KR20230150973A - 폴리시스틴 발현과 관련된 병태 및 질환의 치료용 조성물 - Google Patents
폴리시스틴 발현과 관련된 병태 및 질환의 치료용 조성물 Download PDFInfo
- Publication number
- KR20230150973A KR20230150973A KR1020237029596A KR20237029596A KR20230150973A KR 20230150973 A KR20230150973 A KR 20230150973A KR 1020237029596 A KR1020237029596 A KR 1020237029596A KR 20237029596 A KR20237029596 A KR 20237029596A KR 20230150973 A KR20230150973 A KR 20230150973A
- Authority
- KR
- South Korea
- Prior art keywords
- nucleotides
- mrna
- agent
- nucleobases
- polycystin
- Prior art date
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 115
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 99
- 201000010099 disease Diseases 0.000 title claims abstract description 93
- 239000000203 mixture Substances 0.000 title claims description 115
- 238000011282 treatment Methods 0.000 title description 15
- 108010004408 TRPP Cation Channels Proteins 0.000 title description 6
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 709
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 298
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 232
- 239000003814 drug Substances 0.000 claims abstract description 64
- 229940124597 therapeutic agent Drugs 0.000 claims abstract description 55
- 125000003729 nucleotide group Chemical group 0.000 claims description 891
- 239000002773 nucleotide Substances 0.000 claims description 887
- 102100036142 Polycystin-2 Human genes 0.000 claims description 477
- 239000003795 chemical substances by application Substances 0.000 claims description 303
- 238000000034 method Methods 0.000 claims description 298
- 101001074439 Homo sapiens Polycystin-2 Proteins 0.000 claims description 273
- 101001026882 Homo sapiens Serine/threonine-protein kinase D2 Proteins 0.000 claims description 270
- 101710146368 Polycystin-2 Proteins 0.000 claims description 204
- 230000008685 targeting Effects 0.000 claims description 192
- 108020005067 RNA Splice Sites Proteins 0.000 claims description 151
- 230000001105 regulatory effect Effects 0.000 claims description 102
- 108091033319 polynucleotide Proteins 0.000 claims description 99
- 102000040430 polynucleotide Human genes 0.000 claims description 99
- 238000011144 upstream manufacturing Methods 0.000 claims description 96
- 238000013519 translation Methods 0.000 claims description 95
- 230000000692 anti-sense effect Effects 0.000 claims description 82
- 230000000295 complement effect Effects 0.000 claims description 80
- 150000007523 nucleic acids Chemical class 0.000 claims description 79
- 102000039471 Small Nuclear RNA Human genes 0.000 claims description 62
- 108700024394 Exon Proteins 0.000 claims description 60
- 239000013598 vector Substances 0.000 claims description 58
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 57
- 108700028369 Alleles Proteins 0.000 claims description 55
- 230000001965 increasing effect Effects 0.000 claims description 53
- 102000039446 nucleic acids Human genes 0.000 claims description 53
- 108020004707 nucleic acids Proteins 0.000 claims description 53
- 230000001404 mediated effect Effects 0.000 claims description 44
- 230000000694 effects Effects 0.000 claims description 42
- 230000035772 mutation Effects 0.000 claims description 42
- 235000000346 sugar Nutrition 0.000 claims description 40
- 108020004485 Nonsense Codon Proteins 0.000 claims description 34
- 241000282414 Homo sapiens Species 0.000 claims description 33
- 108091081024 Start codon Proteins 0.000 claims description 33
- 230000004048 modification Effects 0.000 claims description 32
- 238000012986 modification Methods 0.000 claims description 32
- 239000013603 viral vector Substances 0.000 claims description 28
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 27
- 102100036143 Polycystin-1 Human genes 0.000 claims description 27
- 239000008194 pharmaceutical composition Substances 0.000 claims description 26
- 230000001939 inductive effect Effects 0.000 claims description 25
- 230000007812 deficiency Effects 0.000 claims description 24
- 238000002347 injection Methods 0.000 claims description 24
- 239000007924 injection Substances 0.000 claims description 24
- 238000004519 manufacturing process Methods 0.000 claims description 21
- 101150112863 pkd2 gene Proteins 0.000 claims description 21
- 230000002829 reductive effect Effects 0.000 claims description 21
- 208000010061 Autosomal Dominant Polycystic Kidney Diseases 0.000 claims description 20
- 101710146367 Polycystin-1 Proteins 0.000 claims description 20
- 208000022185 autosomal dominant polycystic kidney disease Diseases 0.000 claims description 19
- 230000027455 binding Effects 0.000 claims description 19
- 208000021033 autosomal dominant polycystic liver disease Diseases 0.000 claims description 16
- 208000028589 polycystic liver disease Diseases 0.000 claims description 16
- 239000002157 polynucleotide Substances 0.000 claims description 16
- 201000008450 Intracranial aneurysm Diseases 0.000 claims description 15
- 108020003589 5' Untranslated Regions Proteins 0.000 claims description 14
- 230000007717 exclusion Effects 0.000 claims description 14
- 208000030761 polycystic kidney disease Diseases 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 14
- 108091026823 U7 small nuclear RNA Proteins 0.000 claims description 13
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 13
- 230000002950 deficient Effects 0.000 claims description 12
- 230000003993 interaction Effects 0.000 claims description 12
- 108091093037 Peptide nucleic acid Proteins 0.000 claims description 11
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 11
- 229920001184 polypeptide Polymers 0.000 claims description 10
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 10
- 241000701161 unidentified adenovirus Species 0.000 claims description 10
- 102000001708 Protein Isoforms Human genes 0.000 claims description 9
- 108010029485 Protein Isoforms Proteins 0.000 claims description 9
- 150000003384 small molecules Chemical group 0.000 claims description 9
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 claims description 9
- 238000010254 subcutaneous injection Methods 0.000 claims description 8
- 239000007929 subcutaneous injection Substances 0.000 claims description 8
- 210000003754 fetus Anatomy 0.000 claims description 7
- 238000000185 intracerebroventricular administration Methods 0.000 claims description 7
- 238000010255 intramuscular injection Methods 0.000 claims description 7
- 239000007927 intramuscular injection Substances 0.000 claims description 7
- 239000007928 intraperitoneal injection Substances 0.000 claims description 7
- 238000007913 intrathecal administration Methods 0.000 claims description 7
- 238000010253 intravenous injection Methods 0.000 claims description 7
- 102000044158 nucleic acid binding protein Human genes 0.000 claims description 7
- 108700020942 nucleic acid binding protein Proteins 0.000 claims description 7
- 108091026838 U1 spliceosomal RNA Proteins 0.000 claims description 6
- ANCLJVISBRWUTR-UHFFFAOYSA-N diaminophosphinic acid Chemical compound NP(N)(O)=O ANCLJVISBRWUTR-UHFFFAOYSA-N 0.000 claims description 6
- 101001074444 Homo sapiens Polycystin-1 Proteins 0.000 claims description 5
- 210000001161 mammalian embryo Anatomy 0.000 claims description 5
- 230000001737 promoting effect Effects 0.000 claims description 5
- 230000003612 virological effect Effects 0.000 claims description 5
- 238000002513 implantation Methods 0.000 claims description 4
- 230000000699 topical effect Effects 0.000 claims description 4
- 101100029888 Homo sapiens PKD1 gene Proteins 0.000 claims description 3
- 101150056230 PKD1 gene Proteins 0.000 claims description 3
- 230000014759 maintenance of location Effects 0.000 claims description 3
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 claims description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 2
- 230000004777 loss-of-function mutation Effects 0.000 claims description 2
- 210000000056 organ Anatomy 0.000 claims description 2
- 239000011701 zinc Substances 0.000 claims description 2
- 229910052725 zinc Inorganic materials 0.000 claims description 2
- 108020004688 Small Nuclear RNA Proteins 0.000 claims 6
- 241000700605 Viruses Species 0.000 claims 1
- 230000001276 controlling effect Effects 0.000 claims 1
- 230000002207 retinal effect Effects 0.000 claims 1
- 230000002159 abnormal effect Effects 0.000 abstract description 5
- 208000008425 Protein deficiency Diseases 0.000 abstract description 3
- 201000008542 polycystic kidney disease 2 Diseases 0.000 description 249
- 210000004027 cell Anatomy 0.000 description 141
- 229920000642 polymer Polymers 0.000 description 79
- 230000014616 translation Effects 0.000 description 68
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 56
- 235000018102 proteins Nutrition 0.000 description 42
- 108091027568 Single-stranded nucleotide Proteins 0.000 description 35
- 108091027974 Mature messenger RNA Proteins 0.000 description 27
- 108091034117 Oligonucleotide Proteins 0.000 description 24
- 230000006870 function Effects 0.000 description 20
- 230000009467 reduction Effects 0.000 description 19
- 108091092195 Intron Proteins 0.000 description 17
- 108700026244 Open Reading Frames Proteins 0.000 description 17
- 239000002585 base Substances 0.000 description 16
- 239000000074 antisense oligonucleotide Substances 0.000 description 15
- 238000012230 antisense oligonucleotides Methods 0.000 description 15
- 238000009396 hybridization Methods 0.000 description 14
- 238000002203 pretreatment Methods 0.000 description 13
- 150000001875 compounds Chemical class 0.000 description 12
- YPHMISFOHDHNIV-FSZOTQKASA-N cycloheximide Chemical compound C1[C@@H](C)C[C@H](C)C(=O)[C@@H]1[C@H](O)CC1CC(=O)NC(=O)C1 YPHMISFOHDHNIV-FSZOTQKASA-N 0.000 description 12
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 12
- 239000003112 inhibitor Substances 0.000 description 12
- -1 methoxyethyl moiety Chemical group 0.000 description 12
- 230000037361 pathway Effects 0.000 description 10
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 8
- 210000002919 epithelial cell Anatomy 0.000 description 8
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 7
- 230000008499 blood brain barrier function Effects 0.000 description 7
- 210000001218 blood-brain barrier Anatomy 0.000 description 7
- 230000001976 improved effect Effects 0.000 description 7
- 239000002502 liposome Substances 0.000 description 7
- 150000003839 salts Chemical class 0.000 description 7
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 6
- 230000001594 aberrant effect Effects 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 6
- 208000035475 disorder Diseases 0.000 description 6
- 238000009472 formulation Methods 0.000 description 6
- 102100034343 Integrase Human genes 0.000 description 5
- 230000004913 activation Effects 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 230000037433 frameshift Effects 0.000 description 5
- 210000004940 nucleus Anatomy 0.000 description 5
- 230000035515 penetration Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 4
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 4
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 4
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 210000003734 kidney Anatomy 0.000 description 4
- 125000005647 linker group Chemical group 0.000 description 4
- 150000002632 lipids Chemical group 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000019491 signal transduction Effects 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 239000004094 surface-active agent Substances 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 229940094659 Dopamine reuptake inhibitor Drugs 0.000 description 3
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 3
- YNAVUWVOSKDBBP-UHFFFAOYSA-N Morpholine Chemical group C1COCCN1 YNAVUWVOSKDBBP-UHFFFAOYSA-N 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- OFOBLEOULBTSOW-UHFFFAOYSA-N Propanedioic acid Natural products OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 3
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 3
- 108010007780 U7 Small Nuclear Ribonucleoprotein Proteins 0.000 description 3
- 150000001413 amino acids Chemical class 0.000 description 3
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical group C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000000221 dopamine uptake inhibitor Substances 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003937 drug carrier Substances 0.000 description 3
- 238000010362 genome editing Methods 0.000 description 3
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- HEBKCHPVOIAQTA-UHFFFAOYSA-N meso ribitol Natural products OCC(O)C(O)C(O)CO HEBKCHPVOIAQTA-UHFFFAOYSA-N 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000001717 pathogenic effect Effects 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 210000001324 spliceosome Anatomy 0.000 description 3
- 150000008163 sugars Chemical class 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- GYHCTFXIZSNGJT-UHFFFAOYSA-N tolvaptan Chemical compound CC1=CC=CC=C1C(=O)NC(C=C1C)=CC=C1C(=O)N1C2=CC=C(Cl)C=C2C(O)CCC1 GYHCTFXIZSNGJT-UHFFFAOYSA-N 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- WQZGKKKJIJFFOK-SVZMEOIVSA-N (+)-Galactose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-SVZMEOIVSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 2
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 2
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 108020005004 Guide RNA Proteins 0.000 description 2
- 102000006479 Heterogeneous-Nuclear Ribonucleoproteins Human genes 0.000 description 2
- 108010019372 Heterogeneous-Nuclear Ribonucleoproteins Proteins 0.000 description 2
- 101000808799 Homo sapiens Splicing factor U2AF 35 kDa subunit Proteins 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- LEVWYRKDKASIDU-IMJSIDKUSA-N L-cystine Chemical compound [O-]C(=O)[C@@H]([NH3+])CSSC[C@H]([NH3+])C([O-])=O LEVWYRKDKASIDU-IMJSIDKUSA-N 0.000 description 2
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 229940111055 Serotonin-norepinephrine-dopamine reuptake inhibitor Drugs 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 102100038501 Splicing factor U2AF 35 kDa subunit Human genes 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 108010091281 U1 Small Nuclear Ribonucleoprotein Proteins 0.000 description 2
- 102000018165 U1 Small Nuclear Ribonucleoprotein Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 229910052784 alkaline earth metal Inorganic materials 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 230000001668 ameliorated effect Effects 0.000 description 2
- 229940024606 amino acid Drugs 0.000 description 2
- 235000001014 amino acid Nutrition 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 235000009697 arginine Nutrition 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 239000002775 capsule Substances 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 229960003067 cystine Drugs 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 210000005220 cytoplasmic tail Anatomy 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- MOTZDAYCYVMXPC-UHFFFAOYSA-N dodecyl hydrogen sulfate Chemical compound CCCCCCCCCCCCOS(O)(=O)=O MOTZDAYCYVMXPC-UHFFFAOYSA-N 0.000 description 2
- 229940043264 dodecyl sulfate Drugs 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 231100000221 frame shift mutation induction Toxicity 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000012224 gene deletion Methods 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 235000003642 hunger Nutrition 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000010820 immunofluorescence microscopy Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 210000002161 motor neuron Anatomy 0.000 description 2
- 230000037434 nonsense mutation Effects 0.000 description 2
- 231100000252 nontoxic Toxicity 0.000 description 2
- 230000003000 nontoxic effect Effects 0.000 description 2
- 150000007524 organic acids Chemical class 0.000 description 2
- VLTRZXGMWDSKGL-UHFFFAOYSA-N perchloric acid Chemical compound OCl(=O)(=O)=O VLTRZXGMWDSKGL-UHFFFAOYSA-N 0.000 description 2
- 230000003285 pharmacodynamic effect Effects 0.000 description 2
- 235000021317 phosphate Nutrition 0.000 description 2
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 229920000768 polyamine Polymers 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011321 prophylaxis Methods 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 229940124834 selective serotonin reuptake inhibitor Drugs 0.000 description 2
- 239000012896 selective serotonin reuptake inhibitor Substances 0.000 description 2
- 230000003584 silencer Effects 0.000 description 2
- 230000037351 starvation Effects 0.000 description 2
- KDYFGRWQOYBRFD-UHFFFAOYSA-N succinic acid Chemical compound OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- XOAAWQZATWQOTB-UHFFFAOYSA-N taurine Chemical compound NCCS(O)(=O)=O XOAAWQZATWQOTB-UHFFFAOYSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 239000003174 triple reuptake inhibitor Substances 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- LSPHULWDVZXLIL-UHFFFAOYSA-N (+/-)-Camphoric acid Chemical compound CC1(C)C(C(O)=O)CCC1(C)C(O)=O LSPHULWDVZXLIL-UHFFFAOYSA-N 0.000 description 1
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- AYRXSINWFIIFAE-UHFFFAOYSA-N 2,3,4,5-tetrahydroxy-6-[3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyhexanal Chemical compound OCC1OC(OCC(O)C(O)C(O)C(O)C=O)C(O)C(O)C1O AYRXSINWFIIFAE-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 229940080296 2-naphthalenesulfonate Drugs 0.000 description 1
- BMYNFMYTOJXKLE-UHFFFAOYSA-N 3-azaniumyl-2-hydroxypropanoate Chemical compound NCC(O)C(O)=O BMYNFMYTOJXKLE-UHFFFAOYSA-N 0.000 description 1
- ZRPLANDPDWYOMZ-UHFFFAOYSA-N 3-cyclopentylpropionic acid Chemical compound OC(=O)CCC1CCCC1 ZRPLANDPDWYOMZ-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- FHVDTGUDJYJELY-UHFFFAOYSA-N 6-{[2-carboxy-4,5-dihydroxy-6-(phosphanyloxy)oxan-3-yl]oxy}-4,5-dihydroxy-3-phosphanyloxane-2-carboxylic acid Chemical compound O1C(C(O)=O)C(P)C(O)C(O)C1OC1C(C(O)=O)OC(OP)C(O)C1O FHVDTGUDJYJELY-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-DCSYEGIMSA-N Beta-Lactose Chemical compound OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-DCSYEGIMSA-N 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-M Butyrate Chemical compound CCCC([O-])=O FERIUCNNQQJTOY-UHFFFAOYSA-M 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Natural products CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 102100036293 Calcium-binding mitochondrial carrier protein SCaMC-3 Human genes 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- KXDHJXZQYSOELW-UHFFFAOYSA-M Carbamate Chemical compound NC([O-])=O KXDHJXZQYSOELW-UHFFFAOYSA-M 0.000 description 1
- 241000819038 Chichester Species 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N D-Maltose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- NBSCHQHZLSJFNQ-QTVWNMPRSA-N D-Mannose-6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@@H]1O NBSCHQHZLSJFNQ-QTVWNMPRSA-N 0.000 description 1
- UNXHWFMMPAWVPI-QWWZWVQMSA-N D-Threitol Natural products OC[C@@H](O)[C@H](O)CO UNXHWFMMPAWVPI-QWWZWVQMSA-N 0.000 description 1
- HEBKCHPVOIAQTA-QWWZWVQMSA-N D-arabinitol Chemical compound OC[C@@H](O)C(O)[C@H](O)CO HEBKCHPVOIAQTA-QWWZWVQMSA-N 0.000 description 1
- SHZGCJCMOBCMKK-SVZMEOIVSA-N D-fucopyranose Chemical compound C[C@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1O SHZGCJCMOBCMKK-SVZMEOIVSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- RGHNJXZEOKUKBD-SQOUGZDYSA-M D-gluconate Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O RGHNJXZEOKUKBD-SQOUGZDYSA-M 0.000 description 1
- SRBFZHDQGSBBOR-AGQMPKSLSA-N D-lyxopyranose Chemical compound O[C@@H]1COC(O)[C@@H](O)[C@H]1O SRBFZHDQGSBBOR-AGQMPKSLSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000792859 Enema Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- UNXHWFMMPAWVPI-UHFFFAOYSA-N Erythritol Natural products OCC(O)C(O)CO UNXHWFMMPAWVPI-UHFFFAOYSA-N 0.000 description 1
- 102100038595 Estrogen receptor Human genes 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101100029893 Homo sapiens PKD2 gene Proteins 0.000 description 1
- 101000658071 Homo sapiens Splicing factor U2AF 65 kDa subunit Proteins 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 101150008942 J gene Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- HEBKCHPVOIAQTA-IMJSIDKUSA-N L-arabinitol Chemical compound OC[C@H](O)C(O)[C@@H](O)CO HEBKCHPVOIAQTA-IMJSIDKUSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- SHZGCJCMOBCMKK-JFNONXLTSA-N L-rhamnopyranose Chemical compound C[C@@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-JFNONXLTSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- OFOBLEOULBTSOW-UHFFFAOYSA-L Malonate Chemical compound [O-]C(=O)CC([O-])=O OFOBLEOULBTSOW-UHFFFAOYSA-L 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- AFVFQIVMOAPDHO-UHFFFAOYSA-N Methanesulfonic acid Chemical compound CS(O)(=O)=O AFVFQIVMOAPDHO-UHFFFAOYSA-N 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 1
- OVRNDRQMDRJTHS-KEWYIRBNSA-N N-acetyl-D-galactosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-KEWYIRBNSA-N 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 239000004721 Polyphenylene oxide Substances 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-M Propionate Chemical compound CCC([O-])=O XBDQKXXYIPTUBI-UHFFFAOYSA-M 0.000 description 1
- 108010039259 RNA Splicing Factors Proteins 0.000 description 1
- 102000015097 RNA Splicing Factors Human genes 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 108091006464 SLC25A23 Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102100035040 Splicing factor U2AF 65 kDa subunit Human genes 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- FEWJPZIEWOKRBE-UHFFFAOYSA-N Tartaric acid Natural products [H+].[H+].[O-]C(=O)C(O)C(O)C([O-])=O FEWJPZIEWOKRBE-UHFFFAOYSA-N 0.000 description 1
- 241001122767 Theaceae Species 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-M Thiocyanate anion Chemical compound [S-]C#N ZMZDMBWJUHKJPS-UHFFFAOYSA-M 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010033576 Transferrin Receptors Proteins 0.000 description 1
- 102100026144 Transferrin receptor protein 1 Human genes 0.000 description 1
- 108010037150 Transient Receptor Potential Channels Proteins 0.000 description 1
- 102000011753 Transient Receptor Potential Channels Human genes 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 208000021020 X-linked dominant inheritance Diseases 0.000 description 1
- TVXBFESIOXBWNM-UHFFFAOYSA-N Xylitol Natural products OCCC(O)C(O)C(O)CCO TVXBFESIOXBWNM-UHFFFAOYSA-N 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- XVIYCJDWYLJQBG-UHFFFAOYSA-N acetic acid;adamantane Chemical compound CC(O)=O.C1C(C2)CC3CC1CC2C3 XVIYCJDWYLJQBG-UHFFFAOYSA-N 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- WNLRTRBMVRJNCN-UHFFFAOYSA-L adipate(2-) Chemical compound [O-]C(=O)CCCCC([O-])=O WNLRTRBMVRJNCN-UHFFFAOYSA-L 0.000 description 1
- GZCGUPFRVQAUEE-SLPGGIOYSA-N aldehydo-D-glucose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O GZCGUPFRVQAUEE-SLPGGIOYSA-N 0.000 description 1
- PYMYPHUHKUWMLA-YUPRTTJUSA-N aldehydo-L-lyxose Chemical compound OC[C@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-YUPRTTJUSA-N 0.000 description 1
- 229940072056 alginate Drugs 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 150000008055 alkyl aryl sulfonates Chemical class 0.000 description 1
- 229940045714 alkyl sulfonate alkylating agent Drugs 0.000 description 1
- 150000008052 alkyl sulfonates Chemical class 0.000 description 1
- SRBFZHDQGSBBOR-STGXQOJASA-N alpha-D-lyxopyranose Chemical compound O[C@@H]1CO[C@H](O)[C@@H](O)[C@H]1O SRBFZHDQGSBBOR-STGXQOJASA-N 0.000 description 1
- AWUCVROLDVIAJX-UHFFFAOYSA-N alpha-glycerophosphate Natural products OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000007900 aqueous suspension Substances 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- 229940072107 ascorbate Drugs 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000004900 autophagic degradation Effects 0.000 description 1
- 208000021018 autosomal dominant inheritance Diseases 0.000 description 1
- 208000021024 autosomal recessive inheritance Diseases 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 229940077388 benzenesulfonate Drugs 0.000 description 1
- SRSXLGNVWSONIS-UHFFFAOYSA-M benzenesulfonate Chemical compound [O-]S(=O)(=O)C1=CC=CC=C1 SRSXLGNVWSONIS-UHFFFAOYSA-M 0.000 description 1
- 229940050390 benzoate Drugs 0.000 description 1
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 125000002619 bicyclic group Chemical class 0.000 description 1
- 239000003833 bile salt Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000015916 branching morphogenesis of a tube Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- FATUQANACHZLRT-KMRXSBRUSA-L calcium glucoheptonate Chemical compound [Ca+2].OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)C([O-])=O.OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)C([O-])=O FATUQANACHZLRT-KMRXSBRUSA-L 0.000 description 1
- MIOPJNTWMNEORI-UHFFFAOYSA-N camphorsulfonic acid Chemical compound C1CC2(CS(O)(=O)=O)C(=O)CC1C2(C)C MIOPJNTWMNEORI-UHFFFAOYSA-N 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 208000020832 chronic kidney disease Diseases 0.000 description 1
- 238000002648 combination therapy Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001054 cortical effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 125000000753 cycloalkyl group Chemical group 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 230000037416 cystogenesis Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 229940124447 delivery agent Drugs 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- GPRLSGONYQIRFK-DYCDLGHISA-N deuteron Chemical compound [2H+] GPRLSGONYQIRFK-DYCDLGHISA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- PGUYAANYCROBRT-UHFFFAOYSA-N dihydroxy-selanyl-selanylidene-lambda5-phosphane Chemical compound OP(O)([SeH])=[Se] PGUYAANYCROBRT-UHFFFAOYSA-N 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 1
- GTZOYNFRVVHLDZ-UHFFFAOYSA-N dodecane-1,1-diol Chemical group CCCCCCCCCCCC(O)O GTZOYNFRVVHLDZ-UHFFFAOYSA-N 0.000 description 1
- POULHZVOKOAJMA-UHFFFAOYSA-M dodecanoate Chemical compound CCCCCCCCCCCC([O-])=O POULHZVOKOAJMA-UHFFFAOYSA-M 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 238000000804 electron spin resonance spectroscopy Methods 0.000 description 1
- 208000028208 end stage renal disease Diseases 0.000 description 1
- 201000000523 end stage renal failure Diseases 0.000 description 1
- 239000007920 enema Substances 0.000 description 1
- 229940079360 enema for constipation Drugs 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000013283 epinephrine uptake Effects 0.000 description 1
- UNXHWFMMPAWVPI-ZXZARUISSA-N erythritol Chemical compound OC[C@H](O)[C@H](O)CO UNXHWFMMPAWVPI-ZXZARUISSA-N 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- CCIVGXIOQKPBKL-UHFFFAOYSA-M ethanesulfonate Chemical compound CCS([O-])(=O)=O CCIVGXIOQKPBKL-UHFFFAOYSA-M 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000005496 eutectics Effects 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- FBPFZTCFMRRESA-GUCUJZIJSA-N galactitol Chemical compound OC[C@H](O)[C@@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-GUCUJZIJSA-N 0.000 description 1
- 229940050410 gluconate Drugs 0.000 description 1
- 229960002442 glucosamine Drugs 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000004554 glutamine Nutrition 0.000 description 1
- 125000003827 glycol group Chemical group 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- MNWFXJYAOYHMED-UHFFFAOYSA-N heptanoic acid Chemical compound CCCCCCC(O)=O MNWFXJYAOYHMED-UHFFFAOYSA-N 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- IPCSVZSSVZVIGE-UHFFFAOYSA-M hexadecanoate Chemical compound CCCCCCCCCCCCCCCC([O-])=O IPCSVZSSVZVIGE-UHFFFAOYSA-M 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical compound CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 1
- 210000001320 hippocampus Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 238000011577 humanized mouse model Methods 0.000 description 1
- XMBWDFGMSWQBCA-UHFFFAOYSA-N hydrogen iodide Chemical compound I XMBWDFGMSWQBCA-UHFFFAOYSA-N 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-N hydrogen thiocyanate Natural products SC#N ZMZDMBWJUHKJPS-UHFFFAOYSA-N 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-M hydrogensulfate Chemical compound OS([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-M 0.000 description 1
- 229920001477 hydrophilic polymer Polymers 0.000 description 1
- 150000004679 hydroxides Chemical class 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000005414 inactive ingredient Substances 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 230000037427 ion transport Effects 0.000 description 1
- 230000007794 irritation Effects 0.000 description 1
- SUMDYPCJJOFFON-UHFFFAOYSA-N isethionic acid Chemical compound OCCS(O)(=O)=O SUMDYPCJJOFFON-UHFFFAOYSA-N 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 208000017169 kidney disease Diseases 0.000 description 1
- 229940001447 lactate Drugs 0.000 description 1
- 229940099584 lactobionate Drugs 0.000 description 1
- JYTUSYBCFIZPBE-AMTLMPIISA-N lactobionic acid Chemical compound OC(=O)[C@H](O)[C@@H](O)[C@@H]([C@H](O)CO)O[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O JYTUSYBCFIZPBE-AMTLMPIISA-N 0.000 description 1
- 229940070765 laurate Drugs 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 235000018977 lysine Nutrition 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 239000011976 maleic acid Substances 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 239000004530 micro-emulsion Substances 0.000 description 1
- 150000007522 mineralic acids Chemical class 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- KVBGVZZKJNLNJU-UHFFFAOYSA-M naphthalene-2-sulfonate Chemical compound C1=CC=CC2=CC(S(=O)(=O)[O-])=CC=C21 KVBGVZZKJNLNJU-UHFFFAOYSA-M 0.000 description 1
- 210000001577 neostriatum Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 150000002823 nitrates Chemical class 0.000 description 1
- 238000009377 nuclear transmutation Methods 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- 229940049964 oleate Drugs 0.000 description 1
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 235000006408 oxalic acid Nutrition 0.000 description 1
- 238000012259 partial gene deletion Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 239000003961 penetration enhancing agent Substances 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- JRKICGRDRMAZLK-UHFFFAOYSA-L peroxydisulfate Chemical compound [O-]S(=O)(=O)OOS([O-])(=O)=O JRKICGRDRMAZLK-UHFFFAOYSA-L 0.000 description 1
- DYUMLJSJISTVPV-UHFFFAOYSA-N phenyl propanoate Chemical compound CCC(=O)OC1=CC=CC=C1 DYUMLJSJISTVPV-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 125000004437 phosphorous atom Chemical group 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 229940075930 picrate Drugs 0.000 description 1
- OXNIZHLAWKMVMX-UHFFFAOYSA-M picrate anion Chemical compound [O-]C1=C([N+]([O-])=O)C=C([N+]([O-])=O)C=C1[N+]([O-])=O OXNIZHLAWKMVMX-UHFFFAOYSA-M 0.000 description 1
- 229950010765 pivalate Drugs 0.000 description 1
- IUGYQRQAERSCNH-UHFFFAOYSA-N pivalic acid Chemical compound CC(C)(C)C(O)=O IUGYQRQAERSCNH-UHFFFAOYSA-N 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 108700032676 polycystic kidney disease 2 Proteins 0.000 description 1
- 229920000570 polyether Polymers 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 125000001453 quaternary ammonium group Chemical group 0.000 description 1
- MUPFEKGTMRGPLJ-ZQSKZDJDSA-N raffinose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)O1 MUPFEKGTMRGPLJ-ZQSKZDJDSA-N 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000009711 regulatory function Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- HEBKCHPVOIAQTA-ZXFHETKHSA-N ribitol Chemical compound OC[C@H](O)[C@H](O)[C@H](O)CO HEBKCHPVOIAQTA-ZXFHETKHSA-N 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 229940077276 samsca Drugs 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- JRPHGDYSKGJTKZ-UHFFFAOYSA-K selenophosphate Chemical compound [O-]P([O-])([O-])=[Se] JRPHGDYSKGJTKZ-UHFFFAOYSA-K 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000012453 solvate Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000027039 spliceosomal complex assembly Effects 0.000 description 1
- 230000037423 splicing regulation Effects 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 210000003523 substantia nigra Anatomy 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 239000001384 succinic acid Substances 0.000 description 1
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 235000002906 tartaric acid Nutrition 0.000 description 1
- 239000011975 tartaric acid Substances 0.000 description 1
- 229940095064 tartrate Drugs 0.000 description 1
- 229960003080 taurine Drugs 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 210000001103 thalamus Anatomy 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- JOXIMZWYDAKGHI-UHFFFAOYSA-N toluene-4-sulfonic acid Chemical compound CC1=CC=C(S(O)(=O)=O)C=C1 JOXIMZWYDAKGHI-UHFFFAOYSA-N 0.000 description 1
- 229960001256 tolvaptan Drugs 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- ZDPHROOEEOARMN-UHFFFAOYSA-N undecanoic acid Chemical compound CCCCCCCCCCC(O)=O ZDPHROOEEOARMN-UHFFFAOYSA-N 0.000 description 1
- 125000002948 undecyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- NQPDZGIKBAWPEJ-UHFFFAOYSA-N valeric acid Chemical class CCCCC(O)=O NQPDZGIKBAWPEJ-UHFFFAOYSA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 239000000811 xylitol Substances 0.000 description 1
- HEBKCHPVOIAQTA-SCDXWVJYSA-N xylitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)CO HEBKCHPVOIAQTA-SCDXWVJYSA-N 0.000 description 1
- 235000010447 xylitol Nutrition 0.000 description 1
- 229960002675 xylitol Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1138—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/11—Antisense
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/313—Phosphorodithioates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/314—Phosphoramidates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/315—Phosphorothioates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/321—2'-O-R Modification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/322—2'-R Modification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/11—Protein-serine/threonine kinases (2.7.11)
- C12Y207/11001—Non-specific serine/threonine protein kinase (2.7.11.1), i.e. casein kinase or checkpoint kinase
Abstract
유전자의 대체 스플라이싱 이벤트는 비정상적인 단백질 발현을 초래할 수 있는 비-생산적인 mRNA 전사체로 이어질 수 있으며, 유전자의 대체 스플라이싱 이벤트를 표적으로 할 수 있는 치료제는 환자의 기능성 단백질의 발현 수준을 조절하고/하거나 비정상적인 단백질 발현을 억제할 수 있다. 이러한 치료제는 단백질 결핍에 의해 야기된 병태 또는 질환을 치료하는 데 사용될 수 있다.
Description
상호 참조
본 출원은 2021년 2월 3일에 출원된 미국 가출원 제63/145,288호의 이익을 주장하며, 전체 내용이 참조로 본원에 포함된다.
서열 목록
본 출원은 ASCII 형식으로 전자적으로 제출된 서열 목록을 포함하며, 이는 전체 내용이 참고로 포함된다. 2022년 3월 11일에 생성된 해당 ASCII 복사본의 이름은 47991-732_601_SL.txt이고 크기는 331,023바이트이다.
유전자의 대체 스플라이싱 이벤트(alternative splicing event)는 비정상적인 단백질 발현을 초래할 수 있는 비-생산적인 mRNA 전사체로 이어질 수 있으며, 유전자의 대체 스플라이싱 이벤트를 표적으로 할 수 있는 치료제는 환자의 기능성 단백질의 발현 수준을 조절하고/하거나 비정상적인 단백질 발현을 억제할 수 있다. 이러한 치료제는 단백질 결핍에 의해 야기된 병태 또는 질환을 치료하는 데 사용될 수 있다.
특정 구현예에서, 표적 유전자로부터 전사되고 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)을 포함하는 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는 방법이 본원에 기재되어 있고, 방법은 제제 또는 제제를 인코딩하는 벡터를 세포에 접촉시켜, 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절하는 단계, 및 세포에서 표적 단백질의 발현을 조절하는 단계로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 단계를 포함한다.
특정 구현예에서, 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 제제 또는 제제를 인코딩하는 벡터를 대상체의 세포에 접촉시켜, 제제는 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터의 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절 단계, 및 세포에서 표적 단백질의 발현을 조절하는 단계로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 단계를 포함한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 질환 또는 병태는 폴리시스틴 2의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 1의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다.
일부 구현예에서, 질환 또는 병태는 폴리시스틴 2가 기능적으로 증강, 보상, 대체 또는 기능적으로 상호작용하는 단백질의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다.
일부 구현예에서, 제제는 (a) 프리-mRNA의 표적화 부분에 결합하고; (b) NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 조절하거나; 또는 (c) (a)와 (b)의 조합이다.
일부 구현예에서, 제제는 NMD 엑손의 표적화 부분의 영역에 대한 스플라이싱에 관여하는 인자의 결합을 방해한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손에 근접한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 말단의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 5' 말단의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 프리-mRNA의 2개의 정규 엑손 영역 사이의 인트론 영역에 위치하고, 인트론 영역은 NMD 엑손을 함유한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손과 적어도 부분적으로 중첩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 업스트림 또는 다운스트림 인트론과 적어도 부분적으로 중첩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 5' NMD 엑손-인트론 접합부 또는 3' NMD 엑손-인트론 접합부를 포함한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손 내에 있다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함한다.
일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열을 포함한다.
일부 구현예에서, 프리-mRNA는 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 프리-mRNA는 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, ASO는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18개의 연속 핵산에 대해 적어도 약 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성인 서열을 포함한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085-88031140 내에 있다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085-88031140의 업스트림 또는 다운스트림이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085 88031140의 엑손-인트론 접합부를 포함한다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 폴리시스틴 2 또는 야생형 폴리시스틴 2이다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적이다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적이다.
일부 구현예에서, 제제는 프리-mRNA로부터 NMD 엑손의 배제를 촉진함으로써, 프리-mRNA로부터 프로세싱되고 NMD 엑손이 결여된 프로세싱된 mRNA의 수준을 조절한다.
일부 구현예에서, 제제와 접촉된 세포에서 프리-mRNA로부터의 NMD 엑손의 배제는 대조군 세포에서 프리-mRNA로부터의 NMD 엑손의 배제에 비해 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, 방법은 세포에서 프로세싱된 mRNA의 수준을 증가시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 프로세싱된 mRNA의 수준은 대조군 세포에서 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, 제제는 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 표적 단백질의 수준은 대조군 세포에서 생산된 표적 단백질의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, NMD 엑손을 함유하는 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함한다. 일부 구현예에서, 조기 종결 코돈(PTC)은 NMD 엑손의 다운스트림이다. 일부 구현예에서, NMD 엑손은 조기 종결 코돈(PTC)을 포함한다.
일부 구현예에서, 질환 또는 병태는 표적 유전자 또는 표적 단백질의 기능 상실 돌연변이와 연관된다.
일부 구현예에서, 질환 또는 병태는 표적 유전자의 반가불충분성과 연관되고, 대상체는 기능성 폴리시스틴 2를 인코딩하는 제1 대립유전자 및 폴리시스틴 2가 생산되지 않거나 감소된 수준으로 생산되는 제2 대립유전자, 또는 비기능성 폴리시스틴 2 또는 부분적 기능성 폴리시스틴 2를 인코딩하는 제2 대립유전자를 가지고 있다.
일부 구현예에서, 하나 또는 둘 모두의 대립유전자는 하이포모르프이거나 부분적으로 기능적이다.
일부 구현예에서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택된다.
일부 구현예에서, 질환 또는 병태는 PKD1 또는 PKD2 유전자의 돌연변이와 연관되며, 여기서 대상체는 제 (i) 표적 단백질은 생산되지 않거나 야생형 대립유전자에 비해 감소된 수준으로 생산되거나; 또는 (ii) 생산된 표적 단백질은 야생형 대립유전자에 비해 비기능적이거나 부분적으로 기능적인 제1 대립유전자 인코딩, 및 (iii) 표적 단백질은 야생형 대립유전자에 비해 감소된 수준으로 생산되고 생산된 표적 단백질은 야생형 대립유전자에 비해 적어도 부분적으로 기능적임; 또는 (iv) 생산된 표적 단백질은 야생형 대립유전자에 비해 부분적으로 기능적인 제2 대립유전자를 갖는다.
일부 구현예에서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택된다.
일부 구현예에서, 돌연변이는 하이포모르픽 돌연변이이다.
일부 구현예에서, 제제는 프리-mRNA로부터 NMD 엑손의 배제를 촉진함으로써, 프리-mRNA로부터 프로세싱되고 NMD 엑손이 결여된 프로세싱된 mRNA의 수준을 조절하고 세포의 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 포스포로디아미데이트 모폴리노, 잠금 핵산, 펩티드 핵산, 2'-O-메틸, 2'-플루오로, 또는 2'-O-메톡시에틸 모이어티를 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 적어도 하나의 변형된 당 모이어티를 포함한다.
일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다.
일부 구현예에서, 제제가 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 프리-mRNA의 표적화 부분에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적이다.
일부 구현예에서, 방법은 제제를 인코딩하는 벡터를 세포에 접촉시키는 것을 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머를 포함하는 폴리뉴클레오티드이다.
일부 구현예에서, 벡터는 바이러스 벡터이다.
일부 구현예에서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터이다.
일부 구현예에서, 폴리뉴클레오티드는 변형된 snRNA를 추가로 포함한다.
일부 구현예에서, 변형된 인간 snRNA는 변형된 U1 snRNA 또는 변형된 U7 snRNA이다.
일부 구현예에서, 변형된 인간 snRNA는 변형된 U7 snRNA이고 안티센스 올리고머는 표 4 또는 표 5에 열거된 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 갖는다.
일부 구현예에서, 표적 단백질의 프로세싱된 mRNA 수준 또는 발현 수준을 평가하는 것을 추가로 포함한다.
일부 구현예에서, 대상체는 인간이다.
한 구현예에서, 대상체는 비-인간 동물이다.
일부 구현예에서, 대상체는 태아, 배아 또는 아동이다.
일부 구현예에서, 세포는 생체 외의 것이다.
일부 구현예에서, 제제는 대상체의 척수강내 주사, 뇌실심내 주사, 복강내 주사, 근육내 주사, 피하 주사, 유리체내 또는 정맥내 주사에 의해 투여된다.
일부 구현예에서, 방법은 대상체에게 제2 치료제를 투여하는 것을 추가로 포함한다.
특정 구현예에서, 제2 치료제는 소분자이다.
일부 구현예에서, 제2 치료제는 안티센스 올리고머이다.
일부 구현예에서, 제2 치료제는 인트론 체류를 수정한다.
일부 구현예에서, 방법은 질환 또는 병태를 치료한다.
특정 구현예에서, 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고, 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는, 제제 또는 상기 제제를 인코딩하는 벡터를 포함하는 조성물로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 조성물이 본원에 기재된다.
특정 구현예에서, 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요한 대상체에서 질환 또는 병태를 치료하는, 제제 또는 상기 제제를 인코딩하는 벡터를 포함하는 조성물로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 조성물이 본원에 기재된다.
특정 구현예에서, 본원에 기재된 바와 같은 조성물; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는 약제학적 조성물이 본원에 기재된다.
특정 구현예에서, 넌센스 매개된 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 제제를 인코딩하는 바이러스 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하고, 프리-mRNA는 정규 5' 스플라이스-부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2이다.
일부 구현예에서, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 방지하거나 감소시킴으로써 프리-RNA의 프로세싱을 조절한다.
일부 구현예에서, 제제는 정규 5' 스플라이스-부위에서 스플라이싱을 촉진하거나 증가시킴으로써 프리-RNA의 프로세싱을 조절한다.
일부 구현예에서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱을 조절하는 것은 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산된 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함한다.
다양한 구현예에서, 제제는 소분자이다.
일부 구현예에서, 제제는 폴리펩티드이다.
일부 구현예에서, 폴리펩티드는 핵산 결합 단백질이다.
일부 구현예에서, 핵산 결합 단백질은 TAL-이펙터 또는 징크 핑거 결합 도메인을 함유한다.
일부 구현예에서, 핵산 결합 단백질은 Cas 계열 단백질이다.
일부 구현예에서, 폴리펩티드는 하나 이상의 핵산 분자와 동반되거나 복합화된다.
일부 구현예에서, 제제는 프리-mRNA의 표적화 영역에 상보적인 안티센스 올리고머(ASO)이다.
일부 구현예에서, 제제는 표적 단백질을 인코딩하는 프리-mRNA의 표적화 영역에 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적이다.
일부 구현예에서, 제제는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다.
일부 구현예에서, 제제는 포스포로디아미데이트 모폴리노를 포함한다.
일부 구현예에서, 제제는 잠금 핵산을 포함한다.
일부 구현예에서, 제제는 펩티드 핵산을 포함한다.
일부 구현예에서, 제제는 2'-O-메틸을 포함한다.
일부 구현예에서, 제제는 2'-플루오로 또는 2'-O-메톡시에틸 모이어티를 포함한다.
일부 구현예에서, 제제는 적어도 하나의 변형된 당 모이어티를 포함한다.
일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다.
일부 구현예에서, 제제는 안티센스 올리고머이고, 여기서 제제는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다.
일부 구현예에서, 조성물은 제제를 인코딩하는 벡터를 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머를 포함하는 폴리뉴클레오티드이다.
일부 구현예에서, 벡터는 바이러스 벡터이다.
일부 구현예에서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터이다.
일부 구현예에서, 폴리뉴클레오티드는 변형된 snRNA를 추가로 포함한다.
일부 구현예에서, 변형된 인간 snRNA는 변형된 U1 snRNA 또는 변형된 U7 snRNA이다.
일부 구현예에서, 변형된 인간 snRNA는 변형된 U7 snRNA이고 안티센스 올리고머는 표 4 또는 표 5에 열거된 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 갖는다.
특정 구현예에서, 본원에 기재된 바와 같은 조성물에 따른 제제를 인코딩하는 핵산 분자를 포함하는 조성물이 본원에 기재된다.
일부 구현예에서, 핵산 분자는 바이러스 전달 시스템에 통합된다.
일부 구현예에서, 바이러스 전달 시스템은 아데노바이러스 연관 벡터이다.
일부 구현예에서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터이다.
특정 구현예에서, 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 방법이 본원에 기재되고, 상기 방법은 넌센스 매개 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 제제를 인코딩하는 바이러스 벡터를 세포에 접촉시키는 것을 포함하고, 프리-mRNA는 정규 5' 스플라이스 부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 표적 단백질의 발현을 조절함으로써 프리-mRNA의 프로세싱을 조절하고; 표적 유전자는 PKD2이다.
일부 구현예에서, 제제는 (a) 프리-mRNA의 표적화 부분에 결합하고; (b) 대체 5' 스플라이스-부위에서 스플라이싱에 관여하는 인자의 결합을 조절하거나; 또는 (c) (a)와 (b)의 조합이다.
일부 구현예에서, 제제는 대체 5' 스플라이스-부위에서 스플라이싱에 관여하는 인자가 표적화 부분의 영역에 결합하는 것을 방해한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에 근접한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 다운스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 다운스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4 88036480의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480의 게놈 부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480의 게놈 부위의 다운스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480의 게놈 부위의 다운스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 정규 5' 스플라이스-부위와 대체 5' 스플라이스-부위 사이의 영역에 위치한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역에 위치한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위와 적어도 부분적으로 중첩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림 또는 다운스트림 영역과 적어도 부분적으로 중첩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역 내에 있다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 2개의 정규 엑손 사이의 인트론 영역에 위치한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 2개의 정규 엑손 중 하나에 위치한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 인트론 및 정규 엑손 모두에 걸쳐 있는 영역에 위치한다.
일부 구현예에서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 프리-mRNA의 스플라이싱의 조정은 표적 단백질을 인코딩하는 프로세싱된 mRNA의 생산을 증가시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 표적 단백질은 단백질의 정규 동형이다.
일부 구현예에서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산된 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함한다.
일부 구현예에서, NSASS 조절제는 본원에 기재된 바와 같은 조성물이다.
특정 구현예에서, 본원에 기재된 바와 같은 조성물; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는 약제학적 조성물이 본원에 기재된다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 감소가 필요한 대상체에게 약제학적 조성물을 투여하는 것을 포함하고, 약제학적 조성물은 넌센스 매개된 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터로서, 제제는 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하고, 프리-mRNA는 정규 5' 스플라이스-부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 대안적으로 스플라이싱된 mRNA의 넌센스 매개된 RNA 붕괴를 초래하고, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2인, 바이러스 벡터 및 약제학적으로 허용되는 부형제를 포함한다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 본원에 기재된 약제학적 조성물을 대상체에게 투여하는 단계를 포함한다.
일부 구현예에서, 질환은 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 또는 두개내 동맥류로 이루어진 군으로부터 선택된다.
일부 구현예에서, 질환 또는 병태는 폴리시스틴 2 또는 폴리시스틴 1의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다.
일부 구현예에서, 질환 또는 병태는 폴리시스틴 2가 기능적으로 증강, 보상, 대체 또는 기능적으로 상호작용하는 단백질의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다.
일부 구현예에서, 질환 또는 병태는 표적 단백질의 결핍된 양 또는 활성에 의해 야기된다.
일부 구현예에서, 제제는 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준을 증가시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 제제는 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 표적 단백질의 mRNA 수준 또는 발현 수준을 평가하는 것을 추가로 포함한다.
일부 구현예에서, 방법은 질환과 연관된 적어도 하나의 유전적 돌연변이에 대해 대상체의 게놈을 평가하는 것을 추가로 포함한다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 유전자좌 내에 있다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 발현과 연관된 유전자좌 내에 있다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 좌 내에 있다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 발현과 연관된 유전자좌 내에 있다.
일부 구현예에서, 대상체는 인간이다.
한 구현예에서, 대상체는 비-인간 동물이다.
일부 구현예에서, 대상체는 태아, 배아 또는 아동이다.
일부 구현예에서, 세포 또는 세포들은 생체외, 또는 생체외 조직 또는 기관에 있다.
일부 구현예에서, 제제는 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 투여된다.
일부 구현예에서, 방법은 질환 또는 병태를 치료한다.
특정 구현예에서, 본원에 기재된 바와 같은 방법에 사용하기 위한 치료제가 본원에 기재된다.
특정 구현예에서, 본원에 기재된 바와 같은 치료제 및 약제학적으로 허용되는 부형제를 포함하는 약제학적 조성물이 본원에 기재된다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되고, 방법은 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 본원에 기재된 약제학적 조성물을 투여하는 것을 포함한다.
일부 구현예에서, 방법은 대상체를 치료한다.
특정 구현예에서, 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 폴리시스틴 2 단백질의 발현을 증가시키는 방법이 본원에 기재되고, 방ㅂ1ㅓㅂ은 제제 또는 이 제제를 인코딩하는 벡터를 세포에 접촉시키는 것을 포함하며, 제제는 번역 조절 요소의 구조를 조절함으로써 세포에서 폴리시스틴 2 단백질의 발현을 증가시킨다.
특정 구현예에서, 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 폴리시스틴 2 단백질의 발현을 증가시키는 방법이 본원에 기재되었고, 방법은 제제 또는 제제를 인코딩하는 벡터를 세포에 접촉시키는 단계, 이로써 세포에서 폴리시스틴 2 단백질의 발현을 증가하는 단계를 포함하며, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합이다.
특정 구현예에서, 세포에서 폴리시스틴 2 단백질의 발현을 조절하는 방법이 본원에 기재되고, 방법은 제제 또는 이 제제를 인코딩하는 벡터를 세포에 접촉시키는 것을 포함하며, 제제는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 안티센스 올리고머를 포함한다.
특정 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 안티센스 올리고머를 포함한다.
특정 구현예에서, 제제를 인코딩하는 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 다핵산을 포함한다.
특정 구현예에서, 제제를 포함하는 조성물이 본원에 기재되고, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 표적화 부분에 결합하는 안티센스 올리고머를 포함하고, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드를 포함하고, 프로세싱된 mRNA의 5' UTR 내에 있다.
특정 구현예에서, 제제를 인코딩하는 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 표적화 부분에 결합하는 서열을 포함하는 다핵산을 포함하고, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드를 포함하고, 프로세싱된 mRNA의 5' UTR 내에 있다.
특정 구현예에서, 제제를 포함하는 조성물이 본원에 기재되고, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 조절 요소의 구조를 조절함으로써 폴리시스틴 2 단백질의 발현을 증가시키고, 번역 조절 요소는 프로세싱된 mRNA의 번역을 억제한다.
특정 구현예에서, 제제를 인코딩하는 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 조절 요소의 구조를 조절함으로써 폴리시스틴 2 단백질의 발현을 증가시키고, 번역 조절 요소는 프로세싱된 mRNA의 번역을 억제한다.
특정 구현예에서, 제제를 포함하는 조성물이 본원에 기재되고, 제제는 세포에서 프로세싱된 mRNA의 번역을 증가시키고, 프로세싱된 mRNA는 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하고, 제제는 번역 조절 요소의 구조를 조절함으로써 번역 효율성 및/또는 프로세싱된 mRNA의 번역 속도를 증가시키고, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합이다.
특정 구현예에서, 제제를 인코딩하는 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 세포에서 프로세싱된 mRNA의 번역을 증가시키고, 프로세싱된 mRNA는 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하고, 제제는 번역 조절 요소의 구조를 조절함으로써 번역 효율성 및/또는 프로세싱된 mRNA의 번역 속도를 증가시키고, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합이다.
특정 구현예에서, 표적 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 표적 단백질의 발현을 증가시키는 방법이 본 명세서 기재되고, 방법은 세포 내로 (1) 제1 제제 또는 이 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 이 제2 제제를 인코딩하는 제2 핵산 서열을 전달하는 단계 및 이로써 세포에서 표적 단백질의 발현을 증가시키는 단계를 포함하며, 제1 제제는 표적 단백질을 인코딩하는 표적 유전자로부터 전사되는 프리-mRNA의 스플라이싱을 조절하고, 제2 제제는 표적 단백질을 인코딩하는 프로세싱된 mRNA의 번역 조절 요소의 구조를 조절하며, 표적 단백질은 폴리시스틴 2이다.
특정 구현예에서, 표적 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 표적 단백질의 발현을 증가시키는 방법이 본 명세서 기재되고, 방법은 세포 내로 (1) 제1 제제 또는 이 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 이 제2 제제를 인코딩하는 제2 핵산 서열을 전달하는 단계, 이로써 세포에서 표적 단백질의 발현을 증가시키는 단계를 포함하며, 제1 제제는 표적 단백질을 인코딩하는 표적 유전자로부터 전사되는 프리-mRNA의 스플라이싱을 조절하고, 제2 제제는 (a) 프로세싱된 mRNA의 표적 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하는 제2 제제; 또는 (c) (a)와 (b)의 조합이며, 표적 단백질은 폴리시스틴 2이다. 일부 구현예에서, 제제는 번역 조절 요소의 구조를 조절한다. 일부 구현예에서, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합이다. 일부 구현예에서, 번역 조절 요소는 프로세싱된 mRNA의 5' 비번역 영역(5' UTR)에 있다. 일부 구현예에서, 번역 조절 요소는 프로세싱된 mRNA의 5' UTR의 적어도 일부를 포함한다. 일부 구현예에서, 번역 조절 요소는 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드와의 염기쌍 형성을 수반하는 이차 mRNA 구조를 포함한다. 일부 구현예에서, 제제는 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드와의 염기쌍 형성을 억제한다. 일부 구현예에서, mRNA 이차 구조는 스템, 스템 루프, 구아닌 사중체, 또는 이들의 임의의 조합을 포함한다. 일부 구현예에서, 제제는 주요 시작 코돈에 결합하지 않는다. 일부 구현예에서, 제제는 주요 시작 코돈의 적어도 하나의 뉴클레오티드에 결합한다. 일부 구현예에서, 제제는 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드를 포함하는 이차 mRNA 구조의 형성을 억제하거나 감소시킨다. 일부 구현예에서, 제제는 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드와 프로세싱된 mRNA의 또 다른 뉴클레오티드과의 염기쌍 형성을 억제하거나 감시시킬 수 있고, 임의로 또 다른 뉴클레오티드는 프로세싱된 mRNA의 5' UTR의 또 다른 뉴클레오티드이다. 일부 구현예에서, 번역 조절 요소는 업스트림 열린 해독틀(uORF)의 적어도 일부를 포함한다. 일부 구현예에서, 제제는 uORF의 적어도 일부를 수반하는 이차 mRNA 구조의 형성을 촉진한다. 일부 구현예에서, 번역 조절 요소는 업스트림 시작 코돈을 포함한다. 일부 구현예에서, 제제는 업스트림 시작 코돈의 적어도 하나의 뉴클레오티드와의 염기쌍 형성을 수반하는 이차 mRNA 구조의 형성을 촉진한다. 일부 구현예에서, 제제는 업스트림 시작 코돈에 결합하지 않는다. 일부 구현예에서, 제제는 업스트림 시작 코돈에 결합한다. 일부 구현예에서, 제제는 업스트림 시작 코돈의 적어도 하나의 뉴클레오티드를 포함하는 이차 mRNA 구조의 형성을 촉진하거나 증가시킨다. 일부 구현예에서, 제제는 업스트림 시작 코돈의 적어도 하나의 뉴클레오티드와 프로세싱된 mRNA의 또 다른 뉴클레오티드와의 염기쌍 형성을 촉진하거나 증가시키고, 임의로 또 다른 뉴클레오티드는 프로세싱된 mRNA의 5' UTR의 또 다른 뉴클레오티드이다. 일부 구현예에서, 번역 조절 요소는 프로세싱된 mRNA의 G 풍부 서열에 의해 형성된 구아닌 사중체를 포함한다. 일부 구현예에서, 제제는 구아닌 사중체의 형성을 억제한다. 일부 구현예에서, G 풍부 서열은 프로세싱된 mRNA의 5' 비번역 영역(5' UTR)의 적어도 일부를 포함한다. 일부 구현예에서, G 풍부 서열은 프로세싱된 mRNA의 5' 비번역 영역(5' UTR)에 존재한다. 일부 구현예에서, G 풍부 서열은 식 Gx-N1-7-Gx-N1-7-Gx-N1-7-Gx(서열번호: 227)에 따른 서열을 포함하며, 여기서 x ≥ 3이고 N은 A, C, G 또는 U이다. 일부 구현예에서, G 풍부 서열은 서열 GGGAGCCGGGCUGGGGCUCACACGGGGG(서열번호: 228)를 포함한다. 일부 구현예에서, Gx 서열의 적어도 1개, 2개, 3개 또는 4개 모두는 구조화되거나, 이차 구조로 존재하거나, 또 다른 뉴클레오티드와 염기 쌍을 이루며, 임의로 또 다른 뉴클레오티드는 C 또는 U이다. 일부 구현예에서, 제제는 구아닌 사중체를 완화하거나, 변형을 촉진하거나, 형성을 억제 또는 감소시킨다. 일부 구현예에서, 제제는 구아닌 사중체의 Gx 서열 중 적어도 1개, 2개, 3개 또는 4개 모두의 염기쌍 형성 또는 구조를 완화하거나, 변형을 촉진하거나, 억제 또는 감소시킨다. 일부 구현예에서, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 5' UTR 내에 있다. 일부 구현예에서, 프로세싱된 mRNA의 표적화 부분은 표 3의 서열로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 갖는다. 일부 구현예에서, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 주요 시작 코돈으로부터 바로 다운스트림인 코돈의 업스트림에 적어도 하나의 뉴클레오티드를 포함한다. 일부 구현예에서, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 주요 시작 코돈의 업스트림에 있는 적어도 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 150, 160, 180, 또는 200개의 뉴클레오티드이다. 일부 구현예에서, 프로세싱된 mRNA의 표적화 부분은 주요 시작 코돈의 업스트림에 있는 약 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 150, 160, 180, 200, 또는 220개의 뉴클레오티드이다. 일부 구현예에서, 프로세싱된 mRNA는 표 3의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 서열을 갖는다. 일부 구현예에서, 제제는 안티센스 올리고머를 포함한다. 일부 구현예에서, 안티센스 올리고머는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는다. 일부 구현예에서, 번역 조절 요소는 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도를 억제함으로써 프로세싱된 mRNA의 번역을 억제한다. 일부 구현예에서, 제제는 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도를 증가시킴으로써 세포에서 폴리시스틴 2 단백질의 발현을 증가시킨다. 일부 구현예에서, 안티센스 올리고머는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 약 100% 서열 동일성을 갖는다. 일부 구현예에서, 안티센스 올리고머는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는다. 일부 구현예에서, 안티센스 올리고머는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 약 100% 서열 동일성을 갖는다. 일부 구현예에서, 제제는 프로세싱된 mRNA의 번역을 조절하는 하나 이상의 인자의 결합을 조절한다. 일부 구현예에서, 안티센스 올리고머는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다. 일부 구현예에서, 안티센스 올리고머는 포스포로디아미데이트 모폴리노, 잠금 핵산, 펩티드 핵산, 2'-O-메틸 모이어티, 2'-플루오로 모이어티, 또는 2'-O-메톡시에틸 모이어티를 포함한다. 일부 구현예에서, 안티센스 올리고머는 적어도 하나의 변형된 당 모이어티를 포함한다. 일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다. 일부 구현예에서, 안티센스 올리고머는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다. 일부 구현예에서, 벡터는 제제를 인코딩하는 바이러스 벡터를 포함한다. 일부 구현예에서, 바이러스 벡터는 아데노바이러스 벡터, 아데노 연관 바이러스 (AAV) 벡터, 렌티바이러스 벡터, 단순 포진 바이러스 (HSV) 바이러스 벡터, 또는 레트로바이러스 벡터를 포함한다. 일부 구현예에서, 제제는 세포 침투 펩티드를 추가로 포함한다. 일부 구현예에서, 제제는 안티센스 올리고머에 접합된 세포 침투 펩티드를 포함한다. 일부 구현예에서, 안티센스 올리고머는 포스포로디아미데이트 모폴리노 올리고머이다. 일부 구현예에서, 제제는 유전자 편집 분자 또는 게놈 편집 분자를 인코딩하는 폴리뉴클레오티드를 포함한다. 일부 구현예에서, 제제는 (i) 프로세싱된 mRNA 전사체, (ii) 프로세싱된 mRNA 전사체가 프로세싱된 프리-mRNA, 또는 (iii) 프리-mRNA를 인코딩하는 유전자의 표적 모티프에 결합하는 다핵산 폴리머를 포함한다. 일부 구현예에서, 유전자 편집 분자는 CRISPR-Cas9 또는 이의 기능성 등가물, 및/또는 (i) 프로세싱된 mRNA 전사체, (ii) 프로세싱된 mRNA 전사체가 프로세싱된 프리-mRNA, 또는 (iii) 프리-mRNA를 인코딩하는 유전자의 표적 모티프에 결합하는 다핵산 폴리머를 포함한다. 일부 구현예에서, 표적 모티프에 결합하는 다핵산 폴리머는 가이드 RNA(gRNA)를 포함한다. 일부 구현예에서, 제제는 세포에서 폴리시스틴 2 단백질의 발현을 증가시킨다. 일부 구현예에서, 세포에서 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도가 증가된다. 일부 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터와 접촉된 세포에서 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도는 제제 또는 이 제제를 인코딩하는 벡터와 접촉하지 않은 대조군 세포에서 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도에 비해 증가된다. 일부 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터와 접촉한 세포에서 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도는 제제 또는 이 제제를 인코딩하는 벡터와 접촉하지 않은 대조군 세포에서 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도와 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터와 접촉한 세포에서 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도는 제제의 부재와 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터와 접촉된 세포에서 발현된 폴리시스틴 2 단백질의 수준은 제제 또는 이 제제를 인코딩하는 벡터와 접촉하지 않은 대조군 세포에서 폴리시스틴 2 단백질의 수준과 비교하여 증가된다. 일부 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터와 접촉된 세포에서 발현되는 폴리시스틴 2 단백질의 수준은 제제 또는 이 제제를 인코딩하는 벡터와 접촉하지 않은 대조군 세포에서 폴리시스틴 2 단백질의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터와 접촉된 세포에서 발현되는 폴리시스틴 2 단백질의 수준은 제제의 부재와 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 프로세싱된 mRNA로부터 번역된 폴리시스틴 2 단백질은 기능성 폴리시스틴 2 단백질이다. 일부 구현예에서, 폴리시스틴 2 단백질은 완전히 기능적이다. 일부 구현예에서, 프로세싱된 mRNA로부터 번역된 폴리시스틴 2 단백질은 야생형 폴리시스틴 2 단백질이다. 일부 구현예에서, 프로세싱된 mRNA로부터 번역된 폴리시스틴 2 단백질은 전장 폴리시스틴 2 단백질이다. 일부 구현예에서, 프로세싱된 mRNA 전사체는 돌연변이체 프로세싱된 mRNA 전사체이다. 일부 구현예에서, 프로세싱된 mRNA 전사체는 돌연변이체 프로세싱된 mRNA 전사체가 아니다. 일부 구현예에서, 프로세싱된 mRNA는 돌연변이체 프리-mRNA인 프리-mRNA로부터 프로세싱된다. 일부 구현예에서, 프로세싱된 mRNA는 돌연변이체 프리-mRNA가 아닌 프리-mRNA로부터 프로세싱된다. 일부 구현예에서, 제제는 치료제이다.
일부 구현예에서, 세포에서 발현되는 표적 단백질의 수준은 (1) 제1 제제 또는 이 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 이 제2 제제를 인코딩하는 제2 핵산 서열의 전달에 의해 증가된다. 일부 구현예에서, 세포에서 발현되는 표적 단백질의 수준은 대조군 세포에 비해 증가된다. 일부 구현예에서, 대조군 세포는 제1 제제와 접촉하지 않고 제2 제제와 접촉하지 않은 세포이거나, 또는 여기서 대조군 세포는 제1 제제를 인코딩하는 제1 핵산 서열이 전달되지 않았고 제2 제제를 인코딩하는 제2 핵산 서열이 전달되지 않은 세포이다. 일부 구현예에서, 대조군 세포는 제1 제제와 접촉하지 않고 제2 제제와 접촉하지 않은 세포이거나, 또는 여기서 대조군 세포는 제1 제제를 인코딩하는 제1 핵산 서열이 전달되었고 제2 제제를 인코딩하는 제2 핵산 서열이 전달된 세포이다. 일부 구현예에서, 대조군 세포는 제2 제제와 접촉하지 않고 제1 제제와 접촉하지 않은 세포이거나, 또는 여기서 대조군 세포는 제2 제제를 인코딩하는 제2 핵산 서열이 전달되었고 제1 제제를 인코딩하는 제1 핵산 서열이 전달된 세포이다. 일부 구현예에서, 세포에서 발현되는 표적 단백질의 수준은 대조군 세포와 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, (1) 제1 제제 또는 이 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 이 제2 제제를 인코딩하는 제2 핵산 서열이 전달되는 세포에서 발현되는 표적 단백질의 수준은 제1 제제 또는 제2 제제의 부재와 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 일부 구현예에서, (1) 제1 제제 또는 이 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 이 제2 제제를 인코딩하는 제2 핵산 서열이 전달되는 세포에서 발현되는 표적 단백질의 수준은 제1 제제 또는 제2 제제의 부재와 비교하여 적어도 약 1.5배까지 증가된다.
또한 본원에 개시된 치료제 및 약제학적으로 허용되는 담체 또는 부형제를 포함하는 약제학적 조성물이 본원에 제공된다.
또한 본원에 개시된 치료제를 인코딩하는 벡터 및 약제학적으로 허용되는 담체 또는 부형제를 포함하는 약제학적 조성물이 본원에 제공된다.
또한 본원에 개시된 조성물 및 약제학적으로 허용되는 담체 또는 부형제를 포함하는 약제학적 조성물이 본원에 제공된다.
참고에 의한 포함
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 구체적이고 개별적으로 참고로 포함되는 것으로 표시된 것과 동일한 정도로 본원에 참조로 포함된다.
본 발명의 새로운 특징은 특히 첨부된 청구범위에 기재되어 있다. 본 발명의 특징 및 장점에 대한 더 나은 이해는 본 발명의 원리가 활용되는 예시적인 구현예를 설명하는 다음의 상세한 설명 및 첨부된 도면을 참조함으로써 얻어질 것이다:
도 1a 및 도 1b는 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손) 및 기능성 RNA 또는 전장 표적 단백질의 발현을 증가시키기 위한 넌센스 매개 mRNA 붕괴 유도 엑손의 치료제 매개 배제를 함유하는 표적 프리-mRNA의 도식적 표현을 도시한다. 도 1a는 핵 구획과 세포질 구획으로 나누어진 세포를 보여준다. 핵에서, 표적 유전자의 프리-mRNA 전사체는 스플라이싱을 거쳐 mRNA를 생성하고, 이 mRNA는 세포질로 내보내지고 표적 단백질로 번역된다. 이 표적 유전자의 경우, mRNA의 일부 분획에는 세포질에서 분해되는 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손 mRNA)이 함유되어 있어 표적 단백질 생산이 이루어지지 않는다. 도 1b는 핵 및 세포질 구획으로 나누어진 동일한 세포의 예를 보여준다. 안티센스 올리고머(ASO)와 같은 치료제로 치료하면 넌센스 매개 mRNA 붕괴 유도 엑손의 배제를 촉진하고 기능적(생산적) mRNA를 증가시키고, 이는 더 높은 수준의 표적 단백질로 번역된다.
도 2는 PKD2 NMD(넌센스 매개 mRNA 붕괴) 유도 엑손 포함 이벤트를 도시한다. NMD 유도 엑손 포함 이벤트: NMD 유도 엑손 포함 이벤트(chr4:88031085-88031140)를 함유하는 PKD2 유전자(엑손은 직사각형이고 인트론은 화살촉이 있는 선) 영역의 UCSC 게놈 브라우저 스냅샷은 음영 영역과 상단의 검은색 막대로 표시된다. 4개의 대표적인 인간 신장 샘플 및 사이클로헥시미드(CHX) 또는 DMSO 대조군으로 처리된 혼합 신장 상피 세포의 RNA 시퀀싱 흔적이 표시된다.
도 3은 PKD2 NMD 유도 alt 5'ss 이벤트를 도시한다. NMD 유도 alt 5'ss의 이벤트: NMD 유도 대체 5' 스플라이스 부위 이벤트(chr4:88036355-88036480)를 함유하는 PKD2 유전자(엑손은 직사각형이고 인트론은 화살촉이 있는 선) 영역의 UCSC 게놈 브라우저 스냅샷은 음영 영역과 상단의 검은색 막대로 표시된다. 4개의 대표적인 인간 신장 샘플 및 사이클로헥시미드(CHX) 또는 DMSO 대조군으로 처리된 혼합 신장 상피 세포의 RNA 시퀀싱 흔적이 표시된다. *alt_5 ss는 대체 5' 스플라이스 부위를 지칭한다.
도 4a 내지 도 4c는 NMD 유도 이벤트의 검정을 도시한다. 도 4a는 NMD 유도 엑손(chr4 88031085 88031140) 이벤트의 도식적 표현을 보여준다. 도 4b는 대체 5' 스플라이스 부위(Alt 5'ss)(chr4 88036354 88036480) 이벤트의 도식적 표현을 보여준다. *alt_5 ss는 대체 5' 스플라이스 부위를 지칭한다. 이 예에서, 대체 5' 스플라이스-부위(alt 5' ss)에서 스플라이싱으로 인해 생성된 엑손은 정규 엑손 3 (검은색 막대) 외에 대체 5' 스플라이스-부위(회색 막대)에서 스플라이싱에 의해 연장된 엑손 영역을 함유하고, 따라서 해당 정규 엑손 3(검은색 막대)보다 길다. 일관되게 대체 5' 스플라이스-부위(alt 5' ss)에서 스플라이싱으로 인한 인트론은 해당 정규 인트론 3보다 짧다. 도 4c는 DMSO(-) 또는 시클로헥시미드(CHX)(+)로 처리된 인간 신장 혼합 상피 세포 및 인간 신장 피질 상피 세포로부터의 RNA를 사용한 RT-PCR을 보여준다. 프라이머는 엑손 2와 4에 위치하였다.
도 5는 NMD 엑손 포함 이벤트에 대한 ASO 워크 디자인(walk design)을 도시한다. 음영 처리된 뉴클레오티드는 NMD 유도 엑손 2X에 해당한다. 도 5는 출현 순서대로 각각 서열 번호 263-265를 개시한다.
도 6a 및 6b는 Alt 5'ss 이벤트에 대한 ASO 워크 디자인을 도시한다. 음영 처리된 뉴클레오티드는 표시된 Alt 5'ss의 선택으로 인해 발생하는 연장된 엑손 3의 일부에 해당한다. *alt_5 ss는 대체 5' 스플라이스 부위를 지칭한다. 도 6은 출현 순서대로 각각 서열 번호 266-270를 개시한다.
도 7a는 80nM에서 표시된 ASO로 24시간 동안 형질감염된 일차 신장 혼합 상피 세포를 사용하여 생산적인 PKD2 mRNA의 변화를 도시한다(도 6a 및 6b의 매크로워크 참조).
도 7b는 80nM에서 표시된 ASO로 24시간 동안 형질감염된 일차 신장 혼합 상피 세포를 사용하여 비생산적인 PKD2 mRNA의 변화를 도시한다(도 6a 및 6b의 매크로워크 참조).
도 8a는 80nM에서 표시된 ASO로 24시간 동안 형질감염된 일차 신장 혼합 상피 세포를 사용하여 생산적인 PKD2 mRNA의 변화를 도시한다(도 5의 매크로워크 참조).
도 8b는 80nM에서 표시된 ASO로 24시간 동안 형질감염된 일차 신장 혼합 상피 세포를 사용하여 비생산적인 PKD2 mRNA의 변화를 도시한다(도 5의 매크로워크 참조).
도 9a 내지 도 9e는 생산적인 mRNA 및 단백질 생산을 증가시키기 위해 2개의 이벤트를 표적으로 하는 ASO를 예시한다. 도 9a는 비생산적 엑손 포함 NMD 이벤트 활용에 대한 ASO 조합의 효과를 도시한다. 도 9b는 ASO 조합을 사용한 EX2-EX3 생산적인 mRNA의 발현을 도시한다. 도 9c는 비생산적인 대체 5'ss NMD 이벤트 활용에 대한 ASO 조합의 효과를 도시한다. 도 9d는 ASO 조합을 사용한 EX3-EX4 생산적인 mRNA의 발현을 도시한다. 도 9e는 ASO 조합으로 처리한 후 폴리시스틴 2(PKD2) 단백질 웨스턴 블롯의 정량화를 도시한다.
도 10은 PKD2의 업스트림 열린 해독틀 매크로워크를 예시한다. 음영 처리된 뉴클레오티드는 각각 업스트림 열린 해독틀과 표준 시작 코돈에 해당한다. 도10은 서열번호: 271을 개시한다.
도 1a 및 도 1b는 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손) 및 기능성 RNA 또는 전장 표적 단백질의 발현을 증가시키기 위한 넌센스 매개 mRNA 붕괴 유도 엑손의 치료제 매개 배제를 함유하는 표적 프리-mRNA의 도식적 표현을 도시한다. 도 1a는 핵 구획과 세포질 구획으로 나누어진 세포를 보여준다. 핵에서, 표적 유전자의 프리-mRNA 전사체는 스플라이싱을 거쳐 mRNA를 생성하고, 이 mRNA는 세포질로 내보내지고 표적 단백질로 번역된다. 이 표적 유전자의 경우, mRNA의 일부 분획에는 세포질에서 분해되는 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손 mRNA)이 함유되어 있어 표적 단백질 생산이 이루어지지 않는다. 도 1b는 핵 및 세포질 구획으로 나누어진 동일한 세포의 예를 보여준다. 안티센스 올리고머(ASO)와 같은 치료제로 치료하면 넌센스 매개 mRNA 붕괴 유도 엑손의 배제를 촉진하고 기능적(생산적) mRNA를 증가시키고, 이는 더 높은 수준의 표적 단백질로 번역된다.
도 2는 PKD2 NMD(넌센스 매개 mRNA 붕괴) 유도 엑손 포함 이벤트를 도시한다. NMD 유도 엑손 포함 이벤트: NMD 유도 엑손 포함 이벤트(chr4:88031085-88031140)를 함유하는 PKD2 유전자(엑손은 직사각형이고 인트론은 화살촉이 있는 선) 영역의 UCSC 게놈 브라우저 스냅샷은 음영 영역과 상단의 검은색 막대로 표시된다. 4개의 대표적인 인간 신장 샘플 및 사이클로헥시미드(CHX) 또는 DMSO 대조군으로 처리된 혼합 신장 상피 세포의 RNA 시퀀싱 흔적이 표시된다.
도 3은 PKD2 NMD 유도 alt 5'ss 이벤트를 도시한다. NMD 유도 alt 5'ss의 이벤트: NMD 유도 대체 5' 스플라이스 부위 이벤트(chr4:88036355-88036480)를 함유하는 PKD2 유전자(엑손은 직사각형이고 인트론은 화살촉이 있는 선) 영역의 UCSC 게놈 브라우저 스냅샷은 음영 영역과 상단의 검은색 막대로 표시된다. 4개의 대표적인 인간 신장 샘플 및 사이클로헥시미드(CHX) 또는 DMSO 대조군으로 처리된 혼합 신장 상피 세포의 RNA 시퀀싱 흔적이 표시된다. *alt_5 ss는 대체 5' 스플라이스 부위를 지칭한다.
도 4a 내지 도 4c는 NMD 유도 이벤트의 검정을 도시한다. 도 4a는 NMD 유도 엑손(chr4 88031085 88031140) 이벤트의 도식적 표현을 보여준다. 도 4b는 대체 5' 스플라이스 부위(Alt 5'ss)(chr4 88036354 88036480) 이벤트의 도식적 표현을 보여준다. *alt_5 ss는 대체 5' 스플라이스 부위를 지칭한다. 이 예에서, 대체 5' 스플라이스-부위(alt 5' ss)에서 스플라이싱으로 인해 생성된 엑손은 정규 엑손 3 (검은색 막대) 외에 대체 5' 스플라이스-부위(회색 막대)에서 스플라이싱에 의해 연장된 엑손 영역을 함유하고, 따라서 해당 정규 엑손 3(검은색 막대)보다 길다. 일관되게 대체 5' 스플라이스-부위(alt 5' ss)에서 스플라이싱으로 인한 인트론은 해당 정규 인트론 3보다 짧다. 도 4c는 DMSO(-) 또는 시클로헥시미드(CHX)(+)로 처리된 인간 신장 혼합 상피 세포 및 인간 신장 피질 상피 세포로부터의 RNA를 사용한 RT-PCR을 보여준다. 프라이머는 엑손 2와 4에 위치하였다.
도 5는 NMD 엑손 포함 이벤트에 대한 ASO 워크 디자인(walk design)을 도시한다. 음영 처리된 뉴클레오티드는 NMD 유도 엑손 2X에 해당한다. 도 5는 출현 순서대로 각각 서열 번호 263-265를 개시한다.
도 6a 및 6b는 Alt 5'ss 이벤트에 대한 ASO 워크 디자인을 도시한다. 음영 처리된 뉴클레오티드는 표시된 Alt 5'ss의 선택으로 인해 발생하는 연장된 엑손 3의 일부에 해당한다. *alt_5 ss는 대체 5' 스플라이스 부위를 지칭한다. 도 6은 출현 순서대로 각각 서열 번호 266-270를 개시한다.
도 7a는 80nM에서 표시된 ASO로 24시간 동안 형질감염된 일차 신장 혼합 상피 세포를 사용하여 생산적인 PKD2 mRNA의 변화를 도시한다(도 6a 및 6b의 매크로워크 참조).
도 7b는 80nM에서 표시된 ASO로 24시간 동안 형질감염된 일차 신장 혼합 상피 세포를 사용하여 비생산적인 PKD2 mRNA의 변화를 도시한다(도 6a 및 6b의 매크로워크 참조).
도 8a는 80nM에서 표시된 ASO로 24시간 동안 형질감염된 일차 신장 혼합 상피 세포를 사용하여 생산적인 PKD2 mRNA의 변화를 도시한다(도 5의 매크로워크 참조).
도 8b는 80nM에서 표시된 ASO로 24시간 동안 형질감염된 일차 신장 혼합 상피 세포를 사용하여 비생산적인 PKD2 mRNA의 변화를 도시한다(도 5의 매크로워크 참조).
도 9a 내지 도 9e는 생산적인 mRNA 및 단백질 생산을 증가시키기 위해 2개의 이벤트를 표적으로 하는 ASO를 예시한다. 도 9a는 비생산적 엑손 포함 NMD 이벤트 활용에 대한 ASO 조합의 효과를 도시한다. 도 9b는 ASO 조합을 사용한 EX2-EX3 생산적인 mRNA의 발현을 도시한다. 도 9c는 비생산적인 대체 5'ss NMD 이벤트 활용에 대한 ASO 조합의 효과를 도시한다. 도 9d는 ASO 조합을 사용한 EX3-EX4 생산적인 mRNA의 발현을 도시한다. 도 9e는 ASO 조합으로 처리한 후 폴리시스틴 2(PKD2) 단백질 웨스턴 블롯의 정량화를 도시한다.
도 10은 PKD2의 업스트림 열린 해독틀 매크로워크를 예시한다. 음영 처리된 뉴클레오티드는 각각 업스트림 열린 해독틀과 표준 시작 코돈에 해당한다. 도10은 서열번호: 271을 개시한다.
다양한 구현예에 대한 철저한 이해를 제공하기 위해 이 설명의 특정 세부 사항이 제시된다. 그러나, 당업자는 본 발명이 이러한 세부사항 없이 실시될 수 있음을 이해할 것이다. 다른 경우에, 구현예의 설명을 불필요하게 모호하게 하는 것을 피하기 위해 잘 알려진 구조는 상세하게 도시되거나 기재되지 않았다. 문맥상 달리 요구되지 않는 한, 명세서 및 청구범위 전체에 걸쳐 단어 "포함하다(comprise)" 및 그의 변형, 예컨대, "포함하다(comprises)" 및 "포함하는(comprising)"은 개방적이고 포괄적인 의미로 해석되어야 하지만 이에 제한되지 않는다. 또한, 여기에 제공된 제목은 편의를 위한 것이며 청구된 개시 내용의 범위 또는 의미를 해석하지 않는다.
본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수형 "a", "an" 및 "the"는 내용이 달리 명백하게 지시하지 않는 한 복수의 지시 대상을 포함한다. 또한 "또는"이라는 용어는 전형적으로 내용이 달리 명시하지 않는 한 "및/또는"을 포함하는 의미로 사용된다는 점에 유의해야 한다.
본원에서 사용되는 좌표는 Hg38(인간 게놈 빌드 38)로도 알려진 게놈 참조 어셈블리 GRCh38(Genome Research Consortium 인간 빌드 38)의 좌표를 지칭한다.
달리 정의되지 않는 한, 본원에 사용되는 모든 기술 및 과학 용어는 본 개시내용이 속하는 기술분야에 통상의 지식을 갖는 사람에 의해 전형적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기재된 것과 유사하거나 동등한 방법 및 물질이 본 개시내용의 실시 또는 테스트에 사용될 수 있지만, 적합한 방법 및 물질이 하기에 기재되어 있다.
PKD2 유전자의 대체 스플라이싱 이벤트는 감소된 단백질 발현을 초래할 수 있는 비-생산적인 mRNA 전사체로 이어질 수 있으며, PKD2 유전자의 대체 스플라이싱 이벤트를 표적으로 할 수 있는 치료제는 환자의 기능성 단백질의 발현 수준을 조절(예를 들어, 증가)할 수 있다. 이러한 치료제는 폴리시스틴 2 또는 폴리시스틴 1 결핍에 의해 야기된 병태를 치료하는 데 사용될 수 있다.
비생산적인 mRNA 전사체로 이어질 수 있는 대체 스플라이싱 이벤트 중 하나는 넌센스 매개 mRNA 붕괴를 유도할 수 있는 mRNA 전사체에 여분의 엑손을 포함하는 것이다. 본 개시내용은 또한 PKD2 프리-mRNA로부터 여분의 엑손의 스플라이싱을 조절하여 단백질 코딩 성숙 mRNA의 생산, 따라서 번역된 기능성 폴리시스틴 2의 생산을 증가시키기 위한 조성물 및 방법을 제공한다. 예를 들어, 본원에서 제공되는 조성물 및 방법은 PKD2 프리-mRNA로부터 여분의 엑손의 배제를 촉진할 수 있고, 이로써 프리-mRNA로부터 프로세싱되고 여분의 엑손이 결여된 프로세싱된 mRNA의 수준을 조절할 수 있다.
비생산적인 mRNA 전사체로 이어질 수 있는 또 다른 대체 스플라이싱 이벤트는 대체 5' 스플라이스 부위 이벤트이다. 예를 들어, 대체 5' 스플라이스-부위(예를 들어, 정규 5' ss의 다운스트림)에서 스플라이싱으로 인해 발생하는 엑손은 해당 정규 엑손보다 더 긴 엑손을 초래할 수 있다. 예를 들어, 대체 5' 스플라이스-부위에서 스플라이싱으로 인한 인트론은 해당 정규 인트론보다 짧을 수 있다. 본 개시내용은 PKD2 프리-mRNA의 대체 스플라이싱을 조정하여 단백질 코딩 성숙 mRNA의 생산, 따라서 번역된 기능성 폴리시스틴 2를 증가시키기 위한 조성물 및 방법을 제공한다. 예를 들어, 본원에서 제공되는 조성물 및 방법은 대체 5' 스플라이스-부위에서 스플라이싱을 방지하거나 감소시킴으로써 PKD2 프리-mRNA의 프로세싱을 조절할 수 있다.
이들 조성물 및 방법은 PKD2 프리-mRNA의 구성적 스플라이싱을 촉진할 수 있는 안티센스 올리고머(ASO)를 포함한다. 다양한 구현예에서, 기능성 폴리시스틴 2는 폴리시스틴 2 또는 폴리시스틴 1 결핍에 의해 야기된 병태를 치료하기 위해 개시내용의 방법을 사용하여 증가될 수 있다.
본원에서 언급된 바와 같이 APC2, PKD4, Pc-2, TRPP2, 다낭성 신장 질환 2, 일시적 수용체 전위 양이온 채널로도 알려진 "폴리시스틴 2"는 폴리시스틴 2 활성을 갖거나 유지하는 임의의 재조합 또는 자연 발생 형태의 폴리시스틴 2 또는 이의 변이체 또는 동형체를 포함한다 (예를 들어, 적어도 40% 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성). 일부 양태에서, 변이체 또는 동형체는 자연 발생 폴리시스틴 2에 비해 전체 서열 또는 서열의 일부(예를 들어, 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 갖는다. 일부 구현예에서, 폴리시스틴 2는 UniProt 참조 번호 Q13563으로 확인되는 단백질 또는 실질적 동일성을 갖는 변이체 또는 동형체와 실질적으로 동일하다.
상염색체 우성 다낭성 신장 질환(ADPKD)은 말기 신장 질환의 8~10%를 차지하는 흔한 유전 질환이다. ADPKD는 염색체 16p13.3(PKD1)(1) 및 염색체 4q21-23(PKD2)에 맵핑된 유전자좌를 가진 유 전적으로 이질적이다. 폴리시스틴 1(PKD1에 의해 인코딩됨) 및 폴리시스틴 2(PKD2에 의해 인코딩됨)의 예측된 구조 및 유사한 질환 프로파일은 세포외 접착 이벤트를 이온 수송의 변경과 연결하는 공통 신호전달 경로에 관여함을 시사한다. 폴리시스틴 1과 폴리시스틴 2는 C 말단 세포질 꼬리를 통해 상호 작용하는 것으로 입증되었다. 이 상호작용은 폴리시스틴 1의 상향 조절을 초래했지만 폴리시스틴 2는 상향 조절하지 않았다. 폴리시스틴 1이 아닌 폴리시스틴 2의 세포질 꼬리는 폴리시스틴 1과의 상호 작용에 필요한 도메인과 다른 영역을 통해 동종이량체를 형성하였다. 이러한 결과는 폴리시스틴 2의 돌연변이는 폴리시스틴 1의 기능을 방해하여 정상적인 세뇨관생성에서 작동하는 공통 신호전달 전달 경로의 뚜렷한 분자 병변을 통해 폴리시스틴 1과 유사한 질환 발현을 초래할 수 있는 메커니즘과 일치한다. 데이터는 폴리시스틴 1과 폴리시스틴 2가 낭종 형성을 방지하는 공통 신호전달 경로에 참여한다는 생각을 뒷받침한다(Tsiokas 등, PNAS, Jun 1997, 94(13) 6965-6970, 이의 전체 내용은 참조로 본원에 포함됨). 데이터는 또한 폴리시스틴 1과 폴리시스틴 2 발현이 자가포식이 하향 조절되고 세포사가 증가하는 더 긴 기아 기간 동안 전형적으로 발생하는 전이를 조절하는 공통 신호전달 경로에 참여한다는 생각을 뒷받침하고; 폴리시스틴 1 및 폴리시스틴 2는 생존에서 사망까지의 mIMCD에서 생존에서 사망 기아로의 이러한 전이를 조절할 수 있다(Decuypere, 등, Int. J. Mol. Sci. 2021, 22, 13511). 또한, PKD1/PKD2의 복용량 변화가 ADPKD 병인에 중요한 것으로 알려져 있지만, PKD1/PKD2 발현이 어떻게 조절되는지는 잘 이해되지 않고 있지만; PKD2 번역을 억제할 수 있는 PKD2의 업스트림 열린 해독틀(uORF)에 대한 증거가 있다(Tang, 등, FASEB J. 2013 Dec; 27(12):4998-5009).
용어 "넌센스 매개 RNA 붕괴 엑손"(또는 "NSE" 또는 "NMD 엑손") 및 "NMD 유도 엑손"(또는 NIE)은 상호교환적으로 사용되며 성숙 RNA 전사체에 존재하는 경우 NMD 경로를 활성화할 수 있는 엑손 (예를 들어, 비정규 엑손)을 지칭할 수 있다. 구성적 스플라이싱 이벤트에서, NIE를 함유하는 인트론은 전형적으로 스플라이싱되지만, 인트론 또는 그 일부(예를 들어, NIE)는 대체 또는 비정상적인 스플라이싱 이벤트 동안 유지될 수 있다. NIE를 함유하는 성숙 mRNA 전사체는 예를 들어 NMD 경로를 유도하는 프레임 이동으로 인해 비-생산적일 수 있다. 일부 구현예에서, NMD 엑손은 조기 종결 코돈(또는 조기 종결 코돈(PTC)) 또는 NMD 엑손을 함유하는 성숙 RNA 전사체의 분해를 촉진하는 다른 서열을 함유하는 엑손이다. 성숙 RNA 전사체에 NIE를 포함시키면 유전자 발현이 하향 조절될 수 있다. 일부 구현예에서, NMD 엑손은 대체 스플라이싱 이벤트로부터 생성된 엑손이다. 예를 들어, NMD 엑손은 대체 5' 스플라이스 부위 이벤트에서 생성된 엑손일 수 있다. 예를 들어, NMD 엑손은 정규 엑손 및 정규 엑손에 인접한 인트론의 적어도 일부를 함유하는 엑손일 수 있다. 예를 들어, NMD 엑손은 전체 정규 엑손 및 정규 엑손 바로 다운스트림인 인트론의 적어도 일부를 함유하는 엑손일 수 있다. 일부 구현예에서 NMD 엑손은 인트론(예를 들어, 정규 인트론) 내의 영역이다.
대체 스플라이싱은 성숙 mRNA 전사체에 적어도 하나의 NSE를 포함시킬 수 있다. 용어 "성숙 mRNA" 및 "완전히 스플라이싱된 mRNA"는 완전히 프로세싱된 mRNA를 설명하기 위해 본원에서 상호교환적으로 사용된다. NMD 엑손을 함유하는 성숙 mRNA는 비-생산적인 mRNA일 수 있고 성숙 mRNA의 NMD로 이어질 수 있다. NIE 함유 성숙 mRNA는 때때로 NIE를 함유하지 않는 상응하는 성숙 mRNA로부터의 단백질 발현과 비교하여 감소된 단백질 발현을 야기할 수 있다.
가짜(pseudo) 스플라이스 부위는 진정한 스플라이스 부위와 동일한 스플라이싱 인식 서열을 갖지만 스플라이싱 반응에는 사용되지 않는다. 그들은 인간 게놈의 진정항 스플라이스 부위보다 훨씬 더 많으며 전형적으로 지금까지 제대로 이해되지 않은 분자 메커니즘에 의해 억제된다. 숨겨진 5' 스플라이스 부위는 공통 NNN/GUNNNN 또는 NNN/GCNNNN을 가지며, 여기서 N은 임의의 뉴클레오티드이고/이거나 엑손-인트론 경계이다. 숨겨진 3' 스플라이스 부위에는 공통 NAG/N이 있다. 이들의 활성화는 M이 C 또는 A, R이 G 또는 A, Y가 C 또는 U인 각각 MAG/GURAGU 및 YAG/G와 같은 진본 스플라이스 부위의 최적 공통과 더 유사하게 만드는 주변 뉴클레오티드에 의해 긍정적으로 영향을 받는다.
스플라이스 부위 및 그 조절 서열은 예를 들어 문헌[Kralovicova, J. and Vorechovsky, I. (2007) Global control of aberrant splice site activation by auxiliary splicing sequences: evidence for a gradient in exon and intron definition. Nucleic Acids Res., 35, 6399-6413, (ncbi.nlm.nih.gov/pmc/articles/PMC2095810/pdf/gkm680.pdf)]에 나열된 공개적으로 이용 가능한 적합한 알고리즘을 사용하여 당업자에 의해 쉽게 식별될 수 있다.
스플라이싱 및 넌센스 매개 mRNA 붕괴
개재 서열 또는 인트론은 일차 전사체, 작은 핵 RNA(snRNA) 및 다수의 단백질 사이의 복잡한 상호 작용을 조율하는 스플라이세오좀(spliceosome)이라고 하는 크고 매우 동적 RNA-단백질 복합체에 의해 제거된다. 스플라이세오좀은 U2가 분기점 서열(BPS)에 결합하는 것을 촉진하기 위해 U2 보조 인자(U2AF)를 3'ss 영역에 결합하는 것을 수반하는, U1 snRNA에 의한 5' 스플라이스 부위(5'ss) 또는 U2 경로에 의한 3' 스플라이스 부위(3'ss)의 인식으로 시작으로 정렬된 방식으로 각 인트론에 즉석 조립된다. U2AF는 폴리피리미딘 트랙(PPT)에 결합하는 U2AF2로 인코딩된 65-kD 서브유닛(U2AF65) 및 3'ss에서 고도로 보존된 AG 디뉴클레오티드와 상호 작용하고 U2AF65 결합을 안정화하는 U2AF1로 인코딩된 35-kD 서브유닛(U2AF35)으로 구성된 안정적인 이종이량체이다. BPS/PPT 장치 및 3'ss/5'ss 외에도, 정확한 스플라이싱에는 인트론 또는 엑손 스플라이싱 인핸서 또는 사일런서로 알려진 스플라이스 부위 인식을 활성화하거나 억제하는 보조 서열 또는 구조가 필요하다. 이러한 요소를 통해 진정한 스플라이스 부위가 동일한 서열을 갖지만 크기 순서로 진본 부위보다 훨씬 더 많은 고등 진핵생물의 게놈에 있는 숨겨진 또는 가짜 부위의 엄청난 과잉 중에서 인식될 수 있다. 종종 조절 기능이 있지만 활성화 또는 억제의 정확한 메커니즘은 잘 알려져 있지 않다.
스플라이싱할지 여부에 대한 결정은 전형적으로 가장 정의된 스플라이싱 신호조차도 때때로 부정확하게 스플라이싱할 수 있는 결정론적 프로세스가 아닌 확률론적 프로세스로 모델링될 수 있다. 그러나 정상적인 조건에서, 프리-mRNA 스플라이싱은 놀라울 정도로 높은 충실도로 진행된다. 이는 부분적으로 인접한 시스 작용 보조 엑손 및 인트론 스플라이싱 조절 요소(ESR 또는 ISR)의 활동에 기인한다. 전형적으로 이러한 기능성 요소는 각각 스플라이싱을 자극하거나 억제하는 능력에 따라 엑손 또는 인트론 스플라이싱 인핸서(ESE 또는 ISE) 또는 사일런서(ESS 또는 ISS)로 분류된다. 일부 보조 시스-작용 요소가 U1 snRNP와 5'ss 사이의 복합체 배열과 같은 스플라이세오좀 어셈블리의 동역학에 영향을 미침으로써 작용할 수 있다는 증거가 있지만, 많은 요소가 트랜스-작용 RNA-결합 단백질(RBP)과 함께 기능할 가능성이 매우 높는 것으로 보인다. 예를 들어, 세린- 및 아르기닌 풍부 계열의 RBP (SR 단백질)은 엑손을 정의하는 데 중요한 역할을 하는 보존된 단백질 계열이다. SR 단백질은 프리-스플라이세오좀의 구성 요소를 인접한 스플라이스 부위로 동원하거나 부근에서 ESS의 효과를 길항함으로써 엑손 인식을 촉진한다. ESS의 억제 효과는 이종 핵 리보핵단백질(hnRNP) 계열의 구성원에 의해 매개될 수 있으며 인접한 스플라이스 부위에 대한 코어 스플라이싱 인자의 동원을 변경할 수 있다. 스플라이싱 조절에서의 역할 외에도, 사일런서 요소는 엑손의 전형적인 간격을 갖지만 기능성 열린 해독틀이 없는 미끼 인트론 스플라이스 부위 세트인 가짜 엑손을 억제하는 역할을 하는 것으로 제안된다. ESE 및 ESS는 동족 트랜스 작용 RBP와 협력하여 mRNA가 전구체에서 조립되는 방법, 위치 및 시기를 지정하는 일련의 스플라이싱 제어에서 중요한 구성 요소를 나타낸다.
엑손-인트론 경계를 표시하는 서열은 인간 유전자 내에서 높은 빈도로 발생할 수 있는 다양한 강도의 축퇴 신호이다. 다중 엑손 유전자에서, 상이한 쌍의 스플라이스 부위는 다양한 조합으로 함께 연결되어 단일 유전자에서 다양한 전사체 배열을 생성할 수 있다. 이것은 전형적으로 대체 프리-mRNA 스플라이싱이라고 한다. 대체 스플라이싱에 의해 생산된 대부분의 mRNA 동형은 핵에서 내보내져 기능성 폴리펩티드로 번역될 수 있지만, 단일 유전자의 상이한 mRNA 동형은 번역 효율이 크게 다를 수 있다. 조기 종료 코돈(PTC) 또는 엑손 접합 복합체의 최소 50bp 업스트림에 있는 조기 정지 코돈을 갖는 mRNA 동형은 넌센스 매개 mRNA 붕괴(NMD) 경로에 의한 분해의 표적이 될 가능성이 높다. 기존의 (BPS/PPT/3'ss/5'ss) 및 보조 스플라이싱 모티프의 돌연변이는 엑손 스킵핑 또는 숨겨진(또는 가짜) 엑손 포함 또는 스플라이스-부위 활성화와 같은 비정상적인 스플라이싱을 야기할 수 있으며 인간의 이환을과 사망률에 크게 기여할 수 있다. 비정상적인 및 대체 스플라이싱 패턴 모두 엑손 및 인트론의 천연 DNA 변이체에 의해 영향을 받을 수 있다.
엑손-인트론 경계가 코돈의 세 위치 중 어느 곳에서나 발생할 수 있다는 점을 감안할 때, 대체 스플라이싱 이벤트의 서브세트만이 정규 열린 해독틀을 유지할 수 있음이 분명하다. 예를 들어, 3으로 균등하게 나눌 수 있는 엑손만 스킵핑하거나 해독틀의 변경 없이 mRNA에 포함할 수 있다. 호환 가능한 단계가 없는 스플라이싱 이벤트는 프레임 이동을 유도한다. 다운스트림 이벤트에 의해 역전되지 않는 한, 프레임 이동은 확실히 하나 이상의 PTC로 이어질 수 있으며, 아마도 NMD에 의한 후속 분해로 이어질 수 있다. NMD는 PTC를 함유하는 mRNA를 제거하는 번역 커플링 메커니즘이다. NMD는 모든 진핵생물에 존재하는 감시 경로로 기능할 수 있다. NMD는 조기 정지 코돈 또는 PTC를 함유하는 mRNA 전사체을 제거하여 유전자 발현 오류를 줄일 수 있다. 이러한 비정상적인 mRNA의 번역은 어떤 경우에는 생성된 단백질의 유해한 기능 획득 또는 우세한 음성 활성으로 이어질 수 있다. NMD는 PTC가 있는 전사체뿐만 아니라 많은 내인성 유전자에서 발현되는 광범위한 mRNA 동형을 대상으로 하며, 이는 NMD가 세포의 정상 상태 RNA 수준에서 미세 조정과 조립 조정을 모두 유도하는 마스터 조절자임을 시사한다.
표적 유전자
본 개시내용은 기능성 단백질 코딩 성숙 mRNA의 생산을 조절하고 따라서 기능성 표적 단백질을 번역하기 위해 표적의 대체 스플라이싱을 조절하기 위한 조성물 및 방법을 제공하고, 여기서 표적은 PKD2이다. 이들 조성물 및 방법은 표적 프리-mRNA의 정규 스플라이싱을 촉진할 수 있는 안티센스 올리고머(ASO)를 포함하며, 표적은 PKD2이다. 다양한 구체예에서, 기능성 표적 단백질은 표적 단백질 결핍에 의해 야기된 병태를 치료하기 위해 본 개시내용의 방법을 사용하여 증가될 수 있으며, 여기서 표적은 PKD2로 구성된 군으로부터 선택된다.
일부 구현예에서, 본 발명의 방법은 필요로 하는 대상체에서 병태를 치료하기 위해 기능성 표적 단백질 생산을 증가시키는데 사용되며, 여기서 표적은 PKD2이다. 일부 구현예에서, 대상체는 표적 단백질이 야생형에 비해 반드시 결핍되지는 않지만 그럼에도 불구하고 표적 단백질의 증가가 병태를 완화시키는 병태를 가지며, 여기서 표적은 PKD2이다. 일부 구현예에서, 병태는 산발적 돌연변이에 의해 야기된다. 일부 구현예에서, 본 발명의 방법은 기능성 표적 단백질 생산을 감소시켜 이를 필요로 하는 대상체에서 병태를 치료하는데 사용되며, 여기서 표적은 PKD2이다. 일부 구현예에서, 본 발명의 방법은 기능성 표적 단백질 생산을 조절하여 이를 필요로 하는 대상체에서 병태를 치료하는데 사용되며, 여기서 표적은 PKD2이다.
표적 전사체
일부 구현예에서, 본 개시내용의 방법은 PKD2 유전자로부터 전사된 프리-mRNA에서 NIE의 존재를 활용한다. 기능성 성숙 PKD2 mRNA를 생성하기 위한 확인된 PKD2 NIE 프리-mRNA 종의 스플라이싱은 NIE의 스킵핑을 자극하는 ASO와 같은 치료제를 사용하여 유도될 수 있다. 생성된 성숙 PKD2 mRNA는 NMD 경로를 활성화하지 않고 정상적으로 번역될 수 있으므로 환자의 세포에서 폴리시스틴 2의 양이 증가하고 PKD2 결핍과 관련된 병태 또는 질환, 예를 들어 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환, 및 두개내 동맥류의 증상을 완화한다.
기능적이고 성숙 표적 mRNA를 생산하기 위한 확인된 표적 NSE 프리-mRNA 전사체의 정규 스플라이싱은 정규 스플라이스 부위에서 표적 NSE 프리-mRNA의 구성적 스플라이싱을 촉진하는 ASO와 같은 치료제를 사용하여 유도될 수 있다. 일부 구현예에서, 생성된 기능성 성숙 표적 mRNA는 정상적으로 번역될 수 있고, 이로써 환자의 세포에서 기능성 표적 단백질의 양을 증가시키고 표적 연관 질환의 증상을 예방할 수 있다.
다양한 구현예에서, 본 개시내용은 스플라이싱 또는 단백질 발현 수준을 조절하기 위해 PKD2 프리-mRNA를 표적화할 수 있는 치료제를 제공한다. 치료제는 소분자, 핵산 올리고머 또는 폴리펩티드일 수 있다. 일부 구현예에서, 치료제는 ASO이다. PKD2 프리-mRNA에 대한 다양한 영역 또는 서열은 ASO와 같은 치료제에 의해 표적화될 수 있다. 일부 구현예에서, ASO는 PKD2 유전자로부터 전사된 PKD2 NSE 프리-mRNA를 표적으로 한다. 일부 구현예에서, ASO는 넌센스 매개 RNA 붕괴 엑손(NSE)을 포함하는 PKD2 유전자로부터 전사된 PKD2 NSE 프리-mRNA를 표적으로 한다. 일부 구현예에서, NSE는 PKD2 프리-mRNA 전사체의 정규 인트론 3의 일부(PKD2 프리-mRNA 전사체의 정규 엑손 3의 다운스트림 인트론)를 포함한다. 일부 구현예에서, NSE는 PKD2 프리-mRNA 전사체의 전체 정규 엑손 3을 포함한다. 일부 구현예에서, NSE는 PKD2 프리-mRNA 전사체의 정규 인트론 3의 일부와 PKD2 프리-mRNA 전사체의 전체 정규 엑손 3만을 포함한다. 일부 구현예에서, NSE는 비정상적인 스플라이싱으로 인해 PKD2 프리-mRNA 전사체에 포함된다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NSE 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 엑손 3 또는 4 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 엑손 3 다음 인트론 3의 5' 스플라이스 부위로부터 업스트림(또는 5')의 엑손 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 엑손 3 앞에 있는 인트론 2의 3' 스플라이스 부위로부터 다운스트림 (또는 3')의 엑손 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NSE의 3' 말단에 측접하는 인트론 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4의 3' 스플라이스 부위로부터 업스트림 (또는 5')의 인트론 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4의 5' 스플라이스 부위로부터 다운스트림 (또는 3')의 인트론 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NSE의 5' 말단에 측접하는 인트론 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4의 3' 스플라이스 부위로부터 업스트림 (또는 5')의 인트론 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4의 5' 스플라이스 부위로부터 다운스트림 (또는 3')의 인트론 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 엑손-인트론 경계를 포함하는 서열을 표적으로 한다. 일부 구현예에서, 엑손은 NSE이다. 엑손-인트론 경계는 엑손 서열과 인트론 서열의 접합부를 지칭할 수 있다. 일부 구현예에서, 인트론 서열은 NSE의 5' 말단 또는 엑손의 3' 말단에 측접할 수 있다. 일부 구현예에서, ASO는 인트론의 일부와 엑손의 일부를 모두 포함하는 서열을 표적으로 한다.
일부 구현예에서, 본원에 개시된 방법 또는 조성물을 사용하여 치료 또는 개선될 수 있는 질환 또는 병태는 치료제가 표적으로 하는 표적 단백질(유전자)과 직접적으로 연관되지 않는다. 일부 구현예에서, 본원에서 제공되는 치료제는 질환 또는 병태와 직접적으로 연관되지 않은 단백질(유전자)을 표적으로 할 수 있지만, 표적 단백질(유전자)의 발현 조절은 질환 또는 병태를 치료 또는 개선할 수 있다. 예를 들어, 본원에서 제공되는 치료제에 의한 PKD2와 같은 유전자의 표적화는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 또는 두개내 동맥류을 치료 또는 개선할 수 있다. 일부 구현예에서, PKD2와 같은 이러한 표적 유전자는 경로(신장)에 대해 지시된다고 한다. 일부 구현예에서, PKD2와 같은 이러한 표적 유전자는 경로(다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 또는 상염색체 우성 다낭성 신장 질환)에 대해 지시된다고 한다. 일부 구현예에서, PKD2와 같은 이러한 표적 유전자는 경로(두개내 동맥류)에 대해 지시된다고 한다.
다양한 구현예에서, 본 개시내용은 스플라이싱 또는 단백질 발현 수준을 조절하기 위해 PKD2 프리-mRNA 전사체를 표적화할 수 있는 치료제를 제공한다. 치료제는 소분자, 폴리뉴클레오티드 또는 폴리펩티드일 수 있다. 일부 구현예에서, 치료제는 ASO이다. PKD2 프리-mRNA에 대한 다양한 영역 또는 서열은 ASO와 같은 치료제에 의해 표적화될 수 있다. 일부 구현예에서, ASO는 NIE를 함유하는 PKD2 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NIE 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NIE의 5' 말단으로부터 업스트림(또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NIE의 3' 말단으로부터 다운스트림(또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NIE의 5' 말단에 측접하는 인트론 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NIE의 3' 말단에 측접하는 인트론 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NIE-인트론 경계를 포함하는 서열을 표적으로 한다. NIE-인트론 경계는 인트론 서열과 NIE 영역의 접합부를 의미할 수 있다. 인트론 서열은 NIE의 5' 말단 또는 NIE의 3' 말단에 측접할 수 있다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 엑손 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론의 일부와 엑손의 일부를 모두 포함하는 서열을 표적으로 한다.
일부 구현예에서, ASO는 NIE의 5' 말단으로부터 업스트림(또는 5')에 있는 약 4 내지 약 300개의 뉴클레오티드의 서열을 표적으로 한다. 일부 구현예에서, ASO는 NIE 영역의 5' 말단으로부터 업스트림(또는 5')에 있는 약 1 내지 약 20개의 뉴클레오티드, 약 20 내지 약 50개의 뉴클레오티드, 약 50 내지 약 100개의 뉴클레오티드, 약 100 내지 약 150개의 뉴클레오티드, 약 150 내지 약 200개의 뉴클레오티드, 약 200 내지 약 250개의 뉴클레오티드, 또는 약 250 내지 약 300개의 뉴클레오티드의 서열을 표적으로 한다. 일부 구현예에서, ASO는 NIE의 5' 말단으로부터 업스트림에 있는 300개 초과의 뉴클레오티드의 서열을 표적으로 할 수 있다. 일부 구현예에서, ASO는 NIE의 3' 말단으로부터 다운스트림(또는 3')에 있는 약 4 내지 약 300개의 뉴클레오티드의 서열을 표적으로 한다. 일부 구현예에서, ASO는 NIE의 3' 말단으로부터 다운스트림에 있는 약 1 내지 약 20개의 뉴클레오티드, 약 20 내지 약 50개의 뉴클레오티드, 약 50 내지 약 100개의 뉴클레오티드, 약 100 내지 약 150개의 뉴클레오티드, 약 150 내지 약 200개의 뉴클레오티드, 약 200 내지 약 250개의 뉴클레오티드, 또는 약 250 내지 약 300개의 뉴클레오티드의 서열을 표적으로 한다. 일부 구현예에서, ASO는 NIE의 3' 말단으로부터 다운스트림에 있는 300개 초과의 뉴클레오티드의 서열을 표적으로 한다.
일부 구현예에서, 본원에 개시된 ASO는 PKD2 게놈 서열로부터 전사된 NSE 프리-mRNA를 표적으로 한다. 일부 구현예에서, ASO는 PKD2 게놈 서열의 NSE를 포함하는 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 PKD2 게놈 서열의 NSE의 3' 말단에 측접하는 인트론 및 NSE의 5' 말단에 측접하는 인트론을 포함하는 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 표 3의 프리-mRNA 전사체로 이루어진 군으로부터 선택된 서열을 포함하는 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 서열의 NSE를 포함하는 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 서열의 NSE의 3' 말단에 측접하는 인트론을 포함하는 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 서열의 NSE의 5' 말단에 측접하는 인트론을 포함하는 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, 전사체는 표 3의 전사체로 이루어진 군으로부터 선택된다.
일부 구현예에서, PKD2 NIE 함유 프리-mRNA 전사체는 표 2 또는 표 3에 열거된 서열 중 어느 하나와 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩된다. 일부 구현예에서, PKD2 NIE 프리-mRNA 전사체는 표 2 또는 표 3에 열거된 서열 중 어느 하나와 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, PKD2 NIE 함유 프리-mRNA 전사체는 표 2 또는 표 3에 열거된 서열 중 어느 하나와 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, PKD2 NIE 함유 프리-mRNA 전사체는 표 2 또는 표 3에 열거된 서열 중 어느 하나와 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열에 의해 인코딩된다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 표 2 또는 표 3에 열거된 서열 중 어느 하나의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 프리-mRNA 전사체는 본원에 기재된 PKD2 프리-mRNA 전사체의 프리-mRNA 전사체 또는 이의 보체에 대해 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, PKD2 프리-mRNA로 이루어진 군으로부터 선택된 프리-mRNA의 표적화 부분은 표 2 또는 표 3의 프리-mRNA 전사체 또는 이의 보체의 서열의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, PKD2 프리-mRNA의 프리-mRNA의 표적화 부분은 표 2 또는 표 3의 서열의 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 연속 핵산 또는 이의 보체에 상보적인 서열을 포함한다.
일부 구현예에서, 본원에 개시된 ASO는 PKD2 게놈 서열로부터 전사된 NSE 프리-mRNA를 표적으로 한다. 일부 구현예에서, ASO는 NSE를 포함하는 PKD2 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서 NSE는 엑손 3을 포함한다. 일부 구현예에서 NSE는 PKD2 전사체의 제3 엑손이다. 일부 구현예에서, ASO는 엑손 3 또는 4를 포함하는 PKD2 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 NSE의 3' 말단에 측접하는 인트론 및 NSE의 5' 말단에 측접하는 인트론을 포함하는 PKD2 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, NSE의 3' 말단에 측접하는 인트론은 인트론 3이고 NSE의 5' 말단에 측접하는 인트론은 인트론 2이다. 일부 구현예에서, ASO는 인트론 2, 엑손 3 및 인트론 3을 포함하는 PKD2 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 엑손 3 및 엑손 4를 포함하는 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 NSE를 포함하는 PKD2 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 엑손 3을 포함하는 PKD2 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 NSE의 3' 말단에 측접하는 인트론을 포함하는 PKD2 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3을 포함하는 PKD2 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 NSE의 5' 말단에 측접하는 인트론을 포함하는 PKD2 프리-mRNA 서열을 표적으로 한다.
일부 구현예에서, PKD2 프리-mRNA 전사체는 Ensembl 참조 번호 ENSG00000118762.8 또는 이의 보체에 대해 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩된다. 일부 구현예에서, PKD2 프리-mRNA 전사체는 본원에 기재된 PKD2 프리-mRNA 전사체 또는 이의 보체에 대해 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 표 3의 서열 또는 이의 보체의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 표 2 또는 표 3에 열거된 서열 또는 이의 보체로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, ASO는 표 4의 서열 또는 이의 보체 중 어느 하나와 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 동일한 서열을 포함한다.
일부 구현예에서, 본원에 개시된 ASO는 표적 게놈 서열로부터 전사된 NSE 프리-mRNA를 표적으로 한다. 일부 구현예에서, ASO는 NSE를 포함하는 표적 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 NSE의 3' 말단에 측접하는 인트론 및 NSE의 5' 말단에 측접하는 인트론을 포함하는 표적 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 표 3의 프리-mRNA 전사체 서열로부터 선택된 서열을 포함하는 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 Ensembl 참조 번호로 제시되는 표 3의 프리-mRNA 전사체 서열로부터 선택된 서열을 포함하는 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 NSE를 포함하는 표적 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 NSE의 3' 말단에 측접하는 인트론을 포함하는 표적 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 NSE의 5' 말단에 측접하는 인트론을 포함하는 표적 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, 전사체는 표 3의 전사체 서열로 이루어진 군으로부터 선택된다. 일부 구현예에서, 전사체는 Ensembl 참조 번호에 의해 제시된 바와 같이 표 3의 전사체 서열로 이루어진 군으로부터 선택된다.
일부 구현예에서, 표적 프리-mRNA 전사체는 Ensembl 참조 번호에 의해 제시된 바와 같은 유전자 서열 또는 이의 보체에 대해 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩된다. 일부 구현예에서, 표적 프리-mRNA 전사체는 본원에 기재된 표적 프리-mRNA 전사체 또는 이의 보체에 대해 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 표적 프리-mRNA의 표적화 부분은 표 2의 서열 또는 표 3의 서열 또는 이의 보체의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 표적 프리-mRNA의 표적화 부분은 Ensembl 참조 번호에 의해 제시된 바와 같은 표 3의 서열 또는 표 2의 서열 또는 이의 보체의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 표적 프리-mRNA의 표적화 부분은 표 2 또는 표 3의 서열의 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 연속 핵산 또는 이의 보체에 상보적인 서열을 포함한다.
일부 구현예에서, ASO는 NSE를 포함하는 PKD2 프리-mRNA의 엑손 3을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3의 5' 스플라이스 부위로부터 약 2개의 뉴클레오티드 다운스트림(또는 3') 내지 인트론 2의 3' 스플라이스 부위로부터 약 4개의 뉴클레오티드 업스트림(또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3의 5' 스플라이스 부위로부터 약 2개의 뉴클레오티드 업스트림(또는 5') 내지 인트론 2의 3' 스플라이스 부위로부터 약 4개의 뉴클레오티드 다운스트림(또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 표 4에 열거된 서열 중 어느 하나 또는 이의 보체에 따른 서열을 갖는다.
일부 구현예에서, ASO는 NSE를 포함하는 PKD2 프리-mRNA의 인트론 3을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3의 3' 스플라이스 부위로부터 약 4 내지 약 300개의 뉴클레오티드 업스트림(또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3의 3' 스플라이스 부위로부터 약 4 내지 약 300개의 뉴클레오티드 다운스트림(또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3의 5' 스플라이스 부위로부터 약 4 내지 약 300개의 뉴클레오티드 업스트림(또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3의 5' 스플라이스 부위로부터 약 4 내지 약 300개의 뉴클레오티드 다운스트림(또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 2의 3' 스플라이스 부위로부터 약 6 내지 약 100개의 뉴클레오티드 업스트림(또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 2의 3' 스플라이스 부위로부터 약 4 내지 약 300개의 뉴클레오티드 다운스트림(또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 2의 5' 스플라이스 부위로부터 약 6 내지 약 100개의 뉴클레오티드 업스트림(또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 2의 5' 스플라이스 부위로부터 약 4 내지 약 300개의 뉴클레오티드 다운스트림(또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 표 4의 임의의 서열 또는 이의 보체에 따른 서열을 갖는다.
일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 인트론 2, 3 또는 4에 있다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 엑손 2, 3, 4 또는 5에 있다. 일부 구현예에서, NSE 프리-mRNA의 표적화 부분에 대한 ASO의 혼성화는 정규 엑손 3의 포함을 초래하고, 이어서 폴리시스틴 2 생산을 증가시킨다. 일부 구현예에서, NSE 프리-mRNA의 표적화 부분에 대한 ASO의 혼성화는 정규 엑손의 배제를 초래하고, 이어서 폴리시스틴 2 생산을 감소시킨다. 일부 구현예에서, NSE 프리-mRNA의 표적화 부분에 대한 ASO의 혼성화는 정규 엑손의 포함 또는 배제를 초래하고, 이어서 폴리시스틴 2 생산을 조절한다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 엑손 3 또는 4에 있다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 인트론 2에 있다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 인트론 3에 있다.
일부 구현예에서, ASO는 NIE 엑손 2를 포함하는 PKD2 NIE 함유 프리-mRNA의 엑손 2x를 표적으로 한다.
일부 구현예에서, ASO는 PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140)을 표적으로 한다.
일부 구현예에서, ASO는 PKD2의 엑손 2x의 5' 말단으로부터 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 업스트림 (또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2의 GRCh38/ hg38: chr4:88031085 88031140으로부터 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 업스트림 (또는 5')의 서열을 표적으로 한다.
일부 구현예에서, ASO는 PKD2의 엑손 2x의 5' 말단으로부터 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 업스트림 (또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2의 GRCh38/ hg38: chr4:88031085 88031140으로부터 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 업스트림 (또는 5')의 서열을 표적으로 한다.
일부 구현예에서, ASO는 PKD2의 엑손 2x의 3' 말단으로부터 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 다운스트림 (또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2의 GRCh38/ hg38: chr4:88031085 88031140으로부터 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 다운스트림 (또는 3')의 서열을 표적으로 한다.
일부 구현예에서, ASO는 PKD2의 엑손 2x의 3' 말단으로부터 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 다운스트림 (또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2의 GRCh38/ hg38: chr4:88031085 88031140으로부터 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 다운스트림 (또는 3')의 서열을 표적으로 한다.
일부 구현예에서, ASO는 표 2 또는 표 3에 열거된 서열 중 임의의 하나에 따른 프리-mRNA의 표적화 부분에 상보적인 서열을 갖는다.
일부 구현예에서, ASO는 NIE의 5' 말단으로부터 업스트림의 서열을 표적으로 한다. 예를 들어, NIE(예를 들어, PKD2의 엑손 2x)의 5' 말단으로부터 업스트림의 서열을 표적으로 하는 ASO는 표 2 또는 표 3에 열거된 서열 중 어느 하나의 적어도 8개의 연속 핵산에 대해 적어도 약 80%, 85%, 90%, 95%, 97%, 또는 100% 상보적인 서열을 포함한다. 예를 들어, NIE(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 5' 말단으로부터 업스트림의 서열을 표적으로 하는 ASO는 표 2 또는 표 3에 열거된 서열 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함할 수 있다.
일부 구현예에서, ASO는 엑손-인트론 경계(또는 접합부)를 함유하는 서열을 표적으로 한다. 예를 들어, 엑손-인트론 경계를 함유하는 서열을 표적으로 하는 ASO는 표 2 또는 표 3에 열거된 서열 중 어느 하나의 적어도 8개의 연속 핵산에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 상보적인 서열을 포함할 수 있다. 일부 구현예에서, ASO는 NIE의 3' 말단으로부터 다운스트림의 서열을 표적으로 한다. 예를 들어, NIE(예를 들어, PKD2의 엑손 2x)의 3' 말단으로부터 다운스트림의 서열을 표적으로 하는 ASO는 표 2 또는 표 3에 열거된 서열 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함할 수 있다. 예를 들어, NIE(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 3' 말단으로부터 다운스트림의 서열을 표적으로 하는 ASO는 표 2 또는 표 3에 열거된 서열 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함할 수 있다. 일부 구현예에서, ASO는 NIE 내의 서열을 표적으로 한다.
일부 구현예에서, ASO는 NIE 엑손 2를 포함하는 PKD2 NIE 함유 프리-mRNA의 엑손 2x를 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA의 엑손 2x의 5' 말단으로부터 다운스트림 (또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA의 엑손 2x의 3' 말단으로부터 업스트림(또는 5')의 엑손 2x 서열을 표적으로 한다.
일부 구현예에서, PKD2 NIE 함유 프리-mRNA의 표적화 부분은 인트론 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50에 있다. 일부 구현예에서, NIE 프리-mRNA의 표적화 부분에 대한 ASO의 혼성화는 인트론 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50 내의 NIE 중 적어도 하나의 엑손 스킵핑을 초래하고, 그리고 이후에 폴리시스틴 2 생산을 증가시킨다. 일부 구현예에서, PKD2 NIE 함유 프리-mRNA의 표적화 부분은 PKD2의 인트론 2에 있다. 일부 구현예에서, PKD2 NIE 함유 프리-mRNA의 표적화 부분은 PKD2의 인트론(GRCh38/ hg38:chr4 88019572 88036219)에 있다.
일부 구현예에서, 본 개시내용의 방법 및 조성물은 PKD2 NIE 함유 프리-mRNA의 NIE의 엑손 스킵핑을 유도함으로써 PKD2의 발현을 증가시키는데 사용된다. 일부 구현예에서, NIE는 인트론 1-50 중 임의의 것 내의 서열이다. 일부 구현예에서, NIE는 인트론 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50 중 임의의 것 내의 서열이다. 일부 구현예에서, NIE는 임의의 PKD2 인트론 또는 이의 일부일 수 있다. 일부 구현예에서, NIE는 PKD2의 인트론 2 내에 있다. 일부 구현예에서, NIE는 PKD2의 인트론(GRCh38/ hg38:chr4 88019572 88036219) 내에 있다.
단백질 발현
일부 구현예에서, 돌연변이는 2개의 대립유전자 모두에서 발생한다. 일부 구현예에서, 돌연변이는 2개의 대립유전자 중 하나에서 발생한다. 일부 구현예에서, 추가 돌연변이는 2개의 대립유전자 중 하나에서 발생한다. 일부 구현예에서, 추가 돌연변이는 제1 돌연변이와 동일한 대립유전자에서 발생한다. 다른 구현예에서, 발생하는 추가적인 돌연변이는 트랜스 돌연변이이다.
일부 구현예에서, 본원에 기재된 방법은 기능성 폴리시스틴 2 단백질 또는 RNA의 생산을 증가시키기 위해 사용된다. 본원에서 사용되는 바와 같이, 용어 "기능적"은 치료된 병태 또는 질환, 예를 들어 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 및 두개내 동맥류의 임의의 하나 이상의 증상을 제거하는데 필요한 폴리시스틴 2 단백질 또는 RNA의 활성 또는 기능의 양을 지칭한다. 일부 구현예에서, 방법은 부분적으로 기능적인 폴리시스틴 2 단백질 또는 RNA의 생산을 증가시키기 위해 사용된다. 본원에서 사용되는 바와 같이, "부분적으로 기능적인"이라는 용어는 질환 또는 병태의 임의의 하나 이상의 증상을 제거하거나 예방하는 데 필요한 활성 또는 기능의 양보다 적은 폴리시스틴 2 단백질 또는 RNA의 활성 또는 기능의 양을 지칭한다. 일부 구현예에서, 부분적으로 기능적인 단백질 또는 RNA는 완전 기능성 단백질 또는 RNA에 비해 활성이 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 적을 것이다.
일부 구현예에서, 방법은 폴리시스틴 2를 인코딩하는 NIE 함유 프리-mRNA를 갖는 대상체의 세포에 의한 폴리시스틴 2의 발현을 증가시키는 방법이며, 여기서 대상체는 폴리시스틴 2의 결핍된 양에 의해 야기되는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 또는 두개내 동맥류을 가지고 있고, 여기서 폴리시스틴 2의 결핍된 양은 폴리시스틴 2의 반가불충분성에 의해 야기된다. 이러한 구현예에서, 대상체는 기능성 폴리시스틴 2를 인코딩하는 제1 대립유전자 및 폴리시스틴 2가 생산되지 않는 제2 대립유전자를 갖는다. 또 다른 이러한 구현예에서, 대상체는 기능성 폴리시스틴 2를 인코딩하는 제1 대립유전자 및 비기능성 폴리시스틴 2를 인코딩하는 제2 대립유전자을 갖는다. 또 다른 이러한 구현예에서, 대상체는 기능성 폴리시스틴 2를 인코딩하는 제1 대립유전자 및 부분적 기능성 폴리시스틴 2를 인코딩하는 제2 대립유전자을 갖는다. 임의의 이들 구현예에서, 안티센스 올리고머는 제2 대립유전자로부터 전사된 NIE 함유 프리-mRNA의 표적화 부분에 결합하여, 프리-mRNA로부터 NIE의 엑손 스킵핑을 유도하고 기능성 폴리시스틴 2를 인코딩하는 성숙 mRNA 수준의 증가를 유발하고 대상체의 세포에서 폴리시스틴 2의 발현을 증가시킨다.
일부 구현예에서, 방법은 표적 단백질을 인코딩하는 NSE 프리-mRNA를 갖는 대상체의 세포에 의한 표적 단백질의 발현을 감소시키는 방법이며, 여기서 대상체는 표적 단백질의 과잉량의 활성에 의해 발생하는 질환을 갖고 있고, 표적 단백질의 과잉량의 발현은 돌연변이에 의해 발생하고, 표적은 PKD2로 이루어진 군에서 선택되는 어느 하나이다. 일부 구현예에서, 안티센스 올리고머는 돌연변이를 수반하는 대립유전자로부터 전사된 NSE 프리-mRNA의 표적화 부분에 결합하여, 프리-mRNA로의 NSE의 교대 스플라이싱을 증가시키고, 기능성 표적 단백질을 인코딩하는 성숙 mRNA 수준의 감소 및 대상체의 세포 내 표적 단백질의 발현 감소를 유발한다. 관련 구현예에서, 방법은 기능성 단백질 또는 기능성 RNA의 발현을 감소시키기 위해 ASO를 사용하는 방법이다. 일부 구현예에서, ASO는 표적 단백질을 인코딩하는 NSE 프리-mRNA를 갖는 대상체의 세포에서 표적 단백질의 발현을 감소시키기 위해 사용되며, 여기서 대상체는 표적 단백질의 양 또는 기능이 과량이다.
일부 구현예에서, 방법은 표적 단백질을 인코딩하는 NSE 프리-mRNA를 갖는 대상체의 세포에 의한 표적 단백질의 발현을 조절하는 방법이며, 여기서 대상체는 표적 단백질의 결핍 또는 과잉 양의 활성에 의해 발생하는 질환을 갖고 있고, 표적 단백질의 결핍 또는 과잉 양의 발현은 돌연변이에 의해 발생하고, 표적은 PKD2로 이루어진 군에서 선택되는 어느 하나이다. 일부 구현예에서, 안티센스 올리고머는 돌연변이를 수반하는 대립유전자로부터 전사된 NSE 프리-mRNA의 표적화 부분에 결합하여, 프리-mRNA로의 NSE의 교대 스플라이싱을 조절하고, 기능성 표적 단백질을 인코딩하는 성숙 mRNA 수준의 조절 및 대상체의 세포 내 표적 단백질의 발현 조절을 유발한다. 관련 구현예에서, 방법은 기능성 단백질 또는 기능성 RNA의 발현을 조절하기 위해 ASO를 사용하는 방법이다. 일부 구현예에서, ASO는 표적 단백질을 인코딩하는 NSE 프리-mRNA를 갖는 대상체의 세포에서 표적 단백질의 발현을 조절하기 위해 사용되며, 여기서 대상체는 표적 단백질의 양 또는 기능이 비정상적인 양이다.
일부 구현예에서, 방법은 폴리시스틴 2를 인코딩하는 NIE 함유 프리-mRNA를 갖는 대상체의 세포에 의한 폴리시스틴 2의 발현을 증가시키는 방법이며, 여기서 대상체는 폴리시스틴 2의 결핍된 양에 의해 야기되는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 또는 두개내 동맥류을 가지고 있고, 여기서 폴리시스틴 2의 결핍된 양은 상염색체 열성 유전에 의해 야기된다.
일부 구현예에서, 방법은 폴리시스틴 2를 인코딩하는 NIE 함유 프리-mRNA를 갖는 대상체의 세포에 의한 폴리시스틴 2의 발현을 증가시키는 방법이며, 여기서 대상체는 폴리시스틴 2의 결핍된 양에 의해 야기되는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 또는 두개내 동맥류을 가지고 있고, 여기서 폴리시스틴 2의 결핍된 양은 상염색체 우성 유전에 의해 야기된다.
일부 구현예에서, 방법은 폴리시스틴 2를 인코딩하는 NIE 함유 프리-mRNA를 갖는 대상체의 세포에 의한 폴리시스틴 2의 발현을 증가시키는 방법이며, 여기서 대상체는 폴리시스틴 2의 결핍된 양에 의해 야기되는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 또는 두개내 동맥류을 가지고 있고, 여기서 폴리시스틴 2의 결핍된 양은 X 연관 우성 유전에 의해 야기된다.
관련 구현예에서, 방법은 단백질 또는 기능성 RNA의 발현을 증가시키기 위해 ASO를 사용하는 방법이다. 일부 구현예에서, ASO는 폴리시스틴 2를 인코딩하는 NIE 함유 프리-mRNA를 갖는 대상체의 세포에서 폴리시스틴 2의 발현을 증가시키기 위해 사용될 수 있으며, 여기서 대상체는 폴리시스틴 2의 양 또는 기능에서 결핍, 예를 들어, 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 또는 두개내 동맥류을 갖는다.
일부 구현예에서, 질환 또는 병태의 원인이 되는 단백질을 인코딩하는 NIE 함유 프리-mRNA 전사체는 본원에 기재된 ASO에 의해 표적화된다. 일부 구현예에서, 질환의 원인이 아닌 단백질을 인코딩하는 NIE 함유 프리-mRNA 전사체는 ASO에 의해 표적화된다. 예를 들어, 특정 경로에서 제1 단백질의 돌연변이 또는 결핍의 결과인 질환은 제2 단백질을 인코딩하는 NIE 함유 프리-mRNA를 표적으로 하여 제2 단백질의 생산을 증가시킴으로써 개선될 수 있다. 일부 구현예에서, 제2 단백질의 기능은 제1 단백질의 돌연변이 또는 결핍(질환 또는 병태의 원인임)을 보상할 수 있다. 일부 구현예에서, 대상체는 (a) 야생형인 제1 대립유전자, 및 (b) (i) 폴리시스틴 2가 야생형 대립유전자로부터의 생산에 비해 감소된 수준으로 생산되고, (ii) 폴리시스틴 2가 동등한 야생형 단백질에 비해 기능이 감소된 형태로 생산되거나, 또는 (iii) 폴리시스틴 2 또는 기능성 RNA가 생산되지 않는 돌연변이 대립유전자인 제2 대립유전자를 갖는다.
일부 구현예에서, 대상체는 하기를 갖는다:
(a) 하기인 제1 돌연변이 대립유전자
(i) 폴리시스틴 2는 야생형 대립유전자로부터의 생산에 비해 감소된 수준으로 생산되며,
(ii) 폴리시스틴 2는 동등한 야생형 단백질에 비해 기능이 감소된 형태로 생산되거나,
(iii) 폴리시스틴 2 또는 기능성 RNA가 생산되지 않음; 그리고
(b) 하기인 제2 돌연변이 대립유전자
(i) 폴리시스틴 2는 야생형 대립유전자로부터의 생산에 비해 감소된 수준으로 생산되며,
(ii) 폴리시스틴 2는 동등한 야생형 단백질에 비해 기능이 감소된 형태로 생산되거나,
(iii) 폴리시스틴 2는 생산되지 않음
NIE 함유 프리-mRNA는 제1 대립유전자 및/또는 제2 대립유전자로부터 전사되고, 대상체가 제1 돌연변이 대립유전자 (a)(iii)를 가질 때 제2 돌연변이 대립유전자는 (b)(iii)가 아니며, 대상체가 제2 돌연변이 대립유전자 (b)(iii)를 가질 때 제1 돌연변이 대립유전자는 (a)(iii)가 아니다. 이들 구현예에서, ASO는 제1 대립유전자 또는 제2 대립유전자로부터 전사된 NIE 함유 프리-mRNA의 표적화 부분에 결합하여, NIE 함유 프리-mRNA로부터 NIE의 엑손 스킵핑을 유도하고 대상체의 세포에서 폴리시스틴 2를 인코딩하는 mRNA의 수준 증가 및 표적 단백질 또는 기능성 RNA의 발현 증가를 유발한다. 이들 구현예에서, NIE 함유 프리-mRNA로부터 NIE의 엑손 스킵핑(exon skipping)으로 인해 발현 수준이 증가된 표적 단백질 또는 기능성 RNA는 동등한 야생형 단백질에 비해 기능(부분적 기능성)이 감소된 형태, 또는 동등한 야생형 단백질과 비교하여 전체 기능(완전한 기능)을 갖는 형태일 수 있다.
일부 구현예에서, 폴리시스틴 2를 인코딩하는 mRNA의 수준은 대조군 세포, 예를 들어 안티센스 올리고머로 처리되지 않은 것 또는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 결합하지 않는 안티센스 올리고머로 처리된 것에서 생산되는 폴리시스틴 2를 인코딩하는 mRNA의 양과 비교할 때 1.1 내지 10배 증가된다.
일부 구현예에서, 본 개시내용의 방법을 사용하여 치료된 대상체는 하나의 대립유전자로부터 부분적 기능성 폴리시스틴 2를 발현하며, 여기서 부분적 기능성 폴리시스틴 2는 틀이동 돌연변이, 넌센스 돌연변이, 미스센스 돌연변이 또는 부분 유전자 결실에 의해 야기될 수 있다. 일부 구현예에서, 본 개시내용의 방법을 사용하여 치료된 대상체는 하나의 대립유전자로부터 비기능성 폴리시스틴 2를 발현하며, 여기서 비기능성 폴리시스틴 2는 하나의 대립유전자에서 틀이동 돌연변이, 넌센스 돌연변이, 미스센스 돌연변이, 부분 유전자 결실에 의해 야기될 수 있다. 일부 구현예에서, 본 개시내용의 방법을 사용하여 치료된 대상체는 하나의 대립유전자에서 PKD2 전체 유전자 결실을 갖는다.
엑손 포함
일부 구현예에서, 포함된 NIE는 세포에서 표적 단백질을 인코딩하는 유전자로부터 전사된 NIE 함유 프리-mRNA의 집단에서 가장 풍부한 NIE이다. 일부 구현예에서, 포함된 NIE는 세포에서 표적 단백질을 인코딩하는 유전자로부터 전사된 NIE 함유 프리-mRNA의 집단에서 가장 풍부한 NIE이고, NIE 함유 프리-mRNA의 집단은 2개 이상의 포함된 NIE를 함유한다. 일부 구현예에서, 표적 단백질을 인코딩하는 NIE 함유 프리-mRNA의 집단에서 가장 풍부한 NIE를 표적으로 하는 안티센스 올리고머는 안티센스 올리고머가 표적이 되거나 결합되는 NIE를 포함하여 집단에서 하나 또는 둘 이상의 NIE의 엑손 스킵핑을 유도한다. 일부 구현예에서, 표적화된 영역은 폴리시스틴 2를 인코딩하는 NIE 함유 프리-mRNA에서 가장 풍부한 NIE인 NIE에 있다.
엑손 포함 정도는 엑손 포함 백분율, 예를 들어 주어진 NIE가 포함된 전사체의 백분율로 표현될 수 있다. 요컨대, 엑손 포함 백분율은 엑손 포함 RNA 전사체 양의 평균과 엑손 제외 RNA 전사체 양의 평균의 합에 대한 엑손 포함 RNA 전사체 양의 백분율로 계산할 수 있다.
NSE는 추가 염기 쌍의 스플라이싱의 결과로 생성될 수 있다.
대체 스플라이싱의 정도는 대체 스플라이싱의 백분율, 예를 들어 주어진 NSE가 포함된 전사체의 백분율-나이로 표현될 수 있다. 요약하면 퍼센트 대체 스플라이싱은 NSE가 있는 RNA 전사체 양의 평균과 정규 엑손만 있는 RNA 전사체 양의 평균의 합에 대해 NSE가 있는 RNA 전사체의 양의 퍼센트로 계산할 수 있다.
일부 구현예에서, 포함된 NIE는 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50% 포함의 결정에 기초한 포함된 NIE로 확인되는 엑손이다. 구현예에서, 포함된 NIE는 약 5% 내지 약 100%, 약 5% 내지 약 95%, 약 5% 내지 약 90%, 약 5% 내지 약 85%, 약 5% 내지 약 80%, 약 5% 내지 약 75%, 약 5% 내지 약 70%, 약 5% 내지 약 65%, 약 5% 내지 약 60%, 약 5% 내지 약 55%, 약 5% 내지 약 50%, 약 5% 내지 약 45%, 약 5% 내지 약 40%, 약 5% 내지 약 35%, 약 5% 내지 약 30%, 약 5% 내지 약 25%, 약 5% 내지 약 20%, 약 5% 내지 약 15%, 약 10% 내지 약 100%, 약 10% 내지 약 95%, 약 10% 내지 약 90%, 약 10% 내지 약 85%, 약 10% 내지 약 80%, 약 10% 내지 약 75%, 약 10% 내지 약 70%, 약 10% 내지 약 65%, 약 10% 내지 약 60%, 약 10% 내지 약 55%, 약 10% 내지 약 50%, 약 10% 내지 약 45%, 약 10% 내지 약 40%, 약 10% 내지 약 35%, 약 10% 내지 약 30%, 약 10% 내지 약 25%, 약 10% 내지 약 20%, 약 15% 내지 약 100%, 약 15% 내지 약 95%, 약 15% 내지 약 90%, 약 15% 내지 약 85%, 약 15% 내지 약 80%, 약 15% 내지 약 75%, 약 15% 내지 약 70%, 약 15% 내지 약 65%, 약 15% 내지 약 60%, 약 15% 내지 약 55%, 약 15% 내지 약 50%, 약 15% 내지 약 45%, 약 15% 내지 약 40%, 약 15% 내지 약 35%, 약 15% 내지 약 30%, 약 15% 내지 약 25%, 약 20% 내지 약 100%, 약 20% 내지 약 95%, 약 20% 내지 약 90%, 약 20% 내지 약 85%, 약 20% 내지 약 80%, 약 20% 내지 약 75%, 약 20% 내지 약 70%, 약 20% 내지 약 65%, 약 20% 내지 약 60%, 약 20% 내지 약 55%, 약 20% 내지 약 50%, 약 20% 내지 약 45%, 약 20% 내지 약 40%, 약 20% 내지 약 35%, 약 20% 내지 약 30%, 약 25% 내지 약 100%, 약 25% 내지 약 95%, 약 25% 내지 약 90%, 약 25% 내지 약 85%, 약 25% 내지 약 80%, 약 25% 내지 약 75%, 약 25% 내지 약 70%, 약 25% 내지 약 65%, 약 25% 내지 약 60%, 약 25% 내지 약 55%, 약 25% 내지 약 50%, 약 25% 내지 약 45%, 약 25% 내지 약 40%, 또는 약 25% 내지 약 35% 포함의 결정에 기초한 포함된 NIE로 확인되는 엑손이다. ENCODE 데이터(예를 들어, 문헌[Tilgner, 등, 2012, "Deep sequencing of subcellular RNA fractions shows splicing to be predominantly co-transcriptional in the human genome but inefficient for lncRNAs," Genome Research 22(9):1616-25]에 기재됨)는 엑손 포함을 확인하는 데 도움을 주기 위해 사용할 수 있다.
일부 구현예에서, 세포를 PKD2 프리-mRNA 전사체의 표적화 부분에 상보적인 ASO와 접촉시키는 것은 ASO 부재/처리 부재 시 세포에 의해 생성된 단백질의 양과 비교하여 적어도 10, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350, 400, 450, 500, 또는 1000%까지 생성된 폴리시스틴 2의 양을 증가시킨다. 일부 구현예에서, 안티센스 올리고머는 접촉되는 세포에 의해 생산된 폴리시스틴 2의 총량은 대조군 화합물에 의해 생성된 표적 단백질의 양과 비교하여 약 20% 내지 약 300%, 약 50% 내지 약 300%, 약 100% 내지 약 300%, 약 150% 내지 약 300%, 약 20% 내지 약 50%, 약 20% 내지 약 100%, 약 20% 내지 약 150%, 약 20% 내지 약 200%, 약 20% 내지 약 250%, 약 50% 내지 약 100%, 약 50% 내지 약 150%, 약 50% 내지 약 200%, 약 50% 내지 약 250%, 약 100% 내지 약 150%, 약 100% 내지 약 200%, 약 100% 내지 약 250%, 약 150% 내지 약 200%, 약 150% 내지 약 250%, 약 200% 내지 약 250%, 적어도 약 10%, 적어도 약 20%, 적어도 약 50%, 적어도 약 100%, 적어도 약 150%, 적어도 약 200%, 적어도 약 250%, 또는 적어도 약 300% 증가된다. 일부 구현예에서, 안티센스 올리고머는 접촉되는 세포에 의해 생성된 폴리시스틴 2의 총량은 대조군 화합물에 의해 생성된 표적 단백질의 양과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다. 대조군 화합물은 예를 들어 프리-mRNA의 표적화 부분에 상보적이지 않은 올리고뉴클레오티드일 수 있다.
일부 구현예에서, 세포를 PKD2 프리-mRNA 전사체의 표적화 부분에 상보적인 ASO와 접촉시키는 것은 표적 단백질을 인코딩하는 성숙 mRNA를 포함하여 PKD2를 인코딩하는 mRNA의 양을 증가시킨다. 일부 구현예에서, 폴리시스틴 2를 인코딩하는 mRNA, 또는 폴리시스틴 2를 인코딩하는 성숙 mRNA의 양은 ASO 부재/처리 부재 시 세포에 의해 생성된 단백질의 양과 비교하여 적어도 10, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350, 400, 450, 500, 또는 1000%까지 증가된다. 일부 구현예에서, 폴리시스틴 2를 인코딩하는 mRNA, 또는 안티센스 올리고머는 접촉되는 세포에서 생산된 폴리시스틴 2를 인코딩하는 성숙 mRNA의 총량은 처리되지 않은 세포, 예를 들어, 처리되지 않은 세포 또는 대조군 화합물로 처리된 세포에서 생산된 성숙 RNA의 양과 비교하여 약 20% 내지 약 300%, 약 50% 내지 약 300%, 약 100% 내지 약 300%, 약 150% 내지 약 300%, 약 20% 내지 약 50%, 약 20% 내지 약 100%, 약 20% 내지 약 150%, 약 20% 내지 약 200%, 약 20% 내지 약 250%, 약 50% 내지 약 100%, 약 50% 내지 약 150%, 약 50% 내지 약 200%, 약 50% 내지 약 250%, 약 100% 내지 약 150%, 약 100% 내지 약 200%, 약 100% 내지 약 250%, 약 150% 내지 약 200%, 약 150% 내지 약 250%, 약 200% 내지 약 250%, 적어도 약 10%, 적어도 약 20%, 적어도 약 50%, 적어도 약 100%, 적어도 약 150%, 적어도 약 200%, 적어도 약 250%, 또는 적어도 약 300% 증가된다. 일부 구현예에서, 폴리시스틴 2를 인코딩하는 mRNA, 또는 안티센스 올리고머는 접촉되는 세포에서 생산된 폴리시스틴 2를 인코딩하는 성숙 mRNA의 총량은 처리되지 않은 세포, 예를 들어, 처리되지 않은 세포 또는 대조군 화합물로 처리된 세포에서 생산된 성숙 RNA의 양과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다 대조군 화합물은 예를 들어 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이지 않은 올리고뉴클레오티드일 수 있다.
일부 구현예에서, 세포를 PKD2 프리-mRNA 전사체의 표적화 부분에 상보적인 ASO와 접촉시키는 것은 ASO 부재/처리 부재 시 세포에 의해 생성된 단백질의 양과 비교하여 적어도 10, 20, 30, 40, 50, 60, 80, 100%까지 생성된 폴리시스틴 2의 양을 증가시킨다. 일부 구현예에서, 일부 구현예에서, 안티센스 올리고머는 접촉되는 세포에 의해 생성된 폴리시스틴 2의 총량은 대조군 화합물에 의해 생성된 표적 단백질의 양과 비교하여 약 20% 내지 약 100%, 약 50% 내지 약 100%, 약 20% 내지 약 50%, 또는 약 20% 내지 약 100% 감소된다. 일부 구현예에서, 안티센스 올리고머는 접촉되는 세포에 의해 생성된 폴리시스틴 2의 총량은 대조군 화합물에 의해 생성된 표적 단백질의 양과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 감소된다. 대조군 화합물은 예를 들어 프리-mRNA의 표적화 부분에 상보적이지 않은 올리고뉴클레오티드일 수 있다.
일부 구현예에서, 폴리시스틴 2를 인코딩하는 mRNA의 수준은 대조군 세포, 예를 들어 안티센스 올리고머로 처리되지 않은 것 또는 PKD2 함유 프리-mRNA의 표적화 부분에 결합하지 않는 안티센스 올리고머로 처리된 것에서 생산되는 폴리시스틴 2를 인코딩하는 mRNA의 양과 비교할 때 1.1 내지 10배 감소된다.
일부 구현예에서, 폴리시스틴 2를 인코딩하는 mRNA의 수준은 대조군 세포, 예를 들어 안티센스 올리고머로 처리되지 않은 것 또는 PKD2 프리-mRNA의 표적화 부분에 결합하지 않는 안티센스 올리고머로 처리된 것에서 생산되는 폴리시스틴 2를 인코딩하는 mRNA의 양과 비교할 때 1.1 내지 10배 감소된다.
본 발명의 일부 구현예에서, 대상체는 PKD2에서 돌연변이를 가질 수 있다. 미스센스 변이체, 넌센스 변이체, 단일- 및 이중-뉴클레오티드 삽입 및 결실, 복합 삽입/결실, 및 스플라이스 부위 변이체를 비롯한 다양한 병원성 변이가 PKD2 결핍을 야기하는 것으로 보고되었다. 이 병원성 변이체가 존재하는 경우, 전사체의 약 2%-5%가 올바르게 스플라이싱되어 잔류 효소 활성이 허용된다. 일부 구현예에서, 질환은 절단된 단백질 또는 입체형태가 변경되거나 활성이 감소된 단백질을 생성하는 PKD2 병원성 변이체에 의해 야기되는 PKD2 기능의 손실로부터 발생한다.
일부 구현예에서, 당업계에 공지되고 상기 기재된 임의의 PKD2 돌연변이를 갖는 대상체는 본원에 기재된 방법 및 조성물을 사용하여 치료될 수 있다. 일부 구현예에서, 돌연변이는 임의의 PKD2 인트론 또는 엑손 내에 있다. 일부 구현예에서, 돌연변이는 PKD2 엑손 2, 3 또는 4 내에 있다.
NIE는 임의의 길이일 수 있다. 일부 구현예에서, NIE는 인트론의 전체 서열을 포함하지 않는다. 일부 구현예에서, NIE는 인트론의 전체 서열 및 인트론 업스트림의 엑손의 전체 서열 및 인트론 다운스트림의 엑손의 전체 서열을 포함한다. 일부 구현예에서, NIE는 인트론의 일부일 수 있다. 일부 구현예에서, NIE는 정규 인트론 서열의 5' 말단 부분을 포함할 수 있다. 일부 구현예에서, NIE는 정규 인트론의 정규 5'ss 서열을 포함할 수 있다. 일부 구현예에서, NIE는 정규 인트론의 3' 말단 부분을 포함할 수 있다. 일부 구현예에서, NIE는 정규 인트론의 정규 3'ss 서열을 포함할 수 있다. 일부 구현예에서, NIE는 인트론의 정규 5'ss 서열을 포함하지 않고 인트론 내의 부분일 수 있다. 일부 구현예에서, NIE는 인트론의 정규 3'ss 서열을 포함하지 않고 인트론 내의 부분일 수 있다. 일부 구현예에서, NIE는 인트론의 정규 5'ss 서열 또는 표준 3'ss 서열을 포함하지 않는 인트론 내의 부분일 수 있다. 일부 구현예에서, NIE는 길이가 5개의 뉴클레오티드 내지 10개의 뉴클레오티드, 10개의 뉴클레오티드 내지 15개의 뉴클레오티드, 15개의 뉴클레오티드 내지 20개의 뉴클레오티드, 20개의 뉴클레오티드 내지 25개의 뉴클레오티드, 25개의 뉴클레오티드 내지 30개의 뉴클레오티드, 30개의 뉴클레오티드 내지 35개의 뉴클레오티드, 35개의 뉴클레오티드 내지 40개의 뉴클레오티드, 40개의 뉴클레오티드 내지 45개의 뉴클레오티드, 45개의 뉴클레오티드 내지 50개의 뉴클레오티드, 50개의 뉴클레오티드 내지 55개의 뉴클레오티드, 55개의 뉴클레오티드 내지 60개의 뉴클레오티드, 60개의 뉴클레오티드 내지 65개의 뉴클레오티드, 65개의 뉴클레오티드 내지 70개의 뉴클레오티드, 70개의 뉴클레오티드 내지 75개의 뉴클레오티드, 75개의 뉴클레오티드 내지 80개의 뉴클레오티드, 80개의 뉴클레오티드 내지 85개의 뉴클레오티드, 85개의 뉴클레오티드 내지 90개의 뉴클레오티드, 90개의 뉴클레오티드 내지 95개의 뉴클레오티드, 또는 95개의 뉴클레오티드 내지 100개의 뉴클레오티드일 수 있다. 일부 구현예에서, NIE는 길이가 적어도 10개의 뉴클레오티드, 적어도 20개의 뉴클레오티드, 적어도 30개의 뉴클레오티드, 적어도 40개의 뉴클레오티드, 적어도 50개의 뉴클레오티드, 적어도 60개의 뉴클레오티드, 적어도 70개의 뉴클레오티드, 적어도 80개의 뉴클레오티드, 적어도 90개의 뉴클레오티드, 또는 적어도 100개의 뉴클레오티드일 수 있다. 일부 구현예에서, NIE는 길이가 100 내지 200개의 뉴클레오티드, 200 내지 300개의 뉴클레오티드, 300 내지 400개의 뉴클레오티드, 400 내지 500개의 뉴클레오티드, 500 내지 600개의 뉴클레오티드, 600 내지 700개의 뉴클레오티드, 700 내지 800개의 뉴클레오티드, 800 내지 900개의 뉴클레오티드, 900 내지 1,000개의 뉴클레오티드일 수 있다. 일부 구현예에서, NIE는 길이가 1,000개 초과의 뉴클레오티드일 수 있다.
NIE의 포함은 전사체를 NMD의 표적으로 만드는 성숙 mRNA 전사체에서 틀이동 및 조기 종결 코돈(PTC)(또는 조기 종결 코돈)의 도입으로 이어질 수 있다. NIE를 함유하는 성숙 mRNA 전사체는 단백질 발현을 일으키지 않는 비-생산적인 mRNA 전사체일 수 있다. PTC는 NIE의 다운스트림 위치에 존재할 수 있다. 일부 구현예에서, PTC는 NIE의 임의의 엑손 다운스트림에 존재할 수 있다. 일부 구현예에서, PTC는 NIE 내에 존재할 수 있다. 예를 들어, PKD2 유전자에 의해 인코딩된 mRNA 전사체에 PKD2 프리-mRNA의 엑손 2x가 포함되면 mRNA 전사체에서 PTC를 유도할 수 있다. 예를 들어, PKD2에 의해 인코딩된 mRNA 전사체에 PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140)이 포함된다.
치료제
일부 구현예에서, 본원에 사용된 제제는 치료제를 지칭한다. 일부 구현예에서, 본원에 사용된 치료제는 제제를 지칭한다.
본 개시내용의 다양한 구현예에서, PKD2의 단백질 발현 수준을 조절하기 위해 치료제를 포함하는 조성물 및 방법이 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 대체 스플라이싱을 조절하기 위한 조성물 및 방법이 본원에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 스플라이싱에서 엑손 스킵핑을 유도하기 위한, 예를 들어, PKD2 프리-mRNA의 스플라이싱 동안 NMD 엑손의 스킵핑을 유도하기 위한 조성물 및 방법이 본원에서 제공된다. 다른 구현예에서, 치료제는 단백질 발현 수준을 감소시키기 위해 엑손의 포함을 유도하는데 사용될 수 있다.
본원에 개시된 치료제는 NIE 억제제일 수 있다. 치료제는 다핵산 폴리머를 포함할 수 있다. 본원에 개시된 치료제는 대체 스플라이싱 억제제일 수 있다. 일부 구현예에서, 치료제는 다핵산 폴리머를 포함할 수 있다. 다른 구현예에서, 치료제는 소분자를 포함할 수 있다. 다른 구현예에서, 치료제는 폴리펩티드를 포함할 수 있다. 일부 구현예에서, 치료제는 핵산 분자와 복합체를 형성하거나 복합체를 형성하지 않는 핵산 결합 단백질이다. 다른 구현예에서, 치료제는 또 다른 치료제를 인코딩하는 핵산 분자이다. 추가 구현예에서, 치료제는 아데노바이러스 연관 벡터와 같은 바이러스 전달 시스템에 통합된다.
본 발명의 한 양태에 따르면, 기능성 폴리시스틴 2 또는 폴리시스틴 1 결핍과 연관된 병태 또는 질환의 치료 또는 예방 방법이 본원에 제공되며, 방법은 기능성 폴리시스틴 2의 수준을 증가시키기 위해 대상체에게 NIE 억제제를 투여하는 것을 포함하고, 여기서 제제는 성숙 전사체에서 NIE의 포함을 감소시키기 위해 프리-mRNA 전사체의 영역에 결합한다. 예를 들어, 기능성 폴리시스틴 2 또는 폴리시스틴 1 결핍과 연관된 병태의 치료 또는 예방 방법이 본원에 제공되며, 방법은 기능성 폴리시스틴 2의 수준을 증가시키기 위해 대상체에게 NIE 억제제를 투여하는 것을 포함하고, 여기서 제제는 프리-mRNA 전사체의 NIE(예를 들어, PKD2의 엑손 2x)를 함유하는 인트론의 영역 또는 동일한 인트론 내의 NIE-활성화 조절 서열에 결합한다. 예를 들어, 기능성 폴리시스틴 2 또는 폴리시스틴 1 결핍과 연관된 병태의 치료 또는 예방 방법이 본원에 제공되며, 방법은 기능성 폴리시스틴 2의 수준을 증가시키기 위해 대상체에게 NIE 억제제를 투여하는 것을 포함하고, 여기서 제제는 프리-mRNA 전사체의 NIE(예를 들어, PKD2의 엑손 (GRCh38/ hg38: chr4:88031085 88031140))를 함유하는 인트론의 영역 또는 동일한 인트론 내의 NIE-활성화 조절 서열에 결합한다. 추가로 예를 들어, 기능성 폴리시스틴 2 또는 폴리시스틴 1 결핍과 연관된 병태의 치료 또는 예방 방법이 본원에 제공되며, 방법은 기능성 폴리시스틴 2의 수준을 증가시키기 위해 대상체에게 대체 스플라이싱 억제제를 투여하는 것을 포함하고, 여기서 제제는 프리-mRNA 전사체의 엑손 또는 인트론(예를 들어, 인간 PKD2 유전자의 엑손 3 또는 4, 인트론 2, 3 또는 4)의 영역에 결합한다.
본 발명의 한 양태에 따르면, 기능성 폴리시스틴 2 또는 폴리시스틴 1 결핍과 연관된 병태의 치료 또는 예방 방법이 본원에 제공되며, 방법은 기능성 폴리시스틴 2의 수준을 증가시키기 위해 대상체에게 대체 스플라이싱 억제제를 투여하는 것을 포함하고, 여기서 제제는 성숙 전사체에서 NSE의 포함을 감소시키기 위해 프리-mRNA 전사체의 영역에 결합한다.
대안적으로, 기능성 표적 단백질 과발현과 연관된 병태의 치료 또는 예방 방법이 본원에 제공되며, 방법은 기능성 표적 단백질의 수준을 감소시키기 위해 대상체에게 대체 스플라이싱 억제제를 투여하는 것을 포함하고, 여기서 제제는 프리-mRNA 전사체의 엑손 또는 인트론 영역에 결합하며, 표적 단백질은 폴리시스틴 2이다.
성숙 mRNA에서 NIE 포함을 감소시키는 것을 언급하는 경우, 감소는 완전할 수 있고, 예를 들어 100%일 수 있거나 부분적일 수 있다. 감소는 임상적으로 유의적일 수 있다. 감소/보정은 치료를 받지 않은 대상체에서 NIE 포함 수준에 상대적이거나 유사한 대상체의 집단에서 NIE 포함의 양에 상대적일 수 있다. 감소/보정은 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 10% 더 적을 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 20% 적을 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 40% 적을 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 50% 적을 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 60% 적을 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 80% 적을 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 90% 적을 수 있다.
활성 폴리시스틴 2 수치 증가에 대한 언급이 있는 경우, 증가는 임상적으로 유의적일 수 있다. 증가는 치료를 받지 않은 대상체에서 활성 폴리시스틴 2의 수준에 상대적이거나 유사한 대상체의 집단에서 활성 폴리시스틴 2의 양에 상대적일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 10% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 20% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 40% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 50% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 80% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 100% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 200% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 500% 초과 활성의 폴리시스틴 2일 수 있다.
기능성 폴리시스틴 2 수준의 감소에 대해 언급한 경우, 그 감소는 임상적으로 유의적일 수 있다. 감소는 치료를 받지 않은 대상체에서 기능성 폴리시스틴 2의 수준에 상대적이거나 유사한 대상체의 집단에서 기능성 폴리시스틴 2의 양에 상대적일 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 적어도 10% 적은 기능성 폴리시스틴 2일 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 적어도 20% 적은 기능성 폴리시스틴 2일 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 적어도 40% 적은 기능성 폴리시스틴 2일 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 적어도 50% 적은 기능성 폴리시스틴 2일 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 적어도 80% 적은 기능성 폴리시스틴 2일 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 적어도 100% 적은 기능성 폴리시스틴 2일 수 있다.
NIE 억제제가 다핵산 폴리머를 포함하는 구현예에서, 다핵산 폴리머는 길이가 약 50개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 45개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 40개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 35개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 30개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 24개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 25개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 20개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 19개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 18개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 17개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 16개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 15개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 14개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 13개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 12개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 11개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 50개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 45개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 40개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 35개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 30개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10 내지 약 25개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 20개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 15개 내지 약 25개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 15개 내지 약 30개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 12개 내지 약 30개의 뉴클레오티드일 수 있다.
대체 스플라이싱 억제제가 다핵산 폴리머를 포함하는 구현예에서, 다핵산 폴리머는 길이가 약 50개의 뉴클레오티드일 수 있다. 대체 스플라이싱 조절제가 다핵산 폴리머를 포함하는 구현예에서, 다핵산 폴리머는 길이가 약 50개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 45개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 40개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 35개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 30개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 24개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 25개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 20개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 19개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 18개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 17개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 16개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 15개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 14개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 13개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 12개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 11개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 50개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 45개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 40개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 35개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 30개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10 내지 약 25개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 20개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 15개 내지 약 25개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 15개 내지 약 30개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 12개 내지 약 30개의 뉴클레오티드일 수 있다.
다핵산 폴리머의 서열은 mRNA 전사체, 예를 들어 부분적으로 프로세싱된 mRNA 전사체의 표적 서열에 대해 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5% 상보적이다. 다핵산 폴리머의 서열은 프리-mRNA 전사체의 표적 서열에 100% 상보적일 수 있다.
다핵산 폴리머의 서열은 프리-mRNA 전사체의 표적 서열에 대해 4개 이하의 미스매치를 가질 수 있다. 다핵산 폴리머의 서열은 프리-mRNA 전사체의 표적 서열에 대해 3개 이하의 미스매치를 가질 수 있다. 다핵산 폴리머의 서열은 프리-mRNA 전사체의 표적 서열에 대해 2개 이하의 미스매치를 가질 수 있다. 다핵산 폴리머의 서열은 프리-mRNA 전사체의 표적 서열에 대해 1개 이하의 미스매치를 가질 수 있다. 다핵산 폴리머의 서열은 프리-mRNA 전사체의 표적 서열에 대한 미스매치를 갖지 않을 수 있다.
다핵산 폴리머는 프리-mRNA 전사체의 표적 서열에 특이적으로 혼성화할 수 있다. 예를 들어, 다핵산 폴리머는 프리-mRNA 전사체의 표적 서열에 대해 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5% 또는 100% 서열 상보성을 가질 수 있다. 혼성화는 매우 엄격한 혼성화 조건 하에서 이루어질 수 있다.
다핵산 폴리머는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5% 서열 동일성을 갖는 서열을 포함한다. 다핵산 폴리머는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열과 100% 서열 동일성을 갖는 서열을 포함할 수 있다. 다핵산 폴리머는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5% 서열 동일성을 갖는 서열이다. 다핵산 폴리머는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열과 100% 서열 동일성을 갖는 서열이다.
다핵산 폴리머 서열에 대한 언급이 있는 경우, 당업자는 하나 이상의 치환이 허용될 수 있고, 임의로 2개의 치환이 표적 서열에 혼성화하는 능력을 유지하도록 서열에서 허용될 수 있거나; 또는 치환이 표적 서열에 있는 경우, 능력은 표적 서열로 인식됨을 이해할 것이다. 서열 동일성에 대한 참조는 표준/디폴트 매개변수를 사용하여 BLAST 서열 정렬에 의해 결정될 수 있다. 예를 들어, 서열은 99% 동일성을 가질 수 있고 여전히 본 개시내용에 따라 기능할 수 있다. 다른 구현예에서, 서열은 98% 동일성을 가질 수 있고 여전히 본 개시내용에 따라 기능할 수 있다. 또 다른 구현예에서, 서열은 95% 동일성을 가질 수 있고 여전히 본 개시내용에 따라 기능할 수 있다. 또 다른 구현예에서, 서열은 90% 동일성을 가질 수 있고 여전히 본 개시내용에 따라 기능할 수 있다.
안티센스 올리고머
PKD2 NIE 함유 프리-mRNA의 표적화 부분에 결합함으로써 엑손 스킵핑을 유도하는 안티센스 올리고머를 포함하는 조성물이 본원에서 제공된다. 본원에서 사용되는 용어 "ASO" 및 "안티센스 올리고머"는 상호교환적으로 사용되며 왓슨-크릭 염기쌍 형성 또는 워블 염기쌍 형성 (G-U)에 의해 표적 핵산(예를 들어, PKD2 NIE 함유 프리-mRNA) 서열에 혼성화하는 핵염기를 포함하는 폴리뉴클레오티드와 같은 올리고머를 지칭한다. ASO는 표적 서열에 상보적인 정확한 서열 또는 거의 상보성(예를 들어, 표적 서열에 결합하고 스플라이스 부위에서 스플라이싱을 향상시키기에 충분한 상보성)을 가질 수 있다. ASO는 표적 핵산(예를 들어, 프리-mRNA 전사체의 표적화 부분)에 결합(혼성화)하고 생리학적 조건 하에서 혼성화된 상태를 유지하도록 설계된다. 전형적으로 의도한 (표적화된) 핵산 서열이 아닌 다른 부위에 혼성화되면 표적 핵산이 아닌 제한된 수의 서열(표적 핵산 이외의 일부 부위)에 혼성화한다. ASO의 설계는 프리-mRNA 전사체의 표적화 부분의 핵산 서열 또는 게놈 또는 세포 프리-mRNA 또는 전사체의 다른 위치에서 충분히 유사한 핵산 서열의 발생을 고려할 수 있고, 이로써 ASO가 다른 부위에 결합하여 "표적외" 효과를 유발할 가능성은 제한된다. 예를 들어 WO 2015/035091로 공개된 "Reducing Nonsense-Mediated mRNA Decay"라는 제목의 PCT 출원 번호 PCT/US2014/054151에서 당업계에 공지된 임의의 안티센스 올리고머는 본원에 참조로 포함되며 본원에서 기재된 방법을 실시하는 데 사용될 수 있다.
일부 구현예에서, ASO는 표적 핵산 또는 NIE 함유 프리-mRNA의 표적화 부분에 "특이적으로 혼성화"하거나 "특이적"이다. 전형적으로, 이러한 혼성화는 실질적으로 37℃ 초과, 바람직하게는 적어도 50℃, 전형적으로 60℃ 내지 약 90℃ 사이의 Tm으로 발생한다. 이러한 혼성화는 바람직하게는 엄격한 혼성화 조건에 해당한다. 주어진 이온 강도 및 pH에서, Tm은 표적 서열의 50%가 상보적인 올리고뉴클레오티드에 혼성화되는 온도이다.
올리고뉴클레오티드와 같은 올리고머는 혼성화가 2개의 단일 가닥 폴리뉴클레오티드 사이에 역평행 배열로 발생할 때 서로 "상보적"이다. 이중 가닥 폴리뉴클레오티드는 제1 폴리뉴클레오티드의 가닥 중 하나와 제2 가닥 사이에 혼성화가 발생할 수 있는 경우 다른 폴리뉴클레오티드에 대해 "상보적"일 수 있다. 상보성(하나의 폴리뉴클레오티드가 다른 폴리뉴클레오티드와 상보적인 정도)은 일반적으로 허용되는 염기쌍 형성 규칙에 따라 서로 수소 결합을 형성할 것으로 예상되는 대향 가닥의 염기 비율(예를 들어, 백분율)로 정량화할 수 있다. 안티센스 올리고머(ASO)의 서열은 혼성화하기 위해 표적 핵산의 서열에 100% 상보적일 필요는 없다. 특정 구현예에서, ASO는 표적화되는 표적 핵산 서열 내의 표적 영역에 대한 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 상보성을 갖는다. 예를 들어, 올리고머 화합물의 20개 핵염기 중 18개가 표적 영역에 상보적이어서 특이적으로 혼성화되는 ASO는 90% 상보성을 나타낼 것이다. 이 예에서, 나머지 비-상보적 핵염기는 함께 클러스터링되거나 상보적 핵염기와 산재될 수 있으며 서로 또는 상보적 핵염기에 연속할 필요는 없다. 표적 핵산 영역과 ASO의 퍼센트 상보성은 당업계에 공지된 BLAST 프로그램(기본 로컬 정렬 검색 도구) 및 PowerBLAST 프로그램을 사용하여 일상적으로 결정될 수 있다(Altschul, 등, J. Mol. Biol., 1990, 215, 403-410; Zhang and Madden, Genome Res., 1997, 7, 649-656).
ASO는 표적 서열의 모든 핵염기에 혼성화할 필요는 없으며 혼성화하는 핵염기는 연속하거나 비연속적일 수 있다. ASO는 프리-mRNA 전사체의 하나 이상의 세그먼트에 걸쳐 혼성화할 수 있으므로, 개재 또는 인접 세그먼트가 혼성화 이벤트에 관여하지 않는다(예를 들어, 루프 구조 또는 헤어핀 구조가 형성될 수 있음). 특정 구현예에서, ASO는 표적 프리-mRNA 전사체에서 비연속적 핵염기에 혼성화한다. 예를 들어, ASO는 ASO가 혼성화하지 않는 하나 이상의 핵염기(들)에 의해 분리된 프리-mRNA 전사체의 핵염기에 혼성화할 수 있다.
본원에 기재된 ASO는 NIE 함유 프리-mRNA의 표적화 부분에 존재하는 핵염기에 상보적인 핵염기를 포함한다. 용어 ASO는 표적 mRNA 상의 상보적 핵염기에 혼성화할 수 있는 핵염기를 포함하지만 펩티드 핵산(PNA)과 같은 당 모이어티를 포함하지 않는 임의의 다른 올리고머 분자 올리고뉴클레오티드 및를 구현한다. ASO는 자연 발생 뉴클레오티드, 뉴클레오티드 유사체, 변형된 뉴클레오티드, 또는 이들 중 2개 또는 3개의 임의의 조합을 포함할 수 있다. "자연 발생 뉴클레오티드"라는 용어는 데옥시리보뉴클레오티드 및 리보뉴클레오티드를 포함한다. 용어 "변형된 뉴클레오티드"는 변형되거나 치환된 당 그룹 및/또는 변형된 백본을 갖는 뉴클레오티드를 포함한다. 일부 구현예에서, ASO의 모든 뉴클레오티드는 변형된 뉴클레오티드이다. 본원에 기재된 방법 및 조성물과 상용성인 ASO 또는 ASO의 성분의 화학적 변형은 당업자에게 명백할 것이며, 예를 들어 본원에 그 전문이 참조로 포함된 문헌[미국 특허 제8,258,109 B2호, 미국 특허 제5,656,612호, 미국 특허 공개 제2012/0190728호, 및 Dias and Stein, Mol. Cancer Ther. 2002, 347-355]에 찾을 수 있다.
ASO의 하나 이상의 핵염기는 아데닌, 구아닌, 시토신, 티민 및 우라실과 같은 임의의 자연 발생 비변형 핵염기, 또는 표적 프리-mRNA에 존재하는 핵염기와 수소 결합할 수 있도록 변형되지 않은 핵염기와 충분히 유사한 임의의 합성 또는 변형된 핵염기일 수 있다. 변형된 핵염기의 예는 하이포크산틴, 크산틴, 7-메틸구아닌, 5,6-디하이드로유라실, 5-메틸시토신 및 5-하이드록시메토일시토신을 포함하나 이에 제한되지 않는다.
본원에 기재된 ASO는 또한 올리고머의 성분을 연결하는 백본 구조를 포함한다. "백본 구조" 및 "올리고머 연결"이라는 용어는 상호교환적으로 사용될 수 있으며 ASO의 모노머 사이의 연결을 지칭한다. 자연 발생 올리고뉴클레오티드에서, 백본은 올리고머의 당 모이어티를 연결하는 3'-5' 포스포디에스테르 연결을 포함한다. 본원에 기재된 ASO의 백본 구조 또는 올리고머 연결은 포스포로티오에이트, 포스포로디티오에이트, 포스포로셀레노에이트, 포스포로디셀레노에이트, 포스포로아닐로티오에이트, 포스포라닐라데이트, 포스포르아미데이트 등을 (비제한적으로) 포함할 수 있다. 예를 들어, 문헌[LaPlanche, 등, Nucleic Acids Res. 14:9081 (1986); Stec, 등, J. Am. Chem. Soc. 106:6077 (1984), Stein, 등, Nucleic Acids Res. 16:3209 (1988), Zon, 등, Anti-Cancer Drug Design 6:539 (1991); Zon, 등, Oligonucleotides and Analogues: A Practical Approach, pp. 87-108 (F. Eckstein, Ed., Oxford University Press, Oxford England (1991)); Stec, 등, 미국 특허 제5,151,510호; Uhlmann 및 Peyman, Chemical Reviews 90:543 (1990)] 참조. 일부 구현예에서, ASO의 백본 구조는 인을 함유하지 않고 오히려 예를 들어 펩티드 핵산(PNA)에서 펩티드 결합, 또는 카바메이트, 아미드, 선형 및 고리형 탄화수소 기를 포함하는 연결기를 함유한다. 일부 구현예에서, 백본 변형은 포스포로티오에이트 연결이다. 일부 구현예에서, 백본 변형은 포스포르아미데이트 연결이다.
일부 구현예에서, ASO 백본의 각각의 인 뉴클레오티드간 연결에서의 입체화학은 무작위적이다. 일부 구현예에서, ASO 백본의 각각의 인 뉴클레오티드간 연결에서의 입체화학은 조절되며 랜덤하지 않다. 예를 들어, 미국 특허 출원 공개 제2014/0194610호, "Methods for the Synthesis of Functionalized Nucleic Acids"(본원에 참조로 포함됨)는 핵산 올리고머의 각 인 원자에서 키랄성의 손잡이(handedness)를 독립적으로 선택하는 방법을 기재한다. 일부 구현예에서, 본원의 표 5 및 6에 기재된 임의의 ASO를 포함하나 이에 제한되지 않는 본 개시내용의 방법에 사용되는 ASO는 무작위가 아닌 인 뉴클레오티드간 연결을 갖는 ASO를 포함한다. 일부 구현예에서, 본 발명의 방법에 사용되는 조성물은 순수한 부분입체이성질체 ASO를 포함한다. 일부 구현예에서, 본 개시내용의 방법에 사용되는 조성물은 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 약 100%, 약 90% 내지 약 100%, 약 91% 내지 약 100%, 약 92% 내지 약 100%, 약 93% 내지 약 100%, 약 94% 내지 약 100%, 약 95% 내지 약 100%, 약 96% 내지 약 100%, 약 97% 내지 약 100%, 약 98% 내지 약 100%, 또는 약 99% 내지 약 100%의 부분입체이성질체 순도를 갖는 ASO를 포함한다.
일부 구현예에서, ASO는 그의 인 뉴클레오티드간 연결에서 Rp 및 Sp 배열의 비무작위 혼합물을 갖는다. 예를 들어, 양호한 활성과 뉴클레아제 안정성 사이의 균형을 달성하기 위해 안티센스 올리고뉴클레오티드에 Rp와 Sp의 혼합이 필요하다는 것이 제안되었다(문헌[Wan, 등, 2014, "Synthesis, biophysical properties and biological activity of second-generation antisense oligonucleotides containing chiral phosphorothioate linkages," Nucleic Acids Research 42(22): 13456-13468], 이는 본원에 참조로 포함됨). 일부 구현예에서, 본원의 서열번호: 60-191에 기재된 임의의 ASO를 포함하지만 이에 제한되지 않는 본 개시내용의 방법에 사용되는 ASO는 약 5 내지 100% Rp, 적어도 약 5% Rp, 적어도 약 10% Rp, 적어도 약 15% Rp, 적어도 약 20% Rp, 적어도 약 25% Rp, 적어도 약 30% Rp, 적어도 약 35% Rp, 적어도 약 40% Rp, 적어도 약 45% Rp, 적어도 약 50% Rp, 적어도 약 55% Rp, 적어도 약 60% Rp, 적어도 약 65% Rp, 적어도 약 70% Rp, 적어도 약 75% Rp, 적어도 약 80% Rp, 적어도 약 85% Rp, 적어도 약 90% Rp, 또는 적어도 약 95% Rp을 나머지 Sp, 또는 약 100% Rp와 함께 포함한다. 일부 구현예에서, 본원에 제시된 임의의 ASO를 포함하나 이에 제한되지 않는 본 개시내용의 방법에 사용되는 ASO는 서열번호: 60-191 중 어느 하나의 적어도 8개의 인접한 핵산을 포함하는 영역에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함하고, 약 10% 내지 약 100% Rp, 약 15% 내지 약 100% Rp, 약 20% 내지 약 100% Rp, 약 25% 내지 약 100% Rp, 약 30% 내지 약 100% Rp, 약 35% 내지 약 100% Rp, 약 40% 내지 약 100% Rp, 약 45% 내지 약 100% Rp, 약 50% 내지 약 100% Rp, 약 55% 내지 약 100% Rp, 약 60% 내지 약 100% Rp, 약 65% 내지 약 100% Rp, 약 70% 내지 약 100% Rp, 약 75% 내지 약 100% Rp, 약 80% 내지 약 100% Rp, 약 85% 내지 약 100% Rp, 약 90% 내지 약 100% Rp, 또는 약 95% 내지 약 100% Rp, 약 20% 내지 약 80% Rp, 약 25% 내지 약 75% Rp, 약 30% 내지 약 70% Rp, 약 40% 내지 약 60% Rp, 또는 약 45% 내지 약 55% Rp을, 나머지 Sp와 함께 포함한다.
일부 구현예에서, 본원에 제시된 임의의 ASO를 포함하나 이에 제한되지 않는 본 개시내용의 방법에 사용되는 ASO는 서열번호: 60-191 중 어느 하나의 적어도 8개의 인접한 핵산을 포함하는 영역에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함하고 약 5 내지 100% Sp, 적어도 약 5% Sp, 적어도 약 10% Sp, 적어도 약 15% Sp, 적어도 약 20% Sp, 적어도 약 25% Sp, 적어도 약 30% Sp, 적어도 약 35% Sp, 적어도 약 40% Sp, 적어도 약 45% Sp, 적어도 약 50% Sp, 적어도 약 55% Sp, 적어도 약 60% Sp, 적어도 약 65% Sp, 적어도 약 70% Sp, 적어도 약 75% Sp, 적어도 약 80% Sp, 적어도 약 85% Sp, 적어도 약 90% Sp, 또는 적어도 약 95% Sp를 나머지 Rp, 또는 약 100% Sp와 함께 포함한다. 구현예에서, 본원에 제시된 임의의 ASO를 포함하나 이에 제한되지 않는 본 개시내용의 방법에 사용되는 ASO는 약 10% 내지 약 100% Sp, 약 15% 내지 약 100% Sp, 약 20% 내지 약 100% Sp, 약 25% 내지 약 100% Sp, 약 30% 내지 약 100% Sp, 약 35% 내지 약 100% Sp, 약 40% 내지 약 100% Sp, 약 45% 내지 약 100% Sp, 약 50% 내지 약 100% Sp, 약 55% 내지 약 100% Sp, 약 60% 내지 약 100% Sp, 약 65% 내지 약 100% Sp, 약 70% 내지 약 100% Sp, 약 75% 내지 약 100% Sp, 약 80% 내지 약 100% Sp, 약 85% 내지 약 100% Sp, 약 90% 내지 약 100% Sp, 또는 약 95% 내지 약 100% Sp, 약 20% 내지 약 80% Sp, 약 25% 내지 약 75% Sp, 약 30% 내지 약 70% Sp, 약 40% 내지 약 60% Sp, 또는 약 45% 내지 약 55% Sp를 나머지 Rp와 함께 포함한다.
본원에 기재된 임의의 ASO는 자연 발생 뉴클레오티드에 존재하는 리보스 또는 데옥시리보스를 포함하는 당 모이어티, 또는 모폴린 고리를 포함하는 변형된 당 모이어티 또는 당 유사체를 함유할 수 있다. 변형된 당 모이어티의 비제한적 예는 2' 치환 예컨대 2'-O-메틸 (2'-O-Me), 2'-O-메톡시에틸 (2'MOE), 2'-O-아미노에틸, 2'F; N3'->P5' 포스포르아미데이트, 2'디메틸아미노옥시에톡시, 2'디메틸아미노에톡시에톡시, 2'-구아니디니듐, 2'-O-구아니디늄 에틸, 카바메이트 변형된 당, 및 바이사이클릭 변형된 당을 포함한다. 일부 구현예에서, 당 모이어티 변형은 2'-O-Me, 2'F 및 2'MOE로부터 선택된다. 일부 구현예에서, 당 모이어티 변형은 잠금 핵산(LNA)에서와 같은 여분의 다리 결합이다. 일부 구체예에서 당 유사체는 포스포로디아미데이트 모폴리노(PMO)와 같은 모폴린 고리를 함유한다. 일부 구현예에서, 당 모이어티는 리보푸란실 또는 2'데옥시리보푸란실 변형을 포함한다. 일부 구현예에서, 당 모이어티는 2'4'-구속된 2'O-메틸옥시에틸(cMOE) 변형을 포함한다. 일부 구현예에서, 당 모이어티는 cEt 2',4' 구속된 2'-O 에틸 BNA 변형을 포함한다. 일부 구현예에서, 당 모이어티는 트리사이클로DNA(tcDNA) 변형을 포함한다. 일부 구현예에서, 당 모이어티는 에틸렌 핵산(ENA) 변형을 포함한다. 일부 구현예에서, 당 모이어티는 MCE 변형을 포함한다. 변형은 당업계에 공지되어 있고 예를 들어 이 목적을 위해 본원에 참조로 포함되는 문헌[Jarver, 등, 2014, "A Chemical View of Oligonucleotides for Exon Skipping and Related Drug Applications," Nucleic Acid Therapeutics 24(1): 37-47]에 기재되어 있다.
일부 구현예에서, ASO의 각각의 모노머는 동일한 방식으로 변형되는데, 예를 들어 ASO 백본의 각각의 연결은 포스포로티오에이트 연결을 포함하거나 각각의 리보스 당 모이어티는 2'O-메틸 변형을 포함한다. ASO의 각 모노머 성분에 존재하는 이러한 변형을 "균일한 변형"이라고 한다. 일부 예에서, 상이한 변형의 조합이 바람직할 수 있는데, 예를 들어 ASO는 포스포로디아미데이트 연결 및 모폴린 고리(모폴리노)를 포함하는 당 모이어티의 조합을 포함할 수 있다. ASO에 대한 다양한 변형의 조합을 "혼합 변형" 또는 "혼합 화학"이라고 한다.
일부 구현예에서, ASO는 하나 이상의 백본 변형을 포함한다. 일부 구현예에서, ASO는 하나 이상의 당 모이어티 변형을 포함한다. 일부 구현예에서, ASO는 하나 이상의 백본 변형 및 하나 이상의 당 모이어티 변형을 포함한다. 일부 구현예에서, ASO는 2'MOE 변형 및 포스포로티오에이트 백본을 포함한다. 일부 구현예에서, ASO는 포스포로디아미데이트 모폴리노(PMO)를 포함한다. 일부 구현예에서, ASO는 펩티드 핵산(PNA)을 포함한다. 본원에 기재된 임의의 ASO 또는 ASO의 임의의 성분(예를 들어, 핵염기, 당 모이어티, 백본)은 ASO의 원하는 특성 또는 활성을 달성하거나 ASO의 바람직하지 않은 특성 또는 활성을 감소시키기 위해 변형될 수 있다. 예를 들어, ASO 또는 임의의 ASO의 하나 이상의 성분은 프리-mRNA 전사체 상의 표적 서열에 대한 결합 친화도를 향상시키고; 임의의 비-표적 서열에 대한 결합을 감소시키고; 세포 뉴클레아제(즉, RNase H)에 의한 분해를 감소시키고; ASO의 세포 및/또는 세포 핵으로의 흡수를 개선하고; ASO의 약동학 또는 약력학을 변경시키고/거나; ASO의 반감기를 조절하기 위해 변형될 수 있다.
일부 구현예에서, ASO는 2'-O-(2-메톡시에틸)(MOE) 포스포로티오에이트 변형 뉴클레오티드로 구성된다. 이러한 뉴클레오티드로 구성된 ASO는 특히 본원에 개시된 방법에 매우 적합하며; 이러한 변형을 갖는 올리고머는 뉴클레아제 분해에 대한 상당히 향상된 저항성 및 증가된 생체이용률을 갖는 것으로 나타났으며, 예를 들어 본원에 기재된 일부 구현예에서 경구 전달에 적합하도록 한다. 예를 들어, 문헌[Geary, 등, J Pharmacol Exp Ther. 2001; 296(3):890-7; Geary, 등, J Pharmacol Exp Ther. 2001; 296(3):898-904] 참조.
ASO를 합성하는 방법은 당업자에게 공지될 것이다. 대안으로 또는 추가로 ASO는 상업적 공급원으로부터 얻을 수 있다.
달리 명시되지 않는 한, 단일 가닥 핵산(예를 들어, 프리-mRNA 전사체, 올리고뉴클레오티드, ASO 등) 서열의 왼쪽 말단은 5' 말단이고, 단일 또는 이중 가닥 핵산의 왼쪽 방향은 5' 방향으로 지칭된다. 마찬가지로, 핵산 서열(단일 또는 이중 가닥)의 오른쪽 말단 또는 방향은 3' 말단 또는 방향이다. 전형적으로, 핵산의 기준점에 대해 5'인 영역 또는 서열은 "업스트림"로 지칭되고, 핵산의 기준점에 대해 3'인 영역 또는 서열은 "다운스트림"으로 지칭된다. " 전형적으로 mRNA의 5' 방향 또는 말단은 개시 또는 시작 코돈이 있는 곳이고 3' 말단 또는 방향은 종료 코돈이 있는 곳이다. 일부 양태에서, 핵산에서 기준점의 업스트림에 있는 뉴클레오티드는 음수로 지정될 수 있는 반면, 기준점의 다운스트림에 있는 뉴클레오티드는 양수로 지정될 수 있다. 예를 들어, 기준점(예를 들어, mRNA의 엑손-엑손 접합부)은 "제로" 부위로 지정될 수 있고, 기준점의 바로 인접하고 업스트림에 있는 뉴클레오티드는 "마이너스 1", 예를 들어 "-1"이고, 기준점에 직접 인접하고 다운스트림에 있는 뉴클레오티드는 "플러스 1", 예를 들어 "+1"로 지정된다.
일부 구현예에서, ASO는 PKD2 NIE 함유 프리-mRNA에 포함된 엑손 다음 인트론의 5' 스플라이스 부위의 다운스트림(3' 방향)에 있는 PKD2 NIE 함유 프리-mRNA의 표적 부분에 상보적이고(그리고 결합한다) (예를 들어, 5' 스플라이스 부위를 기준으로 양수로 지정된 방향). 일부 구현예에서, ASO는 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 비해 약 +1 내지 약 +500의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이다. 일부 구현예에서, ASO는 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 비해 뉴클레오티드 +6과 +40,000 사이의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적일 수 있다. 일부 양태에서, ASO는 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 대해 약 +1 내지 약 +40,000, 약 +1 내지 약 +30,000, 약 +1 내지 약 +20,000, 약 +1 내지 약 +15,000, 약 +1 내지 약 +10,000, 약 +1 내지 약 +5,000, 약 +1 내지 약 +4,000, 약 +1 내지 약 +3,000, 약 +1 내지 약 +2,000, 약 +1 내지 약 +1,000, 약 +1 내지 약 +500, 약 +1 내지 약 +490, 약 +1 내지 약 +480, 약 +1 내지 약 +470, 약 +1 내지 약 +460, 약 +1 내지 약 +450, 약 +1 내지 약 +440, 약 +1 내지 약 +430, 약 +1 내지 약 +420, 약 +1 내지 약 +410, 약 +1 내지 약 +400, 약 +1 내지 약 +390, 약 +1 내지 약 +380, 약 +1 내지 약 +370, 약 +1 내지 약 +360, 약 +1 내지 약 +350, 약 +1 내지 약 +340, 약 +1 내지 약 +330, 약 +1 내지 약 +320, 약 +1 내지 약 +310, 약 +1 내지 약 +300, 약 +1 내지 약 +290, 약 +1 내지 약 +280, 약 +1 내지 약 +270, 약 +1 내지 약 +260, 약 +1 내지 약 +250, 약 +1 내지 약 +240, 약 +1 내지 약 +230, 약 +1 내지 약 +220, 약 +1 내지 약 +210, 약 +1 내지 약 +200, 약 +1 내지 약 +190, 약 +1 내지 약 +180, 약 +1 내지 약 +170, 약 +1 내지 약 +160, 약 +1 내지 약 +150, 약 +1 내지 약 +140, 약 +1 내지 약 +130, 약 +1 내지 약 +120, 약 +1 내지 약 +110, 약 +1 내지 약 +100, 약 +1 내지 약 +90, 약 +1 내지 약 +80, 약 +1 내지 약 +70, 약 +1 내지 약 +60, 약 +1 내지 약 +50, 약 +1 내지 약 +40, 약 +1 내지 약 +30, 또는 약 +1 내지 약 +20의 영역 내에 있는 표적화 부분에 상보적이다. 일부 양태에서, ASO는 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 대해 약 +1 내지 약 +100, 약 +100 내지 약 +200, 약 +200 내지 약 +300, 약 +300 내지 약 +400, 또는 약 +400 내지 약 +500의 영역 내에 있는 표적화 부분에 상보적이다.
일부 구현예에서, ASO는 (예를 들어, 5' 스플라이스 부위를 기준으로 음수로 지정된 방향)으로 PKD2 NIE 함유 프리-mRNA에 포함된 엑손 다음 인트론의 5' 스플라이스 부위의 다운스트림(5' 방향)에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이고(그리고 결합한다). 일부 구현예에서, ASO는 내포된 엑손 다음의 인트론의 5' 스플라이스 부위에 비해 약 약 -4 내지 약 -270의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이다. 일부 구현예에서, ASO는 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 비해 뉴클레오티드 -1과 -40,000 사이의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적일 수 있다. 일부 양태에서, ASO는 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 대해 약 -1 내지 약 -40,000, 약 -1 내지 약 -30,000, 약 -1 내지 약 -20,000, 약 -1 내지 약 -15,000, 약 -1 내지 약 -10,000, 약 -1 내지 약 -5,000, 약 -1 내지 약 -4,000, 약 -1 내지 약 -3,000, 약 -1 내지 약 -2,000, 약 -1 내지 약 -1,000, 약 -1 내지 약 -500, 약 -1 내지 약 -490, 약 -1 내지 약 -480, 약 -1 내지 약 -470, 약 -1 내지 약 -460, 약 -1 내지 약 -450, 약 -1 내지 약 -440, 약 -1 내지 약 -430, 약 -1 내지 약 -420, 약 -1 내지 약 -410, 약 -1 내지 약 -400, 약 -1 내지 약 -390, 약 -1 내지 약 -380, 약 -1 내지 약 -370, 약 -1 내지 약 -360, 약 -1 내지 약 -350, 약 -1 내지 약 -340, 약 -1 내지 약 -330, 약 -1 내지 약 -320, 약 -1 내지 약 -310, 약 -1 내지 약 -300, 약 -1 내지 약 -290, 약 -1 내지 약 -280, 약 -1 내지 약 -270, 약 -1 내지 약 -260, 약 -1 내지 약 -250, 약 -1 내지 약 -240, 약 -1 내지 약 -230, 약 -1 내지 약 -220, 약 -1 내지 약 -210, 약 -1 내지 약 -200, 약 -1 내지 약 -190, 약 -1 내지 약 -180, 약 -1 내지 약 -170, 약 -1 내지 약 -160, 약 -1 내지 약 -150, 약 -1 내지 약 -140, 약 -1 내지 약 -130, 약 -1 내지 약 -120, 약 -1 내지 약 -110, 약 -1 내지 약 -100, 약 -1 내지 약 -90, 약 -1 내지 약 -80, 약 -1 내지 약 -70, 약 -1 내지 약 -60, 약 -1 내지 약 -50, 약 -1 내지 약 -40, 약 -1 내지 약 -30, 또는 약 -1 내지 약 -20의 영역 내에 있는 표적화 부분에 상보적이다.
일부 구현예에서, ASO는 (예를 들어, 음수로 지정된 방향)으로 PKD2 NIE 함유 프리-mRNA에 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위의 업스트림(5' 방향)에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 영역에 상보적이다. 일부 구현예에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 비해 약 -1 내지 약 -500의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이다. 일부 구현예에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 비해 -1 내지 -40,000의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이다. 일부 양태에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 대해 약 -1 내지 약 -40,000, 약 -1 내지 약 -30,000, 약 -1 내지 약 -20,000, 약 -1 내지 약 -15,000, 약 -1 내지 약 -10,000, 약 -1 내지 약 -5,000, 약 -1 내지 약 -4,000, 약 -1 내지 약 -3,000, 약 -1 내지 약 -2,000, 약 -1 내지 약 -1,000, 약 -1 내지 약 -500, 약 -1 내지 약 -490, 약 -1 내지 약 -480, 약 -1 내지 약 -470, 약 -1 내지 약 -460, 약 -1 내지 약 -450, 약 -1 내지 약 -440, 약 -1 내지 약 -430, 약 -1 내지 약 -420, 약 -1 내지 약 -410, 약 -1 내지 약 -400, 약 -1 내지 약 -390, 약 -1 내지 약 -380, 약 -1 내지 약 -370, 약 -1 내지 약 -360, 약 -1 내지 약 -350, 약 -1 내지 약 -340, 약 -1 내지 약 -330, 약 -1 내지 약 -320, 약 -1 내지 약 -310, 약 -1 내지 약 -300, 약 -1 내지 약 -290, 약 -1 내지 약 -280, 약 -1 내지 약 -270, 약 -1 내지 약 -260, 약 -1 내지 약 -250, 약 -1 내지 약 -240, 약 -1 내지 약 -230, 약 -1 내지 약 -220, 약 -1 내지 약 -210, 약 -1 내지 약 -200, 약 -1 내지 약 -190, 약 -1 내지 약 -180, 약 -1 내지 약 -170, 약 -1 내지 약 -160, 약 -1 내지 약 -150, 약 -1 내지 약 -140, 약 -1 내지 약 -130, 약 -1 내지 약 -120, 약 -1 내지 약 -110, 약 -1 내지 약 -100, 약 -1 내지 약 -90, 약 -1 내지 약 -80, 약 -1 내지 약 -70, 약 -1 내지 약 -60, 약 -1 내지 약 -50, 약 -1 내지 약 -40, 약 -1 내지 약 -30, 또는 약 -1 내지 약 -20의 영역 내에 있는 표적화 부분에 상보적이다. 일부 양태에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 대해 약 -1 내지 약 -100, 약 -100 내지 약 -200, 약 -200 내지 약 -300, 약 -300 내지 약 -400, 또는 약 -400 내지 약 -500의 영역 내에 있는 표적화 부분에 상보적이다.
일부 구현예에서, ASO는 (예를 들어, 양수로 지정된 방향)으로 PKD2 NIE 함유 프리-mRNA에 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위의 다운스트림(3' 방향)에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 영역에 상보적이다. 일부 구현예에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 비해 약 +1 내지 약 +40,000의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이다. 일부 양태에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 대해 약 +1 내지 약 +40,000, 약 +1 내지 약 +30,000, 약 +1 내지 약 +20,000, 약 +1 내지 약 +15,000, 약 +1 내지 약 +10,000, 약 +1 내지 약 +5,000, 약 +1 내지 약 +4,000, 약 +1 내지 약 +3,000, 약 +1 내지 약 +2,000, 약 +1 내지 약 +1,000, 약 +1 내지 약 +500, 약 +1 내지 약 +490, 약 +1 내지 약 +480, 약 +1 내지 약 +470, 약 +1 내지 약 +460, 약 +1 내지 약 +450, 약 +1 내지 약 +440, 약 +1 내지 약 +430, 약 +1 내지 약 +420, 약 +1 내지 약 +410, 약 +1 내지 약 +400, 약 +1 내지 약 +390, 약 +1 내지 약 +380, 약 +1 내지 약 +370, 약 +1 내지 약 +360, 약 +1 내지 약 +350, 약 +1 내지 약 +340, 약 +1 내지 약 +330, 약 +1 내지 약 +320, 약 +1 내지 약 +310, 약 +1 내지 약 +300, 약 +1 내지 약 +290, 약 +1 내지 약 +280, 약 +1 내지 약 +270, 약 +1 내지 약 +260, 약 +1 내지 약 +250, 약 +1 내지 약 +240, 약 +1 내지 약 +230, 약 +1 내지 약 +220, 약 +1 내지 약 +210, 약 +1 내지 약 +200, 약 +1 내지 약 +190, 약 +1 내지 약 +180, 약 +1 내지 약 +170, 약 +1 내지 약 +160, 약 +1 내지 약 +150, 약 +1 내지 약 +140, 약 +1 내지 약 +130, 약 +1 내지 약 +120, 약 +1 내지 약 +110, 약 +1 내지 약 +100, 약 +1 내지 약 +90, 약 +1 내지 약 +80, 약 +1 내지 약 +70, 약 +1 내지 약 +60, 약 +1 내지 약 +50, 약 +1 내지 약 +40, 약 +1 내지 약 +30, 또는 약 +1 내지 약 +20, 또는 약 +1 내지 약 +10의 영역 내에 있는 표적화 부분에 상보적이다.
일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 NSE의 5' 말단에 대해 -4e 내지 NSE의 3' 말단에 대해 +2e의 영역 내에 있다.
일부 구현예에서, ASO는 (예를 들어, 양수로 지정된 방향)으로 PKD2 NIE 함유 프리-mRNA에 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위의 업스트림(5' 방향)에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 영역에 상보적이다. 일부 구현예에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 비해 약 +1 내지 약 +40,000의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이다. 일부 양태에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 대해 약 +1 내지 약 +40,000, 약 +1 내지 약 +30,000, 약 +1 내지 약 +20,000, 약 +1 내지 약 +15,000, 약 +1 내지 약 +10,000, 약 +1 내지 약 +5,000, 약 +1 내지 약 +4,000, 약 +1 내지 약 +3,000, 약 +1 내지 약 +2,000, 약 +1 내지 약 +1,000, 약 +1 내지 약 +500, 약 +1 내지 약 +490, 약 +1 내지 약 +480, 약 +1 내지 약 +470, 약 +1 내지 약 +460, 약 +1 내지 약 +450, 약 +1 내지 약 +440, 약 +1 내지 약 +430, 약 +1 내지 약 +420, 약 +1 내지 약 +410, 약 +1 내지 약 +400, 약 +1 내지 약 +390, 약 +1 내지 약 +380, 약 +1 내지 약 +370, 약 +1 내지 약 +360, 약 +1 내지 약 +350, 약 +1 내지 약 +340, 약 +1 내지 약 +330, 약 +1 내지 약 +320, 약 +1 내지 약 +310, 약 +1 내지 약 +300, 약 +1 내지 약 +290, 약 +1 내지 약 +280, 약 +1 내지 약 +270, 약 +1 내지 약 +260, 약 +1 내지 약 +250, 약 +1 내지 약 +240, 약 +1 내지 약 +230, 약 +1 내지 약 +220, 약 +1 내지 약 +210, 약 +1 내지 약 +200, 약 +1 내지 약 +190, 약 +1 내지 약 +180, 약 +1 내지 약 +170, 약 +1 내지 약 +160, 약 +1 내지 약 +150, 약 +1 내지 약 +140, 약 +1 내지 약 +130, 약 +1 내지 약 +120, 약 +1 내지 약 +110, 약 +1 내지 약 +100, 약 +1 내지 약 +90, 약 +1 내지 약 +80, 약 +1 내지 약 +70, 약 +1 내지 약 +60, 약 +1 내지 약 +50, 약 +1 내지 약 +40, 약 +1 내지 약 +30, 또는 약 +1 내지 약 +20, 또는 약 +1 내지 약 +10의 영역 내에 있는 표적화 부분에 상보적이다.
일부 구현예에서, PKD2 NIE 함유 프리-mRNA의 표적화 부분은 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 대해 +100 내지 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 대해 -100의 영역 내에 있다. 일부 구현예에서, PKD2 NIE 함유 프리-mRNA의 표적화 부분은 NIE 내에 있다. 일부 구현예에서, PKD2 NIE 함유 프리-mRNA의 표적화 부분은 NIE 및 인트론 경계를 포함한다.
ASO는 특이적 결합 및 스플라이싱의 효과적인 향상에 적합한 임의의 길이일 수 있다. 일부 구현예에서, ASO는 8 내지 50개의 핵염기로 구성된다. 예를 들어, ASO는 길이가 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 40, 45, 또는 50개의 핵염기일 수 있다. 일부 구현예에서, ASO는 50개 초과의 핵염기로 구성된다. 일부 구현예에서, ASO는 길이가 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 12 내지 15개의 핵염기, 13 내지 50개의 핵염기, 13 내지 40개의 핵염기, 13 내지 35개의 핵염기, 13 내지 30개의 핵염기, 13 내지 25개의 핵염기, 13 내지 20개의 핵염기, 14 내지 50개의 핵염기, 14 내지 40개의 핵염기, 14 내지 35개의 핵염기, 14 내지 30개의 핵염기, 14 내지 25개의 핵염기, 14 내지 20개의 핵염기, 15 내지 50개의 핵염기, 15 내지 40개의 핵염기, 15 내지 35개의 핵염기, 15 내지 30개의 핵염기, 15 내지 25개의 핵염기, 15 내지 20개의 핵염기, 20 내지 50개의 핵염기, 20 내지 40개의 핵염기, 20 내지 35개의 핵염기, 20 내지 30개의 핵염기, 20 내지 25개의 핵염기, 25 내지 50개의 핵염기, 25 내지 40개의 핵염기, 25 내지 35개의 핵염기, 또는 25 내지 30개의 핵염기이다. 일부 구현예에서, ASO는 길이가 18개의 뉴클레오티드이다. 일부 구현예에서, ASO는 길이가 15개의 뉴클레오티드이다. 일부 구현예에서, ASO는 길이가 25개의 뉴클레오티드이다.
일부 구현예에서, 화학적 성질은 다르지만 프리-NIE 함유 프리-mRNA의 동일한 표적화 부분에 대해 상보적인 2개 이상의 ASO가 사용된다. 일부 구현예에서, NIE 함유 프리-mRNA의 상이한 표적화 부분에 상보적인 2개 이상의 ASO가 사용된다.
일부 구현예에서, 본 개시내용의 안티센스 올리고뉴클레오티드는 하나 이상의 모이어티 또는 접합체, 예를 들어 올리고뉴클레오티드의 활성 또는 세포 흡수를 향상시키는 표적화 모이어티 또는 다른 접합체에 화학적으로 연결된다. 이러한 모이어티는 지질 모이어티, 예를 들어 콜레스테롤 모이어티, 콜레스테릴 모이어티, 지방족 사슬, 예를 들어 도데칸디올 또는 운데실 잔기, 폴리아민 또는 폴리에틸렌 글리콜 사슬 또는 아다만탄 아세트산을 포함하지만 이에 제한되지 않는다. 친유성 모이어티를 포함하는 올리고뉴클레오티드 및 제조 방법은 공개된 문헌에 기술되어 있다. 구현예에서, 안티센스 올리고뉴클레오티드는 무염기성 뉴클레오티드, 폴리에테르, 폴리아민, 폴리아미드, 펩티드, 탄수화물, 예를 들어, N-아세틸갈락토사민 (GalNAc), N-Ac-글루코사민 (GluNAc), 또는 만노스 (예를 들어, 만노스-6-포스페이트), 지질, 또는 다탄화수소 화합물을 포함하지만 이에 제한되지 않는 모이어티와 접합된다. 접합체는 예를 들어 링커를 사용하여 관련 기술분야에서 이해되고 문헌에 기재된 바와 같이 당, 염기 또는 포스페이트 기 상의 임의의 여러 위치에서 안티센스 올리고뉴클레오티드를 포함하는 임의의 뉴클레오티드 중 하나 이상에 연결될 수 있다. 링커는 2가 또는 3가 분지형 링커를 포함할 수 있다. 구현예에서, 접합체는 안티센스 올리고뉴클레오티드의 3' 말단에 부착된다. 올리고뉴클레오티드 접합체를 제조하는 방법은 예를 들어 본원에 참조로 포함된 문헌[미국 특허 제8,450,467호의 "Carbohydrate conjugates as delivery agents for oligonucleotides"]에 기재되어 있다.
일부 구현예에서, ASO에 의해 표적화되는 핵산은 진핵 세포와 같은 세포에서 발현되는 PKD2 NIE 함유 프리-mRNA이다. 일부 구현예에서, 용어 "세포"는 세포의 개체군을 의미할 수 있다. 일부 구현예에서, 세포는 대상체에 있다. 일부 구현예에서, 세포는 대상체로부터 단리된다. 일부 구현예에서, 세포는 생체 외의 것이다. 일부 구현예에서, 세포는 병태 또는 질환 관련 세포 또는 세포주이다. 일부 구현예에서, 세포는 시험관 내(예를 들어, 세포 배양물)의 것이다.
일부 구현예에서, 본원에 개시된 프리-mRNA를 표적으로 하는 ASO는 표 4에 열거된 서열로 이루어진 군으로부터 선택된다.
약제학적 조성물
기재된 조성물의 제제, 예를 들어 안티센스 올리고뉴클레오티드를 포함하고 임의의 기재된 방법에 사용하기 위한 약제학적 조성물 또는 제형은 약제학적 산업에 잘 알려져 있고 공개된 문헌에 기재된 통상적인 기술에 따라 제조될 수 있다. 구현예에서, 대상체를 치료하기 위한 약제학적 조성물 또는 제형은 본원에 기재된 바와 같은 임의의 안티센스 올리고머, 또는 이의 약제학적으로 허용되는 염, 용매화물, 수화물 또는 에스테르의 유효량을 포함한다. 안티센스 올리고머를 포함하는 약제학적 제형은 약제학적으로 허용되는 부형제, 희석제 또는 담체를 추가로 포함할 수 있다.
약제학적으로 허용되는 염은 과도한 독성, 자극, 알레르기 반응 등 없이 인간 및 하등 동물의 조직과 접촉하여 사용하기에 적합하며 합리적인 유익/위험 비율에 상응한다. (예를 들어, 이러한 목적을 위해 본원에 참조로 포함된 문헌[S. M. Berge, 등, J. Pharmaceutical Sciences, 66: 1-19 (1977)]를 참조한다. 염은 화합물의 최종 단리 및 정제 동안 또는 유리 염기 형태를 적절한 유기산과 반응시켜 별도로 제조된 수 있다. 약제학적으로 허용 가능한 무독성 산 부가 염의 예는 무기 산 예컨대 염산, 브롬화수소산, 인산, 황산 및 과염소산으로 형성되거나 또는 유기 산 예컨대 아세트산, 옥살산, 말레산, 타르타르산, 시트르산, 석신산 또는 말론산으로 또는 다른 문서로 기록된 방법 예컨대 이온 교환을 사용하여 형성된 아미노 기의 염이다. 다른 약제학적으로 허용되는 염은 아디페이트, 알기네이트, 아스코르베이트, 아스파르테이트, 벤젠설포네이트, 벤조에이트, 바이설페이트, 보레이트, 부티레이트, 캄포레이트, 캄포르설포네이트, 시트레이트, 사이클로펜탄프로피오네이트, 디글루코네이트, 도데실설페이트, 에탄설포네이트, 포르메이트, 푸마레이트, 글루코헵토네이트, 글리세로포스페이트, 글루코네이트, 헤미설페이트, 헵타노에이트, 헥사노에이트, 하이드로아이오다이드, 2-하이드록시-에탄설포네이트, 락토바이오네이트, 락테이트, 라우레이트, 라우릴 설페이트, 말레이트, 말레에이트, 말로네이트, 메탄설포네이트, 2-나프탈렌설포네이트, 니코티네이트, 니트레이트, 올레에이트, 옥살레이트, 팔미테이트, 파모에이트, 펙티네이트, 퍼설페이트, 3-페닐프로피오네이트, 포스페이트, 피크레이트, 피발레이트, 프로피오네이트, 스테아레이트, 석시네이트, 설페이트, 타르트레이트, 티오시아네이트, p-톨루엔설포네이트, 운데카노에이트, 발레레이트 염, 등을 포함한다. 대표적인 알칼리 또는 알칼리 토금속 염은 나트륨, 리튬, 칼륨, 칼슘, 마그네슘 등을 포함한다. 추가의 약제학적으로 허용되는 염은 적절한 경우 무독성 암모늄, 사차 암모늄, 및 할라이드, 수산화물, 카복실레이트, 설페이트, 포스페이트, 니트레이트, 저급 알킬 설포네이트 및 아릴 설포네이트와 같은 반대이온을 사용하여 형성된 아민 양이온을 포함한다.
일부 구현예에서, 조성물은 정제, 캡슐, 겔 캡슐, 액체 시럽, 연질 겔, 좌약, 및 관장제와 같으나 이에 제한되지 않는 임의의 많은 가능한 복용 형태로 제형화된다. 구현예에서, 조성물은 수성, 비-수성 또는 혼합 매질에서 현탁액으로 제형화된다. 수성 현탁액은 예를 들어 나트륨 카복시메틸셀룰로오스, 소르비톨 및/또는 덱스트란을 비롯한 현탁액의 점도를 증가시키는 물질을 추가로 함유할 수 있다. 현탁액에는 안정화제가 함유될 수도 있다. 구현예에서, 본 개시내용의 약제학적 제형 또는 조성물은 용액, 에멀젼, 마이크로에멀젼, 포움 또는 리포솜-함유 제형 (예를 들어, 양이온성 또는 비-양이온성 리포솜)을 함유하지만 이에 제한되지 않는다.
본원에 기재된 약제학적 조성물 또는 제형은 하나 이상의 침투 증진제, 담체, 부형제 또는 적절하고 당업자에게 잘 알려져 있거나 공개된 문헌에 기재된 다른 활성 또는 불활성 성분을 포함할 수 있다. 구현예에서, 리포솜은 또한 입체적으로 안정화된 리포솜, 예를 들어, 하나 이상의 특화된 지질을 포함하는 리포솜을 포함한다. 이러한 특화된 지질은 순환 수명이 향상된 리포솜을 생성한다. 구현예에서, 입체적으로 안정화된 리포솜은 하나 이상의 당지질을 포함하거나 폴리에틸렌 글리콜(PEG) 모이어티와 같은 하나 이상의 친수성 폴리머로 유도체화된다. 일부 구현예에서, 계면활성제는 약제학적 제형 또는 조성물에 포함된다. 의약품, 제형 및 에멀젼 내의 계면활성제의 사용은 당업계에 잘 알려져 있다. 구현예에서, 본 개시내용은 안티센스 올리고뉴클레오티드의 효율적인 전달에 영향을 미치기 위해, 예를 들어, 세포막을 통한 확산을 돕고/하거나 친유성 약물의 투과성을 향상시키기 위해 침투 증진제를 사용한다. 일부 구현예에서, 침투 증진제는 계면활성제, 지방산, 담즙산염, 킬레이트제, 또는 비-킬레이트 비-계면활성제이다.
일부 구현예에서, 약제학적 제형은 다수의 안티센스 올리고뉴클레오티드를 포함한다. 구현예에서, 안티센스 올리고뉴클레오티드는 다른 약물 또는 치료제와 함께 투여된다.
병용 요법
일부 구현예에서, 1개 이상의 NSE 조절 제제를 포함하는 조성물이 본명세서에 제공된다. 일부 구현예에서, 2개 이상의 NSE 조절 제제를 포함하는 조성물이 본명세서에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 영역에 상보적인 1개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 영역에 상보적인 2개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 동일한 표적화 영역에 상보적인 1개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 동일한 표적화 영역에 상보적인 2개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 상이한 표적화 영역에 상보적인 1개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 상이한 표적화 영역에 상보적인 2개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, 표 4의 1개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, 표 4의 2개 이상의 ASO를 포함하는 조성물이 본원에 제공된다.
일부 구현예에서, 본 개시내용에 개시된 치료제(예를 들어, ASO)는 하나 이상의 추가 치료제와 함께 사용될 수 있다. 일부 구현예에서, 하나 이상의 추가 치료제는 소분자를 포함할 수 있다. 예를 들어, 하나 이상의 추가 치료제는 WO2016128343A1, WO2017053982A1, WO2016196386A1, WO201428459A1, WO201524876A2, WO2013119916A2, 및 WO2014209841A2에 기재된 소분자를 포함할 수 있으며, 이들은 그 전체가 본원에 참조로 포함된다 일부 구현예에서, 하나 이상의 추가 치료제는 톨밥탄(Jynarque®, Samsca)을 포함할 수 있다. 일부 구현예에서, 하나 이상의 추가 치료제는 인트론 체류를 수정하기 위해 사용될 수 있는 ASO를 포함한다.
대상체의 치료
본원에 제공된 임의의 조성물은 개체에게 투여될 수 있다. "개체"는 "대상체" 또는 "환자"와 상호교환가능하게 사용될 수 있다. 개체는 포유동물, 예를 들어 인간 또는 비-인간 영장류, 설치류, 토끼, 랫트, 마우스, 말, 당나귀, 염소, 고양이, 소, 돼지, 또는 양과 같은 동물일 수 있다. 실시예에서, 개체는 인간이다. 실시예에서, 개체는 태아, 배아 또는 아동이다. 다른 구체예에서, 개체는 식물과 같은 또 다른 진핵 유기체일 수 있다. 일부 구현예에서, 본원에 제공된 조성물은 생체 외 세포에 투여된다.
일부 구현예에서, 본원에 제공된 조성물은 질환 또는 장애를 치료하는 방법으로서 개체에게 투여된다. 일부 구현예에서, 개체는 본원에 기재된 임의의 질환과 같은 유전적 질환을 갖는다. 일부 구현예에서, 개체는 본원에 기재된 임의의 질환과 같은 질환을 가질 위험이 있다. 일부 구현예에서, 개체는 불충분한 양의 단백질 또는 불충분한 단백질 활성에 의해 야기되는 질환 또는 장애를 가질 위험이 증가된다. 개체가 불충분한 양의 단백질 또는 불충분한 단백질 활성을 야기하는 질환 또는 장애를 가질 "위험이 증가된" 경우, 이 방법은 예방적(preventative) 또는 예방적(prophylactic) 치료를 포함한다. 예를 들어, 개체는 질환의 가족력으로 인해 그러한 질환 또는 장애를 가질 위험이 증가할 수 있다. 전형적으로, 그러한 질환 또는 장애를 가질 위험이 증가된 개체는 (예를 들어, 질환 또는 장애의 개시 또는 진행을 예방하거나 지연시킴으로써) 예방적 치료로부터 이익을 얻는다. 구현예에서, 태아는 예를 들어 ASO 조성물을 태아에게 직접적으로 또는 간접적으로(예를 들어, 산모를 통해) 투여함으로써 자궁 내에서 치료된다.
본 발명의 ASO의 투여에 적합한 경로는 ASO의 전달이 요구되는 세포 유형에 따라 달라질 수 있다. 본 개시내용의 ASO는 비경구적으로, 예를 들어 척수강내 주사, 뇌실심내 주사, 복강내 주사, 근육내 주사, 피하 주사 또는 정맥내 주사에 의해 환자에게 투여될 수 있다.
구현예에서, 안티센스 올리고뉴클레오티드는 당업계에 공지된 임의의 방법에 의해 혈액-뇌 장벽을 가로지르는 대상 안티센스 올리고뉴클레오티드의 침투를 촉진할 수 있는 하나 이상의 제제와 함께 투여된다. 예를 들어, 근육 조직의 운동 뉴런에 대한 아데노바이러스 벡터의 투여에 의한 제제의 전달은 문헌[미국 특허 제6,632,427호, "Adenoviral-vector-mediated gene transfer into medullary motor neurons"]에 기재되어 있고, 이는 본원에 참조로 포함된다. 뇌, 예를 들어 선조체, 시상, 해마 또는 흑질로의 직접 벡터 전달은 예를 들어 문헌[미국 특허 제6,756,523호, "Adenovirus vectors for the transfer of foreign genes into cells of the central nervous system particularly in brain]에 기재되어 있고, 이는 본원에 참조로 포함된다.
일부 구현예에서, 안티센스 올리고뉴클레오티드는 바람직한 약제학적 또는 약력학적 특성을 제공하는 제제와 연결되거나 접합된다. 구현예에서, 안티센스 올리고뉴클레오티드는 혈액-뇌 장벽을 가로질러 침투 또는 수송을 촉진하는 것으로 당업계에 공지된 물질, 예를 들어 트랜스페린 수용체에 대한 항체에 커플링된다. 구현예에서, 안티센스 올리고뉴클레오티드는 바이러스 벡터와 연결되어, 예를 들어 안티센스 화합물을 더 효과적으로 만들거나 혈액-뇌 장벽을 가로지르는 수송을 증가시킨다. 구현예에서, 삼투성 혈액 뇌 장벽 파괴는 당, 예를 들어, 메소 에리트리톨, 자일리톨, D(+) 갈락토스, D(+) 락토스, D(+) 자일로스, 둘시톨, 미오-이노시톨, L(-) 푸룩토스, D(-) 만니톨, D(+) 글루코스, D(+) 아라비노오스, D(-) 아라비노오스, 셀로비오스, D(+) 말토스, D(+) 라피노스, L(+) 람노오스, D(+) 멜리바이오스, D(-) 리보스, 아도니톨, D(+) 아라비톨, L(-) 아라비톨, D(+) 푸코스, L(-) 푸코스, D(-) 릭소스, L(+) 릭소스, 및 L(-) 릭소스, 또는 아미노산, 예를 들어, 글루타민, 라이신, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루탐산, 글리신, 히스티딘, 류신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 티로신, 발린, 및 타우린의 주입에 의해 지원된다. 혈액 뇌 장벽 침투를 향상시키기 위한 방법 및 물질은 예를 들어 문헌[미국 특허 제9,193,969호, "Compositions and methods for selective delivery of oligonucleotide molecules to specific neuron types", 미국 특허 제4,866,042호, "Method for the delivery of genetic material across the blood brain barrier", 미국 특허 제6,294,520호, "Material for passage through the blood-brain barrier", 및 미국 특허 제6,936,589호, "Parenteral delivery systems"]에 기재되어 있고, 각각 본원에 참조로 포함된다.
일부 구현예에서, 본 개시내용의 ASO는 예를 들어, 본원에 참조로 포함된 미국 특허 제9,193,969호에 기재된 방법을 사용하여 도파민 재흡수 억제제 (DRI), 선택적 세로토닌 재흡수 억제제 (SSRI), 노르아드레날린 재흡수 억제제 (NRI), 노르에피네프린-도파민 재흡수 억제제 (NDRI), 및 세로토닌-노르에피네프린-도파민 재흡수 억제제 (SNDRI)에 커플링된다.
일부 구현예에서, 방법 및 조성물을 사용하여 치료된 대상체는 당업계에 공지되고 기재된 임의의 방법을 사용하여 병태 개선에 대해 평가된다.
일부 경우에, 치료제는 변형된 인간 snRNA와 같은 변형된 snRNA를 포함한다. 일부 경우에, 치료제는 변형된 snRNA를 인코딩하는 바이러스 벡터와 같은 벡터를 포함한다. 일부 구현예에서, 변형된 snRNA는 변형된 U1 snRNA이다(예를 들어, 문헌[Alanis 등, Human Molecular Genetics, 2012, Vol. 21, No. 11 2389-2398] 참조). 일부 구현예에서, 변형된 snRNA는 변형된 U7 snRNA이다(예를 들어, 문헌[Gadgil 등, J Gene Med. 2021;23:e3321] 참조). 변형된 U7 snRNA는 전체 내용이 참조로 여기에 포함된 문헌[Meyer, K.; (2012), Antisense Derivatives of U7 Small Nuclear RNA as Modulators of Pre-mRNA Splicing. In: Stamm, Stefan; Smith, Christopher W. J.; (eds.) Alternative Pre-mRNA Splicing: Theory and Protocols (pp. 481-494), Chichester: John Wiley & Sons 10.1002/9783527636778.ch45]에 기재된 방법을 포함하는 당업계에 공지된 임의의 방법으로 만들 수 있다. 일부 구현예에서, 변형된 U7(smOPT)은 WT U7과 경쟁하지 않는다(Stefanovic 등, 1995).
일부 구현예에서, 변형된 snRNA는 smOPT 변형을 포함한다. 예를 들어, 변형된 snRNA는 서열 AAUUUUUGGAG(서열번호: 229)를 포함할 수 있다. 예를 들어, 서열 AAUUUUUGGAG(서열번호: 229)는 야생형 U7 snRNA의 서열 AAUUUGUCUAG(서열번호: 230)를 대체하여 변형된 U& snRNA(smOPT)를 생성할 수 있다. 일부 구현예에서, U7 snRNA의 smOPT 변형은 입자를 히스톤 프리-mRNA 프로세싱에서 기능적으로 불활성으로 만든다(Stefanovic 등, 1995). 일부 구현예에서, 변형된 U7(smOPT)은 WT U7보다 더 높은 수준으로 핵에서 안정적으로 발현된다(Stefanovic 등, 1995). 일부 구현예에서, snRNA는 U1 snRNP 표적화 서열을 포함한다. 일부 구현예에서, snRNA는 U7 snRNP 표적화 서열을 포함한다. 일부 구현예에서, snRNA는 변형된 U7 snRNP 표적화 서열을 포함하고 여기서 변형된 U7 snRNP 표적화 서열은 smOPT를 포함한다. 일부 구현예에서, 변형된 snRNA는 PKD2 프리-mRNA에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다. 일부 구현예에서, 변형된 snRNA는 PKD2 mRNA에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다.
일부 구현예에서, 변형된 snRNA는 PKD2 프리-mRNA 또는 프로세싱된 PKD2 mRNA의 표적 영역, 예컨대 NMD 엑손의 배제를 조절하는 PKD2 프리-mRNA의 표적 영역, 대체 5' ss에서 스플라이싱을 조절하는 PKD2 프리-mRNA의 표적 영역, 또는 5' UTR 표적 영역과 같은 PKD2 mRNA의 번역을 조절하는 프로세싱된 PKD2 mRNA의 표적 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다. 일부 구현예에서, 변형된 snRNA는 본원에 개시된 ASO의 1 또는 2 또는 그 초과 개의 서열을 포함하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다. 일부 구현예에서, 변형된 snRNA는 돌연변이를 갖는 PKD2 NMD 엑손 함유 프리-mRNA와 같은 돌연변이를 갖는 PKD2 프리-mRNA의 서열에 혼성화하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형되었다. 일부 구현예에서, 변형된 snRNA는 PKD2 NMD 엑손 함유 프리-mRNA의 2개 이상의 표적 영역에 혼성화하는 2개 이상의 서열을 함유하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형되었다. 예를 들어, 변형된 snRNA는 PKD2 NMD 엑손 함유 프리-mRNA의 적어도 8개의 연연 핵산에 혼성화하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형될 수 있다. 일부 구현예에서, 변형된 snRNA는 본원에 개시된 PKD2 NMD 엑손 함유 프리-mRNA의 임의의 표적 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형되었다. 일부 구현예에서, 변형된 snRNA는 PKD2 NMD 엑손 함유 프리-mRNA의 2개 이상의 표적 영역에 혼성화하는 2개 이상의 서열을 함유하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형되었다. 예를 들어, 변형된 snRNA는 프리-mRNA 전사체의 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))을 함유하는 인트론의 1 또는 2 또는 그 초과 개의 서열의 서열 또는 동일한 인트론에서 NMD 엑손 활성화 조절 서열에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손 내의 영역 또는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 업스트림 또는 다운스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 일부 구현예에서, 변형된 snRNA는 PKD2 NMD 엑손 함유 프리-mRNA에 혼성화하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형된 5' 영역을 갖는다. 일부 구현예에서, 변형된 snRNA는 PKD2 NMD 엑손 함유 프리-mRNA에 혼성화하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형된 3' 영역을 갖는다.
일부 구현예에서, 변형된 snRNA는 NMD 엑손의 배제를 조정하는 PKD2 프리-mRNA의 표적 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다. 예를 들어, 예를 들어, 변형된 snRNA는 NMD 엑손 및 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))) 업스트림의 인트론과 겹치는 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 예를 들어, 변형된 snRNA는 NMD 엑손 및 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))) 다운스트림의 인트론과 겹치는 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 다운스트림에 있는 인트론 서열에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 다운스트림에 있는 인트론 서열의 3' 스플라이스 부위에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 다운스트림에 있는 인트론 서열의 5' 스플라이스 부위에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 업스트림에 있는 인트론 서열에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 업스트림에 있는 인트론 서열의 스플라이스 부위에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 업스트림에 있는 인트론 서열의 3' 스플라이스 부위에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 업스트림에 있는 인트론 서열의 5' 스플라이스 부위에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다.
일부 구현예에서, 변형된 snRNA는 대체 5' ss에서 스플라이싱을 조절하는 PKD2 프리-mRNA의 표적 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다. 예를 들어, 변형된 snRNA는 PKD2 프리-mRNA의 인트론(예를 들어, PKD2의 인트론 3의 대체 5' ss(예를 들어, PKD2의 GRCh38/ hg38: chr4 88036480))의 대체 5' ss와 중첩되는 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 PKD2 프리-mRNA의 인트론의 대체 5' ss 및 대체 5' ss의 NMD 엑손 업스트림(예를 들어, PKD2의 인트론 3의 대체 5' ss(예를 들어, PKD2의 GRCh38/ hg38: chr4 88036480) 및 대체 5' ss의 NMD 엑손 업스트림(예를 들어, 엑손 2))과 중첩되는 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 PKD2 프리-mRNA의 인트론의 대체 5' ss의 다운스트림에 있는 인트론 서열의 대체 5' ss(예를 들어, PKD2의 인트론 3(예를 들어, PKD2의 GRCh38/ hg38: chr4 88036480)의 다운스트림에 있는 인트론 서열)에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 PKD2 프리-mRNA의 인트론의 대체 5' ss의 업스트림에 있는 NMD 엑손(예를 들어, 선택적 엑손)의 서열(예를 들어, PKD2의 인트론 3의 대체 5' ss(예를 들어, PKD2의 GRCh38/ hg38: chr4 88036480))의 업스트림에 있는 NMD 엑손(예를 들어, 선택적 엑손)의 서열)에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, 선택적 엑손)의 다운스트림에 있는 인트론의 대체 5' 스플라이스 부위(예를 들어, NMD 엑손(예를 들어, 선택적 엑손)의 다운스트림에 있는 PKD2의 인트론 3(예를 들어, GRCh38/ hg38: chr4 88036480)의 대체 5' 스플라이스 부위)에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다.
일부 구현예에서, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 번역을 조절하는 PKD2 mRNA의 표적 영역, 예컨대 5' UTR 표적 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 5' UTR 서열에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 업스트림 열린 해독틀 시작 코돈에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 업스트림 열린 해독틀 시작 코돈의 서열 업스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 업스트림 열린 해독틀 시작 코돈의 서열 다운스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 정규 열린 해독틀 시작 코돈의 서열 업스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 제1 업스트림 열린 해독틀 시작 코돈의 서열 다운스트림 및 프로세싱된 PKD2 mRNA의 제2 업스트림 열린 해독틀 시작 코돈의 업스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 제1 업스트림 열린 해독틀 시작 코돈의 서열 업스트림 및 프로세싱된 PKD2 mRNA의 제2 업스트림 열린 해독틀 시작 코돈의 업스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 제1 업스트림 열린 해독틀 시작 코돈의 서열 업스트림, 프로세싱된 PKD2 mRNA의 제2 업스트림 열린 해독틀 시작 코돈의 업스트림 및 프로세싱된 PKD2 mRNA의 정식 열린 해독틀 시작 코돈의 업스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다.
엑손 스킵핑을 유도하는 추가 ASO를 확인하는 방법
또한 PKD2 NIE 함유 프리-mRNA의 엑손 스킵핑을 유도하는 ASO를 확인하거나 결정하는 방법은 본 개시내용의 범위 내에 있다. 예를 들어, 방법은 PKD2 NIE 함유 프리-mRNA의 NIE 스킵핑을 유도하는 ASO를 확인하거나 결정하는 것을 포함할 수 있다. 프리-mRNA의 표적 영역 내의 상이한 뉴클레오티드에 특이적으로 혼성화하는 ASO는 표적 인트론의 스플라이싱 속도 및/또는 정도를 개선하는 ASO를 확인하거나 결정하기 위해 스크리닝될 수 있다. 일부 구현예에서, ASO는 스플라이싱 억제제(들)/사일런서의 결합 부위(들)를 차단하거나 방해할 수 있다. 당업계에 공지된 임의의 방법을 사용하여 엑손의 표적 영역에 혼성화될 때 원하는 효과(예를 들어, NIE 스킵핑, 단백질 또는 기능성 RNA 생산)를 초래하는 ASO를 확인(결정)할 수 있다. 이들 방법은 또한 포함된 엑손에 측접하는 인트론 또는 포함되지 않은 엑손에서 표적화 영역에 결합함으로써 포함된 엑손의 엑손 스킵핑을 유도하는 ASO를 확인하기 위해 사용될 수 있다. 사용할 수 있는 방법의 예는 아래에 제공된다.
ASO "워크(walk)"라고 하는 한 라운드의 스크리닝은 프리-mRNA의 표적 영역에 혼성화하도록 설계된 ASO를 사용하여 수행될 수 있다. 예를 들어, ASO 워크에 사용되는 ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위의 약 100개 뉴클레오티드 업스트림(예를 들어, 표적/포함된 엑손의 업스트림에 위치한 인트론 서열의 일부)에서 표적/포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위의 약 100개 뉴클레오티드 다운스트림 및/또는 포함된 엑손 다음 인트론의 5' 스플라이스 부위의 약 100개 뉴클레오티드 업스트림에서 표적/포함된 엑손 다음 인트론의 5' 스플라이스 부위의 약 100개 뉴클레오티드 다운스트림(예를 들어, 표적/포함된 엑손의 다운스트림에 위치한 인트론 서열의 일부)의 5개의 뉴클레오티드마다 타일링될 수 있다. 예를 들어, 길이가 15개의 뉴클레오티드인 제1 ASO는 표적/포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 비해 +6 내지 +20개의 뉴클레오티드에 특이적으로 혼성화하도록 설계될 수 있다. 제2 ASO는 표적/포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 비해 +11 내지 +25개의 뉴클레오티드에 특이적으로 혼성화하도록 설계될 수 있다. ASO는 프리-mRNA의 표적 영역에 걸치는 것과 같이 설계된다. 실시예에서, ASO는 예를 들어 1, 2, 3 또는 4개의 뉴클레오티드마다 더 가깝게 타일링될 수 있다. 또한, ASO는 5' 스플라이스 부위의 다운스트림에 있는 100개의 뉴클레오티드에서 3' 스플라이스 부위의 업스트림에 있는 100개의 뉴클레오티드까지 타일링될 수 있다. 일부 구현예에서, ASO는 3' 스플라이스 부위의 약 1,160개의 뉴클레오티드 업스트림에서 5' 스플라이스 부위의 약 500개의 뉴클레오티드 다운스트림까지 타일링될 수 있다. 일부 구현예에서, ASO는 3' 스플라이스 부위의 업스트림에 있는 약 500개의 뉴클레오티드에서 3' 스플라이스 부위의 다운스트림에 있는 약 1,920개의 뉴클레오티드까지 타일링될 수 있다.
하나 이상의 ASO, 또는 대조군 ASO(표적 영역에 혼성화할 것으로 예상되지 않는 스크램블된 서열을 갖는 ASO)는 예를 들어 형질감염에 의해 표적 프리-mRNA(예를 들어, NIE 함유 프리-mRNA)를 발현하는 질환 관련 세포주로 전달된다. 각각의 ASO의 엑손 스킵핑 효과는 당업계에 공지된 임의의 방법, 예를 들어 실시예 4에 기재된 바와 같이 스플라이스 접합부에 걸치는 프라이머를 사용하는 역전사효소(RT)-PCR에 의해 평가될 수 있다. 대조군 ASO 처리 세포에 비해 ASO 처리 세포에서 포함된 엑손(예를 들어, NIE의 측접 엑손 포함)을 함유하는 영역에 걸친 프라이머를 사용하여 생산된 더 긴 RT-PCR 생성물의 감소 또는 부재는 표적 NIE의 스플라이싱이 향상되었음을 나타낸다. 일부 구현예에서, 엑손 스킵핑 효율(또는 NIE를 함유하는 인트론을 스플라이싱하기 위한 스플라이싱 효율), 스플라이싱된 대 스플라이싱되지 않은 프리-mRNA의 비율, 스플라이싱 속도 또는 스플라이싱 정도는 본원에 기재된 ASO를 사용하여 개선될 수 있다. 표적 프리-mRNA에 의해 인코딩되는 단백질 또는 기능성 RNA의 양은 또한 각각의 ASO가 원하는 효과(예를 들어, 향상된 기능성 단백질 생산)를 달성했는지 여부를 결정하기 위해 평가될 수 있다. 단백질 생산을 평가 및/또는 정량화하기 위해 당업계에 공지된 임의의 방법, 예를 들어 웨스턴 블롯팅, 유동 세포측정법, 면역형광 현미경검사 및 ELISA가 사용될 수 있다.
ASO "마이크로-워크(micro-walk)"라고 하는 제2 라운드의 스크리닝은 프리-mRNA의 표적 영역에 혼성화하도록 설계된 ASO를 사용하여 수행될 수 있다. ASO 마이크로 워크에 사용되는 ASO는 ASO와 혼성화될 때 엑손 스킵핑(또는 NIE의 향상된 스플라이싱)를 초래하는 프리-mRNA의 뉴클레오티드 산 서열을 추가로 정제하기 위해 1개의 뉴클레오티드마다 타일링된다.
표적 인트론의 스플라이싱을 촉진하는 ASO에 의해 정의된 영역은 ASO "마이크로 워크"를 통해 1-nt 간격으로 배치된 ASO와 더 긴 ASO, 전형적으로 18-25 nt를 포함하여 더 자세히 조사된다.
상기 ASO 워크에 대해 기재된 바와 같이, ASO 마이크로 워크는 예를 들어 하나 이상의 ASO 또는 대조군 ASO(표적 영역에 혼성화될 것으로 예상되지 않는 스크램블된 서열을 갖는 ASO)를 전달함으로써, 예를 들어 표적 프리-mRNA를 발현하는 질환 관련 세포주로의 형질감염시킴으로써 수행된다. 각각의 ASO의 스플라이싱 유도 효과는 당업계에 공지된 임의의 방법, 예를 들어 본원에 기재된 바와 같이 NIE에 걸친 프라이머를 사용하는 역전사효소(RT)-PCR에 의해 평가될 수 있다(예를 들어, 실시예 4 참조). 대조군 ASO 처리 세포에 비해 ASO 처리 세포에서 NIE에 걸친 프라이머를 사용하여 생성된 더 긴 RT-PCR 생성물의 감소 또는 부재는 엑손 스킵핑(또는 NIE를 함유하는 표적 인트론의 스플라이싱)이 향상되었음을 나타낸다. 일부 구현예에서, 엑손 스킵핑 효율(또는 NIE를 함유하는 인트론을 스플라이싱하기 위한 스플라이싱 효율), 스플라이싱된 대 스플라이싱되지 않은 프리-mRNA의 비율, 스플라이싱 속도 또는 스플라이싱 정도는 본원에 기재된 ASO를 사용하여 개선될 수 있다. 표적 프리-mRNA에 의해 인코딩되는 단백질 또는 기능성 RNA의 양은 또한 각각의 ASO가 원하는 효과(예를 들어, 향상된 기능성 단백질 생산)를 달성했는지 여부를 결정하기 위해 평가될 수 있다. 단백질 생산을 평가 및/또는 정량화하기 위해 당업계에 공지된 임의의 방법, 예를 들어 웨스턴 블롯팅, 유동 세포측정법, 면역형광 현미경검사 및 ELISA가 사용될 수 있다.
프리-mRNA의 영역에 혼성화될 때 엑손 스킵핑(또는 NIE를 함유하는 인트론의 강화된 스플라이싱) 및 증가된 단백질 생산을 초래하는 ASO는 동물 모델, 예를 들어 전장 인간 유전자가 노크인된 형질전환 마우스 모델 또는 질환의 인간화 마우스 모델을 사용하여 생체내 시험될 수 있다. ASO의 적절한 투여 경로는 ASO의 전달이 요구되는 질환 및/또는 세포 유형에 따라 달라질 수 있다. ASO는 예를 들어 척수강내 주사, 뇌실심내 주사, 복강내 주사, 근육내 주사, 피하 주사 또는 정맥내 주사에 의해 투여될 수 있다. 투여 후, 모델 동물의 세포, 조직 및/또는 기관은 예를 들어 당업계에 공지되고 본원에 기재된 방법에 의해 스플라이싱(예를 들어, 효율, 속도, 정도) 및 단백질 생산을 평가함으로써 ASO 치료의 효과를 결정하기 위해 평가될 수 있다. 동물 모델은 또한 질환 또는 질환 중증도의 표현형 또는 행동 지표일 수 있다.
또한 본 개시내용의 범위 내에는 NMD 억제제, 예를 들어 시클로헥시미드의 존재 하에 NMD 유도 엑손을 확인하거나 입증하는 방법이 있다. 예시적인 방법이 실시예 2에 제공된다.
예시적인 유전자는 표 1에 요약되어 있다. 각 인트론의 서열은 표 2에 요약되어 있다.
실시예
본 개시는 하기 실시예에 의해 더욱 구체적으로 예시될 것이다. 그러나, 본 개시는 임의의 방식으로 이러한 실시예에 의해 제한되지 않는 것으로 이해되어야 한다.
실시예
1: 차세대 시퀀싱을 이용한
RNAseq에
의한
전사체에서의
NMD 유도 엑손 포함 이벤트의 확인
NIE 포함 이벤트를 확인하기 위해 본원에 기재된 유전자에 의해 생산된 전사체의 스냅샷(snapshot)을 나타내기 위해 차세대 시퀀싱을 사용하여 전체 전사체 샷건 시퀀싱을 수행하였다. 이러한 목적을 위해, 인간 세포의 핵 및 세포질 분획으로부터의 폴리A+ RNA를 단리하고, Illumina의 TruSeq Stranded mRNA 라이브러리 Prep Kit를 사용하여 cDNA 라이브러리를 작제하였다. 라이브러리를 페어-말단 시퀀싱하여(pair-end sequenced) 인간 게놈(Grch38/ hg38 어셈블리)에 맵핑된 100-뉴클레오티드 리드를 생성하였다. 도 2는 PKD2 유전자에서 상이한 예시적인 넌센스-매개 mRNA 붕괴(NMD) 유도 엑손의 확인을 도시한다.
실시예 2: 사이클로헥시미드 처리를 통한 NIE의 확인
DMSO-처리 또는 사이클로헥시미드-처리된 인간 신장 혼합 상피 세포 및 인간 신장 피질 상피 세포 및 엑손의 프라이머로부터의 세포질 RNA를 사용한 RT-PCR 분석은 NMD 유도 엑손에 상응하는 밴드의 존재를 확인할 수 있다. 생성물의 동일성을 시퀀싱에 의해 확인하였다. 밴드의 밀도측정 분석을 수행하여 총 전사체의 NMD 엑손 포함 백분율을 계산하였다. NMD를 억제하기 위해 사이클로헥시미드로 세포를 처리하면 세포질 분획에서 NMD 유도 엑손에 상응하는 생성물이 증가할 수 있다. 도 4b는 각각 사이클로헥시미드 처리를 사용한 다양한 유전자 전사체에서 예시적인 NIE 엑손의 확인을 도시한다.
실시예 3: NMD 엑손 영역 ASO 워크
ASO를 사용하여 3' 스플라이스 부위의 바로 업스트림에, 3' 스플라이스 부위에 걸쳐, NMD 엑손에 걸쳐, 5' 스플라이스 부위에 걸쳐, 및 5' 스플라이스 부위의 다운스트림에 있는 NMD 엑손 영역 표적화 서열에 대해 ASO 워크(walk)를 수행하였다. 한 번에 5개의 뉴클레오티드를 이동시킴으로써 이러한 영역을 덮도록 ASO를 설계하였다. 도 5는 예시적인 NIE 엑손 영역에 대한 ASO 워크를 도시한다.
실시예 4: RT-PCR에 의해 평가된 NMD 엑손 영역 ASO 워크
ASO 워크 서열을 예를 들어, RT-PCR에 의해 평가할 수 있다. 짐노틱 섭취(gymnotic uptake), 트랜스펙션 또는 뉴클레오펙션에 의해 인간 세포에서 본원에 기재된 바와 같은 NMD 엑손 영역을 표적화하는 ASO로 처리된 인간 세포의 SYBR-안전하게 염색된 RT-PCR 생성물을 나타내기 위해 PAGE를 사용할 수 있다. NMD 엑손 포함 및 전장에 상응하는 생성물을 정량화하고, NMD 엑손 포함 백분율을 플롯팅하였다. 전장 생성물을 내부 mRNA 대조군으로 정규화할 수 있으며, 대조군에 대한 배수-변화를 플롯팅할 수 있다. 도 7a는 80 nM에서 명시된 ASO로 24시간 동안 트랜스펙션된 일차 신장 혼합 상피 세포를 사용하여 프로브-기반 RT-qPCR(실시예 5 참조, RPL32로 정규화됨)에 의해 평가된 바와 같은 생산적인 PKD2 mRNA의 변화를 도시한다(도 6a 및 6b의 매크로워크(macrowalk) 참조). 도 7b는 80 nM에서 명시된 ASO로 24시간 동안 트랜스펙션된 일차 신장 혼합 상피 세포를 사용하여 프로브-기반 RT-qPCR(실시예 5 참조, RPL32로 정규화됨)에 의해 평가된 바와 같은 비생산적인 PKD2 mRNA의 변화를 도시한다(도 6a 및 6b의 매크로워크 참조). 도 8a는 80 nM에서 명시된 ASO로 24시간 동안 트랜스펙션된 일차 신장 혼합 상피 세포를 사용하여 프로브-기반 RT-qPCR(실시예 5 참조, RPL32로 정규화됨)에 의해 평가된 바와 같은 생산적인 PKD2 mRNA의 변화를 도시한다(도 5의 매크로워크 참조). 도 8b는 80 nM에서 명시된 ASO로 24시간 동안 트랜스펙션된 일차 신장 혼합 상피 세포를 사용하여 프로브-기반 RT-qPCR(실시예 5 참조, RPL32로 정규화됨)에 의해 평가된 바와 같은 비생산적인 PKD2 mRNA의 변화를 도시한다(도 5의 매크로워크 참조).
실시예 5: RT-qPCR에 의해 평가된 NMD 엑손 영역 ASO 워크
내부 mRNA 대조군으로 정규화된 SYBR-그린 또는 임의의 프로브-기반 RT-qPCR 증폭 결과를, RT-qPCR에 의해 평가될 수 있고 RT-qPCR 결과를 확인하기 위해 Sham에 대한 배수 변화로서 플롯팅될 수 있는 동일한 ASO 섭취 실험을 사용하여, 획득할 수 있다.
실시예 6: CXH-처리된 세포에서 선택된 ASO의 용량-의존적 효과
RNAiMAX 트랜스펙션에 의해 마우스 또는 인간 세포에서 모의-처리된(Sham, RNAiMAX 단독), 또는 30 nM, 80 nM, 및 200 nM 농도에서 NMD 엑손을 표적화하는 ASO로 처리된 SYBR-안전하게 염색된 RT-PCR 생성물을 나타내기 위해 PAGE를 사용할 수 있다. NMD 엑손 포함 및 전장에 상응하는 생성물을 정량화하고, NMD 엑손 포함 백분율을 플롯팅할 수 있다. 전장 생성물을 또한 HPRT 내부 대조군으로 정규화할 수 있으며, Sham에 대한 배수-변화를 플롯팅할 수 있다.
실시예 7: 선택된 ASO의 주입
다양한 농도에서 PBS-주사된(1 ㎕)(-) 또는 ASO 또는 Cep290(음성 대조군 ASO; Gerard et al, Mol. Ther. Nuc. Ac., 2015) 2'-ASO-주사된(1 ㎕)(+) 것으로부터의 마우스의 SYBR-안전하게 염색된 RT-PCR 생성물의 PAGE를 수행하였다. NMD 엑손 포함 및 전장에 상응하는 생성물을 정량화하고, NMD 엑손 포함 백분율을 플롯팅할 수 있다. 전장 생성물을 GAPDH 내부 대조군으로 정규화할 수 있으며, PBS-주사된 것에 비해 ASO-주사된 것의 배수-변화를 플롯팅할 수 있다.
실시예 8: 차세대 시퀀싱을 이용한 RNAseq에 의한 전사체에서 NMD 유도 대안적인 스플라이싱 이벤트의 확인
ASO에 의해 접근 가능한 것으로 알려진 장기에서의 비생산적인 AS 이벤트를, 인간 간, 신장, 중추 신경계(CNS), 및 안구 조직으로부터의 83개의 공개적으로 이용 가능한 RNA-시퀀싱(RNA-seq) 데이터세트를 분석함으로써 확인하였다. 전산 분석은 다양한 유형의 총 13,121개의 비생산적인 AS 이벤트를 함유하는 7,819개의 고유 유전자를 발견하였다. 이러한 유전자를 Orphanet(www.orpha.net/)와 같은 유전 질환 데이터베이스와 상호-참조함으로써, 비생산적인 AS 이벤트를 갖는 1,265개의 질환-관련 유전자를 확인하였다. 많은 NMD-민감성 전사체는 분석된 조직에서 효율적으로 분해되고 RNAseq에 의해 검출할 수 없기 때문에, 지금까지 확인된 것보다 비생산적인 AS 이벤트를 갖는 유전자가 더 많이 존재한다. 도 3은 PKD2 유전자에서 상이한 예시적인 넌센스-매개 mRNA 붕괴(NMD) 유도 대안적인 스플라이싱 이벤트의 확인을 도시한다.
실시예 9: 사이클로헥시미드 처리를 통한 대안적 스플라이싱의 확인
인-실리코 예측을 검증하고 잠재적으로 표적화 가능한 비생산적인 AS 이벤트의 존재비를 정량화하기 위해, 세포를 NMD를 억제하는 것으로 알려진 번역 억제제인 사이클로헥시미드(CHX)로 처리하였다. 예상대로, 역전사효소(RT)-PCR 분석은 DMSO-처리된 세포와 비교하여 CHX 처리시 다양한 세포주에서 예측된 비생산적인 PKD2 스플라이싱 이벤트의 일관된 증가를 나타내었다. 증가는 이러한 비생산적인 AS 이벤트가 NMD에 의한 전사체 분해를 초래한다는 것을 나타낸다. 도 4b는 각각 사이클로헥시미드 처리를 사용한 다양한 유전자 전사체에서 예시적인 NIE 엑손의 확인을 도시한다.
실시예 10:
PKD2
엑손, 대안적인 5' ss 및 5'UTR 영역 ASO 워크
비생산적인 AS 이벤트를 방지하고/하거나 PKD2 mRNA 전사체의 번역을 조절할 수 있는 ASO를 확인하기 위해, 관심 AS 이벤트 또는 PKD2의 5' UTR을 따라 5-nt 단계로 초기 체계적인 ASO 워크를 수행하였다. 도 5는 PKD2 프리-mRNA의 NMD 엑손 AS 이벤트를 따른 체계적인 ASO 워크를 도시한다. 도 6a 및 6b는 PKD2 프리-mRNA의 대안적인 5' ss AS 이벤트를 따른 체계적인 ASO 워크를 도시한다. 도 10은 PKD2 mRNA의 5' UTR을 따른 체계적인 ASO 워크를 도시한다. 이러한 ASO는 2' 리보스 위치에서 균일한 포스포로티오에이트 백본 및 메톡시에틸을 가질 수 있다(2'MOE-PS). 이러한 변형은 이전에 높은 친화성으로 RNA에 대한 결합을 허용하고 표적 RNA-ASO 복합체의 뉴클레아제 및 RNase H 절단 둘 모두에 대한 내성을 부여하는 것으로 나타났다. 트랜스펙션된 세포로부터의 RT-PCR 분석은 PKD2 mRNA에서 AS를 감소시키고 생산적인 mRNA를 증가시키거나 PKD2의 번역을 촉진하는 여러 ASO를 확인한다. PKD2 생산적인 mRNA의 관찰된 증가는 TaqMan qPCR에 의해 확인된다. PKD2 번역의 관찰된 증가는 웨스턴 블롯팅에 의해 확인된다. AS의 배수 변화를 생산적 mRNA(qPCR)의 증가에 대해 플롯팅하여 ASO가 기전에서 기능하고 있음을 입증할 수 있다. PKD2 번역의 관찰된 증가는 웨스턴 블롯팅에 의해 확인된다. 번역의 배수 변화를 폴리시스틴 2 단백질의 증가에 대해 플롯팅하여(웨스턴 블롯팅), ASO가 기전에 대해 기능하고 있음을 입증할 수 있다. 이러한 결과는 유전자 발현 상향조절이 ASO로 비생산적인 AS를 방지함으로써 달성될 수 있음을 강력하게 시사할 것으로 예상된다.
실시예 11: 용량-의존적 방식으로 세포 단백질 발현을 증가시키기 위한 ASO의 사용
바람직한 상향조절 수준은 표적 유전자 및 질환마다 다양하기 때문에, 초기 워크로부터 선택된 양성 ASO 히트를 사용하여 생산적인 mRNA의 증가가 비생산적인 AS 이벤트에 걸쳐 적정될 수 있는지 여부를 결정한다. 예시적인 PKD2 ASO를 용량-의존적 상향조절을 입증하기 위해 증가하는 농도로 세포에서 트랜스펙션하였다. 농도를 ASO의 역가에 기초하여 선택하였다. RT-PCR 결과는 동일한 개개 용량으로 트랜스펙션된 비-표적화 ASO 대조군과 비교하여 PKD2에서 비생산적인 대안적인 3'ss 선택의 용량-의존적 감소를 보여준다. 역으로, 생산적 mRNA의 용량-의존적 증가는 비-표적화 ASO 대조군과 비교하여 TaqMan qPCR에 의해 측정시 관찰된다. 생산적인 mRNA에서 관찰된 상향조절이 단백질 수준의 용량-의존적 증가로 해석되는지 여부를 결정하기 위해, 폴리시스틴 2를 표적화 ASO의 농도를 증가시키면서 트랜스펙션된 세포로부터의 추출물에서 측정하였다. 먼저, PKD2에 대한 항체를 단백질 발현의 짧은 간섭 (si)RNA-매개 녹다운 및 웨스턴 블롯 분석에 의해 검증하였다. 선택된 ASO로 트랜스펙션된 세포로부터의 추출물의 면역블롯팅 결과는 폴리시스틴 2의 용량-의존적 증가를 나타낼 것으로 예상된다. 비-표적화 ASO 대조군은 단백질 수준에 유의한 영향을 미치지 않을 것으로 예상된다. 전체적으로, 데이터는 다양한 유형의 비생산적인 AS 이벤트를 표적화하는 ASO가 생산적인 mRNA의 적정 가능한 증가를 초래하여 단백질 발현의 증가를 초래함을 나타낼 것으로 예상된다. TANGO ASO-매개 단백질 상향조절의 적정 가능한 특성은 단백질 수준을 엄격하게 제어하고 과발현의 위험을 감소시킬 수 있음을 시사할 것으로 예상된다. TANGO 기술의 이러한 측면은 상염색체 우성 반수체 불충분 질환을 해결하는데 특히 적합할 것으로 예상된다.
실시예 12: 생체내 TANGO 접근법의 검증
생체내 TANGO 기전의 적용 가능성을 입증하기 위해, PKD2에서 비생산적인 엑손 포함 이벤트를 표적화하는 ASO 워크로부터 양성 히트를 선택할 수 있다. 인간 PKD2 유전자에서 비생산적인 AS 이벤트는 또한 마우스에서 발생하고 서열 수준에서 고도로 보존되어(데이터는 제시되지 않음), 마우스에서 인간 표적화 ASO를 시험할 수 있다. 본원에 제시된 다른 ASO와 유사하게, PKD2 ASO의 증가하는 농도의 짐노틱(자유) 섭취는 비-표적화 ASO 대조군과 비교하여 AS의 용량-의존적 감소 및 세포에서 생산적 mRNA의 역상관된 증가를 초래한다. ASO의 관찰된 효과가 생체내에서 요약될 수 있는지 확인하기 위해, ASO를 마우스에 투여하거나 PBS를 주사를 통해 마우스에 투여하였다. RNA 및 단백질을 주사 5일 후에 처리된 마우스로부터 추출할 수 있다. RT-PCR 분석은 대조군 PBS 코호트와 비교하여 ASO-처리된 마우스에서 명확한 표적 관여 및 비생산적인 엑손 내포의 일관된 감소를 나타내기 위해 수행될 수 있다. 이러한 감소는 TaqMan qPCR에 의해 측정된 생산적 mRNA의 대략 4배 증가로 효과적으로 번역될 수 있다. 동시에, 웨스턴 블롯에 의한 단백질의 증가를 검증된 항체를 사용하여 검출할 수 있다. 이러한 데이터는 비생산적인 AS 이벤트를 이용함으로써 단백질 발현을 상향조절하기 위한 TANGO 접근법의 개념의 생체내 증거를 제공한다.
실시예 13: 유전 질환의 치료를 위한 TANGO(Targeted Augmentation of Nuclear Gene Output)
단백질 발현을 증가시키기 위해 프리-mRNA 스플라이싱의 안티센스-매개 조절을 이용하는 신규한 기술인 TANGO(Targeted Augmentation of Nuclear Gene Output)를 개발하였다. TANGO는 넌센스-매개 mRNA 붕괴(NMD) 또는 핵 보유에 의한 전사체 분해를 초래하는 자연 발생 비생산적인 스플라이싱 이벤트를 방지한다. 이렇게 함으로써, TANGO는 생산적인 mRNA의 생성을 증가시켜, 전장의 완전한 기능 단백질의 증가를 초래한다. 비생산적인 이벤트를 확인하기 위해 RNA 시퀀싱(RNAseq) 데이터세트의 생물정보학적 분석을 수행하였다. 비생산적인 이벤트는 단백질-코딩 유전자의 50% 초과에서 발견되었으며, 이 중 대략 2,900개는 질환-관련된다. 인-실리코 예측을 검증하기 위해, 다양한 유형의 NMD 유도, 비생산적인 대안적 스플라이싱(AS) 이벤트(카세트 엑손, 대안적인 스플라이스 부위, 및 대안적인 인트론)를 나타내는 표적(예를 들어, PKD2)을, NMD를 억제하는 것으로 알려진 번역 억제제인 사이클로헥시미드(CHX)로 세포를 처리함으로써 선택하고 이들의 존재비를 정량하였다. 선택된 표적의 RT-PCR 분석을 수행하였고, DMSO-처리된 세포와 비교하여 CHX 처리시 비생산적인 mRNA의 증가를 관찰하였다. 안티센스 올리고뉴클레오티드(ASO)는 3가지 유형의 NMD 유도, 비생산적인 AS 이벤트를 표적화하도록 설계되며, TANGO ASO는 시험관내에서 용량-의존적 방식으로 생산적인 mRNA 및 단백질을 증가시키기 위해 스플라이싱을 조절할 수 있을 것으로 예상된다. TANGO 기전과 일치하게, ASO-매개된 상향조절의 수준은 표적화된 NMD 유도 이벤트의 존재비에 정비례하는 것으로 관찰될 것으로 예상된다. 또한, PKD2에서 비생산적인 AS 이벤트를 표적화하는 TANGO ASO의 야생형 마우스에의 주사는 생산적인 mRNA 및 폴리시스틴 2의 증가를 초래할 것으로 예상된다. TANGO가 자연 발생 비생산적인 AS를 이용함에 따라, 이러한 신규한 접근법은 야생형 또는 저형성 대립유전자로부터 유전자 발현을 상향조절하는 데 이용될 수 있어, 유전 질환을 치료하기 위한 잠재적으로 독특한 전략을 제공한다. TANGO는 유전적 간질과 같은 상염색체 우성 반수체부전 질환에 대한 치료를 개발하기 위해 적용되고 있다. 야생형 대립유전자로부터 발현을 증가시키는 TANGO ASO는 결핍된 단백질의 생리학적 수준을 회복시키는 데 사용될 수 있다.
실시예 14: NMD 접합부의 전사체 데이터베이스 및 라벨링:
주석이 달린 전사체를 GENCODE(v. 28) 및 REFSEQ(UCSC를 통해)로부터 다운로딩하였다. 각각의 주석이 달린 엑손-엑손 접합부는 "코딩" 또는 "NMD"로 라벨링된다. 접합부는 "넌센스_매개_붕괴"(GENCODE) 또는 "NR"(REFSEQ)로 라벨링된 전사체에서 독점적으로 발견되는 경우에만 "NMD"로 라벨링된다.
RNA-seq 라이브러리 프로세싱:
스플라이스 접합부 카운트를 생성하기 위해 모든 RNA-seq 샘플을 STAR1 v2.6.1b를 사용하여 hg38 게놈 및 조합된 전사체 데이터베이스에 정렬하였다.
추정되는 NMD 유도 스플라이싱 이벤트의 확인 및 정량:
모든 샘플을 SUPPA22를 통해 진행시켜 주석이 달린 대안적인 스플라이싱 이벤트를 규정하였다. 이후, 하기와 같이 대안적 스플라이싱의 각 유형을 라벨링하고 정량화하기 위해 상이한 접근법을 사용하였다:
엑손 내포( EI ) 및 엑손 스킵핑 ( ES ): "스킵핑된 엑손" 이벤트를 SUPPA로부터 분석하여 각 이벤트에 대한 포함 및 스킵핑 접합부를 수득하였다. 스킵핑 접합부가 "NMD"로 라벨링된 경우, 이벤트는 "ES_NMD"로 라벨링된다. 포함 접합부 중 하나가 "NMD"로 라벨링된 경우, 이벤트는 "EI_NMD"로 라벨링된다. 그 외에는, 이벤트는 "카세트 엑손"으로 라벨링된다. 포함 및 스킵핑 접합부 카운트는 STAR 출력으로부터 검색되며, 이러한 카운트는 동일한 대안적으로 스플라이싱된 엑손을 공유하는 모든 이벤트에 걸쳐 합산된다.
포함에 대한 최종 PSI는 로 계산된다.
내포 이벤트의 경우, .
스킵핑 이벤트의 경우, .
대안적인 3' 및 5' 스플라이스 부위(A3 및 A5): A3 및 A5 이벤트는 SUPPA로부터 분석되어 각각의 대안적인 이벤트에 상응하는 접합부를 수득한다. 긴 또는 짧은 접합부가 "NMD"로 라벨링되는 경우, NMD 이벤트가 보고된다. 둘 접합부 모두가 NMD를 보고하는 경우, 이는 그러한 영역에 복잡한 스플라이싱이 있을 가능성이 있기 때문에 보고되지 않는다. 스플라이스 접합부 카운트를 STAR 출력으로부터 검색하였다. PSI는 로 보고된다.
대안적인 인트론 이벤트(AI): 보유된 인트론 이벤트를 SUPPA로부터 분석하여 대안적인 인트론 이벤트의 목록을 획득하였다. 이벤트 접합부가 NMD로 라벨링된 경우, AI 이벤트를 NMD로 라벨링하였다. PSI를 계산하기 위해, 이의 3' 및 5' 스플라이스 부위(및 동일한 AI 이벤트를 함유하는 다른 모든 모 엑손)를 사용하여 모든 접합부를 합산함으로써 AI가 위치된 엑손의 발현 수준을 추정하였다. AI 접합부의 사용은 이후 범위 [0, ]에 속할 것이며, 이는 AI 접합부의 완전한 사용(이는 인트론 보유를 초래하지 않음)이 엑손 접합부 및 AI 접합부에서 유사한 카운트로 달성되기 때문이다(전체 인트론 보유는 접합부에 대해 0 판독을 가짐). Ψ를 계산하기 위해, 이러한 범위가 이제 이 되도록 접합부 카운트를 정규화하였다.
질환 관련성 주석
:
Orphanet의 공개적으로 이용 가능한 데이터 저장소인 Orphadata(http://www.orphadata.org)로부터 유전자-질환 연관 데이터를 다운로딩하였다. 주석을 모든 유전자 기호 별칭을 포함하도록 확장하였다.
실시예 15: 사이클로헥시미드(CHX)로의 처리, 세포 배양, 및 트랜스펙션
비생산적 mRNA의 존재비를 결정하기 위해, 세포를 DMSO에 용해된 50 ㎍/ml의 CHX(Cell Signaling Technology)와 함께 3시간 동안 인큐베이션하였다.
예를 들어, 세포를 10% FBS를 갖는 EMEM 중에서 성장시키고, 1×105개의 세포를 24-웰 플레이트에 시딩하고, 초기 스크리닝을 위해 80 nM ASO 또는 제조사의 지침에 따라 Lipofectamine RNAiMax 시약(Invitrogen)을 사용하여 1, 5, 25 nM의 선택된 ASO로 역-트랜스펙션하였다. 트랜스펙션 24시간 후에 RNeasy 미니 키트(Qiagen)를 사용하여 총 RNA를 추출하고, ImProm-II 역전사효소(Promega)로 cDNA를 합성하였다. 트랜스펙션 48시간 후에 총 단백질을 RIPA 완충제(Cell Signaling Technology)로 추출하였다.
또 다른 예로서, HEK293 세포를 10% FBS를 갖는 EMEM 중에서 성장시키고, 7×105개의 세포를 6-웰 플레이트에 시딩하고, 제조사의 지침에 따라 Lipofectamine RNAiMax 시약(Invitrogen)을 사용하여 30, 60, 및 120 nM의 안티센스 올리고뉴클레오티드(ASO)로 역-트랜스펙션하였다. 트랜스펙션 24시간 후에 RNeasy 미니 키트(Qiagen)를 사용하여 총 RNA를 추출하고, ImProm-II 역전사효소(Promega)로 cDNA를 합성하였다. 트랜스펙션 48시간 후에 총 단백질을 RIPA 완충제(Cell Signaling Technology)로 추출하였다.
또 다른 예로서, Huh7 세포를 10% FBS를 갖는 DMEM 중에서 성장시키고, 1×105개의 세포를 12-웰 플레이트에 시딩하고, 제조사의 지침에 따라 Lipofectamine RNAiMAX(Invitrogen)를 사용하여 5, 20, 또는 80 nM ASO로 역-트랜스펙션하였다. RT-PCR 분석을 위해, 세포를 트랜스펙션 3시간 내지 21시간 후에 DMSO 중 50 ㎍/mL의 CHX(Cell Signaling Technology)로 처리하였다. 트랜스펙션 24시간 후에 RNeasy 미니 키트(Qiagen)를 사용하여 총 RNA를 추출하고, ImProm-II 역전사효소(Promega)로 cDNA를 합성하였다. 트랜스펙션 48시간 후에 총 단백질을 RIPA 완충제(Cell Signaling Technology)로 추출하였다.
또 다른 예로서, ReNcell VM 세포를 약 90% 컨플루언시(confluency)에 도달할 때까지 라미닌 코팅된 플라스크(2D 배양)에서 각각 20 ng/mL의 bFGF 및 EGF를 함유하는 완전한 NSC 배지에서 성장시켰다. 이후, 세포를 아큐타제 처리에 의해 분리하고, PBS로 세척하고, 김노틱(유리) 섭취를 위해 3, 8, 20 μM ASO를 갖는 초저 부착 표면 24-웰 폴리스티렌 플레이트에서 완전 NSC 배지 중에서 배양하였다. 총 RNA를 배지에 ASO 첨가 72시간 후에 RNeasy 미니 키트(Qiagen)를 사용하여 추출하고, cDNA를 ImProm-II 역전사효소(Promega)로 합성하였다.
실시예 16: qPCR 및 RT-PCR 검정
생산적인 mRNA의 발현 분석을 위해, PKD2에 대해 TaqMan qPCR(Thermo Fisher SC)을 수행하였다. SYBR 그린 qPCR 또는 프로브-기반 qPCR을 정방향 프라이머 및 역방향 프라이머, 및 프로브를 갖는 인간 PKD2에 대해 수행하였다. 사이클링 조건은, 예를 들어, 30 사이클 동안 변성을 위해 95℃에서 30초, 어닐링을 위해 60℃에서 30초 및 연장을 위해 72℃에서 60초였다. 또 다른 예로서, 사이클링 조건은 29 사이클 동안 변성을 위해 95℃에서 30초, 어닐링을 위해 55℃에서 30초, 및 연장을 위해 72℃에서 30초였다. 또 다른 예로서, 사이클링 조건은 28 사이클 동안 변성을 위해 95℃에서 30초, 어닐링을 위해 55℃에서 30초, 및 연장을 위해 72℃에서 75초였다. 또 다른 예로서, 사이클링 조건은 28 사이클 동안 변성을 위해 95℃에서 30초, 어닐링을 위해 56℃에서 30초, 및 연장을 위해 72℃에서 75초였다. PCR 생성물을 5% 폴리아크릴아미드 겔에서 분리하고, Multi Gauge 소프트웨어 버전 2.3으로 정량화하였다.
실시예 17: 웨스턴 블롯팅
단백질 추출물을 Pierce BCA 단백질 검정 키트(ThermoFisher)를 사용하여 비색 검정에 의해 정량화하였다.
예를 들어, 면역블롯팅을 25 ㎍의 용해물로 수행하였다. 또 다른 예로서, 면역블롯팅을 60 ㎍의 용해물로 수행하였다. 또 다른 예로서, 면역블롯팅을 120 ㎍의 용해물로 수행하였다. 또 다른 예로서, 면역블롯팅을 30 ㎍의 용해물로 수행하였다. 일차 항체 및 이차 항체를 구입하였다. 블롯을 Typhoon RLA 9000 이미저(General Electric)를 사용하여 스캔하였다. 밀도측정 분석을 Multi Gauge 소프트웨어 버전 2.3을 사용하여 수행하였다.
실시예 18: 유세포 분석
FACS 완충제에서 배양 플레이트로부터 세포를 리프팅하였다. 세포를 APC-항체(1:250)로 염색하였다. 15,000개 세포로부터의 데이터를 Guava Easycyte 12HT(EMD Millipore) 유세포 분석기에서 수집하였다. 형광 마이너스 1을 사용하여 포지티브 게이트를 결정하였다.
실시예 19:
PKD2
엑손 영역 및 5'UTR 벡터화된 ASO 워크
비생산적인 AS 이벤트를 방지할 수 있는 벡터화된 ASO를 확인하기 위해, 체계적인 벡터화된 ASO 워크를 관심 AS 이벤트를 따라 5-nt 또는 2-nt 단계로 수행할 수 있다. 이러한 벡터화된 ASO를 벡터로부터, 이의 표적화 서열로서 ASO 서열을 함유하는 변형된 U1 snRNA 또는 U7 snRNA로서 발현할 수 있다. 도 5는 PKD2 프리-mRNA의 NMD 엑손 AS 이벤트를 따른 체계적인 벡터화된 ASO 워크를 도시한다. 도 6a 및 6b는 PKD2 프리-mRNA의 대안적인 5' ss AS 이벤트를 따른 체계적인 벡터화된 ASO 워크를 보여준다. 도 10은 PKD2 mRNA의 5' UTR을 따른 체계적인 벡터화된 ASO 워크를 도시한다. 벡터화된 ASO는 변형된 U7 snRNA로 발현된다. 트랜스펙션된 세포주로부터의 RT-PCR 분석은 PKD2 mRNA에서 감소된 AS 및 생산적인 mRNA의 증가를 초래하는 여러 벡터화된 ASO를 확인할 수 있다. PKD2 생산적인 mRNA의 관찰된 증가는 TaqMan qPCR에 의해 확인될 수 있다. AS의 배수 변화는 생산적 mRNA(qPCR)의 증가에 대해 플롯팅되어 벡터화된 ASO가 기전에 대해 기능하고 있음을 입증할 수 있다.
본 발명의 바람직한 구현예가 여기에서 도시되고 설명되었지만, 이러한 구현예는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 이제 본 발명을 벗어나지 않고 당업자에게 수많은 변형, 변경 및 대체가 일어날 것이다. 본원에 기재된 본 발명의 구현예에 대한 다양한 대안이 본 발명을 실시하는데 사용될 수 있음을 이해해야 한다. 다음 청구범위는 본 발명의 범위를 정의하고 이들 청구범위 및 그 등가물 범위 내의 방법 및 구조를 포괄하도록 의도된다.
예시적인 구현예 I
특정 구현예에서, 표적 유전자로부터 전사되고 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)을 포함하는 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는 방법이 본원에 기재되어 있고, 방법은 제제 또는 이 제제를 인코딩하는 벡터를 세포에 접촉시켜, 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절하는 단계, 및 세포에서 표적 단백질의 발현을 조절하는 단계로서, 표적 단백질은 폴리시스틴 2이고 표적 유전자는 PKD2 유전자인 단계를 포함한다.
특정 구현예에서, 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 제제 또는 이 제제를 인코딩하는 벡터를 대상체의 세포에 접촉시켜, 제제는 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터의 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절 단계, 및 세포에서 표적 단백질의 발현을 조절하는 단계로서 표적 단백질은 폴리시스틴 2이고 표적 유전자는 PKD2 유전자인 단계를 포함한다.
일부 구현예에서, 제제는 (a) 프리-mRNA의 표적화 부분에 결합하고; (b) NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 조절하거나; 또는 (c) (a)와 (b)의 조합이다.
일부 구현예에서, 제제는 NMD 엑손의 표적화 부분의 영역에 대한 스플라이싱에 관여하는 인자의 결합을 방해한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손에 근접한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 말단의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 5' 말단의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위 다운스트림의 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 프리-mRNA의 2개의 정규 엑손 영역 사이의 인트론 영역에 위치하고, 인트론 영역은 NMD 엑손을 함유한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손과 적어도 부분적으로 중첩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 업스트림 또는 다운스트림 인트론과 적어도 부분적으로 중첩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 5' NMD 엑손-인트론 접합부 또는 3' NMD 엑손-인트론 접합부를 포함한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손 내에 있다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함한다.
일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.9%, 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열을 포함한다.
일부 구현예에서, 프리-mRNA는 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 프리-mRNA는 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, ASO는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 핵산에 상보적인 적어도 약 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성인 서열을 포함한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085 88031140 내에 있다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085 88031140의 업스트림 또는 다운스트림이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 엑손 GRCh38/ hg38: chr4:88031085 88031140의 엑손-인트론 접합부를 포함한다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 폴리시스틴 2 또는 야생형 폴리시스틴 2이다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적이다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적이다.
일부 구현예에서, 제제는 프리-mRNA로부터 NMD 엑손의 배제를 촉진한다.
일부 구현예에서, 제제와 접촉된 세포에서 프리-mRNA로부터의 NMD 엑손의 배제는 대조군 세포에서 프리-mRNA로부터의 NMD 엑손의 배제에 비해 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, 제제는 세포에서 프로세싱된 mRNA의 수준을 증가시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 프로세싱된 mRNA의 수준은 대조군 세포에서 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, 제제는 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 프리-mRNA로부터 발현된 표적 단백질의 수준은 대조군 세포에서 생산된 표적 단백질의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, 질환 또는 병태는 표적 단백질의 기능 상실 돌연변이에 의해 유도된다.
일부 구현예에서, 질환 또는 병태는 표적 단백질을 인코딩하는 유전자의 반가불충분성과 연관되고, 여기서 대상체는 기능성 표적 단백질을 인코딩하는 제1 대립유전자, 및 표적 단백질이 생산되지 않거나 감소된 수준으로 생산되는 제2 대립유전자, 또는 비기능성 표적 단백질 또는 부분 기능성 표적 단백질을 인코딩하는 제2 대립유전자를 갖는다.
일부 구현예에서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택된다.
일부 구현예에서, 질환 또는 병태는 표적 단백질을 인코딩하는 유전자의 상염색체 열성 돌연변이와 연관되며, 여기서 대상체는 제 (i) 표적 단백질은 생산되지 않거나 야생형 대립유전자에 비해 감소된 수준으로 생산되거나; 또는 (ii) 생산된 표적 단백질은 야생형 대립유전자에 비해 비기능적이거나 부분적으로 기능적인 제1 대립유전자 인코딩, 및 (iii) 표적 단백질은 야생형 대립유전자에 비해 감소된 수준으로 생산되고 생산된 표적 단백질은 야생형 대립유전자에 비해 적어도 부분적으로 기능적임; 또는 (iv) 생산된 표적 단백질은 야생형 대립유전자에 비해 부분적으로 기능적인 제2 대립유전자를 갖는다.
일부 구현예에서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택된다.
일부 구현예에서, 제제는 프리-mRNA로부터 NMD 엑손의 배제를 촉진하고 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 제제는 표적 단백질을 인코딩하는 프리-mRNA로부터 NMD 엑손의 배제를 억제한다.
일부 구현예에서, 제제와 접촉된 세포에서 프리-mRNA로부터의 NMD 엑손의 배제는 대조군 세포에서 프리-mRNA로부터의 NMD 엑손의 배제에 비해 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 감소된다.
일부 구현예에서, 제제는 세포에서 프로세싱된 mRNA의 수준을 감소시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 프로세싱된 mRNA의 수준은 대조군 세포에서 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 감소된다.
일부 구현예에서, 제제는 세포에서 표적 단백질의 발현을 감소시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 프리-mRNA로부터 발현된 표적 단백질의 수준은 대조군 세포에서 발현된 표적 단백질의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 감소된다.
일부 구현예에서, 질환 또는 병태는 표적 단백질의 기능 이득 돌연변이에 의해 유도된다.
일부 구현예에서, 대상체는 표적 단백질이 증가된 수준으로 생성되는 대립유전자, 또는 세포에서 증가된 활성을 나타내는 돌연변이 표적 단백질을 인코딩하는 대립유전자를 갖는다.
일부 구현예에서, 제제는 표적 단백질을 인코딩하는 프리-mRNA로부터 NMD 엑손의 배제를 억제하고 세포에서 표적 단백질의 발현을 감소시킨다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 포스포로디아미데이트 모폴리노, 잠금 핵산, 펩티드 핵산, 2'-O-메틸, 2'-플루오로, 또는 2'-O-메톡시에틸 모이어티를 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 적어도 하나의 변형된 당 모이어티를 포함한다.
일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다.
일부 구현예에서, 제제가 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 프리-mRNA의 표적화 부분에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적이다.
일부 구현예에서, 표적 단백질의 mRNA 수준 또는 발현 수준을 평가하는 것을 추가로 포함한다.
일부 구현예에서, 대상체는 인간이다.
한 구현예에서, 대상체는 비-인간 동물이다.
일부 구현예에서, 대상체는 태아, 배아 또는 아동이다.
일부 구현예에서, 세포는 생체 외의 것이다.
일부 구현예에서, 제제는 대상체의 척수강내 주사, 뇌실심내 주사, 복강내 주사, 근육내 주사, 피하 주사, 유리체내 또는 정맥내 주사에 의해 투여된다.
일부 구현예에서, 방법은 대상체에게 제2 치료제를 투여하는 것을 추가로 포함한다.
특정 구현예에서, 제2 치료제는 소분자이다.
일부 구현예에서, 제2 치료제는 안티센스 올리고머이다.
일부 구현예에서, 제2 치료제는 인트론 체류를 수정한다.
일부 구현예에서, 방법은 질환 또는 병태를 치료한다.
특정 구현예에서, 프로세싱된 mRNA 전사물로부터 NSE의 배제를 조절하고 프로세싱된 mRNA 전사체에 정규 엑손의 포함을 조절하기 위해 프리-mRNA 내의 표적 모티프와 상호작용하는 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제를 포함하는 조성물이 본원에 기재되어 있고, 여기서 표적 모티프는 (i) 2개의 정규 엑손 사이의 인트론 영역, (ii) 2개의 정규 엑손 중 하나, 또는 (iii) 인트론 및 정규 엑손 둘 다에 걸쳐 있는 영역에 위치하고; 여기서 NSE는 (a) 정규 엑손의 일부만, 또는 (b) 정규 엑손 및 정규 엑손에 인접한 인트론의 적어도 일부를 포함하고; 여기서 NSE 조절 제제는 프리-mRNA 전사체로부터 NSE의 배제를 조절하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함를 조절한다.
일부 구현예에서, NSE 조절 제제는 프리-mRNA 전사체로부터 NSE의 배제를 촉진하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함을 촉진한다.
일부 구현예에서, 프로세싱된 mRNA 전사체는 표적 단백질을 인코딩하고 NSE 조절 제제는 프리-mRNA를 함유하는 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
특정 구현예에서, 프리-mRNA의 대체 5' 또는 3' 스플라이스 부위에서 스플라이싱을 조절하고 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA 전사체에 정규 엑손의 포함을 조절하기 위해 프리-mRNA 내의 표적 모티프와 상호작용하는 넌센스 매개 RNA 붕괴 대체 5' 또는 3' 스플라이스 부위(NSASS) 조절 제제를 포함하는 조성물이 본원에 기재되고, 여기서 표적 모티프는 (i) 2개의 정규 엑손 사이의 인트론 영역, (ii) 2개의 정규 엑손 중 하나, 또는 (iii) 인트론 및 정규 엑손 둘 다에 걸쳐 있는 영역에 위치하고; 여기서 프리-mRNA의 대체 5' 또는 3' 스플라이스 부위에서 스플라이싱을 조절하는 것은 프리-mRNA 전사체로부터 엑손의 배제를 조절하고, 여기서 엑손은 (a) 정규 엑손의 일부만, 또는 (b) 정규 엑손 및 정규 엑손에 인접한 인트론의 적어도 일부를 포함하고; 여기서 NSASS 조절 제제는 프리-mRNA 전사체로부터 엑손의 배제를 조절하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함를 조절한다.
일부 구현예에서, NSASS 조절 제제는 프리-mRNA 전사체로부터 대체 5' 또는 3' 스플라이스 부위에서의 스플라이싱으로 인한 엑손의 배제를 촉진하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함을 촉진한다.
일부 구현예에서, 프로세싱된 mRNA 전사체는 표적 단백질을 인코딩하고 NSASS 조절 제제는 프리-mRNA를 함유하는 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 표적 단백질은 PKD2로 이루어진 군으로부터 선택된다.
특정 구현예에서, 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제를 포함하는 조성물이 본원에 기재되고, 여기서 프리-mRNA는 정규 엑손 다음 및 정규 엑손 내에 있는 인트론과 관련하여 정규 5' 스플라이스 부위 업스트림, 또는 정규 엑손 다음 및 인트론 내의 인트론과 관련하여 표준 5' 스플라이스 부위 다운스트림의 대체 5' 스플라이스 부위를 포함하는 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손을 포함하고; 여기서 NSE 조절 제제는 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사체의 프로세싱을 조절하고, 여기서 대체 5' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 PKD2이다.
일부 구현예에서, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손은 정규 엑손 다음 및 정규 엑손 내의 인트론과 관련하여 정규 5' 스플라이스 부위 업스트림의 정규 5' 스플라이스 부위를 포함한다.
일부 구현예에서, 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손은 정규 엑손 다음 및 인트론 내의 인트론과 관련하여 정규 5' 스플라이스 부위 다운스트림의 정규 5' 스플라이스 부위를 포함한다.
특정 구현예에서, 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 넌센스 매개 RNA 붕괴 대체 5' 또는 3' 스플라이스 부위 (NSASS) 조절 제제를 포함하는 조성물이 본원에 기재되고, 여기서 프리-mRNA는 정규 엑손 다음 및 정규 엑손 내에 있는 인트론과 관련하여 정규 5' 스플라이스 부위 업스트림, 또는 정규 엑손 다음 및 인트론 내의 인트론과 관련하여 표준 5' 스플라이스 부위 다운스트림의 대체 5' 스플라이스 부위를 포함하는 엑손을 포함하고; 여기서 NSASS 조절 제제는 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사체의 프로세싱을 조절하고, 여기서 대체 5' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 프리-mRNA는 정규 엑손 다음 및 정규 엑손 내의 인트론과 관련하여 정규 5' 스플라이스 부위 업스트림의 대체 5' 스플라이스 부위를 포함하는 엑손을 포함한다.
일부 구현예에서, 프리-mRNA는 정규 엑손 다음 및 인트론 내의 인트론과 관련하여 정규 5' 스플라이스 부위 다운스트림의 대체 5' 스플라이스 부위를 포함하는 엑손을 포함한다.
특정 구현예에서, 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제를 포함하는 조성물이 본원에 기재되고, 여기서 프리-mRNA는 정규 엑손 앞 및 정규 엑손 내에 있는 인트론과 관련하여 정규 3' 스플라이스 부위 업스트림, 또는 정규 엑손 앞 및 인트론 내의 인트론과 관련하여 정규 3' 스플라이스 부위 업스트림의 대체 3' 스플라이스 부위를 포함하는 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손을 포함하고; 여기서 NSE 조절 제제는 대체 3' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사체의 프로세싱을 조절하고, 여기서 대체 3' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 대체 3' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손은 정규 엑손 앞 및 정규 엑손 내의 인트론과 관련하여 정규 3' 스플라이스 부위 다운스트림의 정규 3' 스플라이스 부위를 포함한다.
일부 구현예에서, 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손은 정규 엑손 앞 및 인트론 내의 인트론과 관련하여 정규 3' 스플라이스 부위 업스트림의 정규 3' 스플라이스 부위를 포함한다.
특정 구현예에서, 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 넌센스 매개 RNA 붕괴 대체 5' 또는 3' 스플라이스 부위 (NSASS) 조절 제제를 포함하는 조성물이 본원에 기재되고, 여기서 프리-mRNA는 정규 엑손 앞 및 정규 엑손 내에 있는 인트론과 관련하여 정규 3' 스플라이스 부위 다운스트림, 또는 정규 엑손 앞 및 인트론 내의 인트론과 관련하여 정규 3' 스플라이스 부위 업스트림의 대체 3' 스플라이스 부위를 포함하는 엑손을 포함하고; 여기서 NSASS 조절 제제는 대체 3' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사체의 프로세싱을 조절하고, 여기서 대체 3' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 대체 3' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 프리-mRNA는 정규 엑손 앞 및 정규 엑손 내의 인트론과 관련하여 정규 3' 스플라이스 부위 다운스트림의 대체 3' 스플라이스 부위를 포함하는 엑손을 포함한다.
일부 구현예에서, 프리-mRNA는 정규 엑손 앞 및 인트론 내의 인트론과 관련하여 정규 3' 스플라이스 부위 업스트림의 대체 3' 스플라이스 부위를 포함하는 엑손을 포함한다.
다양한 구현예에서, 제제는 소분자이다.
일부 구현예에서, 제제는 폴리펩티드이다.
일부 구현예에서, 폴리펩티드는 핵산 결합 단백질이다.
일부 구현예에서, 핵산 결합 단백질은 TAL-이펙터 또는 징크 핑거 결합 도메인을 함유한다.
일부 구현예에서, 핵산 결합 단백질은 Cas 계열 단백질이다.
일부 구현예에서, 폴리펩티드는 하나 이상의 핵산 분자와 동반되거나 복합화된다.
일부 구현예에서, 제제는 프리-mRNA의 표적화 영역에 상보적인 안티센스 올리고머(ASO)이다.
일부 구현예에서, 제제는 표적 단백질을 인코딩하는 프리-mRNA의 표적화 영역에 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적이다.
일부 구현예에서, 제제는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다.
일부 구현예에서, 제제는 포스포로디아미데이트 모폴리노를 포함한다.
일부 구현예에서, 제제는 잠금 핵산을 포함한다.
일부 구현예에서, 제제는 펩티드 핵산을 포함한다.
일부 구현예에서, 제제는 2'-O-메틸을 포함한다.
일부 구현예에서, 제제는 2'-플루오로 또는 2'-O-메톡시에틸 모이어티를 포함한다.
일부 구현예에서, 제제는 적어도 하나의 변형된 당 모이어티를 포함한다.
일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다.
일부 구현예에서, 제제는 안티센스 올리고머이고, 여기서 제제는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다.
특정 구현예에서, 본원에 제공된 바와 같은 조성물에 따른 제제를 인코딩하는 핵산 분자를 포함하는 조성물이 본원에 기재된다.
일부 구현예에서, 핵산 분자는 바이러스 전달 시스템에 통합된다.
일부 구현예에서, 바이러스 전달 시스템은 아데노바이러스 연관 벡터이다.
특정 구현예에서, 본원에 기재술된 단백질 발현 조절 방법은 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제를 프리-mRNA 내의 표적 모티프에 접촉시키는 단계를 포함하고, 여기서 NSE는 (i) 정규 엑손의 일부만, 또는 (ii) 정규 엑손 및 정규 엑손에 인접한 인트론의 적어도 일부를 포함하고; 여기서 프리-mRNA는 프로세싱되어 프로세싱된 mRNA 전사체를 형성하고, 여기서 NSE 조절 제제는 프리-mRNA 전사체로부터 NSE의 배제를 조절하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함을 조절하고; 그리고 프로세싱된 mRNA 전사체는 번역되고, 여기서 NSE의 배제 및 정규 엑손의 포함은 정규 엑손 대신에 NSE를 포함하는 동등한 mRNA 전사체의 표적 단백질 발현에 비해 표적 단백질 발현을 조절한다.
일부 구현예에서, 표적 모티프는 2개의 정규 엑손 사이의 인트론 영역에 위치한다.
일부 구현예에서, 표적 모티프는 2개의 정규 엑손 중 하나에 위치한다.
일부 구현예에서, 표적 모티프는 인트론 및 정규 엑손 모두에 걸친 영역에 위치한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
특정 구현예에서, 표적 단백질을 인코딩하는 프리-mRNA를 갖는 세포에 의한 표적 단백질의 발현을 조절하는 방법이 본원에 기재되고, 여기서 프리-mRNA는 정규 엑손 앞 및 정규 엑손 내에 있는 인트론과 관련하여 정규 3' 스플라이스 부위 업스트림, 또는 정규 엑손 앞 및 인트론 내의 인트론과 관련하여 3' 스플라이스 부위 업스트림의 대체 3' 스플라이스 부위를 포함하는 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손을 포함하고; 이 방법은 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제를 세포에 접촉시키는 것을 포함하며, 여기서 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 대체 3' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사물의 프로세싱을 조절하고, 여기서 대체 3' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
특정 구현예에서, 표적 단백질을 인코딩하는 프리-mRNA를 갖는 세포에 의한 표적 단백질의 발현을 조절하는 방법이 본원에 기재되고, 여기서 프리-mRNA는 정규 엑손 다음 및 정규 엑손 내에 있는 인트론과 관련하여 정규 5' 스플라이스 부위 업스트림, 또는 정규 엑손 다음 및 인트론 내의 인트론과 관련하여 정규 5' 스플라이스 부위 다운스트림의 대체 5' 스플라이스 부위를 포함하는 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손을 포함하고; 이 방법은 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제를 세포에 접촉시키는 것을 포함하며, 여기서 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사물의 프로세싱을 조절하고, 여기서 대체 5' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 프리-mRNA의 표적화 부분에 결합한다.
일부 구현예에서, 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 NSE 또는 NMD 엑손의 스플라이싱에 관여하는 인자에 결합한다.
일부 구현예에서, 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 NMD 엑손의 스플라이싱에 관여하는 인자의 활성을 억제한다.
일부 구현예에서, 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 프리-mRNA의 표적화 부분의 영역에 대한 NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 방해한다.
일부 구현예에서, 프리-mRNA의 스플라이싱의 조절은 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 프리-mRNA의 스플라이싱의 조정은 표적 단백질을 인코딩하는 프로세싱된 mRNA의 생산을 증가시킨다.
일부 구현예에서, 치료제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 표적 단백질은 단백질의 정규 동형이다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 본원에 제공된 바와 같은 조성물이다.
특정 구현예에서, 본원에 제공된 바와 같은 조성물을 포함하는 치료제; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는 약제학적 조성물이 본원에 제공된다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 본원에 제공된 약제학적 조성물을 감소가 필요한 대상체에게 투여하는 단계를 포함한다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되고, 상기 방법은 (a) 프로세싱된 mRNA 전사제로부터 NSE의 배제를 조절하고 프로세싱된 mRNA 전사제에서 정규 엑손의 포함을 조절하기 위해 프리-mRNA 내의 표적 모티프와 상호작용하는 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제로서,
NSE는 (i) 정규 엑손의 일부만, 또는 (ii) 정규 엑손 및 정규 엑손에 인접한 인트론의 적어도 일부를 포함하는 넌센스 매개 RNA 붕괴 엑손 (NSE) 조절 제제; 및 (b) 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는 약제학적 조성물을 대상체에게 투여하는 것을 포함하고, 여기서 질환 또는 병태는 프로세싱된 mRNA로부터 번역된 표적 단백질의 발현의 조절에 의해 NSE 조절 제제의 투여에 의해 대상체에서 치료되거나 예방된다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
특정 구현예에서, 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되고, 대상체의 세포는 표적 단백질을 인코딩하는 프리-mRNA를 갖고, 여기서 프리-mRNA는 (a) 정규 엑손의 5' 말단에 측접하는 정규 인트론 앞에 있는 정규 엑손; 및 (b) 정규 엑손 앞 및 정규 엑손 내의 인트론과 관련하여 정규 3' 스플라이스 부위 다운스트림, 또는 정규 엑손 앞 및 정규 엑손 내의 인트론 과 관련하여 정규 3' 스플라이스 부위 업스트림의 대체 3' 스플라이스 부위를 포함하는 대체 넌센스 매개된 RNA 붕괴 유도(NMD) 엑손을 포함하고, 이 방법은 치료제를 세포에 접촉시키는 것을 포함하고, 여기서 치료제는 대체 3' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사체의 프로세싱을 조절하고, 대체 3' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 대상체의 세포에서 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
특정 구현예에서, 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되고, 대상체의 세포는 표적 단백질을 인코딩하는 프리-mRNA를 갖고, 여기서 프리-mRNA는 (a) 정규 엑손의 3' 말단에 측접하는 정규 인트론이 뒤따르는 정규 엑손; 및 (b) 정규 엑손 다음 및 정규 엑손 내의 인트론과 관련하여 정규 5' 스플라이스 부위 업스트림, 또는 정규 엑손 다음 및 정규 엑손 내의 인트론 과 관련하여 정규 5' 스플라이스 부위 다운스트림의 대체 3' 스플라이스 부위를 포함하는 대체 넌센스 매개된 RNA 붕괴 유도(NMD) 엑손을 포함하고, 이 방법은 치료제를 세포에 접촉시키는 것을 포함하고, 여기서 치료제는 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사체의 프로세싱을 조절하고, 대체 5' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 대상체의 세포에서 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 질환은 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 또는 두개내 동맥류로 이루어진 군으로부터 선택된다.
일부 구현예에서, 질환 또는 병태는 표적 단백질의 결핍된 양 또는 활성에 의해 야기된다.
일부 구현예에서, 치료제는 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준을 증가시킨다.
일부 구현예에서, 치료제는 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 치료제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 표적 단백질의 mRNA 수준 또는 발현 수준을 평가하는 것을 추가로 포함한다.
일부 구현예에서, 방법은 질환과 연관된 적어도 하나의 유전적 돌연변이에 대해 대상체의 게놈을 평가하는 것을 추가로 포함한다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 유전자좌 내에 있다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 발현과 연관된 유전자좌 내에 있다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 좌 내에 있다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 발현과 연관된 유전자좌 내에 있다.
일부 구현예에서, 대상체는 인간이다.
한 구현예에서, 대상체는 비-인간 동물이다.
일부 구현예에서, 대상체는 태아, 배아 또는 아동이다.
일부 구현예에서, 세포 또는 세포들은 생체외, 또는 생체외 조직 또는 기관에 있다.
일부 구현예에서, 치료제는 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 투여된다.
일부 구현예에서, 방법은 질환 또는 병태를 치료한다.
특정 구현예에서, 본원에 제공된 바와 같은 방법에 사용하기 위한 치료제가 본원에 기재된다.
특정 구현예에서, 본원에 제공된 바와 같은 치료제 및 약제학적으로 허용되는 부형제를 포함하는 약제학적 조성물이 본원에 기재된다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 제공되고, 방법은 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 본원에 기재된 약제학적 조성물을 투여하는 것을 포함한다.
일부 구현예에서, 방법은 대상체를 치료한다.
특정 구현예에서, 프로세싱된 mRNA 전사물로부터 NSE의 배제를 조절하고 프로세싱된 mRNA 전사체에 정규 엑손의 포함을 조절하기 위해 표적 유전자로부터 전사된 프리-mRNA 내의 표적 모티프와 상호작용하는 넌센스 매개 RNA 붕괴 엑손 (NSE) 조절 제제 또는 이 제제를 인코딩하는 바이러스 벡터를 포함하는 조성물이 본원에 기재되고, 표적 모티프는 (i) 2개의 정규 엑손 사이의 인트론 영역, (ii) 2개의 정규 엑손 중 하나, 또는 (iii) 인트론 및 정규 엑손 둘 다에 걸쳐 있는 영역에 위치하고; 여기서 NSAE는 (a) 정규 엑손의 일부만, 또는 (b) 정규 엑손 및 정규 엑손에 인접한 인트론의 적어도 일부를 포함하고; 여기서 NSAE 조절 제제는 프로세싱된 mRNA 전사체로부터 NSAE의 배제를 조절하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함를 조절하고; 표적 유전자는 PKD2 유전자이다.
일부 구현예에서, NSAE 조절 제제는 프로세싱된 mRNA 전사체로부터 NSAE의 배제를 촉진하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함을 촉진한다.
일부 구현예에서, 프로세싱된 mRNA 전사체는 표적 단백질을 인코딩하고 NSAE 조절 제제는 프리-mRNA를 함유하는 세포에서 표적 단백질의 발현을 증가시키고, 표적 단백질은 PKD2이다.
예시적인 구현예 II
특정 구현예에서, 표적 유전자로부터 전사되고 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)을 포함하는 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는 방법이 본원에 기재되어 있고, 방법은 제제 또는 이 제제를 인코딩하는 벡터를 세포에 접촉시켜, 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절하는 단계, 및 세포에서 표적 단백질의 발현을 조절하는 단계로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 단계를 포함한다.
특정 구현예에서, 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 이를 필요로 하는 대상체에서 질환 또는 병태는 발병할 가능성을 치료하거나 감소시키는 방법이 기재되며, 이는 제제 또는 벡터를 접촉시키는 단계를 포함한다. 대상체의 세포에 제제를 인코딩하고, 이에 의해 제제는 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 비-센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱된 프로세싱된 mRNA의 수준을 조절하고 대상체의 세포에서 표적 단백질의 발현을 조절하며, 표적 단백질은 PKD2 유전자에 의해 인코딩된다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 2의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 1의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 2가 기능적으로 증강, 보상, 대체 또는 기능적으로 상호작용하는 단백질의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다.
일부 구현예에서, 제제는 (a) 프리-mRNA의 표적화 부분에 결합하고; (b) NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 조절하거나; 또는 (c) (a)와 (b)의 조합이다. 일부 구현예에서, 제제는 NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 방해한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손에 근접한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 말단의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 5' 말단의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 프리-mRNA의 2개의 정규 엑손 영역 사이의 인트론 영역에 위치하고, 인트론 영역은 NMD 엑손을 함유한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손과 적어도 부분적으로 중첩된다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 업스트림 또는 다운스트림 인트론과 적어도 부분적으로 중첩된다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 5' NMD 엑손-인트론 접합부 또는 3' NMD 엑손-인트론 접합부를 포함한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손 내에 있다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함한다.
일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열을 포함한다. 일부 구현예에서, 프리-mRNA는 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 프리-mRNA는 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩된다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, ASO는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18개의 연속 핵산에 대해 적어도 약 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성인 서열을 포함한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085-88031140 내에 있다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085-88031140의 업스트림 또는 다운스트림이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085 88031140의 엑손-인트론 접합부를 포함한다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 폴리시스틴 2 또는 야생형 폴리시스틴 2이다. 일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적이다. 일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적이다.
일부 구현예에서, 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절하고 프리-mRNA로부터 NMD 엑손의 배제를 촉진함으로써, 프리-mRNA로부터 프로세싱되고 NMD 엑손이 결여된 프로세싱된 mRNA의 수준을 조절한다. 일부 구현예에서, 제제와 접촉된 세포에서 프리-mRNA로부터의 NMD 엑손의 배제는 대조군 세포에서 프리-mRNA로부터의 NMD 엑손의 배제에 비해 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 방법은 세포에서 프로세싱된 mRNA의 수준을 증가시킨다. 일부 구현예에서, 제제와 접촉된 세포에서 프로세싱된 mRNA의 수준은 대조군 세포에서 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 제제는 세포에서 표적 단백질의 발현을 증가시킨다. 일부 구현예에서, 표적 단백질의 수준은 대조군 세포에서 생산된 표적 단백질의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, NMD 엑손은 조기 종결 코돈(PTC)을 포함한다. 일부 구현예에서, 질환 또는 병태는 표적 유전자 또는 표적 단백질의 기능 상실 돌연변이와 연관된다. 일부 구현예에서, 질환 또는 병태는 표적 유전자의 반가불충분성과 연관되고, 대상체는 기능성 폴리시스틴 2를 인코딩하는 제1 대립유전자 및 폴리시스틴 2가 생산되지 않거나 감소된 수준으로 생산되는 제2 대립유전자, 또는 비기능성 폴리시스틴 2 또는 부분적 기능성 폴리시스틴 2를 인코딩하는 제2 대립유전자를 가지고 있다. 일부 구현예에서, 하나 또는 둘 모두의 대립유전자는 하이포모르프이거나 부분적으로 기능적이다. 일부 구현예에서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택된다. 일부 구현예에서, 질환 또는 병태는 PKD1 또는 PKD2 유전자의 돌연변이와 연관되며, 여기서 대상체는 제 (i) 표적 단백질은 생산되지 않거나 야생형 대립유전자에 비해 감소된 수준으로 생산되거나; 또는 (ii) 생산된 표적 단백질은 야생형 대립유전자에 비해 비기능적이거나 부분적으로 기능적인 제1 대립유전자 인코딩, 및 (iii) 표적 단백질은 야생형 대립유전자에 비해 감소된 수준으로 생산되고 생산된 표적 단백질은 야생형 대립유전자에 비해 적어도 부분적으로 기능적임; 또는 (iv) 생산된 표적 단백질은 야생형 대립유전자에 비해 부분적으로 기능적인 제2 대립유전자를 갖는다.
일부 구현예에서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택된다. 일부 구현예에서, 돌연변이는 하이포모르픽 돌연변이이다. 일부 구현예에서, 질환 또는 병태는 PKD2 유전자의 돌연변이와 연관된다. 일부 구현예에서, 질환 또는 병태는 PKD1 유전자의 돌연변이와 연관된다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 2와 상호작용하는 폴리시스틴 1 영역의 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 방해하는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 약화시키는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 감소시키는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 차단하는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 2와 상호작용하는 폴리시스틴 1 영역의 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 방해하는 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 약화시키는 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 감소시키는 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 차단하는 돌연변이이다.
일부 구현예에서, 제제는 프리-mRNA로부터 NMD 엑손의 배제를 촉진함으로써, 프리-mRNA로부터 프로세싱되고 NMD 엑손이 결여된 프로세싱된 mRNA의 수준을 조절하고 세포의 표적 단백질의 발현을 증가시킨다. 일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다. 일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 포스포로디아미데이트 모폴리노, 잠금 핵산, 펩티드 핵산, 2'-O-메틸, 2'-플루오로, 또는 2'-O-메톡시에틸 모이어티를 포함한다. 일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 적어도 하나의 변형된 당 모이어티를 포함한다. 일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다. 일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다. 일부 구현예에서, 제제가 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 프리-mRNA의 표적화 부분에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적이다.
일부 구현예에서, 표적 단백질의 프로세싱된 mRNA 수준 또는 발현 수준을 평가하는 것을 추가로 포함한다. 일부 구현예에서, 대상체는 인간이다. 한 구현예에서, 대상체는 비-인간 동물이다. 일부 구현예에서, 대상체는 태아, 배아 또는 아동이다. 일부 구현예에서, 세포는 생체 외의 것이다. 일부 구현예에서, 제제는 대상체의 척수강내 주사, 뇌실심내 주사, 복강내 주사, 근육내 주사, 피하 주사, 유리체내 또는 정맥내 주사에 의해 투여된다. 일부 구현예에서, 방법은 대상체에게 제2 치료제를 투여하는 것을 추가로 포함한다. 특정 구현예에서, 제2 치료제는 소분자이다. 일부 구현예에서, 제2 치료제는 안티센스 올리고머이다. 일부 구현예에서, 제2 치료제는 인트론 체류를 수정한다. 일부 구현예에서, 방법은 질환 또는 병태를 치료한다.
특정 구현예에서, 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고, 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는, 제제 또는 상기 제제를 인코딩하는 벡터를 포함하는 조성물로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 조성물이 본원에 기재된다. 특정 구현예에서, 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요한 대상체에서 질환 또는 병태를 치료하는, 제제 또는 상기 제제를 인코딩하는 벡터를 포함하는 조성물로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 조성물이 본원에 기재된다. 특정 구현예에서, 본원에 기재된 바와 같은 조성물; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는 약제학적 조성물이 본원에 기재된다. 특정 구현예에서, 넌센스 매개된 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하고, 프리-mRNA는 정규 5' 스플라이스 부위의 다운스트림에 대체 5' 스플라이스 부위를 포함하고, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스 부위에서 스플라이싱을 조절하여 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2이다.
일부 구현예에서, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 방지하거나 감소시킴으로써 프리-mRNA의 프로세싱을 조절한다. 일부 구현예에서, 제제는 정규 5' 스플라이스-부위에서 스플라이싱을 촉진하거나 증가시킴으로써 프리-mRNA의 프로세싱을 조절한다. 일부 구현예에서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱을 조절하는 것은 세포에서 표적 단백질의 발현을 증가시킨다. 일부 구현예에서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산된 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함한다.
다양한 구현예에서, 제제는 소분자이다. 일부 구현예에서, 제제는 폴리펩티드이다. 일부 구현예에서, 폴리펩티드는 핵산 결합 단백질이다. 일부 구현예에서, 핵산 결합 단백질은 TAL-이펙터 또는 징크 핑거 결합 도메인을 함유한다. 일부 구현예에서, 핵산 결합 단백질은 Cas 계열 단백질이다. 일부 구현예에서, 폴리펩티드는 하나 이상의 핵산 분자와 동반되거나 복합화된다. 일부 구현예에서, 제제는 프리-mRNA의 표적화 영역에 상보적인 안티센스 올리고머(ASO)이다. 일부 구현예에서, 제제는 표적 단백질을 인코딩하는 프리-mRNA의 표적화 영역에 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적이다. 일부 구현예에서, 제제는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다. 일부 구현예에서, 제제는 포스포로디아미데이트 모폴리노를 포함한다. 일부 구현예에서, 제제는 잠금 핵산을 포함한다. 일부 구현예에서, 제제는 펩티드 핵산을 포함한다. 일부 구현예에서, 제제는 2'-O-메틸을 포함한다. 일부 구현예에서, 제제는 2'-플루오로 또는 2'-O-메톡시에틸 모이어티를 포함한다. 일부 구현예에서, 제제는 적어도 하나의 변형된 당 모이어티를 포함한다. 일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다. 일부 구현예에서, 제제는 안티센스 올리고머이고, 여기서 제제는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다.
특정 구현예에서, 본원에 기재된 바와 같은 조성물에 따른 제제를 인코딩하는 핵산 분자를 포함하는 조성물이 본원에 기재된다. 일부 구현예에서, 핵산 분자는 바이러스 전달 시스템에 통합된다. 일부 구현예에서, 바이러스 전달 시스템은 아데노바이러스 연관 벡터이다. 일부 구현예에서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터이다.
특정 구현예에서, 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 방법이 본원에 기재되고, 상기 방법은 넌센스 매개 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터를 세포에 접촉시키는 것을 포함하고, 프리-mRNA는 정규 5' 스플라이스 부위의 다운스트림에 대체 5' 스플라이스 부위를 포함하고, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스 부위에서 스플라이싱을 조절하여 표적 단백질의 발현을 조절함으로써 프리-mRNA의 프로세싱을 조절하고; 표적 유전자는 PKD2이다.
일부 구현예에서, 제제는 (a) 프리-mRNA의 표적화 부분에 결합하고; (b) 대체 5' 스플라이스-부위에서 스플라이싱에 관여하는 인자의 결합을 조절하거나; 또는 (c) (a)와 (b)의 조합이다. 일부 구현예에서, 제제는 대체 5' 스플라이스-부위에서 스플라이싱에 관여하는 인자가 표적화 부분의 영역에 결합하는 것을 방해한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에 근접한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4 88036480의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480의 게놈 부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480의 게놈 부위 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480의 게놈 부위 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 정규 5' 스플라이스-부위와 대체 5' 스플라이스-부위 사이의 영역에 위치한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역에 위치한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위와 적어도 부분적으로 중첩된다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림 또는 다운스트림 영역과 적어도 부분적으로 중첩된다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역 내에 있다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 2개의 정규 엑손 사이의 인트론 영역에 위치한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 2개의 정규 엑손 중 하나에 위치한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 인트론 및 정규 엑손 모두에 걸쳐 있는 영역에 위치한다.
일부 구현예에서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다. 일부 구현예에서, 프리-mRNA의 스플라이싱의 조정은 표적 단백질을 인코딩하는 프로세싱된 mRNA의 생산을 증가시킨다. 일부 구현예에서, 제제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 표적 단백질은 단백질의 정규 동형이다. 일부 구현예에서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산된 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함한다. 일부 구현예에서, NSASS 조절제는 본원에 기재된 바와 같은 조성물이다.
특정 구현예에서, 본원에 기재된 바와 같은 조성물; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는 약제학적 조성물이 본원에 기재된다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 감소가 필요한 대상체에게 약제학적 조성물을 투여하는 것을 포함하고, 약제학적 조성물은 넌센스 매개된 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터로서, 제제는 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하고, 프리-mRNA는 정규 5' 스플라이스 부위의 다운스트림에 대체 5' 스플라이스 부위를 포함하고, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 대안적으로 스플라이싱된 mRNA의 넌센스 매개된 RNA 붕괴를 초래하고, 제제는 대체 5' 스플라이스 부위에서 스플라이싱을 조절하여 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2인, 바이러스 벡터 및 약제학적으로 허용되는 부형제를 포함한다. 특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 본원에 기재된 약제학적 조성물을 대상체에게 투여하는 단계를 포함한다.
일부 구현예에서, 질환은 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 또는 두개내 동맥류로 이루어진 군으로부터 선택된다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 2의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 1의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 2가 기능적으로 증강, 보상, 대체 또는 기능적으로 상호작용하는 단백질의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다. 일부 구현예에서, 질환 또는 병태는 표적 단백질의 결핍된 양 또는 활성에 의해 야기된다.
일부 구현예에서, 제제는 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준을 증가시킨다. 일부 구현예에서, 제제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다. 일부 구현예에서, 제제는 세포에서 표적 단백질의 발현을 증가시킨다. 일부 구현예에서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 표적 단백질의 mRNA 수준 또는 발현 수준을 평가하는 것을 추가로 포함한다. 일부 구현예에서, 방법은 질환과 연관된 적어도 하나의 유전적 돌연변이에 대해 대상체의 게놈을 평가하는 것을 추가로 포함한다. 일부 구현예에서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 유전자좌 내에 있다. 일부 구현예에서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 발현과 연관된 유전자좌 내에 있다. 일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 좌 내에 있다. 일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD1 유전자 좌 내에 있다. 일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 발현과 연관된 유전자좌 내에 있다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 2와 상호작용하는 폴리시스틴 1 영역의 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 방해하는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 약화시키는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 감소시키는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 차단하는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 2와 상호작용하는 폴리시스틴 1 영역의 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 방해하는 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 약화시키는 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 감소시키는 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 차단하는 돌연변이이다.
일부 구현예에서, 대상체는 인간이다. 한 구현예에서, 대상체는 비-인간 동물이다. 일부 구현예에서, 대상체는 태아, 배아 또는 아동이다. 일부 구현예에서, 세포 또는 세포들은 생체외, 또는 생체외 조직 또는 기관에 있다. 일부 구현예에서, 제제는 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 투여된다. 일부 구현예에서, 방법은 질환 또는 병태를 치료한다.
특정 구현예에서, 본원에 기재된 바와 같은 방법에 사용하기 위한 치료제가 본원에 기재된다. 특정 구현예에서, 본원에 기재된 바와 같은 치료제 및 약제학적으로 허용되는 부형제를 포함하는 약제학적 조성물이 본원에 기재된다. 특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되고, 방법은 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 본원에 기재된 약제학적 조성물을 투여하는 것을 포함한다. 일부 구현예에서, 방법은 대상체를 치료한다.
SEQUENCE LISTING
<110> STOKE THERAPEUTICS, INC.
<120> COMPOSITIONS FOR TREATMENT OF CONDITIONS AND DISEASES ASSOCIATED
WITH POLYCYSTIN EXPRESSION
<130> 47991-732.601
<140> PCT/US2022/015074
<141> 2022-02-03
<150> 63/145,288
<151> 2021-02-03
<160> 271
<170> PatentIn version 3.5
<210> 1
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 1
gtactttcaa agttattt 18
<210> 2
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 2
gagaggtact ttcaaagt 18
<210> 3
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 3
tgatagagag gtactttc 18
<210> 4
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 4
ttctgtgata gagaggta 18
<210> 5
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 5
caattttctg tgatagag 18
<210> 6
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 6
atgaacaatt ttctgtga 18
<210> 7
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 7
gccaaatgaa caattttc 18
<210> 8
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 8
atgaagccaa atgaacaa 18
<210> 9
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 9
aaatgatgaa gccaaatg 18
<210> 10
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 10
cattgaaatg atgaagcc 18
<210> 11
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 11
tcatgcattg aaatgatg 18
<210> 12
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 12
gatactcatg cattgaaa 18
<210> 13
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 13
ctgtcgatac tcatgcat 18
<210> 14
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 14
aggtcctgtc gatactca 18
<210> 15
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 15
aaagcaggtc ctgtcgat 18
<210> 16
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 16
aatgcaaagc aggtcctg 18
<210> 17
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 17
tgttaaatgc aaagcagg 18
<210> 18
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 18
cacagtgtta aatgcaaa 18
<210> 19
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 19
tctcacacag tgttaaat 18
<210> 20
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 20
ttacgtctca cacagtgt 18
<210> 21
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 21
ataacttacg tctcacac 18
<210> 22
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 22
tcaccataac ttacgtct 18
<210> 23
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 23
acaactcacc ataactta 18
<210> 24
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 24
ttctaacaac tcaccata 18
<210> 25
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 25
gtaacttcta acaactca 18
<210> 26
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 26
gaacagtaac ttctaaca 18
<210> 27
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 27
agtaggaaca gtaacttc 18
<210> 28
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 28
ttgagagtag gaacagta 18
<210> 29
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 29
accccctttg agagtagg 18
<210> 30
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 30
agtttacccc ctttgaga 18
<210> 31
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 31
atgttagttt accccctt 18
<210> 32
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 32
tctcaatgtt agtttacc 18
<210> 33
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 33
aaagttctca atgttagt 18
<210> 34
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 34
caggcaaagt tctcaatg 18
<210> 35
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 35
aggcacaggc aaagttct 18
<210> 36
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 36
gtgcaaggca caggcaaa 18
<210> 37
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 37
gcacagtgca aggcacag 18
<210> 38
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 38
actcagcaca gtgcaagg 18
<210> 39
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 39
gaaacactca gcacagtg 18
<210> 40
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 40
gatatgaaac actcagca 18
<210> 41
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 41
ggtaagatat gaaacact 18
<210> 42
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 42
aataaggtaa gatatgaa 18
<210> 43
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 43
aattaaataa ggtaagat 18
<210> 44
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 44
atagaaatta aataaggt 18
<210> 45
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 45
agactataga aattaaat 18
<210> 46
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 46
gagttagact atagaaat 18
<210> 47
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 47
ttatagagtt agactata 18
<210> 48
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 48
ttaccttata gagttaga 18
<210> 49
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 49
agtacttacc ttatagag 18
<210> 50
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 50
ataaatcgaa ccatcgta 18
<210> 51
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 51
aaatcataaa tcgaacca 18
<210> 52
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 52
ttgaaaaatc ataaatcg 18
<210> 53
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 53
tgaagttgaa aaatcata 18
<210> 54
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 54
caccatgaag ttgaaaaa 18
<210> 55
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 55
cacatcacca tgaagttg 18
<210> 56
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 56
actttcacat caccatga 18
<210> 57
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 57
gtatcacttt cacatcac 18
<210> 58
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 58
aatgtgtatc actttcac 18
<210> 59
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 59
tatagaatgt gtatcact 18
<210> 60
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 60
gtttctatag aatgtgta 18
<210> 61
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 61
gtgtggtttc tatagaat 18
<210> 62
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 62
tgaaagtgtg gtttctat 18
<210> 63
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 63
aaaattgaaa gtgtggtt 18
<210> 64
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 64
aattcaaaat tgaaagtg 18
<210> 65
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 65
accaaaattc aaaattga 18
<210> 66
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 66
aaaagaccaa aattcaaa 18
<210> 67
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 67
ctggaaaaag accaaaat 18
<210> 68
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 68
gtagcctgga aaaagacc 18
<210> 69
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 69
gtatggtagc ctggaaaa 18
<210> 70
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 70
ttagagtatg gtagcctg 18
<210> 71
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 71
tctttagagt atggtagc 18
<210> 72
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 72
ctctatcttt agagtatg 18
<210> 73
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 73
tgtggctcta tctttaga 18
<210> 74
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 74
ggatctgtgg ctctatct 18
<210> 75
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 75
gactgggatc tgtggctc 18
<210> 76
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 76
acatggctga ctgggatc 18
<210> 77
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 77
taatcacatg gctgactg 18
<210> 78
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 78
cctcataatc acatggct 18
<210> 79
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 79
taccctcata atcacatg 18
<210> 80
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 80
tcgcttaccc tcataatc 18
<210> 81
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 81
attggtcgct taccctca 18
<210> 82
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 82
agagtattgg tcgcttac 18
<210> 83
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 83
actgtagagt attggtcg 18
<210> 84
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 84
aatacactgt agagtatt 18
<210> 85
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 85
aatacaatac actgtaga 18
<210> 86
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 86
ctggcaatac aatacact 18
<210> 87
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 87
accatctggc aatacaat 18
<210> 88
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 88
gcaaaaccat ctggcaat 18
<210> 89
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 89
gttgggcaaa accatctg 18
<210> 90
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 90
ggctagttgg gcaaaacc 18
<210> 91
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 91
cattaggcta gttgggca 18
<210> 92
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 92
acttacatta ggctagtt 18
<210> 93
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 93
agaatactta cattaggc 18
<210> 94
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 94
tgtttagaat acttacat 18
<210> 95
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 95
aaacatgttt agaatact 18
<210> 96
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 96
accttaaaca tgtttaga 18
<210> 97
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 97
ggcctacctt aaacatgt 18
<210> 98
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 98
agcctggcct accttaaa 18
<210> 99
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 99
agcttagcct ggcctacc 18
<210> 100
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 100
tttcttcccg gcgcccgc 18
<210> 101
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 101
cctttcttcc cggcgccc 18
<210> 102
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 102
ttcctttctt cccggcgc 18
<210> 103
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 103
tgttcctttc ttcccggc 18
<210> 104
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 104
catgttcctt tcttcccg 18
<210> 105
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 105
gccatgttcc tttcttcc 18
<210> 106
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 106
gagccatgtt cctttctt 18
<210> 107
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 107
aggagccatg ttcctttc 18
<210> 108
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 108
tcaggagcca tgttcctt 18
<210> 109
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 109
cctcaggagc catgttcc 18
<210> 110
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 110
cgcctcagga gccatgtt 18
<210> 111
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 111
tgcgcctcag gagccatg 18
<210> 112
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 112
tgtgcgcctc aggagcca 18
<210> 113
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 113
ctgtgcgcct caggagcc 18
<210> 114
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 114
guacuuucaa aguuauuu 18
<210> 115
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 115
gagagguacu uucaaagu 18
<210> 116
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 116
ugauagagag guacuuuc 18
<210> 117
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 117
uucugugaua gagaggua 18
<210> 118
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 118
caauuuucug ugauagag 18
<210> 119
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 119
augaacaauu uucuguga 18
<210> 120
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 120
gccaaaugaa caauuuuc 18
<210> 121
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 121
augaagccaa augaacaa 18
<210> 122
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 122
aaaugaugaa gccaaaug 18
<210> 123
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 123
cauugaaaug augaagcc 18
<210> 124
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 124
ucaugcauug aaaugaug 18
<210> 125
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 125
gauacucaug cauugaaa 18
<210> 126
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 126
cugucgauac ucaugcau 18
<210> 127
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 127
agguccuguc gauacuca 18
<210> 128
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 128
aaagcagguc cugucgau 18
<210> 129
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 129
aaugcaaagc agguccug 18
<210> 130
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 130
uguuaaaugc aaagcagg 18
<210> 131
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 131
cacaguguua aaugcaaa 18
<210> 132
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 132
ucucacacag uguuaaau 18
<210> 133
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 133
uuacgucuca cacagugu 18
<210> 134
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 134
auaacuuacg ucucacac 18
<210> 135
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 135
ucaccauaac uuacgucu 18
<210> 136
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 136
acaacucacc auaacuua 18
<210> 137
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 137
uucuaacaac ucaccaua 18
<210> 138
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 138
guaacuucua acaacuca 18
<210> 139
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 139
gaacaguaac uucuaaca 18
<210> 140
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 140
aguaggaaca guaacuuc 18
<210> 141
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 141
uugagaguag gaacagua 18
<210> 142
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 142
acccccuuug agaguagg 18
<210> 143
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 143
aguuuacccc cuuugaga 18
<210> 144
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 144
auguuaguuu acccccuu 18
<210> 145
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 145
ucucaauguu aguuuacc 18
<210> 146
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 146
aaaguucuca auguuagu 18
<210> 147
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 147
caggcaaagu ucucaaug 18
<210> 148
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 148
aggcacaggc aaaguucu 18
<210> 149
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 149
gugcaaggca caggcaaa 18
<210> 150
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 150
gcacagugca aggcacag 18
<210> 151
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 151
acucagcaca gugcaagg 18
<210> 152
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 152
gaaacacuca gcacagug 18
<210> 153
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 153
gauaugaaac acucagca 18
<210> 154
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 154
gguaagauau gaaacacu 18
<210> 155
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 155
aauaagguaa gauaugaa 18
<210> 156
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 156
aauuaaauaa gguaagau 18
<210> 157
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 157
auagaaauua aauaaggu 18
<210> 158
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 158
agacuauaga aauuaaau 18
<210> 159
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 159
gaguuagacu auagaaau 18
<210> 160
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 160
uuauagaguu agacuaua 18
<210> 161
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 161
uuaccuuaua gaguuaga 18
<210> 162
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 162
aguacuuacc uuauagag 18
<210> 163
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 163
auaaaucgaa ccaucgua 18
<210> 164
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 164
aaaucauaaa ucgaacca 18
<210> 165
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 165
uugaaaaauc auaaaucg 18
<210> 166
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 166
ugaaguugaa aaaucaua 18
<210> 167
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 167
caccaugaag uugaaaaa 18
<210> 168
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 168
cacaucacca ugaaguug 18
<210> 169
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 169
acuuucacau caccauga 18
<210> 170
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 170
guaucacuuu cacaucac 18
<210> 171
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 171
aauguguauc acuuucac 18
<210> 172
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 172
uauagaaugu guaucacu 18
<210> 173
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 173
guuucuauag aaugugua 18
<210> 174
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 174
gugugguuuc uauagaau 18
<210> 175
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 175
ugaaagugug guuucuau 18
<210> 176
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 176
aaaauugaaa gugugguu 18
<210> 177
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 177
aauucaaaau ugaaagug 18
<210> 178
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 178
accaaaauuc aaaauuga 18
<210> 179
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 179
aaaagaccaa aauucaaa 18
<210> 180
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 180
cuggaaaaag accaaaau 18
<210> 181
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 181
guagccugga aaaagacc 18
<210> 182
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 182
guaugguagc cuggaaaa 18
<210> 183
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 183
uuagaguaug guagccug 18
<210> 184
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 184
ucuuuagagu augguagc 18
<210> 185
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 185
cucuaucuuu agaguaug 18
<210> 186
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 186
uguggcucua ucuuuaga 18
<210> 187
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 187
ggaucugugg cucuaucu 18
<210> 188
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 188
gacugggauc uguggcuc 18
<210> 189
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 189
acauggcuga cugggauc 18
<210> 190
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 190
uaaucacaug gcugacug 18
<210> 191
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 191
ccucauaauc acauggcu 18
<210> 192
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 192
uacccucaua aucacaug 18
<210> 193
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 193
ucgcuuaccc ucauaauc 18
<210> 194
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 194
auuggucgcu uacccuca 18
<210> 195
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 195
agaguauugg ucgcuuac 18
<210> 196
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 196
acuguagagu auuggucg 18
<210> 197
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 197
aauacacugu agaguauu 18
<210> 198
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 198
aauacaauac acuguaga 18
<210> 199
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 199
cuggcaauac aauacacu 18
<210> 200
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 200
accaucuggc aauacaau 18
<210> 201
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 201
gcaaaaccau cuggcaau 18
<210> 202
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 202
guugggcaaa accaucug 18
<210> 203
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 203
ggcuaguugg gcaaaacc 18
<210> 204
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 204
cauuaggcua guugggca 18
<210> 205
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 205
acuuacauua ggcuaguu 18
<210> 206
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 206
agaauacuua cauuaggc 18
<210> 207
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 207
uguuuagaau acuuacau 18
<210> 208
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 208
aaacauguuu agaauacu 18
<210> 209
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 209
accuuaaaca uguuuaga 18
<210> 210
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 210
ggccuaccuu aaacaugu 18
<210> 211
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 211
agccuggccu accuuaaa 18
<210> 212
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 212
agcuuagccu ggccuacc 18
<210> 213
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 213
uuucuucccg gcgcccgc 18
<210> 214
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 214
ccuuucuucc cggcgccc 18
<210> 215
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 215
uuccuuucuu cccggcgc 18
<210> 216
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 216
uguuccuuuc uucccggc 18
<210> 217
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 217
cauguuccuu ucuucccg 18
<210> 218
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 218
gccauguucc uuucuucc 18
<210> 219
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 219
gagccauguu ccuuucuu 18
<210> 220
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 220
aggagccaug uuccuuuc 18
<210> 221
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 221
ucaggagcca uguuccuu 18
<210> 222
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 222
ccucaggagc cauguucc 18
<210> 223
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 223
cgccucagga gccauguu 18
<210> 224
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 224
ugcgccucag gagccaug 18
<210> 225
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 225
ugugcgccuc aggagcca 18
<210> 226
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 226
cugugcgccu caggagcc 18
<210> 227
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> misc_feature
<222> (1)..(3)
<223> This region may encompass 1-3 nucleotides
<220>
<221> modified_base
<222> (4)..(10)
<223> a, c, g, or u
<220>
<221> misc_feature
<222> (4)..(10)
<223> This region may encompass 1-7 nucleotides
<220>
<221> misc_feature
<222> (11)..(13)
<223> This region may encompass 1-3 nucleotides
<220>
<221> modified_base
<222> (14)..(20)
<223> a, c, g, or u
<220>
<221> misc_feature
<222> (14)..(20)
<223> This region may encompass 1-7 nucleotides
<220>
<221> misc_feature
<222> (21)..(23)
<223> This region may encompass 1-3 nucleotides
<220>
<221> modified_base
<222> (24)..(30)
<223> a, c, g, or u
<220>
<221> misc_feature
<222> (24)..(30)
<223> This region may encompass 1-7 nucleotides
<220>
<221> misc_feature
<222> (31)..(33)
<223> This region may encompass 1-3 nucleotides
<220>
<223> See specification as filed for detailed description of
substitutions and preferred embodiments
<400> 227
gggnnnnnnn gggnnnnnnn gggnnnnnnn ggg 33
<210> 228
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 228
gggagccggg cuggggcuca cacggggg 28
<210> 229
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 229
aauuuuugga g 11
<210> 230
<211> 11
<212> RNA
<213> Homo sapiens
<400> 230
aauuugucua g 11
<210> 231
<211> 32765
<212> DNA
<213> Homo sapiens
<400> 231
aggcggcggc gggcgccggg aagaaaggaa catggctcct gaggcgcaca gcgccgagcg 60
cggcgccgcg cacccgcgcg ccggacgcca gtgaccgcga tggtgaactc cagtcgcgtg 120
cagcctcagc agcccgggga cgccaagcgg ccgcccgcgc cccgcgcgcc ggacccgggc 180
cggctgatgg ctggctgcgc ggccgtgggc gccagcctcg ccgccccggg cggcctctgc 240
gagcagcggg gcctggagat cgagatgcag cgcatccggc aggcggccgc gcgggacccc 300
ccggccggag ccgcggcctc cccttctcct ccgctctcgt cgtgctcccg gcaggcgtgg 360
agccgcgata accccggctt cgaggccgag gaggaggagg aggaggtgga aggggaagaa 420
ggcggaatgg tggtggagat ggacgtagag tggcgcccgg gcagccggag gtcggccgcc 480
tcctcggccg tgagctccgt gggcgcgcgg agccgggggc ttgggggcta ccacggcgcg 540
ggccacccga gcgggaggcg gcgccggcga gaggaccagg gcccgccgtg ccccagccca 600
gtcggcggcg gggacccgct gcatcgccac ctccccctgg aagggcagcc gccccgagtg 660
gcctgggcgg agaggctggt tcgcgggctg cgaggtaaga gcgcgcgacc cgcagcggca 720
gatgcacgaa ccagaacggc cggcgccggc cggggccatc gcccgctgcg gcagctcccc 780
gggctccatc tcgcatcccc tctgcgttcc gcctcccttg gaagcgcatt ccccacctcc 840
gctagtgctg ccctatttcc ggtacccagc gcggaattcc actgctcttt tgttggtgca 900
tatttattgg atacctcctt cttcaggata tgtcaccata gtctttttta ctgaaaatta 960
gtgaaagcct aattagagtg aaagagtaca tctgggtttt gttttttttt ttcttgtaga 1020
ggaaaaaatg aacattactt gtgtaactga tggtagttgc aactgcatat ttgccaatgt 1080
cacaaaatct aaaggaaaat gttatagtca cccgtggttt ccttcttgcc tggacactcc 1140
attgtcccgg gctgaaaagg gtagcagtac agtgcatata atgtcaagtt gtgggaggag 1200
tgtggcagat tgtcattggt gcattttttt ggtgatgtgt gtggttgttt tgaggagtgg 1260
gagctgttaa gaacaccaca aatagaataa aataatatcg tgaagttatt tggccgtttc 1320
taattctaga catttttcta aaaacagttg caaaggaaag attacattgt tttaaaaaaa 1380
tttgaagtat gtttttaaat aactaaatta atgttctttg aaattccacc aaaatgatga 1440
agtcaccaga tagcagctga taaatgtgtc tgagcccagt gcgcccagct ctacaaaagg 1500
cagaagagga attttcaaat ttgccagtgc ccagtaagag gacatgaatt ttctagtacc 1560
agaggaaatt ctctttttac aaattttgtc agaggtatcc ttgggaaagt atttcatttg 1620
cttttaccct ccaaattatt ttaatctata tttttaagag tttccattct cagttgagtt 1680
tttcttgttc ttctccttct gtcagttttg aaagtcttgc acaaaaacaa tccaggtgtt 1740
gttacagcag tgtgattaaa accaggtcag gcctacactg aaatcccagt tccaccactc 1800
attagctgta cgaccttgag caagttactt atcctctctg atacccaatt tttggatttt 1860
tttttttttt aaagagatga tcataacgct taggacttga ctctttggga gaattaagtg 1920
agttaagaca taaaatgtgc agcatgtatt tgtcatgtta ttagcgcttc agaaatataa 1980
atgtaaacat tttggtactt cgtttatgga gattcttata ctagttaatt ttattaaaag 2040
catgatgggg aacagaagat ccttttcgga taacctgtgt gagtaaatta ataaaacact 2100
aacacttttt aagattcaaa actggattaa ttatgttatt ttacaccatt taaaatgtgc 2160
atttaaaaaa tattcactga agtgagagag aagttccttt taagttaata aataatggta 2220
agttgcatga tccttttaac tcagtttaag catttgataa cacccctaac cttgtttgaa 2280
taaactcaat aacagaatat agagaaataa aatatatatt tcatatgagt atgtatgtaa 2340
atttatttct tttaaaggaa aatttcagga aacaaaatga ataagctcat agtcataaaa 2400
cctctagcca aagtgtgtca atggtctgat ttgtaggaga gcagactcag gaatcgggaa 2460
tttttttttt ttttttaaga gtcggggttt cactctgtca ctgaggctgg agtgcgggga 2520
agcaaacgta gctcactgcg gcctcaaact cctgggctca agctgccctc ccacctcagc 2580
ttcccaagta gttgggatta caggtgcaag ctgctgctcc tagctgaaaa gttttaatta 2640
tataaaatgt ttaaataaat tgttattcct ttcttttatg aagaaatata attgatattc 2700
ttgtcactta ttaaataagc aacattttaa aatgtttagc acctactgtg aagatagcac 2760
tgtgctagct gctatgaata aactagaata gcatatcact gttttcctat ggacaaaaac 2820
ccagaaatgt aaaataaata gccatgaatg ggttgagatt ccccctgccc cctttggata 2880
ctgatgacag aaatcttata tgcactatgt aagcagtgcc ctaggatcag aacagaaagt 2940
aacttgcaat ttttaaaggt gggagaaatg actgaagttt ggagtggtca ggagtttccc 3000
tggaagtctc ttgcctttgt gactttgtat agctccctca aactacctga gcctgagctc 3060
ctcatttata aaatggaaga attgaaccta gcttccaagg tcctttctag cttcaccatg 3120
ctctggtctg ttgtttaatg acatgaatcc aagatggaca acaaatggtc gattttgctc 3180
cttctacagt aaatagatct atcttcttag cagaagtaaa atagtaaaga aagaagacat 3240
gtttgaggcc tgttgaggcc tgtttgctgt atgcattgta tctaatcaag gaattgagaa 3300
tgtagcccta aatattagga aggagttgaa agtttctgag caggaacaga acatgctgaa 3360
aggaaattgt gtcagcagca tggtgtacag gagagcttgg cagagagaaa ggaggcaaga 3420
agacctgtgg gaggcagcca gtaaggaggt gaagagggcc tggaccaaag gaagccaagg 3480
atgaccgaaa gatttaaaga tgaagcccag atttaaaagt atcctcaagt atttgtttat 3540
tcttttctta gcaaattctt tttagtacaa agataaaata tggcactctg agtcataaaa 3600
ttttctgaat ttcagaagtt gaatgttttt ctgaatgtat caacctgtta aagtcagttc 3660
ctgtttgtta ttttaggcgt atattcttgg gctttttttt ttttttccta gagaaactat 3720
gaagtactag ctgtgcaagt cagggtgggc taagctgcta aaacagatac ctccctcccc 3780
ttcaataccc tgaagaacaa gaagttaatt ttttgctcgt gtaacatttt agagagggta 3840
ttccaggttg aatacctgga ataatgaatg aaataataag tcgactctta tttctcctaa 3900
aataattgga tcttgacatt gaaattggtg tgctgattgt atttaataag tgacctccaa 3960
tgcagttatt tcattttgcc atactttatg taatttttat tttttctgcc ttccctttcg 4020
atgtctaaag ggaagcataa ttagttattg gaaaggttat tgagacttaa aaaaagattt 4080
gaacatggct ttggttgatg ctaccacaca gaaactgcaa acatccaact caccgctctt 4140
agttgctgtt catgatagtc tatgcacagt gactgatgaa tttagcctgt cttgaggctt 4200
cagaacttag tcttatgtca tcacgagcag agctttatcc taaattacag gttttcaatg 4260
gggggggggg ggaggggcag ttttgcccct caggggacat ttggcaatct ctggagacat 4320
ttttgattgt catacctggg gggatgcccc tggcatctcc tgggttgagg ttaaggatgc 4380
tgctaatcta caatgcacag tacagccacc ccacacacac acactacaaa gcattctccc 4440
acccaaattg ccaggagtga ggactttgag aaaccctgcc ctagactgtt aaattcaaaa 4500
ggaaataatg gtttattgct cacagtgtgc caggcactgt gttaaactcc ttatattcat 4560
agttttgttt ttatcctcac aacaacctgt gaagaaagaa ctctcatccg tcaccacttt 4620
actgttgagg gcactaagcc ttctaaaggt taaatgactt gcccagggcc gcaactatta 4680
gatgttgcag tcaggattta attccaggca ctttgtgttc aaagtgtttc tcatccactg 4740
tgctatatgc cagtagtgcc caaacctaac tttagccagc aattgtctgc atctcttcag 4800
tttatgaaca tttatttatt aggacatgca ggataatcat accaacacag tccgtgtatc 4860
cagaattcta attgatctag ggagtgggag agcctgcctc tctatttttt ttaaattggt 4920
gtgaaatata cataacataa aattggccat tttaaccatt ttaagtatat aattgagtga 4980
cattaggtag atttattata ttatgtaaat ggacttaaca caatttattt ccagaacttt 5040
tttatcatcc caaacagaaa ctctgtactc attaaacagt aactccctgt ttccccactc 5100
ccccttgccc cagacgctag taacctccat tctacttccc ctttctgtga gtctccctgt 5160
tgtagctacc tgatgtaagt gaaatcagac catgtttgat cttttgtgtc tggcttattc 5220
acttagcata gtattttcaa ggtttatcca tgcgtgcaaa ttcccttctt ttttatgacg 5280
aaatactatt taattgtgtg tgtacatgtg cacacacaat gaaatactat ttcatcataa 5340
aaaggaagtt tgtacacata tatacacaca caccaaattt tgtttatcca ttcatcagtt 5400
catgggcatt tgcggttttt ttccaccttt cgactgttgt gactttccgt ttatttttaa 5460
tctgaacttt actccatcac ttcctccctt tcctttttta ttcgcaccat aattttgaac 5520
aagcagactt tgtattttca ttactctggg gatttttttg agggaggctt gctacccttt 5580
ggggttgtgg taaggttgtg ccagtaacag aattcatgca gtaaaaaaca ttcatgggac 5640
tttcttttgt gataggtact agggatgcag agatgaataa tacaaggtct cgaccttcaa 5700
ggagctcagg gtttagtagg gaaaacagag gtataagtaa gtcattgcaa tgccaggtcc 5760
cagatatggg aggattccag caaagagagg ataaggccag gcacagccgc tcatgcctat 5820
agtcccaaca ctttgggaag ctgagatggg aggatcactt aagcccagca gttcaaggct 5880
accctgggca acatagtgag tggcaaaaaa tacaaaaatt agccaggcag ggtggcacat 5940
gcctgtggtc ccagttattt gggagtttga ggtgggagaa tcacctgagc ctgggagatt 6000
gaggctgcag tgagctgtga tcacgccact gcactccagc ctgggtgaca cagtgagagg 6060
tgagagcctg tatctaaaaa aaaaaaaaag agaggatcag atttacctgg agaggtcaga 6120
gaaggtttcc agagggagta aaacttgagc ttcattttga agaatgagag gggaatacaa 6180
ggagggaaaa ataataggaa caagacctgt tcctgttaca gcaaacctgt aactcccacc 6240
atggaatggg cacgttttcc tgtagacatt tggagccagt gtgggcttca agcctagggg 6300
gctgatatga tcatttgtca atctgaagat gactcttgga acaacgtaga ggatagggtg 6360
aggtgggtag gctggtggct gacagactag gtcaggagag ggctgaccaa gaggaggagg 6420
ggtgacgagg gctggaacta aggcatatga gctgggatgg aaagaagcta gatagaaagg 6480
aaacaaaaac catcagaact gtggaaccaa ctccatggga gggataagaa gagggcctat 6540
tctagggtga aacccaaatt tctggcatgg taccattaac ccaaacagaa agaggagatt 6600
tccagagaaa gaaaagcaaa ttttgcggga ggtgagtgtg agctgtctag agaatatgca 6660
ggtagaacta catgttaact gtaacatata cttgtctgca cctcaggaga tggctgatta 6720
agaattcagg attcaggcca ggcacggtgg cacacgcctt taatcccagc tgcttaagag 6780
actggggcgg gaggattgct tgagcctggg aatccgagat cagcctgggc aacatagcaa 6840
gacactgtct ctaaaaaaaa aaaaaaattc aagattctgg agtcaatatt acttaaggta 6900
gcaactgtct attctataga aaatggacaa atatagataa aaagccactt ccctttctaa 6960
aagtgtccct gcaattcaag tgaatactag gaaggattgt gttcattctt ctaaacaaga 7020
ctcacatgta tcttagcaca aaaagaggat tcttttatga tacaaatgca ctgagaattt 7080
ggtcaggcta tcacaatgaa ctgatagttc agatggattt gagtctttat accactctgg 7140
aatctggacc aactgggcct cctaaggcca ttttgcagat ctgggcttgt ttctgaagct 7200
acagacaggc ctcttccaag cactctaagt gctccacaaa taatatttct gtttcccaga 7260
acaaccccac aaaaaggtac tcttactcca tttttagatg aggaagtgga ggctcatgat 7320
gtcaggtaag ctttctcagc tcccaagtgg ttaagccctc agtttaatgt catttgactc 7380
cagagcccta tgttgcacca tgccttgata ataggccata tgggtttcat gtatttcaga 7440
tggggaaggt tagtgtgagg tgaaagatac acaattaacc ttttaaccat ggaactgaaa 7500
tatttacaga tgaagtgata caatagctgg aattaattcc aaaataattg gggtggtact 7560
ggtccatggc ctgttaggaa ctgggccgca gagcaggagg tgagcagcag gctagtgagc 7620
attgctaccc cctatcatat cagcagtggc atcagatggg tgaggatgta aatgaactag 7680
gattggcatt gagttgatat tgttggatct aggtgataga tttatcatta taatattctc 7740
tctttgtgat atttctgata ttttctaaaa taaaaagttg tagttattta tttatttaga 7800
cggagtttca ctcttttgcc caggttggag tgcagtggtg tgatctcggc tcactgtagc 7860
ctccgcctcc cgggttcaag cgattctcct gcctcagcct cccgagtagc tgggactaca 7920
gcctcccgag tagctcacca ccacacccag ctaacttttg tatttttagt agagaggagg 7980
tttcaccatg ttagataggc tggtctcaaa ctcctgacct caggtgatcc acccacctcg 8040
gcctcccaga gtgctgggat tacaggcgtg agccagtgtg cccagccaat aaaaagtttt 8100
tgaaaggatt tagataaaat agttggggaa atggcatttt tgttcaaagc caattattta 8160
tgtttggaat atcttttgtg cttggagttc tccattacag agttccccag tgttcctatt 8220
aataagtaac attgagcaga ggaatgcact gtttagatca gcagtcccca acctttttgg 8280
caccagggac cggcttcatg gaagacaatt tttccacaga cctggggtag gaagtgtttg 8340
gggatgaaac tgttccacct cagatcatca ggcattagtg agattctcat aaggagcagg 8400
caatctagat tcttcacatg cgcagttcac aatagggttc tcactcctgt gagaatctaa 8460
tgccacccct gatctgacag gaggcggagc tcgggcggta atgctcactt gcctgcggct 8520
cacctcctgc tgtggggccc ggttcctaac aggccatgga ccagtacccg tctgcagcct 8580
ggggactggg gaccctgctt tagatgatgt actctggctt tgcattctgg cattagctaa 8640
gcaccctctt aaaggaaatt gggtctatac tctcagtccg tgttctccct aacacctgga 8700
aacattgaat accttcaatg ctgggaagtt aactcccacc acaactagaa cagctatggg 8760
aaagacaaca gttgattttg aagagtgtca ccaatttgca catgattcca tccttaacca 8820
ttcttatcct atcagctctg ccaaacatgg agaatagttg gctgcaggac agctattttt 8880
cctacttgta gatgcaacta tttctcaccc accaggatgt aaaaggtccc tgtaccctaa 8940
gattggtcct acatacacac ccaatgggaa aatgagatga aaaatttaaa gcagtaaata 9000
tttgaggaag tagatagagt aatttagaaa aagaaaatac acagggccaa gcacagtggc 9060
tcacatctgt aatcccagca ctttgagagg ccaaggtgag aggattgctt gagctcagga 9120
gtttgaggcc agcctaggca atgtagtgag accccacctc tacaaaaaat taaaaactta 9180
gttgggcttg gtagtatgta cctgtagttt aagaaacttg ggaggctgag ctgaggcagg 9240
aggattgttt gagcccgggt ggtcaaggct gcagtgggcc atgattgtgc cagagtactc 9300
cagcctgggt gatagagtga gactctgtct caaacaaaaa aaaaaacaga gacagaaaaa 9360
aagaaagaaa atatatggat gtatatcata taaaaatata aataagggag gccaagtgca 9420
gtggcatgcc tgtaatccca gcactttggg aggctgaagc aggaggatca cttgaggccg 9480
agaattcgag accagcctgg gcaacgtatt gagacctcat ctctgcaaaa aatcaaaaaa 9540
tgaggcggaa ggatggcttg agcccaggag atcaagcctt cagtgagctg tgatcgtacc 9600
actacactcc aggctgggta acagagagag accctgcctc aagataaata aattcataca 9660
tacatacata catacgtaca tacatacata cataagaaga cttgtttctt tccatttgca 9720
atgtttcatt caaaggctag aattaaattg ccgtaggcca tcacaagttt agcttgaata 9780
ttattatttt ttcaagatgg agtctcactc tgtcacccag gctggagtgc agtggtgtga 9840
ttttggctca ctgcaacctc tgtctcccgg gttcaaccga ttcttctgcc tcagcctccc 9900
atgtagctgg gattacaggc gcccgccacc acacctggct aagttttgta tttttagtag 9960
agacagggtt tcaccatgtt ggccagactg gtcttgaact cctgacctca agtgatctac 10020
ccgcctcacc ctcccaaagt gctgggatta taggcttgag ccactgcacc cagcctagct 10080
tgaagaaaat ttgataggag tttgtttttt tctatttata ggccaagcaa taccacgtat 10140
aaatattaag aatcatggct gttccttagt gcctagttgt ttataaacca tgggaaagaa 10200
tgaaatcatt gaccaaatga gacagggtaa cagtcttccc tgggagtaaa gagactagca 10260
gtctctattg acatatattt taggcctggc ctccaaaata aatttaccca aagaagtgat 10320
gtatttgtgt ccagggctac cgagcctaat ctttggctgc ctctgtgtta ttctaagttg 10380
taattttcca tgtcatctaa atttgtaata attctttaat atgatagtgt ttcagtgaac 10440
aaacattctg cttgctgcat ttcttctgag tgagtaattc cctgacaact accagatctt 10500
ggcagaagca aagttggtca taagttatgc tccactctca gtgctggtga aacgtatgat 10560
gcgtaacaca gtgtttttga attcagtgct gattttccta aaggacattt ggaaggaaaa 10620
aagaaaagga aaggaaatac ccaaattcag gaatagaact tacatattat tataagactt 10680
aaaaaataca tgaacactaa tgatgaactc atttcttcga agtaaaaggc cttatgctat 10740
tttttcccat ttccctatgt ggcttgattg tggcgaaagt ggctgtgtga gtttccatta 10800
ttgaaggagt taaggtctgt ggaatcaaag catgagacaa catgcaagga ccaggttggt 10860
ttccatttaa cagccaacct aatctaactg aaaggattga gaggtttgtc ttttttggaa 10920
agtgttaagg ttcttccaag taaccagcaa tgtgacttta ccacactgtt cattaacggg 10980
gctttggatg gccaccatgt ctgctgctgg ctgagtccaa aactgcggtc actctctcca 11040
gcaagctcat ggagggttac gtcatcttca ctcagccagc ccaacgcttt ttccatctgc 11100
taaaatgtag aacatggttg ttgattctac tctttctaca aagaaagaga gggaacatgg 11160
atgagttgct gcttttaaag attatatgtt aattgctgtt ttaaaaatct gctcagctaa 11220
gcacgcttag tgtaatcagt caccatggag ttttttaata ggacagcttc tgctcttaca 11280
gagcagagtt tttatgccag taggttagaa gcataacatg tttctatatt gaagtgattc 11340
tccaacaagg acttcttttc atcaggggtg acctaaaagt tattacttga aatataatta 11400
catcatgttc ttaactgggt ttagtagtag gataattaca aggttgtatc cacctcaaat 11460
aggaagaact gataagtttt gcacaattat ttaactcctc tgttaggcct tccttatttc 11520
ctgttctctt tttaaaattt gactaagata ttgctaatgg gcttgggagc ctataaaatg 11580
atcagaattg ttgccttatg ttttgcatgt ttggggtaac attggagcca gatgtactct 11640
taaataaaag gtaggcctac aaaaccagtt tctcagttgc attcaaaatg tgattaaaaa 11700
aaaaaaaagg agaatctccc ttataggtga actttttaat ttgtgcttta ttttcccttt 11760
tgccattcat gagatttctt aaataaaatg atatcttttc ttttcttcat tattatttta 11820
aaggtctctg gggaacaaga ctcatggagg aaagcagcac taaccgagag aaatacctta 11880
aaagtgtttt acgggaactg gtcacatacc tcctttttct catagtcttg tgcatctgta 11940
agtagaatat ttccttgcac taatgggaaa gttttgaaaa gatttgacct atccaaatca 12000
taattaaaag gaagtgtgta tgcaccagag gggcaactgg gaagttacct tcttaccttt 12060
gtttttaatt ctaatatttt tatttgggca tttgtttatt gactatcttc ctatggtaga 12120
atgcaagctt tataagagaa gggacgtgat ttgttctctg ctgtaccccc atttcccaaa 12180
actgcagatg gcaacagaag gctctgaaaa atatataaga aagaattttt ctaattgtga 12240
ctaaattgtg accaaatgct aagtgactgt ggacttgcgt ttaacacagg acgggagagg 12300
caaagagttc aattccaatt tagaatttgg tcaagttctc ttctgcactc tggtaaacat 12360
taattaaaaa tcagcattat ctgaccagcc agttcatcgt cagtggtggt gattttcact 12420
atgagatacg cgtggcaact tgccagacac caagaaacca agttagagga tttttgtatt 12480
agattcctta acaatgaata cagtatcacc attattacag tatcatcatt attgtcatac 12540
tattattata tcagttaaca taaagtctgc ataagaattg tttccagaaa aatgactttc 12600
caaatttaac tttcaggaaa tacaaataat gctactaata ttgcttttat tggcgtatac 12660
atgtaatatc cccttctttt ggatttggat atgttgtgtc attgcctcat tttaattcat 12720
tatttcttct caatctttaa taattgctgg acttttactc cacaagaaac ttgctatagg 12780
cccatctctt tcgtcttctt tccttctttc agttcgtctt cccatcctct ggtaggggga 12840
ggggagggat gcctgagcga gagactagct gtaggaacca tttgtctcaa agtccagaaa 12900
gccacaggtg atggatttgt cctctgaatc aaagggcgtt cgatgatgga tttctgtcat 12960
gtctcatcta aagtcttcac gagaacagat gaggaagcag ttttatgacc ccagagcctc 13020
ctaccaaact cctctgagaa aaggtttcct tttttttttt tttttttaaa ttagagacag 13080
agtcttgatc tgtttcacag gccggagtgc agtggcacaa tcatagctca ctgcagcctc 13140
gagctcctag gcttcagtga tcctcccacc tcagtcaccc acgtagctgg gactacagct 13200
gcacaccacc atgcccagct aacttttaaa acatttttgt agaggtgggg tctcactttg 13260
ctgcctatac tggtctccag ctcctagctt caagtgatcc tcctgccttg gaagttctgg 13320
gattataggc atgagccact gcacccagcc tggatgtgat atttttatgt tttaaattgt 13380
tagagtttag aaacttgaga ttgagtttgc tgcctgcatt aaaatgatgc ttaaacatta 13440
aactgcagtg gccttaaata ttaacaagtt gattagaatt actaagttct tttcaagctt 13500
tacatataca gacaaatttc ttatgcaaaa tagaaggtaa cccctgtacg taagtctaga 13560
atttcagcag tccccaaaac tgactgagca ttagaatcac tctgatttta aaatacatat 13620
gtggttttcc gagatctact aacagagcct ccataatgta gcctagagaa acgagttttc 13680
agatgtagtg ataaatttgg aaggtaagtc agagaagtaa gctgaagaca gagttttagg 13740
aaatatgcct aaagtcacat aatgaattgg ttttcttgtt tatttgagaa tattgtcgct 13800
ttttgttctt tttcatgcaa atcacatttt atttcttatg tgagtagcta tatatttaaa 13860
aattttgttt ttggaatatt gtagaatctc tacttaagaa agtatcttag cagtcatatg 13920
gtctgacctc actgaatgct aaattctctt taaaacatcc gtctcagatg gttactcata 13980
ctgcctctga ttgaacaaga gtcccaggtt aagggactta cttctttgaa atcgttcatt 14040
tcatttttct acagctatgt tagaaagttc gtccttagca gtgaagccag agtctatctc 14100
ttataacttc tacccagttg caccctccaa gcctacctat accaagtatc ttttttccac 14160
gttgcttttc caattcagct cttcgcaagt ttggagacaa atacctaatc tcctctaagc 14220
cttctccagg ttaagccttt ccagttcatc cagctgttga ttatgtgatt ggagacacaa 14280
gtttgagtaa ctcccatgat ggaaagtccc tctggtgaat gttctgttca tcagagtccc 14340
taagaaagca catgagcctc accatggtga gtggggccat gagattccta aaccagacac 14400
tacactgtgg cttgtgcaac ctaccatggc cagactcatg aggctgtttc atcatataaa 14460
taattcctta gtctcttcac caaaaactgt gaagcactgt gtcccccagc tgtatgtgag 14520
ctagcctggg accatagtgg aggactcctc tttcaaccct gttaaatttc atcttgttag 14580
gatctgccca tttttccatt ctgttgaaat tatcttggaa ctggattcat tcatctcaca 14640
tcagctactc cccgaagcct cacagtatca gcagagttat tatctctatc catatccttg 14700
taaattatta aactaaaaaa gattggtcta agaacatcag tccattaatc aaggctcttt 14760
ggttggagtt cacttcatta tattatcatc cagctcagag tgttcataaa caagatgata 14820
ggaaagactt ttccaaatgc ctgtctgagt aattccccca ttcctgtgat ctgtgagctg 14880
ttgaccagat taaaaaggaa gtgagaataa ccaggcaaga tttactccta gcaaaacctt 14940
actggcttct agtgactgag tcctttccct attgcttacc agctatcttt ttaattacta 15000
gttttaaaat cttgccagca atgtcaatat caaatgacca agaatatcaa actcattact 15060
ctgtatgtaa atgagatagt gtacttaccc ctatggctta agtattaggc tgttcttgca 15120
ttgccctaaa tacctgagac tgggtaattt ataaaaaaag aggtttggcc aggcactgtg 15180
gatcaggcct gtaatctcag cactttgtca ggctgaagca ggtgtaatgg tgagccaaga 15240
gttcaaactt agcctggaca acaaggtgaa accccctctc tgcaaaaaat acaaaaatta 15300
tctgggcatg gtggcatgca cctgtagtcc cagccaccca ggaggctgag gtgggaaaat 15360
tgtttgaagc tgggagtcag tgattgcagt gagccatgat tgcaacactg cactccatcc 15420
agcctgggcg acagagcaag accctgtctc aaaaaataaa taaatgaata aataaataaa 15480
ataaataaat aaatagaaaa gaaaaagaaa gaaaagagat ttatttgcct catggttctg 15540
caggctgtaa gggaagcata gctccagcat ctgcttctgg ggaggcctca ggaagctgtt 15600
actcatggca gaaggtgaag caggagcttg cacatcatgt ggcaaaagca ggagcaagag 15660
agagagaatg gggcagggaa gaagccccac acttttaaat gaccagatcg catgagaaat 15720
cactcgttac ctcaaggaca gtaccaagag gatggtacta aattcctgag aaatccaccc 15780
ccatgatctg atcacctcgt accaggcccc gccttcagca ttggggatta tgtttcaaca 15840
tgagatttgg atggggacaa catccaaact atatcacctt gcatagtagg tagggtttta 15900
aaaagcagtt tggcacagta agaaaagtac agattttttt tgcatcagac agacctgagt 15960
taaaatccca gcttcactgc taacatgcta ggtaaatgtg ggcaagttaa ttaacatttc 16020
taagcctttg tttcctcact ggtaaaacaa gtatttggaa atatcattgt gaagattaga 16080
aataatacat gaaaagatcc taggatgctg tctgtcatac agtagtagta gtaagaagtt 16140
attcttgcca aagattgttg agaatggcag aattatctca gttctaagag ctatagtttc 16200
taattatttg agcctagact cagattcatt tggagcagct aactgctcac caagagctta 16260
ttttccatct taccaatgag gttatgtgcc ctgtgttttt aaaatcagtc tacttaacca 16320
agagaacaga aatgacatga gaattaagta atctcacttt ctctgttatt taggatttat 16380
tcctactcaa aacctgagag ttgctatgaa ttcaccatta aagcacttat taatatacat 16440
gggttactgt tataaatagc aatagtattg ctattgtgtg agttaggtgt tgaagttcaa 16500
gaaaggaata aagaatattt agaagatctt tgaaaacagt gtctgggtac ggtggctcat 16560
gcctgtaatc tcagcacttt gggaggccga ggcaggcaga tcacttgagg tcacgagttc 16620
aagaccagcc tgggcaactt ggcgagacct cgtctctaca agatatacaa aaattagccg 16680
ggtatgttgg catgcacctg taatcccagc tacttaggag gctgaagcac aagaatcact 16740
tgaacctggg aagcagaggt tgcagtgagc caagattgta ccactgcact ccagcctggg 16800
caatagagca acactctgtc tcgaaaaaaa aaaaaaaaaa aaaaaaaaga aagaaagaag 16860
gaaggaagga aagaaaaaaa aaggaaaaaa tgcaaggaag gtatttggtg aatctataat 16920
aataaaaatg tatttgtcat ttcctttttc tgtgctctca ttctataaaa ttgagtaaaa 16980
aatctatata tagtttaaac acattaatag aaatcacaaa agttagctga gtcaacattg 17040
tagaaacata atatttctgt atgtcaaaga aatagacaac attaaaaagc agaaagcaat 17100
tacaaagaat gattataaga aacatcacaa agggttaata ttttaacaca tttgaaactc 17160
aaaaatcact gagaaaagca gtagacttcc ataaatattt tatagagtag aaaaaatagg 17220
ccaagcacag tggctcatgc ctgtaattcc agcactttgg gaggccgagg agggtggatc 17280
acgaggtcag gagttcaaga ccagcccggc caagatggtg aaaccccatc tctactaaaa 17340
atacaaaaac tagccaggcg tggtggcagg tgcctgtaat cccagctact tgggaggctg 17400
aggcagggaa ttgcttaaac ccttaaaccc gggaggtgga ggttgcagtg agccaagttc 17460
gcaccactgc attccagcct gggcgacaga acgagactct gtctcagaaa aagaaaagaa 17520
aagaatagaa aaagaatcca tgggcaggca cagtggctca tgcttataat cccagtactc 17580
taggaagcca aggtgagagg atcaattgag gccaggagtt caaggccagc ctgggcaaca 17640
tagcaagact ttgtctctat taaaaatttt aaaattagcc aggcatggtg acgcacacct 17700
gtagtcccaa ttacttggga gcctgaggca ggagaactgc ttgaggctgc agtgagctat 17760
gattagacca ctgcactcca gcctgagcta cacagtgaga ccttgtgtca aaaaagtaaa 17820
aaaataaaaa ttagccaggc atggtggcac atgcctgtag tcccagctac tcaggaggct 17880
gaggcaagag gatgacttga gtctggaaga tggagactgc agtgagctgt ggtcatgcca 17940
ctgcactcca gcctgggtga cagagcaaga ccctgtctca aaaaaaaaaa aaagaaaaga 18000
aaagaaaaat aaataaaatt tattcaaata caaaagtgat gtggtttgac tctgtgttgc 18060
cacccagatc tcatctccaa ttgtaatccc cgtgtattga cggaggttcc tggtaggaga 18120
tgattggatc atggggatgg tttcccctct gctgttctca tgatagtgag tgagttctca 18180
tgaaatctgg ttgtttggta ggtgtctgtc acttacccct tctttttctc tctcctgctg 18240
ccttgtgaag aaggtacttc cttctccttt gccttccacc atgattataa gtttcctgag 18300
gccttcccag ccatttggaa ctgtaagtca attaaacctc tttcctttat aaattaccga 18360
gtctcaggca gttttttata gaagtgtgaa aatggtctaa tacagagact tggtaccagg 18420
agtggggtac tgctataaaa aataacctga agatatggaa gcgactctgg aactgggtaa 18480
caggcagcaa ttggaacagt ttggagggct cagaagaaga caggaagatg tgggaaagtt 18540
tggaatttcc tagagacttg ttgaatggct ttgaccaata cactgatagt gatatggaca 18600
atgaagtcca ggctgagatg gtctcaggtg gagatgagga acttattggg aactggagta 18660
aacgtcactc ttacatgttt tagcgaagag actggcagca tttttcccct gccctagaga 18720
tctgtggaac tttgaacttg agagacatga tttagagtat ctggcagaag atatttctaa 18780
gcaccaaagc attcgagagg tgacctggct tttcctgaaa gcatacagtt atatgtgctc 18840
acaaagagat ggtttgaaat tggaacttat gtttaaaggg gaagcagagt gcaacaaaag 18900
tttagggagt ttgcagcctg accatgtggt agaaaagaaa aacccatttt ctggggagaa 18960
attcaagctg gctggagaaa tttgcataag taacgaggag ctgaatgtga gttgccaaga 19020
caatggggta aatgtctcca gggcgtttca gaaaatcttc agggcagacc ctcacaacac 19080
aagcctggag gcctagaagg gaaaaatggt gtgagccagg cccaggccca ggccccagct 19140
gttctgtgca gccttgggac atggcaccct gtgttccagc cactccagct ccagctgtgg 19200
ttaaaaggag ccaaggtaca gctggaccat tgcttcagag ggtacaaatc ccaagcatta 19260
gcagcttcca tgtggtgttg ggtctttggg tgcacagaag acaaaagttg agctttggaa 19320
gccgctgcct agatttcaga ggatgtatgg aaacacctcg atgtccaggc agaagtctgc 19380
tgcaggggca gagccttatg gagaacctct gctagggcaa tgcagggggg aaatgtgggg 19440
ttggagctcc cacacagagt ccccactggg gcactgcctc atggagctgt gagaaaagga 19500
ccaccatcct ccagactcca gaatggtaga tccaccaaca gattgcactc tgcgcttaga 19560
aaagctgcag gcactcaatg ccagcctgtg aaagcagctg caggggctgt accctgcaga 19620
gccacagagg tggagctgtc caaggccatg ggagcccacc ccttgcatta gcatggagac 19680
aggggatcaa aggagatttt ggagatctaa gatttaatga atgccctgtc gagtttcaga 19740
cttgaatggg gcctgtgacc cctttgtttt ggccaatttc tcctatttgg aatgggaaca 19800
tatacccaat gcctgtaccc ccattgtatc ttggaagtaa ctaacttgct tttgatttta 19860
cagactcagg cagaagggac ttgccttgtc tcagatgaga ctttggactt gaacttttga 19920
gttaatgttg gaacgaatta agacattggg gttctgttgg gaaggcgtat ttggttttga 19980
aatgtgagaa ggacatgaga ttttggaggg gccaggggta gaatgatatg gtttgactct 20040
gtgtctccac ccaaatctca tctccaattg taatccccat gtgtcaaggg agggacctga 20100
tgggaggtga ctgaatcata ggggcagttt cccccatgct gtttgcatga tagtgaggga 20160
gttctcatga gatctggttt tttggtaagt gtctgggctt cccccttttc cctctctctc 20220
ctactgcctt gtgaagaagg tacttgcttc tcctttgcct tctgccatga ttgtaagttt 20280
cctgaggtct ccccagccat tcagaactgt gagtcaatta aacctcttcc tgcctattct 20340
caggcagttc tttatagcag tatgaaaatg gactactaca gaaagtgtgt aactttaaac 20400
tcagtagtat ccaaagaagt aatgaaaatg gagaaacgaa caacaaaatc atagtacaat 20460
atggtgtatg tactaggaca ggaagagccc ttttaagaag agatctatgt atttccattt 20520
gtttatctct gaaagaaagc aactttgcct tgtattctga aaaagaaagg aatattttat 20580
tttacttgta aaaatcttac aaggatgcta gtctaaatat agttttccta atttgccaga 20640
gaatccatga agatcgagtt gataacaaga tcagtgaagt aaaggtcagt gagttaatct 20700
cacagcagct gcaggctaat tccatttcca gtgaaaaacg tcttgattgc tcaccacata 20760
tcttttcacc acaaacagtt tcagtcttaa gatcacatgt tgcaatccat gagaagtaac 20820
tattaagcct tcaactatga ctggagggct cctcgccctt tctgataaat tgactggaca 20880
aaaactcaat tttaaaatga caagaaatag aagatgtata aatgtacttt aaatgtgacc 20940
aaaatgggtt gtgaaaacac aagacacaat atccaaaaat gctggcaaca cagtacactg 21000
tagagtattg gttgtttatt tacccttgct attgtgtggc tgagcttact gccactgccc 21060
agcattgcaa gggcatcaaa ctgcctatca ctagcctagg aaaagatcaa aattcaaaat 21120
tctaagtaca gtttctactg aatgcttatc acttttgcac cattttaaag taaaaaaatc 21180
agtaagttga accatcatat atccaagatt gtctgtatat aaatattata catctttctc 21240
tcacttttaa aacaaaataa tactagccaa tactaccatt ctcaaaagca cttgtgtcaa 21300
cagcctttac cccttaaaga ttttcctcac aattttaaaa ttgttactta ctattttctt 21360
tgaaatgttg accaaacctg gattaaaaga tttgggggtt ttagtgactg tatttcacaa 21420
actctcttat tgattctgca gcctcacttc tgcctcctaa aaagccctca ccaaggtcac 21480
gggggatggc tcttttcagc ctcttcctgg catttggtcc agtggcattt ggcattctag 21540
gacttccctc tttgtctttg ataactccct ctcttcctgt gttcctcctt gctgtgttca 21600
cttgcttcgc tttcttcttt ctgaagcatg tttacacagt gttttctctg attgggcctg 21660
tgacgttctt taggtcatct tttccacaaa taatgcttca actagtactt gcgtgccagt 21720
gactccacgt cccactcatg agctctgaac ctagtaccag cttctgctgg acatctacaa 21780
tgggatctct cacaggcctc tctcattggt aacatgcccc agcctgaact catctcccac 21840
ccatctatcc agccatgctc tctagttcac ctgaacactt gggtgtcatc ctagatgctt 21900
tcccttccca gtcttctgtg atcattctgc ctcatcagag gctctctaat ctgtcttctt 21960
tcctatatcg ctcttgtccc tattttaatc ctaatcatct atttcctgac ttattcattc 22020
cttaagttgg tcagtaattt aattaaaaac agatttaggc cctgacctta aatgtgataa 22080
gtgatatgaa aggagatgac tggggaaaag gatttccctc aaggaaggcc tctgtgaagc 22140
ctgaagcaag aatgaaaacg agtcagacga agagagaatt gtatgaatga aggctctgag 22200
gcaggaaaac actcagatca ttccagaatc acttagaagc caagtgaagc cagttcctgg 22260
agagcagatc atcaaatgaa gatggaaagg tgaccagggg ccagacctgt agttttggtg 22320
ggccttggtg agggatttac agtaggacac cccatggttt aagtatgaaa gtgacaagat 22380
tcctttaagt tttaagaggc ctcgaaatat gaaccacaga ttagatggaa gctactctcc 22440
ctgtgtctgg actttttaga atttccaaga gctgctgttt ctggaaccag attaatacaa 22500
gtcagtcttc catttattta tttatgtatt tatttgagac agggtctcac tctgtcaccc 22560
aggctggggt gcagtggcat gaacacagct cactgcagct tgggggctca agagatcctc 22620
ctgcctcagc ctcccatgta gttgggacca caggcaccta ccacccagct aattttattt 22680
gttgtagaaa tgaggtctca ttttgctgcc caggctgttc ttgaactctt gggctcaagc 22740
gatcctcctg caacatcttc ccaaagtgct gggatcactc ttccatttaa catgctatct 22800
caacgtcaag ataaacttta aaatctttag ataataggct ggcattttac ttaaacgatc 22860
tttacttctt cagaactgcc attccctata aatatctggt tcttcaacca catcaaacca 22920
cttgtgatct caaaaagcct cagcgtacac tgtcctttct gtcattctaa ttcctcctca 22980
tccttcaaaa tcaactcaag gaccagatcc agggagaagc ttagtggtgc ccacccgaac 23040
cggccccctc cttcgagttg tgctgccatt cgggcccacc tcttcacaca gggttgtcag 23100
accagaccag ctcatgcgtt caccgccctt gcagggatgg gatgcagctg tgcacctctc 23160
agtgccgaca cctggagagt ctcacgaaat gttgacaaca tggcctgttt ccatttcttg 23220
ttcactagga cttctcattt actaacacac agaatttcct gtagtatgtc cacttaatca 23280
gttcaagcct aataattcct tgatttgggt atagtgcttt gcatttatat actgatggtc 23340
cccaacttac gatggttcga tttatgattt ttcaacttca tggtgatgtg aaagtgatac 23400
acattctata gaaaccacac tttcaatttt gaattttggt ctttttccag gctaccatac 23460
tctaaagata gagccacaga tcccagtcag ccatgtgatt atgagggtaa gcgaccaata 23520
ctctacagtg tattgtattg ccagatggtt ttgcccaact agcctaatgt aagtattcta 23580
aacatgttta aggtaggcca ggctaagctg tgttgctcat tcagtaggtt aggtatatta 23640
aatgcatttt caacttatga tattttcaat ttacaatgag tttatcagga tgtaactcta 23700
ctataagtca aggatcatct tgtatagcac ttttaattta tagagtccct tcaaatgttt 23760
gtttgtattt tatttccact gcatccctgt gaggatacca taagttatac agctaacaaa 23820
acagttagtt ttcctgtgca aagtgatggc ttcatcttgt ggcagattac ctggaatact 23880
gtggccaagg catcttagtt ctactgtctt tatatatcta gtacagttat atttttatgg 23940
cagctctgat ttcttctttg gcccaagggt tattaagaga gggaaaaaat ttaatttctt 24000
aacagatata tatatctatg tcaagtcata tatttaattc aaacccttaa tattcctagg 24060
taatttttgt ctactttctc tgtcaaagat tgaaagatac agggttttaa gtttccaact 24120
gtaattgtag ttttggtaat tgttttatta ctaacaggta ttgctctgta tattttgatg 24180
ttctgttatt caatacataa gaattcatta cagttgaatc atcatgtata gtataattta 24240
ccaatgtaaa ataacctttt tatcaaactg agtattcacc ttataatgtc ctctgtcaga 24300
ggattataat accacttaaa accttttaaa aaatattttg ttcctgataa ttttagcttt 24360
gagtggtttt cttataacaa ttctagagat gcgtttttat tttttaacca agatttaaag 24420
ctttgtgatt tagtaagagt ctaaaccatt cacagttcat gcttttttgt caaatttcta 24480
ttatttagta ttttcctctc ttttatattt tcctgttatt ttccatttct attcttttgt 24540
tagactggaa attttttctt tgctttcttt tatcctagtg atttgaaatt tatgtaatat 24600
atactattct acaataccct ttatttgttt tcaatatttg aacctatatt tttcaacatt 24660
attaagaata aaatagtatt tgttgctatt ttgaaatgat agaccatgtt tttaaggcag 24720
gttggtggtt gttaaggcac cagtatcggc caggcacgat ggctcacacc tgtaatctca 24780
gcactttcgg aggccgaggt gggcagatcg tttgagccca gcactttggc cgatactgtg 24840
gtttactgta ttttgttcta gtttatttta tggaaaatgg gaattcagtg gttaagacaa 24900
ggattaaata gcagaagaaa gatgtgtaca tatgtacaga tgtatgtgtc ctttatatgt 24960
tttttagtac tcttgtctcc tttctggtcc tcatttaagg ttatctattt catgcagtaa 25020
atttttcttc acaattcatt tcatttagag agtgaatgct accttccaag tgggctttct 25080
ccagttttcc tttcagggac ttaaaggaga agtgatgtta acagttttat atttccattg 25140
cattttacag tgtgcagatg tcttcacata tatttcccca tttgagcttt acaaaagccc 25200
ttagtattat tctcattgtc tagattccaa aatcaggctt agaggagtta aatagttgtc 25260
caggatctca agatgcaaga cccacaatca tgaacagagg cagatgttca ggatggaggc 25320
aagctgaaac tcaaaaccaa atcattatga ctccaaattc aggagtcttt tagctgccac 25380
ctgcatgggc tcttggtgta gctgaccacc agagtttgta gagctgtcat tcaggtgtgc 25440
catggacttt cctgggacct ggcacaggag aaggactgag ttaatgtttg ctgattaaat 25500
atctgttaca ggctgggcgc ggtggctcac gaccgtaatc ccagcacttt gggaggccga 25560
gcagggagga tcacttgagc tcacaagttt gagaccagcc tgggcagcat ggcgaaaccc 25620
cgtctctaca aaaaatttga aaattagctg gccatggtga tgcatgcctg tagtcccagg 25680
tactcaggaa gctgaggtgg gaggatcaca tgagcccatg agattgaagc tgcagtgagc 25740
tgagatggtg ccactgcact ccagccttgg ccatagagcc agaccttatc tcaaaaaaaa 25800
aaaaaaaaag ttacaataat cttcccttca aagctggaag gcattattta cctgtctgtc 25860
cagcagatgg tgctacataa ccaagggaat ctgttgcttg cccttggtga agctattaaa 25920
gccaatacag atcttgagaa tttcaaaagc aaaaatcaat actggattat gagtgctcta 25980
ggaaaataaa gagataaatt ttcaatttac atacttatat atagttatac catatttgta 26040
aataaaaata tataaataat ttatcaaaat tcctttttaa cagcaacaac cacagtaaac 26100
ccacaggtta aaaactccac aacagtctat attaatcagt caatgcaaag tacattccaa 26160
ttccaagtta actgaaaata atcaacttaa tcatttggtt ggctctgagc agccttcact 26220
gcttgctctt gtgtcatgtt tctttctgtc ctcgattggc tatagactta cagacggctt 26280
ttgcagagga cagtgtactc atgtccatcc tttgcatcct ttgtgggagt tggctaggca 26340
gcactctccc tggggacact atgaactcct cttcttgagt gcagagatca cgtcttgttc 26400
atcttcatgc ccaatacctt gttccataaa tatgaatgga ttagaattct aaactcttaa 26460
ctctgcccca agacagttct gagaggtagt aagtcatata acacctgaag aggactgttc 26520
ttgtcctaat tacattaggt tataagatga caggtgaggg agccaaacca gggggcctgg 26580
aaattattca tacatctcta gatacagtat acaagttgtg tgtattatgt gtatttactc 26640
tgtaattgat tgcttgagat gaacccccaa acacactcgt gtttggatca ttattatcta 26700
cccttctcct taaataatct taatttccta tgatgcttga aagggaaaga ggggccaggt 26760
gtggtggttc acacctgtaa tcccagcact ttgggaggct gaggtgggag catcacctga 26820
ggtctggagt tcaagaccaa cctgaccaac atggtgaaac cctgtctcta ctaaaaataa 26880
aaaatcagct gggcatggta gcacatgcct gtaatcccag ctacttggga ggctgaagtg 26940
ggagaatcgc ttgaacctgg gagggggagg ttgcagtgag ccgagatcac tccattgcac 27000
tccagactgg gcaacaacag tgaaactccg tctcaaaaaa aaaaaaaaaa aaaaggcaga 27060
gtggggaaga gagctgcatg aaggagagat ttactaaata gtacttaatc ccaaaataat 27120
ttctataggt ttgaatatga tccctgaaat ttattatagg ttcaggtaag tattaatcac 27180
gggtattcag aactgtggtt taaaaaatgt atagaacatg tttccttccc cttgaaactt 27240
tttatcagct aattatagga attatattat acctgcaatc attaaagtcc agaatgagac 27300
agtacttggt aaagtgctga aatttataat aaatgcatta tagcaatcca gttaaggagg 27360
aagagccacc attattgaac atttgttaag tgtcagccat tgtactagat aaattttagt 27420
tattattttt atttaggcac caaaaaatcc atgggatagt tggttatccc catcttactg 27480
aagaggaaac tgaagctcag aaagtttaag caacttgcac aggtcacata gcaagtaagg 27540
agcatggcca ggaatcagac cctgatctcc tttggtctac taagcttgca aaggatcttc 27600
ccgcctcctt ccaagaccat tcaatattat cagtaaatgt ccatggcaag gatgtagttc 27660
gagttatagg gttccattca agatatgatt ggtaggtggg aagcagatat gtctgtgtca 27720
atcagtatcc tggaagaagg agatgatgaa ctcaagtggt gattaaggga agtttaatga 27780
agggactatt tacagagatg tggtggggtt aagagaacca acaaggggaa gtgatgcact 27840
caaaaagtta ctacctccag gctttagggg attgggggag ggagtggcac agtgtgaacc 27900
cagtgtggtt gtgagaaaag ggattccctc agcagccatg gccaaggtta gagtctccac 27960
tgccaaactg catccaggtg gtgagggaat ggagaatagg ggtggggtaa caaactctga 28020
cctcggtatc cccaaagggc aaaggattcc aggtggtaca gttcgtaaag attagcctca 28080
gggcacagaa cagggcagag aagaatggag aattgatctg gaggaaacaa acaatggctt 28140
gcccatgtta ttgcagggag agtaggctgg tgtgcacagc aggagggtgg ggagcccagc 28200
atatagctgt gttggggcct gtgcagatca gcctcactgg cagggaggat ctgagccgag 28260
aggtggtgga agatgaaatc gagtaggcat gttggtagtc ctaaatatca agtaaacgtt 28320
cctgatctta cattgatact caatagtaag ccaattttgt ttcccataag ccaatattaa 28380
tattacgtat ttcttttata agccagagat atagagagat accctagaag aatgataggg 28440
gaaaggaagg caagggtgag agaagacctt gtgtgaattt gtccaaaatg tttatccaca 28500
ggaacaatcc ctttgtgaag gctgctggta tgtgaatgtg tgccggttcc cttggggcgt 28560
tcatttggat ctttctgtgt tccagtgacc tacggcatga tgagctccaa tgtgtactac 28620
tacacccgga tgatgtcaca gctcttccta gacacccccg tgtccaaaac ggagaaaact 28680
aactttaaaa ctctgtcttc catggaagac ttctggaagg tatttgcaaa taactttgaa 28740
agtacctctc tatcacagaa aattgttcat ttggcttcat catttcaatg catgagtatc 28800
gacaggacct gctttgcatt taacactgtg tgagacgtaa gttatggtga gttgttagaa 28860
gttactgttc ctactctcaa agggggtaaa ctaacattga gaactttgcc tgtgccttgc 28920
actgtgctga gtgtttcata tcttacctta tttaatttct atagtctaac tctataaggt 28980
aagtactaag actatgccct agtttgttaa tgaggaaaat gagattcagg atgtttaaat 29040
gcgtatggtc acatggctag ggaacaagaa aaattgattt ttttctagcc tgacagctac 29100
ttcatcctag tttgtaattc attccatgag tcaagattca ataaatattt attgagaatc 29160
tcctagaatg taaggccaat gaagggcagt gtggttcttc tgtcttgctt cgccttttgt 29220
gttttgtctc tttgttgatg atggcatgta tccccagctc ttagaacagt gcttgattca 29280
aagtaagcac attctttcaa aggtctgctg ttggtggggc ttggtggctc acgcctgtaa 29340
tcccagcact ttgggaggcc aaggcaggag gattgcttta gcccaggatt ttgaaaccag 29400
ctgggcacaa catagtatga ctttgtctct ccaaaaaagt taaagaatta gcagggtgtg 29460
gtggtacaca cctgcagtcc cagctactca ggaggctgag gtgggagaat cacttgagcg 29520
attgcttgag gtcaaggctg cagtgagcca tggccatgct actgcattcc agctggggca 29580
acagagtgag accctttctc aaaaaaaatc ccccccaaaa aaaaacccaa aaacaaacaa 29640
aaaaggtctg ctgttgtgaa gttcaaccca atccagcccc ttcccaagtt gtcacaaatt 29700
ccaacgtagt taacagtata ccaatgagtg ataccacagg aaaaatatta aactgatctg 29760
agggatatgg ggcttggaat ctaagaaaat tggaagggaa attgaaaagg aaattattat 29820
ttctccttgg ggagatagtt tctaaaattc ttactacacc ctggggtcag agctgttgat 29880
tttaaggata gagacaactg agtcacagga aactattcat atataaaagt acctggcatc 29940
caaaaccaca cttgtataat atgaatcttt caccatctga gtagggcaaa tcagtctatc 30000
tctgttgatc atctgacaag gatagcacac tgagaaatag atctgtcttc cctacaggca 30060
tagctagttg tacaaactaa caagagactt ttgtatacac attccatgat gataaatgcc 30120
aatcactaaa gggacgagga gggattggag agttcaccat acagcaaaat agtccagaca 30180
ggtgaaaggt ctatcaaatg ccaggctggt aatcaaaact gtagcctttt ctctaaacaa 30240
agtttagaac catgattgtg tgggacatta ttttaataag ggaaagtgca gttaatcatg 30300
accccacctt tagtccaaga acaaaaatca gagctgccac gtattaagta cccactctgt 30360
gccaggtgca gtaactatgc aaaagatggg ttttccagat gcaagaacct tggttcagag 30420
gaccctgctc aaggcctcat agctaacaaa tgatggggca agatgctatc ccaaatctct 30480
ctgacaacaa aactcattct tatcactcta ctattttcat agagttgcca aatgcttggt 30540
tatgcaaacg atgcaggcag gggcaagaca gcggctgagc ttggaacttt ttcagagatg 30600
tttcctttgc ttttagttca cagaaggctc cttattggat gggctgtact ggaagatgca 30660
gcccagcaac cagactgaag ctgacaaccg aagtttcatc ttctatgaga acctgctgtt 30720
aggggttcca cgaatacggc aactccgagt cagaaatgga tcctgctcta tcccccagga 30780
cttgagagat gaaattaaag agtgctatga tgtctactct gtcagtagtg aagatagggc 30840
tccctttggg ccccgaaatg gaaccgcgta agtgtctgtg actcattgcc actcggtgat 30900
attcattcat ttattctctg aactcccacc attcattcat tcattccctg acaccttcac 30960
caaggcaaaa ataagttcag tgactcttca gtgcttatat ttaaaccttg gccaacttga 31020
cctttgactt cttaagtttt cactacttct tagccttctt ttagtttcta catgcatatt 31080
tttcagaaga ctaaatcgtt gaccatataa cccctcaaaa attaattatc tgagcgtttg 31140
aaaatttcat ttaagatgcc ctgggccctg tttttacagg tgcagtaaca tcatccacta 31200
agttatttaa cacaagtttt ctggttcagg aactcttttt ataggtcttg caaacaggtt 31260
tttgttcaga atggagttat ttaatgtgta agcttgtgag gcaatttttt gttaggttta 31320
aagcccattt tgttcaaatg tttgagattt taggtatata tttgtacacg tgcatattta 31380
caggggcttt ttgtacactt tggtactcct acttcaaaca tcttgtgtat taagggaggt 31440
cacttactat tttagaagta ttgtagttat tataaagaaa caagaagacc tccaaggccg 31500
tttcagggtg ggcctttgcg gttgctgtcc ctgggtacgt cactggtcgg agtcatcttc 31560
taagctttgc tcagctaatt ctgtcggttc atctaggttc ttttcttgga aactgagttg 31620
cccagaatcc acatttgtta ctatacaatg ggcaatcacc ttttcaatta gtatattctt 31680
cttgtacctt ccagtataca ctctatttaa taccagaacc cataagaaac aaatttagta 31740
aaaatccagg ttgggcacag tttctcatgc ctgtaatccc agcactttgg aaagccaagg 31800
cggacagatc acttgaggtc aggagttcaa gaccagccta gccaacatgg tgaaaccctg 31860
actctactaa aaatacaaaa attagctggg tgtggtgaca tgtgcctata gtcacagcta 31920
ttcgggaggc tgaggcagga gaattgcttg agcccgagtg gtgggggttg cagtgagctg 31980
aggtctcatc attgcactcc agcctgggca acagagcaag actccccctc aaaaaaaaaa 32040
aaaaacaaat ttagtgaaaa tccagagctt tagaacaaag gaactaaata gtctcaaagg 32100
acattatcat ccaagttatg atagtgattt cgctttcttt aaaaaaaaaa ttattacaga 32160
tagagtttct tgatgttgcc caggctggcc tcaaactcct gggctcaagc agtcctccag 32220
cctcagcctc ccaagtagct gggactatga gaatatgcca ccatgcccag ctttattttg 32280
ctttctaatg tgcctttttg tagttcctgc aaagcataag catgccttca tctgtggtac 32340
cctttccaat attttattta tctcacatca ctaataagat aaatttatac agccactgct 32400
ctgtgccaga cattatttaa gaagttattt cacgcattat ctcatctgcc ttcacaaaac 32460
aactctaaaa taggtatcac ctccatttta tagatgaaaa aactgaggct cacttgccca 32520
aagtgtcaca gctaacaaat tggactgaac caagatttaa gcagcctgac tccaaaaccc 32580
atgtttcgcc tactaaacct cttccatatt aattcctcct ccatattaat tgcgtcgtta 32640
gggtggcttg tcgacgctct cagctcccca tcagtactca agcttcctga gggcagggat 32700
tctattttgt taactgctgt attctcaaag ccttgaacaa tgcctcatat gtaaagatac 32760
taata 32765
<210> 232
<211> 134
<212> DNA
<213> Homo sapiens
<400> 232
tgacctacgg catgatgagc tccaatgtgt actactacac ccggatgatg tcacagctct 60
tcctagacac ccccgtgtcc aaaacggaga aaactaactt taaaactctg tcttccatgg 120
aagacttctg gaag 134
<210> 233
<211> 1897
<212> DNA
<213> Homo sapiens
<400> 233
gtatttgcaa ataactttga aagtacctct ctatcacaga aaattgttca tttggcttca 60
tcatttcaat gcatgagtat cgacaggacc tgctttgcat ttaacactgt gtgagacgta 120
agttatggtg agttgttaga agttactgtt cctactctca aagggggtaa actaacattg 180
agaactttgc ctgtgccttg cactgtgctg agtgtttcat atcttacctt atttaatttc 240
tatagtctaa ctctataagg taagtactaa gactatgccc tagtttgtta atgaggaaaa 300
tgagattcag gatgtttaaa tgcgtatggt cacatggcta gggaacaaga aaaattgatt 360
tttttctagc ctgacagcta cttcatccta gtttgtaatt cattccatga gtcaagattc 420
aataaatatt tattgagaat ctcctagaat gtaaggccaa tgaagggcag tgtggttctt 480
ctgtcttgct tcgccttttg tgttttgtct ctttgttgat gatggcatgt atccccagct 540
cttagaacag tgcttgattc aaagtaagca cattctttca aaggtctgct gttggtgggg 600
cttggtggct cacgcctgta atcccagcac tttgggaggc caaggcagga ggattgcttt 660
agcccaggat tttgaaacca gctgggcaca acatagtatg actttgtctc tccaaaaaag 720
ttaaagaatt agcagggtgt ggtggtacac acctgcagtc ccagctactc aggaggctga 780
ggtgggagaa tcacttgagc gattgcttga ggtcaaggct gcagtgagcc atggccatgc 840
tactgcattc cagctggggc aacagagtga gaccctttct caaaaaaaat cccccccaaa 900
aaaaaaccca aaaacaaaca aaaaaggtct gctgttgtga agttcaaccc aatccagccc 960
cttcccaagt tgtcacaaat tccaacgtag ttaacagtat accaatgagt gataccacag 1020
gaaaaatatt aaactgatct gagggatatg gggcttggaa tctaagaaaa ttggaaggga 1080
aattgaaaag gaaattatta tttctccttg gggagatagt ttctaaaatt cttactacac 1140
cctggggtca gagctgttga ttttaaggat agagacaact gagtcacagg aaactattca 1200
tatataaaag tacctggcat ccaaaaccac acttgtataa tatgaatctt tcaccatctg 1260
agtagggcaa atcagtctat ctctgttgat catctgacaa ggatagcaca ctgagaaata 1320
gatctgtctt ccctacaggc atagctagtt gtacaaacta acaagagact tttgtataca 1380
cattccatga tgataaatgc caatcactaa agggacgagg agggattgga gagttcacca 1440
tacagcaaaa tagtccagac aggtgaaagg tctatcaaat gccaggctgg taatcaaaac 1500
tgtagccttt tctctaaaca aagtttagaa ccatgattgt gtgggacatt attttaataa 1560
gggaaagtgc agttaatcat gaccccacct ttagtccaag aacaaaaatc agagctgcca 1620
cgtattaagt acccactctg tgccaggtgc agtaactatg caaaagatgg gttttccaga 1680
tgcaagaacc ttggttcaga ggaccctgct caaggcctca tagctaacaa atgatggggc 1740
aagatgctat cccaaatctc tctgacaaca aaactcattc ttatcactct actattttca 1800
tagagttgcc aaatgcttgg ttatgcaaac gatgcaggca ggggcaagac agcggctgag 1860
cttggaactt tttcagagat gtttcctttg cttttag 1897
<210> 234
<211> 261
<212> DNA
<213> Homo sapiens
<400> 234
tgacctacgg catgatgagc tccaatgtgt actactacac ccggatgatg tcacagctct 60
tcctagacac ccccgtgtcc aaaacggaga aaactaactt taaaactctg tcttccatgg 120
aagacttctg gaaggtattt gcaaataact ttgaaagtac ctctctatca cagaaaattg 180
ttcatttggc ttcatcattt caatgcatga gtatcgacag gacctgcttt gcatttaaca 240
ctgtgtgaga cgtaagttat g 261
<210> 235
<211> 1770
<212> DNA
<213> Homo sapiens
<400> 235
gtgagttgtt agaagttact gttcctactc tcaaaggggg taaactaaca ttgagaactt 60
tgcctgtgcc ttgcactgtg ctgagtgttt catatcttac cttatttaat ttctatagtc 120
taactctata aggtaagtac taagactatg ccctagtttg ttaatgagga aaatgagatt 180
caggatgttt aaatgcgtat ggtcacatgg ctagggaaca agaaaaattg atttttttct 240
agcctgacag ctacttcatc ctagtttgta attcattcca tgagtcaaga ttcaataaat 300
atttattgag aatctcctag aatgtaaggc caatgaaggg cagtgtggtt cttctgtctt 360
gcttcgcctt ttgtgttttg tctctttgtt gatgatggca tgtatcccca gctcttagaa 420
cagtgcttga ttcaaagtaa gcacattctt tcaaaggtct gctgttggtg gggcttggtg 480
gctcacgcct gtaatcccag cactttggga ggccaaggca ggaggattgc tttagcccag 540
gattttgaaa ccagctgggc acaacatagt atgactttgt ctctccaaaa aagttaaaga 600
attagcaggg tgtggtggta cacacctgca gtcccagcta ctcaggaggc tgaggtggga 660
gaatcacttg agcgattgct tgaggtcaag gctgcagtga gccatggcca tgctactgca 720
ttccagctgg ggcaacagag tgagaccctt tctcaaaaaa aatccccccc aaaaaaaaac 780
ccaaaaacaa acaaaaaagg tctgctgttg tgaagttcaa cccaatccag ccccttccca 840
agttgtcaca aattccaacg tagttaacag tataccaatg agtgatacca caggaaaaat 900
attaaactga tctgagggat atggggcttg gaatctaaga aaattggaag ggaaattgaa 960
aaggaaatta ttatttctcc ttggggagat agtttctaaa attcttacta caccctgggg 1020
tcagagctgt tgattttaag gatagagaca actgagtcac aggaaactat tcatatataa 1080
aagtacctgg catccaaaac cacacttgta taatatgaat ctttcaccat ctgagtaggg 1140
caaatcagtc tatctctgtt gatcatctga caaggatagc acactgagaa atagatctgt 1200
cttccctaca ggcatagcta gttgtacaaa ctaacaagag acttttgtat acacattcca 1260
tgatgataaa tgccaatcac taaagggacg aggagggatt ggagagttca ccatacagca 1320
aaatagtcca gacaggtgaa aggtctatca aatgccaggc tggtaatcaa aactgtagcc 1380
ttttctctaa acaaagttta gaaccatgat tgtgtgggac attattttaa taagggaaag 1440
tgcagttaat catgacccca cctttagtcc aagaacaaaa atcagagctg ccacgtatta 1500
agtacccact ctgtgccagg tgcagtaact atgcaaaaga tgggttttcc agatgcaaga 1560
accttggttc agaggaccct gctcaaggcc tcatagctaa caaatgatgg ggcaagatgc 1620
tatcccaaat ctctctgaca acaaaactca ttcttatcac tctactattt tcatagagtt 1680
gccaaatgct tggttatgca aacgatgcag gcaggggcaa gacagcggct gagcttggaa 1740
ctttttcaga gatgtttcct ttgcttttag 1770
<210> 236
<211> 56
<212> DNA
<213> Homo sapiens
<400> 236
gctaccatac tctaaagata gagccacaga tcccagtcag ccatgtgatt atgagg 56
<210> 237
<211> 16648
<212> DNA
<213> Homo sapiens
<400> 237
gtaagtagaa tatttccttg cactaatggg aaagttttga aaagatttga cctatccaaa 60
tcataattaa aaggaagtgt gtatgcacca gaggggcaac tgggaagtta ccttcttacc 120
tttgttttta attctaatat ttttatttgg gcatttgttt attgactatc ttcctatggt 180
agaatgcaag ctttataaga gaagggacgt gatttgttct ctgctgtacc cccatttccc 240
aaaactgcag atggcaacag aaggctctga aaaatatata agaaagaatt tttctaattg 300
tgactaaatt gtgaccaaat gctaagtgac tgtggacttg cgtttaacac aggacgggag 360
aggcaaagag ttcaattcca atttagaatt tggtcaagtt ctcttctgca ctctggtaaa 420
cattaattaa aaatcagcat tatctgacca gccagttcat cgtcagtggt ggtgattttc 480
actatgagat acgcgtggca acttgccaga caccaagaaa ccaagttaga ggatttttgt 540
attagattcc ttaacaatga atacagtatc accattatta cagtatcatc attattgtca 600
tactattatt atatcagtta acataaagtc tgcataagaa ttgtttccag aaaaatgact 660
ttccaaattt aactttcagg aaatacaaat aatgctacta atattgcttt tattggcgta 720
tacatgtaat atccccttct tttggatttg gatatgttgt gtcattgcct cattttaatt 780
cattatttct tctcaatctt taataattgc tggactttta ctccacaaga aacttgctat 840
aggcccatct ctttcgtctt ctttccttct ttcagttcgt cttcccatcc tctggtaggg 900
ggaggggagg gatgcctgag cgagagacta gctgtaggaa ccatttgtct caaagtccag 960
aaagccacag gtgatggatt tgtcctctga atcaaagggc gttcgatgat ggatttctgt 1020
catgtctcat ctaaagtctt cacgagaaca gatgaggaag cagttttatg accccagagc 1080
ctcctaccaa actcctctga gaaaaggttt cctttttttt tttttttttt aaattagaga 1140
cagagtcttg atctgtttca caggccggag tgcagtggca caatcatagc tcactgcagc 1200
ctcgagctcc taggcttcag tgatcctccc acctcagtca cccacgtagc tgggactaca 1260
gctgcacacc accatgccca gctaactttt aaaacatttt tgtagaggtg gggtctcact 1320
ttgctgccta tactggtctc cagctcctag cttcaagtga tcctcctgcc ttggaagttc 1380
tgggattata ggcatgagcc actgcaccca gcctggatgt gatattttta tgttttaaat 1440
tgttagagtt tagaaacttg agattgagtt tgctgcctgc attaaaatga tgcttaaaca 1500
ttaaactgca gtggccttaa atattaacaa gttgattaga attactaagt tcttttcaag 1560
ctttacatat acagacaaat ttcttatgca aaatagaagg taacccctgt acgtaagtct 1620
agaatttcag cagtccccaa aactgactga gcattagaat cactctgatt ttaaaataca 1680
tatgtggttt tccgagatct actaacagag cctccataat gtagcctaga gaaacgagtt 1740
ttcagatgta gtgataaatt tggaaggtaa gtcagagaag taagctgaag acagagtttt 1800
aggaaatatg cctaaagtca cataatgaat tggttttctt gtttatttga gaatattgtc 1860
gctttttgtt ctttttcatg caaatcacat tttatttctt atgtgagtag ctatatattt 1920
aaaaattttg tttttggaat attgtagaat ctctacttaa gaaagtatct tagcagtcat 1980
atggtctgac ctcactgaat gctaaattct ctttaaaaca tccgtctcag atggttactc 2040
atactgcctc tgattgaaca agagtcccag gttaagggac ttacttcttt gaaatcgttc 2100
atttcatttt tctacagcta tgttagaaag ttcgtcctta gcagtgaagc cagagtctat 2160
ctcttataac ttctacccag ttgcaccctc caagcctacc tataccaagt atcttttttc 2220
cacgttgctt ttccaattca gctcttcgca agtttggaga caaataccta atctcctcta 2280
agccttctcc aggttaagcc tttccagttc atccagctgt tgattatgtg attggagaca 2340
caagtttgag taactcccat gatggaaagt ccctctggtg aatgttctgt tcatcagagt 2400
ccctaagaaa gcacatgagc ctcaccatgg tgagtggggc catgagattc ctaaaccaga 2460
cactacactg tggcttgtgc aacctaccat ggccagactc atgaggctgt ttcatcatat 2520
aaataattcc ttagtctctt caccaaaaac tgtgaagcac tgtgtccccc agctgtatgt 2580
gagctagcct gggaccatag tggaggactc ctctttcaac cctgttaaat ttcatcttgt 2640
taggatctgc ccatttttcc attctgttga aattatcttg gaactggatt cattcatctc 2700
acatcagcta ctccccgaag cctcacagta tcagcagagt tattatctct atccatatcc 2760
ttgtaaatta ttaaactaaa aaagattggt ctaagaacat cagtccatta atcaaggctc 2820
tttggttgga gttcacttca ttatattatc atccagctca gagtgttcat aaacaagatg 2880
ataggaaaga cttttccaaa tgcctgtctg agtaattccc ccattcctgt gatctgtgag 2940
ctgttgacca gattaaaaag gaagtgagaa taaccaggca agatttactc ctagcaaaac 3000
cttactggct tctagtgact gagtcctttc cctattgctt accagctatc tttttaatta 3060
ctagttttaa aatcttgcca gcaatgtcaa tatcaaatga ccaagaatat caaactcatt 3120
actctgtatg taaatgagat agtgtactta cccctatggc ttaagtatta ggctgttctt 3180
gcattgccct aaatacctga gactgggtaa tttataaaaa aagaggtttg gccaggcact 3240
gtggatcagg cctgtaatct cagcactttg tcaggctgaa gcaggtgtaa tggtgagcca 3300
agagttcaaa cttagcctgg acaacaaggt gaaaccccct ctctgcaaaa aatacaaaaa 3360
ttatctgggc atggtggcat gcacctgtag tcccagccac ccaggaggct gaggtgggaa 3420
aattgtttga agctgggagt cagtgattgc agtgagccat gattgcaaca ctgcactcca 3480
tccagcctgg gcgacagagc aagaccctgt ctcaaaaaat aaataaatga ataaataaat 3540
aaaataaata aataaataga aaagaaaaag aaagaaaaga gatttatttg cctcatggtt 3600
ctgcaggctg taagggaagc atagctccag catctgcttc tggggaggcc tcaggaagct 3660
gttactcatg gcagaaggtg aagcaggagc ttgcacatca tgtggcaaaa gcaggagcaa 3720
gagagagaga atggggcagg gaagaagccc cacactttta aatgaccaga tcgcatgaga 3780
aatcactcgt tacctcaagg acagtaccaa gaggatggta ctaaattcct gagaaatcca 3840
cccccatgat ctgatcacct cgtaccaggc cccgccttca gcattgggga ttatgtttca 3900
acatgagatt tggatgggga caacatccaa actatatcac cttgcatagt aggtagggtt 3960
ttaaaaagca gtttggcaca gtaagaaaag tacagatttt ttttgcatca gacagacctg 4020
agttaaaatc ccagcttcac tgctaacatg ctaggtaaat gtgggcaagt taattaacat 4080
ttctaagcct ttgtttcctc actggtaaaa caagtatttg gaaatatcat tgtgaagatt 4140
agaaataata catgaaaaga tcctaggatg ctgtctgtca tacagtagta gtagtaagaa 4200
gttattcttg ccaaagattg ttgagaatgg cagaattatc tcagttctaa gagctatagt 4260
ttctaattat ttgagcctag actcagattc atttggagca gctaactgct caccaagagc 4320
ttattttcca tcttaccaat gaggttatgt gccctgtgtt tttaaaatca gtctacttaa 4380
ccaagagaac agaaatgaca tgagaattaa gtaatctcac tttctctgtt atttaggatt 4440
tattcctact caaaacctga gagttgctat gaattcacca ttaaagcact tattaatata 4500
catgggttac tgttataaat agcaatagta ttgctattgt gtgagttagg tgttgaagtt 4560
caagaaagga ataaagaata tttagaagat ctttgaaaac agtgtctggg tacggtggct 4620
catgcctgta atctcagcac tttgggaggc cgaggcaggc agatcacttg aggtcacgag 4680
ttcaagacca gcctgggcaa cttggcgaga cctcgtctct acaagatata caaaaattag 4740
ccgggtatgt tggcatgcac ctgtaatccc agctacttag gaggctgaag cacaagaatc 4800
acttgaacct gggaagcaga ggttgcagtg agccaagatt gtaccactgc actccagcct 4860
gggcaataga gcaacactct gtctcgaaaa aaaaaaaaaa aaaaaaaaaa agaaagaaag 4920
aaggaaggaa ggaaagaaaa aaaaaggaaa aaatgcaagg aaggtatttg gtgaatctat 4980
aataataaaa atgtatttgt catttccttt ttctgtgctc tcattctata aaattgagta 5040
aaaaatctat atatagttta aacacattaa tagaaatcac aaaagttagc tgagtcaaca 5100
ttgtagaaac ataatatttc tgtatgtcaa agaaatagac aacattaaaa agcagaaagc 5160
aattacaaag aatgattata agaaacatca caaagggtta atattttaac acatttgaaa 5220
ctcaaaaatc actgagaaaa gcagtagact tccataaata ttttatagag tagaaaaaat 5280
aggccaagca cagtggctca tgcctgtaat tccagcactt tgggaggccg aggagggtgg 5340
atcacgaggt caggagttca agaccagccc ggccaagatg gtgaaacccc atctctacta 5400
aaaatacaaa aactagccag gcgtggtggc aggtgcctgt aatcccagct acttgggagg 5460
ctgaggcagg gaattgctta aacccttaaa cccgggaggt ggaggttgca gtgagccaag 5520
ttcgcaccac tgcattccag cctgggcgac agaacgagac tctgtctcag aaaaagaaaa 5580
gaaaagaata gaaaaagaat ccatgggcag gcacagtggc tcatgcttat aatcccagta 5640
ctctaggaag ccaaggtgag aggatcaatt gaggccagga gttcaaggcc agcctgggca 5700
acatagcaag actttgtctc tattaaaaat tttaaaatta gccaggcatg gtgacgcaca 5760
cctgtagtcc caattacttg ggagcctgag gcaggagaac tgcttgaggc tgcagtgagc 5820
tatgattaga ccactgcact ccagcctgag ctacacagtg agaccttgtg tcaaaaaagt 5880
aaaaaaataa aaattagcca ggcatggtgg cacatgcctg tagtcccagc tactcaggag 5940
gctgaggcaa gaggatgact tgagtctgga agatggagac tgcagtgagc tgtggtcatg 6000
ccactgcact ccagcctggg tgacagagca agaccctgtc tcaaaaaaaa aaaaaagaaa 6060
agaaaagaaa aataaataaa atttattcaa atacaaaagt gatgtggttt gactctgtgt 6120
tgccacccag atctcatctc caattgtaat ccccgtgtat tgacggaggt tcctggtagg 6180
agatgattgg atcatgggga tggtttcccc tctgctgttc tcatgatagt gagtgagttc 6240
tcatgaaatc tggttgtttg gtaggtgtct gtcacttacc ccttcttttt ctctctcctg 6300
ctgccttgtg aagaaggtac ttccttctcc tttgccttcc accatgatta taagtttcct 6360
gaggccttcc cagccatttg gaactgtaag tcaattaaac ctctttcctt tataaattac 6420
cgagtctcag gcagtttttt atagaagtgt gaaaatggtc taatacagag acttggtacc 6480
aggagtgggg tactgctata aaaaataacc tgaagatatg gaagcgactc tggaactggg 6540
taacaggcag caattggaac agtttggagg gctcagaaga agacaggaag atgtgggaaa 6600
gtttggaatt tcctagagac ttgttgaatg gctttgacca atacactgat agtgatatgg 6660
acaatgaagt ccaggctgag atggtctcag gtggagatga ggaacttatt gggaactgga 6720
gtaaacgtca ctcttacatg ttttagcgaa gagactggca gcatttttcc cctgccctag 6780
agatctgtgg aactttgaac ttgagagaca tgatttagag tatctggcag aagatatttc 6840
taagcaccaa agcattcgag aggtgacctg gcttttcctg aaagcataca gttatatgtg 6900
ctcacaaaga gatggtttga aattggaact tatgtttaaa ggggaagcag agtgcaacaa 6960
aagtttaggg agtttgcagc ctgaccatgt ggtagaaaag aaaaacccat tttctgggga 7020
gaaattcaag ctggctggag aaatttgcat aagtaacgag gagctgaatg tgagttgcca 7080
agacaatggg gtaaatgtct ccagggcgtt tcagaaaatc ttcagggcag accctcacaa 7140
cacaagcctg gaggcctaga agggaaaaat ggtgtgagcc aggcccaggc ccaggcccca 7200
gctgttctgt gcagccttgg gacatggcac cctgtgttcc agccactcca gctccagctg 7260
tggttaaaag gagccaaggt acagctggac cattgcttca gagggtacaa atcccaagca 7320
ttagcagctt ccatgtggtg ttgggtcttt gggtgcacag aagacaaaag ttgagctttg 7380
gaagccgctg cctagatttc agaggatgta tggaaacacc tcgatgtcca ggcagaagtc 7440
tgctgcaggg gcagagcctt atggagaacc tctgctaggg caatgcaggg gggaaatgtg 7500
gggttggagc tcccacacag agtccccact ggggcactgc ctcatggagc tgtgagaaaa 7560
ggaccaccat cctccagact ccagaatggt agatccacca acagattgca ctctgcgctt 7620
agaaaagctg caggcactca atgccagcct gtgaaagcag ctgcaggggc tgtaccctgc 7680
agagccacag aggtggagct gtccaaggcc atgggagccc accccttgca ttagcatgga 7740
gacaggggat caaaggagat tttggagatc taagatttaa tgaatgccct gtcgagtttc 7800
agacttgaat ggggcctgtg acccctttgt tttggccaat ttctcctatt tggaatggga 7860
acatataccc aatgcctgta cccccattgt atcttggaag taactaactt gcttttgatt 7920
ttacagactc aggcagaagg gacttgcctt gtctcagatg agactttgga cttgaacttt 7980
tgagttaatg ttggaacgaa ttaagacatt ggggttctgt tgggaaggcg tatttggttt 8040
tgaaatgtga gaaggacatg agattttgga ggggccaggg gtagaatgat atggtttgac 8100
tctgtgtctc cacccaaatc tcatctccaa ttgtaatccc catgtgtcaa gggagggacc 8160
tgatgggagg tgactgaatc ataggggcag tttcccccat gctgtttgca tgatagtgag 8220
ggagttctca tgagatctgg ttttttggta agtgtctggg cttccccctt ttccctctct 8280
ctcctactgc cttgtgaaga aggtacttgc ttctcctttg ccttctgcca tgattgtaag 8340
tttcctgagg tctccccagc cattcagaac tgtgagtcaa ttaaacctct tcctgcctat 8400
tctcaggcag ttctttatag cagtatgaaa atggactact acagaaagtg tgtaacttta 8460
aactcagtag tatccaaaga agtaatgaaa atggagaaac gaacaacaaa atcatagtac 8520
aatatggtgt atgtactagg acaggaagag cccttttaag aagagatcta tgtatttcca 8580
tttgtttatc tctgaaagaa agcaactttg ccttgtattc tgaaaaagaa aggaatattt 8640
tattttactt gtaaaaatct tacaaggatg ctagtctaaa tatagttttc ctaatttgcc 8700
agagaatcca tgaagatcga gttgataaca agatcagtga agtaaaggtc agtgagttaa 8760
tctcacagca gctgcaggct aattccattt ccagtgaaaa acgtcttgat tgctcaccac 8820
atatcttttc accacaaaca gtttcagtct taagatcaca tgttgcaatc catgagaagt 8880
aactattaag ccttcaacta tgactggagg gctcctcgcc ctttctgata aattgactgg 8940
acaaaaactc aattttaaaa tgacaagaaa tagaagatgt ataaatgtac tttaaatgtg 9000
accaaaatgg gttgtgaaaa cacaagacac aatatccaaa aatgctggca acacagtaca 9060
ctgtagagta ttggttgttt atttaccctt gctattgtgt ggctgagctt actgccactg 9120
cccagcattg caagggcatc aaactgccta tcactagcct aggaaaagat caaaattcaa 9180
aattctaagt acagtttcta ctgaatgctt atcacttttg caccatttta aagtaaaaaa 9240
atcagtaagt tgaaccatca tatatccaag attgtctgta tataaatatt atacatcttt 9300
ctctcacttt taaaacaaaa taatactagc caatactacc attctcaaaa gcacttgtgt 9360
caacagcctt taccccttaa agattttcct cacaatttta aaattgttac ttactatttt 9420
ctttgaaatg ttgaccaaac ctggattaaa agatttgggg gttttagtga ctgtatttca 9480
caaactctct tattgattct gcagcctcac ttctgcctcc taaaaagccc tcaccaaggt 9540
cacgggggat ggctcttttc agcctcttcc tggcatttgg tccagtggca tttggcattc 9600
taggacttcc ctctttgtct ttgataactc cctctcttcc tgtgttcctc cttgctgtgt 9660
tcacttgctt cgctttcttc tttctgaagc atgtttacac agtgttttct ctgattgggc 9720
ctgtgacgtt ctttaggtca tcttttccac aaataatgct tcaactagta cttgcgtgcc 9780
agtgactcca cgtcccactc atgagctctg aacctagtac cagcttctgc tggacatcta 9840
caatgggatc tctcacaggc ctctctcatt ggtaacatgc cccagcctga actcatctcc 9900
cacccatcta tccagccatg ctctctagtt cacctgaaca cttgggtgtc atcctagatg 9960
ctttcccttc ccagtcttct gtgatcattc tgcctcatca gaggctctct aatctgtctt 10020
ctttcctata tcgctcttgt ccctatttta atcctaatca tctatttcct gacttattca 10080
ttccttaagt tggtcagtaa tttaattaaa aacagattta ggccctgacc ttaaatgtga 10140
taagtgatat gaaaggagat gactggggaa aaggatttcc ctcaaggaag gcctctgtga 10200
agcctgaagc aagaatgaaa acgagtcaga cgaagagaga attgtatgaa tgaaggctct 10260
gaggcaggaa aacactcaga tcattccaga atcacttaga agccaagtga agccagttcc 10320
tggagagcag atcatcaaat gaagatggaa aggtgaccag gggccagacc tgtagttttg 10380
gtgggccttg gtgagggatt tacagtagga caccccatgg tttaagtatg aaagtgacaa 10440
gattccttta agttttaaga ggcctcgaaa tatgaaccac agattagatg gaagctactc 10500
tccctgtgtc tggacttttt agaatttcca agagctgctg tttctggaac cagattaata 10560
caagtcagtc ttccatttat ttatttatgt atttatttga gacagggtct cactctgtca 10620
cccaggctgg ggtgcagtgg catgaacaca gctcactgca gcttgggggc tcaagagatc 10680
ctcctgcctc agcctcccat gtagttggga ccacaggcac ctaccaccca gctaatttta 10740
tttgttgtag aaatgaggtc tcattttgct gcccaggctg ttcttgaact cttgggctca 10800
agcgatcctc ctgcaacatc ttcccaaagt gctgggatca ctcttccatt taacatgcta 10860
tctcaacgtc aagataaact ttaaaatctt tagataatag gctggcattt tacttaaacg 10920
atctttactt cttcagaact gccattccct ataaatatct ggttcttcaa ccacatcaaa 10980
ccacttgtga tctcaaaaag cctcagcgta cactgtcctt tctgtcattc taattcctcc 11040
tcatccttca aaatcaactc aaggaccaga tccagggaga agcttagtgg tgcccacccg 11100
aaccggcccc ctccttcgag ttgtgctgcc attcgggccc acctcttcac acagggttgt 11160
cagaccagac cagctcatgc gttcaccgcc cttgcaggga tgggatgcag ctgtgcacct 11220
ctcagtgccg acacctggag agtctcacga aatgttgaca acatggcctg tttccatttc 11280
ttgttcacta ggacttctca tttactaaca cacagaattt cctgtagtat gtccacttaa 11340
tcagttcaag cctaataatt ccttgatttg ggtatagtgc tttgcattta tatactgatg 11400
gtccccaact tacgatggtt cgatttatga tttttcaact tcatggtgat gtgaaagtga 11460
tacacattct atagaaacca cactttcaat tttgaatttt ggtctttttc caggctacca 11520
tactctaaag atagagccac agatcccagt cagccatgtg attatgaggg taagcgacca 11580
atactctaca gtgtattgta ttgccagatg gttttgccca actagcctaa tgtaagtatt 11640
ctaaacatgt ttaaggtagg ccaggctaag ctgtgttgct cattcagtag gttaggtata 11700
ttaaatgcat tttcaactta tgatattttc aatttacaat gagtttatca ggatgtaact 11760
ctactataag tcaaggatca tcttgtatag cacttttaat ttatagagtc ccttcaaatg 11820
tttgtttgta ttttatttcc actgcatccc tgtgaggata ccataagtta tacagctaac 11880
aaaacagtta gttttcctgt gcaaagtgat ggcttcatct tgtggcagat tacctggaat 11940
actgtggcca aggcatctta gttctactgt ctttatatat ctagtacagt tatattttta 12000
tggcagctct gatttcttct ttggcccaag ggttattaag agagggaaaa aatttaattt 12060
cttaacagat atatatatct atgtcaagtc atatatttaa ttcaaaccct taatattcct 12120
aggtaatttt tgtctacttt ctctgtcaaa gattgaaaga tacagggttt taagtttcca 12180
actgtaattg tagttttggt aattgtttta ttactaacag gtattgctct gtatattttg 12240
atgttctgtt attcaataca taagaattca ttacagttga atcatcatgt atagtataat 12300
ttaccaatgt aaaataacct ttttatcaaa ctgagtattc accttataat gtcctctgtc 12360
agaggattat aataccactt aaaacctttt aaaaaatatt ttgttcctga taattttagc 12420
tttgagtggt tttcttataa caattctaga gatgcgtttt tattttttaa ccaagattta 12480
aagctttgtg atttagtaag agtctaaacc attcacagtt catgcttttt tgtcaaattt 12540
ctattattta gtattttcct ctcttttata ttttcctgtt attttccatt tctattcttt 12600
tgttagactg gaaatttttt ctttgctttc ttttatccta gtgatttgaa atttatgtaa 12660
tatatactat tctacaatac cctttatttg ttttcaatat ttgaacctat atttttcaac 12720
attattaaga ataaaatagt atttgttgct attttgaaat gatagaccat gtttttaagg 12780
caggttggtg gttgttaagg caccagtatc ggccaggcac gatggctcac acctgtaatc 12840
tcagcacttt cggaggccga ggtgggcaga tcgtttgagc ccagcacttt ggccgatact 12900
gtggtttact gtattttgtt ctagtttatt ttatggaaaa tgggaattca gtggttaaga 12960
caaggattaa atagcagaag aaagatgtgt acatatgtac agatgtatgt gtcctttata 13020
tgttttttag tactcttgtc tcctttctgg tcctcattta aggttatcta tttcatgcag 13080
taaatttttc ttcacaattc atttcattta gagagtgaat gctaccttcc aagtgggctt 13140
tctccagttt tcctttcagg gacttaaagg agaagtgatg ttaacagttt tatatttcca 13200
ttgcatttta cagtgtgcag atgtcttcac atatatttcc ccatttgagc tttacaaaag 13260
cccttagtat tattctcatt gtctagattc caaaatcagg cttagaggag ttaaatagtt 13320
gtccaggatc tcaagatgca agacccacaa tcatgaacag aggcagatgt tcaggatgga 13380
ggcaagctga aactcaaaac caaatcatta tgactccaaa ttcaggagtc ttttagctgc 13440
cacctgcatg ggctcttggt gtagctgacc accagagttt gtagagctgt cattcaggtg 13500
tgccatggac tttcctggga cctggcacag gagaaggact gagttaatgt ttgctgatta 13560
aatatctgtt acaggctggg cgcggtggct cacgaccgta atcccagcac tttgggaggc 13620
cgagcaggga ggatcacttg agctcacaag tttgagacca gcctgggcag catggcgaaa 13680
ccccgtctct acaaaaaatt tgaaaattag ctggccatgg tgatgcatgc ctgtagtccc 13740
aggtactcag gaagctgagg tgggaggatc acatgagccc atgagattga agctgcagtg 13800
agctgagatg gtgccactgc actccagcct tggccataga gccagacctt atctcaaaaa 13860
aaaaaaaaaa aagttacaat aatcttccct tcaaagctgg aaggcattat ttacctgtct 13920
gtccagcaga tggtgctaca taaccaaggg aatctgttgc ttgcccttgg tgaagctatt 13980
aaagccaata cagatcttga gaatttcaaa agcaaaaatc aatactggat tatgagtgct 14040
ctaggaaaat aaagagataa attttcaatt tacatactta tatatagtta taccatattt 14100
gtaaataaaa atatataaat aatttatcaa aattcctttt taacagcaac aaccacagta 14160
aacccacagg ttaaaaactc cacaacagtc tatattaatc agtcaatgca aagtacattc 14220
caattccaag ttaactgaaa ataatcaact taatcatttg gttggctctg agcagccttc 14280
actgcttgct cttgtgtcat gtttctttct gtcctcgatt ggctatagac ttacagacgg 14340
cttttgcaga ggacagtgta ctcatgtcca tcctttgcat cctttgtggg agttggctag 14400
gcagcactct ccctggggac actatgaact cctcttcttg agtgcagaga tcacgtcttg 14460
ttcatcttca tgcccaatac cttgttccat aaatatgaat ggattagaat tctaaactct 14520
taactctgcc ccaagacagt tctgagaggt agtaagtcat ataacacctg aagaggactg 14580
ttcttgtcct aattacatta ggttataaga tgacaggtga gggagccaaa ccagggggcc 14640
tggaaattat tcatacatct ctagatacag tatacaagtt gtgtgtatta tgtgtattta 14700
ctctgtaatt gattgcttga gatgaacccc caaacacact cgtgtttgga tcattattat 14760
ctacccttct ccttaaataa tcttaatttc ctatgatgct tgaaagggaa agaggggcca 14820
ggtgtggtgg ttcacacctg taatcccagc actttgggag gctgaggtgg gagcatcacc 14880
tgaggtctgg agttcaagac caacctgacc aacatggtga aaccctgtct ctactaaaaa 14940
taaaaaatca gctgggcatg gtagcacatg cctgtaatcc cagctacttg ggaggctgaa 15000
gtgggagaat cgcttgaacc tgggaggggg aggttgcagt gagccgagat cactccattg 15060
cactccagac tgggcaacaa cagtgaaact ccgtctcaaa aaaaaaaaaa aaaaaaaggc 15120
agagtgggga agagagctgc atgaaggaga gatttactaa atagtactta atcccaaaat 15180
aatttctata ggtttgaata tgatccctga aatttattat aggttcaggt aagtattaat 15240
cacgggtatt cagaactgtg gtttaaaaaa tgtatagaac atgtttcctt ccccttgaaa 15300
ctttttatca gctaattata ggaattatat tatacctgca atcattaaag tccagaatga 15360
gacagtactt ggtaaagtgc tgaaatttat aataaatgca ttatagcaat ccagttaagg 15420
aggaagagcc accattattg aacatttgtt aagtgtcagc cattgtacta gataaatttt 15480
agttattatt tttatttagg caccaaaaaa tccatgggat agttggttat ccccatctta 15540
ctgaagagga aactgaagct cagaaagttt aagcaacttg cacaggtcac atagcaagta 15600
aggagcatgg ccaggaatca gaccctgatc tcctttggtc tactaagctt gcaaaggatc 15660
ttcccgcctc cttccaagac cattcaatat tatcagtaaa tgtccatggc aaggatgtag 15720
ttcgagttat agggttccat tcaagatatg attggtaggt gggaagcaga tatgtctgtg 15780
tcaatcagta tcctggaaga aggagatgat gaactcaagt ggtgattaag ggaagtttaa 15840
tgaagggact atttacagag atgtggtggg gttaagagaa ccaacaaggg gaagtgatgc 15900
actcaaaaag ttactacctc caggctttag gggattgggg gagggagtgg cacagtgtga 15960
acccagtgtg gttgtgagaa aagggattcc ctcagcagcc atggccaagg ttagagtctc 16020
cactgccaaa ctgcatccag gtggtgaggg aatggagaat aggggtgggg taacaaactc 16080
tgacctcggt atccccaaag ggcaaaggat tccaggtggt acagttcgta aagattagcc 16140
tcagggcaca gaacagggca gagaagaatg gagaattgat ctggaggaaa caaacaatgg 16200
cttgcccatg ttattgcagg gagagtaggc tggtgtgcac agcaggaggg tggggagccc 16260
agcatatagc tgtgttgggg cctgtgcaga tcagcctcac tggcagggag gatctgagcc 16320
gagaggtggt ggaagatgaa atcgagtagg catgttggta gtcctaaata tcaagtaaac 16380
gttcctgatc ttacattgat actcaatagt aagccaattt tgtttcccat aagccaatat 16440
taatattacg tatttctttt ataagccaga gatatagaga gataccctag aagaatgata 16500
ggggaaagga aggcaagggt gagagaagac cttgtgtgaa tttgtccaaa atgtttatcc 16560
acaggaacaa tccctttgtg aaggctgctg gtatgtgaat gtgtgccggt tcccttgggg 16620
cgttcatttg gatctttctg tgttccag 16648
<210> 238
<211> 19640
<212> DNA
<213> Homo sapiens
<400> 238
atgtcttctc tctcttacag ctcttcaaat tcatcaattt taacaggacc atgagccagc 60
tctcgacaac catgtctcga tgtgccaaag acctgtttgg ctttgctatt atgttcttca 120
ttattttcct agcgtatgct cagttggcat accttgtctt tggcactcag gtcgatgact 180
tcagtacttt ccaagagtgt atgtaagtat atatgaaatt aagaagaaaa atttaatcag 240
agttgtcact gcttctcaag aataaatctt catatgaggt tgctatatga ccaccaatta 300
tttaaaacca gttattttaa gtaagaatta attacctttt cccaaaacat tgatctaccc 360
atgcaaagaa gacaatgcat cctgaaatgc tgatgcttaa gatagcagcc caaagtagta 420
aaatacagtt aacagacata ggaaaccaac actgttctga agactgagtt tttctttgca 480
ccaaatgcag atggtagctt ctagaaggct gtttgcctat attcttactc ctgttgaata 540
ttgttgccat atatttagaa cttcaagtta ttttctaagg aaaaaaacaa gatatttcta 600
atattctaag gtaaactcag accagtacaa gaattttcag tttttttttc caaagatccc 660
aaatgtgaaa taaaacaaca aaaagcagcc agtgtcagat ttctatgcca tttagaaagg 720
agttagttta aaaaggaatg gaagtaatag ggttttgtgc atagatatct cgaattaata 780
ttgctgttga taaaagtgat tttgctaaga cccagcactg acaacacttg gccactttga 840
tcccatttta agtacttgtc agaatattgg atctttgaac tcaaaccatt ttgggttttt 900
ggggtttttt tgttttgttt ttttttgttt tgttttgttt ttgaggcacg gtcttgctct 960
gttgcccagg ctggagtgca gtggtgcaat catagctcac tgcagccttg aactcctagg 1020
ctcaagcaat cctgctgcct cagcctgctg agtagctggg actacaagtg tatgccacca 1080
tgcctggcca atttttaact ttttttatga gaagggatct cactgtgtag cccagggtgg 1140
tattgaactc cagggcctca cactgtcctc tcacctcagc ttccaaaagt actgggatta 1200
caggcatgag ccaccacacc aggccctgtt gttttttttt taaagaaatt tttaacttta 1260
gaccgagggt gactgttgtc aaggtttagg gttaagatgt tttacctaga ttatgtgttg 1320
aaatgttata gccaattgct ttataagtta ttgaataata attgtatttt cttttttttt 1380
ttttttttga gatggagtct cgttccatcg cccaagctag agtgcagcgg tgtaatctca 1440
gctcactgca acctctgcct cccgggttca agcgattctc ctgcctcagc ctcccgaata 1500
gctgagatta tgggcgcacg ccaccaagcc cagctaattt ttgtattttt agtagagacg 1560
gggtttcact atattggcca ggctgttctc gaactcctga cctcgtgatc cgcccgcctc 1620
ggcctcccaa agtgctggga ttacagacgt gatccaccgt gcccagcttg tgttttcttt 1680
ttaaccaaat ggaaataacc tctgtagcat gaaagcattt tattattatt gcagaaggct 1740
ttaattgctg atacaagtag caagactttg taaatgggat tgacaatttt ctgttattcg 1800
gcagctacct atactgctaa aaggtccaaa aataatgaaa tcatctttaa gaaatgttgc 1860
atcaactagt ggacattctt tgtttttgta ttgtggtgtt ttgttttatt tttatagctt 1920
cactcaattc cgtatcattt tgggcgatat caactttgca gagattgagg aagctaatcg 1980
agttttggga ccaatttatt tcactacatt tgtgttcttt atgttcttca ttcttttggt 2040
atgtacattt ttatttatag tgaggttcaa tttaaacttc gtaaatcctt gtcttctctt 2100
ttctctcaca ctttatgtcc tatcaatttt aaataaagac ccaggaagta gaaaaaagtg 2160
tggatgttgg aaaacttatt ttccttttat taattcacag ttttgagact catatcaaat 2220
gtcttttctg tggtctttca ttgatccatg tatatgtgtc tattcaatgc aaaaaaaatt 2280
agatctcttc catggtcttt catttctctc tctatatatg tatctattcc atgcaaaaaa 2340
gaaattagat caagtacaaa tttataaaga tacctaaaat agtgctttgc ctaaaaagta 2400
gaatatgctt acatgctttt taaactcata tgtcagcact ttcgtagtca cttgctagca 2460
tgacttttct ctctttcttc ttttcttttt aaaaaataag aacggaaaag caagctagat 2520
ctaagatgtc gagtaatagt tgagtgaatc attgcatgtc aaaattagga tattctgttt 2580
taaattattt atatcccatt catctagaga ctgcctacag agaatattca aataattaag 2640
tttaaaacta aatgtaacaa tgaatggaaa ttgcattaaa attattttca aaaataattt 2700
ttttattctc ttgatttggt acaaatgaac atttttaatg tttttgccct aagtcaatta 2760
agttttttta aggtgttttg ttctttttct taacatttat atattcaatt gtctactgag 2820
aaggtgttaa gccagcttaa tttaggcaat atttttcatc taaacactaa cagtcatctt 2880
aagaacaatt ttcttaagaa aataacattt tttccatttc agtaaattgt gtaaagatcc 2940
cttgaggaag gttaagtgat cacattttca gtaattcagt gtaataactc taaagtcagt 3000
ccaggtatta ctggttaagt atatggtatt tattgattgg gtattagatg tactgtatta 3060
atttcctgtt taaaaaaaat tttttttccg gggagacaca gcctctggtg taaaacaaag 3120
gtgtgttccc tagctgtact ttaacaggac tgaaaaggtc aggaatatca ttcaagttca 3180
tatgtatctt gctgtatgca tggtttatgg ctcattttta aacttacacc tcttaagctt 3240
cttcttccta tcatatatta aaacaatgga gagaagaata agcctctgtt actctaccat 3300
tgatagtact tcggattcta gagtacctga atctctacta agaaggcaaa aaccaggaat 3360
tgagagtcct gcacctgacc cttcagttga tctcaggcca cctagttttc tccgtttatc 3420
aatctgccaa acaaggatgg atagagtcgt ggcaactgga aaggctcaaa tgtggaattg 3480
tttgaatgtg gtcctttagt aggcagccat cttaccagat ctagagtatt cagtcatctt 3540
accagatcag tcaccagaac atgaaaagaa gctcttagtt tctatcttta tactaaaatt 3600
gtttttttgt acgactgcac aaaaaagaat tgctctcctt gcacctccca gagatatagg 3660
tggatagata catacatacg tacatacata catacataca tacatacata catacataga 3720
cacatacata gatagaagtc tactttcaat acaaacctgt cttttaagga aatgacaagc 3780
tgagcatagg gttggccacc tttctgagcc gattgcctgg tattagttta ttgcccctgt 3840
ttagcaagaa ggcacagtgt taagaagtgg ctcagctgaa ccaggataac cccactcttc 3900
ccccacatca acaggaaaga catcctggtg cagatgtcca tctgataatt cagggaacct 3960
cgggagacag gatggagagg agggtgagct agcttcctct tcccacacct tcaagagcct 4020
ttctcaagca ctttctattt tttgaaatct ctttagaggt cccagacttt gatctgtttc 4080
aattaaggta ttggcaggca ttagttaaca gccacttgga agcaaaaata gaacattaga 4140
tccctgagtt ggaagagaga aggtagaagg tgttacttgg actgcaatta tctgcacttg 4200
gaattgagca tttagtcaaa aacttatatg tattctatat tctattctca tttctgctac 4260
agaattgtaa acaatattct tccttaatac agaaattcat agcccactaa aataagagcg 4320
ttctcatttg ttcatttctc aatcatttaa taagtattta ctaagccact atatccatat 4380
atatatatat atcatatata ctgtataata cacactgtag tgttttttgt ggattgtgta 4440
ctatgaggta gtatgttaga tactgccagt actggggtaa ggaaaacagc ctgattaggc 4500
ccttacgaag attcctcaga cttgtgggga aaacagacat tatcaaatag aaatacttgc 4560
aaaccacagt tatgtgttaa aaaggaaaaa caaagtaaaa aaaaagttgg tgggggggaa 4620
cctgatctcc tggatacagt gcttcgagaa agtttgttgt tggaaatgca aaccattact 4680
actgtggaag ggaaaggtca gaaaaatgaa ctcaccatta ctgaatagta atagtagcta 4740
tcaattaggt ggcacttacc tgcatcagga cctgtcctga gcactttaca tagattgtct 4800
cactaaccag cccaacaaat atgtaaggga gatactatta tttttcccat tttattaatg 4860
taaaacaatt aaataattct ttaaaattag acttagaaaa gtggagcaac aatcttagca 4920
gtgctaggac tgaaatccaa gtttgcttga ctccaaagtc tatctctctt ccagaaactt 4980
tttctttact atctgcctag taggcctgct gtattcctat ttgcaacagc cttttaaact 5040
ctttaaaaat gtgtcctgta aatttcatat atgattatac aaaaaaactt ggaataagca 5100
tacaattcta cttatctgtg ttaactgttg aaatttgaag agctttttgg aattctatac 5160
ccttcagtag tgtatgtaaa agtttctaaa tatagagaac atagataagc aaaaataata 5220
ttaaataaaa taatcgcacc attagtaggt aaatatacta atattttgtt gtattttatt 5280
cttgtatgtt ttcacaaagt atatcataaa atttttcctg tggcatgact taacggagaa 5340
aataatcttc ccaaaacatg tggcagcaaa actgttaatt tattacatca ggctgggcac 5400
agtggctcac gcttgcaatc ccagcacttt gggaagccga ggcgggcaga tcacttgagg 5460
ccaggagttc gagaccagcc tggccaacgt ggtgaaacac tgtctctact aaaaatacaa 5520
cagttagcca ggtgtagtgg cacatgcctg taatcccagc tactcaggag gctgagactc 5580
aagaattgct tgaacccagg aggcagaggt tgcagtaagc tgaggtcgcg cccctgcact 5640
ccagcctggg caacacagtg agactctgtc tcaaaaaaaa aaattttttt ttaaataaat 5700
aaataataaa tttatgtctt cataaagcac tcagattagg aaaaaaagga taaacaaaaa 5760
ggcatgtgtc atttttttga ttgataattc caaattatgt ttcttccttt aatttttgcc 5820
ctcctttcat ttacaaacag aatatgtttt tggctatcat caatgatact tactctgaag 5880
tgaaatctga cttggcacag cagaaagctg aaatggaact ctcagatctt atcagaaagg 5940
taggaaaaac cttaattctc agaattcttc tgtttctgac ataaaatgag cattgtttca 6000
cccagatttt caaatcaaca ttgatccatt gaaattgttt gaaataaaga atacattgct 6060
atatttcagg aataatttaa atgttcccta tcttggagtc ttgatggata tactgctatc 6120
ttgaatttta attctgggaa tccttttatg ccctggaatt aaattctcaa caatcttttg 6180
acactttaag agctgagctg aaggttcatc accttcatta ttttgacatc tcctgtagct 6240
ggctctcact tcaggatcct gagttgagaa taaactagaa gggaagatta tataaaggga 6300
tttccacctc ttctgtctca attaccattt taaaaaaata aaaagtttta gaggaaaaca 6360
cttagtagtt caccctttac ccttgacctt ccacggcagt tttaaaataa gcaaaggaaa 6420
agattcatga attcaggcca tagcctgggg cctgagaact tttacttatg caccttctca 6480
ggaagggttt cattgttaaa tagaagggca ggacaggaaa gttgggcctc tttgttcttc 6540
tcaatgtaac ttctttattt ggtttaaagt ataaaatgta tacaacaaca aataaccaca 6600
tttaaaatac acagtttgtt tcccaacatc attttgctaa gtcatagtgg ctccttaact 6660
gtaatttttt tttttattag tccaagcctt aggattatgt tatctgtgat atatgttata 6720
atagaaaact taagcctctt aaaacaaagt ccttgggatg ggacctaaga ttcacattat 6780
cttgattccg cataacagtt gcttacattt tagcaaatct ccagtgtgta tgcaagcact 6840
cctcacttgg cacaattctg atacacacaa actttggtta ccccagtttt gttatgtaac 6900
accaccttca acaacacagt tcaaatttca gttatcatag tatattaact ctgagtaaca 6960
gcacaaagta caaactccac tgctagctct tcagtgtata gatcagttac ctgagtaaca 7020
gatgtgcagg ctgagcaggc tcactggtca gtcatgacac tattttcagt ctgttactaa 7080
ttggtcactg agcatctgct atccaattca caaacaaaga aagcatgtag tgttgcttcc 7140
ttgtgttcca gtaataagcc catgtgacat tttacaaaaa tggataattg aaaaagagaa 7200
tgggtgcagt ggctcacgca tgttgggagg ccaaggcgga tggatcacct gaggtcagga 7260
gttcgaaacc agcctggcca acatggtgaa accccatctc tactaaaaat acaaaattag 7320
ctgagtgtgg cgacagatgc ctgtaatccc agctactggg gaggctgagg caggagaatc 7380
gcttgcacct aggaggcgga ggttgcagtg agccgagatc gtgccattgc actccagcct 7440
gggtaacaag agcgaaactc cgtctcaaaa aaaaaaaaga aaagaaaaga aaagaaaaag 7500
agaatgggct agcaaagaaa tgaaaaatgg taacactgga agtgaaaatc aaaacagagt 7560
aatggattta tagaagaaat agctgagtga agaagaaata ggagtgttga cactgcgatc 7620
attcaagaga tccagatatg gagccagaag aacttagggc aggtctatca acttaaatga 7680
ggaaaatagc tgtgataaaa cagatgaaga tgtcttgagg aaatgatgcc tgcaaaaaac 7740
ttcacattaa gggaagtctt attagagata tttcacaata atgaaagtac aaaagaaaaa 7800
atgttggggc tggacatggt ggcttactcc tgtaatccca gcactttgag aggccaaggt 7860
gggtggatca cttgaggcca ggaagtcgag acaagcctga tcaacatgat gaaaccccgt 7920
ctctattaaa aatacaaaaa ttagccagac atgatggtgc acacctgtaa ttccagctac 7980
tcaagtggct gaggcacgag aattgcttga accagggagg cggaggttgc agtaagctga 8040
gattgcacca ctgcaatcca gccaggtgac agggtaagac tgtgtctcaa aaataaataa 8100
aagaaaaata tgttggaagc tcatccacat ttaagaagga atatgacaat tcactaatgc 8160
atagaaaaga agttcactcc acattgtaaa gtgtacagtg taatattata caatgaaaac 8220
aaggcaagtg ctgtttaaac tactctggat acatttttta caaagaaata aaacacttta 8280
gtttttaatg tttctaatgt tttacatttt agtgtattaa atcaatatta gttttcttct 8340
tttttaagct ccctatacat ttataactga cactaaggga gtgtttaatg ttttgattaa 8400
aagttgtaaa gatcacagaa caattgtaat tcttcccact gattattcag atcattttgc 8460
acaatttcag cttgcatggt cacttacagt gccgcactat gtgcaaagca aggtcaggtc 8520
taaagttcgc taatgaaaaa tcctcggcca ggggcagtgg ctcacccctg taatcctagc 8580
actttggaag gcgaggcagg cagatcgctt gagctcagga gttcaacacc agcctgggca 8640
acatggtgag accctgtctc tacaaaaaaa aaaaaatagc aaggcgtggt gactcacacc 8700
tgtagtccca gctacttgtt gggggctgag ttgggaaaat cacttgagct caggaggtcg 8760
aggctgcagt gagccagaat cacgccactg cccttctgcc tgggtgacag agtaagatcc 8820
tgtctcaaaa aaagggaaaa tcctcatcta catttcactg ggttttttgt ttgtttgttt 8880
gtttgtttat acacacttaa ggaaattact gtctagaaga tagataatat aaaaaataaa 8940
aatgcaattc atgattcggg tttcttggta ttcctaagaa ctgttgcaca gtactttatg 9000
ctctgaggca gacagctata gcatatatag taatttttgt ttctatcaca taaacttgaa 9060
tacacatatg agtaaaagac ctttagttct tcatgactta ctgaaagacc ctgacttttt 9120
ccatgtaact gttccacaag tgttttatgg aaaactggat acattaattc ttcattcatc 9180
cagcacgtac ttgttgaatg gccaatgtac accaggtttg tagtagttac tactgtgaat 9240
ggaaagtaaa acagatgcaa aaggagaata cactaaacca agtcttttat tttttctctc 9300
tctgataggg ctaccataaa gctttggtca aactaaaact gaaaaaaaat accgtggatg 9360
acatttcaga gagtctgcgg caaggaggag gcaagttaaa ctttgacgaa cttcgacaag 9420
atctcaaagg gtgagaatca tgcttcctga ggttctgaaa aattcctgct tctaaagata 9480
aattcctggt gataagagta tttctagccc aagggctcat acagatactt tttttttttt 9540
tttccagagg caggtatctt tctggaacat gttataagag gaaaacttgc ccccatttgg 9600
tgatttctcc tttcctcctg cattttgatg tctctgtgtt gagggtgaac tgggtacaag 9660
gaatgatttt tatctgtatc ctctctctaa tttcaggaag ggccatactg atgcagagat 9720
tgaggcaata ttcacaaagt acgaccaaga tggagaccaa gaactgaccg aacatgaaca 9780
tcagcagatg agagacgact tggagaaaga gagggtgggt ctggtttagg agaaccggat 9840
ttgatttggt acctacaaca ccacagatgt atcaaacact atagaagtag tgggttattg 9900
agtctcttgc ccattcccca ccacactctc tctctctctc agtcggttta tgtgttagta 9960
ccctgtttat tccagaaaga atatataaca caattatgta taaaaatggg tggttagcat 10020
gatataaaaa cgtcaaaatg aaaagcaagc aaaacaaaag taaaaataat ggattattaa 10080
tgaagcttaa aaatgcattc ataaaaacac atatgcttat taagattggg ctacaaattg 10140
ggccctaagc ttgctggtaa tcagcttgaa aagagaagcc tgattagctg cagagtccac 10200
aatgtccgtg agagtgaaga aaacaaaaaa tgacttacca agagatgtga aattattctg 10260
gttagttagt ggctatttaa attgttaact tttttttctt tttttttttt ttttgagatg 10320
gagtcttgct ctgcctccca ggctggagtg cagtggcaca atcgcgactc actgcaacct 10380
ccacctcccg ggttcaagcg attctcttgc ctcagcctcc caagtagcta ggactacagg 10440
cacatgccat catgcccggc taatttttgt atttgtagta gatatggggt ttcaccatgt 10500
tggtctcaaa ctcctgactg caagcaatct gcccaccttg gcctcccaaa gtggtgggat 10560
tacaggcagt agccaccgtg cctttcctaa attattaaca tttataataa aattaacagc 10620
cgccttccat ttgaatactt tttacaaaat agttaaaaat aaacataagt gggcttttat 10680
agtcagaaaa aaaaattcaa agctttacca ttaactttca aaaataaatg gttagacagc 10740
aacaacaaaa atctgtggta actgaggtac agagaacaca gatgaatgtt attacaaaag 10800
ccactttcct atgagaagtc taggacagtg gtttctaaat gccactccac agacagtgct 10860
agtaggtgac agacttctcc agtcacagtg aaatttaagc ataaagaaaa tgaggaaaat 10920
ttttacaagg ctctatttag acaaagttct tattctgaca ttacatcttt cctactttgg 10980
agctgttgaa tgtattatct tttatgaaaa gaaggcgatc caggttgagc atccctaacc 11040
caaatatgtg agtctgaaat gctccaaaac ctaaaacttc ttgagcacaa acatgatagt 11100
caaaggtcat gcttaaagga aatgctgtca ttggagcagt ttggattttg ggttttcaga 11160
ttagggatgc tgaaccagta agtataatgc aaacattcca aaatattttt gaaaatccca 11220
aatccaaaac acttctgatc ccaagtattt caaataaggg atactcaacc tgtaatatat 11280
ttcttcattt ctttatttat tttattatta ttttaagatg gctcatggcc cactgcagcc 11340
tcaaactcct aggctcaagt gatcttccga cctcaacctc ccaggtagct caggtagctg 11400
ggactgcagg catgcatcac catgcctggc taatttttta aaaaattttt tgtggaggca 11460
gagtctcacc ttgctgccca ggccagtctc aaactcctgg cttcaagcag tactcctgcc 11520
tcagcctccc aaagtattag gattacaggt gtgaccacta tgcctggccc atatttcttc 11580
atttagtttt ttctttgcct gctgtgtttt taatgttctt tcttgttcaa acaaaaagtt 11640
ggctattcct tgctgttagt taaatttgcc aatctatgaa actgaaaaat gcaggagtcc 11700
cagcctggtg ttaaatacaa agaaatccca ggtaaatggc atgcacccag ttcctgcttg 11760
cccaagtcct tggtgaggct tctgtggggt ctcagtgttc tgctcctcac tcagtgaccc 11820
cttgttcttc aggaggacct ggatttggat cacagttctt taccacgtcc catgagcagc 11880
cgaagtttcc ctcgaagcct ggatgactct gaggaggatg acgatgaaga tagcggacat 11940
agctccagaa ggaggggaag catttctagt ggcgtttctt acgaagagtt tcaagtgtaa 12000
gtataaagga attggcagaa tttgcgttga caagagtcca catgagacca ggcagttccc 12060
tcatctctct gaattcactc ctttccatta ctaatcatcc agcttttaaa aataacttat 12120
actggccaga cgcagtggct catgcctgta atcccaccac tttgggaggc caaagcaggc 12180
aggtcatgag gtcagaagtt cgagacgagc ctggccaaca tagtgaaacc ccatctctat 12240
taaaaataca aaaaattagc tgggcatggt ggtgggcacc tgtaatccta gctacttggg 12300
aggctgaggc aagagaattg cttgaacccg ggaggcggag gttacagaga gccgagatgg 12360
ctccactgca caccagcctg ggcgacagtg caagactctg tctcaaaaaa aaaaaaactt 12420
gtcaattggt gttttgtttc ttacataata tgtttactat aaaaattagc aaataagagc 12480
aaaagaaaac attaacattt cacatatttc taccaatgaa aaatgtttat taatatatca 12540
gtgtttgtgt ctctatttgc atgtgtttat caatgtttct atatattttt atggcctaac 12600
atatggttcg tcctgaagaa tgttccttgt gcatttgaga agaatgaata ttctgctgtt 12660
caagtgttct gtagatgttt gttaggtcta gtttgtttac agttttattc aggtctccca 12720
tttcctggtt gatcttagat gtgcctagat gtggtattca cgtttgaaag tggggtatta 12780
aagtctccaa gtattattag ttggagttca tcccttcaat tctgtaaggt tttgctttgt 12840
gtattttgga actctgttgt tgggtgcata catatttata actagtatat tttcctaata 12900
tattgaccct attttctctc tcaacttaat gaggctaaag aaaaaaaaga attgaccctg 12960
ttttcattac aagatgttat ccactttatc tctagtaaaa ttctttgttt taagtatttt 13020
ttgtttgata ttactgtaac cactccagct ttcttttggt tgctgtttgc atgataaatc 13080
tttttccatc cttttacttt aaacttattt atatctttca gtctgaagta tgtctctcct 13140
gtagacagca tataattgga tcttatcttt ttatccagtt tgacaatttc tgtttttgat 13200
tagattgctt aatccattca tttaatgtta tcattgatgt agttgatttc tgtctgctat 13260
tttatttttt gttttctagc ttactttttt ttgttcctct ttcactgctt tcttgtacat 13320
taagtgaata ttttcaagta taacatttaa atttttttaa tgatttttca ttttttttag 13380
tcaggagttg ctctaagact tagtttatac aattaagtta tgaaaaatta cttcagatat 13440
atattaactg aatccagtga gatatagaaa tcatttctat ttagcttttt tcctcttccc 13500
tctttttgtg ctatatattc atctatctat atgtatatat agtcatctac atatgttgca 13560
aatcacattg ttagaacaat gttacatttt tataacacac tgtgtaatat atagtatata 13620
attttatatc tcttaatgaa gctgagagaa gaggaagtat atatttataa atgtgtatat 13680
taacctactt ttttaccatt tctaattctc ttcttttgct cctctggatt caagttatca 13740
tctgtcgtca ttctctttct ccgatacagc tttgctactg cctacctcct attattgtca 13800
aatatattac atttctatta tagaccttca gatccaatta tgtacatatt tttacacaac 13860
tgctttttaa atcagttaag gaacaaaagg agaaatgtac atatatacta tattttatac 13920
ctacacagtt atctttacca gtgttctttg ccttttcatg tggattctga ttactatctg 13980
gagtcacttg ctttcagcat aaagaatttc ctttagtatt ttttgtaaag caggtttgct 14040
agcaatgaat tctttcattt tttgtttatc tgagaatgtt tttctttctc cttcatttcc 14100
tctggcttgt attgtttctg atgagaagac aggtgctaat tttactgtgg tccccttgta 14160
catgatgact caattttctc tcaccacttt caagattttt ttgcttttgt ctttcattat 14220
ttttactgtg atatgtctgg gtataaatct ctgagttcat cctacttaga aagtgttttt 14280
tctgcttctt tcactttctc ttctcctttg ggacccgcat tatgcatatg cttaggggta 14340
tcacatattt ctcttaggct ctgttcgtcg tcattttttt tccctctctg ttcctcagag 14400
tgcatagtct gtattgatgt atcttcaagt tcactgactt gttcttctgt cagcttgctt 14460
aaatctctgt tgagctcctc tagttattta tttatttatt tatttatttt atatatatat 14520
atatatatat atatatagag agagagagag agagagagag agaaagagag agagagagag 14580
acagggagac agggtctcac tccatcaccc aggctggagt acagtggtgt aatcatggct 14640
ctctacagcc tgaacacctg ggctcaaatg atcctcctgc ctcaacctcc caagtagcta 14700
ggactatggg cacatgctgc catgcctggc taatttttaa aaaaaaattt gtagagatgg 14760
catcttgtta tgttgcccag gttggtctca aactcccggc ctcaagtgat ccttccgcct 14820
cggcctccca aagtgctggg gtcacaggta tgagccaccg cacttagcct gaatttttta 14880
tttattatac ttttcaactc cagaatttct atttggttct ttttagcaat ctctgtctct 14940
ttattctgta tttgatgata tcctgtattt gatgagacaa tgtcatcata acttcctttt 15000
ttttttaaga gatagggtct ctctctgtca cccaggctag agtgcagtgg catgatccta 15060
gctcactgca gcctcgaact cctgaactca agcaatcctc ccacctcagc ctcctaagta 15120
cctgacacta caggcatgag ccactgtacc cagctaattt ttattttttg tagagatggg 15180
gtctaagttg cccaggctgg tctcaaactc ctgggctcaa gtgatcctcc ctgctcaggc 15240
tcccaaagtg ctgggattac aggcatgaac cactggaccc agcctccttt atttctttaa 15300
ccatggtggg gttttttatt atttgtttgt ttgttttaac ctgtttgaat atatttataa 15360
taggtacctt caggtctttg tctgctaagt ctgacatctg ggccctctca aagacagttt 15420
cagttgtctt tttttttttc ttcttgtgta tgggaacatt ttcctgtttt tttgttttgt 15480
tttttgttgt tttgttttgt tgttgttgtt gttgttaaag attggacatg ttagataata 15540
tattgtagga actctggcta gtgattccct ttcctcccca ggacttgttt ttatttctct 15600
ttgcttgttt actttttcat acagtctgtt tccccacagt gtctgcctct gactttattc 15660
cttagagggc gcagctgtgg ccatgtacgt agtcactctg ggaagacagt ggttttagca 15720
gcgtgctcat taactttctc tgacctcttt gttatacctc ctgcctctgt ggatattaga 15780
cccagttatt acatttcatt gtttactgat tggtctattg ttttccagaa tgccttggga 15840
tgtaatttgc tccacagtct gatccactta aattcaggcc tctttgcagg gctagtttta 15900
gaggccagtc tttttttttt tttttttttt tttttgagac agagtctcac tctgttgccc 15960
aggccggaat gtagtggtgc agtctcagct cactgcagcc tcaatctctc aggctcaagc 16020
aatcttccca cctcagcttc tcaagtagct aggactacag gtgcacgcca ccatgcctgg 16080
ttaatttttg cattttttat agagatgggg ttttaccatg ttgccccggc tggtctcaaa 16140
ctcctgagtt caagcaatcc acccacctca gcctcacaaa aggccgggat tacagatatg 16200
caccaccacg cctggcccct gaggccagtc tttaactgtc ttcttagctg tctctttccc 16260
tggttctctc tggtgaacta gctggtaatt tgtttatctc ataaggctac cagattcctt 16320
gtaaatgctt atccccacaa tctccattgt tttcaagagc atcgttagtc tttaatttcc 16380
tcacgcttca ttccaaataa agtccattca cttgagaaga gttctatatt cctatgacct 16440
gtgtctcccc atgagcaaaa ctgctactgc tttacagagc cagggacagt ggcccacctc 16500
tctgtggcat cctgctttat gaacaagtca ctgggctcag atggcagtct ctgattttct 16560
caccttgctt cttctggcat ggaaactcca ccctacaagt gggaactgag tggaagaaga 16620
gagccccatt ccccttagcc actcttaaca ggattagaac ctctgcaaca tgcatttaag 16680
aatgggaaca ggctgggcac agtggctcac gcctgtaatc ctagcacttt gggaggtcaa 16740
ggcaggagga ttgcttgagc caggagttca ggaccagcct gtgcaacatg gtgagaccct 16800
catctctaca agaaatagaa aaattaactg gtgggttgtg tatacctgta atcccagcta 16860
ctcgggagcc tgaagtggga ggattgcttg aacctggagg cagaggttgc agtgagtcaa 16920
gattacacca ttgcacgcca gcctgggcaa cagagtgaga ctctgtctca aaaaaaaaaa 16980
aaaaaaaaga gtaggaacat tgaggctggg catggtggct catgcctgta atcctagcac 17040
tatgggaggc caaggcagga gtatcacttg acgctaggag ttcaagacca acctgggtaa 17100
catagcgaga ctttgtctct attaaaaaaa aaaaaaaaaa aggtgtaaaa aacttttgta 17160
acaagagtgg gaaagccggg cacagtggct cacacctgta atcccagcac tttggaaggc 17220
caaggcaggc aggcggatca cctgaggtca ggagtttgag accagcctgg ccaacgtggt 17280
gaaaccccat ctctactaaa aaatagaaaa attatctggg catggtggtg cacacctgta 17340
gtcccagcta ctcgggaggc tgaggcagga gaatcacttg aacctacgag gcagaagttg 17400
cagtaagcca agatcacgcc actgcactcc agcctgggcg acagagcaag actctgtctc 17460
aaaaaaaaaa aaagagtgga aatgttagga tgagaaatgc tggcagcctg cccctccctg 17520
ggagatactg tagccctaga ctggaagttg ggggaggagg gagccctgtg ctcttagctg 17580
cacccatgtg aagttgtgct tctatcacat gagctgggga caggagagaa ggctcagatt 17640
atggcttcag tgccacagaa tctcttcata ctaaaattta gtagattttc ttgaataaat 17700
gctttttcat ttgctgtaca cccttaaaag tttctagaaa tttttaatat ttgagtttta 17760
aaaaataatt ttcaacagtt acagttattt cactaaagag agagtctaca gaaccctctt 17820
gccaccattg cagaggttgt ctttggctta cgagttttta aagtatttgt atacattttt 17880
taagttcaaa ataatagaat tgtaagtgaa catgctgttt tcatactgtt tttcaagctt 17940
tatttaatat attgtaaatc taattctatt ttattaaata gtctgccaca gtataatgtc 18000
tgatgtctcc ttagaatttt attgtatgga tgaacaatga ttatttaatt tcctaccaat 18060
tgttgggtgt tttttgtttg tttgtttgtt tttgagactg ggtctcactc tgtcacccag 18120
gctggagtgc aggagtgcgg tggaatgatc acggctcact gcagcctcaa catcccaagg 18180
ctcaggtgat ccttccacct cagcctcgca agtagctggg agtacaggca catgccacca 18240
tgcccaccta ttttttagag atgaagtttt gccatcctgc ccaggctggc tcgaactcct 18300
ggcctcaagc gatctgcaca cttccgcctc ccaaaatgcc aggattacag gcgtgagcca 18360
tcatgcccta cccccccatc aattgtttga tgtagccatt tttcaatgat ccgcgattaa 18420
gaagcagcac tcttttatag ccaaaaatta cacatatata aaattttcct ttagaaaatg 18480
ttctaaaaat ggaatgtcta actaaagggt taggcataca ttcttaagac ttctgatacg 18540
cgctgacttg caggaaagtt gtttcagtta acactcctac cagcggcatc cgagagttaa 18600
tctgtaaagc ttgagacaac ttagaaagtg tttcaaatga ttgtgttgct taagaaaaaa 18660
atcttagcac ttccttttga aaagccagtg gggctgaaaa gacaatgaca agcactttgt 18720
ccctctgtac tgtgttttcc ttgcagcctg gtgagacgag tggaccggat ggagcattcc 18780
atcggcagca tagtgtccaa gattgacgcc gtgatcgtga agctagagat tatggagcga 18840
gccaaactga agaggaggga ggtgctggga aggctgttgg atggggtggc cgaggtcagt 18900
agtcatgagc tgaaaacacc gctgctgagc atggtgttat taatgaaaat atatgttgct 18960
gacagttgta tttgaagtat tgaagaagag taaaaaaaat ttacgtttat agaaattcac 19020
aatgatgttt ccatttactc tcattttcag atttttttct ctgaaacaga aacactcttt 19080
ctataaaatc tcttgctata aaacatcaat gtagtcatat tgtctaaccc ttaggctgag 19140
atgtttatct ttctccataa ctacagataa aattataatc tggaggtgtt actttcttaa 19200
tactccatat gctaatggtc ctgccttcac tgcagggtag aattaagtga aaaattactc 19260
cagcaactct gagatttgct attatatgct gtaaatctcc agccttacca aactacagat 19320
tatttggtcc ctggacttcc taaggcattt ccttctactg cccccaacac cagtttcttt 19380
ttcccttttt aggatgaaag gctgggtcgt gacagtgaaa tccataggga acagatggaa 19440
cggctagtac gtgaagagtt ggaacgctgg gaatccgatg atgcagcttc ccagatcagt 19500
catggtttag gcacgccagt gggactaaat ggtcaacctc gccccagaag ctcccgccca 19560
tcttcctccc aatctacaga aggcatggaa ggtgcaggtg gaaatgggag ttctaatgtc 19620
cacgtatgat atgtgtgttt 19640
<210> 239
<211> 7321
<212> DNA
<213> Homo sapiens
<400> 239
gaatgatagg ggaaaggaag gcaagggtga gagaagacct tgtgtgaatt tgtccaaaat 60
gtttatccac aggaacaatc cctttgtgaa ggctgctggt atgtgaatgt gtgccggttc 120
ccttggggcg ttcatttgga tctttctgtg ttccagtgac ctacggcatg atgagctcca 180
atgtgtacta ctacacccgg atgatgtcac agctcttcct agacaccccc gtgtccaaaa 240
cggagaaaac taactttaaa actctgtctt ccatggaaga cttctggaag gtatttgcaa 300
ataactttga aagtacctct ctatcacaga aaattgttca tttggcttca tcatttcaat 360
gcatgagtat cgacaggacc tgctttgcat ttaacactgt gtgagacgta agttatggtg 420
agttgttaga agttactgtt cctactctca aagggggtaa actaacattg agaactttgc 480
ctgtgccttg cactgtgctg agtgtttcat atcttacctt atttaatttc tatagtctaa 540
ctctataagg taagtactaa gactatgccc tagtttgtta atgaggaaaa tgagattcag 600
gatgtttaaa tgcgtatggt cacatggcta gggaacaaga aaaattgatt tttttctagc 660
ctgacagcta cttcatccta gtttgtaatt cattccatga gtcaagattc aataaatatt 720
tattgagaat ctcctagaat gtaaggccaa tgaagggcag tgtggttctt ctgtcttgct 780
tcgccttttg tgttttgtct ctttgttgat gatggcatgt atccccagct cttagaacag 840
tgcttgattc aaagtaagca cattctttca aaggtctgct gttggtgggg cttggtggct 900
cacgcctgta atcccagcac tttgggaggc caaggcagga ggattgcttt agcccaggat 960
tttgaaacca gctgggcaca acatagtatg actttgtctc tccaaaaaag ttaaagaatt 1020
agcagggtgt ggtggtacac acctgcagtc ccagctactc aggaggctga ggtgggagaa 1080
tcacttgagc gattgcttga ggtcaaggct gcagtgagcc atggccatgc tactgcattc 1140
cagctggggc aacagagtga gaccctttct caaaaaaaat cccccccaaa aaaaaaccca 1200
aaaacaaaca aaaaaggtct gctgttgtga agttcaaccc aatccagccc cttcccaagt 1260
tgtcacaaat tccaacgtag ttaacagtat accaatgagt gataccacag gaaaaatatt 1320
aaactgatct gagggatatg gggcttggaa tctaagaaaa ttggaaggga aattgaaaag 1380
gaaattatta tttctccttg gggagatagt ttctaaaatt cttactacac cctggggtca 1440
gagctgttga ttttaaggat agagacaact gagtcacagg aaactattca tatataaaag 1500
tacctggcat ccaaaaccac acttgtataa tatgaatctt tcaccatctg agtagggcaa 1560
atcagtctat ctctgttgat catctgacaa ggatagcaca ctgagaaata gatctgtctt 1620
ccctacaggc atagctagtt gtacaaacta acaagagact tttgtataca cattccatga 1680
tgataaatgc caatcactaa agggacgagg agggattgga gagttcacca tacagcaaaa 1740
tagtccagac aggtgaaagg tctatcaaat gccaggctgg taatcaaaac tgtagccttt 1800
tctctaaaca aagtttagaa ccatgattgt gtgggacatt attttaataa gggaaagtgc 1860
agttaatcat gaccccacct ttagtccaag aacaaaaatc agagctgcca cgtattaagt 1920
acccactctg tgccaggtgc agtaactatg caaaagatgg gttttccaga tgcaagaacc 1980
ttggttcaga ggaccctgct caaggcctca tagctaacaa atgatggggc aagatgctat 2040
cccaaatctc tctgacaaca aaactcattc ttatcactct actattttca tagagttgcc 2100
aaatgcttgg ttatgcaaac gatgcaggca ggggcaagac agcggctgag cttggaactt 2160
tttcagagat gtttcctttg cttttagttc acagaaggct ccttattgga tgggctgtac 2220
tggaagatgc agcccagcaa ccagactgaa gctgacaacc gaagtttcat cttctatgag 2280
aacctgctgt taggggttcc acgaatacgg caactccgag tcagaaatgg atcctgctct 2340
atcccccagg acttgagaga tgaaattaaa gagtgctatg atgtctactc tgtcagtagt 2400
gaagataggg ctccctttgg gccccgaaat ggaaccgcgt aagtgtctgt gactcattgc 2460
cactcggtga tattcattca tttattctct gaactcccac cattcattca ttcattccct 2520
gacaccttca ccaaggcaaa aataagttca gtgactcttc agtgcttata tttaaacctt 2580
ggccaacttg acctttgact tcttaagttt tcactacttc ttagccttct tttagtttct 2640
acatgcatat ttttcagaag actaaatcgt tgaccatata acccctcaaa aattaattat 2700
ctgagcgttt gaaaatttca tttaagatgc cctgggccct gtttttacag gtgcagtaac 2760
atcatccact aagttattta acacaagttt tctggttcag gaactctttt tataggtctt 2820
gcaaacaggt ttttgttcag aatggagtta tttaatgtgt aagcttgtga ggcaattttt 2880
tgttaggttt aaagcccatt ttgttcaaat gtttgagatt ttaggtatat atttgtacac 2940
gtgcatattt acaggggctt tttgtacact ttggtactcc tacttcaaac atcttgtgta 3000
ttaagggagg tcacttacta ttttagaagt attgtagtta ttataaagaa acaagaagac 3060
ctccaaggcc gtttcagggt gggcctttgc ggttgctgtc cctgggtacg tcactggtcg 3120
gagtcatctt ctaagctttg ctcagctaat tctgtcggtt catctaggtt cttttcttgg 3180
aaactgagtt gcccagaatc cacatttgtt actatacaat gggcaatcac cttttcaatt 3240
agtatattct tcttgtacct tccagtatac actctattta ataccagaac ccataagaaa 3300
caaatttagt aaaaatccag gttgggcaca gtttctcatg cctgtaatcc cagcactttg 3360
gaaagccaag gcggacagat cacttgaggt caggagttca agaccagcct agccaacatg 3420
gtgaaaccct gactctacta aaaatacaaa aattagctgg gtgtggtgac atgtgcctat 3480
agtcacagct attcgggagg ctgaggcagg agaattgctt gagcccgagt ggtgggggtt 3540
gcagtgagct gaggtctcat cattgcactc cagcctgggc aacagagcaa gactccccct 3600
caaaaaaaaa aaaaaacaaa tttagtgaaa atccagagct ttagaacaaa ggaactaaat 3660
agtctcaaag gacattatca tccaagttat gatagtgatt tcgctttctt taaaaaaaaa 3720
attattacag atagagtttc ttgatgttgc ccaggctggc ctcaaactcc tgggctcaag 3780
cagtcctcca gcctcagcct cccaagtagc tgggactatg agaatatgcc accatgccca 3840
gctttatttt gctttctaat gtgccttttt gtagttcctg caaagcataa gcatgccttc 3900
atctgtggta ccctttccaa tattttattt atctcacatc actaataaga taaatttata 3960
cagccactgc tctgtgccag acattattta agaagttatt tcacgcatta tctcatctgc 4020
cttcacaaaa caactctaaa ataggtatca cctccatttt atagatgaaa aaactgaggc 4080
tcacttgccc aaagtgtcac agctaacaaa ttggactgaa ccaagattta agcagcctga 4140
ctccaaaacc catgtttcgc ctactaaacc tcttccatat taattcctcc tccatattaa 4200
ttgcgtcgtt agggtggctt gtcgacgctc tcagctcccc atcagtactc aagcttcctg 4260
agggcaggga ttctattttg ttaactgctg tattctcaaa gccttgaaca atgcctcata 4320
tgtaaagata ctaataaata tgtgctggat gcattcgagt gatttctact ccagggtgga 4380
ttgccaaagg ggaccttccc tgtcatatct aaactatcct tttattcttc tacattctca 4440
agtcactccc atttcttctt cccttcaact ccaaacttct tggaagaata gtcttcattt 4500
gccacttcca tttccttacc atcaattcac gtcttaaagc ttaggttctt gcttttgaca 4560
tctcaccagg aagctactag ggacctctag ttagcaaatc cactgaacaa atctcagttt 4620
ttatcccctt catactgtct gcagaaagtg gcagtgttga ccgctcattc ttttgacttc 4680
catgaagaac tctacacttt gggttctttt aactctgaaa cccctttctc tcacttctct 4740
tattcccagg ttctatattc atatctccgt cttttctttc ttttctctct ttcccatgac 4800
attcagatgg cttccactga catctttatt tggtgactca tcatttcttc aacaatgtgc 4860
caggcatgtt cccattgcta gaagtccccc ctcttctagt agtgcccttg atgctggaga 4920
aacaaagcag caggaaacag aagaaacgtc ctttcttcac agagcttgca ttctagtgat 4980
acaagacaca tctctattcc acctggatgt cccacacctc ttgtgattta atatgcccca 5040
aactaaactc atcgttttct tatgagatct gctctttgtt ctgttaatgg cactgccgtc 5100
ttcctattgc cctgaaagag actccagagt catttttgag ccatgtttcc tccttgcccc 5160
aacttccaaa tcagttacca agttctgctg gcagtcactg tggttacgac actctctcac 5220
tccttccttt cccttcccat cttcactgag tgacttcagg cctcattacc tcttggttat 5280
tgcagacttt gctaagggag ctgtgtcagg ggtccctaag accaccccca ggttcagtga 5340
ttcactagaa ggactcagca tagaggcatc cttacagcta aggtttatta tggtgaaagg 5400
atacaaaaga aaaggcacat ggcaatatct ggggaaaacc tggtgtaggc ttccaggagc 5460
cctctcccag tgaggtcaca taggatgtgc tgaatttctc caggaacgag ttgtagcaac 5520
atgtgtgaaa tgtctatcag agagattaat tagagactca gtgcctgggg tgttcactgg 5580
gtactggtac tggtttatga ctagcatgtg ccaaaattcc cgactctcag aaggaaagca 5640
ggtgttgagt gtaagccaca ttgcttatac aaatagcaca ggcacagcaa gcctctctta 5700
ccggtcaggg aaagttgaat actggtgcag ggagctgttt atcagtcaag ttcccagatg 5760
ccagccaaag tccaaccttg caaacaggcc ttcctaaaga aaggccatct caggcctgct 5820
gtgttaactc ttttctgcac atgagccctc tgttcctccc cactccagtc ttccctgctg 5880
ccaccagacc agccctgttg tgtgcctctt agaactttcc cttcacagac tccttcatgt 5940
ttgcccttca caagctgacc acagaccacc tttcaatctg ccattcttta tcttatggga 6000
gccaaactga actacttctt ctcttgacca atggctcacg gttgaaaatg cccttcccat 6060
ttgtattagt ctggtctcat gctgctgata aagacatacc tgagactggg caatttacca 6120
aagaaagagg tttaatggac ttacagttcc acatggctgg ggaggcctca caatcatggt 6180
ggaaggcgag gagcaagtca cgtcttacgt ggatggcagc aggcaaagag agagagcttg 6240
tgcagggaaa atcccactta taaaaccatc agatctcgtg agacttactc actatcatga 6300
gaccagcatg ggaaagacct gcccccatga ttcaattacc tcctaccggg tttctccaac 6360
aaaacatggg aattgtggga gttacaattc aagatgagtt tggttgggga cacagccaac 6420
ccatatgacc attcacctgt gcaagtccag atcctactca cctttcatgg ttcaggtcca 6480
acacagcttc ttcctaaagc cttttctaat ccatccctcc actgccagat ccccaaataa 6540
ggacagcttt cctctgatct gccagcctta tttcttttct cttttgcttc ttattattat 6600
ccaccttgta ttttacttgt ttaattataa ctcttatttc cctacttgtt ataaatttgg 6660
gagggaaagg acctttatat ccccattagt gctgaagaag catctgtttt ctaagagatc 6720
ctctgaatat ttgtggatga aattcccaaa tgctgacaat gccacttgat gaacttgtcc 6780
ctcttttggc tgtaattttc tctggggacc tcaagtcgtc tagtccctga gcacagttac 6840
ccagagaagg cagccgtata aactgagcag aggctctaga gcagagcaga ggctctaggg 6900
acaaacagcc ctggcattgg ttcccgagtc tgccctcaaa agctttggga ctacattgac 6960
ctcactaagc ctcagggccc tcattcctaa agaggctaat aacagtatga gaattaacca 7020
agaaaacatg aactgccagg tcaggcacag tacccagctt gataggcctt aatacatact 7080
ttattttaca aggaaccagc tgtccttgta attgcctcaa gtgttccact gattgtaact 7140
gtttgttttt tggttttgtt tttaatcagt tggatctaca caagtgaaaa agacttgaat 7200
ggtagtagcc actggggaat cattgcaact tatagtggag ctggctatta tctggatttg 7260
tcaagaacaa gagaggaaac agctgcacaa gttgctagcc tcaagaaaaa tgtctggctg 7320
g 7321
<210> 240
<211> 30140
<212> DNA
<213> Homo sapiens
<400> 240
ccagtcggcg gcggggaccc gctgcatcgc cacctccccc tggaagggca gccgccccga 60
gtggcctggg cggagaggct ggttcgcggg ctgcgaggta agagcgcgcg acccgcagcg 120
gcagatgcac gaaccagaac ggccggcgcc ggccggggcc atcgcccgct gcggcagctc 180
cccgggctcc atctcgcatc ccctctgcgt tccgcctccc ttggaagcgc attccccacc 240
tccgctagtg ctgccctatt tccggtaccc agcgcggaat tccactgctc ttttgttggt 300
gcatatttat tggatacctc cttcttcagg atatgtcacc atagtctttt ttactgaaaa 360
ttagtgaaag cctaattaga gtgaaagagt acatctgggt tttgtttttt tttttcttgt 420
agaggaaaaa atgaacatta cttgtgtaac tgatggtagt tgcaactgca tatttgccaa 480
tgtcacaaaa tctaaaggaa aatgttatag tcacccgtgg tttccttctt gcctggacac 540
tccattgtcc cgggctgaaa agggtagcag tacagtgcat ataatgtcaa gttgtgggag 600
gagtgtggca gattgtcatt ggtgcatttt tttggtgatg tgtgtggttg ttttgaggag 660
tgggagctgt taagaacacc acaaatagaa taaaataata tcgtgaagtt atttggccgt 720
ttctaattct agacattttt ctaaaaacag ttgcaaagga aagattacat tgttttaaaa 780
aaatttgaag tatgttttta aataactaaa ttaatgttct ttgaaattcc accaaaatga 840
tgaagtcacc agatagcagc tgataaatgt gtctgagccc agtgcgccca gctctacaaa 900
aggcagaaga ggaattttca aatttgccag tgcccagtaa gaggacatga attttctagt 960
accagaggaa attctctttt tacaaatttt gtcagaggta tccttgggaa agtatttcat 1020
ttgcttttac cctccaaatt attttaatct atatttttaa gagtttccat tctcagttga 1080
gtttttcttg ttcttctcct tctgtcagtt ttgaaagtct tgcacaaaaa caatccaggt 1140
gttgttacag cagtgtgatt aaaaccaggt caggcctaca ctgaaatccc agttccacca 1200
ctcattagct gtacgacctt gagcaagtta cttatcctct ctgataccca atttttggat 1260
tttttttttt tttaaagaga tgatcataac gcttaggact tgactctttg ggagaattaa 1320
gtgagttaag acataaaatg tgcagcatgt atttgtcatg ttattagcgc ttcagaaata 1380
taaatgtaaa cattttggta cttcgtttat ggagattctt atactagtta attttattaa 1440
aagcatgatg gggaacagaa gatccttttc ggataacctg tgtgagtaaa ttaataaaac 1500
actaacactt tttaagattc aaaactggat taattatgtt attttacacc atttaaaatg 1560
tgcatttaaa aaatattcac tgaagtgaga gagaagttcc ttttaagtta ataaataatg 1620
gtaagttgca tgatcctttt aactcagttt aagcatttga taacacccct aaccttgttt 1680
gaataaactc aataacagaa tatagagaaa taaaatatat atttcatatg agtatgtatg 1740
taaatttatt tcttttaaag gaaaatttca ggaaacaaaa tgaataagct catagtcata 1800
aaacctctag ccaaagtgtg tcaatggtct gatttgtagg agagcagact caggaatcgg 1860
gaattttttt ttttttttta agagtcgggg tttcactctg tcactgaggc tggagtgcgg 1920
ggaagcaaac gtagctcact gcggcctcaa actcctgggc tcaagctgcc ctcccacctc 1980
agcttcccaa gtagttggga ttacaggtgc aagctgctgc tcctagctga aaagttttaa 2040
ttatataaaa tgtttaaata aattgttatt cctttctttt atgaagaaat ataattgata 2100
ttcttgtcac ttattaaata agcaacattt taaaatgttt agcacctact gtgaagatag 2160
cactgtgcta gctgctatga ataaactaga atagcatatc actgttttcc tatggacaaa 2220
aacccagaaa tgtaaaataa atagccatga atgggttgag attccccctg ccccctttgg 2280
atactgatga cagaaatctt atatgcacta tgtaagcagt gccctaggat cagaacagaa 2340
agtaacttgc aatttttaaa ggtgggagaa atgactgaag tttggagtgg tcaggagttt 2400
ccctggaagt ctcttgcctt tgtgactttg tatagctccc tcaaactacc tgagcctgag 2460
ctcctcattt ataaaatgga agaattgaac ctagcttcca aggtcctttc tagcttcacc 2520
atgctctggt ctgttgttta atgacatgaa tccaagatgg acaacaaatg gtcgattttg 2580
ctccttctac agtaaataga tctatcttct tagcagaagt aaaatagtaa agaaagaaga 2640
catgtttgag gcctgttgag gcctgtttgc tgtatgcatt gtatctaatc aaggaattga 2700
gaatgtagcc ctaaatatta ggaaggagtt gaaagtttct gagcaggaac agaacatgct 2760
gaaaggaaat tgtgtcagca gcatggtgta caggagagct tggcagagag aaaggaggca 2820
agaagacctg tgggaggcag ccagtaagga ggtgaagagg gcctggacca aaggaagcca 2880
aggatgaccg aaagatttaa agatgaagcc cagatttaaa agtatcctca agtatttgtt 2940
tattcttttc ttagcaaatt ctttttagta caaagataaa atatggcact ctgagtcata 3000
aaattttctg aatttcagaa gttgaatgtt tttctgaatg tatcaacctg ttaaagtcag 3060
ttcctgtttg ttattttagg cgtatattct tgggcttttt tttttttttc ctagagaaac 3120
tatgaagtac tagctgtgca agtcagggtg ggctaagctg ctaaaacaga tacctccctc 3180
cccttcaata ccctgaagaa caagaagtta attttttgct cgtgtaacat tttagagagg 3240
gtattccagg ttgaatacct ggaataatga atgaaataat aagtcgactc ttatttctcc 3300
taaaataatt ggatcttgac attgaaattg gtgtgctgat tgtatttaat aagtgacctc 3360
caatgcagtt atttcatttt gccatacttt atgtaatttt tattttttct gccttccctt 3420
tcgatgtcta aagggaagca taattagtta ttggaaaggt tattgagact taaaaaaaga 3480
tttgaacatg gctttggttg atgctaccac acagaaactg caaacatcca actcaccgct 3540
cttagttgct gttcatgata gtctatgcac agtgactgat gaatttagcc tgtcttgagg 3600
cttcagaact tagtcttatg tcatcacgag cagagcttta tcctaaatta caggttttca 3660
atgggggggg gggggagggg cagttttgcc cctcagggga catttggcaa tctctggaga 3720
catttttgat tgtcatacct ggggggatgc ccctggcatc tcctgggttg aggttaagga 3780
tgctgctaat ctacaatgca cagtacagcc accccacaca cacacactac aaagcattct 3840
cccacccaaa ttgccaggag tgaggacttt gagaaaccct gccctagact gttaaattca 3900
aaaggaaata atggtttatt gctcacagtg tgccaggcac tgtgttaaac tccttatatt 3960
catagttttg tttttatcct cacaacaacc tgtgaagaaa gaactctcat ccgtcaccac 4020
tttactgttg agggcactaa gccttctaaa ggttaaatga cttgcccagg gccgcaacta 4080
ttagatgttg cagtcaggat ttaattccag gcactttgtg ttcaaagtgt ttctcatcca 4140
ctgtgctata tgccagtagt gcccaaacct aactttagcc agcaattgtc tgcatctctt 4200
cagtttatga acatttattt attaggacat gcaggataat cataccaaca cagtccgtgt 4260
atccagaatt ctaattgatc tagggagtgg gagagcctgc ctctctattt tttttaaatt 4320
ggtgtgaaat atacataaca taaaattggc cattttaacc attttaagta tataattgag 4380
tgacattagg tagatttatt atattatgta aatggactta acacaattta tttccagaac 4440
ttttttatca tcccaaacag aaactctgta ctcattaaac agtaactccc tgtttcccca 4500
ctcccccttg ccccagacgc tagtaacctc cattctactt cccctttctg tgagtctccc 4560
tgttgtagct acctgatgta agtgaaatca gaccatgttt gatcttttgt gtctggctta 4620
ttcacttagc atagtatttt caaggtttat ccatgcgtgc aaattccctt cttttttatg 4680
acgaaatact atttaattgt gtgtgtacat gtgcacacac aatgaaatac tatttcatca 4740
taaaaaggaa gtttgtacac atatatacac acacaccaaa ttttgtttat ccattcatca 4800
gttcatgggc atttgcggtt tttttccacc tttcgactgt tgtgactttc cgtttatttt 4860
taatctgaac tttactccat cacttcctcc ctttcctttt ttattcgcac cataattttg 4920
aacaagcaga ctttgtattt tcattactct ggggattttt ttgagggagg cttgctaccc 4980
tttggggttg tggtaaggtt gtgccagtaa cagaattcat gcagtaaaaa acattcatgg 5040
gactttcttt tgtgataggt actagggatg cagagatgaa taatacaagg tctcgacctt 5100
caaggagctc agggtttagt agggaaaaca gaggtataag taagtcattg caatgccagg 5160
tcccagatat gggaggattc cagcaaagag aggataaggc caggcacagc cgctcatgcc 5220
tatagtccca acactttggg aagctgagat gggaggatca cttaagccca gcagttcaag 5280
gctaccctgg gcaacatagt gagtggcaaa aaatacaaaa attagccagg cagggtggca 5340
catgcctgtg gtcccagtta tttgggagtt tgaggtggga gaatcacctg agcctgggag 5400
attgaggctg cagtgagctg tgatcacgcc actgcactcc agcctgggtg acacagtgag 5460
aggtgagagc ctgtatctaa aaaaaaaaaa aagagaggat cagatttacc tggagaggtc 5520
agagaaggtt tccagaggga gtaaaacttg agcttcattt tgaagaatga gaggggaata 5580
caaggaggga aaaataatag gaacaagacc tgttcctgtt acagcaaacc tgtaactccc 5640
accatggaat gggcacgttt tcctgtagac atttggagcc agtgtgggct tcaagcctag 5700
ggggctgata tgatcatttg tcaatctgaa gatgactctt ggaacaacgt agaggatagg 5760
gtgaggtggg taggctggtg gctgacagac taggtcagga gagggctgac caagaggagg 5820
aggggtgacg agggctggaa ctaaggcata tgagctggga tggaaagaag ctagatagaa 5880
aggaaacaaa aaccatcaga actgtggaac caactccatg ggagggataa gaagagggcc 5940
tattctaggg tgaaacccaa atttctggca tggtaccatt aacccaaaca gaaagaggag 6000
atttccagag aaagaaaagc aaattttgcg ggaggtgagt gtgagctgtc tagagaatat 6060
gcaggtagaa ctacatgtta actgtaacat atacttgtct gcacctcagg agatggctga 6120
ttaagaattc aggattcagg ccaggcacgg tggcacacgc ctttaatccc agctgcttaa 6180
gagactgggg cgggaggatt gcttgagcct gggaatccga gatcagcctg ggcaacatag 6240
caagacactg tctctaaaaa aaaaaaaaaa ttcaagattc tggagtcaat attacttaag 6300
gtagcaactg tctattctat agaaaatgga caaatataga taaaaagcca cttccctttc 6360
taaaagtgtc cctgcaattc aagtgaatac taggaaggat tgtgttcatt cttctaaaca 6420
agactcacat gtatcttagc acaaaaagag gattctttta tgatacaaat gcactgagaa 6480
tttggtcagg ctatcacaat gaactgatag ttcagatgga tttgagtctt tataccactc 6540
tggaatctgg accaactggg cctcctaagg ccattttgca gatctgggct tgtttctgaa 6600
gctacagaca ggcctcttcc aagcactcta agtgctccac aaataatatt tctgtttccc 6660
agaacaaccc cacaaaaagg tactcttact ccatttttag atgaggaagt ggaggctcat 6720
gatgtcaggt aagctttctc agctcccaag tggttaagcc ctcagtttaa tgtcatttga 6780
ctccagagcc ctatgttgca ccatgccttg ataataggcc atatgggttt catgtatttc 6840
agatggggaa ggttagtgtg aggtgaaaga tacacaatta accttttaac catggaactg 6900
aaatatttac agatgaagtg atacaatagc tggaattaat tccaaaataa ttggggtggt 6960
actggtccat ggcctgttag gaactgggcc gcagagcagg aggtgagcag caggctagtg 7020
agcattgcta ccccctatca tatcagcagt ggcatcagat gggtgaggat gtaaatgaac 7080
taggattggc attgagttga tattgttgga tctaggtgat agatttatca ttataatatt 7140
ctctctttgt gatatttctg atattttcta aaataaaaag ttgtagttat ttatttattt 7200
agacggagtt tcactctttt gcccaggttg gagtgcagtg gtgtgatctc ggctcactgt 7260
agcctccgcc tcccgggttc aagcgattct cctgcctcag cctcccgagt agctgggact 7320
acagcctccc gagtagctca ccaccacacc cagctaactt ttgtattttt agtagagagg 7380
aggtttcacc atgttagata ggctggtctc aaactcctga cctcaggtga tccacccacc 7440
tcggcctccc agagtgctgg gattacaggc gtgagccagt gtgcccagcc aataaaaagt 7500
ttttgaaagg atttagataa aatagttggg gaaatggcat ttttgttcaa agccaattat 7560
ttatgtttgg aatatctttt gtgcttggag ttctccatta cagagttccc cagtgttcct 7620
attaataagt aacattgagc agaggaatgc actgtttaga tcagcagtcc ccaacctttt 7680
tggcaccagg gaccggcttc atggaagaca atttttccac agacctgggg taggaagtgt 7740
ttggggatga aactgttcca cctcagatca tcaggcatta gtgagattct cataaggagc 7800
aggcaatcta gattcttcac atgcgcagtt cacaataggg ttctcactcc tgtgagaatc 7860
taatgccacc cctgatctga caggaggcgg agctcgggcg gtaatgctca cttgcctgcg 7920
gctcacctcc tgctgtgggg cccggttcct aacaggccat ggaccagtac ccgtctgcag 7980
cctggggact ggggaccctg ctttagatga tgtactctgg ctttgcattc tggcattagc 8040
taagcaccct cttaaaggaa attgggtcta tactctcagt ccgtgttctc cctaacacct 8100
ggaaacattg aataccttca atgctgggaa gttaactccc accacaacta gaacagctat 8160
gggaaagaca acagttgatt ttgaagagtg tcaccaattt gcacatgatt ccatccttaa 8220
ccattcttat cctatcagct ctgccaaaca tggagaatag ttggctgcag gacagctatt 8280
tttcctactt gtagatgcaa ctatttctca cccaccagga tgtaaaaggt ccctgtaccc 8340
taagattggt cctacataca cacccaatgg gaaaatgaga tgaaaaattt aaagcagtaa 8400
atatttgagg aagtagatag agtaatttag aaaaagaaaa tacacagggc caagcacagt 8460
ggctcacatc tgtaatccca gcactttgag aggccaaggt gagaggattg cttgagctca 8520
ggagtttgag gccagcctag gcaatgtagt gagaccccac ctctacaaaa aattaaaaac 8580
ttagttgggc ttggtagtat gtacctgtag tttaagaaac ttgggaggct gagctgaggc 8640
aggaggattg tttgagcccg ggtggtcaag gctgcagtgg gccatgattg tgccagagta 8700
ctccagcctg ggtgatagag tgagactctg tctcaaacaa aaaaaaaaac agagacagaa 8760
aaaaagaaag aaaatatatg gatgtatatc atataaaaat ataaataagg gaggccaagt 8820
gcagtggcat gcctgtaatc ccagcacttt gggaggctga agcaggagga tcacttgagg 8880
ccgagaattc gagaccagcc tgggcaacgt attgagacct catctctgca aaaaatcaaa 8940
aaatgaggcg gaaggatggc ttgagcccag gagatcaagc cttcagtgag ctgtgatcgt 9000
accactacac tccaggctgg gtaacagaga gagaccctgc ctcaagataa ataaattcat 9060
acatacatac atacatacgt acatacatac atacataaga agacttgttt ctttccattt 9120
gcaatgtttc attcaaaggc tagaattaaa ttgccgtagg ccatcacaag tttagcttga 9180
atattattat tttttcaaga tggagtctca ctctgtcacc caggctggag tgcagtggtg 9240
tgattttggc tcactgcaac ctctgtctcc cgggttcaac cgattcttct gcctcagcct 9300
cccatgtagc tgggattaca ggcgcccgcc accacacctg gctaagtttt gtatttttag 9360
tagagacagg gtttcaccat gttggccaga ctggtcttga actcctgacc tcaagtgatc 9420
tacccgcctc accctcccaa agtgctggga ttataggctt gagccactgc acccagccta 9480
gcttgaagaa aatttgatag gagtttgttt ttttctattt ataggccaag caataccacg 9540
tataaatatt aagaatcatg gctgttcctt agtgcctagt tgtttataaa ccatgggaaa 9600
gaatgaaatc attgaccaaa tgagacaggg taacagtctt ccctgggagt aaagagacta 9660
gcagtctcta ttgacatata ttttaggcct ggcctccaaa ataaatttac ccaaagaagt 9720
gatgtatttg tgtccagggc taccgagcct aatctttggc tgcctctgtg ttattctaag 9780
ttgtaatttt ccatgtcatc taaatttgta ataattcttt aatatgatag tgtttcagtg 9840
aacaaacatt ctgcttgctg catttcttct gagtgagtaa ttccctgaca actaccagat 9900
cttggcagaa gcaaagttgg tcataagtta tgctccactc tcagtgctgg tgaaacgtat 9960
gatgcgtaac acagtgtttt tgaattcagt gctgattttc ctaaaggaca tttggaagga 10020
aaaaagaaaa ggaaaggaaa tacccaaatt caggaataga acttacatat tattataaga 10080
cttaaaaaat acatgaacac taatgatgaa ctcatttctt cgaagtaaaa ggccttatgc 10140
tattttttcc catttcccta tgtggcttga ttgtggcgaa agtggctgtg tgagtttcca 10200
ttattgaagg agttaaggtc tgtggaatca aagcatgaga caacatgcaa ggaccaggtt 10260
ggtttccatt taacagccaa cctaatctaa ctgaaaggat tgagaggttt gtcttttttg 10320
gaaagtgtta aggttcttcc aagtaaccag caatgtgact ttaccacact gttcattaac 10380
ggggctttgg atggccacca tgtctgctgc tggctgagtc caaaactgcg gtcactctct 10440
ccagcaagct catggagggt tacgtcatct tcactcagcc agcccaacgc tttttccatc 10500
tgctaaaatg tagaacatgg ttgttgattc tactctttct acaaagaaag agagggaaca 10560
tggatgagtt gctgctttta aagattatat gttaattgct gttttaaaaa tctgctcagc 10620
taagcacgct tagtgtaatc agtcaccatg gagtttttta ataggacagc ttctgctctt 10680
acagagcaga gtttttatgc cagtaggtta gaagcataac atgtttctat attgaagtga 10740
ttctccaaca aggacttctt ttcatcaggg gtgacctaaa agttattact tgaaatataa 10800
ttacatcatg ttcttaactg ggtttagtag taggataatt acaaggttgt atccacctca 10860
aataggaaga actgataagt tttgcacaat tatttaactc ctctgttagg ccttccttat 10920
ttcctgttct ctttttaaaa tttgactaag atattgctaa tgggcttggg agcctataaa 10980
atgatcagaa ttgttgcctt atgttttgca tgtttggggt aacattggag ccagatgtac 11040
tcttaaataa aaggtaggcc tacaaaacca gtttctcagt tgcattcaaa atgtgattaa 11100
aaaaaaaaaa aggagaatct cccttatagg tgaacttttt aatttgtgct ttattttccc 11160
ttttgccatt catgagattt cttaaataaa atgatatctt ttcttttctt cattattatt 11220
ttaaaggtct ctggggaaca agactcatgg aggaaagcag cactaaccga gagaaatacc 11280
ttaaaagtgt tttacgggaa ctggtcacat acctcctttt tctcatagtc ttgtgcatct 11340
gtaagtagaa tatttccttg cactaatggg aaagttttga aaagatttga cctatccaaa 11400
tcataattaa aaggaagtgt gtatgcacca gaggggcaac tgggaagtta ccttcttacc 11460
tttgttttta attctaatat ttttatttgg gcatttgttt attgactatc ttcctatggt 11520
agaatgcaag ctttataaga gaagggacgt gatttgttct ctgctgtacc cccatttccc 11580
aaaactgcag atggcaacag aaggctctga aaaatatata agaaagaatt tttctaattg 11640
tgactaaatt gtgaccaaat gctaagtgac tgtggacttg cgtttaacac aggacgggag 11700
aggcaaagag ttcaattcca atttagaatt tggtcaagtt ctcttctgca ctctggtaaa 11760
cattaattaa aaatcagcat tatctgacca gccagttcat cgtcagtggt ggtgattttc 11820
actatgagat acgcgtggca acttgccaga caccaagaaa ccaagttaga ggatttttgt 11880
attagattcc ttaacaatga atacagtatc accattatta cagtatcatc attattgtca 11940
tactattatt atatcagtta acataaagtc tgcataagaa ttgtttccag aaaaatgact 12000
ttccaaattt aactttcagg aaatacaaat aatgctacta atattgcttt tattggcgta 12060
tacatgtaat atccccttct tttggatttg gatatgttgt gtcattgcct cattttaatt 12120
cattatttct tctcaatctt taataattgc tggactttta ctccacaaga aacttgctat 12180
aggcccatct ctttcgtctt ctttccttct ttcagttcgt cttcccatcc tctggtaggg 12240
ggaggggagg gatgcctgag cgagagacta gctgtaggaa ccatttgtct caaagtccag 12300
aaagccacag gtgatggatt tgtcctctga atcaaagggc gttcgatgat ggatttctgt 12360
catgtctcat ctaaagtctt cacgagaaca gatgaggaag cagttttatg accccagagc 12420
ctcctaccaa actcctctga gaaaaggttt cctttttttt tttttttttt aaattagaga 12480
cagagtcttg atctgtttca caggccggag tgcagtggca caatcatagc tcactgcagc 12540
ctcgagctcc taggcttcag tgatcctccc acctcagtca cccacgtagc tgggactaca 12600
gctgcacacc accatgccca gctaactttt aaaacatttt tgtagaggtg gggtctcact 12660
ttgctgccta tactggtctc cagctcctag cttcaagtga tcctcctgcc ttggaagttc 12720
tgggattata ggcatgagcc actgcaccca gcctggatgt gatattttta tgttttaaat 12780
tgttagagtt tagaaacttg agattgagtt tgctgcctgc attaaaatga tgcttaaaca 12840
ttaaactgca gtggccttaa atattaacaa gttgattaga attactaagt tcttttcaag 12900
ctttacatat acagacaaat ttcttatgca aaatagaagg taacccctgt acgtaagtct 12960
agaatttcag cagtccccaa aactgactga gcattagaat cactctgatt ttaaaataca 13020
tatgtggttt tccgagatct actaacagag cctccataat gtagcctaga gaaacgagtt 13080
ttcagatgta gtgataaatt tggaaggtaa gtcagagaag taagctgaag acagagtttt 13140
aggaaatatg cctaaagtca cataatgaat tggttttctt gtttatttga gaatattgtc 13200
gctttttgtt ctttttcatg caaatcacat tttatttctt atgtgagtag ctatatattt 13260
aaaaattttg tttttggaat attgtagaat ctctacttaa gaaagtatct tagcagtcat 13320
atggtctgac ctcactgaat gctaaattct ctttaaaaca tccgtctcag atggttactc 13380
atactgcctc tgattgaaca agagtcccag gttaagggac ttacttcttt gaaatcgttc 13440
atttcatttt tctacagcta tgttagaaag ttcgtcctta gcagtgaagc cagagtctat 13500
ctcttataac ttctacccag ttgcaccctc caagcctacc tataccaagt atcttttttc 13560
cacgttgctt ttccaattca gctcttcgca agtttggaga caaataccta atctcctcta 13620
agccttctcc aggttaagcc tttccagttc atccagctgt tgattatgtg attggagaca 13680
caagtttgag taactcccat gatggaaagt ccctctggtg aatgttctgt tcatcagagt 13740
ccctaagaaa gcacatgagc ctcaccatgg tgagtggggc catgagattc ctaaaccaga 13800
cactacactg tggcttgtgc aacctaccat ggccagactc atgaggctgt ttcatcatat 13860
aaataattcc ttagtctctt caccaaaaac tgtgaagcac tgtgtccccc agctgtatgt 13920
gagctagcct gggaccatag tggaggactc ctctttcaac cctgttaaat ttcatcttgt 13980
taggatctgc ccatttttcc attctgttga aattatcttg gaactggatt cattcatctc 14040
acatcagcta ctccccgaag cctcacagta tcagcagagt tattatctct atccatatcc 14100
ttgtaaatta ttaaactaaa aaagattggt ctaagaacat cagtccatta atcaaggctc 14160
tttggttgga gttcacttca ttatattatc atccagctca gagtgttcat aaacaagatg 14220
ataggaaaga cttttccaaa tgcctgtctg agtaattccc ccattcctgt gatctgtgag 14280
ctgttgacca gattaaaaag gaagtgagaa taaccaggca agatttactc ctagcaaaac 14340
cttactggct tctagtgact gagtcctttc cctattgctt accagctatc tttttaatta 14400
ctagttttaa aatcttgcca gcaatgtcaa tatcaaatga ccaagaatat caaactcatt 14460
actctgtatg taaatgagat agtgtactta cccctatggc ttaagtatta ggctgttctt 14520
gcattgccct aaatacctga gactgggtaa tttataaaaa aagaggtttg gccaggcact 14580
gtggatcagg cctgtaatct cagcactttg tcaggctgaa gcaggtgtaa tggtgagcca 14640
agagttcaaa cttagcctgg acaacaaggt gaaaccccct ctctgcaaaa aatacaaaaa 14700
ttatctgggc atggtggcat gcacctgtag tcccagccac ccaggaggct gaggtgggaa 14760
aattgtttga agctgggagt cagtgattgc agtgagccat gattgcaaca ctgcactcca 14820
tccagcctgg gcgacagagc aagaccctgt ctcaaaaaat aaataaatga ataaataaat 14880
aaaataaata aataaataga aaagaaaaag aaagaaaaga gatttatttg cctcatggtt 14940
ctgcaggctg taagggaagc atagctccag catctgcttc tggggaggcc tcaggaagct 15000
gttactcatg gcagaaggtg aagcaggagc ttgcacatca tgtggcaaaa gcaggagcaa 15060
gagagagaga atggggcagg gaagaagccc cacactttta aatgaccaga tcgcatgaga 15120
aatcactcgt tacctcaagg acagtaccaa gaggatggta ctaaattcct gagaaatcca 15180
cccccatgat ctgatcacct cgtaccaggc cccgccttca gcattgggga ttatgtttca 15240
acatgagatt tggatgggga caacatccaa actatatcac cttgcatagt aggtagggtt 15300
ttaaaaagca gtttggcaca gtaagaaaag tacagatttt ttttgcatca gacagacctg 15360
agttaaaatc ccagcttcac tgctaacatg ctaggtaaat gtgggcaagt taattaacat 15420
ttctaagcct ttgtttcctc actggtaaaa caagtatttg gaaatatcat tgtgaagatt 15480
agaaataata catgaaaaga tcctaggatg ctgtctgtca tacagtagta gtagtaagaa 15540
gttattcttg ccaaagattg ttgagaatgg cagaattatc tcagttctaa gagctatagt 15600
ttctaattat ttgagcctag actcagattc atttggagca gctaactgct caccaagagc 15660
ttattttcca tcttaccaat gaggttatgt gccctgtgtt tttaaaatca gtctacttaa 15720
ccaagagaac agaaatgaca tgagaattaa gtaatctcac tttctctgtt atttaggatt 15780
tattcctact caaaacctga gagttgctat gaattcacca ttaaagcact tattaatata 15840
catgggttac tgttataaat agcaatagta ttgctattgt gtgagttagg tgttgaagtt 15900
caagaaagga ataaagaata tttagaagat ctttgaaaac agtgtctggg tacggtggct 15960
catgcctgta atctcagcac tttgggaggc cgaggcaggc agatcacttg aggtcacgag 16020
ttcaagacca gcctgggcaa cttggcgaga cctcgtctct acaagatata caaaaattag 16080
ccgggtatgt tggcatgcac ctgtaatccc agctacttag gaggctgaag cacaagaatc 16140
acttgaacct gggaagcaga ggttgcagtg agccaagatt gtaccactgc actccagcct 16200
gggcaataga gcaacactct gtctcgaaaa aaaaaaaaaa aaaaaaaaaa agaaagaaag 16260
aaggaaggaa ggaaagaaaa aaaaaggaaa aaatgcaagg aaggtatttg gtgaatctat 16320
aataataaaa atgtatttgt catttccttt ttctgtgctc tcattctata aaattgagta 16380
aaaaatctat atatagttta aacacattaa tagaaatcac aaaagttagc tgagtcaaca 16440
ttgtagaaac ataatatttc tgtatgtcaa agaaatagac aacattaaaa agcagaaagc 16500
aattacaaag aatgattata agaaacatca caaagggtta atattttaac acatttgaaa 16560
ctcaaaaatc actgagaaaa gcagtagact tccataaata ttttatagag tagaaaaaat 16620
aggccaagca cagtggctca tgcctgtaat tccagcactt tgggaggccg aggagggtgg 16680
atcacgaggt caggagttca agaccagccc ggccaagatg gtgaaacccc atctctacta 16740
aaaatacaaa aactagccag gcgtggtggc aggtgcctgt aatcccagct acttgggagg 16800
ctgaggcagg gaattgctta aacccttaaa cccgggaggt ggaggttgca gtgagccaag 16860
ttcgcaccac tgcattccag cctgggcgac agaacgagac tctgtctcag aaaaagaaaa 16920
gaaaagaata gaaaaagaat ccatgggcag gcacagtggc tcatgcttat aatcccagta 16980
ctctaggaag ccaaggtgag aggatcaatt gaggccagga gttcaaggcc agcctgggca 17040
acatagcaag actttgtctc tattaaaaat tttaaaatta gccaggcatg gtgacgcaca 17100
cctgtagtcc caattacttg ggagcctgag gcaggagaac tgcttgaggc tgcagtgagc 17160
tatgattaga ccactgcact ccagcctgag ctacacagtg agaccttgtg tcaaaaaagt 17220
aaaaaaataa aaattagcca ggcatggtgg cacatgcctg tagtcccagc tactcaggag 17280
gctgaggcaa gaggatgact tgagtctgga agatggagac tgcagtgagc tgtggtcatg 17340
ccactgcact ccagcctggg tgacagagca agaccctgtc tcaaaaaaaa aaaaaagaaa 17400
agaaaagaaa aataaataaa atttattcaa atacaaaagt gatgtggttt gactctgtgt 17460
tgccacccag atctcatctc caattgtaat ccccgtgtat tgacggaggt tcctggtagg 17520
agatgattgg atcatgggga tggtttcccc tctgctgttc tcatgatagt gagtgagttc 17580
tcatgaaatc tggttgtttg gtaggtgtct gtcacttacc ccttcttttt ctctctcctg 17640
ctgccttgtg aagaaggtac ttccttctcc tttgccttcc accatgatta taagtttcct 17700
gaggccttcc cagccatttg gaactgtaag tcaattaaac ctctttcctt tataaattac 17760
cgagtctcag gcagtttttt atagaagtgt gaaaatggtc taatacagag acttggtacc 17820
aggagtgggg tactgctata aaaaataacc tgaagatatg gaagcgactc tggaactggg 17880
taacaggcag caattggaac agtttggagg gctcagaaga agacaggaag atgtgggaaa 17940
gtttggaatt tcctagagac ttgttgaatg gctttgacca atacactgat agtgatatgg 18000
acaatgaagt ccaggctgag atggtctcag gtggagatga ggaacttatt gggaactgga 18060
gtaaacgtca ctcttacatg ttttagcgaa gagactggca gcatttttcc cctgccctag 18120
agatctgtgg aactttgaac ttgagagaca tgatttagag tatctggcag aagatatttc 18180
taagcaccaa agcattcgag aggtgacctg gcttttcctg aaagcataca gttatatgtg 18240
ctcacaaaga gatggtttga aattggaact tatgtttaaa ggggaagcag agtgcaacaa 18300
aagtttaggg agtttgcagc ctgaccatgt ggtagaaaag aaaaacccat tttctgggga 18360
gaaattcaag ctggctggag aaatttgcat aagtaacgag gagctgaatg tgagttgcca 18420
agacaatggg gtaaatgtct ccagggcgtt tcagaaaatc ttcagggcag accctcacaa 18480
cacaagcctg gaggcctaga agggaaaaat ggtgtgagcc aggcccaggc ccaggcccca 18540
gctgttctgt gcagccttgg gacatggcac cctgtgttcc agccactcca gctccagctg 18600
tggttaaaag gagccaaggt acagctggac cattgcttca gagggtacaa atcccaagca 18660
ttagcagctt ccatgtggtg ttgggtcttt gggtgcacag aagacaaaag ttgagctttg 18720
gaagccgctg cctagatttc agaggatgta tggaaacacc tcgatgtcca ggcagaagtc 18780
tgctgcaggg gcagagcctt atggagaacc tctgctaggg caatgcaggg gggaaatgtg 18840
gggttggagc tcccacacag agtccccact ggggcactgc ctcatggagc tgtgagaaaa 18900
ggaccaccat cctccagact ccagaatggt agatccacca acagattgca ctctgcgctt 18960
agaaaagctg caggcactca atgccagcct gtgaaagcag ctgcaggggc tgtaccctgc 19020
agagccacag aggtggagct gtccaaggcc atgggagccc accccttgca ttagcatgga 19080
gacaggggat caaaggagat tttggagatc taagatttaa tgaatgccct gtcgagtttc 19140
agacttgaat ggggcctgtg acccctttgt tttggccaat ttctcctatt tggaatggga 19200
acatataccc aatgcctgta cccccattgt atcttggaag taactaactt gcttttgatt 19260
ttacagactc aggcagaagg gacttgcctt gtctcagatg agactttgga cttgaacttt 19320
tgagttaatg ttggaacgaa ttaagacatt ggggttctgt tgggaaggcg tatttggttt 19380
tgaaatgtga gaaggacatg agattttgga ggggccaggg gtagaatgat atggtttgac 19440
tctgtgtctc cacccaaatc tcatctccaa ttgtaatccc catgtgtcaa gggagggacc 19500
tgatgggagg tgactgaatc ataggggcag tttcccccat gctgtttgca tgatagtgag 19560
ggagttctca tgagatctgg ttttttggta agtgtctggg cttccccctt ttccctctct 19620
ctcctactgc cttgtgaaga aggtacttgc ttctcctttg ccttctgcca tgattgtaag 19680
tttcctgagg tctccccagc cattcagaac tgtgagtcaa ttaaacctct tcctgcctat 19740
tctcaggcag ttctttatag cagtatgaaa atggactact acagaaagtg tgtaacttta 19800
aactcagtag tatccaaaga agtaatgaaa atggagaaac gaacaacaaa atcatagtac 19860
aatatggtgt atgtactagg acaggaagag cccttttaag aagagatcta tgtatttcca 19920
tttgtttatc tctgaaagaa agcaactttg ccttgtattc tgaaaaagaa aggaatattt 19980
tattttactt gtaaaaatct tacaaggatg ctagtctaaa tatagttttc ctaatttgcc 20040
agagaatcca tgaagatcga gttgataaca agatcagtga agtaaaggtc agtgagttaa 20100
tctcacagca gctgcaggct aattccattt ccagtgaaaa acgtcttgat tgctcaccac 20160
atatcttttc accacaaaca gtttcagtct taagatcaca tgttgcaatc catgagaagt 20220
aactattaag ccttcaacta tgactggagg gctcctcgcc ctttctgata aattgactgg 20280
acaaaaactc aattttaaaa tgacaagaaa tagaagatgt ataaatgtac tttaaatgtg 20340
accaaaatgg gttgtgaaaa cacaagacac aatatccaaa aatgctggca acacagtaca 20400
ctgtagagta ttggttgttt atttaccctt gctattgtgt ggctgagctt actgccactg 20460
cccagcattg caagggcatc aaactgccta tcactagcct aggaaaagat caaaattcaa 20520
aattctaagt acagtttcta ctgaatgctt atcacttttg caccatttta aagtaaaaaa 20580
atcagtaagt tgaaccatca tatatccaag attgtctgta tataaatatt atacatcttt 20640
ctctcacttt taaaacaaaa taatactagc caatactacc attctcaaaa gcacttgtgt 20700
caacagcctt taccccttaa agattttcct cacaatttta aaattgttac ttactatttt 20760
ctttgaaatg ttgaccaaac ctggattaaa agatttgggg gttttagtga ctgtatttca 20820
caaactctct tattgattct gcagcctcac ttctgcctcc taaaaagccc tcaccaaggt 20880
cacgggggat ggctcttttc agcctcttcc tggcatttgg tccagtggca tttggcattc 20940
taggacttcc ctctttgtct ttgataactc cctctcttcc tgtgttcctc cttgctgtgt 21000
tcacttgctt cgctttcttc tttctgaagc atgtttacac agtgttttct ctgattgggc 21060
ctgtgacgtt ctttaggtca tcttttccac aaataatgct tcaactagta cttgcgtgcc 21120
agtgactcca cgtcccactc atgagctctg aacctagtac cagcttctgc tggacatcta 21180
caatgggatc tctcacaggc ctctctcatt ggtaacatgc cccagcctga actcatctcc 21240
cacccatcta tccagccatg ctctctagtt cacctgaaca cttgggtgtc atcctagatg 21300
ctttcccttc ccagtcttct gtgatcattc tgcctcatca gaggctctct aatctgtctt 21360
ctttcctata tcgctcttgt ccctatttta atcctaatca tctatttcct gacttattca 21420
ttccttaagt tggtcagtaa tttaattaaa aacagattta ggccctgacc ttaaatgtga 21480
taagtgatat gaaaggagat gactggggaa aaggatttcc ctcaaggaag gcctctgtga 21540
agcctgaagc aagaatgaaa acgagtcaga cgaagagaga attgtatgaa tgaaggctct 21600
gaggcaggaa aacactcaga tcattccaga atcacttaga agccaagtga agccagttcc 21660
tggagagcag atcatcaaat gaagatggaa aggtgaccag gggccagacc tgtagttttg 21720
gtgggccttg gtgagggatt tacagtagga caccccatgg tttaagtatg aaagtgacaa 21780
gattccttta agttttaaga ggcctcgaaa tatgaaccac agattagatg gaagctactc 21840
tccctgtgtc tggacttttt agaatttcca agagctgctg tttctggaac cagattaata 21900
caagtcagtc ttccatttat ttatttatgt atttatttga gacagggtct cactctgtca 21960
cccaggctgg ggtgcagtgg catgaacaca gctcactgca gcttgggggc tcaagagatc 22020
ctcctgcctc agcctcccat gtagttggga ccacaggcac ctaccaccca gctaatttta 22080
tttgttgtag aaatgaggtc tcattttgct gcccaggctg ttcttgaact cttgggctca 22140
agcgatcctc ctgcaacatc ttcccaaagt gctgggatca ctcttccatt taacatgcta 22200
tctcaacgtc aagataaact ttaaaatctt tagataatag gctggcattt tacttaaacg 22260
atctttactt cttcagaact gccattccct ataaatatct ggttcttcaa ccacatcaaa 22320
ccacttgtga tctcaaaaag cctcagcgta cactgtcctt tctgtcattc taattcctcc 22380
tcatccttca aaatcaactc aaggaccaga tccagggaga agcttagtgg tgcccacccg 22440
aaccggcccc ctccttcgag ttgtgctgcc attcgggccc acctcttcac acagggttgt 22500
cagaccagac cagctcatgc gttcaccgcc cttgcaggga tgggatgcag ctgtgcacct 22560
ctcagtgccg acacctggag agtctcacga aatgttgaca acatggcctg tttccatttc 22620
ttgttcacta ggacttctca tttactaaca cacagaattt cctgtagtat gtccacttaa 22680
tcagttcaag cctaataatt ccttgatttg ggtatagtgc tttgcattta tatactgatg 22740
gtccccaact tacgatggtt cgatttatga tttttcaact tcatggtgat gtgaaagtga 22800
tacacattct atagaaacca cactttcaat tttgaatttt ggtctttttc caggctacca 22860
tactctaaag atagagccac agatcccagt cagccatgtg attatgaggg taagcgacca 22920
atactctaca gtgtattgta ttgccagatg gttttgccca actagcctaa tgtaagtatt 22980
ctaaacatgt ttaaggtagg ccaggctaag ctgtgttgct cattcagtag gttaggtata 23040
ttaaatgcat tttcaactta tgatattttc aatttacaat gagtttatca ggatgtaact 23100
ctactataag tcaaggatca tcttgtatag cacttttaat ttatagagtc ccttcaaatg 23160
tttgtttgta ttttatttcc actgcatccc tgtgaggata ccataagtta tacagctaac 23220
aaaacagtta gttttcctgt gcaaagtgat ggcttcatct tgtggcagat tacctggaat 23280
actgtggcca aggcatctta gttctactgt ctttatatat ctagtacagt tatattttta 23340
tggcagctct gatttcttct ttggcccaag ggttattaag agagggaaaa aatttaattt 23400
cttaacagat atatatatct atgtcaagtc atatatttaa ttcaaaccct taatattcct 23460
aggtaatttt tgtctacttt ctctgtcaaa gattgaaaga tacagggttt taagtttcca 23520
actgtaattg tagttttggt aattgtttta ttactaacag gtattgctct gtatattttg 23580
atgttctgtt attcaataca taagaattca ttacagttga atcatcatgt atagtataat 23640
ttaccaatgt aaaataacct ttttatcaaa ctgagtattc accttataat gtcctctgtc 23700
agaggattat aataccactt aaaacctttt aaaaaatatt ttgttcctga taattttagc 23760
tttgagtggt tttcttataa caattctaga gatgcgtttt tattttttaa ccaagattta 23820
aagctttgtg atttagtaag agtctaaacc attcacagtt catgcttttt tgtcaaattt 23880
ctattattta gtattttcct ctcttttata ttttcctgtt attttccatt tctattcttt 23940
tgttagactg gaaatttttt ctttgctttc ttttatccta gtgatttgaa atttatgtaa 24000
tatatactat tctacaatac cctttatttg ttttcaatat ttgaacctat atttttcaac 24060
attattaaga ataaaatagt atttgttgct attttgaaat gatagaccat gtttttaagg 24120
caggttggtg gttgttaagg caccagtatc ggccaggcac gatggctcac acctgtaatc 24180
tcagcacttt cggaggccga ggtgggcaga tcgtttgagc ccagcacttt ggccgatact 24240
gtggtttact gtattttgtt ctagtttatt ttatggaaaa tgggaattca gtggttaaga 24300
caaggattaa atagcagaag aaagatgtgt acatatgtac agatgtatgt gtcctttata 24360
tgttttttag tactcttgtc tcctttctgg tcctcattta aggttatcta tttcatgcag 24420
taaatttttc ttcacaattc atttcattta gagagtgaat gctaccttcc aagtgggctt 24480
tctccagttt tcctttcagg gacttaaagg agaagtgatg ttaacagttt tatatttcca 24540
ttgcatttta cagtgtgcag atgtcttcac atatatttcc ccatttgagc tttacaaaag 24600
cccttagtat tattctcatt gtctagattc caaaatcagg cttagaggag ttaaatagtt 24660
gtccaggatc tcaagatgca agacccacaa tcatgaacag aggcagatgt tcaggatgga 24720
ggcaagctga aactcaaaac caaatcatta tgactccaaa ttcaggagtc ttttagctgc 24780
cacctgcatg ggctcttggt gtagctgacc accagagttt gtagagctgt cattcaggtg 24840
tgccatggac tttcctggga cctggcacag gagaaggact gagttaatgt ttgctgatta 24900
aatatctgtt acaggctggg cgcggtggct cacgaccgta atcccagcac tttgggaggc 24960
cgagcaggga ggatcacttg agctcacaag tttgagacca gcctgggcag catggcgaaa 25020
ccccgtctct acaaaaaatt tgaaaattag ctggccatgg tgatgcatgc ctgtagtccc 25080
aggtactcag gaagctgagg tgggaggatc acatgagccc atgagattga agctgcagtg 25140
agctgagatg gtgccactgc actccagcct tggccataga gccagacctt atctcaaaaa 25200
aaaaaaaaaa aagttacaat aatcttccct tcaaagctgg aaggcattat ttacctgtct 25260
gtccagcaga tggtgctaca taaccaaggg aatctgttgc ttgcccttgg tgaagctatt 25320
aaagccaata cagatcttga gaatttcaaa agcaaaaatc aatactggat tatgagtgct 25380
ctaggaaaat aaagagataa attttcaatt tacatactta tatatagtta taccatattt 25440
gtaaataaaa atatataaat aatttatcaa aattcctttt taacagcaac aaccacagta 25500
aacccacagg ttaaaaactc cacaacagtc tatattaatc agtcaatgca aagtacattc 25560
caattccaag ttaactgaaa ataatcaact taatcatttg gttggctctg agcagccttc 25620
actgcttgct cttgtgtcat gtttctttct gtcctcgatt ggctatagac ttacagacgg 25680
cttttgcaga ggacagtgta ctcatgtcca tcctttgcat cctttgtggg agttggctag 25740
gcagcactct ccctggggac actatgaact cctcttcttg agtgcagaga tcacgtcttg 25800
ttcatcttca tgcccaatac cttgttccat aaatatgaat ggattagaat tctaaactct 25860
taactctgcc ccaagacagt tctgagaggt agtaagtcat ataacacctg aagaggactg 25920
ttcttgtcct aattacatta ggttataaga tgacaggtga gggagccaaa ccagggggcc 25980
tggaaattat tcatacatct ctagatacag tatacaagtt gtgtgtatta tgtgtattta 26040
ctctgtaatt gattgcttga gatgaacccc caaacacact cgtgtttgga tcattattat 26100
ctacccttct ccttaaataa tcttaatttc ctatgatgct tgaaagggaa agaggggcca 26160
ggtgtggtgg ttcacacctg taatcccagc actttgggag gctgaggtgg gagcatcacc 26220
tgaggtctgg agttcaagac caacctgacc aacatggtga aaccctgtct ctactaaaaa 26280
taaaaaatca gctgggcatg gtagcacatg cctgtaatcc cagctacttg ggaggctgaa 26340
gtgggagaat cgcttgaacc tgggaggggg aggttgcagt gagccgagat cactccattg 26400
cactccagac tgggcaacaa cagtgaaact ccgtctcaaa aaaaaaaaaa aaaaaaaggc 26460
agagtgggga agagagctgc atgaaggaga gatttactaa atagtactta atcccaaaat 26520
aatttctata ggtttgaata tgatccctga aatttattat aggttcaggt aagtattaat 26580
cacgggtatt cagaactgtg gtttaaaaaa tgtatagaac atgtttcctt ccccttgaaa 26640
ctttttatca gctaattata ggaattatat tatacctgca atcattaaag tccagaatga 26700
gacagtactt ggtaaagtgc tgaaatttat aataaatgca ttatagcaat ccagttaagg 26760
aggaagagcc accattattg aacatttgtt aagtgtcagc cattgtacta gataaatttt 26820
agttattatt tttatttagg caccaaaaaa tccatgggat agttggttat ccccatctta 26880
ctgaagagga aactgaagct cagaaagttt aagcaacttg cacaggtcac atagcaagta 26940
aggagcatgg ccaggaatca gaccctgatc tcctttggtc tactaagctt gcaaaggatc 27000
ttcccgcctc cttccaagac cattcaatat tatcagtaaa tgtccatggc aaggatgtag 27060
ttcgagttat agggttccat tcaagatatg attggtaggt gggaagcaga tatgtctgtg 27120
tcaatcagta tcctggaaga aggagatgat gaactcaagt ggtgattaag ggaagtttaa 27180
tgaagggact atttacagag atgtggtggg gttaagagaa ccaacaaggg gaagtgatgc 27240
actcaaaaag ttactacctc caggctttag gggattgggg gagggagtgg cacagtgtga 27300
acccagtgtg gttgtgagaa aagggattcc ctcagcagcc atggccaagg ttagagtctc 27360
cactgccaaa ctgcatccag gtggtgaggg aatggagaat aggggtgggg taacaaactc 27420
tgacctcggt atccccaaag ggcaaaggat tccaggtggt acagttcgta aagattagcc 27480
tcagggcaca gaacagggca gagaagaatg gagaattgat ctggaggaaa caaacaatgg 27540
cttgcccatg ttattgcagg gagagtaggc tggtgtgcac agcaggaggg tggggagccc 27600
agcatatagc tgtgttgggg cctgtgcaga tcagcctcac tggcagggag gatctgagcc 27660
gagaggtggt ggaagatgaa atcgagtagg catgttggta gtcctaaata tcaagtaaac 27720
gttcctgatc ttacattgat actcaatagt aagccaattt tgtttcccat aagccaatat 27780
taatattacg tatttctttt ataagccaga gatatagaga gataccctag aagaatgata 27840
ggggaaagga aggcaagggt gagagaagac cttgtgtgaa tttgtccaaa atgtttatcc 27900
acaggaacaa tccctttgtg aaggctgctg gtatgtgaat gtgtgccggt tcccttgggg 27960
cgttcatttg gatctttctg tgttccagtg acctacggca tgatgagctc caatgtgtac 28020
tactacaccc ggatgatgtc acagctcttc ctagacaccc ccgtgtccaa aacggagaaa 28080
actaacttta aaactctgtc ttccatggaa gacttctgga aggtatttgc aaataacttt 28140
gaaagtacct ctctatcaca gaaaattgtt catttggctt catcatttca atgcatgagt 28200
atcgacagga cctgctttgc atttaacact gtgtgagacg taagttatgg tgagttgtta 28260
gaagttactg ttcctactct caaagggggt aaactaacat tgagaacttt gcctgtgcct 28320
tgcactgtgc tgagtgtttc atatcttacc ttatttaatt tctatagtct aactctataa 28380
ggtaagtact aagactatgc cctagtttgt taatgaggaa aatgagattc aggatgttta 28440
aatgcgtatg gtcacatggc tagggaacaa gaaaaattga tttttttcta gcctgacagc 28500
tacttcatcc tagtttgtaa ttcattccat gagtcaagat tcaataaata tttattgaga 28560
atctcctaga atgtaaggcc aatgaagggc agtgtggttc ttctgtcttg cttcgccttt 28620
tgtgttttgt ctctttgttg atgatggcat gtatccccag ctcttagaac agtgcttgat 28680
tcaaagtaag cacattcttt caaaggtctg ctgttggtgg ggcttggtgg ctcacgcctg 28740
taatcccagc actttgggag gccaaggcag gaggattgct ttagcccagg attttgaaac 28800
cagctgggca caacatagta tgactttgtc tctccaaaaa agttaaagaa ttagcagggt 28860
gtggtggtac acacctgcag tcccagctac tcaggaggct gaggtgggag aatcacttga 28920
gcgattgctt gaggtcaagg ctgcagtgag ccatggccat gctactgcat tccagctggg 28980
gcaacagagt gagacccttt ctcaaaaaaa atccccccca aaaaaaaacc caaaaacaaa 29040
caaaaaaggt ctgctgttgt gaagttcaac ccaatccagc cccttcccaa gttgtcacaa 29100
attccaacgt agttaacagt ataccaatga gtgataccac aggaaaaata ttaaactgat 29160
ctgagggata tggggcttgg aatctaagaa aattggaagg gaaattgaaa aggaaattat 29220
tatttctcct tggggagata gtttctaaaa ttcttactac accctggggt cagagctgtt 29280
gattttaagg atagagacaa ctgagtcaca ggaaactatt catatataaa agtacctggc 29340
atccaaaacc acacttgtat aatatgaatc tttcaccatc tgagtagggc aaatcagtct 29400
atctctgttg atcatctgac aaggatagca cactgagaaa tagatctgtc ttccctacag 29460
gcatagctag ttgtacaaac taacaagaga cttttgtata cacattccat gatgataaat 29520
gccaatcact aaagggacga ggagggattg gagagttcac catacagcaa aatagtccag 29580
acaggtgaaa ggtctatcaa atgccaggct ggtaatcaaa actgtagcct tttctctaaa 29640
caaagtttag aaccatgatt gtgtgggaca ttattttaat aagggaaagt gcagttaatc 29700
atgaccccac ctttagtcca agaacaaaaa tcagagctgc cacgtattaa gtacccactc 29760
tgtgccaggt gcagtaacta tgcaaaagat gggttttcca gatgcaagaa ccttggttca 29820
gaggaccctg ctcaaggcct catagctaac aaatgatggg gcaagatgct atcccaaatc 29880
tctctgacaa caaaactcat tcttatcact ctactatttt catagagttg ccaaatgctt 29940
ggttatgcaa acgatgcagg caggggcaag acagcggctg agcttggaac tttttcagag 30000
atgtttcctt tgcttttagt tcacagaagg ctccttattg gatgggctgt actggaagat 30060
gcagcccagc aaccagactg aagctgacaa ccgaagtttc atcttctatg agaacctgct 30120
gttaggggtt ccacgaatac 30140
<210> 241
<211> 32598
<212> DNA
<213> Homo sapiens
<400> 241
aatggtagta gccactgggg aatcattgca acttatagtg gagctggcta ttatctggat 60
ttgtcaagaa caagagagga aacagctgca caagttgcta gcctcaagaa aaatgtctgg 120
ctggaccgag gaaccagggc aacttttatt gacttctcag tgtacaacgc caacattaac 180
ctgttctgtg tggtcaggtg tgtactgagg acatgcatcc ctcctatttc tgtgtggttg 240
tacatacatc ctattctggg gttagccaga aaaacctttg cctgcagtta gctacatgag 300
gatgccaagg acccagacgg atagcaaggg aggggtaaaa actgaaggct taccgaaata 360
aaggatattt gaggaaggga gttgggatcc tagaatatta cgagttggaa agaaccataa 420
ctctggtcca agttcatctc aatgctggaa cctttccaga aaaagtattg tgtttttcta 480
acatctgtct ttacccatta taaggatggt tagtgccaca tgttccatca ccaagtcccc 540
cggccatcaa atcttgactc atttcctgga gtttctcact ctcagatgag cctctgctat 600
tagcacacaa gcacagtaac cggagtgctt gtaggatgct cagtaggata cccaggttac 660
ctgctcgtgc tcagggctac caaaggcacg taaagttcct tccacagatc ctgggatgtt 720
gccatgatga cccctctgtg agatagtaac aaaaatgaca aagattccac tggcttgtct 780
gggactcttc ttcattcatt tattcagcaa acattcattg gacacttaat atgggctagg 840
cattgttctc ggctcttggg acatgtcagc aaacaaaata aagatccgca ccttggcaga 900
gcttgcatcc aaccaggagg agactagaga ataaacatta aacaatacaa ataaatagta 960
tagtatatta gaaggtaata ggtactatta aaaagaaaga aaaagcagag caagaggaag 1020
tcagagttca cccactttaa tcttcctggt gagcatgtca gcaacaccca aacatcacta 1080
acatggatta ttgcatgtat atttacacat aagataagaa gtgtttattc tcataatagt 1140
ctttgtcatc attcttgagg ttaagttcaa ttctgcttta tgtggcttgt tggattgtcc 1200
cagtccttgt atttaacaac atttgcagaa aatagtacca cattaaatca attatagatt 1260
atcccttatc caaaatgctt aagaccagaa tgtttgagat ttaagaaatt tttcaggttt 1320
tggaatgtct gcatatatat aatgagatat cttggggatg ggacccaagt ctaaacacaa 1380
aattcattta tgtttcataa atgaaactta atgcacatag cctgaaggaa attttatttt 1440
tcccttaggg atgttgaatc aactgttgtg tgccagcatg ttgacaatga cctgtcacat 1500
gaagtcgggt gtggaatttt ccacttgtgc gttcatggcg gtgctcagaa agtttgggat 1560
tttgaagcat tttatatttc agattttcac attagaaata ctcaagctgt ccttgctcac 1620
agtggccaaa aaaaaagaaa gaaagaaaag aaatactcaa ccagtagtcc agtagtagtt 1680
atcactagaa atgaatgaaa atctattgca gtattattga gtttttccta attattccag 1740
tgcagataaa aagaaaagaa taaaaaggaa gagaataaaa acagagaggc aactctgata 1800
ttttagtaaa ttctatttat agaaggtctt gagtatttct tctgcttcct cccttacttt 1860
aaggatgaac attgttaaga caactgcttc atttctctat actgtttttc taagtttctg 1920
gaagtggttg actactgcag ggccagaatg ggccagagaa atgacttgac acttgaaggc 1980
cacttccttc ccttttgagt tcccaatgaa gctgtcacat acaaggctct tggcttcaga 2040
gttgctctcc tgagtttttg attctcaccc ctactctcta acacatcaaa taggaaagaa 2100
agaacaggag aactgacaat gaaaaggaag gaaaattttc acacttctct gaccagttct 2160
aatttaccat agtcctgttt ttacttgatt attgctcatg catgtgtcct gtatgctcag 2220
gttccaggtg cggctacctg tcctgtaatg gcagagatag tgatggctag tagctgacta 2280
aagggctttt aaatgtctca aaatgaagca gctagagatt ctatttctag ttagaaaaga 2340
agtctgtatc attaactgaa tcacccagct ttctcagtgt gacacctaca aaatgggcat 2400
ttgacaagaa aaaaaccctc agtccagtta tggtaaagca gtaaagatca gagccatcag 2460
tatggatgta aaatagtgta tgttttagac aatcagacat ctattgagta cccacctatt 2520
aactataagg ctctgggaag aagagagaaa actaccctgg aggacaaact atttgatgct 2580
atttaggtgt tacataatga atgaatgact cagttcctat ctttatatat gtacaaaata 2640
tatcctactt ctcaaccaga ttacacatgt tttgagtgga tggtttatat ttctttatat 2700
tcttcatgtt gcctagtaga aggacttgaa tttaatagaa gtcctagggc caggcatggt 2760
ggctccttcc tgtaattcca gcactctgaa aggcccaggc aggaggatca tttgagccca 2820
ggagtttgag accaacctgg gcaaaagggc aagactcagt ctctgccaaa aaaaaaaaaa 2880
ttagttgggc atggtgctgc acacttacat tcccagctac tcaggaggct aaggcaggag 2940
aatcccttga gccctggaat ttgaggcagc agtgagctat gattgcaaca ctgcactcca 3000
gcctgggcaa caaagcgagt ccctgtctct taaaaaaata ataacagaag tcctagaaaa 3060
gtttgtgtgt tgatttactt ttacattaaa agtatatggc atgttgagca gcgtaaatat 3120
agaaaagtgt agggaagact gagcaggaag tactcctttg ggactgaaag acctcaggaa 3180
gtcttattcc tttgatggca caaaattctc caagtatgga attattagct atgataaaaa 3240
tgttttgccg ctagtttggg gggactcatg gtagcagttt cattaccttg taatgcatga 3300
acagaacaga tggacatcca ttcctggctg tattcatgtg ttgttgttgt tattgtttta 3360
attgttctta tttacatgca ggttattggt tgaattccca gcaacaggtg gtgtgattcc 3420
atcttggcaa tttcagcctt taaagctgat ccgatatgtc acaacttttg atttcttcct 3480
ggcagcctgt gagattatct tttgtttctt tatcttttac tatgtggtgg aagagatatt 3540
ggaaattcgc attcacaaac tacactattt caggagtttc tggaattgtc tggatgttgt 3600
gatcgttgtg gtaggtttga gaacaacacc aaatttccta ttctattcta caagcatgtt 3660
aactagagtc tttgatctcc tcagcattgt ggatcttgat attcccaaaa aagaatctaa 3720
aagtccccct caattatatc aacttctgtt actaattatt ttctcatttt gcatgagtaa 3780
ctttgctgag tatgaagtgg agaggtattt acagtatgct ctcagccacg ctaataacaa 3840
gagtatctca gtaattcata tttggcttta gtatgccgta tgagatgtgg aggagaaaac 3900
agtttttttt ctttgttttt ttttccacta atgatatttt tcttcaactg ctggtaaaaa 3960
tcaatttata ttttcctgca catgtgtgaa gttacagcaa taaaaaaact tgtcggccag 4020
gtgtggtagc tcatgcctgt aatcccagca cttggggagg ccaaggcagg aggatcactt 4080
aagccccaga gttcaagccc agccagggta acatagtgag accctgtctt tacaaaaaaa 4140
aaaaaattta attagtcagg catggtggca cacacctgta gtctcagcta ttccagaggc 4200
cgaagtggga ggatcatttg agcccaggag gctgaggctg cagtgagcta taaatgcacc 4260
actgcactgc agcctgggtg acagagtgag accttgcctc aaaaagaaaa gaaaaaagaa 4320
aaatcatcct gaaaatattt tgtgcggcag agaaaacttt ctgcagttta aaattttctg 4380
caaatagtct gcagagtaca aatgtaagtt atattcatca aagttttctg tatgaggtat 4440
aagaaatcaa aggcaggcca tgcacagtgg ctcataccta taatccctgc actttaggga 4500
actgaggtgg gaggatcact tgagatcagg agtttgatac cagcctgggc aacatagtga 4560
gaccccatct ctaaaaaata aaaataaaaa ataaatcaaa ggcagagtca taatcaagac 4620
catgacacca tgtaaattct gtgtctgctc ttgactctat tataacttct aagatttttt 4680
tcaagatgtt ttcccttcat ccttatcact taattaagca tccgtcactt ccttcctgtg 4740
gtttcagtgt ataaaagaat ttttacaagc ttttctccct tcagcaataa caggtaacat 4800
ttcgctaagt ccagttgtac atttaagcat ataacaacat gcttaattat tagatgctta 4860
caagctttgc ttggcatagg tgtaccatgt attattctat gtctttcctt cccactgtcc 4920
tatgatagcc attaccttct gaaatctcag taaatgatgc actaccctat tagcattctc 4980
tcttctgtta gccctcctta tgagagttat tctttccctc atcccactcc taaaaattca 5040
tttggccttt gtggagtatt tagatcaagt cattattaaa ctattcccca ctagaattat 5100
taatagttga taaaatatgg aaaatatatt attcatatgt gagtgaaaga acacttaaag 5160
cataaaaaag aactacatgg ccatatattg catggcaata actatattag cagcaataat 5220
aattgtaata gtaataataa taatggctaa cactttagaa gcttctgtgt taggcatttc 5280
cgggtgcttt tcatggtaca gaagctcatt tgttcctcat actaaccctc ttcactactc 5340
tgccactgcc tctcaagcca tggatatgtg cactttagag tttttactta aagtaaaaat 5400
tcctgtagaa tagatggtgt tgaccccatc agaccgtgat gcagttagaa gtgcatcccg 5460
tcttttacga tggccataca acatcacaca aatcaaggta aacccttgat ccccaaattc 5520
tcaatgtatt aataatgaac agagttacac aagaatttta gcatttaagg aaacaggaga 5580
gacgataata ctggaaataa tttttcagaa tatttctgtt cggattgatg gcagagtgca 5640
ggccatatac attgacaatt attccagaac acaattattg tttggagcta aaaggatgca 5700
aaccctgcct cttggcttat atggatttat ttatgtttag gccattgaaa taatggtaga 5760
aaggtaagta tgatatgcta attaagaaca gacttccttt ttatatttta accaaagaac 5820
tcaatatcaa caaaagacta gtcagtggta ttcacccttt ttgatcatac acacctatca 5880
gtgaaagctt tgactactac acaccctaat ttattatctt tatttgtaaa ttgtgtgcct 5940
actttggtgt aacaggtaca tccgtaaaac atacacatac atagaatttt aaagattgga 6000
ataaaagtta atacaaatag aattccaaaa ctttcttacc acctacctag aagttgtaac 6060
attttcttcc catagcccag tgaattgcct tgcacctgct ttggcgacca ataggaagaa 6120
aggcaatgat atcatggaaa ttgtctcttt ggctcaacag ccacagcatt ttgcaagtgt 6180
ttctttgaaa acttgcttca ctgtgttttt caattttttt tttaaacaac acttaatact 6240
gccagacaac aattcagaca gtgtgctttt tgtttataaa gaacaaggaa gggctactgg 6300
aatctcactt gtcctttgaa acttttgctg accaagtgta gaagtgaggg catgccttct 6360
gctcacccac aaaacacacc ctgtgctcca ctggaccttc aaaccagtgg aaagacccaa 6420
cgctttttgt tttatctagc caaaatttgc ttatgcttac ccaaaacctg aaaagaaatt 6480
atattcttaa tataaataca atcacatctt gaaatcactt tgaaattttc tttattttcc 6540
ttttttcttt ccccaacata tgttctgaag tacacaggct gcatcagtca gccatttgtc 6600
ctgagcaata gtctttcaaa actagaagaa ttacttgaaa aaaagaagac tattaaggaa 6660
tttaaactca aataatttat tgaccacttg ctaggttgta cagggtaaat tttttttttt 6720
tttttttttt ttgagatgga gtcttgctct gtcacccaga ctggagtaca gtggcaccat 6780
ctcggctcac tgcaagctct gcctcccggg ttcacgccat tctccctcct cagcctcctg 6840
agtagctggg actacaggtg cctgccacca tgcccagcta attttttgta tttttagtag 6900
agacagggtt tcaccgagtt agccaggatg gtctcgatct cctgacctcg tgatccgccc 6960
acctcagcct cccaaagtgc tgggattaca ggcgtgaacc accgcgcctg gcccgactaa 7020
ttcatttatt cagcgagtgt tttctgagca cctactatgt acttgccact gttctaggca 7080
ctggggatac aggaatgaac aaaatcaccc aaatctctgc cctcccaatt ttctggtatg 7140
gagagaaagt tcttttgtag atagggatga gaatcccaca gaaaactcag gagtgatgta 7200
acaatgcaaa tgctcacaaa atctctttcc tcatctttca ttccctattt ggaaggaaag 7260
gtttcaaaga cattgatgtt gtataaatga ccatcttctt cattatttta taaacatttg 7320
tcctgtgcag agtaaaaaca actggactgc ataacaaatt atacctattg agagttgggt 7380
aaagagttac cattggatcc agtccaccaa cccaaatgtt tttctacatg tattagctga 7440
gatgagctcc tcatctcagg agaagcctat tcccactgca ggccttcttg agtctgctgt 7500
gttcatcatt cccaccacca acacaaaaat acaagattgg ctctggaaat ccttcacaga 7560
gaaggaagga aaggaagatg gtgaggttgg ctttttagct gtgatcagca accaagctgg 7620
tctttgctat gagaatcagt gggaccatga tctctatggt catctcagga agggagggct 7680
aatgaagtgg tctctggcca tgattcctaa gaagagagaa tggacagcaa agatcgcagc 7740
acctgccaca gcccacctgc tgcagattca gaccccctgg tggggccagg ttgttatgac 7800
taacccctag cactgtctac atttagtggt gatggatgcc aaggaggggg cagtgtcccc 7860
ttggatctga ttgtaaagct tagaaccaaa gcatatgtgg aaagttgtag ggtcatgagt 7920
taagggacag aaatgagcaa gagagaagcc cttggctcat atattcccac tgcaggcctt 7980
cttgagccct ctgtattcat cattcccact gtctttcaag cccaagctca tgctttgttc 8040
tcatgggcac tcatttttag gatatctttt gtccctcttg actttatgtt gtgtgatacc 8100
aactctttag tagttttttg tattatttaa cttcatgtgt ttatctgctc ttgagtctcg 8160
agggcaggat ttatgcagtt tacttctgtt tattcctctt agcccttgca cagtgctgta 8220
tacatagaca tctactatat ttttgttaaa cagagcaaag aatggctggc aattggagaa 8280
tgcagagaaa ccgaaaaatt ttaaatttaa aaatcacaaa taaaaacagc aggatgaagg 8340
caagaaagca aaagggtgga aagtgattaa aatgaaggtg gcagaaaaaa cagaaagcat 8400
tcctctttga gtttgagtct gttatagtgt gatctcttct gtgtatgcat gtatgtgtgt 8460
gtaatgtata tgtgcacaca catgcatgca tgccttcgtt gagtttctat tccgaactaa 8520
ggaaatgcaa gcaatatact gttttactta ttttatggca gggcttaaca ctttccattt 8580
gagtgagtga cttttaagaa tgacatcggg taagtataat ggtgagccct tataattaat 8640
acattggtga agaaaaatat actagtcata ttaaggtaag tttcatattt ctaaaacact 8700
gtaataaaat ataaatattt tgcttttcag ctgtcagtgg tagctatagg aattaacata 8760
tacagaacat caaatgtgga ggtgctacta cagtttctgg aagatcaaaa tactttcccc 8820
aactttgagc atctggcata ttggcagata cagttcaaca atatagctgc tgtcacagta 8880
ttttttgtct ggattaaggt aatttataaa tttcatgttc tacattttaa ataatatttt 8940
ctttaaaaaa aatgagttcc acaaaatcat ggaatacttg aatttgaaat tcaagtgacc 9000
agccaaagct gctcaatatt tactttgaga cagggtctca ctctgtcacc caggctggag 9060
tgcagtggta tgattacagc tcattgcagc ctcgacttcc caggcccaag cgatcctccc 9120
accttatcct ccgaagtcac tgggactaca ggcatgtgcc accatacccg gctaattttt 9180
aaattttttc gtagagacaa ggtctcatta tgttgcccag gctggttttg aactcctggg 9240
ttcaagcaat cctcccacct cagcctccca aagtgctggg attacaggca tgagccaccg 9300
tgccaggcct catattttac atataaagta aactattgag actcatgtga tcattcctct 9360
cactgtcaat gacatacttc tgctatctga attagtgcaa gatcagtccc tataggtttt 9420
gtttaacaaa tgcagtaaga ggcctttcag tgtgttagct gggcctgggg ccccaggctg 9480
ctaacagatg agatgaacag gtgaaggaaa aggaacttag agaaagagag ggaaggagca 9540
ggtggaggga aggggagagt tgctgcactt ggaaatgctt gctagaaggg atcgcctctt 9600
ttccaggtag aggctgtaag ggaagcttta cctagaatta aggttggaac agacactgct 9660
tccaaatagt tccttgctca ctattttcct tattgtccca agatataatg tgcatttcca 9720
tgtgtgtgaa aggttatgac atttcatata caacaagcct caattctgga gatgcaggaa 9780
atttcaataa ttctcaggca gcagctgcca ttcggtcacc agcacaggct ctgattgtgc 9840
tgtccagaca gtaagtacta gccacatgtg cctatttaaa ttcaaattta aattagttaa 9900
gcttaaatac aattaaaaac gcagttcctt ggtcctactg gccacacatt aagtgttcaa 9960
tggctactgt ctaggacagt ggaaatgtag aacatttcca tcatcacaga acgttctctt 10020
gaaaagcact gttctggaag gtacttaccc gttatgtact tttctgagtt ggtattcata 10080
cctagaagac ctgaggttta tcacaagaca tagacttgga ccaggcgcag tggctcatgc 10140
ctgtaattcc agcattttgg gaggccgaga taggtcccct gagcccagga gtctgatacc 10200
agcctgggca acatggcaaa acctcatctc tactaaaaat acaaaaatta gctgggggtg 10260
gtggcacgtg cctgtagtcc tagctactta ggaggcttag gcgggaggat tgcttgaatc 10320
cagaaggcgg agggtgcagt gagccaagat cgcaccgctg cactccagcc tgggcaacag 10380
agtgagaccc tgtctcaaaa aaaaaaaaaa aatgcataga ctttatcctg tatttctcat 10440
gctatttatt tattgacatg cttgttcaag agaaaccatc actaaagcac aaaaccttga 10500
tcataacata gtaataataa tcaaacagca aaaataataa tagtaataag aatgttctgt 10560
ggtgatggaa atgttctata ttttcattgt cctagacagt agccactaac catgtatagg 10620
catggaacac ttaacatgtg gctagtagga ccaagggact gaatttttaa ttgtatttaa 10680
tcttacttaa tttaaatttg aatttagata tccacacatg tttggatagc acagtcagag 10740
cctgtgctgg tgaaaggatg gcaggtgctg cctgagaatt actgaagttt ccttgattat 10800
tattagttta ataataataa tcaagatagt aataataatc aagatagtaa taataatcaa 10860
gatctcagct gggcacagtg gctcacgcac tttgggaggc tgaggcgggc agatcacctg 10920
acgtcgggtt tgagaccagc ctggccaaca tggtgaaacc ctgtccctac taaaaataca 10980
aaaaaaaaaa attagctggg tgtggtggca cgtgcctatg atcccagcta cttgggaatc 11040
tgaggcagga gaattgcttg aacccaggaa gcagaggttg cggtgagctg aatcatgcca 11100
ctgcactcca gcctgggcaa cagagcagca cttcgtctca aaaaaaaaaa aaaaagatct 11160
caaatgaatt gggattgtat taagtaatga ttaagtaatg tgattacagc aatcctcaag 11220
aaatatttca ctgtggccag taacaatgtg taacagacct ttaaacttct agagattttc 11280
ctacaacatg tgtctcaggc tgatgtgttt tatttagtgc ttctcttgga aatgtcttgc 11340
ccctcgatac tttatcatta aggtctttaa ggcagggatc atgactctac tttttttttt 11400
tttttttttt ttgggacgga gtcttgctct gtcgcccagg ctggagtgca gtggcacaat 11460
cttagctcac tgcaacctcc gtctcctggg ttcacgccat tctcctgcct cagcctcccg 11520
agtagctggg actacaggcg gctgccacca cgcccggcta attttttata tttttagtag 11580
agacggggtt tcaccgtgtt agccaggatg gtctcgatct cctgacctcg tgatccaccc 11640
acctcggcct cccaaagtgc tgggattaca ggcttgagcc accacgcccg gcctcatgac 11700
tctacttcta atatctcatc atgtgctctt ccactgaggc ttctacttag agctacacaa 11760
tctgggcagc catcctcagt gccttatcta ccaacatgct caatatggct ttgcagggtt 11820
cactgtctac cagcagggtt cactatctac caacatgctc aatatttctt tgcagtcagg 11880
cagagcaggc tttgcagttc aggcagggca gctggctgca ggccccagct gactcctggg 11940
gatagaatgc caatatttca gacattgcag agatttgagg caatgtacat aaagccctcc 12000
acatataact gatgcacaat aaatgacagt taatattatg caacaagaat ttcctggggg 12060
gttttataat taatttttat ttgtgtgaag ttttttccct cccttttact ttaatccttt 12120
ttggggggaa agcatcacta gtcacagttc acggcagcct cgacctccca ggctcaagca 12180
accctcccac ctcagcctcc tgagtagctg aaaccacagg tgtgtgccac cacacctgac 12240
taatttattt ttattttcta atgaaacaga atcttgccat attgcccagg ctgatcttaa 12300
actcatgggc tcaagcgatc ctcctgcctc agtcttccaa agtgccggga ttatagatgt 12360
gagccactgc actcagcctt tttttttttt tttttaattg tagatagcat aaaacctact 12420
gttttaacca tgcttaagtg tacaattcag tggcattaag tacattcaca gtgttgtgca 12480
gccatcgcca ttatgctgca ttattttcag aactttttca ttattctaaa ctgaaacttt 12540
gtatccattg aacactaact cccaattccc ccagtccctg gtaacctcca ttctactttc 12600
tgtcactgtg agtttgacta ttctaagtac ctaatttaag tggaatcata cagtatttgt 12660
ccttttgtgt caggcttatt tcactttgca tgatgttttc aaggttcatc catgttgtaa 12720
cctgtcagaa tttaatttct tttcaggatg aaataatgtt ttattatata cagtcacacc 12780
attttgttta tccattcatc tattgatgtc ttctctctct tacagctctt caaattcatc 12840
aattttaaca ggaccatgag ccagctctcg acaaccatgt ctcgatgtgc caaagacctg 12900
tttggctttg ctattatgtt cttcattatt ttcctagcgt atgctcagtt ggcatacctt 12960
gtctttggca ctcaggtcga tgacttcagt actttccaag agtgtatgta agtatatatg 13020
aaattaagaa gaaaaattta atcagagttg tcactgcttc tcaagaataa atcttcatat 13080
gaggttgcta tatgaccacc aattatttaa aaccagttat tttaagtaag aattaattac 13140
cttttcccaa aacattgatc tacccatgca aagaagacaa tgcatcctga aatgctgatg 13200
cttaagatag cagcccaaag tagtaaaata cagttaacag acataggaaa ccaacactgt 13260
tctgaagact gagtttttct ttgcaccaaa tgcagatggt agcttctaga aggctgtttg 13320
cctatattct tactcctgtt gaatattgtt gccatatatt tagaacttca agttattttc 13380
taaggaaaaa aacaagatat ttctaatatt ctaaggtaaa ctcagaccag tacaagaatt 13440
ttcagttttt ttttccaaag atcccaaatg tgaaataaaa caacaaaaag cagccagtgt 13500
cagatttcta tgccatttag aaaggagtta gtttaaaaag gaatggaagt aatagggttt 13560
tgtgcataga tatctcgaat taatattgct gttgataaaa gtgattttgc taagacccag 13620
cactgacaac acttggccac tttgatccca ttttaagtac ttgtcagaat attggatctt 13680
tgaactcaaa ccattttggg tttttggggt ttttttgttt tgtttttttt tgttttgttt 13740
tgtttttgag gcacggtctt gctctgttgc ccaggctgga gtgcagtggt gcaatcatag 13800
ctcactgcag ccttgaactc ctaggctcaa gcaatcctgc tgcctcagcc tgctgagtag 13860
ctgggactac aagtgtatgc caccatgcct ggccaatttt taactttttt tatgagaagg 13920
gatctcactg tgtagcccag ggtggtattg aactccaggg cctcacactg tcctctcacc 13980
tcagcttcca aaagtactgg gattacaggc atgagccacc acaccaggcc ctgttgtttt 14040
ttttttaaag aaatttttaa ctttagaccg agggtgactg ttgtcaaggt ttagggttaa 14100
gatgttttac ctagattatg tgttgaaatg ttatagccaa ttgctttata agttattgaa 14160
taataattgt attttctttt tttttttttt tttgagatgg agtctcgttc catcgcccaa 14220
gctagagtgc agcggtgtaa tctcagctca ctgcaacctc tgcctcccgg gttcaagcga 14280
ttctcctgcc tcagcctccc gaatagctga gattatgggc gcacgccacc aagcccagct 14340
aatttttgta tttttagtag agacggggtt tcactatatt ggccaggctg ttctcgaact 14400
cctgacctcg tgatccgccc gcctcggcct cccaaagtgc tgggattaca gacgtgatcc 14460
accgtgccca gcttgtgttt tctttttaac caaatggaaa taacctctgt agcatgaaag 14520
cattttatta ttattgcaga aggctttaat tgctgataca agtagcaaga ctttgtaaat 14580
gggattgaca attttctgtt attcggcagc tacctatact gctaaaaggt ccaaaaataa 14640
tgaaatcatc tttaagaaat gttgcatcaa ctagtggaca ttctttgttt ttgtattgtg 14700
gtgttttgtt ttatttttat agcttcactc aattccgtat cattttgggc gatatcaact 14760
ttgcagagat tgaggaagct aatcgagttt tgggaccaat ttatttcact acatttgtgt 14820
tctttatgtt cttcattctt ttggtatgta catttttatt tatagtgagg ttcaatttaa 14880
acttcgtaaa tccttgtctt ctcttttctc tcacacttta tgtcctatca attttaaata 14940
aagacccagg aagtagaaaa aagtgtggat gttggaaaac ttattttcct tttattaatt 15000
cacagttttg agactcatat caaatgtctt ttctgtggtc tttcattgat ccatgtatat 15060
gtgtctattc aatgcaaaaa aaattagatc tcttccatgg tctttcattt ctctctctat 15120
atatgtatct attccatgca aaaaagaaat tagatcaagt acaaatttat aaagatacct 15180
aaaatagtgc tttgcctaaa aagtagaata tgcttacatg ctttttaaac tcatatgtca 15240
gcactttcgt agtcacttgc tagcatgact tttctctctt tcttcttttc tttttaaaaa 15300
ataagaacgg aaaagcaagc tagatctaag atgtcgagta atagttgagt gaatcattgc 15360
atgtcaaaat taggatattc tgttttaaat tatttatatc ccattcatct agagactgcc 15420
tacagagaat attcaaataa ttaagtttaa aactaaatgt aacaatgaat ggaaattgca 15480
ttaaaattat tttcaaaaat aattttttta ttctcttgat ttggtacaaa tgaacatttt 15540
taatgttttt gccctaagtc aattaagttt ttttaaggtg ttttgttctt tttcttaaca 15600
tttatatatt caattgtcta ctgagaaggt gttaagccag cttaatttag gcaatatttt 15660
tcatctaaac actaacagtc atcttaagaa caattttctt aagaaaataa cattttttcc 15720
atttcagtaa attgtgtaaa gatcccttga ggaaggttaa gtgatcacat tttcagtaat 15780
tcagtgtaat aactctaaag tcagtccagg tattactggt taagtatatg gtatttattg 15840
attgggtatt agatgtactg tattaatttc ctgtttaaaa aaaatttttt ttccggggag 15900
acacagcctc tggtgtaaaa caaaggtgtg ttccctagct gtactttaac aggactgaaa 15960
aggtcaggaa tatcattcaa gttcatatgt atcttgctgt atgcatggtt tatggctcat 16020
ttttaaactt acacctctta agcttcttct tcctatcata tattaaaaca atggagagaa 16080
gaataagcct ctgttactct accattgata gtacttcgga ttctagagta cctgaatctc 16140
tactaagaag gcaaaaacca ggaattgaga gtcctgcacc tgacccttca gttgatctca 16200
ggccacctag ttttctccgt ttatcaatct gccaaacaag gatggataga gtcgtggcaa 16260
ctggaaaggc tcaaatgtgg aattgtttga atgtggtcct ttagtaggca gccatcttac 16320
cagatctaga gtattcagtc atcttaccag atcagtcacc agaacatgaa aagaagctct 16380
tagtttctat ctttatacta aaattgtttt tttgtacgac tgcacaaaaa agaattgctc 16440
tccttgcacc tcccagagat ataggtggat agatacatac atacgtacat acatacatac 16500
atacatacat acatacatac atagacacat acatagatag aagtctactt tcaatacaaa 16560
cctgtctttt aaggaaatga caagctgagc atagggttgg ccacctttct gagccgattg 16620
cctggtatta gtttattgcc cctgtttagc aagaaggcac agtgttaaga agtggctcag 16680
ctgaaccagg ataaccccac tcttccccca catcaacagg aaagacatcc tggtgcagat 16740
gtccatctga taattcaggg aacctcggga gacaggatgg agaggagggt gagctagctt 16800
cctcttccca caccttcaag agcctttctc aagcactttc tattttttga aatctcttta 16860
gaggtcccag actttgatct gtttcaatta aggtattggc aggcattagt taacagccac 16920
ttggaagcaa aaatagaaca ttagatccct gagttggaag agagaaggta gaaggtgtta 16980
cttggactgc aattatctgc acttggaatt gagcatttag tcaaaaactt atatgtattc 17040
tatattctat tctcatttct gctacagaat tgtaaacaat attcttcctt aatacagaaa 17100
ttcatagccc actaaaataa gagcgttctc atttgttcat ttctcaatca tttaataagt 17160
atttactaag ccactatatc catatatata tatatatcat atatactgta taatacacac 17220
tgtagtgttt tttgtggatt gtgtactatg aggtagtatg ttagatactg ccagtactgg 17280
ggtaaggaaa acagcctgat taggccctta cgaagattcc tcagacttgt ggggaaaaca 17340
gacattatca aatagaaata cttgcaaacc acagttatgt gttaaaaagg aaaaacaaag 17400
taaaaaaaaa gttggtgggg gggaacctga tctcctggat acagtgcttc gagaaagttt 17460
gttgttggaa atgcaaacca ttactactgt ggaagggaaa ggtcagaaaa atgaactcac 17520
cattactgaa tagtaatagt agctatcaat taggtggcac ttacctgcat caggacctgt 17580
cctgagcact ttacatagat tgtctcacta accagcccaa caaatatgta agggagatac 17640
tattattttt cccattttat taatgtaaaa caattaaata attctttaaa attagactta 17700
gaaaagtgga gcaacaatct tagcagtgct aggactgaaa tccaagtttg cttgactcca 17760
aagtctatct ctcttccaga aactttttct ttactatctg cctagtaggc ctgctgtatt 17820
cctatttgca acagcctttt aaactcttta aaaatgtgtc ctgtaaattt catatatgat 17880
tatacaaaaa aacttggaat aagcatacaa ttctacttat ctgtgttaac tgttgaaatt 17940
tgaagagctt tttggaattc tatacccttc agtagtgtat gtaaaagttt ctaaatatag 18000
agaacataga taagcaaaaa taatattaaa taaaataatc gcaccattag taggtaaata 18060
tactaatatt ttgttgtatt ttattcttgt atgttttcac aaagtatatc ataaaatttt 18120
tcctgtggca tgacttaacg gagaaaataa tcttcccaaa acatgtggca gcaaaactgt 18180
taatttatta catcaggctg ggcacagtgg ctcacgcttg caatcccagc actttgggaa 18240
gccgaggcgg gcagatcact tgaggccagg agttcgagac cagcctggcc aacgtggtga 18300
aacactgtct ctactaaaaa tacaacagtt agccaggtgt agtggcacat gcctgtaatc 18360
ccagctactc aggaggctga gactcaagaa ttgcttgaac ccaggaggca gaggttgcag 18420
taagctgagg tcgcgcccct gcactccagc ctgggcaaca cagtgagact ctgtctcaaa 18480
aaaaaaaatt tttttttaaa taaataaata ataaatttat gtcttcataa agcactcaga 18540
ttaggaaaaa aaggataaac aaaaaggcat gtgtcatttt tttgattgat aattccaaat 18600
tatgtttctt cctttaattt ttgccctcct ttcatttaca aacagaatat gtttttggct 18660
atcatcaatg atacttactc tgaagtgaaa tctgacttgg cacagcagaa agctgaaatg 18720
gaactctcag atcttatcag aaaggtagga aaaaccttaa ttctcagaat tcttctgttt 18780
ctgacataaa atgagcattg tttcacccag attttcaaat caacattgat ccattgaaat 18840
tgtttgaaat aaagaataca ttgctatatt tcaggaataa tttaaatgtt ccctatcttg 18900
gagtcttgat ggatatactg ctatcttgaa ttttaattct gggaatcctt ttatgccctg 18960
gaattaaatt ctcaacaatc ttttgacact ttaagagctg agctgaaggt tcatcacctt 19020
cattattttg acatctcctg tagctggctc tcacttcagg atcctgagtt gagaataaac 19080
tagaagggaa gattatataa agggatttcc acctcttctg tctcaattac cattttaaaa 19140
aaataaaaag ttttagagga aaacacttag tagttcaccc tttacccttg accttccacg 19200
gcagttttaa aataagcaaa ggaaaagatt catgaattca ggccatagcc tggggcctga 19260
gaacttttac ttatgcacct tctcaggaag ggtttcattg ttaaatagaa gggcaggaca 19320
ggaaagttgg gcctctttgt tcttctcaat gtaacttctt tatttggttt aaagtataaa 19380
atgtatacaa caacaaataa ccacatttaa aatacacagt ttgtttccca acatcatttt 19440
gctaagtcat agtggctcct taactgtaat tttttttttt attagtccaa gccttaggat 19500
tatgttatct gtgatatatg ttataataga aaacttaagc ctcttaaaac aaagtccttg 19560
ggatgggacc taagattcac attatcttga ttccgcataa cagttgctta cattttagca 19620
aatctccagt gtgtatgcaa gcactcctca cttggcacaa ttctgataca cacaaacttt 19680
ggttacccca gttttgttat gtaacaccac cttcaacaac acagttcaaa tttcagttat 19740
catagtatat taactctgag taacagcaca aagtacaaac tccactgcta gctcttcagt 19800
gtatagatca gttacctgag taacagatgt gcaggctgag caggctcact ggtcagtcat 19860
gacactattt tcagtctgtt actaattggt cactgagcat ctgctatcca attcacaaac 19920
aaagaaagca tgtagtgttg cttccttgtg ttccagtaat aagcccatgt gacattttac 19980
aaaaatggat aattgaaaaa gagaatgggt gcagtggctc acgcatgttg ggaggccaag 20040
gcggatggat cacctgaggt caggagttcg aaaccagcct ggccaacatg gtgaaacccc 20100
atctctacta aaaatacaaa attagctgag tgtggcgaca gatgcctgta atcccagcta 20160
ctggggaggc tgaggcagga gaatcgcttg cacctaggag gcggaggttg cagtgagccg 20220
agatcgtgcc attgcactcc agcctgggta acaagagcga aactccgtct caaaaaaaaa 20280
aaagaaaaga aaagaaaaga aaaagagaat gggctagcaa agaaatgaaa aatggtaaca 20340
ctggaagtga aaatcaaaac agagtaatgg atttatagaa gaaatagctg agtgaagaag 20400
aaataggagt gttgacactg cgatcattca agagatccag atatggagcc agaagaactt 20460
agggcaggtc tatcaactta aatgaggaaa atagctgtga taaaacagat gaagatgtct 20520
tgaggaaatg atgcctgcaa aaaacttcac attaagggaa gtcttattag agatatttca 20580
caataatgaa agtacaaaag aaaaaatgtt ggggctggac atggtggctt actcctgtaa 20640
tcccagcact ttgagaggcc aaggtgggtg gatcacttga ggccaggaag tcgagacaag 20700
cctgatcaac atgatgaaac cccgtctcta ttaaaaatac aaaaattagc cagacatgat 20760
ggtgcacacc tgtaattcca gctactcaag tggctgaggc acgagaattg cttgaaccag 20820
ggaggcggag gttgcagtaa gctgagattg caccactgca atccagccag gtgacagggt 20880
aagactgtgt ctcaaaaata aataaaagaa aaatatgttg gaagctcatc cacatttaag 20940
aaggaatatg acaattcact aatgcataga aaagaagttc actccacatt gtaaagtgta 21000
cagtgtaata ttatacaatg aaaacaaggc aagtgctgtt taaactactc tggatacatt 21060
ttttacaaag aaataaaaca ctttagtttt taatgtttct aatgttttac attttagtgt 21120
attaaatcaa tattagtttt cttctttttt aagctcccta tacatttata actgacacta 21180
agggagtgtt taatgttttg attaaaagtt gtaaagatca cagaacaatt gtaattcttc 21240
ccactgatta ttcagatcat tttgcacaat ttcagcttgc atggtcactt acagtgccgc 21300
actatgtgca aagcaaggtc aggtctaaag ttcgctaatg aaaaatcctc ggccaggggc 21360
agtggctcac ccctgtaatc ctagcacttt ggaaggcgag gcaggcagat cgcttgagct 21420
caggagttca acaccagcct gggcaacatg gtgagaccct gtctctacaa aaaaaaaaaa 21480
atagcaaggc gtggtgactc acacctgtag tcccagctac ttgttggggg ctgagttggg 21540
aaaatcactt gagctcagga ggtcgaggct gcagtgagcc agaatcacgc cactgccctt 21600
ctgcctgggt gacagagtaa gatcctgtct caaaaaaagg gaaaatcctc atctacattt 21660
cactgggttt tttgtttgtt tgtttgtttg tttatacaca cttaaggaaa ttactgtcta 21720
gaagatagat aatataaaaa ataaaaatgc aattcatgat tcgggtttct tggtattcct 21780
aagaactgtt gcacagtact ttatgctctg aggcagacag ctatagcata tatagtaatt 21840
tttgtttcta tcacataaac ttgaatacac atatgagtaa aagaccttta gttcttcatg 21900
acttactgaa agaccctgac tttttccatg taactgttcc acaagtgttt tatggaaaac 21960
tggatacatt aattcttcat tcatccagca cgtacttgtt gaatggccaa tgtacaccag 22020
gtttgtagta gttactactg tgaatggaaa gtaaaacaga tgcaaaagga gaatacacta 22080
aaccaagtct tttatttttt ctctctctga tagggctacc ataaagcttt ggtcaaacta 22140
aaactgaaaa aaaataccgt ggatgacatt tcagagagtc tgcggcaagg aggaggcaag 22200
ttaaactttg acgaacttcg acaagatctc aaagggtgag aatcatgctt cctgaggttc 22260
tgaaaaattc ctgcttctaa agataaattc ctggtgataa gagtatttct agcccaaggg 22320
ctcatacaga tacttttttt ttttttttcc agaggcaggt atctttctgg aacatgttat 22380
aagaggaaaa cttgccccca tttggtgatt tctcctttcc tcctgcattt tgatgtctct 22440
gtgttgaggg tgaactgggt acaaggaatg atttttatct gtatcctctc tctaatttca 22500
ggaagggcca tactgatgca gagattgagg caatattcac aaagtacgac caagatggag 22560
accaagaact gaccgaacat gaacatcagc agatgagaga cgacttggag aaagagaggg 22620
tgggtctggt ttaggagaac cggatttgat ttggtaccta caacaccaca gatgtatcaa 22680
acactataga agtagtgggt tattgagtct cttgcccatt ccccaccaca ctctctctct 22740
ctctcagtcg gtttatgtgt tagtaccctg tttattccag aaagaatata taacacaatt 22800
atgtataaaa atgggtggtt agcatgatat aaaaacgtca aaatgaaaag caagcaaaac 22860
aaaagtaaaa ataatggatt attaatgaag cttaaaaatg cattcataaa aacacatatg 22920
cttattaaga ttgggctaca aattgggccc taagcttgct ggtaatcagc ttgaaaagag 22980
aagcctgatt agctgcagag tccacaatgt ccgtgagagt gaagaaaaca aaaaatgact 23040
taccaagaga tgtgaaatta ttctggttag ttagtggcta tttaaattgt taactttttt 23100
ttcttttttt tttttttttg agatggagtc ttgctctgcc tcccaggctg gagtgcagtg 23160
gcacaatcgc gactcactgc aacctccacc tcccgggttc aagcgattct cttgcctcag 23220
cctcccaagt agctaggact acaggcacat gccatcatgc ccggctaatt tttgtatttg 23280
tagtagatat ggggtttcac catgttggtc tcaaactcct gactgcaagc aatctgccca 23340
ccttggcctc ccaaagtggt gggattacag gcagtagcca ccgtgccttt cctaaattat 23400
taacatttat aataaaatta acagccgcct tccatttgaa tactttttac aaaatagtta 23460
aaaataaaca taagtgggct tttatagtca gaaaaaaaaa ttcaaagctt taccattaac 23520
tttcaaaaat aaatggttag acagcaacaa caaaaatctg tggtaactga ggtacagaga 23580
acacagatga atgttattac aaaagccact ttcctatgag aagtctagga cagtggtttc 23640
taaatgccac tccacagaca gtgctagtag gtgacagact tctccagtca cagtgaaatt 23700
taagcataaa gaaaatgagg aaaattttta caaggctcta tttagacaaa gttcttattc 23760
tgacattaca tctttcctac tttggagctg ttgaatgtat tatcttttat gaaaagaagg 23820
cgatccaggt tgagcatccc taacccaaat atgtgagtct gaaatgctcc aaaacctaaa 23880
acttcttgag cacaaacatg atagtcaaag gtcatgctta aaggaaatgc tgtcattgga 23940
gcagtttgga ttttgggttt tcagattagg gatgctgaac cagtaagtat aatgcaaaca 24000
ttccaaaata tttttgaaaa tcccaaatcc aaaacacttc tgatcccaag tatttcaaat 24060
aagggatact caacctgtaa tatatttctt catttcttta tttattttat tattatttta 24120
agatggctca tggcccactg cagcctcaaa ctcctaggct caagtgatct tccgacctca 24180
acctcccagg tagctcaggt agctgggact gcaggcatgc atcaccatgc ctggctaatt 24240
ttttaaaaaa ttttttgtgg aggcagagtc tcaccttgct gcccaggcca gtctcaaact 24300
cctggcttca agcagtactc ctgcctcagc ctcccaaagt attaggatta caggtgtgac 24360
cactatgcct ggcccatatt tcttcattta gttttttctt tgcctgctgt gtttttaatg 24420
ttctttcttg ttcaaacaaa aagttggcta ttccttgctg ttagttaaat ttgccaatct 24480
atgaaactga aaaatgcagg agtcccagcc tggtgttaaa tacaaagaaa tcccaggtaa 24540
atggcatgca cccagttcct gcttgcccaa gtccttggtg aggcttctgt ggggtctcag 24600
tgttctgctc ctcactcagt gaccccttgt tcttcaggag gacctggatt tggatcacag 24660
ttctttacca cgtcccatga gcagccgaag tttccctcga agcctggatg actctgagga 24720
ggatgacgat gaagatagcg gacatagctc cagaaggagg ggaagcattt ctagtggcgt 24780
ttcttacgaa gagtttcaag tgtaagtata aaggaattgg cagaatttgc gttgacaaga 24840
gtccacatga gaccaggcag ttccctcatc tctctgaatt cactcctttc cattactaat 24900
catccagctt ttaaaaataa cttatactgg ccagacgcag tggctcatgc ctgtaatccc 24960
accactttgg gaggccaaag caggcaggtc atgaggtcag aagttcgaga cgagcctggc 25020
caacatagtg aaaccccatc tctattaaaa atacaaaaaa ttagctgggc atggtggtgg 25080
gcacctgtaa tcctagctac ttgggaggct gaggcaagag aattgcttga acccgggagg 25140
cggaggttac agagagccga gatggctcca ctgcacacca gcctgggcga cagtgcaaga 25200
ctctgtctca aaaaaaaaaa aacttgtcaa ttggtgtttt gtttcttaca taatatgttt 25260
actataaaaa ttagcaaata agagcaaaag aaaacattaa catttcacat atttctacca 25320
atgaaaaatg tttattaata tatcagtgtt tgtgtctcta tttgcatgtg tttatcaatg 25380
tttctatata tttttatggc ctaacatatg gttcgtcctg aagaatgttc cttgtgcatt 25440
tgagaagaat gaatattctg ctgttcaagt gttctgtaga tgtttgttag gtctagtttg 25500
tttacagttt tattcaggtc tcccatttcc tggttgatct tagatgtgcc tagatgtggt 25560
attcacgttt gaaagtgggg tattaaagtc tccaagtatt attagttgga gttcatccct 25620
tcaattctgt aaggttttgc tttgtgtatt ttggaactct gttgttgggt gcatacatat 25680
ttataactag tatattttcc taatatattg accctatttt ctctctcaac ttaatgaggc 25740
taaagaaaaa aaagaattga ccctgttttc attacaagat gttatccact ttatctctag 25800
taaaattctt tgttttaagt attttttgtt tgatattact gtaaccactc cagctttctt 25860
ttggttgctg tttgcatgat aaatcttttt ccatcctttt actttaaact tatttatatc 25920
tttcagtctg aagtatgtct ctcctgtaga cagcatataa ttggatctta tctttttatc 25980
cagtttgaca atttctgttt ttgattagat tgcttaatcc attcatttaa tgttatcatt 26040
gatgtagttg atttctgtct gctattttat tttttgtttt ctagcttact tttttttgtt 26100
cctctttcac tgctttcttg tacattaagt gaatattttc aagtataaca tttaaatttt 26160
tttaatgatt tttcattttt tttagtcagg agttgctcta agacttagtt tatacaatta 26220
agttatgaaa aattacttca gatatatatt aactgaatcc agtgagatat agaaatcatt 26280
tctatttagc ttttttcctc ttccctcttt ttgtgctata tattcatcta tctatatgta 26340
tatatagtca tctacatatg ttgcaaatca cattgttaga acaatgttac atttttataa 26400
cacactgtgt aatatatagt atataatttt atatctctta atgaagctga gagaagagga 26460
agtatatatt tataaatgtg tatattaacc tactttttta ccatttctaa ttctcttctt 26520
ttgctcctct ggattcaagt tatcatctgt cgtcattctc tttctccgat acagctttgc 26580
tactgcctac ctcctattat tgtcaaatat attacatttc tattatagac cttcagatcc 26640
aattatgtac atatttttac acaactgctt tttaaatcag ttaaggaaca aaaggagaaa 26700
tgtacatata tactatattt tatacctaca cagttatctt taccagtgtt ctttgccttt 26760
tcatgtggat tctgattact atctggagtc acttgctttc agcataaaga atttccttta 26820
gtattttttg taaagcaggt ttgctagcaa tgaattcttt cattttttgt ttatctgaga 26880
atgtttttct ttctccttca tttcctctgg cttgtattgt ttctgatgag aagacaggtg 26940
ctaattttac tgtggtcccc ttgtacatga tgactcaatt ttctctcacc actttcaaga 27000
tttttttgct tttgtctttc attattttta ctgtgatatg tctgggtata aatctctgag 27060
ttcatcctac ttagaaagtg ttttttctgc ttctttcact ttctcttctc ctttgggacc 27120
cgcattatgc atatgcttag gggtatcaca tatttctctt aggctctgtt cgtcgtcatt 27180
ttttttccct ctctgttcct cagagtgcat agtctgtatt gatgtatctt caagttcact 27240
gacttgttct tctgtcagct tgcttaaatc tctgttgagc tcctctagtt atttatttat 27300
ttatttattt attttatata tatatatata tatatatata tagagagaga gagagagaga 27360
gagagagaaa gagagagaga gagagacagg gagacagggt ctcactccat cacccaggct 27420
ggagtacagt ggtgtaatca tggctctcta cagcctgaac acctgggctc aaatgatcct 27480
cctgcctcaa cctcccaagt agctaggact atgggcacat gctgccatgc ctggctaatt 27540
tttaaaaaaa aatttgtaga gatggcatct tgttatgttg cccaggttgg tctcaaactc 27600
ccggcctcaa gtgatccttc cgcctcggcc tcccaaagtg ctggggtcac aggtatgagc 27660
caccgcactt agcctgaatt ttttatttat tatacttttc aactccagaa tttctatttg 27720
gttcttttta gcaatctctg tctctttatt ctgtatttga tgatatcctg tatttgatga 27780
gacaatgtca tcataacttc cttttttttt taagagatag ggtctctctc tgtcacccag 27840
gctagagtgc agtggcatga tcctagctca ctgcagcctc gaactcctga actcaagcaa 27900
tcctcccacc tcagcctcct aagtacctga cactacaggc atgagccact gtacccagct 27960
aatttttatt ttttgtagag atggggtcta agttgcccag gctggtctca aactcctggg 28020
ctcaagtgat cctccctgct caggctccca aagtgctggg attacaggca tgaaccactg 28080
gacccagcct cctttatttc tttaaccatg gtggggtttt ttattatttg tttgtttgtt 28140
ttaacctgtt tgaatatatt tataataggt accttcaggt ctttgtctgc taagtctgac 28200
atctgggccc tctcaaagac agtttcagtt gtcttttttt ttttcttctt gtgtatggga 28260
acattttcct gtttttttgt tttgtttttt gttgttttgt tttgttgttg ttgttgttgt 28320
taaagattgg acatgttaga taatatattg taggaactct ggctagtgat tccctttcct 28380
ccccaggact tgtttttatt tctctttgct tgtttacttt ttcatacagt ctgtttcccc 28440
acagtgtctg cctctgactt tattccttag agggcgcagc tgtggccatg tacgtagtca 28500
ctctgggaag acagtggttt tagcagcgtg ctcattaact ttctctgacc tctttgttat 28560
acctcctgcc tctgtggata ttagacccag ttattacatt tcattgttta ctgattggtc 28620
tattgttttc cagaatgcct tgggatgtaa tttgctccac agtctgatcc acttaaattc 28680
aggcctcttt gcagggctag ttttagaggc cagtcttttt tttttttttt tttttttttt 28740
gagacagagt ctcactctgt tgcccaggcc ggaatgtagt ggtgcagtct cagctcactg 28800
cagcctcaat ctctcaggct caagcaatct tcccacctca gcttctcaag tagctaggac 28860
tacaggtgca cgccaccatg cctggttaat ttttgcattt tttatagaga tggggtttta 28920
ccatgttgcc ccggctggtc tcaaactcct gagttcaagc aatccaccca cctcagcctc 28980
acaaaaggcc gggattacag atatgcacca ccacgcctgg cccctgaggc cagtctttaa 29040
ctgtcttctt agctgtctct ttccctggtt ctctctggtg aactagctgg taatttgttt 29100
atctcataag gctaccagat tccttgtaaa tgcttatccc cacaatctcc attgttttca 29160
agagcatcgt tagtctttaa tttcctcacg cttcattcca aataaagtcc attcacttga 29220
gaagagttct atattcctat gacctgtgtc tccccatgag caaaactgct actgctttac 29280
agagccaggg acagtggccc acctctctgt ggcatcctgc tttatgaaca agtcactggg 29340
ctcagatggc agtctctgat tttctcacct tgcttcttct ggcatggaaa ctccacccta 29400
caagtgggaa ctgagtggaa gaagagagcc ccattcccct tagccactct taacaggatt 29460
agaacctctg caacatgcat ttaagaatgg gaacaggctg ggcacagtgg ctcacgcctg 29520
taatcctagc actttgggag gtcaaggcag gaggattgct tgagccagga gttcaggacc 29580
agcctgtgca acatggtgag accctcatct ctacaagaaa tagaaaaatt aactggtggg 29640
ttgtgtatac ctgtaatccc agctactcgg gagcctgaag tgggaggatt gcttgaacct 29700
ggaggcagag gttgcagtga gtcaagatta caccattgca cgccagcctg ggcaacagag 29760
tgagactctg tctcaaaaaa aaaaaaaaaa aaagagtagg aacattgagg ctgggcatgg 29820
tggctcatgc ctgtaatcct agcactatgg gaggccaagg caggagtatc acttgacgct 29880
aggagttcaa gaccaacctg ggtaacatag cgagactttg tctctattaa aaaaaaaaaa 29940
aaaaaaggtg taaaaaactt ttgtaacaag agtgggaaag ccgggcacag tggctcacac 30000
ctgtaatccc agcactttgg aaggccaagg caggcaggcg gatcacctga ggtcaggagt 30060
ttgagaccag cctggccaac gtggtgaaac cccatctcta ctaaaaaata gaaaaattat 30120
ctgggcatgg tggtgcacac ctgtagtccc agctactcgg gaggctgagg caggagaatc 30180
acttgaacct acgaggcaga agttgcagta agccaagatc acgccactgc actccagcct 30240
gggcgacaga gcaagactct gtctcaaaaa aaaaaaaaga gtggaaatgt taggatgaga 30300
aatgctggca gcctgcccct ccctgggaga tactgtagcc ctagactgga agttggggga 30360
ggagggagcc ctgtgctctt agctgcaccc atgtgaagtt gtgcttctat cacatgagct 30420
ggggacagga gagaaggctc agattatggc ttcagtgcca cagaatctct tcatactaaa 30480
atttagtaga ttttcttgaa taaatgcttt ttcatttgct gtacaccctt aaaagtttct 30540
agaaattttt aatatttgag ttttaaaaaa taattttcaa cagttacagt tatttcacta 30600
aagagagagt ctacagaacc ctcttgccac cattgcagag gttgtctttg gcttacgagt 30660
ttttaaagta tttgtataca ttttttaagt tcaaaataat agaattgtaa gtgaacatgc 30720
tgttttcata ctgtttttca agctttattt aatatattgt aaatctaatt ctattttatt 30780
aaatagtctg ccacagtata atgtctgatg tctccttaga attttattgt atggatgaac 30840
aatgattatt taatttccta ccaattgttg ggtgtttttt gtttgtttgt ttgtttttga 30900
gactgggtct cactctgtca cccaggctgg agtgcaggag tgcggtggaa tgatcacggc 30960
tcactgcagc ctcaacatcc caaggctcag gtgatccttc cacctcagcc tcgcaagtag 31020
ctgggagtac aggcacatgc caccatgccc acctattttt tagagatgaa gttttgccat 31080
cctgcccagg ctggctcgaa ctcctggcct caagcgatct gcacacttcc gcctcccaaa 31140
atgccaggat tacaggcgtg agccatcatg ccctaccccc ccatcaattg tttgatgtag 31200
ccatttttca atgatccgcg attaagaagc agcactcttt tatagccaaa aattacacat 31260
atataaaatt ttcctttaga aaatgttcta aaaatggaat gtctaactaa agggttaggc 31320
atacattctt aagacttctg atacgcgctg acttgcagga aagttgtttc agttaacact 31380
cctaccagcg gcatccgaga gttaatctgt aaagcttgag acaacttaga aagtgtttca 31440
aatgattgtg ttgcttaaga aaaaaatctt agcacttcct tttgaaaagc cagtggggct 31500
gaaaagacaa tgacaagcac tttgtccctc tgtactgtgt tttccttgca gcctggtgag 31560
acgagtggac cggatggagc attccatcgg cagcatagtg tccaagattg acgccgtgat 31620
cgtgaagcta gagattatgg agcgagccaa actgaagagg agggaggtgc tgggaaggct 31680
gttggatggg gtggccgagg tcagtagtca tgagctgaaa acaccgctgc tgagcatggt 31740
gttattaatg aaaatatatg ttgctgacag ttgtatttga agtattgaag aagagtaaaa 31800
aaaatttacg tttatagaaa ttcacaatga tgtttccatt tactctcatt ttcagatttt 31860
tttctctgaa acagaaacac tctttctata aaatctcttg ctataaaaca tcaatgtagt 31920
catattgtct aacccttagg ctgagatgtt tatctttctc cataactaca gataaaatta 31980
taatctggag gtgttacttt cttaatactc catatgctaa tggtcctgcc ttcactgcag 32040
ggtagaatta agtgaaaaat tactccagca actctgagat ttgctattat atgctgtaaa 32100
tctccagcct taccaaacta cagattattt ggtccctgga cttcctaagg catttccttc 32160
tactgccccc aacaccagtt tctttttccc tttttaggat gaaaggctgg gtcgtgacag 32220
tgaaatccat agggaacaga tggaacggct agtacgtgaa gagttggaac gctgggaatc 32280
cgatgatgca gcttcccaga tcagtcatgg tttaggcacg ccagtgggac taaatggtca 32340
acctcgcccc agaagctccc gcccatcttc ctcccaatct acagaaggca tggaaggtgc 32400
aggtggaaat gggagttcta atgtccacgt atgatatgtg tgtttcagta tgtgtgtttc 32460
taataagtga ggaagtggct gtcctgaatt gctgtaacaa gcacactatt tatatgccct 32520
gaccaccata ggatgctagt ctttgtgacc gattgctaat cttctgcact ttaatttatt 32580
ttatataaac tttaccca 32598
<210> 242
<211> 23828
<212> DNA
<213> Homo sapiens
<400> 242
atactttccc caactttgag catctggcat attggcagat acagttcaac aatatagctg 60
ctgtcacagt attttttgtc tggattaagg taatttataa atttcatgtt ctacatttta 120
aataatattt tctttaaaaa aaatgagttc cacaaaatca tggaatactt gaatttgaaa 180
ttcaagtgac cagccaaagc tgctcaatat ttactttgag acagggtctc actctgtcac 240
ccaggctgga gtgcagtggt atgattacag ctcattgcag cctcgacttc ccaggcccaa 300
gcgatcctcc caccttatcc tccgaagtca ctgggactac aggcatgtgc caccataccc 360
ggctaatttt taaatttttt cgtagagaca aggtctcatt atgttgccca ggctggtttt 420
gaactcctgg gttcaagcaa tcctcccacc tcagcctccc aaagtgctgg gattacaggc 480
atgagccacc gtgccaggcc tcatatttta catataaagt aaactattga gactcatgtg 540
atcattcctc tcactgtcaa tgacatactt ctgctatctg aattagtgca agatcagtcc 600
ctataggttt tgtttaacaa atgcagtaag aggcctttca gtgtgttagc tgggcctggg 660
gccccaggct gctaacagat gagatgaaca ggtgaaggaa aaggaactta gagaaagaga 720
gggaaggagc aggtggaggg aaggggagag ttgctgcact tggaaatgct tgctagaagg 780
gatcgcctct tttccaggta gaggctgtaa gggaagcttt acctagaatt aaggttggaa 840
cagacactgc ttccaaatag ttccttgctc actattttcc ttattgtccc aagatataat 900
gtgcatttcc atgtgtgtga aaggttatga catttcatat acaacaagcc tcaattctgg 960
agatgcagga aatttcaata attctcaggc agcagctgcc attcggtcac cagcacaggc 1020
tctgattgtg ctgtccagac agtaagtact agccacatgt gcctatttaa attcaaattt 1080
aaattagtta agcttaaata caattaaaaa cgcagttcct tggtcctact ggccacacat 1140
taagtgttca atggctactg tctaggacag tggaaatgta gaacatttcc atcatcacag 1200
aacgttctct tgaaaagcac tgttctggaa ggtacttacc cgttatgtac ttttctgagt 1260
tggtattcat acctagaaga cctgaggttt atcacaagac atagacttgg accaggcgca 1320
gtggctcatg cctgtaattc cagcattttg ggaggccgag ataggtcccc tgagcccagg 1380
agtctgatac cagcctgggc aacatggcaa aacctcatct ctactaaaaa tacaaaaatt 1440
agctgggggt ggtggcacgt gcctgtagtc ctagctactt aggaggctta ggcgggagga 1500
ttgcttgaat ccagaaggcg gagggtgcag tgagccaaga tcgcaccgct gcactccagc 1560
ctgggcaaca gagtgagacc ctgtctcaaa aaaaaaaaaa aaatgcatag actttatcct 1620
gtatttctca tgctatttat ttattgacat gcttgttcaa gagaaaccat cactaaagca 1680
caaaaccttg atcataacat agtaataata atcaaacagc aaaaataata atagtaataa 1740
gaatgttctg tggtgatgga aatgttctat attttcattg tcctagacag tagccactaa 1800
ccatgtatag gcatggaaca cttaacatgt ggctagtagg accaagggac tgaattttta 1860
attgtattta atcttactta atttaaattt gaatttagat atccacacat gtttggatag 1920
cacagtcaga gcctgtgctg gtgaaaggat ggcaggtgct gcctgagaat tactgaagtt 1980
tccttgatta ttattagttt aataataata atcaagatag taataataat caagatagta 2040
ataataatca agatctcagc tgggcacagt ggctcacgca ctttgggagg ctgaggcggg 2100
cagatcacct gacgtcgggt ttgagaccag cctggccaac atggtgaaac cctgtcccta 2160
ctaaaaatac aaaaaaaaaa aattagctgg gtgtggtggc acgtgcctat gatcccagct 2220
acttgggaat ctgaggcagg agaattgctt gaacccagga agcagaggtt gcggtgagct 2280
gaatcatgcc actgcactcc agcctgggca acagagcagc acttcgtctc aaaaaaaaaa 2340
aaaaaagatc tcaaatgaat tgggattgta ttaagtaatg attaagtaat gtgattacag 2400
caatcctcaa gaaatatttc actgtggcca gtaacaatgt gtaacagacc tttaaacttc 2460
tagagatttt cctacaacat gtgtctcagg ctgatgtgtt ttatttagtg cttctcttgg 2520
aaatgtcttg cccctcgata ctttatcatt aaggtcttta aggcagggat catgactcta 2580
cttttttttt tttttttttt tttgggacgg agtcttgctc tgtcgcccag gctggagtgc 2640
agtggcacaa tcttagctca ctgcaacctc cgtctcctgg gttcacgcca ttctcctgcc 2700
tcagcctccc gagtagctgg gactacaggc ggctgccacc acgcccggct aattttttat 2760
atttttagta gagacggggt ttcaccgtgt tagccaggat ggtctcgatc tcctgacctc 2820
gtgatccacc cacctcggcc tcccaaagtg ctgggattac aggcttgagc caccacgccc 2880
ggcctcatga ctctacttct aatatctcat catgtgctct tccactgagg cttctactta 2940
gagctacaca atctgggcag ccatcctcag tgccttatct accaacatgc tcaatatggc 3000
tttgcagggt tcactgtcta ccagcagggt tcactatcta ccaacatgct caatatttct 3060
ttgcagtcag gcagagcagg ctttgcagtt caggcagggc agctggctgc aggccccagc 3120
tgactcctgg ggatagaatg ccaatatttc agacattgca gagatttgag gcaatgtaca 3180
taaagccctc cacatataac tgatgcacaa taaatgacag ttaatattat gcaacaagaa 3240
tttcctgggg ggttttataa ttaattttta tttgtgtgaa gttttttccc tcccttttac 3300
tttaatcctt tttgggggga aagcatcact agtcacagtt cacggcagcc tcgacctccc 3360
aggctcaagc aaccctccca cctcagcctc ctgagtagct gaaaccacag gtgtgtgcca 3420
ccacacctga ctaatttatt tttattttct aatgaaacag aatcttgcca tattgcccag 3480
gctgatctta aactcatggg ctcaagcgat cctcctgcct cagtcttcca aagtgccggg 3540
attatagatg tgagccactg cactcagcct tttttttttt ttttttaatt gtagatagca 3600
taaaacctac tgttttaacc atgcttaagt gtacaattca gtggcattaa gtacattcac 3660
agtgttgtgc agccatcgcc attatgctgc attattttca gaactttttc attattctaa 3720
actgaaactt tgtatccatt gaacactaac tcccaattcc cccagtccct ggtaacctcc 3780
attctacttt ctgtcactgt gagtttgact attctaagta cctaatttaa gtggaatcat 3840
acagtatttg tccttttgtg tcaggcttat ttcactttgc atgatgtttt caaggttcat 3900
ccatgttgta acctgtcaga atttaatttc ttttcaggat gaaataatgt tttattatat 3960
acagtcacac cattttgttt atccattcat ctattgatgt cttctctctc ttacagctct 4020
tcaaattcat caattttaac aggaccatga gccagctctc gacaaccatg tctcgatgtg 4080
ccaaagacct gtttggcttt gctattatgt tcttcattat tttcctagcg tatgctcagt 4140
tggcatacct tgtctttggc actcaggtcg atgacttcag tactttccaa gagtgtatgt 4200
aagtatatat gaaattaaga agaaaaattt aatcagagtt gtcactgctt ctcaagaata 4260
aatcttcata tgaggttgct atatgaccac caattattta aaaccagtta ttttaagtaa 4320
gaattaatta ccttttccca aaacattgat ctacccatgc aaagaagaca atgcatcctg 4380
aaatgctgat gcttaagata gcagcccaaa gtagtaaaat acagttaaca gacataggaa 4440
accaacactg ttctgaagac tgagtttttc tttgcaccaa atgcagatgg tagcttctag 4500
aaggctgttt gcctatattc ttactcctgt tgaatattgt tgccatatat ttagaacttc 4560
aagttatttt ctaaggaaaa aaacaagata tttctaatat tctaaggtaa actcagacca 4620
gtacaagaat tttcagtttt tttttccaaa gatcccaaat gtgaaataaa acaacaaaaa 4680
gcagccagtg tcagatttct atgccattta gaaaggagtt agtttaaaaa ggaatggaag 4740
taatagggtt ttgtgcatag atatctcgaa ttaatattgc tgttgataaa agtgattttg 4800
ctaagaccca gcactgacaa cacttggcca ctttgatccc attttaagta cttgtcagaa 4860
tattggatct ttgaactcaa accattttgg gtttttgggg tttttttgtt ttgttttttt 4920
ttgttttgtt ttgtttttga ggcacggtct tgctctgttg cccaggctgg agtgcagtgg 4980
tgcaatcata gctcactgca gccttgaact cctaggctca agcaatcctg ctgcctcagc 5040
ctgctgagta gctgggacta caagtgtatg ccaccatgcc tggccaattt ttaacttttt 5100
ttatgagaag ggatctcact gtgtagccca gggtggtatt gaactccagg gcctcacact 5160
gtcctctcac ctcagcttcc aaaagtactg ggattacagg catgagccac cacaccaggc 5220
cctgttgttt tttttttaaa gaaattttta actttagacc gagggtgact gttgtcaagg 5280
tttagggtta agatgtttta cctagattat gtgttgaaat gttatagcca attgctttat 5340
aagttattga ataataattg tattttcttt tttttttttt ttttgagatg gagtctcgtt 5400
ccatcgccca agctagagtg cagcggtgta atctcagctc actgcaacct ctgcctcccg 5460
ggttcaagcg attctcctgc ctcagcctcc cgaatagctg agattatggg cgcacgccac 5520
caagcccagc taatttttgt atttttagta gagacggggt ttcactatat tggccaggct 5580
gttctcgaac tcctgacctc gtgatccgcc cgcctcggcc tcccaaagtg ctgggattac 5640
agacgtgatc caccgtgccc agcttgtgtt ttctttttaa ccaaatggaa ataacctctg 5700
tagcatgaaa gcattttatt attattgcag aaggctttaa ttgctgatac aagtagcaag 5760
actttgtaaa tgggattgac aattttctgt tattcggcag ctacctatac tgctaaaagg 5820
tccaaaaata atgaaatcat ctttaagaaa tgttgcatca actagtggac attctttgtt 5880
tttgtattgt ggtgttttgt tttattttta tagcttcact caattccgta tcattttggg 5940
cgatatcaac tttgcagaga ttgaggaagc taatcgagtt ttgggaccaa tttatttcac 6000
tacatttgtg ttctttatgt tcttcattct tttggtatgt acatttttat ttatagtgag 6060
gttcaattta aacttcgtaa atccttgtct tctcttttct ctcacacttt atgtcctatc 6120
aattttaaat aaagacccag gaagtagaaa aaagtgtgga tgttggaaaa cttattttcc 6180
ttttattaat tcacagtttt gagactcata tcaaatgtct tttctgtggt ctttcattga 6240
tccatgtata tgtgtctatt caatgcaaaa aaaattagat ctcttccatg gtctttcatt 6300
tctctctcta tatatgtatc tattccatgc aaaaaagaaa ttagatcaag tacaaattta 6360
taaagatacc taaaatagtg ctttgcctaa aaagtagaat atgcttacat gctttttaaa 6420
ctcatatgtc agcactttcg tagtcacttg ctagcatgac ttttctctct ttcttctttt 6480
ctttttaaaa aataagaacg gaaaagcaag ctagatctaa gatgtcgagt aatagttgag 6540
tgaatcattg catgtcaaaa ttaggatatt ctgttttaaa ttatttatat cccattcatc 6600
tagagactgc ctacagagaa tattcaaata attaagttta aaactaaatg taacaatgaa 6660
tggaaattgc attaaaatta ttttcaaaaa taattttttt attctcttga tttggtacaa 6720
atgaacattt ttaatgtttt tgccctaagt caattaagtt tttttaaggt gttttgttct 6780
ttttcttaac atttatatat tcaattgtct actgagaagg tgttaagcca gcttaattta 6840
ggcaatattt ttcatctaaa cactaacagt catcttaaga acaattttct taagaaaata 6900
acattttttc catttcagta aattgtgtaa agatcccttg aggaaggtta agtgatcaca 6960
ttttcagtaa ttcagtgtaa taactctaaa gtcagtccag gtattactgg ttaagtatat 7020
ggtatttatt gattgggtat tagatgtact gtattaattt cctgtttaaa aaaaattttt 7080
tttccgggga gacacagcct ctggtgtaaa acaaaggtgt gttccctagc tgtactttaa 7140
caggactgaa aaggtcagga atatcattca agttcatatg tatcttgctg tatgcatggt 7200
ttatggctca tttttaaact tacacctctt aagcttcttc ttcctatcat atattaaaac 7260
aatggagaga agaataagcc tctgttactc taccattgat agtacttcgg attctagagt 7320
acctgaatct ctactaagaa ggcaaaaacc aggaattgag agtcctgcac ctgacccttc 7380
agttgatctc aggccaccta gttttctccg tttatcaatc tgccaaacaa ggatggatag 7440
agtcgtggca actggaaagg ctcaaatgtg gaattgtttg aatgtggtcc tttagtaggc 7500
agccatctta ccagatctag agtattcagt catcttacca gatcagtcac cagaacatga 7560
aaagaagctc ttagtttcta tctttatact aaaattgttt ttttgtacga ctgcacaaaa 7620
aagaattgct ctccttgcac ctcccagaga tataggtgga tagatacata catacgtaca 7680
tacatacata catacataca tacatacata catagacaca tacatagata gaagtctact 7740
ttcaatacaa acctgtcttt taaggaaatg acaagctgag catagggttg gccacctttc 7800
tgagccgatt gcctggtatt agtttattgc ccctgtttag caagaaggca cagtgttaag 7860
aagtggctca gctgaaccag gataacccca ctcttccccc acatcaacag gaaagacatc 7920
ctggtgcaga tgtccatctg ataattcagg gaacctcggg agacaggatg gagaggaggg 7980
tgagctagct tcctcttccc acaccttcaa gagcctttct caagcacttt ctattttttg 8040
aaatctcttt agaggtccca gactttgatc tgtttcaatt aaggtattgg caggcattag 8100
ttaacagcca cttggaagca aaaatagaac attagatccc tgagttggaa gagagaaggt 8160
agaaggtgtt acttggactg caattatctg cacttggaat tgagcattta gtcaaaaact 8220
tatatgtatt ctatattcta ttctcatttc tgctacagaa ttgtaaacaa tattcttcct 8280
taatacagaa attcatagcc cactaaaata agagcgttct catttgttca tttctcaatc 8340
atttaataag tatttactaa gccactatat ccatatatat atatatatca tatatactgt 8400
ataatacaca ctgtagtgtt ttttgtggat tgtgtactat gaggtagtat gttagatact 8460
gccagtactg gggtaaggaa aacagcctga ttaggccctt acgaagattc ctcagacttg 8520
tggggaaaac agacattatc aaatagaaat acttgcaaac cacagttatg tgttaaaaag 8580
gaaaaacaaa gtaaaaaaaa agttggtggg ggggaacctg atctcctgga tacagtgctt 8640
cgagaaagtt tgttgttgga aatgcaaacc attactactg tggaagggaa aggtcagaaa 8700
aatgaactca ccattactga atagtaatag tagctatcaa ttaggtggca cttacctgca 8760
tcaggacctg tcctgagcac tttacataga ttgtctcact aaccagccca acaaatatgt 8820
aagggagata ctattatttt tcccatttta ttaatgtaaa acaattaaat aattctttaa 8880
aattagactt agaaaagtgg agcaacaatc ttagcagtgc taggactgaa atccaagttt 8940
gcttgactcc aaagtctatc tctcttccag aaactttttc tttactatct gcctagtagg 9000
cctgctgtat tcctatttgc aacagccttt taaactcttt aaaaatgtgt cctgtaaatt 9060
tcatatatga ttatacaaaa aaacttggaa taagcataca attctactta tctgtgttaa 9120
ctgttgaaat ttgaagagct ttttggaatt ctataccctt cagtagtgta tgtaaaagtt 9180
tctaaatata gagaacatag ataagcaaaa ataatattaa ataaaataat cgcaccatta 9240
gtaggtaaat atactaatat tttgttgtat tttattcttg tatgttttca caaagtatat 9300
cataaaattt ttcctgtggc atgacttaac ggagaaaata atcttcccaa aacatgtggc 9360
agcaaaactg ttaatttatt acatcaggct gggcacagtg gctcacgctt gcaatcccag 9420
cactttggga agccgaggcg ggcagatcac ttgaggccag gagttcgaga ccagcctggc 9480
caacgtggtg aaacactgtc tctactaaaa atacaacagt tagccaggtg tagtggcaca 9540
tgcctgtaat cccagctact caggaggctg agactcaaga attgcttgaa cccaggaggc 9600
agaggttgca gtaagctgag gtcgcgcccc tgcactccag cctgggcaac acagtgagac 9660
tctgtctcaa aaaaaaaaat ttttttttaa ataaataaat aataaattta tgtcttcata 9720
aagcactcag attaggaaaa aaaggataaa caaaaaggca tgtgtcattt ttttgattga 9780
taattccaaa ttatgtttct tcctttaatt tttgccctcc tttcatttac aaacagaata 9840
tgtttttggc tatcatcaat gatacttact ctgaagtgaa atctgacttg gcacagcaga 9900
aagctgaaat ggaactctca gatcttatca gaaaggtagg aaaaacctta attctcagaa 9960
ttcttctgtt tctgacataa aatgagcatt gtttcaccca gattttcaaa tcaacattga 10020
tccattgaaa ttgtttgaaa taaagaatac attgctatat ttcaggaata atttaaatgt 10080
tccctatctt ggagtcttga tggatatact gctatcttga attttaattc tgggaatcct 10140
tttatgccct ggaattaaat tctcaacaat cttttgacac tttaagagct gagctgaagg 10200
ttcatcacct tcattatttt gacatctcct gtagctggct ctcacttcag gatcctgagt 10260
tgagaataaa ctagaaggga agattatata aagggatttc cacctcttct gtctcaatta 10320
ccattttaaa aaaataaaaa gttttagagg aaaacactta gtagttcacc ctttaccctt 10380
gaccttccac ggcagtttta aaataagcaa aggaaaagat tcatgaattc aggccatagc 10440
ctggggcctg agaactttta cttatgcacc ttctcaggaa gggtttcatt gttaaataga 10500
agggcaggac aggaaagttg ggcctctttg ttcttctcaa tgtaacttct ttatttggtt 10560
taaagtataa aatgtataca acaacaaata accacattta aaatacacag tttgtttccc 10620
aacatcattt tgctaagtca tagtggctcc ttaactgtaa tttttttttt tattagtcca 10680
agccttagga ttatgttatc tgtgatatat gttataatag aaaacttaag cctcttaaaa 10740
caaagtcctt gggatgggac ctaagattca cattatcttg attccgcata acagttgctt 10800
acattttagc aaatctccag tgtgtatgca agcactcctc acttggcaca attctgatac 10860
acacaaactt tggttacccc agttttgtta tgtaacacca ccttcaacaa cacagttcaa 10920
atttcagtta tcatagtata ttaactctga gtaacagcac aaagtacaaa ctccactgct 10980
agctcttcag tgtatagatc agttacctga gtaacagatg tgcaggctga gcaggctcac 11040
tggtcagtca tgacactatt ttcagtctgt tactaattgg tcactgagca tctgctatcc 11100
aattcacaaa caaagaaagc atgtagtgtt gcttccttgt gttccagtaa taagcccatg 11160
tgacatttta caaaaatgga taattgaaaa agagaatggg tgcagtggct cacgcatgtt 11220
gggaggccaa ggcggatgga tcacctgagg tcaggagttc gaaaccagcc tggccaacat 11280
ggtgaaaccc catctctact aaaaatacaa aattagctga gtgtggcgac agatgcctgt 11340
aatcccagct actggggagg ctgaggcagg agaatcgctt gcacctagga ggcggaggtt 11400
gcagtgagcc gagatcgtgc cattgcactc cagcctgggt aacaagagcg aaactccgtc 11460
tcaaaaaaaa aaaagaaaag aaaagaaaag aaaaagagaa tgggctagca aagaaatgaa 11520
aaatggtaac actggaagtg aaaatcaaaa cagagtaatg gatttataga agaaatagct 11580
gagtgaagaa gaaataggag tgttgacact gcgatcattc aagagatcca gatatggagc 11640
cagaagaact tagggcaggt ctatcaactt aaatgaggaa aatagctgtg ataaaacaga 11700
tgaagatgtc ttgaggaaat gatgcctgca aaaaacttca cattaaggga agtcttatta 11760
gagatatttc acaataatga aagtacaaaa gaaaaaatgt tggggctgga catggtggct 11820
tactcctgta atcccagcac tttgagaggc caaggtgggt ggatcacttg aggccaggaa 11880
gtcgagacaa gcctgatcaa catgatgaaa ccccgtctct attaaaaata caaaaattag 11940
ccagacatga tggtgcacac ctgtaattcc agctactcaa gtggctgagg cacgagaatt 12000
gcttgaacca gggaggcgga ggttgcagta agctgagatt gcaccactgc aatccagcca 12060
ggtgacaggg taagactgtg tctcaaaaat aaataaaaga aaaatatgtt ggaagctcat 12120
ccacatttaa gaaggaatat gacaattcac taatgcatag aaaagaagtt cactccacat 12180
tgtaaagtgt acagtgtaat attatacaat gaaaacaagg caagtgctgt ttaaactact 12240
ctggatacat tttttacaaa gaaataaaac actttagttt ttaatgtttc taatgtttta 12300
cattttagtg tattaaatca atattagttt tcttcttttt taagctccct atacatttat 12360
aactgacact aagggagtgt ttaatgtttt gattaaaagt tgtaaagatc acagaacaat 12420
tgtaattctt cccactgatt attcagatca ttttgcacaa tttcagcttg catggtcact 12480
tacagtgccg cactatgtgc aaagcaaggt caggtctaaa gttcgctaat gaaaaatcct 12540
cggccagggg cagtggctca cccctgtaat cctagcactt tggaaggcga ggcaggcaga 12600
tcgcttgagc tcaggagttc aacaccagcc tgggcaacat ggtgagaccc tgtctctaca 12660
aaaaaaaaaa aatagcaagg cgtggtgact cacacctgta gtcccagcta cttgttgggg 12720
gctgagttgg gaaaatcact tgagctcagg aggtcgaggc tgcagtgagc cagaatcacg 12780
ccactgccct tctgcctggg tgacagagta agatcctgtc tcaaaaaaag ggaaaatcct 12840
catctacatt tcactgggtt ttttgtttgt ttgtttgttt gtttatacac acttaaggaa 12900
attactgtct agaagataga taatataaaa aataaaaatg caattcatga ttcgggtttc 12960
ttggtattcc taagaactgt tgcacagtac tttatgctct gaggcagaca gctatagcat 13020
atatagtaat ttttgtttct atcacataaa cttgaataca catatgagta aaagaccttt 13080
agttcttcat gacttactga aagaccctga ctttttccat gtaactgttc cacaagtgtt 13140
ttatggaaaa ctggatacat taattcttca ttcatccagc acgtacttgt tgaatggcca 13200
atgtacacca ggtttgtagt agttactact gtgaatggaa agtaaaacag atgcaaaagg 13260
agaatacact aaaccaagtc ttttattttt tctctctctg atagggctac cataaagctt 13320
tggtcaaact aaaactgaaa aaaaataccg tggatgacat ttcagagagt ctgcggcaag 13380
gaggaggcaa gttaaacttt gacgaacttc gacaagatct caaagggtga gaatcatgct 13440
tcctgaggtt ctgaaaaatt cctgcttcta aagataaatt cctggtgata agagtatttc 13500
tagcccaagg gctcatacag atactttttt tttttttttc cagaggcagg tatctttctg 13560
gaacatgtta taagaggaaa acttgccccc atttggtgat ttctcctttc ctcctgcatt 13620
ttgatgtctc tgtgttgagg gtgaactggg tacaaggaat gatttttatc tgtatcctct 13680
ctctaatttc aggaagggcc atactgatgc agagattgag gcaatattca caaagtacga 13740
ccaagatgga gaccaagaac tgaccgaaca tgaacatcag cagatgagag acgacttgga 13800
gaaagagagg gtgggtctgg tttaggagaa ccggatttga tttggtacct acaacaccac 13860
agatgtatca aacactatag aagtagtggg ttattgagtc tcttgcccat tccccaccac 13920
actctctctc tctctcagtc ggtttatgtg ttagtaccct gtttattcca gaaagaatat 13980
ataacacaat tatgtataaa aatgggtggt tagcatgata taaaaacgtc aaaatgaaaa 14040
gcaagcaaaa caaaagtaaa aataatggat tattaatgaa gcttaaaaat gcattcataa 14100
aaacacatat gcttattaag attgggctac aaattgggcc ctaagcttgc tggtaatcag 14160
cttgaaaaga gaagcctgat tagctgcaga gtccacaatg tccgtgagag tgaagaaaac 14220
aaaaaatgac ttaccaagag atgtgaaatt attctggtta gttagtggct atttaaattg 14280
ttaacttttt tttctttttt tttttttttt gagatggagt cttgctctgc ctcccaggct 14340
ggagtgcagt ggcacaatcg cgactcactg caacctccac ctcccgggtt caagcgattc 14400
tcttgcctca gcctcccaag tagctaggac tacaggcaca tgccatcatg cccggctaat 14460
ttttgtattt gtagtagata tggggtttca ccatgttggt ctcaaactcc tgactgcaag 14520
caatctgccc accttggcct cccaaagtgg tgggattaca ggcagtagcc accgtgcctt 14580
tcctaaatta ttaacattta taataaaatt aacagccgcc ttccatttga atacttttta 14640
caaaatagtt aaaaataaac ataagtgggc ttttatagtc agaaaaaaaa attcaaagct 14700
ttaccattaa ctttcaaaaa taaatggtta gacagcaaca acaaaaatct gtggtaactg 14760
aggtacagag aacacagatg aatgttatta caaaagccac tttcctatga gaagtctagg 14820
acagtggttt ctaaatgcca ctccacagac agtgctagta ggtgacagac ttctccagtc 14880
acagtgaaat ttaagcataa agaaaatgag gaaaattttt acaaggctct atttagacaa 14940
agttcttatt ctgacattac atctttccta ctttggagct gttgaatgta ttatctttta 15000
tgaaaagaag gcgatccagg ttgagcatcc ctaacccaaa tatgtgagtc tgaaatgctc 15060
caaaacctaa aacttcttga gcacaaacat gatagtcaaa ggtcatgctt aaaggaaatg 15120
ctgtcattgg agcagtttgg attttgggtt ttcagattag ggatgctgaa ccagtaagta 15180
taatgcaaac attccaaaat atttttgaaa atcccaaatc caaaacactt ctgatcccaa 15240
gtatttcaaa taagggatac tcaacctgta atatatttct tcatttcttt atttatttta 15300
ttattatttt aagatggctc atggcccact gcagcctcaa actcctaggc tcaagtgatc 15360
ttccgacctc aacctcccag gtagctcagg tagctgggac tgcaggcatg catcaccatg 15420
cctggctaat tttttaaaaa attttttgtg gaggcagagt ctcaccttgc tgcccaggcc 15480
agtctcaaac tcctggcttc aagcagtact cctgcctcag cctcccaaag tattaggatt 15540
acaggtgtga ccactatgcc tggcccatat ttcttcattt agttttttct ttgcctgctg 15600
tgtttttaat gttctttctt gttcaaacaa aaagttggct attccttgct gttagttaaa 15660
tttgccaatc tatgaaactg aaaaatgcag gagtcccagc ctggtgttaa atacaaagaa 15720
atcccaggta aatggcatgc acccagttcc tgcttgccca agtccttggt gaggcttctg 15780
tggggtctca gtgttctgct cctcactcag tgaccccttg ttcttcagga ggacctggat 15840
ttggatcaca gttctttacc acgtcccatg agcagccgaa gtttccctcg aagcctggat 15900
gactctgagg aggatgacga tgaagatagc ggacatagct ccagaaggag gggaagcatt 15960
tctagtggcg tttcttacga agagtttcaa gtgtaagtat aaaggaattg gcagaatttg 16020
cgttgacaag agtccacatg agaccaggca gttccctcat ctctctgaat tcactccttt 16080
ccattactaa tcatccagct tttaaaaata acttatactg gccagacgca gtggctcatg 16140
cctgtaatcc caccactttg ggaggccaaa gcaggcaggt catgaggtca gaagttcgag 16200
acgagcctgg ccaacatagt gaaaccccat ctctattaaa aatacaaaaa attagctggg 16260
catggtggtg ggcacctgta atcctagcta cttgggaggc tgaggcaaga gaattgcttg 16320
aacccgggag gcggaggtta cagagagccg agatggctcc actgcacacc agcctgggcg 16380
acagtgcaag actctgtctc aaaaaaaaaa aaacttgtca attggtgttt tgtttcttac 16440
ataatatgtt tactataaaa attagcaaat aagagcaaaa gaaaacatta acatttcaca 16500
tatttctacc aatgaaaaat gtttattaat atatcagtgt ttgtgtctct atttgcatgt 16560
gtttatcaat gtttctatat atttttatgg cctaacatat ggttcgtcct gaagaatgtt 16620
ccttgtgcat ttgagaagaa tgaatattct gctgttcaag tgttctgtag atgtttgtta 16680
ggtctagttt gtttacagtt ttattcaggt ctcccatttc ctggttgatc ttagatgtgc 16740
ctagatgtgg tattcacgtt tgaaagtggg gtattaaagt ctccaagtat tattagttgg 16800
agttcatccc ttcaattctg taaggttttg ctttgtgtat tttggaactc tgttgttggg 16860
tgcatacata tttataacta gtatattttc ctaatatatt gaccctattt tctctctcaa 16920
cttaatgagg ctaaagaaaa aaaagaattg accctgtttt cattacaaga tgttatccac 16980
tttatctcta gtaaaattct ttgttttaag tattttttgt ttgatattac tgtaaccact 17040
ccagctttct tttggttgct gtttgcatga taaatctttt tccatccttt tactttaaac 17100
ttatttatat ctttcagtct gaagtatgtc tctcctgtag acagcatata attggatctt 17160
atctttttat ccagtttgac aatttctgtt tttgattaga ttgcttaatc cattcattta 17220
atgttatcat tgatgtagtt gatttctgtc tgctatttta ttttttgttt tctagcttac 17280
ttttttttgt tcctctttca ctgctttctt gtacattaag tgaatatttt caagtataac 17340
atttaaattt ttttaatgat ttttcatttt ttttagtcag gagttgctct aagacttagt 17400
ttatacaatt aagttatgaa aaattacttc agatatatat taactgaatc cagtgagata 17460
tagaaatcat ttctatttag cttttttcct cttccctctt tttgtgctat atattcatct 17520
atctatatgt atatatagtc atctacatat gttgcaaatc acattgttag aacaatgtta 17580
catttttata acacactgtg taatatatag tatataattt tatatctctt aatgaagctg 17640
agagaagagg aagtatatat ttataaatgt gtatattaac ctactttttt accatttcta 17700
attctcttct tttgctcctc tggattcaag ttatcatctg tcgtcattct ctttctccga 17760
tacagctttg ctactgccta cctcctatta ttgtcaaata tattacattt ctattataga 17820
ccttcagatc caattatgta catattttta cacaactgct ttttaaatca gttaaggaac 17880
aaaaggagaa atgtacatat atactatatt ttatacctac acagttatct ttaccagtgt 17940
tctttgcctt ttcatgtgga ttctgattac tatctggagt cacttgcttt cagcataaag 18000
aatttccttt agtatttttt gtaaagcagg tttgctagca atgaattctt tcattttttg 18060
tttatctgag aatgtttttc tttctccttc atttcctctg gcttgtattg tttctgatga 18120
gaagacaggt gctaatttta ctgtggtccc cttgtacatg atgactcaat tttctctcac 18180
cactttcaag atttttttgc ttttgtcttt cattattttt actgtgatat gtctgggtat 18240
aaatctctga gttcatccta cttagaaagt gttttttctg cttctttcac tttctcttct 18300
cctttgggac ccgcattatg catatgctta ggggtatcac atatttctct taggctctgt 18360
tcgtcgtcat tttttttccc tctctgttcc tcagagtgca tagtctgtat tgatgtatct 18420
tcaagttcac tgacttgttc ttctgtcagc ttgcttaaat ctctgttgag ctcctctagt 18480
tatttattta tttatttatt tattttatat atatatatat atatatatat atagagagag 18540
agagagagag agagagagaa agagagagag agagagacag ggagacaggg tctcactcca 18600
tcacccaggc tggagtacag tggtgtaatc atggctctct acagcctgaa cacctgggct 18660
caaatgatcc tcctgcctca acctcccaag tagctaggac tatgggcaca tgctgccatg 18720
cctggctaat ttttaaaaaa aaatttgtag agatggcatc ttgttatgtt gcccaggttg 18780
gtctcaaact cccggcctca agtgatcctt ccgcctcggc ctcccaaagt gctggggtca 18840
caggtatgag ccaccgcact tagcctgaat tttttattta ttatactttt caactccaga 18900
atttctattt ggttcttttt agcaatctct gtctctttat tctgtatttg atgatatcct 18960
gtatttgatg agacaatgtc atcataactt cctttttttt ttaagagata gggtctctct 19020
ctgtcaccca ggctagagtg cagtggcatg atcctagctc actgcagcct cgaactcctg 19080
aactcaagca atcctcccac ctcagcctcc taagtacctg acactacagg catgagccac 19140
tgtacccagc taatttttat tttttgtaga gatggggtct aagttgccca ggctggtctc 19200
aaactcctgg gctcaagtga tcctccctgc tcaggctccc aaagtgctgg gattacaggc 19260
atgaaccact ggacccagcc tcctttattt ctttaaccat ggtggggttt tttattattt 19320
gtttgtttgt tttaacctgt ttgaatatat ttataatagg taccttcagg tctttgtctg 19380
ctaagtctga catctgggcc ctctcaaaga cagtttcagt tgtctttttt tttttcttct 19440
tgtgtatggg aacattttcc tgtttttttg ttttgttttt tgttgttttg ttttgttgtt 19500
gttgttgttg ttaaagattg gacatgttag ataatatatt gtaggaactc tggctagtga 19560
ttccctttcc tccccaggac ttgtttttat ttctctttgc ttgtttactt tttcatacag 19620
tctgtttccc cacagtgtct gcctctgact ttattcctta gagggcgcag ctgtggccat 19680
gtacgtagtc actctgggaa gacagtggtt ttagcagcgt gctcattaac tttctctgac 19740
ctctttgtta tacctcctgc ctctgtggat attagaccca gttattacat ttcattgttt 19800
actgattggt ctattgtttt ccagaatgcc ttgggatgta atttgctcca cagtctgatc 19860
cacttaaatt caggcctctt tgcagggcta gttttagagg ccagtctttt tttttttttt 19920
tttttttttt tgagacagag tctcactctg ttgcccaggc cggaatgtag tggtgcagtc 19980
tcagctcact gcagcctcaa tctctcaggc tcaagcaatc ttcccacctc agcttctcaa 20040
gtagctagga ctacaggtgc acgccaccat gcctggttaa tttttgcatt ttttatagag 20100
atggggtttt accatgttgc cccggctggt ctcaaactcc tgagttcaag caatccaccc 20160
acctcagcct cacaaaaggc cgggattaca gatatgcacc accacgcctg gcccctgagg 20220
ccagtcttta actgtcttct tagctgtctc tttccctggt tctctctggt gaactagctg 20280
gtaatttgtt tatctcataa ggctaccaga ttccttgtaa atgcttatcc ccacaatctc 20340
cattgttttc aagagcatcg ttagtcttta atttcctcac gcttcattcc aaataaagtc 20400
cattcacttg agaagagttc tatattccta tgacctgtgt ctccccatga gcaaaactgc 20460
tactgcttta cagagccagg gacagtggcc cacctctctg tggcatcctg ctttatgaac 20520
aagtcactgg gctcagatgg cagtctctga ttttctcacc ttgcttcttc tggcatggaa 20580
actccaccct acaagtggga actgagtgga agaagagagc cccattcccc ttagccactc 20640
ttaacaggat tagaacctct gcaacatgca tttaagaatg ggaacaggct gggcacagtg 20700
gctcacgcct gtaatcctag cactttggga ggtcaaggca ggaggattgc ttgagccagg 20760
agttcaggac cagcctgtgc aacatggtga gaccctcatc tctacaagaa atagaaaaat 20820
taactggtgg gttgtgtata cctgtaatcc cagctactcg ggagcctgaa gtgggaggat 20880
tgcttgaacc tggaggcaga ggttgcagtg agtcaagatt acaccattgc acgccagcct 20940
gggcaacaga gtgagactct gtctcaaaaa aaaaaaaaaa aaaagagtag gaacattgag 21000
gctgggcatg gtggctcatg cctgtaatcc tagcactatg ggaggccaag gcaggagtat 21060
cacttgacgc taggagttca agaccaacct gggtaacata gcgagacttt gtctctatta 21120
aaaaaaaaaa aaaaaaaggt gtaaaaaact tttgtaacaa gagtgggaaa gccgggcaca 21180
gtggctcaca cctgtaatcc cagcactttg gaaggccaag gcaggcaggc ggatcacctg 21240
aggtcaggag tttgagacca gcctggccaa cgtggtgaaa ccccatctct actaaaaaat 21300
agaaaaatta tctgggcatg gtggtgcaca cctgtagtcc cagctactcg ggaggctgag 21360
gcaggagaat cacttgaacc tacgaggcag aagttgcagt aagccaagat cacgccactg 21420
cactccagcc tgggcgacag agcaagactc tgtctcaaaa aaaaaaaaag agtggaaatg 21480
ttaggatgag aaatgctggc agcctgcccc tccctgggag atactgtagc cctagactgg 21540
aagttggggg aggagggagc cctgtgctct tagctgcacc catgtgaagt tgtgcttcta 21600
tcacatgagc tggggacagg agagaaggct cagattatgg cttcagtgcc acagaatctc 21660
ttcatactaa aatttagtag attttcttga ataaatgctt tttcatttgc tgtacaccct 21720
taaaagtttc tagaaatttt taatatttga gttttaaaaa ataattttca acagttacag 21780
ttatttcact aaagagagag tctacagaac cctcttgcca ccattgcaga ggttgtcttt 21840
ggcttacgag tttttaaagt atttgtatac attttttaag ttcaaaataa tagaattgta 21900
agtgaacatg ctgttttcat actgtttttc aagctttatt taatatattg taaatctaat 21960
tctattttat taaatagtct gccacagtat aatgtctgat gtctccttag aattttattg 22020
tatggatgaa caatgattat ttaatttcct accaattgtt gggtgttttt tgtttgtttg 22080
tttgtttttg agactgggtc tcactctgtc acccaggctg gagtgcagga gtgcggtgga 22140
atgatcacgg ctcactgcag cctcaacatc ccaaggctca ggtgatcctt ccacctcagc 22200
ctcgcaagta gctgggagta caggcacatg ccaccatgcc cacctatttt ttagagatga 22260
agttttgcca tcctgcccag gctggctcga actcctggcc tcaagcgatc tgcacacttc 22320
cgcctcccaa aatgccagga ttacaggcgt gagccatcat gccctacccc cccatcaatt 22380
gtttgatgta gccatttttc aatgatccgc gattaagaag cagcactctt ttatagccaa 22440
aaattacaca tatataaaat tttcctttag aaaatgttct aaaaatggaa tgtctaacta 22500
aagggttagg catacattct taagacttct gatacgcgct gacttgcagg aaagttgttt 22560
cagttaacac tcctaccagc ggcatccgag agttaatctg taaagcttga gacaacttag 22620
aaagtgtttc aaatgattgt gttgcttaag aaaaaaatct tagcacttcc ttttgaaaag 22680
ccagtggggc tgaaaagaca atgacaagca ctttgtccct ctgtactgtg ttttccttgc 22740
agcctggtga gacgagtgga ccggatggag cattccatcg gcagcatagt gtccaagatt 22800
gacgccgtga tcgtgaagct agagattatg gagcgagcca aactgaagag gagggaggtg 22860
ctgggaaggc tgttggatgg ggtggccgag gtcagtagtc atgagctgaa aacaccgctg 22920
ctgagcatgg tgttattaat gaaaatatat gttgctgaca gttgtatttg aagtattgaa 22980
gaagagtaaa aaaaatttac gtttatagaa attcacaatg atgtttccat ttactctcat 23040
tttcagattt ttttctctga aacagaaaca ctctttctat aaaatctctt gctataaaac 23100
atcaatgtag tcatattgtc taacccttag gctgagatgt ttatctttct ccataactac 23160
agataaaatt ataatctgga ggtgttactt tcttaatact ccatatgcta atggtcctgc 23220
cttcactgca gggtagaatt aagtgaaaaa ttactccagc aactctgaga tttgctatta 23280
tatgctgtaa atctccagcc ttaccaaact acagattatt tggtccctgg acttcctaag 23340
gcatttcctt ctactgcccc caacaccagt ttctttttcc ctttttagga tgaaaggctg 23400
ggtcgtgaca gtgaaatcca tagggaacag atggaacggc tagtacgtga agagttggaa 23460
cgctgggaat ccgatgatgc agcttcccag atcagtcatg gtttaggcac gccagtggga 23520
ctaaatggtc aacctcgccc cagaagctcc cgcccatctt cctcccaatc tacagaaggc 23580
atggaaggtg caggtggaaa tgggagttct aatgtccacg tatgatatgt gtgtttcagt 23640
atgtgtgttt ctaataagtg aggaagtggc tgtcctgaat tgctgtaaca agcacactat 23700
ttatatgccc tgaccaccat aggatgctag tctttgtgac cgattgctaa tcttctgcac 23760
tttaatttat tttatataaa ctttacccat ggttcaaaga tttttttttc tttttctcat 23820
ataagaaa 23828
<210> 243
<211> 23754
<212> DNA
<213> Homo sapiens
<400> 243
acagttcaac aatatagctg ctgtcacagt attttttgtc tggattaagg taatttataa 60
atttcatgtt ctacatttta aataatattt tctttaaaaa aaatgagttc cacaaaatca 120
tggaatactt gaatttgaaa ttcaagtgac cagccaaagc tgctcaatat ttactttgag 180
acagggtctc actctgtcac ccaggctgga gtgcagtggt atgattacag ctcattgcag 240
cctcgacttc ccaggcccaa gcgatcctcc caccttatcc tccgaagtca ctgggactac 300
aggcatgtgc caccataccc ggctaatttt taaatttttt cgtagagaca aggtctcatt 360
atgttgccca ggctggtttt gaactcctgg gttcaagcaa tcctcccacc tcagcctccc 420
aaagtgctgg gattacaggc atgagccacc gtgccaggcc tcatatttta catataaagt 480
aaactattga gactcatgtg atcattcctc tcactgtcaa tgacatactt ctgctatctg 540
aattagtgca agatcagtcc ctataggttt tgtttaacaa atgcagtaag aggcctttca 600
gtgtgttagc tgggcctggg gccccaggct gctaacagat gagatgaaca ggtgaaggaa 660
aaggaactta gagaaagaga gggaaggagc aggtggaggg aaggggagag ttgctgcact 720
tggaaatgct tgctagaagg gatcgcctct tttccaggta gaggctgtaa gggaagcttt 780
acctagaatt aaggttggaa cagacactgc ttccaaatag ttccttgctc actattttcc 840
ttattgtccc aagatataat gtgcatttcc atgtgtgtga aaggttatga catttcatat 900
acaacaagcc tcaattctgg agatgcagga aatttcaata attctcaggc agcagctgcc 960
attcggtcac cagcacaggc tctgattgtg ctgtccagac agtaagtact agccacatgt 1020
gcctatttaa attcaaattt aaattagtta agcttaaata caattaaaaa cgcagttcct 1080
tggtcctact ggccacacat taagtgttca atggctactg tctaggacag tggaaatgta 1140
gaacatttcc atcatcacag aacgttctct tgaaaagcac tgttctggaa ggtacttacc 1200
cgttatgtac ttttctgagt tggtattcat acctagaaga cctgaggttt atcacaagac 1260
atagacttgg accaggcgca gtggctcatg cctgtaattc cagcattttg ggaggccgag 1320
ataggtcccc tgagcccagg agtctgatac cagcctgggc aacatggcaa aacctcatct 1380
ctactaaaaa tacaaaaatt agctgggggt ggtggcacgt gcctgtagtc ctagctactt 1440
aggaggctta ggcgggagga ttgcttgaat ccagaaggcg gagggtgcag tgagccaaga 1500
tcgcaccgct gcactccagc ctgggcaaca gagtgagacc ctgtctcaaa aaaaaaaaaa 1560
aaatgcatag actttatcct gtatttctca tgctatttat ttattgacat gcttgttcaa 1620
gagaaaccat cactaaagca caaaaccttg atcataacat agtaataata atcaaacagc 1680
aaaaataata atagtaataa gaatgttctg tggtgatgga aatgttctat attttcattg 1740
tcctagacag tagccactaa ccatgtatag gcatggaaca cttaacatgt ggctagtagg 1800
accaagggac tgaattttta attgtattta atcttactta atttaaattt gaatttagat 1860
atccacacat gtttggatag cacagtcaga gcctgtgctg gtgaaaggat ggcaggtgct 1920
gcctgagaat tactgaagtt tccttgatta ttattagttt aataataata atcaagatag 1980
taataataat caagatagta ataataatca agatctcagc tgggcacagt ggctcacgca 2040
ctttgggagg ctgaggcggg cagatcacct gacgtcgggt ttgagaccag cctggccaac 2100
atggtgaaac cctgtcccta ctaaaaatac aaaaaaaaaa aattagctgg gtgtggtggc 2160
acgtgcctat gatcccagct acttgggaat ctgaggcagg agaattgctt gaacccagga 2220
agcagaggtt gcggtgagct gaatcatgcc actgcactcc agcctgggca acagagcagc 2280
acttcgtctc aaaaaaaaaa aaaaaagatc tcaaatgaat tgggattgta ttaagtaatg 2340
attaagtaat gtgattacag caatcctcaa gaaatatttc actgtggcca gtaacaatgt 2400
gtaacagacc tttaaacttc tagagatttt cctacaacat gtgtctcagg ctgatgtgtt 2460
ttatttagtg cttctcttgg aaatgtcttg cccctcgata ctttatcatt aaggtcttta 2520
aggcagggat catgactcta cttttttttt tttttttttt tttgggacgg agtcttgctc 2580
tgtcgcccag gctggagtgc agtggcacaa tcttagctca ctgcaacctc cgtctcctgg 2640
gttcacgcca ttctcctgcc tcagcctccc gagtagctgg gactacaggc ggctgccacc 2700
acgcccggct aattttttat atttttagta gagacggggt ttcaccgtgt tagccaggat 2760
ggtctcgatc tcctgacctc gtgatccacc cacctcggcc tcccaaagtg ctgggattac 2820
aggcttgagc caccacgccc ggcctcatga ctctacttct aatatctcat catgtgctct 2880
tccactgagg cttctactta gagctacaca atctgggcag ccatcctcag tgccttatct 2940
accaacatgc tcaatatggc tttgcagggt tcactgtcta ccagcagggt tcactatcta 3000
ccaacatgct caatatttct ttgcagtcag gcagagcagg ctttgcagtt caggcagggc 3060
agctggctgc aggccccagc tgactcctgg ggatagaatg ccaatatttc agacattgca 3120
gagatttgag gcaatgtaca taaagccctc cacatataac tgatgcacaa taaatgacag 3180
ttaatattat gcaacaagaa tttcctgggg ggttttataa ttaattttta tttgtgtgaa 3240
gttttttccc tcccttttac tttaatcctt tttgggggga aagcatcact agtcacagtt 3300
cacggcagcc tcgacctccc aggctcaagc aaccctccca cctcagcctc ctgagtagct 3360
gaaaccacag gtgtgtgcca ccacacctga ctaatttatt tttattttct aatgaaacag 3420
aatcttgcca tattgcccag gctgatctta aactcatggg ctcaagcgat cctcctgcct 3480
cagtcttcca aagtgccggg attatagatg tgagccactg cactcagcct tttttttttt 3540
ttttttaatt gtagatagca taaaacctac tgttttaacc atgcttaagt gtacaattca 3600
gtggcattaa gtacattcac agtgttgtgc agccatcgcc attatgctgc attattttca 3660
gaactttttc attattctaa actgaaactt tgtatccatt gaacactaac tcccaattcc 3720
cccagtccct ggtaacctcc attctacttt ctgtcactgt gagtttgact attctaagta 3780
cctaatttaa gtggaatcat acagtatttg tccttttgtg tcaggcttat ttcactttgc 3840
atgatgtttt caaggttcat ccatgttgta acctgtcaga atttaatttc ttttcaggat 3900
gaaataatgt tttattatat acagtcacac cattttgttt atccattcat ctattgatgt 3960
cttctctctc ttacagctct tcaaattcat caattttaac aggaccatga gccagctctc 4020
gacaaccatg tctcgatgtg ccaaagacct gtttggcttt gctattatgt tcttcattat 4080
tttcctagcg tatgctcagt tggcatacct tgtctttggc actcaggtcg atgacttcag 4140
tactttccaa gagtgtatgt aagtatatat gaaattaaga agaaaaattt aatcagagtt 4200
gtcactgctt ctcaagaata aatcttcata tgaggttgct atatgaccac caattattta 4260
aaaccagtta ttttaagtaa gaattaatta ccttttccca aaacattgat ctacccatgc 4320
aaagaagaca atgcatcctg aaatgctgat gcttaagata gcagcccaaa gtagtaaaat 4380
acagttaaca gacataggaa accaacactg ttctgaagac tgagtttttc tttgcaccaa 4440
atgcagatgg tagcttctag aaggctgttt gcctatattc ttactcctgt tgaatattgt 4500
tgccatatat ttagaacttc aagttatttt ctaaggaaaa aaacaagata tttctaatat 4560
tctaaggtaa actcagacca gtacaagaat tttcagtttt tttttccaaa gatcccaaat 4620
gtgaaataaa acaacaaaaa gcagccagtg tcagatttct atgccattta gaaaggagtt 4680
agtttaaaaa ggaatggaag taatagggtt ttgtgcatag atatctcgaa ttaatattgc 4740
tgttgataaa agtgattttg ctaagaccca gcactgacaa cacttggcca ctttgatccc 4800
attttaagta cttgtcagaa tattggatct ttgaactcaa accattttgg gtttttgggg 4860
tttttttgtt ttgttttttt ttgttttgtt ttgtttttga ggcacggtct tgctctgttg 4920
cccaggctgg agtgcagtgg tgcaatcata gctcactgca gccttgaact cctaggctca 4980
agcaatcctg ctgcctcagc ctgctgagta gctgggacta caagtgtatg ccaccatgcc 5040
tggccaattt ttaacttttt ttatgagaag ggatctcact gtgtagccca gggtggtatt 5100
gaactccagg gcctcacact gtcctctcac ctcagcttcc aaaagtactg ggattacagg 5160
catgagccac cacaccaggc cctgttgttt tttttttaaa gaaattttta actttagacc 5220
gagggtgact gttgtcaagg tttagggtta agatgtttta cctagattat gtgttgaaat 5280
gttatagcca attgctttat aagttattga ataataattg tattttcttt tttttttttt 5340
ttttgagatg gagtctcgtt ccatcgccca agctagagtg cagcggtgta atctcagctc 5400
actgcaacct ctgcctcccg ggttcaagcg attctcctgc ctcagcctcc cgaatagctg 5460
agattatggg cgcacgccac caagcccagc taatttttgt atttttagta gagacggggt 5520
ttcactatat tggccaggct gttctcgaac tcctgacctc gtgatccgcc cgcctcggcc 5580
tcccaaagtg ctgggattac agacgtgatc caccgtgccc agcttgtgtt ttctttttaa 5640
ccaaatggaa ataacctctg tagcatgaaa gcattttatt attattgcag aaggctttaa 5700
ttgctgatac aagtagcaag actttgtaaa tgggattgac aattttctgt tattcggcag 5760
ctacctatac tgctaaaagg tccaaaaata atgaaatcat ctttaagaaa tgttgcatca 5820
actagtggac attctttgtt tttgtattgt ggtgttttgt tttattttta tagcttcact 5880
caattccgta tcattttggg cgatatcaac tttgcagaga ttgaggaagc taatcgagtt 5940
ttgggaccaa tttatttcac tacatttgtg ttctttatgt tcttcattct tttggtatgt 6000
acatttttat ttatagtgag gttcaattta aacttcgtaa atccttgtct tctcttttct 6060
ctcacacttt atgtcctatc aattttaaat aaagacccag gaagtagaaa aaagtgtgga 6120
tgttggaaaa cttattttcc ttttattaat tcacagtttt gagactcata tcaaatgtct 6180
tttctgtggt ctttcattga tccatgtata tgtgtctatt caatgcaaaa aaaattagat 6240
ctcttccatg gtctttcatt tctctctcta tatatgtatc tattccatgc aaaaaagaaa 6300
ttagatcaag tacaaattta taaagatacc taaaatagtg ctttgcctaa aaagtagaat 6360
atgcttacat gctttttaaa ctcatatgtc agcactttcg tagtcacttg ctagcatgac 6420
ttttctctct ttcttctttt ctttttaaaa aataagaacg gaaaagcaag ctagatctaa 6480
gatgtcgagt aatagttgag tgaatcattg catgtcaaaa ttaggatatt ctgttttaaa 6540
ttatttatat cccattcatc tagagactgc ctacagagaa tattcaaata attaagttta 6600
aaactaaatg taacaatgaa tggaaattgc attaaaatta ttttcaaaaa taattttttt 6660
attctcttga tttggtacaa atgaacattt ttaatgtttt tgccctaagt caattaagtt 6720
tttttaaggt gttttgttct ttttcttaac atttatatat tcaattgtct actgagaagg 6780
tgttaagcca gcttaattta ggcaatattt ttcatctaaa cactaacagt catcttaaga 6840
acaattttct taagaaaata acattttttc catttcagta aattgtgtaa agatcccttg 6900
aggaaggtta agtgatcaca ttttcagtaa ttcagtgtaa taactctaaa gtcagtccag 6960
gtattactgg ttaagtatat ggtatttatt gattgggtat tagatgtact gtattaattt 7020
cctgtttaaa aaaaattttt tttccgggga gacacagcct ctggtgtaaa acaaaggtgt 7080
gttccctagc tgtactttaa caggactgaa aaggtcagga atatcattca agttcatatg 7140
tatcttgctg tatgcatggt ttatggctca tttttaaact tacacctctt aagcttcttc 7200
ttcctatcat atattaaaac aatggagaga agaataagcc tctgttactc taccattgat 7260
agtacttcgg attctagagt acctgaatct ctactaagaa ggcaaaaacc aggaattgag 7320
agtcctgcac ctgacccttc agttgatctc aggccaccta gttttctccg tttatcaatc 7380
tgccaaacaa ggatggatag agtcgtggca actggaaagg ctcaaatgtg gaattgtttg 7440
aatgtggtcc tttagtaggc agccatctta ccagatctag agtattcagt catcttacca 7500
gatcagtcac cagaacatga aaagaagctc ttagtttcta tctttatact aaaattgttt 7560
ttttgtacga ctgcacaaaa aagaattgct ctccttgcac ctcccagaga tataggtgga 7620
tagatacata catacgtaca tacatacata catacataca tacatacata catagacaca 7680
tacatagata gaagtctact ttcaatacaa acctgtcttt taaggaaatg acaagctgag 7740
catagggttg gccacctttc tgagccgatt gcctggtatt agtttattgc ccctgtttag 7800
caagaaggca cagtgttaag aagtggctca gctgaaccag gataacccca ctcttccccc 7860
acatcaacag gaaagacatc ctggtgcaga tgtccatctg ataattcagg gaacctcggg 7920
agacaggatg gagaggaggg tgagctagct tcctcttccc acaccttcaa gagcctttct 7980
caagcacttt ctattttttg aaatctcttt agaggtccca gactttgatc tgtttcaatt 8040
aaggtattgg caggcattag ttaacagcca cttggaagca aaaatagaac attagatccc 8100
tgagttggaa gagagaaggt agaaggtgtt acttggactg caattatctg cacttggaat 8160
tgagcattta gtcaaaaact tatatgtatt ctatattcta ttctcatttc tgctacagaa 8220
ttgtaaacaa tattcttcct taatacagaa attcatagcc cactaaaata agagcgttct 8280
catttgttca tttctcaatc atttaataag tatttactaa gccactatat ccatatatat 8340
atatatatca tatatactgt ataatacaca ctgtagtgtt ttttgtggat tgtgtactat 8400
gaggtagtat gttagatact gccagtactg gggtaaggaa aacagcctga ttaggccctt 8460
acgaagattc ctcagacttg tggggaaaac agacattatc aaatagaaat acttgcaaac 8520
cacagttatg tgttaaaaag gaaaaacaaa gtaaaaaaaa agttggtggg ggggaacctg 8580
atctcctgga tacagtgctt cgagaaagtt tgttgttgga aatgcaaacc attactactg 8640
tggaagggaa aggtcagaaa aatgaactca ccattactga atagtaatag tagctatcaa 8700
ttaggtggca cttacctgca tcaggacctg tcctgagcac tttacataga ttgtctcact 8760
aaccagccca acaaatatgt aagggagata ctattatttt tcccatttta ttaatgtaaa 8820
acaattaaat aattctttaa aattagactt agaaaagtgg agcaacaatc ttagcagtgc 8880
taggactgaa atccaagttt gcttgactcc aaagtctatc tctcttccag aaactttttc 8940
tttactatct gcctagtagg cctgctgtat tcctatttgc aacagccttt taaactcttt 9000
aaaaatgtgt cctgtaaatt tcatatatga ttatacaaaa aaacttggaa taagcataca 9060
attctactta tctgtgttaa ctgttgaaat ttgaagagct ttttggaatt ctataccctt 9120
cagtagtgta tgtaaaagtt tctaaatata gagaacatag ataagcaaaa ataatattaa 9180
ataaaataat cgcaccatta gtaggtaaat atactaatat tttgttgtat tttattcttg 9240
tatgttttca caaagtatat cataaaattt ttcctgtggc atgacttaac ggagaaaata 9300
atcttcccaa aacatgtggc agcaaaactg ttaatttatt acatcaggct gggcacagtg 9360
gctcacgctt gcaatcccag cactttggga agccgaggcg ggcagatcac ttgaggccag 9420
gagttcgaga ccagcctggc caacgtggtg aaacactgtc tctactaaaa atacaacagt 9480
tagccaggtg tagtggcaca tgcctgtaat cccagctact caggaggctg agactcaaga 9540
attgcttgaa cccaggaggc agaggttgca gtaagctgag gtcgcgcccc tgcactccag 9600
cctgggcaac acagtgagac tctgtctcaa aaaaaaaaat ttttttttaa ataaataaat 9660
aataaattta tgtcttcata aagcactcag attaggaaaa aaaggataaa caaaaaggca 9720
tgtgtcattt ttttgattga taattccaaa ttatgtttct tcctttaatt tttgccctcc 9780
tttcatttac aaacagaata tgtttttggc tatcatcaat gatacttact ctgaagtgaa 9840
atctgacttg gcacagcaga aagctgaaat ggaactctca gatcttatca gaaaggtagg 9900
aaaaacctta attctcagaa ttcttctgtt tctgacataa aatgagcatt gtttcaccca 9960
gattttcaaa tcaacattga tccattgaaa ttgtttgaaa taaagaatac attgctatat 10020
ttcaggaata atttaaatgt tccctatctt ggagtcttga tggatatact gctatcttga 10080
attttaattc tgggaatcct tttatgccct ggaattaaat tctcaacaat cttttgacac 10140
tttaagagct gagctgaagg ttcatcacct tcattatttt gacatctcct gtagctggct 10200
ctcacttcag gatcctgagt tgagaataaa ctagaaggga agattatata aagggatttc 10260
cacctcttct gtctcaatta ccattttaaa aaaataaaaa gttttagagg aaaacactta 10320
gtagttcacc ctttaccctt gaccttccac ggcagtttta aaataagcaa aggaaaagat 10380
tcatgaattc aggccatagc ctggggcctg agaactttta cttatgcacc ttctcaggaa 10440
gggtttcatt gttaaataga agggcaggac aggaaagttg ggcctctttg ttcttctcaa 10500
tgtaacttct ttatttggtt taaagtataa aatgtataca acaacaaata accacattta 10560
aaatacacag tttgtttccc aacatcattt tgctaagtca tagtggctcc ttaactgtaa 10620
tttttttttt tattagtcca agccttagga ttatgttatc tgtgatatat gttataatag 10680
aaaacttaag cctcttaaaa caaagtcctt gggatgggac ctaagattca cattatcttg 10740
attccgcata acagttgctt acattttagc aaatctccag tgtgtatgca agcactcctc 10800
acttggcaca attctgatac acacaaactt tggttacccc agttttgtta tgtaacacca 10860
ccttcaacaa cacagttcaa atttcagtta tcatagtata ttaactctga gtaacagcac 10920
aaagtacaaa ctccactgct agctcttcag tgtatagatc agttacctga gtaacagatg 10980
tgcaggctga gcaggctcac tggtcagtca tgacactatt ttcagtctgt tactaattgg 11040
tcactgagca tctgctatcc aattcacaaa caaagaaagc atgtagtgtt gcttccttgt 11100
gttccagtaa taagcccatg tgacatttta caaaaatgga taattgaaaa agagaatggg 11160
tgcagtggct cacgcatgtt gggaggccaa ggcggatgga tcacctgagg tcaggagttc 11220
gaaaccagcc tggccaacat ggtgaaaccc catctctact aaaaatacaa aattagctga 11280
gtgtggcgac agatgcctgt aatcccagct actggggagg ctgaggcagg agaatcgctt 11340
gcacctagga ggcggaggtt gcagtgagcc gagatcgtgc cattgcactc cagcctgggt 11400
aacaagagcg aaactccgtc tcaaaaaaaa aaaagaaaag aaaagaaaag aaaaagagaa 11460
tgggctagca aagaaatgaa aaatggtaac actggaagtg aaaatcaaaa cagagtaatg 11520
gatttataga agaaatagct gagtgaagaa gaaataggag tgttgacact gcgatcattc 11580
aagagatcca gatatggagc cagaagaact tagggcaggt ctatcaactt aaatgaggaa 11640
aatagctgtg ataaaacaga tgaagatgtc ttgaggaaat gatgcctgca aaaaacttca 11700
cattaaggga agtcttatta gagatatttc acaataatga aagtacaaaa gaaaaaatgt 11760
tggggctgga catggtggct tactcctgta atcccagcac tttgagaggc caaggtgggt 11820
ggatcacttg aggccaggaa gtcgagacaa gcctgatcaa catgatgaaa ccccgtctct 11880
attaaaaata caaaaattag ccagacatga tggtgcacac ctgtaattcc agctactcaa 11940
gtggctgagg cacgagaatt gcttgaacca gggaggcgga ggttgcagta agctgagatt 12000
gcaccactgc aatccagcca ggtgacaggg taagactgtg tctcaaaaat aaataaaaga 12060
aaaatatgtt ggaagctcat ccacatttaa gaaggaatat gacaattcac taatgcatag 12120
aaaagaagtt cactccacat tgtaaagtgt acagtgtaat attatacaat gaaaacaagg 12180
caagtgctgt ttaaactact ctggatacat tttttacaaa gaaataaaac actttagttt 12240
ttaatgtttc taatgtttta cattttagtg tattaaatca atattagttt tcttcttttt 12300
taagctccct atacatttat aactgacact aagggagtgt ttaatgtttt gattaaaagt 12360
tgtaaagatc acagaacaat tgtaattctt cccactgatt attcagatca ttttgcacaa 12420
tttcagcttg catggtcact tacagtgccg cactatgtgc aaagcaaggt caggtctaaa 12480
gttcgctaat gaaaaatcct cggccagggg cagtggctca cccctgtaat cctagcactt 12540
tggaaggcga ggcaggcaga tcgcttgagc tcaggagttc aacaccagcc tgggcaacat 12600
ggtgagaccc tgtctctaca aaaaaaaaaa aatagcaagg cgtggtgact cacacctgta 12660
gtcccagcta cttgttgggg gctgagttgg gaaaatcact tgagctcagg aggtcgaggc 12720
tgcagtgagc cagaatcacg ccactgccct tctgcctggg tgacagagta agatcctgtc 12780
tcaaaaaaag ggaaaatcct catctacatt tcactgggtt ttttgtttgt ttgtttgttt 12840
gtttatacac acttaaggaa attactgtct agaagataga taatataaaa aataaaaatg 12900
caattcatga ttcgggtttc ttggtattcc taagaactgt tgcacagtac tttatgctct 12960
gaggcagaca gctatagcat atatagtaat ttttgtttct atcacataaa cttgaataca 13020
catatgagta aaagaccttt agttcttcat gacttactga aagaccctga ctttttccat 13080
gtaactgttc cacaagtgtt ttatggaaaa ctggatacat taattcttca ttcatccagc 13140
acgtacttgt tgaatggcca atgtacacca ggtttgtagt agttactact gtgaatggaa 13200
agtaaaacag atgcaaaagg agaatacact aaaccaagtc ttttattttt tctctctctg 13260
atagggctac cataaagctt tggtcaaact aaaactgaaa aaaaataccg tggatgacat 13320
ttcagagagt ctgcggcaag gaggaggcaa gttaaacttt gacgaacttc gacaagatct 13380
caaagggtga gaatcatgct tcctgaggtt ctgaaaaatt cctgcttcta aagataaatt 13440
cctggtgata agagtatttc tagcccaagg gctcatacag atactttttt tttttttttc 13500
cagaggcagg tatctttctg gaacatgtta taagaggaaa acttgccccc atttggtgat 13560
ttctcctttc ctcctgcatt ttgatgtctc tgtgttgagg gtgaactggg tacaaggaat 13620
gatttttatc tgtatcctct ctctaatttc aggaagggcc atactgatgc agagattgag 13680
gcaatattca caaagtacga ccaagatgga gaccaagaac tgaccgaaca tgaacatcag 13740
cagatgagag acgacttgga gaaagagagg gtgggtctgg tttaggagaa ccggatttga 13800
tttggtacct acaacaccac agatgtatca aacactatag aagtagtggg ttattgagtc 13860
tcttgcccat tccccaccac actctctctc tctctcagtc ggtttatgtg ttagtaccct 13920
gtttattcca gaaagaatat ataacacaat tatgtataaa aatgggtggt tagcatgata 13980
taaaaacgtc aaaatgaaaa gcaagcaaaa caaaagtaaa aataatggat tattaatgaa 14040
gcttaaaaat gcattcataa aaacacatat gcttattaag attgggctac aaattgggcc 14100
ctaagcttgc tggtaatcag cttgaaaaga gaagcctgat tagctgcaga gtccacaatg 14160
tccgtgagag tgaagaaaac aaaaaatgac ttaccaagag atgtgaaatt attctggtta 14220
gttagtggct atttaaattg ttaacttttt tttctttttt tttttttttt gagatggagt 14280
cttgctctgc ctcccaggct ggagtgcagt ggcacaatcg cgactcactg caacctccac 14340
ctcccgggtt caagcgattc tcttgcctca gcctcccaag tagctaggac tacaggcaca 14400
tgccatcatg cccggctaat ttttgtattt gtagtagata tggggtttca ccatgttggt 14460
ctcaaactcc tgactgcaag caatctgccc accttggcct cccaaagtgg tgggattaca 14520
ggcagtagcc accgtgcctt tcctaaatta ttaacattta taataaaatt aacagccgcc 14580
ttccatttga atacttttta caaaatagtt aaaaataaac ataagtgggc ttttatagtc 14640
agaaaaaaaa attcaaagct ttaccattaa ctttcaaaaa taaatggtta gacagcaaca 14700
acaaaaatct gtggtaactg aggtacagag aacacagatg aatgttatta caaaagccac 14760
tttcctatga gaagtctagg acagtggttt ctaaatgcca ctccacagac agtgctagta 14820
ggtgacagac ttctccagtc acagtgaaat ttaagcataa agaaaatgag gaaaattttt 14880
acaaggctct atttagacaa agttcttatt ctgacattac atctttccta ctttggagct 14940
gttgaatgta ttatctttta tgaaaagaag gcgatccagg ttgagcatcc ctaacccaaa 15000
tatgtgagtc tgaaatgctc caaaacctaa aacttcttga gcacaaacat gatagtcaaa 15060
ggtcatgctt aaaggaaatg ctgtcattgg agcagtttgg attttgggtt ttcagattag 15120
ggatgctgaa ccagtaagta taatgcaaac attccaaaat atttttgaaa atcccaaatc 15180
caaaacactt ctgatcccaa gtatttcaaa taagggatac tcaacctgta atatatttct 15240
tcatttcttt atttatttta ttattatttt aagatggctc atggcccact gcagcctcaa 15300
actcctaggc tcaagtgatc ttccgacctc aacctcccag gtagctcagg tagctgggac 15360
tgcaggcatg catcaccatg cctggctaat tttttaaaaa attttttgtg gaggcagagt 15420
ctcaccttgc tgcccaggcc agtctcaaac tcctggcttc aagcagtact cctgcctcag 15480
cctcccaaag tattaggatt acaggtgtga ccactatgcc tggcccatat ttcttcattt 15540
agttttttct ttgcctgctg tgtttttaat gttctttctt gttcaaacaa aaagttggct 15600
attccttgct gttagttaaa tttgccaatc tatgaaactg aaaaatgcag gagtcccagc 15660
ctggtgttaa atacaaagaa atcccaggta aatggcatgc acccagttcc tgcttgccca 15720
agtccttggt gaggcttctg tggggtctca gtgttctgct cctcactcag tgaccccttg 15780
ttcttcagga ggacctggat ttggatcaca gttctttacc acgtcccatg agcagccgaa 15840
gtttccctcg aagcctggat gactctgagg aggatgacga tgaagatagc ggacatagct 15900
ccagaaggag gggaagcatt tctagtggcg tttcttacga agagtttcaa gtgtaagtat 15960
aaaggaattg gcagaatttg cgttgacaag agtccacatg agaccaggca gttccctcat 16020
ctctctgaat tcactccttt ccattactaa tcatccagct tttaaaaata acttatactg 16080
gccagacgca gtggctcatg cctgtaatcc caccactttg ggaggccaaa gcaggcaggt 16140
catgaggtca gaagttcgag acgagcctgg ccaacatagt gaaaccccat ctctattaaa 16200
aatacaaaaa attagctggg catggtggtg ggcacctgta atcctagcta cttgggaggc 16260
tgaggcaaga gaattgcttg aacccgggag gcggaggtta cagagagccg agatggctcc 16320
actgcacacc agcctgggcg acagtgcaag actctgtctc aaaaaaaaaa aaacttgtca 16380
attggtgttt tgtttcttac ataatatgtt tactataaaa attagcaaat aagagcaaaa 16440
gaaaacatta acatttcaca tatttctacc aatgaaaaat gtttattaat atatcagtgt 16500
ttgtgtctct atttgcatgt gtttatcaat gtttctatat atttttatgg cctaacatat 16560
ggttcgtcct gaagaatgtt ccttgtgcat ttgagaagaa tgaatattct gctgttcaag 16620
tgttctgtag atgtttgtta ggtctagttt gtttacagtt ttattcaggt ctcccatttc 16680
ctggttgatc ttagatgtgc ctagatgtgg tattcacgtt tgaaagtggg gtattaaagt 16740
ctccaagtat tattagttgg agttcatccc ttcaattctg taaggttttg ctttgtgtat 16800
tttggaactc tgttgttggg tgcatacata tttataacta gtatattttc ctaatatatt 16860
gaccctattt tctctctcaa cttaatgagg ctaaagaaaa aaaagaattg accctgtttt 16920
cattacaaga tgttatccac tttatctcta gtaaaattct ttgttttaag tattttttgt 16980
ttgatattac tgtaaccact ccagctttct tttggttgct gtttgcatga taaatctttt 17040
tccatccttt tactttaaac ttatttatat ctttcagtct gaagtatgtc tctcctgtag 17100
acagcatata attggatctt atctttttat ccagtttgac aatttctgtt tttgattaga 17160
ttgcttaatc cattcattta atgttatcat tgatgtagtt gatttctgtc tgctatttta 17220
ttttttgttt tctagcttac ttttttttgt tcctctttca ctgctttctt gtacattaag 17280
tgaatatttt caagtataac atttaaattt ttttaatgat ttttcatttt ttttagtcag 17340
gagttgctct aagacttagt ttatacaatt aagttatgaa aaattacttc agatatatat 17400
taactgaatc cagtgagata tagaaatcat ttctatttag cttttttcct cttccctctt 17460
tttgtgctat atattcatct atctatatgt atatatagtc atctacatat gttgcaaatc 17520
acattgttag aacaatgtta catttttata acacactgtg taatatatag tatataattt 17580
tatatctctt aatgaagctg agagaagagg aagtatatat ttataaatgt gtatattaac 17640
ctactttttt accatttcta attctcttct tttgctcctc tggattcaag ttatcatctg 17700
tcgtcattct ctttctccga tacagctttg ctactgccta cctcctatta ttgtcaaata 17760
tattacattt ctattataga ccttcagatc caattatgta catattttta cacaactgct 17820
ttttaaatca gttaaggaac aaaaggagaa atgtacatat atactatatt ttatacctac 17880
acagttatct ttaccagtgt tctttgcctt ttcatgtgga ttctgattac tatctggagt 17940
cacttgcttt cagcataaag aatttccttt agtatttttt gtaaagcagg tttgctagca 18000
atgaattctt tcattttttg tttatctgag aatgtttttc tttctccttc atttcctctg 18060
gcttgtattg tttctgatga gaagacaggt gctaatttta ctgtggtccc cttgtacatg 18120
atgactcaat tttctctcac cactttcaag atttttttgc ttttgtcttt cattattttt 18180
actgtgatat gtctgggtat aaatctctga gttcatccta cttagaaagt gttttttctg 18240
cttctttcac tttctcttct cctttgggac ccgcattatg catatgctta ggggtatcac 18300
atatttctct taggctctgt tcgtcgtcat tttttttccc tctctgttcc tcagagtgca 18360
tagtctgtat tgatgtatct tcaagttcac tgacttgttc ttctgtcagc ttgcttaaat 18420
ctctgttgag ctcctctagt tatttattta tttatttatt tattttatat atatatatat 18480
atatatatat atagagagag agagagagag agagagagaa agagagagag agagagacag 18540
ggagacaggg tctcactcca tcacccaggc tggagtacag tggtgtaatc atggctctct 18600
acagcctgaa cacctgggct caaatgatcc tcctgcctca acctcccaag tagctaggac 18660
tatgggcaca tgctgccatg cctggctaat ttttaaaaaa aaatttgtag agatggcatc 18720
ttgttatgtt gcccaggttg gtctcaaact cccggcctca agtgatcctt ccgcctcggc 18780
ctcccaaagt gctggggtca caggtatgag ccaccgcact tagcctgaat tttttattta 18840
ttatactttt caactccaga atttctattt ggttcttttt agcaatctct gtctctttat 18900
tctgtatttg atgatatcct gtatttgatg agacaatgtc atcataactt cctttttttt 18960
ttaagagata gggtctctct ctgtcaccca ggctagagtg cagtggcatg atcctagctc 19020
actgcagcct cgaactcctg aactcaagca atcctcccac ctcagcctcc taagtacctg 19080
acactacagg catgagccac tgtacccagc taatttttat tttttgtaga gatggggtct 19140
aagttgccca ggctggtctc aaactcctgg gctcaagtga tcctccctgc tcaggctccc 19200
aaagtgctgg gattacaggc atgaaccact ggacccagcc tcctttattt ctttaaccat 19260
ggtggggttt tttattattt gtttgtttgt tttaacctgt ttgaatatat ttataatagg 19320
taccttcagg tctttgtctg ctaagtctga catctgggcc ctctcaaaga cagtttcagt 19380
tgtctttttt tttttcttct tgtgtatggg aacattttcc tgtttttttg ttttgttttt 19440
tgttgttttg ttttgttgtt gttgttgttg ttaaagattg gacatgttag ataatatatt 19500
gtaggaactc tggctagtga ttccctttcc tccccaggac ttgtttttat ttctctttgc 19560
ttgtttactt tttcatacag tctgtttccc cacagtgtct gcctctgact ttattcctta 19620
gagggcgcag ctgtggccat gtacgtagtc actctgggaa gacagtggtt ttagcagcgt 19680
gctcattaac tttctctgac ctctttgtta tacctcctgc ctctgtggat attagaccca 19740
gttattacat ttcattgttt actgattggt ctattgtttt ccagaatgcc ttgggatgta 19800
atttgctcca cagtctgatc cacttaaatt caggcctctt tgcagggcta gttttagagg 19860
ccagtctttt tttttttttt tttttttttt tgagacagag tctcactctg ttgcccaggc 19920
cggaatgtag tggtgcagtc tcagctcact gcagcctcaa tctctcaggc tcaagcaatc 19980
ttcccacctc agcttctcaa gtagctagga ctacaggtgc acgccaccat gcctggttaa 20040
tttttgcatt ttttatagag atggggtttt accatgttgc cccggctggt ctcaaactcc 20100
tgagttcaag caatccaccc acctcagcct cacaaaaggc cgggattaca gatatgcacc 20160
accacgcctg gcccctgagg ccagtcttta actgtcttct tagctgtctc tttccctggt 20220
tctctctggt gaactagctg gtaatttgtt tatctcataa ggctaccaga ttccttgtaa 20280
atgcttatcc ccacaatctc cattgttttc aagagcatcg ttagtcttta atttcctcac 20340
gcttcattcc aaataaagtc cattcacttg agaagagttc tatattccta tgacctgtgt 20400
ctccccatga gcaaaactgc tactgcttta cagagccagg gacagtggcc cacctctctg 20460
tggcatcctg ctttatgaac aagtcactgg gctcagatgg cagtctctga ttttctcacc 20520
ttgcttcttc tggcatggaa actccaccct acaagtggga actgagtgga agaagagagc 20580
cccattcccc ttagccactc ttaacaggat tagaacctct gcaacatgca tttaagaatg 20640
ggaacaggct gggcacagtg gctcacgcct gtaatcctag cactttggga ggtcaaggca 20700
ggaggattgc ttgagccagg agttcaggac cagcctgtgc aacatggtga gaccctcatc 20760
tctacaagaa atagaaaaat taactggtgg gttgtgtata cctgtaatcc cagctactcg 20820
ggagcctgaa gtgggaggat tgcttgaacc tggaggcaga ggttgcagtg agtcaagatt 20880
acaccattgc acgccagcct gggcaacaga gtgagactct gtctcaaaaa aaaaaaaaaa 20940
aaaagagtag gaacattgag gctgggcatg gtggctcatg cctgtaatcc tagcactatg 21000
ggaggccaag gcaggagtat cacttgacgc taggagttca agaccaacct gggtaacata 21060
gcgagacttt gtctctatta aaaaaaaaaa aaaaaaaggt gtaaaaaact tttgtaacaa 21120
gagtgggaaa gccgggcaca gtggctcaca cctgtaatcc cagcactttg gaaggccaag 21180
gcaggcaggc ggatcacctg aggtcaggag tttgagacca gcctggccaa cgtggtgaaa 21240
ccccatctct actaaaaaat agaaaaatta tctgggcatg gtggtgcaca cctgtagtcc 21300
cagctactcg ggaggctgag gcaggagaat cacttgaacc tacgaggcag aagttgcagt 21360
aagccaagat cacgccactg cactccagcc tgggcgacag agcaagactc tgtctcaaaa 21420
aaaaaaaaag agtggaaatg ttaggatgag aaatgctggc agcctgcccc tccctgggag 21480
atactgtagc cctagactgg aagttggggg aggagggagc cctgtgctct tagctgcacc 21540
catgtgaagt tgtgcttcta tcacatgagc tggggacagg agagaaggct cagattatgg 21600
cttcagtgcc acagaatctc ttcatactaa aatttagtag attttcttga ataaatgctt 21660
tttcatttgc tgtacaccct taaaagtttc tagaaatttt taatatttga gttttaaaaa 21720
ataattttca acagttacag ttatttcact aaagagagag tctacagaac cctcttgcca 21780
ccattgcaga ggttgtcttt ggcttacgag tttttaaagt atttgtatac attttttaag 21840
ttcaaaataa tagaattgta agtgaacatg ctgttttcat actgtttttc aagctttatt 21900
taatatattg taaatctaat tctattttat taaatagtct gccacagtat aatgtctgat 21960
gtctccttag aattttattg tatggatgaa caatgattat ttaatttcct accaattgtt 22020
gggtgttttt tgtttgtttg tttgtttttg agactgggtc tcactctgtc acccaggctg 22080
gagtgcagga gtgcggtgga atgatcacgg ctcactgcag cctcaacatc ccaaggctca 22140
ggtgatcctt ccacctcagc ctcgcaagta gctgggagta caggcacatg ccaccatgcc 22200
cacctatttt ttagagatga agttttgcca tcctgcccag gctggctcga actcctggcc 22260
tcaagcgatc tgcacacttc cgcctcccaa aatgccagga ttacaggcgt gagccatcat 22320
gccctacccc cccatcaatt gtttgatgta gccatttttc aatgatccgc gattaagaag 22380
cagcactctt ttatagccaa aaattacaca tatataaaat tttcctttag aaaatgttct 22440
aaaaatggaa tgtctaacta aagggttagg catacattct taagacttct gatacgcgct 22500
gacttgcagg aaagttgttt cagttaacac tcctaccagc ggcatccgag agttaatctg 22560
taaagcttga gacaacttag aaagtgtttc aaatgattgt gttgcttaag aaaaaaatct 22620
tagcacttcc ttttgaaaag ccagtggggc tgaaaagaca atgacaagca ctttgtccct 22680
ctgtactgtg ttttccttgc agcctggtga gacgagtgga ccggatggag cattccatcg 22740
gcagcatagt gtccaagatt gacgccgtga tcgtgaagct agagattatg gagcgagcca 22800
aactgaagag gagggaggtg ctgggaaggc tgttggatgg ggtggccgag gtcagtagtc 22860
atgagctgaa aacaccgctg ctgagcatgg tgttattaat gaaaatatat gttgctgaca 22920
gttgtatttg aagtattgaa gaagagtaaa aaaaatttac gtttatagaa attcacaatg 22980
atgtttccat ttactctcat tttcagattt ttttctctga aacagaaaca ctctttctat 23040
aaaatctctt gctataaaac atcaatgtag tcatattgtc taacccttag gctgagatgt 23100
ttatctttct ccataactac agataaaatt ataatctgga ggtgttactt tcttaatact 23160
ccatatgcta atggtcctgc cttcactgca gggtagaatt aagtgaaaaa ttactccagc 23220
aactctgaga tttgctatta tatgctgtaa atctccagcc ttaccaaact acagattatt 23280
tggtccctgg acttcctaag gcatttcctt ctactgcccc caacaccagt ttctttttcc 23340
ctttttagga tgaaaggctg ggtcgtgaca gtgaaatcca tagggaacag atggaacggc 23400
tagtacgtga agagttggaa cgctgggaat ccgatgatgc agcttcccag atcagtcatg 23460
gtttaggcac gccagtggga ctaaatggtc aacctcgccc cagaagctcc cgcccatctt 23520
cctcccaatc tacagaaggc atggaaggtg caggtggaaa tgggagttct aatgtccacg 23580
tatgatatgt gtgtttcagt atgtgtgttt ctaataagtg aggaagtggc tgtcctgaat 23640
tgctgtaaca agcacactat ttatatgccc tgaccaccat aggatgctag tctttgtgac 23700
cgattgctaa tcttctgcac tttaatttat tttatataaa ctttacccat ggtt 23754
<210> 244
<211> 5089
<212> DNA
<213> Homo sapiens
<400> 244
aggcggcggc gggcgccggg aagaaaggaa catggctcct gaggcgcaca gcgccgagcg 60
cggcgccgcg cacccgcgcg ccggacgcca gtgaccgcga tggtgaactc cagtcgcgtg 120
cagcctcagc agcccgggga cgccaagcgg ccgcccgcgc cccgcgcgcc ggacccgggc 180
cggctgatgg ctggctgcgc ggccgtgggc gccagcctcg ccgccccggg cggcctctgc 240
gagcagcggg gcctggagat cgagatgcag cgcatccggc aggcggccgc gcgggacccc 300
ccggccggag ccgcggcctc cccttctcct ccgctctcgt cgtgctcccg gcaggcgtgg 360
agccgcgata accccggctt cgaggccgag gaggaggagg aggaggtgga aggggaagaa 420
ggcggaatgg tggtggagat ggacgtagag tggcgcccgg gcagccggag gtcggccgcc 480
tcctcggccg tgagctccgt gggcgcgcgg agccgggggc ttgggggcta ccacggcgcg 540
ggccacccga gcgggaggcg gcgccggcga gaggaccagg gcccgccgtg ccccagccca 600
gtcggcggcg gggacccgct gcatcgccac ctccccctgg aagggcagcc gccccgagtg 660
gcctgggcgg agaggctggt tcgcgggctg cgaggtctct ggggaacaag actcatggag 720
gaaagcagca ctaaccgaga gaaatacctt aaaagtgttt tacgggaact ggtcacatac 780
ctcctttttc tcatagtctt gtgcatcttg acctacggca tgatgagctc caatgtgtac 840
tactacaccc ggatgatgtc acagctcttc ctagacaccc ccgtgtccaa aacggagaaa 900
actaacttta aaactctgtc ttccatggaa gacttctgga agttcacaga aggctcctta 960
ttggatgggc tgtactggaa gatgcagccc agcaaccaga ctgaagctga caaccgaagt 1020
ttcatcttct atgagaacct gctgttaggg gttccacgaa tacggcaact ccgagtcaga 1080
aatggatcct gctctatccc ccaggacttg agagatgaaa ttaaagagtg ctatgatgtc 1140
tactctgtca gtagtgaaga tagggctccc tttgggcccc gaaatggaac cgcttggatc 1200
tacacaagtg aaaaagactt gaatggtagt agccactggg gaatcattgc aacttatagt 1260
ggagctggct attatctgga tttgtcaaga acaagagagg aaacagctgc acaagttgct 1320
agcctcaaga aaaatgtctg gctggaccga ggaaccaggg caacttttat tgacttctca 1380
gtgtacaacg ccaacattaa cctgttctgt gtggtcaggt tattggttga attcccagca 1440
acaggtggtg tgattccatc ttggcaattt cagcctttaa agctgatccg atatgtcaca 1500
acttttgatt tcttcctggc agcctgtgag attatctttt gtttctttat cttttactat 1560
gtggtggaag agatattgga aattcgcatt cacaaactac actatttcag gagtttctgg 1620
aattgtctgg atgttgtgat cgttgtgctg tcagtggtag ctataggaat taacatatac 1680
agaacatcaa atgtggaggt gctactacag tttctggaag atcaaaatac tttccccaac 1740
tttgagcatc tggcatattg gcagatacag ttcaacaata tagctgctgt cacagtattt 1800
tttgtctgga ttaagctctt caaattcatc aattttaaca ggaccatgag ccagctctcg 1860
acaaccatgt ctcgatgtgc caaagacctg tttggctttg ctattatgtt cttcattatt 1920
ttcctagcgt atgctcagtt ggcatacctt gtctttggca ctcaggtcga tgacttcagt 1980
actttccaag agtgtatctt cactcaattc cgtatcattt tgggcgatat caactttgca 2040
gagattgagg aagctaatcg agttttggga ccaatttatt tcactacatt tgtgttcttt 2100
atgttcttca ttcttttgaa tatgtttttg gctatcatca atgatactta ctctgaagtg 2160
aaatctgact tggcacagca gaaagctgaa atggaactct cagatcttat cagaaagggc 2220
taccataaag ctttggtcaa actaaaactg aaaaaaaata ccgtggatga catttcagag 2280
agtctgcggc aaggaggagg caagttaaac tttgacgaac ttcgacaaga tctcaaaggg 2340
aagggccata ctgatgcaga gattgaggca atattcacaa agtacgacca agatggagac 2400
caagaactga ccgaacatga acatcagcag atgagagacg acttggagaa agagagggag 2460
gacctggatt tggatcacag ttctttacca cgtcccatga gcagccgaag tttccctcga 2520
agcctggatg actctgagga ggatgacgat gaagatagcg gacatagctc cagaaggagg 2580
ggaagcattt ctagtggcgt ttcttacgaa gagtttcaag tcctggtgag acgagtggac 2640
cggatggagc attccatcgg cagcatagtg tccaagattg acgccgtgat cgtgaagcta 2700
gagattatgg agcgagccaa actgaagagg agggaggtgc tgggaaggct gttggatggg 2760
gtggccgagg atgaaaggct gggtcgtgac agtgaaatcc atagggaaca gatggaacgg 2820
ctagtacgtg aagagttgga acgctgggaa tccgatgatg cagcttccca gatcagtcat 2880
ggtttaggca cgccagtggg actaaatggt caacctcgcc ccagaagctc ccgcccatct 2940
tcctcccaat ctacagaagg catggaaggt gcaggtggaa atgggagttc taatgtccac 3000
gtatgatatg tgtgtttcag tatgtgtgtt tctaataagt gaggaagtgg ctgtcctgaa 3060
ttgctgtaac aagcacacta tttatatgcc ctgaccacca taggatgcta gtctttgtga 3120
ccgattgcta atcttctgca ctttaattta ttttatataa actttaccca tggttcaaag 3180
attttttttt ctttttctca tataagaaat ctaggtgtaa atattgagta cagaaaaaaa 3240
atcttcatga tgtgtattga gcggtacgcc cagttgccac catgactgag tcttctcagt 3300
tgacaatgaa gtagcctttt aaagctagaa aactgtcaaa gggcttctga gtttcatttc 3360
cagtcacaaa aatcagtatt gttatttttt tccaagagtg tgaaggaaaa tggggcattc 3420
ctttccactc tggcatagtt catgagctta atacatagct ttcttttaag aaaggagcct 3480
tttttttcaa ctagcttcct ggggtaaact tttctaaaag ataaaatgga aaggaactcc 3540
aaactatgat agaatctgtg tgaatggtta agatgaatgt taaatactat gcttttttgt 3600
aagttgatcg tatctgatgt ctgtgggact aactgtatca cttaattttt accttatttt 3660
ggctctaatt tgaataagct gagtaaaacc accaaagatc agttatagga taaaatggca 3720
tctctaacca taacacagga gaattggaag gagccctaag ttgtcactca gtttaatttc 3780
ttttaatggt tagtttagcc taaagattta tctgcatatt ctttttccca tgtggctcta 3840
ctcatttgca actgaattta atgttataac tcatctagtg agaccaactt actaaatttt 3900
tagtatgcac tgaaagtttt tatccaacaa ttatgttcat tttaagcaaa attttaagaa 3960
agttttgaaa ttcataaagc atttggtttt aaactatttt aagaatatag tactcggtca 4020
ggtatgacgg ctcacgcctg taatcccagc actttgggag gccgaaacag gcgaatcact 4080
tgagcccagg agttcaagac caacatgggc aatgtggcga aactccatct ctacaaaaaa 4140
tgcaaaaata aaaaatatag tactcaagta ttcttgatcc tgtgtttcaa aactagaatt 4200
tgtaatgcaa atggagctca gtctaataaa aaagaggttt tggtattaaa agttcataca 4260
ttagacagta tcagccaaaa tttgagttag caacactgtt ttctttacga gagggtctca 4320
cccaaattta tggggagaaa tctatttctc aaaaaaaaaa atcttctttt acagaaatgt 4380
tgagtaaggt gacattttga gcgctaataa gcaaaagagc atgcagtgct gttgaataac 4440
cctcacttgg agaaccaaga gaatcctgtc gtttaatgct atattttaat ttcacaagtt 4500
gttcatttaa ctggtagaat gtcagtccaa tctccaatga gaacatgagc aaatagacct 4560
ttccaggttg aaagtgaaac atactgggtt tctgtaagtt tttcctcatg gcttcatctc 4620
tatctttact ttctcttgaa tatgctacac aaagttcttt attactacat actaaagttt 4680
gcattccagg gatattgact gtacatattt atgtatatgt accatgttgt tacatgtaaa 4740
caaacttcaa tttgaagtgc agctattatg tggtatccat gtgtatcgac catgtgccat 4800
atatcaatta tggtcactag aaagtctctt tatgatactt tttattgtac tgtttttcat 4860
ttcacttgca aaattttgca gaattcctcc tttctaccca taaattacat atatttttct 4920
tctttagtca tggagaactc cccccctcat ctcttcccta ttatctttcc ctgtgtactg 4980
gtattattaa aaagacatta catacgcaag tctttctcga caatcaagaa tgttattaat 5040
gtgtaatact gagcacttta cttcttaata aaaacttgat atagtagca 5089
<210> 245
<211> 1222
<212> DNA
<213> Homo sapiens
<400> 245
atgtcttctc tctcttacag ctcttcaaat tcatcaattt taacaggacc atgagccagc 60
tctcgacaac catgtctcga tgtgccaaag acctgtttgg ctttgctatt atgttcttca 120
ttattttcct agcgtatgct cagttggcat accttgtctt tggcactcag gtcgatgact 180
tcagtacttt ccaagagtgt atcttcactc aattccgtat cattttgggc gatatcaact 240
ttgcagagat tgaggaagct aatcgagttt tgggaccaat ttatttcact acatttgtgt 300
tctttatgtt cttcattctt ttgaatatgt ttttggctat catcaatgat acttactctg 360
aagtgaaatc tgacttggca cagcagaaag ctgaaatgga actctcagat cttatcagaa 420
agggctacca taaagctttg gtcaaactaa aactgaaaaa aaataccgtg gatgacattt 480
cagagagtct gcggcaagga ggaggcaagt taaactttga cgaacttcga caagatctca 540
aagggaaggg ccatactgat gcagagattg aggcaatatt cacaaagtac gaccaagatg 600
gagaccaaga actgaccgaa catgaacatc agcagatgag agacgacttg gagaaagaga 660
gggaggacct ggatttggat cacagttctt taccacgtcc catgagcagc cgaagtttcc 720
ctcgaagcct ggatgactct gaggaggatg acgatgaaga tagcggacat agctccagaa 780
ggaggggaag catttctagt ggcgtttctt acgaagagtt tcaagtcctg gtgagacgag 840
tggaccggat ggagcattcc atcggcagca tagtgtccaa gattgacgcc gtgatcgtga 900
agctagagat tatggagcga gccaaactga agaggaggga ggtgctggga aggctgttgg 960
atggggtggc cgaggatgaa aggctgggtc gtgacagtga aatccatagg gaacagatgg 1020
aacggctagt acgtgaagag ttggaacgct gggaatccga tgatgcagct tcccagatca 1080
gtcatggttt aggcacgcca gtgggactaa atggtcaacc tcgccccaga agctcccgcc 1140
catcttcctc ccaatctaca gaaggcatgg aaggtgcagg tggaaatggg agttctaatg 1200
tccacgtatg atatgtgtgt tt 1222
<210> 246
<211> 693
<212> DNA
<213> Homo sapiens
<400> 246
gaatgatagg ggaaaggaag gcaagggtga gagaagacct tgtgtgaatt tgtccaaaat 60
gtttatccac aggaacaatc cctttgtgaa ggctgctggt atgtgaatgt gtgccggttc 120
ccttggggcg ttcatttgga tctttctgtg ttccagtgac ctacggcatg atgagctcca 180
atgtgtacta ctacacccgg atgatgtcac agctcttcct agacaccccc gtgtccaaaa 240
cggagaaaac taactttaaa actctgtctt ccatggaaga cttctggaag ttcacagaag 300
gctccttatt ggatgggctg tactggaaga tgcagcccag caaccagact gaagctgaca 360
accgaagttt catcttctat gagaacctgc tgttaggggt tccacgaata cggcaactcc 420
gagtcagaaa tggatcctgc tctatccccc aggacttgag agatgaaatt aaagagtgct 480
atgatgtcta ctctgtcagt agtgaagata gggctccctt tgggccccga aatggaaccg 540
cttggatcta cacaagtgaa aaagacttga atggtagtag ccactgggga atcattgcaa 600
cttatagtgg agctggctat tatctggatt tgtcaagaac aagagaggaa acagctgcac 660
aagttgctag cctcaagaaa aatgtctggc tgg 693
<210> 247
<211> 550
<212> DNA
<213> Homo sapiens
<400> 247
ccagtcggcg gcggggaccc gctgcatcgc cacctccccc tggaagggca gccgccccga 60
gtggcctggg cggagaggct ggttcgcggg ctgcgaggtc tctggggaac aagactcatg 120
gaggaaagca gcactaaccg agagaaatac cttaaaagtg ttttacggga actggtcaca 180
tacctccttt ttctcatagt cttgtgcatc tgaacaatcc ctttgtgaag gctgctggta 240
tgtgaatgtg tgccggttcc cttggggcgt tcatttggat ctttctgtgt tccagtgacc 300
tacggcatga tgagctccaa tgtgtactac tacacccgga tgatgtcaca gctcttccta 360
gacacccccg tgtccaaaac ggagaaaact aactttaaaa ctctgtcttc catggaagac 420
ttctggaagt tcacagaagg ctccttattg gatgggctgt actggaagat gcagcccagc 480
aaccagactg aagctgacaa ccgaagtttc atcttctatg agaacctgct gttaggggtt 540
ccacgaatac 550
<210> 248
<211> 1720
<212> DNA
<213> Homo sapiens
<400> 248
aatggtagta gccactgggg aatcattgca acttatagtg gagctggcta ttatctggat 60
ttgtcaagaa caagagagga aacagctgca caagttgcta gcctcaagaa aaatgtctgg 120
ctggaccgag gaaccagggc aacttttatt gacttctcag tgtacaacgc caacattaac 180
ctgttctgtg tggtcagctg tcagtggtag ctataggaat taacatatac agaacatcaa 240
atgtggaggt gctactacag tttctggaag atcaaaatac tttccccaac tttgagcatc 300
tggcatattg gcagatacag ttcaacaata tagctgctgt cacagtattt tttgtctgga 360
ttaagctctt caaattcatc aattttaaca ggaccatgag ccagctctcg acaaccatgt 420
ctcgatgtgc caaagacctg tttggctttg ctattatgtt cttcattatt ttcctagcgt 480
atgctcagtt ggcatacctt gtctttggca ctcaggtcga tgacttcagt actttccaag 540
agtgtatctt cactcaattc cgtatcattt tgggcgatat caactttgca gagattgagg 600
aagctaatcg agttttggga ccaatttatt tcactacatt tgtgttcttt atgttcttca 660
ttcttttgaa tatgtttttg gctatcatca atgatactta ctctgaagtg aaatctgact 720
tggcacagca gaaagctgaa atggaactct cagatcttat cagaaagggc taccataaag 780
ctttggtcaa actaaaactg aaaaaaaata ccgtggatga catttcagag agtctgcggc 840
aaggaggagg caagttaaac tttgacgaac ttcgacaaga tctcaaaggg aagggccata 900
ctgatgcaga gattgaggca atattcacaa agtacgacca agatggagac caagaactga 960
ccgaacatga acatcagcag atgagagacg acttggagaa agagagggag gacctggatt 1020
tggatcacag ttctttacca cgtcccatga gcagccgaag tttccctcga agcctggatg 1080
actctgagga ggatgacgat gaagatagcg gacatagctc cagaaggagg ggaagcattt 1140
ctagtggcgt ttcttacgaa gagtttcaag tcctggtgag acgagtggac cggatggagc 1200
attccatcgg cagcatagtg tccaagattg acgccgtgat cgtgaagcta gagattatgg 1260
agcgagccaa actgaagagg agggaggtgc tgggaaggct gttggatggg gtggccgagg 1320
atgaaaggct gggtcgtgac agtgaaatcc atagggaaca gatggaacgg ctagtacgtg 1380
aagagttgga acgctgggaa tccgatgatg cagcttccca gatcagtcat ggtttaggca 1440
cgccagtggg actaaatggt caacctcgcc ccagaagctc ccgcccatct tcctcccaat 1500
ctacagaagg catggaaggt gcaggtggaa atgggagttc taatgtccac gtatgatatg 1560
tgtgtttcag tatgtgtgtt tctaataagt gaggaagtgg ctgtcctgaa ttgctgtaac 1620
aagcacacta tttatatgcc ctgaccacca taggatgcta gtctttgtga ccgattgcta 1680
atcttctgca ctttaattta ttttatataa actttaccca 1720
<210> 249
<211> 1362
<212> DNA
<213> Homo sapiens
<400> 249
atactttccc caactttgag catctggcat attggcagat acagttcaac aatatagctg 60
ctgtcacagt attttttgtc tggattaagc tcttcaaatt catcaatttt aacaggacca 120
tgagccagct ctcgacaacc atgtctcgat gtgccaaaga cctgtttggc tttgctatta 180
tgttcttcat tattttccta gcgtatgctc agttggcata ccttgtcttt ggcactcagg 240
tcgatgactt cagtactttc caagagtgta taatatgttt ttggctatca tcaatgatac 300
ttactctgaa gtgaaatctg acttggcaca gcagaaagct gaaatggaac tctcagatct 360
tatcagaaag ggctaccata aagctttggt caaactaaaa ctgaaaaaaa ataccgtgga 420
tgacatttca gagagtctgc ggcaaggagg aggcaagtta aactttgacg aacttcgaca 480
agatctcaaa gggaagggcc atactgatgc agagattgag gcaatattca caaagtacga 540
ccaagatgga gaccaagaac tgaccgaaca tgaacatcag cagatgagag acgacttgga 600
gaaagagagg gaggacctgg atttggatca cagttcttta ccacgtccca tgagcagccg 660
aagtttccct cgaagcctgg atgactctga ggaggatgac gatgaagata gcggacatag 720
ctccagaagg aggggaagca tttctagtgg cgtttcttac gaagagtttc aagtcctggt 780
gagacgagtg gaccggatgg agcattccat cggcagcata gtgtccaaga ttgacgccgt 840
gatcgtgaag ctagagatta tggagcgagc caaactgaag aggagggagg tgctgggaag 900
gctgttggat ggggtggccg aggatgaaag gctgggtcgt gacagtgaaa tccataggga 960
acagatggaa cggctagtac gtgaagagtt ggaacgctgg gaatccgatg atgcagcttc 1020
ccagatcagt catggtttag gcacgccagt gggactaaat ggtcaacctc gccccagaag 1080
ctcccgccca tcttcctccc aatctacaga aggcatggaa ggtgcaggtg gaaatgggag 1140
ttctaatgtc cacgtatgat atgtgtgttt cagtatgtgt gtttctaata agtgaggaag 1200
tggctgtcct gaattgctgt aacaagcaca ctatttatat gccctgacca ccataggatg 1260
ctagtctttg tgaccgattg ctaatcttct gcactttaat ttattttata taaactttac 1320
ccatggttca aagatttttt tttctttttc tcatataaga aa 1362
<210> 250
<211> 1554
<212> DNA
<213> Homo sapiens
<400> 250
acagttcaac aatatagctg ctgtcacagt attttttgtc tggattaagc tcttcaaatt 60
catcaatttt aacaggacca tgagccagct ctcgacaacc atgtctcgat gtgccaaaga 120
cctgtttggc tttgctatta tgttcttcat tattttccta gcgtatgctc agttggcata 180
ccttgtcttt ggcactcagg tcgatgactt cagtactttc caagagtgta taatatgttt 240
ttggctatca tcaatgatac ttactctgaa gtgaaatctg acttggcaca gcagaaagct 300
gaaatggaac tctcagatct tatcagaaag ggctaccata aagctttggt caaactaaaa 360
ctgaaaaaaa ataccgtgga tgacatttca gagagtctgc ggcaaggagg aggcaagtta 420
aactttgacg aacttcgaca agatctcaaa gggtgagaat catgcttcct gaggttctga 480
aaaattcctg cttctaaaga taaattcctg gtgataagag tatttctagc ccaagggctc 540
atacagatac tttttttttt tttttccaga ggcaggtatc tttctggaac atgttataag 600
aggaaaactt gcccccattt ggtgatttct cctttcctcc tgcattttga tgtctctgtg 660
ttgagggtga actgggtaca aggaatgatt tttatctgta tcctctctct aatttcagga 720
agggccatac tgatgcagag attgaggcaa tattcacaaa gtacgaccaa gatggagacc 780
aagaactgac cgaacatgaa catcagcaga tgagagacga cttggagaaa gagagggagg 840
acctggattt ggatcacagt tctttaccac gtcccatgag cagccgaagt ttccctcgaa 900
gcctggatga ctctgaggag gatgacgatg aagatagcgg acatagctcc agaaggaggg 960
gaagcatttc tagtggcgtt tcttacgaag agtttcaagt cctggtgaga cgagtggacc 1020
ggatggagca ttccatcggc agcatagtgt ccaagattga cgccgtgatc gtgaagctag 1080
agattatgga gcgagccaaa ctgaagagga gggaggtgct gggaaggctg ttggatgggg 1140
tggccgagga tgaaaggctg ggtcgtgaca gtgaaatcca tagggaacag atggaacggc 1200
tagtacgtga agagttggaa cgctgggaat ccgatgatgc agcttcccag atcagtcatg 1260
gtttaggcac gccagtggga ctaaatggtc aacctcgccc cagaagctcc cgcccatctt 1320
cctcccaatc tacagaaggc atggaaggtg caggtggaaa tgggagttct aatgtccacg 1380
tatgatatgt gtgtttcagt atgtgtgttt ctaataagtg aggaagtggc tgtcctgaat 1440
tgctgtaaca agcacactat ttatatgccc tgaccaccat aggatgctag tctttgtgac 1500
cgattgctaa tcttctgcac tttaatttat tttatataaa ctttacccat ggtt 1554
<210> 251
<211> 99
<212> DNA
<213> Homo sapiens
<400> 251
aggcggcggc gggcgccggg aagaaaggaa catggctcct gaggcgcaca gcgccgagcg 60
cggcgccgcg cacccgcgcg ccggacgcca gtgaccgcg 99
<210> 252
<211> 341
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 252
cccacaucgc cugccacuac uuaaguccga uucacuucgg cuuuagcucc aagccuuuaa 60
ucucgcgaag cucuuuuuuu uuuuuuaaca acauaggagc ugugauuggc uguuuucagc 120
caaucagcac ugacucauuu gcauagccuu uacaagcggu cacaaacuca agaaacgagc 180
gguuuuaaua gucuuuuaga auauuguuua ucgaaccgaa uaaggaacug ugcuuuguga 240
uucacauauc aguggagggg uguggaaaug gcaccuugau cucacccuca ucgaaagugg 300
aguugauguc cuucccuggc ucgcuacaga cgcacuuccg c 341
<210> 253
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 253
aaguguuaca gcucuuuuag 20
<210> 254
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 254
aauuugucua gcagguuuuc ugacuucggu cggaaaaccc cu 42
<210> 255
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 255
aauuuuugga gcagguuuuc ugacuucggu cggaaaaccc cu 42
<210> 256
<211> 168
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 256
cccaauuuca cuggucuaca augaaagcaa aacaguucuc uuccccgcuc cccggugugu 60
gagaggggcu uugauccuuc ucugguuucc uaggaaacgc guaugugcua gagccacgcu 120
cugagacuuc cgccucgugc ggucccgcuu ccuuucugcc uccucugg 168
<210> 257
<211> 571
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 257
cccacaucgc cugccacuac uuaaguccga uucacuucgg cuuuagcucc aagccuuuaa 60
ucucgcgaag cucuuuuuuu uuuuuuaaca acauaggagc ugugauuggc uguuuucagc 120
caaucagcac ugacucauuu gcauagccuu uacaagcggu cacaaacuca agaaacgagc 180
gguuuuaaua gucuuuuaga auauuguuua ucgaaccgaa uaaggaacug ugcuuuguga 240
uucacauauc aguggagggg uguggaaaug gcaccuugau cucacccuca ucgaaagugg 300
aguugauguc cuucccuggc ucgcuacaga cgcacuuccg caaguguuac agcucuuuua 360
gaauuugucu agcagguuuu cugacuucgg ucggaaaacc ccucccaauu ucacuggucu 420
acaaugaaag caaaacaguu cucuuccccg cuccccggug ugugagaggg gcuuugaucc 480
uucucugguu uccuaggaaa cgcguaugug cuagagccac gcucugagac uuccgccucg 540
ugcggucccg cuuccuuucu gccuccucug g 571
<210> 258
<211> 571
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 258
cccacaucgc cugccacuac uuaaguccga uucacuucgg cuuuagcucc aagccuuuaa 60
ucucgcgaag cucuuuuuuu uuuuuuaaca acauaggagc ugugauuggc uguuuucagc 120
caaucagcac ugacucauuu gcauagccuu uacaagcggu cacaaacuca agaaacgagc 180
gguuuuaaua gucuuuuaga auauuguuua ucgaaccgaa uaaggaacug ugcuuuguga 240
uucacauauc aguggagggg uguggaaaug gcaccuugau cucacccuca ucgaaagugg 300
aguugauguc cuucccuggc ucgcuacaga cgcacuuccg caaguguuac agcucuuuua 360
gaauuuuugg agcagguuuu cugacuucgg ucggaaaacc ccucccaauu ucacuggucu 420
acaaugaaag caaaacaguu cucuuccccg cuccccggug ugugagaggg gcuuugaucc 480
uucucugguu uccuaggaaa cgcguaugug cuagagccac gcucugagac uuccgccucg 540
ugcggucccg cuuccuuucu gccuccucug g 571
<210> 259
<211> 210
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 259
aauuuuugga gcagguuuuc ugacuucggu cggaaaaccc cucccaauuu cacuggucua 60
caaugaaagc aaaacaguuc ucuuccccgc uccccggugu gugagagggg cuuugauccu 120
ucucugguuu ccuaggaaac gcguaugugc uagagccacg cucugagacu uccgccucgu 180
gcggucccgc uuccuuucug ccuccucugg 210
<210> 260
<211> 569
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 260
cccacaucgc cugccacuac uuaaguccga uucacuucgg cuuuagcucc aagccuuuaa 60
ucucgcgaag cucuuuuuuu uuuuuuaaca acauaggagc ugugauuggc uguuuucagc 120
caaucagcac ugacucauuu gcauagccuu uacaagcggu cacaaacuca agaaacgagc 180
gguuuuaaua gucuuuuaga auauuguuua ucgaaccgaa uaaggaacug ugcuuuguga 240
uucacauauc aguggagggg uguggaaaug gcaccuugau cucacccuca ucgaaagugg 300
aguugauguc cuucccuggc ucgcuacaga cgcacuuccg cguacuuuca aaguuauuua 360
auuuuuggag cagguuuucu gacuucgguc ggaaaacccc ucccaauuuc acuggucuac 420
aaugaaagca aaacaguucu cuuccccgcu ccccggugug ugagaggggc uuugauccuu 480
cucugguuuc cuaggaaacg cguaugugcu agagccacgc ucugagacuu ccgccucgug 540
cggucccgcu uccuuucugc cuccucugg 569
<210> 261
<211> 569
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 261
cccacaucgc cugccacuac uuaaguccga uucacuucgg cuuuagcucc aagccuuuaa 60
ucucgcgaag cucuuuuuuu uuuuuuaaca acauaggagc ugugauuggc uguuuucagc 120
caaucagcac ugacucauuu gcauagccuu uacaagcggu cacaaacuca agaaacgagc 180
gguuuuaaua gucuuuuaga auauuguuua ucgaaccgaa uaaggaacug ugcuuuguga 240
uucacauauc aguggagggg uguggaaaug gcaccuugau cucacccuca ucgaaagugg 300
aguugauguc cuucccuggc ucgcuacaga cgcacuuccg cauaaaucga accaucguaa 360
auuuuuggag cagguuuucu gacuucgguc ggaaaacccc ucccaauuuc acuggucuac 420
aaugaaagca aaacaguucu cuuccccgcu ccccggugug ugagaggggc uuugauccuu 480
cucugguuuc cuaggaaacg cguaugugcu agagccacgc ucugagacuu ccgccucgug 540
cggucccgcu uccuuucugc cuccucugg 569
<210> 262
<211> 569
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 262
cccacaucgc cugccacuac uuaaguccga uucacuucgg cuuuagcucc aagccuuuaa 60
ucucgcgaag cucuuuuuuu uuuuuuaaca acauaggagc ugugauuggc uguuuucagc 120
caaucagcac ugacucauuu gcauagccuu uacaagcggu cacaaacuca agaaacgagc 180
gguuuuaaua gucuuuuaga auauuguuua ucgaaccgaa uaaggaacug ugcuuuguga 240
uucacauauc aguggagggg uguggaaaug gcaccuugau cucacccuca ucgaaagugg 300
aguugauguc cuucccuggc ucgcuacaga cgcacuuccg cuuucuuccc ggcgcccgca 360
auuuuuggag cagguuuucu gacuucgguc ggaaaacccc ucccaauuuc acuggucuac 420
aaugaaagca aaacaguucu cuuccccgcu ccccggugug ugagaggggc uuugauccuu 480
cucugguuuc cuaggaaacg cguaugugcu agagccacgc ucugagacuu ccgccucgug 540
cggucccgcu uccuuucugc cuccucugg 569
<210> 263
<211> 121
<212> DNA
<213> Homo sapiens
<400> 263
ttacgatggt tcgatttatg atttttcaac ttcatggtga tgtgaaagtg atacacattc 60
tatagaaacc acactttcaa ttttgaattt tggtcttttt ccaggctacc atactctaaa 120
g 121
<210> 264
<211> 94
<212> DNA
<213> Homo sapiens
<400> 264
tggtcttttt ccaggctacc atactctaaa gatagagcca cagatcccag tcagccatgt 60
gattatgagg gtaagcgacc aatactctac agtg 94
<210> 265
<211> 116
<212> DNA
<213> Homo sapiens
<400> 265
gattatgagg gtaagcgacc aatactctac agtgtattgt attgccagat ggttttgccc 60
aactagccta atgtaagtat tctaaacatg tttaaggtag gccaggctaa gctgtg 116
<210> 266
<211> 108
<212> DNA
<213> Homo sapiens
<400> 266
ggaaggtatt tgcaaataac tttgaaagta cctctctatc acagaaaatt gttcatttgg 60
cttcatcatt tcaatgcatg agtatcgaca ggacctgctt tgcattta 108
<210> 267
<211> 97
<212> DNA
<213> Homo sapiens
<400> 267
acctgctttg catttaacac tgtgtgagac gtaagttatg gtgagttgtt agaagttact 60
gttcctactc tcaaaggggg taaactaaca ttgagaa 97
<210> 268
<211> 102
<212> DNA
<213> Homo sapiens
<400> 268
aaactaacat tgagaacttt gcctgtgcct tgcactgtgc tgagtgtttc atatcttacc 60
ttatttaatt tctatagtct aactctataa ggtaagtact aa 102
<210> 269
<211> 150
<212> DNA
<213> Homo sapiens
<400> 269
aaggtatttg caaataactt tgaaagtacc tctctatcac agaaaattgt tcatttggct 60
tcatcatttc aatgcatgag tatcgacagg acctgctttg catttaacac tgtgtgagac 120
gtaagttatg gtgagttgtt agaagttact 150
<210> 270
<211> 146
<212> DNA
<213> Homo sapiens
<400> 270
tatggtgagt tgttagaagt tactgttcct actctcaaag ggggtaaact aacattgaga 60
actttgcctg tgccttgcac tgtgctgagt gtttcatatc ttaccttatt taatttctat 120
agtctaactc tataaggtaa gtacta 146
<210> 271
<211> 98
<212> DNA
<213> Homo sapiens
<400> 271
ggcggcgggc gccgggaaga aaggaacatg gctcctgagg cgcacagcgc cgagcgcggc 60
gccgcgcacc cgcgcgccgg acgccagtga ccgcgatg 98
Claims (184)
- 표적 유전자로부터 전사되고 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)을 포함하는 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는 방법으로서, 제제 또는 이 제제를 인코딩하는 벡터를 세포에 접촉시켜, 제제가 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절하는 단계, 및 세포에서 PKD2 유전자에 의해 인코딩되는 표적 단백질의 발현을 조절하는 단계를 포함하는, 방법.
- 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법으로서, 제제 또는 이 제제를 인코딩하는 벡터를 대상체의 세포에 접촉시켜, 제제가 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터의 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절하는 단계, 및 세포에서 PKD2 유전자에 의해 인코딩되는 표적 단백질의 발현을 조절하는 단계를 포함하는, 방법.
- 제1항 또는 제2항에 있어서, 표적 단백질은 폴리시스틴 2인, 방법.
- 제2항에 있어서, 질환 또는 병태는 폴리시스틴 2의 양 또는 활성의 결핍과 연관된 질환 또는 병태인, 방법.
- 제2항에 있어서, 질환 또는 병태는 폴리시스틴 1의 양 또는 활성의 결핍과 연관된 질환 또는 병태인, 방법.
- 제3항에 있어서, 질환 또는 병태는 폴리시스틴 2가 기능적으로 증강, 보상, 대체 또는 기능적으로 상호작용하는 단백질의 양 또는 활성의 결핍과 연관된 질환 또는 병태인, 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 제제는 하기인, 방법:
(a) 프리-mRNA의 표적화 부분에 결합함;
(b) NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 조절함; 또는
(c) (a)와 (b)의 조합. - 제7항에 있어서, 제제는 NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 방해하는, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손에 근접한 것인, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 말단의 업스트림(upstream)에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 말단의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드인, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단의 다운스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단의 다운스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드인, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위의 다운스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위의 다운스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 프리-mRNA의 2개의 정규 엑손 영역 사이의 인트론 영역에 위치하고, 인트론 영역은 NMD 엑손을 함유하는, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손과 적어도 부분적으로 중첩되는, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손의 업스트림 또는 다운스트림 인트론과 적어도 부분적으로 중첩되는, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 5' NMD 엑손-인트론 접합 또는 3' NMD 엑손-인트론 접합을 포함하는, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손 내에 있는, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함하는, 방법.
- 제1항 내지 제23항 중 어느 한 항에 있어서, NMD 엑손은 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90% 또는 100% 서열 동일성을 갖는 서열을 포함하는, 방법.
- 제1항 내지 제23항 중 어느 한 항에 있어서, NMD 엑손은 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 방법.
- 제7항에 있어서, 프리-mRNA는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함하는, 방법.
- 제7항에 있어서, 프리-mRNA는 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩되는, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함하는, 방법.
- 제7항에 있어서, 제제는 안티센스 올리고머(ASO)이고, ASO는 표 4 또는 표 5에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18개의 연속 핵산에 대해 적어도 약 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성인 서열을 포함하는, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085-88031140내에 있는 것인, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085-88031140의 업스트림 또는 다운스트림인, 방법.
- 제7항에 있어서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085 88031140의 엑손-인트론 접합부를 포함하는, 방법.
- 제3항에 있어서, 프로세싱된 mRNA로부터 발현되는 폴리시스틴 2는 전장 폴리시스틴 2 또는 야생형 폴리시스틴 2인, 방법.
- 제3항에 있어서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적인 것인, 방법.
- 제3항에 있어서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적인 것인, 방법.
- 제1항 내지 제35항 중 어느 한 항에 있어서, 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절하고 프리-mRNA로부터 NMD 엑손의 배제를 촉진함으로써, 프리-mRNA로부터 프로세싱되고 NMD 엑손이 결여된 프로세싱된 mRNA의 수준을 조절하는, 방법.
- 제36항에 있어서, 제제와 접촉된 세포에서 프리-mRNA로부터의 NMD 엑손의 배제는 대조군 세포에서 프리-mRNA로부터의 NMD 엑손의 배제에 비해 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가되는, 방법.
- 제1항 내지 제37항 중 어느 한 항에 있어서, 세포에서 프로세싱된 mRNA의 수준을 증가시키는, 방법.
- 제38항에 있어서, 제제와 접촉된 세포에서 프로세싱된 mRNA의 수준은 대조군 세포에서 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가되는, 방법.
- 제1항 내지 제37항 중 어느 한 항에 있어서, 제제는 세포에서 표적 단백질의 발현을 증가시키는, 방법.
- 제40항에 있어서, 표적 단백질의 수준은 대조군 세포에서 생산된 표적 단백질의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가되는, 방법.
- 제1항 내지 제41항 중 어느 한 항에 있어서, NMD 엑손은 조기 종결 코돈(PTC)을 포함하는, 방법.
- 제2항에 있어서, 질환 또는 병태는 표적 유전자 또는 표적 단백질의 기능 상실 돌연변이와 연관된 것인, 방법.
- 제43항에 있어서, 질환 또는 병태는 표적 유전자의 반가불충분성(haploinsufficiency)과 연관되고, 대상체는 기능성 폴리시스틴 2를 인코딩하는 제1 대립유전자 및 폴리시스틴 2가 생산되지 않거나 감소된 수준으로 생산되는 제2 대립유전자, 또는 비기능성 폴리시스틴 2 또는 부분적 기능성 폴리시스틴 2를 인코딩하는 제2 대립유전자를 가지는, 방법.
- 제44항에 있어서, 하나 또는 둘 모두의 대립유전자는 하이포모르프이거나 부분적으로 기능적인 것인, 방법.
- 제2항 또는 제44항에 있어서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택되는, 방법.
- 제2항 또는 제43항에 있어서, 질환 또는 병태는 PKD1 또는 PKD2 유전자의 돌연변이와 연관되고, 대상체는,
하기 표적 단백질을 인코딩하는 제1 대립유전자:
(i) 표적 단백질은 생산되지 않거나 야생형 대립유전자에 비해 감소된 수준으로 생산됨; 또는
(ii) 생산된 표적 단백질은 야생형 대립유전자에 비해 비기능적이거나 부분적으로 기능적임, 및
하기 표적 단백질을 인코딩하는 제2 대립유전자를 갖는 방법:
(iii) 표적 단백질은 야생형 대립유전자에 비해 감소된 수준으로 생산되고 생산된 표적 단백질은 야생형 대립유전자에 비해 적어도 부분적으로 기능적임; 또는
(iv) 생산된 표적 단백질은 야생형 대립유전자에 비해 부분적으로 기능적임. - 제47항에 있어서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택되는, 방법.
- 제47항에 있어서, 돌연변이는 하이포모르픽(hypomorphic) 돌연변이인, 방법.
- 제47항에 있어서, 질환 또는 병태는 PKD2 유전자의 돌연변이와 연관된 것인, 방법.
- 제47항에 있어서, 질환 또는 병태는 PKD1 유전자의 돌연변이와 연관된 것인, 방법.
- 제43항에 있어서, 제제는 프리-mRNA로부터 NMD 엑손의 배제를 촉진함으로써, 프리-mRNA로부터 프로세싱되고 NMD 엑손이 결여된 프로세싱된 mRNA의 수준을 조절하고 세포의 표적 단백질의 발현을 증가시키는, 방법.
- 제1항 또는 제2항에 있어서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함하는, 방법.
- 제1항 또는 제2항에 있어서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 포스포로디아미데이트 모폴리노, 잠금 핵산, 펩티드 핵산, 2'-O-메틸, 2'-플루오로, 또는 2'-O-메톡시에틸 모이어티를 포함하는, 방법.
- 제1항 또는 제2항에 있어서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 적어도 하나의 변형된 당 모이어티를 포함하는, 방법.
- 제55항에 있어서, 각각의 당 모이어티는 변형된 당 모이어티인, 방법.
- 제1항 또는 제2항에 있어서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어지는, 방법.
- 제7항에 있어서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 프리-mRNA의 표적화 부분에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적인 것인, 방법.
- 제1항 또는 제2항에 있어서, 제제를 인코딩하는 벡터를 세포에 접촉시키는 단계를 포함하는, 방법.
- 제59항에 있어서, 제제는 안티센스 올리고머를 포함하는 폴리뉴클레오티드인, 방법.
- 제59항에 있어서, 벡터는 바이러스 벡터인, 방법.
- 제61항에 있어서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터인, 조성물.
- 제59항에 있어서, 폴리뉴클레오티드는 변형된 snRNA를 추가로 포함하는, 방법.
- 제63항에 있어서, 변형된 인간 snRNA는 변형된 U1 snRNA 또는 변형된 U7 snRNA인, 방법.
- 제63항에 있어서, 변형된 인간 snRNA는 변형된 U7 snRNA이고 안티센스 올리고머는 표 4 또는 표 5에 열거된 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 갖는, 방법.
- 제1항 또는 제2항에 있어서, 표적 단백질의 프로세싱된 mRNA 수준 또는 발현 수준을 평가하는 단계를 추가로 포함하는, 방법.
- 제2항에 있어서, 대상체는 인간인, 방법.
- 제2항에 있어서, 대상체는 비-인간 동물인, 방법.
- 제2항에 있어서, 대상체는 태아, 배아 또는 아동인, 방법.
- 제1항 또는 제2항에 있어서, 세포는 생체 외인 것인, 방법.
- 제2항에 있어서, 제제는 대상체의 척수강내 주사, 뇌실심내 주사, 복강내 주사, 근육내 주사, 피하 주사, 유리체내 또는 정맥내 주사에 의해 투여되는, 방법.
- 제2항에 있어서, 대상체에게 제2 치료제를 투여하는 단계를 추가로 포함하는, 방법.
- 제72항에 있어서, 제2 치료제는 소분자인, 방법.
- 제72항에 있어서, 제2 치료제는 안티센스 올리고머인, 방법.
- 제72항에 있어서, 제2 치료제는 인트론 체류를 수정하는 것인, 방법.
- 제1항 내지 제75항 중 어느 한 항에 있어서, 방법은 넌센스 매개 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터를 세포에 접촉시키는 단계를 추가로 포함하고, 프리-mRNA는 정규 5' 스플라이스 부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 표적 단백질의 발현을 조절함으로써 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2인, 방법.
- 제1항 내지 제76항 중 어느 한 항에 있어서, 질환 또는 병태를 치료하는, 방법.
- 조성물로서, 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고, 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는, 제제 또는 상기 제제를 인코딩하는 벡터를 포함하며, 표적 단백질은 PKD2 유전자에 의해 인코딩되는, 조성물.
- 조성물로서, 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요한 대상체에서 질환 또는 병태를 치료하는, 제제 또는 상기 제제를 인코딩하는 벡터를 포함하며, 표적 단백질은 PKD2 유전자에 의해 인코딩되는, 조성물.
- 제78항 또는 제79항의 조성물; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는, 약제학적 조성물.
- 넌센스 매개된 RNA 붕괴 대체 스플라이스-부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터를 포함하는 조성물로서, 제제는 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하고, 프리-mRNA는 정규 5' 스플라이스-부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2인, 방법.
- 제81항에 있어서, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 방지하거나 감소시킴으로써 프리-mRNA의 프로세싱을 조절하는, 조성물.
- 제81항 또는 제82항에 있어서, 제제는 정규 5' 스플라이스-부위에서 스플라이싱을 촉진하거나 증가시킴으로써 프리-mRNA의 프로세싱을 조절하는, 조성물.
- 제81항에 있어서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱을 조절하는 것은 세포에서 표적 단백질의 발현을 증가시키는, 조성물.
- 제81항 내지 제84항 중 어느 한 항에 있어서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산된 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함하는, 조성물.
- 제81항 내지 제85항 중 어느 한 항에 있어서, 제제는 소분자인, 조성물.
- 제81항 내지 제85항 중 어느 한 항에 있어서, 제제는 폴리펩티드인, 조성물.
- 제87항에 있어서, 폴리펩티드는 핵산 결합 단백질인, 조성물.
- 제88항에 있어서, 핵산 결합 단백질은 TAL-이펙터 또는 징크 핑거 결합 도메인을 함유하는, 조성물.
- 제88항에 있어서, 핵산 결합 단백질은 Cas 계열 단백질인, 조성물.
- 제88항에 있어서, 폴리펩티드는 하나 이상의 핵산 분자를 수반하거나 또는 이와 복합화되는 것인, 조성물.
- 제81항 내지 제85항 중 어느 한 항에 있어서, 제제는 프리-mRNA의 표적화 영역에 상보적인 안티센스 올리고머(ASO)인, 조성물.
- 제92항에 있어서, 제제는 표적 단백질을 인코딩하는 프리-mRNA의 표적화 영역에 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적인, 조성물.
- 제92항 또는 제93항에 있어서, 제제는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함하는, 조성물.
- 제92항 내지 제94항 중 어느 한 항에 있어서, 제제는 포스포로디아미데이트 모폴리노를 포함하는, 조성물.
- 제92항 내지 제95항 중 어느 한 항에 있어서, 제제는 잠금 핵산을 포함하는, 조성물.
- 제92항 내지 제96항 중 어느 한 항에 있어서, 제제는 펩티드 핵산을 포함하는, 조성물.
- 제92항 내지 제96항 중 어느 한 항에 있어서, 제제는 2'-O-메틸을 포함하는, 조성물.
- 제92항 내지 제98항 중 어느 한 항에 있어서, 제제는 2'-플루오로, 또는 2'-O-메톡시에틸 모이어티를 포함하는, 조성물.
- 제92항 내지 제99항 중 어느 한 항에 있어서, 제제는 적어도 하나의 변형된 당 모이어티를 포함하는, 조성물.
- 제100항에 있어서, 각각의 당 모이어티는 변형된 당 모이어티인, 조성물.
- 제81항 내지 제85항 또는 제92항 내지 제101항 중 어느 한 항에 있어서, 제제는 안티센스 올리고머이고, 제제는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어지는, 조성물.
- 제78항, 제79항 및 제81항 중 어느 한 항에 있어서, 조성물이 제제를 인코딩하는 벡터를 포함하는, 조성물.
- 제103항에 있어서, 제제는 안티센스 올리고머를 포함하는 폴리뉴클레오티드인, 방법.
- 제103항에 있어서, 벡터는 바이러스 벡터인, 방법.
- 제105항에 있어서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터인, 조성물.
- 제103항에 있어서, 폴리뉴클레오티드는 변형된 snRNA를 추가로 포함하는, 조성물.
- 제107항에 있어서, 변형된 인간 snRNA는 변형된 U1 snRNA 또는 변형된 U7 snRNA인, 조성물.
- 제107항에 있어서, 변형된 인간 snRNA는 변형된 U7 snRNA이고 안티센스 올리고머는 표 4 또는 표 5에 열거된 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 갖는, 조성물.
- 제81항 내지 제85항 또는 제87항 내지 제109항 중 어느 한 항의 조성물에 따른 제제를 인코딩하는 핵산 분자를 포함하는, 조성물.
- 제110항에 있어서, 핵산 분자는 바이러스 전달 시스템에 혼입되는 것인, 조성물.
- 제111항에 있어서, 바이러스 전달 시스템은 아데노바이러스 연관 벡터인, 조성물.
- 제81항에 있어서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터인, 조성물.
- 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 방법으로서, 상기 방법은 넌센스 매개 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터를 세포에 접촉시키는 단계를 포함하고, 프리-mRNA는 정규 5' 스플라이스 부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 표적 단백질의 발현을 조절함으로써 프리-mRNA의 프로세싱을 조절하고; 그리고
여기서 표적 유전자는 PKD2인, 방법. - 제114항에 있어서, 제제는 하기인, 방법:
(a) 프리-mRNA의 표적화 부분에 결합함;
(b) 대체 5' 스플라이스-부위에서 스플라이싱에 관여하는 인자의 결합을 조절함; 또는
(c) (a)와 (b)의 조합. - 제115항에 있어서, 제제는 대체 5' 스플라이스-부위에서 스플라이싱에 관여하는 인자가 표적화 부분의 영역에 결합하는 것을 방해하는, 방법.
- 제115항 또는 제116항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에 근접한 것인, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드인, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 다운스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 다운스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드인, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4 88036480의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480 업스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드인, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4 88036480의 게놈 부위의 다운스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480 유전자 부위의 다운스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드인, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 정규 5' 스플라이스-부위와 대체 5' 스플라이스-부위 사이의 영역에 위치하는, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역에 위치하는, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위와 적어도 부분적으로 중첩되는, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림 또는 다운스트림 영역과 적어도 부분적으로 중첩되는, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역 내에 있는, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함하는, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 2개의 정규 엑손 사이의 인트론 영역에 위치하는, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 2개의 정규 엑손 중 하나에 위치하는, 방법.
- 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 인트론 및 정규 엑손 모두에 걸친 영역에 위치하는, 방법.
- 제114항에 있어서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가되는, 방법.
- 제114항 내지 제135항 중 어느 한 항에 있어서, 프리-mRNA의 스플라이싱의 조절은 표적 단백질을 인코딩하는 프로세싱된 mRNA의 생산을 증가시키는, 방법.
- 제136항에 있어서, 제제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가되는, 방법.
- 제114항 내지 제137항 중 어느 한 항에 있어서, 표적 단백질은 단백질의 정규 동형인, 방법.
- 제114항 내지 제138항 중 어느 한 항에 있어서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산된 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함하는, 방법.
- 제114항 내지 제139항 중 어느 한 항에 있어서, 방법은 제2 제제 또는 이 제2 제제를 인코딩하는 벡터를 세포에 접촉시키는 단계를 추가로 포함하고, 프리-mRNA는 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)을 포함하여, 이로써 제2 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절하고, 이로써 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고, 세포에서 표적 단백질의 발현을 조절하고, 표적 단백질은 PKD2 유전자에 의해 인코딩되는, 방법.
- 제114항 내지 제140항 중 어느 한 항에 있어서, NSASS 조절제가 제81항 내지 제113항 중 어느 한 항의 조성물인, 방법.
- 제81항 내지 제113항 중 어느 한 항의 조성물; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는, 약제학적 조성물.
- 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법으로서, 방법은 약제학적 조성물을 필요로 하는 대상체에게 투여하는 단계를 포함하고, 약제학적 조성물은 넌센스 매개 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터를 포함하는 조성물; 및 약제학적으로 허용되는 부형제를 포함하고, 제제는 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하고,
여기서 프리-mRNA는 정규 5' 스플라이스-부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 대안적으로 스플라이싱된 mRNA의 넌센스 매개 RNA 붕괴를 초래하고, 제제는 대체 5' 스플라이스 부위에서 스플라이싱을 조절함으로써 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2인, 방법. - 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법으로서, 제81항의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는, 방법.
- 제143항 또는 제144항에 있어서, 질환은 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 또는 두개내 동맥류인, 방법.
- 제143항 또는 제144항에 있어서, 질환 또는 병태는 폴리시스틴 2의 양 또는 활성의 결핍과 연관된 질환 또는 병태인, 방법.
- 제143항 또는 제144항에 있어서, 질환 또는 병태는 폴리시스틴 1의 양 또는 활성의 결핍과 연관된 질환 또는 병태인, 방법.
- 제143항 또는 제144항에 있어서, 질환 또는 병태는 폴리시스틴 2가 기능적으로 증강, 보상, 대체 또는 기능적으로 상호작용하는 단백질의 양 또는 활성의 결핍과 연관된 질환 또는 병태인, 방법.
- 제143항 내지 제148항 중 어느 한 항에 있어서, 질환 또는 병태는 표적 단백질의 결핍된 양 또는 활성에 의해 야기되는, 방법.
- 제143항 내지 제149항 중 어느 한 항에 있어서, 제제는 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준을 증가시키는, 방법.
- 제150항에 있어서, 제제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가되는, 방법.
- 제143항 내지 제151항 중 어느 한 항에 있어서, 제제는 세포에서 표적 단백질의 발현을 증가시키는, 방법.
- 제152항에 있어서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가되는, 방법.
- 제143항 내지 제153항 중 어느 한 항에 있어서, 표적 단백질의 mRNA 수준 또는 발현 수준을 평가하는 단계를 추가로 포함하는, 방법.
- 제143항 내지 제154항 중 어느 한 항에 있어서, 질환과 연관된 적어도 하나의 유전적 돌연변이에 대해 대상체의 게놈을 평가하는 단계를 추가로 포함하는, 방법.
- 제155항에 있어서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 유전자좌 내에 있는 것인, 방법.
- 제155항에 있어서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 발현과 연관된 유전자좌 내에 있는 것인, 방법.
- 제155항에 있어서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자좌 내에 있는 것인, 방법.
- 제155항에 있어서, 적어도 하나의 유전적 돌연변이는 PKD1 유전자좌 내에 있는 것인, 방법.
- 제155항에 있어서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 발현과 연관된 유전자좌 내에 있는 것인, 방법.
- 제143항 내지 제160항 중 어느 한 항에 있어서, 대상체는 인간인, 방법.
- 제143항 내지 제160항 중 어느 한 항에 있어서, 대상체는 비-인간 동물인, 방법.
- 제143항 내지 제160항 중 어느 한 항에 있어서, 대상체는 태아, 배아 또는 아동인, 방법.
- 제143항 내지 제163항 중 어느 한 항에 있어서, 세포 또는 세포들이 생체외, 또는 생체외 조직 또는 기관에 있는 것인, 방법.
- 제143항 내지 제164항 중 어느 한 항에 있어서, 제제는 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 투여되는, 방법.
- 제143항 내지 제165항 중 어느 한 항에 있어서, 질환 또는 병태를 치료하는, 방법.
- 제143항 내지 제166항 중 어느 한 항의 방법에 사용하기 위한 치료제.
- 제167항의 치료제 및 약제학적으로 허용되는 부형제를 포함하는 약제학적 조성물.
- 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법으로서, 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 제168항의 약제학적 조성물을 투여하는 단계를 포함하는, 방법.
- 제169항에 있어서, 대상체를 치료하는, 방법.
- 표적 단백질을 인코딩하는 프로세싱된 mRNA를 갖는 세포에서 표적 단백질의 발현을 증가시키는 방법으로서, 세포 내로 (1) 제1 제제 또는 상기 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 상기 제2 제제를 인코딩하는 제2 핵산 서열을 전달하는 단계를 포함하고,
프리-mRNA는 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)을 포함하여, 이로써 제1 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고, 세포에서 표적 단백질의 발현을 조절하고; 그리고
프리-mRNA는 정규 5' 스플라이스-부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제2 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 표적 단백질의 발현을 조절함으로써 프리-mRNA의 프로세싱을 조절하고;
표적 단백질은 PKD2 유전자에 의해 인코딩되는, 방법. - 제제 또는 상기 제제를 인코딩하는 벡터를 포함하는 조성물로서, 제제는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 안티센스 올리고머를 포함하는, 조성물.
- 제제를 인코딩하는 벡터를 포함하는 조성물로서, 제제는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 다핵산을 포함하는, 조성물.
- 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 폴리시스틴 2 단백질의 발현을 증가시키는 방법으로서, 제제 또는 상기 제제를 인코딩하는 벡터를 세포에 접촉시키는 단계를 포함하며, 제제는 번역 조절 요소의 구조를 조절함으로써 세포에서 폴리시스틴 2 단백질의 발현을 증가시키는, 방법.
- 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 폴리시스틴 2 단백질의 발현을 증가시키는 방법으로서, 제제 또는 상기 제제를 인코딩하는 벡터를 세포에 접촉시키는 단계를 포함하며, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합으로 세포에서 폴리시스틴 2 단백질의 발현을 증가시키는, 방법.
- 세포에서 폴리시스틴 2 단백질의 발현을 조절하는 방법으로서, 제제 또는 상기 제제를 인코딩하는 벡터를 세포에 접촉시키는 단계를 포함하며, 제제는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 안티센스 올리고머를 포함하는, 방법.
- 제제를 포함하는 조성물로서, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 표적화 부분에 결합하는 안티센스 올리고머를 포함하고, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드를 포함하고, 프로세싱된 mRNA의 5' UTR 내에 있는 것인, 조성물.
- 제제를 인코딩하는 벡터를 포함하는 조성물로서, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 표적화 부분에 결합하는 서열을 포함하는 다핵산을 포함하고, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드를 포함하고, 프로세싱된 mRNA의 5' UTR 내에 있는 것인, 조성물.
- 제제를 포함하는 조성물로서, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 조절 요소의 구조를 조절함으로써 폴리시스틴 2 단백질의 발현을 증가시키고, 번역 조절 요소는 프로세싱된 mRNA의 번역을 억제하는, 조성물.
- 제제를 인코딩하는 벡터를 포함하는 조성물로서, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 조절 요소의 구조를 조절함으로써 폴리시스틴 2 단백질의 발현을 증가시키고, 번역 조절 요소는 프로세싱된 mRNA의 번역을 억제하는, 조성물.
- 제제를 포함하는 조성물로서, 제제는 세포에서 프로세싱된 mRNA의 번역을 증가시키고, 프로세싱된 mRNA는 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하고, 제제는 번역 조절 요소의 구조를 조절함으로써 번역 효율성 및/또는 프로세싱된 mRNA의 번역 속도를 증가시키고, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합인, 조성물.
- 제제를 인코딩하는 벡터를 포함하는 조성물로서, 제제는 세포에서 프로세싱된 mRNA의 번역을 증가시키고, 프로세싱된 mRNA는 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하고, 제제는 번역 조절 요소의 구조를 조절함으로써 번역 효율성 및/또는 프로세싱된 mRNA의 번역 속도를 증가시키고, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합인, 조성물.
- 표적 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 표적 단백질의 발현을 증가시키는 방법으로서, 세포 내로 (1) 제1 제제 또는 상기 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 상기 제2 제제를 인코딩하는 제2 핵산 서열을 전달하는 단계 및 이로써 세포에서 표적 단백질의 발현을 증가시키는 단계를 포함하며, 제1 제제는 표적 단백질을 인코딩하는 표적 유전자로부터 전사되는 프리-mRNA의 스플라이싱을 조절하고, 제2 제제는 표적 단백질을 인코딩하는 프로세싱된 mRNA의 번역 조절 요소의 구조를 조절하며, 표적 단백질은 폴리시스틴 2인, 방법.
- 표적 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 표적 단백질의 발현을 증가시키는 방법으로서, 세포 내로 (1) 제1 제제 또는 상기 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 상기 제2 제제를 인코딩하는 제2 핵산 서열을 전달하는 단계 및 이로써 세포에서 표적 단백질의 발현을 증가시키는 단계를 포함하며, 제1 제제는 표적 단백질을 인코딩하는 표적 유전자로부터 전사되는 프리-mRNA의 스플라이싱을 조절하고, 제2 제제는 (a) 프로세싱된 mRNA의 표적 부분에 결합하거나; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합이며, 표적 단백질은 폴리시스틴 2인, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163145288P | 2021-02-03 | 2021-02-03 | |
US63/145,288 | 2021-02-03 | ||
PCT/US2022/015074 WO2022169947A2 (en) | 2021-02-03 | 2022-02-03 | Compositions for treatment of conditions and diseases associated with polycystin expression |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230150973A true KR20230150973A (ko) | 2023-10-31 |
Family
ID=82741748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237029596A KR20230150973A (ko) | 2021-02-03 | 2022-02-03 | 폴리시스틴 발현과 관련된 병태 및 질환의 치료용 조성물 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20240117353A1 (ko) |
EP (1) | EP4288543A2 (ko) |
JP (1) | JP2024507717A (ko) |
KR (1) | KR20230150973A (ko) |
CN (1) | CN117413061A (ko) |
AR (1) | AR124809A1 (ko) |
AU (1) | AU2022215577A1 (ko) |
BR (1) | BR112023015636A2 (ko) |
CA (1) | CA3207341A1 (ko) |
TW (1) | TW202242113A (ko) |
WO (1) | WO2022169947A2 (ko) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6916619B2 (en) * | 2001-10-12 | 2005-07-12 | Athena Diagnostics, Inc. | Compositions and methods for genetic analysis of polycystic kidney disease |
US11096956B2 (en) * | 2015-12-14 | 2021-08-24 | Stoke Therapeutics, Inc. | Antisense oligomers and uses thereof |
CN111936163A (zh) * | 2017-10-23 | 2020-11-13 | 斯托克制药公司 | 用于治疗基于无义介导的rna衰变的病况和疾病的反义寡聚体 |
-
2022
- 2022-02-03 JP JP2023547237A patent/JP2024507717A/ja active Pending
- 2022-02-03 CA CA3207341A patent/CA3207341A1/en active Pending
- 2022-02-03 CN CN202280019548.3A patent/CN117413061A/zh active Pending
- 2022-02-03 KR KR1020237029596A patent/KR20230150973A/ko unknown
- 2022-02-03 WO PCT/US2022/015074 patent/WO2022169947A2/en active Application Filing
- 2022-02-03 AU AU2022215577A patent/AU2022215577A1/en active Pending
- 2022-02-03 BR BR112023015636A patent/BR112023015636A2/pt unknown
- 2022-02-03 AR ARP220100222A patent/AR124809A1/es unknown
- 2022-02-03 EP EP22750375.2A patent/EP4288543A2/en active Pending
- 2022-02-07 TW TW111104414A patent/TW202242113A/zh unknown
-
2023
- 2023-08-02 US US18/364,244 patent/US20240117353A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN117413061A (zh) | 2024-01-16 |
WO2022169947A3 (en) | 2022-09-15 |
WO2022169947A2 (en) | 2022-08-11 |
AR124809A1 (es) | 2023-05-10 |
CA3207341A1 (en) | 2022-08-11 |
JP2024507717A (ja) | 2024-02-21 |
US20240117353A1 (en) | 2024-04-11 |
AU2022215577A1 (en) | 2023-09-21 |
TW202242113A (zh) | 2022-11-01 |
EP4288543A2 (en) | 2023-12-13 |
BR112023015636A2 (pt) | 2024-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020250262B2 (en) | Compositions for modulating tau expression | |
KR102391812B1 (ko) | B형 간염 감염을 치료하기 위해 PAPD5 또는 PAPD7 mRNA를 감소시키기 위한 핵산 분자 | |
ES2744098T3 (es) | Composiciones y sus usos dirigidos a la huntingtina | |
KR101866152B1 (ko) | 종양 억제 유전자에 대한 천연 안티센스 전사체의 억제에 의해 종양 억제 유전자 관련된 질환의 치료 | |
RU2745324C2 (ru) | Композиции и способы модулирования экспрессии tau | |
KR20220062517A (ko) | 결합 변형된 올리고머 화합물 및 이의 용도 | |
AU2020267282B2 (en) | Compositions and methods for decreasing tau expression | |
KR20160027968A (ko) | Foxp3 발현을 조절하기 위한 조성물 및 방법 | |
KR20220012230A (ko) | 스플라이싱 및 번역을 조절하기 위한 방법 및 조성물 | |
AU2021203300B2 (en) | Nucleic acid molecule for reduction of PAPD5 and PAPD7 mRNA for treating hepatitis B infection | |
KR20230022409A (ko) | 병태 및 질환의 치료를 위한 opa1 안티센스 올리고머 | |
TW202221014A (zh) | 用於減少app表現之化合物及方法 | |
US20040115641A1 (en) | Modulation of ROCK 1 expression | |
CN117795076A (zh) | 用丝裂原活化蛋白激酶激酶激酶15(map3k15)抑制剂治疗代谢病症的方法 | |
KR20230137958A (ko) | 헌팅틴을 조절하기 위한 화합물 및 방법 | |
KR20230074214A (ko) | 지방간 질환의 치료 방법 | |
KR20230005933A (ko) | Atxn1을 조정하는 화합물 및 방법 | |
KR20230150973A (ko) | 폴리시스틴 발현과 관련된 병태 및 질환의 치료용 조성물 | |
TW202237842A (zh) | 靶向atxn3之反義寡核苷酸 | |
CN115362255A (zh) | 用无七之子2(sos2)抑制剂治疗眼科疾患 |