KR20210033004A - Rtel1의 발현을 조절하기 위한 올리고뉴클레오티드 - Google Patents
Rtel1의 발현을 조절하기 위한 올리고뉴클레오티드 Download PDFInfo
- Publication number
- KR20210033004A KR20210033004A KR1020217004297A KR20217004297A KR20210033004A KR 20210033004 A KR20210033004 A KR 20210033004A KR 1020217004297 A KR1020217004297 A KR 1020217004297A KR 20217004297 A KR20217004297 A KR 20217004297A KR 20210033004 A KR20210033004 A KR 20210033004A
- Authority
- KR
- South Korea
- Prior art keywords
- oligonucleotide
- rtel1
- nucleosides
- dna
- nucleic acid
- Prior art date
Links
- 101000639763 Homo sapiens Regulator of telomere elongation helicase 1 Proteins 0.000 title claims abstract description 176
- 102100034469 Regulator of telomere elongation helicase 1 Human genes 0.000 title claims abstract description 164
- 108091034117 Oligonucleotide Proteins 0.000 title claims description 658
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 title description 97
- 230000001105 regulatory effect Effects 0.000 title description 3
- 239000000074 antisense oligonucleotide Substances 0.000 claims abstract description 82
- 238000012230 antisense oligonucleotides Methods 0.000 claims abstract description 82
- 230000000295 complement effect Effects 0.000 claims abstract description 74
- 208000015181 infectious disease Diseases 0.000 claims abstract description 66
- 239000003112 inhibitor Substances 0.000 claims abstract description 60
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 45
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 39
- 238000011282 treatment Methods 0.000 claims abstract description 37
- 108020000948 Antisense Oligonucleotides Proteins 0.000 claims abstract description 21
- 230000002265 prevention Effects 0.000 claims abstract description 19
- 230000001603 reducing effect Effects 0.000 claims abstract description 16
- 108091036055 CccDNA Proteins 0.000 claims abstract 4
- 108020004414 DNA Proteins 0.000 claims description 314
- 239000002777 nucleoside Substances 0.000 claims description 225
- 125000003835 nucleoside group Chemical group 0.000 claims description 210
- 239000002773 nucleotide Substances 0.000 claims description 196
- 125000003729 nucleotide group Chemical group 0.000 claims description 196
- 102000039446 nucleic acids Human genes 0.000 claims description 141
- 108020004707 nucleic acids Proteins 0.000 claims description 141
- 150000007523 nucleic acids Chemical class 0.000 claims description 140
- 241000700721 Hepatitis B virus Species 0.000 claims description 124
- 150000003833 nucleoside derivatives Chemical class 0.000 claims description 83
- 230000021615 conjugation Effects 0.000 claims description 79
- 150000001875 compounds Chemical class 0.000 claims description 77
- 239000004055 small Interfering RNA Substances 0.000 claims description 65
- 238000000034 method Methods 0.000 claims description 59
- 108020004459 Small interfering RNA Proteins 0.000 claims description 46
- 150000003839 salts Chemical class 0.000 claims description 37
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 claims description 30
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 27
- 230000000692 anti-sense effect Effects 0.000 claims description 26
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 24
- 150000004713 phosphodiesters Chemical group 0.000 claims description 22
- 201000010099 disease Diseases 0.000 claims description 20
- 239000003814 drug Substances 0.000 claims description 18
- OVRNDRQMDRJTHS-KEWYIRBNSA-N N-acetyl-D-galactosamine Chemical group CC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-KEWYIRBNSA-N 0.000 claims description 17
- 238000001727 in vivo Methods 0.000 claims description 15
- 238000000338 in vitro Methods 0.000 claims description 14
- 230000002401 inhibitory effect Effects 0.000 claims description 13
- 102000050981 human RTEL1 Human genes 0.000 claims description 12
- 102100034343 Integrase Human genes 0.000 claims description 11
- 101710203526 Integrase Proteins 0.000 claims description 10
- 238000004519 manufacturing process Methods 0.000 claims description 8
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 7
- 230000002829 reductive effect Effects 0.000 claims description 7
- 101150054451 Rtel1 gene Proteins 0.000 claims description 6
- 208000037581 Persistent Infection Diseases 0.000 claims description 4
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 2
- 239000002924 silencing RNA Substances 0.000 claims 1
- 230000001684 chronic effect Effects 0.000 abstract description 15
- 210000004027 cell Anatomy 0.000 description 86
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 51
- 230000008685 targeting Effects 0.000 description 34
- 241000282414 Homo sapiens Species 0.000 description 33
- 125000005647 linker group Chemical group 0.000 description 30
- 102000005427 Asialoglycoprotein Receptor Human genes 0.000 description 29
- 108010006523 asialoglycoprotein receptor Proteins 0.000 description 29
- 101710163270 Nuclease Proteins 0.000 description 25
- 238000013461 design Methods 0.000 description 22
- 230000000694 effects Effects 0.000 description 20
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 18
- 239000002585 base Substances 0.000 description 16
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 15
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 15
- 230000009368 gene silencing by RNA Effects 0.000 description 15
- 230000005764 inhibitory process Effects 0.000 description 15
- 108090000623 proteins and genes Proteins 0.000 description 15
- 239000000203 mixture Substances 0.000 description 14
- 230000004048 modification Effects 0.000 description 14
- 238000012986 modification Methods 0.000 description 14
- 210000003494 hepatocyte Anatomy 0.000 description 13
- -1 pyrimidine modified purine Chemical class 0.000 description 13
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 12
- 210000004185 liver Anatomy 0.000 description 12
- 239000000463 material Substances 0.000 description 12
- 239000003795 chemical substances by application Substances 0.000 description 11
- 108091081021 Sense strand Proteins 0.000 description 10
- 238000003776 cleavage reaction Methods 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 230000009467 reduction Effects 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- 241000711549 Hepacivirus C Species 0.000 description 9
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical group CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 9
- 102000000574 RNA-Induced Silencing Complex Human genes 0.000 description 9
- 108010016790 RNA-Induced Silencing Complex Proteins 0.000 description 9
- 230000033228 biological regulation Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- IZTQOLKUZKXIRV-YRVFCXMDSA-N sincalide Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](N)CC(O)=O)C1=CC=C(OS(O)(=O)=O)C=C1 IZTQOLKUZKXIRV-YRVFCXMDSA-N 0.000 description 9
- 101800005151 Cholecystokinin-8 Proteins 0.000 description 8
- 102400000888 Cholecystokinin-8 Human genes 0.000 description 8
- 101710142246 External core antigen Proteins 0.000 description 8
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 8
- 238000011529 RT qPCR Methods 0.000 description 8
- 230000015556 catabolic process Effects 0.000 description 8
- 229940104302 cytosine Drugs 0.000 description 8
- 230000007423 decrease Effects 0.000 description 8
- 238000006731 degradation reaction Methods 0.000 description 8
- 102000004169 proteins and genes Human genes 0.000 description 8
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 7
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 7
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 7
- 239000003085 diluting agent Substances 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 230000001225 therapeutic effect Effects 0.000 description 7
- 230000003612 virological effect Effects 0.000 description 7
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 6
- 108091027974 Mature messenger RNA Proteins 0.000 description 6
- AFVFQIVMOAPDHO-UHFFFAOYSA-N Methanesulfonic acid Chemical compound CS(O)(=O)=O AFVFQIVMOAPDHO-UHFFFAOYSA-N 0.000 description 6
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 6
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 6
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 6
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 6
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 6
- 231100000135 cytotoxicity Toxicity 0.000 description 6
- 230000003013 cytotoxicity Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- 239000003446 ligand Substances 0.000 description 6
- 238000004007 reversed phase HPLC Methods 0.000 description 6
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 5
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 5
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 5
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 5
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 5
- 239000000556 agonist Substances 0.000 description 5
- 239000000427 antigen Substances 0.000 description 5
- 108091007433 antigens Proteins 0.000 description 5
- 102000036639 antigens Human genes 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 229960000980 entecavir Drugs 0.000 description 5
- YXPVEXCTPGULBZ-WQYNNSOESA-N entecavir hydrate Chemical compound O.C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)C1=C YXPVEXCTPGULBZ-WQYNNSOESA-N 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000009472 formulation Methods 0.000 description 5
- 125000000524 functional group Chemical group 0.000 description 5
- 208000002672 hepatitis B Diseases 0.000 description 5
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 5
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 5
- 210000004940 nucleus Anatomy 0.000 description 5
- 230000000069 prophylactic effect Effects 0.000 description 5
- 230000007115 recruitment Effects 0.000 description 5
- 230000028327 secretion Effects 0.000 description 5
- 125000006850 spacer group Chemical group 0.000 description 5
- 108091035539 telomere Proteins 0.000 description 5
- 102000055501 telomere Human genes 0.000 description 5
- 210000003411 telomere Anatomy 0.000 description 5
- VCMJCVGFSROFHV-WZGZYPNHSA-N tenofovir disoproxil fumarate Chemical compound OC(=O)\C=C\C(O)=O.N1=CN=C2N(C[C@@H](C)OCP(=O)(OCOC(=O)OC(C)C)OCOC(=O)OC(C)C)C=NC2=C1N VCMJCVGFSROFHV-WZGZYPNHSA-N 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 229960005486 vaccine Drugs 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 4
- 108010078049 Interferon alpha-2 Proteins 0.000 description 4
- 108010050904 Interferons Proteins 0.000 description 4
- 102000014150 Interferons Human genes 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 239000013543 active substance Substances 0.000 description 4
- 239000002671 adjuvant Substances 0.000 description 4
- 125000004103 aminoalkyl group Chemical group 0.000 description 4
- 230000000840 anti-viral effect Effects 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 150000001720 carbohydrates Chemical class 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 208000035475 disorder Diseases 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 239000002552 dosage form Substances 0.000 description 4
- 230000002708 enhancing effect Effects 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 230000030279 gene silencing Effects 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- JTEGQNOMFQHVDC-NKWVEPMBSA-N lamivudine Chemical compound O=C1N=C(N)C=CN1[C@H]1O[C@@H](CO)SC1 JTEGQNOMFQHVDC-NKWVEPMBSA-N 0.000 description 4
- 208000019423 liver disease Diseases 0.000 description 4
- 239000012139 lysis buffer Substances 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 238000002844 melting Methods 0.000 description 4
- 230000008018 melting Effects 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 150000008300 phosphoramidites Chemical class 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 4
- 239000011734 sodium Substances 0.000 description 4
- 229910052708 sodium Inorganic materials 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 4
- 238000007920 subcutaneous administration Methods 0.000 description 4
- IQFYYKKMVGJFEH-CSMHCCOUSA-N telbivudine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1O[C@@H](CO)[C@H](O)C1 IQFYYKKMVGJFEH-CSMHCCOUSA-N 0.000 description 4
- 229940124597 therapeutic agent Drugs 0.000 description 4
- JOXIMZWYDAKGHI-UHFFFAOYSA-N toluene-4-sulfonic acid Chemical compound CC1=CC=C(S(O)(=O)=O)C=C1 JOXIMZWYDAKGHI-UHFFFAOYSA-N 0.000 description 4
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 4
- 230000032258 transport Effects 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- MSWZFWKMSRAUBD-GASJEMHNSA-N 2-amino-2-deoxy-D-galactopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O MSWZFWKMSRAUBD-GASJEMHNSA-N 0.000 description 3
- BMYNFMYTOJXKLE-UHFFFAOYSA-N 3-azaniumyl-2-hydroxypropanoate Chemical compound NCC(O)C(O)=O BMYNFMYTOJXKLE-UHFFFAOYSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- 108091023037 Aptamer Proteins 0.000 description 3
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 3
- 206010016654 Fibrosis Diseases 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- OFOBLEOULBTSOW-UHFFFAOYSA-N Propanedioic acid Natural products OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 3
- IWUCXVSUMQZMFG-AFCXAGJDSA-N Ribavirin Chemical compound N1=C(C(=O)N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 IWUCXVSUMQZMFG-AFCXAGJDSA-N 0.000 description 3
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 3
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 description 3
- 230000001154 acute effect Effects 0.000 description 3
- 229960001997 adefovir Drugs 0.000 description 3
- WOZSCQDILHKSGG-UHFFFAOYSA-N adefovir depivoxil Chemical compound N1=CN=C2N(CCOCP(=O)(OCOC(=O)C(C)(C)C)OCOC(=O)C(C)(C)C)C=NC2=C1N WOZSCQDILHKSGG-UHFFFAOYSA-N 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 3
- 238000009175 antibody therapy Methods 0.000 description 3
- 230000006907 apoptotic process Effects 0.000 description 3
- 239000012298 atmosphere Substances 0.000 description 3
- MSWZFWKMSRAUBD-UHFFFAOYSA-N beta-D-galactosamine Natural products NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 description 3
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 230000004700 cellular uptake Effects 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000007882 cirrhosis Effects 0.000 description 3
- 208000019425 cirrhosis of liver Diseases 0.000 description 3
- 238000002648 combination therapy Methods 0.000 description 3
- 230000000593 degrading effect Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 238000009509 drug development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 229930182830 galactose Natural products 0.000 description 3
- 150000002256 galaktoses Chemical class 0.000 description 3
- 230000035876 healing Effects 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 150000007529 inorganic bases Chemical class 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 238000007917 intracranial administration Methods 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 3
- 229960001627 lamivudine Drugs 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000021121 meiosis Effects 0.000 description 3
- 229940098779 methanesulfonic acid Drugs 0.000 description 3
- 150000007522 mineralic acids Chemical class 0.000 description 3
- 238000002515 oligonucleotide synthesis Methods 0.000 description 3
- 150000007524 organic acids Chemical class 0.000 description 3
- 150000007530 organic bases Chemical class 0.000 description 3
- 239000002953 phosphate buffered saline Substances 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 239000000651 prodrug Substances 0.000 description 3
- 229940002612 prodrug Drugs 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000011321 prophylaxis Methods 0.000 description 3
- 238000013138 pruning Methods 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 229960000329 ribavirin Drugs 0.000 description 3
- HZCAHMRRMINHDJ-DBRKOABJSA-N ribavirin Natural products O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1N=CN=C1 HZCAHMRRMINHDJ-DBRKOABJSA-N 0.000 description 3
- 108010052833 ribonuclease HI Proteins 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- 125000001424 substituent group Chemical group 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 229960004556 tenofovir Drugs 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- XGDRLCRGKUCBQL-UHFFFAOYSA-N 1h-imidazole-4,5-dicarbonitrile Chemical compound N#CC=1N=CNC=1C#N XGDRLCRGKUCBQL-UHFFFAOYSA-N 0.000 description 2
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 102000000844 Cell Surface Receptors Human genes 0.000 description 2
- 108010001857 Cell Surface Receptors Proteins 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 108020004638 Circular DNA Proteins 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 2
- 108020004394 Complementary RNA Proteins 0.000 description 2
- 102000003844 DNA helicases Human genes 0.000 description 2
- 108090000133 DNA helicases Proteins 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 238000008157 ELISA kit Methods 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- AEMRFAOFKBGASW-UHFFFAOYSA-N Glycolic acid Chemical compound OCC(O)=O AEMRFAOFKBGASW-UHFFFAOYSA-N 0.000 description 2
- 101001075561 Homo sapiens Rho GTPase-activating protein 32 Proteins 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 108010047761 Interferon-alpha Proteins 0.000 description 2
- 102000006992 Interferon-alpha Human genes 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- 229930182821 L-proline Natural products 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- FVMMQJUBNMOPPR-WLDMJGECSA-N N-[(3R,4R,5R,6R)-2,4,5-trihydroxy-6-(hydroxymethyl)oxan-3-yl]formamide Chemical compound OC[C@H]1OC(O)[C@H](NC=O)[C@@H](O)[C@H]1O FVMMQJUBNMOPPR-WLDMJGECSA-N 0.000 description 2
- RTEOJYOKWPEKKN-HXQZNRNWSA-N N-[(3R,4R,5R,6R)-2,4,5-trihydroxy-6-(hydroxymethyl)oxan-3-yl]propanamide Chemical compound CCC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O RTEOJYOKWPEKKN-HXQZNRNWSA-N 0.000 description 2
- GRYLNZFGIOXLOG-UHFFFAOYSA-N Nitric acid Chemical compound O[N+]([O-])=O GRYLNZFGIOXLOG-UHFFFAOYSA-N 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 229930182555 Penicillin Natural products 0.000 description 2
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 2
- 102100020900 Rho GTPase-activating protein 32 Human genes 0.000 description 2
- KDYFGRWQOYBRFD-UHFFFAOYSA-N Succinic acid Natural products OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 108010067390 Viral Proteins Proteins 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical group OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 230000003466 anti-cipated effect Effects 0.000 description 2
- 239000003443 antiviral agent Substances 0.000 description 2
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- KDYFGRWQOYBRFD-NUQCWPJISA-N butanedioic acid Chemical compound O[14C](=O)CC[14C](O)=O KDYFGRWQOYBRFD-NUQCWPJISA-N 0.000 description 2
- 230000030833 cell death Effects 0.000 description 2
- 125000003636 chemical group Chemical group 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 235000015165 citric acid Nutrition 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000000368 destabilizing effect Effects 0.000 description 2
- UREBDLICKHMUKA-CXSFZGCWSA-N dexamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-CXSFZGCWSA-N 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 2
- 230000002222 downregulating effect Effects 0.000 description 2
- 238000012377 drug delivery Methods 0.000 description 2
- 229940088679 drug related substance Drugs 0.000 description 2
- 230000004064 dysfunction Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 239000001530 fumaric acid Substances 0.000 description 2
- 235000011087 fumaric acid Nutrition 0.000 description 2
- 210000001035 gastrointestinal tract Anatomy 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000012606 in vitro cell culture Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 229940079322 interferon Drugs 0.000 description 2
- 229960003521 interferon alfa-2a Drugs 0.000 description 2
- 229960003507 interferon alfa-2b Drugs 0.000 description 2
- 229960003358 interferon alfacon-1 Drugs 0.000 description 2
- 108010010648 interferon alfacon-1 Proteins 0.000 description 2
- 229940047124 interferons Drugs 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 238000007913 intrathecal administration Methods 0.000 description 2
- 238000007914 intraventricular administration Methods 0.000 description 2
- 238000000111 isothermal titration calorimetry Methods 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 238000004020 luminiscence type Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 229910017604 nitric acid Inorganic materials 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 230000009437 off-target effect Effects 0.000 description 2
- 235000005985 organic acids Nutrition 0.000 description 2
- 235000006408 oxalic acid Nutrition 0.000 description 2
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 2
- 229940049954 penicillin Drugs 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000011591 potassium Substances 0.000 description 2
- 229910052700 potassium Inorganic materials 0.000 description 2
- 229960002429 proline Drugs 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 150000003254 radicals Chemical class 0.000 description 2
- 238000000090 raster image correlation spectroscopy Methods 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 229960004889 salicylic acid Drugs 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 108010062513 snake venom phosphodiesterase I Proteins 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- MIXCUJKCXRNYFM-UHFFFAOYSA-M sodium;diiodomethanesulfonate;n-propyl-n-[2-(2,4,6-trichlorophenoxy)ethyl]imidazole-1-carboxamide Chemical group [Na+].[O-]S(=O)(=O)C(I)I.C1=CN=CN1C(=O)N(CCC)CCOC1=C(Cl)C=C(Cl)C=C1Cl MIXCUJKCXRNYFM-UHFFFAOYSA-M 0.000 description 2
- 238000010532 solid phase synthesis reaction Methods 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 229960005322 streptomycin Drugs 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 229960005311 telbivudine Drugs 0.000 description 2
- WGTYBPLFGIVFAS-UHFFFAOYSA-M tetramethylammonium hydroxide Chemical compound [OH-].C[N+](C)(C)C WGTYBPLFGIVFAS-UHFFFAOYSA-M 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 108700012359 toxins Proteins 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- GETQZCLCWQTVFV-UHFFFAOYSA-N trimethylamine Chemical compound CN(C)C GETQZCLCWQTVFV-UHFFFAOYSA-N 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- QBYIENPQHBMVBV-HFEGYEGKSA-N (2R)-2-hydroxy-2-phenylacetic acid Chemical compound O[C@@H](C(O)=O)c1ccccc1.O[C@@H](C(O)=O)c1ccccc1 QBYIENPQHBMVBV-HFEGYEGKSA-N 0.000 description 1
- YIMATHOGWXZHFX-WCTZXXKLSA-N (2r,3r,4r,5r)-5-(hydroxymethyl)-3-(2-methoxyethoxy)oxolane-2,4-diol Chemical compound COCCO[C@H]1[C@H](O)O[C@H](CO)[C@H]1O YIMATHOGWXZHFX-WCTZXXKLSA-N 0.000 description 1
- BJEPYKJPYRNKOW-REOHCLBHSA-N (S)-malic acid Chemical compound OC(=O)[C@@H](O)CC(O)=O BJEPYKJPYRNKOW-REOHCLBHSA-N 0.000 description 1
- WBYWAXJHAXSJNI-VOTSOKGWSA-M .beta-Phenylacrylic acid Natural products [O-]C(=O)\C=C\C1=CC=CC=C1 WBYWAXJHAXSJNI-VOTSOKGWSA-M 0.000 description 1
- RHCSKNNOAZULRK-APZFVMQVSA-N 2,2-dideuterio-2-(3,4,5-trimethoxyphenyl)ethanamine Chemical compound NCC([2H])([2H])C1=CC(OC)=C(OC)C(OC)=C1 RHCSKNNOAZULRK-APZFVMQVSA-N 0.000 description 1
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- HBJGQJWNMZDFKL-UHFFFAOYSA-N 2-chloro-7h-purin-6-amine Chemical compound NC1=NC(Cl)=NC2=C1NC=N2 HBJGQJWNMZDFKL-UHFFFAOYSA-N 0.000 description 1
- KMEMIMRPZGDOMG-UHFFFAOYSA-N 2-cyanoethoxyphosphonamidous acid Chemical compound NP(O)OCCC#N KMEMIMRPZGDOMG-UHFFFAOYSA-N 0.000 description 1
- KXTUJUVCAGXOBN-WQXQQRIOSA-N 2-methyl-N-[(3R,4R,5R,6R)-2,4,5-trihydroxy-6-(hydroxymethyl)oxan-3-yl]propanamide Chemical group CC(C)C(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O KXTUJUVCAGXOBN-WQXQQRIOSA-N 0.000 description 1
- 125000002103 4,4'-dimethoxytriphenylmethyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C(*)(C1=C([H])C([H])=C(OC([H])([H])[H])C([H])=C1[H])C1=C([H])C([H])=C(OC([H])([H])[H])C([H])=C1[H] 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- UJBCLAXPPIDQEE-UHFFFAOYSA-N 5-prop-1-ynyl-1h-pyrimidine-2,4-dione Chemical compound CC#CC1=CNC(=O)NC1=O UJBCLAXPPIDQEE-UHFFFAOYSA-N 0.000 description 1
- QNNARSZPGNJZIX-UHFFFAOYSA-N 6-amino-5-prop-1-ynyl-1h-pyrimidin-2-one Chemical compound CC#CC1=CNC(=O)N=C1N QNNARSZPGNJZIX-UHFFFAOYSA-N 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- VKKXEIQIGGPMHT-UHFFFAOYSA-N 7h-purine-2,8-diamine Chemical compound NC1=NC=C2NC(N)=NC2=N1 VKKXEIQIGGPMHT-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 108091029792 Alkylated DNA Proteins 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 231100000699 Bacterial toxin Toxicity 0.000 description 1
- 239000005711 Benzoic acid Substances 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- RRAAWOVZMCLOJP-MPGFQZEXSA-N C(C(C)C)(=O)C1(O)[C@H](N)[C@@H](O)[C@@H](O)[C@H](O1)CO Chemical group C(C(C)C)(=O)C1(O)[C@H](N)[C@@H](O)[C@@H](O)[C@H](O1)CO RRAAWOVZMCLOJP-MPGFQZEXSA-N 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241000282836 Camelus dromedarius Species 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 241000700199 Cavia porcellus Species 0.000 description 1
- 208000000419 Chronic Hepatitis B Diseases 0.000 description 1
- 206010057573 Chronic hepatic failure Diseases 0.000 description 1
- WBYWAXJHAXSJNI-SREVYHEPSA-N Cinnamic acid Chemical compound OC(=O)\C=C/C1=CC=CC=C1 WBYWAXJHAXSJNI-SREVYHEPSA-N 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102000012422 Collagen Type I Human genes 0.000 description 1
- 108010022452 Collagen Type I Proteins 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 108091062167 DNA cytosine Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 101150018489 DNA-C gene Proteins 0.000 description 1
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 1
- 206010012735 Diarrhoea Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 208000010334 End Stage Liver Disease Diseases 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 208000031448 Genomic Instability Diseases 0.000 description 1
- 208000031886 HIV Infections Diseases 0.000 description 1
- 208000037357 HIV infectious disease Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000678026 Homo sapiens Alpha-1-antichymotrypsin Proteins 0.000 description 1
- 101000903587 Homo sapiens Cytosolic acyl coenzyme A thioester hydrolase Proteins 0.000 description 1
- 101000693243 Homo sapiens Paternally-expressed gene 3 protein Proteins 0.000 description 1
- 101100309022 Homo sapiens RTEL1 gene Proteins 0.000 description 1
- 208000010210 Hoyeraal-Hreidarsson syndrome Diseases 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- 102100040018 Interferon alpha-2 Human genes 0.000 description 1
- 108010079944 Interferon-alpha2b Proteins 0.000 description 1
- 208000001126 Keratosis Diseases 0.000 description 1
- PWKSKIMOESPYIA-BYPYZUCNSA-N L-N-acetyl-Cysteine Chemical compound CC(=O)N[C@@H](CS)C(O)=O PWKSKIMOESPYIA-BYPYZUCNSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 241000701076 Macacine alphaherpesvirus 1 Species 0.000 description 1
- 241000283923 Marmota monax Species 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000282341 Mustela putorius furo Species 0.000 description 1
- HTLZVHNRZJPSMI-UHFFFAOYSA-N N-ethylpiperidine Chemical compound CCN1CCCCC1 HTLZVHNRZJPSMI-UHFFFAOYSA-N 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 102100025757 Paternally-expressed gene 3 protein Human genes 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- IWYDHOAUDWTVEP-UHFFFAOYSA-N R-2-phenyl-2-hydroxyacetic acid Natural products OC(=O)C(O)C1=CC=CC=C1 IWYDHOAUDWTVEP-UHFFFAOYSA-N 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 238000011579 SCID mouse model Methods 0.000 description 1
- 239000012721 SDS lysis buffer Substances 0.000 description 1
- 101001050208 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Putative ATP-dependent RNA helicase ECM32 Proteins 0.000 description 1
- 108010087230 Sincalide Proteins 0.000 description 1
- FEWJPZIEWOKRBE-UHFFFAOYSA-N Tartaric acid Natural products [H+].[H+].[O-]C(=O)C(O)C(O)C([O-])=O FEWJPZIEWOKRBE-UHFFFAOYSA-N 0.000 description 1
- 102000002689 Toll-like receptor Human genes 0.000 description 1
- 108020000411 Toll-like receptor Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 201000000147 X-linked dyskeratosis congenita Diseases 0.000 description 1
- 229960004308 acetylcysteine Drugs 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- BJEPYKJPYRNKOW-UHFFFAOYSA-N alpha-hydroxysuccinic acid Natural products OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 description 1
- 229940024606 amino acid Drugs 0.000 description 1
- 150000005018 aminopurines Chemical class 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 235000011114 ammonium hydroxide Nutrition 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000000730 antalgic agent Substances 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000003110 anti-inflammatory effect Effects 0.000 description 1
- 230000001062 anti-nausea Effects 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 239000003096 antiparasitic agent Substances 0.000 description 1
- 229940125687 antiparasitic agent Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000008365 aqueous carrier Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 239000000688 bacterial toxin Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000010233 benzoic acid Nutrition 0.000 description 1
- 125000003236 benzoyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C(*)=O 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 125000002619 bicyclic group Chemical group 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 229940124765 capsid inhibitor Drugs 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000010609 cell counting kit-8 assay Methods 0.000 description 1
- QSHQKIURKJITMZ-BRPMRXRMSA-N cholane Chemical compound C1CC2CCCC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCC)[C@@]1(C)CC2 QSHQKIURKJITMZ-BRPMRXRMSA-N 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 208000011444 chronic liver failure Diseases 0.000 description 1
- 235000013985 cinnamic acid Nutrition 0.000 description 1
- 229930016911 cinnamic acid Natural products 0.000 description 1
- 229960004106 citric acid Drugs 0.000 description 1
- 230000009668 clonal growth Effects 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- CTMZLDSMFCVUNX-VMIOUTBZSA-N cytidylyl-(3'->5')-guanosine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=C(C(N=C(N)N3)=O)N=C2)O)[C@@H](CO)O1 CTMZLDSMFCVUNX-VMIOUTBZSA-N 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010511 deprotection reaction Methods 0.000 description 1
- 230000001687 destabilization Effects 0.000 description 1
- HPNMFZURTQLUMO-UHFFFAOYSA-N diethylamine Chemical compound CCNCC HPNMFZURTQLUMO-UHFFFAOYSA-N 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- MJJALKDDGIKVBE-UHFFFAOYSA-N ebastine Chemical compound C1=CC(C(C)(C)C)=CC=C1C(=O)CCCN1CCC(OC(C=2C=CC=CC=2)C=2C=CC=CC=2)CC1 MJJALKDDGIKVBE-UHFFFAOYSA-N 0.000 description 1
- 238000002330 electrospray ionisation mass spectrometry Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- CCIVGXIOQKPBKL-UHFFFAOYSA-M ethanesulfonate Chemical compound CCS([O-])(=O)=O CCIVGXIOQKPBKL-UHFFFAOYSA-M 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 229940083124 ganglion-blocking antiadrenergic secondary and tertiary amines Drugs 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 150000002402 hexoses Chemical group 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 1
- 238000011577 humanized mouse model Methods 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- XMBWDFGMSWQBCA-UHFFFAOYSA-N hydrogen iodide Chemical compound I XMBWDFGMSWQBCA-UHFFFAOYSA-N 0.000 description 1
- 229940071870 hydroiodic acid Drugs 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 230000003308 immunostimulating effect Effects 0.000 description 1
- 229960003444 immunosuppressant agent Drugs 0.000 description 1
- 230000001861 immunosuppressant effect Effects 0.000 description 1
- 239000003018 immunosuppressive agent Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- 239000003456 ion exchange resin Substances 0.000 description 1
- 229920003303 ion-exchange polymer Polymers 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- JJWLVOIRVHMVIS-UHFFFAOYSA-N isopropylamine Chemical compound CC(C)N JJWLVOIRVHMVIS-UHFFFAOYSA-N 0.000 description 1
- 230000003907 kidney function Effects 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000008176 lyophilized powder Substances 0.000 description 1
- 159000000003 magnesium salts Chemical class 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 239000011976 maleic acid Substances 0.000 description 1
- 239000001630 malic acid Substances 0.000 description 1
- 235000011090 malic acid Nutrition 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 229960002510 mandelic acid Drugs 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- WBYWAXJHAXSJNI-UHFFFAOYSA-N methyl p-hydroxycinnamate Natural products OC(=O)C=CC1=CC=CC=C1 WBYWAXJHAXSJNI-UHFFFAOYSA-N 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- LNOPIUAQISRISI-UHFFFAOYSA-N n'-hydroxy-2-propan-2-ylsulfonylethanimidamide Chemical compound CC(C)S(=O)(=O)CC(N)=NO LNOPIUAQISRISI-UHFFFAOYSA-N 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 239000000041 non-steroidal anti-inflammatory agent Substances 0.000 description 1
- 229940021182 non-steroidal anti-inflammatory drug Drugs 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 231100000956 nontoxicity Toxicity 0.000 description 1
- 238000002414 normal-phase solid-phase extraction Methods 0.000 description 1
- 239000002674 ointment Substances 0.000 description 1
- 229940116315 oxalic acid Drugs 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 229940124531 pharmaceutical excipient Drugs 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 125000005642 phosphothioate group Chemical group 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920000768 polyamine Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 231100000683 possible toxicity Toxicity 0.000 description 1
- XAEFZNCEHLXOMS-UHFFFAOYSA-M potassium benzoate Chemical compound [K+].[O-]C(=O)C1=CC=CC=C1 XAEFZNCEHLXOMS-UHFFFAOYSA-M 0.000 description 1
- 159000000001 potassium salts Chemical class 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 235000019260 propionic acid Nutrition 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- 125000001453 quaternary ammonium group Chemical group 0.000 description 1
- IUVKMZGDUIUOCP-BTNSXGMBSA-N quinbolone Chemical compound O([C@H]1CC[C@H]2[C@H]3[C@@H]([C@]4(C=CC(=O)C=C4CC3)C)CC[C@@]21C)C1=CCCC1 IUVKMZGDUIUOCP-BTNSXGMBSA-N 0.000 description 1
- 230000007420 reactivation Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000000405 serological effect Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 239000011975 tartaric acid Substances 0.000 description 1
- 235000002906 tartaric acid Nutrition 0.000 description 1
- LDEKQSIMHVQZJK-CAQYMETFSA-N tenofovir alafenamide Chemical compound O([P@@](=O)(CO[C@H](C)CN1C2=NC=NC(N)=C2N=C1)N[C@@H](C)C(=O)OC(C)C)C1=CC=CC=C1 LDEKQSIMHVQZJK-CAQYMETFSA-N 0.000 description 1
- 229960004946 tenofovir alafenamide Drugs 0.000 description 1
- 229960004693 tenofovir disoproxil fumarate Drugs 0.000 description 1
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 1
- 229940021747 therapeutic vaccine Drugs 0.000 description 1
- 238000006177 thiolation reaction Methods 0.000 description 1
- ZEMGGZBWXRYJHK-UHFFFAOYSA-N thiouracil Chemical compound O=C1C=CNC(=S)N1 ZEMGGZBWXRYJHK-UHFFFAOYSA-N 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 229940044616 toll-like receptor 7 agonist Drugs 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- YFTHZRPMJXBUME-UHFFFAOYSA-N tripropylamine Chemical compound CCCN(CCC)CCC YFTHZRPMJXBUME-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 238000004704 ultra performance liquid chromatography Methods 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 244000052613 viral pathogen Species 0.000 description 1
- 230000008957 viral persistence Effects 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 229920001285 xanthan gum Polymers 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1137—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/11—Antisense
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/315—Phosphorothioates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/323—Chemical structure of the sugar modified ring structure
- C12N2310/3231—Chemical structure of the sugar modified ring structure having an additional ring, e.g. LNA, ENA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/33—Chemical structure of the base
- C12N2310/334—Modified C
- C12N2310/3341—5-Methylcytosine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/34—Spatial arrangement of the modifications
- C12N2310/341—Gapmers, i.e. of the type ===---===
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
Abstract
본원 발명은 HBV 감염, 특히 만성 HBV 감염의 치료에서 이용을 위한 RTEL1 저해제에 관계한다. 본원 발명은 특히, cccDNA, 예컨대 HBV cccDNA를 불안정화하기 위한 RTEL1 저해제의 용도에 관계한다. 본원 발명은 또한, RTEL1에 상보적이고 RTEL1 mRNA를 감소시킬 수 있는 안티센스 올리고뉴클레오티드에 관계한다. 제약학적 조성물 및 HBV 감염의 치료 및/또는 예방에서 이의 용도 역시 본원 발명 내에 포함된다.
Description
발명의 분야
본원 발명은 RTEL1에 상보적이고, RTEL1의 발현의 조절 또는 RTEL1 활성의 조절을 야기하는 RTEL1 저해제, 예컨대 올리고뉴클레오티드 (소중합체)에 관계한다. 본원 발명은 특히, B형 간염 바이러스 (HBV) 감염, 특히 만성 HBV 감염을 치료하고 및/또는 예방하는 데 이용을 위한 RTEL1 표적화 핵산 분자의 용도에 관계한다. 본원 발명은 특히, cccDNA, 예컨대 HBV cccDNA를 불안정화하기 위한 RTEL1 저해제의 용도에 관계한다. 제약학적 조성물 및 HBV 감염의 치료 및/또는 예방에서 이의 용도 역시 본원 발명 내에 포함된다.
배경
B형 간염은 역전사를 통해 복제하는 작은 간친화성 바이러스인 B형 간염 바이러스 (HBV)에 의해 유발되는 감염성 질환이다. 만성 HBV 감염은 심각한 간 질환, 예컨대 간경화증 및 간세포 암종에 대한 핵심 인자이다. 만성 HBV 감염에 대한 현재의 치료는 다중기능성 역전사효소인 바이러스 중합효소를 표적으로 하는 페길화된 1형 인터페론 또는 뉴클레오시(티)드 유사체, 예컨대 라미부딘, 아데포비르, 엔테카비르, 테노포비르 디소프록실 및 테노포비르 알라페나미드의 투여에 기초된다. 치료 성공은 통상적으로, B형 간염 표면 항원 (HBsAg)의 상실로서 계측된다. 하지만, 완전한 HBsAg 소실은 좀처럼 달성되지 않는데, 그 이유는 B형 간염 바이러스 DNA가 감염 후 체내에서 존속하기 때문이다. HBV 존속은 핵에서 안정되게 유지되는 HBV 유전체의 에피솜 형태에 의해 매개된다. 이러한 에피솜 형태는 "공유결합 폐쇄 환상 DNA" (cccDNA)로 불린다. cccDNA는 바이러스 복제 중간산물인 전유전체 RNA (pgRNA)를 비롯한, 모든 HBV 전사체에 대한 주형으로서 역할을 한다. cccDNA의 소수 사본의 존재가 완전히 진행된 HBV 감염을 재개하는 데 충분할지도 모른다. HBV에 대한 현재의 치료는 cccDNA를 표적으로 하지 않는다. 하지만, 만성 HBV 감염의 치유는 cccDNA의 제거를 필요로 할 것이다 (Nassal, Gut. 2015 Dec;64(12):1972-84. doi: 10.1136/gutjnl-2015-309809에 의해 검토됨).
말단소립 신장 헬리카아제 1 (RTEL1)의 조절인자는 말단소립의 안정성, 보호 및 신장에서 기능하고, 그리고 DNA 복제 동안 말단소립을 보호하는 것으로 알려진 셀테린 복합체에서 단백질과 상호작용하는 DNA 헬리카아제를 인코딩한다. 이러한 유전자에서 돌연변이는 선천성 각화이상증 및 Hoyerall-Hreidarsson 증후군과 연관되었다 (참조: 예를 들면, Vannier et al 2014 Trends Cell Biol. Vol 24 p.416에 의한 검토).
핵 내에 위치되면, RTEL1은 말단소립-길이 조절, DNA 수복 및 유전체 안정성의 유지에 연루된 ATP-의존성 DNA 헬리카아제로서 기능한다. RTEL1은 독성 재조합을 상쇄시키고, 감수분열 동안 교차를 제한하고, 가닥 침투 사건을 물리적으로 분리함으로써 감수분열 재조합 및 교차 항상성을 조절하고, 그리고 따라서 감수분열 합성 의존성 가닥 어닐링 (SDSA)뿐만 아니라 D 루프 재조합 중간체의 분해에 의해 비-교차 수복을 증진하는 항-재조합효소로서 행동한다. 게다가 RTEL1은 T 루프를 분해하고, 그리고 말단 G4-DNA 구조를 상쇄시킴으로써 말단소립 취약성을 예방하는데, 이들은 함께 말단소립의 동역학 및 안정성을 담보한다.
RTEL1은 siRNA 스크린에서 HPV 에피솜의 안정제로서 확인되었다: (Edwards et al 2013 PLoS One Vol 8, e75406). RTEL1을 표적으로 하는 siRNA가 Hoyeraal-Hreidarsson 증후군에서 RTEL1과의 반응물을 확인하는 데 유사하게 이용되었다 (Schertzer et al 2015 Nucleic Acid Res Vol 43 p. 1834). 이에 더하여, RTEL1은 HIV 감염 저해를 위한 표적을 제공하기 위한, 필수적인 숙주 단백질에 대한 siRNA 스크린으로부터 HIV 숙주 의존성 인자로서 확인되었다 (WO 2007/094818).
우리가 아는 바로는, RTEL1이 cccDNA 안정성 및 유지의 맥락에서 cccDNA 의존성 인자로서 확인된 바가 없을 뿐만 아니라, RTEL1을 저해하는 분자가 HBV 감염의 치료를 위한 cccDNA 불안정화제로서 제안된 바가 없다.
발명의 목적
본원 발명은 HBV 감염된 세포에서 RTEL1의 저해 및 cccDNA의 감소 사이에 상관관계가 있고, 이것이 HBV 감염된 개체의 치료에서 유의미하다는 것을 보여준다. 본원 발명의 목적은 HBV 감염된 세포에서 cccDNA를 감소시키는 RTEL1 저해제를 확인하는 것이다. 이런 RTEL1 저해제는 HBV 감염의 치료에서 이용될 수 있다.
본원 발명은 시험관내와 생체내에서 RTEL1의 발현을 저해할 수 있는 신규한 핵산 분자를 더욱 확인한다.
발명의 요약
본원 발명은 RTEL1의 발현을 조절할 수 있는 핵산을 표적으로 하는 올리고뉴클레오티드에 관계하고, 그리고 RTEL1의 기능에 관련된 질환을 치료하거나 예방하는 것에 관계한다.
따라서, 첫 번째 양상에서 본원 발명은 B형 간염 바이러스 (HBV) 감염의 치료 및/또는 예방에서 이용을 위한 RTEL1 저해제를 제공한다. 특히, cccDNA 및/또는 전유전체 RNA (pgRNA)를 감소시킬 수 있는 RTEL1 저해제가 유용하다. 이런 저해제는 유리하게는, RTEL1 mRNA를 감소시킬 수 있는 길이에서 12 내지 60개 뉴클레오티드의 핵산 분자, 예컨대 포유류 RTEL1에 상보적인 단일 가닥 안티센스 올리고뉴클레오티드, siRNA 또는 shRNA에서 선택된다.
추가의 양상에서 본원 발명은 포유류 RTEL1에 상보적인 적어도 10개 뉴클레오티드, 특히 16 내지 20개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는 12-60개 뉴클레오티드, 예컨대 12-30개 뉴클레오티드의 올리고뉴클레오티드에 관계한다. 이런 올리고뉴클레오티드는 RTEL1의 발현을 저해할 수 있다. 상기 올리고뉴클레오티드는 단일 가닥 안티센스 올리고뉴클레오티드 또는 shRNA 핵산 분자일 수 있다.
안티센스 올리고뉴클레오티드는 갭머 설계를 가질 수 있다. 바람직하게는, 안티센스 올리고뉴클레오티드는 표적 핵산의 개열에 의해 RTEL1의 발현을 저해할 수 있다. 개열은 바람직하게는 뉴클레아제 모집을 통해 달성된다.
추가의 양상에서, 본원 발명은 본원 발명의 안티센스 올리고뉴클레오티드 및 제약학적 부형제를 포함하는 제약학적 조성물을 제공한다.
추가의 양상에서, 본원 발명은 RTEL1을 발현하는 표적 세포에 본원 발명의 안티센스 올리고뉴클레오티드 또는 조성물을 효과량으로 투여함으로써, 상기 세포에서 RTEL1 발현의 조절을 위한 생체내 또는 시험관내 방법을 위한 방법을 제공한다.
추가의 양상에서 본원 발명은 RTEL1의 생체내 활성과 연관된 질환, 장애 또는 기능장애를 치료하거나 예방하기 위한 방법을 제공하는데, 이들 방법은 본원 발명의 안티센스 올리고뉴클레오티드의 치료 또는 예방 효과량을 상기 질환, 장애 또는 기능장애를 앓거나 또는 이것에 취약한 개체에게 투여하는 단계를 포함한다.
본원 발명의 추가 양상은 본원 발명의 핵산 분자의 접합체 및 본원 발명의 분자를 포함하는 제약학적 조성물이다. 특히 간을 표적으로 하는 접합체, 예컨대 GalNAc 클러스터가 관심된다.
도면의 간단한 설명
도 1: 예시적인 안티센스 올리고뉴클레오티드 접합체를 도해하는데, 여기서 올리고뉴클레오티드는 물결선 (A-D)으로서 또는 "올리고뉴클레오티드" (E-H)로서 또는 T2 (I)로서 표현되고, 그리고 아시알로당단백질 수용체 표적화 접합 모이어티는 삼가 N-아세틸갈락토사민 모이어티이다. 화합물 A 내지 D는 디-리신 가지치기 분자, PEG3 스페이서 및 3개의 말단 GalNAc 탄수화물 모이어티를 포함한다. 화합물 A 및 B에서 올리고뉴클레오티드는 링커 없이 아시알로당단백질 수용체 표적화 접합 모이어티에 직접적으로 부착된다. 화합물 C 및 D에서 올리고뉴클레오티드는 C6 링커를 통해 아시알로당단백질 수용체 표적화 접합 모이어티에 부착된다. 화합물 E-I는 상업적으로 가용한 트레블러 가지치기 분자 및 변하는 길이와 구조의 스페이서 및 3개의 말단 GalNAc 탄수화물 모이어티를 포함한다.
도 1: 예시적인 안티센스 올리고뉴클레오티드 접합체를 도해하는데, 여기서 올리고뉴클레오티드는 물결선 (A-D)으로서 또는 "올리고뉴클레오티드" (E-H)로서 또는 T2 (I)로서 표현되고, 그리고 아시알로당단백질 수용체 표적화 접합 모이어티는 삼가 N-아세틸갈락토사민 모이어티이다. 화합물 A 내지 D는 디-리신 가지치기 분자, PEG3 스페이서 및 3개의 말단 GalNAc 탄수화물 모이어티를 포함한다. 화합물 A 및 B에서 올리고뉴클레오티드는 링커 없이 아시알로당단백질 수용체 표적화 접합 모이어티에 직접적으로 부착된다. 화합물 C 및 D에서 올리고뉴클레오티드는 C6 링커를 통해 아시알로당단백질 수용체 표적화 접합 모이어티에 부착된다. 화합물 E-I는 상업적으로 가용한 트레블러 가지치기 분자 및 변하는 길이와 구조의 스페이서 및 3개의 말단 GalNAc 탄수화물 모이어티를 포함한다.
정의
HBV 감염
용어 "B형 간염 바이러스 감염" 또는 "HBV 감염"은 당해 분야에 통상적으로 공지되고, 그리고 B형 간염 바이러스 (HBV)에 의해 유발되고 간에 영향을 주는 감염성 질환을 지칭한다. HBV 감염은 급성 또는 만성 감염일 수 있다. 만성 B형 간염 바이러스 (CHB) 감염은 전 세계적으로 248 백만 명에게 영향을 주는 전체적 질환 부담이다. 연간 대략 686,000건의 사망이 HBV-관련된 말기 간 질환 및 간세포 암종 (HCC)에 기인한다 (GBD 2013; Schweitzer et al., 2015). WHO는 확대된 개입이 없다면, CHB 감염을 안고 살아가는 사람들의 숫자가 다가오는 40-50 년 동안 현재와 같은 높은 수준에 머물러 있을 것이며, 2015년 및 2030년 사이에 누적으로 20 백만 건의 사망이 발생할 것이라고 예측하였다 (WHO 2016). CHB 감염은 단일한 임상적 표현을 나타내는 균질한 질환이 아니다. 감염된 개체는 그들의 일생 동안 CHB-연관된 간 질환의 여러 시기를 겪게 된다; 질환의 이들 시기 또한, 관리 기준 (SOC)으로 치료에 대한 기초가 된다. 현재 지침은 3가지 기준 - 혈청 ALT 수준, HBV DNA 수준, 그리고 간 질환의 심각도에 근거하여 선별된 CHB-감염된 개체만을 치료하도록 권고한다 (EASL, 2017). 이러한 권고는 SOC, 다시 말하면, 뉴클레오시(티)드 유사체 (NA) 및 페길화된 인터페론-알파 (PEG-IFN)가 치유력이 없고 긴 기간 동안 투여되어야 하고, 따라서 그들의 안전성 위험이 증가한다는 사실에 기인하였다. NA는 HBV DNA 복제를 효과적으로 저해한다; 하지만, 이들은 다른 바이러스 마커에 대한 매우 한정된 효과를 갖거나/효과가 없다. HBV 감염의 2가지 홀마크, B형 간염 표면 항원 (HBsAg) 및 공유결합 폐쇄 환상 DNA (cccDNA)가 HBV 치유를 목적으로 하는 신규한 약물의 주된 표적이다. CHB 개체의 혈장에서, HBsAg 서브바이러스 (비어 있는) 입자는 103 내지 105의 계수로 HBV 비리온보다 숫자가 더 많다 (Ganem & Prince, 2014); 이의 과잉은 급성 HBV 감염의 해소 이후에 관찰되는 혈청학적 마커인 중화 항-HBs 항체를 개체가 발달시킬 수 없는 것을 비롯하여, 상기 질환의 면역병인에 기여하는 것으로 생각된다.
cccDNA (공유결합 폐쇄 환상 DNA)
cccDNA는 감염된 간세포의 핵 내에 체류하는 바이러스 유전적 주형인데, 여기서 이것은 생산적 감염에 필요하고 만성 HBV 감염의 자연 코스 동안 바이러스 존속을 책임지는 모든 HBV RNA 전사체를 생성한다 (Locarnini & Zoulim, 2010 Antivir Ther. 15 Suppl 3:3-14. doi: 10.3851/IMP1619). 바이러스 병원소로서 작용하는 cccDNA는 치료의 휴지 후 바이러스 반동의 근원이며, 장기간, 종종, 평생 치료를 필요하게 만든다. PEG-IFN은 이의 다양한 부작용으로 인해 CHB의 작은 부분집합에게만 투여될 수 있다.
결과적으로, HBV cccDNA의 분해 또는 제거에 의해 규정되는 완전한 치유를 대다수의 CHB 환자에게 전달할 수 있는 신규한 요법이 고도로 요구된다.
화합물
본원에서, 용어 "화합물"은 RTEL1 발현 또는 활성을 저해할 수 있는 임의의 분자를 의미한다. 본원 발명의 특정 화합물은 핵산 분자, 예컨대 본원 발명에 따른 RNAi 분자 또는 안티센스 올리고뉴클레오티드, 또는 이런 핵산 분자를 포함하는 임의의 접합체이다. 예를 들면, 본원에서 화합물은 RTEL1을 표적으로 하는 핵산 분자, 특히 안티센스 올리고뉴클레오티드 또는 siRNA일 수 있다.
올리고뉴클레오티드
본원에서 이용된 용어 "올리고뉴클레오티드"는 당업자에게 일반적으로 이해되는 바와 같이 2개 또는 그 이상의 공유 결합된 뉴클레오시드를 포함하는 분자로서 규정된다. 이런 공유 결합된 뉴클레오시드는 또한 핵산 분자 또는 소중합체로 지칭될 수 있는데, 이들은 교체가능하게 이용될 수 있다.
상세한 설명 및 청구항에서 지칭된 올리고뉴클레오티드는 일반적으로 길이에서 70개 미만 뉴클레오티드의 치료적 올리고뉴클레오티드이다. 올리고뉴클레오티드는 단일 가닥 안티센스 올리고뉴클레오티드이거나 또는 이를 포함할 수 있거나, 또는 다른 소중합성 핵산 분자, 예컨대 CRISPR RNA, siRNA, shRNA, 앱타머 또는 리보자임일 수 있다. 치료적 올리고뉴클레오티드 분자는 통상적으로 실험실에서 고체상 화학적 합성, 그 이후에 정제 및 단리에 의해 제조된다. 하지만, shRNA는 종종 렌티바이러스 벡터를 이용하여 세포에 전달되고, 이후 이들로부터 전사되어 RNA 간섭 기구 (RNA-유도 침묵 복합체 (RISC) 포함)와 상호작용할 수 있는 스템 루프 (헤어핀) RNA 구조를 형성할 단일 가닥 RNA를 생성한다. 본원 발명의 구체예에서 shRNA는 화학적으로 생산된 shRNA 분자이다 (플라스미드 또는 바이러스로부터 세포 기초된 발현에 의존하지 않음).
올리고뉴클레오티드의 서열을 언급할 때, 공유 결합된 뉴클레오티드 또는 뉴클레오시드의 핵염기 모이어티 또는 이의 변형체의 서열 또는 순서가 언급된다. 일반적으로, 본원 발명의 올리고뉴클레오티드는 인공적이고 화학적으로 합성되며 전형적으로 정제 또는 단리된다. 하지만 일부 구체예에서 본원 발명의 올리고뉴클레오티드는 표적 세포 내로 진입 시에 벡터로부터 전사되는 shRNA이다. 본원 발명의 올리고뉴클레오티드는 하나 또는 그 이상의 변형된 뉴클레오시드 또는 뉴클레오티드를 포함할 수 있다.
일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 길이에서 10 내지 70개 뉴클레오티드, 예컨대 길이에서 12 내지 60개, 예컨대 13 내지 50개, 예컨대 14 내지 40개, 예컨대 15 내지 30개, 예컨대 12-25개, 예컨대 16 내지 22개, 예컨대 16 내지 20개의 연속 뉴클레오티드를 포함하거나 또는 이들로 구성된다. 따라서, 본원 발명의 올리고뉴클레오티드는 일부 구체예에서, 12-25개 뉴클레오티드의 길이를 가질 수 있다. 대안으로, 본원 발명의 올리고뉴클레오티드는 일부 구체예에서, 15-22개 뉴클레오티드의 길이를 가질 수 있다.
일부 구체예에서, 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 24개 또는 그 이하의 뉴클레오티드, 예컨대 22개의 뉴클레오티드, 예컨대 20개 또는 그 이하의 뉴클레오티드, 예컨대 18개 또는 그 이하의 뉴클레오티드, 예컨대 14, 15, 16 또는 17개의 뉴클레오티드를 포함하거나 또는 이들로 구성된다. 본원에 제공된 임의의 범위는 범위의 종점을 포함하는 것으로 이해되어야 한다. 따라서, 핵산 분자가 12 내지 25개의 뉴클레오티드를 포함한다고 일컬어지는 경우에, 12개 및 25개의 뉴클레오티드 둘 모두 포함된다.
일부 구체예에서, 연속 뉴클레오티드 서열은 길이에서 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 또는 22개의 연속 뉴클레오티드를 포함하거나 이들로 구성된다.
올리고뉴클레오티드(들)는 포유동물에서 표적 핵산의 발현을 조절하기 위한 것이다. 일부 구체예에서, siRNA, shRNA 또는 안티센스 올리고뉴클레오티드와 같은 핵산 분자는 전형적으로 표적 핵산(들)의 발현을 저해하기 위한 것이다.
본원 발명의 구체예에서, 올리고뉴클레오티드는 RNAi 작용제, 예컨대 siRNA 또는 shRNA에서 선택된다. 다른 구체예에서, 올리고뉴클레오티드는 단일 가닥 안티센스 올리고뉴클레오티드, 예컨대 RNaseH와 상호작용하는 높은 친화성 변형된 안티센스 올리고뉴클레오티드이다.
일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 하나 또는 그 이상의 변형된 뉴클레오시드 또는 뉴클레오티드, 예컨대 2' 당 변형된 뉴클레오시드를 포함할 수 있다.
일부 구체예에서, 올리고뉴클레오티드는 포스포로티오에이트 뉴클레오시드간 연쇄를 포함한다.
일부 구체예에서, 올리고뉴클레오티드는 비-뉴클레오시드 모이어티 (접합 모이어티)에 접합될 수 있다.
올리고뉴클레오티드의 라이브러리는 변이체 올리고뉴클레오티드의 집합물인 것으로 이해되어야 한다. 올리고뉴클레오티드의 라이브러리의 목적은 변할 수 있다. 일부 구체예에서, 올리고뉴클레오티드의 라이브러리는 올리고뉴클레오티드의 라이브러리 내에 가장 강력한 서열을 확인하는 목적으로, 하나 또는 그 이상의 포유류 RTEL1 표적 핵산을 표적으로 하는 중첩되는 핵염기 서열을 갖는 올리고뉴클레오티드로 구성된다. 일부 구체예에서, 올리고뉴클레오티드의 라이브러리는 부모 또는 조상 올리고뉴클레오티드의 올리고뉴클레오티드 설계 변이체 (자식 핵산 분자)의 라이브러리인데, 여기서 이들 올리고뉴클레오티드 설계 변이체는 부모 핵산 분자의 코어 핵염기 서열을 유지한다.
안티센스 올리고뉴클레오티드
본원에서 이용된 용어 "안티센스 올리고뉴클레오티드"는 표적 핵산, 특히 표적 핵산 상의 연속 서열에 혼성화함으로써 표적 유전자의 발현을 조절할 수 있는 올리고뉴클레오티드로서 규정된다. 본원에서 안티센스 올리고뉴클레오티드는 본질적으로 이중 가닥이 아니고, 그리고 이런 이유로 siRNA 또는 shRNA가 아니다. 바람직하게는, 본원 발명의 안티센스 올리고뉴클레오티드는 단일 가닥이다. 본원 발명의 단일 가닥 올리고뉴클레오티드는, 내적으로 또는 상호간에 자기-상보성의 정도가 올리고뉴클레오티드의 전체 길이에 걸쳐 50% 미만인 한, 헤어핀 또는 분자간 이중나선 구조 (동일한 올리고뉴클레오티드의 두 분자 사이의 이중나선)를 형성할 수 있는 것으로 이해된다.
바람직하게는, 본원 발명의 단일 가닥 안티센스 올리고뉴클레오티드는 RNA 뉴클레오시드를 내포하지 않는데, 그 이유는 이것이 뉴클레아제 내성을 감소시킬 것이기 때문이다.
바람직하게는, 본원 발명의 올리고뉴클레오티드는 하나 또는 그 이상의 변형된 뉴클레오시드 또는 뉴클레오티드, 예컨대 2' 당 변형된 뉴클레오시드를 포함한다. 또한, 변형되지 않은 뉴클레오시드는 DNA 뉴클레오시드인 것이 바람직하다.
RNAi 분자
본원에서, 용어 "RNA 간섭 (RNAi) 분자"는 세포의 세포질에서 RNA-유도된 침묵 복합체 (RISC)를 통해 RNA-의존성 유전자 침묵을 유도할 수 있는 짧은 이중 가닥 RNA 기초된 올리고뉴클레오티드를 지칭하는데, 여기서 이들은 촉매성 RISC 성분 아르고노트와 상호작용한다. RNAi 분자는 세포, 예를 들면, 개체, 예컨대 포유류 개체 내에 세포에서 표적 핵산의 발현을 조절한다, 예를 들면, 저해한다. RNAi 분자의 한 가지 유형은 짧은 간섭 RNA (siRNA)인데, 이것은 2개의 상보성 올리고뉴클레오티드로 구성되는 이중 가닥 RNA 분자이고, 여기서 전사 후 상보성 mRNA에 한쪽 가닥의 결합은 이의 분해 및 번역의 상실을 야기한다. 작은 헤어핀 RNA (shRNA)는 DICER 및 RNA 유도된 침묵 복합체 (RISC)를 통해 mRNA를 감소시킬 수 있는 스템 루프 (헤어핀) 구조를 형성하는 단일 가닥 RNA-기초된 올리고뉴클레오티드이다. RNAi 분자는 관심되는 유전자의 서열 (표적 핵산)에 기초하여 설계될 수 있다. 상응하는 RNAi는 이후, 화학적으로 또는 시험관내 전사에 의해 합성되거나, 또는 벡터 또는 PCR 산물로부터 발현될 수 있다.
siRNA
용어 siRNA는 짧은 간섭 리보핵산 RNAi 분자를 지칭한다. 이것은 이중 가닥 RNA 분자의 한 부류이며, 당해 분야에서 짧은 간섭 RNA 또는 침묵 RNA로서 또한 알려져 있다. siRNA는 전형적으로 센스 가닥 (운송 가닥으로서 또한 지칭됨) 및 안티센스 가닥 (안내 가닥으로서 또한 지칭됨)을 포함하는데, 여기서 각 가닥은 길이에서 17 - 30개 뉴클레오티드, 전형적으로 길이에서 19 - 25개 뉴클레오시드이고, 여기서 상기 안티센스 가닥은 표적 핵산 (적절하게는 성숙 mRNA 서열)에 상보적, 예컨대 적어도 95% 상보적, 예컨대 완전히 상보적이고, 그리고 센스 가닥은 센스 가닥 및 안티센스 가닥이 이중나선 또는 이중나선 영역을 형성하도록 안티센스 가닥에 상보적이다. siRNA 가닥은 평활 말단 이중나선을 형성할 수 있거나, 또는 유리하게는 센스와 안티센스 가닥 3' 단부는 생체내에서 RISC 기질을 형성하는, Dicer에 의해 생산된 산물과 유사한 예를 들면, 1, 2 또는 3개 뉴클레오시드의 3' 오버행을 형성할 수 있다. 효과적인 신장된 형태의 Dicer 기질은 본원에 참조로서 편입된 US 8,349,809 및 US 8,513,207에서 기술되었다. 일부 구체예에서, 센스 가닥 및 안티센스 가닥 둘 모두 2nt 3' 오버행을 갖는다. 이중나선 영역은 이런 이유로, 예를 들면, 길이에서 17 - 25개 뉴클레오티드, 예컨대 길이에서 21-23개 뉴클레오티드일 수 있다.
일단 세포 내부에 위치하면, 안티센스 가닥은 RISC 복합체 내로 통합되고, 이것은 표적 핵산의 표적 분해 또는 표적 저해를 매개한다. siRNA는 전형적으로 RNA 뉴클레오시드 이외에 변형된 뉴클레오시드를 포함한다. 한 구체예에서 siRNA 분자는 변형된 뉴클레오티드간 연쇄 및 2' 당 변형된 뉴클레오시드, 예컨대 LNA 및 cET 또는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA (MOE), 2'-아미노-DNA, 2'-플루오로-DNA, 아라비노 핵산 (ANA), 2'-플루오로-ANA의 2' 치환된 변형체를 비롯한, 2'-4' 이중환상 리보오스 변형된 뉴클레오시드를 이용하여 화학적으로 변형될 수 있다. 특히 2'플루오로, 2'-O-메틸 또는 2'-O-메톡시에틸이 siRNA 내로 통합될 수 있다.
일부 구체예에서 siRNA 센스 (운송) 가닥의 모든 뉴클레오티드는 2' 당 변형된 뉴클레오시드, 예컨대 LNA으로 변형될 수 있다 (참조: 예를 들면, WO2004/083430, WO2007/085485). 일부 구체예에서 siRNA의 운송 가닥은 불연속적일 수 있다 (참조: 예를 들면, WO2007/107162). siRNA의 안티센스 가닥의 씨앗 영역에서 발생하는 열에 의한 불안정화 뉴클레오티드의 통합은 siRNA의 표적 이탈 활성을 감소시키는 데 유용한 것으로 보고되었다 (참조: 예를 들면, WO2018/098328). 적절하게는 siRNA는 안티센스 가닥의 5' 단부에서 5' 인산염 기 또는 5'-인산염 모방체를 포함한다. 일부 구체예에서 안티센스 가닥의 5' 단부는 RNA 뉴클레오시드이다.
한 구체예에서, siRNA 분자는 적어도 하나의 포스포로티오에이트 또는 메틸포스포네이트 뉴클레오시드간 연쇄를 더욱 포함한다. 포스포로티오에이트 또는 메틸포스포네이트 뉴클레오시드간 연쇄는 어느 한쪽 또는 양쪽 가닥 (예를 들면, 안티센스 가닥; 또는 센스 가닥)의 3' 말단에 있을 수 있거나; 또는 포스포로티오에이트 또는 메틸포스포네이트 뉴클레오시드간 연쇄는 어느 한쪽 또는 양쪽 가닥 (예를 들면, 안티센스 가닥; 또는 센스 가닥)의 5' 말단에 있을 수 있거나; 또는 포스포로티오에이트 또는 메틸포스포네이트 뉴클레오시드간 연쇄는 어느 한쪽 또는 양쪽 가닥 (예를 들면, 안티센스 가닥; 또는 센스 가닥)의 5' 말단 및 3' 말단 둘 모두에 있을 수 있다. 일부 구체예에서 나머지 뉴클레오시드간 연쇄는 포스포디에스테르 연쇄이다. 일부 구체예에서, siRNA 분자는 하나 또는 그 이상의 포스포로티오에이트 뉴클레오시드간 연쇄를 포함한다. siRNA 분자에서 포스포로티오에이트 뉴클레오시드간 연쇄는 RICS에서 뉴클레아제 개열을 감소시킬 수 있고, 이런 이유로 안티센스 가닥에서 모든 뉴클레오시드간 연쇄가 변형되지는 않는 것이 바람직하다.
siRNA 분자는 리간드를 더욱 포함할 수 있다. 일부 구체예에서, 리간드는 센스 가닥의 3' 단부에 접합된다.
생물학적 분포를 위해, siRNA는 표적화 리간드에 접합될 수 있고 및/또는 예를 들면, 지질 나노입자로 조제될 수 있다.
본원 발명의 다른 양상은 dsRNA, 예컨대 치료적 용도에 적합한 siRNA 분자를 포함하는 제약학적 조성물, 그리고 예를 들면, 본원에서 개시된 바와 같은 다양한 질환 상태의 치료를 위해 이들 dsRNA 분자, 예컨대 본원 발명의 siRNA를 투여함으로써 표적 유전자의 발현을 저해하는 방법에 관계한다.
shRNA
짧은 헤어핀 RNA 또는 shRNA 분자는 일반적으로 길이에서 40 내지 70개의 뉴클레오티드, 예컨대 길이에서 45 내지 65개의 뉴클레오티드, 예컨대 길이에서 50 내지 60개의 뉴클레오티드이고 스템 루프 (헤어핀) RNA 구조를 형성하는데, 상기 구조는 Dicer로 알려진 엔도뉴클레아제와 상호작용하고, 이것은 dsRNA를 특징적인 2개의 염기 3' 오버행을 갖는 19-23개 염기쌍 짧은 간섭 RNA로 처리하는 것으로 생각되고, 이들은 이후 RNA-유도 침묵 복합체 (RISC) 내로 통합된다. 적합한 표적 mRNA에 결합 시에, RISC 내에 하나 또는 그 이상의 엔도뉴클레아제가 표적을 개열하여 침묵을 유도한다. RNAi 올리고뉴클레오티드는 변형된 뉴클레오티드간 연쇄 및 2' 당 변형된 뉴클레오시드, 예컨대 LNA 및 cET 또는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA (MOE), 2'-아미노-DNA, 2'-플루오로-DNA, 아라비노 핵산 (ANA), 2'-플루오로-ANA의 2' 치환된 변형체를 비롯한 2'-4' 이중환상 리보오스 변형된 뉴클레오시드를 이용하여 화학적으로 변형될 수 있다.
일부 구체예에서, shRNA 핵산 분자는 하나 또는 그 이상의 포스포로티오에이트 뉴클레오시드간 연쇄를 포함한다. RNAi 분자에서 포스포로티오에이트 뉴클레오시드간 연쇄는 RICS에서 뉴클레아제 개열을 감소시킬 수 있고, 이런 이유로 shRNA 분자의 스템 루프에서 모든 뉴클레오시드간 연쇄가 변형되지는 않는 것이 바람직하다. 포스포로티오에이트 뉴클레오시드간 연쇄는 바람직하게는 shRNA 분자의 스템 루프의 3' 및/또는 5' 단부 내에, 특히 표적 핵산에 상보적이지 않은 분자의 부분 (예를 들면, siRNA 분자의 센스 가닥 또는 운송 가닥) 내에 위치할 수 있다. 하지만, 표적 핵산에 상보적인 shRNA 분자의 영역은 또한, Dicer에 의한 개열 이후에 3' 및/또는 5' 말단이 될 것으로 예측되는 부분에서 첫 2 내지 3개의 뉴클레오시드간 연쇄에서 변형될 수도 있다.
연속 뉴클레오티드 서열
용어 "연속 뉴클레오티드 서열"은 표적 핵산에 상보적인 올리고뉴클레오티드의 영역을 지칭한다. 상기 용어는 본원에서 용어 "연속 핵염기 서열" 및 용어 "올리고뉴클레오티드 모티프 서열"과 교체가능하게 이용된다. 일부 구체예에서, 올리고뉴클레오티드의 모든 뉴클레오티드는 연속 뉴클레오티드 서열을 구성한다. 일부 구체예에서 연속 뉴클레오티드 서열은 siRNA 분자의 안내 가닥 내에 포함된다. 일부 구체예에서 연속 뉴클레오티드 서열은 표적 핵산에 100% 상보적인 shRNA 분자의 부분이다. 일부 구체예에서 올리고뉴클레오티드는 연속 뉴클레오티드 서열, 예컨대 F-G-F' 갭머 영역을 포함하고, 그리고 기능기 (예를 들면, 표적화를 위한 접합체 기)를 연속 뉴클레오티드 서열에 부착하는 데 이용될 수 있는 추가 뉴클레오티드(들), 예를 들면 뉴클레오티드 링커 영역을 임의적으로 포함할 수 있다. 뉴클레오티드 링커 영역은 표적 핵산에 상보적이거나 상보적이지 않을 수 있다. 일부 구체예에서, 안티센스 올리고뉴클레오티드의 핵염기 서열은 연속 뉴클레오티드 서열이다. 일부 구체예에서, 연속 뉴클레오티드 서열은 표적 핵산에 100% 상보적이다.
뉴클레오티드 및 뉴클레오시드
뉴클레오티드 및 뉴클레오시드는 올리고뉴클레오티드 및 폴리뉴클레오티드의 빌딩 블록이고, 그리고 본원 발명의 목적을 위해 자연 발생 및 비자연 발생 뉴클레오티드 및 뉴클레오시드를 모두 포함한다. 자연에서, 뉴클레오티드, 예컨대 DNA와 RNA 뉴클레오티드는 리보오스 당 모이어티, 핵염기 모이어티 및 하나 또는 그 이상의 인산염 기 (뉴클레오시드에는 없음)를 포함한다. 뉴클레오시드 및 뉴클레오티드는 또한 "단위" 또는 "단량체"로 교체가능하게 지칭될 수 있다.
변형된 뉴클레오시드
본원에서 이용된 용어 "변형된 뉴클레오시드" 또는 "뉴클레오시드 변형"은 당 모이어티 또는 (핵)염기 모이어티에 하나 또는 그 이상의 변형을 도입함으로써 등가 DNA 또는 RNA 뉴클레오시드와 비교하여 변형된 뉴클레오시드를 지칭한다. 바람직한 구체예에서, 변형된 뉴클레오시드는 변형된 당 모이어티를 포함한다. 용어 변형된 뉴클레오시드는 또한 본원에서 용어 "뉴클레오시드 유사체" 또는 변형된 "단위" 또는 변형된 "단량체"와 교체가능하게 이용될 수 있다. 변형되지 않은 DNA 또는 RNA 당 모이어티를 갖는 뉴클레오시드는 본원에서 DNA 또는 RNA 뉴클레오시드로 명명된다. DNA 또는 RNA 뉴클레오시드의 염기 영역 내에서 변형을 갖는 뉴클레오시드는 왓슨 크릭 (Watson Crick) 염기 대합을 허용하면, 여전히 일반적으로 DNA 또는 RNA로 명명된다.
변형된 뉴클레오시드간 연쇄
용어 "변형된 뉴클레오시드간 연쇄"는 당업자에 의해 일반적으로 이해되는 바와 같이 2개의 뉴클레오시드를 함께 공유 결합하는, 포스포디에스테르 (PO) 연쇄 이외의 연쇄로서 규정된다. 본원 발명의 올리고뉴클레오티드는 이런 이유로, 하나 또는 그 이상의 변형된 뉴클레오시드간 연쇄, 예컨대 하나 또는 그 이상의 포스포로티오에이트 뉴클레오시드간 연쇄, 또는 하나 또는 그 이상의 포스포로디티오에이트 뉴클레오시드간 연쇄를 포함할 수 있다. 일부 구체예에서, 변형된 뉴클레오시드간 연쇄는 포스포디에스테르 연쇄와 비교하여 올리고뉴클레오티드의 뉴클레아제 내성을 증가시킨다. 자연 발생 올리고뉴클레오티드의 경우, 뉴클레오시드간 연쇄는 인접한 뉴클레오시드 사이에 포스포디에스테르 결합을 생성하는 인산염 기를 포함한다. 변형된 뉴클레오시드간 연쇄는 생체내 이용을 위해 올리고뉴클레오티드를 안정화시키는 데 특히 유용하고, 그리고 본원 발명의 올리고뉴클레오티드 내에 DNA 또는 RNA 뉴클레오시드의 영역에서, 예를 들면 갭머 올리고뉴클레오티드의 갭 영역 G 내에서 뿐만 아니라 영역 F 및 F'와 같은 변형된 뉴클레오시드의 영역에서 뉴클레아제 개열로부터 보호하는 역할을 할 수 있다.
한 구체예에서, 올리고뉴클레오티드는 자연 포스포디에스테르로부터 변형된 하나 또는 그 이상의 뉴클레오시드간 연쇄, 예컨대 뉴클레아제 공격에 더욱 내성이 있는 하나 또는 그 이상의 변형된 뉴클레오시드간 연쇄를 포함한다. 뉴클레아제 내성은 혈청에서 올리고뉴클레오티드를 배양함으로써 또는 뉴클레아제 내성 분석 (예를 들면, 뱀 독 포스포디에스테라아제 (SVPD))을 이용함으로써 판별될 수 있으며, 이들 둘 모두 당해 분야에 잘 알려져 있다. 올리고뉴클레오티드의 뉴클레아제 내성을 향상시킬 수 있는 뉴클레오시드간 연쇄는 뉴클레아제 내성 뉴클레오시드간 연쇄로 지칭된다. 일부 구체예에서 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열에서 뉴클레오시드간 연쇄 중에서 적어도 50%가 변형된다, 예컨대 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열에서 뉴클레오시드간 연쇄 중에서 적어도 60%, 예컨대 적어도 70%, 예컨대 적어도 75%, 예컨대 적어도 80%, 또는 예컨대 적어도 90%가 변형된다. 일부 구체예에서 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열의 모든 뉴클레오시드간 연쇄가 변형된다. 일부 구체예에서 본원 발명의 올리고뉴클레오티드를 비뉴클레오티드 기능기, 예컨대 접합체에 연결하는 뉴클레오시드는 포스포디에스테르일 수 있는 것으로 인식될 것이다. 일부 구체예에서, 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열의 모든 뉴클레오시드간 연쇄는 뉴클레아제 내성 뉴클레오시드간 연쇄이다.
본원 발명의 올리고뉴클레오티드에서 포스포로티오에이트 뉴클레오시드간 연쇄를 이용하는 것이 바람직하다.
포스포로티오에이트 뉴클레오시드간 연쇄는 뉴클레아제 내성, 유리한 약물동력학 및 제조 용이성으로 인해 특히 유용하다. 일부 구체예에서, 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열에서 뉴클레오시드간 연쇄 중에서 적어도 50%는 포스포로티오에이트이다, 예컨대 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열에서 뉴클레오시드간 연쇄 중에서 적어도 60%, 예컨대 적어도 70%, 예컨대 적어도 75%, 예컨대 적어도 80%, 또는 예컨대 적어도 90%는 포스포로티오에이트이다. 일부 구체예에서, 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열의 모든 뉴클레오시드간 연쇄는 포스포로티오에이트이다.
포스포로티오에이트 연쇄와 같은 뉴클레아제 내성 연쇄는 표적 핵산과 이중나선을 형성할 때 뉴클레아제를 모집할 수 있는 올리고뉴클레오티드 영역, 예컨대 갭머의 경우 영역 G에서 특히 유용하다. 하지만, 포스포로티오에이트 연쇄는 또한 비-뉴클레아제 모집 영역 및/또는 친화성 향상 영역, 예컨대 갭머의 경우 영역 F 및 F'에서 유용할 수 있다. 갭머 올리고뉴클레오티드는 일부 구체예에서 영역 F 또는 F'에서, 또는 영역 F 및 영역 F' 둘 모두에서 하나 또는 그 이상의 포스포디에스테르 연쇄를 포함할 수 있고, 여기서 영역 G에서 모든 뉴클레오시드간 연쇄는 포스포로티오에이트일 수 있다.
유리하게는, 올리고뉴클레오티드의 연속 뉴클레오티드 서열의 모든 뉴클레오시드간 연쇄는 포스포로티오에이트이거나, 또는 올리고뉴클레오티드의 모든 뉴클레오시드간 연쇄는 포스포로티오에이트 연쇄이다.
EP 2 742 135에서 개시된 바와 같이, 안티센스 올리고뉴클레오티드는 다른 뉴클레오시드간 연쇄 (포스포디에스테르 및 포스포로티오에이트 이외에), 예를 들면 EP 2 742 135에 따라서 예를 들면 그 외의 DNA 포스포로티오에이트 갭 영역에서 용인될 수 있는 알킬 포스포네이트/메틸 포스포네이트 뉴클레오시드간 연쇄를 포함할 수 있는 것으로 인식된다.
핵염기
용어 핵염기는 핵산 혼성화에서 수소 결합을 형성하는 뉴클레오시드 및 뉴클레오티드 내에 존재하는 퓨린 (예를 들면, 아데닌 및 구아닌) 및 피리미딘 (예를 들면, 우라실, 티민 및 시토신) 모이어티를 포함한다. 본원 발명의 맥락에서, 용어 핵염기는 또한 자연 발생 핵염기와는 다를 수 있지만 핵산 혼성화 동안 기능적인 변형된 핵염기를 포괄한다. 이러한 맥락에서, "핵염기"는 아데닌, 구아닌, 시토신, 티미딘, 우라실, 크산틴 및 히포크산틴과 같은 자연 발생 핵염기뿐만 아니라 비-자연 발생 변이체 둘 모두를 지칭한다. 이런 변이체는 예를 들면 Hirao et al (2012) Accounts of Chemical Research vol 45 page 2055 및 Bergstrom (2009) Current Protocols in Nucleic Acid Chemistry Suppl. 37 1.4.1에서 기술된다.
일부 구체예에서, 핵염기 모이어티는 퓨린 또는 피리미딘을 변형된 퓨린 또는 피리미딘, 예컨대 치환된 퓨린 또는 치환된 피리미딘, 예컨대 이소시토신, 슈도이소시토신, 5-메틸 시토신, 5-티오졸로-시토신, 5-프로피닐-시토신, 5-프로피닐-우라실, 5-브로모우라실, 5-티아졸로-우라실, 2-티오-우라실, 2'-티오-티민, 이노신, 디아미노퓨린, 6-아미노퓨린, 2-아미노퓨린, 2,6-디아미노퓨린 및 2-클로로-6-아미노퓨린에서 선택되는 핵염기로 변화시킴으로써 변형된다.
핵염기 모이어티는 각각의 상응하는 핵염기에 대한 문자 코드, 예를 들면 A, T, G, C 또는 U로 표시될 수 있는데, 여기서 각 문자는 등가 기능의 변형된 핵염기를 임의적으로 포함할 수 있다. 예를 들면, 예시된 올리고뉴클레오티드에서, 핵염기 모이어티는 A, T, G, C 및 5-메틸 시토신에서 선택된다. 임의적으로, LNA 갭머의 경우, 5-메틸 시토신 LNA 뉴클레오시드가 이용될 수 있다.
변형된 올리고뉴클레오티드
용어 변형된 올리고뉴클레오티드는 하나 또는 그 이상의 당-변형된 뉴클레오시드 및/또는 변형된 뉴클레오시드간 연쇄를 포함하는 올리고뉴클레오티드를 설명한다. 용어 "키메라 올리고뉴클레오티드"는 변형된 뉴클레오시드 및 DNA 뉴클레오시드를 갖는 올리고뉴클레오티드를 설명하기 위해 문헌에서 이용된 용어이다. 본원 발명의 안티센스 올리고뉴클레오티드는 유리하게는 키메라 올리고뉴클레오티드이다.
상보성
용어 "상보성"은 뉴클레오시드/뉴클레오티드의 왓슨-크릭 염기 대합에 대한 능력을 설명한다. 왓슨-크릭 염기쌍은 구아닌 (G)-시토신 (C) 및 아데닌 (A)-티민 (T)/우라실 (U)이다. 올리고뉴클레오티드는 변형된 핵염기를 갖는 뉴클레오시드를 포함할 수 있는 것으로 이해될 것이다, 예를 들면 5-메틸 시토신이 종종 시토신을 대신하여 이용되고, 그리고 그 결과 용어 상보성은 변형되지 않은 핵염기 및 변형된 핵염기 사이의 왓슨 크릭 염기 대합을 포괄한다 (참조: 예를 들면, Hirao et al. (2012) Accounts of Chemical Research vol 45 page 2055 및 Bergstrom (2009) Current Protocols in Nucleic Acid Chemistry Suppl. 37 1.4.1).
본원에서 이용된 용어 "% 상보성"은 연속 뉴클레오티드 서열 전역에서 참조 서열 (예를 들면, 표적 서열 또는 서열 모티프)에 상보적인, 핵산 분자 (예를 들면, 올리고뉴클레오티드) 내에 연속 뉴클레오티드 서열의 뉴클레오티드의 비율 (퍼센트로 표시)을 의미한다. 상보성의 백분율은 따라서 2개의 서열 사이에서 상보적인 정렬된 핵염기 (왓슨 크릭 염기쌍으로부터)의 숫자를 계수하고 (5'-3'로 표적 서열 및 3'-5'로 올리고뉴클레오티드 서열과 함께 정렬될 때), 상기 숫자를 올리고뉴클레오티드 내에 뉴클레오티드의 총 수로 나누고, 그리고 여기에 100을 곱함으로써 계산한다. 이런 비교에서, 정렬되지 않은 (염기쌍을 형성하는) 핵염기/뉴클레오티드는 부정합 (mismatch)으로 명명된다. 삽입 및 결실은 연속 뉴클레오티드 서열의 % 상보성의 계산에서 허용되지 않는다. 왓슨 크릭 염기 대합을 형성할 수 있는 핵염기의 기능적 능력이 유지되는 한, 상보성을 결정함에 있어서 핵염기의 화학적 변형은 무시되는 것으로 이해될 것이다 (예를 들면, 5'-메틸 시토신은 % 상보성을 계산할 목적으로 시토신과 동일한 것으로 간주된다).
용어 "완전히 상보적"은 100% 상보성을 의미한다.
다음은 표적 핵산 (서열 번호: 11)과 완전히 상보적인 올리고뉴클레오티드 모티프 (서열 번호: 33)의 예이다.
5'- CTTTGACCAGAGTATGTAAAATTCTC-3' (서열 번호: 11)
3'-AAACTGGTCTCATACATTTT -5' (서열 번호: 33)
동일성
본원에서 이용된 용어 "동일성"은 연속 뉴클레오티드 서열 전역에서 참조 서열 (예를 들면, 서열 모티프)와 동일한 핵산 분자 (예를 들면, 올리고뉴클레오티드) 내에 연속 뉴클레오티드 서열의 뉴클레오티드의 비율 (퍼센트로 표시)을 의미한다. 따라서 동일성의 백분율은 두 서열 (본원 발명의 화합물의 연속 뉴클레오티드 서열에서 및 참조 서열에서) 사이에서 동일한 정렬된 핵염기 (정합)의 숫자를 계수하고, 상기 숫자를 올리고뉴클레오티드 내에 뉴클레오티드의 총 수로 나누고, 그리고 여기에 100을 곱함으로써 계산한다. 이런 이유로, 동일성의 백분율 = (정합 x 100)/정렬된 영역 (예를 들면, 연속 뉴클레오티드 서열)의 길이. 삽입 및 결실은 연속 뉴클레오티드 서열의 동일성의 백분율을 계산할 때 허용되지 않는다. 왓슨 크릭 염기 대합을 형성할 수 있는 핵염기의 기능적 능력이 유지되는 한, 동일성을 결정함에 있어서 핵염기의 화학적 변형은 무시되는 것으로 이해될 것이다 (예를 들면, 5-메틸 시토신은 % 동일성을 계산할 목적으로 시토신과 동일한 것으로 간주된다).
혼성화
본원에서 이용된 용어 "혼성화하는" 또는 "혼성화한다"는 두 핵산 가닥 (예를 들면, 올리고뉴클레오티드 및 표적 핵산)이 반대 가닥 상의 염기쌍 사이에 수소 결합을 형성함으로써 이중나선을 형성하는 것으로 이해되어야 한다. 두 핵산 가닥 사이의 결합 친화성은 혼성화의 강도이다. 이것은 올리고뉴클레오티드의 절반이 표적 핵산과 이중나선을 형성하는 온도로서 규정되는 용융 온도 (Tm)의 관점에서 종종 설명된다. 생리학적 조건에서 Tm은 친화성과 엄격하게 비례하지는 않는다 (Mergny and Lacroix, 2003,Oligonucleotides 13:515-537). 표준 상태 Gibbs 자유 에너지 △G°는 결합 친화성을 나타내는 더욱 정확한 표시이고 △G° = -RTln(Kd)에 의한 반응의 해리 상수 (Kd)와 관련되는데, 여기서 R은 기체 상수이고 T는 절대 온도이다. 이런 이유로, 올리고뉴클레오티드 및 표적 핵산 사이에 반응의 매우 낮은 △G°는 올리고뉴클레오티드 및 표적 핵산 사이의 강한 혼성화를 반영한다. △G°는 수성 농도가 1M이고, pH가 7이고, 온도가 37℃인 반응과 연관된 에너지이다. 표적 핵산에 대한 올리고뉴클레오티드의 혼성화는 자발적 반응이고, 그리고 자발적 반응의 경우 △G°는 0보다 작다. △G°는, 예를 들면 Hansen et al., 1965,Chem. Comm. 36-38 및 Holdgate et al., 2005, Drug Discov Today에서 기술된 바와 같이 등온 적정 열량 측정 (ITC) 방법을 이용하여 실험적으로 계측될 수 있다. 당업자는 상용 장비가 △G° 계측에 이용가능하다는 것을 알 것이다. △G°는 또한, Sugimoto et al., 1995, Biochemistry 34:11211-11216 및 McTigue et al., 2004, Biochemistry 43:5388-5405에 의해 기술된 적절하게 도출된 열역학 매개변수를 이용하는, SantaLucia, 1998, Proc Natl Acad Sci USA. 95: 1460-1465에 의해 기술된 바와 같은 최근접 이웃 모델을 이용함으로써 수치적으로 추정될 수 있다. 혼성화에 의해 의도된 핵산 표적을 조절할 수 있는 가능성을 갖기 위해, 본원 발명의 올리고뉴클레오티드는 길이에서 10-30개의 뉴클레오티드인 올리고뉴클레오티드에 대해 -10 kcal 미만의 추정된 △G° 값으로 표적 핵산에 혼성화한다. 일부 구체예에서, 혼성화의 정도 또는 강도는 표준 상태 Gibbs 자유 에너지 △G°에 의해 계측된다. 올리고뉴클레오티드는 길이에서 8-30개의 뉴클레오티드인 올리고뉴클레오티드에 대해 -10 kcal의 범위 미만, 예컨대 -15 kcal 미만, 예컨대 -20 kcal 미만 및 예컨대 -25 kcal 미만의 추정된 △G° 값으로 표적 핵산에 혼성화할 수 있다. 일부 구체예에서, 올리고뉴클레오티드는 -10 내지 -60 kcal, 예컨대 -12 내지 -40 kcal, 예컨대 -15 내지 -30 kcal 또는 -16 내지 -27 kcal, 예컨대 -18 내지 -25 kcal의 추정된 △G° 값으로 표적 핵산에 혼성화한다.
표적 핵산
본원 발명에 따라서, 표적 핵산은 포유류 RTEL1을 인코딩하는 핵산이고, 그리고 예를 들면 유전자, RNA, mRNA 및 프리-mRNA, 성숙 mRNA 또는 cDNA 서열일 수 있다. 이런 이유로, 표적은 RTEL1 표적 핵산으로 지칭될 수 있다.
본원 발명의 올리고뉴클레오티드는 예를 들면 포유류 RTEL1의 표적 엑손 영역 (특히, siRNA 및 shRNA 표적 엑손 영역뿐만 아니라 안티센스 올리고뉴클레오티드)일 수 있거나, 또는 예를 들면 RTEL1 프리-mRNA에서 표적 인트론 영역 (특히, 안티센스 올리고뉴클레오티드 표적 인트론 영역)일 수 있다. 인간 RTEL1 유전자는 15개의 전사체를 인코딩하고, 이들 중에서 7개는 단백질 코딩이고, 그리고 이런 이유로 잠재적인 핵산 표적이다. 표 1은 서열 번호: 1의 인간 RTEL1 프리-mRNA 상에 위치된 대로, 이들 7개 전사체의 예측된 엑손과 인트론 영역을 열거한다. 본원 발명의 올리고뉴클레오티드는 표 1에서 열거된 전사체 중에서 하나 또는 그 이상의 성숙 mRNA 서열을 표적으로 할 수 있는 것으로 이해된다.
표 1. 상이한 단백질 코딩 RTEL1 mRNA 전사체에 대한 인간 RTEL1 프리-mRNA (서열 번호: 1)에서 전사체, 엑손 및 인트론 영역
적절하게는, 표적 핵산은 RTEL1 단백질, 특히 포유류 RTEL1, 예컨대 인간 RTEL1 (참조: 예를 들면, 표 2 및 3)을 인코딩하는데, 이것은 인간과 원숭이 RTEL1에 대한 프리-mRNA 서열을 제공한다.
일부 구체예에서, 표적 핵산은 서열 번호: 1 및/또는 2 또는 이들의 자연 발생 변이체 (예를 들면, 표 1에서 포유류 RTEL1 단백질을 인코딩하는 서열)에서 선택된다.
연구 또는 진단에서 본원 발명의 올리고뉴클레오티드를 이용하는 경우, 표적 핵산은 cDNA, 또는 DNA 또는 RNA로부터 유래된 합성 핵산일 수 있다.
생체내 또는 시험관내 적용을 위해, 본원 발명의 올리고뉴클레오티드는 전형적으로 RTEL1 표적 핵산을 발현하는 세포 내에서 RTEL1 표적 핵산의 발현을 저해할 수 있다. 본원 발명의 올리고뉴클레오티드의 핵염기의 연속 서열은 올리고뉴클레오티드의 길이에 걸쳐 계측되는 바와 같이, 임의적으로 하나 또는 두 개의 부정합을 제외하고, 그리고 임의적으로 올리고뉴클레오티드를 임의적 기능기, 예컨대 접합체 또는 다른 비-상보적 말단 뉴클레오티드 (예를 들면, 영역 D' 또는 D'')에 결합시킬 수 있는 뉴클레오티드 기반의 링커 영역을 제외하고, 전형적으로 RTEL1 표적 핵산에 상보적이다. 표적 핵산은 일부 구체예에서, RNA 또는 DNA, 예컨대 전령 RNA, 예컨대 성숙 mRNA (예를 들면, 표 1에서 열거된 전사체의 엑손 영역) 또는 프리-mRNA일 수 있다.
일부 구체예에서 표적 핵산은 포유류 RTEL1 단백질, 예컨대 인간 RTEL1을 인코딩하는 RNA 또는 DNA, 예를 들면, 인간 RTEL1 mRNA 서열, 예컨대 서열 번호 1로서 개시된 것이다. 예시적인 표적 핵산에 대한 추가 정보는 표 2 및 3에 제시된다.
표 2. 종간 RTEL1에 대한 유전체 및 조립 정보.
Fwd = 정방향 가닥. 유전체 좌표는 프리-mRNA 서열 (유전체 서열)을 제공한다. NCBI 참조는 mRNA 서열 (cDNA 서열)을 제공한다.
표 3. 종간 RTEL1에 대한 서열 상세 정보.
서열 번호 2가 복수의 NNNNs의 영역을 포함하고, 여기서 염기서열결정이 상기 서열을 정확하게 정밀화할 수 없었고, 그리고 이런 이유로, 축중 서열이 포함된다는 점에 유의한다. 의심할 여지를 없애기 위해 본원 발명의 화합물은 실제 표적 서열에 상보적이고, 그리고 이런 이유로, 축중 화합물이 아니다.
일부 구체예에서, 표적 핵산은 서열 번호 1이다.
일부 구체예에서, 표적 핵산은 서열 번호 2이다.
표적 서열
본원에서 이용된 용어 "표적 서열"은 본원 발명의 올리고뉴클레오티드에 상보적인 핵염기 서열을 포함하는 표적 핵산 내에 존재하는 뉴클레오티드의 서열을 지칭한다. 일부 구체예에서, 표적 서열은 본원 발명의 올리고뉴클레오티드의 연속 뉴클레오티드 서열에 상보적인 핵염기 서열을 갖는 표적 핵산 상의 영역으로 구성된다. 표적 핵산의 이러한 영역은 표적 뉴클레오티드 서열, 표적 서열 또는 표적 영역으로 교체가능하게 지칭될 수 있다. 일부 구체예에서, 표적 서열은 단일 올리고뉴클레오티드의 상보적 서열보다 길고, 그리고 예를 들면 본원 발명의 몇몇 올리고뉴클레오티드에 의해 표적화될 수 있는 표적 핵산의 바람직한 영역을 나타낼 수 있다.
일부 구체예에서, 표적 서열은 인간 RTEL1 mRNA 엑손, 예컨대 상기 표 1에서 목록으로부터 선택된 RTEL1 인간 mRNA 엑손으로 구성된 군에서 선택되는 서열이다.
일부 구체예에서, 표적 서열은 인간 RTEL1 mRNA 인트론, 예컨대 상기 표 1에서 목록으로부터 선택된 RTEL1 인간 mRNA 인트론으로 구성된 군에서 선택되는 서열이다.
본원 발명의 올리고뉴클레오티드는 표적 핵산, 예컨대 본원에서 기술된 표적 서열에 상보적이거나 또는 이것에 혼성화하는 연속 뉴클레오티드 서열을 포함한다.
올리고뉴클레오티드가 상보적이거나 또는 혼성화하는 표적 서열은 일반적으로 적어도 10개 뉴클레오티드의 연속 핵염기 서열을 포함한다. 연속 뉴클레오티드 서열은 10 내지 35개의 뉴클레오티드, 예컨대 12 내지 30개, 예컨대 14 내지 20개, 예컨대 16 내지 20개의 연속 뉴클레오티드이다. 본원 발명의 구체예에서 표적 서열은 표 4에서 도시된 바와 같은 서열 번호: 3-21로 구성된 군에서 선택된다.
표 4: 인간 RTEL1 프리-mRNA (서열 번호: 1) 상에서 표적 서열
일부 구체예에서, 표적 서열은 표 5A 또는 5B에서 도시된 영역에서 선택된다.
표적 세포
본원에서 이용된 용어 "표적 세포"는 표적 핵산을 발현하는 세포를 지칭한다. 본원 발명의 치료적 용도를 위해, 표적 세포는 HBV로 감염되는 것이 바람직하다. 일부 구체예에서, 표적 세포는 생체내 또는 시험관내에 있을 수 있다. 일부 구체예에서, 표적 세포는 포유류 세포, 예컨대 설치류 세포, 예컨대 생쥐 세포 또는 쥐 세포, 또는 우드척 세포 또는 영장류 세포, 예컨대 원숭이 세포 (예를 들면, 시노몰구스 원숭이 세포) 또는 인간 세포이다.
바람직한 구체예에서, 표적 세포는 RTEL1 mRNA, 예컨대 RTEL1 프리-mRNA 또는 RTEL1 성숙 mRNA를 발현한다. RTEL1 mRNA의 폴리 A 꼬리는 안티센스 올리고뉴클레오티드 표적화에서는 전형적으로 무시된다.
게다가, 표적 세포는 간세포일 수 있다. 한 구체예에서 표적 세포는 HBV 감염된 개체로부터 유래되거나, 또는 인간화 간을 갖는 HBV 감염된 생쥐 (PhoenixBio, PXB-생쥐)로부터 유래된 HBV 감염된 일차 인간 간세포이다.
본원 발명에 따라서, 표적 세포는 HBV로 감염될 수 있다. 게다가, 표적 세포는 HBV cccDNA를 포함할 수 있다. 따라서, 표적 세포는 바람직하게는 RTEL1 mRNA, 예컨대 RTEL1 프리-mRNA 또는 RTEL1 성숙 mRNA, 그리고 HBV cccDNA를 포함한다.
자연 발생 변이체
용어 "자연 발생 변이체"는 표적 핵산과 동일한 유전자 좌위로부터 유래하지만, 예를 들면, 동일한 아미노산을 인코딩하는 코돈의 다중성을 유발하는 유전자 코드의 축중성으로 인해, 또는 프리-mRNA의 대안적 스플라이싱, 또는 다형성, 예컨대 단일 뉴클레오티드 다형성 (SNP) 및 대립형질 변이체의 존재로 인해 상이할 수 있는 RTEL1 유전자 또는 전사체의 변이체를 지칭한다. 올리고뉴클레오티드와 충분하게 상보적인 서열의 존재에 기초하여, 본원 발명의 올리고뉴클레오티드는 표적 핵산 및 이의 자연 발생 변이체를 표적으로 할 수 있다.
일부 구체예에서, 자연 발생 변이체는 포유류 RTEL1 표적 핵산, 예컨대 서열 번호 1 및/또는 2의 표적 핵산과 적어도 95%, 예컨대 적어도 98% 또는 적어도 99%의 상동성을 갖는다. 일부 구체예에서, 자연 발생 변이체는 서열 번호: 1의 인간 RTEL1 표적 핵산과 적어도 99%의 상동성을 갖는다. 일부 구체예에서, 자연 발생 변이체는 공지된 다형성이다.
발현의 조절
본원에서 이용된 용어 "발현의 조절"은 올리고뉴클레오티드의 투여 전 RTEL1의 양과 비교할 때, RTEL1의 양을 변경시킬 수 있는 올리고뉴클레오티드의 능력에 대한 총체적인 용어로서 이해되어야 한다. 대안적으로, 발현의 조절은 대조 실험을 참조하여 결정될 수 있다. 일반적으로 대조는 식염수 조성물로 처리된 개체 또는 표적 세포, 또는 비-표적화 올리고뉴클레오티드 (모의)로 처리된 개체 또는 표적 세포인 것으로 이해된다.
조절의 한 유형은, 예를 들면 mRNA의 분해 또는 전사의 차단에 의해 RTEL1의 발현을 저해, 하향 조절, 감소, 억제, 제거, 정지, 차단, 예방, 약화, 저하, 회피 또는 종결시킬 수 있는 올리고뉴클레오티드의 능력이다. 조절의 다른 유형은, 예를 들면 스플라이스 부위의 수복 또는 스플라이싱의 예방 또는 저해 메커니즘, 예컨대 마이크로RNA 억제의 제거 또는 차단에 의해 RTEL1의 발현을 회복, 증가 또는 향상시킬 수 있는 올리고뉴클레오티드의 능력이다.
당 변형
본원 발명의 올리고뉴클레오티드는 변형된 당 모이어티, 다시 말하면, DNA와 RNA에서 발견되는 리보오스 당 모이어티와 비교할 때 당 모이어티의 변형을 갖는 하나 또는 그 이상의 뉴클레오시드를 포함할 수 있다.
리보오스 당 모이어티의 변형을 갖는 다수의 뉴클레오시드는 주로 올리고뉴클레오티드의 일정한 특성, 예컨대 친화성 및/또는 뉴클레아제 내성을 개선하기 위한 목적으로 만들어졌다.
이런 변형은 리보오스 고리 구조가, 예를 들면 헥소오스 고리 (HNA) 또는 이중환상 고리로 대체에 의해 변형되는 것들을 포함하는데, 이들은 전형적으로 리보오스 고리 (LNA) 상에, 또는 전형적으로 C2 및 C3 탄소 사이에 결합이 없는 비-연결된 리보오스 고리 (예를 들면, UNA) 상에 C2 및 C4 탄소 사이에 2가 라디칼 브리지를 갖는다. 다른 당 변형된 뉴클레오시드는, 예를 들면 비시클로헥소오스 핵산 (WO2011/017521) 또는 삼중환상 핵산 (WO2013/154798)을 포함한다. 변형된 뉴클레오시드는 또한, 예를 들면 펩티드 핵산 (PNA) 또는 모르폴리노 핵산의 경우에 당 모이어티가 비-당 모이어티로 대체되는 뉴클레오시드를 포함한다.
당 변형은 또한 리보오스 고리 상의 치환기를 수소 이외의 기, 또는 DNA와 RNA 뉴클레오시드에서 자연적으로 발견되는 2'-OH 기로 변경하는 것을 통해 만들어진 변형을 포함한다. 예를 들면, 2', 3', 4' 또는 5' 위치에서 치환기가 도입될 수 있다.
높은 친화성 변형된 뉴클레오시드
높은 친화성 변형된 뉴클레오시드는 올리고뉴클레오티드 내로 통합될 때, 예를 들면 용융 온도 (Tm)에 의해 계측되는 바와 같이 상보적인 표적에 대한 올리고뉴클레오티드의 친화성을 향상시키는 변형된 뉴클레오티드이다. 본원 발명의 높은 친화성 변형된 뉴클레오시드는 바람직하게는 변형된 뉴클레오시드마다 +0.5 내지 +12℃, 더욱 바람직하게는 +1.5 내지 +10℃, 가장 바람직하게는 +3 내지 +8℃의 용융 온도 증가를 유발한다. 다수의 높은 친화성 변형된 뉴클레오시드는 당해 분야에 공지되어 있고, 그리고 예를 들면 많은 2' 치환된 뉴클레오시드뿐만 아니라 잠금 핵산 (LNA)을 포함한다 (참조: 예를 들면, Freier & Altmann; Nucl. Acid Res., 1997, 25, 4429-4443 및 Uhlmann; Curr. Opinion in Drug Development, 2000, 3(2), 293-213).
2' 당 변형된 뉴클레오시드
2' 당 변형된 뉴클레오시드는 2' 위치에서 H 또는 -OH 이외의 치환기를 갖는 뉴클레오시드 (2' 치환된 뉴클레오시드)이거나, 또는 리보오스 고리에서 2' 탄소 및 두 번째 탄소 사이에 브리지를 형성할 수 있는 2' 결합된 2가 라디칼을 포함하는 뉴클레오시드, 예컨대 LNA (2'-4' 2가 라디칼 브리지) 뉴클레오시드이다.
실제로, 2' 당 치환된 뉴클레오시드의 개발에 많은 관심이 집중되어 왔고, 그리고 수많은 2' 치환된 뉴클레오시드가 올리고뉴클레오티드 내로 통합될 때 유익한 특성을 갖는 것으로 밝혀졌다. 예를 들면, 2' 변형된 당은 올리고뉴클레오티드에 향상된 결합 친화성 및/또는 증가된 뉴클레아제 내성을 제공할 수 있다. 2' 치환된 변형 뉴클레오시드의 실례는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA (MOE), 2'-아미노-DNA, 2'-플루오로-RNA 및 2'-F-ANA 뉴클레오시드이다. 추가적인 실례를 위해, 예를 들면 Freier & Altmann; Nucl. Acid Res., 1997, 25, 4429-4443 및 Uhlmann; Curr. Opinion in Drug Development, 2000, 3(2), 293-213, 그리고 Deleavey and Damha, Chemistry and Biology 2012, 19, 937을 참조한다. 아래에는 일부 2' 치환된 변형 뉴클레오시드가 예시된다.
본원 발명과 관련하여, 2' 치환된 당 변형된 뉴클레오시드는 LNA와 같은 2' 가교된 뉴클레오시드를 포함하지 않는다.
잠금 핵산 뉴클레오시드 (LNA 뉴클레오시드)
"LNA 뉴클레오시드"는 리보오스 고리의 형태를 제한하거나 잠금시키는, 상기 뉴클레오시드의 리보오스 당 고리의 C2' 및 C4'를 연결하는 2가 라디칼 ("2'-4' 브리지"로 또한 지칭됨)을 포함하는 2'-당 변형된 뉴클레오시드이다. 이들 뉴클레오시드는 또한 문헌에서 가교된 핵산 또는 이중환상 핵산 (BNA)으로 명명된다. 리보오스 형태의 잠금은 LNA가 상보적 RNA 또는 DNA 분자에 대한 올리고뉴클레오티드 내로 통합될 때 혼성화의 친화성 향상 (이중나선 안정화)과 연관된다. 이것은 올리고뉴클레오티드/상보적 이중나선의 용융 온도를 계측함으로써 일과적으로 결정될 수 있다.
무제한적이고 예시적인 LNA 뉴클레오시드는 WO 99/014226, WO 00/66604, WO 98/039352, WO 2004/046160, WO 00/047599, WO 2007/134181, WO 2010/077578, WO 2010/036698, WO 2007/090071, WO 2009/006478, WO 2011/156202, WO 2008/154401, WO 2009/067647, WO 2008/150729, Morita et al., Bioorganic & Med. Chem. Lett. 12, 73-76,
Seth et al. J. Org. Chem. 2010, Vol 75(5) pp. 1569-81, Mitsuoka et al., Nucleic Acids Research 2009, 37(4), 1225-1238, 그리고 Wan and Seth, J. Medical Chemistry 2016, 59, 9645-9667에서 개시된다.
본원 발명의 LNA 뉴클레오시드의 특정 실례는 반응식 1 (여기서 B는 상기 규정된 바와 같다)에서 제시된다.
반응식 1
특정 LNA 뉴클레오시드는 베타-D-옥시-LNA, 6'- 메틸-베타-D-옥시 LNA, 예컨대 (S)-6'-메틸-베타-D-옥시-LNA(ScET) 및 ENA이다.
제약학적으로 허용되는 염
용어 "제약학적으로 허용되는 염"은 생물학적으로 바람직하지 않거나 또는 달리 바람직하지 않은 경우가 아닌, 유리 염기 또는 유리 산의 생물학적 효과와 특성을 보유하는 염을 지칭한다. 염은 염산, 브롬화수소산, 황산, 질산, 인산, 구체적으로는 염산과 같은 무기산, 그리고 아세트산, 프로피온산, 글리콜산, 피루브산, 옥살산, 말레산, 말론산, 숙신산, 푸마르산, 타르타르산, 시트르산, 벤조산, 계피산, 만델산, 메탄술폰산, 에탄술폰산, p-톨루엔술폰산, 살리실산, N-아세틸시스테인과 같은 유기산으로 형성된다. 이에 더하여, 이들 염은 유리 산에 무기 염기 또는 유기 염기를 첨가하여 제조될 수 있다. 무기 염기로부터 유래된 염은 나트륨, 칼륨, 리튬, 암모늄, 칼슘, 마그네슘 염을 포함하지만 이들에 한정되지 않는다. 유기 염기로부터 유래된 염은 1차, 2차 및 3차 아민의 염, 자연 발생된 치환된 아민을 비롯한 치환된 아민, 시클릭 아민 및 염기성 이온 교환 수지, 예컨대 이소프로필아민, 트리메틸아민, 디에틸아민, 트리에틸아민, 트리프로필아민, 에탄올아민, 리신, 아르기닌, N-에틸피페리딘, 피페리딘, 폴리아민 수지를 포함하지만 이들에 한정되지 않는다. 화학식 (I)의 화합물은 또한 쌍성 이온의 형태로 존재할 수 있다. 화학식 (I)의 화합물의 특히 바람직한 제약학적으로 허용되는 염은 염산, 브롬화수소산, 황산, 인산 및 메탄술폰산의 염이다.
RNase H 활성 및 모집
안티센스 올리고뉴클레오티드의 RNase H 활성은 상보적 RNA 분자와의 이중나선 형태로 있을 때, RNase H를 모집하는 능력을 지칭한다. WO01/23613은 RNaseH 활성을 결정하기 위한 시험관내 방법을 제공하는데, 이들은 RNaseH를 모집하는 능력을 결정하는 데 이용될 수 있다. 전형적으로, 올리고뉴클레오티드는 상보적 표적 핵산 서열이 제공될 때, pmol/l/분으로 계측되는 바와 같이, 검사되는 변형된 올리고뉴클레오티드와 동일한 염기 서열을 갖지만 올리고뉴클레오티드 내에 모든 단량체 사이에 포스포로티오에이트 연쇄를 갖는 DNA 단량체만을 내포하는 올리고뉴클레오티드를 이용하고 WO01/23613 (본원에 참조로서 편입됨)의 실시예 91-95에 의해 제공된 방법을 이용할 때 결정된 초기 속도의 적어도 5%, 예컨대 적어도 10% 또는 20% 이상의 초기 속도를 갖는 경우에 RNase H를 모집할 수 있는 것으로 간주된다. RNase H 활성을 결정하는 데 이용을 위해, 재조합 인간 RNase H1은 Creative Biomart® (대장균 (E. coli)에서 발현된 His 태그와 융합된 재조합 인간 RNASEH1)로부터 가용하다.
갭머
본원 발명의 안티센스 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 갭머 올리고뉴클레오티드 또는 갭머 설계로 또한 명명되는 갭머일 수 있다. 안티센스 갭머는 RNase H 매개 분해를 통해 표적 핵산을 저해하는 데 통상적으로 이용된다. 갭머 올리고뉴클레오티드는 '5 -> 3' 방향으로 5'-측부, 갭 및 3'-측부인 F-G-F'의 적어도 3개의 별개의 구조 영역을 포함한다. "갭" 영역 (G)은 올리고뉴클레오티드가 RNase H를 모집할 수 있도록 하는 연속 DNA 뉴클레오티드의 스트레치를 포함한다. 갭 영역은 하나 또는 그 이상의 당 변형된 뉴클레오시드, 바람직하게는 높은 친화성 당 변형된 뉴클레오시드를 포함하는 5' 측부 영역 (F)에 의해, 그리고 하나 또는 그 이상의 당 변형된 뉴클레오시드, 바람직하게는 높은 친화성 당 변형된 뉴클레오시드를 포함하는 3' 측부 영역 (F')에 의해 측접된다. 영역 F 및 F' 내에 하나 또는 그 이상의 당 변형된 뉴클레오시드는 표적 핵산에 대한 올리고뉴클레오티드의 친화성을 향상시킨다 (즉, 친화성 향상 당 변형된 뉴클레오시드이다). 일부 구체예에서, 영역 F 및 F' 내에 하나 또는 그 이상의 당 변형된 뉴클레오시드는 2' 당 변형된 뉴클레오시드, 예컨대 LNA 및 2'-MOE에서 독립적으로 선택된 것과 같은 높은 친화성 2' 당 변형체이다.
갭머 설계에서, 갭 영역의 5' 및 3'에 가장 가까운 뉴클레오시드는 DNA 뉴클레오시드이고, 그리고 각각 5' (F) 또는 3' (F') 영역의 당 변형된 뉴클레오시드에 인접하게 위치된다. 측부는 갭 영역으로부터 가장 먼 단부에서, 다시 말하면, 5' 측부의 5' 단부 및 3' 측부의 3' 단부에서 적어도 하나의 당 변형된 뉴클레오시드를 가짐으로써 추가로 규정될 수 있다.
영역 F-G-F'는 연속 뉴클레오티드 서열을 형성한다. 본원 발명의 안티센스 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 화학식 F-G-F'의 갭머 영역을 포함할 수 있다.
갭머 설계 F-G-F'의 전체 길이는, 예를 들면 12 내지 32개의 뉴클레오시드, 예컨대 13 내지 24개, 예컨대 14 내지 22개의 뉴클레오시드, 예컨대 14 내지 17개, 예컨대 16 내지 18개의 뉴클레오시드일 수 있다. 예로서, 본원 발명의 갭머 올리고뉴클레오티드는 하기 화학식으로 나타낼 수 있고:
F1-8-G5-18-F'1-8, 예컨대
F1-8-G5-16-F'1-8, 예컨대
F1-8-G7-16-F'2-8
단서로써, 갭머 영역 F-G-F'의 전체 길이는 적어도 12개, 예컨대 적어도 14개 뉴클레오티드의 길이를 갖는다.
본원 발명의 한 양상에서 안티센스 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 화학식 5'-F-G-F'-3'의 갭머로 구성되거나 또는 이것을 포함하는데, 여기서 영역 F 및 F'는 1-8개의 뉴클레오시드를 독립적으로 포함하거나 또는 이들로 구성되고, 이들 중에서 1-4개는 2' 당 변형되고 F 및 F' 영역의 5' 및 3' 단부를 규정하고, 그리고 G는 RNaseH를 모집할 수 있는 6 내지 18개, 예컨대 6 내지 16개 뉴클레오시드의 영역이다. 일부 구체예에서 G 영역은 DNA 뉴클레오시드로 구성된다.
영역 F, G 및 F'는 아래에 추가로 규정되고 F-G-F' 화학식 내로 통합될 수 있다.
갭머 - 영역 G
갭머의 영역 G (갭 영역)는 올리고뉴클레오티드가 RNaseH, 예컨대 인간 RNase H1을 모집할 수 있도록 하는 뉴클레오시드, 전형적으로 DNA 뉴클레오시드의 영역이다. RNaseH는 DNA와 RNA 사이의 이중나선을 인식하고 RNA 분자를 효소적으로 개열하는 세포 효소이다. 적합하게는 갭머는 길이에서 적어도 5 또는 6개의 연속 DNA 뉴클레오시드, 예컨대 5 - 18개의 연속 DNA 뉴클레오시드, 5 - 17개의 연속 DNA 뉴클레오시드, 예컨대 5 - 16개의 연속 DNA 뉴클레오시드, 예컨대 6 - 15개의 연속 DNA 뉴클레오시드, 예컨대 7 - 14개의 연속 DNA 뉴클레오시드, 예컨대 8 - 12개의 연속 DNA 뉴클레오티드, 예컨대 8 - 12개의 연속 DNA 뉴클레오티드의 갭 영역 (G)을 가질 수 있다. 갭 영역 (G)은, 일부 구체예에서 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18개의 연속 DNA 뉴클레오시드로 구성될 수 있다. 갭 영역에서 시토신 (C) DNA는 일부 사례에서 메틸화될 수 있으며, 이런 잔기는 5'-메틸-시토신 (meC 또는 c 대신에 e가 있음)으로서 주해된다. 갭에서 시토신 DNA의 메틸화는 만약 잠재적 독성을 감소시키기 위해 cg 디뉴클레오티드가 갭 내에 존재하면 바람직하며, 이러한 변형은 올리고뉴클레오티드의 효능에 대한 유의미한 영향을 갖지 않는다. 5' 치환된 DNA 뉴클레오시드, 예컨대 5' 메틸 DNA 뉴클레오시드가 DNA 갭 영역에서 이용에 대해 보고되었다 (EP 2 742 136).
일부 구체예에서, 갭 영역 G는 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18개의 연속 포스포로티오에이트 결합된 DNA 뉴클레오시드로 구성될 수 있다. 일부 구체예에서, 갭 내의 모든 뉴클레오시드간 연쇄는 포스포로티오에이트 연쇄이다.
전통적인 갭머는 DNA 갭 영역을 갖지만, 갭 영역 내에서 이용될 때 RNaseH 모집을 가능하게 하는 변형된 뉴클레오시드의 많은 실례가 있다. 갭 영역 내에 포함될 때 RNaseH를 모집할 수 있는 것으로 보고된 변형된 뉴클레오시드에는, 예를 들면 알파-L-LNA, C4' 알킬화 DNA (PCT/EP2009/050349 및 Vester et al., Bioorg. Med. Chem. Lett. 18 (2008) 2296-2300에서 기술된 바와 같이, 이들 둘 모두 본원에 참조로서 편입됨), ANA 및 2'F-ANA와 같은 아라비노스 유래 뉴클레오시드 (Mangos et al. 2003 J. AM. CHEM. SOC. 125, 654-661), UNA (잠금 해제된 핵산) (본원에 참조로서 편입되는 Fluiter et al., Mol. Biosyst., 2009, 10, 1039에서 기술된 바와 같이)가 포함된다. UNA는 잠금 해제된 핵산인데, 전형적으로 여기서 리보오스의 C2 및 C3 사이의 결합이 제거되어 잠금 해제된 "당" 잔기가 형성된다. 이런 갭머에 이용되는 변형된 뉴클레오시드는 갭 영역 내로 도입될 때 2' 엔도 (DNA 유사) 구조를 채택하는 뉴클레오시드, 다시 말하면, RNaseH 모집을 허용하는 변형체일 수 있다. 일부 구체예에서, 본원에서 기술된 DNA 갭 영역 (G)은 이러한 갭 영역 내로 도입될 때 2' 엔도 (DNA 유사) 구조를 채택하는 1 내지 3개의 당 변형된 뉴클레오시드를 임의적으로 내포할 수 있다.
갭머 - 측부 영역, F 및 F'
영역 F는 영역 G의 5' DNA 뉴클레오시드에 바로 인접하여 위치한다. 영역 F의 3'에 가장 가까운 뉴클레오시드는 당 변형된 뉴클레오시드, 예컨대 높은 친화성 당 변형된 뉴클레오시드, 예를 들면 2' 치환된 뉴클레오시드, 예컨대 MOE 뉴클레오시드 또는 LNA 뉴클레오시드이다.
영역 F'는 영역 G의 3' DNA 뉴클레오시드에 바로 인접하여 위치한다. 영역 F'의 5'에 가장 가까운 뉴클레오시드는 당 변형된 뉴클레오시드, 예컨대 높은 친화성 당 변형된 뉴클레오시드, 예를 들면 2' 치환된 뉴클레오시드, 예컨대 MOE 뉴클레오시드 또는 LNA 뉴클레오시드이다.
영역 F는 길이에서 1-8개의 연속 뉴클레오티드, 예컨대 길이에서 2-6개, 예컨대 3-4개의 연속 뉴클레오티드이다. 바람직하게는, 영역 F의 5'에 가장 가까운 뉴클레오시드는 당 변형된 뉴클레오시드이다. 일부 구체예에서, 영역 F의 2개의 5'에 가장 가까운 뉴클레오시드는 당 변형된 뉴클레오시드이다. 일부 구체예에서, 영역 F의 5'에 가장 가까운 뉴클레오시드는 LNA 뉴클레오시드이다. 일부 구체예에서, 영역 F의 2개의 5'에 가장 가까운 뉴클레오시드는 LNA 뉴클레오시드이다. 일부 구체예에서, 영역 F의 2개의 5'에 가장 가까운 뉴클레오시드는 2' 치환된 뉴클레오시드, 예컨대 2개의 3' MOE 뉴클레오시드이다. 일부 구체예에서, 영역 F의 5'에 가장 가까운 뉴클레오시드는 2' 치환된 뉴클레오시드, 예컨대 MOE 뉴클레오시드이다.
영역 F'는 길이에서 2-8개의 연속 뉴클레오티드, 예컨대 길이에서 3-6개, 예컨대 4-5개의 연속 뉴클레오티드이다. 바람직하게는, 구체예에서, 영역 F'의 3'에 가장 가까운 뉴클레오시드는 당 변형된 뉴클레오시드이다. 일부 구체예에서, 영역 F'의 2개의 3'에 가장 가까운 뉴클레오시드는 당 변형된 뉴클레오시드이다. 일부 구체예에서, 영역 F'의 2개의 3'에 가장 가까운 뉴클레오시드는 LNA 뉴클레오시드이다. 일부 구체예에서, 영역 F'의 3'에 가장 가까운 뉴클레오시드는 LNA 뉴클레오시드이다. 일부 구체예에서, 영역 F'의 2개의 3'에 가장 가까운 뉴클레오시드는 2' 치환된 뉴클레오시드, 예컨대 2개의 3' MOE 뉴클레오시드이다. 일부 구체예에서, 영역 F'의 3'에 가장 가까운 뉴클레오시드는 2' 치환된 뉴클레오시드, 예컨대 MOE 뉴클레오시드이다.
영역 F 또는 F'의 길이가 하나일 때, 이것은 바람직하게는 LNA 뉴클레오시드라는 점에 유의한다.
일부 구체예에서, 영역 F 및 F'는 독립적으로 당 변형된 뉴클레오시드의 연속 서열로 구성되거나 또는 이것을 포함한다. 일부 구체예에서, 영역 F의 당 변형된 뉴클레오시드는 2'-O-알킬 -RNA 단위, 2'-O-메틸-RNA, 2'-아미노-DNA 단위, 2'-플루오로-DNA 단위, 2'-알콕시-RNA, MOE 단위, LNA 단위, 아라비노 핵산 (ANA) 단위 및 2'-플루오로-ANA 단위에서 독립적으로 선택될 수 있다.
일부 구체예에서, 영역 F 및 F'는 LNA 및 2' 치환된 변형 뉴클레오시드 둘 모두를 독립적으로 포함한다 (혼합 날개 설계).
일부 구체예에서, 영역 F 및 F'는 단지 한 가지 유형의 당 변형된 뉴클레오시드, 예컨대 단지 MOE 또는 단지 베타-D-옥시 LNA 또는 단지 ScET로만 구성된다. 이런 설계는 또한 균일한 측부 또는 균일한 갭머 설계로 명명된다.
일부 구체예에서, 영역 F 또는 F', 또는 F 및 F'의 모든 뉴클레오시드는 LNA 뉴클레오시드이다, 예컨대 베타-D-옥시 LNA, ENA 또는 ScET 뉴클레오시드에서 독립적으로 선택된다. 일부 구체예에서, 영역 F는 1-5개, 예컨대 2-4개, 예컨대 3-4개, 예컨대 1, 2, 3, 4 또는 5개의 연속 LNA 뉴클레오시드로 구성된다. 일부 구체예에서, 영역 F 및 F'의 모든 뉴클레오시드는 베타-D-옥시 LNA 뉴클레오시드이다.
일부 구체예에서, 영역 F 또는 F', 또는 F 및 F'의 모든 뉴클레오시드는 2' 치환된 뉴클레오시드, 예컨대 OMe 또는 MOE 뉴클레오시드이다. 일부 구체예에서, 영역 F는 1, 2, 3, 4, 5, 6, 7 또는 8개의 연속 OMe 또는 MOE 뉴클레오시드로 구성된다. 일부 구체예에서, 측부 영역 중 한쪽만 2' 치환된 뉴클레오시드, 예컨대 OMe 또는 MOE 뉴클레오시드로 구성될 수 있다. 일부 구체예에서, 5' (F) 측부 영역은 2' 치환된 뉴클레오시드, 예컨대 OMe 또는 MOE 뉴클레오시드로 구성되는 반면, 3' (F') 측부 영역은 적어도 하나의 LNA 뉴클레오시드, 예컨대 베타-D-옥시 LNA 뉴클레오시드 또는 cET 뉴클레오시드를 포함한다. 일부 구체예에서, 3' (F') 측부 영역은 2' 치환된 뉴클레오시드, 예컨대 OMe 또는 MOE 뉴클레오시드로 구성되는 반면, 5' (F) 측부 영역은 적어도 하나의 LNA 뉴클레오시드, 예컨대 베타-D-옥시 LNA 뉴클레오시드 또는 cET 뉴클레오시드를 포함한다.
일부 구체예에서, 영역 F 및 F'의 모든 변형된 뉴클레오시드는 LNA 뉴클레오시드이고, 예컨대 베타-D-옥시 LNA, ENA 또는 ScET 뉴클레오시드에서 독립적으로 선택되고, 여기서 영역 F 또는 F', 또는 F 및 F'는 DNA 뉴클레오시드를 임의적으로 포함할 수 있다 (교대 측부, 이들에 대한 더욱 상세한 내용은 정의를 참조한다). 일부 구체예에서, 영역 F 및 F'의 모든 변형된 뉴클레오시드는 베타-D-옥시 LNA 뉴클레오시드이고, 여기서 영역 F 또는 F', 또는 F 및 F'는 DNA 뉴클레오시드를 임의적으로 포함할 수 있다 (교대 측부, 이들에 대한 더욱 상세한 내용은 정의를 참조한다).
일부 구체예에서, 영역 F 및 F'의 5'에 가장 가까운 뉴클레오시드 및 3'에 가장 가까운 뉴클레오시드는 LNA 뉴클레오시드, 예컨대 베타-D-옥시 LNA 뉴클레오시드 또는 ScET 뉴클레오시드이다.
일부 구체예에서, 영역 F 및 영역 G 사이의 뉴클레오시드간 연쇄는 포스포로티오에이트 뉴클레오시드간 연쇄이다. 일부 구체예에서, 영역 F' 및 영역 G 사이의 뉴클레오시드간 연쇄는 포스포로티오에이트 뉴클레오시드간 연쇄이다. 일부 구체예에서, 영역 F 또는 F', F 및 F'의 뉴클레오시드 사이의 뉴클레오시드간 연쇄는 포스포로티오에이트 뉴클레오시드간 연쇄이다.
LNA 갭머
LNA 갭머는 영역 F 및 F' 중 하나 또는 둘 모두가 LNA 뉴클레오시드를 포함하거나 또는 이들로 구성되는 갭머이다. 베타-D-옥시 갭머는 영역 F 및 F' 중 하나 또는 둘 모두가 베타-D-옥시 LNA 뉴클레오시드를 포함하거나 또는 이들로 구성되는 갭머이다.
일부 구체예에서 LNA 갭머는 하기 화학식을 갖는다: [LNA]1-5-[영역 G] -[LNA]1-5, 여기서 영역 G는 갭머 영역 G 정의에서 규정된 바와 같다.
MOE 갭머
MOE 갭머는 영역 F 및 F'가 MOE 뉴클레오시드로 구성되는 갭머이다. 일부 구체예에서 MOE 갭머는 설계 [MOE]1-8-[영역 G]-[MOE]1-8, 예컨대 [MOE]2-7-[영역 G]5-16-[MOE]2-7, 예컨대 [MOE]3-6-[영역 G]-[MOE]3-6을 갖고, 여기서 영역 G는 갭머 정의에서 규정된 바와 같다. 5-10-5 설계(MOE-DNA-MOE)를 갖는 MOE 갭머가 당해 분야에서 널리 이용되고 있다.
올리고뉴클레오티드 내에 영역 D' 또는 D''
본원 발명의 올리고뉴클레오티드는 일부 구체예에서 표적 핵산에 상보적인 올리고뉴클레오티드의 연속 뉴클레오티드 서열, 예컨대 갭머 F-G-F' 및 추가적인 5' 및/또는 3' 뉴클레오시드를 포함하거나 또는 이들로 구성될 수 있다. 추가적인 5' 및/또는 3' 뉴클레오시드는 표적 핵산에 완전히 상보적이거나 또는 그렇지 않을 수 있다. 이런 추가적인 5' 및/또는 3' 뉴클레오시드는 본원에서 영역 D' 및 D''로 지칭될 수 있다.
영역 D' 또는 D''의 추가는 연속 뉴클레오티드 서열, 예컨대 갭머를 접합 모이어티 또는 다른 기능기에 결합시키기 위한 목적으로 이용될 수 있다. 연속 뉴클레오티드 서열을 접합 모이어티와 결합시키는 데 이용되는 경우, 생체개열가능 링커로서 작용할 수 있다. 대안적으로는, 엑소뉴클레아제 보호 또는 합성 또는 제조의 용이성을 제공하는 데 이용될 수 있다.
영역 D' 및 D''는 영역 F의 5' 단부 또는 영역 F'의 3' 단부에 각각 부착되어, 다음의 화학식 D'-F-G-F', F-G-F'-D'' 또는 D'-F-G-F'-D''의 설계가 산출될 수 있다. 이 경우, F-G-F'는 올리고뉴클레오티드의 갭머 부분이고, 그리고 영역 D' 또는 D''는 올리고뉴클레오티드의 별도의 부분을 구성한다.
영역 D' 또는 D''는 표적 핵산에 상보적이거나 또는 비-상보적일 수 있는 1, 2, 3, 4 또는 5개의 추가적인 뉴클레오티드를 독립적으로 포함하거나 또는 이들로 구성될 수 있다. F 또는 F' 영역에 인접한 뉴클레오티드는 당-변형된 뉴클레오티드, 예컨대 DNA 또는 RNA 또는 이들의 염기 변형된 버전이 아니다. D' 또는 D' 영역은 뉴클레아제에 민감한 생체개열가능 링커로서 작용할 수 있다 (링커의 정의 참조). 일부 구체예에서, 추가적인 5' 및/또는 3' 단부 뉴클레오티드는 포스포디에스테르 연쇄로 결합되고, 그리고 DNA 또는 RNA이다. 영역 D' 또는 D''로서 이용하기에 적합한 뉴클레오티드 기반 생체개열가능 링커는 WO2014/076195에 개시되는데, 이들은 예로서 포스포디에스테르 결합된 DNA 디뉴클레오티드를 포함한다. 폴리-올리고뉴클레오티드 작제물에서 생체개열가능 링커의 이용은 WO2015/113922에 개시되는데, 여기서 이들은 단일 올리고뉴클레오티드 내에서 복수의 안티센스 작제물 (예를 들면, 갭머 영역)을 연결하는 데 이용된다.
한 구체예에서, 본원 발명의 올리고뉴클레오티드는 갭머를 구성하는 연속 뉴클레오티드 서열 이외에 영역 D' 및/또는 D''를 포함한다.
일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 하기 화학식으로 나타낼 수 있다:
F-G-F'; 특히 F1-8-G5-16-F'2-8
D'-F-G-F', 특히 D'1-3-F1-8-G5-16-F'2-8
F-G-F'-D'', 특히 F1-8-G5-16-F'2-8-D''1-3
D'-F-G-F'-D'', 특히 D'1-3- F1-8-G5-16-F'2-8-D''1-3
일부 구체예에서, 영역 D' 및 영역 F 사이에 위치하는 뉴클레오시드간 연쇄는 포스포디에스테르 연쇄이다. 일부 구체예에서, 영역 F' 및 영역 D'' 사이에 위치하는 뉴클레오시드간 연쇄는 포스포디에스테르 연쇄이다.
접합체
본원에서 이용된 용어 접합체는 비-뉴클레오티드 모이어티 (접합 모이어티 또는 영역 C 또는 제3 영역)에 공유 결합된 올리고뉴클레오티드를 지칭한다.
본원 발명의 올리고뉴클레오티드의 하나 또는 그 이상의 비-뉴클레오티드 모이어티로의 접합은, 예를 들면 올리고뉴클레오티드의 활성, 세포 분포, 세포 흡수 또는 안정성에 영향을 줌으로써 올리고뉴클레오티드의 약리학을 개선할 수 있다. 일부 구체예에서, 접합 모이어티는 올리고뉴클레오티드의 세포 분포, 생체이용률, 대사, 배설, 투과성 및/또는 세포 흡수를 개선함으로써 올리고뉴클레오티드의 약동학적 특성을 변경하거나 향상시킨다. 특히, 접합체는 올리고뉴클레오티드를 특정 기관, 조직 또는 세포 유형에 표적화함으로써 상기 기관, 조직 또는 세포 유형에서 올리고뉴클레오티드의 효과를 향상시킬 수 있다. 이와 동시에, 접합체는 비-표적 세포 유형, 조직 또는 기관에서 올리고뉴클레오티드의 활성, 예를 들면 표적 이탈 활성, 또는 비-표적 세포 유형, 조직 또는 기관에서 활성을 감소시키는 역할을 할 수 있다.
WO 93/07883 및 WO2013/033230은 적합한 접합 모이어티를 제공하고, 이들은 본원에서 참조로서 편입된다. 더욱 적합한 접합 모이어티는 아시알로당단백질 수용체 (ASGPR)에 결합할 수 있는 것들이다. 특히, 삼가 N-아세틸갈락토사민 접합 모이어티가 ASGPR에 결합하는 데 적합하며, 예를 들면 WO 2014/076196, WO 2014/207232 및 WO 2014/179620 (본원에서 참조로서 편입됨)을 참조한다. 이런 접합체는 올리고뉴클레오티드의 간으로의 흡수를 향상시키면서, 신장에서 이의 존재를 감소시켜 접합되지 않은 버전의 동일한 올리고뉴클레오티드와 비교하여 접합된 올리고뉴클레오티드의 간/신장 비율을 증가시키는 역할을 한다.
올리고뉴클레오티드 접합체 및 이들의 합성은 또한, Manoharan in Antisense Drug Technology, Principles, Strategies, and Applications, S.T. Crooke, ed., Ch. 16, Marcel Dekker, Inc., 2001 및 Manoharan, Antisense and Nucleic Acid Drug Development, 2002, 12, 103에 의한 포괄적인 리뷰에서 보고되었고, 이들은 각각 본원에서 전체적으로 참조로서 편입된다.
한 구체예에서, 비-뉴클레오티드 모이어티 (접합 모이어티)는 탄수화물, 세포 표면 수용체 리간드, 원료의약품, 호르몬, 친유성 물질, 중합체, 단백질, 펩티드, 독소 (예를 들면, 박테리아 독소), 비타민, 바이러스 단백질 (예를 들면, 캡시드) 또는 이들의 조합으로 구성된 군에서 선택된다.
링커
연쇄 또는 링커는 하나 또는 그 이상의 공유 결합을 통해 하나의 화학기 또는 관심 부분을 다른 화학기 또는 관심 부분에 결합하는 두 원자 사이의 연결이다. 접합 모이어티는 직접적으로 또는 연결 모이어티 (예를 들면, 링커 또는 사슬)를 통해 올리고뉴클레오티드에 부착될 수 있다. 링커는 제3 영역, 예를 들면, 접합 모이어티 (영역 C)를 제1 영역, 예를 들면, 표적 핵산에 상보적인 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열 (영역 A)에 공유 연결하는 역할을 한다.
본원 발명의 일부 구체예에서, 본원 발명의 접합체 또는 올리고뉴클레오티드 접합체는 표적 핵산 (영역 A 또는 제1 영역)에 상보적인 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열 및 접합 모이어티 (영역 C 또는 제3 영역) 사이에 위치한 링커 영역 (제2 영역 또는 영역 B 및/또는 영역 Y)을 임의적으로 포함할 수 있다.
영역 B는 포유류 체내에서 정상적으로 접하게 되는 조건 또는 이들과 유사한 조건 하에서 개열될 수 있는 생리학적으로 불안정한 결합을 포함하거나 또는 이것으로 구성되는 생체개열가능 링커를 지칭한다. 생리학적으로 불안정한 링커가 화학적 변환 (예를 들면, 개열)을 겪게 되는 조건은 화학적 조건, 예컨대 pH, 온도, 산화 또는 환원 조건 또는 작용제, 그리고 포유류 세포에서 발견되거나 이와 유사한 염 농도를 포함한다. 포유류 세포내 조건은 또한 포유류 세포 내에 정상적으로 존재하는, 예컨대 단백질 분해 효소 또는 가수 분해 효소 또는 뉴클레아제로부터 효소 활성의 존재의 존재를 포함한다. 한 구체예에서, 생체개열가능 링커는 S1 뉴클레아제 개열에 민감하다. 바람직한 구체예에서 뉴클레아제 민감성 링커는 적어도 2개의 연속 포스포디에스테르 연쇄, 예컨대 적어도 3 또는 4 또는 5개의 연속 포스포디에스테르 연쇄를 포함하는 1 내지 10개의 뉴클레오시드, 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 뉴클레오시드, 더욱 바람직하게는 2 내지 6개의 뉴클레오시드, 그리고 가장 바람직하게는 2 내지 4개의 결합된 뉴클레오시드를 포함한다. 바람직하게는 뉴클레오시드는 DNA 또는 RNA이다. 포스포디에스테르 내포 생체개열가능 링커는 WO 2014/076195 (본원에 참조로서 편입됨)에서 더욱 상세하게 기술된다.
영역 Y는 반드시 생체개열가능할 필요는 없지만, 주로 접합 모이어티 (영역 C 또는 제3 영역)를 올리고뉴클레오티드 (영역 A 또는 제1 영역)에 공유 연결하는 역할을 하는 링커를 지칭한다. 영역 Y 링커는 반복 단위, 예컨대 에틸렌 글리콜, 아미노산 단위 또는 아미노 알킬 기의 사슬 구조 또는 소중합체를 포함할 수 있다. 본원 발명의 올리고뉴클레오티드 접합체는 다음의 영역 요소 A-C, A-B-C, A-B-Y-C, A-Y-B-C 또는 A-Y-C로 작제될 수 있다. 일부 구체예에서, 링커 (영역 Y)는 아미노 알킬, 예컨대, 예를 들면 C6 내지 C12 아미노 알킬기를 비롯한 C2-C36 아미노 알킬기이다. 바람직한 구체예에서, 링커 (영역 Y)는 C6 아미노 알킬기이다.
치료
본원에서 이용된 용어 "치료"는 기존 질환 (예를 들면, 본원에 언급된 질환 또는 장애)의 치료, 또는 질환의 예방, 즉 방지 둘 모두를 지칭한다. 이런 이유로, 본원에서 언급된 치료는, 일부 구체예에서 예방적일 수 있음이 인식될 것이다. 예방적은 HBV 감염이 만성 HBV 감염으로 변하는 것을 예방하거나, 또는 만성 HBV 감염에 의해 유발된 심각한 간 질환, 예컨대 간경화증 및 간세포 암종을 예방하는 것으로 이해될 수 있다.
예방
본원에서 용어 "예방하는", "예방" 또는 "예방한다"는 예방적 처치, 다시 말하면, 질환을 치유하기 보다는 예방을 목적으로 하는 조치 또는 절차에 관계한다. 예방은 질환 또는 이의 증상을 완전하게 또는 부분적으로 예방하는 면에서 예방적인 원하는 약리학적 및/또는 생리학적 효과가 획득된다는 것을 의미한다. 따라서, 본원에서 "HBV 감염을 예방하는"은 HBV 감염이 개체에서 발생하는 것을 예방하고, 그리고 HBV 감염의 증상의 발생을 예방하는 것을 포함한다. 본원 발명에서는 특히, HBV 감염된 어미로부터 소아로의 HBV 감염의 예방이 예기된다. 급성 HBV 감염이 만성 HBV 감염으로 변하는 것의 예방이 또한 예기된다.
환자
본원 발명을 위해 "개체" (또는 "환자")는 척추동물일 수 있다. 본원 발명의 맥락에서, 용어 "개체"는 인간 및 다른 동물, 특히 포유동물, 그리고 다른 생물체 둘 모두를 포함한다. 따라서 본원에서 제공된 수단과 방법은 인간 요법 및 수의학적 적용 둘 모두에 적용가능하다. 따라서, 본원에서 개체는 동물, 예컨대 생쥐, 쥐, 햄스터, 토끼, 기니피그, 흰담비, 고양이, 개, 닭, 양, 소 종, 말, 낙타, 또는 영장류일 수 있다. 바람직하게는, 개체는 포유동물이다. 더욱 바람직하게는 개체는 인간이다.
발명의 상세한 설명
감염된 간세포에서 HBV cccDNA는 지속적인 만성 감염 및 재활성화를 책임지며, 새로 합성된 바이러스 자손 및 세포내 뉴클레오캡시드 재활용을 통한 cccDNA 풀 재보충 둘 모두를 담보하는 모든 바이러스 하위유전체 전사체 및 전유전체 RNA (pgRNA)에 대한 주형이 된다. 본원 발명의 맥락에서 RTEL1이 cccDNA 안정성과 연관되는 것으로 최초로 밝혀졌다. 이러한 지식은 HBV 감염된 개체에서 cccDNA를 불안정하게 만드는 기회를 가능하게 하고, 이것은 차례로, 만성적으로 감염된 HBV 환자의 완전한 치유를 위한 기회를 연다.
본원 발명의 한 가지 양상은 B형 간염 바이러스 (HBV) 감염, 특히 만성 HBV 감염의 치료 및/또는 예방에서 이용을 위한 RTEL1 저해제이다.
RTEL1 저해제는 예를 들면 RTEL1 단백질에 특이적으로 결합하는 소형 분자일 수 있는데, 여기서 상기 저해제는 cccDNA에 대한 RTEL1 단백질의 결합을 예방하거나 또는 감소시킨다.
본원 발명의 구체예는 감염된 세포, 예컨대 HBV 감염된 세포에서 cccDNA 및/또는 pgRNA를 감소시킬 수 있는 RTEL1 저해제이다.
추가 구체예에서, RTEL1 저해제는 HBV 감염된 개체에서 생체내에서 HBsAg 및/또는 HBeAg를 감소시킬 수 있다.
본원 발명의 올리고뉴클레오티드
치료적 올리고뉴클레오티드는 잠재적으로 탁월한 RTEL1 저해제인데, 그 이유는 이들이 RNA 간섭 경로를 통해 또는 RNaseH 개열을 통해 RTEL1 전사체를 표적으로 하고 이의 분해를 증진할 수 있기 때문이다. 대안으로, 올리고뉴클레오티드, 예컨대 앱타머는 또한, RTEL1 단백질 상호작용의 저해제로서 작용할 수 있다.
본원 발명의 한 가지 양상은 B형 간염 바이러스 (HBV) 감염의 치료 및/또는 예방에서 이용을 위한 RTEL1 표적화 올리고뉴클레오티드이다. 이런 올리고뉴클레오티드는 단일 가닥 안티센스 올리고뉴클레오티드; siRNA 분자; 또는 shRNA 분자로 구성된 군에서 선택될 수 있다.
본 섹션은 B형 간염 바이러스 (HBV) 감염의 치료 및/또는 예방에서 이용에 적합한 신규한 올리고뉴클레오티드를 설명한다.
본원 발명의 올리고뉴클레오티드는 시험관내와 생체내에서 RTEL1의 발현을 저해할 수 있다. 저해는 올리고뉴클레오티드를, RTEL1을 인코딩하거나 또는 RTEL1의 조절에 관련되는 표적 핵산에 혼성화함으로써 달성된다. 표적 핵산은 포유류 RTEL1 서열, 예컨대 서열 번호: 1 및/또는 2의 서열일 수 있다.
일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 표적의 발현을 저해 또는 하향 조절함으로써 표적의 발현을 조절할 수 있다. 바람직하게는, 이런 조절은 표적의 정상 발현 수준과 비교하여 적어도 20%, 더욱 바람직하게는 표적의 정상 발현 수준과 비교하여 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80% 또는 적어도 90%의 발현 저해를 생성한다. 일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 PXB-PHH 세포에서 10 μM을 이용하여 시험관내에서 RTEL1 mRNA의 발현 수준을 적어도 60% 또는 70% 저해할 수도 있다. 일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 PXB-PHH 세포에서 10μM을 이용하여 시험관내에서 RTEL1 단백질의 발현 수준을 적어도 50% 저해할 수도 있으며, 표적 감소의 이러한 범위는 cccDNA 감소와 우수한 상관관계를 갖는 핵산 분자를 선별하는 면에서 유리하다. 적합하게는, 실시예는 RTEL1 RNA 또는 단백질 저해를 계측하는 데 이용될 수 있는 분석법을 제공한다 (예를 들면, 실시예 1). 표적 저해는 올리고뉴클레오티드의 연속 뉴클레오티드 서열 및 표적 핵산 사이의 혼성화에 의해 촉발된다. 일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 올리고뉴클레오티드 및 표적 핵산 사이의 부정합을 포함한다. 부정합에도 불구하고 표적 핵산에 대한 혼성화는 RTEL1 발현의 원하는 저해를 나타내는 데 여전히 충분할 수 있다. 부정합으로 인한 감소된 결합 친화성은 바람직하게는 올리고뉴클레오티드 내에 뉴클레오티드 숫자의 증가 및/또는 올리고뉴클레오티드 서열 내에 존재하는, 표적에 대한 결합 친화성을 증가시킬 수 있는 변형된 뉴클레오시드, 예컨대 LNA를 비롯한 2' 당 변형된 뉴클레오시드 숫자의 증가에 의해 보상될 수 있다.
본원 발명의 한 양상은 포유류 RTEL1 표적 핵산, 특히 인간 RTEL1 핵산에 적어도 95% 상보적인, 예컨대 완전히 상보적인, 길이에서 적어도 10개 뉴클레오티드, 예컨대 길이에서 적어도 12 내지 30개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는, 길이에서 12 내지 60개 뉴클레오티드의 올리고뉴클레오티드에 관계한다. 이들 올리고뉴클레오티드는 RTEL1의 발현을 저해할 수 있다.
본원 발명의 한 양상은 포유류 RTEL1에 적어도 90% 상보적인, 예컨대 완전히 상보적인, 길이에서 적어도 10개 뉴클레오티드, 예컨대 10 내지 30개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는, 길이에서 12 내지 30개 뉴클레오티드의 안티센스 올리고뉴클레오티드인 본원 발명에 따른 올리고뉴클레오티드에 관계한다.
본원 발명의 추가 양상은 서열 번호: 1의 표적 핵산에 적어도 90% 상보적인, 예컨대 완전히 상보적인, 길이에서 12 내지 20개, 예컨대 15 내지 22개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는 본원 발명에 따른 올리고뉴클레오티드에 관계한다.
일부 구체예에서, 올리고뉴클레오티드는 표적 핵산 또는 표적 서열의 영역에 적어도 90% 상보적인, 예컨대 적어도 91%, 예컨대 적어도 92%, 예컨대 적어도 93%, 예컨대 적어도 94%, 예컨대 적어도 95%, 예컨대 적어도 96%, 예컨대 적어도 97%, 예컨대 적어도 98%, 또는 100% 상보적인, 길이에서 10 내지 30개 뉴클레오티드의 연속 서열을 포함한다.
바람직하게는, 본원 발명의 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 표적 핵산의 영역에 완전히 상보적 (100% 상보적)이거나, 또는 일부 구체예에서 올리고뉴클레오티드 및 표적 핵산 사이에 하나 또는 두 개의 부정합을 포함할 수 있다.
일부 구체예에서, 안티센스 올리고뉴클레오티드 서열은 서열 번호: 1의 상응하는 표적 핵산에 100% 상보적이다.
일부 구체예에서 본원 발명의 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열은 서열 번호: 1 및 서열 번호: 2의 표적 핵산에 적어도 95% 상보적, 예컨대 완전히 (또는 100%) 상보적이다.
일부 구체예에서, 올리고뉴클레오티드는 서열 번호: 1 내에 존재하는 상응하는 표적 서열에 적어도 90% 상보적, 예컨대 100% 상보적인, 길이에서 15 내지 22개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는데, 여기서 상기 표적 서열은 서열 번호: 3 내지 21 (표 4) 또는 표 5A에서 영역 1A 내지 959A로 구성된 군에서 선택된다.
표 5A: 본원 발명의 올리고뉴클레오티드를 이용하여 표적화될 수 있는 서열 번호 1의 영역
일부 구체예에서, 올리고뉴클레오티드는 서열 번호: 1 내에 존재하는 상응하는 표적 서열에 적어도 90% 상보적, 예컨대 100% 상보적인, 길이에서 16 내지 20개, 예컨대 15 내지 22개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는데, 여기서 상기 표적 서열은 서열 번호: 3 내지 21 (표 4) 또는 표 5B에서 영역 B1 내지 B28로 구성된 군에서 선택된다.
표 5B: 본원 발명의 올리고뉴클레오티드를 이용하여 표적화될 수 있는 서열 번호 1의 영역
일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 길이에서 12 내지 60개의 뉴클레오티드, 예컨대 길이에서 13 내지 50개, 예컨대 14 내지 35개, 예컨대 15 내지 30개, 예컨대 16 내지 20개의 연속 뉴클레오티드를 포함하거나 또는 이들로 구성된다. 바람직한 구체예에서, 올리고뉴클레오티드는 길이에서 15, 16, 17, 18, 19 또는 20개의 뉴클레오티드를 포함하거나 또는 이들로 구성된다.
일부 구체예에서, 표적 핵산에 상보적인 올리고뉴클레오티드의 연속 뉴클레오티드 서열은 길이에서 12 내지 30개, 예컨대 13 내지 25개, 예컨대 15 내지 23개, 예컨대 16 내지 22개의 연속 뉴클레오티드를 포함하거나 또는 이들로 구성된다.
일부 구체예에서, 표적 핵산에 상보적인 siRNA 또는 shRNA의 연속 뉴클레오티드 서열은 길이에서 18 내지 28개, 예컨대 19 내지 26개, 예컨대 20 내지 24개, 예컨대 21 내지 23개의 연속 뉴클레오티드를 포함하거나 또는 이들로 구성된다.
일부 구체예에서, 표적 핵산에 상보적인 단일 가닥 안티센스 올리고뉴클레오티드의 연속 뉴클레오티드 서열은 길이에서 12 내지 22개, 예컨대 14 내지 20개, 예컨대 16 내지 20개, 예컨대 15 내지 21개, 예컨대 15 내지 18개, 예컨대 16 내지 18개, 예컨대 16 내지 17개의 연속 뉴클레오티드를 포함하거나 또는 이들로 구성된다.
일부 구체예에서, 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열은 표 6 (재료와 방법 섹션)에서 열거된 서열로 구성된 군에서 선택되는 서열을 포함하거나 또는 이것으로 구성된다.
일부 구체예에서, 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열은 서열 번호: 22 내지 237 (표 6에서 열거된 모티프 서열 참조)로 구성된 군에서 선택되는 서열에 적어도 90% 동일성, 바람직하게는 100% 동일성을 갖는, 길이에서 10 내지 30의 뉴클레오티드를 포함하거나 또는 이들로 구성된다. 특정한 구체예에서 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열은 서열 번호: 22; 23; 24; 25; 26; 27; 28; 29; 32; 35; 36; 37; 38; 39; 40; 41; 42; 42; 42; 43; 43; 46; 49; 83; 109; 130; 203; 및 232에서 선택된다.
연속 올리고뉴클레오티드 서열 (모티프 서열)은, 예를 들면 뉴클레아제 내성 및/또는 표적 핵산에 대한 결합 친화성을 증가시키도록 변형될 수 있는 것으로 이해된다.
변형된 뉴클레오시드 (예컨대, 높은 친화성 변형된 뉴클레오시드)가 올리고뉴클레오티드 서열 내로 통합되는 패턴은 일반적으로 올리고뉴클레오티드 설계로 명명된다.
본원 발명의 올리고뉴클레오티드는 변형된 뉴클레오시드 및 RNA 뉴클레오시드 (특히, siRNA 및 shRNA 분자의 경우) 또는 DNA 뉴클레오시드 (특히, 단일 가닥 안티센스 올리고뉴클레오티드의 경우)로 설계될 수 있다. 바람직하게는, 높은 친화성 변형된 뉴클레오시드가 이용된다.
한 구체예에서, 올리고뉴클레오티드는 적어도 1개의 변형된 뉴클레오시드, 예컨대 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개 또는 적어도 16개의 변형된 뉴클레오시드를 포함한다. 한 구체예에서, 올리고뉴클레오티드는 1 내지 10개의 변형된 뉴클레오시드, 예컨대 2 내지 9개의 변형된 뉴클레오시드, 예컨대 3 내지 8개의 변형된 뉴클레오시드, 예컨대 4 내지 7개의 변형된 뉴클레오시드, 예컨대 6 또는 7개의 변형된 뉴클레오시드를 포함한다. 적합한 변형은 "정의" 섹션에서 "변형된 뉴클레오시드", "높은 친화성 변형된 뉴클레오시드", "당 변형", "2' 당 변형" 및 "잠금 핵산 (LNA)" 하에 기술된다.
한 구체예에서, 올리고뉴클레오티드는 하나 또는 그 이상의 당 변형된 뉴클레오시드, 예컨대 2' 당 변형된 뉴클레오시드를 포함한다. 바람직하게는, 본원 발명의 올리고뉴클레오티드는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA, 2'-아미노-DNA, 2'-플루오로-DNA, 아라비노 핵산 (ANA), 2'-플루오로-ANA 및 LNA 뉴클레오시드로 구성된 군에서 독립적으로 선택되는 하나 또는 그 이상의 2' 당 변형된 뉴클레오시드를 포함한다. 변형된 뉴클레오시드(들) 중 하나 또는 그 이상이 잠금 핵산 (LNA)인 것이 바람직하다.
추가의 구체예에서, 올리고뉴클레오티드는 적어도 하나의 변형된 뉴클레오시드간 연쇄를 포함한다. 적합한 뉴클레오시드간 변형은 "정의" 섹션에서 "변형된 뉴클레오시드간 연쇄" 하에 기술된다. 올리고뉴클레오티드의 5' 또는 3' 단부에서 적어도 2 내지 3개의 뉴클레오시드간 연쇄가 포스포로티오에이트 뉴클레오시드간 연쇄인 것이 바람직하다. 단일 가닥 안티센스 올리고뉴클레오티드의 경우에, 연속 뉴클레오티드 서열 내에 적어도 75%, 예컨대 모든 뉴클레오시드간 연쇄가 포스포로티오에이트 뉴클레오시드간 연쇄인 것이 바람직하다. 일부 구체예에서, 단일 가닥 안티센스 올리고뉴클레오티드의 연속 서열에서 모든 뉴클레오티드간 연쇄는 포스포로티오에이트 연쇄이다.
일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 적어도 하나의 LNA 뉴클레오시드, 예컨대 1, 2, 3, 4, 5, 6, 7 또는 8개의 LNA 뉴클레오시드, 예컨대 2 내지 6개의 LNA 뉴클레오시드, 예컨대 3 내지 7개의 LNA 뉴클레오시드, 4 내지 8개의 LNA 뉴클레오시드 또는 3, 4, 5, 6, 7 또는 8개의 LNA 뉴클레오시드를 포함한다. 일부 구체예에서, 올리고뉴클레오티드에서 적어도 75%의 변형된 뉴클레오시드는 LNA 뉴클레오시드이다, 예컨대 80%, 예컨대 85%, 예컨대 90%의 변형된 뉴클레오시드는 LNA 뉴클레오시드이다. 또 다른 추가의 구체예에서, 올리고뉴클레오티드에서 모든 변형된 뉴클레오시드는 LNA 뉴클레오시드이다. 추가의 구체예에서, 올리고뉴클레오티드는 베타-D-옥시-LNA, 그리고 하기의 LNA 뉴클레오시드: 베타-D 또는 알파-L 구성에서 티오-LNA, 아미노-LNA, 옥시-LNA, ScET 및/또는 ENA, 또는 이들의 조합 중 하나 또는 그 이상을 포함할 수 있다. 추가의 구체예에서, 모든 LNA 시토신 단위는 5-메틸-시토신이다. 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열의 뉴클레아제 안정성을 위해 뉴클레오티드 서열의 5' 단부에서 적어도 1개의 LNA 뉴클레오시드 및 3' 단부에서 적어도 2개의 LNA 뉴클레오시드를 갖는 것이 바람직하다.
본원 발명의 구체예에서, 본원 발명의 올리고뉴클레오티드는 RNase H를 모집할 수 있다.
본원 발명에서 유리한 구조 설계는 "정의" 섹션에서 예를 들면 "갭머", "LNA 갭머" 및 "MOE 갭머" 하에 기술된 바와 같은 갭머 설계이다. 본원 발명에서, 본원 발명의 안티센스 올리고뉴클레오티드가 F-G-F' 설계를 갖는 갭머인 것이 바람직하다. 일부 구체예에서 갭머는 균일한 측부를 갖는 LNA 갭머이다.
본원 발명의 일부 구체예에서 LNA 갭머는 하기의 균일한 측부 설계에서 선택된다: 2-12-3, 4-14-2, 3-10-3, 3-9-3, 2-15-2, 2-12-4, 1-13-2, 3-13-2, 4-13-2, 2-12-2, 3-12-2, 3-15-2, 3-14-2, 3-13-3, 2-14-4, 3-12-3, 1-14-3, 3-14-3, 2-14-3, 2-15-3, 3-11-3, 1-12-3, 1-11-4, 1-13-2, 2-13-2, 2-16-2, 1-14-2, 1-17-3 및 1-18-2.
표 6 (재료와 방법 섹션)은 각 모티프 서열의 바람직한 설계를 열거한다.
모든 경우에서 F-G-F' 설계는 "정의" 섹션에서 "올리고뉴클레오티드 내에 영역 D' 또는 D''" 하에 기술된 바와 같은 영역 D' 및/또는 D''를 더욱 포함할 수 있다. 일부 구체예에서 본원 발명의 올리고뉴클레오티드는 갭머 영역의 5' 또는 3' 단부에서 1, 2 또는 3개의 포스포디에스테르 결합된 뉴클레오시드 단위, 예컨대 DNA 단위를 갖는다. 일부 구체예에서 본원 발명의 올리고뉴클레오티드는 2개의 5' 포스포디에스테르 결합된 DNA 뉴클레오시드, 그 이후에 "정의" 섹션에서 규정된 바와 같은 F-G-F' 갭머 영역으로 구성된다. 5' 또는 3' 단부에서 포스포디에스테르 결합된 DNA 단위를 내포하는 올리고뉴클레오티드는 접합에 적합하고, 그리고 본원에서 기술된 바와 같은 접합 모이어티를 더욱 포함할 수 있다. 간으로의 전달을 위해, ASGPR 표적화 모이어티가 접합 모이어티로서 특히 바람직하다.
본원 발명의 일부 구체예의 경우에, 올리고뉴클레오티드는 CMP-ID-NO: 22_1; 23_1; 24_1; 25_1; 26_1; 27_1; 28_1; 29_1; 30_1; 31_1; 32_1; 33_1; 34_1; 35_1; 36_1; 37_1; 38_1; 39_1; 40_1; 41_1; 42_1; 42_2; 42_3; 43_1; 43_2; 44_1; 45_1; 46_1; 47_1; 48_1; 49_1; 130_1; 109_1; 83_1; 203_1 및 232_1을 갖는 올리고뉴클레오티드 화합물의 군에서 선택된다 (참조: 표 6).
접합체
HBV 감염이 간에서 간세포에 일차적으로 영향을 주기 때문에, 접합되지 않은 저해제와 비교하여 저해제의 간으로의 전달을 증가시킬 접합 모이어티에 RTEL1 저해제를 접합하는 것이 바람직하다. 한 구체예에서 간 표적화 모이어티는 콜레스테롤 또는 다른 지질을 포함하는 모이어티, 또는 아시알로당단백질 수용체 (ASGPR)에 결합할 수 있는 접합 모이어티에서 선택된다.
일부 구체예에서, 본원 발명은 접합 모이어티에 공유 부착된 본원 발명의 핵산 분자를 포함하는 접합체를 제공한다.
아시알로당단백질 수용체 (ASGPR) 접합 모이어티는 갈락토오스의 친화성과 동등하거나 또는 이보다 큰 친화성으로 아시알로당단백질 수용체에 결합할 수 있는 하나 또는 그 이상의 탄수화물 모이어티 (ASGPR 표적화 모이어티)를 포함한다. 아시알로당단백질 수용체에 대한 다양한 갈락토오스 유도체의 친화성이 연구되었거나 (참조: 예를 들면: Jobst, S.T. and Drickamer, K. JB.C. 1996, 271, 6686) 또는 당해 분야에서 전형적인 방법을 이용하여 쉽게 결정된다.
한 구체예에서 접합 모이어티는 갈락토오스, 갈락토사민, N-포르밀-갈락토사민, N-아세틸갈락토사민, N-프로피오닐-갈락토사민, N-n-부타노일-갈락토사민 및 N-이소부타노일갈락토사민으로 구성된 군에서 선택되는 적어도 하나의 아시알로당단백질 수용체 표적화 모이어티를 포함한다. 유리하게는 아시알로당단백질 수용체 표적화 모이어티는 N-아세틸갈락토사민 (GalNAc)이다.
ASGPR 접합 모이어티를 산출하기 위해, ASGPR 표적화 모이어티 (바람직하게는 GalNAc)는 접합체 골격에 부착될 수 있다. 일반적으로, ASGPR 표적화 모이어티는 골격의 동일한 단부에 있을 수 있다. 한 구체예에서, 접합 모이어티는 안티센스 올리고뉴클레오티드에 접합될 수 있는 가지치기 분자에 각 GalNAc 모이어티를 연결하는 스페이서에 연결된 2 내지 4개의 말단 GalNAc 모이어티로 구성된다.
추가 구체예에서, 접합 모이어티는 아시알로당단백질 수용체 표적화 모이어티에 대하여 일가, 이가, 삼가 또는 사가이다. 유리하게는 아시알로당단백질 수용체 표적화 모이어티는 N-아세틸갈락토사민 (GalNAc) 모이어티를 포함한다.
GalNAc 접합 모이어티는, 예를 들면 WO 2014/179620 및 WO 2016/055601 및 PCT/EP2017/059080 (본원에서 참조로서 편입됨)에서 설명된 것들뿐만 아니라 GalNAc 모이어티가 부착된 작은 펩티드, 예컨대 Tyr-Glu-Glu-(아미노헥실 GalNAc)3 (YEE(ahGalNAc)3; 간세포 상에서 아시알로당단백질 수용체에 결합하는 글리코트리펩티드, 참조: 예를 들면, Duff, et al., Methods Enzymol, 2000, 313, 297); 리신-기초된 갈락토오스 클러스터 (예를 들면, L3G4; Biessen, et al., Cardovasc. Med., 1999, 214); 그리고 콜란-기초된 갈락토오스 클러스터 (예를 들면, 아시알로당단백질 수용체에 대한 탄수화물 인식 모티프)를 포함할 수 있다.
ASGPR 접합 모이어티, 특히 삼가 GalNAc 접합 모이어티는 당해 분야에서 공지된 방법을 이용하여 올리고뉴클레오티드의 3' 또는 5' 단부에 부착될 수 있다. 한 구체예에서 ASGPR 접합 모이어티는 올리고뉴클레오티드의 5' 단부에 결합된다.
한 구체예에서 접합 모이어티는 삼가 N-아세틸갈락토사민 (GalNAc), 예컨대 도 1에서 도시된 것들, 특히 도 1d에서 도시된 것들이다.
제조 방법
추가적인 양상에서, 본원 발명은 뉴클레오티드 단위를 반응시켜 올리고뉴클레오티드 내에 포함되는 공유 결합된 연속 뉴클레오티드 단위를 형성하는 단계를 포함하는, 본원 발명의 올리고뉴클레오티드의 제조 방법을 제공한다. 바람직하게는, 상기 방법은 포스포라미디트 화학 반응을 이용한다 (참조: 예를 들면, Caruthers et al, 1987, Methods in Enzymology vol. 154, 287-313쪽). 추가의 구체예에서, 상기 방법은 연속 뉴클레오티드 서열을 접합 모이어티 (리간드)와 반응시켜 접합 모이어티를 올리고뉴클레오티드에 공유 부착하는 단계를 추가로 포함한다. 추가의 양상에서, 본원 발명의 올리고뉴클레오티드 또는 본원 발명의 접합된 올리고뉴클레오티드를 제약학적으로 허용되는 희석제, 용매, 운반체, 염 및/또는 보조제와 혼합하는 단계를 포함하는, 본원 발명의 조성물을 제조하기 위한 방법이 제공된다.
제약학적 염
본원 발명에 따른 화합물은 그들의 제약학적으로 허용되는 염의 형태로 존재할 수 있다. 용어 "제약학적으로 허용되는 염"은 본원 발명의 화합물의 생물학적 효과와 특성을 유지하고 적합한 비-독성 유기 또는 무기 산 또는 유기 또는 무기 염기로부터 형성되는 전통적인 산-부가 염 또는 염기-부가 염을 지칭한다. 산-부가 염은, 예를 들면, 염산, 브롬화수소산, 요오드화수소산, 황산, 술팜산, 인산 및 질산과 같은 무기산으로부터 유래된 것들, 그리고 p-톨루엔술폰산, 살리실산, 메탄술폰산, 옥살산, 숙신산, 시트르산, 말산, 락트산 및 푸마르산 등과 유기산으로부터 유래된 것들을 포함한다. 염기-부가 염은 암모늄, 칼륨, 나트륨 및 4차 수산화암모늄, 예컨대 예를 들면 수산화테트라메틸암모늄으로부터 유래된 것들을 포함한다. 제약학적 화합물을 염으로 바꾸는 화학적 변형은 화합물의 개선된 물리적 및 화학적 안정성, 흡습성, 유동성 및 용해도를 수득하기 위한 약제사들에게 잘 알려진 기술이다. 예를 들면, Bastin, Organic Process Research & Development 2000, 4, 427-435 또는 Ansel, In: Pharmaceutical Dosage Forms and Drug Delivery Systems, 6th ed. (1995), pp. 196 및 1456-1457에서 기술된다. 예를 들면, 본원에 제공된 화합물의 제약학적으로 허용되는 염은 나트륨 염일 수 있다.
추가의 양상에서, 본원 발명은 안티센스 올리고뉴클레오티드 또는 이의 접합체의 제약학적으로 허용되는 염을 제공한다. 바람직한 구체예에서, 제약학적으로 허용되는 염은 나트륨 또는 칼륨 염이다.
제약학적 조성물
추가의 양상에서, 본원 발명은 전술된 올리고뉴클레오티드 및/또는 올리고뉴클레오티드 접합체 또는 이의 염 중 임의의 것 및 제약학적으로 허용되는 희석제, 운반체, 염 및/또는 보조제를 포함하는 제약학적 조성물을 제공한다. 제약학적으로 허용되는 희석제는 인산염-완충 식염수 (PBS)를 포함하고, 그리고 제약학적으로 허용되는 염은 나트륨 및 칼륨 염을 포함하지만 이들에 한정되지 않는다. 일부 구체예에서, 제약학적으로 허용되는 희석제는 멸균 인산염 완충된 식염수이다. 일부 구체예에서, 올리고뉴클레오티드는 제약학적으로 허용되는 희석제에서 50-300 μM 용액의 농도로 이용된다.
본원 발명에 이용하기에 적합한 제제는 Remington's Pharmaceutical Sciences, Mack Publishing Company, Philadelphia, Pa., 17th ed., 1985에서 발견된다. 약물 전달 방법에 관한 간략한 검토를 위해, 예를 들면 Langer (Science 249: 1527-1533, 1990)를 참조한다. WO 2007/031091은 제약학적으로 허용되는 희석제, 운반체 및 보조제의 적합하고 바람직한 실례를 추가로 제공한다 (본원에 참조로서 편입됨). 적합한 용량, 제제, 투여 경로, 조성물, 약형, 다른 치료제와의 병용, 전구약물 제제 또한 WO2007/031091에서 제공된다.
일부 구체예에서, 본원 발명의 올리고뉴클레오티드 또는 올리고뉴클레오티드 접합체, 또는 이들의 제약학적으로 허용되는 염은 고체 형태, 예컨대 분말, 예컨대 동결 건조된 분말이다.
본원 발명의 화합물, 올리고뉴클레오티드 또는 올리고뉴클레오티드 접합체는 제약학적 조성물 또는 제제의 제조를 위해 제약학적으로 허용되는 활성 또는 비활성 물질과 혼합될 수 있다. 제약학적 조성물의 제제를 위한 조성물 및 방법은 투여 경로, 질환의 정도, 또는 투여되는 용량을 포함하지만 이들에 한정되지 않는 다수의 기준에 의존한다.
이들 조성물은 전통적인 멸균 기술에 의해 멸균될 수 있거나, 또는 멸균 여과될 수 있다. 그 결과로서 생성된 수용액은 그대로 이용하기 위해 포장되거나, 또는 동결 건조될 수 있으며, 동결 건조된 제조물은 투여 전 멸균 수성 운반체와 조합된다. 이들 제조물의 pH는 전형적으로 3 내지 11, 더욱 바람직하게는 5 내지 9 또는 6 내지 8, 그리고 가장 바람직하게는 7 내지 8, 예컨대 7 내지 7.5일 것이다. 그 결과로서 생성된 고체 형태의 조성물은 복수의 단일 투약 단위로 포장될 수 있으며, 각각은 고정된 양의 전술된 작용제 또는 작용제들을, 예컨대 정제 또는 캡슐의 밀봉된 포장물 내에 내포한다. 고체 형태의 조성물은 또한 유연한 양을 위한 용기, 예컨대 국소적으로 적용가능한 크림 또는 연고를 위해 설계된 압착가능 튜브에 포장될 수 있다.
일부 구체예에서, 본원 발명의 올리고뉴클레오티드 또는 올리고뉴클레오티드 접합체는 전구약물이다. 특히, 올리고뉴클레오티드 접합체와 관련하여, 일단 전구약물이 작용 부위, 예를 들면, 표적 세포로 전달되면, 접합 모이어티는 올리고뉴클레오티드로부터 개열된다.
투여
본원 발명의 화합물, 올리고뉴클레오티드, 올리고뉴클레오티드 접합체 또는 제약학적 조성물은 국소 (예컨대, 피부, 흡입, 안과 또는 귀) 또는 경장 (예컨대, 경구 또는 위장관을 통해) 또는 비경구 (예컨대, 정맥내, 피하, 근육내, 뇌내, 뇌실내 또는 척수강내) 투여될 수 있다.
바람직한 구체예에서 본원 발명의 올리고뉴클레오티드 또는 제약학적 조성물은 정맥내, 동맥내, 피하, 복막내 또는 근육내 주사 또는 주입, 척수강내 또는 두개내, 예를 들면, 뇌내 또는 심실내, 유리체내 투여를 비롯한 비경구 경로에 의해 투여된다. 한 구체예에서 활성 올리고뉴클레오티드 또는 올리고뉴클레오티드 접합체는 정맥내 투여된다. 다른 구체예에서 활성 올리고뉴클레오티드 또는 올리고뉴클레오티드 접합체는 피하 투여된다.
일부 구체예에서, 본원 발명의 올리고뉴클레오티드, 올리고뉴클레오티드 접합체 또는 제약학적 조성물은 0.1 - 15 mg/kg, 예컨대 0.2 - 10 mg/kg, 예컨대 0.25 - 5 mg/kg의 용량으로 투여된다. 투여는 주 1회, 2 주마다 1회, 3 주마다 1회 또는 심지어 월 1회일 수 있다.
본원 발명은 또한, 약제의 제조를 위한 전술된 바와 같은 본원 발명의 올리고뉴클레오티드 또는 올리고뉴클레오티드 접합체의 용도를 제공하는데, 여기서 상기 약제는 피하 투여용 약형이다.
병용 요법
일부 구체예에서, 본원 발명의 저해제, 예컨대 본원 발명의 화합물, 올리고뉴클레오티드, 올리고뉴클레오티드 접합체 또는 제약학적 조성물은 다른 치료제와의 병용 치료에서 이용을 위한 것이다. 치료제는 예를 들면 전술된 질환 또는 장애에 대한 관리 기준일 수 있다.
실례로서, 본원 발명의 소중합체 또는 소중합체 접합체는 안티센스 (다른 LNA 소중합체 포함), siRNA (예컨대 ARC520), 앱타머, 모르폴리노 또는 임의의 다른 항바이러스성, 뉴클레오티드 서열-의존성 작용 방식을 통해 작용하는 다른 활성제, 예컨대 올리고뉴클레오티드-기초된 항바이러스제 - 예컨대 서열 특이적 올리고뉴클레오티드-기초된 항바이러스제 -와 병용될 수 있다.
추가 실례로서, 본원 발명의 소중합체 또는 소중합체 접합체는 다른 활성제, 예컨대 면역자극 항바이러스성 화합물, 예컨대 인터페론 (예를 들면, 페길화된 인터페론 알파), TLR7 효현제 (예를 들면, GS-9620), 또는 치료용 백신과 병용될 수 있다.
추가 실례로서, 본원 발명의 소중합체 또는 소중합체 접합체는 항바이러스 활성을 갖는 다른 활성제, 예컨대 소형 분자와 병용될 수 있다. 이들 다른 활성제는, 예를 들면, 뉴클레오시드/뉴클레오티드 저해제 (예를 들면, 엔테카비르 또는 테노포비르 디소프록실 푸마르산염), 캡시드화 저해제, 진입 저해제 (예를 들면, 미르클루덱스 B)일 수 있었다.
일정한 구체예에서, 추가 치료제는 HBV 작용제, C형 간염 바이러스 (HCV) 작용제, 화학요법제, 항생제, 진통제, 비스테로이드성 항염증성 (NSAID) 작용제, 항진균제, 항기생충제, 항메스꺼움 작용제, 항-설사 작용제, 또는 면역억제제일 수 있다.
특정 관련된 구체예에서, 추가 HBV 작용제는 인터페론 알파-2b, 인터페론 알파-2a 및 인터페론 알파콘-1 (페길화된 및 페길화되지 않은), 리바비린; HBV RNA 복제 저해제; 두 번째 안티센스 소중합체; HBV 치료용 백신; HBV 예방용 백신; 라미부딘 (3TC); 엔테카비르 (ETV); 테노포비르 디이소프록실 푸마르산염 (TDF); 텔비부딘 (LdT); 아데포비르; 또는 HBV 항체 요법 (단일클론 또는 다중클론)일 수 있다.
다른 특정 관련된 구체예에서, 추가 HCV 작용제는 인터페론 알파-2b, 인터페론 알파-2a 및 인터페론 알파콘-1 (페길화된 및 페길화되지 않은); 리바비린; 페가시스; HCV RNA 복제 저해제 (예를 들면, ViroPharma의 VP50406 계열); HCV 안티센스 작용제; HCV 치료용 백신; HCV 단백질분해효소 저해제; HCV 헬리카아제 저해제; 또는 HCV 단일클론 또는 다중클론 항체 요법일 수 있다.
적용
본원 발명의 올리고뉴클레오티드는, 예를 들면 진단, 치료 및 예방을 위한 연구용 시약으로서 활용될 수 있다.
연구에서, 이런 올리고뉴클레오티드는 세포 (예를 들면, 시험관내 세포 배양물) 및 실험 동물에서 RTEL1 단백질의 합성을 특이적으로 조절하여 표적의 기능적 분석을 용이하게 하거나 또는 치료적 개입을 위한 표적으로서의 유용성의 평가를 용이하게 할 수 있다. 전형적으로, 표적 조절은 단백질을 생산하는 mRNA를 분해 또는 저해하여 단백질 형성을 방해함으로써 달성되거나, 또는 단백질을 생산하는 유전자 또는 mRNA의 조절제를 분해하거나 저해함으로써 달성된다.
연구 또는 진단에서 본원 발명의 올리고뉴클레오티드를 이용하는 경우, 표적 핵산은 cDNA, 또는 DNA 또는 RNA로부터 유래된 합성 핵산일 수 있다.
또한, RTEL1을 발현하는 표적 세포 내에서 RTEL1 발현을 조절하기 위한 생체내 또는 시험관내 방법이 본원 발명에 의해 포괄되고, 상기 방법은 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물을 효과적인 양으로 상기 세포에 투여하는 단계를 포함한다.
일부 구체예에서, 표적 세포는 포유류 세포, 특히 인간 세포이다. 표적 세포는 포유동물에서 시험관내 세포 배양물 또는 조직의 생체내 세포 형성 부분일 수도 있다. 바람직한 구체예에서 표적 세포는 간 내에 존재한다. 표적 세포는 간세포일 수도 있다.
본원 발명의 한 가지 양상은 약제로서 이용을 위한 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물에 관련된다.
본원 발명의 한 양상에서 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물은 감염된 세포에서 cccDNA 수준을 감소시키고, 그리고 이런 이유로 HBV 감염을 저해할 수 있다. 특히, 안티센스 올리고뉴클레오티드는 감염된 세포에서 하기의 파라미터 중에서 한 가지 또는 그 이상에 영향을 줄 수 있다: i) cccDNA를 감소시키고 및/또는 ii) pgRNA를 감소시키고 및/또는 iii) HBV DNA를 감소시키고 및/또는 iv) HBV 바이러스 항원을 감소시킴.
예를 들면, HBV 감염을 저해하는 핵산 분자는 i) 감염된 세포에서 cccDNA 수준을 대조와 비교하여 적어도 40%, 예컨대 50%, 60%, 70%, 80%, 또는 90% 감소시키거나; 또는 ii) pgRNA의 수준을 대조와 비교하여 적어도 40%, 예컨대 50%, 60%, 70%, 80%, 또는 90% 감소시킬 수 있다. 대조는 처리되지 않은 세포 또는 동물, 또는 적합한 대조로 처리된 세포 또는 동물일 수 있다.
HBV 감염의 저해는 HBV 감염된 일차 인간 간세포를 이용하여 시험관내에서, 또는 인간화 간세포 PXB 생쥐 모형 (PhoenixBio에서 가용, Kakuni et al 2014 Int. J. Mol. Sci. 15:58-74 또한 참조)을 이용하여 생체내에서 계측될 수 있다. HBsAg 및/또는 HBeAg의 분비의 저해는 ELISA에 의해, 예를 들면, 제조업체의 사용설명서에 따라서 CLIA ELISA 키트 (Autobio Diagnostic)를 이용함으로써 계측될 수 있다. 세포내 cccDNA 또는 HBV mRNA 및 pgRNA의 감소는, 예를 들면 재료와 방법 섹션에서 기술된 바와 같이 qPCR에 의해 계측될 수 있다. 검사 화합물이 HBV 감염을 저해하는 지를 평가하기 위한 추가 방법은 예를 들면 WO 2015/173208에서 기술된 바와 같이 qPCR에 의해, 또는 노던 블롯; 원지 혼성화, 또는 면역형광을 이용하여 HBV DNA의 분비를 계측한다.
RTEL1 수준의 감소로 인해, 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물은 HBV 감염의 발달을 저해하거나 또는 이것의 치료에서 이용될 수 있다. 특히, cccDNA의 불안정화 및 감소로 인해, 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물은 단순히 HBsAg의 분비를 감소시키는 화합물과 비교하여 만성 HBV 감염의 발달을 더욱 효율적으로 저해하거나 또는 이것을 더욱 효율적으로 치료한다.
따라서, 본원 발명의 한 가지 양상은 HBV 감염된 개체에서 cccDNA 및/또는 pgRNA를 감소시키기 위한 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물의 용도에 관련된다.
본원 발명의 추가 양상은 만성 HBV 감염의 발달을 저해하거나 또는 이것을 치료하기 위한 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물의 용도에 관계한다.
본원 발명의 추가 양상은 HBV 감염된 개인의 전염력을 감소시키기 위한 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물의 용도에 관계한다. 본원 발명의 특정한 양상에서, 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물은 만성 HBV 감염의 발달을 저해한다.
본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물로 치료되는 (또는 본원 발명의 안티센스 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물을 예방적으로 제공받는) 개체는 바람직하게는 인간, 더욱 바람직하게는 HBsAg 양성 및/또는 HBeAg 양성인 인간 환자, 이보다 더욱 바람직하게는 HBsAg 양성 및 HBeAg 양성인 인간 환자이다.
따라서, 본원 발명은 HBV 감염을 치료하는 방법에 관계하는데, 여기서 상기 방법은 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물의 효과량을 투여하는 단계를 포함한다. 본원 발명은 만성 HBV 감염에 의해 유발된 간경화증 및 간세포 암종을 예방하는 방법에 더욱 관계한다.
본원 발명은 또한, 약제, 특히 HBV 감염 또는 만성 HBV 감염의 치료 또는 HBV 감염된 개체의 전염력의 감소에서 이용을 위한 약제의 제조를 위한 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물의 용도를 제공한다. 바람직한 구체예에서 약제는 피하 투여용 약형으로 제조된다.
본원 발명은 또한, 정맥내 투여용 약형인 약제의 제조를 위한 본원 발명의 올리고뉴클레오티드, 접합 화합물, 제약학적 조성물의 용도를 제공한다.
본원 발명의 올리고뉴클레오티드, 접합체 또는 제약학적 조성물은 병용 요법에서 이용될 수 있다. 예를 들면, 본원 발명의 올리고뉴클레오티드, 접합체 또는 제약학적 조성물은 다른 항-HBV 작용제, 예컨대 인터페론 알파-2b, 인터페론 알파-2a 및 인터페론 알파콘-1 (페길화된 및 페길화되지 않은), 리바비린, 라미부딘 (3TC), 엔테카비르, 테노포비르, 텔비부딘 (LdT), 아데포비르, 또는 다른 급부상하는 항-HBV 작용제, 예컨대 HBV RNA 복제 저해제, HBsAg 분비 저해제, HBV 캡시드 저해제, 안티센스 소중합체 (예를 들면, WO2012/145697, WO 2014/179629 및 WO2017/216390에서 기술된 바와 같이), siRNA (예를 들면, WO 2005/014806, WO 2012/024170, WO 2012/2055362, WO 2013/003520, WO 2013/159109, WO 2017/027350 및 WO2017/015175에서 기술됨), HBV 치료용 백신, HBV 예방용 백신, HBV 항체 요법 (단일클론 또는 다중클론), 또는 HBV의 치료 및/또는 예방을 위한 TLR 2, 3, 7, 8 또는 9 효현제와 병용될 수 있다.
발명의 구체예
본원 발명의 하기 구체예는 본원에서 설명된 임의의 다른 구체예와 조합으로 이용될 수 있다.
1. B형 간염 바이러스 (HBV) 감염의 치료 및/또는 예방에서 이용을 위한 RTEL1 저해제.
2. 구체예 1의 이용을 위한 RTEL1 저해제, 여기서 RTEL1 저해제는 효과량으로 투여된다.
3. 구체예 1 또는 2의 이용을 위한 RTEL1 저해제, 여기서 HBV 감염은 만성 감염이다.
4. 구체예 1 내지 3의 이용을 위한 RTEL1 저해제, 여기서 RTEL1 저해제는 감염된 세포에서 cccDNA 및/또는 pgRNA를 감소시킬 수 있다.
5. 구체예 1 내지 4 중에서 한 가지의 이용을 위한 RTEL1 저해제, 여기서 RTEL1 저해제는 DNA, 예컨대 cccDNA에 RTEL1의 결합을 예방하거나 또는 감소시킨다.
6. 구체예 5의 이용을 위한 RTEL1 저해제, 여기서 상기 저해제는 RTEL1 단백질에 특이적으로 결합하는 소형 분자이고, 여기서 상기 저해제는 cccDNA에 RTEL1 단백질의 결합을 예방하거나 또는 감소시킨다.
7. 구체예 1 내지 5 중에서 한 가지의 이용을 위한 RTEL1 저해제, 여기서 상기 저해제는 포유류 RTEL1 표적 핵산에 적어도 90% 상보적인, 길이에서 적어도 10개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하거나 또는 이것으로 구성되는, 길이에서 12-60개 뉴클레오티드의 올리고뉴클레오티드이다.
8. 구체예 7의 이용을 위한 RTEL1 저해제, 이것은 RTEL1 표적 핵산의 수준을 감소시킬 수 있다.
9. 구체예 7 또는 8의 이용을 위한 RTEL1 저해제, 여기서 표적 핵산은 RNA이다.
10. 구체예 9의 이용을 위한 RTEL1 저해제, 여기서 RNA는 프리-mRNA이다.
11. 구체예 7 내지 10 중에서 한 가지의 이용을 위한 RTEL1 저해제, 여기서 올리고뉴클레오티드는 안티센스 올리고뉴클레오티드, siRNA 또는 shRNA에서 선택된다.
12. 구체예 11의 이용을 위한 RTEL1 저해제, 여기서 올리고뉴클레오티드는 단일 가닥 안티센스 올리고뉴클레오티드 또는 이중 가닥 siRNA이다.
13. 구체예 7 내지 12 중에서 한 가지의 이용을 위한 RTEL1 저해제, 여기서 포유류 RTEL1 표적 핵산은 서열 번호: 1 또는 2에서 선택된다.
14. 구체예 7 내지 12 중에서 한 가지의 이용을 위한 RTEL1 저해제, 여기서 올리고뉴클레오티드의 연속 뉴클레오티드 서열은 서열 번호: 1 및 서열 번호: 2의 표적 핵산에 적어도 98% 상보적이다.
15. 구체예 1 내지 14 중에서 한 가지의 이용을 위한 RTEL1 저해제, 여기서 HBV 감염된 세포에서 cccDNA는 대조와 비교할 때 적어도 50%, 예컨대 60%, 예컨대 70%, 예컨대 80%, 예컨대 90%, 예컨대 95%, 예컨대 100% 감소된다.
16. 구체예 7 내지 15 중에서 한 가지의 이용을 위한 올리고뉴클레오티드, 여기서 RTEL1 mRNA는 대조와 비교할 때 적어도 50%, 예컨대 60%, 예컨대 70%, 예컨대 80%, 예컨대 90%, 예컨대 95%, 예컨대 100% 감소된다.
17. 길이에서 12 내지 30개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하거나 또는 이것으로 구성되는 길이에서 12 내지 60개 뉴클레오티드의 올리고뉴클레오티드, 여기서 상기 연속 뉴클레오티드 서열은 포유류 RTEL1 표적 핵산에 적어도 90% 상보적, 예컨대 95%, 예컨대 98%, 예컨대 완전히 상보적이다.
18. 구체예 17의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 화학적으로 생산된다.
19. 구체예 17 또는 18의 올리고뉴클레오티드, 여기서 포유류 RTEL1 표적 핵산은 서열 번호: 1 또는 2에서 선택된다.
20. 구체예 17 또는 18의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 서열 번호: 1 및 서열 번호: 2의 표적 핵산에 적어도 98% 상보적이다.
21. 구체예 17 내지 20 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 길이에서 12 내지 30개 뉴클레오티드이다.
22. 구체예 17 내지 21 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 RNAi 분자, 예컨대 이중 가닥 siRNA 또는 shRNA이다.
23. 구체예 17 내지 21 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 단일 가닥 안티센스 올리고뉴클레오티드이다.
24. 구체예 17 내지 23 중에서 한 가지의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 서열 번호: 3 내지 21 (표 4)에서 선택되는 표적 서열에 상보적이다.
25. 구체예 17 내지 24의 올리고뉴클레오티드, 이것은 -15 kcal 미만의 △G°로 서열 번호: 1 및 서열 번호: 2의 표적 핵산에 혼성화할 수 있다.
26. 구체예 17 내지 25 중에서 한 가지의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 적어도 14개의 연속 뉴클레오티드, 특히 15, 16, 17, 18, 19, 20, 21 또는 22개의 연속 뉴클레오티드를 포함하거나 또는 이들로 구성된다.
27. 구체예 17 내지 25 중에서 한 가지의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 14 내지 22개의 뉴클레오티드를 포함하거나 또는 이들로 구성된다.
28. 구체예 27의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 16 내지 20개의 뉴클레오티드를 포함하거나 또는 이들로 구성된다.
29. 구체예 17 내지 28 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 길이에서 14 내지 25개의 뉴클레오티드를 포함하거나 또는 이들로 구성된다.
30. 구체예 29의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 길이에서 16 내지 22개의 뉴클레오티드를 포함하거나 또는 이들로 구성된다.
31. 구체예 17 내지 30 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 서열 번호: 22-237에서 선택되는 서열을 포함한다.
32. 구체예 17 내지 31 중에서 한 가지의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 자신이 상보적인 표적 핵산과 비교하여 제로 내지 3개의 부정합을 갖는다.
33. 구체예 32의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 표적 핵산과 비교하여 하나의 부정합을 갖는다.
34. 구체예 32의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 표적 핵산과 비교하여 2개의 부정합을 갖는다.
35. 구체예 32의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 양쪽 표적 핵산 서열에 완전히 상보적이다.
36. 하나 또는 그 이상의 변형된 뉴클레오시드를 포함하는, 구체예 17 내지 35의 올리고뉴클레오티드.
37. 구체예 36의 올리고뉴클레오티드, 여기서 하나 또는 그 이상의 변형된 뉴클레오시드는 높은 친화성 변형된 뉴클레오시드이다.
38. 구체예 36 또는 37의 올리고뉴클레오티드, 여기서 하나 또는 그 이상의 변형된 뉴클레오시드는 2' 당 변형된 뉴클레오시드이다.
39. 구체예 38의 올리고뉴클레오티드, 여기서 하나 또는 그 이상의 2' 당 변형된 뉴클레오시드는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA, 2'-아미노-DNA, 2'-플루오로-DNA, 2'-플루오로-ANA 및 LNA 뉴클레오시드로 구성된 군에서 독립적으로 선택된다.
40. 구체예 36-39의 올리고뉴클레오티드, 여기서 하나 또는 그 이상의 변형된 뉴클레오시드는 LNA 뉴클레오시드이다.
41. 구체예 40의 올리고뉴클레오티드, 여기서 변형된 LNA 뉴클레오시드는 옥시-LNA, 아미노-LNA, 티오-LNA, cET 및 ENA에서 선택된다.
42. 구체예 40 또는 41의 올리고뉴클레오티드, 여기서 변형된 LNA 뉴클레오시드는 다음의 2'-4' 브리지 -O-CH2-를 갖는 옥시-LNA이다.
43. 구체예 42의 올리고뉴클레오티드, 여기서 옥시-LNA는 베타-D-옥시-LNA이다.
44. 구체예 40 또는 41의 올리고뉴클레오티드, 여기서 변형된 LNA 뉴클레오시드는 다음의 2'-4' 브리지 -O-CH(CH3)-을 갖는 cET이다.
45. 구체예 44의 올리고뉴클레오티드, 여기서 cET는 (S)cET, 다시 말하면, 6'(S)메틸-베타-D-옥시-LNA이다.
46. 구체예 40 또는 41의 올리고뉴클레오티드, 여기서 LNA는 다음의 2' - 4' 브리지 -O-CH2-CH2-를 갖는 ENA이다.
47. 구체예 17 내지 46 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 적어도 하나의 변형된 뉴클레오시드간 연쇄를 포함한다.
48. 구체예 47의 올리고뉴클레오티드, 여기서 변형된 뉴클레오시드간 연쇄는 뉴클레아제 내성이다.
49. 구체예 47 또는 48의 올리고뉴클레오티드, 여기서 변형된 뉴클레오시드간 연쇄는 포스포로티오에이트 뉴클레오시드간 연쇄이다.
50. 구체예 17 내지 49 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 RNase H를 모집할 수 있는 안티센스 올리고뉴클레오티드이다.
51. 구체예 50의 안티센스 올리고뉴클레오티드, 여기서 상기 안티센스 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열은 갭머이다.
52. 구체예 51의 안티센스 올리고뉴클레오티드, 여기서 상기 안티센스 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 화학식 5'-F-G-F'-3'의 갭머로 구성되거나 또는 이것을 포함하고, 여기서 영역 F 및 F'는 1-4개의 2' 당 변형된 뉴클레오시드를 독립적으로 포함하거나 또는 이들로 구성되고, 그리고 G는 RNaseH를 모집할 수 있는 6 내지 18개 뉴클레오시드의 영역이다.
53. 구체예 52의 안티센스 올리고뉴클레오티드, 여기서 2' 당 변형된 뉴클레오시드는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA, 2'-아미노-DNA, 2'-플루오로-DNA, 아라비노 핵산 (ANA), 2'-플루오로-ANA 및 LNA 뉴클레오시드로 구성된 군에서 독립적으로 선택된다.
54. 구체예 52 또는 53의 안티센스 올리고뉴클레오티드, 여기서 영역 F 및 F'에서 2' 당 변형된 뉴클레오시드 중에서 하나 또는 그 이상은 LNA 뉴클레오시드이다.
55. 구체예 54의 안티센스 올리고뉴클레오티드, 여기서 영역 F 및 F'에서 모든 2' 당 변형된 뉴클레오시드는 LNA 뉴클레오시드이다.
56. 구체예 53 내지 55의 올리고뉴클레오티드, 여기서 LNA 뉴클레오시드는 베타-D-옥시-LNA, 알파-L-옥시-LNA, 베타-D-아미노-LNA, 알파-L-아미노-LNA, 베타-D-티오-LNA, 알파-L-티오-LNA, (S)cET, (R)cET 베타-D-ENA 및 알파-L-ENA에서 선택된다.
57. 구체예 53 내지 56의 안티센스 올리고뉴클레오티드, 여기서 영역 F 및 F'는 동일한 LNA 뉴클레오시드로 구성된다.
58. 구체예 53 내지 57의 안티센스 올리고뉴클레오티드, 여기서 영역 F 및 F'에서 모든 2' 당 변형된 뉴클레오시드는 옥시-LNA 뉴클레오시드이다.
59. 구체예 52 내지 58 중에서 한 가지의 안티센스 올리고뉴클레오티드, 여기서 영역 G에서 뉴클레오시드는 DNA 및/또는 알파-L-LNA 뉴클레오시드이다.
60. 구체예 59의 안티센스 올리고뉴클레오티드, 여기서 영역 G는 적어도 75% DNA 뉴클레오시드로 구성된다.
61. 구체예 60의 안티센스 올리고뉴클레오티드, 여기서 영역 G에서 모든 뉴클레오시드는 DNA 뉴클레오시드이다.
62. 구체예 17 내지 62 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 CMP 식별 번호: 22_1; 23_1; 24_1; 25_1; 26_1; 27_1; 28_1; 29_1; 30_1; 31_1; 32_1; 33_1; 34_1; 35_1; 36_1; 37_1; 38_1; 39_1; 40_1; 41_1; 42_1; 42_2; 42_3; 43_1; 43_2; 44_1; 45_1; 46_1; 49_1; 130_1; 109_1; 83_1; 203_1 및 232_1, 또는 이들의 제약학적으로 허용되는 염에서 선택된다.
63. 구체예 17 내지 50 중에서 한 가지에 따른 올리고뉴클레오티드 또는 구체예 51 내지 62 중에서 한 가지에 따른 안티센스 올리고뉴클레오티드, 그리고 상기 안티센스 올리고뉴클레오티드에 공유 부착된 적어도 하나의 접합 모이어티를 포함하는 접합 화합물.
64. 구체예 63의 접합 화합물, 여기서 올리고뉴클레오티드는 이중 가닥 siRNA이고, 그리고 접합 모이어티는 상기 siRNA의 센스 가닥에 공유 부착된다.
65. 구체예 63 또는 64의 접합 화합물, 여기서 접합 모이어티는 탄수화물, 세포 표면 수용체 리간드, 원료의약품, 호르몬, 친유성 물질, 중합체, 단백질, 펩티드, 독소, 비타민, 바이러스 단백질 또는 이들의 조합에서 선택된다.
66. 구체예 63 내지 65 중에서 한 가지의 접합 화합물, 여기서 접합 모이어티는 아시알로당단백질 수용체에 결합할 수 있다.
67. 구체예 66의 접합 화합물, 여기서 접합 모이어티는 갈락토오스, 갈락토사민, N-포르밀-갈락토사민, N-아세틸갈락토사민, N-프로피오닐-갈락토사민, N-n-부타노일-갈락토사민 및 N-이소부타노일갈락토사민으로 구성되는 군에서 선택되는 적어도 하나의 아시알로당단백질 수용체 표적화 모이어티를 포함한다.
68. 구체예 67의 접합 화합물, 여기서 아시알로당단백질 수용체 표적화 모이어티는 N-아세틸갈락토사민 (GalNAc)이다.
69. 구체예 67 또는 68의 접합 화합물, 여기서 접합 모이어티는 아시알로당단백질 수용체 표적화 모이어티에 대하여 일가, 이가, 삼가 또는 사가이다.
70. 구체예 69의 접합 화합물, 여기서 접합 모이어티는 2 내지 4개의 말단 GalNAc 모이어티, 그리고 각 GalNAc 모이어티를, 안티센스 화합물에 접합될 수 있는 가지치기 분자에 연결하는 스페이서로 구성된다.
71. 구체예 70의 접합 화합물, 여기서 스페이서는 PEG 스페이서이다.
72. 구체예 66 내지 71의 접합 화합물, 여기서 접합 모이어티는 삼가 N-아세틸갈락토사민 (GalNAc) 모이어티이다.
73. 구체예 66 내지 72의 접합 화합물, 여기서 접합 모이어티는 도 1에서 삼가 GalNAc 모이어티 중 한 가지에서 선택된다.
74. 구체예 73의 접합 화합물, 여기서 접합 모이어티는 도 1d에서 삼가 GalNAc 모이어티이다.
75. 올리고뉴클레오티드 또는 안티센스 올리고뉴클레오티드 및 접합 모이어티 사이에 위치하는 링커를 포함하는, 구체예 63-74의 접합 화합물.
76. 구체예 75의 접합 화합물, 여기서 링커는 생리학적으로 불안정 링커이다.
77. 구체예 76의 접합 화합물, 여기서 생리학적으로 불안정 링커는 뉴클레아제 민감성 링커이다.
78. 구체예 76 또는 77의 올리고뉴클레오티드 접합체, 여기서 생리학적으로 불안정 링커는 2 내지 5개의 연속 포스포디에스테르 연쇄로 구성된다.
79. 구체예 66-78의 접합 화합물, 이것은 접합되지 않은 올리고뉴클레오티드 또는 안티센스 올리고뉴클레오티드와 비교하여, 간 대 신장 사이에 향상된 세포 분포, 또는 접합 화합물의 간 내로 향상된 세포 흡수를 전시한다.
80. 구체예 17 내지 50 중에서 한 가지에 따른 올리고뉴클레오티드 또는 구체예 51 내지 61 중에서 한 가지에 따른 안티센스 올리고뉴클레오티드, 구체예 63 내지 79의 접합 화합물, 또는 이들의 허용가능 염, 그리고 제약학적으로 허용되는 희석제, 운반체, 염 및/또는 보조제를 포함하는 제약학적 조성물.
81. 하기 단계를 포함하는, B형 간염 바이러스 (HBV) 감염을 예방하고, 개선하고 및/또는 저해하는 화합물을 확인하기 위한 방법:
a. 검사 화합물을
i. RTEL1 폴리펩티드; 또는
ii. RTEL1을 발현하는 세포와 접촉시키는 단계;
b. 상기 검사 화합물의 존재와 부재에서 RTEL1의 발현 및/또는 활성을 계측하는 단계; 그리고
c. RTEL1의 발현 및/또는 활성을 감소시키고 cccDNA를 감소시키는 화합물을 확인하는 단계.
82. RTEL1을 발현하는 표적 세포에서 RTEL1 발현을 조절하기 위한 생체내 또는 시험관내 방법, 여기서 상기 방법은 구체예 17 내지 50 중에서 한 가지의 올리고뉴클레오티드 또는 구체예 51 내지 61 중에서 한 가지에 따른 안티센스 올리고뉴클레오티드, 구체예 63 내지 79의 접합 화합물 또는 구체예 80의 제약학적 조성물을 효과량으로 상기 세포에 투여하는 단계를 포함한다.
83. 구체예 82의 방법, 여기서 RTEL1 발현은 어떤 치료도 없거나 또는 대조로 치료될 때 수준과 비교하여, 표적 세포에서 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80%, 또는 적어도 90%, 또는 적어도 95% 감소된다.
84. 구체예 82의 방법, 여기서 표적 세포는 HBV로 감염되고, 그리고 HBV 감염된 세포에서 cccDNA는 어떤 치료도 없거나 또는 대조로 치료될 때 수준과 비교하여, HBV 감염된 표적 세포에서 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80%, 또는 적어도 90%, 또는 적어도 95% 감소된다.
85. 질환을 치료하거나 예방하기 위한 방법, 여기서 상기 방법은 구체예 17 내지 50 중에서 한 가지의 올리고뉴클레오티드 또는 구체예 51 내지 61 중에서 한 가지에 따른 안티센스 올리고뉴클레오티드, 구체예 63 내지 79의 접합 화합물 또는 구체예 80의 제약학적 조성물의 치료 또는 예방 효과량을 상기 질환을 앓거나 또는 이것에 취약한 개체에게 투여하는 단계를 포함한다.
86. 개체에서 질환의 치료 또는 예방을 위한 약제로서 이용을 위한, 구체예 17 내지 50 중에서 한 가지의 올리고뉴클레오티드 또는 구체예 51 내지 61 중에서 한 가지에 따른 안티센스 올리고뉴클레오티드, 또는 구체예 63 내지 79 중에서 한 가지의 접합 화합물 또는 구체예 80의 제약학적 조성물.
87. 개체에서 질환의 치료 또는 예방을 위한 약제의 제조를 위한, 구체예 17 내지 50 중에서 한 가지의 올리고뉴클레오티드 또는 구체예 51 내지 61 중에서 한 가지에 따른 안티센스 올리고뉴클레오티드, 또는 구체예 63 내지 79 중에서 한 가지의 접합 화합물의 용도.
88. 구체예 85 - 87의 방법, 올리고뉴클레오티드, 안티센스 올리고뉴클레오티드, 접합체 또는 용도, 여기서 개체는 포유동물이다.
89. 구체예 88의 방법, 올리고뉴클레오티드, 안티센스 올리고뉴클레오티드, 접합체, 또는 용도, 여기서 포유동물은 인간이다.
본원 발명은 이제, 하기 실시예에 의해 예증될 것인데, 이들은 제한의 성격을 갖지 않는다.
실시예
재료와 방법
올리고뉴클레오티드 모티프 서열 및 올리고뉴클레오티드 화합물
표 6: 올리고뉴클레오티드 모티프 서열 (서열 번호로 표시됨), 이들의 설계, 그리고 모티프 서열에 기초하여 설계된 특정 올리고뉴클레오티드 화합물 (CMP 식별 번호로 표시됨)의 목록.
모티프 서열은 올리고뉴클레오티드 내에 존재하는 핵염기의 연속 서열을 나타낸다.
설계는 갭머 설계, F-G-F'를 지칭하는데, 여기서 각 숫자는 연속 변형된 뉴클레오시드, 예를 들면 2' 변형된 뉴클레오시드의 숫자 (첫 번째 숫자=5' 측부), 그 이후에 DNA 뉴클레오시드의 숫자 (두 번째 숫자= 갭 영역), 그 이후에 변형된 뉴클레오시드, 예를 들면 2' 변형된 뉴클레오시드의 숫자 (세 번째 숫자=3' 측부)을 나타내고, 임의적으로 표적 핵산에 상보적인 연속 서열의 반드시 일부인 것은 아닌 DNA와 LNA의 추가 반복된 영역이 선행하거나 또는 후행한다.
올리고뉴클레오티드 화합물은 모티프 서열의 특정 설계를 나타낸다. 대문자는 베타-D-옥시 LNA 뉴클레오시드를 나타내고, 소문자는 DNA 뉴클레오시드를 나타내고, 모든 LNA C는 5-메틸 시토신이고, 5-메틸 DNA 시토신은 "e"에 의해 표시되고, 그리고 모든 뉴클레오시드간 연쇄는 포스포로티오에이트 뉴클레오시드간 연쇄이다.
올리고뉴클레오티드 합성
올리고뉴클레오티드 합성은 일반적으로 당해 분야에 공지되어 있다. 다음은 적용될 수 있는 프로토콜이다. 본원 발명의 올리고뉴클레오티드는 이용된 장치, 지지체 및 농도의 면에서 약간씩 변화를 주는 방식으로 생산될 수 있다.
올리고뉴클레오티드는 1 μmol 규모로 Oligomaker 48 상에서 포스포라미디트 접근법을 이용하여 우리딘 범용 지지체 상에서 합성된다. 합성의 종결 시점에, 올리고뉴클레오티드는 60℃에서 5-16 시간 동안 액상 암모니아를 이용하여 고체 지지체로부터 개열된다. 올리고뉴클레오티드는 역상 HPLC (RP-HPLC)에 의해 또는 고체상 추출에 의해 정제되고 UPLC에 의해 특징화되며, 분자 질량은 ESI-MS에 의해 추가로 확증된다.
올리고뉴클레오티드의 신장:
β-시아노에틸-포스포라미디트 (DNA-A(Bz), DNA-G(ibu), DNA-C(Bz), DNA-T, LNA-5-메틸-C(Bz), LNA-A(Bz), LNA-G(dmf) 또는 LNA-T)의 연계는 아세토니트릴에서 0.1 M의 5'-O-DMT-보호된 아미디트 및 아세토니트릴에서 DCI (4,5-디시아노이미다졸) (0.25 M)의 용액을 활성화제로 이용하여 실시된다. 최종 주기 동안, 원하는 변형을 갖는 포스포라미디트, 예를 들면, 접합체 기를 부착하기 위한 C6 링커 또는 접합체 기 자체가 이용될 수 있다. 포스포티오에이트 연쇄의 도입을 위한 티올화는 크산탄 하이드라이드 (아세토니트릴/피리딘 9:1에서 0.01 M)를 이용하여 수행된다. 포스포디에스테르 연쇄는 THF/피리딘/물 7:2:1에서 0.02 M의 요오드를 이용하여 도입될 수 있다. 나머지 시약은 올리고뉴클레오티드 합성에 전형적으로 이용되는 것들이다.
고체상 합성 후 접합을 위해, 상업적으로 이용가능한 C6 아미노링커 포스포라미디트가 고체상 합성의 마지막 주기에서 이용될 수 있고, 그리고 고체 지지체로부터 탈보호 및 개열 후, 아미노연결되고 탈보호된 올리고뉴클레오티드가 단리된다. 접합체는 표준 합성 방법을 이용한 기능기의 활성화를 통해 도입된다.
RP-HPLC에 의한 정제:
미가공 화합물은 Phenomenex Jupiter C18 10μ 150x10 mm 칼럼 상에서 예비 RP-HPLC에 의해 정제된다. 0.1 M의 아세트산암모늄 pH 8 및 아세토니트릴이 5 mL/분의 유속에서 완충제로서 이용된다. 수집된 분획물은 동결 건조되어 정제된 화합물이 전형적으로 백색 고체로서 제공된다.
약어:
DCI:
4,5-디시아노이미다졸
DCM:
디클로로메탄
DMF:
디메틸포름아미드
DMT:
4,4'-디메톡시트리틸
THF:
테트라히드로푸란
Bz:
벤조일
Ibu:
이소부티릴
RP-HPLC:
역상 고성능 액체 크로마토그래피
T
m
검정:
올리고뉴클레오티드 및 RNA 표적 (인산염 결합됨, PO) 이중나선은 500 ml의 RNase-없는 물에서 3 mM로 희석되고 500 ml 2x Tm-완충액 (200 mM NaCl, 0.2 mM EDTA, 20 mM 나트륨 포스페이트, pH 7.0)과 혼합된다. 상기 용액을 3분 동안 95℃로 가열한 다음, 실온에서 30분 동안 어닐링 (annealing)한다. 이중나선 용융 온도 (Tm)는 PE Templab 소프트웨어 (Perkin Elmer)를 이용하여 Peltier 온도 프로그래머 PTP6이 장착된 Lambda 40 UV/VIS 분광광도계 상에서 계측된다. 온도를 20℃에서 95℃로 상승시킨 다음, 25℃로 낮춘 후 260 nm에서 흡광도를 기록한다. 용융 및 어닐링 둘 모두의 1차 도함수 및 국소 최대값을 이용하여 이중나선 Tm을 평가한다.
클론 성장 배지 (dHCGM). dHCGM은 100 U/ml 페니실린, 100 μg/ml 스트렙토마이신, 20 mM Hepes, 44 mM NaCO3, 15 μg/ml L-프롤린, 0.25 μg/ml 인슐린, 50 nM 덱사메타존, 5 ng/ml EGF, 0.1 mM Asc-2P, 2% DMSO 및 10% FBS를 내포하는 DMEM 배지이다 (Ishida et al., 2015). 세포는 5% CO2를 포함하는 가습된 대기에서 37℃ 인큐베이터에서 배양되었다. 배양 배지는 도말후 24 시에, 그리고 수확 때까지 2 일마다 교체되었다.
일차 인간 간세포 (PXB-PHH)
인간화 생쥐 (uPA/SCID 생쥐) - 본원에서 PHH로 불림 -로부터 수확된 신선한 일차 인간 간세포 (PXB-PHH)가 PhoenixBio Co., Ltd (Japan)로부터 획득되었다. 세포는 변형된 간세포 클론 성장 배지 (dHCGM)에서 하기의 세포 밀도: 35,000개 세포/웰 (384-웰), 70,000개 세포/웰 (96 웰), 또는 400,000개 세포/웰 (24-웰)로 콜라겐 I-코팅된 평판에 파종되었다. dHCGM은 100 U/ml 페니실린, 100 μg/ml 스트렙토마이신, 20 mM Hepes, 44 mM NaCO3, 15 μg/ml L-프롤린, 0.25 μg/ml 인슐린, 50 nM 덱사메타존, 5 ng/ml EGF, 0.1 mM Asc-2P, 2% DMSO 및 10% FBS를 내포하는 DMEM 배지이다 (Ishida et al., 2015). 세포는 5% CO2를 포함하는 가습된 대기에서 37℃ 인큐베이터에서 배양되었다. 배양 배지는 도말후 24 시에, 그리고 수확 때까지 2 일마다 교체되었다.
HBV 감염 및 올리고뉴클레오티드 처리
PHH는 24 시간 동안 4% PEG와 함께 40의 감염 다중도 (MOI)에서 HBV (CHB 개체로부터 정제됨)와 함께 배양되었다; 바이러스 접종물은 다음 날 제거되었다. cccDNA 확립을 허용하기 위해, PHH에서 화합물 처리가 HBV 감염후 3 일자에 시작되었다. 배지에 용해된 신선한 올리고뉴클레오티드가 2 일마다 보충되거나 (실시예 1), 또는 신선한 올리고뉴클레오티드가 3, 5, 7 및 9 일자에 보충되고, 그 후 세포가 19 일자에서 수확될 때까지 배지가 2 일마다 보충되었다 (실시예 2).
HBV 항원 계측
HBV 항원 발현과 분비에 대한 영향을 평가하기 위해, 상층액이 19 일자에 수집되었다. HBV 증식 파라미터, HBsAg 및 HBeAg 수준이 제조업체의 프로토콜에 따라서, CLIA ELISA 키트 (Autobio Diagnostic #CL0310-2, #CL0312-2)를 이용하여 계측되었다. 간단히 말하면, 웰마다 25μL의 상층액이 개별 항체 코팅된 마이크로역가 평판으로 이전되었고, 그리고 25 μL의 효소 접합체 시약이 첨가되었다. 웰이 자동 세정기를 이용하여 세척 완충액으로 5회 세척되기 전, 평판이 실온에서 셰이커에서 60 분 동안 배양되었다. 25 μL의 기질 A 및 B가 각 웰에 첨가되었다. Envision 발광 판독기 (Perkin Elmer)를 이용하여 발광이 계측되기 전, 평판이 실온에서 10 분 동안 셰이커에서 배양되었다.
CCK8 세포 독성 계측
올리고뉴클레오티드의 처리 시에 세포 독성의 영향을 평가하기 위해, 세포는 HBV 감염 및 올리고뉴클레오티드 처리에서 기술된 바와 같이 처리되었고, 그리고 18 일자에, PHH는 5% CO2를 포함하는 가습된 대기에서 37 ℃ 인큐베이터에서 24 시간 동안 전배양되었다. 10ul의 CCK-8 용액이 96 웰 평판의 각 웰에서 100ul까지 첨가되고 1-4 시간 동안 배양되었다. 마이크로평판 판독기 (Tecan)를 이용한 450nM에서 흡광도가 각 평판에 대해 계측되었고, 그리고 값이 대조 (처리되지 않은 세포)의 %로서 계산된다.
세포내 HBV pgRNA 및 RTEL1 RNA에 대한 실시간 PCR
제조업체의 프로토콜에 따라서, Qiagen BioRobot Universal System 및 RNeasy 96 웰 추출 평판 (RNeasy 96 BioRobot 8000 키트 (12)/ 카탈로그 번호/ID: 967152)을 이용하여, mRNA가 세포로부터 추출되었다. 상대적인 HBV 및 세포 mRNA 발현 수준이 ABI QuantStudio 12k Flex 상에서 실시간 PCR을 이용하여 분석되었다.
기술적으로 삼중으로 수행된 TaqMan Fast Advanced 마스터 믹스 (Life Technologies, 카탈로그 번호 4444558)를 이용한 qPCR에 의해, 베타-액틴 (ACT B) 및 HBV pgRNA가 정량되었다. 결과는 인간 ACT B 내인성 대조에 비하여 정규화되었다. 참조 유전자 ACT B 및 비-형질감염된 세포에 대해 정규화된 비교 주기 역치 2-△△Ct 방법을 이용하여 mRNA 발현이 분석되었다. ACTB RNA 및 HBV pgRNA 정량에 이용된 프라이머는 표 7에서 열거된다.
표 7: ACT B 및 HBV pgRNA qPCR 프라이머
HBV cccDNA 정량
DNA가 SDS 용해 완충액을 이용하여 HBV 감염된 일차 인간 간세포로부터 추출되고, 그리고 ZymoResearch 유전체 DNA 클린 & 농축기 키트 (ZymoResearch, 카탈로그 번호 D4067) 프로토콜을 이용하여 정제되었다. 20ul 총 용적에서 37 ℃에서 1 시간 동안, 500ng의 DNA에 대해 10U의 T5를 이용한 T5 엑소뉴클레아제 (New England Biolabs, MA, USA)로 절단 후, cccDNA 수준이 결정되었다. 절단 후, 표본이 50ul로 희석되었고, 이 중에서 4ul가 qPCR 반응에 이용되었다. 참조 유전자 미토콘드리아 DNA 및 비-형질감염된 세포에 대해 정규화된 비교 주기 역치 2-△△Ct 방법을 이용하여 mRNA 발현이 분석되었다. 정량적 실시간 중합효소 연쇄 반응 계측이 QuantStudio 12K Flex PCR 시스템 (Applied Biosystems)에서 수행되었다. qPCR이 Fast SYBR™ Green 마스터 믹스 (Life Technologies, 카탈로그 번호 4385612)로 수행되었다. 프라이머는 표 8에서 도시된다.
표 8: cccDNA qPCR 프라이머.
실시예 1: HBV 감염된 PHH에서 HBV 파라미터에 대한 RTEL1을 표적으로 하는 안티센스 올리고뉴클레오티드의 효과
하기 실험에서, HBV 파라미터, HBsAg, HBeAg, HBV pgRNA 및 cccDNA에 대한 RTEL1 녹다운의 효과가 표 6에서 올리고뉴클레오티드 화합물을 이용하여 검사되었다.
PHH가 재료와 방법 섹션에서 기술된 바와 같이 배양되었다. 이들 세포는 100 μl/웰의 최종 배양 용적으로 HBV 감염후 3 일자에 dHCGM 배지에서 용해된 10μM의 최종 올리고뉴클레오티드 농도로 투약되었다. 실험은 생물학적으로 삼중으로 수행되었고, 그리고 올리고뉴클레오티드를 2 일마다 보충하면서, 세포가 HBV 감염후 19 일자에 수확되었다. 재료와 방법에 따라서, 세포 독성이 CCK8을 이용하여 결정되었고, 상층액이 HBsAg 및 HBeAg를 계측하기 위해 수집되었고, 그리고 세포가 2가지 분획물; 한 가지 용해 완충액을 이용한 RTEL1 mRNA 및 pgRNA 계측을 위한 분획물 및 재료와 방법에서 기술된 바와 같은 다른 용해 완충액을 이용한 cccDNA 계측을 위한 분획물에서 수확되었다. 모든 값은 표 9에서 대조 (처리되지 않은 세포)의 %로서 도시된다, 다시 말하면, RTEL1 mRNA, cccDNA 및 pgRNA의 경우에 값이 더욱 작을수록 저해가 더욱 크다.
바이러스 파라미터에서 임의의 감소가 세포 사멸의 원인이 아니고, 값이 100%에 더욱 가까울수록 독성이 더욱 낮다는 것을 확증하기 위해, CCK8 세포 독성이 재료와 방법 섹션에서 기술된 바와 같이 계측되었다. 결과는 표 9에 도시된다.
표 9: 하류 산물의 RTEL1 매개된 cccDNA 분해와 저해
*RTEL1 및 HBV pgRNA는 하우스키핑 유전자에 대해 정규화된다.
RTEL1을 표적으로 하는 모든 검사된 안티센스 올리고뉴클레오티드는 파라미터 cccDNA, pgRNA, HBsAg 및 HBeAg 중에서 적어도 한 가지에 대항하여 계측의 단일 시점에서 표적 녹다운 및 HBV 항바이러스 효능을 전시하며, CCK8에 의해 어떤 관찰된 세포 독성도 계측되지 않는다.
실시예 2: 감염된 PHH에서 cccDNA에 대한 효과에 대해 검사된, RTEL1을 표적으로 하는 추가 올리고뉴클레오티드 라이브러리
하기 실험에서 표 6에서 CMP 식별 번호: 50_1 내지 237_1로서 도시된, RTEL1 전사체의 전역을 표적으로 하는 236개 올리고뉴클레오티드의 추가 라이브러리가 산출되었다. RTEL1뿐만 아니라 cccDNA를 감소시키는 능력이 검사되었다.
PHH가 재료와 방법 섹션에서 기술된 바와 같이 배양되었다. 이들 세포는 100 μl/웰의 최종 배양 용적으로 HBV 감염후 3. 5. 7 및 9 일자에 dHCGM 배지에서 용해된 10μM의 최종 올리고뉴클레오티드 농도로 투약되었다. 실험은 생물학적으로 삼중으로 수행되었고, 그리고 배지를 19 일자 때까지 2 일마다 보충하면서, 세포가 HBV 감염후 19 일자에 수확되었다.
재료와 방법에 따라서, 세포가 2가지 분획물; 한 가지 용해 완충액을 이용한 RTEL1 mRNA 계측을 위한 분획물 및 재료와 방법에서 기술된 바와 같은 다른 용해 완충액을 이용한 cccDNA 계측을 위한 분획물에서 수확되었다. 모든 값은 표 10에서 대조 (처리되지 않은 세포)의 %로서 도시된다, 다시 말하면, RTEL1 mRNA 및 cccDNA의 경우에 값이 더욱 작을수록 저해/감소가 더욱 크다.
표 10: 올리고뉴클레오티드 처리 이후에 RTEL1 감소 및 cccDNA 분해
바이러스 파라미터에서 감소가 세포 사멸에 의해 유발될 수 있고, 값이 100%에 더욱 가까울수록 독성이 더욱 낮은 지를 사정하기 위해, CCK8 세포 독성이 재료와 방법 섹션에서 기술된 바와 같이 계측되었다. 결과는 표 11에서 도시된다. 대조의 80 %를 초과하는 CCK8 값의 경우에는 세포 사멸이 표 10에서 도시된 RTEL1과 cccDNA 감소에 영향을 줄 공산이 있는 것으로 고려되지 않는다.
표 11: CCK8 세포 독성
#NA (해당값 없음)는 CCK8가 지시된 화합물에 대해 계측되지 않았다는 것을 의미한다.
이들 결과는 라이브러리 내에 236개의 올리고뉴클레오티드 중 단지 5 %만 RTEL1 또는 cccDNA 중에서 적어도 어느 한 가지를 대조의 적어도 80%까지 감소시킬 수 없었다는 것을 증명한다. 이것으로부터, RTEL1 및/또는 cccDNA를 감소시킬 수 있는, 전체 RTEL1 전사체의 전역을 표적으로 하는 올리고뉴클레오티드를 생산하는 것이 가능하며, 비록 소수의 화합물의 경우에는 RTEL1 및 cccDNA에서 감소가 세포 사멸에 기인할 수 있지만, 일반적으로는 세포 사멸에 기인하지 않는 것으로 보여질 수 있다.
SEQUENCE LISTING
<110> F. Hoffmann-La Roche AG
<120> OLIGONUCLEOTIDES FOR MODULATING RTEL1 EXPRESSION
<130> P34869-WO
<160> 246
<170> PatentIn version 3.5
<210> 1
<211> 38444
<212> DNA
<213> hsapiens
<400> 1
agtcagccct gctgccagcc agtgccgggt gctggggact cagggaggcc cgccgggacc 60
actgcgggac agtgagccga gcagaagctg gaacgcagga gaggaaggag agggggcggt 120
cagggctctc aggagccggg tcctgggcaa ggcgcagccg ttttcaaatt ttcaggaaag 180
cggtcggctc acactcgagc agtaaaaaga tgcctctggg gaggaggccc gtgcagctct 240
ccgggcaatg gtggtggctc ggcctagaga ggcggtagtg gaacgcagac cctggtgggg 300
gaatgacatc aagggaggag acgggcggga ccccagattt ctgcctgtgg gcgatggaag 360
tgaggttcac tggccagcgg agccggacac agaacgcgca aaacgccgtg taggcctgga 420
ggagccgaag agcaggcgga ccccctccgc gggggaacag tttccgccgg gagcacaaag 480
caacggaccg gaagtggggg gcggaagtgc agtgggctca gcgccgactg cgcgcctctg 540
cccgcgaaaa ctctgagctg gctgacagct ggggacgggt ggcggccctc gactggagtc 600
ggttgagttc ctgagggacc ccggttctgg aaggttcgcc gcggagacaa gtgagcagtg 660
agtcgcagtg accctacaag tggttctttt acccgagcgg ctcgtaggcg cgttgcggtt 720
tttcgaaact acagctcccg gcaggcccca agccgccctc ggggccgcgg gtcggcggat 780
tggccgcgct gcattttggg acctgtagtt tcctgcgctc gtggcgctgg cgccgcggcg 840
ttggctgagc ccttgaccgg ggctggaggg aagggccgac attcagtgtg tccgcgtctg 900
ttctgttagt cccagttccc gggcgggatt gaggcttaga gaagttgagt gatttgctga 960
gggctgcacg ggttggcatc ccggcatgct ctttcgctac tttggctgca tctggttgcc 1020
cacccgggcg gatggggaat ggactccagc cagccaggag ggcagagggc tggagaggca 1080
gggccggagg ttcagaccct ccgctctgac gttgcgcctg gtgaggccgg gaggggtgcc 1140
gcttgcctct tcagccctca cgctcttgtg gaagtcgcgg aattactgca ggcggaactt 1200
gcagcactgt gggcgtcttt tccagagaag gacggagttg tggggcggga ggataaggca 1260
aggcccagcc acttcgcatc ttcgccccgc cagctcctcg agatgggata taccagggtt 1320
gctctccaac cctctccgca ggagggactg atggaaacgc ctgggaaagt agcccggtac 1380
ccacaaaggc tgtctacaaa cagagtctta ctgtctttcc caggtctgtg ccatagggat 1440
tctcgaagag aacagcgttg tgtcccagtg cacatgctcg catcgcttac caggagtgcc 1500
cgagacccta agatgttcgg agtggttttt tcgcacagac ccgaatagcc tgcccctcag 1560
ccacgctctg tgcccttctg agaacaggct gatatgccca agatagtcct gaatggtgtg 1620
accgtagact tccctttcca gccctacaaa tgccaacagg agtacatgac caaggtcctg 1680
gaatgtctgc agcaggtaga gcacaggccc cgaggaaagg actgcgggtg ggtggagctt 1740
cagccaggac ggggtgtgct tccctctccc ggcccattcc agccaggccc ctccgggcca 1800
gaggcagcgt ctgtcataaa aagggctggt gttccaggtg gggtcagaga gaggattgac 1860
aagtaaaaac gatcgtcctt tgaagggggc cggcccctcc acacctgtgg gtatttctca 1920
tcaggcggga cgagagactg agaaaatgaa taagacacag agacaaagta tagagagaaa 1980
agtgggccca ggggaccggc gctcagcata cagaggacct gcaccggcac cagtctctga 2040
gtttcctcag tattcattaa ttactatttt cactatctca gcaagaggaa tgcggcagga 2100
cagcaaggtg atagtgggga gaaggtcagc aagaaaacgt gagcaaagga atctgggtca 2160
caaataagtt caagggaagg tactatgcct ggatgtgcac gtaggctagt tttatgcttt 2220
tctccaccca aacatctcgg tggagtaaag agtaacagag cagcattgct gccaatatgt 2280
ctcgcctcct gccacagggc ggcttttctc ctatctcaga attgaacaaa tgtacaatcg 2340
ggttttatac cgaaacattc agttcccagg ggcaggcagg agacagtggc cttcctctat 2400
ctcgactgca agaggctttc ctcttttact aatcctcagc acagaccctt cacgggtgtt 2460
gggctggggg actgtcaggt ctttcccatc ccacgaggcc atatttcaga ctatcacatg 2520
gagagaaacc ttgggcaata cccggctttc cagggcagag gtccctgcgg ctttccgcag 2580
tgcatcgtgc ccctggttta tcgagactgg agaatggcga tgacttttac caagcatact 2640
gcctgtaaac atattgttaa caaggcacgt tctgcacagc tctagatccc ttaaaccttg 2700
attccataca acacatgttt ctgtgagctc aaggctgggg caaagttaca gattaacagc 2760
atcttagggc aaagcaattg ttcagggtac aggtcaaaat ggagtgtgtt atgtcttccc 2820
tttctacata gacacagtaa cagtctgatc tctcttttcc ctacagtcct tgagggtgac 2880
agacttagga gtgccttggg ggcctctctg aggagcagct gatattcacg ggtcaggagg 2940
aagcatttcc attagagggg cagccggtgg ccagcctcac ttggaaggtc tttgaacctc 3000
gggggtgcag ggaggtggca gtggtgcagg ttgccttctc ctgggttcct tgaggtgccc 3060
tcttgtaccc ggctcacacc cttcccctcc ccgagtttcc tgctcaggtt cccgtctgag 3120
agcttgtatg taggacgtca gataggacag cataaatgtt tggatccaga aacgcagaac 3180
agtttcctat tttgagactt gacacctaat tagtcatctt actatttaag ctgaaaaata 3240
gtgtcgtgtt ttgggtaacg ttctgcaaat cgtttgctaa tggcggctga gttgcttcac 3300
gccctttagg gcaagagtgg gacttgcctg tggacttctc cgcggtccca cagggctctc 3360
gccacctggc agtggcctct gcatctgcaa agagctgccc gctggctgcc gaagcttgtc 3420
tcagggcagc ttgtgtggcc tcgcctcttc ctggcttccc cgtaaccctt gctccgaact 3480
ccgttcagaa ggtgaatggc atcctggaga gccctacggg tacagggaag acgctgtgcc 3540
tgctgtgcac cacgctggcc tggcgagaac acctccgaga cggcatctct gcccgcaaga 3600
ttgccgagag ggcgcaagga gagcttttcc cggatcgggc cttgtcatcc tggggcaacg 3660
ctgctgctgc tgctggagac cccataggtg accctagttc ccaggcctct cctggcctcc 3720
tgtggggatg gttggcaagg gatggcgctg agggtggggt gggcccatgg ggactcctgc 3780
cgtctctcaa gcagaactca aggagaattt tttagctgct gtataatttc tcgccatcgt 3840
gggtgtaaac ctagggttgg gcttttttgc tgaattaggg cacggcagat gcccacttca 3900
cccatttttg ataaaccagt atctggggtg tcagattctt ggctgtctgc agggccgagt 3960
tagccgaatg ccacctgcct ttgatacgtg agaacgttgt ctgagaaccg tgacttctgt 4020
gcttgcttgt gtctggtcag cttgctacac ggacatccca aagattattt acgcctccag 4080
gacccactcg caactcacac aggtcatcaa cgagcttcgg aacacctcct accggtgggt 4140
cagacgagtt tacacctgtc tcggggtcct caagagaacc agcttggcat ggtgctgagt 4200
ccacagcccc atgctgtgct gtggtggagg gtggtggtct ttctagacgc tcccccgaag 4260
tgtgcagagc gctggtgccc aggggtgggg tgcggcctgg gctgcctcca atgcccatta 4320
cttgtgagga agcagctttg catctgtgtg ctgaccttgg gcgggcgtcc tgagctcctc 4380
gcaggtgctg ttgtagcagc tgtgcagtag gtcagggctg gcccccagtg cagctttgca 4440
catgaagtag gaggaggccc tgctgcttgt cagagcccag cagagtcttg gtgttctgtc 4500
gggttcctgt ggccggacca gtggcagggt gctgtggaag ctgtcgaatc tcctccctct 4560
gtccagtacc cccgctcgtc ttctagctcc ctcctacgcc cgggccacgt ttcagttatg 4620
ctcacttcct ctgaccgccg aggctcctgc gtgtctccat acagctcacg ctgcagggcc 4680
acgctgtggg tgttggagac agctcctcct cgacccacgg tgctctctcc caccaggcct 4740
aaggtgtgtg tgctgggctc ccgggagcag ctgtgcatcc atcctgaggt gaagaaacaa 4800
gagagtaacc atctacaggt aggctcctgg gctcccgctc cggctcagtg tccgacaggc 4860
gagtgctgct gggtgtccag agccccaggc tgcgctcccg ctgggctagg gtttgaagtt 4920
cactggggga ctgcagggga ggacctggtg ggggtgggga ctggcttcgg tcctttcttg 4980
gccgtgcttc agctgcgcac tctgcccttc ctcccacaga tccacttgtg ccgtaagaag 5040
gtggcaagtc gctcctgtca tttctacaac aacgtagaag gtacaagcag ctgggtggga 5100
ccagggtcgg gttggagtgt gtgcagcctc tcagggtgga gctcagtggt gtcacagcct 5160
ggttgtgctt gcccggtggg gcggccagtg cggccatgta cctgggccct gtcttctgac 5220
tcggggccac ccatgttaga cttctgtgtg gaagagctca cacagtggtc tgagacagcc 5280
agccggcaag actgcctctg gctggtgcct ggggccttgg attttgggaa ggctccctcc 5340
atttcctgat gagagggtct ccctgcacct aacctgctgg tgcaaacagt aggggttttg 5400
ctgaacaccg gctttctctt cggggacttt gttgcttgcc cagcagcagg tgctccagtg 5460
accggccctc ataccatctt gggagggtgt cctggaagcc gtgtctggcc tcccgcgacc 5520
ctgccccgtg tgtctttttc ctgtgctgac cttgctgcgg aaaattatgg ccctgagtgt 5580
gactccaggc tgagtcctgt gggtccaaca cgggatgcct tggggcctct tctggagacg 5640
ggatgtgagt gacaggagcc ggccggggca gcttgccctg tgactgcacg tggccacagc 5700
ctgtgagggc cgggggtgct tctccaccca cgtggctgcc cctcgggtat gtcaagggct 5760
tctggggctc atcacggggt cctagagaca gtggcagggt gcacccccgt tggctgccct 5820
tacagtttct gtgacctgag ggtggcatct gtgcagtcgg cgcggtctgt gcttctgtgg 5880
gatcagggtt ccctctgttt cctgcctcag ttggggctca agcctcaggt gaggtggccc 5940
cggagcactc agaaggcatc ggcggtcctg tgggctgctt tctgcactca cgtttgctga 6000
gtgctcagtg tgccaggact gaggaccctg aagctgctct tgtatttagg gcggcgctcc 6060
cctggcagag actgagccag gtggtcccgc atgacccact accaggcgtt tctgggccct 6120
ggcccttgga gggacagggt gggcggaaca tgggcctgca gggaggctcc cgcttactgg 6180
aggcatgtgc tgtgttgctg gagacatcct ctgtgttgct tcttgttcgc tgtggttttt 6240
ggtctggtgg caccaaggac cctcagtcat cttgatgtgt ggttgtccag gcctttttgt 6300
tggtcctaag aaggggctct gcctttgtgc ccccaggttc cctgacagga gctgccggct 6360
cgtcccggtg atgcctgcag gacgtgactc tgggacgggg ggttgggcag atgtgctgat 6420
ggaaattctc aagcaggcgt catttccgag gtcctcacct ggatttccag gacaggagtg 6480
cctgctgggt gtccccagtc ccatgcagcg ggggtccttg ggatagcatg gaacgctgag 6540
catgggcctg gccggccgtg gtcctggaca agggcagtgc cccggtggct gctgggcctg 6600
ggacctggtg gggacgctgg gcctggtacc tggtggggat gctgggcctg ggacctggtg 6660
gggaggcctc tgactgcctc ctggtgctgc ttccgtctgt gttaggcctc tgggtattgg 6720
ggcccccatc tgtctcctcc tccaggcctg tggactcaga ccaggaagac acaggccagc 6780
ccctgcctgt cccccttggc ttgggctctc actgcccgac ctggcgggag gttgcctagc 6840
cgtgaacctt cgcaccctgt ctgccaccgg acaggctgtg agggggtgtc tgcagcacct 6900
gcaccggcct gagcatcttc agagtgggct gcagctcctg gaggggtctg agaggaaggg 6960
aggcaggtat tttgggcgaa tgaggagaca gctggagagc tggcaccctt cctggcctgc 7020
gtcctgtgag gactctggtt ggggacagca agcttggggt cagcctgggg cagagcctct 7080
gggacggccc cgcccctcgt gccccttccc ctcgcagctc ctgtcctcgc cccgccctca 7140
gctctccgcc aggcaaggtt tggcaagtgc cgctgtgcgg cagtgcctgc tgattggctg 7200
gtctgttgct atggtgctgc ccaggggtgt gcttttcctc ccctgccttc cctgctatcc 7260
ctgggagtat ctggggttgg gtcatcgctg gtgtgtgtga gtgtgtgtgt gtgtgtatgt 7320
gcacgtgtgc atatgtgtgc gcttctggcc tctgcagctg agtcctggcc ctcggggggc 7380
ctggcacctc ctggggacag gcacaaagca gccatgatgg agtcgggagc tgggggaggc 7440
cccattgccc cacgtggctg ccctgtgact ctggggtgct tgttagaaga ggtatctggt 7500
tctgtctgtg tttaagcaac tccctaagga attcttgtgg ttccagtttg gggggcctgt 7560
actgtagagg caagggaggg gcaggacatc ccccagactc tgacttctga agccttttct 7620
gcccggggcc tctccgccag tacaggcagt gtcctttgcc agggctgcca tgctgcagag 7680
gggagtgggc cactgtttag cccaggaaaa cctggctctc ccttagctgg aagttctggg 7740
cctgttgtgg ttggcaggga agctgagtga cggtgctaat cacaggggca cctgcagggg 7800
tttgtgggag atgcctctgt gggttggggc gataggctga ggggctgttc ttccctgccc 7860
tgaggagggc tgagtgtagc cgccactcct gtcctgtctt gggctgtctc ggagaggatg 7920
cgtagaaccc tcgggatcct gctggcctcc gtctggtcca ccctgaacct caggccttct 7980
gggggcagag gaggattccc tcaggatcac tcgggtgggg gcctctcttg ggcacctgag 8040
accctcagtg ggtgctttgt ggcgcgttca cggttggtgg gggacgccca gccctgcccg 8100
ccgtgtagga gccgttctgt cctgggcatc cccctgtggt ctgggactta gtggaccctg 8160
agggtgtgtg tttacccctg cctcacacct gcagaaaaaa gcctggagca ggagctggcc 8220
agccccatcc tggacattga ggacttggtc aagagcggaa gcaagcacag gtgagacccc 8280
tcagtgaggc cacgaccact gtccttccat ggcccagctc tcctgtgacc tgtggaggcc 8340
cggatatatt tcttcacttt tctttgttcc tttttaaatt atgaaactaa ccaccattca 8400
gtacgaaaaa gtttaagcag ctctgaggaa gatagagtaa aaaattgtct ccctcttccc 8460
tggccctcag ccatccccgg tggccaccgt ggagtgtgga cggagccctg caggcctgtg 8520
tctgtgcgga agcacgcgca gttttgtctg cacagactgt cctgcagttg gctgttttca 8580
ctcagcgttg tgggtatagc ttcccatgct ggtgctggca gctcggcctt gttcttttga 8640
ggacagcaga tgtctcctat gtctacctct tacagcttca gagattcaag ttataataaa 8700
gctcttctta tattgagggg gaaacctccc tccccctttt ttttgaaaca gggtctcgct 8760
ctgctaccca ggctgcagtg cagtgtcaca gtcttggctc actgcagcct cagcctccca 8820
ggctcaagcg attttcccac ctcagcctcc caagtagccg ggactgcagg cacacaccac 8880
catgcctggt taatttttgt attttttgta cagacagggt ctcactctgt tgctcaggcc 8940
agtctcctga gctcgagagt tccacctgcc ttggcctccc aaagtgctgg gattacaggc 9000
gtgagacccc atgcctggcc agctcttttt tttttttttt ttttttttga gacggagtct 9060
cgctctgtcg cccaggctgg agtgcagtgg tgcgatctcg gctcactgca agctccgcct 9120
cccgagttca cgccattctc ctgcctcagc ctcccgagta gctgggacta caggtgcccg 9180
ccaccacgtc tggctaattt tctgtatttt tagtagagac ggggtttcac cgtgttagcc 9240
aggatggtct cgatcttctg accttgtgat ccgcccacct cggcctccca aagtgctggg 9300
attacaggag tgagccaccg cgcccggccc agctctgctt tttcttagtg gttctgcgtt 9360
gtgtttgttt ctatccagga atagggttgg ttttactttt ccatcgagtt tttaaagaga 9420
cgacgattta catggtcgga aactcacgag gactccccat cccttggtcg gaaactcaca 9480
tggactcccc atcccttggt cagaaactca cgtggactcc catccatccc aggcagcagc 9540
ttcccacctg ggccctacgt gcaggatgag ggctccttcc gggtcagaag acatggcggc 9600
ctcggggcac cgtcccctgc atggggtgct cacaggatct tctcctctct ccttcccagg 9660
gtgtgccctt actacctgtc ccggaacctg aagcagcaag ccgacatcat attcatgccg 9720
tacaattact tgttggatgc caaggtgggg gctcagtcct gtagctgacg actcctgatg 9780
tccaggggtg tccctgggct tgggaacagc tgtccgagcc tttgctgctt cagggcctta 9840
gatcagcagg cctgggtggg aggactcacc tctgtcactg ggcaggggct caacctggcc 9900
agacacactt gtgagcagcc ccaggccaca ggtcagtttt ctgagcagtc tgggagcggg 9960
caggctggtg ggagtgagga gagacctcca ggctgtggtc cataggccag tgcccgctct 10020
tgatcctgac agctcaggtt ctctccttca cgtcaggcca tgggaggcac cgagaacaca 10080
ggaagcccac tgactcccct cttcccagcg cgtgcccggc cccacactca ctccccctcc 10140
cagcatgtgc ccggcttcac actcactccc ctcttcccag tgcatgcccg gccccacact 10200
cactcccccc acagcatgtg cccggcctga cactcactcc cctcctccca gtgtgtgccc 10260
agccccactc ccttccgccc cgtgtgccca gccccacgct cactcccccc gccagcatgt 10320
gcccggcccc acactcaact cccctcctcc cagtgtgtgc ccggccctgc tgccctcctc 10380
cccatgtgcc ctgcttttgt gccccacact ttttacttag tgcaggtggg atcacacgcc 10440
acgggtcaat ggtttgtgtg ttcacgtgac gatggcgtgg tgacgtttcc agatcccgtc 10500
gttggttcgc tcattctcgg ggtgtatatt tattgagagc tcatcatgct gggtgctatt 10560
ccaggcatag caagactggc ttcactcaca tggagctttg attctagtgg tggggacagg 10620
tggacagcaa aagagtaagc acgtgagctg atgatactga agggaaatag agcagaggga 10680
ggaggcggag accgagccaa gcgggcccaa gtgcgatgtc ggcgggaggt ggggaatgct 10740
ggtgggtctg aggggagcct cagcaggtgc agcagagcaa gggaagaggt gagtgggggc 10800
ggctgggggg ccgactcctg ggaagctgta gcagaacccc acagagagct ggtgaggttt 10860
gccgtggttg tgggtgactc ggtgctttga gccctggctg cccctgggaa ccatctggag 10920
agcttctaac ccaaccaggc ccctccctgg gacagttata tcacagctgg taagccgagt 10980
ctaacacttt cacggaaacg cagaagatct aaaacagcaa gatgaccgtg aagaagaaca 11040
gagctggagg actcacctcg ctggtttcaa gactcctcta aagctgcagg agtggaggtg 11100
gagatggccc agctcaggca caggcctgca ggccatggag aaggcagcaa gctcaagctg 11160
acccacacgc atgtggtcat tgtttttttt ttcagttgga atctcactct gtcacccagg 11220
ttggagtgca gtggcaccat ctcggctcac tgcagccccc gcccctaggt tctagcgatt 11280
ctcccacatc agcctcccga gtagctggga ttacaggcgt gcgccaccat gcctggccct 11340
tggtgattgt tttttgacaa acatgccaat ttaattgaga gaggaaatga aggttgattt 11400
ctggttttct gaaaaaatgg tgctaagaac agctggatat ctgttcggaa aacagtgaat 11460
cttaactctt gttttaccct gtataaacct aaatgtaaaa gctaaactaa aagttataga 11520
aaggaacatg ggggaggtct ttgcaacttt ggggtaggca gagatttctt agtatggata 11580
cacaaggcac tagccatgaa gaaaaacatt aaaatttaga cttcaccaaa atttaaagct 11640
tcaactctgt ggaagagttg agaaaatgaa aaagcagtta aagaaaggga gaaaatactt 11700
ctttcaaagg acttaaaaaa ttttttcagc cctcctctga tttgaaagga cctttgacca 11760
gagtatgtaa aattctccca taactaagca aacaacccac ttaaccactg ggaagggatc 11820
tggacagacg tttcaccaag atgggtggaa tggccagtta accactggga gagcatccgg 11880
acagacgttt cgccaagatg ggtggaatgg ccagttaacc actgggagag catccggaca 11940
gacgtttcgc caagatgggt ggaatggcca gttaaccact gggagagcat ccggacagac 12000
gtttcgccaa gatgggtgga atggccagtt aaccactggg agagcatccg gacagacgtt 12060
tcgccaagat gggtggaatg gccagttaac cactgggaga gcatccggac agacgtttcg 12120
ccaagatggg tggaatggcc agttaaccac tgggagagca tccggacaga cgtttcgcca 12180
agatgggtgg aatggccagt taaccactgg gagagcatcc ggacagacgt ttcgccaaga 12240
tgggtggaat ggccagttaa ccactgggag agcatccgga cagacgtttc gccaagatgg 12300
gtggaatggc cagttaacca ctgggagagc atccggacag acgtttcgcc aagatgggtg 12360
gaatggccag ttaaccactg ggagagcatc cggacagacg tttcgccaag atgggtggaa 12420
tggccagtta accactggga gagcatccgg acagacgttt cgccaagatg ggtggaatgg 12480
ccagttaacc actgggagag catccggaca gacgtttcgc caagatgggt ggaatggcca 12540
gttaaccact gggagagcat ccggacagac gtttcgccaa gatgggtgga atggccagtt 12600
aaccactggg agagcatccg gacagacgtt tcaccaaggt ggatggaatg accagttgag 12660
cacatggaaa gtcgcccagc atctccagtc ataggagaag gcagattaaa gccacgggga 12720
gccgacactg tggtcccact ggcatggctg aaattcagaa gccctgagtg tggcatgagg 12780
atgtggaaca gctggatctc atccatcgct gtgaagttgt gtagccactc cacaaacgtg 12840
tggcaaacag ccgagccggg agaagggaag acgtgttcaa agattcatat gtggccaggc 12900
tcagtggctc acgcctgtaa tcccagaact ttaggggcca aggctggggg atcgcttaag 12960
cccaggagtt tgagaccagc ctaggcaaca tagggagacc ccatctcaaa aaaaaaaaaa 13020
aagaaaaaag aaaagacttc agtgtgcagg tttaccagag ttttgtttgc agttgccaaa 13080
actgggaagc agcccgcgtg agcccatcca caggtgaatg gacagaccgt ggtacccgaa 13140
cactaacagc agccacgggc gtggactgtg gtcacacagc agcagggagc cgatgagtct 13200
cggacatgct aacccagaga ggcccattga ggaggaccta ctgttttttg tgtttttgtt 13260
ttttgttttg aaatggagtc tcgctctgtg gtgcaggctg gagtgcagtg gtgtggtctt 13320
ggctcactgc agcttccgcc tcttgggttc aaacagttct cctgcctcag ccttccgagt 13380
agctgggact acaggcaccc gccaccacac ccggctaatt tttgtatttt cagtagagac 13440
ggcagttcgc catgttggcc aggctggtcc caaactcctg accttgtcat ccactcactt 13500
tggcctccca aagtgctgag gttgcaggca tgaaccaccg cacccggctg gacctactgt 13560
tttattccat ttatgtgaca ctctattaat agaaaaggca ggggtggggc tggtggttat 13620
atggtgcaca taactgccag aactcagtac acttaaaatg aacatcttaa tgtgtgaaat 13680
tttttttttt gagacggggt cttgctctgt cacccaggct agagtgcagt ggtgcgatct 13740
ccactcactg caagctctgc ctcctgggtt cacgccattc tcctgcctca gcctcccgag 13800
tagctgggac tacaggcgcc cgccaccacg cctggctaat tttttttttt tttttgtatt 13860
tttagtagag acggggtttc acagtgttcg ccaggctggt ctcgatctcc tgacctcgtg 13920
atccgcctgc ctcggcctcc gaaagtgctg ggcttgcagg cgtgagccac catgcccggc 13980
caatgtgtga aaatttaaaa gtaccaaagc tggaccccac cccagattgc tcccatgaca 14040
ctctgtgggt gggacctggg agttgggttt tgttttgttt tgttttgttt ttgagatgaa 14100
gtctcactct gtcgcctagg ctggagtgca gtgacacaat ctcggctcac attaacctct 14160
gcctcccaga tgaaagcgat tctcctgcct cagccttctg agtagctggg attacaggca 14220
cacaccacca ccccctgcta atttttgtat ttttagtaga gacggggttt taccatgttg 14280
gccaggctgg tcttgaactc ctgacctcgt gatccgcccg cctcggcctc ccaaagtgct 14340
gggattacag gcgtgagcca ccgcgcctgg ctgggagttg ggtttgtaaa tctccctgag 14400
tggggctggg gcagggaact gctgggtctg ggtcttcctg gctcctctgg tctgtggctt 14460
cctgactgcg gtggccgggg gctcccaggg catcgtggcc gtctgtcttg ctgagcgtgg 14520
cacgtgcctt tccatgctgt ggaggagcgt ctcccggtat ggcgaactgc tggttagggt 14580
ggggcggtgt tgccaggtca tccaggtctg gcctctgctc tcgacatcgc cggcgctgtt 14640
gctcatctgc gcttgtgatg ttcgatgcct gctgcacatg tcttggcttc cctctttccc 14700
ggcctctgtg agctccagcg ctgcgtccct tctcttcctc ctgtagagcc gcagagcaca 14760
caacattgac ctgaagggga cagtcgtgat ctttgacgaa gctcacaacg tggtgagtct 14820
ccgctggcct cctaaacacc tcctattgct tctggccttt ttgtcaagag ccacgcaaac 14880
ctttctggag gggctctggc caaactcctg aagccctagg tgcccaggac tggggactga 14940
gcacaccagg agcttctgcc accccctccc gccctgatcc gatgcctctg ctggggctgg 15000
agactggcca gctgggccag ggacctgccc gtcaggcgca gggcccccac aggccgctca 15060
ccagaccctt tccctccagc cagctcgggg tcagcctggg ccagggctgt ctcctctgcc 15120
ctcggcagca gcaggcttgt ggtcttgcct gcagtgtctc tgcccttccg gccacatggc 15180
ttgagactga ggcaggagaa tcgcttgaac cttggaggca gaggctgcag tgagccagga 15240
tcacaccact gcattccagc ctgggtgaca aagcgggatt ctgtgtcaaa aaaaaaaatg 15300
ttgactgggc gcgctagctc atgcctataa tcccagcact ttgggaggct gaggtgggcg 15360
gatcacgagg tcaagagatc aagaccatcc tggccaacat agtgaaacac cgtctctact 15420
aaaaatacaa aaaaattagc tgggcgtggt ggcgtgtgcc tatagtccca gctactcagg 15480
aggctgaggc aggagaatca ctcgaaccca ggaggtagag gttgcaatga gccaagatca 15540
caccactgta ctccagcctg gtgacagagc aagactccgt ctcaaaaaaa ataaaatcaa 15600
aaagaataat tggcaattcc agtgaaataa ttgtttgttt gtttgttgag acagggtctc 15660
cttctgtcgt ccaggctgga gttcagtggt atgatcttgg cccactgcaa cctccacctc 15720
ctgggctcaa gccatcctcc cacctcagcc tcccgagtag ccgggactac aggtgcacac 15780
caccacgccc ggctaatttt tgtatttttt gtagaggcgg ggtttcccag cgttgcccag 15840
gctggtcttg aacccctgag ctcaagtgat ctgcccacct tggcctccca aagtgctggg 15900
attacaggtg tgagccaccg cgcccggcct gaaacaatcg tttctaaata ttggtgtggg 15960
ccacacagtc atgtttggac ctacttgtgg ccttttacag accccaggcc aaggctttgg 16020
gaacttggct gtcagcctcc tgtgccttct gcacccccac cccatttctg ctttctggaa 16080
cccccgatcc tgtcctgttc tgtggtgatt cgggtgtgct tgggctctag gagaagatgt 16140
gtgaagaatc ggcatccttt gacctgactc cccatgacct ggcttcagga ctggacgtca 16200
tagaccaggt gctggaggag cagaccaagg cagcgcagca gggtgagccc cacccggagt 16260
tcagcgcgga ctcccccagc ccaggtgcgt tcatagccag actgcttggt cctgaggcct 16320
gcgctgctgc agggtgagcc ccacccggag ttcagcacgg actcccccag cccaggtgcg 16380
ttcatagcca ggctgcttgg tcctgaggcc cgtgctactg cagtgggcag cctgccctgt 16440
ggctgtgtgt ggtcggcctg ggcaccatct attcaggctg gcactgcagg gcatccgctt 16500
ctctcagagg cttcttgggt gtgaattctt cagggtcctg tagcctgtgg aagggctggt 16560
attgttcagt agttctggta ttttccaaag acctatgtct tctcccagcc agtatcaact 16620
tggcctctac tgtgtaaaac tggaaaactc tactttgtga agctgagttg ggagcatcgc 16680
ttgaggccag gagtttgaga ccagcctggg caacatggcg gaacctcgcc cctgccaaaa 16740
aattagccag gtgtggtggt gtgctcctgt ggtccaagct tttccggagg ccgaagtggg 16800
aggcgtgctt gagcctggga ggcagagctt ccggtgcccc agatgactcc actgcactcc 16860
agcctgggcg gcagagtgag gccatctcaa aaaaaaaaaa aaggaaaact aaatatattc 16920
actgtaaggg cattttgcat ctttaaatga cccacaaatc tggcatgcat cagctgctct 16980
gcctgtaggt tccttcccag tgtttgtcca gaggtgtatt tccacacagc gctagtcacg 17040
gcatacgtgg aaaacgtgga aacccttcat ggatgttgtc agttggtcta tattttcttt 17100
cttttttttt tttttgagat ggagtttcac ttttgttgcc caggctggag tgcaatggcg 17160
cgatcttggc tcactgcaac ctccgcctcc tgggttcaag caattctcct gcctcagcct 17220
cccaagtagc tgggatcaca ggcgtgcacc accacgccca gctaattttg tatttttagt 17280
agagatggtt tctccgtgtt ggccaggctg gtctcgaact cctgacctca cgtgatccac 17340
ccgcttcggc ctcccaaagt gctgggatta caggcgtgag ccgccacgcc cggcctttgt 17400
ccatattttc tacatggctt ctgtaaacag ctgactagga gtctgtgtga atatcttcat 17460
aggttctgct gtgacactac ttgctcgtga gcatctccag gtgtaaacag catcagcttc 17520
ccccattttc ctttaaaatc gcacatgtgg acggacacca cggggaccct ggaccctggg 17580
gagccccgtc ctcacccttc tcaccaggat ggctgcttgg tagagagtga gtttgcaaag 17640
ttggcatttg tttagtacag aagttatcag gtgttctggc tttagaatcc ctttatatat 17700
atatatatat acatatattt aagtgacagg gtctcactct gttgcccagg ctggaatgtg 17760
gtggtacaat caaagttccc tgtagcctcg gcctcctggg ctcatgggat cttcccgtct 17820
cagcgtctta aagcgccggg accacaggtg tgcaccactg ccaccggctc tcaagattgc 17880
cacgcaggga gttgcagtgg gggaaggggt tcctgggact ttgaacgctc cacctccctc 17940
ctctccacag tcccccaacc ccacctctct aacggggtgg acggccgcct ctttccatcc 18000
ttcgcttggc gcagggtggg gagagtgaca ggtctccttc cctcatctcg gcagctgcca 18060
tttcatcgct tacataacgt gggagaaaca tccacccacc cccaggcctg tgtgaacatc 18120
accacggggc cttctccact cttcagtttt gttagttact tgatgtgcag ggctttttgt 18180
tgtaactagt gggggacgtg tggtggggtg ggcttctgcc atctcattca ggaccagaac 18240
ttcagttttc atccctatct gttcccccac ccctttggag atggggtctc actctgtcac 18300
ccaggctgga gagcggtggt gccatcacgg ctcactgcag cctccacctc ctgcagcctc 18360
cacctcttgg gctcaagtga tcctcctgcc tcggcctccc aagctcctgg gactacaggc 18420
gtgtgccact gtgcttggca gggtccattc ttttcctcac actttattta ttgaagagcc 18480
caggccgttt accctgcaga gtcggaatct gtacaggagg ggcagccaca cgagttcccc 18540
ggtttactct gaacttaggt ggcttgaggg ccccagttag actgcggcca ccgtttgccg 18600
ggctccagat gggacgtcct ttctatcaga aggctcacag tatctccttt cccgtttctt 18660
cccatgtgaa cattgttgct gctgaacacc tgaatatgtt aatcactggg ggcttgcaag 18720
atggcagtgt gctaattcca tcatctagtc agttagcagg aataacttag gaccacgccc 18780
tgcaccatat cagctatgtg gtgatcccat tcacacagga aaggtgggac aaatgctggg 18840
ggtgggccgg gtgtgctgtc tcacacctgt catcccagca ctttgggagg cccaggcagg 18900
cggatcacga ggtcagagat tgagaccatc ctggccaaca cggtgaaacc ccgtctctac 18960
taaaaataca aaaaaattag ccaggtgtgg tggtgcatgc ttgtaatccc agctacttgg 19020
gaggctgagg caggagaatc acttgaaccc aggaggcgga ggttgcagtg agccgagatc 19080
gcaccattgc actccagcct ggcgacagag cgagactccg tctcaaaaat caatcagtca 19140
atcaagtgtc atcactgaat gtttgtgtgt gaacgtgggg attggtcctg ccccatgctc 19200
cctcctgaat ctcactcctg acctcagttg ctgcaccttg aggtgttttc atgtgggctc 19260
ttgtgtcctg accccggcgg ttgtggcctc tttgctgtct gggagtcagg atttttcaca 19320
ctcatgtcct gctccagacc tggaatcagc caagtctcca agaagccctg ctttcttttc 19380
ctgcaagacg gtatttcaag acccgccatg cggcagcggg ttggtcatgg ttactgggtt 19440
ggtcgttgtt actgggtgtt ttcgtggaga tacagccata cgcacaggtg tgttcacaaa 19500
tgttaattct aaaggtcaaa cacccggcca ggcataaggg ctcagcggta atcccagcac 19560
tttgggagac caagactggt ggatcacctg aggtcaggag tttaagacca gcctgagcaa 19620
cagggtgaaa ccccatctct actaaaaatg cgaaaattag ccgggcatgg tggcgcacac 19680
ctatagtccc agctagtcgg gagacagaca cgagaattgc ttgaacctgg gacatggagg 19740
ttgcagtgag cagagatggc gctgctgcac ccctgcctgg gtgacagagt gacaccctgt 19800
ctcaaaaatg aatagataaa taaagataaa acacctgctc ctcttggtgt ctccagtttg 19860
gatttggcct gtgtagcctc ttccttcgcc tgttggtgga tttggcctgc acggattctg 19920
tgtggcctct tccttcccct gttggtggat ttggcctgca cggattctgt gtggcctctt 19980
ccttcccctg ttggtggatt tggcctgcac ggattctgtg tggcctcttc cttcccctgt 20040
tggtggattt ggcctgcacg gattctgtgt ggcctcttcc ttcccctgtt ggtggatttg 20100
gcctgcacgg attctgtgtg gcctcttcct tcccctgttg gtggatttgg cctgcacgga 20160
ttctgtgtgg cctcttcctt cccatgttgg tggatttggc ctgcatggat tctgtgtggc 20220
ctcttccttt ccatgttggt gtcctttttt ccatgccagg aatcctggtt ctcaagggcg 20280
gggttgttgg cacgagcgtg atgcagactg cctttgctgc ctttctcttg cccagggctg 20340
aacatggagc tggaagacat tgcaaagctg aagagtaagt gttgccctcc ccgcctcctt 20400
gcagctgggt ggggcctcct ccttgcgagg aggtgggtga cacctcctcg acccacagtg 20460
atcctgctgc gcctggaggg ggccatcgat gctgttgagc tgcctggaga cgacagcggt 20520
gtcaccaagc cagggaggtg agaggcgggg agccagcccc ttcactgcag gcccagccta 20580
gagctagaaa cgggccatgg tgcagtcctg ggctgtcaca tcacgagtga ggcctgtttt 20640
caggcctgtt ttcccttttt gagacctggg aggagcacct gctttgcatg atctggttgc 20700
tgagatgttg agaggagcag cacacactcc cacgggacag cacacagccc cccacggaac 20760
ggcacacaca cccatggaac agcacacaca ctcccacgaa cagcacacac actcccacga 20820
acagcacaca cactcccacg gaacagcaca cacacccacg gaacggcaca cacacccacg 20880
gaacagcaca cacactccca cggaacagca cacacaccca cggaacggca cacactccca 20940
cggaacggca cactctccca cggaacagca cactctccca cggaacagca cacacactcc 21000
cacggaacag cacacacacc cacggaacgg cacacactcc cacggaacag cagactctcc 21060
cacggaacag cacacacact cccacagaca gcacacacac acccacggaa cagcacactc 21120
tcccacgcgg ggccgctggg tttcctgcag tttctcctcc tccaggcctt tccctggacc 21180
ctggtccagt ccgtcatttg agcacaggtg cctgttagaa cgagaccttc ttgttaggac 21240
gatgagtgtc ccagccacca cctcttttgg actccgggag gcctggaacg ttctgaacgc 21300
tccgtggggc tccagtcttc tccgcagcca gggcagcagg gtttgctgtc tgtcctgcag 21360
gcagatgagg agtcagggct ggggcctgtg tgggggctct cctgagcgca cagccgccga 21420
ggtggagcgt gttctgcctg agcgccgacc tggtcggggg aatcccagtt gcttccaggt 21480
ggagccactg tcctcagcgt aatgctcaag gctctggcct ggctcctcgg ccaccctgca 21540
ccctcagggt cccctcctgt agcttctgct gccccatcac tgtcactctc caaagctttg 21600
gggactctgc ccagagccac cgcctcccag aagcccctga caacctcttg acgaccccct 21660
agtgacccca tccctcccct ctgacggcgg cccctgctct gaggcggctt cttttcctcg 21720
gtgctgttct cgtgctggcc aggcctcctc tccccacctg gaggctcctg agggcggagg 21780
cctctcacct ccaatgctgg cgtcccctgg agggctgaat ttgtttccga gggaaggaaa 21840
cttccacagt tgttgccttc agttccaaag ctgcagcctg atttccccct ccaggctcga 21900
gcctgttttc ttctcggcag ctacatcttt gaccagtgtc gtcccccctc aggcccgagc 21960
ctgccttctt ctcctcagtt cccaaagctg cagtctggtc cccccgccag gctcgagcct 22020
gccttcttct cctcggcagc tacatctttg agctgtttgc tgaagcccag atcacgtttc 22080
agaccaaggg ctgcatcctg gactcgctgg accagatcat ccagcacctg gcaggacgtg 22140
agtgctggca cggggtcttt ggtgcgggca aatgtggcgt agggggtgca gcaggcctcc 22200
atcttggcag tcagggctcc cctggccgtc acctggccgt cagcaggaac aggcccacag 22260
aacctcatct tctgatcggg gcgtggaggc gttagtgcca cttgccagct gccgtagagc 22320
ctgtcccagt tctgcagctg gcggcttcgt cctacagcct catcccatta ttctgctttt 22380
gagaaagagc agcccaaggc cctagctggc ttgtggggcc tctggcttct ccacaccacc 22440
ccgagttctg cttctcagag ttgtggggtc cagaggcttt gcccagaggc ggtgtcccca 22500
tgggctgctc tggtttgaga cgccgggccc agcggggtct ctcctctgct gcgctcccgg 22560
gtgctgggga gggtggcttt tgctgcttca acccttaggc gaccatagag cctcttttca 22620
agtcccactg acccccttgg agactctgtc cctgcctggc ttctctcctg gctgctggga 22680
agagcaggcg aactgcccgc cctgaatgga tgctgcgctc caccctgggc cccccattgg 22740
gcaggagatg gagcttggca gtcgggctga gcgggctcat gctggaaggg ccggggctgg 22800
ggtcggggcc tcccctgcct gcagtgtggg tgtcagcgcc ctgctgccct ccaggtgctg 22860
gagtgttcac caacacggcc ggactgcaga agctggcgga cattatccag gtggggcctg 22920
ctcctctgtg gcatctcctt ccctgatgga agccgggcgg gtgccttctc ctgctgtatt 22980
agttaactga ttctagactt ggggatggga gaaaggcccc tacaccacct gtttctgatt 23040
ggcaaactct cggctccttt ccagtgccct aaacccacac tgggcctcct gcagggatgg 23100
gggaggacga ggtctggtgg cacatgccca gggtgatgct ggtgagggag gacgcaaagg 23160
acagtggggg ccggggagcc gctcctgccc tgtccgggcc ctcaggccag gggggaccca 23220
ctgctggcag ccccagcagc cccagctgca cgcagatgaa gagctctgga cacacgcggc 23280
ttcctgaaca gcttctccag ggacagacaa atggggaccc tgcaggttcc cggcaggggt 23340
gtccctggga gcccatgatt gggggtgcga ccctggcccc cttctcattg gccccgtcct 23400
gtcctgcaat gcccgtccca tgtgaggtct gcttctggct ccatgcctat ggcagcacct 23460
gctttccctg gcgtagaggt gcttgtccgg tttgtggagg gcacgcccca ttttgggtgc 23520
tctgggcacg ttgcctctcc ggggcctcgg tggctttttt agaagcagac tcagaagtcc 23580
ctgactgggg aagccaaggc acaggtggct gtgtggagcc ctgtgaggcc tcctctgtgc 23640
tgcccacgct gtacctgctg gccacacgag atcatggcag ggttaggcag ggctgcccag 23700
cgctatgaca gcttcatgag tgtccatctg gcctgtgggg tgcttgagct gggggaggcc 23760
gcagaagaac cctgggatgc atggctggcc tgtgcatgct gctgggcatg gagctgcaga 23820
tcccggaaca agcaggcact gccttctcct tcacagacgc agctctgagc gggggcgaga 23880
cctgggcagg gaccaggtgg ggtgggcaca gggtggtggg gcccaggctc agccctccct 23940
ccactgtggc cgtctctgtg gccagtgacg ccacagcctg tgtcttctct gtgcggtagc 24000
tggggctgga aggacagcac tgccttgtcc tcccaactcc tccccaaagg cacggtgggc 24060
atcccaggcc cagacccctc tgtctgtggc tcctgcctgc caagggctgc tgtgctgtcc 24120
cgcatggagt gtggttggct cttcaagcag gaggccgtgc acctatcagg cggacctgct 24180
tccatgtccc tgatgggtca ctgcaaagca cctccagcac atggccaggc gaggtagccc 24240
tgcagcccag ggcctggagg gcaggtgtga gctggcccgg gcctgtccct ccctggaata 24300
cagcttccca ggctcccact tatggagaag tctcctccac actatggaac tgaatcctag 24360
aatgtggctt ctgaggttcc tacactcgaa ctgaatcctg gaatgcggct tccaaggctt 24420
ccagctatgg agaagactcc acactctgga accgaatcct ggaacgcggc ctcccaggcc 24480
cccagctatg gagaagactc cacactctgg aaccgaatcc tggaacgcgg cctcccaggc 24540
ccccagctat ggagaagact ccacactctg gaaccggatc ctggaacgcg gcctcccagc 24600
ctcccactta aggagaagtc tccacactct ggaaccggat cctggaacgt ggcctcccag 24660
gcccccactt aaggagaaga ctccacactc tggaaccgaa tcctgcacac tccatcggtt 24720
tggaatttcc tttggctgct gctctaagta gccgctggtg gatgactcag cttctgccag 24780
ccctcgggtg cctggaggat gagggactgc acacagtgct cacccgcgtt ggctcctgag 24840
cccctgcagg tgtgggcggt gcccataggg ctggtgctgg gttgggcctg cagccctgag 24900
tcacaggtga ccctgggggc agagtggggc cagtggcccc aggaagagga tgtgggatgc 24960
acagctcagc tggaggcgaa ctccaggcag ggtcaggccg tgtgctcgga agtcagggct 25020
tagctggagg caaactctgg gcagtgctgg cccgtgttgg ggaaccagtt gcccctgggc 25080
ccccgtgaga ctgctgggtc ctcatccctc tctgcctgag gccggagctg ccctgggctg 25140
aggcacaggg ggatttgtgg tggtgttttt ttgagaaagg gtctcgcttt gtcaccccgg 25200
ctggagtgca ggggcttgat cacagctcac tgcagcctca acctcctggg cccaagtgat 25260
cctcttgcct cagccacccg aggagctgtg aacacaggtg tgcaccaccg cactcagcta 25320
atttttaaaa tttttttgta gagatgaggt cttgccatgt ttcccaggct ggtctcaaac 25380
tcctgggctc aggcagtctg cccgccttgg cctcccaaag tgctgggatt acaggcaaga 25440
gcttccatgc ctgcccagca gaaggctttt cgaaggaagc tgtttcctga ggcagactca 25500
gccctgctca tggcagccac cagcgtgggg gtgaacttgt tctgttactt ccatccccgt 25560
gggccaaatg ctttggtaaa acacaaggcc ctgtgtttag ctgtcttgac agtgaaaatg 25620
gctgggaagg aaggaaggaa cggaaggaaa tttctctctc cttctgtgcg tacccaggca 25680
cgtgcacatg catgcagagt acgcacacac gcacgcacgc ctgcacaaat ccacgcatgt 25740
tgccaagtct ctgtgttcca gccgtggtgt ctgccccccg gtgttctcta gttcggcttc 25800
tccgcatttc tgtgaatgat tccggcttct tggtgttccc agcagaactc cctcaagtct 25860
gcggcggggc tctgacggcg gtggcttggc tgacatggcc acattgctga gcctgttggg 25920
ggctttgcgt tcctgttctg gccgtttttg gctcgttttc caggaacggt cgtcacgcgc 25980
tcctctccta gtgcaggcat cattcctttc ccattgattt gcagggttct ctgtaagttc 26040
tgaggatccc atatacatat actctctgta agttctgagg atcccatata catattctct 26100
ctctaagttc tgaggatccc atatacatat tctctctcta agttctgagg atcccatgcc 26160
gacatacata ttctttcctt gtctcatgct ggtcattttt tccattttca tgacaggttt 26220
ggtgaacaca tgtttccttg tcagattttt gttctgagct tgtgcctccc gaccaagatg 26280
ctaaaccggg tcttgtgtat tctccaaact gcactgtaga gtgacggagc tttgtgtctg 26340
ggcctccatg ccttctgacg tcacctgtgg gggtgtgaaa ggcagactct accttgattt 26400
ttcccagcac gccacaccgg tggttctgtg cgctgaccga gcggctcggc ttcccccaac 26460
tccactgggc acctgccaca cttttcctca tgtttttgtt cactgtggtt ttgtcgtaag 26520
tcctggtgtt ggcctgaacc aatttctttt tgtttgtttt tgagacagag ttttgctctt 26580
gttgcccagg ctggagtgca gtggcgcgat ctcggctcac tgcaagctcc gcctcccggg 26640
ttcacgccat tctcctgcct cagcctccca aatacctggg attataggca cctgccacca 26700
cgcctggcta attttttgta tttttagtag agacgaggtt tcaccgtgtt agccaggatg 26760
gtctcgatct cctgacctcg tgatccgcct cccaaagtgc tgggattaca ggcatgagcc 26820
accgtgccca gcctgatatt tttagtagaa atggggtttt gccatgttgg ccaggctggt 26880
ctcgaactcc tgacctcagg tgatcctctc accttggcct cccagagtgc tgggattacg 26940
ggtgtgagcc accacgcccg gcctcttgtt cttttgaaac ctgccctgac gttttttcca 27000
tagtgcatct tggagtcagc gtgtctactt cctgtaaaaa tcttactgtg attttgacta 27060
gaatgtgttg aattcctgtt ttttttttga gtcagggtct ctctgttgcc caggctggag 27120
tgcagtggga ccatcacagc tcactgcagc ctcaacctcc tgggctcagg ggatcctctc 27180
agctcaacct cccaagtagc tgggaccaca ggcacatgcc accatgcccg gctaggtttt 27240
tttttttttt tttttggtga acaccctggg gttgcaccat gttgcccagg ctggtctcga 27300
actcctgggt tcgggcagtt tgctcctctc agcctcccgg agtgctggga ttacaggcct 27360
gagccactgc actaggccat gttgaatttc tagattaatt tggggccctc aggggcacag 27420
agaggagggc tgggccagtt ggcgggagga gaggcccctc gggctgccgc attttcagtg 27480
catggagatg gcctatgttg ggggaacaca gagctcaccg ggggtccctg cagggaggag 27540
aaagggtcag gcaggtgcca gctcctgtcc attggcctgg ggctgcatga tggcaggggc 27600
cggtgaaccg atgacccctg ggtgtcctgt gaccttctgt gtatgcggct gatgctgcag 27660
aaagtcgggt ggcctcaggc tcctgacggg gctgcacttc ctctgccttt cagattgtgt 27720
tcagtgtgga cccctccgag ggcagccctg gttccccagc agggctgggg gccttacagt 27780
cctataaggt aggggccacc tccaggaggc aggtggaggg cagcccttgt tccccggcag 27840
ggctgggggc cttacagtcc tataaggtgg gggccacctc caggaggcag gtggggctgg 27900
gggtcttctg gtcctaaaag gtaaggggct gcccccagga catgggcggg gcctccacac 27960
tcctggtcct gtcccctcca ggtgcacatc catcctgatg ctggtcaccg gaggacggct 28020
cagcggtctg atgcctggag caccactgca gccagaaagc gaggtacaga cctgggccca 28080
cacgctcccc gcccgcccgg gtgcagtgcc cggcaccacc atgccacagg ctaggcacat 28140
gcccagccgt ggatctcctg cccccatggg cctggccacc ttctccatat ccaggccaat 28200
ccagagcatt ctcctcactg tccctctgaa gattggagtt actgagagac gtaggagatg 28260
gcctgatggc accgtgacct gcccagagtc acctggttgg tggtggcaga gccacagccc 28320
agccaggcct ccctgctggg acacgctcgt ttatgccgag gccgtcagca cagagcctcc 28380
acagtgaggc acggctctgc ctgctgcctc cacgcagcgc ctggccgggc caagcctcag 28440
ggtcacatct gaagggggcc cggctggccc tgttgtccga agcccctggt gcgctcagcc 28500
ccgaggcccc acgtgccttc ttggcttcct gtgctccgtg gcgtcttcga gtcggtgctg 28560
ccggggacgc tgtgtggatg gggtctgtga gtgtgccctc ggctccgtgt ccggagccct 28620
gtggttcttg gggtgtatct ggccccaccc ccactgcgtg gtgtccaggg tggggcttca 28680
cggctgcagc tgcgggagct gctgcccctg ccttgtgctc cagtggggcc ttgcctctgg 28740
gcttggttcg tccctctctg gaacattctt tctcagctgc tgtccgaccc atggtggcat 28800
gacgtggccc tggctgaagc agcccttgtg cggttgctgt ggttgggtct gcctggccga 28860
gccggaaggg aagggctggg agggcgtcag ggtggcgtgg cttgaccccc gctcggtgat 28920
ggtcctgcag caaggcctct cccagcagga agcgtccatc ccggggggag gccggcgccc 28980
ctcacgcagt tggggttgcg ggaggcagtg cgtgcctgag gcagccggtg cacagattcc 29040
aagggcctgg aatctgtttg ttccattgac ctctgatgtc acttgacttc tcagaagcag 29100
ccactccctg cactgggcgt ttgtaggaaa tgagctcctg gaggaggggg tggggaagtt 29160
cccccattgc agggcacact cagccccagg aaggaaacgt gcctcgtccc tgctgactcc 29220
gaatcgcagt cagagtcgtt ctgcttgtgc cgtgttgaat tcccggcatc cggcatccag 29280
actcagcctc ctccccaggc cacggccgcc gtggccagtc ggtcaagccc ttctaggaac 29340
ttcctttgag ctggcgccct tgttcactgc tgacgccact cagaggcttg tgcacgtgtc 29400
ctgcttccag gcagagctgg gaactcgcac cccgtcttct gcacgcggcc gtggaatgtc 29460
gggatgccgg cgcttccttc ccgtgtgctc ttggcggggt gggcttcttg ccctgagccg 29520
catgtcacag tttctgcaga agtttagggt tggagtgggc tgacctctct gcaggtgtcc 29580
ccagcctctg cctggggtct gcctcctact cccaggaccc cctgtccccc agaggggccc 29640
caagctggca ggctcacact cagggcagcc tcctttgttc tgacttctgc acagtgggcc 29700
tgggtggctg cccgcggctc gcttgcttga tgccagtggg tggagagggt gatgggcaga 29760
gaggcaggtg gtcaggcccc cagtcccgtc ctcacactct gtgccctctg ccgccccccg 29820
ccccacaggg aaggtgctga gctactggtg cttcagtccc ggccacagca tgcacgagct 29880
ggtccgccag ggcgtccgct ccctcatcct taccagcggc acgctggccc cggtgtcctc 29940
ctttgctctg gagatgcaga tgtacgggcc acccctgcca gggcctgagc accggtgaca 30000
cctctgacat cagcggggtg gaagtggtgg gggtccccat gagccgggtg ctgggggtct 30060
cgggcctcga gggctaaagg ggtgctggtg cacttcccca ctgtctgctc cctctggcca 30120
cgctcagccc tttcccagtc tgcctggaga acccacacat catcgacaag caccagatct 30180
gggtgggggt cgtccccaga ggccccgatg gagcccagtt gagctccgcg tttgacagac 30240
ggtgagggcc tgtccctggg ccctgctggg gtgggaggtg ggggagcact gaggcctgag 30300
gtcctgagca gtggcctctc cggctctagg ttttccgagg agtgcttatc ctccctgggg 30360
aaggctctgg gtgagtgccc tgaatgcccc agctgtgccc atcctggatc ctggacccct 30420
gctcccaaga gctggtaggg aaccctgcag acatcctgcc cctgccttga ccccggcccc 30480
tgcacttcca ggcaacatcg cccgcgtggt gccctatggg ctcctgatct tcttcccttc 30540
ctatcctgtc atggagaaga gcctggagtt ctggcgggtg cgtctcccct gtgttctggg 30600
cggggtgggt gagggcaggg ctggagcatg aagcaggcag tggtcacagc tcctgcttgc 30660
cctcatcgga tcggcggcgt gaccagggct gccgtgtccc tgcctcttcc tcccacaggc 30720
ccgcgacttg gccaggaaga tggaggcgct gaagccgctg tttgtggagc ccaggagcaa 30780
aggcagcttc tccgaggtcg gcacttggcc ggggctctgg gcctgctgcc ccctcgtgcc 30840
tcccctgcct ctcacagctt ccccaaggct gaccactggc cctgaccatg ggctccggcg 30900
gctcccgctg cctcttcagg gctcctgcgt ttccttcctg gccctgagtg ttgcctctta 30960
tcttacaaag cccccagcac cgggtgggtg tggtaacagt ggccctcctg tctgagtagc 31020
cctagtcggc caccctggcc ctggggttcc ccgtgttttc tgggaagcac tgagcaggcg 31080
tggggtcagc ctgggatccg tgccaggaag aagcttccag aacccgattg gccttcctgg 31140
ctaggacgat ccttcatctt ggagcatgag acctgggtct ccctcatggg ggaggaaggg 31200
gctggggggg ggctccaggc tcagcctcac caactttcct tccagaccat cagtgcttac 31260
tatgcaaggg ttgccgcccc tgggtccacc ggcgccacct tcctggcggt ctgccggggc 31320
aaggtgagct ctccagggcc ctctgccctg acctggttgc ctgttccctg gtgggtgctt 31380
atggctcccc agcagactct gggccctggg ggctgcccgg tcccctcctt gggtcccacg 31440
agagcgactg ctggccctgc tgggagcgtg tcctgctctg ggcctgggca ggcaggatgg 31500
gagtttcctg gccacaagag ttggaggtgg cgtctgggag ctgtggaccc caagtggggt 31560
cctgacccac agatggagct tcctcccacc cctggttggg gacggagcct cggggaaggt 31620
ggctgggctg ggtgtgggca ccagggagag gagcccccac ggccccaggc agctccctgg 31680
tgtgtcccct aggccagcga ggggctggac ttctcagaca cgaatggccg tggtgtgatt 31740
gtcacgggcc tcccgtaccc cccacgcatg gacccccggg ttgtcctcaa gatgcagttc 31800
ctggatgaga tgaagggcca gggtggggct gggggccagg tgagttacag cagggtgggg 31860
ctggggtaag gcggtctggt gactgagccc ccgccccgtg gccaagggag cccccgtgac 31920
cgagccgcct cgccccacag ttcctctctg ggcaggagtg gtaccggcag caggcgtcca 31980
gggctgtgaa ccaggccatc gggcgagtga tccggcaccg ccaggactac ggagctgtct 32040
tcctctgtga ccacaggtgc gtgcagtccg gtggcaggcg cggcgccagg ggacacgccc 32100
acaccccact gggcccctgg actctccttc cccacatgag gccccgtctc ctccagagcc 32160
tctccggcta ctcggggtca gcgtggggcc cctgcagcag atgagggtct tcacttcggt 32220
gaactgaacc cttgaagcgg ctgtgggcag ggcagcaggg ctatggccac cccccaggtt 32280
cgcctttgcc gacgcaagag cccaactgcc ctcctgggtg cgtccccacg tcagggtgta 32340
tgacaacttt ggccatgtca tccgagacgt ggcccagttc ttccgtgttg ccgagcgaac 32400
tgtgagttcc tgcccaggga ggggatgagg gtgttgtccc cagaggagcc agaaatgggt 32460
ccacccaccc ccatggttct gcagatgcca gcgccggccc cccgggctac agcacccagt 32520
gtgcgtggag aagatgctgt cagcgaggcc aagtcgcctg gccccttctt ctccaccagg 32580
aaagctaaga gtctggacct gcatgtcccc agcctgaagc agaggtcctc aggtgcggac 32640
gggcagcgct gggtgggcgg tgtgggggtg gcggagcggg cggcgtgggg cgggcagcac 32700
caggcgccca gggcggaggc gactcacctg gctttgtgcg cttcccctcc cacctccaaa 32760
ggctgcctct ccctcctagg gcagggcccc cacgggctgc aaccctcccc tacaggcaga 32820
gaacgcccca ggcaaggatg ccccccgagg ctgagactcc ccccaatagc agggaggaca 32880
cccacaggca ggaccccaag tgctgggact ctcccccaag aggggctttg ccacaggcag 32940
ggaccccagc tggggccccc cgtgggcttc actgcgcact cgggtgcccc tgcagggtca 33000
ccagctgccg gggaccccga gagtagcctg tgtgtggagt atgagcagga gccagttcct 33060
gcccggcaga ggcccagggg gctgctggcc gccctggagc acagcgaaca gcgggcgggg 33120
agccctggcg aggagcaggt acagttccag ggccttggga tggacacaga ccctctgtct 33180
cctgaggcca acccgacccc gcccatctgg cctcaggcac ctccccacac acccctgtaa 33240
atcccctgcc tggcaggcag gcgggcaagc gggcggggga tcccagctgc ctggctgtct 33300
gtgggtcctc caccccacct cacccacagg ctgctggctc ccaggtggtg catgccctgg 33360
ccctccgcgg gtgcccccca catcactttg gttctctggc gggtcagctt ggctcagtgc 33420
actcaaggtc gggtgcccct gccactggct gcgcttgagg ctggcctttc tccaggaatg 33480
tgctgcgggt ggaacccagg ttccttcttc cttggggcct tttgccccag aagcccataa 33540
ttcctcaggc caacccgaaa ttttctccct gcttcctgct gggagccatt cccctcttcc 33600
tgcccatccc tgcccttcag gcccctggag tgagctccag gtgcaggcac caggcacctg 33660
tgtccccttc ctgccagccc ctcgctgtgg tcggactgtc ttccctggac ctgctcttac 33720
aagtcaccac ctgcgagcct catgagccgc tggtgtgact tggacaggac caagttgtgg 33780
cactgtcacc ggggtgtgct gtgcccccct cccccgacct ccatcttggc tcagggctcc 33840
ttgggaccat cttccctgtg cgtccaggtg ctttgggacc ccagagtgtg tggttggggt 33900
ctgtgtgtgg ttgtgagctg tgtcctcctc aggcccacag ctgctccacc ctgtccctcc 33960
tgtctgagaa gaggccggca gaagaaccgc gaggagggag gaagaagatc cggctggtca 34020
gccacccggt gcgtgagctg tccctgcacc tgtgccgacc accatagaca cgcatgggaa 34080
cgcagccgtg ggtgccccca gccacggctg gtcccgatgg gaccagggaa tccaccccca 34140
ggagctgatg tccagggcag ctgtgatgct gacggccagg ggctcaagtg tgtggtttct 34200
tctgcagggg gctcatgagt cccagctgga atcaggcccc acccttgggc aggtttggca 34260
tggggcctgc agcactgggc ttggccctgg catttccctc aagtgtggat gcacacctgc 34320
ctcatgtgag ggacacagcc cattcctagc cttggatcaa agaacggagt tatagccgga 34380
gccaggaagc cccctgcctg ctggaaaacc ccaagtgtgg cggcctttgt ccatgtccct 34440
tggcttctgg gaagaactgg gtggtgccca ggcagggctg gtgccatcag gaagtgggtg 34500
gctgctgagg ggcctgggct ggcgagggcc tgggtgggga gtgcctgggc cgcccctgcc 34560
ttggtttcca cgtttccgtg ttggtctggg gtgtgtagag agatgggcac tgctcatccg 34620
gaagcccctc cttgtgcgct gccatcctgg gagcctcagc cgcatccgct gtggggcagg 34680
gggcttgagg gaggaggaga gagacgggcc atgcaggacc cctggcttga ggcagagcca 34740
atctaccctt tgcccattca ctgctctcag ttccctgcca gcctctcact gtgtgacctc 34800
agacgggccc agccccacag ctttcttccc gcagcccctc cctatgtcca tccagccagc 34860
cagtttctca ggcagcagcc ccacctcggc agtcactgtc ccagggaacg ctcaatgttc 34920
caaggaaggc tctgcagccc cagggaccag atgatgaggc tggccctgat ggagcctcgg 34980
gcctgtgtcc tgcaggagga gcccgtggct ggtgcacaga cggacagggc caagctcttc 35040
atggtggccg tgaagcagga gttgagccaa gccaactttg ccaccttcac ccaggccctg 35100
caggactaca agggttccga tgacttcgcc gccctggccg cctgtctcgg ccccctcttt 35160
gctgaggacc ccaagaagca caacctgctc caaggtgccc tggcttgcag aggccaccca 35220
ccctgagggc agtgctgccg ccgcgtgtgg ggtgggggcc atctgggtcc aaggtggtct 35280
ctgttctcta gagaaaaagg ggcagatggg gacagacgcc ccttcctcta caggcttcta 35340
ccagtttgtg cggccccacc ataagcagca gtttgaggag gtctgtatcc agctgacagg 35400
acgaggctgt ggctatcggc ctgagcacag cattccccga aggcagcggg cacagccggt 35460
cctggacccc actggtaaat ggggccccag gtgggaccct cagactcctg cgtggaaggc 35520
agtgtgggcc agagtcctgg gctgcttggg gtgggcatcc tcgggccctg cttggccccg 35580
cctctctgtt cccctatggg agtgatgggg gcctccacct ccaccaccag caccagcagc 35640
accacctcca cctccacctc cacctccacc tccaccacca cctccacctc caccaccacc 35700
tcctccacca ccaccacctc caccaccacc accaccacca ccacctccac ctccaccacc 35760
tccacctcca ccaccaccac ctccacctcc accaccacca cctccacctc caccaccacc 35820
tccaccacca ccacctccac ctccaccacc acctccacca ccaccaccac caccaccacc 35880
accaccacca ccacctccac caccaccacc tgcaccacca cctccacctc caccaccacc 35940
accacctcca cctccaccag cagcagcatc acttgttggg gagaccctgt gcaactccat 36000
gcacagccct gtccctgcca tagccccgac ccctaagcac agccctgtcc aactgccaca 36060
cgtcccctgc ctcccatgca tggtcctggg gggtcaactg cacacgccag ggtcctaggg 36120
tcctagaccc ctgtcctccc tgtttctgcc tctgtttggg gtggagtcca agtctccaga 36180
ggcggaagca tctgtgttcg tgtgttaatg aacagcccct acagagttcc cctagttcac 36240
ccagggggga acctagcctg ttgggacgac cccagatccc ttctgggctt ggtactcact 36300
gggatatcct catgcctgca cccagcctac ggctctgagc tcctgagtgg ggctttggcc 36360
tgcccgccac tgttccagcc cccatccagc aggctggtgt ctcctctgat gcccccagca 36420
cccaggcgtg tacctgcctg ggttttcccg ccctggtctg aggtgggtga ggcctggcct 36480
ccctagccag ccctgccccc ccaccccagg gaactttcca gatgctctcg accagctttg 36540
tggctctaca tctcttcatc aggaagaacg gcgccggatc ccaagctgac cgtgtccacg 36600
gctgcagccc agcagctgga cccccaagag cacctgaacc agggcaggcc ccacctgtcg 36660
cccaggccac ccccaacagg tagctgactc ctgaaccgtg tgcagcctac gacttggtgg 36720
gtccctcagt ggcttcacga ggctaactct tgagtgtggc cggggctgcc cctgtgggga 36780
gccatctcat ggtggggact gctcccggtt ctgcaccccg cagttgtcct gagcagctct 36840
ccaggagttc ctggaggaag ggcgggcagg gcggtgggac tctcagtcct ccaccccagc 36900
gccactctga gccatgctac tcccacacca ggagaccctg gcagccaacc acagtggggg 36960
tctggagtgc ccagagcagg gaagcagggc cagcacgccg tgagcgccta cctggctgat 37020
gcccgcaggg ccctggggtc cgcgggctgt agccaactct tggcagcgct gacagcctat 37080
aagcaagacg acgacctcga caaggtgctg gctgtgttgg ccgccctgac cactgcaaag 37140
ccagaggact tccccctgct gcacagcaag tggccctggc gtggggaaca gccggtgggg 37200
tggggggcag gggacaaaat gggggctgtg ccgggtctga ttgaagctcc ccgcagggtt 37260
cagcatgttt gtgcgtccac accacaagca gcgcttctca cagacgtgca cagacctgac 37320
cggccggccc tacccgggca tggagccacc gggaccccag gaggagaggc ttgccgtgcc 37380
tcctgtgctt acccacaggg ctccccaacc aggtagggca cctgcctggc tgctcctggc 37440
agcgccccaa ccgcacgcag ccctgggagt gagcagcaaa gccccaggcc cccctcagac 37500
tcaagtctct gtctccaggc ccctcacggt ccgagaagac cgggaagacc cagagcaaga 37560
tctcgtcctt ccttagacag aggccagcag ggactgtggg ggcgggcggt gaggatgcag 37620
gtcccagcca gtcctcagga cctccccacg ggcctgcagc atctgagtgg ggtgagcctc 37680
atgggagaga catcgctggg cagcaggcca cgggagctcc gggcgggccc ctctcagcag 37740
gctgtgtgtg ccagggctgt ggggcagagg acgtggtgcc cttccagtgc cctgcctgtg 37800
acttccagcg ctgccaagcc tgctggcaac ggcaccttca ggttggtgcc tggccactac 37860
agttcctgct gggtgtagcc ccaggtgatg ggctgagggg gaaagggcag gcccttgtcc 37920
tggtggcaac gcctggcaga cgtgtgcagt gggccggttg tctcacaggc ctctaggatg 37980
tgcccagcct gccacaccgc ctccaggaag cagagcgtca tgcaggtctt ctggccagag 38040
ccccagtgag tgcccacgga ggcccccagc acacccaacg tggcttgatc acctgcctgt 38100
ccagctctgg tgggccaaga acccacccaa cagaataggc cagcccatgc cagccggctt 38160
ggcccgctgc aggcctcagg caggcggggc ccatggttgg tccctgcggt gggaccggat 38220
ctgggcctgc ctctgagaag ccctgagcta ccttggggtc tggggtgggt ttctgggaaa 38280
gtgcttcccc agaacttccc tggctcctgg cctgtgagtg gtgccacagg ggcaccccag 38340
ctgagcccct caccgggaag gaggagaccc ccgtgggcac gtgtccactt ttaatcaggg 38400
gacagggctc tctaataaag ctgctggcag tgcccaggac ggtg 38444
<210> 2
<211> 37214
<212> DNA
<213> mfascicularis
<220>
<221> misc_feature
<222> (4525)..(4624)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (4914)..(5013)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9472)..(9571)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (16613)..(17049)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (19812)..(19911)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (35806)..(36357)
<223> n is a, c, g, or t
<400> 2
atgcccaaga tagtcctgaa tggtgtgacc atagacttcc cattccagcc ctacaaatgc 60
caacaggagt acatgaccaa ggtcctggaa tgcctgcagc aggtagagca caggctggga 120
ggaaaggact gcaggcaggt ggagctgggg ctgggtgtgc gtccctctcc cgacccattc 180
cagccaggcc cctccagagg cagcctctgt cataaaaagg ctggtgttcc aggtggggtc 240
agagagagga ttgacaagta aaaacatcgt ccttgagagt gacagactta gtgccttggg 300
ggcctctgag gagcggctgg tattcacagg tcaggaggaa gcatttccat cagaggggca 360
gccgggggcc agcctcactt tgaaggtctt tgaacctttg gggtgcaggg aggtggcagc 420
ggcgcaggtt gccttctcct gggttccttg aggtgccctc ttgtacccgg ctcacacccc 480
tcccctcccc gagtttcccg ctcaggttcc catctgagag ctcgtatgta ggacatcaga 540
taggacagcg taagtgtttg gatctggaaa cacagaacag tttcctattt tgagacttga 600
tgcctaatta gtcatcttac tatttaggct gaaaaatact gttgcatttc gggtaacgtt 660
ctgcaaatgg tctgctgatg gcagctggag ttgcttcacg ccctttaggg caagagtgga 720
aagtgtcctg cggacttatc catggtcccg tggggctctc gccacctgac agcggcctct 780
gcatctgcga agagctgccc actggctgct gaggcttgtc tcagggtggt ttgtgtggcc 840
ttgcctcttc ctggcttccc cgtaaccctt gcccccaact ctgttcagaa ggtgaacggc 900
attctggaga gccccacggg cacggggaag acgctgtgcc tgctgtgtac cacgctggcc 960
tggcgagaac acctccgaga caccatctct gcccgcaaga ttgccgagag ggttcaaggg 1020
gagcttttcc cgaatcaggc cttgtcgtcc tggggcaacg ctgctgctgc tgctgaagat 1080
cccataggtg accctagttc ccaggccttc cctgacctcc tgtggggatg gctggcaagg 1140
gatggcgctg agggtagggt gggcccatgg ggacttctgc cagcagagct caaggagaat 1200
tttgtagctg ccacataatt tctcgccatc gtgggtataa acctagggtt gggctttttt 1260
gctgaattag ggcgtggcag gtgtacactt cgcccgtttg tgataaacga gtctctgggg 1320
tgtcagattc ttggctgtct gcagggctga gttagccgaa tgccacccgc ctttaacacg 1380
tgagaaccat gacctctgtg cttgcttgtg tctgggcagc ttgctacacg gatatcccaa 1440
agatcattta cgcctccagg acccactcgc aactcacgca ggtcatcaac gagcttcgga 1500
acacctccta ccggtgggtc agacgagttc acgcctgtct tggggtcctc gagagaacca 1560
gcttgacgtg gtgctgggtc cacagaccac gctgtgctgt agtggagggg gcggtctttc 1620
cagacgctcc ccagaagtat gcagtgtgct ggtgcccagg ggtggggcgg ggcccgggct 1680
gtccctagtg cccattactt gtgaggaggc agctttgcat ttgtgtgctg accttgggct 1740
ggcgtcctga gctcctttca ggtgctgttg tggcagctgt gtggcaggtc agggccggcc 1800
cccagtgcag ctttgcacat gaagtgggag gaggccctgc cgcttgtcag agccctgcag 1860
agtcttggtg ttctgtcggg ttcctgtgga ggggccgatg gcggggtgct gtggaagctg 1920
tcgaatctcg tccctctgtc cagttccccc gcttgtctcc ttgctccctc ctactcccgg 1980
gccacgatcc tatgccgggg ccactctcct gcacccggac cacgctccta cgcccaggcc 2040
actctcctac gcctggacca cattgcagtt atgctgactt cctctggctg ccagtgctcc 2100
tgtgtgtctc catacagctc acgctgcggg accacgctgt ggctgttgga ggcagctcct 2160
cctccaccca tagtgctctc tccctccagg cctaaggtgt gtgtgctggg ctcccgggag 2220
cagctgtgca tccatccaga ggtgaagaaa caagagagta accacatgca ggtgggctcc 2280
tggctcccgc tccggctcag ggttccgtga ggcgagtgct gctgggtatc cagagtccca 2340
ggctgtgctc ctgctgggct ggggttcgaa gttcactggg ggactgcagg cgagggcctg 2400
gtgggggtgg ggactggctc gggtcctttc ttggccatac tccagccgcg cactctgccc 2460
ttcctcccgc agatccactt gtgccgcaag aaggtggcaa gtcgctcctg tcatttctac 2520
aacaacgtgg aaggtacagg cagctcggtg ggaccaggct tgggttggag tgtgtgcagc 2580
ctctcagggc gtcagcctgg ttgtgcttgc cgggtggggc ggccagtgca gccgtgtacc 2640
tgggcactgt cttctgactc gggaccaccc gtgttagtct tctgtgtgga agagctcacc 2700
cagtggtctg agacagccag ccggccggac tgcctgtggc tggtgcctgg ggccttggat 2760
tttgggaagg ctccctccat ttccggacga gaagggctcc ctgcacctga ctactggtgc 2820
atacagcagc ggttttgctg aacacctgct ttgtcttcgg ggagcctgag gttttgttgc 2880
ttgcccagca gcgggtgctc ctgtgaccgg cccttgtacc atcttgggag ggtgtcctgg 2940
aagccgtgtc tggcctcccc cgaccttgcc gcatgtgtct ttgtcctgtg ctgacgttgc 3000
agagaaaaat tacagccccg agcgtgactc caggctgagt cctgtgggtc cgacacggga 3060
ggccttgggg cctcttcagg agacgggatg agtgagtgat gggagcagag ccagggcacc 3120
tcgccctgtg actgcaggtg gccacagcct gtgagggcca ggggtgcttc tccacccacg 3180
tggctgcccc tcgggtatgt caggggcttc tggggctctt cacgaggtct cagagacagt 3240
agcagggtgt gcccccgtcg gctgccctta cagtttctgt gacctgaggg tggcatctgt 3300
gcggttggca tggcctgagc ttctgtggga tcagagttcc ctttgtttcc tgcctcagtt 3360
ggggctcaag cctcaggtga cgtggccctg gagcacctgg aaggcgtcgg cggtcctgcg 3420
ggctgctgtc tgcactcgtg tttgctgagt gctcagtatg ccaggactga ggaccctgaa 3480
gctgctgtta tatttaggac ggttctcccc tggcagagac ggagccgggt ggtcccgcct 3540
gacccaccac caggcgtttc tgggccctgg agggacaggg tgggcggaac atgggcctgc 3600
agggagacct ccacttactg gaggctcgtg ctgtgttgct ggaggcatct tctgtgttgc 3660
ttcttgtttg ctgtgtcttt tgttctggtg gcaccaagga cctccagtca ccttgatgtg 3720
tggttgtcca ggcctttttg gtggtcctga gaaggggtct gaggggctct gcctctgccg 3780
ccaggttccc tgatggaagc tgcccactcg tcctggtggt gcccacagga cgtgactctg 3840
gcacaggagg gcagatgtgc tgttggagat tctcagcccg tcgtcgtcat ttccaaagtc 3900
ctcacccgca tttctgggac aggacaggag tgcctgctgg gtgtccccgg tcccatgcag 3960
cgggggtcct tgggatagtg tggaacgctg agtgtgggcc tgtccggcgg tggtcctgga 4020
caagggtagc acccctgtgg ccgccgggcc tggtgcctgg tgcctagcgg ggaggccgct 4080
gaccgcctcc tgtgctgctt ccatccgtgt caggcctctg ggtgttgggc ccccatctgt 4140
ctccccccag gcctgtggga tcagtccaag aagactcaat ccagccccag cctgtccccc 4200
ttggcttggg ctctcactgc ccgacctggc aggaggttgc ctagcggtga acctttgcat 4260
cctgtctgcc ccctggacag gctctgaggg ggtgtctgca acacctgtgc cagcctgggc 4320
atcttttttt tttttttttt cttttgagac gaaatctcgc tctgccgccc aggctggagt 4380
gcagtggcgt gatctcagct cactgcaagc tccacctccc gggttcacgc cattctcctg 4440
cctcagcctc ccgagtagtt gggactacag gtgcccgcca ccatgcccgg ctaatttttt 4500
gtattttttt tctttttttt tttgnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4560
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4620
nnnntttgag acggagtctc gctatgtcgc ccagggtgga gtgcagtggc cggatctcag 4680
ctcactgcaa gctccgcctc ccgggttttt acgccattct cctgcctcag cctcccgagt 4740
agccgggact acaggcgccc gccacctcgc ccggctagtt ttttgtattt tttagtagag 4800
acggggtttc actgtgttag ccaggatggt ctcgaactcc tgacctcgtg atccgcccgt 4860
ctcggcctcc caaagtgctg ggattacagg cttgagccac cgcgcccggc cttnnnnnnn 4920
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4980
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnttttgta tattttttta gtagagatgg 5040
ggtttcaccg tgttagccag gatggtctcg atgatctgac cgcgtgatcc gcccacctcg 5100
gcctcccaaa gtgctgggat tgcaggcttg agccaccgtg cccggccagc ctgggcatct 5160
ttagagtggg ctgcagctcc tggaggggtc tgagaggaag gaaggcaggt attttgtgaa 5220
tgaagagaca gctagagagc tggcaccctt cctggcctgc gtcctgtgag gactctggtt 5280
ggggacagca agcttggggt tagcctgggg cagagcctct gggaggcccc tgccccttgt 5340
cccccttccc cttgcagctc ctgtcctcgc cccgccctca gctctctgcc agggaaggtt 5400
tggcaagtgc cgctgtgcgg cagtgcgtgc tgattggctg gtcgttgcta tggtgccgct 5460
cagggatatg cttttcctcc cctgccttcc ctgctatccc tgggagcatc tggagttgag 5520
tcatcgctgg tgtgtgtgtg tgtgtgtgag tgtgtgtgtg agtgtgtgag tgtgtgtgtg 5580
cgtgtgtgtg tgtgtgtgtg agtgtgtgag tgtgtgtgtg tgagtgtgtg tgtgagtgtg 5640
tgtgtgtgtg agtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgagtgtg tgtgtgagtg 5700
tgtgtgtgtg tgtgtgtgtg tgagtgtgtg tgtgtgtgtg tgtgtcagtg tgtgtgtgtg 5760
tgtgtgtgtg tgtgtgagtg tgtgtgtgtg tgtgtgtgtg tgagtgtgtg tgtgagtgtg 5820
tgtgtgagtg tgtgtgtgag tgtgtgtgag tgtgtgtgag tgtgtgtgtg agtgtgtgtg 5880
agagtgtgtg tgagagtgtg tgtgagtgtg tgtgtgtgag tgtgtgtgtg agtgtgtgtg 5940
tgagagtgtg tgtgtgagtg tgtgtgtgtg tgtgagagtg tgtgtgtgtg agtgtgtgtg 6000
tgtgagtgtg tgtgtgtgtg tttgtgcccg tgtgcgcctc tggcctctgc agctgagtcc 6060
tggctctcag ggggcctggc acctcccggg gatgggcaca aagcagccac gatgcagccg 6120
ggagctgggg aaggccccat tgccccacac ggctgcccta agactctggg gtgcttcttg 6180
gaagaggtcc ttgcttctgt ctgtgtttaa gcagctccct aaggagttct tgtggttcca 6240
ggttgggggc ctgtgctgtg gaggcgaggg aggggcagga cccccaactc cctgaagcct 6300
tttctggcct ggtcctctca gccagcatag gcagggccct ttcccagggc tgccatgctg 6360
cagaggggag cgggccacta tgtagcctag gaaaacctga cgttccttcc gctggcagtt 6420
ctgggcctgt tgtggttggc agggaagctg agccacggtg ctcatcacag gggcacctcc 6480
aggatttttg ggagatgcct ccgtgggctg gggcgatacg ctgaggagct gttcttccct 6540
gccctgagga gggctgagtg tagccgtcac ccctgtcctg tcttgggctg tctcagggag 6600
gatgcataga accctcggaa ccctgctggc ccttgtctga tccaccctca acctcaggcc 6660
ttctaggggc acaggagggc tccgtcggga tcactgcggg tgggggcctc ccttggacac 6720
ctgagaccct caatgggtgc tttgtggcac gttcatgatt ggggcggggg gcacccagcc 6780
ctgcctgccg tgtaggagct gttctgtcct gggcgtccct ctgtggttgg gacccggagg 6840
gtgtgtgttt accccgcctc acacctgcag agaaaggcct ggagcaggag ttggccagcc 6900
ccatcctgga catcgaggac ttggtcaaga gcggaagcaa gcacaggtga gacccctcag 6960
tgaggccacg accactgtcc ttccatggcc cagctctcct gtgacctgtg gaggcccaga 7020
tatgtttctt cccttttctt tgttcctttc taagtcgtga aactaaccac cgtttagtgt 7080
gagaaagttg aagcagctct gaggaacgta gagtaaaaag cgaaaccgcc tccctcttcc 7140
ctggccgtca gccaccccag gagccaccgt ggagcgggga cagagccctg caggctcgtg 7200
tctgtgtgga agcacgcacg gttttgtctg cacagactgt tctgcagttt gccgttttca 7260
ctcagcgttg tgggtagctt cgcatgctgg tgctggtcgt ccggcttcgt tcttctgagg 7320
acagcaaata tgtcctttgt ccacctcttt tatagtttca gagattcaag ttataataaa 7380
gcttttctta tattgagggg gagagctcct gcccctcttt ttttttttag acagagtctc 7440
gctctgctgt ccaggctgga gtgcagcgtc gtgatcttgg ctcactgcag tctcaacctc 7500
ccaggctcaa gtgattctct cagctcagcc tcccaagtag ctgggactgc aggcatgcac 7560
caccacgcct ggttaatttt tgtatttttt gtacggacaa ggtctcactc tgttgctcag 7620
tccagtcttg aactcctgag ctcaagagtt ccacccgcct cggcctccca aagttctggg 7680
attccaggcg tgagcaccac gcccgaccca gctctgcttt gttttagtgg ttctgtttgt 7740
gtttgtttct gatgacctct atccaggaat agggttggtt tttcttttcc atggagtttt 7800
taaagagatg atgatttaca tggtttaaaa ctcatgtgga ctccccgtcc atcccagaca 7860
gcggcttccc acctggaccc catgctcagg attagggctc cttccgggtc agaagatgtg 7920
gcggccccgg cctcgggtca ccgtcccctg cacggggtgc tcacagcatc ttcccctctc 7980
ctcgttccca gggtgtgccc ttactacctg tcccggaacc tgaagcagca agccgacatc 8040
gtcttcatgc cgtacaatta cttgttggat gccaaggtgg gggctcagtc tgcgtcgctg 8100
acaactcctg atgtccaggg gggttcctgg gcttgggaaa ggccgtccga gcctttgctg 8160
ctgcagggac ttagagcagc aggcctgggt gggagagctc acctgtcact gggcaggggc 8220
tcaacctggc cagacacact tgtgagcacc cccaggccct gggtcagttg ttctgagcaa 8280
tctgggagtg ggcaggctgg tgggagtgag gagaggcctc caggctgtgg tccacaggcc 8340
agcgcccact cttgatcctg acagctcagg ttctctcctt cacgtccgat cacaggaagc 8400
aaagcactga gaacacggga agcccactca ctcccctcct cccagcccca cactcactcc 8460
cccccatgcc cggccccaca ctcacttccc tcctcgtagc ctgtactcac ccacatgctg 8520
ttgtgcccca cactttttat ttagtgcagg tggcatctcg ccgcgggtca gtgacttgtg 8580
ttcacgtggc gatgacgtgg tgacgcttcc agatccctcc attggtttgc tcattctcag 8640
ggtgtatatt tatcaagagc ccatcgtgct gggggctgtt ctaggcatag caagactggc 8700
ttcattcatg tggagctttg attctagcgg tggggacagg tagacagcag aagagtaagc 8760
ccgtgagccg atgagactga agagaagtag agcagagcga ggaggtggag acagagccga 8820
gtgggcaggg cccaagtgcg atgtcggcag gagatgggga atgctgatgt gtctgagggg 8880
agcccgagct ggtgcagcag agcaagggag gaggcggggg gccgactcct gggcagcgat 8940
tgtagaaccc cacggagagc tggtgaggtt tgccgtggtt gcaggtgact cggtgctttg 9000
agccgtggct gcccctggga accacctgga gagcttctaa cccaaccagg cccttccctg 9060
ggacaattct gtcacagctg gtaagctaag tccaacactt tcacggaaac acagaagatc 9120
taaaacggca cgatgaccgt gaagaacaga gctggaggac tcacctcact ggtttcaaga 9180
ctcctctaaa actgcaggag tggaggtgga gacggctcag ctcaggcaca agcctgcagg 9240
ccatggagaa ggcagcaagc tccagctgac ccacacgctt gcggtcattg tttttttttt 9300
ttagttggaa tctccctctg tcaccccagt tggactgcag tggcaccatc tcggctcact 9360
gcagccccca cctcctgggt tcaagcgatt ctcccacatc agcctcccga gtcactggga 9420
ttacaggcgt gcgccaccac gccctgcccg tgatgattgt tttttttttt tnnnnnnnnn 9480
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 9540
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nttttgagac agagtctcgc tgtgtcgccc 9600
agggtggagt gcagtggccg gatctcagct cactgcaagc tctgcctccc gggtttttac 9660
gccattctcc tgcctcagcc tcccgagtgg ccgggactac aggcacccac cacctcgccc 9720
ggctagtttt ttgtattttt tagtagagac ggggtttcac cgtgttagcc aggatggtct 9780
cgaactcctg acctcgtgat ccgcccgtct cggcctccca aagtgctggg attacaggct 9840
tgagccaccg cgcccggccg atgattgttt tttgacaaat gcgccaatgt aattgagaga 9900
ggaaatgaag gttgattttt ggttttctga aaaagtggtg ctaagaacag ctggatatct 9960
gtttggaaaa cagcgaatct taactcttgc tttactctat ataaacctaa atgtaaaagc 10020
taaactaaag gttatagaaa gaaacatggg ggggtctttg caactctggg gtaggcagag 10080
attccttagt gtggatacat aaggcactag ccgtgaagaa aaacataaaa tttggatttc 10140
accaaaattt aaagcttcaa cacttgagaa gacttgagaa aattaaagag cagttatgga 10200
aagggagaaa atgcttctgt ctttcagagg acttaaaaaa catttttcag ccctcctcat 10260
attttaaagg acctttgacc agagtatgta aaattctctc ataactaagc aaaaaaccca 10320
tttaaccagt gggaaaggat ctgcacagac gtttcaccaa gatggacgga gtggccagtt 10380
gggcacatgg aaggacgccc agcatctcca gtcacaggag aaggcagatt aaagccacgg 10440
ggagccggca ctacggtccc gctagcatgc tgaaattcag aagcctgagt gtggcacgag 10500
gaggtggaac agctggatct catccattgc tcctaagctg tgaagctgtg tagccactcc 10560
acaaacacgt gtggcgaaca gccgaaccgg gagaagggaa gacgtgttca aagatttgtg 10620
tgtggccagg ctcagtggct cacacctgta atcccagaac tttaggggcc aaggctcagg 10680
gatcgcttac gcccaggagt ctgagaccag cctgggcaac atagggagac cccatctcaa 10740
aaaaaaagaa aaaagaaaaa aaaagactta aatgtgcaag tttaccagag ctttgtttaa 10800
gttgccagaa ctgggaagcc gcccacgtga gtccatccac tggtgaacgg acaaaccgtg 10860
gttcgcaaac cccaacagca gccgcgggca tgggctgtgg tcacacagca gcagggagcc 10920
agtgagtctc agatgtgcta acccagaggc caactgagga ggacctactg ttttttgttt 10980
tttgattttt gttttgagac agagtcttgc tctgtggtgc aggctggagt gcagtggtgt 11040
ggtctcggct cactgcagcc tctgcctctc gggttcaagc agttctcctg cctcagcctt 11100
ccgagtatct gggactacag gcacccgcca ccacacccgg ctaatttttg tatttttagt 11160
agagacggca tttcgccatg ttggccaggc tggtttcaaa ctcctgacct tgtgatccac 11220
tcaccttggc ctcccaaagt gctgggatta caggcgtgag ccaccgcacc cagctggacc 11280
tactgtttta ttccgtttat atgacgctgt attaatagaa gaggcagggg tagagctggt 11340
ggttatgtgg tgcacttaac tgccagaact cagtaccctt aaaatgggca tcttaatgtg 11400
tgaaaactta aaagtaccaa agctggaccc caccccagct tgctcccatg acactctgtg 11460
gtgggacctg ggagttgggg tttttttttt tttttttcag atggagtctc actctgttgc 11520
ccaggctgga gtgcagtggt gcaatcttgg ctcactgcaa cctctgcctc ccagattaaa 11580
gcgattctcc tgcctcagcc ttctgagtag ctggggttac aggcgcacac caccacgccc 11640
ggctaatttt tgtgttttta gtagagatgg ggtttcacca tgttggtcag gctggtctcg 11700
aactcctgac ctcatgatcc acccgcctcg gcctcccaca gtgctgggat tacaggtggg 11760
agccaccgcg cccggcctgg agttgggttt gtaaatctcc ctgagtgggg ccggggcaga 11820
gaactgctgg gtctgggtct tcctggctcc tgtggtctgt ggctggctga ctgcggtggc 11880
cgggggctcc caggacgtcg tggccgtccg tcttgctgag cgtggcgcgt gcctttccat 11940
gctgtgcgtg agcgtctccc ggcgtggcga gctgctgctt cgggtggggc ggtgttgcca 12000
ggttgccatc cagatctggc ctctcctctc cacgtcgccg gcggtgtttg tcatcggcac 12060
ttgcgatgtt cgatgccggc cacatgtgcc ttggtttccc tccttcctgc ccctgtgagc 12120
tccagcaccg tgtcccttct cttcctcctg tagagccgca gagcacacag cattgacctg 12180
aaggggacgg tcgtgatctt tgacgaagct cacaatgtgg tgagtctcca ctgcctccta 12240
aacgcctcct gtttcttcaa gagcagcgca aacctttctg gaggggctct ggccaaaccc 12300
ttgcagcctt cggtgcccag gactgaggac tgagcacccc aggagcttct gcaccccttc 12360
ccactctgat ccgatgcctc tgctggggct ggagactggc cagctgggcc agggacctgc 12420
ccctcaggcg cagggccccc acaggccgct ccccaggcct tccctctagc cagctagggg 12480
tcagcctggg ccaggggtgt ctcctctgcc ctcggcttct gtcaccaggg cagcagcagg 12540
cgtgtggtct cgcctgcagt gtctctgccc ttccggccac atggcctgag gctgaggcag 12600
aattgcttga accctggagg tggaggctgc ggtgagccag gatcacaccg ctgcactcca 12660
gcctgggtga cagagcggga ttctgtgtca aaaaaaaaaa aaatgttgac tgggcgcagt 12720
aggtcatgcc tataatccca gcactttggg aggccgaggc gggcggatca tgaagtcaag 12780
agatcaagac tatcctggcc aacatagtga aaccccattt ctactaaaaa tacaaaaata 12840
ttagctgggc gtggtggtgg gtgcctatag tcccagctac tcaggaggct gaggcaggag 12900
aattgctcga acccgggagg tggaggttgt agtgagccaa gatcacacta ttgcactcta 12960
gcctggtgac agcgagactc cgtctcaaaa aaaaaaaaaa aaaaaaaatt ggcaactcca 13020
ttgaaataat tgtttgtttg tgttttgaga cagggtctca ttctgtcgtc caggctggag 13080
ttcagtggtg tgatcttggt ccactgcaac ctccacctcc tgggctcaag ccatcctcct 13140
acttcatcct cccaagtaac caggactaca ggtgcacacc accacgcctg gctaattttt 13200
gtattttttg tagagatggg gttttgcatc attgcccagg ctggttttga actcctgagc 13260
tcaagtgatc tgtccacctc agcctcccaa agtgctggga tcacaggtgt gagccgctgc 13320
gcctggcctg aaataatcgt ttctcaatat tggtgtgggc cagacagtcg tgtttggacc 13380
tgcttgtggc ctggccttag agaccccagg gcgtggcttt ggggacttgg ctgtcagcct 13440
cctgtgcctt ctgcacccaa ccccattcct gctttctgga acccccgatc ctatcctgct 13500
ctgtggtgat ccgggtgatt tgggctcccg atcctatcct gctctgtggt gatccgtgtg 13560
attcgggctc ctgatcctat cctgctcggt ggtgatcccg gtgattcggg cccccgatcc 13620
tatcctgctc tgtggtgatc cgggtgattc gggctcctga tcctatcccg ctctgtggtg 13680
atctgggtga ttcaggctcc cgatcctgtc ctgctctgtg gtgatccggg tgattcaggc 13740
tcctgatcct atcctgctct gtggtgatcc cggtgattcg ggcccccaat cctatcctgc 13800
tctgtggtga tcccggtgat tccggctccc gatcctgtcc tgctgtgtgg tgatcccggt 13860
gattcgggcc cccaatccta tcccgctctg tggtggtccg ggtgatttgg gctcctgatc 13920
ctgtcctgct ctgtggtgat ccgtgtgatt caggctcctg atcctgtcct gctcggtggt 13980
gatcccagtg attcgggccc ccgatcctat cctgctctgt ggtgatccgt gtgattcggg 14040
ctcctgatcc tatcctgctc tgtggcgatc ccggtgattt gggctcccga tcctatcctg 14100
ctctgtggtg atctgggtgt gctcggactc caggagaaga tgtgtgaaga atcagcgtcc 14160
tttgacctga ccccccatga cctggcttca ggactggacg tcatagacca ggtgctggag 14220
gagcagacca agactgtgca gctgggcgag ccccacccgg agttcagcac agactccccc 14280
agcccaggtg cgttcatagc caggctgctc ggtcctgagg cctgcgctgc tgcagggggc 14340
agcctgccct gtggctgtgt gtggtcggcc tgggcactgt ctgttcaggc tggcactgca 14400
gggcacccac ttctctcaga ggcttctcgg gtgtgaattg tttggggtcc tgtaggctgt 14460
ggaagggctg gtatcgttca gtagttctgg tattttccga agacctatgt cttctcccag 14520
ccagtgtcaa cttggcctct actgtgtaaa attagagaac tatactttgt gaagctgaga 14580
tgggagcatc gcttgaggcc aggagttcga gaccagcctg ggcaacatag cgaaacctcg 14640
cctctgccaa aaaattagcc aggtgtggtg gtatggtcct gtggtcctgt ggtcagagct 14700
tttctggagg ctgaagtggg aggagctctt gagcccggga ggcagagctt gccccagatg 14760
gctccactgt actccagcct gggtgacaga gtgaggctgt ctccaaaaaa aaaaaaaaaa 14820
aaagtaaaac taactatatt cactgtaagg gcattttgcg tgtttaaatg acccacacat 14880
cgggcctgca tcacttgctg tgcccgtaga ttccttccca gtgttcgtcc agaggcgtat 14940
ttccacacag cgctagtcac ggcgtacgtg gaaaacgcgg aaacccccat ggatgtggtc 15000
ggttggtctg tactgtctgt gttttcttcc tttctttttt tttttgagat ggagttccac 15060
tcttgttgcc caggctggag tgcaatggtg cgatcttggc tcaccgcaac ttcctcctcc 15120
caggttcaag tgattctcct gcttcagcct cccaagtacc tgggactaca ggcgcgcgcc 15180
accacgccca gctaattttg tatttttagc agagtcaggg tttctccatg ttggccaggc 15240
tggtctcaaa ctccaggtga tccgcccacc tcggcctcct gaagtgctgg gatccaggcg 15300
tgagccgccg cgcccggcct gtgtcgtgtt ttctgcgtgg cctctgtaaa cagctgacta 15360
ggagtctgtg agcatcttca ttggttccgc tgtgacttgc gtgtgagcat ctccagcatc 15420
agctttcctc attttccttt aaaatcgcac atgtggatgg acaccatggg gaccctggac 15480
cctgggcagc ctcgtcctca cctttctcac cagggtggct gcttgggaga gagtgagttt 15540
gcgaacttgg catttgttct ggctgtagga tccgtttata tatatacata tatttaagtg 15600
acagggtctg actctgttgc ccaggctgga atgcggtggc gtgatcttag ctccctgtag 15660
cctcagcctc ctgggctcgt ggggtcttcc cgtctcagcc tcttaaagca ccgggaccgc 15720
aggcggtcgc cactgccatc ggatctcaag gctgccacgc agggcgctgc agtaggggaa 15780
ggggttcctg ggactttgaa cgctccacct ccctcttctc cacagtcccc caaccccacc 15840
tctaactggg agtggatggc cacctctttc catcctttgc ctggcgcagg gtggggagaa 15900
tgacaggtct ccttcccgca tctcggcagc tgccctttcg tcggttatat gacgtgggag 15960
agaccccggc cacccccagg gctgtgtgac gtgggagaga ccccggccac ccccagggct 16020
gtgaacaccg ccacaggggc cttctccact cttcagtttt gttagttacg tgacgtgcag 16080
ggcttttcgt tgtaactagt gggggacgtg tggtgagggg ggcttctgcc gtctcattca 16140
ggaccggaac ttcagttttc atcgctattt gtcctcctac gcctttggag atggggtctc 16200
gctctgttac ccaggctgga gagcagtggt gccatcaggg ctcacggcag cctcctcctc 16260
ctgcagcctc cgcctcttgg gctcacacaa tcctcctgcc tcggcctccc aaactcctgg 16320
gacgactaca gacgtgcgcc accgtgcttg gcagggttca ttcttttcct cacactttat 16380
ttattggaga gcccggtaga gcgcccggtt tgcacgatct ggttgttgag acgttgagag 16440
gaaccctgcg gagtctgaat ctgggtatgg gaggggcagt cacacgagtt ccccggtgtc 16500
ctcgtctcct ccgcacttag gtgcccttag gtggcttgag gaccccagtt agactggggc 16560
caccctttgc ctggctccag gcgggatgtc ctttcttttt tttttttttt ttnnnnnnnn 16620
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16680
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16740
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16800
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16860
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16920
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16980
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17040
nnnnnnnnnc tgggactaca ggcgcccgcc acctcgcccg gctagttttt tgtatttttt 17100
agtagagacg gggtttcacc gtgtcagcca ggatggtctc gatctcctga cctcgtgatc 17160
cgcccgcctc ggcctcccaa agtgctggga ttacaggctt gagccaccgc gcccggccgg 17220
gatgtccttt ctatcaggag gctcacagta tctgctttcc agtttcttct gatgttaatg 17280
ttgttgctgc tgaacacctg actctgttga ttattggggg attgcaagat ggtagtgtcc 17340
caattctgtc gcttagtcag ttagcaggaa taatctagca ccatgctctg catcgcatca 17400
gccgtgtggt gatcccattc acacaggaaa ggcgggataa atgctggctg tgggccgggt 17460
gtgctgtccc gcatctgtaa tcccagcact ttgggaggcc agggcggtcg gatcacgagg 17520
tcagagattg agaccatcct ggccaacatg gtgaaacccc gtctctacta aaaatacaaa 17580
aaaaaaccca aaacatgagt gggctgtggt ggcgcgtgct tgtaatccca gctaccgggg 17640
agactgaggc aggagaatca cttgaacccg gggggcggag gttgcagaga gctgagatcg 17700
cgccactgca ctccagcctc acaacaaagc gagactctgt ctcagtaatc aatcagtcaa 17760
tcaatcagac gtcatcagtg aatgtacgtg agcgtgtagg gattggtcct gctccgcgcg 17820
ccaccctcaa tctcacttct gacctccgtt ctccacctcg aggtgttttc atgtgggccc 17880
gtgtgtcctg accccagcag ttgtggcctc tttgctgtct gggagtcagg atttttcaca 17940
ctcatgtcct gctccagacc tggaatcagc caagtctcca agaagctctg gtttcttttc 18000
ctgcaaggtg gtatttcagg acccacgatg cggcaacagg ctggtcatgg ttactgggtt 18060
ggtcattgtt actgggtgtt tttgtggaga tacatccata cgcacagatg tgttcacaaa 18120
tgttaactct gaaggtaaac cacccggctg ggcacaaggg ctcaccggta atcccagcac 18180
tttgggagac cgagacagtt ggatgacctg aggtcgggag tttaagacca gcctgggcaa 18240
catggtgaaa ccccatctct actaaaaacg caaaaattag ccaggtgtgg tggcacacgc 18300
cggtagtccc agctagttgg gagacagaca tgctggaacc tgggacacgg aggttgcaga 18360
gagcagagat agtgccgctg caccccagcc tgggtgatag ggtgacaccc tgtctccaaa 18420
ataaatagat aaataaaggg aaaacgcctc ctcttggtgt ctccagtttg gactggctgg 18480
catgggttcc ggtagcctct tcccccatgg tggcgtcctt ttttccatgc cgggaatcct 18540
ggttctcaag ggcggggttg ttggtctgag tgtgacacag actgtgcctt tgctgccttt 18600
ctcttgccca gggctgaaca tggagctgga agacattgca aagctgaaga gtaagtgctg 18660
ccctccccac cttcttgcgg ctgggtgggg cctccccctg atgcctcctc aacccgacct 18720
gcagtgatcc tgctccgcct ggagggggcc atcgatgcca ttgagctgcc tggagacgac 18780
agcggtgtca ccaagccagg gaggtgagag gcggggagcc agctgcttca ctggaggccc 18840
agcctggagc tagagatagg ccatggtgca gtcctaggct gtcccaccag tgaggcctgt 18900
tttcaggccc gttttccctt tttgagacct ggtaggagca cctggtttgc atgatctggt 18960
tgttgagacg ttgagaggaa gagcacacgc atccacggaa cagcacacgc atccacggaa 19020
cagcacacgc atccacggaa cagcacacac tcccacggaa cagcacacgc atccacggaa 19080
cagcacccac tcccacggaa cagcacacac acccacggaa cagcacatgc ttccacggaa 19140
cagcacatgc ttccacggaa cagcacaccc ccacggaacg gcacccacgg aacagcacgc 19200
acgcccccac agaacagcac acacccccac agaacagcac ccacgccccc acggaacagc 19260
acacacaccc acggaacagc acacacgccc ccacagaaca gcacacaccc ccacggaaca 19320
gcacacgcac ccatggaaca gcacccacgg aacagcacac actcccacgg aacagcacac 19380
gcccccacgg aacagcacac acacccacgg aacagcacac actcccacgg aacagtacac 19440
gcatccacgg aacagcacac acgcccacgg aacagcacac gcatccacgg aacagcacac 19500
actcccatgg aacagcacac gcatccacag aacagcacac acactcccac ggaacagcac 19560
acaacagcac acactcccac ggaacagcac acgcccccac ggaacagcac acacacccac 19620
ggaacagcac acactcccac ggaacagcac acgcccccac ggaacagcac acacacccac 19680
ggaacagcac acacgccccc acagaacagc acacaccccc acggaacagc acacgcaccc 19740
atggaacagc acccacggaa cagcacacac tcccacggaa cagcacacgc acccacggaa 19800
cagcacacac annnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19860
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn ngcacccacg 19920
gaacagcacg cacgccccca cagaacagca cacaccccca cagaacagca cccacgcccc 19980
cacggaacag cacacacacc cacggaacag cacacacgcc cccacagaac agcacacacc 20040
cccacggaac agcacacgca cccatggaac agcacccacg gaacagcaca cactcccacg 20100
gaacagcaca cgcccccacg gaacagcaca cactcccacg gaacagcaca cgcccccacg 20160
gaacagcaca cacacccacg gaacagcaca cactcccacg gaacagtaca cgcatccacg 20220
gaacagcaca cacgcccacg gaacagcaca cgcatccacg gaacagcaca cactcccatg 20280
gaacagcaca cgcatccaca gaacagcaca cacactccca cggaacagca cacactccca 20340
tggaacagca cacacacacc cacggaacag cacacacgcc cacggaacag cacacactcc 20400
cacggaacag cacacacatc cacggaacag cacccacgga acagcaccca cgcccgcatg 20460
gaacagcacc cacggaacaa cacacacccc cacggaacag cacacacccc cacggaacaa 20520
cacacactcc cacggaacaa cacacacccc cacggaacaa cacacacccc cacggaacag 20580
cacacacacc cacggaacaa cacacactcc cacggaacaa cacacacccc cacggaacaa 20640
cacacacccc cacggaacag cacacacacc cccacggaac aacacacacc cccacggaac 20700
agcacacact cccatggaac agcacacaca cccacggaac agcacacaca cacccacgga 20760
acagcacaca cacgcccacg gaacagcaca cacccccacg gaacagcaca cacccccacg 20820
gaacagcaca cacccccacg gaacagcaca cacacgccca cggaacagca cacacgccca 20880
tgcggggccg ctgggtttcc tgcagtttgt cctcctccag gcctttccct ggacctcctc 20940
aggtgcctgt tagaatgaga ccttcttgtt aggacgatga gtgtcccagc caccacctct 21000
tttggactcc gggaggcccg gaacattctg aaggctccgt gggtctcctg tcttctccgc 21060
ggccagggca gcagcatttg ttgtctgtcc tgcaggcaga tgagggtcag gcctggggcc 21120
cgtgtggggc tccactgagt gcacagccgc caaggcgagc gcgttctgcc tgagcgctga 21180
ccttgtggcg actcccagtt gcttccaggt ggagccagtg tcctcagcgt aatgctcaag 21240
gctctggcgt ggctcctcgg ccacctgcac ccccaggggc ccctcctgta gcttctgctg 21300
ccgccatcac tgtcactctc ccaaggcttt ggggactctg cccagagccg ctgcctccca 21360
gaagcccctg acgacccccc ggcgacccca tccctccctc tgatgacggc ctctgccccg 21420
aggcggcttt tccttggtgc tgttcttgtg ccggccaggc ctccacttcc catctggagg 21480
ctcctgaggg cggaggcctc tcacccccaa tgccggcgtc ccctggaggg ctcagtttgt 21540
ttccgaggga aggaaacttc cacagttgct gccttcagtt cccaaagctg cagcctgatc 21600
ccccgtccag gctcgagcct gccttcttct cctcgcagct acatctttga gctgtttgct 21660
gaagcccgga tcacgtttca gaccaagggc tgcatcctgg actcgctgga ccagatcatc 21720
cagcacctgg ccggacgtga gtgccggggc ggggtccttg gtgtgggcag acgtggcgta 21780
gggggtgcag caggcctcca tcctggcagt cagggctcgc ctggccatca cctggccgtc 21840
agcaggaaca ggctcacaga acctcacctg gtcggggcgt ggaggcgtta gtgccggttg 21900
cccactgccg tagagcctgt cccagttctg cagctggcgg cttcgtcctg cagactcatc 21960
ccattattcc ccttttaagg aagagcagcc caaggccctg gctgggttgt ggggcctcag 22020
gcttctccac acaccctgag ttctgcttct cagagctgtg gggtccagag gctttgccca 22080
gaggcagtgt cgtcatgggc tgctctggtt tgagatgccg gcccgccggg gcctctgctg 22140
tgctcccagg tgctggggag ggcggctctt gctgcttcaa accttaggtg accatagagc 22200
ctcttttcaa gttccaccgg cccccttgga gacgctgtcc ctgcctggct gctctcctgg 22260
ctgctgggaa gggcaggcga gctgcccgcc ctgagtggac actgcgctcc accctgggcc 22320
ccccgttggg caggagatgg agcttggcag tcgggctgag ctggcttatg gctggaaggg 22380
cgggggctgg ggtcggggcc tcccctgcct gcagtgcggg tgtcagcgcc cggcatgcta 22440
cctccccagg tgctggagtg ttcaccaaca cggccggact gcagaagctg gcggacatca 22500
tccaggtggg gcctgctcct ctggcgtctc cttccctgat ggaagccggg cgggtgcctt 22560
ctcctgctgt attagttact gactctagac gtgggggtgg gagaacggcc cccacaccac 22620
ctgtttccga ctggcaaacg cttggctcct ttcctgtgac ccaaacccac actgggcctc 22680
ccgcggggat gggggaggac gaggtctggt ggcccgtgcc cagggtgacg ctggtggggg 22740
aggacgtgaa ggggagtggg ggccagggag ccgctcctgc cctgtccggg ccctcaggcc 22800
ggggggaccc actcctggca gccccagcta cacgcagatg aagagctctg gacacacgta 22860
gcttcctgaa cagcttctcc agggacagac aaacggggac cctgcaggtt gccggcgggg 22920
gtgtccctgc gagcccatga tgggggatgc ggccccggcc cccttcttgg ccccgtcctg 22980
ccctgtgatg cccgtcccct cccatgtgag gttgctcctg gctctgtgcc tgtggcagca 23040
cctgctttcc ctgaggcaga cgggcttgtg cggtttgtgg agggcaagcc ccatttttgg 23100
gtgctctggg cacacacttg cctctcctgg acctcggtgc attttttaga agcagaccca 23160
caagtccctg actgggaggc catcagtcct tggggaaacc gaggcacagg tggctgtgtg 23220
gagccatgtg aggctgcctc tgtgctgccc acactgaacc tcctggccac acgaggtcat 23280
ggcagggtta ggtggggctg cccagctctg tgacaacttc gtgagtgtcc gcctggggtg 23340
gggggtgctt gagctggggg aggccgcaga agaaccctgg aatgtaccgc cggcctgtgc 23400
atgcagtgcg gtgctctgtg catgctactg ggcgtggagc tgcaggcccc aggacgacca 23460
ggcactgcct tcttcataga cgtggctctg agcaggggcg agacctgggc agggaccagg 23520
tggggtgggc acagcaggtg gtagggccca ggctcagccc tacctccacc gtggccttct 23580
ctgcggccag tgatgccaca gccagtgtct tctctgtgtg gcagctgggg ctggaaagac 23640
ggcactgcta tgtctcccag ctcctcccca aaagcacggt gggcatccca gggccagacc 23700
cctctctctg tggctcctgc ctgccaaggg ctgctttgcc gtcccgcctg gagcgtggtt 23760
ggctcttcaa gcaggaggcc gtgcacctgc caggcggacc tgcttccatg tcctgacggg 23820
tcactcaaag cacctccagc acatggccat cgaggcagcc ctgcagccca gggcctggag 23880
ggcaggtgtg agctggcccg ggcctgcccc tccctggaat gtggcttccc aggctccagt 23940
atggagcagt gtccacactc tggaaccaaa tcttgttcac cccattggtt tggaatttcc 24000
tttggctgct gctctaagta gccactggga gatgactcag ctcctcccaa ccctggggac 24060
tgcacaccgt gttcaccctc ggctgctcct gagtccctgc aggtgtgggc actgctcata 24120
gggctgctgc tgggctggac ttgcagccct gaggcacagg tgaccctggg gacagagtgg 24180
ggctagagtg gggctagtgg ccccaggaag aggatgtggg atgcacggtt cagttggagg 24240
caagtccggg cagggccagg ctgtgtgctg gggaggtaga gcttagctgg aggcaaactc 24300
tgggcagtgc tggcccgtgc tgggcagcca gtcaccgctg ggcccctgtg agactagtgg 24360
gtcccctttc ttctctgcct gagctgccct ggggctgaag cacggggcgg tttgtagtgg 24420
tgtttttttg agacagggtc tcgctctgtc accccagcgg gagtgcaggg ccttgtcacc 24480
agctcactgc agcctcagcc tcctgggccc aggccatcct cttgcctcag ccacctgagt 24540
agctgggaac acaggcgtgc accaccacgc ccggctaatt ttaaaagctt ttttgtggag 24600
atggggtctt ggcgtgcacc accacgctcg gctaattttt taaattttta tgtggagatg 24660
ggtcttgcca tgttgcccag gctggtctca aagtcctggg ctccggcagt ctgcccacct 24720
tggcctccca cagtgctggg attacaggta agagcttcca ggcctgccca tcagagggct 24780
ggctttttga gggaagctgt ttcctgaggc agcctcagcc cctgctcatg gcagcccctg 24840
gtgtcatggt gaatttgttc tgttgtttcc atccctgtgg gccaaatgct ttggtaaaac 24900
gcaaggcctt gtatttagct gtcttgacag tgaaaatggc tgggaaggaa ggaaggaagg 24960
aatggaagga agtttctctc tcccgtgcat acccaggcac gtgcacacgt gcgcagtcca 25020
cgcacgctgc cggtctctgt cccagccgcg gtgccggccc ccgtgttctc cagttcagct 25080
tctccgcatt tctgtgaacg attccggctt cttgatgttc ccagcagaac tccctcaagc 25140
cttcggcttc tccagggctc tgacggcggc tgggctgacg tggccgctct gcggagcctg 25200
ttggggcttc acgttcctgt tctggccatt tccggctctt tttccgggaa gggtcatcac 25260
gcgctctttt cctagtgcag gcatcgtccc tttcccgttg atttgcaggg ttctctgtaa 25320
gatctgagga acacgtgcca acatattctt tcctggtctc gtgctggtca ttttttccat 25380
tttcacgaca ggtttggtga acagatgttt ccttgtcatc agacttttgt cttgagcttg 25440
tatcccccga ccaagatgct aaactgggtc ttgtgtgttc tccaaactgc actgtagggt 25500
ggcggagctt tgtgtcgggg cctccgcacc ttccggcgtc acctgtgggg gtgtgaaagg 25560
cagactctac ctggattttt cccagcacgc cacaccggtg gttccgtctg ctgaccgagt 25620
ggctcggctt ctcccaactc cgctgggcac ctgccacact gttttcctca cggttttgtt 25680
cgtggtggtt ttgtcgtaag tcctggtgtc ggccagaacc aatttctgtt tttgtttgtt 25740
tttgagatgg agtttcgctc ttgtcgccca gggtggagtg cagtggtacg atcttggctc 25800
actgtaacct ccgcctcctg ggttcaaatg attctcctgc ctcagcctcc tgagtagctg 25860
ggattacagg tgcttgccac cacgcccagc taattttcat atttttagta gagacggggt 25920
tttgccgtgt gggccaggct ggtctcgaac ccctgacctc aggtgatcct ctcgcctcag 25980
cctcccagag tgctgggatt acaggtgtga gccgccgcgc ccggcctctt gttcttctta 26040
aacctgccct gatgttttct ccatgatgca tgttggagtc aacctgtctg cttcctttaa 26100
aaatcttgct gtgattttga ctggaatgtg tggaattcct gtgtttttga gtcagtgtct 26160
ctctgttgcc cagtctggag tgcagtggga ccatcacagc tcactgcagc ctcaacctcc 26220
tgggctcagg ggatcctctc agcccagcct cccaagtagc tgggaccacg gcacgtgcca 26280
ccacgcccgg ctagttttca tatttttttg gtggagaccc cagggttgca ccatgttgcc 26340
caggctggtc tcgaactcct gggttcgggc agttcgcccc tctcggcctc tcagagtgct 26400
gggattacag gcgtgagcca ctgcactagg ccatgttgaa tttctagatt aatttgggac 26460
ccttaggggc acagagagga gggctgggcc agctggtggg aggagaggcc tctcgggctg 26520
ccgcatttcc agtgcacgga gatggcctgc gtagggggaa cagagctcac tgggggtccc 26580
tccagggagg agaaagggtc aggcaggtgc cagctcctgt ccatcagcct ggggctgcat 26640
gatggcaggg gctggtgaac cgatgacctc tgggtgtcct gtgaccttcc gtgtgtgggg 26700
ctgatgccgc agaagatcag gtggcctcca gggctccggg ctctggcctc aggctcctca 26760
cgggactgca cctcctctct ttcagattgt gtttagtgtg gacccctccg agggcagccg 26820
tggttccccg gcagggctgg gacccttaca gtcctataag gtaggggcca cctccaggag 26880
gcaggtgggg ctgggggtcc tgcagtcctg aaaggtaagc ggctgccccc aggacacggg 26940
cggggtctcc acacttctgg tcctgtcccc tccaggtgca cgtccatcct gatgctggtc 27000
accggaggac ggctcagcgg tctgatgcct ggagcaccac tgcagccaga aagcgaggta 27060
cagacctggg cccacactct ccccgcccgc ccgggtgtgg tgctcagcac cagcatgcca 27120
caggctaggc acgtggccag ccgtgggtct cctgcccccc tgggcctggc caccttctcc 27180
atgtccaggc caatccagag cgttctcctc actgtccctc tgaaggctgg agttactgag 27240
agacatggga gagggcctga tggcaccgtg acctgcccag agtcacctgg ttggtggcgg 27300
cagagccaca gctcagccag gccttcctgc tgggacacac tggtttatgc caaggccgtc 27360
agcacggagc cccacagtga ggcacagctt tccctgctgc ctccacccag cgcctggctg 27420
ggccaagcct cagggtctca tctgaagggg gcccgactgg ccctgttgtc cgaagcctct 27480
ggtgcgctcg gccctgaggc cccacgtgcc ttgttggctt cctgtgctct gtggcgtctt 27540
cgagtcggtg ctgccgggta cctgtgtgga tggggcccgt gagtgggccc tcggctccgt 27600
gtccagagtc ctgtggttct tggagtgtgt ccggccccac ccggccatgt ggtgtccaag 27660
gggggctttg tggcggcagc ggtgggagct gctgcccctt ctcgtgctcc agtggggcct 27720
tgcctctggg cttggttcgt tcctctctgg aacgttcttt ctcagagctc tctggcccgc 27780
ggtggcacga cgtggccctg gctgaagcag cccccgcgtg gttgctgtgg ttggtctgcc 27840
tggccgagcc ggaaggggag gcccgggagg gcgtcagggt tgcgtggctt gacccccggt 27900
cggtggctcg gtgatggcct cgtggcaagg cgtctcccag caggaagcgt ccatcctggg 27960
gggtcgtggg aggcggcgcg tgcctgaggc agctggcgca cagatcctga gggcctggaa 28020
tctatttgtt ccattgacct gtgacgtcac ttgacttctg agaagcagcc gctccctgcg 28080
ttgggtgttt gtaggaaatg agttcctgga ggcggaggtc gggaagttcc cccgctgcag 28140
ggcacgctca gccccaggaa gcggggtgac ctttgctggg agaggtgcct tgtccctgct 28200
gaccccgagt cacagtcagc gtcgttctgc ttgtgccgtg tttaattcct ggtgtccggt 28260
gcccaggctc agtctcctcc ccaggccgcg gccgctgcgg tcagtcagtc aagcacttct 28320
aggaacttcc tttgaaccgg tgcccttgtt cgctgctgac gccactcgga ggcttcctgg 28380
cggagcgggg aactcgcact tcctcttgtg cgcgtccctg gaatgtcggg acgctggcgc 28440
ttgcttcccg tgcgctcttg gcgggatgag cttgccctga gctgcatgtc actgtttctg 28500
cagaagttta gggttggagt tggctgacct ctctggaggt gtccccagca tctgcctggg 28560
gtctgcctcg tactcccggg acccccagtc ccccagaggg gaccccagct ggcagactgc 28620
gctcacactc agggcagcct cctttgttct gacttctgca cgctgggcct gggtggctgt 28680
gggcggctca cttgcttgat gccagtgggt gagagggtga tgggcagaga ggcaggcggt 28740
caggccccca gtcccgtcct cacaccctgt gtcccctgct cccctccgcc ccacagggaa 28800
ggtgttgagc tactggtgct tcagtcccgg ccacagcatg cgcgagctgg tccgccaggg 28860
cgtccgctcc ctcatcctta ccagcggcac gctggccccg gtgtcctcct ttgccctgga 28920
gatgcagatg tacgggccac ccctgccagg ggcctaagca ctggtgacgc ctgtgacgtt 28980
agtggggtgg gagtgctggg ggtccccatg agccggggtg ctgggggtct tgggcctcac 29040
tgggggtctc gggccttgag ggctaaaggg gtgctggtgt ccttccccac tgtctgtccc 29100
tccggccacg ctcagccctt tcccggtctg cctggagaac ccacacatca tcgacaagca 29160
ccagatctgg gtgggggtcg tccccagagg tcccgacgga gcccagctga gctccgcgtt 29220
tgacagacgg tgagggcctg tccctgggcc gtgctggggt gcgaggtcgg ggagtactga 29280
gccctgaggc cctgagcagt ggcctctcgg ctctgtgcag gttttctgag gagtgcttgt 29340
cctccctggg gaaggctctg ggtaagtgcc cggcacaccc cagctgtgcc catcctggat 29400
cctggaccct gctcccaaga gctggtaggg accccggaag acgccccgcc cctgccctga 29460
ccccagcccc tgcacttcca ggcaacatcg cccgcgtggt gccctacggg ctgctgatct 29520
tcttcccttc ctatcctgtc atggagaaga gcctggagtt ctggcgagta tgtctcccct 29580
gtgtgtcctg ggtggggtgg gtgagggcag ggctggagca cgaagcaggc agtggccaca 29640
gctcctgcct gccctcatcg gatcggcggc gtaaccaggg ctgccgtgtc cctgcctctt 29700
cctcccacag gcccgcgact tggccaggaa gatggaggca ctgaagccgc tgtttgtgga 29760
gcccaggagc aaaggcagct tctccgaggt cagcacttgg ccggggctct gggtctgctg 29820
ccccctcgtg cctcccgtgc ccctcacagc ttccccgagg ctgaccacca gccctgacca 29880
cgggctctgg cggctcccgc ctgcctcttc agggcccctg cgtttccttc ctggccctga 29940
gtgttgcctc ttatcttaca aagcccccag cactgggtgg gtgtggcgac agtggtcctc 30000
ctgcctgagg agctatagcc ggcggccacc ctggccctgg gattccccgt gttttctggg 30060
aagcactgag caggcgcagg atcagcctgg gatccgtgcc aggaagaagt ttccagaacc 30120
cagttggcct tcctggctag gatagtcctt catcttggag gatgagacct gggtctccct 30180
catgggggaa gaaggggccg aggtgggctc caggctgagc ctgaccaact ttccttccag 30240
accatcagtg cttactatgc aagggtcgct gcccctgggt ccaccggcgc caccttcctg 30300
gcggtgtgcc ggggcaaggt gagctctctg gggccctctg tcctgacccg gttgcctgtt 30360
ccccagtggg tgctcatggc tcctcagctg actttgggcc ctgggggctg cctggtcccc 30420
tccttgggcc ccacaagagc aaagcactgg tggcctgctg ggagcgtgcc ccgctctggg 30480
tcgggcaggc aggatgcagg aggttcctgg ccacgagagt tggaggtggc gtctgggagc 30540
tgtggacccc aagtggggtc ctgacccata gatggggctt cctcccaccc ctggttggag 30600
cccccatggc cccaggcagc tccctggtgt gtcccccagg ccagcgaggg gttggacttc 30660
tcagacacga atggccgtgg tgtgatcgtc acgggcctcc cgtacccccc ccgcatggac 30720
ccccgggttg tcctcaagat gcagttcctg gacgagatga agggccaggg tggggctggg 30780
ggccaggtga gttacagcag ggcggggctg gggtaaggca atctggcgac tgagcccccc 30840
tgtgaccacg ggagcccctg tgaccgagcc tcctcgccct ccagttcctc tctgggcagg 30900
agtggtaccg gcagcaggcg tccagggcgg tgaaccaggc catcgggcga gtgatccggc 30960
accgccagga ctacggggct gtcttcctct gtgaccacag gtgcgtgcag tccgggggca 31020
ggcgtggcgc caggggacac ggccacatcc cactgggccc tggactcctt ccccacatga 31080
ggccccgtct cccccagagc ctctctggcg actcggggtc agcctgaggc ccctgcggca 31140
gatgagggtc ttcacttggg tgaactgacc ccctgaagcg gctgtgggca gggcagcagg 31200
gctgtggcca ccccccaggt tcgcctttgc tgatgccaga gcccagctgc cctcctgggt 31260
gcgtcctcac gtcagggtgt acgacaactt cggccacgtc atccgagacg tggcccagtt 31320
cttccgtgtt gccgagcgaa ctgtgagttt ctgcccaggg aggggatgag ggtgttgtcc 31380
ccagaggagc cagaaatggg cccacccacc cccagtggtt ctgcagatgc cagcaccggc 31440
cccccgggct gcagcaccca gtttgcgtga aggagaagat gctgtcaggg aggccaagtc 31500
gcctgacccc ctcctctcca ccaggaaagc taagagtctg gacctgcatg tccccagcct 31560
gaagcagagg tcctcaggtg cagatggcca gtgcgggacg ggcagtgtgg ggcgggcggg 31620
gcaggcggat tggggcgggc cgtgtggggc aagcagcggg gcaggtggtg tggggcgggc 31680
ggcaccaggc gcccagggtg gaggcggctc acctggcttt atgcactgcc cctcccacct 31740
ccaaaggctg tgtctgcctc ctagggtggg gttcccacgg gctggaaccc tcccctacag 31800
gcagagaagg cctcaggcaa agacgcgccc caaggctggg actcccccta atagcaggga 31860
ggacacccac aggcaggggc ccccaaatgc tgggaccctc cctcaggagg ggctccgtca 31920
taggcaggga cccccagctg gggccccgcg gtgggcttca ctgcgcactc gggtactctg 31980
caggatcacc agctgccggg gaccccgaga gtagcctgtg tgtggagtat gagcaggagc 32040
cagttcctgc ccggcagagg cccagggggc tgctggccgc cctggagcac agtgaacagc 32100
gggccgggga ccttggcgag gagcaggtgc agttccaggg ccttgggatg gacacagacc 32160
ctctgtctcc tgaggccaac cccaccccgc ccatctgact tcaggcacct ccccacacac 32220
ccctgtaaat cccctgcctg tggggcgggc aggcaggtga gggatcccag ctgcctggct 32280
gtgtgtgtgc cctccacctc gcctcaccca caggctgctg gctcccaggt ggtgcatgcc 32340
ctggccctca gcgggtgccc ccacatcact ttgattctct ggcaggtcag cttggctcag 32400
ggcactcaag gtcgggtgcc cctgcccctg gctgtgcctg aggctggcct ttctccagga 32460
atgtgctgcg gttgggaccc aggttccttc ctccttgggg ccttttgccc cagaagccca 32520
taatttctca gctttctccc tgcttcctgc tgggggccgt tctcttgctg cctgtccctg 32580
cccttcaggc tcctggagtg agccccgggt gcaggcacca gacacctgtg tccccttcct 32640
gccagcccct cgctgtggtc ggactgtcct tcctggacct gctcttacgt gtcaccacct 32700
gtgagcctca tgagccgctg gcgtgacttg gacaggacca agttgtggga ctgtcaccag 32760
ggtgtgccgc gcccctcccc cgaccttcgt cttggctact gctcagggct ccttggggcc 32820
atcttccctg tgggcccagg tgctttgggg ccctggagtg tgtggttgga accacagctg 32880
tgtcctcctc aggcccacag ctgctccacc ctgtccctcc tggctgagaa gaggccggca 32940
gaggagctgc gaggagggag gaagaagatc cggctggtca gccacctggt gcgtgagctg 33000
tccctgcacc tgtgccgacc accatagaca cgtgtgggaa cccggccctg ggtgccccca 33060
gccaagttgg gatgtgggcc cgatgggacc agggaagtta cccccgggag ctgatgtcca 33120
gggcggctgt gaagctgtcg gcccaagggc tcaagggcag ctgggatcag gccccgccct 33180
tgggcaggct tggtttgggg gctgcagcac tgggtttggc cctggcattt ccctcaagtg 33240
tggacgtgca cctgcctcat tcgaggggcg cagcccattc ccagccttgg atgaaagaac 33300
cgagttatag tcggagccag gaagccccct gcctgctgga aagccccaag tgtggcagcc 33360
tttgtccatg tcccttggct tctgggaaga actgggtggt gcccaggcag ggctggtgcc 33420
atcaggaagt gggcggctgc cgaggggcct gggctgttga gggcctgggt ggggagtgcc 33480
ggggctgccc ctgccttggt ttccacgttt ccgtgttggt ctggggtgtg tggagagatg 33540
agcaccgctt cttgggaagc ccctccctat gatctgccat cctggagcct cagctgtgtc 33600
cgctgtgggg tgggggcttt agggaggagg agagaggacc cccagcttga gggagagcca 33660
gtctaccctt tgcccattcg ctgccctcgg ttccctgcca gcctctcact gtgtgaccca 33720
gacaggccca gccccgcagc tttcctcccg cagcacctcc gtgtccatcc agccaaccag 33780
tttctcaggc agcagccccc gctcagcaat cactgtcccg gggaacaccc aatgctccaa 33840
ggaaggctct gcagctccag ggacgggatg atgaggctgg ccctgatgga gcctcgggcc 33900
tgtgtgctgc aggaggagcc cgtggctggc gcacagatgg acagggccaa gctcttcatg 33960
gtggctgtga agcaggaact gagccaagcc aactttgcca ccttcaccca ggccctgcag 34020
gactacaagg gttccgatga cttcgccgcc ctggccgcct gtctcggccc cctctttgct 34080
gaggacccca agaagcacag cctgctccaa ggtgccctgg cttgcagggg ccgcccatcc 34140
tgagggcagt gctgccgctg tgtggggtgg gggccatctg ggtccaaggt tgtctctgtt 34200
ctctagagaa aagggggcgg atggggacag acaccccttc ctctacaggc ttctaccagt 34260
ttgtgcggcc tcaccacaag gagcagtttg aggaggtctg tatccagctg acgggacggg 34320
gctgcggcta ccggccagag cacagcgttc cccgaaggca gcgggcacag ccagccctgg 34380
accccactgg taaatggggc ctcgggtggg accctcagac tcctccgtgg aaggcaccgg 34440
agtcctgggc tggttggggt gggcatccct ggggccctgc gtggccccgc ctctctgttc 34500
ccgtgtggga gtgatggggg ccacccccca ccaccagcag cagtatcact tgttggggag 34560
accctgtgca actccacgca gggccctgcc cttcccatag cccctgaccc ctacgcacag 34620
ccctgtccag ctgccgcacg tgtcccctgc cccccatgca cagccctggg gagtccactg 34680
cacacgccag ggtcctagac ccctagaccc ctagatccct gtcctcccgt cctccctact 34740
tctgcctttg cctagggtgg agtccaagcc tccagaggtg ggagtgtctg tgttcgtgct 34800
tgttaacgaa cagcccccat agagctcctc cagtgtaggg ttcacccagc ggggaaccta 34860
acctgttggg aagaccccag accccttctg ggcttggtac ccaccctggg gctctaagct 34920
cctgagcagg gctttggcct gcctgccact gttccagccc ccatccagca gttggtgtct 34980
cctctgctgc cccggcacct gggcacgtgt gcctgcctgg gttttcccgc cctggtccga 35040
ggtgggtgag gcctggcctc cccagccagc ccttccccct ccccggggga actttccagg 35100
tgcttgggac cagctttgtg gctctccatc tcttcatcag gaaggacagc gctagatccc 35160
aagctgactg tgtccaaggc tgcagcccag cagctggacc cccgagagca cctgaaccag 35220
ggcaggcccc acctgtcgcc cagaccaccc cccacaggta gctgagtcct gaactgtgtg 35280
cagcctgtga cttggtgggt tcctcagtgg cttgatgagg ctaacacttg agtgtggctt 35340
gagcctttga accggaggtg ccagtggagc tgcccctgtg gggagcatct cctggtgggg 35400
gctcccggtt ctgtaccccg cagttgtcct gagcagctct ccaggagttc gtgggaggaa 35460
gggcaggcag ggtggtggga ctctcagtcc tctgccccag cgccactctg agccatgcta 35520
ctcccacacc aggaggccct ggcagccacc cacagcaggg gtccagagcg cccagagcag 35580
ggaagcaggg ccagcgcgcc gtgagcgcct acctggcaga tgtccgcagg gccctggggt 35640
ctgcaggctg tagccagctc ttggcagcac tgacagccta caagcaagac gatgacctcg 35700
acaaggtgct ggccgtgctg gccgccctga ccactgcaaa gccggaggac ttccccctgc 35760
tgcagagcaa gtggcctggg cgtgggggac agccagtggg gtgggnnnnn nnnnnnnnnn 35820
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 35880
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 35940
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 36000
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 36060
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 36120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 36180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 36240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 36300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnggg 36360
ggcaggggca gggtggggac cgtgccgggt ctgagtgaag ctccccgcag ggttcagcat 36420
gtttgtgcgt ccacaccaca agcagcgctt ctcacagacg tgcacagacc tgaccggcag 36480
accctccctg ggcacggagc caccaggacc ccaggaggag agtcttgccg tgcctcctgt 36540
gctcacccac agggctcccc aaccaggtag ggcgcctgcc tggctgctcc tgacagtgcc 36600
ccaaccgcac gcagccctgg gagtgagcag caaagcccca ggccctgctc agactcagtc 36660
tccgtctcca ggcccctcac ggtccgagaa gcccggaaag acccagagcg agatctcgac 36720
cttccttaga cagaggccag cagggactgt gggggcgggc ggtgaggctg cagggcccag 36780
ccagtcccca ggacctcccc acgggcctgc agcatctgag tggggtgagc ctcctgggag 36840
agaccttgct gggcagcagg ctgcgggagc tccgagcggg cccctctcag caggctgtgt 36900
gtgccagggc tgtggggcgg aggatgtggt gcccttccag tgccctgcct gtgatttcca 36960
gcgctgccaa gcctgttggc aacggcacct tcaggttggt gcctggtcac tacagttcct 37020
gctgggtgta gccccaggtg gtgggctgag ggggaaaggg ccgggtatag ccccaggtgg 37080
tgggctggtg gcaacgcctg gcaggtgcgt ccagcgggcc ggttgtctta caggcctcta 37140
ggacgtgccc atcctgccac accgcctcca ggaagcagag cgtcacgcag gtcttctggc 37200
cagagcccca gtga 37214
<210> 3
<211> 18
<212> DNA
<213> Homo sapiens
<400> 3
gaccactgtc cttccatg 18
<210> 4
<211> 46
<212> DNA
<213> Homo sapiens
<400> 4
ttcagagatt caagttataa taaagctctt cttatattga ggggga 46
<210> 5
<211> 18
<212> DNA
<213> Homo sapiens
<400> 5
aggaataggg ttggtttt 18
<210> 6
<211> 17
<212> DNA
<213> Homo sapiens
<400> 6
ccttactacc tgtcccg 17
<210> 7
<211> 20
<212> DNA
<213> Homo sapiens
<400> 7
acaattactt gttggatgcc 20
<210> 8
<211> 18
<212> DNA
<213> Homo sapiens
<400> 8
agcttctaac ccaaccag 18
<210> 9
<211> 21
<212> DNA
<213> Homo sapiens
<400> 9
tataaaccta aatgtaaaag c 21
<210> 10
<211> 20
<212> DNA
<213> Homo sapiens
<400> 10
ttcaccaaaa tttaaagctt 20
<210> 11
<211> 26
<212> DNA
<213> Homo sapiens
<400> 11
ctttgaccag agtatgtaaa attctc 26
<210> 12
<211> 18
<212> DNA
<213> Homo sapiens
<400> 12
aagacgtgtt caaagatt 18
<210> 13
<211> 17
<212> DNA
<213> Homo sapiens
<400> 13
ggacctactg ttttttg 17
<210> 14
<211> 19
<212> DNA
<213> Homo sapiens
<400> 14
ggacctactg ttttattcc 19
<210> 15
<211> 22
<212> DNA
<213> Homo sapiens
<400> 15
gtcccttctc ttcctcctgt ag 22
<210> 16
<211> 19
<212> DNA
<213> Homo sapiens
<400> 16
cgtgatcttt gacgaagct 19
<210> 17
<211> 16
<212> DNA
<213> Homo sapiens
<400> 17
cgcaaacctt tctgga 16
<210> 18
<211> 23
<212> DNA
<213> Homo sapiens
<400> 18
agcctgtgtg tggagtatga gca 23
<210> 19
<211> 20
<212> DNA
<213> Homo sapiens
<400> 19
cgtttccgtg ttggtctggg 20
<210> 20
<211> 19
<212> DNA
<213> Homo sapiens
<400> 20
gactacaagg gttccgatg 19
<210> 21
<211> 20
<212> DNA
<213> Homo sapiens
<400> 21
agtttgagga ggtctgtatc 20
<210> 22
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 22
catggaagga cagtggt 17
<210> 23
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 23
agctttatta taacttgaat 20
<210> 24
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 24
cgggacaggt agtaag 16
<210> 25
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 25
cgggacaggt agtaa 15
<210> 26
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 26
gcatccaaca agtaattgt 19
<210> 27
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 27
gcatccaaca agtaattg 18
<210> 28
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 28
ggcatccaac aagtaatt 18
<210> 29
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 29
ggttgggtta gaagct 16
<210> 30
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 30
gcttttacat ttaggtttat 20
<210> 31
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 31
catgttcctt tctataact 19
<210> 32
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 32
agctttaaat tttggtgaa 19
<210> 33
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 33
ttttacatac tctggtcaaa 20
<210> 34
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 34
ttttacatac tctggtca 18
<210> 35
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 35
gaattttaca tactctggtc 20
<210> 36
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 36
gaattttaca tactctggt 19
<210> 37
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 37
gagaatttta catactctgg 20
<210> 38
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 38
atctttgaac acgtctt 17
<210> 39
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 39
acaaaaaaca gtaggtcc 18
<210> 40
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 40
ggaataaaac agtaggtc 18
<210> 41
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 41
agcttcgtca aagatcac 18
<210> 42
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 42
ggtgggtgga tgtttc 16
<210> 43
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 43
ggtggtgtgg agaagc 16
<210> 44
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 44
gctcatactc cacacac 17
<210> 45
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 45
catcggaacc cttgtagtcc 20
<210> 46
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 46
gatacagacc tcctcaaac 19
<210> 47
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 47
ggtggaggtg gtgctgc 17
<210> 48
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 48
aggtggaggt ggtgct 16
<210> 49
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 49
tggtgtggga gtagca 16
<210> 50
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 50
cgatggcgag aaatta 16
<210> 51
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 51
taattcagca aaaaagccca 20
<210> 52
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 52
aagaatctga cacccca 17
<210> 53
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 53
agacagccaa gaatctgaca c 21
<210> 54
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 54
cagccaagaa tctgaca 17
<210> 55
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 55
acaggaaccc gacag 15
<210> 56
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 56
gttactctct tgtttcttca c 21
<210> 57
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 57
ttactctctt gtttcttca 19
<210> 58
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 58
gttactctct tgtttcttc 19
<210> 59
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 59
cgtgggtgga gaagca 16
<210> 60
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 60
acgtgggtgg agaagc 16
<210> 61
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 61
cagaaactgt aagggca 17
<210> 62
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 62
agggatagca gggaagg 17
<210> 63
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 63
gcttaaacac agacaga 17
<210> 64
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 64
tgcttaaaca cagacag 17
<210> 65
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 65
cagggcaggg aagaacag 18
<210> 66
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 66
catggaagga cagtgg 16
<210> 67
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 67
ccccctcaat ataagaa 17
<210> 68
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 68
aaccaaccct attcctgg 18
<210> 69
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 69
accaacccta ttcctg 16
<210> 70
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 70
aaccaaccct attcctg 17
<210> 71
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 71
aaaaccaacc ctattcct 18
<210> 72
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 72
aaaccaaccc tattcc 16
<210> 73
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 73
ggtagtaagg gcacacc 17
<210> 74
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 74
gacaggtagt aagggcacac 20
<210> 75
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 75
gtagtaaggg cacac 15
<210> 76
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 76
gacaggtagt aagggcaca 19
<210> 77
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 77
acaggtagta agggcaca 18
<210> 78
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 78
gacaggtagt aagggca 17
<210> 79
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 79
cgggacaggt agtaaggg 18
<210> 80
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 80
catccaacaa gtaattgt 18
<210> 81
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 81
ggcatccaac aagtaattgt 20
<210> 82
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 82
ggcatccaac aagtaattg 19
<210> 83
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 83
ggcatccaac aagtaat 17
<210> 84
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 84
cgtgaaggag agaacct 17
<210> 85
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 85
acgtgaagga gagaacc 17
<210> 86
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 86
gacgtgaagg agagaacc 18
<210> 87
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 87
gacgtgaagg agagaac 17
<210> 88
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 88
cagtcttgct atgcct 16
<210> 89
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 89
ctagaatcaa agctcca 17
<210> 90
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 90
acatcgcact tgggc 15
<210> 91
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 91
cacggcaaac ctcacc 16
<210> 92
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 92
aaccacggca aacctcac 18
<210> 93
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 93
caaagcaccg agtcacc 17
<210> 94
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 94
tcaaagcacc gagtcac 17
<210> 95
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 95
ctggttgggt tagaag 16
<210> 96
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 96
tataactttt agtttagc 18
<210> 97
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 97
ttcctttcta taactttt 18
<210> 98
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 98
gttcctttct ataactttt 19
<210> 99
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 99
gttcctttct ataacttt 18
<210> 100
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 100
atgttccttt ctataacttt 20
<210> 101
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 101
atgttccttt ctataactt 19
<210> 102
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 102
atgttccttt ctataact 18
<210> 103
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 103
gctttaatct gccttc 16
<210> 104
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 104
ccgtggcttt aatctgc 17
<210> 105
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 105
ccgtggcttt aatctg 16
<210> 106
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 106
caaaaaacag taggtcc 17
<210> 107
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 107
gaataaaaca gtaggtcc 18
<210> 108
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 108
ggaataaaac agtaggtcc 19
<210> 109
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 109
ggaataaaac agtaggt 17
<210> 110
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 110
ggaataaaac agtagg 16
<210> 111
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 111
cacagagtgt catggg 16
<210> 112
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 112
acagcatgga aaggcacg 18
<210> 113
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 113
cagcatggaa aggcacg 17
<210> 114
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 114
tacaggagga agagaaggga c 21
<210> 115
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 115
acaggaggaa gagaaggg 18
<210> 116
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 116
tctacaggag gaagagaa 18
<210> 117
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 117
tctacaggag gaagaga 17
<210> 118
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 118
cttcgtcaaa gatcacg 17
<210> 119
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 119
gcttcgtcaa agatcacg 18
<210> 120
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 120
gcttcgtcaa agatcac 17
<210> 121
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 121
ccagaaaggt ttgcg 15
<210> 122
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 122
tccagaaagg tttgcg 16
<210> 123
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 123
cagaggcatc ggatcag 17
<210> 124
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 124
cagaggcatc ggatca 16
<210> 125
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 125
agcagaggca tcggatc 17
<210> 126
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 126
attcttcaca catcttc 17
<210> 127
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 127
ctatgaacgc acctg 15
<210> 128
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 128
ggctatgaac gcacctg 17
<210> 129
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 129
gctgggagaa gacatag 17
<210> 130
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 130
caaaatgccc ttacagtga 19
<210> 131
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 131
caaaatgccc ttacagt 17
<210> 132
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 132
tgtgcgattt taaaggaaaa t 21
<210> 133
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 133
catgtgcgat tttaaaggaa a 21
<210> 134
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 134
tgtgcgattt taaaggaa 18
<210> 135
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 135
catgtgcgat tttaaagga 19
<210> 136
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 136
atgtgcgatt ttaaagga 18
<210> 137
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 137
accctgtcac ttaaatatat g 21
<210> 138
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 138
gagggaggtg gagcgtt 17
<210> 139
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 139
ctgaagagtg gagaagg 17
<210> 140
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 140
caataaataa agtgtgagga 20
<210> 141
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 141
caacccagta accatgac 18
<210> 142
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 142
caacccagta accatga 17
<210> 143
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 143
accaacccag taaccatga 19
<210> 144
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 144
gagcaggtgt tttatc 16
<210> 145
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 145
ggtcgaggag gtgtcac 17
<210> 146
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 146
gtcgaggagg tgtcac 16
<210> 147
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 147
ggtcgaggag gtgtca 16
<210> 148
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 148
ggtcgaggag gtgtc 15
<210> 149
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 149
ccaggtctca aaaaggg 17
<210> 150
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 150
attacgctga ggaca 15
<210> 151
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 151
cattacgctg aggac 15
<210> 152
<211> 14
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 152
cttgagcatt acgc 14
<210> 153
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 153
cgaggagaag aaggcag 17
<210> 154
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 154
ccttggtctg aaacgtgat 19
<210> 155
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 155
ctaacgcctc cacgc 15
<210> 156
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 156
ggacaggctc tacgg 15
<210> 157
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 157
actaatacag caggagaagg 20
<210> 158
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 158
aactaataca gcaggagaag g 21
<210> 159
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 159
taactaatac agcaggagaa g 21
<210> 160
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 160
ttgaagagcc aaccac 16
<210> 161
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 161
ccattttcac tgtcaag 17
<210> 162
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 162
gccattttca ctgtcaa 17
<210> 163
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 163
agaaatgcgg agaagc 16
<210> 164
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 164
aaatggaaaa aatgaccagc 20
<210> 165
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 165
aggacttacg acaaaaccac 20
<210> 166
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 166
ggacttacga caaaacca 18
<210> 167
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 167
gacttacgac aaaacca 17
<210> 168
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 168
acaccaggac ttacgaca 18
<210> 169
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 169
tagaaattca acatggc 17
<210> 170
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 170
ctagaaattc aacatggc 18
<210> 171
<211> 14
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 171
gtcatcggtt cacc 14
<210> 172
<211> 14
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 172
actcgaagac gcca 14
<210> 173
<211> 14
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 173
gactcgaaga cgcc 14
<210> 174
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 174
ggcacaagca gaacgac 17
<210> 175
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 175
agtcagaaca aaggaggc 18
<210> 176
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 176
gaagtcagaa caaaggag 18
<210> 177
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 177
gcagaagtca gaacaaagg 19
<210> 178
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 178
gtgcagaagt cagaacaaa 19
<210> 179
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 179
gtgcagaagt cagaacaa 18
<210> 180
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 180
aaggatgagg gagcggac 18
<210> 181
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 181
gtaaggatga gggagc 16
<210> 182
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 182
tggtaaggat gagggag 17
<210> 183
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 183
cgtacatctg catctc 16
<210> 184
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 184
tgtaagataa gaggcaacac t 21
<210> 185
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 185
ttgtaagata agaggcaaca c 21
<210> 186
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 186
ttgtaagata agaggcaaca 20
<210> 187
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 187
tttgtaagat aagaggcaac a 21
<210> 188
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 188
tgtaagataa gaggcaa 17
<210> 189
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 189
ctggaaggaa agttggt 17
<210> 190
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 190
atagtaagca ctgatggtc 19
<210> 191
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 191
tagtaagcac tgatgg 16
<210> 192
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 192
catagtaagc actgatg 17
<210> 193
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 193
ctgtaactca cctggc 16
<210> 194
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 194
cggatcactc gcccg 15
<210> 195
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 195
acacaggcta ctctcgg 17
<210> 196
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 196
acacaggcta ctctcg 16
<210> 197
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 197
ccacacacag gctactc 17
<210> 198
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 198
atactccaca cacaggct 18
<210> 199
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 199
atactccaca cacaggc 17
<210> 200
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 200
gctcatactc cacacacag 19
<210> 201
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 201
tcatactcca cacacag 17
<210> 202
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 202
gctcatactc cacacaca 18
<210> 203
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 203
tgctcatact ccacacac 18
<210> 204
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 204
agcaggaagc agggagaaa 19
<210> 205
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 205
tccgaccaca gcgag 15
<210> 206
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 206
cagaagccaa gggacatg 18
<210> 207
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 207
cagaagccaa gggacat 17
<210> 208
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 208
ccagaccaac acggaaacg 19
<210> 209
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 209
ccagaccaac acggaaac 18
<210> 210
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 210
gaatgggcaa agggtaga 18
<210> 211
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 211
aatgggcaaa gggtaga 17
<210> 212
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 212
gaatgggcaa agggtag 17
<210> 213
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 213
gaacccttgt agtcctg 17
<210> 214
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 214
aacccttgta gtcct 15
<210> 215
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 215
ggaacccttg tagtc 15
<210> 216
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 216
atcggaaccc ttgtagtc 18
<210> 217
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 217
catcggaacc cttgtagtc 19
<210> 218
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 218
catcggaacc cttgtagt 18
<210> 219
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 219
gatacagacc tcctcaaact 20
<210> 220
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 220
gatacagacc tcctcaaac 19
<210> 221
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 221
gatacagacc tcctcaaa 18
<210> 222
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 222
gatacagacc tcctcaa 17
<210> 223
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 223
gccccattta ccagtg 16
<210> 224
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 224
cccaacaagt gatgct 16
<210> 225
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 225
cccaacaagt gatgc 15
<210> 226
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 226
gtaccaagcc cagaagg 17
<210> 227
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 227
gtaccaagcc cagaag 16
<210> 228
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 228
ttcctgatga agagatg 17
<210> 229
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 229
tcctgatgaa gagatg 16
<210> 230
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 230
tgggagtagc atggc 15
<210> 231
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 231
tgtgggagta gcatggc 17
<210> 232
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 232
gtgggagtag catggc 16
<210> 233
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 233
aaacatgctg aaccctg 17
<210> 234
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 234
acaaacatgc tgaaccct 18
<210> 235
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 235
cacaaacatg ctgaaccc 18
<210> 236
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 236
cacaaacatg ctgaacc 17
<210> 237
<211> 17
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic oligonucleotide
<400> 237
tggacgcaca aacatgc 17
<210> 238
<211> 21
<212> DNA
<213> artificial
<220>
<223> Primer
<400> 238
ggagtgtgga ttcgcactcc t 21
<210> 239
<211> 20
<212> DNA
<213> artificial
<220>
<223> Primer
<400> 239
agattgagat cttctgcgac 20
<210> 240
<211> 27
<212> DNA
<213> artificial
<220>
<223> probe
<400> 240
aggcaggtcc cctagaagaa gaactcc 27
<210> 241
<211> 21
<212> DNA
<213> artificial
<220>
<223> primer
<400> 241
ccatcctgga cattgaggac t 21
<210> 242
<211> 21
<212> DNA
<213> artificial
<220>
<223> primer
<400> 242
caggttccgg gacaggtagt a 21
<210> 243
<211> 21
<212> DNA
<213> artificial
<220>
<223> primer
<400> 243
cgtctgtgcc ttctcatctg c 21
<210> 244
<211> 20
<212> DNA
<213> artificial
<220>
<223> primer
<400> 244
gcacagcttg gaggcttgaa 20
<210> 245
<211> 20
<212> DNA
<213> artificial
<220>
<223> primer
<400> 245
ccgtctgaac tatcctgccc 20
<210> 246
<211> 20
<212> DNA
<213> artificial
<220>
<223> primer
<400> 246
gccgtagtcg gtgtactcgt 20
Claims (31)
- B형 간염 바이러스 (HBV) 감염의 치료 및/또는 예방에서 이용을 위한 RTEL1 저해제.
- 청구항 제 1항에 있어서, HBV 감염은 만성 감염인, RTEL1 저해제.
- 청구항 제 1항 또는 제 2항에 있어서, RTEL1 저해제는 감염된 세포에서 cccDNA를 감소시킬 수 있는, RTEL1 저해제.
- 청구항 제 1항 내지 제 3항 중 어느 한 항에 있어서, 상기 저해제는 포유류 RTEL1 표적 핵산, 특히 인간 RTEL1 핵산에 적어도 95% 상보적인, 길이에서 적어도 10개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는, 길이에서 12 내지 60개 뉴클레오티드의 올리고뉴클레오티드이고, 그리고 RTEL1 mRNA를 감소시킬 수 있는, RTEL1 저해제.
- 청구항 제 1항 내지 제 4항 중 어느 한 항에 있어서, 단일 가닥 안티센스 올리고뉴클레오티드, siRNA 또는 shRNA 분자에서 선택되는, RTEL 1 저해제.
- 청구항 제 1항 내지 제 5항 중 어느 한 항에 있어서, 포유류 RTEL1 표적 핵산은 서열 번호: 1 또는 2에서 선택되는, RTEL 1 저해제.
- 청구항 제 4항 내지 제 6항 중 어느 한 항에 있어서, 연속 뉴클레오티드 서열은 서열 번호: 1 및 서열 번호: 2의 표적 핵산에 적어도 98% 상보적인, RTEL 1 저해제.
- 청구항 제 3항 내지 제 7항 중 어느 한 항에 있어서, HBV 감염된 세포에서 cccDNA는 대조와 비교할 때 적어도 60% 감소되는, RTEL 1 저해제.
- 청구항 제 4항 내지 제 7항 중 어느 한 항에 있어서, RTEL1 mRNA는 대조와 비교할 때 적어도 60% 감소되는, RTEL 1 저해제.
- 포유류 RTEL1, 특히 인간 RTEL1에 상보적인 적어도 10개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는 길이에서 12-30개 뉴클레오티드의 단일 가닥 안티센스 올리고뉴클레오티드에 있어서, 상기 올리고뉴클레오티드는 RTEL1의 발현을 저해할 수 있는, 단일 가닥 안티센스 올리고뉴클레오티드.
- 청구항 제 10항에 있어서, 연속 뉴클레오티드 서열은 서열 번호: 1에 적어도 90% 상보적인, 예컨대 완전히 상보적인, 안티센스 올리고뉴클레오티드.
- 청구항 제 10항 또는 제 11항에 있어서, 길이에서 12 내지 25개, 특히 15 내지 21개의 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는, 안티센스 올리고뉴클레오티드.
- 청구항 제 11항 내지 제 12항 중 어느 한 항에 있어서, 연속 뉴클레오티드 서열은 서열 번호: 3-21에서 선택되는 표적 서열에 100% 상보적인, 올리고뉴클레오티드.
- 청구항 제 10항 내지 제 13항 중 어느 한 항에 있어서, 올리고뉴클레오티드는 서열 번호: 22-237로 구성된 군에서 선택되는 서열을 포함하는, 올리고뉴클레오티드.
- 청구항 제 10항 내지 제 14항 중 어느 한 항에 있어서, 하나 또는 그 이상의 2' 당 변형된 뉴클레오시드를 포함하는, 안티센스 올리고뉴클레오티드.
- 청구항 제 15항에 있어서, 하나 또는 그 이상의 2' 당 변형된 뉴클레오시드는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA, 2'-아미노-DNA, 2'-플루오로-DNA, 아라비노 핵산 (ANA), 2'-플루오로-ANA 및 LNA 뉴클레오시드로 구성된 군에서 독립적으로 선택되는, 안티센스 올리고뉴클레오티드.
- 청구항 제 15항 내지 제 16항 중 어느 한 항에 있어서, 하나 또는 그 이상의 2' 당 변형된 뉴클레오시드는 LNA 뉴클레오시드인, 안티센스 올리고뉴클레오티드.
- 청구항 제 10항 내지 제 17항 중 어느 한 항에 있어서, 올리고뉴클레오티드는 적어도 하나의 포스포로티오에이트 뉴클레오시드간 연쇄를 포함하는, 안티센스 올리고뉴클레오티드.
- 청구항 제 18항에 있어서, 연속 뉴클레오티드 서열 내에 모든 뉴클레오시드간 연쇄는 포스포로티오에이트 뉴클레오시드간 연쇄인, 안티센스 올리고뉴클레오티드.
- 청구항 제 10항 내지 제 19항 중 어느 한 항에 있어서, 올리고뉴클레오티드는 RNase H를 모집할 수 있는, 안티센스 올리고뉴클레오티드.
- 청구항 제 10항 내지 제 20항 중 어느 한 항에 있어서, 안티센스 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 화학식 5'-F-G-F'-3'의 갭머로 구성되거나 또는 이를 포함하고, 여기서 영역 F 및 F'는 1 - 4개의 2' 당 변형된 뉴클레오시드를 독립적으로 포함하고, 그리고 G는 RNaseH를 모집할 수 있는 6 내지 16개 뉴클레오시드의 영역, 예컨대 6 내지 18개 DNA 뉴클레오시드를 포함하는 영역인, 안티센스 올리고뉴클레오티드.
- 청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 올리고뉴클레오티드 및 상기 올리고뉴클레오티드에 공유 부착된 적어도 하나의 접합 모이어티를 포함하는 접합체.
- 청구항 제 22항에 있어서, 접합 모이어티는 도 1에서 삼가 GalNAc 모이어티 중 한 가지에서 선택되는, 접합 화합물.
- 청구항 제 22항 또는 제 23항에 있어서, 적어도 2개의 연속 포스포디에스테르 연쇄를 포함하는 2 내지 5개의 연결된 뉴클레오시드로 구성되는 생리학적으로 불안정 링커를 포함하고, 여기서 상기 생리학적으로 불안정 링커는 올리고뉴클레오티드 성분의 5' 또는 3' 단부에서 공유 결합된, 접합 화합물.
- 청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 올리고뉴클레오티드의 제약학적으로 허용되는 염, 또는 청구항 제 22항 내지 제 24항에 따른 접합체의 제약학적으로 허용되는 염.
- 청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 올리고뉴클레오티드, 또는 청구항 제 22항 내지 제 24항에 따른 접합체, 또는 청구항 제 25항에 따른 제약학적으로 허용되는 염, 그리고 제약학적으로 허용되는 부형제를 포함하는 제약학적 조성물.
- RTEL1을 발현하는 표적 세포에서 RTEL1 발현을 조절하기 위한 생체내 또는 시험관내 방법에 있어서, 상기 방법은 청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 올리고뉴클레오티드, 또는 청구항 제 22항 내지 제 24항에 따른 접합체, 청구항 제 25항에 따른 제약학적으로 허용되는 염, 또는 청구항 제 26항에 따른 제약학적 조성물을 효과량으로 상기 세포에 투여하는 단계를 포함하는, 생체내 또는 시험관내 방법.
- 질환을 치료하거나 예방하기 위한 방법에 있어서, 청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 올리고뉴클레오티드, 또는 청구항 제 22항 내지 제 24항에 따른 접합체, 청구항 제 25항에 따른 제약학적으로 허용되는 염, 또는 청구항 제 26항에 따른 제약학적 조성물의 치료 또는 예방 효과량을, 상기 질환을 앓거나 또는 상기 질환에 취약한 개체에게 투여하는 단계를 포함하는, 방법.
- 청구항 제 28항에 있어서, 질환은 B형 간염 바이러스 (HBV)인, 방법.
- 의약에서 이용을 위한, 청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 안티센스 올리고뉴클레오티드, 또는 청구항 제 22항 내지 제 24항에 따른 접합체, 청구항 제 25항에 따른 제약학적으로 허용되는 염, 또는 청구항 제 26항에 따른 제약학적 조성물.
- B형 간염 바이러스 HBV의 치료 또는 예방을 위한 약제의 제조를 위한, 청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 올리고뉴클레오티드, 또는 청구항 제 22항 내지 제 24항에 따른 접합체, 청구항 제 25항에 따른 제약학적으로 허용되는 염, 또는 청구항 제 26항에 따른 제약학적 조성물의 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18183477.1 | 2018-07-13 | ||
EP18183477 | 2018-07-13 | ||
PCT/EP2019/068639 WO2020011902A1 (en) | 2018-07-13 | 2019-07-11 | Oligonucleotides for modulating rtel1 expression |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210033004A true KR20210033004A (ko) | 2021-03-25 |
Family
ID=62951968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217004297A KR20210033004A (ko) | 2018-07-13 | 2019-07-11 | Rtel1의 발현을 조절하기 위한 올리고뉴클레오티드 |
Country Status (16)
Country | Link |
---|---|
US (1) | US20210147850A1 (ko) |
EP (1) | EP3821013A1 (ko) |
JP (1) | JP2021524277A (ko) |
KR (1) | KR20210033004A (ko) |
CN (1) | CN112534055A (ko) |
AU (1) | AU2019300324A1 (ko) |
BR (1) | BR112021000538A2 (ko) |
CA (1) | CA3106288A1 (ko) |
CL (1) | CL2021000018A1 (ko) |
CR (1) | CR20210015A (ko) |
IL (1) | IL279929A (ko) |
MX (1) | MX2021000404A (ko) |
PE (1) | PE20211306A1 (ko) |
SG (1) | SG11202100348SA (ko) |
TW (1) | TWI791868B (ko) |
WO (1) | WO2020011902A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW202246500A (zh) * | 2021-02-02 | 2022-12-01 | 瑞士商赫孚孟拉羅股份公司 | 用於抑制 rtel1 表現之增強型寡核苷酸 |
WO2023111210A1 (en) | 2021-12-17 | 2023-06-22 | F. Hoffmann-La Roche Ag | Combination of oligonucleotides for modulating rtel1 and fubp1 |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0724447B1 (en) | 1991-10-24 | 2003-05-07 | Isis Pharmaceuticals, Inc. | Derivatized oligonucleotides having improved uptake |
JP3756313B2 (ja) | 1997-03-07 | 2006-03-15 | 武 今西 | 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体 |
AU9063398A (en) | 1997-09-12 | 1999-04-05 | Exiqon A/S | Oligonucleotide analogues |
NZ513402A (en) | 1999-02-12 | 2003-06-30 | Sankyo Co | Novel nucleosides and oligonucleotide analogues |
CN102180924A (zh) | 1999-05-04 | 2011-09-14 | 桑塔里斯制药公司 | L-核糖-lna类似物 |
US6617442B1 (en) | 1999-09-30 | 2003-09-09 | Isis Pharmaceuticals, Inc. | Human Rnase H1 and oligonucleotide compositions thereof |
US7393950B2 (en) * | 2002-08-29 | 2008-07-01 | Hong Kong University Of Science & Technology | Antisense oligonucleotides targeted to human CDC45 |
ES2607471T3 (es) | 2002-11-18 | 2017-03-31 | Roche Innovation Center Copenhagen A/S | Diseño antisentido |
WO2004083430A2 (en) | 2003-03-21 | 2004-09-30 | Santaris Pharma A/S | SHORT INTERFERING RNA (siRNA) ANALOGUES |
US8350021B2 (en) | 2003-06-12 | 2013-01-08 | Alnylam Pharmaceuticals, Inc. | Conserved HBV and HCV sequences useful for gene silencing |
EP1915181A4 (en) | 2005-08-10 | 2009-07-15 | Merck & Co Inc | NEW HIV TARGETS |
WO2007031091A2 (en) | 2005-09-15 | 2007-03-22 | Santaris Pharma A/S | Rna antagonist compounds for the modulation of p21 ras expression |
ES2516815T3 (es) | 2006-01-27 | 2014-10-31 | Isis Pharmaceuticals, Inc. | Análogos de ácidos nucleicos bicíclicos modificados en la posición 6 |
DK1984382T3 (da) | 2006-01-27 | 2012-09-03 | Santaris Pharma As | LNA modificerede fosforthiolerede oligonukleotider |
DK2002004T3 (en) | 2006-03-23 | 2015-11-30 | Roche Innovation Ct Copenhagen As | LITTLE INTERNAL SEGMENTED INTERFERENCE RNA |
US7666854B2 (en) | 2006-05-11 | 2010-02-23 | Isis Pharmaceuticals, Inc. | Bis-modified bicyclic nucleic acid analogs |
AU2007249349B2 (en) | 2006-05-11 | 2012-03-08 | Isis Pharmaceuticals, Inc. | 5'-Modified bicyclic nucleic acid analogs |
AU2008260277C1 (en) | 2007-05-30 | 2014-04-17 | Isis Pharmaceuticals, Inc. | N-substituted-aminomethylene bridged bicyclic nucleic acid analogs |
EP2173760B2 (en) | 2007-06-08 | 2015-11-04 | Isis Pharmaceuticals, Inc. | Carbocyclic bicyclic nucleic acid analogs |
CN101796062B (zh) | 2007-07-05 | 2014-07-30 | Isis制药公司 | 6-双取代双环核酸类似物 |
US8546556B2 (en) | 2007-11-21 | 2013-10-01 | Isis Pharmaceuticals, Inc | Carbocyclic alpha-L-bicyclic nucleic acid analogs |
EP2356129B1 (en) | 2008-09-24 | 2013-04-03 | Isis Pharmaceuticals, Inc. | Substituted alpha-l-bicyclic nucleosides |
WO2010080129A2 (en) | 2008-12-18 | 2010-07-15 | Dicerna Pharmaceuticals, Inc. | Extended dicer substrate agents and methods for the specific inhibition of gene expression |
WO2010093788A2 (en) | 2009-02-11 | 2010-08-19 | Dicerna Pharmaceuticals, Inc. | Multiplex dicer substrate rna interference molecules having joining sequences |
US9012421B2 (en) | 2009-08-06 | 2015-04-21 | Isis Pharmaceuticals, Inc. | Bicyclic cyclohexose nucleic acid analogs |
EP2580228B1 (en) | 2010-06-08 | 2016-03-23 | Ionis Pharmaceuticals, Inc. | Substituted 2'-amino and 2'-thio-bicyclic nucleosides and oligomeric compounds prepared therefrom |
CA2807307C (en) | 2010-08-17 | 2021-02-09 | Merck Sharp & Dohme Corp. | Rna interference mediated inhibition of hepatitis b virus (hbv) gene expression using short interfering nucleic acid (sina) |
CN103370415B (zh) | 2010-10-28 | 2017-05-31 | 本尼特生物制药有限公司 | Hbv治疗 |
EP3505528B1 (en) | 2011-04-21 | 2020-11-25 | Ionis Pharmaceuticals, Inc. | Modulation of hepatitis b virus (hbv) expression |
US8809293B2 (en) | 2011-06-30 | 2014-08-19 | Arrowhead Madison Inc. | Compositions and methods for inhibiting gene expression of hepatitis B virus |
WO2013022966A1 (en) | 2011-08-11 | 2013-02-14 | Isis Pharmaceuticals, Inc. | Linkage modified gapped oligomeric compounds and uses thereof |
WO2013033230A1 (en) | 2011-08-29 | 2013-03-07 | Isis Pharmaceuticals, Inc. | Oligomer-conjugate complexes and their use |
WO2013154798A1 (en) | 2012-04-09 | 2013-10-17 | Isis Pharmaceuticals, Inc. | Tricyclic nucleic acid analogs |
WO2013159109A1 (en) | 2012-04-20 | 2013-10-24 | Isis Pharmaceuticals, Inc. | Modulation of hepatitis b virus (hbv) expression |
MX363068B (es) | 2012-11-15 | 2019-03-07 | Roche Innovation Ct Copenhagen As | Conjugados de oligonucleotido. |
PL2992009T3 (pl) | 2013-05-01 | 2020-11-30 | Ionis Pharmaceuticals, Inc. | Kompozycje i sposoby modulowania ekspresji apolipoproteiny(a) |
WO2014205105A1 (en) * | 2013-06-19 | 2014-12-24 | The Regents Of The University Of California | Biomarkers of response to inhibition of poly-adp ribose polymerase (parp) in cancer |
PE20160158A1 (es) | 2013-06-27 | 2016-03-18 | Roche Innovation Ct Copenhagen As | Oligomeros antisentido y conjugados con diana en pcsk9 |
CA2935426C (en) | 2014-01-30 | 2023-07-25 | F. Hoffmann-La Roche Ag | Polyoligomer compound with biocleavable conjugates for reducing or inhibiting expression of a nucleic acid target |
GB201408623D0 (en) | 2014-05-15 | 2014-07-02 | Santaris Pharma As | Oligomers and oligomer conjugates |
SG11201702877TA (en) | 2014-10-10 | 2017-05-30 | Hoffmann La Roche | Galnac phosphoramidites, nucleic acid conjugates thereof and their use |
EP3325097B1 (en) | 2015-07-17 | 2021-09-01 | Arcturus Therapeutics, Inc. | Compositions and agents against hepatitis b virus and uses thereof |
CN115957337A (zh) | 2015-08-07 | 2023-04-14 | 箭头药业股份有限公司 | 乙型肝炎病毒感染的RNAi疗法 |
MA45496A (fr) | 2016-06-17 | 2019-04-24 | Hoffmann La Roche | Molécules d'acide nucléique pour la réduction de l'arnm de padd5 ou pad7 pour le traitement d'une infection par l'hépatite b |
US11504391B1 (en) | 2016-11-23 | 2022-11-22 | Alnylam Pharmaceuticals, Inc. | Modified RNA agents with reduced off-target effect |
-
2019
- 2019-07-11 AU AU2019300324A patent/AU2019300324A1/en not_active Abandoned
- 2019-07-11 BR BR112021000538-2A patent/BR112021000538A2/pt unknown
- 2019-07-11 MX MX2021000404A patent/MX2021000404A/es unknown
- 2019-07-11 KR KR1020217004297A patent/KR20210033004A/ko not_active Application Discontinuation
- 2019-07-11 EP EP19739971.0A patent/EP3821013A1/en active Pending
- 2019-07-11 CA CA3106288A patent/CA3106288A1/en active Pending
- 2019-07-11 JP JP2021500833A patent/JP2021524277A/ja active Pending
- 2019-07-11 CN CN201980047097.2A patent/CN112534055A/zh active Pending
- 2019-07-11 SG SG11202100348SA patent/SG11202100348SA/en unknown
- 2019-07-11 CR CR20210015A patent/CR20210015A/es unknown
- 2019-07-11 PE PE2020002231A patent/PE20211306A1/es unknown
- 2019-07-11 WO PCT/EP2019/068639 patent/WO2020011902A1/en unknown
- 2019-07-12 TW TW108124604A patent/TWI791868B/zh active
-
2021
- 2021-01-03 IL IL279929A patent/IL279929A/en unknown
- 2021-01-05 CL CL2021000018A patent/CL2021000018A1/es unknown
- 2021-01-13 US US17/147,797 patent/US20210147850A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
SG11202100348SA (en) | 2021-02-25 |
US20210147850A1 (en) | 2021-05-20 |
TW202020152A (zh) | 2020-06-01 |
CN112534055A (zh) | 2021-03-19 |
CL2021000018A1 (es) | 2021-07-09 |
IL279929A (en) | 2021-03-01 |
CA3106288A1 (en) | 2020-01-16 |
BR112021000538A2 (pt) | 2021-04-06 |
CR20210015A (es) | 2021-03-22 |
TWI791868B (zh) | 2023-02-11 |
PE20211306A1 (es) | 2021-07-20 |
EP3821013A1 (en) | 2021-05-19 |
AU2019300324A1 (en) | 2021-01-21 |
MX2021000404A (es) | 2021-03-25 |
JP2021524277A (ja) | 2021-09-13 |
WO2020011902A1 (en) | 2020-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2768699C2 (ru) | МОЛЕКУЛЫ НУКЛЕИНОВЫХ КИСЛОТ ДЛЯ УМЕНЬШЕНИЯ УРОВНЯ мРНК PAPD5 ИЛИ PAPD7 ДЛЯ ЛЕЧЕНИЯ ИНФЕКЦИОННОГО ГЕПАТИТА В | |
AU2020233603A1 (en) | Compositions and methods | |
CN109477106B (zh) | 二酰基甘油酰基转移酶2(dgat2)的调节剂 | |
DK2742135T3 (en) | BINDING MODIFIED GAPPED OLIGOMERIC COMPOUNDS AND APPLICATIONS THEREOF | |
KR101900770B1 (ko) | 근육긴장성 이영양증-단백질 키나제(dmpk) 발현의 조절 방법 | |
CN107429250B (zh) | 用于调节tmprss6表达的化合物和方法 | |
DK2906256T3 (en) | SELECTIVE ANTISENSE COMPOUNDS AND APPLICATIONS THEREOF | |
DK2475675T3 (en) | MODULATION OF HUNTINGTIN EXPRESSION | |
DK2534248T3 (en) | SELECTIVE REDUCTION OF ALLELVARIANS | |
KR101853509B1 (ko) | 췌장 발달 유전자에 대한 천연 안티센스 전사체의 억제에 의한 췌장 발달 유전자와 관련된 질환의 치료 | |
AU2020267230A1 (en) | Compounds and methods for reducing tau expression | |
KR102585973B1 (ko) | 타우 발현을 조절하기 위한 올리고뉴클레오티드 | |
AU2021203300B2 (en) | Nucleic acid molecule for reduction of PAPD5 and PAPD7 mRNA for treating hepatitis B infection | |
KR20190025970A (ko) | Htra1 발현을 조절하기 위한 안티센스 올리고뉴클레오티드 | |
KR101839177B1 (ko) | Ptpib 발현의 안티센스 조절 | |
KR20200140853A (ko) | B형 간염 바이러스 감염을 치료하기 위한 fubp1 억제제의 용도 | |
TW202325310A (zh) | Pcsk9表現之調節劑 | |
KR20210033004A (ko) | Rtel1의 발현을 조절하기 위한 올리고뉴클레오티드 | |
KR20200015608A (ko) | Htra1 발현을 조절하기 위한 안티센스 올리고뉴클레오티드 | |
KR20230137958A (ko) | 헌팅틴을 조절하기 위한 화합물 및 방법 | |
TW202246500A (zh) | 用於抑制 rtel1 表現之增強型寡核苷酸 | |
CN116888265A (zh) | 用于抑制rtel1表达的增强寡核苷酸 | |
KR20200104339A (ko) | Htra1 rna 길항제에 대한 동반 진단제 | |
CN115516091A (zh) | Cops3抑制剂用于治疗乙型肝炎病毒感染的用途 | |
US20040115650A1 (en) | Modulation of MAD1-like 1 expression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal |