KR20230028475A - Fubp1 발현을 조절하기 위한 개선된 올리고뉴클레오타이드 - Google Patents

Fubp1 발현을 조절하기 위한 개선된 올리고뉴클레오타이드 Download PDF

Info

Publication number
KR20230028475A
KR20230028475A KR1020237002523A KR20237002523A KR20230028475A KR 20230028475 A KR20230028475 A KR 20230028475A KR 1020237002523 A KR1020237002523 A KR 1020237002523A KR 20237002523 A KR20237002523 A KR 20237002523A KR 20230028475 A KR20230028475 A KR 20230028475A
Authority
KR
South Korea
Prior art keywords
conjugate
antisense oligonucleotide
fubp1
nucleosides
seq
Prior art date
Application number
KR1020237002523A
Other languages
English (en)
Inventor
사빈 제빙
쇠렌 오토센
야콥 라븐
리케 페데르센
소우팔론 루앙사이
에리히 콜러
요한나 마리 발터
헬레네 마리아 길링
나타샤 흐루슈카
수잔네 모르
발렌티나 다리엔소
Original Assignee
에프. 호프만-라 로슈 아게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에프. 호프만-라 로슈 아게 filed Critical 에프. 호프만-라 로슈 아게
Publication of KR20230028475A publication Critical patent/KR20230028475A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/712Nucleic acids or oligonucleotides having modified sugars, i.e. other than ribose or 2'-deoxyribose
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7125Nucleic acids or oligonucleotides having modified internucleoside linkage, i.e. other than 3'-5' phosphodiesters
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/20Antivirals for DNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/323Chemical structure of the sugar modified ring structure
    • C12N2310/3231Chemical structure of the sugar modified ring structure having an additional ring, e.g. LNA, ENA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/33Chemical structure of the base
    • C12N2310/334Modified C
    • C12N2310/33415-Methylcytosine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/34Spatial arrangement of the modifications
    • C12N2310/341Gapmers, i.e. of the type ===---===
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3515Lipophilic moiety, e.g. cholesterol
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/33Alteration of splicing

Abstract

본 발명은 원위 상류 요소-결합 단백질 1(Far Upstream element-Binding Protein 1, FUBP1)에 상보적이고 FUBP1 표적 핵산, 예를 들어, FUBP1 mRNA를 감소시킬 수 있는 개선된 안티센스 올리고뉴클레오타이드에 관한 것이다. 본 발명은 B형 간염 바이러스(HBV) 감염, 특히 만성 HBV 감염을 치료 및/또는 예방하는데 사용하기 위한, FUBP1을 표적으로 하는 개선된 안티센스 올리고뉴클레오타이드 또는 이의 접합체에 관한 것이다. 본 발명은 특히 cccDNA, 예를 들어, HBV cccDNA를 탈안정화하기 위한, FUBP1을 표적으로 하는 개선된 안티센스 올리고뉴클레오타이드 또는 이의 접합체의 용도에 관한 것이다. 본 발명은 또한 암 치료에 사용하기 위한, FUBP1을 표적으로 하는 개선된 안티센스 올리고뉴클레오타이드 또는 이의 접합체에 관한 것이다. 또한 HBV 감염의 치료 및/또는 예방에 있어서의 약학 조성물 및 이의 용도, 또는 암 치료에 있어서 이의 용도가 본 발명에 포함된다.

Description

FUBP1 발현을 조절하기 위한 개선된 올리고뉴클레오타이드
발명의 분야
본 발명은 원위 상류 요소-결합 단백질 1(Far Upstream element-Binding Protein 1, FUBP1)에 상보적이고 FUBP1 표적 핵산, 예를 들어, FUBP1 mRNA를 감소시킬 수 있는 개선된 안티센스 올리고뉴클레오타이드에 관한 것이다. 본 발명은 B형 간염 바이러스(HBV) 감염, 특히 만성 HBV 감염을 치료 및/또는 예방하는데 사용하기 위한, FUBP1을 표적으로 하는 개선된 안티센스 올리고뉴클레오타이드 또는 이의 접합체에 관한 것이다. 본 발명은 특히 cccDNA, 예를 들어, HBV cccDNA를 탈안정화하기 위한, FUBP1을 표적으로 하는 개선된 안티센스 올리고뉴클레오타이드 또는 이의 접합체의 용도에 관한 것이다. 본 발명은 또한 암 치료에 사용하기 위한, FUBP1을 표적으로 하는 개선된 안티센스 올리고뉴클레오타이드 또는 이의 접합체에 관한 것이다. 또한 HBV 감염의 치료 및/또는 예방에 있어서의 약학 조성물 및 이의 용도, 또는 암 치료에 있어서 이의 용도가 본 발명에 포함된다.
배경
원위 상류 요소-결합 단백질 1(FUBP1 또는 FBP1)은 여러 DNA 요소에 결합하는 단일 가닥 DNA 결합 단백질이다. 이 단백질은 또한 RNA에 결합하는 것으로 생각되며 DNA-DNA 및 RNA-RNA 듀플렉스 모두에 대한 시험관 내 활성과 함께 3'-5' 헬리카제 활성을 포함한다. FUBP1은 미분화 세포에서 c-myc의 상류에 위치한 원위 상류 요소(FUSE)에 결합하여 원암유전자 c-myc의 전사를 활성화시키는 것으로 알려져 있다. 이 단백질은 주로 세포의 핵에 존재한다. FUBP1의 상향조절은 많은 유형의 암에서 관찰되었다. 또한, FUBP1은 C형 간염 바이러스 및 엔테로바이러스로부터의 RNA에 결합하여 복제를 매개할 수 있다(Zhang and Chen 2013 Oncogene vol 32 p. 2907-2916).
FUBP1은 또한 HCC 종양 형성에 관여하는 것으로 제안되었던 간세포 암종(HCC)에서 확인되었으며(Ramdzan 외, 2008 Proteomics Vol 8 p. 5086-5096), FUBP1은 렌티바이러스-발현된 shRNA 표적화 FUBP1을 사용하여 예증된 바와 같이 HCC 종양 성장에 필요한 것으로 확인된 바 있다(Rabenhorst 외, 2009 Hepatology vol 50 p 1121-1129).
렌티바이러스-발현된 shRNA에 의한 FUBP1의 녹다운이 난소암에서 치료 반응을 개선시킨다는 것이 증명되었다(Zhang 외, 2017 Oncology Letters Vol 14 p. 5819-5824).
WO 2004/027061에는 테스트 물질이 FBP(FBP는 이제 FUBP라 지칭됨)를 억제하는지 여부를 분석하는 단계를 포함하는 스크리닝 방법 및 FBP를 억제하는 물질을 유효성분(들)으로 함유하는 증식성 질환 치료용 의약 조성물이 개시되어 있다.
폴리(U) 결합 스플라이싱 인자 60(PUF60)은 HBV 프리게놈 발현의 전사 및 전사 후 단계 모두의 잠재적인 조절자이다. PUF60은 c-myc 억제와 관련하여 FUBP1과 복합체를 형성하는 것으로 알려져 있다. 그러나 FUBP1은 HBV 프리게놈 발현의 PUF60 의존적 조절에 참여하지 않는다(Sun 외, 2017 Scientific Reports 7:12874).
HBV 감염은 전 세계적으로 약 3억 5천만 명의 만성 감염 보균자에게 영향을 미치는 주요 건강 문제로 남아 있다. 보균자의 약 25%는 궁극적으로 만성 간염, 간경화 또는 간암으로 사망한다. B형 간염 바이러스는 담배 다음으로 중요한 발암 물질로 모든 원발성 간암의 60 내지 80%를 유발한다. HBV는 HIV보다 100배 더 전염성이 있다.
B형 간염 바이러스(HBV)는 외피가 있는 부분적 이중 가닥 DNA 바이러스다. 소형 3.2kb HBV 게놈은 각각 코어, 폴리머라제(Pol), 외피 및 X-단백질을 인코딩하는 4개의 중복 오픈 리딩 프레임(ORF)으로 구성된다. Pol ORF는 가장 길고 외피 ORF는 그 안에 위치하며 X와 코어 ORF는 Pol ORF와 중복된다. HBV 게놈의 복제 주기에는 다음과 같은 두 가지 주요 이벤트가 있다: 1) 이완된 원형(RC DNA)으로부터 폐쇄된 원형 DNA(cccDNA)를 생성, 및 2)프리게놈 RNA(pgRNA)를 역전사하여 RC DNA를 생성. RC DNA는 감염 바이러스 입자 또는 세포내 복제 중간체로부터 유래할 수 있다.
HBsAg 정량화는 만성 B형 간염의 예후 및 치료 반응에 대한 중요한 바이오마커이며 만성적으로 감염된 환자에서 순환 HBsAg의 소실(loss)은 완치 달성의 핵심 이벤트로 간주된다. 그러나 HBsAg 소실 및 혈청전환(기능적 치유)의 달성은 만성 감염 환자에서 거의 관찰되지 않는다. B형 간염 e-항원(HBV 외피 항원 또는 HBeAg라고도 함)은 B형 간염 감염된 세포에서 분비되는 바이러스 단백질이다. HBeAg는 만성 B형 간염 감염과 연관이 있으며 활동성 바이러스 질환과 환자의 감염 정도를 나타내는 마커로 사용된다.
따라서, HBsAg의 분비에 더하여 HBeAg의 분비를 감소시키는 것은 HBsAg만의 분비 억제와 비교하여 만성 HBV 감염의 발달 억제를 개선시킬 것이다.
뉴클레오사(타)이드 유사체와 같은 현재 요법은 HBV DNA 합성을 억제하는 분자이지만 HBsAg 수준을 낮추는 것과는 관련이 없다. 현재 개발 중인 대부분의 요법은 지속적인 HBsAg 소실과 함께, 항-HB 혈청전환의 존재 또는 부재, 혈청 DNA 불검출, 및 전사적으로 비활성 상태인 cccDNA로 정의되는 기능적 완치에 도달하는 것을 목표로 하지만 cccDNA 지속성을 해결하지는 못한다. 대조적으로, HBV 감염의 완치는 지속적인 HBV DNA 및 HBsAg 소실과 함께 cccDNA 소실로 정의된다. 감염된 간세포에서 cccDNA의 지속성은 만성 B형 간염 바이러스(CHB) 환자에서 바이러스를 근절함에 주요 장벽이며, cccDNA를 제거하는 HBV 완치를 위한 새로운 요법 개발이 시급하다.
WO 2019/193165에서 소분자, siRNA 또는 LNA 안티센스 올리고뉴클레오타이드를 사용하여 FUBP1 기능성을 억제하면 HBV cccDNA가 감소하는 것으로 나타났다. WO 2019/193165의 실시예 섹션에서, FUBP1 발현을 억제할 수 있는 단일 가닥 LNA 갭머 올리고뉴클레오타이드를 분석하였다.
FUBP1을 특이적으로 억제할 수 있는 치료제가 필요하다. 우리는 인간 FUBP1을 표적으로 하는 2000개 이상의 안티센스 올리고뉴클레오타이드를 스크리닝하고 인간 FUBP1을 특이적으로 표적함에 특히 효능있고 유효한 서열 및 화합물들을 확인했다. 특히, 9개의 교번 연접 갭머가 확인되었으며, 이는 시험관 내에서 인간 FUBP1의 강력한 하향 조절을 제공했다. 8개의 화합물은 인간 FUBP1의 엑손 14 내 영역을 표적으로 하고, 하나의 화합물은 엑손 20 내 영역(화합물 식별 번호 18_1)을 표적으로 한다.
발명의 목적
본 발명은 FUBP1 발현을 조절하는 안티센스 올리고뉴클레오타이드 및 이의 접합체를 제공한다. 우리는 인간 FUBP1 전구-mRNA의 엑손 14 또는 엑손 20에 존재하는 특정 표적 서열을 확인했으며, 이는 안티센스 올리고뉴클레오타이드 또는 이의 접합체에 의해 표적화되어 효과적인 FUBP1 억제를 제공할 수 있다. 특히, 서열번호 1의 16184-16205번 위치를 표적하는 것이 FUBP1을 감소시키는 양상에서 유리하다.
또한, 우리는 인간 FUBP1 전구-mRNA의 엑손 20에 존재하는 특정 표적 서열을 확인했으며, 이는 안티센스 올리고뉴클레오타이드 또는 이의 접합체에 의해 표적화되어 효과적인 FUBP1 억제를 제공할 수 있다. 특히, 서열번호 1의 30536-30553번 위치를 표적하는 것이 FUBP1을 감소시키는 양상에서 유리하다.
따라서, 본 발명의 목적은 FUBP1을 표적으로 하는 개선된 안티센스 올리고뉴클레오타이드 또는 이의 접합체를 제공하는 것이며, 여기서 안티센스 올리고뉴클레오타이드 또는 이의 접합체는 시험관내 및 생체내에서 FUBP1의 발현을 억제함으로써 HBV 감염 세포에서 cccDNA를 감소시킬 수 있다. FUBP1을 표적으로 하는 개선된 안티센스 올리고뉴클레오타이드 또는 이의 접합체는 HBV 감염의 치료 및/또는 예방 또는 암 치료에 사용될 수 있다.
발명의 요약
본 발명은 포유동물 FUBP1 핵산과 같은 FUBP1(원위 상류 요소 결합 단백질 1) 핵산을 표적으로 하고 상기 핵산을 발현하는 세포에서 상기 핵산의 발현을 억제할 수 있는 안티센스 올리고뉴클레오타이드 또는 이의 접합체, 및 의약에서의 이의 용도에 관한 것이다. 상기 안티센스 올리고뉴클레오타이드는 인간 FUBP1과 같은 포유동물 FUBP1 핵산에 대해 상보적이다.
본 발명은 인간 FUBP1 전구-mRNA(서열번호 1로 예시)의 뉴클레오타이드 16184 내지 16205 영역에 상보적인, 예를 들어, 완전히 상보적인 연속 뉴클레오타이드 서열을 포함하는 안티센스 올리고뉴클레오타이드를 제공한다.
또한, 본 발명은 인간 FUBP1 전구-mRNA(서열번호 1로 예시)의 뉴클레오타이드 30536-30553 영역에 상보적인, 예를 들어, 완전히 상보적인 연속 뉴클레오타이드 서열을 포함하는 안티센스 올리고뉴클레오타이드를 제공한다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드 또는 연속 뉴클레오타이드 서열은 서열번호 1의 뉴클레오타이드 16184 내지 16200의 영역에 상보적, 예를 들어, 완전히 상보적이다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드 또는 연속 뉴클레오타이드 서열은 서열번호 1의 뉴클레오타이드 16186 내지 16203의 영역에 상보적, 예를 들어, 완전히 상보적이다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드 또는 연속 뉴클레오타이드 서열은 서열번호 1의 뉴클레오타이드 30536-30553의 영역에 상보적, 예를 들어, 완전히 상보적이다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드 또는 연속 뉴클레오타이드 서열은 서열번호 1의 뉴클레오타이드 16188 내지 16205의 영역에 상보적, 예를 들어, 완전히 상보적이다. 일부 실시형태에서, 안티센스 올리고뉴클레오타이드 또는 연속 뉴클레오타이드 서열은 서열번호 1의 뉴클레오타이드 16189 내지 16205의 영역에 상보적, 예를 들어, 완전히 상보적이다.
본 발명의 안티센스 올리고뉴클레오타이드는 전형적으로 12-30개, 예를 들어, 12 내지 22개, 예를 들어, 16 내지 20개 뉴클레오타이드 길이이고, 적어도 12개 뉴클레오타이드, 예를 들어 13, 14, 15, 16, 17 또는 18개의 뉴클레오타이드의 연속 뉴클레오타이드 서열을 포함하는데, 이는 서열번호 1의 뉴클레오타이드 16184-16205, 16184-16200, 16186-16203, 16188-16205, 16189-16205 및 30536-30553의 영역으로부터 선택된 인간 FUBP1 전구-mRNA(서열번호 1로 예시)의 영역에 상보적, 예를 들어, 완전히 상보적이다.
본 발명은 12-22개 뉴클레오타이드 길이의 안티센스 올리고뉴클레오타이드를 제공하며, 상기 안티센스 올리고뉴클레오타이드는 12-22개 뉴클레오타이드 길이의 연속 뉴클레오타이드 서열을 포함하고, 연속 뉴클레오타이드 서열은 서열번호 10에 대해 상보적, 예를 들어 완전히 상보적이다.
본 발명은 12-20개 뉴클레오타이드 길이(예를 들어, 15, 16, 17, 또는 18개 뉴클레오타이드 길이)의 안티센스 올리고뉴클레오타이드를 제공하며, 상기 안티센스 올리고뉴클레오타이드는 12-18개 뉴클레오타이드 길이(예를 들어, 15, 16, 17, 또는 18개 뉴클레오타이드 길이)의 연속 뉴클레오타이드 서열을 포함하고, 연속 뉴클레오타이드 서열은 서열번호 11에 대해 상보적, 예를 들어 완전히 상보적이다.
본 발명은 12-20개 뉴클레오타이드 길이(예를 들어, 15, 16, 17, 또는 18개 뉴클레오타이드 길이)의 안티센스 올리고뉴클레오타이드를 제공하며, 상기 안티센스 올리고뉴클레오타이드는 12-18개 뉴클레오타이드 길이(예를 들어, 15, 16, 17, 또는 18개 뉴클레오타이드 길이)의 연속 뉴클레오타이드 서열을 포함하고, 연속 뉴클레오타이드 서열은 서열번호 19에 대해 상보적, 예를 들어 완전히 상보적이다.
본 발명은 10 -30개 뉴클레오타이드 길이의 연속 뉴클레오타이드 서열을 포함하는 10 내지 30개 뉴클레오타이드 길이의 안티센스 올리고뉴클레오타이드를 제공하며, 여기서 연속 뉴클레오타이드 서열은 서열번호 6, 7, 8, 9 및 18로 구성된 군으로부터 선택된 서열에 100% 동일하거나; 또는 이의 적어도 14개 연속 뉴클레오타이드이다.
본 발명은 10 -30개 뉴클레오타이드 길이의 연속 뉴클레오타이드 서열을 포함하는 10 내지 30개 뉴클레오타이드 길이의 안티센스 올리고뉴클레오타이드를 제공하며, 여기서 연속 뉴클레오타이드 서열은 서열번호 6, 7, 8, 9 및 18로 구성된 군으로부터 선택된 서열에 100% 동일하거나; 또는 이의 적어도 15개 연속 뉴클레오타이드이다.
본 발명은 10 -30개 뉴클레오타이드 길이의 연속 뉴클레오타이드 서열을 포함하는 10 내지 30개 뉴클레오타이드 길이의 안티센스 올리고뉴클레오타이드를 제공하며, 여기서 연속 뉴클레오타이드 서열은 서열번호 6, 7, 8, 9 및 18로 구성된 군으로부터 선택된 서열에 100% 동일하거나; 또는 이의 적어도 16개 연속 뉴클레오타이드이다.
본 발명은 서열번호 6, 7, 8, 9 및 18로 구성된 군으로부터 선택된 서열에 100% 동일하거나, 또는 이의 14, 15, 16, 또는 17개 연속 뉴클레오타이드인 연속 뉴클레오타이드 서열을 포함하는 안티센스 올리고뉴클레오타이드를 제공한다.
본 발명은 서열번호 6, 7, 8, 9 및 18로 구성된 군으로부터 선택된 연속 뉴클레오타이드 서열을 포함하는(또는 이들로 구성된) 안티센스 올리고뉴클레오타이드를 제공한다.
본 발명은 서열번호 6(CTTATGCTTTTTATGGT)에 100% 동일하거나, 또는 이의 14, 15, 또는 16개 연속 뉴클레오타이드인 연속 뉴클레오타이드 서열을 포함하는 안티센스 올리고뉴클레오타이드를 제공한다.
본 발명은 서열번호 7(CTTATGCTTTTTATGGTT)에 100% 동일하거나, 또는 이의 14, 15, 16, 또는 17개 연속 뉴클레오타이드인 연속 뉴클레오타이드 서열을 포함하는 안티센스 올리고뉴클레오타이드를 제공한다.
본 발명은 서열번호 서열번호 8(GCTTTTTATGGTTTCAC)에 100% 동일하거나, 또는 이의 14, 15, 또는 16개 연속 뉴클레오타이드인 연속 뉴클레오타이드 서열을 포함하는 안티센스 올리고뉴클레오타이드를 제공한다.
본 발명은 서열번호 9(TATGCTTTTTATGGTTTC)에 100% 동일하거나, 또는 이의 14, 15, 16, 또는 17개 연속 뉴클레오타이드인 연속 뉴클레오타이드 서열을 포함하는 안티센스 올리고뉴클레오타이드를 제공한다.
본 발명은 서열번호 18(ACCAATTTTCATTTCTAC)에 100% 동일하거나, 또는 이의 14, 15, 16, 또는 17개 연속 뉴클레오타이드인 연속 뉴클레오타이드 서열을 포함하는 안티센스 올리고뉴클레오타이드를 제공한다.
본 발명은 다음으로부터 선택된 안티센스 올리고뉴클레오타이드를 제공한다:
CTTatGctttttatgGT (서열번호 6, 화합물 식별 번호 6_1),
CTTaTgctttttatgGT (서열번호 6, 화합물 식별 번호 6_2),
CTtATgctttttatgGTT (서열번호 7, 화합물 식별 번호 7_1),
CTtAtgctttttatgGTT (서열번호 7, 화합물 식별 번호 7_2),
CTtAtgctttttatGgTT (서열번호 7, 화합물 식별 번호 7_3),
CTtAtgctttttatGGTT (서열번호 7, 화합물 식별 번호 7_4),
GcttTttatggtTtCAC (서열번호 8, 화합물 식별 번호 8_1),
TATgcTttttatggtTTC (서열번호 9, 화합물 식별 번호 9_1), 및
AcCAAttttcatttCtAC (서열번호 18, 화합물 식별 번호 18_1)
여기서 대문자는 베타-D-옥시 LNA 뉴클레오사이드이고, 소문자는 DNA 뉴클레오사이드이고, 모든 LNA C는 LNA 5-메틸 시토신이고, 모든 뉴클레오사이드간 연결은 포스포로티오에이트 뉴클레오사이드간 연결이다.
본 발명은 또한 본 발명의 안티센스 올리고뉴클레오타이드의 약학적으로 허용되는 염을 제공한다.
본 발명은 표 1에 열거된 군으로부터 선택된 안티센스 올리고뉴클레오타이드 또는 이의 약학적으로 허용되는 염을 제공한다.
표 1. 화합물 표(본 발명의 예시적인 안티센스 올리고뉴클레오타이드) - HELM 주석 형식
Figure pct00001
Helm 주석 키:
[LR](G)는 베타-D-옥시-LNA 구아닌 뉴클레오사이드이고,
[LR](T)는 베타-D-옥시-LNA 티민 뉴클레오사이드이고,
[LR](A)는 베타-D-옥시-LNA 아데닌 뉴클레오사이드이고,
[LR]([5meC]는 베타-D-옥시-LNA 5-메틸 시토신 뉴클레오사이드이고,
[dR](G)는 DNA 구아닌 뉴클레오사이드이고,
[dR](T)는 DNA 티민 뉴클레오사이드이고,
[dR](A)는 DNA 아데닌 뉴클레오사이드이고,
[dR]([C]는 DNA 시토신 뉴클레오사이드이고,
[SP].는 포스포로티오에이트 뉴클레오사이드간 연결이고,
P.는 포스포디에스테르 뉴클레오사이드간 연결이다.
따라서 본 발명은 화합물 식별 번호 # 6_1, 6_2, 7_1, 7_2, 7_3, 7_4; 8_1 및 9_1로 구성된 군으로부터 선택된 안티센스 올리고뉴클레오타이드를 제공한다.
본 발명은 화합물 식별 번호: 18_1의 안티센스 올리고뉴클레오타이드를 추가로 제공한다:
한 실시형태에서, 안티센스 올리고뉴클레오타이드는 WO 2019/193165에 개시된 바와 같은 안티센스 올리고뉴클레오타이드 화합물 식별 번호 53_1 또는 54_1이 아니다(또한 실시예 섹션의 표 7 참조).
한 실시형태에서, 안티센스 올리고뉴클레오타이드는 WO 2019/193165에 개시된 바와 같은 안티센스 올리고뉴클레오타이드 화합물 식별 번호 78_1 및 79_1이 아니다(또한 실시예 섹션의 표 7 참조).
본 발명은 본 발명의 안티센스 올리고뉴클레오타이드, 및 상기 안티센스 올리고뉴클레오타이드에 공유적으로 부착된 적어도 하나의 접합체 모이어티를 추가로 포함한다.
일부 실시형태에서, 접합체 모이어티는 인간 아시알로당단백질 수용체와 같은 아시알로당단백질 수용체에 결합할 수 있다. 예를 들어, 접합체 모이어티는 갈락토스, 갈락토사민, N-포르밀-갈락토사민, N-아세틸갈락토사민, N-프로피오닐-갈락토사민, N-n-부타노일-갈락토사민 및 N-이소부타노일갈락토사민으로 구성된 군으로부터 선택되는 적어도 하나의 아시알로당단백질 수용체-표적화 모이어티를 포함할 수 있다.
일부 실시형태에서, 아시알로당단백질 수용체-표적화 모이어티는 N-아세틸갈락토사민(GalNAc)이다. 따라서, 본 발명의 안티센스 올리고뉴클레오타이드는 적어도 하나의 N-아세틸갈락토사민(GalNAc) 모이어티를 포함하는 적어도 하나의 접합체 모이어티, 예를 들어, 아래 기재된 바와 같이 적어도 하나의 N-아세틸갈락토사민(GalNAc) 모이어티를 포함하는 적어도 하나의 접합체 모이어티에 접합될 수 있다. 본 발명의 한 양상에 따르면, 접합체 모이어티는 다음에 기재된 바와 같은 GalNAc 잔기 R이다.
일부 실시형태에서, 접합체 모이어티는 적어도 3가, 예를 들어, 2가, 3가 또는 4가 GalNAc 잔기 R이다. 바람직하게는 접합체 모이어티는 3가 GalNAc 잔기 R이다. 본원에서 사용되는 용어 “3가 GalNAc 잔기”는 3개의 N-아세틸갈락토사민 잔기, 즉 바람직하게는 다음 화학식의 3개의 모이어티를 포함하는 잔기이다.
Figure pct00002
각각의 접합체 모이어티 또는 GalNAc 잔기 R 및 안티센스 올리고뉴클레오타이드는 링커 L, 예를 들어, 생체절단가능한 링커 L을 통해 함께 연결될 수 있다. 따라서, 접합체 화합물은 안티센스 올리고뉴클레오타이드와 각각의 접합체 모이어티 또는 GalNAc 잔기 R 사이에 위치한 링커 L을 포함할 수 있다.
일부 실시형태에서, 링커 L은 1 내지 10개의 연결된 뉴클레오사이드, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 연결된 뉴클레오사이드, 예를 들어, 2 내지 6개의 연결된 뉴클레오사이드, 예를 들어 2 내지 5개의 연결된 뉴클레오사이드, 예를 들어 2 내지 4개의 연결된 뉴클레오사이드를 포함한다. 일부 실시형태에서, 링커는 2개의 연결된 뉴클레오타이드를 포함한다. 따라서, 뉴클레오사이드는 DNA 뉴클레오사이드일 수 있다. 전형적으로, 뉴클레오사이드는 포스포디에스테르 뉴클레오사이드간 연결을 통해 연결된다. 더욱이, 링커 L은 포스포디에스테르 뉴클레오사이드간 연결을 통해 안티센스 화합물에 연결될 수 있다.
예시적인 접합체는 표 2(HELM 주석 형식) 및 도 1 내지 8, 도 8.1 및 도 10에 제공된다.
본 발명은 표 2에 열거된 접합체 군으로부터 선택된 접합체 또는 이의 약학적으로 허용되는 염을 제공한다.
표 2. 화합물 표(본 발명의 예시적인 접합체) - HELM 주석 형식(HELM 주석의 주석에 대해서는 표 1에 대한 설명 참조).
Figure pct00003
Figure pct00004
상기 표에서 [5gn2c6]는 다음 화학식을 갖는 GalNAc 잔기 R이다:
Figure pct00005
상기 도면에 도시되고 상기 표에 사용된 R은 도 9D1 및 9D2에 도시된 2개의 입체이성질체의 혼합물임을 이해해야 한다.
본 발명의 추가 양상에 따르면, 상기 도면에 도시되고 상기 표에 사용된 R은 도 9D1에 도시된 바와 같은 입체이성질체이다.
본 발명의 추가 양상에 따르면, 상기 도면에 도시되고 상기 표에 사용된 R은 도 9D1에 도시된 바와 같은 입체이성질체이다. 표 2에 제공된 접합체의 구조는 도 1 내지 8 및 8.1에 도시되어 있다.
본 발명은 도 1의 접합체 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 화합물 식별 번호 6_1의 안티센스 올리고뉴클레오타이드 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 도 2의 접합체 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 화합물 식별 번호 6_2의 안티센스 올리고뉴클레오타이드 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 도 3의 접합체 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 화합물 식별 번호 7_1의 안티센스 올리고뉴클레오타이드 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 도 4의 접합체 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 화합물 식별 번호 7_2의 안티센스 올리고뉴클레오타이드 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 도 5의 접합체 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 화합물 식별 번호 7_3의 안티센스 올리고뉴클레오타이드 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 도 6의 접합체 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 화합물 식별 번호 7_4의 안티센스 올리고뉴클레오타이드 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 도 7의 접합체 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 화합물 식별 번호 8_1의 안티센스 올리고뉴클레오타이드 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 도 8의 접합체 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 화합물 식별 번호 9_1의 안티센스 올리고뉴클레오타이드 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 화합물 식별 번호 18_1의 안티센스 올리고뉴클레오타이드 또는 이의 약학적으로 허용되는 염을 제공한다.
본 발명은 도 8.1의 접합체 또는 이의 약학적으로 허용되는 염을 제공한다.
화학식 (I)의 화합물
본 발명은 또한 다음 화학식 (I)의 화합물을 제공한다.
Figure pct00006
(I)
여기서
n은 0 또는 1이고
p는 0 또는 1이고
단, n이 1인 경우 p는 바람직하게는 1이고,
그리고 단, n이 0이고 p가 0인 경우, R은 바람직하게는 H이고,
L은 링커이고, 바람직하게는 L은 2-10개의 뉴클레오사이드, 예를 들어, 2-5개의 뉴클레오사이드를 포함하거나 이로 구성된 링커이고,
R은 GalNAc 잔기, 바람직하게는 3가 GalNAc 잔기이고,
A는 본 발명에 따른 안티센스 올리고뉴클레오타이드 잔기이다.
용어 “안티센스 올리고뉴클레오타이드 잔기”는 -(L)n-(O-P(=O)(-OH)-)p-를 통해 잔기 R에 5' 말단을 통해 부착된 본 발명에 따른 안티센스 올리고뉴클레오타이드, 예를 들어 표 6에 나타낸 안티센스 올리고뉴클레오타이드를 의미한다. 바람직한 안티센스 올리고뉴클레오타이드 잔기는 도 1A, 2A, 3A, 4A, 5A, 6A, 7A 및 8A에 도시되어 있다. 추가의 바람직한 안티센스 올리고뉴클레오타이드 잔기는 도 8.1A에 도시되어 있다.
GalNAc 잔기 R
R은 GalNAc 잔기, 바람직하게는 3가 GalNAc 잔기이다. 본원에 사용된 용어 “GalNAc 잔기”는 적어도 하나의 N-아세틸갈락토사민(GalNAc) 모이어티, 즉, 적어도 하나의 다음 화학식의 모이어티를 포함하는 잔기를 의미한다:
Figure pct00007
본원에 사용된 용어 “3가 GalNAc 잔기”는 3개의 N-아세틸갈락토사민(GalNAc) 모이어티, 즉, 바람직하게는 다음 화학식의 3개의 모이어티를 포함하는 잔기를 의미한다:
Figure pct00008
바람직하게는, GalNAc 잔기는 다음 구조를 갖는 적어도 하나, 바람직하게는 3개의 GalNAc 빌딩 블록(La)을 포함하고,
Figure pct00009
(La)
여기서 링커a는 알킬기, 알킬-옥시-알킬기, 적어도 하나의 포스포디에스테르 연결을 포함하는 알킬기, 적어도 하나의 아미드 연결을 포함하는 알킬기, 적어도 하나의 포스포디에스테르 연결을 포함하는 알킬-옥시-알킬기 및 적어도 하나의 아미드 연결을 포함하는 알킬-옥시-알킬기로부터 선택된다.
용어 “알킬”은 C1 내지 C20 알킬기, 바람직하게는 C2 내지 C8, 예를 들어 C2, C3, C4, C5, C6, C7 또는 C8, 알킬기와 같은 치환되거나 비치환된 선형 또는 분지형 알킬기를 의미한다. 바람직하게는 알킬기는 비치환, 더욱 바람직하게는 선형의 비치환된 알킬기이다.
용어 “알킬-옥시-알킬” 기는 산소를 통해 연결된 적어도 2개의 알킬기, 바람직하게는 에틸-옥시-에틸기, 예를 들어, -(CH2-O)x- 기를 의미하며, 이때 정수 x는 바람직하게는 2 내지 20 범위, 더욱 바람직하게는 2 내지 6 범위, 예를 들어 2, 3, 4, 5 또는 6이고, 더욱 바람직하게는 x는 3 또는 5이다.
본 발명의 양상에 따르면, GalNAc 빌딩 블록(La)은 다음 구조(La)의 기로부터 선택된다.
하나 이상의 잔기(La)가 GalNAc 잔기에 존재하는 경우(예를 들어, 3가 GalNAc 잔기의 3개 잔기), 모든 잔기는 바람직하게는 동일하다.
가장 바람직하게는, La는 다음 구조를 갖는다:
Figure pct00010
접합체 모이어티 R이 다중, 예를 들어, 바람직하게는 3개의 GalNAc 모이어티를 포함하는 경우, R은 GalNAc 빌딩 블록(La) 외에 다가, 바람직하게는 4가 빌딩 블록(Lb)을 포함하고, 여기에 빌딩 블록(La)는 바람직하게는 -(L)n-(O-P(=O)(-OH)-)p-를 통해 안티센스 올리고뉴클레오타이드 잔기 A에 부착된다.
Lb는 바람직하게는 다음 구조식 중 하나로부터 선택된다:
Figure pct00011
X는 O 또는 S이고, Z는 O 또는 NH이고, 여기서 n은 1 내지 4, 바람직하게는 2 또는 3, 더 바람직하게는 2이다.
보다 바람직하게는, Lb는 다음 구조식을 가지며:
Figure pct00012
,
Lb는 구조식 Lb* 또는 구조식 Lb**를 갖거나 이들의 혼합물인 것으로 이해되어야 한다. 바람직한 양상에 따르면 Lb는 Lb*와 Lb**의 혼합물이다:
Figure pct00013
(Lb*)
Figure pct00014
(Lb**).
따라서, 접합 모이어티 R은 바람직하게는 구조식 (La)3-Lb-를 포함하고, 보다 바람직하게는 R은 다음 구조식 중 하나
Figure pct00015
더 바람직하게는 다음 구조식을 포함하고
Figure pct00016
,
여기서 Lb는 바람직하게는 Lb* 및 Lb**의 혼합물이고,
X는 O 또는 S이고, Z는 O 또는 NH이고, n은 1 내지 3, 바람직하게는 2이고, La는 상기 기재된 바와 같으며, 바람직하게는 La는 다음:
Figure pct00017
및 이들의 혼합물로 구성된 군으로부터 선택되고, 바람직하게는 GalNAc 잔기 내의 모든 잔기(La)는 동일하다.
(La)3-Lb가 다음과 같은 경우
Figure pct00018
La는 더욱 바람직하게는 다음으로 구성된 군으로부터 선택되고
Figure pct00019
(La)3-Lb
Figure pct00020
또는
Figure pct00021
이고,
바람직하게는
Figure pct00022
인 경우,
La는 바람직하게는 다음과 같다.
Figure pct00023
선택적으로, 접합체 모이어티 R은 링커 Lc를 추가로 포함한다. 따라서, R은 바람직하게는 구조식 (La)3-Lb-(Lc)c-를 가지며 정수 c는 1 또는 0이다.
이러한 링커 화합물은 당업자에게 공지되어 있고 (La)3-Lb를 해당 화합물의 나머지 부분, 즉, -(L)n-(O-P(=O)(-OH)-)p-를 통해 안티센스 올리고뉴클레오타이드 잔기에 부착하도록 적합하게 선택된다.
Lb의 구조식에 따라, Lc는 알킬, 알킬-옥시-알킬, 아미노-알킬(-NH-알킬-), 아미노-알킬-옥시-알킬, 비천연 아미노산 잔기 및 천연 아미노 잔기로 구성된 군으로부터 선택된다. 본 발명의 한 양상에 따르면, Lc는 치환 또는 비치환 리신기이다.
본 발명의 한 양상에 따르면, R은 c = 1인 (La)3-Lb-(Lc)c이고 (La)3-Lb는 다음과 같다.
Figure pct00024
Lc는 바람직하게는 아미노-알킬기 또는 아미노산, 예를 들어, 치환 또는 비치환 리신기이고, 특히, LC는 예를 들어 다음으로 구성된 군으로부터 선택되며:
Figure pct00025
아미노기는 Lb의 카르보닐기에 부착되어 아미드 결합을 형성한다. 이 양상에 따른 바람직한 잔기 R은 도 9A1, 9A2; 9C1, 9C2, 9D1, 9D2에 도시되어 있다. 따라서, 본 발명의 한 양상에 따르면, R은 도 9A1, 9A2, 9C1, 9C2, 9D1 및 9D2에 도시된 잔기로 구성된 군으로부터 선택된다.
본 발명의 추가 양상에 따르면, R은 구조식 (La)3-Lb-(Lc)c를 가지며, 여기서 c는 0이고, 여기서 (La)3-Lb는 다음과 같다:
Figure pct00026
본 발명의 이러한 양상에 따른 바람직한 잔기 R은 도 9B1 및 9B2에 도시되어 있다.
본 발명의 추가 양상에 따르면, R은 구조식 (La)3-Lb-(Lc)c를 가지며, 여기서 (L a )3-Lb는 다음과 같고
Figure pct00027
Z는 O이다. 이 경우, c는 바람직하게는 1이고 Lc는 바람직하게는 알킬기, 더 바람직하게는 C3 내지 C6 알킬기, 더 바람직하게는 프로필기, 가장 바람직하게는 n-프로필기이다. 이 양상에 따른 바람직한 잔기 R은 도 9E1, 9F1, 9G1 및 9H1에 도시되어 있다. 따라서, 본 발명의 한 양상에 따르면, R은 도 9E1, 9F1, 9G1 및 9H1에 도시된 잔기로 구성된 군으로부터 선택된다.
본 발명의 추가 양상에 따르면, R은 구조식 (La)3-Lb-(Lc)c를 가지며, 여기서 (L a )3-Lb는 다음과 같고
Figure pct00028
그리고 Z는 NH이다. 이 경우 c는 바람직하게는 1이고 Lc는 바람직하게는 알킬기, 아미노산 포함 기 또는 다음 구조식을 가지는 기이다.
Figure pct00029
특히, 이 경우 Lc
Figure pct00030
이다.
본 발명의 이러한 양상에 따른 바람직한 잔기 R은 도 9J1에 도시되어 있다.
본 발명의 추가 양상에 따르면, R은 구조식 (La)3-Lb-(Lc)c를 가지며, 여기서 (L a )3-Lb는 다음과 같고
Figure pct00031
Z는 NH이고 c는 0이다. 본 발명의 이러한 양상에 따른 바람직한 잔기 R은 도 9I1에 도시되어 있다.
본 발명의 한 양상에 따르면, R은 c = 0인 (La)3-Lb-(Lc)c이고 여기서 (La)3-Lb는 다음과 같다.
Figure pct00032
본 발명의 이러한 양상에 따른 바람직한 잔기 R은 도 9L1 및 9L2에 도시되어 있다.
따라서, R은 바람직하게는 도 9A1, 9A2; 9C1, 9C2, 9D1, 9D2, 9E1, 9F1, 9G1, 9H1, 9I1, 9J1, 9L1 9L2에 도시된 잔기, 및 이의 혼합물, 예를 들어, 9A1 및 9A2의; 9C1 및 9C2의 또는 9D1 및 9D2의 입체이성질체 혼합물로부터 선택되고, 더욱 바람직하게는 R은 9D1, 9D2에 도시된 잔기 및 이의 혼합물로부터 선택되고, 더욱 바람직하게는 R은 9D1 및 9D2에 도시된 잔기들의 혼합물, 예를 들어, 9D1 대 9D2의 몰비가 10: 90 내지 90:10 범위, 예를 들어, 30:70 내지 70:30 범위, 예를 들어, 45:55 내지 55:45 범위인 혼합물이다.
그러므로, 화합물 (I)은 바람직하게는 도 10A1, 10A2; 10C1, 10C2, 10D1, 10D2, 10E1, 10F1, 10G1, 10H1, 10I1, 10J1, 10L1, 10L2에 도시된 화합물 및 이의 혼합물, 예를 들어, 10A1 및 10A2의; 10C1 및 10C2의 또는 10D1, 10D2에 도시된 10D1 및 10D2의 입체이성질체 혼합물, 및 이의 혼합물로부터 선택되고, 더욱 바람직하게는 화합물(I)은 10D1 및 10D2에 도시된 화합물들의 혼합물, 예를 들어, 10D1 대 10 D2의 몰비가 10: 90 내지 90:10 범위, 예를 들어, 30:70 내지 70:30 범위, 예를 들어, 45:55 내지 55:45 범위인 혼합물이다.
링커 L
상기 화학식에서, L은 본원에 정의된 바와 같은 링커이고, 바람직하게는 L은 2-10개의 뉴클레오사이드, 예를 들어, 2-5개의 뉴클레오사이드, 예를 들어, 2개의 뉴클레오사이드를 포함하거나 이로 구성된 링커이고, 여기서 선택적으로 뉴클레오사이드는 포스포디에스테르 연결된 뉴클레오사이드이다.
링커 L은 1 내지 10개의 연결된 뉴클레오사이드, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 연결된 뉴클레오사이드, 예를 들어, 2 내지 6개의 연결된 뉴클레오사이드, 예를 들어 2 내지 5개의 연결된 뉴클레오사이드, 예를 들어 2 내지 4개의 연결된 뉴클레오사이드를 포함한다. 일부 실시형태에서, 링커는 2개의 연결된 뉴클레오타이드를 포함한다. 따라서, 뉴클레오사이드는 DNA 뉴클레오사이드일 수 있다. 전형적으로, 뉴클레오사이드는 포스포디에스테르 뉴클레오사이드간 연결을 통해 연결된다. 더욱이, 링커 L은 포스포디에스테르 뉴클레오사이드간 연결을 통해 안티센스 화합물에 연결될 수 있다. 또한, 링커 L은 적합한 작용기, 예를 들어, 아미드, 아민, 에테르, 에스테르, 포스포디에스테르(-OP(=O)(-OH)-O-) 또는 티오포스포디에스테르(-OP(=S)(-OH)-O-) 연결을 통해 접합체 모이어티 R에 연결된다. L은 선택적으로 L을 R에 연결하는 작용기와 뉴클레오사이드 사이에 추가로 알킬기 또는 알킬-옥시-알킬기를 포함할 수 있음을 이해해야 한다. 이러한 예에서, 뉴클레오사이드는 바람직하게는 포스포디에스테르 결합을 통해 알킬기 또는 알킬-옥시-알킬기에 연결되고, 이는 차례로, 적합한 작용기, 예를 들어, 아미드, 아민, 에테르, 에스테르, 포스포디에스테르(-OP(=O)(-OH)- 또는 티오포스포디에스테르(-OP(=S)(-OH)-O-) 결합을 통해 R에 연결된다.
바람직한 실시형태에 따르면 L은 다음과 같다.
Figure pct00033
안티센스(A) 올리고뉴클레오타이드 잔기
A는 -(L)n-(O-P(=O)(-OH)-)p를 통해 5' 프라임 말단을 통해 R에 부착되는 본 발명에 따른 안티센스 올리고뉴클레오타이드 잔기, 예를 들어, 표 6에 나타낸 안티센스 올리고뉴클레오타이드이다. 바람직하게는, A는 도 1A, 2A, 3A, 4A, 5A, 6A, 7A 및 8A에 도시된 잔기 또는 도 1A, 2A 3A, 4A, 5A, 6A, 7A, 8A 및 8.1A에 도시된 잔기로부터 선택된 안티센스 올리고뉴클레오타이드 잔기이다.
본 발명의 추가 양상에 따르면, A는 도 8.1A에 도시된 안티센스 올리고뉴클레오타이드 잔기이다.
그러므로, 화합물 (I)은 바람직하게는 도 10A1, 10A2; 10C1, 10C2, 10D1, 10D2, 10E1, 10F1, 10G1, 10H1, 10I1, 10J1, 10L1 10L2에 도시된 화합물, 및 이의 혼합물, 예를 들어, 10A1 및 10A2의; 10C1 및 10C2의 또는 10D1 및 10D2의 입체이성질체 혼합물로부터 선택되고, 더욱 바람직하게는 화합물 (I)은 10D1 및 10D2에 도시된 화합물, 및 이의 혼합물로부터 선택되고, 더욱 바람직하게는 화합물 (I)은 화합물 10D1 및 10D2의 혼합물이고, 이때 바람직하게는 A는 표 6에 나타낸 안티센스 올리고뉴클레오타이드로부터 선택되고, 바람직하게는 A는 도 1A, 2A 3A, 4A, 5A, 6A, 7A 및8A에 도시된 잔기로부터 선택된 안티센스 올리고뉴클레오타이드 잔기이고 그리고 L은 2-10개 뉴클레오사이드, 예를 들어, 2-5개 뉴클레오사이드, 예를 들어, 2개 뉴클레오사이드를 포함하거나 이로 구성된 링커이고, 여기서 선택적으로 뉴클레오사이드는 포스포디에스테르 연결된 뉴클레오사이드이고,
더욱 바람직하게는 여기서 L은 다음과 같다.
Figure pct00034
추가 양상에서, R은 구조식 (I)을 갖는 잔기이다.
Figure pct00035
L은 본원에 정의된 바와 같은 링커이고, 바람직하게는 L은 2-10개의 뉴클레오사이드, 예를 들어, 2-5개의 뉴클레오사이드, 예를 들어, 2개의 뉴클레오사이드를 포함하거나 이로 구성된 링커이고, 여기서 선택적으로 뉴클레오사이드는 포스포디에스테르 연결된 뉴클레오사이드이고, 더욱 바람직하게는 L은 다음과 같고
Figure pct00036
그리고
A는 본 발명에 따른 안티센스 올리고뉴클레오타이드, 예를 들어, 표 6에 나타낸 안티센스 올리고뉴클레오타이드이다.
본 발명의 한 양상에 따르면, A는 도 1A, 2A, 3A, 4A, 5A, 6A, 7A 및 8A에 도시된 잔기 또는 도 1A, 2A 3A, 4A, 5A, 6A, 7A, 8A 및 8.1A에 도시된 잔기로부터 선택된 안티센스 올리고뉴클레오타이드 잔기이다.
본 발명의 추가 양상에 따르면, A는 도 8.1A에 도시된 안티센스 올리고뉴클레오타이드 잔기이다.
본 발명은 본 발명의 안티센스 올리고뉴클레오타이드 또는 본 발명의 접합체, 및 약학적으로 허용되는 희석제, 담체, 염 및/또는 보조제를 포함하는 약학 조성물을 제공한다.
본 발명은 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체의 약학적으로 허용되는 염을 제공한다. 일부 실시형태에서, 약학적으로 허용되는 염은 나트륨염, 칼륨염 및 암모늄염으로 구성된 군으로부터 선택된다.
본 발명은 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체의 약학 용액을 제공하며, 여기서 상기 약학 용액은 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체 및 약학적으로 허용되는 용매, 예를 들어, 포스페이트 완충 식염수를 포함한다. 또는 용매는 물 또는 염화나트륨 용액이다.
본 발명은 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체를 동결건조 분말 형태와 같은 고체 분말 형태로 제공한다.
본 발명은 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체의 약학적으로 허용되는 염을 제공한다.
본 발명은 본 발명에 따른 안티센스 올리고뉴클레오타이드의 약학적으로 허용되는 염 또는 본 발명의 접합체를 제공하며, 여기서 약학적으로 허용되는 염은 나트륨염이다. 대안적으로, 상기 염은 칼륨 염이다.
본 발명은 본 발명의 본 발명의 안티센스 올리고뉴클레오타이드, 또는 접합체, 또는 본 발명의 염 및 약학적으로 허용되는 희석제, 용매, 담체, 염 및/또는 보조제를 포함하는 약학 조성물을 제공한다.
본 발명은 FUBP1을 발현하는 표적 세포에서 FUBP1 발현을 억제하는 방법을 제공하며, 상기 방법은 본 발명의 본 발명의 안티센스 올리고뉴클레오타이드, 또는 접합체, 또는 본 발명의 염, 또는 본 발명의 조성물을 유효량으로 상기 세포에 투여하는 것을 포함한다. 상기 방법은 생체내 또는 시험관내 방법일 수 있다.
본 발명은 HBV 감염, 예를 들어, 만성 HBV 감염 및 증식성 질환, 예를 들어, 암, 특히 간세포 암종으로 구성된 군으로부터 선택된 질환을 치료 및/또는 예방하기 위해 치료적 또는 예방적 유효량의 본 발명의 본 발명의 안티센스 올리고뉴클레오타이드, 또는 접합체, 또는 본 발명의 염 또는 본 발명의 조성물을 투여하는 것을 포함하는, 인간과 같은 대상체에서 HBV 감염을 치료 및/또는 예방하는 방법을 제공한다.
일부 실시형태에서, 본 발명의 안티센스 올리고뉴클레오타이드, 또는 본 발명의 접합체, 또는 본 발명의 염, 또는 본 발명의 약학 조성물은 HBV 감염, 예를 들어, 만성 HBV 감염의 치료 및/또는 예방에 사용하기 위한 것이다.
본 발명은 약제에 사용하기 위한, 본 발명의 안티센스 올리고뉴클레오타이드, 또는 본 발명의 접합체, 또는 약학 조성물, 또는 본 발명의 염을 제공한다.추가 양상에서, 본 발명은 FUBP1을 발현 중인 표적 세포에서, 본 발명의 안티센스 올리고뉴클레오타이드 또는 본 발명의 접합체를 유효량으로 상기 세포에 투여함으로써 FUBP1 발현을 억제하는 방법을 제공한다. 추가 양상에서, 본 발명은 FUBP1을 발현 중인 표적 세포에서, 본 발명의 안티센스 올리고뉴클레오타이드 또는 본 발명의 접합체를 유효량으로 상기 세포에 투여함으로써 FUBP1 발현을 억제하는 생체내 또는 시험관내 방법을 제공한다. 상기 세포는 예를 들어, 인간 세포, 예를 들어, 간 세포(liver cell), 예를 들어, 간세포(hepatocyte) 일 수 있다. 한 실시형태에서, 세포는 간세포 암종 세포이다.
추가 양상에서, 본 발명은 HBV 감염된 세포에 본 발명의 안티센스 올리고뉴클레오타이드 또는 본 발명의 접합체를 유효량으로 투여함으로써 상기 세포에서 cccDNA를 감소시키는 방법을 제공한다.
추가 양상에서, 본 발명은 HBV 감염된 세포에 본 발명의 안티센스 올리고뉴클레오타이드 또는 본 발명의 접합체를 유효량으로 투여함으로써 상기 세포에서 cccDNA를 감소시키는 생체내 또는 시험관내 방법을 제공한다.
추가 양상에서, 본 발명은 HBV 감염, 예를 들어, 만성 HBV 감염 및 증식성 질환, 예를 들어, 암, 특히 간세포 암종으로 구성된 군으로부터 선택된 질환을 치료 및/또는 예방하는 방법을 제공한다.
추가 양상에서, 본 발명은 HBV 감염, 예를 들어, 만성 HBV 감염 및 증식성 질환, 예를 들어, 암, 특히 간세포 암종으로 구성된 군으로부터 선택된 질환의 치료 또는 예방을 위한 약제의 제조에서 사용하기 위한, 본 발명의 안티센스 올리고뉴클레오타이드, 또는 접합체, 또는 본 발명의 약학 조성물을 제공한다.
추가 양상에서, 본 발명은 항바이러스 약물의 제조에 사용하기 위한 본 발명의 본 발명의 안티센스 올리고뉴클레오타이드, 또는 접합체, 또는 본 발명의 약학 조성물을 제공한다.
추가 양상에서, 본 발명은 항종양 약물의 제조에 사용하기 위한 본 발명의 안티센스 올리고뉴클레오타이드, 또는 접합체, 또는 본 발명의 약학 조성물을 제공한다.
본 발명은 HBV 감염, 예를 들어, 만성 HBV 감염 및 증식성 질환, 예를 들어, 암, 특히 간세포 암종으로 구성된 군으로부터 서택된 질환의 치료 및/또는 예방에 사용하기 위한, 본 발명의 안티센스 올리고뉴클레오타이드, 또는 본 발명의 접합체, 또는 본 발명의 약학 조성물을 제공한다.
서열 목록
본 출원과 함께 제출된 서열 목록은 본원에 참조로 포함된다. 서열 목록과 명세서 또는 도면 사이에 불일치가 있는 경우, 명세서에 개시된 정보(그림 포함)가 정확한 것으로 간주된다.
도면의 간단한 설명
도 1 포스포디에스테르 연결된 DNA 디뉴클레오타이드를 통해 GalNAc 모이어티에 접합된 화합물 6_1 (서열번호 6)
도 1A 화합물 6_1 (서열번호 6)의 잔기 A
도 2 포스포디에스테르 연결된 DNA 디뉴클레오타이드를 통해 GalNAc 모이어티에 접합된 화합물 6_2 (서열번호 6)
도 2A 화합물 6_2 (서열번호 6)의 잔기 A
도 3 포스포디에스테르 연결된 DNA 디뉴클레오타이드를 통해 GalNAc 모이어티에 접합된 화합물 7_1 (서열번호 7)
도 3A 화합물 7_1 (서열번호 7)의 잔기 A
도 4 포스포디에스테르 연결된 DNA 디뉴클레오타이드를 통해 GalNAc 모이어티에 접합된 화합물 7_2 (서열번호 7)
도 4A 화합물 7_2 (서열번호 7)의 잔기 A
도 5 포스포디에스테르 연결된 DNA 디뉴클레오타이드를 통해 GalNAc 모이어티에 접합된 화합물 7_3 (서열번호 7)
도 5A 화합물 7_3 (서열번호 7)의 잔기
도 6 포스포디에스테르 연결된 DNA 디뉴클레오타이드를 통해 GalNAc 모이어티에 접합된 화합물 7_4 (서열번호 7)
도 6A 화합물 7_4 (서열번호 7)의 잔기 A
도 7 포스포디에스테르 연결된 DNA 디뉴클레오타이드를 통해 GalNAc 모이어티에 접합된 화합물 8_1 (서열번호 8)
도 7A 화합물 8_1 (서열번호 8)의 잔기 A
도 8 포스포디에스테르 연결된 DNA 디뉴클레오타이드를 통해 GalNAc 모이어티에 접합된 화합물 9_1 (서열번호 9)
도 8A 화합물 9_1 (서열번호 9)의 잔기 A
도 8.1 포스포디에스테르 연결된 DNA 디뉴클레오타이드를 통해 GalNAc 모이어티에 접합된 화합물 18_1 (서열번호 18)
도 8.1A 화합물 18_1 (서열번호 18)의 잔기 A
도 9 도 9는 예시적인 GalNAc 모이어티를 도시한다. 도 9L의 화합물은 합성의 일부로서 여전히 고체 지지체 상에 있는 동안 올리고뉴클레오타이드에 첨가된 단량체 GalNAc 포스포르아미다이트로 구성되고, X는 S 또는 O이고, Y는 S 또는 O이고, n은 1-3이다(WO 2017/178656 참조). 도 9B 및 도 9D는 또한 각각 C6 링커가 있거나 없는 GalNAc2 또는 GN2라고도 한다.
도 10 도 10은 예시적인 안티센스 올리고뉴클레오타이드 접합체를 도시한다. 도 10A-D의 화합물은 디-리신 분지 분자, PEG3 스페이서 및 3개의 말단 GalNAc 탄수화물 모이어티를 포함한다. 도 10A 및 도 10B의 화합물에서 올리고뉴클레오타이드는 바람직하게는 링커 없이 아시알로당단백질 수용체-표적화 접합체 모이어티에 직접 부착된다. 도 10C 및 도 10D의 화합물에서 올리고뉴클레오타이드는 C6 링커를 통해 아시알로당단백질 수용체-표적화 접합체 부분에 부착된다. 도 10E-J의 화합물은 상업적으로 구입가능한 트레블러 분지 분자 및 다양한 길이 및 구조의 스페이서 및 3개의 말단 GalNAc 탄수화물 모이어티를 포함한다. 도 10L의 화합물은 합성의 일부로서 여전히 고체 지지체 상에 있는 동안 올리고뉴클레오타이드에 첨가된 단량체 GalNAc 포스포르아미다이트로 구성되고, X=S 또는 O이고, Y는 S 또는 O이고, n은 1-3이다(WO 2017/178656 참조).
도 11 도 11은 Hela 세포에서 항-FUBP1 화합물의 시험관내 효능 분석 결과를 보여준다. FUBP1 mRNA 수준은 정규화되고 대조군의 %로 표시된다.
도 12 표적 결합: FUBP1 mRNA. 실시예 3에 기재된 바와 같이, 4개의 안티센스 올리고뉴클레오타이드 화합물이 HBV 감염 PHH 세포에서 테스트되었다. 각 화합물은 3주 동안 주 1회 10 μM의 농도로 세포에 전달되었다. FUBP1 mRNA 표적 KD는 마지막 치료 1주일 후에 평가되었다. 제조업체의 프로토콜에 따라 MagNA Pure 로봇 및 MagNA Pure 96 세포 RNA 대용량 키트를 사용하여 세포로부터 총 RNA를 추출하고 FUBP1 mRNA를 TaqMan qPCR로 정량하였다. 이 도면은 10 μM에서 테스트된 올리고를 사용하여 음성 대조군(NDC=1)과 비교한 표적 mRNA의 잔부 발현을 보여준다. 데이터는 인간 GUS B 참조 유전자에 대해 정규화되고 두 생물학적 복제물의 평균 + SD를 테스트된 각 올리고에 대해 보고한다. 50% 및 20%의 FC가 그래프에서 강조 표시된다. 화합물 식별 번호 7_3은 10μM에서 mRNA 발현을 각각 80% 감소시켜 최고의 FUBP1 mRNA KD를 보여준다. 화합물 식별 번호 18_1은 선행 기술 올리고(화합물 식별 번호 35_1 및 50_1)와 비교하여, 화합물 식별 번호 7_3을 갖는 올리고뉴클레오타이드와 동등하게 FUBP1 mRNA를 감소시키는 데 가장 강력한 효과를 나타낸다. 둘 다 NDC에 비해 약 80%까지 10 μM에서 표적 mRNA 발현을 감소시킨다(자세한 내용은 실시예 3 참조).
도 13: 화합물 식별 번호 7_3 및 18_1이 포스포디에스테르 연결된 DNA 디뉴클레오타이드를 통해 GalNAc 모이어티에 접합된 올리고뉴클레오타이드의 생체내 간 PK/PD 상관관계의 평가를 단일 용량 마우스 연구에서 평가하였다(Conj. = 접합체, 자세한 내용은 실시예 4 참조).
정의
HBV 감염
“B형 간염 바이러스 감염” 또는 “HBV 감염”이라는 용어는 당업계에 일반적으로 알려져 있으며 B형 간염 바이러스(HBV)에 의해 발생하고 간에 영향을 미치는 감염성 질환을 의미한다. HBV 감염은 급성 또는 만성 감염일 수 있다. 만성 B형 간염 바이러스(CHB) 감염은 전 세계적으로 2억 4천 8백만 명의 개인에게 영향을 미치는 세계적인 질환이다. 매년 약 686,000명이 HBV 관련 말기 간 질환 및 간세포 암종(HCC)으로 인해 사망한다(GBD 2013; Schweitzer 외, 2015). WHO는 시술을 확대하지 않으면 CHB 감염 환자 수가 향후 40~50년 동안 현재와 같은 높은 수준을 유지할 것이며 2015년에서 2030년 사이에 누적 2천만 명이 사망할 것으로 예상했다(WHO 2016). CHB 감염은 단일한 임상 양상을 보이는 동종 질환이 아니다. 감염된 개인은 일생 동안 CHB 관련 간 질환의 여러 단계를 거쳐 질환이 진행되었으며; 이러한 질환 단계는 또한 표준 치료요법(SOC) 치료의 기초가 된다. 현재 지침에서는 혈청 ALT 수준, HBV DNA 수준, 간 질환의 중증도(EASL, 2017)의 세 가지 기준에 따라 선별된 CHB 감염 개체만 치료할 것을 권장한다. 이러한 권장 사항은 SOC, 즉 뉴클레오사(타)이드 유사체(NA) 및 페길화 인터페론-알파(PEG-IFN)는 치료 효과가 없고 장기간 투여되어야 하며 이로써 안전 위험이 증가한다는 사실 때문이었다. NA는 HBV DNA 복제를 효과적으로 억제한다; 그러나 이들은 다른 바이러스 마커에 매우 제한적이거나 영향을 미치지 않는다. HBV 감염의 두 가지 특징인 B형 간염 표면 항원(HBsAg)과 공유결합 폐쇄된 원형 DNA(cccDNA)는 HBV 완치를 목표로 하는 신약들의 주요 표적이다. CHB 개체의 혈장에서 HBsAg 하위 바이러스(빈) 입자는 HBV 비리온보다 103 내지 105 계수(factor) 만큼 더 많다(Ganem & Prince, 2014); 이의 과량은 급성 HBV 감염의 해결 후에 관찰되는 혈청학적 마커인 중화 항-HBs 항체를 발달시키는 개체의 무능력을 비롯한 해당 질환의 면역병인에 기여하는 것으로 여겨진다.
일부 실시형태에서, 용어 “HBV 감염”은 “만성 HBV 감염”을 지칭한다.
또한, 이 용어는 임의의 HBV 유전자형 감염을 포함한다.
일부 실시형태에서, 치료될 환자는 HBV 유전자형 A로 감염된다.
일부 실시형태에서, 치료될 환자는 HBV 유전자형 B로 감염된다.
일부 실시형태에서, 치료될 환자는 HBV 유전자형 C로 감염된다(실시예 섹션, 실시예 3에서 테스트되었음).
일부 실시형태에서, 치료될 환자는 HBV 유전자형 D로 감염된다.
일부 실시형태에서, 치료될 환자는 HBV 유전자형 E로 감염된다.
일부 실시형태에서, 치료될 환자는 HBV 유전자형 F로 감염된다.
일부 실시형태에서, 치료될 환자는 HBV 유전자형 G로 감염된다.
일부 실시형태에서, 치료될 환자는 HBV 유전자형 H로 감염된다.
일부 실시형태에서, 치료될 환자는 HBV 유전자형 I로 감염된다.
일부 실시형태에서, 치료될 환자는 HBV 유전자형 J로 감염된다.
cccDNA (공유결합 폐쇄된 원형 DNA)
cccDNA는 감염된 간세포의 핵에 상주하는 바이러스 유전자 주형으로, 여기에서 생산적인 감염에 필요한 모든 HBV RNA 전사물을 생성하고 만성 HBV 감염의 자연 경과 동안 바이러스 지속성을 담당한다(Locarnini & Zoulim, 2010 Antivir Ther. 15 Suppl 3:3-14. doi: 10.3851/IMP1619). 바이러스 저장소 역할을 하는 cccDNA는 치료 중단 후 바이러스 반등의 원천이며 장기간, 종종 평생 치료를 필요로 한다. PEG-IFN은 다양한 부작용으로 인해 CHB의 작은 하위집합에만 투여할 수 있다.
결과적으로 HBV cccDNA의 분해 또는 제거로 정의되는 완치를 대부분의 CHB 환자에게 전달할 수 있는 새로운 요법이 절실히 필요하다.
화합물
여기서, 용어 “화합물”은 FUBP1 발현 또는 활성을 억제할 수 있는 모든 분자를 의미한다. 본 발명의 특정 화합물은 핵산 분자, 예를 들어, 본 발명에 따른 안티센스 올리고뉴클레오타이드 또는 이러한 핵산 분자를 포함하는 임의의 접합체이다. 예를 들어, 본원에서 화합물은 FUBP1을 표적으로 하는 핵산 분자, 특히, 안티센스 올리고뉴클레오타이드일 수 있다.
올리고뉴클레오타이드
본원에서 사용되는 용어 “올리고뉴클레오타이드”는 일반적으로 당업자가 이해하는 바와 같이 2개 이상의 공유 결합된 뉴클레오사이드를 포함하는 분자로 정의된다. 이러한 공유 결합된 뉴클레오사이드는 또한 핵산 분자 또는 올리고머로 지칭될 수 있다. 올리고뉴클레오타이드는 일반적으로 고체상 화학 합성에 이어 정제 및 단리하여 실험실에서 만들어진다. 올리고뉴클레오타이드의 서열을 언급할 때, 공유적으로 연결된 뉴클레오타이드 또는 뉴클레오사이드의 핵염기 모이어티 또는 이의 변형의 서열 또는 순서가 언급된다. 본 발명의 올리고뉴클레오타이드는 인공적이고 화학적으로 합성되며 일반적으로 정제되거나 단리된다. 본 발명의 올리고뉴클레오타이드는 2' 당 변형된 뉴클레오사이드와 같은 하나 이상의 변형된 뉴클레오사이드를 포함할 수 있다. 본 발명의 올리고뉴클레오타이드는 하나 이상의 변형된 뉴클레오사이드간 연결, 예를 들어, 하나 이상의 포스포로티오에이트 뉴클레오사이드간 연결을 포함할 수 있다.
안티센스 올리고뉴클레오타이드
본원에서 사용되는 용어 “안티센스 올리고뉴클레오타이드” 또는 “ASO”는 표적 핵산, 특히 표적 핵산 상의 연속 서열에 혼성화함으로써 표적 유전자의 발현을 조절할 수 있는 올리고뉴클레오타이드로 정의된다. 안티센스 올리고뉴클레오타이드는 본질적으로 이중 가닥이 아니므로 siRNA 또는 shRNA가 아니다. 바람직하게는, 본 발명의 안티센스 올리고뉴클레오타이드는 단일 가닥이다. 본 발명의 단일 가닥 올리고뉴클레오타이드는, 내부 또는 상호 자기 상보성의 정도가 전장 뉴클레오타이드에 걸쳐 50% 미만인 한, 헤어핀 또는 분자간 듀플렉스 구조(동일한 올리고뉴클레오타이드의 두 분자들 사이의 듀플렉스)를 형성할 수 있는 것으로 이해된다.
일부 실시형태에서, 본 발명의 단일 가닥 안티센스 올리고뉴클레오타이드는 RNA 뉴클레오사이드를 함유하지 않을 수 있다.
유리하게는, 본 발명의 안티센스 올리고뉴클레오타이드는 하나 이상의 변형 뉴클레오사이드 또는 뉴클레오타이드, 예를 들어, 2' 당 변형 뉴클레오사이드를 포함한다. 또한, 변형되지 않은 뉴클레오사이드는 DNA 뉴클레오사이드인 것이 유리하다.
연속 뉴클레오타이드 서열
용어 “연속 뉴클레오타이드 서열”은 표적 핵산에 상보적인 올리고뉴클레오타이드의 영역을 의미한다. 이 용어는 본원에서 용어 “연속 핵염기 서열” 및 용어 “올리고뉴클레오타이드 모티프 서열”과 상호교환적으로 사용된다. 일부 실시형태에서, 올리고뉴클레오타이드의 모든 뉴클레오사이드는 연속 뉴클레오타이드 서열을 구성한다. 일부 실시형태에서 올리고뉴클레오타이드는 F-G-F' 갭머 영역과 같은 연속 뉴클레오타이드 서열을 포함하고, 선택적으로 추가 뉴클레오타이드(들), 예를 들어, 작용기(예를 들어, 접합체 기)를 연속 뉴클레오타이드 서열에 부착하는데 사용될 수 있는 뉴클레오타이드 링커 영역을 포함할 수 있다. 뉴클레오타이드 링커 영역은 표적 핵산에 상보적이거나 상보적이지 않을 수 있다. 일부 실시형태에서, 안티센스 올리고뉴클레오타이드의 핵염기 서열은 연속 뉴클레오타이드 서열이다.
뉴클레오타이드 및 뉴클레오사이드
뉴클레오타이드 및 뉴클레오사이드는 올리고뉴클레오타이드 및 폴리뉴클레오타이드의 빌딩 블록이고, 본 발명의 목적을 위해 자연 발생 및 비-자연 발생 뉴클레오사이드 모두를 포함한다. 자연에서 DNA 및 RNA 뉴클레오타이드와 같은 뉴클레오타이드는 리보스 당 모이어티, 핵염기 모이어티 및 하나 이상의 포스페이트 기(뉴클레오사이드에는 없음)를 포함한다. 뉴클레오사이드 및 뉴클레오타이드는 또한 “단위” 또는 “단량체”로 상호교환적으로 지칭될 수 있다.
변형된 뉴클레오사이드
본원에서 사용되는 용어 “변형된 뉴클레오사이드” 또는 “뉴클레오사이드 변형”은 동등한 DNA 또는 RNA 뉴클레오사이드와 비교하여 당 모이어티 또는 (핵)염기 모이어티의 하나 이상의 변형 도입에 의해 변형된 뉴클레오사이드를 의미한다. 유리하게는, 본 발명의 안티센스 올리고뉴클레오타이드의 변형된 뉴클레오사이드 중 하나 이상은 변형된 당 모이어티를 포함한다. 용어 “변형된 뉴클레오사이드”는 또한 본원에서 “뉴클레오사이드 유사체” 또는 변형된 “단위” 또는 변형된 “단량체”라는 용어와 상호교환적으로 사용될 수 있다. 변형되지 않은 DNA 또는 RNA 당 모이어티를 갖는 뉴클레오사이드는 본원에서 DNA 또는 RNA 뉴클레오사이드라고 한다. DNA 또는 RNA 뉴클레오사이드의 염기 영역에 변형이 있는 뉴클레오사이드는 왓슨 크릭(Watson Crick) 염기쌍 형성을 허용하는 경우 여전히 일반적으로 DNA 또는 RNA라고 한다.
변형된 뉴클레오사이드간 연결
“변형된 뉴클레오사이드간 연결”이라는 용어는 일반적으로 2개의 뉴클레오사이드를 함께 공유 결합시키는 포스포디에스테르(PO) 연결 이외의 연결로서 당업자가 이해하는 것으로 정의된다. 따라서, 본 발명의 올리고뉴클레오타이드는 하나 이상의 포스포로티오에이트 뉴클레오사이드간 연결, 또는 하나 이상의 포스포로디티오에이트 뉴클레오사이드간 연결과 같은 하나 이상의 변형된 뉴클레오사이드간 연결을 포함할 수 있다.
일부 실시형태에서 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열에서 뉴클레오사이드간 연결의 적어도 50%는 포스포로티오에이트이다, 예를 들어, 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열에서 뉴클레오사이드간 연결의 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80% 또는 예를 들어, 적어도 90%는 포스포로티오에이트이다. 일부 실시형태에서 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열의 모든 뉴클레오사이드간 연결은 포스포로티오에이트이다.
일부 유리한 실시형태에서, 올리고뉴클레오타이드의 연속 뉴클레오타이드 서열의 모든 뉴클레오사이드간 연결은 포스포로티오에이트이거나, 올리고뉴클레오타이드의 모든 뉴클레오사이드간 연결은 포스포로티오에이트 연결이다.
포스포로티오에이트 연결은, 예를 들어, 아래에 예시된 바와 같이 상이한 호변이성질체 형태로 존재할 수 있다:
Figure pct00037
.
EP 2 742 135에 개시된 바와 같이 안티센스 올리고뉴클레오타이드는 (포스포디에스테르, 포스포로티오에이트 및 포스포로디티오에이트 이외의) 다른 뉴클레오사이드간 연결, 예를 들어, 알킬 포스포네이트/메틸 포스포네이트 뉴클레오사이드간 연결을 포함할 수 있으며, 이는 EP 2 742 135에 따라, 예를 들어, 다른 DNA 포스포로티오에이트에서 갭 영역에 허용될 수 있다.
핵염기
핵염기라는 용어는 핵산 혼성화에서 수소 결합을 형성하는 뉴클레오사이드 및 뉴클레오타이드에 존재하는 퓨린(예를 들어 아데닌 및 구아닌) 및 피리미딘(예를 들어 우라실, 티민 및 시토신) 모이어티를 포함한다. 본 발명의 맥락에서 용어 핵염기는 또한 천연 발생 핵염기와 상이할 수 있지만 핵산 혼성화 동안 기능성인 변형된 핵염기를 포함한다. 이러한 맥락에서 “핵염기”는 아데닌, 구아닌, 시토신, 티미딘, 우라실, 잔틴 및 하이포잔틴과 같은 천연 발생 핵염기, 뿐만 아니라 비-천연 발생 변이체를 모두 의미한다. 이러한 변이체는 예를 들어 Hirao 외, (2012) Accounts of Chemical Research vol 45 page 2055 및 Bergstrom (2009) Current Protocols in Nucleic Acid Chemistry Suppl. 37 1.4.1에 기재되어 있다.
일부 실시형태에서, 핵염기 모이어티는 퓨린 또는 피리미딘을 변형된 퓨린 또는 피리미딘, 예를 들어, 치환된 퓨린 또는 치환된 피리미딘, 예를 들어, 이소시토신, 유사이소시토신, 5-메틸 시토신, 5-티오졸로-시토신, 5-프로피닐-시토신, 5-프로피닐-우라실, 5-브로모우라실 5-티아졸로-우라실, 2-티오-우라실, 2'티오-티민, 이노신, 디아미노퓨린, 6-아미노퓨린, 2-아미노퓨린, 2,6-디아미노퓨린 및 2-클로로-6-아미노퓨린으로부터 선택된 핵염기로 변경함으로써 변형된다.
핵염기 모이어티는 각각의 상응하는 핵염기, 예를 들어 A, T, G, C 또는 U에 대한 문자 코드로 표시될 수 있으며, 각 문자는 선택적으로 동등한 기능의 변형된 핵염기를 포함할 수 있다. 예를 들어, 예시된 올리고뉴클레오타이드에서 핵염기 모이어티는 A, T, G, C 및 5-메틸 시토신에서 선택된다. 선택적으로 LNA 갭머의 경우 5-메틸 시토신 LNA 뉴클레오사이드를 사용할 수 있다.
변형된 올리고뉴클레오타이드
용어 “변형된 올리고뉴클레오타이드”는 하나 이상의 당-변형된 뉴클레오사이드 및/또는 변형된 뉴클레오사이드간 연결을 포함하는 올리고뉴클레오타이드를 설명한다. 용어 “키메라 올리고뉴클레오타이드”는 DNA 뉴클레오사이드 및 당 변형 뉴클레오사이드를 포함하는 올리고뉴클레오타이드를 기술하기 위해 문헌들에서 사용되어 온 용어이다. 본 발명의 안티센스 올리고뉴클레오타이드는 유리하게는 키메라 올리고뉴클레오타이드이다.
상보성
“상보성”이라는 용어는 뉴클레오사이드/뉴클레오타이드의 왓슨-크릭 염기쌍 형성 능력을 설명한다. 왓슨-크릭 염기쌍은 구아닌(G)-시토신(C) 및 아데닌(A) - 티민(T)/우라실(U)이다. 올리고뉴클레오타이드는 변형된 핵염기를 가진 뉴클레오사이드를 포함할 수 있다, 예를 들면, 5-메틸 시토신은 종종 시토신 대신 사용되며, 이와 같이 이러한 상보성이라는 용어는 비-변형된 핵염기와 변형된 핵염기 사이의 왓슨 크릭 염기-쌍을 포함하는 것으로 이해될 것이다 (예를 들면 Hirao 외 (2012) Accounts of Chemical Research vol 45 page 2055 and Bergstrom (2009) Current Protocols in Nucleic Acid Chemistry Suppl. 37 1.4.1 참고).
본원에서 사용된 용어 “상보성 %”는, 연속 뉴클레오타이드 서열 전반에 걸쳐, 핵산 분자 (예를 들어, 올리고뉴클레오타이드) 내 연속 뉴클레오타이드 서열 중 참조 서열 (예를 들어, 표적 서열 또는 서열 모티프)에 상보적인, 뉴클레오타이드의 비율(퍼센트)를 지칭한다. 그러므로 상보성 백분율은 (표적 서열 5'-3' 및 3'-5'의 올리고뉴클레오타이드 서열과 함께 정렬될 때) 2개 서열들 사이에 (왓슨 크릭 염기 쌍으로부터) 상보적인 정렬된 핵염기들의 수를 계수하고, 이 수를 올리고뉴클레오타이드의 총 뉴클레오타이드 수로 나누고 100을 곱하여 계산된다. 이러한 비교에서 정렬되지 않는 (염기쌍을 형성하는) 핵염기/뉴클레오타이드를 미스매치라 명명한다. 연속 뉴클레오타이드 서열의 상보성 % 계산에서 삽입 및 결실은 허용되지 않는다. 상보성을 결정할 때 핵염기의 화학적 변형은 왓슨 크릭 염기쌍을 형성하는 핵염기의 기능적 능력이 유지되는 한 무시됨을 이해할 수 있을 것이다 (예를 들어, 5'-메틸 시토신은 동일성 % 계산을 위해 시토신과 동일한 것으로 간주된다).
용어 “완전히 상보적”은 100% 상보성을 지칭한다.
동일성
본원에서 사용된 용어 “동일성 %”는, 연속 뉴클레오타이드 서열 전반에 걸쳐, 핵산 분자(예를 들어, 올리고뉴클레오타이드) 내 연속 뉴클레오타이드 서열 중 참조 서열(예를 들어, 서열 모티프)에 동일한, 뉴클레오타이드의 비율(퍼센트로 표현)를 지칭한다. 그러므로 동일성 백분율은 2개 서열들(본 발명의 화합물의 연속 뉴클레오타이드 서열과 참조 서열) 사이에 동일한 (매치) 정렬된 핵염기의 수를 계수하고, 이 수를 올리고뉴클레오타이드 내 뉴클레오타이드의 총 수로 나누고 100을 곱하여 계산된다. 그러므로, 동일성 백분율 = (매치 x 100)/정렬된 영역(예를 들어, 연속 뉴클레오타이드 서열)의 길이. 연속 뉴클레오타이드 서열의 동일성 백분율 계산에서 삽입 및 결실은 허용되지 않는다. 동일성을 결정할 때 핵염기의 화학적 변형은 왓슨 크릭 염기쌍을 형성하는 핵염기의 기능적 능력이 유지되는 한 무시됨을 이해할 수 있을 것이다(예를 들어, 5-메틸 시토신은 동일성 % 계산을 위해 시토신과 동일한 것으로 간주된다).
혼성화
본원에서 사용된 용어 “혼성화”, “혼성화하는 것” 또는 “혼성화하다”는 2개의 핵산 가닥(예를 들어, 올리고뉴클레오타이드 및 표적 핵산)이 반대 가닥의 염기 쌍들 사이에 수소 결합을 형성하여 이중나선을 형성하는 것으로 이해되어야 한다. 두 핵산 가닥 사이의 결합 친화성은 혼성화의 강도이다. 이것은 종종 올리고뉴클레오타이드의 절반이 표적 핵산과 이중나선을 형성하는 온도로 정의되는 용융 온도(Tm)로 설명된다. 생리적 조건에서 Tm은 친화성에 엄격하게 비례하지 않는다(Mergny and Lacroix, 2003, Oligonucleotides 13:515-537). 표준 상태 깁스 자유 에너지 ΔG°는 결합 친화성의 보다 정확한 표현이며 ΔG°=-RTln(Kd)에 의한 반응의 해리 상수(Kd)와 관련되며, 여기서 R은 기체 상수이고 T는 절대 온도이다. 그러므로, 올리고뉴클레오타이드와 표적 핵산 사이 반응의 매우 낮은 ΔG°는 올리고뉴클레오타이드와 표적 핵산 사이의 강한 혼성화를 반영한다. ΔG°는 수성 농도가 1M이고, pH가 7이고, 온도가 37°C인 반응과 관련된 에너지이다. 표적 핵산에 대한 올리고뉴클레오타이드의 혼성화는 자발적인 반응이며 자발적인 반응의 경우 ΔG°는 0보다 작다. ΔG°는, 예를 들면, Hansen 외, 1965, Chem. Comm. 36-38 and Holdgate 외, 2005, Drug Discov Today에 기재된 등온 적정 열량계(ITC) 방법을 사용하여 실험적으로 측정될 수 있다. 통상의 기술자는 ΔG° 측정에 시판 장비들을 이용가능함을 알고 있을 것이다. ΔG°는 Sugimoto 외의, 1995, Biochemistry 34:11211-11216 및 McTigue 외, 2004, Biochemistry 43:5388-5405에 기재된 적절히 유도된 열역학적 매개변수들을 사용하여 SantaLucia, 1998, Proc Natl Acad Sci USA. 95: 1460-1465에 기재된 가장 근접한 이웃 모델을 사용하여 수치적으로 추정될 수도 있다. 그 의도한 핵산 표적을 혼성화로 조절할 가능성을 갖도록 하기 위해, 본 발명의 올리고뉴클레오타이드는 10-30개 뉴클레오타이드 길이인 올리고뉴클레오타이드에 대해 -10 kcal 미만의 추정 ΔG° 값으로 표적 핵산에 혼성화한다. 일부 실시형태에서 혼성화 정도 또는 강도는 표준 상태 깁스 자유 에너지 ΔG°에 의해 측정된다. 올리고뉴클레오타이드는, 8-30개 뉴클레오타이드 길이인 올리고뉴클레오타이드의 경우, -10 kcal 범위 미만, 예를 들어, -15 kcal 미만, 예를 들어, -20 kcal 미만, 그리고 예를 들어, -25 kcal 미만의 추정 ΔG° 값으로 표적 핵산에 혼성화할 수 있다. 일부 실시형태에서, 올리고뉴클레오타이드는 -10 내지 -60 kcal, 예를 들어, -12 내지 -40, 예를 들어, -15 내지 -30 kcal 또는 -16 내지 -27 kcal, 예를 들어, -18 내지 -25 kcal의 추정 ΔG ° 값으로 표적 핵산에 혼성화한다.
표적
본원에서 사용되는 용어 “표적”은 포유동물 단백질 “원위 상류 요소 결합 단백질 1”을 의미하며 대안적으로 “FUBP1” 또는 “FBP” 또는 “FUBP” 또는 “hDH V”로 알려져 있다. 호모 사피엔스 FUBP1 유전자는 염색체 1, 77944055..77979435, 보체(NC_000001.11, 유전자 ID 1462)에 위치한다. FUBP1 유전자는 c-myc의 원위 상류 요소를 활성화하고 미분화 세포에서 c-myc의 발현을 자극하는 ssDNA 결합 단백질을 인코딩한다. FUBP에 의한 FUSE의 조절은 비인코딩 가닥에 대한 FUBP의 단일 가닥 결합을 통해 발생한다. FUBP1 단백질은 ATP 의존성 DNA 헬리카제 활성을 가지고 있다. 인간 FUBP1의 아미노산 서열은 당업계에 알려져 있고, UniProt(예를 들어, 본원에 참고로 포함된 인간 FUBP1UniProt에 대한 UniProt 엔트리 Q96AE4 참조)를 통해 평가될 수 있다.
표적 핵산
본 발명에 따르면, 표적 핵산은 포유동물 FUBP1을 인코딩하는 핵산이며, 예를 들어, 유전자, RNA, mRNA 및 전구-mRNA, 성숙 mRNA 또는 cDNA 서열 일 수 있다. 따라서 표적은 FUBP1 표적 핵산으로 언급될 수 있다.
적절하게는, 표적 핵산은 FUBP1 단백질, 특히 포유동물 FUBP1, 예를 들어, 서열번호 1, 2 및/또는 3으로 본원에 제공된 pre-mRNA 또는 mRNA 서열들을 인코딩하는 인간 FUBP1 유전자를 인코딩한다. 서열번호 1은 인간 FUBP1 전구-mRNA의 서열이다. 서열번호 2 및 3은 인간 FUBP1 mRNA의 서열이다.
표 3은 서열번호 1의 예측된 엑손 및 인트론 영역을 열거한다.
표 3. 인간 FUBP1 전구-mRNA의 엑손 및 인트론 영역.
Figure pct00038
일부 실시형태에서, 표적 핵산은 mRNA 또는 전구-mRNA와 같은 사이노몰구스 원숭이 FUBP1 핵산일 수 있다.
일부 실시형태에서, 표적 핵산은 mRNA 또는 전구-mRNA와 같은 마우스 FUBP1 핵산일 수 있다.
표 4는 인간, 사이노 원숭이 및 마우스 FUBP1의 게놈 서열에 대한 개요를 제공한다. 표 5는 인간, 원숭이 및 마우스 FUBP1에 대한 전구-mRNA 서열과 인간 FUBP1에 대한 성숙 mRNA에 대한 개요를 제공한다.
일부 실시형태에서, 표적 핵산은 서열번호 1, 2, 3, 4, 및/또는 5 또는 이의 자연 발생 변이체(예를 들어, 포유동물 FUBP1을 인코드하는 서열들)로 구성된 군에서 선택된다.
일부 실시형태에서, 표적 핵산은 서열번호 1, 2, 및/또는 3 또는 이의 자연 발생 변이체(예를 들어, 포유동물 FUBP1을 인코드하는 서열들)로 구성된 군에서 선택된다.
일부 실시형태에서, 표적 핵산은 서열번호 4 및 5 또는 이의 자연 발생 변이체(예를 들어, 포유동물 FUBP1을 인코딩하는 서열들)로 구성된 군에서 선택된다.
표 4. 종들간 FUBP1에 대한 게놈 및 어셈블리 정보.
Figure pct00039
Fwd = 정방향 가닥. Rv = 역방향 가닥. 게놈 좌표는 전구-mRNA 서열(게놈 서열)을 제공한다.
연구 또는 진단에 본 발명의 안티센스 올리고뉴클레오타이드를 사용하는 경우 표적 핵산은 cDNA 또는 DNA 또는 RNA로부터 유래된 합성 핵산 일 수 있다.
생체내 또는 시험관내 응용의 경우, 본 발명의 치료적 안티센스 올리고뉴클레오타이드는 전형적으로 FUBP1 표적 핵산을 발현하는 세포에서 FUBP1 표적 핵산의 발현을 억제 할 수 있다. 본 발명의 안티센스 올리고뉴클레오타이드의 핵염기의 연속 서열은, 안티센스 올리고뉴클레오타이드 길이에 걸쳐 측정시, 선택적으로 1 또는 2개 미스매치를 제외하고, 그리고 선택적으로 안티센스 올리고뉴클레오타이드를 선택적 작용기, 예를 들어, 접합체에 연결할 수 있는 뉴클레오타이드 기반 링커 영역들, 또는 다른 비-상보적 말단 뉴클레오타이드를 제외하고 일반적으로 FUBP1 표적 핵산의 보존된 영역에 상보적이다.
표적 핵산은 전령 RNA, 예를 들어, 전구-mRNA일 수 있으며, 이는 포유동물 FUBP1 단백질, 예를 들어, 인간 FUBP1, 예를 들어, 인간 FUBP1 전구-mRNA 서열(예를 들어, 서열번호 1로 개시된 것), 사이노몰구스 원숭이 FUBP1 전구-mRNA 서열(예를 들어, 서열번호 4로 개시된 것), 또는 마우스 FUBP1 전구-mRNA 서열(예를 들어, 서열번호 5로 개시된 것), 또는 성숙한 FUBP1 mRNA(예를 들어, 서열번호 2 및 3으로 개시된 인간 성숙 mRNA)를 인코딩한다. 서열번호 1-5, 10, 11, 15 및 19는 DNA 서열이다 - 표적 RNA 서열은 티미딘 염기(T) 대신에 우라실(U) 염기를 가짐이 이해될 것이다.
예시적인 표적 핵산에 대한 추가 정보는 표 5에 제공되어 있다.
표 5. 종 전체에 걸친 FUBP1의 서열 세부 사항.
Figure pct00040
비고: 서열번호 4는 여러 NNNN의 영역을 포함하고, 이 영역에서 시퀀싱은 해당 서열을 정확하게 세분화할 수 없으므로 축퇴성 서열이 포함된다. 의심의 여지를 없애기 위해, 본 발명의 화합물은 실제 표적 서열에 상보적이므로 축퇴성 화합물이 아니다.
일부 실시형태에서, 표적 핵산은 서열번호 1이다.
일부 실시형태에서, 표적 핵산은 서열번호 2이다.
일부 실시형태에서, 표적 핵산은 서열번호 3이다.
일부 실시형태에서, 표적 핵산은 서열번호 4이다.
일부 실시형태에서, 표적 핵산은 서열번호 5이다.
일부 실시형태에서, 표적 핵산은 서열번호 1, 2 및 3이다.
일부 실시형태에서, 표적 핵산은 서열번호 1 및 4이다. 따라서, 안티센스 올리고뉴클레오타이드는 인간 및 사이노 원숭이 FUBP1 모두를 표적으로 할 수 있다.
일부 실시형태에서, 표적 핵산은 서열번호 1 및 5이다. 따라서, 안티센스 올리고뉴클레오타이드는 인간 및 마우스 FUBP1 모두를 표적한다.
일부 실시형태에서, 표적 핵산은 서열번호 1, 4 및 5이다. 따라서, 안티센스 올리고뉴클레오타이드는 인간, 사이노 원숭이 및 마우스 FUBP1을 표적으로 할 수 있다.
표적 서열
본원에서 사용된 용어 “표적 서열”은 본 발명의 올리고뉴클레오타이드 또는 핵산 분자에 상보적인 핵염기 서열을 포함하는 표적 핵산에 존재하는 뉴클레오타이드의 서열을 지칭한다. 일부 실시형태에서, 표적 서열은 본 발명의 안티센스 올리고뉴클레오타이드의 연속 뉴클레오타이드 서열(즉, 하위 서열)에 상보적인 핵염기 서열을 갖는 표적 핵산상의 영역으로 구성된다. 표적 핵산의 이 영역은 표적 뉴클레오타이드 서열, 표적 서열 또는 표적 영역으로 상호교환적으로 지칭 될 수 있다. 일부 실시형태에서 표적 서열은 단일 안티센스 올리고뉴클레오타이드의 상보적 서열보다 길고, 예를 들어, 본 발명의 여러 안티센스 올리고뉴클레오타이드에 의해 표적화 될 수 있는 표적 핵산의 바람직한 영역을 나타낼 수 있다.
한 실시형태에서, 표적 서열은 인간 FUBP1 mRNA의 엑손 14 내의 영역이다(상기 표 3 참조).
또 다른 실시형태에서, 표적 서열은 인간 FUBP1 mRNA의 엑손 20 내의 영역이다(상기 표 3 참조).
본 발명의 안티센스 올리고뉴클레오타이드는 표적 핵산 상의 영역, 예를 들어, 본원에 기재된 표적 서열에 상보적이거나 이에 혼성화하는 연속 뉴클레오타이드 서열을 포함한다.
본 발명의 올리고뉴클레오타이드에 의해 표적화될 수 있는 인간 FUBP1 전구-mRNA(참조로서 서열번호 1 사용)의 영역에 의해 정의된 바와 같은 표적 서열 영역이 본원에서 아래에 제공된다.
본 발명의 올리고뉴클레오타이드는 표적 핵산, 예를 들어, 표적 핵산의 하위 서열, 예를 들어, 본원에 기재된 표적 서열에 상보적이거나 이에 혼성화하는 연속 뉴클레오타이드 서열을 포함한다.
올리고뉴클레오타이드는 표적 핵산 분자에 존재하는 표적 서열에 상보적인 연속 뉴클레오타이드 서열을 포함한다. 연속 뉴클레오타이드 서열(및 그러므로 표적 서열)은 적어도 12개의 연속 뉴클레오타이드, 예를 들어, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24개의 뉴클레오타이드, 예를 들어, 14-20게, 예를 들어, 14-18개 연속 뉴클레오타이드를 포함한다.
표적 서열 영역
본 발명자들은 본 발명의 올리고뉴클레오타이드에 의해 표적화될 수 있는 FUBP1 표적 핵산의 특히 효과적인 서열을 확인하였다.
일부 실시형태에서, 표적 서열은 서열번호 10이다.
일부 실시형태에서, 표적 서열은 서열번호 11이다.
일부 실시형태에서, 표적 서열은 서열번호 15이다.
일부 실시형태에서, 표적 서열은 서열번호 19이다.
서열번호 10: gtgaaaccataaaaagcataag
서열번호 11: AACCATAAAAAGCATAAG
서열번호 15: gtgaaaccataaaaagcata
서열번호 19: GTAGAAATGAAAATTGGT
서열번호 10, 11, 15 및 19는 DNA 서열이다 - 표적 RNA 서열은 티미딘 염기(T) 대신에 우라실(U) 염기를 가짐이 이해될 것이다.
일부 실시형태에서, 표적 서열은 서열번호 1의 뉴클레오타이드 16184 내지 16200의 영역이다.
일부 실시형태에서, 표적 서열은 서열번호 1의 뉴클레오타이드 16186 내지 16203의 영역이다.
일부 실시형태에서, 표적 서열은 서열번호 1의 뉴클레오타이드 16188 내지 16205의 영역이다.
일부 실시형태에서, 표적 서열은 서열번호 1의 뉴클레오타이드 16189 내지 16205의 영역이다.
일부 실시형태에서, 표적 서열은 서열번호 1의 뉴클레오타이드 30536 내지 30553의 영역이다.
표적 세포
본원에서 사용되는 용어 “표적 세포”는 표적 핵산을 발현하는 세포를 지칭한다. 일부 실시형태에서 표적 세포는 생체내 또는 시험관내 존재할 수 있다. 일부 실시형태에서 표적 세포는 포유동물 세포, 예를 들어, 마우스 세포 또는 래트 세포와 같은 설치류 세포 또는 영장류 세포, 예를 들어, 원숭이 세포 또는 인간 세포이다.
일반적으로 표적 세포는 FUBP1 mRNA, 예를 들어, FUBP1 전구-mRNA 또는 FUBP1 성숙 mRNA를 발현한다. 예를 들어, 표적 세포는 인간 FUBP1 전구-mRNA(예를 들어, 서열번호 1), 또는 엑손 14(또는 엑손 20)를 포함하는 인간 FUBP1 성숙 mRNA(예를 들어, 서열번호 2 또는 3)를 발현한다. 실험적 평가를 위해 표적 서열을 포함하는 핵산을 발현하는 표적 세포가 사용될 수 있다. FUBP1 mRNA의 폴리 A 꼬리는 일반적으로 안티센스 올리고뉴클레오타이드 표적화에 있어 무시된다.
본 발명의 안티센스 올리고뉴클레오타이드는 전형적으로 FUBP1 표적 핵산을 발현하는 표적 세포에서 FUBP1 표적 핵산의 발현을, 예를 들어, 생체내 또는 시험관내에서, 억제 할 수 있다.
또한, 표적 세포는 간세포일 수 있다. 한 실시형태에서, 표적 세포는 HBV 감염된 개체 또는 인간화 간을 갖는 HBV 감염된 마우스(PhoenixBio, PXB-마우스)로부터 유래된 HBV 감염된 1차 인간 간세포이다.
한 실시형태에서, 표적 세포는 HBV로 감염될 수 있다. 추가로, 표적 세포는 HBV cccDNA를 포함할 수 있다. 따라서, 표적 세포는 바람직하게는 FUBP1 전구-mRNA 또는 FUBP1 성숙 mRNA와 같은 FUBP1 mRNA 및 HBV cccDNA를 포함한다.
또한, 표적 세포는 암 세포, 예를 들어, 간세포 암종 세포 일 수 있다.
자연 발생 변이체
용어 “자연 발생 변이체”는 표적 핵산과 동일한 유전자 좌위로부터 유래하지만, 예를 들면, 동일한 아미노산을 인코딩하는 다수의 코돈을 유발하는 유전자 코드의 축퇴성에 의해, 또는 전구-mRNA의 대체 스플라이싱, 또는 다형성, 예를 들어, 단일 뉴클레오타이드 다형성(SNPs), 및 대립유전자 변이체들의 존재로 인해 상이할 수 있는 FUBP1 유전자 또는 전사체의 변이체들을 지칭한다. 그러므로, 올리고뉴클레오타이드에 충분히 상보적인 서열의 존재에 기초하여, 본 발명의 올리고뉴클레오타이드는 표적 핵산 및 이의 자연 발생 변이체를 표적화 할 수 있다.
일부 실시형태에서, 자연 발생 변이체는 포유동물 FUBP1 표적 핵산, 예를 들어 서열번호 1, 2, 3, 4 또는 5로 구성된 군에서 선택된 표적 핵산에 대해 적어도 95%, 예를 들어, 적어도 98% 또는 적어도 99%의 상동성을 갖는다. 일부 실시형태에서 자연 발생 변이체는 서열번호 1의 인간 FUBP1 표적 핵산에 대해 적어도 99%의 상동성을 갖는다.
발현의 억제
본원에서 사용되는 용어 “발현의 억제”는 표적 세포에서 FUBP1의 양 또는 활성을 억제하는 올리고뉴클레오타이드의 능력에 대한 전반적인 용어로 이해되어야 한다. 활성 억제는 FUBP1 pre-mRNA 또는 FUBP1 mRNA의 수준을 측정하거나 세포에서 FUBP1 또는 FUBP1 활성 수준을 측정하여 결정할 수 있다. 따라서 발현 억제는 시험관내 또는 생체내에서 결정될 수 있다.
전형적으로, 발현의 억제는 표적 세포에 대한 유효량의 안티센스 올리고뉴클레오타이드 투여로 인한 활성의 억제를 비교하고 그 수준을 안티센스 올리고뉴클레오타이드의 투여 없이 표적 세포로부터 얻은 참조 수준(대조군 실험), 또는 공지된 참조 수준(예를 들어, 유효량의 안티센스 올리고뉴클레오타이드 투여 전의 발현 수준, 또는 예정된 또는 그 외 공지된 발현 수준)과 비교함으로써 결정된다.
예를 들어, 대조군 실험은 동물이나 사람, 식염수 조성물 또는 참조 올리고뉴클레오타이드(종종 뒤섞인 대조군)로 처리된 표적 세포일 수 있다.
용어 억제 또는 억제하다는 또한 FUBP1 발현의 하향 조절, 감소, 억제, 감소, 저하로 지칭될 수 있다.
발현의 억제는 예를 들어, 전구-mRNA 또는 mRNA의 분해(예를 들어, 갭머와 같은 RNase H 동원 올리고뉴클레오타이드 사용)에 의해 발생할 수 있다.
고 친화성 변형된 뉴클레오사이드
고 친화성 변형된 뉴클레오사이드는, 예를 들어, 용융 온도(Tm)로 측정시, 올리고뉴클레오타이드에 통합 될 때 올리고뉴클레오타이드의 그 상보적 표적에 대한 친화성을 개선시키는 변형된 뉴클레오타이드이다. 본 발명의 고 친화성 변형된 뉴클레오사이드는 용융 온도를 바람직하게는 변형된 뉴클레오사이드 당 +0.5 내지 +12oC, 더욱 바람직하게는 +1.5 내지 +10oC 그리고 가장 바람직하게는 +3 내지 +8oC 증가시킨다. 다수의 고 친화성 변형된 뉴클레오사이드가 해당 기술분야에 공지되어 있으며, 예를 들어, 많은 2' 치환된 뉴클레오사이드 및 잠금 핵산(LNA)을 포함한다(예를 들어, Freier & Altmann; Nucl. Acid Res., 1997, 25, 4429-4443 및 Uhlmann; Curr. Opinion in Drug Development, 2000, 3(2), 293-213 참고).
당 변형
본 발명의 올리고머는 변형된 당 모이어티, 즉 DNA 및 RNA에서 발견되는 리보스 당 모이어티와 비교할 때 당 모이어티의 변형을 갖는 하나 이상의 뉴클레오사이드를 포함 할 수 있다.
주로 친화성 및/또는 뉴클레아제 내성과 같은 올리고뉴클레오타이드의 특정한 특성을 개선하기 위한 목적으로 리보스 당 모이어티가 변형된 수많은 뉴클레오사이드가 만들어졌다.
이러한 변형에는, 리보스 고리 구조가, 예를 들어, 헥소스 고리(HNA), 또는, 일반적으로 리보스 고리(LNA)의 C2와 C4 탄소 사이에 바이라디칼 가교를 갖는 바이사이클릭 고리, 또는 일반적으로 C2와 C3 탄소 사이에 결합이 없는 연결되지 않은 리보스 고리(예를 들어, UNA)로의 교체에 의해 변형되는 경우가 포함된다. 다른 당 변형된 뉴클레오사이드는, 예를 들어, 바이사이클로헥소스 핵산(WO2011/017521) 또는 트라이사이클릭 핵산(WO2013/154798)을 포함한다. 변형된 뉴클레오사이드는 또한 예를 들어, 펩티드 핵산(PNA) 또는 모르폴리노 핵산의 경우에 당 모이어티가 비-당 모이어티로 교체된 뉴클레오사이드를 포함한다.
당 변형은 또한 리보스 고리의 치환기 그룹을 수소 이외의 그룹으로 변경하거나 DNA 및 RNA 뉴클레오사이드에서 자연적으로 발견되는 2'-OH 그룹으로 변경하여 이루어진 변형을 포함한다. 예를 들어, 치환기는 2', 3', 4' 또는 5' 위치에 도입 될 수 있다.
2' 당 변형된 뉴클레오사이드
2' 당 변형된 뉴클레오사이드는 2' 위치에 H 또는 -OH 이외의 치환기를 갖는 뉴클레오사이드(2' 치환된 뉴클레오사이드) 또는 리보스 고리의 2' 탄소와 제 2 탄소 사이에 가교를 형성할 수 있는 2' 연결된 바이라디칼을 포함하는 뉴클레오사이드, 예를 들어, LNA(2'-4' 바이라디칼 가교된) 뉴클레오사이드이다.
실제로, 2' 당 치환된 뉴클레오사이드를 개발하는데 많은 노력을 해왔으며, 많은 2' 치환된 뉴클레오사이드는 올리고뉴클레오타이드에 통합 될 때 유익한 특성을 갖는 것으로 밝혀졌다. 예를 들어, 2' 변형된 당은 올리고뉴클레오타이드에 대한 개선된 결합 친화성 및/또는 증가된 뉴클레아제 내성을 제공 할 수 있다. 2' 치환된 변형된 뉴클레오사이드의 예는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA(MOE), 2'-아미노-DNA, 2'-플루오로-RNA, 및 2'-F-ANA 뉴클레오사이드이다. 추가 예로서, 예를 들어, Freier & Altmann; Nucl. Acid Res., 1997, 25, 4429-4443 and Uhlmann; Curr. Opinion in Drug Development, 2000, 3(2), 293-213, 및 Deleavey and Damha, Chemistry and Biology 2012, 19, 937을 참고하라. 아래에 일부 2' 치환된 변형된 뉴클레오사이드를 예시한다.
Figure pct00041
본 발명과 관련하여 2' 치환된 당 변형된 뉴클레오사이드는 LNA와 같은 2' 가교 뉴클레오사이드를 포함하지 않는다.
잠금 핵산 뉴클레오사이드(LNA 뉴클레오사이드)
“LNA 뉴클레오사이드”는 상기 뉴클레오사이드의 리보스 당 고리의 C2'과 C4'를 연결하는 바이라디칼(“2'- 4' 가교”로도 지칭됨)을 포함하는 2'- 변형된 뉴클레오사이드로서, 리보스 고리의 입체형태를 제한 또는 잠금한다. 이러한 뉴클레오사이드는 문헌에서 가교 핵산 또는 바이사이클릭 핵산(BNA)으로도 명명된다. 리보스 입체형태의 잠금은 LNA가 상보적 RNA 또는 DNA 분자에 대한 올리고뉴클레오타이드에 통합 될 때 개선된 혼성화(이중나선 안정화) 친화성과 연관된다. 이는 올리고뉴클레오타이드/보체 이중나선의 용융 온도를 측정하여 관례적으로 결정될 수 있다.
비 제한적인 예시적 LNA 뉴클레오사이드가 WO 99/014226, WO 00/66604, WO 98/039352, WO 2004/046160, WO 00/047599, WO 2007/134181, WO 2010/077578, WO 2010/036698, WO 2007/090071, WO 2009/006478, WO 2011/156202, WO 2008/154401, WO 2009/067647, WO 2008/150729, Morita 외, Bioorganic & Med.Chem. Lett. 12, 73-76, Seth 외, J. Org. Chem. 2010, Vol 75(5) pp. 1569-81, 및 Mitsuoka 외, Nucleic Acids Research 2009, 37(4), 1225-1238, 및 Wan and Seth, J. Medical Chemistry 2016, 59, 96459667에 개시되어 있다.추가의 비제한적인 예시적인 LNA 뉴클레오사이드는 반응식 1에 개시되어 있다.
반응식 1:
Figure pct00042
특정 LNA 뉴클레오사이드는 베타-D-옥시-LNA, 6'-메틸-베타-D-옥시 LNA, 예를 들어, (S)-6'-메틸-베타-D-옥시-LNA(ScET) 및 ENA이다. 특히 유리한 LNA는 베타-D-옥시-LNA이다.
뉴클레아제 매개 분해
뉴클레아제 매개 분해는 이러한 서열로 이중나선을 형성 할 때 상보적 뉴클레오타이드 서열의 분해를 매개 할 수 있는 올리고뉴클레오타이드를 의미한다.
일부 실시형태에서, 올리고뉴클레오타이드는 표적 핵산의 뉴클레아제 매개 분해를 통해 기능 할 수 있으며, 여기서 본 발명의 올리고뉴클레오타이드는 뉴클레아제, 특히 엔도뉴클레아제, 바람직하게는 RNase H와 같은 엔도리보뉴클레아제(RNase)를 동원 할 수 있다. 뉴클레아제 매개 메카니즘을 통해 작동하는 올리고뉴클레오타이드 디자인의 예는 전형적으로 5 개 또는 6 개 이상의 연속적인 DNA 뉴클레오사이드의 영역을 포함하고 친화성 개선 뉴클레오사이드, 예를 들어, 갭머가 한쪽 또는 양쪽에서 연접하는 올리고뉴클레오타이드이다.
RNase H 활성 및 동원
안티센스 올리고뉴클레오타이드의 RNase H 활성은 상보적 RNA 분자와 함께 이중나선으로 존재할 때 RNase H를 동원하는 능력을 나타낸다. WO01/23613은 RNase H 활성을 결정하는 시험관내 방법을 제공하며, 이는 RNase H를 동원하는 능력을 결정하는데 사용될 수 있다. 전형적으로 올리고뉴클레오타이드는, 상보적 표적 핵산 서열과 함께 제공될 때, pmol/l/분으로 측정하여, 테스트되는 변형된 올리고뉴클레오타이드와 동일한 염기 서열을 가지지만 올리고뉴클레오타이드 내 모든 단량체들 사이에 포스포로티오에이트 연결을 가지는 DNA 단량체들 만을 내포하는 올리고뉴클레오타이드를 사용하고, WO01/23613(본원에 참고문헌으로 포함됨)의 실시예 91-95에 제공된 방법들을 사용하여 결정한 초기 속도의 적어도 5%, 예를 들어, 적어도 10% 또는 20% 초과인 초기 속도를 가지는 경우, RNase H를 동원할 수 있는 것으로 간주된다. RHase H 활성을 결정함에 사용하기 위해, Creative Biomart®(대장균에서 발현된 His 태그와 융합된 재조합 인간 RNase H1)의 재조합 인간 RNase H1을 사용할 수 있다.
갭머
본 발명의 안티센스 올리고뉴클레오타이드, 또는 이의 연속 뉴클레오타이드 서열은, 갭머 올리고뉴클레오타이드 또는 갭머 디자인으로도 명명되는 갭머일 수 있다. 안티센스 갭머들은 RNase H 매개 분해를 통해 표적 핵산을 억제하는데 통상적으로 사용된다. 갭머 올리고뉴클레오타이드는 '5-> 3' 방향으로 3개 이상의 별개의 구조 영역들인 5'-플랭크, 갭 및 3'-플랭크, F-G-F'를 포함한다. “갭” 영역(G)은 올리고뉴클레오타이드가 RNase H를 동원 할 수 있게 하는 인접 DNA 뉴클레오타이드의 스트레치를 포함한다. 갭 영역에는 하나 이상의 당 변형된 뉴클레오사이드, 유리하게는 고 친화성 당 변형된 뉴클레오사이드를 포함하는 5' 연접 영역(F), 그리고 하나 이상의 당 변형된 뉴클레오사이드, 유리하게는 고 친화성 당 변형된 뉴클레오사이드를 포함하는 3' 연접 영역(F')이 연접된다. 영역 F 및 F' 에서 하나 이상의 당 변형된 뉴클레오사이드는 표적 핵산에 대한 올리고뉴클레오타이드의 친화성을 개선시킨다(즉, 친화성 개선 당 변형된 뉴클레오사이드임). 일부 실시형태에서, 영역 F 및 F'에서 하나 이상의 당 변형된 뉴클레오사이드는 LNA 및 2'-MOE로부터 독립적으로 선택된 것과 같은 고 친화성 2' 당 변형과 같은 2' 당 변형된 뉴클레오사이드이다.
한 갭머 디자인에서, 갭 영역의 5' 및 3'에 가장 가까운 뉴클레오사이드는 DNA 뉴클레오사이드이고, 각각 5'(F) 또는 3'(F') 영역의 당 변형된 뉴클레오사이드에 인접하여 위치한다. 플랭크는 갭 영역으로부터 가장 원위의 말단, 즉, 5' 플랭크의 5' 말단 및 3' 플랭크의 3' 말단에 하나 이상의 당 변형된 뉴클레오사이드를 가지는 것으로 추가로 정의될 수 있다.
영역 F-G-F'은 연속 뉴클레오타이드 서열을 형성한다. 본 발명의 안티센스 올리고뉴클레오타이드, 또는 이의 연속 뉴클레오타이드 서열은, 식 F-G-F'의 갭머 영역을 포함할 수 있다. 일부 실시형태에서, 화학식 FG-F'의 갭머 영역의 뉴클레오사이드 사이의 모든 뉴클레오사이드간 연결은 포스포로티오에이트 뉴클레오사이드간 연결이다.
갭머 디자인 F-G-F'의 전장은, 예를 들면, 12 내지 32개 뉴클레오사이드, 예를 들어, 13 내지 24개, 예를 들어, 14 내지 22개 뉴클레오사이드, 예를 들어, 15 내지 20개, 예를 들어, 16 내지 18개 뉴클레오사이드 일 수 있다. 일부 실시형태에서, 전체 길이는 17개의 뉴클레오사이드이다. 일부 실시형태에서, 전체 길이는 17개의 뉴클레오사이드이다.
예를 들어, 본 발명의 갭머 올리고뉴클레오타이드는 다음 식으로 표시 될 수 있다:
F1-8-G5-16-F'1-8, 예를 들어,
F1-8-G7-16-F'2-8, 또는
F4-8-G7-12-F'2-8, 또는
F4-6-G7-11-F'2-6
단, 갭머 영역 F-G-F'의 전체 길이는 12개 이상, 예를 들어, 14개 이상의 뉴클레오타이드 길이이다.
한 실시형태에서, 본 발명의 갭머 올리고뉴클레오타이드는 다음 식으로 표시 될 수 있다:
F4-6-G7-11-F'2-6
바람직하게는 여기서 갭머 영역 FG-F'의 전체 길이는 적어도 16개 뉴클레오타이드, 예를 들어, 17개 또는 18개 뉴클레오타이드이다.
본 발명의 한 양상에서 안티센스 올리고뉴클레오타이드, 또는 이의 연속 뉴클레오타이드 서열은, 식 5'-F-G-F'-3'의 갭머로 구성되거나 이를 포함하고, 이 때 영역 F 및 F'은 독립적으로 1-8개 뉴클레오사이드를 포함하거나 이들로 구성되고, 이들 중 1-4개는 2' 당 변형되고 F 및 F' 영역의 5' 및 3' 말단을 정의하고, G는 RNase H를 동원할 수 있는 6 내지 16개 뉴클레오사이드, 예를 들어, 7 내지 12개 뉴클레오사이드 영역이다.
일부 실시형태에서, 영역 F 및 F'의 모든 변형된 뉴클레오사이드는 베타-D-옥시 LNA 뉴클레오사이드이다. 또한, 영역 F 또는 F', 또는 F 및 F'는 선택적으로 DNA 뉴클레오사이드를 포함할 수 있다. 선택적으로, 연접 영역 F 또는 F', 또는 연접 영역 F 및 F' 모두는 하나 이상의 DNA 뉴클레오사이드(교번 플랭크(alternating flank), 자세한 내용은 교번 플랭크의 정의 참조)를 포함할 수 있다.
영역 F, G 및 F '는 아래에서 추가로 정의되며 F-G-F' 식에 통합될 수 있다.
갭머-영역 G
갭머의 영역 G(갭 영역)는 올리고뉴클레오타이드가 RNaseH, 예를 들어, 인간 RNase H1, 전형적으로 DNA 뉴클레오사이드를 동원할 수 있게 하는 뉴클레오사이드의 영역이다. RNase H는 DNA와 RNA 사이의 이중나선을 인식하여 RNA 분자를 효소적으로 절단하는 세포 효소이다. 적합하게는 갭머는 5 또는 6개 이상의 연속 DNA 뉴클레오사이드, 예를 들어, 5-16개 연속 DNA 뉴클레오사이드, 예를 들어, 6-15개 연속 DNA 뉴클레오사이드, 예를 들어, 7-14개 연속 DNA 뉴클레오사이드, 예를 들어, 8-12개 연속 DNA 뉴클레오타이드, 예를 들어, 8-12개 연속 DNA 뉴클레오타이드 길이의 갭 영역(G)을 가질 수 있다. 갭 영역 G는 일부 실시형태에서 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16 개의 연속 DNA 뉴클레오사이드로 구성 될 수 있다.
일부 실시형태에서, 갭 영역 G는 12개 이하의 연속 DNA 뉴클레오사이드, 예를 들어 7, 8, 9, 10 또는 11개의 연속 DNA 뉴클레오사이드, 예를 들어 9, 10 또는 11개의 연속 DNA 뉴클레오사이드로 구성될 수 있다.
갭 영역에 있는 하나 이상의 시토신(C) DNA는 어떤 경우에는 메틸화될 수 있다(예를 들어 DNA c 다음에 DNA g가 오는 경우). 이러한 잔기는 5-메틸-시토신(meC)으로 주석된다. 일부 실시형태들에서 갭 영역 G는 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 인접 포스포로티오에이트 연결된 DNA 뉴클레오사이드로 구성될 수 있다.
일부 실시형태들에서, 갭 내 모든 뉴클레오사이드간 연결은 포스포로티오에이트 연결이다.
갭머-연접 영역들, F 및 F'
영역 F는 영역 G의 5' DNA 뉴클레오사이드에 바로 인접하여 위치한다. 영역 F의 3'에 가장 가까운 뉴클레오사이드는, 당 변형된 뉴클레오사이드, 예를 들어, 고 친화성 당 변형된 뉴클레오사이드, 예를 들면, 2' 치환된 뉴클레오사이드, 예를 들어, MOE 뉴클레오사이드, 또는 LNA 뉴클레오사이드이다.
영역 F는 영역 G의 3' DNA 뉴클레오사이드에 바로 인접하여 위치한다. 영역 F의 5'에 가장 가까운 뉴클레오사이드는, 당 변형된 뉴클레오사이드, 예를 들어, 고 친화성 당 변형된 뉴클레오사이드, 예를 들면, 2' 치환된 뉴클레오사이드, 예를 들어, MOE 뉴클레오사이드, 또는 LNA 뉴클레오사이드이다.
영역 F는 1-8개 연속 뉴클레오타이드 길이, 예를 들어, 2-6개, 예를 들어, 4-6개 연속 뉴클레오타이드 길이이다. 일부 실시형태에서, 영역 F의 길이는 4개 연속 뉴클레오타이드이다. 일부 실시형태에서, 영역 F의 길이는 5개 연속 뉴클레오타이드이다. 일부 실시형태에서, 영역 F의 길이는 6개 연속 뉴클레오타이드이다.
유리하게는 영역 F의 5'에 가장 가까운 뉴클레오사이드는 당 변형된 뉴클레오사이드이다. 일부 실시형태들에서 영역 F'의 5'에 가장 가까운 2개 뉴클레오사이드는 당 변형된 뉴클레오사이드이다. 일부 실시형태들에서 영역 F의 5'에 가장 가까운 뉴클레오사이드는 LNA 뉴클레오사이드이다. 일부 실시형태들에서 영역 F'의 5'에 가장 가까운 2개 뉴클레오사이드는 LNA 뉴클레오사이드이다.
영역 F는 1-8개 연속 뉴클레오타이드 길이, 예를 들어, 2-6개, 예를 들어, 2-5개 연속 뉴클레오타이드 길이이다. 일부 실시형태에서, 영역 F의 길이는 2개 연속 뉴클레오타이드이다. 일부 실시형태에서, 영역 F의 길이는 3개 연속 뉴클레오타이드이다. 일부 실시형태에서, 영역 F의 길이는 4개 연속 뉴클레오타이드이다. 일부 실시형태에서, 영역 F의 길이는 5개 연속 뉴클레오타이드이다.
유리하게는 영역 F의 3'에 가장 가까운 뉴클레오사이드는 당 변형된 뉴클레오사이드이다. 일부 실시형태들에서 영역 F'의 3'에 가장 가까운 2개 뉴클레오사이드는 당 변형된 뉴클레오사이드이다. 일부 실시형태들에서 영역 F'의 3'에 가장 가까운 2개 뉴클레오사이드는 LNA 뉴클레오사이드이다. 일부 실시형태들에서 영역 F'의 3'에 가장 가까운 뉴클레오사이드는 LNA 뉴클레오사이드이다.
영역 F의 길이가 1 일 때 이는 유리하게는 LNA 뉴클레오사이드임을 주목해야 한다. 또한, 영역 F 및/또는 F'의 길이가 2일 때, 영역 F 및/또는 F'의 두 뉴클레오사이드 모두는 유리하게는 LNA 뉴클레오사이드임을 주목하여야 한다.
일부 실시형태에서, 영역 F 및 F' 내 당 변형된 뉴클레오사이드는 오직 한 유형의 당 변형된 뉴클레오사이드, 예를 들어, MOE만 또는 베타-D-옥시 LNA만 또는 ScET만으로 구성된다. 이러한 디자인은 또한 균일 플랭크 또는 균일 갭머 디자인으로 명명된다.
일부 실시형태에서, 영역 F 또는 F', 또는 F 및 F'의 모든 뉴클레오사이드는 LNA 뉴클레오사이드, 예를 들어, 베타-D-옥시 LNA 뉴클레오사이드이다. 대안적 실시예에서, 영역 F 및 F'의 모든 당 변형된 뉴클레오사이드는 LNA 뉴클레오사이드, 예를 들어, 베타-D-옥시 LNA 뉴클레오사이드이고, 여기서 영역 F 또는 F', 또는 영역 F 및 F' 둘 모두는 DNA 뉴클레오사이드(또는 교번 플랭크, 자세한 내용은 이에 대한 정의 참조)를 포함할 수 있다.
일부 실시형태들에서 영역 F 및 F'의 5'에 가장 가까운 그리고 3'에 가장 가까운 뉴클레오사이드는 LNA 뉴클레오사이드, 예를 들어, 베타-D-옥시 LNA 뉴클레오사이드 뉴클레오사이드이다.
일부 실시형태에서, 영역 F와 영역 G 사이의 뉴클레오사이드간 연결 및/또는 영역 F'와 영역 G 사이의 뉴클레오사이드간 연결은 포스포로티오에이트 뉴클레오사이드간 연결이다. 일부 실시형태들에서, 영역 F 또는 F', F 및 F'의 뉴클레오사이드들 사이의 뉴클레오사이드간 연결은 포스포로티오에이트 뉴클레오사이드간 연결이다.
LNA 갭머
LNA 갭머는 영역 F 및 F' 중 하나 또는 둘 모두가 LNA 뉴클레오사이드를 포함하거나 이들로 구성된 갭머이다. 베타-D-옥시 갭머는 영역 F 및 F' 중 하나 또는 둘 모두가 베타-D-옥시 LNA 뉴클레오사이드를 포함하거나 이들로 구성된 갭머이다.
일부 실시형태에서, LNA 갭머는 식: [LNA]1-5-[영역 G]-[LNA]1-5이고, 여기서 영역 G는 RNase H를 동원할 수 있는 연속 DNA 뉴클레오사이드의 영역이거나 이를 포함한다.
MOE 갭머
MOE 갭머는 영역 F 및 F'가 MOE 뉴클레오사이드로 구성된 갭머이다. 일부 실시형태들에서 MOE 갭머의 디자인은 [MOE]1-8-[영역 G] 5-16-[MOE] 1-8, 예를 들어, [MOE]2-7-[영역 G]6-14-[MOE] 2-7, 예를 들어, [MOE]3-6-[영역 G]8-12-[MOE] 3-6이고, 이 때 영역 G는 갭머 정의에서 정의된 바와 같다. 5-10-5 디자인(MOE-DNA-MOE)의 MOE 갭머가 해당 분야에서 널리 사용되어 왔다.
혼합형 윙 갭머
혼합형 윙 갭머는 LNA 갭머이며 이 때 영역 F 및 F' 중 하나 또는 둘 모두는 2'-O-알킬-RNA 단위, 2'-O-메틸-RNA, 2'-아미노-DNA 단위, 2'-플루오로-DNA 단위, 2'-알콕시-RNA, MOE 단위, 아라비노 핵산(ANA) 단위 및 2'-플루오로-ANA 단위, 예를 들어, MOE 뉴클레오사이드로 구성된 군에서 독립적으로 선택된 2' 치환된 뉴클레오사이드, 예를 들어, 2' 치환된 뉴클레오사이드를 포함한다. 영역 F 및 F' 중 하나 이상, 또는 영역 F 및 F' 둘 모두가 하나 이상의 LNA 뉴클레오사이드를 포함하는 일부 실시형태에서, 영역 F 및 F'의 나머지 뉴클레오사이드는 MOE 및 LNA로 구성된 군에서 독립적으로 선택된다. 영역 F 및 F' 중 하나 이상, 또는 영역 F 및 F' 둘 모두가 둘 이상의 LNA 뉴클레오사이드를 포함하는 일부 실시형태에서, 영역 F 및 F'의 나머지 뉴클레오사이드는 MOE 및 LNA로 구성된 군에서 독립적으로 선택된다. 일부 혼합형 윙 실시형태에서, 영역 F 및 F' 중 하나 또는 둘 모두는 하나 이상의 DNA 뉴클레오사이드를 추가로 포함 할 수 있다.
교번 플랭크 갭머
연접 영역은 LNA 및 DNA 뉴클레오사이드를 모두 포함 할 수 있으며, LNA-DNA-LNA 뉴클레오사이드의 교번 모티프를 포함하므로 “교번 플랭크”로 지칭된다. 적어도 하나의 교번 플랭크를 포함하는 갭머는 “교번 플랭크 갭머”로 지칭된다. 따라서 “교번 플랭크 갭머”는 플랭크들(F 또는 F') 중 적어도 하나가 LNA 뉴클레오사이드(들) 외에 하나 이상의 DNA 뉴클레오타이드를 포함하는 LNA 갭머 올리고뉴클레오타이드이다. 일부 실시형태들에서 영역 F 또는 F' 중 하나 이상, 또는 영역 F 및 F' 모두는, LNA 뉴클레오사이드 및 DNA 뉴클레오사이드 모두를 포함한다. 이러한 실시형태에서, 연접 영역 F 또는 F', 또는 F 및 F' 모두는 3개 이상의 뉴클레오사이드를 포함하고, 이 때 F 및/또는 F' 영역의 5' 및 3'에 가장 가까운 뉴클레오사이드는 LNA 뉴클레오사이드이다. 교번 플랭크 LNA 갭머는 WO2016/127002에 개시되어 있다.
교번 플랭크 영역은 최대 3개 연속 DNA 뉴클레오사이드, 예를 들어, 1 내지 2 또는 1 또는 2 또는 3개 연속 DNA 뉴클레오사이드를 포함할 수 있다.
이러한 교번 플랭크 영역들은 LNA 뉴클레오사이드(L)의 수, 이에 이어 DNA 뉴클레오사이드(D)의 수를 나타내는 일련의 정수들로 주석처리될 수 있으며, 예를 들면, [L]1-3-[D]1-3-[L]1-3 or [L]1-2-[D]1-2-[L]1-2-[D]1-2-[L]1-2 이다.올리고뉴클레오타이드 디자인에서 이들은 종종 숫자들로 나타내어질 것이며, 그리하여 2-2-1은 5' [L]2-[D]2-[L] 3'을 나타내고, 1-1-1-1-1은 5' [L]-[D]-[L]-[D]-[L] 3'을 나타낸다. 교번 플랭크를 가지는 올리고뉴클레오타이드에서 플랭크(영역 F 및 F')의 길이는 이 영역들에 대해 상기 기재한 바와 같을 수 있으며, 예를 들어, 4 내지 8, 예를 들어, 5 내지 6개 뉴클레오사이드, 예를 들어, 4, 5, 6 또는 7개 변형된 뉴클레오사이드이다. 추가적인 엑소뉴클레아제 내성을 부여하기 위해 3' 플랭크(F')의 3' 말단에 2개 이상의 LNA 뉴클레오사이드를 갖는 것이 유리할 수 있다.
한 실시형태에서, 본 발명의 갭머 올리고뉴클레오타이드는 다음 식으로 표시 될 수 있다:
F4-6-G7-11-F'2-6,
여기서 F는[L]1-3-[D]1-3-[L]1-3의 디자인을 갖고 F'는 [L]1-2-[D]1-2-[L]2-4, 또는 [L]2-6의 디자인을 갖는다.
단, 갭머 영역 F-G-F'의 전체 길이는 적어도 16개 뉴클레오타이드, 예를 들어, 17개 또는 18개 뉴클레오타이드 길이이다.
따라서, 본 발명의 갭머 올리고뉴클레오타이드는 적어도 하나의 교번 플랭크를 포함할 수 있다. 전형적으로, 적어도 F 영역은 교번 플랭크이다. 일부 실시예에서, F 및 F' 영역 모두는 교번 플랭크이다. 일부 실시형태에서, F 영역은 교번 플랭크이고 F' 영역은 균일 플랭크이다(즉, F'는 오직 베타-D-옥시 LNA와 같은 한 유형의 당 변형된 뉴클레오사이드로만 구성됨).
일부 실시형태에서, 영역 F의 디자인은 3-2-1(즉, LLLDDL), 3-1-1 (즉, LLLDL), 2-1-2(LLDLL), 2-1-1(LLDL) 및 1-3-1(즉, LDDDL)의 디자인으로부터 선택된다.
일부 실시형태에서, 영역 F'의 디자인은 1-1-3(즉, LDLLL) 또는 1-1-2(즉, LDLL)이다. 일부 실시형태에서, 영역 F의 디자인은 LL, LLL 또는 LLLL이다.
올리고뉴클레오타이드의 영역 D' 또는 D''
본 발명의 올리고뉴클레오타이드는 일부 실시형태들에서 표적 핵산에 상보적인 올리고뉴클레오타이드의 연속 뉴클레오타이드 서열, 예를 들어, 갭머 영역 F-G-F', 및 추가 5' 및/또는 3' 뉴클레오사이드를 포함하거나 이들로 구성될 수 있다. 추가 5' 및/또는 3' 뉴클레오사이드는 표적 핵산에 완전히 상보적이거나 완전히 상보적이지는 않을 수 있다. 이러한 추가 5' 및/또는 3' 뉴클레오사이드는 본원에서 영역 D' 및 D''으로 지칭될 수 있다.
영역 D' 는 D”의 첨가는 갭머와 같은 연속 뉴클레오타이드 서열을 접합체 모이어티 또는 또 다른 작용기에 연결하기 위한 목적으로 사용될 수 있다. 이것이 연속 뉴클레오타이드 서열을 접합체 모이어티와 연결하기 위해 사용되는 경우, 이는 생분해성 링커로 기능할 수 있다. 대안적으로, 이는 엑소뉴클레아제 보호를 제공하거나 합성 또는 제조의 용이성을 위해 사용될 수 있다.
영역 D' 및 D''은 각각 영역 F의 5' 말단 또는 영역 F'의 3' 말단에 부착되어, 다음 식 D'-F-G-F', F-G-F'-D'' 또는 D'-F-G-F'-D''의 디자인을 생성할 수 있다. 이 경우 F-G-F'는 올리고뉴클레오타이드의 갭머 부분이고 영역 D' 또는 D''은 올리고뉴클레오타이드의 별도 부분을 구성한다.
영역 D' 또는 D''는 표적 핵산에 상보적이거나 비-상보적일 수 있는 1, 2, 3, 4 또는 5개의 추가 뉴클레오타이드를 독립적으로 포함하거나 이들로 구성될 수 있다. F 또는 F' 영역에 인접한 뉴클레오타이드는 당 변형된 뉴클레오타이드, 예를 들어, 이의 DNA 또는 RNA 또는 염기 변형된 형태가 아니다. D' 또는 D' 영역은 뉴클레아제에 민감한 생분해성 링커로 작용할 수 있다(링커 정의 참조). 일부 실시형태들에서 또 다른 5' 및/또는 3' 말단 뉴클레오타이드는 포스포디에스테르 연결로 연결되며, DNA 또는 RNA이다. 영역 D' 또는 D''로서 사용하기에 적합한 뉴클레오타이드 기반 생분해성 링커는 WO2014/076195에 개시되어 있으며, 이는 예로서 포스포디에스테르 연결된 DNA 디뉴클레오타이드를 포함한다. 폴리-올리고뉴클레오타이드 구조체에서 생분해성 링커의 사용은 WO2015/113922에 개시되어 있으며, 여기서 이들은 단일 올리고뉴클레오타이드 내에서 다수의 안티센스 구조체들(예를 들어, 갭머 영역)을 연결하는데 사용된다.
한 실시형태에서 본 발명의 올리고뉴클레오타이드는 갭머를 구성하는 연속 뉴클레오타이드 서열 이외에 영역 D' 및/또는 D''를 포함한다.
일부 실시형태들에서, 본 발명의 올리고뉴클레오타이드는 다음 식으로 나타낼 수 있다:
F-G-F'; 특히 F1-8-G5-16-F'2-8, 예를 들어, F4-6-G7-11-F'2-6
D'-F-G-F', 특히 D'1-3-F1-8-G5-16-F'2-8, 예를 들어, D'1-3- F4-6-G7-11-F'2-6
F-G-F'-D'', 특히 F1-8-G5-16-F'2-8-D''1-3
D'-F-G-F'-D'', 특히 D'1-3- F1-8-G5-16-F'2-8-D''1-3
일부 실시형태들에서 영역 D'과 영역 F 사이에 위치한 뉴클레오사이드간 연결은 포스포디에스테르 연결이다. 일부 실시형태들에서 영역 F'과 영역 D'' 사이에 위치한 뉴클레오사이드간 연결은 포스포디에스테르 연결이다.
접합체
본원에서 사용된 용어 접합체는 비-뉴클레오타이드 모이어티(접합체 모이어티 또는 영역 C 또는 제 3 영역)에 공유적으로 연결된 올리고뉴클레오타이드를 지칭한다. 접합체 모이어티는 영역 D' 또는 D''와 같은 링커를 통해 선택적으로 안티센스 올리고뉴클레오타이드에 공유 결합될 수 있다.
올리고뉴클레오타이드 접합체 및 이의 합성은 또한 Manoharan의 Antisense Drug Technology, Principles, Strategies, and Applications, S.T. Crooke, ed., Ch. 16, Marcel Dekker, Inc., 2001 및 Manoharan, Antisense and Nucleic Acid Drug Development, 2002, 12, 103에 종합적 검토로 보고된 바 있다.
일부 실시형태들에서, 비-뉴클레오타이드 모이어티(접합체 모이어티)는 탄수화물(예를 들어, GalNAc), 세포 표면 수용체 리간드, 약물 물질, 호르몬, 친유성 물질, 중합체, 단백질, 펩티드, 독소(예를 들어, 박테리아 독소), 비타민, 바이러스성 단백질(예를 들어, 캡시드) 또는 이들의 조합으로 구성된 군에서 선택된다.
예시적인 접합체 모이어티는 아시알로당단백질 수용체(ASGPR)에 결합할 수 있는 것들을 포함한다. 특히, 3가 N-아세틸갈락토사민 접합체 잔기가 ASGPR에 결합하기에 적합하다(예를 들어 WO 2014/076196, WO 2014/207232 및 WO 2014/179620 참조). 이러한 접합체는 간으로의 올리고뉴클레오타이드 흡수를 개선시키는 역할을 한다.
일부 실시형태에서, 접합체는 예를 들어 참고문헌으로 포함된 WO 2012/143379에 개시된 바와 같은 트랜스페린 수용체에 대한 특이적 친화성을 갖는 항체 또는 항체 단편이다. 일부 실시형태에서 비-뉴클레오타이드 모이어티는 항체 또는 항체 단편, 예를 들어 혈액-뇌-장벽을 통한 전달을 촉진하는 항체 또는 항체 단편, 특히, 트랜스페린 수용체를 표적하는 항체 또는 항체 단편이다.
링커
연결 또는 링커는 하나 이상의 공유 결합을 통해 하나의 관심 화학 그룹 또는 세그먼트를 또 다른 관심 화학 그룹 또는 세그먼트에 연결하는 두 원자 사이의 연결이다. 접합체 모이어티는 직접적으로 또는 연결 모이어티(예를 들어, 링커 또는 테더)를 통해 올리고뉴클레오타이드에 부착 될 수 있다. 링커는 제 3 영역, 예를 들어, 접합체 모이어티(영역 C)를 제 1 영역, 예를 들어, 표적 핵산(영역 A)에 상보적인 올리고뉴클레오타이드 또는 연속 뉴클레오타이드 서열에 공유적으로 연결하는 역할을 한다.
본 발명의 일부 실시형태에서, 본 발명의 접합체 또는 올리고뉴클레오타이드 접합체는 선택적으로 표적 핵산(영역 A 또는 제1 영역)에 상보적인 올리고뉴클레오타이드 또는 연속 뉴클레오타이드 서열과 접합체 모이어티(영역 C 또는 제3 영역) 사이에 위치하는 링커 영역(제2 영역 또는 영역 B 및/또는 영역 Y)을 포함 할 수 있다.
생분해성 링커(영역 B)는 통상적으로 만나게 되는 또는 포유동물 신체 내부에서 만나게 되는 조건과 유사한 조건하에서 절단가능한 생리학적으로 불안정한 결합을 포함하거나 이러한 결합으로 구성된다. 생리학적으로 불안정한 링커가 화학적 변형(예를 들어, 절단)을 거치게 되는 조건에는 화학적 조건, 예를 들어, pH, 온도, 산화 또는 환원 조건 또는 물질, 포유동물 세포에서 발견되거나 만나게 되는 것과 유사한 염 농도가 포함된다. 포유류 세포내 조건은 또한 단백질분해 효소 또는 가수분해 효소 또는 뉴클레아제와 같은 포유동물 세포에 정상적으로 존재하는 효소 활성의 존재를 포함한다. 한 실시형태에서 생분해성 링커는 S1 뉴클레아제 절단에 민감하다. 일부 실시형태들에서, 생리학적으로 불안정한 링커(생분해성)는 1 내지 10개의 연결된 뉴클레오사이드, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 연결된 뉴클레오사이드, 예를 들어, 2 내지 6개의 연결된 뉴클레오사이드, 예를 들어, 2 내지 5개의 연결된 뉴클레오사이드, 예를 들어, 2 내지 4개의 연결된 뉴클레오사이드를 포함하고, 여기서 적어도 2개의 연속적인 연결부, 예를 들어, 포스포디에스테르 연결부, 예를 들어, 적어도 3 또는 4 또는 5개 연속적인 포스포디에스테르 연결부는 생분해성이다. 바람직하게는 뉴클레오사이드는 DNA 또는 RNA이다.
한 실시형태에서, 올리고뉴클레오타이드와 접합체 모이어티 사이의 링커는 안티센스 올리고뉴클레오타이드의 연속 뉴클레오타이드 서열의 5' 또는 3' 말단에 적어도 2개의 연속적인 포스포디에스테르 연결을 포함하는 2 내지 5개의 연속적인 포스포디에스테르 연결된 뉴클레오사이드로 구성된 생리학적으로 불안정한 링커이다.
일부 실시형태에서, 생리학적으로 불안정한 링커는 AA, AT, AC, AG, TA, TT, TC, TG, CA, CT, CC, CG, GA, GT, GC 또는 GG로 구성된 군으로부터 선택된 서열을 가진 DNA 디뉴클레오타이드를 포함하거나 이것으로 구성되며, 여기서 2개의 DNA 뉴클레오사이드 사이에 포스포디에스테르 연결부가 있고 디뉴클레오타이드의 5' 또는 3' 말단에는 핵산 분자의 올리고뉴클레오타이드를 디뉴클레오타이드에 또는 접합체 모이어티를 디뉴클레오타이드에 연결하는 적어도 하나의 추가 포스포디에스테르가 있다. 예를 들어, 링커는 CA 디뉴클레오타이드일 수 있다. 일부 실시형태들에서, 생리학적으로 불안정한 링커는 AAA, AAT, AAC, AAG, ATA, ATT, ATC, ATG, ACA, ACT, ACC, ACG, AGA, AGT, AGC, AGG, TAA, TAT, TAC, TAG, TTA, TTT, TTC, TAG, TCA, TCT, TCC, TCG, TGA, TGT, TGC, TGG, CAA, CAT, CAC, CAG, CTA, CTG, CTC, CTT, CCA, CCT, CCC, CCG, CGA, CGT, CGC, CGG, GAA, GAT, GAC, CAG, GTA, GTT, GTC, GTG, GCA, GCT, GCC, GCG, GGA, GGT, GGC, 또는 GGG 서열의 DNA 트리뉴클레오타이드를 포함하거나 이것으로 구성되고, 여기서 DNA 뉴클레오사이드들 사이에 포스포디에스테르 연결부가 존재하고 그리고 트리뉴클레오타이드의 5' 또는 3' 말단에 하나의 추가 포스포디에스테르가 존재할 수 있다. 생분해성 링커를 함유하는 포스포디에스테르는 WO 2014/076195(본원에 참고로 포함됨)에 보다 상세히 설명되어 있다. 생분해성 링커를 갖는 접합체 화합물에서 표준과 비교할 때 접합체 모이어티의 적어도 약 50%가 올리고뉴클레오타이드로부터 절단되는데, 예를 들어, 절단된 올리고뉴클레오타이드로부터 접합체 모이어티의 적어도 약 60%가 절단, 예를 들어, 적어도 약 70%가 절단, 예를 들어, 적어도 약 80%가 절단, 예를 들어, 적어도 약 85%가 절단, 예를 들어, 적어도 약 90%가 절단, 예를 들어, 적어도 약 95%가 절단된다.
영역 Y는 반드시 생분해성일 필요는 없지만 주로 접합체 모이어티(영역 C 또는 제 3 영역)를 올리고뉴클레오타이드(영역 A 또는 제 1 영역)에 공유 연결하는 역할을 하는 링커를 의미한다. 영역 Y 링커는 사슬 구조 또는 반복 단위의 올리고머, 예를 들어, 에틸렌 글리콜, 아미노산 단위 또는 아미노 알킬기를 포함 할 수 있다. 본 발명의 올리고뉴클레오타이드 접합체는 다음과 같은 영역 요소들 A-C, A-B-C, A-B-Y-C, A-Y-B-C 또는 A-Y-C로 구성될 수 있다. 일부 실시형태들에서 링커(영역 Y)는 아미노 알킬, 예를 들어, 예를 들면 C6 내지 C12 아미노 알킬기를 비롯한 C2-C36 아미노 알킬기이다.
일부 실시형태에서, 링커(영역 Y)는 C6 아미노 알킬기이다.
약학적으로 허용되는 염
용어 “약학적으로 허용되는 염”은, 생물학적으로 또는 달리 바람직하지 않은 것은 아닌, 유리 염기 또는 유리 산의 생물학적 유효성 및 성질들을 보유하는 염들을 지칭한다. 이러한 염들은 무기산, 예를 들어, 염화수소산, 브롬화수소산, 황산, 질산, 인산, 특히, 염화수소산, 및 유기산, 예를 들어, 아세트산, 프로피온산, 글리콜산, 피루브산, 옥살산, 말레산, 말론산, 숙신산, 푸마르산, 타르타르산, 시트르산, 벤조산, 신남산, 만델산, 메탄설폰산, 에탄설폰산, p-톨루엔설폰산, 살리실산, N-아세틸시스테인을 사용하여 형성된다. 또한 이들 염은 무기 염기 또는 유기 염기를 유리 산에 부가하여 제조될 수 있다. 무기 염기로부터 유도된 염들에는, 나트륨, 칼륨, 리튬, 암모늄, 칼슘, 마그네슘 염 등이 포함되나 이에 제한되는 것은 아니다. 유기 염기로부터 유도된 염들에는, 자연 발생 치환된 아민, 사이클릭 아민 및 염기성 이온 교환 수지, 예를 들어, 아이소프로필아민, 트라이메틸아민, 다이에틸아민, 트라이에틸아민, 트라이프로필아민, 에탄올아민, 리신, 아르기닌, N-에틸피페리딘, 피페리딘, 폴리아민 수지를 비롯한 1차, 2차, 및 3차 아민, 치환된 아민의 염이 포함되나 이에 제한되는 것은 아니다. 본 발명의 화합물은 또한 양쪽성 이온의 형태로 존재할 수 있다. 화학식 (I)의 화합물의 특히 바람직한 약학적으로 허용되는 염은 염화수소산, 브롬화수소산, 황산, 인산 및 메탄설폰산의 염이다.
치료
본원에서 사용되는 “치료”, “치료하는”, “치료하다” 등의 용어는 일반적으로 원하는 약리학적 및/또는 생리학적 효과를 얻는 것을 의미한다. 이러한 효과는 질환 및/또는 질환으로 인한 역효과를 부분적으로 또는 완전히 치료한다는 점에서 치료적이다. 본원에서 사용되는 용어 “치료”는 대상체에서 질환의 임의의 치료를 포함하고 다음을 포함한다: (a) 질환을 억제하는 것; 또는 (b) 질환을 개선(즉, 경감)하는 것, 즉 질환의 퇴행을 유발하는 것. HBV 감염을 개선 및/또는 억제하는 화합물은 HBV 감염을 치료하는 화합물이다. 바람직하게는, 본원에서 사용되는 용어 “치료”는 이미 발현된 장애의 의학적 개입, 예를 들어, 이미 결정되고 발현된 HBV 감염 또는 암의 치료에 관한 것이다.
예방
본원에서 “예방하는 것”, “예방” 또는 “예방하다”라는 용어는 예방적 치료, 즉 질환을 치료하기보다는 예방하는 것을 목적으로 하는 조치 또는 절차에 관한 것이다. 예방이란 질환 또는 이의 증상을 완전히 또는 부분적으로 예방한다는 점에서 원하는 예방적인 약리학적 및/또는 생리학적 효과가 얻어지는 것을 의미한다. 따라서, 본원에서 “HBV 감염을 예방하는 것”은 대상체에서 HBV 감염이 발생하는 것을 예방하는 것 그리고 HBV 감염 증상의 발생을 예방하는 것을 포함한다. 본 발명에서 특히 HBV 감염된 모체로부터 어린이의 HBV 감염을 예방하는 것이 고려된다. 또한 급성 HBV 감염이 만성 HBV 감염으로 전환되는 것을 예방하는 것이 고려된다.
환자
본 발명의 목적에서, “대상체” 또는 “환자”는 척추동물일 수 있다. 본 발명의 맥락에서, 용어 “대상체”는 인간 및 다른 동물, 특히, 포유동물 및 다른 유기체를 모두 포함한다. 따라서, 본원에 제공된 수단 및 방법은 인간 요법 및 수의학 분야 모두에 적용가능하다. 따라서, 본원에서 대상체는 마우스, 래트, 햄스터, 토끼, 기니피그, 흰족제비, 고양이, 개, 닭, 양, 소과, 말, 낙타 또는 영장류와 같은 동물일 수 있다. 바람직하게는 대상체는 포유동물이다. 보다 바람직하게는 대상체는 인간이다. 일부 실시형태에서, 환자는 본원에 언급된 질환, 예를 들어, HBV 감염 또는 암에 걸려있다. 일부 실시형태에서, 환자는 상기 질환에 걸리기 쉽다.
발명의 상세한 설명
본 발명의 한 양상은, HBV 감염, 예를 들어, 만성 HBV 감염 및 증식성 질환, 예를 들어, 암, 특히 간세포 암종으로 구성된 군으로부터 선택된 질환의 치료 및/또는 예방에 사용하기 위한, FUBP1을 표적하는 개선된 안티센스 올리고뉴클레오타이드, 또는 이의 접합체이다.
본 발명의 한 실시형태는 감염된 세포, 예를 들어, HBV 감염된 세포에서 HBV DNA, 예를 들어, cccDNA, 및 HBV RNA 전사체, 예를 들어, pgRNA를 감소시킬 수 있는 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체이다.
추가 실시형태에서, 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체는 HBV 감염된 개체의 생체내에서 HBsAg 및/또는 HBeAg를 감소시킬 수 있다.
본 발명의 또 다른 양상은 B형 간염 바이러스(HBV) 감염, 특히, 만성 HBV 감염의 치료 및/또는 예방 또는 FUBP1이 과발현된 암의 치료에서 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체의 용도이다.
본 발명의 안티센스 올리고뉴클레오타이드
본 발명의 개선된 안티센스 올리고뉴클레오타이드 또는 이의 접합체는 FUBP1 전사체를 표적화할 수 있고 RNase H 절단을 통해 분해를 촉진할 수 있기 때문에 잠재적으로 우수한 FUBP1 억제제이다.
본 발명의 한 양상은 HBV 감염의 치료 및/또는 예방, 또는 암 치료에 사용하기 위한 개선된 안티센스 올리고뉴클레오타이드 또는 이의 접합체이다.
본 섹션은 HBV 감염의 치료 및/또는 예방, 또는 암 치료에 사용하기에 적합한 개선된 안티센스 올리고뉴클레오타이드 또는 이의 접합체를 설명한다.
본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체는 시험관내 및 생체내에서 FUBP1의 발현을 억제할 수 있다. 이러한 억제는 FUBP1을 인코딩하는 또는 FUBP1의 조절에 관여하는 표적 핵산에 안티센스 올리고뉴클레오타이드를 혼성화함으로써 달성된다. 표적 핵산은 포유동물 FUBP1 서열, 예를 들어, 서열번호 1, 2, 3, 4 및/또는 5로 구성된 군으로부터 선택된 서열 일 수 있다.
본 발명의 올리고뉴클레오타이드는 FUBP1를 표적하는 안티센스 올리고뉴클레오타이드이다.
일부 실시형태에서 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체는 표적을 억제하거나 하향-조절함으로써 표적의 발현을 조절할 수 있다. 바람직하게는, 이러한 조절은 표적의 정상 발현 수준에 비해 적어도 20%의 발현 억제, 더욱 바람직하게는 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 또는 적어도 90%의 억제를 가져온다. 일부 실시형태에서, 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체는 PXB-PHH 세포에서 25 μM을 사용하여 시험관내에서 FUBP1 mRNA의 발현 수준을 적어도 50% 또는 60% 억제할 수 있다. 일부 실시형태에서, 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체는 PXB-PHH 중의 25 μM 세포를 사용하여 시험관 내에서 FUBP1 단백질의 발현 수준을 적어도 50% 만큼 억제할 수 있으며, 이러한 범위의 표적 감소는 cccDNA 감소와 좋은 상관관계가 있는 안티센스 올리고뉴클레오타이드를 선택하는 양상에서 유리하다. 적합하게는, 실시예들은 FUBP1 RNA 억제를 측정함에 사용될 수 있는 분석법을 제공한다(예를 들어, 실시예 1 또는 2). 표적 억제는 안티센스 올리고뉴클레오타이드의 연속 뉴클레오타이드 서열과 표적 핵산 사이의 혼성화에 의해 유발된다. 일부 실시형태에서 본 발명의 안티센스 올리고뉴클레오타이드는 안티센스 올리고뉴클레오타이드와 표적 핵산 사이의 미스매치를 포함한다. 미스매치에도 불구하고 표적 핵산에 대한 혼성화는 여전히 원하는 FUBP1 발현 억제를 나타내기에 충분할 수 있다. 미스매치로 인한 결합 친화성 감소는 올리고뉴클레오타이드 내 뉴클레오타이드 수의 증가 및/또는 안티센스 올리고뉴클레오타이드 서열 내부에 존재하는 표적에 대한 결합 친화성을 증가시킬 수 있는 변형된 뉴클레오사이드, 예를 들어, LNA를 비롯한 2' 당 변형된 뉴클레오사이드 수의 증가에 의해 보충될 수 있다.
본 발명의 한 양상은 12 내지 30개, 예를 들어, 12 내지 22개, 예를 들어, 16 내지 20개 뉴클레오타이드 길이의 개선된 안티센스 올리고뉴클레오타이드에 관한 것으로, 이는 서열번호 1의 뉴클레오타이드 16184-16205의 표적 서열, 예를 들어, 16184-16200, 16186-16203, 16188-16205 및 16189-16205로부터 선택된 표적 서열에 적어도 90% 상보성, 예를 들어, 100% 상보성을 가지며 적어도 12개 뉴클레오타이드 길이, 예를 들어, 14, 15, 16, 또는 17개 뉴클레오타이드 길이인 연속 뉴클레오타이드 서열을 포함한다. 특히, FUBP1의 발현을 억제할 수 있는, 즉 FUBP1 mRNA와 같은 FUBP1 핵산을 감소시킬 수 있는 안티센스 올리고뉴클레오타이드는 본 발명의 일부로 간주된다.
일부 실시형태에서, 본 발명의 안티센스 올리고뉴클레오타이드는 서열번호 10의 표적 핵산에 적어도 90% 상보성, 예를 들어, 완전 상보성을 갖는 12 내지 22개 뉴클레오타이드, 예를 들어, 15 내지 20개 뉴클레오타이드의 연속 뉴클레오타이드 서열을 포함한다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드는 서열번호 11의 표적 핵산에 적어도 90% 상보성, 예를 들어, 완전 상보성을 갖는 15 내지 18개 뉴클레오타이드, 예를 들어, 17 또는 18개 뉴클레오타이드의 연속 뉴클레오타이드 서열을 포함한다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드는 서열번호 18의 표적 핵산에 적어도 90% 상보성, 예를 들어, 완전 상보성을 갖는 15 내지 18개 뉴클레오타이드, 예를 들어, 17 또는 18개 뉴클레오타이드의 연속 뉴클레오타이드 서열을 포함한다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드는 서열번호 1의 다음 영역들: 서열번호 1의 16184-16205, 16184-16200, 16186-16203, 16188-16205 및 16189-16205에서 선택된 표적 핵산에 적어도 90% 상보성, 예를 들어, 완전 상보성을 갖는 15 내지 22개 뉴클레오타이드, 예를 들어, 15 또는 18개 뉴클레오타이드, 예를 들어, 17 또는 18개 뉴클레오타이드의 연속 뉴클레오타이드 서열을 포함한다. 더욱이, 이는 서열번호 1의 다음 영역: 30536-30553에서 선택된 표적 핵산에 적어도 90% 상보성, 예를 들어, 완전 상보성을 갖는 15 내지 22개 뉴클레오타이드, 예를 들어, 15 또는 18개 뉴클레오타이드, 예를 들어, 17 또는 18개 뉴클레오타이드의 연속 뉴클레오타이드 서열을 포함할 수 있다.
일부 실시형태들에서, 안티센스 올리고뉴클레오타이드는 12 내지 30개 뉴클레오타이드 길이의 인접 서열을 포함하며, 이는 표적 핵산 또는 표적 서열의 영역과 적어도 90% 상보적, 예를 들어, 적어도 91%, 예를 들어, 적어도 92%, 예를 들어, 적어도 93%, 예를 들어, 적어도 94%, 예를 들어, 적어도 95%, 예를 들어, 적어도 96%, 예를 들어, 적어도 97%, 예를 들어, 적어도 98%, 또는 100% 상보적이다.
본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열이 표적 핵산의 영역에 대해 완전히 상보적(100% 상보적)이거나 일부 실시형태에서 올리고뉴클레오타이드와 표적 핵산 사이에 1 또는 2개의 미스매치를 포함 할 수 있는 경우 유리하다.
일부 실시형태에서 안티센스 올리고뉴클레오타이드 서열은 서열번호 1의 상응하는 표적 핵산에 100% 상보적이다.
일부 실시형태에서, 본 발명의 안티센스 올리고뉴클레오타이드 또는 연속 뉴클레오타이드 서열은 서열번호 1 및 서열번호 4의 표적 핵산에 적어도 95% 상보성, 예를 들어, 완전(또는 100%) 상보성이다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드는 서열번호 1에 존재하는 상응하는 표적 서열에 적어도 90% 상보성, 예를 들어, 100% 상보성을 가지는 15 내지 22개 뉴클레오타이드 길이의 연속 뉴클레오타이드 서열을 포함하고, 여기서 표적 서열은 서열번호 1의 뉴클레오타이드 16184-16205, 16184-16200, 16186-16203, 16188-16205, 16189-16205 및 30536-30553으로부터 선택된다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드의 연속 뉴클레오타이드 서열은 서열번호 10의 표적 부위 서열에 적어도 90% 상보성, 유리하게는 100% 상보성이다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드의 연속 뉴클레오타이드 서열은 서열번호 11의 표적 부위 서열에 적어도 90% 상보성, 유리하게는 100% 상보성이다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드의 연속 뉴클레오타이드 서열은 서열번호 15의 표적 부위 서열에 적어도 90% 상보성, 유리하게는 100% 상보성이다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드의 연속 뉴클레오타이드 서열은 서열번호 19의 표적 부위 서열에 적어도 90% 상보성, 유리하게는 100% 상보성이다.
일부 실시형태에서, 연속 뉴클레오타이드 서열은 서열번호 6, 7, 8, 9 및 18로 구성된 군으로부터 선택된 핵염기 서열, 또는 이의 적어도 14개 연속 뉴클레오타이드, 예를 들어, 이의 17 또는 18개 연속 뉴클레오타이드를 포함한다.
일부 실시형태에서, 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열은, 10 내지 30개 뉴클레오타이드 길이, 예를 들어, 12 내지 25개, 예를 들어, 11 내지 22개, 예를 들어, 12 내지 20개, 예를 들어, 14 내지 18개 또는 16 내지 18개 연속 뉴클레오타이드 길이를 포함하거나 이들로 구성된다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열은 22개 이하의 뉴클레오타이드, 예를 들어, 20개 이하, 또는 18개 이하의 뉴클레오타이드를 포함하거나 이들로 구성된다. 예를 들어, 안티센스 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열은 14, 15, 16 또는 17개의 뉴클레오타이드를 포함할 수 있다. 본 명세서에 주어진 임의의 범위는 범위 종점을 포함하는 것으로 이해되어야 한다. 따라서, 올리고뉴클레오타이드가 10 내지 30 개의 뉴클레오타이드를 포함한다고 말하면, 10 개 및 30 개의 뉴클레오타이드가 모두 포함된다.
본 발명은 본 발명에 따른 안티센스 올리고뉴클레오타이드, 예를 들어, 12 - 24개 뉴클레오타이드 길이, 예를 들어, 12 - 18개 뉴클레오타이드 길이의 안티센스 올리고뉴클레오타이드를 제공하며, 여기서 안티센스 올리고뉴클레오타이드는 서열번호 6에 존재하는 적어도 12, 예를 들어, 적어도 13, 예를 들어, 적어도 14, 예를 들어, 적어도 15 또는 적어도 16개의 연속 뉴클레오타이드를 포함하는 연속 뉴클레오타이드 서열을 포함한다.
본 발명은 본 발명에 따른 안티센스 올리고뉴클레오타이드, 예를 들어, 12 - 24개 뉴클레오타이드 길이, 예를 들어, 12 - 18개 뉴클레오타이드 길이의 안티센스 올리고뉴클레오타이드를 제공하며, 여기서 안티센스 올리고뉴클레오타이드는 서열번호 7에 존재하는 적어도 12, 예를 들어, 적어도 13, 예를 들어, 적어도 14, 예를 들어, 적어도 15 또는 적어도 16개의 연속 뉴클레오타이드를 포함하는 연속 뉴클레오타이드 서열을 포함한다.
본 발명은 본 발명에 따른 안티센스 올리고뉴클레오타이드, 예를 들어, 12 - 24개 뉴클레오타이드 길이, 예를 들어, 12 - 18개 뉴클레오타이드 길이의 안티센스 올리고뉴클레오타이드를 제공하며, 여기서 안티센스 올리고뉴클레오타이드는 서열번호 8에 존재하는 적어도 12, 예를 들어, 적어도 13, 예를 들어, 적어도 14, 예를 들어, 적어도 15 또는 적어도 16개의 연속 뉴클레오타이드를 포함하는 연속 뉴클레오타이드 서열을 포함한다.
본 발명은 본 발명에 따른 안티센스 올리고뉴클레오타이드, 예를 들어, 12 - 24개 뉴클레오타이드 길이, 예를 들어, 12 - 18개 뉴클레오타이드 길이의 안티센스 올리고뉴클레오타이드를 제공하며, 여기서 안티센스 올리고뉴클레오타이드는 서열번호 9에 존재하는 적어도 12, 예를 들어, 적어도 13, 예를 들어, 적어도 14, 예를 들어, 적어도 15 또는 적어도 16개의 연속 뉴클레오타이드를 포함하는 연속 뉴클레오타이드 서열을 포함한다.
본 발명은 본 발명에 따른 안티센스 올리고뉴클레오타이드, 예를 들어, 12 - 24개 뉴클레오타이드 길이, 예를 들어, 12 - 18개 뉴클레오타이드 길이의 안티센스 올리고뉴클레오타이드를 제공하며, 여기서 안티센스 올리고뉴클레오타이드는 서열번호 18에 존재하는 적어도 12, 예를 들어, 적어도 13, 예를 들어, 적어도 14, 예를 들어, 적어도 15 또는 적어도 16, 적어도 17 또는 18개의 연속 뉴클레오타이드를 포함하는 연속 뉴클레오타이드 서열을 포함한다.
일부 실시형태에서, 연속 뉴클레오타이드 서열은 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 또는 22개 연속 뉴클레오타이드 길이, 예를 들어, 16, 17 또는 18개 연속 뉴클레오타이드를 포함하거나 이들로 구성된다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열은 서열번호 6, 7, 8, 9 및 18로부터 선택된 서열을 포함하거나 이들로 구성된다.
유리한 실시형태들에서, 안티센스 올리고뉴클레오타이드는 하나 이상의 당 변형된 뉴클레오사이드, 예를 들어, 하나 이상의 2' 당 변형된 뉴클레오사이드, 예를 들어, 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA, 2'-아미노-DNA, 2'-플루오로-DNA, 아라비노 핵산(ANA), 2'-플루오로-ANA 및 LNA 뉴클레오사이드로 구성된 군으로부터 독립적으로 선택된 하나 이상의 2' 당 변형된 뉴클레오사이드를 포함한다. 하나 이상의 변형된 뉴클레오사이드(들)이 잠금 핵산(LNA)인 경우 유리하다.
일부 실시형태에서, 연속 뉴클레오타이드 서열은 LNA 뉴클레오사이드를 포함한다.
일부 실시형태에서, 연속 뉴클레오타이드 서열은 LNA 뉴클레오사이드 및 DNA 뉴클레오사이드를 포함한다.
일부 실시형태에서, 연속 뉴클레오타이드 서열은 2'-O-메톡시에틸(2'MOE) 뉴클레오사이드를 포함한다.
일부 실시형태에서, 연속 뉴클레오타이드 서열은 2'-O-메톡시에틸(2'MOE) 뉴클레오사이드 및 DNA 뉴클레오사이드를 포함한다.
유리하게는, 안티센스 올리고뉴클레오타이드의 3'에 가장 가까운 뉴클레오사이드, 또는 이의 연속 뉴클레오사이드는 2' 당 변형된 뉴클레오사이드이다.
유리하게는, 안티센스 올리고뉴클레오타이드는 포스포로티오에이트 또는 포스포로디티오에이트와 같은 적어도 하나의 변형된 뉴클레오사이드간 연결을 포함한다.
일부 실시형태에서, 연속 뉴클레오타이드 서열 내의 적어도 하나의 뉴클레오사이드간 연결은 포스포로티오에이트 뉴클레오사이드간 연결이다.
일부 실시형태에서, 연속 뉴클레오타이드 서열 내의 적어도 하나의 뉴클레오사이드간 연결은 포스포로디티오에이트 뉴클레오사이드간 연결이다.
일부 실시형태에서, 연속 뉴클레오타이드 서열 내의 적어도 하나의 뉴클레오사이드간 연결은 포스포디에스테르 뉴클레오사이드간 연결이다.
일부 실시형태에서, 연속 뉴클레오타이드 서열 내 모든 뉴클레오사이드간 연결은 포스포로티오에이트 뉴클레오사이드간 연결이다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열 내의 뉴클레오사이드간 연결의 적어도 75%는 포스포로티오에이트 뉴클레오사이드간 연결이다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열 내의 뉴클레오사이드간 연결 모두는 포스포로티오에이트 뉴클레오사이드간 연결이다.
본 발명의 유리한 실시형태에서 본 발명의 안티센스 올리고뉴클레오타이드는 RNase H1과 같은 RNase H를 동원할 수 있다. 일부 실시형태에서, 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열은 갭머이다.
일부 실시형태에서, 안티센스 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열은 식 5'-F-G-F'-3'의 갭머로 구성되거나 이를 포함한다.
일부 실시형태에서, 영역 G는 6 내지 16개의 DNA 뉴클레오사이드, 예를 들어, 7 내지 12개의 DNA 뉴클레오사이드로 구성된다. 일부 실시형태에서, 영역 F는 4 내지 6개의 뉴클레오사이드를 포함하고/하거나 영역 F'는 2 내지 6개의 뉴클레오사이드를 포함한다.
일부 실시형태에서, 영역 F 및 F'은 각각 적어도 하나의 LNA 뉴클레오사이드를 포함한다.
본 발명의 올리고뉴클레오타이드의 일부 실시형태에서, 모든 LNA 뉴클레오사이드는 베타-D-옥시 LNA 뉴클레오사이드이다.
일부 실시형태에서, 본 발명의 올리고뉴클레오타이드는 균일 플랭크를 갖는 LNA 갭머이다.
본 발명의 일부 실시형태에서, LNA 갭머는 교번 플랭크 LNA 갭머이다. 일부 실시예에서, 교번 플랭크 LNA 갭머는 적어도 하나의 교번 플랭크(예를 들어, 플랭크 F)를 포함한다. 일부 실시예에서, 교번 플랭크 LNA 갭머는 하나의 교번 플랭크(예를 들어, 플랭크 F) 및 하나의 균일 플랭크(예를 들어, 플랭크 F')를 포함한다. 일부 실시예에서, 교번 플랭크 LNA 갭머는 2개의 교번 플랭크를 포함한다. 예를 들어 LNA 갭머는 다음 디자인 중에서 선택된 디자인을 가질 수 있다: 3-2-1-9-2, 3-1-1-10-2, 2-1-2-10-3, 2-1-1-11-3, 2-1-1-10-1-1-2, 2-1-1-10-4, 1-3-1-7-1-1-3, 및 3-2-1-9-3. 대안적으로 LNA 갭머는 다음과 같은 디자인을 가질 수 있다: 1-1-3-9-1-1-2.
표 6은 각 모티프 서열에 대해 선호되는 디자인을 열거한다.
본 발명은 다음과 같은 올리고뉴클레오타이드 화합물을 제공한다(표 6):
표 6: 본 발명의 올리고뉴클레오타이드 모티프 서열들(서열번호로 표시), 이들의 디자인 및 모티프 서열을 기반으로 디자인된 본 발명의 특정 올리고뉴클레오타이드 화합물(화합물 식별 번호로 표시)의 목록.
Figure pct00043
표에서 제목 “올리고뉴클레오타이드 화합물”은 모티프 서열의 특정 디자인을 나타낸다. 대문자는 베타-D-옥시 LNA 뉴클레오사이드이고, 소문자는 DNA 뉴클레오사이드이고, 모든 LNA C는 5-메틸 시토신이고, 모든 뉴클레오사이드간 연결은 포스포로티오에이트 뉴클레오사이드간 연결이다. “디자인”라는 제목은 갭머 디자인인 F-G-F'을 의미한다. 교번 플랭크 디자인의 갭머에서 올리고뉴클레오타이드의 플랭크는 일련의 정수들로 주석처리되며, 이는 베타-D-옥시 LNA 뉴클레오사이드(L)의 수 및 이에 이은 DNA 뉴클레오사이드(D)의 수를 나타낸다. 예를 들어, 2-2-1 모티프가 있는 플랭크는 LLDDL을 나타낸다. 양쪽 블랭크 모두는 5' 및 3' 말단에 베타-D-옥시 LNA 뉴클레오사이드를 가진다. 다수의 DNA 뉴클레오사이드로 구성된 갭 영역(G)은 플랭크들 사이에 위치한다.
본 발명의 일부 실시형태에 있어서, 올리고뉴클레오타이드는 화합물 식별 번호 6_1, 6_2, 7_1, 7_2, 7_3, 7_4; 8_1 및 9_1의 올리고뉴클레오타이드 화합물들의 군으로부터 선택된다(표 6 참조).예를 들어, 상기 화합물은 화합물 식별 번호 7_3의 화합물일 수 있다.
대안적인 실시형태에서, 올리고뉴클레오타이드는 화합물 식별 번호 18_1을 갖는 화합물의 올리고뉴클레오타이드이다(표 6 참조).
모든 경우 F-G-F' 디자인은 “정의” 섹션의 “올리고뉴클레오타이드의 영역 D' 또는 D''에 기재된 바와 같은 영역 D' 및/또는 D''을 추가로 포함할 수 있다. 일부 실시형태들에서 본 발명의 올리고뉴클레오타이드는 갭머 영역의 5' 또는 3' 말단, 예를 들어, 5' 말단에 1, 2 또는 3개 포스포디에스테르 연결된 뉴클레오사이드 단위, 예를 들어, DNA 단위를 가진다. 일부 실시형태에서, 본 발명의 올리고뉴클레오타이드는 2개의 5' 포스포디에스테르 연결된 DNA 뉴클레오사이드에 이어 상기 정의된 바와 같은 F-G-F′갭머 영역으로 구성된다. 5' 또는 3' 말단에 포스포디에스테르 연결된 DNA 단위를 포함하는 올리고뉴클레오타이드는 접합에 적합하며 본원에 기재된 바와 같은 접합체 모이어티를 추가로 포함할 수 있다. 간으로의 전달을 위해, ASGPR 표적화 모이어티가 접합체 모이어티로서 특히 유리하며, 자세한 내용은 접합체 섹션을 참조하라.
접합체
HBV 감염은 주로 간에서 간세포에 영향을 미치기 때문에, 접합되지 않은 안티센스 올리고뉴클레오타이드에 비해 본 발명의 개선된 안티센스 올리고뉴클레오타이드의 간으로의 전달을 증가시킬 접합체 모이어티에 안티센스 올리고뉴클레오타이드를 접합시키는 것이 유리하다. 한 실시형태에서, 간 표적화 모이어티는 콜레스테롤 또는 다른 지질을 포함하는 모이어티 또는 아시알로당단백질 수용체(ASGPR)에 결합할 수 있는 접합체 모이어티로부터 선택된다.
일부 실시형태에서, 본 발명은 접합체 모이어티에 공유적으로 부착된 본 발명의 안티센스 올리고뉴클레오타이드를 포함하는 접합체를 제공한다.
아시알로당단백질 수용체(ASGPR) 접합체 모이어티는 갈락토스의 친화성과 동일하거나 그보다 큰 친화성으로 아시알로당단백질 수용체(ASPGR 표적화 모이어티)에 결합할 수 있는 하나 이상의 탄수화물 모이어티를 포함한다. 아시알로당단백질 수용체에 대한 수많은 갈락토스 유도체의 친화성이 연구되었거나(예를 들어 Jobst, ST 및 Drickamer, K. JB.C. 1996, 271, 6686 참조) 당업계의 전형적인 방법을 사용하여 쉽게 결정된다.
한 실시형태에서, 접합체 모이어티는 갈락토스, 갈락토사민, N-포르밀-갈락토사민, N-아세틸갈락토사민, N-프로피오닐-갈락토사민, N-n-부타노일-갈락토사민 및 N-이소부타노일갈락토사민으로 구성된 군으로부터 선택되는 적어도 하나의 아시알로당단백질 수용체-표적화 모이어티를 포함한다. 유리하게는, 아시알로당단백질 수용체-표적화 모이어티는 N-아세틸갈락토사민(GalNAc)이다.
ASGPR 접합체 모이어티를 생성하기 위해 ASPGR 표적화 모이어티(바람직하게는 GalNAc)가 접합체 스캐폴드에 부착될 수 있다. 일반적으로 ASPGR 표적화 모이어티는 해당 스캐폴드의 동일한 말단에 있을 수 있다. 한 실시형태에서, 접합체 모이어티는 스페이서에 연결된 2개 내지 4개의 말단 GalNAc 모이어티로 구성되며, 이는 각각의 GalNAc 모이어티를 안티센스 올리고뉴클레오타이드에 접합될 수 있는 분지 분자에 연결한다.
추가의 실시형태에서, 접합체 모이어티는 아시알로당단백질 수용체-표적화 모이어티에 대하여 1가, 2가, 3가 또는 4가이다. 유리하게는, 아시알로당단백질 수용체-표적화 모이어티는 N-아세틸갈락토사민(GalNAc) 모이어티를 포함한다.
GalNAc 접합체 모이어티는, 예를 들어, WO 2014/179620 및 WO 2016/055601 및 PCT/EP2017/059080에 기재된 것들(본원에 참조로 포함됨) 및 GalNAc 모이어티가 부착된 소형 펩티드, 예를 들어, Tyr-Glu-Glu-(아미노헥실 GalNAc)3 (YEE(ahGalNAc)3; 간세포 상의 아시알로당단백질 수용체에 결합하는 글리코트리펩티드(예를 들어, Duff, 외, Methods Enzymol, 2000, 313, 297 참조); 리신 기반 갈락토스 클러스터(예를 들어, L3G4; Biessen, 외, Cardovasc. Med., 1999, 214); 및 콜레인 기반 갈락토스 클러스터(예를 들어, 아시알로당단백질 수용체에 대한 탄수화물 인식 모티프)를 포함할 수 있다.
ASGPR 접합체 모이어티, 특히 3가 GalNAc 접합체 모이어티는 당업계에 공지된 방법을 사용하여 올리고뉴클레오타이드의 3'- 또는 5'-말단에 부착될 수 있다. 한 실시형태에서, ASGPR 접합체 모이어티는 올리고뉴클레오타이드의 5'-말단에 연결된다.
한 실시형태에서, 접합체 모이어티는 3가 N-아세틸갈락토사민(GalNAc), 예를 들어, 도 9A1, 9A2; 9C1, 9C2, 9D1, 9D2, 9E1, 9F1, 9G1, 9H1, 9I1, 9J1, 9L1 및 9L2에 도시된 것들이거나 접합체 모이어티는 9A1 및 9A2의 혼합물; 9C1 및 9C2의 혼합물 또는 9D1 및 9D2의 혼합물, 특히, 도 9D1 또는 9D2에 도시된 바와 같은 3가 N아세틸갈락토사민(GalNAc) 또는 이들의 혼합물이다.
일부 실시형태에서, 접합체는 다음으로 구성된 군으로부터 선택된다:
5'-GN2-C6ocoao mCsTsTsastsGscstststststsastsgsGsT,
5'-GN2-C6ocoao mCsTsTsasTsgscstststststsastsgsGsT,
5'-GN2-C6ocoao mCsTstsAsTsgscstststststsastsgsGsTsT,
5'-GN2-C6ocoao mCsTstsAstsgscstststststsastsgsGsTsT,
5'-GN2-C6ocoao mCsTstsAstsgscstststststsastsGsgsTsT,
5'-GN2-C6ocoao mCsTstsAstsgscstststststsastsGsGsTsT,
5'-GN2-C6ocoao GscststsTststsastsgsgstsTsts mCsAs mC, 및
5'-GN2-C6ocoao TsAsTsgscsTststststsastsgsgstsTsTs mC,
5'-GN2-C6ocoao AScS mCSASAStStStStScSaStStStS mCStAS mC
여기서 대문자는 베타-D-옥시 LNA 뉴클레오사이드를 나타내고, 소문자는 DNA 뉴클레오사이드를 나타내며, 여기서 각각의 LNA 시토신은 5-메틸 시토신이고, 아래첨자 s는 포스포로티오에이트 뉴클레오사이드간 연결을 나타내고, 아래첨자 o는 포스포디에스테르 뉴클레오사이드간 연결을 나타내고, 그리고 GN2-C6은, 바람직하게는 올리고뉴클레오타이드의 5' 말단에서 포스포디에스테르 연결을 통해 결합된, 도 9D에 나타낸 바와 같은 3가 N-아세틸갈락토사민(GalNAc), 예를 들어, 도 9D-1 또는 도 9D2에 나타낸 바와 같은 3가 N-아세틸갈락토사민(GalNAc) 또는 이 둘의 혼합물이다. 이러한 분자들 중 일부를 나타내는 화학식을 도 1 내지 8 및 8.1에 나타낸다.
일부 실시형태에서, 접합체는 도 1에 도시된 접합체이다.
일부 실시형태에서, 접합체는 도 2에 도시된 접합체이다.
일부 실시형태에서, 접합체는 도 3에 도시된 접합체이다.
일부 실시형태에서, 접합체는 도 4에 도시된 접합체이다.
일부 실시형태에서, 접합체는 도 5에 도시된 접합체이다.
일부 실시형태에서, 접합체는 도 6에 도시된 접합체이다.
일부 실시형태에서, 접합체는 도 7에 도시된 접합체이다.
일부 실시형태에서, 접합체는 도 8에 도시된 접합체이다.
일부 실시형태에서, 접합체는 도 8.1에 도시된 접합체이다.
도 1-8, 및 8.1에 도시된 화합물들은 양성자화된 형태로 도시되어 있다-포스포로티오에이트 연결 상의 S 원자가 양성자화된다 - 양성자의 존재는 분자 환경의 산성도, 그리고 대체 양이온의 존재(예를 들어, 올리고뉴클레오타이드가 염 형태로 존재하는 경우)에 따라 달라질 것임을 이해할 수 있을 것이다. 양성자화된 포스포로티오에이트는 호변이성질체 형태로 존재한다.
약학적으로 허용되는 염
본 발명의 화합물은 약학적으로 허용되는 염의 형태로 존재할 수 있다. 용어 “약학적으로 허용되는 염”은 본 발명의 화합물의 생물학적 효과 및 특성을 유지하고 적합한 무독성 유기 또는 무기 산 또는 유기 또는 무기 염기로부터 형성되는 통상적인 산 부가 염 또는 염기 부가 염을 지칭한다. 산 부가 염은, 예를 들어, 염화수소산, 브롬화수소산, 요오드화수소산, 황산, 설팜산, 인산 및 질산과 같은 무기산으로부터 유도된 것들, 및 p-톨루엔설폰산, 살리실산, 메탄설폰산, 옥살산, 숙신산, 구연산, 말산, 젖산, 푸마르산과 같은 유기산으로부터 유도된 것들 등을 포함한다. 염기-부가 염은 암모늄, 칼륨, 나트륨 및 4차 수산화암모늄, 예를 들어, 수산화 테트라메틸 암모늄으로부터 유도된 염을 포함한다. 약학적 화합물의 염으로의 화학적 변형은 화합물의 개선된 물리적 및 화학적 안정성, 흡습성, 유동성 및 용해도를 얻기 위해 약학분야 화학자에게 잘 알려진 기술이다. 이것은 예를 들면, Bastin, Organic Process Research & Development 2000, 4, 427-435 또는 Ansel, In: Pharmaceutical Dosage Forms and Drug Delivery Systems, 6th ed. (1995), pp. 196 및 1456-1457에 기재되어 있다. 예를 들어, 본원에 제공된 화합물의 약학적으로 허용되는 염은 나트륨 염 일 수 있다.
추가 양상에서, 본 발명은 안티센스 올리고뉴클레오타이드 또는 그의 접합체의 약학적으로 허용가능한 염, 예를 들어 약학적으로 허용가능한 나트륨염, 암모늄염 또는 칼륨염을 제공한다.
제조 방법
또 다른 양상에서, 본 발명은 뉴클레오타이드 단위를 반응시켜 올리고뉴클레오타이드에 포함된 공유 결합된 연속 뉴클레오타이드 단위를 형성하는 단계를 포함하는 본 발명의 올리고뉴클레오타이드 제조 방법을 제공한다. 바람직하게는, 이러한 방법은 포스포라미다이트 화학을 사용한다(예를 들면 Caruthers 외, 1987, Methods in Enzymology vol. 154, pages 287-313 참조). 추가 실시형태에서, 이러한 방법은 접합 모이어티(리간드)와 연속 뉴클레오타이드 서열을 반응시켜 접합 모이어티를 올리고뉴클레오타이드에 공유적으로 부착하는 단계를 추가로 포함한다. 추가 양상에서 본 발명의 올리고뉴클레오타이드 또는 접합 된 올리고뉴클레오타이드를 약학적으로 허용되는 희석제, 용매, 담체, 염 및/또는 보조제와 혼합하는 단계를 포함하는, 본 발명의 조성물의 제조 방법이 제공된다.
약학 조성물
또 다른 양상에서, 본 발명은 임의의 전술한 올리고뉴클레오타이드 및/또는 올리고뉴클레오타이드 접합체 또는 이의 염 및 약학적으로 허용되는 희석제, 담체, 염 및/또는 보조제를 포함하는 약학 조성물을 제공한다. 약학적으로 허용되는 희석제는 포스페이트 완충 식염수(PBS)를 포함하고 약학적으로 허용되는 염은 나트륨, 암모늄 및 칼륨 염을 포함하지만 이에 제한되지 않는다. 일부 실시형태에서 약학적으로 허용되는 희석제는 멸균 포스페이트 완충 식염수이다. 대안적으로, 희석제는 물 또는 염화나트륨 용액일 수 있다. 일부 실시형태에서 올리고뉴클레오타이드는 50 내지 300μM 용액의 농도로 약학적으로 허용되는 희석제에 사용된다.
본 발명에 사용하기에 적합한 제형은 Remington 's Pharmaceutical Sciences, Mack Publishing Company, Philadelphia, Pa., 17th ed., 1985에서 찾을 수 있다. 약물 전달 방법에 대한 간략한 검토는 예를 들어, Langer(Science 249:1527-1533, 1990)를 참조하라. WO 2007/031091은 약학적으로 허용되는 희석제, 담체 및 보조제의 적합하고 바람직한 추가 예를 제공한다(본원에 참고문헌으로 포함됨). 적합한 투여량, 제형, 투여 경로, 조성물, 투여 형태, 다른 치료제와의 병용, 전구-약물 제형도 WO2007/031091에 제공된다.
일부 실시형태에서, 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체, 또는 이의 약학적으로 허용되는 염은 분말, 예를 들어 동결건조 분말과 같은 고체 형태이다.
일부 실시형태에서, 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체는 약학적 조성물 또는 제형의 제조를 위해 약학적으로 허용되는 활성 또는 불활성 물질과 혼합 될 수 있다. 약학적 조성물의 조성 및 제제화 방법은 투여 경로, 질환 정도 또는 투여 될 용량을 비롯한(그러나 이에 제한되지 않음) 다수의 기준에 따라 달라진다.
이들 조성물은 통상적인 멸균 기술에 의해 멸균되거나 멸균 여과 될 수 있다. 생성된 수용액은 그대로 사용하기 위해 포장되거나 동결건조 될 수 있으며, 동결건조된 제제는 투여 전에 멸균된 수성 담체와 조합된다. 제제의 pH는 전형적으로 3 내지 11, 보다 바람직하게는 5 내지 9 또는 6 내지 8, 가장 바람직하게는 7 내지 8, 예를 들어 7 내지 7.5가 될 것이다. 생성된 고체 형태의 조성물은 다수의 단일 용량 단위로 포장 될 수 있으며, 각 단위는 예를 들어, 밀봉된 정제 또는 캡슐 포장으로 고정된 양의 전술한 제제 또는 제제들을 함유한다. 고체 형태의 조성물은 또한 예를 들어, 국소 도포가능한 크림 또는 연고용으로 디자인된 압착가능한 튜브에 유동적인 양을 위한 용기로 포장 될 수 있다.
일부 실시형태에서, 본 발명의 안티센스 올리고뉴클레오타이드 또는 이의 접합체는 전구약물이다. 특히, 안티센스 올리고뉴클레오타이드 접합체와 관련하여, 일단 전구 약물이 작용 부위, 예를 들어, 표적 세포로 전달되면 접합체 모이어티가 올리고뉴클레오타이드로부터 절단된다.
응용
본 발명의 개선된 안티센스 올리고뉴클레오타이드는 예를 들어, 진단, 치료 및 예방을 위한 연구 시약으로 사용될 수 있다.
연구에서 이러한 안티센스 올리고뉴클레오타이드를 사용하여 세포(예를 들어, 시험관내 세포 배양) 및 실험 동물에서 FUBP1 단백질의 합성을 특이적으로 조절함으로써, 표적의 기능적 분석 또는 치료적 개입을 위한 표적으로서의 그 유용성 평가를 용이하게 할 수 있다. 전형적으로, 표적 조절은 단백질을 생산하는 mRNA를 분해 또는 억제함으로써 단백질 형성을 방지함에 의해 또는 단백질을 생산하는 유전자 또는 mRNA의 조절자를 분해 또는 억제함에 의해 이루어진다.
연구 또는 진단에 본 발명의 안티센스 올리고뉴클레오타이드를 사용하는 경우 표적 핵산은 cDNA 또는 DNA 또는 RNA로부터 유래된 합성 핵산 일 수 있다.
또한, FUBP1을 발현하는 표적 세포에서 FUBP1 발현을 조절하기 위한 생체내 또는 시험관내 방법이 본 발명에 포함되며, 상기 방법은 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학 조성물을 유효량으로 상기 세포에 투여하는 것을 포함한다.
일부 실시형태에서, 표적 세포는 포유동물 세포, 특히 인간 세포이다. 표적 세포는 시험관내 세포 배양물 또는 포유동물 조직의 일부를 형성하는 생체내 세포 일 수 있다. 바람직한 실시형태에서 표적 세포는 간에 존재한다. 표적 세포는 간세포일 수 있다.
본 발명의 한 양상은 약제로 사용하기 위한, 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학 조성물에 관한 것이다.
본 발명의 한 양상에서, 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학 조성물은 감염된 세포에서 cccDNA 수준을 감소시킬 수 있고 따라서 HBV 감염을 억제할 수 있다. 특히, 안티센스 올리고뉴클레오타이드 또는 이의 접합체는 i) cccDNA 감소 및/또는 ii) pgRNA 감소 및/또는 iii) HBV DNA 감소 및/또는 iv) HBV 바이러스 항원 감소 중 하나 이상의 매개변수에 영향을 미칠 수 있다.
예를 들어, HBV 감염을 억제하는 안티센스 올리고뉴클레오타이드 또는 이의 접합체는 i) 감염된 세포에서 cccDNA 수준을 대조군과 비교하여 적어도 40%, 예를 들어, 50%, 60%, 70%, 80% 또는 90% 만큼; 또는 ii) pgRNA의 수준을 대조군과 비교하여 적어도 40%, 예를 들어, 50%, 60%, 70%, 80%, 또는 90% 만큼 감소시킬 수 있다. 대조군은 처리되지 않은 세포 또는 동물, 또는 적절한 대조군으로 처리된 세포 또는 동물일 수 있다.
HBV 감염의 억제는 HBV 감염된 1차 인간 간세포를 사용하여 시험관내에서 또는 인간화 간세포 PXB 마우스 모델(PhoenixBio에서 구입가능, 또한 Kakuni 외, 2014 Int. J. Mol. Sci. 15:58-74 참조)을 사용하여 생체내에서 측정될 수 있다. HBsAg 및/또는 HBeAg의 분비 억제는, 예를 들어, 제조업체의 지침에 따라 CLIA ELISA 키트(Autobio Diagnostic)를 사용하여 ELISA로 측정할 수 있다. 세포내 cccDNA 또는 HBV mRNA 및 pgRNA의 감소는, 예를 들어, 재료 및 방법 섹션에 기술된 바와 같이 qPCR에 의해 측정될 수 있다. 테스트 화합물이 HBV 감염을 억제하는지 여부를 평가하기 위한 추가 방법은 qPCR에 의해, 예를 들어, WO 2015/173208에 기술된 바와 같이 또는 노던 블롯법; 인시튜 혼성화 또는 면역형광법을 사용하여 HBV DNA의 분비를 측정하는 것이다.
FUBP1 수준의 감소로 인해 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학 조성물은 HBV 감염의 발생을 억제하거나 HBV 감염의 치료에 사용될 수 있다. 특히, 본 발명의 cccDNA, 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약제학적 조성물의 불안정화 및 감소는 HBsAg의 분비를 감소시키기만 하는 화합물과 비교하여 만성 HBV 감염의 발생을 보다 효율적으로 억제하거나 이를 치료한다.
따라서, 본 발명의 한 양상은 HBV 감염된 개체에서 cccDNA 및/또는 pgRNA를 감소시키기 위한 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약제학적 조성물의 용도에 관한 것이다.
본 발명의 추가 양상은 만성 HBV 감염의 발생을 억제하거나 치료하기 위한 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학 조성물의 용도에 관한 것이다.
본 발명의 추가 양상은 HBV 감염된 사람의 전염성을 감소시키기 위한 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학 조성물의 용도에 관한 것이다.본 발명의 특정 양상에서, 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학 조성물은 만성 HBV 감염의 발생을 억제한다.
본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학 조성물로 치료될 대상체(또는 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학 조성물을 예방적으로 받는 대상체)는 바람직하게는 인간, 보다 바람직하게는 HBsAg 양성 및/또는 HBeAg 양성인 인간 환자, 훨씬 더 바람직하게는 HBsAg 양성 및 HBeAg 양성인 인간 환자이다.
따라서, 본 발명은 유효량의 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약제학적 조성물을 투여하는 것을 포함하는, HBV 감염을 치료하는 방법에 관한 것이다. 본 발명은 또한 만성 HBV 감염에 의해 유발되는 간경화 및 간세포 암종을 예방하는 방법에 관한 것이다.
본 발명은 또한 약제, 특히 HBV 감염 또는 만성 HBV 감염의 치료 또는 HBV 감염자의 감염성 감소에 사용하기 위한 약제의 제조를 위한, 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약제학적 조성물의 용도를 제공한다. 바람직한 실시형태에서, 약제는 피하 투여용 제형으로 제조된다.
본 발명은 또한 약제의 제조를 위한, 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체, 약제학적 조성물의 용도를 제공하며, 여기서 약제는 정맥내 투여용 제형이다.
병용 요법
일부 실시형태들에서 본 발명의 개선된 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학적 조성물은 또 다른 치료제와의 병용 치료에 사용하기 위한 것이다. 치료제는 예를 들면 상기 질환 또는 장애에 대한 치료의 표준 일 수 있다.
예로서, 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약제학적 조성물은 다른 활성제, 예를 들어 안티센스(다른 LNA 올리고머 포함), siRNA(예를 들어, ARC520), 앱타머, 모르폴리노 또는 기타 항바이러스, 뉴클레오타이드 서열 의존적 작용 방식를 통해 작용하는, 올리고뉴클레오타이드 기반 항바이러스제 - 예를 들어 서열 특이적 올리고뉴클레오타이드 기반 항바이러스제-와 병용될 수 있다.
추가의 예로서, 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학 조성물은 다른 활성제, 예를 들어, 인터페론(예를 들어 페길화된 인터페론 알파), TLR7 작용제(예를 들어 GS-9620), 또는 치료용 백신과 같은 면역 자극 항바이러스 화합물과 병용될 수 있다.
추가 예로서, 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약제학적 조성물은 항바이러스 활성을 갖는 다른 활성제, 예를 들어, 소분자와 병용될 수 있다. 이러한 다른 활성제는, 예를 들어, 뉴클레오사이드/뉴클레오타이드 억제제(예를 들어 엔테카비르 또는 테노포비르 디소프록실 푸마레이트), 캡슐화 억제제, 진입 억제제(예를 들어 Myrcludex B)일 수 있다.
특정 실시형태에서, 추가 치료제는 HBV 제제, C형 간염 바이러스(HCV) 제제, 화학요법제, 항생제, 진통제, 비스테로이드성 항염증제(NSAID) 제제, 항진균제, 구충제, 항오심제, 항설사제 또는 면역억제제 일 수 있다.
특히, 관련 실시형태에서, 추가적인 HBV 제제는 인터페론 알파-2b, 인터페론 알파-2a 및 인터페론 알파콘-1(페길화 및 비페길화), 리바비린; HBV RNA 복제 억제제; 제2 안티센스 올리고머; HBV 치료 백신; HBV 예방 백신; 라미부딘(3TC); 엔테카비르(ETV); 테노포비르 디이소프록실 푸마레이트(TDF); 텔비부딘(LdT); 아데포비르; 또는 HBV 항체 요법(단클론 또는 다클론)일 수 있다.
다른 특정 관련 실시형태에서, 추가 HCV 제제는 인터페론 알파-2b, 인터페론 알파-2a 및 인터페론 알파콘-1(페길화 및 비페길화); 리바비린; 페가시스; HCV RNA 복제 억제제(예를 들어 ViroPharma사의 VP50406 시리즈); HCV 안티센스제; HCV 치료용 백신; HCV 프로테아제 억제제; HCV 헬리카제 억제제; 또는 HCV 단클론 또는 다클론 항체 요법일 수 있다.
투여
본 발명의 개선된 안티센스 올리고뉴클레오타이드, 이의 접합체, 또는 약학 조성물은 모범 의료 관행과 합치하는 양상으로 제형화, 투약, 및 투여된다. 이와 관련하여 고려해야 할 요소에는 치료 중인 특정 포유동물, 개별 환자의 임상 병태, 제제 전달 부위, 투여 방법, 투여 일정, 환자들의 연령 및 성별 및 의료 종사자에게 알려진 기타 요소가 포함된다. 여기에서 “유효량”(“(치료학적) 유효 용량”으로도 알려짐)은 의사 또는 다른 임상의가 찾고 있는 대상체의 생물학적 또는 의학적 반응을 유도할 화합물의 양을 의미한다. 본 발명의 올리고뉴클레오타이드, 접합체 화합물 또는 약학 조성물의 “유효량”은 이러한 고려사항에 의해 결정될 것이며, HBsAg 및/또는 HBeAg를 억제하는데 필요한 최소량이다. 예를 들어, 이러한 양은 수용자의 세포 또는 포유동물 전체에 독성인 양 미만일 수 있다.
일부 실시형태에서, 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학 조성물은 0.1 - 15 mg/kg, 예를 들어, 0.2 - 10 mg/kg, 예를 들어, 0.25 - 5 mg/kg의 용량으로 투여된다. 투여는 1주에 1회, 2주에 1회, 3주에 1회 또는 심지어 1개월에 1회일 수 있다.
본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학 조성물은 국소(예를 들어, 피부, 흡입, 눈 또는 귀) 또는 경장(예를 들어, 경구 또는 위장관을 통해) 또는 비경구(예를 들어, 정맥, 피하 또는 근육 내)로 투여될 수 있다.
바람직한 실시형태에서, 본 발명의 안티센스 올리고뉴클레오타이드, 이의 접합체 또는 약학적 조성물은 정맥내, 동맥내, 피하, 복강내 또는 근육내 주사 또는 주입을 포함하는 비경구 경로에 의해 투여된다. 한 실시형태에서, 활성 올리고뉴클레오타이드 또는 올리고뉴클레오타이드 접합체는 정맥내로 투여된다. GalNAc 접합 화합물을 사용하면 ASGP 수용체의 포화를 지연시키기 위해 피하 투여하는 것이 유리할 수 있다.
본 발명의 실시형태
본 발명의 다음의 실시형태들은 본원에 설명된 임의의 다른 실시형태와 조합하여 사용될 수 있다. 상기 본원에, 특히, “발명의 요약”, “정의” 및 “발명의 상세한 설명” 섹션에 제공된 정의 및 설명은 다음에 준용된다.
1. FUBP1 핵산에 적어도 90% 상보적인, 예를 들어, 완전히 상보적인 연속 뉴클레오타이드 서열을 포함하는 안티센스 올리고뉴클레오타이드로서, 세포에서 FUBP1, 예를 들어, 인간 FUBP1의 발현을 억제할 수 있는, 안티센스 올리고뉴클레오타이드.
2. 실시형태 1에 있어서,
a) 연속 뉴클레오타이드 서열은 인간 FUBP1의 엑손 14 내의 영역(표 3 참조)에 적어도 90% 상보적, 예를 들어, 완전히 상보적이거나, 또는
b) 연속 뉴클레오타이드 서열은 인간 FUBP1의 엑손 20 내의 영역(표 3 참조)에 적어도 90% 상보적, 예를 들어, 완전히 상보적인, 안티센스 올리고뉴클레오타이드.
3. 실시형태 1 및 2에 있어서,
a) 연속 뉴클레오타이드 서열은 서열번호 1에 제시된 인간 FUBP1 전구-mRNA의 뉴클레오타이드 16184 내지 16205의 영역, 예를 들어, 서열번호 1의 뉴클레오타이드 16184 내지 16200, 뉴클레오타이드 16186 내지 16203, 및 뉴클레오타이드 16188 내지 16205, 및 뉴클레오타이드 16189 내지 16205의 영역으로부터 선택된 영역에 완전히 상보적이고, 또는
b) 연속 뉴클레오타이드 서열은 서열번호 1에 제시된 인간 FUBP1 전구-mRNA의 뉴클레오타이드 30536 내지 30553의 영역에 완전히 상보적인, 안티센스 올리고뉴클레오타이드.
4. 실시형태 1 내지 3 중 어느 하나에 있어서, a) 연속 뉴클레오타이드 서열은 서열번호 10 및/또는 서열번호 11에 완전히 상보적이거나 b) 연속 뉴클레오타이드 서열은 서열번호 19에 완전히 상보적인, 안티센스 올리고뉴클레오타이드.
5. 실시형태 1 내지 4 중 어느 하나에 있어서, 안티센스 올리고뉴클레오타이드는 12 내지 30개 뉴클레오타이드 길이, 예를 들어 12 내지 22개 뉴클레오타이드 길이, 예를 들어 16 내지 20개 뉴클레오타이드 길이인, 안티센스 올리고뉴클레오타이드.
6. 실시형태 1 내지 4 중 어느 하나에 있어서, 연속 뉴클레오타이드 서열은 적어도 12개 뉴클레오타이드, 예를 들어, 14, 15, 16, 17 또는 18개 뉴클레오타이드의 연속 서열인, 안티센스 올리고뉴클레오타이드.
7. 실시형태 6에 있어서, 연속 뉴클레오타이드 서열은 17 또는 18개 뉴클레오타이드의 연속 서열인, 안티센스 올리고뉴클레오타이드.
8. 실시형태 1 내지 7 중 어느 하나에 있어서, 연속 뉴클레오타이드 서열은 서열번호 6, 7, 8, 9 및 18로 구성된 군으로부터 선택된 서열과 100% 동일한, 또는 이의 적어도 15개의 연속 뉴클레오타이드인, 안티센스 올리고뉴클레오타이드.
9. 실시형태 1 내지 8 중 어느 하나에 있어서, 연속 뉴클레오타이드 서열에 하나 이상의 변형된 뉴클레오사이드를 포함하는, 안티센스 올리고뉴클레오타이드.
10. 실시형태 9에 있어서, 연속 뉴클레오타이드 서열 내 하나 이상의 변형된 뉴클레오사이드는 2' 당 변형된 뉴클레오사이드인, 안티센스 올리고뉴클레오타이드.
11. 실시형태 10에 있어서, 하나 이상의 2' 당 변형된 뉴클레오사이드는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA, 2'-아미노-DNA, 2'-플루오로-DNA, 아라비노 핵산(ANA), 2'-플루오로-ANA 및 LNA 뉴클레오사이드로 구성된 군에서 독립적으로 선택됨을 특징으로 하는, 안티센스 올리고뉴클레오타이드.
12. 실시형태 9 내지 11 중 어느 하나에 있어서, 하나 이상의 변형된 뉴클레오사이드는 LNA 뉴클레오사이드, 예를 들어, 이어서 2'-4' 다리 -O-CH2-를 갖는 옥시-LNA인, 안티센스 올리고뉴클레오타이드.
13. 실시형태 12에 있어서, 하나 이상의 변형된 뉴클레오사이드는 베타-D-옥시-LNA인, 안티센스 올리고뉴클레오타이드.
14. 실시형태 1 내지 13 중 어느 하나에 있어서, 연속 뉴클레오타이드 서열 내의 적어도 하나의 뉴클레오사이드간 연결은 포스포로티오에이트 뉴클레오사이드간 연결인, 안티센스 올리고뉴클레오타이드.
15. 실시형태 1 내지 14 중 어느 하나에 있어서, 연속 뉴클레오타이드 서열 내의 적어도 하나의 뉴클레오사이드간 연결은 포스포로디티오에이트 뉴클레오사이드간 연결인, 안티센스 올리고뉴클레오타이드.
16. 실시형태 1 내지 15 중 어느 하나에 있어서, 연속 뉴클레오타이드 서열 내의 적어도 하나의 뉴클레오사이드간 연결은 포스포로디에스테르 뉴클레오사이드간 연결인, 안티센스 올리고뉴클레오타이드.
17. 실시형태 16에 있어서, 연속 뉴클레오타이드 서열 내 모든 뉴클레오사이드간 연결은 포스포로티오에이트 뉴클레오사이드간 연결인, 안티센스 올리고뉴클레오타이드.
18. 실시형태 1 내지 17 중 어느 하나에 있어서, 안티센스 올리고뉴클레오타이드는 RNase H, 예를 들어, RNase H1을 동원할 수 있는 안티센스 올리고뉴클레오타이드인, 안티센스 올리고뉴클레오타이드.
19. 실시형태 18에 있어서, 안티센스 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열은 식 5'-F-G-F'-3'의 갭머로 구성되거나 이를 포함하는, 안티센스 올리고뉴클레오타이드.
20. 실시형태 19에 있어서, 영역 G는 6 내지 16개의 DNA 뉴클레오사이드, 예를 들어, 7 내지 12개의 DNA 뉴클레오사이드, 예를 들어 7 내지 11개의 DNA 뉴클레오사이드 길이를 갖는, 안티센스 올리고뉴클레오타이드.
21. 실시형태 18 내지 20 중 어느 하나에 있어서, 영역 F 및 F'는 각각 적어도 하나의 LNA 뉴클레오사이드를 포함하고, 예를 들어, 영역 F 및 F'는 각각 적어도 하나의 LNA 뉴클레오사이드를 포함하는, 안티센스 올리고뉴클레오타이드.
22. 실시형태 18 내지 21 중 어느 하나에 있어서, 영역 F는 1 내지 8개 DNA 뉴클레오사이드, 예를 들어, 4 내지 6개 DNA 뉴클레오사이드 길이를 갖는, 안티센스 올리고뉴클레오타이드.
23. 실시형태 18 내지 22 중 어느 하나에 있어서, 영역 F'는 1 내지 8개 DNA 뉴클레오사이드, 예를 들어, 2 내지 6개 DNA 뉴클레오사이드 길이를 갖는, 안티센스 올리고뉴클레오타이드.
24. 실시형태 18 내지 23 중 어느 하나에 있어서, 안티센스 올리고뉴클레오타이드 또는 이의 연속 뉴클레오타이드 서열은 식 F4-6-G7-11-F'2-6의 갭머로 구성되거나 이를 포함하고, 바람직하게는, 갭머는 적어도 하나의 교번 플랭크를 포함하는, 안티센스 올리고뉴클레오타이드.
25. 실시형태 1 내지 24 중 어느 하나에 있어서, 안티센스 올리고뉴클레오타이드는 다음으로 구성된 안티센스 올리고뉴클레오타이드 군으로부터 선택되고:
CTTatGctttttatgGT (서열번호 6),
CTTaTgctttttatgGT (서열번호 6),
CTtATgctttttatgGTT (서열번호 7),
CTtAtgctttttatgGTT (서열번호 7),
CTtAtgctttttatGgTT (서열번호 7),
CTtAtgctttttatGGTT (서열번호 7),
GcttTttatggtTtCAC (서열번호 8),
TATgcTttttatggtTTC (서열번호 9), 및
AcCAAttttcatttCtAC (서열번호 18),
여기서 대문자는 베타-D-옥시 LNA 뉴클레오사이드이고, 소문자는 DNA 뉴클레오사이드이고, 모든 LNA C는 5-메틸 시토신이고, 모든 뉴클레오사이드간 연결은 포스포로티오에이트 뉴클레오사이드간 연결인, 안티센스 올리고뉴클레오타이드.
26. 실시형태 1 내지 25 중 어느 하나의 안티센스 올리고뉴클레오타이드, 및 상기 안티센스 올리고뉴클레오타이드에 공유적으로 부착된 적어도 하나의 접합체 모이어티를 포함하는, 접합체.
27. 실시형태 27에 있어서, 접합체 모이어티는 갈락토스, 갈락토사민, N-포르밀-갈락토사민, N-아세틸갈락토사민, N-프로피오닐-갈락토사민, N-n-부타노일-갈락토사민 및 N-이소부타노일갈락토사민으로 구성된 군으로부터 선택되는 적어도 하나의 아시알로당단백질 수용체-표적화 모이어티를 포함하는, 접합체.
28. 실시형태 27에 있어서, 아시알로당단백질 수용체-표적화 모이어티는 N-아세틸갈락토사민(GalNAc)인, 접합체 화합물.
29. 실시형태 27 또는 28에 있어서, 접합체 모이어티는 아시알로당단백질 수용체-표적화 모이어티에 대하여 1가, 2가, 3가 또는 4가인, 접합체 화합물.
30. 실시형태 29에 있어서, 접합체 모이어티는 2개 내지 4개의 말단 GalNAc 모이어티 및 각각의 GalNAc 모이어티를 안티센스 화합물에 접합될 수 있는 분지 분자에 연결하는 스페이서로 구성되는, 접합체 화합물.
31. 실시형태 30에 있어서, 스페이서는 PEG 스페이서인, 접합체 화합물.
32. 실시형태 26 내지 31 중 어느 하나에 있어서, 상기 접합체 모이어티는 3가 N-아세틸갈락토사민(GalNAc) 모이어티인, 접합체 화합물.
33. 실시형태 26 내지 32 중 어느 하나에 있어서, 접합체 모이어티는 도 9A1, 9A2; 9C1, 9C2, 9D1, 9D2, 9E1, 9F1, 9G1, 9H1, 9I1, 9J1, 9L1 및 9L2의 3가 GalNAc 모이어티들 중 하나로부터 선택되는, 접합체 화합물.
34. 실시형태 33에 있어서, 접합체 모이어티는 도 9D1 또는 9D2의 3가 GalNAc 모이어티 또는 이들의 혼합물인, 접합체 화합물.
35. 실시형태 26 내지 34 중 어느 하나에 있어서, 안티센스 올리고뉴클레오타이드와 접합체 모이어티 사이에 위치하는 링커를 포함하는, 접합체 화합물.
36. 실시형태 35에 있어서, 링커는 2 내지 5개의 연속적인 포스포디에스테르 연결된 뉴클레오사이드, 예를 들어, 2개의 연속적인 포스포디에스테르 연결된 뉴클레오사이드, 예를 들어, 포스포디에스테르 연결된 뉴클레오사이드 ca를 포함하거나 이들로 구성되는, 접합체 화합물.
37. 실시형태 26 내지 36 중 어느 하나에 있어서, 접합체는 다음으로 구성된 군으로부터 선택되고:
5'-GN2-C6ocoao mCsTsTsastsGscstststststsastsgsGsT,
5'-GN2-C6ocoao mCsTsTsasTsgscstststststsastsgsGsT,
5'-GN2-C6ocoao mCsTstsAsTsgscstststststsastsgsGsTsT,
5'-GN2-C6ocoao mCsTstsAstsgscstststststsastsgsGsTsT,
5'-GN2-C6ocoao mCsTstsAstsgscstststststsastsGsgsTsT,
5'-GN2-C6ocoao mCsTstsAstsgscstststststsastsGsGsTsT,
5'-GN2-C6ocoao GscststsTststsastsgsgstsTsts mCsAs mC,
5'-GN2-C6ocoao TsAsTsgscsTststststsastsgsgstsTsTs mC, 및
5'-GN2-C6ocoao AScS mCSASAStStStStScSaStStStS mCStAS mC,
바람직하게는, 여기서 대문자는 베타-D-옥시 LNA 뉴클레오사이드를 나타내고, 소문자는 DNA 뉴클레오사이드를 나타내며, 여기서 각각의 LNA 시토신은 5-메틸 시토신이고, mc는 5-메틸 시토신 DNA 이고, 그리고 아래첨자 s는 포스포로티오에이트 뉴클레오사이드간 연결을 나타내고, 아래첨자 o는 포스포디에스테르 뉴클레오사이드간 연결을 나타내고, 그리고 GN2-C6은, 바람직하게는 올리고뉴클레오타이드의 5' 말단에서 포스포디에스테르 연결을 통해 결합된, 도 9D에 나타낸 바와 같은 3가 N-아세틸갈락토사민(GalNAc), 예를 들어, 도 9D-1 또는 도 9D2에 나타낸 바와 같은 3가 N-아세틸갈락토사민(GalNAc) 또는 이 둘의 혼합물인, 접합체.
38. 도 1에 도시된 접합체.
39. 도 2에 도시된 접합체.
40. 도 3에 도시된 접합체.
41. 도 4에 도시된 접합체.
42. 도 5에 도시된 접합체.
43. 도 6에 도시된 접합체.
44. 도 7에 도시된 접합체.
45. 도 8에 도시된 접합체.
46. 도 8.1에 도시된 접합체.
47. 실시형태 1 내지 25 중 어느 하나의 올리고뉴클레오타이드 또는 실시형태 26 내지 46 중 어느 하나에 따른 접합체의 약학적으로 허용되는 염.
48. 실시형태 1 내지 25 중 어느 하나의 안티센스 올리고뉴클레오타이드, 실시형내 26 내지 46 중 어느 하나의 접합체, 또는 실시형태 48의 약학적으로 허용되는 염, 및 약학적으로 허용되는 희석제, 용매, 담체, 염 및/또는 보조제를 포함하는, 약학 조성물.
49. FUBP1을 발현하는 표적 세포에서 FUBP1 발현을 조절하는 생체내 또는 시험관내 방법으로서, 상기 방법은 실시형태 1 내지 25 중 어느 하나의 안티센스 올리고뉴클레오타이드, 실시형태 26 내지 46 중 어느 하나의 접합체, 실시형태 48의 약학적으로 허용되는 염, 또는 실시형태 48의 약학 조성물을 유효량으로 상기 세포에 투여하는 것을 포함하는, 방법.
50. 질환에 걸린 또는 걸리기 쉬운 대상체에게 실시형태 1 내지 25 중 어느 하나의 안티센스 올리고뉴클레오타이드, 실시형태 26 내지 46 중 어느 하나의 접합체, 실시형태 47의 약학적으로 허용되는 염 또는 실시형태 48의 약학 조성물의 치료적 또는 예방적 유효량을 투여하는 것을 포함하는 질환의 치료 또는 예방 방법으로서, 이때 질환은 B형 간염 바이러스(HBV) 감염 및/또는 암인, 방법.
51. 의약에 사용하기 위한, 실시형태 1 내지 25 중 어느 하나의 안티센스 올리고뉴클레오타이드, 실시형태 26 내지 46 중 어느 하나의 접합체, 실시형태 47의 약학적으로 허용되는 염 또는 실시형태 48의 약학 조성물.
52. B형 간염 바이러스(HBV) 감염 및/또는 암의 치료 또는 예방에 사용하기 위한, 실시형태 1 내지 25 중 어느 하나의 안티센스 올리고뉴클레오타이드, 실시형태 26 내지 46 중 어느 하나의 접합체, 실시형태 47의 약학적으로 허용되는 염 또는 실시형태 48의 약학 조성물.
53. B형 간염 바이러스(HBV) 감염 및/또는 암의 치료 또는 예방을 위한 약제의 제조를 위한, 실시형태 1 내지 25 중 어느 하나의 안티센스 올리고뉴클레오타이드, 실시형태 26 내지 46 중 어느 하나의 접합체, 실시형태 47의 약학적으로 허용되는 염 또는 실시형태 48의 약학 조성물의 용도.
54. 질환은 B형 간염 바이러스(HBV) 감염, 예를 들어, 만성 HBV 감염인, 실시형태 50의 방법, 실시형태 52의 안티센스 올리고뉴클레오타이드, 접합체, 약학 조성물, 또는 약학적으로 허용되는 염 또는 실시형태 53의 용도.
55. 질환은 암, 예를 들어, 간세포 암종인, 실시형태 50의 방법, 실시형태 52의 안티센스 올리고뉴클레오타이드, 접합체, 약학 조성물, 또는 약학적으로 허용되는 염 또는 실시형태 53의 용도.
56. 안티센스 올리고뉴클레오타이드는 AcCAAttttcatttCtAC(서열번호 18)인, 실시형태 1 내지 25 중 어느 하나의 안티센스 올리고뉴클레오타이드, 실시형태 26 내지 33 및 45 중 어느 하나의 접합체, 실시형태 47의 약학적으로 허용되는 염 또는 실시형태 48의 약학 조성물, 실시형태 53의 용도, 또는 실시형태 54 및 54의 방법.
57. 안티센스 올리고뉴클레오타이드는 CTtAtgctttttatGgTT(서열번호 7)인, 실시형태 1 내지 25 중 어느 하나의 안티센스 올리고뉴클레오타이드, 실시형태 26 내지 33 및 42 중 어느 하나의 접합체, 실시형태 47의 약학적으로 허용되는 염 또는 실시형태 48의 약학 조성물, 실시형태 53의 용도, 또는 실시형태 54 및 54의 방법.
실시예
도입
FUBP1의 과발현 및 돌연변이는 수년 동안 암과 관련이 있는 것으로 알려져 왔다. 특히, 인간 간세포 암종(HCC)에서 FUBP1의 강력한 과발현은 종양 성장을 보조하고 환자 예후 불량과 관련이 있다.
감염된 간세포의 HBV cccDNA는 지속적인 만성 감염 및 재활성화를 담당하며, 새로 합성된 바이러스 자손 및 세포 내 뉴클레오캡시드 재활용을 통한 cccDNA 풀 보충을 보장하기 위해 모든 바이러스 하위게놈 전사체 및 전구-게놈 RNA(pgRNA)의 템플릿이 된다.
WO 2019/193165에서 FUBP1이 cccDNA 안정성과 연관되어 있음이 밝혀졌다. 이러한 결과는 HBV 감염 대상체에서 cccDNA를 불안정화할 수 있는 기회를 제공하며, 그리하여 만성적으로 감염된 HBV 환자를 완치할 수 있는 기회를 열어준다.
본 연구에서는, 인간 FUBP1을 표적으로 하는 2000개 이상의 안티센스 올리고뉴클레오타이드를 선별했다. 본 스크리닝에서, 인간 FUBP1을 표적으로 함에 특히 효능있고 효과적인 화합물이 확인되었다. 구체적으로, 인간 FUBP1의 엑손 14 내의 영역을 표적화하고 시험관내에서 인간 FUBP1를 강력하게 하향 조절하는 9개의 교번 플랭크 갭머 LNA 올리고뉴클레오타이드가 식별되었다. 더욱이, 인간 FUBP1의 엑손 20 내의 영역을 표적화하고 또한 인간 FUBP1를 강력하게 하향 조절하는 1개의 교번 플랭크 갭머 LNA 올리고뉴클레오타이드가 식별되었다. 식별된 9개의 화합물에 대한 개요가 상기 표 6에 제공된다.
식별된 화합물의 표적 서열은 WO 2019/193165에 개시된 바와 같이 화합물 식별 번호 53_1 및 54_1의 표적 서열과 중복된다. 이 두 화합물은 HeLa 세포에서 FUBP1을 5μM에서 ~70%까지 억제한다. 그러나 이러한 9개의 식별된 화합물은 HeLa 세포에서 FUBP1을 약 ~25%로부터 3.3μM의 경우 35%까지 또는 5μM의 경우 ~27%까지 억제하므로 분명히 더 효과적이다(화합물 식별 번호 18_1). 또한, 이들은 WO 2019/193165의 가장 우수한 화합물인 화합물 식별 번호 50_1보다 HeLa 세포에서 FUBP1을 표적화하는 데 더 효율적이다(실시예 1 참조).
WO 2019/193165의 선행 기술 화합물 35_1, 50_1, 53_1, 54_1, 78_1 및 79_1에 대한 개요는 아래 표 7에 제공된다. 이들 화합물은 균일 플랭크들을 가진 갭머이다. 화합물 식별 번호 50_1은 PHH 세포에서 가장 우수한 화합물이었고, 화합물 식별 번호 35_1은 HeLa 세포에서 가장 우수한 화합물이었다. 화합물 식별 번호 53_1 및 54_1은 화합물 식별 번호 6_1, 6_2, 7_1, 7_2, 7_3, 7_4; 8_1 및 9_1에 가장 가까운 화합물이다. 화합물 식별 번호 78_1 및 79_1은 화합물 식별 번호 18_1에 가장 가까운 화합물이다.
표 7: 대조군 올리고뉴클레오타이드 화합물의 목록(WO 2019/193165에 개시됨)
Figure pct00044
화합물들에서: 대문자는 LNA 뉴클레오사이드(베타-D-옥시 LNA 뉴클레오사이드가 사용됨)를 나타내고, 모든 LNA 시토신은 5-메틸 시토신이며, 소문자는 DNA 뉴클레오사이드를 나타낸다. 모든 뉴클레오사이드간 연결은 포스포로티오에이트 뉴클레오사이드간 연결이다.
실시예 1: Hela 세포에서 인간 FUBP1 mRNA를 표적으로 하는 안티센스 올리고뉴클레오타이드의 시험관 내 효능 테스트
FUBP1을 표적으로 하는 안티센스 올리고뉴클레오타이드는 ECACC(카탈로그 번호 93021013)에서 획득한 인간 Hela 세포에서 FUBP1 mRNA 발현을 감소시키는 능력에 대해 테스트되었다.
Hela 세포는 세포 배양 배지(EMEM[Sigma, 카탈로그 번호 M2279], 10% 소 태아 혈청[Sigma, 카탈로그 번호 F7524], 2mM 글루타민[Sigma, G7513], 0.1mM NEAA[Sigma, M7145] 및 0.025mg/ml 겐타마이신[Sigma, 카탈로그 번호 G1397])에서 성장되었다. 세포를 포스페이트 완충 식염수(PBS)[Sigma 카탈로그 번호 14190-094]로 세척하고 0.25% 트립신-EDTA 용액(Sigma, T3924)을 첨가하여, 5일마다 트립신 처리하고 37
Figure pct00045
C에서 2-3분 인큐베이션하고, 및 세포 시딩 전 배산(trituration)시켰다.
실험적 사용을 위해, 웰당 2500개의 세포를 190μL 성장 배지에서 96웰 플레이트(Nunc 카탈로그 번호 167008)에 시딩했다. PBS에 용해된 ASO는 세포를 접종한 후 대략 24시간 후에 최종 맞춤형 농도에 도달하도록 첨가되었다. 배지 교환 없이 세포를 3일 동안 인큐베이션하였다.
인큐베이션 후, 배지를 제거한 후 125μL RLT 용해 완충액(Qiagen 79216) 및 125μL 70% 에탄올을 첨가하여 세포를 수확했다. 제조업체의 지침(Qiagen RNeasy 96 키트)에 따라 RNA를 정제하고 최종 부피 200μL DNase/RNase가 없는 물(Gibco)에서 용리시켰다.
RNA에 90°C에서 40초 동안 열 충격을 가하여 RNA:LNA 듀플렉스를 용융시켰으며, 얼음으로 곧바로 이동시키고 사용 전 원심분리시켰다. 원스텝 qPCR 반응을 위해 qPCR-혼합물(QauntaBio사의 qScriptTMXLE 원스텝 RT-qPCR ToughMix® Low ROX, 카탈로그 번호 95134-500)을 2개의 IDT 프로브(최종 농도 1X)와 혼합하여 마스터믹스를 생성했다. Taqman 프로브는 IDT: FUBP1: Hs.PT.58.26883775(프라이머-프로브 비율 2, FAM) 또는 ThermoFisher Scientific: GUSB: 4326320E에서 구입했다. 이후 마스터믹스(6 μL) 및 RNA(4μL, 1-2 ng/μL)를 qPCR 플레이트(MicroAmp®optical 384 웰, 4309849)에서 혼합하였다. 밀봉 후, 플레이트를 RT에서 1분 동안 1000g으로 빠르게 원심분리시키고 ViiaTM 7 시스템(Applied Biosystems, Thermo)으로 옮겼으며 다음 PCR 조건을 사용했다: 50°C에서 15분; 95℃에서 3분; 다음을 40주기: 95°C에서 5초 후 1.6°C/초의 온도 감소 후 60°C에서 45초. 데이터는 QuantStudioTM 실시간 PCR 소프트웨어를 사용하여 분석되었다.
qPCR 데이터를 캡처하고 Quantstudio7 소프트웨어에서 원시 데이터 품질 관리를 수행했다.
그런 다음 데이터를 E-Workbook으로 가져와 BioBook 템플릿을 사용하여 데이터를 캡처하고 분석했다. 데이터는 다음 단계를 사용하여 분석되었다:
1. 델타 델타 Ct 방법으로 수량을 계산하였다(수량 = 2^(-Ct)*1000000000)
2. 이러한 수량을 동일한 웰에서 실행된 하우스키핑 유전자 분석에 대해 계산된 수량에 대해 정규화하였다. 상대 대상 수량 = QUANTITY_표적 / QUANTITY_하우스키핑
3. 동일한 플레이트에 있는 모든 PBS 처리 웰들의 평균으로 나누어 각 웰에 대한 RNA 녹다운을 계산했다. 정규화 대상 수량 = (상대 대상 수량 / [평균] 상대 대상 수량]_pbs_웰) * 100
4. 최종 데이터는 미처리(PBS) 웰들의 백분율로 표시된다.
5. 농도-반응 실험을 위해, 각 화합물[희석 모델에 따라 8 또는 10개 농도]에 대한 RNA 녹다운 값(단계 3-4)으로부터 곡선을 피팅했다. 곡선은 Biobook의 4 매개변수 S자형 용량 반응 모델을 사용하여 피팅된다.
상대 FUBP1 mRNA 발현 수준은 대조군의 %로 표 8에 제시되어 있다, 즉, 값이 낮을수록 억제가 더 커진다. 또한 결과는 도 11에 도시되어 있다.
표 8: Hela 세포에서 항-FUBP1 화합물의 시험관내 효능. FUBP1 mRNA 수준을 GUSB에 대해 정규화하고 대조군의 %로 표시한다.
Figure pct00046
*대조군 화합물, nd: 결정되지 않음
**화합물 식별 번호 17_1은 다음과 같다: ATgctTtttatggtttCA(서열번호 17), 화합물 식별 번호 16_1은 다음과 같다: TTAtgctttttatggTTT(서열번호 16), 여기에서 대문자는 베타-D-옥시 LNA 뉴클레오사이드이고, 소문자는 DNA 뉴클레오사이드이고, 모든 LNA C는 5-메틸 시토신이고, 모든 뉴클레오사이드간 연결은 포스포로티오에이트 뉴클레오사이드간 연결이다. 화합물 식별 번호 17은 서열번호 1의 nt 16185 내지 16202를 표적한다. 화합물 식별 번호 16은 서열번호 1의 nt 16187 내지 16204를 표적한다.
***데이터는 WO 2019/193165에서 가져온 것이다.
대조군 화합물에 대한 실험은 별도로 수행하였다.
실시예 2: 일차 인간 간세포(PXB-PHH)에서 인간 FUBP1 mRNA를 표적으로 하는 안티센스 올리고뉴클레오타이드의 시험관 내 효능 테스트
인간화 마우스(uPA/SCID 마우스)로부터 수확한 신선한 일차 인간 간세포(PXB-PHH)(본원에서 PHH라고 함)를 PhoenixBio Co., Ltd(일본)로부터 96-웰 형태로 구입하고 변형된 간세포 클론 성장 배지(dHCGM)에서 배양했다. dHCGM은 100 U/ml 페니실린, 100 μg/ml 스트렙토마이신, 20 mM Hepes, 44 mM NaHCO3, 15 μg/ml L-프롤린, 0.25 μg/ml 인슐린, 50 nM 덱사메타손, 5 ng/ml EGF, 0.1mM Asc-2P, 2% DMSO 및 10% FBS(Ishida 외, 2015)를 함유하는 DMEM 배지이다.
세포를 37℃5% CO2의 가습 분위기에서 배양하였다. 수확할 때까지 배양 배지를 주 2회 교체하였다.
감염되지 않은 세포는 5 μM에서 단일 처리를 받았고 7일 후에 수확되었다. 모든 처리에서 세포들에 dHCGM 배지 중 최종 부피 120μI/웰의 올리고뉴클레오타이드 화합물을 투여했다. RNA 측정 실험은 생물학적 중복으로 수행되었다.
그 후 FUBP1 RNA에 대한 실시간 PCR을 수행했다. 제조업체의 프로토콜에 따라 MagNA Pure 로봇 및 MagNA Pure 96 세포 RNA 대용량 키트(Roche, #05467535001)를 사용하여 세포로부터 총 mRNA를 추출하였다. mRNA 발현 수준은 QuantStudio 12K Flex(Applied Biosystems), TaqMan RNA-to-CT 원스텝 키트(Applied Biosystems, #4392938) 및 인간 GusB 내인성 대조군(Applied Biosystems, # Hs00939627_m1)을 사용하는 qPCR로 기술적 중복으로 정량되었다. 참조 유전자 GusB 및 처리되지 않은 세포에 대해 정규화된 비교 주기 역치 2-ΔΔCt 방법을 사용하여 mRNA 발현을 분석하였다. GusB RNA 및 FUBP1 RNA 정량화에 사용된 TaqMan 프라이머를 아래 표에 열거한다.
표 9: GusB RNA 및 FUBP1 RNA 정량화를 위한 프라이머
Figure pct00047
PXB-PHH 세포에서 8개 화합물(화합물 식별 번호 6_1, 6_2, 7_1, 7_2, 7_3, 7_4; 8_1 및 9_1. 화합물 식별 번호 78_1 및 79_1)의 상대 FUBP1 mRNA 발현 수준을 표 10에 대조군의 %로 나타낸다, 즉, 값이 낮을수록 억제가 커진다.PXB-PHH 세포에서 화합물 식별 번호 18_1의 FUBP1 mRNA 발현 수준은 실시예 3에서 분석된다.
표 10: PXB-PHH 세포에서 항-FUBP1 화합물의 시험관내 효능. FUBP1 mRNA 수준을 GUSB에 대해 정규화하고 대조군의 %로 표시한다.
Figure pct00048
실시예 1 및 2로부터 도출된 결론
실시예 1 및 2의 데이터는 표 6에 나타낸 바와 같이 LNA ASO로 FUBP1을 표적화하는 것이 FUBP1을 효율적으로 감소시킨다는 것을 보여준다.
실시예 3: 화합물 식별 번호 7_1 및 18_1의 추가 분석
다음에서, 식별된 9개의 화합물 중 2개:화합물 식별 번호 7_3 및 18_1에 대한 추가 실험을 설명한다. 이 실험에서, 상기 2개 화합물을 WO 2019/193165에서 가장 우수한 결과를 제공한 2개의 이전 화합물과 비교했다.
재료 및 방법
일차 인간 간세포(PXB-PHH)
신선한 일차 인간 간세포(PXB-PHH)를 실시예 2에 기재된 바와 같이 배양하였으나 24-웰 형식을 사용하였다.
ASO 서열 및 화합물
표 11은 실시예 3에서 테스트된 화합물에 대한 개요를 제공한다:
표 11: ASO가 표적하는 인간 FUBP1 서열
Figure pct00049
*표 6, 본 발명에 따른 화합물 참조
**표 7: WO 2019/193165에 개시된 대조군 화합물 참조
HBV 감염 및 올리고뉴클레오타이드 치료
도착 시, PHH는 16시간 동안 PHH 배지에서 4%(v/v) PEG 중의 HBV와 함께 PHH 세포를 배양함으로써 만성 환자 유래 정제 접종물(유전자형 C)을 사용하여 MOI 110으로 감염되었다. 그런 다음 세포를 PBS로 3회 세척하고 신선한 PHH 배지에서 5% CO2가 포함된 가습 분위기에서 배양했다. 감염 후 4일에 세포를 10 μM의 최종 농도에서 FUBP1 LNA(표 11 참조)로 이중으로 처리하거나 약물 없음 대조군(NDC)으로서 PBS로 처리했다. 처리 당일 세포들로부터 오래된 배지를 제거하고 400 μl/웰의 새로운 PHH 배지로 교체했다. 웰 당 50μM의 각 FUBP1 LNA 100μL 또는 NDC로서의 PBS를 400μL PHH 배지에 첨가했다. 감염 후 4, 11 및 18일차에 동일한 치료를 3회 반복하였다. 세포 배양 배지는 감염 후 7, 14 및 21일차에 3일마다 새로운 배지로 교체되었다.
세포내 HBV pgRNA 및 FUBP1 mRNA에 대한 실시간 PCR
세포 생존율 결정 후 세포를 PBS로 1회 세척하였다. 제조업체의 프로토콜에 따라 MagNA Pure 로봇 및 MagNA Pure 96 세포 RNA 대용량 키트(Roche, #05467535001)를 사용하여 세포로부터 총 RNA를 추출하였다. QuantStudio 12K Flex(Applied Biosystems), TaqMan RNA-to-CT 원스텝 키트(Applied Biosystems, #4392938) 및 인간 GusB 내인성 대조군(Applied Biosystems, # Hs00939627_m1)을 사용하는 qPCR로 기술적 중복으로 정량된 FUBP1 mRNA 및 바이러스 pgRNA 발현 수준이 사용되었다. 참조 유전자 GusB 및 처리되지 않은 세포에 대해 정규화된 비교 주기 역치 2-ΔΔCt 방법을 사용하여 FUBP1 mRNA 및 바이러스 pgRNA 상대 발현을 분석하였다. GusB RNA, FUBP1 RNA 및 HBV pgRNA 정량화에 사용된 TaqMan 프라이머를 표 12에 열거한다.
표 12: GusB 유전자, FUBP1 RNA 및 HBV pgRNA 정량화에 사용된 TaqMan 프라이머
Figure pct00050
결과
테스트 화합물들의 상대 FUBP1 mRNA 발현 수준을 표 13 및 도 12에 나타낸다. 상기 표 및 도 13으로부터 유도될 수 있는 바와 같이, 본 발명의 두 화합물(화합물 식별 번호 7_3 및 18_1)은 NDC에 비해 표적 mRNA 발현을 약 80% 만큼 감소시킨다. FUBP1 mRNA 수준에 대한 이들의 효과는 선행 기술 화합물(화합물 식별 번호 50_1 및 35_1)의 효과보다 훨씬 강력하다.
표 13: PXB-PHH 세포에서 항-FUBP1 화합물의 시험관내 효능. FUBP1 mRNA 수준을 GUSB에 대해 정규화하고 대조군의 %로 표시한다.
Figure pct00051
표 14는 상이한 농도의 안티센스 화합물로 처리된 HBV 감염 PHH 세포에서의 pgRNA를 보여준다. 표에서 알 수 있듯이 하향 조절은 안티센스 화합물의 농도와 관련이 있다. 10 μM의 농도에서, 화합물 식별 번호 7_3에 대해 가장 낮은 pgRNA 수준이 관찰되었다. 더욱이, 가장 높은 pgRNA 수준은 화합물 식별 번호 35_1을 갖는 선행 기술 화합물에서 관찰되었다. 화합물 식별 번호 18_1은 선행 기술 화합물인 화합물 식별 번호 50_1과 유사한 방식으로 HBV pgRNA를 하향조절하였다.
표 14: HBV에 감염된 PXB-PHH 세포에서 항-FUBP1 화합물의 시험관내 효능: pgRNA. pgRNA 수준은 처리되지 않은 세포(NDC)에 대해 정규화되어 대조군의 %로 나타낸다.
Figure pct00052
세포들은 또한 3주 동안 주 1회 2 μM의 농도로 테스트되었다. 2 μM에서, 화합물 식별 번호 7_3은 mRNA 발현의 50% 감소로 가장 우수한 FUBP1 mRNA KD를 보여주었다. 따라서, 효과는 농도에 따라 달라진다(2 μM에서 80% 감소가 관찰되었으므로). 또한, 화합물 식별 번호 18_1은 선행 기술 올리고(2 μM에서)와 비교하여 표적 mRNA 발현 수준에 유사한 효과를 나타냈다.
실시예 4: FUBP1 ASO 생체내 PK/PD
화합물 식별 번호 7_3 및 18_1이 포스포디에스테르 연결된 DNA 디뉴클레오타이드를 통해 GalNAc 모이어티에 접합된 올리고뉴클레오타이드의 생체내 간 PK/PD 상관관계를 C57BL/6 마우스를 사용하여 단일 용량 마우스 연구에서 평가하였다(접합체의 구조에 관하여, 도 5 및 8.1 참조). 마우스들에게 3mg/kg을 피하 투여하고 다른 시점에서 종료했다. Fubp1 mRNA 녹다운, 화합물 노출 및 PKPD는 아래에 설명하는 바와 같이 측정하였다.
재료 및 방법
조직 샘플 처리
Figure pct00053
간 샘플을 2ml 둥근 바닥 에펜도르프 튜브에 냉동 보관하고 5mm 균질화 비드를 첨가한 후 TissueLyser II(Qiagen)의 MagNa 순수 완충액(Roche)에서 2 x 1.5분 동안 균질화했다. 샘플 균질화를 완료한 후, 균질액을 실온(RT)에서 30분 동안 방치하여 조직 용해를 완료했다. 균질화 공정의 모든 단계는 완충액 티오시아네이트 염 및 메르캅토에탄올 함량으로 인해 유동 후드에서 수행되었다. 용해 후, 균질액을 17,000g에서 3분 동안 원심분리했다.
MagNa 순수 기기에 과부하가 걸리지 않도록 균질액을 400 μL당 약 20 mg 조직으로 희석했다. 후속 qPCR 분석을 위해 MagNA pure 96 기기에서 균질액 350μL를 RNA 추출에 사용했다. 균질액의 나머지 분취물을 hELISA 분석에 사용했다.
혼성화 ELISA
다음 올리고 및 (모든-LNA 포스포-다이에스테르) ELISA 프로브들을 hELISA 분석에 사용하였으며, 모두 Roche Innovation Center Copenhagen A/S에서 디자인, 합성 및 검증되었다.
Figure pct00054
Figure pct00055
Figure pct00056
hELISA 분석 전에, 균질액을 실온이 되게하고 사용하기 전에 와동시켰다. 샘플을 5 × SSCT 완충액에서 최소 10배 희석하였다.
샘플 매트릭스 및 희석 배율과 일치하는 적절한 표준들을 모든 플레이트에서 실행하고 (품질 및 정체를 확인한 제제로부터) 관련 올리고를 사용한 샘플과 함께 준비했다. 각 화합물에 대한 표준물질을 투여되지 않은 샘플들로부터 얻은 샘플 풀에 소량첨가(spike in)하였다. 소량첨가 농도는 샘플 올리고 함량의 ~10배 이내가 되도록 만들어졌다.
샘플 및 표준을 원하는 설정의 희석 플레이트에 추가하고 희석 시리즈를 만들었다. 300μL 샘플/표준 + 포획-검출 용액을 첫 번째 웰에 첨가하고 150μL 포획-검출 용액을 나머지 웰에 첨가했다.
150μL 액체를 순차적으로 옮겨 표준 및 샘플의 2배 희석 시리즈를 만들었다. 2-4개의 웰을 맹검용으로 보관했다(포획-검출 용액만). 최적의 결과를 얻으려면 적어도 6개 웰의 2배 샘플 희석 시리즈가 권장된다.
희석 플레이트의 샘플들을 RT에서 30분 동안 인큐베이션했다. 100 μL의 액체를 희석 플레이트에서 스트렙타비딘 플레이트로 옮겼다. 이 플레이트를 부드럽게 교반하면서(플레이트 쉐이커) RT에서 1시간 동안 인큐베이션하였다. 웰을 흡인시키고 300 μL의 2 x SSCT 완충액으로 3회 세척했다.
PBST에서 1:4000으로 희석된 100 μL 항-DIG-AP(동일자에 제조)를 각 웰에 첨가하고 부드럽게 교반하면서 RT에서 1시간 동안 인큐베이션하였다. 웰을 흡인시키고 300 μL의 2 x SSCT 완충액으로 3회 세척했다.
100 μL의 기질(AP) 용액(새로 준비됨)을 각 웰에 첨가했다. 부드럽게 교반하면서 30분 인큐베이션 후 615 nm에서 색의 강도를 분광광도계로 측정했다.
원시 데이터를 판독기(Gen5 2.0 소프트웨어)로부터 엑셀 형식으로 내보내고 엑셀에서 추가로 분석했다. GraphPad Prism 8 소프트웨어 및 로지스틱 4PL 회귀 모델을 사용하여 표준 곡선을 생성했다. 
데이터 포인트들은 기술적 중복의 평균값으로 기록되었다.
RNA 정제
모든 샘플은 제조업체의 프로토콜을 사용하여 MagNA Pure 96 기기(Roche)를 사용하여 정제되었다.
Figure pct00057
조직 균질액 350μL를 MagNaPure 96 프로세싱 카트리지로 옮겼다. 나머지 용해물은 올리고뉴클레오타이드 노출 분석의 추후 분석을 위해 보관되었다. 세포 RNA 대용량 키트와 함께 MagNa Pure 96을 사용하고 프로토콜 “RNA 조직 FF 표준 LV 3.1”을 사용하여 RNA를 정제했다. RNA는 50μL 용리 완충액(키트로부터, 05467535001)에서 용리되었다.
모든 샘플에 대한 ~2.0의 A260/280 비율 및 RNA 농도는 Eon Microplate 분광광도계(BioTek Instruments)를 사용하여 결정되었다. 이러한 농도를 기준으로, 샘플들을 DNase/RNase가 없는 물에 희석하여 25ng/μL로 정규화시키고 실험 농도 2.5ng/μl까지 추가 희석시켰다.
그런 다음 샘플을 원스텝 qPCR 분석을 위한 주입물로 사용했다. 분석 세부 사항을 아래에 나타낸다.
qPCR 분석
qPCR은 다음 재료들을 사용하여 원스텝 qPCR 형식으로 실시되었다.
Figure pct00058
Figure pct00059
qPCR 분석을 위한 RNA 준비
원하지 않는 RT 효소 활성을 없애기 위해 이 프로토콜의 모든 단계에서 반응을 차갑게 유지했다. 그런 다음 희석된 RNA를 90°C에서 40초 동안 열 충격을 가하여 RNA:ASO 듀플렉스를 분리하고 얼음에 두었다. 분석 전에 RNA 샘플을 웰의 바닥으로 회전시켰다.
각 플레이트에서 표준 곡선을 실행하고 정량화 및 증폭 효율성 측정에 사용했다. 4 uL의 10 ng/uL PBS 샘플을 10 uL 반응에서 주입물로 사용했다. 7-포인트 표준 곡선을 형성하기 위해 RNase가 없는 물에서 2배 희석 시리즈를 준비했다.
2회의 개별 마우스 Fubp1 분석 및 4회의 대조군 분석을 각 동물에 대해 2번의 기술적 중복으로 이중 반응으로 실시했다.
qPCR의 경우 다음 단계를 따랐다: 
각 qPCR 웰에 대해, 5μL XLT 원스텝 믹스, 0.5μL 프로브 믹스1(20x), 0.5μL 프로브 믹스2(20x)가 포함된 스톡 마스터믹스를 준비했다. 스톡 마스터믹스로부터 6μL를 384-웰 플레이트(MicroAmp 광학 384웰 플레이트 - Applied Biosystems 4309849)의 각 웰에 첨가했다.
RNA 희석 플레이트로부터, 4μL의 희석된 RNA(2.5ng/uL)를 마스터 믹스의 각 웰에 추가했다. 그런 다음 플레이트를 밀봉하고 와동시켰다. 그런 다음 플레이트를 3분 동안 고속으로 원심분리했다. qPCR 반응들은 다음 프로그램을 실행하는 것으로 설정된 qPCR 기기(Life Technology Viia7; 소프트웨어: QuantStudio v. 1.3)로 옮길 때까지 차갑게 유지시켰다: 50°C에서 15분, 95°C에서 3분, 설정 온도 변화율은 1.9°C/s이다. 이후 95°C에서 5초간 그리고 60°C에서 45초간으로 40주기를 수행했으며 온도 변화율은 1.6°C/s로 설정했다.
모든 샘플은 기술적 변동성을 최소로 제한하는 동일한 실험에서 분석되었다.
qPCR 데이터 처리
qPCR 데이터는 Quantstudio 소프트웨어(Applied Biosystems)에서 검토되었다. 증폭 곡선의 불규칙성을 기반으로 가능한 이상치 웰들을 식별하고 제거했다. 각 플레이트를 검토한 후, 각 qPCR 분석에 대한 표준 곡선들을 기반으로 각 샘플의 ct-값에서 계산된 수량이 있는 내보내기 파일을 생성하고 엑셀을 사용하여 분석했다. 
일반적으로 표준 곡선은, 효율성이 권장되는 95-105% 사이에 있어 높은 품질이었으며 이는 고성능 분석을 나타낸다.
4개의 다른 HK 유전자(Gusb, Rplp0, Rps29 및 Tbp)를 분석하고 이들의 기하 평균을 정규화에 사용했다. HK 유전자들의 안정성은 포함시키기 전에 Vandesompele 외의 문헌(Vandesompele 외, 2002)에 의해 발표된 방법을 사용하여 평가되었다. 4개의 HK 유전자를 사용함으로써 페어링 방식의 HK 유전자 변이는 모든 조직에 대해 권장 임계값인 0.15 미만이다.
“잔부 Fubp1 %”는 다음과 같이 계산되었다: 각각의 Fubp1 qPCR 분석으로부터 얻은 수량을 HK 분석의 기하 평균으로 정규화하고 처리되지 않은 군의 평균으로 추가로 나누어 mRNA 잔량%를 제공했다. 잔부 Fubp1 mRNA% 결과 2개의 평균을 최종 판독값으로 사용했다.
PKPD 플롯팅 및 계산
간 조직 노출 값들이 조직 g당 화합물 nmol(nmol/g)로 계산되었다. 이 값들을 추가로 log10-변환시키고 잔부 Fubp1 mRNA %에 대해 플롯팅하였다(도 13). GraphPad Prism 8을 사용하여 비선형 회귀 곡선을 피팅하였다(4PL 회귀 모델, 상단=100으로 제한됨). 최적 추정 PKPD IC50을 상기 소프트웨어로 계산하였다 (회귀 IC50: 화합물 식별 번호 18_1의 접합체: 0.092 nmol/g; 화합물 식별 번호 7_3의 접합체: 0.068 nmol/g).
결과: 두 가지 테스트 접합체 모두는 우수한 PK 프로파일을 갖는다. 표적 KD에 대한 초기 발병 양상에서 화합물 식별 번호 7_3의 접합체는 화합물 식별 번호 18_1의 접합체보다 약간 더 우수하다.
SEQUENCE LISTING <110> F. Hoffmann-La Roche AG <120> ENHANCED OLIGONUCLEOTIDES FOR MODULATING FUBP1 EXPRESSION <130> P36078 <150> EP 20182437.2 <151> 2020-06-26 <160> 22 <170> PatentIn version 3.5 <210> 1 <211> 35056 <212> DNA <213> homo sapiens <400> 1 gcgcaagaat gtaatagagc ttcgacggcc gccattttct ttctttctta gctgttagct 60 gagaggaagt ctctgaacag gcggcagcgg ctcttatagt gcaaccatgg cagactattc 120 aacagtgcct cccccctctt ctggctcagc tggtggcggt ggtggcggcg gtggtggtgg 180 aggagttaac gacgctttca aagatgcact gcagagagcc cggcaggtaa gtgtggaccg 240 cgcggcggaa tcccgaaagc tcacggtaat tggccgctga ctgagtaggc cgctaccctt 300 aagcgcatga ggaagaggaa agaggtgttc ttccgggctg aaatgtgaag agacacgttt 360 ccccatgttg gtaataacga ttagagacca gaacccagtt ttgtgttctt ggtgcctaat 420 ccacttagaa ccccgacgcg tgctacgcaa agaaggcctg aagtctttct cccgcttctg 480 cggcactcgc gtgtctccag tgagctagtt tagataaaga tcctcttcca ggggataaag 540 cgcagttagt ttcacacaat ttaatggaag gttctggtaa tgagtttggg aaagaactag 600 ggtctgtcct ggagccatag caagggaagg gatttatcat taaagtagcc tttacagctc 660 atttccgttc tctctcgcaa ttaaaaccgc tttcagtacc attcaccgtc acacctctac 720 aaggaaggga cttgaaagca gcctttttct gggcgggatt tacgtgtcag tctgttccac 780 cagtccgccc cccttatttc tcaaaatggc ctcaggccca ttataccaga ggtttcaatt 840 tgaatctgcc tctcagttca gagtcgtaaa ctgaccagac ctctttgtat tacgtagtgc 900 gtgcatttgc cctgaaggca ccactttccc agacgaaagc tgttaaaata gtgcgtgtat 960 tccaggaaaa taaaagatac cttaatttga actttacatt cttagatagt cccctaatat 1020 atttaacatt tcaaaatgta tggtgttggt atagatttgc atgtaagcaa aagaatccta 1080 ttctctgtga cactatgcat attgtactag gtgctgggca ttttttacta gttttaagct 1140 aatgataatt agaaaccagt gttgtgctgt gttttcgttg cattaggagt tcacttagtt 1200 aactttttac cgggacagtt gaaggaacat tgagtcaaaa ttagaattca taaaatccgt 1260 tgtaacacat ctaatgtgaa cgcattataa acatgtacct gtactttttt ataaccagaa 1320 atactaggag tagtcaacaa aaggtcatca ttaatattag ttctgcggtt ttttccacgt 1380 aatttaagaa attctgaaca tgtttagcaa caagcatata actatgacaa acactcttag 1440 cgtgttttat tagattgatt tgtaaaactt aagggaacta ttttatttac tggaaccaac 1500 tattttattt taccagaacc agcacattgg attaattggt atcgcacact gtaggtagat 1560 actggagttt tgttttgttt tgtttgagac ggagtctccc tctgtcgccc agactggagt 1620 gcagtggtgc gatctcgtcc cactgcaacc tctgcctccc ggcttcaagc aattctcctg 1680 cctcagcctc ccgagtagct gggattacag gcgcccgcca ccatgcccgg ctaatttttt 1740 gtgttttttt tgtttgtttg tttgttttca gtagagacag ggtttcacca tgctggccag 1800 gctggtctcg aactcctgac ctcgtgatcc gcccgtcttg gcctcccaaa gctgggatta 1860 caggcgtgag ccgctgcgcc cggccttgtt ttttttcgtt tgtttgtttt aatgcatgaa 1920 ttgtttccta ctaagaagct atgatatagt tccttgacca aatgcagatg aacaggatta 1980 tctgattaat actttaacga gagcagacaa aatatggata tttaattcat ccacttgctt 2040 tataagtgtt tatagagttt gttaggaggg gatgcccaat ttcctaagta aaggtgatat 2100 atgagcaaga cattataaaa tgaaagagag tttggccagt gaagaaaaga agcagcatgc 2160 gcagaggtgt ggggacttga gggaatggca aggacccaga agtgaagtcg ctagaagatg 2220 ggggtgggag gacgtgaaac gaggcaagga aaggtacaag cggatccaga tactggaaga 2280 ccttgtgttg caatgcttta attaaaaatt ggatttcagg ccgggtacgg tggctcacgc 2340 ctgtagtccc agcactttgg gaggctgagg caggcagatc acttgaagtc ggagtttaag 2400 accagcctgg ccaacatggt gaaaccccat ctttacaaaa aatacaaaaa gtagccgggc 2460 ttggtggcct gtgcctgtag tcctagctac ttgggaggct gaggcacaag aaccgcttca 2520 acctgggaag tggaggttgc agtgagtgga gatcacgctg ctgcactcca gcctggtcat 2580 agagcgagac cctgtctcaa aaaaaaaaaa attggatttt attattaggc taagccataa 2640 tttctttata cttcttaaaa tatagaaatt gttggcaaat tgtgaaattt attgttgtat 2700 aatgctaata gatcagttgt cctgatgtct ttgctgtaat gatttcttta taaaaatgat 2760 cttaaatctg agctccctaa ctttagtttt tgcctggaat tacccattac atttgatgat 2820 atctctaaat gtcagttgta gctgttactc tgatgatata agtggaatat acagaagcgt 2880 acttagacaa aagttaggtt aatatctgaa ctacttcctc cttgtgtatt taagagaata 2940 ttgacttaag tttctagaat cctcaactaa tcctaagttt attttctttg tctagaatac 3000 tatgctgttt ttgtttttgg aaggaagaga tataggcata gtttcctgct ctcaaggagc 3060 ttcaaaggct gtaccagtgg ggatgccatt ggtattttta gctggatagt tgttattcag 3120 aaaagcagga caagtaatta tgattcctgg tccgtacctg gtaatgccag taatgttaac 3180 tctagctggt tgttgacatc tggtcattta gttgccaatc ttcttttttt ttttctggct 3240 tttatgtgaa atttttagat ttttataata tcctgagcta aattcaacac agggacacca 3300 gattgctgct ttagttcagg gtttccagcc tgtgcactta agaaatttat ttttgtgtat 3360 atcaagctgt aactccagag attgggattg tttgattggg tctttagcag tggtactaat 3420 agcaacttct gtctctagaa cattggaaaa ttaaaatgtg tttatctacc gtttttttcc 3480 tcgaggttat atgaaggtag aaatgaatca gactagatga ttagctaagc gagactatta 3540 accctcatcc cttcccctct agacaactat gaaattagtc attatgtatt cgatccttct 3600 tgcagtctct tctctgacag ttataaaagt gatttaggct gcataatgtt gtttgaatga 3660 aatgaaaata tagactagag ctgttttttt ttttatttcc atcagtctct tcagtgaaaa 3720 ctaacatttg agcatgattc tttttttaaa tcattttgtg acagtttagc aaggcttgtg 3780 ataagcaagt tatggtatgg taatatttct agtgtccacg tttcttcaca tgtctggtgt 3840 atgggaacta ctaactccat caggaccttg cctatagtag gtactcaaca tttactgaat 3900 taaatcaata aacattttta atgaattaca gtacaagtca gacctctgta tctgtgggct 3960 ctgcatctgc aaattcagcc aaccatggat cagaaatatt agaaaaatgg aagaacagtc 4020 cagcaataca agtaatatga ataaaaacaa tacaacaact atgtacattg tatcaggtat 4080 tataagtaat ttagagatgc tttaagtata ctgaaggatt tgcgtaggtt atatgcagat 4140 actgtaccat tttatataag gaacttgagc atctgtggat tttggtattt gcatggttcc 4200 tggaaccaat cccccaggga tactgaggga ctatagttga tcataccacc tgattttaga 4260 gattttctga gtctcagaag ttaattaagt aaactacaat agtctgttct taacctcgga 4320 ggatacattc caagaacctc agtgaatatc tgaaaccaca gatagtattg aatccaatat 4380 atacacggta atattttttc ctatacatat gtatctataa agtttaaatt ctaaatcaga 4440 cacagtatta acgataataa taaattagtg caagactggg catagtggtt cacacctata 4500 atcttaacac tttaactatg acgttgtctt tgaaaagaaa tcagctagcc aaggtggctc 4560 atggctgtaa tcctagtgtt ttgagaagct aagtcaggaa gattgcttga gcccaggagt 4620 ctgagaccac cctaggcaac atggtgaaac cctgtttcta taaaaaatac caaaaaatag 4680 gctgggcgcg gtggctcacg cctgtaatct cagcactttg ggaggctgag gcgggtggat 4740 cacgaggtca ggagattgag accgtcctgg ctaacacggt gaaaccccgt ctctactaaa 4800 aatacaaaaa attagccggg agtagtgggc gcctgtagtc ccagctactc aggagactga 4860 ggcaggagaa tggcgtgaac ccgggaggtg gagcttgcag tgaaccgaga tcgcgccact 4920 gcatgccagc ctgggcaaca gagcgagact ccatctcaaa aaaaaaaaaa aaaaaaccaa 4980 aaaattagcc agacgtggtg gtgcttgcct gtagtaccag ctatccagaa ggctgaggtg 5040 ggaggattgc ttgaacttgg gaggtcaagt ctagaatgtt gacaatgttg ggtcctttat 5100 gtagttgcat aagtgagcca tgatcgtgcc actgcactac atccttgggc aacagcctga 5160 ccctgtctca aaattttaat ttaattaaaa aaataaaata gaacaattac aacaatacac 5220 tgtattactg gacaagaagg gcaaatttaa aaaaaattaa accaatatgc tataataagt 5280 tatatgaatg aggggaccct cccctacccc agaatatctg attgtactat atcataggta 5340 actgaaaccg tgaagagcaa aaactgaaga taaagagact actgtgtctt ttaagtttct 5400 tttcaactcc caaattcttg gatttctcac ctcttggctt cctcaataga ggtgagaaat 5460 gttaaagtag tgaaaacagg aaaaataact tactcattca agaagtagat aatggtccag 5520 atggaaagct tgaattattt ttgtaaaact aaaattaaat aaagtagcca ggcatggtgg 5580 cttacgcctg taatcccagc actttgggag gctgaggcgg gtggatcact tgcggtcagg 5640 agttcaagac cagcctggcc aacaaggtga aaccctgtct atactaaaaa tacaaaaatt 5700 agctgagcat ggtggcgggc gcctgtaatc ccagctactc gagaggctga ggcaggagaa 5760 tcgcttgaac ttggggggcg gacattgcag tgagcccaga tcacgccact gcactctagt 5820 ctgggtaaca tcttgagact ccatctcaaa taataataat aattaaataa agtaaaaagt 5880 ttcccacacc tcataaatgt ctaataaaaa ttgaatatgt tgagttcaag tactctgaaa 5940 aaggagttga atatagttgg aggttggttt ttaggaatta ctatttttct taaattaact 6000 atccttgtag tcacctagga attgtgtatt ttctatagat cttagaaaat tatcaaatct 6060 acagttcatt ttgttttttc agtttttttt ttttttttaa gagatggagt cttgctgtat 6120 tagcgttgaa ctcctggcct cagccagttc tcccatctca gcttctgaag tagctggggc 6180 tgcaggtgcc actgagcctg gcttctttat tggtattttt attaaacact tttctctaat 6240 gtctttgtaa cagttctcag tttttgaaat gctgttactg tttctttagt gtgaactgtc 6300 aactttcatt ttttcttttc ttttcttttc ttttcttttt ttcttttttg agacagagtc 6360 tcgctctgtc acccagactg gagtgcagtg gtgcgatctt ggctcactgc gacctctgcc 6420 tcccgggttc aagtgattct cctgcctgag cctcccgagt agctggaatt acaggtgcgc 6480 accactgtgc ctggctaatt tttttttttt ttttttgtat ttttagtaga ggtggtgttt 6540 caccatgtca gtcaggctgg tcttgaactc ctgaactcat gatccccccc gccctgcctc 6600 ggcctcccaa agtgctggga ttacaggcat gagccaccac gcctggcctc agctttcatt 6660 ttcatttggt tagtttttga actattcagt gggtaaagtt gtataaataa gtgtcttttc 6720 tctgtataga agtgtcttgg agttcaagga gtgctgcttt gcaaactcat agagtattta 6780 taaaagctaa ctgcagaagg tattcatagg ctaaaccgtt tcctattctt ggtagcacca 6840 ttttctctgg cctgaaatac tttccttcta ctattagtgc ctgtcgatac ccagcagtgt 6900 atttactttc ctgaggaaca attcaaatgc taagtgcttt aagacctaag ggtggaaaag 6960 cagtgttttc aggcattatt aggaaaataa gatttaaatt agacacccag aaacaaaaac 7020 aggtttgtaa ttggtaaagt gaaagatggt taaagaaggt tagattgacc aaagcgagaa 7080 tttacctttt tttttttttt ttttttgaga cagagtctca tgccgttgcc caggctggag 7140 tgcagtggcg tgatcttggc tcaccgtaac ctccacttcc tgggttcaag cagttctccc 7200 acctgagcct cccgagtagc tgggtgacat gcgccaccac gctcagctaa tttctttgta 7260 tttttagtag agactgggtt tctccatgtt ggtcaggctg gtctcgaact cctgacctca 7320 gtgatctgcc cgccttggcc tcccaaaatg ctgggattac aggcatgagc cactgtgtcc 7380 ggctgagagt gtaccttttt ttttttttat caagcaatct agtacttgat cctaataatc 7440 tttgtggtag gtgtttgcat ttttagatga ggaaaaggga aatctatgag tcctaggaaa 7500 tacagttggt atatgggaac tgatatgtaa ttagacttaa gtgatccatg ttgaatttat 7560 gacttaagca cttaactata atcttaacct ctccagttgt ctgatgaagt tagtatatgg 7620 gaactgatac atagacttaa gtgatccatg ttgaatttat gacttcagca cttaactata 7680 attttaccct ctccagttgt ctgatgataa taaaaacttg aagcagttat ccatatgggg 7740 atctctttgg ggaatcccag tcaccaaaag ttaggttttc tttaatattt tttcatggaa 7800 gatttcaaat atactcaaaa ttgaaagaat tatataataa attctcatga gcccatcaca 7860 catcaataat gaatgtacag cattgcagtg tggagcttgg cctattgctg accactcagc 7920 aatgtggcag aaccactcca tgattcccca tggaaatggg aactacttcg gttgtccttt 7980 tatagaaaaa ttcagtaagt atctgctgat tgtgccctac ttgtgacttg aagccaggtt 8040 tttttttttg ttttttattt tttttgtttt gttttgtttg taacagtctt gctctgtcat 8100 ccaagagggg catgatattg gtgcactgca acctccacct cctgggttca agtgattctc 8160 gtgcctcagc ctcccgagta gctgggacta tgggcgtgca ccaccacacc tggctaattt 8220 ttgtatttag tagagatgga gtttcatcat gttgcccagg ctgctctcga actcctgagc 8280 tcaagcaatc tacccacctc cacctcccaa agtgctaaga ttacaggcat gagccaccat 8340 gacagcaaag ctgggtattt cttaaattgg ttcagtcagg tgcaataaat tatttgccct 8400 actctaaaat ttaaaaatct tctaagaatt atggttttgc agctgaggtt tttttaagac 8460 tcgagctccc tggactccta catatatcct tagaacaaca ttgtccaata gaagtacaat 8520 gtgagccaca tgttttgttt aacccagcat atccaaaata ttaccccctt tgcatgtgct 8580 taatataaaa atttaagatg atttatattc caggttttca atattcagtg agtaatttta 8640 cacttagagc aagtatcatt tcagactagt cacattttga gtactcaata accacatatg 8700 gctagtggct accttactag atagcatagc ctttgagtcc cacaaagtgt tcacattcta 8760 tgtgtttaca cacatctttt gaagtgtcat gacagagcca gataggatcc agattttctt 8820 taaatctggt ctctcttccg gattcctagt tgattacttc tttgttgctt cttataggga 8880 tgtatcagaa gtttaataat cttatgatta ttatgttaac tgcctgaagt attaatggta 8940 gcaataaatt gaactataat tttaattttt caagtaaatt ttcttatgtg atactaaata 9000 tttcacatat acatgtatca ggaagtaaat gggggtaatt tagtaatgaa tagtatataa 9060 tagtttatga tggtattttt cttttttttt tttagattgc agcaaaaatt ggaggtgatg 9120 cagggacatc actgaattca aatgactatg gttatggggg acaaaaaaga cctttagaag 9180 atggaggtaa gttatactct aagtatttta aattgttttt cagagtgttt agttgaagtg 9240 attctcggta tttttctgtt attttattga gatattaact tttattataa ggttgttaaa 9300 attgtaagct gtatattggc ctaaaagggg ggaaagaaaa ctagacaagg taagtaaaat 9360 ttgaaagaaa ttttttaaaa aattttttaa aaaaggaagt tttgtcttaa tagaaaacaa 9420 tttattttcc ctcttttagg attgtgccag attgaaagtt tgcacagacg tcttgttaat 9480 aatattaaaa aacatataaa ttgcttagaa gacacttcac tggttttact catacgtgaa 9540 tggattttaa tatgctgtat tttcgtcatt tttctatttc caattgcacc ttaaaggttg 9600 aaattcctat agtttgctac tctagtgtgt tgcaggttat accatttttt ttttaatgtt 9660 ctttactttc agtacttttg tgtttcacgt ttagctttaa acctgtggat taaaacagtg 9720 gatttacagt gctatgtatt tttaaaaatc gtaatcgttg aagcttctga acttagaagt 9780 ctgcatgtat tttttgtttt aggtttgata tatgagtttt gatacatttt ctttttaccc 9840 ttttttttaa agggaggatt ctcactgagg ctatagaatg tatttgtagc ttttgaccag 9900 gagaacttgg tttcctttta tttaagtgtc tttcatattt atagtgaggt ttttaatgta 9960 gaaaaaaaat gagctaatga tgcttcagat gttgtatgta atgtattctt tttattttat 10020 gtgtagatgg ctcttggaca agtccgagca gtacaacaca ctgggaggga atgccctctc 10080 cttttaaagg caggaatttt tatttattac ctgtgttcag tatgtaaacg tgaaataaac 10140 cagtggattc ttaaatggac acaaatattt cttggattat gtgtctgcgc atattttatt 10200 tttgctgcac aacattctga tgtttaatca tttaagtttg aaggggggag gagaatgtag 10260 tactttgagc tataggttgt ctgttccaag gtatgcattg tattcatctg tgtaatggat 10320 ttaggtgaag gtagtcatgt agttgctttg agattttatt tttttgctaa agttttatgc 10380 agtgaaatgt ttgtttataa ataatagaac agtttaggtt gagattgcct tgtaatgttg 10440 tggggggttt ttttgttttt ttttttttgg gcatagcttt gtggtcactg tcagatacac 10500 tttaatatgt cagatttttg tagtttgata ggcttttctc cccccagtct tcagttcctg 10560 aggtggaagc atcattagcc tttagcatgt gatattttgc tagtaatgga cctaaagtac 10620 gttgtcttgt gtcattctaa tgtgcttaac atacattaag gtcagtgatt tcttaagaat 10680 cagataacta ttttaatgtc tgtgcatctt ttgaacgtga agagaatgaa gtatcgtttc 10740 ttttttagat tactgagttg gggttgaatt ttggcagttt tggttcaaat gataaaccat 10800 accttcagat atttcaataa atgtttatat tgttatttat tcttgtttgg gaggggagaa 10860 gctttgtact taattggcaa aaaattaaaa gacacttaat tttgcagatc aaccagatgc 10920 taagaaagtt gctcctcaaa atgactgtaa gtattccttt taaactgggt caaaagctaa 10980 agtaacaatt tcaatgttaa gattttgttc atattattgg gtatctttga agttagttgg 11040 tttatgagta ttttggatca gctagcctga atttctttgt aaatatatac ctttttctcc 11100 tattttacaa tctgtcccat taattgtggc cgggtatatg taaagattgg ttgctgaatt 11160 attttacata tttaacaact ccaattcttg atctatactt gtacaacttg aaaaaggaaa 11220 ttattttgtt ctgtgccatt gctaatataa tgtcttccct ttcattggct ctcttgcccc 11280 tgtcaatgcc aatataaata ttgtgtaaaa aatttgactc tcttcaaggt gttgtctgtg 11340 cattagggag agatttttga atgtttgatg tgattgtgtt gttaaatata taagtaaatt 11400 taaattttga atttttgttt tatttttatt taattttttg atagcttttg gaacacagtt 11460 accaccgatg catcagcagc aaaggtatag tcacaagatt ttcaaaaagt actctgcaag 11520 ttttggttga gctgtatgta aaaacacaac cacattggtg tatattgaat atgtgtctgt 11580 gtattttttg gtgtacctag ttcatatcac tccccttggg aaggtaccat aaagtgatga 11640 tttttctttt gagtgagaaa aatttgtgat ttggagagat aggtggaatt aaccacattt 11700 tagaagaaca ggggtgaatt agagtaactg ttaagatgac attctctaaa ctccacttca 11760 acttctttac agttaatgcc ttcagactgt tccattcatc atcccttctt cacttgatgt 11820 gtcatcttaa atttcttaat ttaactactc aagtaataag atcatatttt ttgacatgag 11880 tctgagccta gaaccttagt ttaagccatt gggagacatt agacttccat ttttattaat 11940 agattatctt ttatttgtaa acaaagtatc tttcattgaa ggaaaatggt gctttctgtt 12000 atttcttagc agatctgtaa tgacagaaga atacaaagtt ccagatggaa tggttggatt 12060 cagtaagtaa cttgattttt aaagttttga aaacatgatc aaaacatact ttagaatctt 12120 tcaaccaaaa aaaaaatttt tttttttcta actagtaatt ggcagaggag gtgaacagat 12180 ctcacgcata caacaggaat ctggatgcaa aatacagata gctcctggta atgttacatt 12240 ctcatggtat tttcagtgtg actagaaaac tagctttttt ttttttttaa gccttctagt 12300 aacaataatg ctacttttaa tcttttgacc tgaagttatc tgtttgtttt aaattgtaga 12360 cagtggtggc cttccagaaa ggtcctgtat gttaactgga acacctgaat ctgtccagta 12420 agtttgaaaa atcttaaaaa tctacttaag taacaacagc agaactcttt gaattttgtc 12480 tcttctcttt gttactgctt tattttacac tgtggtttcg ctgccacctt ccctcaaagt 12540 cctccaactc ctttgaagtt tatgcctcat gcctttctca ggtggggttc atcatctgaa 12600 tcattaaaca cagaaaatgg ttaaaacaac tccatatcta ctccagtctc tacttgtaaa 12660 gccacgtgta gcctggagaa gaatgcacag tcaggtcgac tggtgacact taaaactcag 12720 acattaagct caagtggact gttgtgttgc ctgcatttcc ctagttccat tcacttttcc 12780 actcctctcc caggctcttt aatactgtat ttccccacct ccaaatcttc agcatctaac 12840 cccacgctct cccacttaag cttatttact gagaaaatgg aagcaaatga taagaagctt 12900 ttctttttcc ctaccactaa acctaccagc cttcattttt cctctgttca catagtactc 12960 aggtaattgc tttccttttg tgttcgagtg cctaaagcca gccctttctt cctactgaag 13020 gttcagcttg cagttgtact ttcttctgca ttgttagttc tccctcatta ctaggttttt 13080 tcttttcttt tttttgagac gaagtctcgc tctgttgcca ggctggagtg caggggcacg 13140 atctcggctc actgcaacct ccgcctcccg agtagctggg actaccggtg catgccacca 13200 cacccagcta atttttgtat ttttttagta gagacagggt ttcaccatgt tggccgggat 13260 ggtctcaatc tcttgacctc gtgatccacc cacctcggcc tcccaaagtc ctgggattac 13320 aggcgtgagc cacttccccc agcctgattt tctttatggc actttccaaa taatgtgtta 13380 ttcatttgac atgttatttt tacttattta atgaaatgaa gccactctag caggaaccct 13440 gtttctttga gtgctattac cccattacct agaatagcac ctgcacatag ttgatattta 13500 aatatttgtt gaatgaataa ttgtagcata tgagtaagca aaatggtagt ttaaaaatgt 13560 aaataaatca tttagttctt ggaagaatca gtttaattct gagataactt tagcattaga 13620 gttctttctt ggaaattttg gactattctt aaaaataaaa attgtatatc tagaaaattt 13680 ttttgcataa tctctcaatc tttgaccctt gatggcattt tctttcagtt aaaagtaaaa 13740 gcattgttaa agttagcatc aaggcaccta atcctgaact gggataggag gagtacttgg 13800 ttatattgtt ttatatttct ctatttgaat aagcttgggt atgctacagc ttactattta 13860 aatattaatt tgttaacagg tcagcaaaac ggttactgga ccagattgtt gaaaaaggaa 13920 gaccagctcc tggcttccat catggcgatg gaccgggaaa tgcagttcaa gaaatcatga 13980 ttccagctag caaggcagga ttagtcattg gaaaaggggg agaaactatt aaacagcttc 14040 aggtattgtt atttttgtga aatggctact tttgatctgt tttgatgccc atttttgtcc 14100 acttcctttt gttaatatat attatttcta tgattgtaac aggaacgggc tggagttaaa 14160 atggttatga ttcaagacgg gccgcagaac actggtgctg acaaacctct taggattaca 14220 ggagacccat ataaagttca agtaaactta actttatact ttataaagaa agagtgggtt 14280 gaatggggtt gggcaaaata tgcatgaata attaaaatgt tttgagacat gctttctaaa 14340 ttagctaact ttttctgctt tagcaagcca aggaaatggt gttagagtta attcgtgatc 14400 aaggcggttt cagagaagtt cggaatgagt atgggtcaag aataggagga aatgaaggga 14460 tagatgtaag taaaaatacc cattcagaaa tggttgtatg ctaattcata aatataatag 14520 tgttttctgt tttgtgttaa gtagctctaa cattgttatc cttttatttc acctttatac 14580 tttagaatac agaattctat atatcttgtt accctattta ctataaatat agaattatat 14640 gtacttttat gatttgaggc agattttcag gaaatggcgc ttttttaaaa tacttttttt 14700 tactttaaac cctgagaagc tagctttctt aatacttagt cttttttaca taaggtcccc 14760 attccaagat ttgctgttgg cattgtaata ggaagaaatg gagagatgat caaaaaaata 14820 caaaatgatg ctggtgttcg cattcagttt aagccaggtg agtacatata ataatcttgt 14880 aagtgttggc agcagtgagt tttgacatac atttattgtt taattaattt tgtttctttg 14940 ttttgaagat gatgggacaa cacccgaaag gatagcacaa ataacaggac ctccagaccg 15000 atgtcaacat gctgcagaaa ttattacaga ccttcttcga agtgttcagg tttgatagaa 15060 agttaacatt ttcatttttt gtttttatgg aaaagtattt tccttcatga aatctgaagt 15120 tacctctata tcagagtctg cttgatgatg ctttattaat ggagaaagtt taaattgctt 15180 taaggtaaag atcttggagc aggaagaact actaccttaa gtgctacctt atttactctt 15240 gtattttaaa aaatgttatt acttattagg gccagttcat ctctacattt ctgattcagg 15300 tatatgagag ctgggaaaaa taaacttaat aattttatca tgaaacaaaa gtatttctgt 15360 gctgactctt cgttcttgtc tttccctctc tataggctgg taatcctggt ggacctggac 15420 ctggtggtcg aggaagaggt agaggtcaag gcaactggaa catgggacca cctggtggac 15480 tacaggaatt taattttatt gtgccaactg ggaaaactgg attaataata ggaaaaggca 15540 atgtatttta aactcttaat gttttaacac attattcatt tttctggaca ctttctgttg 15600 ctgtcgtaaa caagtggcaa tgctttttct ctgaccgtat tttagtagaa aagaattctt 15660 atgttaatat gtaacaagta aaacataaat gagggatctc atgtatattt agagaaagag 15720 caggatttta atcttactag cttctagaga aagcgaacta agagataatt attagcataa 15780 gaaatgtctt ttgacccaaa aagtggtttg agtgtttttg tttgtgcatt ttggtttttc 15840 ccgactcata ttttaaaaat ttgaatgttt ataagtgtat tagtttatat ttacactgct 15900 tttaaaagca gttaattcaa atattttatt ataatcacat taagtttatg tttaaacata 15960 ctaagtaaat gtaaatgtat tttaagagaa gcatgaaatg cttcctaaaa tttgattttc 16020 agtgtagaat attaaatgaa aaatcttaat acaatattgt caattaggat actgaccaaa 16080 ccatattttt aatggcccat ttaattgtga ccattttctt ctaaatagct cctagtacac 16140 ccttgaaacc tttagagaaa ttactgtctt ttgattttag gaggtgaaac cataaaaagc 16200 ataagccagc agtctggtgc aagaatagaa cttcagagaa atcctccacc aaatgcagat 16260 cctaatatga agttatttac aattcgtggc actccacaac agatagacta tgctcggcaa 16320 ctcatagaag aaaagattgg tgtgagtata ctttaaactt ttaattttta gtgtagaccc 16380 ttagactgta gttaaattaa gacgtttatt caaatacatc aaaggaaaat gtatcattac 16440 tagtcagcat ttatagattt catgatatgt ataatagata caacgtgaag attttccagc 16500 aatgaaaata acctaattaa atgtgtagtt acaggttttg agaacaacct tacatttggg 16560 tgtggctaga taagaggagg gtagtgttac ctgtaggcat gatattagtg ttggtgtagg 16620 attgtggaac atacttgaag gacatagtta acgggaattc attatttatt aagattttac 16680 tctactgaac cccagcgagg caaacaagat aaatcagata catctgccac tctacagtag 16740 aaattcataa atcctaggtt ttggactggc tcacagatca tctgggggta ttaaaatgta 16800 gactatttgg gtgcttccca ctcctacaca taatatacag agacagacct gactcaaaat 16860 gtctgggata gggcccagca tctaatttta catagatgtt tgggtgattc tggtgcacag 16920 acaaatttgg aaatttttcc tccaggaaag ttttctgtta gaacaaaaaa gtatgaaacg 16980 ctttgactgc ttttttgtaa gtgaggcaga cagtgtctta ctggagtttt taacacaaag 17040 tgtgcagggg gcatcttaaa ttattagaat tgcctaggaa aaattatttt tggtgtttgc 17100 catgctgtga atggggtgcg tgcaaaacaa ggttgacact gtttctgtca acttgggaag 17160 acaaaaatag atgtacaaaa gacgcttaag gaacgtctta caaaatgtac acaaacattg 17220 tgagttctgt tgtatggata gtttaatggt tcaaaaaatg aagaggatgt ttgtagagta 17280 atgatagagg ttgatgccat ggcaaaaaaa tgaatagcac tcatcttggt tttttatttt 17340 acagtattag cctaacatgc atgcgtcagg atttctgttg gattcatgga aaaacaagat 17400 agattgtttt ggagaagcaa tttggtgtgg tgattaagag catggactct gtagtcgggt 17460 tgcctcagtt cagaattctg tgaatcattt actggttctg tgaccttgga gaagttactc 17520 aggcttttct gtgccttggt ttcctcctgt aaaatgaaga taatggtatc tacttcatag 17580 agttgtaggg attaaatgaa tgttcatgtg tgtgtcactt aaaagaatgc ctgccacata 17640 accctaaaaa atgttgctac tttttcagta ttatttttac tacttggaaa gaataggtca 17700 tggatagtaa gtgagagatg acagcaattg gagatttaaa gagacaagtt aataaaaaga 17760 actttaaagg tcatgaagtt tagtttccct attttgcagt gagaaattta caacaaaatg 17820 tagtgttagc attttgtcca acatgtcgcc tggttgtgtt aactactcag aaggagcatt 17880 ttaggacagt taagtgtaat gtctttgttg gcttaaccaa acagaaatca gttaagcgtt 17940 attaatgatg tggcatgcat gcatgataag gatataaaat atcctgattt attgaaggaa 18000 ttaaaaaggg aatttttgtg ctattaaaca tcatgataca tgaaaggcca aaaaggatat 18060 aaattattga tctgaatggg attttagtga cagaaatagg ttgtgaggtg gattttagtt 18120 tcatagtgaa acaactagct attaacgtta tcagtgaaat gttcagaaga cgatgataca 18180 ggacccaagc ggtttgggaa tatattgtca agacggttgt ctcatgttag gcaagtagat 18240 atagagagaa gagctgaaga taaggacctg atttctgtga gtaagatgga aaaagatagt 18300 aaaagtaaga atgataaaag gaaagggaac tactgctgtc cgcaaacaag ctaaaggaaa 18360 tttaattgct aatttaaatt taatttaatt taaattgcat ttaattgcta ctgctattga 18420 ttttagtgaa ttttacatgt ctcattatta tggcagatga aatagttttt gcaaaatgaa 18480 tgaggaaagg aaggaaaacc taaaatttgt tatttgtgac tataagaggg tagaaatgga 18540 tgattatttg gccgtagagt tgtttaacca ttactgtgtt tttctgattt ttctatgtca 18600 tccttttttt tgtagggccc agtaaatcct ttagggccac ctgtacccca tgggccccat 18660 ggtgtcccag gcccccatgg acctcctggg cctccagggc ctggaactcc aatgggacca 18720 tacaaccctg caccttataa tcctggacca ccaggcccgg ctcctcagta agtattgggt 18780 ttagttctgg gctttcccca aagattctag ttttgggact gttttttatg ctgatttttc 18840 ttttcagtgg tcctccagcc ccatatgctc cccagggatg gggaaatgca tatccacact 18900 ggcagcagca ggctcctcct gatccaggta gaagatgctt attatttgtg tgttatctgt 18960 attattttcc actcctgtta cattattaaa ttttctagtg ttgattctac atttgtatgc 19020 atcaccttca ctcactttac tctttcaaca gtgttaggca ctgcctctac cccagtgtat 19080 aggactgaca tgaatatgag ctctgctttt atggaatttc tttctacttg cctttggctt 19140 atgagttgat acagtagaat gataaaagct aaaagctgca ggaaagagca cagtgtcata 19200 ggttttggat accagtgctg tcaaatgtgt agtatgttca ttgtgacatt atctgtggaa 19260 aaatagtttt tacttattta gaaaagtatg tgataggggc tgggcactga ggctcacgtc 19320 tgtaatccca cctattcaga agtctgaggc tgaggcttga gaccagcctg ggcaatatgg 19380 caagacccat ctctaaaaaa atttgtttta aattagccgg gcagggtggt atgtgcctgt 19440 acttgaggct gaggtgggag gattgcttga gcctagaagt tctagattgt attgagctgt 19500 gggcacacca ttgcactccc ctgggcaaca gaatgggatc ccatctctta aaaaattatg 19560 tatatatgta acagtctata taaatatata tatataacag tccaacagag tgttaagtat 19620 tggggcatta aacttccaaa ttgtcaaata agatatctgt tctagtactc ctcatatgac 19680 aacttcatgt gagtaaaaat caggcctgta tttaataact gcatgctaaa gcccaaatac 19740 gtttaattat tttctatatt cagatttatt tttatcctat tatattctgg catctttcca 19800 taccctgtag tttgctttcc atcttggtca aagagtcatt ctttgaaacc aattaacatt 19860 tatttatgat ccttttttct cacctgctac ctacctttta ggcctctttc actcgtgtag 19920 tttcaaggaa aatatactca attatggaat actttctaca cataatacat ttatcccaaa 19980 aaaacttgaa gtaatttatg taaatgaaat tgcttgatta acttcatagg aagtgtgctg 20040 tttggaatat gatgacacag catgacagtt accaagcatg acttgagttg tgctaggata 20100 taggtgtgca aagttggggt tgtgttctat agcaaaagaa tgcactccca gcgtaagcaa 20160 cactgatgga aggggctcac agggtacagg atataatact cttaacaact aatttttgga 20220 gaatgaaagg gcttttcttt ccctcttgtt ggctgattgg gatggtataa ttaatgggat 20280 tgaagagttt gagtaggtta aaaggcagat tcatattggg taacttggat ctgccaggat 20340 tgtatttttg agcactactg ggtggttagc atgattgagg aaaaatgatg ggaataagaa 20400 gtggaagtgg tctttgtatc acaagttgaa tttctcactt ggagtagtag tgaagtcact 20460 actgtaagag ctggtcagtg aatgtggttg cagcatggcc tttgggcaag aagtaaccca 20520 tttaactaaa accagctggt tggccccact cagatttatc aaagggttac tgggtccctg 20580 ggggtggata ttgcttatat tagacttaga atagcatact gttttaatat tatatgaact 20640 aaaatgtttc tttaaaaaaa gagtggtctg ttaatggatt tatgtagtgg tcaagaattt 20700 agacttcaga gtcaaataaa cctatatcag tcctagtcct acagtttact aattgtgaga 20760 tgtcaagcaa gtttttgaac tcctctaagc ctctgttttc ttatctataa attaataaat 20820 gaatgaatcg ggttgagtga atatttagta aattcttagt acatactagt tatttgtaac 20880 tgtgagactg gttttttggt atggttttca catttgggag tagaaatacc acttcctaaa 20940 gtctgtttta tctcaaattc tctatccagg catagtgtaa agtgaaatac ctagatttct 21000 tgattaatat acagataatg gccagacgcc atggctaaaa cctgtgacgc tagcacttcg 21060 gaaggctgag gcgggcggat cacttgaggt caggagttgg agaccagcct ggcaaacatg 21120 gcgaaaccct gtctctacta aaaatacaaa aattagctgg atgtggtggc aggtgtctgt 21180 aatcccagct acttaggagg ctgagacagg agaactcctt gagaattgct ccactgccct 21240 ccagcctggg caacagagtg agacacttca tctcaaaaaa aaaaaaaaaa tacagataat 21300 gacactattg agatatgtaa acatccaaca taaaaaagca gtacattggg caattgagaa 21360 aagtttggca ggtgtcctaa taacacctta caattatatt accttgcaat tttctttttc 21420 tagaaattct tgctcatttt tctcaaactt gactaacctt tattaagcag ctgagaattg 21480 ctactgttca gaatgaaggt ataatagaaa atttaaaagt tttaattgta tggtattcct 21540 agtataaaag acaatcaagt tttttctggt ttctagaaga ttgaaaggtc tcaaactgtt 21600 cgcacttcag ttgatgtggg agatgagtga gggtcagtca agtgtagagg agacaacata 21660 gctaaaagcc gagacacggg catagtgatt tctgaaaagt acaagcactg tgttgtggct 21720 ggagcttggg tgttgaagag atacaaccaa agggagagat gaggctgaaa tggaaaggat 21780 aagccagggg cttcaggctg ttaaagatgt tgaatgatag gctgtactta agctttgaac 21840 atcctgaaga ttgcagagaa tgaagaattt caagtaggat gacatcaagt ttataacatt 21900 caatgtgaaa taggatgaaa tgtggctaat cttttttaag atttttatat tttctcttca 21960 ttgaaaataa ggacaaagtt cattgttcta aaataatttt ctttcttata caggttagtc 22020 cctagaaatg tttttcttta gtcatcttct agatagagct gtttgtgctt gaggcgaaac 22080 caatttagaa aaaaacaagg gcacaggatg gtttgagaca gagcattgga tttggagcca 22140 aaagaccttt attcatatcc cagttatgcc actcagtagt ttttaaccta ggaaagtcac 22200 ttagtctctg agacttggtt ttctttaata aaagctgatg gtgacaacaa aaataataga 22260 aaatttaagt tttcatatac tttttttaat gttctagtta attttggggg ctgtatattt 22320 gccagagagc tgggcggggg ggtggtgtgt gtgtgtgtga gagagaatta cagacttcac 22380 atgcaaacct tgaactttca tttattttag ctaaggcagg aacggatcca aattcagcag 22440 cttgggctgc ttattacgct cactattatc aacagcaagc acagccacca ccagcagccc 22500 ctgcaggtgc accaactaca actcaaacta atggacaagg taactacaga acttattgta 22560 tgtgaaagcc aaaagttgtg cttggaatta tatatgaagt acatcactgt ataataccta 22620 aaatttctga cattatttaa ttataattta agcagacttt tcctttttta aattgttact 22680 ttgaaatagt ttcaaacttt cataaaagtt gtaagaagaa tacccggagc acccagatag 22740 cccagctgtt aatgttttat tcccttgttt actctgttac catctatatc atacatgtgt 22800 atctgtattt attttaaata tccattataa ttagttctga aggaagctaa ttatatccag 22860 cataattagt tctgaaagaa atcactgaag actaaactgt agacatgatg tcctgttggg 22920 tacttcttca aaaatacata accatcatac agccctccaa atcagtaagt caacattgat 22980 atattaagtt ctttatatca ttatggattt ctgatttttg cagtaggtta tatttttaaa 23040 gtatttttat aattttgata atcagattat cctggatttg gccagtcagg gagtatattc 23100 agggtggtgc ctatatcctt ttgaaatacc tgtcattctt ttaagcactt ccatactgtc 23160 tggcacagta agattgttat tttgtgcttt ctgggctcca gccctcgagt cagctatttc 23220 ttcaaggagc tcttattcct tttagtagag tatggtagtt agaaacgaga cttgagtatg 23280 cttgttgcta ctgaggtgta attgcttcta gcttctttca acaggcagaa ctaggaaata 23340 tatttacata catgcatacc tacatacaca caccaaaaaa cacataaaca tcgatatatg 23400 tatatatttt taaaaactat gttcatatca ccacatccgt ttcagcattt tggggttttc 23460 aagccttttc cttttttgta cttgtttaca aacgtgagaa acctggtgtc ctcagtgtat 23520 ttccttattt gacatgcatt tacttatatg ttcaacataa ccagtcttca aacaggttgg 23580 ttttcttttc tgtccaccac ctctgtaccc ccagtacctt ctatctttgg cactgttagg 23640 gatgccacca ccacatagta cttccctcct accctcactg tcacattgca ggcccctgcc 23700 agctcctgca cccaaggaaa cggccaaaat tgccttttaa aaactttaat tctgtttttt 23760 gttttgtttt gcttgaacaa ggagatcagc agaatccagc cccagctgga caggttgatt 23820 ataccaaggc ttgggaagag tactacaaga aaatgggtat gttttataca tttcttgaaa 23880 atacatactt aattaaattg aaacaaatta ttctcttcag gaagagaata attgaataaa 23940 atcactggac ttgtaaacat atcaagacag ttgtaaatta tagtttttaa atttgtggtt 24000 atatggcaag gaaatttttt tttctaattg catttgtcaa ccagttatta attgaaacta 24060 gaaatgtcct tactggtaca tacaatatta acattactat acttttgaca atgacagtta 24120 tatatattat cagtctaaat gacataaggt taaattttaa tgtgtcaggc gaaaattgtg 24180 tgtgatacca ttatttttgc tgcaagataa gcaggtaaga agtaatctgc agtgacggaa 24240 agtaaccaag tgatggaacc agaatctggc ttccaagagg gtctgagtcc caagcttgtc 24300 tcccaaattt gtctctttag gaaccatttg gaacctgata ctatacttct ggacaaatca 24360 ctatatttca gctgcttttg ctcttagtca tttaaaatta ttacatacca cagctagatg 24420 tcacaaatga aagctaaatt ggtaagcttg gttatccttc actagcagaa aaagaaccta 24480 taggtggtag agttttgtca taagagaacg gtctacttgg gattttcaat gttttctttg 24540 ccaaagaatg tttctcattc tccacagaaa gaaaaatttc cagaaaggtg atgattttaa 24600 tcttctagat gtaaaattac atatacctga tgataaagtt gttttgcaca actggtttct 24660 ttttaaagaa aaattgtttt tcctcttaga atggcttcct aggagagtca tgttccgtct 24720 ctttctgagg ctttaacaga ttatgttttt gtgacctagc ttaggcagat ctacagtagc 24780 tacaattcgg caaaaagaaa cttttaactt aaaaacagca tactctgatt aaggttggtt 24840 acataattta ttttctgaac tgggatcctt tttagaatga atagggatgc tattaataat 24900 catgccctga cagcattgtg gtcaggacct gtaatcaact taactttaat taaatagcat 24960 caccatttta aaagacttga gcatgagcca cgtgcggtgg cacacacttg tagtcccagc 25020 tgcttgggag gctaaggtgg aaggattcct tgaacacagg agattgaggc cagccttggc 25080 atcatagtga gacctggtca cgtgtttggg ttaaaaatca ctaacttcaa cttctatttt 25140 ctcaatgggt aatgtcccct agatagggtc cctagttatt attaagtagg taaaaataaa 25200 ggcttgttaa tggatttagg taattatgga ggaatgagtt tggcttctgt gctttatttt 25260 accatattga ttatttgtaa tatggccatt aatacattta ctgtttagtc ttttttgttt 25320 tactttttat gttttactca aaatgagtgg gtgggtggaa ttctaatttt tattgttaag 25380 ggaagacatt ttaccttgtc tttaattttt tatttttttt taccatttcc ctgccagtta 25440 gagatactat actatactgt cttgaatcct ctgtaggaaa acatggcata gaaataatta 25500 aataataatt agatgttaaa taataatgct gtatgactaa agaacctcct taccccacct 25560 tttctgttgt tgttctgtag taccacaata atcacttgtt aattttattt atttatttat 25620 ttgagaggga gtctcactct cgcccaggct ggagtgcggt ggcgcaatct cagctcactg 25680 caacctccgc ctcccaggtt caagcgattc tccggcctca tactcccaag tagctgggat 25740 tacaggcgcc tgctaccaca tccggctgat tttttgtata tttagtagat acgggctttc 25800 atcatgttgg ccaagctggt ctcaaactcc tgacctcagg tgatccacct gcctcagcct 25860 tccaaagtgt tgggattatg ggtgtgagcc actgcaccca gcctcacctg ttaattttat 25920 gagcaaaaca gattagttgg gcaagtcctt cacatgcata tctcgttgtt gttgtttttt 25980 ttaagacgga gtcttggtct tactccccaa gcaatggtgc gatttcgtct cagtgcaacc 26040 tctgcttcct gggttcaagc tattctcctg cctcaacttc ccaagtagct gggattacag 26100 gcgcccaacc acacccagct aatttttgta tttttagtag agacagagtt tcaccatgtt 26160 ggccaggctg gtctcgaact cctgacctca ggtgatccac ccgcctcagc ctcgcaaagt 26220 gttgggatta caggtgtgag ccactgcgcc tggccacatg tgtatatctt aaaggaaata 26280 atgctaggta atttagtcag gtgcttgatg agcatttgtc atcatcatac ggagtcaatt 26340 tgtctttttc tataaaagtt ctttttgtaa atgattagtt gcttaactgc tttaatttct 26400 tctaggtacc ttacctgtca tcaggatctt tttaccacaa ataagaaacc ttaaagcata 26460 aaacttggtt cagtcttcac atttcttaaa tggaaggaga aagggaataa tagggagata 26520 tctttatctc aaagccaact gttgttgact tttccagtgg caggggtatg atgctaggac 26580 ttcagatttc ctgattcccc atcctagtgc cccttttgcc aaactaggca ggctttcaca 26640 gcttttggag cctaatttaa gtttttcttg ttaagaacag aaaactccat tcatagattt 26700 taatttgtca ttatttgctt atttactgaa aaaaaaaaaa aactattgaa aacaggtgtg 26760 ggttaagttt cccaaaatta ggtttatatt tcaaaacaat tctaagttcc caaggataac 26820 accaaactaa gaggataaat ttttatttta ttttttttta ttttattttt ttgagatgga 26880 gcctttccct gtcgcccagg ctgaagtgca gtggcatgat ctcggctcac ttgcagcatc 26940 cacctcccag gttgaagcaa ttcttctgcc tcagcctccc aagtagagaa aatcttgata 27000 agatttcaga ggcttataag gaacagcagt aaagatgggt gtttttaaag ctagaataca 27060 gggatttttt taagaccctt aagagaacaa acagggtttc aaaatagaaa ggagtaattc 27120 ttgtttggag aagtgaagac atttgggaaa agtttgactt gaggaaggcc attatgataa 27180 ggactgatgt ggtagactct gaaccctgaa gaatctggta ccttaagcct aaaggagggt 27240 agagtgagga cttgtgggaa aggtacagtt atatgggaag acaactgagt gtgaaaatct 27300 attcatgcaa ggctggctct taggctctaa tagaatcttg caagctaact ctagagcaag 27360 tcttttatct ttgggatgaa agaaatttaa ggctaaactt tatacattat aattataaaa 27420 ctataataaa tattagataa tgttctactg aagtataaac tcaactatct ggcatcaaac 27480 agtaactaag ccatgatcac accactgcca ctgtgttctg gcctaggtga cagagcaaga 27540 ccctgtctca aaacaaaatc cagtaactaa agagaggaat aaggggagcg caaggtaagg 27600 cagtacatgt ctgaaggggc agggaaagag ttctttctct acttccaact gggcaaaata 27660 aatcacattt gccctttaga ttggaagagt gaaataagct tttcttgaac atcttttaag 27720 attggagtgt caaatattac caacttattt accaagaatt tggtttttct taaagtctaa 27780 agtgtttact attagctttc cacagggata taggagtttg cagaggttgt agttttttaa 27840 gggaacatca atgaattttc ttgatgcata tgcctgtttc taccatttta cattgttaat 27900 ttgcctctaa aatgagtaac tcttacaatg gggtttaaaa cctgaagact attgattgct 27960 accttgatca ggtttggttt caagtgtgca ccctgtaaga gacaatgtgt ggttttattg 28020 ctattgtcac accagttttt tagatattga aacctgtttc agatttgctt gaattgtgtc 28080 ttgtaagagg aaaatgttaa acttacttcc tctttgagaa cagttattta tagaagacag 28140 gaaaatatga gaatttttaa tagtatatga gagttctctg ttacccaaga aaagagggtt 28200 tttttcaggc atttttaaag aatcataaat cttaaattct ttcactcagt tgctttgagt 28260 ctgtgacctg ttttacaatg gtgatagact gctttctgaa actatgaaat tggtcttgtt 28320 ggcagcatcc tacaaacata aaaagagctt cctgtgtgtc catgctccag tatttttgtc 28380 tatggtagtt atttcacaaa gccaagcgag ttacaaacga aataaaatag tgcttaagta 28440 aagaaactga ataggagaac atatactctc tcttctcaat tttttattta gaaaattata 28500 taccttcaga aattggggaa ataaggcatc agacactcag cttcatcatt ttttaaaagt 28560 ttgctgtatg cgctttatat gtatgttttt tgtgtatgaa ccatttcaaa gtaagttgca 28620 gacaagacag tttgctctaa ataaactcaa tgtctgggca cagtggttga cgcctgtaat 28680 cccaggactt tgggaggcca aggcaggtgg atcacttgag tccaggagtt caggaccagc 28740 ctggacaaca tggcaaaacc ccatctctac aaaaaaagag aaaaatgtca gctaggcatg 28800 gtgggcctgt agtcccagct actctagagg ctgaggtggg aggatcacct gagccctggg 28860 aggttgaggc tgcagtgagc catgattgca ccgctgcact ccagcctggg tggcagagtg 28920 agaccctgtc tgaaaataaa taccctcaat attatcacaa acatacagac tatatttaaa 28980 tttccatagt tgtcaggaat atgtcttttg tcgtctgtgt gttttgttta attcagagta 29040 cattcaagat tcatgcgttg catttcattg ctatatttct ttaatctctt aattcagcaa 29100 agtcacctta tttggaaaaa gacctgattg tgaaagctga gttttatgtg ttttcattga 29160 tcttgttctt tattccttgt caggttactt ttaataacat tgtgttgtaa ttggaataaa 29220 ttattaatac ttttaacatc ttattatgtg tgtgtgtaca tacactttat aggttactaa 29280 tcaggaaaaa gtcttggcta ggtcttaata cagtctttaa atcattgcct ttaagtgggc 29340 ttaaagtttt tcaaaaatgt tctttttgta attctggaat cgaattaaga ttatgcctaa 29400 atctttacct tccttagcta aagcagtgtg gatttggggt tgattctgtt tttttactaa 29460 taatgacgct ctagaactaa aagttaacga ttaattataa ggcaaaaaga aaagagcgtt 29520 cttttttttt ttctaattgc agagtagttt cctgacacta ctaaatgaat attttaaata 29580 aaacaggagt aattctgacc ctctgtgctt ttgtcttata acctgtactt acagtggatg 29640 taattttata ttaaagttta ggggtttttt tttttggtca acaagggcaa acacaagatt 29700 attcaaaggc ttgggagaaa tattacaaga agcaaggtat tgtttttatt agaaatgaga 29760 tgttgggctt ataattgtgg ttacagcaac aaagttcttt tttttcaaag gtcaggcagt 29820 tcctgctccg actggggctc ctccaggtgg tcagccagat tatagtgcag cctgggctga 29880 gtattataga caacaagcag cctattatgc ccagacaagt ccccagggaa tgccacagca 29940 tcctccagca cctcaggtat aatgtaattg ctaatttgtt gatttctact ccagtctgtt 30000 ttctgcatgt ttactgtttg tctgtttggg agtgtttgcc ttttaaattt ttatctggca 30060 aagtataata actatttaaa tgaagtacta cggtgtattg tttgggtttt tttgtttttt 30120 ataatgcttt ccagcatctg agtggtgaat atttctgcaa tgcctttgat tttaaaaata 30180 aattttcttc ccccagggat ttgcaaatca tgcaagaagc caccaccatt tatattaacc 30240 actttttctt tcttaaagga ttcactcctg aattagctcc atttcaagga ttttctttaa 30300 ctttttgtgt atttcttatg tatctcttct gcacagggcc aataataaga agtggacaat 30360 acagtatttg cttcattgtg tgggggaaaa aaacctttgt taaatatatg gatgcagacg 30420 acttgatgaa gatcttaatt ttgtttttgg tttaaaatag tgtttccttt tttttttttt 30480 tttttgaaaa tgtacaaaat atctatcact actgatagga ggttaatatt tctgtgtaga 30540 aatgaaaatt ggtttgtttt tagtatttag tgtagatgta cacattccag caaatgtatt 30600 tgcaattatg tggttgatgc tttgtgatat aaatgtactt tttcaatgta tactttcact 30660 tttaaaatgc ctgttttgtg ctttacaata aatgatatga aacctcctgt gtcggtaagt 30720 tggatatgtg ggtatttaaa ggattcataa tttcttagca atgataaatt aagatacata 30780 tacacaaata tataagcttt ccccatgaaa tattgagttt ttaaacactg gcatgttttt 30840 ccccccttgc agtatagtgg tagattggag gatcttttcc atttattgta ttggctcttt 30900 cagcacaagt aatcctgata tcttcatttt ttttccttct gtttgattaa aaactgcatg 30960 tgtgtacaat gatcttttgg catacttcca ttgcattaac agtgaaattt ccttttatac 31020 atgaccactg tttcagacct gtactgctgc tataacagtt aacctttctg ttcttaattt 31080 gataatactt gatttccaag actgtttcgg cataactaat tttaaacagt tttcagatag 31140 tgaatatgag tagtctaata agaacagttt ttttccatgt gaagcaactc tttcaatgta 31200 tataatgtta gtgtgtttct ttctaaattt aggatagaaa agtgaatagt gtgcaaaaag 31260 tatagctaca ttgcatctgc cattgaaaca taaatggggt atggaaacgt tcaagctttt 31320 tttttttctt tatgcagtat agataagctt tgttttgtaa atgcacaagt ccaatcattg 31380 aatcaactta atttttttat gtacttgaag tcattttatt actctttaac actcatgctg 31440 aagttctgat attttgttga aatccattgt tttactcttt gcatatttgt tggctctttg 31500 catattaata tattagacta catgcaaata cagtctgtct tgccattgtc tgttgaagtg 31560 caggtttgat ccagccagta tagaactagc tctgtagggg tgaggaggac tgtgctgtgt 31620 atcatccttg attgtgttcc ttcaaggagc attgcactgt aagtacatca gaatgacaaa 31680 ttgatgaact gcaacagtat ctttttgtca atgttccaca taatgcaaat gccatacgtt 31740 gtgtgaatat tatgttggaa tacagtgctg atatcttgga aaaccataac tgcctcttaa 31800 tttaacatag aataatacat agttctgtat tttttttaaa gtgagcttaa tgggtaagta 31860 ttttttatat gctttagcta tagctaaaga aaactgatac ttaacaaagt tgaatagtat 31920 tattcactgg tgctcctaaa atattgtttt tcagtgtaaa atatgcatat cttctatatt 31980 taatatgaaa gtcttgaaat gtatcagaca gaaggggatt tcagtttgca aataatgagc 32040 aatgtagcaa ttttaacaca tttcataaat atatattttg tcattggtgg agagcaccat 32100 ttgttgtttt gaatatactt taaaggaaga ggtacaagga cataaatgtt gagattacct 32160 acaggatgga aatagcagta cagttcattg tagatatttt gaaatgtttt tgattgtttt 32220 atataaccta gagtgacttc ccttaccctt atttagatct gcatatatag ttctagtatg 32280 aagtttaata gttaaggagt tagctatttg ttatctttaa gagtagggta ttgacgtgaa 32340 caattgcagt attttgcatg atactgtttt atagatgacc ttttaggaaa gtggtgcatt 32400 tattaattga actgaagaag tagttcagtt gaattcagta tcataattca caaattggag 32460 gctgttgatt ttgattcatt taaggtttaa aatctttatt aattgcaaac agtgcaatta 32520 tttatacttc acagtgcctt cccagacctt ccaccttagg ttctgctgca aaaagcacca 32580 ggtaagcaca acctaaggac atatataaat aaatatttca atacattaat gttgtccctg 32640 tgaggttttt gtggttgtgt attcaaaggc aatctgctac tgcttcccca aaatgtattt 32700 tgttatttta tgctaccatc ttagtggaaa gtctgtaagt tgttaaagca actgtttaca 32760 tttctgggta atgtttttta ttttactttt ttttttttat taagacaaga aaatgatgag 32820 tagattgctg cagtaattga actacatcca aatctttttg tattttttcc ccaaatatag 32880 aagtgttaat attaagaaag gacaattaca cagttttcaa gatttaggaa atcacttgtt 32940 tagaaacttc aacagccttc acaatctgtt ttatatgatg gacagaaaat ttctttgccc 33000 tccaaaatta taatttcttt atttttttct tattcttaaa ctataataat tcagtaagga 33060 tattatgggt tagaatttta ttatgatttt tttcttagac aaaagttata tgctgaagaa 33120 ggaaaaagtt ataaggcagt atgttttgat aaaaggcatg tgcatcagtg aaatgttaac 33180 tgtatagcaa ataacctttc ataatctgta gcaatcagta tttttctgat ttaataatat 33240 tttaataact gacgctgcat ttaatttttt tgccagttta aaatgtttgt gtgtttttat 33300 agatgatttt aactggtaca tattttgagt taagttgaat gtatgaaagc agcatcttat 33360 cagttttgtt tattcgattt ctaaaatgtg ctgatccttt taaaactcct gcttatctct 33420 gcaacaaaga aaaatattca aaaatactgc cttcattttc acacacagtg ctgaagatgc 33480 tgcaagcacc aaatcatagc tcataaaatc aggtcctgag atagttaccc ataaagagga 33540 atcctttgag tgtatgccat tggtgagccg atgagcatgg accatagaag ggctcaatgt 33600 agaaggtaaa attggcaaat cataattgag aaatatgaaa tgtattccca tacataatat 33660 ggtatagggt gtaatgtacc tgcttttgat cacttttcat tttaaagtgc tattcacttg 33720 atcttaaatg ttccatgaac tgttaaattt cttaagttac atagttacta caccacattt 33780 atgtgtatgt tatgttttaa tagtcaatga taggtatgta caattgataa tataaagggg 33840 ctcattgaaa cttgagagcc tgttgagttt tggttagttg tagattgcat ttttataaaa 33900 aaaaatacag atagattgat gataatagat attggggcat tgtttctgtc tcatgagaat 33960 tcttttattc attaccataa gccttcactg atactataag cattatttta aatgacgctg 34020 atcttaagtc tgaaataaat ggaaagcaga aaaggtgagc cagttgattt gaatgcattg 34080 gatattagtg ttagaaacaa tgtatagttt agattgaaac tgaactgact tatttagcac 34140 ttaaacaaaa atttgacaat gtttttagtt ttttttaaga cagcttagtg tggtgatact 34200 tagaattcta tggtttgatg tttcttttag aaatgagaag tatagtttta ttttttaata 34260 taaaaaatgg ttttaatact aaaactagta atttgatact agttgtttat aaacattgta 34320 aaatatatct tttaaacaaa ttatcttggt agttaattca taagggtggg tttgggtagg 34380 aatagcagag tactttcaga gggaaagggg agtcattcag aagtgatagc attttatttg 34440 tttgaatact ctgccagtaa aatcagctgt acttagaaag ttatctgttg tgtagaataa 34500 tgatgtagag tttactaatc agtgaggatg tcttgttttt attttctgca aactctgcct 34560 cactttaaaa tgcattataa caatacctaa ttaaagataa ttttggctct gaaagttacc 34620 ttattttttg ttgagttagt gacttcattt ttcttgccac aatataagct tttgagggat 34680 ttttttaaat tggtgctttt aataagcaaa taaatcccag ggttttattt tcttcagtga 34740 tacccctata gaaactctta aatgtatttg cgcatatata tatatatatt ttcttatgca 34800 tgctcgatgc attttcgtcc tgagaaaaat gttctctaca gaaactaccc gtgtgtaaaa 34860 agaagattgg cttaaaatgg ctactgtgat gggaacagtg tcttagggag atgcagcttg 34920 gacttgaggt aaattgaata ctttacaact gtggtttaga gtttgcttta atgacattgt 34980 atgtaaaagg tcacatgatt gctgtaattt tgtattcatt atggtttcct caataaatgt 35040 acattgatga ctatta 35056 <210> 2 <211> 1968 <212> DNA <213> homo sapiens <400> 2 atggcagact attcaacagt gcctcccccc tcttctggct cagctggtgg cggtggtggc 60 ggcggtggtg gtggaggagt taacgacgct ttcaaagatg cactgcagag agcccggcag 120 attgcagcaa aaattggagg tgatgcaggg acatcactga attcaaatga ctatggttat 180 gggggacaaa aaagaccttt agaagatgga gatcaaccag atgctaagaa agttgctcct 240 caaaatgact cttttggaac acagttacca ccgatgcatc agcagcaaag cagatctgta 300 atgacagaag aatacaaagt tccagatgga atggttggat tcataattgg cagaggaggt 360 gaacagatct cacgcataca acaggaatct ggatgcaaaa tacagatagc tcctgacagt 420 ggtggccttc cagaaaggtc ctgtatgtta actggaacac ctgaatctgt ccagtcagca 480 aaacggttac tggaccagat tgttgaaaaa ggaagaccag ctcctggctt ccatcatggc 540 gatggaccgg gaaatgcagt tcaagaaatc atgattccag ctagcaaggc aggattagtc 600 attggaaaag ggggagaaac tattaaacag cttcaggaac gggctggagt taaaatggtt 660 atgattcaag acgggccgca gaacactggt gctgacaaac ctcttaggat tacaggagac 720 ccatataaag ttcaacaagc caaggaaatg gtgttagagt taattcgtga tcaaggcggt 780 ttcagagaag ttcggaatga gtatgggtca agaataggag gaaatgaagg gatagatgtc 840 cccattccaa gatttgctgt tggcattgta ataggaagaa atggagagat gatcaaaaaa 900 atacaaaatg atgctggtgt tcgcattcag tttaagccag atgatgggac aacacccgaa 960 aggatagcac aaataacagg acctccagac cgatgtcaac atgctgcaga aattattaca 1020 gaccttcttc gaagtgttca ggctggtaat cctggtggac ctggacctgg tggtcgagga 1080 agaggtagag gtcaaggcaa ctggaacatg ggaccacctg gtggactaca ggaatttaat 1140 tttattgtgc caactgggaa aactggatta ataataggaa aaggaggtga aaccataaaa 1200 agcataagcc agcagtctgg tgcaagaata gaacttcaga gaaatcctcc accaaatgca 1260 gatcctaata tgaagttatt tacaattcgt ggcactccac aacagataga ctatgctcgg 1320 caactcatag aagaaaagat tggtggccca gtaaatcctt tagggccacc tgtaccccat 1380 gggccccatg gtgtcccagg cccccatgga cctcctgggc ctccagggcc tggaactcca 1440 atgggaccat acaaccctgc accttataat cctggaccac caggcccggc tcctcatggt 1500 cctccagccc catatgctcc ccagggatgg ggaaatgcat atccacactg gcagcagcag 1560 gctcctcctg atccagctaa ggcaggaacg gatccaaatt cagcagcttg ggctgcttat 1620 tacgctcact attatcaaca gcaagcacag ccaccaccag cagcccctgc aggtgcacca 1680 actacaactc aaactaatgg acaaggagat cagcagaatc cagccccagc tggacaggtt 1740 gattatacca aggcttggga agagtactac aagaaaatgg gtcaggcagt tcctgctccg 1800 actggggctc ctccaggtgg tcagccagat tatagtgcag cctgggctga gtattataga 1860 caacaagcag cctattatgc ccagacaagt ccccagggaa tgccacagca tcctccagca 1920 cctcagggat ttgcaaatca tgcaagaagc caccaccatt tatattaa 1968 <210> 3 <211> 1935 <212> DNA <213> homo sapiens <400> 3 atggcagact attcaacagt gcctcccccc tcttctggct cagctggtgg cggtggtggc 60 ggcggtggtg gtggaggagt taacgacgct ttcaaagatg cactgcagag agcccggcag 120 attgcagcaa aaattggagg tgatgcaggg acatcactga attcaaatga ctatggttat 180 gggggacaaa aaagaccttt agaagatgga gatcaaccag atgctaagaa agttgctcct 240 caaaatgact cttttggaac acagttacca ccgatgcatc agcagcaaag cagatctgta 300 atgacagaag aatacaaagt tccagatgga atggttggat tcataattgg cagaggaggt 360 gaacagatct cacgcataca acaggaatct ggatgcaaaa tacagatagc tcctgacagt 420 ggtggccttc cagaaaggtc ctgtatgtta actggaacac ctgaatctgt ccagtcagca 480 aaacggttac tggaccagat tgttgaaaaa ggaagaccag ctcctggctt ccatcatggc 540 gatggaccgg gaaatgcagt tcaagaaatc atgattccag ctagcaaggc aggattagtc 600 attggaaaag ggggagaaac tattaaacag cttcaggaac gggctggagt taaaatggtt 660 atgattcaag acgggccgca gaacactggt gctgacaaac ctcttaggat tacaggagac 720 ccatataaag ttcaacaagc caaggaaatg gtgttagagt taattcgtga tcaaggcggt 780 ttcagagaag ttcggaatga gtatgggtca agaataggag gaaatgaagg gatagatgtc 840 cccattccaa gatttgctgt tggcattgta ataggaagaa atggagagat gatcaaaaaa 900 atacaaaatg atgctggtgt tcgcattcag tttaagccag atgatgggac aacacccgaa 960 aggatagcac aaataacagg acctccagac cgatgtcaac atgctgcaga aattattaca 1020 gaccttcttc gaagtgttca ggctggtaat cctggtggac ctggacctgg tggtcgagga 1080 agaggtagag gtcaaggcaa ctggaacatg ggaccacctg gtggactaca ggaatttaat 1140 tttattgtgc caactgggaa aactggatta ataataggaa aaggaggtga aaccataaaa 1200 agcataagcc agcagtctgg tgcaagaata gaacttcaga gaaatcctcc accaaatgca 1260 gatcctaata tgaagttatt tacaattcgt ggcactccac aacagataga ctatgctcgg 1320 caactcatag aagaaaagat tggtggccca gtaaatcctt tagggccacc tgtaccccat 1380 gggccccatg gtgtcccagg cccccatgga cctcctgggc ctccagggcc tggaactcca 1440 atgggaccat acaaccctgc accttataat cctggaccac caggcccggc tcctcatggt 1500 cctccagccc catatgctcc ccagggatgg ggaaatgcat atccacactg gcagcagcag 1560 gctcctcctg atccagctaa ggcaggaacg gatccaaatt cagcagcttg ggctgcttat 1620 tacgctcact attatcaaca gcaagcacag ccaccaccag cagcccctgc aggtgcacca 1680 actacaactc aaactaatgg acaaggagat cagcagaatc cagccccagc tggacaggtt 1740 gattatacca aggcttggga agagtactac aagaaaatgg gtcaggcagt tcctgctccg 1800 actggggctc ctccaggtgg tcagccagat tatagtgcag cctgggctga gtattataga 1860 caacaagcag cctattatgc ccagacaagt ccccagggaa tgccacagca tcctccagca 1920 cctcagggcc aataa 1935 <210> 4 <211> 39750 <212> DNA <213> macaca fascicularis <220> <221> misc_feature <222> (1246)..(1266) <223> n is a, c, g, or t <220> <221> misc_feature <222> (2077)..(2131) <223> n is a, c, g, or t <220> <221> misc_feature <222> (2666)..(2690) <223> n is a, c, g, or t <220> <221> misc_feature <222> (3304)..(3345) <223> n is a, c, g, or t <220> <221> misc_feature <222> (3869)..(3870) <223> n is a, c, g, or t <220> <221> misc_feature <222> (6076)..(6076) <223> n is a, c, g, or t <220> <221> misc_feature <222> (6091)..(6093) <223> n is a, c, g, or t <220> <221> misc_feature <222> (6159)..(6183) <223> n is a, c, g, or t <220> <221> misc_feature <222> (6259)..(6277) <223> n is a, c, g, or t <220> <221> misc_feature <222> (6869)..(6906) <223> n is a, c, g, or t <220> <221> misc_feature <222> (7072)..(7139) <223> n is a, c, g, or t <220> <221> misc_feature <222> (7714)..(7714) <223> n is a, c, g, or t <220> <221> misc_feature <222> (11374)..(11394) <223> n is a, c, g, or t <220> <221> misc_feature <222> (11454)..(11491) <223> n is a, c, g, or t <220> <221> misc_feature <222> (12562)..(12562) <223> n is a, c, g, or t <220> <221> misc_feature <222> (12699)..(12742) <223> n is a, c, g, or t <220> <221> misc_feature <222> (12793)..(12794) <223> n is a, c, g, or t <220> <221> misc_feature <222> (13648)..(13656) <223> n is a, c, g, or t <220> <221> misc_feature <222> (14247)..(14261) <223> n is a, c, g, or t <220> <221> misc_feature <222> (14474)..(20234) <223> n is a, c, g, or t <220> <221> misc_feature <222> (21758)..(21789) <223> n is a, c, g, or t <220> <221> misc_feature <222> (23223)..(23225) <223> n is a, c, g, or t <220> <221> misc_feature <222> (24454)..(24512) <223> n is a, c, g, or t <220> <221> misc_feature <222> (24563)..(24589) <223> n is a, c, g, or t <220> <221> misc_feature <222> (25270)..(25338) <223> n is a, c, g, or t <220> <221> misc_feature <222> (25723)..(25734) <223> n is a, c, g, or t <220> <221> misc_feature <222> (25857)..(25857) <223> n is a, c, g, or t <220> <221> misc_feature <222> (26517)..(26523) <223> n is a, c, g, or t <220> <221> misc_feature <222> (27589)..(27590) <223> n is a, c, g, or t <220> <221> misc_feature <222> (27660)..(27688) <223> n is a, c, g, or t <220> <221> misc_feature <222> (28733)..(28733) <223> n is a, c, g, or t <220> <221> misc_feature <222> (30266)..(30266) <223> n is a, c, g, or t <220> <221> misc_feature <222> (30317)..(30371) <223> n is a, c, g, or t <220> <221> misc_feature <222> (30453)..(30768) <223> n is a, c, g, or t <220> <221> misc_feature <222> (30833)..(30837) <223> n is a, c, g, or t <220> <221> misc_feature <222> (30906)..(30912) <223> n is a, c, g, or t <220> <221> misc_feature <222> (30997)..(30998) <223> n is a, c, g, or t <220> <221> misc_feature <222> (31271)..(31562) <223> n is a, c, g, or t <220> <221> misc_feature <222> (31697)..(31697) <223> n is a, c, g, or t <220> <221> misc_feature <222> (31707)..(31782) <223> n is a, c, g, or t <220> <221> misc_feature <222> (32257)..(32257) <223> n is a, c, g, or t <220> <221> misc_feature <222> (33477)..(33478) <223> n is a, c, g, or t <220> <221> misc_feature <222> (37353)..(37427) <223> n is a, c, g, or t <400> 4 gagatttcgt tccttcagtc tccacccctt tacggcacga tggtcgcgca agaatgtgat 60 acagcttcga cggccgccat tttctttctt tcttagctgt tagctgagag gaagtctctg 120 aacgggcggc agcggctagc gtagtgtaac catggcagac tattcaacag tgcctccacc 180 gtcttctggc tcagctggtg gcggcggtgg cggcggtggt ggtggaggag ttaacgacgc 240 tttcaaagat gcactacaga gagcccggca ggtaagtgtg gaccgcgcgg cggaatcccg 300 aaagctcacg gtaattggcc gctgactgag taggccgcta ccctttagcg catgaggaag 360 aggaaagagg tgtccttccg ggctgaaatg tgaggagaca cgtttcccct tgttggtaat 420 aaagattaga gaccagaact cagttttgtg ttcttggtgt gtaatccact tagaaccccg 480 acgcgtgcta cgcaaaggcc tgaagtcttt ctcccgcttc tgcggcactc gtgtgtcgcc 540 agcgagctag cttagcctcc ccttttcctc gagatgaaga tcctcttcca ggggataaag 600 cgcaggtagt ttcacacaat ttaatggaag gttctggtaa tcagtttggg aaagaactag 660 ggtcggtctc ctggagccat agcaagggaa gggatttgtc gttaaagtag cctttacagc 720 tcatttccgt tccctctcgc aattaaaacc gctttccgta cctttcacct tctcacctct 780 acaaggaagg gacttgaaag ccgtcttttt ctgggcggga tttacgcgtc agtctgttct 840 aacagtcagt cccccttatt tctcaaaatg gcctcaggcc cattatacca gaggtttcaa 900 tttgaatctg cctctctgtt aagagtcgta aactgaccag acctctttgt attacgtagt 960 gcgtacattt gccctgaaga caccactttc ccagacgaaa gctgttaaaa tagtgcgagt 1020 attccaggaa aatagaagat ttcttaattt gaactttaca tttttagata gtcccctaat 1080 atatttaaaa tttcaaaatg tatggtgttg gtatggattt gcatgtaagc aaaagaattc 1140 tattctctat gacactatgc atgttgtact aggtgctgga catttttact agtgttaagc 1200 taatggtagg tagaaaccag tgttgtgctg tgttttcatt gcattnnnnn nnnnnnnnnn 1260 nnnnnncggt acagttaaag gaacattgag tcaaaatcag aattcataaa atccgttgta 1320 acatacctaa tgtgaacaca ttatcaacat gtacctgtac ttgtttataa ccagagatat 1380 tagaggtagt caacaaaagg ttatcattaa tattagttct gcggtttttt cacataattt 1440 aagaaattct gaacatgttt agcagcaagc atttgtataa ctatgacaaa cactgttagc 1500 gcgttttatt agattgattt gtaaaactta actattgtat ttattggaac caactatttt 1560 attttactag aaccagcaca ttggattact tagtatcaaa cactgtaggt agatactgga 1620 gttttgtttt gttttgtttg agacggagtc tccctctgtc gcccaggctg gattggagta 1680 gcgtggtgcg atctcgtccc actgcaacct ccgcctccgg cttcaagcaa ttctcctgcc 1740 tcagcctccc gagtggctgg aattacaggc gcccgccacc gtgcccggct aattttttgt 1800 tttgtttttg ttttttaagt agagacaggg tttcaccatg ctggccaggc tggtctcgaa 1860 ctcctgacct cgtgatccgc ccgccttgac ctcccaaagt gctgcgatta cagcagtgag 1920 cccggccttt tttgttgttg ttgtttaaat gcatgaattg tttcctacta agaagctatg 1980 atatagttcc ttgaccaaat gcagatgaac aggattatct gataaattga ttaacgagag 2040 cagacaaaat acgggtattt aattcatctg ctcattnnnn nnnnnnnnnn nnnnnnnnnn 2100 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn ngttgggagg ggatacccag cttcctaagt 2160 aaaggagtga tatttgagca aggcattata gaataaatga gagtttggcc agtagggaaa 2220 agaagcagca tgcggagagg tatgggacgt gggggaatga caagaaccca gaattgaagt 2280 cactagaaga tggtggtggg aggacgtgaa acaaggcaag gaaaggtaca agcggatcca 2340 gatactggaa gactttgtgt tgcaatgctt taatgaaaaa ttggatttcg ggccgggttc 2400 ggtggctcat gcctgtaatc ccagcacttt gggaggctga ggcagacaga tcacttgaag 2460 tcggggttta agaccagcct ggccaacatg gtgaaacccc atctctacaa aaaatacaaa 2520 aggtagccgg gcttggtggc ctgtgcctgt agttccagct acttgggagg ctgaggcaca 2580 agaattgcct gaacctggaa agtggaggta gcagtgagtg gagatcatgc tgctgcactc 2640 cagcctgggc atagagcgag accctnnnnn nnnnnnnnnn nnnnnnnnnn ggttttatta 2700 ttaggctaag ccataatttc tttctacttt ttaaaataca gaaattgcca tcaaactgaa 2760 atttattgtc ttatatgcta ataggtcagt tgttctgtct ttactgtaat gatttcttta 2820 tgaaaatgat cttaaatctg agattcctaa ctttggcttt taactagaat tacccattac 2880 atttgatgat gtctttaaat gtcagttgta gctattagtc tgataatatg tgtggaatat 2940 acagaagggt atttagacag aagttaggtt aacatctgaa ctacttcctc cttgcgtatt 3000 taagagaata ttgagttagg tttctagaat cctcaactaa ctctaagttt attttctttg 3060 tctagaatac tatgctgttt ttgtttttgg aaggaagaga tataagaaca gtttgctgct 3120 ctcaaggagc ttcaaaggct gtaccagtgg ggatgccatt ggtatattta gctggatagt 3180 tgttattcag aaaagcagga caagtaattt tgattcctgg tccgtacttg gtaatgtcag 3240 taatgttaac tctagctggt tgttgacatc tggtcattta gttgccaatt cctttttttt 3300 tttnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnntattc tgagctcaat 3360 tcaacacagg gacaccaggt tgctgctttt gttcatggtt tccagcctgt gcacttaaga 3420 aatttatttt tatgtatttc aagctgtaac tccagagatt gggattgttt gattgcgtcc 3480 ttagcagtga tactaatagc aacttctgtc tctagaacat tggaaaatta aaatgtattt 3540 atctaccgtt ttttcccttg aggttatatg aaggtagaaa tgaatcagac tagatgatta 3600 gctaagcaaa actgttaacc ctcatccctt cccctctaga caactatgaa attagtcagt 3660 atgtattcga tccttcttgc aatctcttct ctgacaatta taaaagtgat tcaggctgca 3720 taatgttgtt tgaatgaaat gaaaatacag actagagctg tttttggttt tgtttttttt 3780 tttatttacc atcagtctgt tcagtgaaaa ctaacattta agcatgattc tttttaaaaa 3840 tcattttgtg acagtttagc agggcttgnn tgataagcaa actatggtat ggtaatattt 3900 ctagtgtgca cgtttcttca catgtctggt atatgggaac tctaactcca tcaggacttt 3960 gcctatagta ggtactcagc atttactgaa ttaaatcaat aaacattttt gatgaattaa 4020 agtacaagtc agacctctgt gtctgtgggc tctgcatctg caaattcagc caactgtgga 4080 tcaaaaatat tagaaaaatg gaatgacggt ccaacaatac aagtaatacg aatgaaaaca 4140 atacaactat gtacattgta tcaggtatta taagtaattt agagatgctt taagtatacc 4200 aaaggatttg cataggttgt atgcagatac tgtaccattt tgtgtaagga acttgagcat 4260 ctgtggattt tggtatttgc atggttcctg gaaccaatcc ctcagggaca ctgagggact 4320 atagttggtc ataccacctg attttagaga ttttctgatc ctcagaagtt aattaagtaa 4380 actacagtag tctgttctta acctcggagg atacattcca agaacctcag tgaatatctg 4440 aaaccacata tagtattgaa tccgatatat acacggtaat attttttcct atacatgtgt 4500 atctataaag tttaaattct aaattagaca tagtattaac aataataata aattagaaaa 4560 agactgggca tagtggttca cgcctataat cttaacactt taacttttaa ctatgacgtt 4620 gtcttgaaaa agaaatcagc cagccaaggt ggctcatgtc tgtaatccta gtgttttgag 4680 aagctcagtc aggaagtttg tttgaaccca ggaatccgag accaccctag gcaacatggt 4740 gaaaccttgt ttctataaaa aaaaaccaaa aaattagcca gacctggtgg tgcatgcctg 4800 tagtaccagc tacccaggag gctgaggtgg gaggagtgct tgaacttggg aggtcaagtt 4860 tacaatgttg acaatgttgg gtcctttacg tagttgtgta agtgagccat gatcatgcca 4920 ctgcactaca gccttgggca acagcctgac cctgtctcaa aattttaatt taattttaaa 4980 aatgaaatag aacaattaca acaatacgct gtattactga caagaagggc aaatttttaa 5040 aaaaccaata tgctgtaata agttatatga ataaggggat cctcccctac cccagaatat 5100 ctgattgtac tataccgtag gtaactgcaa ccgtggagag caaaaactga agatactgtg 5160 tcttaagttt ctttttcaac tcccaaattc ttggatttct cacgtcttgg cttcctcagt 5220 agaggtgaga aatgctaaaa cagtgaaaac aggaaaaata acttactcat tcaagaagtc 5280 gattatggtc cagatggaaa atttgaatta tttttgtaaa actaaactaa agtagccagg 5340 caccgtggct cacgcctgta atctcagcac tttgggaggc tgaggcgggt ggatcacttg 5400 aggtcaggaa ttcaagacca gcctggccaa caaggtgaaa ccctgtctct actaaaaata 5460 caaaaattag tcaggcatgg tggcgggcac ctgtagtccc ggctacttgg gaggctgagg 5520 tgggagaatc gcttgaacct ggggtgtgga cattgcagtg agcccagatc acgccactgc 5580 actccagcct gggcaacatt gtgagactac aaaaaatata atagtaagta aagtaaaaag 5640 tttcccatac ttgataaatg tctaataaaa attgaatatg ttctaggact ctgaaaaagg 5700 agttgaatat agttggaggt tggtttttag gaattatttt tcttaaatta attatccttg 5760 tagtcaccta ggaattgtat attttctgtt gatcttagaa aattgatcaa atctatagtt 5820 cattttgttt tttcaatttt tttttaaaga gatggggtct tactgtatta atgttgaact 5880 cctggcctca accaggtctc ccacctcagc ttctgaagta actgggattg caggtgccac 5940 tgagccaggc tcctttattg gtatttttat taaaagcttt tctctaatgt ctttgtaaca 6000 gttctcaatt tttgaaatgg tgttactcat tctttagagt aaactgtcaa ctttcatttt 6060 cttttttttt tttttntttt ttctttcttt nnnttgagac ggaatctcgc tctgtcaccc 6120 aggctggagt gtagtggtgg gatctcggct cactgtgann nnnnnnnnnn nnnnnnnnnn 6180 nnntctcctg cctcagcctc cagagtagct ggaattaacg ggcacgtgac accgtgccca 6240 gctacttttt ttttttttnn nnnnnnnnnn nnnnnnngat gggggtttca ccatgttggt 6300 caggctggtc tcgaactcca gacgtcaggt gatccaccca cctcagcctc ccaaagtgct 6360 ggtattacag gcatgagcaa cagcgcccag cctcaacttt cattttcatt tggttagttt 6420 ttgaactatt cagtgggtaa ggttgtataa atgtcttttc tctgtataga agtttcttgg 6480 agttcaagga gtgctacttt gcaaactcat agagtattta taaaagctaa ctgcagaagg 6540 tgttcatagg ctaaaccgtt tcctattctt ggtagcacca ttttctctgg cctgaaatac 6600 tttccctcta ctattagtgt ctgtcagtgc ccagcagtgt atttactttc ctgaggaaca 6660 attcaaatgc taagtgcttt aagacctaag ggtggaaaag cagtgttttc aggcattatt 6720 aggaaaataa gattttaatt agacacccag aaacaaaaac aggtttgtaa ttggtaaagt 6780 gaaagatggt taaagaaggt tagattgacc aaagctagag tttttctttt tttctttttt 6840 tttttttttt tttttgagac agtgtctcnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6900 nnnnnnggct agctgcaacc tccacttcct gggttcaaac agttctccca cctgagcctc 6960 ctgagtagct gcgaggcatg tgtcaccatg ctcagccatt ttttgtgtgt ttttagtaga 7020 gactgagttt ctccatgttg gtcaggctgg tctcgaactc ttgagctcag gnnnnnnnnn 7080 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnt 7140 gtaccttttt ttaatcgagc aatctagttc ttgatcctaa tagtctttgt ggtgggtgtt 7200 tgcattttta gatgaggaaa agggaaatct aggagtccta ggaaatacag ttggtatatg 7260 ggaactgata cgtaattaga cttaagcaat ccatgttgaa tttgtgactt aagcacttaa 7320 ctataaattt accctctcca gttgtctgat gataatcaaa acttgaagca gttatccata 7380 ttgggatctc tttggggaat cccagtcacc aaaagttagg ttttctttaa tattttttca 7440 tggaagtttt caaatatact caaaattgaa agaattatgt aataaattct catgagccca 7500 tcacacatct tcaataatga atgtacagca ttgcagtgtg gagcttggcc tattgctgac 7560 cactcatcaa tgtggcagaa ccactccatg gttccccatg gaaatgggag ctacttcagt 7620 tctcttttta cagaaaaatt caataaatat ctactgattg tgccctactt gtgacttgaa 7680 gccaggtttg tttgttgttg tttttctttt tttntttttt tttttttttt actagtcttg 7740 ctctgtcacc cgagctacag tgcaatggca tgatatcagt gcactgcaac ctccagctcc 7800 tgggttcaag tgattctctt gcctcagcct cccgagtagc tgggactatg ggcgtgcacc 7860 acaataccta gctaattttt gtatatagta gagatagagc ttcatcatgt tgcccaggct 7920 gctctcgaac tcctgagctc aagcagtcta cccacctcca cctcccaaag tactaagatt 7980 acaggcatga gccaccatgc cagcaaagct gggtatttct taaatttgtt cagtcaggtg 8040 caagaaatta tttgccctac tctgaaagtt aaaaatattc taagagaatt atggtttcgc 8100 agctggggtt ttttaagact tgagctcctg gggctcctgc atatatcctt agaacaacat 8160 tgtccagtag aagtacaatg taagccatgt tttgtttaac ccagcatatc caaaatatta 8220 ccccttttgc atgtgcttaa tataaaaaat taagatgatt tctattccag gttttcaata 8280 ttcagtgagt aattttacac ttagagcaag tgtcatttca gactagtcac attttgagta 8340 ctcagtaacc acatatgggc tagtgctacc ttgctagata gcatagcctt tgggtcccac 8400 aaagtgttca cattctctgt ttacacacat cttttgaagt gtcatgagag agagccagat 8460 aggatccaga ttttctttat atctgtttgg tctgtcttac ggattcctag ttgattattt 8520 ctttgttgct tcttataggg atgtatcaga agcttaataa actcatgatt attatgttaa 8580 ctgcctgaag tattaatttt agcaacaaat tgaactataa ttttaatttt tcaagtaaat 8640 tttcttatgt gatactaagt atttcatata tacatgtatt agaagtaaat gggagtttag 8700 taatgaatag tatatagtag tttgtgatta tatttttctg tttttttttt ttagattgca 8760 gcaaaaattg gaggtgatgc tgggacatca ctgaattcaa atgactatgg ttacggggga 8820 caaaaaagac ctttagaaga tggaggtaag ttatactcat acgtatttta aattgttttt 8880 cagagtgttt agttgaagtg gttctcagta ttttttgtta ttctattgag acattacttt 8940 tattataaga ttgttaaaac tgtaaggtgt atattggcct aaaggggggg aagagaccta 9000 gagaaggtaa gtaaaatttc agtcaaccag aaagttttgt cttactagaa aacagtttat 9060 tttccctctt ttaggattgt gccagattga aagtttgcac agacgtcttg ttaataatat 9120 taaaaaaaca aaaatataaa ttgcttagaa gacacttcac tggttttact catacatgaa 9180 tggattttaa tatgctgtgt tttcgtcatt tttctatttg caattacact ttaaaggtcg 9240 aaattcgtat tgtttgctac tctagtgtgt tgcaggttat accgtttttt ttaatgttct 9300 ttgcttttag tacttttgtg tttcacgttt agctgtaaac ctatagatta aaacagtggg 9360 ttcacagtgc tttgtagttt taaaaatcat aatcattgaa gcttctgaac ttagaagtct 9420 gcatgtattt tttgttttag gtttgatgta tgagttttga tacattttct ttttaccctt 9480 ttttttaaag gaaggattct cactgaggct atagaatgta tttgtagctt ttgaccagga 9540 gaactttgtt tcctttattt aagtgtcttt catatttata gtgaggtttt taatataaaa 9600 aaaaaaaatg agctaatgat gcttcagatg ttgtatgtaa tgtattcttt ttattttatg 9660 tgtagatggc tcttggacaa gtccgagcag tacaacacac tgggagggaa tgccctctcc 9720 ttttaaaggc aggaattttt atttattacc tgtgttcagt atgtaaacgt gaaataaacc 9780 agtggattct taaatggaca caaatatttc ttggattatg tgtctgaatt tttgctgcac 9840 aacattctga tggttaatca tttaagtttg aaggggggag gagaatgtag tactttgagc 9900 tataggttgt ctgttccaag gtatgcattg tattcatctg tgtaatggat ttagatgaag 9960 gtagtcatgt agttgccttg agtttttttg ttttttgtgt tttttttgct aaagttttat 10020 acagtgaaat gtttgtttat aaataataga acagtttaag ttgagattgc cttgtaatgt 10080 tgtggggttt gttttttttt ttaatttttt ggggcatagc tttgtggtca ctgtccgata 10140 tactcaactt ttaatatgtc agatttttgt agtttgatac gcttttttcc ccccagtctt 10200 cagttcctga ggtggaagca tcattagcct ttagcatgtg atattttgct agtaatggac 10260 ctaaagtact ttgtcttgta tcattctaat gtgcataaca tacattaagg tcagtgattt 10320 gttaagaatc agataactat tttaatgtct gtgcatcttt tgaatgtgaa gagaatgaag 10380 tatagtttct tttttagatt actgagtttg tgttgaattt tggcagtttt ggttcaaatg 10440 ataaaccgta ccttcagata tttcaataaa tgtttatatt tattcttgtt tgggagggga 10500 gaagctttgt acttaattgg taaaaaatta aaagacactt aattttgcag atcaaccaga 10560 tgctaagaaa gttgctcctc aaaatgactg taagtattcc ttttaaactg ggtcaaaagc 10620 tatattaaga ttttgttcat attattgggt atctttgaag ttagttggtt tatgagtatt 10680 ttggatcagc tagcctgaac ttctttgtaa atatgtacct ttttctccta ttttacaatc 10740 tgtcccatta attgtggcca ggtatatgta aggattggtt gccgaattat tttacatatt 10800 taacaactcc aattcttgat ctacgcttgt acaacttgaa aaaggaaatt atattgttct 10860 gtgccattgc taatataatg tcttcccttt cattggctct cttacccctg tcagtgccaa 10920 tataaatatt ctgtataaaa tttgactctc ttcaaggtgt tgtctgtgca ttagggaaag 10980 gtttttgaat gtttgatgtg attttgttgt taaatacata agtaacttta aattttgaat 11040 tttcgtttta tttttattta attttttgat agcttttgga acacagttac caccgatgca 11100 tcagcagcaa aggtatagtc acaaactttt caaaaagtac tctgcaagtt ttggttgagc 11160 tgcatgtaaa aacacaacca cattggtata tattgaatat gtgtctgtat tttttggtgt 11220 acctagttca tatcactccc cttgggaagg taccataaag tgatgatttt tcttttgagt 11280 gagaaaaatt tgtgatttgg agagagagag ggaattagcc acagtttaga agaacagggg 11340 tgaattagag taactgttaa gatgacattc tctnnnnnnn nnnnnnnnnn nnnnacagtt 11400 catgccttca gactgttcca ttgatcatcc cttcttcact tgatgtatca tctnnnnnnn 11460 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nattttttga catgagtctg agcatagaac 11520 cttagtttaa gccattggga gacattagac ttccattttt attaatagat tatcttttat 11580 ttgtaaacaa agtatctttc actgaaggaa aaatggtact ttctgttact ttttagcaga 11640 tctgtaatga cagaagaata caaagttcca gatggaatgg ttggatttag taagtaactt 11700 gatttttaaa gttttgaaaa catgatcaaa acatacttta gaatctttca accaaaaaaa 11760 cttttttttt ctaactagta attggcagag gaggtgaaca gatctcacgc atacaacagg 11820 aatctggatg caaaatacag atagctcctg gtaatgttac attctcttgg tattttcaga 11880 gtgactagaa aagtagcttt ttttttttct tttaggtttc tagtactaat aatgctgcct 11940 ttaatctttt gacctgaagt tctatttttg ttttaaattg tagacagtgg tggccttcca 12000 gaaaggtcct gtatgttaac tggaacacct gaatctgtcc agtaagtttg aaaatcttta 12060 aaatggactt aaagtaacaa cgggagaact ctttgaattt tctctctgct ctttgttact 12120 gctttatttt acactactct ttcgttgcct ccttccctcc caagtcctct gactcctttg 12180 aagtttatgc ctcatgcctt tctcaattag ggtttatcat taaacacaga aaatggttaa 12240 aacaacttca tatctactcc agtctctact tacaaagcga agtgtagcct ggaggagaat 12300 gcgcagtaat gttgactggt gacacctaaa actcagacat taagctcaag tggactgttg 12360 tgttgtctgc atttccctag ttccattcac ttttccattc ctctccaagg ctctttaata 12420 ctatatttcc ccatctccaa atcttcagca tctaacccca cctctctcct tcttaagctt 12480 atttacggag aaaatggaaa cgaatgataa gaagcttttc ttttccccta ccgctaaacc 12540 taccagcctt catttttttt cnctgttcac atagtactca ggtaattgct ttcctttgtg 12600 ttcatgtgcc taaagccagc cctttcttcc tattgaaggt tcagcctgca gttgtacttt 12660 cttctgcgtt attagttccc cccctttact agatttttnn nnnnnnnnnn nnnnnnnnnn 12720 nnnnnnnnnn nnnnnnnnnn nntgcaggtg catgccacca cacccagcta atttttgtat 12780 ttttttagta ganncagggt ttcaccatgt tggccaggat ggtgtcaatg tcttgacctc 12840 gttatccacc cgcctcggcc tccccaagtc ctgggattat aggcgtgagc cactgccccc 12900 agcctgattt tctttgtagc actttccaaa taatacgtta ttcatttgac atgttatttt 12960 tacttatttt aatgaaacga agccactcca gcaggaaccc tgtctctttg agtgttacca 13020 ccccattacc taaaatggca cttgcacatg gttgatattt aagtatttgt tgaatgaata 13080 attgtagcat atgagtaagt aaaatggtag tttaaaaatg taaataaata aatcttttag 13140 ttcttggaag aatcagttta attctgagat aactttagca ttagagttct tggaaattgt 13200 ggactattct taaaaataaa aattgtatat ctagaaaatt tattgcctaa tctctcaatc 13260 tttgaccctt gatggcattt tctttcagtt aaaagtaaaa acattgttaa agttagcatt 13320 aaggcaccta atcctgaatt ggggtaggag gagtacttgg ttacattgtt ttgtatttct 13380 ctatttgaat aaacttgggt atgctgcaac ttactattta aatattaatt tgttaacagg 13440 tcagcaaaac ggttactgga ccagattgtt gaaaaaggaa gaccagctcc tggcttccat 13500 catggcgatg gaccgggaaa tgcagttcaa gaaatcatga ttcctgctag caaggcagga 13560 ttagtcattg gaaagggggg agaaactatt aaacagcttc aggtattgtt atgtttgtga 13620 aatggctact tttggtctgt tttgatgnnn nnnnnngtct gctccctttt gttaatatgt 13680 attattttct atgattataa caggaacggg cgggagttaa aatggttatg attcaagacg 13740 ggccgcaaaa cactggtgct gacaaacctc ttaggattac aggagaccca tataaagttc 13800 aagtaaactt aactttatac tttataaaga aagagtttgg gttgaatggg gttgggcaaa 13860 atatgcatga ataattaaaa tgttttgaga cgtgctttct aaattagcta actttttcta 13920 ctttagcaag ccaaggaaat ggtgttagag ttaattcgtg atcaaggtgg tttcagagaa 13980 gttcggaatg agtatgggtc aagaatagga ggaaatgaag ggatagatgt aagtaaaaat 14040 acccattcag aaatggttgt atgctaattc gtaaatatag tagtgttttc tgttttgtgt 14100 taaatagctc taacattgtt atccttttat ttcaccttta tactttagaa tacagaatta 14160 agtattttat atcttgtcac cctatttgct ataaatataa aattatatgt actattatga 14220 tttgaggcag attttcagga aatggtnnnn nnnnnnnnnn nctttttttt actttaaacc 14280 ctgagaagct agttttctta atactcagtc ttttttacat aaggtcccca ttccaagatt 14340 tgctgttggc attgtaatag gaagaaacgg agagatgatc aaaaaaatac aaaatgatgc 14400 tggtgttcga attcagttta agccaggtga gtgcatataa taatcttgta agtgttggca 14460 gcaatgagtt ttgnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14520 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14580 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14640 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14700 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14760 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14820 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14880 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14940 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15000 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15060 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15360 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15420 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15480 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15540 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15600 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15660 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15720 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15780 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15840 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15900 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15960 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16020 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16080 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16140 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16200 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16260 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16320 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16380 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16440 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16500 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16560 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16620 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16680 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16740 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16800 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16860 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16920 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16980 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17040 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17100 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17160 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17220 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17280 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17340 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17400 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17460 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17520 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17580 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17640 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17700 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17760 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17820 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17880 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17940 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18000 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18060 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18360 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18420 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18480 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18540 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18600 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18660 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18720 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18780 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18840 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18900 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 18960 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19020 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19080 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19140 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19200 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19260 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19320 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19380 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19440 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19500 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19560 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19620 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19680 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19740 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19800 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19860 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19920 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19980 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20040 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20100 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20160 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20220 nnnnnnnnnn nnnnacaccc atttactgtt taattaattt tgtttctttg ttttgaagat 20280 gatgggacaa cacctgagag gatagcacaa ataacaggac ctccagaccg atgtcaacat 20340 gctgcagaaa ttattacaga ccttcttcga agtgttcagg tttgatagaa agttaacatt 20400 ttcatttttt gtttttatgg aaaaatactt tccttcatga aatctgaagt ttcctctata 20460 tcagagtctg cttgatgatg ctttattaat ggagaaagtt taaattgttt taaggtaaag 20520 atcttggagc aggaagaact actaccttaa gtgctacctt atttactctt taatttaaaa 20580 aaatgttatt acttatgatt atttgggccg gttcatctct acatttatgg ttcaggtatt 20640 tgagagctgg gaaaaataga cataattaat tttatcatga aaaaaagtat ttctgtgctg 20700 attttttcct tcttgtctat tcctctctat aggctggtaa tcctggtgga cctggacctg 20760 gtggtcgagg aagaggtaga ggtcaaggca actggaacat gggaccacct ggtggactac 20820 aggaatttaa ttttattgtg ccaactggga aaactggatt aataatagga aaaggcaatg 20880 tattttaaac tcttaatgtt taacacatta ttcatttttc tggacactat ttctgttgct 20940 gttgtaaaca agtggcaatg ctttttctct ggctgtgttt tagtagaaaa gcattcttat 21000 gttaatacgt aacaagtaaa acataaatga aggatctaat gtatatttat aaaaagagca 21060 ggattttaat cttactagct tctagagaaa gtgaactaag ataattatta gcataagaaa 21120 ggtcttttga cccaaaaagt tgtttgagtg tttttgtttg tgcattttgg tttttcccga 21180 ctcatatttt aaaaatttga atgtttataa gtgtattagt ttatatttat ctgcttttaa 21240 aagcagttta ttcaaatatt ttattataat cacattaagg ttaagtttaa acataccaag 21300 taaatgtaaa tgtattttaa gagaagcatg aaatgcttcc taaaatttag atttaaagtg 21360 tagaatatta aatgaaaaat cttaatacaa tactgtcaag tagaatactg actgaccaaa 21420 ccatgttttt aatggcctat ttaattgtga ccattttctt ctaaatagct tctagtatac 21480 ccttgaaacc tttagagaaa ttactgtctt ttattttagg aggtgaaacc ataaaaagca 21540 taagccaaca gtctggtgca agaatagagc ttcagagaaa tcctccacca aatgcagatc 21600 ctaatatgaa gttatttaca attcgtggca ctccacaaca gatagattat gctcggcaac 21660 tcatagaaga aaagattggt gtgagtatac tttaaacttt taatttatag tgtagaccct 21720 tagattgtag ttaaattaag acgtttattc gaatacannn nnnnnnnnnn nnnnnnnnnn 21780 nnnnnnnnnt tatagatttc atgataccta taatagatac aatgtgaaga ttttccagca 21840 atgaaaataa cctaattaaa tgtgcagtta caggttttga gaacaacctt acgtttgagt 21900 gtggatagat aggagggtgc aggcatcata ttagtgttat tgtaggattg tggaacatac 21960 ttgaaggaca cagttaatgg gaattcatta tttattaaga ttttactata ctgaacccca 22020 gcaaggcaaa caagataaat cagatgcatc ttccgctctg cagtagaaat tcgtaaatcc 22080 tagcttttgg actggctcac aaatcatctg ggttttaaaa tgtagactat ttgggtgctt 22140 ccaactccta cacataatat acagagacag acctgactca aaatgtctgg gatagggccc 22200 agcatctgat tttacacaga tgtttgggtt tttttcttcc agaaaagttt tctgttagaa 22260 caaaaagtat aaaaagcttt gactgctttt ttgtaaatga ggcagatggt gtcttactgg 22320 agtttttaac acaaagtgtg cagggagcat cttaaattat taatcagaat ttcctaggaa 22380 aaattagttt tggtgtttgc catgctgtga atggagtgca tgcaaaacaa ggttgacgct 22440 gttttctgtg tacttgggaa gacaaaaata gatgtactaa agatgcttaa ggaacatctt 22500 ataaaatgta cacaaacatt gtaagttctg ttgtatggat agtttaattg ttcaaaaaat 22560 gaagatgttt gtggagtaat gataggaggt tgatgccata gcaaaaaaaa atgaatagca 22620 catcttggtt tttgatttta cagtattagc cttacatgca tggatcagga tttctgttgg 22680 attcatggta aaacaagata gattgtttta gagaagcaat ttggtgtggt gattaagagc 22740 acggactctt ttctctgaat catttactgg gtctgtgacc ttggagaagt tgctcaggct 22800 tttctgtgcc ttggtttcct cctataaaat gaggataatt gtatctattt catagagttg 22860 tagggattaa atgaacgttc acctgtgtgt cacttaaaag aatgcctggc acatagccct 22920 aaaaaatgtt gctacttttt cagtattatt tttactattt ggaaagaata gataatggat 22980 aataaagtga gagatgacag caattggaga cttaaagaga caagttaata aaaataactt 23040 taaaggtcat gaagtttagt ttccctattt tgcagtgaga aatttacaac aaaatatagt 23100 gttaccattt tgtccagcat gtcgcctggt tgtgttaact actcagaagg agcattttag 23160 gacagttaag tgtaatgtct ttgttggctt aacaaaacag aaatcagtta agcattatta 23220 atnnngatgt ggcatgcatg catgataagg atataaaata tcctgattta ttgaaggact 23280 taaaaaggga atgtttgtgc tgtttagaat tatgatacat gaaaggccaa aaaggatata 23340 aattattgat ctgaatgggg tttcagtgac agaaataggt tgtgaggtgg agtttggttt 23400 aatagtgaac caactagctg ttaacattat caatgaagtg ttcagaagac aattgatgat 23460 ataggaccca agcagtttgg gaatatattg tcaagatggt tgtcttatgt taggcaagta 23520 gatgtagaga gaagagctga agataaagac ctgatttctg tgattaagat gaaaaaagat 23580 agtaaaagaa agaattataa aaggaaaggg atctactgct gtcgcagaca agctaaagaa 23640 aatttaattg ctaattttaa tttaatttaa attgcattta attgctaccg ctattgattt 23700 tagtaaattt cacatgtctc cttattatgg cagataaaat agtttttgca aaatgaatga 23760 ggaaaggaag gaaaacctaa aatttgttgt ttgtgactat aagagggtag aaatggaaga 23820 ttatttgtcc atagagttgg tttgctgatt tttctatgtc ttcctttttt tttttgtagg 23880 gcccagtaaa tcctttaggg ccacctgtac cccatgggcc ccatggcgtc ccaggccccc 23940 atggacctcc tgggcctcca gggcctggaa ctccaatggg accatataac cctgcacctt 24000 ataatcctgg accaccaggc ccagctcctc agtaagtatt gggtttagtt ctgggctttc 24060 ccccaaagat tctagttttt ggactacatt tttatactga attttcttct cagtggtcct 24120 ccagccccat acgctcccca gggatgggga aatgcatatc cacactggca gcagcaggct 24180 cctcctgatc caggtaaaaa gatgcttatc atttgtgtgt tagctgtatt gtttttcact 24240 cgtgttacat tattaaattt tctagtgttg attctacatt tgtatgcctc accttcactc 24300 actctactct ttcaacagcg ttaggcactg cctctacccc agtgtatata gaactgacat 24360 gaatatgatc tctgctttta tgaaattcct ttcagcttgc atttggcttt cttatgagtc 24420 gatatagcag aatgataaaa actaaaagct gcannnnnnn nnnnnnnnnn nnnnnnnnnn 24480 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnaatatgta gtgtgttaat tgtgacatta 24540 tctatgaaaa aatagttttt acnnnnnnnn nnnnnnnnnn nnnnnnnnng ggcactgagg 24600 ctcacgtctg taatcccacc tgttcagaag tcgaggctga ggcttgagac cagcctaggc 24660 aacatggcaa gacccatctc taaaaaaatt tgttttaaat tagccagcca gggtggtatg 24720 tgtctgtatt tctagctgct cagaaggctg gagggggggc ggggattgct tgaggctaga 24780 agttctagat tgtattgagc tgtgggcgca ccactgcact cccctgggca acagaatggg 24840 accccatctc ttaaaaaata tatatatatg tatatataaa acagtcttac agagtgttaa 24900 gtatttgggc attaaactcc caaattgtca aataagatac cggttctagt actcctcata 24960 atgacaactt catgtgagta aaaatcaggc ctgtatttaa taactgcatg ctaaaaccca 25020 aatacattta attattttct atattcagat ctgtattttc gatatgtatc tattatatcc 25080 tgtactattc tggcgtcttt ccataccctg tagtttgctt tccatcttgg tcaaagagtc 25140 attctttgaa accagttaac atttatttat gatctttttt tttcacctgc tacctacctt 25200 ttaggcctct ttcaccagag tagtttcaag gaaaatatac tcaattatgg attactttct 25260 acacataatn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 25320 nnnnnnnnnn nnnnnnnntg ctgtttggaa tatgatgaca cagcatgata gttaccaaat 25380 aatcacaact tccattaatt caaggaatga cttgagttgt gctaggatat aggtatgcaa 25440 agttggggtt gtattctata gcaaaagaat gcactcccag cataccaaca ctgatagaag 25500 ggctcacaag gtacagaata taatactgta aacacgaatt tttggagaat gaaagggctt 25560 tgcttttcct cttgttggct aattgggatg gtataattaa gtaatgagat tgaagagttt 25620 gagtaggtta agagacagat tcatactggg taacttggat ctgccaggat tgtatttttg 25680 agcactactg ggtggttagc atgattgaga aaaaatgatg ggnnnnnnnn nnnnaagtgg 25740 tctttgtatc acatgttgag tttcccactt ggagtagtag tgaagtcact actataaaag 25800 ctggtcagtg aatgtggttg cagcatggcc tttgggcaag aagtaaccca tttaaancca 25860 gctggttggc cccactcaga tttatcaaag ggttactggg tctctggggt ggatattgct 25920 tatattagac ttagaatgac gtaacgtttt aatgtatgaa ctaaaatatt tctttaaaaa 25980 aagagtggtc tgttacggat ttatgtagtg gtcaagaatt tagacttcag agtcaaatag 26040 acctagatca gtcctagtcc tacagtttac taatggtgag atgtcaggca agtttttgaa 26100 ctcctctaag cctgttttct tatctataaa ttgatcaatg aatgaatctt gggttgagtg 26160 aatatttagt aaattcttag tacatactag ttatttgtga gactggtact tcagtatggt 26220 ttacacgttt gggtgtagaa ataacacttc ctaaagtctg ttttatctca aattctctgt 26280 ccaggcatag tgtaaagtga aatacctaga tttcttgatt aatatacaga taatagccgg 26340 gcgccatggc taacacctgt aatcctagta ctttgggaga ctgaggcggg cggttcactt 26400 gaggtcagga gttggagacc agcctagcca acatggcgaa aacctgtctc tactaaaaat 26460 acaaaaatta gctgggtgtg gtggcgggtg cctgtaatgc cagctacttg ggaggcnnnn 26520 nnnggagaat tgcttgagaa tcgctccact gcattccagc ctgggcaaca gagtgagaca 26580 cttcatctca aaaaataata ataaataccg ataatgacac tattgagata tgtaaacatc 26640 caggatacaa aagcagtaca ttgggcaatt gagaaaagct tggagggtgt cctaaaaaca 26700 ccttacaatt atattacctt gtagttttct ttttctacaa attctcactc ctttttctca 26760 aacttgacta acctttgtta agcagctgag aattgctact gttcagaatg aaagcataat 26820 agaaaattta aaagttttaa ttgtatgata ttcctagtat aaaggacaga atcaagtttt 26880 tttgtggttt ctagaagatt gagaggtctc aaactgtttg cacttcagtt gatgtgggag 26940 atgagtgagg gtcagtcaag tgtagaggaa acatagctaa aagctgagac atgggcatag 27000 tgatttctga aaagtacaag cactgtgttg tggctggagc ttgggtgtta aagagataca 27060 aatgaaggga gaggtgaggc tgaaatggaa aggataagcc aggggattca gactgttaaa 27120 gatgttgaat gataggctgt acttaagctt tgaccatcct gaagattcta gagaatgaag 27180 aatttcaagt aggatgacat caagtttata acattcaatg tgaaatagga tgaaatgtgg 27240 ctaatctttt ttttaagatt tttatatttt ctcttcattg aaaataagga caaagttcat 27300 tgttctaaaa taattgtttc tttcttatgc aggttagccc ctagaaatgt ttttcttaag 27360 tcatcttcca gatagagctg tttgtgcttg aggcgaaacc aatttagaaa aaaacaaggg 27420 cacaggatgg tttgagacag agcattggat ttggagccaa aagaccttta ttcatatccc 27480 agttatgcaa ctcagtagtt tttaacctgg gaaagtcact tggtctctga gccttgtttt 27540 ctttaataaa agctgatggt aacaacaaaa ataatagaaa atataaaann tttcatgtac 27600 ttttttttaa tgttctagtt aattttggga gctgtatatt tgccagagag ctgggggggn 27660 nnnnnnnnnn nnnnnnnnnn nnnnnnnngt gagaattaca gacttcaaca tgcaaacctt 27720 gaactttcat ttattctagc taaggcagga acggatccaa attcagcagc ttgggctgct 27780 tattatgctc actattatca acagcaagca cagccaccac cagcagcccc tgcaggtgca 27840 ccaactacaa ctcaaactaa tggacaaggt aactaaagaa cttatatgtg aaagtcaaaa 27900 cttgtgcttg gaattatata tgaagtacat cactgtataa tacctaaaat ttctaacatt 27960 atttaattat aatttaagca gacttttcct tttttaaatt gttacctgga aatagtttca 28020 aactttcata aaagttataa gaataccagg agccacccat ataaccagct gttaatgttt 28080 tatcccttgt ttactctaat accgtctata tcatacaagt gtatgggtgt gtatttattt 28140 taaatatcca ttataattag ttctgaagga aactaattat atccagtata attagttctg 28200 aaagaaatca tttaagacta aactatagac acaatgtcct gttgggtact tcttcaaaaa 28260 tatataacca tcatacagcc ctccaaatca gtaagtcaac attaatatat taagctcttt 28320 atatcattat ggatttctga tttttgcagt gggttatatt ttttgaatat ttttataatt 28380 ttgataatca gactatccta gatttggcca gtcagggagt atattcaggg tggtgcctat 28440 atccttttga aatatctgtc gttattttaa gcacttccat actgtctggc acagtgagat 28500 tgttattttg tgttttatgg gctccaaccc ttaagtcagc tatttcttca aggagctctg 28560 attcctttta gtagagtatg gtagttagaa acgaggcttg actatgcttg ttgctactga 28620 ggtgtaattg cttctaactt ctttcagcag acagaactag gaaatatatt tacatacatg 28680 catacctaca tacacatgcc aaaaaacaca taaacattga tatgtgtata tantttttaa 28740 aactatgttc atattacgac attcatttca gcattttggg gttttcaagc cttttccttt 28800 tctgtacttg tttacaaatg gtgagaaacc tggtatcctc agtgtatctc cttattttac 28860 atacatttac ttatatgttc gacataacca gtcttccaaa caggttggtt ttcttttctg 28920 tccaccacct ctgtaccccc agtaccttct atctttggca ccagtaggga tgccaccacc 28980 acatagtacc ttcctcctac ccctcactgt cacattgcag gcccctgcca gctcctgcac 29040 ccaaggaaac agctaaaatt gccttttaaa aactttaatt ctgtttttct gttttgtttt 29100 gttttgtttt gcttgatcaa ggagatcagc agaatccagc cccagctgga caggttgatt 29160 ataccaaggc ttgggaagag tactacaaga aaatgggtat gttttataca tttcttgaaa 29220 atacatactt aattaaattg aaacacaagg tattctcttc agaaagagaa taattgaata 29280 aaatcactgg actcgtaaac ataccaagac agttgcaaat tatagttttt aaatttgtgg 29340 ttatatagca aggaaatatt tttctttcta attgcatttg tcaaccagtt attaattgaa 29400 actagaaatt tcctcactgg cacatacagt attaacatta ctatactttt gacaatgaca 29460 gttatatata ttagtctgag tgacataagg ttaaatttta atgtgtcagg tgaaaatgga 29520 ttgtgtgtga taccattatt tttgctgcaa gataagcagg taagaagtaa tctgtagtga 29580 gggaaagtaa ctaagtgatg gaaccagaat ctggcttcca agagggtctg agtcccaagc 29640 ttgtctccca aatttgtctc tttagggacc atttggaacc tggtactata cttctggaca 29700 aatcactatg tttcaactgc ttttgctctt taaaaattat tacataccac agctagatgt 29760 cacaaacgaa aactaaattg gtaagcttgg ttatccttca ctagcagaaa aagaatctat 29820 aggtggtagt tttgtcataa gagatcggtc tacttgggat tctcagtgta agtttcaatg 29880 ttttctttgc caaagaatgt ttctcattct ccgcagaaag aaaaatttcc agaagggtga 29940 tgattttaat cttctaggtg taaaattata tatacttgat gataaagatg ttctgcacaa 30000 ctggtttctt tttaaagaaa gaaaaaattg tttttcctca tagagtggct tcctaggaga 30060 gtcatattcc atctatttct gagactataa cagattaata tatgtttttg tgacgtagct 30120 taggcagatc tacagtagct gaaattccgc aaaaagaaac ttttaactta aaaacagcat 30180 actctgatta aggttggtta cataatatat tttctgaaca gggatctttt ttagaatgaa 30240 tagggatgct attaatcatg tcctgncggg cgcggtggct cacgcctgta atcccagcac 30300 tttgggaggc cgaggcnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 30360 nnnnnnnnnn ncgtctctac taaaaataca aaaaattaac cgggcgcgat ggcgggcgcc 30420 tgtagtccca gctactcagg agcctgaggc agnnnnnnnn nnnnnnnnnn nnnnnnnnnn 30480 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 30540 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 30600 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 30660 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 30720 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnta aaaatcttca 30780 acttctattt tctcaatggg taatgttccc tagatatggt ccctagttat tannnnntta 30840 agtagataaa aataaaggct tgttaatgga tttagctaat tactgaggaa tgagtttgac 30900 ttctgnnnnn nnttttacct tattgattat ttgtaatatg gccgttaata catttactgt 30960 ttagtctttt atgttttact tttttatgtt ttactcnntg agtgggtggg ttgaattctg 31020 atttttattg ttaagggaag aaattctaat tttcattgtt aagggaagaa attgtcttta 31080 ttgtctttaa tttttttttt caccatttcc ctgccagtta gagatactgt gctatactgt 31140 cttaaatcct ctgtaggaaa acatggcata gaaataatta aataataata ctgcatgact 31200 aaagaacctc cttaccccac cttttctatc atttttctgt agtaccacaa taatcacctg 31260 ttaattttat nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 31320 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 31380 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 31440 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 31500 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 31560 nntcacctgt taattttatg agcaaaatag attagttgaa aacagatgta ggttaagttt 31620 tccaaaattg gctttatatt ttaaagacaa ttctaaattc cccaggataa caccaaacta 31680 agttattttt ttttttnttt ttttttnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 31740 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnggttcaag caattcttct 31800 gcctcagcct cccaagtaga gaaaatcttg atgagatttc agagagttat aaggaatggc 31860 agcaatctaa agatgggtat ttttaaagct agaatagaag gattttttat aagagactct 31920 taagagaaca agcagggttt caaagtagaa aggagtaatt cttttttgga gaagtgaaga 31980 catttgagaa aagtttgact taaggaaggc ccttacaata aggactgatg tagtagactc 32040 tgaaccctta agaatctggt accttaagcc taaaggaggg tagagtgaga cttgtaggaa 32100 aggtacaagt atataggaag acaactgagt gtgaaaatct attcaagcaa ggctgactct 32160 taggctataa taaaatctta caggctaact gtagagcaag tcttttatct tttggatgaa 32220 agaaatgtaa ggctaaactt tatagattat aattatnaaa ctataataaa tattagataa 32280 tgttctactg aagtgtaaac tcaactgtct tgaatcaaac agtaactaag ccatgatcac 32340 accactacca ctgtgttcca gcctaggtga cagagcaaga ccctgtctca aaacaaaatc 32400 caataactaa agagaataat aaggggagca aggtaaggca gtacatgtct gaaagggcaa 32460 ggaaagagtt ctttaaagtc taaagtgttt actattagct ttccacaggg atataggagt 32520 ttgcagacgt tgtagttttt taagggaaca ttgatggaat tttcttgatg aatatgcctg 32580 tttctaccat cttacatcta aaatgagtaa ctctcacagt gggtttaaaa cctgaagaat 32640 attgattgct accttgatca ggtttggttt caagtgtgca gcttgtaaga gaaaacgtgt 32700 ggttttattg ctgttgttac acgagagtat ttggcagttt tttaaatatt gaaacctgtt 32760 tcagatttgc ttgaattgtg tcttgtaaga ggcaaatgtt cctgtttgat taacagttct 32820 ttatagaaga caggaaaata tgagaatttt taatagtcta tgagagttct ctgttaccca 32880 agaaaagagg gtttgtttca tgcattttta aagaatcata aatcttaaat tctttcactc 32940 agttgctttg attctgtcac ctattttaca atggtgatgg acaggtttct gaaactagga 33000 aattggcctt gttggcaaca tcatacaaac ataaaaacag cttcctatac gtccatgctc 33060 cagtactttt gtctgtggta attatttcac aaagccaagt gagttacaaa cgaaataaaa 33120 tagtgcttaa gtaaagcaac tgaataggaa aacacatctc tcttctcaat tttttattta 33180 gaaaattata taccttcaga aattggggaa attaggtacc actcagcttc attcatcatt 33240 tttttaaagt ttgctgtatg tgctttatat gtacgttttt ctgtatgaac catttcaatg 33300 taagttgcag acaagacagt tggctctaaa gaaactcaat gtctggacac agtgattcac 33360 gcctgtaatc ccaggacttt tgggagacca aggcaggtgg atcactttag cccaggagtt 33420 aaagaccagc ctggacaacg ctgcaaaacc ccatctctgc aaaaaaagag aaaaatnnca 33480 gctaggcatg gtgggcttgt agtcccagct actctagagg cagaagtggg aggatcatct 33540 gagccgtggg aggtcgaggc tgcagcgagc catgaatgca ccgctgcact ccagcctggg 33600 tggcatagtg agaccctgtc tgaaaataaa taccttcaat agtatcacaa aaatacagac 33660 tatatttaaa tttccatagt tgtcaggaat atgtctttcg tcgtctgtgt gtttgttaaa 33720 ttcagagtgc attcaaagat tcgtgcattg catttcattg ttatatttct ttagtctctt 33780 aattcagcaa agtcatctca tttggagaaa gacctgatcg tgaaagctga gttatgtgtt 33840 tcattgatct tgttctttat tccttgtcac gttactttta ataccattgt gttgtaattg 33900 gaataaatta ttgatacttt taacatctta ctactaatct ctgtgtgtgt gtacatgtac 33960 atgtacatac actttatagg ttactaatca ggaaaaagtc ttggctaggt cttaaaataa 34020 taaaatcttt aaatcattgc aattaagtgg gttttttgtt tttaattctg gaatccaatc 34080 aagattatgc ctaaatcttt accttcctta gctaaagcag tgtggatttg gggttgattt 34140 tgttttttta ctaataatga cgctctagaa ctaaacatta tgattaatta taaggcaaaa 34200 agaaaataaa gagcgttttt tttttatttt agagtagttt cctgacacta ctaatgaata 34260 ttttaaataa aacaggagta attctgaccc tctgtgcttt tgtcttatga ttgtaattta 34320 atattaaatt tagggggttt ttttaggtca acaagggcag acacaagatt attcaaaggc 34380 ttgggaggaa tattacaaga agcaaggtat tgtttttact ggaaatgagg tgttggactt 34440 ttaattgtgg ttacagcaac aaaattcttt tttttcaaag gtcaagcagt tcctgctccg 34500 actggggctc ctccaggtgg tcagccagat tatagtgcag cctgggctga gtattataga 34560 caacaagcag cctattatgc ccagacaagt ccccagggaa tgccacagca tcctccagca 34620 cctcaggtat aatgtaattg ctaatttgtt gatttctact ccagtctgtt ttctgcatgt 34680 ttactgtttg tctgtttggg agtgtttgcc ttttaaattt ttatctggca aagtataact 34740 tatttaaatg aagtactacg gtgtattgtt tgggtttttt tgtttgtttt ttataatgtt 34800 ttccggcatc tgagtgctga atatttctgc aatgcctttg attttaaaaa taaattttct 34860 tcccccaggg atttgcaaat catgcaagaa gctaccacca tttatattaa ccagtttttc 34920 tttcttaaag gattcactcc tgaattagct ccatttcaag gattttcttt aactttttgt 34980 gtatttctta tgtatctctt ctgcacaggg ccaataataa gaagtggaca atacagtatt 35040 tgcttcattg tgtgggggaa aaaaaccttt gttaaatata tggatgcaga cgacttgatg 35100 aagatcttaa ttttgttttt ggtttaaaat agtgtttttt tttgtttttt tttgtttttt 35160 ttttttgcaa atgtacaaaa tatctatcac tactgatagg aggttaatat ttctgtgtag 35220 aaatgaaaat tggtttgttt ttagtattta gtgtagatgt acacattcca gcaaatgtat 35280 ttgcaattat gtggttgatg ctttgtgata taaatgtact ttttcaatgt atactttcac 35340 ttttaaaatg cctgttttgt gctttacaat aaatgatatg aaacctcctg tgtcggtaag 35400 ttggatatgt gggtatttaa aggattcata atttcttagc aatgataaat taagatacat 35460 atacacaaat atataagctt tccccatgaa atattgagtt tttaaacact ggcatgtttt 35520 tccccccttg cagtatagtg gtagattgga ggatcttttc catttattgt atttggctct 35580 ttcagcacaa gtaatcctgg tatcttcatt tttttccttc tgtttgatta aaaactgcat 35640 gtgtgtacaa tgatcttctg gcatacttcc attgcattaa cagtgaaatt tcctttttat 35700 acatgaccac tgtttcagac ctgtactgct gctataacag ttaacctttc tgttcttaat 35760 ttgataatac ttgatttcca agactgtttc ggcataacta attttaaaca gttttcagat 35820 agtgaatatg agtagtctaa taagaacagt ttttttccat gtaaagcaac tctttcaatg 35880 tatataatag tgtgtttctt tctaaattta ggatagaaaa gtgaatagtg tgcaaaaagt 35940 atagctacat tgcatctgcc attgaaacat aaatggggta tggaaacgtt caagcttttt 36000 ttttttcttt aagcagtata gataagcttt gttttgtaaa tgcacaagtc caatcattga 36060 atcaacttaa tttttttatg tacttgaagt cattttatta ctctttaaca ctcatgctga 36120 agttctgata ttttgttgaa atccattgtt ttactctttg catatttgtt ggctctttgc 36180 atattaatat attagactac atgcaaatac agtctgtctt gccattgtct gttgaagtgc 36240 aggtttgatc cagccagtat agaactagct ctgtaggggt gaggaggact gtgctgtgta 36300 tcatccttga ttgtgttcct tcaaggagca ttgcactgta agtacatcag aatgacaaat 36360 tgatgaactg caacagtatc tttttgtcaa tgttccacat aatgcaaatg ccatactttg 36420 tgtgaatatt atgttggaat acagtgctga tatcttggaa aaccataact gcttcttaat 36480 ttaacataga ataatacata gttctgtatt ttttttaaag tgagcttaat gggtaagtat 36540 tttttatatg ctttagctat agctaaagaa aactgatact taacaaagtt gaatagtatt 36600 attcactggt gctcctgaaa tattgttttt cagtgtaaaa tatgcatata ttctatattt 36660 aatatgaaag tcttgaaatg tatcagaagg gatttcagtt tgcaaataat gagcaatgta 36720 gcaattttaa cacatttcat aaatatatat tttgtcattt gtggggagca ccatttgttg 36780 ttttgaatat actttaaagg aagaggtaca aggacataaa tgttgagatt acctacagga 36840 tggaaatagc agtacagttc attatagata ttttgaaatg tttttgattg ttttatataa 36900 cctagagtga cttcccttac ccttatttag atctggatat atagttctag tttgaagttt 36960 aatagttaag gagttagcta tttgttatct ttaagagtag ggtattgacg tgagcaattg 37020 cagtattttg catgatactg ttttatagat gaccttttag gaaagtggtg catttattaa 37080 ttgaactgaa gaagtagttc agttgaattc agtatcataa ctcacaaatt ggaggctgtt 37140 gattttgatt catttaaggt ttaaaatctt tattaattgc aaacagtgca attatttata 37200 cttcacagtg ccttcccaga ccttccacct taggttctgc tgcaaaaagc accaggtaag 37260 cacaacctaa ggacatatat aaataaatat ttcagtacat taatgttgtc cctgtgaggt 37320 ttttgtggtt gtgtattcaa aggcaatctg ctnnnnnnnn nnnnnnnnnn nnnnnnnnnn 37380 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnncca tcttagtgga 37440 aagtctgtaa gttgttaaag caactgttta catttctggg taatgttttt atttacgttt 37500 ttttttttta tttaagacaa gaaaatgatg agtagattgc tgcagtaatt gatctacatc 37560 caaatctttt tgtatttttt ccccaaatat agaagtgtta agattaagaa aggacaatta 37620 cacagttttc aagatttagg aaatcacttg ttcagaaact tcaacagcct tcacaatctg 37680 ttttatatga tggacagaaa atttctttgc cctccaaaac tataatttct ttattttttt 37740 cttaaactat aataattcag taaggatatt atgggttaca attttattat gttttttctg 37800 agacaaaagt tatatgctag aaaaggaaaa agttaataag gcagtatgtt ttgataaaag 37860 gcatgtgcat cagtgaaatg ttaactgtac agcaaataac ctttcataat ctgtagcaat 37920 cagtattttt ctgatttaat attttaataa ctgacgctgc atttatataa tttttttgcc 37980 agtttaaaat gtttgtgtgt ttttatagat gattttaact ggtacatatt ttgagttaag 38040 atgaatgtat gaaagcagca tcttaccagt tttgtttatt caatttctaa aatgtgctga 38100 tccttttaaa actcctgctt atctctgcaa caaagaaaaa tattcaaaaa tactgccttc 38160 attttcacac acagtgctga agatgctgca agcaccaaat catagctcaa taaaatcagg 38220 tcctgagata gttacccata aagaggaatc ctttgagtgt atgccattgg tgagccgatg 38280 agcatggacc atagaagggc tcaatgtaga aggtaaaatt ggcaaatcat aattgagaaa 38340 tatgaaatgt attcccatac ataatatggt atagggtgta atgtacctgc ttttgatcac 38400 ttttcatttt aaagtgctat tcacttgatc ttaaatgttc catgaactgt taaatttctt 38460 aagttacata gttattacac cacatttatg tgtatgttat gttttaatag tcaatgatag 38520 gtatgtaaat ataaagggac tcattgaaac ttgagagcct gtcgagtttt ggttagttgt 38580 agattgcatt tttattaaaa aaatatagat agatgaatga taatagatat tggggcactg 38640 tttctgtctc atgagaattc ttttattcat taccataagc cttcactgat aatataagca 38700 ttattttaaa tgacgctggt cttaaatctg aaataaatgg aaagcagaaa aggtgagcca 38760 gttgatttga atgcattgga tattagtgtt agaaacaatg tatagtttag attgaaattg 38820 aactgacttt atttagcact taaacaaaaa tttgacaatg tttttggttt ttttttaaga 38880 cagcttagtg tggtgatact tagaattcta tggtttgatg tttcttttag aaatgagaag 38940 tatagtttta ttttttaata tcaaaaatgg ttttaatact aaaactagta atttaatact 39000 agttgtttat aaacattgta aaatatatct tttaaacaaa ttatcttagt agttaattca 39060 taagggtggt tttgggtagg aatagcagag taccttcaga gggaaagggg agtaattcag 39120 aagtgatagc attttatttg tttgaatact ctgccagtaa aatcagctct acttagaaag 39180 ttatctgttg tgtagaataa tgatgtagag tttactaatc agtgaggatg tcttgttttt 39240 attttctgca aactctgcct cactttaaaa tgcattttaa caatacctaa ttaaaaataa 39300 ttttggttct gaaaataacc ttattttttg ttgagttagt gacttcattt ttcttgtcac 39360 aatataagct tttgagggat ttttttaaat tggtgctttt aataagcaaa tcccagggtt 39420 ttattttctt cagtgatacc cctcttaaat gtatttgcac atatatatat attttttctt 39480 atgcatgctc gatgcatttt cgtcctgaga aaaatgttct ctacagaaac tacccgtgtg 39540 taaaaagaag attggcttaa aatggctact gtgatgggaa cagtgtctta gggagatgca 39600 gcttggactt gaggtaaatt gaatacttta caaactgtgg tttagagttt gctttaatga 39660 cattgtatgt aaaaggtcac atgatagctg taattttgta ttcattatgg tttcctcaat 39720 aaataaatgt acattgatga atattataag 39750 <210> 5 <211> 26405 <212> DNA <213> Mus musculus <400> 5 gctgaaacat cgcgggattt ccgtctgcca gtctccgccc ctttacggca cgatggtcgt 60 gcaagaatgt gatagagcct cgacggccgc catcttcttc ctttcttagc agttaaccga 120 gagcggcgcc tccctccgcg aggaaacggc agcgtgtgct gtagcgtggg tatggccgac 180 tactccacag tgcctccgcc gtcgtctggc tcggctggcg gcggcggcgg cggagtcgtt 240 aacgacgctt tcaaagatgc cctgcagaga gcgcggcagg taagcgtgga ccgaccgcgc 300 ggcggcttcc cctccccgac ccccgagagc cgccggcggg gcaggtccgg ccctgctcgc 360 actcgcggct gccgcccgag gagatggcgt cttctcacga ggggtcccag cggctcgagg 420 ccgagcccgt tgtcgtggtc tgaagcgccc ccccctccca cgcgctctcc ccgagcgtgg 480 cctccacttc cgccccgcgc gcgcggcctc gccgccccgt gcgccctgcc tgccccggct 540 ccctcggctc cggttccgcc cgacccaggc gcgtggaagg ttctgggcgc tcaggtcacg 600 gcgagggcaa gccagggagg gccggctgcc tggctagcgg tccccgccgc ttcccgcgcc 660 gccgagctct ccaccctcgc cgtaattagc ctaacgttcc ccgcggcgtt caccagcgag 720 gctctccccg gggcgggatc tgcgtgcgat ccaccaatcc tttccccagc tccaaatggc 780 cccgggccct ttcttcccca gccttgagtt tgaatctgcc tctctcttcc caagtcgaag 840 cctccaacct ctttgtgcta cgtagggacg tactgttgcc tcgaatggca accattttcc 900 cagatgaaaa gggttggata gataagagtc cttgcatttg acaccccccc cccaataacc 960 tgaacgtcaa tgtcttcaag tagcccccgc ccccgacttc tttgtagctt aaaaatgtat 1020 aatgttgcct tgccgggtgg ggtggtgctc gactttagtc ccagcactcg agagacagag 1080 cctggcaggt ctcttgagtt tgaggccagt caaaacggcc aagagggacc tgtctcaaaa 1140 aaaaaagtat gttatggaat ttgcctgtaa ggtaaaataa acccttatgg ctctgttgta 1200 gttgctagac atgagcaggt ttttaaagcc agctttgact atactggaaa cttccttcag 1260 gaccgaaaga ttaccgactc aatcaaggtt tatcaagtct accataatac agcaagcaca 1320 cttatctagt gcatagatac tgaaaaaata tatttattca tacagaggga ttccatgagc 1380 aatgtggttg gtgtacatag aagtcagagg acaacttgtg ggagttgatt ctccttccat 1440 gtaggaccct ttggtcaggt gtaagttgtt aggctcaggg acaagtgtgt ctgcctgggc 1500 atctgaggaa actttttgat gcagggcctc taccgaaagc ctaggcaggc ctgaggttta 1560 aggcttcctg ctgaattgtc tctagtgtag gtgtactcca cctctcggct ttggaagctt 1620 tttaagtgtg tgatttctag tcttgtgaga taaaaatcga acacgagtga gcagacagct 1680 ttgatgataa agtaaaccac agcggttaca taaatagtca cactgtgagg caggcgctgt 1740 acaggacgct gctggaaagg gatgcctcac tgaaagatgg gtgacattca tatagtgcag 1800 tgaggagtgg gagtctggcc agcatagaca agaagctgct gcttgctcta caaagatcga 1860 gggtttctgg aaggacagct ctaagaggta gtcagctaat ataggataac ataggaggag 1920 gaaaaaggtg ggaatgtgag aaaaactatg gatagattcc attgttagca agcattggct 1980 gtgataatac aagtgtttat tatagatgat agtatctgtt acacctttgg acattctggg 2040 tatgtagaaa ttccatcagg accttgcctg tgtaagtaag ggactaaggt ctcactatgt 2100 agttctggct gtcctggaac tcactgccta cctctgcctt taggactaaa ggtgtgtgcc 2160 acccatgccc agatgagatt ttgttttcaa aatgagagtc tttctgcctc accctcctga 2220 atgctggagt gacaggtctg cctacactga tcctggcaca cttacttttt ctaaaaatta 2280 ttttctttat ttacattcct gcccactcac ccccagttcc tcacaccatt ccttcttcat 2340 ctccccacct cccttccctg gggcctcaag tctcaagggt taggtggatc ttctcccact 2400 gagaccagac caggcagtcc tctgctgtta cacacacaca cacacacaca cacacacaca 2460 cacatataca cacataagcc agggaacttg gaccagcccg agtgtgctgc taggcacact 2520 ttttataagt ttggtgcaac tgtgtctttg aggatgaatg tgcgcattgt taaattttcc 2580 aaaaggaaaa tttgaaagtt gctgtggacc ctgcctagga agcactagaa gtagatttgc 2640 acttccacct ttaaaactac taaagaaagt gtgggctaaa gtgtaggaga tagatgtttt 2700 cacgtcatta ccttcttaga attatcttta actccaaaat tggtgagggt gggtcagtga 2760 agaaagtggt aaatgctggt ttggtttgat ttttgtctga agtaaaaaag cacagaaata 2820 cagtagagca aaaatcaagt ggaaagcttg aattatttct gtgggttaaa ataaaaacat 2880 tacttacact taatgtgtgt ttaatagaaa cattgggttc ataattgtag catgtgagaa 2940 gttaggatta gactagctgg ggctataatc agaccatgtt cccatccacc caccacccac 3000 ccccaatgag gggagagttg aaagttttgc ttggtctttt gaatgaactg tgtaccaatt 3060 tttcttttgg atgcttgtag acctattaca tgaatggagt gtgaataagc atgctttctt 3120 atggatattc cttggtcttc aagtaaactc agaagtgttc ataaaagcta attgtagaac 3180 atagccatag tctaagccgt tttcctctcg ttcaattgta cgtaacactt cccttttaac 3240 atcagttcct gtcagtccca tacagtgcac ttaaatacct aagatatagt ttacaaatgc 3300 tatgatttga aatcaaaggg tggaaaagat tttgtttcca aatgtgtggg ttgttttaaa 3360 tggggatata acataagttt aatagatcat taactatttg ttagctccct gaagtattag 3420 tggtagtttt aattattctt aataagtgaa tctttctagt gtttttaaaa gtatatcttt 3480 tattgtagga aatttagtgc tgagtagtac ataaagtatt aataccctga ttagtattcc 3540 gatttttctt ttaagattgc agcaaaaatt gggggtgatg ctggtacatc attgaattca 3600 aatgactatg gttatggggg acaaaaaaga cccttagaag atggaggtaa gttatagcca 3660 acaagaataa ttatcttcca tggtattcat ttgataagat tttcagtatt gtttatcaag 3720 atgatttatc aaaatactac tatctattgg tctcagaaga ataggatttt gaaaaagaca 3780 gacctagaaa aggtaggtat aatttgaatc tattgggaag tattattgta atagaaaaca 3840 ggttttgtta tttttttttt tttttgtcct gttataggat tatgcttgct ttgagttgca 3900 cagactgtta atgatataaa taaagttatg ttatttggga aacactttac tgaattttct 3960 catttattga atgagtcttt gatactccct ttcattcagt cagaatccac gtctaggtta 4020 aggttggttg gttgcaggca tcccattttt atattgtttt agtgttttgt gtgtttcata 4080 tttatcttta aacattgatt aaaactgtgg attcatagtg ttttctcttt ttaaaaatca 4140 tcacttctgc acttagaagt gtgtactttt ttattttagt tttgatgtat gtataaattt 4200 tgatattgat atatttgccc ttttgtaaaa gattctgata gcatatagga ctgactgtat 4260 ttgtggccct ttctggtaat acttggtttc cttttgttta agtatgttta tatttgcaag 4320 tgaggttttt aatatgcaag aaaaaatgag ctaatgatgc ttcagatgtt gtgtgtaatg 4380 tactcttttt attttatgtg tagatggctc ttggacaaat ccgagcagta ccacacactg 4440 ggagggaatg ccctctcctt ttaaaggcag gaatttttat ttattacctg tgtttagtat 4500 gtaaatgtga aataagccag tggattctta aatggacaca atggtctctt ggtttatgtg 4560 tctgaatttt tgctatacaa aagccttgaa gttgggagaa taataatagt gttttgagct 4620 ataggctgtc tattcatatg ttgtatgcat tttgtttatt tgagaaaggc aatcgtgtgg 4680 ttgctttgag gttttggtgt tctgtagtga aatgcttcat ttgagaataa tagaacagtt 4740 tagattgaaa ttgtcttgta acgtgagctt tcttttttgg tatagtttta tgatcactgt 4800 cagattcact catcttttga tatgtctggt ttttatgtag tgctctctaa ttgtcagttc 4860 tagagtggat gaagcatcat taaccattag cataaggtat tcaccagcat tgaagctaaa 4920 cagtttgtgc tgtattattc caaactaaag tgtctgtgca ttgtttaaac acaagagaat 4980 gaaagaattt aggttttgtg ggtttttttt ttttttttag atttttgagt ctaggttgaa 5040 ttgtgtcagt tttgattcaa ttggtaaacc aatatatcat gtattttaat aaatatcatt 5100 attcttgctt ggtgggggtg gggagctttg tttttaattg acaaaaagta aaagacactt 5160 aattttgcag atcagccaga tgctaagaaa gtacctcccc aaaatgactg taagtacttt 5220 aagctgaggt tttgttgctt ctttaaaaat tacgtgtgtg tgtgtgtgtg tgtgtatgtg 5280 tgtgtgtatg tatgtatgta tgtatgtatg tcaagatggc ataggaattc cctgaaagtg 5340 gactacatgt gggtgctgag aacttggttc tctacaagag catgtgtcct ctttatcatc 5400 taagtcttct ctccagactg ttgtttctac tttgggtggg ttgtgagttt ggggtttggg 5460 gaatttgctt ttgagccaaa gtctcaaata tgtaattctg actgcccttg acttcacaga 5520 gatctacctg tgtaaaagta ttttttattt tgcctgatgt aattgtcatc tctgagcctt 5580 actgcctcaa accttctagt tctttctgaa ctctggtgca aactcctctc caagctgatt 5640 caatatagct tctctcttga cctctgccgg aattgctctg cttggcctca aactatcctt 5700 ctcattttct ggcttattct gtttttacat gtgtctagct tgttccctct ctgcaaccta 5760 tatatctcta caactgttcc aataagactg tcctcccacc ccctgggcta tttatttatc 5820 tcttaagtcc tcctctctat tctcctgaga gctagacata attaatccca ttctttttgg 5880 ggtttttttt tggggggggg gggttagaca gggtttctct gtgtagccct ggctgtcctg 5940 gaactcactc tgtagaccag gctggcctcg aactcagaaa tccacctgcc tttgcctccc 6000 aagtgctggg attaaaggtg tgcgccacca acgcccggct gtttgttttt caaaacaggg 6060 tttctctgta gctctggctg tctagaactc accctggacc aggctgacct ctgcctccca 6120 agtgctggga ttaaaaggcg tgacccacca ctgcccggct ttttttcctt ttcttttcct 6180 caaagatttg ttactttata tatgagtgca ctgtagctgc cttcaggcac actagaatcg 6240 gatcctatcc cattacagat ggttgtgagc caccctgtgg ttgctgggaa ttgatctcag 6300 gacctctgga agaacagtca gtgctcttaa ccactgagcc attttcccag ccctaatttt 6360 attcttttga ctccttctct gattgatcac tttgtctgct actctaaatt aaacatcact 6420 ttcaaacatg agtgcttcct tctacaaact aacttcatct ttactgtttg ggattaaagg 6480 tcattaaagg attaaagagc aaagccacac cacaactata agcacataca cccccacccc 6540 cgtaaataac acaatcttgg ggctcaccct ataatctaag tgatcaaata gcctacaaca 6600 gacttgcttt tgttttctcc tgtgcttgga ctaaggatgt gtgtgccttg ccatactcaa 6660 cagggttggt attacaaatg tctagctgga atttccttac aaatgtatat aggtttttac 6720 tatattttta aaaaagaatg attctctttt acttgggagc cacgtatata caaacactga 6780 tggctgagct gtgactataa gttaactact ctagttgtta atctgtgtgt ccctttcctg 6840 actttcttgc tactctcagt gatgattcaa atatgaatgg tccgaatttt tttcctatgt 6900 atacatcagg gaaagagttt ggagtacgtg gtatgtttgt ctcaaataaa ctcgaactta 6960 agcttgtttt tgttcatttt ttcgtagctt ttggagcaca gttacctcca atgcatcagc 7020 agcaaaggta tagtcaaaac ttttaaagct actttgcaag tcttagttgg attgtatgta 7080 cagccaagtt agtctataat gcaaatgtct gcataccatt ttgtatgtgt ggtttacttc 7140 tgtaaaccac attgggaaaa tggtatagaa acattgttaa tttgggaaaa caggttgaaa 7200 ttgacgcatt tcagaagagg taaaataaat gttaaagtgg cattcgcttt gacaggtgtt 7260 cagtttcctg ccctgctcac acatgctgcc tcatttaaga acctggctgg gctactggga 7320 gactttaaga ttgggtttat tagactgctt ttatgtgtat atgtacatta tttttctgtg 7380 aggaaaatgt tagtttctgt tctttcttag cagatctgta atgacagaag aatacaaagt 7440 cccagatggg atggtcggat ttagtaagta ccattaatac taaggtttta agacaaagca 7500 tactttcaaa aatagtatga atgataactt ctcccctttc tctaccttaa ctagtaattg 7560 gcagaggagg tgaacagatc tcacgaatac agcaggaatc tggatgcaag atacagatag 7620 cacctggtaa cattccgtgt gtgtgtgtgt gtgtgtacga attacttgtt gttttgtcca 7680 gttcttacag ttttttgaga gtggctagga aactcaagta ttttaagttt ctaaatatct 7740 gatattttta ttgtattttt tacttaaact tttcttttta tttaattgta gatagtggtg 7800 gcctaccaga aaggtcttgt atgctaactg gaacacctga atctgtccag taagtttgaa 7860 aatgttaagt ctacttacag ttaagactga agactataag cttcgttttc ataccatttc 7920 gctttaaaag tttacatatt atgcctttct taaaataggg ttcatcatct gaacctaaga 7980 cagagaaatt gttaaagcca gagactaagc cgtaactcag gcatttaggt gcttgccttc 8040 catgtaggaa gaactgagtt tgatcctaaa actaaaaaaa aaaaaactgg cgtggtaata 8100 tcatggctca ggagttggac acaggcagat tttggggact tggtaaccaa ccagctaaca 8160 ctatttgatg ggttcaaagt cattgagaga ccttgcctca aggtacttat cacaaaaaag 8220 gtactgatgg ttgtaatttg acctatacac cttccatacg tgtctataca gactcagaaa 8280 ttattaaaac ctgccttgca caaatatgtt aataacgtca cctaaaactc atgaccaatc 8340 tagtcatgaa aattttatat tcctgttttt ctcttccact caattctaag gctctgataa 8400 aactacccaa tctttacctc taattgtctt ctccccactg ccatctcccc tccagacagg 8460 gtttcattgt atatccatag ctgactgtct ctgaactcac tcgctctgta gtccaggctg 8520 gcctaaaact taaaagatct gcctgccgaa ggcatgtacc accattgccc accacactca 8580 ctgtcttgac tgacttgtgt tgctgtgacc aagaaagtgt tatcatccta cactgaaatc 8640 ttaacaccgt tccttgcata cttttttttt tttgtctagt attgagatac tgttttacgt 8700 tcatttgcct gactttctac ttcaagaaat tcctgactaa actgattttt tacttcattc 8760 ctaaaatttt aggagtaatt tctaagagtt tatagacaga tttggaaatt acatatcata 8820 aaaatatctt tgaacctcat gttgtatttt gttaacacag tgctttaaaa ggtttgtacc 8880 attgaagttt cccctttaaa agtttatcta gtgtgtgtgc ctctcagttt ccttcaagct 8940 ctgcttctaa cagctgcatc gacagttctc tttccaaggc agaggctgag tcgtgcacta 9000 gttaaccccg ttgctgtgtg acaggatgga tggaagatgt ttaatgactg tgttcacttg 9060 gagcatacag acttcagtac ttactgccca tttgacttga cactcactcc tttggtttag 9120 gttcttgcct ccgaccatga aatgccatat gaccaattta gagtatgttt gaaacctgac 9180 taagataaaa ctgctgactt ttattatttt gggataagtt gggttatgct acgtattttt 9240 atcaagatta atttgttaac agatcagcaa aaagattatt ggaccagatt gttgaaaagg 9300 gaagaccagc ccctggcttt catcatggtg atggacctgg aaatgcagtt caggaaatca 9360 tgattccagc cagcaaagca ggactagtta ttggaaaggg gggcgagact attaaacaac 9420 ttcaggtatt attatattgt aaagaatatt attaagtctt ttgaggccac tttttattgt 9480 ttttactaac atattttcat gatattaata ggaacgggct ggtgttaaaa tggtaatgat 9540 tcaagatggg cctcaaaaca ctggtgctga taaacctctt aggattacgg gtgacccata 9600 caaagttcag gtaagcttca ctttgtctct tatatataaa ggctgagggg gtggacaaaa 9660 tacgtattaa atttttttga caaatattct gaattggata actttctatt atagcaagcc 9720 aaggaaatgg tattagagtt aattcgtgat caaggtggtt tcagagaagt gcggaatgag 9780 tatggctcaa gaataggagg caatgaaggg atagatgtaa gtaagaattc tgagtcagca 9840 gtggttgtat cctaatccat gggcactagt gttttcctgc tttgaattaa atggacttgg 9900 cttaacatca tgtccctttt cttgttttct tccttggggt ttttttatct tgttattttt 9960 atgatcattt agtatattta cttttatgat taagtgggga tgagtttttg agaaatgtct 10020 tttaaaatat acttttactt aaggtcccaa ttccaagatt tgctgttggc attgtaatag 10080 gaagaaatgg agaaatgatt aaaaaaatac aaaatgatgc tggtgttcga attcagttta 10140 agccaggtaa gtttaaggta tatttaatgt tctaagaatt gatagctttt aatcttgaca 10200 tttataattg gtttgtcaca acttactctg tttttttttg ttgttgttgt tgttattgtt 10260 ttagatgatg gaacaacacc tgataggata gcacagataa caggacctcc agacaggtgt 10320 cagcacgctg cagaaataat cacagacctt ctacgaagtg ttcaggtgtg ataggaaatt 10380 aacattttca gtttgctttc tttggaaaag tttttatcat acctgaatga aaaaaatgcc 10440 cctccaggtt atattagaat ctgttggcag tgttaaaatg actaacgtta aattgcttta 10500 aggtaaacat tttagggtag atttgcataa atgttctgcc ttatttcccc cagtgcatgt 10560 gaacttttat ttctatgggt atatgtgcct tggcaattgt gcctatggaa gccaaaggaa 10620 atttttctga agttggttct ctattatgtg ggtcctagaa attaaaccca ggtcattttg 10680 catgtatggg tagtctccca atatatttta aaagtggaag ttattactta gttgactatt 10740 tttgtttgac gtcatctctt aatttcattg tttagaaata cgagagttgg ggataataag 10800 ctaatagttt tattacagag tttattttgt tctctccttt cttaggctgg caatcctggt 10860 ggaccgggac ctggtggtcg aggacgaggt agaggtcaag gaaactggaa tatggggccc 10920 ccgggtggac tccaggagtt taatttcatt gtgccaactg ggaaaactgg actgatcatt 10980 ggaaaaggca atgtatttta aactctttgt tttgatatac tggatatttg taaacaaaag 11040 atgctattta tattttttta ggaaaggggt cttaacatgg cagctaaaat aagaatactc 11100 tttaatgtat gctaaaaatg ggattgtgtc tcaactgctt ctagggaaag gggaccaaaa 11160 gtctgtcagt tacaaaactt gatcctaatt caaatgggtt ttgttggtgt tttttgtttt 11220 gttttgcatt taacttcttt gttacttaca aaacctgttg attgaaatat ttttctgttc 11280 tgacccatat cagggtgtat gtttagtaag gtgtgtataa aatagacttt agtgtgtttt 11340 gcattagttc tagatggaag aacaggctaa atagaaaatc ctaacattat tgtccagtgg 11400 aatgctacaa aactgtttaa tgggcaaagt aataggtgtt tggggttttt tttggttttt 11460 tttaaatagt atttctgcca gacatggtga cagacacctt taatcccagc acttagtagg 11520 cagatgcagg tgtttctctt gtgagtttga agccagcatg gtctacaggg tgagttatag 11580 gacaaccagg gccacacaga gacccttgtc ttaggaaaga gtattgcttg cattctgtga 11640 acttagtgtc ttgcggtttt aggaggtgaa accataaaaa gcataagcca acagtctggt 11700 gcaagaatag aactgcagag aagccctcca cctaatgcag atcccaatat gaagttattt 11760 acaattcggg gcactccaca gcaaatagac tatgctcgac aactcataga agagaagatt 11820 ggggtaagtg tactctcatt tatagcatag ttcctggtaa ctttaaaatg tactgtggga 11880 aaatacatcg tttctaatat gaaattgcag gtattgtgat atagtgtata tacatatatt 11940 gacataggaa agatatccaa aatacaagaa ccatgaactc agaaatccgc ctgcctctgc 12000 ctgtcaagtg ctgggattaa aggcgtgcgc caccacaccc ggctgagaat accatgtgtt 12060 aagttttccc ttgatgtgca atttgcagaa tatactctca gcagttgtca cattagggaa 12120 gtaaagggaa ctaggcagtc ttgtttttaa aagaaaatca taaaaagagt aagaaacaca 12180 gaagactaag ctgaaagaac tctgctggag ctgaggattt cagtgaattt tacatggcag 12240 atgatgacat tttatttttt gcaccaaaat tcaaagaggg taaatttaaa tttgttattt 12300 aagcgtagaa atggaagagt agttggactt tgaattactc aaccattaca ttgtttgagt 12360 gtctagttat tgtttatgtt ttcttttcct tttttttttt ataatagggc ccagtaaatc 12420 ctttagggcc acctgtaccc catgggcccc atggggttcc aggtcctcat gggcctcctg 12480 gacctccagg gccgggaact ccaatgggac catacaaccc tgcaccttac aatccaggac 12540 cacctggccc agctcctcag taagtaccac atttgcttgg ttctgggctt tccctaaaga 12600 cctaggaatt gggggctgga gagatgacga tggctcagca gtgcagagca cttgttcctg 12660 ttgcagaggg acctgagctc acttcccagc accacacggg ggttcgcaac cattcgtgac 12720 aggttccagg gtatctttac agcgacacta ggcatacata gctgcatata catacatgca 12780 atacatgcag aggcaaaacc tacacataaa ataaataaag ctggctttta ttaatggtat 12840 ttgtgttttg ttccccaccc ctagcggtcc tccagcccca tatgctcccc agggatgggg 12900 aaatgcgtat ccacattggc agcaacaggc tcctcctgac ccaggtaaag ggtaatctac 12960 tattaatatg ttagcttcat tgtatactgc tggtcacagt cctaaactac ctactgcatg 13020 tgcgatcttt taaggcactt cccctgcagt ataggatgac actgctgtct agtatgttgt 13080 gactttattc atagtagttc atatttataa aataatgtgt ttaacactac tatgttctca 13140 aataataagt ataaattatt ttgttgctga taaaattaag gtcccttaat taccaaaaca 13200 ggagagtaca tttatttttc tctcttataa tctggatttt ctatagcatg gtgttctcat 13260 tatatcttcc catactggtt ttgtttctac tccatcatga tcaggaatca acttggaaat 13320 aggacttttt tctttgtttt tcttttgttt tttcactttg cagcccctgt agtttgattc 13380 atttgaaaag tttgagagaa cgtgttctga gttatagatt tctacatagt gtatttttta 13440 caaatcaaag ttgatttaga tgtaattgct ttgttggatt tgttaaatgt tttaatattt 13500 taatgtatgt taaattcata ggaacttttc tcagtcacca aataaccaca acttctattc 13560 atttaagaaa caacttgagc cgggcggcag tggtgaacgc cattagtccc agcacacagg 13620 agacagaagc aggcagatct ctgagttcga ggacagcctg atctacagag catgttcaag 13680 gatagccagg gacacacagg aaaaatccta tctcaaaaaa gagagagaga gaaaaaaaaa 13740 gaaaaagaaa taacttgaat tgtgatggca tctgaatatg aaagatgagt gtcgattagc 13800 aaaagagtgc attcccaggg cagacaagaa gcatcagtta tgacttcctt tgtaagggtt 13860 ttaaaagtga atcttctcct tctaacaagc atttagacgt ggcatgatca aatagagttg 13920 gaacaggtta tattgaaggt tttatatggc taattcaatt tcataggatt gctcaaatga 13980 gtgatgtttg atattagcac tgtaaggtct ggtcagtgaa tatgacttcc agcattacct 14040 ggaagactga ctcggcaata tgttgcttaa atttgacttg gaagtataca gtattttatt 14100 gtctgcattt tcaagaaact gctgctgtga ggttgagatt tatatagatg tcaagaattt 14160 aatcttcaat cttaaatgga taatatgcga attcatccta tgtaaaagaa tagtgagctc 14220 ttagtacctg ctagttgcaa gtcacaaaaa aaaagtttgg gttttggttt ggtttttgag 14280 ttacaaaggt gagcttagtg cagaggatgc tggttgtggt gacttgggaa tagggcagca 14340 gctaaaactt gagtattggg ggatgctaaa agaattaata gaaaggataa gccacagtgc 14400 tggggataag cattagaacc tgagttctat ccctcccacc tgttgtaaag aaaaataaat 14460 aaagcgcttt aataaagttc gtaaaaagga tccgtaaagt ttcctggcct gctcttgtaa 14520 ccaaatctag gagctctggg ttcagagaga aatcctatct caaaaaaaat taggaaggaa 14580 ggctggagag agggctcagt ggataagaaa agcaataact gctcttccag aggtctgagt 14640 tcaattccca gcaaccacat ggtagttcac aaccatctgc aatgggatct gatgccctct 14700 gctggtgttt ctgaagagag cttcaagtgt actcatatac aaaataataa taattctttt 14760 aaaaaatgag gaagggtgtc agagaggtag cttagtgatt attataaagg tcttcctgct 14820 ctttgagagg atgcaagttg agatccagtt actctcacac cttctggttc tctttagtaa 14880 cccacatttg tgtagataca cacaggttca cagatacaca taactagaag tgggacttta 14940 aagtctagat aaaacaaggt gagcatgtct agggagatca cccagaatca gtacacacaa 15000 acagacacgc cacgacacga tggctaagct ggggagggcg gccagaccac agcatgtagc 15060 ccggaaacag gaaaagtgga ggaagaaaag gtaacggctt ggaaatccaa cggcctgtgt 15120 taaatggggc atggtcttaa aactgtacag gagctttcaa atgataagct atgcttgaag 15180 tatcctaaag gtgttagaaa aggatagagc aggactttca ggattgtgac tgaaataaat 15240 ataaactgca tgtatctaac ctttgtttct ttcttgtaca aattagtcca taactgcctg 15300 ctatacagaa ctgttgcact tggcagctta acttgttggg ggaaaaaaag caaagacacg 15360 ggattgagct gagacaaacc attggattgg aagccaaaag atcatccatt tatataccag 15420 ttccaccgat cactagtaaa ttacttaata cctgtaacct aggaaattac ttaattcccg 15480 aggctgaagt ttctgaacta aaagccaagt gatgatgata atactagaac attttgaaag 15540 tttccattcg ctattggtaa cttttgagcc tatttgtcag gaatcaccaa aaaggtaagg 15600 gttggtttct agagtttaca tattaacctt gaaaccgctc tttgttttta cattgtagcc 15660 aaggcaggag cagatccaaa ctcggcagct tgggctgctt attatgctca ctattaccag 15720 cagcaggcac aacccccacc tgcagctcct gccggtgcac cagctacaac ccaaacgaac 15780 ggacaaggta actacggtaa tgaaagattt tatttcctat tttaaagcta tagtttgtgt 15840 ttggattcat gtatgaagtc ataacaaaac tctctttcag tcctgagaat tgttgggcct 15900 tgtgcatgat ggtatcatta ggttagatcc tcgggcctaa ggttttgaag actcagttgt 15960 gactttgtgt aagcaaacta agtcaaataa tagttggaag aataatgcct taagtagtga 16020 gactgttaac tgtcctcccc ccacccccat ttacttcact accctgattt atgtctgtta 16080 taatagttct gaagagagct actgaaaact gtacttagag acataaaatc atatcacctt 16140 tctacagacc cttattcatt ccaaaataaa tgaccaccat ggactttaaa gtcagttact 16200 catcattgat ataccactgt tatacacagc ccttgcttag atcaccaact gaccccgtgt 16260 tttcattagg ttcattaagt ctcatcaagc tagagcactt tcttggtctt cttttatgcc 16320 tctaataaga ggataactca acagttagat agctgccaag ctatagagtt actaaccatg 16380 gttgtttaaa tggtcttgct actaccagcc tggtttttgc actatactac aactatgtac 16440 tgtaaagaat tacctagggg ctggtgagat ggctcagtgg ataagagcac ccgactgctc 16500 ttccaaaggt ccggagttca aatcccagca accacatggt ggctcacaac catctgtaat 16560 gggatacgat ccgattctag tgtgcctgaa ggcagctaca gtgtacttac atataataaa 16620 taaataaatc ttttaaaaaa aaaaagaatt acctagtatt ttctgctact ttttactgga 16680 gtaatgtcac tatcctatac attgaacttc tgcctcagcc ttagtctgta ttattaataa 16740 accttgcctt ggtaccctac tattacagca gctgttaact gttagtttct gtcattgtat 16800 attagttgct attttactac aaggaataga ttgccctttt ttaactactt tcattatatt 16860 gtcctagatt tggggtggtt ggggttatct tcaaggtggc tctggtgcct ctgacgttcg 16920 ttcttcaggt gcttccttag tacctgacac agtaagataa ctttgtcttc tgagctccaa 16980 tcggtgattc atttcctttt ctctctctct ttctctctct ctctctctct ctctctctcc 17040 ctctctctct ctctctctct ctctctctct ctcaggatag aatttagaga tcagtctaag 17100 tatactaatt gctatctaaa tgtcactaat tataatcctg tccaaattag aactaaaaag 17160 tatgtttggg gctggcattc agtcaatagt acttgttcct gcagaaaacc caggtttgat 17220 tgctagtacc cacatggtaa ctcacactga aactgattcc aggggaccca gtgccctctt 17280 ctgatctgtg gagcaccaga tacccagggt gcacagatta tacatgtgga caaaatgctc 17340 acacataaaa ttaaacagta tctttaaaaa catgcaggac aacacgtgtc tactaaaaat 17400 cacatgatta tatactactt tttcatttaa tctttaaaat tagtgcttca aagctatttg 17460 tggcttttct aaaaatgtgt gcaggagata tcaagggatg aaccatgctt gaactgtcct 17520 taaaaatgga tagaaaccat gttctatatt tcttttgtgt gcatttactt actattccca 17580 gtttctgtgt ccaccccttc tatacccact tgtcatgtat tcccaacaaa cacttgcaca 17640 actccgtggt gtagacagtg ctaattacag tactgatggt gtagaagcaa aagtgcataa 17700 caaccttcag aaacttaaat cttgttttgt ttgtttgttt tttaaaaagg agatcagcag 17760 gctccagctc cagctggaca ggttgattat acaaaggctt gggaagaata ctacaagaaa 17820 atgggtatgc tctacagttt acgtcttatc ctttatctta gtaactaaac ggaagtaaat 17880 acacattaca aagctagaga tgagtaacaa aacatttgct tgtttttaaa aaagaatact 17940 tgaggtaact catccgtatg tttttataat gttaaagttt atattaaaca agctaggcag 18000 tggtgatacc tgcctttaat cccagtactt ggaaggtaga ggaaggtaga tctccgagtt 18060 tgaggccagc cttgtctaca aagcaagttc caggacactt gggactctta gacagagaaa 18120 ccccatcttg aaaaacaaaa ataataataa acaggaaagg tgacatcctg aaattgactg 18180 gaagttaaga catattaaga gcaattcaag aaattcttat aattgtgctt atggcagaga 18240 aatacaattg tcagcaagtt aataattaaa acctggcatt tccttactag gtaataatat 18300 atggctttat tactgtactt ttgtgtagtg gtctaaatgg aatgagatta aattttaggc 18360 cagcaaagta gttgtatcac tggctttact gcaaaataag cataaaatta gcccacagtg 18420 acattgcttt acatttctaa acatttgcat gcattgaaaa ggaaaaaagg gtgacctttt 18480 aaaaagattt tgacaactat tgaacgtaat tcttaacata accatagtga ttgtgttaat 18540 gtatttcttg tcggtgatac agctttcgac aaagttcctt tcagaacaac tgtttgggga 18600 aatgtgataa caaacttctg cagtgaacag atgggctgat aacttttctt aacctcactg 18660 atcgcaggca ggttctaaca gatggacctt agcactagaa acttgaaacc tgccgggcgt 18720 ggtggcacac acctttaatc ccagcacttg gtgggcagag gcaggcagat ttctgagttc 18780 gaggacagcc tggtctacag agtgagttcc atccaggaca gccagggcta cacagagaaa 18840 ccctgtttgg ggcctggggg gaagaaactt gaaaccttaa aacaatattg tgtgtaatta 18900 gaatgcttac ataatttctt ctctgaactg tgatattttt gagagtagat ggaaatgtat 18960 taatcattcc gtggtagccg tgctgaaata gtgctacttg tttataagaa gctgagcatg 19020 ccaaggtgaa agtgcgctaa ctccattgtt tgtttttact gtgtgagtgt tgattgggta 19080 gaaacctggt aactggacta cgtaattaag acagagtaag gtatttgtct gtgctcgatt 19140 atgtcatgtt atttgtttac atgacttcaa ataagtttta tagatatttt gcattctgta 19200 ttcttaaaaa gtatattgac taggactttt gagagtaggt attttaactc aattaggttt 19260 tagtttttaa tattctagca ctttccagca cacagttctg tgaattcctc ttcttctaat 19320 tattattatt attattagag atttatttat tttatgtata tgaatgcact gtagctgtac 19380 agatggttgt gagccttcat atggttgttg gaaattgaat tttaagaact ctgctcaatc 19440 cgacccaaag atttatttac tgtcataaat aagtacaccg ttgctgactt cagacatacc 19500 agaagagggc atcatatctc actatgggtg gttgtgagct accatgtggt tgctaggatt 19560 tgaactcagg accttgagaa gagtagtact cttactcgct gagccgtctc ccagcccgaa 19620 ttcctgttct tggttgttat gtctaccgat caatcagttg gcatacatag agacagacac 19680 acacagacag cagcatcgtg caggataact atttggagac tcattttctt catttgtgct 19740 tttttgtaat tatgttgaag atcttaatcc tgtgagcaaa aaaagactaa ctgaacaatt 19800 ccctgtcata tagatcttga aagatactgt tttaggtaat ttaattaatc attgaattag 19860 tatttttaat tatatgatag ttataaaaat catttttccc tgtaaaacat ttaactacaa 19920 tttttttctg aaagtatggt ccttgatata ttttttagta taatcatgaa ttaagagacc 19980 ttaaagcaaa aggttcagaa tagaagctca ggagatagat gggtaagagt gcttaatgac 20040 ctgggttcaa atcccactac ctatcttaaa agccaatcat gactgttgca tgttgggaag 20100 cagttgcagg agcttgctag ccaactgtgg attcagtaaa aggagcaggg gaataaggta 20160 cagagggata gaagaaggca aaggcaggca gatttctgag ttcgaggcca gcctggtctg 20220 caaagtgagt tccaggacag ccagggctat acagagaaac cctgtctcga aaaaaaagaa 20280 aaagaaactc atttgcagtt aacttgcttg tttacaaaat tcattaagta tttctagaat 20340 tcgattttta tcatttgata actcagaatg gtcacttaaa acaaaattac taataaacgc 20400 tgagttttgg gctggtgaga tcgctcagtg ggtaagagca ccctactgct cgtccgaagg 20460 tccggagttc aaatcccagc aaccacatgg tggctcacaa caaccatctg taacaagatc 20520 tgacaccctc ttctggagtg tctgaagaca gctacagtgt acttacatat aataaataaa 20580 taaatcttta aaaaaaaaaa gctgagtttt acatctttca ttgaacttta tttcagctgc 20640 caggttattt ttagtaaagc tgtgatataa actcagtatg tcttttgctt cattgtgtgt 20700 gtcataaata tctttcagta cttctctgta gtttaagact agtaatatag tgacccaaat 20760 ggatagaaga gtggtgagct aggtatggtg gcacatatac gcatttagtc ctagtgctca 20820 ggaggcagaa gcaggtagat ctccaaggat gaggtcagcc ctggatagtg agaccctttc 20880 tcagttagca aaaaaaaaaa acaaagcgtt tcttctttcc ttgtcaaaga ttatatctga 20940 attttcccct ttgtttaaag gtatgtgagt ttgggtcatt ttgtctttta ctaatcaagc 21000 tgaactaaga gactgaaact tgtgattgaa gtgaaaagag tatctttgcc gtttcttgtg 21060 tgctgcactt tcccccctca tcctccctcc cttgtctaag gcatatttaa gataaacaga 21120 aactgaaggg gcaatgaggc acagataatc ctagcacgtg ggaagttgcc aagaggataa 21180 caagttttga gccacctgtg ctacataagt gaaaccctgt gttgagataa aaacaagagc 21240 tattgcccct ctgtgccttg cattataagc tgtacttaat ggtacataca tttttgtatt 21300 aaagttgagg gggtgtttta ggtcacaagg gcagacacga ggttattaaa aggcttggaa 21360 gaagtattaa aaaggcaaga tgctgtgttt actagagaag agttactgtg agatttgtaa 21420 ttatagcagc aataaagttc tctgttttcc tgaaggtcaa gcagttcctg ctcctgctgg 21480 ggccccacca ggtggtcagc cggattatag tgcagcctgg gctgagtact atagacagca 21540 agcagcgtat tatgcccaga caagtcccca ggggatgccg cagcatcctc cagcacctca 21600 ggtagaaaac atttgctatt ttttttgttt tgtttttgtt tttgttttcc actccaacca 21660 tgttttctgc atgtttgtct gtttgggaat gaatatgttt tacttggtaa agtataacta 21720 catgaaatat cgtgttgtgt ttggggactc agtttttcta ataatgtttt ctggcatctg 21780 agtgctattt ttgtaatgcc tttgatttta aaaataaatt ttcttccccc cagggatttg 21840 caaatcatgc aagaagccac catcatttat attaaccagt ttttctttct taaaggattc 21900 actcctgaat tagctccatt taaaggattt tctttaactt tttgtgtatc tcttatgtat 21960 ctcttctgca cagggccaat aataagaagt ggacaataca gtatttgctt cattgtgtgg 22020 gggaaaaaac ctttgttaaa tatatggatg cagacgactt gatgaagatc ttaattttgt 22080 ttttggttta aagtagtgtt tttttccccc cctttttttt tattttgaaa atgtacaaaa 22140 taactatcac tactgatagg aggttaatat ttctgtgtag aaatgaaaat tggtttgttt 22200 ttagtcttta gtgtagatgt acacattcca gcaaatgtat ttgcaactat tatgtggtcg 22260 atgctttgtg atataaatgt actttttcaa tgtatacttt cacttttaaa atgcctgttt 22320 tgtgctttac aataaatgat atgaaacctc ctgtgtcggt aagttggata tgtgggtaaa 22380 ggattcatag tttcttagca gtgataaatt aagatacatg tacacgaata tataagcttt 22440 ccccatgaat tactgagttt ttaaacactg gcatgttttt tcccctgttg gagtatagtg 22500 gtagattgga ggttcttttc tgttgtattt ggctatttca gcacaagtaa tcctgatatt 22560 ttcatgtttt tccttctatt tgattaaaaa ctgcatgtgt atacaatgat ctttagtata 22620 cttccattgc attaacagtg acatttcctt ttatacatga gcactatttc agacctgtac 22680 cgctgctaca acagttaacc ttcctgttct tcacttattt ccgagactgt ttcagcataa 22740 ctaattttga acagtttgca gacagtgatt tgaggagttt ataagaaaca ttgttttttt 22800 catgtaaagc aactctttcc atgtatatat atatattata atagtgtgtt tctctctaaa 22860 ttcaggatag aaaagtaata gaatgtgaaa gtatagctac attgcatctg ccattgaaac 22920 atttggggta tgaaaatgtt caagcttttt ttttcttttt gcagtataga taagctttgt 22980 cttgtaattg cacaagtcca gtcattgaat caaattaatt tttttatgta ctgaatcatt 23040 ttattaatct ttaacattca tgctgaagtt ctgatatttt gttgaaaacc attgttttac 23100 tctgcatatt tgttggctct ttgcatatta atatattaga ctacatgcaa atacagtctg 23160 tcttgccatt gtctgttgaa gtgcaggttt gatccagcca gtatagaact agctctgtag 23220 gggtgaggag gactgtgctg tgtatcatcc ttgattgtgt tccttcaagg agcattgcac 23280 tgtaagtaca tcagagtgac aaattgatga actgcaacag tgtctttttg tcgatgttcc 23340 acataatgca attgctatat tttgtgtgac tattatgttg gaatacagtg ctgtcatggg 23400 aaaccataac tgcttcttaa catagaataa tacatagttc tgtatttttt ttaagtgagc 23460 ttaatgggta agtatttttg atatgcttta gctaatagct aaagaaaatt gatcagtaac 23520 aaagttgaat agtattatca gtgctcctaa aatgctgttt ttcagtgtaa aatatgccta 23580 tcttttatag tgatatgaaa aacttgaaat gtttaagaca gaagtgcttt tcagtttgca 23640 aagtttaagg acttaacgcc ttttcattaa atgttagttc tatcatctgt ggggagcacc 23700 atttgtatga ggacaaaaat gttgaggtta tagggcagaa aatagtacag ctcattgtgg 23760 atgttttgaa atgttttttg attgttttat gtaacttagt gacttccctt ccccttattt 23820 agatctggat gcatagctct agtatgaagt ttaatagtaa tagttaaggc cttacctgtt 23880 aagatcttaa gtgtagggta ttgacatgaa cagtttcagt attttgcatg atattgttgc 23940 atagatgacc taggaaagtg ttgtggtgca tttagtaatt aaactgaagg aaatagttgg 24000 attcagtatc ataattcaca aattggaggc tgttgatttt gattcgttta aaatttaaaa 24060 tctttattaa ttgcaaacag tgcaattatt tatacttcac agtgccttcc cagaccttcc 24120 accttaggtt ctgctgcaaa aagcaacagg taagcacaac ctaaggccat ctctatataa 24180 atatatcagt acatacatgt tgtccctgtg aggtttgtgg ttgtgtactc actcaagcaa 24240 tctgctgctg ccgctgcccc aaatgtactt tgttatttat ggtaccattc tagtggaaag 24300 tctgttaagt tgttcaagca actgtttaca attttgggtg atgttttgtt tttggttttt 24360 ttgggttttt tttttcccca ttaaaatgag tagattgctg caataactga aaaacatcca 24420 aatctttttg tgcacccctc ctctcccaga gttatagaaa tgtttaagaa cacttcagta 24480 gttgagacat aggaaatcat ttggtcagaa atttcaacag ccttcacagc ccgtttgtat 24540 gagtaacagg aaattctctt tgccctccaa atctgatctt tttatagttt tatttttatt 24600 atttttcccc tgtattagta ctgctttaaa gtacagtaat tcagtgagat cgttttggtt 24660 cagtttcata gacagttcta ttttcatgac ttgtatttgc tgacaaggaa gaataaagaa 24720 tactggcagt aagttttggg aaaggcatgt gcatcagtga aatgttactt gtataacaaa 24780 taacctttca taatctgcat aaccagtagt ttctgattta taatatttta ataactgact 24840 gcatttattt ttgccagttt aaaatgtttt gtgttcttag gattgatgtt tagtgcatat 24900 tttgagttaa atgactatct taaagcagca ccatatcagt tgtttttatt cattttctaa 24960 aatgtgctga tcctattaaa aactcctgct tatcttttac aacaaagaaa aatattcaaa 25020 aatactgcct tcattttcac acacagtgct gaagatgctg caagcaccaa atcatagctc 25080 ataaaatcag gtcctgagat agttacccat aaagaggaat cctttgagtg tatgccattg 25140 gtgagccgat gagcatggac catagaaggg ctcaatgtag aaggtaaaat tggcaaatca 25200 taattgagaa atatgactgt gttcccatac ataatatggt atagggtgta atgtacctgc 25260 tcttgatcac tttcatttta aagtgctatt cacttaaatg ttccatgaat tgtttattgc 25320 accacagttt gtgtgtgtgt gtgtgtgtga gagagagaga gagagagaga gaaataggtc 25380 agatcagtat gttgcaagca gatctttaga gcctgtcaag ttttggttag ttgtagtttc 25440 catttggaaa tgtagatgaa tgcttgtaga tattggagat tgtttctatc ttgtaagaac 25500 ttttcactgg tgctgtaagc atttcaaata gcaccagtct taacctttaa atgggaagta 25560 gaaaaggtga gcccaaagtt tacagatgat tttaatgcta tacatgttag tgtagtgata 25620 cttagaatgc tttgtttgat gtttatttca gaaatgcgta tactagaaaa tcattttaat 25680 attaaaactg gtgacttaat actagttgta aagtgttttc ttaaagaagg atcttggtac 25740 ttaattgata aagtgggttt agataggagt agcaagtgct ctcgatagag aaagtttttg 25800 ttcacttcaa tactttgtca ttacaaccag ttcttcctga aaatagttac atgtctagta 25860 aattgatgta gaattaactc gctggagata atctcatttt agttctgcaa attctgcctg 25920 gctttaaaat gcattttcat aatacttaga aataatttga ctgaaaataa ctgctttttt 25980 atttaatcag tcaatcaact tttactacaa atttaattga gggatttttt aatttaattg 26040 gtgctttaaa gaagcaaata aatccctggg ttttgttttc ttcagtaaat atcctaaaga 26100 aactctttaa tgtatttgcg agtatatata tattttctta tgcatgctcg atgcattttc 26160 gtcctgagaa aagtgttctc tacagaaact acccgtgtgt taaaagaaga ttggcttaaa 26220 atggctactg tgatgggaac agtgtcttag ggagatgcag cttggacttg aggtaaattg 26280 aatactttac aaactggctt agagttttgc tttaatgtca ttatatgtaa aagggcacat 26340 gattattgta attttgtatt ctttatggtt tccttaatta aaataataaa tgtacagtga 26400 ttact 26405 <210> 6 <211> 17 <212> DNA <213> artificial <220> <223> Oligonucleotide targeting FUBP1 <400> 6 cttatgcttt ttatggt 17 <210> 7 <211> 18 <212> DNA <213> artificial <220> <223> Oligonucleotide targeting FUBP1 <400> 7 cttatgcttt ttatggtt 18 <210> 8 <211> 17 <212> DNA <213> artificial <220> <223> Oligonucleotide targeting FUBP1 <400> 8 gctttttatg gtttcac 17 <210> 9 <211> 18 <212> DNA <213> artificial <220> <223> Oligonucleotide targeting FUBP1 <400> 9 tatgcttttt atggtttc 18 <210> 10 <211> 22 <212> DNA <213> artificial <220> <223> Target region within FUBP1 <400> 10 gtgaaaccat aaaaagcata ag 22 <210> 11 <211> 18 <212> DNA <213> artificial <220> <223> Target region within FUBP1 <400> 11 aaccataaaa agcataag 18 <210> 12 <211> 19 <212> DNA <213> artificial <220> <223> Sequence of Compound ID No 50_1 of WO 2019/193165 <400> 12 ccatttcttc ctattacaa 19 <210> 13 <211> 18 <212> DNA <213> artificial <220> <223> Sequence of Compound ID No 53_1 of WO 2019/193165 <400> 13 gctttttatg gtttcacc 18 <210> 14 <211> 20 <212> DNA <213> artificial <220> <223> Sequence of Compound ID No 54_1 of WO 2019/193165 <400> 14 atgcttttta tggtttcacc 20 <210> 15 <211> 20 <212> DNA <213> artificial <220> <223> Target region within FUBP1 <400> 15 gtgaaaccat aaaaagcata 20 <210> 16 <211> 18 <212> DNA <213> artificial <220> <223> Oligonucleotide targeting FUBP1 <400> 16 ttatgctttt tatggttt 18 <210> 17 <211> 18 <212> DNA <213> artificial <220> <223> Oligonucleotide targeting FUBP1 <400> 17 atgcttttta tggtttca 18 <210> 18 <211> 18 <212> DNA <213> artificial <220> <223> Oligonucleotide targeting FUBP1 <400> 18 accaattttc atttctac 18 <210> 19 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Target region within FUBP1 <400> 19 gtagaaatga aaattggt 18 <210> 20 <211> 19 <212> DNA <213> artificial <220> <223> Oligonucleotide targeting FUBP1 <400> 20 atattaacct cctatcagt 19 <210> 21 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide targeting FUBP1 <400> 21 aatattaacc tcctatcag 19 <210> 22 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide targeting FUBP1 <400> 22 cccataacca tagtcat 17

Claims (17)

  1. 다음으로 구성된 안티센스 올리고뉴클레오타이드의 군으로부터 선택된 안티센스 올리고뉴클레오타이드로서:
    CTtAtgctttttatGgTT (서열번호 7),
    AcCAAttttcatttCtAC (서열번호 18),
    CTTatGctttttatgGT (서열번호 6),
    CTTaTgctttttatgGT (서열번호 6),
    CTtATgctttttatgGTT (서열번호 7),
    CTtAtgctttttatgGTT (서열번호 7),
    CTtAtgctttttatGGTT (서열번호 7),
    GcttTttatggtTtCAC (서열번호 8), 및
    TATgcTttttatggtTTC (서열번호 9),
    여기서 대문자는 베타-D-옥시 LNA 뉴클레오사이드이고, 소문자는 DNA 뉴클레오사이드이고, 모든 LNA C는 5-메틸 시토신이고, 모든 뉴클레오사이드간 연결은 포스포로티오에이트 뉴클레오사이드간 연결인, 안티센스 올리고뉴클레오타이드.
  2. 제1항의 안티센스 올리고뉴클레오타이드, 및 상기 안티센스 올리고뉴클레오타이드에 공유적으로 부착된 적어도 하나의 접합체 모이어티를 포함하는, 접합체.
  3. 제2항에 있어서, 적어도 하나의 접합체 모이어티는 아시알로당단백질 수용체(asialoglycoprotein receptor)에 결합할 수 있는, 접합체.
  4. 제2항 또는 제3항에 있어서, 접합체 모이어티는 도 9의 3가 GalNAc 모이어티들 중 하나로부터 선택되는, 접합체.
  5. 제4항에 있어서, 접합체 모이어티는 도 9D1 또는 9D2의 3가 GalNAc 모이어티 또는 이들의 혼합물인, 접합체.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 안티센스 올리고뉴클레오타이드와 접합체 모이어티 사이에 위치하는 링커를 포함하는, 접합체.
  7. 제6항에 있어서, 링커는 2 내지 5개의 연속적인 포스포디에스테르 연결된 뉴클레오사이드를 포함하거나 이로 구성된, 접합체.
  8. 도 1, 도 2, 도 3, 도 4, 도 5, 도 6, 도 7, 도 8 및 도 8.1에 도시된 접합체 군에서 선택된 접합체.
  9. 제1항의 올리고뉴클레오타이드 또는 제2항 내지 제8항 중 어느 한 항에 따른 접합체의 약학적으로 허용되는 염.
  10. 제1항의 안티센스 올리고뉴클레오타이드, 제2항 내지 제8항 중 어느 한 항의 접합체 또는 제9항의 약학적으로 허용되는 염, 및 약학적으로 허용되는 희석제, 용매, 담체, 염 및/또는 보조제를 포함하는 약학 조성물.
  11. FUBP1을 발현하는 표적 세포에서 FUBP1 발현을 조절하는 생체내 또는 시험관내 방법으로서, 상기 방법은 제1항의 안티센스 올리고뉴클레오타이드, 제2항 내지 제8항 중 어느 한 항의 접합체, 제9항의 약학적으로 허용되는 염, 또는 제10항의 약학 조성물을 유효량으로 상기 세포에 투여하는 것을 포함하는, 방법.
  12. 질환에 걸린 또는 걸리기 쉬운 대상체에게 제1항의 안티센스 올리고뉴클레오타이드, 제2항 내지 제8항 중 어느 한 항의 접합체, 제9항의 약학적으로 허용되는 염 또는 제10항의 약학 조성물의 치료적 또는 예방적 유효량을 투여하는 것을 포함하는 질환의 치료 또는 예방 방법으로서, 이때 질환은 B형 간염 바이러스(HBV) 감염 및/또는 암인, 방법.
  13. 약제에 사용하기 위한, 제1항의 안티센스 올리고뉴클레오타이드, 제2항 내지 제8항 중 어느 한 항의 접합체, 제9항의 약학적으로 허용되는 염 또는 제10항의 약학 조성물.
  14. B형 간염 바이러스(HBV) 감염 및/또는 암의 치료 또는 예방에 사용하기 위한, 제1항의 안티센스 올리고뉴클레오타이드, 제2항 내지 제8항 중 어느 한 항의 접합체, 제9항의 약학적으로 허용되는 염 또는 제10항의 약학 조성물.
  15. B형 간염 바이러스(HBV) 감염 및/또는 암의 치료 또는 예방용 약제의 제조를 위한, 제1항의 안티센스 올리고뉴클레오타이드, 제2항 내지 제8항 중 어느 한 항의 접합체, 제9항의 약학적으로 허용되는 염 또는 제10항의 약학 조성물의 용도.
  16. 제12항, 제14항 및 제15항 중 어느 한 항에 있어서, 질환은 B형 간염 바이러스(HBV) 감염, 예를 들어, 만성 HBV 감염인, 방법, 안티센스 올리고뉴클레오타이드, 접합체, 약학 조성물 또는 약학적으로 허용되는 염, 또는 용도.
  17. 제12항, 제14항 및 제15항 중 어느 한 항에 있어서, 질환은 암, 예를 들어, 간세포 암종인, 방법, 안티센스 올리고뉴클레오타이드, 접합체, 약학 조성물 또는 약학적으로 허용되는 염, 또는 용도.
KR1020237002523A 2020-06-26 2021-06-25 Fubp1 발현을 조절하기 위한 개선된 올리고뉴클레오타이드 KR20230028475A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20182437.2 2020-06-26
EP20182437 2020-06-26
PCT/EP2021/067550 WO2021260197A1 (en) 2020-06-26 2021-06-25 Enhanced oligonucleotides for modulating fubp1 expression

Publications (1)

Publication Number Publication Date
KR20230028475A true KR20230028475A (ko) 2023-02-28

Family

ID=71170391

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237002523A KR20230028475A (ko) 2020-06-26 2021-06-25 Fubp1 발현을 조절하기 위한 개선된 올리고뉴클레오타이드

Country Status (16)

Country Link
US (1) US20220031730A1 (ko)
EP (1) EP4171575A1 (ko)
JP (1) JP2023531249A (ko)
KR (1) KR20230028475A (ko)
CN (1) CN116033908A (ko)
AR (1) AR122731A1 (ko)
AU (1) AU2021295609A1 (ko)
BR (1) BR112022026612A2 (ko)
CA (1) CA3186722A1 (ko)
CO (1) CO2023000116A2 (ko)
CR (1) CR20220645A (ko)
IL (1) IL299269A (ko)
MX (1) MX2022016280A (ko)
PE (1) PE20230613A1 (ko)
TW (1) TW202216999A (ko)
WO (1) WO2021260197A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115851725A (zh) * 2022-10-28 2023-03-28 珠海市人民医院 一种抑制解螺旋酶Ⅴ基因表达的siRNA及其应用

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3756313B2 (ja) 1997-03-07 2006-03-15 武 今西 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体
AU9063398A (en) 1997-09-12 1999-04-05 Exiqon A/S Oligonucleotide analogues
NZ513402A (en) 1999-02-12 2003-06-30 Sankyo Co Novel nucleosides and oligonucleotide analogues
CN102180924A (zh) 1999-05-04 2011-09-14 桑塔里斯制药公司 L-核糖-lna类似物
US6617442B1 (en) 1999-09-30 2003-09-09 Isis Pharmaceuticals, Inc. Human Rnase H1 and oligonucleotide compositions thereof
AU2003264441A1 (en) 2002-09-17 2004-04-08 The Circle For The Promotion Of Science And Engineering Method of screening remedy for proliferative disease
ES2607471T3 (es) 2002-11-18 2017-03-31 Roche Innovation Center Copenhagen A/S Diseño antisentido
WO2007031091A2 (en) 2005-09-15 2007-03-22 Santaris Pharma A/S Rna antagonist compounds for the modulation of p21 ras expression
ES2516815T3 (es) 2006-01-27 2014-10-31 Isis Pharmaceuticals, Inc. Análogos de ácidos nucleicos bicíclicos modificados en la posición 6
US7666854B2 (en) 2006-05-11 2010-02-23 Isis Pharmaceuticals, Inc. Bis-modified bicyclic nucleic acid analogs
AU2007249349B2 (en) 2006-05-11 2012-03-08 Isis Pharmaceuticals, Inc. 5'-Modified bicyclic nucleic acid analogs
AU2008260277C1 (en) 2007-05-30 2014-04-17 Isis Pharmaceuticals, Inc. N-substituted-aminomethylene bridged bicyclic nucleic acid analogs
EP2173760B2 (en) 2007-06-08 2015-11-04 Isis Pharmaceuticals, Inc. Carbocyclic bicyclic nucleic acid analogs
CN101796062B (zh) 2007-07-05 2014-07-30 Isis制药公司 6-双取代双环核酸类似物
US8546556B2 (en) 2007-11-21 2013-10-01 Isis Pharmaceuticals, Inc Carbocyclic alpha-L-bicyclic nucleic acid analogs
EP2356129B1 (en) 2008-09-24 2013-04-03 Isis Pharmaceuticals, Inc. Substituted alpha-l-bicyclic nucleosides
US9012421B2 (en) 2009-08-06 2015-04-21 Isis Pharmaceuticals, Inc. Bicyclic cyclohexose nucleic acid analogs
EP2580228B1 (en) 2010-06-08 2016-03-23 Ionis Pharmaceuticals, Inc. Substituted 2'-amino and 2'-thio-bicyclic nucleosides and oligomeric compounds prepared therefrom
WO2012143379A1 (en) 2011-04-20 2012-10-26 Roche Glycart Ag Method and constructs for the ph dependent passage of the blood-brain-barrier
WO2013022966A1 (en) 2011-08-11 2013-02-14 Isis Pharmaceuticals, Inc. Linkage modified gapped oligomeric compounds and uses thereof
WO2013154798A1 (en) 2012-04-09 2013-10-17 Isis Pharmaceuticals, Inc. Tricyclic nucleic acid analogs
MX363068B (es) 2012-11-15 2019-03-07 Roche Innovation Ct Copenhagen As Conjugados de oligonucleotido.
PL2992009T3 (pl) 2013-05-01 2020-11-30 Ionis Pharmaceuticals, Inc. Kompozycje i sposoby modulowania ekspresji apolipoproteiny(a)
PE20160158A1 (es) 2013-06-27 2016-03-18 Roche Innovation Ct Copenhagen As Oligomeros antisentido y conjugados con diana en pcsk9
CA2935426C (en) 2014-01-30 2023-07-25 F. Hoffmann-La Roche Ag Polyoligomer compound with biocleavable conjugates for reducing or inhibiting expression of a nucleic acid target
GB201408623D0 (en) 2014-05-15 2014-07-02 Santaris Pharma As Oligomers and oligomer conjugates
SG11201702877TA (en) 2014-10-10 2017-05-30 Hoffmann La Roche Galnac phosphoramidites, nucleic acid conjugates thereof and their use
US20180023081A1 (en) 2015-02-04 2018-01-25 Bristol-Myers Squibb Company Lna oligonucleotides with alternating flanks
KR102468177B1 (ko) 2016-04-14 2022-11-16 에프. 호프만-라 로슈 아게 트리틸-모노-GalNAc 화합물 및 이의 용도
AU2019247645A1 (en) 2018-04-05 2020-10-15 Centre Leon Berard Use of FUBP1 inhibitors for treating hepatitis B virus infection

Also Published As

Publication number Publication date
WO2021260197A1 (en) 2021-12-30
CN116033908A (zh) 2023-04-28
AU2021295609A1 (en) 2023-01-19
CO2023000116A2 (es) 2023-03-27
AR122731A1 (es) 2022-10-05
EP4171575A1 (en) 2023-05-03
CR20220645A (es) 2023-02-17
BR112022026612A2 (pt) 2023-01-24
MX2022016280A (es) 2023-02-09
IL299269A (en) 2023-02-01
US20220031730A1 (en) 2022-02-03
JP2023531249A (ja) 2023-07-21
PE20230613A1 (es) 2023-04-13
CA3186722A1 (en) 2021-12-30
TW202216999A (zh) 2022-05-01

Similar Documents

Publication Publication Date Title
AU2016225852B2 (en) Modulation of alpha synuclein expression
KR102391812B1 (ko) B형 간염 감염을 치료하기 위해 PAPD5 또는 PAPD7 mRNA를 감소시키기 위한 핵산 분자
RU2748426C2 (ru) Композиции для модуляции экспрессии c90rf72
RU2730677C2 (ru) Соединение для модуляции экспрессии гена c9orf72 и его применение
KR102482440B1 (ko) 부계 ube3a 발현을 유도하기 위한 올리고뉴클레오티드
DK2906256T3 (en) SELECTIVE ANTISENSE COMPOUNDS AND APPLICATIONS THEREOF
CN107427532B (zh) 用于调节c9orf72表达的组合物
DK2742135T3 (en) BINDING MODIFIED GAPPED OLIGOMERIC COMPOUNDS AND APPLICATIONS THEREOF
DK2534248T3 (en) SELECTIVE REDUCTION OF ALLELVARIANS
KR20200140805A (ko) Camk2d 안티센스 올리고뉴클레오티드 및 그의 용도
AU2018203564A1 (en) Antisense modulation of gccr expression
KR20150030205A (ko) Smn 유전자 패밀리 발현을 조절하기 위한 조성물 및 방법
KR20200140853A (ko) B형 간염 바이러스 감염을 치료하기 위한 fubp1 억제제의 용도
AU2021203300B2 (en) Nucleic acid molecule for reduction of PAPD5 and PAPD7 mRNA for treating hepatitis B infection
KR20210008497A (ko) Atxn3 발현 감소용 화합물 및 방법
KR20200109338A (ko) 알파-시누클레인 안티센스 올리고뉴클레오티드 및 이의 용도
KR20230143199A (ko) 타우 발현을 조절하기 위한 올리고뉴클레오티드
US6448080B1 (en) Antisense modulation of WRN expression
KR20200108315A (ko) Tmem106b의 발현을 조절하기 위한 올리고뉴클레오티드
TW202221014A (zh) 用於減少app表現之化合物及方法
KR20230028475A (ko) Fubp1 발현을 조절하기 위한 개선된 올리고뉴클레오타이드
US20040115641A1 (en) Modulation of ROCK 1 expression
TW202221123A (zh) 調節scn2a之化合物及方法
CN116157522A (zh) A1cf抑制剂用于治疗乙型肝炎病毒感染的用途
KR20230005933A (ko) Atxn1을 조정하는 화합물 및 방법