KR20210033004A

KR20210033004A - Rtel1의 발현을 조절하기 위한 올리고뉴클레오티드

Info

Publication number: KR20210033004A
Application number: KR1020217004297A
Authority: KR
Inventors: 마르코 버레라; 요제피네 펠버; 장-크리스토프 호플락; 수잔네 캄믈러; 토니 캄-통; 브라이언 레오나르드; 리케 페데르센; 필립 트로프베르거; 미리암 트리야트니; 다니엘 제레미 털리; 앙겔리나 발리어; 지타오 데이비드 장
Original assignee: 에프. 호프만-라 로슈 아게
Priority date: 2018-07-13
Filing date: 2019-07-11
Publication date: 2021-03-25
Also published as: SG11202100348SA; US20210147850A1; TW202020152A; CN112534055A; CL2021000018A1; IL279929A; CA3106288A1; BR112021000538A2; CR20210015A; TWI791868B; PE20211306A1; EP3821013A1; AU2019300324A1; MX2021000404A; JP2021524277A; WO2020011902A1

Abstract

본원 발명은 HBV 감염, 특히 만성 HBV 감염의 치료에서 이용을 위한 RTEL1 저해제에 관계한다. 본원 발명은 특히, cccDNA, 예컨대 HBV cccDNA를 불안정화하기 위한 RTEL1 저해제의 용도에 관계한다. 본원 발명은 또한, RTEL1에 상보적이고 RTEL1 mRNA를 감소시킬 수 있는 안티센스 올리고뉴클레오티드에 관계한다. 제약학적 조성물 및 HBV 감염의 치료 및/또는 예방에서 이의 용도 역시 본원 발명 내에 포함된다.

Description

RTEL1의 발현을 조절하기 위한 올리고뉴클레오티드

발명의 분야

본원 발명은 RTEL1에 상보적이고, RTEL1의 발현의 조절 또는 RTEL1 활성의 조절을 야기하는 RTEL1 저해제, 예컨대 올리고뉴클레오티드 (소중합체)에 관계한다. 본원 발명은 특히, B형 간염 바이러스 (HBV) 감염, 특히 만성 HBV 감염을 치료하고 및/또는 예방하는 데 이용을 위한 RTEL1 표적화 핵산 분자의 용도에 관계한다. 본원 발명은 특히, cccDNA, 예컨대 HBV cccDNA를 불안정화하기 위한 RTEL1 저해제의 용도에 관계한다. 제약학적 조성물 및 HBV 감염의 치료 및/또는 예방에서 이의 용도 역시 본원 발명 내에 포함된다.

배경

B형 간염은 역전사를 통해 복제하는 작은 간친화성 바이러스인 B형 간염 바이러스 (HBV)에 의해 유발되는 감염성 질환이다. 만성 HBV 감염은 심각한 간 질환, 예컨대 간경화증 및 간세포 암종에 대한 핵심 인자이다. 만성 HBV 감염에 대한 현재의 치료는 다중기능성 역전사효소인 바이러스 중합효소를 표적으로 하는 페길화된 1형 인터페론 또는 뉴클레오시(티)드 유사체, 예컨대 라미부딘, 아데포비르, 엔테카비르, 테노포비르 디소프록실 및 테노포비르 알라페나미드의 투여에 기초된다. 치료 성공은 통상적으로, B형 간염 표면 항원 (HBsAg)의 상실로서 계측된다. 하지만, 완전한 HBsAg 소실은 좀처럼 달성되지 않는데, 그 이유는 B형 간염 바이러스 DNA가 감염 후 체내에서 존속하기 때문이다. HBV 존속은 핵에서 안정되게 유지되는 HBV 유전체의 에피솜 형태에 의해 매개된다. 이러한 에피솜 형태는 "공유결합 폐쇄 환상 DNA" (cccDNA)로 불린다. cccDNA는 바이러스 복제 중간산물인 전유전체 RNA (pgRNA)를 비롯한, 모든 HBV 전사체에 대한 주형으로서 역할을 한다. cccDNA의 소수 사본의 존재가 완전히 진행된 HBV 감염을 재개하는 데 충분할지도 모른다. HBV에 대한 현재의 치료는 cccDNA를 표적으로 하지 않는다. 하지만, 만성 HBV 감염의 치유는 cccDNA의 제거를 필요로 할 것이다 (Nassal, Gut. 2015 Dec;64(12):1972-84. doi: 10.1136/gutjnl-2015-309809에 의해 검토됨).

말단소립 신장 헬리카아제 1 (RTEL1)의 조절인자는 말단소립의 안정성, 보호 및 신장에서 기능하고, 그리고 DNA 복제 동안 말단소립을 보호하는 것으로 알려진 셀테린 복합체에서 단백질과 상호작용하는 DNA 헬리카아제를 인코딩한다. 이러한 유전자에서 돌연변이는 선천성 각화이상증 및 Hoyerall-Hreidarsson 증후군과 연관되었다 (참조: 예를 들면, Vannier et al 2014 Trends Cell Biol. Vol 24 p.416에 의한 검토).

핵 내에 위치되면, RTEL1은 말단소립-길이 조절, DNA 수복 및 유전체 안정성의 유지에 연루된 ATP-의존성 DNA 헬리카아제로서 기능한다. RTEL1은 독성 재조합을 상쇄시키고, 감수분열 동안 교차를 제한하고, 가닥 침투 사건을 물리적으로 분리함으로써 감수분열 재조합 및 교차 항상성을 조절하고, 그리고 따라서 감수분열 합성 의존성 가닥 어닐링 (SDSA)뿐만 아니라 D 루프 재조합 중간체의 분해에 의해 비-교차 수복을 증진하는 항-재조합효소로서 행동한다. 게다가 RTEL1은 T 루프를 분해하고, 그리고 말단 G4-DNA 구조를 상쇄시킴으로써 말단소립 취약성을 예방하는데, 이들은 함께 말단소립의 동역학 및 안정성을 담보한다.

RTEL1은 siRNA 스크린에서 HPV 에피솜의 안정제로서 확인되었다: (Edwards et al 2013 PLoS One Vol 8, e75406). RTEL1을 표적으로 하는 siRNA가 Hoyeraal-Hreidarsson 증후군에서 RTEL1과의 반응물을 확인하는 데 유사하게 이용되었다 (Schertzer et al 2015 Nucleic Acid Res Vol 43 p. 1834). 이에 더하여, RTEL1은 HIV 감염 저해를 위한 표적을 제공하기 위한, 필수적인 숙주 단백질에 대한 siRNA 스크린으로부터 HIV 숙주 의존성 인자로서 확인되었다 (WO 2007/094818).

우리가 아는 바로는, RTEL1이 cccDNA 안정성 및 유지의 맥락에서 cccDNA 의존성 인자로서 확인된 바가 없을 뿐만 아니라, RTEL1을 저해하는 분자가 HBV 감염의 치료를 위한 cccDNA 불안정화제로서 제안된 바가 없다.

발명의 목적

본원 발명은 HBV 감염된 세포에서 RTEL1의 저해 및 cccDNA의 감소 사이에 상관관계가 있고, 이것이 HBV 감염된 개체의 치료에서 유의미하다는 것을 보여준다. 본원 발명의 목적은 HBV 감염된 세포에서 cccDNA를 감소시키는 RTEL1 저해제를 확인하는 것이다. 이런 RTEL1 저해제는 HBV 감염의 치료에서 이용될 수 있다.

본원 발명은 시험관내와 생체내에서 RTEL1의 발현을 저해할 수 있는 신규한 핵산 분자를 더욱 확인한다.

발명의 요약

본원 발명은 RTEL1의 발현을 조절할 수 있는 핵산을 표적으로 하는 올리고뉴클레오티드에 관계하고, 그리고 RTEL1의 기능에 관련된 질환을 치료하거나 예방하는 것에 관계한다.

따라서, 첫 번째 양상에서 본원 발명은 B형 간염 바이러스 (HBV) 감염의 치료 및/또는 예방에서 이용을 위한 RTEL1 저해제를 제공한다. 특히, cccDNA 및/또는 전유전체 RNA (pgRNA)를 감소시킬 수 있는 RTEL1 저해제가 유용하다. 이런 저해제는 유리하게는, RTEL1 mRNA를 감소시킬 수 있는 길이에서 12 내지 60개 뉴클레오티드의 핵산 분자, 예컨대 포유류 RTEL1에 상보적인 단일 가닥 안티센스 올리고뉴클레오티드, siRNA 또는 shRNA에서 선택된다.

추가의 양상에서 본원 발명은 포유류 RTEL1에 상보적인 적어도 10개 뉴클레오티드, 특히 16 내지 20개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는 12-60개 뉴클레오티드, 예컨대 12-30개 뉴클레오티드의 올리고뉴클레오티드에 관계한다. 이런 올리고뉴클레오티드는 RTEL1의 발현을 저해할 수 있다. 상기 올리고뉴클레오티드는 단일 가닥 안티센스 올리고뉴클레오티드 또는 shRNA 핵산 분자일 수 있다.

안티센스 올리고뉴클레오티드는 갭머 설계를 가질 수 있다. 바람직하게는, 안티센스 올리고뉴클레오티드는 표적 핵산의 개열에 의해 RTEL1의 발현을 저해할 수 있다. 개열은 바람직하게는 뉴클레아제 모집을 통해 달성된다.

추가의 양상에서, 본원 발명은 본원 발명의 안티센스 올리고뉴클레오티드 및 제약학적 부형제를 포함하는 제약학적 조성물을 제공한다.

추가의 양상에서, 본원 발명은 RTEL1을 발현하는 표적 세포에 본원 발명의 안티센스 올리고뉴클레오티드 또는 조성물을 효과량으로 투여함으로써, 상기 세포에서 RTEL1 발현의 조절을 위한 생체내 또는 시험관내 방법을 위한 방법을 제공한다.

추가의 양상에서 본원 발명은 RTEL1의 생체내 활성과 연관된 질환, 장애 또는 기능장애를 치료하거나 예방하기 위한 방법을 제공하는데, 이들 방법은 본원 발명의 안티센스 올리고뉴클레오티드의 치료 또는 예방 효과량을 상기 질환, 장애 또는 기능장애를 앓거나 또는 이것에 취약한 개체에게 투여하는 단계를 포함한다.

본원 발명의 추가 양상은 본원 발명의 핵산 분자의 접합체 및 본원 발명의 분자를 포함하는 제약학적 조성물이다. 특히 간을 표적으로 하는 접합체, 예컨대 GalNAc 클러스터가 관심된다.

도면의 간단한 설명
도 1: 예시적인 안티센스 올리고뉴클레오티드 접합체를 도해하는데, 여기서 올리고뉴클레오티드는 물결선 (A-D)으로서 또는 "올리고뉴클레오티드" (E-H)로서 또는 T₂(I)로서 표현되고, 그리고 아시알로당단백질 수용체 표적화 접합 모이어티는 삼가 N-아세틸갈락토사민 모이어티이다. 화합물 A 내지 D는 디-리신 가지치기 분자, PEG3 스페이서 및 3개의 말단 GalNAc 탄수화물 모이어티를 포함한다. 화합물 A 및 B에서 올리고뉴클레오티드는 링커 없이 아시알로당단백질 수용체 표적화 접합 모이어티에 직접적으로 부착된다. 화합물 C 및 D에서 올리고뉴클레오티드는 C6 링커를 통해 아시알로당단백질 수용체 표적화 접합 모이어티에 부착된다. 화합물 E-I는 상업적으로 가용한 트레블러 가지치기 분자 및 변하는 길이와 구조의 스페이서 및 3개의 말단 GalNAc 탄수화물 모이어티를 포함한다.

정의

HBV 감염

용어 "B형 간염 바이러스 감염" 또는 "HBV 감염"은 당해 분야에 통상적으로 공지되고, 그리고 B형 간염 바이러스 (HBV)에 의해 유발되고 간에 영향을 주는 감염성 질환을 지칭한다. HBV 감염은 급성 또는 만성 감염일 수 있다. 만성 B형 간염 바이러스 (CHB) 감염은 전 세계적으로 248 백만 명에게 영향을 주는 전체적 질환 부담이다. 연간 대략 686,000건의 사망이 HBV-관련된 말기 간 질환 및 간세포 암종 (HCC)에 기인한다 (GBD 2013; Schweitzer et al., 2015). WHO는 확대된 개입이 없다면, CHB 감염을 안고 살아가는 사람들의 숫자가 다가오는 40-50 년 동안 현재와 같은 높은 수준에 머물러 있을 것이며, 2015년 및 2030년 사이에 누적으로 20 백만 건의 사망이 발생할 것이라고 예측하였다 (WHO 2016). CHB 감염은 단일한 임상적 표현을 나타내는 균질한 질환이 아니다. 감염된 개체는 그들의 일생 동안 CHB-연관된 간 질환의 여러 시기를 겪게 된다; 질환의 이들 시기 또한, 관리 기준 (SOC)으로 치료에 대한 기초가 된다. 현재 지침은 3가지 기준 - 혈청 ALT 수준, HBV DNA 수준, 그리고 간 질환의 심각도에 근거하여 선별된 CHB-감염된 개체만을 치료하도록 권고한다 (EASL, 2017). 이러한 권고는 SOC, 다시 말하면, 뉴클레오시(티)드 유사체 (NA) 및 페길화된 인터페론-알파 (PEG-IFN)가 치유력이 없고 긴 기간 동안 투여되어야 하고, 따라서 그들의 안전성 위험이 증가한다는 사실에 기인하였다. NA는 HBV DNA 복제를 효과적으로 저해한다; 하지만, 이들은 다른 바이러스 마커에 대한 매우 한정된 효과를 갖거나/효과가 없다. HBV 감염의 2가지 홀마크, B형 간염 표면 항원 (HBsAg) 및 공유결합 폐쇄 환상 DNA (cccDNA)가 HBV 치유를 목적으로 하는 신규한 약물의 주된 표적이다. CHB 개체의 혈장에서, HBsAg 서브바이러스 (비어 있는) 입자는 103 내지 105의 계수로 HBV 비리온보다 숫자가 더 많다 (Ganem & Prince, 2014); 이의 과잉은 급성 HBV 감염의 해소 이후에 관찰되는 혈청학적 마커인 중화 항-HBs 항체를 개체가 발달시킬 수 없는 것을 비롯하여, 상기 질환의 면역병인에 기여하는 것으로 생각된다.

cccDNA (공유결합 폐쇄 환상 DNA)

cccDNA는 감염된 간세포의 핵 내에 체류하는 바이러스 유전적 주형인데, 여기서 이것은 생산적 감염에 필요하고 만성 HBV 감염의 자연 코스 동안 바이러스 존속을 책임지는 모든 HBV RNA 전사체를 생성한다 (Locarnini & Zoulim, 2010 Antivir Ther. 15 Suppl 3:3-14. doi: 10.3851/IMP1619). 바이러스 병원소로서 작용하는 cccDNA는 치료의 휴지 후 바이러스 반동의 근원이며, 장기간, 종종, 평생 치료를 필요하게 만든다. PEG-IFN은 이의 다양한 부작용으로 인해 CHB의 작은 부분집합에게만 투여될 수 있다.

결과적으로, HBV cccDNA의 분해 또는 제거에 의해 규정되는 완전한 치유를 대다수의 CHB 환자에게 전달할 수 있는 신규한 요법이 고도로 요구된다.

화합물

본원에서, 용어 "화합물"은 RTEL1 발현 또는 활성을 저해할 수 있는 임의의 분자를 의미한다. 본원 발명의 특정 화합물은 핵산 분자, 예컨대 본원 발명에 따른 RNAi 분자 또는 안티센스 올리고뉴클레오티드, 또는 이런 핵산 분자를 포함하는 임의의 접합체이다. 예를 들면, 본원에서 화합물은 RTEL1을 표적으로 하는 핵산 분자, 특히 안티센스 올리고뉴클레오티드 또는 siRNA일 수 있다.

올리고뉴클레오티드

본원에서 이용된 용어 "올리고뉴클레오티드"는 당업자에게 일반적으로 이해되는 바와 같이 2개 또는 그 이상의 공유 결합된 뉴클레오시드를 포함하는 분자로서 규정된다. 이런 공유 결합된 뉴클레오시드는 또한 핵산 분자 또는 소중합체로 지칭될 수 있는데, 이들은 교체가능하게 이용될 수 있다.

상세한 설명 및 청구항에서 지칭된 올리고뉴클레오티드는 일반적으로 길이에서 70개 미만 뉴클레오티드의 치료적 올리고뉴클레오티드이다. 올리고뉴클레오티드는 단일 가닥 안티센스 올리고뉴클레오티드이거나 또는 이를 포함할 수 있거나, 또는 다른 소중합성 핵산 분자, 예컨대 CRISPR RNA, siRNA, shRNA, 앱타머 또는 리보자임일 수 있다. 치료적 올리고뉴클레오티드 분자는 통상적으로 실험실에서 고체상 화학적 합성, 그 이후에 정제 및 단리에 의해 제조된다. 하지만, shRNA는 종종 렌티바이러스 벡터를 이용하여 세포에 전달되고, 이후 이들로부터 전사되어 RNA 간섭 기구 (RNA-유도 침묵 복합체 (RISC) 포함)와 상호작용할 수 있는 스템 루프 (헤어핀) RNA 구조를 형성할 단일 가닥 RNA를 생성한다. 본원 발명의 구체예에서 shRNA는 화학적으로 생산된 shRNA 분자이다 (플라스미드 또는 바이러스로부터 세포 기초된 발현에 의존하지 않음).

올리고뉴클레오티드의 서열을 언급할 때, 공유 결합된 뉴클레오티드 또는 뉴클레오시드의 핵염기 모이어티 또는 이의 변형체의 서열 또는 순서가 언급된다. 일반적으로, 본원 발명의 올리고뉴클레오티드는 인공적이고 화학적으로 합성되며 전형적으로 정제 또는 단리된다. 하지만 일부 구체예에서 본원 발명의 올리고뉴클레오티드는 표적 세포 내로 진입 시에 벡터로부터 전사되는 shRNA이다. 본원 발명의 올리고뉴클레오티드는 하나 또는 그 이상의 변형된 뉴클레오시드 또는 뉴클레오티드를 포함할 수 있다.

일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 길이에서 10 내지 70개 뉴클레오티드, 예컨대 길이에서 12 내지 60개, 예컨대 13 내지 50개, 예컨대 14 내지 40개, 예컨대 15 내지 30개, 예컨대 12-25개, 예컨대 16 내지 22개, 예컨대 16 내지 20개의 연속 뉴클레오티드를 포함하거나 또는 이들로 구성된다. 따라서, 본원 발명의 올리고뉴클레오티드는 일부 구체예에서, 12-25개 뉴클레오티드의 길이를 가질 수 있다. 대안으로, 본원 발명의 올리고뉴클레오티드는 일부 구체예에서, 15-22개 뉴클레오티드의 길이를 가질 수 있다.

일부 구체예에서, 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 24개 또는 그 이하의 뉴클레오티드, 예컨대 22개의 뉴클레오티드, 예컨대 20개 또는 그 이하의 뉴클레오티드, 예컨대 18개 또는 그 이하의 뉴클레오티드, 예컨대 14, 15, 16 또는 17개의 뉴클레오티드를 포함하거나 또는 이들로 구성된다. 본원에 제공된 임의의 범위는 범위의 종점을 포함하는 것으로 이해되어야 한다. 따라서, 핵산 분자가 12 내지 25개의 뉴클레오티드를 포함한다고 일컬어지는 경우에, 12개 및 25개의 뉴클레오티드 둘 모두 포함된다.

일부 구체예에서, 연속 뉴클레오티드 서열은 길이에서 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 또는 22개의 연속 뉴클레오티드를 포함하거나 이들로 구성된다.

올리고뉴클레오티드(들)는 포유동물에서 표적 핵산의 발현을 조절하기 위한 것이다. 일부 구체예에서, siRNA, shRNA 또는 안티센스 올리고뉴클레오티드와 같은 핵산 분자는 전형적으로 표적 핵산(들)의 발현을 저해하기 위한 것이다.

본원 발명의 구체예에서, 올리고뉴클레오티드는 RNAi 작용제, 예컨대 siRNA 또는 shRNA에서 선택된다. 다른 구체예에서, 올리고뉴클레오티드는 단일 가닥 안티센스 올리고뉴클레오티드, 예컨대 RNaseH와 상호작용하는 높은 친화성 변형된 안티센스 올리고뉴클레오티드이다.

일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 하나 또는 그 이상의 변형된 뉴클레오시드 또는 뉴클레오티드, 예컨대 2' 당 변형된 뉴클레오시드를 포함할 수 있다.

일부 구체예에서, 올리고뉴클레오티드는 포스포로티오에이트 뉴클레오시드간 연쇄를 포함한다.

일부 구체예에서, 올리고뉴클레오티드는 비-뉴클레오시드 모이어티 (접합 모이어티)에 접합될 수 있다.

올리고뉴클레오티드의 라이브러리는 변이체 올리고뉴클레오티드의 집합물인 것으로 이해되어야 한다. 올리고뉴클레오티드의 라이브러리의 목적은 변할 수 있다. 일부 구체예에서, 올리고뉴클레오티드의 라이브러리는 올리고뉴클레오티드의 라이브러리 내에 가장 강력한 서열을 확인하는 목적으로, 하나 또는 그 이상의 포유류 RTEL1 표적 핵산을 표적으로 하는 중첩되는 핵염기 서열을 갖는 올리고뉴클레오티드로 구성된다. 일부 구체예에서, 올리고뉴클레오티드의 라이브러리는 부모 또는 조상 올리고뉴클레오티드의 올리고뉴클레오티드 설계 변이체 (자식 핵산 분자)의 라이브러리인데, 여기서 이들 올리고뉴클레오티드 설계 변이체는 부모 핵산 분자의 코어 핵염기 서열을 유지한다.

안티센스 올리고뉴클레오티드

본원에서 이용된 용어 "안티센스 올리고뉴클레오티드"는 표적 핵산, 특히 표적 핵산 상의 연속 서열에 혼성화함으로써 표적 유전자의 발현을 조절할 수 있는 올리고뉴클레오티드로서 규정된다. 본원에서 안티센스 올리고뉴클레오티드는 본질적으로 이중 가닥이 아니고, 그리고 이런 이유로 siRNA 또는 shRNA가 아니다. 바람직하게는, 본원 발명의 안티센스 올리고뉴클레오티드는 단일 가닥이다. 본원 발명의 단일 가닥 올리고뉴클레오티드는, 내적으로 또는 상호간에 자기-상보성의 정도가 올리고뉴클레오티드의 전체 길이에 걸쳐 50% 미만인 한, 헤어핀 또는 분자간 이중나선 구조 (동일한 올리고뉴클레오티드의 두 분자 사이의 이중나선)를 형성할 수 있는 것으로 이해된다.

바람직하게는, 본원 발명의 단일 가닥 안티센스 올리고뉴클레오티드는 RNA 뉴클레오시드를 내포하지 않는데, 그 이유는 이것이 뉴클레아제 내성을 감소시킬 것이기 때문이다.

바람직하게는, 본원 발명의 올리고뉴클레오티드는 하나 또는 그 이상의 변형된 뉴클레오시드 또는 뉴클레오티드, 예컨대 2' 당 변형된 뉴클레오시드를 포함한다. 또한, 변형되지 않은 뉴클레오시드는 DNA 뉴클레오시드인 것이 바람직하다.

RNAi 분자

본원에서, 용어 "RNA 간섭 (RNAi) 분자"는 세포의 세포질에서 RNA-유도된 침묵 복합체 (RISC)를 통해 RNA-의존성 유전자 침묵을 유도할 수 있는 짧은 이중 가닥 RNA 기초된 올리고뉴클레오티드를 지칭하는데, 여기서 이들은 촉매성 RISC 성분 아르고노트와 상호작용한다. RNAi 분자는 세포, 예를 들면, 개체, 예컨대 포유류 개체 내에 세포에서 표적 핵산의 발현을 조절한다, 예를 들면, 저해한다. RNAi 분자의 한 가지 유형은 짧은 간섭 RNA (siRNA)인데, 이것은 2개의 상보성 올리고뉴클레오티드로 구성되는 이중 가닥 RNA 분자이고, 여기서 전사 후 상보성 mRNA에 한쪽 가닥의 결합은 이의 분해 및 번역의 상실을 야기한다. 작은 헤어핀 RNA (shRNA)는 DICER 및 RNA 유도된 침묵 복합체 (RISC)를 통해 mRNA를 감소시킬 수 있는 스템 루프 (헤어핀) 구조를 형성하는 단일 가닥 RNA-기초된 올리고뉴클레오티드이다. RNAi 분자는 관심되는 유전자의 서열 (표적 핵산)에 기초하여 설계될 수 있다. 상응하는 RNAi는 이후, 화학적으로 또는 시험관내 전사에 의해 합성되거나, 또는 벡터 또는 PCR 산물로부터 발현될 수 있다.

siRNA

용어 siRNA는 짧은 간섭 리보핵산 RNAi 분자를 지칭한다. 이것은 이중 가닥 RNA 분자의 한 부류이며, 당해 분야에서 짧은 간섭 RNA 또는 침묵 RNA로서 또한 알려져 있다. siRNA는 전형적으로 센스 가닥 (운송 가닥으로서 또한 지칭됨) 및 안티센스 가닥 (안내 가닥으로서 또한 지칭됨)을 포함하는데, 여기서 각 가닥은 길이에서 17 - 30개 뉴클레오티드, 전형적으로 길이에서 19 - 25개 뉴클레오시드이고, 여기서 상기 안티센스 가닥은 표적 핵산 (적절하게는 성숙 mRNA 서열)에 상보적, 예컨대 적어도 95% 상보적, 예컨대 완전히 상보적이고, 그리고 센스 가닥은 센스 가닥 및 안티센스 가닥이 이중나선 또는 이중나선 영역을 형성하도록 안티센스 가닥에 상보적이다. siRNA 가닥은 평활 말단 이중나선을 형성할 수 있거나, 또는 유리하게는 센스와 안티센스 가닥 3' 단부는 생체내에서 RISC 기질을 형성하는, Dicer에 의해 생산된 산물과 유사한 예를 들면, 1, 2 또는 3개 뉴클레오시드의 3' 오버행을 형성할 수 있다. 효과적인 신장된 형태의 Dicer 기질은 본원에 참조로서 편입된 US 8,349,809 및 US 8,513,207에서 기술되었다. 일부 구체예에서, 센스 가닥 및 안티센스 가닥 둘 모두 2nt 3' 오버행을 갖는다. 이중나선 영역은 이런 이유로, 예를 들면, 길이에서 17 - 25개 뉴클레오티드, 예컨대 길이에서 21-23개 뉴클레오티드일 수 있다.

일단 세포 내부에 위치하면, 안티센스 가닥은 RISC 복합체 내로 통합되고, 이것은 표적 핵산의 표적 분해 또는 표적 저해를 매개한다. siRNA는 전형적으로 RNA 뉴클레오시드 이외에 변형된 뉴클레오시드를 포함한다. 한 구체예에서 siRNA 분자는 변형된 뉴클레오티드간 연쇄 및 2' 당 변형된 뉴클레오시드, 예컨대 LNA 및 cET 또는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA (MOE), 2'-아미노-DNA, 2'-플루오로-DNA, 아라비노 핵산 (ANA), 2'-플루오로-ANA의 2' 치환된 변형체를 비롯한, 2'-4' 이중환상 리보오스 변형된 뉴클레오시드를 이용하여 화학적으로 변형될 수 있다. 특히 2'플루오로, 2'-O-메틸 또는 2'-O-메톡시에틸이 siRNA 내로 통합될 수 있다.

일부 구체예에서 siRNA 센스 (운송) 가닥의 모든 뉴클레오티드는 2' 당 변형된 뉴클레오시드, 예컨대 LNA으로 변형될 수 있다 (참조: 예를 들면, WO2004/083430, WO2007/085485). 일부 구체예에서 siRNA의 운송 가닥은 불연속적일 수 있다 (참조: 예를 들면, WO2007/107162). siRNA의 안티센스 가닥의 씨앗 영역에서 발생하는 열에 의한 불안정화 뉴클레오티드의 통합은 siRNA의 표적 이탈 활성을 감소시키는 데 유용한 것으로 보고되었다 (참조: 예를 들면, WO2018/098328). 적절하게는 siRNA는 안티센스 가닥의 5' 단부에서 5' 인산염 기 또는 5'-인산염 모방체를 포함한다. 일부 구체예에서 안티센스 가닥의 5' 단부는 RNA 뉴클레오시드이다.

한 구체예에서, siRNA 분자는 적어도 하나의 포스포로티오에이트 또는 메틸포스포네이트 뉴클레오시드간 연쇄를 더욱 포함한다. 포스포로티오에이트 또는 메틸포스포네이트 뉴클레오시드간 연쇄는 어느 한쪽 또는 양쪽 가닥 (예를 들면, 안티센스 가닥; 또는 센스 가닥)의 3' 말단에 있을 수 있거나; 또는 포스포로티오에이트 또는 메틸포스포네이트 뉴클레오시드간 연쇄는 어느 한쪽 또는 양쪽 가닥 (예를 들면, 안티센스 가닥; 또는 센스 가닥)의 5' 말단에 있을 수 있거나; 또는 포스포로티오에이트 또는 메틸포스포네이트 뉴클레오시드간 연쇄는 어느 한쪽 또는 양쪽 가닥 (예를 들면, 안티센스 가닥; 또는 센스 가닥)의 5' 말단 및 3' 말단 둘 모두에 있을 수 있다. 일부 구체예에서 나머지 뉴클레오시드간 연쇄는 포스포디에스테르 연쇄이다. 일부 구체예에서, siRNA 분자는 하나 또는 그 이상의 포스포로티오에이트 뉴클레오시드간 연쇄를 포함한다. siRNA 분자에서 포스포로티오에이트 뉴클레오시드간 연쇄는 RICS에서 뉴클레아제 개열을 감소시킬 수 있고, 이런 이유로 안티센스 가닥에서 모든 뉴클레오시드간 연쇄가 변형되지는 않는 것이 바람직하다.

siRNA 분자는 리간드를 더욱 포함할 수 있다. 일부 구체예에서, 리간드는 센스 가닥의 3' 단부에 접합된다.

생물학적 분포를 위해, siRNA는 표적화 리간드에 접합될 수 있고 및/또는 예를 들면, 지질 나노입자로 조제될 수 있다.

본원 발명의 다른 양상은 dsRNA, 예컨대 치료적 용도에 적합한 siRNA 분자를 포함하는 제약학적 조성물, 그리고 예를 들면, 본원에서 개시된 바와 같은 다양한 질환 상태의 치료를 위해 이들 dsRNA 분자, 예컨대 본원 발명의 siRNA를 투여함으로써 표적 유전자의 발현을 저해하는 방법에 관계한다.

shRNA

짧은 헤어핀 RNA 또는 shRNA 분자는 일반적으로 길이에서 40 내지 70개의 뉴클레오티드, 예컨대 길이에서 45 내지 65개의 뉴클레오티드, 예컨대 길이에서 50 내지 60개의 뉴클레오티드이고 스템 루프 (헤어핀) RNA 구조를 형성하는데, 상기 구조는 Dicer로 알려진 엔도뉴클레아제와 상호작용하고, 이것은 dsRNA를 특징적인 2개의 염기 3' 오버행을 갖는 19-23개 염기쌍 짧은 간섭 RNA로 처리하는 것으로 생각되고, 이들은 이후 RNA-유도 침묵 복합체 (RISC) 내로 통합된다. 적합한 표적 mRNA에 결합 시에, RISC 내에 하나 또는 그 이상의 엔도뉴클레아제가 표적을 개열하여 침묵을 유도한다. RNAi 올리고뉴클레오티드는 변형된 뉴클레오티드간 연쇄 및 2' 당 변형된 뉴클레오시드, 예컨대 LNA 및 cET 또는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA (MOE), 2'-아미노-DNA, 2'-플루오로-DNA, 아라비노 핵산 (ANA), 2'-플루오로-ANA의 2' 치환된 변형체를 비롯한 2'-4' 이중환상 리보오스 변형된 뉴클레오시드를 이용하여 화학적으로 변형될 수 있다.

일부 구체예에서, shRNA 핵산 분자는 하나 또는 그 이상의 포스포로티오에이트 뉴클레오시드간 연쇄를 포함한다. RNAi 분자에서 포스포로티오에이트 뉴클레오시드간 연쇄는 RICS에서 뉴클레아제 개열을 감소시킬 수 있고, 이런 이유로 shRNA 분자의 스템 루프에서 모든 뉴클레오시드간 연쇄가 변형되지는 않는 것이 바람직하다. 포스포로티오에이트 뉴클레오시드간 연쇄는 바람직하게는 shRNA 분자의 스템 루프의 3' 및/또는 5' 단부 내에, 특히 표적 핵산에 상보적이지 않은 분자의 부분 (예를 들면, siRNA 분자의 센스 가닥 또는 운송 가닥) 내에 위치할 수 있다. 하지만, 표적 핵산에 상보적인 shRNA 분자의 영역은 또한, Dicer에 의한 개열 이후에 3' 및/또는 5' 말단이 될 것으로 예측되는 부분에서 첫 2 내지 3개의 뉴클레오시드간 연쇄에서 변형될 수도 있다.

연속 뉴클레오티드 서열

용어 "연속 뉴클레오티드 서열"은 표적 핵산에 상보적인 올리고뉴클레오티드의 영역을 지칭한다. 상기 용어는 본원에서 용어 "연속 핵염기 서열" 및 용어 "올리고뉴클레오티드 모티프 서열"과 교체가능하게 이용된다. 일부 구체예에서, 올리고뉴클레오티드의 모든 뉴클레오티드는 연속 뉴클레오티드 서열을 구성한다. 일부 구체예에서 연속 뉴클레오티드 서열은 siRNA 분자의 안내 가닥 내에 포함된다. 일부 구체예에서 연속 뉴클레오티드 서열은 표적 핵산에 100% 상보적인 shRNA 분자의 부분이다. 일부 구체예에서 올리고뉴클레오티드는 연속 뉴클레오티드 서열, 예컨대 F-G-F' 갭머 영역을 포함하고, 그리고 기능기 (예를 들면, 표적화를 위한 접합체 기)를 연속 뉴클레오티드 서열에 부착하는 데 이용될 수 있는 추가 뉴클레오티드(들), 예를 들면 뉴클레오티드 링커 영역을 임의적으로 포함할 수 있다. 뉴클레오티드 링커 영역은 표적 핵산에 상보적이거나 상보적이지 않을 수 있다. 일부 구체예에서, 안티센스 올리고뉴클레오티드의 핵염기 서열은 연속 뉴클레오티드 서열이다. 일부 구체예에서, 연속 뉴클레오티드 서열은 표적 핵산에 100% 상보적이다.

뉴클레오티드 및 뉴클레오시드

뉴클레오티드 및 뉴클레오시드는 올리고뉴클레오티드 및 폴리뉴클레오티드의 빌딩 블록이고, 그리고 본원 발명의 목적을 위해 자연 발생 및 비자연 발생 뉴클레오티드 및 뉴클레오시드를 모두 포함한다. 자연에서, 뉴클레오티드, 예컨대 DNA와 RNA 뉴클레오티드는 리보오스 당 모이어티, 핵염기 모이어티 및 하나 또는 그 이상의 인산염 기 (뉴클레오시드에는 없음)를 포함한다. 뉴클레오시드 및 뉴클레오티드는 또한 "단위" 또는 "단량체"로 교체가능하게 지칭될 수 있다.

변형된 뉴클레오시드

본원에서 이용된 용어 "변형된 뉴클레오시드" 또는 "뉴클레오시드 변형"은 당 모이어티 또는 (핵)염기 모이어티에 하나 또는 그 이상의 변형을 도입함으로써 등가 DNA 또는 RNA 뉴클레오시드와 비교하여 변형된 뉴클레오시드를 지칭한다. 바람직한 구체예에서, 변형된 뉴클레오시드는 변형된 당 모이어티를 포함한다. 용어 변형된 뉴클레오시드는 또한 본원에서 용어 "뉴클레오시드 유사체" 또는 변형된 "단위" 또는 변형된 "단량체"와 교체가능하게 이용될 수 있다. 변형되지 않은 DNA 또는 RNA 당 모이어티를 갖는 뉴클레오시드는 본원에서 DNA 또는 RNA 뉴클레오시드로 명명된다. DNA 또는 RNA 뉴클레오시드의 염기 영역 내에서 변형을 갖는 뉴클레오시드는 왓슨 크릭 (Watson Crick) 염기 대합을 허용하면, 여전히 일반적으로 DNA 또는 RNA로 명명된다.

변형된 뉴클레오시드간 연쇄

용어 "변형된 뉴클레오시드간 연쇄"는 당업자에 의해 일반적으로 이해되는 바와 같이 2개의 뉴클레오시드를 함께 공유 결합하는, 포스포디에스테르 (PO) 연쇄 이외의 연쇄로서 규정된다. 본원 발명의 올리고뉴클레오티드는 이런 이유로, 하나 또는 그 이상의 변형된 뉴클레오시드간 연쇄, 예컨대 하나 또는 그 이상의 포스포로티오에이트 뉴클레오시드간 연쇄, 또는 하나 또는 그 이상의 포스포로디티오에이트 뉴클레오시드간 연쇄를 포함할 수 있다. 일부 구체예에서, 변형된 뉴클레오시드간 연쇄는 포스포디에스테르 연쇄와 비교하여 올리고뉴클레오티드의 뉴클레아제 내성을 증가시킨다. 자연 발생 올리고뉴클레오티드의 경우, 뉴클레오시드간 연쇄는 인접한 뉴클레오시드 사이에 포스포디에스테르 결합을 생성하는 인산염 기를 포함한다. 변형된 뉴클레오시드간 연쇄는 생체내 이용을 위해 올리고뉴클레오티드를 안정화시키는 데 특히 유용하고, 그리고 본원 발명의 올리고뉴클레오티드 내에 DNA 또는 RNA 뉴클레오시드의 영역에서, 예를 들면 갭머 올리고뉴클레오티드의 갭 영역 G 내에서 뿐만 아니라 영역 F 및 F'와 같은 변형된 뉴클레오시드의 영역에서 뉴클레아제 개열로부터 보호하는 역할을 할 수 있다.

한 구체예에서, 올리고뉴클레오티드는 자연 포스포디에스테르로부터 변형된 하나 또는 그 이상의 뉴클레오시드간 연쇄, 예컨대 뉴클레아제 공격에 더욱 내성이 있는 하나 또는 그 이상의 변형된 뉴클레오시드간 연쇄를 포함한다. 뉴클레아제 내성은 혈청에서 올리고뉴클레오티드를 배양함으로써 또는 뉴클레아제 내성 분석 (예를 들면, 뱀 독 포스포디에스테라아제 (SVPD))을 이용함으로써 판별될 수 있으며, 이들 둘 모두 당해 분야에 잘 알려져 있다. 올리고뉴클레오티드의 뉴클레아제 내성을 향상시킬 수 있는 뉴클레오시드간 연쇄는 뉴클레아제 내성 뉴클레오시드간 연쇄로 지칭된다. 일부 구체예에서 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열에서 뉴클레오시드간 연쇄 중에서 적어도 50%가 변형된다, 예컨대 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열에서 뉴클레오시드간 연쇄 중에서 적어도 60%, 예컨대 적어도 70%, 예컨대 적어도 75%, 예컨대 적어도 80%, 또는 예컨대 적어도 90%가 변형된다. 일부 구체예에서 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열의 모든 뉴클레오시드간 연쇄가 변형된다. 일부 구체예에서 본원 발명의 올리고뉴클레오티드를 비뉴클레오티드 기능기, 예컨대 접합체에 연결하는 뉴클레오시드는 포스포디에스테르일 수 있는 것으로 인식될 것이다. 일부 구체예에서, 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열의 모든 뉴클레오시드간 연쇄는 뉴클레아제 내성 뉴클레오시드간 연쇄이다.

본원 발명의 올리고뉴클레오티드에서 포스포로티오에이트 뉴클레오시드간 연쇄를 이용하는 것이 바람직하다.

포스포로티오에이트 뉴클레오시드간 연쇄는 뉴클레아제 내성, 유리한 약물동력학 및 제조 용이성으로 인해 특히 유용하다. 일부 구체예에서, 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열에서 뉴클레오시드간 연쇄 중에서 적어도 50%는 포스포로티오에이트이다, 예컨대 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열에서 뉴클레오시드간 연쇄 중에서 적어도 60%, 예컨대 적어도 70%, 예컨대 적어도 75%, 예컨대 적어도 80%, 또는 예컨대 적어도 90%는 포스포로티오에이트이다. 일부 구체예에서, 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열의 모든 뉴클레오시드간 연쇄는 포스포로티오에이트이다.

포스포로티오에이트 연쇄와 같은 뉴클레아제 내성 연쇄는 표적 핵산과 이중나선을 형성할 때 뉴클레아제를 모집할 수 있는 올리고뉴클레오티드 영역, 예컨대 갭머의 경우 영역 G에서 특히 유용하다. 하지만, 포스포로티오에이트 연쇄는 또한 비-뉴클레아제 모집 영역 및/또는 친화성 향상 영역, 예컨대 갭머의 경우 영역 F 및 F'에서 유용할 수 있다. 갭머 올리고뉴클레오티드는 일부 구체예에서 영역 F 또는 F'에서, 또는 영역 F 및 영역 F' 둘 모두에서 하나 또는 그 이상의 포스포디에스테르 연쇄를 포함할 수 있고, 여기서 영역 G에서 모든 뉴클레오시드간 연쇄는 포스포로티오에이트일 수 있다.

유리하게는, 올리고뉴클레오티드의 연속 뉴클레오티드 서열의 모든 뉴클레오시드간 연쇄는 포스포로티오에이트이거나, 또는 올리고뉴클레오티드의 모든 뉴클레오시드간 연쇄는 포스포로티오에이트 연쇄이다.

EP 2 742 135에서 개시된 바와 같이, 안티센스 올리고뉴클레오티드는 다른 뉴클레오시드간 연쇄 (포스포디에스테르 및 포스포로티오에이트 이외에), 예를 들면 EP 2 742 135에 따라서 예를 들면 그 외의 DNA 포스포로티오에이트 갭 영역에서 용인될 수 있는 알킬 포스포네이트/메틸 포스포네이트 뉴클레오시드간 연쇄를 포함할 수 있는 것으로 인식된다.

핵염기

용어 핵염기는 핵산 혼성화에서 수소 결합을 형성하는 뉴클레오시드 및 뉴클레오티드 내에 존재하는 퓨린 (예를 들면, 아데닌 및 구아닌) 및 피리미딘 (예를 들면, 우라실, 티민 및 시토신) 모이어티를 포함한다. 본원 발명의 맥락에서, 용어 핵염기는 또한 자연 발생 핵염기와는 다를 수 있지만 핵산 혼성화 동안 기능적인 변형된 핵염기를 포괄한다. 이러한 맥락에서, "핵염기"는 아데닌, 구아닌, 시토신, 티미딘, 우라실, 크산틴 및 히포크산틴과 같은 자연 발생 핵염기뿐만 아니라 비-자연 발생 변이체 둘 모두를 지칭한다. 이런 변이체는 예를 들면 Hirao et al (2012) Accounts of Chemical Research vol 45 page 2055 및 Bergstrom (2009) Current Protocols in Nucleic Acid Chemistry Suppl. 37 1.4.1에서 기술된다.

일부 구체예에서, 핵염기 모이어티는 퓨린 또는 피리미딘을 변형된 퓨린 또는 피리미딘, 예컨대 치환된 퓨린 또는 치환된 피리미딘, 예컨대 이소시토신, 슈도이소시토신, 5-메틸 시토신, 5-티오졸로-시토신, 5-프로피닐-시토신, 5-프로피닐-우라실, 5-브로모우라실, 5-티아졸로-우라실, 2-티오-우라실, 2'-티오-티민, 이노신, 디아미노퓨린, 6-아미노퓨린, 2-아미노퓨린, 2,6-디아미노퓨린 및 2-클로로-6-아미노퓨린에서 선택되는 핵염기로 변화시킴으로써 변형된다.

핵염기 모이어티는 각각의 상응하는 핵염기에 대한 문자 코드, 예를 들면 A, T, G, C 또는 U로 표시될 수 있는데, 여기서 각 문자는 등가 기능의 변형된 핵염기를 임의적으로 포함할 수 있다. 예를 들면, 예시된 올리고뉴클레오티드에서, 핵염기 모이어티는 A, T, G, C 및 5-메틸 시토신에서 선택된다. 임의적으로, LNA 갭머의 경우, 5-메틸 시토신 LNA 뉴클레오시드가 이용될 수 있다.

변형된 올리고뉴클레오티드

용어 변형된 올리고뉴클레오티드는 하나 또는 그 이상의 당-변형된 뉴클레오시드 및/또는 변형된 뉴클레오시드간 연쇄를 포함하는 올리고뉴클레오티드를 설명한다. 용어 "키메라 올리고뉴클레오티드"는 변형된 뉴클레오시드 및 DNA 뉴클레오시드를 갖는 올리고뉴클레오티드를 설명하기 위해 문헌에서 이용된 용어이다. 본원 발명의 안티센스 올리고뉴클레오티드는 유리하게는 키메라 올리고뉴클레오티드이다.

상보성

용어 "상보성"은 뉴클레오시드/뉴클레오티드의 왓슨-크릭 염기 대합에 대한 능력을 설명한다. 왓슨-크릭 염기쌍은 구아닌 (G)-시토신 (C) 및 아데닌 (A)-티민 (T)/우라실 (U)이다. 올리고뉴클레오티드는 변형된 핵염기를 갖는 뉴클레오시드를 포함할 수 있는 것으로 이해될 것이다, 예를 들면 5-메틸 시토신이 종종 시토신을 대신하여 이용되고, 그리고 그 결과 용어 상보성은 변형되지 않은 핵염기 및 변형된 핵염기 사이의 왓슨 크릭 염기 대합을 포괄한다 (참조: 예를 들면, Hirao et al. (2012) Accounts of Chemical Research vol 45 page 2055 및 Bergstrom (2009) Current Protocols in Nucleic Acid Chemistry Suppl. 37 1.4.1).

본원에서 이용된 용어 "% 상보성"은 연속 뉴클레오티드 서열 전역에서 참조 서열 (예를 들면, 표적 서열 또는 서열 모티프)에 상보적인, 핵산 분자 (예를 들면, 올리고뉴클레오티드) 내에 연속 뉴클레오티드 서열의 뉴클레오티드의 비율 (퍼센트로 표시)을 의미한다. 상보성의 백분율은 따라서 2개의 서열 사이에서 상보적인 정렬된 핵염기 (왓슨 크릭 염기쌍으로부터)의 숫자를 계수하고 (5'-3'로 표적 서열 및 3'-5'로 올리고뉴클레오티드 서열과 함께 정렬될 때), 상기 숫자를 올리고뉴클레오티드 내에 뉴클레오티드의 총 수로 나누고, 그리고 여기에 100을 곱함으로써 계산한다. 이런 비교에서, 정렬되지 않은 (염기쌍을 형성하는) 핵염기/뉴클레오티드는 부정합 (mismatch)으로 명명된다. 삽입 및 결실은 연속 뉴클레오티드 서열의 % 상보성의 계산에서 허용되지 않는다. 왓슨 크릭 염기 대합을 형성할 수 있는 핵염기의 기능적 능력이 유지되는 한, 상보성을 결정함에 있어서 핵염기의 화학적 변형은 무시되는 것으로 이해될 것이다 (예를 들면, 5'-메틸 시토신은 % 상보성을 계산할 목적으로 시토신과 동일한 것으로 간주된다).

용어 "완전히 상보적"은 100% 상보성을 의미한다.

다음은 표적 핵산 (서열 번호: 11)과 완전히 상보적인 올리고뉴클레오티드 모티프 (서열 번호: 33)의 예이다.

5'- CTTTGACCAGAGTATGTAAAATTCTC-3' (서열 번호: 11)

3'-AAACTGGTCTCATACATTTT -5' (서열 번호: 33)

동일성

본원에서 이용된 용어 "동일성"은 연속 뉴클레오티드 서열 전역에서 참조 서열 (예를 들면, 서열 모티프)와 동일한 핵산 분자 (예를 들면, 올리고뉴클레오티드) 내에 연속 뉴클레오티드 서열의 뉴클레오티드의 비율 (퍼센트로 표시)을 의미한다. 따라서 동일성의 백분율은 두 서열 (본원 발명의 화합물의 연속 뉴클레오티드 서열에서 및 참조 서열에서) 사이에서 동일한 정렬된 핵염기 (정합)의 숫자를 계수하고, 상기 숫자를 올리고뉴클레오티드 내에 뉴클레오티드의 총 수로 나누고, 그리고 여기에 100을 곱함으로써 계산한다. 이런 이유로, 동일성의 백분율 = (정합 x 100)/정렬된 영역 (예를 들면, 연속 뉴클레오티드 서열)의 길이. 삽입 및 결실은 연속 뉴클레오티드 서열의 동일성의 백분율을 계산할 때 허용되지 않는다. 왓슨 크릭 염기 대합을 형성할 수 있는 핵염기의 기능적 능력이 유지되는 한, 동일성을 결정함에 있어서 핵염기의 화학적 변형은 무시되는 것으로 이해될 것이다 (예를 들면, 5-메틸 시토신은 % 동일성을 계산할 목적으로 시토신과 동일한 것으로 간주된다).

혼성화

본원에서 이용된 용어 "혼성화하는" 또는 "혼성화한다"는 두 핵산 가닥 (예를 들면, 올리고뉴클레오티드 및 표적 핵산)이 반대 가닥 상의 염기쌍 사이에 수소 결합을 형성함으로써 이중나선을 형성하는 것으로 이해되어야 한다. 두 핵산 가닥 사이의 결합 친화성은 혼성화의 강도이다. 이것은 올리고뉴클레오티드의 절반이 표적 핵산과 이중나선을 형성하는 온도로서 규정되는 용융 온도 (T_m)의 관점에서 종종 설명된다. 생리학적 조건에서 T_m은 친화성과 엄격하게 비례하지는 않는다 (Mergny and Lacroix, 2003,Oligonucleotides 13:515-537). 표준 상태 Gibbs 자유 에너지 △G°는 결합 친화성을 나타내는 더욱 정확한 표시이고 △G° = -RTln(K_d)에 의한 반응의 해리 상수 (K_d)와 관련되는데, 여기서 R은 기체 상수이고 T는 절대 온도이다. 이런 이유로, 올리고뉴클레오티드 및 표적 핵산 사이에 반응의 매우 낮은 △G°는 올리고뉴클레오티드 및 표적 핵산 사이의 강한 혼성화를 반영한다. △G°는 수성 농도가 1M이고, pH가 7이고, 온도가 37℃인 반응과 연관된 에너지이다. 표적 핵산에 대한 올리고뉴클레오티드의 혼성화는 자발적 반응이고, 그리고 자발적 반응의 경우 △G°는 0보다 작다. △G°는, 예를 들면 Hansen et al., 1965,Chem. Comm. 36-38 및 Holdgate et al., 2005, Drug Discov Today에서 기술된 바와 같이 등온 적정 열량 측정 (ITC) 방법을 이용하여 실험적으로 계측될 수 있다. 당업자는 상용 장비가 △G° 계측에 이용가능하다는 것을 알 것이다. △G°는 또한, Sugimoto et al., 1995, Biochemistry 34:11211-11216 및 McTigue et al., 2004, Biochemistry 43:5388-5405에 의해 기술된 적절하게 도출된 열역학 매개변수를 이용하는, SantaLucia, 1998, Proc Natl Acad Sci USA. 95: 1460-1465에 의해 기술된 바와 같은 최근접 이웃 모델을 이용함으로써 수치적으로 추정될 수 있다. 혼성화에 의해 의도된 핵산 표적을 조절할 수 있는 가능성을 갖기 위해, 본원 발명의 올리고뉴클레오티드는 길이에서 10-30개의 뉴클레오티드인 올리고뉴클레오티드에 대해 -10 kcal 미만의 추정된 △G° 값으로 표적 핵산에 혼성화한다. 일부 구체예에서, 혼성화의 정도 또는 강도는 표준 상태 Gibbs 자유 에너지 △G°에 의해 계측된다. 올리고뉴클레오티드는 길이에서 8-30개의 뉴클레오티드인 올리고뉴클레오티드에 대해 -10 kcal의 범위 미만, 예컨대 -15 kcal 미만, 예컨대 -20 kcal 미만 및 예컨대 -25 kcal 미만의 추정된 △G° 값으로 표적 핵산에 혼성화할 수 있다. 일부 구체예에서, 올리고뉴클레오티드는 -10 내지 -60 kcal, 예컨대 -12 내지 -40 kcal, 예컨대 -15 내지 -30 kcal 또는 -16 내지 -27 kcal, 예컨대 -18 내지 -25 kcal의 추정된 △G° 값으로 표적 핵산에 혼성화한다.

표적 핵산

본원 발명에 따라서, 표적 핵산은 포유류 RTEL1을 인코딩하는 핵산이고, 그리고 예를 들면 유전자, RNA, mRNA 및 프리-mRNA, 성숙 mRNA 또는 cDNA 서열일 수 있다. 이런 이유로, 표적은 RTEL1 표적 핵산으로 지칭될 수 있다.

본원 발명의 올리고뉴클레오티드는 예를 들면 포유류 RTEL1의 표적 엑손 영역 (특히, siRNA 및 shRNA 표적 엑손 영역뿐만 아니라 안티센스 올리고뉴클레오티드)일 수 있거나, 또는 예를 들면 RTEL1 프리-mRNA에서 표적 인트론 영역 (특히, 안티센스 올리고뉴클레오티드 표적 인트론 영역)일 수 있다. 인간 RTEL1 유전자는 15개의 전사체를 인코딩하고, 이들 중에서 7개는 단백질 코딩이고, 그리고 이런 이유로 잠재적인 핵산 표적이다. 표 1은 서열 번호: 1의 인간 RTEL1 프리-mRNA 상에 위치된 대로, 이들 7개 전사체의 예측된 엑손과 인트론 영역을 열거한다. 본원 발명의 올리고뉴클레오티드는 표 1에서 열거된 전사체 중에서 하나 또는 그 이상의 성숙 mRNA 서열을 표적으로 할 수 있는 것으로 이해된다.

표 1. 상이한 단백질 코딩 RTEL1 mRNA 전사체에 대한 인간 RTEL1 프리-mRNA (서열 번호: 1)에서 전사체, 엑손 및 인트론 영역

적절하게는, 표적 핵산은 RTEL1 단백질, 특히 포유류 RTEL1, 예컨대 인간 RTEL1 (참조: 예를 들면, 표 2 및 3)을 인코딩하는데, 이것은 인간과 원숭이 RTEL1에 대한 프리-mRNA 서열을 제공한다.

일부 구체예에서, 표적 핵산은 서열 번호: 1 및/또는 2 또는 이들의 자연 발생 변이체 (예를 들면, 표 1에서 포유류 RTEL1 단백질을 인코딩하는 서열)에서 선택된다.

연구 또는 진단에서 본원 발명의 올리고뉴클레오티드를 이용하는 경우, 표적 핵산은 cDNA, 또는 DNA 또는 RNA로부터 유래된 합성 핵산일 수 있다.

생체내 또는 시험관내 적용을 위해, 본원 발명의 올리고뉴클레오티드는 전형적으로 RTEL1 표적 핵산을 발현하는 세포 내에서 RTEL1 표적 핵산의 발현을 저해할 수 있다. 본원 발명의 올리고뉴클레오티드의 핵염기의 연속 서열은 올리고뉴클레오티드의 길이에 걸쳐 계측되는 바와 같이, 임의적으로 하나 또는 두 개의 부정합을 제외하고, 그리고 임의적으로 올리고뉴클레오티드를 임의적 기능기, 예컨대 접합체 또는 다른 비-상보적 말단 뉴클레오티드 (예를 들면, 영역 D' 또는 D'')에 결합시킬 수 있는 뉴클레오티드 기반의 링커 영역을 제외하고, 전형적으로 RTEL1 표적 핵산에 상보적이다. 표적 핵산은 일부 구체예에서, RNA 또는 DNA, 예컨대 전령 RNA, 예컨대 성숙 mRNA (예를 들면, 표 1에서 열거된 전사체의 엑손 영역) 또는 프리-mRNA일 수 있다.

일부 구체예에서 표적 핵산은 포유류 RTEL1 단백질, 예컨대 인간 RTEL1을 인코딩하는 RNA 또는 DNA, 예를 들면, 인간 RTEL1 mRNA 서열, 예컨대 서열 번호 1로서 개시된 것이다. 예시적인 표적 핵산에 대한 추가 정보는 표 2 및 3에 제시된다.

표 2. 종간 RTEL1에 대한 유전체 및 조립 정보.

Fwd = 정방향 가닥. 유전체 좌표는 프리-mRNA 서열 (유전체 서열)을 제공한다. NCBI 참조는 mRNA 서열 (cDNA 서열)을 제공한다.

표 3. 종간 RTEL1에 대한 서열 상세 정보.

서열 번호 2가 복수의 NNNNs의 영역을 포함하고, 여기서 염기서열결정이 상기 서열을 정확하게 정밀화할 수 없었고, 그리고 이런 이유로, 축중 서열이 포함된다는 점에 유의한다. 의심할 여지를 없애기 위해 본원 발명의 화합물은 실제 표적 서열에 상보적이고, 그리고 이런 이유로, 축중 화합물이 아니다.

일부 구체예에서, 표적 핵산은 서열 번호 1이다.

일부 구체예에서, 표적 핵산은 서열 번호 2이다.

표적 서열

본원에서 이용된 용어 "표적 서열"은 본원 발명의 올리고뉴클레오티드에 상보적인 핵염기 서열을 포함하는 표적 핵산 내에 존재하는 뉴클레오티드의 서열을 지칭한다. 일부 구체예에서, 표적 서열은 본원 발명의 올리고뉴클레오티드의 연속 뉴클레오티드 서열에 상보적인 핵염기 서열을 갖는 표적 핵산 상의 영역으로 구성된다. 표적 핵산의 이러한 영역은 표적 뉴클레오티드 서열, 표적 서열 또는 표적 영역으로 교체가능하게 지칭될 수 있다. 일부 구체예에서, 표적 서열은 단일 올리고뉴클레오티드의 상보적 서열보다 길고, 그리고 예를 들면 본원 발명의 몇몇 올리고뉴클레오티드에 의해 표적화될 수 있는 표적 핵산의 바람직한 영역을 나타낼 수 있다.

일부 구체예에서, 표적 서열은 인간 RTEL1 mRNA 엑손, 예컨대 상기 표 1에서 목록으로부터 선택된 RTEL1 인간 mRNA 엑손으로 구성된 군에서 선택되는 서열이다.

일부 구체예에서, 표적 서열은 인간 RTEL1 mRNA 인트론, 예컨대 상기 표 1에서 목록으로부터 선택된 RTEL1 인간 mRNA 인트론으로 구성된 군에서 선택되는 서열이다.

본원 발명의 올리고뉴클레오티드는 표적 핵산, 예컨대 본원에서 기술된 표적 서열에 상보적이거나 또는 이것에 혼성화하는 연속 뉴클레오티드 서열을 포함한다.

올리고뉴클레오티드가 상보적이거나 또는 혼성화하는 표적 서열은 일반적으로 적어도 10개 뉴클레오티드의 연속 핵염기 서열을 포함한다. 연속 뉴클레오티드 서열은 10 내지 35개의 뉴클레오티드, 예컨대 12 내지 30개, 예컨대 14 내지 20개, 예컨대 16 내지 20개의 연속 뉴클레오티드이다. 본원 발명의 구체예에서 표적 서열은 표 4에서 도시된 바와 같은 서열 번호: 3-21로 구성된 군에서 선택된다.

표 4: 인간 RTEL1 프리-mRNA (서열 번호: 1) 상에서 표적 서열

일부 구체예에서, 표적 서열은 표 5A 또는 5B에서 도시된 영역에서 선택된다.

표적 세포

본원에서 이용된 용어 "표적 세포"는 표적 핵산을 발현하는 세포를 지칭한다. 본원 발명의 치료적 용도를 위해, 표적 세포는 HBV로 감염되는 것이 바람직하다. 일부 구체예에서, 표적 세포는 생체내 또는 시험관내에 있을 수 있다. 일부 구체예에서, 표적 세포는 포유류 세포, 예컨대 설치류 세포, 예컨대 생쥐 세포 또는 쥐 세포, 또는 우드척 세포 또는 영장류 세포, 예컨대 원숭이 세포 (예를 들면, 시노몰구스 원숭이 세포) 또는 인간 세포이다.

바람직한 구체예에서, 표적 세포는 RTEL1 mRNA, 예컨대 RTEL1 프리-mRNA 또는 RTEL1 성숙 mRNA를 발현한다. RTEL1 mRNA의 폴리 A 꼬리는 안티센스 올리고뉴클레오티드 표적화에서는 전형적으로 무시된다.

게다가, 표적 세포는 간세포일 수 있다. 한 구체예에서 표적 세포는 HBV 감염된 개체로부터 유래되거나, 또는 인간화 간을 갖는 HBV 감염된 생쥐 (PhoenixBio, PXB-생쥐)로부터 유래된 HBV 감염된 일차 인간 간세포이다.

본원 발명에 따라서, 표적 세포는 HBV로 감염될 수 있다. 게다가, 표적 세포는 HBV cccDNA를 포함할 수 있다. 따라서, 표적 세포는 바람직하게는 RTEL1 mRNA, 예컨대 RTEL1 프리-mRNA 또는 RTEL1 성숙 mRNA, 그리고 HBV cccDNA를 포함한다.

자연 발생 변이체

용어 "자연 발생 변이체"는 표적 핵산과 동일한 유전자 좌위로부터 유래하지만, 예를 들면, 동일한 아미노산을 인코딩하는 코돈의 다중성을 유발하는 유전자 코드의 축중성으로 인해, 또는 프리-mRNA의 대안적 스플라이싱, 또는 다형성, 예컨대 단일 뉴클레오티드 다형성 (SNP) 및 대립형질 변이체의 존재로 인해 상이할 수 있는 RTEL1 유전자 또는 전사체의 변이체를 지칭한다. 올리고뉴클레오티드와 충분하게 상보적인 서열의 존재에 기초하여, 본원 발명의 올리고뉴클레오티드는 표적 핵산 및 이의 자연 발생 변이체를 표적으로 할 수 있다.

일부 구체예에서, 자연 발생 변이체는 포유류 RTEL1 표적 핵산, 예컨대 서열 번호 1 및/또는 2의 표적 핵산과 적어도 95%, 예컨대 적어도 98% 또는 적어도 99%의 상동성을 갖는다. 일부 구체예에서, 자연 발생 변이체는 서열 번호: 1의 인간 RTEL1 표적 핵산과 적어도 99%의 상동성을 갖는다. 일부 구체예에서, 자연 발생 변이체는 공지된 다형성이다.

발현의 조절

본원에서 이용된 용어 "발현의 조절"은 올리고뉴클레오티드의 투여 전 RTEL1의 양과 비교할 때, RTEL1의 양을 변경시킬 수 있는 올리고뉴클레오티드의 능력에 대한 총체적인 용어로서 이해되어야 한다. 대안적으로, 발현의 조절은 대조 실험을 참조하여 결정될 수 있다. 일반적으로 대조는 식염수 조성물로 처리된 개체 또는 표적 세포, 또는 비-표적화 올리고뉴클레오티드 (모의)로 처리된 개체 또는 표적 세포인 것으로 이해된다.

조절의 한 유형은, 예를 들면 mRNA의 분해 또는 전사의 차단에 의해 RTEL1의 발현을 저해, 하향 조절, 감소, 억제, 제거, 정지, 차단, 예방, 약화, 저하, 회피 또는 종결시킬 수 있는 올리고뉴클레오티드의 능력이다. 조절의 다른 유형은, 예를 들면 스플라이스 부위의 수복 또는 스플라이싱의 예방 또는 저해 메커니즘, 예컨대 마이크로RNA 억제의 제거 또는 차단에 의해 RTEL1의 발현을 회복, 증가 또는 향상시킬 수 있는 올리고뉴클레오티드의 능력이다.

당 변형

본원 발명의 올리고뉴클레오티드는 변형된 당 모이어티, 다시 말하면, DNA와 RNA에서 발견되는 리보오스 당 모이어티와 비교할 때 당 모이어티의 변형을 갖는 하나 또는 그 이상의 뉴클레오시드를 포함할 수 있다.

리보오스 당 모이어티의 변형을 갖는 다수의 뉴클레오시드는 주로 올리고뉴클레오티드의 일정한 특성, 예컨대 친화성 및/또는 뉴클레아제 내성을 개선하기 위한 목적으로 만들어졌다.

이런 변형은 리보오스 고리 구조가, 예를 들면 헥소오스 고리 (HNA) 또는 이중환상 고리로 대체에 의해 변형되는 것들을 포함하는데, 이들은 전형적으로 리보오스 고리 (LNA) 상에, 또는 전형적으로 C2 및 C3 탄소 사이에 결합이 없는 비-연결된 리보오스 고리 (예를 들면, UNA) 상에 C2 및 C4 탄소 사이에 2가 라디칼 브리지를 갖는다. 다른 당 변형된 뉴클레오시드는, 예를 들면 비시클로헥소오스 핵산 (WO2011/017521) 또는 삼중환상 핵산 (WO2013/154798)을 포함한다. 변형된 뉴클레오시드는 또한, 예를 들면 펩티드 핵산 (PNA) 또는 모르폴리노 핵산의 경우에 당 모이어티가 비-당 모이어티로 대체되는 뉴클레오시드를 포함한다.

당 변형은 또한 리보오스 고리 상의 치환기를 수소 이외의 기, 또는 DNA와 RNA 뉴클레오시드에서 자연적으로 발견되는 2'-OH 기로 변경하는 것을 통해 만들어진 변형을 포함한다. 예를 들면, 2', 3', 4' 또는 5' 위치에서 치환기가 도입될 수 있다.

높은 친화성 변형된 뉴클레오시드

높은 친화성 변형된 뉴클레오시드는 올리고뉴클레오티드 내로 통합될 때, 예를 들면 용융 온도 (T^m)에 의해 계측되는 바와 같이 상보적인 표적에 대한 올리고뉴클레오티드의 친화성을 향상시키는 변형된 뉴클레오티드이다. 본원 발명의 높은 친화성 변형된 뉴클레오시드는 바람직하게는 변형된 뉴클레오시드마다 +0.5 내지 +12℃, 더욱 바람직하게는 +1.5 내지 +10℃, 가장 바람직하게는 +3 내지 +8℃의 용융 온도 증가를 유발한다. 다수의 높은 친화성 변형된 뉴클레오시드는 당해 분야에 공지되어 있고, 그리고 예를 들면 많은 2' 치환된 뉴클레오시드뿐만 아니라 잠금 핵산 (LNA)을 포함한다 (참조: 예를 들면, Freier & Altmann; Nucl. Acid Res., 1997, 25, 4429-4443 및 Uhlmann; Curr. Opinion in Drug Development, 2000, 3(2), 293-213).

2' 당 변형된 뉴클레오시드

2' 당 변형된 뉴클레오시드는 2' 위치에서 H 또는 -OH 이외의 치환기를 갖는 뉴클레오시드 (2' 치환된 뉴클레오시드)이거나, 또는 리보오스 고리에서 2' 탄소 및 두 번째 탄소 사이에 브리지를 형성할 수 있는 2' 결합된 2가 라디칼을 포함하는 뉴클레오시드, 예컨대 LNA (2'-4' 2가 라디칼 브리지) 뉴클레오시드이다.

실제로, 2' 당 치환된 뉴클레오시드의 개발에 많은 관심이 집중되어 왔고, 그리고 수많은 2' 치환된 뉴클레오시드가 올리고뉴클레오티드 내로 통합될 때 유익한 특성을 갖는 것으로 밝혀졌다. 예를 들면, 2' 변형된 당은 올리고뉴클레오티드에 향상된 결합 친화성 및/또는 증가된 뉴클레아제 내성을 제공할 수 있다. 2' 치환된 변형 뉴클레오시드의 실례는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA (MOE), 2'-아미노-DNA, 2'-플루오로-RNA 및 2'-F-ANA 뉴클레오시드이다. 추가적인 실례를 위해, 예를 들면 Freier & Altmann; Nucl. Acid Res., 1997, 25, 4429-4443 및 Uhlmann; Curr. Opinion in Drug Development, 2000, 3(2), 293-213, 그리고 Deleavey and Damha, Chemistry and Biology 2012, 19, 937을 참조한다. 아래에는 일부 2' 치환된 변형 뉴클레오시드가 예시된다.

본원 발명과 관련하여, 2' 치환된 당 변형된 뉴클레오시드는 LNA와 같은 2' 가교된 뉴클레오시드를 포함하지 않는다.

잠금 핵산 뉴클레오시드 (LNA 뉴클레오시드)

"LNA 뉴클레오시드"는 리보오스 고리의 형태를 제한하거나 잠금시키는, 상기 뉴클레오시드의 리보오스 당 고리의 C2' 및 C4'를 연결하는 2가 라디칼 ("2'-4' 브리지"로 또한 지칭됨)을 포함하는 2'-당 변형된 뉴클레오시드이다. 이들 뉴클레오시드는 또한 문헌에서 가교된 핵산 또는 이중환상 핵산 (BNA)으로 명명된다. 리보오스 형태의 잠금은 LNA가 상보적 RNA 또는 DNA 분자에 대한 올리고뉴클레오티드 내로 통합될 때 혼성화의 친화성 향상 (이중나선 안정화)과 연관된다. 이것은 올리고뉴클레오티드/상보적 이중나선의 용융 온도를 계측함으로써 일과적으로 결정될 수 있다.

무제한적이고 예시적인 LNA 뉴클레오시드는 WO 99/014226, WO 00/66604, WO 98/039352, WO 2004/046160, WO 00/047599, WO 2007/134181, WO 2010/077578, WO 2010/036698, WO 2007/090071, WO 2009/006478, WO 2011/156202, WO 2008/154401, WO 2009/067647, WO 2008/150729, Morita et al., Bioorganic & Med. Chem. Lett. 12, 73-76, Seth et al. J. Org. Chem. 2010, Vol 75(5) pp. 1569-81, Mitsuoka et al., Nucleic Acids Research 2009, 37(4), 1225-1238, 그리고 Wan and Seth, J. Medical Chemistry 2016, 59, 9645-9667에서 개시된다.

본원 발명의 LNA 뉴클레오시드의 특정 실례는 반응식 1 (여기서 B는 상기 규정된 바와 같다)에서 제시된다.

반응식 1

특정 LNA 뉴클레오시드는 베타-D-옥시-LNA, 6'- 메틸-베타-D-옥시 LNA, 예컨대 (S)-6'-메틸-베타-D-옥시-LNA(ScET) 및 ENA이다.

제약학적으로 허용되는 염

용어 "제약학적으로 허용되는 염"은 생물학적으로 바람직하지 않거나 또는 달리 바람직하지 않은 경우가 아닌, 유리 염기 또는 유리 산의 생물학적 효과와 특성을 보유하는 염을 지칭한다. 염은 염산, 브롬화수소산, 황산, 질산, 인산, 구체적으로는 염산과 같은 무기산, 그리고 아세트산, 프로피온산, 글리콜산, 피루브산, 옥살산, 말레산, 말론산, 숙신산, 푸마르산, 타르타르산, 시트르산, 벤조산, 계피산, 만델산, 메탄술폰산, 에탄술폰산, p-톨루엔술폰산, 살리실산, N-아세틸시스테인과 같은 유기산으로 형성된다. 이에 더하여, 이들 염은 유리 산에 무기 염기 또는 유기 염기를 첨가하여 제조될 수 있다. 무기 염기로부터 유래된 염은 나트륨, 칼륨, 리튬, 암모늄, 칼슘, 마그네슘 염을 포함하지만 이들에 한정되지 않는다. 유기 염기로부터 유래된 염은 1차, 2차 및 3차 아민의 염, 자연 발생된 치환된 아민을 비롯한 치환된 아민, 시클릭 아민 및 염기성 이온 교환 수지, 예컨대 이소프로필아민, 트리메틸아민, 디에틸아민, 트리에틸아민, 트리프로필아민, 에탄올아민, 리신, 아르기닌, N-에틸피페리딘, 피페리딘, 폴리아민 수지를 포함하지만 이들에 한정되지 않는다. 화학식 (I)의 화합물은 또한 쌍성 이온의 형태로 존재할 수 있다. 화학식 (I)의 화합물의 특히 바람직한 제약학적으로 허용되는 염은 염산, 브롬화수소산, 황산, 인산 및 메탄술폰산의 염이다.

RNase H 활성 및 모집

안티센스 올리고뉴클레오티드의 RNase H 활성은 상보적 RNA 분자와의 이중나선 형태로 있을 때, RNase H를 모집하는 능력을 지칭한다. WO01/23613은 RNaseH 활성을 결정하기 위한 시험관내 방법을 제공하는데, 이들은 RNaseH를 모집하는 능력을 결정하는 데 이용될 수 있다. 전형적으로, 올리고뉴클레오티드는 상보적 표적 핵산 서열이 제공될 때, pmol/l/분으로 계측되는 바와 같이, 검사되는 변형된 올리고뉴클레오티드와 동일한 염기 서열을 갖지만 올리고뉴클레오티드 내에 모든 단량체 사이에 포스포로티오에이트 연쇄를 갖는 DNA 단량체만을 내포하는 올리고뉴클레오티드를 이용하고 WO01/23613 (본원에 참조로서 편입됨)의 실시예 91-95에 의해 제공된 방법을 이용할 때 결정된 초기 속도의 적어도 5%, 예컨대 적어도 10% 또는 20% 이상의 초기 속도를 갖는 경우에 RNase H를 모집할 수 있는 것으로 간주된다. RNase H 활성을 결정하는 데 이용을 위해, 재조합 인간 RNase H1은 Creative Biomart® (대장균 (E. coli)에서 발현된 His 태그와 융합된 재조합 인간 RNASEH1)로부터 가용하다.

갭머

본원 발명의 안티센스 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 갭머 올리고뉴클레오티드 또는 갭머 설계로 또한 명명되는 갭머일 수 있다. 안티센스 갭머는 RNase H 매개 분해를 통해 표적 핵산을 저해하는 데 통상적으로 이용된다. 갭머 올리고뉴클레오티드는 '5 -> 3' 방향으로 5'-측부, 갭 및 3'-측부인 F-G-F'의 적어도 3개의 별개의 구조 영역을 포함한다. "갭" 영역 (G)은 올리고뉴클레오티드가 RNase H를 모집할 수 있도록 하는 연속 DNA 뉴클레오티드의 스트레치를 포함한다. 갭 영역은 하나 또는 그 이상의 당 변형된 뉴클레오시드, 바람직하게는 높은 친화성 당 변형된 뉴클레오시드를 포함하는 5' 측부 영역 (F)에 의해, 그리고 하나 또는 그 이상의 당 변형된 뉴클레오시드, 바람직하게는 높은 친화성 당 변형된 뉴클레오시드를 포함하는 3' 측부 영역 (F')에 의해 측접된다. 영역 F 및 F' 내에 하나 또는 그 이상의 당 변형된 뉴클레오시드는 표적 핵산에 대한 올리고뉴클레오티드의 친화성을 향상시킨다 (즉, 친화성 향상 당 변형된 뉴클레오시드이다). 일부 구체예에서, 영역 F 및 F' 내에 하나 또는 그 이상의 당 변형된 뉴클레오시드는 2' 당 변형된 뉴클레오시드, 예컨대 LNA 및 2'-MOE에서 독립적으로 선택된 것과 같은 높은 친화성 2' 당 변형체이다.

갭머 설계에서, 갭 영역의 5' 및 3'에 가장 가까운 뉴클레오시드는 DNA 뉴클레오시드이고, 그리고 각각 5' (F) 또는 3' (F') 영역의 당 변형된 뉴클레오시드에 인접하게 위치된다. 측부는 갭 영역으로부터 가장 먼 단부에서, 다시 말하면, 5' 측부의 5' 단부 및 3' 측부의 3' 단부에서 적어도 하나의 당 변형된 뉴클레오시드를 가짐으로써 추가로 규정될 수 있다.

영역 F-G-F'는 연속 뉴클레오티드 서열을 형성한다. 본원 발명의 안티센스 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 화학식 F-G-F'의 갭머 영역을 포함할 수 있다.

갭머 설계 F-G-F'의 전체 길이는, 예를 들면 12 내지 32개의 뉴클레오시드, 예컨대 13 내지 24개, 예컨대 14 내지 22개의 뉴클레오시드, 예컨대 14 내지 17개, 예컨대 16 내지 18개의 뉴클레오시드일 수 있다. 예로서, 본원 발명의 갭머 올리고뉴클레오티드는 하기 화학식으로 나타낼 수 있고:

F_1-8-G_5-18-F'_1-8,예컨대

F_1-8-G_5-16-F'_1-8, 예컨대

F_1-8-G_7-16-F'_2-8

단서로써, 갭머 영역 F-G-F'의 전체 길이는 적어도 12개, 예컨대 적어도 14개 뉴클레오티드의 길이를 갖는다.

본원 발명의 한 양상에서 안티센스 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 화학식 5'-F-G-F'-3'의 갭머로 구성되거나 또는 이것을 포함하는데, 여기서 영역 F 및 F'는 1-8개의 뉴클레오시드를 독립적으로 포함하거나 또는 이들로 구성되고, 이들 중에서 1-4개는 2' 당 변형되고 F 및 F' 영역의 5' 및 3' 단부를 규정하고, 그리고 G는 RNaseH를 모집할 수 있는 6 내지 18개, 예컨대 6 내지 16개 뉴클레오시드의 영역이다. 일부 구체예에서 G 영역은 DNA 뉴클레오시드로 구성된다.

영역 F, G 및 F'는 아래에 추가로 규정되고 F-G-F' 화학식 내로 통합될 수 있다.

갭머 - 영역 G

갭머의 영역 G (갭 영역)는 올리고뉴클레오티드가 RNaseH, 예컨대 인간 RNase H1을 모집할 수 있도록 하는 뉴클레오시드, 전형적으로 DNA 뉴클레오시드의 영역이다. RNaseH는 DNA와 RNA 사이의 이중나선을 인식하고 RNA 분자를 효소적으로 개열하는 세포 효소이다. 적합하게는 갭머는 길이에서 적어도 5 또는 6개의 연속 DNA 뉴클레오시드, 예컨대 5 - 18개의 연속 DNA 뉴클레오시드, 5 - 17개의 연속 DNA 뉴클레오시드, 예컨대 5 - 16개의 연속 DNA 뉴클레오시드, 예컨대 6 - 15개의 연속 DNA 뉴클레오시드, 예컨대 7 - 14개의 연속 DNA 뉴클레오시드, 예컨대 8 - 12개의 연속 DNA 뉴클레오티드, 예컨대 8 - 12개의 연속 DNA 뉴클레오티드의 갭 영역 (G)을 가질 수 있다. 갭 영역 (G)은, 일부 구체예에서 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18개의 연속 DNA 뉴클레오시드로 구성될 수 있다. 갭 영역에서 시토신 (C) DNA는 일부 사례에서 메틸화될 수 있으며, 이런 잔기는 5'-메틸-시토신 (^meC 또는 c 대신에 e가 있음)으로서 주해된다. 갭에서 시토신 DNA의 메틸화는 만약 잠재적 독성을 감소시키기 위해 cg 디뉴클레오티드가 갭 내에 존재하면 바람직하며, 이러한 변형은 올리고뉴클레오티드의 효능에 대한 유의미한 영향을 갖지 않는다. 5' 치환된 DNA 뉴클레오시드, 예컨대 5' 메틸 DNA 뉴클레오시드가 DNA 갭 영역에서 이용에 대해 보고되었다 (EP 2 742 136).

일부 구체예에서, 갭 영역 G는 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18개의 연속 포스포로티오에이트 결합된 DNA 뉴클레오시드로 구성될 수 있다. 일부 구체예에서, 갭 내의 모든 뉴클레오시드간 연쇄는 포스포로티오에이트 연쇄이다.

전통적인 갭머는 DNA 갭 영역을 갖지만, 갭 영역 내에서 이용될 때 RNaseH 모집을 가능하게 하는 변형된 뉴클레오시드의 많은 실례가 있다. 갭 영역 내에 포함될 때 RNaseH를 모집할 수 있는 것으로 보고된 변형된 뉴클레오시드에는, 예를 들면 알파-L-LNA, C4' 알킬화 DNA (PCT/EP2009/050349 및 Vester et al., Bioorg. Med. Chem. Lett. 18 (2008) 2296-2300에서 기술된 바와 같이, 이들 둘 모두 본원에 참조로서 편입됨), ANA 및 2'F-ANA와 같은 아라비노스 유래 뉴클레오시드 (Mangos et al. 2003 J. AM. CHEM. SOC. 125, 654-661), UNA (잠금 해제된 핵산) (본원에 참조로서 편입되는 Fluiter et al., Mol. Biosyst., 2009, 10, 1039에서 기술된 바와 같이)가 포함된다. UNA는 잠금 해제된 핵산인데, 전형적으로 여기서 리보오스의 C2 및 C3 사이의 결합이 제거되어 잠금 해제된 "당" 잔기가 형성된다. 이런 갭머에 이용되는 변형된 뉴클레오시드는 갭 영역 내로 도입될 때 2' 엔도 (DNA 유사) 구조를 채택하는 뉴클레오시드, 다시 말하면, RNaseH 모집을 허용하는 변형체일 수 있다. 일부 구체예에서, 본원에서 기술된 DNA 갭 영역 (G)은 이러한 갭 영역 내로 도입될 때 2' 엔도 (DNA 유사) 구조를 채택하는 1 내지 3개의 당 변형된 뉴클레오시드를 임의적으로 내포할 수 있다.

갭머 - 측부 영역, F 및 F'

영역 F는 영역 G의 5' DNA 뉴클레오시드에 바로 인접하여 위치한다. 영역 F의 3'에 가장 가까운 뉴클레오시드는 당 변형된 뉴클레오시드, 예컨대 높은 친화성 당 변형된 뉴클레오시드, 예를 들면 2' 치환된 뉴클레오시드, 예컨대 MOE 뉴클레오시드 또는 LNA 뉴클레오시드이다.

영역 F'는 영역 G의 3' DNA 뉴클레오시드에 바로 인접하여 위치한다. 영역 F'의 5'에 가장 가까운 뉴클레오시드는 당 변형된 뉴클레오시드, 예컨대 높은 친화성 당 변형된 뉴클레오시드, 예를 들면 2' 치환된 뉴클레오시드, 예컨대 MOE 뉴클레오시드 또는 LNA 뉴클레오시드이다.

영역 F는 길이에서 1-8개의 연속 뉴클레오티드, 예컨대 길이에서 2-6개, 예컨대 3-4개의 연속 뉴클레오티드이다. 바람직하게는, 영역 F의 5'에 가장 가까운 뉴클레오시드는 당 변형된 뉴클레오시드이다. 일부 구체예에서, 영역 F의 2개의 5'에 가장 가까운 뉴클레오시드는 당 변형된 뉴클레오시드이다. 일부 구체예에서, 영역 F의 5'에 가장 가까운 뉴클레오시드는 LNA 뉴클레오시드이다. 일부 구체예에서, 영역 F의 2개의 5'에 가장 가까운 뉴클레오시드는 LNA 뉴클레오시드이다. 일부 구체예에서, 영역 F의 2개의 5'에 가장 가까운 뉴클레오시드는 2' 치환된 뉴클레오시드, 예컨대 2개의 3' MOE 뉴클레오시드이다. 일부 구체예에서, 영역 F의 5'에 가장 가까운 뉴클레오시드는 2' 치환된 뉴클레오시드, 예컨대 MOE 뉴클레오시드이다.

영역 F'는 길이에서 2-8개의 연속 뉴클레오티드, 예컨대 길이에서 3-6개, 예컨대 4-5개의 연속 뉴클레오티드이다. 바람직하게는, 구체예에서, 영역 F'의 3'에 가장 가까운 뉴클레오시드는 당 변형된 뉴클레오시드이다. 일부 구체예에서, 영역 F'의 2개의 3'에 가장 가까운 뉴클레오시드는 당 변형된 뉴클레오시드이다. 일부 구체예에서, 영역 F'의 2개의 3'에 가장 가까운 뉴클레오시드는 LNA 뉴클레오시드이다. 일부 구체예에서, 영역 F'의 3'에 가장 가까운 뉴클레오시드는 LNA 뉴클레오시드이다. 일부 구체예에서, 영역 F'의 2개의 3'에 가장 가까운 뉴클레오시드는 2' 치환된 뉴클레오시드, 예컨대 2개의 3' MOE 뉴클레오시드이다. 일부 구체예에서, 영역 F'의 3'에 가장 가까운 뉴클레오시드는 2' 치환된 뉴클레오시드, 예컨대 MOE 뉴클레오시드이다.

영역 F 또는 F'의 길이가 하나일 때, 이것은 바람직하게는 LNA 뉴클레오시드라는 점에 유의한다.

일부 구체예에서, 영역 F 및 F'는 독립적으로 당 변형된 뉴클레오시드의 연속 서열로 구성되거나 또는 이것을 포함한다. 일부 구체예에서, 영역 F의 당 변형된 뉴클레오시드는 2'-O-알킬 -RNA 단위, 2'-O-메틸-RNA, 2'-아미노-DNA 단위, 2'-플루오로-DNA 단위, 2'-알콕시-RNA, MOE 단위, LNA 단위, 아라비노 핵산 (ANA) 단위 및 2'-플루오로-ANA 단위에서 독립적으로 선택될 수 있다.

일부 구체예에서, 영역 F 및 F'는 LNA 및 2' 치환된 변형 뉴클레오시드 둘 모두를 독립적으로 포함한다 (혼합 날개 설계).

일부 구체예에서, 영역 F 및 F'는 단지 한 가지 유형의 당 변형된 뉴클레오시드, 예컨대 단지 MOE 또는 단지 베타-D-옥시 LNA 또는 단지 ScET로만 구성된다. 이런 설계는 또한 균일한 측부 또는 균일한 갭머 설계로 명명된다.

일부 구체예에서, 영역 F 또는 F', 또는 F 및 F'의 모든 뉴클레오시드는 LNA 뉴클레오시드이다, 예컨대 베타-D-옥시 LNA, ENA 또는 ScET 뉴클레오시드에서 독립적으로 선택된다. 일부 구체예에서, 영역 F는 1-5개, 예컨대 2-4개, 예컨대 3-4개, 예컨대 1, 2, 3, 4 또는 5개의 연속 LNA 뉴클레오시드로 구성된다. 일부 구체예에서, 영역 F 및 F'의 모든 뉴클레오시드는 베타-D-옥시 LNA 뉴클레오시드이다.

일부 구체예에서, 영역 F 또는 F', 또는 F 및 F'의 모든 뉴클레오시드는 2' 치환된 뉴클레오시드, 예컨대 OMe 또는 MOE 뉴클레오시드이다. 일부 구체예에서, 영역 F는 1, 2, 3, 4, 5, 6, 7 또는 8개의 연속 OMe 또는 MOE 뉴클레오시드로 구성된다. 일부 구체예에서, 측부 영역 중 한쪽만 2' 치환된 뉴클레오시드, 예컨대 OMe 또는 MOE 뉴클레오시드로 구성될 수 있다. 일부 구체예에서, 5' (F) 측부 영역은 2' 치환된 뉴클레오시드, 예컨대 OMe 또는 MOE 뉴클레오시드로 구성되는 반면, 3' (F') 측부 영역은 적어도 하나의 LNA 뉴클레오시드, 예컨대 베타-D-옥시 LNA 뉴클레오시드 또는 cET 뉴클레오시드를 포함한다. 일부 구체예에서, 3' (F') 측부 영역은 2' 치환된 뉴클레오시드, 예컨대 OMe 또는 MOE 뉴클레오시드로 구성되는 반면, 5' (F) 측부 영역은 적어도 하나의 LNA 뉴클레오시드, 예컨대 베타-D-옥시 LNA 뉴클레오시드 또는 cET 뉴클레오시드를 포함한다.

일부 구체예에서, 영역 F 및 F'의 모든 변형된 뉴클레오시드는 LNA 뉴클레오시드이고, 예컨대 베타-D-옥시 LNA, ENA 또는 ScET 뉴클레오시드에서 독립적으로 선택되고, 여기서 영역 F 또는 F', 또는 F 및 F'는 DNA 뉴클레오시드를 임의적으로 포함할 수 있다 (교대 측부, 이들에 대한 더욱 상세한 내용은 정의를 참조한다). 일부 구체예에서, 영역 F 및 F'의 모든 변형된 뉴클레오시드는 베타-D-옥시 LNA 뉴클레오시드이고, 여기서 영역 F 또는 F', 또는 F 및 F'는 DNA 뉴클레오시드를 임의적으로 포함할 수 있다 (교대 측부, 이들에 대한 더욱 상세한 내용은 정의를 참조한다).

일부 구체예에서, 영역 F 및 F'의 5'에 가장 가까운 뉴클레오시드 및 3'에 가장 가까운 뉴클레오시드는 LNA 뉴클레오시드, 예컨대 베타-D-옥시 LNA 뉴클레오시드 또는 ScET 뉴클레오시드이다.

일부 구체예에서, 영역 F 및 영역 G 사이의 뉴클레오시드간 연쇄는 포스포로티오에이트 뉴클레오시드간 연쇄이다. 일부 구체예에서, 영역 F' 및 영역 G 사이의 뉴클레오시드간 연쇄는 포스포로티오에이트 뉴클레오시드간 연쇄이다. 일부 구체예에서, 영역 F 또는 F', F 및 F'의 뉴클레오시드 사이의 뉴클레오시드간 연쇄는 포스포로티오에이트 뉴클레오시드간 연쇄이다.

LNA 갭머

LNA 갭머는 영역 F 및 F' 중 하나 또는 둘 모두가 LNA 뉴클레오시드를 포함하거나 또는 이들로 구성되는 갭머이다. 베타-D-옥시 갭머는 영역 F 및 F' 중 하나 또는 둘 모두가 베타-D-옥시 LNA 뉴클레오시드를 포함하거나 또는 이들로 구성되는 갭머이다.

일부 구체예에서 LNA 갭머는 하기 화학식을 갖는다: [LNA]_1-5-[영역 G] -[LNA]_1-5, 여기서 영역 G는 갭머 영역 G 정의에서 규정된 바와 같다.

MOE 갭머

MOE 갭머는 영역 F 및 F'가 MOE 뉴클레오시드로 구성되는 갭머이다. 일부 구체예에서 MOE 갭머는 설계 [MOE]_1-8-[영역 G]-[MOE]_1-8, 예컨대 [MOE]_2-7-[영역 G]_5-16-[MOE]_2-7, 예컨대 [MOE]_3-6-[영역 G]-[MOE]_3-6을 갖고, 여기서 영역 G는 갭머 정의에서 규정된 바와 같다. 5-10-5 설계(MOE-DNA-MOE)를 갖는 MOE 갭머가 당해 분야에서 널리 이용되고 있다.

올리고뉴클레오티드 내에 영역 D' 또는 D''

본원 발명의 올리고뉴클레오티드는 일부 구체예에서 표적 핵산에 상보적인 올리고뉴클레오티드의 연속 뉴클레오티드 서열, 예컨대 갭머 F-G-F' 및 추가적인 5' 및/또는 3' 뉴클레오시드를 포함하거나 또는 이들로 구성될 수 있다. 추가적인 5' 및/또는 3' 뉴클레오시드는 표적 핵산에 완전히 상보적이거나 또는 그렇지 않을 수 있다. 이런 추가적인 5' 및/또는 3' 뉴클레오시드는 본원에서 영역 D' 및 D''로 지칭될 수 있다.

영역 D' 또는 D''의 추가는 연속 뉴클레오티드 서열, 예컨대 갭머를 접합 모이어티 또는 다른 기능기에 결합시키기 위한 목적으로 이용될 수 있다. 연속 뉴클레오티드 서열을 접합 모이어티와 결합시키는 데 이용되는 경우, 생체개열가능 링커로서 작용할 수 있다. 대안적으로는, 엑소뉴클레아제 보호 또는 합성 또는 제조의 용이성을 제공하는 데 이용될 수 있다.

영역 D' 및 D''는 영역 F의 5' 단부 또는 영역 F'의 3' 단부에 각각 부착되어, 다음의 화학식 D'-F-G-F', F-G-F'-D'' 또는 D'-F-G-F'-D''의 설계가 산출될 수 있다. 이 경우, F-G-F'는 올리고뉴클레오티드의 갭머 부분이고, 그리고 영역 D' 또는 D''는 올리고뉴클레오티드의 별도의 부분을 구성한다.

영역 D' 또는 D''는 표적 핵산에 상보적이거나 또는 비-상보적일 수 있는 1, 2, 3, 4 또는 5개의 추가적인 뉴클레오티드를 독립적으로 포함하거나 또는 이들로 구성될 수 있다. F 또는 F' 영역에 인접한 뉴클레오티드는 당-변형된 뉴클레오티드, 예컨대 DNA 또는 RNA 또는 이들의 염기 변형된 버전이 아니다. D' 또는 D' 영역은 뉴클레아제에 민감한 생체개열가능 링커로서 작용할 수 있다 (링커의 정의 참조). 일부 구체예에서, 추가적인 5' 및/또는 3' 단부 뉴클레오티드는 포스포디에스테르 연쇄로 결합되고, 그리고 DNA 또는 RNA이다. 영역 D' 또는 D''로서 이용하기에 적합한 뉴클레오티드 기반 생체개열가능 링커는 WO2014/076195에 개시되는데, 이들은 예로서 포스포디에스테르 결합된 DNA 디뉴클레오티드를 포함한다. 폴리-올리고뉴클레오티드 작제물에서 생체개열가능 링커의 이용은 WO2015/113922에 개시되는데, 여기서 이들은 단일 올리고뉴클레오티드 내에서 복수의 안티센스 작제물 (예를 들면, 갭머 영역)을 연결하는 데 이용된다.

한 구체예에서, 본원 발명의 올리고뉴클레오티드는 갭머를 구성하는 연속 뉴클레오티드 서열 이외에 영역 D' 및/또는 D''를 포함한다.

일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 하기 화학식으로 나타낼 수 있다:

F-G-F'; 특히 F_1-8-G_5-16-F'_2-8

D'-F-G-F', 특히 D'_1-3-F_1-8-G_5-16-F'_2-8

F-G-F'-D'', 특히 F_1-8-G_5-16-F'_2-8-D''_1-3

D'-F-G-F'-D'', 특히 D'_1-3- F_1-8-G_5-16-F'_2-8-D''_1-3

일부 구체예에서, 영역 D' 및 영역 F 사이에 위치하는 뉴클레오시드간 연쇄는 포스포디에스테르 연쇄이다. 일부 구체예에서, 영역 F' 및 영역 D'' 사이에 위치하는 뉴클레오시드간 연쇄는 포스포디에스테르 연쇄이다.

접합체

본원에서 이용된 용어 접합체는 비-뉴클레오티드 모이어티 (접합 모이어티 또는 영역 C 또는 제3 영역)에 공유 결합된 올리고뉴클레오티드를 지칭한다.

본원 발명의 올리고뉴클레오티드의 하나 또는 그 이상의 비-뉴클레오티드 모이어티로의 접합은, 예를 들면 올리고뉴클레오티드의 활성, 세포 분포, 세포 흡수 또는 안정성에 영향을 줌으로써 올리고뉴클레오티드의 약리학을 개선할 수 있다. 일부 구체예에서, 접합 모이어티는 올리고뉴클레오티드의 세포 분포, 생체이용률, 대사, 배설, 투과성 및/또는 세포 흡수를 개선함으로써 올리고뉴클레오티드의 약동학적 특성을 변경하거나 향상시킨다. 특히, 접합체는 올리고뉴클레오티드를 특정 기관, 조직 또는 세포 유형에 표적화함으로써 상기 기관, 조직 또는 세포 유형에서 올리고뉴클레오티드의 효과를 향상시킬 수 있다. 이와 동시에, 접합체는 비-표적 세포 유형, 조직 또는 기관에서 올리고뉴클레오티드의 활성, 예를 들면 표적 이탈 활성, 또는 비-표적 세포 유형, 조직 또는 기관에서 활성을 감소시키는 역할을 할 수 있다.

WO 93/07883 및 WO2013/033230은 적합한 접합 모이어티를 제공하고, 이들은 본원에서 참조로서 편입된다. 더욱 적합한 접합 모이어티는 아시알로당단백질 수용체 (ASGPR)에 결합할 수 있는 것들이다. 특히, 삼가 N-아세틸갈락토사민 접합 모이어티가 ASGPR에 결합하는 데 적합하며, 예를 들면 WO 2014/076196, WO 2014/207232 및 WO 2014/179620 (본원에서 참조로서 편입됨)을 참조한다. 이런 접합체는 올리고뉴클레오티드의 간으로의 흡수를 향상시키면서, 신장에서 이의 존재를 감소시켜 접합되지 않은 버전의 동일한 올리고뉴클레오티드와 비교하여 접합된 올리고뉴클레오티드의 간/신장 비율을 증가시키는 역할을 한다.

올리고뉴클레오티드 접합체 및 이들의 합성은 또한, Manoharan in Antisense Drug Technology, Principles, Strategies, and Applications, S.T. Crooke, ed., Ch. 16, Marcel Dekker, Inc., 2001 및 Manoharan, Antisense and Nucleic Acid Drug Development, 2002, 12, 103에 의한 포괄적인 리뷰에서 보고되었고, 이들은 각각 본원에서 전체적으로 참조로서 편입된다.

한 구체예에서, 비-뉴클레오티드 모이어티 (접합 모이어티)는 탄수화물, 세포 표면 수용체 리간드, 원료의약품, 호르몬, 친유성 물질, 중합체, 단백질, 펩티드, 독소 (예를 들면, 박테리아 독소), 비타민, 바이러스 단백질 (예를 들면, 캡시드) 또는 이들의 조합으로 구성된 군에서 선택된다.

링커

연쇄 또는 링커는 하나 또는 그 이상의 공유 결합을 통해 하나의 화학기 또는 관심 부분을 다른 화학기 또는 관심 부분에 결합하는 두 원자 사이의 연결이다. 접합 모이어티는 직접적으로 또는 연결 모이어티 (예를 들면, 링커 또는 사슬)를 통해 올리고뉴클레오티드에 부착될 수 있다. 링커는 제3 영역, 예를 들면, 접합 모이어티 (영역 C)를 제1 영역, 예를 들면, 표적 핵산에 상보적인 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열 (영역 A)에 공유 연결하는 역할을 한다.

본원 발명의 일부 구체예에서, 본원 발명의 접합체 또는 올리고뉴클레오티드 접합체는 표적 핵산 (영역 A 또는 제1 영역)에 상보적인 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열 및 접합 모이어티 (영역 C 또는 제3 영역) 사이에 위치한 링커 영역 (제2 영역 또는 영역 B 및/또는 영역 Y)을 임의적으로 포함할 수 있다.

영역 B는 포유류 체내에서 정상적으로 접하게 되는 조건 또는 이들과 유사한 조건 하에서 개열될 수 있는 생리학적으로 불안정한 결합을 포함하거나 또는 이것으로 구성되는 생체개열가능 링커를 지칭한다. 생리학적으로 불안정한 링커가 화학적 변환 (예를 들면, 개열)을 겪게 되는 조건은 화학적 조건, 예컨대 pH, 온도, 산화 또는 환원 조건 또는 작용제, 그리고 포유류 세포에서 발견되거나 이와 유사한 염 농도를 포함한다. 포유류 세포내 조건은 또한 포유류 세포 내에 정상적으로 존재하는, 예컨대 단백질 분해 효소 또는 가수 분해 효소 또는 뉴클레아제로부터 효소 활성의 존재의 존재를 포함한다. 한 구체예에서, 생체개열가능 링커는 S1 뉴클레아제 개열에 민감하다. 바람직한 구체예에서 뉴클레아제 민감성 링커는 적어도 2개의 연속 포스포디에스테르 연쇄, 예컨대 적어도 3 또는 4 또는 5개의 연속 포스포디에스테르 연쇄를 포함하는 1 내지 10개의 뉴클레오시드, 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 뉴클레오시드, 더욱 바람직하게는 2 내지 6개의 뉴클레오시드, 그리고 가장 바람직하게는 2 내지 4개의 결합된 뉴클레오시드를 포함한다. 바람직하게는 뉴클레오시드는 DNA 또는 RNA이다. 포스포디에스테르 내포 생체개열가능 링커는 WO 2014/076195 (본원에 참조로서 편입됨)에서 더욱 상세하게 기술된다.

영역 Y는 반드시 생체개열가능할 필요는 없지만, 주로 접합 모이어티 (영역 C 또는 제3 영역)를 올리고뉴클레오티드 (영역 A 또는 제1 영역)에 공유 연결하는 역할을 하는 링커를 지칭한다. 영역 Y 링커는 반복 단위, 예컨대 에틸렌 글리콜, 아미노산 단위 또는 아미노 알킬 기의 사슬 구조 또는 소중합체를 포함할 수 있다. 본원 발명의 올리고뉴클레오티드 접합체는 다음의 영역 요소 A-C, A-B-C, A-B-Y-C, A-Y-B-C 또는 A-Y-C로 작제될 수 있다. 일부 구체예에서, 링커 (영역 Y)는 아미노 알킬, 예컨대, 예를 들면 C6 내지 C12 아미노 알킬기를 비롯한 C2-C36 아미노 알킬기이다. 바람직한 구체예에서, 링커 (영역 Y)는 C6 아미노 알킬기이다.

치료

본원에서 이용된 용어 "치료"는 기존 질환 (예를 들면, 본원에 언급된 질환 또는 장애)의 치료, 또는 질환의 예방, 즉 방지 둘 모두를 지칭한다. 이런 이유로, 본원에서 언급된 치료는, 일부 구체예에서 예방적일 수 있음이 인식될 것이다. 예방적은 HBV 감염이 만성 HBV 감염으로 변하는 것을 예방하거나, 또는 만성 HBV 감염에 의해 유발된 심각한 간 질환, 예컨대 간경화증 및 간세포 암종을 예방하는 것으로 이해될 수 있다.

예방

본원에서 용어 "예방하는", "예방" 또는 "예방한다"는 예방적 처치, 다시 말하면, 질환을 치유하기 보다는 예방을 목적으로 하는 조치 또는 절차에 관계한다. 예방은 질환 또는 이의 증상을 완전하게 또는 부분적으로 예방하는 면에서 예방적인 원하는 약리학적 및/또는 생리학적 효과가 획득된다는 것을 의미한다. 따라서, 본원에서 "HBV 감염을 예방하는"은 HBV 감염이 개체에서 발생하는 것을 예방하고, 그리고 HBV 감염의 증상의 발생을 예방하는 것을 포함한다. 본원 발명에서는 특히, HBV 감염된 어미로부터 소아로의 HBV 감염의 예방이 예기된다. 급성 HBV 감염이 만성 HBV 감염으로 변하는 것의 예방이 또한 예기된다.

환자

본원 발명을 위해 "개체" (또는 "환자")는 척추동물일 수 있다. 본원 발명의 맥락에서, 용어 "개체"는 인간 및 다른 동물, 특히 포유동물, 그리고 다른 생물체 둘 모두를 포함한다. 따라서 본원에서 제공된 수단과 방법은 인간 요법 및 수의학적 적용 둘 모두에 적용가능하다. 따라서, 본원에서 개체는 동물, 예컨대 생쥐, 쥐, 햄스터, 토끼, 기니피그, 흰담비, 고양이, 개, 닭, 양, 소 종, 말, 낙타, 또는 영장류일 수 있다. 바람직하게는, 개체는 포유동물이다. 더욱 바람직하게는 개체는 인간이다.

발명의 상세한 설명

감염된 간세포에서 HBV cccDNA는 지속적인 만성 감염 및 재활성화를 책임지며, 새로 합성된 바이러스 자손 및 세포내 뉴클레오캡시드 재활용을 통한 cccDNA 풀 재보충 둘 모두를 담보하는 모든 바이러스 하위유전체 전사체 및 전유전체 RNA (pgRNA)에 대한 주형이 된다. 본원 발명의 맥락에서 RTEL1이 cccDNA 안정성과 연관되는 것으로 최초로 밝혀졌다. 이러한 지식은 HBV 감염된 개체에서 cccDNA를 불안정하게 만드는 기회를 가능하게 하고, 이것은 차례로, 만성적으로 감염된 HBV 환자의 완전한 치유를 위한 기회를 연다.

본원 발명의 한 가지 양상은 B형 간염 바이러스 (HBV) 감염, 특히 만성 HBV 감염의 치료 및/또는 예방에서 이용을 위한 RTEL1 저해제이다.

RTEL1 저해제는 예를 들면 RTEL1 단백질에 특이적으로 결합하는 소형 분자일 수 있는데, 여기서 상기 저해제는 cccDNA에 대한 RTEL1 단백질의 결합을 예방하거나 또는 감소시킨다.

본원 발명의 구체예는 감염된 세포, 예컨대 HBV 감염된 세포에서 cccDNA 및/또는 pgRNA를 감소시킬 수 있는 RTEL1 저해제이다.

추가 구체예에서, RTEL1 저해제는 HBV 감염된 개체에서 생체내에서 HBsAg 및/또는 HBeAg를 감소시킬 수 있다.

본원 발명의 올리고뉴클레오티드

치료적 올리고뉴클레오티드는 잠재적으로 탁월한 RTEL1 저해제인데, 그 이유는 이들이 RNA 간섭 경로를 통해 또는 RNaseH 개열을 통해 RTEL1 전사체를 표적으로 하고 이의 분해를 증진할 수 있기 때문이다. 대안으로, 올리고뉴클레오티드, 예컨대 앱타머는 또한, RTEL1 단백질 상호작용의 저해제로서 작용할 수 있다.

본원 발명의 한 가지 양상은 B형 간염 바이러스 (HBV) 감염의 치료 및/또는 예방에서 이용을 위한 RTEL1 표적화 올리고뉴클레오티드이다. 이런 올리고뉴클레오티드는 단일 가닥 안티센스 올리고뉴클레오티드; siRNA 분자; 또는 shRNA 분자로 구성된 군에서 선택될 수 있다.

본 섹션은 B형 간염 바이러스 (HBV) 감염의 치료 및/또는 예방에서 이용에 적합한 신규한 올리고뉴클레오티드를 설명한다.

본원 발명의 올리고뉴클레오티드는 시험관내와 생체내에서 RTEL1의 발현을 저해할 수 있다. 저해는 올리고뉴클레오티드를, RTEL1을 인코딩하거나 또는 RTEL1의 조절에 관련되는 표적 핵산에 혼성화함으로써 달성된다. 표적 핵산은 포유류 RTEL1 서열, 예컨대 서열 번호: 1 및/또는 2의 서열일 수 있다.

일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 표적의 발현을 저해 또는 하향 조절함으로써 표적의 발현을 조절할 수 있다. 바람직하게는, 이런 조절은 표적의 정상 발현 수준과 비교하여 적어도 20%, 더욱 바람직하게는 표적의 정상 발현 수준과 비교하여 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80% 또는 적어도 90%의 발현 저해를 생성한다. 일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 PXB-PHH 세포에서 10 μM을 이용하여 시험관내에서 RTEL1 mRNA의 발현 수준을 적어도 60% 또는 70% 저해할 수도 있다. 일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 PXB-PHH 세포에서 10μM을 이용하여 시험관내에서 RTEL1 단백질의 발현 수준을 적어도 50% 저해할 수도 있으며, 표적 감소의 이러한 범위는 cccDNA 감소와 우수한 상관관계를 갖는 핵산 분자를 선별하는 면에서 유리하다. 적합하게는, 실시예는 RTEL1 RNA 또는 단백질 저해를 계측하는 데 이용될 수 있는 분석법을 제공한다 (예를 들면, 실시예 1). 표적 저해는 올리고뉴클레오티드의 연속 뉴클레오티드 서열 및 표적 핵산 사이의 혼성화에 의해 촉발된다. 일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 올리고뉴클레오티드 및 표적 핵산 사이의 부정합을 포함한다. 부정합에도 불구하고 표적 핵산에 대한 혼성화는 RTEL1 발현의 원하는 저해를 나타내는 데 여전히 충분할 수 있다. 부정합으로 인한 감소된 결합 친화성은 바람직하게는 올리고뉴클레오티드 내에 뉴클레오티드 숫자의 증가 및/또는 올리고뉴클레오티드 서열 내에 존재하는, 표적에 대한 결합 친화성을 증가시킬 수 있는 변형된 뉴클레오시드, 예컨대 LNA를 비롯한 2' 당 변형된 뉴클레오시드 숫자의 증가에 의해 보상될 수 있다.

본원 발명의 한 양상은 포유류 RTEL1 표적 핵산, 특히 인간 RTEL1 핵산에 적어도 95% 상보적인, 예컨대 완전히 상보적인, 길이에서 적어도 10개 뉴클레오티드, 예컨대 길이에서 적어도 12 내지 30개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는, 길이에서 12 내지 60개 뉴클레오티드의 올리고뉴클레오티드에 관계한다. 이들 올리고뉴클레오티드는 RTEL1의 발현을 저해할 수 있다.

본원 발명의 한 양상은 포유류 RTEL1에 적어도 90% 상보적인, 예컨대 완전히 상보적인, 길이에서 적어도 10개 뉴클레오티드, 예컨대 10 내지 30개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는, 길이에서 12 내지 30개 뉴클레오티드의 안티센스 올리고뉴클레오티드인 본원 발명에 따른 올리고뉴클레오티드에 관계한다.

본원 발명의 추가 양상은 서열 번호: 1의 표적 핵산에 적어도 90% 상보적인, 예컨대 완전히 상보적인, 길이에서 12 내지 20개, 예컨대 15 내지 22개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는 본원 발명에 따른 올리고뉴클레오티드에 관계한다.

일부 구체예에서, 올리고뉴클레오티드는 표적 핵산 또는 표적 서열의 영역에 적어도 90% 상보적인, 예컨대 적어도 91%, 예컨대 적어도 92%, 예컨대 적어도 93%, 예컨대 적어도 94%, 예컨대 적어도 95%, 예컨대 적어도 96%, 예컨대 적어도 97%, 예컨대 적어도 98%, 또는 100% 상보적인, 길이에서 10 내지 30개 뉴클레오티드의 연속 서열을 포함한다.

바람직하게는, 본원 발명의 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 표적 핵산의 영역에 완전히 상보적 (100% 상보적)이거나, 또는 일부 구체예에서 올리고뉴클레오티드 및 표적 핵산 사이에 하나 또는 두 개의 부정합을 포함할 수 있다.

일부 구체예에서, 안티센스 올리고뉴클레오티드 서열은 서열 번호: 1의 상응하는 표적 핵산에 100% 상보적이다.

일부 구체예에서 본원 발명의 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열은 서열 번호: 1 및 서열 번호: 2의 표적 핵산에 적어도 95% 상보적, 예컨대 완전히 (또는 100%) 상보적이다.

일부 구체예에서, 올리고뉴클레오티드는 서열 번호: 1 내에 존재하는 상응하는 표적 서열에 적어도 90% 상보적, 예컨대 100% 상보적인, 길이에서 15 내지 22개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는데, 여기서 상기 표적 서열은 서열 번호: 3 내지 21 (표 4) 또는 표 5A에서 영역 1A 내지 959A로 구성된 군에서 선택된다.

표 5A: 본원 발명의 올리고뉴클레오티드를 이용하여 표적화될 수 있는 서열 번호 1의 영역

일부 구체예에서, 올리고뉴클레오티드는 서열 번호: 1 내에 존재하는 상응하는 표적 서열에 적어도 90% 상보적, 예컨대 100% 상보적인, 길이에서 16 내지 20개, 예컨대 15 내지 22개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는데, 여기서 상기 표적 서열은 서열 번호: 3 내지 21 (표 4) 또는 표 5B에서 영역 B1 내지 B28로 구성된 군에서 선택된다.

표 5B: 본원 발명의 올리고뉴클레오티드를 이용하여 표적화될 수 있는 서열 번호 1의 영역

일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 길이에서 12 내지 60개의 뉴클레오티드, 예컨대 길이에서 13 내지 50개, 예컨대 14 내지 35개, 예컨대 15 내지 30개, 예컨대 16 내지 20개의 연속 뉴클레오티드를 포함하거나 또는 이들로 구성된다. 바람직한 구체예에서, 올리고뉴클레오티드는 길이에서 15, 16, 17, 18, 19 또는 20개의 뉴클레오티드를 포함하거나 또는 이들로 구성된다.

일부 구체예에서, 표적 핵산에 상보적인 올리고뉴클레오티드의 연속 뉴클레오티드 서열은 길이에서 12 내지 30개, 예컨대 13 내지 25개, 예컨대 15 내지 23개, 예컨대 16 내지 22개의 연속 뉴클레오티드를 포함하거나 또는 이들로 구성된다.

일부 구체예에서, 표적 핵산에 상보적인 siRNA 또는 shRNA의 연속 뉴클레오티드 서열은 길이에서 18 내지 28개, 예컨대 19 내지 26개, 예컨대 20 내지 24개, 예컨대 21 내지 23개의 연속 뉴클레오티드를 포함하거나 또는 이들로 구성된다.

일부 구체예에서, 표적 핵산에 상보적인 단일 가닥 안티센스 올리고뉴클레오티드의 연속 뉴클레오티드 서열은 길이에서 12 내지 22개, 예컨대 14 내지 20개, 예컨대 16 내지 20개, 예컨대 15 내지 21개, 예컨대 15 내지 18개, 예컨대 16 내지 18개, 예컨대 16 내지 17개의 연속 뉴클레오티드를 포함하거나 또는 이들로 구성된다.

일부 구체예에서, 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열은 표 6 (재료와 방법 섹션)에서 열거된 서열로 구성된 군에서 선택되는 서열을 포함하거나 또는 이것으로 구성된다.

일부 구체예에서, 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열은 서열 번호: 22 내지 237 (표 6에서 열거된 모티프 서열 참조)로 구성된 군에서 선택되는 서열에 적어도 90% 동일성, 바람직하게는 100% 동일성을 갖는, 길이에서 10 내지 30의 뉴클레오티드를 포함하거나 또는 이들로 구성된다. 특정한 구체예에서 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열은 서열 번호: 22; 23; 24; 25; 26; 27; 28; 29; 32; 35; 36; 37; 38; 39; 40; 41; 42; 42; 42; 43; 43; 46; 49; 83; 109; 130; 203; 및 232에서 선택된다.

연속 올리고뉴클레오티드 서열 (모티프 서열)은, 예를 들면 뉴클레아제 내성 및/또는 표적 핵산에 대한 결합 친화성을 증가시키도록 변형될 수 있는 것으로 이해된다.

변형된 뉴클레오시드 (예컨대, 높은 친화성 변형된 뉴클레오시드)가 올리고뉴클레오티드 서열 내로 통합되는 패턴은 일반적으로 올리고뉴클레오티드 설계로 명명된다.

본원 발명의 올리고뉴클레오티드는 변형된 뉴클레오시드 및 RNA 뉴클레오시드 (특히, siRNA 및 shRNA 분자의 경우) 또는 DNA 뉴클레오시드 (특히, 단일 가닥 안티센스 올리고뉴클레오티드의 경우)로 설계될 수 있다. 바람직하게는, 높은 친화성 변형된 뉴클레오시드가 이용된다.

한 구체예에서, 올리고뉴클레오티드는 적어도 1개의 변형된 뉴클레오시드, 예컨대 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개 또는 적어도 16개의 변형된 뉴클레오시드를 포함한다. 한 구체예에서, 올리고뉴클레오티드는 1 내지 10개의 변형된 뉴클레오시드, 예컨대 2 내지 9개의 변형된 뉴클레오시드, 예컨대 3 내지 8개의 변형된 뉴클레오시드, 예컨대 4 내지 7개의 변형된 뉴클레오시드, 예컨대 6 또는 7개의 변형된 뉴클레오시드를 포함한다. 적합한 변형은 "정의" 섹션에서 "변형된 뉴클레오시드", "높은 친화성 변형된 뉴클레오시드", "당 변형", "2' 당 변형" 및 "잠금 핵산 (LNA)" 하에 기술된다.

한 구체예에서, 올리고뉴클레오티드는 하나 또는 그 이상의 당 변형된 뉴클레오시드, 예컨대 2' 당 변형된 뉴클레오시드를 포함한다. 바람직하게는, 본원 발명의 올리고뉴클레오티드는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA, 2'-아미노-DNA, 2'-플루오로-DNA, 아라비노 핵산 (ANA), 2'-플루오로-ANA 및 LNA 뉴클레오시드로 구성된 군에서 독립적으로 선택되는 하나 또는 그 이상의 2' 당 변형된 뉴클레오시드를 포함한다. 변형된 뉴클레오시드(들) 중 하나 또는 그 이상이 잠금 핵산 (LNA)인 것이 바람직하다.

추가의 구체예에서, 올리고뉴클레오티드는 적어도 하나의 변형된 뉴클레오시드간 연쇄를 포함한다. 적합한 뉴클레오시드간 변형은 "정의" 섹션에서 "변형된 뉴클레오시드간 연쇄" 하에 기술된다. 올리고뉴클레오티드의 5' 또는 3' 단부에서 적어도 2 내지 3개의 뉴클레오시드간 연쇄가 포스포로티오에이트 뉴클레오시드간 연쇄인 것이 바람직하다. 단일 가닥 안티센스 올리고뉴클레오티드의 경우에, 연속 뉴클레오티드 서열 내에 적어도 75%, 예컨대 모든 뉴클레오시드간 연쇄가 포스포로티오에이트 뉴클레오시드간 연쇄인 것이 바람직하다. 일부 구체예에서, 단일 가닥 안티센스 올리고뉴클레오티드의 연속 서열에서 모든 뉴클레오티드간 연쇄는 포스포로티오에이트 연쇄이다.

일부 구체예에서, 본원 발명의 올리고뉴클레오티드는 적어도 하나의 LNA 뉴클레오시드, 예컨대 1, 2, 3, 4, 5, 6, 7 또는 8개의 LNA 뉴클레오시드, 예컨대 2 내지 6개의 LNA 뉴클레오시드, 예컨대 3 내지 7개의 LNA 뉴클레오시드, 4 내지 8개의 LNA 뉴클레오시드 또는 3, 4, 5, 6, 7 또는 8개의 LNA 뉴클레오시드를 포함한다. 일부 구체예에서, 올리고뉴클레오티드에서 적어도 75%의 변형된 뉴클레오시드는 LNA 뉴클레오시드이다, 예컨대 80%, 예컨대 85%, 예컨대 90%의 변형된 뉴클레오시드는 LNA 뉴클레오시드이다. 또 다른 추가의 구체예에서, 올리고뉴클레오티드에서 모든 변형된 뉴클레오시드는 LNA 뉴클레오시드이다. 추가의 구체예에서, 올리고뉴클레오티드는 베타-D-옥시-LNA, 그리고 하기의 LNA 뉴클레오시드: 베타-D 또는 알파-L 구성에서 티오-LNA, 아미노-LNA, 옥시-LNA, ScET 및/또는 ENA, 또는 이들의 조합 중 하나 또는 그 이상을 포함할 수 있다. 추가의 구체예에서, 모든 LNA 시토신 단위는 5-메틸-시토신이다. 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열의 뉴클레아제 안정성을 위해 뉴클레오티드 서열의 5' 단부에서 적어도 1개의 LNA 뉴클레오시드 및 3' 단부에서 적어도 2개의 LNA 뉴클레오시드를 갖는 것이 바람직하다.

본원 발명의 구체예에서, 본원 발명의 올리고뉴클레오티드는 RNase H를 모집할 수 있다.

본원 발명에서 유리한 구조 설계는 "정의" 섹션에서 예를 들면 "갭머", "LNA 갭머" 및 "MOE 갭머" 하에 기술된 바와 같은 갭머 설계이다. 본원 발명에서, 본원 발명의 안티센스 올리고뉴클레오티드가 F-G-F' 설계를 갖는 갭머인 것이 바람직하다. 일부 구체예에서 갭머는 균일한 측부를 갖는 LNA 갭머이다.

본원 발명의 일부 구체예에서 LNA 갭머는 하기의 균일한 측부 설계에서 선택된다: 2-12-3, 4-14-2, 3-10-3, 3-9-3, 2-15-2, 2-12-4, 1-13-2, 3-13-2, 4-13-2, 2-12-2, 3-12-2, 3-15-2, 3-14-2, 3-13-3, 2-14-4, 3-12-3, 1-14-3, 3-14-3, 2-14-3, 2-15-3, 3-11-3, 1-12-3, 1-11-4, 1-13-2, 2-13-2, 2-16-2, 1-14-2, 1-17-3 및 1-18-2.

표 6 (재료와 방법 섹션)은 각 모티프 서열의 바람직한 설계를 열거한다.

모든 경우에서 F-G-F' 설계는 "정의" 섹션에서 "올리고뉴클레오티드 내에 영역 D' 또는 D''" 하에 기술된 바와 같은 영역 D' 및/또는 D''를 더욱 포함할 수 있다. 일부 구체예에서 본원 발명의 올리고뉴클레오티드는 갭머 영역의 5' 또는 3' 단부에서 1, 2 또는 3개의 포스포디에스테르 결합된 뉴클레오시드 단위, 예컨대 DNA 단위를 갖는다. 일부 구체예에서 본원 발명의 올리고뉴클레오티드는 2개의 5' 포스포디에스테르 결합된 DNA 뉴클레오시드, 그 이후에 "정의" 섹션에서 규정된 바와 같은 F-G-F' 갭머 영역으로 구성된다. 5' 또는 3' 단부에서 포스포디에스테르 결합된 DNA 단위를 내포하는 올리고뉴클레오티드는 접합에 적합하고, 그리고 본원에서 기술된 바와 같은 접합 모이어티를 더욱 포함할 수 있다. 간으로의 전달을 위해, ASGPR 표적화 모이어티가 접합 모이어티로서 특히 바람직하다.

본원 발명의 일부 구체예의 경우에, 올리고뉴클레오티드는 CMP-ID-NO: 22_1; 23_1; 24_1; 25_1; 26_1; 27_1; 28_1; 29_1; 30_1; 31_1; 32_1; 33_1; 34_1; 35_1; 36_1; 37_1; 38_1; 39_1; 40_1; 41_1; 42_1; 42_2; 42_3; 43_1; 43_2; 44_1; 45_1; 46_1; 47_1; 48_1; 49_1; 130_1; 109_1; 83_1; 203_1 및 232_1을 갖는 올리고뉴클레오티드 화합물의 군에서 선택된다 (참조: 표 6).

접합체

HBV 감염이 간에서 간세포에 일차적으로 영향을 주기 때문에, 접합되지 않은 저해제와 비교하여 저해제의 간으로의 전달을 증가시킬 접합 모이어티에 RTEL1 저해제를 접합하는 것이 바람직하다. 한 구체예에서 간 표적화 모이어티는 콜레스테롤 또는 다른 지질을 포함하는 모이어티, 또는 아시알로당단백질 수용체 (ASGPR)에 결합할 수 있는 접합 모이어티에서 선택된다.

일부 구체예에서, 본원 발명은 접합 모이어티에 공유 부착된 본원 발명의 핵산 분자를 포함하는 접합체를 제공한다.

아시알로당단백질 수용체 (ASGPR) 접합 모이어티는 갈락토오스의 친화성과 동등하거나 또는 이보다 큰 친화성으로 아시알로당단백질 수용체에 결합할 수 있는 하나 또는 그 이상의 탄수화물 모이어티 (ASGPR 표적화 모이어티)를 포함한다. 아시알로당단백질 수용체에 대한 다양한 갈락토오스 유도체의 친화성이 연구되었거나 (참조: 예를 들면: Jobst, S.T. and Drickamer, K. JB.C. 1996, 271, 6686) 또는 당해 분야에서 전형적인 방법을 이용하여 쉽게 결정된다.

한 구체예에서 접합 모이어티는 갈락토오스, 갈락토사민, N-포르밀-갈락토사민, N-아세틸갈락토사민, N-프로피오닐-갈락토사민, N-n-부타노일-갈락토사민 및 N-이소부타노일갈락토사민으로 구성된 군에서 선택되는 적어도 하나의 아시알로당단백질 수용체 표적화 모이어티를 포함한다. 유리하게는 아시알로당단백질 수용체 표적화 모이어티는 N-아세틸갈락토사민 (GalNAc)이다.

ASGPR 접합 모이어티를 산출하기 위해, ASGPR 표적화 모이어티 (바람직하게는 GalNAc)는 접합체 골격에 부착될 수 있다. 일반적으로, ASGPR 표적화 모이어티는 골격의 동일한 단부에 있을 수 있다. 한 구체예에서, 접합 모이어티는 안티센스 올리고뉴클레오티드에 접합될 수 있는 가지치기 분자에 각 GalNAc 모이어티를 연결하는 스페이서에 연결된 2 내지 4개의 말단 GalNAc 모이어티로 구성된다.

추가 구체예에서, 접합 모이어티는 아시알로당단백질 수용체 표적화 모이어티에 대하여 일가, 이가, 삼가 또는 사가이다. 유리하게는 아시알로당단백질 수용체 표적화 모이어티는 N-아세틸갈락토사민 (GalNAc) 모이어티를 포함한다.

GalNAc 접합 모이어티는, 예를 들면 WO 2014/179620 및 WO 2016/055601 및 PCT/EP2017/059080 (본원에서 참조로서 편입됨)에서 설명된 것들뿐만 아니라 GalNAc 모이어티가 부착된 작은 펩티드, 예컨대 Tyr-Glu-Glu-(아미노헥실 GalNAc)3 (YEE(ahGalNAc)3; 간세포 상에서 아시알로당단백질 수용체에 결합하는 글리코트리펩티드, 참조: 예를 들면, Duff, et al., Methods Enzymol, 2000, 313, 297); 리신-기초된 갈락토오스 클러스터 (예를 들면, L3G4; Biessen, et al., Cardovasc. Med., 1999, 214); 그리고 콜란-기초된 갈락토오스 클러스터 (예를 들면, 아시알로당단백질 수용체에 대한 탄수화물 인식 모티프)를 포함할 수 있다.

ASGPR 접합 모이어티, 특히 삼가 GalNAc 접합 모이어티는 당해 분야에서 공지된 방법을 이용하여 올리고뉴클레오티드의 3' 또는 5' 단부에 부착될 수 있다. 한 구체예에서 ASGPR 접합 모이어티는 올리고뉴클레오티드의 5' 단부에 결합된다.

한 구체예에서 접합 모이어티는 삼가 N-아세틸갈락토사민 (GalNAc), 예컨대 도 1에서 도시된 것들, 특히 도 1d에서 도시된 것들이다.

제조 방법

추가적인 양상에서, 본원 발명은 뉴클레오티드 단위를 반응시켜 올리고뉴클레오티드 내에 포함되는 공유 결합된 연속 뉴클레오티드 단위를 형성하는 단계를 포함하는, 본원 발명의 올리고뉴클레오티드의 제조 방법을 제공한다. 바람직하게는, 상기 방법은 포스포라미디트 화학 반응을 이용한다 (참조: 예를 들면, Caruthers et al, 1987, Methods in Enzymology vol. 154, 287-313쪽). 추가의 구체예에서, 상기 방법은 연속 뉴클레오티드 서열을 접합 모이어티 (리간드)와 반응시켜 접합 모이어티를 올리고뉴클레오티드에 공유 부착하는 단계를 추가로 포함한다. 추가의 양상에서, 본원 발명의 올리고뉴클레오티드 또는 본원 발명의 접합된 올리고뉴클레오티드를 제약학적으로 허용되는 희석제, 용매, 운반체, 염 및/또는 보조제와 혼합하는 단계를 포함하는, 본원 발명의 조성물을 제조하기 위한 방법이 제공된다.

제약학적 염

본원 발명에 따른 화합물은 그들의 제약학적으로 허용되는 염의 형태로 존재할 수 있다. 용어 "제약학적으로 허용되는 염"은 본원 발명의 화합물의 생물학적 효과와 특성을 유지하고 적합한 비-독성 유기 또는 무기 산 또는 유기 또는 무기 염기로부터 형성되는 전통적인 산-부가 염 또는 염기-부가 염을 지칭한다. 산-부가 염은, 예를 들면, 염산, 브롬화수소산, 요오드화수소산, 황산, 술팜산, 인산 및 질산과 같은 무기산으로부터 유래된 것들, 그리고 p-톨루엔술폰산, 살리실산, 메탄술폰산, 옥살산, 숙신산, 시트르산, 말산, 락트산 및 푸마르산 등과 유기산으로부터 유래된 것들을 포함한다. 염기-부가 염은 암모늄, 칼륨, 나트륨 및 4차 수산화암모늄, 예컨대 예를 들면 수산화테트라메틸암모늄으로부터 유래된 것들을 포함한다. 제약학적 화합물을 염으로 바꾸는 화학적 변형은 화합물의 개선된 물리적 및 화학적 안정성, 흡습성, 유동성 및 용해도를 수득하기 위한 약제사들에게 잘 알려진 기술이다. 예를 들면, Bastin, Organic Process Research & Development 2000, 4, 427-435 또는 Ansel, In: Pharmaceutical Dosage Forms and Drug Delivery Systems, 6th ed. (1995), pp. 196 및 1456-1457에서 기술된다. 예를 들면, 본원에 제공된 화합물의 제약학적으로 허용되는 염은 나트륨 염일 수 있다.

추가의 양상에서, 본원 발명은 안티센스 올리고뉴클레오티드 또는 이의 접합체의 제약학적으로 허용되는 염을 제공한다. 바람직한 구체예에서, 제약학적으로 허용되는 염은 나트륨 또는 칼륨 염이다.

제약학적 조성물

추가의 양상에서, 본원 발명은 전술된 올리고뉴클레오티드 및/또는 올리고뉴클레오티드 접합체 또는 이의 염 중 임의의 것 및 제약학적으로 허용되는 희석제, 운반체, 염 및/또는 보조제를 포함하는 제약학적 조성물을 제공한다. 제약학적으로 허용되는 희석제는 인산염-완충 식염수 (PBS)를 포함하고, 그리고 제약학적으로 허용되는 염은 나트륨 및 칼륨 염을 포함하지만 이들에 한정되지 않는다. 일부 구체예에서, 제약학적으로 허용되는 희석제는 멸균 인산염 완충된 식염수이다. 일부 구체예에서, 올리고뉴클레오티드는 제약학적으로 허용되는 희석제에서 50-300 μM 용액의 농도로 이용된다.

본원 발명에 이용하기에 적합한 제제는 Remington's Pharmaceutical Sciences, Mack Publishing Company, Philadelphia, Pa., 17th ed., 1985에서 발견된다. 약물 전달 방법에 관한 간략한 검토를 위해, 예를 들면 Langer (Science 249: 1527-1533, 1990)를 참조한다. WO 2007/031091은 제약학적으로 허용되는 희석제, 운반체 및 보조제의 적합하고 바람직한 실례를 추가로 제공한다 (본원에 참조로서 편입됨). 적합한 용량, 제제, 투여 경로, 조성물, 약형, 다른 치료제와의 병용, 전구약물 제제 또한 WO2007/031091에서 제공된다.

일부 구체예에서, 본원 발명의 올리고뉴클레오티드 또는 올리고뉴클레오티드 접합체, 또는 이들의 제약학적으로 허용되는 염은 고체 형태, 예컨대 분말, 예컨대 동결 건조된 분말이다.

본원 발명의 화합물, 올리고뉴클레오티드 또는 올리고뉴클레오티드 접합체는 제약학적 조성물 또는 제제의 제조를 위해 제약학적으로 허용되는 활성 또는 비활성 물질과 혼합될 수 있다. 제약학적 조성물의 제제를 위한 조성물 및 방법은 투여 경로, 질환의 정도, 또는 투여되는 용량을 포함하지만 이들에 한정되지 않는 다수의 기준에 의존한다.

이들 조성물은 전통적인 멸균 기술에 의해 멸균될 수 있거나, 또는 멸균 여과될 수 있다. 그 결과로서 생성된 수용액은 그대로 이용하기 위해 포장되거나, 또는 동결 건조될 수 있으며, 동결 건조된 제조물은 투여 전 멸균 수성 운반체와 조합된다. 이들 제조물의 pH는 전형적으로 3 내지 11, 더욱 바람직하게는 5 내지 9 또는 6 내지 8, 그리고 가장 바람직하게는 7 내지 8, 예컨대 7 내지 7.5일 것이다. 그 결과로서 생성된 고체 형태의 조성물은 복수의 단일 투약 단위로 포장될 수 있으며, 각각은 고정된 양의 전술된 작용제 또는 작용제들을, 예컨대 정제 또는 캡슐의 밀봉된 포장물 내에 내포한다. 고체 형태의 조성물은 또한 유연한 양을 위한 용기, 예컨대 국소적으로 적용가능한 크림 또는 연고를 위해 설계된 압착가능 튜브에 포장될 수 있다.

일부 구체예에서, 본원 발명의 올리고뉴클레오티드 또는 올리고뉴클레오티드 접합체는 전구약물이다. 특히, 올리고뉴클레오티드 접합체와 관련하여, 일단 전구약물이 작용 부위, 예를 들면, 표적 세포로 전달되면, 접합 모이어티는 올리고뉴클레오티드로부터 개열된다.

투여

본원 발명의 화합물, 올리고뉴클레오티드, 올리고뉴클레오티드 접합체 또는 제약학적 조성물은 국소 (예컨대, 피부, 흡입, 안과 또는 귀) 또는 경장 (예컨대, 경구 또는 위장관을 통해) 또는 비경구 (예컨대, 정맥내, 피하, 근육내, 뇌내, 뇌실내 또는 척수강내) 투여될 수 있다.

바람직한 구체예에서 본원 발명의 올리고뉴클레오티드 또는 제약학적 조성물은 정맥내, 동맥내, 피하, 복막내 또는 근육내 주사 또는 주입, 척수강내 또는 두개내, 예를 들면, 뇌내 또는 심실내, 유리체내 투여를 비롯한 비경구 경로에 의해 투여된다. 한 구체예에서 활성 올리고뉴클레오티드 또는 올리고뉴클레오티드 접합체는 정맥내 투여된다. 다른 구체예에서 활성 올리고뉴클레오티드 또는 올리고뉴클레오티드 접합체는 피하 투여된다.

일부 구체예에서, 본원 발명의 올리고뉴클레오티드, 올리고뉴클레오티드 접합체 또는 제약학적 조성물은 0.1 - 15 mg/kg, 예컨대 0.2 - 10 mg/kg, 예컨대 0.25 - 5 mg/kg의 용량으로 투여된다. 투여는 주 1회, 2 주마다 1회, 3 주마다 1회 또는 심지어 월 1회일 수 있다.

본원 발명은 또한, 약제의 제조를 위한 전술된 바와 같은 본원 발명의 올리고뉴클레오티드 또는 올리고뉴클레오티드 접합체의 용도를 제공하는데, 여기서 상기 약제는 피하 투여용 약형이다.

병용 요법

일부 구체예에서, 본원 발명의 저해제, 예컨대 본원 발명의 화합물, 올리고뉴클레오티드, 올리고뉴클레오티드 접합체 또는 제약학적 조성물은 다른 치료제와의 병용 치료에서 이용을 위한 것이다. 치료제는 예를 들면 전술된 질환 또는 장애에 대한 관리 기준일 수 있다.

실례로서, 본원 발명의 소중합체 또는 소중합체 접합체는 안티센스 (다른 LNA 소중합체 포함), siRNA (예컨대 ARC520), 앱타머, 모르폴리노 또는 임의의 다른 항바이러스성, 뉴클레오티드 서열-의존성 작용 방식을 통해 작용하는 다른 활성제, 예컨대 올리고뉴클레오티드-기초된 항바이러스제 - 예컨대 서열 특이적 올리고뉴클레오티드-기초된 항바이러스제 -와 병용될 수 있다.

추가 실례로서, 본원 발명의 소중합체 또는 소중합체 접합체는 다른 활성제, 예컨대 면역자극 항바이러스성 화합물, 예컨대 인터페론 (예를 들면, 페길화된 인터페론 알파), TLR7 효현제 (예를 들면, GS-9620), 또는 치료용 백신과 병용될 수 있다.

추가 실례로서, 본원 발명의 소중합체 또는 소중합체 접합체는 항바이러스 활성을 갖는 다른 활성제, 예컨대 소형 분자와 병용될 수 있다. 이들 다른 활성제는, 예를 들면, 뉴클레오시드/뉴클레오티드 저해제 (예를 들면, 엔테카비르 또는 테노포비르 디소프록실 푸마르산염), 캡시드화 저해제, 진입 저해제 (예를 들면, 미르클루덱스 B)일 수 있었다.

일정한 구체예에서, 추가 치료제는 HBV 작용제, C형 간염 바이러스 (HCV) 작용제, 화학요법제, 항생제, 진통제, 비스테로이드성 항염증성 (NSAID) 작용제, 항진균제, 항기생충제, 항메스꺼움 작용제, 항-설사 작용제, 또는 면역억제제일 수 있다.

특정 관련된 구체예에서, 추가 HBV 작용제는 인터페론 알파-2b, 인터페론 알파-2a 및 인터페론 알파콘-1 (페길화된 및 페길화되지 않은), 리바비린; HBV RNA 복제 저해제; 두 번째 안티센스 소중합체; HBV 치료용 백신; HBV 예방용 백신; 라미부딘 (3TC); 엔테카비르 (ETV); 테노포비르 디이소프록실 푸마르산염 (TDF); 텔비부딘 (LdT); 아데포비르; 또는 HBV 항체 요법 (단일클론 또는 다중클론)일 수 있다.

다른 특정 관련된 구체예에서, 추가 HCV 작용제는 인터페론 알파-2b, 인터페론 알파-2a 및 인터페론 알파콘-1 (페길화된 및 페길화되지 않은); 리바비린; 페가시스; HCV RNA 복제 저해제 (예를 들면, ViroPharma의 VP50406 계열); HCV 안티센스 작용제; HCV 치료용 백신; HCV 단백질분해효소 저해제; HCV 헬리카아제 저해제; 또는 HCV 단일클론 또는 다중클론 항체 요법일 수 있다.

적용

본원 발명의 올리고뉴클레오티드는, 예를 들면 진단, 치료 및 예방을 위한 연구용 시약으로서 활용될 수 있다.

연구에서, 이런 올리고뉴클레오티드는 세포 (예를 들면, 시험관내 세포 배양물) 및 실험 동물에서 RTEL1 단백질의 합성을 특이적으로 조절하여 표적의 기능적 분석을 용이하게 하거나 또는 치료적 개입을 위한 표적으로서의 유용성의 평가를 용이하게 할 수 있다. 전형적으로, 표적 조절은 단백질을 생산하는 mRNA를 분해 또는 저해하여 단백질 형성을 방해함으로써 달성되거나, 또는 단백질을 생산하는 유전자 또는 mRNA의 조절제를 분해하거나 저해함으로써 달성된다.

또한, RTEL1을 발현하는 표적 세포 내에서 RTEL1 발현을 조절하기 위한 생체내 또는 시험관내 방법이 본원 발명에 의해 포괄되고, 상기 방법은 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물을 효과적인 양으로 상기 세포에 투여하는 단계를 포함한다.

일부 구체예에서, 표적 세포는 포유류 세포, 특히 인간 세포이다. 표적 세포는 포유동물에서 시험관내 세포 배양물 또는 조직의 생체내 세포 형성 부분일 수도 있다. 바람직한 구체예에서 표적 세포는 간 내에 존재한다. 표적 세포는 간세포일 수도 있다.

본원 발명의 한 가지 양상은 약제로서 이용을 위한 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물에 관련된다.

본원 발명의 한 양상에서 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물은 감염된 세포에서 cccDNA 수준을 감소시키고, 그리고 이런 이유로 HBV 감염을 저해할 수 있다. 특히, 안티센스 올리고뉴클레오티드는 감염된 세포에서 하기의 파라미터 중에서 한 가지 또는 그 이상에 영향을 줄 수 있다: i) cccDNA를 감소시키고 및/또는 ii) pgRNA를 감소시키고 및/또는 iii) HBV DNA를 감소시키고 및/또는 iv) HBV 바이러스 항원을 감소시킴.

예를 들면, HBV 감염을 저해하는 핵산 분자는 i) 감염된 세포에서 cccDNA 수준을 대조와 비교하여 적어도 40%, 예컨대 50%, 60%, 70%, 80%, 또는 90% 감소시키거나; 또는 ii) pgRNA의 수준을 대조와 비교하여 적어도 40%, 예컨대 50%, 60%, 70%, 80%, 또는 90% 감소시킬 수 있다. 대조는 처리되지 않은 세포 또는 동물, 또는 적합한 대조로 처리된 세포 또는 동물일 수 있다.

HBV 감염의 저해는 HBV 감염된 일차 인간 간세포를 이용하여 시험관내에서, 또는 인간화 간세포 PXB 생쥐 모형 (PhoenixBio에서 가용, Kakuni et al 2014 Int. J. Mol. Sci. 15:58-74 또한 참조)을 이용하여 생체내에서 계측될 수 있다. HBsAg 및/또는 HBeAg의 분비의 저해는 ELISA에 의해, 예를 들면, 제조업체의 사용설명서에 따라서 CLIA ELISA 키트 (Autobio Diagnostic)를 이용함으로써 계측될 수 있다. 세포내 cccDNA 또는 HBV mRNA 및 pgRNA의 감소는, 예를 들면 재료와 방법 섹션에서 기술된 바와 같이 qPCR에 의해 계측될 수 있다. 검사 화합물이 HBV 감염을 저해하는 지를 평가하기 위한 추가 방법은 예를 들면 WO 2015/173208에서 기술된 바와 같이 qPCR에 의해, 또는 노던 블롯; 원지 혼성화, 또는 면역형광을 이용하여 HBV DNA의 분비를 계측한다.

RTEL1 수준의 감소로 인해, 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물은 HBV 감염의 발달을 저해하거나 또는 이것의 치료에서 이용될 수 있다. 특히, cccDNA의 불안정화 및 감소로 인해, 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물은 단순히 HBsAg의 분비를 감소시키는 화합물과 비교하여 만성 HBV 감염의 발달을 더욱 효율적으로 저해하거나 또는 이것을 더욱 효율적으로 치료한다.

따라서, 본원 발명의 한 가지 양상은 HBV 감염된 개체에서 cccDNA 및/또는 pgRNA를 감소시키기 위한 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물의 용도에 관련된다.

본원 발명의 추가 양상은 만성 HBV 감염의 발달을 저해하거나 또는 이것을 치료하기 위한 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물의 용도에 관계한다.

본원 발명의 추가 양상은 HBV 감염된 개인의 전염력을 감소시키기 위한 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물의 용도에 관계한다. 본원 발명의 특정한 양상에서, 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물은 만성 HBV 감염의 발달을 저해한다.

본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물로 치료되는 (또는 본원 발명의 안티센스 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물을 예방적으로 제공받는) 개체는 바람직하게는 인간, 더욱 바람직하게는 HBsAg 양성 및/또는 HBeAg 양성인 인간 환자, 이보다 더욱 바람직하게는 HBsAg 양성 및 HBeAg 양성인 인간 환자이다.

따라서, 본원 발명은 HBV 감염을 치료하는 방법에 관계하는데, 여기서 상기 방법은 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물의 효과량을 투여하는 단계를 포함한다. 본원 발명은 만성 HBV 감염에 의해 유발된 간경화증 및 간세포 암종을 예방하는 방법에 더욱 관계한다.

본원 발명은 또한, 약제, 특히 HBV 감염 또는 만성 HBV 감염의 치료 또는 HBV 감염된 개체의 전염력의 감소에서 이용을 위한 약제의 제조를 위한 본원 발명의 올리고뉴클레오티드, 접합 화합물 또는 제약학적 조성물의 용도를 제공한다. 바람직한 구체예에서 약제는 피하 투여용 약형으로 제조된다.

본원 발명은 또한, 정맥내 투여용 약형인 약제의 제조를 위한 본원 발명의 올리고뉴클레오티드, 접합 화합물, 제약학적 조성물의 용도를 제공한다.

본원 발명의 올리고뉴클레오티드, 접합체 또는 제약학적 조성물은 병용 요법에서 이용될 수 있다. 예를 들면, 본원 발명의 올리고뉴클레오티드, 접합체 또는 제약학적 조성물은 다른 항-HBV 작용제, 예컨대 인터페론 알파-2b, 인터페론 알파-2a 및 인터페론 알파콘-1 (페길화된 및 페길화되지 않은), 리바비린, 라미부딘 (3TC), 엔테카비르, 테노포비르, 텔비부딘 (LdT), 아데포비르, 또는 다른 급부상하는 항-HBV 작용제, 예컨대 HBV RNA 복제 저해제, HBsAg 분비 저해제, HBV 캡시드 저해제, 안티센스 소중합체 (예를 들면, WO2012/145697, WO 2014/179629 및 WO2017/216390에서 기술된 바와 같이), siRNA (예를 들면, WO 2005/014806, WO 2012/024170, WO 2012/2055362, WO 2013/003520, WO 2013/159109, WO 2017/027350 및 WO2017/015175에서 기술됨), HBV 치료용 백신, HBV 예방용 백신, HBV 항체 요법 (단일클론 또는 다중클론), 또는 HBV의 치료 및/또는 예방을 위한 TLR 2, 3, 7, 8 또는 9 효현제와 병용될 수 있다.

발명의 구체예

본원 발명의 하기 구체예는 본원에서 설명된 임의의 다른 구체예와 조합으로 이용될 수 있다.

1. B형 간염 바이러스 (HBV) 감염의 치료 및/또는 예방에서 이용을 위한 RTEL1 저해제.

2. 구체예 1의 이용을 위한 RTEL1 저해제, 여기서 RTEL1 저해제는 효과량으로 투여된다.

3. 구체예 1 또는 2의 이용을 위한 RTEL1 저해제, 여기서 HBV 감염은 만성 감염이다.

4. 구체예 1 내지 3의 이용을 위한 RTEL1 저해제, 여기서 RTEL1 저해제는 감염된 세포에서 cccDNA 및/또는 pgRNA를 감소시킬 수 있다.

5. 구체예 1 내지 4 중에서 한 가지의 이용을 위한 RTEL1 저해제, 여기서 RTEL1 저해제는 DNA, 예컨대 cccDNA에 RTEL1의 결합을 예방하거나 또는 감소시킨다.

6. 구체예 5의 이용을 위한 RTEL1 저해제, 여기서 상기 저해제는 RTEL1 단백질에 특이적으로 결합하는 소형 분자이고, 여기서 상기 저해제는 cccDNA에 RTEL1 단백질의 결합을 예방하거나 또는 감소시킨다.

7. 구체예 1 내지 5 중에서 한 가지의 이용을 위한 RTEL1 저해제, 여기서 상기 저해제는 포유류 RTEL1 표적 핵산에 적어도 90% 상보적인, 길이에서 적어도 10개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하거나 또는 이것으로 구성되는, 길이에서 12-60개 뉴클레오티드의 올리고뉴클레오티드이다.

8. 구체예 7의 이용을 위한 RTEL1 저해제, 이것은 RTEL1 표적 핵산의 수준을 감소시킬 수 있다.

9. 구체예 7 또는 8의 이용을 위한 RTEL1 저해제, 여기서 표적 핵산은 RNA이다.

10. 구체예 9의 이용을 위한 RTEL1 저해제, 여기서 RNA는 프리-mRNA이다.

11. 구체예 7 내지 10 중에서 한 가지의 이용을 위한 RTEL1 저해제, 여기서 올리고뉴클레오티드는 안티센스 올리고뉴클레오티드, siRNA 또는 shRNA에서 선택된다.

12. 구체예 11의 이용을 위한 RTEL1 저해제, 여기서 올리고뉴클레오티드는 단일 가닥 안티센스 올리고뉴클레오티드 또는 이중 가닥 siRNA이다.

13. 구체예 7 내지 12 중에서 한 가지의 이용을 위한 RTEL1 저해제, 여기서 포유류 RTEL1 표적 핵산은 서열 번호: 1 또는 2에서 선택된다.

14. 구체예 7 내지 12 중에서 한 가지의 이용을 위한 RTEL1 저해제, 여기서 올리고뉴클레오티드의 연속 뉴클레오티드 서열은 서열 번호: 1 및 서열 번호: 2의 표적 핵산에 적어도 98% 상보적이다.

15. 구체예 1 내지 14 중에서 한 가지의 이용을 위한 RTEL1 저해제, 여기서 HBV 감염된 세포에서 cccDNA는 대조와 비교할 때 적어도 50%, 예컨대 60%, 예컨대 70%, 예컨대 80%, 예컨대 90%, 예컨대 95%, 예컨대 100% 감소된다.

16. 구체예 7 내지 15 중에서 한 가지의 이용을 위한 올리고뉴클레오티드, 여기서 RTEL1 mRNA는 대조와 비교할 때 적어도 50%, 예컨대 60%, 예컨대 70%, 예컨대 80%, 예컨대 90%, 예컨대 95%, 예컨대 100% 감소된다.

17. 길이에서 12 내지 30개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하거나 또는 이것으로 구성되는 길이에서 12 내지 60개 뉴클레오티드의 올리고뉴클레오티드, 여기서 상기 연속 뉴클레오티드 서열은 포유류 RTEL1 표적 핵산에 적어도 90% 상보적, 예컨대 95%, 예컨대 98%, 예컨대 완전히 상보적이다.

18. 구체예 17의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 화학적으로 생산된다.

19. 구체예 17 또는 18의 올리고뉴클레오티드, 여기서 포유류 RTEL1 표적 핵산은 서열 번호: 1 또는 2에서 선택된다.

20. 구체예 17 또는 18의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 서열 번호: 1 및 서열 번호: 2의 표적 핵산에 적어도 98% 상보적이다.

21. 구체예 17 내지 20 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 길이에서 12 내지 30개 뉴클레오티드이다.

22. 구체예 17 내지 21 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 RNAi 분자, 예컨대 이중 가닥 siRNA 또는 shRNA이다.

23. 구체예 17 내지 21 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 단일 가닥 안티센스 올리고뉴클레오티드이다.

24. 구체예 17 내지 23 중에서 한 가지의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 서열 번호: 3 내지 21 (표 4)에서 선택되는 표적 서열에 상보적이다.

25. 구체예 17 내지 24의 올리고뉴클레오티드, 이것은 -15 kcal 미만의 △G°로 서열 번호: 1 및 서열 번호: 2의 표적 핵산에 혼성화할 수 있다.

26. 구체예 17 내지 25 중에서 한 가지의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 적어도 14개의 연속 뉴클레오티드, 특히 15, 16, 17, 18, 19, 20, 21 또는 22개의 연속 뉴클레오티드를 포함하거나 또는 이들로 구성된다.

27. 구체예 17 내지 25 중에서 한 가지의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 14 내지 22개의 뉴클레오티드를 포함하거나 또는 이들로 구성된다.

28. 구체예 27의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 16 내지 20개의 뉴클레오티드를 포함하거나 또는 이들로 구성된다.

29. 구체예 17 내지 28 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 길이에서 14 내지 25개의 뉴클레오티드를 포함하거나 또는 이들로 구성된다.

30. 구체예 29의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 길이에서 16 내지 22개의 뉴클레오티드를 포함하거나 또는 이들로 구성된다.

31. 구체예 17 내지 30 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 서열 번호: 22-237에서 선택되는 서열을 포함한다.

32. 구체예 17 내지 31 중에서 한 가지의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 자신이 상보적인 표적 핵산과 비교하여 제로 내지 3개의 부정합을 갖는다.

33. 구체예 32의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 표적 핵산과 비교하여 하나의 부정합을 갖는다.

34. 구체예 32의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 표적 핵산과 비교하여 2개의 부정합을 갖는다.

35. 구체예 32의 올리고뉴클레오티드, 여기서 연속 뉴클레오티드 서열은 양쪽 표적 핵산 서열에 완전히 상보적이다.

36. 하나 또는 그 이상의 변형된 뉴클레오시드를 포함하는, 구체예 17 내지 35의 올리고뉴클레오티드.

37. 구체예 36의 올리고뉴클레오티드, 여기서 하나 또는 그 이상의 변형된 뉴클레오시드는 높은 친화성 변형된 뉴클레오시드이다.

38. 구체예 36 또는 37의 올리고뉴클레오티드, 여기서 하나 또는 그 이상의 변형된 뉴클레오시드는 2' 당 변형된 뉴클레오시드이다.

39. 구체예 38의 올리고뉴클레오티드, 여기서 하나 또는 그 이상의 2' 당 변형된 뉴클레오시드는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA, 2'-아미노-DNA, 2'-플루오로-DNA, 2'-플루오로-ANA 및 LNA 뉴클레오시드로 구성된 군에서 독립적으로 선택된다.

40. 구체예 36-39의 올리고뉴클레오티드, 여기서 하나 또는 그 이상의 변형된 뉴클레오시드는 LNA 뉴클레오시드이다.

41. 구체예 40의 올리고뉴클레오티드, 여기서 변형된 LNA 뉴클레오시드는 옥시-LNA, 아미노-LNA, 티오-LNA, cET 및 ENA에서 선택된다.

42. 구체예 40 또는 41의 올리고뉴클레오티드, 여기서 변형된 LNA 뉴클레오시드는 다음의 2'-4' 브리지 -O-CH₂-를 갖는 옥시-LNA이다.

43. 구체예 42의 올리고뉴클레오티드, 여기서 옥시-LNA는 베타-D-옥시-LNA이다.

44. 구체예 40 또는 41의 올리고뉴클레오티드, 여기서 변형된 LNA 뉴클레오시드는 다음의 2'-4' 브리지 -O-CH(CH₃)-을 갖는 cET이다.

45. 구체예 44의 올리고뉴클레오티드, 여기서 cET는 (S)cET, 다시 말하면, 6'(S)메틸-베타-D-옥시-LNA이다.

46. 구체예 40 또는 41의 올리고뉴클레오티드, 여기서 LNA는 다음의 2' - 4' 브리지 -O-CH₂-CH₂-를 갖는 ENA이다.

47. 구체예 17 내지 46 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 적어도 하나의 변형된 뉴클레오시드간 연쇄를 포함한다.

48. 구체예 47의 올리고뉴클레오티드, 여기서 변형된 뉴클레오시드간 연쇄는 뉴클레아제 내성이다.

49. 구체예 47 또는 48의 올리고뉴클레오티드, 여기서 변형된 뉴클레오시드간 연쇄는 포스포로티오에이트 뉴클레오시드간 연쇄이다.

50. 구체예 17 내지 49 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 RNase H를 모집할 수 있는 안티센스 올리고뉴클레오티드이다.

51. 구체예 50의 안티센스 올리고뉴클레오티드, 여기서 상기 안티센스 올리고뉴클레오티드 또는 연속 뉴클레오티드 서열은 갭머이다.

52. 구체예 51의 안티센스 올리고뉴클레오티드, 여기서 상기 안티센스 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 화학식 5'-F-G-F'-3'의 갭머로 구성되거나 또는 이것을 포함하고, 여기서 영역 F 및 F'는 1-4개의 2' 당 변형된 뉴클레오시드를 독립적으로 포함하거나 또는 이들로 구성되고, 그리고 G는 RNaseH를 모집할 수 있는 6 내지 18개 뉴클레오시드의 영역이다.

53. 구체예 52의 안티센스 올리고뉴클레오티드, 여기서 2' 당 변형된 뉴클레오시드는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA, 2'-아미노-DNA, 2'-플루오로-DNA, 아라비노 핵산 (ANA), 2'-플루오로-ANA 및 LNA 뉴클레오시드로 구성된 군에서 독립적으로 선택된다.

54. 구체예 52 또는 53의 안티센스 올리고뉴클레오티드, 여기서 영역 F 및 F'에서 2' 당 변형된 뉴클레오시드 중에서 하나 또는 그 이상은 LNA 뉴클레오시드이다.

55. 구체예 54의 안티센스 올리고뉴클레오티드, 여기서 영역 F 및 F'에서 모든 2' 당 변형된 뉴클레오시드는 LNA 뉴클레오시드이다.

56. 구체예 53 내지 55의 올리고뉴클레오티드, 여기서 LNA 뉴클레오시드는 베타-D-옥시-LNA, 알파-L-옥시-LNA, 베타-D-아미노-LNA, 알파-L-아미노-LNA, 베타-D-티오-LNA, 알파-L-티오-LNA, (S)cET, (R)cET 베타-D-ENA 및 알파-L-ENA에서 선택된다.

57. 구체예 53 내지 56의 안티센스 올리고뉴클레오티드, 여기서 영역 F 및 F'는 동일한 LNA 뉴클레오시드로 구성된다.

58. 구체예 53 내지 57의 안티센스 올리고뉴클레오티드, 여기서 영역 F 및 F'에서 모든 2' 당 변형된 뉴클레오시드는 옥시-LNA 뉴클레오시드이다.

59. 구체예 52 내지 58 중에서 한 가지의 안티센스 올리고뉴클레오티드, 여기서 영역 G에서 뉴클레오시드는 DNA 및/또는 알파-L-LNA 뉴클레오시드이다.

60. 구체예 59의 안티센스 올리고뉴클레오티드, 여기서 영역 G는 적어도 75% DNA 뉴클레오시드로 구성된다.

61. 구체예 60의 안티센스 올리고뉴클레오티드, 여기서 영역 G에서 모든 뉴클레오시드는 DNA 뉴클레오시드이다.

62. 구체예 17 내지 62 중에서 한 가지의 올리고뉴클레오티드, 여기서 상기 올리고뉴클레오티드는 CMP 식별 번호: 22_1; 23_1; 24_1; 25_1; 26_1; 27_1; 28_1; 29_1; 30_1; 31_1; 32_1; 33_1; 34_1; 35_1; 36_1; 37_1; 38_1; 39_1; 40_1; 41_1; 42_1; 42_2; 42_3; 43_1; 43_2; 44_1; 45_1; 46_1; 49_1; 130_1; 109_1; 83_1; 203_1 및 232_1, 또는 이들의 제약학적으로 허용되는 염에서 선택된다.

63. 구체예 17 내지 50 중에서 한 가지에 따른 올리고뉴클레오티드 또는 구체예 51 내지 62 중에서 한 가지에 따른 안티센스 올리고뉴클레오티드, 그리고 상기 안티센스 올리고뉴클레오티드에 공유 부착된 적어도 하나의 접합 모이어티를 포함하는 접합 화합물.

64. 구체예 63의 접합 화합물, 여기서 올리고뉴클레오티드는 이중 가닥 siRNA이고, 그리고 접합 모이어티는 상기 siRNA의 센스 가닥에 공유 부착된다.

65. 구체예 63 또는 64의 접합 화합물, 여기서 접합 모이어티는 탄수화물, 세포 표면 수용체 리간드, 원료의약품, 호르몬, 친유성 물질, 중합체, 단백질, 펩티드, 독소, 비타민, 바이러스 단백질 또는 이들의 조합에서 선택된다.

66. 구체예 63 내지 65 중에서 한 가지의 접합 화합물, 여기서 접합 모이어티는 아시알로당단백질 수용체에 결합할 수 있다.

67. 구체예 66의 접합 화합물, 여기서 접합 모이어티는 갈락토오스, 갈락토사민, N-포르밀-갈락토사민, N-아세틸갈락토사민, N-프로피오닐-갈락토사민, N-n-부타노일-갈락토사민 및 N-이소부타노일갈락토사민으로 구성되는 군에서 선택되는 적어도 하나의 아시알로당단백질 수용체 표적화 모이어티를 포함한다.

68. 구체예 67의 접합 화합물, 여기서 아시알로당단백질 수용체 표적화 모이어티는 N-아세틸갈락토사민 (GalNAc)이다.

69. 구체예 67 또는 68의 접합 화합물, 여기서 접합 모이어티는 아시알로당단백질 수용체 표적화 모이어티에 대하여 일가, 이가, 삼가 또는 사가이다.

70. 구체예 69의 접합 화합물, 여기서 접합 모이어티는 2 내지 4개의 말단 GalNAc 모이어티, 그리고 각 GalNAc 모이어티를, 안티센스 화합물에 접합될 수 있는 가지치기 분자에 연결하는 스페이서로 구성된다.

71. 구체예 70의 접합 화합물, 여기서 스페이서는 PEG 스페이서이다.

72. 구체예 66 내지 71의 접합 화합물, 여기서 접합 모이어티는 삼가 N-아세틸갈락토사민 (GalNAc) 모이어티이다.

73. 구체예 66 내지 72의 접합 화합물, 여기서 접합 모이어티는 도 1에서 삼가 GalNAc 모이어티 중 한 가지에서 선택된다.

74. 구체예 73의 접합 화합물, 여기서 접합 모이어티는 도 1d에서 삼가 GalNAc 모이어티이다.

75. 올리고뉴클레오티드 또는 안티센스 올리고뉴클레오티드 및 접합 모이어티 사이에 위치하는 링커를 포함하는, 구체예 63-74의 접합 화합물.

76. 구체예 75의 접합 화합물, 여기서 링커는 생리학적으로 불안정 링커이다.

77. 구체예 76의 접합 화합물, 여기서 생리학적으로 불안정 링커는 뉴클레아제 민감성 링커이다.

78. 구체예 76 또는 77의 올리고뉴클레오티드 접합체, 여기서 생리학적으로 불안정 링커는 2 내지 5개의 연속 포스포디에스테르 연쇄로 구성된다.

79. 구체예 66-78의 접합 화합물, 이것은 접합되지 않은 올리고뉴클레오티드 또는 안티센스 올리고뉴클레오티드와 비교하여, 간 대 신장 사이에 향상된 세포 분포, 또는 접합 화합물의 간 내로 향상된 세포 흡수를 전시한다.

80. 구체예 17 내지 50 중에서 한 가지에 따른 올리고뉴클레오티드 또는 구체예 51 내지 61 중에서 한 가지에 따른 안티센스 올리고뉴클레오티드, 구체예 63 내지 79의 접합 화합물, 또는 이들의 허용가능 염, 그리고 제약학적으로 허용되는 희석제, 운반체, 염 및/또는 보조제를 포함하는 제약학적 조성물.

81. 하기 단계를 포함하는, B형 간염 바이러스 (HBV) 감염을 예방하고, 개선하고 및/또는 저해하는 화합물을 확인하기 위한 방법:

a. 검사 화합물을

i. RTEL1 폴리펩티드; 또는

ii. RTEL1을 발현하는 세포와 접촉시키는 단계;

b. 상기 검사 화합물의 존재와 부재에서 RTEL1의 발현 및/또는 활성을 계측하는 단계; 그리고

c. RTEL1의 발현 및/또는 활성을 감소시키고 cccDNA를 감소시키는 화합물을 확인하는 단계.

82. RTEL1을 발현하는 표적 세포에서 RTEL1 발현을 조절하기 위한 생체내 또는 시험관내 방법, 여기서 상기 방법은 구체예 17 내지 50 중에서 한 가지의 올리고뉴클레오티드 또는 구체예 51 내지 61 중에서 한 가지에 따른 안티센스 올리고뉴클레오티드, 구체예 63 내지 79의 접합 화합물 또는 구체예 80의 제약학적 조성물을 효과량으로 상기 세포에 투여하는 단계를 포함한다.

83. 구체예 82의 방법, 여기서 RTEL1 발현은 어떤 치료도 없거나 또는 대조로 치료될 때 수준과 비교하여, 표적 세포에서 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80%, 또는 적어도 90%, 또는 적어도 95% 감소된다.

84. 구체예 82의 방법, 여기서 표적 세포는 HBV로 감염되고, 그리고 HBV 감염된 세포에서 cccDNA는 어떤 치료도 없거나 또는 대조로 치료될 때 수준과 비교하여, HBV 감염된 표적 세포에서 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80%, 또는 적어도 90%, 또는 적어도 95% 감소된다.

85. 질환을 치료하거나 예방하기 위한 방법, 여기서 상기 방법은 구체예 17 내지 50 중에서 한 가지의 올리고뉴클레오티드 또는 구체예 51 내지 61 중에서 한 가지에 따른 안티센스 올리고뉴클레오티드, 구체예 63 내지 79의 접합 화합물 또는 구체예 80의 제약학적 조성물의 치료 또는 예방 효과량을 상기 질환을 앓거나 또는 이것에 취약한 개체에게 투여하는 단계를 포함한다.

86. 개체에서 질환의 치료 또는 예방을 위한 약제로서 이용을 위한, 구체예 17 내지 50 중에서 한 가지의 올리고뉴클레오티드 또는 구체예 51 내지 61 중에서 한 가지에 따른 안티센스 올리고뉴클레오티드, 또는 구체예 63 내지 79 중에서 한 가지의 접합 화합물 또는 구체예 80의 제약학적 조성물.

87. 개체에서 질환의 치료 또는 예방을 위한 약제의 제조를 위한, 구체예 17 내지 50 중에서 한 가지의 올리고뉴클레오티드 또는 구체예 51 내지 61 중에서 한 가지에 따른 안티센스 올리고뉴클레오티드, 또는 구체예 63 내지 79 중에서 한 가지의 접합 화합물의 용도.

88. 구체예 85 - 87의 방법, 올리고뉴클레오티드, 안티센스 올리고뉴클레오티드, 접합체 또는 용도, 여기서 개체는 포유동물이다.

89. 구체예 88의 방법, 올리고뉴클레오티드, 안티센스 올리고뉴클레오티드, 접합체, 또는 용도, 여기서 포유동물은 인간이다.

본원 발명은 이제, 하기 실시예에 의해 예증될 것인데, 이들은 제한의 성격을 갖지 않는다.

실시예

재료와 방법

올리고뉴클레오티드 모티프 서열 및 올리고뉴클레오티드 화합물

표 6: 올리고뉴클레오티드 모티프 서열 (서열 번호로 표시됨), 이들의 설계, 그리고 모티프 서열에 기초하여 설계된 특정 올리고뉴클레오티드 화합물 (CMP 식별 번호로 표시됨)의 목록.

모티프 서열은 올리고뉴클레오티드 내에 존재하는 핵염기의 연속 서열을 나타낸다.

설계는 갭머 설계, F-G-F'를 지칭하는데, 여기서 각 숫자는 연속 변형된 뉴클레오시드, 예를 들면 2' 변형된 뉴클레오시드의 숫자 (첫 번째 숫자=5' 측부), 그 이후에 DNA 뉴클레오시드의 숫자 (두 번째 숫자= 갭 영역), 그 이후에 변형된 뉴클레오시드, 예를 들면 2' 변형된 뉴클레오시드의 숫자 (세 번째 숫자=3' 측부)을 나타내고, 임의적으로 표적 핵산에 상보적인 연속 서열의 반드시 일부인 것은 아닌 DNA와 LNA의 추가 반복된 영역이 선행하거나 또는 후행한다.

올리고뉴클레오티드 화합물은 모티프 서열의 특정 설계를 나타낸다. 대문자는 베타-D-옥시 LNA 뉴클레오시드를 나타내고, 소문자는 DNA 뉴클레오시드를 나타내고, 모든 LNA C는 5-메틸 시토신이고, 5-메틸 DNA 시토신은 "e"에 의해 표시되고, 그리고 모든 뉴클레오시드간 연쇄는 포스포로티오에이트 뉴클레오시드간 연쇄이다.

올리고뉴클레오티드 합성

올리고뉴클레오티드 합성은 일반적으로 당해 분야에 공지되어 있다. 다음은 적용될 수 있는 프로토콜이다. 본원 발명의 올리고뉴클레오티드는 이용된 장치, 지지체 및 농도의 면에서 약간씩 변화를 주는 방식으로 생산될 수 있다.

올리고뉴클레오티드는 1 μmol 규모로 Oligomaker 48 상에서 포스포라미디트 접근법을 이용하여 우리딘 범용 지지체 상에서 합성된다. 합성의 종결 시점에, 올리고뉴클레오티드는 60℃에서 5-16 시간 동안 액상 암모니아를 이용하여 고체 지지체로부터 개열된다. 올리고뉴클레오티드는 역상 HPLC (RP-HPLC)에 의해 또는 고체상 추출에 의해 정제되고 UPLC에 의해 특징화되며, 분자 질량은 ESI-MS에 의해 추가로 확증된다.

올리고뉴클레오티드의 신장:

β-시아노에틸-포스포라미디트 (DNA-A(Bz), DNA-G(ibu), DNA-C(Bz), DNA-T, LNA-5-메틸-C(Bz), LNA-A(Bz), LNA-G(dmf) 또는 LNA-T)의 연계는 아세토니트릴에서 0.1 M의 5'-O-DMT-보호된 아미디트 및 아세토니트릴에서 DCI (4,5-디시아노이미다졸) (0.25 M)의 용액을 활성화제로 이용하여 실시된다. 최종 주기 동안, 원하는 변형을 갖는 포스포라미디트, 예를 들면, 접합체 기를 부착하기 위한 C6 링커 또는 접합체 기 자체가 이용될 수 있다. 포스포티오에이트 연쇄의 도입을 위한 티올화는 크산탄 하이드라이드 (아세토니트릴/피리딘 9:1에서 0.01 M)를 이용하여 수행된다. 포스포디에스테르 연쇄는 THF/피리딘/물 7:2:1에서 0.02 M의 요오드를 이용하여 도입될 수 있다. 나머지 시약은 올리고뉴클레오티드 합성에 전형적으로 이용되는 것들이다.

고체상 합성 후 접합을 위해, 상업적으로 이용가능한 C6 아미노링커 포스포라미디트가 고체상 합성의 마지막 주기에서 이용될 수 있고, 그리고 고체 지지체로부터 탈보호 및 개열 후, 아미노연결되고 탈보호된 올리고뉴클레오티드가 단리된다. 접합체는 표준 합성 방법을 이용한 기능기의 활성화를 통해 도입된다.

RP-HPLC에 의한 정제:

미가공 화합물은 Phenomenex Jupiter C18 10μ 150x10 mm 칼럼 상에서 예비 RP-HPLC에 의해 정제된다. 0.1 M의 아세트산암모늄 pH 8 및 아세토니트릴이 5 mL/분의 유속에서 완충제로서 이용된다. 수집된 분획물은 동결 건조되어 정제된 화합물이 전형적으로 백색 고체로서 제공된다.

약어:

DCI: 4,5-디시아노이미다졸

DCM: 디클로로메탄

DMF: 디메틸포름아미드

DMT: 4,4'-디메톡시트리틸

THF: 테트라히드로푸란

Bz: 벤조일

Ibu: 이소부티릴

RP-HPLC: 역상 고성능 액체 크로마토그래피

T _m 검정:

올리고뉴클레오티드 및 RNA 표적 (인산염 결합됨, PO) 이중나선은 500 ml의 RNase-없는 물에서 3 mM로 희석되고 500 ml 2x T_m-완충액 (200 mM NaCl, 0.2 mM EDTA, 20 mM 나트륨 포스페이트, pH 7.0)과 혼합된다. 상기 용액을 3분 동안 95℃로 가열한 다음, 실온에서 30분 동안 어닐링 (annealing)한다. 이중나선 용융 온도 (T_m)는 PE Templab 소프트웨어 (Perkin Elmer)를 이용하여 Peltier 온도 프로그래머 PTP6이 장착된 Lambda 40 UV/VIS 분광광도계 상에서 계측된다. 온도를 20℃에서 95℃로 상승시킨 다음, 25℃로 낮춘 후 260 nm에서 흡광도를 기록한다. 용융 및 어닐링 둘 모두의 1차 도함수 및 국소 최대값을 이용하여 이중나선 T_m을 평가한다.

클론 성장 배지 (dHCGM). dHCGM은 100 U/ml 페니실린, 100 μg/ml 스트렙토마이신, 20 mM Hepes, 44 mM NaCO3, 15 μg/ml L-프롤린, 0.25 μg/ml 인슐린, 50 nM 덱사메타존, 5 ng/ml EGF, 0.1 mM Asc-2P, 2% DMSO 및 10% FBS를 내포하는 DMEM 배지이다 (Ishida et al., 2015). 세포는 5% CO2를 포함하는 가습된 대기에서 37℃ 인큐베이터에서 배양되었다. 배양 배지는 도말후 24 시에, 그리고 수확 때까지 2 일마다 교체되었다.

일차 인간 간세포 (PXB-PHH)

인간화 생쥐 (uPA/SCID 생쥐) - 본원에서 PHH로 불림 -로부터 수확된 신선한 일차 인간 간세포 (PXB-PHH)가 PhoenixBio Co., Ltd (Japan)로부터 획득되었다. 세포는 변형된 간세포 클론 성장 배지 (dHCGM)에서 하기의 세포 밀도: 35,000개 세포/웰 (384-웰), 70,000개 세포/웰 (96 웰), 또는 400,000개 세포/웰 (24-웰)로 콜라겐 I-코팅된 평판에 파종되었다. dHCGM은 100 U/ml 페니실린, 100 μg/ml 스트렙토마이신, 20 mM Hepes, 44 mM NaCO3, 15 μg/ml L-프롤린, 0.25 μg/ml 인슐린, 50 nM 덱사메타존, 5 ng/ml EGF, 0.1 mM Asc-2P, 2% DMSO 및 10% FBS를 내포하는 DMEM 배지이다 (Ishida et al., 2015). 세포는 5% CO2를 포함하는 가습된 대기에서 37℃ 인큐베이터에서 배양되었다. 배양 배지는 도말후 24 시에, 그리고 수확 때까지 2 일마다 교체되었다.

HBV 감염 및 올리고뉴클레오티드 처리

PHH는 24 시간 동안 4% PEG와 함께 40의 감염 다중도 (MOI)에서 HBV (CHB 개체로부터 정제됨)와 함께 배양되었다; 바이러스 접종물은 다음 날 제거되었다. cccDNA 확립을 허용하기 위해, PHH에서 화합물 처리가 HBV 감염후 3 일자에 시작되었다. 배지에 용해된 신선한 올리고뉴클레오티드가 2 일마다 보충되거나 (실시예 1), 또는 신선한 올리고뉴클레오티드가 3, 5, 7 및 9 일자에 보충되고, 그 후 세포가 19 일자에서 수확될 때까지 배지가 2 일마다 보충되었다 (실시예 2).

HBV 항원 계측

HBV 항원 발현과 분비에 대한 영향을 평가하기 위해, 상층액이 19 일자에 수집되었다. HBV 증식 파라미터, HBsAg 및 HBeAg 수준이 제조업체의 프로토콜에 따라서, CLIA ELISA 키트 (Autobio Diagnostic #CL0310-2, #CL0312-2)를 이용하여 계측되었다. 간단히 말하면, 웰마다 25μL의 상층액이 개별 항체 코팅된 마이크로역가 평판으로 이전되었고, 그리고 25 μL의 효소 접합체 시약이 첨가되었다. 웰이 자동 세정기를 이용하여 세척 완충액으로 5회 세척되기 전, 평판이 실온에서 셰이커에서 60 분 동안 배양되었다. 25 μL의 기질 A 및 B가 각 웰에 첨가되었다. Envision 발광 판독기 (Perkin Elmer)를 이용하여 발광이 계측되기 전, 평판이 실온에서 10 분 동안 셰이커에서 배양되었다.

CCK8 세포 독성 계측

올리고뉴클레오티드의 처리 시에 세포 독성의 영향을 평가하기 위해, 세포는 HBV 감염 및 올리고뉴클레오티드 처리에서 기술된 바와 같이 처리되었고, 그리고 18 일자에, PHH는 5% CO₂를 포함하는 가습된 대기에서 37 ℃ 인큐베이터에서 24 시간 동안 전배양되었다. 10ul의 CCK-8 용액이 96 웰 평판의 각 웰에서 100ul까지 첨가되고 1-4 시간 동안 배양되었다. 마이크로평판 판독기 (Tecan)를 이용한 450nM에서 흡광도가 각 평판에 대해 계측되었고, 그리고 값이 대조 (처리되지 않은 세포)의 %로서 계산된다.

세포내 HBV pgRNA 및 RTEL1 RNA에 대한 실시간 PCR

제조업체의 프로토콜에 따라서, Qiagen BioRobot Universal System 및 RNeasy 96 웰 추출 평판 (RNeasy 96 BioRobot 8000 키트 (12)/ 카탈로그 번호/ID: 967152)을 이용하여, mRNA가 세포로부터 추출되었다. 상대적인 HBV 및 세포 mRNA 발현 수준이 ABI QuantStudio 12k Flex 상에서 실시간 PCR을 이용하여 분석되었다.

기술적으로 삼중으로 수행된 TaqMan Fast Advanced 마스터 믹스 (Life Technologies, 카탈로그 번호 4444558)를 이용한 qPCR에 의해, 베타-액틴 (ACT B) 및 HBV pgRNA가 정량되었다. 결과는 인간 ACT B 내인성 대조에 비하여 정규화되었다. 참조 유전자 ACT B 및 비-형질감염된 세포에 대해 정규화된 비교 주기 역치 2-△△Ct 방법을 이용하여 mRNA 발현이 분석되었다. ACTB RNA 및 HBV pgRNA 정량에 이용된 프라이머는 표 7에서 열거된다.

표 7: ACT B 및 HBV pgRNA qPCR 프라이머

HBV cccDNA 정량

DNA가 SDS 용해 완충액을 이용하여 HBV 감염된 일차 인간 간세포로부터 추출되고, 그리고 ZymoResearch 유전체 DNA 클린 & 농축기 키트 (ZymoResearch, 카탈로그 번호 D4067) 프로토콜을 이용하여 정제되었다. 20ul 총 용적에서 37 ℃에서 1 시간 동안, 500ng의 DNA에 대해 10U의 T5를 이용한 T5 엑소뉴클레아제 (New England Biolabs, MA, USA)로 절단 후, cccDNA 수준이 결정되었다. 절단 후, 표본이 50ul로 희석되었고, 이 중에서 4ul가 qPCR 반응에 이용되었다. 참조 유전자 미토콘드리아 DNA 및 비-형질감염된 세포에 대해 정규화된 비교 주기 역치 2-△△Ct 방법을 이용하여 mRNA 발현이 분석되었다. 정량적 실시간 중합효소 연쇄 반응 계측이 QuantStudio 12K Flex PCR 시스템 (Applied Biosystems)에서 수행되었다. qPCR이 Fast SYBR™ Green 마스터 믹스 (Life Technologies, 카탈로그 번호 4385612)로 수행되었다. 프라이머는 표 8에서 도시된다.

표 8: cccDNA qPCR 프라이머.

실시예 1: HBV 감염된 PHH에서 HBV 파라미터에 대한 RTEL1을 표적으로 하는 안티센스 올리고뉴클레오티드의 효과

하기 실험에서, HBV 파라미터, HBsAg, HBeAg, HBV pgRNA 및 cccDNA에 대한 RTEL1 녹다운의 효과가 표 6에서 올리고뉴클레오티드 화합물을 이용하여 검사되었다.

PHH가 재료와 방법 섹션에서 기술된 바와 같이 배양되었다. 이들 세포는 100 μl/웰의 최종 배양 용적으로 HBV 감염후 3 일자에 dHCGM 배지에서 용해된 10μM의 최종 올리고뉴클레오티드 농도로 투약되었다. 실험은 생물학적으로 삼중으로 수행되었고, 그리고 올리고뉴클레오티드를 2 일마다 보충하면서, 세포가 HBV 감염후 19 일자에 수확되었다. 재료와 방법에 따라서, 세포 독성이 CCK8을 이용하여 결정되었고, 상층액이 HBsAg 및 HBeAg를 계측하기 위해 수집되었고, 그리고 세포가 2가지 분획물; 한 가지 용해 완충액을 이용한 RTEL1 mRNA 및 pgRNA 계측을 위한 분획물 및 재료와 방법에서 기술된 바와 같은 다른 용해 완충액을 이용한 cccDNA 계측을 위한 분획물에서 수확되었다. 모든 값은 표 9에서 대조 (처리되지 않은 세포)의 %로서 도시된다, 다시 말하면, RTEL1 mRNA, cccDNA 및 pgRNA의 경우에 값이 더욱 작을수록 저해가 더욱 크다.

바이러스 파라미터에서 임의의 감소가 세포 사멸의 원인이 아니고, 값이 100%에 더욱 가까울수록 독성이 더욱 낮다는 것을 확증하기 위해, CCK8 세포 독성이 재료와 방법 섹션에서 기술된 바와 같이 계측되었다. 결과는 표 9에 도시된다.

표 9: 하류 산물의 RTEL1 매개된 cccDNA 분해와 저해

^*RTEL1 및 HBV pgRNA는 하우스키핑 유전자에 대해 정규화된다.

RTEL1을 표적으로 하는 모든 검사된 안티센스 올리고뉴클레오티드는 파라미터 cccDNA, pgRNA, HBsAg 및 HBeAg 중에서 적어도 한 가지에 대항하여 계측의 단일 시점에서 표적 녹다운 및 HBV 항바이러스 효능을 전시하며, CCK8에 의해 어떤 관찰된 세포 독성도 계측되지 않는다.

실시예 2: 감염된 PHH에서 cccDNA에 대한 효과에 대해 검사된, RTEL1을 표적으로 하는 추가 올리고뉴클레오티드 라이브러리

하기 실험에서 표 6에서 CMP 식별 번호: 50_1 내지 237_1로서 도시된, RTEL1 전사체의 전역을 표적으로 하는 236개 올리고뉴클레오티드의 추가 라이브러리가 산출되었다. RTEL1뿐만 아니라 cccDNA를 감소시키는 능력이 검사되었다.

PHH가 재료와 방법 섹션에서 기술된 바와 같이 배양되었다. 이들 세포는 100 μl/웰의 최종 배양 용적으로 HBV 감염후 3. 5. 7 및 9 일자에 dHCGM 배지에서 용해된 10μM의 최종 올리고뉴클레오티드 농도로 투약되었다. 실험은 생물학적으로 삼중으로 수행되었고, 그리고 배지를 19 일자 때까지 2 일마다 보충하면서, 세포가 HBV 감염후 19 일자에 수확되었다.

재료와 방법에 따라서, 세포가 2가지 분획물; 한 가지 용해 완충액을 이용한 RTEL1 mRNA 계측을 위한 분획물 및 재료와 방법에서 기술된 바와 같은 다른 용해 완충액을 이용한 cccDNA 계측을 위한 분획물에서 수확되었다. 모든 값은 표 10에서 대조 (처리되지 않은 세포)의 %로서 도시된다, 다시 말하면, RTEL1 mRNA 및 cccDNA의 경우에 값이 더욱 작을수록 저해/감소가 더욱 크다.

표 10: 올리고뉴클레오티드 처리 이후에 RTEL1 감소 및 cccDNA 분해

바이러스 파라미터에서 감소가 세포 사멸에 의해 유발될 수 있고, 값이 100%에 더욱 가까울수록 독성이 더욱 낮은 지를 사정하기 위해, CCK8 세포 독성이 재료와 방법 섹션에서 기술된 바와 같이 계측되었다. 결과는 표 11에서 도시된다. 대조의 80 %를 초과하는 CCK8 값의 경우에는 세포 사멸이 표 10에서 도시된 RTEL1과 cccDNA 감소에 영향을 줄 공산이 있는 것으로 고려되지 않는다.

표 11: CCK8 세포 독성

#NA (해당값 없음)는 CCK8가 지시된 화합물에 대해 계측되지 않았다는 것을 의미한다.

이들 결과는 라이브러리 내에 236개의 올리고뉴클레오티드 중 단지 5 %만 RTEL1 또는 cccDNA 중에서 적어도 어느 한 가지를 대조의 적어도 80%까지 감소시킬 수 없었다는 것을 증명한다. 이것으로부터, RTEL1 및/또는 cccDNA를 감소시킬 수 있는, 전체 RTEL1 전사체의 전역을 표적으로 하는 올리고뉴클레오티드를 생산하는 것이 가능하며, 비록 소수의 화합물의 경우에는 RTEL1 및 cccDNA에서 감소가 세포 사멸에 기인할 수 있지만, 일반적으로는 세포 사멸에 기인하지 않는 것으로 보여질 수 있다.

SEQUENCE LISTING <110> F. Hoffmann-La Roche AG <120> OLIGONUCLEOTIDES FOR MODULATING RTEL1 EXPRESSION <130> P34869-WO <160> 246 <170> PatentIn version 3.5 <210> 1 <211> 38444 <212> DNA <213> hsapiens <400> 1 agtcagccct gctgccagcc agtgccgggt gctggggact cagggaggcc cgccgggacc 60 actgcgggac agtgagccga gcagaagctg gaacgcagga gaggaaggag agggggcggt 120 cagggctctc aggagccggg tcctgggcaa ggcgcagccg ttttcaaatt ttcaggaaag 180 cggtcggctc acactcgagc agtaaaaaga tgcctctggg gaggaggccc gtgcagctct 240 ccgggcaatg gtggtggctc ggcctagaga ggcggtagtg gaacgcagac cctggtgggg 300 gaatgacatc aagggaggag acgggcggga ccccagattt ctgcctgtgg gcgatggaag 360 tgaggttcac tggccagcgg agccggacac agaacgcgca aaacgccgtg taggcctgga 420 ggagccgaag agcaggcgga ccccctccgc gggggaacag tttccgccgg gagcacaaag 480 caacggaccg gaagtggggg gcggaagtgc agtgggctca gcgccgactg cgcgcctctg 540 cccgcgaaaa ctctgagctg gctgacagct ggggacgggt ggcggccctc gactggagtc 600 ggttgagttc ctgagggacc ccggttctgg aaggttcgcc gcggagacaa gtgagcagtg 660 agtcgcagtg accctacaag tggttctttt acccgagcgg ctcgtaggcg cgttgcggtt 720 tttcgaaact acagctcccg gcaggcccca agccgccctc ggggccgcgg gtcggcggat 780 tggccgcgct gcattttggg acctgtagtt tcctgcgctc gtggcgctgg cgccgcggcg 840 ttggctgagc ccttgaccgg ggctggaggg aagggccgac attcagtgtg tccgcgtctg 900 ttctgttagt cccagttccc gggcgggatt gaggcttaga gaagttgagt gatttgctga 960 gggctgcacg ggttggcatc ccggcatgct ctttcgctac tttggctgca tctggttgcc 1020 cacccgggcg gatggggaat ggactccagc cagccaggag ggcagagggc tggagaggca 1080 gggccggagg ttcagaccct ccgctctgac gttgcgcctg gtgaggccgg gaggggtgcc 1140 gcttgcctct tcagccctca cgctcttgtg gaagtcgcgg aattactgca ggcggaactt 1200 gcagcactgt gggcgtcttt tccagagaag gacggagttg tggggcggga ggataaggca 1260 aggcccagcc acttcgcatc ttcgccccgc cagctcctcg agatgggata taccagggtt 1320 gctctccaac cctctccgca ggagggactg atggaaacgc ctgggaaagt agcccggtac 1380 ccacaaaggc tgtctacaaa cagagtctta ctgtctttcc caggtctgtg ccatagggat 1440 tctcgaagag aacagcgttg tgtcccagtg cacatgctcg catcgcttac caggagtgcc 1500 cgagacccta agatgttcgg agtggttttt tcgcacagac ccgaatagcc tgcccctcag 1560 ccacgctctg tgcccttctg agaacaggct gatatgccca agatagtcct gaatggtgtg 1620 accgtagact tccctttcca gccctacaaa tgccaacagg agtacatgac caaggtcctg 1680 gaatgtctgc agcaggtaga gcacaggccc cgaggaaagg actgcgggtg ggtggagctt 1740 cagccaggac ggggtgtgct tccctctccc ggcccattcc agccaggccc ctccgggcca 1800 gaggcagcgt ctgtcataaa aagggctggt gttccaggtg gggtcagaga gaggattgac 1860 aagtaaaaac gatcgtcctt tgaagggggc cggcccctcc acacctgtgg gtatttctca 1920 tcaggcggga cgagagactg agaaaatgaa taagacacag agacaaagta tagagagaaa 1980 agtgggccca ggggaccggc gctcagcata cagaggacct gcaccggcac cagtctctga 2040 gtttcctcag tattcattaa ttactatttt cactatctca gcaagaggaa tgcggcagga 2100 cagcaaggtg atagtgggga gaaggtcagc aagaaaacgt gagcaaagga atctgggtca 2160 caaataagtt caagggaagg tactatgcct ggatgtgcac gtaggctagt tttatgcttt 2220 tctccaccca aacatctcgg tggagtaaag agtaacagag cagcattgct gccaatatgt 2280 ctcgcctcct gccacagggc ggcttttctc ctatctcaga attgaacaaa tgtacaatcg 2340 ggttttatac cgaaacattc agttcccagg ggcaggcagg agacagtggc cttcctctat 2400 ctcgactgca agaggctttc ctcttttact aatcctcagc acagaccctt cacgggtgtt 2460 gggctggggg actgtcaggt ctttcccatc ccacgaggcc atatttcaga ctatcacatg 2520 gagagaaacc ttgggcaata cccggctttc cagggcagag gtccctgcgg ctttccgcag 2580 tgcatcgtgc ccctggttta tcgagactgg agaatggcga tgacttttac caagcatact 2640 gcctgtaaac atattgttaa caaggcacgt tctgcacagc tctagatccc ttaaaccttg 2700 attccataca acacatgttt ctgtgagctc aaggctgggg caaagttaca gattaacagc 2760 atcttagggc aaagcaattg ttcagggtac aggtcaaaat ggagtgtgtt atgtcttccc 2820 tttctacata gacacagtaa cagtctgatc tctcttttcc ctacagtcct tgagggtgac 2880 agacttagga gtgccttggg ggcctctctg aggagcagct gatattcacg ggtcaggagg 2940 aagcatttcc attagagggg cagccggtgg ccagcctcac ttggaaggtc tttgaacctc 3000 gggggtgcag ggaggtggca gtggtgcagg ttgccttctc ctgggttcct tgaggtgccc 3060 tcttgtaccc ggctcacacc cttcccctcc ccgagtttcc tgctcaggtt cccgtctgag 3120 agcttgtatg taggacgtca gataggacag cataaatgtt tggatccaga aacgcagaac 3180 agtttcctat tttgagactt gacacctaat tagtcatctt actatttaag ctgaaaaata 3240 gtgtcgtgtt ttgggtaacg ttctgcaaat cgtttgctaa tggcggctga gttgcttcac 3300 gccctttagg gcaagagtgg gacttgcctg tggacttctc cgcggtccca cagggctctc 3360 gccacctggc agtggcctct gcatctgcaa agagctgccc gctggctgcc gaagcttgtc 3420 tcagggcagc ttgtgtggcc tcgcctcttc ctggcttccc cgtaaccctt gctccgaact 3480 ccgttcagaa ggtgaatggc atcctggaga gccctacggg tacagggaag acgctgtgcc 3540 tgctgtgcac cacgctggcc tggcgagaac acctccgaga cggcatctct gcccgcaaga 3600 ttgccgagag ggcgcaagga gagcttttcc cggatcgggc cttgtcatcc tggggcaacg 3660 ctgctgctgc tgctggagac cccataggtg accctagttc ccaggcctct cctggcctcc 3720 tgtggggatg gttggcaagg gatggcgctg agggtggggt gggcccatgg ggactcctgc 3780 cgtctctcaa gcagaactca aggagaattt tttagctgct gtataatttc tcgccatcgt 3840 gggtgtaaac ctagggttgg gcttttttgc tgaattaggg cacggcagat gcccacttca 3900 cccatttttg ataaaccagt atctggggtg tcagattctt ggctgtctgc agggccgagt 3960 tagccgaatg ccacctgcct ttgatacgtg agaacgttgt ctgagaaccg tgacttctgt 4020 gcttgcttgt gtctggtcag cttgctacac ggacatccca aagattattt acgcctccag 4080 gacccactcg caactcacac aggtcatcaa cgagcttcgg aacacctcct accggtgggt 4140 cagacgagtt tacacctgtc tcggggtcct caagagaacc agcttggcat ggtgctgagt 4200 ccacagcccc atgctgtgct gtggtggagg gtggtggtct ttctagacgc tcccccgaag 4260 tgtgcagagc gctggtgccc aggggtgggg tgcggcctgg gctgcctcca atgcccatta 4320 cttgtgagga agcagctttg catctgtgtg ctgaccttgg gcgggcgtcc tgagctcctc 4380 gcaggtgctg ttgtagcagc tgtgcagtag gtcagggctg gcccccagtg cagctttgca 4440 catgaagtag gaggaggccc tgctgcttgt cagagcccag cagagtcttg gtgttctgtc 4500 gggttcctgt ggccggacca gtggcagggt gctgtggaag ctgtcgaatc tcctccctct 4560 gtccagtacc cccgctcgtc ttctagctcc ctcctacgcc cgggccacgt ttcagttatg 4620 ctcacttcct ctgaccgccg aggctcctgc gtgtctccat acagctcacg ctgcagggcc 4680 acgctgtggg tgttggagac agctcctcct cgacccacgg tgctctctcc caccaggcct 4740 aaggtgtgtg tgctgggctc ccgggagcag ctgtgcatcc atcctgaggt gaagaaacaa 4800 gagagtaacc atctacaggt aggctcctgg gctcccgctc cggctcagtg tccgacaggc 4860 gagtgctgct gggtgtccag agccccaggc tgcgctcccg ctgggctagg gtttgaagtt 4920 cactggggga ctgcagggga ggacctggtg ggggtgggga ctggcttcgg tcctttcttg 4980 gccgtgcttc agctgcgcac tctgcccttc ctcccacaga tccacttgtg ccgtaagaag 5040 gtggcaagtc gctcctgtca tttctacaac aacgtagaag gtacaagcag ctgggtggga 5100 ccagggtcgg gttggagtgt gtgcagcctc tcagggtgga gctcagtggt gtcacagcct 5160 ggttgtgctt gcccggtggg gcggccagtg cggccatgta cctgggccct gtcttctgac 5220 tcggggccac ccatgttaga cttctgtgtg gaagagctca cacagtggtc tgagacagcc 5280 agccggcaag actgcctctg gctggtgcct ggggccttgg attttgggaa ggctccctcc 5340 atttcctgat gagagggtct ccctgcacct aacctgctgg tgcaaacagt aggggttttg 5400 ctgaacaccg gctttctctt cggggacttt gttgcttgcc cagcagcagg tgctccagtg 5460 accggccctc ataccatctt gggagggtgt cctggaagcc gtgtctggcc tcccgcgacc 5520 ctgccccgtg tgtctttttc ctgtgctgac cttgctgcgg aaaattatgg ccctgagtgt 5580 gactccaggc tgagtcctgt gggtccaaca cgggatgcct tggggcctct tctggagacg 5640 ggatgtgagt gacaggagcc ggccggggca gcttgccctg tgactgcacg tggccacagc 5700 ctgtgagggc cgggggtgct tctccaccca cgtggctgcc cctcgggtat gtcaagggct 5760 tctggggctc atcacggggt cctagagaca gtggcagggt gcacccccgt tggctgccct 5820 tacagtttct gtgacctgag ggtggcatct gtgcagtcgg cgcggtctgt gcttctgtgg 5880 gatcagggtt ccctctgttt cctgcctcag ttggggctca agcctcaggt gaggtggccc 5940 cggagcactc agaaggcatc ggcggtcctg tgggctgctt tctgcactca cgtttgctga 6000 gtgctcagtg tgccaggact gaggaccctg aagctgctct tgtatttagg gcggcgctcc 6060 cctggcagag actgagccag gtggtcccgc atgacccact accaggcgtt tctgggccct 6120 ggcccttgga gggacagggt gggcggaaca tgggcctgca gggaggctcc cgcttactgg 6180 aggcatgtgc tgtgttgctg gagacatcct ctgtgttgct tcttgttcgc tgtggttttt 6240 ggtctggtgg caccaaggac cctcagtcat cttgatgtgt ggttgtccag gcctttttgt 6300 tggtcctaag aaggggctct gcctttgtgc ccccaggttc cctgacagga gctgccggct 6360 cgtcccggtg atgcctgcag gacgtgactc tgggacgggg ggttgggcag atgtgctgat 6420 ggaaattctc aagcaggcgt catttccgag gtcctcacct ggatttccag gacaggagtg 6480 cctgctgggt gtccccagtc ccatgcagcg ggggtccttg ggatagcatg gaacgctgag 6540 catgggcctg gccggccgtg gtcctggaca agggcagtgc cccggtggct gctgggcctg 6600 ggacctggtg gggacgctgg gcctggtacc tggtggggat gctgggcctg ggacctggtg 6660 gggaggcctc tgactgcctc ctggtgctgc ttccgtctgt gttaggcctc tgggtattgg 6720 ggcccccatc tgtctcctcc tccaggcctg tggactcaga ccaggaagac acaggccagc 6780 ccctgcctgt cccccttggc ttgggctctc actgcccgac ctggcgggag gttgcctagc 6840 cgtgaacctt cgcaccctgt ctgccaccgg acaggctgtg agggggtgtc tgcagcacct 6900 gcaccggcct gagcatcttc agagtgggct gcagctcctg gaggggtctg agaggaaggg 6960 aggcaggtat tttgggcgaa tgaggagaca gctggagagc tggcaccctt cctggcctgc 7020 gtcctgtgag gactctggtt ggggacagca agcttggggt cagcctgggg cagagcctct 7080 gggacggccc cgcccctcgt gccccttccc ctcgcagctc ctgtcctcgc cccgccctca 7140 gctctccgcc aggcaaggtt tggcaagtgc cgctgtgcgg cagtgcctgc tgattggctg 7200 gtctgttgct atggtgctgc ccaggggtgt gcttttcctc ccctgccttc cctgctatcc 7260 ctgggagtat ctggggttgg gtcatcgctg gtgtgtgtga gtgtgtgtgt gtgtgtatgt 7320 gcacgtgtgc atatgtgtgc gcttctggcc tctgcagctg agtcctggcc ctcggggggc 7380 ctggcacctc ctggggacag gcacaaagca gccatgatgg agtcgggagc tgggggaggc 7440 cccattgccc cacgtggctg ccctgtgact ctggggtgct tgttagaaga ggtatctggt 7500 tctgtctgtg tttaagcaac tccctaagga attcttgtgg ttccagtttg gggggcctgt 7560 actgtagagg caagggaggg gcaggacatc ccccagactc tgacttctga agccttttct 7620 gcccggggcc tctccgccag tacaggcagt gtcctttgcc agggctgcca tgctgcagag 7680 gggagtgggc cactgtttag cccaggaaaa cctggctctc ccttagctgg aagttctggg 7740 cctgttgtgg ttggcaggga agctgagtga cggtgctaat cacaggggca cctgcagggg 7800 tttgtgggag atgcctctgt gggttggggc gataggctga ggggctgttc ttccctgccc 7860 tgaggagggc tgagtgtagc cgccactcct gtcctgtctt gggctgtctc ggagaggatg 7920 cgtagaaccc tcgggatcct gctggcctcc gtctggtcca ccctgaacct caggccttct 7980 gggggcagag gaggattccc tcaggatcac tcgggtgggg gcctctcttg ggcacctgag 8040 accctcagtg ggtgctttgt ggcgcgttca cggttggtgg gggacgccca gccctgcccg 8100 ccgtgtagga gccgttctgt cctgggcatc cccctgtggt ctgggactta gtggaccctg 8160 agggtgtgtg tttacccctg cctcacacct gcagaaaaaa gcctggagca ggagctggcc 8220 agccccatcc tggacattga ggacttggtc aagagcggaa gcaagcacag gtgagacccc 8280 tcagtgaggc cacgaccact gtccttccat ggcccagctc tcctgtgacc tgtggaggcc 8340 cggatatatt tcttcacttt tctttgttcc tttttaaatt atgaaactaa ccaccattca 8400 gtacgaaaaa gtttaagcag ctctgaggaa gatagagtaa aaaattgtct ccctcttccc 8460 tggccctcag ccatccccgg tggccaccgt ggagtgtgga cggagccctg caggcctgtg 8520 tctgtgcgga agcacgcgca gttttgtctg cacagactgt cctgcagttg gctgttttca 8580 ctcagcgttg tgggtatagc ttcccatgct ggtgctggca gctcggcctt gttcttttga 8640 ggacagcaga tgtctcctat gtctacctct tacagcttca gagattcaag ttataataaa 8700 gctcttctta tattgagggg gaaacctccc tccccctttt ttttgaaaca gggtctcgct 8760 ctgctaccca ggctgcagtg cagtgtcaca gtcttggctc actgcagcct cagcctccca 8820 ggctcaagcg attttcccac ctcagcctcc caagtagccg ggactgcagg cacacaccac 8880 catgcctggt taatttttgt attttttgta cagacagggt ctcactctgt tgctcaggcc 8940 agtctcctga gctcgagagt tccacctgcc ttggcctccc aaagtgctgg gattacaggc 9000 gtgagacccc atgcctggcc agctcttttt tttttttttt ttttttttga gacggagtct 9060 cgctctgtcg cccaggctgg agtgcagtgg tgcgatctcg gctcactgca agctccgcct 9120 cccgagttca cgccattctc ctgcctcagc ctcccgagta gctgggacta caggtgcccg 9180 ccaccacgtc tggctaattt tctgtatttt tagtagagac ggggtttcac cgtgttagcc 9240 aggatggtct cgatcttctg accttgtgat ccgcccacct cggcctccca aagtgctggg 9300 attacaggag tgagccaccg cgcccggccc agctctgctt tttcttagtg gttctgcgtt 9360 gtgtttgttt ctatccagga atagggttgg ttttactttt ccatcgagtt tttaaagaga 9420 cgacgattta catggtcgga aactcacgag gactccccat cccttggtcg gaaactcaca 9480 tggactcccc atcccttggt cagaaactca cgtggactcc catccatccc aggcagcagc 9540 ttcccacctg ggccctacgt gcaggatgag ggctccttcc gggtcagaag acatggcggc 9600 ctcggggcac cgtcccctgc atggggtgct cacaggatct tctcctctct ccttcccagg 9660 gtgtgccctt actacctgtc ccggaacctg aagcagcaag ccgacatcat attcatgccg 9720 tacaattact tgttggatgc caaggtgggg gctcagtcct gtagctgacg actcctgatg 9780 tccaggggtg tccctgggct tgggaacagc tgtccgagcc tttgctgctt cagggcctta 9840 gatcagcagg cctgggtggg aggactcacc tctgtcactg ggcaggggct caacctggcc 9900 agacacactt gtgagcagcc ccaggccaca ggtcagtttt ctgagcagtc tgggagcggg 9960 caggctggtg ggagtgagga gagacctcca ggctgtggtc cataggccag tgcccgctct 10020 tgatcctgac agctcaggtt ctctccttca cgtcaggcca tgggaggcac cgagaacaca 10080 ggaagcccac tgactcccct cttcccagcg cgtgcccggc cccacactca ctccccctcc 10140 cagcatgtgc ccggcttcac actcactccc ctcttcccag tgcatgcccg gccccacact 10200 cactcccccc acagcatgtg cccggcctga cactcactcc cctcctccca gtgtgtgccc 10260 agccccactc ccttccgccc cgtgtgccca gccccacgct cactcccccc gccagcatgt 10320 gcccggcccc acactcaact cccctcctcc cagtgtgtgc ccggccctgc tgccctcctc 10380 cccatgtgcc ctgcttttgt gccccacact ttttacttag tgcaggtggg atcacacgcc 10440 acgggtcaat ggtttgtgtg ttcacgtgac gatggcgtgg tgacgtttcc agatcccgtc 10500 gttggttcgc tcattctcgg ggtgtatatt tattgagagc tcatcatgct gggtgctatt 10560 ccaggcatag caagactggc ttcactcaca tggagctttg attctagtgg tggggacagg 10620 tggacagcaa aagagtaagc acgtgagctg atgatactga agggaaatag agcagaggga 10680 ggaggcggag accgagccaa gcgggcccaa gtgcgatgtc ggcgggaggt ggggaatgct 10740 ggtgggtctg aggggagcct cagcaggtgc agcagagcaa gggaagaggt gagtgggggc 10800 ggctgggggg ccgactcctg ggaagctgta gcagaacccc acagagagct ggtgaggttt 10860 gccgtggttg tgggtgactc ggtgctttga gccctggctg cccctgggaa ccatctggag 10920 agcttctaac ccaaccaggc ccctccctgg gacagttata tcacagctgg taagccgagt 10980 ctaacacttt cacggaaacg cagaagatct aaaacagcaa gatgaccgtg aagaagaaca 11040 gagctggagg actcacctcg ctggtttcaa gactcctcta aagctgcagg agtggaggtg 11100 gagatggccc agctcaggca caggcctgca ggccatggag aaggcagcaa gctcaagctg 11160 acccacacgc atgtggtcat tgtttttttt ttcagttgga atctcactct gtcacccagg 11220 ttggagtgca gtggcaccat ctcggctcac tgcagccccc gcccctaggt tctagcgatt 11280 ctcccacatc agcctcccga gtagctggga ttacaggcgt gcgccaccat gcctggccct 11340 tggtgattgt tttttgacaa acatgccaat ttaattgaga gaggaaatga aggttgattt 11400 ctggttttct gaaaaaatgg tgctaagaac agctggatat ctgttcggaa aacagtgaat 11460 cttaactctt gttttaccct gtataaacct aaatgtaaaa gctaaactaa aagttataga 11520 aaggaacatg ggggaggtct ttgcaacttt ggggtaggca gagatttctt agtatggata 11580 cacaaggcac tagccatgaa gaaaaacatt aaaatttaga cttcaccaaa atttaaagct 11640 tcaactctgt ggaagagttg agaaaatgaa aaagcagtta aagaaaggga gaaaatactt 11700 ctttcaaagg acttaaaaaa ttttttcagc cctcctctga tttgaaagga cctttgacca 11760 gagtatgtaa aattctccca taactaagca aacaacccac ttaaccactg ggaagggatc 11820 tggacagacg tttcaccaag atgggtggaa tggccagtta accactggga gagcatccgg 11880 acagacgttt cgccaagatg ggtggaatgg ccagttaacc actgggagag catccggaca 11940 gacgtttcgc caagatgggt ggaatggcca gttaaccact gggagagcat ccggacagac 12000 gtttcgccaa gatgggtgga atggccagtt aaccactggg agagcatccg gacagacgtt 12060 tcgccaagat gggtggaatg gccagttaac cactgggaga gcatccggac agacgtttcg 12120 ccaagatggg tggaatggcc agttaaccac tgggagagca tccggacaga cgtttcgcca 12180 agatgggtgg aatggccagt taaccactgg gagagcatcc ggacagacgt ttcgccaaga 12240 tgggtggaat ggccagttaa ccactgggag agcatccgga cagacgtttc gccaagatgg 12300 gtggaatggc cagttaacca ctgggagagc atccggacag acgtttcgcc aagatgggtg 12360 gaatggccag ttaaccactg ggagagcatc cggacagacg tttcgccaag atgggtggaa 12420 tggccagtta accactggga gagcatccgg acagacgttt cgccaagatg ggtggaatgg 12480 ccagttaacc actgggagag catccggaca gacgtttcgc caagatgggt ggaatggcca 12540 gttaaccact gggagagcat ccggacagac gtttcgccaa gatgggtgga atggccagtt 12600 aaccactggg agagcatccg gacagacgtt tcaccaaggt ggatggaatg accagttgag 12660 cacatggaaa gtcgcccagc atctccagtc ataggagaag gcagattaaa gccacgggga 12720 gccgacactg tggtcccact ggcatggctg aaattcagaa gccctgagtg tggcatgagg 12780 atgtggaaca gctggatctc atccatcgct gtgaagttgt gtagccactc cacaaacgtg 12840 tggcaaacag ccgagccggg agaagggaag acgtgttcaa agattcatat gtggccaggc 12900 tcagtggctc acgcctgtaa tcccagaact ttaggggcca aggctggggg atcgcttaag 12960 cccaggagtt tgagaccagc ctaggcaaca tagggagacc ccatctcaaa aaaaaaaaaa 13020 aagaaaaaag aaaagacttc agtgtgcagg tttaccagag ttttgtttgc agttgccaaa 13080 actgggaagc agcccgcgtg agcccatcca caggtgaatg gacagaccgt ggtacccgaa 13140 cactaacagc agccacgggc gtggactgtg gtcacacagc agcagggagc cgatgagtct 13200 cggacatgct aacccagaga ggcccattga ggaggaccta ctgttttttg tgtttttgtt 13260 ttttgttttg aaatggagtc tcgctctgtg gtgcaggctg gagtgcagtg gtgtggtctt 13320 ggctcactgc agcttccgcc tcttgggttc aaacagttct cctgcctcag ccttccgagt 13380 agctgggact acaggcaccc gccaccacac ccggctaatt tttgtatttt cagtagagac 13440 ggcagttcgc catgttggcc aggctggtcc caaactcctg accttgtcat ccactcactt 13500 tggcctccca aagtgctgag gttgcaggca tgaaccaccg cacccggctg gacctactgt 13560 tttattccat ttatgtgaca ctctattaat agaaaaggca ggggtggggc tggtggttat 13620 atggtgcaca taactgccag aactcagtac acttaaaatg aacatcttaa tgtgtgaaat 13680 tttttttttt gagacggggt cttgctctgt cacccaggct agagtgcagt ggtgcgatct 13740 ccactcactg caagctctgc ctcctgggtt cacgccattc tcctgcctca gcctcccgag 13800 tagctgggac tacaggcgcc cgccaccacg cctggctaat tttttttttt tttttgtatt 13860 tttagtagag acggggtttc acagtgttcg ccaggctggt ctcgatctcc tgacctcgtg 13920 atccgcctgc ctcggcctcc gaaagtgctg ggcttgcagg cgtgagccac catgcccggc 13980 caatgtgtga aaatttaaaa gtaccaaagc tggaccccac cccagattgc tcccatgaca 14040 ctctgtgggt gggacctggg agttgggttt tgttttgttt tgttttgttt ttgagatgaa 14100 gtctcactct gtcgcctagg ctggagtgca gtgacacaat ctcggctcac attaacctct 14160 gcctcccaga tgaaagcgat tctcctgcct cagccttctg agtagctggg attacaggca 14220 cacaccacca ccccctgcta atttttgtat ttttagtaga gacggggttt taccatgttg 14280 gccaggctgg tcttgaactc ctgacctcgt gatccgcccg cctcggcctc ccaaagtgct 14340 gggattacag gcgtgagcca ccgcgcctgg ctgggagttg ggtttgtaaa tctccctgag 14400 tggggctggg gcagggaact gctgggtctg ggtcttcctg gctcctctgg tctgtggctt 14460 cctgactgcg gtggccgggg gctcccaggg catcgtggcc gtctgtcttg ctgagcgtgg 14520 cacgtgcctt tccatgctgt ggaggagcgt ctcccggtat ggcgaactgc tggttagggt 14580 ggggcggtgt tgccaggtca tccaggtctg gcctctgctc tcgacatcgc cggcgctgtt 14640 gctcatctgc gcttgtgatg ttcgatgcct gctgcacatg tcttggcttc cctctttccc 14700 ggcctctgtg agctccagcg ctgcgtccct tctcttcctc ctgtagagcc gcagagcaca 14760 caacattgac ctgaagggga cagtcgtgat ctttgacgaa gctcacaacg tggtgagtct 14820 ccgctggcct cctaaacacc tcctattgct tctggccttt ttgtcaagag ccacgcaaac 14880 ctttctggag gggctctggc caaactcctg aagccctagg tgcccaggac tggggactga 14940 gcacaccagg agcttctgcc accccctccc gccctgatcc gatgcctctg ctggggctgg 15000 agactggcca gctgggccag ggacctgccc gtcaggcgca gggcccccac aggccgctca 15060 ccagaccctt tccctccagc cagctcgggg tcagcctggg ccagggctgt ctcctctgcc 15120 ctcggcagca gcaggcttgt ggtcttgcct gcagtgtctc tgcccttccg gccacatggc 15180 ttgagactga ggcaggagaa tcgcttgaac cttggaggca gaggctgcag tgagccagga 15240 tcacaccact gcattccagc ctgggtgaca aagcgggatt ctgtgtcaaa aaaaaaaatg 15300 ttgactgggc gcgctagctc atgcctataa tcccagcact ttgggaggct gaggtgggcg 15360 gatcacgagg tcaagagatc aagaccatcc tggccaacat agtgaaacac cgtctctact 15420 aaaaatacaa aaaaattagc tgggcgtggt ggcgtgtgcc tatagtccca gctactcagg 15480 aggctgaggc aggagaatca ctcgaaccca ggaggtagag gttgcaatga gccaagatca 15540 caccactgta ctccagcctg gtgacagagc aagactccgt ctcaaaaaaa ataaaatcaa 15600 aaagaataat tggcaattcc agtgaaataa ttgtttgttt gtttgttgag acagggtctc 15660 cttctgtcgt ccaggctgga gttcagtggt atgatcttgg cccactgcaa cctccacctc 15720 ctgggctcaa gccatcctcc cacctcagcc tcccgagtag ccgggactac aggtgcacac 15780 caccacgccc ggctaatttt tgtatttttt gtagaggcgg ggtttcccag cgttgcccag 15840 gctggtcttg aacccctgag ctcaagtgat ctgcccacct tggcctccca aagtgctggg 15900 attacaggtg tgagccaccg cgcccggcct gaaacaatcg tttctaaata ttggtgtggg 15960 ccacacagtc atgtttggac ctacttgtgg ccttttacag accccaggcc aaggctttgg 16020 gaacttggct gtcagcctcc tgtgccttct gcacccccac cccatttctg ctttctggaa 16080 cccccgatcc tgtcctgttc tgtggtgatt cgggtgtgct tgggctctag gagaagatgt 16140 gtgaagaatc ggcatccttt gacctgactc cccatgacct ggcttcagga ctggacgtca 16200 tagaccaggt gctggaggag cagaccaagg cagcgcagca gggtgagccc cacccggagt 16260 tcagcgcgga ctcccccagc ccaggtgcgt tcatagccag actgcttggt cctgaggcct 16320 gcgctgctgc agggtgagcc ccacccggag ttcagcacgg actcccccag cccaggtgcg 16380 ttcatagcca ggctgcttgg tcctgaggcc cgtgctactg cagtgggcag cctgccctgt 16440 ggctgtgtgt ggtcggcctg ggcaccatct attcaggctg gcactgcagg gcatccgctt 16500 ctctcagagg cttcttgggt gtgaattctt cagggtcctg tagcctgtgg aagggctggt 16560 attgttcagt agttctggta ttttccaaag acctatgtct tctcccagcc agtatcaact 16620 tggcctctac tgtgtaaaac tggaaaactc tactttgtga agctgagttg ggagcatcgc 16680 ttgaggccag gagtttgaga ccagcctggg caacatggcg gaacctcgcc cctgccaaaa 16740 aattagccag gtgtggtggt gtgctcctgt ggtccaagct tttccggagg ccgaagtggg 16800 aggcgtgctt gagcctggga ggcagagctt ccggtgcccc agatgactcc actgcactcc 16860 agcctgggcg gcagagtgag gccatctcaa aaaaaaaaaa aaggaaaact aaatatattc 16920 actgtaaggg cattttgcat ctttaaatga cccacaaatc tggcatgcat cagctgctct 16980 gcctgtaggt tccttcccag tgtttgtcca gaggtgtatt tccacacagc gctagtcacg 17040 gcatacgtgg aaaacgtgga aacccttcat ggatgttgtc agttggtcta tattttcttt 17100 cttttttttt tttttgagat ggagtttcac ttttgttgcc caggctggag tgcaatggcg 17160 cgatcttggc tcactgcaac ctccgcctcc tgggttcaag caattctcct gcctcagcct 17220 cccaagtagc tgggatcaca ggcgtgcacc accacgccca gctaattttg tatttttagt 17280 agagatggtt tctccgtgtt ggccaggctg gtctcgaact cctgacctca cgtgatccac 17340 ccgcttcggc ctcccaaagt gctgggatta caggcgtgag ccgccacgcc cggcctttgt 17400 ccatattttc tacatggctt ctgtaaacag ctgactagga gtctgtgtga atatcttcat 17460 aggttctgct gtgacactac ttgctcgtga gcatctccag gtgtaaacag catcagcttc 17520 ccccattttc ctttaaaatc gcacatgtgg acggacacca cggggaccct ggaccctggg 17580 gagccccgtc ctcacccttc tcaccaggat ggctgcttgg tagagagtga gtttgcaaag 17640 ttggcatttg tttagtacag aagttatcag gtgttctggc tttagaatcc ctttatatat 17700 atatatatat acatatattt aagtgacagg gtctcactct gttgcccagg ctggaatgtg 17760 gtggtacaat caaagttccc tgtagcctcg gcctcctggg ctcatgggat cttcccgtct 17820 cagcgtctta aagcgccggg accacaggtg tgcaccactg ccaccggctc tcaagattgc 17880 cacgcaggga gttgcagtgg gggaaggggt tcctgggact ttgaacgctc cacctccctc 17940 ctctccacag tcccccaacc ccacctctct aacggggtgg acggccgcct ctttccatcc 18000 ttcgcttggc gcagggtggg gagagtgaca ggtctccttc cctcatctcg gcagctgcca 18060 tttcatcgct tacataacgt gggagaaaca tccacccacc cccaggcctg tgtgaacatc 18120 accacggggc cttctccact cttcagtttt gttagttact tgatgtgcag ggctttttgt 18180 tgtaactagt gggggacgtg tggtggggtg ggcttctgcc atctcattca ggaccagaac 18240 ttcagttttc atccctatct gttcccccac ccctttggag atggggtctc actctgtcac 18300 ccaggctgga gagcggtggt gccatcacgg ctcactgcag cctccacctc ctgcagcctc 18360 cacctcttgg gctcaagtga tcctcctgcc tcggcctccc aagctcctgg gactacaggc 18420 gtgtgccact gtgcttggca gggtccattc ttttcctcac actttattta ttgaagagcc 18480 caggccgttt accctgcaga gtcggaatct gtacaggagg ggcagccaca cgagttcccc 18540 ggtttactct gaacttaggt ggcttgaggg ccccagttag actgcggcca ccgtttgccg 18600 ggctccagat gggacgtcct ttctatcaga aggctcacag tatctccttt cccgtttctt 18660 cccatgtgaa cattgttgct gctgaacacc tgaatatgtt aatcactggg ggcttgcaag 18720 atggcagtgt gctaattcca tcatctagtc agttagcagg aataacttag gaccacgccc 18780 tgcaccatat cagctatgtg gtgatcccat tcacacagga aaggtgggac aaatgctggg 18840 ggtgggccgg gtgtgctgtc tcacacctgt catcccagca ctttgggagg cccaggcagg 18900 cggatcacga ggtcagagat tgagaccatc ctggccaaca cggtgaaacc ccgtctctac 18960 taaaaataca aaaaaattag ccaggtgtgg tggtgcatgc ttgtaatccc agctacttgg 19020 gaggctgagg caggagaatc acttgaaccc aggaggcgga ggttgcagtg agccgagatc 19080 gcaccattgc actccagcct ggcgacagag cgagactccg tctcaaaaat caatcagtca 19140 atcaagtgtc atcactgaat gtttgtgtgt gaacgtgggg attggtcctg ccccatgctc 19200 cctcctgaat ctcactcctg acctcagttg ctgcaccttg aggtgttttc atgtgggctc 19260 ttgtgtcctg accccggcgg ttgtggcctc tttgctgtct gggagtcagg atttttcaca 19320 ctcatgtcct gctccagacc tggaatcagc caagtctcca agaagccctg ctttcttttc 19380 ctgcaagacg gtatttcaag acccgccatg cggcagcggg ttggtcatgg ttactgggtt 19440 ggtcgttgtt actgggtgtt ttcgtggaga tacagccata cgcacaggtg tgttcacaaa 19500 tgttaattct aaaggtcaaa cacccggcca ggcataaggg ctcagcggta atcccagcac 19560 tttgggagac caagactggt ggatcacctg aggtcaggag tttaagacca gcctgagcaa 19620 cagggtgaaa ccccatctct actaaaaatg cgaaaattag ccgggcatgg tggcgcacac 19680 ctatagtccc agctagtcgg gagacagaca cgagaattgc ttgaacctgg gacatggagg 19740 ttgcagtgag cagagatggc gctgctgcac ccctgcctgg gtgacagagt gacaccctgt 19800 ctcaaaaatg aatagataaa taaagataaa acacctgctc ctcttggtgt ctccagtttg 19860 gatttggcct gtgtagcctc ttccttcgcc tgttggtgga tttggcctgc acggattctg 19920 tgtggcctct tccttcccct gttggtggat ttggcctgca cggattctgt gtggcctctt 19980 ccttcccctg ttggtggatt tggcctgcac ggattctgtg tggcctcttc cttcccctgt 20040 tggtggattt ggcctgcacg gattctgtgt ggcctcttcc ttcccctgtt ggtggatttg 20100 gcctgcacgg attctgtgtg gcctcttcct tcccctgttg gtggatttgg cctgcacgga 20160 ttctgtgtgg cctcttcctt cccatgttgg tggatttggc ctgcatggat tctgtgtggc 20220 ctcttccttt ccatgttggt gtcctttttt ccatgccagg aatcctggtt ctcaagggcg 20280 gggttgttgg cacgagcgtg atgcagactg cctttgctgc ctttctcttg cccagggctg 20340 aacatggagc tggaagacat tgcaaagctg aagagtaagt gttgccctcc ccgcctcctt 20400 gcagctgggt ggggcctcct ccttgcgagg aggtgggtga cacctcctcg acccacagtg 20460 atcctgctgc gcctggaggg ggccatcgat gctgttgagc tgcctggaga cgacagcggt 20520 gtcaccaagc cagggaggtg agaggcgggg agccagcccc ttcactgcag gcccagccta 20580 gagctagaaa cgggccatgg tgcagtcctg ggctgtcaca tcacgagtga ggcctgtttt 20640 caggcctgtt ttcccttttt gagacctggg aggagcacct gctttgcatg atctggttgc 20700 tgagatgttg agaggagcag cacacactcc cacgggacag cacacagccc cccacggaac 20760 ggcacacaca cccatggaac agcacacaca ctcccacgaa cagcacacac actcccacga 20820 acagcacaca cactcccacg gaacagcaca cacacccacg gaacggcaca cacacccacg 20880 gaacagcaca cacactccca cggaacagca cacacaccca cggaacggca cacactccca 20940 cggaacggca cactctccca cggaacagca cactctccca cggaacagca cacacactcc 21000 cacggaacag cacacacacc cacggaacgg cacacactcc cacggaacag cagactctcc 21060 cacggaacag cacacacact cccacagaca gcacacacac acccacggaa cagcacactc 21120 tcccacgcgg ggccgctggg tttcctgcag tttctcctcc tccaggcctt tccctggacc 21180 ctggtccagt ccgtcatttg agcacaggtg cctgttagaa cgagaccttc ttgttaggac 21240 gatgagtgtc ccagccacca cctcttttgg actccgggag gcctggaacg ttctgaacgc 21300 tccgtggggc tccagtcttc tccgcagcca gggcagcagg gtttgctgtc tgtcctgcag 21360 gcagatgagg agtcagggct ggggcctgtg tgggggctct cctgagcgca cagccgccga 21420 ggtggagcgt gttctgcctg agcgccgacc tggtcggggg aatcccagtt gcttccaggt 21480 ggagccactg tcctcagcgt aatgctcaag gctctggcct ggctcctcgg ccaccctgca 21540 ccctcagggt cccctcctgt agcttctgct gccccatcac tgtcactctc caaagctttg 21600 gggactctgc ccagagccac cgcctcccag aagcccctga caacctcttg acgaccccct 21660 agtgacccca tccctcccct ctgacggcgg cccctgctct gaggcggctt cttttcctcg 21720 gtgctgttct cgtgctggcc aggcctcctc tccccacctg gaggctcctg agggcggagg 21780 cctctcacct ccaatgctgg cgtcccctgg agggctgaat ttgtttccga gggaaggaaa 21840 cttccacagt tgttgccttc agttccaaag ctgcagcctg atttccccct ccaggctcga 21900 gcctgttttc ttctcggcag ctacatcttt gaccagtgtc gtcccccctc aggcccgagc 21960 ctgccttctt ctcctcagtt cccaaagctg cagtctggtc cccccgccag gctcgagcct 22020 gccttcttct cctcggcagc tacatctttg agctgtttgc tgaagcccag atcacgtttc 22080 agaccaaggg ctgcatcctg gactcgctgg accagatcat ccagcacctg gcaggacgtg 22140 agtgctggca cggggtcttt ggtgcgggca aatgtggcgt agggggtgca gcaggcctcc 22200 atcttggcag tcagggctcc cctggccgtc acctggccgt cagcaggaac aggcccacag 22260 aacctcatct tctgatcggg gcgtggaggc gttagtgcca cttgccagct gccgtagagc 22320 ctgtcccagt tctgcagctg gcggcttcgt cctacagcct catcccatta ttctgctttt 22380 gagaaagagc agcccaaggc cctagctggc ttgtggggcc tctggcttct ccacaccacc 22440 ccgagttctg cttctcagag ttgtggggtc cagaggcttt gcccagaggc ggtgtcccca 22500 tgggctgctc tggtttgaga cgccgggccc agcggggtct ctcctctgct gcgctcccgg 22560 gtgctgggga gggtggcttt tgctgcttca acccttaggc gaccatagag cctcttttca 22620 agtcccactg acccccttgg agactctgtc cctgcctggc ttctctcctg gctgctggga 22680 agagcaggcg aactgcccgc cctgaatgga tgctgcgctc caccctgggc cccccattgg 22740 gcaggagatg gagcttggca gtcgggctga gcgggctcat gctggaaggg ccggggctgg 22800 ggtcggggcc tcccctgcct gcagtgtggg tgtcagcgcc ctgctgccct ccaggtgctg 22860 gagtgttcac caacacggcc ggactgcaga agctggcgga cattatccag gtggggcctg 22920 ctcctctgtg gcatctcctt ccctgatgga agccgggcgg gtgccttctc ctgctgtatt 22980 agttaactga ttctagactt ggggatggga gaaaggcccc tacaccacct gtttctgatt 23040 ggcaaactct cggctccttt ccagtgccct aaacccacac tgggcctcct gcagggatgg 23100 gggaggacga ggtctggtgg cacatgccca gggtgatgct ggtgagggag gacgcaaagg 23160 acagtggggg ccggggagcc gctcctgccc tgtccgggcc ctcaggccag gggggaccca 23220 ctgctggcag ccccagcagc cccagctgca cgcagatgaa gagctctgga cacacgcggc 23280 ttcctgaaca gcttctccag ggacagacaa atggggaccc tgcaggttcc cggcaggggt 23340 gtccctggga gcccatgatt gggggtgcga ccctggcccc cttctcattg gccccgtcct 23400 gtcctgcaat gcccgtccca tgtgaggtct gcttctggct ccatgcctat ggcagcacct 23460 gctttccctg gcgtagaggt gcttgtccgg tttgtggagg gcacgcccca ttttgggtgc 23520 tctgggcacg ttgcctctcc ggggcctcgg tggctttttt agaagcagac tcagaagtcc 23580 ctgactgggg aagccaaggc acaggtggct gtgtggagcc ctgtgaggcc tcctctgtgc 23640 tgcccacgct gtacctgctg gccacacgag atcatggcag ggttaggcag ggctgcccag 23700 cgctatgaca gcttcatgag tgtccatctg gcctgtgggg tgcttgagct gggggaggcc 23760 gcagaagaac cctgggatgc atggctggcc tgtgcatgct gctgggcatg gagctgcaga 23820 tcccggaaca agcaggcact gccttctcct tcacagacgc agctctgagc gggggcgaga 23880 cctgggcagg gaccaggtgg ggtgggcaca gggtggtggg gcccaggctc agccctccct 23940 ccactgtggc cgtctctgtg gccagtgacg ccacagcctg tgtcttctct gtgcggtagc 24000 tggggctgga aggacagcac tgccttgtcc tcccaactcc tccccaaagg cacggtgggc 24060 atcccaggcc cagacccctc tgtctgtggc tcctgcctgc caagggctgc tgtgctgtcc 24120 cgcatggagt gtggttggct cttcaagcag gaggccgtgc acctatcagg cggacctgct 24180 tccatgtccc tgatgggtca ctgcaaagca cctccagcac atggccaggc gaggtagccc 24240 tgcagcccag ggcctggagg gcaggtgtga gctggcccgg gcctgtccct ccctggaata 24300 cagcttccca ggctcccact tatggagaag tctcctccac actatggaac tgaatcctag 24360 aatgtggctt ctgaggttcc tacactcgaa ctgaatcctg gaatgcggct tccaaggctt 24420 ccagctatgg agaagactcc acactctgga accgaatcct ggaacgcggc ctcccaggcc 24480 cccagctatg gagaagactc cacactctgg aaccgaatcc tggaacgcgg cctcccaggc 24540 ccccagctat ggagaagact ccacactctg gaaccggatc ctggaacgcg gcctcccagc 24600 ctcccactta aggagaagtc tccacactct ggaaccggat cctggaacgt ggcctcccag 24660 gcccccactt aaggagaaga ctccacactc tggaaccgaa tcctgcacac tccatcggtt 24720 tggaatttcc tttggctgct gctctaagta gccgctggtg gatgactcag cttctgccag 24780 ccctcgggtg cctggaggat gagggactgc acacagtgct cacccgcgtt ggctcctgag 24840 cccctgcagg tgtgggcggt gcccataggg ctggtgctgg gttgggcctg cagccctgag 24900 tcacaggtga ccctgggggc agagtggggc cagtggcccc aggaagagga tgtgggatgc 24960 acagctcagc tggaggcgaa ctccaggcag ggtcaggccg tgtgctcgga agtcagggct 25020 tagctggagg caaactctgg gcagtgctgg cccgtgttgg ggaaccagtt gcccctgggc 25080 ccccgtgaga ctgctgggtc ctcatccctc tctgcctgag gccggagctg ccctgggctg 25140 aggcacaggg ggatttgtgg tggtgttttt ttgagaaagg gtctcgcttt gtcaccccgg 25200 ctggagtgca ggggcttgat cacagctcac tgcagcctca acctcctggg cccaagtgat 25260 cctcttgcct cagccacccg aggagctgtg aacacaggtg tgcaccaccg cactcagcta 25320 atttttaaaa tttttttgta gagatgaggt cttgccatgt ttcccaggct ggtctcaaac 25380 tcctgggctc aggcagtctg cccgccttgg cctcccaaag tgctgggatt acaggcaaga 25440 gcttccatgc ctgcccagca gaaggctttt cgaaggaagc tgtttcctga ggcagactca 25500 gccctgctca tggcagccac cagcgtgggg gtgaacttgt tctgttactt ccatccccgt 25560 gggccaaatg ctttggtaaa acacaaggcc ctgtgtttag ctgtcttgac agtgaaaatg 25620 gctgggaagg aaggaaggaa cggaaggaaa tttctctctc cttctgtgcg tacccaggca 25680 cgtgcacatg catgcagagt acgcacacac gcacgcacgc ctgcacaaat ccacgcatgt 25740 tgccaagtct ctgtgttcca gccgtggtgt ctgccccccg gtgttctcta gttcggcttc 25800 tccgcatttc tgtgaatgat tccggcttct tggtgttccc agcagaactc cctcaagtct 25860 gcggcggggc tctgacggcg gtggcttggc tgacatggcc acattgctga gcctgttggg 25920 ggctttgcgt tcctgttctg gccgtttttg gctcgttttc caggaacggt cgtcacgcgc 25980 tcctctccta gtgcaggcat cattcctttc ccattgattt gcagggttct ctgtaagttc 26040 tgaggatccc atatacatat actctctgta agttctgagg atcccatata catattctct 26100 ctctaagttc tgaggatccc atatacatat tctctctcta agttctgagg atcccatgcc 26160 gacatacata ttctttcctt gtctcatgct ggtcattttt tccattttca tgacaggttt 26220 ggtgaacaca tgtttccttg tcagattttt gttctgagct tgtgcctccc gaccaagatg 26280 ctaaaccggg tcttgtgtat tctccaaact gcactgtaga gtgacggagc tttgtgtctg 26340 ggcctccatg ccttctgacg tcacctgtgg gggtgtgaaa ggcagactct accttgattt 26400 ttcccagcac gccacaccgg tggttctgtg cgctgaccga gcggctcggc ttcccccaac 26460 tccactgggc acctgccaca cttttcctca tgtttttgtt cactgtggtt ttgtcgtaag 26520 tcctggtgtt ggcctgaacc aatttctttt tgtttgtttt tgagacagag ttttgctctt 26580 gttgcccagg ctggagtgca gtggcgcgat ctcggctcac tgcaagctcc gcctcccggg 26640 ttcacgccat tctcctgcct cagcctccca aatacctggg attataggca cctgccacca 26700 cgcctggcta attttttgta tttttagtag agacgaggtt tcaccgtgtt agccaggatg 26760 gtctcgatct cctgacctcg tgatccgcct cccaaagtgc tgggattaca ggcatgagcc 26820 accgtgccca gcctgatatt tttagtagaa atggggtttt gccatgttgg ccaggctggt 26880 ctcgaactcc tgacctcagg tgatcctctc accttggcct cccagagtgc tgggattacg 26940 ggtgtgagcc accacgcccg gcctcttgtt cttttgaaac ctgccctgac gttttttcca 27000 tagtgcatct tggagtcagc gtgtctactt cctgtaaaaa tcttactgtg attttgacta 27060 gaatgtgttg aattcctgtt ttttttttga gtcagggtct ctctgttgcc caggctggag 27120 tgcagtggga ccatcacagc tcactgcagc ctcaacctcc tgggctcagg ggatcctctc 27180 agctcaacct cccaagtagc tgggaccaca ggcacatgcc accatgcccg gctaggtttt 27240 tttttttttt tttttggtga acaccctggg gttgcaccat gttgcccagg ctggtctcga 27300 actcctgggt tcgggcagtt tgctcctctc agcctcccgg agtgctggga ttacaggcct 27360 gagccactgc actaggccat gttgaatttc tagattaatt tggggccctc aggggcacag 27420 agaggagggc tgggccagtt ggcgggagga gaggcccctc gggctgccgc attttcagtg 27480 catggagatg gcctatgttg ggggaacaca gagctcaccg ggggtccctg cagggaggag 27540 aaagggtcag gcaggtgcca gctcctgtcc attggcctgg ggctgcatga tggcaggggc 27600 cggtgaaccg atgacccctg ggtgtcctgt gaccttctgt gtatgcggct gatgctgcag 27660 aaagtcgggt ggcctcaggc tcctgacggg gctgcacttc ctctgccttt cagattgtgt 27720 tcagtgtgga cccctccgag ggcagccctg gttccccagc agggctgggg gccttacagt 27780 cctataaggt aggggccacc tccaggaggc aggtggaggg cagcccttgt tccccggcag 27840 ggctgggggc cttacagtcc tataaggtgg gggccacctc caggaggcag gtggggctgg 27900 gggtcttctg gtcctaaaag gtaaggggct gcccccagga catgggcggg gcctccacac 27960 tcctggtcct gtcccctcca ggtgcacatc catcctgatg ctggtcaccg gaggacggct 28020 cagcggtctg atgcctggag caccactgca gccagaaagc gaggtacaga cctgggccca 28080 cacgctcccc gcccgcccgg gtgcagtgcc cggcaccacc atgccacagg ctaggcacat 28140 gcccagccgt ggatctcctg cccccatggg cctggccacc ttctccatat ccaggccaat 28200 ccagagcatt ctcctcactg tccctctgaa gattggagtt actgagagac gtaggagatg 28260 gcctgatggc accgtgacct gcccagagtc acctggttgg tggtggcaga gccacagccc 28320 agccaggcct ccctgctggg acacgctcgt ttatgccgag gccgtcagca cagagcctcc 28380 acagtgaggc acggctctgc ctgctgcctc cacgcagcgc ctggccgggc caagcctcag 28440 ggtcacatct gaagggggcc cggctggccc tgttgtccga agcccctggt gcgctcagcc 28500 ccgaggcccc acgtgccttc ttggcttcct gtgctccgtg gcgtcttcga gtcggtgctg 28560 ccggggacgc tgtgtggatg gggtctgtga gtgtgccctc ggctccgtgt ccggagccct 28620 gtggttcttg gggtgtatct ggccccaccc ccactgcgtg gtgtccaggg tggggcttca 28680 cggctgcagc tgcgggagct gctgcccctg ccttgtgctc cagtggggcc ttgcctctgg 28740 gcttggttcg tccctctctg gaacattctt tctcagctgc tgtccgaccc atggtggcat 28800 gacgtggccc tggctgaagc agcccttgtg cggttgctgt ggttgggtct gcctggccga 28860 gccggaaggg aagggctggg agggcgtcag ggtggcgtgg cttgaccccc gctcggtgat 28920 ggtcctgcag caaggcctct cccagcagga agcgtccatc ccggggggag gccggcgccc 28980 ctcacgcagt tggggttgcg ggaggcagtg cgtgcctgag gcagccggtg cacagattcc 29040 aagggcctgg aatctgtttg ttccattgac ctctgatgtc acttgacttc tcagaagcag 29100 ccactccctg cactgggcgt ttgtaggaaa tgagctcctg gaggaggggg tggggaagtt 29160 cccccattgc agggcacact cagccccagg aaggaaacgt gcctcgtccc tgctgactcc 29220 gaatcgcagt cagagtcgtt ctgcttgtgc cgtgttgaat tcccggcatc cggcatccag 29280 actcagcctc ctccccaggc cacggccgcc gtggccagtc ggtcaagccc ttctaggaac 29340 ttcctttgag ctggcgccct tgttcactgc tgacgccact cagaggcttg tgcacgtgtc 29400 ctgcttccag gcagagctgg gaactcgcac cccgtcttct gcacgcggcc gtggaatgtc 29460 gggatgccgg cgcttccttc ccgtgtgctc ttggcggggt gggcttcttg ccctgagccg 29520 catgtcacag tttctgcaga agtttagggt tggagtgggc tgacctctct gcaggtgtcc 29580 ccagcctctg cctggggtct gcctcctact cccaggaccc cctgtccccc agaggggccc 29640 caagctggca ggctcacact cagggcagcc tcctttgttc tgacttctgc acagtgggcc 29700 tgggtggctg cccgcggctc gcttgcttga tgccagtggg tggagagggt gatgggcaga 29760 gaggcaggtg gtcaggcccc cagtcccgtc ctcacactct gtgccctctg ccgccccccg 29820 ccccacaggg aaggtgctga gctactggtg cttcagtccc ggccacagca tgcacgagct 29880 ggtccgccag ggcgtccgct ccctcatcct taccagcggc acgctggccc cggtgtcctc 29940 ctttgctctg gagatgcaga tgtacgggcc acccctgcca gggcctgagc accggtgaca 30000 cctctgacat cagcggggtg gaagtggtgg gggtccccat gagccgggtg ctgggggtct 30060 cgggcctcga gggctaaagg ggtgctggtg cacttcccca ctgtctgctc cctctggcca 30120 cgctcagccc tttcccagtc tgcctggaga acccacacat catcgacaag caccagatct 30180 gggtgggggt cgtccccaga ggccccgatg gagcccagtt gagctccgcg tttgacagac 30240 ggtgagggcc tgtccctggg ccctgctggg gtgggaggtg ggggagcact gaggcctgag 30300 gtcctgagca gtggcctctc cggctctagg ttttccgagg agtgcttatc ctccctgggg 30360 aaggctctgg gtgagtgccc tgaatgcccc agctgtgccc atcctggatc ctggacccct 30420 gctcccaaga gctggtaggg aaccctgcag acatcctgcc cctgccttga ccccggcccc 30480 tgcacttcca ggcaacatcg cccgcgtggt gccctatggg ctcctgatct tcttcccttc 30540 ctatcctgtc atggagaaga gcctggagtt ctggcgggtg cgtctcccct gtgttctggg 30600 cggggtgggt gagggcaggg ctggagcatg aagcaggcag tggtcacagc tcctgcttgc 30660 cctcatcgga tcggcggcgt gaccagggct gccgtgtccc tgcctcttcc tcccacaggc 30720 ccgcgacttg gccaggaaga tggaggcgct gaagccgctg tttgtggagc ccaggagcaa 30780 aggcagcttc tccgaggtcg gcacttggcc ggggctctgg gcctgctgcc ccctcgtgcc 30840 tcccctgcct ctcacagctt ccccaaggct gaccactggc cctgaccatg ggctccggcg 30900 gctcccgctg cctcttcagg gctcctgcgt ttccttcctg gccctgagtg ttgcctctta 30960 tcttacaaag cccccagcac cgggtgggtg tggtaacagt ggccctcctg tctgagtagc 31020 cctagtcggc caccctggcc ctggggttcc ccgtgttttc tgggaagcac tgagcaggcg 31080 tggggtcagc ctgggatccg tgccaggaag aagcttccag aacccgattg gccttcctgg 31140 ctaggacgat ccttcatctt ggagcatgag acctgggtct ccctcatggg ggaggaaggg 31200 gctggggggg ggctccaggc tcagcctcac caactttcct tccagaccat cagtgcttac 31260 tatgcaaggg ttgccgcccc tgggtccacc ggcgccacct tcctggcggt ctgccggggc 31320 aaggtgagct ctccagggcc ctctgccctg acctggttgc ctgttccctg gtgggtgctt 31380 atggctcccc agcagactct gggccctggg ggctgcccgg tcccctcctt gggtcccacg 31440 agagcgactg ctggccctgc tgggagcgtg tcctgctctg ggcctgggca ggcaggatgg 31500 gagtttcctg gccacaagag ttggaggtgg cgtctgggag ctgtggaccc caagtggggt 31560 cctgacccac agatggagct tcctcccacc cctggttggg gacggagcct cggggaaggt 31620 ggctgggctg ggtgtgggca ccagggagag gagcccccac ggccccaggc agctccctgg 31680 tgtgtcccct aggccagcga ggggctggac ttctcagaca cgaatggccg tggtgtgatt 31740 gtcacgggcc tcccgtaccc cccacgcatg gacccccggg ttgtcctcaa gatgcagttc 31800 ctggatgaga tgaagggcca gggtggggct gggggccagg tgagttacag cagggtgggg 31860 ctggggtaag gcggtctggt gactgagccc ccgccccgtg gccaagggag cccccgtgac 31920 cgagccgcct cgccccacag ttcctctctg ggcaggagtg gtaccggcag caggcgtcca 31980 gggctgtgaa ccaggccatc gggcgagtga tccggcaccg ccaggactac ggagctgtct 32040 tcctctgtga ccacaggtgc gtgcagtccg gtggcaggcg cggcgccagg ggacacgccc 32100 acaccccact gggcccctgg actctccttc cccacatgag gccccgtctc ctccagagcc 32160 tctccggcta ctcggggtca gcgtggggcc cctgcagcag atgagggtct tcacttcggt 32220 gaactgaacc cttgaagcgg ctgtgggcag ggcagcaggg ctatggccac cccccaggtt 32280 cgcctttgcc gacgcaagag cccaactgcc ctcctgggtg cgtccccacg tcagggtgta 32340 tgacaacttt ggccatgtca tccgagacgt ggcccagttc ttccgtgttg ccgagcgaac 32400 tgtgagttcc tgcccaggga ggggatgagg gtgttgtccc cagaggagcc agaaatgggt 32460 ccacccaccc ccatggttct gcagatgcca gcgccggccc cccgggctac agcacccagt 32520 gtgcgtggag aagatgctgt cagcgaggcc aagtcgcctg gccccttctt ctccaccagg 32580 aaagctaaga gtctggacct gcatgtcccc agcctgaagc agaggtcctc aggtgcggac 32640 gggcagcgct gggtgggcgg tgtgggggtg gcggagcggg cggcgtgggg cgggcagcac 32700 caggcgccca gggcggaggc gactcacctg gctttgtgcg cttcccctcc cacctccaaa 32760 ggctgcctct ccctcctagg gcagggcccc cacgggctgc aaccctcccc tacaggcaga 32820 gaacgcccca ggcaaggatg ccccccgagg ctgagactcc ccccaatagc agggaggaca 32880 cccacaggca ggaccccaag tgctgggact ctcccccaag aggggctttg ccacaggcag 32940 ggaccccagc tggggccccc cgtgggcttc actgcgcact cgggtgcccc tgcagggtca 33000 ccagctgccg gggaccccga gagtagcctg tgtgtggagt atgagcagga gccagttcct 33060 gcccggcaga ggcccagggg gctgctggcc gccctggagc acagcgaaca gcgggcgggg 33120 agccctggcg aggagcaggt acagttccag ggccttggga tggacacaga ccctctgtct 33180 cctgaggcca acccgacccc gcccatctgg cctcaggcac ctccccacac acccctgtaa 33240 atcccctgcc tggcaggcag gcgggcaagc gggcggggga tcccagctgc ctggctgtct 33300 gtgggtcctc caccccacct cacccacagg ctgctggctc ccaggtggtg catgccctgg 33360 ccctccgcgg gtgcccccca catcactttg gttctctggc gggtcagctt ggctcagtgc 33420 actcaaggtc gggtgcccct gccactggct gcgcttgagg ctggcctttc tccaggaatg 33480 tgctgcgggt ggaacccagg ttccttcttc cttggggcct tttgccccag aagcccataa 33540 ttcctcaggc caacccgaaa ttttctccct gcttcctgct gggagccatt cccctcttcc 33600 tgcccatccc tgcccttcag gcccctggag tgagctccag gtgcaggcac caggcacctg 33660 tgtccccttc ctgccagccc ctcgctgtgg tcggactgtc ttccctggac ctgctcttac 33720 aagtcaccac ctgcgagcct catgagccgc tggtgtgact tggacaggac caagttgtgg 33780 cactgtcacc ggggtgtgct gtgcccccct cccccgacct ccatcttggc tcagggctcc 33840 ttgggaccat cttccctgtg cgtccaggtg ctttgggacc ccagagtgtg tggttggggt 33900 ctgtgtgtgg ttgtgagctg tgtcctcctc aggcccacag ctgctccacc ctgtccctcc 33960 tgtctgagaa gaggccggca gaagaaccgc gaggagggag gaagaagatc cggctggtca 34020 gccacccggt gcgtgagctg tccctgcacc tgtgccgacc accatagaca cgcatgggaa 34080 cgcagccgtg ggtgccccca gccacggctg gtcccgatgg gaccagggaa tccaccccca 34140 ggagctgatg tccagggcag ctgtgatgct gacggccagg ggctcaagtg tgtggtttct 34200 tctgcagggg gctcatgagt cccagctgga atcaggcccc acccttgggc aggtttggca 34260 tggggcctgc agcactgggc ttggccctgg catttccctc aagtgtggat gcacacctgc 34320 ctcatgtgag ggacacagcc cattcctagc cttggatcaa agaacggagt tatagccgga 34380 gccaggaagc cccctgcctg ctggaaaacc ccaagtgtgg cggcctttgt ccatgtccct 34440 tggcttctgg gaagaactgg gtggtgccca ggcagggctg gtgccatcag gaagtgggtg 34500 gctgctgagg ggcctgggct ggcgagggcc tgggtgggga gtgcctgggc cgcccctgcc 34560 ttggtttcca cgtttccgtg ttggtctggg gtgtgtagag agatgggcac tgctcatccg 34620 gaagcccctc cttgtgcgct gccatcctgg gagcctcagc cgcatccgct gtggggcagg 34680 gggcttgagg gaggaggaga gagacgggcc atgcaggacc cctggcttga ggcagagcca 34740 atctaccctt tgcccattca ctgctctcag ttccctgcca gcctctcact gtgtgacctc 34800 agacgggccc agccccacag ctttcttccc gcagcccctc cctatgtcca tccagccagc 34860 cagtttctca ggcagcagcc ccacctcggc agtcactgtc ccagggaacg ctcaatgttc 34920 caaggaaggc tctgcagccc cagggaccag atgatgaggc tggccctgat ggagcctcgg 34980 gcctgtgtcc tgcaggagga gcccgtggct ggtgcacaga cggacagggc caagctcttc 35040 atggtggccg tgaagcagga gttgagccaa gccaactttg ccaccttcac ccaggccctg 35100 caggactaca agggttccga tgacttcgcc gccctggccg cctgtctcgg ccccctcttt 35160 gctgaggacc ccaagaagca caacctgctc caaggtgccc tggcttgcag aggccaccca 35220 ccctgagggc agtgctgccg ccgcgtgtgg ggtgggggcc atctgggtcc aaggtggtct 35280 ctgttctcta gagaaaaagg ggcagatggg gacagacgcc ccttcctcta caggcttcta 35340 ccagtttgtg cggccccacc ataagcagca gtttgaggag gtctgtatcc agctgacagg 35400 acgaggctgt ggctatcggc ctgagcacag cattccccga aggcagcggg cacagccggt 35460 cctggacccc actggtaaat ggggccccag gtgggaccct cagactcctg cgtggaaggc 35520 agtgtgggcc agagtcctgg gctgcttggg gtgggcatcc tcgggccctg cttggccccg 35580 cctctctgtt cccctatggg agtgatgggg gcctccacct ccaccaccag caccagcagc 35640 accacctcca cctccacctc cacctccacc tccaccacca cctccacctc caccaccacc 35700 tcctccacca ccaccacctc caccaccacc accaccacca ccacctccac ctccaccacc 35760 tccacctcca ccaccaccac ctccacctcc accaccacca cctccacctc caccaccacc 35820 tccaccacca ccacctccac ctccaccacc acctccacca ccaccaccac caccaccacc 35880 accaccacca ccacctccac caccaccacc tgcaccacca cctccacctc caccaccacc 35940 accacctcca cctccaccag cagcagcatc acttgttggg gagaccctgt gcaactccat 36000 gcacagccct gtccctgcca tagccccgac ccctaagcac agccctgtcc aactgccaca 36060 cgtcccctgc ctcccatgca tggtcctggg gggtcaactg cacacgccag ggtcctaggg 36120 tcctagaccc ctgtcctccc tgtttctgcc tctgtttggg gtggagtcca agtctccaga 36180 ggcggaagca tctgtgttcg tgtgttaatg aacagcccct acagagttcc cctagttcac 36240 ccagggggga acctagcctg ttgggacgac cccagatccc ttctgggctt ggtactcact 36300 gggatatcct catgcctgca cccagcctac ggctctgagc tcctgagtgg ggctttggcc 36360 tgcccgccac tgttccagcc cccatccagc aggctggtgt ctcctctgat gcccccagca 36420 cccaggcgtg tacctgcctg ggttttcccg ccctggtctg aggtgggtga ggcctggcct 36480 ccctagccag ccctgccccc ccaccccagg gaactttcca gatgctctcg accagctttg 36540 tggctctaca tctcttcatc aggaagaacg gcgccggatc ccaagctgac cgtgtccacg 36600 gctgcagccc agcagctgga cccccaagag cacctgaacc agggcaggcc ccacctgtcg 36660 cccaggccac ccccaacagg tagctgactc ctgaaccgtg tgcagcctac gacttggtgg 36720 gtccctcagt ggcttcacga ggctaactct tgagtgtggc cggggctgcc cctgtgggga 36780 gccatctcat ggtggggact gctcccggtt ctgcaccccg cagttgtcct gagcagctct 36840 ccaggagttc ctggaggaag ggcgggcagg gcggtgggac tctcagtcct ccaccccagc 36900 gccactctga gccatgctac tcccacacca ggagaccctg gcagccaacc acagtggggg 36960 tctggagtgc ccagagcagg gaagcagggc cagcacgccg tgagcgccta cctggctgat 37020 gcccgcaggg ccctggggtc cgcgggctgt agccaactct tggcagcgct gacagcctat 37080 aagcaagacg acgacctcga caaggtgctg gctgtgttgg ccgccctgac cactgcaaag 37140 ccagaggact tccccctgct gcacagcaag tggccctggc gtggggaaca gccggtgggg 37200 tggggggcag gggacaaaat gggggctgtg ccgggtctga ttgaagctcc ccgcagggtt 37260 cagcatgttt gtgcgtccac accacaagca gcgcttctca cagacgtgca cagacctgac 37320 cggccggccc tacccgggca tggagccacc gggaccccag gaggagaggc ttgccgtgcc 37380 tcctgtgctt acccacaggg ctccccaacc aggtagggca cctgcctggc tgctcctggc 37440 agcgccccaa ccgcacgcag ccctgggagt gagcagcaaa gccccaggcc cccctcagac 37500 tcaagtctct gtctccaggc ccctcacggt ccgagaagac cgggaagacc cagagcaaga 37560 tctcgtcctt ccttagacag aggccagcag ggactgtggg ggcgggcggt gaggatgcag 37620 gtcccagcca gtcctcagga cctccccacg ggcctgcagc atctgagtgg ggtgagcctc 37680 atgggagaga catcgctggg cagcaggcca cgggagctcc gggcgggccc ctctcagcag 37740 gctgtgtgtg ccagggctgt ggggcagagg acgtggtgcc cttccagtgc cctgcctgtg 37800 acttccagcg ctgccaagcc tgctggcaac ggcaccttca ggttggtgcc tggccactac 37860 agttcctgct gggtgtagcc ccaggtgatg ggctgagggg gaaagggcag gcccttgtcc 37920 tggtggcaac gcctggcaga cgtgtgcagt gggccggttg tctcacaggc ctctaggatg 37980 tgcccagcct gccacaccgc ctccaggaag cagagcgtca tgcaggtctt ctggccagag 38040 ccccagtgag tgcccacgga ggcccccagc acacccaacg tggcttgatc acctgcctgt 38100 ccagctctgg tgggccaaga acccacccaa cagaataggc cagcccatgc cagccggctt 38160 ggcccgctgc aggcctcagg caggcggggc ccatggttgg tccctgcggt gggaccggat 38220 ctgggcctgc ctctgagaag ccctgagcta ccttggggtc tggggtgggt ttctgggaaa 38280 gtgcttcccc agaacttccc tggctcctgg cctgtgagtg gtgccacagg ggcaccccag 38340 ctgagcccct caccgggaag gaggagaccc ccgtgggcac gtgtccactt ttaatcaggg 38400 gacagggctc tctaataaag ctgctggcag tgcccaggac ggtg 38444 <210> 2 <211> 37214 <212> DNA <213> mfascicularis <220> <221> misc_feature <222> (4525)..(4624) <223> n is a, c, g, or t <220> <221> misc_feature <222> (4914)..(5013) <223> n is a, c, g, or t <220> <221> misc_feature <222> (9472)..(9571) <223> n is a, c, g, or t <220> <221> misc_feature <222> (16613)..(17049) <223> n is a, c, g, or t <220> <221> misc_feature <222> (19812)..(19911) <223> n is a, c, g, or t <220> <221> misc_feature <222> (35806)..(36357) <223> n is a, c, g, or t <400> 2 atgcccaaga tagtcctgaa tggtgtgacc atagacttcc cattccagcc ctacaaatgc 60 caacaggagt acatgaccaa ggtcctggaa tgcctgcagc aggtagagca caggctggga 120 ggaaaggact gcaggcaggt ggagctgggg ctgggtgtgc gtccctctcc cgacccattc 180 cagccaggcc cctccagagg cagcctctgt cataaaaagg ctggtgttcc aggtggggtc 240 agagagagga ttgacaagta aaaacatcgt ccttgagagt gacagactta gtgccttggg 300 ggcctctgag gagcggctgg tattcacagg tcaggaggaa gcatttccat cagaggggca 360 gccgggggcc agcctcactt tgaaggtctt tgaacctttg gggtgcaggg aggtggcagc 420 ggcgcaggtt gccttctcct gggttccttg aggtgccctc ttgtacccgg ctcacacccc 480 tcccctcccc gagtttcccg ctcaggttcc catctgagag ctcgtatgta ggacatcaga 540 taggacagcg taagtgtttg gatctggaaa cacagaacag tttcctattt tgagacttga 600 tgcctaatta gtcatcttac tatttaggct gaaaaatact gttgcatttc gggtaacgtt 660 ctgcaaatgg tctgctgatg gcagctggag ttgcttcacg ccctttaggg caagagtgga 720 aagtgtcctg cggacttatc catggtcccg tggggctctc gccacctgac agcggcctct 780 gcatctgcga agagctgccc actggctgct gaggcttgtc tcagggtggt ttgtgtggcc 840 ttgcctcttc ctggcttccc cgtaaccctt gcccccaact ctgttcagaa ggtgaacggc 900 attctggaga gccccacggg cacggggaag acgctgtgcc tgctgtgtac cacgctggcc 960 tggcgagaac acctccgaga caccatctct gcccgcaaga ttgccgagag ggttcaaggg 1020 gagcttttcc cgaatcaggc cttgtcgtcc tggggcaacg ctgctgctgc tgctgaagat 1080 cccataggtg accctagttc ccaggccttc cctgacctcc tgtggggatg gctggcaagg 1140 gatggcgctg agggtagggt gggcccatgg ggacttctgc cagcagagct caaggagaat 1200 tttgtagctg ccacataatt tctcgccatc gtgggtataa acctagggtt gggctttttt 1260 gctgaattag ggcgtggcag gtgtacactt cgcccgtttg tgataaacga gtctctgggg 1320 tgtcagattc ttggctgtct gcagggctga gttagccgaa tgccacccgc ctttaacacg 1380 tgagaaccat gacctctgtg cttgcttgtg tctgggcagc ttgctacacg gatatcccaa 1440 agatcattta cgcctccagg acccactcgc aactcacgca ggtcatcaac gagcttcgga 1500 acacctccta ccggtgggtc agacgagttc acgcctgtct tggggtcctc gagagaacca 1560 gcttgacgtg gtgctgggtc cacagaccac gctgtgctgt agtggagggg gcggtctttc 1620 cagacgctcc ccagaagtat gcagtgtgct ggtgcccagg ggtggggcgg ggcccgggct 1680 gtccctagtg cccattactt gtgaggaggc agctttgcat ttgtgtgctg accttgggct 1740 ggcgtcctga gctcctttca ggtgctgttg tggcagctgt gtggcaggtc agggccggcc 1800 cccagtgcag ctttgcacat gaagtgggag gaggccctgc cgcttgtcag agccctgcag 1860 agtcttggtg ttctgtcggg ttcctgtgga ggggccgatg gcggggtgct gtggaagctg 1920 tcgaatctcg tccctctgtc cagttccccc gcttgtctcc ttgctccctc ctactcccgg 1980 gccacgatcc tatgccgggg ccactctcct gcacccggac cacgctccta cgcccaggcc 2040 actctcctac gcctggacca cattgcagtt atgctgactt cctctggctg ccagtgctcc 2100 tgtgtgtctc catacagctc acgctgcggg accacgctgt ggctgttgga ggcagctcct 2160 cctccaccca tagtgctctc tccctccagg cctaaggtgt gtgtgctggg ctcccgggag 2220 cagctgtgca tccatccaga ggtgaagaaa caagagagta accacatgca ggtgggctcc 2280 tggctcccgc tccggctcag ggttccgtga ggcgagtgct gctgggtatc cagagtccca 2340 ggctgtgctc ctgctgggct ggggttcgaa gttcactggg ggactgcagg cgagggcctg 2400 gtgggggtgg ggactggctc gggtcctttc ttggccatac tccagccgcg cactctgccc 2460 ttcctcccgc agatccactt gtgccgcaag aaggtggcaa gtcgctcctg tcatttctac 2520 aacaacgtgg aaggtacagg cagctcggtg ggaccaggct tgggttggag tgtgtgcagc 2580 ctctcagggc gtcagcctgg ttgtgcttgc cgggtggggc ggccagtgca gccgtgtacc 2640 tgggcactgt cttctgactc gggaccaccc gtgttagtct tctgtgtgga agagctcacc 2700 cagtggtctg agacagccag ccggccggac tgcctgtggc tggtgcctgg ggccttggat 2760 tttgggaagg ctccctccat ttccggacga gaagggctcc ctgcacctga ctactggtgc 2820 atacagcagc ggttttgctg aacacctgct ttgtcttcgg ggagcctgag gttttgttgc 2880 ttgcccagca gcgggtgctc ctgtgaccgg cccttgtacc atcttgggag ggtgtcctgg 2940 aagccgtgtc tggcctcccc cgaccttgcc gcatgtgtct ttgtcctgtg ctgacgttgc 3000 agagaaaaat tacagccccg agcgtgactc caggctgagt cctgtgggtc cgacacggga 3060 ggccttgggg cctcttcagg agacgggatg agtgagtgat gggagcagag ccagggcacc 3120 tcgccctgtg actgcaggtg gccacagcct gtgagggcca ggggtgcttc tccacccacg 3180 tggctgcccc tcgggtatgt caggggcttc tggggctctt cacgaggtct cagagacagt 3240 agcagggtgt gcccccgtcg gctgccctta cagtttctgt gacctgaggg tggcatctgt 3300 gcggttggca tggcctgagc ttctgtggga tcagagttcc ctttgtttcc tgcctcagtt 3360 ggggctcaag cctcaggtga cgtggccctg gagcacctgg aaggcgtcgg cggtcctgcg 3420 ggctgctgtc tgcactcgtg tttgctgagt gctcagtatg ccaggactga ggaccctgaa 3480 gctgctgtta tatttaggac ggttctcccc tggcagagac ggagccgggt ggtcccgcct 3540 gacccaccac caggcgtttc tgggccctgg agggacaggg tgggcggaac atgggcctgc 3600 agggagacct ccacttactg gaggctcgtg ctgtgttgct ggaggcatct tctgtgttgc 3660 ttcttgtttg ctgtgtcttt tgttctggtg gcaccaagga cctccagtca ccttgatgtg 3720 tggttgtcca ggcctttttg gtggtcctga gaaggggtct gaggggctct gcctctgccg 3780 ccaggttccc tgatggaagc tgcccactcg tcctggtggt gcccacagga cgtgactctg 3840 gcacaggagg gcagatgtgc tgttggagat tctcagcccg tcgtcgtcat ttccaaagtc 3900 ctcacccgca tttctgggac aggacaggag tgcctgctgg gtgtccccgg tcccatgcag 3960 cgggggtcct tgggatagtg tggaacgctg agtgtgggcc tgtccggcgg tggtcctgga 4020 caagggtagc acccctgtgg ccgccgggcc tggtgcctgg tgcctagcgg ggaggccgct 4080 gaccgcctcc tgtgctgctt ccatccgtgt caggcctctg ggtgttgggc ccccatctgt 4140 ctccccccag gcctgtggga tcagtccaag aagactcaat ccagccccag cctgtccccc 4200 ttggcttggg ctctcactgc ccgacctggc aggaggttgc ctagcggtga acctttgcat 4260 cctgtctgcc ccctggacag gctctgaggg ggtgtctgca acacctgtgc cagcctgggc 4320 atcttttttt tttttttttt cttttgagac gaaatctcgc tctgccgccc aggctggagt 4380 gcagtggcgt gatctcagct cactgcaagc tccacctccc gggttcacgc cattctcctg 4440 cctcagcctc ccgagtagtt gggactacag gtgcccgcca ccatgcccgg ctaatttttt 4500 gtattttttt tctttttttt tttgnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4560 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4620 nnnntttgag acggagtctc gctatgtcgc ccagggtgga gtgcagtggc cggatctcag 4680 ctcactgcaa gctccgcctc ccgggttttt acgccattct cctgcctcag cctcccgagt 4740 agccgggact acaggcgccc gccacctcgc ccggctagtt ttttgtattt tttagtagag 4800 acggggtttc actgtgttag ccaggatggt ctcgaactcc tgacctcgtg atccgcccgt 4860 ctcggcctcc caaagtgctg ggattacagg cttgagccac cgcgcccggc cttnnnnnnn 4920 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4980 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnttttgta tattttttta gtagagatgg 5040 ggtttcaccg tgttagccag gatggtctcg atgatctgac cgcgtgatcc gcccacctcg 5100 gcctcccaaa gtgctgggat tgcaggcttg agccaccgtg cccggccagc ctgggcatct 5160 ttagagtggg ctgcagctcc tggaggggtc tgagaggaag gaaggcaggt attttgtgaa 5220 tgaagagaca gctagagagc tggcaccctt cctggcctgc gtcctgtgag gactctggtt 5280 ggggacagca agcttggggt tagcctgggg cagagcctct gggaggcccc tgccccttgt 5340 cccccttccc cttgcagctc ctgtcctcgc cccgccctca gctctctgcc agggaaggtt 5400 tggcaagtgc cgctgtgcgg cagtgcgtgc tgattggctg gtcgttgcta tggtgccgct 5460 cagggatatg cttttcctcc cctgccttcc ctgctatccc tgggagcatc tggagttgag 5520 tcatcgctgg tgtgtgtgtg tgtgtgtgag tgtgtgtgtg agtgtgtgag tgtgtgtgtg 5580 cgtgtgtgtg tgtgtgtgtg agtgtgtgag tgtgtgtgtg tgagtgtgtg tgtgagtgtg 5640 tgtgtgtgtg agtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgagtgtg tgtgtgagtg 5700 tgtgtgtgtg tgtgtgtgtg tgagtgtgtg tgtgtgtgtg tgtgtcagtg tgtgtgtgtg 5760 tgtgtgtgtg tgtgtgagtg tgtgtgtgtg tgtgtgtgtg tgagtgtgtg tgtgagtgtg 5820 tgtgtgagtg tgtgtgtgag tgtgtgtgag tgtgtgtgag tgtgtgtgtg agtgtgtgtg 5880 agagtgtgtg tgagagtgtg tgtgagtgtg tgtgtgtgag tgtgtgtgtg agtgtgtgtg 5940 tgagagtgtg tgtgtgagtg tgtgtgtgtg tgtgagagtg tgtgtgtgtg agtgtgtgtg 6000 tgtgagtgtg tgtgtgtgtg tttgtgcccg tgtgcgcctc tggcctctgc agctgagtcc 6060 tggctctcag ggggcctggc acctcccggg gatgggcaca aagcagccac gatgcagccg 6120 ggagctgggg aaggccccat tgccccacac ggctgcccta agactctggg gtgcttcttg 6180 gaagaggtcc ttgcttctgt ctgtgtttaa gcagctccct aaggagttct tgtggttcca 6240 ggttgggggc ctgtgctgtg gaggcgaggg aggggcagga cccccaactc cctgaagcct 6300 tttctggcct ggtcctctca gccagcatag gcagggccct ttcccagggc tgccatgctg 6360 cagaggggag cgggccacta tgtagcctag gaaaacctga cgttccttcc gctggcagtt 6420 ctgggcctgt tgtggttggc agggaagctg agccacggtg ctcatcacag gggcacctcc 6480 aggatttttg ggagatgcct ccgtgggctg gggcgatacg ctgaggagct gttcttccct 6540 gccctgagga gggctgagtg tagccgtcac ccctgtcctg tcttgggctg tctcagggag 6600 gatgcataga accctcggaa ccctgctggc ccttgtctga tccaccctca acctcaggcc 6660 ttctaggggc acaggagggc tccgtcggga tcactgcggg tgggggcctc ccttggacac 6720 ctgagaccct caatgggtgc tttgtggcac gttcatgatt ggggcggggg gcacccagcc 6780 ctgcctgccg tgtaggagct gttctgtcct gggcgtccct ctgtggttgg gacccggagg 6840 gtgtgtgttt accccgcctc acacctgcag agaaaggcct ggagcaggag ttggccagcc 6900 ccatcctgga catcgaggac ttggtcaaga gcggaagcaa gcacaggtga gacccctcag 6960 tgaggccacg accactgtcc ttccatggcc cagctctcct gtgacctgtg gaggcccaga 7020 tatgtttctt cccttttctt tgttcctttc taagtcgtga aactaaccac cgtttagtgt 7080 gagaaagttg aagcagctct gaggaacgta gagtaaaaag cgaaaccgcc tccctcttcc 7140 ctggccgtca gccaccccag gagccaccgt ggagcgggga cagagccctg caggctcgtg 7200 tctgtgtgga agcacgcacg gttttgtctg cacagactgt tctgcagttt gccgttttca 7260 ctcagcgttg tgggtagctt cgcatgctgg tgctggtcgt ccggcttcgt tcttctgagg 7320 acagcaaata tgtcctttgt ccacctcttt tatagtttca gagattcaag ttataataaa 7380 gcttttctta tattgagggg gagagctcct gcccctcttt ttttttttag acagagtctc 7440 gctctgctgt ccaggctgga gtgcagcgtc gtgatcttgg ctcactgcag tctcaacctc 7500 ccaggctcaa gtgattctct cagctcagcc tcccaagtag ctgggactgc aggcatgcac 7560 caccacgcct ggttaatttt tgtatttttt gtacggacaa ggtctcactc tgttgctcag 7620 tccagtcttg aactcctgag ctcaagagtt ccacccgcct cggcctccca aagttctggg 7680 attccaggcg tgagcaccac gcccgaccca gctctgcttt gttttagtgg ttctgtttgt 7740 gtttgtttct gatgacctct atccaggaat agggttggtt tttcttttcc atggagtttt 7800 taaagagatg atgatttaca tggtttaaaa ctcatgtgga ctccccgtcc atcccagaca 7860 gcggcttccc acctggaccc catgctcagg attagggctc cttccgggtc agaagatgtg 7920 gcggccccgg cctcgggtca ccgtcccctg cacggggtgc tcacagcatc ttcccctctc 7980 ctcgttccca gggtgtgccc ttactacctg tcccggaacc tgaagcagca agccgacatc 8040 gtcttcatgc cgtacaatta cttgttggat gccaaggtgg gggctcagtc tgcgtcgctg 8100 acaactcctg atgtccaggg gggttcctgg gcttgggaaa ggccgtccga gcctttgctg 8160 ctgcagggac ttagagcagc aggcctgggt gggagagctc acctgtcact gggcaggggc 8220 tcaacctggc cagacacact tgtgagcacc cccaggccct gggtcagttg ttctgagcaa 8280 tctgggagtg ggcaggctgg tgggagtgag gagaggcctc caggctgtgg tccacaggcc 8340 agcgcccact cttgatcctg acagctcagg ttctctcctt cacgtccgat cacaggaagc 8400 aaagcactga gaacacggga agcccactca ctcccctcct cccagcccca cactcactcc 8460 cccccatgcc cggccccaca ctcacttccc tcctcgtagc ctgtactcac ccacatgctg 8520 ttgtgcccca cactttttat ttagtgcagg tggcatctcg ccgcgggtca gtgacttgtg 8580 ttcacgtggc gatgacgtgg tgacgcttcc agatccctcc attggtttgc tcattctcag 8640 ggtgtatatt tatcaagagc ccatcgtgct gggggctgtt ctaggcatag caagactggc 8700 ttcattcatg tggagctttg attctagcgg tggggacagg tagacagcag aagagtaagc 8760 ccgtgagccg atgagactga agagaagtag agcagagcga ggaggtggag acagagccga 8820 gtgggcaggg cccaagtgcg atgtcggcag gagatgggga atgctgatgt gtctgagggg 8880 agcccgagct ggtgcagcag agcaagggag gaggcggggg gccgactcct gggcagcgat 8940 tgtagaaccc cacggagagc tggtgaggtt tgccgtggtt gcaggtgact cggtgctttg 9000 agccgtggct gcccctggga accacctgga gagcttctaa cccaaccagg cccttccctg 9060 ggacaattct gtcacagctg gtaagctaag tccaacactt tcacggaaac acagaagatc 9120 taaaacggca cgatgaccgt gaagaacaga gctggaggac tcacctcact ggtttcaaga 9180 ctcctctaaa actgcaggag tggaggtgga gacggctcag ctcaggcaca agcctgcagg 9240 ccatggagaa ggcagcaagc tccagctgac ccacacgctt gcggtcattg tttttttttt 9300 ttagttggaa tctccctctg tcaccccagt tggactgcag tggcaccatc tcggctcact 9360 gcagccccca cctcctgggt tcaagcgatt ctcccacatc agcctcccga gtcactggga 9420 ttacaggcgt gcgccaccac gccctgcccg tgatgattgt tttttttttt tnnnnnnnnn 9480 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 9540 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nttttgagac agagtctcgc tgtgtcgccc 9600 agggtggagt gcagtggccg gatctcagct cactgcaagc tctgcctccc gggtttttac 9660 gccattctcc tgcctcagcc tcccgagtgg ccgggactac aggcacccac cacctcgccc 9720 ggctagtttt ttgtattttt tagtagagac ggggtttcac cgtgttagcc aggatggtct 9780 cgaactcctg acctcgtgat ccgcccgtct cggcctccca aagtgctggg attacaggct 9840 tgagccaccg cgcccggccg atgattgttt tttgacaaat gcgccaatgt aattgagaga 9900 ggaaatgaag gttgattttt ggttttctga aaaagtggtg ctaagaacag ctggatatct 9960 gtttggaaaa cagcgaatct taactcttgc tttactctat ataaacctaa atgtaaaagc 10020 taaactaaag gttatagaaa gaaacatggg ggggtctttg caactctggg gtaggcagag 10080 attccttagt gtggatacat aaggcactag ccgtgaagaa aaacataaaa tttggatttc 10140 accaaaattt aaagcttcaa cacttgagaa gacttgagaa aattaaagag cagttatgga 10200 aagggagaaa atgcttctgt ctttcagagg acttaaaaaa catttttcag ccctcctcat 10260 attttaaagg acctttgacc agagtatgta aaattctctc ataactaagc aaaaaaccca 10320 tttaaccagt gggaaaggat ctgcacagac gtttcaccaa gatggacgga gtggccagtt 10380 gggcacatgg aaggacgccc agcatctcca gtcacaggag aaggcagatt aaagccacgg 10440 ggagccggca ctacggtccc gctagcatgc tgaaattcag aagcctgagt gtggcacgag 10500 gaggtggaac agctggatct catccattgc tcctaagctg tgaagctgtg tagccactcc 10560 acaaacacgt gtggcgaaca gccgaaccgg gagaagggaa gacgtgttca aagatttgtg 10620 tgtggccagg ctcagtggct cacacctgta atcccagaac tttaggggcc aaggctcagg 10680 gatcgcttac gcccaggagt ctgagaccag cctgggcaac atagggagac cccatctcaa 10740 aaaaaaagaa aaaagaaaaa aaaagactta aatgtgcaag tttaccagag ctttgtttaa 10800 gttgccagaa ctgggaagcc gcccacgtga gtccatccac tggtgaacgg acaaaccgtg 10860 gttcgcaaac cccaacagca gccgcgggca tgggctgtgg tcacacagca gcagggagcc 10920 agtgagtctc agatgtgcta acccagaggc caactgagga ggacctactg ttttttgttt 10980 tttgattttt gttttgagac agagtcttgc tctgtggtgc aggctggagt gcagtggtgt 11040 ggtctcggct cactgcagcc tctgcctctc gggttcaagc agttctcctg cctcagcctt 11100 ccgagtatct gggactacag gcacccgcca ccacacccgg ctaatttttg tatttttagt 11160 agagacggca tttcgccatg ttggccaggc tggtttcaaa ctcctgacct tgtgatccac 11220 tcaccttggc ctcccaaagt gctgggatta caggcgtgag ccaccgcacc cagctggacc 11280 tactgtttta ttccgtttat atgacgctgt attaatagaa gaggcagggg tagagctggt 11340 ggttatgtgg tgcacttaac tgccagaact cagtaccctt aaaatgggca tcttaatgtg 11400 tgaaaactta aaagtaccaa agctggaccc caccccagct tgctcccatg acactctgtg 11460 gtgggacctg ggagttgggg tttttttttt tttttttcag atggagtctc actctgttgc 11520 ccaggctgga gtgcagtggt gcaatcttgg ctcactgcaa cctctgcctc ccagattaaa 11580 gcgattctcc tgcctcagcc ttctgagtag ctggggttac aggcgcacac caccacgccc 11640 ggctaatttt tgtgttttta gtagagatgg ggtttcacca tgttggtcag gctggtctcg 11700 aactcctgac ctcatgatcc acccgcctcg gcctcccaca gtgctgggat tacaggtggg 11760 agccaccgcg cccggcctgg agttgggttt gtaaatctcc ctgagtgggg ccggggcaga 11820 gaactgctgg gtctgggtct tcctggctcc tgtggtctgt ggctggctga ctgcggtggc 11880 cgggggctcc caggacgtcg tggccgtccg tcttgctgag cgtggcgcgt gcctttccat 11940 gctgtgcgtg agcgtctccc ggcgtggcga gctgctgctt cgggtggggc ggtgttgcca 12000 ggttgccatc cagatctggc ctctcctctc cacgtcgccg gcggtgtttg tcatcggcac 12060 ttgcgatgtt cgatgccggc cacatgtgcc ttggtttccc tccttcctgc ccctgtgagc 12120 tccagcaccg tgtcccttct cttcctcctg tagagccgca gagcacacag cattgacctg 12180 aaggggacgg tcgtgatctt tgacgaagct cacaatgtgg tgagtctcca ctgcctccta 12240 aacgcctcct gtttcttcaa gagcagcgca aacctttctg gaggggctct ggccaaaccc 12300 ttgcagcctt cggtgcccag gactgaggac tgagcacccc aggagcttct gcaccccttc 12360 ccactctgat ccgatgcctc tgctggggct ggagactggc cagctgggcc agggacctgc 12420 ccctcaggcg cagggccccc acaggccgct ccccaggcct tccctctagc cagctagggg 12480 tcagcctggg ccaggggtgt ctcctctgcc ctcggcttct gtcaccaggg cagcagcagg 12540 cgtgtggtct cgcctgcagt gtctctgccc ttccggccac atggcctgag gctgaggcag 12600 aattgcttga accctggagg tggaggctgc ggtgagccag gatcacaccg ctgcactcca 12660 gcctgggtga cagagcggga ttctgtgtca aaaaaaaaaa aaatgttgac tgggcgcagt 12720 aggtcatgcc tataatccca gcactttggg aggccgaggc gggcggatca tgaagtcaag 12780 agatcaagac tatcctggcc aacatagtga aaccccattt ctactaaaaa tacaaaaata 12840 ttagctgggc gtggtggtgg gtgcctatag tcccagctac tcaggaggct gaggcaggag 12900 aattgctcga acccgggagg tggaggttgt agtgagccaa gatcacacta ttgcactcta 12960 gcctggtgac agcgagactc cgtctcaaaa aaaaaaaaaa aaaaaaaatt ggcaactcca 13020 ttgaaataat tgtttgtttg tgttttgaga cagggtctca ttctgtcgtc caggctggag 13080 ttcagtggtg tgatcttggt ccactgcaac ctccacctcc tgggctcaag ccatcctcct 13140 acttcatcct cccaagtaac caggactaca ggtgcacacc accacgcctg gctaattttt 13200 gtattttttg tagagatggg gttttgcatc attgcccagg ctggttttga actcctgagc 13260 tcaagtgatc tgtccacctc agcctcccaa agtgctggga tcacaggtgt gagccgctgc 13320 gcctggcctg aaataatcgt ttctcaatat tggtgtgggc cagacagtcg tgtttggacc 13380 tgcttgtggc ctggccttag agaccccagg gcgtggcttt ggggacttgg ctgtcagcct 13440 cctgtgcctt ctgcacccaa ccccattcct gctttctgga acccccgatc ctatcctgct 13500 ctgtggtgat ccgggtgatt tgggctcccg atcctatcct gctctgtggt gatccgtgtg 13560 attcgggctc ctgatcctat cctgctcggt ggtgatcccg gtgattcggg cccccgatcc 13620 tatcctgctc tgtggtgatc cgggtgattc gggctcctga tcctatcccg ctctgtggtg 13680 atctgggtga ttcaggctcc cgatcctgtc ctgctctgtg gtgatccggg tgattcaggc 13740 tcctgatcct atcctgctct gtggtgatcc cggtgattcg ggcccccaat cctatcctgc 13800 tctgtggtga tcccggtgat tccggctccc gatcctgtcc tgctgtgtgg tgatcccggt 13860 gattcgggcc cccaatccta tcccgctctg tggtggtccg ggtgatttgg gctcctgatc 13920 ctgtcctgct ctgtggtgat ccgtgtgatt caggctcctg atcctgtcct gctcggtggt 13980 gatcccagtg attcgggccc ccgatcctat cctgctctgt ggtgatccgt gtgattcggg 14040 ctcctgatcc tatcctgctc tgtggcgatc ccggtgattt gggctcccga tcctatcctg 14100 ctctgtggtg atctgggtgt gctcggactc caggagaaga tgtgtgaaga atcagcgtcc 14160 tttgacctga ccccccatga cctggcttca ggactggacg tcatagacca ggtgctggag 14220 gagcagacca agactgtgca gctgggcgag ccccacccgg agttcagcac agactccccc 14280 agcccaggtg cgttcatagc caggctgctc ggtcctgagg cctgcgctgc tgcagggggc 14340 agcctgccct gtggctgtgt gtggtcggcc tgggcactgt ctgttcaggc tggcactgca 14400 gggcacccac ttctctcaga ggcttctcgg gtgtgaattg tttggggtcc tgtaggctgt 14460 ggaagggctg gtatcgttca gtagttctgg tattttccga agacctatgt cttctcccag 14520 ccagtgtcaa cttggcctct actgtgtaaa attagagaac tatactttgt gaagctgaga 14580 tgggagcatc gcttgaggcc aggagttcga gaccagcctg ggcaacatag cgaaacctcg 14640 cctctgccaa aaaattagcc aggtgtggtg gtatggtcct gtggtcctgt ggtcagagct 14700 tttctggagg ctgaagtggg aggagctctt gagcccggga ggcagagctt gccccagatg 14760 gctccactgt actccagcct gggtgacaga gtgaggctgt ctccaaaaaa aaaaaaaaaa 14820 aaagtaaaac taactatatt cactgtaagg gcattttgcg tgtttaaatg acccacacat 14880 cgggcctgca tcacttgctg tgcccgtaga ttccttccca gtgttcgtcc agaggcgtat 14940 ttccacacag cgctagtcac ggcgtacgtg gaaaacgcgg aaacccccat ggatgtggtc 15000 ggttggtctg tactgtctgt gttttcttcc tttctttttt tttttgagat ggagttccac 15060 tcttgttgcc caggctggag tgcaatggtg cgatcttggc tcaccgcaac ttcctcctcc 15120 caggttcaag tgattctcct gcttcagcct cccaagtacc tgggactaca ggcgcgcgcc 15180 accacgccca gctaattttg tatttttagc agagtcaggg tttctccatg ttggccaggc 15240 tggtctcaaa ctccaggtga tccgcccacc tcggcctcct gaagtgctgg gatccaggcg 15300 tgagccgccg cgcccggcct gtgtcgtgtt ttctgcgtgg cctctgtaaa cagctgacta 15360 ggagtctgtg agcatcttca ttggttccgc tgtgacttgc gtgtgagcat ctccagcatc 15420 agctttcctc attttccttt aaaatcgcac atgtggatgg acaccatggg gaccctggac 15480 cctgggcagc ctcgtcctca cctttctcac cagggtggct gcttgggaga gagtgagttt 15540 gcgaacttgg catttgttct ggctgtagga tccgtttata tatatacata tatttaagtg 15600 acagggtctg actctgttgc ccaggctgga atgcggtggc gtgatcttag ctccctgtag 15660 cctcagcctc ctgggctcgt ggggtcttcc cgtctcagcc tcttaaagca ccgggaccgc 15720 aggcggtcgc cactgccatc ggatctcaag gctgccacgc agggcgctgc agtaggggaa 15780 ggggttcctg ggactttgaa cgctccacct ccctcttctc cacagtcccc caaccccacc 15840 tctaactggg agtggatggc cacctctttc catcctttgc ctggcgcagg gtggggagaa 15900 tgacaggtct ccttcccgca tctcggcagc tgccctttcg tcggttatat gacgtgggag 15960 agaccccggc cacccccagg gctgtgtgac gtgggagaga ccccggccac ccccagggct 16020 gtgaacaccg ccacaggggc cttctccact cttcagtttt gttagttacg tgacgtgcag 16080 ggcttttcgt tgtaactagt gggggacgtg tggtgagggg ggcttctgcc gtctcattca 16140 ggaccggaac ttcagttttc atcgctattt gtcctcctac gcctttggag atggggtctc 16200 gctctgttac ccaggctgga gagcagtggt gccatcaggg ctcacggcag cctcctcctc 16260 ctgcagcctc cgcctcttgg gctcacacaa tcctcctgcc tcggcctccc aaactcctgg 16320 gacgactaca gacgtgcgcc accgtgcttg gcagggttca ttcttttcct cacactttat 16380 ttattggaga gcccggtaga gcgcccggtt tgcacgatct ggttgttgag acgttgagag 16440 gaaccctgcg gagtctgaat ctgggtatgg gaggggcagt cacacgagtt ccccggtgtc 16500 ctcgtctcct ccgcacttag gtgcccttag gtggcttgag gaccccagtt agactggggc 16560 caccctttgc ctggctccag gcgggatgtc ctttcttttt tttttttttt ttnnnnnnnn 16620 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16680 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16740 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16800 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16860 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16920 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 16980 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 17040 nnnnnnnnnc tgggactaca ggcgcccgcc acctcgcccg gctagttttt tgtatttttt 17100 agtagagacg gggtttcacc gtgtcagcca ggatggtctc gatctcctga cctcgtgatc 17160 cgcccgcctc ggcctcccaa agtgctggga ttacaggctt gagccaccgc gcccggccgg 17220 gatgtccttt ctatcaggag gctcacagta tctgctttcc agtttcttct gatgttaatg 17280 ttgttgctgc tgaacacctg actctgttga ttattggggg attgcaagat ggtagtgtcc 17340 caattctgtc gcttagtcag ttagcaggaa taatctagca ccatgctctg catcgcatca 17400 gccgtgtggt gatcccattc acacaggaaa ggcgggataa atgctggctg tgggccgggt 17460 gtgctgtccc gcatctgtaa tcccagcact ttgggaggcc agggcggtcg gatcacgagg 17520 tcagagattg agaccatcct ggccaacatg gtgaaacccc gtctctacta aaaatacaaa 17580 aaaaaaccca aaacatgagt gggctgtggt ggcgcgtgct tgtaatccca gctaccgggg 17640 agactgaggc aggagaatca cttgaacccg gggggcggag gttgcagaga gctgagatcg 17700 cgccactgca ctccagcctc acaacaaagc gagactctgt ctcagtaatc aatcagtcaa 17760 tcaatcagac gtcatcagtg aatgtacgtg agcgtgtagg gattggtcct gctccgcgcg 17820 ccaccctcaa tctcacttct gacctccgtt ctccacctcg aggtgttttc atgtgggccc 17880 gtgtgtcctg accccagcag ttgtggcctc tttgctgtct gggagtcagg atttttcaca 17940 ctcatgtcct gctccagacc tggaatcagc caagtctcca agaagctctg gtttcttttc 18000 ctgcaaggtg gtatttcagg acccacgatg cggcaacagg ctggtcatgg ttactgggtt 18060 ggtcattgtt actgggtgtt tttgtggaga tacatccata cgcacagatg tgttcacaaa 18120 tgttaactct gaaggtaaac cacccggctg ggcacaaggg ctcaccggta atcccagcac 18180 tttgggagac cgagacagtt ggatgacctg aggtcgggag tttaagacca gcctgggcaa 18240 catggtgaaa ccccatctct actaaaaacg caaaaattag ccaggtgtgg tggcacacgc 18300 cggtagtccc agctagttgg gagacagaca tgctggaacc tgggacacgg aggttgcaga 18360 gagcagagat agtgccgctg caccccagcc tgggtgatag ggtgacaccc tgtctccaaa 18420 ataaatagat aaataaaggg aaaacgcctc ctcttggtgt ctccagtttg gactggctgg 18480 catgggttcc ggtagcctct tcccccatgg tggcgtcctt ttttccatgc cgggaatcct 18540 ggttctcaag ggcggggttg ttggtctgag tgtgacacag actgtgcctt tgctgccttt 18600 ctcttgccca gggctgaaca tggagctgga agacattgca aagctgaaga gtaagtgctg 18660 ccctccccac cttcttgcgg ctgggtgggg cctccccctg atgcctcctc aacccgacct 18720 gcagtgatcc tgctccgcct ggagggggcc atcgatgcca ttgagctgcc tggagacgac 18780 agcggtgtca ccaagccagg gaggtgagag gcggggagcc agctgcttca ctggaggccc 18840 agcctggagc tagagatagg ccatggtgca gtcctaggct gtcccaccag tgaggcctgt 18900 tttcaggccc gttttccctt tttgagacct ggtaggagca cctggtttgc atgatctggt 18960 tgttgagacg ttgagaggaa gagcacacgc atccacggaa cagcacacgc atccacggaa 19020 cagcacacgc atccacggaa cagcacacac tcccacggaa cagcacacgc atccacggaa 19080 cagcacccac tcccacggaa cagcacacac acccacggaa cagcacatgc ttccacggaa 19140 cagcacatgc ttccacggaa cagcacaccc ccacggaacg gcacccacgg aacagcacgc 19200 acgcccccac agaacagcac acacccccac agaacagcac ccacgccccc acggaacagc 19260 acacacaccc acggaacagc acacacgccc ccacagaaca gcacacaccc ccacggaaca 19320 gcacacgcac ccatggaaca gcacccacgg aacagcacac actcccacgg aacagcacac 19380 gcccccacgg aacagcacac acacccacgg aacagcacac actcccacgg aacagtacac 19440 gcatccacgg aacagcacac acgcccacgg aacagcacac gcatccacgg aacagcacac 19500 actcccatgg aacagcacac gcatccacag aacagcacac acactcccac ggaacagcac 19560 acaacagcac acactcccac ggaacagcac acgcccccac ggaacagcac acacacccac 19620 ggaacagcac acactcccac ggaacagcac acgcccccac ggaacagcac acacacccac 19680 ggaacagcac acacgccccc acagaacagc acacaccccc acggaacagc acacgcaccc 19740 atggaacagc acccacggaa cagcacacac tcccacggaa cagcacacgc acccacggaa 19800 cagcacacac annnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 19860 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn ngcacccacg 19920 gaacagcacg cacgccccca cagaacagca cacaccccca cagaacagca cccacgcccc 19980 cacggaacag cacacacacc cacggaacag cacacacgcc cccacagaac agcacacacc 20040 cccacggaac agcacacgca cccatggaac agcacccacg gaacagcaca cactcccacg 20100 gaacagcaca cgcccccacg gaacagcaca cactcccacg gaacagcaca cgcccccacg 20160 gaacagcaca cacacccacg gaacagcaca cactcccacg gaacagtaca cgcatccacg 20220 gaacagcaca cacgcccacg gaacagcaca cgcatccacg gaacagcaca cactcccatg 20280 gaacagcaca cgcatccaca gaacagcaca cacactccca cggaacagca cacactccca 20340 tggaacagca cacacacacc cacggaacag cacacacgcc cacggaacag cacacactcc 20400 cacggaacag cacacacatc cacggaacag cacccacgga acagcaccca cgcccgcatg 20460 gaacagcacc cacggaacaa cacacacccc cacggaacag cacacacccc cacggaacaa 20520 cacacactcc cacggaacaa cacacacccc cacggaacaa cacacacccc cacggaacag 20580 cacacacacc cacggaacaa cacacactcc cacggaacaa cacacacccc cacggaacaa 20640 cacacacccc cacggaacag cacacacacc cccacggaac aacacacacc cccacggaac 20700 agcacacact cccatggaac agcacacaca cccacggaac agcacacaca cacccacgga 20760 acagcacaca cacgcccacg gaacagcaca cacccccacg gaacagcaca cacccccacg 20820 gaacagcaca cacccccacg gaacagcaca cacacgccca cggaacagca cacacgccca 20880 tgcggggccg ctgggtttcc tgcagtttgt cctcctccag gcctttccct ggacctcctc 20940 aggtgcctgt tagaatgaga ccttcttgtt aggacgatga gtgtcccagc caccacctct 21000 tttggactcc gggaggcccg gaacattctg aaggctccgt gggtctcctg tcttctccgc 21060 ggccagggca gcagcatttg ttgtctgtcc tgcaggcaga tgagggtcag gcctggggcc 21120 cgtgtggggc tccactgagt gcacagccgc caaggcgagc gcgttctgcc tgagcgctga 21180 ccttgtggcg actcccagtt gcttccaggt ggagccagtg tcctcagcgt aatgctcaag 21240 gctctggcgt ggctcctcgg ccacctgcac ccccaggggc ccctcctgta gcttctgctg 21300 ccgccatcac tgtcactctc ccaaggcttt ggggactctg cccagagccg ctgcctccca 21360 gaagcccctg acgacccccc ggcgacccca tccctccctc tgatgacggc ctctgccccg 21420 aggcggcttt tccttggtgc tgttcttgtg ccggccaggc ctccacttcc catctggagg 21480 ctcctgaggg cggaggcctc tcacccccaa tgccggcgtc ccctggaggg ctcagtttgt 21540 ttccgaggga aggaaacttc cacagttgct gccttcagtt cccaaagctg cagcctgatc 21600 ccccgtccag gctcgagcct gccttcttct cctcgcagct acatctttga gctgtttgct 21660 gaagcccgga tcacgtttca gaccaagggc tgcatcctgg actcgctgga ccagatcatc 21720 cagcacctgg ccggacgtga gtgccggggc ggggtccttg gtgtgggcag acgtggcgta 21780 gggggtgcag caggcctcca tcctggcagt cagggctcgc ctggccatca cctggccgtc 21840 agcaggaaca ggctcacaga acctcacctg gtcggggcgt ggaggcgtta gtgccggttg 21900 cccactgccg tagagcctgt cccagttctg cagctggcgg cttcgtcctg cagactcatc 21960 ccattattcc ccttttaagg aagagcagcc caaggccctg gctgggttgt ggggcctcag 22020 gcttctccac acaccctgag ttctgcttct cagagctgtg gggtccagag gctttgccca 22080 gaggcagtgt cgtcatgggc tgctctggtt tgagatgccg gcccgccggg gcctctgctg 22140 tgctcccagg tgctggggag ggcggctctt gctgcttcaa accttaggtg accatagagc 22200 ctcttttcaa gttccaccgg cccccttgga gacgctgtcc ctgcctggct gctctcctgg 22260 ctgctgggaa gggcaggcga gctgcccgcc ctgagtggac actgcgctcc accctgggcc 22320 ccccgttggg caggagatgg agcttggcag tcgggctgag ctggcttatg gctggaaggg 22380 cgggggctgg ggtcggggcc tcccctgcct gcagtgcggg tgtcagcgcc cggcatgcta 22440 cctccccagg tgctggagtg ttcaccaaca cggccggact gcagaagctg gcggacatca 22500 tccaggtggg gcctgctcct ctggcgtctc cttccctgat ggaagccggg cgggtgcctt 22560 ctcctgctgt attagttact gactctagac gtgggggtgg gagaacggcc cccacaccac 22620 ctgtttccga ctggcaaacg cttggctcct ttcctgtgac ccaaacccac actgggcctc 22680 ccgcggggat gggggaggac gaggtctggt ggcccgtgcc cagggtgacg ctggtggggg 22740 aggacgtgaa ggggagtggg ggccagggag ccgctcctgc cctgtccggg ccctcaggcc 22800 ggggggaccc actcctggca gccccagcta cacgcagatg aagagctctg gacacacgta 22860 gcttcctgaa cagcttctcc agggacagac aaacggggac cctgcaggtt gccggcgggg 22920 gtgtccctgc gagcccatga tgggggatgc ggccccggcc cccttcttgg ccccgtcctg 22980 ccctgtgatg cccgtcccct cccatgtgag gttgctcctg gctctgtgcc tgtggcagca 23040 cctgctttcc ctgaggcaga cgggcttgtg cggtttgtgg agggcaagcc ccatttttgg 23100 gtgctctggg cacacacttg cctctcctgg acctcggtgc attttttaga agcagaccca 23160 caagtccctg actgggaggc catcagtcct tggggaaacc gaggcacagg tggctgtgtg 23220 gagccatgtg aggctgcctc tgtgctgccc acactgaacc tcctggccac acgaggtcat 23280 ggcagggtta ggtggggctg cccagctctg tgacaacttc gtgagtgtcc gcctggggtg 23340 gggggtgctt gagctggggg aggccgcaga agaaccctgg aatgtaccgc cggcctgtgc 23400 atgcagtgcg gtgctctgtg catgctactg ggcgtggagc tgcaggcccc aggacgacca 23460 ggcactgcct tcttcataga cgtggctctg agcaggggcg agacctgggc agggaccagg 23520 tggggtgggc acagcaggtg gtagggccca ggctcagccc tacctccacc gtggccttct 23580 ctgcggccag tgatgccaca gccagtgtct tctctgtgtg gcagctgggg ctggaaagac 23640 ggcactgcta tgtctcccag ctcctcccca aaagcacggt gggcatccca gggccagacc 23700 cctctctctg tggctcctgc ctgccaaggg ctgctttgcc gtcccgcctg gagcgtggtt 23760 ggctcttcaa gcaggaggcc gtgcacctgc caggcggacc tgcttccatg tcctgacggg 23820 tcactcaaag cacctccagc acatggccat cgaggcagcc ctgcagccca gggcctggag 23880 ggcaggtgtg agctggcccg ggcctgcccc tccctggaat gtggcttccc aggctccagt 23940 atggagcagt gtccacactc tggaaccaaa tcttgttcac cccattggtt tggaatttcc 24000 tttggctgct gctctaagta gccactggga gatgactcag ctcctcccaa ccctggggac 24060 tgcacaccgt gttcaccctc ggctgctcct gagtccctgc aggtgtgggc actgctcata 24120 gggctgctgc tgggctggac ttgcagccct gaggcacagg tgaccctggg gacagagtgg 24180 ggctagagtg gggctagtgg ccccaggaag aggatgtggg atgcacggtt cagttggagg 24240 caagtccggg cagggccagg ctgtgtgctg gggaggtaga gcttagctgg aggcaaactc 24300 tgggcagtgc tggcccgtgc tgggcagcca gtcaccgctg ggcccctgtg agactagtgg 24360 gtcccctttc ttctctgcct gagctgccct ggggctgaag cacggggcgg tttgtagtgg 24420 tgtttttttg agacagggtc tcgctctgtc accccagcgg gagtgcaggg ccttgtcacc 24480 agctcactgc agcctcagcc tcctgggccc aggccatcct cttgcctcag ccacctgagt 24540 agctgggaac acaggcgtgc accaccacgc ccggctaatt ttaaaagctt ttttgtggag 24600 atggggtctt ggcgtgcacc accacgctcg gctaattttt taaattttta tgtggagatg 24660 ggtcttgcca tgttgcccag gctggtctca aagtcctggg ctccggcagt ctgcccacct 24720 tggcctccca cagtgctggg attacaggta agagcttcca ggcctgccca tcagagggct 24780 ggctttttga gggaagctgt ttcctgaggc agcctcagcc cctgctcatg gcagcccctg 24840 gtgtcatggt gaatttgttc tgttgtttcc atccctgtgg gccaaatgct ttggtaaaac 24900 gcaaggcctt gtatttagct gtcttgacag tgaaaatggc tgggaaggaa ggaaggaagg 24960 aatggaagga agtttctctc tcccgtgcat acccaggcac gtgcacacgt gcgcagtcca 25020 cgcacgctgc cggtctctgt cccagccgcg gtgccggccc ccgtgttctc cagttcagct 25080 tctccgcatt tctgtgaacg attccggctt cttgatgttc ccagcagaac tccctcaagc 25140 cttcggcttc tccagggctc tgacggcggc tgggctgacg tggccgctct gcggagcctg 25200 ttggggcttc acgttcctgt tctggccatt tccggctctt tttccgggaa gggtcatcac 25260 gcgctctttt cctagtgcag gcatcgtccc tttcccgttg atttgcaggg ttctctgtaa 25320 gatctgagga acacgtgcca acatattctt tcctggtctc gtgctggtca ttttttccat 25380 tttcacgaca ggtttggtga acagatgttt ccttgtcatc agacttttgt cttgagcttg 25440 tatcccccga ccaagatgct aaactgggtc ttgtgtgttc tccaaactgc actgtagggt 25500 ggcggagctt tgtgtcgggg cctccgcacc ttccggcgtc acctgtgggg gtgtgaaagg 25560 cagactctac ctggattttt cccagcacgc cacaccggtg gttccgtctg ctgaccgagt 25620 ggctcggctt ctcccaactc cgctgggcac ctgccacact gttttcctca cggttttgtt 25680 cgtggtggtt ttgtcgtaag tcctggtgtc ggccagaacc aatttctgtt tttgtttgtt 25740 tttgagatgg agtttcgctc ttgtcgccca gggtggagtg cagtggtacg atcttggctc 25800 actgtaacct ccgcctcctg ggttcaaatg attctcctgc ctcagcctcc tgagtagctg 25860 ggattacagg tgcttgccac cacgcccagc taattttcat atttttagta gagacggggt 25920 tttgccgtgt gggccaggct ggtctcgaac ccctgacctc aggtgatcct ctcgcctcag 25980 cctcccagag tgctgggatt acaggtgtga gccgccgcgc ccggcctctt gttcttctta 26040 aacctgccct gatgttttct ccatgatgca tgttggagtc aacctgtctg cttcctttaa 26100 aaatcttgct gtgattttga ctggaatgtg tggaattcct gtgtttttga gtcagtgtct 26160 ctctgttgcc cagtctggag tgcagtggga ccatcacagc tcactgcagc ctcaacctcc 26220 tgggctcagg ggatcctctc agcccagcct cccaagtagc tgggaccacg gcacgtgcca 26280 ccacgcccgg ctagttttca tatttttttg gtggagaccc cagggttgca ccatgttgcc 26340 caggctggtc tcgaactcct gggttcgggc agttcgcccc tctcggcctc tcagagtgct 26400 gggattacag gcgtgagcca ctgcactagg ccatgttgaa tttctagatt aatttgggac 26460 ccttaggggc acagagagga gggctgggcc agctggtggg aggagaggcc tctcgggctg 26520 ccgcatttcc agtgcacgga gatggcctgc gtagggggaa cagagctcac tgggggtccc 26580 tccagggagg agaaagggtc aggcaggtgc cagctcctgt ccatcagcct ggggctgcat 26640 gatggcaggg gctggtgaac cgatgacctc tgggtgtcct gtgaccttcc gtgtgtgggg 26700 ctgatgccgc agaagatcag gtggcctcca gggctccggg ctctggcctc aggctcctca 26760 cgggactgca cctcctctct ttcagattgt gtttagtgtg gacccctccg agggcagccg 26820 tggttccccg gcagggctgg gacccttaca gtcctataag gtaggggcca cctccaggag 26880 gcaggtgggg ctgggggtcc tgcagtcctg aaaggtaagc ggctgccccc aggacacggg 26940 cggggtctcc acacttctgg tcctgtcccc tccaggtgca cgtccatcct gatgctggtc 27000 accggaggac ggctcagcgg tctgatgcct ggagcaccac tgcagccaga aagcgaggta 27060 cagacctggg cccacactct ccccgcccgc ccgggtgtgg tgctcagcac cagcatgcca 27120 caggctaggc acgtggccag ccgtgggtct cctgcccccc tgggcctggc caccttctcc 27180 atgtccaggc caatccagag cgttctcctc actgtccctc tgaaggctgg agttactgag 27240 agacatggga gagggcctga tggcaccgtg acctgcccag agtcacctgg ttggtggcgg 27300 cagagccaca gctcagccag gccttcctgc tgggacacac tggtttatgc caaggccgtc 27360 agcacggagc cccacagtga ggcacagctt tccctgctgc ctccacccag cgcctggctg 27420 ggccaagcct cagggtctca tctgaagggg gcccgactgg ccctgttgtc cgaagcctct 27480 ggtgcgctcg gccctgaggc cccacgtgcc ttgttggctt cctgtgctct gtggcgtctt 27540 cgagtcggtg ctgccgggta cctgtgtgga tggggcccgt gagtgggccc tcggctccgt 27600 gtccagagtc ctgtggttct tggagtgtgt ccggccccac ccggccatgt ggtgtccaag 27660 gggggctttg tggcggcagc ggtgggagct gctgcccctt ctcgtgctcc agtggggcct 27720 tgcctctggg cttggttcgt tcctctctgg aacgttcttt ctcagagctc tctggcccgc 27780 ggtggcacga cgtggccctg gctgaagcag cccccgcgtg gttgctgtgg ttggtctgcc 27840 tggccgagcc ggaaggggag gcccgggagg gcgtcagggt tgcgtggctt gacccccggt 27900 cggtggctcg gtgatggcct cgtggcaagg cgtctcccag caggaagcgt ccatcctggg 27960 gggtcgtggg aggcggcgcg tgcctgaggc agctggcgca cagatcctga gggcctggaa 28020 tctatttgtt ccattgacct gtgacgtcac ttgacttctg agaagcagcc gctccctgcg 28080 ttgggtgttt gtaggaaatg agttcctgga ggcggaggtc gggaagttcc cccgctgcag 28140 ggcacgctca gccccaggaa gcggggtgac ctttgctggg agaggtgcct tgtccctgct 28200 gaccccgagt cacagtcagc gtcgttctgc ttgtgccgtg tttaattcct ggtgtccggt 28260 gcccaggctc agtctcctcc ccaggccgcg gccgctgcgg tcagtcagtc aagcacttct 28320 aggaacttcc tttgaaccgg tgcccttgtt cgctgctgac gccactcgga ggcttcctgg 28380 cggagcgggg aactcgcact tcctcttgtg cgcgtccctg gaatgtcggg acgctggcgc 28440 ttgcttcccg tgcgctcttg gcgggatgag cttgccctga gctgcatgtc actgtttctg 28500 cagaagttta gggttggagt tggctgacct ctctggaggt gtccccagca tctgcctggg 28560 gtctgcctcg tactcccggg acccccagtc ccccagaggg gaccccagct ggcagactgc 28620 gctcacactc agggcagcct cctttgttct gacttctgca cgctgggcct gggtggctgt 28680 gggcggctca cttgcttgat gccagtgggt gagagggtga tgggcagaga ggcaggcggt 28740 caggccccca gtcccgtcct cacaccctgt gtcccctgct cccctccgcc ccacagggaa 28800 ggtgttgagc tactggtgct tcagtcccgg ccacagcatg cgcgagctgg tccgccaggg 28860 cgtccgctcc ctcatcctta ccagcggcac gctggccccg gtgtcctcct ttgccctgga 28920 gatgcagatg tacgggccac ccctgccagg ggcctaagca ctggtgacgc ctgtgacgtt 28980 agtggggtgg gagtgctggg ggtccccatg agccggggtg ctgggggtct tgggcctcac 29040 tgggggtctc gggccttgag ggctaaaggg gtgctggtgt ccttccccac tgtctgtccc 29100 tccggccacg ctcagccctt tcccggtctg cctggagaac ccacacatca tcgacaagca 29160 ccagatctgg gtgggggtcg tccccagagg tcccgacgga gcccagctga gctccgcgtt 29220 tgacagacgg tgagggcctg tccctgggcc gtgctggggt gcgaggtcgg ggagtactga 29280 gccctgaggc cctgagcagt ggcctctcgg ctctgtgcag gttttctgag gagtgcttgt 29340 cctccctggg gaaggctctg ggtaagtgcc cggcacaccc cagctgtgcc catcctggat 29400 cctggaccct gctcccaaga gctggtaggg accccggaag acgccccgcc cctgccctga 29460 ccccagcccc tgcacttcca ggcaacatcg cccgcgtggt gccctacggg ctgctgatct 29520 tcttcccttc ctatcctgtc atggagaaga gcctggagtt ctggcgagta tgtctcccct 29580 gtgtgtcctg ggtggggtgg gtgagggcag ggctggagca cgaagcaggc agtggccaca 29640 gctcctgcct gccctcatcg gatcggcggc gtaaccaggg ctgccgtgtc cctgcctctt 29700 cctcccacag gcccgcgact tggccaggaa gatggaggca ctgaagccgc tgtttgtgga 29760 gcccaggagc aaaggcagct tctccgaggt cagcacttgg ccggggctct gggtctgctg 29820 ccccctcgtg cctcccgtgc ccctcacagc ttccccgagg ctgaccacca gccctgacca 29880 cgggctctgg cggctcccgc ctgcctcttc agggcccctg cgtttccttc ctggccctga 29940 gtgttgcctc ttatcttaca aagcccccag cactgggtgg gtgtggcgac agtggtcctc 30000 ctgcctgagg agctatagcc ggcggccacc ctggccctgg gattccccgt gttttctggg 30060 aagcactgag caggcgcagg atcagcctgg gatccgtgcc aggaagaagt ttccagaacc 30120 cagttggcct tcctggctag gatagtcctt catcttggag gatgagacct gggtctccct 30180 catgggggaa gaaggggccg aggtgggctc caggctgagc ctgaccaact ttccttccag 30240 accatcagtg cttactatgc aagggtcgct gcccctgggt ccaccggcgc caccttcctg 30300 gcggtgtgcc ggggcaaggt gagctctctg gggccctctg tcctgacccg gttgcctgtt 30360 ccccagtggg tgctcatggc tcctcagctg actttgggcc ctgggggctg cctggtcccc 30420 tccttgggcc ccacaagagc aaagcactgg tggcctgctg ggagcgtgcc ccgctctggg 30480 tcgggcaggc aggatgcagg aggttcctgg ccacgagagt tggaggtggc gtctgggagc 30540 tgtggacccc aagtggggtc ctgacccata gatggggctt cctcccaccc ctggttggag 30600 cccccatggc cccaggcagc tccctggtgt gtcccccagg ccagcgaggg gttggacttc 30660 tcagacacga atggccgtgg tgtgatcgtc acgggcctcc cgtacccccc ccgcatggac 30720 ccccgggttg tcctcaagat gcagttcctg gacgagatga agggccaggg tggggctggg 30780 ggccaggtga gttacagcag ggcggggctg gggtaaggca atctggcgac tgagcccccc 30840 tgtgaccacg ggagcccctg tgaccgagcc tcctcgccct ccagttcctc tctgggcagg 30900 agtggtaccg gcagcaggcg tccagggcgg tgaaccaggc catcgggcga gtgatccggc 30960 accgccagga ctacggggct gtcttcctct gtgaccacag gtgcgtgcag tccgggggca 31020 ggcgtggcgc caggggacac ggccacatcc cactgggccc tggactcctt ccccacatga 31080 ggccccgtct cccccagagc ctctctggcg actcggggtc agcctgaggc ccctgcggca 31140 gatgagggtc ttcacttggg tgaactgacc ccctgaagcg gctgtgggca gggcagcagg 31200 gctgtggcca ccccccaggt tcgcctttgc tgatgccaga gcccagctgc cctcctgggt 31260 gcgtcctcac gtcagggtgt acgacaactt cggccacgtc atccgagacg tggcccagtt 31320 cttccgtgtt gccgagcgaa ctgtgagttt ctgcccaggg aggggatgag ggtgttgtcc 31380 ccagaggagc cagaaatggg cccacccacc cccagtggtt ctgcagatgc cagcaccggc 31440 cccccgggct gcagcaccca gtttgcgtga aggagaagat gctgtcaggg aggccaagtc 31500 gcctgacccc ctcctctcca ccaggaaagc taagagtctg gacctgcatg tccccagcct 31560 gaagcagagg tcctcaggtg cagatggcca gtgcgggacg ggcagtgtgg ggcgggcggg 31620 gcaggcggat tggggcgggc cgtgtggggc aagcagcggg gcaggtggtg tggggcgggc 31680 ggcaccaggc gcccagggtg gaggcggctc acctggcttt atgcactgcc cctcccacct 31740 ccaaaggctg tgtctgcctc ctagggtggg gttcccacgg gctggaaccc tcccctacag 31800 gcagagaagg cctcaggcaa agacgcgccc caaggctggg actcccccta atagcaggga 31860 ggacacccac aggcaggggc ccccaaatgc tgggaccctc cctcaggagg ggctccgtca 31920 taggcaggga cccccagctg gggccccgcg gtgggcttca ctgcgcactc gggtactctg 31980 caggatcacc agctgccggg gaccccgaga gtagcctgtg tgtggagtat gagcaggagc 32040 cagttcctgc ccggcagagg cccagggggc tgctggccgc cctggagcac agtgaacagc 32100 gggccgggga ccttggcgag gagcaggtgc agttccaggg ccttgggatg gacacagacc 32160 ctctgtctcc tgaggccaac cccaccccgc ccatctgact tcaggcacct ccccacacac 32220 ccctgtaaat cccctgcctg tggggcgggc aggcaggtga gggatcccag ctgcctggct 32280 gtgtgtgtgc cctccacctc gcctcaccca caggctgctg gctcccaggt ggtgcatgcc 32340 ctggccctca gcgggtgccc ccacatcact ttgattctct ggcaggtcag cttggctcag 32400 ggcactcaag gtcgggtgcc cctgcccctg gctgtgcctg aggctggcct ttctccagga 32460 atgtgctgcg gttgggaccc aggttccttc ctccttgggg ccttttgccc cagaagccca 32520 taatttctca gctttctccc tgcttcctgc tgggggccgt tctcttgctg cctgtccctg 32580 cccttcaggc tcctggagtg agccccgggt gcaggcacca gacacctgtg tccccttcct 32640 gccagcccct cgctgtggtc ggactgtcct tcctggacct gctcttacgt gtcaccacct 32700 gtgagcctca tgagccgctg gcgtgacttg gacaggacca agttgtggga ctgtcaccag 32760 ggtgtgccgc gcccctcccc cgaccttcgt cttggctact gctcagggct ccttggggcc 32820 atcttccctg tgggcccagg tgctttgggg ccctggagtg tgtggttgga accacagctg 32880 tgtcctcctc aggcccacag ctgctccacc ctgtccctcc tggctgagaa gaggccggca 32940 gaggagctgc gaggagggag gaagaagatc cggctggtca gccacctggt gcgtgagctg 33000 tccctgcacc tgtgccgacc accatagaca cgtgtgggaa cccggccctg ggtgccccca 33060 gccaagttgg gatgtgggcc cgatgggacc agggaagtta cccccgggag ctgatgtcca 33120 gggcggctgt gaagctgtcg gcccaagggc tcaagggcag ctgggatcag gccccgccct 33180 tgggcaggct tggtttgggg gctgcagcac tgggtttggc cctggcattt ccctcaagtg 33240 tggacgtgca cctgcctcat tcgaggggcg cagcccattc ccagccttgg atgaaagaac 33300 cgagttatag tcggagccag gaagccccct gcctgctgga aagccccaag tgtggcagcc 33360 tttgtccatg tcccttggct tctgggaaga actgggtggt gcccaggcag ggctggtgcc 33420 atcaggaagt gggcggctgc cgaggggcct gggctgttga gggcctgggt ggggagtgcc 33480 ggggctgccc ctgccttggt ttccacgttt ccgtgttggt ctggggtgtg tggagagatg 33540 agcaccgctt cttgggaagc ccctccctat gatctgccat cctggagcct cagctgtgtc 33600 cgctgtgggg tgggggcttt agggaggagg agagaggacc cccagcttga gggagagcca 33660 gtctaccctt tgcccattcg ctgccctcgg ttccctgcca gcctctcact gtgtgaccca 33720 gacaggccca gccccgcagc tttcctcccg cagcacctcc gtgtccatcc agccaaccag 33780 tttctcaggc agcagccccc gctcagcaat cactgtcccg gggaacaccc aatgctccaa 33840 ggaaggctct gcagctccag ggacgggatg atgaggctgg ccctgatgga gcctcgggcc 33900 tgtgtgctgc aggaggagcc cgtggctggc gcacagatgg acagggccaa gctcttcatg 33960 gtggctgtga agcaggaact gagccaagcc aactttgcca ccttcaccca ggccctgcag 34020 gactacaagg gttccgatga cttcgccgcc ctggccgcct gtctcggccc cctctttgct 34080 gaggacccca agaagcacag cctgctccaa ggtgccctgg cttgcagggg ccgcccatcc 34140 tgagggcagt gctgccgctg tgtggggtgg gggccatctg ggtccaaggt tgtctctgtt 34200 ctctagagaa aagggggcgg atggggacag acaccccttc ctctacaggc ttctaccagt 34260 ttgtgcggcc tcaccacaag gagcagtttg aggaggtctg tatccagctg acgggacggg 34320 gctgcggcta ccggccagag cacagcgttc cccgaaggca gcgggcacag ccagccctgg 34380 accccactgg taaatggggc ctcgggtggg accctcagac tcctccgtgg aaggcaccgg 34440 agtcctgggc tggttggggt gggcatccct ggggccctgc gtggccccgc ctctctgttc 34500 ccgtgtggga gtgatggggg ccacccccca ccaccagcag cagtatcact tgttggggag 34560 accctgtgca actccacgca gggccctgcc cttcccatag cccctgaccc ctacgcacag 34620 ccctgtccag ctgccgcacg tgtcccctgc cccccatgca cagccctggg gagtccactg 34680 cacacgccag ggtcctagac ccctagaccc ctagatccct gtcctcccgt cctccctact 34740 tctgcctttg cctagggtgg agtccaagcc tccagaggtg ggagtgtctg tgttcgtgct 34800 tgttaacgaa cagcccccat agagctcctc cagtgtaggg ttcacccagc ggggaaccta 34860 acctgttggg aagaccccag accccttctg ggcttggtac ccaccctggg gctctaagct 34920 cctgagcagg gctttggcct gcctgccact gttccagccc ccatccagca gttggtgtct 34980 cctctgctgc cccggcacct gggcacgtgt gcctgcctgg gttttcccgc cctggtccga 35040 ggtgggtgag gcctggcctc cccagccagc ccttccccct ccccggggga actttccagg 35100 tgcttgggac cagctttgtg gctctccatc tcttcatcag gaaggacagc gctagatccc 35160 aagctgactg tgtccaaggc tgcagcccag cagctggacc cccgagagca cctgaaccag 35220 ggcaggcccc acctgtcgcc cagaccaccc cccacaggta gctgagtcct gaactgtgtg 35280 cagcctgtga cttggtgggt tcctcagtgg cttgatgagg ctaacacttg agtgtggctt 35340 gagcctttga accggaggtg ccagtggagc tgcccctgtg gggagcatct cctggtgggg 35400 gctcccggtt ctgtaccccg cagttgtcct gagcagctct ccaggagttc gtgggaggaa 35460 gggcaggcag ggtggtggga ctctcagtcc tctgccccag cgccactctg agccatgcta 35520 ctcccacacc aggaggccct ggcagccacc cacagcaggg gtccagagcg cccagagcag 35580 ggaagcaggg ccagcgcgcc gtgagcgcct acctggcaga tgtccgcagg gccctggggt 35640 ctgcaggctg tagccagctc ttggcagcac tgacagccta caagcaagac gatgacctcg 35700 acaaggtgct ggccgtgctg gccgccctga ccactgcaaa gccggaggac ttccccctgc 35760 tgcagagcaa gtggcctggg cgtgggggac agccagtggg gtgggnnnnn nnnnnnnnnn 35820 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 35880 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 35940 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 36000 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 36060 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 36120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 36180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 36240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 36300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnggg 36360 ggcaggggca gggtggggac cgtgccgggt ctgagtgaag ctccccgcag ggttcagcat 36420 gtttgtgcgt ccacaccaca agcagcgctt ctcacagacg tgcacagacc tgaccggcag 36480 accctccctg ggcacggagc caccaggacc ccaggaggag agtcttgccg tgcctcctgt 36540 gctcacccac agggctcccc aaccaggtag ggcgcctgcc tggctgctcc tgacagtgcc 36600 ccaaccgcac gcagccctgg gagtgagcag caaagcccca ggccctgctc agactcagtc 36660 tccgtctcca ggcccctcac ggtccgagaa gcccggaaag acccagagcg agatctcgac 36720 cttccttaga cagaggccag cagggactgt gggggcgggc ggtgaggctg cagggcccag 36780 ccagtcccca ggacctcccc acgggcctgc agcatctgag tggggtgagc ctcctgggag 36840 agaccttgct gggcagcagg ctgcgggagc tccgagcggg cccctctcag caggctgtgt 36900 gtgccagggc tgtggggcgg aggatgtggt gcccttccag tgccctgcct gtgatttcca 36960 gcgctgccaa gcctgttggc aacggcacct tcaggttggt gcctggtcac tacagttcct 37020 gctgggtgta gccccaggtg gtgggctgag ggggaaaggg ccgggtatag ccccaggtgg 37080 tgggctggtg gcaacgcctg gcaggtgcgt ccagcgggcc ggttgtctta caggcctcta 37140 ggacgtgccc atcctgccac accgcctcca ggaagcagag cgtcacgcag gtcttctggc 37200 cagagcccca gtga 37214 <210> 3 <211> 18 <212> DNA <213> Homo sapiens <400> 3 gaccactgtc cttccatg 18 <210> 4 <211> 46 <212> DNA <213> Homo sapiens <400> 4 ttcagagatt caagttataa taaagctctt cttatattga ggggga 46 <210> 5 <211> 18 <212> DNA <213> Homo sapiens <400> 5 aggaataggg ttggtttt 18 <210> 6 <211> 17 <212> DNA <213> Homo sapiens <400> 6 ccttactacc tgtcccg 17 <210> 7 <211> 20 <212> DNA <213> Homo sapiens <400> 7 acaattactt gttggatgcc 20 <210> 8 <211> 18 <212> DNA <213> Homo sapiens <400> 8 agcttctaac ccaaccag 18 <210> 9 <211> 21 <212> DNA <213> Homo sapiens <400> 9 tataaaccta aatgtaaaag c 21 <210> 10 <211> 20 <212> DNA <213> Homo sapiens <400> 10 ttcaccaaaa tttaaagctt 20 <210> 11 <211> 26 <212> DNA <213> Homo sapiens <400> 11 ctttgaccag agtatgtaaa attctc 26 <210> 12 <211> 18 <212> DNA <213> Homo sapiens <400> 12 aagacgtgtt caaagatt 18 <210> 13 <211> 17 <212> DNA <213> Homo sapiens <400> 13 ggacctactg ttttttg 17 <210> 14 <211> 19 <212> DNA <213> Homo sapiens <400> 14 ggacctactg ttttattcc 19 <210> 15 <211> 22 <212> DNA <213> Homo sapiens <400> 15 gtcccttctc ttcctcctgt ag 22 <210> 16 <211> 19 <212> DNA <213> Homo sapiens <400> 16 cgtgatcttt gacgaagct 19 <210> 17 <211> 16 <212> DNA <213> Homo sapiens <400> 17 cgcaaacctt tctgga 16 <210> 18 <211> 23 <212> DNA <213> Homo sapiens <400> 18 agcctgtgtg tggagtatga gca 23 <210> 19 <211> 20 <212> DNA <213> Homo sapiens <400> 19 cgtttccgtg ttggtctggg 20 <210> 20 <211> 19 <212> DNA <213> Homo sapiens <400> 20 gactacaagg gttccgatg 19 <210> 21 <211> 20 <212> DNA <213> Homo sapiens <400> 21 agtttgagga ggtctgtatc 20 <210> 22 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 22 catggaagga cagtggt 17 <210> 23 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 23 agctttatta taacttgaat 20 <210> 24 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 24 cgggacaggt agtaag 16 <210> 25 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 25 cgggacaggt agtaa 15 <210> 26 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 26 gcatccaaca agtaattgt 19 <210> 27 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 27 gcatccaaca agtaattg 18 <210> 28 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 28 ggcatccaac aagtaatt 18 <210> 29 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 29 ggttgggtta gaagct 16 <210> 30 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 30 gcttttacat ttaggtttat 20 <210> 31 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 31 catgttcctt tctataact 19 <210> 32 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 32 agctttaaat tttggtgaa 19 <210> 33 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 33 ttttacatac tctggtcaaa 20 <210> 34 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 34 ttttacatac tctggtca 18 <210> 35 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 35 gaattttaca tactctggtc 20 <210> 36 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 36 gaattttaca tactctggt 19 <210> 37 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 37 gagaatttta catactctgg 20 <210> 38 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 38 atctttgaac acgtctt 17 <210> 39 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 39 acaaaaaaca gtaggtcc 18 <210> 40 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 40 ggaataaaac agtaggtc 18 <210> 41 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 41 agcttcgtca aagatcac 18 <210> 42 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 42 ggtgggtgga tgtttc 16 <210> 43 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 43 ggtggtgtgg agaagc 16 <210> 44 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 44 gctcatactc cacacac 17 <210> 45 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 45 catcggaacc cttgtagtcc 20 <210> 46 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 46 gatacagacc tcctcaaac 19 <210> 47 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 47 ggtggaggtg gtgctgc 17 <210> 48 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 48 aggtggaggt ggtgct 16 <210> 49 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 49 tggtgtggga gtagca 16 <210> 50 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 50 cgatggcgag aaatta 16 <210> 51 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 51 taattcagca aaaaagccca 20 <210> 52 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 52 aagaatctga cacccca 17 <210> 53 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 53 agacagccaa gaatctgaca c 21 <210> 54 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 54 cagccaagaa tctgaca 17 <210> 55 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 55 acaggaaccc gacag 15 <210> 56 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 56 gttactctct tgtttcttca c 21 <210> 57 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 57 ttactctctt gtttcttca 19 <210> 58 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 58 gttactctct tgtttcttc 19 <210> 59 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 59 cgtgggtgga gaagca 16 <210> 60 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 60 acgtgggtgg agaagc 16 <210> 61 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 61 cagaaactgt aagggca 17 <210> 62 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 62 agggatagca gggaagg 17 <210> 63 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 63 gcttaaacac agacaga 17 <210> 64 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 64 tgcttaaaca cagacag 17 <210> 65 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 65 cagggcaggg aagaacag 18 <210> 66 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 66 catggaagga cagtgg 16 <210> 67 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 67 ccccctcaat ataagaa 17 <210> 68 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 68 aaccaaccct attcctgg 18 <210> 69 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 69 accaacccta ttcctg 16 <210> 70 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 70 aaccaaccct attcctg 17 <210> 71 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 71 aaaaccaacc ctattcct 18 <210> 72 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 72 aaaccaaccc tattcc 16 <210> 73 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 73 ggtagtaagg gcacacc 17 <210> 74 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 74 gacaggtagt aagggcacac 20 <210> 75 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 75 gtagtaaggg cacac 15 <210> 76 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 76 gacaggtagt aagggcaca 19 <210> 77 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 77 acaggtagta agggcaca 18 <210> 78 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 78 gacaggtagt aagggca 17 <210> 79 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 79 cgggacaggt agtaaggg 18 <210> 80 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 80 catccaacaa gtaattgt 18 <210> 81 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 81 ggcatccaac aagtaattgt 20 <210> 82 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 82 ggcatccaac aagtaattg 19 <210> 83 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 83 ggcatccaac aagtaat 17 <210> 84 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 84 cgtgaaggag agaacct 17 <210> 85 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 85 acgtgaagga gagaacc 17 <210> 86 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 86 gacgtgaagg agagaacc 18 <210> 87 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 87 gacgtgaagg agagaac 17 <210> 88 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 88 cagtcttgct atgcct 16 <210> 89 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 89 ctagaatcaa agctcca 17 <210> 90 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 90 acatcgcact tgggc 15 <210> 91 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 91 cacggcaaac ctcacc 16 <210> 92 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 92 aaccacggca aacctcac 18 <210> 93 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 93 caaagcaccg agtcacc 17 <210> 94 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 94 tcaaagcacc gagtcac 17 <210> 95 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 95 ctggttgggt tagaag 16 <210> 96 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 96 tataactttt agtttagc 18 <210> 97 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 97 ttcctttcta taactttt 18 <210> 98 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 98 gttcctttct ataactttt 19 <210> 99 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 99 gttcctttct ataacttt 18 <210> 100 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 100 atgttccttt ctataacttt 20 <210> 101 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 101 atgttccttt ctataactt 19 <210> 102 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 102 atgttccttt ctataact 18 <210> 103 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 103 gctttaatct gccttc 16 <210> 104 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 104 ccgtggcttt aatctgc 17 <210> 105 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 105 ccgtggcttt aatctg 16 <210> 106 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 106 caaaaaacag taggtcc 17 <210> 107 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 107 gaataaaaca gtaggtcc 18 <210> 108 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 108 ggaataaaac agtaggtcc 19 <210> 109 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 109 ggaataaaac agtaggt 17 <210> 110 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 110 ggaataaaac agtagg 16 <210> 111 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 111 cacagagtgt catggg 16 <210> 112 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 112 acagcatgga aaggcacg 18 <210> 113 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 113 cagcatggaa aggcacg 17 <210> 114 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 114 tacaggagga agagaaggga c 21 <210> 115 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 115 acaggaggaa gagaaggg 18 <210> 116 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 116 tctacaggag gaagagaa 18 <210> 117 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 117 tctacaggag gaagaga 17 <210> 118 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 118 cttcgtcaaa gatcacg 17 <210> 119 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 119 gcttcgtcaa agatcacg 18 <210> 120 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 120 gcttcgtcaa agatcac 17 <210> 121 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 121 ccagaaaggt ttgcg 15 <210> 122 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 122 tccagaaagg tttgcg 16 <210> 123 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 123 cagaggcatc ggatcag 17 <210> 124 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 124 cagaggcatc ggatca 16 <210> 125 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 125 agcagaggca tcggatc 17 <210> 126 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 126 attcttcaca catcttc 17 <210> 127 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 127 ctatgaacgc acctg 15 <210> 128 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 128 ggctatgaac gcacctg 17 <210> 129 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 129 gctgggagaa gacatag 17 <210> 130 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 130 caaaatgccc ttacagtga 19 <210> 131 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 131 caaaatgccc ttacagt 17 <210> 132 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 132 tgtgcgattt taaaggaaaa t 21 <210> 133 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 133 catgtgcgat tttaaaggaa a 21 <210> 134 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 134 tgtgcgattt taaaggaa 18 <210> 135 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 135 catgtgcgat tttaaagga 19 <210> 136 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 136 atgtgcgatt ttaaagga 18 <210> 137 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 137 accctgtcac ttaaatatat g 21 <210> 138 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 138 gagggaggtg gagcgtt 17 <210> 139 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 139 ctgaagagtg gagaagg 17 <210> 140 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 140 caataaataa agtgtgagga 20 <210> 141 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 141 caacccagta accatgac 18 <210> 142 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 142 caacccagta accatga 17 <210> 143 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 143 accaacccag taaccatga 19 <210> 144 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 144 gagcaggtgt tttatc 16 <210> 145 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 145 ggtcgaggag gtgtcac 17 <210> 146 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 146 gtcgaggagg tgtcac 16 <210> 147 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 147 ggtcgaggag gtgtca 16 <210> 148 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 148 ggtcgaggag gtgtc 15 <210> 149 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 149 ccaggtctca aaaaggg 17 <210> 150 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 150 attacgctga ggaca 15 <210> 151 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 151 cattacgctg aggac 15 <210> 152 <211> 14 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 152 cttgagcatt acgc 14 <210> 153 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 153 cgaggagaag aaggcag 17 <210> 154 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 154 ccttggtctg aaacgtgat 19 <210> 155 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 155 ctaacgcctc cacgc 15 <210> 156 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 156 ggacaggctc tacgg 15 <210> 157 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 157 actaatacag caggagaagg 20 <210> 158 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 158 aactaataca gcaggagaag g 21 <210> 159 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 159 taactaatac agcaggagaa g 21 <210> 160 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 160 ttgaagagcc aaccac 16 <210> 161 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 161 ccattttcac tgtcaag 17 <210> 162 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 162 gccattttca ctgtcaa 17 <210> 163 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 163 agaaatgcgg agaagc 16 <210> 164 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 164 aaatggaaaa aatgaccagc 20 <210> 165 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 165 aggacttacg acaaaaccac 20 <210> 166 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 166 ggacttacga caaaacca 18 <210> 167 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 167 gacttacgac aaaacca 17 <210> 168 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 168 acaccaggac ttacgaca 18 <210> 169 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 169 tagaaattca acatggc 17 <210> 170 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 170 ctagaaattc aacatggc 18 <210> 171 <211> 14 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 171 gtcatcggtt cacc 14 <210> 172 <211> 14 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 172 actcgaagac gcca 14 <210> 173 <211> 14 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 173 gactcgaaga cgcc 14 <210> 174 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 174 ggcacaagca gaacgac 17 <210> 175 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 175 agtcagaaca aaggaggc 18 <210> 176 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 176 gaagtcagaa caaaggag 18 <210> 177 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 177 gcagaagtca gaacaaagg 19 <210> 178 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 178 gtgcagaagt cagaacaaa 19 <210> 179 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 179 gtgcagaagt cagaacaa 18 <210> 180 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 180 aaggatgagg gagcggac 18 <210> 181 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 181 gtaaggatga gggagc 16 <210> 182 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 182 tggtaaggat gagggag 17 <210> 183 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 183 cgtacatctg catctc 16 <210> 184 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 184 tgtaagataa gaggcaacac t 21 <210> 185 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 185 ttgtaagata agaggcaaca c 21 <210> 186 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 186 ttgtaagata agaggcaaca 20 <210> 187 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 187 tttgtaagat aagaggcaac a 21 <210> 188 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 188 tgtaagataa gaggcaa 17 <210> 189 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 189 ctggaaggaa agttggt 17 <210> 190 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 190 atagtaagca ctgatggtc 19 <210> 191 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 191 tagtaagcac tgatgg 16 <210> 192 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 192 catagtaagc actgatg 17 <210> 193 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 193 ctgtaactca cctggc 16 <210> 194 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 194 cggatcactc gcccg 15 <210> 195 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 195 acacaggcta ctctcgg 17 <210> 196 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 196 acacaggcta ctctcg 16 <210> 197 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 197 ccacacacag gctactc 17 <210> 198 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 198 atactccaca cacaggct 18 <210> 199 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 199 atactccaca cacaggc 17 <210> 200 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 200 gctcatactc cacacacag 19 <210> 201 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 201 tcatactcca cacacag 17 <210> 202 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 202 gctcatactc cacacaca 18 <210> 203 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 203 tgctcatact ccacacac 18 <210> 204 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 204 agcaggaagc agggagaaa 19 <210> 205 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 205 tccgaccaca gcgag 15 <210> 206 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 206 cagaagccaa gggacatg 18 <210> 207 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 207 cagaagccaa gggacat 17 <210> 208 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 208 ccagaccaac acggaaacg 19 <210> 209 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 209 ccagaccaac acggaaac 18 <210> 210 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 210 gaatgggcaa agggtaga 18 <210> 211 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 211 aatgggcaaa gggtaga 17 <210> 212 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 212 gaatgggcaa agggtag 17 <210> 213 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 213 gaacccttgt agtcctg 17 <210> 214 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 214 aacccttgta gtcct 15 <210> 215 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 215 ggaacccttg tagtc 15 <210> 216 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 216 atcggaaccc ttgtagtc 18 <210> 217 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 217 catcggaacc cttgtagtc 19 <210> 218 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 218 catcggaacc cttgtagt 18 <210> 219 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 219 gatacagacc tcctcaaact 20 <210> 220 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 220 gatacagacc tcctcaaac 19 <210> 221 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 221 gatacagacc tcctcaaa 18 <210> 222 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 222 gatacagacc tcctcaa 17 <210> 223 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 223 gccccattta ccagtg 16 <210> 224 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 224 cccaacaagt gatgct 16 <210> 225 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 225 cccaacaagt gatgc 15 <210> 226 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 226 gtaccaagcc cagaagg 17 <210> 227 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 227 gtaccaagcc cagaag 16 <210> 228 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 228 ttcctgatga agagatg 17 <210> 229 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 229 tcctgatgaa gagatg 16 <210> 230 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 230 tgggagtagc atggc 15 <210> 231 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 231 tgtgggagta gcatggc 17 <210> 232 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 232 gtgggagtag catggc 16 <210> 233 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 233 aaacatgctg aaccctg 17 <210> 234 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 234 acaaacatgc tgaaccct 18 <210> 235 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 235 cacaaacatg ctgaaccc 18 <210> 236 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 236 cacaaacatg ctgaacc 17 <210> 237 <211> 17 <212> DNA <213> Artificial sequence <220> <223> Synthetic oligonucleotide <400> 237 tggacgcaca aacatgc 17 <210> 238 <211> 21 <212> DNA <213> artificial <220> <223> Primer <400> 238 ggagtgtgga ttcgcactcc t 21 <210> 239 <211> 20 <212> DNA <213> artificial <220> <223> Primer <400> 239 agattgagat cttctgcgac 20 <210> 240 <211> 27 <212> DNA <213> artificial <220> <223> probe <400> 240 aggcaggtcc cctagaagaa gaactcc 27 <210> 241 <211> 21 <212> DNA <213> artificial <220> <223> primer <400> 241 ccatcctgga cattgaggac t 21 <210> 242 <211> 21 <212> DNA <213> artificial <220> <223> primer <400> 242 caggttccgg gacaggtagt a 21 <210> 243 <211> 21 <212> DNA <213> artificial <220> <223> primer <400> 243 cgtctgtgcc ttctcatctg c 21 <210> 244 <211> 20 <212> DNA <213> artificial <220> <223> primer <400> 244 gcacagcttg gaggcttgaa 20 <210> 245 <211> 20 <212> DNA <213> artificial <220> <223> primer <400> 245 ccgtctgaac tatcctgccc 20 <210> 246 <211> 20 <212> DNA <213> artificial <220> <223> primer <400> 246 gccgtagtcg gtgtactcgt 20

Claims

B형 간염 바이러스 (HBV) 감염의 치료 및/또는 예방에서 이용을 위한 RTEL1 저해제.
청구항 제 1항에 있어서, HBV 감염은 만성 감염인, RTEL1 저해제.
청구항 제 1항 또는 제 2항에 있어서, RTEL1 저해제는 감염된 세포에서 cccDNA를 감소시킬 수 있는, RTEL1 저해제.
청구항 제 1항 내지 제 3항 중 어느 한 항에 있어서, 상기 저해제는 포유류 RTEL1 표적 핵산, 특히 인간 RTEL1 핵산에 적어도 95% 상보적인, 길이에서 적어도 10개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는, 길이에서 12 내지 60개 뉴클레오티드의 올리고뉴클레오티드이고, 그리고 RTEL1 mRNA를 감소시킬 수 있는, RTEL1 저해제.
청구항 제 1항 내지 제 4항 중 어느 한 항에 있어서, 단일 가닥 안티센스 올리고뉴클레오티드, siRNA 또는 shRNA 분자에서 선택되는, RTEL 1 저해제.
청구항 제 1항 내지 제 5항 중 어느 한 항에 있어서, 포유류 RTEL1 표적 핵산은 서열 번호: 1 또는 2에서 선택되는, RTEL 1 저해제.
청구항 제 4항 내지 제 6항 중 어느 한 항에 있어서, 연속 뉴클레오티드 서열은 서열 번호: 1 및 서열 번호: 2의 표적 핵산에 적어도 98% 상보적인, RTEL 1 저해제.
청구항 제 3항 내지 제 7항 중 어느 한 항에 있어서, HBV 감염된 세포에서 cccDNA는 대조와 비교할 때 적어도 60% 감소되는, RTEL 1 저해제.
청구항 제 4항 내지 제 7항 중 어느 한 항에 있어서, RTEL1 mRNA는 대조와 비교할 때 적어도 60% 감소되는, RTEL 1 저해제.
포유류 RTEL1, 특히 인간 RTEL1에 상보적인 적어도 10개 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는 길이에서 12-30개 뉴클레오티드의 단일 가닥 안티센스 올리고뉴클레오티드에 있어서, 상기 올리고뉴클레오티드는 RTEL1의 발현을 저해할 수 있는, 단일 가닥 안티센스 올리고뉴클레오티드.
청구항 제 10항에 있어서, 연속 뉴클레오티드 서열은 서열 번호: 1에 적어도 90% 상보적인, 예컨대 완전히 상보적인, 안티센스 올리고뉴클레오티드.
청구항 제 10항 또는 제 11항에 있어서, 길이에서 12 내지 25개, 특히 15 내지 21개의 뉴클레오티드의 연속 뉴클레오티드 서열을 포함하는, 안티센스 올리고뉴클레오티드.
청구항 제 11항 내지 제 12항 중 어느 한 항에 있어서, 연속 뉴클레오티드 서열은 서열 번호: 3-21에서 선택되는 표적 서열에 100% 상보적인, 올리고뉴클레오티드.
청구항 제 10항 내지 제 13항 중 어느 한 항에 있어서, 올리고뉴클레오티드는 서열 번호: 22-237로 구성된 군에서 선택되는 서열을 포함하는, 올리고뉴클레오티드.
청구항 제 10항 내지 제 14항 중 어느 한 항에 있어서, 하나 또는 그 이상의 2' 당 변형된 뉴클레오시드를 포함하는, 안티센스 올리고뉴클레오티드.
청구항 제 15항에 있어서, 하나 또는 그 이상의 2' 당 변형된 뉴클레오시드는 2'-O-알킬-RNA, 2'-O-메틸-RNA, 2'-알콕시-RNA, 2'-O-메톡시에틸-RNA, 2'-아미노-DNA, 2'-플루오로-DNA, 아라비노 핵산 (ANA), 2'-플루오로-ANA 및 LNA 뉴클레오시드로 구성된 군에서 독립적으로 선택되는, 안티센스 올리고뉴클레오티드.
청구항 제 15항 내지 제 16항 중 어느 한 항에 있어서, 하나 또는 그 이상의 2' 당 변형된 뉴클레오시드는 LNA 뉴클레오시드인, 안티센스 올리고뉴클레오티드.
청구항 제 10항 내지 제 17항 중 어느 한 항에 있어서, 올리고뉴클레오티드는 적어도 하나의 포스포로티오에이트 뉴클레오시드간 연쇄를 포함하는, 안티센스 올리고뉴클레오티드.
청구항 제 18항에 있어서, 연속 뉴클레오티드 서열 내에 모든 뉴클레오시드간 연쇄는 포스포로티오에이트 뉴클레오시드간 연쇄인, 안티센스 올리고뉴클레오티드.
청구항 제 10항 내지 제 19항 중 어느 한 항에 있어서, 올리고뉴클레오티드는 RNase H를 모집할 수 있는, 안티센스 올리고뉴클레오티드.
청구항 제 10항 내지 제 20항 중 어느 한 항에 있어서, 안티센스 올리고뉴클레오티드 또는 이의 연속 뉴클레오티드 서열은 화학식 5'-F-G-F'-3'의 갭머로 구성되거나 또는 이를 포함하고, 여기서 영역 F 및 F'는 1 - 4개의 2' 당 변형된 뉴클레오시드를 독립적으로 포함하고, 그리고 G는 RNaseH를 모집할 수 있는 6 내지 16개 뉴클레오시드의 영역, 예컨대 6 내지 18개 DNA 뉴클레오시드를 포함하는 영역인, 안티센스 올리고뉴클레오티드.
청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 올리고뉴클레오티드 및 상기 올리고뉴클레오티드에 공유 부착된 적어도 하나의 접합 모이어티를 포함하는 접합체.
청구항 제 22항에 있어서, 접합 모이어티는 도 1에서 삼가 GalNAc 모이어티 중 한 가지에서 선택되는, 접합 화합물.
청구항 제 22항 또는 제 23항에 있어서, 적어도 2개의 연속 포스포디에스테르 연쇄를 포함하는 2 내지 5개의 연결된 뉴클레오시드로 구성되는 생리학적으로 불안정 링커를 포함하고, 여기서 상기 생리학적으로 불안정 링커는 올리고뉴클레오티드 성분의 5' 또는 3' 단부에서 공유 결합된, 접합 화합물.
청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 올리고뉴클레오티드의 제약학적으로 허용되는 염, 또는 청구항 제 22항 내지 제 24항에 따른 접합체의 제약학적으로 허용되는 염.
청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 올리고뉴클레오티드, 또는 청구항 제 22항 내지 제 24항에 따른 접합체, 또는 청구항 제 25항에 따른 제약학적으로 허용되는 염, 그리고 제약학적으로 허용되는 부형제를 포함하는 제약학적 조성물.
RTEL1을 발현하는 표적 세포에서 RTEL1 발현을 조절하기 위한 생체내 또는 시험관내 방법에 있어서, 상기 방법은 청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 올리고뉴클레오티드, 또는 청구항 제 22항 내지 제 24항에 따른 접합체, 청구항 제 25항에 따른 제약학적으로 허용되는 염, 또는 청구항 제 26항에 따른 제약학적 조성물을 효과량으로 상기 세포에 투여하는 단계를 포함하는, 생체내 또는 시험관내 방법.
질환을 치료하거나 예방하기 위한 방법에 있어서, 청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 올리고뉴클레오티드, 또는 청구항 제 22항 내지 제 24항에 따른 접합체, 청구항 제 25항에 따른 제약학적으로 허용되는 염, 또는 청구항 제 26항에 따른 제약학적 조성물의 치료 또는 예방 효과량을, 상기 질환을 앓거나 또는 상기 질환에 취약한 개체에게 투여하는 단계를 포함하는, 방법.
청구항 제 28항에 있어서, 질환은 B형 간염 바이러스 (HBV)인, 방법.
의약에서 이용을 위한, 청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 안티센스 올리고뉴클레오티드, 또는 청구항 제 22항 내지 제 24항에 따른 접합체, 청구항 제 25항에 따른 제약학적으로 허용되는 염, 또는 청구항 제 26항에 따른 제약학적 조성물.
B형 간염 바이러스 HBV의 치료 또는 예방을 위한 약제의 제조를 위한, 청구항 제 10항 내지 제 21항 중 어느 한 항에 따른 올리고뉴클레오티드, 또는 청구항 제 22항 내지 제 24항에 따른 접합체, 청구항 제 25항에 따른 제약학적으로 허용되는 염, 또는 청구항 제 26항에 따른 제약학적 조성물의 용도.