TW202246500A

TW202246500A - 用於抑制ｒｔｅｌ１表現之增強型寡核苷酸

Info

Publication number: TW202246500A
Application number: TW111104124A
Authority: TW
Inventors: 艾瑞克方德; 娜塔莎赫鲁施卡; 蘇珊卡麥樂; 埃里克寇勒; 布萊恩李奧納德; 蘇法隆尼盧安賽; 蘇珊莫爾; 托比亞斯尼爾森; 索倫歐特森; 萊可佩得森; 蘇倫Ｖ萊斯繆森; 史蒂芬施密特; 莎賓賽溫; 丹尼爾特力; 喬安娜瑪麗沃爾瑟
Original assignee: 瑞士商赫孚孟拉羅股份公司
Priority date: 2021-02-02
Filing date: 2022-01-28
Publication date: 2022-12-01
Also published as: JP2024505583A; WO2022167456A1; US11898145B2; US20220251556A1; EP4288540A1

Abstract

本發明涉及靶向端粒延長解旋酶調節因子 1 (RTEL1) 之增強型反義寡核苷酸，得以調節 RTEL1 之表現或調節 RTEL1 活性。本發明特別是涉及該靶向 RTEL1 之增強型反義寡核苷酸用於治療及/或預防 B 型肝炎病毒 (HBV) 感染，特別是慢性 HBV 感染之用途。本發明特別是涉及該靶向 RTEL1 之增強型反義寡核苷酸用於去穩定 cccDNA，例如 HBV cccDNA 之用途。本發明還包含醫藥組成物以及其在治療及/或預防 HBV 感染中之用途。

Description

用於抑制　RTEL1　表現之增強型寡核苷酸

本發明涉及靶向 RTEL1 (端粒延長解旋酶調節因子 1) 之增強型反義寡核苷酸，得以調節 RTEL1 之表現或調節 RTEL1 活性。本發明特別是涉及靶向 RTEL1 之增強型反義寡核苷酸用於治療及/或預防 B 型肝炎病毒 (HBV) 感染，特別是慢性 HBV 感染之用途。本發明特別是涉及該靶向 RTEL1 之增強型反義寡核苷酸用於去穩定 cccDNA，例如 HBV cccDNA 之用途。本發明還包含醫藥組成物以及其在治療及/或預防 HBV 感染中之用途。

B 型肝炎係由 B 型肝炎病毒 (HBV) 引起之傳染病， B 型肝炎病毒係一種透過逆轉錄複製之小型嗜肝病毒。慢性 HBV 感染係導致嚴重肝病例如肝硬化、肝細胞癌之關鍵因素。當下對於慢性 HBV 感染之治療係基於投予聚乙二醇化第 1 型干擾素或核苷 (酸) 類似物，例如拉米夫定 (lamivudine)、阿德福韋 (adefovir)、恩替卡韋 (entecavir)、替諾福韋地索普西 (tenofovir disoproxil) 及替諾福韋艾拉酚胺 (tenofovir alafenamide)，該等藥物靶向病毒聚合酶，亦即一種多功能逆轉錄酶。治療成功通常以 B 型肝炎表面抗原 (HBsAg) 之丟失來衡量。然而，由於 B 型肝炎病毒 DNA 在感染後仍然存在於體內，因此很少能完全清除 HBsAg。HBV 之持久性由 HBV 基因體之游離形式媒介，該形式穩定地維持在細胞核中。該游離形式稱為「共價閉合環狀 DNA」(cccDNA)。cccDNA 充當所有 HBV 轉錄本之模板，包括前基因體 RNA (pgRNA)，亦即一種病毒複製中間體。幾個 cccDNA 複本之存在可能足以重新引發 HBV 感染。當下對於 HBV 之治療並不靶向 cccDNA。然而，慢性 HBV 感染之治癒將會要求消除 cccDNA (由 Nassal，Gut.2015 Dec;64(12):1972-84. doi: 10.1136/gutjnl-2015-309809 綜述)。

端粒延長解旋酶調節因子 1 (RTEL1) 編碼 DNA 解旋酶，該酶在端粒之穩定性、保護及延長中起作用，且與已知在 DNA 複製期間保護端粒之遮蔽素複合物 (shelterin complex) 中的蛋白質交互作用。該基因中之突變與先天性角化不良症及 Hoyerall-Hreidarsson 症候群有關 (參見例如由 Vannier 等人, 2014 Trends Cell Biol. Vol 24 p.416 綜述)。

RTEL1 位於細胞核中，作為 ATP 依賴性 DNA 解旋酶，參與端粒長度調節、DNA 修復及基因體穩定性之維持。RTEL1 作為抗重組酶，在減數分裂期間抵消毒性重組且限制互換，並且藉由物理解離鏈入侵事件來調節減數分裂重組及互換恆定性，從而藉由減數分裂合成依賴性鏈黏著 (SDSA) 來促進非互換修復以及分解 D 環重組中間體。此外，RTEL1 分解 T‑環且藉由抵消端粒 G4-DNA 結構來防止端粒脆弱，該等作用共同確保端粒之動態性及穩定性。

RTEL1 已在 siRNA 篩選中被鑑定為 HPV 游離基因體之穩定劑：(Edwards 等人, 2013 PLoS One Vol 8, e75406)。同樣，靶向 RTEL1 之 siRNA 也已經用於鑑定在 Hoyeraal-Hreidarsson 症候群中與 RTEL1 之交互作用物 (Schertzer 等人 2015 Nucleic Acid Res Vol 43 p. 1834)。此外，RTEL1 在對必需宿主蛋白之 siRNA 篩選中被鑑定為 HIV 宿主依賴性因子，以提供抑制 HIV 感染之標靶 (WO 2007/094818)。

在 WO 2020/011902 中，顯示用反義寡核苷酸靶向 RTEL1 導致 RTEL1 減少。此外，觀察到對於 HBV 感染參數例如 HBV cccDNA、pgRNA、HBsAg 及 HBeAg 的影響。

需要能夠特異性地抑制 RTEL1 的治療劑。我們已經篩選了超過 1000 種靶向人類 RTEL1 之反義寡核苷酸，並鑑定了特別有效且特異性地靶向人類 RTEL1 的序列及化合物。具體而言，鑑定了四種 LNA 間隙子寡核苷酸，該等寡核苷酸在活體外對於人類 RTEL1 具有強烈的下調作用。經鑑定之 LNA 間隙子寡核苷酸靶向人類 RTEL1 前驅 mRNA 之內含子區域。

本發明的目的

本發明提供調節 RTEL1 (「端粒延長解旋酶調節因子 1」) 表現之反義寡核苷酸及其結合物。我們鑑定了存在於人類 RTEL1 前驅 mRNA 中之內含子標靶序列，該序列可為反義寡核苷酸或其結合物所靶向以給出有效的 RTEL1 抑制。例如，靶向 SEQ ID NO: 1 的位置 8681-8701 或 11753-11774 有利於減少 RTEL1。據此，本發明之一個目的為提供靶向 RTEL1 之增強型反義寡核苷酸或其結合物，其中該反義寡核苷酸能夠在活體外及或活體內抑制 RTEL1 之表現，從而減少經 HBV 感染之細胞中的 cccDNA。靶向 RTEL1 之增強型反義寡核苷酸或其結合物可用於治療 HBV 感染。

本發明提供與 RTEL1 核酸互補且能夠抑制其表現之反義寡核苷酸或其結合物，及其在醫藥中之用途。

本發明提供一種反義寡核苷酸，其包含與人類 RTEL1 前驅 mRNA 之區域 (如 SEQ ID NO: 1 中所例示)，例如來自 SEQ ID NO: 1 之核苷酸 8681-8701 或核苷酸 11753-11774 之區域互補，例如完全互補的連續核苷酸序列。

在一些實施例中，該反義寡核苷酸或其連續核苷酸序列與來自 SEQ ID NO: 1 之核苷酸 8681-8701 的區域互補，例如完全互補。

在一些實施例中，該反義寡核苷酸或其連續核苷酸序列與來自 SEQ ID NO: 1 之核苷酸 11753-11774 的區域，例如與來自 SEQ ID NO: 1 之核苷酸 11757-11774、11756-11774 或 11753-11770 的區域互補，例如完全互補。

本發明之反義寡核苷酸之長度通常為 12 至 24 個核苷酸，例如長度為 12 至 22 個，例如 16 至 22 個核苷酸，並且包含至少 12 個核苷酸之連續核苷酸序列，該連續核苷酸序列與人類 RTEL1 前驅 mRNA (如 SEQ ID NO: 1 中所例示) 之選自 SEQ ID NO: 1 之核苷酸 8681-8701 及 11753-11774 的區域互補，例如完全互補。

本發明提供一種反義寡核苷酸，其長度為 12 至 22 個核苷酸，其中該反義寡核苷酸包含長度為 12 至 22 個核苷酸之連續核苷酸序列，其中該連續核苷酸序列與 SEQ ID NO 7、SEQ ID NO 8、SEQ ID NO 9 及/或 SEQ ID NO 10 互補，例如完全互補。

本發明提供一種反義寡核苷酸，其長度為 12 至 22 個核苷酸 (例如長度為 15、16、17、18、19 或 20 個核苷酸)，其中該反義寡核苷酸包含長度為 12 至 18 個核苷酸 (例如長度為 15、16、17 或 18 個核苷酸) 之連續核苷酸序列，其中該連續核苷酸序列與 SEQ ID NO 11 互補，例如完全互補。

本發明提供一種反義寡核苷酸，其長度為 10 至 30 個核苷酸，該反義寡核苷酸包含長度為 10 至 30 個核苷酸之連續核苷酸序列，其中該連續核苷酸序列與選自由 SEQ ID NO: 3、SEQ ID NO: 4、SEQ ID NO: 5 及 SEQ ID NO: 6 所組成之群組或其至少 14 個連續核苷酸的序列 100% 相同。

本發明提供一種反義寡核苷酸，其長度為 10 至 30 個核苷酸，該反義寡核苷酸包含長度為 10 至 30 個核苷酸之連續核苷酸序列，其中該連續核苷酸序列與選自由 SEQ ID NO: 3、SEQ ID NO: 4、SEQ ID NO: 5 及 SEQ ID NO: 6 所組成之群組或其至少 15 個連續核苷酸的序列 100% 相同。

本發明提供一種反義寡核苷酸，其長度為 10 至 30 個核苷酸，該反義寡核苷酸包含長度為 10 至 30 個核苷酸之連續核苷酸序列，其中該連續核苷酸序列與選自由 SEQ ID NO: 3、SEQ ID NO: 4、SEQ ID NO: 5 及 SEQ ID NO: 6 所組成之群組或其至少 16 個連續核苷酸的序列 100% 相同。

本發明提供一種反義寡核苷酸，其包含連續核苷酸序列，該連續核苷酸序列與選自由 SEQ ID NO: 3、SEQ ID NO: 4、SEQ ID NO: 5 及 SEQ ID NO: 6 所組成之群組或其至少 14 個連續核苷酸的序列 100% 相同。

本發明提供一種反義寡核苷酸，其包含連續核苷酸序列，該連續核苷酸序列選自由 SEQ ID NO: 3、SEQ ID NO: 4、SEQ ID NO: 5 及 SEQ ID NO: 6 所組成之群組。

本發明提供一種反義寡核苷酸，其包含連續核苷酸序列，該連續核苷酸序列與 SEQ ID NO: 3 (AATTTTACATACTCTGGT) 或其至少 14 個、15 個、16 個或 17 個連續核苷酸 100% 相同。

本發明提供一種反義寡核苷酸，其包含連續核苷酸序列，該連續核苷酸序列與 SEQ ID NO: 4 (AATTTTACATACTCTGGTC) 或其至少 14 個、15 個、16 個、17 個或 18 個連續核苷酸 100% 相同。

本發明提供一種反義寡核苷酸，其包含連續核苷酸序列，該連續核苷酸序列與 SEQ ID NO: 5 (TTACATACTCTGGTCAAA) 或其至少 14 個、15 個、16 個或 17 個連續核苷酸 100% 相同。

本發明提供一種反義寡核苷酸，其包含連續核苷酸序列，該連續核苷酸序列與 SEQ ID NO: 6 (CTTTATTATAACTTGAATCTC) 或其至少 14 個、15 個、16 個、17 個、18 個、19 個、20 個或 21 個連續核苷酸 100% 相同。

本發明提供一種反義寡核苷酸，其包含選自由化合物 ID No 3_1、ID No 4_1、ID No 5_1 及 ID No 6_1 (參見例如下表 6) 所組成之群組之化合物的連續核苷酸。

在一些實施例中，該反義寡核苷酸不是選自由 WO 2020/011902 A1 之化合物 ID No 36_1、ID No 35_1、ID No 33_1、ID No 34_1 及 ID No 37_1 (參見例如 WO 2020/011902 A1 之表 6) 所組成之群組的反義寡核苷酸。

在一些實施例中，該反義寡核苷酸不是選自由 WO 2020/011902 A1 之化合物 ID No 23_1 (參見例如 WO 2020/011902 A1 之表 6) 的反義寡核苷酸。

本發明提供選自表 1 所列的群組中的反義寡核苷酸或其醫藥上可接受之鹽。

本發明提供一種選自由以下所組成之群組的反義寡核苷酸： AATTttacatactctgGT (SEQ ID NO: 3，化合物 ID No 3_1)， AAttttacatactctGGTC (SEQ ID NO: 4，化合物 ID No 4_1)， TTacatactctggtCAAA (SEQ ID NO: 5，化合物 ID No 5_1)，及 CTttattataactTgaAtCTC (SEQ ID NO: 6，化合物 ID No 6_1)，其中大寫字母為 β-D-氧 LNA 核苷，小寫字母為 DNA 核苷，所有 LNA C 皆為 LNA 5-甲基胞嘧啶，且所有核苷間鍵結皆為硫代磷酸酯核苷間鍵結。

本發明還提供一種本發明之反義寡核苷酸之醫藥上可接受之鹽。

表 1. 化合物表 ( 本發明之示例性反義寡核苷酸 ) – HELM 註釋格式

序列識別號	化合物識別號 #	HELM 標注寫成 5’ – 3’	由以下圖中所示之結合物組成：
3	3_1	[LR](A)[sP].[LR](A)[sP].[LR](T)[sP].[LR](T)[sP].[dR](T)[sP].[dR](T)[sP].[dR](A)[sP].[dR](C)[sP].[dR](A)[sP].[dR](T)[sP].[dR](A)[sP].[dR](C)[sP].[dR](T)[sP].[dR](C)[sP].[dR](T)[sP].[dR](G)[sP].[LR](G)[sP].[LR](T)	1
4	4_1	[LR](A)[sP].[LR](A)[sP].[dR](T)[sP].[dR](T)[sP].[dR](T)[sP].[dR](T)[sP].[dR](A)[sP].[dR](C)[sP].[dR](A)[sP].[dR](T)[sP].[dR](A)[sP].[dR](C)[sP].[dR](T)[sP].[dR](C)[sP].[dR](T)[sP].[LR](G)[sP].[LR](G)[sP].[LR](T)[sP].[LR]([5meC])	2
5	5_1	[LR](T)[sP].[LR](T)[sP].[dR](A)[sP].[dR](C)[sP].[dR](A)[sP].[dR](T)[sP].[dR](A)[sP].[dR](C)[sP].[dR](T)[sP].[dR](C)[sP].[dR](T)[sP].[dR](G)[sP].[dR](G)[sP].[dR](T)[sP].[LR]([5meC])[sP].[LR](A)[sP].[LR](A)[sP].[LR](A)	4
6	6_1	[LR]([5meC])[sP].[LR](T)[sP].[dR](T)[sP].[dR](T)[sP].[dR](A)[sP].[dR](T)[sP].[dR](T)[sP].[dR](A)[sP].[dR](T)[sP].[dR](A)[sP].[dR](A)[sP].[dR](C)[sP].[dR](T)[sP].[LR](T)[sP].[dR](G)[sP].[dR](A)[sP].[LR](A)[sP].[dR](T)[sP].[LR]([5meC])[sP].[LR](T)[sP].[LR]([5meC])	3

Helm 註解鍵：[LR](G) 為 β-D-氧-LNA 鳥嘌呤核苷， [LR](T) 為 β-D-氧-LNA 胸腺嘧啶核苷， [LR](A) 為 β-D-氧-LNA 腺嘌呤核苷， [LR]([5meC]) 為 β-D-氧-LNA 5-甲基胞嘧啶核苷， [dR](G) 為 DNA 鳥嘌呤核苷， [dR](T) 為 DNA 胸腺嘧啶核苷， [dR](A) 為 DNA 腺嘌呤核苷， [dR](C) 為 DNA 胞嘧啶核苷， [sP] 為硫代磷酸酯核苷間鍵結， P 為磷酸二酯核苷間鍵結。

本發明因此提供一種反義寡核苷酸，該反義寡核苷酸選自化合物 ID No # 3_1、ID No # 4_1、ID No # 5_1 及 ID No # 6_1。

本發明進一步提供一種結合物，其包含根據本發明之反義寡核苷酸以及至少一個共價連接至該反義寡核苷酸之結合物部分。

在一些實施例中，該結合物部分能夠結合至去唾液酸糖蛋白受體，例如人類去唾液酸糖蛋白受體。例如，該結合物部分可包含至少一個選自由半乳糖、半乳胺糖、N-甲醯基-半乳胺糖、N-乙醯基半乳胺糖、N-丙醯基-半乳胺糖、N-正丁醯基-半乳胺糖及 N-異丁醯基半乳胺糖所組成之群組的去唾液酸糖蛋白受體靶向部分。

在一些實施例中，該去唾液酸糖蛋白受體靶向部分為 N-乙醯基半乳胺糖 (GalNAc)。因此，本發明之反義寡核苷酸可以與至少一個包含至少一個 N-乙醯基半乳胺糖 (GalNAc) 部分之結合物部分結合，例如與至少一個包含至少一個如下所述之 N-乙醯基半乳胺糖 (GalNAc) 部分的結合物部分結合。根據本發明之一個態樣，該結合物部分為如下文所述之 GalNAc 殘基 R。

在一些實施例中，該結合物部分為至少三價，例如二價、三價或四價 GalNAc 殘基殘基 R。較佳地，該結合物部分為三價 GalNAc 殘基 R。如本文所用之術語「三價 GalNAc 殘基」指代包含三個 N-乙醯基半乳胺糖部分的殘基，亦即較佳三個下式之部分

該結合物部分或該 GalNAc 殘基 R 中之各者及該反義寡核苷酸可以經由連接子 L，例如生物可切割連接子 L 連接在一起。因此，該結合物化合物可以包含連接子 L，其定位在反義寡核苷酸與結合物部分或 GalNAc 殘基 R 中之各者之間。

在一個實施例中，該結合物部分為三價 N-乙醯基半乳胺糖 (GalNAc)，例如圖 5 所示之彼等。在一個實施例中，該結合物部分為圖 5A-1 或圖5A-2 之三價 N-乙醯基半乳胺糖 (GalNAc)，或兩者之混合物。在一個實施例中，該結合物部分為圖 5B-1 或圖5B-2 之三價 N-乙醯基半乳胺糖 (GalNAc)，或兩者之混合物。在一個實施例中，該結合物部分為圖 5C-1 或圖5C-2 之三價 N-乙醯基半乳胺糖 (GalNAc)，或兩者之混合物。在一個實施例中，該結合物部分為圖 5D-1 或圖5D-2 之三價 N-乙醯基半乳胺糖 (GalNAc)，或兩者之混合物。該結合物部分與該反義寡核苷酸可以經由連接子，例如生物可切割連接子連接在一起。因此，該結合物化合物可以包含定位在反義寡核苷酸與結合物部分之間的連接子。

在一些實施例中，該連接子包含 1 至 10 個經連接之核苷或由 1 至 10 個經連接之核苷組成，例如 1 個、2 個、3 個、4 個、5 個、6 個、7 個、8 個、9 個或 10 個經連接之核苷，例如 2 到 6 個之間的經連接之核苷，例如 2 到 5 個之間的經連接之核苷，例如 2 到 4 個之間的經連接之核苷。在一些實施例中，該連接子包含兩個經連接之核苷酸。因此，該等核苷可以為 DNA 核苷。通常，該等核苷經由磷酸二酯核苷間鍵結連接。此外，該連接子可以經由磷酸二酯核苷間鍵結連接至反義化合物。

表 2 中提供示例性結合物 (以 HELM 註釋格式)。除了表 1 中所示之化合物外，該化合物亦包含兩個核苷酸「ca」作為 5' 末端之可切割連接子。此係表 2 中之序列的 HELM 註釋之一部分。在 GalNAc 媒介之遞送成功後，可切割連接子被切割掉，留下化合物作為活性藥物。

本發明提供選自表 2 中所列述之結合物群組的結合物或其醫藥上可接受之鹽。

表 2.化合物表 (本發明之示例性結合物) - HELM 註釋格式 (對於 HELM 註釋上之註釋，參見針對表 1 的解釋)。

序列識別號	寡核苷酸化合物 ID 編號 # (根據上表 1)	HELM 標注寫成 5’ – 3’。	示例性化合物 – 見圖：
3	3_1_GalNAc	{[5gn2c6]P.[dR](C)P.[dR](A)P.[LR](A)[sP].[LR](A)[sP].[LR](T)[sP].[LR](T)[sP].[dR](T)[sP].[dR](T)[sP].[dR](A)[sP].[dR](C)[sP].[dR](A)[sP].[dR](T)[sP].[dR](A)[sP].[dR](C)[sP].[dR](T)[sP].[dR](C)[sP].[dR](T)[sP].[dR](G)[sP].[LR](G)[sP].[LR](T)	1
4	4_1_GalNAc	{[5gn2c6]P.[dR](C)P.[dR](A)P.[LR](A)[sP].[LR](A)[sP].[dR](T)[sP].[dR](T)[sP].[dR](T)[sP].[dR](T)[sP].[dR](A)[sP].[dR](C)[sP].[dR](A)[sP].[dR](T)[sP].[dR](A)[sP].[dR](C)[sP].[dR](T)[sP].[dR](C)[sP].[dR](T)[sP].[LR](G)[sP].[LR](G)[sP].[LR](T)[sP].[LR]([5meC])}	2
5	5_1_GalNAc	[5gn2c6]P.[dR](C)P.[dR](A)P.[LR](T)[sP].[LR](T)[sP].[dR](A)[sP].[dR](C)[sP].[dR](A)[sP].[dR](T)[sP].[dR](A)[sP].[dR](C)[sP].[dR](T)[sP].[dR](C)[sP].[dR](T)[sP].[dR](G)[sP].[dR](G)[sP].[dR](T)[sP].[LR]([5meC])[sP].[LR](A)[sP].[LR](A)[sP].[LR](A)	4
6	6_1_GalNAc	{[5gn2c6]P.[dR](C)P.[dR](A)P.[LR]([5meC])[sP].[LR](T)[sP].[dR](T)[sP].[dR](T)[sP].[dR](A)[sP].[dR](T)[sP].[dR](T)[sP].[dR](A)[sP].[dR](T)[sP].[dR](A)[sP].[dR](A)[sP].[dR](C)[sP].[dR](T)[sP].[LR](T)[sP].[dR](G)[sP].[dR](A)[sP].[LR](A)[sP].[dR](T)[sP].[LR]([5meC])[sP].[LR](T)[sP].[LR]([5meC])	3

在上表中，5gn2c6 為圖 5D-1 或圖 5D-2 之三價 N-乙醯基半乳胺糖 (GalNAc)，或兩者之混合物。在一些實施例中，5gn2c6 為具有下式之 GalNAc 殘基 R：

應理解，上圖所示之 R 為圖 5D1 及圖 5D2 所示之兩種立體異構物之混合物。

根據本發明之又一態樣，上圖所示之 R 為如圖 5D1 所示之立體異構物。

根據本發明之又一態樣，如上圖所示之 R 為如圖 5D2 所示之立體異構體。表 2 中提供之結合物的結構如圖 1 至圖 4 所示。

本發明提供圖 1 之結合物或其醫藥上可接受之鹽。本發明提供化合物識別號 3_1 的反義寡核苷酸或其醫藥上可接受之鹽。

本發明提供圖 2 之結合物或其醫藥上可接受之鹽。本發明提供化合物識別號 4_1 的反義寡核苷酸或其醫藥上可接受之鹽。

本發明提供圖 3 之結合物或其醫藥上可接受之鹽。本發明提供化合物識別號 6_1 的反義寡核苷酸或其醫藥上可接受之鹽。

本發明提供圖 4 之結合物或其醫藥上可接受之鹽。本發明提供化合物識別號 5_1 的反義寡核苷酸或其醫藥上可接受之鹽。

式 (I) 化合物

本發明還提供下式 (I) 之化合物

(I) 其中 n 為 0 或 1 p 為 0 或 1 前提條件是在 n 為 1 的情況下，p 較佳為 1，並且前提條件是在 n 為 0 且 p 為 0 的情況下，R 較佳為 H， L 為連接子，較佳地 L 為包含 2 至 10 個核苷，例如 2 至 5 個核苷或由其組成的連接子， R 為 GalNAc 殘基，較佳為三價 GalNAc 殘基，且 A 為根據本發明之反義寡核苷酸殘基。

術語「反義寡核苷酸殘基」指代根據本發明之反義寡核苷酸，該反義寡核苷酸藉由其 5’ 末端經由 -(L) _n-(O-P(=O)(-OH)-) _p- 連接至殘基 R，例如表 6 中所示之反義寡核苷酸。較佳之反義寡核苷酸殘基如圖 1A、圖 2A、圖 3A、圖 4A、圖 5A、圖 6A、圖 7A 及圖 8A 所示。

GalNAc 殘基 R

R 為 GalNAc 殘基，較佳為三價 GalNAc 殘基。如本文所用，術語「GalNAc 殘基」指代一種殘基，其包含至少一個 N-乙醯基半乳胺糖 (GalNAc) 部分，亦即至少一個下式之部分：

如本文所用，術語「三價 GalNAc 殘基」指代一種殘基，其包含三個 N-乙醯基半乳胺糖 (GalNAc) 部分，亦即較佳三個下式之部分：

較佳地，該 GalNAc 殘基包含至少一個，較佳三個具有以下結構之 GalNAc 構建單元 (L ^a)，

(L ^a) 其中連接子 ^a係選自烷基、烷基-氧-烷基、包含至少一個磷酸二酯鍵結之烷基、包含至少一個醯胺鍵結之烷基、包含至少一個磷酸二酯鍵結之烷基-氧-烷基、及包含至少一個醯胺鍵結之烷基-氧-烷基。

術語「烷基」指代經取代或未經取代之直鏈或支鏈烷基，例如 C1 至 C20 烷基，較佳為 C2 至 C8，例如 C2、C3、C4、C5、C6、C7 或 C8 烷基。較佳地，烷基未經取代，更佳為直鏈且未經取代之烷基。

術語「烷基-氧-烷基」指代至少兩個經由氧連接之烷基，較佳為乙基-氧-乙基，例如 -(CH ₂-O) _x- 基團，其中整數 x 較佳在 2 至 20 範圍內，更較佳在 2 至 6 範圍內，例如 2、3、4、5 或 6，更佳地，x 為 3 或 5。

根據本發明之一個態樣，該 GalNAc 構建單元 (L ^a) 係選自以下結構 (L ^a) 之群組。

如果 GalNAc 殘基中存在多於一個殘基 ( ^La)，例如三價 GalNAc 殘基中之三個殘基，則所有殘基較佳係相同。

最佳地，L ^a具有結構

在該結合物部分 R 包含多個，例如較佳三個 GalNAc 部分的情況下，R 除了包含該等 GalNAc 構建單元 (L ^a) 之外，亦包括一個多價 (較佳四價) 構建單元 (L ^b)，該等構建單元 (L ^a) 較佳連接至該多價構建單元，且該多價構建單元經由 -(L) _n-(O-P(=O)(-OH)-) _p- 連接至反義寡核苷酸殘基 A。

L ^b較佳選自以下結構中之一者：

其中 X 為 O 或 S，且其中 Z 為 O 或 NH，並且其中 n 為 1 至 4，較佳為 2 或 3，更佳為 2。

更佳地，L ^b具有結構

，應理解，L ^b具有結構 L ^b* 或結構 L ^b** 或者為其混合物。根據較佳態樣，L ^b為 L ^b* 與 L ^b** 之混合物。 :

(L ^b*)

(L ^b**)

因此，結合物部分 R 較佳包含結構 (L ^a) ₃-L ^b-，更佳地，R 包含以下結構中之一者：

更佳地，結構

，其中 L ^b較佳地為 L ^b* 與 L ^b** 之混合物，並且其中 X 為 O 或 S，且 Z 為 O 或 NH，並且其中 n 為 1 至 3，較佳為 2，且 L ^a如上所述，較佳地，其中 L ^a係選自由以下所組成之群組：

及其混合物，其中較佳地，GalNAc 殘基內之所有殘基 (L ^a) 係相同。

如果 (L ^a) ₃-L ^b為

則 L ^a係更佳選自由以下所組成之群組：

如果 (L ^a) ₃-L ^b為

或

，較佳為

， L ^a較佳為

視情況，結合物部分 R 額外地包含連接子 L ^c。因此，R 較佳具有結構 (L ^a) ₃-L ^b-(L ^c) _c-，其中整數 c 為 1 或 0。

該等連接子化合物係本領域具有通常知識者已知的並且經適當選擇以將 (L ^a) ₃-L _b連接至該化合物之剩餘部分，亦即，經由 (L) _n-(O-P(=O)(-OH)-) _p- 連接至反義寡核苷酸殘基。

取決於 L ^b之結構，L ^c係選自由以下所組成之群組：烷基、烷基-氧-烷基、胺基-烷基 (-NH-烷基-)、胺基-烷基-氧-烷基、非天然胺基酸殘基及天然胺基酸殘基。根據本發明之一個態樣，L ^c為經取代或未經取代之離胺酸基團。

根據本發明之一個態樣，R 為 (L ^a) ₃-L ^b-(L ^c) _c，其中 c = 1 且 (L ^a) ₃-L _b為

L ^c較佳為胺基-烷基或胺基酸，例如經取代或未經取代之離胺酸基團，特別是 L ^C係例如選自由以下所組成之群組：

其中胺基連接至 L ^b之羰基，從而形成醯胺鍵。根據該態樣之較佳殘基 R 在圖 5A1、圖5A2、圖 5C1、圖 5C2、圖 5D1、圖 5D2 中描述。因此，根據本發明之一個態樣，R 選自圖 5A1、圖 5A2、圖 5C1、圖 5C2、圖 5D1 及圖 5D2 中描述之殘基。

根據本發明之又一態樣，R 具有結構 (L ^a) ₃-L ^b-(L ^c) _c，其中 c 為 0，並且其中 (L ^a) ₃-L _b為

根據本發明之該態樣的較佳殘基 R 在圖 5B1 及圖 5B2 中描述。

根據本發明之又一態樣，R 具有結構 (L ^a) ₃-L ^b-(L ^c) _c，其中 (L ^a ) ₃-L _b為

並且 Z 為 O。在這種情況下，c 較佳為 1，L ^c較佳為烷基，更佳為 C3 至 C6 烷基，更佳為丙基，最佳為正丙基。根據該態樣之較佳殘基 R 在圖 5E1、圖 5F1、圖 5G1 及圖 5H1 中描述。因此，根據本發明之一個態樣，R 選自圖 5E1、圖 5F1、圖 5G1 及圖 5H1 中描述之殘基

且 Z 為 NH。在這種情況下，c 較佳為 1 且 L ^c較佳為烷基、包含胺基酸之基團或具有以下結構之基團：

特別是，在這種情況下，L ^c為

。

根據本發明之該態樣的較佳殘基 R 在圖 5J1 中描述。

且其中 Z 為 NH，且 c 為 0。根據本發明之該態樣的較佳殘基 R 在圖 5I1 中描述。

根據本發明之一個態樣，R 為 (L ^a) ₃-L ^b-(L ^c) _c，其中 c = 0 且其中 (L ^a) ₃-L _b為

根據本發明之該態樣的較佳殘基 R 在圖 5L1 及圖 5L2 中描述。

因此，R 較佳係選自圖 5A1、圖 5A2；圖 5B1、圖 5B2、圖 5C1、圖 5C2、圖 5D1、圖 5D2、圖 5E1、圖 5F1、圖 5G1、圖 5H1、圖 5I1、圖 5J1、圖 5L1、圖 5L2 中描述之殘基及其混合物，例如 5A1 與 5A2、5B1 與 5B2、5C1 與 5C2、或者 5D1 與 D2 之立體異構混合物，更佳地，R 係選自 5D1、5D2 中描述之殘基及其混合物，更佳地，R 為 5D1 與 5D2 中描述之殘基的混合物，例如具有 10: 90 至 90:10 範圍內，例如 30:70 至 70:30 範圍內，例如 45:55 至 55:45 範圍內之 5D1 與 5D2 莫耳比的混合物。

因此，化合物 (I) 較佳係選自圖 6A1、圖 6A2；圖 6B1、圖 6B2、圖 6C1、圖 6C2、圖 6D1、圖 6D2、圖 6E1、圖 6F1、圖 6G1、圖 6H1、圖 6I1、圖 6J1、圖 6L1、圖 6L2 中描述之化合物及其混合物，例如 6A1 與 6A2、6B1 與 6B2、6C1 與 6C2、或者 6D1 與 6D2 之立體異構混合物，更佳地，化合物(I) 係選自由 6D1、6D2 中描述之化合物及其混合物所組成之群組，更佳地，化合物(I) 為 6D1 與 6D2 中描述之化合物的混合物，例如具有 10: 90 至 90:10 範圍內，例如 30:70 至 70:30 範圍內，例如 45:55 至 55:45 範圍內之 6D1 與 6D2 莫耳比的混合物。

連接子 L

在上式中，L 為如本文所定義之連接子，較佳地，L 為包含 2 至 10 個核苷，例如 2 至 5 個核苷，例如 2 個核苷或由其組成的連接子，其中視情況該等核苷為經磷酸二酯連接之核苷。

作為連接子，L 包含 1 至 10 個之間的經連接之核苷，例如 1、2、3、4、5、6、7、8、9 或 10 個經連接之核苷，例如 2 到 6 個之間的經連接之核苷，例如 2 到 5 個之間的經連接之核苷，例如 2 到 4 個之間的經連接之核苷，或由其組成。在一些實施例中，該連接子包含兩個經連接之核苷酸。因此，該等核苷可以為 DNA 核苷。通常，該等核苷經由磷酸二酯核苷間鍵結連接。此外，連接子 L 可以經由磷酸二酯核苷間鍵結與反義化合物連接。此外，連接子 L 經由適合之官能基與結合物部分 R 連接，例如經由醯胺、胺、醚、酯、磷酸二酯 (-O-P(=O)(-OH)-O-) 或硫代磷酸二酯 (-O-P(=S)(-OH)-O-) 鍵結。應理解，L 可視情況在核苷與將 L 連接至 R 之官能基之間額外地包含烷基或烷基-氧-烷基。在這種情況下，核苷較佳經由磷酸二酯鍵連接至烷基或烷基-氧-烷基，該基團繼而經由適合之官能基連接至 R，例如經由醯胺、胺、醚、酯、磷酸二酯 (-O-P(=O)(-OH)-O-) 或硫代磷酸二酯 (-O-P(=S)(-OH)-O-) 鍵

根據一個較佳實施例，L 為

反義 (A) 寡核苷酸殘基

A 為根據本發明之反義寡核苷酸殘基，該反義寡核苷酸如表 6 中所示，藉由其 5’ 最末端經由 -(L) _n-(O-P(=O)(-OH)-) _p連接至 R。較佳地，A 為選自圖 1A、圖 2A、圖 3A 及圖 4 中描述之殘基的反義寡核苷酸殘基。

因此，化合物 (I) 較佳係選自圖 6A1、圖 6A2; 6B1、圖 6B2、圖 6C1、圖 6C2、圖 6D1、圖 6D2、圖 6E1、圖 6F1、圖 6G1、圖 6H1、圖 6I1、圖 6J1、圖 6L1、圖 6L2 中描述之化合物及其混合物，例如 6A1 與 6A2、6B1 與 6B2、6C1 與 6C2、或者 6D1 與 6D2 之立體異構混合物，更佳地，化合物 (I) 係選自 6D1 及 6D2 中描述之化合物及其混合物，更佳地，化合物 (I) 為化合物 6D1 與 6D2 之混合物，較佳地，其中 A 係選自表 6 中所示之反義寡核苷酸，較佳地，其中 A 為選自圖 1A、圖 2A、圖3A、圖 4A、圖 5A、圖 6A、圖 7A 及圖 8A 中描述之殘基的反義寡核苷酸殘基，且 L 為包含 2 至 10 個核苷，例如 2 至 5 個核苷，例如 2 個核苷或由其組成的鏈接子，其中視情況該等核苷為經磷酸二酯連接之核苷，更佳地，其中 L 為

在又一態樣中，R 為具有結構 (I) 之殘基

L 為如本文所定義之連接子，較佳地，L 為包含 2 至 10 個核苷，例如 2 至 5 個核苷，例如 2 個核苷或由其組成的連接子，其中視情況該等核苷為經磷酸二酯連接之核苷，更佳地，L 為

及 A 為根據本發明之反義寡核苷酸，例如表 6 中所示之反義寡核苷酸。

根據本發明之一個態樣，A 為選自圖 1A、圖 2A、圖 3A 及圖 4A 中描述之殘基的反義寡核苷酸殘基，例如，A 為下式之反義寡核苷酸：

本發明提供醫藥組成物，該等醫藥組成物包含本發明之反義寡核苷酸或其結合物以及醫藥上可接受之稀釋劑、載劑、鹽及/或佐劑。

本發明提供一種本發明之反義寡核苷酸或其結合物的醫藥上可接受之鹽。在某些實施例中，醫藥上可接受之鹽選自由鈉鹽、鉀鹽及銨鹽所組成之群組。

本發明提供一種本發明之反義寡核苷酸或其結合物之醫藥溶液，其中該醫藥溶液包含本發明之反義寡核苷酸或其結合物以及醫藥上可接受之溶劑，例如食鹽水。

本發明提供固體粉末形式例如凍乾粉末形式的本發明之反義寡核苷酸或其結合物。

本發明提供一種本發明之反義寡核苷酸或其結合物的醫藥上可接受之鹽。

本發明提供一種根據本發明之反義寡核苷酸或本發明之結合物的醫藥上可接受之鹽，其中該醫藥上可接受之鹽為鈉鹽或鉀鹽。

本發明提供一種醫藥組成物，其包含本發明之反義寡核苷酸或本發明之結合物，或本發明之鹽以及醫藥上可接受之稀釋劑、溶劑、載劑、鹽及/或佐劑。

本發明提供一種在表現 RTEL1 之標靶細胞中抑制 RTEL1 表現之方法，該方法包含向該細胞投予有效量的本發明之反義寡核苷酸、或本發明之結合物、或或本發明之鹽、或本發明之組成物。該方法可以為體內方法或體外方法。

本發明提供一種在個體例如人類中治療及/或預防 HBV 感染之方法，包含投予治療或預防有效量的本發明之反義寡核苷酸、或本發明之結合物、或本發明之鹽、或本發明之組成物，例如以治療及/或預防 HBV 感染，例如慢性 HBV 感染。

在一些實施例中，本發明之反義寡核苷酸、或本發明之結合物、或本發明之鹽、或本發明之醫藥組成物係用於治療及/或預防 HBV 感染，例如慢性 HBV 感染。

本發明提供本發明之反義寡核苷酸、或本發明之結合物、或醫藥組成物、或本發明之鹽，其用於醫藥中。

在又一態樣中，本發明提供在表現 RTEL1 之標靶細胞中抑制 RTEL1 表現之方法，該方法藉由以有效量向該細胞投予本發明之反義寡核苷酸或本發明之結合物來進行。在又一態樣中，本發明提供一種在表現 RTEL1 之標靶細胞中抑制 RTEL1 表現之活體內或活體外方法，該方法藉由以有效量向該細胞投予本發明之反義寡核苷酸或本發明之結合物來進行。例如，細胞可以為人類細胞，例如肝臟細胞，例如肝細胞。

在又一態樣中，本發明提供在經 HBV 感染之細胞中減少 cccDNA 之方法，該方法藉由以有效量向該細胞投予本發明之反義寡核苷酸或本發明之結合物來進行。在又一態樣中，本發明提供在經 HBV 感染之細胞中減少 cccDNA 之活體內或活體外方法，該方法藉由以有效量向該細胞投予本發明之反義寡核苷酸或本發明之結合物來進行。

在又一態樣中，本發明提供治療及/或預防 HBV 感染例如慢性 HBV 感染之方法。

在又一態樣中，本發明之反義寡核苷酸、或本發明之結合物、或本發明之醫藥組成物係用於治療及/或預防病毒性肝臟感染，例如 HBV、HCV、HDV 或寄生蟲感染，例如瘧疾、弓蟲症、利什曼病及錐蟲病，或者肝癌或肝臟中之轉移。

在又一態樣中，本發明提供反義寡核苷酸、或本發明之結合物、或本發明之醫藥組成物，其用於製造治療及/或預防 HBV 感染，例如慢性 HBV 感染之藥物。

在又一態樣中，本發明提供反義寡核苷酸、或本發明之結合物、或本發明之醫藥組成物，其用於製造抗病毒藥物。

本發明提供本發明之反義寡核苷酸、或本發明之結合物、或本發明之醫藥組成物，其用於治療 HBV 感染，例如慢性 HBV 感染。

序列表

隨本申請呈送的序列表藉由引用方式併入本文。如果序列表與說明書或圖式不一致，則說明書 (包括圖式) 中揭露之資訊應視為正確。

界定

HBV 感染

術語「B 型肝炎病毒感染 (hepatitis B virus infection)」或「HBV 感染 (HBV infection)」在本領域中是眾所周知的，並且是指由 B 型肝炎病毒 (HBV) 引起並影響肝臟的傳染病。HBV 感染可以是急性或慢性感染。慢性 B 型肝炎病毒 (CHB) 感染係一種全球性疾病負擔，影響全球 2.48 億人。每年約有 686,000 人死於 HBV 相關的終末期肝病及肝細胞癌 (HCC) (GBD 2013; Schweitzer 等人, 2015)。世衛組織預計，如果不擴大干預，在未來 40 至 50 年內，慢性 B 型肝炎感染人數將保持在當下之高水平，2015 年至 2030 年期間將有 2,000 萬人死亡 (WHO 2016)。CHB 感染不是具有單一臨床表現的同種疾病。經感染之個體在其一生中經歷與 CHB 相關之肝病之多個階段；該等疾病階段也是標準照護 (SOC) 治療的基礎。當下之指南建議僅基於以下三個標準治療選定之 CHB 感染個體：血清 ALT 含量、HBV DNA 含量及肝病嚴重程度 (EASL, 2017)。該建議係因為以下事實：SOC 亦即核苷 (酸) 類似物 (NA) 及聚乙二醇化干擾素-α (PEG-IFN) 不具治癒療效且必須長期投予，因而增加了其安全風險。NA 有效抑制 HBV DNA 複製；然而，其等對其他病毒標記之影響非常有限/沒有影響。HBV 感染之兩個標誌，B 型肝炎表面抗原 (HBsAg) 及共價閉合環狀 DNA (cccDNA) 為針對 HBV 治癒之新型藥物的主要標靶。在 CHB 個體之血漿中，HBsAg 次病毒 (空) 顆粒之數量為 HBV 病毒粒子之 10 ³到 10 ⁵倍 (Ganem & Prince, 2014)；據信其過量有助於疾病之免疫發病機制，包括個體無法產生中和抗 HB 抗體，該抗體為在急性 HBV 感染消退後觀察到的血清學標記物。

cccDNA ( 共價閉合環狀 DNA)

cccDNA 為病毒遺傳模板，存在於經感染之肝細胞的細胞核中，其在該處產生了生產性感染所需之所有 HBV RNA 轉錄本，且係慢性 HBV 感染之自然過程期間病毒持續存在的原因 (Locarnini & Zoulim, 2010 Antivir Ther. 15 增刊 3:3-14. doi: 10.3851/IMP1619)。cccDNA 充當病毒儲庫，為治療停止後病毒反彈之來源，需要長期，通常是終生治療。由於其各種副作用，PEG-IFN 只能投予至 CHB 之一個小子集。

因此，迫切需要能夠為大多數 CHB 患者提供完全治癒之新型療法，即降解或消除 HBV cccDNA。

化合物

本文中，術語「化合物」意指能夠抑制 RTEL1 表現或活性之任何分子。本發明之特定化合物為根據本發明之反義寡核苷酸或包含該核酸分子之任何結合物。例如，本文中，化合物可以為靶向 RTEL1 的核酸分子，特別是反義寡核苷酸。

寡核苷酸

本文所用的「寡核苷酸」一詞的定義如同具有通常技術者所知，是指包含兩個或多個共價連結核苷的分子。該等共價鍵結核苷亦可稱為核酸分子或寡聚物。寡核苷酸通常是在實驗室中製作，先經固相化學合成後再加以純化和分離。提及寡核苷酸的序列時，是指共價連結核苷酸或核苷的核鹼基部分或其修飾的序列或順序。本發明之寡核苷酸為人造的，且為化學合成的，通常經過純化或分離。本發明之寡核苷酸可包含一個或多個修飾核苷，如 2’ 糖修飾核苷。本發明之寡核苷酸可包含一個或多個修飾核苷間鍵結，如一個或多個硫代磷酸酯核苷間鍵結。

反義寡核苷酸

如本文所用，術語「反義寡核苷酸」定義為能夠藉由與標靶核酸，特別是標靶核酸上之連續序列雜交而調節標靶基因之表現的寡核苷酸。反義寡核苷酸實質上並非雙股，因此不是 siRNA 或 shRNA。本發明之反義寡核苷酸較佳的是單股。應理解，只要跨寡核苷酸全長之序列內或序列間自我互補程度低於 50%，本發明之單股寡核苷酸便可形成髮夾或分子間雙鏈體結構 (同一寡核苷酸的兩個分子之間的雙鏈體)。

在一些實施例中，本發明之單股反義寡核苷酸可以不含有 RNA 核苷。

有利的是，本發明之反義寡核苷酸含有一個或多個修飾核苷或核苷酸，例如 2’ 糖修飾核苷。此外，有利的是，所述未經修飾的核苷是 DNA 核苷。

連續核苷酸序列

術語「連續核苷酸序列」指代寡核苷酸之與標靶核酸互補的區域。在本文中，該術語可與「連續核鹼基序列」和「寡核苷酸模體序列」交替使用。在某些實施例中，該寡核苷酸的全部核苷組成該連續核苷酸序列。在某些實施例中，該寡核苷酸包含該連續核苷酸序列，如 F-G-F’ 間隙子區域，且可視情況包含一個或多個其他核苷酸，例如可用於將官能基團 (例如，結合物基團) 連附至該連續核苷酸序列之核苷酸連接子區域。所述核苷酸連接子區域可與標靶核酸互補或不互補。在某些實施例中，該反義寡核苷酸的該核鹼基序列為該連續核苷酸序列。

核苷酸和核苷

核苷酸和核苷為寡核苷酸及聚核苷酸的建構組元，在本發明中，包括自然產生及非自然產生核苷酸和核苷。在本質上，例如 DNA 及 RNA 核苷酸等核苷酸包含核糖部分、核鹼基部分以及一個或多個磷酸根 (核苷中則無磷酸根)。核苷及核苷酸亦可互換稱為「單元」或「單體」。

修飾核苷

本文中所用的「修飾核苷」或「核苷修飾」一詞意指藉由導入糖部分或 (核) 鹼基部分的一個或多個修飾，對照相等 DNA 或 RNA 核苷進行修飾的核苷。有利的是，本發明之反義寡核苷酸之修飾核苷中的一個或多個包含修飾糖部分。「修飾核苷」一詞在本文中亦可與「核苷類似物」或修飾「單元」或修飾「單體」等詞互換使用。本文中將具有未修飾 DNA 或 RNA 糖部分的核苷稱為 DNA 或 RNA 核苷。在 DNA 或 RNA 核苷的鹼基區域中包含修飾的核苷，若允許瓦特生克立克 (Watson Crick) 鹼基配對，則大體上仍稱為 DNA 或 RNA。

修飾核苷間鍵結

「修飾核苷間鍵結」一詞，如具有通常技術者所知之定義，是指除磷酸二酯 (PO) 鍵結以外，可將兩個核苷共價耦接在一起的鍵結。因此，本發明之寡核苷酸可包含一個或多個經修飾之核苷間鍵結，例如一個或多個硫代磷酸酯核苷間鍵結，或一個或多個二硫代磷酸酯核苷間鍵結。

在一些實施例中，該寡核苷酸或其連續核苷酸序列中之該等核苷間鍵結中的至少 50% 為硫代磷酸酯，該寡核苷酸或其連續核苷酸序列中之該等核苷間鍵結中的例如至少 60%，例如至少 70%，例如至少 75%，例如至少 80% 或例如至少 90% 為硫代磷酸酯。在某些實施例中，該寡核苷酸或其連續核苷酸序列中的所有該核苷間鍵結均為硫代磷酸酯。

在某些有利的實施例中，該寡核苷酸的該連續核苷酸序列的所有該核苷間鍵結均為硫代磷酸酯，或該寡核苷酸的所有該核苷間鍵結均為硫代磷酸酯鍵結。

應知，如 EP 2 742 135 中所揭露，反義寡核苷酸可包含其他核苷間鍵結 (磷酸二酯、硫代磷酸酯及二硫代磷酸酯除外)，例如磷酸烷酯/磷酸甲酯核苷間，其依據 EP 2 742 135 可例如耐受於缺口區域中不同狀態之 DNA 硫代磷酸酯。

核鹼基

術語核鹼基包括存在於核苷及核苷酸中之嘌呤 (例如，腺嘌呤及鳥嘌呤) 及嘧啶 (例如，尿嘧啶、胸腺嘧啶及胞嘧啶) 部分，其在核酸雜交中形成氫鍵。在本發明範圍內，術語核鹼基亦包含與自然產生核鹼基不同但在核酸雜交過程中具有功能性的修飾核鹼基。於本說明書中，「核鹼基」意指例如腺嘌呤、鳥嘌呤、胞嘧啶、胸苷、脲嘧啶、黃嘌呤和次黃嘌呤等自然產生核鹼基以及非自然產生變異體。此類變異體例如是 Hirao 等人 (2012) Accounts of Chemical Research vol 45 page 2055 以及 Bergstrom (2009) Current Protocols in Nucleic Acid Chemistry Suppl. 37 1.4.1 中所描述的變異體。

在某些實施例中，該核鹼基部分藉由將嘌呤或嘧啶改變為修飾嘌呤或嘧啶而被修飾，如取代嘌呤或取代嘧啶，如選自異胞嘧啶、偽異胞嘧啶、5-甲基胞嘧啶、5-噻唑並-胞嘧啶、5-丙炔基-胞嘧啶、5-丙炔基-脲嘧啶、5-溴脲嘧啶、5-噻唑並-脲嘧啶、2-硫基-脲嘧啶、2’硫基-胸腺嘧啶、肌苷、二胺基嘌呤、6-胺基嘌呤、2-胺基嘌呤、2,6-二胺基嘌呤及 2-氯-6-胺基嘌呤的核鹼基。

該核鹼基部分可用每一對應的核鹼基的字母代碼表示，例如 A、T、G、C 或 U，其中各字母可視情況包括對等功能的修飾核鹼基。例如，在例示的寡核苷酸中，所述核鹼基部分選自 A、T、G、C 及 5-甲基胞嘧啶。視情況，5-甲基胞嘧啶 LNA 核苷可用於 LNA 間隙子。

修飾寡核苷酸

修飾寡核苷酸一詞描述包含一個或多個糖修飾核苷及/或修飾核苷間鍵結的寡核苷酸。「嵌合寡核苷酸」一詞在文獻中用於描述包含糖修飾核苷和DNA核苷的寡核苷酸。本發明之反義寡核苷酸有利地為嵌合寡核苷酸。

互補性

「互補性」一詞是用來形容核苷/核苷酸的瓦特生克立克 (Watson-Crick) 鹼基配對能力。瓦特生克立克 (Watson-Crick) 鹼基對是鳥嘌呤 (G) - 胞嘧啶 (C) 及腺嘌呤 (A) - 胸腺嘧啶 (T)/脲嘧啶 (U)。應知寡核苷酸可包含具有修飾核鹼基的核苷，例如 5-甲基胞嘧啶經常用來取代胞嘧啶，因此互補性一詞包括非修飾核鹼基與修飾核鹼基之間的瓦特生克立克 (Watson-Crick) 鹼基配對 (見例如 Hirao 等人 (2012) Accounts of Chemical Research vol 45 page 2055 以及 Bergstrom (2009) Current Protocols in Nucleic Acid Chemistry Suppl 37 1.4.1)。

本文所用的「% 互補」一詞意指核酸分子 (例如寡核苷酸) 中的連續核苷酸序列中與參考序列 (例如標靶序列或序列模體) 互補的核苷酸所佔的比例 (百分比)，該核酸分子橫跨該連續核苷酸序列。互補性百分率的計算方式是先算出兩個序列間互補 (形成瓦特生克立克 (Watson-Crick) 鹼基對) 的對齊核鹼基 (當對齊於標靶序列 5’-3’ 及寡核苷酸序列 3’-5’) 的數目，將該數字除以所述寡核苷酸中的核苷酸總數，再乘以 100。在該等比對中，未對齊 (形成鹼基對) 的核鹼基/核苷酸稱為錯配。計算連續核苷酸序列的 % 互補性時不可進行插入和刪除。應知在判定互補性時，只要核鹼基形成瓦特生克立克 (Watson-Crick) 鹼基配對的功能留存，即可不考量核鹼基的化學修飾 (例如在計算 % 相同度時，5’-甲基胞嘧啶與胞嘧啶視為相同)。

「完全互補」意指具有 100% 互補性。

相同度

本文所用的「相同度」一詞意指核酸分子 (例如寡核苷酸) 中的連續核苷酸序列中與參考序列 (例如序列模體) 完全相同的核苷酸所佔的比例 (以百分比表達)，該核酸分子橫跨該連續核苷酸序列。相同度百分比的計算方式是，算出兩個序列 (在本發明之化合物的連續核苷酸序列中及在參考序列中) 之間相同 (為一個匹配) 的對齊核鹼基的數目，將該數字除以寡核苷酸中的核苷酸總數，再乘以 100。因此，相同度百分比 = (匹配數 x 100)/對齊區域 (例如連續核苷酸序列) 長度。計算連續核苷酸序列的相同度百分比時不可對序列進行插入和刪除。應知在判定相同度時，只要核鹼基形成瓦特生克立克 (Watson-Crick) 鹼基配對的功能留存，即可不考量核鹼基的化學修飾 (例如在計算 % 相同度時，5’-甲基胞嘧啶與胞嘧啶視為相同)。

雜交

本文所用的「雜交」一詞理解為兩股核酸鏈 (例如一股寡核苷酸及一股標靶核酸) 在相對股上的鹼基對之間形成氫鍵，從而形成雙鏈體 (duplex)。兩股核酸之間的結合親和力是指雜交的強度。其通常用融化溫度 (T _m) 來描述，所述融化溫度的定義是一半寡核苷酸與標靶核酸形成雙鏈體時的溫度。在生理條件下，T _m並非嚴格地與親和力成比例 (Mergny 與 Lacroix, 2003, Oligonucleotides 13:515–537)。標準狀態吉布斯自由能 ΔG° 更能準確代表結合親和力，並且與反應的離解常數 (K _d) 之間具有 ΔG° = -RTln(K _d) 的關係，其中 R 是氣體常數，而 T 是絕對溫度。因此，寡核苷酸與該標靶核酸之間的反應的非常低的 ΔG° 體現該寡核苷酸與該標靶核酸之間的強勢雜交。ΔG° 為與其中含水濃度為 1M、pH 為 7、溫度為 37℃ 之反應關聯的能量。寡核苷酸與標靶核酸之雜交為自發性反應，而自發性反應之 ΔG° 小於零。ΔG° 可經由實驗來測量：例如，利用如 Hansen 等人 1965 年在 Chem.Comm.36–38 及 Holdgate 等人, 2005, Drug Discov Today 中所述之等溫滴定量熱法 (ITC)。具有通常技術者應知，市面上可購得用於測量 ΔG° 的商用設備。ΔG° 亦可透過數值方式進行估計，例如藉由利用 SantaLucia 於 1998 年在 Proc Natl Acad Sci USA.95: 1460–1465 中描述的最近鄰模型或利用 Sugimoto 等人., 1995, Biochemistry 34:11211–11216 及 McTigue 等人, 2004, Biochemistry 43:5388–5405 中描述的適當取得之熱力學參數。為了能夠經由雜交調節本發明之寡核苷酸的預期核酸標靶，將長度為 10-30 個核苷酸的寡核苷酸以低於 -10 千卡的估計 ΔG° 值雜交至標靶核酸。在某些實施例中，雜交的程度或強度藉由標準狀態吉布斯自由能 ΔG° 來測量。長度為 8 至 30 個核苷酸的寡核苷酸可以低於 -10 千卡範圍的估計 ΔG° 值雜交至標靶核酸，例如低於 -15 千卡，例如低於 -20 千卡，及例如低於 -25 千卡。在一些實施例中，以 -10 至 -60 kcal、例如 -12 至 -40 kcal、例如 -15 至 -30 kcal、或 -16 至 -27 kcal、例如 -18 至 -25 kcal 的估計 ΔG° 值，該寡核苷酸與標靶核酸雜交。

標靶

如本文所用，術語「標靶」指代哺乳動物蛋白 RTEL1 (「端粒延長解旋酶調節因子 1」)，或者稱為「KIAA1088」或「C20ORF41」或「端粒長度之調節因子」或「端粒長度調節因子」或「染色體 20 開讀框 41」。智人 RTEL1 基因位於第 20 號染色體，63,657,810 至 63,696,253，補體 (智人更新註釋，版本 109.20200228，GRCh38.p13)。RTEL1 蛋白係一種 ATP 依賴性 DNA 解旋酶，與端粒長度調節、DNA 修復及基因體穩定性之維持有關。人類 RTEL1 之胺基酸序列係本領域已知者並且可以經由 UniProt 評估，參見關於人類 RTEL1 之 UniProt 條目 Q9NZ71，其藉由引用併入本文。

標靶核酸

根據本發明，標靶核酸為編碼哺乳動物 RTEL1 之核酸且可以例如為基因、RNA、mRNA 及前驅 mRNA、成熟 mRNA 或 cDNA 序列。因此標靶可稱為 RTEL1 標靶核酸。

本發明之反義寡核苷酸可以例如靶向哺乳動物 RTEL1 之外顯子區域，或可以例如靶向 RTEL1 前驅 mRNA 中之內含子區域。人類 RTEL1 基因編碼 15 個轉錄本，此等轉錄本中之 7 個係蛋白質編碼者，因此為潛在之核酸標靶。表 3 列述該等 7 個轉錄本之預測外顯子及內含子區域，定位在 SEQ ID NO: 1 之人類 RTEL1 前驅 mRNA 上。

表 3.用於不同蛋白質編碼 RTEL1 mRNA 轉錄本的人類 RTEL1 前驅 mRNA (SEQ ID NO: 1) 中之轉錄本、外顯子及內含子區域

轉錄本 ID	轉錄本區域	外顯子區域	內含子區域
開始	結束	外顯子	開始	結束	內含子	開始	結束
RTEL1-205 ENST00000370018	1	38444	1	1	657	1	657	1424
		2	1424	1695	2	1695	3489
		3	3489	3687	3	3687	4041
		4	4041	4134	4	4134	4737
		5	4737	4818	5	4818	5020
		6	5020	5080	6	5080	8195
		7	8195	8270	7	8270	9660
		8	9660	9744	8	9744	14747
		9	14747	14812	9	14812	16131
		10	16131	16284	10	16284	20336
		11	20336	20374	11	20374	20459
		12	20459	20537	12	20537	22040
		13	22040	22137	13	22137	22855
		14	22855	22910	14	22910	27714
		15	27714	27788	15	27788	27982
		16	27982	28063	16	28063	29829
		17	29829	29961	17	29961	30128
		18	30128	30241	18	30241	30330
		19	30330	30370	19	30370	30492
		20	30492	30577	20	30577	30719
		21	30719	30796	21	30796	31246
		22	31246	31323	22	31323	31693
		23	31693	31839	23	31839	31941
		24	31941	32056	24	32056	32278
		25	32278	32401	25	32401	32485
		26	32485	32632	26	32632	32996
		27	32996	33138	27	33138	33933
		28	33933	34028	28	34028	34996
		29	34996	35194	29	35194	35334
		30	35334	35474	30	35474	36563
		31	36563	36679	31	36679	36932
		32	36932	37165	32	37165	37257
		33	37257	37412	33	37412	37519
		34	37519	37671	34	37671	37969
		35	37969	38444
RTEL1-203 ENST00000360203	485	38433	1	485	657	1	657	1424
		2	1424	1695	2	1695	3489
		3	3489	3687	3	3687	4041
		4	4041	4134	4	4134	4737
		5	4737	4818	5	4818	5020
		6	5020	5080	6	5080	8195
		7	8195	8270	7	8270	9660
		8	9660	9744	8	9744	14747
		9	14747	14812	9	14812	16131
		10	16131	16284	10	16284	20336
		11	20336	20374	11	20374	20459
		12	20459	20537	12	20537	22040
		13	22040	22137	13	22137	22855
		14	22855	22910	14	22910	27714
		15	27714	27788	15	27788	27982
		16	27982	28063	16	28063	29829
		17	29829	29961	17	29961	30128
		18	30128	30241	18	30241	30330
		19	30330	30370	19	30370	30492
		20	30492	30577	20	30577	30719
		21	30719	30796	21	30796	31246
		22	31246	31323	22	31323	31693
		23	31693	31839	23	31839	31941
		24	31941	32056	24	32056	32278
		25	32278	32401	25	32401	32485
		26	32485	32632	26	32632	32996
		27	32996	33138	27	33138	33933
		28	33933	34028	28	34028	34996
		29	34996	35194	29	35194	35334
		30	35334	35474	30	35474	36563
		31	36563	36679	31	36679	36932
		32	36932	37165	32	37165	37257
		33	37257	37412	33	37412	37519
		34	37519	37841	34	37841	37969
		35	37969	38433
RTEL1-212 ENST00000508582	482	38171	1	482	657	1	657	1424
		2	1424	1695	2	1695	3489
		3	3489	3687	3	3687	4041
		4	4041	4134	4	4134	4665
		5	4665	4818	5	4818	5020
		6	5020	5080	6	5080	8195
		7	8195	8270	7	8270	9660
		8	9660	9744	8	9744	14747
		9	14747	14812	9	14812	16131
		10	16131	16284	10	16284	20336
		11	20336	20374	11	20374	20459
		12	20459	20537	12	20537	22040
		13	22040	22137	13	22137	22855
		14	22855	22910	14	22910	27714
		15	27714	27788	15	27788	27982
		16	27982	28063	16	28063	29829
		17	29829	29961	17	29961	30128
		18	30128	30241	18	30241	30330
		19	30330	30370	19	30370	30492
		20	30492	30577	20	30577	30719
		21	30719	30796	21	30796	31246
		22	31246	31323	22	31323	31693
		23	31693	31839	23	31839	31941
		24	31941	32056	24	32056	32278
		25	32278	32401	25	32401	32485
		26	32485	32632	26	32632	32996
		27	32996	33138	27	33138	33933
		28	33933	34028	28	34028	34996
		29	34996	35194	29	35194	35334
		30	35334	35474	30	35474	36563
		31	36563	36679	31	36679	36932
		32	36932	37165	32	37165	37257
		33	37257	37412	33	37412	37519
		34	37519	37671	34	37671	37969
		35	37969	38171
RTEL1-201 ENST00000318100	505	38434	1	505	650	1	650	3489
		2	3489	3687	2	3687	4041
		3	4041	4134	3	4134	4737
		4	4737	4818	4	4818	5020
		5	5020	5080	5	5080	8195
		6	8195	8270	6	8270	9660
		7	9660	9744	7	9744	14747
		8	14747	14812	8	14812	16131
		9	16131	16284	9	16284	20336
		10	20336	20374	10	20374	20459
		11	20459	20537	11	20537	22040
		12	22040	22137	12	22137	22855
		13	22855	22910	13	22910	27714
		14	27714	27788	14	27788	27982
		15	27982	28063	15	28063	29829
		16	29829	29961	16	29961	30128
		17	30128	30241	17	30241	30330
		18	30330	30370	18	30370	30492
		19	30492	30577	19	30577	30719
		20	30719	30796	20	30796	31246
		21	31246	31323	21	31323	31693
		22	31693	31839	22	31839	31941
		23	31941	32056	23	32056	32278
		24	32278	32401	24	32401	32485
		25	32485	32632	25	32632	32996
		26	32996	33138	26	33138	33933
		27	33933	34028	27	34028	34996
		28	34996	35194	28	35194	35334
		29	35334	35474	29	35474	36563
		30	36563	36679	30	36679	36932
		31	36932	37165	31	37165	37257
		32	37257	37412	32	37412	37519
		33	37519	37671	33	37671	37969
		34	37969	38434
RTEL1-202 ENST00000356810	551	16284	1	551	650	1	650	1424
		2	1424	1695	2	1695	3489
		3	3489	3687	3	3687	4041
		4	4041	4134	4	4134	4587
		5	4587	4818	5	4818	5020
		6	5020	5080	6	5080	8195
		7	8195	8270	7	8270	9660
		8	9660	9744	8	9744	14747
		9	14747	14812	9	14812	16131
		10	16131	16284
RTEL1-206 ENST00000425905	30530	33067	1	30530	30577	1	30577	30719
		2	30719	30796	2	30796	31246
		3	31246	31323	3	31323	31941
		4	31941	32056	4	32056	32278
		5	32278	32401	5	32401	32485
		6	32485	32632	6	32632	32996
		7	32996	33067
RTEL1-214 ENST00000646389	811	3653	1	811	943	1	943	1424
		2	1424	1695	2	1695	3489
		3	3489	3653

適合的是，該標靶核酸編碼 RTEL1 蛋白，特別是哺乳動物 RTEL1，例如人類 RTEL1 (參見例如表 3 及表 4)，其提供用於人類及猴 RTEL1 的前驅 mRNA 序列。

在一些實施例中，該標靶核酸係選自 SEQ ID NO: 1 及/或 SEQ ID NO: 2 或其天然出現之變異體 (例如編碼哺乳動物 RTEL1 蛋白之序列)。

若在研究或診斷中採用本發明之反義寡核苷酸或本發明之結合物，則標靶核酸可以為 cDNA 或衍生自 DNA 或 RNA 之合成核酸。

對於活體內或活體外應用，本發明之反義寡核苷酸通常能夠在表現 RTEL1 標靶核酸之細胞中抑制 RTEL1 標靶核酸之表現。本發明之寡核苷酸的核鹼基之連續序列通常與 RTEL1 標靶核酸互補，如在整個反義寡核苷酸長度上所測量，視情況有一個或兩個錯配的例外，且視情況不包括可以將寡核苷酸與視情況存在之官能基例如結合物或其他非互補末端核苷酸 (例如區域 D’或 D’’) 連接的基於核苷酸之連接子區域。在一些實施例中，標靶核酸可以為 RNA 或 DNA，例如訊息 RNA，例如前驅 mRNA，例如人類 RTEL1，例如人類 RTEL1 前驅 mRNA 序列，例如作為 SEQ ID NO: 1 揭露者，或食蟹猴 RTEL1 前驅 mRNA 序列，例如作為 SEQ ID NO: 2 揭露者。SEQ ID NO: 1 及 SEQ ID NO:2 為 DNA 序列 – 應理解，標靶 RNA 序列具有尿嘧啶 (U) 鹼基替代胸苷鹼基 (T)。

表 4 及表 5 中提供有關示例性標靶核酸之進一步資訊。

表 4.RTEL1 跨物種基因組及組裝資訊。

物種	染色體	股	基因組學座標開始結束	組裝	ensembl 基因_id
人	20	fwd	63657810	63696253	GRCh38.p12	ENSG00000258366
食蟹猴	10	fwd	95853726	95890939	Macaca_fascicularis_5.0	ENSMFAG00000043680

Fwd = 正向股。基因組座標提供前 mRNA 序列 (基因組序列)。NCBI 參考提供 mRNA 序列 (cDNA 序列)。

表 5.RTEL1 跨物種序列詳情。

物種	RNA 類型	長度 (核苷酸數)	SEQ ID NO
人	前 mRNA	38444	1
猴	前 mRNA	37214	2

註：SEQ ID NO: 2 包含多個 NNNN 之區域，其中定序已經無法準確地細化序列，因此包括簡併序列。為避免疑問，本發明之化合物與實際標靶序列互補，因此不是簡併化合物。

在一些實施例中，該標靶核酸為 SEQ ID NO: 1。

在一些實施例中，該標靶核酸為 SEQ ID NO: 2。

在一些實施例中，該標靶核酸為 SEQ ID NO: 1 及 SEQ ID NO: 2。

標靶序列

如本文所用，術語「標靶序列」指代存在於標靶核酸中之核苷酸序列，其包含與本發明之寡核苷酸互補的核鹼基序列。在某些實施例中，所述標靶序列包含標靶核酸上的一個區域，所述區域的核鹼基序列與本發明之寡核苷酸的連續核苷酸序列為互補。所述標靶核酸的此一區域也可互換地稱為標靶核苷酸序列、標靶序列或標靶區域。在一些實施例中，標靶序列比單一寡核苷酸之互補序列更長，且可能例如代表標靶核酸之較容易被本發明之數種寡核苷酸所靶向之區域。

本發明之寡核苷酸包含連續核苷酸序列，該連續核苷酸序列與標靶核酸，例如本文所述之標靶序列互補及雜交。

與該反義寡核苷酸互補之標靶序列通常包含至少 10 個核苷酸之連續核鹼基序列。該連續核苷酸序列的長度在 10 至 30 個核苷酸之間，如 12 至 30 個核苷酸 (如 14 至 20 個)，如 15 至 18 個連續核苷酸 (如 15 個、16 個、17 個連續核苷酸)。

標靶序列區域

發明人已經鑑定了 RTEL1 標靶核酸之特別有效之序列，該序列可以被本發明之寡核苷酸或其結合物靶向。

在一些實施例中，該標靶序列為 SEQ ID NO: 7。

在一些實施例中，該標靶序列為 SEQ ID NO: 8。

在一些實施例中，該標靶序列為 SEQ ID NO: 9。

在一些實施例中，該標靶序列為 SEQ ID NO: 10。

在一些實施例中，該標靶序列為 SEQ ID NO: 11。 SEQ ID NO 7：TTTGACCAGAGTATGTAAAATT SEQ ID NO 8：ACCAGAGTATGTAAAATT SEQ ID NO: 9：GACCAGAGTATGTAAAATT SEQ ID NO: 10：TTTGACCAGAGTATGTAA SEQ ID NO: 11：GAGATTCAAGTTATAATAAAG

SEQ ID NO: 7 至 SEQ ID NO: 11 為 DNA 序列 – 應理解，標靶 RNA 序列具有尿嘧啶 (U) 鹼基替代胸苷鹼基 (T)。

SEQ ID NO: 7 至 SEQ ID NO: 10 所示之標靶序列可以在人類 RTEL1 之內含子 8 中找到。SEQ ID No: 11 所示之標靶序列可以在人類 RTEL1 之內含子 7 中找到。

在一些實施例中，該標靶序列為來自 SEQ ID NO: 1 之核苷酸 11753-11774 的區域。

在一些實施例中，該標靶序列為來自 SEQ ID NO: 1 之核苷酸 11757-11774 的區域。

在一些實施例中，該標靶序列為來自 SEQ ID NO: 1 之核苷酸 11756-11774 的區域。

在一些實施例中，該標靶序列為來自 SEQ ID NO: 1 之核苷酸 11753-11770 的區域。

在一些實施例中，該標靶序列為來自 SEQ ID NO: 1 之核苷酸 8681-8701 的區域。

標靶細胞

如本文所用，術語「標靶細胞」指代表現標靶核酸之細胞。在一些實施例中，標靶細胞可以為活體內細胞或活體外細胞。在某些實施例中，該標靶細胞為哺乳動物細胞 (如囓齒動物細胞、小鼠細胞或大鼠細胞)，或靈長類動物細胞 (如猴子細胞或人類細胞等)。

一般而言，該標靶細胞表達 RTEL1 mRNA，如 RTEL1 前 mRNA 或 RTEL1 成熟 mRNA。對於實驗評估，可以使用表現包含標靶序列之核酸 (例如人類 RTEL1 前驅 mRNA，例如 SEQ ID NO: 1) 的標靶細胞。

RTEL1 mRNA 的複 A 尾部在反義寡核苷酸標定上通常予以忽略。

本發明之反義寡核苷酸通常能夠例如在活體內或活體外在表現 RTEL1 標靶核酸之細胞 (標靶細胞) 中抑制 RTEL1 標靶核酸之表現。

此外，標靶細胞可以為肝細胞。在一個實施例中，標靶細胞為 HBV 感染之原代人類肝細胞，其來源於 HBV 感染之個體或來源於具有人源化肝臟之 HBV 感染之小鼠 (PhoenixBio，PXB 小鼠)。

根據本發明，標靶細胞可以被 HBV 感染。此外，標靶細胞可以包含 HBV cccDNA。因此，該標靶細胞較佳包含 RTEL1 mRNA，例如 RTEL1 前驅 mRNA 或 RTEL1 成熟 mRNA 以及 HBV cccDNA。

自然產生之變異體

「自然產生變體」一詞意指與所述標靶核酸源自相同基因座但可有差異的 RTEL1 基因或轉錄的變體，所述差異可例如是出於基因碼簡併造成多重密碼子編碼同一個胺基酸，或因前 mRNA 的選擇性剪接，或多態性的存在，例如單核苷酸多態性 (SNP) 及等位基因變體。基於與寡核苷酸的足夠互補序列的存在，本發明的寡核苷酸因此可以靶向標靶核酸及其自然產生的變異體。

在一些實施例中，自然產生之變異體與哺乳動物 RTEL1 標靶核酸，例如 SEQ ID NO:1 之標靶核酸，具有至少 95%，例如至少 98% 或至少 99% 的同源性。在一些實施例中，自然產生之變異體與 SEQ ID NO: 1 之人類 RTEL1 標靶核酸具有至少 99% 的同源性。

表現的抑制

本文所用的「表現的抑制」一詞應理解為寡核苷酸抑制標靶細胞中 RTEL1 的量或活性的能力的總稱。可以藉由測量 RTEL1 前 mRNA 或 RTEL1 mRNA 的水平，或藉由測量細胞中 RTEL1 或 RTEL1 活性的水平來判定活性的抑制。因此可以在活體外或活體內測定表現之抑制。

一般而言，藉由比較對標靶細胞投予有效量的該反義寡核苷酸而產生的活性抑制，並將該水平與不投予該反義寡核苷酸而從標靶細胞獲得的參考水平或已知的參考水平 (例如在投予有效量的該反義寡核苷酸之前的表現水平或預定的或其他已知的表現水平) 進行比較 (對照實驗) 來判定表現抑制。

例如，對照實驗可以為動物或人，或用鹽水組成物或參考寡核苷酸處理的標靶細胞 (通常是加擾的對照)。

術語抑制 (inhibition) 或抑制 (inhibit) 亦可以稱為下調、減少、阻遏、減輕、降低 RTEL1 例如 RTEL1 前驅 mRNA 之表現。

表現之抑制可以例如藉由前驅 mRNA 或 mRNA (例如使用 RNaseH 招募寡核苷酸，例如間隙子) 之降解而發生。

高親和力修飾核苷

高親和力修飾核苷係一種修飾核苷酸，當併入該寡核苷酸中時，可提升該寡核苷酸對其互補標靶至親和力，例如，如藉由解鏈溫度 (Tm) 所測量。本發明之高親和力修飾核苷較佳地導致每一修飾核苷之解鏈溫度增加 +0.5 至 +12℃ 之間，更佳 +1.5 至 +10℃ 之間，最佳 +3 至 +8℃ 之間。該技術領域中已有眾多已知之高親和力修飾核苷，包括例如許多 2’ 取代之核苷以及鎖核酸 (LNA) (參見例如 Freier & Altmann; Nucl. Acid Res., 1997, 25, 4429-4443 及 Uhlmann; Curr. Opinion in Drug Development, 2000, 3(2), 293-213)。

糖修飾

本發明之寡聚物可包含一個或多個具有經修飾之糖部分的核苷，亦即與 DNA 及 RNA 中之核糖糖部分相較為經過修飾的糖部分。

目前已製成了眾多包含經修飾核糖部分的核苷，主要目的為改善寡核苷酸的特定特性，例如親和力及/或核酸酶抗性。

此種修飾包括對核糖環結構的修飾，例如取代為己糖環 (HNA)，或通常在核糖環 (LNA) 上的 C2 與 C4 碳原子之間具有雙自由基橋，或通常在 C2 與 C3 碳原子之間無鍵的未連結核糖環 (例如 UNA)。其他糖修飾核苷包括，例如，雙環己糖核酸 (WO2011/017521) 或三環核酸 (WO2013/154798)。修飾核苷也包括將糖部分取代為非糖部分的核苷，例如胜肽核酸 (PNA) 或嗎啉基核酸的情形。

糖修飾也包括經由將核糖環上的取代基團改變為除在 DNA 及 RNA 核苷中自然存有的氫或 2’-OH 基團以外的基團來進行修飾。取代基可例如在 2’、3’、4’ 或 5’位置導入。

2’ 糖修飾核苷

2’ 糖修飾核苷是在 2’ 位置 (2’ 取代的核苷) 具有非 H 或 –OH 的取代基的核苷或包含能夠在核糖環中的 2’ 碳與第二碳之間形成架橋的 2’ 連結雙自由基的核苷，如 LNA (2’ – 4’ 雙自由基架橋) 核苷。

更確切地，2’ 糖取代核苷的開發頗受關注，目前也已發現許多 2’ 取代核苷在併入寡核苷酸中時具有助益特性。例如，2’ 修飾糖可加強所述寡核苷酸的結合親和力及/或增加所述寡核苷酸的核酸酶抗性。2’ 取代修飾核苷的實例包括 2’-O-烷基-RNA、2’-O-甲基-RNA、2’-烷氧基-RNA、2’-O-甲氧基乙基-RNA (MOE)、2’-胺基-DNA、2’-氟基-RNA 及 2’-F-ANA 核苷。對於又一些實例，請參閱例如 Freier & Altmann; Nucl. Acid Res., 1997, 25, 4429-4443 及 Uhlmann; Curr. Opinion in Drug Development, 2000, 3(2), 293-213 以及 Deleavey 與 Damha, Chemistry and Biology 2012, 19, 937。以下為 2’ 取代修飾核苷的圖解。

在本發明中，2’ 取代糖修飾核苷並不包括 2’ 橋接核苷，如 LNA。

鎖核酸核苷 (LNA 核苷 )

「LNA 核苷」是一種 2’- 修飾核苷，所述 2’- 修飾核苷包含連結所述核苷的核糖環之 C2’ 與 C4’ 的雙自由基 (此雙自由基亦稱為「2’ - 4’ 架橋」)，其可限制或鎖定所述核糖環的構造。該等核苷於文獻中也稱為橋接核酸或雙環核酸 (BNA)。鎖定核糖的構造，可在將 LNA 併入寡核苷酸中而產生互補 RNA 或 DNA 分子時提升雜交親和力 (雙鏈體穩定化)。藉由測量寡核苷酸/補體雙鏈體的融化溫度，可對此進行常規的判定。

非限制性地，例示性 LNA 核苷於 WO 99/014226、WO 00/66604、WO 98/039352、WO 2004/046160、WO 00/047599、WO 2007/134181、WO 2010/077578、WO 2010/036698、WO 2007/090071、WO 2009/006478、WO 2011/156202、WO 2008/154401、WO 2009/067647、WO 2008/150729、Morita 等人，Bioorganic & Med.Chem.Lett.12, 73-76，Seth 等人 J. Org.Chem. 2010, Vol 75(5) pp. 1569-81 及 Mitsuoka 等人，Nucleic Acids Research 2009, 37(4), 1225-1238 以及 Wan 與 Seth，J. Medical Chemistry 2016, 59, 9645−9667 中揭露。

方案 1 中揭露了其他非限制性例示 LNA 核苷。

方案 1：

特定 LNA 核苷為 β-D-氧基-LNA、6’-甲基-β-D-氧基 LNA，如 (S)-6’-甲基-β-D-氧基-LNA (ScET) 及 ENA。具有特定優勢的 LNA 為 β-D-氧基-LNA。

核酸酶媒介之降解

核酸酶中介降解意指一寡核苷酸能夠在與互補核苷酸序列形成雙股螺旋時，居中影響所述序列的降解。

在一些實施例中，該寡核苷酸可經由核酸酶媒介之標靶核酸的降解而發揮作用，其中本發明之寡核苷酸能夠招募核酸酶，特別是核酸內切酶，較佳是核糖核酸酶 (RNase)，例如核糖核酸酶 H。經由核酸酶媒介機轉而運作之寡核苷酸設計的實例為寡核苷酸，該等寡核苷酸通常包含長度為至少 5 或 6 個接連 DNA 核苷的區域，且在一側或兩側上側接有親和力增強型核苷，例如間隙子。

RNase H 活性與招募

反義寡核苷酸的 RNase H 活性是指當其與互補 RNA 分子在雙鏈體中時，招募 RNase H 的能力。WO01/23613 提供用於測定核糖核酸酶 H 活性之活體外方法，該方法可用於測定招募核糖核酸酶 H 的能力。以使用具有與所測試的經修飾之寡核苷酸相同的鹼基序列但在寡核苷酸中所有單體之間僅包含具有硫代磷酸酯鍵結的 DNA 單體之寡核苷酸，並且使用 WO01/23613 (藉由引入併入於此) 提供的實例 91 至 95 所述之方法，以皮莫耳/公升/分鐘 (pmol/l/min) 為單位測量的初始速率為基準，如果寡核苷酸與互補標靶核酸序列反應之初始速率為上述基準初始速率的至少 5%，例如至少 10% 或超過 20%，則通常認為該寡核苷酸能夠招募核糖核酸酶 H。為了用於測定 RNase H 活性，重組人類 RNase H1 (與大腸桿菌中表現之 His 標籤融合的重組人類 H1) 可從 Creative Biomart® 獲得。

間隙子

本發明之反義寡核苷酸，或其連續核苷酸序列，可為一間隙子，亦稱為間隙子寡核苷酸或間隙子設計。反義間隙子常用於透過核糖核酸酶 H 中介降解來抑制標靶核酸。一個間隙子寡核苷酸包含至少三個有區別的結構區域，也就是一個 5’-側翼、一個缺口和一個 3’-側翼，F-G-F’ 為 ‘5 -＞ 3’ 方向。該「缺口」區域 (G) 包含一段使得寡核苷酸能夠招募 RNase H 的連續 DNA 核苷酸。該缺口區域側接包含一個或多個糖修飾核苷 (有利的是高親和力糖修飾核苷) 的 5’ 側翼區域 (F)，且側接包含一個或多個糖修飾核苷 (有利的是高親和力糖修飾核苷) 的 3’ 側翼區域 (F’)。區域 F 及 F’ 中之一個或多個糖修飾核苷可增強寡核苷酸對於標靶核酸的親和力 (亦即其為親和力增強型糖修飾核苷)。在某些實施例中，區域 F 及 F’ 中的一或多個糖修飾核苷是 2’ 糖修飾核苷，例如高親和力 2’ 糖修飾，例如獨立選自 LNA 及 2’-MOE。

在間隙子設計中，缺口區域的 5’ 及 3’ 多數核苷為 DNA 核苷，且位置分別鄰近 5’ (F) 或 3’ (F’) 區域的糖修飾核苷。該側翼可進一步定義為在距離該缺口區域最遠之端具有至少一個糖修飾核苷，即在 5’ 側翼的 5’ 端及在 3’ 側翼的 3’ 端。在一些實施例中，式 F-G-F' 之間隙子區域的核苷之間的所有核苷間鍵結皆為硫代磷酸酯核苷間鍵結。

區域 F-G-F’ 形成一個連續核苷酸序列。本發明之反義寡核苷酸，或其連續核苷酸序列，可包含式 F-G-F’ 的間隙子區域。

該間隙子設計 F-G-F’ 之整體長度可以為，例如 12 至 32 個核苷，例如 13 至 24 個，例如 14 至 22 個核苷，例如 15 至 20 個，例如 16 至 18 個核苷。

舉例而言，本發明之間隙子寡核苷酸可由下式代表： F _1-8-G _5-16-F’ _1-8，例如 F _1-8-G _7-16-F’ _2-8或 F _1-8-G _11-16-F’ _2-8，附帶條件是所述間隙子區域 F-G-F’ 的整體長度為至少 12 個，例如至少 14 個核苷酸。

在本發明之一個態樣中，該反義寡核苷酸或其連續核苷酸序列包含式 5’-F-G-F’-3’ 的間隙子或由其組成，其中區域 F 及 F' 獨立地包含 1 至 8 個核苷或由其組成，其中 1 至 4 個核苷經 2' 糖修飾，並限定區域 F 及 F' 的 5’ 及和 3' 端，並且 G 為 6 至 16 個核苷之間的區域，其能夠招募 RNase H。

以下進一步定義了區域 F、G 及 F'，並且可以將其合併到 F-G-F’ 式中。

間隙子 - 區域 G

間隙子之區域 G (缺口區域) 為使得寡核苷酸能夠招募 RNaseH 例如人類 RNase H1 的核苷區域，通常為 DNA 核苷。RNaseH 係一種細胞酶，其可在 DNA 與 RNA 之間辨識雙股螺旋，並酶切 RNA 分子。適合的是，間隙子可具有長度為至少 5 個或 6 個連續 DNA 核苷，例如 5 至 16 個連續 DNA 核苷，例如 6 至 15 個連續 DNA 核苷，例如 7 至 14 個連續 DNA 核苷，例如 8 至 12 個連續 DNA 核苷酸，例如 8 至 12 個連續 DNA 核苷酸的缺口區域 (G).在一些實施例中，缺口區域 G 可由 6、7、8、9、10、11、12、13、14、15 或 16 個連續 DNA 核苷組成。此外，區域 G 可以具有 11 至 16 個連續 DNA 核苷酸的長度。

在一些情況下，缺口區域中的一個或多個胞嘧啶 (C) DNA 可能經甲基化 (例如當 DNA c 後接 DNA g 時)，該等殘基被注釋為 5-甲基-胞嘧啶 ( ^meC)。在一些實施例中，缺口區域 G 可以由 6、7、8、9、10、11、12、13、14、15 或 16 個經硫代磷酸酯連接之連續 DNA 核苷組成。

在一些實施例中，缺口中的所有核苷間鍵結是硫代磷酸酯鍵結。

間隙子 - 側翼區域， F 及 F'

區域 F 緊鄰區域 G 的 5’ DNA 核苷。區域 F 最 3’端的核苷為糖修飾的核苷，諸如高親和力糖修飾的核苷，例如 2’ 取代的核苷，諸如 MOE 核苷，或 LNA 核苷。

區域 F 緊鄰區域 G 的 3’ DNA 核苷。區域 F 最 5’端的核苷為糖修飾的核苷，諸如高親和力糖修飾的核苷，例如 2’ 取代的核苷，諸如 MOE 核苷，或 LNA 核苷。

區域 F 長度為 1 - 8 個連續核苷酸，諸如長度為 2 - 6 個，諸如 2 - 4 個連續核苷酸。在一些實施例中，區域 F 之長度為 2 個連續核苷酸。在一些實施例中，區域 F 之長度為 3 個連續核苷酸。在一些實施例中，區域 F 之長度為 4 個連續核苷酸。

有利地，區域 F 的 5’ 最末端核苷為糖修飾核苷。在一些實施例中，區域 F 的兩個 5' 最末端核苷為糖修飾核苷。在一些實施例中，區域 F 的 5' 最末端核苷為 LNA 核苷。在一些實施例中，區域 F 的兩個 5’ 最末端核苷為 LNA 核苷。

區域 F’ 的長度為 1 至 8 個連續核苷酸，例如長度為 2 至 6 個連續核苷酸。在一些實施例中，區域 F’ 之長度為 2 個連續核苷酸。在一些實施例中，區域 F’ 之長度為 4 個連續核苷酸。在一些實施例中，區域 F’ 之長度為 5 個連續核苷酸。在一些實施例中，區域 F’ 之長度為 6 個連續核苷酸。

有利地，區域 F’ 的 3’ 最末端核苷為糖修飾核苷。在一些實施例中，區域 F’ 的兩個 3' 最末端核苷為糖修飾核苷。在一些實施例中，區域 F’ 的兩個 3’ 最末端核苷為 LNA 核苷。在一些實施例中，區域 F’ 的 3' 最末端核苷為 LNA 核苷。

應注意，當區域 F 的長度為一個核苷時，其有利地為 LNA 核苷。此外，注意到當區域 F 及/或 F’ 的長度為兩個核苷時，區域 F 及/或 F’ 的兩個核苷有利地為 LNA 核苷。

在一些實施例中，區域 F 及 F’ 中的糖修飾核苷酸僅由一種類型的糖修飾核苷組成，例如僅由 MOE 或僅由 β-D-氧 LNA 或僅由 ScET 組成。該等設計亦稱為均一側翼或均一間隙子設計。

在一些實施例中，區域 F 或 F’或者 F 及 F’ 的所有核苷皆為 LNA 核苷，例如 β-D-氧 LNA 核苷。在替代性實施例中，區域 F 及 F' 的所有糖修飾核苷皆為 LNA 核苷，例如 β-D-氧 LNA 核苷，其中區域 F 或 F' 或者區域 F 及 F’ 兩者可視情況包含 DNA 核苷 (交替側翼，更多詳細資訊參見此等之定義)。

在一些實施例中，區域 F 及 F' 的 5' 最末端及 3' 最末端核苷為 LNA 核苷，例如 β-D-氧 LNA 核苷。

在一些實施例中，區域 F 與區域 G 之間的核苷間鍵結及/或區域 F’ 與區域 G 之間的核苷間鍵結為硫代磷酸酯核苷間鍵結。在一些實施例中，區域 F 或 F’ 之核苷之間、F 與 F’之間的核苷間鍵結為硫代磷酸酯核苷間鍵結。

LNA 間隙子

LNA 間隙子是指其中區域 F 及 F’ 中任一者或兩者都包含或具有 LNA 核苷的間隙子。β-D-氧基間隙子是指其中區域 F 及 F’ 中任一者或兩者都包含或具有 β-D-氧基 LNA 核苷的間隙子。

在某些實施例中，該 LNA 間隙子系如下式：[LNA] _1-5-[區域 G]-[LNA] _1-5，其中區域 G 為或包含能夠招募 RNase H 的連續 DNA 核苷之區域。

MOE 間隙子

MOE 間隙子是其中區域 F 及 F’ 由 MOE 核苷所構成的間隙子。在一些實施例中，MOE 間隙子的設計為 [MOE] _1-8-[區域 G] _5-16-[MOE] _1-8，例如 [MOE] _2-7-[區域 G] _6-14-[MOE] _2-7，例如 [MOE] _3-6-[區域 G] _8-12-[MOE] _3-6，其中區域 G 具有如該間隙子定義中的定義。具有 5-10-5 設計 (MOE-DNA-MOE) 的 MOE 間隙子已廣泛用於本技術領域中。

混合型翼間隙子

混合型翼間隙子是一種 LNA 間隙子，其中區域 F 及 F’ 中的一者或兩者包含 2’ 取代核苷，如獨立選自由 2’-O-烷基-RNA 單元、2’-O-甲基-RNA、2’-胺基-DNA 單元、2’-氟基-DNA 單元、2’-烷氧基-RNA、MOE 單元、阿糖基核酸 (ANA) 單元及 2’-氟基-ANA 單元所組成之群組的 2’ 取代核苷，如 MOE 核苷。在某些實施例中，其中區域 F 及 F’ 中的至少一個或區域 F 及 F’ 兩者均包含至少一個 LNA 核苷，區域 F 及 F’ 的其餘核苷為獨立選自由 MOE 及 LNA 所組成之群組。在某些實施例中，其中區域 F 及 F’ 中的至少一個或區域 F 及 F’ 兩者均包含至少兩個 LNA 核苷，區域 F 及 F’ 的其餘核苷為獨立選自以 MOE 及 LNA 所組成之群組。在某些混合型翼的實施例中，區域 F 及 F’ 中的一或兩者可進一步包含一或多個 DNA 核苷。

交替側翼間隙子

側翼區域可包含 LNA 及 DNA 核苷兩者，並且由於其包含 LNA-DNA-LNA 核苷的交替模體，因此稱為「交替側翼」。包含至少一個交替側翼之間隙子稱為「交替側翼間隙子」。因此，「選擇性側翼間隙子」是指 LNA 間隙子寡核苷酸，其中至少一個側翼 (F 或 F’) 在一個或多個 LNA 核苷之外還包含 DNA。在某些實施例中，區域 F 或 F’ 中的至少一個或兩個包含 LNA 核苷及 DNA 核苷這兩者。在該等實施例中，側翼區域 F 或 F’，或 F 和 F’ 兩者，包含至少三個核苷，其中 F 及/或 F’ 區域的 5’ 及 3’ 多數核苷為 LNA 核苷。交替側翼 LNA 間隙子在 WO2016/127002 中揭露。

一種交替側翼區域可包含至多 3 個連續 DNA 核苷，例如 1 個至 2 個或 1 個或 2 個或 3 個連續 DNA 核苷。

交替側翼區域可以註釋為一系列整數，代表 LNA 核苷 (L) 的數量，然後是 DNA 核苷 (D) 的數量，例如 [L]1-3-[D]1-3-[L]1-3 或 [L]1-2-[D]1-2-[L]1-2-[D]1-2-[L]1-2。在寡核苷酸設計中，此等通常表示為數字，使得 2-2-1 表示 5' [L]2-[D]2-[L] 3'，並且 1-1-1-1-1 表示 5' [L]-[D]-[L ]-[D]-[L] 3'。具有交替側翼之寡核苷酸中的側翼 (區域 F 及 F') 的長度可以如上文針對此等區域所描述者，例如 4 至 8 個，例如 5 至 6 個核苷，例如 4、5、6 或 7 個經修飾之核苷。可能有利的是，在 3' 側翼 (F') 的 3' 末端具有至少兩個 LNA 核苷，以賦予額外的核酸外切酶抗性。

寡核苷酸中的區域 D’ 或 D’’

在一些實施例中，本發明之寡核苷酸可以包含寡核苷酸之連續核苷酸序列或由其組成，該連續核苷酸序列與標靶核酸例如間隙子區域 F-G-F’ 以及進一步之 5’ 及/或 3’ 核苷互補。所述進一步的 5’ 及/或 3’ 核苷可與或不與所述標靶核酸為完全互補。該等進一步的 5’ 及/或 3’ 核苷本文中可稱為區域 D’ 及 D’’。

區域 D’ 或 D’’ 的加入可用於將所述連續核苷酸序列，例如間隙子，連接至結合物部分或另一官能基團。當用於接合所述連續核苷酸序列與結合物部分時，其可做為生物可切斷型連接子。替代性地，其可用於提供核酸外切酶保護或促進合成或製造。

區域 D’ 及 D’’ 可分別連附至區域 F 的 5’ 端或區域 F’ 的 3’ 端，以分別產生下式的設計：D’-F-G-F’、F-G-F’-D’’ 或 D’-F-G-F’-D’’。在此實例中，F-G-F’ 是所述寡核苷酸的間隙子部位，且區域 D’ 或 D’’ 構成所述寡核苷酸的一個分離部分。

區域 D’ 或 D’’ 可獨立包含或具有 1、2、3、4 或 5 個外加核苷酸，其可與所述標靶核酸為互補或不為互補。鄰接 F 或 F’ 區域的核苷酸並非糖修飾核苷酸，例如 DNA 或 RNA 或其鹼基修飾版本。D’ 或 D’’ 區域可做為對核酸酶易感的生物可切斷型連接子 (見連接子定義)。在某些實施例中，該外加 5’ 及/或 3’ 端核苷酸是與磷酸二酯鍵結連結，且為 DNA 或 RNA。適用為區域 D’ 或 D’’ 的核苷酸基生物可切斷型連接子可參照 WO2014/076195 的揭露，舉例而言可包括磷酸二酯連結 DNA 二核苷酸。生物可切割連接子在聚寡核苷酸構造體中的使用可參照 WO2015/113922 中所揭露，在該案中該等連接子係用於連接單一寡核苷酸中的多個反義構造體 (例如間隙子區域)。

在一個實施例中，本發明之寡核苷酸除包含構成該間隙子的連續核苷酸序列之外，還包含區域 D’ 及/或 D’’。

在一些實施例中，本發明之寡核苷酸可由下式代表： F-G-F’；特別是 F _1-8-G _5-16-F’ _2-8D’-F-G-F’；特別是 D’ _1-3-F _1-8-G _5-16-F’ _2-8F-G-F’-D’’；特別是 F _1-8-G _5-16-F’ _2-8-D’’ _1-3D’-F-G-F’-D’’；特別是 D’ _1-3- F _1-8-G _5-16-F’ _2-8-D’’ _1-3

在某些實施例中，該位在區域 D’ 與區域 F 之間的核苷間鍵結是磷酸二酯鍵結。在某些實施例中，該位在區域 F’ 與區域 D’’ 之間的核苷間鍵結是磷酸二酯鍵結。

結合物

如本文所用，術語結合物指代寡核苷酸，其與非核苷酸部分 (結合物部分或區域 C 或第三區域) 共價連接。結合物部分可以視情況透過連接子基團 (如區域 D’ 或 D’) 共價連接至反義寡核苷酸。

寡核苷酸共軛體及其合成業經報導於 Manoharan 在 Antisense Drug Technology, Principles, Strategies, and Applications, S.T.Crooke 編輯，第 16 章, Marcel Dekker, Inc., 2001 中之綜合評論及 Manoharan, Antisense and Nucleic Acid Drug Development, 2002, 12, 103。

在一些實施例中，該非核苷酸部分 (結合物部分) 係選自由碳水化合物 (例如 GalNAc)、細胞表面受體配體、原料藥、激素、親脂性物質、聚合物、蛋白質、胜肽、毒素 (例如細菌毒素)、維生素、病毒蛋白 (例如殼體) 或其組合所組成之群組。

示例性結合物部分包括彼等能夠結合至去唾液酸糖蛋白受體 (ASGPR) 者。特別是，三價 N-乙醯基半乳胺糖結合物適合用於結合至 ASGPR，參見例如 WO 2014/076196、WO 2014/207232 及 WO 2014/179620。此類結合物用於增強肝臟對寡核苷酸的攝取。

在某些實施例中，所述結合物是對運鐵蛋白受體具有特定親和力的抗體或抗體片段，例如 WO 2012/143379 中所揭露者，該案經參照併入本文。在一些實施例中，該非核苷酸部分為抗體或抗體片段，例如有助於跨血腦障壁之遞送的抗體或抗體片段，特別是靶向運鐵蛋白受體的抗體或抗體片段。

連接子

鍵結或連接子是兩個原子之間的連接，用以將一個關注中的化學基團或區段經由一或多個共價鍵連結至另一個關注中的化學基團或區段。結合物部分可直接或透過連接部分 (例如連接子或繫鏈) 連接至寡核苷酸。連接子用於將第三區域，例如結合物部分 (區域 C)，共價連結至第一區域，例如與標靶核酸互補的寡核苷酸或連續核苷酸序列 (區域 A)。

在本發明的一些實施例中，本發明之結合物或寡核苷酸結合物可視情況包含連接子區域 (第二區域或區域 B 及/或區域 Y)，其定位在與標靶核酸互補之寡核苷酸或連續核苷酸序列 (區域 A 或第一區域) 與結合物部分 (區域 C 或第三區域) 之間。

生物可切割連接子 (區域 B) 包含生理不穩定鍵或由其組成，該生理不穩定鍵在正常情況下或類似於哺乳動物體內遇到的條件下可切割。生理不安定連接子經歷化學轉換 (例如，切斷) 的條件包括化學條件，例如 pH、溫度、氧化或還原條件或作用劑，以及哺乳動物細胞內所常態存在或與之類似的鹽濃度。哺乳動物細胞內條件亦包括通常存在於哺乳動物細胞中的酵素活性，例如蛋白分解酶或水解酶或核酸酶的活性。在一個實施例中，生物可切斷型連接子容易受到 S1 核酸酶切斷。在一些實施例中，該生理不穩定連接子 (生物可切割) 包含 1 至 10 個之間的經連接之核苷，例如 1、2、3、4、5、6、7、8、9 或 10 個經連接至核苷，例如 2 至 6 個之間的經連接之核苷，例如 2 至 5 個之間的經連接之核苷，例如 2 至 4 個之間的經連接之核苷，其中至少兩個接連鍵結為生物可切割，例如磷酸二酯鍵結，例如至少 3 或 4 或 5 個接連磷酸二酯鍵結。該核苷較佳的是 DNA 或 RNA。

在一個實施例中，寡核苷酸與結合物部分之間的連接子為生理不穩定連接子，其由 2 至 5 個經接連磷酸二酯連接的核苷組成，在反義寡核苷酸之連續核苷酸序列的 5’ 或 3’ 末端包含至少兩個接連磷酸二酯鍵結。

在一些實施例中，該生理不穩定連接子包含 DNA 二核苷酸或由其組成，該 DNA 二核苷酸具有選自由 AA、AT、AC、AG、TA、TT、TC、TG、CA、CT、CC、CG、GA、GT、GC 或 GG 所組成之群組，其中在兩個 DNA 核苷之間存在磷酸二酯鍵結，並且在二核苷酸之 5' 或 3' 端存在至少又一個磷酸二酯，將核酸分子之寡核苷酸與該二核苷酸連接或將該結合物部分與該二核苷酸連接。例如，連接子可以為 CA 二核苷酸。在一些實施例中，該生理不穩定之連接子包含下列序列之 DNA 三核苷酸或由其組成：AAA、AAT、AAC、AAG、ATA、ATT、ATC、ATG、ACA、ACT、ACC、ACG、AGA、AGT、AGC、AGG、TAA、TAT、TAC、TAG、TTA、TTT、TTC、TAG、TCA、TCT、TCC、TCG、TGA、TGT、TGC、TGG、CAA、CAT、CAC、CAG、CTA、CTG、CTC、CTT、CCA、CCT、CCC、CCG、CGA、CGT、CGC、CGG、GAA、GAT、GAC、CAG、GTA、GTT、GTC、GTG、GCA、GCT、GCC、GCG、GGA、GGT、GGC 或 GGG，其中在 DNA 核苷之間存在磷酸二酯鍵結，並且可能在三核苷酸之 5' 或 3' 端存在又一個磷酸二酯。包含磷酸二酯的生物可切割連接子在 WO 2014/076195 (在此藉由引用併入) 中更詳細地描述。當與標準品相比時，在具有生物可切割連接子的結合物化合物中，至少約 50% 的結合物部分被從寡核苷酸切割，例如至少約 60% 被切割，例如至少約 70% 被切割，例如至少約 80% 被切割，例如至少約 85% 被切割，例如至少約 90% 被切割，例如至少約 95% 的結合物部分被從寡核苷酸切割。

區域 Y 意指未必為生物可切斷型但主要功能是將結合物部分 (區域 C 或第三區域) 共價連接至寡核苷酸 (區域 A 或第一區域) 的連接子。區域 Y 連接子可包含鏈結構或重複單元的寡聚物，諸如乙二醇、胺基酸單元或胺基烷基基團。本發明之寡核苷酸結合物可由以下區域元件構造：A-C、A-B-C、A-B-Y-C、A-Y-B-C 或 A-Y-C。在一些實施例中，連接子 (區域 Y) 為胺基烷基，如 C2 至 C36 胺基烷基團，包括例如 C6 至 C12 胺基烷基。在某些實施例中，該連接子 (區域 Y) 為 C6 胺基烷基團。

較佳地，可切割連接子在將本發明之結合物遞送至其標靶細胞後被切割。例如，在進行結合物至標靶細胞 (例如肝臟細胞) 的 GalNAc 媒介之遞送後，連接子被切掉，留下裸露之化合物作為活性藥物。例如，在實例部分中測試的結合物包含 CA 二核苷酸連接子。

醫藥上可接受之鹽

術語「醫藥上可接受之鹽」指代保有生物學有效性及游離鹼或游離酸之特性，且並非在生物學上或在其他方面有不利之處的鹽。該鹽類是以無機酸形成，例如鹽酸、氫溴酸、硫酸、硝酸、磷酸，具體是鹽酸，以及以有機酸形成，例如乙酸、丙酸、乙醇酸、丙酮酸、草酸、馬來酸、丙二酸、琥珀酸、延胡索酸、酒石酸、檸檬酸、苄酸、肉桂酸、苦杏仁酸、甲磺酸、乙磺酸、對甲苯磺酸、水楊酸、N-乙醯半胱胺酸。此外，此等鹽可由無機鹼或有機鹼添加至游離酸中來製備。衍生自無機鹼的鹽包括但不限於鈉、鉀、鋰、銨、鈣、鎂鹽。衍生自有機鹼的鹽包括但不限於一級胺、二級胺、和三級胺的鹽、取代胺，包括天然存在的取代胺、環胺和鹼性離子交換樹脂，諸如異丙胺、三甲胺、二乙胺、三乙胺、三丙胺、乙醇胺、離胺酸、精胺酸、N-乙基哌啶、哌啶、多胺樹脂。本發明之化合物亦可以兩性離子之形式存在。特佳的式 (I) 化合物的醫藥上可接受的鹽為鹽酸、氫溴酸、硫酸、磷酸和甲磺酸的鹽。

治療

本文所用的「治療」一詞意指治療既有疾病 (例如本文所提及之疾病或疾患)，或防範疾病，也就是預防。因此應知，本文中所稱的治療，於某些實施例中，是屬於預防疾病性質。預防可以理解為防止 HBV 感染轉為慢性 HBV 感染或防止慢性 HBV 感染引起的嚴重肝病例如肝硬化及肝細胞癌。

預防

在本文中，術語「預防」、「防止」或「阻止」涉及預防性治療，亦即，其目的為預防而非治癒疾病的措施或程序。預防意指獲得期望的藥理學及/或生理學效果，該效果在完全或部分地防止疾病或其症狀方面是預防性的。據此，本文中，「預防 HBV 感染」包括防止 HBV 感染在個體中發生，以及防止 HBV 感染症狀的發生。在本發明中，特別考慮了預防來自 HBV 感染之母親的兒童之 HBV 感染。還考慮預防急性 HBV 感染轉變為慢性 HBV 感染。

患者

對於本發明之目的，「個體」或「患者」可以為脊椎動物。在本發明之語境中，術語「個體」包括人類及其他動物，特別是哺乳動物及其他生物。因此，本文提供的手段及方法適用於人類療法及獸醫應用兩者。據此，本文中之個體可以為動物，例如小鼠、大鼠、倉鼠、兔、豚鼠、雪貂、貓、狗、雞、羊、牛科物種、馬、駱駝或靈長類動物。較佳地，個體為哺乳動物。更佳地，個體為人類。在一些實施例中，患者罹患本文提及之疾病，例如 HBV 感染。在一些實施例中，患者易患該疾病。

發明實施方式

受感染之肝臟細胞中之 B 型肝炎病毒 (HBV) 共價閉合環狀 DNA (cccDNA) 負責持續的慢性感染及再活化，係所有病毒次基因體轉錄本及前基因體 RNA (pgRNA) 的模板，以確保新合成之病毒後代及經由細胞內核鞘循環之 cccDNA 池補充兩者。RTEL1 與 cccDNA 穩定性有關。RTEL1 之抑制導致經 HBV 感染之個體中 cccDNA 的去穩定，這繼而為慢性感染之 HBV 患者的完全治癒提供了機會。

本發明之一個態樣為靶向 RTEL1 之增強型反義寡核苷酸或其結合物，其用於治療及/或預防 HBV 感染，特別是慢性 HBV 感染。

在一個實施例中，靶向 RTEL1 之反義寡核苷酸或其結合物可以例如減少 RTEL1 蛋白之表現、RTEL1 蛋白與 cccDNA 之結合，從而減少被感染之細胞例如 HBV 感染之細胞中的 cccDNA 及/或 pgRNA。

在一個實施例中，靶向 RTEL1 之反義寡核苷酸或其結合物能夠在活體內減少 HBV 感染之個體的 HBsAg 及/或 HBeAg。

在一個實施例中，靶向 RTEL1 之反義寡核苷酸或其結合物能夠在活體內減少 HBV 感染之個體的 cccDNA。

在一個實施例中，靶向 RTEL1 之反義寡核苷酸或其結合物能夠在活體內減少 HBV 感染之個體的 pgRNA。

本發明之反義寡核 苷酸

本發明之增強型反義寡核苷酸或其結合物可能為優異之 RTEL1 抑制劑，因為它們可以靶向 RTEL1 轉錄本並且經由 RNase H 切割促進其降解。

本發明之一個態樣為一種增強型反義寡核苷酸或其結合物，其用於治療及/或預防 HBV 感染。

本部分描述適合用於治療及/或預防 HBV 感染的新型寡核苷酸。

本發明之反義寡核苷酸或其結合物能夠在活體外及活體內抑制 RTEL1 之表現。藉由將寡核苷酸與編碼 RTEL1 或參與調節 RTEL1 的標靶核酸雜交來達成抑制。標靶核酸可以為哺乳動物 RTEL1 序列，例如 SEQ ID NO: 1 及/或 SEQ ID NO: 2 之序列。

在一些實施例中，本發明之反義寡核苷酸或其結合物能夠藉由抑制或下調標靶之表現而調節該標靶之表現。較佳地，該調節相較於標靶之正常表現水平可產生至少 20% 的表現抑制，更佳相較於正常表現水平產生至少 30%、至少 40%、至少 50%、至少 60%、至少 70%、至少 80%，或至少 90% 的表現抑制。在一些實施例中，本發明之反義寡核苷酸或其結合物能夠在活體外使用 10 μM 在 PXB-PHH 細胞中將 RTEL1 mRNA之表現水平抑制至少 60％或 70％。在一些實施例中，本發明之反義寡核苷酸或其結合物可能能夠在活體外使用 10 μM 在 PXB-PHH 細胞中將 RTEL1 蛋白之表現水平抑制至少50%，該標靶減少範圍在選擇與 cccDNA 減少具有良好相關性的反義寡核苷酸方面是有利的。適合的是，實例提供可用於測量 RTEL1 RNA 抑制的測定 (例如實例 1)。藉由反義寡核苷酸之連續核苷酸序列與標靶核酸之間的雜交來觸發標靶抑制。在某些實施例中，本發明之反義寡核苷酸包含反義寡核苷酸與標靶核酸之間的錯配。儘管存在錯配，但與標靶核酸的雜交仍可能足以顯示出所期望的 RTEL1 表現抑制。藉由增加反義寡核苷酸中核苷酸的數量及/或增加能夠增加與存在於寡核苷酸序列內之標靶 (例如 2’ 糖修飾核苷，包括 LNA) 的結合親和力的經修飾之核苷的數量，可以有利地補償由錯配導致的減少的結合親和力。

本發明之一個態樣涉及長度為 12 至 60 個核苷酸之增強型反義寡核苷酸，其包含長度為至少 10 個核苷酸，例如長度為至少 12 至 30 個核苷酸的連續核苷酸序列，其與哺乳動物 RTEL1 標靶核酸，特別是人類 RTEL1 核酸為至少 95% 互補，例如完全互補。反義寡核苷酸能夠抑制 RTEL1 之表現。

在一些實施例中，本發明之反義寡核苷酸包含 12 至 22 個核苷酸，例如 15 至 20 個核苷酸的連續核苷酸序列，與 SEQ ID NO: 7 之標靶核酸具有至少 90％的互補性，例如完全互補。

在一些實施例中，反義寡核苷酸包含 15 至 18 個核苷酸，例如 17 或 18 個核苷酸的連續核苷酸序列，與 SEQ ID NO: 8 之標靶核酸為至少 90％互補，例如完全互補。

在一些實施例中，反義寡核苷酸包含 15 至 19 個核苷酸，例如 18 或 19 個核苷酸的連續核苷酸序列，與 SEQ ID NO: 9 之標靶核酸為至少 90％互補，例如完全互補。

在一些實施例中，反義寡核苷酸包含 15 至 18 個核苷酸，例如 17 或 18 個核苷酸的連續核苷酸序列，與 SEQ ID NO: 10 之標靶核酸為至少 90％互補，例如完全互補。

在一些實施例中，本發明之反義寡核苷酸包含 12 至 22 個核苷酸，例如 17 至 22 個核苷酸的連續核苷酸序列，與 SEQ ID NO: 11 之標靶核酸具有至少 90％的互補性，例如完全互補。

在一些實施例中，該反義寡核苷酸包含 15 至 22 個核苷酸，例如 15 至 18 個核苷酸，例如 17 或 18 個核苷酸的連續核苷酸序列，與以下選自 SEQ ID NO: 1 之區域的標靶核酸具有至少 90% 的互補性，例如完全互補：SEQ ID NO: 1 之 8681-8701、SEQ ID NO: 1 之 11753-11774，例如來自 SEQ ID NO: 1 之核苷酸 11757-11774、11756-11774 或 11753-11770 的區域。

本發明之一個態樣涉及一種反義寡核苷酸，其係長度為 12 至 30 個核苷酸之反義寡核苷酸，包含長度為至少 10 個核苷酸，例如至少 10 至 30 個核苷酸的連續核苷酸序列，其與哺乳動物 RTEL1 為至少 90% 互補，例如完全互補。

本發明之又一態樣涉及反義寡核苷酸，其包含長度為 12 至 20 個，例如 15 至 22 個核苷酸之連續核苷酸序列，該連續核苷酸序列與 SEQ ID NO: 1 之標靶核酸具有至少 90% 之互補性，例如完全互補。

在一些實施例中，該反義寡核苷酸包含長度為 10 至 30 個核苷酸的連續序列，該連續序列與標靶核酸或標靶序列之區域為至少 90% 互補，例如至少 91%、例如至少 92%、例如至少 93%、例如至少 94%、例如至少 95%、例如至少 96%、例如至少 97%、例如至少 98%、或 100% 互補。

如果本發明之反義寡核苷酸或其連續核苷酸序列與標靶核酸之區域完全互補 (100% 互補)，則是有利的，或者在一些實施例中，該寡核苷酸與標靶核酸之間可包含一個或兩個錯配。

在一些實施例中，該反義寡核苷酸序列與 SEQ ID NO: 1 之相應標靶核酸為 100% 互補。

在一些實施例中，本發明之反義寡核苷酸或連續核苷酸序列與 SEQ ID NO: 1 及 SEQ ID NO: 2 的標靶核酸為至少 95% 互補，例如完全 (或 100%) 互補。

在一些實施例中，該連續核苷酸序列包含選自由 SEQ ID NO: 3、SEQ ID NO: 4、SEQ ID NO: 5 及 SEQ ID NO: 6 或其至少 14 個連續核苷酸所組成之群組的序列。

在某些實施例中，本發明之反義寡核苷酸或其連續核苷酸序列包含長度為 10 個至 30 個核苷酸或由其組成，如長度為 12 個至 25 個核苷酸、如 11 個至 22 個核苷酸、如 12 個至 20 個核苷酸、如 14 個至 18 個或 14 個至 16 個連續核苷酸。

在某些實施例中，反義寡核苷酸或其連續核苷酸序列包含 22 個或更少之核苷酸或由其組成，如 20 個或更少之核苷酸，如 18 個或更少之核苷酸，如 14 個、15 個、16 個或 17 個核苷酸。應知在本文中給定之所有範圍均包括範圍端點。據此，若本文中描述一寡核苷酸包括自 10 個至 30 個核苷酸，則 10 個及 30 個核苷酸均包含在內。

在一些實施例中，連續核苷酸序列之長度包含 10、11、12、13、14、15、16、17、18、19、20、21 或 22 個連續核苷酸或由其組成。

在一些實施例中，反義寡核苷酸或其連續核苷酸序列包含選自 SEQ ID NO: 3、SEQ ID NO: 4、SEQ ID NO: 5 及 SEQ ID NO: 6 之序列或由其組成。

本發明提供根據本發明之反義寡核苷酸，例如長度為 12 至 24 個核苷酸，例如長度為 12 至 18 個核苷酸的反義寡核苷酸，其中該反義寡核苷酸包含連續核苷酸序列，該連續核苷酸序列包含至少 12 個，例如至少 13 個，例如至少 14 個，例如至少 15 個或至少 16 個存在於 SEQ ID NO: 7 中的連續核苷酸。

本發明提供反義寡核苷酸，例如長度為 12 至 24 個核苷酸，例如長度為 12 至 18 個核苷酸的反義寡核苷酸，其中該反義寡核苷酸包含連續核苷酸序列，該連續核苷酸序列包含至少 12 個，例如至少 13 個，例如至少 14 個，例如至少 15 個或至少 16 個存在於 SEQ ID NO: 8 中的連續核苷酸。

本發明提供反義寡核苷酸，例如長度為 12 至 24 個核苷酸，例如長度為 12 至 18 個核苷酸的反義寡核苷酸，其中該反義寡核苷酸包含連續核苷酸序列，該連續核苷酸序列包含至少 12 個，例如至少 13 個，例如至少 14 個，例如至少 15 個或至少 16 個存在於 SEQ ID NO: 9 中的連續核苷酸。

本發明提供反義寡核苷酸，例如長度為 12 至 24 個核苷酸，例如長度為 12 至 18 個核苷酸的反義寡核苷酸，其中該反義寡核苷酸包含連續核苷酸序列，該連續核苷酸序列包含至少 12 個，例如至少 13 個，例如至少 14 個，例如至少 15 個或至少 16 個存在於 SEQ ID NO: 10 中的連續核苷酸。

本發明提供反義寡核苷酸，例如長度為 12 至 24 個核苷酸，例如長度為 12 至 18 個核苷酸的反義寡核苷酸，其中該反義寡核苷酸包含連續核苷酸序列，該連續核苷酸序列包含至少 12 個，例如至少 13 個，例如至少 14 個，例如至少 15 個或至少 16 個存在於 SEQ ID NO: 11 中的連續核苷酸。

在有利的實施例中，反義寡核苷酸包含一個或多個糖修飾核苷，如一個或多個 2’ 糖修飾核苷，如一個或多個獨立選自由 2'-O-烷基-RNA、2'-O-甲基-RNA、2'-烷氧基-RNA、2'-O-甲氧基乙基-RNA、2'-胺基-DNA、2'-氟-DNA、阿拉伯核酸 (ANA)、2' -氟-ANA和 LNA 核苷所組成之群組之 2'糖修飾核苷。若修飾核苷中的一個或多個為鎖核酸 (LNA)，則是有利的。

在某些實施例中，連續核苷酸序列包含 LNA 核苷。

在本發明之寡核苷酸的一些實施例中，所有 LNA 核苷皆為 β-D-氧 LNA 核苷。

在某些實施例中，連續核苷酸序列包含 LNA 核苷和 DNA 核苷。

在某些實施例中，連續核苷酸序列包含 2'-O-甲氧基乙基 (2'MOE) 核苷。

在某些實施例中，連續核苷酸序列包含 2'-O-甲氧基乙基 (2'MOE) 核苷和 DNA 核苷。

有利的是，反義寡核苷酸之 3' 最末端核苷或其連續核苷酸序列為 2’ 糖修飾核苷。

有利的是，反義寡核苷酸包含至少一個修飾核苷間鍵結，如硫代磷酸酯或二硫代磷酸酯。

在一些實施例中，連續核苷酸序列中的至少一個核苷間鍵結為硫代磷酸酯核苷間鍵結。

在某些實施例中，連續核苷酸序列中的至少一個核苷間鍵結為二硫代磷酸酯核苷間鍵結。

在某些實施例中，連續核苷酸序列中的至少一個核苷間鍵結為磷酸雙酯核苷間鍵結。

在某些實施例中，連續核苷酸序列內的所有核苷間鍵結都為硫代磷酸酯核苷間鍵結。

在一些實施例中，反義寡核苷酸或其連續核苷酸序列內之核苷間鍵結中的至少 75% 為硫代磷酸酯核苷間鍵結。

在某些實施例中，反義寡核苷酸或其連續核苷酸序列內所有核苷間鍵結為硫代磷酸酯核苷間鍵結。

在本發明之有利的實施例中，本發明之反義寡核苷酸能夠招募 RNase H，如 RNase H1。在某些實施例中，本發明之反義寡核苷酸或其連續核苷酸序列是間隙子。

在某些實施例中，反義寡核苷酸或其連續核苷酸序列包含式 5’-F-G-F’-3 的間隙子或由其組成。

在一些實施例中，區域 G 由 6 至 16 個 DNA 核苷，例如11 至 16 個 DNA 核苷組成。在一些實施例中，區域 F 包含 2 至 4 個 DNA 核苷且/或區域 F’ 包含 2 至 6 個 DNA 核苷。

在某些實施例中，區域 F 和 F’ 各自包含至少一個 LNA 核苷。

在一些實施例中，本發明之寡核苷酸為具有均一側翼的 LNA 間隙子。例如，具有均一側翼的 LNA 間隙子可能具有選自以下設計的設計：4-12-2、2-13-4 及 2-12-5。表 6 列述每個模體序列的較佳設計。

在本發明之一些實施例中，LNA 間隙子為交替側翼 LNA 間隙子。在一些實施例中，交替側翼 LNA 間隙子包含至少一個交替側翼 (例如側翼 F')。在一些實施例中，交替側翼 LNA 間隙子包含一個交替側翼 (例如側翼 F') 及一個均一側翼 (例如側翼 F)。例如，具有一個交替 F' 側翼的 LNA 間隙子可以具有以下設計：2-11-1-2-1-1-3。

本發明提供以下寡核苷酸化合物 (表 6)：

表 6：本發明之寡核苷酸模體序列 (以 SEQ ID NO 表示)、其設計以及基於該模體序列所設計的具體寡核苷酸化合物 (以 CMP ID NO 表示) 的列述。

SEQ ID NO	模體序列	SEQ ID NO: 1 上的位置	設計	CMP 識別號	寡核苷酸化合物
開始	結束
3	AATTTTACATACTCTGGT	11757	11774	4-12-2	3_1	AATTttacatactctgGT
4	AATTTTACATACTCTGGTC	11756	11774	2-13-4	4_1	AAttttacatactctGGTC
5	TTACATACTCTGGTCAAA	11753	11770	2-12-5	5_1	TTacatactctggtCAAA
6	CTTTATTATAACTTGAATCTC	8681	8701	2-11-1-2-1-1-3	6_1	CTttattataactTgaAtCTC

表中的標題「寡核苷酸化合物」代表模體序列的具體設計。大寫字母為 β-D-氧 LNA 核苷，小寫字母為 DNA 核苷，所有 LNA C 皆為 5-甲基胞嘧啶，所有核苷間鍵結皆為硫代磷酸酯核苷間鍵結。標題「設計」指代間隙子設計，F-G-F'。在經典的間隙子設計中，亦即具有均一側翼的間隙子 (例如 4-12-2)，側翼 (F 及 F') 中的所有核苷酸皆由相同類型的 2'-糖修飾核苷 (例如 LNA、cET 或 MOE) 以及中間形成缺口 (G) 的一段 DNA 組成。在具有交替側翼設計的間隙子中，寡核苷酸的側翼被註釋為一系列整數，代表多個 β-D-氧 LNA 核苷 (L)，後接一定數量的 DNA 核苷 (D)。例如，具有 1-2-1-1-3 模體的側翼 F' 代表 LDDLDLLL (參見 CMP ID NO 6_1)。兩個側翼的 5' 及 3' 末端皆具有一個 β-D-氧 LNA 核苷。由一定數量的 DNA 核苷構成的缺口區 (G) 位於側翼之間。

對於本發明之一些實施例，該寡核苷酸係選自由具有CMP-ID-NO: 3_1、CMP-ID-NO: 4_1、CMP-ID-NO: 5_1 及 CMP-ID-NO: 6_1 (參見表 6) 所組成之寡核苷酸化合物群組。

在所有情況下，F-G-F′ 設計可以進一步包括區域 D’ 及/或 D’’，如在「定義」部分中「寡核苷酸中的區域 D’ 或 D’’」下所述。在一些實施例中，本發明之反義寡核苷酸在間隙子區域的 5′ 或 3′ 端，例如在 5′ 端，具有 1、2 或 3 個經磷酸二酯連接的核苷單元，例如 DNA 單元。在一些實施例中，本發明之反義寡核苷酸由以下所組成：兩個經磷酸二酯連接的 5’ DNA 核苷，後接如上定義的 F-G-F’ 間隙子區域。在 5’ 或 3’ 端含有經磷酸二酯連接之 DNA 單元的寡核苷酸適用於結合作用，並可以進一步包含本文所述的結合物部分。對於遞送至肝臟，ASGPR 靶向部分作為結合物部分特別有利，請參閱結合物部分了解更多細節。

共軛物

由於 HBV 感染主要影響肝臟中的肝細胞，因此有利的是將本發明之增強型反義寡核苷酸與結合物部分結合，與未結合的反義寡核苷酸相比，將會增加反義寡核苷酸向肝臟之遞送。在一個實施例中，肝臟靶向部分係選自包含膽固醇或其他脂質的部分或者能夠結合至去唾液酸糖蛋白受體 (ASGPR) 的結合物部分。

在一些實施例中，本發明提供一種結合物，其包含共價連接至結合物部分的本發明之反義寡核苷酸。

去唾液酸糖蛋白受體 (ASGPR) 結合物部分包含一個或多個能夠以等於或大於半乳糖的親和力結合至去唾液酸糖蛋白受體的碳水化合物部分 (ASPGR 靶向部分)。許多半乳糖衍生物對於去唾液酸糖蛋白受體的親和力已經得以研究 (參見例如：Jobst, S.T. 與 Drickamer, K. JB.C.1996, 271, 6686) 或使用本領域典型之方法容易地測定。

在一個實施例中，該結合物部分包含至少一個去唾液酸糖蛋白受體靶向部分，其係選自由半乳糖、半乳胺糖、N-甲醯基-半乳胺糖、N-乙醯基半乳胺糖、N-丙醯基-半乳胺糖、N-正丁醯基-半乳胺糖及 N-異丁醯基半乳胺糖所組成之群組。有利地，去唾液酸糖蛋白受體靶向部分為 N-乙醯基半乳胺糖 (GalNAc)。

為了生成 ASGPR 結合物部分，可以將 ASPGR 靶向部分 (較佳 GalNAc) 連接至結合物支架。通常，ASPGR 靶向部分可以在支架的同一端。在一個實施例中，該結合物部分由與間隔子連接的 2 至 4 個末端 GalNAc 部分組成，該間隔子將每個 GalNAc 部分與支鏈分子連接，從而可以與反義寡核苷酸結合。

在又一實施例中，該結合物部分相對於去唾液酸糖蛋白受體靶向部分為單價的、二價的、三價的或四價的。有利地，去唾液酸糖蛋白受體靶向部分包含 N-乙醯基半乳胺糖 (GalNAc) 部分。

GalNAc 結合物部分可以包括例如 WO 2014/179620 及 WO 2016/055601 及 PCT/EP2017/059080 (藉由引用於此處併入) 中描述之彼等，以及連接有 GalNAc 部分的小胜肽，例如 Tyr-Glu-Glu-(胺基己基 GalNAc) 3 (YEE(ahGalNAc)3；一種結合至肝細胞上之去唾液酸糖蛋白受體的醣三肽，參見例如 Duff 等人, Methods Enzymol, 2000, 313, 297)；基於離胺酸之半乳糖簇 (例如，L3G4；Biessen 等人, Cardovasc.Med., 1999, 214）；以及膽烷為基礎的半乳糖簇（例如，去唾液酸糖蛋白受體的碳水化合物識別模體）。

可以使用本領域已知的方法將 ASGPR 結合物部分，特別是三價 GalNAc 結合物部分連接至寡核苷酸的 3’ 或 5’ 端。在一個實施例中，該 ASGPR 結合物部分與寡核苷酸的 5’ 端連接。

在一個實施例中，該結合物部分為三價 N-乙醯基半乳胺糖 (GalNAc)，例如圖 5 所示之彼等。在一個實施例中，該結合物部分為圖 5A-1 或圖5A-2 之三價 N-乙醯基半乳胺糖 (GalNAc)，或兩者之混合物。在一個實施例中，該結合物部分為圖 5B-1 或圖5B-2 之三價 N-乙醯基半乳胺糖 (GalNAc)，或兩者之混合物。在一個實施例中，該結合物部分為圖 5C-1 或圖5C-2 之三價 N-乙醯基半乳胺糖 (GalNAc)，或兩者之混合物。在一個實施例中，該結合物部分為圖 5D-1 或圖5D-2 之三價 N-乙醯基半乳胺糖 (GalNAc)，或兩者之混合物。

在一些實施例中，該結合物係選自由以下所組成之群組： 5'-GN2-C6 _oc _oa _oA _sA _sT _sT _st _st _sa _sc _sa _st _sa _sc _st _sc _st _sg _sG _sT _s， 5'-GN2-C6 _oc _oa _oA _sA _st _st _st _st _sa _sc _sa _st _sa _sc _st _sc _st _sG _sG _sT _s ^mC _s， 5'-GN2-C6 _oc _oa _o ^mC _sT _st _st _sa _st _st _sa _st _sa _sa _sc _st _sT _sg _sa _sA _st _s ^mC _sT _s ^mC _s，及 5'-GN2-C6 _oc _oa _oT _sT _sa _sc _sa _st _sa _sc _st _sc _st _sg _sg _st _s ^mC _sA _sA _sA _s其中大寫字母代表 β-D-氧 LNA 核苷，小寫字母代表 DNA 核苷，其中每個 LNA 胞嘧啶為 5-甲基胞嘧啶，並且其中下標 s 代表硫代磷酸酯核苷間鍵結，且下標 o 代表磷酸二酯核苷間鍵結，並且 GN2-C6 為三價 N-乙醯基半乳胺糖 (GalNAc)，例如圖 5 所示之彼等，例如圖 5D-1 或圖 5D-2 的三價 N-乙醯基半乳胺糖 (GalNAc)，或兩者之混合物。

代表一些分子的化學圖如圖 1 至圖 4 所示。

在一些實施例中，結合物為如圖 1 所示的結合物。

在一些實施例中，結合物為如圖 2 所示的結合物。

在一些實施例中，結合物為如圖 3 所示的結合物。

在一些實施例中，結合物為如圖 4 所示的結合物。

圖 1 至圖 4 中所示的化合物以質子化形式示出，亦即，硫代磷酸酯鍵結上的硫原子經質子化；應理解，質子之存在將取決於分子之環境酸性以及替代性陽離子之存在 (例如當該寡核苷酸為鹽形式時)。質子化硫代磷酸酯是以互變異構的形式存在。

醫藥上可接受之鹽

根據本發明之化合物可以以其醫藥上可接受之鹽的形式存在。術語「醫藥上可接受之鹽」係指習知的酸加成鹽或鹼加成鹽，其保留了本發明化合物的生物學效力和特性，並由合適的無毒有機或無機酸或有機或無機鹼形成。酸加成鹽包括例如衍生自無機酸的那些，諸如氫氯酸、氫溴酸、氫碘酸、硫酸、胺磺酸、磷酸和硝酸，以及衍生自有機酸的那些，諸如對甲苯磺酸、水楊酸、甲磺酸、草酸、琥珀酸、檸檬酸、蘋果酸、乳酸、富馬酸等。鹼加成鹽包括衍生自氫氧化銨、氫氧化鉀、氫氧化鈉和四級銨氫氧化物的那些，諸如例如四甲基氫氧化銨。將藥物化合物進行化學修飾成鹽是藥物化學家眾所周知的技術，以獲得改善之化合物的物理和化學穩定性、吸濕性、流動性和溶解性。例如，在 Bastin, Organic Process Research & Development 2000, 4, 427-435，或在 Ansel 的以下文獻中對此進行了描述：Pharmaceutical Dosage Forms and Drug Delivery Systems，第六版，(1995)，第 196 頁和第 1456-1457 頁。例如，本文提供之化合物的醫藥上可接受之鹽可以是鈉鹽。

在又一態樣中，本發明提供反義寡核苷酸或其結合物之醫藥上可接受之鹽，例如醫藥上可接受之鈉鹽、銨鹽或鉀鹽。

製造方法

在又一態樣中，本發明提供製造本發明之寡核苷酸之方法，該方法包含使核苷酸單元反應並藉此形成包含在寡核苷酸中的共價連接之連續核苷酸單元。較佳地，該方法使用磷醯亞胺化學 (參見例如 Caruthers 等人, 1987, Methods in Enzymology 第 154 卷，第 287-313 頁)。在又一實施例中，該方法進一步包含使連續核苷酸序列與結合物部分 (配體) 反應，以將結合物部分共價連接至寡核苷酸。在又一態樣中，提供一種用以製造本發明之組成物之方法，該方法包含將本發明之寡核苷酸或結合之寡核苷酸與一種醫藥上可接受之稀釋劑、溶劑、載劑、鹽及/或佐劑混合。

醫藥組成物

在又一態樣中，本發明提供醫藥組成物，其包含任一前述寡核苷酸及/或寡核苷酸結合物或其鹽以及一種醫藥上可接受之稀釋劑、載劑、鹽及/或佐劑。醫藥上可接受之稀釋劑包括磷酸鹽緩衝生理食鹽水 (PBS)，而醫藥上可接受之鹽包括但不限於鈉鹽及鉀鹽。在一些實施例中，醫藥上可接受之稀釋劑為無菌磷酸鹽緩衝生理食鹽水。在一些實施例中，該寡核苷酸係以 50 至 300 µM 溶液之濃度用於該醫藥上可接受之稀釋劑中。

適合用於本發明之調配物可參閱 Remington's Pharmaceutical Sciences, Mack Publishing Company, Philadelphia, Pa.，第 17 版, 1985。對於藥物遞送方法的簡要說明，參見例如 Langer (Science 249:1527-1533, 1990)。WO 2007/031091 提供了醫藥上可接受之稀釋劑、載體和佐劑的進一步合適和較佳的實例 (在此藉由引用併入)。WO2007/031091 中還提供了合適的劑量、製劑、投予途徑、組成物、劑型、與其他治療劑的組合、前藥製劑。

在一些實施例中，本發明之反義寡核苷酸或其結合物或其醫藥上可接受之鹽為固體形式，例如粉末，例如凍乾粉末。

在一些實施例中，本發明之反義寡核苷酸或其結合物可以與醫藥上可接受之活性或惰性物質混合，用以製備醫藥組成物或調配物。組成物及用以形成醫藥組成物製劑的方法取決於若干標準，包括但不限於，投予途徑、疾病程度或要投予的劑量。

這些組成物可經由習知消毒技術消毒或經過濾滅菌。如此製成的水溶液可經包裝後直接使用，或經凍乾，使用前先將凍乾製劑與無菌水性載體結合再行投予。製劑的 pH 通常為介於 3 和 11 之間，更佳的是介於 5 和 9 之間或是介於 6 和 8 之間，最佳的是介於 7 和 8 之間，例如 7 至 7.5。製成的固態組成物可分為單劑包裝，每劑中包含固定數量的上述作用劑，例如為藥錠或膠囊的密封包裝。固體形式之組成物也可以包裝在容器中，以利靈活調整用量，例如在設計用於局部應用的乳膏或軟膏的可擠壓管中。

在一些實施例中，本發明之反義寡核苷酸或其結合物為前驅藥。特別是關於反義寡核苷酸結合物，一旦將該前驅藥遞送至作用位點例如標靶細胞，結合物部分即從反義寡核苷酸上被切掉。

應用

本發明之增強型反義寡核苷酸可作為研究試劑用於例如診斷、治療及預防。

在研究中，可在細胞 (例如活體外細胞培養物) 及實驗動物中使用該反義寡核苷酸來特異性地調節 RTEL1 蛋白的合成，藉此促進對於標靶的功能分析，或評估其做為治療介入標靶的實用性。一般而言，標靶調節藉由調降或抑制產生此蛋白質的 mRNA 而實現，從而預防蛋白質形成，或藉由對致使基因或 mRNA 產生此蛋白質的調節劑進行調降或抑制。

若在研究或診斷中採用本發明之反義寡核苷酸，則標靶核酸可以為 cDNA 或衍生自 DNA 或 RNA 的合成核酸。

本發明還涵蓋一種在表現 RTEL1 之標靶細胞中調節 RTEL1 表現的活體內或活體外方法，該方法包含以有效量向該細胞投予本發明之反義寡核苷酸、其結合物或醫藥組成物。

在一些實施例中，標靶細胞為哺乳動物細胞，特別是人類細胞。標靶細胞可以為活體外細胞培養物或形成哺乳動物組織的一部分的活體內細胞。在較佳實施例中，標靶細胞存在於肝臟中。標靶細胞可以為肝細胞。

本發明之一個態樣涉及本發明之反義寡核苷酸、其結合物或醫藥組成物，其用作藥物。

在本發明之一個態樣中，本發明之反義寡核苷酸、其結合物或醫藥組成物能夠降低被感染之細胞中的 cccDNA 含量並因此抑制 HBV 感染。特別是，該反義寡核苷酸或其結合物能夠在被感染之細胞中影響以下參數中的一者或多者：i) 減少 cccDNA 及/或 ii) 減少 pgRNA 及/或 iii) 減少 HBV DNA 及/或 iv) 減少 HBV 病毒抗原。

例如，抑制 HBV 感染的反義寡核苷酸或其結合物可以 i) 與對照相比，將被感染之細胞中的 cccDNA 含量降低至少 40%，例如 50%、60%、70%、80% 或 90%；或 ii) 與對照相比，將 pgRNA 含量降低至少 40%，例如 50%、60%、70%、80% 或 90%。對照可以為未經治療的細胞或動物，或用適當對照治療的細胞或動物。

HBV 感染的抑制可以使用 HBV 感染的原代人類肝細胞在活體外或使用人源化肝細胞 PXB 小鼠模型 (可在 PhoenixBio 獲得，也參見 Kakuni 等人 2014 Int. J. Mol. Sci. 15:58-74) 在活體內測量。HBsAg 及/或 HBeAg 之分泌的抑制可以藉由 ELISA 測定，例如根據製造商的說明使用 CLIA ELISA 套組 (Autobio Diagnostic)。細胞內 cccDNA 或 HBV mRNA 及 pgRNA 的減少可藉由 qPCR 測定，例如，如「材料與方法」部分所述。評估測試化合物是否抑制 HBV 感染的其他方法，是藉由 qPCR（例如 WO 2015/173208 中所述）或使用北方墨點法、原位雜交技術或免疫螢光法來測定 HBV DNA 的分泌。

由於 RTEL1 含量的降低，本發明之反義寡核苷酸、其結合物或醫藥組成物可用於抑制 HBV 感染的發展或用於治療 HBV 感染。特別是 cccDNA 之去穩定化及減少，與僅減少 HBsAg 之分泌的化合物相比，本發明之反義寡核苷酸、其結合物或醫藥組成物更有效地抑制慢性 HBV 感染的發展或治療慢性 HBV 感染。

據此，本發明之一個態樣涉及本發明之反義寡核苷酸、其結合物或醫藥組成物的用途，其用來減少 HBV 感染之個體中的 cccDNA 及/或 pgRNA。

本發明之又一態樣涉及本發明之反義寡核苷酸、其結合物或醫藥組成物之用途，其用來抑制慢性 HBV 感染的發展或治療慢性 HBV 感染。

本發明之又一態樣涉及本發明之反義寡核苷酸、其結合物或醫藥組成物的用途，其用來降低 HBV 感染者的傳染性。在本發明之特定態樣中，本發明之反義寡核苷酸、其結合物或醫藥組成物抑制慢性 HBV 感染的發展。

待使用本發明之反義寡核苷酸、其結合物或醫藥組成物治療 (或預防性地接受本發明之反義寡核苷酸、其結合物或醫藥組成物) 的個體較佳為人類，更佳為 HBsAg 陽性及/或 HBeAg 陽性之人類患者，甚至更佳為 HBsAg 陽性及 HBeAg 陽性之人類患者。

據此，本發明涉及一種治療 HBV 感染之方法，其中該方法包含投予有效量的本發明之反義寡核苷酸、其結合物或醫藥組成物。本發明進一步涉及一種預防由慢性 HBV 感染引起的肝硬化及肝細胞癌之方法。

本發明還提供本發明之反義寡核苷酸、其結合物或醫藥組成物的用途，其用於製造藥物，特別是用於治療 HBV 感染或慢性 HBV 感染或降低 HBV 感染者之傳染性的藥物。在較佳實施例中，藥物經製造為用於皮下投予的劑型。

本發明還提供本發明之反義寡核苷酸、其結合物、醫藥組成物的用途，其用於製造藥物，其中該藥物為用於靜脈內投予的劑型。

本發明之反義寡核苷酸、其結合物或醫藥組成物可用於組合療法。例如，本發明之反義寡核苷酸、其結合物或醫藥組成物可以與其他抗 HBV 藥物組合，例如干擾素 α-2b、干擾素 α-2a 及干擾素 αcon-1 (聚乙二醇化及非聚乙二醇化)、利巴韋林 (ribavirin)、拉米夫定 (lamivudine) (3TC)、恩替卡韋 (entecavir)、替諾福韋 (tenofovir)、替比夫定 (telbivudine) (LdT)、阿德福韋 (adefovir) 或其他新興抗 HBV 藥物，例如 HBV RNA 複製抑制劑、HBsAg 分泌抑制劑、HBV 殼體抑制劑、反義寡聚體 (例如，如 WO2012/145697、WO 2014/179629 及 WO2017/216390 中所述)、siRNA (例如 WO 2005/014806、WO 2012/024170、WO 2012/2055362、WO 2013/003520、WO 2013/159109、WO 2017/027350 及 WO2017/015175 中所述)、HBV 治療性疫苗、HBV 預防性疫苗、HBV 抗體療法 (單株或多株) 或用於治療及/或預防 HBV 的 TLR 2、3、7、8 或 9 促效劑。

組合療法

在一些實施例中，本發明之增強型反義寡核苷酸、其結合物或醫藥組成物係用於與另一治療劑進行組合治療。該治療劑例如可以為上述疾病或疾患之照護標準。

舉例而言，該反義寡核苷酸、其結合物或醫藥組成物可以與其他活性物質組合使用，該等其他活性物質例如基於寡核苷酸之抗病毒劑，例如基於序列特異性寡核苷酸之抗病毒劑，其透過反義 (包括其他 LNA 寡聚物)、siRNA (例如 ARC520)、適體、嗎啉代物或任何其他抗病毒劑、核苷酸序列依賴性作用模式起作用。

進一步舉例而言，該反義寡核苷酸、其結合物或醫藥組成物可以與其他活性物質組合使用，該等其他活性物質例如免疫刺激性抗病毒化合物，例如干擾素 (例如聚乙二醇化干擾素 α)、TLR7 促效劑 (例如 GS-9620) 或治療性疫苗。

進一步舉例而言，該反義寡核苷酸、其結合物或醫藥組成物可以與具有抗病毒活性的其他活性物質例如小分子組合使用。此等其他活性物質可以為例如核苷/核苷酸抑制劑 (例如恩替卡韋或富馬酸替諾福韋地索普西)、衣殼化抑制劑（encapsidation inhibitor）、進入抑制劑 (例如 Myrcludex B)。

在某些實施例中，額外治療劑可以為 HBV 劑、C 型肝炎病毒 (HCV) 劑、化療劑、抗生素、鎮痛劑、非類固醇抗炎 (NSAID) 劑、抗真菌劑、抗寄生蟲劑、抗噁心劑、止瀉劑或免疫抑制劑。

特別是相關實施例，抗病毒劑可以選自干擾素 α-2b、干擾素 α-2a 及干擾素 αcon-1 (聚乙二醇化及非聚乙二醇化)；利巴韋林 (ribavirin)；HBV RNA 複製抑制劑；第二反義寡聚物；HBV 治療性疫苗；HBV 預防性疫苗；拉米夫定 (lamivudine) (3TC)；恩替卡韋 (entecavir) (ETV)；替諾福韋延胡索酸酯 (tenofovir diisoproxil fumarate) (TDF)；替比夫定 (telbivudine) (LdT)；阿德福韋 (adefovir)；及 HBV 抗體療法 (單株或多株)。

在其他具體相關的實施例中，額外 HCV 劑可以為干擾素 α-2b、干擾素 α-2a 及干擾素 αcon-1 (聚乙二醇化及非聚乙二醇化)；利巴韋林；聚乙二醇化干扰素 (pegasys)； HCV RNA 複製抑制劑 (例如 ViroPharma 的 VP50406 系列)；HCV 反義劑；HCV 治療性疫苗；HCV 蛋白酶抑制劑；HCV 解旋酶抑制劑；或 HCV 單株或多株抗體療法。

投予

本發明之增強型反義寡核苷酸、其結合物或醫藥組成物可以局部投予 (例如，至皮膚、吸入、眼用或耳用) 或腸內投予 (例如，口服或透過胃腸道) 或腸胃外投予 (例如、靜脈內、皮下或肌肉內)。

在較佳實施例中，本發明之反義寡核苷酸、其結合物或醫藥組成物係藉由胃腸外途徑投予，包括靜脈內、動脈內、皮下、腹腔內或肌肉內投予。在一個實施例中，活性反義寡核苷酸或其結合物係經靜脈內投予。在另一實施例中，活性反義寡核苷酸或其結合物係經皮下投予。

在一些實施例中，本發明之反義寡核苷酸、其結合物或醫藥組成物係以 0.1 - 15 mg/kg，例如 0.2 - 10 mg/kg，例如 0.25 - 5 mg/kg 之劑量投予。投予可為每週一次、每兩週一次、每三週一次或甚至每月一次。

本發明還提供如所述之本發明之反義寡核苷酸或其結合物用於製造藥物之用途，其中該藥物係用於皮下投予之劑型。

發明之實施例

本發明之以下實施例可與本文所述之任何其他實施例結合運用：上文提供之定義及解釋，特別是在「發明內容」、「定義」及「發明實施方式」部分中提供之定義及解釋加以必要修訂應用於下文。 1. 一種反義寡核苷酸，其包含與 RTEL1 核酸具有至少 90％互補性，例如 100％互補性之連續核苷酸序列，其中該反義寡核苷酸能夠抑制細胞中之 RTEL1，例如人類 RTEL1 之表現。 2. 如實施例 1 之反義寡核苷酸，其中該連續核苷酸序列與來自如 SEQ ID NO: 1 中所示之人類 RTEL1 前驅 mRNA 之核苷酸 11753-11774 的區域，例如來自 SEQ ID NO: 1 之核苷酸 11757-11774、核苷酸 11756-11774 或核苷酸 11753-11770 之區域完全互補。 3. 如實施例 1 及實施例 2 之反義寡核苷酸，其中該連續核苷酸序列與 SEQ ID NO: 7、SEQ ID NO: 8、SEQ ID NO: 9 及/或 SEQ ID NO: 10 完全互補。 4. 如實施例 1 之反義寡核苷酸，其中該連續核苷酸序列與來自 SEQ ID NO: 1 中所示之人類 RTEL1 前驅 mRNA 之核苷酸 8681-8701 的區域完全互補。 5. 如實施例 1 及實施例 4 之反義寡核苷酸，其中該連續核苷酸序列與 SEQ ID NO: 11完全互補。 6. 如實施例 1 至 5 中任一項之反義寡核苷酸，其中該反義寡核苷酸之長度為 12 至 30 個核苷酸，例如 12 至 22 個核苷酸，例如 16 至 20 個核苷酸。 7. 如實施例 1 至 6 中任一項之反義寡核苷酸，其中該連續核苷酸序列為至少 12 個核苷酸，例如 14、15、16、17、18、19 或 20 個核苷酸之連續序列。 8. 如實施例 7 之反義寡核苷酸，其中該連續核苷酸序列為 18 或 19 個核苷酸的連續序列。 9. 如實施例 1 至 8 中任一項之反義寡核苷酸，其中該連續核苷酸序列與選自由 SEQ ID NO: 3、SEQ ID NO: 4、SEQ ID NO: 5 及 SEQ ID NO: 6 所組成之群組的序列或其至少 15 個連續核苷酸為 100%相同。 10. 如實施例 1 至 9 中任一項之反義寡核苷酸，其在該連續核苷酸序列中包含一個或多個經修飾之核苷。 11. 如實施例 10 之反義寡核苷酸，其中該連續核苷酸序列中之一個或多個經修飾之核苷為 2’ 糖修飾核苷。 12. 如實施例 11 之反義寡核苷酸，其中該一個或多個 2’ 糖修飾核苷係獨立地選自由以下所組成之群組：2’-O-烷基-RNA、2’-O-甲基-RNA、2’-烷氧基-RNA、2’-O-甲氧基乙基-RNA、2’-胺基-DNA、2’-氟-DNA、阿糖基核酸 (ANA)、2’-氟-ANA 及 LNA 核苷。 13. 如實施例 10 至 12 中任一項之反義寡核苷酸，其中該一個或多個經修飾之核苷為 LNA 核苷，例如具有以下 2'-4’ 橋-O-CH ₂- 的氧-LNA。 14. 如實施例 13 之反義寡核苷酸，其中該一個或多個經修飾之核苷為 β-D-氧-LNA。 15. 如實施例 1 至 14 中任一項之反義寡核苷酸，其中該連續核苷酸序列中的至少一個核苷間鍵結為硫代磷酸酯核苷間鍵結。 16. 如實施例 1 至 15 中任一項之反義寡核苷酸，其中該連續核苷酸序列中的至少一個核苷間鍵結為二硫代磷酸酯核苷間鍵結。 17. 如實施例 1 至 16 中任一項之反義寡核苷酸，其中該連續核苷酸序列中的至少一個核苷間鍵結為磷酸二酯核苷間鍵結。 18. 如實施例 17 之反義寡核苷酸，其中該連續核苷酸序列中的所有核苷間鍵結皆為硫代磷酸酯核苷間鍵結。 19. 如實施例 1 至 18 中任一項之反義寡核苷酸，其中該反義寡核苷酸為能夠募集 RNase H，例如 RNase H1 的反義寡核苷酸。 20. 如實施例 19 之反義寡核苷酸，其中該反義寡核苷酸或其連續核苷酸序列包含式 5’-F-G-F’-3’ 之間隙子或由其組成。 21. 根據實施例 20 之反義寡核苷酸，其中區域 G 具有 6 至 16 個 DNA 核苷，例如 11 至 16 個 DNA 核苷之長度。 22. 根據實施例 19 至 21 中任一項之反義寡核苷酸，其中區域 F 及 F’ 各自包含至少一個 LNA 核苷，例如其中區域 F 及 F'各自包含至少一個 LNA 核苷。 23. 根據實施例 19 至 22 中任一項之反義寡核苷酸，其中區域 F 具有 1 至 8 個 DNA 核苷，例如 2 至 4 個 DNA 核苷之長度。 24. 根據實施例 19 至 23 中任一項之反義寡核苷酸，其中區域 F’ 具有 1 至 8 個 DNA 核苷，例如 2 至 6 個 DNA 核苷之長度。 25. 根據實施例 19 至 24 中任一項之反義寡核苷酸，其中該反義寡核苷酸或其連續核苷酸序列包含式 F _2-4-G _11-16-F’ _2-6之間隙子或由其組成。 26. 根據實施例 19 至 25 中任一項之反義寡核苷酸，其中該間隙子包含至少一個交替側翼。 27. 根據實施例 19 至 25 中任一項之反義寡核苷酸，其中該間隙子包含兩個均一側翼。 28. 根據實施例 1 至 27 中任一項之反義寡核苷酸，其中該反義寡核苷酸係選自由以下所組成之反義寡核苷酸之群組： AATTttacatactctgGT (SEQ ID NO: 3，化合物 ID No 3_1)， AAttttacatactctGGTC (SEQ ID NO: 4，化合物 ID No 4_1)， TTacatactctggtCAAA (SEQ ID NO: 5，化合物 ID No 5_1)，及 CTttattataactTgaAtCTC (SEQ ID NO: 6，化合物 ID No 6_1)，其中大寫字母為 β-D-氧基 LNA 核苷，小寫字母為 DNA 核苷，所有 LNA C 皆為 5-甲基胞嘧啶，所有核苷間鍵結皆為硫代磷酸酯核苷間鍵結。 29. 一種結合物，其包含如實施例 1 至 28 中任一項之反義寡核苷酸，以及至少一個共價連接至該反義寡核苷酸之結合物部分。 30. 如實施例 29 之結合物，其中該結合物部分包含至少一個去唾液酸糖蛋白受體靶向部分，其係選自由半乳糖、半乳胺糖、N-甲醯基-半乳胺糖、N-乙醯基半乳胺糖、N-丙醯基-半乳胺糖、N-正丁醯基-半乳胺糖及 N-異丁醯基半乳胺糖所組成之群組。 31. 如實施例 30 之結合物，其中該去唾液酸糖蛋白受體靶向部分為 N-乙醯基半乳胺糖 (GalNAc)。 32. 如實施例 30 或 31 之化合物，其中該結合物部分相對於去唾液酸糖蛋白受體靶向部分為單價的、二價的、三價的或四價的。 33. 如實施例 32 之化合物，其中該結合物部分由二至四個末端 GalNAc 部分及間隔子組成，該間隔子將每個 GalNAc 部分與支鏈分子連接，從而可以與反義化合物結合。 34. 如實施例 33 之結合物，其中該間隔子為 PEG 間隔子。 35. 如實施例 30 至 34 中任一項之結合物，其中該結合物部分為三價 N-乙醯基半乳胺糖 (GalNAc) 部分。 36. 如實施例 30 至 35 中任一項之化合物，其中該結合物部分係選自圖 5 中的三價 GalNAc 部分之一者。 37. 如實施例 36 之結合物，其中該結合物部分為圖 5 中的三價 GalNAc 部分，例如圖 5D-1 或圖 5D-2 之三價 GalNAc 部分，或兩者之混合物。 38. 如實施例 29 至 37 中任一項之結合物，其包含定位在反義寡核苷酸與結合物部分之間的連接子。 39. 如實施例 38 之結合物，其中該生理不穩定之連接子包含 2 至 5 個接連的磷酸二酯連接之核苷，例如 2 個接連的磷酸二酯連接之核苷或由其組成。 40. 根據實施例 29 至 39 中任一項之結合物，其中該結合物係選自由以下所組成之群組： 5'-GN2-C6 _oc _oa _oA _sA _sT _sT _st _st _sa _sc _sa _st _sa _sc _st _sc _st _sg _sG _sT， 5'-GN2-C6 _oc _oa _oA _sA _st _st _st _st _sa _sc _sa _st _sa _sc _st _sc _st _sG _sG _sT _s ^mC， 5'-GN2-C6 _oc _oa _o ^mC _sT _st _st _sa _st _st _sa _st _sa _sa _sc _st _sT _sg _sa _sA _st _s ^mC _sT _s ^mC，及 5'-GN2-C6 _oc _oa _oT _sT _sa _sc _sa _st _sa _sc _st _sc _st _sg _sg _st _s ^mC _sA _sA _sA 其中大寫字母代表 β-D-氧 LNA 核苷，小寫字母代表 DNA 核苷，其中每個 LNA 胞嘧啶為 5-甲基胞嘧啶，且 ^mc 為 5-甲基胞嘧啶 DNA，並且其中下標 s 代表硫代磷酸酯核苷鍵結，且下標 o 代表磷酸二酯核苷間鍵結，GN2-C6 為下式之殘基：

其中殘基 GN2-C6 在寡核苷酸 5’ 端經由磷酸二酯鍵結連接，並且/或其中 GN2-C6 為圖 5D1 或圖 5D2 之三價 N-乙醯基半乳胺糖 (GalNAc)，或兩者之混合物，更佳地，其中 GN2-C6 為圖 5D1 或圖 5D2 中描繪的三價 N-乙醯基半乳胺糖 (GalNAc) 殘基之混合物 41. 結合物如圖 1 所示。 42. 結合物如圖 2 所示。 43. 結合物如圖 3 所示。 44. 結合物如圖 4 所示。 45. 一種如實施例 1 至 28 中任一項之反義寡核苷酸的醫藥上可接受之鹽，或根據實施例 29 至 44 之結合物。 46. 一種醫藥組成物，其包含如實施例 1 至 28 中任一項之反義寡核苷酸、如實施例 29 至 44 中任一項之結合物或如實施例 45 之醫藥上可接受之鹽，以及一種醫藥上可接受之稀釋劑、溶劑、載劑、鹽及/或佐劑。 47. 一種用於在表現 RTEL1 之標靶細胞中調節 RTEL1 表現之活體內或活體外方法，該方法包含以有效量對該細胞投予如實施例 1 至 28 中任一項之反義寡核苷酸、如實施例 29 至 44 中任一項之結合物、如實施例 45 之醫藥上可接受之鹽或如實施例 46 之醫藥組成物。 48. 一種用於治療或預防疾病之方法，其包含對罹患或易患該疾病之個體投予治療或預防有效量的如實施例 1 至 28 中任一項之反義寡核苷酸、如實施例 29 至 44 中任一項之結合物、如實施例 45 之醫藥上可接受之鹽或如實施例 46 之醫藥組成物，其中該疾病為 B 型肝炎病毒 (HBV) 感染，例如慢性 HBV 感染。 49. 如實施例 1 至 28 中任一項之反義寡核苷酸、如實施例 29 至 44 中任一項之結合物、如實施例 45 之醫藥上可接受之鹽、或如實施例 46 之醫藥組成物，其用於醫藥中。 50. 如實施例 1 至 28 中任一項之反義寡核苷酸、如實施例 29 至 44 中任一項之結合物、如實施例 45 之醫藥上可接受之鹽或如實施例 46 之醫藥組成物，其用於治療或預防 B 型肝炎病毒 (HBV) 感染，例如慢性 HBV 感染。 51. 如實施例 1 至 28 中任一項之反義寡核苷酸、如實施例 29 至 44 中任一項之結合物、如實施例 45 之醫藥上可接受之鹽或如實施例 46 之醫藥組成物用於製備藥物的用途，該藥物用於治療或預防 B 型肝炎病毒 (HBV) 感染，例如慢性 HBV 感染。

實例

材料與方法

寡核苷酸合成

寡核苷酸合成已為此技術領域中所公知。以下為可採用的合成方式。本發明之寡核苷酸的製造方法可能在所用裝置、撐體及濃度方面略有差異。

在 Oligomaker 48 上，以 1 微莫耳刻度，透過亞磷醯胺法，於脲苷通用撐體上合成寡核苷酸。在合成結束時，於 60℃ 用氨水處理 5 至 16 小時，將該寡核苷酸自固體載體上切割。藉由逆相 HPLC (RP-HPLC) 或藉由固相萃取來純化寡核苷酸，並藉由 UPLC 進行特性分析，再藉由 ESI-MS 進一步確認分子質量。

使用 5’-O-DMT-保護之醯胺在乙腈中的 0.1 M 溶液以及 DCI (4,5–二氰基咪唑) 的乙腈 (0.25 M) 溶液做為活化劑，進行 β-氰基乙基-亞磷醯胺 (DNA-A(Bz)、DNA-G(ibu)、DNA-C(Bz)、DNA-T、LNA-5-甲基-C(Bz)、LNA-A(Bz)、LNA-G(dmf) 或 LNA-T) 之偶合。於最終循環時，可使用具有所需修飾的亞磷醯胺，所需修飾例如用以連附結合物基團的 C6 連接子，或結合物基團本身。為導入硫代磷酸酯鍵結，使用氫化黃原素 (0.01 莫耳於乙腈/吡啶 9:1) 執行硫醇化處理。可利用 0.02 莫耳的碘於 THF/吡啶/水 7:2:1 導入磷酸二酯鍵聯。其餘試劑為通常用於寡核苷酸合成者。

可於固相合成的最後循環使用經商購取得的 C6 胺基連接子亞磷醯胺來進行後固相合成接合，在脫保護及自撐體裂解後，便可分離出胺基連結脫保護寡核苷酸。接著使用標準合成方法，透過官能基團的活化來導入結合物。

使用製備型 RP-HPLC 在 Phenomenex Jupiter® C18 10µ 150x10 mm 管柱上對粗產化合物進行純化。使用 pH 為 8 的 0.1 M 乙酸銨及乙腈為緩衝液，流速為 5 mL/min。將蒐集而得的碎片凍乾以產生純化的化合物，其通常為白色固體狀。

縮寫：DCI：4,5-二氰基咪唑 DCM：二氯甲烷 DMF：二甲基甲醯胺 DMT：4,4’-二甲氧三苯甲基 THF：四氫呋喃 Bz：苯甲醯基 Ibu：異丁醯基 RP-HPLC：逆相高效液相層析法

原代人類肝細胞 (PXB-PHH)

從人源化小鼠 (uPA/SCID 小鼠) 中採集的新鮮原代人類肝細胞 (PXB-PHH) - 本文稱為 PHH - 以 96 孔形式從 PhoenixBio Co.，Ltd (日本) 獲得且在改良肝細胞選殖生長培養基 (dHCGM) 中培養。dHCGM 為一種 DMEM 培養基，其含有 100 U/ml 青黴素、100 μg/ml 鏈黴素、20 mM Hepes、44 mM NaHCO ₃、15 μg/ml L-脯胺酸、0.25 μg/ml 胰島素、50 nM 地塞米松、5 ng/ml EGF、 0.1 mM Asc-2P、2% DMSO 及 10% FBS (Ishida 等人，2015)。

將細胞於具有 5% CO ₂之加濕環境中於 37℃ 培養。除週末外，每 2 天更換一次培養基直至收穫。

HBV 感染及寡核苷酸治療

將 PHH 與 HBV (從慢性 B 型肝炎 (CHB) 個體中純化) 以 40 的感染複數 (MOI) 及 4% PEG 一起孵育 24 小時。次日去除病毒接種物，用 PBS 洗滌細胞 3 次，然後加入新鮮培養基。

為了建立 cccDNA，PHH 中的化合物治療在 HBV 感染後第 3 天開始。從 10 μM 開始，細胞以 1:10 稀釋階梯劑量反應方式投予。在 HBV 感染後第 3 天、第 5 天及第 7 天，在 dHCGM 培養基的最終體積為 100 μl/孔中，對細胞投予寡核苷酸化合物。10 nM 恩替卡韋 (ETV) 治療在感染後第 5 天開始，確保藉由 qPCR 進行真實 cccDNA 測量，並且每兩天 (週末除外) 更換包括 10 nM ETV 的培養基，直到在 HBV 感染後第 16 天收穫細胞。實驗以生物學三重複方式進行。

細胞內 RTEL1 RNA 的即時 PCR

使用 Qiagen BioRobot 通用系統及 RNeasy 96 孔提取平盤 (RNeasy 96 BioRobot 8000 套組 (12)/目錄號.II D：967152) 根據製造商之方案，從細胞中提取總 mRNA。在 ABI QuantStudio™ 12k Flex 上使用即時 PCR 分析 mRNA 表現水平。β-肌動蛋白 (ACT B) 係藉由 qPCR 使用 TaqMan Fast 高級預混液 (Life Technologies，目錄號 4444558) 以技術性二重複方式進行定量。RTEL1 基因之 qPCR 使用 Fast SYBR™ Green 預混液 (Life Technologies，Cat.No 4385612) 進行。結果歸一化至人類 ACT B 內源性對照。mRNA 表現係使用歸一化至參考基因 ACT B 及未處理之細胞的比較性循環閾值 2-ΔΔCt 方法進行分析。用於 ACTB RNA 及 RTEL1 RNA 定量之引子列述於表 7：

表 7: ACT B 及 RTEL1 RNA qPCR 引子

參數	方向	引子序列	Seq ID No
RTEL1	Fwd	5’- CCATCCTGGACATTGAGGACT-3’	15
Rev	5’- CAGGTTCCGGGACAGGTAGTA-3’	16
管家基因引子 ACT B (VIC)：Hs01060665_g1 (Thermo Fisher Scientific)

HBV cccDNA 定量

使用 SDS 裂解緩衝液 (50 mM Tris pH8、5mM EDTA、1% SDS) 從 HBV 感染的原代人類肝細胞中提取 DNA。在 80 μl SDS 裂解緩衝液中裂解細胞後，將樣品在 -80℃ 冷凍至少 2 小時。樣品在 37℃ 解凍，向 96 孔平盤之每個孔中加入 1 μl 蛋白酶 K (目錄號 AM25448 @ Ambion biosciences，20 mg/mL 原料液)，樣品在 56℃ 孵育 30 分鐘。孵育後，加入 3 體積的來自 ZYMO Research Genomic DNA Clean & Concentrator 套組 (ZymoResearch，目錄號 D4067) 之 ChIP DNA 結合緩衝液，並按照製造商的方案純化 DNA。DNA 在 20 µl DNA 溶析緩衝液中溶析，並使用 2 µl DNA 進行 qPCR。

使用比較性循環閾值 2-ΔΔCt 方法以技術性二重複方式將 cccDNA 表現水平定量。在 QuantStudio 12K Flex PCR 系統 (Applied Biosystems) 上進行定量即時聚合酶連鎖反應測量。使用 Fast SYBR™ Green 預混液 (Life Technologies，Cat.No 4385612) 歸一化至粒線體 DNA (mitoDNA) 及作為內源對照的未處理之細胞。將循環儀設置調整為在 95℃ 孵育 5 分鐘，然後 45 個循環，每個循環為 95℃ 1 秒及 60℃ 35 秒。使用的引子列述於下表 8 中 (圖表中的所有探針皆為 SYBR Green)：

表 8：cccDNA qPCR 引子。

參數	方向	引子序列	Seq ID No
cccDNA	Fwd	5′- CGTCTGTGCCTTCTCATCTGC-3`	17
Rev	5′- GCACAGCTTGGAGGCTTGAA -3′	18
粒線體 DNA	Fwd	5’- CCGTCTGAACTATCCTGCCC -3’	19
Rev	5’- GCCGTAGTCGGTGTACTCGT-3’	20

實例 1 ：靶向 RTEL1 的反義寡核苷酸對 HBV 感染之 PHH 細胞中之 RTEL1 RNA 及 cccDNA 的影響。

使用來自表 6 之寡核苷酸化合物測試 RTEL1 敲低對 RTEL1 RNA 及 cccDNA 的影響。如材料與方法部分所述培養 PHH。如上所述，用來自表 6 之化合物處理 HBV 感染之 PHH 細胞。在 16 天的治療後，RTEL1 mRNA 及 cccDNA 係如上所述藉由 qPCR 測量。結果在表 9 中顯示為相對於平均無藥物對照 (NDC) 樣品的百分比 (亦即，值愈低，抑制/減少愈大)。

表 9：用 LNA ASO 敲低 RTEL1 後，對 cccDNA 的影響

CMP 識別號	SEQ ID NO	化合物	相對於對照的 cccDNA 百分比 ( 平均值 )	cccDNA SD	相對於對照的 RTEL1 百分比 ( 平均值 )	RTEL1 SD
3_1	3	AATTttacatactctgGT	28	13	19	3
4_1	4	AAttttacatactctGGTC	3	1	24	2
5_1	5	TTacatactctggtCAAA	21	6	35	11
6_1	6	CTttattataactTgaAtCTC	39	5	21	8

對於化合物：大寫字母代表 LNA 核苷 (使用 β-D-氧 LNA 核苷)，所有 LNA 胞嘧啶皆為 5-甲基胞嘧啶，小寫字母代表 DNA 核苷。所有核苷間鍵結皆為硫代磷酸酯核苷間鍵結。

實例 2 ：以濃度反應曲線測試不同濃度之人類 MDA-MB-231 細胞株中靶向 RTEL1 mRNA 的反義寡核苷酸的活體外功效。

人類 MDA-MB-231 細胞株係購自 ATCC，並按照供應商的建議保存在 37℃ 及具有 5% CO ₂之加濕培養箱中。對於測定，將 3500 個細胞/孔在 96 孔平盤中接種在培養基中。在加入溶解在 PBS 中的寡核苷酸之前，將細胞培養 24 小時。寡核苷酸的最高篩選濃度：50 µM 及隨後分 8 步進行 1:1 稀釋。添加寡核苷酸後 3 天，收穫細胞。根據製造商的說明，使用 PureLink™ Pro 96 RNA 純化套組 (Thermo Fisher Scientific) 提取 RNA，並在50 µl 水中溶析。隨後用不含 DNase/RNase 的水 (Gibco) 將 RNA 稀釋 10 倍，並加熱至 90℃，保持一分鐘。

對於基因表現分析，在雙工設置中使用 qScript™ XLT 一步 RT-qPCR ToughMix®, Low ROX™ (Quantabio) 進行一步 RT-qPCR。以下 TaqMan 引子測定用於 qPCR：RTEL1_Hs00249668_m1 [FAM-MGB] 及內源性對照 GUSB_Hs99999908_m1 [VIC-MGB]。所有引子組皆購自 Thermo Fisher Scientific。IC50 測定係於 GraphPad Prism7.04 中從生物學重複 n=2 進行。用 50 μM 寡核苷酸處理時的相對 RTEL1 mRNA 含量在表 10 中顯示為相對於對照 (經 PBS 處理之樣品) 的百分比。

表 10：IC50 值及 Max K _D時的 mRNA 含量

SEQ ID NO	模體	CMP 識別號	化合物	MDA-MB-231 中之 IC ₅₀	SD	在 MDA-MB-231 中之最大 KD 時 mRNA 含量	SD
3	aattttacatactctggt	3_1	AATTttacatactctgGT	0.6	0.1	38	1
4	aattttacatactctggtc	4_1	AAttttacatactctGGTC	0.3	0.1	14	1
5	ttacatactctggtcaaa	5_1	TTacatactctggtCAAA	0.9	0.3	9	4
6	ctttattataacttgaatctc	6_1	CTttattataactTgaAtCTC	0.4	0.1	18	3

如圖 7 中提供的人類細胞株 MDA-MB-231 中之濃度反應曲線所示，該等化合物對人類 RTEL1 mRNA 的敲低顯示出非常好的功效及效力。

實例 3 ：本發明化合物與先前技術化合物之活體內功效的直接比較

在該實驗中，將本發明的化合物 (CMP ID NO: 3_1、CMP ID NO: 4_1、5_1 及 CMP ID NO: 6_1，參見例如表 6) 與 WO 2020/011902 A1 中揭露之化合物進行比較。所測試之先前技術化合物如表 11 所示 (CMP ID NO: 7_1 至 CMP ID NO: 23_1)。具體而言，測試了對人類 MDA-MB-231 細胞中 RTEL1 mRNA 含量的影響。

人類 MDA-MB-231 細胞株係購自 ATCC，並按照供應商的建議保存在 37℃ 及具有 5% CO ₂的加濕培養箱中。對於測定，將 3500 個細胞/孔在 96 孔平盤中接種在培養基中。在加入溶解在 PBS 中的寡核苷酸之前，將細胞培養 24 小時。寡核苷酸的最高篩選濃度：50 µM 及隨後分 8 步進行 1:1 稀釋。添加寡核苷酸後 3 天，收穫細胞。根據製造商的說明，使用 PureLink™ Pro 96 RNA 純化套組 (Thermo Fisher Scientific) 提取 RNA，並在50 µl 水中溶析。隨後用不含 DNase/RNase 的水 (Gibco) 將 RNA 稀釋 10 倍，並加熱至 90℃，保持一分鐘。

對於基因表現分析，在雙工設置中使用 qScript™ XLT 一步 RT-qPCR ToughMix®, Low ROX™ (Quantabio) 進行一步 RT-qPCR。以下 TaqMan 引子測定用於 qPCR：RTEL1_Hs00249668_m1 [FAM-MGB] 及內源性對照 GUSB_Hs99999908_m1 [VIC-MGB]。所有引子組皆購自 Thermo Fisher Scientific。IC50 測定係於 GraphPad Prism7.04 中從生物學重複 n=2 進行。用 50 μM 寡核苷酸處理時的相對 RTEL1 mRNA 含量在表 11 中顯示為相對於對照 (經 PBS 處理之樣品) 的百分比。結果亦顯示於圖 8。

表 11：IC50 值及 Max K _D時的 mRNA 含量

CMP 識別編號	SEQ ID NO	化合物	MDA-MB-231 中之 IC ₅₀	在 MDA-MB-231 中之最大 KD 時 mRNA 含量
3_1	3	AATTttacatactctgGT	0.7	32
4_1	4	AAttttacatactctGGTC	0.2	6
5_1	5	TTacatactctggtCAAA	0.9	9
6_1	6	CTttattataactTgaAtCTC	0.2	7
7_1	21	GAattttacatactctGGT	0.6	15
8_1	22	GAAttttacatactctgGTC	0.3	8
9_1	23	CAAaaaacagtaggTCC	2.0	18
10_1	24	Gagggaggtggag ^mcgTT	-	55
11_1	25	AGCTttattataacttgaAT	-	55
12_1	26	TTttacatactctggtCAAA	0.8	17
13_1	27	TTTtacatactctggTCA	0.4	4
14_1	28	GAgaattttacatactcTGG	0.6	16
15_1	29	GCatccaacaagtaattGT	-	35
16_1	30	GgtgggtggatgTTTC	0.8	32
17_1	31	GgtggtgtggagaAGC	-	52
18_1	32	GGCatccaacaagtaaTT	2.1	22
19_1	33	GGaataaaacagtaGGTC	0.5	18
20_1	34	GCcattttcactgtCAA	0.3	7
21_1	35	GTGcagaagtcagaacaAA	0.9	26
22_1	36	CAAAatgcccttacagtGA	0.3	6
23_1	37	GGAataaaacagtaGGT	0.2	13

實例 4 ：以 100 nM 濃度在 HepG2 及 3T3 細胞中篩選反義寡核苷酸凋亡蛋白酶 (Caspase) 24 小時。

在該實驗中，藉由在 HepG2 細胞中之凋亡蛋白酶篩選來評估本發明之化合物 (CMP ID NO: 3_1、CMP ID NO: 4_1、5_1 及 CMP ID NO: 6_1，參見例如表 6) 之毒性。實例 3 中測試之先前技術化合物包括在該研究中。再者，分析了全長 CMP ID NO: 3_1 及 CMP ID NO: 5_1 的較短代謝物 (更多細節參見實例 6)。

HepG2 或 3T3 細胞係於大約70% 融合在具有 GlutaMax (Gibco #41090；HepG2) 之 MEM 培養基中培養或在具有 Glutamax (Gibco #31966) 之 DMEM 培養基中連同 5 mM HEPES (3T3) 培養，該等培養基添加有 10% 熱滅活胎牛血清。用 0.25% 胰蛋白酶-EDTA 溶液 (Gibco #25200056) 分離細胞，並且以 1 x 10 ⁴個細胞/孔 (HepG2) 或 0.25x 10 ⁴個細胞/孔 (3T3) 之密度接種於黑色透明 96 孔平盤 (Corning #3904, NY, USA) 中。使用溶解在 Opti-MEM (Gibco #31985) 中的 100 nM 寡核苷酸，用 Lipofectamine 2000 (Life Technologies #11668019) 瞬時轉染接種後 24 小時的細胞。使用 Caspase-Glo® 3/7 測定 (Promega Corporation, Madison WI, USA) 確定 Caspase-3/7 活性。將重構之 Caspase-Glo® 3/7 試劑添加到轉染後 24 小時的細胞中，孵育 60 分鐘，將細胞裂解物轉移到不透明的 96 孔平盤 (Corning #3600, NY, USA) 中，然後根據製造商的說明，在 Enspire 多模式平盤分析儀 (Perkin Elmer) 上測定發光。

結果顯示於表 12 中。

表 12：凋亡蛋白酶評分之結果

CMP-ID	SEQ ID NO	化合物	HepG2 中之凋亡蛋白酶 (% AW)	3T3 中之凋亡蛋白酶 (% AW)
3_1	3	AATTttacatactctgGT	-4	20
3_1-1	38	AATTttacatactctgG	-5	11
3_1-2	39	AATTttacatactctg	-6	3
4_1	4	AAttttacatactctGGTC	32	23
5_1	5	TTacatactctggtCAAA	8	29
5_1-1	40	TTacatactctggtCAA	8	30
5_1-2	41	TTacatactctggtCA	0	13
6_1	6	CTttattataactTgaAtCTC	6	22
7_1	21	GAattttacatactctGGT	2	26
8_1	22	GAAttttacatactctgGTC	11	35
9_1	23	CAAaaaacagtaggTCC	2	26
10_1	24	Gagggaggtggag ^mcgTT	11	-7
11_1	25	AGCTttattataacttgaAT	5	47
12_1	26	TTttacatactctggtCAAA	23	72
13_1	27	TTTtacatactctggTCA	33	47
14_1	28	GAgaattttacatactcTGG	13	44
15_1	29	GCatccaacaagtaattGT	53	102
16_1	30	GgtgggtggatgTTTC	114	12
17_1	31	GgtggtgtggagaAGC	110	80
18_1	32	GGCatccaacaagtaaTT	94	144
19_1	33	GGaataaaacagtaGGTC	44	73
20_1	34	GCcattttcactgtCAA	59	23
21_1	35	GTGcagaagtcagaacaAA	20	69
22_1	36	CAAAatgcccttacagtGA	143	44
23_1	37	GGAataaaacagtaGGT	70	51

具有超過 60% AW 值的化合物視為有毒 (T)。具有 40-60% AW 值的化合物視為具有中度毒性 (MT)。具有 20-40% AW 值的化合物視為具有輕度毒性 (M)。具有低於 20% AW 值的化合物視為無毒 (NT)

由於可在表 12 推導得出，化合物 CMP ID NO: 11_1 (MT)、CMP ID NO: 12_1 (T)、CMP ID NO: 13_1 (MT)、CMP ID NO: 14_1 (MT)、CMP ID NO: 15_1 (T)、CMP ID NO: 16_1 (T)、CMP ID NO: 17_1 (T)、CMP ID NO: 18_1 (T)、CMP ID NO: 19_1 (T)、CMP ID NO: 20_1 (MT)、CMP ID NO: 21_1、CMP ID NO: 22_1 及 CMP ID NO: 23_1 顯示具有中度毒性 (MT) 或有毒 (T)，故取消選擇該等化合物進行進一步分析。

實例 5 ：以濃度反應曲線測試不同濃度之人類 MDA-MB-231 細胞株中靶向 RTEL1 mRNA 的全長反義寡核苷酸及其代謝物的活體外功效。

已知反義寡核苷酸在細胞中代謝。在本實驗中，測試了全長寡核苷酸及其等之 3' 端代謝物 (亦即 n-1、n-2、n-3、n-4、n-5 及 n-6) 的減少 RTEL1 mRNA 標靶的活體外效力。

人類 MDA-MB-231 細胞株係購自 ATCC，並按照供應商的建議保存在 37℃ 及具有 5% CO ₂的加濕培養箱中。對於測定，將 3500 個細胞/孔在 96 孔平盤中接種在培養基中。在加入溶解在 PBS 中的寡核苷酸之前，將細胞培養 24 小時。寡核苷酸的最高篩選濃度：50 µM 及隨後分 8 步進行稀釋。添加寡核苷酸後 3 天，收穫細胞。根據製造商的說明，使用 PureLink™ Pro 96 RNA 純化套組 (Thermo Fisher Scientific) 提取 RNA，並在50 µl 水中溶析。隨後用不含 DNase/RNase 的水 (Gibco) 將 RNA 稀釋 10 倍，並加熱至 90℃，保持一分鐘。

對於基因表現分析，在雙工設置中使用 qScript™ XLT 一步 RT-qPCR ToughMix®, Low ROX™ (Quantabio) 進行一步 RT-qPCR。以下 TaqMan 引子測定用於 qPCR：RTEL1_ Hs01548056_m1 [FAM-MGB] 及內源性對照 GUSB_Hs99999908_m1 [VIC-MGB]。所有引子組皆購自 Thermo Fisher Scientific。相對 RTEL1 mRNA 含量顯示為相對於對照 (經 PBS 處理的樣品) 之百分比，及使用 GraphPad Prism7.04 測定 IC ₅₀。

結果顯示於圖 9 及表 13 中

表 13：全長寡核苷酸及其代謝物的活體外效力

CMP-ID	SEQ ID NO	化合物	MDA-MB-231 中之 IC ₅₀ [µM]	MDA-MB-231 中 50 µM 時的 RTEL1 mRNA 含量 (%)
5_1	5	TTacatactctggtCAAA	0.6	2
5_1-1	40	TTacatactctggtCAA	0.4	3
5_1-2	41	TTacatactctggtCA	0.7	3
5_1-3	42	TTacatactctggtC	2.5	13
5_1-4	43	TTacatactctggt	-	33
5_1-5	44	TTacatactctgg	-	33
5_1-6	45	TTacatactctg	-	72
7_1	21	GAattttacatactctGGT	0.4	3
7_1-1	46	GAattttacatactctGG	1.0	11
7_1-2	47	GAattttacatactcTG	-	62
7_1-3	48	GAattttacatactcT	-	72
7_1-4	49	GAattttacatactc	-	72
7_1-5	50	GAattttacatact	-	79
7_1-6	51	GAattttacatac	-	84
8_1	22	GAAttttacatactctgGTC	0.1	3
8_1-1	52	GAAttttacatactctgGT	1.4	16
8_1-2	53	GAAttttacatactctgG	3.1	34
8_1-3	54	GAAttttacatactctg	-	68
8_1-4	55	GAAttttacatactct	-	67
8_1-5	56	GAAttttacatactc	-	68
8_1-6	57	GAAttttacatact		77
9_1	23	CAAaaaacagtaggTCC	1.2	11
9_1-1	58	CAAaaaacagtaggTC	-	64
9_1-2	59	CAAaaaacagtaggT	-	73
9_1-3	60	CAAaaaacagtagg	-	68
9_1-4	61	CAAaaaacagtag	-	78
9_1-5	62	CAAaaaacagta	-	83
9_1-6	63	CAAaaaacagt	-	79
10_1	24	Gagggaggtggag ^mcgTT	-	46
10_1-1	64	Gagggaggtggag ^mcgT	-	38
10_1-2	65	Gagggaggtggag ^mcg	-	39
10_1-3	66	Gagggaggtggag ^mc	-	34
10_1-4	67	Gagggaggtggag	-	47
10_1-5	68	Gagggaggtgga	-	51
10_1-6	69	Gagggaggtgg	-	54

如可自表 13 及圖 9a 推導得出，全長寡核苷酸 CMP 5_1 的 IC ₅₀為 0.6 µM。有利地，第一及第二代謝物 (CMP 5_1-1 及 CMP 5_1-2) 在進一步代謝物 (n-3 至 n-6) 顯示以最大功效及效力降低之前，保持相似的標靶敲低活性，IC ₅₀分別為 0.4 µM 及 0.7 µM。對於所有其他化合物，與其等各自之全長序列化合物相比，n-1 及 n-2 代謝物已經顯示出效力及/或最大效力的顯著損失。

實例 6 ： CMP 5_1-GalNAc 反義寡核苷酸的活體內研究

研究時間表

該研究在 HBV 感染之 PXB-mice® (一種具有穩定人類肝細胞移植 (PhoenixBio) 的嵌合小鼠模型) 中運行總計 77 天，分為 3 組 (媒液、CMPD3_1_GalNAc、CMPD5_1_GalNAc)，每組 20 隻動物。每週使用 10 mg/kg 化合物或等效體積之媒液對動物給藥。在第 28 天及第 56 天分別犧牲每組 5 隻動物。其餘動物在第 77 天犧牲，然後對動物的肝臟進行生物分析。研究方案顯示於圖 10 中。

方法與材料

用於 CMP 3_1 及 CMP 5_1 之 GalNAc 結合物藉由本領域已知之方法產生 (參見例如 Javanbakh 等人 Liver-Targeted Anti-HBV Single-Stranded Oligonucleotides with Locked Nucleic Acid Potently Reduce HBV Gene Expression In Vivo. Mol Ther Nucleic Acids. 2018 Jun 1;11:441-454. doi: 10.1016/j.omtn.2018.02.005. Epub 2018 Feb 23. PMID: 29858079; PMCID: PMC5992345)。所產生之結合物分別如圖 1 劑圖 4 所示。

動物及處置

HBV 基因型 C 感染的人類肝嵌合 uPA/SCID 小鼠 (PXB 小鼠；供體肝細胞 BD195 (Corning Incorporated)) 購自 PhoenixBio Co, Ltd。動物處置由位於日本東廣島的 PhoenixBio Co, Ltd. 現場完成。選擇在給藥開始 (第 0 天) 時為至少 20 週齡、在給藥開始前一天 (第 -1 天) 測定之體重為 18 g 或更大的雄性小鼠用於研究。小鼠在給藥開始前至少 6 週已經感染 HBV 基因型 C (編號：PBB004，批號：180118，PhoenixBio Co., Ltd.) 並在第 -7 天顯示血清 HBV-DNA 含量＞ 1x10 ⁶複本/ml，如藉由 qPCR 所測定。基於體重的算術平均值以及血液 h-Alb 濃度及血清 HBV-DNA 濃度的幾何平均值，在第-1 天確定研究開始時的組隨機化。

10 mg/kg 的所有劑量皆基於在給藥日投予前取得之小鼠個體的體重計算。在第 0、7、14、28、35、42、49、56、63 及 70 天，使用帶有永久連接針頭的一次性 1.0 mL 注射器 (Terumo Corporation)，將劑量調配物注射到所有受試小鼠上背部的頸部皮下組織中。

在各自的犧牲日，用異氟醚麻醉標靶動物並藉由心臟穿刺及放血犧牲。提取肝臟並將左側葉分成大約 100 mg 的塊。記錄準確的重量，並將肝臟樣品在液氮中速凍並儲存在 -80℃，直到進一步處理。

根據需要，犧牲具有垂死徵象或體重減輕＞ 20％之初始體重的動物。所有過早終止/發現死亡的動物以及犧牲時具有胸腺瘤/淋巴瘤的小鼠皆排除在分析之外。

RTEL1 mRNA 表現的定量

將肝組織樣品冷凍直至在 MagNA Pure LC RNA 分離組織裂解緩衝液 (產品號 03604721001，Roche) 中裂解，然後根據用戶手冊，使用 MagNA Pure 96 細胞 RNA 大體積套組 (產品號 05467535001，Roche) 在 MagNA Pure 96 儀器 (Roche) 上繼續提取 RNA，並且用水調整 RNA 濃度。

對於基因表現分析，使用 qScript™ XLT 一步 RT-qPCR ToughMix®, Low ROX™ (Quantabio) 進行一步 RT-qPCR。以下 TaqMan 引子測定用於 qPCR：Hs01548056_m1；Hs00249680_m1；Hs00249668_m1 及參考基因 GAPDH_Hs99999905_m1；PGK1_Hs99999906_m1 及 GUSB_Hs99999908_m1。所有引子組皆購自 Thermo Fisher Scientific。相對 mRNA 表現水平顯示為相對於食鹽水處理之對照組的百分比。

結果顯示於圖 11。分析顯示，使用每週給藥 10 mg/kg 的 CMP3_1_GalNAc，敲低效率為大約 80%；使用每週給藥 10 mg/kg 的 CMP5_1_GalNAc，敲低效率為約 95%。

實例 7 ：原代人類肝細胞的活體外研究

方法與材料

細胞培養基

藉由膠原酶灌注法從具有人源化肝臟的嵌合尿激酶型胞漿素原活化物/嚴重合併性免疫缺失 (uPA/SCID) 小鼠中分離的原代人類肝細胞 (PHH) 獲自 PhoenixBio (日本廣島)。PHH 以每孔 7 × 10 ⁴個細胞的濃度在第 I 型膠原蛋白包被之 96 孔平盤上接種在改良之肝細胞選殖生長培養基 (dHCGM) 中。dHCGM 為一種 DMEM 培養基，其含有 100 U/ml 青黴素、100 μg/ml 鏈黴素、20 mM Hepes、44 mM NaHCO ₃、15 μg/ml L-脯胺酸、0.25 μg/ml 胰島素、50 nM 地塞米松、5 ng/ml EGF、 0.1 mM Asc-2P、2% DMSO 及 10% FBS (Ishida 等人, 2015)。

然後將感染複數 (MOI) 為 40 的 HBV 基因型 C 添加到 96 孔平盤中的細胞中，最終濃度為 4% PEG 8000 (Sigma-Aldrich)。感染的細胞在 37℃ 孵育 20 小時，然後用 PBS 洗滌兩次以去除 HBV 接種物並且用完全培養基重新填充。在感染後第 4 天，用不同濃度的 LNA 處理細胞。在感染後第 6 天及第 8 天用新的 LNA 更換培養基。磷酸鹽緩衝生理食鹽水 (PBS) 用作「無藥物」對照 (NDC)。在感染後第 19 天收穫上清液及細胞，並用於 HBV 標記及標靶基因敲低分析。

根據製造商的方案，使用細胞計數套組 8 (Sigma-Aldrich) 評估 LNA 的細胞毒性，並表示為相對於 NDC 的細胞毒性百分比。

RNA 提取及即時定量 PCR

根據製造商的方案，使用 MagNA Pure 96 機器人及 MagNA Pure 96 細胞 RNA 大體積套組 (Roche) 從細胞中提取細胞內 mRNA。使用 QuantStudio 12K Flex (Life Technologies)，使用 TaqMan RNA-to-Ct 1 步套組 (Applied Biosystems，#4392938)，以技術性二重複方式進行相對總 HBV、RTEL1、pgRNA 及 β-葡萄醣醛酸酶 (GusB) 內源性對照 mRNA 的定量。mRNA 表現係使用歸一化至參考基因 GusB 及無藥物對照的比較性循環閾值 2-ΔΔCt 方法進行分析。TaqMan 引子及測定 ID 如下：RTEL1、Hs02568623_s1；總 HBV RNA Pa03453406_s1；HBV pgRNA AILJKX5。作為參考基因 GusB，使用 Hs00939627_m1。所有引子及探針組皆購自 ThermoFisher。

25 µM 反義寡核苷酸的結果顯示在表 14 中，該表尤其包括有關細胞之細胞毒性及 RTEL1 mRNA 敲低的資訊。CMP10_1 顯示出高細胞毒性及在靶向 RTEL1 mRNA 方面的不良功效。此外，CMP9_1 顯示第二差的 RTEL1 mRNA 敲低，57% 的 RTEL1 mRNA 剩餘。

表 14 ：原代人類肝細胞的活體外研究 (25 µM 反義寡核苷酸 )

LNA @25 µM	細胞毒性百分比	相對於 NDC 的 RTEL1 mRNA 百分比	相對於 NDC 的 pgRNA 百分比	相對於 NDC 的總 HBV-RNA 百分比
5_1	4	17	70	72
5_1_GalNAc	5	15	57	46
7_1	1	24	83	76
8_1	3	13	74	81
9_1	2	57	103	94
10_1	30	101	61	53

5 µM 反義寡核苷酸之結果顯示於表 15。CMP10_1 顯示在靶向 RTEL1 mRNA 方面的不良功效。此外，CMP9_1 再次顯示第二差的 RTEL1 mRNA 敲低，79% 的 RTEL1 mRNA 剩餘。

表 15 ：原代人類肝細胞的活體外研究 (5 µM 反義寡核苷酸 )

LNA@5 µM	細胞毒性百分比	相對於 NDC 的 RTEL1 mRNA 百分比	相對於 NDC 的 pgRNA 百分比	相對於 NDC 的總 HBV-RNA 百分比
5_1	4	47	77	80
5_1_GalNAc	2	29	62	72
7_1	0	40	84	92
8_1	1	28	78	101
9_1	-1	79	146	130
10_1	-4	106	175	116

實例 8 ： CMP5_1-GalNAc 概念的活體內驗證

研究時間表

該研究在 HBV 感染的 PXB-mice® (一種具有穩定人類肝細胞移植 (PhoenixBio) 的嵌合小鼠模型) 中進行，小鼠在第 56 天及第 105 天犧牲。CMP5_1-GalNac 在進行 8 次 5、10 及 20 mg/kg 每週給藥後 (第 56 天，參見圖 12) 評估。此外，CMP5_1-GalNac 還在進行 15 次 10 mg/kg 每週給藥後 (第 105 天) 評估。對於每個組，有一個單獨的媒液對照小組接受與治療動物相同體積的媒液。在研究開始時，所有組的小鼠數目為 6 隻。對動物的肝臟進行生物分析。

方法與材料

動物及處置

HBV 基因型 C 感染的人類肝嵌合 uPA/SCID 小鼠 (PXB 小鼠；供體肝細胞 BD195 (Corning Incorporated)) 購自 PhoenixBio Co, Ltd。動物處置由日本宇土的 LSIM Safety Institute Corporation 完成。選擇在給藥開始 (第 0 天) 時為至少 25 週齡、在給藥開始前一天 (第 -1 天) 測定之體重為 18 g 或更大的雄性小鼠用於研究。小鼠在給藥開始前至少 6 週已經感染 HBV 基因型 C (編號：PBB004，批號：180118，PhoenixBio Co., Ltd.) 並在第 -7 天顯示血清 HBV-DNA 含量＞ 1x10 ⁶複本/ml，如藉由 qPCR 所測定。在研究開始時，在第 -1 天基於體重以及血液 h-Alb 濃度及血清 HBV-DNA 濃度進行分層隨機化。

所有劑量皆基於在給藥日投予前取得之小鼠個體的體重計算。所有受試小鼠皆接受將劑量調配物或匹配的媒液注射到上背部的頸部皮下組織中。第 56 天犧牲的動物在第 0、7、14、21、28、35、42 及 49 天注射 (參見圖 12)。20 mg/kg/週的劑量以 10 mg/kg 的兩次連續注射給予，以避免嵌合肝臟中的 ASGPR 過載。因此，此等小鼠在第 0、1、7、8、14、15、21、22、28、29、35、36、42、43、49 及 50 天給藥。在第 105 天犧牲的動物在第 0、7、14、21、28、35、42、49、56、63、70、77、84、91 及 98 天使用帶有永久連接針頭的一次性 1.0 mL 注射器 (Terumo Corporation) 投予 10mg/kg (參見圖 12)。

藉由南方墨點分析測定 cccDNA

將肝組織冷凍直至在 DNA 提取緩衝液 (50 mM Tris pH8、5 mM EDTA、150 mM NaCl、1% SDS) 中均質化。提取物首先在環境溫度用 RNase 混合液 (ThermoFisher) 消化 30 分鐘，然後在輕微攪拌下在 56℃ 用蛋白酶 K (ThermoFisher) 消化 2 小時。藉由離心沉澱碎片，並藉由與 1 體積超純緩衝液飽和苯酚 (ThermoFisher) 一起搖晃三次從上清液中提取 DNA，然後用 1 體積的苯酚:氯仿:異戊醇 (25:24:1；ThermoFisher) 提取。然後藉由在-20℃ 添加 1 體積的 100% 乙醇及 60 mM (最終) NaAc (SigmaAldrich) 隔夜來沉澱 DNA。然後藉由離心沉澱 DNA，用 70% 乙醇洗滌沉澱並風乾，然後再懸浮在 10 mM Tris-HCl pH8 (ThermoFisher) 中。

使用 NanoDrop (ThermoFisher) 定量 DNA 含量，並將濃度歸一化至 1.5 µg/µl。然後將 30 µg DNA 用 70 U T5 核酸外切酶 (New England Biolabs) 在 1x CutSmart 緩衝液 (New England Biolabs) 中於 37℃ 消化 2 小時。對於每個樣品，等體積與 Blue Juice 裝載緩衝液 (ThermoFisher) 混合並裝載至 0.95% 瓊脂糖-TAE 凝膠 (SigmaAldrich) 上。在每組 (生物) 樣品之間，添加 1 個裝載有 DNA 分子量標記 VII (Roche) 的泳道 (每個泳道中的量相同)。分離後，將凝膠轉移到新鮮的 0.2 M HCl (Acros Organics) 中 10 分鐘，然後用水沖洗三次。隨後，將凝膠於變性緩衝液 (0.5 M NaOH、1.5 M NaCl) 中放置 30 分鐘並用水沖洗一次。接下來，將凝膠轉移到中和緩衝液 (0.5 M Tris pH7.5，1.5 M NaCl) 中 30 分鐘。最後，凝膠用 20x SSC 緩衝液 (ThermoFisher) 平衡 30 分鐘。然後根據製造商的說明，使用 TurboBlotter 套組 (Cytiva) 將 DNA 轉移到 Hybond-XL 膜 (Cytiva) 上，使用 20x SSC 緩衝液 (ThermoFisher) 進行隔夜轉移。轉移後，藉由使用 1800 J UV 輻射將 DNA 交聯到膜上，然後乾燥膜。

對於 HBV cccDNA 之特異性偵測，根據製造商的說明，將 DIG 核酸偵測套組與 DIG EasyHyb 緩衝液及 DIG 洗滌與封閉緩衝液組 (所有皆來自 Roche) 一起使用。根據製造商的說明，使用 DIG PCR 探針套組 (Roche) 藉由 PCR 生成探針。含有 HBV 基因型 C 基因體之質體用作模板，具有以下引子：正向，GTTTTTCACCTCTGCCTAATCATC (SEQ ID NO: 70)；反向，GCAAAAAGTTGCATGGTGCTGGT (SEQ ID NO: 71)。

使用在 100℃ 變性 5 分鐘的探針進行雜交，然後快速冷卻至 4℃ 在 37℃ 隔夜。根據製造商的說明進行清洗及偵測。使用 FUSION FX 系統 (Vilber) 獲取圖像，該系統設置適當的曝光時間以偵測媒液對照樣品中的 cccDNA。為進行分析，使用 ImageStudio 軟體 (Licor) 對 cccDNA 條帶 (2.1 kB 大小) 進行定量。為了解釋不均勻的轉移，還對 DNA 分子量標記 VII 的 2.8 kB 條帶定量，並且將 cccDNA 條帶強度歸一化至構成該組的兩個條帶的平均強度。然後將各個值歸一化為媒液對照組的平均條帶強度。

RTEL1 mRNA 分析

圖 13A 顯示每週給藥 CMP5_1-GalNAc，持續 105 天的實例，使 RTEL1 mRNA 減少至約 15%，且 cccDNA 減少至約 20%

圖 13B 顯示每週給藥 5、10 及 20 mg/kg CMP5_1-GalNac 後，在第 56 天，RTEL1 mRNA 的敲低分別為 87%、91% 及 97%。對於 10 及 20 mg/kg CMP5_1-GalNac，cccDNA 分別減少 59% 及 73%。

結論：從上述實例可以看出，CMP ID 5_1 展示了一種安全有效的化合物，其可在活體內及活體外靶向 RTEL1 mRNA。我們在此已經展示了 CMP ID_5_1 的良好活體外藥物特性曲線，並且我們已經展示了 RTEL1 之標靶可以在活體內非常有效地參與隨後的病毒 cccDNA 減少。此外，我們已經利用 B 型肝炎感染的人源化小鼠模型證明，藉由下調 RTEL1 mRNA，可以對病毒 cccDNA 產生顯著的劑量依賴性影響。化合物 5_1 還具有從 3’ 末端降解後保持活性的特性。這意味著從 3' 端開始的 n-1 及 n-2 與全長 CMP ID_5_1 相比具有可比較的活體外效力。n-3 降解還保留了對 RTEL1 的活性，儘管活體外效力較低。由於母體分子的代謝物仍然對 RTEL1 mRNA 產生所希望的影響，因此該特徵為該分子帶來了明顯的益處。

圖 1化合物 3_1 (SEQ ID NO: 3) 經由經磷酸二酯連接之 DNA 二核苷酸與三價 GalNAc 部分結合圖 1A化合物 3_1 (SEQ ID NO:3) 之殘基 A 圖 2化合物 4_1 (SEQ ID NO: 4) 經由經磷酸二酯連接之 DNA 二核苷酸與三價 GalNAc 部分結合圖 2A化合物 4_1 (SEQ ID NO:4) 之殘基 A 圖 3化合物 6_1 (SEQ ID NO: 6) 經由經磷酸二酯連接之 DNA 二核苷酸與三價 GalNAc 部分結合圖 3A化合物 6_1 (SEQ ID NO:6) 之殘基 A 圖 4化合物 5_1 (SEQ ID NO: 5) 經由經磷酸二酯連接之 DNA 二核苷酸與三價 GalNAc 部分結合圖 4A化合物 5_1 (SEQ ID NO:5) 之殘基 A 圖 5圖 5A1 至圖 5L2 說明示例性 GalNAc 部分。圖5L1 及圖 5L2 中之化合物由單體 GalNAc 磷醯亞胺組成，X 為 S 或 O，Y 為 S 或 O，且 n = 1 至 3 (參見 WO 2017/178656)，其添加到寡核苷酸中但同時仍在固相支持物上作為合成的一部分。圖5B1 及圖 5B2 以及圖5D1 及 5D2 在本文中亦分別稱為 GalNAc2 或 GN2，分別不具有及具有 C6 連接子。圖 6圖 6 A1-L2：說明示例性反義寡核苷酸結合物，其中該寡核苷酸由如上所述之術語「A」表示。圖 6A1-D2 中之化合物包含二-離胺酸支鏈分子、PEG3 間隔子及三個末端 GalNAc 碳水化合物部分。在圖 6A (圖 6A-1 及圖 6A-2 顯示同一化合物之兩種不同非鏡像異構物) 及圖 6B (圖 6B-1 及圖 6B-2 顯示同一化合物之兩種不同非鏡像異構物) 之化合物中，寡核苷酸直接連接至去唾液酸糖蛋白受體靶向結合物部分，不具有烷基連接子。在圖 6C (圖 6C-1 及圖 6C-2 顯示同一化合物之兩種不同非鏡像異構物) 及圖 6D (圖 6D-1 及圖 6D-2 顯示同一化合物之兩種不同非鏡像異構物) 之化合物中，寡核苷酸經由 C6 連接子連接至去唾液酸糖蛋白受體靶向結合物部分。圖 6E-J 中之化合物包含可商業獲得之三分支分子以及不同長度及結構之間隔子以及三個末端 GalNAc 碳水化合物部分。圖6L1 及圖 6L2 中之化合物由單體 GalNAc 磷醯亞胺組成，其中 X = S 或 O，且獨立地，Y = S 或 O，且 n = 1 至 3 (參見 WO 2017/178656)，其添加到寡核苷酸中但同時仍在固相支持物上作為合成的一部分。圖 7 ：在活體外測試寡核苷酸 CMP ID No 3_1、CMP ID No 4_1、CMP ID No 5_1 及 CMP ID No 6_1 在人類細胞系 MDA-MB-231 中的濃度依賴性效力及功效。圖 8 ：在活體外測試寡核苷酸 CMP ID No 3_1、CMP ID No 4_1、CMP ID No 5_1 及 CMP ID No 6_1 以及先前技術化合物 (CMP ID No 7_1 至 CMP ID No 23_1) 在人類細胞系 MDA-MB-231 中的濃度依賴性效力及功效。圖 9 ：在活體外測試寡核苷酸反義分子及其較短之代謝物在人類細胞系 MDA-MB-231 中的濃度依賴性效力及功效。 A) CMP ID 5_1， B)CMP ID 7_1， C)CMP ID 8_1， D)CMP ID 9_1， E)CMP ID 10_1。圖 10 ：對用 GalNAc 結合之 CMP ID 5_1 治療的小鼠進行活體內分析之研究方案圖 11 ：來自用 GalNAc 結合之寡核苷酸反義 CMP ID No 3_1 及 CMP ID No 5_1 治療的 PXB 小鼠之肝臟組織中的 RTEL1 mRNA 含量圖 12 ：對用 GalNAc 結合之 CMP ID 5_1 治療的 HBV 感染之 PXB 小鼠進行活體內分析之研究方案。圖 13 ：來自用 GalNAc 結合之 CMP ID 5_1 及對照治療的 HBV 感染之 PXB 小鼠之肝臟組織中的RTEL1 mRNA 含量及 HBV cccDNA 含量： A) 第 105 天， B)第 56 天。

<![CDATA[<110>  瑞士商赫孚孟拉羅股份公司 (F. Hoffmann-La Roche AG)]]>
          <![CDATA[<120>  用於抑制 RTEL1 表現之增強型寡核苷酸]]>
          <![CDATA[<130>  P35909]]>
          <![CDATA[<160>  71    ]]>
          <![CDATA[<170>  PatentIn 3.5 版]]>
          <![CDATA[<210>  1]]>
          <![CDATA[<211>  38444]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  1]]>
          agtcagccct gctgccagcc agtgccgggt gctggggact cagggaggcc cgccgggacc       60
          actgcgggac agtgagccga gcagaagctg gaacgcagga gaggaaggag agggggcggt      120
          cagggctctc aggagccggg tcctgggcaa ggcgcagccg ttttcaaatt ttcaggaaag      180
          cggtcggctc acactcgagc agtaaaaaga tgcctctggg gaggaggccc gtgcagctct      240
          ccgggcaatg gtggtggctc ggcctagaga ggcggtagtg gaacgcagac cctggtgggg      300
          gaatgacatc aagggaggag acgggcggga ccccagattt ctgcctgtgg gcgatggaag      360
          tgaggttcac tggccagcgg agccggacac agaacgcgca aaacgccgtg taggcctgga      420
          ggagccgaag agcaggcgga ccccctccgc gggggaacag tttccgccgg gagcacaaag      480
          caacggaccg gaagtggggg gcggaagtgc agtgggctca gcgccgactg cgcgcctctg      540
          cccgcgaaaa ctctgagctg gctgacagct ggggacgggt ggcggccctc gactggagtc      600
          ggttgagttc ctgagggacc ccggttctgg aaggttcgcc gcggagacaa gtgagcagtg      660
          agtcgcagtg accctacaag tggttctttt acccgagcgg ctcgtaggcg cgttgcggtt      720
          tttcgaaact acagctcccg gcaggcccca agccgccctc ggggccgcgg gtcggcggat      780
          tggccgcgct gcattttggg acctgtagtt tcctgcgctc gtggcgctgg cgccgcggcg      840
          ttggctgagc ccttgaccgg ggctggaggg aagggccgac attcagtgtg tccgcgtctg      900
          ttctgttagt cccagttccc gggcgggatt gaggcttaga gaagttgagt gatttgctga      960
          gggctgcacg ggttggcatc ccggcatgct ctttcgctac tttggctgca tctggttgcc     1020
          cacccgggcg gatggggaat ggactccagc cagccaggag ggcagagggc tggagaggca     1080
          gggccggagg ttcagaccct ccgctctgac gttgcgcctg gtgaggccgg gaggggtgcc     1140
          gcttgcctct tcagccctca cgctcttgtg gaagtcgcgg aattactgca ggcggaactt     1200
          gcagcactgt gggcgtcttt tccagagaag gacggagttg tggggcggga ggataaggca     1260
          aggcccagcc acttcgcatc ttcgccccgc cagctcctcg agatgggata taccagggtt     1320
          gctctccaac cctctccgca ggagggactg atggaaacgc ctgggaaagt agcccggtac     1380
          ccacaaaggc tgtctacaaa cagagtctta ctgtctttcc caggtctgtg ccatagggat     1440
          tctcgaagag aacagcgttg tgtcccagtg cacatgctcg catcgcttac caggagtgcc     1500
          cgagacccta agatgttcgg agtggttttt tcgcacagac ccgaatagcc tgcccctcag     1560
          ccacgctctg tgcccttctg agaacaggct gatatgccca agatagtcct gaatggtgtg     1620
          accgtagact tccctttcca gccctacaaa tgccaacagg agtacatgac caaggtcctg     1680
          gaatgtctgc agcaggtaga gcacaggccc cgaggaaagg actgcgggtg ggtggagctt     1740
          cagccaggac ggggtgtgct tccctctccc ggcccattcc agccaggccc ctccgggcca     1800
          gaggcagcgt ctgtcataaa aagggctggt gttccaggtg gggtcagaga gaggattgac     1860
          aagtaaaaac gatcgtcctt tgaagggggc cggcccctcc acacctgtgg gtatttctca     1920
          tcaggcggga cgagagactg agaaaatgaa taagacacag agacaaagta tagagagaaa     1980
          agtgggccca ggggaccggc gctcagcata cagaggacct gcaccggcac cagtctctga     2040
          gtttcctcag tattcattaa ttactatttt cactatctca gcaagaggaa tgcggcagga     2100
          cagcaaggtg atagtgggga gaaggtcagc aagaaaacgt gagcaaagga atctgggtca     2160
          caaataagtt caagggaagg tactatgcct ggatgtgcac gtaggctagt tttatgcttt     2220
          tctccaccca aacatctcgg tggagtaaag agtaacagag cagcattgct gccaatatgt     2280
          ctcgcctcct gccacagggc ggcttttctc ctatctcaga attgaacaaa tgtacaatcg     2340
          ggttttatac cgaaacattc agttcccagg ggcaggcagg agacagtggc cttcctctat     2400
          ctcgactgca agaggctttc ctcttttact aatcctcagc acagaccctt cacgggtgtt     2460
          gggctggggg actgtcaggt ctttcccatc ccacgaggcc atatttcaga ctatcacatg     2520
          gagagaaacc ttgggcaata cccggctttc cagggcagag gtccctgcgg ctttccgcag     2580
          tgcatcgtgc ccctggttta tcgagactgg agaatggcga tgacttttac caagcatact     2640
          gcctgtaaac atattgttaa caaggcacgt tctgcacagc tctagatccc ttaaaccttg     2700
          attccataca acacatgttt ctgtgagctc aaggctgggg caaagttaca gattaacagc     2760
          atcttagggc aaagcaattg ttcagggtac aggtcaaaat ggagtgtgtt atgtcttccc     2820
          tttctacata gacacagtaa cagtctgatc tctcttttcc ctacagtcct tgagggtgac     2880
          agacttagga gtgccttggg ggcctctctg aggagcagct gatattcacg ggtcaggagg     2940
          aagcatttcc attagagggg cagccggtgg ccagcctcac ttggaaggtc tttgaacctc     3000
          gggggtgcag ggaggtggca gtggtgcagg ttgccttctc ctgggttcct tgaggtgccc     3060
          tcttgtaccc ggctcacacc cttcccctcc ccgagtttcc tgctcaggtt cccgtctgag     3120
          agcttgtatg taggacgtca gataggacag cataaatgtt tggatccaga aacgcagaac     3180
          agtttcctat tttgagactt gacacctaat tagtcatctt actatttaag ctgaaaaata     3240
          gtgtcgtgtt ttgggtaacg ttctgcaaat cgtttgctaa tggcggctga gttgcttcac     3300
          gccctttagg gcaagagtgg gacttgcctg tggacttctc cgcggtccca cagggctctc     3360
          gccacctggc agtggcctct gcatctgcaa agagctgccc gctggctgcc gaagcttgtc     3420
          tcagggcagc ttgtgtggcc tcgcctcttc ctggcttccc cgtaaccctt gctccgaact     3480
          ccgttcagaa ggtgaatggc atcctggaga gccctacggg tacagggaag acgctgtgcc     3540
          tgctgtgcac cacgctggcc tggcgagaac acctccgaga cggcatctct gcccgcaaga     3600
          ttgccgagag ggcgcaagga gagcttttcc cggatcgggc cttgtcatcc tggggcaacg     3660
          ctgctgctgc tgctggagac cccataggtg accctagttc ccaggcctct cctggcctcc     3720
          tgtggggatg gttggcaagg gatggcgctg agggtggggt gggcccatgg ggactcctgc     3780
          cgtctctcaa gcagaactca aggagaattt tttagctgct gtataatttc tcgccatcgt     3840
          gggtgtaaac ctagggttgg gcttttttgc tgaattaggg cacggcagat gcccacttca     3900
          cccatttttg ataaaccagt atctggggtg tcagattctt ggctgtctgc agggccgagt     3960
          tagccgaatg ccacctgcct ttgatacgtg agaacgttgt ctgagaaccg tgacttctgt     4020
          gcttgcttgt gtctggtcag cttgctacac ggacatccca aagattattt acgcctccag     4080
          gacccactcg caactcacac aggtcatcaa cgagcttcgg aacacctcct accggtgggt     4140
          cagacgagtt tacacctgtc tcggggtcct caagagaacc agcttggcat ggtgctgagt     4200
          ccacagcccc atgctgtgct gtggtggagg gtggtggtct ttctagacgc tcccccgaag     4260
          tgtgcagagc gctggtgccc aggggtgggg tgcggcctgg gctgcctcca atgcccatta     4320
          cttgtgagga agcagctttg catctgtgtg ctgaccttgg gcgggcgtcc tgagctcctc     4380
          gcaggtgctg ttgtagcagc tgtgcagtag gtcagggctg gcccccagtg cagctttgca     4440
          catgaagtag gaggaggccc tgctgcttgt cagagcccag cagagtcttg gtgttctgtc     4500
          gggttcctgt ggccggacca gtggcagggt gctgtggaag ctgtcgaatc tcctccctct     4560
          gtccagtacc cccgctcgtc ttctagctcc ctcctacgcc cgggccacgt ttcagttatg     4620
          ctcacttcct ctgaccgccg aggctcctgc gtgtctccat acagctcacg ctgcagggcc     4680
          acgctgtggg tgttggagac agctcctcct cgacccacgg tgctctctcc caccaggcct     4740
          aaggtgtgtg tgctgggctc ccgggagcag ctgtgcatcc atcctgaggt gaagaaacaa     4800
          gagagtaacc atctacaggt aggctcctgg gctcccgctc cggctcagtg tccgacaggc     4860
          gagtgctgct gggtgtccag agccccaggc tgcgctcccg ctgggctagg gtttgaagtt     4920
          cactggggga ctgcagggga ggacctggtg ggggtgggga ctggcttcgg tcctttcttg     4980
          gccgtgcttc agctgcgcac tctgcccttc ctcccacaga tccacttgtg ccgtaagaag     5040
          gtggcaagtc gctcctgtca tttctacaac aacgtagaag gtacaagcag ctgggtggga     5100
          ccagggtcgg gttggagtgt gtgcagcctc tcagggtgga gctcagtggt gtcacagcct     5160
          ggttgtgctt gcccggtggg gcggccagtg cggccatgta cctgggccct gtcttctgac     5220
          tcggggccac ccatgttaga cttctgtgtg gaagagctca cacagtggtc tgagacagcc     5280
          agccggcaag actgcctctg gctggtgcct ggggccttgg attttgggaa ggctccctcc     5340
          atttcctgat gagagggtct ccctgcacct aacctgctgg tgcaaacagt aggggttttg     5400
          ctgaacaccg gctttctctt cggggacttt gttgcttgcc cagcagcagg tgctccagtg     5460
          accggccctc ataccatctt gggagggtgt cctggaagcc gtgtctggcc tcccgcgacc     5520
          ctgccccgtg tgtctttttc ctgtgctgac cttgctgcgg aaaattatgg ccctgagtgt     5580
          gactccaggc tgagtcctgt gggtccaaca cgggatgcct tggggcctct tctggagacg     5640
          ggatgtgagt gacaggagcc ggccggggca gcttgccctg tgactgcacg tggccacagc     5700
          ctgtgagggc cgggggtgct tctccaccca cgtggctgcc cctcgggtat gtcaagggct     5760
          tctggggctc atcacggggt cctagagaca gtggcagggt gcacccccgt tggctgccct     5820
          tacagtttct gtgacctgag ggtggcatct gtgcagtcgg cgcggtctgt gcttctgtgg     5880
          gatcagggtt ccctctgttt cctgcctcag ttggggctca agcctcaggt gaggtggccc     5940
          cggagcactc agaaggcatc ggcggtcctg tgggctgctt tctgcactca cgtttgctga     6000
          gtgctcagtg tgccaggact gaggaccctg aagctgctct tgtatttagg gcggcgctcc     6060
          cctggcagag actgagccag gtggtcccgc atgacccact accaggcgtt tctgggccct     6120
          ggcccttgga gggacagggt gggcggaaca tgggcctgca gggaggctcc cgcttactgg     6180
          aggcatgtgc tgtgttgctg gagacatcct ctgtgttgct tcttgttcgc tgtggttttt     6240
          ggtctggtgg caccaaggac cctcagtcat cttgatgtgt ggttgtccag gcctttttgt     6300
          tggtcctaag aaggggctct gcctttgtgc ccccaggttc cctgacagga gctgccggct     6360
          cgtcccggtg atgcctgcag gacgtgactc tgggacgggg ggttgggcag atgtgctgat     6420
          ggaaattctc aagcaggcgt catttccgag gtcctcacct ggatttccag gacaggagtg     6480
          cctgctgggt gtccccagtc ccatgcagcg ggggtccttg ggatagcatg gaacgctgag     6540
          catgggcctg gccggccgtg gtcctggaca agggcagtgc cccggtggct gctgggcctg     6600
          ggacctggtg gggacgctgg gcctggtacc tggtggggat gctgggcctg ggacctggtg     6660
          gggaggcctc tgactgcctc ctggtgctgc ttccgtctgt gttaggcctc tgggtattgg     6720
          ggcccccatc tgtctcctcc tccaggcctg tggactcaga ccaggaagac acaggccagc     6780
          ccctgcctgt cccccttggc ttgggctctc actgcccgac ctggcgggag gttgcctagc     6840
          cgtgaacctt cgcaccctgt ctgccaccgg acaggctgtg agggggtgtc tgcagcacct     6900
          gcaccggcct gagcatcttc agagtgggct gcagctcctg gaggggtctg agaggaaggg     6960
          aggcaggtat tttgggcgaa tgaggagaca gctggagagc tggcaccctt cctggcctgc     7020
          gtcctgtgag gactctggtt ggggacagca agcttggggt cagcctgggg cagagcctct     7080
          gggacggccc cgcccctcgt gccccttccc ctcgcagctc ctgtcctcgc cccgccctca     7140
          gctctccgcc aggcaaggtt tggcaagtgc cgctgtgcgg cagtgcctgc tgattggctg     7200
          gtctgttgct atggtgctgc ccaggggtgt gcttttcctc ccctgccttc cctgctatcc     7260
          ctgggagtat ctggggttgg gtcatcgctg gtgtgtgtga gtgtgtgtgt gtgtgtatgt     7320
          gcacgtgtgc atatgtgtgc gcttctggcc tctgcagctg agtcctggcc ctcggggggc     7380
          ctggcacctc ctggggacag gcacaaagca gccatgatgg agtcgggagc tgggggaggc     7440
          cccattgccc cacgtggctg ccctgtgact ctggggtgct tgttagaaga ggtatctggt     7500
          tctgtctgtg tttaagcaac tccctaagga attcttgtgg ttccagtttg gggggcctgt     7560
          actgtagagg caagggaggg gcaggacatc ccccagactc tgacttctga agccttttct     7620
          gcccggggcc tctccgccag tacaggcagt gtcctttgcc agggctgcca tgctgcagag     7680
          gggagtgggc cactgtttag cccaggaaaa cctggctctc ccttagctgg aagttctggg     7740
          cctgttgtgg ttggcaggga agctgagtga cggtgctaat cacaggggca cctgcagggg     7800
          tttgtgggag atgcctctgt gggttggggc gataggctga ggggctgttc ttccctgccc     7860
          tgaggagggc tgagtgtagc cgccactcct gtcctgtctt gggctgtctc ggagaggatg     7920
          cgtagaaccc tcgggatcct gctggcctcc gtctggtcca ccctgaacct caggccttct     7980
          gggggcagag gaggattccc tcaggatcac tcgggtgggg gcctctcttg ggcacctgag     8040
          accctcagtg ggtgctttgt ggcgcgttca cggttggtgg gggacgccca gccctgcccg     8100
          ccgtgtagga gccgttctgt cctgggcatc cccctgtggt ctgggactta gtggaccctg     8160
          agggtgtgtg tttacccctg cctcacacct gcagaaaaaa gcctggagca ggagctggcc     8220
          agccccatcc tggacattga ggacttggtc aagagcggaa gcaagcacag gtgagacccc     8280
          tcagtgaggc cacgaccact gtccttccat ggcccagctc tcctgtgacc tgtggaggcc     8340
          cggatatatt tcttcacttt tctttgttcc tttttaaatt atgaaactaa ccaccattca     8400
          gtacgaaaaa gtttaagcag ctctgaggaa gatagagtaa aaaattgtct ccctcttccc     8460
          tggccctcag ccatccccgg tggccaccgt ggagtgtgga cggagccctg caggcctgtg     8520
          tctgtgcgga agcacgcgca gttttgtctg cacagactgt cctgcagttg gctgttttca     8580
          ctcagcgttg tgggtatagc ttcccatgct ggtgctggca gctcggcctt gttcttttga     8640
          ggacagcaga tgtctcctat gtctacctct tacagcttca gagattcaag ttataataaa     8700
          gctcttctta tattgagggg gaaacctccc tccccctttt ttttgaaaca gggtctcgct     8760
          ctgctaccca ggctgcagtg cagtgtcaca gtcttggctc actgcagcct cagcctccca     8820
          ggctcaagcg attttcccac ctcagcctcc caagtagccg ggactgcagg cacacaccac     8880
          catgcctggt taatttttgt attttttgta cagacagggt ctcactctgt tgctcaggcc     8940
          agtctcctga gctcgagagt tccacctgcc ttggcctccc aaagtgctgg gattacaggc     9000
          gtgagacccc atgcctggcc agctcttttt tttttttttt ttttttttga gacggagtct     9060
          cgctctgtcg cccaggctgg agtgcagtgg tgcgatctcg gctcactgca agctccgcct     9120
          cccgagttca cgccattctc ctgcctcagc ctcccgagta gctgggacta caggtgcccg     9180
          ccaccacgtc tggctaattt tctgtatttt tagtagagac ggggtttcac cgtgttagcc     9240
          aggatggtct cgatcttctg accttgtgat ccgcccacct cggcctccca aagtgctggg     9300
          attacaggag tgagccaccg cgcccggccc agctctgctt tttcttagtg gttctgcgtt     9360
          gtgtttgttt ctatccagga atagggttgg ttttactttt ccatcgagtt tttaaagaga     9420
          cgacgattta catggtcgga aactcacgag gactccccat cccttggtcg gaaactcaca     9480
          tggactcccc atcccttggt cagaaactca cgtggactcc catccatccc aggcagcagc     9540
          ttcccacctg ggccctacgt gcaggatgag ggctccttcc gggtcagaag acatggcggc     9600
          ctcggggcac cgtcccctgc atggggtgct cacaggatct tctcctctct ccttcccagg     9660
          gtgtgccctt actacctgtc ccggaacctg aagcagcaag ccgacatcat attcatgccg     9720
          tacaattact tgttggatgc caaggtgggg gctcagtcct gtagctgacg actcctgatg     9780
          tccaggggtg tccctgggct tgggaacagc tgtccgagcc tttgctgctt cagggcctta     9840
          gatcagcagg cctgggtggg aggactcacc tctgtcactg ggcaggggct caacctggcc     9900
          agacacactt gtgagcagcc ccaggccaca ggtcagtttt ctgagcagtc tgggagcggg     9960
          caggctggtg ggagtgagga gagacctcca ggctgtggtc cataggccag tgcccgctct    10020
          tgatcctgac agctcaggtt ctctccttca cgtcaggcca tgggaggcac cgagaacaca    10080
          ggaagcccac tgactcccct cttcccagcg cgtgcccggc cccacactca ctccccctcc    10140
          cagcatgtgc ccggcttcac actcactccc ctcttcccag tgcatgcccg gccccacact    10200
          cactcccccc acagcatgtg cccggcctga cactcactcc cctcctccca gtgtgtgccc    10260
          agccccactc ccttccgccc cgtgtgccca gccccacgct cactcccccc gccagcatgt    10320
          gcccggcccc acactcaact cccctcctcc cagtgtgtgc ccggccctgc tgccctcctc    10380
          cccatgtgcc ctgcttttgt gccccacact ttttacttag tgcaggtggg atcacacgcc    10440
          acgggtcaat ggtttgtgtg ttcacgtgac gatggcgtgg tgacgtttcc agatcccgtc    10500
          gttggttcgc tcattctcgg ggtgtatatt tattgagagc tcatcatgct gggtgctatt    10560
          ccaggcatag caagactggc ttcactcaca tggagctttg attctagtgg tggggacagg    10620
          tggacagcaa aagagtaagc acgtgagctg atgatactga agggaaatag agcagaggga    10680
          ggaggcggag accgagccaa gcgggcccaa gtgcgatgtc ggcgggaggt ggggaatgct    10740
          ggtgggtctg aggggagcct cagcaggtgc agcagagcaa gggaagaggt gagtgggggc    10800
          ggctgggggg ccgactcctg ggaagctgta gcagaacccc acagagagct ggtgaggttt    10860
          gccgtggttg tgggtgactc ggtgctttga gccctggctg cccctgggaa ccatctggag    10920
          agcttctaac ccaaccaggc ccctccctgg gacagttata tcacagctgg taagccgagt    10980
          ctaacacttt cacggaaacg cagaagatct aaaacagcaa gatgaccgtg aagaagaaca    11040
          gagctggagg actcacctcg ctggtttcaa gactcctcta aagctgcagg agtggaggtg    11100
          gagatggccc agctcaggca caggcctgca ggccatggag aaggcagcaa gctcaagctg    11160
          acccacacgc atgtggtcat tgtttttttt ttcagttgga atctcactct gtcacccagg    11220
          ttggagtgca gtggcaccat ctcggctcac tgcagccccc gcccctaggt tctagcgatt    11280
          ctcccacatc agcctcccga gtagctggga ttacaggcgt gcgccaccat gcctggccct    11340
          tggtgattgt tttttgacaa acatgccaat ttaattgaga gaggaaatga aggttgattt    11400
          ctggttttct gaaaaaatgg tgctaagaac agctggatat ctgttcggaa aacagtgaat    11460
          cttaactctt gttttaccct gtataaacct aaatgtaaaa gctaaactaa aagttataga    11520
          aaggaacatg ggggaggtct ttgcaacttt ggggtaggca gagatttctt agtatggata    11580
          cacaaggcac tagccatgaa gaaaaacatt aaaatttaga cttcaccaaa atttaaagct    11640
          tcaactctgt ggaagagttg agaaaatgaa aaagcagtta aagaaaggga gaaaatactt    11700
          ctttcaaagg acttaaaaaa ttttttcagc cctcctctga tttgaaagga cctttgacca    11760
          gagtatgtaa aattctccca taactaagca aacaacccac ttaaccactg ggaagggatc    11820
          tggacagacg tttcaccaag atgggtggaa tggccagtta accactggga gagcatccgg    11880
          acagacgttt cgccaagatg ggtggaatgg ccagttaacc actgggagag catccggaca    11940
          gacgtttcgc caagatgggt ggaatggcca gttaaccact gggagagcat ccggacagac    12000
          gtttcgccaa gatgggtgga atggccagtt aaccactggg agagcatccg gacagacgtt    12060
          tcgccaagat gggtggaatg gccagttaac cactgggaga gcatccggac agacgtttcg    12120
          ccaagatggg tggaatggcc agttaaccac tgggagagca tccggacaga cgtttcgcca    12180
          agatgggtgg aatggccagt taaccactgg gagagcatcc ggacagacgt ttcgccaaga    12240
          tgggtggaat ggccagttaa ccactgggag agcatccgga cagacgtttc gccaagatgg    12300
          gtggaatggc cagttaacca ctgggagagc atccggacag acgtttcgcc aagatgggtg    12360
          gaatggccag ttaaccactg ggagagcatc cggacagacg tttcgccaag atgggtggaa    12420
          tggccagtta accactggga gagcatccgg acagacgttt cgccaagatg ggtggaatgg    12480
          ccagttaacc actgggagag catccggaca gacgtttcgc caagatgggt ggaatggcca    12540
          gttaaccact gggagagcat ccggacagac gtttcgccaa gatgggtgga atggccagtt    12600
          aaccactggg agagcatccg gacagacgtt tcaccaaggt ggatggaatg accagttgag    12660
          cacatggaaa gtcgcccagc atctccagtc ataggagaag gcagattaaa gccacgggga    12720
          gccgacactg tggtcccact ggcatggctg aaattcagaa gccctgagtg tggcatgagg    12780
          atgtggaaca gctggatctc atccatcgct gtgaagttgt gtagccactc cacaaacgtg    12840
          tggcaaacag ccgagccggg agaagggaag acgtgttcaa agattcatat gtggccaggc    12900
          tcagtggctc acgcctgtaa tcccagaact ttaggggcca aggctggggg atcgcttaag    12960
          cccaggagtt tgagaccagc ctaggcaaca tagggagacc ccatctcaaa aaaaaaaaaa    13020
          aagaaaaaag aaaagacttc agtgtgcagg tttaccagag ttttgtttgc agttgccaaa    13080
          actgggaagc agcccgcgtg agcccatcca caggtgaatg gacagaccgt ggtacccgaa    13140
          cactaacagc agccacgggc gtggactgtg gtcacacagc agcagggagc cgatgagtct    13200
          cggacatgct aacccagaga ggcccattga ggaggaccta ctgttttttg tgtttttgtt    13260
          ttttgttttg aaatggagtc tcgctctgtg gtgcaggctg gagtgcagtg gtgtggtctt    13320
          ggctcactgc agcttccgcc tcttgggttc aaacagttct cctgcctcag ccttccgagt    13380
          agctgggact acaggcaccc gccaccacac ccggctaatt tttgtatttt cagtagagac    13440
          ggcagttcgc catgttggcc aggctggtcc caaactcctg accttgtcat ccactcactt    13500
          tggcctccca aagtgctgag gttgcaggca tgaaccaccg cacccggctg gacctactgt    13560
          tttattccat ttatgtgaca ctctattaat agaaaaggca ggggtggggc tggtggttat    13620
          atggtgcaca taactgccag aactcagtac acttaaaatg aacatcttaa tgtgtgaaat    13680
          tttttttttt gagacggggt cttgctctgt cacccaggct agagtgcagt ggtgcgatct    13740
          ccactcactg caagctctgc ctcctgggtt cacgccattc tcctgcctca gcctcccgag    13800
          tagctgggac tacaggcgcc cgccaccacg cctggctaat tttttttttt tttttgtatt    13860
          tttagtagag acggggtttc acagtgttcg ccaggctggt ctcgatctcc tgacctcgtg    13920
          atccgcctgc ctcggcctcc gaaagtgctg ggcttgcagg cgtgagccac catgcccggc    13980
          caatgtgtga aaatttaaaa gtaccaaagc tggaccccac cccagattgc tcccatgaca    14040
          ctctgtgggt gggacctggg agttgggttt tgttttgttt tgttttgttt ttgagatgaa    14100
          gtctcactct gtcgcctagg ctggagtgca gtgacacaat ctcggctcac attaacctct    14160
          gcctcccaga tgaaagcgat tctcctgcct cagccttctg agtagctggg attacaggca    14220
          cacaccacca ccccctgcta atttttgtat ttttagtaga gacggggttt taccatgttg    14280
          gccaggctgg tcttgaactc ctgacctcgt gatccgcccg cctcggcctc ccaaagtgct    14340
          gggattacag gcgtgagcca ccgcgcctgg ctgggagttg ggtttgtaaa tctccctgag    14400
          tggggctggg gcagggaact gctgggtctg ggtcttcctg gctcctctgg tctgtggctt    14460
          cctgactgcg gtggccgggg gctcccaggg catcgtggcc gtctgtcttg ctgagcgtgg    14520
          cacgtgcctt tccatgctgt ggaggagcgt ctcccggtat ggcgaactgc tggttagggt    14580
          ggggcggtgt tgccaggtca tccaggtctg gcctctgctc tcgacatcgc cggcgctgtt    14640
          gctcatctgc gcttgtgatg ttcgatgcct gctgcacatg tcttggcttc cctctttccc    14700
          ggcctctgtg agctccagcg ctgcgtccct tctcttcctc ctgtagagcc gcagagcaca    14760
          caacattgac ctgaagggga cagtcgtgat ctttgacgaa gctcacaacg tggtgagtct    14820
          ccgctggcct cctaaacacc tcctattgct tctggccttt ttgtcaagag ccacgcaaac    14880
          ctttctggag gggctctggc caaactcctg aagccctagg tgcccaggac tggggactga    14940
          gcacaccagg agcttctgcc accccctccc gccctgatcc gatgcctctg ctggggctgg    15000
          agactggcca gctgggccag ggacctgccc gtcaggcgca gggcccccac aggccgctca    15060
          ccagaccctt tccctccagc cagctcgggg tcagcctggg ccagggctgt ctcctctgcc    15120
          ctcggcagca gcaggcttgt ggtcttgcct gcagtgtctc tgcccttccg gccacatggc    15180
          ttgagactga ggcaggagaa tcgcttgaac cttggaggca gaggctgcag tgagccagga    15240
          tcacaccact gcattccagc ctgggtgaca aagcgggatt ctgtgtcaaa aaaaaaaatg    15300
          ttgactgggc gcgctagctc atgcctataa tcccagcact ttgggaggct gaggtgggcg    15360
          gatcacgagg tcaagagatc aagaccatcc tggccaacat agtgaaacac cgtctctact    15420
          aaaaatacaa aaaaattagc tgggcgtggt ggcgtgtgcc tatagtccca gctactcagg    15480
          aggctgaggc aggagaatca ctcgaaccca ggaggtagag gttgcaatga gccaagatca    15540
          caccactgta ctccagcctg gtgacagagc aagactccgt ctcaaaaaaa ataaaatcaa    15600
          aaagaataat tggcaattcc agtgaaataa ttgtttgttt gtttgttgag acagggtctc    15660
          cttctgtcgt ccaggctgga gttcagtggt atgatcttgg cccactgcaa cctccacctc    15720
          ctgggctcaa gccatcctcc cacctcagcc tcccgagtag ccgggactac aggtgcacac    15780
          caccacgccc ggctaatttt tgtatttttt gtagaggcgg ggtttcccag cgttgcccag    15840
          gctggtcttg aacccctgag ctcaagtgat ctgcccacct tggcctccca aagtgctggg    15900
          attacaggtg tgagccaccg cgcccggcct gaaacaatcg tttctaaata ttggtgtggg    15960
          ccacacagtc atgtttggac ctacttgtgg ccttttacag accccaggcc aaggctttgg    16020
          gaacttggct gtcagcctcc tgtgccttct gcacccccac cccatttctg ctttctggaa    16080
          cccccgatcc tgtcctgttc tgtggtgatt cgggtgtgct tgggctctag gagaagatgt    16140
          gtgaagaatc ggcatccttt gacctgactc cccatgacct ggcttcagga ctggacgtca    16200
          tagaccaggt gctggaggag cagaccaagg cagcgcagca gggtgagccc cacccggagt    16260
          tcagcgcgga ctcccccagc ccaggtgcgt tcatagccag actgcttggt cctgaggcct    16320
          gcgctgctgc agggtgagcc ccacccggag ttcagcacgg actcccccag cccaggtgcg    16380
          ttcatagcca ggctgcttgg tcctgaggcc cgtgctactg cagtgggcag cctgccctgt    16440
          ggctgtgtgt ggtcggcctg ggcaccatct attcaggctg gcactgcagg gcatccgctt    16500
          ctctcagagg cttcttgggt gtgaattctt cagggtcctg tagcctgtgg aagggctggt    16560
          attgttcagt agttctggta ttttccaaag acctatgtct tctcccagcc agtatcaact    16620
          tggcctctac tgtgtaaaac tggaaaactc tactttgtga agctgagttg ggagcatcgc    16680
          ttgaggccag gagtttgaga ccagcctggg caacatggcg gaacctcgcc cctgccaaaa    16740
          aattagccag gtgtggtggt gtgctcctgt ggtccaagct tttccggagg ccgaagtggg    16800
          aggcgtgctt gagcctggga ggcagagctt ccggtgcccc agatgactcc actgcactcc    16860
          agcctgggcg gcagagtgag gccatctcaa aaaaaaaaaa aaggaaaact aaatatattc    16920
          actgtaaggg cattttgcat ctttaaatga cccacaaatc tggcatgcat cagctgctct    16980
          gcctgtaggt tccttcccag tgtttgtcca gaggtgtatt tccacacagc gctagtcacg    17040
          gcatacgtgg aaaacgtgga aacccttcat ggatgttgtc agttggtcta tattttcttt    17100
          cttttttttt tttttgagat ggagtttcac ttttgttgcc caggctggag tgcaatggcg    17160
          cgatcttggc tcactgcaac ctccgcctcc tgggttcaag caattctcct gcctcagcct    17220
          cccaagtagc tgggatcaca ggcgtgcacc accacgccca gctaattttg tatttttagt    17280
          agagatggtt tctccgtgtt ggccaggctg gtctcgaact cctgacctca cgtgatccac    17340
          ccgcttcggc ctcccaaagt gctgggatta caggcgtgag ccgccacgcc cggcctttgt    17400
          ccatattttc tacatggctt ctgtaaacag ctgactagga gtctgtgtga atatcttcat    17460
          aggttctgct gtgacactac ttgctcgtga gcatctccag gtgtaaacag catcagcttc    17520
          ccccattttc ctttaaaatc gcacatgtgg acggacacca cggggaccct ggaccctggg    17580
          gagccccgtc ctcacccttc tcaccaggat ggctgcttgg tagagagtga gtttgcaaag    17640
          ttggcatttg tttagtacag aagttatcag gtgttctggc tttagaatcc ctttatatat    17700
          atatatatat acatatattt aagtgacagg gtctcactct gttgcccagg ctggaatgtg    17760
          gtggtacaat caaagttccc tgtagcctcg gcctcctggg ctcatgggat cttcccgtct    17820
          cagcgtctta aagcgccggg accacaggtg tgcaccactg ccaccggctc tcaagattgc    17880
          cacgcaggga gttgcagtgg gggaaggggt tcctgggact ttgaacgctc cacctccctc    17940
          ctctccacag tcccccaacc ccacctctct aacggggtgg acggccgcct ctttccatcc    18000
          ttcgcttggc gcagggtggg gagagtgaca ggtctccttc cctcatctcg gcagctgcca    18060
          tttcatcgct tacataacgt gggagaaaca tccacccacc cccaggcctg tgtgaacatc    18120
          accacggggc cttctccact cttcagtttt gttagttact tgatgtgcag ggctttttgt    18180
          tgtaactagt gggggacgtg tggtggggtg ggcttctgcc atctcattca ggaccagaac    18240
          ttcagttttc atccctatct gttcccccac ccctttggag atggggtctc actctgtcac    18300
          ccaggctgga gagcggtggt gccatcacgg ctcactgcag cctccacctc ctgcagcctc    18360
          cacctcttgg gctcaagtga tcctcctgcc tcggcctccc aagctcctgg gactacaggc    18420
          gtgtgccact gtgcttggca gggtccattc ttttcctcac actttattta ttgaagagcc    18480
          caggccgttt accctgcaga gtcggaatct gtacaggagg ggcagccaca cgagttcccc    18540
          ggtttactct gaacttaggt ggcttgaggg ccccagttag actgcggcca ccgtttgccg    18600
          ggctccagat gggacgtcct ttctatcaga aggctcacag tatctccttt cccgtttctt    18660
          cccatgtgaa cattgttgct gctgaacacc tgaatatgtt aatcactggg ggcttgcaag    18720
          atggcagtgt gctaattcca tcatctagtc agttagcagg aataacttag gaccacgccc    18780
          tgcaccatat cagctatgtg gtgatcccat tcacacagga aaggtgggac aaatgctggg    18840
          ggtgggccgg gtgtgctgtc tcacacctgt catcccagca ctttgggagg cccaggcagg    18900
          cggatcacga ggtcagagat tgagaccatc ctggccaaca cggtgaaacc ccgtctctac    18960
          taaaaataca aaaaaattag ccaggtgtgg tggtgcatgc ttgtaatccc agctacttgg    19020
          gaggctgagg caggagaatc acttgaaccc aggaggcgga ggttgcagtg agccgagatc    19080
          gcaccattgc actccagcct ggcgacagag cgagactccg tctcaaaaat caatcagtca    19140
          atcaagtgtc atcactgaat gtttgtgtgt gaacgtgggg attggtcctg ccccatgctc    19200
          cctcctgaat ctcactcctg acctcagttg ctgcaccttg aggtgttttc atgtgggctc    19260
          ttgtgtcctg accccggcgg ttgtggcctc tttgctgtct gggagtcagg atttttcaca    19320
          ctcatgtcct gctccagacc tggaatcagc caagtctcca agaagccctg ctttcttttc    19380
          ctgcaagacg gtatttcaag acccgccatg cggcagcggg ttggtcatgg ttactgggtt    19440
          ggtcgttgtt actgggtgtt ttcgtggaga tacagccata cgcacaggtg tgttcacaaa    19500
          tgttaattct aaaggtcaaa cacccggcca ggcataaggg ctcagcggta atcccagcac    19560
          tttgggagac caagactggt ggatcacctg aggtcaggag tttaagacca gcctgagcaa    19620
          cagggtgaaa ccccatctct actaaaaatg cgaaaattag ccgggcatgg tggcgcacac    19680
          ctatagtccc agctagtcgg gagacagaca cgagaattgc ttgaacctgg gacatggagg    19740
          ttgcagtgag cagagatggc gctgctgcac ccctgcctgg gtgacagagt gacaccctgt    19800
          ctcaaaaatg aatagataaa taaagataaa acacctgctc ctcttggtgt ctccagtttg    19860
          gatttggcct gtgtagcctc ttccttcgcc tgttggtgga tttggcctgc acggattctg    19920
          tgtggcctct tccttcccct gttggtggat ttggcctgca cggattctgt gtggcctctt    19980
          ccttcccctg ttggtggatt tggcctgcac ggattctgtg tggcctcttc cttcccctgt    20040
          tggtggattt ggcctgcacg gattctgtgt ggcctcttcc ttcccctgtt ggtggatttg    20100
          gcctgcacgg attctgtgtg gcctcttcct tcccctgttg gtggatttgg cctgcacgga    20160
          ttctgtgtgg cctcttcctt cccatgttgg tggatttggc ctgcatggat tctgtgtggc    20220
          ctcttccttt ccatgttggt gtcctttttt ccatgccagg aatcctggtt ctcaagggcg    20280
          gggttgttgg cacgagcgtg atgcagactg cctttgctgc ctttctcttg cccagggctg    20340
          aacatggagc tggaagacat tgcaaagctg aagagtaagt gttgccctcc ccgcctcctt    20400
          gcagctgggt ggggcctcct ccttgcgagg aggtgggtga cacctcctcg acccacagtg    20460
          atcctgctgc gcctggaggg ggccatcgat gctgttgagc tgcctggaga cgacagcggt    20520
          gtcaccaagc cagggaggtg agaggcgggg agccagcccc ttcactgcag gcccagccta    20580
          gagctagaaa cgggccatgg tgcagtcctg ggctgtcaca tcacgagtga ggcctgtttt    20640
          caggcctgtt ttcccttttt gagacctggg aggagcacct gctttgcatg atctggttgc    20700
          tgagatgttg agaggagcag cacacactcc cacgggacag cacacagccc cccacggaac    20760
          ggcacacaca cccatggaac agcacacaca ctcccacgaa cagcacacac actcccacga    20820
          acagcacaca cactcccacg gaacagcaca cacacccacg gaacggcaca cacacccacg    20880
          gaacagcaca cacactccca cggaacagca cacacaccca cggaacggca cacactccca    20940
          cggaacggca cactctccca cggaacagca cactctccca cggaacagca cacacactcc    21000
          cacggaacag cacacacacc cacggaacgg cacacactcc cacggaacag cagactctcc    21060
          cacggaacag cacacacact cccacagaca gcacacacac acccacggaa cagcacactc    21120
          tcccacgcgg ggccgctggg tttcctgcag tttctcctcc tccaggcctt tccctggacc    21180
          ctggtccagt ccgtcatttg agcacaggtg cctgttagaa cgagaccttc ttgttaggac    21240
          gatgagtgtc ccagccacca cctcttttgg actccgggag gcctggaacg ttctgaacgc    21300
          tccgtggggc tccagtcttc tccgcagcca gggcagcagg gtttgctgtc tgtcctgcag    21360
          gcagatgagg agtcagggct ggggcctgtg tgggggctct cctgagcgca cagccgccga    21420
          ggtggagcgt gttctgcctg agcgccgacc tggtcggggg aatcccagtt gcttccaggt    21480
          ggagccactg tcctcagcgt aatgctcaag gctctggcct ggctcctcgg ccaccctgca    21540
          ccctcagggt cccctcctgt agcttctgct gccccatcac tgtcactctc caaagctttg    21600
          gggactctgc ccagagccac cgcctcccag aagcccctga caacctcttg acgaccccct    21660
          agtgacccca tccctcccct ctgacggcgg cccctgctct gaggcggctt cttttcctcg    21720
          gtgctgttct cgtgctggcc aggcctcctc tccccacctg gaggctcctg agggcggagg    21780
          cctctcacct ccaatgctgg cgtcccctgg agggctgaat ttgtttccga gggaaggaaa    21840
          cttccacagt tgttgccttc agttccaaag ctgcagcctg atttccccct ccaggctcga    21900
          gcctgttttc ttctcggcag ctacatcttt gaccagtgtc gtcccccctc aggcccgagc    21960
          ctgccttctt ctcctcagtt cccaaagctg cagtctggtc cccccgccag gctcgagcct    22020
          gccttcttct cctcggcagc tacatctttg agctgtttgc tgaagcccag atcacgtttc    22080
          agaccaaggg ctgcatcctg gactcgctgg accagatcat ccagcacctg gcaggacgtg    22140
          agtgctggca cggggtcttt ggtgcgggca aatgtggcgt agggggtgca gcaggcctcc    22200
          atcttggcag tcagggctcc cctggccgtc acctggccgt cagcaggaac aggcccacag    22260
          aacctcatct tctgatcggg gcgtggaggc gttagtgcca cttgccagct gccgtagagc    22320
          ctgtcccagt tctgcagctg gcggcttcgt cctacagcct catcccatta ttctgctttt    22380
          gagaaagagc agcccaaggc cctagctggc ttgtggggcc tctggcttct ccacaccacc    22440
          ccgagttctg cttctcagag ttgtggggtc cagaggcttt gcccagaggc ggtgtcccca    22500
          tgggctgctc tggtttgaga cgccgggccc agcggggtct ctcctctgct gcgctcccgg    22560
          gtgctgggga gggtggcttt tgctgcttca acccttaggc gaccatagag cctcttttca    22620
          agtcccactg acccccttgg agactctgtc cctgcctggc ttctctcctg gctgctggga    22680
          agagcaggcg aactgcccgc cctgaatgga tgctgcgctc caccctgggc cccccattgg    22740
          gcaggagatg gagcttggca gtcgggctga gcgggctcat gctggaaggg ccggggctgg    22800
          ggtcggggcc tcccctgcct gcagtgtggg tgtcagcgcc ctgctgccct ccaggtgctg    22860
          gagtgttcac caacacggcc ggactgcaga agctggcgga cattatccag gtggggcctg    22920
          ctcctctgtg gcatctcctt ccctgatgga agccgggcgg gtgccttctc ctgctgtatt    22980
          agttaactga ttctagactt ggggatggga gaaaggcccc tacaccacct gtttctgatt    23040
          ggcaaactct cggctccttt ccagtgccct aaacccacac tgggcctcct gcagggatgg    23100
          gggaggacga ggtctggtgg cacatgccca gggtgatgct ggtgagggag gacgcaaagg    23160
          acagtggggg ccggggagcc gctcctgccc tgtccgggcc ctcaggccag gggggaccca    23220
          ctgctggcag ccccagcagc cccagctgca cgcagatgaa gagctctgga cacacgcggc    23280
          ttcctgaaca gcttctccag ggacagacaa atggggaccc tgcaggttcc cggcaggggt    23340
          gtccctggga gcccatgatt gggggtgcga ccctggcccc cttctcattg gccccgtcct    23400
          gtcctgcaat gcccgtccca tgtgaggtct gcttctggct ccatgcctat ggcagcacct    23460
          gctttccctg gcgtagaggt gcttgtccgg tttgtggagg gcacgcccca ttttgggtgc    23520
          tctgggcacg ttgcctctcc ggggcctcgg tggctttttt agaagcagac tcagaagtcc    23580
          ctgactgggg aagccaaggc acaggtggct gtgtggagcc ctgtgaggcc tcctctgtgc    23640
          tgcccacgct gtacctgctg gccacacgag atcatggcag ggttaggcag ggctgcccag    23700
          cgctatgaca gcttcatgag tgtccatctg gcctgtgggg tgcttgagct gggggaggcc    23760
          gcagaagaac cctgggatgc atggctggcc tgtgcatgct gctgggcatg gagctgcaga    23820
          tcccggaaca agcaggcact gccttctcct tcacagacgc agctctgagc gggggcgaga    23880
          cctgggcagg gaccaggtgg ggtgggcaca gggtggtggg gcccaggctc agccctccct    23940
          ccactgtggc cgtctctgtg gccagtgacg ccacagcctg tgtcttctct gtgcggtagc    24000
          tggggctgga aggacagcac tgccttgtcc tcccaactcc tccccaaagg cacggtgggc    24060
          atcccaggcc cagacccctc tgtctgtggc tcctgcctgc caagggctgc tgtgctgtcc    24120
          cgcatggagt gtggttggct cttcaagcag gaggccgtgc acctatcagg cggacctgct    24180
          tccatgtccc tgatgggtca ctgcaaagca cctccagcac atggccaggc gaggtagccc    24240
          tgcagcccag ggcctggagg gcaggtgtga gctggcccgg gcctgtccct ccctggaata    24300
          cagcttccca ggctcccact tatggagaag tctcctccac actatggaac tgaatcctag    24360
          aatgtggctt ctgaggttcc tacactcgaa ctgaatcctg gaatgcggct tccaaggctt    24420
          ccagctatgg agaagactcc acactctgga accgaatcct ggaacgcggc ctcccaggcc    24480
          cccagctatg gagaagactc cacactctgg aaccgaatcc tggaacgcgg cctcccaggc    24540
          ccccagctat ggagaagact ccacactctg gaaccggatc ctggaacgcg gcctcccagc    24600
          ctcccactta aggagaagtc tccacactct ggaaccggat cctggaacgt ggcctcccag    24660
          gcccccactt aaggagaaga ctccacactc tggaaccgaa tcctgcacac tccatcggtt    24720
          tggaatttcc tttggctgct gctctaagta gccgctggtg gatgactcag cttctgccag    24780
          ccctcgggtg cctggaggat gagggactgc acacagtgct cacccgcgtt ggctcctgag    24840
          cccctgcagg tgtgggcggt gcccataggg ctggtgctgg gttgggcctg cagccctgag    24900
          tcacaggtga ccctgggggc agagtggggc cagtggcccc aggaagagga tgtgggatgc    24960
          acagctcagc tggaggcgaa ctccaggcag ggtcaggccg tgtgctcgga agtcagggct    25020
          tagctggagg caaactctgg gcagtgctgg cccgtgttgg ggaaccagtt gcccctgggc    25080
          ccccgtgaga ctgctgggtc ctcatccctc tctgcctgag gccggagctg ccctgggctg    25140
          aggcacaggg ggatttgtgg tggtgttttt ttgagaaagg gtctcgcttt gtcaccccgg    25200
          ctggagtgca ggggcttgat cacagctcac tgcagcctca acctcctggg cccaagtgat    25260
          cctcttgcct cagccacccg aggagctgtg aacacaggtg tgcaccaccg cactcagcta    25320
          atttttaaaa tttttttgta gagatgaggt cttgccatgt ttcccaggct ggtctcaaac    25380
          tcctgggctc aggcagtctg cccgccttgg cctcccaaag tgctgggatt acaggcaaga    25440
          gcttccatgc ctgcccagca gaaggctttt cgaaggaagc tgtttcctga ggcagactca    25500
          gccctgctca tggcagccac cagcgtgggg gtgaacttgt tctgttactt ccatccccgt    25560
          gggccaaatg ctttggtaaa acacaaggcc ctgtgtttag ctgtcttgac agtgaaaatg    25620
          gctgggaagg aaggaaggaa cggaaggaaa tttctctctc cttctgtgcg tacccaggca    25680
          cgtgcacatg catgcagagt acgcacacac gcacgcacgc ctgcacaaat ccacgcatgt    25740
          tgccaagtct ctgtgttcca gccgtggtgt ctgccccccg gtgttctcta gttcggcttc    25800
          tccgcatttc tgtgaatgat tccggcttct tggtgttccc agcagaactc cctcaagtct    25860
          gcggcggggc tctgacggcg gtggcttggc tgacatggcc acattgctga gcctgttggg    25920
          ggctttgcgt tcctgttctg gccgtttttg gctcgttttc caggaacggt cgtcacgcgc    25980
          tcctctccta gtgcaggcat cattcctttc ccattgattt gcagggttct ctgtaagttc    26040
          tgaggatccc atatacatat actctctgta agttctgagg atcccatata catattctct    26100
          ctctaagttc tgaggatccc atatacatat tctctctcta agttctgagg atcccatgcc    26160
          gacatacata ttctttcctt gtctcatgct ggtcattttt tccattttca tgacaggttt    26220
          ggtgaacaca tgtttccttg tcagattttt gttctgagct tgtgcctccc gaccaagatg    26280
          ctaaaccggg tcttgtgtat tctccaaact gcactgtaga gtgacggagc tttgtgtctg    26340
          ggcctccatg ccttctgacg tcacctgtgg gggtgtgaaa ggcagactct accttgattt    26400
          ttcccagcac gccacaccgg tggttctgtg cgctgaccga gcggctcggc ttcccccaac    26460
          tccactgggc acctgccaca cttttcctca tgtttttgtt cactgtggtt ttgtcgtaag    26520
          tcctggtgtt ggcctgaacc aatttctttt tgtttgtttt tgagacagag ttttgctctt    26580
          gttgcccagg ctggagtgca gtggcgcgat ctcggctcac tgcaagctcc gcctcccggg    26640
          ttcacgccat tctcctgcct cagcctccca aatacctggg attataggca cctgccacca    26700
          cgcctggcta attttttgta tttttagtag agacgaggtt tcaccgtgtt agccaggatg    26760
          gtctcgatct cctgacctcg tgatccgcct cccaaagtgc tgggattaca ggcatgagcc    26820
          accgtgccca gcctgatatt tttagtagaa atggggtttt gccatgttgg ccaggctggt    26880
          ctcgaactcc tgacctcagg tgatcctctc accttggcct cccagagtgc tgggattacg    26940
          ggtgtgagcc accacgcccg gcctcttgtt cttttgaaac ctgccctgac gttttttcca    27000
          tagtgcatct tggagtcagc gtgtctactt cctgtaaaaa tcttactgtg attttgacta    27060
          gaatgtgttg aattcctgtt ttttttttga gtcagggtct ctctgttgcc caggctggag    27120
          tgcagtggga ccatcacagc tcactgcagc ctcaacctcc tgggctcagg ggatcctctc    27180
          agctcaacct cccaagtagc tgggaccaca ggcacatgcc accatgcccg gctaggtttt    27240
          tttttttttt tttttggtga acaccctggg gttgcaccat gttgcccagg ctggtctcga    27300
          actcctgggt tcgggcagtt tgctcctctc agcctcccgg agtgctggga ttacaggcct    27360
          gagccactgc actaggccat gttgaatttc tagattaatt tggggccctc aggggcacag    27420
          agaggagggc tgggccagtt ggcgggagga gaggcccctc gggctgccgc attttcagtg    27480
          catggagatg gcctatgttg ggggaacaca gagctcaccg ggggtccctg cagggaggag    27540
          aaagggtcag gcaggtgcca gctcctgtcc attggcctgg ggctgcatga tggcaggggc    27600
          cggtgaaccg atgacccctg ggtgtcctgt gaccttctgt gtatgcggct gatgctgcag    27660
          aaagtcgggt ggcctcaggc tcctgacggg gctgcacttc ctctgccttt cagattgtgt    27720
          tcagtgtgga cccctccgag ggcagccctg gttccccagc agggctgggg gccttacagt    27780
          cctataaggt aggggccacc tccaggaggc aggtggaggg cagcccttgt tccccggcag    27840
          ggctgggggc cttacagtcc tataaggtgg gggccacctc caggaggcag gtggggctgg    27900
          gggtcttctg gtcctaaaag gtaaggggct gcccccagga catgggcggg gcctccacac    27960
          tcctggtcct gtcccctcca ggtgcacatc catcctgatg ctggtcaccg gaggacggct    28020
          cagcggtctg atgcctggag caccactgca gccagaaagc gaggtacaga cctgggccca    28080
          cacgctcccc gcccgcccgg gtgcagtgcc cggcaccacc atgccacagg ctaggcacat    28140
          gcccagccgt ggatctcctg cccccatggg cctggccacc ttctccatat ccaggccaat    28200
          ccagagcatt ctcctcactg tccctctgaa gattggagtt actgagagac gtaggagatg    28260
          gcctgatggc accgtgacct gcccagagtc acctggttgg tggtggcaga gccacagccc    28320
          agccaggcct ccctgctggg acacgctcgt ttatgccgag gccgtcagca cagagcctcc    28380
          acagtgaggc acggctctgc ctgctgcctc cacgcagcgc ctggccgggc caagcctcag    28440
          ggtcacatct gaagggggcc cggctggccc tgttgtccga agcccctggt gcgctcagcc    28500
          ccgaggcccc acgtgccttc ttggcttcct gtgctccgtg gcgtcttcga gtcggtgctg    28560
          ccggggacgc tgtgtggatg gggtctgtga gtgtgccctc ggctccgtgt ccggagccct    28620
          gtggttcttg gggtgtatct ggccccaccc ccactgcgtg gtgtccaggg tggggcttca    28680
          cggctgcagc tgcgggagct gctgcccctg ccttgtgctc cagtggggcc ttgcctctgg    28740
          gcttggttcg tccctctctg gaacattctt tctcagctgc tgtccgaccc atggtggcat    28800
          gacgtggccc tggctgaagc agcccttgtg cggttgctgt ggttgggtct gcctggccga    28860
          gccggaaggg aagggctggg agggcgtcag ggtggcgtgg cttgaccccc gctcggtgat    28920
          ggtcctgcag caaggcctct cccagcagga agcgtccatc ccggggggag gccggcgccc    28980
          ctcacgcagt tggggttgcg ggaggcagtg cgtgcctgag gcagccggtg cacagattcc    29040
          aagggcctgg aatctgtttg ttccattgac ctctgatgtc acttgacttc tcagaagcag    29100
          ccactccctg cactgggcgt ttgtaggaaa tgagctcctg gaggaggggg tggggaagtt    29160
          cccccattgc agggcacact cagccccagg aaggaaacgt gcctcgtccc tgctgactcc    29220
          gaatcgcagt cagagtcgtt ctgcttgtgc cgtgttgaat tcccggcatc cggcatccag    29280
          actcagcctc ctccccaggc cacggccgcc gtggccagtc ggtcaagccc ttctaggaac    29340
          ttcctttgag ctggcgccct tgttcactgc tgacgccact cagaggcttg tgcacgtgtc    29400
          ctgcttccag gcagagctgg gaactcgcac cccgtcttct gcacgcggcc gtggaatgtc    29460
          gggatgccgg cgcttccttc ccgtgtgctc ttggcggggt gggcttcttg ccctgagccg    29520
          catgtcacag tttctgcaga agtttagggt tggagtgggc tgacctctct gcaggtgtcc    29580
          ccagcctctg cctggggtct gcctcctact cccaggaccc cctgtccccc agaggggccc    29640
          caagctggca ggctcacact cagggcagcc tcctttgttc tgacttctgc acagtgggcc    29700
          tgggtggctg cccgcggctc gcttgcttga tgccagtggg tggagagggt gatgggcaga    29760
          gaggcaggtg gtcaggcccc cagtcccgtc ctcacactct gtgccctctg ccgccccccg    29820
          ccccacaggg aaggtgctga gctactggtg cttcagtccc ggccacagca tgcacgagct    29880
          ggtccgccag ggcgtccgct ccctcatcct taccagcggc acgctggccc cggtgtcctc    29940
          ctttgctctg gagatgcaga tgtacgggcc acccctgcca gggcctgagc accggtgaca    30000
          cctctgacat cagcggggtg gaagtggtgg gggtccccat gagccgggtg ctgggggtct    30060
          cgggcctcga gggctaaagg ggtgctggtg cacttcccca ctgtctgctc cctctggcca    30120
          cgctcagccc tttcccagtc tgcctggaga acccacacat catcgacaag caccagatct    30180
          gggtgggggt cgtccccaga ggccccgatg gagcccagtt gagctccgcg tttgacagac    30240
          ggtgagggcc tgtccctggg ccctgctggg gtgggaggtg ggggagcact gaggcctgag    30300
          gtcctgagca gtggcctctc cggctctagg ttttccgagg agtgcttatc ctccctgggg    30360
          aaggctctgg gtgagtgccc tgaatgcccc agctgtgccc atcctggatc ctggacccct    30420
          gctcccaaga gctggtaggg aaccctgcag acatcctgcc cctgccttga ccccggcccc    30480
          tgcacttcca ggcaacatcg cccgcgtggt gccctatggg ctcctgatct tcttcccttc    30540
          ctatcctgtc atggagaaga gcctggagtt ctggcgggtg cgtctcccct gtgttctggg    30600
          cggggtgggt gagggcaggg ctggagcatg aagcaggcag tggtcacagc tcctgcttgc    30660
          cctcatcgga tcggcggcgt gaccagggct gccgtgtccc tgcctcttcc tcccacaggc    30720
          ccgcgacttg gccaggaaga tggaggcgct gaagccgctg tttgtggagc ccaggagcaa    30780
          aggcagcttc tccgaggtcg gcacttggcc ggggctctgg gcctgctgcc ccctcgtgcc    30840
          tcccctgcct ctcacagctt ccccaaggct gaccactggc cctgaccatg ggctccggcg    30900
          gctcccgctg cctcttcagg gctcctgcgt ttccttcctg gccctgagtg ttgcctctta    30960
          tcttacaaag cccccagcac cgggtgggtg tggtaacagt ggccctcctg tctgagtagc    31020
          cctagtcggc caccctggcc ctggggttcc ccgtgttttc tgggaagcac tgagcaggcg    31080
          tggggtcagc ctgggatccg tgccaggaag aagcttccag aacccgattg gccttcctgg    31140
          ctaggacgat ccttcatctt ggagcatgag acctgggtct ccctcatggg ggaggaaggg    31200
          gctggggggg ggctccaggc tcagcctcac caactttcct tccagaccat cagtgcttac    31260
          tatgcaaggg ttgccgcccc tgggtccacc ggcgccacct tcctggcggt ctgccggggc    31320
          aaggtgagct ctccagggcc ctctgccctg acctggttgc ctgttccctg gtgggtgctt    31380
          atggctcccc agcagactct gggccctggg ggctgcccgg tcccctcctt gggtcccacg    31440
          agagcgactg ctggccctgc tgggagcgtg tcctgctctg ggcctgggca ggcaggatgg    31500
          gagtttcctg gccacaagag ttggaggtgg cgtctgggag ctgtggaccc caagtggggt    31560
          cctgacccac agatggagct tcctcccacc cctggttggg gacggagcct cggggaaggt    31620
          ggctgggctg ggtgtgggca ccagggagag gagcccccac ggccccaggc agctccctgg    31680
          tgtgtcccct aggccagcga ggggctggac ttctcagaca cgaatggccg tggtgtgatt    31740
          gtcacgggcc tcccgtaccc cccacgcatg gacccccggg ttgtcctcaa gatgcagttc    31800
          ctggatgaga tgaagggcca gggtggggct gggggccagg tgagttacag cagggtgggg    31860
          ctggggtaag gcggtctggt gactgagccc ccgccccgtg gccaagggag cccccgtgac    31920
          cgagccgcct cgccccacag ttcctctctg ggcaggagtg gtaccggcag caggcgtcca    31980
          gggctgtgaa ccaggccatc gggcgagtga tccggcaccg ccaggactac ggagctgtct    32040
          tcctctgtga ccacaggtgc gtgcagtccg gtggcaggcg cggcgccagg ggacacgccc    32100
          acaccccact gggcccctgg actctccttc cccacatgag gccccgtctc ctccagagcc    32160
          tctccggcta ctcggggtca gcgtggggcc cctgcagcag atgagggtct tcacttcggt    32220
          gaactgaacc cttgaagcgg ctgtgggcag ggcagcaggg ctatggccac cccccaggtt    32280
          cgcctttgcc gacgcaagag cccaactgcc ctcctgggtg cgtccccacg tcagggtgta    32340
          tgacaacttt ggccatgtca tccgagacgt ggcccagttc ttccgtgttg ccgagcgaac    32400
          tgtgagttcc tgcccaggga ggggatgagg gtgttgtccc cagaggagcc agaaatgggt    32460
          ccacccaccc ccatggttct gcagatgcca gcgccggccc cccgggctac agcacccagt    32520
          gtgcgtggag aagatgctgt cagcgaggcc aagtcgcctg gccccttctt ctccaccagg    32580
          aaagctaaga gtctggacct gcatgtcccc agcctgaagc agaggtcctc aggtgcggac    32640
          gggcagcgct gggtgggcgg tgtgggggtg gcggagcggg cggcgtgggg cgggcagcac    32700
          caggcgccca gggcggaggc gactcacctg gctttgtgcg cttcccctcc cacctccaaa    32760
          ggctgcctct ccctcctagg gcagggcccc cacgggctgc aaccctcccc tacaggcaga    32820
          gaacgcccca ggcaaggatg ccccccgagg ctgagactcc ccccaatagc agggaggaca    32880
          cccacaggca ggaccccaag tgctgggact ctcccccaag aggggctttg ccacaggcag    32940
          ggaccccagc tggggccccc cgtgggcttc actgcgcact cgggtgcccc tgcagggtca    33000
          ccagctgccg gggaccccga gagtagcctg tgtgtggagt atgagcagga gccagttcct    33060
          gcccggcaga ggcccagggg gctgctggcc gccctggagc acagcgaaca gcgggcgggg    33120
          agccctggcg aggagcaggt acagttccag ggccttggga tggacacaga ccctctgtct    33180
          cctgaggcca acccgacccc gcccatctgg cctcaggcac ctccccacac acccctgtaa    33240
          atcccctgcc tggcaggcag gcgggcaagc gggcggggga tcccagctgc ctggctgtct    33300
          gtgggtcctc caccccacct cacccacagg ctgctggctc ccaggtggtg catgccctgg    33360
          ccctccgcgg gtgcccccca catcactttg gttctctggc gggtcagctt ggctcagtgc    33420
          actcaaggtc gggtgcccct gccactggct gcgcttgagg ctggcctttc tccaggaatg    33480
          tgctgcgggt ggaacccagg ttccttcttc cttggggcct tttgccccag aagcccataa    33540
          ttcctcaggc caacccgaaa ttttctccct gcttcctgct gggagccatt cccctcttcc    33600
          tgcccatccc tgcccttcag gcccctggag tgagctccag gtgcaggcac caggcacctg    33660
          tgtccccttc ctgccagccc ctcgctgtgg tcggactgtc ttccctggac ctgctcttac    33720
          aagtcaccac ctgcgagcct catgagccgc tggtgtgact tggacaggac caagttgtgg    33780
          cactgtcacc ggggtgtgct gtgcccccct cccccgacct ccatcttggc tcagggctcc    33840
          ttgggaccat cttccctgtg cgtccaggtg ctttgggacc ccagagtgtg tggttggggt    33900
          ctgtgtgtgg ttgtgagctg tgtcctcctc aggcccacag ctgctccacc ctgtccctcc    33960
          tgtctgagaa gaggccggca gaagaaccgc gaggagggag gaagaagatc cggctggtca    34020
          gccacccggt gcgtgagctg tccctgcacc tgtgccgacc accatagaca cgcatgggaa    34080
          cgcagccgtg ggtgccccca gccacggctg gtcccgatgg gaccagggaa tccaccccca    34140
          ggagctgatg tccagggcag ctgtgatgct gacggccagg ggctcaagtg tgtggtttct    34200
          tctgcagggg gctcatgagt cccagctgga atcaggcccc acccttgggc aggtttggca    34260
          tggggcctgc agcactgggc ttggccctgg catttccctc aagtgtggat gcacacctgc    34320
          ctcatgtgag ggacacagcc cattcctagc cttggatcaa agaacggagt tatagccgga    34380
          gccaggaagc cccctgcctg ctggaaaacc ccaagtgtgg cggcctttgt ccatgtccct    34440
          tggcttctgg gaagaactgg gtggtgccca ggcagggctg gtgccatcag gaagtgggtg    34500
          gctgctgagg ggcctgggct ggcgagggcc tgggtgggga gtgcctgggc cgcccctgcc    34560
          ttggtttcca cgtttccgtg ttggtctggg gtgtgtagag agatgggcac tgctcatccg    34620
          gaagcccctc cttgtgcgct gccatcctgg gagcctcagc cgcatccgct gtggggcagg    34680
          gggcttgagg gaggaggaga gagacgggcc atgcaggacc cctggcttga ggcagagcca    34740
          atctaccctt tgcccattca ctgctctcag ttccctgcca gcctctcact gtgtgacctc    34800
          agacgggccc agccccacag ctttcttccc gcagcccctc cctatgtcca tccagccagc    34860
          cagtttctca ggcagcagcc ccacctcggc agtcactgtc ccagggaacg ctcaatgttc    34920
          caaggaaggc tctgcagccc cagggaccag atgatgaggc tggccctgat ggagcctcgg    34980
          gcctgtgtcc tgcaggagga gcccgtggct ggtgcacaga cggacagggc caagctcttc    35040
          atggtggccg tgaagcagga gttgagccaa gccaactttg ccaccttcac ccaggccctg    35100
          caggactaca agggttccga tgacttcgcc gccctggccg cctgtctcgg ccccctcttt    35160
          gctgaggacc ccaagaagca caacctgctc caaggtgccc tggcttgcag aggccaccca    35220
          ccctgagggc agtgctgccg ccgcgtgtgg ggtgggggcc atctgggtcc aaggtggtct    35280
          ctgttctcta gagaaaaagg ggcagatggg gacagacgcc ccttcctcta caggcttcta    35340
          ccagtttgtg cggccccacc ataagcagca gtttgaggag gtctgtatcc agctgacagg    35400
          acgaggctgt ggctatcggc ctgagcacag cattccccga aggcagcggg cacagccggt    35460
          cctggacccc actggtaaat ggggccccag gtgggaccct cagactcctg cgtggaaggc    35520
          agtgtgggcc agagtcctgg gctgcttggg gtgggcatcc tcgggccctg cttggccccg    35580
          cctctctgtt cccctatggg agtgatgggg gcctccacct ccaccaccag caccagcagc    35640
          accacctcca cctccacctc cacctccacc tccaccacca cctccacctc caccaccacc    35700
          tcctccacca ccaccacctc caccaccacc accaccacca ccacctccac ctccaccacc    35760
          tccacctcca ccaccaccac ctccacctcc accaccacca cctccacctc caccaccacc    35820
          tccaccacca ccacctccac ctccaccacc acctccacca ccaccaccac caccaccacc    35880
          accaccacca ccacctccac caccaccacc tgcaccacca cctccacctc caccaccacc    35940
          accacctcca cctccaccag cagcagcatc acttgttggg gagaccctgt gcaactccat    36000
          gcacagccct gtccctgcca tagccccgac ccctaagcac agccctgtcc aactgccaca    36060
          cgtcccctgc ctcccatgca tggtcctggg gggtcaactg cacacgccag ggtcctaggg    36120
          tcctagaccc ctgtcctccc tgtttctgcc tctgtttggg gtggagtcca agtctccaga    36180
          ggcggaagca tctgtgttcg tgtgttaatg aacagcccct acagagttcc cctagttcac    36240
          ccagggggga acctagcctg ttgggacgac cccagatccc ttctgggctt ggtactcact    36300
          gggatatcct catgcctgca cccagcctac ggctctgagc tcctgagtgg ggctttggcc    36360
          tgcccgccac tgttccagcc cccatccagc aggctggtgt ctcctctgat gcccccagca    36420
          cccaggcgtg tacctgcctg ggttttcccg ccctggtctg aggtgggtga ggcctggcct    36480
          ccctagccag ccctgccccc ccaccccagg gaactttcca gatgctctcg accagctttg    36540
          tggctctaca tctcttcatc aggaagaacg gcgccggatc ccaagctgac cgtgtccacg    36600
          gctgcagccc agcagctgga cccccaagag cacctgaacc agggcaggcc ccacctgtcg    36660
          cccaggccac ccccaacagg tagctgactc ctgaaccgtg tgcagcctac gacttggtgg    36720
          gtccctcagt ggcttcacga ggctaactct tgagtgtggc cggggctgcc cctgtgggga    36780
          gccatctcat ggtggggact gctcccggtt ctgcaccccg cagttgtcct gagcagctct    36840
          ccaggagttc ctggaggaag ggcgggcagg gcggtgggac tctcagtcct ccaccccagc    36900
          gccactctga gccatgctac tcccacacca ggagaccctg gcagccaacc acagtggggg    36960
          tctggagtgc ccagagcagg gaagcagggc cagcacgccg tgagcgccta cctggctgat    37020
          gcccgcaggg ccctggggtc cgcgggctgt agccaactct tggcagcgct gacagcctat    37080
          aagcaagacg acgacctcga caaggtgctg gctgtgttgg ccgccctgac cactgcaaag    37140
          ccagaggact tccccctgct gcacagcaag tggccctggc gtggggaaca gccggtgggg    37200
          tggggggcag gggacaaaat gggggctgtg ccgggtctga ttgaagctcc ccgcagggtt    37260
          cagcatgttt gtgcgtccac accacaagca gcgcttctca cagacgtgca cagacctgac    37320
          cggccggccc tacccgggca tggagccacc gggaccccag gaggagaggc ttgccgtgcc    37380
          tcctgtgctt acccacaggg ctccccaacc aggtagggca cctgcctggc tgctcctggc    37440
          agcgccccaa ccgcacgcag ccctgggagt gagcagcaaa gccccaggcc cccctcagac    37500
          tcaagtctct gtctccaggc ccctcacggt ccgagaagac cgggaagacc cagagcaaga    37560
          tctcgtcctt ccttagacag aggccagcag ggactgtggg ggcgggcggt gaggatgcag    37620
          gtcccagcca gtcctcagga cctccccacg ggcctgcagc atctgagtgg ggtgagcctc    37680
          atgggagaga catcgctggg cagcaggcca cgggagctcc gggcgggccc ctctcagcag    37740
          gctgtgtgtg ccagggctgt ggggcagagg acgtggtgcc cttccagtgc cctgcctgtg    37800
          acttccagcg ctgccaagcc tgctggcaac ggcaccttca ggttggtgcc tggccactac    37860
          agttcctgct gggtgtagcc ccaggtgatg ggctgagggg gaaagggcag gcccttgtcc    37920
          tggtggcaac gcctggcaga cgtgtgcagt gggccggttg tctcacaggc ctctaggatg    37980
          tgcccagcct gccacaccgc ctccaggaag cagagcgtca tgcaggtctt ctggccagag    38040
          ccccagtgag tgcccacgga ggcccccagc acacccaacg tggcttgatc acctgcctgt    38100
          ccagctctgg tgggccaaga acccacccaa cagaataggc cagcccatgc cagccggctt    38160
          ggcccgctgc aggcctcagg caggcggggc ccatggttgg tccctgcggt gggaccggat    38220
          ctgggcctgc ctctgagaag ccctgagcta ccttggggtc tggggtgggt ttctgggaaa    38280
          gtgcttcccc agaacttccc tggctcctgg cctgtgagtg gtgccacagg ggcaccccag    38340
          ctgagcccct caccgggaag gaggagaccc ccgtgggcac gtgtccactt ttaatcaggg    38400
          gacagggctc tctaataaag ctgctggcag tgcccaggac ggtg                     38444
          <![CDATA[<210>  2]]>
          <![CDATA[<211>  37214]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  食蟹獼猴]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  misc_feature]]>
          <![CDATA[<222>  (4525)..(4624)]]>
          <![CDATA[<223>  n 為 a、c、g 或 t]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  misc_feature]]>
          <![CDATA[<222>  (4914)..(5013)]]>
          <![CDATA[<223>  n 為 a、c、g 或 t]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  misc_feature]]>
          <![CDATA[<222>  (9472)..(9571)]]>
          <![CDATA[<223>  n 為 a、c、g 或 t]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  misc_feature]]>
          <![CDATA[<222>  (16613)..(17049)]]>
          <![CDATA[<223>  n 為 a、c、g 或 t]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  misc_feature]]>
          <![CDATA[<222>  (19812)..(19911)]]>
          <![CDATA[<223>  n 為 a、c、g 或 t]]>
          <![CDATA[<220>]]>
          <![CDATA[<221>  misc_feature]]>
          <![CDATA[<222>  (35806)..(36357)]]>
          <![CDATA[<223>  n 為 a、c、g 或 t]]>
          <![CDATA[<400>  2]]>
          atgcccaaga tagtcctgaa tggtgtgacc atagacttcc cattccagcc ctacaaatgc       60
          caacaggagt acatgaccaa ggtcctggaa tgcctgcagc aggtagagca caggctggga      120
          ggaaaggact gcaggcaggt ggagctgggg ctgggtgtgc gtccctctcc cgacccattc      180
          cagccaggcc cctccagagg cagcctctgt cataaaaagg ctggtgttcc aggtggggtc      240
          agagagagga ttgacaagta aaaacatcgt ccttgagagt gacagactta gtgccttggg      300
          ggcctctgag gagcggctgg tattcacagg tcaggaggaa gcatttccat cagaggggca      360
          gccgggggcc agcctcactt tgaaggtctt tgaacctttg gggtgcaggg aggtggcagc      420
          ggcgcaggtt gccttctcct gggttccttg aggtgccctc ttgtacccgg ctcacacccc      480
          tcccctcccc gagtttcccg ctcaggttcc catctgagag ctcgtatgta ggacatcaga      540
          taggacagcg taagtgtttg gatctggaaa cacagaacag tttcctattt tgagacttga      600
          tgcctaatta gtcatcttac tatttaggct gaaaaatact gttgcatttc gggtaacgtt      660
          ctgcaaatgg tctgctgatg gcagctggag ttgcttcacg ccctttaggg caagagtgga      720
          aagtgtcctg cggacttatc catggtcccg tggggctctc gccacctgac agcggcctct      780
          gcatctgcga agagctgccc actggctgct gaggcttgtc tcagggtggt ttgtgtggcc      840
          ttgcctcttc ctggcttccc cgtaaccctt gcccccaact ctgttcagaa ggtgaacggc      900
          attctggaga gccccacggg cacggggaag acgctgtgcc tgctgtgtac cacgctggcc      960
          tggcgagaac acctccgaga caccatctct gcccgcaaga ttgccgagag ggttcaaggg     1020
          gagcttttcc cgaatcaggc cttgtcgtcc tggggcaacg ctgctgctgc tgctgaagat     1080
          cccataggtg accctagttc ccaggccttc cctgacctcc tgtggggatg gctggcaagg     1140
          gatggcgctg agggtagggt gggcccatgg ggacttctgc cagcagagct caaggagaat     1200
          tttgtagctg ccacataatt tctcgccatc gtgggtataa acctagggtt gggctttttt     1260
          gctgaattag ggcgtggcag gtgtacactt cgcccgtttg tgataaacga gtctctgggg     1320
          tgtcagattc ttggctgtct gcagggctga gttagccgaa tgccacccgc ctttaacacg     1380
          tgagaaccat gacctctgtg cttgcttgtg tctgggcagc ttgctacacg gatatcccaa     1440
          agatcattta cgcctccagg acccactcgc aactcacgca ggtcatcaac gagcttcgga     1500
          acacctccta ccggtgggtc agacgagttc acgcctgtct tggggtcctc gagagaacca     1560
          gcttgacgtg gtgctgggtc cacagaccac gctgtgctgt agtggagggg gcggtctttc     1620
          cagacgctcc ccagaagtat gcagtgtgct ggtgcccagg ggtggggcgg ggcccgggct     1680
          gtccctagtg cccattactt gtgaggaggc agctttgcat ttgtgtgctg accttgggct     1740
          ggcgtcctga gctcctttca ggtgctgttg tggcagctgt gtggcaggtc agggccggcc     1800
          cccagtgcag ctttgcacat gaagtgggag gaggccctgc cgcttgtcag agccctgcag     1860
          agtcttggtg ttctgtcggg ttcctgtgga ggggccgatg gcggggtgct gtggaagctg     1920
          tcgaatctcg tccctctgtc cagttccccc gcttgtctcc ttgctccctc ctactcccgg     1980
          gccacgatcc tatgccgggg ccactctcct gcacccggac cacgctccta cgcccaggcc     2040
          actctcctac gcctggacca cattgcagtt atgctgactt cctctggctg ccagtgctcc     2100
          tgtgtgtctc catacagctc acgctgcggg accacgctgt ggctgttgga ggcagctcct     2160
          cctccaccca tagtgctctc tccctccagg cctaaggtgt gtgtgctggg ctcccgggag     2220
          cagctgtgca tccatccaga ggtgaagaaa caagagagta accacatgca ggtgggctcc     2280
          tggctcccgc tccggctcag ggttccgtga ggcgagtgct gctgggtatc cagagtccca     2340
          ggctgtgctc ctgctgggct ggggttcgaa gttcactggg ggactgcagg cgagggcctg     2400
          gtgggggtgg ggactggctc gggtcctttc ttggccatac tccagccgcg cactctgccc     2460
          ttcctcccgc agatccactt gtgccgcaag aaggtggcaa gtcgctcctg tcatttctac     2520
          aacaacgtgg aaggtacagg cagctcggtg ggaccaggct tgggttggag tgtgtgcagc     2580
          ctctcagggc gtcagcctgg ttgtgcttgc cgggtggggc ggccagtgca gccgtgtacc     2640
          tgggcactgt cttctgactc gggaccaccc gtgttagtct tctgtgtgga agagctcacc     2700
          cagtggtctg agacagccag ccggccggac tgcctgtggc tggtgcctgg ggccttggat     2760
          tttgggaagg ctccctccat ttccggacga gaagggctcc ctgcacctga ctactggtgc     2820
          atacagcagc ggttttgctg aacacctgct ttgtcttcgg ggagcctgag gttttgttgc     2880
          ttgcccagca gcgggtgctc ctgtgaccgg cccttgtacc atcttgggag ggtgtcctgg     2940
          aagccgtgtc tggcctcccc cgaccttgcc gcatgtgtct ttgtcctgtg ctgacgttgc     3000
          agagaaaaat tacagccccg agcgtgactc caggctgagt cctgtgggtc cgacacggga     3060
          ggccttgggg cctcttcagg agacgggatg agtgagtgat gggagcagag ccagggcacc     3120
          tcgccctgtg actgcaggtg gccacagcct gtgagggcca ggggtgcttc tccacccacg     3180
          tggctgcccc tcgggtatgt caggggcttc tggggctctt cacgaggtct cagagacagt     3240
          agcagggtgt gcccccgtcg gctgccctta cagtttctgt gacctgaggg tggcatctgt     3300
          gcggttggca tggcctgagc ttctgtggga tcagagttcc ctttgtttcc tgcctcagtt     3360
          ggggctcaag cctcaggtga cgtggccctg gagcacctgg aaggcgtcgg cggtcctgcg     3420
          ggctgctgtc tgcactcgtg tttgctgagt gctcagtatg ccaggactga ggaccctgaa     3480
          gctgctgtta tatttaggac ggttctcccc tggcagagac ggagccgggt ggtcccgcct     3540
          gacccaccac caggcgtttc tgggccctgg agggacaggg tgggcggaac atgggcctgc     3600
          agggagacct ccacttactg gaggctcgtg ctgtgttgct ggaggcatct tctgtgttgc     3660
          ttcttgtttg ctgtgtcttt tgttctggtg gcaccaagga cctccagtca ccttgatgtg     3720
          tggttgtcca ggcctttttg gtggtcctga gaaggggtct gaggggctct gcctctgccg     3780
          ccaggttccc tgatggaagc tgcccactcg tcctggtggt gcccacagga cgtgactctg     3840
          gcacaggagg gcagatgtgc tgttggagat tctcagcccg tcgtcgtcat ttccaaagtc     3900
          ctcacccgca tttctgggac aggacaggag tgcctgctgg gtgtccccgg tcccatgcag     3960
          cgggggtcct tgggatagtg tggaacgctg agtgtgggcc tgtccggcgg tggtcctgga     4020
          caagggtagc acccctgtgg ccgccgggcc tggtgcctgg tgcctagcgg ggaggccgct     4080
          gaccgcctcc tgtgctgctt ccatccgtgt caggcctctg ggtgttgggc ccccatctgt     4140
          ctccccccag gcctgtggga tcagtccaag aagactcaat ccagccccag cctgtccccc     4200
          ttggcttggg ctctcactgc ccgacctggc aggaggttgc ctagcggtga acctttgcat     4260
          cctgtctgcc ccctggacag gctctgaggg ggtgtctgca acacctgtgc cagcctgggc     4320
          atcttttttt tttttttttt cttttgagac gaaatctcgc tctgccgccc aggctggagt     4380
          gcagtggcgt gatctcagct cactgcaagc tccacctccc gggttcacgc cattctcctg     4440
          cctcagcctc ccgagtagtt gggactacag gtgcccgcca ccatgcccgg ctaatttttt     4500
          gtattttttt tctttttttt tttgnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn     4560
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn     4620
          nnnntttgag acggagtctc gctatgtcgc ccagggtgga gtgcagtggc cggatctcag     4680
          ctcactgcaa gctccgcctc ccgggttttt acgccattct cctgcctcag cctcccgagt     4740
          agccgggact acaggcgccc gccacctcgc ccggctagtt ttttgtattt tttagtagag     4800
          acggggtttc actgtgttag ccaggatggt ctcgaactcc tgacctcgtg atccgcccgt     4860
          ctcggcctcc caaagtgctg ggattacagg cttgagccac cgcgcccggc cttnnnnnnn     4920
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn     4980
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnttttgta tattttttta gtagagatgg     5040
          ggtttcaccg tgttagccag gatggtctcg atgatctgac cgcgtgatcc gcccacctcg     5100
          gcctcccaaa gtgctgggat tgcaggcttg agccaccgtg cccggccagc ctgggcatct     5160
          ttagagtggg ctgcagctcc tggaggggtc tgagaggaag gaaggcaggt attttgtgaa     5220
          tgaagagaca gctagagagc tggcaccctt cctggcctgc gtcctgtgag gactctggtt     5280
          ggggacagca agcttggggt tagcctgggg cagagcctct gggaggcccc tgccccttgt     5340
          cccccttccc cttgcagctc ctgtcctcgc cccgccctca gctctctgcc agggaaggtt     5400
          tggcaagtgc cgctgtgcgg cagtgcgtgc tgattggctg gtcgttgcta tggtgccgct     5460
          cagggatatg cttttcctcc cctgccttcc ctgctatccc tgggagcatc tggagttgag     5520
          tcatcgctgg tgtgtgtgtg tgtgtgtgag tgtgtgtgtg agtgtgtgag tgtgtgtgtg     5580
          cgtgtgtgtg tgtgtgtgtg agtgtgtgag tgtgtgtgtg tgagtgtgtg tgtgagtgtg     5640
          tgtgtgtgtg agtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgagtgtg tgtgtgagtg     5700
          tgtgtgtgtg tgtgtgtgtg tgagtgtgtg tgtgtgtgtg tgtgtcagtg tgtgtgtgtg     5760
          tgtgtgtgtg tgtgtgagtg tgtgtgtgtg tgtgtgtgtg tgagtgtgtg tgtgagtgtg     5820
          tgtgtgagtg tgtgtgtgag tgtgtgtgag tgtgtgtgag tgtgtgtgtg agtgtgtgtg     5880
          agagtgtgtg tgagagtgtg tgtgagtgtg tgtgtgtgag tgtgtgtgtg agtgtgtgtg     5940
          tgagagtgtg tgtgtgagtg tgtgtgtgtg tgtgagagtg tgtgtgtgtg agtgtgtgtg     6000
          tgtgagtgtg tgtgtgtgtg tttgtgcccg tgtgcgcctc tggcctctgc agctgagtcc     6060
          tggctctcag ggggcctggc acctcccggg gatgggcaca aagcagccac gatgcagccg     6120
          ggagctgggg aaggccccat tgccccacac ggctgcccta agactctggg gtgcttcttg     6180
          gaagaggtcc ttgcttctgt ctgtgtttaa gcagctccct aaggagttct tgtggttcca     6240
          ggttgggggc ctgtgctgtg gaggcgaggg aggggcagga cccccaactc cctgaagcct     6300
          tttctggcct ggtcctctca gccagcatag gcagggccct ttcccagggc tgccatgctg     6360
          cagaggggag cgggccacta tgtagcctag gaaaacctga cgttccttcc gctggcagtt     6420
          ctgggcctgt tgtggttggc agggaagctg agccacggtg ctcatcacag gggcacctcc     6480
          aggatttttg ggagatgcct ccgtgggctg gggcgatacg ctgaggagct gttcttccct     6540
          gccctgagga gggctgagtg tagccgtcac ccctgtcctg tcttgggctg tctcagggag     6600
          gatgcataga accctcggaa ccctgctggc ccttgtctga tccaccctca acctcaggcc     6660
          ttctaggggc acaggagggc tccgtcggga tcactgcggg tgggggcctc ccttggacac     6720
          ctgagaccct caatgggtgc tttgtggcac gttcatgatt ggggcggggg gcacccagcc     6780
          ctgcctgccg tgtaggagct gttctgtcct gggcgtccct ctgtggttgg gacccggagg     6840
          gtgtgtgttt accccgcctc acacctgcag agaaaggcct ggagcaggag ttggccagcc     6900
          ccatcctgga catcgaggac ttggtcaaga gcggaagcaa gcacaggtga gacccctcag     6960
          tgaggccacg accactgtcc ttccatggcc cagctctcct gtgacctgtg gaggcccaga     7020
          tatgtttctt cccttttctt tgttcctttc taagtcgtga aactaaccac cgtttagtgt     7080
          gagaaagttg aagcagctct gaggaacgta gagtaaaaag cgaaaccgcc tccctcttcc     7140
          ctggccgtca gccaccccag gagccaccgt ggagcgggga cagagccctg caggctcgtg     7200
          tctgtgtgga agcacgcacg gttttgtctg cacagactgt tctgcagttt gccgttttca     7260
          ctcagcgttg tgggtagctt cgcatgctgg tgctggtcgt ccggcttcgt tcttctgagg     7320
          acagcaaata tgtcctttgt ccacctcttt tatagtttca gagattcaag ttataataaa     7380
          gcttttctta tattgagggg gagagctcct gcccctcttt ttttttttag acagagtctc     7440
          gctctgctgt ccaggctgga gtgcagcgtc gtgatcttgg ctcactgcag tctcaacctc     7500
          ccaggctcaa gtgattctct cagctcagcc tcccaagtag ctgggactgc aggcatgcac     7560
          caccacgcct ggttaatttt tgtatttttt gtacggacaa ggtctcactc tgttgctcag     7620
          tccagtcttg aactcctgag ctcaagagtt ccacccgcct cggcctccca aagttctggg     7680
          attccaggcg tgagcaccac gcccgaccca gctctgcttt gttttagtgg ttctgtttgt     7740
          gtttgtttct gatgacctct atccaggaat agggttggtt tttcttttcc atggagtttt     7800
          taaagagatg atgatttaca tggtttaaaa ctcatgtgga ctccccgtcc atcccagaca     7860
          gcggcttccc acctggaccc catgctcagg attagggctc cttccgggtc agaagatgtg     7920
          gcggccccgg cctcgggtca ccgtcccctg cacggggtgc tcacagcatc ttcccctctc     7980
          ctcgttccca gggtgtgccc ttactacctg tcccggaacc tgaagcagca agccgacatc     8040
          gtcttcatgc cgtacaatta cttgttggat gccaaggtgg gggctcagtc tgcgtcgctg     8100
          acaactcctg atgtccaggg gggttcctgg gcttgggaaa ggccgtccga gcctttgctg     8160
          ctgcagggac ttagagcagc aggcctgggt gggagagctc acctgtcact gggcaggggc     8220
          tcaacctggc cagacacact tgtgagcacc cccaggccct gggtcagttg ttctgagcaa     8280
          tctgggagtg ggcaggctgg tgggagtgag gagaggcctc caggctgtgg tccacaggcc     8340
          agcgcccact cttgatcctg acagctcagg ttctctcctt cacgtccgat cacaggaagc     8400
          aaagcactga gaacacggga agcccactca ctcccctcct cccagcccca cactcactcc     8460
          cccccatgcc cggccccaca ctcacttccc tcctcgtagc ctgtactcac ccacatgctg     8520
          ttgtgcccca cactttttat ttagtgcagg tggcatctcg ccgcgggtca gtgacttgtg     8580
          ttcacgtggc gatgacgtgg tgacgcttcc agatccctcc attggtttgc tcattctcag     8640
          ggtgtatatt tatcaagagc ccatcgtgct gggggctgtt ctaggcatag caagactggc     8700
          ttcattcatg tggagctttg attctagcgg tggggacagg tagacagcag aagagtaagc     8760
          ccgtgagccg atgagactga agagaagtag agcagagcga ggaggtggag acagagccga     8820
          gtgggcaggg cccaagtgcg atgtcggcag gagatgggga atgctgatgt gtctgagggg     8880
          agcccgagct ggtgcagcag agcaagggag gaggcggggg gccgactcct gggcagcgat     8940
          tgtagaaccc cacggagagc tggtgaggtt tgccgtggtt gcaggtgact cggtgctttg     9000
          agccgtggct gcccctggga accacctgga gagcttctaa cccaaccagg cccttccctg     9060
          ggacaattct gtcacagctg gtaagctaag tccaacactt tcacggaaac acagaagatc     9120
          taaaacggca cgatgaccgt gaagaacaga gctggaggac tcacctcact ggtttcaaga     9180
          ctcctctaaa actgcaggag tggaggtgga gacggctcag ctcaggcaca agcctgcagg     9240
          ccatggagaa ggcagcaagc tccagctgac ccacacgctt gcggtcattg tttttttttt     9300
          ttagttggaa tctccctctg tcaccccagt tggactgcag tggcaccatc tcggctcact     9360
          gcagccccca cctcctgggt tcaagcgatt ctcccacatc agcctcccga gtcactggga     9420
          ttacaggcgt gcgccaccac gccctgcccg tgatgattgt tttttttttt tnnnnnnnnn     9480
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn     9540
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nttttgagac agagtctcgc tgtgtcgccc     9600
          agggtggagt gcagtggccg gatctcagct cactgcaagc tctgcctccc gggtttttac     9660
          gccattctcc tgcctcagcc tcccgagtgg ccgggactac aggcacccac cacctcgccc     9720
          ggctagtttt ttgtattttt tagtagagac ggggtttcac cgtgttagcc aggatggtct     9780
          cgaactcctg acctcgtgat ccgcccgtct cggcctccca aagtgctggg attacaggct     9840
          tgagccaccg cgcccggccg atgattgttt tttgacaaat gcgccaatgt aattgagaga     9900
          ggaaatgaag gttgattttt ggttttctga aaaagtggtg ctaagaacag ctggatatct     9960
          gtttggaaaa cagcgaatct taactcttgc tttactctat ataaacctaa atgtaaaagc    10020
          taaactaaag gttatagaaa gaaacatggg ggggtctttg caactctggg gtaggcagag    10080
          attccttagt gtggatacat aaggcactag ccgtgaagaa aaacataaaa tttggatttc    10140
          accaaaattt aaagcttcaa cacttgagaa gacttgagaa aattaaagag cagttatgga    10200
          aagggagaaa atgcttctgt ctttcagagg acttaaaaaa catttttcag ccctcctcat    10260
          attttaaagg acctttgacc agagtatgta aaattctctc ataactaagc aaaaaaccca    10320
          tttaaccagt gggaaaggat ctgcacagac gtttcaccaa gatggacgga gtggccagtt    10380
          gggcacatgg aaggacgccc agcatctcca gtcacaggag aaggcagatt aaagccacgg    10440
          ggagccggca ctacggtccc gctagcatgc tgaaattcag aagcctgagt gtggcacgag    10500
          gaggtggaac agctggatct catccattgc tcctaagctg tgaagctgtg tagccactcc    10560
          acaaacacgt gtggcgaaca gccgaaccgg gagaagggaa gacgtgttca aagatttgtg    10620
          tgtggccagg ctcagtggct cacacctgta atcccagaac tttaggggcc aaggctcagg    10680
          gatcgcttac gcccaggagt ctgagaccag cctgggcaac atagggagac cccatctcaa    10740
          aaaaaaagaa aaaagaaaaa aaaagactta aatgtgcaag tttaccagag ctttgtttaa    10800
          gttgccagaa ctgggaagcc gcccacgtga gtccatccac tggtgaacgg acaaaccgtg    10860
          gttcgcaaac cccaacagca gccgcgggca tgggctgtgg tcacacagca gcagggagcc    10920
          agtgagtctc agatgtgcta acccagaggc caactgagga ggacctactg ttttttgttt    10980
          tttgattttt gttttgagac agagtcttgc tctgtggtgc aggctggagt gcagtggtgt    11040
          ggtctcggct cactgcagcc tctgcctctc gggttcaagc agttctcctg cctcagcctt    11100
          ccgagtatct gggactacag gcacccgcca ccacacccgg ctaatttttg tatttttagt    11160
          agagacggca tttcgccatg ttggccaggc tggtttcaaa ctcctgacct tgtgatccac    11220
          tcaccttggc ctcccaaagt gctgggatta caggcgtgag ccaccgcacc cagctggacc    11280
          tactgtttta ttccgtttat atgacgctgt attaatagaa gaggcagggg tagagctggt    11340
          ggttatgtgg tgcacttaac tgccagaact cagtaccctt aaaatgggca tcttaatgtg    11400
          tgaaaactta aaagtaccaa agctggaccc caccccagct tgctcccatg acactctgtg    11460
          gtgggacctg ggagttgggg tttttttttt tttttttcag atggagtctc actctgttgc    11520
          ccaggctgga gtgcagtggt gcaatcttgg ctcactgcaa cctctgcctc ccagattaaa    11580
          gcgattctcc tgcctcagcc ttctgagtag ctggggttac aggcgcacac caccacgccc    11640
          ggctaatttt tgtgttttta gtagagatgg ggtttcacca tgttggtcag gctggtctcg    11700
          aactcctgac ctcatgatcc acccgcctcg gcctcccaca gtgctgggat tacaggtggg    11760
          agccaccgcg cccggcctgg agttgggttt gtaaatctcc ctgagtgggg ccggggcaga    11820
          gaactgctgg gtctgggtct tcctggctcc tgtggtctgt ggctggctga ctgcggtggc    11880
          cgggggctcc caggacgtcg tggccgtccg tcttgctgag cgtggcgcgt gcctttccat    11940
          gctgtgcgtg agcgtctccc ggcgtggcga gctgctgctt cgggtggggc ggtgttgcca    12000
          ggttgccatc cagatctggc ctctcctctc cacgtcgccg gcggtgtttg tcatcggcac    12060
          ttgcgatgtt cgatgccggc cacatgtgcc ttggtttccc tccttcctgc ccctgtgagc    12120
          tccagcaccg tgtcccttct cttcctcctg tagagccgca gagcacacag cattgacctg    12180
          aaggggacgg tcgtgatctt tgacgaagct cacaatgtgg tgagtctcca ctgcctccta    12240
          aacgcctcct gtttcttcaa gagcagcgca aacctttctg gaggggctct ggccaaaccc    12300
          ttgcagcctt cggtgcccag gactgaggac tgagcacccc aggagcttct gcaccccttc    12360
          ccactctgat ccgatgcctc tgctggggct ggagactggc cagctgggcc agggacctgc    12420
          ccctcaggcg cagggccccc acaggccgct ccccaggcct tccctctagc cagctagggg    12480
          tcagcctggg ccaggggtgt ctcctctgcc ctcggcttct gtcaccaggg cagcagcagg    12540
          cgtgtggtct cgcctgcagt gtctctgccc ttccggccac atggcctgag gctgaggcag    12600
          aattgcttga accctggagg tggaggctgc ggtgagccag gatcacaccg ctgcactcca    12660
          gcctgggtga cagagcggga ttctgtgtca aaaaaaaaaa aaatgttgac tgggcgcagt    12720
          aggtcatgcc tataatccca gcactttggg aggccgaggc gggcggatca tgaagtcaag    12780
          agatcaagac tatcctggcc aacatagtga aaccccattt ctactaaaaa tacaaaaata    12840
          ttagctgggc gtggtggtgg gtgcctatag tcccagctac tcaggaggct gaggcaggag    12900
          aattgctcga acccgggagg tggaggttgt agtgagccaa gatcacacta ttgcactcta    12960
          gcctggtgac agcgagactc cgtctcaaaa aaaaaaaaaa aaaaaaaatt ggcaactcca    13020
          ttgaaataat tgtttgtttg tgttttgaga cagggtctca ttctgtcgtc caggctggag    13080
          ttcagtggtg tgatcttggt ccactgcaac ctccacctcc tgggctcaag ccatcctcct    13140
          acttcatcct cccaagtaac caggactaca ggtgcacacc accacgcctg gctaattttt    13200
          gtattttttg tagagatggg gttttgcatc attgcccagg ctggttttga actcctgagc    13260
          tcaagtgatc tgtccacctc agcctcccaa agtgctggga tcacaggtgt gagccgctgc    13320
          gcctggcctg aaataatcgt ttctcaatat tggtgtgggc cagacagtcg tgtttggacc    13380
          tgcttgtggc ctggccttag agaccccagg gcgtggcttt ggggacttgg ctgtcagcct    13440
          cctgtgcctt ctgcacccaa ccccattcct gctttctgga acccccgatc ctatcctgct    13500
          ctgtggtgat ccgggtgatt tgggctcccg atcctatcct gctctgtggt gatccgtgtg    13560
          attcgggctc ctgatcctat cctgctcggt ggtgatcccg gtgattcggg cccccgatcc    13620
          tatcctgctc tgtggtgatc cgggtgattc gggctcctga tcctatcccg ctctgtggtg    13680
          atctgggtga ttcaggctcc cgatcctgtc ctgctctgtg gtgatccggg tgattcaggc    13740
          tcctgatcct atcctgctct gtggtgatcc cggtgattcg ggcccccaat cctatcctgc    13800
          tctgtggtga tcccggtgat tccggctccc gatcctgtcc tgctgtgtgg tgatcccggt    13860
          gattcgggcc cccaatccta tcccgctctg tggtggtccg ggtgatttgg gctcctgatc    13920
          ctgtcctgct ctgtggtgat ccgtgtgatt caggctcctg atcctgtcct gctcggtggt    13980
          gatcccagtg attcgggccc ccgatcctat cctgctctgt ggtgatccgt gtgattcggg    14040
          ctcctgatcc tatcctgctc tgtggcgatc ccggtgattt gggctcccga tcctatcctg    14100
          ctctgtggtg atctgggtgt gctcggactc caggagaaga tgtgtgaaga atcagcgtcc    14160
          tttgacctga ccccccatga cctggcttca ggactggacg tcatagacca ggtgctggag    14220
          gagcagacca agactgtgca gctgggcgag ccccacccgg agttcagcac agactccccc    14280
          agcccaggtg cgttcatagc caggctgctc ggtcctgagg cctgcgctgc tgcagggggc    14340
          agcctgccct gtggctgtgt gtggtcggcc tgggcactgt ctgttcaggc tggcactgca    14400
          gggcacccac ttctctcaga ggcttctcgg gtgtgaattg tttggggtcc tgtaggctgt    14460
          ggaagggctg gtatcgttca gtagttctgg tattttccga agacctatgt cttctcccag    14520
          ccagtgtcaa cttggcctct actgtgtaaa attagagaac tatactttgt gaagctgaga    14580
          tgggagcatc gcttgaggcc aggagttcga gaccagcctg ggcaacatag cgaaacctcg    14640
          cctctgccaa aaaattagcc aggtgtggtg gtatggtcct gtggtcctgt ggtcagagct    14700
          tttctggagg ctgaagtggg aggagctctt gagcccggga ggcagagctt gccccagatg    14760
          gctccactgt actccagcct gggtgacaga gtgaggctgt ctccaaaaaa aaaaaaaaaa    14820
          aaagtaaaac taactatatt cactgtaagg gcattttgcg tgtttaaatg acccacacat    14880
          cgggcctgca tcacttgctg tgcccgtaga ttccttccca gtgttcgtcc agaggcgtat    14940
          ttccacacag cgctagtcac ggcgtacgtg gaaaacgcgg aaacccccat ggatgtggtc    15000
          ggttggtctg tactgtctgt gttttcttcc tttctttttt tttttgagat ggagttccac    15060
          tcttgttgcc caggctggag tgcaatggtg cgatcttggc tcaccgcaac ttcctcctcc    15120
          caggttcaag tgattctcct gcttcagcct cccaagtacc tgggactaca ggcgcgcgcc    15180
          accacgccca gctaattttg tatttttagc agagtcaggg tttctccatg ttggccaggc    15240
          tggtctcaaa ctccaggtga tccgcccacc tcggcctcct gaagtgctgg gatccaggcg    15300
          tgagccgccg cgcccggcct gtgtcgtgtt ttctgcgtgg cctctgtaaa cagctgacta    15360
          ggagtctgtg agcatcttca ttggttccgc tgtgacttgc gtgtgagcat ctccagcatc    15420
          agctttcctc attttccttt aaaatcgcac atgtggatgg acaccatggg gaccctggac    15480
          cctgggcagc ctcgtcctca cctttctcac cagggtggct gcttgggaga gagtgagttt    15540
          gcgaacttgg catttgttct ggctgtagga tccgtttata tatatacata tatttaagtg    15600
          acagggtctg actctgttgc ccaggctgga atgcggtggc gtgatcttag ctccctgtag    15660
          cctcagcctc ctgggctcgt ggggtcttcc cgtctcagcc tcttaaagca ccgggaccgc    15720
          aggcggtcgc cactgccatc ggatctcaag gctgccacgc agggcgctgc agtaggggaa    15780
          ggggttcctg ggactttgaa cgctccacct ccctcttctc cacagtcccc caaccccacc    15840
          tctaactggg agtggatggc cacctctttc catcctttgc ctggcgcagg gtggggagaa    15900
          tgacaggtct ccttcccgca tctcggcagc tgccctttcg tcggttatat gacgtgggag    15960
          agaccccggc cacccccagg gctgtgtgac gtgggagaga ccccggccac ccccagggct    16020
          gtgaacaccg ccacaggggc cttctccact cttcagtttt gttagttacg tgacgtgcag    16080
          ggcttttcgt tgtaactagt gggggacgtg tggtgagggg ggcttctgcc gtctcattca    16140
          ggaccggaac ttcagttttc atcgctattt gtcctcctac gcctttggag atggggtctc    16200
          gctctgttac ccaggctgga gagcagtggt gccatcaggg ctcacggcag cctcctcctc    16260
          ctgcagcctc cgcctcttgg gctcacacaa tcctcctgcc tcggcctccc aaactcctgg    16320
          gacgactaca gacgtgcgcc accgtgcttg gcagggttca ttcttttcct cacactttat    16380
          ttattggaga gcccggtaga gcgcccggtt tgcacgatct ggttgttgag acgttgagag    16440
          gaaccctgcg gagtctgaat ctgggtatgg gaggggcagt cacacgagtt ccccggtgtc    16500
          ctcgtctcct ccgcacttag gtgcccttag gtggcttgag gaccccagtt agactggggc    16560
          caccctttgc ctggctccag gcgggatgtc ctttcttttt tttttttttt ttnnnnnnnn    16620
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    16680
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    16740
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    16800
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    16860
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    16920
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    16980
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    17040
          nnnnnnnnnc tgggactaca ggcgcccgcc acctcgcccg gctagttttt tgtatttttt    17100
          agtagagacg gggtttcacc gtgtcagcca ggatggtctc gatctcctga cctcgtgatc    17160
          cgcccgcctc ggcctcccaa agtgctggga ttacaggctt gagccaccgc gcccggccgg    17220
          gatgtccttt ctatcaggag gctcacagta tctgctttcc agtttcttct gatgttaatg    17280
          ttgttgctgc tgaacacctg actctgttga ttattggggg attgcaagat ggtagtgtcc    17340
          caattctgtc gcttagtcag ttagcaggaa taatctagca ccatgctctg catcgcatca    17400
          gccgtgtggt gatcccattc acacaggaaa ggcgggataa atgctggctg tgggccgggt    17460
          gtgctgtccc gcatctgtaa tcccagcact ttgggaggcc agggcggtcg gatcacgagg    17520
          tcagagattg agaccatcct ggccaacatg gtgaaacccc gtctctacta aaaatacaaa    17580
          aaaaaaccca aaacatgagt gggctgtggt ggcgcgtgct tgtaatccca gctaccgggg    17640
          agactgaggc aggagaatca cttgaacccg gggggcggag gttgcagaga gctgagatcg    17700
          cgccactgca ctccagcctc acaacaaagc gagactctgt ctcagtaatc aatcagtcaa    17760
          tcaatcagac gtcatcagtg aatgtacgtg agcgtgtagg gattggtcct gctccgcgcg    17820
          ccaccctcaa tctcacttct gacctccgtt ctccacctcg aggtgttttc atgtgggccc    17880
          gtgtgtcctg accccagcag ttgtggcctc tttgctgtct gggagtcagg atttttcaca    17940
          ctcatgtcct gctccagacc tggaatcagc caagtctcca agaagctctg gtttcttttc    18000
          ctgcaaggtg gtatttcagg acccacgatg cggcaacagg ctggtcatgg ttactgggtt    18060
          ggtcattgtt actgggtgtt tttgtggaga tacatccata cgcacagatg tgttcacaaa    18120
          tgttaactct gaaggtaaac cacccggctg ggcacaaggg ctcaccggta atcccagcac    18180
          tttgggagac cgagacagtt ggatgacctg aggtcgggag tttaagacca gcctgggcaa    18240
          catggtgaaa ccccatctct actaaaaacg caaaaattag ccaggtgtgg tggcacacgc    18300
          cggtagtccc agctagttgg gagacagaca tgctggaacc tgggacacgg aggttgcaga    18360
          gagcagagat agtgccgctg caccccagcc tgggtgatag ggtgacaccc tgtctccaaa    18420
          ataaatagat aaataaaggg aaaacgcctc ctcttggtgt ctccagtttg gactggctgg    18480
          catgggttcc ggtagcctct tcccccatgg tggcgtcctt ttttccatgc cgggaatcct    18540
          ggttctcaag ggcggggttg ttggtctgag tgtgacacag actgtgcctt tgctgccttt    18600
          ctcttgccca gggctgaaca tggagctgga agacattgca aagctgaaga gtaagtgctg    18660
          ccctccccac cttcttgcgg ctgggtgggg cctccccctg atgcctcctc aacccgacct    18720
          gcagtgatcc tgctccgcct ggagggggcc atcgatgcca ttgagctgcc tggagacgac    18780
          agcggtgtca ccaagccagg gaggtgagag gcggggagcc agctgcttca ctggaggccc    18840
          agcctggagc tagagatagg ccatggtgca gtcctaggct gtcccaccag tgaggcctgt    18900
          tttcaggccc gttttccctt tttgagacct ggtaggagca cctggtttgc atgatctggt    18960
          tgttgagacg ttgagaggaa gagcacacgc atccacggaa cagcacacgc atccacggaa    19020
          cagcacacgc atccacggaa cagcacacac tcccacggaa cagcacacgc atccacggaa    19080
          cagcacccac tcccacggaa cagcacacac acccacggaa cagcacatgc ttccacggaa    19140
          cagcacatgc ttccacggaa cagcacaccc ccacggaacg gcacccacgg aacagcacgc    19200
          acgcccccac agaacagcac acacccccac agaacagcac ccacgccccc acggaacagc    19260
          acacacaccc acggaacagc acacacgccc ccacagaaca gcacacaccc ccacggaaca    19320
          gcacacgcac ccatggaaca gcacccacgg aacagcacac actcccacgg aacagcacac    19380
          gcccccacgg aacagcacac acacccacgg aacagcacac actcccacgg aacagtacac    19440
          gcatccacgg aacagcacac acgcccacgg aacagcacac gcatccacgg aacagcacac    19500
          actcccatgg aacagcacac gcatccacag aacagcacac acactcccac ggaacagcac    19560
          acaacagcac acactcccac ggaacagcac acgcccccac ggaacagcac acacacccac    19620
          ggaacagcac acactcccac ggaacagcac acgcccccac ggaacagcac acacacccac    19680
          ggaacagcac acacgccccc acagaacagc acacaccccc acggaacagc acacgcaccc    19740
          atggaacagc acccacggaa cagcacacac tcccacggaa cagcacacgc acccacggaa    19800
          cagcacacac annnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    19860
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn ngcacccacg    19920
          gaacagcacg cacgccccca cagaacagca cacaccccca cagaacagca cccacgcccc    19980
          cacggaacag cacacacacc cacggaacag cacacacgcc cccacagaac agcacacacc    20040
          cccacggaac agcacacgca cccatggaac agcacccacg gaacagcaca cactcccacg    20100
          gaacagcaca cgcccccacg gaacagcaca cactcccacg gaacagcaca cgcccccacg    20160
          gaacagcaca cacacccacg gaacagcaca cactcccacg gaacagtaca cgcatccacg    20220
          gaacagcaca cacgcccacg gaacagcaca cgcatccacg gaacagcaca cactcccatg    20280
          gaacagcaca cgcatccaca gaacagcaca cacactccca cggaacagca cacactccca    20340
          tggaacagca cacacacacc cacggaacag cacacacgcc cacggaacag cacacactcc    20400
          cacggaacag cacacacatc cacggaacag cacccacgga acagcaccca cgcccgcatg    20460
          gaacagcacc cacggaacaa cacacacccc cacggaacag cacacacccc cacggaacaa    20520
          cacacactcc cacggaacaa cacacacccc cacggaacaa cacacacccc cacggaacag    20580
          cacacacacc cacggaacaa cacacactcc cacggaacaa cacacacccc cacggaacaa    20640
          cacacacccc cacggaacag cacacacacc cccacggaac aacacacacc cccacggaac    20700
          agcacacact cccatggaac agcacacaca cccacggaac agcacacaca cacccacgga    20760
          acagcacaca cacgcccacg gaacagcaca cacccccacg gaacagcaca cacccccacg    20820
          gaacagcaca cacccccacg gaacagcaca cacacgccca cggaacagca cacacgccca    20880
          tgcggggccg ctgggtttcc tgcagtttgt cctcctccag gcctttccct ggacctcctc    20940
          aggtgcctgt tagaatgaga ccttcttgtt aggacgatga gtgtcccagc caccacctct    21000
          tttggactcc gggaggcccg gaacattctg aaggctccgt gggtctcctg tcttctccgc    21060
          ggccagggca gcagcatttg ttgtctgtcc tgcaggcaga tgagggtcag gcctggggcc    21120
          cgtgtggggc tccactgagt gcacagccgc caaggcgagc gcgttctgcc tgagcgctga    21180
          ccttgtggcg actcccagtt gcttccaggt ggagccagtg tcctcagcgt aatgctcaag    21240
          gctctggcgt ggctcctcgg ccacctgcac ccccaggggc ccctcctgta gcttctgctg    21300
          ccgccatcac tgtcactctc ccaaggcttt ggggactctg cccagagccg ctgcctccca    21360
          gaagcccctg acgacccccc ggcgacccca tccctccctc tgatgacggc ctctgccccg    21420
          aggcggcttt tccttggtgc tgttcttgtg ccggccaggc ctccacttcc catctggagg    21480
          ctcctgaggg cggaggcctc tcacccccaa tgccggcgtc ccctggaggg ctcagtttgt    21540
          ttccgaggga aggaaacttc cacagttgct gccttcagtt cccaaagctg cagcctgatc    21600
          ccccgtccag gctcgagcct gccttcttct cctcgcagct acatctttga gctgtttgct    21660
          gaagcccgga tcacgtttca gaccaagggc tgcatcctgg actcgctgga ccagatcatc    21720
          cagcacctgg ccggacgtga gtgccggggc ggggtccttg gtgtgggcag acgtggcgta    21780
          gggggtgcag caggcctcca tcctggcagt cagggctcgc ctggccatca cctggccgtc    21840
          agcaggaaca ggctcacaga acctcacctg gtcggggcgt ggaggcgtta gtgccggttg    21900
          cccactgccg tagagcctgt cccagttctg cagctggcgg cttcgtcctg cagactcatc    21960
          ccattattcc ccttttaagg aagagcagcc caaggccctg gctgggttgt ggggcctcag    22020
          gcttctccac acaccctgag ttctgcttct cagagctgtg gggtccagag gctttgccca    22080
          gaggcagtgt cgtcatgggc tgctctggtt tgagatgccg gcccgccggg gcctctgctg    22140
          tgctcccagg tgctggggag ggcggctctt gctgcttcaa accttaggtg accatagagc    22200
          ctcttttcaa gttccaccgg cccccttgga gacgctgtcc ctgcctggct gctctcctgg    22260
          ctgctgggaa gggcaggcga gctgcccgcc ctgagtggac actgcgctcc accctgggcc    22320
          ccccgttggg caggagatgg agcttggcag tcgggctgag ctggcttatg gctggaaggg    22380
          cgggggctgg ggtcggggcc tcccctgcct gcagtgcggg tgtcagcgcc cggcatgcta    22440
          cctccccagg tgctggagtg ttcaccaaca cggccggact gcagaagctg gcggacatca    22500
          tccaggtggg gcctgctcct ctggcgtctc cttccctgat ggaagccggg cgggtgcctt    22560
          ctcctgctgt attagttact gactctagac gtgggggtgg gagaacggcc cccacaccac    22620
          ctgtttccga ctggcaaacg cttggctcct ttcctgtgac ccaaacccac actgggcctc    22680
          ccgcggggat gggggaggac gaggtctggt ggcccgtgcc cagggtgacg ctggtggggg    22740
          aggacgtgaa ggggagtggg ggccagggag ccgctcctgc cctgtccggg ccctcaggcc    22800
          ggggggaccc actcctggca gccccagcta cacgcagatg aagagctctg gacacacgta    22860
          gcttcctgaa cagcttctcc agggacagac aaacggggac cctgcaggtt gccggcgggg    22920
          gtgtccctgc gagcccatga tgggggatgc ggccccggcc cccttcttgg ccccgtcctg    22980
          ccctgtgatg cccgtcccct cccatgtgag gttgctcctg gctctgtgcc tgtggcagca    23040
          cctgctttcc ctgaggcaga cgggcttgtg cggtttgtgg agggcaagcc ccatttttgg    23100
          gtgctctggg cacacacttg cctctcctgg acctcggtgc attttttaga agcagaccca    23160
          caagtccctg actgggaggc catcagtcct tggggaaacc gaggcacagg tggctgtgtg    23220
          gagccatgtg aggctgcctc tgtgctgccc acactgaacc tcctggccac acgaggtcat    23280
          ggcagggtta ggtggggctg cccagctctg tgacaacttc gtgagtgtcc gcctggggtg    23340
          gggggtgctt gagctggggg aggccgcaga agaaccctgg aatgtaccgc cggcctgtgc    23400
          atgcagtgcg gtgctctgtg catgctactg ggcgtggagc tgcaggcccc aggacgacca    23460
          ggcactgcct tcttcataga cgtggctctg agcaggggcg agacctgggc agggaccagg    23520
          tggggtgggc acagcaggtg gtagggccca ggctcagccc tacctccacc gtggccttct    23580
          ctgcggccag tgatgccaca gccagtgtct tctctgtgtg gcagctgggg ctggaaagac    23640
          ggcactgcta tgtctcccag ctcctcccca aaagcacggt gggcatccca gggccagacc    23700
          cctctctctg tggctcctgc ctgccaaggg ctgctttgcc gtcccgcctg gagcgtggtt    23760
          ggctcttcaa gcaggaggcc gtgcacctgc caggcggacc tgcttccatg tcctgacggg    23820
          tcactcaaag cacctccagc acatggccat cgaggcagcc ctgcagccca gggcctggag    23880
          ggcaggtgtg agctggcccg ggcctgcccc tccctggaat gtggcttccc aggctccagt    23940
          atggagcagt gtccacactc tggaaccaaa tcttgttcac cccattggtt tggaatttcc    24000
          tttggctgct gctctaagta gccactggga gatgactcag ctcctcccaa ccctggggac    24060
          tgcacaccgt gttcaccctc ggctgctcct gagtccctgc aggtgtgggc actgctcata    24120
          gggctgctgc tgggctggac ttgcagccct gaggcacagg tgaccctggg gacagagtgg    24180
          ggctagagtg gggctagtgg ccccaggaag aggatgtggg atgcacggtt cagttggagg    24240
          caagtccggg cagggccagg ctgtgtgctg gggaggtaga gcttagctgg aggcaaactc    24300
          tgggcagtgc tggcccgtgc tgggcagcca gtcaccgctg ggcccctgtg agactagtgg    24360
          gtcccctttc ttctctgcct gagctgccct ggggctgaag cacggggcgg tttgtagtgg    24420
          tgtttttttg agacagggtc tcgctctgtc accccagcgg gagtgcaggg ccttgtcacc    24480
          agctcactgc agcctcagcc tcctgggccc aggccatcct cttgcctcag ccacctgagt    24540
          agctgggaac acaggcgtgc accaccacgc ccggctaatt ttaaaagctt ttttgtggag    24600
          atggggtctt ggcgtgcacc accacgctcg gctaattttt taaattttta tgtggagatg    24660
          ggtcttgcca tgttgcccag gctggtctca aagtcctggg ctccggcagt ctgcccacct    24720
          tggcctccca cagtgctggg attacaggta agagcttcca ggcctgccca tcagagggct    24780
          ggctttttga gggaagctgt ttcctgaggc agcctcagcc cctgctcatg gcagcccctg    24840
          gtgtcatggt gaatttgttc tgttgtttcc atccctgtgg gccaaatgct ttggtaaaac    24900
          gcaaggcctt gtatttagct gtcttgacag tgaaaatggc tgggaaggaa ggaaggaagg    24960
          aatggaagga agtttctctc tcccgtgcat acccaggcac gtgcacacgt gcgcagtcca    25020
          cgcacgctgc cggtctctgt cccagccgcg gtgccggccc ccgtgttctc cagttcagct    25080
          tctccgcatt tctgtgaacg attccggctt cttgatgttc ccagcagaac tccctcaagc    25140
          cttcggcttc tccagggctc tgacggcggc tgggctgacg tggccgctct gcggagcctg    25200
          ttggggcttc acgttcctgt tctggccatt tccggctctt tttccgggaa gggtcatcac    25260
          gcgctctttt cctagtgcag gcatcgtccc tttcccgttg atttgcaggg ttctctgtaa    25320
          gatctgagga acacgtgcca acatattctt tcctggtctc gtgctggtca ttttttccat    25380
          tttcacgaca ggtttggtga acagatgttt ccttgtcatc agacttttgt cttgagcttg    25440
          tatcccccga ccaagatgct aaactgggtc ttgtgtgttc tccaaactgc actgtagggt    25500
          ggcggagctt tgtgtcgggg cctccgcacc ttccggcgtc acctgtgggg gtgtgaaagg    25560
          cagactctac ctggattttt cccagcacgc cacaccggtg gttccgtctg ctgaccgagt    25620
          ggctcggctt ctcccaactc cgctgggcac ctgccacact gttttcctca cggttttgtt    25680
          cgtggtggtt ttgtcgtaag tcctggtgtc ggccagaacc aatttctgtt tttgtttgtt    25740
          tttgagatgg agtttcgctc ttgtcgccca gggtggagtg cagtggtacg atcttggctc    25800
          actgtaacct ccgcctcctg ggttcaaatg attctcctgc ctcagcctcc tgagtagctg    25860
          ggattacagg tgcttgccac cacgcccagc taattttcat atttttagta gagacggggt    25920
          tttgccgtgt gggccaggct ggtctcgaac ccctgacctc aggtgatcct ctcgcctcag    25980
          cctcccagag tgctgggatt acaggtgtga gccgccgcgc ccggcctctt gttcttctta    26040
          aacctgccct gatgttttct ccatgatgca tgttggagtc aacctgtctg cttcctttaa    26100
          aaatcttgct gtgattttga ctggaatgtg tggaattcct gtgtttttga gtcagtgtct    26160
          ctctgttgcc cagtctggag tgcagtggga ccatcacagc tcactgcagc ctcaacctcc    26220
          tgggctcagg ggatcctctc agcccagcct cccaagtagc tgggaccacg gcacgtgcca    26280
          ccacgcccgg ctagttttca tatttttttg gtggagaccc cagggttgca ccatgttgcc    26340
          caggctggtc tcgaactcct gggttcgggc agttcgcccc tctcggcctc tcagagtgct    26400
          gggattacag gcgtgagcca ctgcactagg ccatgttgaa tttctagatt aatttgggac    26460
          ccttaggggc acagagagga gggctgggcc agctggtggg aggagaggcc tctcgggctg    26520
          ccgcatttcc agtgcacgga gatggcctgc gtagggggaa cagagctcac tgggggtccc    26580
          tccagggagg agaaagggtc aggcaggtgc cagctcctgt ccatcagcct ggggctgcat    26640
          gatggcaggg gctggtgaac cgatgacctc tgggtgtcct gtgaccttcc gtgtgtgggg    26700
          ctgatgccgc agaagatcag gtggcctcca gggctccggg ctctggcctc aggctcctca    26760
          cgggactgca cctcctctct ttcagattgt gtttagtgtg gacccctccg agggcagccg    26820
          tggttccccg gcagggctgg gacccttaca gtcctataag gtaggggcca cctccaggag    26880
          gcaggtgggg ctgggggtcc tgcagtcctg aaaggtaagc ggctgccccc aggacacggg    26940
          cggggtctcc acacttctgg tcctgtcccc tccaggtgca cgtccatcct gatgctggtc    27000
          accggaggac ggctcagcgg tctgatgcct ggagcaccac tgcagccaga aagcgaggta    27060
          cagacctggg cccacactct ccccgcccgc ccgggtgtgg tgctcagcac cagcatgcca    27120
          caggctaggc acgtggccag ccgtgggtct cctgcccccc tgggcctggc caccttctcc    27180
          atgtccaggc caatccagag cgttctcctc actgtccctc tgaaggctgg agttactgag    27240
          agacatggga gagggcctga tggcaccgtg acctgcccag agtcacctgg ttggtggcgg    27300
          cagagccaca gctcagccag gccttcctgc tgggacacac tggtttatgc caaggccgtc    27360
          agcacggagc cccacagtga ggcacagctt tccctgctgc ctccacccag cgcctggctg    27420
          ggccaagcct cagggtctca tctgaagggg gcccgactgg ccctgttgtc cgaagcctct    27480
          ggtgcgctcg gccctgaggc cccacgtgcc ttgttggctt cctgtgctct gtggcgtctt    27540
          cgagtcggtg ctgccgggta cctgtgtgga tggggcccgt gagtgggccc tcggctccgt    27600
          gtccagagtc ctgtggttct tggagtgtgt ccggccccac ccggccatgt ggtgtccaag    27660
          gggggctttg tggcggcagc ggtgggagct gctgcccctt ctcgtgctcc agtggggcct    27720
          tgcctctggg cttggttcgt tcctctctgg aacgttcttt ctcagagctc tctggcccgc    27780
          ggtggcacga cgtggccctg gctgaagcag cccccgcgtg gttgctgtgg ttggtctgcc    27840
          tggccgagcc ggaaggggag gcccgggagg gcgtcagggt tgcgtggctt gacccccggt    27900
          cggtggctcg gtgatggcct cgtggcaagg cgtctcccag caggaagcgt ccatcctggg    27960
          gggtcgtggg aggcggcgcg tgcctgaggc agctggcgca cagatcctga gggcctggaa    28020
          tctatttgtt ccattgacct gtgacgtcac ttgacttctg agaagcagcc gctccctgcg    28080
          ttgggtgttt gtaggaaatg agttcctgga ggcggaggtc gggaagttcc cccgctgcag    28140
          ggcacgctca gccccaggaa gcggggtgac ctttgctggg agaggtgcct tgtccctgct    28200
          gaccccgagt cacagtcagc gtcgttctgc ttgtgccgtg tttaattcct ggtgtccggt    28260
          gcccaggctc agtctcctcc ccaggccgcg gccgctgcgg tcagtcagtc aagcacttct    28320
          aggaacttcc tttgaaccgg tgcccttgtt cgctgctgac gccactcgga ggcttcctgg    28380
          cggagcgggg aactcgcact tcctcttgtg cgcgtccctg gaatgtcggg acgctggcgc    28440
          ttgcttcccg tgcgctcttg gcgggatgag cttgccctga gctgcatgtc actgtttctg    28500
          cagaagttta gggttggagt tggctgacct ctctggaggt gtccccagca tctgcctggg    28560
          gtctgcctcg tactcccggg acccccagtc ccccagaggg gaccccagct ggcagactgc    28620
          gctcacactc agggcagcct cctttgttct gacttctgca cgctgggcct gggtggctgt    28680
          gggcggctca cttgcttgat gccagtgggt gagagggtga tgggcagaga ggcaggcggt    28740
          caggccccca gtcccgtcct cacaccctgt gtcccctgct cccctccgcc ccacagggaa    28800
          ggtgttgagc tactggtgct tcagtcccgg ccacagcatg cgcgagctgg tccgccaggg    28860
          cgtccgctcc ctcatcctta ccagcggcac gctggccccg gtgtcctcct ttgccctgga    28920
          gatgcagatg tacgggccac ccctgccagg ggcctaagca ctggtgacgc ctgtgacgtt    28980
          agtggggtgg gagtgctggg ggtccccatg agccggggtg ctgggggtct tgggcctcac    29040
          tgggggtctc gggccttgag ggctaaaggg gtgctggtgt ccttccccac tgtctgtccc    29100
          tccggccacg ctcagccctt tcccggtctg cctggagaac ccacacatca tcgacaagca    29160
          ccagatctgg gtgggggtcg tccccagagg tcccgacgga gcccagctga gctccgcgtt    29220
          tgacagacgg tgagggcctg tccctgggcc gtgctggggt gcgaggtcgg ggagtactga    29280
          gccctgaggc cctgagcagt ggcctctcgg ctctgtgcag gttttctgag gagtgcttgt    29340
          cctccctggg gaaggctctg ggtaagtgcc cggcacaccc cagctgtgcc catcctggat    29400
          cctggaccct gctcccaaga gctggtaggg accccggaag acgccccgcc cctgccctga    29460
          ccccagcccc tgcacttcca ggcaacatcg cccgcgtggt gccctacggg ctgctgatct    29520
          tcttcccttc ctatcctgtc atggagaaga gcctggagtt ctggcgagta tgtctcccct    29580
          gtgtgtcctg ggtggggtgg gtgagggcag ggctggagca cgaagcaggc agtggccaca    29640
          gctcctgcct gccctcatcg gatcggcggc gtaaccaggg ctgccgtgtc cctgcctctt    29700
          cctcccacag gcccgcgact tggccaggaa gatggaggca ctgaagccgc tgtttgtgga    29760
          gcccaggagc aaaggcagct tctccgaggt cagcacttgg ccggggctct gggtctgctg    29820
          ccccctcgtg cctcccgtgc ccctcacagc ttccccgagg ctgaccacca gccctgacca    29880
          cgggctctgg cggctcccgc ctgcctcttc agggcccctg cgtttccttc ctggccctga    29940
          gtgttgcctc ttatcttaca aagcccccag cactgggtgg gtgtggcgac agtggtcctc    30000
          ctgcctgagg agctatagcc ggcggccacc ctggccctgg gattccccgt gttttctggg    30060
          aagcactgag caggcgcagg atcagcctgg gatccgtgcc aggaagaagt ttccagaacc    30120
          cagttggcct tcctggctag gatagtcctt catcttggag gatgagacct gggtctccct    30180
          catgggggaa gaaggggccg aggtgggctc caggctgagc ctgaccaact ttccttccag    30240
          accatcagtg cttactatgc aagggtcgct gcccctgggt ccaccggcgc caccttcctg    30300
          gcggtgtgcc ggggcaaggt gagctctctg gggccctctg tcctgacccg gttgcctgtt    30360
          ccccagtggg tgctcatggc tcctcagctg actttgggcc ctgggggctg cctggtcccc    30420
          tccttgggcc ccacaagagc aaagcactgg tggcctgctg ggagcgtgcc ccgctctggg    30480
          tcgggcaggc aggatgcagg aggttcctgg ccacgagagt tggaggtggc gtctgggagc    30540
          tgtggacccc aagtggggtc ctgacccata gatggggctt cctcccaccc ctggttggag    30600
          cccccatggc cccaggcagc tccctggtgt gtcccccagg ccagcgaggg gttggacttc    30660
          tcagacacga atggccgtgg tgtgatcgtc acgggcctcc cgtacccccc ccgcatggac    30720
          ccccgggttg tcctcaagat gcagttcctg gacgagatga agggccaggg tggggctggg    30780
          ggccaggtga gttacagcag ggcggggctg gggtaaggca atctggcgac tgagcccccc    30840
          tgtgaccacg ggagcccctg tgaccgagcc tcctcgccct ccagttcctc tctgggcagg    30900
          agtggtaccg gcagcaggcg tccagggcgg tgaaccaggc catcgggcga gtgatccggc    30960
          accgccagga ctacggggct gtcttcctct gtgaccacag gtgcgtgcag tccgggggca    31020
          ggcgtggcgc caggggacac ggccacatcc cactgggccc tggactcctt ccccacatga    31080
          ggccccgtct cccccagagc ctctctggcg actcggggtc agcctgaggc ccctgcggca    31140
          gatgagggtc ttcacttggg tgaactgacc ccctgaagcg gctgtgggca gggcagcagg    31200
          gctgtggcca ccccccaggt tcgcctttgc tgatgccaga gcccagctgc cctcctgggt    31260
          gcgtcctcac gtcagggtgt acgacaactt cggccacgtc atccgagacg tggcccagtt    31320
          cttccgtgtt gccgagcgaa ctgtgagttt ctgcccaggg aggggatgag ggtgttgtcc    31380
          ccagaggagc cagaaatggg cccacccacc cccagtggtt ctgcagatgc cagcaccggc    31440
          cccccgggct gcagcaccca gtttgcgtga aggagaagat gctgtcaggg aggccaagtc    31500
          gcctgacccc ctcctctcca ccaggaaagc taagagtctg gacctgcatg tccccagcct    31560
          gaagcagagg tcctcaggtg cagatggcca gtgcgggacg ggcagtgtgg ggcgggcggg    31620
          gcaggcggat tggggcgggc cgtgtggggc aagcagcggg gcaggtggtg tggggcgggc    31680
          ggcaccaggc gcccagggtg gaggcggctc acctggcttt atgcactgcc cctcccacct    31740
          ccaaaggctg tgtctgcctc ctagggtggg gttcccacgg gctggaaccc tcccctacag    31800
          gcagagaagg cctcaggcaa agacgcgccc caaggctggg actcccccta atagcaggga    31860
          ggacacccac aggcaggggc ccccaaatgc tgggaccctc cctcaggagg ggctccgtca    31920
          taggcaggga cccccagctg gggccccgcg gtgggcttca ctgcgcactc gggtactctg    31980
          caggatcacc agctgccggg gaccccgaga gtagcctgtg tgtggagtat gagcaggagc    32040
          cagttcctgc ccggcagagg cccagggggc tgctggccgc cctggagcac agtgaacagc    32100
          gggccgggga ccttggcgag gagcaggtgc agttccaggg ccttgggatg gacacagacc    32160
          ctctgtctcc tgaggccaac cccaccccgc ccatctgact tcaggcacct ccccacacac    32220
          ccctgtaaat cccctgcctg tggggcgggc aggcaggtga gggatcccag ctgcctggct    32280
          gtgtgtgtgc cctccacctc gcctcaccca caggctgctg gctcccaggt ggtgcatgcc    32340
          ctggccctca gcgggtgccc ccacatcact ttgattctct ggcaggtcag cttggctcag    32400
          ggcactcaag gtcgggtgcc cctgcccctg gctgtgcctg aggctggcct ttctccagga    32460
          atgtgctgcg gttgggaccc aggttccttc ctccttgggg ccttttgccc cagaagccca    32520
          taatttctca gctttctccc tgcttcctgc tgggggccgt tctcttgctg cctgtccctg    32580
          cccttcaggc tcctggagtg agccccgggt gcaggcacca gacacctgtg tccccttcct    32640
          gccagcccct cgctgtggtc ggactgtcct tcctggacct gctcttacgt gtcaccacct    32700
          gtgagcctca tgagccgctg gcgtgacttg gacaggacca agttgtggga ctgtcaccag    32760
          ggtgtgccgc gcccctcccc cgaccttcgt cttggctact gctcagggct ccttggggcc    32820
          atcttccctg tgggcccagg tgctttgggg ccctggagtg tgtggttgga accacagctg    32880
          tgtcctcctc aggcccacag ctgctccacc ctgtccctcc tggctgagaa gaggccggca    32940
          gaggagctgc gaggagggag gaagaagatc cggctggtca gccacctggt gcgtgagctg    33000
          tccctgcacc tgtgccgacc accatagaca cgtgtgggaa cccggccctg ggtgccccca    33060
          gccaagttgg gatgtgggcc cgatgggacc agggaagtta cccccgggag ctgatgtcca    33120
          gggcggctgt gaagctgtcg gcccaagggc tcaagggcag ctgggatcag gccccgccct    33180
          tgggcaggct tggtttgggg gctgcagcac tgggtttggc cctggcattt ccctcaagtg    33240
          tggacgtgca cctgcctcat tcgaggggcg cagcccattc ccagccttgg atgaaagaac    33300
          cgagttatag tcggagccag gaagccccct gcctgctgga aagccccaag tgtggcagcc    33360
          tttgtccatg tcccttggct tctgggaaga actgggtggt gcccaggcag ggctggtgcc    33420
          atcaggaagt gggcggctgc cgaggggcct gggctgttga gggcctgggt ggggagtgcc    33480
          ggggctgccc ctgccttggt ttccacgttt ccgtgttggt ctggggtgtg tggagagatg    33540
          agcaccgctt cttgggaagc ccctccctat gatctgccat cctggagcct cagctgtgtc    33600
          cgctgtgggg tgggggcttt agggaggagg agagaggacc cccagcttga gggagagcca    33660
          gtctaccctt tgcccattcg ctgccctcgg ttccctgcca gcctctcact gtgtgaccca    33720
          gacaggccca gccccgcagc tttcctcccg cagcacctcc gtgtccatcc agccaaccag    33780
          tttctcaggc agcagccccc gctcagcaat cactgtcccg gggaacaccc aatgctccaa    33840
          ggaaggctct gcagctccag ggacgggatg atgaggctgg ccctgatgga gcctcgggcc    33900
          tgtgtgctgc aggaggagcc cgtggctggc gcacagatgg acagggccaa gctcttcatg    33960
          gtggctgtga agcaggaact gagccaagcc aactttgcca ccttcaccca ggccctgcag    34020
          gactacaagg gttccgatga cttcgccgcc ctggccgcct gtctcggccc cctctttgct    34080
          gaggacccca agaagcacag cctgctccaa ggtgccctgg cttgcagggg ccgcccatcc    34140
          tgagggcagt gctgccgctg tgtggggtgg gggccatctg ggtccaaggt tgtctctgtt    34200
          ctctagagaa aagggggcgg atggggacag acaccccttc ctctacaggc ttctaccagt    34260
          ttgtgcggcc tcaccacaag gagcagtttg aggaggtctg tatccagctg acgggacggg    34320
          gctgcggcta ccggccagag cacagcgttc cccgaaggca gcgggcacag ccagccctgg    34380
          accccactgg taaatggggc ctcgggtggg accctcagac tcctccgtgg aaggcaccgg    34440
          agtcctgggc tggttggggt gggcatccct ggggccctgc gtggccccgc ctctctgttc    34500
          ccgtgtggga gtgatggggg ccacccccca ccaccagcag cagtatcact tgttggggag    34560
          accctgtgca actccacgca gggccctgcc cttcccatag cccctgaccc ctacgcacag    34620
          ccctgtccag ctgccgcacg tgtcccctgc cccccatgca cagccctggg gagtccactg    34680
          cacacgccag ggtcctagac ccctagaccc ctagatccct gtcctcccgt cctccctact    34740
          tctgcctttg cctagggtgg agtccaagcc tccagaggtg ggagtgtctg tgttcgtgct    34800
          tgttaacgaa cagcccccat agagctcctc cagtgtaggg ttcacccagc ggggaaccta    34860
          acctgttggg aagaccccag accccttctg ggcttggtac ccaccctggg gctctaagct    34920
          cctgagcagg gctttggcct gcctgccact gttccagccc ccatccagca gttggtgtct    34980
          cctctgctgc cccggcacct gggcacgtgt gcctgcctgg gttttcccgc cctggtccga    35040
          ggtgggtgag gcctggcctc cccagccagc ccttccccct ccccggggga actttccagg    35100
          tgcttgggac cagctttgtg gctctccatc tcttcatcag gaaggacagc gctagatccc    35160
          aagctgactg tgtccaaggc tgcagcccag cagctggacc cccgagagca cctgaaccag    35220
          ggcaggcccc acctgtcgcc cagaccaccc cccacaggta gctgagtcct gaactgtgtg    35280
          cagcctgtga cttggtgggt tcctcagtgg cttgatgagg ctaacacttg agtgtggctt    35340
          gagcctttga accggaggtg ccagtggagc tgcccctgtg gggagcatct cctggtgggg    35400
          gctcccggtt ctgtaccccg cagttgtcct gagcagctct ccaggagttc gtgggaggaa    35460
          gggcaggcag ggtggtggga ctctcagtcc tctgccccag cgccactctg agccatgcta    35520
          ctcccacacc aggaggccct ggcagccacc cacagcaggg gtccagagcg cccagagcag    35580
          ggaagcaggg ccagcgcgcc gtgagcgcct acctggcaga tgtccgcagg gccctggggt    35640
          ctgcaggctg tagccagctc ttggcagcac tgacagccta caagcaagac gatgacctcg    35700
          acaaggtgct ggccgtgctg gccgccctga ccactgcaaa gccggaggac ttccccctgc    35760
          tgcagagcaa gtggcctggg cgtgggggac agccagtggg gtgggnnnnn nnnnnnnnnn    35820
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    35880
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    35940
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    36000
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    36060
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    36120
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    36180
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    36240
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    36300
          nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnggg    36360
          ggcaggggca gggtggggac cgtgccgggt ctgagtgaag ctccccgcag ggttcagcat    36420
          gtttgtgcgt ccacaccaca agcagcgctt ctcacagacg tgcacagacc tgaccggcag    36480
          accctccctg ggcacggagc caccaggacc ccaggaggag agtcttgccg tgcctcctgt    36540
          gctcacccac agggctcccc aaccaggtag ggcgcctgcc tggctgctcc tgacagtgcc    36600
          ccaaccgcac gcagccctgg gagtgagcag caaagcccca ggccctgctc agactcagtc    36660
          tccgtctcca ggcccctcac ggtccgagaa gcccggaaag acccagagcg agatctcgac    36720
          cttccttaga cagaggccag cagggactgt gggggcgggc ggtgaggctg cagggcccag    36780
          ccagtcccca ggacctcccc acgggcctgc agcatctgag tggggtgagc ctcctgggag    36840
          agaccttgct gggcagcagg ctgcgggagc tccgagcggg cccctctcag caggctgtgt    36900
          gtgccagggc tgtggggcgg aggatgtggt gcccttccag tgccctgcct gtgatttcca    36960
          gcgctgccaa gcctgttggc aacggcacct tcaggttggt gcctggtcac tacagttcct    37020
          gctgggtgta gccccaggtg gtgggctgag ggggaaaggg ccgggtatag ccccaggtgg    37080
          tgggctggtg gcaacgcctg gcaggtgcgt ccagcgggcc ggttgtctta caggcctcta    37140
          ggacgtgccc atcctgccac accgcctcca ggaagcagag cgtcacgcag gtcttctggc    37200
          cagagcccca gtga                                                      37214
          <![CDATA[<210>  3]]>
          <![CDATA[<211>  18]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  寡核苷酸化合物 3_1]]>
          <![CDATA[<400>  3]]>
          aattttacat actctggt                                                     18
          <![CDATA[<210>  4]]>
          <![CDATA[<211>  19]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  寡核苷酸化合物 4_1]]>
          <![CDATA[<400>  4]]>
          aattttacat actctggtc                                                    19
          <![CDATA[<210>  5]]>
          <![CDATA[<211>  18]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  寡核苷酸化合物 5_1]]>
          <![CDATA[<400>  5]]>
          ttacatactc tggtcaaa                                                     18
          <![CDATA[<210>  6]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  寡核苷酸化合物 6_1]]>
          <![CDATA[<400>  6]]>
          ctttattata acttgaatct c                                                 21
          <![CDATA[<210>  7]]>
          <![CDATA[<211>  22]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  7]]>
          tttgaccaga gtatgtaaaa tt                                                22
          <![CDATA[<210>  8]]>
          <![CDATA[<211>  18]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  8]]>
          accagagtat gtaaaatt                                                     18
          <![CDATA[<210>  9]]>
          <![CDATA[<211>  19]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  9]]>
          gaccagagta tgtaaaatt                                                    19
          <![CDATA[<210>  10]]>
          <![CDATA[<211>  18]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  10]]>
          tttgaccaga gtatgtaa                                                     18
          <![CDATA[<210>  11]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  11]]>
          gagattcaag ttataataaa g                                                 21
          <![CDATA[<210>  12]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  引子]]>
          <![CDATA[<400>  12]]>
          ggagtgtgga ttcgcactcc t                                                 21
          <![CDATA[<210>  13]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  引子]]>
          <![CDATA[<400>  13]]>
          agattgagat cttctgcgac                                                   20
          <![CDATA[<210>  14]]>
          <![CDATA[<211>  27]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  探針]]>
          <![CDATA[<400>  14]]>
          aggcaggtcc cctagaagaa gaactcc                                           27
          <![CDATA[<210>  15]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  引子]]>
          <![CDATA[<400>  15]]>
          ccatcctgga cattgaggac t                                                 21
          <![CDATA[<210>  16]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  引子]]>
          <![CDATA[<400>  16]]>
          caggttccgg gacaggtagt a                                                 21
          <![CDATA[<210>  17]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  引子]]>
          <![CDATA[<400>  17]]>
          cgtctgtgcc ttctcatctg c                                                 21
          <![CDATA[<210>  18]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  引子]]>
          <![CDATA[<400>  18]]>
          gcacagcttg gaggcttgaa                                                   20
          <![CDATA[<210>  19]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  引子]]>
          <![CDATA[<400>  19]]>
          ccgtctgaac tatcctgccc                                                   20
          <![CDATA[<210>  20]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  引子]]>
          <![CDATA[<400>  20]]>
          gccgtagtcg gtgtactcgt                                                   20
          <![CDATA[<210>  21]]>
          <![CDATA[<211>  19]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  21]]>
          gaattttaca tactctggt                                                    19
          <![CDATA[<210>  22]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  22]]>
          gaattttaca tactctggtc                                                   20
          <![CDATA[<210>  23]]>
          <![CDATA[<211>  17]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  23]]>
          caaaaaacag taggtcc                                                      17
          <![CDATA[<210>  24]]>
          <![CDATA[<211>  17]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  24]]>
          gagggaggtg gagcgtt                                                      17
          <![CDATA[<210>  25]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  25]]>
          agctttatta taacttgaat                                                   20
          <![CDATA[<210>  26]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  26]]>
          ttttacatac tctggtcaaa                                                   20
          <![CDATA[<210>  27]]>
          <![CDATA[<211>  18]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  27]]>
          ttttacatac tctggtca                                                     18
          <![CDATA[<210>  28]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  28]]>
          gagaatttta catactctgg                                                   20
          <![CDATA[<210>  29]]>
          <![CDATA[<211>  19]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  29]]>
          gcatccaaca agtaattgt                                                    19
          <![CDATA[<210>  30]]>
          <![CDATA[<211>  16]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  30]]>
          ggtgggtgga tgtttc                                                       16
          <![CDATA[<210>  31]]>
          <![CDATA[<211>  16]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  31]]>
          ggtggtgtgg agaagc                                                       16
          <![CDATA[<210>  32]]>
          <![CDATA[<211>  18]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  32]]>
          ggcatccaac aagtaatt                                                     18
          <![CDATA[<210>  33]]>
          <![CDATA[<211>  18]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  33]]>
          ggaataaaac agtaggtc                                                     18
          <![CDATA[<210>  34]]>
          <![CDATA[<211>  17]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  34]]>
          gccattttca ctgtcaa                                                      17
          <![CDATA[<210>  35]]>
          <![CDATA[<211>  19]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  35]]>
          gtgcagaagt cagaacaaa                                                    19
          <![CDATA[<210>  36]]>
          <![CDATA[<211>  19]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  36]]>
          caaaatgccc ttacagtga                                                    19
          <![CDATA[<210>  37]]>
          <![CDATA[<211>  17]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  37]]>
          ggaataaaac agtaggt                                                      17
          <![CDATA[<210>  38]]>
          <![CDATA[<211>  17]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  38]]>
          aattttacat actctgg                                                      17
          <![CDATA[<210>  39]]>
          <![CDATA[<211>  16]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  寡核苷酸]]>
          <![CDATA[<400>  39]]>
          aattttacat actctg                                                       16
          <![CDATA[<210>  40]]>
          <![CDATA[<211>  17]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  寡核苷酸]]>
          <![CDATA[<400>  40]]>
          ttacatactc tggtcaa                                                      17
          <![CDATA[<210>  41]]>
          <![CDATA[<211>  16]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  寡核苷酸]]>
          <![CDATA[<400>  41]]>
          ttacatactc tggtca                                                       16
          <![CDATA[<210>  42]]>
          <![CDATA[<211>  15]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  寡核苷酸]]>
          <![CDATA[<400>  42]]>
          ttacatactc tggtc                                                        15
          <![CDATA[<210>  43]]>
          <![CDATA[<211>  14]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  43]]>
          ttacatactc tggt                                                         14
          <![CDATA[<210>  44]]>
          <![CDATA[<211>  13]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  44]]>
          ttacatactc tgg                                                          13
          <![CDATA[<210>  45]]>
          <![CDATA[<211>  12]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  45]]>
          ttacatactc tg                                                           12
          <![CDATA[<210>  46]]>
          <![CDATA[<211>  18]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  46]]>
          gaattttaca tactctgg                                                     18
          <![CDATA[<210>  47]]>
          <![CDATA[<211>  17]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  47]]>
          gaattttaca tactctg                                                      17
          <![CDATA[<210>  48]]>
          <![CDATA[<211>  16]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  48]]>
          gaattttaca tactct                                                       16
          <![CDATA[<210>  49]]>
          <![CDATA[<211>  15]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  49]]>
          gaattttaca tactc                                                        15
          <![CDATA[<210>  50]]>
          <![CDATA[<211>  14]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  50]]>
          gaattttaca tact                                                         14
          <![CDATA[<210>  51]]>
          <![CDATA[<211>  13]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  51]]>
          gaattttaca tac                                                          13
          <![CDATA[<210>  52]]>
          <![CDATA[<211>  19]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  52]]>
          gaattttaca tactctggt                                                    19
          <![CDATA[<210>  53]]>
          <![CDATA[<211>  18]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  53]]>
          gaattttaca tactctgg                                                     18
          <![CDATA[<210>  54]]>
          <![CDATA[<211>  17]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  54]]>
          gaattttaca tactctg                                                      17
          <![CDATA[<210>  55]]>
          <![CDATA[<211>  16]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  55]]>
          gaattttaca tactct                                                       16
          <![CDATA[<210>  56]]>
          <![CDATA[<211>  15]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  56]]>
          gaattttaca tactc                                                        15
          <![CDATA[<210>  57]]>
          <![CDATA[<211>  14]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  57]]>
          gaattttaca tact                                                         14
          <![CDATA[<210>  58]]>
          <![CDATA[<211>  16]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  58]]>
          caaaaaacag taggtc                                                       16
          <![CDATA[<210>  59]]>
          <![CDATA[<211>  15]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  59]]>
          caaaaaacag taggt                                                        15
          <![CDATA[<210>  60]]>
          <![CDATA[<211>  14]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  60]]>
          caaaaaacag tagg                                                         14
          <![CDATA[<210>  61]]>
          <![CDATA[<211>  13]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  61]]>
          caaaaaacag tag                                                          13
          <![CDATA[<210>  62]]>
          <![CDATA[<211>  12]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  62]]>
          caaaaaacag ta                                                           12
          <![CDATA[<210>  63]]>
          <![CDATA[<211>  11]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  63]]>
          caaaaaacag t                                                            11
          <![CDATA[<210>  64]]>
          <![CDATA[<211>  16]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  64]]>
          gagggaggtg gagcgt                                                       16
          <![CDATA[<210>  65]]>
          <![CDATA[<211>  15]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  65]]>
          gagggaggtg gagcg                                                        15
          <![CDATA[<210>  66]]>
          <![CDATA[<211>  14]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  66]]>
          gagggaggtg gagc                                                         14
          <![CDATA[<210>  67]]>
          <![CDATA[<211>  13]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  67]]>
          gagggaggtg gag                                                          13
          <![CDATA[<210>  68]]>
          <![CDATA[<211>  13]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  68]]>
          gagggaggtg gag                                                          13
          <![CDATA[<210>  69]]>
          <![CDATA[<211>  11]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  反義寡核苷酸]]>
          <![CDATA[<400>  69]]>
          gagggaggtg g                                                            11
          <![CDATA[<210>  70]]>
          <![CDATA[<211>  24]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  引子]]>
          <![CDATA[<400>  70]]>
          gtttttcacc tctgcctaat catc                                              24
          <![CDATA[<210>  71]]>
          <![CDATA[<211>  23]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  引子]]>
          <![CDATA[<400>  71]]>
          gcaaaaagtt gcatggtgct ggt                                               23

Claims

一種反義寡核苷酸，其選自由以下所組成之反義寡核苷酸之群組： TTacatactctggtCAAA (SEQ ID NO: 5)、 AATTttacatactctgGT (SEQ ID NO: 3)、 AAttttacatactctGGTC (SEQ ID NO: 4) 及 CTttattataactTgaAtCTC (SEQ ID NO: 6)，其中大寫字母為 β-D-氧 LNA 核苷，小寫字母為 DNA 核苷，所有 LNA C 皆為 5-甲基胞嘧啶，且所有核苷間鍵結皆為硫代磷酸酯核苷間鍵結。
一種結合物，其包含如請求項 1 之反義寡核苷酸，以及至少一個共價連接至該反義寡核苷酸之結合物部分。
如請求項 2 之結合物，其中該至少一個結合物部分能夠結合至去唾液酸糖蛋白受體。
如請求項 2 或 3 之結合物，其中該結合物部分係選自圖 5 中之三價 GalNAc 部分中的一個。
如請求項 4 之結合物，其中該結合物部分為圖 5D 中之三價 GalNAc 部分，諸如圖 5D-1 或圖 5D-2 之三價 GalNAc 部分，或二者之混合物。
如請求項 2 至 5 中任一項之結合物，其包含位在該反義寡核苷酸與該結合物部分之間的連接子。
如請求項 6 之結合物，其中該連接子包含 2 至 5 個連續的磷酸二酯連接的核苷，或該連接子由 2 至 5 個連續的磷酸二酯連接的核苷組成。
一種結合物，其選自由以下所組成之群組：圖 1、圖 2、圖 3 及圖 4 所示之結合物。
一種如請求項 1 之反義寡核苷酸或如請求項 2 至 8 中任一項之結合物之醫藥上可接受之鹽。
一種醫藥組成物，其包含如請求項 1 之反義寡核苷酸、如請求項 2 至 8 中任一項之結合物或如請求項 9 之醫藥上可接受之鹽，以及醫藥上可接受之稀釋劑、溶劑、載劑、鹽及/或佐劑。
一種在表現 RTEL1 之標靶細胞中調節 RTEL1 表現之活體內或活體外方法，該方法包含向該細胞投予有效量之如請求項 1 之反義寡核苷酸、如請求項 2 至 8 中任一項之結合物、如請求項 9 之醫藥上可接受之鹽或如請求項 10 之醫藥組成物。
一種治療或預防疾病之方法，其包含向患有或易罹患該疾病之個體投予治療或預防有效量之如請求項 1 之反義寡核苷酸、如請求項 2 至 8 中任一項之結合物、如請求項 9 之醫藥上可接受之鹽或如請求項 10 之醫藥組成物，其中該疾病為 B 型肝炎病毒 (HBV) 感染，例如慢性 HBV 感染。
如請求項 1 之反義寡核苷酸、如請求項 2 至 8 中任一項之結合物、如請求項 9 之醫藥上可接受之鹽或如請求項 10 之醫藥組成物，其用於醫藥中。
如請求項 1 之反義寡核苷酸、如請求項 2 至 8 中任一項之結合物、如請求項 9 之醫藥上可接受之鹽或如請求項 10 之醫藥組成物，其用於治療或預防 B 型肝炎病毒 (HBV) 感染，例如慢性 HBV 感染。
一種如請求項 1 之反義寡核苷酸、如請求項 2 至 8 中任一項之結合物、如請求項 9 之醫藥上可接受之鹽或如請求項 10 之醫藥組成物用於製備藥物之用途，該藥物用於治療或預防 B 型肝炎病毒 (HBV) 感染，例如慢性 HBV 感染。