CN111699258A

CN111699258A - 用于调控pias4表达的寡核苷酸

Info

Publication number: CN111699258A
Application number: CN201980006014.5A
Authority: CN
Inventors: L·彼得森; P·哈格多恩
Original assignee: Roche Innovation Center Copenhagen AS
Current assignee: Roche Innovation Center Copenhagen AS
Priority date: 2018-01-10
Filing date: 2019-01-08
Publication date: 2020-09-22
Also published as: EP3737758A1; US20210095274A1; WO2019137883A1; JP2021511022A

Abstract

本发明涉及能够调控靶细胞中PIAS4的表达的反义寡核苷酸。该反义寡核苷酸与PIAS4前mRNA杂交。本发明进一步涉及该寡核苷酸的缀合物和使用该反义寡核苷酸治疗癌症,诸如胰腺癌,乳腺癌和肝纤维化的药学组合物和方法。

Description

用于调控PIAS4表达的寡核苷酸

发明领域

本发明涉及与PIAS4转录物互补的寡核苷酸(寡聚物)。此类寡核苷酸可用于减少细胞中的PIAS4转录物,导致对PIAS4的表达的调控。对PIAS4表达的调控对于一系列医学病症,诸如癌症或肝纤维化是有益的。

发明背景

激活的STAT蛋白质抑制剂4(PIAS4)作为E3型小泛素样修饰剂(SUMO)连接酶,稳定UBE2I和底物之间的相互作用,和作为SUMO拴系因子发挥功能。PIAS4在多种细胞途径中作为转录共调节剂发挥至关紧要作用,包括STAT途径,p53/TP53途径,Wnt途径和类固醇激素信号传导途径；介导CEBPA,PARK7,HERC2,MYB,TCF4和RNF168的SUMO化。在Wnt信号传导中,PIAS4经由促进它们的SUMO化来遏制LEF1且增强TCF4转录活性；而且,PIAS4增强MTA1的SUMO化且可能参与它的旁系同系物选择性SUMO化(见例如Yamamoto H.et al.,EMBO J.22:2047-2059(2003)；Dahle O.et al.,Eur.J.Biochem.270:1338-1348(2003)；SubramanianL.et al.,J.Biol.Chem.278:9134-9141(2003)；Shinbo Y.et al.,Cell DeathDiffer.13:96-108(2006)；Cong L.,J.Biol.Chem.286:43793-43808(2011)；和DanielsenJ.R.et al.,J.Cell Biol.197:179-187(2012))。

Chien et al.(2013)109,1795-1804公开了使用两种不同外显子特异性siRNA在PIAS4表达与正常胰腺相比升高的胰腺癌细胞系和肿瘤中遏制PIAS4基因表达。

PIAS4通过遏制SIRT1调节肝细胞中的促炎症转录。使用慢病毒投递靶向PIAS4的短发夹RNA(shRNA)而降低PIAS4通过恢复SIRT1表达PIAS4而削弱NASH小鼠中的肝炎症(Lina Sun et al.,Oncotarget,2016,7(28):42892-42903和Xu et al.,The Journal ofBiomedical Research,2016,30(6):496-501)。

使用siRNA的PIAS4消减降低乳腺癌细胞的生长,特别是在与直接AMPK激活剂A769662组合时,提示可能探索抑制AMPKa1 SUMO化来调控AMPK激活和由此遏制癌细胞生长(Yan et al.,Nature Communications,2015,6:8979)。

上述参考文献无一公开靶向PIAS4的单链反义寡核苷酸,特别是,它们没有公开靶向PIAS4基因中的内含子序列或重复序列的概念。

靶向相同RNA中的重复位点的反义寡核苷酸已经显示在体外转染实验的一些情况中具有增强的下调靶mRNA的效力。GCGR,STST3,MAPT,OGFR,和BOK RNA就是这种情况(Vickers et al.,PLOS one,October 2014,Volume 9,Issue 10)。WO 2013/120003也提到了通过重复靶向来调控RNA。

发明目的

PIAS4牵涉多种医学状况,诸如癌症和肝纤维化的进展。本发明提供能够在体内和在体外二者调控PIAS4 mRNA和蛋白质表达的反义寡核苷酸。特别是,在前mRNA水平靶向PIAS4的表达,其防止成熟PIAS4 mRNA形成。靶向重复位点的反义寡核苷酸具有与靶向相同靶序列内的单一区域的反义寡核苷酸相比更高的效力。相应地,本发明可以与标准护理疗法用于组合疗法,特别是癌症和肝纤维化的治疗。

发明概述

本发明提供与哺乳动物PIAS4核酸,诸如SEQ ID NO:1,2和/或3互补且靶向哺乳动物PIAS4核酸,诸如SEQ ID NO:1,2和/或3的反义寡核苷酸,及其用途。

本发明提供反义寡核苷酸,其包含与靶哺乳动物PIAS4核酸的内含子中存在的某些区域或序列互补的连续核苷酸序列。

本发明的化合物能够抑制表达哺乳动物PIAS4靶核酸的细胞中的该哺乳动物PIAS4靶核酸。

本发明提供一种靶向哺乳动物PIAS4靶核酸的反义寡核苷酸,及其体外和体内用途,和它们在药物中的用途。

相应地,在第一个方面,本发明提供一种长度为10至50个核苷酸的反义寡核苷酸,其包含与选自由SEQ ID NO:1和3,或其天然发生变体组成的组的哺乳动物PIAS4靶核酸具有至少90％互补性,诸如完全互补的长度为10至30个核苷酸的连续核苷酸序列,其中该反义寡核苷酸能够降低细胞中该哺乳动物PIAS4靶核酸的表达。

在又一个方面,本发明提供该反义寡核苷酸,其中该连续核苷酸序列与哺乳动物PIAS4靶核酸的前mRNA(例如SEQ ID NO:1)中存在的内含子区至少90％互补,诸如完全互补。

在又一个方面,本发明提供反义寡核苷酸,其包含与SEQ ID NO:1和/或SEQ IDNO:3的靶核酸中存在的至少两个重复靶区具有至少90％互补性的长度为10至30个核苷酸的连续核苷酸序列。

在又一个方面,本发明提供反义寡核苷酸,其包含与SEQ ID NO:1的靶核酸的长度为10-22个,诸如14-20个核苷酸的靶区至少95％互补,诸如完全互补的连续核苷酸序列,其中该靶区跨越该靶核酸重复至少5次或更多次。

在又一个方面,本发明提供该反义寡核苷酸,其中该连续核苷酸序列与选自由SEQID NO:1的位置28478-28497,28540-28559,28816-28835,28910-28929,29024-29043；28478-28495,28540-28557,28696-28713,28816-28833,28910-28927,29024-29041；28482-28497,28544-28559,28820-28835,28914-28929,29028-29043；28484-28497,28546-28559,28822-28835,28916-28929,29030-29043；28142-28161,28144-28161,28145-28160,28147-28160组成的组的SEQ ID NO:1的区域至少90％互补,诸如完全互补。

在又一个方面,本发明提供该反义寡核苷酸,其中该反义寡核苷酸或其连续核苷酸序列选自由GgatgtgtgacggtgtggAC(化合物9_1)；ATgtgtgacggtgtgGAC(化合物10_1)；GGATgtgtgacggtGT(化合物11_1)；GGATgtgtgacGGT(化合物12_1)组成的组,其中大写字母代表LNA核苷,诸如β-D-氧基LNA核苷,小写字母代表DNA核苷,任选地,所有LNA C是5-甲基胞嘧啶,且至少一个,优选所有核苷间连接是硫代磷酸酯核苷间连接。

在又一个方面,本发明提供该反义寡核苷酸,其中该反义寡核苷酸或其连续核苷酸序列选自由GgatgtgtgacggtgtggAC(化合物9_1)；ATgtgtgacggtgtgGAC(化合物10_1)；GGATgtgtgacggtGT(化合物11_1)；GGATgtgtgacGGT(化合物12_1)组成的组；其中大写字母代表β-D-氧基LNA核苷,小写字母代表DNA核苷,所有LNAC是5-甲基胞嘧啶,且所有核苷间连接是硫代磷酸酯核苷间连接。

在又一个方面,本发明提供一种缀合物,其包含依照本发明的反义寡核苷酸,和至少一个共价附着至所述寡核苷酸的缀合物模块。

在又一个方面,本发明提供一种药学组合物,其包含依照本发明的反义寡核苷酸或依照本发明的缀合物,和药学可接受稀释剂,溶剂,载剂,盐和/或佐剂。

在又一个方面,本发明提供依照本发明的反义寡核苷酸或缀合物的药学可接受盐。

在又一个方面,本发明提供一种用于抑制表达哺乳动物PIAS4的靶细胞中的PIAS4表达的方法,所述方法包含以有效量将依照本发明的反义寡核苷酸,缀合物,药学可接受盐,或药学组合物施用于所述细胞。

在又一个方面,本发明提供一种用于治疗或预防疾病的方法,其包含将治疗或预防有效量的依照本发明的反义寡核苷酸,缀合物,药学可接受盐,或药学组合物施用于罹患或易感该疾病的受试者。

在又一个方面,本发明提供该反义寡核苷酸,该缀合物,该药学可接受盐,或该药学组合物用于制备用于治疗或预防癌症或肝纤维化的药物的用途。

定义

寡核苷酸

如本文中使用的术语“寡核苷酸”定义为技术人员一般将其理解为包含两个或更多个共价连接的核苷的分子。此类共价结合的核苷还可以称作核酸分子或寡聚物。寡核苷酸通常在实验室中通过固相化学合成来生成,继以纯化。在提及寡核苷酸的序列时,提及共价连接的核苷酸或核苷的核碱基模块或其修饰的序列或次序。本发明的寡核苷酸是人造的,而且是化学合成的,而且典型地是纯化的或分离的。本发明的寡核苷酸可包含一个或多个修饰的核苷或核苷酸。

反义寡核苷酸

如本文中使用的术语“反义寡核苷酸”定义为能够通过与靶核酸,特别是靶核酸上的连续序列杂交来调控靶基因的表达的寡核苷酸。反义寡核苷酸本质上不是双链的,而且因此不是siRNA或shRNA。优选地,本发明的反义寡核苷酸是单链的。理解的是,本发明的单链寡核苷酸能形成发夹或分子间双链体结构(相同寡核苷酸的两个分子之间的双链体),只要跨越寡核苷酸的全长自身内或间互补性的程度少于50％。有利地,本发明的反义寡核苷酸包含一个或多个修饰的核苷或核苷酸。

连续核苷酸序列

术语“连续核苷酸序列”指寡核苷酸中与靶核酸互补的区域。该术语在本文中与术语“连续核碱基序列”和术语“寡核苷酸基序序列”可互换使用。在一些实施方案中,寡核苷酸的所有核苷酸构成连续核苷酸序列。在一些实施方案中,寡核苷酸包含连续核苷酸序列,诸如F-G-F’缺口体区,而且可任选地包含一个或多个别的核苷酸,例如可用于将官能团附着至连续核苷酸序列的核苷酸接头区。核苷酸接头区可以是或不是与靶核酸互补的。

核苷酸

核苷酸是寡核苷酸和多核苷酸的构件块,而且出于本发明的目的包括天然发生和非天然发生核苷酸二者。在自然界中,核苷酸,诸如DNA和RNA核苷酸包含核糖糖模块,核碱基模块和一个或多个磷酸根基团(其在核苷中缺失)。核苷和核苷酸还可以可互换地称作“单元”或“单体”。

修饰的核苷

如本文中使用的术语“修饰的核苷”或“核苷修饰”指与等同的DNA或RNA核苷相比通过引入一处或多处糖模块或(核)碱基模块的修饰而修饰的核苷。在一个优选的实施方案中,修饰的核苷包含修饰的糖模块。术语修饰的核苷在本文中还可以与术语“核苷类似物”或修饰的“单元”或修饰的“单体”可互换使用。具有未修饰的DNA或RNA糖模块的核苷在本文中称作DNA或RNA核苷。如果它们容许Watson Crick碱基配对的话,具有DNA或RNA核苷的碱基区中的修饰的核苷一般仍然称作DNA或RNA。

修饰的核苷间连接

术语“修饰的核苷间连接”定义为技术人员一般理解为除了磷酸二酯(PO)连接以外将两个核苷共价偶联到一起的连接。本发明的寡核苷酸因此可包含修饰的核苷间连接。在一些实施方案中,修饰的核苷间连接与磷酸二酯连接相比提高寡核苷酸的核酸酶抗性。对于天然发生寡核苷酸,核苷间连接包括创建相邻核苷之间的磷酸二酯键的磷酸根基团。修饰的核苷间连接在稳定用于体内使用的寡核苷酸中特别有用,而且可用来在本发明的寡核苷酸中的DNA或RNA核苷的区域针对核酸酶切割提供保护,例如在缺口体寡核苷酸的缺口区内,以及在修饰的核苷的区域,诸如F和F’区中。

在一个实施方案中,寡核苷酸包含一个或多个自天然磷酸二酯修饰的核苷间连接,诸如例如一个或多个对核酸酶攻击更具抗性的修饰的核苷间连接。可以通过在血清中温育寡核苷酸或通过使用核酸酶抗性测定法(例如蛇毒磷酸二酯酶(SVPD))来测定核酸酶抗性,二者均是本领域公知的。能够增强寡核苷酸的核酸酶抗性的核苷间连接称作核酸酶抗性核苷间连接。在一些实施方案中,寡核苷酸或其连续核苷酸序列中至少50％的核苷间连接是修饰的,寡核苷酸或其连续核苷酸序列中诸如至少60％,诸如至少70％,诸如至少80％或诸如至少90％的核苷间连接是核酸酶抗性核苷间连接。在一些实施方案中,寡核苷酸或其连续核苷酸序列的所有核苷间连接是核酸酶抗性核苷间连接。会认识的是,在一些实施方案中,将本发明的寡核苷酸连接至非核苷酸官能团,诸如缀合物的核苷可以是磷酸二酯。

供本发明的寡核苷酸中使用的一种优选的修饰的核苷间连接是硫代磷酸酯。

由于核酸酶抗性,有益的药动学和容易制造,硫代磷酸酯核苷间连接是特别有用的。在一些实施方案中,寡核苷酸或其连续核苷酸序列中至少50％的核苷间连接是硫代磷酸酯,寡核苷酸或其连续核苷酸序列中诸如至少60％,诸如至少70％,诸如至少80％或诸如至少90％的核苷间连接是硫代磷酸酯。在一些实施方案中,不同于二硫代磷酸酯核苷间连接,寡核苷酸或其连续核苷酸序列的所有核苷间连接是硫代磷酸酯。在一些实施方案中,在二硫代磷酸酯连接以外,本发明的寡核苷酸包含硫代磷酸酯核苷间连接和至少一个磷酸二酯连接,诸如2,3或4个磷酸二酯连接二者。在缺口体寡核苷酸中,磷酸二酯连接在存在时适当地并非位于缺口区G中的连续DNA核苷之间。

核酸酶抗性连接,诸如硫代磷酸酯连接在能够在与靶核酸形成双链体时募集核酸酶的寡核苷酸区域,诸如缺口体的G区中是特别有用的。然而,硫代磷酸酯连接在非核酸酶募集区和/或亲和力增强区,诸如缺口体的F和F’区中也可能是有用的。在一些实施方案中,缺口体寡核苷酸可包含F或F’区,或F和F’区二者中的一个或多个磷酸二酯连接,其中G区中的核苷间连接可以完全是硫代磷酸酯。

有利的是,寡核苷酸的连续核苷酸序列中的所有核苷间连接或寡核苷酸的所有核苷间连接是硫代磷酸酯连接。

认识的是,如EP 2 742 135中公开的,反义寡核苷酸可包含其它核苷间连接(除了磷酸二酯和硫代磷酸酯以外),例如烷基膦酸酯/甲基膦酸酯核苷间连接,其依照EP 2 742135可能例如在其它情况下是DNA硫代磷酸酯的缺口区中得到耐受。

核碱基

术语核碱基包括核苷和核苷酸中存在的嘌呤(例如腺嘌呤和鸟嘌呤)和嘧啶(例如尿嘧啶,胸腺嘧啶和胞嘧啶)模块,其在核酸杂交中形成氢键。在本发明的语境中,术语核碱基还涵盖与天然发生核碱基不同,但在核酸杂交期间有功能的修饰的核碱基。在此语境中,“核碱基”指天然发生核碱基,诸如腺嘌呤,鸟嘌呤,胞嘧啶,胸腺嘧啶,尿嘧啶,黄嘌呤和次黄嘌呤,以及非天然发生变体二者。此类变体例如描述于Hirao et al.(2012)Accounts ofChemical Research,vol.45,page 2055和Bergstrom(2009)Current Protocols inNucleic Acid Chemistry,Suppl.37 1.4.1。

在一些实施方案中,核碱基模块是通过将嘌呤或嘧啶改变为修饰的嘌呤或嘧啶,诸如取代的嘌呤或取代的嘧啶,诸如选自异胞嘧啶,假异胞嘧啶,5-甲基胞嘧啶,5-噻唑基-胞嘧啶,5-丙炔基-胞嘧啶,5-丙炔基-尿嘧啶,5-溴尿嘧啶,5-噻唑基-尿嘧啶,2-硫-尿嘧啶,2’-硫-胸腺嘧啶,肌苷,二氨基嘌呤,6-氨基嘌呤,2-氨基嘌呤,2,6-二氨基嘌呤和2-氯-6-氨基嘌呤的核碱基而修饰的。

核碱基模块可以用每种相应核碱基的字母代码来表示,例如A,T,G,C或U,其中每种字母可任选包括功能等同的修饰的核碱基。例如,在例示的寡核苷酸中,核碱基模块选自A,T,G,C,和5-甲基胞嘧啶。任选地,对于LNA缺口体,可使用5-甲基胞嘧啶LNA核苷。

修饰的寡核苷酸

术语修饰的寡核苷酸描述包含一个或多个糖修饰的核苷和/或修饰的核苷间连接的寡核苷酸。术语“嵌合”寡核苷酸是在文献中已经用于描述具有修饰的核苷的寡核苷酸的术语。

互补性

术语“互补性”描述核苷/核苷酸的Watson-Crick碱基配对能力。Watson-Crick碱基对是鸟嘌呤(G)-胞嘧啶(C)和腺嘌呤(A)-胸腺嘧啶(T)/尿嘧啶(U)。会理解的是,寡核苷酸可包含具有修饰的核碱基的核苷,例如,常常使用5-甲基胞嘧啶代替胞嘧啶,而且为此术语互补性涵盖非修饰的和修饰的核碱基之间的Watson Crick碱基配对(见例如Hirao etal.(2012)Accounts of Chemical Research,vol.45,page 2055和Bergstrom(2009)Current Protocols in Nucleic Acid Chemistry,Suppl.37 1.4.1)。

如本文中使用的术语“％互补”指核酸分子(例如寡核苷酸)的连续核苷酸序列中跨越连续核苷酸序列与参照序列(例如靶序列或序列基序)互补的核苷酸的比例(以百分比计)。如此通过对两条序列之间互补(形成Watson Crick碱基对)的对齐核碱基的数目计数(当靶序列5’-3’和寡核苷酸序列3’-5’比对时),将该数目除以寡核苷酸中的核苷酸的总数并乘以100来计算互补性的百分比。在此类比较中,不对齐(形成碱基对)的核碱基/核苷酸称作错配。连续核苷酸序列的％互补性的计算中不容许插入和删除。会理解的是,在确定互补性时,忽略核碱基的化学修饰,只要核碱基形成Watson Crick碱基配对的功能能力得到保留(例如,为了计算％同一性的目的,认为5’-甲基胞嘧啶与胞嘧啶相同)。

术语“完全互补”指100％互补性。

下面是与靶核酸(SEQ ID NO:4)完全互补的寡核苷酸(SEQ ID NO:12)的一个例子。

5’GTCCACACCGTCACACATCC 3’(SEQ ID NO:4)

3’TGGCAGTGTGTAGG 5’(SEQ ID NO:12)

同一性

如本文中使用的术语“同一性”指核酸分子(例如寡核苷酸)中的连续核苷酸序列中跨越连续核苷酸序列与参照序列(例如序列基序)相同的核苷酸的比例(以百分比表述)。如此通过对两条序列(本发明的化合物的连续核苷酸序列中的和参照序列中的)之间相同(匹配)的对齐碱基计数,将该数目除以寡核苷酸中的核苷酸的总数并乘以100来计算同一性的百分比。因此,同一性的百分比＝(匹配x 100)/比对区域(例如连续核苷酸序列)的长度。在连续核苷酸序列的同一性的百分比的计算中不容许插入和删除。会理解的是,在确定同一性时,忽略核碱基的化学修饰,只要核碱基形成Watson Crick碱基配对的功能能力得到保留(例如,为了计算％同一性的目的,认为5-甲基胞嘧啶与胞嘧啶相同)。

杂交

如本文中使用的术语“杂交”要理解为两条核酸链(例如寡核苷酸和靶核酸)在相对链上的碱基对之间形成氢键,由此形成双链体。两条核酸链之间的结合的亲和力是杂交的强度。它常常以解链温度(T_m)来描述,定义为一半的寡核苷酸与靶核酸形成双链体时的温度。在生理条件下,T_m并不与亲和力严格成比例(Mergny and Lacroix,2003,Oligonucleotides,13:515-537)。标准状态的Gibbs自由能ΔG°是结合亲和力的一种更加精确的表示且通过ΔG°＝-RTln(K_d)与反应的解离常数(K_d)相关,其中R是气体常数且T是绝对温度。因此,寡核苷酸和靶核酸之间的反应的ΔG°很低反映寡核苷酸和靶核酸之间的杂交强。ΔG°是与其中水浓度为1M,pH为7,且温度为37℃的反应有关的能量。寡核苷酸对靶核酸的杂交是自发反应,而对于自发反应,ΔG°小于零。ΔG°可以通过实验来测量,例如通过使用如Hansen et al.,1965,Chem.Comm.36-38和Holdgate et al.,2005,Drug DiscovToday中描述的等温滴定量热法(ITC)方法。技术人员会知道,商用设备可用于ΔG°测量。ΔG°还可以使用适宜推导的由Sugimoto et al.,1995,Biochemistry,34:11211-11216和McTigue et al.,2004,Biochemistry,43:5388-5405描述的热力学参数通过使用如SantaLucia,1998,Proc Natl Acad Sci USA,95:1460-1465中描述的最近邻居模型在数值上估算。为了具有通过杂交来调控它的预定核酸靶的可能性,本发明的寡核苷酸以对于长度为10-30个核苷酸的寡核苷酸低于-10kcal的估算ΔG°值与靶核酸杂交。在一些实施方案中,通过标准状态Gibbs自由能ΔG°来测量杂交的程度或强度。寡核苷酸可以以对于长度为8-30个核苷酸的寡核苷酸低于-10kcal,诸如低于-15kcal,诸如低于-20kcal和诸如低于-25kcal的范围的估算ΔG°值与靶核酸杂交。在一些实施方案中,寡核苷酸以-10至-60kcal,诸如-12至-40,诸如-15至-30kcal或-16至-27kcal,诸如-18至-25kcal的估算ΔG°值与靶核酸杂交。

靶核酸

依照本发明,靶核酸是编码哺乳动物PIAS4且可以例如是基因,RNA,mRNA,和前mRNA,成熟mRNA或cDNA序列的核酸。靶因此可以称作PIAS4靶核酸。本发明的寡核苷酸可以例如靶向哺乳动物PIAS4的外显子区,或者可以例如靶向PIAS4前mRNA中的任何内含子区(见例如表1)。

表1:人PIAS4前mRNA中的外显子和内含子区

合适地,靶核酸编码PIAS4蛋白质,特别是哺乳动物PIAS4,诸如人PIAS4(见例如表2和3),其提供人和猴PIAS4的基因组序列,成熟mRNA和前mRNA序列。

在一些实施方案中,靶核酸选自由SEQ ID NO:1,2和3或其天然发生变体(例如编码哺乳动物PIAS4蛋白质的序列)组成的组。

在一些实施方案中,靶核酸可以是编码哺乳动物PIAS4蛋白质,诸如人PIAS4的RNA或DNA,诸如信使RNA,诸如成熟mRNA或前mRNA,例如人前mRNA序列,诸如作为SEQ ID NO:1公开的或如SEQ ID NO:2中公开的人成熟mRNA。

如果在研究或诊断中采用本发明的寡核苷酸的话,靶核酸可以是自DNA或RNA衍生的cDNA或合成核酸。

对于体内或体外应用,本发明的寡核苷酸典型地能够降低表达PIAS4靶核酸的细胞中PIAS4靶核酸的表达。本发明的寡核苷酸的核碱基的连续序列典型地与PIAS4靶核酸互补,如跨越寡核苷酸的长度测量的,任选地,一处或两处错配除外,且任选地排除可将寡核苷酸连接至任选的官能团,诸如缀合物的基于核苷酸的接头区,或其它非互补末端核苷酸(例如D’或D”区)。

关于跨越物种的PIAS4的基因组和装配的进一步信息在表2中提供,而前mRNA和mRNA的序列详情在表3中提供。

表2:跨越物种的关于PIAS4的基因组和装配信息

Fwd＝正向链。基因组坐标提供前mRNA序列(基因组序列)。

表3:跨越物种的PIAS4的序列详情

物种	RNA类型	长度(nt)	SEQ ID NO
				人	前mRNA	31741	1
人	mRNA	3159	2
				食蟹猴	前mRNA	30449	3*

注意:SEQ ID NO:3包含多个NNNNs的区域,其中测序未能精确精炼序列,而且因此包括简并序列。为了避免疑问,本发明的化合物与实际的靶序列互补且因此不是简并化合物。

靶序列

如本文中使用的术语“靶序列”指靶核酸中存在的包含与本发明的反义寡核苷酸互补的核碱基序列的核苷酸的序列。在一些实施方案中,靶序列由靶核酸上具有与本发明的反义寡核苷酸的连续核苷酸序列互补的核碱基序列的区域组成。靶核酸的这个区域可以可互换地称作靶核苷酸序列,靶序列或靶区。在一些实施方案中,靶序列比单一寡核苷酸的连续互补序列要长,而且可以例如代表靶核酸中可以受到本发明的数个寡核苷酸靶向的优选区域。

本发明的反义寡核苷酸包含与靶核酸,诸如本文中描述的靶序列互补的连续核苷酸序列。

在一些实施方案中,靶序列在人和猴之间是保守的,特别是SEQ ID NO:1和3二者中存在的序列。在一个优选的实施方案中,此类靶核酸序列在SEQ ID NO:4中存在。

寡核苷酸与之互补的靶序列一般包含至少10个核苷酸的连续核碱基序列。连续核苷酸序列介于10至50个核苷酸,诸如12至30个,诸如14至20个,诸如15至18个连续核苷酸之间。

在本发明的一个实施方案中,靶序列是SEQ ID NO:4。

在本发明的另一个实施方案中,靶序列是SEQ ID NO:13。

重复靶区

靶区或靶序列可以是对于靶核酸而言独特的(仅存在一次)。

在本发明的一些方面,靶区在靶核酸的跨度上重复至少两次。本发明涵盖的重复意味着有在靶核酸中在不同位置处发生的至少两段相同的长度为至少10个,诸如至少11个,或至少12个核苷酸的核苷酸序列(靶区)。每个重复靶区在靶核酸的连续序列上通过至少一个核碱基与相同区域分开且位于靶核酸内不同且不交叠的位置。

靶细胞

如本文中使用的术语“靶细胞”指表达靶核酸的细胞。在一些实施方案中,靶细胞可以在体内或在体外。在一些实施方案中,靶细胞是哺乳动物细胞,诸如啮齿动物细胞,诸如小鼠细胞或大鼠细胞,或灵长动物细胞,诸如猴细胞或人细胞。

在优选的实施方案中,靶细胞表达PIAS4 mRNA,诸如PIAS4前mRNA或PIAS4成熟mRNA。反义寡核苷酸靶向忽略PIAS4 mRNA的polyA尾。

天然发生变体

术语“天然发生变体”指PIAS4基因或转录物的变体,其与靶核酸源自相同的基因座且是与靶核酸来自相同染色体位置和方向的定向转录物,但是可以例如由于引起编码相同氨基酸的密码子的多重性的遗传密码的简并性,或由于前mRNA的可变剪接,或多态性,诸如单核苷酸多态性,和等位变体的存在而不同。基于足够的与寡核苷酸互补的序列的存在,本发明的寡核苷酸可因此靶向靶核酸及其天然发生变体。

在一些实施方案中,天然发生变体与哺乳动物PIAS4靶核酸,诸如选自由SEQ IDNO:1,2和3组成的组的靶核酸具有至少95％,诸如至少98％或至少99％同源性。

对表达的调控

如本文中使用的术语“对表达的调控”要理解为与施用寡核苷酸之前PIAS4的量相比寡核苷酸改变PIAS4的量的能力的总称。或者,对表达的调控可以通过参照对照实验来确定。一般理解的是,对照是用盐水组合物处理的靶细胞或用非靶向寡核苷酸(模拟)处理的靶细胞。

依照本发明的调控会理解为反义寡核苷酸抑制,下调,减轻,遏制,去除,停止,阻断,防止,减少,降低,避免或终止PIAS4的表达的能力,例如通过mRNA的降解或转录的阻断。

高亲和力修饰的核苷

高亲和力修饰的核苷是修饰的核苷酸,其在掺入寡核苷酸时增强寡核苷酸对它的互补靶的亲和力,例如如通过解链温度(T_m)测量的。本发明的高亲和力修饰的核苷优选导致解链温度升高+0.5至+12℃,更优选+1.5至+10℃和最优选+3至+8℃每个修饰的核苷。众多高亲和力修饰的核苷是本领域已知的且包括例如许多2’取代的核苷以及锁定的核酸(LNA)(见例如Freier and Altmann,Nucl.Acid Res.,1997,25,4429-4443和Uhlmann,Curr.Opinion in Drug Development,2000,3(2),293-213)。

糖修饰

本发明的寡聚物可包含一个或多个具有修饰的糖模块的核苷,即与在DNA和RNA中找到的核糖糖模块相比对糖模块的修饰。

已经生成了众多具有对核糖糖模块的修饰的核苷,主要目的是改进寡核苷酸的某些特性,诸如亲和力和/或核酸酶抗性。

此类修饰包括那些其中核糖环结构进行修饰的,例如通过用己糖环(HNA),或典型地具有核糖环上的C2和C4碳之间的双基桥的双环环(LNA),或典型地缺乏C2和C3碳之间的键的未连接核糖环(例如UNA)替换。其它糖修饰的核苷包括例如双环己糖核酸(WO2011/017521)或三环核酸(WO2013/154798)。修饰的核苷还包括其中糖模块用非糖模块替换的核苷,例如在肽核酸(PNA),或吗啉代核酸的情况中。

糖修饰还包括经由将核糖环上的取代基基团改变成除了氢以外的基团或在DNA和RNA核苷中天然找到的2’-OH基团而进行的修饰。例如,可以在2’,3’,4’或5’位置引入取代基。具有修饰的糖模块的核苷还包括2’修饰的核苷,诸如2’取代的核苷。确实,已经将很多焦点花在开发2’取代的核苷上,而且已经发现众多2’取代的核苷在掺入寡核苷酸时具有有益特性,诸如增强的核苷抗性和增强的亲和力。

2’修饰的核苷

2’糖修饰的核苷是在2’位置处具有除了H或-OH以外的取代基(2’取代的核苷)或包含2’连接双基的核苷,而且包括2’取代的核苷和LNA(2’-4’双基桥接)核苷。例如,2’修饰的糖可以对寡核苷酸提供增强的结合亲和力和/或升高的核酸酶抗性。2’取代的修饰的核苷的例子是2’-O-烷基-RNA,2’-O-甲基-RNA,2’-烷氧基-RNA,2’-O-甲氧基乙基-RNA(MOE),2’-氨基-DNA,2’-氟-RNA,和2’-F-ANA核苷。更多例子请见例如Freier and Altmann,Nucl.Acid Res.,1997,25,4429-4443；Uhlmann,Curr.Opinion in Drug Development,2000,3(2),293-213；和Deleavey and Damha,Chemistry and Biology,2012,19,937。下面是一些2’取代的修饰的核苷的例示。

锁定的核酸核苷(LNA)

“LNA核苷”是2’-修饰的核苷,其包含连接所述核苷的核糖糖环的C2’和C4’的双基(也称作“2’-4’桥”),其约束或锁定核糖环的构象。这些核苷在文献中也称作桥接核酸或双环核酸(BNA)。当LNA掺入互补RNA或DNA分子的寡核苷酸时,核糖的构象的锁定与增强的杂交亲和力有关(双链体稳定化)。这可以通过测量寡核苷酸/互补双链体的解链温度来例行确定。

非限制性的,例示性的LNA核苷公开于WO 99/014226,WO 00/66604,WO 98/039352,WO 2004/046160,WO 00/047599,WO 2007/134181,WO 2010/077578,WO 2010/036698,WO 2007/090071,WO 2009/006478,WO 2011/156202,WO 2008/154401,WO 2009/067647,WO 2008/150729,Morita et al.,Bioorganic&Med.Chem.Lett.12,73-76,Seth etal.,J.Org.Chem.2010,Vol.75(5),pp.1569-81和Mitsuoka et al.,Nucleic AcidsResearch,2009,37(4),1225-1238。

2’-4’桥包含2至4个桥接原子且特别是式-X-Y-,X连接至C4’且Y连接至C2’,

其中

X是氧,硫,-CR^aR^b-,-C(R^a)＝C(R^b)-,-C(＝CR^aR^b)-,-C(R^a)＝N-,-Si(R^a)₂-,-SO₂-,-NR^a-；-O-NR^a-,-NR^a-O-,-C(＝J)-,Se,-O-NR^a-,-NR^a-CR^aR^b-,-N(R^a)-O-或-O-CR^aR^b-；

Y是氧,硫,-(CR^aR^b)_n-,-CR^aR^b-O-CR^aR^b-,-C(R^a)＝C(R^b)-,-C(R^a)＝N-,-Si(R^a)₂-,-SO₂-,-NR^a-,-C(＝J)-,Se,-O-NR^a-,-NR^a-CR^aR^b-,-N(R^a)-O-或-O-CR^aR^b-；前提是-X-Y-不是-O-O-,-Si(R^a)₂-Si(R^a)₂-,-SO₂-SO₂-,-C(R^a)＝C(R^b)-C(R^a)＝C(R^b),-C(R^a)＝N-C(R^a)＝N-,-C(R^a)＝N-C(R^a)＝C(R^b)-,-C(R^a)＝C(R^b)-C(R^a)＝N-或-Se-Se-；

J是氧,硫,＝CH₂或＝N(R^a)；

R^a和R^b独立选自氢,卤素,羟基,氰基,硫羟基,烷基,取代的烷基,烯基,取代的烯基,炔基,取代的炔基,烷氧基,取代的烷氧基,烷氧基烷基,烯基氧基,羧基,烷氧基羰基,烷基羰基,甲酰基,芳基,杂环基,氨基,烷基氨基,氨甲酰基,烷基氨基羰基,氨基烷基氨基羰基,烷基氨基烷基氨基羰基,烷基羰基氨基,脲基,烷酰基氧基,磺酰基,烷基磺酰基氧基,硝基,叠氮基,硫羟基硫醚烷基硫烷基,芳基氧基羰基,芳基氧基,芳基羰基,杂芳基,杂芳基氧基羰基,杂芳基氧基,杂芳基羰基,-OC(＝X^a)R^c,-OC(＝X^a)NR^cR^d和-NR^eC(＝X^a)NR^cR^d；

或两个成双的R^a和R^b一些形成任选取代的亚甲基；

或两个成双的R^a和R^b与它们所附着的碳原子一起形成环烷基或卤代环烷基,仅具有-X-Y-的一个碳原子；

其中取代的烷基,取代的烯基,取代的炔基,取代的烷氧基和取代的亚甲基是被1至3个独立选自卤素,羟基,烷基,烯基,炔基,烷氧基,烷氧基烷基,烯基氧基,羧基,烷氧基羰基,烷基羰基,甲酰基,杂环基,芳基和杂芳基的取代基取代的烷基,烯基,炔基和亚甲基；

X^a是氧,硫或-NR^c；

R^c,R^d和R^e独立选自氢和烷基；且

n是1,2或3。

在本发明的又一个特定实施方案中,X是氧,硫,-NR^a-,-CR^aR^b-或-C(＝CR^aR^b)-,特别是氧,硫,-NH-,-CH₂-或-C(＝CH₂)-,更加特别是氧。

在本发明的另一个特定实施方案中,Y是-CR^aR^b-,-CR^aR^b-CR^aR^b-或-CR^aR^b-CR^aR^b-CR^aR^b-,特别是-CH₂-CHCH₃-,-CHCH₃-CH₂-,-CH₂-CH₂-或-CH₂-CH₂-CH₂-。

在本发明的一个特定实施方案中,-X-Y-是-O-(CR^aR^b)_n-,-S-CR^aR^b-,-N(R^a)CR^aR^b-,-CR^aR^b-CR^aR^b-,-O-CR^aR^b-O-CR^aR^b-,-CR^aR^b-O-CR^aR^b-,-C(＝CR^aR^b)-CR^aR^b-,-N(R^a)CR^aR^b-,-O-N(R^a)-CR^aR^b-或-N(R^a)-O-CR^aR^b-。

在本发明的一个特定实施方案中,R^a和R^b独立选自由氢,卤素,羟基,烷基和烷氧基烷基组成的组,特别是氢,卤素,烷基和烷氧基烷基。

在本发明的另一个实施方案中,R^a和R^b独立选自由氢,氟,羟基,甲基和-CH₂-O-CH₃组成的组,特别是氢,氟,甲基和-CH₂-O-CH₃。

有利地,-X-Y-的R^a和R^b之一如上文定义的且另一同时都是氢。

在本发明的又一个特定实施方案中,R^a是氢或烷基,特别是氢或甲基。

在本发明的另一个特定实施方案中,R^b是氢或烷基,特别是氢或甲基。

在本发明的一个特定实施方案中,R^a和R^b之一或二者是氢。

在本发明的一个特定实施方案中,R^a和R^b仅之一是氢。

在本发明的一个特定实施方案中,R^a和R^b之一是甲基且另一是氢。

在本发明的一个特定实施方案中,R^a和R^b同时均是甲基。

在本发明的一个特定实施方案中,-X-Y-是-O-CH₂-,-S-CH₂-,-S-CH(CH₃)-,-NH-CH₂-,-O-CH₂CH₂-,-O-CH(CH₂-O-CH₃)-,-O-CH(CH₂CH₃)-,-O-CH(CH₃)-,-O-CH₂-O-CH₂-,-O-CH₂-O-CH₂-,-CH₂-O-CH₂-,-C(＝CH₂)CH₂-,-C(＝CH₂)CH(CH₃)-,-N(OCH₃)CH₂-或-N(CH₃)CH₂-。

在本发明的一个特定实施方案中,-X-Y-是-O-CR^aR^b-,其中R^a和R^b独立选自由氢,烷基和烷氧基烷基组成的组,特别是氢,甲基和-CH₂-O-CH₃。

在一个特定实施方案中,-X-Y-是-O-CH₂-或-O-CH(CH₃)-,特别是-O-CH₂-。

2’-4’桥可以位于核糖环的平面下方(β-D-构型)或环的平面上方(α-L-构型),分别如式(A)和式(B)中图示的。

依照本发明的LNA核苷特别是式(A)或(B)的,

其中

W是氧,硫,-N(R^a)-或-CR^aR^b-,特别是氧；

B是核碱基或修饰的核碱基；

Z是与相邻核苷或5'末端基团的核苷间连接；

Z*是与相邻核苷或3'末端基团的核苷间连接；

R¹,R²,R³,R⁵和R^5*独立选自氢,卤素,烷基,卤代烷基,烯基,炔基,羟基,烷氧基,烷氧基烷基,叠氮基,烯基氧基,羧基,烷氧基羰基,烷基羰基,甲酰基和芳基；且

X,Y,R^a和R^b如上文定义的。

在一个特定实施方案中,在-X-Y-的定义中,R^a是氢或烷基,特别是氢或甲基。在另一个特定实施方案中,在-X-Y-的定义中,R^b是氢或烷基,特别是氢或甲基。在又一个特定实施方案中,在-X-Y-的定义中,R^a和R^b之一或二者是氢。在一个特定实施方案中,在-X-Y-的定义中,R^a和R^b仅之一是氢。在一个特定实施方案中,在-X-Y-的定义中,R^a和R^b之一是甲基且另一是氢。在一个特定实施方案中,在-X-Y-的定义中,R^a和R^b同时均是甲基。

在又一个特定实施方案中,在X的定义中,R^a是氢或烷基,特别是氢或甲基。在另一个特定实施方案中,在X的定义中,R^b是氢或烷基,特别是氢或甲基。在一个特定实施方案中,在X的定义中,R^a和R^b之一或二者是氢。在一个特定实施方案中,在X的定义中,R^a和R^b仅之一是氢。在一个特定实施方案中,在X的定义中,R^a和R^b之一是甲基且另一是氢。在一个特定实施方案中,在X的定义中,R^a和R^b同时均是甲基。

在又一个特定实施方案中,在Y的定义中,R^a是氢或烷基,特别是氢或甲基。在另一个特定实施方案中,在Y的定义中,R^b是氢或烷基,特别是氢或甲基。在一个特定实施方案中,在Y的定义中,R^a和R^b之一或二者是氢。在一个特定实施方案中,在Y的定义中,R^a和R^b仅之一是氢。在一个特定实施方案中,在Y的定义中,R^a和R^b之一是甲基且另一是氢。在一个特定实施方案中,在Y的定义中,R^a和R^b同时均是甲基。

在本发明的一个特定实施方案中,R¹,R²,R³,R⁵和R^5*独立选自氢和烷基,特别是氢和甲基。

在本发明的又一个特别有利的实施方案中,R¹,R²,R³,R⁵和R^5*同时均是氢。

在本发明的另一个特定实施方案中,R¹,R²,R³同时均是氢,R⁵和R^5*之一是氢且另一如上文定义的,特别是烷基,更加特别是甲基。

在本发明的一个特定实施方案中,R⁵和R^5*独立选自氢,卤素,烷基,烷氧基烷基和叠氮基,特别是氢,氟,甲基,甲氧基乙基和叠氮基。在本发明的特别有利的实施方案中,R⁵和R^5*之一是氢且另一是烷基,特别是甲基,卤素,特别是氟,烷氧基烷基,特别是甲氧基乙基或叠氮基；或R⁵和R^5*同时均是氢或卤素,特别是同时均是氢或氟。在此类特定实施方案中,W可以有利地是氧,且-X-Y-有利地是-O-CH₂-。

在本发明的一个特定实施方案中,-X-Y-是-O-CH₂-,W是氧且R¹,R²,R³,R⁵和R^5*同时均是氢。此类LNA核苷公开于WO 99/014226,WO 00/66604,WO 98/039352和WO 2004/046160,据此通过援引收录它们全部,而且包括本领域通常称作β-D-氧基LNA和α-L-氧基LNA核苷的。

在本发明的另一个特定实施方案中,-X-Y-是-S-CH₂-,W是氧且R¹,R²,R³,R⁵和R^5*同时均是氢。此类硫LNA核苷公开于WO 99/014226和WO 2004/046160,据此通过援引收录它们。

在本发明的另一个特定实施方案中,-X-Y-是-NH-CH₂-,W是氧且R¹,R²,R³,R⁵和R^5*同时均是氢。此类氨基LNA核苷公开于WO 99/014226和WO 2004/046160,据此通过援引收录它们。

在本发明的另一个特定实施方案中,-X-Y-是-O-CH₂CH₂-或-OCH₂CH₂CH₂-,W是氧,且R¹,R²,R³,R⁵和R^5*同时均是氢。此类LNA核苷公开于WO 00/047599和Morita et al.,Bioorganic&Med.Chem.Lett.12,73-76,通过援引收录它们,而且包括本领域通常称作2’-O-4’C-亚乙基桥接核酸(ENA)的。

在本发明的另一个特定实施方案中,-X-Y-是-O-CH₂-,W是氧,R¹,R²,R³同时均是氢,R⁵和R^5*之一是氢且另一不是氢,诸如烷基,例如甲基。此类5’取代的LNA核苷公开于WO2007/134181,据此通过援引收录它。

在本发明的另一个特定实施方案中,-X-Y-是-O-CR^aR^b-,其中R^a和R^b之一或二者不是氢,特别是烷基,诸如甲基,W是氧,R¹,R²,R³同时均是氢,R⁵和R^5*之一是氢且另一不是氢,特别是烷基,例如甲基。此类双修饰的LNA核苷公开于WO 2010/077578,据此通过援引收录它。

在本发明的另一个特定实施方案中,-X-Y-是-O-CHR^a-,W是氧且R¹,R²,R³,R⁵和R^5*同时均是氢。此类6’-取代的LNA核苷公开于WO 2010/036698和WO 2007/090071,据此通过援引收录它们二者。在此类6’-取代的LNA核苷中,R^a特别是C₁-C₆烷基,诸如甲基。

在本发明的另一个特定实施方案中,-X-Y-是-O-CH(CH₂-O-CH₃)-(“2’O-甲氧基乙基双环核酸”,Seth et al.,J.Org.Chem.2010,Vol.75(5),pp.1569-81)。

在本发明的另一个特定实施方案中,-X-Y-是-O-CH(CH₂CH₃)-(“2’O-乙基双环核酸”,Seth at al.,J.Org.Chem.2010,Vol 75(5),pp.1569-81)。

在本发明的另一个特定实施方案中,-X-Y-是-O-CH(CH₂-O-CH₃)-,W是氧且R¹,R²,R³,R⁵和R^5*同时均是氢。此类LNA核苷在本领域也称作环状MOE(cMOE)且公开于WO 2007/090071。

在本发明的另一个特定实施方案中,-X-Y-是-O-CH(CH₃)-。

在本发明的另一个特定实施方案中,-X-Y-是-O-CH₂-O-CH₂-(Seth et al.,J.Org.Chem.2010,同上)。

在本发明的另一个特定实施方案中,-X-Y-是-O-CH(CH₃)-,W是氧且R¹,R²,R³,R⁵和R^5*同时均是氢。此类6’-甲基LNA核苷在本领域也称作cET核苷,而且可以是(S)-cET或(R)-cET非对映异构体,如公开于WO 2007/090071(β-D)和WO 2010/036698(α-L),据此通过援引收录它们二者。

在本发明的另一个特定实施方案中,-X-Y-是-O-CR^aR^b-,其中R^a和R^b均不是氢,W是氧且R¹,R²,R³,R⁵和R^5*同时均是氢。在一个特定实施方案中,R^a和R^b同时均是烷基,特别是同时均是甲基。此类6’-二取代的LNA核苷公开于WO 2009/006478,据此通过援引收录它。

在本发明的另一个特定实施方案中,-X-Y-是-S-CHR^a-,W是氧且R¹,R²,R³,R⁵和R^5*同时均是氢。此类6’-取代的硫LNA核苷公开于WO 2011/156202,据此通过援引收录它。在此类6’-取代的硫LNA的一个特定实施方案中,R^a是烷基,特别是甲基。

在本发明的一个特定实施方案中,-X-Y-是-C(＝CH₂)C(R^aR^b)-,-C(＝CHF)C(R^aR^b)-或-C(＝CF₂)C(R^aR^b)-,W是氧且R¹,R²,R³,R⁵和R^5*同时均是氢。R^a和R^b有利地独立选自氢,卤素,烷基和烷氧基烷基,特别是氢,甲基,氟和甲氧基甲基。R^a和R^b特别是同时均是氢或甲基或R^a和R^b之一是氢且另一是甲基。此类乙烯基碳LNA核苷公开于WO 2008/154401和WO 2009/067647,据此通过援引收录它们二者。

在本发明的一个特定实施方案中,-X-Y-是-N(OR^a)-CH₂-,W是氧且R¹,R²,R³,R⁵和R^5*同时均是氢。在一个特定实施方案中,R^a是烷基,诸如甲基。此类LNA核苷也称作N取代的LNA且公开于WO 2008/150729,据此通过援引收录它。

在本发明的一个特定实施方案中,-X-Y-是-O-N(R^a)-,-N(R^a)-O-,-NR^a-CR^aR^b-CR^aR^b-或-NR^a-CR^aR^b-,W是氧且R¹,R²,R³,R⁵和R^5*同时均是氢。R^a和R^b有利地独立选自氢,卤素,烷基和烷氧基烷基,特别是氢,甲基,氟和甲氧基甲基。在一个特定实施方案中,R^a是烷基,诸如甲基,R^b是氢或甲基,特别是氢(Seth et al.,J.Org.Chem.2010,同上)。

在本发明的一个特定实施方案中,-X-Y-是-O-N(CH₃)-(Seth et al.,J.Org.Chem.2010,同上)。

在本发明的一个特定实施方案中,R⁵和R^5*同时均是氢。在本发明的另一个特定实施方案中,R⁵和R^5*之一是氢且另一是烷基,诸如甲基。在此类实施方案中,R¹,R²和R³可以特别是氢且-X-Y-可以特别是-O-CH₂-或-O-CHC(R^a)₃-,诸如-O-CH(CH₃)-。

在本发明的一个特定实施方案中,-X-Y-是-CR^aR^b-O-CR^aR^b-,诸如-CH₂-O-CH₂-,W是氧且R¹,R²,R³,R⁵和R^5*同时均是氢。在此类特定实施方案中,R^a可以特别是烷基,诸如甲基,R^b可以特别是氢或甲基,特别是氢。此类LNA核苷也称作构象约束核苷酸(CRN)且公开于WO2013/036868,据此通过援引收录它。

在本发明的一个特定实施方案中,-X-Y-是-O-CR^aR^b-O-CR^aR^b-,诸如-O-CH₂-O-CH₂-,W是氧且R¹,R²,R³,R⁵和R^5*同时均是氢。R^a和R^b有利地独立选自氢,卤素,烷基和烷氧基烷基,特别是氢,甲基,氟和甲氧基甲基。在此类特定实施方案中,R^a可以特别是烷基,诸如甲基,R^b可以特别是氢或甲基,特别是氢。此类LNA核苷也称作COC核苷酸且公开于Mitsuokaet al.,Nucleic Acids Research,2009,37(4),1225-1238,据此通过援引收录它。

除非另有规定,会认识的是,LNA核苷可以是β-D或α-L立体异构体。

本发明的LNA核苷的特定例子呈现于方案1(其中B如上文定义的)。

方案1

特定的LNA核苷是β-D-氧基-LNA,6’-甲基-β-D-氧基-LNA,诸如(S)-6’-甲基-β-D-氧基-LNA(ScET)和ENA。

如果本发明的起始材料或化合物之一含有在一个或多个反应步骤的反应条件下不稳定或具有反应性的一个或多个官能团的话,可以应用本领域公知的方法在关键步骤之前引入适宜的保护基团(如描述于例如“Protective Groups in Organic Chemistry”byT.W.Greene and P.G.M.Wuts,3rd Ed.,1999,Wiley,New York)。可以使用文献中描述的标准方法在合成的后期去除此类保护基团。保护基团的例子是叔丁氧基羰基(Boc),9-芴基甲基氨基甲酸酯(Fmoc),2-三甲基甲硅烷基乙基氨基甲酸酯(Teoc),羰基苄基氧基(Cbz)和对甲氧基苄基氧基羰基(Moz)。

本文中描述的化合物可含有数个不对称中心,而且可以以光学纯的对映异构物,对映异构物的混合物,诸如例如外消旋化合物,非对映异构体的混合物,非对映异构体外消旋化合物或非对映异构体外消旋化合物的混合物的形式存在。

术语“不对称碳原子”意味着具有四个不同取代基的碳原子。依照Cahn-Ingold-Prelog规则,不对称碳原子可以是“R”或“S”构型的。

化学基团定义

在本说明书中,单独或组合的术语“烷基”表示具有1至8个碳原子的直链或支链烷基基团,特别是具有1至6个碳原子的直或支链烷基基团和更加特别是具有1至4个碳原子的直或支链烷基基团。直链和支链C₁-C₈烷基基团的例子是甲基,乙基,丙基,异丙基,丁基,异丁基,叔丁基,异构的戊基,异构的己基,异构的庚基和异构的辛基,特别是甲基,乙基,丙基,丁基和戊基。烷基的特定例子是甲基,乙基和丙基。

单独或组合的术语“环烷基”表示具有3至8个碳原子的环烷基环和特别是具有3至6个碳原子的环烷基环。环烷基的例子是环丙基,环丁基,环戊基,环己基,环庚基和环辛基,更加特别是环丙基和环丁基。“环烷基”的特定例子是环丙基。

单独或组合的术语“烷氧基”表示式烷基-O-的基团,其中术语“烷基”具有先前给出的含义,诸如甲氧基,乙氧基,正丙氧基,异丙氧基,正丁氧基,异丁氧基,仲丁氧基和叔丁氧基。特定的“烷氧基”是甲氧基和乙氧基。甲氧基乙氧基是“烷氧基烷氧基”的特定例子。

单独或组合的术语“氧基”表示-O-基团。

单独或组合的术语“烯基”表示包含烯键和多至8个,优选多至6个,特别是优选多至4个碳原子的直链或支链烃残基。烯基基团的例子是乙烯基,1-丙烯基,2-丙烯基,异丙烯基,1-丁烯基,2-丁烯基,3-丁烯基和异丁烯基。

单独或组合的术语“炔基”表示包含三键和多至8个,优选多至6个,特别是优选多至4个碳原子的直链或支链烃残基。

单独或组合的术语“卤素”或“卤代”表示氟,氯,溴或碘,特别是氟,氯或溴,更加特别是氟。与另一个基团组合的术语“卤代”表示所述基团被至少一个卤素取代,特别被1-5个卤素,特别是1-4个卤素,即1,2,3或4个卤素取代。

单独或组合的术语“卤代烷基”表示被至少一个卤素取代的烷基基团,特别是被1-5个卤素,特别是1-3个卤素取代。卤代烷基的例子包括一氟,二氟或三氟甲基,乙基或丙基,例如3,3,3-三氟丙基,2-氟乙基,2,2,2-三氟乙基,氟甲基或三氟甲基。氟甲基,二氟甲基和三氟甲基是特定的“卤代烷基”。

单独或组合的术语“卤代环烷基”表示被至少一个卤素取代的如上文定义的环烷基基团,特别是被1-5个卤素,特别是1-3个卤素取代。“卤代环烷基”的特定例子是卤代环丙基,特别是氟环丙基,二氟环丙基和三氟环丙基。

单独或组合的术语“羟基”表示-OH基团。

单独或组合的术语“硫羟基”表示-SH基团。

单独或组合的术语“羰基”表示-C(O)-基团。

单独或组合的术语“羧基”表示-COOH基团。

单独或组合的术语“氨基”表示伯氨基基团(-NH₂),仲氨基基团(-NH-),或叔氨基基团(-N-)。

单独或组合的术语“烷基氨基”表示被1或2个如上文定义的烷基基团取代的如上文定义的氨基基团。

单独或组合的术语“磺酰基”表示-SO₂基团。

单独或组合的术语“亚磺酰基”表示-SO-基团。

单独或组合的术语“硫烷基”表示-S-基团。

单独或组合的术语“氰基”表示-CN基团。

单独或组合的术语“叠氮基”表示-N₃基团。

单独或组合的术语“硝基”表示-NO₂基团。

单独或组合的术语“甲酰基”表示-C(O)H基团。

单独或组合的术语“氨甲酰基”表示-C(O)NH₂基团。

单独或组合的术语“脲基”表示-NH-C(O)-NH₂基团。

单独或组合的术语“芳基”表示任选被1至3个独立选自卤素,羟基,烷基,烯基,炔基,烷氧基,烷氧基烷基,烯基氧基,羧基,烷氧基羰基,烷基羰基和甲酰基的取代基取代的,包含6至10个碳环原子的一价芳香族碳环单或双环环系统。芳基的例子包括苯基和萘基,特别是苯基。

单独或组合的术语“杂芳基”表示任选被1至3个独立选自卤素,羟基,烷基,烯基,炔基,烷氧基,烷氧基烷基,烯基氧基,羧基,烷氧基羰基,烷基羰基和甲酰基的取代基取代的,5至12个环原子的一价芳香族杂环单或双环环系统,其包含1,2,3或4个选自N,O和S的杂原子,剩余环原子是碳。杂芳基的例子包括吡咯基,呋喃基,噻吩基,咪唑基,噁唑基,噻唑基,三唑基,噁二唑基,噻二唑基,四唑基,吡啶基,吡嗪基,吡唑基,哒嗪基,嘧啶基,三嗪基,氮杂环庚烷基,二氮杂环庚烷基,异噁唑基,苯并呋喃基,异噻唑基,苯并噻吩基,吲哚基,异吲哚基,异苯并呋喃基,苯并咪唑基,苯并噁唑基,苯并异噁唑基,苯并噻唑基,苯并异噻唑基,苯并噁二唑基,苯并噻二唑基,苯并三唑基,嘌呤基,喹啉基,异喹啉基,喹唑啉基,喹噁啉基,咔唑基或吖啶基。

单独或组合的术语“杂环基”表示任选被1至3个独立选自卤素,羟基,烷基,烯基,炔基,烷氧基,烷氧基烷基,烯基氧基,羧基,烷氧基羰基,烷基羰基和甲酰基的取代基取代的,4至12个,特别是4至9个环原子的一价饱和或部分不饱和的单或双环环系统,其包含1,2,3或4个选自N,O和S的环杂原子,剩余环原子是碳。单环饱和杂环基的例子是氮杂环丁烷基,吡咯烷基,四氢呋喃基,四氢噻吩基,吡唑烷基,咪唑烷基,噁唑烷基,异噁唑烷基,噻唑烷基,哌啶基,四氢吡喃基,四氢噻喃基,哌嗪基,吗啉基,硫吗啉基,1,1-二氧代-硫吗啉-4-基,氮杂环庚烷基,二氮杂环庚烷基,高哌嗪基,或氧杂氮杂环庚烷基。双环饱和杂环烷基的例子是8-氮杂-双环[3.2.1]辛基,奎宁环基,8-氧杂-3-氮杂-双环[3.2.1]辛基,9-氮杂-双环[3.3.1]壬基,3-氧杂-9-氮杂-双环[3.3.1]壬基,或3-硫杂-9-氮杂-双环[3.3.1]壬基。部分不饱和的杂环烷基的例子是二氢呋喃基,咪唑啉基,二氢噁唑基,四氢吡啶基或二氢吡喃基。

药学可接受盐

术语“药学可接受盐”指不是在生物学上或在其它方面不想要的,保留游离碱或游离酸的生物学有效性和特性的那些盐。与无机酸,诸如氢氯酸,氢溴酸,硫酸,硝酸,磷酸,特别是氢氯酸,和有机酸,诸如乙酸,丙酸,乙醇酸,丙酮酸,草酸,马来酸,丙二酸,琥珀酸,富马酸,酒石酸,柠檬酸,苯甲酸,肉桂酸,扁桃酸,甲磺酸,乙磺酸,p-甲苯磺酸,水杨酸,N-乙酰基半胱氨酸形成盐。另外,可以通过将无机碱或有机碱添加至游离酸来制备这些盐。自无机碱衍生的盐包括但不限于钠,钾,锂,铵,钙,镁盐。自有机碱衍生的盐包括但不限于伯,仲,和叔胺,取代的胺,包括天然发生的取代的胺,环胺和碱性离子交换树脂,诸如异丙胺,三甲胺,二乙胺,三乙胺,三丙胺,乙醇胺,赖氨酸,精氨酸,N-乙基哌啶,哌啶,多胺树脂的盐。式(I)的化合物也可以以两性离子的形式存在。式(I)的化合物的特别优选的药学可接受盐是氢氯酸,氢溴酸,硫酸,磷酸和甲磺酸的盐。

保护基团

单独或组合的术语“保护基团”表示选择性封闭多官能化合物中的反应性位点,使得能在另一个未保护的反应性位点选择性进行化学反应的基团。可以去除保护基团。例示性保护基团是氨基保护基团,羧基保护基团或羟基保护基团。

核酸酶介导的降解

核酸酶介导的降解指在与此类序列形成双链体时能够介导互补核苷酸序列降解的寡核苷酸。

在一些实施方案中,寡核苷酸可经由核酸酶介导的靶核酸降解来发挥功能,其中本发明的寡核苷酸能够募集核酸酶,特别是内切核酸酶,优选内切核糖核酸酶(RNA酶),诸如RNA酶H。经由核酸酶介导的机制运作的寡核苷酸设计的例子是典型地包含至少5或6个DNA核苷的区域且一侧或两侧侧翼为亲和力增强性核苷的寡核苷酸,例如缺口体(gapmer),头体(headmer)和尾体(tailmer)。

RNA酶H活性和募集

反义寡核苷酸的RNA酶H活性指它在与互补RNA分子形成双链体时募集RNA酶H的能力。WO 01/23613提供用于测定RNA酶H活性的体外方法,其可用于测定募集RNA酶H的能力。典型地,如果在与互补靶核酸序列一起提供时具有使用与所测试的修饰的寡核苷酸具有相同碱基序列但只含有在寡核苷酸中的所有单体之间具有硫代磷酸酯连接的DNA单体的寡核苷酸,且使用由WO 01/23613(据此通过援引收录)的实施例91-95提供的方法学测定的初始速率的至少5％,诸如至少10％或多于20％的初始速率(如以pmol/l/min测量的)的话,认为寡核苷酸能够募集RNA酶H。供测定RNA酶H活性中使用,重组人RNA酶H1自Lubio ScienceGmbH(Lucerne,Switzerland)可得。

缺口体

本发明的反义寡核苷酸或其连续核苷酸序列可以是缺口体。反义缺口体常常用于经由RNA酶H介导的降解来抑制靶核酸。缺口体寡核苷酸包含至少三个独特的结构区,5’侧翼,缺口和3’侧翼,‘5->3’取向的F-G-F’。“缺口”区(G)包含使得寡核苷酸能够募集RNA酶H的一段连续DNA核苷酸。缺口区侧翼是包含一个或多个糖修饰的核苷,有利地是高亲和力糖修饰的核苷的5’侧翼区(F),和包含一个或多个糖修饰的核苷,有利地是高亲和力糖修饰的核苷的3’侧翼区(F’)。F和F’区中的一个或多个糖修饰的核苷增强寡核苷酸对靶核酸的亲和力(即,是亲和力增强性糖修饰的核苷)。在一些实施方案中,F和F’区中的一个或多个糖修饰的核苷是2’糖修饰的核苷,诸如高亲和力2’糖修饰,诸如独立选自LNA和2’-MOE。

在缺口体设计中,缺口区的最5’和3’核苷是DNA核苷,而且分别位置与5’(F)或3’(F’)区的糖修饰的核苷相邻。可以通过在最远离缺口区的末端,即在5’侧翼的5’末端和在3’侧翼的3’末端具有至少一个糖修饰的核苷来进一步定义侧翼。

F-G-F’区形成连续核苷酸序列。本发明的反义寡核苷酸或其连续核苷酸序列可包含式F-G-F’的缺口体区。

缺口体设计F-G-F’的总体长度可以是例如12至32个核苷,诸如13至24个,诸如14至22个核苷,诸如14至17个,诸如16至18个核苷。

举例而言,本发明的缺口体寡核苷酸可以用下式表示:

F_1-8-G_5-16-F’_1-8,诸如F_1-8-G_7-16-F’_2-8,

前提是缺口体区F-G-F’的总体长度是长度为至少12个,诸如至少14个核苷酸。

下面进一步定义F,G和F’区,而且可以并入F-G-F’式。

缺口体-G区

缺口体的G区(缺口区)是使得寡核苷酸能够募集RNA酶H,诸如人RNA酶H1的核苷,典型地是DNA核苷的区域。RNA酶H是识别DNA和RNA之间的双链体,并酶促切割RNA分子的细胞酶。合适地,缺口体可具有长度为至少5或6个连续DNA核苷,诸如5-16个连续DNA核苷,诸如6-15个连续DNA核苷,诸如7-14个连续DNA核苷,诸如8-12个连续DNA核苷酸,诸如8-12个连续DNA核苷酸的缺口区(G)。在一些实施方案中,缺口区G可以由6,7,8,9,10,11,12,13,14,15或16个连续DNA核苷组成。在一些情况中,缺口区中的胞嘧啶(C)DNA可以是甲基化的,此类残基或是注释为5-甲基-胞嘧啶(^meC)或是用E代替C。如果缺口中存在CG二核苷酸的话,缺口中的胞嘧啶DNA的甲基化对于降低潜在毒性是有利的,修饰对寡核苷酸的功效没有显著影响。

在一些实施方案中,缺口区G可以由6,7,8,9,10,11,12,13,14,15或16个连续硫代磷酸酯连接的DNA核苷组成。在一些实施方案中,缺口中的所有核苷间连接是硫代磷酸酯连接。

尽管传统的缺口体具有DNA缺口区,然而有在缺口区内使用时容许RNA酶H募集的修饰的核苷的众多例子。已经报告为在缺口区内包括时能够募集RNA酶H的修饰的核苷包括例如α-L-LNA,C4’烷基化DNA(如描述于PCT/EP2009/050349和Vester et al.,Bioorg.Med.Chem.Lett.18(2008)2296-2300,通过援引将二者收入本文),阿拉伯糖衍生的核苷,像ANA和2'F-ANA(Mangos et al.,2003,J.Am.Chem.Soc.125,654-661),UNA(未锁定的核酸)(如描述于Fluiter et al.,Mol.Biosyst.,2009,10,1039,通过援引收入本文)。UNA是未锁定的核酸,典型地其中已经去除核糖的C2和C3之间的键,形成未锁定的“糖”残基。此类缺口体中使用的修饰的核苷可以是在引入缺口区时采取2’向内(DNA样)结构的核苷,即容许RNA酶H募集的修饰。在一些实施方案中,本文中描述的DNA缺口区(G)可任选含有1至3个在引入缺口区时采取2’向内(DNA样)结构的糖修饰的核苷。

G区-“缺口破坏者”

或者,有将赋予3’向内构象的修饰的核苷插入缺口体的缺口区,同时保留一些RNA酶H活性的众多报告。具有包含一个或多个3’向内修饰的核苷的缺口区的此类缺口体称作“缺口破坏者”或“缺口断裂”缺口体,见例如WO2013/022984。缺口破坏者寡核苷酸在缺口区内保留足够的DNA核苷区域以容许RNA酶H募集。缺口破坏者寡核苷酸设计募集RNA酶H的能力典型地是序列或甚至化合物特异性的,见Rukov et al.,2015,Nucl.Acids Res.Vol.43,pp.8476-8487,其公开募集RNA酶H的“缺口破坏者”寡核苷酸,其在一些情况中提供更加特异性的对靶RNA的切割。缺口破坏者寡核苷酸的缺口区内使用的修饰的核苷可以是例如赋予3’向内构象的修饰的核苷,诸如2’-O-甲基(OMe)或2’-O-MOE(MOE)核苷,或β-D-LNA核苷(核苷的核糖糖环的C2’和C4’之间的桥处于β构象),诸如β-D-氧基LNA或ScET核苷。

就像含有上文描述的G区的缺口体,缺口破坏者或缺口破坏缺口体的缺口区具有缺口的5’末端(与F区的3’核苷相邻)处的DNA核苷和缺口的3’末端(与F’区的5’核苷相邻)处的DNA核苷。包含破坏缺口的缺口体典型地保留缺口区的5’末端或3’末端任一处的至少3或4个连续DNA核苷的区域。

缺口破坏者寡核苷酸的例示性设计包括

F_1-8-[D_3-4-E₁-D_3-4]_-F’_1-8

F_1-8-[D_1-4-E₁-D_3-4]-F’_1-8

F_1-8-[D_3-4-E₁-D_1-4]-F’_1-8

其中G区在方括号[D_n-E_r-D_m]内,D是DNA核苷的连续序列,E是修饰的核苷(缺口破坏者或缺口破坏核苷),而F和F’是如本文中定义的侧翼区,而且前提是缺口体区F-G-F’的总体长度是长度为至少12个,诸如至少14个核苷酸。

在一些实施方案中,缺口破坏缺口体的G区包含至少6个DNA核苷,诸如6,7,8,9,10,11,12,13,14,15或16个DNA核苷。如上文描述的,DNA核苷可以是连续的,或者可以任选是散布有一个或多个修饰的核苷,前提是缺口区G能够介导RNA酶H募集。

缺口体-侧翼区,F和F’

F区位置紧邻G区的5’DNA核苷。F区的最3’核苷是糖修饰的核苷,诸如高亲和力糖修饰的核苷,例如2’取代的核苷,诸如MOE核苷,或LNA核苷。

F’区位置紧邻G区的3’DNA核苷。F’区的最5’核苷是糖修饰的核苷,诸如高亲和力糖修饰的核苷,例如2’取代的核苷,诸如MOE核苷,或LNA核苷。

F区长度为1-8个连续核苷酸,诸如长度为2-6个,诸如3-4个连续核苷酸。有利地,F区的最5’核苷是糖修饰的核苷。在一些实施方案中,F区的两个最5’核苷是糖修饰的核苷。在一些实施方案中,F区的最5’核苷是LNA核苷。在一些实施方案中,F区的两个最5’核苷是LNA核苷。在一些实施方案中,F区的两个最5’核苷是2’取代的核苷,诸如两个3’MOE核苷。在一些实施方案中,F区的最5’核苷是2’取代的核苷,诸如MOE核苷。

F’区长度为2-8个连续核苷酸,诸如长度为3-6个,诸如4-5个连续核苷酸。有利地,F’区的最3’核苷是糖修饰的核苷。在一些实施方案中,F’区的两个最3’核苷是糖修饰的核苷。在一些实施方案中,F’区的两个最3’核苷是LNA核苷。在一些实施方案中,F’区的最3’核苷是LNA核苷。在一些实施方案中,F’区的两个最3’核苷是2’取代的核苷,诸如两个3’MOE核苷。在一些实施方案中,F’区的最3’核苷是2’取代的核苷,诸如MOE核苷。

应当注意,当F或F’区的长度为1时,它有利地是LNA核苷。

在一些实施方案中,F和F’区独立由糖修饰的核苷的连续序列组成或包含其。在一些实施方案中,F区的糖修饰的核苷可以独立选自2’-O-烷基-RNA单元,2’-O-甲基-RNA,2’-氨基-DNA单元,2’-氟-DNA单元,2’-烷氧基-RNA,MOE单元,LNA单元,阿拉伯糖核酸(ANA)单元和2’-氟-ANA单元。

在一些实施方案中,F和F’区独立包含LNA和2’取代的修饰的核苷二者(混合翼设计)。

在一些实施方案中,F和F’区由仅仅一种类型的糖修饰的核苷组成,诸如仅仅MOE或仅仅β-D-氧基LNA或仅仅ScET。此类设计也称作均匀侧翼或均匀缺口体设计。

在一些实施方案中,F或F’,或F和F’区的所有核苷是LNA核苷,诸如独立选自β-D-氧基LNA,ENA或ScET核苷。在一些实施方案中,F区由1-5个,诸如2-4个,诸如3-4个,诸如1,2,3,4或5个连续LNA核苷组成。在一些实施方案中,F和F’区的所有核苷是β-D-氧基LNA核苷。

在一些实施方案中,F或F’,或F和F’区的所有核苷是2’取代的核苷,诸如OMe或MOE核苷。在一些实施方案中,F区由1,2,3,4,5,6,7,或8个连续OMe或MOE核苷组成。在一些实施方案中,仅侧翼区之一可以由2’取代的核苷,诸如OMe或MOE核苷组成。在一些实施方案中,是5’(F)侧翼区由2’取代的核苷,诸如OMe或MOE核苷组成,而3’(F’)侧翼区包含至少一个LNA核苷,诸如β-D-氧基LNA核苷或cET核苷。在一些实施方案中,是3’(F’)侧翼区由2’取代的核苷,诸如OMe或MOE核苷组成,而5’(F)侧翼区包含至少一个LNA核苷,诸如β-D-氧基LNA核苷或cET核苷。

在一些实施方案中,F和F’区的所有修饰的核苷是LNA核苷,诸如独立选自β-D-氧基LNA,ENA或ScET核苷,其中F或F’,或F和F’区可以任选包含DNA核苷(交替侧翼,更多详情见这些的定义)。在一些实施方案中,F和F’区的所有修饰的核苷是β-D-氧基LNA核苷,其中F或F’,或F和F’区可以任选包含DNA核苷(交替侧翼,更多详情见这些的定义)。

在一些实施方案中,F和F’区的最5’和最3’核苷是LNA核苷,诸如β-D-氧基LNA核苷或ScET核苷。

在一些实施方案中,F区和G区之间的核苷间连接是硫代磷酸酯核苷间连接。在一些实施方案中,F’区和G区之间的核苷间连接是硫代磷酸酯核苷间连接。在一些实施方案中,F或F’,F和F’区的核苷之间的核苷间连接是硫代磷酸酯核苷间连接。

别的缺口体设计公开于WO 2004/046160,WO 2007/146511和WO 2008/113832,据此通过援引收录。

LNA缺口体

LNA缺口体是其中F和F’区之一或二者包含LNA核苷或由其组成的缺口体。β-D-氧基缺口体是其中F和F’区之一或二者包含β-D-氧基LNA核苷或由其组成的缺口体。

在一些实施方案中,LNA缺口体是式:[LNA]_1-5-[G区]-[LNA]_1-5,其中G区如缺口体G区定义中定义的。

MOE缺口体

MOE缺口体是其中F和F’区由MOE核苷组成的缺口体。在一些实施方案中,MOE缺口体是设计[MOE]_1-8-[G区]-[MOE]_1-8,诸如[MOE]_2-7-[G区]_5-16-[MOE]_2-7,诸如[MOE]_3-6-[G区]-[MOE]_3-6,其中G区如缺口体定义中定义的。具有5-10-5设计(MOE-DNA-MOE)的MOE缺口体已经在本领域广泛使用。

混合翼缺口体

混合翼缺口体是其中F和F’区之一或二者包含2’取代的核苷,诸如独立选自由2’-O-烷基-RNA单元,2’-O-甲基-RNA,2’-氨基-DNA单元,2’-氟-DNA单元,2’-烷氧基-RNA,MOE单元,阿拉伯糖核酸(ANA)单元和2’-氟-ANA单元组成的组的2’取代的核苷,诸如MOE核苷的LNA缺口体。在其中F和F’区至少之一或F和F’区二者包含至少一个LNA核苷的一些实施方案中,F和F’区的剩余核苷独立选自由MOE和LNA组成的组。在其中F和F’区至少之一或F和F’区二者包含至少两个LNA核苷的一些实施方案中,F和F’区的剩余核苷独立选自由MOE和LNA组成的组。在一些混合翼实施方案中,F和F’区之一或二者可进一步包含一个或多个DNA核苷。

混合翼缺口体设计公开于WO 2008/049085和WO 2012/109395,通过援引收录它们二者。

交替侧翼缺口体

侧翼区可包含LNA和DNA核苷二者且称作“交替侧翼”,因为它们包含LNA-DNA-LNA核苷的交替基序。包含此类交替侧翼的缺口体称作“交替侧翼缺口体”。“交替侧翼缺口体”因而是其中侧翼至少之一(F或F’)在LNA核苷以外包含DNA的LNA缺口体寡核苷酸。在一些实施方案中,F或F’区至少之一或F和F’区二者包含LNA核苷和DNA核苷二者。在此类实施方案中,侧翼区F或F’,或F和F’二者包含至少三个核苷,其中F和/或F’区的最5’和3’核苷是LNA核苷。

交替侧翼LNA缺口体公开于WO 2016/127002。

具有交替侧翼的寡核苷酸是其中侧翼至少之一(F或F’)在LNA核苷以外包含DNA的LNA缺口体寡核苷酸。在一些实施方案中,F或F’区至少之一或F和F’区二者包含LNA核苷和DNA核苷二者。在此类实施方案中,侧翼区F或F’,或F和F’二者包含至少三个核苷,其中F和/或F’区的最5’和3’核苷是LNA核苷。

在一些实施方案中,F或F’区至少之一或F和F’区二者包含LNA核苷和DNA核苷二者。在此类实施方案中,侧翼区F或F’,或F和F’二者包含至少三个核苷,其中F或F’区的最5’和3’核苷是LNA核苷,等等。包含LNA和DNA核苷二者的侧翼区称作交替侧翼,因为它们包含LNA-DNA-LNA核苷的交替基序。交替侧翼LNA缺口体公开于WO 2016/127002。

交替侧翼区可包含多至3个连续DNA核苷,诸如1至2个,或1,2或3个连续DNA核苷。

交替侧翼可以注释为一系列整数,代表LNA核苷(L)的数目,继以DNA核苷(D)的数目,例如

[L]_1-3-[D]_1-4-[L]_1-3

[L]_1-2-[D]_1-2-[L]_1-2-[D]_1-2-[L]_1-2

在寡核苷酸设计中,这些常常会用数目代表,诸如2-2-1代表5’[L]₂-[D]₂-[L]3’,而1-1-1-1-1代表5’[L]-[D]-[L]-[D]-[L]3’。具有交替侧翼的寡核苷酸中侧翼(F和F’区)的长度可以独立是3至10个核苷,诸如4至8个,诸如5至6个核苷,诸如4,5,6或7个修饰的核苷。在一些实施方案中,缺口体寡核苷酸中的侧翼仅之一是交替的,而另一由LNA核苷酸构成。在3’侧翼(F’)的3’末端具有至少两个LNA核苷对于赋予另外的外切核酸酶抗性可能是有利的。具有交替侧翼的寡核苷酸的一些例子是:

[L]_1-5-[D]_1-4-[L]_1-3-[G]_5-16-[L]_2-6

[L]_1-2-[D]_1-2-[L]_1-2-[D]_1-2-[L]_1-2-[G]_5-16-[L]_1-2-[D]_1-3-[L]_2-4

[L]_1-5-[G]_5-16-[L]-[D]-[L]-[D]-[L]₂

前提是缺口体的总体长度是长度为至少12个,诸如至少14个核苷酸。

寡核苷酸中的D’或D”区

在一些实施方案中,本发明的寡核苷酸可包含与靶核酸互补的寡核苷酸的连续核苷酸序列,诸如缺口体F-G-F’,和别的5’和/或3’核苷或由其组成。别的5’和/或3’核苷可以是或不是与靶核酸完全互补的。此类别的5’和/或3’核苷在本文中可称作D’和D”区。

D’或D”区的添加可用于将连续核苷酸序列,诸如缺口体连接至缀合物模块或另一个官能团的目的。当用于连接连续核苷酸序列与缀合物模块时,它可充当生物可切割接头。或者,它可用于提供外切核酸酶保护或使合成或制造变得容易。

D’和D”区可附着于F区的5’末端或F’区的3’末端,分别生成下式D’-F-G-F’,F-G-F’-D”或D’-F-G-F’-D”的设计。在这种情况中,F-G-F’是寡核苷酸的缺口体部分,而D’或D”区构成寡核苷酸的分开部分。

D’或D”区可独立包含可以与靶核酸互补或不互补的1,2,3,4或5个另外的核苷酸或由其组成。与F或F’区相邻的核苷酸不是糖修饰的核苷酸,诸如DNA或RNA或这些的碱基修饰型式。D’或D”区可充当核酸酶易感性生物可切割接头(见接头的定义)。在一些实施方案中,另外的5’和/或3’末端核苷酸是以磷酸二酯连接连接的,而且是DNA或RNA。适合用作D’或D”区的基于核苷酸的生物可切割接头公开于WO 2014/076195,其包括例如磷酸二酯连接的DNA二核苷酸。多-寡核苷酸构建物中生物可切割接头的使用公开于WO2015/113922,其中它们用于在单个寡核苷酸内连接多个反义构建物(例如缺口体区)。

在一个实施方案中,本发明的寡核苷酸在构成缺口体的连续核苷酸序列以外包含D’和/或D”区。

在一些实施方案中,本发明的寡核苷酸可以以下式表示:

F-G-F’,特别是F_1-8-G_5-16-F’_2-8

D’-F-G-F’,特别是D’_1-3-F_1-8-G_5-16-F’_2-8

F-G-F’-D”,特别是F_1-8-G_5-16-F’_2-8-D”_1-3

D’-F-G-F’-D”,特别是D’_1-3-F_1-8-G_5-16-F’_2-8-D”_1-3

在一些实施方案中,位于D’区和F区之间的核苷间连接是磷酸二酯连接。在一些实施方案中,位于F’区和D”区之间的核苷间连接是磷酸二酯连接。

缀合物

如本文中使用的术语缀合物指与非核苷酸模块(缀合物模块或C区或第三区)共价连接的寡核苷酸。

本发明的寡核苷酸对一个或多个非核苷酸模块的缀合可改善寡核苷酸的药理学,例如通过影响寡核苷酸的活性,细胞分布,细胞摄取或稳定性。在一些实施方案中,缀合物模块通过改善寡核苷酸的细胞分布,生物利用度,代谢,排泄,通透性,和/或细胞摄取来修饰或增强寡核苷酸的药动学特性。特别是,缀合物可将寡核苷酸靶向特定器官,组织或细胞类型并由此增强寡核苷酸在该器官,组织或细胞类型中的有效性。同时,缀合物可用来降低寡核苷酸在非靶细胞类型,组织或器官中的活性,例如脱靶活性或在非靶细胞类型,组织或器官中的活性。WO 93/07883和WO 2013/033230提供了合适的缀合物模块,通过援引收录它们。别的合适的缀合物模块是那些能够结合无唾液酸糖蛋白受体(ASGPr)的。特别是,三价N-乙酰基半乳糖胺缀合物模块适合于结合ASGPr,见例如WO 2014/076196,WO 2014/207232和WO 2014/179620(据此通过援引收录,特别是WO 2014/076196的图13或WO2014/179620的权利要求158-164)。

寡核苷酸缀合物和它们的合成还已经在全面综述中报告,Manoharan,AntisenseDrug Technology,Principles,Strategies,and Applications,S.T.Crooke,ed.,Ch.16,Marcel Dekker,Inc.,2001和Manoharan,Antisense and Nucleic Acid DrugDevelopment,2002,12,103,通过援引将其每一篇完整收入本文。

在一个实施方案中,非核苷酸模块(缀合物模块)选自由碳水化合物,细胞表面受体配体,药物物质,激素,亲脂性物质,聚合物,蛋白质,肽,毒素(例如细菌毒素),维生素,病毒蛋白质(例如衣壳)或其组合组成的组。

接头

连接或接头是两个原子之间的联系,经由一个或多个共价键连接一个感兴趣化学基团或区段与另一个感兴趣化学基团或区段。缀合物模块可直接或经由连接模块(例如接头或系链)附着于寡核苷酸。接头用来共价连接第三区,例如缀合物模块(C区)与第一区,例如与靶核酸互补的寡核苷酸或连续核苷酸序列(A区),由此连接A区的末端之一与C。

在本发明的一些实施方案中,本发明的缀合物或寡核苷酸缀合物可任选包含位于与靶核酸互补的寡核苷酸或连续核苷酸序列(A区或第一区)和缀合物模块(C区或第三区)之间的接头区(第二区或B区和/或Y区)。

B区指包含在正常情况下遭遇的或与在哺乳动物身体内遭遇的条件类似的条件下可切割的生理学上不稳定的键或由其组成的生物可切割接头。生理学上不稳定的接头经历化学转化(例如切割)的条件包括在哺乳动物细胞中找到的或与在哺乳动物细胞中遭遇的那些类似的化学条件,诸如pH,温度,氧化性或还原性条件或药剂,和盐浓度。哺乳动物细胞内条件还包括正常情况下在哺乳动物细胞中存在的酶活性的存在,诸如蛋白水解酶或水解酶或核酸酶。在一个实施方案中,生物可切割接头对S1核酸酶切割易感。在一个优选的实施方案中,核酸酶易感性接头包含1至10个核苷,诸如1,2,3,4,5,6,7,8,9或10个核苷,更优选2至6个核苷,最优选2至4个连接的核苷,包含至少两个连续磷酸二酯连接,诸如至少3或4或5个连续磷酸二酯连接。优选地,核苷是DNA或RNA。含有磷酸二酯的生物可切割接头更加详细地描述于WO2014/076195(据此通过援引收录)。

还可以经由非生物可切割接头将缀合物连接至寡核苷酸,或者在一些实施方案中,缀合物可包含共价附着至生物可切割接头的不可切割接头(Y区)。并非必然生物可切割但主要用来共价连接缀合物模块(C区或第三区)与寡核苷酸(A区或第一区)的接头可包含链结构或重复单元,诸如乙二醇,氨基酸单元或氨基烷基基团的寡聚物。本发明的寡核苷酸缀合物可以用下面的区域元件构建:A-C,A-B-C,A-B-Y-C,A-Y-B-C或A-Y-C。在一些实施方案中,不可切割接头(Y区)是氨基烷基,诸如C2至C36氨基烷基基团,包括例如C6至C12氨基烷基基团。在一个优选的实施方案中,接头(Y区)是C6氨基烷基基团。缀合物接头基团可经由使用氨基修饰的寡核苷酸和缀合物基团上的活化的酯基团例行附着至寡核苷酸。

治疗

如本文中使用的术语“治疗”指治疗现有的疾病(例如如本文中提到的疾病或病症)或预防疾病(即防范)二者。因此会认识的是,如本文中提到的治疗在一些实施方案中可以是预防性的。

发明详述

本发明的寡核苷酸

本发明涉及能够抑制PIAS4的表达的寡核苷酸。可以通过与编码PIAS4或牵涉调节PIAS4的靶核酸杂交来实现抑制。靶核酸可以是哺乳动物PIAS4序列,诸如选自由SEQ IDNO:1,2和3组成的组的序列。

本发明的寡核苷酸是靶向PIAS4的反义寡核苷酸。

在一些实施方案中,本发明的反义寡核苷酸能够通过抑制或降低靶标表达来调控靶标的表达。优选地,此类表达抑制是与靶标的正常表达水平相比至少20％,更加优选地与靶标的正常表达水平相比至少30％,40％,50％,60％,70％,80％,90％或95％抑制。在一些实施方案中,本发明的寡核苷酸可能能够在体外使用HeLa细胞将PIAS4 mRNA的表达水平抑制至少60％或70％。在一些实施方案中,本发明的化合物可能能够在体外使用HeLa细胞将PIAS4蛋白质的表达水平抑制至少50％。合适地,实施例提供可用于测量PIAS4 RNA或蛋白质抑制的测定法(例如实施例1)。通过寡核苷酸的连续核苷酸序列和靶核酸之间的杂交触发靶标调控。在一些实施方案中,本发明的寡核苷酸包含寡核苷酸和靶核酸之间的错配。尽管错配,与靶核酸的杂交可能仍然足以显示期望的对PIAS4表达的调控。错配导致的降低的结合亲和力可能通过增加寡核苷酸中核苷酸的数目和/或增加寡核苷酸序列内存在的能够提高对靶物的结合亲和力的修饰的核苷,诸如2’糖修饰的核苷,包括LNA的数目有利地得到补偿。

本发明的一个方面涉及一种长度为10至50个,诸如10至30个核苷酸的反义寡核苷酸,其包含与哺乳动物PIAS4编码靶核酸具有至少90％互补性,诸如完全互补性的长度为10至30个核苷酸的连续核苷酸序列,其中反义寡核苷酸能够降低细胞中哺乳动物PIAS4编码靶核酸的表达。

本发明的一个方面涉及一种长度为10至30个核苷酸的反义寡核苷酸,其包含与哺乳动物PIAS4编码靶核酸具有至少90％互补性,诸如完全互补性的长度为10至22个核苷酸的连续核苷酸序列,其中反义寡核苷酸能够降低细胞中哺乳动物PIAS4编码靶核酸的表达。

本发明的另一个方面涉及依照本发明的反义寡核苷酸,其中该连续核苷酸序列与哺乳动物PIAS4编码靶核酸的前mRNA(例如SEQ ID NO:1)中存在的内含子区至少90％互补,诸如完全互补。

在一些实施方案中,反义寡核苷酸包含与靶核酸或靶序列至少90％互补,诸如至少91％,诸如至少92％,诸如至少93％,诸如至少94％,诸如至少95％,诸如至少96％,诸如至少97％,诸如至少98％,或100％互补的连续序列。

在一个优选的实施方案中,本发明的反义寡核苷酸或其连续核苷酸序列与靶核酸或靶序列完全互补(100％互补),或者在一些实施方案中,可包含寡核苷酸和靶核酸之间的一处或两处错配。

本发明的另一个方面涉及反义寡核苷酸,其中连续核苷酸序列与选自由SEQ IDNO:1,2或3,或其天然发生变体组成的组的序列至少90％互补。

在一些实施方案中,寡核苷酸序列与SEQ ID NO:1和SEQ ID NO:3中存在的相应靶序列至少90％互补或至少95％互补,诸如完全互补。在一些实施方案中,反义寡核苷酸的连续序列与哺乳动物PIAS4靶核酸完全互补。

在一个优选的实施方案中,寡核苷酸序列是SEQ ID NO:1和SEQ ID NO:8中存在的相应靶序列或与SEQ ID NO:1和SEQ ID NO:8中存在的相应靶序列100％互补。在另一个实施方案中,寡核苷酸序列与SEQ ID NO:1至8中存在的相应靶核酸区100％互补。

本发明的另一个方面涉及反义寡核苷酸,其中连续核苷酸序列与哺乳动物PIAS4靶核酸的前mRNA(例如SEQ ID NO:1)中存在的内含子区至少90％互补,诸如完全互补。

应当理解,SEQ ID NO:1上的内含子位置可以根据PIAS4前mRNA的不同剪接而变化。在本发明的语境中,基因序列或前mRNA中在最终RNA产物(成熟mRNA)的成熟期间通过RNA剪接自前mRNA去除的任何核苷酸序列是内含子,不管它们在SEQ ID NO:1上的位置。表1提供SEQ ID NO:1中的最常见内含子区。

在一些实施方案中,连续核苷酸序列与选自内含子1(SEQ ID NO:1的143-5277)；内含子2(SEQ ID NO:1的5705-16390)；内含子3(SEQ ID NO:1的16476-20500)；内含子4(SEQ ID NO:1的20543-20864)；内含子5(SEQ ID NO:1的20956-21074)；内含子6(SEQ IDNO:1的21204-21285)；内含子7(SEQ ID NO:1的21390-25454)；内含子8(SEQ ID NO:1的25529-25774)；内含子9(SEQ ID NO:1的25936-29728)和内含子10(SEQ ID NO:1的29860-29970)的人PIAS4的前mRNA中存在的内含子区至少90％互补,诸如完全互补。

在一些实施方案中,本发明的反义寡核苷酸或其连续核苷酸序列与哺乳动物PIAS4靶核酸的人前mRNA的内含子9,例如哺乳动物PIAS4靶核酸的人前mRNA的核苷酸,例如SEQ ID NO:1的核苷酸25936-29728至少90％互补,诸如完全互补。

在一些实施方案中,本发明的反义寡核苷酸或其连续核苷酸序列与哺乳动物PIAS4靶核酸的人前mRNA的内含子9,例如哺乳动物PIAS4靶核酸的人前mRNA的核苷酸,例如SEQ ID NO:1的核苷酸28478-29043至少90％互补,诸如完全互补。

在一些实施方案中,连续核苷酸序列与SEQ ID NO:4至少90％互补,诸如完全互补。

在一些实施方案中,连续核苷酸序列与SEQ ID NO:13至少90％互补,诸如完全互补。

在一些实施方案中,寡核苷酸或连续核苷酸序列与靶核酸的一个区域互补,其中靶核酸区域选自由SEQ ID NO:1的位置28478-28497,28540-28559,28816-28835,28910-28929,29024-29043；28478-28495,28540-28557,28696-28713,28816-28833,28910-28927,29024-29041；28482-28497,28544-28559,28820-28835,28914-28929,29028-29043；28484-28497,28546-28559,28822-28835,28916-28929,29030-29043；28142-28161,28144-28161,28145-28160,28147-28160组成的组。

依照本发明的一个方面,靶序列在靶核酸内重复,即在靶核酸中在不同位置处存在至少两个相同的长度为至少10个核苷酸的靶核苷酸序列(靶区)。重复靶区一般是10至50个核苷酸,诸如11至30个核苷酸,诸如12至25个核苷酸,诸如13至22个核苷酸,诸如14至20个核苷酸,诸如15至19个核苷酸,诸如16至18个核苷酸。在一个优选的实施方案中,重复靶区是14至20个核苷酸。

在一个方面,本发明提供反义寡核苷酸,其中连续核苷酸序列与跨越SEQ ID NO:1的靶核酸重复至少2次的靶区至少90％互补,诸如完全互补。这样的效果是数个寡核苷酸化合物(具有相同序列)能与同一靶核酸上的一个或多个靶区杂交(同时),这在将寡核苷酸施用于细胞或动物或人时可导致对靶核酸的多个切割事件。

在一些实施方案中,寡核苷酸或连续核苷酸序列与重复靶区,至少3个重复靶区,诸如至少4,5,6,7,8,9或10个重复靶区,或多于10个重复靶区的靶区至少90％互补,诸如完全互补。

在又一个实施方案中,反义寡核苷酸包含与SEQ ID NO:1的靶核酸的长度为10-22个,诸如14-20个核苷酸的靶区至少90％互补,诸如完全互补的连续核苷酸序列,其中靶区跨越靶核酸的内含子重复至少2次或更多次。

在一些实施方案中,本发明的反义寡核苷酸或其连续核苷酸序列与SEQ ID NO:13中的至少5个重复靶区互补。

在一些实施方案中,本发明的寡核苷酸包含长度为10至35个核苷酸,诸如长度为10至30个,诸如11至22个,诸如12至20个,诸如14至18个或14至16个连续核苷酸或由其组成。有利地,寡核苷酸包含长度为14至20个核苷酸或由其组成。

要理解,本文中给出的任何范围包括范围端点。

在一些实施方案中,寡核苷酸或其连续核苷酸序列包含22个或更少核苷酸,诸如20个或更少核苷酸,诸如18个或更少核苷酸,诸如少于18个,诸如14,15,16或17个核苷酸或由其组成。

在一些实施方案中,本发明的连续核苷酸序列包含与选自由SEQ ID NO:9,10,11和12组成的组的序列具有至少90％同一性,诸如100％同一性的长度为10至30个核苷酸或由其组成。

在一些实施方案中,反义寡核苷酸或其连续核苷酸序列包含与选自SEQ ID NO:9,10,11和12的序列具有至少90％同一性,优选100％同一性的长度为12至20个连续核苷酸或由其组成。

在一些实施方案中,反义寡核苷酸或其连续核苷酸序列包含与选自SEQ ID NO:9,10,11和12的序列具有至少90％同一性,优选100％同一性的长度为14至20个连续核苷酸或由其组成。

在一些实施方案中,反义寡核苷酸或其连续核苷酸序列包含选自SEQ ID NO:9和10的序列。

在一些实施方案中,反义寡核苷酸或其连续核苷酸序列包含选自SEQ ID NO:11和12的序列。

寡核苷酸化合物呈现基序序列的具体设计。大写字母代表β-D-氧基LNA核苷,小写字母代表DNA核苷,所有LNA C是5-甲基胞嘧啶,5-甲基DNA胞嘧啶以“e”表示,且所有核苷间连接优选是硫代磷酸酯核苷间连接。理解的是,可以修饰连续核碱基序列(基序序列)以例如提高核酸酶抗性和/或对靶核酸的结合亲和力。修饰描述于定义和下面的段落。表4列举每一种基序序列的优选设计。

理解的是,可以修饰连续核碱基序列(基序序列)以例如提高核酸酶抗性和/或对靶核酸的结合亲和力。修饰描述于定义和下面的段落。表4列举每一种基序序列的优选设计。

其中修饰的核苷(诸如高亲和力修饰的核苷)掺入寡核苷酸序列的样式一般称作寡核苷酸设计。

本发明的寡核苷酸设计成有修饰的核苷和DNA核苷。有利地,使用高亲和力修饰的核苷。

在一个实施方案中,寡核苷酸包含至少1个修饰的核苷,诸如至少2个,至少3个,至少4个,至少5个,至少6个,至少7个,至少8个,至少9个,至少10个,至少11个,至少12个,至少13个,至少14个,至少15个或至少16个修饰的核苷。在一个实施方案中,寡核苷酸包含1至10个修饰的核苷,诸如2至9个修饰的核苷,诸如3至8个修饰的核苷,诸如4至7个修饰的核苷,诸如6或7个修饰的核苷。合适的修饰描述于“定义”部分“修饰的核苷”,“高亲和力修饰的核苷”,“糖修饰”,“2’糖修饰”和“锁定的核酸(LNA)”下。

在一个实施方案中,寡核苷酸包含一个或多个糖修饰的核苷,诸如2’糖修饰的核苷。优选地,本发明的寡核苷酸包含一个或多个独立选自由2’-O-烷基-RNA,2’-O-甲基-RNA,2’-烷氧基-RNA,2’-O-甲氧基乙基-RNA,2’-氨基-DNA,2’-氟-DNA,阿拉伯糖核酸(ANA),2’-氟-ANA和LNA核苷组成的组的2’糖修饰的核苷。有利的是,一个或多个修饰的核苷是锁定的核酸(LNA)。

在又一个实施方案中,寡核苷酸包含至少一个修饰的核苷间连接。合适的核苷间修饰描述于“定义”部分“修饰的核苷间连接”下。有利的是,连续核苷酸序列内至少75％,诸如所有核苷间连接是硫代磷酸酯核苷间连接。在一些实施方案中,寡核苷酸的连续序列中的所有核苷酸间连接是硫代磷酸酯连接。

在一些实施方案中,本发明的寡核苷酸包含至少一个LNA核苷,诸如1,2,3,4,5,6,7,或8个LNA核苷,诸如2至6个LNA核苷,诸如3至7个LNA核苷,4至8个LNA核苷,或3,4,5,6,7或8个LNA核苷。在一些实施方案中,寡核苷酸中至少75％的修饰的核苷是LNA核苷,诸如80％,诸如85％,诸如90％的修饰的核苷是LNA核苷。在仍有又一个实施方案中,寡核苷酸中的所有修饰的核苷是LNA核苷。在又一个实施方案中,寡核苷酸可包含β-D-氧基-LNA和一种或多种下述LNA核苷二者:硫-LNA,氨基-LNA,氧基-LNA,ScET和/或ENA,或是β-D或是α-L构型或其组合。在又一个实施方案中,所有LNA胞嘧啶单元是5-甲基-胞嘧啶。具有核苷酸序列的5’末端处的至少1个LNA核苷和3’末端处的至少2个LNA核苷对于寡核苷酸或连续核苷酸序列的核酸酶稳定性是有利的。

在本发明的一个实施方案中,本发明的寡核苷酸能够募集RNA酶H。

在本发明中,一种有利的结构设计是如“定义”部分中例如“缺口体”,“LNA缺口体”,“MOE缺口体”,“混合翼缺口体”和“交替侧翼缺口体”下描述的缺口体设计。缺口体设计包括具有均匀侧翼,混合翼侧翼,交替侧翼,和缺口破坏者设计的缺口体。在本发明中,有利的是,本发明的寡核苷酸是具有F-G-F’设计的缺口体。在一些实施方案中,缺口体是具有均匀侧翼的LNA缺口体。

在本发明的一些实施方案中,LNA缺口体选自下面的均匀侧翼设计1-17-2,2-13-3,4-10-2和4-7-3。

本发明的例示性化合物

在例示性寡核苷酸化合物中,大写字母代表β-D-氧基LNA核苷,小写字母代表DNA核苷,所有LNA C是5-甲基胞嘧啶,5-甲基DNA胞嘧啶以“e”或^mc表示,且所有核苷间连接是硫代磷酸酯核苷间连接。

对于本发明的一些实施方案,寡核苷酸选自具有CMP ID NO:9_1；10_1；11_1和12_1的寡核苷酸化合物的组。

在本发明的一个实施方案中,寡核苷酸是CMP ID NO:11_1或12_1。

制造方法

在又一个方面,本发明提供用于制造本发明的寡核苷酸的方法,其包含使核苷酸单元起反应并由此形成寡核苷酸中包含的共价连接的连续核苷酸单元。优选地,该方法使用亚磷酰胺(亚氨基磷酸酯,phosphoramidite)化学(见例如Caruthers et al.,1987,Methods in Enzymology vol.154,pages 287-313)。在又一个实施方案中,该方法进一步包含使连续核苷酸序列与缀合模块(配体)起反应。在又一个方面,提供用于制造本发明的组合物的方法,其包含混合本发明的寡核苷酸或缀合的寡核苷酸与药学可接受稀释剂,溶剂,载剂,盐和/或佐剂。

药学盐

在又一个方面,本发明提供反义寡核苷酸或其缀合物的药学可接受盐。在一个优选的实施方案中,药学可接受盐是钠或钾盐。

药学组合物

在又一个方面,本发明提供药学组合物,其包含任何上述寡核苷酸和/或寡核苷酸缀合物或其盐和药学可接受稀释剂,载剂,盐和/或佐剂。药学可接受稀释剂包括磷酸盐缓冲盐水(PBS),而药学可接受盐包括但不限于钠和钾盐。在一些实施方案中,药学可接受稀释剂是无菌磷酸盐缓冲盐水。在一些实施方案中,以50-300μM溶液的浓度在药学可接受稀释剂中使用寡核苷酸。

供本发明中使用的合适的配制剂可见于Remington's PharmaceuticalSciences,Mack Publishing Company,Philadelphia,Pa.,17th ed.,1985。对于用于药物投递的方法的简要综述,见例如Langer(Science 249:1527-1533,1990)。WO 2007/031091提供药学可接受稀释剂,载剂和佐剂的别的合适的和优选的例子(据此通过援引收录)。WO2007/031091中还提供合适的剂量,配制剂,施用路径,组合物,剂型,与其它治疗剂的组合,前药配制剂。

本发明的寡核苷酸或寡核苷酸缀合物可以与药学可接受活性或惰性物质混合以制备药学组合物或配制剂。组合物和用于配制药学组合物的方法取决于多项标准,包括但不限于施用的路径,疾病的程度,或要施用的剂量。

这些组合物可以通过常规灭菌技术来灭菌,或者可以无菌过滤。所得水溶液可以包装成原样使用,或冻干,冻干制剂在施用前与无菌水载剂组合。制剂的pH典型地会介于3和11之间,更优选地介于5和9之间或介于6和8之间,而且最优选地介于7和8之间,诸如7至7.5。所得固体形式的组合物可以包装成多个单剂单元,每个含有固定量的上述一种或多种药剂,诸如在片剂或胶囊剂的密封包装中。固体形式的组合物也可以包装在用于灵活数量的容器中,诸如在设计用于表面可应用乳膏剂或软膏剂的可挤压管中。

在一些实施方案中,本发明的寡核苷酸或寡核苷酸缀合物是前药。特别是就寡核苷酸缀合物而言,一旦前药投递至作用位点,例如靶细胞,就自寡核苷酸切割掉缀合物模块。

应用

可利用本发明的寡核苷酸作为研究试剂,用于例如诊断,治疗和预防。

在研究中,可使用此类寡核苷酸来特异性调控细胞(例如体外细胞培养物)和实验动物中PIAS4蛋白质的合成,由此推动靶物的功能分析或它作为治疗干预的靶标的有用性的评估。典型地,通过降解或抑制生成蛋白质的前mRNA或mRNA,由此阻止蛋白质形成或通过降解或抑制生成蛋白质的基因或mRNA的调控剂来实现靶物调控。可以通过靶向前mRNA,由此阻止成熟mRNA形成来实现别的优势。

本发明提供用于调控表达PIAS4的靶细胞中的PIAS4表达的体内或体外方法,所述方法包含以有效量将本发明的寡核苷酸施用于所述细胞。

在一些实施方案中,靶细胞是哺乳动物细胞,特别是人细胞。靶细胞可以是体外细胞培养物或哺乳动物中形成组织的部分的体内细胞。在优选的实施方案中,靶细胞存在于输精管中的细胞,颗粒细胞,癌细胞,诸如胰腺癌细胞和乳腺癌细胞或肝细胞,诸如肝星形细胞。

在诊断中,可使用寡核苷酸通过Northern印迹,原位杂交或类似技术来检测和量化细胞和组织中的PIAS4表达。

对于治疗,可以将寡核苷酸施用于怀疑具有可以通过调控PIAS4的表达来治疗的疾病或病症的动物或人。

本发明提供用于治疗或预防疾病的方法,其包含将治疗或预防有效量的本发明的寡核苷酸,寡核苷酸缀合物或药学组合物施用于罹患或易感疾病的受试者。

本发明还涉及如本文中定义的寡核苷酸,组合物或缀合物,供作为药物使用。

依照本发明的寡核苷酸,寡核苷酸缀合物或药学组合物典型地以有效量施用。

本发明还提供所描述的发明的寡核苷酸或寡核苷酸缀合物用于制造用于治疗病症,诸如本文中提到的病症的药物,或用于治疗如本文中提到的病症的方法的用途。

如本文中提到的疾病或病症与PIAS4的表达有关。

优选采用本发明的方法来治疗或预防由异常的PIAS4水平和/或活性,特别是升高的PIAS4水平引起的疾病。

本发明进一步涉及如本文中定义的寡核苷酸,寡核苷酸缀合物或药学组合物用于制造用于治疗异常的PIAS4水平和/或活性的药物的用途。

在一个实施方案中,本发明涉及寡核苷酸,寡核苷酸缀合物或药学组合物,供治疗选自癌症,诸如胰腺癌,肝癌,乳腺癌,睾丸癌,黑素瘤,胶质瘤,头和颈癌,结肠直肠癌,尿路上皮癌,前列腺癌,宫颈癌,和子宫内膜癌的疾病或病症中使用。

在一个实施方案中,本发明涉及寡核苷酸,寡核苷酸缀合物或药学组合物,供治疗导致肝纤维化的肝病中使用,特别是肝纤维化与非酒精性脂肪肝病和非酒精性脂肪肝炎(NASH)有关的情况。

施用

可以肠内(诸如口服或经由胃肠道)或胃肠外(诸如静脉内,皮下,肌肉内,(大)脑内,脑室内或鞘内)施用本发明的寡核苷酸,寡核苷酸缀合物或药学组合物。

在一个非限制性实施方案中,通过胃肠外路径施用本发明的反义寡核苷酸,缀合物,药学盐或药学组合物,包括静脉内,动脉内,皮下,腹膜内或肌肉内注射或输注。

在一个实施方案中,静脉内施用活性寡核苷酸或寡核苷酸缀合物或药学组合物。在另一个实施方案中,皮下施用活性寡核苷酸或寡核苷酸缀合物或药学组合物。

在一些实施方案中,以0.1-15mg/kg,诸如0.2-10mg/kg,诸如0.25-5mg/kg的剂量施用本发明的寡核苷酸,寡核苷酸缀合物或药学组合物。施用可以是一周一次,每两周一次,每三周一次或甚至一个月一次或甚至每三个月一次。

本发明还提供所描述的发明的寡核苷酸或寡核苷酸缀合物用于制造药物的用途,其中药物是用于皮下施用的剂型。

本发明还提供所描述的发明的寡核苷酸或寡核苷酸缀合物用于制造药物的用途,其中药物是用于静脉内施用的剂型。

实施方案

本发明的下述实施方案可以与本文中描述的任何其它实施方案组合使用。

1.一种长度为10至50个核苷酸的反义缺口体寡核苷酸,其包含与选自由SEQ IDNO:1和3,或其天然发生变体组成的组的哺乳动物PIAS4靶核酸具有至少90％互补性,诸如完全互补性的长度为10至30个核苷酸的连续核苷酸序列,其中该反义寡核苷酸能够降低细胞中该哺乳动物PIAS4编码靶核酸的表达。

2.实施方案1的反义寡核苷酸,其中该连续核苷酸序列与该哺乳动物PIAS4靶序列完全互补。

3.实施方案1和2任一项的反义寡核苷酸,其中该连续核苷酸序列与哺乳动物PIAS4靶核酸的前mRNA(例如SEQ ID NO:1)中存在的内含子区至少90％互补,诸如完全互补。

4.依照实施方案1-3任一项的反义寡核苷酸,其中该连续核苷酸序列与选自内含子1(SEQ ID NO:1的143-5277)；内含子2(SEQ ID NO:1的5705-16390)；内含子3(SEQ IDNO:1的16476-20500)；内含子4(SEQ ID NO:1的20543-20864)；内含子5(SEQ ID NO:1的20956-21074)；内含子6(SEQ ID NO:1的21204-21285)；内含子7(SEQ ID NO:1的21390-25454)；内含子8(SEQ ID NO:1的25529-25774)；内含子9(SEQ ID NO:1的25936-29728)和内含子10(SEQ ID NO:1的29860-29970)的人PIAS4的前mRNA中存在的内含子区至少90％互补,诸如完全互补。

5.依照实施方案1-4任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ IDNO:1的位置25936-29728至少90％互补,诸如完全互补。

6.依照实施方案1-5任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ IDNO:1的位置28478-29043至少90％互补,诸如完全互补。

7.实施方案1-6任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ ID NO:4或SEQ ID NO:13至少90％互补,诸如完全互补。

8.实施方案1-7任一项的反义寡核苷酸,其中该连续核苷酸序列与选自由SEQ IDNO:1的位置28478-28497,28540-28559,28816-28835,28910-28929,29024-29043；28478-28495,28540-28557,28696-28713,28816-28833,28910-28927,29024-29041；28482-28497,28544-28559,28820-28835,28914-28929,29028-29043；28484-28497,28546-28559,28822-28835,28916-28929,29030-29043；28142-28161,28144-28161,28145-28160,28147-28160组成的组的SEQ ID NO:1的靶区至少90％互补,诸如完全互补。

9.依照实施方案1-8任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ IDNO:1的靶核酸的长度为10-22个,诸如14-20个核苷酸的靶序列至少90％互补,诸如完全互补,其中该靶序列跨越该靶核酸重复至少5次或更多次。

10.实施方案1-9任一项的反义寡核苷酸,其中该寡核苷酸能够以-10kcal以下的ΔG°与选自由SEQ ID NO:1,2和3组成的组的靶核酸杂交。

11.实施方案1-10的反义寡核苷酸,其中该靶核酸是RNA。

12.实施方案11的反义寡核苷酸,其中该mRNA是前mRNA或成熟mRNA。

13.实施方案1-12任一项的反义寡核苷酸,其中该连续核苷酸序列包含至少10个连续核苷酸,特别是11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,或29个连续核苷酸或由其组成。

14.实施方案1-13的反义寡核苷酸,其中该连续核苷酸序列包含12至22个核苷酸或由其组成。

15.实施方案1-14任一项的反义寡核苷酸,其中该连续核苷酸序列包含14-20个核苷酸或由其组成。

16.实施方案1-13任一项的反义寡核苷酸,其中该反义寡核苷酸在长度上包含12至35个核苷酸或由其组成。

17.实施方案1-13任一项的反义寡核苷酸,其中该反义寡核苷酸在长度上包含14至25个核苷酸或由其组成。

18.实施方案1-17任一项的反义寡核苷酸,其中该寡核苷酸或连续核苷酸序列是单链的。

19.实施方案1-18任一项的反义寡核苷酸,其中该寡核苷酸既不是siRNA也不是自我互补的。

20.实施方案1-19任一项的反义寡核苷酸,其中该连续核苷酸序列包含选自SEQID NO:9,10,11和12的序列或由其组成。

21.实施方案1-20任一项的反义寡核苷酸,其中该连续核苷酸序列与同其互补的靶核酸相比具有零至三处错配。

22.实施方案21的反义寡核苷酸,其中该连续核苷酸序列与该靶核酸相比具有一处错配。

23.实施方案21的反义寡核苷酸,其中该连续核苷酸序列与该靶核酸相比具有两处错配。

24.实施方案1-23任一项的反义寡核苷酸,其包含一个或多个修饰的核苷。

25.实施方案24的反义寡核苷酸,其中该一个或多个修饰的核苷是高亲和力修饰的核苷。

26.实施方案24或25任一项的反义寡核苷酸,其中该一个或多个修饰的核苷是2’糖修饰的核苷。

27.实施方案26的反义寡核苷酸,其中该一个或多个2’糖修饰的核苷独立选自由2’-O-烷基-RNA,2’-O-甲基-RNA,2’-烷氧基-RNA,2’-O-甲氧基乙基-RNA,2’-氨基-DNA,2’-氟-DNA,阿拉伯糖核酸(ANA),2’-氟-ANA和LNA核苷组成的组。

28.实施方案26或27任一项的反义寡核苷酸,其中该反义寡核苷酸包含3-6个2’糖修饰的核苷。

29.实施方案1-28任一项的反义寡核苷酸,其中该寡核苷酸包含至少一个修饰的核苷间连接。

30.实施方案29的反义寡核苷酸,其中该修饰的核苷间连接是核酸酶抗性的。

31.实施方案29或30任一项的反义寡核苷酸,其中该连续核苷酸序列内至少50％的核苷间连接是硫代磷酸酯核苷间连接。

32.实施方案29-31任一项的反义寡核苷酸,其中该连续核苷酸序列内的所有核苷间连接是硫代磷酸酯核苷间连接。

33.实施方案1-32任一项的反义寡核苷酸,其中该寡核苷酸能够募集RNA酶H。

34.实施方案33的反义寡核苷酸,其中该寡核苷酸是缺口体。

35.实施方案1-34任一项的反义寡核苷酸,其中该反义寡核苷酸或其连续核苷酸序列由式5’-F-G-F’-3’的缺口体组成或包含其,其中F和F’区独立包含1-8个核苷或由其组成,其中1-4个是2’糖修饰的且定义该F和F’区的5’和3’端,且G是能够募集RNA酶H的介于6和16个核苷之间的区域。

36.实施方案35的寡核苷酸,其中该2’糖修饰的核苷独立选自由2’-O-烷基-RNA,2’-O-甲基-RNA,2’-烷氧基-RNA,2’-O-甲氧基乙基-RNA,2’-氨基-DNA,2’-氟-DNA,阿拉伯糖核酸(ANA),2’-氟-ANA和LNA核苷组成的组。

37.实施方案35或36任一项的反义寡核苷酸,其中F和F’区中一个或多个该修饰的核苷是LNA核苷。

38.实施方案37的反义寡核苷酸,其中F和F’区中所有该修饰的核苷是LNA核苷。

39.实施方案38的反义寡核苷酸,其中F和F’区由LNA核苷组成。

40.实施方案45-47任一项的反义寡核苷酸,其中F和F’区中所有该修饰的核苷是氧基-LNA核苷。

41.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷选自β-D-氧基-LNA,α-L-氧基-LNA,β-D-氨基-LNA,α-L-氨基-LNA,β-D-硫-LNA,α-L-硫-LNA,(S)cET,(R)cET,β-D-ENA和α-L-ENA。

42.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷是氧基-LNA。

43.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷是β-D-氧基-LNA。

44.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷是硫-LNA。

45.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷是氨基-LNA。

46.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷是cET。

47.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷是ENA。

48.实施方案37的反义寡核苷酸,其中F或F’区中至少一个进一步包含至少一个独立选自由2’-O-烷基-RNA,2’-O-甲基-RNA,2’-烷氧基-RNA,2’-O-甲氧基乙基-RNA,2’-氨基-DNA和2’-氟-DNA组成的组的2’糖取代的核苷。

49.实施方案35-48任一项的反义寡核苷酸,其中G区中的RNA酶H募集核苷独立选自DNA,α-L-LNA,C4’烷基化DNA,ANA和2'F-ANA和UNA。

50.实施方案49的反义寡核苷酸,其中G区中的核苷是DNA和/或α-L-LNA核苷。

51.实施方案49或50的反义寡核苷酸,其中G区由至少75％DNA核苷组成。

52.实施方案49-51任一项的反义寡核苷酸,其中G区中的所有核苷是DNA核苷。

53.依照实施方案1-52任一项的反义寡核苷酸,其中该反义寡核苷酸或其连续核苷酸序列选自由GgatgtgtgacggtgtggAC(化合物9_1)；ATgtgtgacggtgtgGAC(化合物10_1)；GGATgtgtgacggtGT(化合物11_1)；GGATgtgtgacGGT(化合物12_1)组成的组；其中大写字母代表LNA核苷,诸如β-D-氧基LNA,小写字母代表DNA核苷,任选地,所有LNA C是5-甲基胞嘧啶,且至少一个,优选所有核苷间连接是硫代磷酸酯核苷间连接。

54.实施方案53的寡核苷酸,其中该寡核苷酸选自CMP ID NO:9_1；10_1；11_1；12_1。

55.一种缀合物,其包含依照实施方案1-54任一项的反义寡核苷酸,和至少一个共价附着至所述反义寡核苷酸的缀合物模块。

56.实施方案55的反义寡核苷酸缀合物,其中该缀合物模块选自碳水化合物,细胞表面受体配体,药物物质,激素,亲脂性物质,聚合物,蛋白质,肽,毒素,维生素,病毒蛋白或其组合。

57.实施方案55或56的反义寡核苷酸缀合物,其中该缀合物模块能够结合无唾液酸糖蛋白受体。

58.实施方案55-57任一项的反义寡核苷酸缀合物,其包含位于该反义寡核苷酸和该缀合物模块之间的接头。

59.实施方案58的反义寡核苷酸缀合物,其中该接头是生理学不稳定接头。

60.实施方案59的反义寡核苷酸缀合物,其中该生理学不稳定接头是核酸酶易感性接头。

61.实施方案56-60的反义寡核苷酸缀合物,其中该寡核苷酸具有式D’-F-G-F’或F-G-F’-D”,其中F,F’和G如实施方案35-52中定义的且D’或D”包含1,2或3个具有硫代磷酸酯核苷间连接的DNA核苷。

62.依照实施方案1-54任一项的反义寡核苷酸或依照实施方案55-61任一项的缀合物的药学可接受盐。

63.一种药学组合物,其包含实施方案1-54任一项的反义寡核苷酸或依照实施方案55-61任一项的缀合物或实施方案62的药学可接受盐和药学可接受稀释剂,载剂,盐和/或佐剂。

64.一种用于制造实施方案1-54任一项的反义寡核苷酸的方法,其包含使核苷酸单元起反应,由此形成该寡核苷酸中包含的共价连接的连续核苷酸单元。

65.实施方案64的方法,其进一步包含使该连续核苷酸序列与非核苷酸缀合模块起反应。

66.一种用于制造实施方案63的组合物的方法,其包含混合该寡核苷酸与药学可接受稀释剂,载剂,盐和/或佐剂。

67.一种用于降低表达哺乳动物PIAS4的靶细胞中的PIAS4表达的体内或体外方法,所述方法包含以有效量将实施方案1-54任一项的反义寡核苷酸或依照实施方案55-61任一项的缀合物或实施方案62的药学盐或实施方案63的药学组合物施用于所述细胞。

68.一种用于治疗,缓解或预防疾病的方法,其包含将治疗或预防有效量的实施方案1-54任一项的反义寡核苷酸或依照实施方案55-61任一项的缀合物或实施方案62的药学盐或实施方案63的药学组合物施用于罹患或易感该疾病的受试者。

69.实施方案1-54任一项的反义寡核苷酸或依照实施方案55-61任一项的缀合物或实施方案62的药学盐或实施方案63的药学组合物,其用作用于在受试者中治疗,缓解或预防疾病的药物。

70.实施方案1-54任一项的反义寡核苷酸的寡核苷酸或依照实施方案55-61任一项的缀合物用于制备用于在受试者中治疗或预防疾病的药物的用途。

71.实施方案67-70任一项的方法,反义寡核苷酸或用途,其中该疾病与PIAS4的体内活性有关。

72.实施方案67-71任一项的方法,反义寡核苷酸或用途,其中该疾病与PIAS4基因的过表达和/或PIAS4蛋白质的异常水平有关。

73.实施方案72的方法,反义寡核苷酸或用途,其中该PIAS4与没有实施方案1-54的反义寡核苷酸或依照实施方案55-61任一项的缀合物或实施方案62的药学盐或实施方案63的药学组合物的表达相比降低至少30％,或至少40％,或至少50％,或至少60％,或至少70％,或至少80％,或至少90％,或至少95％。

74.实施方案67-71任一项的方法,反义寡核苷酸或用途,其中该疾病是癌症,诸如胰腺癌或乳腺癌。

75.实施方案67-71任一项的方法,反义寡核苷酸或用途,其中该疾病是肝纤维化。

76.实施方案75任一项的方法,反义寡核苷酸或用途,其中该肝纤维化与非酒精性脂肪肝病和非酒精性脂肪肝炎(NASH)有关。

77.实施方案67-76任一项的方法,反义寡核苷酸或用途,其中该受试者是哺乳动物。

78.实施方案77的方法,反义寡核苷酸或用途,其中该哺乳动物是人。

实施例

材料和方法

表4:寡核苷酸基序序列的列表(用SEQ ID NO表示),这些的设计,以及基于基序序列设计的具体寡核苷酸化合物(用CMP ID NO表示)

*多个数指重复靶向化合物

基序序列代表寡核苷酸中存在的核碱基的连续序列。

设计指缺口体设计,F-G-F’,其中每个数代表连续修饰的核苷,例如2’修饰的核苷的数目(第一个数＝5’侧翼),继以DNA核苷的数目(第二个数＝缺口区),继以修饰的核苷,例如2’修饰的核苷的数目(第三个数＝3’侧翼),任选地之前或之后是DNA和LNA的别的重复区,其并非必然是与靶核酸互补的连续序列的部分。

寡核苷酸化合物代表基序序列的具体设计。大写字母代表β-D-氧基LNA核苷,小写字母代表DNA核苷,所有LNA C是5-甲基胞嘧啶,5-甲基DNA胞嘧啶用“e”表示,且所有核苷间连接是硫代磷酸酯核苷间连接。

寡核苷酸合成

寡核苷酸合成是本领域普遍知道的。下面是可应用的一种方案。本发明的寡核苷酸可以通过就所使用的设备,支持物和浓度而言略有变化的方法来生成。

以1μmol规模在Oligomaker 48上使用亚磷酰胺办法在尿苷通用支持物上合成寡核苷酸。在合成结束时,使用氨水自固体支持物切割寡核苷酸,60℃,5-16小时。通过反相HPLC(RP-HPLC)或通过固相萃取来纯化寡核苷酸并通过UPLC来表征,并进一步通过ESI-MS来确认分子量。

寡核苷酸的延伸:

通过使用0.1M 5’-O-DMT保护的亚氨基酯(amidite)在乙腈中的溶液和乙腈中的DCI(4,5-二氰基咪唑)(0.25M)作为活化剂实施β-氰基乙基-亚磷酰胺(DNA-A(Bz),DNA-G(ibu),DNA-C(Bz),DNA-T,LNA-5-甲基-C(Bz),LNA-A(Bz),LNA-G(dmf),或LNA-T)的偶联。对于最终的循环,可使用具有期望修饰的亚磷酰胺,例如用于附着缀合物基团的C6接头或这样的缀合物基团。通过使用苍耳烷氢化物(0.01M,在乙腈/吡啶9:1中)进行用于引入硫代磷酸酯连接的硫醇化。可以使用THF/吡啶/水7:2:1中的0.02M碘引入磷酸二酯连接。其余试剂是典型地用于寡核苷酸合成的那些。

对于固相合成后缀合,可以在固相合成的最后循环中使用可商购的C6氨基接头亚磷酰胺,并且在脱保护和自固体支持物切割之后分离氨基连接的去保护的寡核苷酸。使用标准合成方法经由官能团的活化引入缀合物。

通过RP-HPLC的纯化:

在Phenomenex Jupiter C18 10μ150x10mm柱上通过制备性RP-HPLC来纯化粗制化合物。以5mL/min的流速使用0.1M乙酸铵pH 8和乙腈作为缓冲液。将收集的级分冻干以给出纯化的化合物,典型地是白色固体。

缩写:

DCI:4,5-二氰基咪唑

DCM:二氯甲烷

DMF:二甲基甲酰胺

DMT:4,4’-二甲氧基三苯甲基

THF:四氢呋喃

Bz:苯甲酰基

Ibu:异丁酰基

RP-HPLC:反相高效液体层析

T_m测定法:

将寡核苷酸和RNA靶(磷酸酯连接的,PO)双链体在500ml无RNA酶水中稀释至3mM并与500ml 2x T_m缓冲液(200mM NaCl,0.2mM EDTA,20mM磷酸钠,pH 7.0)混合。将溶液加热至95℃达3分钟,然后容许于室温退火30分钟。使用PE Templab软件(Perkin Elmer)在配备有Peltier温度编程器PTP6的Lambda 40UV/VIS分光光度计上测量双链体解链温度(T_m)。温度自20℃上升至95℃,然后下降至25℃,记录260nm处的吸收。使用解链和退火二者的一阶导数和局部极大值来评估双链体T_m。

实施例1–测试体外功效和效力

在HeLa细胞中在体外实验中测试靶向PIAS4上的一个区域的寡核苷酸以及靶向至少三个独立区域的寡核苷酸。对寡核苷酸评估EC50(效力)和最大kd(功效)。

细胞系

自欧洲认证细胞培养物保藏中心(ECACC)购买HeLa细胞系并如供应商推荐的那样在增湿温箱中于37℃和5％CO₂维持。为了测定法,如供应商推荐的那样在具有10％胎牛血清(FBS)的Eagle氏极限必需培养基(Sigma,M4655)中在96多孔板中接种2,500个细胞/孔。

寡核苷酸效力和功效

在添加寡核苷酸之前将细胞温育24小时。在PBS中溶解寡核苷酸并以0.01,0.031,0.1,0.31,1,3.21,10,和32.1μM的寡核苷酸终浓度添加至细胞,最终的培养物体积是100μl/孔。添加寡核苷酸化合物后3天收获细胞并使用PureLink Pro 96RNA纯化试剂盒(ThermoFisher Scientific)依照制造商的说明书提取总RNA。在多路反应中使用来自ThermoFisher Scientific的FAM标记的TaqMan测定法量化靶转录物水平,使用VIC标记的GAPDH对照探针,设置为技术上一式两份,生物学上一式三份。TaqMan引物测定法用于感兴趣PIAS4(Hs01071948_m1)和持家基因GAPDH(4326317E

/MGB探针)的靶转录物。在表5中作为对照样品的％显示寡核苷酸的EC50和功效。

在GraphPad Prism6中实施EC50计算。在表5中作为对照的％显示最大PIAS4敲低水平。

表5:EC50和相对于对照的最大敲低(最大Kd)％

CMP ID NO	EC50	Std	最大kd	std	SEQ ID NO:1上的开始位置
						5_1	3.65	153.56	88.24	112.17	28142
6_1	N/A	418.10	0.00	233.33	28144
						7_1	57.17	333.44	0.00	215.67	28145
8_1	2.44	1.07	66.99	4.55	28147
						9_1	1.83	0.90	97.69	1.29	28478,28540,28816,28910,29024
10_1	2.00	0.63	18.65	7.52	28478,28540,28696,28816,28910,29024
						11_1	0.74	0.03	2.40	1.03	28482,28544,28820,28914,29028
12_1	1.10	0.15	7.06	3.60	28484,28546,28822,28916,29030

序列表

<110> 哥本哈根罗氏创新中心（Roche Innovation Center Copenhagen A/S）

<120> 用于调控PIAS4表达的寡核苷酸

<130> P34400-WO

<160> 13

<170> PatentIn version 3.5

<210> 1

<211> 31741

<212> DNA

<213> 人（homo sapiens）

<400> 1

ggaggagcgc gcgcgggtgc taattggccc gggcggcggc cccgcccgcg agtggtgagc 60

ggtcacgtga cgcgacggct gggggctccc ggcgcggggg acgctggtga ccaagatggc 120

ggcggagctg gtggaggcca aagtgagtga gcggtggcgg cgccggccgg ggcaagtggg 180

cgagagggcg ggggccgggc cgcaggtcga ggtctgcgcc ttctgtccgg ggccccacag 240

cgcggccggc ccgcggctcg ccgtcccggc ccccagaccc cgacccccgg tctcagggtg 300

agggcggggg gcggggaggc cgggggcggg gccctcctgc ctcacccagg tcttcgcgcc 360

gggggtcgct cccccggctt caggcagggt ccccccaccc agcccgagcc cttagggtcc 420

cggtccctga gcgccaggcc agggccgcgc ctcccggttg aggcaccgtc ccgccgggat 480

gcgggacgtg ttgagctact cgttgccctc ttggttccga gccggggtcc ttgctttttg 540

gctggtgtgt tggggggagt gtctgcgcct ccccgcccac agggctccca ggactgctat 600

ctgggtctcg tccccgccca acaggccagg ctggggtttg cgagtctcct gctcggaagg 660

gtcccccgag tcctggatag tgtcctgcca ccgtccaggt ggaggagtca gggccctgag 720

accaccccca agacacggca cgtcctcttg gggtctggag ttcaggctcg gtcttgagcc 780

cctcttcagc tcctgcattg gtcccagaac cccgccccct tcccgacacc gtctctcaca 840

cgccggagtg ggcgcttggg ggaaggctgg gccctccctt tccctcccca taggatggag 900

ttcggaccac tcttcttggt cacagacctt ctttattctc ctttttttaa tcttaaatcc 960

tggactgtgc tttggtccta cctcgttcct ctcgggacag aatctgaggc tactgattct 1020

gcttcagggg gctctaaacc tcacctgtgc agcatcagat actgtcctca aaccttggct 1080

gcttctccta ttttctgctc ttgagcgagt ctacttctta ggtcagacac ccaccctccc 1140

cctacacagc ccccagaact tttatgcacc ccaactttgg tttctaaggt cccctctctt 1200

tctgcctatt ctcttttgtt gatctctgga gggtccccac tgggtccaag gctggcctct 1260

ttagaacaac tgttgctgct gctctattat actttgggtc ctgtccaggt cccatgtccc 1320

atagatacca tctcctagct tggaaccact tttaatcatc ctgggattga gctcagagta 1380

tccccattcc aggggatgta ccttcttgta ggtgcctacc tagagctgag ggtctaaaac 1440

ccttagaagt gcccgcaagg ccacggcttc cggggaggtt aggggacctc tccctccccc 1500

atcccctttc acatcttccc tccccacggt cctgacctgt acgtatcttc ttctcggtcc 1560

tctcacatta ccccctggga tctgaaaaca cagcactcag ggctctgtga ttatagcata 1620

tacctctctt cgcctcccaa ccctacaccc ctgcgcacac ttctgctcct ctctagagtt 1680

ttgaaaagtg gagactcgcc ctggagatgt ggaggcctga actctgtaaa cccaaagtgg 1740

caggctctgg gcttgaagtg tcctggagtc ctgaaatgta acctcccgtt tcggggcttg 1800

gagctgtgac cctggacccc aacccccacc ctggctgagg gcagggtctg cactcttttg 1860

taccatccag gccttgaaat atgatctgat gaactttcct taaccctctg gtggctgggc 1920

ccccccccac cccaattaaa tcaagttgac ccttctttca ggttctctaa accgtgagcc 1980

tccattcaag ggggcctgga ccctggggaa ccttctttct ccttgagtct gttgctacct 2040

ctccaagtac cttaaatgtc attgaaacat ccccttcttt acaggggcct tccccagcct 2100

gtcatattca tggctgcaga ttctgtcttt tggggtgcat cacagactgc tcggaggggc 2160

gaatgttggg ggtttgttgg tgaactttga aatctgagac tctcagcttg aggcctgcag 2220

gcgggtttgg ggcaggggtg tctgtgagct ccctgaaata gtccacagcg tttcgcacag 2280

atctccgctt tcctggagag aggcgccttc ctgagctacc cccggtgctc tgaggggcct 2340

atgctggagg aaaggttcag cgcagctgct gtgtctcggc tgatgtctcc ccatgcgact 2400

tccaggcaag cctggagttg aaactctgga agctgccggg gcctggcact gtttataaac 2460

acagctctga cggcaagcag gtcagcttga agccagggca ggaagtgatc ttggggcatt 2520

tggggcttct tcctgaatgc ttgtcccccc cgcactccct ccagtgtcaa gggcaggctc 2580

ctccgaggtg gcagctgctg ggaaatctga gtcgtgaaca tatggccacc taaggggtgt 2640

gctccgggaa gcgggagctg cggctccact gtccagcctg ggtggggcag gggctcccgg 2700

ggtgcgagga tgtcagcagg ttccccagcc cacctgcctt cggccagtct gccagtgtga 2760

agtgtccaca tgacatcgtc tctccctgct aaggctttgg gccacttcca gaagaaacat 2820

cttgtctgca agcctttttg ttttctgcac aaggtaggaa gtcaggccaa gggagatgag 2880

gcatttttgt tttcaaagca tccctgactc tcaggcccag cagaccatgc aggtccccat 2940

agccagtgtg ctggtgagtg agggtccccc gggcagcaga cgggaacacc cttgggaggc 3000

cagaggccga ggggccgatg ccagtcccac gcatgtacta gggaggctct gggccagcct 3060

cttccctctg tgagcctcgg tttcctcacc tacacgatgg gtgtcctcat tgtgaaatta 3120

gcgacacagg ccttgctggt gcctggtagg gagcaagacg ctggcatccc gattctttac 3180

agtcacgggg ccccgcagcc ctgatatggg aagaggcttc tcccgaggct ctttgggcag 3240

ggctgggccg cctgcacgtg tgtccctgtc attttgagcc tggacagcct ctccgtctcc 3300

aacaggaccc tggcccgata cagctggaag aaatcagagc tgacagatga ggacccgaca 3360

gtgggccccg gctgctgcag ctttggtgct gaaatgtgcg gctaggctcc tggtctcacc 3420

ctggggcagc caggagccgg aaacctcagc gcctcctggc acggaggctg cagtttacat 3480

accccactgg gactgcctct ggcttcgacc ctcagggtct ttcgagtgga gtttgaatgg 3540

tttattggtt tcttcgggta cccgccagct ttccttaaca cccttgacgc ttgagctttc 3600

tccccattcc tcctggaagc tactgtttcc caccacatct cattcatccc aggccagctt 3660

cagggctaag ggtgggtggc cctgaaaccc tgccagccca tccctcgagg acacctggct 3720

tctgcagcct gttgaggagc cttccttccc cttcagggtc ctacccctca tggaggtcag 3780

gccactgcca gtctacccca cctcaaacac cagggtcagc tgggctctgc tgtttggttt 3840

ttatttcgct ggagaggccc ggccaggcga tgagggccag gtcctgccaa gcctcatttg 3900

tcgctttgac ccaggtcctg caacagcccc tgtggctgct atcttcccct tggaccggtc 3960

ccccagggac tcagggcaac gtgtggaggt gtgtttggtg tggaggtgtg tttggtgtgg 4020

aggtgtgggg ggtgtggagg tgtgtggggt gtggaggtgt gtggggtgtg gaggtgtgtg 4080

gggtgtggag gtgtgtgggg tgtggaggtg tgtggggtgt ggaggtgtgt ggggtgtgga 4140

ggtgtgtggg gtgtggaggt gtgtggggtg tggaggtgtg tggggtgtgg aggtgtgtgg 4200

ggtgtggagg tgtgtttggt gtggagctgt ggggtgtgga ggtgtggggg gtgtggaggt 4260

gtgtggggtg tggaggtgtg tggggtgtgg aggtgtgtgg ggtgtggagg tgtgtggggt 4320

gtggaggtgt gtggggtgtg gaggtgtgtg gggtgtggag gtgtgtgggg tgtggaggtg 4380

tgtggggtgt ggaggtgtgt ggggtgtgga ggtgtgtggg gtgtggaggt gtgtttggtt 4440

gtcgtgagct gtgggtattt agcaccacac agagcccagg atggccccag tgtccacagg 4500

gccaaggagg agaaaccctg cctgggatga tcagcagatg tttcggaggc ccccacaggc 4560

ccagccctgt gttgacatcc agagggtagt gtggcagcaa gaaccgcccc tggcttcaga 4620

gccaggcctg ggttcgaatc ttggcgctgc cacctctgag ccgacagttc ctcatttgtg 4680

acagagctca cacaccagcc tagcaggggt gttttaagga tcagagttaa atatataatc 4740

acatgaccgg cttggttccc ggcaggtgat tagtactaag taaactgtgg ctaccgttgg 4800

cgagaccgaa gggaaaacat atctgtggct gacatgggtt gagcgcccgc ccagccagtg 4860

ctttatgtca ttatcctccc gacgtagaga ctgagggtca gagaggcatt tggtgtttgc 4920

cggtaaggca ctggcagagg ctgtttacaa gtaaagcaca attgtcagtt cctgccctgg 4980

ggatgctttc aggctgaaga cagggaaaga gaacctaaaa tagaaggggg ggcctagtca 5040

gaggcgcttt tgctgcgttg gcgatgctgg ggaaagtttg atgaggagga gggagggggc 5100

agggctttgc tgggaggggg caccgtaggg gcagggcact ccaccagccc cagccaaggc 5160

tggcgcttcc tggcgagtgg gtgtctttca cggcccccac atcggggcct ggcctccatg 5220

gagtcccctg cctcgcagct gtgtcctctg agtgtgtgtg tgcttgctcc tcctcagaac 5280

atggtgatga gttttcgagt ctccgacctt cagatgctcc tgggtttcgt gggccggagt 5340

aagagtggac tgaagcacga gctcgtcacc agggccctcc agctggtgca gtttgactgt 5400

agccctgagc tgttcaagaa gatcaaggag ctgtacgaga cccgctacgc caagaagaac 5460

tcggagcctg ccccacagcc gcaccggccc ctggaccccc tgaccatgca ctccacctac 5520

gaccgggccg gcgctgtgcc caggactccg ctggcaggcc ccaatattga ctaccccgtg 5580

ctctacggaa agtacttaaa cggactggga cggttgcccg ccaagaccct caagccagaa 5640

gtccgcctgg tgaagctgcc gttctttaat atgctggatg agctgctgaa gcccaccgaa 5700

ttaggtgagt ggtcaccctg gggaggctgc gactggaggc ttcacctagg ccccgtcgcc 5760

cagcccagcc cagccacaca gccgacttcg agtgatgttc tctgtggcgc agccagggcg 5820

gggagccaca gtggccaggg gtgtccttcc tcggaagcaa agggaccatc tttgatattg 5880

gtcacccctt gctgtgttac aagttacccc gaaatggagc cactggaagc agggggcgtc 5940

tgttagctct caggaacctg tgagctgtgt tgcggggcat tggggcttgg gggctctcat 6000

gaggctcagt caggctggag ccacctcatc tggaggctcg accagggctg gagcaggcac 6060

atccttgtgt ggtggctggc aggcctcagc tcctcgccag ctcttggcca cagtccccag 6120

gtcctcatgg tgcggactcc tgcacggatt gcctgggcgt cctcagcctg gtggctccct 6180

caccctaggg tagcgagtgt gcacctccaa gctgggagct ggagcccttt ttataaccca 6240

acctcggaca cgcctcgcca tctcccccac agagtccgtt gctcacacag actctgtggc 6300

gcatgcaggg accacaccag gctgtgactg ccagggccag gggtgaccag ggccacctgg 6360

gagcctggtt tccctgctta ttccccttgg aaagggggct ggccagtggc atccttcccc 6420

cgggctctgg ttcctcgctg gcagcctgca ggagtgtcct tggtcagtgg gctcaggtca 6480

ctgccaggct gtgtgcaccg ggcgtgctgg gggttcaggg cgatcccagg cggaggagag 6540

gtgctgggct ccacgcttct ctctctcgtg tctttgtctg caagcactga ctgagcagga 6600

actgtgtgtc aggacctcat agcccacagc agtgtggaca ggcccctggt gcctccccag 6660

cagccgtggc cattcaggct gcaggtgggc attgagccca gtctctgcct cagccatagc 6720

cctgagctca gggccaggga ggcctccgca gccccagccc ccagggcaga gagagtgtgc 6780

agcctctggg actcccagat agggagcgga acgtcctggg cctttgcgga cctgtgcctt 6840

gaggcgctca gatttcacca agtcctctgt gtgcctggag gtctctccgt ctcttcttcc 6900

tgcctcccct cccctgcccc cactctttcc ttcgcacagt aaacatcgga gcgcctgctg 6960

ggtgggtgcg tgatgggcac caggcgtggg cacgcagcag ggaacaggac caaggccacg 7020

aggttcagaa ccctgtgcat gccccctccc accctgctga cccagcaacc tgcctggccc 7080

ctgctgtggc ctgagggccc ttctctggca cgcttcagtc cattgggtgc cagctggccc 7140

ccgctcccct gcccagggag gcagcgttga tgggggtagg gggaagggga actggctgct 7200

tttcccctcc catctgcagc cctgggactt agtgaggtta ggctggaggg gctgtgcttc 7260

caggtgagga tggaggaagt ggaggaggga ggaaggtgct gtcggtggtt cctgcggcag 7320

ccgaggctcc tccctccagc ctgaggctcc gccttccaag tgaggctccg cctccacctt 7380

ttttctcttg caggaggtgt ctagcagcag cctcctgggg agcaggttgg cccagtggca 7440

cctgtcctgg gggactcagg gtcttggcct gagttccatc ggactgactt tcccagcctt 7500

tgctctctca tgagggaagc tgttccccct gccaggttct tgggcagagc tggctgtctc 7560

tgaaggttgg gccttgggaa ggacctgcat cacagggagg ctgggctttc ctgggagcgg 7620

cagggcaggc ttggtccagg gcgggggacg gggctgacca gcttccttcc tgcacgggga 7680

ccagtagctc cgtcccacaa tacatcgctg tgccctgagc caccagggac cccggtcacc 7740

tgatctccgg gagagcctgc tcccctgtct acaccagtgt gcctgtgctg gcggctcaga 7800

acaaagaggc catccccacc ctgcctctct ctcccactgg ctctctctcc atctcaggcc 7860

gccaggtgaa cctcctttcc tggattccgt gctcttgggg gactccctgg gggccacctc 7920

ggtcctcaga agtttcctgg agcatagccc ctggccccga agcagtggtc cccatggttt 7980

taggacctga gatgccatct gtccgccctg accctgggct gtgtccctcc ccagggtgca 8040

ctctgtggtg ctggccttgc ccgggggccg cctccggagg acccagttcc accggcttct 8100

ccctcactcc ctcctctggc tgtgacccac cgtccagcgt gaggcccacc gctctggtct 8160

gtttccccgg aatagccgcc ggccggctcc aggatggaga ccgcgccagg cggacaggag 8220

ccataaatca cgcggtgcgg aatgctgggc tgggggaggg ggtgacagag ccacagagca 8280

ggctgcaggg gcctcaggct gtaggtgatc ggctccagtg ggaggtgccg tgtgtgggga 8340

cggggctggc acccagaaca gtgcggagaa cggcccaagg tcgcacagcg gcctgccttc 8400

cctcctcccg agccgactgg ctcctgctcc tgagcagagg ctctggcctg gacctctgca 8460

ggctgggaac cctgtcctgc ctgtcggcaa ggaagccggc gccacccctt tccagcctgc 8520

gccacctggg gagtccggct agggagcctg accctcctgt cagggtactt gggaagagag 8580

gctgtcagga aatgtggggc agaaggaagg atacatgctg gccgggcaca gagctgctcc 8640

tccagggtct tggcccgcag cgggcacccc gaggaatctg cctgcccacc cgcctgctgt 8700

gcagagtgga gcccctgtca ccacgactcc agatgccccc agaggcagat agccctggta 8760

ccagccaaga gccgccggtc tggcatgtgc tgtgctgtgt gtaggcacct gtgcccttca 8820

gcctctgaag cccttgggcc agcattgccc aggccacagc aaggtagcgt ggtccctgct 8880

caggtgcagc acagaagtgc caggtgataa gtctcatggc acacggaggg ctttcagggg 8940

cagctgtcag tagcaggagc catttactct acatttgtga ggaggtagca gtcaggaagg 9000

cctcctggag gcagcagcgt ttcagtccag acccgagggt gactctcaag aagccaggca 9060

gagaggaggg ggcaggggag cgtattccag gcagagggca gtgagggcag aggccgatgg 9120

ccagagaggg ctcattcatg gggctgaatg gagttcattg tggccagaac atggtgcgcc 9180

caggaggagg gacgcagtag cctgggcgcg ggcggcagag gctggaaccc gagaatggtg 9240

ggcccgggga aggctggggg ctaccctgct tgccccgagg gcttcagcgc ccctgaggtt 9300

ctggtatgat ttttggggtc agtgaggaaa ctgaagtgca ggaggcaagt ggccgtctgc 9360

cttccacagc caggcctgct gcccgcccag gcccaccatc tgtccgtctg cacactgggg 9420

gcctggatgg gcacggagcg tcctgtgtca ctgtcccaca tgtggggtag tctgacccac 9480

tcagcccgct ggcacttccc atacctgtgg ttggggaaca gggggactcc gccagctctg 9540

ccccaggtct tggccttcag gttgaagagg agggatgggc ccactgctac cagatggggg 9600

gctgccagca gccaccccca tgtcccgcta gtccttctcc catcccctgt ggccccctgc 9660

cctgcccagc ccagctcccc aacctgcccg ctggctgcag cctcctgctc tgcttcctgc 9720

ccactggtcc ccctcccatg gcagcctgtg aatgttttca ctgatgggta gagtggtcgg 9780

catcacccct gtgcctagcc aggggcacct gttccccgcc cctccaggac agtgccccct 9840

gtgtccctca tacctgactg tgctgcctct actcttgatc tgggggacct gggttgggga 9900

atcagtgctg gtagctctta gctggacagg gtgggtccgg gagttagaga acttgtatgt 9960

gccggggagg ggacagcctg gggagggggc cagcacatgg gccagctgga gggggaatgg 10020

tcccatccga tcagcttttt tttttttttt ttttgagatg gagtctgact gtcgcccgtg 10080

ctggagtgca gtggcgcgat cttggcttac tacagcctcc tggcttcaag cgattctcct 10140

gcctcagcct cccaagtaac tgagattaca ggcacgcacc accacaccca gctaatttta 10200

tgtactttta gtagagacga ggtttcacca tcttgaccag gctagtcttg aactcctgac 10260

ttcaggtgat ccacctacct tggcctccca aagtgctggg gttacaggcg tgagccactg 10320

cgcccagtct cattttttgt atttttaatg gagacggggt ttcgtcatgt tgaccaggct 10380

tgtcttgaat tcctaacctc aagtgatcca cctgcctcgg cctcccaaag tgctgggatt 10440

ataggcgtga gccaccaggc ccggccccag tcagcctttt aaaaactccc tgtgtttcat 10500

ttctatttaa acttgtacaa ttatgcgctt gtcctagaaa actggagtca acagcagagc 10560

agtccggccg gcgccctgct gcccgagtgg gccgcctcgg tacaccgggc cggtgcttgc 10620

cgccttctcc ctttgcatgt gtgattgtag gaatgtgtgg ctgtgtcctg gctgctattt 10680

tataaccacc ccccatactg tgagcatctg ctcacagcgt taaatattca tcgtcagcag 10740

catctcgtga ggctccctgg cagccttggg tggagccaac ggctgggccc ttcttgttgg 10800

gctctcggat cgggcccagg ggctgctttt cgtgcccggg ccggagggcc tggctgagca 10860

cctcacccca gaaccggctc tgcctggcag ggcccccgtg gtcacctgat cttgcacctg 10920

gccccaaagg tgcatctggt tcagtggtgc ccttgccttg gtcccgtggc cttggatgct 10980

gggcagccca cgaaaccatc tcccccttgg ggaacttcat gcttcagtgg cccaacaaga 11040

aggagcagca gagtgatgta gggaaactga gtcgctcctt aggaggagaa ggtttggaga 11100

aaagtgaggt ggcggggggt gcggttttta aatggggtgc tcagcgaagg ctttccttct 11160

ggtgacattt gtacaaagac aaatataggg ccatgaggct ggtcggggga ggaaggttcc 11220

agaagaggga atggcaggtg cggaggccct gatgcagcat ggctggtggg gcccaagcag 11280

gaggccaggg tggtggccgt gtgtgcgccg gggtgtgtgt ggccctgagc aggggtactg 11340

agggtcaggg gtctcctgcg gagccatccc agggggcggg ctctggctgc tgagaccggc 11400

agagctgggg gcagtcgtct gcaccgggcg ggatttgaaa acagagctga caggactggc 11460

tgagggagtg gatgtttgca ggacagcaga gacgggggct tcatggatgc cacctgggtt 11520

tctggcccca aacagctgac cccgagggca gaagggcagg tttgagggag accccacagc 11580

cccttcccca gcataggggg gccgggtgtt tggggggaac cgtcagcggc ccggggccag 11640

tggcacagca gtgagagcac agggcacctc ccaggccccc agcagagaag cacagcccgg 11700

tctcccccag agggaggagc cctcccaggg cagggacccc agagtcttgt tcttcaatga 11760

ctgggccctg tctgccccag gcatgggctg gcaacaatcc ctggccagct gggtggctcc 11820

cttgctgcct gctggggacc cacccttctc ccctacctcc ttctgagaca ctgaggggtg 11880

gggtgtctgt gttttcacct ccgacccagc ctggaagctc aaggcccagc tcaggtgtag 11940

gctcccgtgc agcctccctg cccctgaacc attgctcccc tggcactcag ggcagacctg 12000

ggcgcgtctg caggtggcct gtgtgccccc ctcccaatta ggcggccttc ctcaagggcc 12060

cagccgggac tccacagccc atcacctctg cagagactgg ctgtgccctg agcatataaa 12120

cgggaaccgg ctgtggcagc cccctcttcc tgagggccag ccacagaccc ggcaccggtc 12180

cccgaagaaa caggtcaaca tgggcgggac gtgcaggctg aggccacaga ggccctggca 12240

gggctgggag ccgagcccag ggagtctggc ttttttcttt tttttttttt tgaaatggag 12300

tctcgctgtc gcccgggctg gagtgcagcg gcaggatctc agctcactgc aagctccgcc 12360

tcccaggttc acgccattct cctgcctcag cctcccgagt agctgggacc acaggcgcct 12420

gccaccacgc ccggctaatt ttttgtattt ttagtagaga cggggtttca ccatgttagc 12480

caggatggtc tctatctcct gacctcatga tccgactgcc tcggcctccc aaagtgctgg 12540

gattacaggc gtgagccact gcacccggct tctcgtgggt tttaattgag aaagttccaa 12600

gacagtgctg gtagttgagg tgcgatccca tggctccggt tcttgtaaag gccctgtcgt 12660

gggtgcaggc cacaccactg tgtgcactgc cgtcctggga gcacctggga gcacagacat 12720

agcctgcgaa gctgatgagc tccagccttt accaggggca gttcgccatc cctgttctaa 12780

agggcttgcc tgtcatctcg ttgtctcgtc tcccggccac tgcaaggctg ccattgtggc 12840

cagattctcg ctcccccacg ctcttccgat attttttaca cttataaaca aataggtgtt 12900

tactcagatg ccttctctcc attttcatta cacaagtgat agcaggacgt gcacgctgct 12960

cagcgttttt gctttgtatc taaatatatt ttttaatgta gacacagtct tgctatgttg 13020

cccaggctgg tctcgaactt ctgagcccaa gcagtcctct cacctcagcc tcctgagtag 13080

cgggaatgac agctgcacac cagcacacct ggctcaggct tatttaaaaa ctttttttag 13140

agacaaggtc tcactgtgtt gcctgggctg ggctccaact cctgtgctac agcgatcctc 13200

ccaccttggc ctcctgaagg gttggggtta caggcatgag ccgctgtgcc cagcctgcaa 13260

gtttctttga acgcatgttt ccatgtattg agggaaaata ctttggagtg ggattcctga 13320

ttcctgggtg atagggtagg tctgtgctta cctttataag ggtagtttcc cagagtgatg 13380

gtactgtctt ataaccccac cagcagagag ttctgattgc tctacacctt tgccatctct 13440

tagagttgcc agtcctttca ttttagccat gctagtgggt gtgtagagag gtattttatt 13500

ttattttacc tcattttata ttattgatac agagcctcac tctgtcaccc aggctggagt 13560

gcagttacac aatctcggct cactgcaacc tccgccttct gggtttaagc gattctcctc 13620

agcctcccga gtagctggga ttagaggcgt gtgtcaccat gcctggctaa tttttgtatt 13680

tttagtagag atggggttac catattgtcc aggctggtct tgaactcctg acctcaagtg 13740

atccacctgc ctcgcctcca cagtgctggg attccaggca tgagccaccg cacctggcct 13800

gggtgtgtag agaggattta aaccggtctt ggatttctac acaaatcgca ggggcctgaa 13860

atactggctg atattttgtg gaggatttta catctgtgtt catgaggggt attcatcggg 13920

aattttcctt ccttgatgct gagttgtgag gttttggtat cagagttatg ctggccttgt 13980

aaaataagaa gtatgctttc cttctctgtt ttttgaaaga gtttatgtac ggtttatgtg 14040

gtttctttcc aaaatgtttt atagaattca ccgatatgga cctgcatttt ctttttcttt 14100

tttttttttt ttttttttga gatggggtct gattctgttg cccaggctgg agtgcagtgg 14160

tacgatcatg gctcactgca gcctccactt cctgggttca agcaatcctc ctgcctcagc 14220

ctccaaagta gctgggacta caggtggtgt gcacctccac acctggctaa tttaaaaatt 14280

ttttgtagag acaaggtctc actttgttgc ccaggctggc ctcaaactcc tgggctcaag 14340

caatccaccc acctcagccc ccaaagtgct gggattacag gcatgagcca ccatgcccaa 14400

tctggacctg cagttttcag aaaaggtttt aattatggat ccaacttcct taacaggtaa 14460

agagcttttc aaacttcctg tatcttttgg tacccgtttt ggtaatttgc atctttggga 14520

ggatttgtcc atgtcactaa gttgtcagat tcattggcat aaagtttcac cttttattcc 14580

cctattgaac cgaaaagctg tagggtctgt actattgttc tttcatttct gatattggta 14640

gtttgtgttc tcactgtctt tttgttgttc agctagagtt ttgttttttt tgttgttgtt 14700

gttgtttttg gtggtttttt ttgagacaga gtctcgctct gtagcccagg ctggagtgca 14760

gtggcacgat cttggctcac tgcaagcttc gcctccctgc aagctccgcc tcccaggttc 14820

gcgccattct cctgcctcag cctccctagt agctgggact gcaggcgcct gccactacac 14880

ccagctaatt ttttgtattt ttagtagaga tggggtttca ccgtgttagc caggatggtc 14940

tcgatctcct gacctcgtga tccacccccc tcggcctccc aaaatgctgg gattacaggc 15000

gtgagccacc gcgcctggcc gtttgttttt gtttttgttt ttttgggttt ttttggaaac 15060

agtctcactc tgtcgcccag gcagtggtgt gatctccact cactgcaacc tttgcctctc 15120

agcttcagac aattctcctg cctcagcctc ccaagtagct gggattacag gcgcccgaac 15180

caggcctggc tatttttttt ttttttgaga caccacaccc tgctgttttt ttaagagatg 15240

cggcagccag gcgccgtagc tcatgcctgt aattccagca cattgggagg ccgaggtggg 15300

cagatcacct gaggtcggga gttcgagagc agcctggcca acatggagaa accctacctc 15360

tactaaaaat agaaaattag ccgggcgtgg tggctcatgc ctgtaatccc agctgttttg 15420

ggaggctgag gcaggaggat cacttgaacc caggaggtgg aggttgcagt gagctgagat 15480

tgtgctattg cagtccagcc tgggcaacaa gagtgaaaca aagtctcaaa aaaaaaaaaa 15540

aaaatggggc tggctgggca cagtggctca cgcctgtaat cccagcattt tgagagtttg 15600

agatgggcgg atcacctgag gtcacgagtt cgaaaccagc ctggccaaca tggcgaaatc 15660

ccatctctac taaaaataca aaaattagcc aggcttggtg gctattcggg aggttgaggc 15720

aggagaatcg cttaaacccg ggagacggag gttgcagtca gccgagatcg tgccattgca 15780

ctccagcctg ggcgacaggg taaaactcca tctccaaaac aaaacaaaac aaaacaaaac 15840

aaacaaaaac caatgttttc tgactgcgcc tctgcctgtc agtccagttg taagtaagag 15900

ggtagggccc aggcttgtga gcaccatggc cttcatcccg tcagtacccc ccgcaccacc 15960

tctgtccggg tgacgtggcc accctgcagg caggaggaga gcaagggccg ggtccggttt 16020

gtgctcagga gagaggaggt atggcagtgt cctgctggcc tggctgggtc cagctctccc 16080

cgccaggcag ctcggcactt ttcggtttcc taagtagacg cctgcatccc acaggctgcg 16140

aaggtcaccc agcaatctga gtggccgtca acaggacaca ggccatggtg agcggccccg 16200

agaaggggat gggcgggagt cctccctcat cctccttcct gggcggcccc cacctctgcc 16260

ccacatatct gtccagccaa cttcccattt cctgtttcct ggtctgaaga ggcgcaggct 16320

gggaaaagcg actgggctcg ggggacctgc cagggaccag acatgcccct gaccccgtgt 16380

ttgtcttcag tcccacagaa caacgagaag cttcaggaga gcccgtgcat cttcgcattg 16440

acgccaagac aggtggagtt gatccggaac tccaggtgtg cggcacctcc cccagcccag 16500

caccccaccg cccgcccacc cactttctcc tgggctcact ggggagagcc ggcagccacg 16560

tccactgcag gcctcgctcg ggctcagtcc agaaccgtgc tgcaaggcag tggccgggtt 16620

tgcttccttc cagaaaaccc catcctgggt ctcaggtgct ggcctgtgtg cccactgcct 16680

gtgccctgca gcctgctaga gagaggcgga ctgactgtgc ccttttaaca cggtcttgcc 16740

ctcctgggcc catcctgggc attgcaggga gcggaggagc attcctcgcc tccacccacg 16800

ccatgacaag aacacacccc tgttgtgaca accacagatg tccccagaca ttgtccagtg 16860

tcccctaggg caggataacc cgggcgagac ctccctgggt taggggattc cacgtatccc 16920

caagagactc tgtgtcccat gatcctctgc cctgctgagg tcccagaagg ctgcatacat 16980

tgaaatccac accctgaatt ggagggggag aaagtaggtg aatcccagga gctgggggtc 17040

cccggtttac accgcccgcc ttaggaattt attctggtgt ccagcatgag caggaagtta 17100

agtcaggtgt ttttttgttt tttttttttg agactgagtg tagctcttgt tatccaggct 17160

tccaggctgg agtgcagtgg cgcgattttg gcttcctgca acctccacct gctggattca 17220

agcaattctc ctgcctcagc ctcccaagta gctgggatta caggcgctca ctaccacgcc 17280

cggctaatct tgtattttta gtagagatag ggttttgcca tgttgatcag gctggtctcg 17340

aattcctgac tcaggtgatt cacccacctc agcctcccag aatgctggga ttacaggcgt 17400

gagccactgc gcctggcgga agtcaggttt tttcccagtt atataatgaa tacggggttt 17460

ccccctccat accgtggata gtgaggtggg atggttccct cggtggggcc gtcctgggca 17520

ctgcaggctg ctgagcagca tccctggcct ccacctgctc tgtgccagga acacccctaa 17580

ctctgacaac cacagatgtc cccagacaca gctcggtgtc gcctggggca gggtcgtcct 17640

cagatgagga cggttgaact gtggcaggtg aggggccagt gtggctgccc tgcgctctgc 17700

tcctccctca gtctctccga ggctgtactg cctccagctg agacagattc ctgctgggca 17760

ggctaatggt aggtgctggg cccttaggac aggggaggcc atttgcccag gtcacccctg 17820

agtccatggc agggctgggc cgggcgcccc catttaatgc ctagcttctc gtgcccagcc 17880

gcttcagacc caccgccccc acctgctgtg gggccaggtt cctggggcct cccagcctgg 17940

ccctcacacc tagtaagggt tcagatccag ccgagccagg cttggccatg gaggcctctc 18000

tgcctgggtg acccaaggtg gcgacctcgt ctttctcagc ctcgtcttcc ttgtctatgt 18060

acctgggtca gcacagcctc cacctgcact gggtccctgc tgcagagtgc tcagagccag 18120

ccacacagta taaaaaaatc agtttgggct gggcacggtg gctcacaact gtaatcgcag 18180

ccctttggga ggccaaggca ggtggatcac gaggtcagaa gatcgagacc atcttggcta 18240

acacagtgaa accccgtctc taccaaacat acaaaaaaat tagccgggtg tggtgacggg 18300

cgcctgtagt cccagctact cgggaggctg aggcaggaga atggcgtgaa cccgggaggc 18360

ggagcttgca gtgagccgag atcctgccac tgcactccag cctgggcaac aaagggagac 18420

tccgtctcaa aaaaaaaaaa aaaaaaaagt ttggttttct cctcagaaag cttctggaca 18480

tttctttttc tttttctttt ttttttttga aatgaagtcg ctctgtcgcc aggctggagt 18540

gcagtggcgt gatgtcggct cactgcaact tctgcctccc aggttcaagc gattctcctg 18600

actcagcctc ccgagtagct gggactacag gtgcgcacca ccacgcctgg ctaatttttg 18660

tatttttagt agagacaggg tttcaccatg ttggccaaga tgatctcaat ctcttgacct 18720

cgtgatccac cccacatctg cctcccaaag tgctgggatt acaggcgtga gccaccctgc 18780

ccatcccaca tttctttttc ttatgtcgag atatgatttg cataccatag aatatacagt 18840

ttttaagggt gtcatcgagt gggttctcgt ggatcagtag gtatcgcagc tcccaccact 18900

gcctagtctc agggcagtca tgtccatccc cagcagctgc cacccttcat ccactggccc 18960

ccacgcatcc cctcctgtct gtaaatgggt ctgtcctgga catttcatag aagtggaatc 19020

acatactatg tggctttcgt ttattattat tatttaagac agaatctcac tctgtcgccc 19080

aggctggagt gcagtgtcgc gatctcagtt cactgcaatc tccgcctccc aggttcaagt 19140

gattctcttg ccccagactt ctgactagct aggattacag gcgtgcacca ccacactcag 19200

ctaatatttg tatttttttt gagacagagt cacactccga ggcccaggct ggagtgcagt 19260

ggcacgatct tggctcactg caagctctgc ctcctgggtt cacgccattc tcctgcctca 19320

gcctcccaag tagctgggac tacaggcacc cgccaccacg cctggctgat tttttttttt 19380

gtatttttag tagagacggg gtttcaccat gatagccagg agggtctcga tctcctgacc 19440

ttgttatccg cccgcctcgg cctcccaaag tgctgggatt acaggcgtga gccactgcac 19500

ctggcctaat ttttgtattt ttagtagaga cgaggtttca ccatattgcc caggcttgtc 19560

tcgaactcct gacctcaagt gacccaccca cctccgcctc ccaaagtgcc agggttactg 19620

gcgtgagcca cctgccttgt gtgtcctttc gtgtctggcg tctctcactg ggtgggacat 19680

cctcacggtg cacctgtgct gaggcctggg tctgagcctg gctcctttcc atggctgggt 19740

cgcgtcccgt gcgtgttggt ccttcggtct acggaaggac actcaggatg ctgctagttt 19800

gtggctgttg tggtcagttc tgctgtgaac atccacggat gcgtctttgg gtagatagac 19860

tttttcctct tcttctgggg gcgtttcttg ttaaagttta tcctcaggtg ttactggttt 19920

ttgttttttt ttttttggag agtgtttctc tttgttaccc aggctggagt gcagtggtgc 19980

aatcatagct tgcagcctgt gcctccatgg gttcagacga tccccctgcc tcagcctcca 20040

agcagctggg accacaggtg tgcaccacca cgcctgggta attttttgtg gagacagttt 20100

caccatgttg cgcaggctcg tctcaaattc ctgggctcaa gagctccgcc agccttgacc 20160

tcccaaactg ggtgttttct tgccattgtg agccagctgc tagattcccg catgcacgtt 20220

ttagctatgt ttcttcgcag ggagaggcac ctggctgccc tctctggttc agggttttgc 20280

tgtggattct gttgcatttt ccagggaggc cagcccctct cctgacctca cagccactcc 20340

tctcacccag cccgtacaaa agagtcctgg gcctcagttt cccagctctg ggggagggag 20400

ccttgtggtg tggcggtctc caccttgtcg ggtgggctgg ggtcacgccc tcctcactca 20460

gctctccttt cctttcctct ggtttgctcc acacccacag ggaactgcag cccggagtta 20520

aagccgtgca ggtcgtcctg aggtatgccc aggtgtgccc gcgaccccag ggctggaccc 20580

ccagccaccc gcccctcccc gccccccagt cctggcccag gcccttctca gtctcccctg 20640

ctaacagcag agcccagctc tcctcacctg ctgtctatcc ctgtctgggg atacatcacc 20700

atccgacccc cactcaggcc acacccgggg gccctgatac cccccgtgtc acattctccg 20760

gtgcccccat cactgccgcc tggctaccac tcgtgtaccc ccgcagcagc ctagtccctc 20820

ctgtgcgccc cctccccgcc ccatggtccc tgttgtcgtt gcagaatctg ttactcagac 20880

accagctgcc ctcaggagga ccagtacccg cccaacatcg ctgtgaaggt caaccacagc 20940

tactgctccg tcccggtgag catgccccgc ccccgcgtcg gctgcacggg tttggggggc 21000

gtggagggag ggtgggggcc gtcggatttc ccagccgctc ttggctcgag gctgagcggc 21060

ccatctgctt gcagggctac tacccctcca ataagcccgg ggtggagccc aagaggccgt 21120

gccgccccat caacctcacc cacctcatgt acctgtcctc ggccaccaac cgcatcactg 21180

tcacctgggg gaactacggc aaggtgagtg cgtgcccggg tgcccaccct gccccccaac 21240

cccggccccg tcctgccagc cctgacccct tccttctgtc cccagagcta ctcggtggcc 21300

ctgtacctgg tgcggcagct gacctcatcg gagctgctgc agaggctgaa gaccattggg 21360

gtaaagcacc cggagctgtg caaggcactg ggtgagcagc tcaggccacc tcggccgagg 21420

ggtgccaagt ccaccctgga aacccgccct gtgctgggtg aagcgggggg ccctgcaccc 21480

ggaggagatc gatcaggggc cgcctgtcac tctgggggtc catggccccc cggctgtggc 21540

tggggaggtc tctggaggat acggatggca gagggggcac ttggcagtgg gagctgctgt 21600

gcggaggcct gtggggtcac acctcgtgtt gctggcccca ggtgctccag cccacagggg 21660

tctaagcagc agaagagctg gagcctcatt ccgggacagc acagaggccg ggaggggtga 21720

gaggagcaca gagggagctg tggtctaagc agccccttct cgttgcctca gcggggccga 21780

gggtgctgcg ggacctggcg ggtcacggac ggccagggtc gtggaggcag ttgctgtggg 21840

aggaagacgg gcggcggcgg tctgacctca cgttggtgag gccccgttta atcttttttc 21900

tttttctttt tctttttttt ttagagagtc agggtctctg ggaggtagag gttgcagtga 21960

gctgagactg catcgctgca ctccagcctg ggctgcagag cgagactcca cctcaaaaaa 22020

aaaagtgtct cggtgtatcg cccaggctac agtgcagtgg tgggatcgtg gctcactgta 22080

gcctctaact cgggctcaag ccatcctcct gcctcagcct cctgagtagc ttgggaccac 22140

atgtgttcac caccacaccc aactaatttt tttttttttt tttttttttt tttttgagac 22200

agagtctcac tctgttgccc aggctggagt gcaatggcac gatctcggct cactgaaacc 22260

tctacctcct gggttcaagc gattcttctg cctcagcctc ctgagtagct gggactacag 22320

gcatgtgcca ccatgcccgg ctaatttttt gtattttcag tagagacggg gtttcacctt 22380

gttagccagg atggtcttaa gctcctgacc tcgtgatccg cttgcctcgg cctcccaaag 22440

tgctgggatt acaggcgtga gccaccacgc ccggccccaa ctaatttttt aatgtttcgt 22500

agagatggaa tcttgctgtg ttgcccaggc tggtcgtaaa ctcctgagct caagcagtgc 22560

acctgcctca atctcccaaa gtgctgggat tacagtcttg gccactttcg cacctggtct 22620

cttttgtcct tgtaacaatg aaaacaattt tttttaagtg acacgcagag caattttaaa 22680

agaaagcctg ccggcaaggc gcagtggctc acacctgtaa tcccagcact ttgggaggcc 22740

gaggcgggca gatcatgggg tcaggagagc aacaccatcc tggctaatat ggtgaaaccc 22800

catctctact aaaaatacaa aaaattagcc aggcgtggtg gcaggcacct gtagtcccag 22860

ctactcggga ggctgaggca ggagaatggc gtgaacccag gaggcagagc ttgcagtgag 22920

cggagatcgt gccactgcac tccagcctgg gtgagagtgt gagactccat ctcaaaaaaa 22980

aaaaaaagcc tgccaagcct ggtaggcaaa tcagtcctca ccccaagcag ccacgcagca 23040

caaagccagc gtacagcagt tagccctgcc tggcggctgt gtggcctcag aaagtcgctg 23100

gccttctctg gtggccactg tcttcaggag aatagatctg agccatcttg agggcacctg 23160

gacatctctc tggaccccac atgcttgggg cccaggcctc agtgggctct gcaggcctgt 23220

cttatggaga ggctaggcct aacctggagt catttggagc tgggagtggg agtcaggcag 23280

gtgggtgagg actgggacca cctgccaggc tgacgagagg gcggttctgg gccagccggg 23340

tttgctcgca cccccttccc gaatggtggc tgttttcagg tggaatctgg gcaccacccc 23400

agccccttgg cagaatgtgg gccagagggt cttccagctg cccctcctag ctgcccaggc 23460

ccctgtgccc aggccagaga gttccccatg agcactgccc tcctggcaca gccaggccca 23520

ggcctctggt ccctgttcct gaccaccaaa gggcacctcc ttgcctgggt gtccagaagc 23580

ctggagcagt gctggcactg ccaggggcct gcgagcccca tcgtgttgaa gcctcctgtg 23640

cactccagcc ccccaagtca ggaaagatag ccggcagcac cccctctgca gagcaggacg 23700

tggagggtga ggggtccctc cacggagtcc ggcatccttg gccagcctcc tccaggctcg 23760

gggatggagg gcctggctat gtacccgtgt gaccagtggg gacactgagg cacagagtgg 23820

caaagttagg gttctgtgtc ctgggttacc ccgccccacc tccctcttcc ctcaaagggc 23880

ccttttttca accgcccccg accttccctg cctgtgggga catggccaac ttgagggagg 23940

aggctggggc cgggcaggcc tcttctaggc ccacggggtg ggggccgggc ttaactcctc 24000

agtgaccaga gcccgcagtg ctgggggctg tggggtcagg cttcctctcc gaaggggtct 24060

cctgctgctt cccacagccg gccccaggct cagcctctct gtcactggat ttctttcttg 24120

ctgcacctag gaagtcctca cctttgcctc acttgaaccc ttcctgctgc gcacgtctct 24180

ccatacacaa aggagggaga gtttgcttta aaatcagatg ggcacctgca tcccctccta 24240

gctgcccctt tgccaggctt gagggtccac ccgggcaccg ggtagccaga gctgggatcc 24300

aaggatggaa actcagctga ggagtgagcg gctggggcag ccttggctca agcaggggag 24360

ctgctgggag ccagcacgtg gctgccacca cgtccccacg ggagaaggaa gagcccactg 24420

ctccacaccc cggctggggg tctgggtggg ggtcaggaag gaggaagtgg ctcccaagcg 24480

ggcagagata agtggtgttt caggccaata aggggtggta ggggcatttc caggcggagg 24540

aacgtcagga cagctggggg gagtgggggg gcaggctggc accatcactc tggaccccaa 24600

gtcacttggg caggtggctt cctggaggaa gcaacactgg tccaccaggc agctgagggc 24660

caggtggtgg atggagaggc cctgtgggtt gtgggccagg gtggcctgcc ccccatggcc 24720

cagggctggg gtctctcctg agctacccat ggatggagtt taccctggga tggagccaca 24780

tcccagaagc ctcaggaggg cagccagggt ccctgcgtga gtttccttct ggctgtgggc 24840

ctgctgcccg tcgaggggag ggcggcgcct gcctccaaga cttcatgttt cacatatgtt 24900

tccccatgtt ccgtgcagct tgctggcggg caccgtcttt tcctttaaag aagcagctac 24960

actcctgtct gcaggctgcc ttggggcggt gctggggctg ggcggcagcc gcttgctggc 25020

tcacagccag gaagccccag gatccgtctc ccaaagagtc cctgcctcat tccccgctgt 25080

ggccttgggg atggtgcttc ggtgacagaa tgaagtcaca gcaatgactc tttcggtggc 25140

tgtgttgcat gaaacttgcc agaaaagtcc catgggtcat agtccacgca gggtggggga 25200

ggccacatag gccacctccg tgtgggggct tcggctgggt ctgtgctgtg cccaggttgt 25260

ggtcaaatct aatggtggtt gccacccggc tttctccaat ccctcacggc cccgagccac 25320

acagcgaagc ttgggactca tcgtcagggg cctgttctgg gaggtggacg tcagtgccgg 25380

agagaactcg aatcacagcc ccgcgccctg ctgttcccac cctcctgacg gtgtcttccg 25440

ttccctcccc acagtcaagg agaagctgcg ccttgatcct gacagcgaga tcgccaccac 25500

cggtgtgcgg gtgtccctca tctgtccggt gagtcggggc gcggtcccct cctcgaggcc 25560

tctcctgcgg ccggccttcc cccctggcgg ccctgggccc ggggcggctt ggctgggccg 25620

tgagcctgcg ggggcgaggc tggtcttcgt cccctccgtg ttcctgaggc atgagtgatt 25680

ggagcgagcc acaggatgga gctgggggtg aggggcaccg ggcaggcggg cacaacagga 25740

ggggtgccct gctcacgcag cccctccccc acagctggtg aagatgcggc tctccgtgcc 25800

ctgccgggca gagacctgtg cccacctgca gtgcttcgac gccgtcttct acctgcagat 25860

gaacgagaag aagcccacct ggatgtgccc cgtgtgcgac aagccagccc cctacgacca 25920

gctcatcatc gacgggtgag cccggggccc cggggagggc ggccggagcc ggacatccgt 25980

ggaggtctcg gtggcacccc gcttcctgca gaccacatgg tgccccagca agacacagca 26040

gtgggggcac atggtcctgg agctttggaa accccgggct gcgaaaagag ccggtttctt 26100

tctcgcggaa cttctcagag cctttgctat gcaggtgaca gccacgtagc ttaggttgca 26160

gaaggtgggc tccggtccac cccgctccca cgtgacctca ggcaagtgtg accctgagct 26220

ccaggagtgt ggtttgtgcc acaaaaaact gagccaggtc gtgctttcac acggcgttca 26280

ccccaggacg cgcagccttg ggggtgacct cctcacagaa aggcaaagga ggtggcgcct 26340

cctggagcac tctggctacg ccatgccctt cccttcctag gtggcacagc tgtggccagg 26400

cattccccag gccacagggg acaggaggac aagacctttc tccctggtgg aaggctctgc 26460

ccagggctta agtttccaga aactgagccc cgttgtctgt ggtgcctgat gcggctcctg 26520

cccggcgccg accgcgccca cctcgtcccc agagccgccg gcagggcgcg aggccacagc 26580

ggcacaagct ggcgccctca caggcgggag caggccctgc ctgtgggggt gggccgggtc 26640

cccagccctc aggcatggcc tcagcggact gtgcaggtga aggcagggct ggcctgcctc 26700

tggggttgta gatttcatcc ccaggtggac ctccggttca tgcacttgtc cccatcccag 26760

gagacagacc tgtgagcgtc ctcagtttac agacgaggaa acaggctcag aggaggcaac 26820

cagcagctgg agctaccccg gctcacgggg ccaggctgag acttgaaccc agcctgagtc 26880

tgggtcccct ctgtggaggg ctgggtggcc acccccttgc atcccagctt cgggtagaga 26940

gaggagtcct ttgggccggg cacgtgggct gcctgaatgg ctgctctgtt cccagcctga 27000

cagctgtgca gccgggtgcc cgccttcccc cacaggcccg gagtggggct tgggcttggg 27060

gtggcggcag ctctcacagc tccagggcca ccagggctgg ggcaggcagc tgtgtcccat 27120

gcaggccttg gcctcagcag cccatgggac tcggtgtagc cagggaggct tcctggagga 27180

ggggtccttg gttcatactt tgttccatga gccctatcac ctctctgtcc ctggctctga 27240

gctgggtgac cccagggtcc ccaaaagagc cccgtcccag accctgcctt cagagtcttg 27300

ttcttggcca ggggagcgga tagaggagca gagccagaca taaacgttcc cgttgctgtg 27360

tgtgtcttgg ggaggaggaa gagaagctgt ggggtggggc tttggagggt gaaaagcagt 27420

tttgcaagca gggaagtggg caggcagggc tgtgctacgc ctggggcggc cctggcacgg 27480

tgggctccga gcatcgcctc agagagagct cggcggggcg gaggggctgg cctgggtgag 27540

agcctcagaa agggtggccc agagtgggac gagggctctc ctgtgtgatg agaacgatgc 27600

cactgcgggt gcctgggagc agctgtagcc ttgacagtaa caggccagcc tgggccctgc 27660

atggacccgt ggggcagggg gcctctcctc agacgccccc cagccactgc acctttccct 27720

tcctgcgggt ggggagactg aggccctttg gctaagacgg gttggggagc agaaccaggg 27780

cctgcctcca gttggccttg tggcctcagg gaactcgttc ccttcccgag cctctgtttc 27840

tgcatttgta aaatggggct ggtaggacct ccgagtaaaa aggccggaca cagtgggggt 27900

gctctggaga ggctgtggct ggcatgggcg tggggagccc gcactctgct cccattgcta 27960

ccctcacagc ctctgcaggg gctttgagca gccagcacct tcactccagc ctgtttcctg 28020

atctggcggg cacacagtgc aatgtgaaag caggtgtgcg tgcacaccca cacccgcatg 28080

cccacacatc catacagtcc acaccatcac acacacacac ccacacacat ccatacagtc 28140

cataccatca cacacacccg cacacatcca tacagtccac accatcacac acacacccgc 28200

acacatccat acagtccaca ccgtctcaca cacacacccg cacacatcca tacagtccac 28260

accgtctcac acacacacct gcacacatcc atacagtcca caccataaca cacacataca 28320

gtccacaccg tcatacacac acacacacat ctgtacagtc cacaccttca cacatccata 28380

cagtccacac cgtcatacac acacacatct atacagtcca cactgtcaca catccgtaca 28440

gtccacaccg tcatacaaac acacacacat ctatacagtc cacaccgtca cacatccgta 28500

cagtccacac cgtcatacaa acacacacac atctatacag tccacaccgt cacacatcca 28560

tacagtccac actgtcatac acacacacat ctatacagtc cacaccatca catgcacaca 28620

catctatatg gtctacaccg tcacacacac acacatctat acagtccaca cctgttacat 28680

gcacacatct atacagtcca caccgtcaca catctataca gtccacaccg tcatacacac 28740

acacgtctat acagtccaca ctgtcacaca tccgtacagt ccacactgtc atacaaacac 28800

acacacatct atacggtcca caccgtcaca catccataca gtccacaccg tcatacaaac 28860

acacacacat ctatacagtc cacacctgtt acatgcacac atctatacag tccacaccgt 28920

cacacatcca tacagtccac accgtcatac acacacacat ctatacagtc cacaccgtct 28980

cacatctata cagtccacac tgtcatacac acacatctat acagtccaca ccgtcacaca 29040

tccatatagt ccacaccatc atacacacac acatctctac agtccacacc atcacatgca 29100

cacacacatc tatatggtct acaccgtcac acacacacac acatctatac agtccacacc 29160

gtcacatatc tgtacagtcc acaccgtcac acacacacgc ccacacccgc atgccacaca 29220

tccatacagt ccacattcac gtatgcccat atgcatccat tcacacgtgt gtacacatgc 29280

tcacacacac acattcatag actccacaca tgcacacgtg cacacacacg cacatgctcg 29340

cacacatgca cagatacact cacgtccaca cacgctcaaa catgcgtgca cacccggagg 29400

tgcccagagg ggcagggtgg ggaggacccc tgcagctgcc acactccctg ctcttgtggg 29460

tagttggggg ccactgggta tgtgtgtcca tgccccgtcc ccccggcagt gccgtgcact 29520

gcagacctgc ctggggctca gcacctgcag gggcctgagg gcgggggagg gaatgcgggg 29580

tccctggacc cctgcggtcg gggtggtgag gctgctcttg cagagagaag tggggagtgc 29640

ctggctgcat ccgggaggga tggagggctg gggagttggg ggggtggggc acctccagcc 29700

ccggcgtcag ctgtccgcct cgccccaggc tcctctcgaa gatcctgagc gagtgtgagg 29760

acgccgacga gatcgagtac ctggtggacg gctcgtggtg cccgatccgc gccgaaaagg 29820

agcgcagctg cagcccgcag ggcgccatcc tcgtgctggg tgagtgcctc accccaccag 29880

ccgcgcagtc cgcagccagg gccgcctcag tttccccatt tatcagtggt tgcatcctaa 29940

gtacctgcac cctgtccctg ttgcccgtag gcccctcgga cgccaatggg ctcctgcccg 30000

cccccagcgt caacgggagc ggtgccctgg gcagcacggg tggcggcggc ccggtgggca 30060

gcatggagaa tgggaagccg ggcgccgatg tggtggacct cacgctggac agctcatcgt 30120

cctcggagga tgaggaggag gaggaagagg aggaggaaga cgaggacgaa gaggggcccc 30180

ggcccaagcg ccgctgcccc ttccagaagg gcctggtgcc ggcctgctga ccccggccgc 30240

acactcgact ttcctggtgc tcaccacgca gaggggcacg ggccagcctc gggcgcagag 30300

ggaggagtga cctttctttt tctttttatt gtcgttcgtt ttgtttttcc acccttttgc 30360

ctggctcctg gcacctgtac ctctggactc tcctatcggg ggattaaaaa aaaaagtaaa 30420

atgacaaaaa aagatacaaa aaagaaaaat gaaacaaaaa agtcaaactc ttaaaaacaa 30480

ggccggccac ccacacagcc gcctccccgg ctggagtccg agccgggaag gggtagtggg 30540

cgggagggac caggacgccg ccccgcgccc tcccctccgg atgccccgcc gcccgccgcc 30600

ctctgcccac gaccattcca gccagtgcgc ggggacccgg gcggcgggcg gtggggcgca 30660

gcccctctct ggcgaccact ttgacgtttg tctcttcctt tgctttttct ctgcaaatgc 30720

atcctcgccc agagaccctc acgcgccgag cagcgagcgt tttagccgag aagccatgga 30780

gtgggttggg gcggggaggg gcagtagggt ggggggatgg gtgggcagga tgggggtaca 30840

gtgggcggct ggggagggtt tagccacaga tgtgttgtat tttttgaaag tgcaataatt 30900

tggtattttg aagacccggc gtgtggtcag gaacccccgg ggaaggcggg ggcccagggt 30960

gcggcaccgt gtggcgtggg ggggtctcag ttttctagcc agctacctcg gtaattccaa 31020

ttcaggttaa cttccctacg gaacagcaca gatgtccaca gatgtccaca gctgccgccg 31080

ccgccgccgc caccataccc cggtccttgg ggcatgggtt gcggtcgctt cccaaggggc 31140

agcagggacc ccggccaccc cggctctcgg tttgggttga ttcctctcct ttttgctctt 31200

ggttttccga cgggtacgag gctggcccgg caccctgtcc cccgggagcc tcactcttcc 31260

agcaggacca gaccaggggc ctccttcctg tccccaggcg ttcccggccc ctcgcaggcc 31320

ccacccatgc ccttggcctc agggtccaac aactggggga gctaccaggg ctctgccttc 31380

aggagcccac agctgggcac cccccttgcc ccgcaggaga ccggggcgca ggcggggcac 31440

cggcctcacc tggttctcca acaccgctgc ctgcggtctg ttttgctttt gtcctcccca 31500

gcccagaatt ttcctttgta taaacagaac tcctagtcag gaagcaatat catttcaggt 31560

ctaaagaaag ggacgtgcat ctggccgagg gcagttcagt ctcactgcag agcccgcagc 31620

ccgctgcgca gctcggcccc tcccgcccgc acgggcagct gaaggccgct gttttctaat 31680

atttgtattc taatttaatt gtttttaaaa aatgcaaata aaaaaggtcg aggtgaagcc 31740

a 31741

<210> 2

<211> 3159

<212> DNA

<213> 人（homo sapiens）

<400> 2

ggaggagcgc gcgcgggtgc taattggccc gggcggcggc cccgcccgcg agtggtgagc 60

ggtcacgtga cgcgacggct gggggctccc ggcgcggggg acgctggtga ccaagatggc 120

ggcggagctg gtggaggcca aaaacatggt gatgagtttt cgagtctccg accttcagat 180

gctcctgggt ttcgtgggcc ggagtaagag tggactgaag cacgagctcg tcaccagggc 240

cctccagctg gtgcagtttg actgtagccc tgagctgttc aagaagatca aggagctgta 300

cgagacccgc tacgccaaga agaactcgga gcctgcccca cagccgcacc ggcccctgga 360

ccccctgacc atgcactcca cctacgaccg ggccggcgct gtgcccagga ctccgctggc 420

aggccccaat attgactacc ccgtgctcta cggaaagtac ttaaacggac tgggacggtt 480

gcccgccaag accctcaagc cagaagtccg cctggtgaag ctgccgttct ttaatatgct 540

ggatgagctg ctgaagccca ccgaattagt cccacagaac aacgagaagc ttcaggagag 600

cccgtgcatc ttcgcattga cgccaagaca ggtggagttg atccggaact ccagggaact 660

gcagcccgga gttaaagccg tgcaggtcgt cctgagaatc tgttactcag acaccagctg 720

ccctcaggag gaccagtacc cgcccaacat cgctgtgaag gtcaaccaca gctactgctc 780

cgtcccgggc tactacccct ccaataagcc cggggtggag cccaagaggc cgtgccgccc 840

catcaacctc acccacctca tgtacctgtc ctcggccacc aaccgcatca ctgtcacctg 900

ggggaactac ggcaagagct actcggtggc cctgtacctg gtgcggcagc tgacctcatc 960

ggagctgctg cagaggctga agaccattgg ggtaaagcac ccggagctgt gcaaggcact 1020

ggtcaaggag aagctgcgcc ttgatcctga cagcgagatc gccaccaccg gtgtgcgggt 1080

gtccctcatc tgtccgctgg tgaagatgcg gctctccgtg ccctgccggg cagagacctg 1140

tgcccacctg cagtgcttcg acgccgtctt ctacctgcag atgaacgaga agaagcccac 1200

ctggatgtgc cccgtgtgcg acaagccagc cccctacgac cagctcatca tcgacgggct 1260

cctctcgaag atcctgagcg agtgtgagga cgccgacgag atcgagtacc tggtggacgg 1320

ctcgtggtgc ccgatccgcg ccgaaaagga gcgcagctgc agcccgcagg gcgccatcct 1380

cgtgctgggc ccctcggacg ccaatgggct cctgcccgcc cccagcgtca acgggagcgg 1440

tgccctgggc agcacgggtg gcggcggccc ggtgggcagc atggagaatg ggaagccggg 1500

cgccgatgtg gtggacctca cgctggacag ctcatcgtcc tcggaggatg aggaggagga 1560

ggaagaggag gaggaagacg aggacgaaga ggggccccgg cccaagcgcc gctgcccctt 1620

ccagaagggc ctggtgccgg cctgctgacc ccggccgcac actcgacttt cctggtgctc 1680

accacgcaga ggggcacggg ccagcctcgg gcgcagaggg aggagtgacc tttctttttc 1740

tttttattgt cgttcgtttt gtttttccac ccttttgcct ggctcctggc acctgtacct 1800

ctggactctc ctatcggggg attaaaaaaa aaagtaaaat gacaaaaaaa gatacaaaaa 1860

agaaaaatga aacaaaaaag tcaaactctt aaaaacaagg ccggccaccc acacagccgc 1920

ctccccggct ggagtccgag ccgggaaggg gtagtgggcg ggagggacca ggacgccgcc 1980

ccgcgccctc ccctccggat gccccgccgc ccgccgccct ctgcccacga ccattccagc 2040

cagtgcgcgg ggacccgggc ggcgggcggt ggggcgcagc ccctctctgg cgaccacttt 2100

gacgtttgtc tcttcctttg ctttttctct gcaaatgcat cctcgcccag agaccctcac 2160

gcgccgagca gcgagcgttt tagccgagaa gccatggagt gggttggggc ggggaggggc 2220

agtagggtgg ggggatgggt gggcaggatg ggggtacagt gggcggctgg ggagggttta 2280

gccacagatg tgttgtattt tttgaaagtg caataatttg gtattttgaa gacccggcgt 2340

gtggtcagga acccccgggg aaggcggggg cccagggtgc ggcaccgtgt ggcgtggggg 2400

ggtctcagtt ttctagccag ctacctcggt aattccaatt caggttaact tccctacgga 2460

acagcacaga tgtccacaga tgtccacagc tgccgccgcc gccgccgcca ccataccccg 2520

gtccttgggg catgggttgc ggtcgcttcc caaggggcag cagggacccc ggccaccccg 2580

gctctcggtt tgggttgatt cctctccttt ttgctcttgg ttttccgacg ggtacgaggc 2640

tggcccggca ccctgtcccc cgggagcctc actcttccag caggaccaga ccaggggcct 2700

ccttcctgtc cccaggcgtt cccggcccct cgcaggcccc acccatgccc ttggcctcag 2760

ggtccaacaa ctgggggagc taccagggct ctgccttcag gagcccacag ctgggcaccc 2820

cccttgcccc gcaggagacc ggggcgcagg cggggcaccg gcctcacctg gttctccaac 2880

accgctgcct gcggtctgtt ttgcttttgt cctccccagc ccagaatttt cctttgtata 2940

aacagaactc ctagtcagga agcaatatca tttcaggtct aaagaaaggg acgtgcatct 3000

ggccgagggc agttcagtct cactgcagag cccgcagccc gctgcgcagc tcggcccctc 3060

ccgcccgcac gggcagctga aggccgctgt tttctaatat ttgtattcta atttaattgt 3120

ttttaaaaaa tgcaaataaa aaaggtcgag gtgaagcca 3159

<210> 3

<211> 30449

<212> DNA

<213> 食蟹猴（macaca fascicularis）

<220>

<221> 混杂特征

<222> (11806)..(12020)

<223> n 是 a, c, g, 或 t

<220>

<221> 混杂特征

<222> (20000)..(20513)

<223> n 是 a, c, g, 或 t

<220>

<221> 混杂特征

<222> (22511)..(22874)

<223> n 是 a, c, g, 或 t

<220>

<221> 混杂特征

<222> (26906)..(28773)

<223> n 是 a, c, g, 或 t

<400> 3

ggcggccgcg cgcgcctgcg caggacgcaa cagcgcgcac gggcggcggg aggagcgcgc 60

gcgggtgcta attggctcgg gtggcggccc cgcccgcgag tggtgggcgg tcacgtgacg 120

cgacggctgg gggctcccgg cgcgggggac gctggtggcc aagatggcgg cggagctggt 180

ggaggccaaa gtgagtgagc ggcggcggaa ccggccgggg caagtgggcg agagggcggg 240

ggccgggccg caggtcgagg tctgcgcctt ctgtccgggg ccccacagcg cggccggccc 300

gcggctcgcg gtcccggccc ccagaccccg accccgggtc tcagggtgag ggcggggggc 360

ggggaggccg ggggcggggc cctcctgcct cacccgggtc ttcgctccgg gggtcgcttc 420

cccggcttca ggcaggctcc cccccaccca gcccgagccc ttggagtccc ggtccctaag 480

cgccaggcca gggccgcgcc tcccggttga ggcaccgttc tcccgggctg cgggacgtgt 540

tgagcttctc gttgctctct tggttccgag ccggggtctt tgctctttgg ctggtgtgta 600

ggggggagtg tctgcgcctc cccgcccgca gggctcccaa gaatggtatc tgggtctcgt 660

ccccgcccaa caggccagac tggggtttgc gagtctcctg cttggaaggg tcccctgagt 720

cccggagagt gtcctgccac agtccaggta gaggagtcag ggccctgagg ccacctccaa 780

gacacagcac gtcctcttgg ggtctggagt ccaggctcgg gcttgagccc ctctgcagct 840

cctgcattgg tcccagaacc ccgccccctt cccgacaccg tctctcacac gctggagtgg 900

gcgctgggga agactgggcc ccctctttcc ctccccatag aatggagtcc tgaccacttt 960

tcttggtcaa agactttcct tattctcctt ttttttaatc ttaaatcctg gactgtgctt 1020

tggtcctacc tcattcccgt tgggacagaa tctaaggcta ctaattctgc ttcaggggcc 1080

tctaaacctt acctgtgcag catcagatac tgtcttcaaa ccttgggtgc ttctcttatt 1140

ttctgttctt gagcgagtct actttttagg tcagacaccc tccctcccta cacagccccc 1200

agaatcttta tgcaccccag ctttggtttt taaggtctcc tgtctttctg cctattctct 1260

tatgttgatc tctggagggt ccccactggg tccaagattg gcttctttag aataacttct 1320

gctgctagtc ttttatacta cggatcctgt gcaggtccca tgtcccatag ataccatctc 1380

ctaacttgga acccatttta atcctaggat tgagctccga gtatccgcat tccaggggat 1440

gtaccttctt gtaggtgcct gcctaaagct gagggtctaa aacccttaga agtgcccgca 1500

aaaccacggc ttccagggag gttaggggac ctctccctcc cccatccctc ttcacgtctt 1560

ccctccccac agtcctgacc tgtacatatt ttcttctcag tcctctcaca ttacccactg 1620

ggatctgaaa acacagcact cagggctatg tgattacagc atacacctct cttcgcctcc 1680

caaccctgcc cctctccccc gccccgcaca cacttctgtc cctctctaga gttttgaaaa 1740

gtggagactc gccctggaga tgtggaggcc taaactctgt aaacccgagg tggcaggctc 1800

tgggcttgaa gtgccctgga gtcctgaaat gtaacctcct ttctggactt ggagctgtga 1860

ccctggactc cccaccccca ccctggctga gggcagggtc tgcactcttt tgtaccatcc 1920

aggccttgaa atatgatctg atgaactttc cttgaccctc tggtgactag gtccccccac 1980

ctcaattaaa tcaagttgat ccttctttca ggttctctaa accgtgagct tccattcaag 2040

ggggcctgga ccccggggag ccttctttct tcttgagtcc attgctaccc ctctaagtac 2100

cttaaatgtc attgaaacat cccccttttt tacaggggcc ttctccagcc tgtcatattc 2160

atggctgcag attctgtctt ttggggtgca tcacagactg ctcggaggga cgaatgttgg 2220

gggcttgttg gtgaactttg aaatctgaga ctctcagctt gagacctgga ggcaggtttg 2280

gggcaggggt gtctgtgagc tccctgaaat agtccgcagc acacatctcc actttcctgg 2340

aaagaggcgc cttcctgagc ttcccccagt gctccgaggg gcctgtgcta gaggagaggt 2400

tcagcgcagc tgctgtgtct cggctgatgt ctccccacgc gacttccagg caagcctgga 2460

gttgaaactc tggaagctgc cggggcctgg cgctgtttat aaacacagct ctgacggcag 2520

gcaggtcagc tcagagccag ggcaggaagt gatcctgggg catttggggc ttcttcctga 2580

atgcttgtcc cccccgcatt ccctccagtg tcaagggcag gctcctctga ggtggcagct 2640

gccgggaaat ctgagtcgtg aacatatggc cgcctaaggg gtgtgctccg ggaagtggga 2700

gctggggctc cactgtccag cctgggcggg gcggaggctc ccggggtgcc aggatgtcag 2760

caggttcctg agcccacctg ccttcgacca ggctgccagt gtgaagtgtc cacatgacat 2820

cgtctctccc tgctaaggcc ttgggccact tccagaagaa acatcttgtc cgcaagcctt 2880

tgtgttttct gcacaaggta ggaagtcagg ccaagggagg tgaggcattt ttgttttcaa 2940

agcatcactg actctgaggc ccagcagacc acgcaggtcc ccatagccag tgtgctggtg 3000

agtgagggtc cccggcagcg gacgggaaca ccctggggag cccaggggcc gaggggctga 3060

tgccagtccc atgcatgtac tagggaggct ctgggccagc cacttctctc tgtgagcctc 3120

ggtttcctca cctacacgat gggtgtggtc attgtgaaat tagcgacata ggcctcgctg 3180

gtgcctggca gggagcagac gctggcatcc cggttcttca tggtcacggg gccgcgcaac 3240

cctgatacgg gaagaggctt ctcccgaggc tcttagggca ggactgggcc acccacacgt 3300

gcgtccctgt cgttttgagc cgggacagcc tcttcgtctc cagcaggatc ctggcctggt 3360

acagctggaa ggaatcagag ttgacagatg aggaccccgc cagcggcccc ggctgctgca 3420

gccttggtgt tgaaatgggc ggctaggctc ctggcctcac cctggggcag ccgggagctg 3480

gaaaccccag cacttcctgg cacggaggcc gcagtgtaga cactccagtg ggactgcctc 3540

tggctttgac cctcagggtc tttcgagtgg agtttggatg acttattggt ttcttcgggt 3600

gcctgccagc tttgcttacc acccttgaca cttgagcttt ttctccattc ctcctggaag 3660

tttctctttc ccaccacatc tcattcatcc caggccagct tcagggctga gggtgggtgg 3720

ccccgaaacc ctgccagccc atccctcgag gacacctggc ttctgcagcc tgttgagctc 3780

tctttccctt tcatggtcct acccctcatg gaggggaggc cactgccagg ctaccccaca 3840

tcaaacacta gggtcagctg ggctctgttg tttggtttga tttcgctgga gaggtactgt 3900

cgggggatga gggccaggtc ctgccaagcc tcattcgtca cattggccca ggtcccgcaa 3960

cagcccctgt ggctgctgcc ttcccctcgg accagtcccc cagggactca gggcgatgtc 4020

tggagatgta tttggttgtc atgaactgtg ggtgtttagc accccacagt gcccgggacg 4080

gccccagcgt ccacagggcc gaggggacga aaccctgctg gaatgatggg tagacgtttc 4140

ggaggccccc acaggcccgg ccctgtgttg ctgtccggag gagagtgtgg cagcagggac 4200

cgcccctggc ttcagagccg ggtctgggtt tgaatcttgg cactgccacc tctgagccta 4260

cagttctttt gtgacagagc tcacacacca gcctagcagg ggtgttttaa ggatcagagt 4320

taaatatata atcacatgac cgacttggtt cccggcaggt gattagtgct aagtaaactg 4380

tggctaccgt tggcgagacc gaagggaaaa catgtctgtg gctgacaagg gttgagcgcc 4440

cgcccagcca gtgctttatg tcattatcct cccgacgaag agactgaggg tcagagaggc 4500

acttggtgtt tgtcggcaag gcactggcag aggccgttta caagtaaagc acgattccca 4560

gttcctgccc tggggatgct ttcaggctga agacagggaa agagaaccta aaatagaagg 4620

ggggcctagt cagaggcgct tttgctgcgt tggcgatgct ggggaaagtt tgatgaggag 4680

gagggaggcg gcagggcttt gctgggaggg ggcaccgtag gggcagggca ctccaccagc 4740

cccagccaag gctggcgctt cctggcgagt gggtgtctct cacggccccc gcctcagggc 4800

ctggcctctg cggagtcccc tgcctcgcag ctctgccttc tgagttgtgt gtgcttgctc 4860

ctcctcagaa catggtgatg agttttcgag tctccgacct tcagatgctc ctgggtttcg 4920

tgggccggag taagagcgga ctgaagcacg agctcgtcac cagggccctc cagctggtgc 4980

agtttgactg tagccccgag ttgttcaaaa agatcaagga gctgtacgag acccgctacg 5040

ccaagaagaa ctcggagcct gcccagcagc cgcaccggcc cctggacccc ctgaccatgc 5100

actccaccta cgaccgggcc ggcgctgtgc ccaggactcc gctggcaggc cccaatattg 5160

actaccccgt gctctacggg aagtacttaa acggactggg acggttaccc gccaagaccc 5220

ttaagccaga agtccgcctg gtgaagctgc ccttctttaa catgctggac gagctgctga 5280

agcccaccga gttaggtgag tggccgcccc ggggaggctg cgacgggagg cctcacctag 5340

gccctgtcgc ccagcccagc cacgcagccc acctttggtg atgttctctg gcgcggccag 5400

ggtgggagcc acggtggcca gggctgtcct tccctggaag caaagggacc atctttgata 5460

ttggtcaccc cttgctgtgg tacaagttac cctgaaatgg agcagtgggc gtctgttagc 5520

tctcaggaac cagcgagccg cgttgcgggg cgttggggct cgggggctct catgaggctc 5580

agtcaggccg gagccacctc atccggaggc tcgaccaggg ctggagcagc cacttcctcg 5640

tgtggtggct ggcaggctgc agctcctcac cggcttttgg ccgtcgtccc caggtcctca 5700

ctgtgcggcc tcctgcacgg gctgcccggg cttcctcagc ctggtggctc cctcacccta 5760

gggtagcgag cgtgcacgtc cagctgggag ctggagccct ttttatgacc cagcctcgga 5820

cacgccttgc cgtctccccc atggagtcca ttgctcacag actctgtggc acaggcaggg 5880

accacaccag gctgtgactg ccagggccaa gggtgaccag ggtcacctgg gaacctggtt 5940

tccctgctta ttccccatgg aaagggggct ggccagtggc atcggccttc cctccttccc 6000

ccaggctctg gttcctcgct ggcagcctgc aggtatggcc ttggtcagcg ggctcaggtc 6060

actgccaggc tgtgcgcacc aggcgtgctg ggggctcagg gcgatcccag gcagaggaga 6120

ggtgctgggc tccacgcttc tctctctcat gtctttgtct gcaagcactg actgagcagg 6180

agtgtgtcag gacctcgcag cccgcagcag tgtggacagg cccctggcgc ctcccagcag 6240

ccgtgaccat tcaggctgca ggtgggtatc aagcccggtc tctgcctcaa ccatagccct 6300

gagctcaggg ccagggaggc cagagcagcc ccagccccca gggcagggag agtgtgcagc 6360

ctctgggact cccagttagg gagcagaaca tcctgggcct tttgcggacc tgtgccccaa 6420

ggcgctcaga ttttaccagg tcctctgtgt gcctggaggt ctcttcttcc tgcctccctt 6480

cccctgcccc cactctttcc ttcgcagtaa acgtcgcgca gtaaacgtcg gagtgcagta 6540

aacgtgggag tgcctgctgg gtgggtgcgt gatgggcacc aggcatggac acgcagcagg 6600

gaacgggacc aaggccgcga ggttcaggaa gcctctgcac gccccctccc accctgctga 6660

cccagcgacc tgcctggtcc ctgctgtggc ctgagggctc ctctctggca cgcttcagtc 6720

cactgggtgc cagctggccc cactcccctg ccccgggagg cagggtcaat gggggtgtgg 6780

ggaaggggaa ctggctgcca ttcccctccc acctacagcc ctgggacttt gtgaggttag 6840

gttggagggg ctgggcttcc aagtgaggtt ggaggaggtg gaggaggtgg aggaggtagg 6900

aagatgctgc tggtggttcc tgatacagtg aggctcctcc ctccagcctg aggctccgcc 6960

ttccaagtga ggctccgcct ccaccttttt tcttttgcag gaggtgtcta gcggcagcct 7020

cctggggagc aggttggccc agcagcacct gtcctgggag actcggggcc ttggcctgac 7080

tttcccggcc tttgctgcct cacgagggaa gcggttcccc cggcgggttc ttgggcagag 7140

ctggctatct ctgaagcttg ggccttggga aggacctgca tcacagggag gctgggcttt 7200

cccgggagcg gcagggcagg cttggtccag ggcgggggac ggggctgact gtcttccttc 7260

ctgcacgggg accagtagct ccatcccaca atgcatcact gtgccctgag cccccaggga 7320

ccccggtcac ctgatctccg ggagagccag ctcccctgtc tacaccagta tgactctgct 7380

ggcggctcag aacaaagagg ccaaccccac cctgcctctc cttcccactg gccccctctc 7440

catcctaggc caccaggtga acctcctttc ctggattccc atgctcttcg gggacccccc 7500

cggggaatgc ctgggtcctc agaggtttcc tggagcatag accctggccc caaagcagtg 7560

ctccccttgg tttcagggcc tgagatgcca ttcctccacc ccgaccctgg gctgtgtccc 7620

tccccagggt gcactctgtg gtgctggcct tgcgggggac cgcctcagga ggacccggtt 7680

ccaccggctt cccccttgcc cccgcctctg gctgtgaccc accggccagc gtgaggccca 7740

ctgctctggt ctgtttcccc ggaatagctg ccggccggct ccaggatgga gactgcgcca 7800

ggcggacagg agccataaat cacgtggcgc ggaatgctgg gctgggggag ggggtgacag 7860

agctgcagag caggctacgg gggcctcggg ccacagatga tcggctccag tgggaggtac 7920

catgtgtggg gacggggctg gcgcccagaa cagtgcggag aatggcccaa ggtcacacag 7980

cggcctgcct tcccttattc tgagccgact gggtcctgcc tctgagcaga ggctctggcc 8040

tggacctcgc gaaggctggg gcccctgtcc tgcctctcag cagggaagcc cgccccaccg 8100

cttcccagcc tgcagcacct ggggagtccg gccagggggc ctgaccctcc tgtcagggca 8160

catgggaaga gaggctgtca ggagatgtgg ggcggaagga aggacacacg ctggccgggc 8220

gcagagctgc ttctccaggg cctcggccca cagcgggcac cccgaggaat ctgcctgctt 8280

gcccgcctgc tgtgcagagt ggagcccctg tcgccacggc ttcagacgcc cccagaggca 8340

ggaagccctg gcactagcca agagctgcca gtcgggcatg tgctgtgctg tgctgtgtgt 8400

agacacatgt gcccttcagt ctctgaagcc cttgggtgag cattgcccag gccacagcaa 8460

ggtagcatgg tccctgctca ggtgccacac agaagtgcca ggtgatgagt gtctcgtggc 8520

tggcagaggg ctttcagggg cagctgtcag tagcgggagc cattcactgt acatttggga 8580

ggaggtagca gtcaggaagg cttcctggag gcagcagctt ccagtccaga cctgagggtg 8640

attcccaaga agccaggcag cgaggagggg gcagaggagt gtactccagg cagagatggg 8700

gggcagggga gtgtactctg ggcagagggg agggggcaga ggagtgtact ccaggcagag 8760

ggcagtgagg gcagaggccg atggccagag agggctcatt cacagggctg aatggagtcc 8820

attgtggcca gagtgtggtg tgcccaggag gagggacgca gcagcctggg tgcaggcggc 8880

agaggctgga acccgagaat ggtgggtcca gggaaggttg gaagctaccc tgctttcccc 8940

gagggctgca gcgcccctga ggttctggtg tgattttggg ggtcagtgag gaaactgaga 9000

ggtgcaggag gcaagtggcc acctgccttc cacagccagg cctgctgccc gcccaggccc 9060

accatctgtc cgtctgcaca ctgggagcct ggggggcacg gggcatcctg tgtcactgtc 9120

ccgtgtgtag ggtagtctga cccactcggc ccgctggcac ttcccgtgcc tatgattggg 9180

gaacaagggg actccgccag ctctgcccca ggtccgggcc ttctggttga ggaggaggga 9240

tgggcccacc gctaccaact gggggactgc tggcagccac ccccacatcc cactggtcct 9300

tctcctgtcc cctgtggccc ctgccctgcc cagcccagtt ccccacctgc ccgccggcca 9360

cagcctcctg ctctgcttcc tgcccactgg tccccctccc atggcagcct gtgaatgttc 9420

tcgctgatgg gtggagctgt cagcaccgcc ccctgtgcct agccaggggc acctgttccc 9480

cacccctcca ggacagtgcc ccctgtgtcc ctcatacctg actgtgctgc ctctactctt 9540

gatctggggg acctggggtg gggagttggt gctggtagct cttagctgga cagggcgggg 9600

ctgggagtta gagaacttgt atgtgctggg gaggggacag cctggaggag ggggccagca 9660

catgggccag ctggaggcag aatggtccca tccgatcagc ttttttaaaa tttttttatt 9720

tttgagatgg agtcttgttc tgtcgcccag cctggagtgc agtggccgga tctcggctca 9780

ctgcaagctc cgcctcccgg gttcacatca ttctcctgcc tcagcctccc gagtagctgg 9840

gactacaggt gccgccaccg cgcccggcta gttttttgta ttttttagta gagacggggt 9900

ttcgccgtgt tagccaggat gatctcgatc tcctgacctc gtgatctgcc cgcctcggcc 9960

tcccagaagt gctgggatta caggcgtgag ccaccgcacc cggccctgat cagcctttta 10020

aaatctcccc gtgtttcatt tctatttaca cttgcacaat gatgcgcctg tcccagaaaa 10080

ctggagtcaa cagcagagca gcccggctgg cgccctgctg cccgagcggg ccgcctcagc 10140

gcagcgggcc gtgcttgccg ccttccccct ttgcctgtgt gattgtagga gcgtgtggct 10200

gtcctggctg ctgttttata accacccccc atgctgtgag catctgctcc tggcgttaaa 10260

tattcatgtc agcagcatct cgcgaggctc cctggcagcc ttgggtggag ccagcggctg 10320

ggcccttctt gttgggctct cggattgggc ccatgggctg ctttgcatgc ccgggctgga 10380

gggcctggct gggcacctca tcccagaacc ggctctgcct ggcagggccc agcctcgcac 10440

ctggccgcaa aggtgcatct ggttcagcag cgcctgtgcc ttggtcctgt ggcccgtggg 10500

tgccgggcag tccacgaaac cgtctccccc tcggggaact tcatgcttca atggcccaac 10560

aagaaggagc agcagagtga tgcagggaaa ctgagtcgat ccttggaggg agaaggtttg 10620

gagaaaagcg gggcgggggg tgcagttttt aaatgaggtg ctcagggaag cctttccttc 10680

tggttacatt tgtgcaaaga caaatatagg gccatgaggc tggtcgggag aggaaggttc 10740

cagaagaggg aatggcgtgt gcagagtccc cgaggcagca tggctggtag ggcccaggca 10800

ggaggccagg gtgggtgtgg ccctgaacag gggtgctgag ggccaggggt ctcctgcaga 10860

gccagcccag ggagcaggct ctggctgctg agaccagcag agctggggac aggtgtccgc 10920

gtcgggtggc atttgaaagc agaactgaca ggactggctg ggggagggga tgtttgcagg 10980

acagcagagg cgggggctgc gtggatgcca cctgggtttc tggccccaaa cagctgaccc 11040

cgagggcaga agaggaggtt tgcggtagcc cctcttccta agggccagcc acagcccctt 11100

ccccagcaga ggggggccag gtgttagggg ggatccgtga gcggcctggg gcgagtagca 11160

cagcagagca gtcagagcac agggcatctc ccgggtcccc agcagagaag cacagcctgg 11220

cctcccccag agggagcctc ccggggcaag gaccccagag ttttggtctt caatgactgg 11280

gccctttctg ccccaggcat ggacttgctg cttattgggg acccaccctc ctcccctaat 11340

tccttctgag acactgaggg gtggagtgtc cgtgttttca cctctgaccc agcctggaag 11400

ctcaaggccc agctcaggtg tcggctcctg tgaggcctcc ctgccccgaa ccattgctcc 11460

ccggcgcttg gggcagatct gggcgcatct acaggtggcc tgtgtgcccc accctcccaa 11520

ttaggcggcc ttcctcaggg gcccagctgg gcatccacag cccatcacct ctgcagagac 11580

tggctgtgcc ctcagcacat aaacgggaac aggctgtggc actgtggcgc ttgtggcaac 11640

accactgctg cggtagcacc ctcttcctga gggccagcca cagacccggc accggttccc 11700

gcagaaacgg gtcagcatgg gccggacatg caggctcagg ccacaaaggc cctggcaggg 11760

ctgggatccc agcccaggca gtctggcttc tttttttttt tttttnnnnn nnnnnnnnnn 11820

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11880

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11940

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12000

nnnnnnnnnn nnnnnnnnnn ttttgagaca gagtcttgct ctgtggccca ggctggagtg 12060

cagtggcaca acctcggctc actgcaagct ccacctcctg ggttcacgcc attctgcctt 12120

agcttcccga gtagctgggc ttcccgtgag ccaccacacc cagccggcag tctgagcttc 12180

tgagcctaaa gcagatgtac tttttacatc gttacccgtt ctcatgggtt ttaattgaga 12240

aagttccaag acggtgctgg cagttgaggt ccgatgccac ggctccggtt cttgtaaagg 12300

cccttgtcat aggtgcaggc cacactgctg tgtgcactgc cgtcctggga gcacctttcc 12360

aggaccgggc agtctctgct cataacacag acagtgtggc ctgcgaagct gatgaactcc 12420

agcctttacc agggcagttc gccgtccttg ttctgaaggg cttgcccgtc atcttgtctc 12480

ccggccactc caaggctgcc attgtggcca gattctctct cccccacgct cctccgatat 12540

ttttttacac ttatagacaa ataggcattt actcagattc cttccctccg ttttcgttac 12600

acaagcgatg gcagggcata catgccgctc agtgtttttg atttacgtct aaatatattt 12660

tttaacgtag acacagtctt gctgtgttgc ccaggctggt ctcacacttc tgaacccaag 12720

caatcttccc gcctcagcct cctgcgccgc agggatgaca gctgcacacc agcacacctg 12780

gctcaggctc atttaaaaat ggttttttag agacaaggtc tcactatgtt acccaggcta 12840

gtctccaact actgtgctaa agcgatcctc ctaccttggc ctcctaaagt gctgggatta 12900

caggcatgag ctgccgtacc cggcctgcaa gtctctgaat gcatgtttcc atttactttg 12960

tttttttttt tttttttttt tttgagacgg agtctcgctc tgtcacccag gctggagtgc 13020

agtggccgga tctcagctca ctgcaagctc cgcctcctgg gttcacgcca ttctcctgcc 13080

tcagcctcct gagtagctgg gactacaggc gcctgccacc tcgcccggct aagtttttgt 13140

atctttagta gagacggggt ttcactgtgt tagccaggat ggtctcgatc tcctgacctc 13200

gtgatccgcc cgtctcggcc tcccaaagtg ctgggattac aggcttgagc caccgcgccc 13260

ggccgcatgt ttccatttac tgaaggaaaa tactttgagt gggattcctg ggtgctgggg 13320

taggtctgtg cttaccttta taagggcagt ttcccaaagt gattgtactg tcttataacc 13380

ccaccagcag agagtttgct ctacaccctc gccacctcgt agagttgcca gtcttttcat 13440

tttagccatg ctagtggatg tgtagagaga tattttactt tattttacct catcttattt 13500

tattgatatg gagccgcact ctgtcaccca ggctggagtg cagtgaccca gtctcggttc 13560

actgcaacct ccgcctcctg ggtttaagca attctcctta gcctcccgag tagctgggat 13620

tacaggcgtg tgtcaccatg cctggctaat ttttgtattt ttagtagaga tggggttacc 13680

atattgtcca ggctggtctt gaactcctga cctcaagcga tccacctgcc ttggcctcca 13740

cagtgctggg attccaggca tgagccaccg cgcctggcct gtgtgtgtag agaggattta 13800

taccagtctt agatttctca cacaaatcgc aggggcctga aatactggct gatattttgt 13860

ggaggatttt acatctgtgt tcgtgagggg catttattgg taattttcct tccttgacgc 13920

cgtgttgtga ggttttggta tcagagttat gctggccttg taaaataggt agtattcttt 13980

ccttctctgt tgtttgaaag agtttacgta cagtttatgt ggtttctttc caaaatgttt 14040

tatagaattc accaatatgg acctgcagtt ttctttttct ttttcttttt cttttttttt 14100

tgagatgggg tctggttctg ttgcccaggc tggagtgcag tggtgcgatc acggctcact 14160

gcagcctcca cctcctgggc tcaagcgatc ctcctgcctc agcctccaag gtagctggga 14220

ctacaggtgg tgcgcgcctc cacacctggc taatttaaaa aatttttgta gagacagggt 14280

ctcactgtgt tgcccaggct ggcctcaaac tcctgggctc aagcgatccg cccacctcag 14340

cccccaaagt gctgggatta caggcgtgag ccaccgtgcc cgacctggac ctgcagtttt 14400

cagaaaaggt tttaattatg gatccaaatt ccttaacagg taacaaactt ttcaaacgtc 14460

ctgtatcttt tggtacccgt tctggtaatg tgcatctttg gaagaatttg tcactgagtt 14520

gtcagatccg ttggcatgaa ggtacacctt ttcttcccct gttggaccag aaagcggtgg 14580

ggtctgtgct gtggttctct gtcatttctg atgtgggtag tttgtgttct cactgtcttt 14640

ctgttgttca gctagagttt cgttcgtttg tttttgtttt tgtgttttgg gggttttttt 14700

ggaaacagtc tcgctctgtc gcccaggcag tggtgtgatc tccactcact gcaacctcca 14760

cctcccagct tcaagcagtt ctcctgcctc agcctcccaa gtagctggga ttacaggtgc 14820

ctgaaccacg cctggctaat tttttttttt ttttgagacg ccacaccatg ctgttttttt 14880

ttttaagaga tggggcagcc aggtgcagtg gctcatgcct gtaatcccag cactttggga 14940

gaccaaggcg ggcggatcac ctgaggttgg gagttcaaga ccagcctgac caacatggag 15000

aaaccctgtc tctgctaaaa atacaaaatt agctgggcgt ggtggcacat gcctgtaatc 15060

ccagctgctt tgggaggctg aggcaagagg atcgtttgaa cccacgaggc ggaggttgtg 15120

gtgagccgag atgatgccat tgcactccag cctgggtgac aagggtgaaa caaagtctca 15180

aaaaaaaaaa aaaagatggg gctggctgag cggaatggct cacgtctgta atcccagcat 15240

tttgagaggt tgaggtgggc agatcacctg aagtcacgac tttgaaacga gcctggccaa 15300

catggtaaaa tccgatttct actaaaaata caataattag ccaggcgtgg tggctatttg 15360

ggaggctgag gcaggagaat tgcttgaacc tgggagacgg aggttgcagt gagccgagat 15420

cgtgccattg tactccagcc tgggcgacag ggtaagattc catctcaaaa acaaaacaaa 15480

caaacacaaa gaacagtgtt ttctgactgc gcctctgctc gtcagtccag ttgtaagtaa 15540

tagggtaggg cccaggcttg tgagcgccat ggccttcatc ccgtcagtac ctccggcgcc 15600

acctctgtcc atgtgacgcc atggccacct tgcaggcacg aggagagcaa gggccgggtc 15660

cattttgtac ttaggaggga ggagggatgg caggtcctgc aggcctggct gggtccagct 15720

ctccccccag gcagctgggc atttttcagc cttcctaaat agacgcctgc atcccatggg 15780

ctgcaaaggg cactggctct ctgagtggcc ctcaacagga cacgggccgt ggtgaatggc 15840

cccgagaagg ggatggacgg gagtcctccc tcattctcct ccctcatcct cctccctggg 15900

cggcccccac ctctgcccca catatctgtc ccgccagctt cccatttcct gtttcctgat 15960

ctgaagagga gaaggccggg aaaagcgact gggctcgggg gacctgccag ggaccagaca 16020

tgcccatgac cctgtgtttg tcttcagtcc cacagaacaa cgagaagctt caggagagcc 16080

cgtgcatctt cgcattgacg ccaagacagg tggagttgat ccggaactcc aggtgcgcgg 16140

ctccccccca gccccgtgcc ctgccgcccg cccgctttct cctgggctca ctggaagagc 16200

cggcagccac gcccactgca ggcccggctc gggctcagtc cagaaccgtg ctgcgaggca 16260

gtggccgggt tcgctgcctt ccagaaaacc ccgtcctgag tgtcacccgc tgggctgtgc 16320

ccactgcctg taccctgcag cccgctagag agaggcggac tgaccgtccc cttttaacac 16380

ggtcttgccc tctgcctgtg ggaccatcct gggcgctgca gggtgctgag tagcattcct 16440

cgcctccacc cactccatgc cgagaacaca cccatgttgt gacagccaca gatgtcccca 16500

gacgttgtcc agtgtcccct ggggcaggat aacgcgggtg agacctccct gggttattgg 16560

attccacgta cccccaagag actctgcgtc ccctaatcct ctgccctgct gaggtcccag 16620

aaggctgcac acattgaaat ccacaccctg agttggaggg ggagagagga ggagaatccc 16680

gggagctggg gtccctggtt tacaccgccc gccttatccg gaatttattc tggtgtccag 16740

catgagcagg aagttaggtg ttttgttttg tttgtttgtt tttgagactg agtttcactc 16800

ttgttgccca ggctggagtg cagtggcacg atcttggctt cctgcaactt ccacctcccg 16860

tattcaagcg attctcctgc ctcaacctcc caggtagctg ggattacagg cgcccactac 16920

cacgcccggc tgttcttgta tttttagtag aaatggggtt ttgccatgtt ggtcaggctg 16980

gtctcgaact cctgactcag gtgattcacc cacctcagcc tcccagagtg ctggaattac 17040

aggcgtgaac caccgcgccc ggccaaagtc aggttttttc ccagataatg aacgcagggt 17100

ttacccctgt gcaccgtgga tagtgaggtg ggatcgttcc ctcggatgtc cccagacact 17160

gccctcagat gaggacggtt gaactctagc aggtgagggg ccagtgtggc tgctcggtgc 17220

tctgctcctc cctcagtctc tctcaggctg tcctgcctcc agctgagaca gattcttgcc 17280

ggggcagcct catggtgggt gctggaccct caggacaggg gaggcctttt gcccaggtca 17340

ccgctgagtc cgtggcaggg ctgggctggg cgcccccatt tgatgcccag cttctcatgc 17400

tcagctgctt cagacccacc gcctctactt gctgtggggc caggttcccg gggcctccca 17460

gcctggccct cacacctagt aagggttcag aaccagctga gccaggcttg gccacggagg 17520

cctctctgcc tgggtgaccc aaggtggtga cgtcaccttc ctcctcttcc ttgtctgtga 17580

acctgggtcc acacagctcc acccgcactg cgtccctgct gcggggtgct tgagccagcc 17640

acacagtata aaaaaatcag tttgggtttc tcctcagaaa gcttctggac atttcctttt 17700

cttttttttt ctttttttga gacagagtcg ctctgtcacc gggctggagt gcagtggcgc 17760

gatctcggct cactgcaagc tccgccccct gggttcaagc gatattcttc tcctgactcc 17820

gcctcgcgag tagctgggac tacaggcatg cgccaccacg cctggctaat ttttgtattt 17880

ttagtagaga cagggtttca ccatgttggc caggatgatc tcgatctctt gacctcgtga 17940

tccacccgcc tctgcctccc aaagtgctga gattacaggc gtgaaccacc gtgcccaacc 18000

cgcatttgta tttcttacgt tgagatatga tttgcatgcc atagaatacg cagtttttaa 18060

gtgtgtcatt gagtgggttc tcgtggatca ataggtagtg cagctcccac cactgcctag 18120

tctcggagca attgtgtcca tccccatcag ccaccaccct tcatccgctg gcccccacgc 18180

atcccctcct atctccgtaa atgggcttgt cctagacatt tcgtagaagt ggagtcacac 18240

actgtggctt ttttaaatga ttattatttg agacggaatc tcactctgtt gtccaggctg 18300

gagtgcagtg tcgcgatctc agctcactgc aacctccgcc tcccaggttc aagtgattct 18360

cttgcctcag actcctgagt agctaggatt acaggcatgt accaccgcat tcagctgatg 18420

tttgtatttt tagtaaaaac gaggtttcat catgttgccc aggttggtct ggaacccctg 18480

acctcaggtg acccacccac ctccgccccc caaagtgttg gggttactgg cgtgagccac 18540

ctgccctgtg tgtccttttg tgtctggcat ctctcactgg gcgggacgtc ctcacggtgc 18600

acctgtgctg aggcccgggt cagcctggct cctttccgtg gctgggtcac gtgccgtgtg 18660

tattggtcct tccgtctatg gaaggacact caggctgccg ctactttgtg gctgtcgtgg 18720

tcatttctgc tgtgaacatc cacggatgcg tctttgggta gagagacttt ttcctcttct 18780

cctggtgatg tttcttatta aagtttattc tcaggtgtta actgggtttt ttttgttttt 18840

ttttaatttg gagagtgttt ctctttgtta cccaggctgg tgtgcagtgg tgcaatcata 18900

gctcactgca gcctccgcct ccacgggttc agatgatcct cctgcctcag cctccaagca 18960

gccgggacca caggtgtgca ccaccatgcc cggataattt tttgtatttt ttgtagagac 19020

agtttcacca tgttgcccag gctggtctca aattcctggg ctcaagagct ccgccggcct 19080

cggcctcgca gactgggcat tttcttgccg ttgtgagctg gctgctacat tccagcatgc 19140

acgttttagc tgtttcctcg cagtgagagg cacctggctg ccctctctgg ttcagggttt 19200

tgcggtcgat tctcttgcat tttccaggga ggccagcccc tctcctgacc ctacagccac 19260

tcctgtctca cctggcctgc acaaaagagt cctgggcctc agtttcccag ctctagggga 19320

gggagccttg tggggtggca gtctccacct tgtggggcag gctgaggttg cgccttcctc 19380

actccgctct cctttccttt cctctggttt gctccacacc cacagagaac tgcagcccgg 19440

agttaaagcc gtgcaggtcg tcctgaggta tgcccaggtg tgcccacgac cccagggctg 19500

gacccccggc cacctgcccc tcctcccccc cgccccccag tcctggtcca ggctcttctc 19560

agtctcccct gccaacagca gagcccagct ccccccagcc tgccatctgt ccctgtctgg 19620

ggatacgcca ccatcccacc acctgctcag gccacacccg ggggccccaa taccccccat 19680

gtcaccttct ccagtgcccc catcaccgcc acttgactcc cacttgtgta cccctgcagc 19740

ggcccagccc ctcctgtgcg cctcatggtc cccattgttc cccacagcgg cctagcccct 19800

cctgtgcgcc cactcctgcc gccccatggt ccctgttgtc gttgcagaat ctgttactca 19860

gacaccagct gccctcagga ggaccagtac ccgcccaaca tcgctgtgaa ggtcaaccac 19920

agctactgct cagtcccggt gagcacggcc cgccccgcat ctgctacacg ggtttggggg 19980

gcgtggaggg agggtggggn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20040

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20100

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20160

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20220

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20280

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20340

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20400

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20460

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnagggtgg 20520

ggggcgtgga gggagggtgg gggccgttgg attttccagc cattcttggc tcgaggctga 20580

gcggtctgtc tgcttgcagg gctactaccc ctccaataag cctggggtgg aacccaagag 20640

gccgtgccgc cccatcaacc tcacccacct catgtacctg tcctcggcca ccaaccgcat 20700

caccgtcacc tgggggaact acggcaaggt gagtgcatgc tcggtgccca ccctgccccc 20760

ctgccccggc ccccgccctg ccagccctga ccccgcccct ctgtccccag agctactccg 20820

tggccctgta cctggttcgg cagttgacct cgtcagagct gctgcagagg ctgaagacca 20880

ttggggtgaa gcacccggag ctgtgcaagg cactgggtga gcagctcagg gccacctcgg 20940

ccgaggggca ggccaagtcc cccctggaaa ccttccctgt actgggcgag ggtggggggg 21000

cctgcacccg aaggagatgg gtaaggggct gcctgtcact ctaggggtcc atggcctccc 21060

cgctatggct gaggaggtct gtggaggata cggatggcag agggggcact tggcagtggg 21120

agctgctgtg cagaagcctg tggggtcaca ccccgtgttg ctggccccag gcgccccagc 21180

ctacaggggt ccaagcagca gaagagctgg ggccttgttc ctcattccgg ggcagcacag 21240

aggccgggag gggtgagagg agtccagagg gagctgcgct ctaagcaggc tcttctggtt 21300

gcctcagcgg ggtcaagggt gctgcggggc ctggcggggc acggacagcg atggccatgg 21360

aggcagttgc tatgggagga aggtgaacag cggcggtctg acctcacgtg gtgaggcccc 21420

attttatctt tttttttttt tttttttaag agagtcaggg tttccaggag gtggaggttg 21480

cagtgagctg agattgcacc gctagactcc agccttggct gcagagcgag actccacctc 21540

aaaaaaggaa aaaagagggt ctcactgtat cgcccaggct acagtgcaat ggtgtgctcg 21600

tggctcactg cagcctctga ctcaggctcc agccatcctc ctgcctcagc ctcctgagta 21660

gcttgggacc gcatgtgttt accaccacac ccaactaatt tttttttttc tttttttttt 21720

tttgtgaaac agagtctcac tgtcacccag gctggagtgc aatggcatga gcttggctca 21780

ctacaacctc cgcttcctgg gttcaagcaa ttctcctgcc tcagcctccc gagtagctgg 21840

gactacaggc acccgccacc acactcagct aaatttttgt atttttagta aagacagggt 21900

ttcactgtgt taaccaggat agtctcgaac tcctgacctc gtgatccgcc cacctccgcg 21960

tcccacagtg ctgggattac aggcgtgagc ctccgcaccc ggccccaact aattttttaa 22020

tgtttcctag agacaggttc ttgctgtgtt gcccaggctg gtcttaaact cctgggttca 22080

agcggtgcac ctgccccaac ctcccagagt gctgggatga cagtcttggc ctcttttgca 22140

cctgttctct tttgtacttg taacaatgaa aacaatattt tttaagtgac acgcagagca 22200

attttaaaag aaagcctact ggccaggcgc agtggctcac gcctgtaatc ccagcacttt 22260

gtgaggccga ggcgggcgga tcacgaggtc aggagatcaa gaccatcctg gctaacacgg 22320

tgaaaccccg tctctactaa aaatacaaaa aaatagccgg gcgaggtggc gggtgcctgt 22380

agtcccagct actcgggagg ctgaggcagg agaacggcgt gaacccagga ggcggagctt 22440

acagtgagcc gagatcgcgc cactgcactc cagcctggga gagtgagact ccgtctcaaa 22500

aaaaaaaaaa nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 22560

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 22620

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 22680

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 22740

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 22800

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 22860

nnnnnnnnnn nnnnaaaaaa aagcctgcca agctgggcag gtgaatgagt ccccccgtgc 22920

agccgcacag cacaaagcca gcgtacattt agccttgctt ggtggctgtg tggccttgga 22980

aagtcactgg ctttctctgg tggccactgt cttcaggaga atagatctga gccatcttga 23040

gggcacctgg gcctctctct ggaccccaca tgcttggggc tcaggcctca gtgggctcca 23100

caggcctgtt ctatggagag gctaggccta acctggagtc ctttggagct gggagtggga 23160

gttgggcagg tgggcgagga ctgggaccac ctgccagact gagaagaggg tggttctggg 23220

ccaaccgggt tagctcgtgc ccccttccag aatgctcgct gttttcaggt ggaatttggg 23280

caccacccca gccccttggc agaatggggg ccagagggtc tcccagctgc ccttcctagc 23340

tgcccagggc tcctgtgccc aggcctgaga gttccccatg agcactgccc tcctggcaca 23400

gccaggcccg ggcctctggc ccctgttcct gaccaccaaa gggctcctac tagcctgggt 23460

gtccagaagc ctggagcggt ggtgggactg ccaggggcct gcgagcccca tcgtgttgaa 23520

gcttcctgca cactccggtc ccccaagtca ggaaggatag ccggcagcac cccctctgca 23580

gagcaggatg tgcaggggtg agggtgccca ccgcagagtc ccgcatcccc ggccagcctc 23640

ctccaggctc ggggagggag ggcctggcga tgtccccgtg ggaccagtgg ggacactgag 23700

gcacagattg gcaaagttag ggttctgtga cctgggtgtc cccgccctgc ctccctcttc 23760

cctcaaaggg ccctttcttc aacccccccc caccttcctt tcctttgggg acaatggcca 23820

acttgaggga ggaggctggg gccgggcagg cctcttctag gcccatgggg tgggggccgg 23880

ccttaactcc tcagtgacca gagccctgca gtgctggggg ctgcagggtc agatttcctc 23940

tctgaagggg tctcctgccg cttcccacag ctggccccag ccttagcctc tttgtcactg 24000

gatttttttc tcgttgcacc taggaagtcc tcacgtttgc ctcacttgaa cccttcctgc 24060

tgcacatgtc tttctgtaca tggagaaggg agagcttgct ttaaaatcag atgggcacct 24120

gcatcccctc ctagctgccc agggcccctt tgccaggcgt gagggtccac gtgggcacca 24180

ggtagccaga gctgggtccc aggggtggaa actcagccaa ggagtgagcg actagggcag 24240

ccttggctca agcaggagag ctgctgggag cctgcgaggg ggccagacca tgctggccag 24300

cttgtggctg ccactgcgtc cctacgggag aaggaagaac ccactgctgc acacacaggc 24360

cggggggctg ggtgggggtc aggaaggagg aagtggcttc caagcggcca gagataagtg 24420

gtgtttcagg ccgacaaggg gtggtaggag catttccaga cagagaaacg tcaggacagc 24480

tgggggaagc ggggagacag gctggcacca tcactctgaa ccccaagtcg gttgggcagg 24540

tggcttccta gaggaagcaa aactggtcca ctaggcagct gagggccggg tggtggatgg 24600

agaggccctg tggactgtgg gccagggtgg tctgccctgc agggcccagg gctgggggct 24660

gtcctgagct agctgaggat ggagttcagc cgcatcccag aagtgtcagg aggcagccgg 24720

ggtccctgcg tgagttcctt ctggctgtgg gcctgctgcc tgtggagggg agggcggtgc 24780

ctgccccgag ccttcatgtt tcacgtgttt gcccgtgttc cgtgcagctt gctggcgggc 24840

accgtctttt cctttaaaga agcggctaca ctcctgggtg tgcgggctgc ctcggcgtgg 24900

tgtccggggc tgggcggcgg ccgcttcctg gctcacagcc gggaggcccc cgggtccatc 24960

tcccaaagga atccctgcct cattccccac tgtggccttg gggatggtgc gtcagtgacg 25020

gaattaagtc acagcaatga ccccgtcggt ggctgtgttg catgaaactt tccagaaaag 25080

tcccgtgggt cacagcccac gcggggtagg ggaggccaca taggccacct gcgtgtgggg 25140

gcttcggctg ggtctgtggt gtgcccaggt tgtggtcaaa tctaatggtg gtcgccgcct 25200

gacttcctct ggtgcctcgt ggccctgagc cacacagcga ggctcaaggc tcgttttggg 25260

ggcatccgtt ctgggaggtg gtcacgggtg ctggagagaa cccgaatccc agtcctgtgc 25320

cccactgtgc ccacctctct gacggcgtcc tccgttccct ccccacagtc aaggagaagc 25380

tgcgcctgga tcccgacagc gagatcgcca ccactggtgt gcgggtgtcc ctcatctgcc 25440

cggtgagttg gggcagcctc ctccttgggg cctctcctgc ggctgtactt cctccctggt 25500

ggccctgggc ccagggcatc ttggctggac cgtgagcctg cgggggcaag gctggtcttg 25560

gtccccccgt gttcctgagg catgagcgtt ggaacaagcc acaggatgga gctgggggtg 25620

aggggtgccg ggtgggcggg cacagcagac gggtgccatg ctcacgcagc ccctcccccg 25680

cagctggtga agatgcggct ctctgtgccc tgccgggcag agacctgcgc ccacctgcag 25740

tgcttcgacg ccgtcttcta cctgcagatg aatgagaaga agcccacctg gatgtgcccc 25800

gtgtgcgaca agccagcccc ctacgaccag ctcatcatcg atgggtgagc ctggggcccc 25860

gggagggcgg ccggagccgg gcggccgtgg agatctcggc ggcaccctgc ttcctgcaga 25920

ccccgtgctg ccccagcaag acacagcagt ggggacacgt ggtcccggag ctttggaagc 25980

cccgggctgt gagaagagcc cgtttcttcc tcgcggaact tttcagagcc tttgctgtgc 26040

aggcgatagg cgtgtagctt aggctgcaga aggcgggctc aggtccaccc cgctcccaca 26100

tgacctcagg caggtgtgac cttgagctcc aggagtgtgg tttttgcccc aaaaaaccaa 26160

gccggactct gctttcacac ggcgttcgcc ccaggatgcg cagcaatggg ggtggctcct 26220

cacagagagg cgaaggaggt ggtgcccctg gagtgctctg gccacgccat acccttccct 26280

tcctgggtgg cacagctgtg gccaggcatt ccccaggcac caggggacag gaggacaaga 26340

cctttctccc tggagggagg ctctgcccag ggcttaagtt tccagaaact gagccctgtt 26400

gtctgtggca cctgatgcgg ctcctgcatg gcgccggcca cgcccacctc tcgtccccag 26460

agcctctggc gggcgtgagg ccacagcggc acgagctggt gccctcacag gcgggagcag 26520

gccctgcctg ggggggtgag ctgggccccc agccctcggg tgcacggcct cagtggaccg 26580

tgcaggtgaa ggcagggctg gcctgcctct ggggtcatag atttggtccc taagtagacc 26640

tccggtttgt gcagttgtcc ccatcctggg aggcagacct gtgagcttcc ccattttaca 26700

gacgaggaaa caggctcaga ggaggcagcc agcagccgga gcccccctcg gctcacaggg 26760

ggccagactg ggacttgaac ttggcctgag tctgggtccc ctctgtggag ggctgggtgg 26820

ccaccccctt gcatcccagc ttcaggtaga aagaggagac cctagggccg ggcacgtgga 26880

ctgcctgaat ggctgctctg ttctcnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26940

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27000

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27060

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27120

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27180

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27240

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27300

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27360

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27420

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27480

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27540

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27600

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27660

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27720

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27780

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27840

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27900

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27960

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28020

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28080

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28140

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28200

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28260

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28320

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28380

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28440

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28500

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28560

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28620

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28680

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28740

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnatacagt ccacaccatc atatacacac 28800

acatccgtac agtccacacc atatacacac ccatacagtc cacaccgtca caaatacaca 28860

caaatacatc catacattcc acaccatcac atacacaccc atccatacag tccacactgt 28920

cacacataca aacacatcca tacagtccac accatcacac acacacctat acggtccaca 28980

ccatcacaca tacattcatg cagtccacac tgacacacac agtcgataca gtccacactg 29040

tcacacacac aatcgatacc acaccgtcac acacacaaat tgatacagac cacagtgaca 29100

cacacacaca atcgatacca caccgtcaca cacagtctac agtacacggt cacacacaca 29160

atctatatag tctacactat cacacatcca tacagtccac accgtcacac atccatacag 29220

tccacacggt cacacataca cacacacatc catacagtcc acattcacgt atgcccacat 29280

gcatccacac atggatgcac acatacactc acgtgtgcgc ttgtacacat gcatccatgc 29340

acacgtgtgc acacatgcac agatacactc acatccccac acaaacatgc atgcacacct 29400

ggaggtgccc agaggggcag ggagggccgg acccctgcag cccccacatc ccctgctctt 29460

gtgggtggtt gggggccact ggttttgtgc atccttgccc caccacccct ggcggtgccg 29520

tgcgcatgac ctgccgggga tcagcagctg caggagcctg aggccagggg agggaattca 29580

gggcccctgg accctgtagt cggggcgtga agctgctctt gcagagagca gtgggaagtg 29640

cctggcggca tccaggagga atggagggct ggggagttgg gggggcgggg cacccccagc 29700

cgcatcatca gctgtccgcc tcgccccagg ctcctctcga agatcctgag cgagtgtgag 29760

gacgccgacg agatcgagta cctggtggac ggttcgtggt gcccaatccg cgccgaaaag 29820

gagcgcagct gcagcccgca gggcgccatc ctcgtgctgg gtgagtgcct cgccaccacc 29880

aaccgcgcag tccccagcca gggcagcctc agtttcccca tttatcagtg gttgcatcct 29940

aagtacctgc accctgtcgc tgtcacccgc aggcccctcg gatgccaatg ggctcctgcc 30000

tgcccccagc gtcaacggga gcggtgccct gggcagcacg ggtggcggcg gcccggtgag 30060

cggcgtggag aatggaaagc cgggcgccga cgtggtggac ctcacgctgg acagctcatc 30120

gtcctcagag gatgaggagg aagaggaaga ggaggaggag gaggacgacg aagagggccc 30180

ccggcccaag cgccgctgcc ccttccagaa gggcctggtg ccggcctgct gaccccggcc 30240

gcacactcga ctttcctggt gctcaccacg cagaggggcg cgggccagcc tcaggcacag 30300

agggaggagt gacctttctt gttctttttc ttgtcgttcc ttttgttttt ccaccccttt 30360

gcctggctcc tggcacctgt acctctggac tctcctatgg gggattaaaa aaaaagtaaa 30420

atgacaaaaa aagatacaaa aaagaaaaa 30449

<210> 4

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 靶位点序列

<400> 4

gtccacaccg tcacacatcc 20

<210> 5

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸基序

<400> 5

gcgggtgtgt gtgatggtat 20

<210> 6

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸基序

<400> 6

gcgggtgtgt gtgatggt 18

<210> 7

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸基序

<400> 7

cgggtgtgtg tgatgg 16

<210> 8

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸基序

<400> 8

cgggtgtgtg tgat 14

<210> 9

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸基序

<400> 9

ggatgtgtga cggtgtggac 20

<210> 10

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸基序

<400> 10

atgtgtgacg gtgtggac 18

<210> 11

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸基序

<400> 11

ggatgtgtga cggtgt 16

<210> 12

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸基序

<400> 12

ggatgtgtga cggt 14

<210> 13

<211> 566

<212> DNA

<213> 人工序列

<220>

<223> 靶位点序列

<400> 13

gtccacaccg tcacacatcc gtacagtcca caccgtcata caaacacaca cacatctata 60

cagtccacac cgtcacacat ccatacagtc cacactgtca tacacacaca catctataca 120

gtccacacca tcacatgcac acacatctat atggtctaca ccgtcacaca cacacacatc 180

tatacagtcc acacctgtta catgcacaca tctatacagt ccacaccgtc acacatctat 240

acagtccaca ccgtcataca cacacacgtc tatacagtcc acactgtcac acatccgtac 300

agtccacact gtcatacaaa cacacacaca tctatacggt ccacaccgtc acacatccat 360

acagtccaca ccgtcataca aacacacaca catctataca gtccacacct gttacatgca 420

cacatctata cagtccacac cgtcacacat ccatacagtc cacaccgtca tacacacaca 480

catctataca gtccacaccg tctcacatct atacagtcca cactgtcata cacacacatc 540

tatacagtcc acaccgtcac acatcc 566

Claims

1.一种长度为10至50个核苷酸的反义寡核苷酸,其包含与选自由SEQ ID NO:1和3,或其天然发生变体组成的组的哺乳动物PIAS4靶核酸具有至少90％互补性,诸如完全互补的长度为10至30个核苷酸的连续核苷酸序列,其中该反义寡核苷酸能够降低细胞中该哺乳动物PIAS4靶核酸的表达。

2.依照权利要求1的反义寡核苷酸,其中该连续核苷酸序列与SEQ ID NO:1的PIAS4靶核酸中存在的内含子区至少90％互补,诸如完全互补。

3.依照权利要求1或2的反义寡核苷酸,其中该连续核苷酸序列与选自SEQ ID NO:1的位置143-5277；SEQ ID NO:1的位置5705-16390；SEQ ID NO:1的位置16476-20500；SEQ IDNO:1的位置20543-20864；SEQ ID NO:1的位置20956-21074；SEQ ID NO:1的位置21204-21285；SEQ ID NO:1的位置21390-25454；SEQ ID NO:1的位置25529-25774；SEQ ID NO:1的位置25936-29728；或SEQ ID NO:1的位置29860-29970的PIAS4的内含子区至少90％互补,诸如完全互补。

4.依照权利要求1-3任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ ID NO:1的位置25936-29728至少90％互补,诸如完全互补。

5.依照权利要求1-4任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ ID NO:4或SEQ ID NO:13至少90％互补,诸如完全互补。

6.依照权利要求1-5任一项的反义寡核苷酸,其中该连续核苷酸序列与选自由SEQ IDNO:1的位置28478-28497,28540-28559,28816-28835,28910-28929,29024-29043；28478-28495,28540-28557,28696-28713,28816-28833,28910-28927,29024-29041；28482-28497,28544-28559,28820-28835,28914-28929,29028-29043；28484-28497,28546-28559,28822-28835,28916-28929,29030-29043；28142-28161,28144-28161,28145-28160,28147-28160组成的组的SEQ ID NO:1的靶区至少90％互补,诸如完全互补。

7.依照权利要求1-6任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ ID NO:1的靶核酸的长度为10-22个,诸如14-20个核苷酸的靶区至少90％互补,诸如完全互补,其中该靶区跨越该靶核酸重复至少5次。

8.依照权利要求1-7任一项的反义寡核苷酸,其中该连续核苷酸序列与选自由SEQ IDNO:9,10,11和12组成的组的序列至少90％同一,诸如100％同一。

9.依照权利要求1-8任一项的反义寡核苷酸,其中该连续核苷酸序列由选自由SEQ IDNO:9,10,11和12组成的组的序列组成或构成。

10.权利要求1-9任一项的反义寡核苷酸,其中该连续核苷酸序列包含一个或多个2’糖修饰的核苷。

11.权利要求10的反义寡核苷酸,其中该一个或多个2’糖修饰的核苷独立选自由2’-O-烷基-RNA,2’-O-甲基-RNA,2’-烷氧基-RNA,2’-O-甲氧基乙基-RNA,2’-氨基-DNA,2’-氟-DNA,阿拉伯糖核酸(ANA),2’-氟-ANA和LNA核苷组成的组。

12.权利要求10或11的反义寡核苷酸,其中该一个或多个修饰的核苷是LNA核苷。

13.权利要求1-12任一项的反义寡核苷酸,其中该连续核苷酸序列包含至少一个修饰的核苷间连接。

14.权利要求13的反义寡核苷酸,其中该连续核苷酸序列内至少50％,诸如至少75％,诸如至少90％,诸如所有的核苷间连接是硫代磷酸酯核苷间连接。

15.权利要求1-14任一项的反义寡核苷酸,其中该连续寡核苷酸能够募集RNA酶H。

16.权利要求1-15的反义寡核苷酸,其中该反义寡核苷酸或其连续核苷酸序列由式5’-F-G-F’-3’的缺口体组成或构成,其中F和F’区独立包含1-8个核苷,其中1-4个是2’糖修饰的且定义该F和F’区的5’和3’端,且G是能够募集RNA酶H的介于6和16个核苷之间的区域,诸如包含6-16个DNA核苷的区域。

17.权利要求1-16任一项的反义寡核苷酸,其中该反义寡核苷酸或其连续核苷酸序列选自由GgatgtgtgacggtgtggAC(化合物9_1)；ATgtgtgacggtgtgGAC(化合物10_1)；GGATgtgtgacggtGT(化合物11_1)；GGATgtgtgacGGT(化合物12_1)组成的组；其中大写字母代表LNA核苷,诸如β-D-氧基LNA核苷,小写字母代表DNA核苷,任选地,所有LNA C是5-甲基胞嘧啶,且至少一个,优选所有核苷间连接是硫代磷酸酯核苷间连接。

18.一种缀合物,其包含依照权利要求1-17任一项的反义寡核苷酸,和至少一个共价附着至所述寡核苷酸的缀合物模块。

19.依照权利要求1-17任一项的反义寡核苷酸或依照权利要求18的缀合物的药学可接受盐。

20.一种药学组合物,其包含权利要求1-17任一项的反义寡核苷酸或权利要求18的缀合物或权利要求19的药学可接受盐,和药学可接受稀释剂,溶剂,载剂,盐和/或佐剂。

21.一种用于抑制表达哺乳动物PIAS4的靶细胞中的该哺乳动物PIAS4表达的体内或体外方法,所述方法包含以有效量将权利要求1-17任一项的反义寡核苷酸,依照权利要求18的缀合物,权利要求19的药学可接受盐或权利要求20的药学组合物施用于所述细胞。

22.权利要求1-17任一项的反义寡核苷酸,依照权利要求18的缀合物,权利要求19的药学可接受盐或权利要求20的药学组合物,其供药物中使用。

23.权利要求1-17任一项的反义寡核苷酸,依照权利要求18的缀合物,权利要求19的药学可接受盐或权利要求20的药学组合物,其供治疗或预防肝纤维化或癌症,诸如胰腺癌和乳腺癌中使用。

24.权利要求任一项的反义寡核苷酸,依照权利要求18的缀合物,权利要求19的药学可接受盐或权利要求20的药学组合物用于制备用于治疗或预防肝纤维化或癌症,诸如胰腺癌和乳腺癌的药物的用途。