CN111699258A - 用于调控pias4表达的寡核苷酸 - Google Patents

用于调控pias4表达的寡核苷酸 Download PDF

Info

Publication number
CN111699258A
CN111699258A CN201980006014.5A CN201980006014A CN111699258A CN 111699258 A CN111699258 A CN 111699258A CN 201980006014 A CN201980006014 A CN 201980006014A CN 111699258 A CN111699258 A CN 111699258A
Authority
CN
China
Prior art keywords
antisense oligonucleotide
oligonucleotide
nucleosides
seq
nnnnnnnnnn nnnnnnnnnn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980006014.5A
Other languages
English (en)
Inventor
L·彼得森
P·哈格多恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Roche Innovation Center Copenhagen AS
Original Assignee
Roche Innovation Center Copenhagen AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Roche Innovation Center Copenhagen AS filed Critical Roche Innovation Center Copenhagen AS
Publication of CN111699258A publication Critical patent/CN111699258A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/104Aminoacyltransferases (2.3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/323Chemical structure of the sugar modified ring structure
    • C12N2310/3231Chemical structure of the sugar modified ring structure having an additional ring, e.g. LNA, ENA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/33Chemical structure of the base
    • C12N2310/334Modified C
    • C12N2310/33415-Methylcytosine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/34Spatial arrangement of the modifications
    • C12N2310/341Gapmers, i.e. of the type ===---===
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/34Spatial arrangement of the modifications
    • C12N2310/345Spatial arrangement of the modifications having at least two different backbone modifications
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/34Spatial arrangement of the modifications
    • C12N2310/346Spatial arrangement of the modifications having a combination of backbone and sugar modifications
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/02Aminoacyltransferases (2.3.2)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明涉及能够调控靶细胞中PIAS4的表达的反义寡核苷酸。该反义寡核苷酸与PIAS4前mRNA杂交。本发明进一步涉及该寡核苷酸的缀合物和使用该反义寡核苷酸治疗癌症,诸如胰腺癌,乳腺癌和肝纤维化的药学组合物和方法。

Description

用于调控PIAS4表达的寡核苷酸
发明领域
本发明涉及与PIAS4转录物互补的寡核苷酸(寡聚物)。此类寡核苷酸可用于减少细胞中的PIAS4转录物,导致对PIAS4的表达的调控。对PIAS4表达的调控对于一系列医学病症,诸如癌症或肝纤维化是有益的。
发明背景
激活的STAT蛋白质抑制剂4(PIAS4)作为E3型小泛素样修饰剂(SUMO)连接酶,稳定UBE2I和底物之间的相互作用,和作为SUMO拴系因子发挥功能。PIAS4在多种细胞途径中作为转录共调节剂发挥至关紧要作用,包括STAT途径,p53/TP53途径,Wnt途径和类固醇激素信号传导途径;介导CEBPA,PARK7,HERC2,MYB,TCF4和RNF168的SUMO化。在Wnt信号传导中,PIAS4经由促进它们的SUMO化来遏制LEF1且增强TCF4转录活性;而且,PIAS4增强MTA1的SUMO化且可能参与它的旁系同系物选择性SUMO化(见例如Yamamoto H.et al.,EMBO J.22:2047-2059(2003);Dahle O.et al.,Eur.J.Biochem.270:1338-1348(2003);SubramanianL.et al.,J.Biol.Chem.278:9134-9141(2003);Shinbo Y.et al.,Cell DeathDiffer.13:96-108(2006);Cong L.,J.Biol.Chem.286:43793-43808(2011);和DanielsenJ.R.et al.,J.Cell Biol.197:179-187(2012))。
Chien et al.(2013)109,1795-1804公开了使用两种不同外显子特异性siRNA在PIAS4表达与正常胰腺相比升高的胰腺癌细胞系和肿瘤中遏制PIAS4基因表达。
PIAS4通过遏制SIRT1调节肝细胞中的促炎症转录。使用慢病毒投递靶向PIAS4的短发夹RNA(shRNA)而降低PIAS4通过恢复SIRT1表达PIAS4而削弱NASH小鼠中的肝炎症(Lina Sun et al.,Oncotarget,2016,7(28):42892-42903和Xu et al.,The Journal ofBiomedical Research,2016,30(6):496-501)。
使用siRNA的PIAS4消减降低乳腺癌细胞的生长,特别是在与直接AMPK激活剂A769662组合时,提示可能探索抑制AMPKa1 SUMO化来调控AMPK激活和由此遏制癌细胞生长(Yan et al.,Nature Communications,2015,6:8979)。
上述参考文献无一公开靶向PIAS4的单链反义寡核苷酸,特别是,它们没有公开靶向PIAS4基因中的内含子序列或重复序列的概念。
靶向相同RNA中的重复位点的反义寡核苷酸已经显示在体外转染实验的一些情况中具有增强的下调靶mRNA的效力。GCGR,STST3,MAPT,OGFR,和BOK RNA就是这种情况(Vickers et al.,PLOS one,October 2014,Volume 9,Issue 10)。WO 2013/120003也提到了通过重复靶向来调控RNA。
发明目的
PIAS4牵涉多种医学状况,诸如癌症和肝纤维化的进展。本发明提供能够在体内和在体外二者调控PIAS4 mRNA和蛋白质表达的反义寡核苷酸。特别是,在前mRNA水平靶向PIAS4的表达,其防止成熟PIAS4 mRNA形成。靶向重复位点的反义寡核苷酸具有与靶向相同靶序列内的单一区域的反义寡核苷酸相比更高的效力。相应地,本发明可以与标准护理疗法用于组合疗法,特别是癌症和肝纤维化的治疗。
发明概述
本发明提供与哺乳动物PIAS4核酸,诸如SEQ ID NO:1,2和/或3互补且靶向哺乳动物PIAS4核酸,诸如SEQ ID NO:1,2和/或3的反义寡核苷酸,及其用途。
本发明提供反义寡核苷酸,其包含与靶哺乳动物PIAS4核酸的内含子中存在的某些区域或序列互补的连续核苷酸序列。
本发明的化合物能够抑制表达哺乳动物PIAS4靶核酸的细胞中的该哺乳动物PIAS4靶核酸。
本发明提供一种靶向哺乳动物PIAS4靶核酸的反义寡核苷酸,及其体外和体内用途,和它们在药物中的用途。
相应地,在第一个方面,本发明提供一种长度为10至50个核苷酸的反义寡核苷酸,其包含与选自由SEQ ID NO:1和3,或其天然发生变体组成的组的哺乳动物PIAS4靶核酸具有至少90%互补性,诸如完全互补的长度为10至30个核苷酸的连续核苷酸序列,其中该反义寡核苷酸能够降低细胞中该哺乳动物PIAS4靶核酸的表达。
在又一个方面,本发明提供该反义寡核苷酸,其中该连续核苷酸序列与哺乳动物PIAS4靶核酸的前mRNA(例如SEQ ID NO:1)中存在的内含子区至少90%互补,诸如完全互补。
在又一个方面,本发明提供反义寡核苷酸,其包含与SEQ ID NO:1和/或SEQ IDNO:3的靶核酸中存在的至少两个重复靶区具有至少90%互补性的长度为10至30个核苷酸的连续核苷酸序列。
在又一个方面,本发明提供反义寡核苷酸,其包含与SEQ ID NO:1的靶核酸的长度为10-22个,诸如14-20个核苷酸的靶区至少95%互补,诸如完全互补的连续核苷酸序列,其中该靶区跨越该靶核酸重复至少5次或更多次。
在又一个方面,本发明提供该反义寡核苷酸,其中该连续核苷酸序列与选自由SEQID NO:1的位置28478-28497,28540-28559,28816-28835,28910-28929,29024-29043;28478-28495,28540-28557,28696-28713,28816-28833,28910-28927,29024-29041;28482-28497,28544-28559,28820-28835,28914-28929,29028-29043;28484-28497,28546-28559,28822-28835,28916-28929,29030-29043;28142-28161,28144-28161,28145-28160,28147-28160组成的组的SEQ ID NO:1的区域至少90%互补,诸如完全互补。
在又一个方面,本发明提供该反义寡核苷酸,其中该反义寡核苷酸或其连续核苷酸序列选自由GgatgtgtgacggtgtggAC(化合物9_1);ATgtgtgacggtgtgGAC(化合物10_1);GGATgtgtgacggtGT(化合物11_1);GGATgtgtgacGGT(化合物12_1)组成的组,其中大写字母代表LNA核苷,诸如β-D-氧基LNA核苷,小写字母代表DNA核苷,任选地,所有LNA C是5-甲基胞嘧啶,且至少一个,优选所有核苷间连接是硫代磷酸酯核苷间连接。
在又一个方面,本发明提供该反义寡核苷酸,其中该反义寡核苷酸或其连续核苷酸序列选自由GgatgtgtgacggtgtggAC(化合物9_1);ATgtgtgacggtgtgGAC(化合物10_1);GGATgtgtgacggtGT(化合物11_1);GGATgtgtgacGGT(化合物12_1)组成的组;其中大写字母代表β-D-氧基LNA核苷,小写字母代表DNA核苷,所有LNAC是5-甲基胞嘧啶,且所有核苷间连接是硫代磷酸酯核苷间连接。
在又一个方面,本发明提供一种缀合物,其包含依照本发明的反义寡核苷酸,和至少一个共价附着至所述寡核苷酸的缀合物模块。
在又一个方面,本发明提供一种药学组合物,其包含依照本发明的反义寡核苷酸或依照本发明的缀合物,和药学可接受稀释剂,溶剂,载剂,盐和/或佐剂。
在又一个方面,本发明提供依照本发明的反义寡核苷酸或缀合物的药学可接受盐。
在又一个方面,本发明提供一种用于抑制表达哺乳动物PIAS4的靶细胞中的PIAS4表达的方法,所述方法包含以有效量将依照本发明的反义寡核苷酸,缀合物,药学可接受盐,或药学组合物施用于所述细胞。
在又一个方面,本发明提供一种用于治疗或预防疾病的方法,其包含将治疗或预防有效量的依照本发明的反义寡核苷酸,缀合物,药学可接受盐,或药学组合物施用于罹患或易感该疾病的受试者。
在又一个方面,本发明提供该反义寡核苷酸,该缀合物,该药学可接受盐,或该药学组合物用于制备用于治疗或预防癌症或肝纤维化的药物的用途。
定义
寡核苷酸
如本文中使用的术语“寡核苷酸”定义为技术人员一般将其理解为包含两个或更多个共价连接的核苷的分子。此类共价结合的核苷还可以称作核酸分子或寡聚物。寡核苷酸通常在实验室中通过固相化学合成来生成,继以纯化。在提及寡核苷酸的序列时,提及共价连接的核苷酸或核苷的核碱基模块或其修饰的序列或次序。本发明的寡核苷酸是人造的,而且是化学合成的,而且典型地是纯化的或分离的。本发明的寡核苷酸可包含一个或多个修饰的核苷或核苷酸。
反义寡核苷酸
如本文中使用的术语“反义寡核苷酸”定义为能够通过与靶核酸,特别是靶核酸上的连续序列杂交来调控靶基因的表达的寡核苷酸。反义寡核苷酸本质上不是双链的,而且因此不是siRNA或shRNA。优选地,本发明的反义寡核苷酸是单链的。理解的是,本发明的单链寡核苷酸能形成发夹或分子间双链体结构(相同寡核苷酸的两个分子之间的双链体),只要跨越寡核苷酸的全长自身内或间互补性的程度少于50%。有利地,本发明的反义寡核苷酸包含一个或多个修饰的核苷或核苷酸。
连续核苷酸序列
术语“连续核苷酸序列”指寡核苷酸中与靶核酸互补的区域。该术语在本文中与术语“连续核碱基序列”和术语“寡核苷酸基序序列”可互换使用。在一些实施方案中,寡核苷酸的所有核苷酸构成连续核苷酸序列。在一些实施方案中,寡核苷酸包含连续核苷酸序列,诸如F-G-F’缺口体区,而且可任选地包含一个或多个别的核苷酸,例如可用于将官能团附着至连续核苷酸序列的核苷酸接头区。核苷酸接头区可以是或不是与靶核酸互补的。
核苷酸
核苷酸是寡核苷酸和多核苷酸的构件块,而且出于本发明的目的包括天然发生和非天然发生核苷酸二者。在自然界中,核苷酸,诸如DNA和RNA核苷酸包含核糖糖模块,核碱基模块和一个或多个磷酸根基团(其在核苷中缺失)。核苷和核苷酸还可以可互换地称作“单元”或“单体”。
修饰的核苷
如本文中使用的术语“修饰的核苷”或“核苷修饰”指与等同的DNA或RNA核苷相比通过引入一处或多处糖模块或(核)碱基模块的修饰而修饰的核苷。在一个优选的实施方案中,修饰的核苷包含修饰的糖模块。术语修饰的核苷在本文中还可以与术语“核苷类似物”或修饰的“单元”或修饰的“单体”可互换使用。具有未修饰的DNA或RNA糖模块的核苷在本文中称作DNA或RNA核苷。如果它们容许Watson Crick碱基配对的话,具有DNA或RNA核苷的碱基区中的修饰的核苷一般仍然称作DNA或RNA。
修饰的核苷间连接
术语“修饰的核苷间连接”定义为技术人员一般理解为除了磷酸二酯(PO)连接以外将两个核苷共价偶联到一起的连接。本发明的寡核苷酸因此可包含修饰的核苷间连接。在一些实施方案中,修饰的核苷间连接与磷酸二酯连接相比提高寡核苷酸的核酸酶抗性。对于天然发生寡核苷酸,核苷间连接包括创建相邻核苷之间的磷酸二酯键的磷酸根基团。修饰的核苷间连接在稳定用于体内使用的寡核苷酸中特别有用,而且可用来在本发明的寡核苷酸中的DNA或RNA核苷的区域针对核酸酶切割提供保护,例如在缺口体寡核苷酸的缺口区内,以及在修饰的核苷的区域,诸如F和F’区中。
在一个实施方案中,寡核苷酸包含一个或多个自天然磷酸二酯修饰的核苷间连接,诸如例如一个或多个对核酸酶攻击更具抗性的修饰的核苷间连接。可以通过在血清中温育寡核苷酸或通过使用核酸酶抗性测定法(例如蛇毒磷酸二酯酶(SVPD))来测定核酸酶抗性,二者均是本领域公知的。能够增强寡核苷酸的核酸酶抗性的核苷间连接称作核酸酶抗性核苷间连接。在一些实施方案中,寡核苷酸或其连续核苷酸序列中至少50%的核苷间连接是修饰的,寡核苷酸或其连续核苷酸序列中诸如至少60%,诸如至少70%,诸如至少80%或诸如至少90%的核苷间连接是核酸酶抗性核苷间连接。在一些实施方案中,寡核苷酸或其连续核苷酸序列的所有核苷间连接是核酸酶抗性核苷间连接。会认识的是,在一些实施方案中,将本发明的寡核苷酸连接至非核苷酸官能团,诸如缀合物的核苷可以是磷酸二酯。
供本发明的寡核苷酸中使用的一种优选的修饰的核苷间连接是硫代磷酸酯。
由于核酸酶抗性,有益的药动学和容易制造,硫代磷酸酯核苷间连接是特别有用的。在一些实施方案中,寡核苷酸或其连续核苷酸序列中至少50%的核苷间连接是硫代磷酸酯,寡核苷酸或其连续核苷酸序列中诸如至少60%,诸如至少70%,诸如至少80%或诸如至少90%的核苷间连接是硫代磷酸酯。在一些实施方案中,不同于二硫代磷酸酯核苷间连接,寡核苷酸或其连续核苷酸序列的所有核苷间连接是硫代磷酸酯。在一些实施方案中,在二硫代磷酸酯连接以外,本发明的寡核苷酸包含硫代磷酸酯核苷间连接和至少一个磷酸二酯连接,诸如2,3或4个磷酸二酯连接二者。在缺口体寡核苷酸中,磷酸二酯连接在存在时适当地并非位于缺口区G中的连续DNA核苷之间。
核酸酶抗性连接,诸如硫代磷酸酯连接在能够在与靶核酸形成双链体时募集核酸酶的寡核苷酸区域,诸如缺口体的G区中是特别有用的。然而,硫代磷酸酯连接在非核酸酶募集区和/或亲和力增强区,诸如缺口体的F和F’区中也可能是有用的。在一些实施方案中,缺口体寡核苷酸可包含F或F’区,或F和F’区二者中的一个或多个磷酸二酯连接,其中G区中的核苷间连接可以完全是硫代磷酸酯。
有利的是,寡核苷酸的连续核苷酸序列中的所有核苷间连接或寡核苷酸的所有核苷间连接是硫代磷酸酯连接。
认识的是,如EP 2 742 135中公开的,反义寡核苷酸可包含其它核苷间连接(除了磷酸二酯和硫代磷酸酯以外),例如烷基膦酸酯/甲基膦酸酯核苷间连接,其依照EP 2 742135可能例如在其它情况下是DNA硫代磷酸酯的缺口区中得到耐受。
核碱基
术语核碱基包括核苷和核苷酸中存在的嘌呤(例如腺嘌呤和鸟嘌呤)和嘧啶(例如尿嘧啶,胸腺嘧啶和胞嘧啶)模块,其在核酸杂交中形成氢键。在本发明的语境中,术语核碱基还涵盖与天然发生核碱基不同,但在核酸杂交期间有功能的修饰的核碱基。在此语境中,“核碱基”指天然发生核碱基,诸如腺嘌呤,鸟嘌呤,胞嘧啶,胸腺嘧啶,尿嘧啶,黄嘌呤和次黄嘌呤,以及非天然发生变体二者。此类变体例如描述于Hirao et al.(2012)Accounts ofChemical Research,vol.45,page 2055和Bergstrom(2009)Current Protocols inNucleic Acid Chemistry,Suppl.37 1.4.1。
在一些实施方案中,核碱基模块是通过将嘌呤或嘧啶改变为修饰的嘌呤或嘧啶,诸如取代的嘌呤或取代的嘧啶,诸如选自异胞嘧啶,假异胞嘧啶,5-甲基胞嘧啶,5-噻唑基-胞嘧啶,5-丙炔基-胞嘧啶,5-丙炔基-尿嘧啶,5-溴尿嘧啶,5-噻唑基-尿嘧啶,2-硫-尿嘧啶,2’-硫-胸腺嘧啶,肌苷,二氨基嘌呤,6-氨基嘌呤,2-氨基嘌呤,2,6-二氨基嘌呤和2-氯-6-氨基嘌呤的核碱基而修饰的。
核碱基模块可以用每种相应核碱基的字母代码来表示,例如A,T,G,C或U,其中每种字母可任选包括功能等同的修饰的核碱基。例如,在例示的寡核苷酸中,核碱基模块选自A,T,G,C,和5-甲基胞嘧啶。任选地,对于LNA缺口体,可使用5-甲基胞嘧啶LNA核苷。
修饰的寡核苷酸
术语修饰的寡核苷酸描述包含一个或多个糖修饰的核苷和/或修饰的核苷间连接的寡核苷酸。术语“嵌合”寡核苷酸是在文献中已经用于描述具有修饰的核苷的寡核苷酸的术语。
互补性
术语“互补性”描述核苷/核苷酸的Watson-Crick碱基配对能力。Watson-Crick碱基对是鸟嘌呤(G)-胞嘧啶(C)和腺嘌呤(A)-胸腺嘧啶(T)/尿嘧啶(U)。会理解的是,寡核苷酸可包含具有修饰的核碱基的核苷,例如,常常使用5-甲基胞嘧啶代替胞嘧啶,而且为此术语互补性涵盖非修饰的和修饰的核碱基之间的Watson Crick碱基配对(见例如Hirao etal.(2012)Accounts of Chemical Research,vol.45,page 2055和Bergstrom(2009)Current Protocols in Nucleic Acid Chemistry,Suppl.37 1.4.1)。
如本文中使用的术语“%互补”指核酸分子(例如寡核苷酸)的连续核苷酸序列中跨越连续核苷酸序列与参照序列(例如靶序列或序列基序)互补的核苷酸的比例(以百分比计)。如此通过对两条序列之间互补(形成Watson Crick碱基对)的对齐核碱基的数目计数(当靶序列5’-3’和寡核苷酸序列3’-5’比对时),将该数目除以寡核苷酸中的核苷酸的总数并乘以100来计算互补性的百分比。在此类比较中,不对齐(形成碱基对)的核碱基/核苷酸称作错配。连续核苷酸序列的%互补性的计算中不容许插入和删除。会理解的是,在确定互补性时,忽略核碱基的化学修饰,只要核碱基形成Watson Crick碱基配对的功能能力得到保留(例如,为了计算%同一性的目的,认为5’-甲基胞嘧啶与胞嘧啶相同)。
术语“完全互补”指100%互补性。
下面是与靶核酸(SEQ ID NO:4)完全互补的寡核苷酸(SEQ ID NO:12)的一个例子。
5’GTCCACACCGTCACACATCC 3’(SEQ ID NO:4)
3’TGGCAGTGTGTAGG 5’(SEQ ID NO:12)
同一性
如本文中使用的术语“同一性”指核酸分子(例如寡核苷酸)中的连续核苷酸序列中跨越连续核苷酸序列与参照序列(例如序列基序)相同的核苷酸的比例(以百分比表述)。如此通过对两条序列(本发明的化合物的连续核苷酸序列中的和参照序列中的)之间相同(匹配)的对齐碱基计数,将该数目除以寡核苷酸中的核苷酸的总数并乘以100来计算同一性的百分比。因此,同一性的百分比=(匹配x 100)/比对区域(例如连续核苷酸序列)的长度。在连续核苷酸序列的同一性的百分比的计算中不容许插入和删除。会理解的是,在确定同一性时,忽略核碱基的化学修饰,只要核碱基形成Watson Crick碱基配对的功能能力得到保留(例如,为了计算%同一性的目的,认为5-甲基胞嘧啶与胞嘧啶相同)。
杂交
如本文中使用的术语“杂交”要理解为两条核酸链(例如寡核苷酸和靶核酸)在相对链上的碱基对之间形成氢键,由此形成双链体。两条核酸链之间的结合的亲和力是杂交的强度。它常常以解链温度(Tm)来描述,定义为一半的寡核苷酸与靶核酸形成双链体时的温度。在生理条件下,Tm并不与亲和力严格成比例(Mergny and Lacroix,2003,Oligonucleotides,13:515-537)。标准状态的Gibbs自由能ΔG°是结合亲和力的一种更加精确的表示且通过ΔG°=-RTln(Kd)与反应的解离常数(Kd)相关,其中R是气体常数且T是绝对温度。因此,寡核苷酸和靶核酸之间的反应的ΔG°很低反映寡核苷酸和靶核酸之间的杂交强。ΔG°是与其中水浓度为1M,pH为7,且温度为37℃的反应有关的能量。寡核苷酸对靶核酸的杂交是自发反应,而对于自发反应,ΔG°小于零。ΔG°可以通过实验来测量,例如通过使用如Hansen et al.,1965,Chem.Comm.36-38和Holdgate et al.,2005,Drug DiscovToday中描述的等温滴定量热法(ITC)方法。技术人员会知道,商用设备可用于ΔG°测量。ΔG°还可以使用适宜推导的由Sugimoto et al.,1995,Biochemistry,34:11211-11216和McTigue et al.,2004,Biochemistry,43:5388-5405描述的热力学参数通过使用如SantaLucia,1998,Proc Natl Acad Sci USA,95:1460-1465中描述的最近邻居模型在数值上估算。为了具有通过杂交来调控它的预定核酸靶的可能性,本发明的寡核苷酸以对于长度为10-30个核苷酸的寡核苷酸低于-10kcal的估算ΔG°值与靶核酸杂交。在一些实施方案中,通过标准状态Gibbs自由能ΔG°来测量杂交的程度或强度。寡核苷酸可以以对于长度为8-30个核苷酸的寡核苷酸低于-10kcal,诸如低于-15kcal,诸如低于-20kcal和诸如低于-25kcal的范围的估算ΔG°值与靶核酸杂交。在一些实施方案中,寡核苷酸以-10至-60kcal,诸如-12至-40,诸如-15至-30kcal或-16至-27kcal,诸如-18至-25kcal的估算ΔG°值与靶核酸杂交。
靶核酸
依照本发明,靶核酸是编码哺乳动物PIAS4且可以例如是基因,RNA,mRNA,和前mRNA,成熟mRNA或cDNA序列的核酸。靶因此可以称作PIAS4靶核酸。本发明的寡核苷酸可以例如靶向哺乳动物PIAS4的外显子区,或者可以例如靶向PIAS4前mRNA中的任何内含子区(见例如表1)。
表1:人PIAS4前mRNA中的外显子和内含子区
Figure BDA0002509100550000101
合适地,靶核酸编码PIAS4蛋白质,特别是哺乳动物PIAS4,诸如人PIAS4(见例如表2和3),其提供人和猴PIAS4的基因组序列,成熟mRNA和前mRNA序列。
在一些实施方案中,靶核酸选自由SEQ ID NO:1,2和3或其天然发生变体(例如编码哺乳动物PIAS4蛋白质的序列)组成的组。
在一些实施方案中,靶核酸可以是编码哺乳动物PIAS4蛋白质,诸如人PIAS4的RNA或DNA,诸如信使RNA,诸如成熟mRNA或前mRNA,例如人前mRNA序列,诸如作为SEQ ID NO:1公开的或如SEQ ID NO:2中公开的人成熟mRNA。
如果在研究或诊断中采用本发明的寡核苷酸的话,靶核酸可以是自DNA或RNA衍生的cDNA或合成核酸。
对于体内或体外应用,本发明的寡核苷酸典型地能够降低表达PIAS4靶核酸的细胞中PIAS4靶核酸的表达。本发明的寡核苷酸的核碱基的连续序列典型地与PIAS4靶核酸互补,如跨越寡核苷酸的长度测量的,任选地,一处或两处错配除外,且任选地排除可将寡核苷酸连接至任选的官能团,诸如缀合物的基于核苷酸的接头区,或其它非互补末端核苷酸(例如D’或D”区)。
关于跨越物种的PIAS4的基因组和装配的进一步信息在表2中提供,而前mRNA和mRNA的序列详情在表3中提供。
表2:跨越物种的关于PIAS4的基因组和装配信息
Figure BDA0002509100550000111
Fwd=正向链。基因组坐标提供前mRNA序列(基因组序列)。
表3:跨越物种的PIAS4的序列详情
物种 RNA类型 长度(nt) SEQ ID NO
前mRNA 31741 1
mRNA 3159 2
食蟹猴 前mRNA 30449 3*
注意:SEQ ID NO:3包含多个NNNNs的区域,其中测序未能精确精炼序列,而且因此包括简并序列。为了避免疑问,本发明的化合物与实际的靶序列互补且因此不是简并化合物。
靶序列
如本文中使用的术语“靶序列”指靶核酸中存在的包含与本发明的反义寡核苷酸互补的核碱基序列的核苷酸的序列。在一些实施方案中,靶序列由靶核酸上具有与本发明的反义寡核苷酸的连续核苷酸序列互补的核碱基序列的区域组成。靶核酸的这个区域可以可互换地称作靶核苷酸序列,靶序列或靶区。在一些实施方案中,靶序列比单一寡核苷酸的连续互补序列要长,而且可以例如代表靶核酸中可以受到本发明的数个寡核苷酸靶向的优选区域。
本发明的反义寡核苷酸包含与靶核酸,诸如本文中描述的靶序列互补的连续核苷酸序列。
在一些实施方案中,靶序列在人和猴之间是保守的,特别是SEQ ID NO:1和3二者中存在的序列。在一个优选的实施方案中,此类靶核酸序列在SEQ ID NO:4中存在。
寡核苷酸与之互补的靶序列一般包含至少10个核苷酸的连续核碱基序列。连续核苷酸序列介于10至50个核苷酸,诸如12至30个,诸如14至20个,诸如15至18个连续核苷酸之间。
在本发明的一个实施方案中,靶序列是SEQ ID NO:4。
在本发明的另一个实施方案中,靶序列是SEQ ID NO:13。
重复靶区
靶区或靶序列可以是对于靶核酸而言独特的(仅存在一次)。
在本发明的一些方面,靶区在靶核酸的跨度上重复至少两次。本发明涵盖的重复意味着有在靶核酸中在不同位置处发生的至少两段相同的长度为至少10个,诸如至少11个,或至少12个核苷酸的核苷酸序列(靶区)。每个重复靶区在靶核酸的连续序列上通过至少一个核碱基与相同区域分开且位于靶核酸内不同且不交叠的位置。
靶细胞
如本文中使用的术语“靶细胞”指表达靶核酸的细胞。在一些实施方案中,靶细胞可以在体内或在体外。在一些实施方案中,靶细胞是哺乳动物细胞,诸如啮齿动物细胞,诸如小鼠细胞或大鼠细胞,或灵长动物细胞,诸如猴细胞或人细胞。
在优选的实施方案中,靶细胞表达PIAS4 mRNA,诸如PIAS4前mRNA或PIAS4成熟mRNA。反义寡核苷酸靶向忽略PIAS4 mRNA的polyA尾。
天然发生变体
术语“天然发生变体”指PIAS4基因或转录物的变体,其与靶核酸源自相同的基因座且是与靶核酸来自相同染色体位置和方向的定向转录物,但是可以例如由于引起编码相同氨基酸的密码子的多重性的遗传密码的简并性,或由于前mRNA的可变剪接,或多态性,诸如单核苷酸多态性,和等位变体的存在而不同。基于足够的与寡核苷酸互补的序列的存在,本发明的寡核苷酸可因此靶向靶核酸及其天然发生变体。
在一些实施方案中,天然发生变体与哺乳动物PIAS4靶核酸,诸如选自由SEQ IDNO:1,2和3组成的组的靶核酸具有至少95%,诸如至少98%或至少99%同源性。
对表达的调控
如本文中使用的术语“对表达的调控”要理解为与施用寡核苷酸之前PIAS4的量相比寡核苷酸改变PIAS4的量的能力的总称。或者,对表达的调控可以通过参照对照实验来确定。一般理解的是,对照是用盐水组合物处理的靶细胞或用非靶向寡核苷酸(模拟)处理的靶细胞。
依照本发明的调控会理解为反义寡核苷酸抑制,下调,减轻,遏制,去除,停止,阻断,防止,减少,降低,避免或终止PIAS4的表达的能力,例如通过mRNA的降解或转录的阻断。
高亲和力修饰的核苷
高亲和力修饰的核苷是修饰的核苷酸,其在掺入寡核苷酸时增强寡核苷酸对它的互补靶的亲和力,例如如通过解链温度(Tm)测量的。本发明的高亲和力修饰的核苷优选导致解链温度升高+0.5至+12℃,更优选+1.5至+10℃和最优选+3至+8℃每个修饰的核苷。众多高亲和力修饰的核苷是本领域已知的且包括例如许多2’取代的核苷以及锁定的核酸(LNA)(见例如Freier and Altmann,Nucl.Acid Res.,1997,25,4429-4443和Uhlmann,Curr.Opinion in Drug Development,2000,3(2),293-213)。
糖修饰
本发明的寡聚物可包含一个或多个具有修饰的糖模块的核苷,即与在DNA和RNA中找到的核糖糖模块相比对糖模块的修饰。
已经生成了众多具有对核糖糖模块的修饰的核苷,主要目的是改进寡核苷酸的某些特性,诸如亲和力和/或核酸酶抗性。
此类修饰包括那些其中核糖环结构进行修饰的,例如通过用己糖环(HNA),或典型地具有核糖环上的C2和C4碳之间的双基桥的双环环(LNA),或典型地缺乏C2和C3碳之间的键的未连接核糖环(例如UNA)替换。其它糖修饰的核苷包括例如双环己糖核酸(WO2011/017521)或三环核酸(WO2013/154798)。修饰的核苷还包括其中糖模块用非糖模块替换的核苷,例如在肽核酸(PNA),或吗啉代核酸的情况中。
糖修饰还包括经由将核糖环上的取代基基团改变成除了氢以外的基团或在DNA和RNA核苷中天然找到的2’-OH基团而进行的修饰。例如,可以在2’,3’,4’或5’位置引入取代基。具有修饰的糖模块的核苷还包括2’修饰的核苷,诸如2’取代的核苷。确实,已经将很多焦点花在开发2’取代的核苷上,而且已经发现众多2’取代的核苷在掺入寡核苷酸时具有有益特性,诸如增强的核苷抗性和增强的亲和力。
2’修饰的核苷
2’糖修饰的核苷是在2’位置处具有除了H或-OH以外的取代基(2’取代的核苷)或包含2’连接双基的核苷,而且包括2’取代的核苷和LNA(2’-4’双基桥接)核苷。例如,2’修饰的糖可以对寡核苷酸提供增强的结合亲和力和/或升高的核酸酶抗性。2’取代的修饰的核苷的例子是2’-O-烷基-RNA,2’-O-甲基-RNA,2’-烷氧基-RNA,2’-O-甲氧基乙基-RNA(MOE),2’-氨基-DNA,2’-氟-RNA,和2’-F-ANA核苷。更多例子请见例如Freier and Altmann,Nucl.Acid Res.,1997,25,4429-4443;Uhlmann,Curr.Opinion in Drug Development,2000,3(2),293-213;和Deleavey and Damha,Chemistry and Biology,2012,19,937。下面是一些2’取代的修饰的核苷的例示。
Figure BDA0002509100550000141
锁定的核酸核苷(LNA)
“LNA核苷”是2’-修饰的核苷,其包含连接所述核苷的核糖糖环的C2’和C4’的双基(也称作“2’-4’桥”),其约束或锁定核糖环的构象。这些核苷在文献中也称作桥接核酸或双环核酸(BNA)。当LNA掺入互补RNA或DNA分子的寡核苷酸时,核糖的构象的锁定与增强的杂交亲和力有关(双链体稳定化)。这可以通过测量寡核苷酸/互补双链体的解链温度来例行确定。
非限制性的,例示性的LNA核苷公开于WO 99/014226,WO 00/66604,WO 98/039352,WO 2004/046160,WO 00/047599,WO 2007/134181,WO 2010/077578,WO 2010/036698,WO 2007/090071,WO 2009/006478,WO 2011/156202,WO 2008/154401,WO 2009/067647,WO 2008/150729,Morita et al.,Bioorganic&Med.Chem.Lett.12,73-76,Seth etal.,J.Org.Chem.2010,Vol.75(5),pp.1569-81和Mitsuoka et al.,Nucleic AcidsResearch,2009,37(4),1225-1238。
2’-4’桥包含2至4个桥接原子且特别是式-X-Y-,X连接至C4’且Y连接至C2’,
其中
X是氧,硫,-CRaRb-,-C(Ra)=C(Rb)-,-C(=CRaRb)-,-C(Ra)=N-,-Si(Ra)2-,-SO2-,-NRa-;-O-NRa-,-NRa-O-,-C(=J)-,Se,-O-NRa-,-NRa-CRaRb-,-N(Ra)-O-或-O-CRaRb-;
Y是氧,硫,-(CRaRb)n-,-CRaRb-O-CRaRb-,-C(Ra)=C(Rb)-,-C(Ra)=N-,-Si(Ra)2-,-SO2-,-NRa-,-C(=J)-,Se,-O-NRa-,-NRa-CRaRb-,-N(Ra)-O-或-O-CRaRb-;前提是-X-Y-不是-O-O-,-Si(Ra)2-Si(Ra)2-,-SO2-SO2-,-C(Ra)=C(Rb)-C(Ra)=C(Rb),-C(Ra)=N-C(Ra)=N-,-C(Ra)=N-C(Ra)=C(Rb)-,-C(Ra)=C(Rb)-C(Ra)=N-或-Se-Se-;
J是氧,硫,=CH2或=N(Ra);
Ra和Rb独立选自氢,卤素,羟基,氰基,硫羟基,烷基,取代的烷基,烯基,取代的烯基,炔基,取代的炔基,烷氧基,取代的烷氧基,烷氧基烷基,烯基氧基,羧基,烷氧基羰基,烷基羰基,甲酰基,芳基,杂环基,氨基,烷基氨基,氨甲酰基,烷基氨基羰基,氨基烷基氨基羰基,烷基氨基烷基氨基羰基,烷基羰基氨基,脲基,烷酰基氧基,磺酰基,烷基磺酰基氧基,硝基,叠氮基,硫羟基硫醚烷基硫烷基,芳基氧基羰基,芳基氧基,芳基羰基,杂芳基,杂芳基氧基羰基,杂芳基氧基,杂芳基羰基,-OC(=Xa)Rc,-OC(=Xa)NRcRd和-NReC(=Xa)NRcRd
或两个成双的Ra和Rb一些形成任选取代的亚甲基;
或两个成双的Ra和Rb与它们所附着的碳原子一起形成环烷基或卤代环烷基,仅具有-X-Y-的一个碳原子;
其中取代的烷基,取代的烯基,取代的炔基,取代的烷氧基和取代的亚甲基是被1至3个独立选自卤素,羟基,烷基,烯基,炔基,烷氧基,烷氧基烷基,烯基氧基,羧基,烷氧基羰基,烷基羰基,甲酰基,杂环基,芳基和杂芳基的取代基取代的烷基,烯基,炔基和亚甲基;
Xa是氧,硫或-NRc
Rc,Rd和Re独立选自氢和烷基;且
n是1,2或3。
在本发明的又一个特定实施方案中,X是氧,硫,-NRa-,-CRaRb-或-C(=CRaRb)-,特别是氧,硫,-NH-,-CH2-或-C(=CH2)-,更加特别是氧。
在本发明的另一个特定实施方案中,Y是-CRaRb-,-CRaRb-CRaRb-或-CRaRb-CRaRb-CRaRb-,特别是-CH2-CHCH3-,-CHCH3-CH2-,-CH2-CH2-或-CH2-CH2-CH2-。
在本发明的一个特定实施方案中,-X-Y-是-O-(CRaRb)n-,-S-CRaRb-,-N(Ra)CRaRb-,-CRaRb-CRaRb-,-O-CRaRb-O-CRaRb-,-CRaRb-O-CRaRb-,-C(=CRaRb)-CRaRb-,-N(Ra)CRaRb-,-O-N(Ra)-CRaRb-或-N(Ra)-O-CRaRb-。
在本发明的一个特定实施方案中,Ra和Rb独立选自由氢,卤素,羟基,烷基和烷氧基烷基组成的组,特别是氢,卤素,烷基和烷氧基烷基。
在本发明的另一个实施方案中,Ra和Rb独立选自由氢,氟,羟基,甲基和-CH2-O-CH3组成的组,特别是氢,氟,甲基和-CH2-O-CH3
有利地,-X-Y-的Ra和Rb之一如上文定义的且另一同时都是氢。
在本发明的又一个特定实施方案中,Ra是氢或烷基,特别是氢或甲基。
在本发明的另一个特定实施方案中,Rb是氢或烷基,特别是氢或甲基。
在本发明的一个特定实施方案中,Ra和Rb之一或二者是氢。
在本发明的一个特定实施方案中,Ra和Rb仅之一是氢。
在本发明的一个特定实施方案中,Ra和Rb之一是甲基且另一是氢。
在本发明的一个特定实施方案中,Ra和Rb同时均是甲基。
在本发明的一个特定实施方案中,-X-Y-是-O-CH2-,-S-CH2-,-S-CH(CH3)-,-NH-CH2-,-O-CH2CH2-,-O-CH(CH2-O-CH3)-,-O-CH(CH2CH3)-,-O-CH(CH3)-,-O-CH2-O-CH2-,-O-CH2-O-CH2-,-CH2-O-CH2-,-C(=CH2)CH2-,-C(=CH2)CH(CH3)-,-N(OCH3)CH2-或-N(CH3)CH2-。
在本发明的一个特定实施方案中,-X-Y-是-O-CRaRb-,其中Ra和Rb独立选自由氢,烷基和烷氧基烷基组成的组,特别是氢,甲基和-CH2-O-CH3
在一个特定实施方案中,-X-Y-是-O-CH2-或-O-CH(CH3)-,特别是-O-CH2-。
2’-4’桥可以位于核糖环的平面下方(β-D-构型)或环的平面上方(α-L-构型),分别如式(A)和式(B)中图示的。
依照本发明的LNA核苷特别是式(A)或(B)的,
Figure BDA0002509100550000161
其中
W是氧,硫,-N(Ra)-或-CRaRb-,特别是氧;
B是核碱基或修饰的核碱基;
Z是与相邻核苷或5'末端基团的核苷间连接;
Z*是与相邻核苷或3'末端基团的核苷间连接;
R1,R2,R3,R5和R5*独立选自氢,卤素,烷基,卤代烷基,烯基,炔基,羟基,烷氧基,烷氧基烷基,叠氮基,烯基氧基,羧基,烷氧基羰基,烷基羰基,甲酰基和芳基;且
X,Y,Ra和Rb如上文定义的。
在一个特定实施方案中,在-X-Y-的定义中,Ra是氢或烷基,特别是氢或甲基。在另一个特定实施方案中,在-X-Y-的定义中,Rb是氢或烷基,特别是氢或甲基。在又一个特定实施方案中,在-X-Y-的定义中,Ra和Rb之一或二者是氢。在一个特定实施方案中,在-X-Y-的定义中,Ra和Rb仅之一是氢。在一个特定实施方案中,在-X-Y-的定义中,Ra和Rb之一是甲基且另一是氢。在一个特定实施方案中,在-X-Y-的定义中,Ra和Rb同时均是甲基。
在又一个特定实施方案中,在X的定义中,Ra是氢或烷基,特别是氢或甲基。在另一个特定实施方案中,在X的定义中,Rb是氢或烷基,特别是氢或甲基。在一个特定实施方案中,在X的定义中,Ra和Rb之一或二者是氢。在一个特定实施方案中,在X的定义中,Ra和Rb仅之一是氢。在一个特定实施方案中,在X的定义中,Ra和Rb之一是甲基且另一是氢。在一个特定实施方案中,在X的定义中,Ra和Rb同时均是甲基。
在又一个特定实施方案中,在Y的定义中,Ra是氢或烷基,特别是氢或甲基。在另一个特定实施方案中,在Y的定义中,Rb是氢或烷基,特别是氢或甲基。在一个特定实施方案中,在Y的定义中,Ra和Rb之一或二者是氢。在一个特定实施方案中,在Y的定义中,Ra和Rb仅之一是氢。在一个特定实施方案中,在Y的定义中,Ra和Rb之一是甲基且另一是氢。在一个特定实施方案中,在Y的定义中,Ra和Rb同时均是甲基。
在本发明的一个特定实施方案中,R1,R2,R3,R5和R5*独立选自氢和烷基,特别是氢和甲基。
在本发明的又一个特别有利的实施方案中,R1,R2,R3,R5和R5*同时均是氢。
在本发明的另一个特定实施方案中,R1,R2,R3同时均是氢,R5和R5*之一是氢且另一如上文定义的,特别是烷基,更加特别是甲基。
在本发明的一个特定实施方案中,R5和R5*独立选自氢,卤素,烷基,烷氧基烷基和叠氮基,特别是氢,氟,甲基,甲氧基乙基和叠氮基。在本发明的特别有利的实施方案中,R5和R5*之一是氢且另一是烷基,特别是甲基,卤素,特别是氟,烷氧基烷基,特别是甲氧基乙基或叠氮基;或R5和R5*同时均是氢或卤素,特别是同时均是氢或氟。在此类特定实施方案中,W可以有利地是氧,且-X-Y-有利地是-O-CH2-。
在本发明的一个特定实施方案中,-X-Y-是-O-CH2-,W是氧且R1,R2,R3,R5和R5*同时均是氢。此类LNA核苷公开于WO 99/014226,WO 00/66604,WO 98/039352和WO 2004/046160,据此通过援引收录它们全部,而且包括本领域通常称作β-D-氧基LNA和α-L-氧基LNA核苷的。
在本发明的另一个特定实施方案中,-X-Y-是-S-CH2-,W是氧且R1,R2,R3,R5和R5*同时均是氢。此类硫LNA核苷公开于WO 99/014226和WO 2004/046160,据此通过援引收录它们。
在本发明的另一个特定实施方案中,-X-Y-是-NH-CH2-,W是氧且R1,R2,R3,R5和R5*同时均是氢。此类氨基LNA核苷公开于WO 99/014226和WO 2004/046160,据此通过援引收录它们。
在本发明的另一个特定实施方案中,-X-Y-是-O-CH2CH2-或-OCH2CH2CH2-,W是氧,且R1,R2,R3,R5和R5*同时均是氢。此类LNA核苷公开于WO 00/047599和Morita et al.,Bioorganic&Med.Chem.Lett.12,73-76,通过援引收录它们,而且包括本领域通常称作2’-O-4’C-亚乙基桥接核酸(ENA)的。
在本发明的另一个特定实施方案中,-X-Y-是-O-CH2-,W是氧,R1,R2,R3同时均是氢,R5和R5*之一是氢且另一不是氢,诸如烷基,例如甲基。此类5’取代的LNA核苷公开于WO2007/134181,据此通过援引收录它。
在本发明的另一个特定实施方案中,-X-Y-是-O-CRaRb-,其中Ra和Rb之一或二者不是氢,特别是烷基,诸如甲基,W是氧,R1,R2,R3同时均是氢,R5和R5*之一是氢且另一不是氢,特别是烷基,例如甲基。此类双修饰的LNA核苷公开于WO 2010/077578,据此通过援引收录它。
在本发明的另一个特定实施方案中,-X-Y-是-O-CHRa-,W是氧且R1,R2,R3,R5和R5*同时均是氢。此类6’-取代的LNA核苷公开于WO 2010/036698和WO 2007/090071,据此通过援引收录它们二者。在此类6’-取代的LNA核苷中,Ra特别是C1-C6烷基,诸如甲基。
在本发明的另一个特定实施方案中,-X-Y-是-O-CH(CH2-O-CH3)-(“2’O-甲氧基乙基双环核酸”,Seth et al.,J.Org.Chem.2010,Vol.75(5),pp.1569-81)。
在本发明的另一个特定实施方案中,-X-Y-是-O-CH(CH2CH3)-(“2’O-乙基双环核酸”,Seth at al.,J.Org.Chem.2010,Vol 75(5),pp.1569-81)。
在本发明的另一个特定实施方案中,-X-Y-是-O-CH(CH2-O-CH3)-,W是氧且R1,R2,R3,R5和R5*同时均是氢。此类LNA核苷在本领域也称作环状MOE(cMOE)且公开于WO 2007/090071。
在本发明的另一个特定实施方案中,-X-Y-是-O-CH(CH3)-。
在本发明的另一个特定实施方案中,-X-Y-是-O-CH2-O-CH2-(Seth et al.,J.Org.Chem.2010,同上)。
在本发明的另一个特定实施方案中,-X-Y-是-O-CH(CH3)-,W是氧且R1,R2,R3,R5和R5*同时均是氢。此类6’-甲基LNA核苷在本领域也称作cET核苷,而且可以是(S)-cET或(R)-cET非对映异构体,如公开于WO 2007/090071(β-D)和WO 2010/036698(α-L),据此通过援引收录它们二者。
在本发明的另一个特定实施方案中,-X-Y-是-O-CRaRb-,其中Ra和Rb均不是氢,W是氧且R1,R2,R3,R5和R5*同时均是氢。在一个特定实施方案中,Ra和Rb同时均是烷基,特别是同时均是甲基。此类6’-二取代的LNA核苷公开于WO 2009/006478,据此通过援引收录它。
在本发明的另一个特定实施方案中,-X-Y-是-S-CHRa-,W是氧且R1,R2,R3,R5和R5*同时均是氢。此类6’-取代的硫LNA核苷公开于WO 2011/156202,据此通过援引收录它。在此类6’-取代的硫LNA的一个特定实施方案中,Ra是烷基,特别是甲基。
在本发明的一个特定实施方案中,-X-Y-是-C(=CH2)C(RaRb)-,-C(=CHF)C(RaRb)-或-C(=CF2)C(RaRb)-,W是氧且R1,R2,R3,R5和R5*同时均是氢。Ra和Rb有利地独立选自氢,卤素,烷基和烷氧基烷基,特别是氢,甲基,氟和甲氧基甲基。Ra和Rb特别是同时均是氢或甲基或Ra和Rb之一是氢且另一是甲基。此类乙烯基碳LNA核苷公开于WO 2008/154401和WO 2009/067647,据此通过援引收录它们二者。
在本发明的一个特定实施方案中,-X-Y-是-N(ORa)-CH2-,W是氧且R1,R2,R3,R5和R5*同时均是氢。在一个特定实施方案中,Ra是烷基,诸如甲基。此类LNA核苷也称作N取代的LNA且公开于WO 2008/150729,据此通过援引收录它。
在本发明的一个特定实施方案中,-X-Y-是-O-N(Ra)-,-N(Ra)-O-,-NRa-CRaRb-CRaRb-或-NRa-CRaRb-,W是氧且R1,R2,R3,R5和R5*同时均是氢。Ra和Rb有利地独立选自氢,卤素,烷基和烷氧基烷基,特别是氢,甲基,氟和甲氧基甲基。在一个特定实施方案中,Ra是烷基,诸如甲基,Rb是氢或甲基,特别是氢(Seth et al.,J.Org.Chem.2010,同上)。
在本发明的一个特定实施方案中,-X-Y-是-O-N(CH3)-(Seth et al.,J.Org.Chem.2010,同上)。
在本发明的一个特定实施方案中,R5和R5*同时均是氢。在本发明的另一个特定实施方案中,R5和R5*之一是氢且另一是烷基,诸如甲基。在此类实施方案中,R1,R2和R3可以特别是氢且-X-Y-可以特别是-O-CH2-或-O-CHC(Ra)3-,诸如-O-CH(CH3)-。
在本发明的一个特定实施方案中,-X-Y-是-CRaRb-O-CRaRb-,诸如-CH2-O-CH2-,W是氧且R1,R2,R3,R5和R5*同时均是氢。在此类特定实施方案中,Ra可以特别是烷基,诸如甲基,Rb可以特别是氢或甲基,特别是氢。此类LNA核苷也称作构象约束核苷酸(CRN)且公开于WO2013/036868,据此通过援引收录它。
在本发明的一个特定实施方案中,-X-Y-是-O-CRaRb-O-CRaRb-,诸如-O-CH2-O-CH2-,W是氧且R1,R2,R3,R5和R5*同时均是氢。Ra和Rb有利地独立选自氢,卤素,烷基和烷氧基烷基,特别是氢,甲基,氟和甲氧基甲基。在此类特定实施方案中,Ra可以特别是烷基,诸如甲基,Rb可以特别是氢或甲基,特别是氢。此类LNA核苷也称作COC核苷酸且公开于Mitsuokaet al.,Nucleic Acids Research,2009,37(4),1225-1238,据此通过援引收录它。
除非另有规定,会认识的是,LNA核苷可以是β-D或α-L立体异构体。
本发明的LNA核苷的特定例子呈现于方案1(其中B如上文定义的)。
方案1
Figure BDA0002509100550000211
特定的LNA核苷是β-D-氧基-LNA,6’-甲基-β-D-氧基-LNA,诸如(S)-6’-甲基-β-D-氧基-LNA(ScET)和ENA。
如果本发明的起始材料或化合物之一含有在一个或多个反应步骤的反应条件下不稳定或具有反应性的一个或多个官能团的话,可以应用本领域公知的方法在关键步骤之前引入适宜的保护基团(如描述于例如“Protective Groups in Organic Chemistry”byT.W.Greene and P.G.M.Wuts,3rd Ed.,1999,Wiley,New York)。可以使用文献中描述的标准方法在合成的后期去除此类保护基团。保护基团的例子是叔丁氧基羰基(Boc),9-芴基甲基氨基甲酸酯(Fmoc),2-三甲基甲硅烷基乙基氨基甲酸酯(Teoc),羰基苄基氧基(Cbz)和对甲氧基苄基氧基羰基(Moz)。
本文中描述的化合物可含有数个不对称中心,而且可以以光学纯的对映异构物,对映异构物的混合物,诸如例如外消旋化合物,非对映异构体的混合物,非对映异构体外消旋化合物或非对映异构体外消旋化合物的混合物的形式存在。
术语“不对称碳原子”意味着具有四个不同取代基的碳原子。依照Cahn-Ingold-Prelog规则,不对称碳原子可以是“R”或“S”构型的。
化学基团定义
在本说明书中,单独或组合的术语“烷基”表示具有1至8个碳原子的直链或支链烷基基团,特别是具有1至6个碳原子的直或支链烷基基团和更加特别是具有1至4个碳原子的直或支链烷基基团。直链和支链C1-C8烷基基团的例子是甲基,乙基,丙基,异丙基,丁基,异丁基,叔丁基,异构的戊基,异构的己基,异构的庚基和异构的辛基,特别是甲基,乙基,丙基,丁基和戊基。烷基的特定例子是甲基,乙基和丙基。
单独或组合的术语“环烷基”表示具有3至8个碳原子的环烷基环和特别是具有3至6个碳原子的环烷基环。环烷基的例子是环丙基,环丁基,环戊基,环己基,环庚基和环辛基,更加特别是环丙基和环丁基。“环烷基”的特定例子是环丙基。
单独或组合的术语“烷氧基”表示式烷基-O-的基团,其中术语“烷基”具有先前给出的含义,诸如甲氧基,乙氧基,正丙氧基,异丙氧基,正丁氧基,异丁氧基,仲丁氧基和叔丁氧基。特定的“烷氧基”是甲氧基和乙氧基。甲氧基乙氧基是“烷氧基烷氧基”的特定例子。
单独或组合的术语“氧基”表示-O-基团。
单独或组合的术语“烯基”表示包含烯键和多至8个,优选多至6个,特别是优选多至4个碳原子的直链或支链烃残基。烯基基团的例子是乙烯基,1-丙烯基,2-丙烯基,异丙烯基,1-丁烯基,2-丁烯基,3-丁烯基和异丁烯基。
单独或组合的术语“炔基”表示包含三键和多至8个,优选多至6个,特别是优选多至4个碳原子的直链或支链烃残基。
单独或组合的术语“卤素”或“卤代”表示氟,氯,溴或碘,特别是氟,氯或溴,更加特别是氟。与另一个基团组合的术语“卤代”表示所述基团被至少一个卤素取代,特别被1-5个卤素,特别是1-4个卤素,即1,2,3或4个卤素取代。
单独或组合的术语“卤代烷基”表示被至少一个卤素取代的烷基基团,特别是被1-5个卤素,特别是1-3个卤素取代。卤代烷基的例子包括一氟,二氟或三氟甲基,乙基或丙基,例如3,3,3-三氟丙基,2-氟乙基,2,2,2-三氟乙基,氟甲基或三氟甲基。氟甲基,二氟甲基和三氟甲基是特定的“卤代烷基”。
单独或组合的术语“卤代环烷基”表示被至少一个卤素取代的如上文定义的环烷基基团,特别是被1-5个卤素,特别是1-3个卤素取代。“卤代环烷基”的特定例子是卤代环丙基,特别是氟环丙基,二氟环丙基和三氟环丙基。
单独或组合的术语“羟基”表示-OH基团。
单独或组合的术语“硫羟基”表示-SH基团。
单独或组合的术语“羰基”表示-C(O)-基团。
单独或组合的术语“羧基”表示-COOH基团。
单独或组合的术语“氨基”表示伯氨基基团(-NH2),仲氨基基团(-NH-),或叔氨基基团(-N-)。
单独或组合的术语“烷基氨基”表示被1或2个如上文定义的烷基基团取代的如上文定义的氨基基团。
单独或组合的术语“磺酰基”表示-SO2基团。
单独或组合的术语“亚磺酰基”表示-SO-基团。
单独或组合的术语“硫烷基”表示-S-基团。
单独或组合的术语“氰基”表示-CN基团。
单独或组合的术语“叠氮基”表示-N3基团。
单独或组合的术语“硝基”表示-NO2基团。
单独或组合的术语“甲酰基”表示-C(O)H基团。
单独或组合的术语“氨甲酰基”表示-C(O)NH2基团。
单独或组合的术语“脲基”表示-NH-C(O)-NH2基团。
单独或组合的术语“芳基”表示任选被1至3个独立选自卤素,羟基,烷基,烯基,炔基,烷氧基,烷氧基烷基,烯基氧基,羧基,烷氧基羰基,烷基羰基和甲酰基的取代基取代的,包含6至10个碳环原子的一价芳香族碳环单或双环环系统。芳基的例子包括苯基和萘基,特别是苯基。
单独或组合的术语“杂芳基”表示任选被1至3个独立选自卤素,羟基,烷基,烯基,炔基,烷氧基,烷氧基烷基,烯基氧基,羧基,烷氧基羰基,烷基羰基和甲酰基的取代基取代的,5至12个环原子的一价芳香族杂环单或双环环系统,其包含1,2,3或4个选自N,O和S的杂原子,剩余环原子是碳。杂芳基的例子包括吡咯基,呋喃基,噻吩基,咪唑基,噁唑基,噻唑基,三唑基,噁二唑基,噻二唑基,四唑基,吡啶基,吡嗪基,吡唑基,哒嗪基,嘧啶基,三嗪基,氮杂环庚烷基,二氮杂环庚烷基,异噁唑基,苯并呋喃基,异噻唑基,苯并噻吩基,吲哚基,异吲哚基,异苯并呋喃基,苯并咪唑基,苯并噁唑基,苯并异噁唑基,苯并噻唑基,苯并异噻唑基,苯并噁二唑基,苯并噻二唑基,苯并三唑基,嘌呤基,喹啉基,异喹啉基,喹唑啉基,喹噁啉基,咔唑基或吖啶基。
单独或组合的术语“杂环基”表示任选被1至3个独立选自卤素,羟基,烷基,烯基,炔基,烷氧基,烷氧基烷基,烯基氧基,羧基,烷氧基羰基,烷基羰基和甲酰基的取代基取代的,4至12个,特别是4至9个环原子的一价饱和或部分不饱和的单或双环环系统,其包含1,2,3或4个选自N,O和S的环杂原子,剩余环原子是碳。单环饱和杂环基的例子是氮杂环丁烷基,吡咯烷基,四氢呋喃基,四氢噻吩基,吡唑烷基,咪唑烷基,噁唑烷基,异噁唑烷基,噻唑烷基,哌啶基,四氢吡喃基,四氢噻喃基,哌嗪基,吗啉基,硫吗啉基,1,1-二氧代-硫吗啉-4-基,氮杂环庚烷基,二氮杂环庚烷基,高哌嗪基,或氧杂氮杂环庚烷基。双环饱和杂环烷基的例子是8-氮杂-双环[3.2.1]辛基,奎宁环基,8-氧杂-3-氮杂-双环[3.2.1]辛基,9-氮杂-双环[3.3.1]壬基,3-氧杂-9-氮杂-双环[3.3.1]壬基,或3-硫杂-9-氮杂-双环[3.3.1]壬基。部分不饱和的杂环烷基的例子是二氢呋喃基,咪唑啉基,二氢噁唑基,四氢吡啶基或二氢吡喃基。
药学可接受盐
术语“药学可接受盐”指不是在生物学上或在其它方面不想要的,保留游离碱或游离酸的生物学有效性和特性的那些盐。与无机酸,诸如氢氯酸,氢溴酸,硫酸,硝酸,磷酸,特别是氢氯酸,和有机酸,诸如乙酸,丙酸,乙醇酸,丙酮酸,草酸,马来酸,丙二酸,琥珀酸,富马酸,酒石酸,柠檬酸,苯甲酸,肉桂酸,扁桃酸,甲磺酸,乙磺酸,p-甲苯磺酸,水杨酸,N-乙酰基半胱氨酸形成盐。另外,可以通过将无机碱或有机碱添加至游离酸来制备这些盐。自无机碱衍生的盐包括但不限于钠,钾,锂,铵,钙,镁盐。自有机碱衍生的盐包括但不限于伯,仲,和叔胺,取代的胺,包括天然发生的取代的胺,环胺和碱性离子交换树脂,诸如异丙胺,三甲胺,二乙胺,三乙胺,三丙胺,乙醇胺,赖氨酸,精氨酸,N-乙基哌啶,哌啶,多胺树脂的盐。式(I)的化合物也可以以两性离子的形式存在。式(I)的化合物的特别优选的药学可接受盐是氢氯酸,氢溴酸,硫酸,磷酸和甲磺酸的盐。
保护基团
单独或组合的术语“保护基团”表示选择性封闭多官能化合物中的反应性位点,使得能在另一个未保护的反应性位点选择性进行化学反应的基团。可以去除保护基团。例示性保护基团是氨基保护基团,羧基保护基团或羟基保护基团。
核酸酶介导的降解
核酸酶介导的降解指在与此类序列形成双链体时能够介导互补核苷酸序列降解的寡核苷酸。
在一些实施方案中,寡核苷酸可经由核酸酶介导的靶核酸降解来发挥功能,其中本发明的寡核苷酸能够募集核酸酶,特别是内切核酸酶,优选内切核糖核酸酶(RNA酶),诸如RNA酶H。经由核酸酶介导的机制运作的寡核苷酸设计的例子是典型地包含至少5或6个DNA核苷的区域且一侧或两侧侧翼为亲和力增强性核苷的寡核苷酸,例如缺口体(gapmer),头体(headmer)和尾体(tailmer)。
RNA酶H活性和募集
反义寡核苷酸的RNA酶H活性指它在与互补RNA分子形成双链体时募集RNA酶H的能力。WO 01/23613提供用于测定RNA酶H活性的体外方法,其可用于测定募集RNA酶H的能力。典型地,如果在与互补靶核酸序列一起提供时具有使用与所测试的修饰的寡核苷酸具有相同碱基序列但只含有在寡核苷酸中的所有单体之间具有硫代磷酸酯连接的DNA单体的寡核苷酸,且使用由WO 01/23613(据此通过援引收录)的实施例91-95提供的方法学测定的初始速率的至少5%,诸如至少10%或多于20%的初始速率(如以pmol/l/min测量的)的话,认为寡核苷酸能够募集RNA酶H。供测定RNA酶H活性中使用,重组人RNA酶H1自Lubio ScienceGmbH(Lucerne,Switzerland)可得。
缺口体
本发明的反义寡核苷酸或其连续核苷酸序列可以是缺口体。反义缺口体常常用于经由RNA酶H介导的降解来抑制靶核酸。缺口体寡核苷酸包含至少三个独特的结构区,5’侧翼,缺口和3’侧翼,‘5->3’取向的F-G-F’。“缺口”区(G)包含使得寡核苷酸能够募集RNA酶H的一段连续DNA核苷酸。缺口区侧翼是包含一个或多个糖修饰的核苷,有利地是高亲和力糖修饰的核苷的5’侧翼区(F),和包含一个或多个糖修饰的核苷,有利地是高亲和力糖修饰的核苷的3’侧翼区(F’)。F和F’区中的一个或多个糖修饰的核苷增强寡核苷酸对靶核酸的亲和力(即,是亲和力增强性糖修饰的核苷)。在一些实施方案中,F和F’区中的一个或多个糖修饰的核苷是2’糖修饰的核苷,诸如高亲和力2’糖修饰,诸如独立选自LNA和2’-MOE。
在缺口体设计中,缺口区的最5’和3’核苷是DNA核苷,而且分别位置与5’(F)或3’(F’)区的糖修饰的核苷相邻。可以通过在最远离缺口区的末端,即在5’侧翼的5’末端和在3’侧翼的3’末端具有至少一个糖修饰的核苷来进一步定义侧翼。
F-G-F’区形成连续核苷酸序列。本发明的反义寡核苷酸或其连续核苷酸序列可包含式F-G-F’的缺口体区。
缺口体设计F-G-F’的总体长度可以是例如12至32个核苷,诸如13至24个,诸如14至22个核苷,诸如14至17个,诸如16至18个核苷。
举例而言,本发明的缺口体寡核苷酸可以用下式表示:
F1-8-G5-16-F’1-8,诸如F1-8-G7-16-F’2-8,
前提是缺口体区F-G-F’的总体长度是长度为至少12个,诸如至少14个核苷酸。
下面进一步定义F,G和F’区,而且可以并入F-G-F’式。
缺口体-G区
缺口体的G区(缺口区)是使得寡核苷酸能够募集RNA酶H,诸如人RNA酶H1的核苷,典型地是DNA核苷的区域。RNA酶H是识别DNA和RNA之间的双链体,并酶促切割RNA分子的细胞酶。合适地,缺口体可具有长度为至少5或6个连续DNA核苷,诸如5-16个连续DNA核苷,诸如6-15个连续DNA核苷,诸如7-14个连续DNA核苷,诸如8-12个连续DNA核苷酸,诸如8-12个连续DNA核苷酸的缺口区(G)。在一些实施方案中,缺口区G可以由6,7,8,9,10,11,12,13,14,15或16个连续DNA核苷组成。在一些情况中,缺口区中的胞嘧啶(C)DNA可以是甲基化的,此类残基或是注释为5-甲基-胞嘧啶(meC)或是用E代替C。如果缺口中存在CG二核苷酸的话,缺口中的胞嘧啶DNA的甲基化对于降低潜在毒性是有利的,修饰对寡核苷酸的功效没有显著影响。
在一些实施方案中,缺口区G可以由6,7,8,9,10,11,12,13,14,15或16个连续硫代磷酸酯连接的DNA核苷组成。在一些实施方案中,缺口中的所有核苷间连接是硫代磷酸酯连接。
尽管传统的缺口体具有DNA缺口区,然而有在缺口区内使用时容许RNA酶H募集的修饰的核苷的众多例子。已经报告为在缺口区内包括时能够募集RNA酶H的修饰的核苷包括例如α-L-LNA,C4’烷基化DNA(如描述于PCT/EP2009/050349和Vester et al.,Bioorg.Med.Chem.Lett.18(2008)2296-2300,通过援引将二者收入本文),阿拉伯糖衍生的核苷,像ANA和2'F-ANA(Mangos et al.,2003,J.Am.Chem.Soc.125,654-661),UNA(未锁定的核酸)(如描述于Fluiter et al.,Mol.Biosyst.,2009,10,1039,通过援引收入本文)。UNA是未锁定的核酸,典型地其中已经去除核糖的C2和C3之间的键,形成未锁定的“糖”残基。此类缺口体中使用的修饰的核苷可以是在引入缺口区时采取2’向内(DNA样)结构的核苷,即容许RNA酶H募集的修饰。在一些实施方案中,本文中描述的DNA缺口区(G)可任选含有1至3个在引入缺口区时采取2’向内(DNA样)结构的糖修饰的核苷。
G区-“缺口破坏者”
或者,有将赋予3’向内构象的修饰的核苷插入缺口体的缺口区,同时保留一些RNA酶H活性的众多报告。具有包含一个或多个3’向内修饰的核苷的缺口区的此类缺口体称作“缺口破坏者”或“缺口断裂”缺口体,见例如WO2013/022984。缺口破坏者寡核苷酸在缺口区内保留足够的DNA核苷区域以容许RNA酶H募集。缺口破坏者寡核苷酸设计募集RNA酶H的能力典型地是序列或甚至化合物特异性的,见Rukov et al.,2015,Nucl.Acids Res.Vol.43,pp.8476-8487,其公开募集RNA酶H的“缺口破坏者”寡核苷酸,其在一些情况中提供更加特异性的对靶RNA的切割。缺口破坏者寡核苷酸的缺口区内使用的修饰的核苷可以是例如赋予3’向内构象的修饰的核苷,诸如2’-O-甲基(OMe)或2’-O-MOE(MOE)核苷,或β-D-LNA核苷(核苷的核糖糖环的C2’和C4’之间的桥处于β构象),诸如β-D-氧基LNA或ScET核苷。
就像含有上文描述的G区的缺口体,缺口破坏者或缺口破坏缺口体的缺口区具有缺口的5’末端(与F区的3’核苷相邻)处的DNA核苷和缺口的3’末端(与F’区的5’核苷相邻)处的DNA核苷。包含破坏缺口的缺口体典型地保留缺口区的5’末端或3’末端任一处的至少3或4个连续DNA核苷的区域。
缺口破坏者寡核苷酸的例示性设计包括
F1-8-[D3-4-E1-D3-4]-F’1-8
F1-8-[D1-4-E1-D3-4]-F’1-8
F1-8-[D3-4-E1-D1-4]-F’1-8
其中G区在方括号[Dn-Er-Dm]内,D是DNA核苷的连续序列,E是修饰的核苷(缺口破坏者或缺口破坏核苷),而F和F’是如本文中定义的侧翼区,而且前提是缺口体区F-G-F’的总体长度是长度为至少12个,诸如至少14个核苷酸。
在一些实施方案中,缺口破坏缺口体的G区包含至少6个DNA核苷,诸如6,7,8,9,10,11,12,13,14,15或16个DNA核苷。如上文描述的,DNA核苷可以是连续的,或者可以任选是散布有一个或多个修饰的核苷,前提是缺口区G能够介导RNA酶H募集。
缺口体-侧翼区,F和F’
F区位置紧邻G区的5’DNA核苷。F区的最3’核苷是糖修饰的核苷,诸如高亲和力糖修饰的核苷,例如2’取代的核苷,诸如MOE核苷,或LNA核苷。
F’区位置紧邻G区的3’DNA核苷。F’区的最5’核苷是糖修饰的核苷,诸如高亲和力糖修饰的核苷,例如2’取代的核苷,诸如MOE核苷,或LNA核苷。
F区长度为1-8个连续核苷酸,诸如长度为2-6个,诸如3-4个连续核苷酸。有利地,F区的最5’核苷是糖修饰的核苷。在一些实施方案中,F区的两个最5’核苷是糖修饰的核苷。在一些实施方案中,F区的最5’核苷是LNA核苷。在一些实施方案中,F区的两个最5’核苷是LNA核苷。在一些实施方案中,F区的两个最5’核苷是2’取代的核苷,诸如两个3’MOE核苷。在一些实施方案中,F区的最5’核苷是2’取代的核苷,诸如MOE核苷。
F’区长度为2-8个连续核苷酸,诸如长度为3-6个,诸如4-5个连续核苷酸。有利地,F’区的最3’核苷是糖修饰的核苷。在一些实施方案中,F’区的两个最3’核苷是糖修饰的核苷。在一些实施方案中,F’区的两个最3’核苷是LNA核苷。在一些实施方案中,F’区的最3’核苷是LNA核苷。在一些实施方案中,F’区的两个最3’核苷是2’取代的核苷,诸如两个3’MOE核苷。在一些实施方案中,F’区的最3’核苷是2’取代的核苷,诸如MOE核苷。
应当注意,当F或F’区的长度为1时,它有利地是LNA核苷。
在一些实施方案中,F和F’区独立由糖修饰的核苷的连续序列组成或包含其。在一些实施方案中,F区的糖修饰的核苷可以独立选自2’-O-烷基-RNA单元,2’-O-甲基-RNA,2’-氨基-DNA单元,2’-氟-DNA单元,2’-烷氧基-RNA,MOE单元,LNA单元,阿拉伯糖核酸(ANA)单元和2’-氟-ANA单元。
在一些实施方案中,F和F’区独立包含LNA和2’取代的修饰的核苷二者(混合翼设计)。
在一些实施方案中,F和F’区由仅仅一种类型的糖修饰的核苷组成,诸如仅仅MOE或仅仅β-D-氧基LNA或仅仅ScET。此类设计也称作均匀侧翼或均匀缺口体设计。
在一些实施方案中,F或F’,或F和F’区的所有核苷是LNA核苷,诸如独立选自β-D-氧基LNA,ENA或ScET核苷。在一些实施方案中,F区由1-5个,诸如2-4个,诸如3-4个,诸如1,2,3,4或5个连续LNA核苷组成。在一些实施方案中,F和F’区的所有核苷是β-D-氧基LNA核苷。
在一些实施方案中,F或F’,或F和F’区的所有核苷是2’取代的核苷,诸如OMe或MOE核苷。在一些实施方案中,F区由1,2,3,4,5,6,7,或8个连续OMe或MOE核苷组成。在一些实施方案中,仅侧翼区之一可以由2’取代的核苷,诸如OMe或MOE核苷组成。在一些实施方案中,是5’(F)侧翼区由2’取代的核苷,诸如OMe或MOE核苷组成,而3’(F’)侧翼区包含至少一个LNA核苷,诸如β-D-氧基LNA核苷或cET核苷。在一些实施方案中,是3’(F’)侧翼区由2’取代的核苷,诸如OMe或MOE核苷组成,而5’(F)侧翼区包含至少一个LNA核苷,诸如β-D-氧基LNA核苷或cET核苷。
在一些实施方案中,F和F’区的所有修饰的核苷是LNA核苷,诸如独立选自β-D-氧基LNA,ENA或ScET核苷,其中F或F’,或F和F’区可以任选包含DNA核苷(交替侧翼,更多详情见这些的定义)。在一些实施方案中,F和F’区的所有修饰的核苷是β-D-氧基LNA核苷,其中F或F’,或F和F’区可以任选包含DNA核苷(交替侧翼,更多详情见这些的定义)。
在一些实施方案中,F和F’区的最5’和最3’核苷是LNA核苷,诸如β-D-氧基LNA核苷或ScET核苷。
在一些实施方案中,F区和G区之间的核苷间连接是硫代磷酸酯核苷间连接。在一些实施方案中,F’区和G区之间的核苷间连接是硫代磷酸酯核苷间连接。在一些实施方案中,F或F’,F和F’区的核苷之间的核苷间连接是硫代磷酸酯核苷间连接。
别的缺口体设计公开于WO 2004/046160,WO 2007/146511和WO 2008/113832,据此通过援引收录。
LNA缺口体
LNA缺口体是其中F和F’区之一或二者包含LNA核苷或由其组成的缺口体。β-D-氧基缺口体是其中F和F’区之一或二者包含β-D-氧基LNA核苷或由其组成的缺口体。
在一些实施方案中,LNA缺口体是式:[LNA]1-5-[G区]-[LNA]1-5,其中G区如缺口体G区定义中定义的。
MOE缺口体
MOE缺口体是其中F和F’区由MOE核苷组成的缺口体。在一些实施方案中,MOE缺口体是设计[MOE]1-8-[G区]-[MOE]1-8,诸如[MOE]2-7-[G区]5-16-[MOE]2-7,诸如[MOE]3-6-[G区]-[MOE]3-6,其中G区如缺口体定义中定义的。具有5-10-5设计(MOE-DNA-MOE)的MOE缺口体已经在本领域广泛使用。
混合翼缺口体
混合翼缺口体是其中F和F’区之一或二者包含2’取代的核苷,诸如独立选自由2’-O-烷基-RNA单元,2’-O-甲基-RNA,2’-氨基-DNA单元,2’-氟-DNA单元,2’-烷氧基-RNA,MOE单元,阿拉伯糖核酸(ANA)单元和2’-氟-ANA单元组成的组的2’取代的核苷,诸如MOE核苷的LNA缺口体。在其中F和F’区至少之一或F和F’区二者包含至少一个LNA核苷的一些实施方案中,F和F’区的剩余核苷独立选自由MOE和LNA组成的组。在其中F和F’区至少之一或F和F’区二者包含至少两个LNA核苷的一些实施方案中,F和F’区的剩余核苷独立选自由MOE和LNA组成的组。在一些混合翼实施方案中,F和F’区之一或二者可进一步包含一个或多个DNA核苷。
混合翼缺口体设计公开于WO 2008/049085和WO 2012/109395,通过援引收录它们二者。
交替侧翼缺口体
侧翼区可包含LNA和DNA核苷二者且称作“交替侧翼”,因为它们包含LNA-DNA-LNA核苷的交替基序。包含此类交替侧翼的缺口体称作“交替侧翼缺口体”。“交替侧翼缺口体”因而是其中侧翼至少之一(F或F’)在LNA核苷以外包含DNA的LNA缺口体寡核苷酸。在一些实施方案中,F或F’区至少之一或F和F’区二者包含LNA核苷和DNA核苷二者。在此类实施方案中,侧翼区F或F’,或F和F’二者包含至少三个核苷,其中F和/或F’区的最5’和3’核苷是LNA核苷。
交替侧翼LNA缺口体公开于WO 2016/127002。
具有交替侧翼的寡核苷酸是其中侧翼至少之一(F或F’)在LNA核苷以外包含DNA的LNA缺口体寡核苷酸。在一些实施方案中,F或F’区至少之一或F和F’区二者包含LNA核苷和DNA核苷二者。在此类实施方案中,侧翼区F或F’,或F和F’二者包含至少三个核苷,其中F和/或F’区的最5’和3’核苷是LNA核苷。
在一些实施方案中,F或F’区至少之一或F和F’区二者包含LNA核苷和DNA核苷二者。在此类实施方案中,侧翼区F或F’,或F和F’二者包含至少三个核苷,其中F或F’区的最5’和3’核苷是LNA核苷,等等。包含LNA和DNA核苷二者的侧翼区称作交替侧翼,因为它们包含LNA-DNA-LNA核苷的交替基序。交替侧翼LNA缺口体公开于WO 2016/127002。
交替侧翼区可包含多至3个连续DNA核苷,诸如1至2个,或1,2或3个连续DNA核苷。
交替侧翼可以注释为一系列整数,代表LNA核苷(L)的数目,继以DNA核苷(D)的数目,例如
[L]1-3-[D]1-4-[L]1-3
[L]1-2-[D]1-2-[L]1-2-[D]1-2-[L]1-2
在寡核苷酸设计中,这些常常会用数目代表,诸如2-2-1代表5’[L]2-[D]2-[L]3’,而1-1-1-1-1代表5’[L]-[D]-[L]-[D]-[L]3’。具有交替侧翼的寡核苷酸中侧翼(F和F’区)的长度可以独立是3至10个核苷,诸如4至8个,诸如5至6个核苷,诸如4,5,6或7个修饰的核苷。在一些实施方案中,缺口体寡核苷酸中的侧翼仅之一是交替的,而另一由LNA核苷酸构成。在3’侧翼(F’)的3’末端具有至少两个LNA核苷对于赋予另外的外切核酸酶抗性可能是有利的。具有交替侧翼的寡核苷酸的一些例子是:
[L]1-5-[D]1-4-[L]1-3-[G]5-16-[L]2-6
[L]1-2-[D]1-2-[L]1-2-[D]1-2-[L]1-2-[G]5-16-[L]1-2-[D]1-3-[L]2-4
[L]1-5-[G]5-16-[L]-[D]-[L]-[D]-[L]2
前提是缺口体的总体长度是长度为至少12个,诸如至少14个核苷酸。
寡核苷酸中的D’或D”区
在一些实施方案中,本发明的寡核苷酸可包含与靶核酸互补的寡核苷酸的连续核苷酸序列,诸如缺口体F-G-F’,和别的5’和/或3’核苷或由其组成。别的5’和/或3’核苷可以是或不是与靶核酸完全互补的。此类别的5’和/或3’核苷在本文中可称作D’和D”区。
D’或D”区的添加可用于将连续核苷酸序列,诸如缺口体连接至缀合物模块或另一个官能团的目的。当用于连接连续核苷酸序列与缀合物模块时,它可充当生物可切割接头。或者,它可用于提供外切核酸酶保护或使合成或制造变得容易。
D’和D”区可附着于F区的5’末端或F’区的3’末端,分别生成下式D’-F-G-F’,F-G-F’-D”或D’-F-G-F’-D”的设计。在这种情况中,F-G-F’是寡核苷酸的缺口体部分,而D’或D”区构成寡核苷酸的分开部分。
D’或D”区可独立包含可以与靶核酸互补或不互补的1,2,3,4或5个另外的核苷酸或由其组成。与F或F’区相邻的核苷酸不是糖修饰的核苷酸,诸如DNA或RNA或这些的碱基修饰型式。D’或D”区可充当核酸酶易感性生物可切割接头(见接头的定义)。在一些实施方案中,另外的5’和/或3’末端核苷酸是以磷酸二酯连接连接的,而且是DNA或RNA。适合用作D’或D”区的基于核苷酸的生物可切割接头公开于WO 2014/076195,其包括例如磷酸二酯连接的DNA二核苷酸。多-寡核苷酸构建物中生物可切割接头的使用公开于WO2015/113922,其中它们用于在单个寡核苷酸内连接多个反义构建物(例如缺口体区)。
在一个实施方案中,本发明的寡核苷酸在构成缺口体的连续核苷酸序列以外包含D’和/或D”区。
在一些实施方案中,本发明的寡核苷酸可以以下式表示:
F-G-F’,特别是F1-8-G5-16-F’2-8
D’-F-G-F’,特别是D’1-3-F1-8-G5-16-F’2-8
F-G-F’-D”,特别是F1-8-G5-16-F’2-8-D”1-3
D’-F-G-F’-D”,特别是D’1-3-F1-8-G5-16-F’2-8-D”1-3
在一些实施方案中,位于D’区和F区之间的核苷间连接是磷酸二酯连接。在一些实施方案中,位于F’区和D”区之间的核苷间连接是磷酸二酯连接。
缀合物
如本文中使用的术语缀合物指与非核苷酸模块(缀合物模块或C区或第三区)共价连接的寡核苷酸。
本发明的寡核苷酸对一个或多个非核苷酸模块的缀合可改善寡核苷酸的药理学,例如通过影响寡核苷酸的活性,细胞分布,细胞摄取或稳定性。在一些实施方案中,缀合物模块通过改善寡核苷酸的细胞分布,生物利用度,代谢,排泄,通透性,和/或细胞摄取来修饰或增强寡核苷酸的药动学特性。特别是,缀合物可将寡核苷酸靶向特定器官,组织或细胞类型并由此增强寡核苷酸在该器官,组织或细胞类型中的有效性。同时,缀合物可用来降低寡核苷酸在非靶细胞类型,组织或器官中的活性,例如脱靶活性或在非靶细胞类型,组织或器官中的活性。WO 93/07883和WO 2013/033230提供了合适的缀合物模块,通过援引收录它们。别的合适的缀合物模块是那些能够结合无唾液酸糖蛋白受体(ASGPr)的。特别是,三价N-乙酰基半乳糖胺缀合物模块适合于结合ASGPr,见例如WO 2014/076196,WO 2014/207232和WO 2014/179620(据此通过援引收录,特别是WO 2014/076196的图13或WO2014/179620的权利要求158-164)。
寡核苷酸缀合物和它们的合成还已经在全面综述中报告,Manoharan,AntisenseDrug Technology,Principles,Strategies,and Applications,S.T.Crooke,ed.,Ch.16,Marcel Dekker,Inc.,2001和Manoharan,Antisense and Nucleic Acid DrugDevelopment,2002,12,103,通过援引将其每一篇完整收入本文。
在一个实施方案中,非核苷酸模块(缀合物模块)选自由碳水化合物,细胞表面受体配体,药物物质,激素,亲脂性物质,聚合物,蛋白质,肽,毒素(例如细菌毒素),维生素,病毒蛋白质(例如衣壳)或其组合组成的组。
接头
连接或接头是两个原子之间的联系,经由一个或多个共价键连接一个感兴趣化学基团或区段与另一个感兴趣化学基团或区段。缀合物模块可直接或经由连接模块(例如接头或系链)附着于寡核苷酸。接头用来共价连接第三区,例如缀合物模块(C区)与第一区,例如与靶核酸互补的寡核苷酸或连续核苷酸序列(A区),由此连接A区的末端之一与C。
在本发明的一些实施方案中,本发明的缀合物或寡核苷酸缀合物可任选包含位于与靶核酸互补的寡核苷酸或连续核苷酸序列(A区或第一区)和缀合物模块(C区或第三区)之间的接头区(第二区或B区和/或Y区)。
B区指包含在正常情况下遭遇的或与在哺乳动物身体内遭遇的条件类似的条件下可切割的生理学上不稳定的键或由其组成的生物可切割接头。生理学上不稳定的接头经历化学转化(例如切割)的条件包括在哺乳动物细胞中找到的或与在哺乳动物细胞中遭遇的那些类似的化学条件,诸如pH,温度,氧化性或还原性条件或药剂,和盐浓度。哺乳动物细胞内条件还包括正常情况下在哺乳动物细胞中存在的酶活性的存在,诸如蛋白水解酶或水解酶或核酸酶。在一个实施方案中,生物可切割接头对S1核酸酶切割易感。在一个优选的实施方案中,核酸酶易感性接头包含1至10个核苷,诸如1,2,3,4,5,6,7,8,9或10个核苷,更优选2至6个核苷,最优选2至4个连接的核苷,包含至少两个连续磷酸二酯连接,诸如至少3或4或5个连续磷酸二酯连接。优选地,核苷是DNA或RNA。含有磷酸二酯的生物可切割接头更加详细地描述于WO2014/076195(据此通过援引收录)。
还可以经由非生物可切割接头将缀合物连接至寡核苷酸,或者在一些实施方案中,缀合物可包含共价附着至生物可切割接头的不可切割接头(Y区)。并非必然生物可切割但主要用来共价连接缀合物模块(C区或第三区)与寡核苷酸(A区或第一区)的接头可包含链结构或重复单元,诸如乙二醇,氨基酸单元或氨基烷基基团的寡聚物。本发明的寡核苷酸缀合物可以用下面的区域元件构建:A-C,A-B-C,A-B-Y-C,A-Y-B-C或A-Y-C。在一些实施方案中,不可切割接头(Y区)是氨基烷基,诸如C2至C36氨基烷基基团,包括例如C6至C12氨基烷基基团。在一个优选的实施方案中,接头(Y区)是C6氨基烷基基团。缀合物接头基团可经由使用氨基修饰的寡核苷酸和缀合物基团上的活化的酯基团例行附着至寡核苷酸。
治疗
如本文中使用的术语“治疗”指治疗现有的疾病(例如如本文中提到的疾病或病症)或预防疾病(即防范)二者。因此会认识的是,如本文中提到的治疗在一些实施方案中可以是预防性的。
发明详述
本发明的寡核苷酸
本发明涉及能够抑制PIAS4的表达的寡核苷酸。可以通过与编码PIAS4或牵涉调节PIAS4的靶核酸杂交来实现抑制。靶核酸可以是哺乳动物PIAS4序列,诸如选自由SEQ IDNO:1,2和3组成的组的序列。
本发明的寡核苷酸是靶向PIAS4的反义寡核苷酸。
在一些实施方案中,本发明的反义寡核苷酸能够通过抑制或降低靶标表达来调控靶标的表达。优选地,此类表达抑制是与靶标的正常表达水平相比至少20%,更加优选地与靶标的正常表达水平相比至少30%,40%,50%,60%,70%,80%,90%或95%抑制。在一些实施方案中,本发明的寡核苷酸可能能够在体外使用HeLa细胞将PIAS4 mRNA的表达水平抑制至少60%或70%。在一些实施方案中,本发明的化合物可能能够在体外使用HeLa细胞将PIAS4蛋白质的表达水平抑制至少50%。合适地,实施例提供可用于测量PIAS4 RNA或蛋白质抑制的测定法(例如实施例1)。通过寡核苷酸的连续核苷酸序列和靶核酸之间的杂交触发靶标调控。在一些实施方案中,本发明的寡核苷酸包含寡核苷酸和靶核酸之间的错配。尽管错配,与靶核酸的杂交可能仍然足以显示期望的对PIAS4表达的调控。错配导致的降低的结合亲和力可能通过增加寡核苷酸中核苷酸的数目和/或增加寡核苷酸序列内存在的能够提高对靶物的结合亲和力的修饰的核苷,诸如2’糖修饰的核苷,包括LNA的数目有利地得到补偿。
本发明的一个方面涉及一种长度为10至50个,诸如10至30个核苷酸的反义寡核苷酸,其包含与哺乳动物PIAS4编码靶核酸具有至少90%互补性,诸如完全互补性的长度为10至30个核苷酸的连续核苷酸序列,其中反义寡核苷酸能够降低细胞中哺乳动物PIAS4编码靶核酸的表达。
本发明的一个方面涉及一种长度为10至30个核苷酸的反义寡核苷酸,其包含与哺乳动物PIAS4编码靶核酸具有至少90%互补性,诸如完全互补性的长度为10至22个核苷酸的连续核苷酸序列,其中反义寡核苷酸能够降低细胞中哺乳动物PIAS4编码靶核酸的表达。
本发明的另一个方面涉及依照本发明的反义寡核苷酸,其中该连续核苷酸序列与哺乳动物PIAS4编码靶核酸的前mRNA(例如SEQ ID NO:1)中存在的内含子区至少90%互补,诸如完全互补。
在一些实施方案中,反义寡核苷酸包含与靶核酸或靶序列至少90%互补,诸如至少91%,诸如至少92%,诸如至少93%,诸如至少94%,诸如至少95%,诸如至少96%,诸如至少97%,诸如至少98%,或100%互补的连续序列。
在一个优选的实施方案中,本发明的反义寡核苷酸或其连续核苷酸序列与靶核酸或靶序列完全互补(100%互补),或者在一些实施方案中,可包含寡核苷酸和靶核酸之间的一处或两处错配。
本发明的另一个方面涉及反义寡核苷酸,其中连续核苷酸序列与选自由SEQ IDNO:1,2或3,或其天然发生变体组成的组的序列至少90%互补。
在一些实施方案中,寡核苷酸序列与SEQ ID NO:1和SEQ ID NO:3中存在的相应靶序列至少90%互补或至少95%互补,诸如完全互补。在一些实施方案中,反义寡核苷酸的连续序列与哺乳动物PIAS4靶核酸完全互补。
在一个优选的实施方案中,寡核苷酸序列是SEQ ID NO:1和SEQ ID NO:8中存在的相应靶序列或与SEQ ID NO:1和SEQ ID NO:8中存在的相应靶序列100%互补。在另一个实施方案中,寡核苷酸序列与SEQ ID NO:1至8中存在的相应靶核酸区100%互补。
本发明的另一个方面涉及反义寡核苷酸,其中连续核苷酸序列与哺乳动物PIAS4靶核酸的前mRNA(例如SEQ ID NO:1)中存在的内含子区至少90%互补,诸如完全互补。
应当理解,SEQ ID NO:1上的内含子位置可以根据PIAS4前mRNA的不同剪接而变化。在本发明的语境中,基因序列或前mRNA中在最终RNA产物(成熟mRNA)的成熟期间通过RNA剪接自前mRNA去除的任何核苷酸序列是内含子,不管它们在SEQ ID NO:1上的位置。表1提供SEQ ID NO:1中的最常见内含子区。
在一些实施方案中,连续核苷酸序列与选自内含子1(SEQ ID NO:1的143-5277);内含子2(SEQ ID NO:1的5705-16390);内含子3(SEQ ID NO:1的16476-20500);内含子4(SEQ ID NO:1的20543-20864);内含子5(SEQ ID NO:1的20956-21074);内含子6(SEQ IDNO:1的21204-21285);内含子7(SEQ ID NO:1的21390-25454);内含子8(SEQ ID NO:1的25529-25774);内含子9(SEQ ID NO:1的25936-29728)和内含子10(SEQ ID NO:1的29860-29970)的人PIAS4的前mRNA中存在的内含子区至少90%互补,诸如完全互补。
在一些实施方案中,本发明的反义寡核苷酸或其连续核苷酸序列与哺乳动物PIAS4靶核酸的人前mRNA的内含子9,例如哺乳动物PIAS4靶核酸的人前mRNA的核苷酸,例如SEQ ID NO:1的核苷酸25936-29728至少90%互补,诸如完全互补。
在一些实施方案中,本发明的反义寡核苷酸或其连续核苷酸序列与哺乳动物PIAS4靶核酸的人前mRNA的内含子9,例如哺乳动物PIAS4靶核酸的人前mRNA的核苷酸,例如SEQ ID NO:1的核苷酸28478-29043至少90%互补,诸如完全互补。
在一些实施方案中,连续核苷酸序列与SEQ ID NO:4至少90%互补,诸如完全互补。
在一些实施方案中,连续核苷酸序列与SEQ ID NO:13至少90%互补,诸如完全互补。
在一些实施方案中,寡核苷酸或连续核苷酸序列与靶核酸的一个区域互补,其中靶核酸区域选自由SEQ ID NO:1的位置28478-28497,28540-28559,28816-28835,28910-28929,29024-29043;28478-28495,28540-28557,28696-28713,28816-28833,28910-28927,29024-29041;28482-28497,28544-28559,28820-28835,28914-28929,29028-29043;28484-28497,28546-28559,28822-28835,28916-28929,29030-29043;28142-28161,28144-28161,28145-28160,28147-28160组成的组。
依照本发明的一个方面,靶序列在靶核酸内重复,即在靶核酸中在不同位置处存在至少两个相同的长度为至少10个核苷酸的靶核苷酸序列(靶区)。重复靶区一般是10至50个核苷酸,诸如11至30个核苷酸,诸如12至25个核苷酸,诸如13至22个核苷酸,诸如14至20个核苷酸,诸如15至19个核苷酸,诸如16至18个核苷酸。在一个优选的实施方案中,重复靶区是14至20个核苷酸。
在一个方面,本发明提供反义寡核苷酸,其中连续核苷酸序列与跨越SEQ ID NO:1的靶核酸重复至少2次的靶区至少90%互补,诸如完全互补。这样的效果是数个寡核苷酸化合物(具有相同序列)能与同一靶核酸上的一个或多个靶区杂交(同时),这在将寡核苷酸施用于细胞或动物或人时可导致对靶核酸的多个切割事件。
在一些实施方案中,寡核苷酸或连续核苷酸序列与重复靶区,至少3个重复靶区,诸如至少4,5,6,7,8,9或10个重复靶区,或多于10个重复靶区的靶区至少90%互补,诸如完全互补。
在又一个实施方案中,反义寡核苷酸包含与SEQ ID NO:1的靶核酸的长度为10-22个,诸如14-20个核苷酸的靶区至少90%互补,诸如完全互补的连续核苷酸序列,其中靶区跨越靶核酸的内含子重复至少2次或更多次。
在一些实施方案中,本发明的反义寡核苷酸或其连续核苷酸序列与SEQ ID NO:13中的至少5个重复靶区互补。
在一些实施方案中,本发明的寡核苷酸包含长度为10至35个核苷酸,诸如长度为10至30个,诸如11至22个,诸如12至20个,诸如14至18个或14至16个连续核苷酸或由其组成。有利地,寡核苷酸包含长度为14至20个核苷酸或由其组成。
要理解,本文中给出的任何范围包括范围端点。
在一些实施方案中,寡核苷酸或其连续核苷酸序列包含22个或更少核苷酸,诸如20个或更少核苷酸,诸如18个或更少核苷酸,诸如少于18个,诸如14,15,16或17个核苷酸或由其组成。
在一些实施方案中,本发明的连续核苷酸序列包含与选自由SEQ ID NO:9,10,11和12组成的组的序列具有至少90%同一性,诸如100%同一性的长度为10至30个核苷酸或由其组成。
在一些实施方案中,反义寡核苷酸或其连续核苷酸序列包含与选自SEQ ID NO:9,10,11和12的序列具有至少90%同一性,优选100%同一性的长度为12至20个连续核苷酸或由其组成。
在一些实施方案中,反义寡核苷酸或其连续核苷酸序列包含与选自SEQ ID NO:9,10,11和12的序列具有至少90%同一性,优选100%同一性的长度为14至20个连续核苷酸或由其组成。
在一些实施方案中,反义寡核苷酸或其连续核苷酸序列包含选自SEQ ID NO:9和10的序列。
在一些实施方案中,反义寡核苷酸或其连续核苷酸序列包含选自SEQ ID NO:11和12的序列。
寡核苷酸化合物呈现基序序列的具体设计。大写字母代表β-D-氧基LNA核苷,小写字母代表DNA核苷,所有LNA C是5-甲基胞嘧啶,5-甲基DNA胞嘧啶以“e”表示,且所有核苷间连接优选是硫代磷酸酯核苷间连接。理解的是,可以修饰连续核碱基序列(基序序列)以例如提高核酸酶抗性和/或对靶核酸的结合亲和力。修饰描述于定义和下面的段落。表4列举每一种基序序列的优选设计。
理解的是,可以修饰连续核碱基序列(基序序列)以例如提高核酸酶抗性和/或对靶核酸的结合亲和力。修饰描述于定义和下面的段落。表4列举每一种基序序列的优选设计。
其中修饰的核苷(诸如高亲和力修饰的核苷)掺入寡核苷酸序列的样式一般称作寡核苷酸设计。
本发明的寡核苷酸设计成有修饰的核苷和DNA核苷。有利地,使用高亲和力修饰的核苷。
在一个实施方案中,寡核苷酸包含至少1个修饰的核苷,诸如至少2个,至少3个,至少4个,至少5个,至少6个,至少7个,至少8个,至少9个,至少10个,至少11个,至少12个,至少13个,至少14个,至少15个或至少16个修饰的核苷。在一个实施方案中,寡核苷酸包含1至10个修饰的核苷,诸如2至9个修饰的核苷,诸如3至8个修饰的核苷,诸如4至7个修饰的核苷,诸如6或7个修饰的核苷。合适的修饰描述于“定义”部分“修饰的核苷”,“高亲和力修饰的核苷”,“糖修饰”,“2’糖修饰”和“锁定的核酸(LNA)”下。
在一个实施方案中,寡核苷酸包含一个或多个糖修饰的核苷,诸如2’糖修饰的核苷。优选地,本发明的寡核苷酸包含一个或多个独立选自由2’-O-烷基-RNA,2’-O-甲基-RNA,2’-烷氧基-RNA,2’-O-甲氧基乙基-RNA,2’-氨基-DNA,2’-氟-DNA,阿拉伯糖核酸(ANA),2’-氟-ANA和LNA核苷组成的组的2’糖修饰的核苷。有利的是,一个或多个修饰的核苷是锁定的核酸(LNA)。
在又一个实施方案中,寡核苷酸包含至少一个修饰的核苷间连接。合适的核苷间修饰描述于“定义”部分“修饰的核苷间连接”下。有利的是,连续核苷酸序列内至少75%,诸如所有核苷间连接是硫代磷酸酯核苷间连接。在一些实施方案中,寡核苷酸的连续序列中的所有核苷酸间连接是硫代磷酸酯连接。
在一些实施方案中,本发明的寡核苷酸包含至少一个LNA核苷,诸如1,2,3,4,5,6,7,或8个LNA核苷,诸如2至6个LNA核苷,诸如3至7个LNA核苷,4至8个LNA核苷,或3,4,5,6,7或8个LNA核苷。在一些实施方案中,寡核苷酸中至少75%的修饰的核苷是LNA核苷,诸如80%,诸如85%,诸如90%的修饰的核苷是LNA核苷。在仍有又一个实施方案中,寡核苷酸中的所有修饰的核苷是LNA核苷。在又一个实施方案中,寡核苷酸可包含β-D-氧基-LNA和一种或多种下述LNA核苷二者:硫-LNA,氨基-LNA,氧基-LNA,ScET和/或ENA,或是β-D或是α-L构型或其组合。在又一个实施方案中,所有LNA胞嘧啶单元是5-甲基-胞嘧啶。具有核苷酸序列的5’末端处的至少1个LNA核苷和3’末端处的至少2个LNA核苷对于寡核苷酸或连续核苷酸序列的核酸酶稳定性是有利的。
在本发明的一个实施方案中,本发明的寡核苷酸能够募集RNA酶H。
在本发明中,一种有利的结构设计是如“定义”部分中例如“缺口体”,“LNA缺口体”,“MOE缺口体”,“混合翼缺口体”和“交替侧翼缺口体”下描述的缺口体设计。缺口体设计包括具有均匀侧翼,混合翼侧翼,交替侧翼,和缺口破坏者设计的缺口体。在本发明中,有利的是,本发明的寡核苷酸是具有F-G-F’设计的缺口体。在一些实施方案中,缺口体是具有均匀侧翼的LNA缺口体。
在本发明的一些实施方案中,LNA缺口体选自下面的均匀侧翼设计1-17-2,2-13-3,4-10-2和4-7-3。
本发明的例示性化合物
在例示性寡核苷酸化合物中,大写字母代表β-D-氧基LNA核苷,小写字母代表DNA核苷,所有LNA C是5-甲基胞嘧啶,5-甲基DNA胞嘧啶以“e”或mc表示,且所有核苷间连接是硫代磷酸酯核苷间连接。
对于本发明的一些实施方案,寡核苷酸选自具有CMP ID NO:9_1;10_1;11_1和12_1的寡核苷酸化合物的组。
在本发明的一个实施方案中,寡核苷酸是CMP ID NO:11_1或12_1。
制造方法
在又一个方面,本发明提供用于制造本发明的寡核苷酸的方法,其包含使核苷酸单元起反应并由此形成寡核苷酸中包含的共价连接的连续核苷酸单元。优选地,该方法使用亚磷酰胺(亚氨基磷酸酯,phosphoramidite)化学(见例如Caruthers et al.,1987,Methods in Enzymology vol.154,pages 287-313)。在又一个实施方案中,该方法进一步包含使连续核苷酸序列与缀合模块(配体)起反应。在又一个方面,提供用于制造本发明的组合物的方法,其包含混合本发明的寡核苷酸或缀合的寡核苷酸与药学可接受稀释剂,溶剂,载剂,盐和/或佐剂。
药学盐
在又一个方面,本发明提供反义寡核苷酸或其缀合物的药学可接受盐。在一个优选的实施方案中,药学可接受盐是钠或钾盐。
药学组合物
在又一个方面,本发明提供药学组合物,其包含任何上述寡核苷酸和/或寡核苷酸缀合物或其盐和药学可接受稀释剂,载剂,盐和/或佐剂。药学可接受稀释剂包括磷酸盐缓冲盐水(PBS),而药学可接受盐包括但不限于钠和钾盐。在一些实施方案中,药学可接受稀释剂是无菌磷酸盐缓冲盐水。在一些实施方案中,以50-300μM溶液的浓度在药学可接受稀释剂中使用寡核苷酸。
供本发明中使用的合适的配制剂可见于Remington's PharmaceuticalSciences,Mack Publishing Company,Philadelphia,Pa.,17th ed.,1985。对于用于药物投递的方法的简要综述,见例如Langer(Science 249:1527-1533,1990)。WO 2007/031091提供药学可接受稀释剂,载剂和佐剂的别的合适的和优选的例子(据此通过援引收录)。WO2007/031091中还提供合适的剂量,配制剂,施用路径,组合物,剂型,与其它治疗剂的组合,前药配制剂。
本发明的寡核苷酸或寡核苷酸缀合物可以与药学可接受活性或惰性物质混合以制备药学组合物或配制剂。组合物和用于配制药学组合物的方法取决于多项标准,包括但不限于施用的路径,疾病的程度,或要施用的剂量。
这些组合物可以通过常规灭菌技术来灭菌,或者可以无菌过滤。所得水溶液可以包装成原样使用,或冻干,冻干制剂在施用前与无菌水载剂组合。制剂的pH典型地会介于3和11之间,更优选地介于5和9之间或介于6和8之间,而且最优选地介于7和8之间,诸如7至7.5。所得固体形式的组合物可以包装成多个单剂单元,每个含有固定量的上述一种或多种药剂,诸如在片剂或胶囊剂的密封包装中。固体形式的组合物也可以包装在用于灵活数量的容器中,诸如在设计用于表面可应用乳膏剂或软膏剂的可挤压管中。
在一些实施方案中,本发明的寡核苷酸或寡核苷酸缀合物是前药。特别是就寡核苷酸缀合物而言,一旦前药投递至作用位点,例如靶细胞,就自寡核苷酸切割掉缀合物模块。
应用
可利用本发明的寡核苷酸作为研究试剂,用于例如诊断,治疗和预防。
在研究中,可使用此类寡核苷酸来特异性调控细胞(例如体外细胞培养物)和实验动物中PIAS4蛋白质的合成,由此推动靶物的功能分析或它作为治疗干预的靶标的有用性的评估。典型地,通过降解或抑制生成蛋白质的前mRNA或mRNA,由此阻止蛋白质形成或通过降解或抑制生成蛋白质的基因或mRNA的调控剂来实现靶物调控。可以通过靶向前mRNA,由此阻止成熟mRNA形成来实现别的优势。
如果在研究或诊断中采用本发明的寡核苷酸的话,靶核酸可以是自DNA或RNA衍生的cDNA或合成核酸。
本发明提供用于调控表达PIAS4的靶细胞中的PIAS4表达的体内或体外方法,所述方法包含以有效量将本发明的寡核苷酸施用于所述细胞。
在一些实施方案中,靶细胞是哺乳动物细胞,特别是人细胞。靶细胞可以是体外细胞培养物或哺乳动物中形成组织的部分的体内细胞。在优选的实施方案中,靶细胞存在于输精管中的细胞,颗粒细胞,癌细胞,诸如胰腺癌细胞和乳腺癌细胞或肝细胞,诸如肝星形细胞。
在诊断中,可使用寡核苷酸通过Northern印迹,原位杂交或类似技术来检测和量化细胞和组织中的PIAS4表达。
对于治疗,可以将寡核苷酸施用于怀疑具有可以通过调控PIAS4的表达来治疗的疾病或病症的动物或人。
本发明提供用于治疗或预防疾病的方法,其包含将治疗或预防有效量的本发明的寡核苷酸,寡核苷酸缀合物或药学组合物施用于罹患或易感疾病的受试者。
本发明还涉及如本文中定义的寡核苷酸,组合物或缀合物,供作为药物使用。
依照本发明的寡核苷酸,寡核苷酸缀合物或药学组合物典型地以有效量施用。
本发明还提供所描述的发明的寡核苷酸或寡核苷酸缀合物用于制造用于治疗病症,诸如本文中提到的病症的药物,或用于治疗如本文中提到的病症的方法的用途。
如本文中提到的疾病或病症与PIAS4的表达有关。
优选采用本发明的方法来治疗或预防由异常的PIAS4水平和/或活性,特别是升高的PIAS4水平引起的疾病。
本发明进一步涉及如本文中定义的寡核苷酸,寡核苷酸缀合物或药学组合物用于制造用于治疗异常的PIAS4水平和/或活性的药物的用途。
在一个实施方案中,本发明涉及寡核苷酸,寡核苷酸缀合物或药学组合物,供治疗选自癌症,诸如胰腺癌,肝癌,乳腺癌,睾丸癌,黑素瘤,胶质瘤,头和颈癌,结肠直肠癌,尿路上皮癌,前列腺癌,宫颈癌,和子宫内膜癌的疾病或病症中使用。
在一个实施方案中,本发明涉及寡核苷酸,寡核苷酸缀合物或药学组合物,供治疗导致肝纤维化的肝病中使用,特别是肝纤维化与非酒精性脂肪肝病和非酒精性脂肪肝炎(NASH)有关的情况。
施用
可以肠内(诸如口服或经由胃肠道)或胃肠外(诸如静脉内,皮下,肌肉内,(大)脑内,脑室内或鞘内)施用本发明的寡核苷酸,寡核苷酸缀合物或药学组合物。
在一个非限制性实施方案中,通过胃肠外路径施用本发明的反义寡核苷酸,缀合物,药学盐或药学组合物,包括静脉内,动脉内,皮下,腹膜内或肌肉内注射或输注。
在一个实施方案中,静脉内施用活性寡核苷酸或寡核苷酸缀合物或药学组合物。在另一个实施方案中,皮下施用活性寡核苷酸或寡核苷酸缀合物或药学组合物。
在一些实施方案中,以0.1-15mg/kg,诸如0.2-10mg/kg,诸如0.25-5mg/kg的剂量施用本发明的寡核苷酸,寡核苷酸缀合物或药学组合物。施用可以是一周一次,每两周一次,每三周一次或甚至一个月一次或甚至每三个月一次。
本发明还提供所描述的发明的寡核苷酸或寡核苷酸缀合物用于制造药物的用途,其中药物是用于皮下施用的剂型。
本发明还提供所描述的发明的寡核苷酸或寡核苷酸缀合物用于制造药物的用途,其中药物是用于静脉内施用的剂型。
实施方案
本发明的下述实施方案可以与本文中描述的任何其它实施方案组合使用。
1.一种长度为10至50个核苷酸的反义缺口体寡核苷酸,其包含与选自由SEQ IDNO:1和3,或其天然发生变体组成的组的哺乳动物PIAS4靶核酸具有至少90%互补性,诸如完全互补性的长度为10至30个核苷酸的连续核苷酸序列,其中该反义寡核苷酸能够降低细胞中该哺乳动物PIAS4编码靶核酸的表达。
2.实施方案1的反义寡核苷酸,其中该连续核苷酸序列与该哺乳动物PIAS4靶序列完全互补。
3.实施方案1和2任一项的反义寡核苷酸,其中该连续核苷酸序列与哺乳动物PIAS4靶核酸的前mRNA(例如SEQ ID NO:1)中存在的内含子区至少90%互补,诸如完全互补。
4.依照实施方案1-3任一项的反义寡核苷酸,其中该连续核苷酸序列与选自内含子1(SEQ ID NO:1的143-5277);内含子2(SEQ ID NO:1的5705-16390);内含子3(SEQ IDNO:1的16476-20500);内含子4(SEQ ID NO:1的20543-20864);内含子5(SEQ ID NO:1的20956-21074);内含子6(SEQ ID NO:1的21204-21285);内含子7(SEQ ID NO:1的21390-25454);内含子8(SEQ ID NO:1的25529-25774);内含子9(SEQ ID NO:1的25936-29728)和内含子10(SEQ ID NO:1的29860-29970)的人PIAS4的前mRNA中存在的内含子区至少90%互补,诸如完全互补。
5.依照实施方案1-4任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ IDNO:1的位置25936-29728至少90%互补,诸如完全互补。
6.依照实施方案1-5任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ IDNO:1的位置28478-29043至少90%互补,诸如完全互补。
7.实施方案1-6任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ ID NO:4或SEQ ID NO:13至少90%互补,诸如完全互补。
8.实施方案1-7任一项的反义寡核苷酸,其中该连续核苷酸序列与选自由SEQ IDNO:1的位置28478-28497,28540-28559,28816-28835,28910-28929,29024-29043;28478-28495,28540-28557,28696-28713,28816-28833,28910-28927,29024-29041;28482-28497,28544-28559,28820-28835,28914-28929,29028-29043;28484-28497,28546-28559,28822-28835,28916-28929,29030-29043;28142-28161,28144-28161,28145-28160,28147-28160组成的组的SEQ ID NO:1的靶区至少90%互补,诸如完全互补。
9.依照实施方案1-8任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ IDNO:1的靶核酸的长度为10-22个,诸如14-20个核苷酸的靶序列至少90%互补,诸如完全互补,其中该靶序列跨越该靶核酸重复至少5次或更多次。
10.实施方案1-9任一项的反义寡核苷酸,其中该寡核苷酸能够以-10kcal以下的ΔG°与选自由SEQ ID NO:1,2和3组成的组的靶核酸杂交。
11.实施方案1-10的反义寡核苷酸,其中该靶核酸是RNA。
12.实施方案11的反义寡核苷酸,其中该mRNA是前mRNA或成熟mRNA。
13.实施方案1-12任一项的反义寡核苷酸,其中该连续核苷酸序列包含至少10个连续核苷酸,特别是11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,或29个连续核苷酸或由其组成。
14.实施方案1-13的反义寡核苷酸,其中该连续核苷酸序列包含12至22个核苷酸或由其组成。
15.实施方案1-14任一项的反义寡核苷酸,其中该连续核苷酸序列包含14-20个核苷酸或由其组成。
16.实施方案1-13任一项的反义寡核苷酸,其中该反义寡核苷酸在长度上包含12至35个核苷酸或由其组成。
17.实施方案1-13任一项的反义寡核苷酸,其中该反义寡核苷酸在长度上包含14至25个核苷酸或由其组成。
18.实施方案1-17任一项的反义寡核苷酸,其中该寡核苷酸或连续核苷酸序列是单链的。
19.实施方案1-18任一项的反义寡核苷酸,其中该寡核苷酸既不是siRNA也不是自我互补的。
20.实施方案1-19任一项的反义寡核苷酸,其中该连续核苷酸序列包含选自SEQID NO:9,10,11和12的序列或由其组成。
21.实施方案1-20任一项的反义寡核苷酸,其中该连续核苷酸序列与同其互补的靶核酸相比具有零至三处错配。
22.实施方案21的反义寡核苷酸,其中该连续核苷酸序列与该靶核酸相比具有一处错配。
23.实施方案21的反义寡核苷酸,其中该连续核苷酸序列与该靶核酸相比具有两处错配。
24.实施方案1-23任一项的反义寡核苷酸,其包含一个或多个修饰的核苷。
25.实施方案24的反义寡核苷酸,其中该一个或多个修饰的核苷是高亲和力修饰的核苷。
26.实施方案24或25任一项的反义寡核苷酸,其中该一个或多个修饰的核苷是2’糖修饰的核苷。
27.实施方案26的反义寡核苷酸,其中该一个或多个2’糖修饰的核苷独立选自由2’-O-烷基-RNA,2’-O-甲基-RNA,2’-烷氧基-RNA,2’-O-甲氧基乙基-RNA,2’-氨基-DNA,2’-氟-DNA,阿拉伯糖核酸(ANA),2’-氟-ANA和LNA核苷组成的组。
28.实施方案26或27任一项的反义寡核苷酸,其中该反义寡核苷酸包含3-6个2’糖修饰的核苷。
29.实施方案1-28任一项的反义寡核苷酸,其中该寡核苷酸包含至少一个修饰的核苷间连接。
30.实施方案29的反义寡核苷酸,其中该修饰的核苷间连接是核酸酶抗性的。
31.实施方案29或30任一项的反义寡核苷酸,其中该连续核苷酸序列内至少50%的核苷间连接是硫代磷酸酯核苷间连接。
32.实施方案29-31任一项的反义寡核苷酸,其中该连续核苷酸序列内的所有核苷间连接是硫代磷酸酯核苷间连接。
33.实施方案1-32任一项的反义寡核苷酸,其中该寡核苷酸能够募集RNA酶H。
34.实施方案33的反义寡核苷酸,其中该寡核苷酸是缺口体。
35.实施方案1-34任一项的反义寡核苷酸,其中该反义寡核苷酸或其连续核苷酸序列由式5’-F-G-F’-3’的缺口体组成或包含其,其中F和F’区独立包含1-8个核苷或由其组成,其中1-4个是2’糖修饰的且定义该F和F’区的5’和3’端,且G是能够募集RNA酶H的介于6和16个核苷之间的区域。
36.实施方案35的寡核苷酸,其中该2’糖修饰的核苷独立选自由2’-O-烷基-RNA,2’-O-甲基-RNA,2’-烷氧基-RNA,2’-O-甲氧基乙基-RNA,2’-氨基-DNA,2’-氟-DNA,阿拉伯糖核酸(ANA),2’-氟-ANA和LNA核苷组成的组。
37.实施方案35或36任一项的反义寡核苷酸,其中F和F’区中一个或多个该修饰的核苷是LNA核苷。
38.实施方案37的反义寡核苷酸,其中F和F’区中所有该修饰的核苷是LNA核苷。
39.实施方案38的反义寡核苷酸,其中F和F’区由LNA核苷组成。
40.实施方案45-47任一项的反义寡核苷酸,其中F和F’区中所有该修饰的核苷是氧基-LNA核苷。
41.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷选自β-D-氧基-LNA,α-L-氧基-LNA,β-D-氨基-LNA,α-L-氨基-LNA,β-D-硫-LNA,α-L-硫-LNA,(S)cET,(R)cET,β-D-ENA和α-L-ENA。
42.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷是氧基-LNA。
43.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷是β-D-氧基-LNA。
44.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷是硫-LNA。
45.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷是氨基-LNA。
46.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷是cET。
47.实施方案37-40任一项的反义寡核苷酸,其中该LNA核苷是ENA。
48.实施方案37的反义寡核苷酸,其中F或F’区中至少一个进一步包含至少一个独立选自由2’-O-烷基-RNA,2’-O-甲基-RNA,2’-烷氧基-RNA,2’-O-甲氧基乙基-RNA,2’-氨基-DNA和2’-氟-DNA组成的组的2’糖取代的核苷。
49.实施方案35-48任一项的反义寡核苷酸,其中G区中的RNA酶H募集核苷独立选自DNA,α-L-LNA,C4’烷基化DNA,ANA和2'F-ANA和UNA。
50.实施方案49的反义寡核苷酸,其中G区中的核苷是DNA和/或α-L-LNA核苷。
51.实施方案49或50的反义寡核苷酸,其中G区由至少75%DNA核苷组成。
52.实施方案49-51任一项的反义寡核苷酸,其中G区中的所有核苷是DNA核苷。
53.依照实施方案1-52任一项的反义寡核苷酸,其中该反义寡核苷酸或其连续核苷酸序列选自由GgatgtgtgacggtgtggAC(化合物9_1);ATgtgtgacggtgtgGAC(化合物10_1);GGATgtgtgacggtGT(化合物11_1);GGATgtgtgacGGT(化合物12_1)组成的组;其中大写字母代表LNA核苷,诸如β-D-氧基LNA,小写字母代表DNA核苷,任选地,所有LNA C是5-甲基胞嘧啶,且至少一个,优选所有核苷间连接是硫代磷酸酯核苷间连接。
54.实施方案53的寡核苷酸,其中该寡核苷酸选自CMP ID NO:9_1;10_1;11_1;12_1。
55.一种缀合物,其包含依照实施方案1-54任一项的反义寡核苷酸,和至少一个共价附着至所述反义寡核苷酸的缀合物模块。
56.实施方案55的反义寡核苷酸缀合物,其中该缀合物模块选自碳水化合物,细胞表面受体配体,药物物质,激素,亲脂性物质,聚合物,蛋白质,肽,毒素,维生素,病毒蛋白或其组合。
57.实施方案55或56的反义寡核苷酸缀合物,其中该缀合物模块能够结合无唾液酸糖蛋白受体。
58.实施方案55-57任一项的反义寡核苷酸缀合物,其包含位于该反义寡核苷酸和该缀合物模块之间的接头。
59.实施方案58的反义寡核苷酸缀合物,其中该接头是生理学不稳定接头。
60.实施方案59的反义寡核苷酸缀合物,其中该生理学不稳定接头是核酸酶易感性接头。
61.实施方案56-60的反义寡核苷酸缀合物,其中该寡核苷酸具有式D’-F-G-F’或F-G-F’-D”,其中F,F’和G如实施方案35-52中定义的且D’或D”包含1,2或3个具有硫代磷酸酯核苷间连接的DNA核苷。
62.依照实施方案1-54任一项的反义寡核苷酸或依照实施方案55-61任一项的缀合物的药学可接受盐。
63.一种药学组合物,其包含实施方案1-54任一项的反义寡核苷酸或依照实施方案55-61任一项的缀合物或实施方案62的药学可接受盐和药学可接受稀释剂,载剂,盐和/或佐剂。
64.一种用于制造实施方案1-54任一项的反义寡核苷酸的方法,其包含使核苷酸单元起反应,由此形成该寡核苷酸中包含的共价连接的连续核苷酸单元。
65.实施方案64的方法,其进一步包含使该连续核苷酸序列与非核苷酸缀合模块起反应。
66.一种用于制造实施方案63的组合物的方法,其包含混合该寡核苷酸与药学可接受稀释剂,载剂,盐和/或佐剂。
67.一种用于降低表达哺乳动物PIAS4的靶细胞中的PIAS4表达的体内或体外方法,所述方法包含以有效量将实施方案1-54任一项的反义寡核苷酸或依照实施方案55-61任一项的缀合物或实施方案62的药学盐或实施方案63的药学组合物施用于所述细胞。
68.一种用于治疗,缓解或预防疾病的方法,其包含将治疗或预防有效量的实施方案1-54任一项的反义寡核苷酸或依照实施方案55-61任一项的缀合物或实施方案62的药学盐或实施方案63的药学组合物施用于罹患或易感该疾病的受试者。
69.实施方案1-54任一项的反义寡核苷酸或依照实施方案55-61任一项的缀合物或实施方案62的药学盐或实施方案63的药学组合物,其用作用于在受试者中治疗,缓解或预防疾病的药物。
70.实施方案1-54任一项的反义寡核苷酸的寡核苷酸或依照实施方案55-61任一项的缀合物用于制备用于在受试者中治疗或预防疾病的药物的用途。
71.实施方案67-70任一项的方法,反义寡核苷酸或用途,其中该疾病与PIAS4的体内活性有关。
72.实施方案67-71任一项的方法,反义寡核苷酸或用途,其中该疾病与PIAS4基因的过表达和/或PIAS4蛋白质的异常水平有关。
73.实施方案72的方法,反义寡核苷酸或用途,其中该PIAS4与没有实施方案1-54的反义寡核苷酸或依照实施方案55-61任一项的缀合物或实施方案62的药学盐或实施方案63的药学组合物的表达相比降低至少30%,或至少40%,或至少50%,或至少60%,或至少70%,或至少80%,或至少90%,或至少95%。
74.实施方案67-71任一项的方法,反义寡核苷酸或用途,其中该疾病是癌症,诸如胰腺癌或乳腺癌。
75.实施方案67-71任一项的方法,反义寡核苷酸或用途,其中该疾病是肝纤维化。
76.实施方案75任一项的方法,反义寡核苷酸或用途,其中该肝纤维化与非酒精性脂肪肝病和非酒精性脂肪肝炎(NASH)有关。
77.实施方案67-76任一项的方法,反义寡核苷酸或用途,其中该受试者是哺乳动物。
78.实施方案77的方法,反义寡核苷酸或用途,其中该哺乳动物是人。
实施例
材料和方法
表4:寡核苷酸基序序列的列表(用SEQ ID NO表示),这些的设计,以及基于基序序列设计的具体寡核苷酸化合物(用CMP ID NO表示)
Figure BDA0002509100550000501
*多个数指重复靶向化合物
基序序列代表寡核苷酸中存在的核碱基的连续序列。
设计指缺口体设计,F-G-F’,其中每个数代表连续修饰的核苷,例如2’修饰的核苷的数目(第一个数=5’侧翼),继以DNA核苷的数目(第二个数=缺口区),继以修饰的核苷,例如2’修饰的核苷的数目(第三个数=3’侧翼),任选地之前或之后是DNA和LNA的别的重复区,其并非必然是与靶核酸互补的连续序列的部分。
寡核苷酸化合物代表基序序列的具体设计。大写字母代表β-D-氧基LNA核苷,小写字母代表DNA核苷,所有LNA C是5-甲基胞嘧啶,5-甲基DNA胞嘧啶用“e”表示,且所有核苷间连接是硫代磷酸酯核苷间连接。
寡核苷酸合成
寡核苷酸合成是本领域普遍知道的。下面是可应用的一种方案。本发明的寡核苷酸可以通过就所使用的设备,支持物和浓度而言略有变化的方法来生成。
以1μmol规模在Oligomaker 48上使用亚磷酰胺办法在尿苷通用支持物上合成寡核苷酸。在合成结束时,使用氨水自固体支持物切割寡核苷酸,60℃,5-16小时。通过反相HPLC(RP-HPLC)或通过固相萃取来纯化寡核苷酸并通过UPLC来表征,并进一步通过ESI-MS来确认分子量。
寡核苷酸的延伸:
通过使用0.1M 5’-O-DMT保护的亚氨基酯(amidite)在乙腈中的溶液和乙腈中的DCI(4,5-二氰基咪唑)(0.25M)作为活化剂实施β-氰基乙基-亚磷酰胺(DNA-A(Bz),DNA-G(ibu),DNA-C(Bz),DNA-T,LNA-5-甲基-C(Bz),LNA-A(Bz),LNA-G(dmf),或LNA-T)的偶联。对于最终的循环,可使用具有期望修饰的亚磷酰胺,例如用于附着缀合物基团的C6接头或这样的缀合物基团。通过使用苍耳烷氢化物(0.01M,在乙腈/吡啶9:1中)进行用于引入硫代磷酸酯连接的硫醇化。可以使用THF/吡啶/水7:2:1中的0.02M碘引入磷酸二酯连接。其余试剂是典型地用于寡核苷酸合成的那些。
对于固相合成后缀合,可以在固相合成的最后循环中使用可商购的C6氨基接头亚磷酰胺,并且在脱保护和自固体支持物切割之后分离氨基连接的去保护的寡核苷酸。使用标准合成方法经由官能团的活化引入缀合物。
通过RP-HPLC的纯化:
在Phenomenex Jupiter C18 10μ150x10mm柱上通过制备性RP-HPLC来纯化粗制化合物。以5mL/min的流速使用0.1M乙酸铵pH 8和乙腈作为缓冲液。将收集的级分冻干以给出纯化的化合物,典型地是白色固体。
缩写:
DCI:4,5-二氰基咪唑
DCM:二氯甲烷
DMF:二甲基甲酰胺
DMT:4,4’-二甲氧基三苯甲基
THF:四氢呋喃
Bz:苯甲酰基
Ibu:异丁酰基
RP-HPLC:反相高效液体层析
Tm测定法:
将寡核苷酸和RNA靶(磷酸酯连接的,PO)双链体在500ml无RNA酶水中稀释至3mM并与500ml 2x Tm缓冲液(200mM NaCl,0.2mM EDTA,20mM磷酸钠,pH 7.0)混合。将溶液加热至95℃达3分钟,然后容许于室温退火30分钟。使用PE Templab软件(Perkin Elmer)在配备有Peltier温度编程器PTP6的Lambda 40UV/VIS分光光度计上测量双链体解链温度(Tm)。温度自20℃上升至95℃,然后下降至25℃,记录260nm处的吸收。使用解链和退火二者的一阶导数和局部极大值来评估双链体Tm
实施例1–测试体外功效和效力
在HeLa细胞中在体外实验中测试靶向PIAS4上的一个区域的寡核苷酸以及靶向至少三个独立区域的寡核苷酸。对寡核苷酸评估EC50(效力)和最大kd(功效)。
细胞系
自欧洲认证细胞培养物保藏中心(ECACC)购买HeLa细胞系并如供应商推荐的那样在增湿温箱中于37℃和5%CO2维持。为了测定法,如供应商推荐的那样在具有10%胎牛血清(FBS)的Eagle氏极限必需培养基(Sigma,M4655)中在96多孔板中接种2,500个细胞/孔。
寡核苷酸效力和功效
在添加寡核苷酸之前将细胞温育24小时。在PBS中溶解寡核苷酸并以0.01,0.031,0.1,0.31,1,3.21,10,和32.1μM的寡核苷酸终浓度添加至细胞,最终的培养物体积是100μl/孔。添加寡核苷酸化合物后3天收获细胞并使用PureLink Pro 96RNA纯化试剂盒(ThermoFisher Scientific)依照制造商的说明书提取总RNA。在多路反应中使用来自ThermoFisher Scientific的FAM标记的TaqMan测定法量化靶转录物水平,使用VIC标记的GAPDH对照探针,设置为技术上一式两份,生物学上一式三份。TaqMan引物测定法用于感兴趣PIAS4(Hs01071948_m1)和持家基因GAPDH(4326317E
Figure BDA0002509100550000521
/MGB探针)的靶转录物。在表5中作为对照样品的%显示寡核苷酸的EC50和功效。
在GraphPad Prism6中实施EC50计算。在表5中作为对照的%显示最大PIAS4敲低水平。
表5:EC50和相对于对照的最大敲低(最大Kd)%
CMP ID NO EC50 Std 最大kd std SEQ ID NO:1上的开始位置
5_1 3.65 153.56 88.24 112.17 28142
6_1 N/A 418.10 0.00 233.33 28144
7_1 57.17 333.44 0.00 215.67 28145
8_1 2.44 1.07 66.99 4.55 28147
9_1 1.83 0.90 97.69 1.29 28478,28540,28816,28910,29024
10_1 2.00 0.63 18.65 7.52 28478,28540,28696,28816,28910,29024
11_1 0.74 0.03 2.40 1.03 28482,28544,28820,28914,29028
12_1 1.10 0.15 7.06 3.60 28484,28546,28822,28916,29030
序列表
<110> 哥本哈根罗氏创新中心(Roche Innovation Center Copenhagen A/S)
<120> 用于调控PIAS4表达的寡核苷酸
<130> P34400-WO
<160> 13
<170> PatentIn version 3.5
<210> 1
<211> 31741
<212> DNA
<213> 人(homo sapiens)
<400> 1
ggaggagcgc gcgcgggtgc taattggccc gggcggcggc cccgcccgcg agtggtgagc 60
ggtcacgtga cgcgacggct gggggctccc ggcgcggggg acgctggtga ccaagatggc 120
ggcggagctg gtggaggcca aagtgagtga gcggtggcgg cgccggccgg ggcaagtggg 180
cgagagggcg ggggccgggc cgcaggtcga ggtctgcgcc ttctgtccgg ggccccacag 240
cgcggccggc ccgcggctcg ccgtcccggc ccccagaccc cgacccccgg tctcagggtg 300
agggcggggg gcggggaggc cgggggcggg gccctcctgc ctcacccagg tcttcgcgcc 360
gggggtcgct cccccggctt caggcagggt ccccccaccc agcccgagcc cttagggtcc 420
cggtccctga gcgccaggcc agggccgcgc ctcccggttg aggcaccgtc ccgccgggat 480
gcgggacgtg ttgagctact cgttgccctc ttggttccga gccggggtcc ttgctttttg 540
gctggtgtgt tggggggagt gtctgcgcct ccccgcccac agggctccca ggactgctat 600
ctgggtctcg tccccgccca acaggccagg ctggggtttg cgagtctcct gctcggaagg 660
gtcccccgag tcctggatag tgtcctgcca ccgtccaggt ggaggagtca gggccctgag 720
accaccccca agacacggca cgtcctcttg gggtctggag ttcaggctcg gtcttgagcc 780
cctcttcagc tcctgcattg gtcccagaac cccgccccct tcccgacacc gtctctcaca 840
cgccggagtg ggcgcttggg ggaaggctgg gccctccctt tccctcccca taggatggag 900
ttcggaccac tcttcttggt cacagacctt ctttattctc ctttttttaa tcttaaatcc 960
tggactgtgc tttggtccta cctcgttcct ctcgggacag aatctgaggc tactgattct 1020
gcttcagggg gctctaaacc tcacctgtgc agcatcagat actgtcctca aaccttggct 1080
gcttctccta ttttctgctc ttgagcgagt ctacttctta ggtcagacac ccaccctccc 1140
cctacacagc ccccagaact tttatgcacc ccaactttgg tttctaaggt cccctctctt 1200
tctgcctatt ctcttttgtt gatctctgga gggtccccac tgggtccaag gctggcctct 1260
ttagaacaac tgttgctgct gctctattat actttgggtc ctgtccaggt cccatgtccc 1320
atagatacca tctcctagct tggaaccact tttaatcatc ctgggattga gctcagagta 1380
tccccattcc aggggatgta ccttcttgta ggtgcctacc tagagctgag ggtctaaaac 1440
ccttagaagt gcccgcaagg ccacggcttc cggggaggtt aggggacctc tccctccccc 1500
atcccctttc acatcttccc tccccacggt cctgacctgt acgtatcttc ttctcggtcc 1560
tctcacatta ccccctggga tctgaaaaca cagcactcag ggctctgtga ttatagcata 1620
tacctctctt cgcctcccaa ccctacaccc ctgcgcacac ttctgctcct ctctagagtt 1680
ttgaaaagtg gagactcgcc ctggagatgt ggaggcctga actctgtaaa cccaaagtgg 1740
caggctctgg gcttgaagtg tcctggagtc ctgaaatgta acctcccgtt tcggggcttg 1800
gagctgtgac cctggacccc aacccccacc ctggctgagg gcagggtctg cactcttttg 1860
taccatccag gccttgaaat atgatctgat gaactttcct taaccctctg gtggctgggc 1920
ccccccccac cccaattaaa tcaagttgac ccttctttca ggttctctaa accgtgagcc 1980
tccattcaag ggggcctgga ccctggggaa ccttctttct ccttgagtct gttgctacct 2040
ctccaagtac cttaaatgtc attgaaacat ccccttcttt acaggggcct tccccagcct 2100
gtcatattca tggctgcaga ttctgtcttt tggggtgcat cacagactgc tcggaggggc 2160
gaatgttggg ggtttgttgg tgaactttga aatctgagac tctcagcttg aggcctgcag 2220
gcgggtttgg ggcaggggtg tctgtgagct ccctgaaata gtccacagcg tttcgcacag 2280
atctccgctt tcctggagag aggcgccttc ctgagctacc cccggtgctc tgaggggcct 2340
atgctggagg aaaggttcag cgcagctgct gtgtctcggc tgatgtctcc ccatgcgact 2400
tccaggcaag cctggagttg aaactctgga agctgccggg gcctggcact gtttataaac 2460
acagctctga cggcaagcag gtcagcttga agccagggca ggaagtgatc ttggggcatt 2520
tggggcttct tcctgaatgc ttgtcccccc cgcactccct ccagtgtcaa gggcaggctc 2580
ctccgaggtg gcagctgctg ggaaatctga gtcgtgaaca tatggccacc taaggggtgt 2640
gctccgggaa gcgggagctg cggctccact gtccagcctg ggtggggcag gggctcccgg 2700
ggtgcgagga tgtcagcagg ttccccagcc cacctgcctt cggccagtct gccagtgtga 2760
agtgtccaca tgacatcgtc tctccctgct aaggctttgg gccacttcca gaagaaacat 2820
cttgtctgca agcctttttg ttttctgcac aaggtaggaa gtcaggccaa gggagatgag 2880
gcatttttgt tttcaaagca tccctgactc tcaggcccag cagaccatgc aggtccccat 2940
agccagtgtg ctggtgagtg agggtccccc gggcagcaga cgggaacacc cttgggaggc 3000
cagaggccga ggggccgatg ccagtcccac gcatgtacta gggaggctct gggccagcct 3060
cttccctctg tgagcctcgg tttcctcacc tacacgatgg gtgtcctcat tgtgaaatta 3120
gcgacacagg ccttgctggt gcctggtagg gagcaagacg ctggcatccc gattctttac 3180
agtcacgggg ccccgcagcc ctgatatggg aagaggcttc tcccgaggct ctttgggcag 3240
ggctgggccg cctgcacgtg tgtccctgtc attttgagcc tggacagcct ctccgtctcc 3300
aacaggaccc tggcccgata cagctggaag aaatcagagc tgacagatga ggacccgaca 3360
gtgggccccg gctgctgcag ctttggtgct gaaatgtgcg gctaggctcc tggtctcacc 3420
ctggggcagc caggagccgg aaacctcagc gcctcctggc acggaggctg cagtttacat 3480
accccactgg gactgcctct ggcttcgacc ctcagggtct ttcgagtgga gtttgaatgg 3540
tttattggtt tcttcgggta cccgccagct ttccttaaca cccttgacgc ttgagctttc 3600
tccccattcc tcctggaagc tactgtttcc caccacatct cattcatccc aggccagctt 3660
cagggctaag ggtgggtggc cctgaaaccc tgccagccca tccctcgagg acacctggct 3720
tctgcagcct gttgaggagc cttccttccc cttcagggtc ctacccctca tggaggtcag 3780
gccactgcca gtctacccca cctcaaacac cagggtcagc tgggctctgc tgtttggttt 3840
ttatttcgct ggagaggccc ggccaggcga tgagggccag gtcctgccaa gcctcatttg 3900
tcgctttgac ccaggtcctg caacagcccc tgtggctgct atcttcccct tggaccggtc 3960
ccccagggac tcagggcaac gtgtggaggt gtgtttggtg tggaggtgtg tttggtgtgg 4020
aggtgtgggg ggtgtggagg tgtgtggggt gtggaggtgt gtggggtgtg gaggtgtgtg 4080
gggtgtggag gtgtgtgggg tgtggaggtg tgtggggtgt ggaggtgtgt ggggtgtgga 4140
ggtgtgtggg gtgtggaggt gtgtggggtg tggaggtgtg tggggtgtgg aggtgtgtgg 4200
ggtgtggagg tgtgtttggt gtggagctgt ggggtgtgga ggtgtggggg gtgtggaggt 4260
gtgtggggtg tggaggtgtg tggggtgtgg aggtgtgtgg ggtgtggagg tgtgtggggt 4320
gtggaggtgt gtggggtgtg gaggtgtgtg gggtgtggag gtgtgtgggg tgtggaggtg 4380
tgtggggtgt ggaggtgtgt ggggtgtgga ggtgtgtggg gtgtggaggt gtgtttggtt 4440
gtcgtgagct gtgggtattt agcaccacac agagcccagg atggccccag tgtccacagg 4500
gccaaggagg agaaaccctg cctgggatga tcagcagatg tttcggaggc ccccacaggc 4560
ccagccctgt gttgacatcc agagggtagt gtggcagcaa gaaccgcccc tggcttcaga 4620
gccaggcctg ggttcgaatc ttggcgctgc cacctctgag ccgacagttc ctcatttgtg 4680
acagagctca cacaccagcc tagcaggggt gttttaagga tcagagttaa atatataatc 4740
acatgaccgg cttggttccc ggcaggtgat tagtactaag taaactgtgg ctaccgttgg 4800
cgagaccgaa gggaaaacat atctgtggct gacatgggtt gagcgcccgc ccagccagtg 4860
ctttatgtca ttatcctccc gacgtagaga ctgagggtca gagaggcatt tggtgtttgc 4920
cggtaaggca ctggcagagg ctgtttacaa gtaaagcaca attgtcagtt cctgccctgg 4980
ggatgctttc aggctgaaga cagggaaaga gaacctaaaa tagaaggggg ggcctagtca 5040
gaggcgcttt tgctgcgttg gcgatgctgg ggaaagtttg atgaggagga gggagggggc 5100
agggctttgc tgggaggggg caccgtaggg gcagggcact ccaccagccc cagccaaggc 5160
tggcgcttcc tggcgagtgg gtgtctttca cggcccccac atcggggcct ggcctccatg 5220
gagtcccctg cctcgcagct gtgtcctctg agtgtgtgtg tgcttgctcc tcctcagaac 5280
atggtgatga gttttcgagt ctccgacctt cagatgctcc tgggtttcgt gggccggagt 5340
aagagtggac tgaagcacga gctcgtcacc agggccctcc agctggtgca gtttgactgt 5400
agccctgagc tgttcaagaa gatcaaggag ctgtacgaga cccgctacgc caagaagaac 5460
tcggagcctg ccccacagcc gcaccggccc ctggaccccc tgaccatgca ctccacctac 5520
gaccgggccg gcgctgtgcc caggactccg ctggcaggcc ccaatattga ctaccccgtg 5580
ctctacggaa agtacttaaa cggactggga cggttgcccg ccaagaccct caagccagaa 5640
gtccgcctgg tgaagctgcc gttctttaat atgctggatg agctgctgaa gcccaccgaa 5700
ttaggtgagt ggtcaccctg gggaggctgc gactggaggc ttcacctagg ccccgtcgcc 5760
cagcccagcc cagccacaca gccgacttcg agtgatgttc tctgtggcgc agccagggcg 5820
gggagccaca gtggccaggg gtgtccttcc tcggaagcaa agggaccatc tttgatattg 5880
gtcacccctt gctgtgttac aagttacccc gaaatggagc cactggaagc agggggcgtc 5940
tgttagctct caggaacctg tgagctgtgt tgcggggcat tggggcttgg gggctctcat 6000
gaggctcagt caggctggag ccacctcatc tggaggctcg accagggctg gagcaggcac 6060
atccttgtgt ggtggctggc aggcctcagc tcctcgccag ctcttggcca cagtccccag 6120
gtcctcatgg tgcggactcc tgcacggatt gcctgggcgt cctcagcctg gtggctccct 6180
caccctaggg tagcgagtgt gcacctccaa gctgggagct ggagcccttt ttataaccca 6240
acctcggaca cgcctcgcca tctcccccac agagtccgtt gctcacacag actctgtggc 6300
gcatgcaggg accacaccag gctgtgactg ccagggccag gggtgaccag ggccacctgg 6360
gagcctggtt tccctgctta ttccccttgg aaagggggct ggccagtggc atccttcccc 6420
cgggctctgg ttcctcgctg gcagcctgca ggagtgtcct tggtcagtgg gctcaggtca 6480
ctgccaggct gtgtgcaccg ggcgtgctgg gggttcaggg cgatcccagg cggaggagag 6540
gtgctgggct ccacgcttct ctctctcgtg tctttgtctg caagcactga ctgagcagga 6600
actgtgtgtc aggacctcat agcccacagc agtgtggaca ggcccctggt gcctccccag 6660
cagccgtggc cattcaggct gcaggtgggc attgagccca gtctctgcct cagccatagc 6720
cctgagctca gggccaggga ggcctccgca gccccagccc ccagggcaga gagagtgtgc 6780
agcctctggg actcccagat agggagcgga acgtcctggg cctttgcgga cctgtgcctt 6840
gaggcgctca gatttcacca agtcctctgt gtgcctggag gtctctccgt ctcttcttcc 6900
tgcctcccct cccctgcccc cactctttcc ttcgcacagt aaacatcgga gcgcctgctg 6960
ggtgggtgcg tgatgggcac caggcgtggg cacgcagcag ggaacaggac caaggccacg 7020
aggttcagaa ccctgtgcat gccccctccc accctgctga cccagcaacc tgcctggccc 7080
ctgctgtggc ctgagggccc ttctctggca cgcttcagtc cattgggtgc cagctggccc 7140
ccgctcccct gcccagggag gcagcgttga tgggggtagg gggaagggga actggctgct 7200
tttcccctcc catctgcagc cctgggactt agtgaggtta ggctggaggg gctgtgcttc 7260
caggtgagga tggaggaagt ggaggaggga ggaaggtgct gtcggtggtt cctgcggcag 7320
ccgaggctcc tccctccagc ctgaggctcc gccttccaag tgaggctccg cctccacctt 7380
ttttctcttg caggaggtgt ctagcagcag cctcctgggg agcaggttgg cccagtggca 7440
cctgtcctgg gggactcagg gtcttggcct gagttccatc ggactgactt tcccagcctt 7500
tgctctctca tgagggaagc tgttccccct gccaggttct tgggcagagc tggctgtctc 7560
tgaaggttgg gccttgggaa ggacctgcat cacagggagg ctgggctttc ctgggagcgg 7620
cagggcaggc ttggtccagg gcgggggacg gggctgacca gcttccttcc tgcacgggga 7680
ccagtagctc cgtcccacaa tacatcgctg tgccctgagc caccagggac cccggtcacc 7740
tgatctccgg gagagcctgc tcccctgtct acaccagtgt gcctgtgctg gcggctcaga 7800
acaaagaggc catccccacc ctgcctctct ctcccactgg ctctctctcc atctcaggcc 7860
gccaggtgaa cctcctttcc tggattccgt gctcttgggg gactccctgg gggccacctc 7920
ggtcctcaga agtttcctgg agcatagccc ctggccccga agcagtggtc cccatggttt 7980
taggacctga gatgccatct gtccgccctg accctgggct gtgtccctcc ccagggtgca 8040
ctctgtggtg ctggccttgc ccgggggccg cctccggagg acccagttcc accggcttct 8100
ccctcactcc ctcctctggc tgtgacccac cgtccagcgt gaggcccacc gctctggtct 8160
gtttccccgg aatagccgcc ggccggctcc aggatggaga ccgcgccagg cggacaggag 8220
ccataaatca cgcggtgcgg aatgctgggc tgggggaggg ggtgacagag ccacagagca 8280
ggctgcaggg gcctcaggct gtaggtgatc ggctccagtg ggaggtgccg tgtgtgggga 8340
cggggctggc acccagaaca gtgcggagaa cggcccaagg tcgcacagcg gcctgccttc 8400
cctcctcccg agccgactgg ctcctgctcc tgagcagagg ctctggcctg gacctctgca 8460
ggctgggaac cctgtcctgc ctgtcggcaa ggaagccggc gccacccctt tccagcctgc 8520
gccacctggg gagtccggct agggagcctg accctcctgt cagggtactt gggaagagag 8580
gctgtcagga aatgtggggc agaaggaagg atacatgctg gccgggcaca gagctgctcc 8640
tccagggtct tggcccgcag cgggcacccc gaggaatctg cctgcccacc cgcctgctgt 8700
gcagagtgga gcccctgtca ccacgactcc agatgccccc agaggcagat agccctggta 8760
ccagccaaga gccgccggtc tggcatgtgc tgtgctgtgt gtaggcacct gtgcccttca 8820
gcctctgaag cccttgggcc agcattgccc aggccacagc aaggtagcgt ggtccctgct 8880
caggtgcagc acagaagtgc caggtgataa gtctcatggc acacggaggg ctttcagggg 8940
cagctgtcag tagcaggagc catttactct acatttgtga ggaggtagca gtcaggaagg 9000
cctcctggag gcagcagcgt ttcagtccag acccgagggt gactctcaag aagccaggca 9060
gagaggaggg ggcaggggag cgtattccag gcagagggca gtgagggcag aggccgatgg 9120
ccagagaggg ctcattcatg gggctgaatg gagttcattg tggccagaac atggtgcgcc 9180
caggaggagg gacgcagtag cctgggcgcg ggcggcagag gctggaaccc gagaatggtg 9240
ggcccgggga aggctggggg ctaccctgct tgccccgagg gcttcagcgc ccctgaggtt 9300
ctggtatgat ttttggggtc agtgaggaaa ctgaagtgca ggaggcaagt ggccgtctgc 9360
cttccacagc caggcctgct gcccgcccag gcccaccatc tgtccgtctg cacactgggg 9420
gcctggatgg gcacggagcg tcctgtgtca ctgtcccaca tgtggggtag tctgacccac 9480
tcagcccgct ggcacttccc atacctgtgg ttggggaaca gggggactcc gccagctctg 9540
ccccaggtct tggccttcag gttgaagagg agggatgggc ccactgctac cagatggggg 9600
gctgccagca gccaccccca tgtcccgcta gtccttctcc catcccctgt ggccccctgc 9660
cctgcccagc ccagctcccc aacctgcccg ctggctgcag cctcctgctc tgcttcctgc 9720
ccactggtcc ccctcccatg gcagcctgtg aatgttttca ctgatgggta gagtggtcgg 9780
catcacccct gtgcctagcc aggggcacct gttccccgcc cctccaggac agtgccccct 9840
gtgtccctca tacctgactg tgctgcctct actcttgatc tgggggacct gggttgggga 9900
atcagtgctg gtagctctta gctggacagg gtgggtccgg gagttagaga acttgtatgt 9960
gccggggagg ggacagcctg gggagggggc cagcacatgg gccagctgga gggggaatgg 10020
tcccatccga tcagcttttt tttttttttt ttttgagatg gagtctgact gtcgcccgtg 10080
ctggagtgca gtggcgcgat cttggcttac tacagcctcc tggcttcaag cgattctcct 10140
gcctcagcct cccaagtaac tgagattaca ggcacgcacc accacaccca gctaatttta 10200
tgtactttta gtagagacga ggtttcacca tcttgaccag gctagtcttg aactcctgac 10260
ttcaggtgat ccacctacct tggcctccca aagtgctggg gttacaggcg tgagccactg 10320
cgcccagtct cattttttgt atttttaatg gagacggggt ttcgtcatgt tgaccaggct 10380
tgtcttgaat tcctaacctc aagtgatcca cctgcctcgg cctcccaaag tgctgggatt 10440
ataggcgtga gccaccaggc ccggccccag tcagcctttt aaaaactccc tgtgtttcat 10500
ttctatttaa acttgtacaa ttatgcgctt gtcctagaaa actggagtca acagcagagc 10560
agtccggccg gcgccctgct gcccgagtgg gccgcctcgg tacaccgggc cggtgcttgc 10620
cgccttctcc ctttgcatgt gtgattgtag gaatgtgtgg ctgtgtcctg gctgctattt 10680
tataaccacc ccccatactg tgagcatctg ctcacagcgt taaatattca tcgtcagcag 10740
catctcgtga ggctccctgg cagccttggg tggagccaac ggctgggccc ttcttgttgg 10800
gctctcggat cgggcccagg ggctgctttt cgtgcccggg ccggagggcc tggctgagca 10860
cctcacccca gaaccggctc tgcctggcag ggcccccgtg gtcacctgat cttgcacctg 10920
gccccaaagg tgcatctggt tcagtggtgc ccttgccttg gtcccgtggc cttggatgct 10980
gggcagccca cgaaaccatc tcccccttgg ggaacttcat gcttcagtgg cccaacaaga 11040
aggagcagca gagtgatgta gggaaactga gtcgctcctt aggaggagaa ggtttggaga 11100
aaagtgaggt ggcggggggt gcggttttta aatggggtgc tcagcgaagg ctttccttct 11160
ggtgacattt gtacaaagac aaatataggg ccatgaggct ggtcggggga ggaaggttcc 11220
agaagaggga atggcaggtg cggaggccct gatgcagcat ggctggtggg gcccaagcag 11280
gaggccaggg tggtggccgt gtgtgcgccg gggtgtgtgt ggccctgagc aggggtactg 11340
agggtcaggg gtctcctgcg gagccatccc agggggcggg ctctggctgc tgagaccggc 11400
agagctgggg gcagtcgtct gcaccgggcg ggatttgaaa acagagctga caggactggc 11460
tgagggagtg gatgtttgca ggacagcaga gacgggggct tcatggatgc cacctgggtt 11520
tctggcccca aacagctgac cccgagggca gaagggcagg tttgagggag accccacagc 11580
cccttcccca gcataggggg gccgggtgtt tggggggaac cgtcagcggc ccggggccag 11640
tggcacagca gtgagagcac agggcacctc ccaggccccc agcagagaag cacagcccgg 11700
tctcccccag agggaggagc cctcccaggg cagggacccc agagtcttgt tcttcaatga 11760
ctgggccctg tctgccccag gcatgggctg gcaacaatcc ctggccagct gggtggctcc 11820
cttgctgcct gctggggacc cacccttctc ccctacctcc ttctgagaca ctgaggggtg 11880
gggtgtctgt gttttcacct ccgacccagc ctggaagctc aaggcccagc tcaggtgtag 11940
gctcccgtgc agcctccctg cccctgaacc attgctcccc tggcactcag ggcagacctg 12000
ggcgcgtctg caggtggcct gtgtgccccc ctcccaatta ggcggccttc ctcaagggcc 12060
cagccgggac tccacagccc atcacctctg cagagactgg ctgtgccctg agcatataaa 12120
cgggaaccgg ctgtggcagc cccctcttcc tgagggccag ccacagaccc ggcaccggtc 12180
cccgaagaaa caggtcaaca tgggcgggac gtgcaggctg aggccacaga ggccctggca 12240
gggctgggag ccgagcccag ggagtctggc ttttttcttt tttttttttt tgaaatggag 12300
tctcgctgtc gcccgggctg gagtgcagcg gcaggatctc agctcactgc aagctccgcc 12360
tcccaggttc acgccattct cctgcctcag cctcccgagt agctgggacc acaggcgcct 12420
gccaccacgc ccggctaatt ttttgtattt ttagtagaga cggggtttca ccatgttagc 12480
caggatggtc tctatctcct gacctcatga tccgactgcc tcggcctccc aaagtgctgg 12540
gattacaggc gtgagccact gcacccggct tctcgtgggt tttaattgag aaagttccaa 12600
gacagtgctg gtagttgagg tgcgatccca tggctccggt tcttgtaaag gccctgtcgt 12660
gggtgcaggc cacaccactg tgtgcactgc cgtcctggga gcacctggga gcacagacat 12720
agcctgcgaa gctgatgagc tccagccttt accaggggca gttcgccatc cctgttctaa 12780
agggcttgcc tgtcatctcg ttgtctcgtc tcccggccac tgcaaggctg ccattgtggc 12840
cagattctcg ctcccccacg ctcttccgat attttttaca cttataaaca aataggtgtt 12900
tactcagatg ccttctctcc attttcatta cacaagtgat agcaggacgt gcacgctgct 12960
cagcgttttt gctttgtatc taaatatatt ttttaatgta gacacagtct tgctatgttg 13020
cccaggctgg tctcgaactt ctgagcccaa gcagtcctct cacctcagcc tcctgagtag 13080
cgggaatgac agctgcacac cagcacacct ggctcaggct tatttaaaaa ctttttttag 13140
agacaaggtc tcactgtgtt gcctgggctg ggctccaact cctgtgctac agcgatcctc 13200
ccaccttggc ctcctgaagg gttggggtta caggcatgag ccgctgtgcc cagcctgcaa 13260
gtttctttga acgcatgttt ccatgtattg agggaaaata ctttggagtg ggattcctga 13320
ttcctgggtg atagggtagg tctgtgctta cctttataag ggtagtttcc cagagtgatg 13380
gtactgtctt ataaccccac cagcagagag ttctgattgc tctacacctt tgccatctct 13440
tagagttgcc agtcctttca ttttagccat gctagtgggt gtgtagagag gtattttatt 13500
ttattttacc tcattttata ttattgatac agagcctcac tctgtcaccc aggctggagt 13560
gcagttacac aatctcggct cactgcaacc tccgccttct gggtttaagc gattctcctc 13620
agcctcccga gtagctggga ttagaggcgt gtgtcaccat gcctggctaa tttttgtatt 13680
tttagtagag atggggttac catattgtcc aggctggtct tgaactcctg acctcaagtg 13740
atccacctgc ctcgcctcca cagtgctggg attccaggca tgagccaccg cacctggcct 13800
gggtgtgtag agaggattta aaccggtctt ggatttctac acaaatcgca ggggcctgaa 13860
atactggctg atattttgtg gaggatttta catctgtgtt catgaggggt attcatcggg 13920
aattttcctt ccttgatgct gagttgtgag gttttggtat cagagttatg ctggccttgt 13980
aaaataagaa gtatgctttc cttctctgtt ttttgaaaga gtttatgtac ggtttatgtg 14040
gtttctttcc aaaatgtttt atagaattca ccgatatgga cctgcatttt ctttttcttt 14100
tttttttttt ttttttttga gatggggtct gattctgttg cccaggctgg agtgcagtgg 14160
tacgatcatg gctcactgca gcctccactt cctgggttca agcaatcctc ctgcctcagc 14220
ctccaaagta gctgggacta caggtggtgt gcacctccac acctggctaa tttaaaaatt 14280
ttttgtagag acaaggtctc actttgttgc ccaggctggc ctcaaactcc tgggctcaag 14340
caatccaccc acctcagccc ccaaagtgct gggattacag gcatgagcca ccatgcccaa 14400
tctggacctg cagttttcag aaaaggtttt aattatggat ccaacttcct taacaggtaa 14460
agagcttttc aaacttcctg tatcttttgg tacccgtttt ggtaatttgc atctttggga 14520
ggatttgtcc atgtcactaa gttgtcagat tcattggcat aaagtttcac cttttattcc 14580
cctattgaac cgaaaagctg tagggtctgt actattgttc tttcatttct gatattggta 14640
gtttgtgttc tcactgtctt tttgttgttc agctagagtt ttgttttttt tgttgttgtt 14700
gttgtttttg gtggtttttt ttgagacaga gtctcgctct gtagcccagg ctggagtgca 14760
gtggcacgat cttggctcac tgcaagcttc gcctccctgc aagctccgcc tcccaggttc 14820
gcgccattct cctgcctcag cctccctagt agctgggact gcaggcgcct gccactacac 14880
ccagctaatt ttttgtattt ttagtagaga tggggtttca ccgtgttagc caggatggtc 14940
tcgatctcct gacctcgtga tccacccccc tcggcctccc aaaatgctgg gattacaggc 15000
gtgagccacc gcgcctggcc gtttgttttt gtttttgttt ttttgggttt ttttggaaac 15060
agtctcactc tgtcgcccag gcagtggtgt gatctccact cactgcaacc tttgcctctc 15120
agcttcagac aattctcctg cctcagcctc ccaagtagct gggattacag gcgcccgaac 15180
caggcctggc tatttttttt ttttttgaga caccacaccc tgctgttttt ttaagagatg 15240
cggcagccag gcgccgtagc tcatgcctgt aattccagca cattgggagg ccgaggtggg 15300
cagatcacct gaggtcggga gttcgagagc agcctggcca acatggagaa accctacctc 15360
tactaaaaat agaaaattag ccgggcgtgg tggctcatgc ctgtaatccc agctgttttg 15420
ggaggctgag gcaggaggat cacttgaacc caggaggtgg aggttgcagt gagctgagat 15480
tgtgctattg cagtccagcc tgggcaacaa gagtgaaaca aagtctcaaa aaaaaaaaaa 15540
aaaatggggc tggctgggca cagtggctca cgcctgtaat cccagcattt tgagagtttg 15600
agatgggcgg atcacctgag gtcacgagtt cgaaaccagc ctggccaaca tggcgaaatc 15660
ccatctctac taaaaataca aaaattagcc aggcttggtg gctattcggg aggttgaggc 15720
aggagaatcg cttaaacccg ggagacggag gttgcagtca gccgagatcg tgccattgca 15780
ctccagcctg ggcgacaggg taaaactcca tctccaaaac aaaacaaaac aaaacaaaac 15840
aaacaaaaac caatgttttc tgactgcgcc tctgcctgtc agtccagttg taagtaagag 15900
ggtagggccc aggcttgtga gcaccatggc cttcatcccg tcagtacccc ccgcaccacc 15960
tctgtccggg tgacgtggcc accctgcagg caggaggaga gcaagggccg ggtccggttt 16020
gtgctcagga gagaggaggt atggcagtgt cctgctggcc tggctgggtc cagctctccc 16080
cgccaggcag ctcggcactt ttcggtttcc taagtagacg cctgcatccc acaggctgcg 16140
aaggtcaccc agcaatctga gtggccgtca acaggacaca ggccatggtg agcggccccg 16200
agaaggggat gggcgggagt cctccctcat cctccttcct gggcggcccc cacctctgcc 16260
ccacatatct gtccagccaa cttcccattt cctgtttcct ggtctgaaga ggcgcaggct 16320
gggaaaagcg actgggctcg ggggacctgc cagggaccag acatgcccct gaccccgtgt 16380
ttgtcttcag tcccacagaa caacgagaag cttcaggaga gcccgtgcat cttcgcattg 16440
acgccaagac aggtggagtt gatccggaac tccaggtgtg cggcacctcc cccagcccag 16500
caccccaccg cccgcccacc cactttctcc tgggctcact ggggagagcc ggcagccacg 16560
tccactgcag gcctcgctcg ggctcagtcc agaaccgtgc tgcaaggcag tggccgggtt 16620
tgcttccttc cagaaaaccc catcctgggt ctcaggtgct ggcctgtgtg cccactgcct 16680
gtgccctgca gcctgctaga gagaggcgga ctgactgtgc ccttttaaca cggtcttgcc 16740
ctcctgggcc catcctgggc attgcaggga gcggaggagc attcctcgcc tccacccacg 16800
ccatgacaag aacacacccc tgttgtgaca accacagatg tccccagaca ttgtccagtg 16860
tcccctaggg caggataacc cgggcgagac ctccctgggt taggggattc cacgtatccc 16920
caagagactc tgtgtcccat gatcctctgc cctgctgagg tcccagaagg ctgcatacat 16980
tgaaatccac accctgaatt ggagggggag aaagtaggtg aatcccagga gctgggggtc 17040
cccggtttac accgcccgcc ttaggaattt attctggtgt ccagcatgag caggaagtta 17100
agtcaggtgt ttttttgttt tttttttttg agactgagtg tagctcttgt tatccaggct 17160
tccaggctgg agtgcagtgg cgcgattttg gcttcctgca acctccacct gctggattca 17220
agcaattctc ctgcctcagc ctcccaagta gctgggatta caggcgctca ctaccacgcc 17280
cggctaatct tgtattttta gtagagatag ggttttgcca tgttgatcag gctggtctcg 17340
aattcctgac tcaggtgatt cacccacctc agcctcccag aatgctggga ttacaggcgt 17400
gagccactgc gcctggcgga agtcaggttt tttcccagtt atataatgaa tacggggttt 17460
ccccctccat accgtggata gtgaggtggg atggttccct cggtggggcc gtcctgggca 17520
ctgcaggctg ctgagcagca tccctggcct ccacctgctc tgtgccagga acacccctaa 17580
ctctgacaac cacagatgtc cccagacaca gctcggtgtc gcctggggca gggtcgtcct 17640
cagatgagga cggttgaact gtggcaggtg aggggccagt gtggctgccc tgcgctctgc 17700
tcctccctca gtctctccga ggctgtactg cctccagctg agacagattc ctgctgggca 17760
ggctaatggt aggtgctggg cccttaggac aggggaggcc atttgcccag gtcacccctg 17820
agtccatggc agggctgggc cgggcgcccc catttaatgc ctagcttctc gtgcccagcc 17880
gcttcagacc caccgccccc acctgctgtg gggccaggtt cctggggcct cccagcctgg 17940
ccctcacacc tagtaagggt tcagatccag ccgagccagg cttggccatg gaggcctctc 18000
tgcctgggtg acccaaggtg gcgacctcgt ctttctcagc ctcgtcttcc ttgtctatgt 18060
acctgggtca gcacagcctc cacctgcact gggtccctgc tgcagagtgc tcagagccag 18120
ccacacagta taaaaaaatc agtttgggct gggcacggtg gctcacaact gtaatcgcag 18180
ccctttggga ggccaaggca ggtggatcac gaggtcagaa gatcgagacc atcttggcta 18240
acacagtgaa accccgtctc taccaaacat acaaaaaaat tagccgggtg tggtgacggg 18300
cgcctgtagt cccagctact cgggaggctg aggcaggaga atggcgtgaa cccgggaggc 18360
ggagcttgca gtgagccgag atcctgccac tgcactccag cctgggcaac aaagggagac 18420
tccgtctcaa aaaaaaaaaa aaaaaaaagt ttggttttct cctcagaaag cttctggaca 18480
tttctttttc tttttctttt ttttttttga aatgaagtcg ctctgtcgcc aggctggagt 18540
gcagtggcgt gatgtcggct cactgcaact tctgcctccc aggttcaagc gattctcctg 18600
actcagcctc ccgagtagct gggactacag gtgcgcacca ccacgcctgg ctaatttttg 18660
tatttttagt agagacaggg tttcaccatg ttggccaaga tgatctcaat ctcttgacct 18720
cgtgatccac cccacatctg cctcccaaag tgctgggatt acaggcgtga gccaccctgc 18780
ccatcccaca tttctttttc ttatgtcgag atatgatttg cataccatag aatatacagt 18840
ttttaagggt gtcatcgagt gggttctcgt ggatcagtag gtatcgcagc tcccaccact 18900
gcctagtctc agggcagtca tgtccatccc cagcagctgc cacccttcat ccactggccc 18960
ccacgcatcc cctcctgtct gtaaatgggt ctgtcctgga catttcatag aagtggaatc 19020
acatactatg tggctttcgt ttattattat tatttaagac agaatctcac tctgtcgccc 19080
aggctggagt gcagtgtcgc gatctcagtt cactgcaatc tccgcctccc aggttcaagt 19140
gattctcttg ccccagactt ctgactagct aggattacag gcgtgcacca ccacactcag 19200
ctaatatttg tatttttttt gagacagagt cacactccga ggcccaggct ggagtgcagt 19260
ggcacgatct tggctcactg caagctctgc ctcctgggtt cacgccattc tcctgcctca 19320
gcctcccaag tagctgggac tacaggcacc cgccaccacg cctggctgat tttttttttt 19380
gtatttttag tagagacggg gtttcaccat gatagccagg agggtctcga tctcctgacc 19440
ttgttatccg cccgcctcgg cctcccaaag tgctgggatt acaggcgtga gccactgcac 19500
ctggcctaat ttttgtattt ttagtagaga cgaggtttca ccatattgcc caggcttgtc 19560
tcgaactcct gacctcaagt gacccaccca cctccgcctc ccaaagtgcc agggttactg 19620
gcgtgagcca cctgccttgt gtgtcctttc gtgtctggcg tctctcactg ggtgggacat 19680
cctcacggtg cacctgtgct gaggcctggg tctgagcctg gctcctttcc atggctgggt 19740
cgcgtcccgt gcgtgttggt ccttcggtct acggaaggac actcaggatg ctgctagttt 19800
gtggctgttg tggtcagttc tgctgtgaac atccacggat gcgtctttgg gtagatagac 19860
tttttcctct tcttctgggg gcgtttcttg ttaaagttta tcctcaggtg ttactggttt 19920
ttgttttttt ttttttggag agtgtttctc tttgttaccc aggctggagt gcagtggtgc 19980
aatcatagct tgcagcctgt gcctccatgg gttcagacga tccccctgcc tcagcctcca 20040
agcagctggg accacaggtg tgcaccacca cgcctgggta attttttgtg gagacagttt 20100
caccatgttg cgcaggctcg tctcaaattc ctgggctcaa gagctccgcc agccttgacc 20160
tcccaaactg ggtgttttct tgccattgtg agccagctgc tagattcccg catgcacgtt 20220
ttagctatgt ttcttcgcag ggagaggcac ctggctgccc tctctggttc agggttttgc 20280
tgtggattct gttgcatttt ccagggaggc cagcccctct cctgacctca cagccactcc 20340
tctcacccag cccgtacaaa agagtcctgg gcctcagttt cccagctctg ggggagggag 20400
ccttgtggtg tggcggtctc caccttgtcg ggtgggctgg ggtcacgccc tcctcactca 20460
gctctccttt cctttcctct ggtttgctcc acacccacag ggaactgcag cccggagtta 20520
aagccgtgca ggtcgtcctg aggtatgccc aggtgtgccc gcgaccccag ggctggaccc 20580
ccagccaccc gcccctcccc gccccccagt cctggcccag gcccttctca gtctcccctg 20640
ctaacagcag agcccagctc tcctcacctg ctgtctatcc ctgtctgggg atacatcacc 20700
atccgacccc cactcaggcc acacccgggg gccctgatac cccccgtgtc acattctccg 20760
gtgcccccat cactgccgcc tggctaccac tcgtgtaccc ccgcagcagc ctagtccctc 20820
ctgtgcgccc cctccccgcc ccatggtccc tgttgtcgtt gcagaatctg ttactcagac 20880
accagctgcc ctcaggagga ccagtacccg cccaacatcg ctgtgaaggt caaccacagc 20940
tactgctccg tcccggtgag catgccccgc ccccgcgtcg gctgcacggg tttggggggc 21000
gtggagggag ggtgggggcc gtcggatttc ccagccgctc ttggctcgag gctgagcggc 21060
ccatctgctt gcagggctac tacccctcca ataagcccgg ggtggagccc aagaggccgt 21120
gccgccccat caacctcacc cacctcatgt acctgtcctc ggccaccaac cgcatcactg 21180
tcacctgggg gaactacggc aaggtgagtg cgtgcccggg tgcccaccct gccccccaac 21240
cccggccccg tcctgccagc cctgacccct tccttctgtc cccagagcta ctcggtggcc 21300
ctgtacctgg tgcggcagct gacctcatcg gagctgctgc agaggctgaa gaccattggg 21360
gtaaagcacc cggagctgtg caaggcactg ggtgagcagc tcaggccacc tcggccgagg 21420
ggtgccaagt ccaccctgga aacccgccct gtgctgggtg aagcgggggg ccctgcaccc 21480
ggaggagatc gatcaggggc cgcctgtcac tctgggggtc catggccccc cggctgtggc 21540
tggggaggtc tctggaggat acggatggca gagggggcac ttggcagtgg gagctgctgt 21600
gcggaggcct gtggggtcac acctcgtgtt gctggcccca ggtgctccag cccacagggg 21660
tctaagcagc agaagagctg gagcctcatt ccgggacagc acagaggccg ggaggggtga 21720
gaggagcaca gagggagctg tggtctaagc agccccttct cgttgcctca gcggggccga 21780
gggtgctgcg ggacctggcg ggtcacggac ggccagggtc gtggaggcag ttgctgtggg 21840
aggaagacgg gcggcggcgg tctgacctca cgttggtgag gccccgttta atcttttttc 21900
tttttctttt tctttttttt ttagagagtc agggtctctg ggaggtagag gttgcagtga 21960
gctgagactg catcgctgca ctccagcctg ggctgcagag cgagactcca cctcaaaaaa 22020
aaaagtgtct cggtgtatcg cccaggctac agtgcagtgg tgggatcgtg gctcactgta 22080
gcctctaact cgggctcaag ccatcctcct gcctcagcct cctgagtagc ttgggaccac 22140
atgtgttcac caccacaccc aactaatttt tttttttttt tttttttttt tttttgagac 22200
agagtctcac tctgttgccc aggctggagt gcaatggcac gatctcggct cactgaaacc 22260
tctacctcct gggttcaagc gattcttctg cctcagcctc ctgagtagct gggactacag 22320
gcatgtgcca ccatgcccgg ctaatttttt gtattttcag tagagacggg gtttcacctt 22380
gttagccagg atggtcttaa gctcctgacc tcgtgatccg cttgcctcgg cctcccaaag 22440
tgctgggatt acaggcgtga gccaccacgc ccggccccaa ctaatttttt aatgtttcgt 22500
agagatggaa tcttgctgtg ttgcccaggc tggtcgtaaa ctcctgagct caagcagtgc 22560
acctgcctca atctcccaaa gtgctgggat tacagtcttg gccactttcg cacctggtct 22620
cttttgtcct tgtaacaatg aaaacaattt tttttaagtg acacgcagag caattttaaa 22680
agaaagcctg ccggcaaggc gcagtggctc acacctgtaa tcccagcact ttgggaggcc 22740
gaggcgggca gatcatgggg tcaggagagc aacaccatcc tggctaatat ggtgaaaccc 22800
catctctact aaaaatacaa aaaattagcc aggcgtggtg gcaggcacct gtagtcccag 22860
ctactcggga ggctgaggca ggagaatggc gtgaacccag gaggcagagc ttgcagtgag 22920
cggagatcgt gccactgcac tccagcctgg gtgagagtgt gagactccat ctcaaaaaaa 22980
aaaaaaagcc tgccaagcct ggtaggcaaa tcagtcctca ccccaagcag ccacgcagca 23040
caaagccagc gtacagcagt tagccctgcc tggcggctgt gtggcctcag aaagtcgctg 23100
gccttctctg gtggccactg tcttcaggag aatagatctg agccatcttg agggcacctg 23160
gacatctctc tggaccccac atgcttgggg cccaggcctc agtgggctct gcaggcctgt 23220
cttatggaga ggctaggcct aacctggagt catttggagc tgggagtggg agtcaggcag 23280
gtgggtgagg actgggacca cctgccaggc tgacgagagg gcggttctgg gccagccggg 23340
tttgctcgca cccccttccc gaatggtggc tgttttcagg tggaatctgg gcaccacccc 23400
agccccttgg cagaatgtgg gccagagggt cttccagctg cccctcctag ctgcccaggc 23460
ccctgtgccc aggccagaga gttccccatg agcactgccc tcctggcaca gccaggccca 23520
ggcctctggt ccctgttcct gaccaccaaa gggcacctcc ttgcctgggt gtccagaagc 23580
ctggagcagt gctggcactg ccaggggcct gcgagcccca tcgtgttgaa gcctcctgtg 23640
cactccagcc ccccaagtca ggaaagatag ccggcagcac cccctctgca gagcaggacg 23700
tggagggtga ggggtccctc cacggagtcc ggcatccttg gccagcctcc tccaggctcg 23760
gggatggagg gcctggctat gtacccgtgt gaccagtggg gacactgagg cacagagtgg 23820
caaagttagg gttctgtgtc ctgggttacc ccgccccacc tccctcttcc ctcaaagggc 23880
ccttttttca accgcccccg accttccctg cctgtgggga catggccaac ttgagggagg 23940
aggctggggc cgggcaggcc tcttctaggc ccacggggtg ggggccgggc ttaactcctc 24000
agtgaccaga gcccgcagtg ctgggggctg tggggtcagg cttcctctcc gaaggggtct 24060
cctgctgctt cccacagccg gccccaggct cagcctctct gtcactggat ttctttcttg 24120
ctgcacctag gaagtcctca cctttgcctc acttgaaccc ttcctgctgc gcacgtctct 24180
ccatacacaa aggagggaga gtttgcttta aaatcagatg ggcacctgca tcccctccta 24240
gctgcccctt tgccaggctt gagggtccac ccgggcaccg ggtagccaga gctgggatcc 24300
aaggatggaa actcagctga ggagtgagcg gctggggcag ccttggctca agcaggggag 24360
ctgctgggag ccagcacgtg gctgccacca cgtccccacg ggagaaggaa gagcccactg 24420
ctccacaccc cggctggggg tctgggtggg ggtcaggaag gaggaagtgg ctcccaagcg 24480
ggcagagata agtggtgttt caggccaata aggggtggta ggggcatttc caggcggagg 24540
aacgtcagga cagctggggg gagtgggggg gcaggctggc accatcactc tggaccccaa 24600
gtcacttggg caggtggctt cctggaggaa gcaacactgg tccaccaggc agctgagggc 24660
caggtggtgg atggagaggc cctgtgggtt gtgggccagg gtggcctgcc ccccatggcc 24720
cagggctggg gtctctcctg agctacccat ggatggagtt taccctggga tggagccaca 24780
tcccagaagc ctcaggaggg cagccagggt ccctgcgtga gtttccttct ggctgtgggc 24840
ctgctgcccg tcgaggggag ggcggcgcct gcctccaaga cttcatgttt cacatatgtt 24900
tccccatgtt ccgtgcagct tgctggcggg caccgtcttt tcctttaaag aagcagctac 24960
actcctgtct gcaggctgcc ttggggcggt gctggggctg ggcggcagcc gcttgctggc 25020
tcacagccag gaagccccag gatccgtctc ccaaagagtc cctgcctcat tccccgctgt 25080
ggccttgggg atggtgcttc ggtgacagaa tgaagtcaca gcaatgactc tttcggtggc 25140
tgtgttgcat gaaacttgcc agaaaagtcc catgggtcat agtccacgca gggtggggga 25200
ggccacatag gccacctccg tgtgggggct tcggctgggt ctgtgctgtg cccaggttgt 25260
ggtcaaatct aatggtggtt gccacccggc tttctccaat ccctcacggc cccgagccac 25320
acagcgaagc ttgggactca tcgtcagggg cctgttctgg gaggtggacg tcagtgccgg 25380
agagaactcg aatcacagcc ccgcgccctg ctgttcccac cctcctgacg gtgtcttccg 25440
ttccctcccc acagtcaagg agaagctgcg ccttgatcct gacagcgaga tcgccaccac 25500
cggtgtgcgg gtgtccctca tctgtccggt gagtcggggc gcggtcccct cctcgaggcc 25560
tctcctgcgg ccggccttcc cccctggcgg ccctgggccc ggggcggctt ggctgggccg 25620
tgagcctgcg ggggcgaggc tggtcttcgt cccctccgtg ttcctgaggc atgagtgatt 25680
ggagcgagcc acaggatgga gctgggggtg aggggcaccg ggcaggcggg cacaacagga 25740
ggggtgccct gctcacgcag cccctccccc acagctggtg aagatgcggc tctccgtgcc 25800
ctgccgggca gagacctgtg cccacctgca gtgcttcgac gccgtcttct acctgcagat 25860
gaacgagaag aagcccacct ggatgtgccc cgtgtgcgac aagccagccc cctacgacca 25920
gctcatcatc gacgggtgag cccggggccc cggggagggc ggccggagcc ggacatccgt 25980
ggaggtctcg gtggcacccc gcttcctgca gaccacatgg tgccccagca agacacagca 26040
gtgggggcac atggtcctgg agctttggaa accccgggct gcgaaaagag ccggtttctt 26100
tctcgcggaa cttctcagag cctttgctat gcaggtgaca gccacgtagc ttaggttgca 26160
gaaggtgggc tccggtccac cccgctccca cgtgacctca ggcaagtgtg accctgagct 26220
ccaggagtgt ggtttgtgcc acaaaaaact gagccaggtc gtgctttcac acggcgttca 26280
ccccaggacg cgcagccttg ggggtgacct cctcacagaa aggcaaagga ggtggcgcct 26340
cctggagcac tctggctacg ccatgccctt cccttcctag gtggcacagc tgtggccagg 26400
cattccccag gccacagggg acaggaggac aagacctttc tccctggtgg aaggctctgc 26460
ccagggctta agtttccaga aactgagccc cgttgtctgt ggtgcctgat gcggctcctg 26520
cccggcgccg accgcgccca cctcgtcccc agagccgccg gcagggcgcg aggccacagc 26580
ggcacaagct ggcgccctca caggcgggag caggccctgc ctgtgggggt gggccgggtc 26640
cccagccctc aggcatggcc tcagcggact gtgcaggtga aggcagggct ggcctgcctc 26700
tggggttgta gatttcatcc ccaggtggac ctccggttca tgcacttgtc cccatcccag 26760
gagacagacc tgtgagcgtc ctcagtttac agacgaggaa acaggctcag aggaggcaac 26820
cagcagctgg agctaccccg gctcacgggg ccaggctgag acttgaaccc agcctgagtc 26880
tgggtcccct ctgtggaggg ctgggtggcc acccccttgc atcccagctt cgggtagaga 26940
gaggagtcct ttgggccggg cacgtgggct gcctgaatgg ctgctctgtt cccagcctga 27000
cagctgtgca gccgggtgcc cgccttcccc cacaggcccg gagtggggct tgggcttggg 27060
gtggcggcag ctctcacagc tccagggcca ccagggctgg ggcaggcagc tgtgtcccat 27120
gcaggccttg gcctcagcag cccatgggac tcggtgtagc cagggaggct tcctggagga 27180
ggggtccttg gttcatactt tgttccatga gccctatcac ctctctgtcc ctggctctga 27240
gctgggtgac cccagggtcc ccaaaagagc cccgtcccag accctgcctt cagagtcttg 27300
ttcttggcca ggggagcgga tagaggagca gagccagaca taaacgttcc cgttgctgtg 27360
tgtgtcttgg ggaggaggaa gagaagctgt ggggtggggc tttggagggt gaaaagcagt 27420
tttgcaagca gggaagtggg caggcagggc tgtgctacgc ctggggcggc cctggcacgg 27480
tgggctccga gcatcgcctc agagagagct cggcggggcg gaggggctgg cctgggtgag 27540
agcctcagaa agggtggccc agagtgggac gagggctctc ctgtgtgatg agaacgatgc 27600
cactgcgggt gcctgggagc agctgtagcc ttgacagtaa caggccagcc tgggccctgc 27660
atggacccgt ggggcagggg gcctctcctc agacgccccc cagccactgc acctttccct 27720
tcctgcgggt ggggagactg aggccctttg gctaagacgg gttggggagc agaaccaggg 27780
cctgcctcca gttggccttg tggcctcagg gaactcgttc ccttcccgag cctctgtttc 27840
tgcatttgta aaatggggct ggtaggacct ccgagtaaaa aggccggaca cagtgggggt 27900
gctctggaga ggctgtggct ggcatgggcg tggggagccc gcactctgct cccattgcta 27960
ccctcacagc ctctgcaggg gctttgagca gccagcacct tcactccagc ctgtttcctg 28020
atctggcggg cacacagtgc aatgtgaaag caggtgtgcg tgcacaccca cacccgcatg 28080
cccacacatc catacagtcc acaccatcac acacacacac ccacacacat ccatacagtc 28140
cataccatca cacacacccg cacacatcca tacagtccac accatcacac acacacccgc 28200
acacatccat acagtccaca ccgtctcaca cacacacccg cacacatcca tacagtccac 28260
accgtctcac acacacacct gcacacatcc atacagtcca caccataaca cacacataca 28320
gtccacaccg tcatacacac acacacacat ctgtacagtc cacaccttca cacatccata 28380
cagtccacac cgtcatacac acacacatct atacagtcca cactgtcaca catccgtaca 28440
gtccacaccg tcatacaaac acacacacat ctatacagtc cacaccgtca cacatccgta 28500
cagtccacac cgtcatacaa acacacacac atctatacag tccacaccgt cacacatcca 28560
tacagtccac actgtcatac acacacacat ctatacagtc cacaccatca catgcacaca 28620
catctatatg gtctacaccg tcacacacac acacatctat acagtccaca cctgttacat 28680
gcacacatct atacagtcca caccgtcaca catctataca gtccacaccg tcatacacac 28740
acacgtctat acagtccaca ctgtcacaca tccgtacagt ccacactgtc atacaaacac 28800
acacacatct atacggtcca caccgtcaca catccataca gtccacaccg tcatacaaac 28860
acacacacat ctatacagtc cacacctgtt acatgcacac atctatacag tccacaccgt 28920
cacacatcca tacagtccac accgtcatac acacacacat ctatacagtc cacaccgtct 28980
cacatctata cagtccacac tgtcatacac acacatctat acagtccaca ccgtcacaca 29040
tccatatagt ccacaccatc atacacacac acatctctac agtccacacc atcacatgca 29100
cacacacatc tatatggtct acaccgtcac acacacacac acatctatac agtccacacc 29160
gtcacatatc tgtacagtcc acaccgtcac acacacacgc ccacacccgc atgccacaca 29220
tccatacagt ccacattcac gtatgcccat atgcatccat tcacacgtgt gtacacatgc 29280
tcacacacac acattcatag actccacaca tgcacacgtg cacacacacg cacatgctcg 29340
cacacatgca cagatacact cacgtccaca cacgctcaaa catgcgtgca cacccggagg 29400
tgcccagagg ggcagggtgg ggaggacccc tgcagctgcc acactccctg ctcttgtggg 29460
tagttggggg ccactgggta tgtgtgtcca tgccccgtcc ccccggcagt gccgtgcact 29520
gcagacctgc ctggggctca gcacctgcag gggcctgagg gcgggggagg gaatgcgggg 29580
tccctggacc cctgcggtcg gggtggtgag gctgctcttg cagagagaag tggggagtgc 29640
ctggctgcat ccgggaggga tggagggctg gggagttggg ggggtggggc acctccagcc 29700
ccggcgtcag ctgtccgcct cgccccaggc tcctctcgaa gatcctgagc gagtgtgagg 29760
acgccgacga gatcgagtac ctggtggacg gctcgtggtg cccgatccgc gccgaaaagg 29820
agcgcagctg cagcccgcag ggcgccatcc tcgtgctggg tgagtgcctc accccaccag 29880
ccgcgcagtc cgcagccagg gccgcctcag tttccccatt tatcagtggt tgcatcctaa 29940
gtacctgcac cctgtccctg ttgcccgtag gcccctcgga cgccaatggg ctcctgcccg 30000
cccccagcgt caacgggagc ggtgccctgg gcagcacggg tggcggcggc ccggtgggca 30060
gcatggagaa tgggaagccg ggcgccgatg tggtggacct cacgctggac agctcatcgt 30120
cctcggagga tgaggaggag gaggaagagg aggaggaaga cgaggacgaa gaggggcccc 30180
ggcccaagcg ccgctgcccc ttccagaagg gcctggtgcc ggcctgctga ccccggccgc 30240
acactcgact ttcctggtgc tcaccacgca gaggggcacg ggccagcctc gggcgcagag 30300
ggaggagtga cctttctttt tctttttatt gtcgttcgtt ttgtttttcc acccttttgc 30360
ctggctcctg gcacctgtac ctctggactc tcctatcggg ggattaaaaa aaaaagtaaa 30420
atgacaaaaa aagatacaaa aaagaaaaat gaaacaaaaa agtcaaactc ttaaaaacaa 30480
ggccggccac ccacacagcc gcctccccgg ctggagtccg agccgggaag gggtagtggg 30540
cgggagggac caggacgccg ccccgcgccc tcccctccgg atgccccgcc gcccgccgcc 30600
ctctgcccac gaccattcca gccagtgcgc ggggacccgg gcggcgggcg gtggggcgca 30660
gcccctctct ggcgaccact ttgacgtttg tctcttcctt tgctttttct ctgcaaatgc 30720
atcctcgccc agagaccctc acgcgccgag cagcgagcgt tttagccgag aagccatgga 30780
gtgggttggg gcggggaggg gcagtagggt ggggggatgg gtgggcagga tgggggtaca 30840
gtgggcggct ggggagggtt tagccacaga tgtgttgtat tttttgaaag tgcaataatt 30900
tggtattttg aagacccggc gtgtggtcag gaacccccgg ggaaggcggg ggcccagggt 30960
gcggcaccgt gtggcgtggg ggggtctcag ttttctagcc agctacctcg gtaattccaa 31020
ttcaggttaa cttccctacg gaacagcaca gatgtccaca gatgtccaca gctgccgccg 31080
ccgccgccgc caccataccc cggtccttgg ggcatgggtt gcggtcgctt cccaaggggc 31140
agcagggacc ccggccaccc cggctctcgg tttgggttga ttcctctcct ttttgctctt 31200
ggttttccga cgggtacgag gctggcccgg caccctgtcc cccgggagcc tcactcttcc 31260
agcaggacca gaccaggggc ctccttcctg tccccaggcg ttcccggccc ctcgcaggcc 31320
ccacccatgc ccttggcctc agggtccaac aactggggga gctaccaggg ctctgccttc 31380
aggagcccac agctgggcac cccccttgcc ccgcaggaga ccggggcgca ggcggggcac 31440
cggcctcacc tggttctcca acaccgctgc ctgcggtctg ttttgctttt gtcctcccca 31500
gcccagaatt ttcctttgta taaacagaac tcctagtcag gaagcaatat catttcaggt 31560
ctaaagaaag ggacgtgcat ctggccgagg gcagttcagt ctcactgcag agcccgcagc 31620
ccgctgcgca gctcggcccc tcccgcccgc acgggcagct gaaggccgct gttttctaat 31680
atttgtattc taatttaatt gtttttaaaa aatgcaaata aaaaaggtcg aggtgaagcc 31740
a 31741
<210> 2
<211> 3159
<212> DNA
<213> 人(homo sapiens)
<400> 2
ggaggagcgc gcgcgggtgc taattggccc gggcggcggc cccgcccgcg agtggtgagc 60
ggtcacgtga cgcgacggct gggggctccc ggcgcggggg acgctggtga ccaagatggc 120
ggcggagctg gtggaggcca aaaacatggt gatgagtttt cgagtctccg accttcagat 180
gctcctgggt ttcgtgggcc ggagtaagag tggactgaag cacgagctcg tcaccagggc 240
cctccagctg gtgcagtttg actgtagccc tgagctgttc aagaagatca aggagctgta 300
cgagacccgc tacgccaaga agaactcgga gcctgcccca cagccgcacc ggcccctgga 360
ccccctgacc atgcactcca cctacgaccg ggccggcgct gtgcccagga ctccgctggc 420
aggccccaat attgactacc ccgtgctcta cggaaagtac ttaaacggac tgggacggtt 480
gcccgccaag accctcaagc cagaagtccg cctggtgaag ctgccgttct ttaatatgct 540
ggatgagctg ctgaagccca ccgaattagt cccacagaac aacgagaagc ttcaggagag 600
cccgtgcatc ttcgcattga cgccaagaca ggtggagttg atccggaact ccagggaact 660
gcagcccgga gttaaagccg tgcaggtcgt cctgagaatc tgttactcag acaccagctg 720
ccctcaggag gaccagtacc cgcccaacat cgctgtgaag gtcaaccaca gctactgctc 780
cgtcccgggc tactacccct ccaataagcc cggggtggag cccaagaggc cgtgccgccc 840
catcaacctc acccacctca tgtacctgtc ctcggccacc aaccgcatca ctgtcacctg 900
ggggaactac ggcaagagct actcggtggc cctgtacctg gtgcggcagc tgacctcatc 960
ggagctgctg cagaggctga agaccattgg ggtaaagcac ccggagctgt gcaaggcact 1020
ggtcaaggag aagctgcgcc ttgatcctga cagcgagatc gccaccaccg gtgtgcgggt 1080
gtccctcatc tgtccgctgg tgaagatgcg gctctccgtg ccctgccggg cagagacctg 1140
tgcccacctg cagtgcttcg acgccgtctt ctacctgcag atgaacgaga agaagcccac 1200
ctggatgtgc cccgtgtgcg acaagccagc cccctacgac cagctcatca tcgacgggct 1260
cctctcgaag atcctgagcg agtgtgagga cgccgacgag atcgagtacc tggtggacgg 1320
ctcgtggtgc ccgatccgcg ccgaaaagga gcgcagctgc agcccgcagg gcgccatcct 1380
cgtgctgggc ccctcggacg ccaatgggct cctgcccgcc cccagcgtca acgggagcgg 1440
tgccctgggc agcacgggtg gcggcggccc ggtgggcagc atggagaatg ggaagccggg 1500
cgccgatgtg gtggacctca cgctggacag ctcatcgtcc tcggaggatg aggaggagga 1560
ggaagaggag gaggaagacg aggacgaaga ggggccccgg cccaagcgcc gctgcccctt 1620
ccagaagggc ctggtgccgg cctgctgacc ccggccgcac actcgacttt cctggtgctc 1680
accacgcaga ggggcacggg ccagcctcgg gcgcagaggg aggagtgacc tttctttttc 1740
tttttattgt cgttcgtttt gtttttccac ccttttgcct ggctcctggc acctgtacct 1800
ctggactctc ctatcggggg attaaaaaaa aaagtaaaat gacaaaaaaa gatacaaaaa 1860
agaaaaatga aacaaaaaag tcaaactctt aaaaacaagg ccggccaccc acacagccgc 1920
ctccccggct ggagtccgag ccgggaaggg gtagtgggcg ggagggacca ggacgccgcc 1980
ccgcgccctc ccctccggat gccccgccgc ccgccgccct ctgcccacga ccattccagc 2040
cagtgcgcgg ggacccgggc ggcgggcggt ggggcgcagc ccctctctgg cgaccacttt 2100
gacgtttgtc tcttcctttg ctttttctct gcaaatgcat cctcgcccag agaccctcac 2160
gcgccgagca gcgagcgttt tagccgagaa gccatggagt gggttggggc ggggaggggc 2220
agtagggtgg ggggatgggt gggcaggatg ggggtacagt gggcggctgg ggagggttta 2280
gccacagatg tgttgtattt tttgaaagtg caataatttg gtattttgaa gacccggcgt 2340
gtggtcagga acccccgggg aaggcggggg cccagggtgc ggcaccgtgt ggcgtggggg 2400
ggtctcagtt ttctagccag ctacctcggt aattccaatt caggttaact tccctacgga 2460
acagcacaga tgtccacaga tgtccacagc tgccgccgcc gccgccgcca ccataccccg 2520
gtccttgggg catgggttgc ggtcgcttcc caaggggcag cagggacccc ggccaccccg 2580
gctctcggtt tgggttgatt cctctccttt ttgctcttgg ttttccgacg ggtacgaggc 2640
tggcccggca ccctgtcccc cgggagcctc actcttccag caggaccaga ccaggggcct 2700
ccttcctgtc cccaggcgtt cccggcccct cgcaggcccc acccatgccc ttggcctcag 2760
ggtccaacaa ctgggggagc taccagggct ctgccttcag gagcccacag ctgggcaccc 2820
cccttgcccc gcaggagacc ggggcgcagg cggggcaccg gcctcacctg gttctccaac 2880
accgctgcct gcggtctgtt ttgcttttgt cctccccagc ccagaatttt cctttgtata 2940
aacagaactc ctagtcagga agcaatatca tttcaggtct aaagaaaggg acgtgcatct 3000
ggccgagggc agttcagtct cactgcagag cccgcagccc gctgcgcagc tcggcccctc 3060
ccgcccgcac gggcagctga aggccgctgt tttctaatat ttgtattcta atttaattgt 3120
ttttaaaaaa tgcaaataaa aaaggtcgag gtgaagcca 3159
<210> 3
<211> 30449
<212> DNA
<213> 食蟹猴(macaca fascicularis)
<220>
<221> 混杂特征
<222> (11806)..(12020)
<223> n 是 a, c, g, 或 t
<220>
<221> 混杂特征
<222> (20000)..(20513)
<223> n 是 a, c, g, 或 t
<220>
<221> 混杂特征
<222> (22511)..(22874)
<223> n 是 a, c, g, 或 t
<220>
<221> 混杂特征
<222> (26906)..(28773)
<223> n 是 a, c, g, 或 t
<400> 3
ggcggccgcg cgcgcctgcg caggacgcaa cagcgcgcac gggcggcggg aggagcgcgc 60
gcgggtgcta attggctcgg gtggcggccc cgcccgcgag tggtgggcgg tcacgtgacg 120
cgacggctgg gggctcccgg cgcgggggac gctggtggcc aagatggcgg cggagctggt 180
ggaggccaaa gtgagtgagc ggcggcggaa ccggccgggg caagtgggcg agagggcggg 240
ggccgggccg caggtcgagg tctgcgcctt ctgtccgggg ccccacagcg cggccggccc 300
gcggctcgcg gtcccggccc ccagaccccg accccgggtc tcagggtgag ggcggggggc 360
ggggaggccg ggggcggggc cctcctgcct cacccgggtc ttcgctccgg gggtcgcttc 420
cccggcttca ggcaggctcc cccccaccca gcccgagccc ttggagtccc ggtccctaag 480
cgccaggcca gggccgcgcc tcccggttga ggcaccgttc tcccgggctg cgggacgtgt 540
tgagcttctc gttgctctct tggttccgag ccggggtctt tgctctttgg ctggtgtgta 600
ggggggagtg tctgcgcctc cccgcccgca gggctcccaa gaatggtatc tgggtctcgt 660
ccccgcccaa caggccagac tggggtttgc gagtctcctg cttggaaggg tcccctgagt 720
cccggagagt gtcctgccac agtccaggta gaggagtcag ggccctgagg ccacctccaa 780
gacacagcac gtcctcttgg ggtctggagt ccaggctcgg gcttgagccc ctctgcagct 840
cctgcattgg tcccagaacc ccgccccctt cccgacaccg tctctcacac gctggagtgg 900
gcgctgggga agactgggcc ccctctttcc ctccccatag aatggagtcc tgaccacttt 960
tcttggtcaa agactttcct tattctcctt ttttttaatc ttaaatcctg gactgtgctt 1020
tggtcctacc tcattcccgt tgggacagaa tctaaggcta ctaattctgc ttcaggggcc 1080
tctaaacctt acctgtgcag catcagatac tgtcttcaaa ccttgggtgc ttctcttatt 1140
ttctgttctt gagcgagtct actttttagg tcagacaccc tccctcccta cacagccccc 1200
agaatcttta tgcaccccag ctttggtttt taaggtctcc tgtctttctg cctattctct 1260
tatgttgatc tctggagggt ccccactggg tccaagattg gcttctttag aataacttct 1320
gctgctagtc ttttatacta cggatcctgt gcaggtccca tgtcccatag ataccatctc 1380
ctaacttgga acccatttta atcctaggat tgagctccga gtatccgcat tccaggggat 1440
gtaccttctt gtaggtgcct gcctaaagct gagggtctaa aacccttaga agtgcccgca 1500
aaaccacggc ttccagggag gttaggggac ctctccctcc cccatccctc ttcacgtctt 1560
ccctccccac agtcctgacc tgtacatatt ttcttctcag tcctctcaca ttacccactg 1620
ggatctgaaa acacagcact cagggctatg tgattacagc atacacctct cttcgcctcc 1680
caaccctgcc cctctccccc gccccgcaca cacttctgtc cctctctaga gttttgaaaa 1740
gtggagactc gccctggaga tgtggaggcc taaactctgt aaacccgagg tggcaggctc 1800
tgggcttgaa gtgccctgga gtcctgaaat gtaacctcct ttctggactt ggagctgtga 1860
ccctggactc cccaccccca ccctggctga gggcagggtc tgcactcttt tgtaccatcc 1920
aggccttgaa atatgatctg atgaactttc cttgaccctc tggtgactag gtccccccac 1980
ctcaattaaa tcaagttgat ccttctttca ggttctctaa accgtgagct tccattcaag 2040
ggggcctgga ccccggggag ccttctttct tcttgagtcc attgctaccc ctctaagtac 2100
cttaaatgtc attgaaacat cccccttttt tacaggggcc ttctccagcc tgtcatattc 2160
atggctgcag attctgtctt ttggggtgca tcacagactg ctcggaggga cgaatgttgg 2220
gggcttgttg gtgaactttg aaatctgaga ctctcagctt gagacctgga ggcaggtttg 2280
gggcaggggt gtctgtgagc tccctgaaat agtccgcagc acacatctcc actttcctgg 2340
aaagaggcgc cttcctgagc ttcccccagt gctccgaggg gcctgtgcta gaggagaggt 2400
tcagcgcagc tgctgtgtct cggctgatgt ctccccacgc gacttccagg caagcctgga 2460
gttgaaactc tggaagctgc cggggcctgg cgctgtttat aaacacagct ctgacggcag 2520
gcaggtcagc tcagagccag ggcaggaagt gatcctgggg catttggggc ttcttcctga 2580
atgcttgtcc cccccgcatt ccctccagtg tcaagggcag gctcctctga ggtggcagct 2640
gccgggaaat ctgagtcgtg aacatatggc cgcctaaggg gtgtgctccg ggaagtggga 2700
gctggggctc cactgtccag cctgggcggg gcggaggctc ccggggtgcc aggatgtcag 2760
caggttcctg agcccacctg ccttcgacca ggctgccagt gtgaagtgtc cacatgacat 2820
cgtctctccc tgctaaggcc ttgggccact tccagaagaa acatcttgtc cgcaagcctt 2880
tgtgttttct gcacaaggta ggaagtcagg ccaagggagg tgaggcattt ttgttttcaa 2940
agcatcactg actctgaggc ccagcagacc acgcaggtcc ccatagccag tgtgctggtg 3000
agtgagggtc cccggcagcg gacgggaaca ccctggggag cccaggggcc gaggggctga 3060
tgccagtccc atgcatgtac tagggaggct ctgggccagc cacttctctc tgtgagcctc 3120
ggtttcctca cctacacgat gggtgtggtc attgtgaaat tagcgacata ggcctcgctg 3180
gtgcctggca gggagcagac gctggcatcc cggttcttca tggtcacggg gccgcgcaac 3240
cctgatacgg gaagaggctt ctcccgaggc tcttagggca ggactgggcc acccacacgt 3300
gcgtccctgt cgttttgagc cgggacagcc tcttcgtctc cagcaggatc ctggcctggt 3360
acagctggaa ggaatcagag ttgacagatg aggaccccgc cagcggcccc ggctgctgca 3420
gccttggtgt tgaaatgggc ggctaggctc ctggcctcac cctggggcag ccgggagctg 3480
gaaaccccag cacttcctgg cacggaggcc gcagtgtaga cactccagtg ggactgcctc 3540
tggctttgac cctcagggtc tttcgagtgg agtttggatg acttattggt ttcttcgggt 3600
gcctgccagc tttgcttacc acccttgaca cttgagcttt ttctccattc ctcctggaag 3660
tttctctttc ccaccacatc tcattcatcc caggccagct tcagggctga gggtgggtgg 3720
ccccgaaacc ctgccagccc atccctcgag gacacctggc ttctgcagcc tgttgagctc 3780
tctttccctt tcatggtcct acccctcatg gaggggaggc cactgccagg ctaccccaca 3840
tcaaacacta gggtcagctg ggctctgttg tttggtttga tttcgctgga gaggtactgt 3900
cgggggatga gggccaggtc ctgccaagcc tcattcgtca cattggccca ggtcccgcaa 3960
cagcccctgt ggctgctgcc ttcccctcgg accagtcccc cagggactca gggcgatgtc 4020
tggagatgta tttggttgtc atgaactgtg ggtgtttagc accccacagt gcccgggacg 4080
gccccagcgt ccacagggcc gaggggacga aaccctgctg gaatgatggg tagacgtttc 4140
ggaggccccc acaggcccgg ccctgtgttg ctgtccggag gagagtgtgg cagcagggac 4200
cgcccctggc ttcagagccg ggtctgggtt tgaatcttgg cactgccacc tctgagccta 4260
cagttctttt gtgacagagc tcacacacca gcctagcagg ggtgttttaa ggatcagagt 4320
taaatatata atcacatgac cgacttggtt cccggcaggt gattagtgct aagtaaactg 4380
tggctaccgt tggcgagacc gaagggaaaa catgtctgtg gctgacaagg gttgagcgcc 4440
cgcccagcca gtgctttatg tcattatcct cccgacgaag agactgaggg tcagagaggc 4500
acttggtgtt tgtcggcaag gcactggcag aggccgttta caagtaaagc acgattccca 4560
gttcctgccc tggggatgct ttcaggctga agacagggaa agagaaccta aaatagaagg 4620
ggggcctagt cagaggcgct tttgctgcgt tggcgatgct ggggaaagtt tgatgaggag 4680
gagggaggcg gcagggcttt gctgggaggg ggcaccgtag gggcagggca ctccaccagc 4740
cccagccaag gctggcgctt cctggcgagt gggtgtctct cacggccccc gcctcagggc 4800
ctggcctctg cggagtcccc tgcctcgcag ctctgccttc tgagttgtgt gtgcttgctc 4860
ctcctcagaa catggtgatg agttttcgag tctccgacct tcagatgctc ctgggtttcg 4920
tgggccggag taagagcgga ctgaagcacg agctcgtcac cagggccctc cagctggtgc 4980
agtttgactg tagccccgag ttgttcaaaa agatcaagga gctgtacgag acccgctacg 5040
ccaagaagaa ctcggagcct gcccagcagc cgcaccggcc cctggacccc ctgaccatgc 5100
actccaccta cgaccgggcc ggcgctgtgc ccaggactcc gctggcaggc cccaatattg 5160
actaccccgt gctctacggg aagtacttaa acggactggg acggttaccc gccaagaccc 5220
ttaagccaga agtccgcctg gtgaagctgc ccttctttaa catgctggac gagctgctga 5280
agcccaccga gttaggtgag tggccgcccc ggggaggctg cgacgggagg cctcacctag 5340
gccctgtcgc ccagcccagc cacgcagccc acctttggtg atgttctctg gcgcggccag 5400
ggtgggagcc acggtggcca gggctgtcct tccctggaag caaagggacc atctttgata 5460
ttggtcaccc cttgctgtgg tacaagttac cctgaaatgg agcagtgggc gtctgttagc 5520
tctcaggaac cagcgagccg cgttgcgggg cgttggggct cgggggctct catgaggctc 5580
agtcaggccg gagccacctc atccggaggc tcgaccaggg ctggagcagc cacttcctcg 5640
tgtggtggct ggcaggctgc agctcctcac cggcttttgg ccgtcgtccc caggtcctca 5700
ctgtgcggcc tcctgcacgg gctgcccggg cttcctcagc ctggtggctc cctcacccta 5760
gggtagcgag cgtgcacgtc cagctgggag ctggagccct ttttatgacc cagcctcgga 5820
cacgccttgc cgtctccccc atggagtcca ttgctcacag actctgtggc acaggcaggg 5880
accacaccag gctgtgactg ccagggccaa gggtgaccag ggtcacctgg gaacctggtt 5940
tccctgctta ttccccatgg aaagggggct ggccagtggc atcggccttc cctccttccc 6000
ccaggctctg gttcctcgct ggcagcctgc aggtatggcc ttggtcagcg ggctcaggtc 6060
actgccaggc tgtgcgcacc aggcgtgctg ggggctcagg gcgatcccag gcagaggaga 6120
ggtgctgggc tccacgcttc tctctctcat gtctttgtct gcaagcactg actgagcagg 6180
agtgtgtcag gacctcgcag cccgcagcag tgtggacagg cccctggcgc ctcccagcag 6240
ccgtgaccat tcaggctgca ggtgggtatc aagcccggtc tctgcctcaa ccatagccct 6300
gagctcaggg ccagggaggc cagagcagcc ccagccccca gggcagggag agtgtgcagc 6360
ctctgggact cccagttagg gagcagaaca tcctgggcct tttgcggacc tgtgccccaa 6420
ggcgctcaga ttttaccagg tcctctgtgt gcctggaggt ctcttcttcc tgcctccctt 6480
cccctgcccc cactctttcc ttcgcagtaa acgtcgcgca gtaaacgtcg gagtgcagta 6540
aacgtgggag tgcctgctgg gtgggtgcgt gatgggcacc aggcatggac acgcagcagg 6600
gaacgggacc aaggccgcga ggttcaggaa gcctctgcac gccccctccc accctgctga 6660
cccagcgacc tgcctggtcc ctgctgtggc ctgagggctc ctctctggca cgcttcagtc 6720
cactgggtgc cagctggccc cactcccctg ccccgggagg cagggtcaat gggggtgtgg 6780
ggaaggggaa ctggctgcca ttcccctccc acctacagcc ctgggacttt gtgaggttag 6840
gttggagggg ctgggcttcc aagtgaggtt ggaggaggtg gaggaggtgg aggaggtagg 6900
aagatgctgc tggtggttcc tgatacagtg aggctcctcc ctccagcctg aggctccgcc 6960
ttccaagtga ggctccgcct ccaccttttt tcttttgcag gaggtgtcta gcggcagcct 7020
cctggggagc aggttggccc agcagcacct gtcctgggag actcggggcc ttggcctgac 7080
tttcccggcc tttgctgcct cacgagggaa gcggttcccc cggcgggttc ttgggcagag 7140
ctggctatct ctgaagcttg ggccttggga aggacctgca tcacagggag gctgggcttt 7200
cccgggagcg gcagggcagg cttggtccag ggcgggggac ggggctgact gtcttccttc 7260
ctgcacgggg accagtagct ccatcccaca atgcatcact gtgccctgag cccccaggga 7320
ccccggtcac ctgatctccg ggagagccag ctcccctgtc tacaccagta tgactctgct 7380
ggcggctcag aacaaagagg ccaaccccac cctgcctctc cttcccactg gccccctctc 7440
catcctaggc caccaggtga acctcctttc ctggattccc atgctcttcg gggacccccc 7500
cggggaatgc ctgggtcctc agaggtttcc tggagcatag accctggccc caaagcagtg 7560
ctccccttgg tttcagggcc tgagatgcca ttcctccacc ccgaccctgg gctgtgtccc 7620
tccccagggt gcactctgtg gtgctggcct tgcgggggac cgcctcagga ggacccggtt 7680
ccaccggctt cccccttgcc cccgcctctg gctgtgaccc accggccagc gtgaggccca 7740
ctgctctggt ctgtttcccc ggaatagctg ccggccggct ccaggatgga gactgcgcca 7800
ggcggacagg agccataaat cacgtggcgc ggaatgctgg gctgggggag ggggtgacag 7860
agctgcagag caggctacgg gggcctcggg ccacagatga tcggctccag tgggaggtac 7920
catgtgtggg gacggggctg gcgcccagaa cagtgcggag aatggcccaa ggtcacacag 7980
cggcctgcct tcccttattc tgagccgact gggtcctgcc tctgagcaga ggctctggcc 8040
tggacctcgc gaaggctggg gcccctgtcc tgcctctcag cagggaagcc cgccccaccg 8100
cttcccagcc tgcagcacct ggggagtccg gccagggggc ctgaccctcc tgtcagggca 8160
catgggaaga gaggctgtca ggagatgtgg ggcggaagga aggacacacg ctggccgggc 8220
gcagagctgc ttctccaggg cctcggccca cagcgggcac cccgaggaat ctgcctgctt 8280
gcccgcctgc tgtgcagagt ggagcccctg tcgccacggc ttcagacgcc cccagaggca 8340
ggaagccctg gcactagcca agagctgcca gtcgggcatg tgctgtgctg tgctgtgtgt 8400
agacacatgt gcccttcagt ctctgaagcc cttgggtgag cattgcccag gccacagcaa 8460
ggtagcatgg tccctgctca ggtgccacac agaagtgcca ggtgatgagt gtctcgtggc 8520
tggcagaggg ctttcagggg cagctgtcag tagcgggagc cattcactgt acatttggga 8580
ggaggtagca gtcaggaagg cttcctggag gcagcagctt ccagtccaga cctgagggtg 8640
attcccaaga agccaggcag cgaggagggg gcagaggagt gtactccagg cagagatggg 8700
gggcagggga gtgtactctg ggcagagggg agggggcaga ggagtgtact ccaggcagag 8760
ggcagtgagg gcagaggccg atggccagag agggctcatt cacagggctg aatggagtcc 8820
attgtggcca gagtgtggtg tgcccaggag gagggacgca gcagcctggg tgcaggcggc 8880
agaggctgga acccgagaat ggtgggtcca gggaaggttg gaagctaccc tgctttcccc 8940
gagggctgca gcgcccctga ggttctggtg tgattttggg ggtcagtgag gaaactgaga 9000
ggtgcaggag gcaagtggcc acctgccttc cacagccagg cctgctgccc gcccaggccc 9060
accatctgtc cgtctgcaca ctgggagcct ggggggcacg gggcatcctg tgtcactgtc 9120
ccgtgtgtag ggtagtctga cccactcggc ccgctggcac ttcccgtgcc tatgattggg 9180
gaacaagggg actccgccag ctctgcccca ggtccgggcc ttctggttga ggaggaggga 9240
tgggcccacc gctaccaact gggggactgc tggcagccac ccccacatcc cactggtcct 9300
tctcctgtcc cctgtggccc ctgccctgcc cagcccagtt ccccacctgc ccgccggcca 9360
cagcctcctg ctctgcttcc tgcccactgg tccccctccc atggcagcct gtgaatgttc 9420
tcgctgatgg gtggagctgt cagcaccgcc ccctgtgcct agccaggggc acctgttccc 9480
cacccctcca ggacagtgcc ccctgtgtcc ctcatacctg actgtgctgc ctctactctt 9540
gatctggggg acctggggtg gggagttggt gctggtagct cttagctgga cagggcgggg 9600
ctgggagtta gagaacttgt atgtgctggg gaggggacag cctggaggag ggggccagca 9660
catgggccag ctggaggcag aatggtccca tccgatcagc ttttttaaaa tttttttatt 9720
tttgagatgg agtcttgttc tgtcgcccag cctggagtgc agtggccgga tctcggctca 9780
ctgcaagctc cgcctcccgg gttcacatca ttctcctgcc tcagcctccc gagtagctgg 9840
gactacaggt gccgccaccg cgcccggcta gttttttgta ttttttagta gagacggggt 9900
ttcgccgtgt tagccaggat gatctcgatc tcctgacctc gtgatctgcc cgcctcggcc 9960
tcccagaagt gctgggatta caggcgtgag ccaccgcacc cggccctgat cagcctttta 10020
aaatctcccc gtgtttcatt tctatttaca cttgcacaat gatgcgcctg tcccagaaaa 10080
ctggagtcaa cagcagagca gcccggctgg cgccctgctg cccgagcggg ccgcctcagc 10140
gcagcgggcc gtgcttgccg ccttccccct ttgcctgtgt gattgtagga gcgtgtggct 10200
gtcctggctg ctgttttata accacccccc atgctgtgag catctgctcc tggcgttaaa 10260
tattcatgtc agcagcatct cgcgaggctc cctggcagcc ttgggtggag ccagcggctg 10320
ggcccttctt gttgggctct cggattgggc ccatgggctg ctttgcatgc ccgggctgga 10380
gggcctggct gggcacctca tcccagaacc ggctctgcct ggcagggccc agcctcgcac 10440
ctggccgcaa aggtgcatct ggttcagcag cgcctgtgcc ttggtcctgt ggcccgtggg 10500
tgccgggcag tccacgaaac cgtctccccc tcggggaact tcatgcttca atggcccaac 10560
aagaaggagc agcagagtga tgcagggaaa ctgagtcgat ccttggaggg agaaggtttg 10620
gagaaaagcg gggcgggggg tgcagttttt aaatgaggtg ctcagggaag cctttccttc 10680
tggttacatt tgtgcaaaga caaatatagg gccatgaggc tggtcgggag aggaaggttc 10740
cagaagaggg aatggcgtgt gcagagtccc cgaggcagca tggctggtag ggcccaggca 10800
ggaggccagg gtgggtgtgg ccctgaacag gggtgctgag ggccaggggt ctcctgcaga 10860
gccagcccag ggagcaggct ctggctgctg agaccagcag agctggggac aggtgtccgc 10920
gtcgggtggc atttgaaagc agaactgaca ggactggctg ggggagggga tgtttgcagg 10980
acagcagagg cgggggctgc gtggatgcca cctgggtttc tggccccaaa cagctgaccc 11040
cgagggcaga agaggaggtt tgcggtagcc cctcttccta agggccagcc acagcccctt 11100
ccccagcaga ggggggccag gtgttagggg ggatccgtga gcggcctggg gcgagtagca 11160
cagcagagca gtcagagcac agggcatctc ccgggtcccc agcagagaag cacagcctgg 11220
cctcccccag agggagcctc ccggggcaag gaccccagag ttttggtctt caatgactgg 11280
gccctttctg ccccaggcat ggacttgctg cttattgggg acccaccctc ctcccctaat 11340
tccttctgag acactgaggg gtggagtgtc cgtgttttca cctctgaccc agcctggaag 11400
ctcaaggccc agctcaggtg tcggctcctg tgaggcctcc ctgccccgaa ccattgctcc 11460
ccggcgcttg gggcagatct gggcgcatct acaggtggcc tgtgtgcccc accctcccaa 11520
ttaggcggcc ttcctcaggg gcccagctgg gcatccacag cccatcacct ctgcagagac 11580
tggctgtgcc ctcagcacat aaacgggaac aggctgtggc actgtggcgc ttgtggcaac 11640
accactgctg cggtagcacc ctcttcctga gggccagcca cagacccggc accggttccc 11700
gcagaaacgg gtcagcatgg gccggacatg caggctcagg ccacaaaggc cctggcaggg 11760
ctgggatccc agcccaggca gtctggcttc tttttttttt tttttnnnnn nnnnnnnnnn 11820
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11880
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11940
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12000
nnnnnnnnnn nnnnnnnnnn ttttgagaca gagtcttgct ctgtggccca ggctggagtg 12060
cagtggcaca acctcggctc actgcaagct ccacctcctg ggttcacgcc attctgcctt 12120
agcttcccga gtagctgggc ttcccgtgag ccaccacacc cagccggcag tctgagcttc 12180
tgagcctaaa gcagatgtac tttttacatc gttacccgtt ctcatgggtt ttaattgaga 12240
aagttccaag acggtgctgg cagttgaggt ccgatgccac ggctccggtt cttgtaaagg 12300
cccttgtcat aggtgcaggc cacactgctg tgtgcactgc cgtcctggga gcacctttcc 12360
aggaccgggc agtctctgct cataacacag acagtgtggc ctgcgaagct gatgaactcc 12420
agcctttacc agggcagttc gccgtccttg ttctgaaggg cttgcccgtc atcttgtctc 12480
ccggccactc caaggctgcc attgtggcca gattctctct cccccacgct cctccgatat 12540
ttttttacac ttatagacaa ataggcattt actcagattc cttccctccg ttttcgttac 12600
acaagcgatg gcagggcata catgccgctc agtgtttttg atttacgtct aaatatattt 12660
tttaacgtag acacagtctt gctgtgttgc ccaggctggt ctcacacttc tgaacccaag 12720
caatcttccc gcctcagcct cctgcgccgc agggatgaca gctgcacacc agcacacctg 12780
gctcaggctc atttaaaaat ggttttttag agacaaggtc tcactatgtt acccaggcta 12840
gtctccaact actgtgctaa agcgatcctc ctaccttggc ctcctaaagt gctgggatta 12900
caggcatgag ctgccgtacc cggcctgcaa gtctctgaat gcatgtttcc atttactttg 12960
tttttttttt tttttttttt tttgagacgg agtctcgctc tgtcacccag gctggagtgc 13020
agtggccgga tctcagctca ctgcaagctc cgcctcctgg gttcacgcca ttctcctgcc 13080
tcagcctcct gagtagctgg gactacaggc gcctgccacc tcgcccggct aagtttttgt 13140
atctttagta gagacggggt ttcactgtgt tagccaggat ggtctcgatc tcctgacctc 13200
gtgatccgcc cgtctcggcc tcccaaagtg ctgggattac aggcttgagc caccgcgccc 13260
ggccgcatgt ttccatttac tgaaggaaaa tactttgagt gggattcctg ggtgctgggg 13320
taggtctgtg cttaccttta taagggcagt ttcccaaagt gattgtactg tcttataacc 13380
ccaccagcag agagtttgct ctacaccctc gccacctcgt agagttgcca gtcttttcat 13440
tttagccatg ctagtggatg tgtagagaga tattttactt tattttacct catcttattt 13500
tattgatatg gagccgcact ctgtcaccca ggctggagtg cagtgaccca gtctcggttc 13560
actgcaacct ccgcctcctg ggtttaagca attctcctta gcctcccgag tagctgggat 13620
tacaggcgtg tgtcaccatg cctggctaat ttttgtattt ttagtagaga tggggttacc 13680
atattgtcca ggctggtctt gaactcctga cctcaagcga tccacctgcc ttggcctcca 13740
cagtgctggg attccaggca tgagccaccg cgcctggcct gtgtgtgtag agaggattta 13800
taccagtctt agatttctca cacaaatcgc aggggcctga aatactggct gatattttgt 13860
ggaggatttt acatctgtgt tcgtgagggg catttattgg taattttcct tccttgacgc 13920
cgtgttgtga ggttttggta tcagagttat gctggccttg taaaataggt agtattcttt 13980
ccttctctgt tgtttgaaag agtttacgta cagtttatgt ggtttctttc caaaatgttt 14040
tatagaattc accaatatgg acctgcagtt ttctttttct ttttcttttt cttttttttt 14100
tgagatgggg tctggttctg ttgcccaggc tggagtgcag tggtgcgatc acggctcact 14160
gcagcctcca cctcctgggc tcaagcgatc ctcctgcctc agcctccaag gtagctggga 14220
ctacaggtgg tgcgcgcctc cacacctggc taatttaaaa aatttttgta gagacagggt 14280
ctcactgtgt tgcccaggct ggcctcaaac tcctgggctc aagcgatccg cccacctcag 14340
cccccaaagt gctgggatta caggcgtgag ccaccgtgcc cgacctggac ctgcagtttt 14400
cagaaaaggt tttaattatg gatccaaatt ccttaacagg taacaaactt ttcaaacgtc 14460
ctgtatcttt tggtacccgt tctggtaatg tgcatctttg gaagaatttg tcactgagtt 14520
gtcagatccg ttggcatgaa ggtacacctt ttcttcccct gttggaccag aaagcggtgg 14580
ggtctgtgct gtggttctct gtcatttctg atgtgggtag tttgtgttct cactgtcttt 14640
ctgttgttca gctagagttt cgttcgtttg tttttgtttt tgtgttttgg gggttttttt 14700
ggaaacagtc tcgctctgtc gcccaggcag tggtgtgatc tccactcact gcaacctcca 14760
cctcccagct tcaagcagtt ctcctgcctc agcctcccaa gtagctggga ttacaggtgc 14820
ctgaaccacg cctggctaat tttttttttt ttttgagacg ccacaccatg ctgttttttt 14880
ttttaagaga tggggcagcc aggtgcagtg gctcatgcct gtaatcccag cactttggga 14940
gaccaaggcg ggcggatcac ctgaggttgg gagttcaaga ccagcctgac caacatggag 15000
aaaccctgtc tctgctaaaa atacaaaatt agctgggcgt ggtggcacat gcctgtaatc 15060
ccagctgctt tgggaggctg aggcaagagg atcgtttgaa cccacgaggc ggaggttgtg 15120
gtgagccgag atgatgccat tgcactccag cctgggtgac aagggtgaaa caaagtctca 15180
aaaaaaaaaa aaaagatggg gctggctgag cggaatggct cacgtctgta atcccagcat 15240
tttgagaggt tgaggtgggc agatcacctg aagtcacgac tttgaaacga gcctggccaa 15300
catggtaaaa tccgatttct actaaaaata caataattag ccaggcgtgg tggctatttg 15360
ggaggctgag gcaggagaat tgcttgaacc tgggagacgg aggttgcagt gagccgagat 15420
cgtgccattg tactccagcc tgggcgacag ggtaagattc catctcaaaa acaaaacaaa 15480
caaacacaaa gaacagtgtt ttctgactgc gcctctgctc gtcagtccag ttgtaagtaa 15540
tagggtaggg cccaggcttg tgagcgccat ggccttcatc ccgtcagtac ctccggcgcc 15600
acctctgtcc atgtgacgcc atggccacct tgcaggcacg aggagagcaa gggccgggtc 15660
cattttgtac ttaggaggga ggagggatgg caggtcctgc aggcctggct gggtccagct 15720
ctccccccag gcagctgggc atttttcagc cttcctaaat agacgcctgc atcccatggg 15780
ctgcaaaggg cactggctct ctgagtggcc ctcaacagga cacgggccgt ggtgaatggc 15840
cccgagaagg ggatggacgg gagtcctccc tcattctcct ccctcatcct cctccctggg 15900
cggcccccac ctctgcccca catatctgtc ccgccagctt cccatttcct gtttcctgat 15960
ctgaagagga gaaggccggg aaaagcgact gggctcgggg gacctgccag ggaccagaca 16020
tgcccatgac cctgtgtttg tcttcagtcc cacagaacaa cgagaagctt caggagagcc 16080
cgtgcatctt cgcattgacg ccaagacagg tggagttgat ccggaactcc aggtgcgcgg 16140
ctccccccca gccccgtgcc ctgccgcccg cccgctttct cctgggctca ctggaagagc 16200
cggcagccac gcccactgca ggcccggctc gggctcagtc cagaaccgtg ctgcgaggca 16260
gtggccgggt tcgctgcctt ccagaaaacc ccgtcctgag tgtcacccgc tgggctgtgc 16320
ccactgcctg taccctgcag cccgctagag agaggcggac tgaccgtccc cttttaacac 16380
ggtcttgccc tctgcctgtg ggaccatcct gggcgctgca gggtgctgag tagcattcct 16440
cgcctccacc cactccatgc cgagaacaca cccatgttgt gacagccaca gatgtcccca 16500
gacgttgtcc agtgtcccct ggggcaggat aacgcgggtg agacctccct gggttattgg 16560
attccacgta cccccaagag actctgcgtc ccctaatcct ctgccctgct gaggtcccag 16620
aaggctgcac acattgaaat ccacaccctg agttggaggg ggagagagga ggagaatccc 16680
gggagctggg gtccctggtt tacaccgccc gccttatccg gaatttattc tggtgtccag 16740
catgagcagg aagttaggtg ttttgttttg tttgtttgtt tttgagactg agtttcactc 16800
ttgttgccca ggctggagtg cagtggcacg atcttggctt cctgcaactt ccacctcccg 16860
tattcaagcg attctcctgc ctcaacctcc caggtagctg ggattacagg cgcccactac 16920
cacgcccggc tgttcttgta tttttagtag aaatggggtt ttgccatgtt ggtcaggctg 16980
gtctcgaact cctgactcag gtgattcacc cacctcagcc tcccagagtg ctggaattac 17040
aggcgtgaac caccgcgccc ggccaaagtc aggttttttc ccagataatg aacgcagggt 17100
ttacccctgt gcaccgtgga tagtgaggtg ggatcgttcc ctcggatgtc cccagacact 17160
gccctcagat gaggacggtt gaactctagc aggtgagggg ccagtgtggc tgctcggtgc 17220
tctgctcctc cctcagtctc tctcaggctg tcctgcctcc agctgagaca gattcttgcc 17280
ggggcagcct catggtgggt gctggaccct caggacaggg gaggcctttt gcccaggtca 17340
ccgctgagtc cgtggcaggg ctgggctggg cgcccccatt tgatgcccag cttctcatgc 17400
tcagctgctt cagacccacc gcctctactt gctgtggggc caggttcccg gggcctccca 17460
gcctggccct cacacctagt aagggttcag aaccagctga gccaggcttg gccacggagg 17520
cctctctgcc tgggtgaccc aaggtggtga cgtcaccttc ctcctcttcc ttgtctgtga 17580
acctgggtcc acacagctcc acccgcactg cgtccctgct gcggggtgct tgagccagcc 17640
acacagtata aaaaaatcag tttgggtttc tcctcagaaa gcttctggac atttcctttt 17700
cttttttttt ctttttttga gacagagtcg ctctgtcacc gggctggagt gcagtggcgc 17760
gatctcggct cactgcaagc tccgccccct gggttcaagc gatattcttc tcctgactcc 17820
gcctcgcgag tagctgggac tacaggcatg cgccaccacg cctggctaat ttttgtattt 17880
ttagtagaga cagggtttca ccatgttggc caggatgatc tcgatctctt gacctcgtga 17940
tccacccgcc tctgcctccc aaagtgctga gattacaggc gtgaaccacc gtgcccaacc 18000
cgcatttgta tttcttacgt tgagatatga tttgcatgcc atagaatacg cagtttttaa 18060
gtgtgtcatt gagtgggttc tcgtggatca ataggtagtg cagctcccac cactgcctag 18120
tctcggagca attgtgtcca tccccatcag ccaccaccct tcatccgctg gcccccacgc 18180
atcccctcct atctccgtaa atgggcttgt cctagacatt tcgtagaagt ggagtcacac 18240
actgtggctt ttttaaatga ttattatttg agacggaatc tcactctgtt gtccaggctg 18300
gagtgcagtg tcgcgatctc agctcactgc aacctccgcc tcccaggttc aagtgattct 18360
cttgcctcag actcctgagt agctaggatt acaggcatgt accaccgcat tcagctgatg 18420
tttgtatttt tagtaaaaac gaggtttcat catgttgccc aggttggtct ggaacccctg 18480
acctcaggtg acccacccac ctccgccccc caaagtgttg gggttactgg cgtgagccac 18540
ctgccctgtg tgtccttttg tgtctggcat ctctcactgg gcgggacgtc ctcacggtgc 18600
acctgtgctg aggcccgggt cagcctggct cctttccgtg gctgggtcac gtgccgtgtg 18660
tattggtcct tccgtctatg gaaggacact caggctgccg ctactttgtg gctgtcgtgg 18720
tcatttctgc tgtgaacatc cacggatgcg tctttgggta gagagacttt ttcctcttct 18780
cctggtgatg tttcttatta aagtttattc tcaggtgtta actgggtttt ttttgttttt 18840
ttttaatttg gagagtgttt ctctttgtta cccaggctgg tgtgcagtgg tgcaatcata 18900
gctcactgca gcctccgcct ccacgggttc agatgatcct cctgcctcag cctccaagca 18960
gccgggacca caggtgtgca ccaccatgcc cggataattt tttgtatttt ttgtagagac 19020
agtttcacca tgttgcccag gctggtctca aattcctggg ctcaagagct ccgccggcct 19080
cggcctcgca gactgggcat tttcttgccg ttgtgagctg gctgctacat tccagcatgc 19140
acgttttagc tgtttcctcg cagtgagagg cacctggctg ccctctctgg ttcagggttt 19200
tgcggtcgat tctcttgcat tttccaggga ggccagcccc tctcctgacc ctacagccac 19260
tcctgtctca cctggcctgc acaaaagagt cctgggcctc agtttcccag ctctagggga 19320
gggagccttg tggggtggca gtctccacct tgtggggcag gctgaggttg cgccttcctc 19380
actccgctct cctttccttt cctctggttt gctccacacc cacagagaac tgcagcccgg 19440
agttaaagcc gtgcaggtcg tcctgaggta tgcccaggtg tgcccacgac cccagggctg 19500
gacccccggc cacctgcccc tcctcccccc cgccccccag tcctggtcca ggctcttctc 19560
agtctcccct gccaacagca gagcccagct ccccccagcc tgccatctgt ccctgtctgg 19620
ggatacgcca ccatcccacc acctgctcag gccacacccg ggggccccaa taccccccat 19680
gtcaccttct ccagtgcccc catcaccgcc acttgactcc cacttgtgta cccctgcagc 19740
ggcccagccc ctcctgtgcg cctcatggtc cccattgttc cccacagcgg cctagcccct 19800
cctgtgcgcc cactcctgcc gccccatggt ccctgttgtc gttgcagaat ctgttactca 19860
gacaccagct gccctcagga ggaccagtac ccgcccaaca tcgctgtgaa ggtcaaccac 19920
agctactgct cagtcccggt gagcacggcc cgccccgcat ctgctacacg ggtttggggg 19980
gcgtggaggg agggtggggn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20040
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20100
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20160
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20220
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20280
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20340
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20400
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 20460
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnagggtgg 20520
ggggcgtgga gggagggtgg gggccgttgg attttccagc cattcttggc tcgaggctga 20580
gcggtctgtc tgcttgcagg gctactaccc ctccaataag cctggggtgg aacccaagag 20640
gccgtgccgc cccatcaacc tcacccacct catgtacctg tcctcggcca ccaaccgcat 20700
caccgtcacc tgggggaact acggcaaggt gagtgcatgc tcggtgccca ccctgccccc 20760
ctgccccggc ccccgccctg ccagccctga ccccgcccct ctgtccccag agctactccg 20820
tggccctgta cctggttcgg cagttgacct cgtcagagct gctgcagagg ctgaagacca 20880
ttggggtgaa gcacccggag ctgtgcaagg cactgggtga gcagctcagg gccacctcgg 20940
ccgaggggca ggccaagtcc cccctggaaa ccttccctgt actgggcgag ggtggggggg 21000
cctgcacccg aaggagatgg gtaaggggct gcctgtcact ctaggggtcc atggcctccc 21060
cgctatggct gaggaggtct gtggaggata cggatggcag agggggcact tggcagtggg 21120
agctgctgtg cagaagcctg tggggtcaca ccccgtgttg ctggccccag gcgccccagc 21180
ctacaggggt ccaagcagca gaagagctgg ggccttgttc ctcattccgg ggcagcacag 21240
aggccgggag gggtgagagg agtccagagg gagctgcgct ctaagcaggc tcttctggtt 21300
gcctcagcgg ggtcaagggt gctgcggggc ctggcggggc acggacagcg atggccatgg 21360
aggcagttgc tatgggagga aggtgaacag cggcggtctg acctcacgtg gtgaggcccc 21420
attttatctt tttttttttt tttttttaag agagtcaggg tttccaggag gtggaggttg 21480
cagtgagctg agattgcacc gctagactcc agccttggct gcagagcgag actccacctc 21540
aaaaaaggaa aaaagagggt ctcactgtat cgcccaggct acagtgcaat ggtgtgctcg 21600
tggctcactg cagcctctga ctcaggctcc agccatcctc ctgcctcagc ctcctgagta 21660
gcttgggacc gcatgtgttt accaccacac ccaactaatt tttttttttc tttttttttt 21720
tttgtgaaac agagtctcac tgtcacccag gctggagtgc aatggcatga gcttggctca 21780
ctacaacctc cgcttcctgg gttcaagcaa ttctcctgcc tcagcctccc gagtagctgg 21840
gactacaggc acccgccacc acactcagct aaatttttgt atttttagta aagacagggt 21900
ttcactgtgt taaccaggat agtctcgaac tcctgacctc gtgatccgcc cacctccgcg 21960
tcccacagtg ctgggattac aggcgtgagc ctccgcaccc ggccccaact aattttttaa 22020
tgtttcctag agacaggttc ttgctgtgtt gcccaggctg gtcttaaact cctgggttca 22080
agcggtgcac ctgccccaac ctcccagagt gctgggatga cagtcttggc ctcttttgca 22140
cctgttctct tttgtacttg taacaatgaa aacaatattt tttaagtgac acgcagagca 22200
attttaaaag aaagcctact ggccaggcgc agtggctcac gcctgtaatc ccagcacttt 22260
gtgaggccga ggcgggcgga tcacgaggtc aggagatcaa gaccatcctg gctaacacgg 22320
tgaaaccccg tctctactaa aaatacaaaa aaatagccgg gcgaggtggc gggtgcctgt 22380
agtcccagct actcgggagg ctgaggcagg agaacggcgt gaacccagga ggcggagctt 22440
acagtgagcc gagatcgcgc cactgcactc cagcctggga gagtgagact ccgtctcaaa 22500
aaaaaaaaaa nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 22560
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 22620
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 22680
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 22740
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 22800
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 22860
nnnnnnnnnn nnnnaaaaaa aagcctgcca agctgggcag gtgaatgagt ccccccgtgc 22920
agccgcacag cacaaagcca gcgtacattt agccttgctt ggtggctgtg tggccttgga 22980
aagtcactgg ctttctctgg tggccactgt cttcaggaga atagatctga gccatcttga 23040
gggcacctgg gcctctctct ggaccccaca tgcttggggc tcaggcctca gtgggctcca 23100
caggcctgtt ctatggagag gctaggccta acctggagtc ctttggagct gggagtggga 23160
gttgggcagg tgggcgagga ctgggaccac ctgccagact gagaagaggg tggttctggg 23220
ccaaccgggt tagctcgtgc ccccttccag aatgctcgct gttttcaggt ggaatttggg 23280
caccacccca gccccttggc agaatggggg ccagagggtc tcccagctgc ccttcctagc 23340
tgcccagggc tcctgtgccc aggcctgaga gttccccatg agcactgccc tcctggcaca 23400
gccaggcccg ggcctctggc ccctgttcct gaccaccaaa gggctcctac tagcctgggt 23460
gtccagaagc ctggagcggt ggtgggactg ccaggggcct gcgagcccca tcgtgttgaa 23520
gcttcctgca cactccggtc ccccaagtca ggaaggatag ccggcagcac cccctctgca 23580
gagcaggatg tgcaggggtg agggtgccca ccgcagagtc ccgcatcccc ggccagcctc 23640
ctccaggctc ggggagggag ggcctggcga tgtccccgtg ggaccagtgg ggacactgag 23700
gcacagattg gcaaagttag ggttctgtga cctgggtgtc cccgccctgc ctccctcttc 23760
cctcaaaggg ccctttcttc aacccccccc caccttcctt tcctttgggg acaatggcca 23820
acttgaggga ggaggctggg gccgggcagg cctcttctag gcccatgggg tgggggccgg 23880
ccttaactcc tcagtgacca gagccctgca gtgctggggg ctgcagggtc agatttcctc 23940
tctgaagggg tctcctgccg cttcccacag ctggccccag ccttagcctc tttgtcactg 24000
gatttttttc tcgttgcacc taggaagtcc tcacgtttgc ctcacttgaa cccttcctgc 24060
tgcacatgtc tttctgtaca tggagaaggg agagcttgct ttaaaatcag atgggcacct 24120
gcatcccctc ctagctgccc agggcccctt tgccaggcgt gagggtccac gtgggcacca 24180
ggtagccaga gctgggtccc aggggtggaa actcagccaa ggagtgagcg actagggcag 24240
ccttggctca agcaggagag ctgctgggag cctgcgaggg ggccagacca tgctggccag 24300
cttgtggctg ccactgcgtc cctacgggag aaggaagaac ccactgctgc acacacaggc 24360
cggggggctg ggtgggggtc aggaaggagg aagtggcttc caagcggcca gagataagtg 24420
gtgtttcagg ccgacaaggg gtggtaggag catttccaga cagagaaacg tcaggacagc 24480
tgggggaagc ggggagacag gctggcacca tcactctgaa ccccaagtcg gttgggcagg 24540
tggcttccta gaggaagcaa aactggtcca ctaggcagct gagggccggg tggtggatgg 24600
agaggccctg tggactgtgg gccagggtgg tctgccctgc agggcccagg gctgggggct 24660
gtcctgagct agctgaggat ggagttcagc cgcatcccag aagtgtcagg aggcagccgg 24720
ggtccctgcg tgagttcctt ctggctgtgg gcctgctgcc tgtggagggg agggcggtgc 24780
ctgccccgag ccttcatgtt tcacgtgttt gcccgtgttc cgtgcagctt gctggcgggc 24840
accgtctttt cctttaaaga agcggctaca ctcctgggtg tgcgggctgc ctcggcgtgg 24900
tgtccggggc tgggcggcgg ccgcttcctg gctcacagcc gggaggcccc cgggtccatc 24960
tcccaaagga atccctgcct cattccccac tgtggccttg gggatggtgc gtcagtgacg 25020
gaattaagtc acagcaatga ccccgtcggt ggctgtgttg catgaaactt tccagaaaag 25080
tcccgtgggt cacagcccac gcggggtagg ggaggccaca taggccacct gcgtgtgggg 25140
gcttcggctg ggtctgtggt gtgcccaggt tgtggtcaaa tctaatggtg gtcgccgcct 25200
gacttcctct ggtgcctcgt ggccctgagc cacacagcga ggctcaaggc tcgttttggg 25260
ggcatccgtt ctgggaggtg gtcacgggtg ctggagagaa cccgaatccc agtcctgtgc 25320
cccactgtgc ccacctctct gacggcgtcc tccgttccct ccccacagtc aaggagaagc 25380
tgcgcctgga tcccgacagc gagatcgcca ccactggtgt gcgggtgtcc ctcatctgcc 25440
cggtgagttg gggcagcctc ctccttgggg cctctcctgc ggctgtactt cctccctggt 25500
ggccctgggc ccagggcatc ttggctggac cgtgagcctg cgggggcaag gctggtcttg 25560
gtccccccgt gttcctgagg catgagcgtt ggaacaagcc acaggatgga gctgggggtg 25620
aggggtgccg ggtgggcggg cacagcagac gggtgccatg ctcacgcagc ccctcccccg 25680
cagctggtga agatgcggct ctctgtgccc tgccgggcag agacctgcgc ccacctgcag 25740
tgcttcgacg ccgtcttcta cctgcagatg aatgagaaga agcccacctg gatgtgcccc 25800
gtgtgcgaca agccagcccc ctacgaccag ctcatcatcg atgggtgagc ctggggcccc 25860
gggagggcgg ccggagccgg gcggccgtgg agatctcggc ggcaccctgc ttcctgcaga 25920
ccccgtgctg ccccagcaag acacagcagt ggggacacgt ggtcccggag ctttggaagc 25980
cccgggctgt gagaagagcc cgtttcttcc tcgcggaact tttcagagcc tttgctgtgc 26040
aggcgatagg cgtgtagctt aggctgcaga aggcgggctc aggtccaccc cgctcccaca 26100
tgacctcagg caggtgtgac cttgagctcc aggagtgtgg tttttgcccc aaaaaaccaa 26160
gccggactct gctttcacac ggcgttcgcc ccaggatgcg cagcaatggg ggtggctcct 26220
cacagagagg cgaaggaggt ggtgcccctg gagtgctctg gccacgccat acccttccct 26280
tcctgggtgg cacagctgtg gccaggcatt ccccaggcac caggggacag gaggacaaga 26340
cctttctccc tggagggagg ctctgcccag ggcttaagtt tccagaaact gagccctgtt 26400
gtctgtggca cctgatgcgg ctcctgcatg gcgccggcca cgcccacctc tcgtccccag 26460
agcctctggc gggcgtgagg ccacagcggc acgagctggt gccctcacag gcgggagcag 26520
gccctgcctg ggggggtgag ctgggccccc agccctcggg tgcacggcct cagtggaccg 26580
tgcaggtgaa ggcagggctg gcctgcctct ggggtcatag atttggtccc taagtagacc 26640
tccggtttgt gcagttgtcc ccatcctggg aggcagacct gtgagcttcc ccattttaca 26700
gacgaggaaa caggctcaga ggaggcagcc agcagccgga gcccccctcg gctcacaggg 26760
ggccagactg ggacttgaac ttggcctgag tctgggtccc ctctgtggag ggctgggtgg 26820
ccaccccctt gcatcccagc ttcaggtaga aagaggagac cctagggccg ggcacgtgga 26880
ctgcctgaat ggctgctctg ttctcnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 26940
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27000
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27060
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27420
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27480
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27540
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27600
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27660
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27720
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27780
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27840
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27900
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 27960
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28020
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28080
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28140
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28200
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28260
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28320
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28380
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28440
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28500
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28560
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28620
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28680
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28740
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnatacagt ccacaccatc atatacacac 28800
acatccgtac agtccacacc atatacacac ccatacagtc cacaccgtca caaatacaca 28860
caaatacatc catacattcc acaccatcac atacacaccc atccatacag tccacactgt 28920
cacacataca aacacatcca tacagtccac accatcacac acacacctat acggtccaca 28980
ccatcacaca tacattcatg cagtccacac tgacacacac agtcgataca gtccacactg 29040
tcacacacac aatcgatacc acaccgtcac acacacaaat tgatacagac cacagtgaca 29100
cacacacaca atcgatacca caccgtcaca cacagtctac agtacacggt cacacacaca 29160
atctatatag tctacactat cacacatcca tacagtccac accgtcacac atccatacag 29220
tccacacggt cacacataca cacacacatc catacagtcc acattcacgt atgcccacat 29280
gcatccacac atggatgcac acatacactc acgtgtgcgc ttgtacacat gcatccatgc 29340
acacgtgtgc acacatgcac agatacactc acatccccac acaaacatgc atgcacacct 29400
ggaggtgccc agaggggcag ggagggccgg acccctgcag cccccacatc ccctgctctt 29460
gtgggtggtt gggggccact ggttttgtgc atccttgccc caccacccct ggcggtgccg 29520
tgcgcatgac ctgccgggga tcagcagctg caggagcctg aggccagggg agggaattca 29580
gggcccctgg accctgtagt cggggcgtga agctgctctt gcagagagca gtgggaagtg 29640
cctggcggca tccaggagga atggagggct ggggagttgg gggggcgggg cacccccagc 29700
cgcatcatca gctgtccgcc tcgccccagg ctcctctcga agatcctgag cgagtgtgag 29760
gacgccgacg agatcgagta cctggtggac ggttcgtggt gcccaatccg cgccgaaaag 29820
gagcgcagct gcagcccgca gggcgccatc ctcgtgctgg gtgagtgcct cgccaccacc 29880
aaccgcgcag tccccagcca gggcagcctc agtttcccca tttatcagtg gttgcatcct 29940
aagtacctgc accctgtcgc tgtcacccgc aggcccctcg gatgccaatg ggctcctgcc 30000
tgcccccagc gtcaacggga gcggtgccct gggcagcacg ggtggcggcg gcccggtgag 30060
cggcgtggag aatggaaagc cgggcgccga cgtggtggac ctcacgctgg acagctcatc 30120
gtcctcagag gatgaggagg aagaggaaga ggaggaggag gaggacgacg aagagggccc 30180
ccggcccaag cgccgctgcc ccttccagaa gggcctggtg ccggcctgct gaccccggcc 30240
gcacactcga ctttcctggt gctcaccacg cagaggggcg cgggccagcc tcaggcacag 30300
agggaggagt gacctttctt gttctttttc ttgtcgttcc ttttgttttt ccaccccttt 30360
gcctggctcc tggcacctgt acctctggac tctcctatgg gggattaaaa aaaaagtaaa 30420
atgacaaaaa aagatacaaa aaagaaaaa 30449
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 4
gtccacaccg tcacacatcc 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸基序
<400> 5
gcgggtgtgt gtgatggtat 20
<210> 6
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸基序
<400> 6
gcgggtgtgt gtgatggt 18
<210> 7
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸基序
<400> 7
cgggtgtgtg tgatgg 16
<210> 8
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸基序
<400> 8
cgggtgtgtg tgat 14
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸基序
<400> 9
ggatgtgtga cggtgtggac 20
<210> 10
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸基序
<400> 10
atgtgtgacg gtgtggac 18
<210> 11
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸基序
<400> 11
ggatgtgtga cggtgt 16
<210> 12
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸基序
<400> 12
ggatgtgtga cggt 14
<210> 13
<211> 566
<212> DNA
<213> 人工序列
<220>
<223> 靶位点序列
<400> 13
gtccacaccg tcacacatcc gtacagtcca caccgtcata caaacacaca cacatctata 60
cagtccacac cgtcacacat ccatacagtc cacactgtca tacacacaca catctataca 120
gtccacacca tcacatgcac acacatctat atggtctaca ccgtcacaca cacacacatc 180
tatacagtcc acacctgtta catgcacaca tctatacagt ccacaccgtc acacatctat 240
acagtccaca ccgtcataca cacacacgtc tatacagtcc acactgtcac acatccgtac 300
agtccacact gtcatacaaa cacacacaca tctatacggt ccacaccgtc acacatccat 360
acagtccaca ccgtcataca aacacacaca catctataca gtccacacct gttacatgca 420
cacatctata cagtccacac cgtcacacat ccatacagtc cacaccgtca tacacacaca 480
catctataca gtccacaccg tctcacatct atacagtcca cactgtcata cacacacatc 540
tatacagtcc acaccgtcac acatcc 566

Claims (24)

1.一种长度为10至50个核苷酸的反义寡核苷酸,其包含与选自由SEQ ID NO:1和3,或其天然发生变体组成的组的哺乳动物PIAS4靶核酸具有至少90%互补性,诸如完全互补的长度为10至30个核苷酸的连续核苷酸序列,其中该反义寡核苷酸能够降低细胞中该哺乳动物PIAS4靶核酸的表达。
2.依照权利要求1的反义寡核苷酸,其中该连续核苷酸序列与SEQ ID NO:1的PIAS4靶核酸中存在的内含子区至少90%互补,诸如完全互补。
3.依照权利要求1或2的反义寡核苷酸,其中该连续核苷酸序列与选自SEQ ID NO:1的位置143-5277;SEQ ID NO:1的位置5705-16390;SEQ ID NO:1的位置16476-20500;SEQ IDNO:1的位置20543-20864;SEQ ID NO:1的位置20956-21074;SEQ ID NO:1的位置21204-21285;SEQ ID NO:1的位置21390-25454;SEQ ID NO:1的位置25529-25774;SEQ ID NO:1的位置25936-29728;或SEQ ID NO:1的位置29860-29970的PIAS4的内含子区至少90%互补,诸如完全互补。
4.依照权利要求1-3任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ ID NO:1的位置25936-29728至少90%互补,诸如完全互补。
5.依照权利要求1-4任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ ID NO:4或SEQ ID NO:13至少90%互补,诸如完全互补。
6.依照权利要求1-5任一项的反义寡核苷酸,其中该连续核苷酸序列与选自由SEQ IDNO:1的位置28478-28497,28540-28559,28816-28835,28910-28929,29024-29043;28478-28495,28540-28557,28696-28713,28816-28833,28910-28927,29024-29041;28482-28497,28544-28559,28820-28835,28914-28929,29028-29043;28484-28497,28546-28559,28822-28835,28916-28929,29030-29043;28142-28161,28144-28161,28145-28160,28147-28160组成的组的SEQ ID NO:1的靶区至少90%互补,诸如完全互补。
7.依照权利要求1-6任一项的反义寡核苷酸,其中该连续核苷酸序列与SEQ ID NO:1的靶核酸的长度为10-22个,诸如14-20个核苷酸的靶区至少90%互补,诸如完全互补,其中该靶区跨越该靶核酸重复至少5次。
8.依照权利要求1-7任一项的反义寡核苷酸,其中该连续核苷酸序列与选自由SEQ IDNO:9,10,11和12组成的组的序列至少90%同一,诸如100%同一。
9.依照权利要求1-8任一项的反义寡核苷酸,其中该连续核苷酸序列由选自由SEQ IDNO:9,10,11和12组成的组的序列组成或构成。
10.权利要求1-9任一项的反义寡核苷酸,其中该连续核苷酸序列包含一个或多个2’糖修饰的核苷。
11.权利要求10的反义寡核苷酸,其中该一个或多个2’糖修饰的核苷独立选自由2’-O-烷基-RNA,2’-O-甲基-RNA,2’-烷氧基-RNA,2’-O-甲氧基乙基-RNA,2’-氨基-DNA,2’-氟-DNA,阿拉伯糖核酸(ANA),2’-氟-ANA和LNA核苷组成的组。
12.权利要求10或11的反义寡核苷酸,其中该一个或多个修饰的核苷是LNA核苷。
13.权利要求1-12任一项的反义寡核苷酸,其中该连续核苷酸序列包含至少一个修饰的核苷间连接。
14.权利要求13的反义寡核苷酸,其中该连续核苷酸序列内至少50%,诸如至少75%,诸如至少90%,诸如所有的核苷间连接是硫代磷酸酯核苷间连接。
15.权利要求1-14任一项的反义寡核苷酸,其中该连续寡核苷酸能够募集RNA酶H。
16.权利要求1-15的反义寡核苷酸,其中该反义寡核苷酸或其连续核苷酸序列由式5’-F-G-F’-3’的缺口体组成或构成,其中F和F’区独立包含1-8个核苷,其中1-4个是2’糖修饰的且定义该F和F’区的5’和3’端,且G是能够募集RNA酶H的介于6和16个核苷之间的区域,诸如包含6-16个DNA核苷的区域。
17.权利要求1-16任一项的反义寡核苷酸,其中该反义寡核苷酸或其连续核苷酸序列选自由GgatgtgtgacggtgtggAC(化合物9_1);ATgtgtgacggtgtgGAC(化合物10_1);GGATgtgtgacggtGT(化合物11_1);GGATgtgtgacGGT(化合物12_1)组成的组;其中大写字母代表LNA核苷,诸如β-D-氧基LNA核苷,小写字母代表DNA核苷,任选地,所有LNA C是5-甲基胞嘧啶,且至少一个,优选所有核苷间连接是硫代磷酸酯核苷间连接。
18.一种缀合物,其包含依照权利要求1-17任一项的反义寡核苷酸,和至少一个共价附着至所述寡核苷酸的缀合物模块。
19.依照权利要求1-17任一项的反义寡核苷酸或依照权利要求18的缀合物的药学可接受盐。
20.一种药学组合物,其包含权利要求1-17任一项的反义寡核苷酸或权利要求18的缀合物或权利要求19的药学可接受盐,和药学可接受稀释剂,溶剂,载剂,盐和/或佐剂。
21.一种用于抑制表达哺乳动物PIAS4的靶细胞中的该哺乳动物PIAS4表达的体内或体外方法,所述方法包含以有效量将权利要求1-17任一项的反义寡核苷酸,依照权利要求18的缀合物,权利要求19的药学可接受盐或权利要求20的药学组合物施用于所述细胞。
22.权利要求1-17任一项的反义寡核苷酸,依照权利要求18的缀合物,权利要求19的药学可接受盐或权利要求20的药学组合物,其供药物中使用。
23.权利要求1-17任一项的反义寡核苷酸,依照权利要求18的缀合物,权利要求19的药学可接受盐或权利要求20的药学组合物,其供治疗或预防肝纤维化或癌症,诸如胰腺癌和乳腺癌中使用。
24.权利要求任一项的反义寡核苷酸,依照权利要求18的缀合物,权利要求19的药学可接受盐或权利要求20的药学组合物用于制备用于治疗或预防肝纤维化或癌症,诸如胰腺癌和乳腺癌的药物的用途。
CN201980006014.5A 2018-01-10 2019-01-08 用于调控pias4表达的寡核苷酸 Pending CN111699258A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18151034.8 2018-01-10
EP18151034 2018-01-10
PCT/EP2019/050279 WO2019137883A1 (en) 2018-01-10 2019-01-08 Oligonucleotides for modulating pias4 expression

Publications (1)

Publication Number Publication Date
CN111699258A true CN111699258A (zh) 2020-09-22

Family

ID=60953790

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980006014.5A Pending CN111699258A (zh) 2018-01-10 2019-01-08 用于调控pias4表达的寡核苷酸

Country Status (5)

Country Link
US (1) US20210095274A1 (zh)
EP (1) EP3737758A1 (zh)
JP (1) JP2021511022A (zh)
CN (1) CN111699258A (zh)
WO (1) WO2019137883A1 (zh)

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69233046T2 (de) 1991-10-24 2004-03-04 Isis Pharmaceuticals, Inc., Carlsfeld Derivatisierte oligonukleotide mit verbessertem aufnahmevermögen
JP3756313B2 (ja) 1997-03-07 2006-03-15 武 今西 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体
EP1557424A1 (en) 1997-09-12 2005-07-27 Exiqon A/S Bi-cyclic nucleoside, nucleotide and oligonucleoide analogues
BRPI0008131B8 (pt) 1999-02-12 2021-05-25 Daiichi Sankyo Co Ltd composto ou um sal deste, análogo de oligonucleotídeo, composição farmacêutica, sonda para um gene,iniciador para começar a amplificação, uso de um análogo de oligonucleotídeo ou de um sal deste farmacologicamente aceitável, agente antisentido, e, agente antígeno
NZ514348A (en) 1999-05-04 2004-05-28 Exiqon As L-ribo-LNA analogues
US6617442B1 (en) 1999-09-30 2003-09-09 Isis Pharmaceuticals, Inc. Human Rnase H1 and oligonucleotide compositions thereof
DK1569661T3 (da) 2002-11-18 2010-01-11 Santaris Pharma As Antisense design
CN101437834B (zh) * 2004-07-19 2012-06-06 贝勒医学院 细胞因子信号转导调节剂的调节和用于免疫治疗的应用
WO2007031091A2 (en) 2005-09-15 2007-03-22 Santaris Pharma A/S Rna antagonist compounds for the modulation of p21 ras expression
DK1984381T3 (da) 2006-01-27 2010-11-01 Isis Pharmaceuticals Inc 6-modificerede bicycliske nukleinsyreanaloger
WO2007143315A2 (en) 2006-05-05 2007-12-13 Isis Pharmaceutical, Inc. Compounds and methods for modulating expression of pcsk9
US7666854B2 (en) 2006-05-11 2010-02-23 Isis Pharmaceuticals, Inc. Bis-modified bicyclic nucleic acid analogs
CA2651453C (en) 2006-05-11 2014-10-14 Isis Pharmaceuticals, Inc. 5'-modified bicyclic nucleic acid analogs
JP5665317B2 (ja) 2006-10-18 2015-02-04 アイシス ファーマシューティカルズ, インコーポレーテッド アンチセンス化合物
WO2008113832A2 (en) 2007-03-22 2008-09-25 Santaris Pharma A/S SHORT RNA ANTAGONIST COMPOUNDS FOR THE MODULATION OF TARGET mRNA
US8278425B2 (en) 2007-05-30 2012-10-02 Isis Pharmaceuticals, Inc. N-substituted-aminomethylene bridged bicyclic nucleic acid analogs
DK2173760T4 (en) 2007-06-08 2016-02-08 Isis Pharmaceuticals Inc Carbocyclic bicyclic nukleinsyreanaloge
US8278283B2 (en) 2007-07-05 2012-10-02 Isis Pharmaceuticals, Inc. 6-disubstituted or unsaturated bicyclic nucleic acid analogs
US8546556B2 (en) 2007-11-21 2013-10-01 Isis Pharmaceuticals, Inc Carbocyclic alpha-L-bicyclic nucleic acid analogs
US8501805B2 (en) 2008-09-24 2013-08-06 Isis Pharmaceuticals, Inc. Substituted alpha-L-bicyclic nucleosides
EP2462153B1 (en) 2009-08-06 2015-07-29 Isis Pharmaceuticals, Inc. Bicyclic cyclohexose nucleic acid analogs
US8846637B2 (en) 2010-06-08 2014-09-30 Isis Pharmaceuticals, Inc. Substituted 2′-amino and 2′-thio-bicyclic nucleosides and oligomeric compounds prepared therefrom
EP3467109A1 (en) 2011-02-08 2019-04-10 Ionis Pharmaceuticals, Inc. Oligomeric compounds comprising bicyclic nucleotides and uses thereof
WO2013022966A1 (en) 2011-08-11 2013-02-14 Isis Pharmaceuticals, Inc. Linkage modified gapped oligomeric compounds and uses thereof
WO2013033230A1 (en) 2011-08-29 2013-03-07 Isis Pharmaceuticals, Inc. Oligomer-conjugate complexes and their use
SG11201401314PA (en) 2011-09-07 2014-09-26 Marina Biotech Inc Synthesis and uses of nucleic acid compounds with conformationally restricted monomers
WO2013120003A1 (en) 2012-02-08 2013-08-15 Isis Pharmaceuticals, Inc. Modulation of rna by repeat targeting
US9221864B2 (en) 2012-04-09 2015-12-29 Isis Pharmaceuticals, Inc. Tricyclic nucleic acid analogs
KR102112892B1 (ko) 2012-11-15 2020-05-19 로슈 이노베이션 센터 코펜하겐 에이/에스 올리고뉴클레오티드 콘쥬게이트
JP6995478B2 (ja) 2013-05-01 2022-01-14 アイオーニス ファーマシューティカルズ, インコーポレーテッド Hbvおよびttr発現を調節するための組成物および方法
ES2770667T3 (es) 2013-06-27 2020-07-02 Roche Innovation Ct Copenhagen As Oligómeros antisentido y conjugados que se dirigen a PCSK9
US10358643B2 (en) 2014-01-30 2019-07-23 Hoffmann-La Roche, Inc. Poly oligomer compound with biocleavable conjugates
US20180023081A1 (en) 2015-02-04 2018-01-25 Bristol-Myers Squibb Company Lna oligonucleotides with alternating flanks

Also Published As

Publication number Publication date
EP3737758A1 (en) 2020-11-18
US20210095274A1 (en) 2021-04-01
WO2019137883A1 (en) 2019-07-18
JP2021511022A (ja) 2021-05-06

Similar Documents

Publication Publication Date Title
DK2742135T3 (en) BINDING MODIFIED GAPPED OLIGOMERIC COMPOUNDS AND APPLICATIONS THEREOF
KR102391812B1 (ko) B형 간염 감염을 치료하기 위해 PAPD5 또는 PAPD7 mRNA를 감소시키기 위한 핵산 분자
DK2906256T3 (en) SELECTIVE ANTISENSE COMPOUNDS AND APPLICATIONS THEREOF
CN109477106B (zh) 二酰基甘油酰基转移酶2(dgat2)的调节剂
US20040180847A1 (en) Antisense modulation of kinesin-like 1 expression
US20040266714A1 (en) Modulation of glucagon receptor expression
KR20060116848A (ko) Stat3 발현의 안티센스 올리고뉴클레오티드 조절
RU2766360C2 (ru) МОЛЕКУЛЫ НУКЛЕИНОВЫХ КИСЛОТ ДЛЯ УМЕНЬШЕНИЯ УРОВНЯ мРНК PAPD5 ИЛИ PAPD7 ДЛЯ ЛЕЧЕНИЯ ИНФЕКЦИОННОГО ГЕПАТИТА В
AU2023202255A1 (en) Oligonucleotides for modulating Tau expression
CN111655851A (zh) 靶向srebp1的反义寡核苷酸
KR20210033004A (ko) Rtel1의 발현을 조절하기 위한 올리고뉴클레오티드
US20040110150A1 (en) Modulation of Ephrin-B2 expression
US20040063129A1 (en) Antisense modulation of PPAR-delta expression
KR20200015608A (ko) Htra1 발현을 조절하기 위한 안티센스 올리고뉴클레오티드
US20040092465A1 (en) Modulation of huntingtin interacting protein 1 expression
US20040115640A1 (en) Modulation of angiopoietin-2 expression
US20040115634A1 (en) Modulation of stat 6 expression
US6828151B2 (en) Antisense modulation of hematopoietic cell protein tyrosine kinase expression
US20040014051A1 (en) Antisense modulation of breast cancer-1 expression
CN111699258A (zh) 用于调控pias4表达的寡核苷酸
US20040110143A1 (en) Modulation of fetoprotein transcription factor expression
US20040102390A1 (en) Modulation of Notch3 expression
US20040115636A1 (en) Modulation of interleukin 18 expression
US20040115637A1 (en) Modulation of PPAR-alpha expression
US20040101855A1 (en) Modulation of PPAR binding protein expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40038068

Country of ref document: HK