CN117795071A - 用于通过肝配蛋白-b2抑制防止由内皮功能障碍导致的肾功能障碍的反义寡核苷酸 - Google Patents

用于通过肝配蛋白-b2抑制防止由内皮功能障碍导致的肾功能障碍的反义寡核苷酸 Download PDF

Info

Publication number
CN117795071A
CN117795071A CN202280054813.1A CN202280054813A CN117795071A CN 117795071 A CN117795071 A CN 117795071A CN 202280054813 A CN202280054813 A CN 202280054813A CN 117795071 A CN117795071 A CN 117795071A
Authority
CN
China
Prior art keywords
seq
antisense oligonucleotide
nucleotides
region
lna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280054813.1A
Other languages
English (en)
Inventor
M·中山
T·铺田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Max Planck Gesellschaft zur Foerderung der Wissenschaften eV
Original Assignee
Max Planck Gesellschaft zur Foerderung der Wissenschaften eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Max Planck Gesellschaft zur Foerderung der Wissenschaften eV filed Critical Max Planck Gesellschaft zur Foerderung der Wissenschaften eV
Publication of CN117795071A publication Critical patent/CN117795071A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/313Phosphorodithioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/323Chemical structure of the sugar modified ring structure
    • C12N2310/3231Chemical structure of the sugar modified ring structure having an additional ring, e.g. LNA, ENA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/33Chemical structure of the base
    • C12N2310/334Modified C
    • C12N2310/33415-Methylcytosine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/34Spatial arrangement of the modifications
    • C12N2310/341Gapmers, i.e. of the type ===---===
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/34Spatial arrangement of the modifications
    • C12N2310/346Spatial arrangement of the modifications having a combination of backbone and sugar modifications

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Saccharide Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交的反义寡核苷酸,以及所述反义寡核苷酸的盐和光学异构体,其用于防止由内皮功能障碍导致的肾功能障碍。

Description

用于通过肝配蛋白-B2抑制防止由内皮功能障碍导致的肾功 能障碍的反义寡核苷酸
技术领域
本发明涉及能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交的反义寡核苷酸,以及所述反义寡核苷酸的盐和光学异构体,其用于防止由内皮功能障碍导致的肾功能障碍。
背景技术
终末期肾病(ESRD)是一个世界性的公共卫生问题,给医疗卫生系统带来了巨大的经济负担。已知内皮功能障碍诱导肾脏中的通常还伴有足细胞足突消失的微血管病变,这是肾病的关键过程。在发达国家和发展中国家,糖尿病是微血管病变的主要原因,并导致ESRD。糖尿病中的高血糖导致许多并发症,例如高血压和肾病。在这种情况下,高血压是驱动糖尿病中的微血管功能障碍发展的主要致病因素。在肾脏中,血压升高减弱血液与尿液间隙之间的肾小球过滤屏障,导致蛋白尿,这是发展ESRD的主要风险。糖尿病肾病中受损的肾脏过滤功能是肾衰竭的主要原因。
肾小球是血液与泌尿腔(urinary space)之间的特化过滤屏障,由足细胞、肾小球基底膜(GBM)和窗孔肾小球内皮细胞(GEC)组成。健康足细胞足突的形态对肾脏过滤功能至关重要。在大多数蛋白尿疾病(包括糖尿病肾病)中都观察到足突的消失。
近期的研究表明,肾病蛋白(nephrin)(定位于足突的裂隙隔膜的跨膜蛋白)和肾病蛋白磷酸化对维持足细胞足突具有重要意义。已知肾病蛋白表达减少和肾病蛋白磷酸化导致以病理性足突重塑为特征的肾功能障碍。肾病蛋白的缺失导致足细胞消失并引起蛋白尿,这在ESRD的发作中很常见。在糖尿病中,高血糖引起内皮功能障碍,导致足突消失,表明从内皮细胞(EC)到足细胞的细胞通讯对疾病的发展至关重要。然而,尚不清楚横跨肾小球基底膜(GBM)连接内皮细胞与足细胞的分子连接。
目前对于糖尿病肾病的治疗选择限于控制血压和血糖水平。糖尿病中的高血压被认为导致微血管功能障碍(包括肾小球),从而导致蛋白尿。然而,这些治疗的效果有限。
国际专利申请WO2004/080418A2公开了用于治疗癌症或血管生成相关疾病的用于抑制肝配蛋白(Ephrin)B2或EphB4表达的核酸化合物(例如反义寡核苷酸(ASO))。国际专利申请WO2007/038395A2公开了用于治疗病毒感染的用于抑制肝配蛋白B2或EphB4表达的核酸化合物(例如反义寡核苷酸(ASO))。为了研究ASO对肝配蛋白B2表达的抑制作用,将肝配蛋白B2转录本的蛋白质编码区的核苷酸序列细分为20个连续核苷酸的区段,并且测试了靶向肝配蛋白B2转录本的蛋白质编码区的每个所述区段的由20个核苷酸组成的51种反义寡核苷酸(ASO)。在这51种反义寡核苷酸(ASO)中,靶向蛋白质编码区的第1至第262位核苷酸内的区段的8种ASO具有最强的抑制性作用。
美国专利申请US2004/110150A1涉及用于调节肝配蛋白B2表达的化合物、组合物和方法,并公开了长度为20个核苷酸的反义寡核苷酸,由十个2’-脱氧核苷酸组成的中央“缺口”区构成,两侧侧翼是由2’甲氧基乙基核苷酸构成的五核苷酸翼。美国专利申请US2004/110150A1公开了靶向基因组序列的不同区域和肝配蛋白B2转录本的不同区域(例如与肝配蛋白B2转录本的3’非翻译区(UTR)或蛋白质编码区相对应的区域,以及其他区域例如内含子区域或内含子:外显子接合、起始密码子或终止密码子)的反义寡核苷酸。在反义寡核苷酸(ASO)中,靶向蛋白质编码区的第1至第262个核苷酸内的区段、3’UTR的第510至第900个核苷酸内、第1475至第1490个核苷酸内、第1755至第1775个核苷酸内、第1937至第1957个核苷酸内和第2420至第2440个核苷酸内的区段的ASO导致最强的抑制性作用。
本发明的目的是提供药学活性剂,特别是用于治疗伴有足细胞足突消失的肾病,例如糖尿病肾病,以及包含至少一种这些化合物作为药学活性成分的组合物。本申请的目的还在于提供用于控制足细胞中的肾病蛋白功能的药学活性化合物。
本发明的目的通过独立权利要求的教导得以解决。本发明的进一步的优势特征、方面和细节从本申请的从属权利要求、说明书、附图和实施例中将是明显的。
发明简述
本发明涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.IDNo.1)、AAATGCCTTGCTTGTA(Seq.IDNo.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.IDNo.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。
本发明的一个重要方面是,用于预防和治疗肾病和/或糖尿病蛋白尿和/或糖尿病肾病的本文所述的反义寡核苷酸的靶序列位于编码Efnb2的基因的区域或编码Efnb2的mRNA的区域内,所述区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。这种靶序列特别具有优势,因为它们在两个物种之间表现出重要的交叉反应性。本发明的反义寡核苷酸由10至28个核苷酸组成。在人和小鼠之间100%保守的至少28个连续核苷酸的序列的优势在于,最大长度为28个核苷酸的ASO可以在整个长度上与100%保守的序列杂交。
反义寡核苷酸包含能够与序列AATTCAGCCCTAACCT(Seq.IDNo.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列已被发现对于在内皮细胞中抑制肝配蛋白-B2表达特别具有优势。令人惊讶的是,经证实,本发明的反义寡核苷酸对于恢复肾病蛋白表达和磷酸化以及恢复足细胞足突消失具有治疗效果。令人惊讶的是,本发明的反义寡核苷酸的效果远远强于目前用于治疗伴有足细胞足突消失的肾病的一线药物。
优选地,编码Efnb2的基因的区域或编码Efnb2的mRNA的区域位于编码Efnb2的基因或编码Efnb2的mRNA的蛋白质编码区内。优选地,编码Efnb2的基因的区域或编码Efnb2的mRNA的区域位于编码Efnb2的基因或编码Efnb2的mRNA的开放阅读框内。优选地,编码Efnb2的基因的区域或编码Efnb2的mRNA的区域位于编码Efnb2的mRNA的3’非翻译区(UTR)内。
当反义寡核苷酸靶向位于在人类和小鼠之间100%保守的至少28个连续核苷酸的序列区域内的序列AATTCAGCCCTAACCT(Seq.IDNo.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)时,含有LNA(锁核酸)的反义寡核苷酸经证实对于提供对所需的对肝配蛋白B2表达的抑制作用而言尤为重要。因此,根据本发明,10至28个核苷酸中的至少两个是LNA。进一步优选的是,10至28个核苷酸中的至少四个是LNA。在优选的实施方案中,所述反义寡核苷酸具有在3’末端有1至5个LNA单元和在5’末端有1至5个LNA单元的gapmer结构。
在优选的实施方案中,所述反义寡核苷酸选择性地仅与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交。在进一步优选的实施方案中,所述反义寡核苷酸选择性地仅与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列AAATGCCTTGCTTGTA(Seq.IDNo.2)杂交。在进一步优选的实施方案中,所述反义寡核苷酸选择性地仅与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列CTGAATTTTGCAATGT(Seq.ID No.3)杂交。
在优选的实施方案中,本发明的反义寡核苷酸与本文所述的编码Efnb2的基因的区域或编码Efnb2的mRNA的区域以100%的互补性结合,并且不与人类转录组中的任何其他区域结合。
在优选的实施方案中,所述反义寡核苷酸由序列AGGTTAGGGCTGAATT(Seq.IDNo.4)的10至16个核苷酸的序列组成,所述序列与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列AATTCAGCCCTAACCT(Seq.ID No.1)互补。优选地,所述反义寡核苷酸由选自以下的序列AGGTTAGGGCTGAATT的10至16个核苷酸的序列组成:
Seq ID No. L 序列,5'-3' Seq ID No. L 序列,5'-3'
8 10 AGGTTAGGGC 33 11 AGGTTAGGGCT
9 10 GGTTAGGGCT 21 11 GGTTAGGGCTG
10 10 GTTAGGGCTG 22 11 GTTAGGGCTGA
11 10 TTAGGGCTGA 23 11 TTAGGGCTGAA
12 10 TAGGGCTGAA 24 11 TAGGGCTGAAT
13 10 AGGGCTGAAT 25 11 AGGGCTGAATT
14 10 GGGCTGAATT 26 13 AGGTTAGGGCTGA
15 12 AGGTTAGGGCTG 27 13 GGTTAGGGCTGAA
16 12 GGTTAGGGCTGA 28 13 GTTAGGGCTGAAT
17 12 GTTAGGGCTGAA 29 13 TTAGGGCTGAATT
18 12 TTAGGGCTGAAT 30 14 AGGTTAGGGCTGAA
36 12 TAGGGCTGAATT 31 14 GGTTAGGGCTGAAT
19 15 AGGTTAGGGCTGAAT 32 14 GTTAGGGCTGAATT
20 15 GGTTAGGGCTGAATT 4 16 AGGTTAGGGCTGAATT
在优选的实施方案中,所述反义寡核苷酸由TACAAGCAAGGCATTT(Seq.ID No.5)的10至16个核苷酸的序列组成,所述序列与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列AAATGCCTTGCTTGTA(Seq.ID No.2)互补。优选地,所述反义寡核苷酸由选自以下的TACAAGCAAGGCATTT序列的10至16个核苷酸的序列组成:
在优选的实施方案中,所述反义寡核苷酸由ACATTGCAAAATTCAG(Seq.ID No.6)的10至16个核苷酸的序列组成,所述序列与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列CTGAATTTTGCAATGT(Seq.ID No.3)互补。优选地,所述反义寡核苷酸由选自以下的序列ACATTGCAAAATTCAG的10至16个核苷酸的序列组成:
本发明的反义寡核苷酸特别适用于作为药物活性剂用于抑制肝配蛋白-B2的功能或分泌,提供肾脏保护作用。因此,本发明的反义寡核苷酸适用于控制肾病蛋白功能,优选用于预防和治疗糖尿病蛋白尿和/或糖尿病肾病。
本发明进一步涉及药物组合物,其含有至少一种反义寡核苷酸以及至少一种药学上可接受的载体、赋形剂、佐剂、溶剂或稀释剂。
本发明进一步涉及治疗患有选自肾病和/或糖尿病蛋白尿和/或糖尿病肾病的疾病的动物(或人或患者)的方法,包括向所述动物施用治疗或预防有效量的至少一种本发明的反义寡核苷酸或根据本发明的药物组合物。
本发明进一步涉及抑制细胞或组织中的肝配蛋白-B2表达的方法,包括用有效量的至少一种根据本发明的反义寡核苷酸孵育所述细胞或组织。
本发明进一步涉及恢复细胞或组织中的肾病蛋白功能的方法,包括用有效量的至少一种本发明的反义寡核苷酸孵育所述细胞或组织。
发明内容
令人惊讶的是,经证实,抑制内皮细胞中的肝配蛋白-B2显著恢复由肾病蛋白表达下降引起的足细胞足突消失和肾功能。
EphB受体酪氨酸激酶及其跨膜配体肝配蛋白-B2介导细胞间接触依赖性信号转导,从而调节多种不同细胞类型和组织中的细胞迁移和细胞骨架组织化。肝配蛋白-B2的结合诱导EphB受体聚集和自动磷酸化,导致表达EphB的细胞中的下游信号激活(称为“正向信号转导”)。与此同时,肝配蛋白-B2的胞质尾部通过其C末端的PDZ结合基序或酪氨酸残基的磷酸化参与“反向信号转导”。在血管系统中,肝配蛋白-B2控制VEGF受体运输和下游信号转导,从而调节血管生成过程中的内皮出芽行为。在成熟组织中,肝配蛋白-B2是动脉EC和动脉衍生EC(包括肾小球内皮细胞(GEC))的标志物。然而,肝配蛋白-B2在成熟内皮细胞(EC)中的作用尚不清楚。
发明人惊奇地发现,由细胞外囊泡(例如外泌体)介导的细胞间接触非依赖性的肝配蛋白-B2/EphB4正向信号转导在从内皮细胞(EC)到足细胞的细胞通讯中起着关键作用。
已经发现这一信号转导通路在糖尿病病况下被过度激活。该通路在糖尿病中被过度激活而导致足细胞足突消失,并且已经发现通过细胞类型特异性基因缺失抑制肝配蛋白-B2/EphB4可以防止小鼠中的肾小球功能障碍。在肝配蛋白-B2内皮特异性诱导型敲除小鼠和EphB4足细胞特异性诱导型敲除小鼠中,糖尿病小鼠的蛋白尿和足细胞消失均可恢复。
令人惊讶的是,已经发现能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交的反义寡核苷酸以及所述反义寡核苷酸的盐和光学异构体可解决上述目标。
因此,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.IDNo.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的序列,以及所述反义寡核苷酸的盐和光学异构体。
优选地,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.IDNo.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体。
更优选地,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.IDNo.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。
略作改动,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的外显子区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。
反义寡核苷酸包含能够与序列AATTCAGCCCTAACCT(Seq.IDNo.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列已被发现对于在内皮细胞中抑制肝配蛋白-B2表达特别具有优势。令人惊讶的是,已经发现本发明的反义寡核苷酸对于恢复肾病蛋白表达和磷酸化以及恢复足细胞足突消失具有治疗效果。令人惊讶的是,本发明的反义寡核苷酸的效果远远强于目前用于治疗伴有足细胞足突消失的肾病的一线药物。
因此,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.IDNo.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列,并且其中所述反义寡核苷酸抑制内皮细胞中的肝配蛋白-B2表达。
因此,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.IDNo.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列,并且其中所述反义寡核苷酸恢复肾病蛋白表达。优选地,其中所述反义寡核苷酸恢复肾病蛋白表达和磷酸化。更优选地,其中所述反义寡核苷酸恢复足细胞中的肾病蛋白表达和磷酸化。
因此,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.IDNo.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列,并且其中所述反义寡核苷酸恢复肾病蛋白表达。优选地,其中所述反义寡核苷酸恢复肾病蛋白表达和磷酸化。更优选地,其中所述反义寡核苷酸恢复足细胞中的肾病蛋白表达和磷酸化。优选地,其中所述反义寡核苷酸增加肾病蛋白表达。优选地,其中所述反义寡核苷酸增加肾病蛋白表达和磷酸化。更优选地,其中所述反义寡核苷酸增加足细胞中的肾病蛋白表达和磷酸化。
因此,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.IDNo.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列,并且其中所述反义寡核苷酸恢复足细胞足突消失。
更优选地,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列,其中所述反义寡核苷酸抑制内皮细胞中的肝配蛋白-B2表达,并且其中所述反义寡核苷酸恢复足细胞足突消失。
更优选地,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列,其中所述反义寡核苷酸抑制内皮细胞中的肝配蛋白-B2表达,并且其中所述反义寡核苷酸恢复肾病蛋白表达。优选地,其中所述反义寡核苷酸恢复肾病蛋白表达和磷酸化。更优选地,其中所述反义寡核苷酸恢复足细胞中的肾病蛋白表达和磷酸化。优选地,其中所述反义寡核苷酸增加肾病蛋白表达。优选地,其中所述反义寡核苷酸增加肾病蛋白表达和磷酸化。更优选地,其中所述反义寡核苷酸增加足细胞中的肾病蛋白表达和磷酸化。
更优选地,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和动物之间100%保守的至少28个连续核苷酸的序列,其中所述反义寡核苷酸恢复足细胞足突消失,并且其中所述反义寡核苷酸恢复肾病蛋白表达。优选地,其中所述反义寡核苷酸恢复肾病蛋白表达和磷酸化。更优选地,其中所述反义寡核苷酸恢复足细胞中的肾病蛋白表达和磷酸化。优选地,其中所述反义寡核苷酸增加肾病蛋白表达。优选地,其中所述反义寡核苷酸增加肾病蛋白表达和磷酸化。更优选地,其中所述反义寡核苷酸增加足细胞中的肾病蛋白表达和磷酸化。
最优选地,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)、AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列,其中所述反义寡核苷酸抑制内皮细胞中的肝配蛋白-B2表达,其中所述反义寡核苷酸恢复足细胞足突消失,并且其中所述反义寡核苷酸恢复肾病蛋白表达。优选地,其中所述反义寡核苷酸恢复肾病蛋白表达和磷酸化。更优选地,其中所述反义寡核苷酸恢复足细胞中的肾病蛋白表达和磷酸化。优选地,其中所述反义寡核苷酸增加肾病蛋白表达。优选地,其中所述反义寡核苷酸增加肾病蛋白表达和磷酸化。更优选地,其中所述反义寡核苷酸增加足细胞中的肾病蛋白表达和磷酸化。
优选地,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体;并且其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。优选地,其中所述反义寡核苷酸抑制内皮细胞中的肝配蛋白-B2的表达。优选地,其中所述反义寡核苷酸恢复足细胞足突消失。优选地,其中所述反义寡核苷酸恢复肾病蛋白表达。优选地,其中所述反义寡核苷酸恢复肾病蛋白表达和磷酸化。优选地,其中所述反义寡核苷酸恢复足细胞中的肾病蛋白表达和磷酸化。优选地,其中所述反义寡核苷酸增加肾病蛋白表达。优选地,其中所述反义寡核苷酸增加肾病蛋白表达和磷酸化。更优选地,其中所述反义寡核苷酸增加足细胞中的肾病蛋白表达和磷酸化。
更优选地,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体;并且其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列,其中所述反义寡核苷酸抑制内皮细胞中的肝配蛋白-B2表达,其中所述反义寡核苷酸恢复足细胞足突消失,并且其中所述反义寡核苷酸恢复肾病蛋白表达和磷酸化。
优选地,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AAATGCCTTGCTTGTA(Seq.ID No.2)或CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域位于编码Efnb2的mRNA的3’非翻译区(UTR)内。
本发明涉及由10至28个核苷酸组成的反义寡核苷酸,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的序列,以及所述反义寡核苷酸的盐和光学异构体。
优选地,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。
优选地,其中所述反义寡核苷酸抑制内皮细胞中的肝配蛋白-B2表达。优选地,其中所述反义寡核苷酸恢复足细胞足突消失。优选地,其中所述反义寡核苷酸恢复肾病蛋白表达。优选地,其中所述反义寡核苷酸恢复肾病蛋白表达和磷酸化。优选地,其中所述反义寡核苷酸恢复足细胞中的肾病蛋白表达和磷酸化。优选地,其中所述反义寡核苷酸增加肾病蛋白表达。优选地,其中所述反义寡核苷酸增加肾病蛋白表达和磷酸化。更优选地,其中所述反义寡核苷酸增加足细胞中的肾病蛋白表达和磷酸化。
优选地,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体;并且其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。
换句话说,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的开放阅读框区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的开放阅读框区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体。优选地,编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。
略作改动,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的蛋白质编码区或与编码Efnb2的mRNA的蛋白质编码区杂交,其中编码Efnb2的基因的蛋白质编码区或编码Efnb2的mRNA的蛋白质编码区包含序列AATTCAGCCCTAACCT(Seq.ID No.1),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体。优选地,编码Efnb2的基因的蛋白质编码区或编码Efnb2的mRNA的蛋白质编码区包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。优选地,编码Efnb2的基因的区域或编码Efnb2的mRNA的区域位于编码Efnb2的基因的蛋白质编码区或mRNA的蛋白质编码区内。
优选地,本文所述的反义寡核苷酸选择性地仅与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交。优选地,由10至28个核苷酸组成的反义寡核苷酸(其中10至28个核苷酸中的至少两个是LNA)选择性地仅与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交。
序列AATTCAGCCCTAACCT(Seq.ID No.1)的互补序列是AGGTTAGGGCTGAATT(5’-3’)(Seq.ID No.4)。序列AATTCAGCCCTAACCT(Seq.ID No.1)也以5’-3’方向书写。本发明的优选反义寡核苷酸包含与序列AGGTTAGGGCTGAATT(5’-3’)(Seq.ID No.4)重叠或对应的序列。本发明的反义寡核苷酸由10至28个核苷酸组成,并且优选包含与序列AGGTTAGGGCTGAATT(5’-3’)(Seq.ID No.4)的10个连续核苷酸的序列对应的至少10个连续核苷酸的序列。因此,特别优选包含能够与序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的至少10个连续核苷酸的序列的反义寡核苷酸。因此,根据本发明的反义寡核苷酸至少与序列AATTCAGCCCTAACCT(Seq.ID No.1)内的至少10个连续核苷酸的序列杂交。在优选的实施方案中,所述反义寡核苷酸的至少所述10个连续核苷酸与靶序列AATTCAGCCCTAACCT(Seq.ID No.1)内的区域互补,优选100%互补。
因此,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列,其中至少能够与序列AATTCAGCCCTAACCT(Seq.IDNo.1)杂交的至少10个连续核苷酸的序列与序列AATTCAGCCCTAACCT(Seq.ID No.1)内的区域互补,优选100%互补。
本发明进一步涉及由10至28个核苷酸组成的反义寡核苷酸,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AAATGCCTTGCTTGTA(Seq.ID No.2),并且所述反义寡核苷酸包含能够与所述序列AAATGCCTTGCTTGTA(Seq.ID No.2)杂交的序列,以及所述反义寡核苷酸的盐和光学异构体。
因此,优选地,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AAATGCCTTGCTTGTA(Seq.ID No.2),并且所述反义寡核苷酸包含能够与所述序列AAATGCCTTGCTTGTA(Seq.ID No.2)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。优选地,其中所述反义寡核苷酸抑制内皮细胞中的肝配蛋白-B2表达。优选地,其中所述反义寡核苷酸恢复足细胞足突消失。优选地,其中所述反义寡核苷酸恢复肾病蛋白表达。优选地,其中所述反义寡核苷酸恢复肾病蛋白表达和磷酸化。优选地,其中所述反义寡核苷酸恢复足细胞中的肾病蛋白表达和磷酸化。优选地,其中所述反义寡核苷酸增加肾病蛋白表达。优选地,其中所述反义寡核苷酸增加肾病蛋白表达和磷酸化。更优选地,其中所述反义寡核苷酸增加足细胞中的肾病蛋白表达和磷酸化。
优选地,所述反义寡核苷酸选择性地仅与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列AAATGCCTTGCTTGTA(Seq.ID No.2)杂交。优选地,由10至28个核苷酸组成的反义寡核苷酸(其中10至28个核苷酸中的至少两个是LNA)选择性地仅与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列AAATGCCTTGCTTGTA(Seq.ID No.2)杂交。
序列AAATGCCTTGCTTGTA(Seq.ID No.2)的互补序列是TACAAGCAAGGCATTT(5'-3')(Seq.ID No.5)。序列AAATGCCTTGCTTGTA(Seq.ID No.2)也以5’-3’方向书写。本发明的优选反义寡核苷酸包含与序列TACAAGCAAGGCATTT(5'-3')(Seq.ID No.4)重叠或对应的序列。根据本发明的反义寡核苷酸由10至28个核苷酸组成,并且优选包含与序列TACAAGCAAGGCATTT(5'-3')(Seq.ID No.5)的10个连续核苷酸的序列对应的至少10个连续核苷酸的序列。因此,特别优选包含能够与序列AAATGCCTTGCTTGTA(Seq.ID No.2)杂交的至少10个连续核苷酸的序列的反义寡核苷酸。因此,根据本发明的反义寡核苷酸至少与靶序列AAATGCCTTGCTTGTA(Seq.ID No.2)内的至少10个连续核苷酸的序列杂交。在优选的实施方案中,至少所述10个连续核苷酸与靶序列AAATGCCTTGCTTGTA(Seq.ID No.2)内的区域互补,优选100%互补。
因此,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AAATGCCTTGCTTGTA(Seq.ID No.2),并且所述反义寡核苷酸包含能够与所述序列AAATGCCTTGCTTGTA(Seq.ID No.2)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列,其中至少能够与序列AAATGCCTTGCTTGTA(Seq.IDNo.2)杂交的至少10个连续核苷酸的序列与序列AAATGCCTTGCTTGTA(Seq.ID No.2)内的区域互补,优选100%互补。
因此,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列CTGAATTTTGCAATGT(Seq.ID No.3)杂交的序列,以及所述反义寡核苷酸的盐和光学异构体。
因此,优选地,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。优选地,其中所述反义寡核苷酸抑制内皮细胞中的肝配蛋白-B2表达。优选地,其中所述反义寡核苷酸恢复足细胞足突消失。优选地,其中所述反义寡核苷酸恢复肾病蛋白表达。优选地,其中所述反义寡核苷酸恢复肾病蛋白表达和磷酸化。优选地,其中所述反义寡核苷酸恢复足细胞中的肾病蛋白表达和磷酸化。优选地,其中所述反义寡核苷酸增加肾病蛋白表达。优选地,其中所述反义寡核苷酸增加肾病蛋白表达和磷酸化。更优选地,其中所述反义寡核苷酸增加足细胞中的肾病蛋白表达和磷酸化。
优选地,所述反义寡核苷酸选择性地仅与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列CTGAATTTTGCAATGT(Seq.ID No.3)杂交。优选地,由10至28个核苷酸组成的反义寡核苷酸(其中10至28个核苷酸中的至少两个是LNA)选择性地仅与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列CTGAATTTTGCAATGT(Seq.ID No.3)杂交。
序列CTGAATTTTGCAATGT(Seq.ID No.3)的互补序列是ACATTGCAAAATTCAG(5'-3')(Seq.ID No.6)。序列CTGAATTTTGCAATGT(Seq.ID No.3)也以5’-3’方向书写。本发明的优选反义寡核苷酸包含与序列ACATTGCAAAATTCAG(5'-3')(Seq.ID No.6)重叠或对应的序列。根据本发明的反义寡核苷酸由10至28个核苷酸组成,优选包含与序列ACATTGCAAAATTCAG(5'-3')(Seq.ID No.6)的10个连续核苷酸的序列对应的至少10个连续核苷酸的序列。因此,特别优选包含能够与序列CTGAATTTTGCAATGT(Seq.IDNo.3)杂交的至少10个连续核苷酸的序列的反义寡核苷酸。因此,根据本发明的反义寡核苷酸至少与靶序列CTGAATTTTGCAATGT(Seq.ID No.3)内的至少10个连续核苷酸的序列杂交。在优选的实施方案中,至少所述10个连续核苷酸与靶序列CTGAATTTTGCAATGT(Seq.ID No.3)内的区域互补,优选100%互补。
因此,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列CTGAATTTTGCAATGT(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列CTGAATTTTGCAATGT(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列,其中至少能够与序列CTGAATTTTGCAATGT(Seq.IDNo.3)杂交的至少10个连续核苷酸的序列与序列CTGAATTTTGCAATGT(Seq.ID No.3)内的区域互补,优选100%互补。
尽管已经证实肝配蛋白-B2在血管生成过程中作为VEGF受体信号转导的调节子的作用,但肝配蛋白-B2在成熟内皮细胞(EC)中的作用尚不清楚。先前的研究已经表明,GEC中的VEGF信号转导调节内皮窗孔,这是GEC的一个重要特征。
为了进一步了解内皮肝配蛋白-B2在成熟GEC中的作用,发明人检验了肝配蛋白-B2在肾小球中的表达。肾小球中与肝配蛋白-B2抗体的免疫反应对应的信号,不仅在内皮细胞(EC)的标志物CD31阳性结构中观察到,而且在肾病蛋白阳性的足细胞中也观察到(图1a)。为了证实肝配蛋白-B2抗体的特异性,检验了来自编码肝配蛋白-B2的Efnb2基因的floxed小鼠与内皮特异性他莫昔芬(Tamoxifen)诱导型Cre驱动子品系Cdh5-CreErt2小鼠交配繁殖的小鼠的肾脏。为了在完成血管生成发育后诱导有效的基因缺失,从出生后(P)21天至P23向小鼠注射他莫昔芬,并且在P35收集肾脏。有趣的是,在肝配蛋白-B2内皮诱导型敲除(Efnb2iΔEC)小鼠中,肝配蛋白-B2表达不仅在CD31阳性的EC中降低,而且在足细胞中也降低(图1a)。
由于在EC特异性KO小鼠的足细胞中肝配蛋白-B2表达减少,发明人检验了Efnb2i ΔEC小鼠的足细胞的表型。令人惊讶的是,使用免疫染色和蛋白免疫印迹分析,与对照组小鼠相比,观察到Efnb2iΔEC小鼠的肾病蛋白表达显著增加(图1b-d)。这些结果表明,肝配蛋白-B2对足细胞中的肾病蛋白表达非常重要。因此,令人惊讶的是,已经发现肾小球内皮细胞(GEC)中的肝配蛋白-B2控制足细胞中的肾病蛋白表达。
众所周知的是,肾小球中的足细胞和EC被肾小球基底膜(GBM)物理隔离。为了检验EC中的肝配蛋白-B2是否能在不形成细胞间接触的情况下激活足细胞上的EphB4,发明人首先在培养的细胞中异位表达N末端带GFP-flag标记的肝配蛋白-B2(图2a)。用Flag M2抗体从HEK293细胞和人脐静脉内皮细胞(HUVEC)裂解液及其细胞培养条件培养基中免疫沉淀肝配蛋白-B2(图2a)。肝配蛋白-B2的免疫沉淀在细胞裂解液和培养条件培养基中均得到证实(图2b)。
为了证实在体内的肝配蛋白-B2分泌,发明人分析了在EC中表达CFP-肝配蛋白-B2的小鼠。内皮细胞中的肝配蛋白-B2的过表达会在小鼠中导致毒性。在VE-cadherin-tTA/tetO-CFP-Efnb2小鼠中,向怀孕雌性小鼠施用四环素可避免肝配蛋白-B2过表达的胚胎致死性。出生后,撤去四环素处理可诱导EC中的CFP-肝配蛋白-B2嵌合表达。仅表现出低水平肝配蛋白-B2过表达的小鼠达到成年。用抗GFP抗体(识别CFP)的染色揭示在CD31阳性EC中CFP嵌合表达。虽然低水平的肝配蛋白-B2过表达可能不足以影响这些小鼠的肾病蛋白表达,但在肾病蛋白阳性的足细胞中观察到与CFP-肝配蛋白-B2相对应的特异性信号(图2c)。此外,在对照组小鼠的血浆中检测到肝配蛋白-B2,而在Efnb2iΔEC小鼠的血浆中肝配蛋白-B2显著降低(图2d)。为了研究内皮肝配蛋白-B2对足细胞的EphB4的功能性作用,对Efnb2i ΔEC小鼠肾脏中的EphB4的磷酸化进行检验,并证实肾小球中的EphB4磷酸化降低(图2e,f)。这些观察结果表明,在EC的胞质尾部肝配蛋白-B2被剪切,从EC穿过GBM,到达足细胞从而刺激足细胞中的EphB4正向信号转导。因此,已经发现,通过细胞外囊泡(例如外泌体)从内皮细胞(EC)将肝配蛋白-B2分泌至足细胞。
为了研究肝配蛋白-B2/EphB4正向信号转导与肾病蛋白之间的关联,发明人接下来进行从肾脏组织中免疫沉淀EphB4,并证实了肾病蛋白/EphB4复合物的形成(图3a)。肾病蛋白的功能和定位需要肾病蛋白酪氨酸磷酸化,因此其对稳定足细胞中的足突结构非常重要。使用磷酸化Tyr1193/1176肾病蛋白抗体的免疫染色证实了Efnb2iΔEC小鼠肾脏中肾病蛋白的磷酸化。在这些突变体小鼠的肾小球中,与磷酸化肾病蛋白相对应的信号增加,这表明肝配蛋白-B2/EphB4正向信号转导对肾病蛋白磷酸化的抑制作用(图3b-c)。因此,EphB4与肾病蛋白形成蛋白复合物控制肾病蛋白磷酸化。
与肝配蛋白-B2对肾病蛋白磷酸化的抑制作用一致的是,与患有2型糖尿病的患者相比,患有2型糖尿病肾病的患者的肝配蛋白-B2的mRNA增加。另外,EphB4被证明是表现出视网膜病变和肾病的晚期1型糖尿病病况的标志物。
为了进一步了解肝配蛋白-B2在糖尿病肾病中的作用,发明人检验了糖尿病患者的肾脏活检中的肝配蛋白-B2的免疫染色。三名患者被诊断为高草酸尿症,另外三名被诊断为糖尿病肾病(DN)。在DN患者的组织中,肾小球中针对与肾病蛋白共定位的肝配蛋白-B2的信号强于高草酸尿症患者的活检中的信号(图4a,b)。
发明人接下来检验了抑制患有糖尿病肾病的小鼠的肝配蛋白-B2/EphB4正向信号转导是否会恢复肾病蛋白功能和足细胞足突结构,并有益于防止糖尿病肾衰竭。
为了解决这个问题,发明人采用具有肝配蛋白-B2或EphB4突变体的糖尿病小鼠模型。为了检验肝配蛋白-B2功能缺失在糖尿病中的作用,对C57BL/6背景的对照组和Efnb2i ΔEC小鼠在5周龄时注射链脲菌素(Streptozotocin),并用高脂肪饮食喂养。C57BL/6对照组和Efnb2iΔEC小鼠在18周后发展出轻度糖尿病表型。对照组和Efnb2iΔEC糖尿病小鼠之间的肾脏HE染色、血糖水平和体重没有差异。尽管并不显著,Efnb2iΔEC小鼠的血清肌酐水平降低(图5a-d)。虽然与对照组小鼠相比,糖尿病小鼠的尿白蛋白与肌酐比值(UACR)显著升高(图5e),但即使再诱导糖尿病之后Efnb2iΔEC小鼠的UACR也未受影响(图5e)。而且,与非糖尿病对照组相比,糖尿病小鼠的肾病蛋白的表达水平减少,但有趣的是,与非糖尿病对照组相比,Efnb2iΔEC小鼠的肾病蛋白表达水平并未降低(图5f,g)。此外,在超微结构水平上,糖尿病对照组小鼠的肾小球中经常可见足细胞消失,而在Efnb2iΔEC小鼠中较少观察到(图5h)。与肾病蛋白功能恢复一致的是,在Efnb2iΔEC小鼠的足细胞裂隙隔膜上观察到与抗肾病蛋白抗体相对应的强免疫金信号(图5h)。因此,抑制肝配蛋白-B2/EphB4正向信号转导恢复糖尿病病况下的蛋白尿。
综上所述,这些结果表明,抑制肝配蛋白-B2/EphB4穿过GBM的正向信号转导通过控制足细胞中的肾病蛋白功能而具有肾脏保护作用。
发明人检验了反义寡核苷酸(ASO)对肝配蛋白-B2表达的影响。用培养的EC对不同的针对肝配蛋白-B2的序列(Efnb2ASO)进行检验。其中,用4种不同的ASO处理EC有效地敲除肝配蛋白-B2(图6)。其中,三种在人类和小鼠之间保守。因此,抑制肝配蛋白-B2功能或分泌改善糖尿病的蛋白尿,从而成为糖尿病肾病患者的一个新的、有前景的靶点。
本发明的发明人已经对编码Efnb2的基因的基因组序列和编码Efnb2的mRNA序列进行检验和深入分析,以确定为用于预防和治疗肾病和/或糖尿病蛋白尿和/或糖尿病肾病的反义寡核苷酸提供最有效的靶序列的区域。已经发现,用于预防和治疗肾病和/或糖尿病蛋白尿和/或糖尿病肾病的治疗有效的反义寡核苷酸涉及能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交的反义寡核苷酸,其中编码Efnb2的基因的区域或编码Efnb2的mRNA包含在人和小鼠之间100%保守的序列。根据本发明的反义寡核苷酸由10至28个核苷酸组成。在人和小鼠之间100%保守的至少28个连续核苷酸的序列具有的优势在于,长度为28个核苷酸的ASO可以在整个长度上与100%保守的序列杂交。因此,强烈优选编码Efnb2的基因的区域或编码Efnb2的mRNA的区域,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。换句话说,强烈优选编码Efnb2的基因的区域或编码Efnb2的mRNA的区域,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在智人和小家鼠之间100%保守的至少28个连续核苷酸的序列。
因此,本发明的一个重要方面是用于预防和治疗肾病和/或糖尿病蛋白尿和/或糖尿病肾病的反义寡核苷酸的靶序列位于编码Efnb2的基因的区域或编码Efnb2的mRNA的区域内,所述区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。优选地,编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少36个连续核苷酸的序列。优选地,编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少46个连续核苷酸的序列。已经发现,所述靶序列特别有优势,因为它们在两个物种之间表现出重要的交叉反应性。
为了确定在智人和小鼠之间100%保守的至少28个连续核苷酸的潜在靶序列,将Seq.ID No.101(代表智人染色体13,GRCh38.p13初级组装)中所列出的人类基因组序列与Seq.ID No.289(代表小家鼠品系C57BL/6J染色体8,GRCm38.p6 C57BL/6J)中所列出的小家鼠基因组序列进行比对。发明人发现,对于用于预防和治疗肾病和/或糖尿病蛋白尿和/或糖尿病肾病的反义寡核苷酸的编码Efnb2的基因或编码Efnb2的mRNA内的优选区域涉及能够与编码Efnb2的基因的外显子区域或与编码Efnb2的mRNA的区域杂交的反义寡核苷酸。本发明的发明人进一步研究了编码Efnb2的基因的基因组序列和编码Efnb2的mRNA的序列,以确定最有潜力为用于预防和治疗肾病和/或糖尿病蛋白尿和/或糖尿病肾病的反义寡核苷酸提供有优势的靶序列的区域,并且发现最有前景的反义寡核苷酸是能够与编码Efnb2的基因的开放阅读框(ORF)或与编码Efnb2的mRNA的蛋白质编码区或与编码Efnb2的基因的区域或编码Efnb2的mRNA的3’非翻译区(UTR)内的编码Efnb2的mRNA的区域杂交的反义寡核苷酸。
蛋白质编码基因的外显子含有开放阅读框(ORF),以及末端外显子的5’和3’非翻译区(UTR)。在人类/智人中肝配蛋白B2的mRNA转录本一共具有5个外显子。第一外显子(Seq.ID No.90)编码5’非翻译区(UTR)和一部分蛋白质编码序列,第二(Seq.ID No.91)、第三(Seq.ID No.92)和第四(Seq.ID No.93)外显子编码一部分蛋白质编码序列,第五外显子(Seq.ID No.94)编码一部分蛋白质编码序列和3’非翻译区(UTR)(Seq.ID No.296)。本领域已知人mRNA的不同转录本。Seq.IDNo.98的序列代表以DNA编码书写的智人肝配蛋白B2(EFNB2),转录本变体1,mRNA。Seq.ID No.99的序列代表以DNA编码书写的智人肝配蛋白B2(EFNB2),转录本变体2,mRNA。Seq.ID No.100的序列代表以DNA编码书写的智人肝配蛋白B2(EFNB2),转录本变体3,mRNA。发明人已经确认,mRNA转录本变体2缺少第二外显子区域的序列,mRNA转录本变体3缺少第三外显子区域的序列。
下一步,发明人已经确认在编码Efnb2的基因的外显子区域内或在编码Efnb2的mRNA的区域内的在人和小鼠之间100%保守的序列。已经将mRNA,智人肝配蛋白B2(EFNB2),转录本变体1的编码区的核苷酸序列(Seq.ID No.295)与mRNA,小家鼠肝配蛋白B2(EFNB2)的编码区序列进行比对。发明人已经确认肝配蛋白B2转录本编码区内的在人和小鼠之间100%保守的至少28个连续核苷酸的序列。已经发现,第二外显子(Seq.ID No.91)和第三外显子(Seq.ID No.92)的序列包括在人和小鼠之间100%保守的优选至少28个,更优选至少36个,更优选至少46个核苷酸的序列。然而,仅第二外显子区域包含在智人的肝配蛋白B2的所有三个mRNA转录本变体1、2和3中。因此,已经发现,第二外显子区域是用于预防和治疗肾病和/或糖尿病蛋白尿和/或糖尿病肾病的反义寡核苷酸的特别优选靶标。
发明人通过用培养的EC检测针对编码肝配蛋白-B2的基因的第二外显子区域的序列(Efnb2ASO)的不同序列来检验反义寡核苷酸(ASO)对肝配蛋白-B2表达的影响。因此,发明人发现包含在3’末端的3个LNA和在5’末端的3个LNA的序列AGGTTAGGGCTGAATT(5'-3')(Seq.ID No.4)的本发明的ASO有效敲除肝配蛋白-B2(图6)。ASO AGGTTAGGGCTGAATT(5'-3')(Seq.ID No.4)具有与序列AATTCAGCCCTAACCT(Seq.ID No.1)互补的在人和小鼠之间100%保守的序列。因此,本发明的发明人已经确认序列AATTCAGCCCTAACCT(Seq.ID No.1)作为编码Efnb2的基因的第二外显子区域的序列内或编码Efnb2的mRNA的区域内的最有优势的靶序列。
有利的是,序列AATTCAGCCCTAACCT(Seq.ID No.1)在人和小鼠之间在至少28个核苷酸的区域内100%保守。此外,序列AATTCAGCCCTAACCT(Seq.ID No.1)不仅在人和小鼠之间在至少28个核苷酸的区域内100%保守,而且在例如人和大鼠、人和黑猩猩、人和猕猴之间在至少28个核苷酸的区域内100%保守。
因此,优选地,本发明涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1),反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人、小鼠、大鼠、黑猩猩和猕猴之间100%保守的至少28个连续核苷酸的序列。
因此,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域在编码Efnb2的基因的第二外显子区域(Seq.ID No.291)内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。
现有技术WO2004/080418A2和WO2007/038395A2公开了由20个核苷酸组成的靶向肝配蛋白B2转录本的蛋白质编码区的51种反义寡核苷酸(ASO)。在这51种反义寡核苷酸(ASO)中,靶向蛋白质编码序列第1至第262位核苷酸内的区段的8种ASO产生最强的抑制作用。因此,第131至第262位核苷酸内的区段位于编码肝配蛋白-B2的基因的第二外显子区域(Efnb2ASO)内。在靶向蛋白质编码序列第1至第262位核苷酸内的区段的8种ASO中,靶向编码肝配蛋白-B2的基因的第二外显子区域(Efnb2ASO)的4种ASO产生最强的抑制作用。本发明的靶序列AATTCAGCCCTAACCT(Seq.ID No.1)位于编码Efnb2的基因或编码Efnb2的mRNA的区域的蛋白质编码序列的第356至第372位核苷酸之间。WO2004/080418A2和WO2007/038395A2的靶向蛋白质编码序列的第356至第415位核苷酸之间的区域的反义寡核苷酸(ASO)在这个范围内仅显示出中等抑制作用。而且,US2004/110150A1公开了靶向蛋白质编码序列的第1至第262位核苷酸内的区段的产生对肝配蛋白B2表达的最强抑制作用的ASO。US2004/110150A1还公开了蛋白质编码序列的第263至第415位核苷酸的区段内(的ASO)产生对肝配蛋白B2表达的中等抑制作用。
然而,本发明的反义寡核苷酸由10至28个核苷酸组成,并且10至28个核苷酸中的至少两个是LNA。已经发现,当本发明的反义寡核苷酸靶向位于在人和小鼠之间100%保守的至少28个连续核苷酸的序列的区域内的序列AATTCAGCCCTAACCT(Seq.ID No.1)时,含有LNA(锁核酸)的反义寡核苷酸对于提供所需的对肝配蛋白B2表达的抑制作用特别重要,并且其中编码Efnb2的基因的区域位于编码Efnb2的基因的第二外显子区域(Seq.IDNo.291)内。因此,与现有技术的教导相反,本发明的反义寡核苷酸通过靶向序列AATTCAGCCCTAACCT(Seq.ID No.1)来有效抑制肝配蛋白B2的表达。
发明人通过用培养的EC检测针对编码肝配蛋白-B2的基因第五外显子区域(Efnb2ASO)或特别是3’非翻译区(UTR)的不同序列来进一步检验反义寡核苷酸(ASO)对肝配蛋白-B2表达的影响。因此,发明人发现,包含在3’末端的三个LNA和在5’末端的三个LNA的序列TACAAGCAAGGCATTT(5'-3')(Seq.ID No.5)和ACATTGCAAAATTCAG(5'-3')(Seq.IDNo.6)的ASO有效敲除肝配蛋白-B2(图6)。ASO TACAAGCAAGGCATTT(5'-3')(Seq.ID No.5)具有与序列AAATGCCTTGCTTGTA(Seq.ID No.2)互补的在人和小鼠之间100%保守的序列。ASOACATTGCAAAATTCAG(5'-3')(Seq.ID No.6)具有与序列ACATTGCAAAATTCAG(Seq.ID No.3)互补的在人和小鼠之间100%保守的序列。
因此,本发明的发明人已经确认两个序列AAATGCCTTGCTTGTA(Seq.ID No.2)和CTGAATTTTGCAATGT(Seq.ID No.3)作为位于编码Efnb2的基因的第五外显子区域内或编码Efnb2的mRNA的区域内的3’非翻译区(UTR)内的最有优势的靶序列。
有利的是,序列AAATGCCTTGCTTGTA(Seq.ID No.2)和CTGAATTTTGCAATGT(Seq.IDNo.3)在人和小鼠之间在至少28个核苷酸的区域内100%保守。此外,序列AAATGCCTTGCTTGTA(Seq.ID No.2)和CTGAATTTTGCAATGT(Seq.ID No.3)不仅在人和小鼠之间在至少28个核苷酸的区域内100%保守,而且在例如人和黑猩猩之间在至少28个核苷酸的区域内100%保守。
因此,本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,并且10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AAATGCCTTGCTTGTA(Seq.ID No.2)或ACATTGCAAAATTCAG(Seq.ID No.3),并且所述反义寡核苷酸包含能够与所述序列AAATGCCTTGCTTGTA(Seq.ID No.2)或ACATTGCAAAATTCAG(Seq.ID No.3)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的3’非翻译区(UTR)(Seq.IDNo.296)内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人、小鼠和黑猩猩之间100%保守的至少28个连续核苷酸的序列。
现有技术US2004/110150A1公开了靶向基因组序列的不同区域和肝配蛋白B2mRNA转录本的不同区域(例如对应于肝配蛋白B2mRNA转录本的3’非翻译区(UTR)或蛋白质编码区的区域)的反义寡核苷酸。在这些反义寡核苷酸(ASO)中,靶向3’-UTR的第510至第900位、第1475至第1490位、第1755至第1775位、第1937至第1957位和第2420至第2440位核苷酸内的区段的ASO产生对肝配蛋白B2表达的最强抑制作用。然而,任何靶向3’-UTR并显示出强抑制作用的反义寡核苷酸(ASO)靶向在人和小鼠之间100%保守的3’-UTR的序列。因此,US2004/110150A1的靶向编码Efnb2的mRNA的3’-UTR内的序列的ASO不适用于本发明。US2004/110150A1完全没有公开可以与序列AAATGCCTTGCTTGTA(Seq.ID No.2)或ACATTGCAAAATTCAG(Seq.ID No.3)杂交的ASO。
本发明的反义寡核苷酸由10至28个核苷酸组成,并且10至28个核苷酸中的至少两个是LNA。已经发现,当本发明的反义寡核苷酸靶向位于在人和小鼠之间100%保守的至少28个连续核苷酸的序列的区域内的序列AAATGCCTTGCTTGTA(Seq.ID No.2)或ACATTGCAAAATTCAG(Seq.ID No.3)时,含有LNA(锁核酸)的反义寡核苷酸对于提供所需的对肝配蛋白B2表达的抑制作用特别重要,并且其中编码Efnb2的基因的区域在编码Efnb2的mRNA的3’-非翻译区(UTR)(Seq.ID No.296)内。因此,与现有技术的教导相反,本发明的反义寡核苷酸通过靶向序列AAATGCCTTGCTTGTA(Seq.ID No.2)或ACATTGCAAAATTCAG(Seq.ID No.3)来有效抑制肝配蛋白B2表达。
优选地,本发明的反义寡核苷酸由10至28个核苷酸组成,其中10至28个核苷酸中的至少两个是LNA。因此,本发明的反义寡核苷酸优选包含2至10个LNA单元,更优选3至9个LNA单元,还更优选4至8个LNA单元,并且还优选至少6个非LNA单元,更优选至少7个非LNA单元,最优选至少8个非LNA单元。非LNA单元优选是DNA单元。LNA单元优选位于3’末端(又称为3’端)和5’末端(又称为5’端)。优选在3’末端和/或5’末端存在至少一个,更优选至少两个LNA单元。
因此,优选含有3至10个LNA单元的反义寡核苷酸,特别是含有在反义寡核苷酸的5’末端的1至5个LNA单元和在3’末端的1至5个LNA单元,并且在LNA单元之间有至少7个,更优选至少8个DNA单元。因此,在优选的实施方案中,所述反义寡核苷酸具有在3’末端有1至5个LNA单元和在5’末端有1至5个LNA单元的gapmer结构。
此外,所述反义寡核苷酸可以含有常见的核碱基,例如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶,以及它们的常见衍生物。本发明的反义寡核苷酸还可以含有修饰的核苷间桥(例如硫代磷酸酯或二硫代磷酸酯)而不是磷酸酯桥。这种修饰可以仅在反义寡核苷酸的LNA片段中或仅在反义寡核苷酸的非LNA片段中存在,或两者中都存在。
优选以下由10至16个核苷酸组成的反义寡核苷酸(表1),并且优选包含与序列AGGTTAGGGCTGAATT(Seq.ID No.4)的10个连续核苷酸的序列对应的至少10个连续核苷酸的序列:
Seq ID No. L 序列,5'-3' Seq ID No. L 序列,5'-3'
8 10 AGGTTAGGGC 33 11 AGGTTAGGGCT
9 10 GGTTAGGGCT 21 11 GGTTAGGGCTG
10 10 GTTAGGGCTG 22 11 GTTAGGGCTGA
11 10 TTAGGGCTGA 23 11 TTAGGGCTGAA
12 10 TAGGGCTGAA 24 11 TAGGGCTGAAT
13 10 AGGGCTGAAT 25 11 AGGGCTGAATT
14 10 GGGCTGAATT 26 13 AGGTTAGGGCTGA
15 12 AGGTTAGGGCTG 27 13 GGTTAGGGCTGAA
16 12 GGTTAGGGCTGA 28 13 GTTAGGGCTGAAT
17 12 GTTAGGGCTGAA 29 13 TTAGGGCTGAATT
18 12 TTAGGGCTGAAT 30 14 AGGTTAGGGCTGAA
36 12 TAGGGCTGAATT 31 14 GGTTAGGGCTGAAT
19 15 AGGTTAGGGCTGAAT 32 14 GTTAGGGCTGAATT
20 15 GGTTAGGGCTGAATT 4 16 AGGTTAGGGCTGAATT
更优选以下由10至16个核苷酸组成的反义寡核苷酸(表2),并且优选包含与序列AGGTTAGGGCTGAATT(Seq.ID No.4)的10个连续核苷酸的序列对应的至少10个连续核苷酸的序列:
优选由以下序列代表的通式(S1)的反义寡核苷酸:
5’-N1-TAGGGCTG-N2-3’(Seq.ID No.7)
其中
N1代表:AATTCTAGACCCCAGAGGT-,ATTCTAGACCCCAGAGGT-,TTCTAGACCCCAGAGGT-,TCTAGACCCCAGAGGT-,CTAGACCCCAGAGGT-,TAGACCCCAGAGGT-,AGACCCCAGAGGT-,GACCCCAGAGGT-,ACCCCAGAGGT-,CCCCAGAGGT-,CCCAGAGGT-,CCAGAGGT-,CAGAGGT-,AGAGGT-,GAGGT-,AGGT-,GGT-,GT-或T-;以及
N2代表:-AATTCTTGAAACTTGATGG,-AATTCTTGAAACTTGATG,-AATTCTTGAAACTTGAT,-AATTCTTGAAACTTGA,-AATTCTTGAAACTTG,-AATTCTTGAAACTT,-AATTCTTGAAACT,-AATTCTTGAAAC,-AATTCTTGAAA,-AATTCTTGAA,-AATTCTTGA,-AATTCTTG,-AATTCTT,-AATTCT,-AATTC,-AATT,-AAT,-AA或-A。
优选地,通式(S1)的反义寡核苷酸具有10至28个核苷酸,并且在3’端有至少一个LNA核苷酸,在5’端有至少一个LNA核苷酸。还优选具有10至28个核苷酸的反义寡核苷酸,并且在3’端有两个LNA核苷酸,在5’端有两个LNA核苷酸。作为LNA核苷酸(LNA单元),特别是在“锁核酸”章节中公开的LNA核苷酸(LNA单元),优选在“优选的LNA”章节中公开的LNA核苷酸(LNA单元)是适合的,但不限于所述LNA核苷酸(LNA单元),并且作为核苷间桥,特别是在“核苷间连接(IL)”章节中公开的核苷间桥是适合的,但不限于所述“核苷间连接(IL)”。
更优选地,通式(S1)的反义寡核苷酸具有11至24个核苷酸,并且在3’端有至少两个LNA核苷酸,在5’端有至少两个LNA核苷酸。还更优选的是,所述反义寡核苷酸具有10至16个,更优选12至14个核苷酸,并且在3’末端具有1至5个,优选2至4个和更优选2至3个LNA单元,并且在5’末端具有1至5个,优选2至4个和更优选2至3个LNA单元。优选所述反义寡核苷酸是LNA片段A-DNA片段-LNA片段B的形式的gapmer。优选所述反义寡核苷酸在两个LNA片段之间含有至少6个,更优选至少7个和最优选至少8个非LNA单元(例如DNA单元)。非LNA单元和LNA单元的适合的核碱基在“核碱基”章节中公开。
进一步优选式(S1)的反义寡核苷酸:
5’-N1-TAGGGCTG-N2-3’(Seq.ID No.7)
其中
N1代表CCAGAGGT-,CAGAGGT-,AGAGGT-,GAGGT-,AGGT-,GGT-,GT-或T-;以及
N2代表:-AATTCTTG,-AATTCTT,-AATTCT,-AATTC,-AATT,-AAT,-AA或-A。
进一步优选式(S1)的反义寡核苷酸:
5’-N1-TAGGGCTG-N2-3’(Seq.ID No.7)
其中
N1代表:AGGT-,GGT-,GT-或T-;以及
N2代表:-AATT,-AAT,-AA或-A。
在优选的实施方案中,N1代表GGT-以及N2代表-A。在另一个优选的实施方案中,N1代表GT-以及N2代表-AA。在另一个优选的实施方案中,N1代表T-以及N2代表-AAT。
优选地,本发明涉及式(S1)的反义寡核苷酸:
5’-N1-TAGGGCTG-N2-3’(Seq.ID No.7)
其中
N1代表GGT-以及N2代表-A。
优选以下的反义寡核苷酸(表3):
Seq ID No. L 序列,5'-3' Seq ID No. L 序列,5'-3'
11 10 TTAGGGCTGA 22 11 GTTAGGGCTGA
16 12 GGTTAGGGCTGA 23 11 TTAGGGCTGAA
17 12 GTTAGGGCTGAA 26 13 AGGTTAGGGCTGA
18 12 TTAGGGCTGAAT 27 13 GGTTAGGGCTGAA
19 15 AGGTTAGGGCTGAAT 28 13 GTTAGGGCTGAAT
20 15 GGTTAGGGCTGAATT 29 13 TTAGGGCTGAATT
4 16 AGGTTAGGGCTGAATT 30 14 AGGTTAGGGCTGAA
32 14 GTTAGGGCTGAATT 31 14 GGTTAGGGCTGAAT
优选由以下序列代表的通式(S1A)的反义寡核苷酸:
5’-N1A-TTAGGGCT-N2A-3’(Seq.ID No.34)
其中
N1A代表:AAATTCTAGACCCCAGAGG-,AATTCTAGACCCCAGAGG-,ATTCTAGACCCCAGAGG-,TTCTAGACCCCAGAGG-,TCTAGACCCCAGAGG-,CTAGACCCCAGAGG-,TAGACCCCAGAGG-,AGACCCCAGAGG-,GACCCCAGAGG-,ACCCCAGAGG-,CCCCAGAGG-,CCCAGAGG-,CCAGAGG-,CAGAGG-,AGAGGT-,GAGG-,AGG-,GG-或G-;以及
N2A代表:-GAATTCTTGAAACTTGATG,-GAATTCTTGAAACTTGAT,-GAATTCTTGAAACTTGA,-GAATTCTTGAAACTTG,-GAATTCTTGAAACTT,-GAATTCTTGAAACT,-GAATTCTTGAAAC,-GAATTCTTGAAA,-GAATTCTTGAA,-GAATTCTTGA,-GAATTCTTG,-GAATTCTT,-GAATTCT,-GAATTC,-GAATT,-GAAT,-GAA,-GA或-G。
优选地,通式(S1A)的反义寡核苷酸具有10至28个核苷酸,并且在3’端有至少一个LNA核苷酸,在5’端有至少一个LNA核苷酸。还优选具有10至28个核苷酸的反义寡核苷酸,并且在3’端有两个LNA核苷酸,在5’端有两个LNA核苷酸。作为LNA核苷酸(LNA单元),特别是在“锁核酸”章节中公开的LNA核苷酸(LNA单元),优选在“优选的LNA”章节中公开的LNA核苷酸(LNA单元)是适合的,但不限于所述LNA核苷酸(LNA单元),并且作为核苷间桥,特别是在“核苷间连接(IL)”章节中公开的核苷间桥是适合的,但不限于所述“核苷间连接(IL)”。
更优选地,通式(S1A)的反义寡核苷酸具有11至24个核苷酸,并且在3’端有至少两个LNA核苷酸,在5’端有至少两个LNA核苷酸。还更优选地,所述反义寡核苷酸在3’末端具有10至16个,更优选12至14个核苷酸,和1至5个,优选2至4个和更优选2至3个LNA单元,并且在5’末端具有1至5个,优选2至4个和更优选2至3个LNA单元。优选所述反义寡核苷酸是LNA片段A-DNA片段-LNA片段B的形式的gapmer。优选所述反义寡核苷酸在两个LNA片段之间含有至少6个,更优选至少7个和最优选至少8个非LNA单元(例如DNA单元)。非LNA单元和LNA单元的适合的核碱基在“核碱基”章节中公开。
进一步优选式(S1A)的反义寡核苷酸:
5’-N1A-TTAGGGCT-N2A-3’(Seq.ID No.34)
其中
N1A代表:CCCAGAGG-,CCAGAGG-,CAGAGG-,AGAGG-,GAGG-,AGG-,GG-或G-;以及
N2A代表:-GAATTCTT,-GAATTCT,-GAATTC,-GAATT,-GAAT,-GAA,-GA或-G。
进一步优选式(S1A)的反义寡核苷酸:
5’-N1A-TTAGGGCT-N2A-3’(Seq.ID No.34)
其中
N1A代表:GAGG-,AGG-,GG-或G-;以及
N2A代表:-GAAT,-GAA,-GA或-G。
在优选的实施方案中,N1A代表AGG-以及N2A代表-G。在另一个优选的实施方案中,N1A代表GG-以及N2A代表-GA。在另一个优选的实施方案中,N1A代表G-以及N2A代表-GAA。
优选地,本发明涉及式(S1A)的反义寡核苷酸:
5’-N1A-TTAGGGCT-N2A-3’(Seq.ID No.34)
其中N1A代表:GG-以及N2A代表:-GA。
优选以下的反义寡核苷酸(表4):
优选由以下序列代表的通式(S1B)的反义寡核苷酸:
5’-N1B-GTTAGGGC-N2B-3’(Seq.ID No.35)
其中
N1B代表:GAAATTCTAGACCCCAGAG-,AAATTCTAGACCCCAGAG-,AATTCTAGACCCCAGAG-,ATTCTAGACCCCAGAG-,TTCTAGACCCCAGAG-,TCTAGACCCCAGAG-,CTAGACCCCAGAG-,TAGACCCCAGAG-,AGACCCCAGAG-,GACCCCAGAG-,ACCCCAGAG-,CCCCAGAG-,CCCAGAG-,CCAGAG-,CAGAG-,AGAG-,GAG-,AG-或G-;以及
N2B代表:-TGAATTCTTGAAACTTGAT,-TGAATTCTTGAAACTTGA,-TGAATTCTTGAAACTTG,-TGAATTCTTGAAACTT,-TGAATTCTTGAAACT,-TGAATTCTTGAAAC,-TGAATTCTTGAAA,-TGAATTCTTGAA,-TGAATTCTTGA,-TGAATTCTTG,-TGAATTCTT,-TGAATTCT,-TGAATTC,-TGAATT,-TGAAT,-TGAA,-TGA,-TG或-T。
优选地,通式(S1B)的反义寡核苷酸具有10至28个核苷酸,并且在3’端有至少一个LNA核苷酸,在5’端有至少一个LNA核苷酸。还优选具有10至28个核苷酸的反义寡核苷酸,并且在3’端有两个LNA核苷酸,在5’端有两个LNA核苷酸。作为LNA核苷酸(LNA单元),特别是在“锁核酸”章节中公开的LNA核苷酸(LNA单元),优选在“优选的LNA”章节中公开的LNA核苷酸(LNA单元)是适合的,但不限于所述LNA核苷酸(LNA单元),并且作为核苷间桥,特别是在“核苷间连接(IL)”章节中公开的核苷间桥是适合的,但不限于所述“核苷间连接(IL)”
更优选地,通式(S1B)的反义寡核苷酸具有11至24个核苷酸,并且在3’端有至少两个LNA核苷酸,在5’端有至少两个LNA核苷酸。还更优选地,所述反义寡核苷酸具有10至16个,更优选12至14个核苷酸,并且在3'末端具有1至5个,优选2至4个和更优选2至3个LNA单元,并且在5'末端具有1至5个,优选2至4个和更优选2至3个LNA单元。优选所述反义寡核苷酸是LNA片段A-DNA片段-LNA片段B的形式的gapmer。优选所述反义寡核苷酸在两个LNA片段之间含有至少6个,更优选至少7个和最优选至少8个非LNA单元(例如DNA单元)。非LNA单元和LNA单元的适合的核碱基在“核碱基”章节中公开。
进一步优选式(S1B)的反义寡核苷酸:
5’-N1B-GTTAGGGC-N2B-3’(Seq.ID No.35)
其中
N1B代表:CCCCAGAG-,CCCAGAG-,CCAGAG-,CAGAG-,AGAG-,GAG-,AG-或G-;以及
N2B代表:-TGAATTCT,-TGAATTC,-TGAATT,-TGAAT,-TGAA,-TGA,-TG或-T。
进一步优选式(S1B)的反义寡核苷酸:
5’-N1B-GTTAGGGC-N2B-3’(Seq.ID No.35)
其中
N1B代表:AGAG-,GAG-,AG-或G-;以及
N2B代表:-TGAA,-TGA,-TG或-T。
在优选的实施方案中,N1B代表GAG-以及N2B代表-T。在另一个优选的实施方案中,N1B代表AG-以及N2B代表-TG。在另一个优选的实施方案中,N1B代表G-以及N2B代表-TGA。
优选地,本发明涉及式(S1B)的反义寡核苷酸:
5’-N1B-GTTAGGGC-N2B-3’(Seq.ID No.35)
其中N1B代表G-以及N2B代表-TGA。
优选以下的反义寡核苷酸(表5):
Seq ID No. L 序列,5'-3' Seq ID No. L 序列,5'-3'
9 10 GGTTAGGGCT 21 11 GGTTAGGGCTG
15 12 AGGTTAGGGCTG 26 13 AGGTTAGGGCTGA
16 12 GGTTAGGGCTGA 27 13 GGTTAGGGCTGAA
19 15 AGGTTAGGGCTGAAT 30 14 AGGTTAGGGCTGAA
20 15 GGTTAGGGCTGAATT 31 14 GGTTAGGGCTGAAT
4 16 AGGTTAGGGCTGAATT
本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,其中10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列5’-N1-TAGGGCTG-N2-3’(Seq.ID No.7)或5’-N1A-TTAGGGCT-N2A-3’(Seq.ID No.34)或5’-N1B-GTTAGGGC-N2B-3’(Seq.ID No.35)表示,其中
N1代表:AATTCTAGACCCCAGAGGT-,ATTCTAGACCCCAGAGGT-,TTCTAGACCCCAGAGGT-,TCTAGACCCCAGAGGT-,CTAGACCCCAGAGGT-,TAGACCCCAGAGGT-,AGACCCCAGAGGT-,GACCCCAGAGGT-,ACCCCAGAGGT-,CCCCAGAGGT-,CCCAGAGGT-,CCAGAGGT-,CAGAGGT-,AGAGGT-,GAGGT-,AGGT-,GGT-,GT-或T-;
N2代表:-AATTCTTGAAACTTGATGG,-AATTCTTGAAACTTGATG,-AATTCTTGAAACTTGAT,-AATTCTTGAAACTTGA,-AATTCTTGAAACTTG,-AATTCTTGAAACTT,-AATTCTTGAAACT,-AATTCTTGAAAC,-AATTCTTGAAA,-AATTCTTGAA,-AATTCTTGA,-AATTCTTG,-AATTCTT,-AATTCT,-AATTC,-AATT,-AAT,-AA或-A;
N1A代表:AAATTCTAGACCCCAGAGG-,AATTCTAGACCCCAGAGG-,ATTCTAGACCCCAGAGG-,TTCTAGACCCCAGAGG-,TCTAGACCCCAGAGG-,CTAGACCCCAGAGG-,TAGACCCCAGAGG-,AGACCCCAGAGG-,GACCCCAGAGG-,ACCCCAGAGG-,CCCCAGAGG-,CCCAGAGG-,CCAGAGG-,CAGAGG-,AGAGGT-,GAGG-,AGG-,GG-或G-;
N2A代表:-GAATTCTTGAAACTTGATG,-GAATTCTTGAAACTTGAT,-GAATTCTTGAAACTTGA,-GAATTCTTGAAACTTG,-GAATTCTTGAAACTT,-GAATTCTTGAAACT,-GAATTCTTGAAAC,-GAATTCTTGAAA,-GAATTCTTGAA,-GAATTCTTGA,-GAATTCTTG,-GAATTCTT,-GAATTCT,-GAATTC,-GAATT,-GAAT,-GAA,-GA或-G;
N1B代表:GAAATTCTAGACCCCAGAG-,AAATTCTAGACCCCAGAG-,AATTCTAGACCCCAGAG-,ATTCTAGACCCCAGAG-,TTCTAGACCCCAGAG-,TCTAGACCCCAGAG-,CTAGACCCCAGAG-,TAGACCCCAGAG-,AGACCCCAGAG-,GACCCCAGAG-,ACCCCAGAG-,CCCCAGAG-,CCCAGAG-,CCAGAG-,CAGAG-,AGAG-,GAG-,AG-或G-;
N2B代表:-TGAATTCTTGAAACTTGAT,-TGAATTCTTGAAACTTGA,-TGAATTCTTGAAACTTG,-TGAATTCTTGAAACTT,-TGAATTCTTGAAACT,-TGAATTCTTGAAAC,-TGAATTCTTGAAA,-TGAATTCTTGAA,-TGAATTCTTGA,-TGAATTCTTG,-TGAATTCTT,-TGAATTCT,-TGAATTC,-TGAATT,-TGAAT,-TGAA,-TGA,-TG或-T;
以及所述反义寡核苷酸的盐和光学异构体。
本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,其中10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列5’-N1-TAGGGCTG-N2-3’(Seq.IDNo.7)或5’-N1A-TTAGGGCT-N2A-3’(Seq.ID No.34)或5’-N1B-GTTAGGGC-N2B-3’(Seq.IDNo.35)表示,其中残基N1、N2、N1A、N2A、N1B和N2B具有含义特别是如本文所公开的进一步限制的含义,以及所述反义寡核苷酸的盐和光学异构体。
令人惊讶的是,已经发现由10至16个核苷酸,优选12至16个核苷酸,更优选12至14个核苷酸(其中10至16个核苷酸,优选12至16个核苷酸,更优选12至14个核苷酸中的至少两个是LNA)组成的反义寡核苷酸具有的优势在于:在实验中可以使用任何转染试剂,例如lipofectamine,并且可以“自由摄取”。
本发明优选涉及由10至16个核苷酸组成的反义寡核苷酸,其中10至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:GGTTAGGGCT(Seq.ID No.9),GTTAGGGCTG(Seq.ID No.10),TTAGGGCTGA(Seq.ID No.11),AGGTTAGGGCTG(Seq.ID No.15),GGTTAGGGCTGA(Seq.IDNo.16),GTTAGGGCTGAA(Seq.ID No.17),TTAGGGCTGAAT(Seq.IDNo.18),AGGTTAGGGCTGAAT(Seq.ID No.19),GGTTAGGGCTGAATT(Seq.ID No.20),GGTTAGGGCTG(Seq.IDNo.21),GTTAGGGCTGA(Seq.ID No.22),TTAGGGCTGAA(Seq.ID No.23),AGGTTAGGGCTGA(Seq.ID No.26),GGTTAGGGCTGAA(Seq.ID No.27),GTTAGGGCTGAAT(Seq.IDNo.28),TTAGGGCTGAATT(Seq.ID No.29),AGGTTAGGGCTGAA(Seq.ID No.30),GGTTAGGGCTGAAT(Seq.ID No.31),GTTAGGGCTGAATT(Seq.ID No.32),AGGTTAGGGCTGAATT(Seq.ID No.4),以及所述反义寡核苷酸的盐和光学异构体。
更优选地,本发明涉及由10至16个核苷酸组成的反义寡核苷酸,其中10至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:GGTTAGGGCT(Seq.IDNo.9),GTTAGGGCTG(Seq.ID No.10),TTAGGGCTGA(Seq.ID No.11),GGTTAGGGCTGA(Seq.IDNo.16),AGGTTAGGGCTGAAT(Seq.IDNo.19),GGTTAGGGCTGAATT(Seq.ID No.20),GGTTAGGGCTG(Seq.IDNo.21),GTTAGGGCTGA(Seq.ID No.22),AGGTTAGGGCTGA(Seq.IDNo.26),GGTTAGGGCTGAA(Seq.IDNo.27),AGGTTAGGGCTGAA(Seq.ID No.30),GGTTAGGGCTGAAT(Seq.ID No.31),AGGTTAGGGCTGAATT(Seq.ID No.4),以及所述反义寡核苷酸的盐和光学异构体。
更优选地,本发明涉及由12至16个核苷酸组成的反义寡核苷酸,其中12至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:AGGTTAGGGCTG(Seq.IDNo.15),GGTTAGGGCTGA(Seq.ID No.16),GTTAGGGCTGAA(Seq.ID No.17),TTAGGGCTGAAT(Seq.ID No.18),AGGTTAGGGCTGAAT(Seq.ID No.19),GGTTAGGGCTGAATT(Seq.ID No.20),AGGTTAGGGCTGA(Seq.ID No.26),GGTTAGGGCTGAA(Seq.ID No.27),GTTAGGGCTGAAT(Seq.IDNo.28),TTAGGGCTGAATT(Seq.IDNo.29),AGGTTAGGGCTGAA(Seq.ID No.30),GGTTAGGGCTGAAT(Seq.ID No.31),GTTAGGGCTGAATT(Seq.ID No.32),AGGTTAGGGCTGAATT(Seq.ID No.4),以及所述反义寡核苷酸的盐和光学异构体。
还更优选地,本发明涉及由12至16个核苷酸组成的反义寡核苷酸,其中12至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中反义寡核苷酸由以下序列表示:GGTTAGGGCTGA(Seq.IDNo.16),AGGTTAGGGCTGAAT(Seq.ID No.19),GGTTAGGGCTGAATT(Seq.ID No.20),AGGTTAGGGCTGA(Seq.ID No.26),GGTTAGGGCTGAA(Seq.ID No.27),AGGTTAGGGCTGAA(Seq.IDNo.30),GGTTAGGGCTGAAT(Seq.ID No.31),AGGTTAGGGCTGAATT(Seq.ID No.4),以及所述反义寡核苷酸的盐和光学异构体。
更优选地,本发明涉及由12至14个核苷酸组成的反义寡核苷酸,其中12至14个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:AGGTTAGGGCTG(Seq.IDNo.15),GGTTAGGGCTGA(Seq.ID No.16),GTTAGGGCTGAA(Seq.ID No.17),TTAGGGCTGAAT(Seq.ID No.18),AGGTTAGGGCTGA(Seq.ID No.26),GGTTAGGGCTGAA(Seq.ID No.27),GTTAGGGCTGAAT(Seq.ID No.28),TTAGGGCTGAATT(Seq.ID No.29),AGGTTAGGGCTGAA(Seq.IDNo.30),GGTTAGGGCTGAAT(Seq.ID No.31),GTTAGGGCTGAATT(Seq.ID No.32),以及所述反义寡核苷酸的盐和光学异构体。
还更优选地,本发明涉及由12至14个核苷酸组成的反义寡核苷酸,其中12至14个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:GGTTAGGGCTGA(Seq.ID No.16),AGGTTAGGGCTGA(Seq.IDNo.26),GGTTAGGGCTGAA(Seq.ID No.27),AGGTTAGGGCTGAA(Seq.ID No.30),GGTTAGGGCTGAAT(Seq.ID No.31),以及所述反义寡核苷酸的盐和光学异构体。
呈gapmer形式(LNA片段1-DNA片段-LNA片段2)的式S1、S1A或S1B的反义寡核苷酸含有在5’末端的由2至5个,优选2至4个LNA单元组成的LNA片段,并且含有在3’末端的由2至5个,优选2至4个LNA单元组成的LNA片段,并且在两个LNA片段之间有一个由6至14个,优选7至12个DNA单元,以及更优选8至11个DNA单元组成的DNA片段。
式S1、S1A或S1B的反义寡核苷酸含有本文公开的LNA核苷酸(LNA单元),特别是在“锁核酸”章节中公开的LNA单元,并且优选在“优选的LNA”章节中公开的LNA单元。LNA单元和DNA单元可以包含标准核碱基,例如腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U),但还可以包含在“核碱基”章节中公开的修饰的核碱基。式S1、S1A或S1B的反义寡核苷酸或所述反义寡核苷酸的LNA段和DNA段可以含有本文公开的任何核苷间连接,特别是在“核苷间连接(IL)”章节中公开的核苷间连接。式S1、S1A或S1B的反义寡核苷酸还可以任选地含有在3’末端和/或5’末端的末端基团,特别是在“末端基团”章节中公开的末端基团。
实验表明,修饰的核碱基不会显著增加或改变本发明的反义寡核苷酸在神经系统和肿瘤适应症方面的活性。经证实,特别是当5-甲基胞嘧啶仅用于LNA核苷酸中或用于LNA核苷酸和DNA核苷酸中和/或当2-氨基腺嘌呤用于DNA核苷酸而不用于LNA核苷酸中时,修饰的核碱基5-甲基胞嘧啶或2-氨基腺嘌呤进一步提高式S1、S1A或S1B的反义寡核苷酸的活性。
作为式S1、S1A或S1B的反义寡核苷酸的LNA单元,特别优选β-D-氧代-LNA(b1)、β-D-硫代-LNA(b2)、α-L-氧代-LNA(b4)、β-D-ENA(b5)、β-D-(NH)-LNA(b6)、β-D-(NCH3)-LNA(b7)、β-D-(ONH)-LNA(b8)和β-D-(ONCH3)-LNA(b9)。实验表明,所有这些LNA单元b1、b2、b4、b5、b6、b7、b8和b9都能通过所需的努力合成,并产生具有相当的稳定性和活性的反义寡核苷酸。然而,根据实验,进一步优选LNA单元b1、b2、b4、b5、b6和b7。还进一步优选LNA单元b1、b2、b4、b6和b7,甚至更优选LNA单元b1和b4,就化学合成的复杂性而言,最优选β-D-氧代-LNA(b1)。
到目前为止,还没有发现能显著改变或提高对肿瘤或神经系统适应症的稳定性或活性的特别的3’末端基团或5’末端基团,因此3’和5’末端基团是可能的但不是明确优选的。
可以使用各种核苷间桥或核苷间连接。在本文公开的式中,核苷间连接IL由-IL’-Y-表示。因此,IL=-IL’-Y-=-X”-P(=X’)(X-)-Y-,其中IL优选地选自由以下组成的组:
-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-,-O-P(O)(CH3)-O-,-O-P(O)(OCH3)-O-,-O-P(O)(NH(CH3))-O-,-O-P(O)[N(CH3)2]-O-,-O-P(O)(BH3 -)-O-,-O-P(O)(OCH2CH2OCH3)-O-,-O-P(O)(OCH2CH2SCH3)-O-,-O-P(O)(O-)-N(CH3)-,-N(CH3)-P(O)(O-)-O-。优选的核苷间连接IL选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-,-O-P(O)(OCH3)-O-,-O-P(O)(NH(CH3))-O-,-O-P(O)[N(CH3)2]-O-,-O-P(O)(OCH2CH2OCH3)-O-,更优选选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-,还更优选选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,和最优选选自-O-P(O)(O-)-O-和-O-P(O)(S-)-O-。
因此,本发明优选涉及呈由10至28个核苷酸,优选10至18个核苷酸,更优选10至16个核苷酸,和还更优选12至16个核苷酸或12至14个核苷酸组成的gapmer形式的反义寡核苷酸,并且在所述反义寡核苷酸的这些核苷酸中的5’末端的1至5个和在3’末端的1至5个核苷酸是LNA核苷酸,并且在5’末端和3’末端的LNA核苷酸之间存在至少6个,优选7个和更优选8个DNA核苷酸的序列,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列5’-N1-TAGGGCTG-N2-3’(Seq.ID No.7)或5’-N1A-TTAGGGCT-N2A-3’(Seq.ID No.34)或5’-N1B-GTTAGGGC-N2B-3’(Seq.ID No.35)表示,其中残基N1、N2、N1A、N2A、N1B和N2B具有含义特别是如本文所公开的进一步限制的含义,以及
LNA核苷酸选自β-D-氧代-LNA(b1),β-D-硫代-LNA(b2),α-L-氧代-LNA(b4),β-D-ENA(b5),β-D-(NH)-LNA(b6),β-D-(NCH3)-LNA(b7),β-D-(ONH)-LNA(b8)和β-D-(ONCH3)-LNA(b9);优选选自β-D-氧代-LNA(b1),β-D-硫代-LNA(b2),α-L-氧代-LNA(b4),β-D-(NH)-LNA(b6)和β-D-(NCH3)-LNA(b7);以及核苷间连接选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-,-O-P(O)(CH3)-O-,-O-P(O)(OCH3)-O-,-O-P(O)(NH(CH3))-O-,-O-P(O)[N(CH3)2]-O-,-O-P(O)(BH3 -)-O-,-O-P(O)(OCH2CH2OCH3)-O-,-O-P(O)(OCH2CH2SCH3)-O-,-O-P(O)(O-)-N(CH3)-,-N(CH3)-P(O)(O-)-O-;以及优选选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-;以及所述反义寡核苷酸的盐和光学异构体。这种优选的反义寡核苷酸可以不含任何修饰的3’和5’末端,或可以不含任何3’和5’末端基团,并且可以作为修饰的核碱基含有5-甲基胞嘧啶和/或2-氨基腺嘌呤。
还进一步优选的是,本发明涉及呈由10至28个核苷酸,优选10至18个核苷酸,更优选10至16个核苷酸,和还更优选12至16个核苷酸或12至14个核苷酸组成的gapmer形式的反义寡核苷酸,并且在所述反义寡核苷酸的这些核苷酸中的5’末端的1至5个和在3’末端的1至5个核苷酸是LNA核苷酸,并且在5’末端和3’末端的LNA核苷酸之间存在至少6个,优选7个和更优选8个DNA核苷酸的序列,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列5’-N1-TAGGGCTG-N2-3’(Seq.IDNo.7)或5’-N1A-TTAGGGCT-N2A-3’(Seq.IDNo.34)或5’-N1B-GTTAGGGC-N2B-3’(Seq.IDNo.35)表示,其中残基N1、N2、N1A、N2A、N1B和N2B具有含义特别是如本文所公开的进一步限制的含义,以及LNA核苷酸选自β-D-氧代-LNA(b1)、β-D-硫代-LNA(b2)、α-L-氧代-LNA(b4)、β-D-(NH)-LNA(b6)和β-D-(NCH3)-LNA(b7);以及核苷间连接选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-;优选选自磷酸酯、硫代磷酸酯和二硫代磷酸酯;以及所述反义寡核苷酸的盐和光学异构体。
特别优选表1或表2或表3-5的gapmer反义寡核苷酸,其含有在3’端的2至5个,优选2至4个和更优选2至3个LNA单元的片段,和在5’端的2至5个,优选2至4个和更优选2至3个LNA单元的片段,以及在LNA单元的两个片段之间的至少6个,优选7个和更优选8个DNA单元的片段,其中所述LNA单元选自β-D-氧代-LNA(b1)、β-D-硫代-LNA(b2)、α-L-氧代-LNA(b4)、β-D-(NH)-LNA(b6)和β-D-(NCH3)-LNA(b7),并且核苷间连接选自磷酸酯、硫代磷酸酯和二硫代磷酸酯。这种优选的反义寡核苷酸可以不含有任何修饰的3’和5’末端,或可以不含有任何3’和5’末端基团,并且可以作为修饰的核碱基在LNA单元中,优选在所有LNA单元中含有5-甲基胞嘧啶和/或在一些或所有DNA单元中含有2-氨基腺嘌呤和/或在一些或所有DNA单元中含有5-甲基胞嘧啶。
优选以下由10至16个核苷酸组成的反义寡核苷酸(表6),并且优选包含与序列TACAAGCAAGGCATTT(Seq.ID No.5)的10个连续核苷酸的序列对应的至少10个连续核苷酸的序列:
更优选以下由10至16个核苷酸组成的反义寡核苷酸(表7),并且优选包含与序列TACAAGCAAGGCATTT(Seq.ID No.5)的10个连续核苷酸的序列对应的至少10个连续核苷酸的序列:
/>
还优选由以下序列代表的通式(S2)的反义寡核苷酸:
5’-N3-AGCAAGGC-N4-3’(Seq.ID No.64)
其中
N3代表:GACCAGGGACGATCATACA-,ACCAGGGACGATCATACA-,CCAGGGACGATCATACA-,CAGGGACGATCATACA-,AGGGACGATCATACA-,GGGACGATCATACA-,GGACGATCATACA-,GACGATCATACA-,ACGATCATACA-,CGATCATACA-,GATCATACA-,ATCATACA-,TCATACA-,CATACA-,ATACA-,TACA-,ACA-,CA-或A-;以及
N4代表:-ATTTACAGTAACTTTACAA,-ATTTACAGTAACTTTACA,-ATTTACAGTAACTTTAC,-ATTTACAGTAACTTTA,-ATTTACAGTAACTTT,-ATTTACAGTAACTT,-ATTTACAGTAACT,-ATTTACAGTAAC,-ATTTACAGTAA,-ATTTACAGTA,-ATTTACAGT,-ATTTACAGT,-ATTTACAG,-ATTTACA,-ATTTAC,-ATTTA,-ATTT,-ATT,-AT或-A。
优选地,通式(S2)的反义寡核苷酸具有10至28个核苷酸,并且在3’端有至少一个LNA核苷酸,在5’端有至少一个LNA核苷酸。还优选具有10至28个核苷酸的反义寡核苷酸,并且在3’端有两个LNA核苷酸,在5’端有两个LNA核苷酸。作为LNA核苷酸(LNA单元),特别是在“锁核酸”章节中公开的LNA核苷酸(LNA单元),优选在“优选的LNA”章节中公开的LNA核苷酸(LNA单元)是适合的,并且作为核苷间桥,特别是在“核苷间连接(IL)”章节中公开的核苷间桥是适合的。
更优选地,所述反义寡核苷酸具有11至24个核苷酸,并且在3’端有至少两个LNA核苷酸,在5’端有至少两个LNA核苷酸。
还更优选地,所述反义寡核苷酸具有10至16个,更优选12至14个核苷酸,并且在3'末端具有1至5个,优选2至4个和更优选2至3个LNA单元,并且在5'末端具有1至5个,优选2至4个和更优选2至3个LNA单元。优选地,所述反义寡核苷酸是LNA片段A-DNA片段-LNA片段B的形式的GapmeR。优选地,所述反义寡核苷酸在两个LNA片段之间含有至少6个,更优选至少7个和最优选至少8个非LNA单元(例如DNA单元)。非LNA单元和LNA单元的适合的核碱基在“核碱基”章节中公开。
因此,还优选通式(S2)的反义寡核苷酸
5’-N3-AGCAAGGC-N4-3’(Seq.ID No.64)
其中
N3代表:ATCATACA-,TCATACA-,CATACA-,ATACA-,TACA-,ACA-,CA-或A-;以及
N4代表:-ATTTACAG,-ATTTACA,-ATTTAC,-ATTTA,-ATTT,-ATT,-AT或-A。
进一步优选式(S2)的反义寡核苷酸:
5’-N3-AGCAAGGC-N4-3’(Seq.ID No.64)
其中
N3代表:TACA-,ACA-,CA-或A-;以及
N4代表:-ATTT,-ATT,-AT或-A。
在优选的实施方案中,N3代表ACA-以及N4代表-A。在另一个优选的实施方案中,N3代表CA-以及N4代表-AT。在另一个优选的实施方案中,N3代表A-以及N4代表-ATT。
优选地,本发明涉及式(S2)的反义寡核苷酸:
5’-N3-AGCAAGGC-N4-3’(Seq.ID No.64)
其中
N3代表CA-,以及N4代表-AT。
优选以下的反义寡核苷酸(表8):
Seq ID No. L 序列,5'-3' Seq ID No. L 序列,5'-3'
40 10 AAGCAAGGCA 53 11 CAAGCAAGGCA
45 12 ACAAGCAAGGCA 54 11 AAGCAAGGCAT
46 12 CAAGCAAGGCAT 57 13 TACAAGCAAGGCA
47 12 AAGCAAGGCATT 58 13 ACAAGCAAGGCAT
49 15 TACAAGCAAGGCATT 59 13 CAAGCAAGGCATT
50 15 ACAAGCAAGGCATTT 60 13 AAGCAAGGCATTT
63 14 CAAGCAAGGCATTT 61 14 TACAAGCAAGGCAT
5 16 TACAAGCAAGGCATTT 62 14 ACAAGCAAGGCATT
还优选由以下序列代表的通式(S2A)的反义寡核苷酸:
5’-N3A-AAGCAAGG-N4A-3’(Seq.ID No.65)
其中
N3A代表:TGACCAGGGACGATCATAC-,GACCAGGGACGATCATAC-,ACCAGGGACGATCATAC-,CCAGGGACGATCATAC-,CAGGGACGATCATAC-,AGGGACGATCATAC-,GGGACGATCATAC-,GGACGATCATAC-,GACGATCATAC-,ACGATCATAC-,CGATCATAC-,GATCATAC-,ATCATAC-,TCATAC-,CATAC-,ATAC-,TAC-,AC-或C-;以及
N4A代表:-CATTTACAGTAACTTTACA,-CATTTACAGTAACTTTAC,-CATTTACAGTAACTTTA,-CATTTACAGTAACTTT,-CATTTACAGTAACTT,-CATTTACAGTAACT,-CATTTACAGTAAC,-CATTTACAGTAA,-CATTTACAGTA,-CATTTACAGT,-CATTTACAGT,-CATTTACAG,-CATTTACA,-CATTTAC,-CATTTA,-CATTT,-CATT,-CAT,-CA或-C。
优选地,通式(S2A)的反义寡核苷酸具有10至28个核苷酸,并且在3’端有至少一个LNA核苷酸,在5’端有至少一个LNA核苷酸。还优选具有10至28个核苷酸的反义寡核苷酸,并且在3’端有两个LNA核苷酸,在5’端有两个LNA核苷酸。作为LNA核苷酸(LNA单元),特别是在“锁核酸”章节中公开的LNA核苷酸(LNA单元),优选在“优选的LNA”章节中公开的LNA核苷酸(LNA单元)是适合的,并且作为核苷间桥,特别是在“核苷间连接(IL)”章节中公开的核苷间桥是适合的。
更优选地,所述反义寡核苷酸具有11至24个核苷酸,并且在3’端有至少两个LNA核苷酸,在5’端有至少两个LNA核苷酸。
还更优选地,所述反义寡核苷酸具有10至16个,更优选12至14个核苷酸,并且在3'末端具有1至5个,优选2至4个和更优选2至3个LNA单元,并且在5'末端具有1至5个,优选2至4个和更优选2至3个LNA单元。优选所述反义寡核苷酸是LNA片段A-DNA片段-LNA片段B的形式的GapmeR。优选所述反义寡核苷酸在两个LNA片段之间含有至少6个,更优选至少7个和最优选至少8个非LNA单元(例如DNA单元)。非LNA单元和LNA单元的适合的核碱基在“核碱基”章节中公开。
因此,还优选通式(S2A)的反义寡核苷酸:
5’-N3A-AAGCAAGG-N4A-3’(Seq.ID No.65)
其中
N3A代表GATCATAC-,ATCATAC-,TCATAC-,CATAC-,ATAC-,TAC-,AC-或C-;以及
N4A代表:-CATTTACA,-CATTTAC,-CATTTA,-CATTT,-CATT,-CAT,-CA或-C。
还进一步优选通式(S2A)的反义寡核苷酸:
5’-N3A-AAGCAAGG-N4A-3’(Seq.ID No.65)
其中
N3A代表:ATAC-,TAC-,AC-或C-;以及
N4A代表:-CATT,-CAT,-CA或-C。
在优选的实施方案中,N3A代表TAC-以及N4A代表-C。在另一个优选的实施方案中,N3A代表AC-以及N4A代表-CA。在另一个优选的实施方案中,N3A代表C-以及N4A代表-CAT。
优选地,本发明涉及式(S2A)的反义寡核苷酸:
5’-N3A-AAGCAAGG-N4A-3’(Seq.ID No.65)
其中
N3A代表C-以及N4A代表-CAT。
优选以下的反义寡核苷酸(表9):
还优选由以下序列代表的通式(S2B)的反义寡核苷酸:
5’-N3B-GCAAGGCA-N4B-3’(Seq.ID No.66)
其中
N3B代表:ACCAGGGACGATCATACAA-,CCAGGGACGATCATACAA-,CAGGGACGATCATACAA-,AGGGACGATCATACAA-,GGGACGATCATACAA-,GGACGATCATACAA-,GACGATCATACAA-,ACGATCATACAA-,CGATCATACAA-,GATCATACAA-,ATCATACAA-,TCATACAA-,CATACAA-,ATACAA-,TACAA-,ACAA-,CAA-,AA-或A-;以及
N4B代表:-TTTACAGTAACTTTACAAA,-TTTACAGTAACTTTACAA,-TTTACAGTAACTTTACA,-TTTACAGTAACTTTAC,-TTTACAGTAACTTTA,-TTTACAGTAACTTT,-TTTACAGTAACTT,-TTTACAGTAACT,-TTTACAGTAAC,-TTTACAGTAA,-TTTACAGTA,-TTTACAGT,-TTTACAGT,-TTTACAG,-TTTACA,-TTTAC,-TTTA,-TTT,-TT或-T。
优选地,通式(S2B)的反义寡核苷酸具有10至28个核苷酸,并且在3’端有至少一个LNA核苷酸,在5’端有至少一个LNA核苷酸。还优选具有10至28个核苷酸的反义寡核苷酸,并且在3’端有两个LNA核苷酸,在5’端有两个LNA核苷酸。作为LNA核苷酸(LNA单元),特别是在“锁核酸”章节中公开的LNA核苷酸(LNA单元),优选在“优选的LNA”章节中公开的LNA核苷酸(LNA单元)是适合的,并且作为核苷间桥,特别是在“核苷间连接(IL)”章节中公开的核苷间桥是适合的。
更优选地,所述反义寡核苷酸具有11至24个核苷酸,并且在3’端有至少两个LNA核苷酸,在5’端有至少两个LNA核苷酸。
还更优选地,所述反义寡核苷酸具有10至16个,更优选12至14个核苷酸,并且在3'末端具有1至5个,优选2至4个和更优选2至3个LNA单元,并且在5'末端具有1至5个,优选2至4个和更优选2至3个LNA单元。优选所述反义寡核苷酸是LNA片段A-DNA片段-LNA片段B的形式的GapmeR。优选所述反义寡核苷酸在两个LNA片段之间含有至少6个,更优选至少7个和最优选至少8个非LNA单元(例如DNA单元)。非LNA单元和LNA单元的适合的核碱基在“核碱基”章节中公开。
因此,还优选通式(S2B)的反义寡核苷酸:
5’-N3B-GCAAGGCA-N4B-3’(Seq.ID No.66)
其中
N3B代表:TCATACAA-,CATACAA-,ATACAA-,TACAA-,ACAA-,CAA-,AA-或A-;以及
N4B代表:-TTTACAGT,-TTTACAG,-TTTACA,-TTTAC,-TTTA,-TTT,-TT或-T。
还进一步优选通式(S2B)的反义寡核苷酸:
5’-N3B-GCAAGGCA-N4B-3’(Seq.ID No.66)
其中
N3B代表:ACAA-,CAA-,AA-或A-;以及
N4B代表:-TTTA,-TTT,-TT或-T。
在优选的实施方案中,N3B代表CAA-以及N4B代表-T。在另一个优选的实施方案中,N3B代表AA-以及N4B代表-TT。在另一个优选的实施方案中,N3B代表A-以及N4B代表-T。
优选地,本发明涉及式(S2B)的反义寡核苷酸:
5’-N3B-GCAAGGCA-N4B-3’(Seq.ID No.66)
其中
N3B代表CAA-以及N4B代表-T。
优选以下的反义寡核苷酸(表10):
/>
本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,其中10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列5’-N3-AGCAAGGC-N4-3’(Seq.IDNo.64)或5’-N3A-AAGCAAGG-N4A-3’(Seq.ID No.65)或5’-N3B-GCAAGGCA-N4B-3’(Seq.ID No.66)表示,其中N3代表:GACCAGGGACGATCATACA-,ACCAGGGACGATCATACA-,CCAGGGACGATCATACA-,CAGGGACGATCATACA-,AGGGACGATCATACA-,GGGACGATCATACA-,GGACGATCATACA-,GACGATCATACA-,ACGATCATACA-,CGATCATACA-,GATCATACA-,ATCATACA-,TCATACA-,CATACA-,ATACA-,TACA-,ACA-,CA-或A-;
N4代表:-ATTTACAGTAACTTTACAA,-ATTTACAGTAACTTTACA,-ATTTACAGTAACTTTAC,-ATTTACAGTAACTTTA,-ATTTACAGTAACTTT,-ATTTACAGTAACTT,-ATTTACAGTAACT,-ATTTACAGTAAC,-ATTTACAGTAA,-ATTTACAGTA,-ATTTACAGT,-ATTTACAGT,-ATTTACAG,-ATTTACA,-ATTTAC,-ATTTA,-ATTT,-ATT,-AT或-A;
N3A代表:TGACCAGGGACGATCATAC-,GACCAGGGACGATCATAC-,ACCAGGGACGATCATAC-,CCAGGGACGATCATAC-,CAGGGACGATCATAC-,AGGGACGATCATAC-,GGGACGATCATAC-,GGACGATCATAC-,GACGATCATAC-,ACGATCATAC-,CGATCATAC-,GATCATAC-,ATCATAC-,TCATAC-,CATAC-,ATAC-,TAC-,AC-或C-;
N4A代表:-CATTTACAGTAACTTTACA,-CATTTACAGTAACTTTAC,-CATTTACAGTAACTTTA,-CATTTACAGTAACTTT,-CATTTACAGTAACTT,-CATTTACAGTAACT,-CATTTACAGTAAC,-CATTTACAGTAA,-CATTTACAGTA,-CATTTACAGT,-CATTTACAGT,-CATTTACAG,-CATTTACA,-CATTTAC,-CATTTA,-CATTT,-CATT,-CAT,-CA或-C;
N3B代表:ACCAGGGACGATCATACAA-,CCAGGGACGATCATACAA-,CAGGGACGATCATACAA-,AGGGACGATCATACAA-,GGGACGATCATACAA-,GGACGATCATACAA-,GACGATCATACAA-,ACGATCATACAA-,CGATCATACAA-,GATCATACAA-,ATCATACAA-,TCATACAA-,CATACAA-,ATACAA-,TACAA-,ACAA-,CAA-,AA-或A-;
N4B代表:-TTTACAGTAACTTTACAAA,-TTTACAGTAACTTTACAA,-TTTACAGTAACTTTACA,-TTTACAGTAACTTTAC,-TTTACAGTAACTTTA,-TTTACAGTAACTTT,-TTTACAGTAACTT,-TTTACAGTAACT,-TTTACAGTAAC,-TTTACAGTAA,-TTTACAGTA,-TTTACAGT,-TTTACAGT,-TTTACAG,-TTTACA,-TTTAC,-TTTA,-TTT,-TT或-T;以及所述反义寡核苷酸的盐和光学异构体。
本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,其中10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列5’-N3-AGCAAGGC-N4-3’(Seq.IDNo.64)或5’-N3A-AAGCAAGG-N4A-3’(Seq.ID No.65)或5’-N3B-GCAAGGCA-N4B-3’(Seq.ID No.66)表示,其中残基N3、N4、N3A、N4A、N3B和N4B具有含义特别是如本文所公开的进一步限制的含义,以及所述反义寡核苷酸的盐和光学异构体。
令人惊讶的是,已经发现由10至16个核苷酸,优选12至16个核苷酸,更优选12至14个核苷酸(其中10至16个核苷酸,优选12至16个核苷酸,更优选12至14个核苷酸中的至少两个是LNA)组成的反义寡核苷酸具有的优势在于:可以使用任何转染试剂,例如lipofectamine,并且可以“自由摄取”。
本发明优选涉及由10至16个核苷酸组成的反义寡核苷酸,其中10至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:CAAGCAAGGC(Seq.ID No.39),AAGCAAGGCA(Seq.ID No.40),AGCAAGGCAT(Seq.ID No.41),TACAAGCAAGGC(Seq.ID No.44),ACAAGCAAGGCA(Seq.IDNo.45),CAAGCAAGGCAT(Seq.ID No.46),AAGCAAGGCATT(Seq.IDNo.47),AGCAAGGCATTT(Seq.ID No.48),TACAAGCAAGGCATT(Seq.ID No.49),ACAAGCAAGGCATTT(Seq.ID No.50),ACAAGCAAGGC(Seq.IDNo.52),CAAGCAAGGCA(Seq.IDNo.53),AAGCAAGGCAT(Seq.ID No.54),AGCAAGGCATT(Seq.ID No.55),TACAAGCAAGGCA(Seq.ID No.57),ACAAGCAAGGCAT(Seq.IDNo.58),CAAGCAAGGCATT(Seq.ID No.59),AAGCAAGGCATTT(Seq.ID No.60),TACAAGCAAGGCAT(Seq.IDNo.61),ACAAGCAAGGCATT(Seq.IDNo.62)CAAGCAAGGCATTT(Seq.IDNo.63)TACAAGCAAGGCATTT(Seq.ID No.5),以及所述反义寡核苷酸的盐和光学异构体。
更优选地,本发明涉及由10至16个核苷酸组成的反义寡核苷酸,其中10至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:CAAGCAAGGC(Seq.IDNo.39),AAGCAAGGCA(Seq.ID No.40),AGCAAGGCAT(Seq.IDNo.41),CAAGCAAGGCAT(Seq.ID No.46),TACAAGCAAGGCATT(Seq.ID No.49),ACAAGCAAGGCATTT(Seq.ID No.50),CAAGCAAGGCA(Seq.IDNo.53),AAGCAAGGCAT(Seq.ID No.54),ACAAGCAAGGCAT(Seq.IDNo.58),CAAGCAAGGCATT(Seq.ID No.59),TACAAGCAAGGCAT(Seq.ID No.61),ACAAGCAAGGCATT(Seq.ID No.62),CAAGCAAGGCATTT(Seq.ID No.63),TACAAGCAAGGCATTT(Seq.ID No.5),以及所述反义寡核苷酸的盐和光学异构体。
更优选地,本发明涉及由12至16个核苷酸组成的反义寡核苷酸,其中12至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:TACAAGCAAGGC(Seq.IDNo.44),ACAAGCAAGGCA(Seq.ID No.45),CAAGCAAGGCAT(Seq.ID No.46),AAGCAAGGCATT(Seq.ID No.47),AGCAAGGCATTT(Seq.IDNo.48),TACAAGCAAGGCATT(Seq.IDNo.49),ACAAGCAAGGCATTT(Seq.ID No.50),TACAAGCAAGGCA(Seq.ID No.57),ACAAGCAAGGCAT(Seq.ID No.58),CAAGCAAGGCATT(Seq.ID No.59),AAGCAAGGCATTT(Seq.IDNo.60),TACAAGCAAGGCAT(Seq.ID No.61),ACAAGCAAGGCATT(Seq.ID No.62),CAAGCAAGGCATTT(Seq.ID No.63),TACAAGCAAGGCATTT(Seq.ID No.5),以及所述反义寡核苷酸的盐和光学异构体。
还更优选地,本发明涉及由12至16个核苷酸组成的反义寡核苷酸,其中12至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:CAAGCAAGGCAT(Seq.ID No.46),TACAAGCAAGGCATT(Seq.ID No.49),ACAAGCAAGGCATTT(Seq.ID No.50),ACAAGCAAGGCAT(Seq.ID No.58),CAAGCAAGGCATT(Seq.IDNo.59),TACAAGCAAGGCAT(Seq.IDNo.61),ACAAGCAAGGCATT(Seq.ID No.62),CAAGCAAGGCATTT(Seq.ID No.63),TACAAGCAAGGCATTT(Seq.ID No.5),以及所述反义寡核苷酸的盐和光学异构体。
更优选地,本发明涉及由12至14个核苷酸组成的反义寡核苷酸,其中12至14个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:TACAAGCAAGGC(Seq.IDNo.44),ACAAGCAAGGCA(Seq.ID No.45),CAAGCAAGGCAT(Seq.ID No.46),AAGCAAGGCATT(Seq.ID No.47),AGCAAGGCATTT(Seq.ID No.48),TACAAGCAAGGCA(Seq.ID No.57),ACAAGCAAGGCAT(Seq.ID No.58),CAAGCAAGGCATT(Seq.ID No.59),AAGCAAGGCATTT(Seq.IDNo.60),TACAAGCAAGGCAT(Seq.ID No.61),ACAAGCAAGGCATT(Seq.ID No.62),CAAGCAAGGCATTT(Seq.ID No.63),以及所述反义寡核苷酸的盐和光学异构体。
还更优选地,本发明涉及由12至14个核苷酸组成的反义寡核苷酸,其中12至14个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:CAAGCAAGGCAT(Seq.ID No.46),ACAAGCAAGGCAT(Seq.IDNo.58),CAAGCAAGGCATT(Seq.ID No.59),TACAAGCAAGGCAT(Seq.ID No.61),ACAAGCAAGGCATT(Seq.ID No.62),CAAGCAAGGCATTT(Seq.ID No.63),以及所述反义寡核苷酸的盐和光学异构体。
式S2、S2A或S2B的呈gapmer(LNA片段1-DNA片段-LNA片段2)形式的反义寡核苷酸含有在5’末端的由2至5个,优选2至4个LNA单元组成的LNA片段,并且含有在3’末端的由2至5个,优选2至4个LNA单元组成的LNA片段,以及在两个LNA之间的由6至14个,优选7至12个和更优选8至11个DNA单元组成的DNA片段。
式S2、S2A或S2B的反义寡核苷酸含有本文公开的LNA核苷酸(LNA单元),特别是在“锁核酸”章节中公开的LNA单元,优选在“优选的LNA”章节中公开的LNA单元。LNA单元和DNA单元可以包含标准核碱基,例如腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U),但还可以包含“核碱基”章节中公开的修饰的核碱基。式S2、S2A或S2B的反义寡核苷酸或所述反义寡核苷酸的LNA片段和DNA片段可以含有本文公开的任何核苷间连接,特别是“核苷间连接(IL)”章节中公开的核苷间连接。式S2、S2A或S2B的反义寡核苷酸还可以任选地含有在3'末端和/或5'末端的末端基团,特别是在“末端基团”章节中公开的末端基团。
实验表明,修饰的核碱基不会显著增加或改变本发明的反义寡核苷酸在神经系统和肿瘤适应症方面的活性。经证实,特别是当5-甲基胞嘧啶仅用于LNA核苷酸中或用于LNA核苷酸和DNA核苷酸中和/或当2-氨基腺嘌呤用于DNA核苷酸中而不用于LNA核苷酸中时,修饰的核碱基5-甲基胞嘧啶或2-氨基腺嘌呤进一步提高式S2、S2A或S2B的反义寡核苷酸的活性。
作为式S2、S2A或S2B的反义寡核苷酸的LNA单元,特别优选β-D-氧代-LNA(b1)、β-D-硫代-LNA(b2)、α-L-氧代-LNA(b4)、β-D-ENA(b5)、β-D-(NH)-LNA(b6)、β-D-(NCH3)-LNA(b7)、β-D-(ONH)-LNA(b8)和β-D-(ONCH3)-LNA(b9)。实验表明,所有这些LNA单元b1、b2、b4、b5、b6、b7、b8和b9都能通过所需的努力合成,并产生具有相当的稳定性和活性的反义寡核苷酸。然而,根据实验,进一步优选LNA单元b1、b2、b4、b5、b6和b7。还进一步优选LNA单元b1、b2、b4、b6和b7,甚至更优选LNA单元b1和b4,就化学合成的复杂性而言,最优选β-D-氧代-LNA(b1)。
到目前为止,还没有发现可以显著改变或提高对肿瘤或神经系统适应症的稳定性或活性的特别的3'末端基团或5'末端基团,因此3'末端基团和5'末端基团是可能的但不是明确优选的。
可以使用各种核苷间桥或核苷间连接。在本文公开的式中,核苷间连接IL由-IL’-Y-表示。因此,IL=-IL’-Y-=-X”-P(=X’)(X-)-Y-,其中IL优选选自由以下组成的组:
-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-,-O-P(O)(CH3)-O-,-O-P(O)(OCH3)-O-,-O-P(O)(NH(CH3))-O-,-O-P(O)[N(CH3)2]-O-,-O-P(O)(BH3 -)-O-,-O-P(O)(OCH2CH2OCH3)-O-,-O-P(O)(OCH2CH2SCH3)-O-,-O-P(O)(O-)-N(CH3)-,-N(CH3)-P(O)(O-)-O-。优选的核苷间连接IL选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-,-O-P(O)(OCH3)-O-,-O-P(O)(NH(CH3))-O-,-O-P(O)[N(CH3)2]-O-,-O-P(O)(OCH2CH2OCH3)-O-,更优选选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-,还更优选选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,以及最优选选自-O-P(O)(O-)-O-和-O-P(O)(S-)-O-。
因此,本发明优选涉及呈由10至28个核苷酸,优选10至18个核苷酸,更优选10至16个核苷酸和还更优选12至16个核苷酸或12至14个核苷酸组成的gapmer形式的反义寡核苷酸,并且在所述反义寡核苷酸的这些核苷酸中的5’末端的1至5个和在3’末端的1至5个核苷酸是LNA核苷酸,并且在5’末端和3’末端的LNA核苷酸之间存在至少6个,优选7个和更优选8个DNA核苷酸的序列,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:5’-N3-AGCAAGGC-N4-3’(Seq.ID No.64)或5’-N3A-AAGCAAGG-N4A-3’(Seq.ID No.65)或5’-N3B-GCAAGGCA-N4B-3’(Seq.ID No.66),其中残基N3、N4、N3A、N4A、N3B和N4B具有含义特别是如本文所公开的进一步限定的含义,以及
LNA核苷酸选自β-D-氧代-LNA(b1),β-D-硫代-LNA(b2),α-L-氧代-LNA(b4),β-D-ENA(b5),β-D-(NH)-LNA(b6),β-D-(NCH3)-LNA(b7),β-D-(ONH)-LNA(b8)和β-D-(ONCH3)-LNA(b9);优选选自β-D-氧代-LNA(b1),β-D-硫代-LNA(b2),α-L-氧代-LNA(b4),β-D-(NH)-LNA(b6)和β-D-(NCH3)-LNA(b7);以及
核苷间连接选自
-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-,-O-P(O)(CH3)-O-,-O-P(O)(OCH3)-O-,-O-P(O)(NH(CH3))-O-,-O-P(O)[N(CH3)2]-O-,-O-P(O)(BH3 -)-O-,-O-P(O)(OCH2CH2OCH3)-O-,-O-P(O)(OCH2CH2SCH3)-O-,-O-P(O)(O-)-N(CH3)-,-N(CH3)-P(O)(O-)-O-;
优选选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-;以及所述反义寡核苷酸的盐和光学异构体。这种优选的反义寡核苷酸可以不含有任何修饰的3'和5'末端,或可以不含有任何3'和5'末端基团,并且可以作为修饰的核碱基含有5-甲基胞嘧啶和/或2-氨基腺嘌呤。
还进一步优选的是,本发明涉及呈由10至28个核苷酸,优选10至18个核苷酸,更优选10至16个核苷酸和还更优选12至16或12至14个核苷酸组成的gapmer形式的反义寡核苷酸,并且在所述反义寡核苷酸的这些核苷酸中的5’末端的1至5个和在3’末端的1至5个核苷酸是LNA核苷酸,并且在5’末端和3’末端的LNA核苷酸之间存在至少6个,优选7个和更优选8个DNA核苷酸的序列,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:5’-N3-AGCAAGGC-N4-3’(Seq.ID No.64)或5’-N3A-AAGCAAGG-N4A-3’(Seq.ID No.65)或5’-N3B-GCAAGGCA-N4B-3’(Seq.ID No.66),其中残基N3、N4、N3A、N4A、N3B和N4B具有含义特别是如本文所公开的进一步限制的含义,以及LNA核苷酸选自β-D-氧代-LNA(b1)、β-D-硫代-LNA(b2)、α-L-氧代-LNA(b4)、β-D-(NH)-LNA(b6)和β-D-(NCH3)-LNA(b7);以及
核苷间连接选自
-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-;和优选选自磷酸酯、硫代磷酸酯和二硫代磷酸酯;
以及所述反义寡核苷酸的盐和光学异构体。
特别优选表6或表7或表8-10的gapmer反义寡核苷酸,其含有在3’端的2至5个,优选2至4个和更优选2至3个LNA单元的片段,和在5’端的2至5个,优选2至4个和更优选2至3个LNA单元的片段,以及在LNA单元的两个片段之间的至少6个,优选7个和更优选8个DNA单元的片段,其中LNA单元选自β-D-氧代-LNA(b1)、β-D-硫代-LNA(b2)、α-L-氧代-LNA(b4)、β-D-(NH)-LNA(b6)和β-D-(NCH3)-LNA(b7),以及核苷间连接选自磷酸酯、硫代磷酸酯和二硫代磷酸酯。这种优选的反义寡核苷酸可以不含有任何修饰的3'和5'末端,或可以不含有任何3'和5'末端基团,并且可以作为修饰的核碱基在LNA单元,优选所有的LNA单元中含有5-甲基胞嘧啶和/或在一些或所有DNA单元中含有2-氨基腺嘌呤和/或在一些或所有DNA单元中含有5-甲基胞嘧啶。
优选以下由10至16个核苷酸组成的反义寡核苷酸(表11),并且优选包含与序列ACATTGCAAAATTCAG(Seq.ID No.6)的10个连续核苷酸的序列对应的至少10个连续核苷酸的序列:
更优选以下由10至16个核苷酸组成的反义寡核苷酸(表12),并且优选包含与序列ACATTGCAAAATTCAG(Seq.ID No.6)的10个连续核苷酸的序列对应的至少10个连续核苷酸的序列:
还优选由以下序列代表的通式(S3)的反义寡核苷酸:
5’-N5-GCAAAATT-N6-3’(Seq.ID No.94)
其中
N5代表:AGCTGTAGCTAAATACATT-,GCTGTAGCTAAATACATT-,CTGTAGCTAAATACATT-,TGTAGCTAAATACATT-,GTAGCTAAATACATT-,TAGCTAAATACATT-,AGCTAAATACATT-,GCTAAATACATT-,GCTAAATACATT-,CTAAATACATT-,TAAATACATT-,AAATACATT-,AATACATT-,ATACATT-,TACATT-,ACATT-,CATT-,ATT-,TT-或T-;以及
N6代表:-CAGATTTTATACAAAACAT,-CAGATTTTATACAAAACA,-CAGATTTTATACAAAAC,-CAGATTTTATACAAAA,-CAGATTTTATACAAA,-CAGATTTTATACAA,-CAGATTTTATACA,-CAGATTTTATAC,-CAGATTTTATA,-CAGATTTTAT,-CAGATTTTA,-CAGATTTT,-CAGATTT,-CAGATT,-CAGAT,-CAGA,-CAG,-CA或-C。
优选地,通式(S3)的反义寡核苷酸具有10至28个核苷酸,并且在3’端有至少一个LNA核苷酸,在5’端有至少一个LNA核苷酸。还优选具有10至28个核苷酸的反义寡核苷酸,并且在3'端有两个LNA核苷酸,在5'端有两个LNA核苷酸。作为LNA核苷酸(LNA单元),特别是在“锁核酸”章节中公开的LNA核苷酸(LNA单元),优选在“优选的LNA”章节中公开的LNA核苷酸(LNA单元)是适合的,并且作为核苷间桥,特别是在“核苷间连接(IL)”章节中公开的核苷间桥是适合的。
更优选地,所述反义寡核苷酸具有11至24个核苷酸,并且在3'端有至少两个LNA核苷酸,在5'端有至少两个LNA核苷酸。
还更优选地,所述反义寡核苷酸具有10至16个,更优选12至14个和还更优选12个核苷酸,并且在3'末端具有1至5个,优选2至4个和更优选2至3个LNA单元,并且在5'末端具有1至5个,优选2至4个和更优选2至3个LNA单元。优选地,所述反义寡核苷酸是LNA片段A-DNA片段-LNA片段B的形式的GapmeR。优选地所述反义寡核苷酸在两个LNA片段之间含有至少6个,更优选至少7个和最优选至少8个非LNA单元(例如DNA单元)。非LNA单元和LNA单元的适合的核碱基在“核碱基”章节中公开。
因此,还优选通式(S3)的反义寡核苷酸
5’-N5-GCAAAATT-N6-3’(Seq.ID No.94)
其中
N5代表:AATACATT-,ATACATT-,ATACATT-,TACATT-,ACATT-,CATT-,ATT-,TT-或T-;以及
N6代表:-CAGATTTT,-CAGATTT,-CAGATT,-CAGAT,-CAGA,-CAG,-CA或-C。
进一步优选通式(S3)的反义寡核苷酸
5’-N5-GCAAAATT-N6-3’(Seq.ID No.94)
其中
N5代表:CATT-,ATT-,TT-或T-;以及
N6代表-CAGA,-CAG,-CA或-C。
在优选的实施方案中,N5代表ATT-并且N6代表-C。在另一个优选的实施方案中,N5代表TT-并且N6代表-CA。在另一个优选的实施方案中,N5代表T-并且N6代表-CAG。
优选地,本发明涉及式(S3)的反义寡核苷酸:
5’-N5-GCAAAATT-N6-3’(Seq.ID No.64)
其中
N5代表T-并且N6代表-CAG。
优选以下的反义寡核苷酸(表13):
Seq ID No. L 序列,5'-3' Seq ID No. L 序列,5'-3'
71 10 TGCAAAATTC 84 11 TTGCAAAATTC
74 12 TGCAAAATTCAG 85 11 TGCAAAATTCA
77 12 ATTGCAAAATTC 88 13 CATTGCAAAATTC
78 12 TTGCAAAATTCA 89 13 ATTGCAAAATTCA
79 15 ACATTGCAAAATTCA 90 13 TTGCAAAATTCAG
80 15 CATTGCAAAATTCAG 91 14 ACATTGCAAAATTC
6 16 ACATTGCAAAATTCAG 92 14 CATTGCAAAATTCA
93 14 ATTGCAAAATTCAG
还优选由以下序列代表的通式(S3A)的反义寡核苷酸:
5’-N5A-CAAAATTC-N6A-3’(Seq.ID No.95)
其中
N5A代表:GCTGTAGCTAAATACATTG-,CTGTAGCTAAATACATTG-,TGTAGCTAAATACATTG-,GTAGCTAAATACATTG-,TAGCTAAATACATTG-,AGCTAAATACATTG-,GCTAAATACATTG-,GCTAAATACATTG-,CTAAATACATTG-,TAAATACATTG-,AAATACATTG-,AATACATTG-,ATACATTG-,TACATTG-,ACATTG-,CATTG-,ATTG-,TTG-,TG-或G-;以及
N6A代表:-AGATTTTATACAAAACATC,-AGATTTTATACAAAACAT,-AGATTTTATACAAAACA,-AGATTTTATACAAAAC,-AGATTTTATACAAAA,-AGATTTTATACAAA,-AGATTTTATACAA,-AGATTTTATACA,-AGATTTTATAC,-AGATTTTATA,-AGATTTTAT,-AGATTTTA,-AGATTTT,-AGATTT,-AGATT,-AGAT,-AGA,-AG或-A。
优选地,通式(S3A)的反义寡核苷酸具有10至28个核苷酸,并且在3'端有至少一个LNA核苷酸,在5'端有至少一个LNA核苷酸。还优选具有10至28个核苷酸的反义寡核苷酸,并且在3'端有两个LNA核苷酸,在5'端有两个LNA核苷酸。作为LNA核苷酸(LNA单元),特别是在“锁核酸”章节中公开的LNA核苷酸(LNA单元),优选在“优选的LNA”章节中公开的LNA核苷酸(LNA单元)是适合的,并且作为核苷间桥,特别是在“核苷间连接(IL)”章节中公开的核苷间桥是适合的。
更优选地,所述反义寡核苷酸具有11至24个核苷酸,并且在3'端有至少两个LNA核苷酸,在5'端有至少两个LNA核苷酸。
还更优选地,所述反义寡核苷酸具有10至16个,更优选12至14个和还更优选12个核苷酸,并且在3'末端具有1至5个,优选2至4个和更优选2至3个LNA单元,并且在5'末端具有1至5个,优选2至4个和更优选2至3个LNA单元。优选地,所述反义寡核苷酸是LNA片段A-DNA片段-LNA片段B的形式的GapmeR。优选地所述反义寡核苷酸在两个LNA片段之间含有至少6个,更优选至少7个和最优选至少8个非LNA单元(例如DNA单元)。非LNA单元和LNA单元的适合的核碱基在“核碱基”章节中公开。
因此,还优选通式(S3A)的反义寡核苷酸
5’-N5A-CAAAATTC-N6A-3’(Seq.ID No.95)
其中
N5A代表:ATACATTG-,ATACATTG-,TACATTG-,ACATTG-,CATTG-,ATTG-,TTG-,TG-或G-;以及
N6A代表:-AGATTTTA,-AGATTTT,-AGATTT,-AGATT,-AGAT,-AGA,-AG或-A。
进一步优选通式(S3A)的反义寡核苷酸
5’-N5A-CAAAATTC-N6A-3’(Seq.ID No.95)
其中
N5A代表:ATTG-,TTG-,TG-或G-;以及
N6A代表:-AGAT,-AGA,-AG或-A。
在优选的实施方案中,N5A代表TTG-并且N6A代表-A。在另一个优选的实施方案中,N5A代表TG-并且N6A代表-AG。在另一个优选的实施方案中,N5A代表G-并且N6A代表-AGA。
优选地,本发明涉及式(S3A)的反义寡核苷酸:
5’-N5A-CAAAATTC-N6A-3’(Seq.ID No.95)
其中N5A代表TG-并且N6A代表-AG。
优选以下的反义寡核苷酸(表14):
Seq ID No. L 序列,5'-3' Seq ID No. L 序列,5'-3'
72 10 GCAAAATTCA 85 11 TGCAAAATTCA
74 12 TGCAAAATTCAG 86 11 GCAAAATTCAG
78 12 TTGCAAAATTCA 89 13 ATTGCAAAATTCA
79 15 ACATTGCAAAATTCA 90 13 TTGCAAAATTCAG
80 15 CATTGCAAAATTCAG 92 14 CATTGCAAAATTCA
6 16 ACATTGCAAAATTCAG 93 14 ATTGCAAAATTCAG
还优选由以下序列代表的通式(S3B)的反义寡核苷酸:
5’-N5B-AAAATTCA-N6B-3’(Seq.ID No.96)
其中
N5B代表:CTGTAGCTAAATACATTGC-,TGTAGCTAAATACATTGC-,GTAGCTAAATACATTGC-,TAGCTAAATACATTGC-,AGCTAAATACATTGC-,GCTAAATACATTGC-,GCTAAATACATTGC-,CTAAATACATTGC-,TAAATACATTGC-,AAATACATTGC-,AATACATTGC-,ATACATTGC-,TACATTGC-,ACATTGC-,CATTGC-,ATTGC-,TTGC-,TGC-,GC-或C-;以及
N6B代表:-GATTTTATACAAAACATCT,-GATTTTATACAAAACATC-GATTTTATACAAAACAT,-GATTTTATACAAAACA,-GATTTTATACAAAAC,-GATTTTATACAAAA,-GATTTTATACAAA,-GATTTTATACAA,-GATTTTATACA,-GATTTTATAC,-GATTTTATA,-GATTTTAT,-GATTTTA,-GATTTT,-GATTT,-GATT,-GAT,-GA或-G。
优选地,通式(S3A)的反义寡核苷酸具有10至28个核苷酸,并且在3'端有至少一个LNA核苷酸,在5'端有至少一个LNA核苷酸。还优选具有10至28个核苷酸的反义寡核苷酸,并且在3'端有两个LNA核苷酸,在5'端有两个LNA核苷酸。作为LNA核苷酸(LNA单元),特别是在“锁核酸”章节中公开的LNA核苷酸(LNA单元),优选在“优选的LNA”章节中公开的LNA核苷酸(LNA单元)是适合的,并且作为核苷间桥,特别是在“核苷间连接(IL)”章节中公开的核苷间桥是适合的。
更优选地,所述反义寡核苷酸具有11至24个核苷酸,并且在3'端有至少两个LNA核苷酸,在5'端有至少两个LNA核苷酸。
还更优选地,所述反义寡核苷酸具有10至16个,更优选12至14个和还更优选12个核苷酸,并且在3'末端具有1至5个,优选2至4个和更优选2至3个LNA单元,并且在5'末端具有1至5个,优选2至4个和更优选2至3个LNA单元。优选地,所述反义寡核苷酸是LNA片段A-DNA片段-LNA片段B的形式的GapmeR。优选地所述反义寡核苷酸在两个LNA片段之间含有至少6个,更优选至少7个和最优选至少8个非LNA单元(例如DNA单元)。非LNA单元和LNA单元的适合的核碱基在“核碱基”章节中公开。
因此,还优选通式(S3B)的反义寡核苷酸
5’-N5B-AAAATTCA-N6B-3’(Seq.ID No.96)
其中
N5B代表:TACATTGC-,ACATTGC-,CATTGC-,ATTGC-,TTGC-,TGC-,GC-或C-;以及
N6B代表:-GATTTTAT,-GATTTTA,-GATTTT,-GATTT,-GATT,-GAT,-GA或-G。
进一步优选通式(S3B)的反义寡核苷酸
5’-N5B-AAAATTCA-N6B-3’(Seq.ID No.96)
其中
N5B代表:TTGC-,TGC-,GC-或C-;以及
N6B代表:-GATT,-GAT,-GA或-G。
在优选的实施方案中,N5B代表TGC-以及N6B代表-G。在另一个优选的实施方案中,N5B代表GC-以及N6B代表-GA。在另一个优选的实施方案中,N5B代表C-以及N6B代表-GAT。
优选地,本发明涉及式(S3B)的反义寡核苷酸:
5’-N5B-AAAATTCA-N6B-3’(Seq.ID No.96)
其中N5B代表:TGC-以及N6B代表-G。
优选以下的反义寡核苷酸(表15):
Seq ID No. L 序列,5'-3' Seq ID No. L 序列,5'-3'
73 10 CAAAATTCAG 86 11 GCAAAATTCAG
74 12 TGCAAAATTCAG 90 13 TTGCAAAATTCAG
80 15 CATTGCAAAATTCAG 93 14 ATTGCAAAATTCAG
6 16 ACATTGCAAAATTCAG
本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,其中10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列5’-N5-GCAAAATT-N6-3’(Seq.IDNo.94)或5’-N5A-CAAAATTC-N6A-3’(Seq.ID No.95)或5’-N5B-AAAATTCA-N6B-3’(Seq.IDNo.96)表示,其中
N5代表:AGCTGTAGCTAAATACATT-,GCTGTAGCTAAATACATT-,CTGTAGCTAAATACATT-,TGTAGCTAAATACATT-,GTAGCTAAATACATT-,TAGCTAAATACATT-,AGCTAAATACATT-,GCTAAATACATT-,GCTAAATACATT-,CTAAATACATT-,TAAATACATT-,AAATACATT-,AATACATT-,ATACATT-,TACATT-,ACATT-,CATT-,ATT-,TT-或T-;
N6代表:-CAGATTTTATACAAAACAT,-CAGATTTTATACAAAACA,-CAGATTTTATACAAAAC,-CAGATTTTATACAAAA,-CAGATTTTATACAAA,-CAGATTTTATACAA,-CAGATTTTATACA,-CAGATTTTATAC,-CAGATTTTATA,-CAGATTTTAT,-CAGATTTTA,-CAGATTTT,-CAGATTT,-CAGATT,-CAGAT,-CAGA,-CAG,-CA或-C;
N5A代表:GCTGTAGCTAAATACATTG-,CTGTAGCTAAATACATTG-,TGTAGCTAAATACATTG-,GTAGCTAAATACATTG-,TAGCTAAATACATTG-,AGCTAAATACATTG-,GCTAAATACATTG-,GCTAAATACATTG-,CTAAATACATTG-,TAAATACATTG-,AAATACATTG-,AATACATTG-,ATACATTG-,TACATTG-,ACATTG-,CATTG-,ATTG-,TTG-,TG-或G-;
N6A代表:-AGATTTTATACAAAACATC,-AGATTTTATACAAAACAT,-AGATTTTATACAAAACA,-AGATTTTATACAAAAC,-AGATTTTATACAAAA,-AGATTTTATACAAA,-AGATTTTATACAA,-AGATTTTATACA,-AGATTTTATAC,-AGATTTTATA,-AGATTTTAT,-AGATTTTA,-AGATTTT,-AGATTT,-AGATT,-AGAT,-AGA,-AG或-A;
N5B代表:CTGTAGCTAAATACATTGC-,TGTAGCTAAATACATTGC-,GTAGCTAAATACATTGC-,TAGCTAAATACATTGC-,AGCTAAATACATTGC-,GCTAAATACATTGC-,GCTAAATACATTGC-,CTAAATACATTGC-,TAAATACATTGC-,AAATACATTGC-,AATACATTGC-,ATACATTGC-,TACATTGC-,ACATTGC-,CATTGC-,ATTGC-,TTGC-,TGC-,GC-或C-;
N6B代表:-GATTTTATACAAAACATCT,-GATTTTATACAAAACATC-GATTTTATACAAAACAT,-GATTTTATACAAAACA,-GATTTTATACAAAAC,-GATTTTATACAAAA,-GATTTTATACAAA,-GATTTTATACAA,-GATTTTATACA,-GATTTTATAC,-GATTTTATA,-GATTTTAT,-GATTTTA,-GATTTT,-GATTT,-GATT,-GAT,-GA或-G;
以及所述反义寡核苷酸的盐和光学异构体。
本发明优选涉及由10至28个核苷酸组成的反义寡核苷酸,其中10至28个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列5’-N5-GCAAAATT-N6-3’(Seq.IDNo.94)或5’-N5A-CAAAATTC-N6A-3’(Seq.ID No.95)或5’-N5B-AAAATTCA-N6B-3’(Seq.IDNo.96)表示,其中残基N5、N6、N5A、N6A、N5B和N6B具有含义特别是如本文所公开的进一步限制的含义,以及所述反义寡核苷酸的盐和光学异构体。
令人惊讶的是,已经发现由10至16个核苷酸,优选12至16个核苷酸,更优选12至14个核苷酸(其中10至16个核苷酸,优选12至16个核苷酸,更优选12至14个核苷酸中的至少两个是LNA)组成的反义寡核苷酸具有的优势在于:可以使用任何转染试剂,例如lipofectamine,并且可以“自由摄取”。
本发明优选涉及由10至16个核苷酸组成的反义寡核苷酸,其中10至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:TGCAAAATTC(Seq.ID No.71),GCAAAATTCA(Seq.ID No.72),CAAAATTCAG(Seq.ID No.73),TGCAAAATTCAG(Seq.ID No.74),ATTGCAAAATTC(Seq.IDNo.77),TTGCAAAATTCA(Seq.ID No.78),ACATTGCAAAATTCA(Seq.IDNo.79),CATTGCAAAATTCAG(Seq.IDNo.80),ACATTGCAAAATTCAG(Seq.ID No.6),TTGCAAAATTC(Seq.IDNo.84),TGCAAAATTCA(Seq.ID No.85),GCAAAATTCAG(Seq.IDNo.86),CATTGCAAAATTC(Seq.ID No.88),ATTGCAAAATTCA(Seq.ID No.89),TTGCAAAATTCAG(Seq.IDNo.90),ACATTGCAAAATTC(Seq.ID No.91),CATTGCAAAATTCA(Seq.ID No.92),ATTGCAAAATTCAG(Seq.ID No.93),以及所述反义寡核苷酸的盐和光学异构体。
更优选地,本发明涉及由10至16个核苷酸组成的反义寡核苷酸,其中10至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:TGCAAAATTC(Seq.IDNo.71),GCAAAATTCA(Seq.ID No.72),CAAAATTCAG(Seq.ID No.73),TGCAAAATTCAG(Seq.IDNo.74),CATTGCAAAATTCAG(Seq.IDNo.80),ACATTGCAAAATTCAG(Seq.ID No.6),TGCAAAATTCA(Seq.IDNo.85),GCAAAATTCAG(Seq.ID No.86),TTGCAAAATTCAG(Seq.IDNo.90),ATTGCAAAATTCAG(Seq.ID No.93),以及所述反义寡核苷酸的盐和光学异构体。
更优选地,本发明涉及由12至16个核苷酸组成的反义寡核苷酸,其中12至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:TGCAAAATTCAG(Seq.IDNo.74),ATTGCAAAATTC(Seq.ID No.77),TTGCAAAATTCA(Seq.ID No.78),ACATTGCAAAATTCA(Seq.IDNo.79),CATTGCAAAATTCAG(Seq.ID No.80),ACATTGCAAAATTCAG(Seq.ID No.6),CATTGCAAAATTC(Seq.ID No.88),ATTGCAAAATTCA(Seq.ID No.89),TTGCAAAATTCAG(Seq.IDNo.90),ACATTGCAAAATTC(Seq.IDNo.91),CATTGCAAAATTCA(Seq.ID No.92),ATTGCAAAATTCAG(Seq.ID No.93),以及所述反义寡核苷酸的盐和光学异构体。
还更优选地,本发明涉及由12至16个核苷酸组成的反义寡核苷酸,其中12至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中反义寡核苷酸由以下序列表示:TGCAAAATTCAG(Seq.IDNo.74),CATTGCAAAATTCAG(Seq.ID No.80),ACATTGCAAAATTCAG(Seq.ID No.6),TTGCAAAATTCAG(Seq.ID No.90),ATTGCAAAATTCAG(Seq.ID No.93),以及所述反义寡核苷酸的盐和光学异构体。
更优选地,本发明涉及由12至14个核苷酸组成的反义寡核苷酸,其中12至14个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:TGCAAAATTCAG(Seq.IDNo.74),ATTGCAAAATTC(Seq.ID No.77),TTGCAAAATTCA(Seq.ID No.78),CATTGCAAAATTC(Seq.ID No.88),ATTGCAAAATTCA(Seq.ID No.89),TTGCAAAATTCAG(Seq.ID No.90),ACATTGCAAAATTC(Seq.ID No.91),CATTGCAAAATTCA(Seq.ID No.92),ATTGCAAAATTCAG(Seq.ID No.93),以及所述反义寡核苷酸的盐和光学异构体。
还更优选地,本发明涉及由12至14个核苷酸组成的反义寡核苷酸,其中12至14个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:TGCAAAATTCAG(Seq.ID No.74),TTGCAAAATTCAG(Seq.ID No.90),ATTGCAAAATTCAG(Seq.ID No.93),以及所述反义寡核苷酸的盐和光学异构体。
呈gapmer(LNA片段1-DNA片段-LNA片段2)的形式的式S3、S3A、S3B的反义寡核苷酸含有在5'末端的由2至5个,优选2至4个LNA单元组成的LNA片段,和在3'末端的由2至5个,优选2至4个LNA单元组成的LNA片段,以及在两个LNA片段之间的由6至14个,优选7至12个,更优选8至11个DNA单元组成的一个DNA片段。
式S3、S3A、S3B的反义寡核苷酸含有本文中公开的LNA核苷酸(LNA单元),特别是在“锁核酸”章节中公开的LNA核苷酸,优选在“优选的LNA”章节中公开的LNA核苷酸。LNA单元和DNA单元可以包含标准核碱基,例如腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U),但还可以包含在“核碱基”章节中公开的修饰的核碱基。式S3、S3A、S3B的反义寡核苷酸或所述反义寡核苷酸的LNA片段和DNA片段可以包含本文中公开的任何核苷间连接,特别是在“核苷间连接(IL)”章节中公开的核苷间连接。式S3、S3A、S3B的反义寡核苷酸还可以任选地在3'末端和/或5'末端含有末端基团,特别是在“末端基团”章节中公开的末端基团。
实验表明,修饰的核碱基不会显著增加或改变本发明的反义寡核苷酸在神经系统和肿瘤适应症方面的活性。经证明,特别是当5-甲基胞嘧啶仅用于LNA核苷酸中或用于LNA核苷酸和DNA核苷酸中和/或当2-氨基腺嘌呤用于DNA核苷酸中而不用于LNA核苷酸中时,修饰的核碱基5-甲基胞嘧啶或2-氨基腺嘌呤进一步提高式S3、S3A、S3B的反义寡核苷酸的活性。
作为式S3、S3A、S3B的反义寡核苷酸的LNA单元,特别优选β-D-氧代-LNA(b1)、β-D-硫代-LNA(b2)、α-L-氧代-LNA(b4)、β-D-ENA(b5)、β-D-(NH)-LNA(b6)、β-D-(NCH3)-LNA(b7)、β-D-(ONH)-LNA(b8)和β-D-(ONCH3)-LNA(b9)。实验表明,所有这些LNA单元b1、b2、b4、b5、b6、b7、b8和b9都可以通过所需的努力合成,并产生具有相当的稳定性和活性的反义寡核苷酸。然而,根据实验,进一步优选LNA单元b1、b2、b4、b5、b6和b7。还进一步优选LNA单元b1、b2、b4、b6和b7,甚至更优选LNA单元b1和b4,就化学合成的复杂性而言,最优选β-D-氧代-LNA(b1)。
到目前为止,还未发现能够显著改变或提高对肿瘤或神经系统的适应症的稳定性的特别的3'末端基团或5'末端基团,因此3'末端基团和5'末端基团是可能的但不是明确优选的。
可以使用各种核苷间桥或核苷间连接。在本文公开的式中,核苷间连接IL由-IL’-Y-表示。因此,IL=-IL’-Y-=-X”-P(=X’)(X-)-Y-,其中IL优选选自由以下组成的组:
-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-,-O-P(O)(CH3)-O-,-O-P(O)(OCH3)-O-,-O-P(O)(NH(CH3))-O-,-O-P(O)[N(CH3)2]-O-,-O-P(O)(BH3 -)-O-,-O-P(O)(OCH2CH2OCH3)-O-,-O-P(O)(OCH2CH2SCH3)-O-,-O-P(O)(O-)-N(CH3)-,-N(CH3)-P(O)(O-)-O-。优选的核苷间连接IL选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-,-O-P(O)(OCH3)-O-,-O-P(O)(NH(CH3))-O-,-O-P(O)[N(CH3)2]-O-,-O-P(O)(OCH2CH2OCH3)-O-,更优选选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-,还更优选选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,和最优选选自-O-P(O)(O-)-O-和-O-P(O)(S-)-O-。
因此,本发明优选涉及呈由10至28个核苷酸,优选10至18个核苷酸,更优选10至16个,和还更优选12至16个核苷酸或12至14个核苷酸组成的gapmer的形式的反义寡核苷酸,并且在反义寡核苷酸的这些核苷酸中的5’末端的1至5个和在3’末端的1至5个核苷酸是LNA核苷酸,并且在5’末端和3’末端的LNA核苷酸之间存在至少6个,优选7个和更优选8个DNA核苷酸的序列,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列5’-N5-GCAAAATT-N6-3’(Seq.ID No.94)或5’-N5A-CAAAATTC-N6A-3’(Seq.ID No.95)或5’-N5B-AAAATTCA-N6B-3’(Seq.ID No.96)表示,其中残基N5、N6、N5A、N6A、N5B和N6B具有含义特别是如本文所公开的进一步限制的含义,以及
LNA核苷酸选自β-D-氧代-LNA(b1),β-D-硫代-LNA(b2),α-L-氧代-LNA(b4),β-D-ENA(b5),β-D-(NH)-LNA(b6),β-D-(NCH3)-LNA(b7),β-D-(ONH)-LNA(b8)和β-D-(ONCH3)-LNA(b9);和优选地选自β-D-氧代-LNA(b1),β-D-硫代-LNA(b2),α-L-氧代-LNA(b4),β-D-(NH)-LNA(b6)和β-D-(NCH3)-LNA(b7);以及
核苷间连接选自
-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-,-O-P(O)(CH3)-O-,-O-P(O)(OCH3)-O-,-O-P(O)(NH(CH3))-O-,-O-P(O)[N(CH3)2]-O-,-O-P(O)(BH3 -)-O-,-O-P(O)(OCH2CH2OCH3)-O-,-O-P(O)(OCH2CH2SCH3)-O-,-O-P(O)(O-)-N(CH3)-,-N(CH3)-P(O)(O-)-O-;
优选选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-;以及所述反义寡核苷酸的盐和光学异构体。这种优选的反义寡核苷酸可以不包含任何修饰的3'和5'末端,或可以不包含任何3'和5'末端基团,并且可以作为修饰的核碱基包含5-甲基胞嘧啶和/或2-氨基腺嘌呤。
还进一步优选地,本发明涉及呈由10至28个核苷酸,优选10至18个核苷酸,更优选10至16个,和还更优选12至16个核苷酸或12至14个核苷酸组成的gapmer的形式的反义寡核苷酸,并且在反义寡核苷酸的这些核苷酸中的5’末端的1至5个和在3’末端的1至5个核苷酸是LNA核苷酸,并且在5’末端和3’末端的LNA核苷酸之间存在至少6个,优选7个和更优选8个DNA核苷酸的序列,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中反义寡核苷酸由以下的序列5’-N5-GCAAAATT-N6-3’(Seq.IDNo.94)或5’-N5A-CAAAATTC-N6A-3’(Seq.ID No.95)或5’-N5B-AAAATTCA-N6B-3’(Seq.IDNo.96)表示,其中残基N5、N6、N5A、N6A、N5B和N6B具有含义特别是如本文所公开的进一步限制的含义,以及LNA核苷酸选自β-D-氧代-LNA(b1)、β-D-硫代-LNA(b2)、α-L-氧代-LNA(b4)、β-D-(NH)-LNA(b6)和β-D-(NCH3)-LNA(b7);以及
核苷间连接选自
-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-;优选选自磷酸酯、硫代磷酸酯和二硫代磷酸酯;以及所述反义寡核苷酸的盐和光学异构体。
特别优选表11或表12或表13-15的gapmer反义寡核苷酸,其含有在3'端的2至5个,优选2至4个和更优选2至3个LNA单元的片段,和在5'端的2至5个,优选2至4个和更优选2至3个LNA单元的片段,以及在LNA单元的两个片段之间的至少6个,优选7个和更优选8个DNA单元的片段,其中LNA单元选自β-D-氧代-LNA(b1)、β-D-硫代-LNA(b2)、α-L-氧代-LNA(b4)、β-D-(NH)-LNA(b6)和β-D-(NCH3)-LNA(b7),以及核苷间连接选自磷酸酯、硫代磷酸酯和二硫代磷酸酯。这些优选的反义寡核苷酸可以不含任何修饰的3'和5'末端,或可以不含任何3'和5'末端基团,并且作为修饰的核碱基可以在LNA单元,优选所有LNA单元中含有5-甲基胞嘧啶和/或在一些或所有DNA单元中含有2-氨基腺嘌呤和/或在一些或所有DNA单元中含有5-甲基胞嘧啶。
优选以下的反义寡核苷酸(表16):
/>
/>
更优选以下的反义寡核苷酸(表17):
/>
本文公开的反义寡核苷酸例如表16和17的反义寡核苷酸由核苷酸组成,优选非LNA单元(本文中也称为非LNA核苷酸)的DNA核苷酸,以及LNA单元(本文中也称为LNA核苷酸)。虽然没有明确指出,但表16和表17的序列Seq.ID No.4-93的反义寡核苷酸含有在3'端的2至4个LNA核苷酸(LNA单元),和在5'端的2至4个LNA核苷酸(LNA单元)。
也就是说,只要没有明确指出,本发明的反义寡核苷酸或如本文通过字母代码A、C、G、T和U所公开的反义寡核苷酸可以含有本文中公开的任何核苷间连接、任何末端基团和任何核碱基。此外,本发明的或如本文所公开的反义寡核苷酸是本文中公开的任何具有至少一个位于3'端的LNA单元和至少一个位于5'端的LNA单元的gapmer结构的gapmer。此外,本文中公开的任何LNA单元均可以用于本发明的或如本文所公开的反义寡核苷酸中。因此,例如,反义寡核苷酸AGGTTAGGGCTGAATT(Seq.ID No.4)或TACAAGCAAGGCATTT(Seq.ID No.5)或ACATTGCAAAATTCAG(Seq.ID No.6)或GGTTAGGGCTGA(Seq.ID No.16)或CAAGCAAGGCAT(Seq.ID No.46)或TGCAAAATTCAG(Seq.ID No.74)含有至少一个位于5'端的LNA单元和至少一个位于3'端的LNA单元、本文中公开的任何核碱基、任何3'末端基团、任何5'末端基团、任何gapmer结构以及任何核苷间连接,并且覆盖所述反义寡核苷酸的盐和光学异构体。
特别优选在3'末端和5'末端使用LNA单元。因此,优选地,如果3’末端的最后1-5个核苷酸以及5’末端的最后1-5个核苷酸,特别是本文公开的序列的3’末端的最后1-5个核苷酸以及5’末端的最后1-5个核苷酸,特别是表16和17中的序列Seq.ID No.4-93的3’末端的最后1-5个核苷酸以及5’末端的最后1-5个核苷酸是LNA单元(也称为LNA核苷酸),而在3'和5'端的1-5个LNA单元之间,存在2-14个,优选3-12个,更优选4-10个,更优选5-9个,还更优选6-8个非LNA单元(也称为非LNA核苷酸)。这类反义寡核苷酸称为gapmer,在下文中将更详细公开。更优选地,在反义寡核苷酸的3'端有2-5个LNA核苷酸,5'端有2-5个LNA核苷酸,或者3'端有1-4个LNA核苷酸,5'端有1-4个LNA核苷酸,还更优选地,在反义寡核苷酸的3'端有2-4个LNA核苷酸,5'端有2-4个LNA核苷酸,并且在反义寡核苷酸的3'和5'端LNA单元之间存在数量为优选4-10个,更优选5-9个,还更优选6-8个非LNA单元。
此外,作为LNA单元之间以及LNA单元与非LNA单元之间的核苷间连接,优选使用硫代磷酸酯或二硫代磷酸酯,优选硫代磷酸酯。
因此,进一步优选的反义寡核苷酸,其中多于50%,优选多于60%,更优选多于70%,还更优选多于80%,最优选多于90%的核苷间连接是硫代磷酸酯或磷酸酯,并且更优选硫代磷酸酯连接,并且其中3'端的最后1-4个或2-5个核苷酸是LNA单元,5'端的最后1-4个或2-5个核苷酸是LNA单元,以及两端的LNA单元之间存在6-14个非LNA单元的核苷酸,优选7-12个,优选8-11个,更优选8-10个非LNA单元的核苷酸的序列,所述非LNA单元优选DNA单元。此外,优选地,这些呈gapmer形式的反义寡核苷酸由总共12至20个,优选12至18个,更优选12至16个核苷酸,更优选12至14个核苷酸组成。
因此,本发明优选涉及由10至16个核苷酸组成的反义寡核苷酸,其中10至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:GGTTAGGGCT(Seq.IDNo.9),GTTAGGGCTG(Seq.ID No.10),TTAGGGCTGA(Seq.ID No.11),AGGTTAGGGCTG(Seq.ID No.15),GGTTAGGGCTGA(Seq.IDNo.16),GTTAGGGCTGAA(Seq.ID No.17),TTAGGGCTGAAT(Seq.ID No.18),AGGTTAGGGCTGAAT(Seq.ID No.19),GGTTAGGGCTGAATT(Seq.ID No.20),GGTTAGGGCTG(Seq.IDNo.21),GTTAGGGCTGA(Seq.ID No.22),TTAGGGCTGAA(Seq.ID No.23),AGGTTAGGGCTGA(Seq.ID No.26),GGTTAGGGCTGAA(Seq.ID No.27),GTTAGGGCTGAAT(Seq.IDNo.28),TTAGGGCTGAATT(Seq.ID No.29),AGGTTAGGGCTGAA(Seq.IDNo.30),GGTTAGGGCTGAAT(Seq.ID No.31),GTTAGGGCTGAATT(Seq.ID No.32),AGGTTAGGGCTGAATT(Seq.ID No.4),CAAGCAAGGC(Seq.IDNo.39),AAGCAAGGCA(Seq.IDNo.40),AGCAAGGCAT(Seq.IDNo.41),TACAAGCAAGGC(Seq.ID No.44),ACAAGCAAGGCA(Seq.IDNo.45),CAAGCAAGGCAT(Seq.ID No.46),AAGCAAGGCATT(Seq.ID No.47),AGCAAGGCATTT(Seq.IDNo.48),TACAAGCAAGGCATT(Seq.ID No.49),ACAAGCAAGGCATTT(Seq.ID No.50),ACAAGCAAGGC(Seq.IDNo.52),CAAGCAAGGCA(Seq.ID No.53),AAGCAAGGCAT(Seq.ID No.54),AGCAAGGCATT(Seq.ID No.55),TACAAGCAAGGCA(Seq.ID No.57),ACAAGCAAGGCAT(Seq.IDNo.58),CAAGCAAGGCATT(Seq.ID No.59),AAGCAAGGCATTT(Seq.ID No.60),TACAAGCAAGGCAT(Seq.IDNo.61),ACAAGCAAGGCATT(Seq.ID No.62),CAAGCAAGGCATTT(Seq.ID No.63),TACAAGCAAGGCATTT(Seq.ID No.5),TGCAAAATTC(Seq.IDNo.71),GCAAAATTCA(Seq.ID No.72),CAAAATTCAG(Seq.ID No.73),TGCAAAATTCAG(Seq.ID No.74),ATTGCAAAATTC(Seq.IDNo.77),TTGCAAAATTCA(Seq.ID No.78),ACATTGCAAAATTCA(Seq.IDNo.79),CATTGCAAAATTCAG(Seq.IDNo.80),ACATTGCAAAATTCAG(Seq.ID No.6),TTGCAAAATTC(Seq.IDNo.84),TGCAAAATTCA(Seq.ID No.85),GCAAAATTCAG(Seq.IDNo.86),CATTGCAAAATTC(Seq.ID No.88),ATTGCAAAATTCA(Seq.ID No.89),TTGCAAAATTCAG(Seq.IDNo.90),ACATTGCAAAATTC(Seq.ID No.91),CATTGCAAAATTCA(Seq.ID No.92),ATTGCAAAATTCAG(Seq.ID No.93),以及所述反义寡核苷酸的盐和光学异构体。
更优选地,本发明涉及由10至16个核苷酸组成的反义寡核苷酸,其中10至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:GGTTAGGGCT(Seq.IDNo.9),GTTAGGGCTG(Seq.ID No.10),TTAGGGCTGA(Seq.ID No.11),GGTTAGGGCTGA(Seq.IDNo.16),AGGTTAGGGCTGAAT(Seq.IDNo.19),GGTTAGGGCTGAATT(Seq.ID No.20),GGTTAGGGCTG(Seq.IDNo.21),GTTAGGGCTGA(Seq.ID No.22),AGGTTAGGGCTGA(Seq.IDNo.26),GGTTAGGGCTGAA(Seq.IDNo.27),AGGTTAGGGCTGAA(Seq.ID No.30),GGTTAGGGCTGAAT(Seq.ID No.31),AGGTTAGGGCTGAATT(Seq.ID No.4),CAAGCAAGGC(Seq.IDNo.39),AAGCAAGGCA(Seq.ID No.40),AGCAAGGCAT(Seq.IDNo.41),CAAGCAAGGCAT(Seq.ID No.46),TACAAGCAAGGCATT(Seq.ID No.49),ACAAGCAAGGCATTT(Seq.ID No.50),CAAGCAAGGCA(Seq.IDNo.53),AAGCAAGGCAT(Seq.ID No.54),ACAAGCAAGGCAT(Seq.ID No.58),CAAGCAAGGCATT(Seq.ID No.59),TACAAGCAAGGCAT(Seq.ID No.61),ACAAGCAAGGCATT(Seq.ID No.62),CAAGCAAGGCATTT(Seq.ID No.63),TACAAGCAAGGCATTT(Seq.ID No.5),TGCAAAATTC(Seq.IDNo.71),GCAAAATTCA(Seq.ID No.72),CAAAATTCAG(Seq.ID No.73),TGCAAAATTCAG(Seq.IDNo.74),CATTGCAAAATTCAG(Seq.IDNo.80),ACATTGCAAAATTCAG(Seq.ID No.6),TGCAAAATTCA(Seq.IDNo.85),GCAAAATTCAG(Seq.ID No.86),TTGCAAAATTCAG(Seq.ID No.90),ATTGCAAAATTCAG(Seq.ID No.93),以及所述反义寡核苷酸的盐和光学异构体。
更优选地,本发明涉及由12至16个核苷酸组成的反义寡核苷酸,其中12至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:AGGTTAGGGCTG(Seq.IDNo.15),GGTTAGGGCTGA(Seq.ID No.16),GTTAGGGCTGAA(Seq.ID No.17),TTAGGGCTGAAT(Seq.ID No.18),AGGTTAGGGCTGAAT(Seq.ID No.19),GGTTAGGGCTGAATT(Seq.ID No.20),AGGTTAGGGCTGA(Seq.ID No.26),GGTTAGGGCTGAA(Seq.ID No.27),GTTAGGGCTGAAT(Seq.IDNo.28),TTAGGGCTGAATT(Seq.IDNo.29),AGGTTAGGGCTGAA(Seq.ID No.30),GGTTAGGGCTGAAT(Seq.ID No.31),GTTAGGGCTGAATT(Seq.ID No.32),AGGTTAGGGCTGAATT(Seq.ID No.4),TACAAGCAAGGC(Seq.ID No.44),ACAAGCAAGGCA(Seq.IDNo.45),CAAGCAAGGCAT(Seq.IDNo.46),AAGCAAGGCATT(Seq.ID No.47),AGCAAGGCATTT(Seq.ID No.48),TACAAGCAAGGCATT(Seq.ID No.49),ACAAGCAAGGCATTT(Seq.ID No.50),TACAAGCAAGGCA(Seq.ID No.57),ACAAGCAAGGCAT(Seq.ID No.58),CAAGCAAGGCATT(Seq.ID No.59),AAGCAAGGCATTT(Seq.IDNo.60),TACAAGCAAGGCAT(Seq.ID No.61),ACAAGCAAGGCATT(Seq.ID No.62),CAAGCAAGGCATTT(Seq.ID No.63),TACAAGCAAGGCATTT(Seq.ID No.5),TGCAAAATTCAG(Seq.ID No.74),ATTGCAAAATTC(Seq.ID No.77),TTGCAAAATTCA(Seq.ID No.78),ACATTGCAAAATTCA(Seq.ID No.79),CATTGCAAAATTCAG(Seq.ID No.80),ACATTGCAAAATTCAG(Seq.ID No.6),CATTGCAAAATTC(Seq.ID No.88),ATTGCAAAATTCA(Seq.ID No.89),TTGCAAAATTCAG(Seq.ID No.90),ACATTGCAAAATTC(Seq.ID No.91),CATTGCAAAATTCA(Seq.ID No.92),ATTGCAAAATTCAG(Seq.ID No.93),以及所述反义寡核苷酸的盐和光学异构体。
还更优选地,本发明涉及由12至16个核苷酸组成的反义寡核苷酸,其中12至16个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:GGTTAGGGCTGA(Seq.ID No.16),AGGTTAGGGCTGAAT(Seq.ID No.19),GGTTAGGGCTGAATT(Seq.ID No.20),AGGTTAGGGCTGA(Seq.ID No.26),GGTTAGGGCTGAA(Seq.ID No.27),AGGTTAGGGCTGAA(Seq.IDNo.30),GGTTAGGGCTGAAT(Seq.ID No.31),AGGTTAGGGCTGAATT(Seq.ID No.4),CAAGCAAGGCAT(Seq.ID No.46),TACAAGCAAGGCATT(Seq.ID No.49),ACAAGCAAGGCATTT(Seq.ID No.50),ACAAGCAAGGCAT(Seq.ID No.58),CAAGCAAGGCATT(Seq.IDNo.59),TACAAGCAAGGCAT(Seq.ID No.61),ACAAGCAAGGCATT(Seq.ID No.62),CAAGCAAGGCATTT(Seq.ID No.63),TACAAGCAAGGCATTT(Seq.ID No.5),TGCAAAATTCAG(Seq.ID No.74),CATTGCAAAATTCAG(Seq.ID No.80),ACATTGCAAAATTCAG(Seq.ID No.6),TTGCAAAATTCAG(Seq.ID No.90),ATTGCAAAATTCAG(Seq.ID No.93),以及所述反义寡核苷酸的盐和光学异构体。
更优选地,本发明涉及由12至14个核苷酸组成的反义寡核苷酸,其中12至14个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:AGGTTAGGGCTG(Seq.IDNo.15),GGTTAGGGCTGA(Seq.ID No.16),GTTAGGGCTGAA(Seq.ID No.17),TTAGGGCTGAAT(Seq.ID No.18),AGGTTAGGGCTGA(Seq.ID No.26),GGTTAGGGCTGAA(Seq.ID No.27),GTTAGGGCTGAAT(Seq.ID No.28),TTAGGGCTGAATT(Seq.ID No.29),AGGTTAGGGCTGAA(Seq.IDNo.30),GGTTAGGGCTGAAT(Seq.ID No.31),GTTAGGGCTGAATT(Seq.ID No.32),TACAAGCAAGGC(Seq.IDNo.44),ACAAGCAAGGCA(Seq.ID No.45),CAAGCAAGGCAT(Seq.ID No.46),AAGCAAGGCATT(Seq.ID No.47),AGCAAGGCATTT(Seq.ID No.48),TACAAGCAAGGCA(Seq.IDNo.57),ACAAGCAAGGCAT(Seq.ID No.58),CAAGCAAGGCATT(Seq.ID No.59),AAGCAAGGCATTT(Seq.IDNo.60),TACAAGCAAGGCAT(Seq.ID No.61),ACAAGCAAGGCATT(Seq.IDNo.62),CAAGCAAGGCATTT(Seq.ID No.63),TGCAAAATTCAG(Seq.ID No.74),ATTGCAAAATTC(Seq.ID No.77),TTGCAAAATTCA(Seq.ID No.78),CATTGCAAAATTC(Seq.ID No.88),ATTGCAAAATTCA(Seq.IDNo.89),TTGCAAAATTCAG(Seq.ID No.90),ACATTGCAAAATTC(Seq.IDNo.91),CATTGCAAAATTCA(Seq.ID No.92),ATTGCAAAATTCAG(Seq.ID No.93),以及所述反义寡核苷酸的盐和光学异构体。
还更优选地,本发明涉及由12至14个核苷酸组成的反义寡核苷酸,其中12至14个核苷酸中的至少两个是LNA,其中所述反义寡核苷酸能够与编码Efnb2的基因的区域或与编码Efnb2的mRNA的区域杂交,其中所述反义寡核苷酸由以下序列表示:GGTTAGGGCTGA(Seq.ID No.16),AGGTTAGGGCTGA(Seq.ID No.26),GGTTAGGGCTGAA(Seq.ID No.27),AGGTTAGGGCTGAA(Seq.ID No.30),GGTTAGGGCTGAAT(Seq.ID No.31),CAAGCAAGGCAT(Seq.IDNo.46),ACAAGCAAGGCAT(Seq.IDNo.58),CAAGCAAGGCATT(Seq.ID No.59),TACAAGCAAGGCAT(Seq.ID No.61),ACAAGCAAGGCATT(Seq.ID No.62),CAAGCAAGGCATTT(Seq.ID No.63)TGCAAAATTCAG(Seq.ID No.74),TTGCAAAATTCAG(Seq.IDNo.90),ATTGCAAAATTCAG(Seq.IDNo.93),以及所述反义寡核苷酸的盐和光学异构体。
应理解,本文中使用的“编码DNA链”是指与mRNA(以DNA代码书写的除外)相同的DNA链,并且涵盖用于蛋白质翻译的密码子。其不用作转录为mRNA的模板。因此,术语“编码DNA链”、“正义DNA链”和“非模板DNA链”可以互换使用。
此外,本文中使用的“非编码DNA链”是指与“编码DNA链”互补并作为mRNA转录的模板的DNA链。因此,术语“非编码DNA链”、“反义DNA链”和“模板DNA链”可以互换使用。
术语“反义寡核苷酸”是指核糖核酸(RNA)或脱氧核糖核酸(DNA)的寡聚体或多聚体或其模拟物或变体。术语“反义寡核苷酸”包括由天然存在的核碱基、糖和共价核苷间(骨架)连接组成的寡核苷酸,以及功能类似的具有非天然存在的部分的寡核苷酸。这种经修饰或取代的寡核苷酸通常比天然形式的寡核苷酸更优选,因为它们具有期望的特性,例如增强的细胞摄取、增强的对核酸靶标的亲和力以及在核酸酶存在时增加的稳定性。反义寡核苷酸是与靶核酸杂交并抑制其表达的短的催化RNA或催化寡核苷酸。
术语“核苷”对于本领域技术人员来说是众所周知的,它是指戊糖部分,例如核糖、脱氧核糖或修饰的或锁定的核糖或修饰的或锁定的脱氧核糖,例如下面详细公开的LNA。核碱基与糖苷碳原子(戊糖的1’位)相连,核苷间连接形成于3'氧或硫原子,优选核苷的3'氧原子,和5’氧或硫原子,优选相邻核苷的5'氧原子之间,而所述核苷间连接不属于核苷。
术语“核苷酸”对本领域技术人员来说是众所周知的,它是指戊糖部分,例如核糖、脱氧核糖或修饰的或锁定的核糖或修饰的或锁定的脱氧核糖,例如下面详细公开的LNA。核碱基与糖基碳原子(戊糖的1'位)相连,核苷间连接形成于3'氧或硫原子,优选核苷的3'氧原子,和5'氧或硫原子,优选相邻核苷的5'氧原子之间,而所述核苷间连接是核苷酸的一部分。
核碱基
术语“核碱基”在本文中缩写为“B”,是指五种标准核苷酸碱基腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U),以及它们的修饰物或类似物或具有与互补链中的碱基形成沃森-克里克碱基配对的能力的类似物。修饰的核碱基包括其他合成的和天然的核碱基,例如5-甲基胞嘧啶(C*)、5-羟甲基胞嘧啶、N4-甲基胞嘧啶、黄嘌呤、次黄嘌呤、7-脱氮黄嘌呤、2-氨基腺嘌呤、6-甲基腺嘌呤、6-甲基鸟嘌呤、6-乙基腺嘌呤、6-乙基鸟嘌呤、2-丙基腺嘌呤、2-丙基鸟嘌呤、6-羧基尿嘧啶、5-卤代尿嘧啶、5,6-二氢尿嘧啶、5-卤代胞嘧啶、5-丙炔尿嘧啶、5-丙炔胞嘧啶、6-氮杂尿嘧啶、6-氮杂胞嘧啶、6-氮杂胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫代尿嘧啶、8-氟腺嘌呤、8-氯腺嘌呤、8-溴腺嘌呤、8-碘腺嘌呤、8-氨基腺嘌呤、8-硫代腺嘌呤、8-硫代烷基腺嘌呤、8-羟基腺嘌呤、8-氟鸟嘌呤、8-氯鸟嘌呤、8-溴鸟嘌呤、8-碘鸟嘌呤、8-氨基鸟嘌呤、8-硫代鸟嘌呤、8-硫代烷基鸟嘌呤、8-羟基鸟嘌呤、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、5-三氟甲基尿嘧啶、5-氟胞嘧啶、5-溴胞嘧啶、5-氯胞嘧啶、5-碘胞嘧啶、5-三氟甲基胞嘧啶、7-甲基鸟嘌呤、7-甲基腺嘌呤、8-氮杂鸟嘌呤、8-氮杂腺嘌呤、7-脱氮鸟嘌呤、7-脱氮腺嘌呤、7-脱氮-8-氮杂腺嘌呤、3-脱氮鸟嘌呤、3-脱氮腺嘌呤、2-硫代尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶等,其中优选5-甲基胞嘧啶和/或2-氨基腺嘌呤取代,因为这些修饰已被证明可提高核酸双链体的稳定性。
本发明的优选的反义寡核苷酸可以包含核碱基类似物。反义寡核苷酸中仅有一个核苷酸单元的核碱基可以被核碱基类似物替换,或者反义寡核苷酸中的两个、三个、四个、五个或甚至所有核碱基都可以被核碱基类似物替换。
应认识到,当提到核苷酸或单体的序列时,所指的是碱基(例如A、T、G、C或U)的序列。通过字母代码A、T、G、C和U表示反义寡核苷酸时,必须理解为所述反义寡核苷酸可以包含本文公开的任何核碱基、本文公开的任何3'末端基团、本文公开的任何5'末端基团以及本文公开的任何核苷间连接(也称为核苷间桥)。核苷酸A、T、G、C和U还必须理解为LNA核苷酸或非LNA核苷酸,例如优选DNA核苷酸。
已经证明,本文公开的反义寡核苷酸以及所述反义寡核苷酸的盐与靶标(即编码EfnB2的基因或编码EfnB2的mRNA)互补,即具有足够好的杂交性和足够的特异性,特别是产生所需的抑制作用的选择性。
术语“盐”是指本发明的反义寡核苷酸的生理学和/或药学上可接受的盐。所述反义寡核苷酸含有核碱基,例如腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶或其衍生物,这些核碱基是碱性的并形成例如氯化物或甲磺酸盐的盐。核苷间连接优选含有带负电荷的氧或硫原子,这些原子形成例如钠盐、锂盐或钾盐的盐。因此,药学上可接受的碱加成盐由无机碱或有机碱形成。适合的有机碱和无机碱的实例是源自金属离子的碱,例如铝、碱金属离子(例如钠或钾)、碱土金属离子(例如钙或镁)、或胺盐离子或碱或碱土氢氧化物、碳酸盐或碳酸氢盐。实例包括水性LiOH、NaOH、KOH、NH4OH、碳酸钾、氨和碳酸氢钠、铵盐、伯胺、仲胺和叔胺(例如季铵盐氢氧化物)、低烷基胺(例如甲胺、叔丁胺、普鲁卡因、乙醇胺)、芳烷基胺(例如二苄胺和N,N-二苄基乙二胺)、低烷基哌啶(例如N-乙基哌啶)、环烷基胺(例如环己胺或二环己胺)、吗啉、葡萄糖胺、N-甲基-和N,N-二甲基葡萄糖胺、1-金刚烷胺、苯乙胺,或由氨基酸(例如精氨酸、赖氨酸、鸟氨酸或原本中性或酸性氨基酸的酰胺)、氯普鲁卡因、胆碱、普鲁卡因或类似物质衍生的盐。
由于所述反义寡核苷酸是碱性的,它们与有机酸和无机酸形成药学上可接受的盐。适用于形成此类酸加成盐的酸的实例是盐酸、氢溴酸、硫酸、磷酸、乙酸、柠檬酸、草酸、丙二酸、水杨酸、对氨基水杨酸、苹果酸、富马酸、琥珀酸、抗坏血酸、马来酸、磺酸、膦酸、高氯酸、硝酸、甲酸、丙酸、葡萄糖酸、乳酸、酒石酸、羟基马来酸、丙酮酸、苯乙酸、苯甲酸、对氨基苯甲酸、对羟基苯甲酸、甲磺酸、乙磺酸、亚硝酸、羟基乙磺酸、乙烯基磺酸、对甲苯磺酸、萘磺酸、对氨基苯磺酸、樟脑磺酸、瓷酸(china acid)、扁桃酸、邻甲基扁桃酸、氢-苯磺酸、苦味酸、己二酸、D-邻甲苯基酒石酸、羟基丙二酸、甲苯酸、(邻、间、对)-甲苯酸、萘胺磺酸,以及本领域技术人员熟知的其他矿物酸或羧酸。盐的制备是通过使游离碱与足量的所需的酸接触,以常规方式生成盐。
在本发明的背景下,“杂交”是指核酸杂交,其中单链核酸(DNA或RNA)与另一个具有非常相似或甚至互补序列的单链核酸相互作用。因此这种相互作用是通过特定核碱基之间(碱基配对)的氢键发生的。
本文中使用的术语“互补性”(DNA和RNA碱基配对互补性)是指两个核酸之间精确配对的能力。当其形状允许通过氢键结合在一起时,碱基对中的核苷酸是互补的。因此,腺嘌呤和胸腺嘧啶(或尿嘧啶)配对形成两个氢键,胞嘧啶-鸟嘌呤配对形成三个氢键。本文中使用的“互补序列”是指DNA或RNA序列,当它们彼此反向平行排列时,序列中每个位置的核苷酸碱基将互补,就像看镜子看到的是事物的反面。
本文中使用的术语“特异性杂交”表示反义寡核苷酸与靶序列的足够程度的互补性或精确的碱基配对,从而使反义寡核苷酸与DNA或RNA靶标之间发生稳定和特异性结合。根据本发明的反义寡核苷酸的序列不需要与其靶核酸的序列100%互补以特异性杂交,但优选100%的互补性。因此,“100%互补性”是指反义寡核苷酸在其完整或全长上与靶核酸杂交而没有错配。换句话说,在本发明中,当反义化合物与靶标DNA或RNA分子的结合发生在生理或病理条件下时,反义化合物被定义为可特异性杂交的,而反义寡核苷酸与非靶标序列的非特异性结合是极不可能或甚至不可能发生的。
因此,本发明优选涉及反义寡核苷酸,其中所述反义寡核苷酸以100%的互补性与编码EfnB2的mRNA结合,并且不与完整人类转录组中的任何其他区域结合。本发明进一步优选涉及反义寡核苷酸,其中所述反义寡核苷酸在其完整长度上与编码EfnB2的mRNA具有100%的互补性,并且不具有脱靶效应。可替代地,本发明优选涉及与编码EfnB2的mRNA具有100%互补性,但与人类转录组的另外mRNA无互补性的反义寡核苷酸。因此,术语“人类转录组”是指人类生物体中的转录本的总集合,即所有细胞类型和环境条件下(在任何给定时间)的转录本。
本发明的反义寡核苷酸的具有的共同点是,它们相对于所结合的编码EfnB2的基因或编码EfnB2的mRNA的区域具有特异性。根据本发明,优选地,反义寡核苷酸在其全长上仅与人类转录组内的编码EfnB2的mRNA具有100%互补性。
本文中使用的术语“mRNA”可以涵盖含有内含子的mRNA(也称为前mRNA)以及不含任何内含子的成熟mRNA。
本发明的反义寡核苷酸能够与前mRNA和/或成熟mRNA结合或杂交。也就是说,所述反义寡核苷酸可以与前mRNA的内含子区域或在内含子区域内结合或杂交,或可以与前mRNA的内含子-外显子重叠区域结合或杂交,或可以与前mRNA的外显子区域或在外显子区域内以及mRNA的外显子区域结合或杂交。优选能够与前mRNA和mRNA结合或杂交的反义寡核苷酸。反义寡核苷酸(ASO)与前mRNA的结合或杂交抑制5'帽的形成,抑制前mRNA的剪接以获得mRNA,并激活切割前mRNA的RNA酶H。反义寡核苷酸(ASO)与mRNA的结合或杂交激活切割mRNA的RNA酶H,并抑制核糖体亚基的结合。
优选地,根据本发明的反义寡核苷酸与前mRNA的外显子区域或在外显子区域内以及mRNA的外显子区域结合或杂交。
本发明的反义寡核苷酸由至少10个和不多于28个,优选不多于24个和更优选不多于20个核苷酸组成,因此由10、11、12、13、14、15、16、17、18、19或20个核苷酸组成,优选由10至20个,或10至19个,或11至19个,或12至19个,或12至18个核苷酸组成,更优选由12至16个核苷酸组成。这些核苷酸中优选至少两个,优选三个,更优选四个是锁核酸(LNA)。还可以使用更短的反义寡核苷酸,即具有少于10个的核苷酸的反义寡核苷酸,但反义寡核苷酸越短,杂交强度不足、选择性降低或丧失的风险就越高。非选择性反义寡核苷酸具有与人类转录组中的非所需的区域以及编码其他蛋白质的非所需的mRNA结合的风险,从而产生非预期的副作用。还可以使用具有多于20个核苷酸的更长的反义寡核苷酸,但进一步增加长度使这种反义寡核苷酸的合成变得更加复杂和昂贵,而不能在提高选择性或杂交强度或针对降解的更好的稳定性方面有任何进一步的好处。
因此,本发明涉及由10至20个核苷酸组成的反义寡核苷酸。优选至少两个核苷酸,并且优选3'和5'末端核苷酸是LNA。因此,优选至少3'末端核苷酸是LNA,以及至少5'末端核苷酸是LNA。在存在多于2个LNA的情况下,优选将另外的LNA连接到3'或5'末端LNA上,例如在本文公开的gapmer的情况下。
存在于本发明的反义寡核苷酸中的一个核苷酸建造块可以由以下通式(B1)和(B2)表示:
其中
B代表核碱基;
IL’代表-X”-P(=X’)(X-)-;
R代表-H,-F,-OH,-NH2,-OCH3,-OCH2CH2OCH3以及R#代表-H;
或R和R#共同形成-R#-R-桥,其选自-CH2-O-,-CH2-S-,-CH2-NH-,-CH2-N(CH3)-,-CH2-N(C2H5)-,-CH2-CH2-O-,-CH2-CH2-S-,-CH2-CH2-NH-,-CH2-CH2-N(CH3)-或-CH2-CH2-N(C2H5)-;
X’代表=O或=S;
X-代表-O-,-OH,-ORH,-NHRH,-N(RH)2,-OCH2CH2ORH,-OCH2CH2SRH,-BH3 -,-RH,-SH,-SRH或-S-
X”代表-O-,-NH-,-NRH-,-CH2-或-S-;
Y是-O-,-NH-,-NRH-,-CH2-或-S-;
RH选自氢和C1-4-烷基并且优选-CH3或-C2H5并且最优选-CH3
优选地,X-代表-O-,-OH,-OCH3,-NH(CH3),-N(CH3)2,-OCH2CH2OCH3,-OCH2CH2SCH3,-BH3 -,-CH3,-SH,-SCH3或-S-;并且更优选-O-,-OH,-OCH3,-N(CH3)2,-OCH2CH2OCH3,-BH3 -,-SH,-SCH3或-S-
IL’优选代表-O-P(O)(O-)-,-O-P(O)(S-)-,-O-P(S)(S-)-,-S-P(O)(O-)-,-S-P(O)(S-)-,-S-P(S)(S-)-,-O-P(O)(O-)-,-O-P(O)(S-)-,-S-P(O)(O-)-,-O-P(O)(RH)-,-O-P(O)(ORH)-,-O-P(O)(NHRH)-,-O-P(O)[N(RH)2]-,-O-P(O)(BH3 -)-,-O-P(O)(OCH2CH2ORH)-,-O-P(O)(OCH2CH2SRH)-,-O-P(O)(O-)-,-NRH-P(O)(O-)-,其中RH选自氢和C1-4-烷基。
基团-O-P(O)(RH)-O-优选-O-P(O)(CH3)-O-或-O-P(O)(C2H5)-O-并且最优选-O-P(O)(CH3)-O-。
基团-O-P(O)(ORH)-O-优选-O-P(O)(OCH3)-O-或-O-P(O)(OC2H5)-O-并且最优选-O-P(O)(OCH3)-O-。
基团-O-P(O)(NHRH)-O-优选-O-P(O)(NHCH3)-O-或-O-P(O)(NHC2H5)-O-并且最优选-O-P(O)(NHCH3)-O-。
基团-O-P(O)[N(RH)2]-O-优选-O-P(O)[N(CH3)2]-O-或-O-P(O)[N(C2H5)2]-O-并且最优选-O-P(O)[N(CH3)2]-O-。
基团-O-P(O)(OCH2CH2ORH)-O-优选-O-P(O)(OCH2CH2OCH3)-O-或-O-P(O)(OCH2CH2OC2H5)-O-并且最优选-O-P(O)(OCH2CH2OCH3)-O-。
基团-O-P(O)(OCH2CH2SRH)-O-优选-O-P(O)(OCH2CH2SCH3)-O-或-O-P(O)(OCH2CH2SC2H5)-O-并且最优选-O-P(O)(OCH2CH2SCH3)-O-。
基团-O-P(O)(O-)-NRH-优选-O-P(O)(O-)-NH-或-O-P(O)(O-)-N(CH3)-并且最优选-O-P(O)(O-)-NH-。
基团-NRH-P(O)(O-)-O-优选-NH-P(O)(O-)-O-或-N(CH3)-P(O)(O-)-O-并且最优选-NH-P(O)(O-)-O-。
甚至更优选IL’代表-O-P(O)(O-)-,-O-P(O)(S-)-,-O-P(S)(S-)-,-O-P(O)(NHRH)-或-O-P(O)[N(RH)2]-,还更优选IL’代表-O-P(O)(O-)-,-O-P(O)(S-)-或-O-P(S)(S-)-,最优选IL’代表-O-P(O)(S-)-或-O-P(S)(S-)-。
优选地Y代表-O-。
优选地B代表选自A、T、G、C、U的标准核碱基。
优选地IL代表-O-P(=O)(S-)-或-O-P(=S)(S-)-。
因此优选以下的通式(B3)至(B6):
其中
B代表核碱基并且优选A、T、G、C、U;
R代表-H,-F,-OH,-NH2,-N(CH3)2,-OCH3,-OCH2CH2OCH3,-OCH2CH2CH2OH,-OCH2CH2CH2NH2并且优选-H;
R*代表如下文定义的-R#-R-部分并且,例如,优选选自-C(RaRb)-O-,-C(RaRb)-NRc-,-C(RaRb)-S-和-C(RaRb)-C(RaRb)-O-,其中取代基Ra、Rb和Rc具有如本文所定义的含义。更优选R*选自-CH2-O-,-CH2-S-,-CH2-NH-,-CH2-N(CH3)-,-CH2-CH2-O-或-CH2-CH2-S-,更优选-CH2-O-,-CH2-S-,-CH2-CH2-O-或-CH2-CH2-S-,还更优选-CH2-O-,-CH2-S-或-CH2-CH2-O-,还更优选-CH2-O-或-CH2-S-,最优选-CH2-O-。
非LNA单元的优选的核苷酸的实例如下:
/>
核苷间连接(IL)
本文所述的反义寡核苷酸的单体通过核苷间连接耦联在一起。合适地,每个单体都通过核苷间连接与相邻的3'单体相连。本领域普通技术人员应理解,在本发明的背景下,寡聚体的末端的5'单体不包含5'核苷间连接,尽管它可以包含或不包含5'末端基团。术语“核苷间连接”意指能够将两个核苷酸、两个核苷酸类似物(例如两个LNA)以及一个核苷酸和一个核苷酸类似物(例如LNA)共价耦联在一起的基团。具体和优选的实例包括磷酸基团和硫代磷酸基团。
本发明的反义寡核苷酸的核苷酸或其连续核苷酸序列通过核苷间连接耦联在一起。合适地,每个核苷酸都通过核苷间连接,经由5'位置连接到3'相邻核苷酸。
反义寡核苷酸可以通过几种不同的方式进行修饰。可以发生骨架内的修饰,是指它们的核苷间骨架中的磷酸基团(也称为磷酸二酯基团)部分或全部被其他基团替换的反义寡核苷酸。优选的经修饰的反义寡核苷酸骨架包括,例如,具有正常的3’-5’连接的硫代磷酸酯,手性硫代磷酸酯,二硫代磷酸酯,磷酸三酯,氨基烷基磷酸三酯,甲基、乙基和C3-C10-烷基膦酸酯(包括3'-亚烷基膦酸酯和手性膦酸酯),次膦酸酯,膦酰胺酯(包括3'-氨基磷酰胺酯和氨基烷基磷酰胺酯),硫代磷酰胺酯,硫代烷基膦酸酯,硫代烷基磷酸三酯和硼磷酸酯,它们的2'-5'连接的类似物,以及具有反向极性(其中相邻核苷酸单元配对是3'-5'至5'-3'或2'-5'至5'-2'连接)的类似物。还包括各种盐、混合盐和其游离酸形式,并在本文中进一步详细公开。
适合的核苷间连接包括WO2007/031091中所列出的,例如WO2007/031091的第34页第一段中列出的核苷间连接(通过引用并入本文)。在一些实施方案中,优选将核苷酸间连接从其正常的磷酸二酯修饰为更能抵抗核酸酶攻击的连接,例如硫代磷酸酯或硼磷酸酯—这两种连接被RNA酶H介导的切割所接受,也使得该途径的反义抑制减少了靶基因的表达。
核苷间连接由与核糖部分的3'碳原子结合的基团IL'和与相邻的核糖部分的5'碳原子结合的基团Y组成,如下式(IL’Y)所示
核苷间连接IL由-IL’-Y-表示。IL’代表-X”-P(=X’)(X-)-,从而IL由-X”-P(=X’)(X-)-Y-表示,其中取代基X-、X’、X”和Y具有如本文所公开的含义。
核苷间连接IL=-X”-P(=X’)(X-)-Y-优选选自由以下组成的组:
-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-S-P(O)(O-)-O-,-S-P(O)(S-)-O-,-S-P(S)(S-)-O-,-O-P(O)(O-)-S-,-O-P(O)(S-)-S-,-S-P(O)(O-)-S-,-O-P(O)(RH)-O-,-O-P(O)(ORH)-O-,-O-P(O)(NHRH)-O-,-O-P(O)[N(RH)2]-O-,-O-P(O)(BH3 -)-O-,-O-P(O)(OCH2CH2ORH)-O-,-O-P(O)(OCH2CH2SRH)-O-,-O-P(O)(O-)-NRH-,-NRH-P(O)(O-)-O-,其中RH选自氢和C1-4-烷基。
基团-O-P(O)(RH)-O-优选-O-P(O)(CH3)-O-或-O-P(O)(C2H5)-O-,最优选-O-P(O)(CH3)-O-。
基团-O-P(O)(ORH)-O-优选-O-P(O)(OCH3)-O-或-O-P(O)(OC2H5)-O-,最优选-O-P(O)(OCH3)-O-。
基团-O-P(O)(NHRH)-O-优选-O-P(O)(NHCH3)-O-或-O-P(O)(NHC2H5)-O-,最优选-O-P(O)(NHCH3)-O-。
基团-O-P(O)[N(RH)2]-O-优选-O-P(O)[N(CH3)2]-O-或-O-P(O)[N(C2H5)2]-O-,最优选-O-P(O)[N(CH3)2]-O-。
基团-O-P(O)(OCH2CH2ORH)-O-优选-O-P(O)(OCH2CH2OCH3)-O-或-O-P(O)(OCH2CH2OC2H5)-O-,最优选-O-P(O)(OCH2CH2OCH3)-O-。
基团-O-P(O)(OCH2CH2SRH)-O-优选-O-P(O)(OCH2CH2SCH3)-O-或-O-P(O)(OCH2CH2SC2H5)-O-,最优选-O-P(O)(OCH2CH2SCH3)-O-。
基团-O-P(O)(O-)-NRH-优选-O-P(O)(O-)-NH-或-O-P(O)(O-)-N(CH3)-,最优选-O-P(O)(O-)-NH-。
基团-NRH-P(O)(O-)-O-优选-NH-P(O)(O-)-O-或-N(CH3)-P(O)(O-)-O-,最优选-NH-P(O)(O-)-O-。
甚至更优选地IL代表-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-O-P(O)(NHRH)-O-或-O-P(O)[N(RH)2]-O-,还更优选地IL代表-O-P(O)(O-)-O-,-O-P(O)(S-)-O-或-O-P(S)(S-)-O-,最优选地IL代表-O-P(O)(S-)-O-或-O-P(O)(O-)-O-。
因此,IL优选磷酸基团(-O-P(O)(O-)-O-)、硫代磷酸基团(-O-P(O)(S-)-O-)或二硫代磷酸基团(-O-P(S)(S-)-O-)。
反义寡核苷酸的核苷酸单元或核苷通过核苷间连接彼此相连,因此在一个反义寡核苷酸中可以存在不同的核苷间连接。LNA单元优选通过非磷酸基团的核苷间连接进行连接。LNA单元通过基团IL彼此相连,所述基团IL优选选自-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-O-P(O)(NHRH)-O-和-O-P(O)[N(RH)2]-O-并且更优选选自-O-P(O)(S-)-O-和-O-P(S)(S-)-O-。
非LNA单元通过基团IL彼此相连,所述基团IL优选选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-O-P(O)(NHRH)-O-和-O-P(O)[N(RH)2]-O-并且更优选选自-O-P(O)(O-)-O-,-O-P(O)(S-)-O-和-O-P(S)(S-)-O-。
非LNA单元通过基团IL与LNA单元连接,所述基团IL优选选自-O-P(O)(S-)-O-,-O-P(S)(S-)-O-,-O-P(O)(NHRH)-O-和-O-P(O)[N(RH)2]-O-并且更优选选自-O-P(O)(S-)-O-和-O-P(S)(S-)-O-。
本文中使用的术语“LNA单元”是指锁定的核苷酸,即具有双环结构,特别是双环核糖结构的核苷酸,更特别是如通式(II)所示的双环核糖结构。桥将核糖“锁定”在3'-内(北)构象中。用连接2'氧和4'碳的额外的桥来修饰LNA核苷酸的核糖部分。LNA的可替代使用的术语是双环核苷酸或桥接核苷酸,因此,LNA单元的另外的术语是双环核苷酸单元或桥接核苷酸单元。
本文中使用的术语“非LNA单元”是指未锁定的核苷酸,即不具有双环糖部分,特别是不具有双环核糖结构,更特别是不具有如通式(II)所示的双环核糖结构的核苷酸。非LNA单元优选DNA单元。
本文中使用的术语“DNA单元”是指含有2-脱氧核糖作为糖的核苷酸。因此,核苷酸由核碱基和2-脱氧核糖组成。
本文中使用的术语“单元”是指本发明的反义寡核苷酸的一部分、片段或部分。因此,“单元”不是完整的分子,而是反义寡核苷酸的一部分或片段或部分,其具有至少一个用于与反义寡核苷酸的另外的一部分或片段或部分进行共价连接的位置。例如,通式结构(B1)至(B6)是单元,因为它们可以分别通过基团Y和IL'或-O-和-O-P(O)(S-)-共价连接。优选地,单元是由戊糖结构、与戊糖结构相连的核碱基、5'基团和IL基团组成的部分。
本文中使用的术语“建造块”或“单体”是指分子,特别是指用于合成本发明的反义寡核苷酸的核苷酸。
实例是通式(I)的LNA分子,其中Y代表5’末端基团,IL’代表3’末端基团。
优选本文中提供的含有适合的硫(S)的核苷间连接。
优选骨架中的硫代磷酸酯部分,其中至少50%的核苷间连接是硫代磷酸酯基团。如果存在LNA单元,还优选LNA单元通过硫代磷酸酯连接作为核苷内连接。最优选完整的硫代磷酸酯骨架,即最优选的是所有核苷酸单元以及LNA单元(如果存在)通过硫代磷酸酯基团相互连接,硫代磷酸酯基团的定义如下:-O-P(O)(S-)-O-,其与-O-P(O,S)-O-或-O-P(O-)(S)-O-同义。
在反义寡核苷酸是gapmer的情况下,优选LNA区域具有选自-O-P(O)(S-)-O-和-O-P(S)(S-)-O-的核苷间连接,非LNA区域(即中间的部分)具有选自-O-P(O)(O-)-O-、-O-P(O)(S-)-O-和-O-P(S)(S-)-O-的核苷间连接,并且LNA区域通过选自-O-P(O)(O-)-O-、-O-P(O)(S-)-O-和-O-P(S)(S-)-O-的核苷间连接与非LNA区域相连。
甚至更优选地,所有核苷酸间连接(即10聚体中的9个和20聚体中的19个)都选自-O-P(O)(S-)-O-和-O-P(S)(S-)-O-。还更优选地,所有核苷间连接是硫代磷酸酯基团(-O-P(O)(S-)-O-)或是二硫代磷酸酯基团(-O-P(S)(S-)-O-)。
锁核酸
特别优选地,反义寡核苷酸中的通式(B1)或(B2)的一些核苷酸由所谓的LNA(锁核酸)替换。缩写LNA是注册商标,但本文中术语“LNA”仅用于描述。
优选地,末端核苷酸由LNA替换,更优选在3'端的最后1至4个核苷酸和/或在5'端的最后1至4个核苷酸由LNA替换。还优选,至少在3'端和5'端的末端核苷酸各自被LNA替换。
本文中使用的术语“LNA”是指双环核苷酸类似物,称为“锁核酸”。它可以指LNA单体,或者,当用于“LNA反义寡核苷酸”或“含有LNA的反义寡核苷酸”的背景下时,LNA是指含有一个或多个此类双环核苷酸类似物的寡核苷酸。LNA核苷酸的特点是在核糖环的C2'和C4'之间存在接头基团(例如桥)--例如下面所述的双基R#-R。本发明的反义寡核苷酸中使用的LNA优选具有通式(I)的结构
其中,对于所有手性中心,不对称基团可以以R或S方向存在;
其中X选自-O-、-S-、-N(RN)-、-C(R6R7)-,优选X是-O-;
B选自氢,任选取代的C1-4-烷氧基、任选取代的C1-4-烷基、任选取代的C1-4-乙酰氧基、核碱基和核碱基类似物,优选B是核碱基或核碱基类似物,最优选标准核碱基;
如果通式(I)的部分是本发明反义寡核苷酸的LNA单元,则Y代表与相邻核苷酸的核苷间连接的一部分;如果通式(I)的部分是用于合成本发明的反义寡核苷酸的单体或建造块,则Y代表5'末端基团。5'碳原子任选地包括取代基R4和R5
如果通式(I)的部分是本发明的反义寡核苷酸的LNA单元,IL'代表与相邻核苷酸的核苷间连接的一部分;如果通式(I)的部分是用于合成本发明的反义寡核苷酸的单体或建造块,则IL'代表3'末端基团。
R#和R共同代表由1-4个基团或原子组成的二价接头基团,这些基团或原子选自-C(RaRb)-、-C(Ra)=C(Rb)-、-C(Ra)=N-、-O-、-Si(Ra)2-、-S-、-SO2-、-N(Rc)-和>C=Z,其中Z选自-O-、-S-和-N(Ra)-,Ra、Rb和Rc各自独立地选自氢、任选取代的C1-12烷基、任选取代的C2-6烷烯基、任选取代的C2-6烷炔基、羟基、任选取代的C1-12烷氧基、C1-6-烷氧基-C1-6-烷基、C2-6-烯氧基、羧基、C1-12-烷氧羰基、C1-12-烷基羰基、甲酰基、芳基、芳氧基-羰基、芳氧基、芳基羰基、杂芳基、杂芳氧基-羰基、杂芳氧基、杂芳羰基、氨基、单和双(C1-6-烷基)氨基、氨甲酰基、单和双(C1-6-烷基)氨基羰基、氨基-C1-6-烯基-氨基羰基、单和双(C1-6-烷基)氨基-C1-6-烯基-氨基羰基、C1-6-烷基-羰基氨基、脲基、C1-6-烷酰氧基、砜(sulphono)、C1-6-烷基磺酰基氧基(alkylsulphonyloxy)、硝基、叠氮基、磺酰基(sulphanyl)、C1-6-烷硫基、卤素,其中芳基和杂芳基可以是任选取代的,其中两个成对取代基Ra和Rb一起可以代表任选取代的亚甲基(=CH2),其中对于所有手性中心,不对称基团可以以R或S方向存在,以及;
存在的每个取代基R1、R2、R3、R4、R5、R6和R7独立地选自氢、任选取代的C1-12-烷基、任选取代的C2-6-烯基、任选取代的C2-6-炔基、羟基、C1-12-烷氧基、C1-6-烷氧基-C1-6-烷基、C2-6-烯氧基、羧基、C1-12-烷氧羰基、C1-12-烷基羰基、甲酰基、芳基、芳氧基-羰基、芳氧基、芳甲酰基、杂芳基、杂芳氧-羰基、杂芳氧基、杂芳羰基、氨基、单-和双(C1-6-烷基)氨基、氨甲酰基、单-和双(C1-6-烷基)-氨基-羰基、氨基-C1-6-烷基-氨基羰基、单-和双(C1-6-烷基)氨基-C1-6-烷基-氨基羰基、C1-6-烷基-羰基氨基、脲基、C1-6-烷酰氧基、砜、C1-6-烷基磺酰基氧基、硝基、叠氮基、磺酰基、C1-6-烷硫基、卤素,其中芳基和杂芳基可以是任选取代的,并且其中两个成对取代基一起可以指代氧络、硫代氧基、亚氨基或任选取代的亚甲基;
其中,RN选自氢和C1-4-烷基,并且其中两个相邻(非成对)取代基可以指代产生双键的另外的键;当RN存在且不参与双基时,其选自氢和C1-4-烷基;以及它们的碱性盐和酸加成盐。对于所有手性中心,不对称基团可以以R或S方向存在。
在优选的实施方案中,R#和R一起代表由选自由-C(RaRb)-C(RaRb)-、-C(RaRb)-O-、-C(RaRb)-NRc-、-C(RaRb)-S-和-C(RaRb)-C(RaRb)-O-组成的组的基团组成的双基,其中每个Ra、Rb和Rc可以任选地独立选择。
在一些实施方案中,Ra和Rb可以任选地独立选自由氢和C1-6-烷基组成的组,例如甲基,并且优选是氢。
在优选的实施方案中,R1、R2、R3、R4和R5独立地选自由氢、卤素、C1-6-烷基、取代的C1-6-烷基、C2-6-烯基、取代的C2-6-烯基、C2-6-炔基或取代的C2-6-炔基、C1-6-烷氧基、取代的C1-6-烷氧基、酰基、取代的酰基、C1-6-氨基烷基或取代的C1-6-氨基烷基组成的组。对于所有手性中心,不对称基团可以以R或S方向存在。
在优选的实施方案中,R1、R2、R3、R4和R5是氢。
在一些实施方案中,R1、R2和R3独立地选自由氢、卤素、C1-6-烷基、取代的C1-6-烷基、C2-6-烯基、取代的C2-6-烯基、C2-6-炔基或取代的C2-6-炔基、C1-6-烷氧基、取代的C1-6-烷氧基、酰基、取代的酰基、C1-6-氨基烷基或取代的C1-6-氨基烷基组成的组。对于所有手性中心,不对称基团可以以R或S方向存在。在优选的实施方案中,R1、R2和R3是氢。
在优选的实施方案中,R4和R5各自独立地选自由-H、-CH3、-CH2-CH3、-CH2-O-CH3和-CH=CH2组成的组。合适地,在一些实施方案中,R4或R5是氢,而另一个基团(分别是R4和R5)选自由C1-6-烷基、C2-6-烯基、C2-6-炔基、取代的C1-6-烷基、取代的C2-6-烯基、取代的C2-6-炔基或取代的酰基(-C(=O)-)组成的组;其中每个取代基用由独立选自卤素、C1-6-烷基、取代的C1-6-烷基、C2-6-烯基、取代的C2-6-烯基、C2-6-炔基、取代的C2-6-炔基、-OJ1、-SJ1、-NJ1J2、-N3、-COOJ1、-CN、-O-C(=O)NJ1J2、-N(H)C(=NH)NJ1J2或-N(H)C(=X)N(H)J2的基团进行单或多取代,其中X是O或S;并且每个J1和J2独立地是-H、C1-6-烷基、取代的C1-6-烷基、C2-6-烯基、取代的C2-6-烯基、C2-6-炔基、取代的C2-6-炔基、C1-6-氨基烷基、取代的C1-6-氨基烷基或保护基团。在一些实施方案中,R4或R5是取代的C1-6-烷基。在一些实施方案中,R4或R5是取代的亚甲基,其中优选的取代基包括独立选自-F、-NJ1J2、-N3、-CN、-OJ1、-SJ1、-O-C(=O)NJ1J2、-N(H)C(=NH)NJ1J2或-N(H)C(=O)N(H)J2的一个或多个基团。在一些实施方案中,每个J1和J2独立地是-H或C1-6-烷基。在一些实施方案中,R4或R5是甲基、乙基或甲氧基甲基。在一些实施方案中,R4或R5是甲基。在进一步的实施方案中,R4或R5是乙烯基。在一些实施方案中,R4或R5是取代的酰基。在一些实施方案中,R4或R5是-O-C(=O)NJ1J2。对于所有手性中心,不对称基团可以以R或S方向存在。此类5'修饰的双环核苷酸公开于WO2007/134181A中,其通过引用整体并入本文。
在一些实施方案中,B是核碱基,包括核碱基类似物和天然存在的核碱基,例如嘌呤或嘧啶,或取代的嘌呤或取代的嘧啶,例如本文中所指的核碱基,例如选自由腺嘌呤、胞嘧啶、胸腺嘧啶、腺嘌呤、尿嘧啶和/或修饰或取代的碱基,例如5-噻唑尿嘧啶、2-硫代尿嘧啶、5-丙炔基-尿嘧啶、2'硫代胸腺嘧啶、5-甲基胞嘧啶、5-噻唑胞嘧啶、5-丙炔基-胞嘧啶、2,6-二氨基嘌呤等组成的组的核碱基。
在优选的实施方案中,R#和R一起代表选自-C(RaRb)-O-、-C(RaRb)-C(RcRd)-O-、-C(RaRb)-C(RcRd)-C(ReRf)-O-、-C(RaRb)-O-C(RdRe)-、-C(RaRb)-O-C(RdRe)-O-、-C(RaRb)-C(RdRe)-、-C(RaRb)-C(RcRd)-C(ReRf)-、-C(Ra)=C(Rb)-C(RdRe)-、-C(RaRb)-N(Rc)-、-C(RaRb)-C(RdRe)-N(Rc)-、-C(RaRb)-N(Rc)-O-、-C(RaRb)-S-和-C(RaRb)-C(RdRe)-S-的双基,其中Ra、Rb、Rc、Rd、Re和Rf各自独立选自氢、任选取代的C1-12-烷基、任选取代的C2-6-烯基、任选取代的C2-6-炔基、羟基、C1-12-烷氧基、C1-6-烷氧基-C1-6-烷基、C2-6-烯氧基、羧基、C1-12-烷氧羰基、C1-12-烷基羰基、甲酰基、芳基、芳氧基-羰基、芳氧基、芳甲酰基、杂芳基、杂芳氧-羰基、杂芳氧基、杂芳羰基、氨基、单-和双(C1-6-烷基)氨基、氨甲酰基、单-和双(C1-6-烷基)-氨基-羰基、氨基-C1-6-烷基-氨基羰基、单-和双(C1-6-烷基)氨基-C1-6-烷基-氨基羰基、C1-6-烷基-羰基氨基、脲基、C1-6-烷酰氧基、砜、C1-6-烷基磺酰基氧基、硝基、叠氮基、磺酰基、C1-6-烷硫基、卤素,其中芳基和杂芳基可以是任选取代的,并且两个成对取代基Ra和Rb一起可以指代任选取代的亚甲基(=CH2)。对于所有手性中心,不对称基团可以以R或S方向存在。
在进一步的实施方案中,R#和R一起指代选自-CH2-O-、-CH2-S-、-CH2-NH-、-CH2-N(CH3)-、-CH2-CH2-O-、-CH2-CH(CH3)-、-CH2-CH2-S-、-CH2-CH2-NH-、-CH2-CH2-CH2-、-CH2-CH2-CH2-O-、-CH2-CH2-CH(CH3)-、-CH=CH-CH2-、-CH2-O-CH2-O-、-CH2-NH-O-、-CH2-N(CH3)-O-、-CH2-O-CH2-、-CH(CH3)-O-、-CH(CH2-O-CH3)-O-、-CH2-CH2-和-CH=CH-的双基(二价基团)。对于所有手性中心,不对称基团可以以R或S方向存在。
在一些实施方案中,R#和R一起指代双基-C(RaRb)-N(Rc)-O-,其中Ra和Rb独立选自由氢、卤素、C1-6-烷基、取代的C1-6-烷基、C2-6-烯基、取代的C2-6-烯基、C2-6-炔基或取代的C2-6-炔基、C1-6-烷氧基、取代的C1-6-烷氧基、酰基、取代的酰基、C1-6-氨基烷基或取代的C1-6-氨基烷基组成的组,例如氢,以及;其中Rc选自由氢、卤素、C1-6-烷基、取代的C1-6-烷基、C2-6-烯基、取代的C2-6-烯基、C2-6-炔基或取代的C2-6-炔基、C1-6-烷氧基、取代的C1-6-烷氧基、酰基、取代的酰基、C1-6-氨基烷基或取代的C1-6-氨基烷基组成的组,并且优选氢。
在优选的实施方案中,R#和R一起代表双基-C(RaRb)-O-C(RdRe)-O-,其中Ra、Rb、Rd和Re独立选自由氢、卤素、C1-6-烷基、取代的C1-6-烷基、C2-6-烯基、取代的C2-6-烯基、C2-6-炔基或取代的C2-6-炔基、C1-6-烷氧基、取代的C1-6-烷氧基、酰基、取代的酰基、C1-6-氨基烷基或取代的C1-6-氨基烷基组成的组,并且优选氢。
在优选的实施方案中,R#和R形成双基-CH(Z)-O-,其中Z选自由C1-6-烷基、C2-6-烯基、C2-6-炔基、取代的C1-6-烷基、取代的C2-6-烯基、取代的C2-6-炔基、酰基、取代的酰基、取代的酰胺基、巯基或取代的巯基组成的组;并且其中每个取代基用独立选自卤素、氧络、羟基OJ1、-NJ1J2、-SJ1、-N3、-OC(=X)J1、-OC(=X)NJ1J2、-NJ3C(=X)NJ1J2和-CN的任选被保护的取代基独立进行单或多取代,其中每个J1、J2和J3独立地是-H或C1-6-烷基,X是O、S或NJ1。在优选的实施方案中,Z是C1-6-烷基或取代的C1-6-烷基。在进一步的实施方案中,Z是甲基。在优选的实施方案中,Z是取代的C1-6-烷基。在优选的实施方案中,所述取代基是C1-6-烷氧基。在某些实施方案中,Z是CH3OCH2-。对于所有手性中心,不对称基团可以以R或S方向存在。此类双环核苷酸公开于US7,399,845中,其通过引用整体并入本文。在优选的实施方案中,R1、R2、R3、R4和R5是氢。在优选的实施方案中,R1、R2和R3是氢,并且R4、R5中的一个或两个可以不是氢,如上文和WO2007/134181中所述。
在优选的实施方案中,R#和R一起代表双基,其在桥中包含取代的氨基,例如双基-CH2-N(Rc)-,其中Rc是C1-12-烷氧基。在优选的实施方案中,R#和R一起代表双基-Cq3q4-NOR-,其中q3和q4独立地选自由氢、卤素、C1-6-烷基、取代的C1-6-烷基、C2-6-烯基、取代的C2-6-烯基、C2-6-炔基或取代的C2-6-炔基、C1-6-烷氧基、取代的C1-6-烷氧基、酰基、取代的酰基、C1-6-氨基烷基或取代的C1-6-氨基烷基组成的组;其中每个取代的基团用独立选自卤素、-OJ1、-SJ1、-NJ1J2、-COOJ1、-CN、-OC(=O)NJ1J2、-NH-C(=NH)NJ1J2或-NH-C(=X)NHJ2的取代基团独立进行单或多取代,其中X是O或S;并且J1和J2各自独立地是-H、C1-6-烷基、C2-6-烯基、C2-6-炔基、C1-6-氨基烷基或保护基团。对于所有手性中心,不对称基团可以以R或S方向存在。此类双环核苷酸公开于WO2008/150729中,其通过引用整体并入本文。在优选的实施方案中,R1、R2、R3、R4和R5独立地选自由氢、卤素、C1-6-烷基、取代的C1-6-烷基、C2-6-烯基、取代的C2-6-烯基、C2-6-炔基或取代的C2-6-炔基、C1-6-烷氧基、取代的C1-6-烷氧基、酰基、取代的酰基、C1-6-氨基烷基或取代的C1-6-氨基烷基组成的组。在优选的实施方案中,R1、R2、R3、R4和R5是氢。在优选的实施方案中,R1、R2和R3是氢,并且R4、R5中的一个或两个可以不是氢,如上文和WO2007/134181中所述。
在优选的实施方案中,R#和R一起代表双基(二价基团)-C(RaRb)-O-,其中Ra和Rb各自独立地是卤素、C1-12-烷基、取代的C1-12-烷基、C2-6-烯基、取代的C2-6-烯基、C2-6-炔基、取代的C2-6-炔基、C1-12-烷氧基、取代的C1-12-烷氧基、-OJ1、-SJ1、-S(O)J1、-SO2-J1、-NJ1J2、-N3、-CN、-C(=O)OJ1、-C(=O)NJ1J2、-C(=O)J1、-OC(=O)NJ1J2、-NH-C(=NH)NJ1J2、-NH-C(=O)NJ1J2或-NH-C(=S)NJ1J2;或Ra和Rb一起是=C(q3)(q4);q3和q4各自独立地是-H、卤素、C1-12-烷基或取代的C1-12-烷基;每个取代的基团用独立选自卤素、C1-6-烷基、取代的C1-6-烷基、C2-6-烯基、取代的C2-6-烯基、C2-6-炔基、取代的C2-6-炔基、-OJ1、-SJ1、-NJ1J2、-N3、-CN、-C(=O)OJ1、-C(=O)NJ1J2、-C(=O)J1、-OC(=O)NJ1J2、-NH-C(=O)NJ1J2或-NH-C(=S)NJ1J2的取代基团独立进行单或多取代,并且;每个J1和J2各自独立地是-H、C1-6-烷基、取代的C1-6-烷基、C2-6-烯基、取代的C2-6-烯基、C2-6-炔基、取代的C2-6-炔基、C1-6-氨基烷基、取代的C1-6-氨基烷基或保护基团。此类化合物公开于WO2009006478A中,其通过引用整体并入本文。
在优选的实施方案中,R#和R形成双基-Q-,其中Q是-C(q1)(q2)C(q3)(q4)-、-C(q1)=C(q3)-、-C[=C(q1)(q2)]-C(q3)(q4)-或-C(q1)(q2)-C[=C(q3)(q4)]-;
q1、q2、q3、q4各自独立地是-H、卤素、C1-12-烷基、取代的C1-12-烷基、C2-6-烯基、取代的C1-12-烷氧基、-OJ1、-SJ1、-S(O)J1、-SO2-J1、-NJ1J2、-N3、-CN、-C(=O)OJ1、-C(=O)NJ1J2、-C(=O)J1、-OC(=O)NJ1J2、-NH-C(=NH)NJ1J2、-NH-C(=O)NJ1J2或-NH-C(=S)NJ1J2;J1和J2各自独立地是-H、C1-6-烷基、C2-6-烯基、C2-6-炔基、C1-6-氨基烷基或保护基团;并且任选地,当Q是-C(q1)(q2)C(q3)(q4)-并且q3或q4中的一个是-CH3时,则至少q3或q4中的另一个或q1或q2中的一个不是-H。在优选的实施方案中,R1、R2、R3、R4和R5是氢。对于所有手性中心,不对称基团可以以R或S方向存在。此类双环核苷酸公开于WO2008/154401中,其通过引用整体并入本文。在优选的实施方案中,R1、R2、R3、R4和R5各自独立地选自由氢、卤素、C1-6-烷基、取代的C1-6-烷基、C2-6-烯基、取代的C2-6-烯基、C2-6-炔基或取代的C2-6-炔基、C1-6-烷氧基、取代的C1-6-烷氧基、酰基、取代的酰基、C1-6-氨基烷基或取代的C1-6-氨基烷基组成的组。在优选的实施方案中,R1、R2、R3、R4和R5是氢。在优选的实施方案中,R1、R2是R3是氢,R4、R5中的一个或两个可以不是氢,如上文和WO2007/134181或WO2009/067647中(α-L双环核酸类似物)所述。
本文中使用的术语“C1-C6-烷基”是指-CH3,-C2H5,-C3H7,-CH(CH3)2,-C4H9,-CH2-CH(CH3)2,-CH(CH3)-C2H5,-C(CH3)3,-C5H11,-CH(CH3)-C3H7,-CH2-CH(CH3)-C2H5,-CH(CH3)-CH(CH3)2,-C(CH3)2-C2H5,-CH2-C(CH3)3,-CH(C2H5)2,-C2H4-CH(CH3)2,-C6H13,-C3H6-CH(CH3)2,-C2H4-CH(CH3)-C2H5,-CH(CH3)-C4H9,-CH2-CH(CH3)-C3H7,-CH(CH3)-CH2-CH(CH3)2,-CH(CH3)-CH(CH3)-C2H5,-CH2-CH(CH3)-CH(CH3)2,-CH2-C(CH3)2-C2H5,-C(CH3)2-C3H7,-C(CH3)2-CH(CH3)2,-C2H4-C(CH3)3,-CH2-CH(C2H5)2和-CH(CH3)-C(CH3)3。术语“C1-C6-烷基”还应包括“C1-C6-环烷基”例如环-C3H5,环-C4H7,环-C5H9和环-C6H11
优选-CH3,-C2H5,-C3H7,-CH(CH3)2,-C4H9,-CH2-CH(CH3)2,-CH(CH3)-C2H5,-C(CH3)3和-C5H11。特别优选-CH3,-C2H5,-C3H7和-CH(CH3)2
术语“C1-C6-烷基”还应包括“C1-C6-环烷基”例如环-C3H5,环-C4H7,环-C5H9和环-C6H11
本文中使用的术语“C1-C12-烷基”是指C1-C6-烷基,-C7H15,-C8H17,-C9H19,-C10H21,-C11H23,-C12H25
本文中使用的术语“C1-C6-烷烯基”是指-CH2-,-C2H4-,-CH(CH3)-,-C3H6-,-CH2-CH(CH3)-,-CH(CH3)-CH2-,-C(CH3)2-,-C4H8-,-CH2-C(CH3)2-,-C(CH3)2-CH2-,-C2H4-CH(CH3)-,-CH(CH3)-C2H4-,-CH2-CH(CH3)-CH2-,-CH(CH3)-CH(CH3)-,-C5H10-,-CH(CH3)-C3H6-,-CH2-CH(CH3)-C2H4-,-C2H4-CH(CH3)-CH2-,-C3H6-CH(CH3)-,-C2H4-C(CH3)2-,-C(CH3)2-C2H4-,-CH2-C(CH3)2-CH2-,-CH2-CH(CH3)-CH(CH3)-,-CH(CH3)-CH2-CH(CH3)-,-CH(CH3)-CH(CH3)-CH2-,-CH(CH3)-CH(CH3)-CH(CH3)-,-C(CH3)2-C3H6-,-CH2-C(CH3)2-C2H4-,-C2H4-C(CH3)2-CH2-,-C3H6-C(CH3)2-,-CH(CH3)-C4H8-,-C6H12-,-CH2-CH(CH3)-C3H6-,-C2H4-CH(CH3)-C2H4-,-C3H6-CH(CH3)-CH2-,-C4H8-CH(CH3)-,-C2H4-CH(CH3)-CH(CH3)-,-CH2-CH(CH3)-CH(CH3)-CH2-,-CH2-CH(CH3)-CH2-CH(CH3)-,-CH(CH3)-C2H4-CH(CH3)-,-CH(CH3)-CH2-CH(CH3)-CH2-和-CH(CH3)-CH(CH3)-C2H4-。
本文中使用的术语“C2-C6-烯基”是指-CH=CH2,-CH2-CH=CH2,-C(CH3)=CH2,-CH=CH-CH3,-C2H4-CH=CH2,-CH2-CH=CH-CH3,-CH=CH-C2H5,-CH2-C(CH3)=CH2,-CH(CH3)-CH=CH,-CH=C(CH3)2,-C(CH3)=CH-CH3,-CH=CH-CH=CH2,-C3H6-CH=CH2,-C2H4-CH=CH-CH3,-CH2-CH=CH-C2H5,-CH=CH-C3H7,-CH2-CH=CH-CH=CH2,-CH=CH-CH=CH-CH3,-CH=CH-CH2-CH=CH2,-C(CH3)=CH-CH=CH2,-CH=C(CH3)-CH=CH2,-CH=CH-C(CH3)=CH2,-C2H4-C(CH3)=CH2,-CH2-CH(CH3)-CH=CH2,-CH(CH3)-CH2-CH=CH2,-CH2-CH=C(CH3)2,-CH2-C(CH3)=CH-CH3,-CH(CH3)-CH=CH-CH3,-CH=CH-CH(CH3)2,-CH=C(CH3)-C2H5,-C(CH3)=CH-C2H5,-C(CH3)=C(CH3)2,-C(CH3)2-CH=CH2,-CH(CH3)-C(CH3)=CH2,-C(CH3)=CH-CH=CH2,-CH=C(CH3)-CH=CH2,-CH=CH-C(CH3)=CH2,-C4H8-CH=CH2,-C3H6-CH=CH-CH3,-C2H4-CH=CH-C2H5,-CH2-CH=CH-C3H7,-CH=CH-C4H9,-C3H6-C(CH3)=CH2,-C2H4-CH(CH3)-CH=CH2,-CH2-CH(CH3)-CH2-CH=CH2,-CH(CH3)-C2H4-CH=CH2,-C2H4-CH=C(CH3)2,-C2H4-C(CH3)=CH-CH3,-CH2-CH(CH3)-CH=CH-CH3,-CH(CH3)-CH2-CH=CH-CH3,-CH2-CH=CH-CH(CH3)2,-CH2-CH=C(CH3)-C2H5,-CH2-C(CH3)=CH-C2H5,-CH(CH3)-CH=CH-C2H5,-CH=CH-CH2-CH(CH3)2,-CH=CH-CH(CH3)-C2H5,-CH=C(CH3)-C3H7,-C(CH3)=CH-C3H7,-CH2-CH(CH3)-C(CH3)=CH2,-CH(CH3)-CH2-C(CH3)=CH2,-CH(CH3)-CH(CH3)-CH=CH2,-CH2-C(CH3)2-CH=CH2,-C(CH3)2-CH2-CH=CH2,-CH2-C(CH3)=C(CH3)2,-CH(CH3)-CH=C(CH3)2,-C(CH3)2-CH=CH-CH3,-CH(CH3)-C(CH3)=CH-CH3,-CH=C(CH3)-CH(CH3)2,-C(CH3)=CH-CH(CH3)2,-C(CH3)=C(CH3)-C2H5,-CH=CH-C(CH3)3,-C(CH3)2-C(CH3)=CH2,-CH(C2H5)-C(CH3)=CH2,-C(CH3)(C2H5)-CH=CH2,-CH(CH3)-C(C2H5)=CH2,-CH2-C(C3H7)=CH2,-CH2-C(C2H5)=CH-CH3,-CH(C2H5)-CH=CH-CH3,-C(C4H9)=CH2,-C(C3H7)=CH-CH3,-C(C2H5)=CH-C2H5,-C(C2H5)=C(CH3)2,-C[C(CH3)3]=CH2,-C[CH(CH3)(C2H5)]=CH2,-C[CH2-CH(CH3)2]=CH2,-C2H4-CH=CH-CH=CH2,-CH2-CH=CH-CH2-CH=CH2,-CH=CH-C2H4-CH=CH2,-CH2-CH=CH-CH=CH-CH3,-CH=CH-CH2-CH=CH-CH3,-CH=CH-CH=CH-C2H5,-CH2-CH=CH-C(CH3)=CH2,-CH2-CH=C(CH3)-CH=CH2,-CH2-C(CH3)=CH-CH=CH2,-CH(CH3)-CH=CH-CH=CH2,-CH=CH-CH2-C(CH3)=CH2,-CH=CH-CH(CH3)-CH=CH2,-CH=C(CH3)-CH2-CH=CH2,-C(CH3)=CH-CH2-CH=CH2,-CH=CH-CH=C(CH3)2,-CH=CH-C(CH3)=CH-CH3,-CH=C(CH3)-CH=CH-CH3,-C(CH3)=CH-CH=CH-CH3,-CH=C(CH3)-C(CH3)=CH2,-C(CH3)=CH-C(CH3)=CH2,-C(CH3)=C(CH3)-CH=CH2和-CH=CH-CH=CH-CH=CH2
优选-CH=CH2,-CH2-CH=CH2,-C(CH3)=CH2,-CH=CH-CH3,-C2H4-CH=CH2,-CH2-CH=CH-CH3。特别优选-CH=CH2,-CH2-CH=CH2和-CH=CH-CH3
本文中使用的术语“C2-C6-炔基”是指-C≡CH,-C≡C-CH3,-CH2-C≡CH,-C2H4-C≡CH,-CH2-C≡C-CH3,-C≡C-C2H5,-C3H6-C≡CH,-C2H4-C≡C-CH3,-CH2-C≡C-C2H5,-C≡C-C3H7,-CH(CH3)-C≡CH,-CH2-CH(CH3)-C≡CH,-CH(CH3)-CH2-C≡CH,-CH(CH3)-C≡C-CH3,-C4H8-C≡CH,-C3H6-C≡C-CH3,-C2H4-C≡C-C2H5,-CH2-C≡C-C3H7,-C≡C-C4H9,-C2H4-CH(CH3)-C≡CH,-CH2-CH(CH3)-CH2-C≡CH,-CH(CH3)-C2H4-C≡CH,-CH2-CH(CH3)-C≡C-CH3,-CH(CH3)-CH2-C≡C-CH3,-CH(CH3)-C≡C-C2H5,-CH2-C≡C-CH(CH3)2,-C≡C-CH(CH3)-C2H5,-C≡C-CH2-CH(CH3)2,-C≡C-C(CH3)3,-CH(C2H5)-C≡C-CH3,-C(CH3)2-C≡C-CH3,-CH(C2H5)-CH2-C≡CH,-CH2-CH(C2H5)-C≡CH,-C(CH3)2-CH2-C≡CH,-CH2-C(CH3)2-C≡CH,-CH(CH3)-CH(CH3)-C≡CH,-CH(C3H7)-C≡CH,-C(CH3)(C2H5)-C≡CH,-C≡C-C≡CH,-CH2-C≡C-C≡CH,-C≡C-C≡C-CH3,-CH(C≡CH)2,-C2H4-C≡C-C≡CH,-CH2-C≡C-CH2-C≡CH,-C≡C-C2H4-C≡CH,-CH2-C≡C-C≡C-CH3,-C≡C-CH2-C≡C-CH3,-C≡C-C≡C-C2H5,-C≡C-CH(CH3)-C≡CH,-CH(CH3)-C≡C-C≡CH,-CH(C≡CH)-CH2-C≡CH,-C(C≡CH)2-CH3,-CH2-CH(C≡CH)2,-CH(C≡CH)-C≡C-CH3。优选-C≡CH和-C≡C-CH3
术语“C1-6-烷氧基”是指“C1-C6-烷基-O-”。术语“C1-12-烷氧基”是指“C1-C12-烷基-O-”。术语“C1-6-氨基烷基”是指“H2N-C1-C6-烷基-”。术语“C2-C6-烯基氧基”是指“C2-C6-烯基-O-”。术语“C1-6-烷基羰基”是指“C1-C6-烷基-CO-”。还指“酰基”。术语“C1-12-烷基羰基”是指“C1-C12-烷基-CO-”。还指“酰基”。术语“C1-6-烷氧羰基”是指“C1-C6-烷基-O-CO-”。术语“C1-12-烷氧羰基”是指“C1-C12-烷基-O-CO-”。术语“C1-C6-烷酰氧基”是指“C1-C6-烷基-CO-O-”。术语“C1-6-烷硫基”是指“C1-C6-烷基-S-”。术语“C1-6-烷基磺酰基氧基”是指“C1-C6-烷基-SO2-O-”。术语“C1-6-烷基羰基氨基”是指“C1-C6-烷基-CO-NH-”。术语“C1-6-烷基氨基”是指“C1-C6-烷基-NH-”。术语“(C1-6-)2烷基氨基”是指二烷氨基基团例如“[C1-C6-烷基][C1-C6-烷基]N-”。术语“C1-6-烷基氨羰基”是指“C1-C6-烷基-NH-CO-”。术语“(C1-6-)2烷基氨羰基”是指二烷基氨羰基基团例如“[C1-C6-烷基][C1-C6-烷基]N-CO-”。术语“氨基-C1-6-烷基氨羰基”是指“H2N-[C1-C6-烷基烯基]-NH-CO-”。术语“C1-6-烷基-氨基-C1-6-烷基氨羰基”是指“C1-6-烷基-HN-[C1-C6-烷基烯基]-NH-CO-”。术语“(C1-6-)2烷基-氨基-C1-6-烷基氨羰基”是指“[C1-C6-烷基][C1-C6-烷基]N-[C1-C6-烷基烯基]-NH-CO-”。术语“芳基”是指苯基、甲苯基、取代苯基和取代甲苯基。术语“芳氧基”是指“芳基-O-”。术语“芳基羰基”是指“芳基-CO-”。术语“芳氧羰基”是指“芳基-O-CO-”。
术语“杂芳基”是指具有4至9个环原子的取代或未取代的芳杂环基团,其中1至4个原子选自O、N和/或S。优选的“杂芳基”基团在5或6元芳香环上有1或2个杂原子。包括单环和双环系统。典型的“杂芳基”基团是:吡啶基、呋喃基、噻吩基、吡咯基、噁唑基、噻唑基、咪唑基、异噁唑基、异噻唑基、噁二唑基、哒嗪基、嘧啶基、吡嗪基、1,3,5-三嗪基、1,2,3-三唑基、1,3,4-噻二唑基、吲哚嗪基、吲哚基、异吲哚基,苯并[b]呋喃基、苯并[b]噻吩基、吲唑基、苯并咪唑基、苯并噻唑基、嘌呤基、喹嗪基、喹啉基、异喹啉基、喹唑啉基、喹喔啉基、1,8-萘啶基、四氢喹啉基、苯并噁唑基、色烯基(chrom 2onyl)、吲唑基等类似基团。
术语“杂芳氧基”是指“杂芳基-O-”。术语“杂芳基羰基”是指“杂芳基-CO-”。术语“杂芳氧羰基”是指“杂芳基-O-CO-”。
术语“取代”指其中一个或多个氢原子被一个或多个以下的取代基替换的基团:-OH,-OCH3,-OC2H5,-OC3H7,-O-环-C3H5,-OCH(CH3)2,-OCH2Ph,-F,-Cl,-COCH3,-COC2H5,-COC3H7,-CO-环-C3H5,-COCH(CH3)2,-COOH,-CONH2,-NH2,-NHCH3,-NHC2H5,-NHC3H7,-NH-环-C3H5,-NHCH(CH3)2,-N(CH3)2,-N(C2H5)2,-N(C3H7)2,-N(环-C3H5)2,-N[CH(CH3)2]2,-SO3H,-OCF3,-OC2F5,环-C3H5,-CH3,-C2H5,-C3H7,-CH(CH3)2,-CH=CH2,-CH2-CH=CH2,-C≡CH和/或-C≡C-CH3
在通式结构(I)代表用于合成本发明的反义寡核苷酸的单体或建造块的情况下,末端基团Y和IL’各自独立地选自氢、叠氮、卤素、氰基、硝基、羟基、PG-O-、AG-O-、巯基、PG-S-、AG-S-、C1-6-烷硫基、氨基、PG-N(RH)-、AG-N(RH)-、单或双(C1-6-烷基)氨基、任选取代的C1-6-烷氧基、任选取代的C1-6-烷基、任选取代的C2-6-烯基、任选取代的C2-6-烯氧基、任选取代的C2-6-炔基、任选取代的C2-6-炔氧基、单磷酸酯、一硫代磷酸酯、二磷酸酯、二硫代磷酸酯、三磷酸酯、三硫代磷酸酯、羧基、砜、羟甲基、PG-O-CH2-、AG-O-CH2-、氨甲基、PG-N(RH)-CH2-、AG-N(RH)-CH2-、羧甲基、砜甲基,其中PG分别是OH、SH和-NH(RH)的保护基团,AG分别是OH、SH和-NH(RH)的活化基团,RH选自氢和C1-6-烷基。
羟基取代基的保护基团PG包含取代的三苯甲基,例如4,4’-二甲氧三苯甲基(DMT)、4-单甲氧三苯甲基(MMT)、任选取代的9-(9苯基)呫吨基(pixyl)、任选取代的甲氧基四氢吡喃基(mthp)、硅烷基(例如三甲基硅烷基(TMS)、三异丙基硅烷基(TIPS)、叔丁基二甲基硅烷基(TBDMS)、三乙基硅烷基和苯基二甲基硅烷基、叔丁基醚、乙缩醛(包括两个羟基基团)、酰基(例如乙酰基或卤素取代的乙酰基,例如氯乙酰基或氟乙酰基)、异丁酰基、特戊酰基、苯甲酰基和取代的苯甲酰基、甲氧基甲基(MOM)、苄基醚或取代的苄基醚(例如2,6-二氯苄基(2,6-CI2BzI)。可替代地,当Y或IL’是羟基时,它们可以通过任选地通过接头附着在固体支持物上进行保护。
当Y或IL’是氨基基团时,氨基保护基团的说明性示例是芴甲氧羰基(Fmoc)、叔丁氧羰基(BOC)、三氟乙酰基、烯丙氧羰基(alloc或AOC)、苄氧羰基(Z或Cbz)、取代的苄氧羰基(例如2-氯苄氧羰基(2-CIZ)、单甲氧三苯甲基(MMT)、二甲氧三苯甲基(DMT)、邻苯二甲酰基和9-(9苯基)呫吨基(pixyl)。
Act分别代表-OH、-SH和-NH(RH)的活化基团。这些活化基团是,例如,选自任选取代的O-亚磷酰胺、任选取代的O-磷酸三酯、任选取代的O-磷酸二酯、任选取代的H-磷酸酯和任选取代的O-磷酸酯。
在本发明的上下文中,术语“亚磷酰胺”是指式-P(ORx)-N(Ry)2的基团,其中Rx指代任选取代的烷基基团,例如甲基、2-氰乙基或苄基,每个Ry指代任选取代的烷基基团,例如乙基或异丙基,或基团-N(Ry)2形成吗啉基基团(-N(CH2CH2)2O)。优选地,Rx指代2-氰乙基,并且两个Ry优选是相同的,并指代异丙基。因此,特别相关的亚磷酰胺是N,N-二异丙基-O-(2-氰乙基)亚磷酰胺。
LNA单体或LNA建造块
在合成本发明的反义寡核苷酸时,用作起始材料的LNA单体或LNA建造块优选是以下通式的LNA核苷:
LNA建造块通常以具有四种不同的核碱基的LNA亚磷酰胺的形式提供,所述四种不同的核碱基是:腺嘌呤(A)、鸟嘌呤(G)、5-甲基胞嘧啶(C*)和胸腺嘧啶(T)。通过标准亚磷酰胺化学法合成含有LNA单元的本发明的反义寡核苷酸。在LNA建造块中,核碱基受到保护。优选的嘌呤碱基的氨基基团的保护基团是苯甲酰基团(Bz),表示为ABz。优选的5-甲基嘧啶酮碱基的氨基基团的保护基团是苯甲酰基(Bz),表示为C*Bz。优选的6-羟基嘌呤碱基的氨基基团的保护基团是二甲基甲脒(DMF)基团、二乙基甲脒(DEF)、二丙基甲脒(DPF)、二丁基甲脒(DBF)或异丁基(-CO-CH(CH3)2)基团,表示为GDMF、GDEF、GDPF、GDBF或GiBu。因此,基团-NDMF是指-N=CH-N(CH3)2。DMT是指4,4’-二甲氧三苯甲基。因此,LNA-T是指5’-O-(4,4’-二甲氧三苯甲基)-3’-O-(2-氰乙基-N,N-二异丙基)-亚磷酰胺-胸苷LNA。LNA-C*Bz是指5’-O-(4,4’-二甲氧三苯甲基)-3’-O-(2-氰乙基-N,N-二异丙基)亚磷酰胺-4-N-苯甲酰基-5-甲基-2’-胞苷LNA。LNA-ABz是指5’-O-(4,4’-二甲氧三苯甲基)-3’-O-(2-氰乙基-N,N-二异丙基)亚磷酰胺-6-N-苯甲酰基-2’-腺苷LNA。LNA-GDMF是指5’-O-(4,4’-二甲氧三苯甲基)-3’-O-(2-氰乙基-N,N-二异丙基)-亚磷酰胺-2-N-二甲基甲脒-2’-鸟苷LNA。LNA-GiBu是指5’-O-(4,4’-甲氧基-三苯甲基)-3’-O-(2-氰乙基-N,N-二异丙基)亚磷酰胺-2-N-丁酰-2’-鸟苷LNA。
末端基团
在Y代表本发明的反义寡核苷酸的5’末端基团的情况下,残基Y还命名为Y5’并且代表:
-OH,-O-C1-6-烷基,-S-C1-6-烷基,-O-C6-9-苯基,-O-C7-10-苄基,-NH-C1-6-烷基,-N(C1-6-烷基)2,-O-C2-6-烯基,-S-C2-6-烯基,-NH-C2-6-烯基,-N(C2-6-烯基)2,-O-C2-6-炔基,-S-C2-6-炔基,-NH-C2-6-炔基,-N(C2-6-炔基)2,-O-C1-6-烷基烯基-O-C1-6-烷基,-O-[C1-6-烷基烯基-O]m-C1-6-烷基,-O-CO-C1-6-烷基,-O-CO-C2-6-烯基,-O-CO-C2-6-炔基,-O-S(O)-C1-6-烷基,-O-SO2-C1-6-烷基,-O-SO2-O-C1-6-烷基,-O-P(O)(O-)2,-O-P(O)(O-)(O-C1-6-烷基),-O-P(O)(O-C1-6-烷基)2,-O-P(O)(S-)2,-O-P(O)(S-C1-6-烷基)2,-O-P(O)(S-)(O-C1-6-烷基),-O-P(O)(O-)(NH-C1-6-烷基),-O-P(O)(O-C1-6-烷基)(NH-C1-6-烷基),-O-P(O)(O-)[N(C1-6-烷基)2],-O-P(O)(O-C1-6-烷基)[N(C1-6-烷基)2],-O-P(O)(O-)(BH3 -),-O-P(O)(O-C1-6-烷基)(BH3 -),-O-P(O)(O-)(O-C1-6-烷基烯基-O-C1-6-烷基),-O-P(O)(O-C1-6-烷基烯基-O-C1-6-烷基)2,-O-P(O)(O-)(O-C1-6-烷基烯基-S-C1-6-烷基),-O-P(O)(O-C1-6-烷基烯基-S-C1-6-烷基)2,-O-P(O)(O-)(OCH2CH2O-C1-6-烷基),-O-P(O)(OCH2CH2O-C1-6-烷基)2,-O-P(O)(O-)(OCH2CH2S-C1-6-烷基),-O-P(O)(OCH2CH2S-C1-6-烷基)2,-O-P(O)(O-)OC3H6OH,-O-P(O)(S-)OC3H6OH,-O-P(S)(S-)OC3H6OH,
其中C1-6-烷基,C2-6-烯基,C2-6-炔基,-O-C6-9-苯基或-O-C7-10-苄基可以被-F,-OH,C1-4-烷基,C2-4-烯基和/或C2-4-炔基进一步取代,其中m选自1、2、3、4、5、6、7、8、9或10。
更优选:-OCH3,-OC2H5,-OC3H7,-O-环-C3H5,-OCH(CH3)2,-OC(CH3)3,-OC4H9,-OPh,-OCH2-Ph,-O-COCH3,-O-COC2H5,-O-COC3H7,-O-CO-环-C3H5,-O-COCH(CH3)2,-OCF3,-O-S(O)CH3,-O-S(O)C2H5,-O-S(O)C3H7,-O-S(O)-环-C3H5,-O-SO2CH3,-O-SO2C2H5,-O-SO2C3H7,-O-SO2-环-C3H5,-O-SO2-OCH3,-O-SO2-OC2H5,-O-SO2-OC3H7,-O-SO2-O-环-C3H5,-O(CH2)nN[(CH2)nOH],-O(CH2)nN[(CH2)n-H],-O-P(O)(O-)OC3H6OH,-O-P(O)(S-)OC3H6OH,
甚至更优选:
-OCH3,-OC2H5,-OCH2CH2OCH3(也称为MOE),-OCH2CH2-N(CH3)2(也称为DMAOE),-O[(CH2)nO]mCH3,-O(CH2)nOCH3,-O(CH2)nNH2,-O(CH2)nN(CH3)2,-O-P(O)(O-)OC3H6OH,-O-P(O)(S-)OC3H6OH,
其中n选自1、2、3、4、5或6;以及
其中m选自1、2、3、4、5、6、7、8、9或10。
在IL’代表本发明的反义寡核苷酸的3’末端基团的情况下,残基IL’还命名为IL’3’并且代表:
-OH,-O-C1-6-烷基,-S-C1-6-烷基,-O-C6-9-苯基,-O-C7-10-苄基,-NH-C1-6-烷基,-N(C1-6-烷基)2,-O-C2-6-烯基,-S-C2-6-烯基,-NH-C2-6-烯基,-N(C2-6-烯基)2,-O-C2-6-炔基,-S-C2-6-炔基,-NH-C2-6-炔基,-N(C2-6-炔基)2,-O-C1-6-烷基烯基-O-C1-6-烷基,-O-[C1-6-烷基烯基-O]m-C1-6-烷基,
-O-CO-C1-6-烷基,-O-CO-C2-6-烯基,-O-CO-C2-6-炔基,-O-S(O)-C1-6-烷基,-O-SO2-C1-6-烷基,-O-SO2-O-C1-6-烷基,
-O-P(O)(O-)2,-O-P(O)(O-)(O-C1-6-烷基),-O-P(O)(O-C1-6-烷基)2,-O-P(O)(S-)2,-O-P(O)(S-C1-6-烷基)2,-O-P(O)(S-)(O-C1-6-烷基),-O-P(O)(O-)(NH-C1-6-烷基),-O-P(O)(O-C1-6-烷基)(NH-C1-6-烷基),-O-P(O)(O-)[N(C1-6-烷基)2],-O-P(O)(O-C1-6-烷基)[N(C1-6-烷基)2],-O-P(O)(O-)(BH3 -),-O-P(O)(O-C1-6-烷基)(BH3 -),-O-P(O)(O-)(O-C1-6-烷基烯基-O-C1-6-烷基),-O-P(O)(O-C1-6-烷基烯基-O-C1-6-烷基)2,-O-P(O)(O-)(O-C1-6-烷基烯基-S-C1-6-烷基),-O-P(O)(O-C1-6-烷基烯基-S-C1-6-烷基)2,-O-P(O)(O-)(OCH2CH2O-C1-6-烷基),-O-P(O)(OCH2CH2O-C1-6-烷基)2,-O-P(O)(O-)(OCH2CH2S-C1-6-烷基),-O-P(O)(OCH2CH2S-C1-6-烷基)2,-O-P(O)(O-)OC3H6OH,-O-P(O)(S-)OC3H6OH,
其中C1-6-烷基,C2-6-烯基,C2-6-炔基,-O-C6-9-苯基或-O-C7-10-苄基可以被-F,-OH,C1-4-烷基,C2-4-烯基和/或C2-4-炔基进一步取代,其中m选自1、2、3、4、5、6、7、8、9或10。
更优选:-OCH3,-OC2H5,-OC3H7,-O-环-C3H5,-OCH(CH3)2,-OC(CH3)3,-OC4H9,-OPh,-OCH2-Ph,-O-COCH3,-O-COC2H5,-O-COC3H7,-O-CO-环-C3H5,-O-COCH(CH3)2,-OCF3,-O-S(O)CH3,-O-S(O)C2H5,-O-S(O)C3H7,-O-S(O)-环-C3H5,-O-SO2CH3,-O-SO2C2H5,-O-SO2C3H7,-O-SO2-环-C3H5,-O-SO2-OCH3,-O-SO2-OC2H5,-O-SO2-OC3H7,-O-SO2-O-环-C3H5,-O(CH2)nN[(CH2)nOH],-O(CH2)nN[(CH2)n-H],-O-P(O)(O-)OC3H6OH,-O-P(O)(S-)OC3H6OH,
甚至更优选:
-OCH3,-OC2H5,-OCH2CH2OCH3(也称为MOE),-OCH2CH2-N(CH3)2(也称为DMAOE),-O[(CH2)nO]mCH3,-O(CH2)nOCH3,-O(CH2)nNH2,-O(CH2)nN(CH3)2,-O-P(O)(O-)OC3H6OH,-O-P(O)(S-)OC3H6OH,
其中n选自1、2、3、4、5或6;以及
其中m选自1、2、3、4、5、6、7、8、9或10。
优选的LNA
在优选的实施方案中,用于本发明的反义寡核苷酸中的LNA单元优选具有通式(II)的结构:
优选地,-C(RaRb)-X-部分表示-C(RaRb)-O-、-C(RaRb)-NRc-、-C(RaRb)-S-和-C(RaRb)-C(RaRb)-O-,其中取代基Ra、Rb和Rc具有如本文所定义的含义,并且优选C1-6-烷基,更优选C1-4-烷基。更优选地,-C(RaRb)-X-选自-CH2-O-、-CH2-S-、-CH2-NH-、-CH2-N(CH3)-、-CH2-CH2-O-或-CH2-CH2-S-,更优选-CH2-O-、-CH2-S-、-CH2-CH2-O-或-CH2-CH2-S-,还更优选-CH2-O-、-CH2-S-或-CH2-CH2-O-,还更优选-CH2-O-或-CH2-S-,最优选-CH2-O-。
所有的手性中心和不对称取代基(如果有的话)可以是R方向或是S方向。例如,两个示例性的立体化学异构体是β-D和α-L异构体,如下所示:
/>
优选的LNA单元选自通式(b1)至(b9):
术语“硫代-LNA”包含锁核苷酸,其中通式(II)中的X选自-S-或-CH2-S-。硫代-LNA可以是β-D构型和α-L构型。
术语“氨基-LNA”包含锁核苷酸,其中通式(II)中的X选自-NH-、-N(R)-、-CH2-NH-和-CH2-N(R)-,其中R选自氢和C1-4-烷基。氨基-LNA可以是β-D构型和α-L构型。
术语“氧-LNA”包含锁核苷酸,其中通式(II)中的X是-O-。氧代-LNA可以是β-D和α-L构型。
术语“ENA”包含锁核苷酸,其中通式(II)中的X是-CH2-O-(其中-CH2-O-的氧原子附加到相对于碱基B的2'位置)。Ra和Rb各自独立地是氢或甲基。
在优选的示例性实施方案中,LNA选自β-D-氧代-LNA、α-L-氧代-LNA、β-D-氨基-LNA和β-D-硫代-LNA,特别是β-D-氧代-LNA。
Gapmer
本发明的反义寡核苷酸可以由包含非LNA单元的DNA核苷酸和LNA核苷酸的核苷酸序列组成,并且可以以gapmer的形式排列。本文优选具有完全硫代磷酸骨架的LNA gapmer。一般来说,硫代磷酸骨架确保对酶促降解的优异耐受性。
因此,本发明的反义寡核苷酸优选是gapmer。gapmer由未锁定的(因此是非LNA单元)DNA核苷酸单元的中间部分组成。中间部分的DNA核苷酸可以通过本文公开的核苷间连接(IL)彼此相连,IL优选是磷酸基团、硫代磷酸基团或二硫代磷酸基团,并且其可以含有核碱基类似物,例如5-丙炔胞嘧啶、7-甲基鸟嘌呤、7-甲基腺嘌呤、2-氨基腺嘌呤、2-硫代胸腺嘧啶、2-硫代胞嘧啶或5-甲基胞嘧啶。DNA单元或DNA核苷酸不是双环戊糖结构。非LNA单元的中间部分在3'端和5'端侧翼是由LNA单元组成的序列。因此,gapmer具有如下通式:
LNA序列1-非LNA序列-LNA序列2
区域A-区域B-区域C
反义寡核苷酸的中间部分由非LNA单元的DNA核苷酸单元组成,当中间部分与互补的靶RNA形成双链体时,能够招募RNA酶。3'和5'末端核苷酸单元是LNA单元,优选是α-L构型,特别优选β-D-氧代-LNA和α-L-氧代LNA。
因此,gapmer是反义寡核苷酸,它包含能够招募RNA酶(例如RNA酶H)的邻接延伸的DNA核苷酸,例如至少6或7个非LNA单元的DNA核苷酸的区域,本文中称为中间部分或区域B,其中区域B的5'和3'侧翼是亲和力增强的核苷酸类似物(其为LNA单元)的区域,例如在能够招募RNA酶的邻接延伸的DNA核苷酸的5'和3'有1-6个LNA单元—这些侧翼区域分别称为区域A和区域C。
优选地,gapmer包括式(5'至3')A-B-C或任选地A-B-C-D或D-A-B-C的(多)核苷酸序列,其中;区域A(5'区)由至少一个核苷酸类似物组成,例如至少一个LNA单元,例如1-6个LNA单元之间,区域B由至少五个连续的非LNA单元的DNA核苷酸组成,其能够招募RNA酶(当与互补RNA分子形成双链体时),区域C(3'区)由至少一个核苷酸类似物组成,例如至少一个LNA单元,例如1-6个LNA单元之间,区域D(当存在时)由1、2或3个非LNA单元的DNA核苷酸组成。
在一些实施方案中,区域A由1、2、3、4、5或6个LNA单元组成,例如2-5个LNA单元之间,例如2或3个LNA单元;和/或区域C由1、2、3、4、5或6个LNA单元组成,例如2-5个LNA单元之间,例如2或3个LNA单元。
在一些实施方案中,B由5、6、7、8、9、10、11或12个能够招募RNA酶的连续DNA核苷酸组成,或6-10个,或7-9个,例如能够招募RNA酶的8个连续核苷酸。在一些实施方案中,区域B由至少一个DNA核苷酸单元组成,例如1-12个DNA核苷酸单元,优选4-12个DNA核苷酸单元之间,更优选6-10个DNA核苷酸单元之间,还更优选7-10个DNA核苷酸单元之间,最优选8、9或10个非LNA单元的DNA核苷酸单元。
在一些实施方案中,区域A由1至4个LNA组成,区域B由7、8、9、10或11个DNA核苷酸单元组成,区域C由1至4个LNA单元组成。这种设计包括(A-B-C):1-7-2、2-7-1、2-7-2、3-7-1、3-7-2、1-7-3、2-7-3、3-7-3、2-7-4、3-7-4、4-7-2、4-7-3、4-7-4、1-8-1、1-8-2、2-8-1、2-8-2、1-8-3、3-8-1、3-8-3、2-8-3、3-8-2、4-8-1、4-8-2、1-8-4、2-8-4、3-8-4、4-8-3、4-8-4、1-9-1、1-9-2、2-9-1、2-9-2、2-9-3、3-9-2、3-9-3、1-9-3、3-9-1、4-9-1、1-9-4、4-9-2、2-9-4、4-9-3、3-9-4、4-9-4、1-10-1、1-10-2、2-10-1、2-10-2、1-10-3、3-10-1、2-10-2、2-10-3、3-10-2、3-10-3、2-10-4、4-10-2、3-10-4、4-10-3、4-10-4、1-11-1、1-11-2、2-11-1、2-11-2、1-11-3、3-11-1、2-11-2、2-11-3、3-11-2、3-11-3、2-11-4、4-11-2、3-11-4、4-11-3、4-11-4,并且可以进一步包括区域D,其可以含有一个或2个非LNA单元的DNA核苷酸。进一步的gapmer设计公开于WO2004/046160A中,并且通过引用并入本文。
在一些实施方案中,反义寡核苷酸由总共10、11、12、13或14个核苷酸单元(LNA单元和非LNA单元一起)的连续核苷酸序列组成,其中连续核苷酸序列属于式(5'-3')、A-B-C或任选地A-B-C-D或D-A-B-C,其中A由1、2或3个LNA单元组成,B由7、8或9个非LNA单元的连续DNA核苷酸单元组成,并且当与互补RNA分子(例如mRNA靶标)形成双链体时能够招募RNA酶,C由1、2或3个LNA单元组成。当存在时,D由单个非LNA单元的DNA核苷酸组成。
在一些实施方案中,A由1个LNA单元组成。在一些实施方案中,A由2个LNA单元组成。在一些实施方案中,A由3个LNA单元组成。在一些实施方案中,C由1个LNA单元组成。在一些实施方案中,C由2个LNA单元组成。在一些实施方案中,C由3个LNA单元组成。在一些实施方案中,B由7个非LNA单元的DNA核苷酸单元组成。在一些实施方案中,B由8个非LNA单元的DNA核苷酸单元组成。在一些实施方案中,B由9个非LNA单元的DNA核苷酸单元组成。在一些实施方案中,B由1-9个非LNA单元的DNA核苷酸单元组成,例如2、3、4、5、6、7或8个DNA核苷酸单元。DNA核苷酸单元始终是非LNA单元。在一些实施方案中,B包含1、2或3个LNA单元,这些单元优选是α-L构型,更优选α-L-氧代LNA单元。在一些实施方案中,A-B-C中存在的核苷酸的数量选自由以下组成的组(LNA单元-区域B-LNA单元,更优选α-L-氧代LNA单元(区域A)-区域B-(区域C)α-L-氧代LNA单元):1-7-2、2-7-1、2-7-2、3-7-1、3-7-2、1-7-3、2-7-3、3-7-3、2-7-4、3-7-4、4-7-2、4-7-3、4-7-4、1-8-1、1-8-2、2-8-1、2-8-2、1-8-3、3-8-1、3-8-3、2-8-3、3-8-2、4-8-1、4-8-2、1-8-4、2-8-4、3-8-4、4-8-3、4-8-4、1-9-1、1-9-2、2-9-1、2-9-2、2-9-3、3-9-2、3-9-3、1-9-3、3-9-1、4-9-1、1-9-4、4-9-2、2-9-4、4-9-3、3-9-4、4-9-4、1-10-1、1-10-2、2-10-1、2-10-2、1-10-3、3-10-1、2-10-2、2-10-3、3-10-2、3-10-3、2-10-4、4-10-2、3-10-4、4-10-3、4-10-4、1-11-1、1-11-2、2-11-1、2-11-2、1-11-3、3-11-1、2-11-2、2-11-3、3-11-2、3-11-3、2-11-4、4-11-2、3-11-4、4-11-3、4-11-4。在进一步优选的实施方案中,A-B-C中的核苷酸的数量选自由以下组成的组:2-8-2、3-8-3、4-8-2、2-8-4、3-8-4、4-8-3、4-8-4、2-9-2、3-9-3、4-9-2、2-9-4、4-9-3、3-9-4、4-9-4、2-10-2、3-10-3、2-10-4、4-10-2、3-10-4、4-10-3、4-10-4、2-11-2、2-11-4、4-11-2、3-11-4、4-11-3并且还更优选:2-8-2、3-8-3、3-8-4、4-8-3、4-8-4、2-9-2、3-9-3、4-9-3、3-9-4、4-9-4、2-10-2、3-10-3、3-10-4、4-10-3、4-10-4、2-11-2、3-11-4和4-11-3。
硫代磷酸酯、磷酸酯或二硫代磷酸酯,还特别优选硫代磷酸酯核苷间连接,尤其是对于gapmer区域B。硫代磷酸酯、磷酸酯或二硫代磷酸酯连接,特别是硫代磷酸酯核苷内连接,还可以用于侧翼区域(A和C,以及对于连接A或C与D,以及区域D(如果存在)内)。
然而,区域A、B和C可以包含除了硫代磷酸酯或二硫代磷酸酯之外的核苷间连接,例如磷酸二酯连接,特别是例如在使用核苷酸类似物保护区域A和C内的核苷间连接免受内切核酸酶降解的情况下-例如当区域A和C由LNA单元组成时。
反义寡核苷酸中的核苷间连接可以是磷酸二酯、硫代磷酸酯、二硫代磷酸酯或硼磷酸酯,以使RNA酶H切割靶RNA。优选硫代磷酸酯或二硫代磷酸酯,因为它们具有更好的核酸酶抗性,以及其他原因,例如易于制造。在本发明的寡聚体的一个方面中,LNA单元和/或非LNA单元通过硫代磷酸酯基团的方式连接在一起。
人们认识到,将磷酸二酯连接,例如一个或两个连接,纳入到另外的硫代磷酸反义寡核苷酸中,特别是LNA单元之间或邻近LNA单元(通常在区域A和/或区域C中),可以改变反义寡核苷酸的生物利用度和/或生物分布(参见WO2008/053314A,其通过引用并入本文)。
在一些实施方案中,例如在本文中公开的反义寡核苷酸的序列中,并且在适合且未特别指明的情况下,剩余所有的核苷间连接基团是磷酸二酯基团或硫代磷酸基团,或其混合物。
在一些实施方案中,所有核苷间连接基团都是硫代磷酸基团。当提及特定的gapmer反义寡核苷酸序列(例如本文中提供的序列)时,应理解,在各种实施方案中,当连接是硫代磷酸连接时,可以使用替代连接,例如本文中公开的那些,例如可以使用磷酸(也称为磷酸二酯)连接,特别是用于核苷酸类似物(例如LNA单元)之间的连接。同样,在各种实施方案中,当提及特定的gapmer反义寡核苷酸序列(例如本文中提供的序列)时,当C残基被注释为5'甲基修饰的胞嘧啶时,寡聚体中存在的一个或多个C可以是未修饰的C残基。
图例
本文中使用的缩写b、d、s、ss具有以下含义:
b LNA单元或LNA核苷酸(选自b1-b7的任何一个)
b1 β-D-氧代-LNA
b2 β-D-硫代-LNA
b3 β-D-氨基-LNA
b4 α-L-氧代-LNA
b5 β-D-ENA
b6 β-D-(NH)-LNA
b7 β-D-(NCH3)-LNA
d 2-脱氧,即2-脱氧核糖单元
C*甲基-C(5-甲基胞嘧啶);[因而dC*是5-甲基-2’-脱氧胞苷]
A*2-氨基腺嘌呤[因而dA*是2-氨基-2’-脱氧腺苷]
s核苷间连接是硫代磷酸基团(-O-P(O)(S-)-O-)
ss核苷间连接是二硫代磷酸基团(-O-P(S)(S-)-O-)
/5SpC3/-O-P(O)(O-)OC3H6OH位于反义寡核苷酸的5’末端基团
/3SpC3/-O-P(O)(O-)OC3H6OH位于反义寡核苷酸的3’末端基团
/5SpC3s/-O-P(O)(S-)OC3H6OH位于反义寡核苷酸的5’末端基团
/3SpC3s/-O-P(O)(S-)OC3H6OH位于反义寡核苷酸的3’末端基团
粗体显示的核苷酸是LNA核苷酸
非粗体显示的是非LNA核苷酸
Gapmer序列
优选以下如表18至表29中所列出的呈gapmer形式的反义寡核苷酸。本文公开的反义寡核苷酸例如表18至表29的反义寡核苷酸由核苷酸组成,优选DNA核苷酸,它们是非LNA单元(本文中还命名为非LNA核苷酸)以及LNA单元(本文中还命名为LNA核苷酸)。虽然没有明确指出,但序列中的反义寡核苷酸虽然没有明确指出,表18至29中涉及LNA单元的“C”优选含有5-甲基胞嘧啶(C*)作为核碱基。
表18
/>
/>
表19
/>
/>
表20
/>
/>
表21
/>
/>
表22
/>
/>
表23
/>
/>
表24
/>
/>
表25
/>
/>
表26
/>
/>
表27
/>
/>
/>
表28
/>
/>
/>
表29
/>
/>
特别优选以下如表30至表32中所列出的呈gapmer形式的反义寡核苷酸。
表30
/>
/>
/>
/>
/>
/>
表31
/>
/>
/>
/>
/>
/>
表32
/>
/>
/>
/>
/>
还特别优选表33的gapmer反义寡核苷酸。
表33
/>
/>
/>
/>
药物组合物
本发明的反义寡核苷酸优选以其药学活性盐的形式施用,任选地使用基本上无毒的药学上可接受的载体、赋形剂、佐剂、溶剂或稀释剂。本发明的药品是以已知的方式在常规固体或液体载体或稀释剂和常规药用佐剂中以适合的剂量水平制备的。优选的制剂和配方是适用于输注或注射(鞘内、脑室内、颅内、静脉内、脑实质内、瘤内、眼内或眼外、腹膜内、肌内、皮下)、局部施用至大脑、吸入、局部施用至实体瘤或口服应用的可施用形式。然而,还可以采用其他应用形式,例如通过上皮或皮肤粘膜衬里(口腔粘膜、直肠和阴道上皮衬里、鼻咽粘膜、肠粘膜)吸收、直肠、透皮、局部、皮内、胃内、皮内、阴道内、血管内、鼻内、颊内、经皮、舌下应用,或制药技术中可用的任何其他方法。
例如,可施用的制剂包括可注射的液体制剂、延迟制剂、特别用于吸入的粉末、丸剂、片剂、薄膜片剂、包衣片剂、分散颗粒、糖锭剂、凝胶剂、糖浆剂、浆剂、悬浮剂、乳剂、胶囊剂和沉淀剂。还可以采用其他可施用的盖仑制剂,例如通过植入式泵或导管连续注射至大脑中。
本文中使用的术语“药学上可接受的”是指不会干扰制剂中作为活性成分的反义寡核苷酸的生物活性并对所施用的宿主无毒性的任何载体。适合的药物载体的示例是本领域众所周知的,包括磷酸盐缓冲生理盐水溶液、水、乳剂(例如油/水乳剂)、各种类型的湿润剂、无菌溶液等。这些载体可以通过常规方法配制,并且活性化合物可以以有效剂量向受试者施用。
“有效剂量”是指作为活性成分的反义寡核苷酸的足以影响疾病的病程和严重性从而使此类病理减轻或缓解的量。适用于治疗和/或防止这些疾病或病症的“有效剂量”可以使用本领域技术人员已知的方法确定。此外,本发明的反义寡核苷酸可以与脂质体、复合物形成剂、受体靶向分子、溶剂、防腐剂和/或稀释剂混合并一起施用。
优选的是用于活性成分的持续释放,特别是用于本发明的至少一种反义寡核苷酸的鞘内施用、脑室内施用或颅内施用的持续输注的输注溶液或固体基质形式的药物制剂。还优选的是适用于局部施用至大脑的溶液或固体基质形式的药物制剂。对于肺部纤维化疾病,特别优选的是吸入制剂。
即用型无菌溶液包含例如浓度在1至100mg/ml,优选5至25mg/ml的范围内的至少一种反义寡核苷酸,以及等渗剂,例如从诸如蔗糖、乳糖、甘露醇或山梨醇的糖中选择的等渗剂。还可以包括适合的缓冲剂,以将溶液的pH值控制在6至8(优选7-8)。制剂的另一种任选成分可以是非离子表面活性剂,例如Tween 20或Tween 80。
供复溶使用的无菌冻干粉末包含至少一种反义寡核苷酸,以及任选地膨松剂(例如甘露醇、海藻糖、山梨醇、甘氨酸)和/或冷冻保护剂(例如海藻糖、甘露醇)。用于复溶的溶剂可以是用于可注射化合物的水,具有或不具有缓冲盐以将pH值控制在6至8。
适用于吸入的气雾剂可以包括溶液和粉末形式的固体,其可以与药学上可接受的载体(例如惰性压缩气体,例如氮气)组合使用。
特别优选的药物组合物是适用于通过吸入施用或适用于静脉内施用的冻干(冷冻-干燥)制剂(冻干物)。为了制备优选的冻干制剂,将本发明的至少一种反义寡核苷酸溶解在4至5%(w/v)的甘露醇溶液中,然后将溶液冻干。甘露醇溶液也可以在上述的适合的缓冲溶液中制备。
适合的冷冻/冻干保护剂(又称膨松剂或稳定剂)的进一步的示例还包括无巯基白蛋白、免疫球蛋白、聚亚烷基氧化物(polyalkyleneoxide)(例如PEG、聚丙二醇)、海藻糖、葡萄糖、蔗糖、山梨醇、右旋糖酐、麦芽糖、棉子糖、水苏糖和其他糖类(参见,例如WO97/29782),但优选使用甘露醇。这些在常规冻干技术中可以以常规量使用。冻干方法在制备药物制剂的技术领域中是众所周知的。
对于通过吸入施用,冻干制剂的颗粒直径优选为2至5μm,更优选3至4μm。冻干制剂特别适用于使用吸入器施用,例如或/>吸入器(NEBU-TEC,Elsenfeld,Germany)。可以在无菌蒸馏水或任何其他适用于吸入施用的液体中将冻干产品再水化。可替代地,对于静脉内施用,可以在无菌蒸馏水或任何其他适用于静脉内施用的液体中将冻干产品再水化。
在无菌蒸馏水或其他适合的液体中再水化以用于施用之后,冻干制剂应具有再水化的肽制剂的靶标组织(即针对静脉内施用的血液或针对吸入施用的肺组织)的近似生理渗透压。因此,优选再水化制剂是基本上等渗的。
静脉内、口服或吸入施用的优选剂量浓度是10至2000μmol/ml,并且更优选是200至800μmol/ml。
对于片剂或胶囊形式的口服施用,可以将至少一种反义寡核苷酸与任何口服无毒性的药学上可接受的惰性载体(例如乳糖、淀粉、蔗糖、纤维素、硬脂酸镁、磷酸氢钙、硫酸钙、滑石粉、甘露醇、乙醇(液体形式)等)组合。此外,在期望或需要时,还可以在混合物中掺入适合的粘结剂、润滑剂、崩解剂和着色剂。粉末和片剂可以由约5到约95%的本发明的组合物组成。
适合的粘结剂包括淀粉、明胶、天然糖、玉米甜味剂、天然胶和合成胶例如阿拉伯胶、海藻酸钠、羧甲基纤维素、聚乙二醇和蜡。可被提及用于这些剂型的润滑剂包括硼酸、苯甲酸钠、醋酸钠、氯化钠等。崩解剂包括淀粉、甲基纤维素、瓜尔胶等。
另外,本发明的组合物可以配制为持续释放形式,以提供至少一种反义寡核苷酸的速率受控释放,以优化治疗效果。适用于持续释放的剂型包括含有至少一种反义寡核苷酸的用于持续释放的可植入生物降解基质、含有具有不同崩解速率的层的分层片剂或用至少一种反义寡核苷酸浸渍的控释聚合物基质。
液体形式制剂包括溶液、悬浮剂和乳剂。例如,可以提及用于肠胃外注射的水或水-丙二醇溶液,或用于口服溶液、悬浮剂和乳剂的甜味剂和不透明剂的添加。
适合的稀释剂是通常构成组合物或剂型的主要部分的物质。适合的稀释剂包括糖,例如乳糖、蔗糖、甘露醇和山梨醇,来源于小麦、玉米、大米和马铃薯的淀粉,以及纤维素,例如微晶纤维素。组合物中的稀释剂的量可以在总的组合物的按重量计约5%至约95%的范围内,优选在按重量计约25%至约75%的范围内。
术语崩解剂是指添加到组合物以帮助组合物破裂(崩解)并释放药品的材料。适合的崩解剂包括淀粉、“冷水可溶”改性淀粉(例如羧甲基淀粉钠)、天然胶和合成胶(例如刺槐豆胶、卡拉胶、瓜尔胶、黄芪胶和琼脂)、纤维素衍生物(例如甲基纤维素和羧甲基纤维素钠)、微晶纤维素和交联微晶纤维素(例如交联羧甲基纤维素钠)、海藻酸盐(例如海藻酸和海藻酸钠)、粘土(例如膨润土)和泡腾剂混合物。组合物中崩解剂的量可以在组合物的按重量计约1至约40%的范围内,优选在组合物的按重量计2至约30%的范围内,更优选在组合物的按重量计约3至20%的范围内,最优选在按重量计约5至约10%的范围内。
粘结剂表征将粉末粘结或“粘合”在一起并通过形成颗粒使其粘聚的物质,从而充当制剂中的“粘合剂”。粘结剂增加稀释剂或膨松剂中已有的粘聚强度。适合的粘结剂包括糖,例如蔗糖;来源于小麦、玉米、大米和马铃薯的淀粉;天然胶,例如阿拉伯胶、明胶和黄芪胶;海藻的衍生物,例如海藻酸、海藻酸钠和海藻酸铵钙;纤维素材料,例如甲基纤维素、羧甲基纤维素钠和羟丙基甲基纤维素;聚乙烯吡咯烷酮;以及无机物,例如硅酸镁铝。组合物中粘结剂的量可以在组合物的按重量计约1至30%的范围内,优选在组合物的按重量计约2至约20%的范围内,更优选在按重量计约3至约10%的范围内,甚至更优选在按重量计约3至约6%的范围内。
润滑剂是指添加至剂型中以使片剂、颗粒剂等能够在被压缩后通过减少摩擦或磨损而从模具或芯中释放的物质。适合的润滑剂包括金属硬脂酸盐,例如硬脂酸镁、硬脂酸钙或硬脂酸钾、硬脂酸;高熔点蜡;以及水溶性润滑剂,例如氯化钠、苯甲酸钠、乙酸钠、油酸钠、聚乙二醇和D,L-亮氨酸。通常在压缩前的最后一步添加润滑剂,因为润滑剂必须存在于颗粒表面以及颗粒与压片机的部件之间。组合物中润滑剂的量可以在组合物的按重量计约0.05至约15%的范围内,优选在组合物的按重量计0.2至约5%的范围内,更优选在约0.3至约3%的范围内,最优选在组合物的按重量计约0.3至约1.5%的范围内。
助流剂是防止结块和改善颗粒流动特性以使得流动平稳和均匀的材料。适合的助流剂包括二氧化硅和滑石粉。组合物中的助流剂的量可以在组合物的按重量计约0.01至10%的范围内,优选在总的组合物的按重量计0.1%至约7%的范围内,更优选在按重量计约0.2至5%的范围内,最优选在按重量计约0.5至约2%的范围内。
在本文公开的药物组合物中,反义寡核苷酸优选以其盐的形式掺入,并且任选地与增加反义寡核苷酸的稳定性、增加RNA酶H的招募、增加靶标寻找特性、增强细胞摄取等的其他组分一起掺入。为了达到这些目的,替代或附加于可以用达到这些目的的进一步的组分的使用,可以对反义寡核苷酸进行化学修饰。因此,本发明的反义寡核苷酸可以与增强反义寡核苷酸的活性、细胞分布或细胞摄取等的部分或组分进行化学连接。这样的部分包括脂质部分,例如胆固醇部分,胆酸,硫醚,己基-S-三苯甲硫醇,硫代胆固醇,脂肪链,例如十二烷二醇(dodecandiol)或十一烷基残基,磷脂,例如双十六烷基-rac-甘油或三乙铵-1,2-二-O-十六烷基-rac-丙三氧代-3H-膦酸酯,多胺或聚乙二醇链,或金刚烷乙酸,棕榈酰基部分,或十八胺或己胺-羰基-羟胆甾醇部分。本发明还包括其为嵌合化合物的反义寡核苷酸。在本发明的上下文中,“嵌合”反义寡核苷酸是含有两个或更多个化学上不同的区域的反义寡核苷酸,其中一个区域是本文所公开的寡核苷酸序列,其与增加细胞摄取、增加对核酸酶降解的抵抗力、增加对靶核酸的结合亲和力、增加RNA酶H的招募等的部分或组分连接。例如,反义寡核苷酸的另外的区域或部分或组分可以充当能够切割RNA:DNA杂合体或RNA:RNA分子的酶的底物。举例来说,RNA酶H是细胞的核糖核酸内切酶,其切割RNA:DNA双链体中的RNA链。因此,RNA酶H的激活导致其为编码TGF-RII的mRNA的RNA靶标的切割,从而大大提高反义寡核苷酸抑制基因表达的效率。因此,在使用嵌合寡核苷酸时,使用较短的寡核苷酸通常可以获得相当的结果。
适应症
本发明涉及本文公开的反义寡核苷酸用于抑制肝配蛋白-B2功能或用于肾脏保护作用或用于控制肾病蛋白功能的用途。
本发明涉及本文公开的反义寡核苷酸用于肾病的预防和治疗中的用途。本发明涉及本文公开的反义寡核苷酸用于糖尿病肾病的预防和治疗中的用途。本发明涉及本文公开的反义寡核苷酸用于糖尿病中的蛋白尿和/或肾病的预防和治疗中的用途。为了治疗糖尿病中的蛋白尿和/或糖尿病肾病,将使用经过单肾摘除(UNx)手术的db/db小鼠作为具有肾脏并发症的2型糖尿病的模式动物。小鼠将从14周龄开始腹腔注射1ml/kg KGW体积中的20mg/kg KGW ASO,每周两次,最长持续4周。将对白蛋白尿和肾脏结构进行分析。
本发明进一步涉及治疗患有选自肾病和/或糖尿病蛋白尿和/或糖尿病肾病的疾病的动物(或人或患者)的方法,包括向所述动物施用治疗或预防有效量的由10至28个核苷酸组成的反义寡核苷酸,并且所述10至28个核苷酸中的至少两个是LNA,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列CTGAATTTTGCAATGT(Seq.ID No.3)或AAATGCCTTGCTTGTA(Seq.ID No.2),并且所述反义寡核苷酸包含能够与所述序列CTGAATTTTGCAATGT(Seq.ID No.3)或AAATGCCTTGCTTGTA(Seq.ID No.2)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。本文公开了优选的反义寡核苷酸,其包含能够与所述序列CTGAATTTTGCAATGT(Seq.IDNo.3)或AAATGCCTTGCTTGTA(Seq.ID No.2)杂交的至少10个连续核苷酸的序列。
本发明进一步涉及治疗患有选自肾病和/或糖尿病蛋白尿和/或糖尿病肾病的疾病的动物(或人或患者)的方法,包括向所述动物施用治疗或预防有效量的由10至28个核苷酸组成的反义寡核苷酸,并且所述10至28个核苷酸中的至少两个是LNA,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。本文公开了优选的反义寡核苷酸,其包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的至少10个连续核苷酸的序列。
本发明进一步涉及抑制细胞或组织中的肝配蛋白-B2的表达的方法,包括用有效量的由10至28个核苷酸组成的反义寡核苷酸孵育所述细胞或组织,并且所述10至28个核苷酸中的至少两个是LNA,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列CTGAATTTTGCAATGT(Seq.ID No.3)或AAATGCCTTGCTTGTA(Seq.ID No.2),并且所述反义寡核苷酸包含能够与所述序列CTGAATTTTGCAATGT(Seq.ID No.3)或AAATGCCTTGCTTGTA(Seq.ID No.2)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。本文公开了优选的反义寡核苷酸,其包含能够与所述序列CTGAATTTTGCAATGT(Seq.IDNo.3)或AAATGCCTTGCTTGTA(Seq.ID No.2)杂交的至少10个连续核苷酸的序列。
本发明进一步涉及抑制细胞或组织中的肝配蛋白-B2的表达的方法,包括用有效量的由10至28个核苷酸组成的反义寡核苷酸孵育所述细胞或组织,并且所述10至28个核苷酸中的至少两个是LNA,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。本文公开了优选的反义寡核苷酸,其包含能够与所述序列AATTCAGCCCTAACCT(Seq.IDNo.1)杂交的至少10个连续核苷酸的序列。
本发明进一步涉及恢复细胞或组织中的肾病蛋白功能的方法,包括用有效量的由10至28个核苷酸组成的反义寡核苷酸孵育所述细胞或组织,并且所述10至28个核苷酸中的至少两个是LNA,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列CTGAATTTTGCAATGT(Seq.ID No.3)或AAATGCCTTGCTTGTA(Seq.ID No.2),并且所述反义寡核苷酸包含能够与所述序列CTGAATTTTGCAATGT(Seq.ID No.3)或AAATGCCTTGCTTGTA(Seq.IDNo.2)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。本文公开了优选的反义寡核苷酸,其包含能够与所述序列CTGAATTTTGCAATGT(Seq.IDNo.3)或AAATGCCTTGCTTGTA(Seq.ID No.2)杂交的至少10个连续核苷酸的序列。
本发明进一步涉及恢复细胞或组织中的肾病蛋白功能的方法,包括用有效量的由10至28个核苷酸组成的反义寡核苷酸孵育所述细胞或组织,并且所述10至28个核苷酸中的至少两个是LNA,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.ID No.1),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.IDNo.1)杂交的至少10个连续核苷酸的序列,以及所述反义寡核苷酸的盐和光学异构体,其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。本文公开了优选的反义寡核苷酸,其包含能与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的至少10个连续核苷酸的序列。
表33a:本文公开的序列的描述。
/>
/>
/>
/>
/>
/>
Seq.ID No.98代表智人肝配蛋白B2(EFNB2),转录本变体1,mRNA(NCBI参考序列:NM_004093.4)以DNA编码书写,即以G、C、A、T编码表示,而非以RNA编码书写。Seq.ID No.99代表智人肝配蛋白B2(EFNB2),转录本变体2,mRNA(NCBI参考序列:NM_001372056.1)以DNA编码书写,即以G、C、A、T编码表示,而非以RNA编码书写。Seq.ID No.100代表智人肝配蛋白B2(EFNB2),转录本变体1,mRNA(NCBI参考序列:NM_001372057.1)以DNA编码书写,即以G、C、A、T编码表示,而以RNA编码书写。Seq.ID No.101代表智人染色体13,GRCh38.p13初级组装(NCBI参考序列:NC_000013.11)(NC_000013.11:c106535662-106489745智人染色体13,GRCh38.p13初级组装)。Seq.ID No.189代表小家鼠品系C57BL/6J染色体8,GRCm38.p6C57BL/6J NCBI参考序列:NC_000074.6。
附图说明
图1:肝配蛋白-B2/EphB4正向信号转导控制肾小球中的肾病蛋白表达。a:对照和Efnb2iΔEC小鼠的肾小球中肝配蛋白-B2、CD31、肾病蛋白和细胞核(DAPI)的染色。三角指示肾病蛋白阳性的足细胞,箭头指示CD31阳性的EC。中间图的虚线框的放大图像显示在右侧图中。b,c:对照和Efnb2iΔEC小鼠的肾小球中的肾病蛋白、CD31和DAPI染色。b)中肾病蛋白的定量平均强度显示在c)中。n=3,直线代表平均值+/-SEM。**p<0.01,通过学生氏t检验。d:对照和Efnb2iΔEC小鼠肾脏裂解液的蛋白免疫印迹分析。显示了肾病蛋白的定量强度。数值代表平均值+/-SEM,n=5,通过学生氏t检验,****p<0.0001。
图2:肝配蛋白-B2由EC分泌至足细胞。a:带标签形式的肝配蛋白-B2蛋白和抗体的表位的示意图。b:用flag抗体从HEK293细胞裂解液及其培养条件培养基中对N端带标签的GFP-flag-肝配蛋白-B2或GFP进行免疫沉淀。上侧的图显示了用抗flag抗体检测到的条带。下侧的图显示了用针对其胞质尾产生的肝配蛋白-B2抗体检测到的条带。c,用GFP抗体进行可视化的CFP-肝配蛋白-B2在足细胞(三角)以及EC中被证实。使用tTA阴性动物作为阴性对照。d:在对照小鼠的血浆中检测到Eprhin-B2,其在Efnb2iΔEC小鼠的血浆中显著降低。e,f:对照和Efnb2iΔEC小鼠的肾小球中pEphB4、肾病蛋白和DAPI的染色。d)中pEphB4的定量平均强度显示在e)中。n=3,直线代表平均值+/-SEM。通过学生氏t检验,**p<0.01。
图3:肝配蛋白-B2/EphB4正向信号转导调节肾小球中的肾病蛋白磷酸化。a:用肾病蛋白从小鼠肾脏裂解液中对内源EphB4进行免疫沉淀。b,c:对照和Efnb2iΔEC小鼠的肾小球中的磷酸化肾病蛋白、CD31和DAPI的染色。b)中磷酸化肾病蛋白的定量平均强度显示在c)中。n=4,直线代表平均值+/-SEM。通过学生氏t检验,***p<0.001。
图4:在糖尿病肾病患者中的肝配蛋白-B2表达增加。a,b,高草酸尿症和糖尿病肾病患者的肾小球中肝配蛋白-B2、肾病蛋白和DAPI的染色。用a)中的DAPI标准化的足细胞中肝配蛋白-B2表达的相对比值显示在b)中。n=3,直线代表平均值+/-SEM。通过学生氏t检验,*p<0.05。
图5:在Efnb2iΔEC突变体中糖尿病肾脏功能障碍得到改善。a:对照和Efnb2iΔEC小鼠肾脏的苏木精和伊红(HE)染色切片的光学显微镜分析。b:糖尿病对照和Efnb2iΔEC小鼠中血糖水平的定量。直线代表平均值+/-SEM。实验终点时,对于对照,n=8,对于Efnb2iΔEC小鼠,n=6。通过学生氏t检验,n.s.。c:实验终点时,糖尿病对照和Efnb2iΔEC小鼠的体重的定量。直线代表平均值+/-SEM。n=6。通过学生氏t检验,n.s.。d,实验终点时糖尿病对照(n=3)和Efnb2iΔEC小鼠(n=4)中血清肌酐水平的定量。直线代表平均值+/-SEM。通过学生氏t检验,n.s.。e:使用UACR对来自对照和Efnb2iΔEC小鼠的连续尿液样品进行定量。非糖尿病对照,n=5,糖尿病对照,n=5,糖尿病Efnb2iΔEC小鼠,n=4,通过双因素ANOVA,**p<0.01,*p<0.05。直线代表平均值+/-SEM。f,g:非糖尿病对照、糖尿病对照和Efnb2iΔEC小鼠的肾小球中肾病蛋白、CD31和DAPI的染色。肾病蛋白在f)中的定量平均强度显示在g)中。非糖尿病对照n=6,糖尿病对照n=6,糖尿病Efnb2iΔEC小鼠n=8。直线代表平均值+/-SEM。通过双因素ANOVA,***p<0.001。h:免疫金EM染色显示肾病蛋白(三角)定位于糖尿病对照和Efnb2iΔEC小鼠的足突基底部和足细胞裂隙隔膜之下。
图6:通过ASO敲低肝配蛋白-B2。a)ASO转染到从Efnb2 loxed小鼠(命名为LOX)分离培养的EC(肝配蛋白-B2基因)中,Efnb2mRNA(基因编码的eprin-B2)的相对表达减少。通过实时RT-PCR分析mRNA水平(n=3)。数据代表平均值15±S.E.M.,单因素ANOVA。*p<0.05,**p<0.01,***p<0.001。b)显示了针对Efnb2的ASO的序列。对于阴性对照,使用肝配蛋白-B2 KO细胞(命名为KO)。所有ASO都具有包含在3’末端的4个LNA和在5’末端的4个LNA的gapmer结构。
图7:示意图显示了efnb2短链体聚物(shortmer)Seq.ID 74p的结果。
图8:高血糖不仅影响肾脏稳态,还影响其他组织。检查了糖尿病条件下在内皮细胞中抑制肝配蛋白-B2的影响。为了深入了解肝配蛋白-B2在糖尿病中的作用,观察了内皮细胞Efnb2缺失对白内障、脂肪肝和炎症的影响:A:从患有糖尿病的小鼠眼球中移除晶状体,并且检验其光传播。虽然对照小鼠表现出严重的白内障并且光传播受到严重抑制(受影响区域显示为灰色),但肝配蛋白-B2内皮特异性KO小鼠中的症状得到改善。B显示统计学分析。C,D:通过油红O染色(C)和使用巨噬细胞标志物f4/80的免疫染色(D)检验脂肪肝疾病。从糖尿病小鼠分离肝脏并进行冰冻切片。对照糖尿病小鼠显示出脂质蓄积和肝脏炎症。肝配蛋白-B2内皮特异性糖尿病小鼠中的症状得到大幅改善。绿色(鬼笔环肽),蓝色(DAPI)。这些结果显示抑制内皮肝配蛋白-B2对糖尿病并发症的有益作用。
以下实施例旨在展示本发明的优选实施方案。本领域技术人员应理解,以下实施例中公开的技术代表了发明人所发现的在本发明的实践中发挥了良好作用的技术,因此可以认为这些技术构成了本发明的实践的优选模式。然而,根据本公开内容,本领域技术人员应理解,在不偏离本发明的精神和范围的情况下,可以对所公开的具体实施方案进行许多改变并仍然获得相同或类似的结果。
根据本说明书,本发明的各方面的进一步修改和替代实施方案对于本领域技术人员而言将是明显的。因此,本说明书应解释为仅是说明性的,并且是出于向本领域技术人员提供实施本发明的一般方法的教导的目的。应理解,本文显示和描述的本发明的形式应视为实施方案的实例。可以对本文中举例说明和描述的元素和材料进行替换,可以对局部部分和流程进行颠倒,并且本发明的某些特征可以独立使用,在受益于本发明的说明书之后所有这些对于本领域技术人员而言都是明显的。在不偏离如以下权利要求所描述的本发明的精神和范围的情况下,可以对本文所描述的元素进行改变。
实施例
材料与方法
具有以下序列的寡核苷酸用作参考:
参考.1=Gb1sC*b1sdGsdGsdAsdCsdAsdCsdGsdCsC*b1sGb1(Seq.ID No.97)
实施例1:小鼠
所有实验均使用雄性小鼠。Cdh5-Cre ERT2小鼠与Efnb2 loxP-flanked同源小鼠(Efnb2lox/lox)交配繁殖。Efnb2lox/lox-Cdh5-Cre ERT2阴性小鼠用作对照同窝鼠。为了诱导肝配蛋白-B2的基因沉默,在Efnb2iΔEC和对照同窝鼠中以3mg/ml的50μl的剂量腹腔注射他莫昔芬(Tamoxifen)(Sigma,T5648),持续从P21至P23的连续三天。为了检查肾小球中Cre的特异性表达,Cdh5-Cre ERT2小鼠与R26-stop-EYFP突变小鼠交配繁殖。
涉及动物的实验均按照机构准则和法律进行,并遵循当地动物伦理委员会和当局(Regierungspraesidium Darmstadt)批准的方案。
LOX是细胞系的名称,是从携带T抗原的肝配蛋白-B2floxed/floxed小鼠中分离出的内皮细胞。然后用编码Cre的质粒DNA感染这些细胞以对Efnb2(编码肝配蛋白-B2的基因)进行KO。
糖尿病模型小鼠
为了诱导糖尿病,将链脲菌素(Streptozotocin)(Sigma,S0130)溶解在pH4.5的柠檬酸钠缓冲液(Sigma,C8532)中,将其从P35至P39以40mg/Kg体重进行腹腔注射。当必要时,为小鼠提供10%蔗糖水(Sigma,S0389)以防止和治疗低血糖。注射链脲菌素之后,用西式高脂饮食喂养小鼠直至实验终点(ssniffGmbH,E15126-34)以帮助糖尿病的发展。在实验方案之前和结束时,通过尾静脉取血检查小鼠的血糖值。对照非糖尿病小鼠从5周龄至18周龄期间仅用西式高脂饮食进行喂养。
免疫染色
小鼠肾脏切片通过冰冻切片(10μm厚)制备,并在PBS中用4%多聚甲醛溶液(pH7.4)固定10分钟。经固定的切片用PBS洗涤3次,并用合适的抗肝配蛋白-B2(Sigma,HPA0008999,1:100稀释)、CD31(BD Pharmingen,557355,1:100稀释)、肾病蛋白(R&DSystems,AF3159,1:100稀释)、phospho-EphB4(Signalway Antibody,12720,1:100稀释)、phospho-肾病蛋白(Abcam,ab80299,1:100稀释)或GFP(Invitrogen,A21311,1:200稀释)的一抗在4℃下孵育过夜。用一抗孵育之后,切片用PBS洗涤3次,然后用生物素-SP-缀合的AffiniPure山羊抗兔IgG(H+L)(Jackson ImmunoResearch:Laboratories Inc.,705-065-147,1:200稀释)和另外的相关Alexa Fluor二抗在室温下孵育2小时。切片用PBS洗涤3次,并用针对生物素的链霉亲和素Alexa Fluor缀合的二抗(Thermo Fisher Scientific,Invitrogen,Life Technologies)孵育另外的两个小时。用PBS洗涤3次后,在PBS中用DAPI(Thermo Fisher Scientific,Invitrogen,Life Technologies;D3571)溶液对切片进行复染15分钟。洗涤切片并使用封片介质(SouthernBiotech,0100-01)进行封片。
用于人体研究分析的标本在知情同意后取自患者。根据《赫尔辛基宣言》的规定,这些标本的使用获得了华盛顿大学医学院IRB的批准。
甲醛固定的石蜡包埋的肾脏组织样品经脱蜡处理后,通过在EDTA缓冲液(pH 8)中将载玻片煮沸15分钟进行抗原修复,用5%BSA/5%FBS/0.1%Tween-20封闭30分钟,然后用兔抗肝配蛋白-B2抗体(Sigma,HPA0008999,1:100稀释)和山羊抗肾病蛋白抗体(R&DSystems,AF3159,1:100稀释)在4℃下处理过夜。然后用AlexaFluor 546驴抗山羊IgG(1:500稀释;Invitrogen)、AlexaFluor 488驴抗兔IgG和Hoechst 33342(1:500稀释;ThermoFisher Scientific)在室温下孵育载玻片2小时。使用Leica SP8显微镜拍摄图像。为了测量肾小球的像素的平均信号强度,使用Volocity(Improvision)进行定量图像分析。使用Photoshop CS和Illustrator CS(Adobe)软件进行图像处理,并遵守图像处理的一般准则。
苏木精和伊红(HE)以及PAM染色
对在实验终点采集的肾脏进行脱水和石蜡封片。使用显微切片机切片(3-4μm厚)后,将载玻片置于60℃下以使石蜡融化并将组织固定在载玻片上。然后将肾脏切片通过依次浸泡在二甲苯(10分钟,3次)、100%乙醇(5分钟,3次)、95%乙醇(5分钟,1次)、80%乙醇(5分钟,1次)和去离子水(5分钟,1次)中进行再水化。将切片在苏木精(Waldeck;2E-038)溶液中浸泡5分钟,然后用流动的自来水洗涤直至出现与苏木精相对应的蓝色。在这之后,将切片放置在伊红(Waldeck;2C-140)溶液中1分钟,并在95%乙醇中洗涤3次,持续3分钟。染色后的肾脏切片再次在100%乙醇(3分钟,3次)和二甲苯(5分钟,3次)中脱水,随后使用New(Merck Millipore;107961)封片介质进行封片。
用于免疫电子显微术的肾病蛋白染色
对于EM,将肾脏组织的小块(透射EM)在4%多聚甲醛和0.2%戊二醛中固定过夜。在PBS中用20%驴血清和0.1%phot-flo(Electron Microscopy Sciences)孵育样品30分钟,然后用抗肾病蛋白抗体(R&Dsystems,AF3159,1:100稀释)在4℃下孵育过夜,随后用兔抗山羊Fab'(Nanoprobes,2006,1:100稀释)在4℃下孵育过夜。在0.1M磷酸盐缓冲液中洗涤并用1%戊二醛固定之后,用HQ Sliver增强试剂盒(Nanoprobes,2012)增强信号。用OsO4重新固定后,样品在梯度乙醇系列中脱水,并包埋在环氧树脂中。通过EM(Hitachi,H-7650)检验超薄切片。
UACR测量和血清肌酐测定
按照制造商的说明,使用小鼠白蛋白ELISA试剂盒(ShibayagiCo.Ltd,AKRAL-121)和肌酐测定试剂盒(AbCam,ab65340)测定尿白蛋白值和尿肌酐值。使用96孔板酶标仪测量ELISA平板的光密度(O.D.)读数,在450nm处测量白蛋白值,在570nm处测量肌酐值。对于每只小鼠的每个时间点,通过白蛋白的最终值(毫克/升,mg/l)除以获得的肌酐值(克/升,g/l)得到UACR值。如上所述,使用肌酐测定试剂盒(AbCam,ab65340)确定血清肌酐值。储存在-80℃的血清在冰上解冻,并且不经任何稀释即用于测定。
用肾脏裂解液进行蛋白免疫印迹分析
将收集的全肾组织进行称重,切成小块并悬浮于3ml/g组织的RIPA缓冲液(50mMTris-HCl,pH 7.4;1%NP-40;0.5%脱氧胆酸钠;0.1%SDS;150mM NaCl;2mM EDTA;蛋白酶抑制剂(Sigma,P2714,1:100))中,用手持超声波仪进行均质化。然后,将样品在10000xg下离心10分钟。将上清液转移至新的试管中,并在4℃下以10000xg再次旋转30分钟。然后将上清液用于进一步分析。使用BCA蛋白质测定法(Pierce)确定蛋白质浓度,将2mg蛋白质悬浮在3x SDS上样缓冲液中,煮沸并用于使用抗肾病蛋白(R&D systems,AF3159,1:1000稀释)和抗a-tubulin(Sigma,T5168,1:20000)抗体的蛋白免疫印迹分析。用ImageJ测量信号强度。
从肾脏裂解液中免疫沉淀EphB4
与用于蛋白免疫印迹相同地制备肾脏裂解液,然后用2μg抗EphB4抗体(R&Dsystems,MAB446)在4℃下在旋转下孵育1小时。然后加入20μl的预先用洗涤缓冲液(50mMTris-HCl pH8.0,EDTA 1mM,NaCl 150mM,NP-40 1%,蛋白酶抑制剂(Sigma,P2714,1:100)和磷酸酶抑制剂(Merck Millipore,524625))洗涤的Dynabeads G(Thermo FisherScientific,Invitrogen,Life Technologies;10004D)。在4℃孵育1小时之后,使用磁力分离器分离Dynabeads G,并用洗涤缓冲液洗涤5次。将珠子重悬于30μl的1X SDS样品缓冲液中,使用抗肾病蛋白(R&D Systems,AF3159,1:1000稀释)和抗EphB4(R&DSystems,AF446,1:1000稀释)抗体进行蛋白免疫印迹分析。
从培养的EC中免疫沉淀肝配蛋白-B2
将Efnb2 lox/lox细胞和KO细胞(1x106个细胞/10cm平皿)15接种并孵育24小时。用冰冷的PBS洗涤细胞,并用800μl的裂解缓冲液(50mM Tris-HCl[pH7.4],1%NP-40,150mMNaCl,蛋白酶抑制剂混合物(Sigma,P2714,1:100),磷酸酶抑制剂混合物(Calbiochem,524629,1:50)进行裂解。将裂解液在4℃下以20000x g离心10分钟,上清液用与2μg肝配蛋白-B2抗体(R&D systems AF 496)交联的蛋白Gsepharose珠子在4℃下孵育1小时。用过量的裂解缓冲液洗涤珠子三次,并用60μl的1X SDS样品缓冲液进行洗脱。然后将20μl的每份洗脱液进行SDS-PAGE,随后用抗肝配蛋白-B2抗体(Sigma,HPA008999)进行免疫印迹。
cDNA的转染
用聚乙烯亚胺(PEI;Polysciences Inc.,24765)将pEGFP(clontech)pBabe-puro-GFP-flag-肝配蛋白-B2、pcDNA3-HA-Capns1(由Claudio Schneider博士友情赠送)或pCMV-Rbpj-myc-Flag(由Lead Discovery Center GmbH,Dortmund友情提供)转染至HEK293细胞中。通过将100μl的150mM NaCl蒸馏水溶液与2μg质粒DNA混合然后将混合物涡旋随后加入100μl PEI-NaCl溶液来制备200μl转染混合物。PEI-NaCl-质粒转染混合物孵育10分钟并加入到细胞中。转染混合物与细胞孵育6-8小时。洗涤细胞并加入新鲜的细胞培养基。对于HUVEC,按照生产商的说明使用DNA转染试剂(PolyPlus,101-10)。
带标签的蛋白质的免疫沉淀
转染之后48小时,用裂解缓冲液(20mM Tris-HCl[pH7.4],1mM EDTA,1mM DTT,1%CHAPS,150mM NaCl和1X蛋白酶抑制剂(Sigma,P2714))裂解细胞。细胞裂解液或培养基通过在4℃下以10000xg离心10分钟进行澄清。上清液与Flag-M2磁珠(Sigma,M8823)在4℃下孵育2小时。用磁力分离器分离Flag-M2磁珠,并用裂解缓冲液洗涤3次。将珠子悬浮在SDS样品缓冲液中以用于使用抗Flag-M2 HRP缀合的(Sigma,A8592,1:10,000稀释)、抗肝配蛋白-B2(Sigma,HPA008999,1:1000稀释)或抗HA-HRP缀合的(Cell Signaling Technology,2999,1:10000稀释)抗体进行蛋白免疫印迹分析。
实施例2:ASO的转染
动态递送系统(Mirus Bio,Madison,WI)将ASO转染至Lox细胞中。通过在Opti-MEM中混合6μl ASO然后涡旋混合物随后加入3μl TransIT-X2来制备50μL的ASO混合物。将ASO转染混合物孵育30分钟并添加至细胞中(最终浓度100nM)。转染混合物与细胞一起孵育48小时。
RT-qPCR
用Quick-RNA Miniprep试剂盒(R1054,Zymo Research,Freiburg Germany)提取mRNA。用SuperScript IV VILO(11756050,ThermoFisherScientific,MA)进行反转录。用Power SYBR Green Master Mix(4367659,Thermo Fisher Scientific)和以下引物进行定量PCR:小鼠β-肌动蛋白_Fwd:5'-GAAATCGTGCGTGACATCAAAG-3',小鼠β-肌动蛋白_Rvr5'-TGTAGTTTCATGGATGCCACAG-3',小鼠Efnb2-1_Fwd:5'-ATTATTTGCCCCAAAGTGGACTC-3',小鼠Efnb2-1_Rvs5'-GCAGCGGGGTATTCTCCTTC-3'
实施例2.1
反义寡核苷酸Seq.ID 74p的结果如图7所示。
表34
格式 96孔板
细胞 LOX 2x10^4/孔
培养基 LOX细胞培养基
自由摄取10、3.3、1.1、0.37、0.12μM
表35
混合60μl的短链体聚物反义寡核苷酸Seq.ID 74p+300μl细胞
划分为120μl的3份
在33℃下孵育48小时
用Cells-to-CT试剂盒进行分析
qPCR StepOnePlusTM实时PCR系统
Power up SYBR Green
内部对照:B2M(β-2-微球蛋白)
实施例3:gapmer反义寡核苷酸的合成
缩写
Pybop:六氟磷酸(苯并三唑-1-基-氧基)三吡咯烷基磷((Benzotriazol-1-yl-oxy)tripyrrolidinophosphonium-hexafluorophosphate)
DCM:二氯甲烷(Dichloromethane)
DMF:二甲基甲酰胺(Dimethylformamide)
DIEA:二异丙基乙胺(Diisopropylethylamine)
DMAP:4-二甲氨基吡啶(4-Dimethylaminopyridine)
DMT:4,4’-双甲氧基三苯甲基(4,4’-dimethoxytrityl)
LCAA:长链烷基氨基
TRIS:三(羟甲基)氨基甲烷(Tris(hydroxymethyl)-aminomethan)
TRIS-HCl:三(羟甲基)氨基甲烷盐酸盐(Tris(hydroxymethyl)-aminomethanhydrochloride)
DEPC:焦磷酸二乙酯(Diethylpyrocarbonate)
Gapmer反义寡核苷酸合成和纯化
使用装载有UnylinkerTM Chemgenes(Wilmington,MA,USA)的可控孔玻璃(CPG)作为固体支持物以得到3μmol的合成规模,在ABI 394合成仪(Applied Biosystems)上根据亚磷酰胺寡聚化学法制备gapmer形式的反义寡核苷酸。
可替代地,可以在ABI 3900或ExpediteTM(Applied Biosystems)上根据亚磷酰胺寡聚化学法制备反义寡核苷酸。在ABI3900上,固体支持物可以是装载有UnySupport(GlenResearch,Sterling,Virginia,USA)的聚苯乙烯,以得到0.2μmol的合成规模。
作为DNA建造单元,使用5’-O-DMT-2’-脱氧胸苷-3’-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺、5’-O-DMT-N4-苯甲酰基-2’-脱氧胞苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺、5’-O-DMT-N6-苯甲酰基-2’-脱氧腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺和5’-O-DMT-N2-异丁酰-2’-脱氧鸟苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺,其对应于脱氧胸苷(dT)、4-N-苯甲酰基-2’-脱氧胞苷(dCBz)、6-N-苯甲酰基-2’-脱氧腺苷(dABz)和2-N-异丁酰-2’-脱氧鸟苷(dGiBu)的5’-O-(4,4’-二甲基三苯甲基)-2’-O,3’-O-(2-氰乙基-N,N-二异丙基)亚磷酰胺单体。
作为LNA建造单元(β-D-氧代-LNA),使用5’-O-DMT-2’-O,4’-C-亚甲基-N2-二甲基甲脒-鸟苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(LNA-GDMF)、5’-O-DMT-2’-O,4’-C-亚甲基-胸苷3’-[(2-氰乙基)-(N,N-二异丙基)]亚磷酰胺(LNA-T)、5’-O-DMT-2’-O,4’-C-亚甲基-N6-苯甲酰腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(LNA-ABz)、5’-O-DMT-2’-O-,4’-C-亚甲基-5-甲基-N4-苯甲酰胞苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(LNA-C*Bz)。
除了LNA-C*Bz是在THF/乙腈(25/75(v/v))的混合物中溶解之外,LNA的亚磷酰胺溶解在干燥的乙腈中,以得到0.07M的寡核苷酸。对于LNA-ABz(MW=885.9g/mole,CAS号[206055-79-0]),将100mg溶解在1.6ml无水乙腈中。对于LNA-C*Bz(MW=875.9g/mol,CAS号[206055-82-5]),将100mg溶解在1.6ml THF/乙腈25/75(v/v)中。对于LNA-GDMF(MW=852.9g/mol,CAS号[709641-79-2]),将100mg溶解在1.7ml无水乙腈中。对于LNA-T(MW=772.8g/mol,CAS号[206055-75-6]),将100mg溶解在1.8ml无水乙腈中。
β-D-硫代-LNA,5’-O-DMT-2’-脱氧-2’-巯基-2’-S,4’-C-亚甲基-N6-苯甲酰腺苷-3’-[(2-氰乙基-N,N-二异丙基)]-亚磷酰胺、5’-O-DMT-2’-脱氧-2’-巯基-2’-S,4’-C-亚甲基-5-甲基-N4-苯甲酰胞苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺、5'-O-DMT-2’-脱氧-2’-巯基-2’-S,4’-C-亚甲基-N2-二甲基甲脒鸟苷-3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺和5’-O-DMT-2’-脱氧-2’-巯基-2’-S,4’-C-亚甲基-胸苷-3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺如J.Org.Chem.1998,63,6078-6079中所描述进行合成。
β-D-氨基-LNA,5’-O-DMT-2’-脱氧-2’-氨基-2’-N,4’-C-亚甲基-5-甲基-N4-苯甲酰胞苷-3’-[(2-氰乙基-N,N-二异丙基)]-亚磷酰胺、5'-O-DMT-2’-脱氧-2’-氨基-2’-N,4’-C-亚甲基-N2-二甲基甲脒鸟苷-3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺、5’-O-DMT-2’-脱氧-2’-氨基-2’-N,4’-C-亚甲基-胸苷-3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺、5’-O-DMT-2’-脱氧-2’-氨基-2’-N,4’-C-亚甲基-N6-苯甲酰腺苷-3’-[(2-氰乙基-N,N-二异丙基)]-亚磷酰胺、5’-O-DMT-2’-脱氧-2’-甲胺基-2’-N,4’-C-亚甲基-5-甲基-N4-苯甲酰胞苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺、5'-O-DMT-2’-脱氧-2’-甲胺基-2’-N,4’-C-亚甲基-N2-二甲基甲脒鸟苷-3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺、5’-O-DMT-2’-脱氧-2’-甲胺基-2’-N,4’-C-亚甲基-胸苷-3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺和5’-O-DMT-2’-脱氧-2’-氨基-2’-N,4’-C-亚甲基-N6-苯甲酰腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺的合成根据文献程序(J.Org:Chem.1998,63,6078-6079)进行。
α-L-氧代-LNA,α-L-5’-O-DMT-2’-O,4’-C-亚甲基-N6-苯甲酰腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺、α-L-5’-O-DMT-2’-O-,4’-C-亚甲基-5-甲基-N4-苯甲酰胞苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺、α-L-5'-O-DMT-2'-O,4’-C-亚甲基-N2-二甲基甲脒鸟苷-3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺和α-L-5’-O-DMT-2'-O,4’-C-亚甲基-胸苷-3'-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺以文献(J.Am.Chem.Soc.2002,124,2164-2176;Angew.Chem.Int.Ed.2000,39,1656-1659)中描述的类似程序进行。
β-D-ENA LNA,5’-O-DMT-2’-O,4’-C-乙烯-N2-二甲基甲脒-鸟苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺、5'-O-DMT-2'-O,4’-C-乙烯-胸苷3'-[(2-氰乙基)-(N,N-二异丙基))亚磷酰胺、5’-O-DMT-2’-O,4’-C-乙烯-N6-苯甲酰腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺和5’-O-DMT-2’-O-,4’-C-乙烯-5-甲基-N4-苯甲酰胞苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺的合成根据文献程序(Nucleic Acids Research:2001,增刊第1期,241-242)进行。
β-D-ENA LNA,5’-O-DMT-2’-O,4’-C-乙烯-N2-二甲基甲脒-鸟苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺、5'-O-DMT-2'-O,4’-C-乙烯-胸苷3'-[(2-氰乙基)-(N,N-二异丙基)]亚磷酰胺、5’-O-DMT-2’-O,4’-C-乙烯-N6-苯甲酰腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺和5’-O-DMT-2’-O-,4’-C-乙烯-5-甲基-N4-苯甲酰胞苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺的合成根据文献程序(Nucleic Acids Research:2001,增刊第1期,241-242)进行。
用于合成具有二硫代磷酸酯骨架的寡核苷酸的(β-(苯甲酰基巯基)乙基)吡咯烷醇硫代亚磷酰胺通过与由Caruthers(J.Org.Chem.1996,61,4272-4281)所报道的类似的方案进行制备。
采购“亚磷酰胺-C3”(3-(4,4'-二甲氧基三苯氧基)丙基-1-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺和“3’-间隔子C3 CPG”(1-二甲氧基三苯氧代-丙二醇-3-琥珀酰基)-长链烷基氨基-CPG。
一般程序
LNA固体支持物的制备
1)LNA琥珀酰半酯的制备(WO2007/112754)
将5'-O-DMT-3'-羟基-核苷酸单体、琥珀酸酐(1.2eq.)和DMAP(1.2eq.)溶解在35ml二氯甲烷(DCM)中。反应在室温下搅拌过夜。用0.1M pH5.5的NaH2PO4(2x)和卤水(1x)萃取之后,有机层进一步用无水NaSO4干燥,过滤并蒸发。半酯衍生物的收率为95%,并且其使用无需进一步纯化。
2)LNA支持物的制备(WO2007/112754)
将上述制备的半酯衍生物(90μmol)溶解在最低量的DMF中,加入DIEA和pyBOP(90μmol)并一起混合1分钟。在手动合成仪中将此预活化的混合物与LCAA-CPG(80-120筛目尺寸,300mg)组合并搅拌。在室温下1.5小时之后,过滤掉支撑物,并用DMF、DCM和MeOH进行洗涤。干燥之后,装载量确定为57μmol/g。
寡核苷酸的延伸(偶联)
如WO2007/112754中所述的4,5-二氰基咪唑(DCI)用于亚磷酰胺的偶联。除了DCI之外,可以使用其他试剂例如5-乙硫基-1H-四氮唑(ETT)(在乙腈中0.5M)、5-苄硫基-1H-四氮唑或糖精-1-甲基咪唑作为活化剂。0.25M DCI(在乙腈中)用于与LNA的偶联。
加帽
加入在THF(HPLC级)中的10%乙酸酐(Ac2O)和在THF/吡啶(8:1)(HPLC级)中的10%N-甲基咪唑(NMI)并使其反应。
氧化
磷(lll)至磷(V)的转变通常用例如碘/THF/吡啶/H2O(使用0.02M碘的THF/吡啶/H2O溶液)或0.5M 1S)-(+)-(10-樟脑磺酰)-哑嗪(CSO)的无水乙腈溶液来实现。
在制备硫代磷酸核苷酸间键联的情况下,使用在无水乙腈中的0.2M 3H-1,2-苯并二硫醇-3-酮1,1-二氧化物(Beaucage试剂)进行硫代步骤。还可以通过使用无水乙腈/吡啶(1:1v/v)中3-((二甲基氨基-亚甲基)氨基)-3H-1,2,4-二噻唑啉-3-硫酮(DDTT)的0.05M溶液,或通过使用如WO2007/112754中所述的苍耳烷氯化物(乙腈/吡啶10%中的0.01M)进行硫代。可替代地,可以使用其他试剂进行硫代步骤,例如苍耳烷氢化物(5-亚氨基-(1,2,4)二噻唑烷-3-硫酮)、苯乙酰二硫化物(PADS)。
在制备硫代磷酸核苷酸间键联的情况下,通过加入吡啶/乙腈(4:1v/v)中的0.05MDDTT(3-((二甲基氨基-亚甲基)氨基)-3H-1,2,4-二噻唑啉-3-硫酮)将所得的硫代亚磷酸盐三酯氧化成硫代磷酸三酯。
从固体支持物上切割和脱保护
在固相合成结束时,可以使用“Deblock”试剂将最后的5’-O-(4,4’-二甲氧三苯甲基)基团从合成仪上移除,或该基团可以仍然存在而寡核苷酸被从固相支持物上切割下来。用三氯乙酸移除DMT基团。
移除固体支持物上的5’-O-(4,4’-二甲氧三苯甲基)基团:
在固相合成完成后,用乙腈中的20%二乙胺溶液处理反义寡核苷酸20分钟,以移除磷酸骨架上的氰乙基保护基团。随后,将反义寡核苷酸从固体载体上切割下来,并使用1至5mL浓氨水在55℃下脱保护16小时。通过过滤或离心分离反义寡核苷酸与固体支持物。
如果寡核苷酸含有二硫代磷酸酯三酯,用苯硫酚:三乙胺:二氧己环(1:1:2,v/v/v)对硫醇基团进行脱保护24小时,然后使用氨水在室温下持续1-2小时以将寡核苷酸从固体支持物上切割下,并在65℃下进一步脱保护4小时。
从固体支持物上切割后移除5’-O-(4,4’-二甲氧三苯甲基)基团:
使用氨水在室温下1-2小时以将寡核苷酸从固体支持物上切割下来,并在65℃下进一步脱保护4小时。通过反相HPLC(RP-HPLC)纯化寡核苷酸,然后用三氯乙酸移除DMT基团。
如果寡核苷酸含有二硫代磷酸酯三酯,通过加入850μl在浓乙醇中的氨(氨/乙醇3:1v/v)在55℃下持续15-16小时来进行从固体支持物上的切割和硫醇基团的脱保护。
末端基团
在反义寡核苷酸的5’末端的末端基团:
用二氯甲烷中的3%三氯乙酸(w/v)处理固体支持物上的寡核苷酸以完全移除5’-DMT保护基团。进一步,用合适的具有氰乙基-N,N-二异丙基)亚磷酰胺部分的末端基团对化合物进行转化。将磷(III)氧化为磷(V)后,如上所述进行脱保护、从固体支持物上脱离和脱保护顺序。
纯化
通过阴离子交换高效液相色谱(HPLC)在AKTA Explorer色谱系统(GEHealthcare,Freiburg,Germany)和填充有Source Q15(GE Healthcare)的柱上对粗制反义寡核苷酸进行纯化。缓冲液A是10mM高氯酸钠、20mM Tris、1mM EDTA,pH 7.4,并且含20%乙腈;缓冲液B与缓冲液A相同,除了具有500mM高氯酸钠。使用在32个柱体积(CV)内的15%B至55%B的梯度。记录在280nm处的UV痕迹。将合适的级分合并,并用3M NaOAc,pH=5.2和70%乙醇进行沉淀。最后,用70%乙醇洗涤沉淀。
分析
通过电喷雾电离质谱(ESI-MS)确认反义寡核苷酸的身份,并通过分析型OligoPro毛细管电泳(CE)确定纯度。
在配备有Mono Q 10/100GL柱的Amersham Biosciences P920FPLC仪器上对二硫代酯(dithioate)进行纯化。用DEPC处理的水配制缓冲液,其组成如下:缓冲液A:25mMTris-HCl,1mM EDTA,pH 8.0;缓冲液B:25mM Tris-HCl,1mM EDTA,1M NaCl,pH 8.0。
实施例3.1:C*b1sAb1sdAsdGsdCsdAsdAsdGsdGsdCsAb1sTb1(Seq.ID No.46m)
步骤1(偶联):
用1400μl 3%三氯乙酸的二氯甲烷溶液处理5'-O-DMT-2'-O,4’-C-亚甲基-胸苷-3’-O-琥珀酰基-连接的LCAA CPG(0.2μmol)60秒以完全移除5’-DMT保护基团。用总量为800μl的乙腈洗涤几次后,用80μl的5’-O-DMT-2’-O,4’-C-亚甲基-N6-苯甲酰腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联反应。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤2(偶联):
用80μl的5’-O-DMT-N4-苯甲酰基-2’-脱氧胞苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤3(偶联):
用80μl的5’-O-DMT-N2-异丁酰基-2’-脱氧鸟苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤4(偶联):
用80μl的5’-O-DMT-N2-异丁酰基-2’-脱氧鸟苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤5(偶联):
用80μl的5’-O-DMT-N6-苯甲酰基-2’-脱氧腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤6(偶联):
用80μl的5’-O-DMT-N6-苯甲酰基-2’-脱氧腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤7(偶联):
用80μl的5’-O-DMT-N4-苯甲酰基-2’-脱氧胞苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤8(偶联):
用80μl的5’-O-DMT-N2-异丁酰基-2’-脱氧鸟苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤9(偶联):
用80μl的5’-O-DMT-N6-苯甲酰基-2’-脱氧腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤10(偶联):
用80μl的5’-O-DMT-2’-O,4’-C-亚甲基-N6-苯甲酰腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤11(偶联):
用80μl的5’-O-DMT-2’-O-,4’-C-亚甲基-5-甲基-N4-苯甲酰胞苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤12(脱保护和切割):
在固相合成完成后,用乙腈中的20%二乙胺溶液处理反义寡核苷酸20分钟,以移除磷酸骨架上的氰乙基保护基团。
随后,反义寡核苷酸被从固体支持物上切割下来,并使用5mL浓氨水在55℃下进一步脱保护16小时。通过过滤或离心分离反义寡核苷酸与固体支持物。
步骤13(纯化):
根据上述的一般程序,通过阴离子交换高效液相色谱(HPLC)纯化粗制反义寡核苷酸。
实施例3.2:Tb1sGb1sdCsdAsdAsdAsdAsdTsdTsdCsAb1sGb1s(Seq.ID No.74m)
步骤1(偶联):
用1400μl 3%三氯乙酸的二氯甲烷溶液处理5'-O-DMT-2'-O,4’-C-亚甲基-N2-二甲基甲脒鸟苷3’-O琥珀酰基-连接的LCAA CPG(0.2μmol)60秒以完全移除5’-DMT保护基团。用总量为800μl的乙腈洗涤几次后,用80μl的5’-O-DMT-2’-O,4’-C-亚甲基-N6-苯甲酰腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联反应。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤2(偶联):
用80μl的5’-O-DMT-N4-苯甲酰基-2’-脱氧胞苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤3(偶联):
用80μl的5'-O-DMT-2’-脱氧胸苷-3’-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤4(偶联):
用80μl的5'-O-DMT-2’-脱氧胸苷-3’-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤5(偶联):
用80μl的5’-O-DMT-N6-苯甲酰基-2’-脱氧腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤6(偶联):
用80μl的5’-O-DMT-N6-苯甲酰基-2’-脱氧腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤7(偶联):
用80μl的5’-O-DMT-N6-苯甲酰基-2’-脱氧腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤8(偶联):
用80μl的5’-O-DMT-N6-苯甲酰基-2’-脱氧腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤9(偶联):
用80μl的5’-O-DMT-N4-苯甲酰基-2’-脱氧胞苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤10(偶联):
用80μl的5’-O-DMT-2’-O,4’-C-亚甲基-N2-二甲基甲脒鸟苷-3’-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤11(偶联):
用80μl的5’-O-DMT-2’-O-,4’-C-亚甲基-胸苷-3’-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤12(脱保护和切割):
在固相合成完成后,用乙腈中的20%二乙胺溶液(Biosolve BV,Valkenswaard,The Netherlands)处理反义寡核苷酸20分钟,以移除磷酸骨架上的氰乙基保护基团。
随后,反义寡核苷酸被从固体支持物上切割下来,并使用5mL浓氨水在55℃下进一步脱保护16小时。通过过滤或离心分离反义寡核苷酸与固体支持物。
步骤13(纯化):
通过阴离子交换高效液相色谱(HPLC)在AKTA Explorer色谱系统(GEHealthcare,Freiburg,Germany)和填充有Source Q15(GE Healthcare)的柱上对粗制反义寡核苷酸进行纯化。缓冲液A是10mM高氯酸钠、20mM Tris、1mM EDTA,pH 7.4,并且含20%乙腈;缓冲液B与缓冲液A相同,除了具有500mM高氯酸钠。使用在32个柱体积(CV)内的15%B至55%B的梯度。记录在280nm处的UV痕迹。将合适的级分合并,并用3M NaOAc,pH=5.2和70%乙醇进行沉淀。最后,用70%乙醇洗涤沉淀。
实施例3.3:Gb1sGb1sdTsdTsdAsdGsdGsdGsdCsdTsGb1sAb1s(Seq.ID No.16m)
步骤1(偶联):
用1400μl 3%三氯乙酸的二氯甲烷溶液处理5'-O-DMT-2'-O,4’-C-亚甲基-N6-苯甲酰腺苷-3’-O-琥珀酰基-连接的LCAA CPG(0.2μmol)60秒以完全移除5’-DMT保护基团。用总量为800μl的乙腈洗涤几次后,用80μl的5’-O-DMT-2’-O,4’-C-亚甲基-N2-二甲基甲脒鸟苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联反应。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤2(偶联):
用80μl的5'-O-DMT-2’-脱氧胸苷-3’-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤3(偶联):
用80μl的5’-O-DMT-N4-苯甲酰基-2’-脱氧胞苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤4(偶联):
用80μl的5’-O-DMT-N2-异丁酰基-2’-脱氧鸟苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤5(偶联):
用80μl的5’-O-DMT-N2-异丁酰基-2’-脱氧鸟苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤6(偶联):
用80μl的5’-O-DMT-N2-异丁酰基-2’-脱氧鸟苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤7(偶联):
用80μl的5’-O-DMT-N6-苯甲酰基-2’-脱氧腺苷-3’-(2-氰乙基-N,N-二异丙基)亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤8(偶联):
用80μl的5'-O-DMT-2’-脱氧胸苷-3’-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤9(偶联):
用80μl的5'-O-DMT-2’-脱氧胸苷-3’-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤10(偶联):
用80μl的5’-O-DMT-2’-O,4’-C-亚甲基-N2-二甲基甲脒鸟苷-3’-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤11(偶联):
用80μl的5’-O-DMT-2’-O-,4’-C-亚甲基-N2-二甲基甲脒鸟苷-3’-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(0.07M)和236μl的DCI(0.25M)的乙腈溶液进行偶联。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将640μl的Beaucage(0.2M)插入至柱子中持续180秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
步骤12(脱保护和切割):
在固相合成完成后,用乙腈中的20%二乙胺溶液(Biosolve BV,Valkenswaard,The Netherlands)处理反义寡核苷酸20分钟,以移除磷酸骨架上的氰乙基保护基团。
随后,反义寡核苷酸被从固体支持物上切割下来,并使用5mL浓氨水在55℃下进一步脱保护16小时。通过过滤或离心分离反义寡核苷酸与固体支持物。
步骤13(纯化):
通过阴离子交换高效液相色谱(HPLC)在AKTA Explorer色谱系统(GEHealthcare,Freiburg,Germany)和填充有Source Q15(GE Healthcare)的柱上对粗制反义寡核苷酸进行纯化。缓冲液A是10mM高氯酸钠、20mM Tris、1mM EDTA,pH 7.4,并且含20%乙腈;缓冲液B与缓冲液A相同,除了具有500mM高氯酸钠。使用在32个柱体积(CV)内的15%B至55%B的梯度。记录在280nm处的UV痕迹。将合适的级分合并,并用3M NaOAc,pH=5.2和70%乙醇进行沉淀。最后,用70%乙醇洗涤沉淀。
实施例3.4
根据一般程序,用如实施例3.3所示例的合适的DNA和LNA建造单元来合成Seq.IDNo.15m、17m、18m、21i、22i、23i、21j、22j、23j、26m、27m、28m、29m、26n、27n、28n、29n、26o、27o、28o、29o、30q、31q、32q、30r、31r、32r、30s、31s、32s、30t、31t、32t、19q、20q、19r、20r、19s、20s、19t、20t、4as、4at、4au、4av、4aw、4ax、4ay、4az、4ba、4bb和4bc的反义寡核苷酸。
实施例3.5
根据一般程序,用如实施例3.1所示例的合适的DNA和LNA建造单元来合成Seq.IDNo.45m、47m、48m、44m、52i、53i、54i、55i、52j、53j、54j、55j、57m、58m、60m、59m、57n、58n、60n、59n、57o、58o、60o、59o、61q、62q、63q、61r、62r、63r、61s、62s、63s、61t、62t、63t、49q、50q、49r、50r、49s、50s、49t、50t、5as、5at、5au、5av、5aw、5ax、5ay、5az、5ba、5bb和5bc的反义寡核苷酸。
实施例3.6
根据一般程序,用如实施例3.2所示例的合适的DNA和LNA建造单元来合成Seq.IDNo.74m、77m、78m、84i、85i、86i、84j、85j、86j、88m、89m、90m、88n、89n、90n、88o、89o、90o,91q、92q、93q、91r、92r、93r、91s、92s、93s、91t、92t、93t、79q、80q、79r、80r、79s、80s、79t、80t、6as、6at、6au、6av、6aw、6ax、6ay、6az、6ba、6bb、6bc的反义寡核苷酸。
实施例3.7:Gb1Gb1dTsdTsdAsdGsdGsdGsdCsdTsGb1Ab1(Seq.ID.16p)
根据一般程序,将LNA与CPG结合。偶联反应和加帽步骤也如实施例3.3中所述的进行。
实施例3.8
根据一般程序,用如实施例3.3所示例的合适的DNA和LNA建造单元来合成Seq.IDNo.15p、17p、18p、21k、22k、23k、21l、22l、23l、9f、10f、11f、26p、27p、28p、29p、26q、27q、28q、29q、26r、27r、28r、29r、30u、31u、32u、30v、31v、32v、30w、31w、32w、30x、31x、32x、19u、20u、19v、20v、19w、20w、19x、20x、4bd、4be、4bf、4bg、4bh、4bi、4bj、4bk、4bl、4bm和4bn的反义寡核苷酸。
实施例3.9
根据一般程序,用如实施例3.1所示例的合适的DNA和LNA建造单元来合成Seq.IDNo.46p、45p、47p、48p、44p、52k、53k、54k、55k、52l、53l、54l、55l、39f、40f、41f、57p、58p、60p、59p、57q、58q、60q、59q、57r、58r、60r、59r、61u、62u、63u、61v、62v、63v、61w、62w、63w、61x、62x、63x、49u、50u、49v、50v、49w、50w、49x、50x、5bd、5be、5bf、5bg、5bh、5bi、5bj、5bk、5bl、5bm和5bn的反义寡核苷酸。
实施例3.10
根据一般程序,用如实施例3.2所示例的合适的DNA和LNA建造单元来合成Seq.IDNo.74p、77p、78p、84k、85k、86k、84l、85l、86l、71f、72f、73f、88p、89p、90p、88q、89q、90q、88r、89r、90r、91u、92u、93u、91v、92v、93v、91w、92w、93w、91x、92x、93x、79u、80u、79v、80v、79w、80w、79x、80x、6bd、6be、6bf、6bg、6bh、6bi、6bj、6bk、6bl、6bm和6bn的反义寡核苷酸。
实施例3.11:
Gb1ssGb1ssdTssdTssdAssdGssdGssdGssdCssdTssGb1ssAb1(Seq.ID.16s)
用1400μl 3%三氯乙酸的二氯甲烷溶液处理5'-O-DMT-2'-O,4’-C-亚甲基-N6-苯甲酰腺苷-3’-O-琥珀酰基-连接的LCAA CPG(0.2μmol)60秒以完全移除5’-DMT保护基团。用总量为800μl的乙腈洗涤几次后,用38μl在10%二氯甲烷(v/v)乙腈溶液中的5’-O-DMT-2’-O,4’-C-亚甲基-N2-二甲基甲脒鸟苷-3’-[(β-苯甲酰巯基)乙基]吡咯烷醇硫代磷酰胺(0.15M)和236μl的DCI(0.25M)的乙腈溶液进行偶联反应。允许偶联反应发生250秒,用800μl乙腈冲洗多余的试剂,将900μl的DDTT(在吡啶/乙腈4:1v/v中的0.05M)插入至柱子中持续240秒。用320μl乙腈冲洗系统。对于加帽步骤,加入448μl的乙酸酐的THF溶液(1:9v/v)和448μl的N-甲基咪唑(NMI)/THF/吡啶(1:8:1)并使其反应45秒。在此循环结束时,用480μl乙腈洗涤系统。用1400μl 3%三氯乙酸的二氯甲烷溶液处理化合物60秒以完全移除5’-DMT保护基团。
寡核苷酸的进一步延伸以与先前实施例中所述相同的方式进行。
在固相合成完成后,将反义寡核苷酸在850μl氨的浓乙醇溶液(氨/乙醇3:1v/v)中在55℃下处理15-16小时,以便将反义寡核苷酸从固体支持物上切割下来并使硫醇基团脱保护。
接下来,使用Mono Q 10/100GL柱通过阴离子交换色谱对粗制反义寡核苷酸进行纯化。缓冲液用DEPC处理的水配制,其组成如下:缓冲液A:25mM Tris-HCl,1mM EDTA,pH8.0;缓冲液B:25mM Tris-HCl,1mM EDTA,1M NaCl,pH 8.0。
实施例3.12
根据一般程序,用如实施例3.11所示例的合适的DNA和LNA建造单元来合成Seq.IDNo.15s、17s、18s、21m、22m、23m、21n、22n、23n、9g、10g、11g、26s、27s、28s、29s、26t、27t、28t、29t、26u、27u、28u、29u、30y、31y、32y、30z、31z、32z、30aa、31aa、32aa、30ab、31ab、32ab、19y、20y、19z、20z、19aa、20aa、19ab、20ab、4bo、4bp、4bq、4br、4bs、4bt、4bu、4bv、4bw、4bx、4by、46s、45s、47s、48s、44s、52m、53m、54m、55m、52n、53n、54n、55n、39g、40g、41g、57s、58s、60s、59s、57t、58t、60t、59t、57u、58u、60u、59u、61y、62y、63y、61z、62z、63z、61aa、62aa、63aa、61ab、62ab、63ab、49y、50y、49z、50z、49aa、50aa、49ab、50ab、5bo、5bp、5bq、5br、5bs、5bt、5bu、5bv、5bw、5bx、5by、74s、77s、78s、84m、85m、86m、84n、85n、86n、71g、72g、73g、88s、89s、90s、88t、89t、90t、88u、89u、90u、91y、92y、93y、91z、92z、93z、91aa、92aa、93aa、91ab、92ab、93ab、79y、80y、79z、80z、79aa、80aa、79ab、80ab、6bo、6bp、6bq、6br、6bs、6bt、6bu、6bv、6bw、6bx和6by的反义寡核苷酸。
实施例3.13
根据一般程序,用如实施例3.11所示例的合适的DNA和LNA建造单元来合成Seq.IDNo.9e、10e、11e、39e、40e、41e、71e、72e和73e的反义寡核苷酸。
实施例3.14
根据一般程序和如先前实施例所示来合成其他的Seq.ID No.16n、15n、17n、18n、46n、45n、47n、48n、44n、74n、77n、78n、16o、15o、17o、18o、46o、45o、47o、48o、44o、74o、77o、78o、16t、15t、17t、18t、46t、45t、47t、48t、44t、74t、77t、78t、16u、15u、17u、18u、46u、45u、47u、48u、44u、74u、77u、78u、16q、15q、17q、18q、46q、45q、47q、48q、44q、74q、77q、78q、16r、15r、17r、18r、46r、45r、47r、48r、44r、74r、77r和78r的反义寡核苷酸。以与含有β-D-氧代-LNA单元的反义寡核苷酸相同的方式来制备包括β-D-硫代-LNA、β-D-氨基-LNA、α-L-氧代-LNA、β-D-ENA、β-D-(NH)-LNA或β-D-(NCH3)-LNA单元的反义寡核苷酸。
序列表
<110> 马克斯·普朗克科学促进学会
<120> 用于通过肝配蛋白-B2抑制防止由内皮功能障碍导致的肾功能障碍的反义寡核苷酸
<130> GAR-P04264WO
<150> EP21179667.7
<151> 2021-06-15
<160> 296
<170> PatentIn version 3.5
<210> 1
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 智人肝配蛋白B2(EFNB2)、转录本变体1、2和3内的靶序列, 正义
<400> 1
aattcagccc taacct 16
<210> 2
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 智人肝配蛋白B2(EFNB2)、转录本变体1、2和3内的靶序列, 正义
<400> 2
aaatgccttg cttgta 16
<210> 3
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 智人肝配蛋白B2(EFNB2)、转录本变体1、2和3内的靶序列, 正义
<400> 3
ctgaattttg caatgt 16
<210> 4
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 4
aggttagggc tgaatt 16
<210> 5
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 5
tacaagcaag gcattt 16
<210> 6
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 6
acattgcaaa attcag 16
<210> 7
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 通式S1
<220>
<221> misc_feature
<222> (1)..(1)
<223> n可以代表5'AATTCTAGACCCCAGAGGT'3或来源于5'AATTCTAGACCCCAGAGGT'3的序列, 其中从5'末端消除一个或多个核苷酸,其中n至少是T
<220>
<221> misc_feature
<222> (10)..(10)
<223> n可以代表5'AATTCTTGAAACTTGATGG'3或来源于5'AATTCTTGAAACTTGATGG'3的序列, 其中从3'末端消除一个或多个核苷酸,其中n至少是A
<400> 7
ntagggctgn 10
<210> 8
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 8
aggttagggc 10
<210> 9
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 9
ggttagggct 10
<210> 10
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 10
gttagggctg 10
<210> 11
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 11
ttagggctga 10
<210> 12
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 12
tagggctgaa 10
<210> 13
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 13
agggctgaat 10
<210> 14
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 14
gggctgaatt 10
<210> 15
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 15
aggttagggc tg 12
<210> 16
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 16
ggttagggct ga 12
<210> 17
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 17
gttagggctg aa 12
<210> 18
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 18
ttagggctga at 12
<210> 19
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 19
aggttagggc tgaat 15
<210> 20
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 20
ggttagggct gaatt 15
<210> 21
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 21
ggttagggct g 11
<210> 22
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 22
gttagggctg a 11
<210> 23
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 23
ttagggctga a 11
<210> 24
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 24
tagggctgaa t 11
<210> 25
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 25
agggctgaat t 11
<210> 26
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 26
aggttagggc tga 13
<210> 27
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 27
ggttagggct gaa 13
<210> 28
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 28
gttagggctg aat 13
<210> 29
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 29
ttagggctga att 13
<210> 30
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 30
aggttagggc tgaa 14
<210> 31
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 31
ggttagggct gaat 14
<210> 32
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 32
gttagggctg aatt 14
<210> 33
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 33
aggttagggc t 11
<210> 34
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 通式S1A
<220>
<221> misc_feature
<222> (1)..(1)
<223> n可以代表5'AAATTCTAGACCCCAGAGG'3或来源于5'AAATTCTAGACCCCAGAGG'3的序列, 其中从5'末端消除一个或多个核苷酸,其中n至少是G
<220>
<221> misc_feature
<222> (10)..(10)
<223> n可以代表5'GAATTCTTGAAACTTGATG'3或来源于5'GAATTCTTGAAACTTGATG'3的序列, 其中从3'末端消除一个或多个核苷酸,其中n至少是G
<400> 34
nttagggctn 10
<210> 35
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 通式S1B
<220>
<221> misc_feature
<222> (1)..(1)
<223> n可以代表5'GAAATTCTAGACCCCAGAG'3或来源于5'GAAATTCTAGACCCCAGAG'3的序列, 其中从5'末端消除一个或多个核苷酸,其中n至少是G
<220>
<221> misc_feature
<222> (10)..(10)
<223> n可以代表5'TGAATTCTTGAAACTTGAT'3或来源于5'TGAATTCTTGAAACTTGAT'3的序列, 其中从3'末端消除一个或多个核苷酸,其中n至少是T
<400> 35
ngttagggcn 10
<210> 36
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 36
tagggctgaa tt 12
<210> 37
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 37
tacaagcaag 10
<210> 38
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 38
acaagcaagg 10
<210> 39
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 39
caagcaaggc 10
<210> 40
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 40
aagcaaggca 10
<210> 41
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 41
agcaaggcat 10
<210> 42
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 42
gcaaggcatt 10
<210> 43
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 43
caaggcattt 10
<210> 44
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 44
tacaagcaag gc 12
<210> 45
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 45
acaagcaagg ca 12
<210> 46
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 46
caagcaaggc at 12
<210> 47
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 47
aagcaaggca tt 12
<210> 48
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 48
agcaaggcat tt 12
<210> 49
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 49
tacaagcaag gcatt 15
<210> 50
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 50
acaagcaagg cattt 15
<210> 51
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 51
tacaagcaag g 11
<210> 52
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 52
acaagcaagg c 11
<210> 53
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 53
caagcaaggc a 11
<210> 54
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 54
aagcaaggca t 11
<210> 55
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 55
agcaaggcat t 11
<210> 56
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 56
gcaaggcatt t 11
<210> 57
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 57
tacaagcaag gca 13
<210> 58
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 58
acaagcaagg cat 13
<210> 59
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 59
caagcaaggc att 13
<210> 60
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 60
aagcaaggca ttt 13
<210> 61
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 61
tacaagcaag gcat 14
<210> 62
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 62
acaagcaagg catt 14
<210> 63
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 63
caagcaaggc attt 14
<210> 64
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 通式S2
<220>
<221> misc_feature
<222> (1)..(1)
<223> n可以代表5'GACCAGGGACGATCATACA'3或来源于5'GACCAGGGACGATCATACA'3的序列, 其中从5'末端消除一个或多个核苷酸,其中n至少是A
<220>
<221> misc_feature
<222> (10)..(10)
<223> n可以代表5'ATTTACAGTAACTTTACAA'3或来源于5'ATTTACAGTAACTTTACAA'3的序列, 其中从3'末端消除一个或多个核苷酸,其中n至少是A
<400> 64
nagcaaggcn 10
<210> 65
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 通式S2A
<220>
<221> misc_feature
<222> (1)..(1)
<223> n可以代表5'TGACCAGGGACGATCATAC'3或来源于5'TGACCAGGGACGATCATAC'3的序列, 其中从5'末端消除一个或多个核苷酸,其中n至少是C
<220>
<221> misc_feature
<222> (10)..(10)
<223> n可以代表5'CATTTACAGTAACTTTACA'3或来源于5'CATTTACAGTAACTTTACA'3的序列, 其中从3'末端消除一个或多个核苷酸,其中n至少是C
<400> 65
naagcaaggn 10
<210> 66
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 通式S2B
<220>
<221> misc_feature
<222> (1)..(1)
<223> n可以代表5'ACCAGGGACGATCATACAA'3或来源于5'ACCAGGGACGATCATACAA'3的序列, 其中从5'末端消除一个或多个核苷酸,其中n至少是A
<220>
<221> misc_feature
<222> (10)..(10)
<223> n可以代表5'TTTACAGTAACTTTACAAA'3或来源于5'TTTACAGTAACTTTACAAA'3的序列, 其中从3'末端消除一个或多个核苷酸,其中n至少是T
<400> 66
ngcaaggcan 10
<210> 67
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 67
acattgcaaa 10
<210> 68
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 68
cattgcaaaa 10
<210> 69
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 69
attgcaaaat 10
<210> 70
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 70
ttgcaaaatt 10
<210> 71
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 71
tgcaaaattc 10
<210> 72
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 72
gcaaaattca 10
<210> 73
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 73
caaaattcag 10
<210> 74
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 74
tgcaaaattc ag 12
<210> 75
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 75
acattgcaaa at 12
<210> 76
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 76
cattgcaaaa tt 12
<210> 77
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 77
attgcaaaat tc 12
<210> 78
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 78
ttgcaaaatt ca 12
<210> 79
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 79
acattgcaaa attca 15
<210> 80
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 80
cattgcaaaa ttcag 15
<210> 81
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 81
acattgcaaa a 11
<210> 82
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 82
cattgcaaaa t 11
<210> 83
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 83
attgcaaaat t 11
<210> 84
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 84
ttgcaaaatt c 11
<210> 85
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 85
tgcaaaattc a 11
<210> 86
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 86
gcaaaattca g 11
<210> 87
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 87
acattgcaaa att 13
<210> 88
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 88
cattgcaaaa ttc 13
<210> 89
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 89
attgcaaaat tca 13
<210> 90
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 90
ttgcaaaatt cag 13
<210> 91
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 91
acattgcaaa attc 14
<210> 92
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 92
cattgcaaaa ttca 14
<210> 93
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 针对智人肝配蛋白B2(EFNB2)、转录本变体1、2和3的反义寡核苷酸
<400> 93
attgcaaaat tcag 14
<210> 94
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 通式S3
<220>
<221> misc_feature
<222> (1)..(1)
<223> n可以代表5'AGCTGTAGCTAAATACATT'3或来源于5'AGCTGTAGCTAAATACATT'3的序列, 其中从5'末端消除一个或多个核苷酸,其中n至少是T
<220>
<221> misc_feature
<222> (10)..(10)
<223> n可以代表5'CAGATTTTATACAAAACAT'3或来源于5'CAGATTTTATACAAAACAT'3的序列, 其中从3'末端消除一个或多个核苷酸,其中n至少是C
<400> 94
ngcaaaattn 10
<210> 95
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 通式S3A
<220>
<221> misc_feature
<222> (1)..(1)
<223> n可以代表5'GCTGTAGCTAAATACATTG'3或来源于5'GCTGTAGCTAAATACATTG'3的序列, 其中从5'末端消除一个或多个核苷酸,其中n至少是G
<220>
<221> misc_feature
<222> (10)..(10)
<223> n可以代表5'AGATTTTATACAAAACATC'3或来源于5'AGATTTTATACAAAACATC'3的序列, 其中从3'末端消除一个或多个核苷酸,其中n至少是A
<400> 95
ncaaaattcn 10
<210> 96
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 通式S3B
<220>
<221> misc_feature
<222> (1)..(1)
<223> n可以代表5'CTGTAGCTAAATACATTGC'3或来源于5'CTGTAGCTAAATACATTGC'3的序列, 其中从5'末端消除一个或多个核苷酸,其中n至少是C
<220>
<221> misc_feature
<222> (10)..(10)
<223> n可以代表5'GATTTTATACAAAACATCT'3或来源于5'GATTTTATACAAAACATCT'3的序列, 其中从3'末端消除一个或多个核苷酸,其中n至少是G
<400> 96
naaaattcan 10
<210> 97
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 参考
<400> 97
gcggacacgc cg 12
<210> 98
<211> 4995
<212> DNA
<213> 人工序列
<220>
<223> 智人肝配蛋白B2 (EFNB2), 转录本变体1
<400> 98
gctgactctc ctcggcgggg accgcggcgc cggccggagc gaggagctgc gcacgcagcg 60
ggtcccggcg ccctccccgc acacaaaggc ccgcgcgcgt ccggagcccg cggcggggac 120
cgagctccct ctttcctgcc ctgggggccg ggagccgcgc ggactgagaa ggctcctgcg 180
cgcccggagg cgccctactc cgctccgtgc tccgggacat ggaaccgcgc cgacgcggcg 240
cccgcgcgct cgggccgctg cccgctgcac tggatctata gtcacaggcg gccccgctcg 300
gggcgcagcg cccgccgccc gcgccggtcg tctccgctcc gggtctttgt gtcccagccc 360
gcacccgccc cgcgcccacc cgccagccgc ggccggcccg gcaccctgga gccgcacggg 420
agtcggccgt ccgagctgcg tccggcgcgg cgccccggaa ccccgagtcc gccgcgccgc 480
cgcgccccgc gcgtgcgctc ccgccccgcg ccctgagggc cccggagagc gagcgcacct 540
ggcccggcga ccgctggagc tgcgcagcgc gcctcggagc tgcctgcggg cgcacgccgt 600
cttccccgcc agtctgcccc ggaggattgg gggtcccagc ctgcgtcccg tcagtccctt 660
cttggcccgg agtgcgcgga gctgggagtg gcttcgccat ggctgtgaga agggactccg 720
tgtggaagta ctgctggggt gttttgatgg ttttatgcag aactgcgatt tccaaatcga 780
tagttttaga gcctatctat tggaattcct cgaactccaa atttctacct ggacaaggac 840
tggtactata cccacagata ggagacaaat tggatattat ttgccccaaa gtggactcta 900
aaactgttgg ccagtatgaa tattataaag tttatatggt tgataaagac caagcagaca 960
gatgcactat taagaaggaa aatacccctc tcctcaactg tgccaaacca gaccaagata 1020
tcaaattcac catcaagttt caagaattca gccctaacct ctggggtcta gaatttcaga 1080
agaacaaaga ttattacatt atatctacat caaatgggtc tttggagggc ctggataacc 1140
aggagggagg ggtgtgccag acaagagcca tgaagatcct catgaaagtt ggacaagatg 1200
caagttctgc tggatcaacc aggaataaag atccaacaag acgtccagaa ctagaagctg 1260
gtacaaatgg aagaagttcg acaacaagtc cctttgtaaa accaaatcca ggttctagca 1320
cagacggcaa cagcgccgga cattcgggga acaacatcct cggttccgaa gtggccttat 1380
ttgcagggat tgcttcagga tgcatcatct tcatcgtcat catcatcacg ctggtggtcc 1440
tcttgctgaa gtaccggagg agacacagga agcactcgcc gcagcacacg accacgctgt 1500
cgctcagcac actggccaca cccaagcgca gcggcaacaa caacggctca gagcccagtg 1560
acattatcat cccgctaagg actgcggaca gcgtcttctg ccctcactac gagaaggtca 1620
gcggggacta cgggcacccg gtgtacatcg tccaggagat gcccccgcag agcccggcga 1680
acatttacta caaggtctga gagggaccct ggtggtacct gtgctttccc agaggacacc 1740
taatgtcccg atgcctccct tgagggtttg agagcccgcg tgctggagaa ttgactgaag 1800
cacagcaccg ggggagaggg acactcctcc tcggaagagc ccgtcgcgct ggacagctta 1860
cctagtcttg tagcattcgg ccttggtgaa cacacacgct ccctggaagc tggaagactg 1920
tgcagaagac gcccattcgg actgctgtgc cgcgtcccac gtctcctcct cgaagccatg 1980
tgctgcggtc actcaggcct ctgcagaagc caagggaaga cagtggtttg tggacgagag 2040
ggctgtgagc atcctggcag gtgccccagg atgccacgcc tggaagggcc ggcttctgcc 2100
tggggtgcat ttcccccgca gtgcataccg gacttgtcac acggacctcg ggctagttaa 2160
ggtgtgcaaa gatctctaga gtttagtcct tactgtctca ctcgttctgt tacccagggc 2220
tctgcagcac ctcacctgag acctccactc cacatctgca tcactcatgg aacactcatg 2280
tctggagtcc cctcctccag ccgctggcaa caacagcttc agtccatggg taatccgttc 2340
atagaaattg tgtttgctaa caaggtgccc tttagccaga tgctaggctg tctgcgaaga 2400
aggctaggag ttcatagaag ggagtggggc tggggaaagg gctggctgca attgcagctc 2460
actgctgctg cctctgaaac agaaagttgg aaaggaaaaa agaaaaaagc aattaggtag 2520
cacagcactt tggttttgct gagatcgaag aggccagtag gagacacgac agcacacaca 2580
gtggattcca gtgcatgggg aggcactcgc tgttatcaaa tagcgatgtg caggaagaaa 2640
agcccctctt cattccgggg aacaaagacg ggtattgttg ggaaaggaac aggcttggag 2700
ggaagggaga aagtaggccg ctgatgatat attcgggcag gactgttgtg gtactggcaa 2760
taagatacac agctccgagc tgtaggagag tcggtctgct ttggatgatt ttttaagcag 2820
actcagctgc tatacttatc acattttatt aaacacaggg aaagcattta ggagaatagc 2880
agagagccaa atctgaccta aaagttgaaa agccaaaggt caaacaggct gtaattccat 2940
catcatcgtt gttattaaag aatccttatc tataaaaggt aggtcagatc cccctccccc 3000
caggttcctc cttcccctcc cgattgagcc ttacgacact ttggtttatg cggtgctgtc 3060
cgggtgccag ggctgcaggg tcggtactga tggaggctgc agcgcccggt gctctgtgtc 3120
aaggtgaagc acatacggca gacctcttag agtccttaag acggaagtaa attatgatgt 3180
ccagggggag aaggaagata ggacgtattt ataataggta tatagaacac aagggatata 3240
aaatgaaaga tttttactaa tatatatttt aaggttgcac acagtacaca ccagaagatg 3300
tgaaattcat ttgtggcaat taagtggtcc caatgctcag cgcttaaaaa aacaaattgg 3360
acagctactt ctgggaaaaa caacatcatt ccaaaaagaa caataatgag agcaaatgca 3420
aaaataacca agtcctccga aggcatctca cggaaccgta gactaggaag tacgagcccc 3480
acagagcagg aagccgatgt gactgcatca tatatttaac aatgacaaga tgttccggcg 3540
tttatttctg cgttgggttt tcccttgcct tatgggctga agtgttctct agaatccagc 3600
aggtcacact gggggcttca ggtgacgatt tagctgtggc tccctcctcc tgtcctcccc 3660
cgcaccccct cccttctggg aaacaagaag agtaaacagg aaacctactt tttatgtgct 3720
atgcaaaata gacatcttta acatagtcct gttactatgg taacactttg ctttctgaat 3780
tggaagggaa aaaaaatgta gcgacagcat tttaaggttc tcagacctcc agtgagtacc 3840
tgcaaaaatg agttgtcaca gaaattatga tcctctattt cctgaacctg gaaatgatgt 3900
tggtccaaag tgcgtgtgtg tatgtgtgag tgggtgcgtg gtatacatgt gtacatatat 3960
gtataatata tatctacaat atatattata tatatctata tcatatttct gtggagggtt 4020
gccatggtaa ccagccacag tacatatgta attctttcca tcaccccaac ctctcctttc 4080
tgtgcattca tgcaagagtt tcttgtaagc catcagaagt tacttttagg atgggggaga 4140
ggggcgagaa ggggaaaaat gggaaatagt ctgattttaa tgaaatcaaa tgtatgtatc 4200
atcagttggc tacgttttgg ttctatgcta aactgtgaaa aatcagatga attgataaaa 4260
gagttccctg caaccaattg aaaagtgttc tgtgcgtctg ttttgtgtct ggtgcagaat 4320
atgacaatct accaactgtc cctttgtttg aagttggttt agctttggaa agttactgta 4380
aatgccttgc ttgtatgatc gtccctggtc acccgacttt ggaatttgca ccatcatgtt 4440
tcagtgaaga tgctgtaaat aggttcagat tttactgtct atggatttgg ggtgttacag 4500
tagccttatt caccttttta ataaaaatac acatgaaaac aagaaagaaa tggcttttct 4560
tacccagatt gtgtacatag agcaatgttg gttttttata aagtctaagc aagatgtttt 4620
gtataaaatc tgaattttgc aatgtattta gctacagctt gtttaacggc agtgtcattc 4680
ccctttgcac tgtaatgagg aaaaaatggt ataaaaggtt gccaaattgc tgcatatttg 4740
tgccgtaatt atgtaccatg aatatttatt taaaatttcg ttgtccaatt tgtaagtaac 4800
acagtattat gcctgagtta taaatatttt tttctttctt tgttttattt taatagcctg 4860
tcataggttt taaatctgct ttagtttcac attgcagtta gccccagaaa atgaaatccg 4920
tgaagtcaca ttccacatct gtttcaaact gaatttgttc ttaaaaaaat aaaatatttt 4980
tttcctatgg aaaaa 4995
<210> 99
<211> 4902
<212> DNA
<213> 人工序列
<220>
<223> 智人肝配蛋白B2 (EFNB2), 转录本变体2
<400> 99
gctgactctc ctcggcgggg accgcggcgc cggccggagc gaggagctgc gcacgcagcg 60
ggtcccggcg ccctccccgc acacaaaggc ccgcgcgcgt ccggagcccg cggcggggac 120
cgagctccct ctttcctgcc ctgggggccg ggagccgcgc ggactgagaa ggctcctgcg 180
cgcccggagg cgccctactc cgctccgtgc tccgggacat ggaaccgcgc cgacgcggcg 240
cccgcgcgct cgggccgctg cccgctgcac tggatctata gtcacaggcg gccccgctcg 300
gggcgcagcg cccgccgccc gcgccggtcg tctccgctcc gggtctttgt gtcccagccc 360
gcacccgccc cgcgcccacc cgccagccgc ggccggcccg gcaccctgga gccgcacggg 420
agtcggccgt ccgagctgcg tccggcgcgg cgccccggaa ccccgagtcc gccgcgccgc 480
cgcgccccgc gcgtgcgctc ccgccccgcg ccctgagggc cccggagagc gagcgcacct 540
ggcccggcga ccgctggagc tgcgcagcgc gcctcggagc tgcctgcggg cgcacgccgt 600
cttccccgcc agtctgcccc ggaggattgg gggtcccagc ctgcgtcccg tcagtccctt 660
cttggcccgg agtgcgcgga gctgggagtg gcttcgccat ggctgtgaga agggactccg 720
tgtggaagta ctgctggggt gttttgatgg ttttatgcag aactgcgatt tccaaatcga 780
tagttttaga gcctatctat tggaattcct cgaactccaa atttctacct ggacaaggac 840
tggtactata cccacagata ggagacaaat tggatattat ttgccccaaa gtggactcta 900
aaactgttgg ccagtatgaa tattataaag tttatatggt tgataaagac caagcagaca 960
gatgcactat taagaaggaa aatacccctc tcctcaactg tgccaaacca gaccaagata 1020
tcaaattcac catcaagttt caagaattca gccctaacct ctggggtcta gaatttcaga 1080
agaacaaaga ttattacatt atatatgcaa gttctgctgg atcaaccagg aataaagatc 1140
caacaagacg tccagaacta gaagctggta caaatggaag aagttcgaca acaagtccct 1200
ttgtaaaacc aaatccaggt tctagcacag acggcaacag cgccggacat tcggggaaca 1260
acatcctcgg ttccgaagtg gccttatttg cagggattgc ttcaggatgc atcatcttca 1320
tcgtcatcat catcacgctg gtggtcctct tgctgaagta ccggaggaga cacaggaagc 1380
actcgccgca gcacacgacc acgctgtcgc tcagcacact ggccacaccc aagcgcagcg 1440
gcaacaacaa cggctcagag cccagtgaca ttatcatccc gctaaggact gcggacagcg 1500
tcttctgccc tcactacgag aaggtcagcg gggactacgg gcacccggtg tacatcgtcc 1560
aggagatgcc cccgcagagc ccggcgaaca tttactacaa ggtctgagag ggaccctggt 1620
ggtacctgtg ctttcccaga ggacacctaa tgtcccgatg cctcccttga gggtttgaga 1680
gcccgcgtgc tggagaattg actgaagcac agcaccgggg gagagggaca ctcctcctcg 1740
gaagagcccg tcgcgctgga cagcttacct agtcttgtag cattcggcct tggtgaacac 1800
acacgctccc tggaagctgg aagactgtgc agaagacgcc cattcggact gctgtgccgc 1860
gtcccacgtc tcctcctcga agccatgtgc tgcggtcact caggcctctg cagaagccaa 1920
gggaagacag tggtttgtgg acgagagggc tgtgagcatc ctggcaggtg ccccaggatg 1980
ccacgcctgg aagggccggc ttctgcctgg ggtgcatttc ccccgcagtg cataccggac 2040
ttgtcacacg gacctcgggc tagttaaggt gtgcaaagat ctctagagtt tagtccttac 2100
tgtctcactc gttctgttac ccagggctct gcagcacctc acctgagacc tccactccac 2160
atctgcatca ctcatggaac actcatgtct ggagtcccct cctccagccg ctggcaacaa 2220
cagcttcagt ccatgggtaa tccgttcata gaaattgtgt ttgctaacaa ggtgcccttt 2280
agccagatgc taggctgtct gcgaagaagg ctaggagttc atagaaggga gtggggctgg 2340
ggaaagggct ggctgcaatt gcagctcact gctgctgcct ctgaaacaga aagttggaaa 2400
ggaaaaaaga aaaaagcaat taggtagcac agcactttgg ttttgctgag atcgaagagg 2460
ccagtaggag acacgacagc acacacagtg gattccagtg catggggagg cactcgctgt 2520
tatcaaatag cgatgtgcag gaagaaaagc ccctcttcat tccggggaac aaagacgggt 2580
attgttggga aaggaacagg cttggaggga agggagaaag taggccgctg atgatatatt 2640
cgggcaggac tgttgtggta ctggcaataa gatacacagc tccgagctgt aggagagtcg 2700
gtctgctttg gatgattttt taagcagact cagctgctat acttatcaca ttttattaaa 2760
cacagggaaa gcatttagga gaatagcaga gagccaaatc tgacctaaaa gttgaaaagc 2820
caaaggtcaa acaggctgta attccatcat catcgttgtt attaaagaat ccttatctat 2880
aaaaggtagg tcagatcccc ctccccccag gttcctcctt cccctcccga ttgagcctta 2940
cgacactttg gtttatgcgg tgctgtccgg gtgccagggc tgcagggtcg gtactgatgg 3000
aggctgcagc gcccggtgct ctgtgtcaag gtgaagcaca tacggcagac ctcttagagt 3060
ccttaagacg gaagtaaatt atgatgtcca gggggagaag gaagatagga cgtatttata 3120
ataggtatat agaacacaag ggatataaaa tgaaagattt ttactaatat atattttaag 3180
gttgcacaca gtacacacca gaagatgtga aattcatttg tggcaattaa gtggtcccaa 3240
tgctcagcgc ttaaaaaaac aaattggaca gctacttctg ggaaaaacaa catcattcca 3300
aaaagaacaa taatgagagc aaatgcaaaa ataaccaagt cctccgaagg catctcacgg 3360
aaccgtagac taggaagtac gagccccaca gagcaggaag ccgatgtgac tgcatcatat 3420
atttaacaat gacaagatgt tccggcgttt atttctgcgt tgggttttcc cttgccttat 3480
gggctgaagt gttctctaga atccagcagg tcacactggg ggcttcaggt gacgatttag 3540
ctgtggctcc ctcctcctgt cctcccccgc accccctccc ttctgggaaa caagaagagt 3600
aaacaggaaa cctacttttt atgtgctatg caaaatagac atctttaaca tagtcctgtt 3660
actatggtaa cactttgctt tctgaattgg aagggaaaaa aaatgtagcg acagcatttt 3720
aaggttctca gacctccagt gagtacctgc aaaaatgagt tgtcacagaa attatgatcc 3780
tctatttcct gaacctggaa atgatgttgg tccaaagtgc gtgtgtgtat gtgtgagtgg 3840
gtgcgtggta tacatgtgta catatatgta taatatatat ctacaatata tattatatat 3900
atctatatca tatttctgtg gagggttgcc atggtaacca gccacagtac atatgtaatt 3960
ctttccatca ccccaacctc tcctttctgt gcattcatgc aagagtttct tgtaagccat 4020
cagaagttac ttttaggatg ggggagaggg gcgagaaggg gaaaaatggg aaatagtctg 4080
attttaatga aatcaaatgt atgtatcatc agttggctac gttttggttc tatgctaaac 4140
tgtgaaaaat cagatgaatt gataaaagag ttccctgcaa ccaattgaaa agtgttctgt 4200
gcgtctgttt tgtgtctggt gcagaatatg acaatctacc aactgtccct ttgtttgaag 4260
ttggtttagc tttggaaagt tactgtaaat gccttgcttg tatgatcgtc cctggtcacc 4320
cgactttgga atttgcacca tcatgtttca gtgaagatgc tgtaaatagg ttcagatttt 4380
actgtctatg gatttggggt gttacagtag ccttattcac ctttttaata aaaatacaca 4440
tgaaaacaag aaagaaatgg cttttcttac ccagattgtg tacatagagc aatgttggtt 4500
ttttataaag tctaagcaag atgttttgta taaaatctga attttgcaat gtatttagct 4560
acagcttgtt taacggcagt gtcattcccc tttgcactgt aatgaggaaa aaatggtata 4620
aaaggttgcc aaattgctgc atatttgtgc cgtaattatg taccatgaat atttatttaa 4680
aatttcgttg tccaatttgt aagtaacaca gtattatgcc tgagttataa atattttttt 4740
ctttctttgt tttattttaa tagcctgtca taggttttaa atctgcttta gtttcacatt 4800
gcagttagcc ccagaaaatg aaatccgtga agtcacattc cacatctgtt tcaaactgaa 4860
tttgttctta aaaaaataaa atattttttt cctatggaaa aa 4902
<210> 100
<211> 4881
<212> DNA
<213> 人工序列
<220>
<223> 智人肝配蛋白B2 (EFNB2), 转录本变体3
<400> 100
gctgactctc ctcggcgggg accgcggcgc cggccggagc gaggagctgc gcacgcagcg 60
ggtcccggcg ccctccccgc acacaaaggc ccgcgcgcgt ccggagcccg cggcggggac 120
cgagctccct ctttcctgcc ctgggggccg ggagccgcgc ggactgagaa ggctcctgcg 180
cgcccggagg cgccctactc cgctccgtgc tccgggacat ggaaccgcgc cgacgcggcg 240
cccgcgcgct cgggccgctg cccgctgcac tggatctata gtcacaggcg gccccgctcg 300
gggcgcagcg cccgccgccc gcgccggtcg tctccgctcc gggtctttgt gtcccagccc 360
gcacccgccc cgcgcccacc cgccagccgc ggccggcccg gcaccctgga gccgcacggg 420
agtcggccgt ccgagctgcg tccggcgcgg cgccccggaa ccccgagtcc gccgcgccgc 480
cgcgccccgc gcgtgcgctc ccgccccgcg ccctgagggc cccggagagc gagcgcacct 540
ggcccggcga ccgctggagc tgcgcagcgc gcctcggagc tgcctgcggg cgcacgccgt 600
cttccccgcc agtctgcccc ggaggattgg gggtcccagc ctgcgtcccg tcagtccctt 660
cttggcccgg agtgcgcgga gctgggagtg gcttcgccat ggctgtgaga agggactccg 720
tgtggaagta ctgctggggt gttttgatgg ttttatgcag aactgcgatt tccaaatcga 780
tagttttaga gcctatctat tggaattcct cgaactccaa atttctacct ggacaaggac 840
tggtactata cccacagata ggagacaaat tggatattat ttgccccaaa gtggactcta 900
aaactgttgg ccagtatgaa tattataaag tttatatggt tgataaagac caagcagaca 960
gatgcactat taagaaggaa aatacccctc tcctcaactg tgccaaacca gaccaagata 1020
tcaaattcac catcaagttt caagaattca gccctaacct ctggggtcta gaatttcaga 1080
agaacaaaga ttattacatt atatctacat caaatgggtc tttggagggc ctggataacc 1140
aggagggagg ggtgtgccag acaagagcca tgaagatcct catgaaagtt ggacaaggtt 1200
ctagcacaga cggcaacagc gccggacatt cggggaacaa catcctcggt tccgaagtgg 1260
ccttatttgc agggattgct tcaggatgca tcatcttcat cgtcatcatc atcacgctgg 1320
tggtcctctt gctgaagtac cggaggagac acaggaagca ctcgccgcag cacacgacca 1380
cgctgtcgct cagcacactg gccacaccca agcgcagcgg caacaacaac ggctcagagc 1440
ccagtgacat tatcatcccg ctaaggactg cggacagcgt cttctgccct cactacgaga 1500
aggtcagcgg ggactacggg cacccggtgt acatcgtcca ggagatgccc ccgcagagcc 1560
cggcgaacat ttactacaag gtctgagagg gaccctggtg gtacctgtgc tttcccagag 1620
gacacctaat gtcccgatgc ctcccttgag ggtttgagag cccgcgtgct ggagaattga 1680
ctgaagcaca gcaccggggg agagggacac tcctcctcgg aagagcccgt cgcgctggac 1740
agcttaccta gtcttgtagc attcggcctt ggtgaacaca cacgctccct ggaagctgga 1800
agactgtgca gaagacgccc attcggactg ctgtgccgcg tcccacgtct cctcctcgaa 1860
gccatgtgct gcggtcactc aggcctctgc agaagccaag ggaagacagt ggtttgtgga 1920
cgagagggct gtgagcatcc tggcaggtgc cccaggatgc cacgcctgga agggccggct 1980
tctgcctggg gtgcatttcc cccgcagtgc ataccggact tgtcacacgg acctcgggct 2040
agttaaggtg tgcaaagatc tctagagttt agtccttact gtctcactcg ttctgttacc 2100
cagggctctg cagcacctca cctgagacct ccactccaca tctgcatcac tcatggaaca 2160
ctcatgtctg gagtcccctc ctccagccgc tggcaacaac agcttcagtc catgggtaat 2220
ccgttcatag aaattgtgtt tgctaacaag gtgcccttta gccagatgct aggctgtctg 2280
cgaagaaggc taggagttca tagaagggag tggggctggg gaaagggctg gctgcaattg 2340
cagctcactg ctgctgcctc tgaaacagaa agttggaaag gaaaaaagaa aaaagcaatt 2400
aggtagcaca gcactttggt tttgctgaga tcgaagaggc cagtaggaga cacgacagca 2460
cacacagtgg attccagtgc atggggaggc actcgctgtt atcaaatagc gatgtgcagg 2520
aagaaaagcc cctcttcatt ccggggaaca aagacgggta ttgttgggaa aggaacaggc 2580
ttggagggaa gggagaaagt aggccgctga tgatatattc gggcaggact gttgtggtac 2640
tggcaataag atacacagct ccgagctgta ggagagtcgg tctgctttgg atgatttttt 2700
aagcagactc agctgctata cttatcacat tttattaaac acagggaaag catttaggag 2760
aatagcagag agccaaatct gacctaaaag ttgaaaagcc aaaggtcaaa caggctgtaa 2820
ttccatcatc atcgttgtta ttaaagaatc cttatctata aaaggtaggt cagatccccc 2880
tccccccagg ttcctccttc ccctcccgat tgagccttac gacactttgg tttatgcggt 2940
gctgtccggg tgccagggct gcagggtcgg tactgatgga ggctgcagcg cccggtgctc 3000
tgtgtcaagg tgaagcacat acggcagacc tcttagagtc cttaagacgg aagtaaatta 3060
tgatgtccag ggggagaagg aagataggac gtatttataa taggtatata gaacacaagg 3120
gatataaaat gaaagatttt tactaatata tattttaagg ttgcacacag tacacaccag 3180
aagatgtgaa attcatttgt ggcaattaag tggtcccaat gctcagcgct taaaaaaaca 3240
aattggacag ctacttctgg gaaaaacaac atcattccaa aaagaacaat aatgagagca 3300
aatgcaaaaa taaccaagtc ctccgaaggc atctcacgga accgtagact aggaagtacg 3360
agccccacag agcaggaagc cgatgtgact gcatcatata tttaacaatg acaagatgtt 3420
ccggcgttta tttctgcgtt gggttttccc ttgccttatg ggctgaagtg ttctctagaa 3480
tccagcaggt cacactgggg gcttcaggtg acgatttagc tgtggctccc tcctcctgtc 3540
ctcccccgca ccccctccct tctgggaaac aagaagagta aacaggaaac ctacttttta 3600
tgtgctatgc aaaatagaca tctttaacat agtcctgtta ctatggtaac actttgcttt 3660
ctgaattgga agggaaaaaa aatgtagcga cagcatttta aggttctcag acctccagtg 3720
agtacctgca aaaatgagtt gtcacagaaa ttatgatcct ctatttcctg aacctggaaa 3780
tgatgttggt ccaaagtgcg tgtgtgtatg tgtgagtggg tgcgtggtat acatgtgtac 3840
atatatgtat aatatatatc tacaatatat attatatata tctatatcat atttctgtgg 3900
agggttgcca tggtaaccag ccacagtaca tatgtaattc tttccatcac cccaacctct 3960
cctttctgtg cattcatgca agagtttctt gtaagccatc agaagttact tttaggatgg 4020
gggagagggg cgagaagggg aaaaatggga aatagtctga ttttaatgaa atcaaatgta 4080
tgtatcatca gttggctacg ttttggttct atgctaaact gtgaaaaatc agatgaattg 4140
ataaaagagt tccctgcaac caattgaaaa gtgttctgtg cgtctgtttt gtgtctggtg 4200
cagaatatga caatctacca actgtccctt tgtttgaagt tggtttagct ttggaaagtt 4260
actgtaaatg ccttgcttgt atgatcgtcc ctggtcaccc gactttggaa tttgcaccat 4320
catgtttcag tgaagatgct gtaaataggt tcagatttta ctgtctatgg atttggggtg 4380
ttacagtagc cttattcacc tttttaataa aaatacacat gaaaacaaga aagaaatggc 4440
ttttcttacc cagattgtgt acatagagca atgttggttt tttataaagt ctaagcaaga 4500
tgttttgtat aaaatctgaa ttttgcaatg tatttagcta cagcttgttt aacggcagtg 4560
tcattcccct ttgcactgta atgaggaaaa aatggtataa aaggttgcca aattgctgca 4620
tatttgtgcc gtaattatgt accatgaata tttatttaaa atttcgttgt ccaatttgta 4680
agtaacacag tattatgcct gagttataaa tatttttttc tttctttgtt ttattttaat 4740
agcctgtcat aggttttaaa tctgctttag tttcacattg cagttagccc cagaaaatga 4800
aatccgtgaa gtcacattcc acatctgttt caaactgaat ttgttcttaa aaaaataaaa 4860
tatttttttc ctatggaaaa a 4881
<210> 101
<211> 45918
<212> DNA
<213> 智人
<400> 101
gctgactctc ctcggcgggg accgcggcgc cggccggagc gaggagctgc gcacgcagcg 60
ggtcccggcg ccctccccgc acacaaaggc ccgcgcgcgt ccggagcccg cggcggggac 120
cgagctccct ctttcctgcc ctgggggccg ggagccgcgc ggactgagaa ggctcctgcg 180
cgcccggagg cgccctactc cgctccgtgc tccgggacat ggaaccgcgc cgacgcggcg 240
cccgcgcgct cgggccgctg cccgctgcac tggatctata gtcacaggcg gccccgctcg 300
gggcgcagcg cccgccgccc gcgccggtcg tctccgctcc gggtctttgt gtcccagccc 360
gcacccgccc cgcgcccacc cgccagccgc ggccggcccg gcaccctgga gccgcacggg 420
agtcggccgt ccgagctgcg tccggcgcgg cgccccggaa ccccgagtcc gccgcgccgc 480
cgcgccccgc gcgtgcgctc ccgccccgcg ccctgagggc cccggagagc gagcgcacct 540
ggcccggcga ccgctggagc tgcgcagcgc gcctcggagc tgcctgcggg cgcacgccgt 600
cttccccgcc agtctgcccc ggaggattgg gggtcccagc ctgcgtcccg tcagtccctt 660
cttggcccgg agtgcgcgga gctgggagtg gcttcgccat ggctgtgaga agggactccg 720
tgtggaagta ctgctggggt gttttgatgg ttttatgcag aactgcgatt tccaaatcga 780
tagttttaga gcctatctat tggaattcct cgaactccaa gtaagtggcg tccgcgatcc 840
ccctatgtcc ccgccccggg gtccgccgcg ccgtccgggc gggaggaggg gtcagtccgc 900
ggggcctcgg agcctgtttc tggaacctcg gttccccgtc ccccaccccc aacccccgcc 960
ccatttcact aggtggagac tcctcgctcg gctttccaac ccgagccccg ctggaacgga 1020
cggtctctcc gcctttcctc ccccgaacgc tcccaggcgc taaaagctac tatcggctcg 1080
ggtgtcaagt ccgggaaggt gtccgatggc gatacctgac cctctcctgt tttcgaggac 1140
gaaggacatg gccacaatct aggctggccg gcacgcgggg actggtgggc tctggagaga 1200
ggcggagatg ctgcattcgc ggggagcgcg ggcggcgtgg tccggggccc gcgggcgggc 1260
gaccggggtg gcaggacgct ggcagcgaag cgcgttctgg agaggggagc ctggagtcgc 1320
tacgctgccc gcagagccct ggagccgggg cgccttggca ccgcgccgcc agcccgaggg 1380
tgcgcgggga gctcgcctgc ttcgcaggag aactcgggcg tcgagccctt tcctccgcgc 1440
cggggagacg ggccttaggc ttctccctga gggcccgccg cacctcggcc tcccgcttcg 1500
ttcataagcc ggtagccccg gagtatgcgg tctcgatggc cgacctgatt gtaatgcact 1560
tcctataaaa gcttagggcc ctgcccagtc gacactgctc ctgaagcctt ctccctcggg 1620
accctggtag gaatgggatc cttaggatca gatttgctct taccggactc tacagccggg 1680
agcgagccag gccttgtgga gagtaacttt cagtttgggc caccagagtg cattcagaat 1740
ttagaaaatc ccatccatcc ctaaatctgt gtggtcataa ctcgtagtca tctgggtatt 1800
cagtactgtg tatcccctta tttcgaatca cagccaaaac atattttaca gaatcttgga 1860
attgtagtct cgggaaactt ggagaagaag tatgcagaca ttagctggtt tctggagaaa 1920
acgtttgaga tcagaagcaa aatcaatggc ctaattgaag ttgagcaagt tgggcctggt 1980
tttaggagaa aagaaatggg ggattgattt agaaatcacg tcttaaagga gtgtgtccat 2040
tctcttaaaa gtgtcaaatt tcaaattcac taacatgtta accaagaatc ccttcatgaa 2100
aagggcgaaa acgtcggtta caaatcggtt taaacaaatg tttgtatgat gctagaaggc 2160
actttcaaca ccgctcatac ggagaagtta cttagctctg cctccttcca tgtagtctgc 2220
tcttgcatgg attatatttt taatgtaaat tgttgtattt gctgatgaag tactggcggc 2280
ggcatctttg catcgatgcc ggctcgggag gcgccaggtg gtgccggaag gagccgggct 2340
aggacctcgc gcagcagcgg gtcccggagt ccgggagagg cgggcgggcg ggcgaggcgg 2400
tcgcggggag cccgcggcgc cgctgcccgc ccggtgcctc cagaggtcac tcttccatgc 2460
ggaatcgcgc agcgccaggc ctcgcccctc ccccaggccg cctgctccag ccactctgca 2520
ctttcactga ccggttctct ttgaggctgt tttttttttt cttatgagga tttaatattt 2580
ctgtttaaat ctagttgaaa gcaattccgt tagcctcttc agcgtttagt tcggtgtgtg 2640
tatctttatc tttgcgctat attaactatt agtttgtgtg tatccggtag gagaattaga 2700
aatacctagt tgggagaaaa agaaaagtag aacaatagtt atttcaacct aaggtttaga 2760
cgttaataac ttctttttgt aatgtgtcga gatggggggt cctgggggga ggtgacaggt 2820
actcaccact cccccccccc attctgatga tgaagatgag tctgtctttc cagctatgtc 2880
cagacctgcg agggccctgc gtttctggaa gcctgccgtt tgcgcggttg aggttgctgc 2940
tgctgtcttg tcctccacag cagcatttct tttaaaattc tcctgataac ggcctgcctg 3000
gatgactgga taatgtgtgc ctggaaaagg tctcccttgc agctgaatgc tagctccaga 3060
gatcagaaag atttcttcct gtaggagcca taggaaagag tcctctctaa gtttttgaga 3120
atgcatacaa ccccctgatg acagggggtc gctttccttg gggaagtttt atatttattt 3180
ccagaggaaa gtttgaatcg gtaaatatga tgtggcagga aggtaatcaa atgcattgaa 3240
gtttcacatc agttcctatg aactgtggaa caattcattt gtaatgaagc cgccatcagt 3300
aattagattt gtttcattca gaggtcagct tttttagcag gtggtcgaca cagggagcat 3360
gcagcagctg tttggataca gggtccagaa aaccctttgt aaattcagcg tctccgtaac 3420
tactttaatc acattgtcgg ctctcccgtc cctgactgta tgtaataatg gaaagatgtc 3480
ctgcgtgctg aaacagtagc tgccctgtta ggttattcac attgctttga tacgttctgg 3540
tagagttggg tccgttgtag ccattttggt tgtttaaagt tttggttttt tttttgtttt 3600
ttttttaatt cagcagagaa cagtaatgcc tagcttccgt ttttaactta acacttcagt 3660
agaacatttt cttccaagag ggagattttg gcctaagtaa agtagtgggc tcttttttaa 3720
aaaaaaatta attttacttt aatgtgagca aatctgtatt ggtatggtgt tctgcaatgc 3780
attacactga ctttgaaaat ttcgagtact aatgccttat gtctggggtt accattccct 3840
gtgcatcaca tactagttag ttaacatagc attttgcttt tcccatgtaa ttttttccct 3900
atataatact ggattcctga tactaattga cttgatacaa aagaatggct ggatgatatc 3960
cagataacgt ataatacatg ggcttcacca caatcaggct ctgaataaat acagacctgt 4020
cagagattga taaaataaac tacaatggat agtgctgttt aaacagtcca ttcaataaca 4080
tatataagcc agcctgcctt ccattgtgtc tgaaattctt atttttgtag gtaaacaaat 4140
gcacattcag cactgattga atagcccctt gaactatgct ccacagtttg cgtttgggtt 4200
aatcttgtcg gttttaatat agagagaaaa aagctcaaag caccaggggt ggaattgtta 4260
gtgctttcac atccacattc ctcacatttt gtcaggatga taaactgtag gtaatggact 4320
gtcgttgttc tgcaggacaa ctgagccagg cagagcacaa agactaagct aaagcgatac 4380
ctcacaacat gcttggtagc cttcttttca gatgagaatt tatttgagaa tcatgtgtct 4440
agggactgca catcttaacc tcaacagtta cagcttcaag ccccagaaac aggagctgga 4500
ggttaagatg atttgctaag cacctggttc taaatctttt acaaagcata agctgttgac 4560
gctggttctg ccgacgcaaa gacatgcaga tgactccaac atttccagag gcttctgact 4620
taagctaaag tgtgtggaca ggtgaattcg ccatgggcct ggagaccagc ttgctaaaaa 4680
ctatgtgttt gaatggttcc tccagacaga gtcagctgaa gaacaattgg tggatttata 4740
ttaaaacctc ttgtctgtaa acttactgag gtgcatcctt cggttggtgg atcagtgaga 4800
taattgcctt cagatggaca ttgcaactgg agcaactaaa tccttgctgt ctttccttcc 4860
tctgaaatct tccaggtagc tcccgagagc ttcagtatga caccaaactt cgggcgacgt 4920
tttagagtgc gttcacctaa tgggaaacta ttcgagatcc cagcgtgact gcagtaatgc 4980
gtcataggaa tgggagtggc aggggaaaag gaaatacaga ttgtagaccc taataaaaaa 5040
atttttagga aagatatttc tttaacgttt tatgagaact tcattcttaa aatacttaat 5100
tgcaaattag acaaatagaa gtgctcttct aaggaaggtg attaaactgg tcctcctatc 5160
agcctaatct ctgcctgcct ttgctgctga cataaagaac ctgtttttca ggtcacttaa 5220
tatacatcta catagatttg cttatgagct caccctttgt gtagcggagt agagccttaa 5280
agaggagtgc tcaactgttt aaaatatttt gattaaaata tgcagaaccc atagaactat 5340
aagcttctag tcaggaatta gctctttcag ggaacagctc cccccttctt tttaaggggg 5400
gaattagaag gaggctgggg gaggaatata agaacagcaa agaaggaagg atagcaaatg 5460
ggacatgttc cgaacagctt ggaaaaactc ctgtggcttc attgtctcta taaagccaaa 5520
gaatacaaag acataagcaa ttcagccctt ctcccatgat ggaagatgta aaccgttgac 5580
atgcctcccc tgtttaactt gtttaattct cattttaaat tcagcacgat actagccgtg 5640
tgaactctga agatttcttt agtaatccat tttgtagttc cgaatcaaaa acaaagtgaa 5700
agggtctgac acaatttgct tttattttta ggcaaatcaa ccctggtcat agttaataag 5760
gggattacaa ctcagactag gtctttacag atgtgatgta aatcaagggc agagtataaa 5820
gaaactgatc ccttttgatt gaagtatagt aaaaaggcat agagaaacta gcagcagtaa 5880
tctgattgta tggcaataaa accaccattt tctgtctttc agataaaaat aatgtggtaa 5940
atccatgcag ttcataagat gtaaaggcag ataaagggtg aagccatggc aacatataga 6000
ttagcttgat gttagaaatg acacgtctct gaaaagggcg cgggacgaag gcccttgcct 6060
ccaggctgtt gggcattatg tgagaaccac acagacttgg aaactgggat taggaagtat 6120
gaaagctcta cttgtggtct gggatggctg aggcagtaaa gaaaagctgc tcagttcttg 6180
ctcattggtg gtggataata tggcaaaggt agatttcatt gactgccttt tttatagatt 6240
gagattgggg ctgattaaaa cttcagatca ctgcagttgt tagggcctgg gagattttcc 6300
tttttaactc ctggcctaac agcagcagcc gttctgtagg attaactgca cttcgcggtc 6360
gttgccttaa tctatttggg cttcaggcag ggacatgctg ggaaggaaca gagaccagag 6420
gggataggta gggctggggt tatctgaaaa gaaaacagag accttttgat ttcagccatc 6480
ttttcagacc cagctccctc tcccgctgca tgggagaagc aaaggtaaac aggacacatt 6540
gtccctctcc ctcagccaca gagctcttct gtgagttttg tctttcccac cctggaaaaa 6600
aagataaaat acaattttta aaaggggagg gaggaattta gttttaattc aaatgagtag 6660
taatccaata tgccaaaagc agtgggctct acctagatgt aattttactc gtaaatgtga 6720
gtcttaaact ttgagttgaa tggggcaggc tgttagaggt ggtgtaaatt acaggattat 6780
aaaaatgtta gtgctgccca gccttaaagt caaaaacaga aaaatctctg tgctgttgag 6840
tcttcccgcc ctctctcctg aacaaccttg taagtaagct agacttttgt ttttgccttc 6900
catactttcc atttcagcca ttaaacaaaa taagccattg aaaccacgat tgggttccat 6960
gcagagtgac atccgcaatc gggtcaagcc agaaggaaat acttgctcga ttgcccccta 7020
tttggcatta caggaaagtc tccacacttt ggaagagtct gaactctcaa gacattgaaa 7080
atgccaaagg ctgcaaacac cctgtgtctt tcttgatgga gtgcatcttg gtgtgtttta 7140
caaaggggaa ttcagtgctg tttttttgtt gttgttgttg tttttttttt ttaaagagca 7200
gcatagggcc cttctagact cttggattct gtgtctgaca aaaatggtca ttaaatgagc 7260
aatattataa tttagaccca tttcactgat tttgttccaa attctcaact gacttgagca 7320
tctgtttggg gctgtagata cattgccctt gttgactgtt tttctcgttt ctatgggaat 7380
tactgtagcc attactatgt agctttcata gactcaaaac atttttaaag tattgcatat 7440
aggctggcca tatccagtgc ctgttacttt accttctttt tctaacttaa tgcagcagtc 7500
tgtattaaca gatccatttc atttgtctag cttcatcaga gagaggctac cccctgattt 7560
acaggctgct cacatccaag caccttgcat tctacacttg acagtgattg ctaatggccc 7620
attcaactaa agtatttgct tgttaacagg gaacagaaca tgataaatgt ccagcaagct 7680
tgctgcctcc ttcagctttt caaacgcaga ctggtgcata tttatggcag gcaaatgaca 7740
aaagaaaaag ctgaattgcc ctggcctcca gctttctatc agaaacaggg ttaaagtgat 7800
taaagcaatc attcaagaaa gccctgccgt ttgtttacta accttcatcc aacatttagc 7860
tttgtagtct acctgtgaga agatatttca gaagtattag agataaggaa ggaggatcta 7920
gcaaaccagt gaaaagagta ggtgaccagt tataaaatgc tttccatgca cattgaatgc 7980
caggcgaacc tatttctgtt attccagcag acaatcagca gtggctctag attattaaca 8040
tattttcctt tcatgtataa attcaaatat gtaattctag tccaaagcat tctgtggctg 8100
gtaagcacat acttgctgat ttcaaataag aaaacatagc aagggaaagc tccattaaac 8160
aagttgtttc tgcccttagt aattctctaa acaagatagg aagaaaaagt ggacagtagt 8220
ggagtattaa tagtgtgctc ttttcattct ctaaagcacg agtaagtaag cgttcaaact 8280
actctgtggt gggcatacat ttagagcgct gtgaatgaac cactgctgtt ctgccatact 8340
taatttattt atattattat ttttatttta ttgttgtttt tatgtattat tataattatt 8400
tatttatatt actaatttat tttctcaatt taaatcctgt tgcatccaat tttaattaca 8460
gtttttgtat ctgccttccc atacttgcta cccacgtccc cattgccact gcggccttat 8520
ccatgttttc tgtgtacacc actctcgtat caccccagaa taattatgag tgctacccag 8580
acttttgaaa ccactagagt caacatgttt gtctttgagg aaagccaatg atgctttagc 8640
atttttggca ggggtggatg tgtgtttaag tggggtgggt gcagctcctt attgtctgcc 8700
tattctactg ttgttcccaa tccacattcc ctgcggggca cctaacctgt gtgcatagca 8760
aagaatttcc gaccttcaga gccagaagtg tttctcaatt gatctcttcc agcctagggt 8820
tatagctgat gaattataat ccttgctctt tccacacctt tacctgggct taccatggcc 8880
ctaaaacatt tgcccagaat cagaattgtc tcatgagtga gtggggcaag gcaaatcctg 8940
ttccagacca gctgagaatg tacctagctg cagaagaagt tagaaagtgt catcttttac 9000
ttatctacca gaactatatt cgaggtacat tttagattta aaaaaaaagc aagttctcgt 9060
aggccttgaa tccccccctt gctatgggaa aatggatcat tattataatg gactgtccag 9120
taaagttcat gatttctcct agacatgttc tctctcttta tgacctagat caagagtgat 9180
ctctttaagt cttttcttca taatcccaca gcactttgta cttagatgta cttagaaaga 9240
accatataca cggtacgtca tgattgatat gcaagccttc accactctac ctgtcctaaa 9300
agtcagggac acaccttctt catttcatca gtccctactt ctatccagca ttggcatcca 9360
gtaagtatta gtggaatgga cagacaaccc gaatttgtgc tgatggcagt ttaccctgtt 9420
ttaactgtca tccttctgct actagacatg gatgagacct gagacgatgg gactgctcag 9480
aggtccctgg ctcttgaact ttagggcacc agaatcccct gcagggcttg agaaaacagg 9540
ggtttctggg ccccaccccc agagttcctg attcctgagg tctggggtgg ggcttgaaga 9600
tggacatgtt taacaagctc ccaggtgacg ctggcaactg ctgcctcagg gccatgctga 9660
gaaccctcgc cctacacaaa cctttctggg aaaacaactc aacattaaag ctgtttgggg 9720
atctctgaag aaatctgtag tccttgcctt gttgggggag catcagggat ctaaccattg 9780
atggtggagt atttgttgtt aattcagcaa gcaactatta agtgttaggc ctgttactcg 9840
gctctaacaa tacaaggcag agtgacctgt accctcgaga tttaaagtct aagtcctgta 9900
gagagaagcc caggtgggag caagcacatt tagagttagg tgcttggtgc aaggtgggga 9960
cacagaagaa gggaatggca tttgcctctg gaggggtccg gaaacagcct agggaggagg 10020
agcttgagtc ttgaaatact gtgggcatct ctaagcaaag tcacagtaga cagctgaaat 10080
aaagaaaata gtaagcaagc caaagaaaca gtatttcagc caagggcagc gtgtgtctat 10140
cacgtccacc tgtgaacacg tcccaggatt ctctgcatcc ggccattgct caagacagat 10200
ccctcacagg aacagctaag ccactgattt cagctacctg ttcacgtgag aattatcagt 10260
acctactgct tttcaaaatg agtatgatca tggataggtg aggcaattca gtttcgcaga 10320
gacagtaggg caagtgccac tgtagtttag ttaagggcac atgctttaga gtttggctat 10380
gtgagtccaa tcccagttta gccatttatt agctgggtag ctttaggagc agtagcctta 10440
gtgtctctca gttgtcccat ctctataata gggacaataa cataatagtg ctgaataaaa 10500
gagtaacaaa attttggtca acatttaatg tatttaaaga gctaagctcc gtgattggca 10560
caatgaacca atcaatcaaa caccagttgt tattaataaa agtcagttga atatgtactg 10620
tgtgcctggc cgtggttcaa tttgcctttg catacaagga aaaaattaaa atactctgtt 10680
aataaagact atagcataat actttcacct taaacttctt gatgttaatt tattttgttt 10740
acctgccaaa cttctactca ttccttatga ctttctgcta catgaaacac cctttgtaat 10800
tcttttgtcc tattaaatta agttctctct cctctgcttt cctgcttttg gtgctttcta 10860
ataacacttt taaccctgga ctttctcatt cagctgtgca actgtggact gagaggaggc 10920
tctttgaatt cattttgtat attctagtag agagtactgt gagcagttgg gttgttgaat 10980
gaatacatta attcaacctg gagggatggg cagtattgca ttttttacat tgatattaca 11040
tgatatttag aaaactgctt aactggtgga cgttgtttta ttaacagcat tttgtgtata 11100
gcactcacta tgtgccagct gctattctaa ctgcctgaca aatactcctg aaaccttcat 11160
ggtaaccata tgagggaagc acttttaata tatccataat accaacgggg agactgtggc 11220
caaattggtt aattaactta gccaaagtca tattgaacta ataagtggat ttaaacccag 11280
ctagtctggg gccagggtcc ctcttttaat cttctgcctc ctgcttatgc tgttgcatgg 11340
agtagtcttt atcatataac taaattaagc atgcatttgc ttaaagcagt gcatacatga 11400
tggatcaaaa agtttgtggt ataattggtt taattctgtc attatccatt ttgatttata 11460
gtcactttct tatgatggtc gtgtagtttt aaatggaacc tttgaatctt tgatataata 11520
aggttatgtc aaatcttggg tataataagg ttatacccaa tggaaacaga ataatgatca 11580
gcccatttaa aggatgactg gagagttatt acaatacata atagtcatgc atatattgag 11640
tagtattcct ttggtaacat tttcctttta aaaattgtaa catttgattg ttccttgttg 11700
ggagaaaagg aggtcagatt tttgagggga gatccatttg gtgagatgct gagtgtgtgt 11760
caagctaagg agatagtatg acatcttttt tagagtctag tcacaattaa atgccatttt 11820
attttggatt ttgggatccg tgccagcttc cagcttgtca gagctgagaa gactcaaatc 11880
aagtccaggc ttatttctac agcaaactgg gattctggct tcttgccggt ggattcattc 11940
agtacagccc atctggcttt tgatgttctg caagtttgga gccatttgtt gaaggaagcc 12000
aggcggtgaa tattggtggt cctggggttc tcttgactcc aagtggtgcc ccttggtttg 12060
cattttcacc atgcttagca tctgcttacc tggagaccat gcagccgccg gccagaggtc 12120
tccaacaacc aaatcttcat gccttttaga actcagagtc cccagcacat cctccttcct 12180
cctccttgtc caattacttt catgcagttc tcagtagctg cttgtttgaa tcacttatag 12240
tatttaactt ctagggtgtt tttgggtttt ggtcaaggta attccaggct gaatgtggtg 12300
actaagcagg aaataaatgg gtcgtcctca aagttacagt ggagcgctgt ttctattttc 12360
ctaaggtaca cagttgtggg ggcgatccgt atggaagtca ggaacccagt ctgattttgc 12420
ttccttttga tggtagcagt acagacctgg ctgttttgta gcctgctttg tttttcttcc 12480
ttttcttccc taacttcacg ggctgtggca aagccctgag acgtgcagga aaatgtctcc 12540
tgtcatacgc ccacagcaga cctagccctg accctcctct gaagcccagg aaggaggtat 12600
ctgtgaagca gcctgcttgt aaagcaattg cacacagcct tgtaaactgt gttactgggc 12660
tgattatact tgattggcaa ggtgaatctc ttatagcaaa agagaacttg gagagtttta 12720
tctcatctta tgccttatta atttgttcat tctttaatta cacagccacc tattgagcac 12780
cctatttatg caaggtacct ggtcgggggt cagagggagg gtcccatggt aaacgagaca 12840
gactcaatcc tggaggagca ggaatggcag cccctcgctg ggctgttggc cccaccaaaa 12900
gggaaaggtt tcattttaat aatacatggg tgaatcattt ttgtcaatag gcaaaattct 12960
ttgtagttaa aaaaaaatat gatggtagga aggaaaggga tgggcagagg gttaaaacaa 13020
aagatatgct ctccctaact ctagattgta gtattgttat gcttgtcact gtagctgaat 13080
tccatttctt tgagtttttt caatgccaag gcattccctg tatgacttac gtgagccttt 13140
catctccgcg atttttccca ttcaggtaaa tgagcaaatg gatttgaaca ctcatatcta 13200
aaacaagaga gaaccagctg gaaatgccct ttgaatttct ttctctatgt aaaccatttt 13260
tctttctggt gcctcaccta taaataacag gagttccacc ttcctttata gactcttgct 13320
gaaagcatgg tttggaacaa gaccgtacag gtgcacacaa attacagttg ggaaagaagc 13380
ctgcagtgca tcttgtctct gaaggttatg aaatcctcct tttagtaatg gagctggcgt 13440
gatcaagcca gcaggatgaa atttggcatt tgtgagatca ccccccttct cacttgccca 13500
ctgtacatag catcccagcc ttactcttca aatctccaca ttttttctta tctagctaca 13560
aaattcatag gctgattttt ttggggtgcg tgtgtggttt tttttttgtt tttttggtaa 13620
ataaagacct gcatttttat tttgatatag gtggttgagt tttgtcttta atttcatgac 13680
agagatttaa ctagtctcaa cttttgaaaa gacaacaatg atatttgggg atcacacact 13740
taaagttaga tttctagatg attaatacca aagtagatga ttttttagcc tcagccattt 13800
ataggtatgc ccttctgtga attttttatg acagtgaaaa tcatggcaca gataaaaatt 13860
aaataaatac ttctgttatt ttcctgaaga aaaaaaaaaa aagcttaaac tatgagaata 13920
ctgtctttga gcactttaaa ataaaattga cttcagccag caggattttg agcattacat 13980
cacaaataaa aaacaagatt aacatcaaaa ggagtcagtt ttcattcaat tgtgcagcac 14040
tgtgggctgt gaaatttaat attattttga ctcatatgct aattgtagac tgacagagga 14100
aaatggattg tgtttaaata aaaggataca cagcatcaca cgcagctgta tcaaatacaa 14160
gttgaggtct ttgggccagg aactgggggc cctctagctc tgttattgca gattcaagtt 14220
tgacaaataa aactttcctt tagactgtag tttaattact ttttttcaaa ggtatgcgtg 14280
atgaagaggc acaaatacac ctcaccttga agagttgcta aactggtttg tgtgccgatc 14340
agttcaccgt gtgtttgaat ttctgtgctt ctcatctttc cttttcttga aaagattttg 14400
cttgtcattg gtgtgaattg taccccccac ccccacccat ctagtctttg ctctcagatt 14460
tataacactt taatggttcc aaattgtata gcctgctctt agaccccttt tcttttcctt 14520
gaataaatca ggttcatgtt gcagacgata tttgttttag gaaagtgtga aagaaggggc 14580
acctgtgaaa acacgcaatt gttccaacac acatatacat ccaaattaaa gcagaaaatg 14640
tcaaagcctc caatcactac cttatttctt ggaggtttaa agccgctgag aagatagtgg 14700
tgccctcgct ggaagtttta aggtaattac tttttactct aagcagtagt atctggtaac 14760
ctaattccgt ataaacctga caccctatcg ctacacccca gtatttctct gatttcagaa 14820
taagtctgcg tagaaacttg ttctgatgtt aaagtgcaaa agggggcagt aaagtgctat 14880
ccacaaaaaa ggaaaaacat tttccaagta tttcttatta ctgcctgtgt ctttcgtagg 14940
ccctgccttt atttattcat tttataacaa aactcttatg tttggggcat tcagagaata 15000
ccttattaag ctgttgcagc aatctagcat taaatggaag acatgcaaga ctgaagatcc 15060
tgcctgttta tgaagtgtgc catcaaattc acatgctcat gatgcagagt ccttctttgg 15120
gagtattcgt attcccaagt gcacagagca cttcggaaag gagccttggt ctttggtgtt 15180
aatgctctcc tagctccgta tagatgtggc aggcccaaag tacatggtgg ggtgaagggt 15240
caagggtttg ggcttatcca gagcagcgtg catcctttgt caggaggtga ctggaaacac 15300
cagccaatta cagcagaact gcagactgct catctgcatt cggaattgca gatgaaccag 15360
tttgtactcg acttctcttc ttcactgtag gctttgacat ttaattaaaa attaaagcct 15420
tttatggaaa aagtacatgt tttccaaaat ggggtaaatt cgaagtatac ttgatacaga 15480
acactggctt gggaataaac ctgtgatatt acatgacttt tggtttgcaa ctgctaggct 15540
gagcctcttt gtaaagctgg gatttagaat ctttgaaatg tttgtacagt tcaatgatta 15600
agcataaatt gtatatattc cctttttttc acttatttga gtaaacaagt ttgttactac 15660
agcttctgtg gactcagaga tttatgtatt aaataggcca caacttcaac taggataatt 15720
ttatttatct gcttgttagg gaattgcatc aaaagtttaa gtctgtaggc attaaatatt 15780
ttaaatgctt atttttaaag tcaattatga aagatagcac aaagtttttc tgaaactaca 15840
ttaaaaaaat aatgttttaa tcttatcaca aaagcattga ctatttattg caaagaaaac 15900
acagaaagct aaaaatcatt ctaagtccac cattcagtag cccaaagtgg tctcaggtaa 15960
aggcggtgtg tgtgaccatt tgtttatggt tgtctccgtg cagtcagcaa aataaacaga 16020
acaacatgcc atatattatt gatgtgtata ttttcaactg aaattagcca tctgcttaca 16080
atgatcatat acactaatgg tataattttg aaatgaaaag aaaaataaaa taattctttg 16140
tggagagtaa tgcgaattga cttatgaatc tcgccctgct tggcagtttg ctctagaggt 16200
agaagagctt tatgtgtggg cctcctcccc ccccacacat ttattctgct cacacttgca 16260
ccagcatcca tgtcaggact caccttgtcc tgttacatga gtaacatggc cctgattctc 16320
aagtgcatga taactgccat aattacacat aaatattaaa tatttaaata gatctttacg 16380
tgtgtaatat taggtagaag tggctctgga tcgaatctga tgctttttaa atagaagctt 16440
tcccacaaca tttccaagca ctgtcatcgt gtctgtctcg atttggggtt tacctggcct 16500
agttatctgt ctgggtgtag aaactggtag ttcctgtttg tatctttttt gttctgatct 16560
ctttattctg tgtcagctaa atattcttgc agtcagttac taacatatta actcatcctt 16620
gtttggaaac tttggcatat ccttccatgg tttccttccg tggacctgtc gcgtctctca 16680
ggagagccac caggtatatt gtcacacatt tcgcatgtat tttcagagac tacagcagca 16740
tcaagtggcc ccccagcgat ttgggttttc ttctcggtta atctacactc tttggccaac 16800
cgtgagaaaa cttgtaagaa ggcatcagat gtttgtgcta aggtgcgtgt agtatggtca 16860
gaggaagaaa gaagcaggga aaatggagtg gccgtgggtg ggaggggaag cagggagtgc 16920
aatttcgggt tcactacaca gctctccata aacttctcca ctgctggctt cccacggatc 16980
ctcctattac actgggcaaa gtgcagaaat agatcaggcg accactgcct ccgtccattt 17040
cccaggcacc ctgtgagacc cgataatgca atacaggtca gcagaaaagt ccagacttga 17100
catcccaacg tgccatggtc tggtctgtga atgaaaatca catgaggtga cctctgaact 17160
ctaagtggct ggtttatgtt ttcagtgtat taggcccgtg ttttaaacaa gcatgtgctc 17220
gtagtgtagg ttaaaacttt ctgttgtctt cattaattat gctgtgttct agtctattaa 17280
tattaaagaa tattgtgttg cataatgact aattttttta ttttttggag acggagtctt 17340
gctctgtcac ccaggctgga gtgcagtagt gcgatctcgg ctcactgcaa cctccgcctc 17400
tcggattcaa gcaattctct gtctcagcct ccgagtaact aggactacag gcgcccgcca 17460
ccatgcccag ctaagtgttg tatttttaat agagacgggg ttttaccatc ttggccaggc 17520
tggtcttgaa ctcctgacct cgtgatccac ccgcctcagc ctcccaaagt gctgggatta 17580
taggcgtgag ccaccacgcc tggcaacata aggactattt tttaaagttt ttacaattat 17640
gactgtgaag ttgaaatgtc taaattatta gagatccagt ttagattact aaatatttat 17700
gtctaattga gatgattaga cttagccaaa gtatccatgt agaagtatta gagtctagat 17760
tggtgaaaaa cttgaaaaag cttggcttaa gttcaatagg taatccaaga gtaaaaacag 17820
attccaatat cagatctttt caccatagtc atgttaagtt tggaagccct acttgagtgt 17880
ttccagtttt ttccacatta tattgtgtct atatttgatt caaaggcagg gcatctattg 17940
tcttgcttag gactgattca ctgggaaaag ccactggagt tgcctatttc cactcagtat 18000
gcctcactct tagagtagct tcccatggtt cccaggcagg ccctccagtg agaatgcacc 18060
aagccacacg ccatggcctg ggaagcagtc ctgaacctgg agattgtctt gatggaaagg 18120
aagaggcagc cttcccctcc caggaagata gtagagagcc tgctctgact tcgctcaggg 18180
atggaactgg tctggctcag ttctctctcc tgtgtgggac atgaatcact cttggtggtc 18240
tttgcttttt atttgggctt aaaatcagca gactttatta aatgacacct ctctctaacc 18300
actctctgtc tgggcgaagt ttaacaagaa cagcctcccc ccatgtggta tgggttgtaa 18360
ctgtggcggt ttccctctgc tgtttttggt tacaagatga acattatctg aacacacaga 18420
aagaaatctg tatttggcat ccataatgga aagtcagttt agtaatttaa acttagccag 18480
ttatcatcat cataattctt tttaacactt tcaaagtcag cataggagaa gtgtattgtt 18540
gaatattaca aaatatttag ggcatagata gatgtgctgt gtagtttgat ttgttaatgt 18600
gtctaagcaa tcaaagcaac agaattcaaa tataaacccc atcacttcca aaataggaac 18660
tctgtttact gacttgatta taacatatgg aactcaattg ttttccatta aaaaatgata 18720
ctattaggaa actcacccca ttttcttttc atatatattc tgctatttgc ataattgtct 18780
ggagtccata tgtaatatta aatgtaaaac acaaatgcca tgtagctggt ctgtttcttc 18840
ctcacctttt ggttcctggc ctcctgggga agggttgcac atctgagccg tggtctcaga 18900
tgactgcctc ggaagaagcc tcttcccttc aggcaccact gatgtgtgct tggtgtggag 18960
ctagactttc cctggctctc catgtgacgc tcacatgtgc gtgtcttgat ttcccttaac 19020
ttcatggctt atctatgaac agcttgattt gggggaaaaa aatgtgtttc ccaatgctgg 19080
agttataatt gaatgtgctg cagtcaaaac tgaaatgtgt gcagagaaag ggggcttttc 19140
ctgtcatgct cattgggcac cagtgtgtct tcacctgttt tgtgtgttag gtccatgcgt 19200
catgctgaaa tgaagaacat gggatgtatg gggctttgga cagtgctgag ccaaaagcaa 19260
gtgctcaaaa gcagctgtgt ttgtattatt agtggttctg gaggtggctg attgccttgc 19320
attttaagta gagagggatt gtagaagact gccaatactt agaacttttt ccagagagga 19380
agggtcagaa actgcatctg cagggctcct tgctctccag aaatgccagt gtgcctggga 19440
gggcatcttc agaaatccag tctctcctcc tcagtgtgtc ctgtaccgac tcagtggttc 19500
tgtcttcaga attcctatca tgtctgtgat ctgcaaatag tggtatttaa tttgacttca 19560
atttgtataa atgttagctt ctatttgttc attcctattt tttgttcaat taatacatta 19620
tttattgagc atctactctg tgtcagcccc ttgggtgttt aatactgaat tagtcacatg 19680
tgggacttgc ctgccctcag ggagctagac tataaattcc taatgatcag tggtctccac 19740
ttttctgtca ctcataatgt ctggcacaac ataggttact tgagttgtta cactcacagt 19800
actgttgttt gctgccatgg tgctttagga agtgtgagag ttcccgggag gcagagtcaa 19860
taatgcagac tacacgtagt gaaaacatgg ccaggagagc tgtagttcag gctctcagct 19920
caactgcact ctgtccactg agaagccata atttcttcac ttaaagtgac tgtgcgctat 19980
ggctgtttat atatacgctt aaaaagtaaa agctgctaaa ccactcaagg attggggcct 20040
tttgtattga tttaattaaa ggaacaatca ttgttttaat gagctctaga aacaattact 20100
tttgaagagc cgaggatcaa attcttgcct cacgttttgc cacagtgtgt tctgaaaggt 20160
gaattaatgc ttttggaatc atcaggaata gtgagctttg tcacgattta ctttttacaa 20220
gcgtatctaa tatgcatatt gaaatgtgag cctccccacc acacttccgc tttgataagc 20280
atcccccgga ttgccgtcac tgaccattat agatttttaa caaagttgga cagtacacac 20340
tgaatgaaaa ctttacatca aggaaggcct ggcgtgtttg taaaatgaat taaaaggctc 20400
attaaatgat ttatatgact tacgccttct gaaaatatgg cctcaaacac agagatcccc 20460
aaagccacac cgacccctgc gtcccatgtt ctcgacctca ccgcatcagc accagcaaga 20520
cctgtcgctg agacggtgag tgatgagagt caagaggagt gacttgcatg gcctgggagg 20580
aaacctcctg tgaatcttta gttaagcagg aaaaaaaaaa tcctcatgaa ggaaacagga 20640
tcttgggagc attttgaatg aagaaggagc ttagtgagcc aaacttgaga catagggtgt 20700
aatgtgggag agttttaaga tttgcagaga tgtacagctt gggagggggt gtaatgcatt 20760
ttcttaaaag agctgaatga atggttgagg aaatgggtac atctggtttg gttaaggatc 20820
ctaatctctg aagcctggga tgcccccagg gcttgtaatt taggaatact tcccctaata 20880
gtagctaacc cttatatagt gctgtctgtg caggctacaa aaggagcaga ttaaggatag 20940
aaaaggtttg gagtgtatga gaaaccctag gcaggaattg actcctggtg tttgtaaacc 21000
ttaaagatgt cctaaaaagg tcaaggaata agacaggaga aaaaggaaat gtcaggaaga 21060
tgatcaattt aatgtttatg gaatttagtt tgtacttact gcccggcatc ttgcctgagg 21120
tttttaacct cagcagcaca tcagaattac tgtgtgtgtg ttggaggggc tgggggagat 21180
aaagaaatta gcctcatccc aaacattctg attcagtctg ttacttgaga aactgaattg 21240
tgttttgtcc ataaagaaga tgaaattgtc tacagagaac acattgccat tcacaaggtt 21300
gaggggatac cacagagagg ctcccactgt gatttgcatt tgtcaaaagt tctagagaat 21360
tcttcaacag tacacacatg gttgttttaa atatatcatt gttataaaaa ttcgttttga 21420
gttctgtttc acagaaagtt tttttgaatg aatgaatgtc atatatcctt gctaaaggag 21480
ctcagttaaa aaaaaaggga ccatccttct cttttggggg ttgtacagta acacattccc 21540
aagaaagagg taacagccac atacattttt cttcccaata aagagtgtgg gtttttaata 21600
tgaatccata gtatgatttc tgttatgttt tgtgctgctt cataaccaca ctcatgcact 21660
tttcagaaaa ttaataccat tcattagcat aaatcataaa ctattccctt ggtatgggtt 21720
tgaaattggg ggtgccctat catccttgct ttatctctta gtgaattatg accctgtagt 21780
catcatggct ggtgggcgtc tctggttaaa gaaagggttg gattggaagg attcagaggc 21840
gattctttgt tcttaggctt taatatttta atgagcctgc aggcttggct gcttacgaac 21900
gagctgagat ttctaagtgt gttgttagtg ttagcacttg tagaaggatg ttcattagga 21960
agttcttgtt tcagtttttc agagaaactc cccattaaga aagatcattc aggaacatgg 22020
ctaccaagaa agaggaaagg gaggagggag gctttcagct ataagcatta aggggatatt 22080
gtatcagtag tcttagttct aaagatttgc ttctgagaat taattggagc aaatacatct 22140
caagggaaga aaaaaaaaga tttatagggc agggacagta gttgtccttg caagtagagg 22200
acacttcatt ttgcagctga atcaatacca caactaatta tttctggtta tcttttacgc 22260
atttgtaaga cattgctttt gttcagtgta ataaaaaacc cattgtttga tcagtgactg 22320
actaattatg ataagtaatt tgaaacattc ttgatgaaac ttgtctgtta attaacatca 22380
acagcacagg gaaactaaca ggacaacaaa gtattagtgg atccactgtt ccctccaatt 22440
gacgagcttt ctctgtggca tgcccaataa actaaagctg ccaatggtta aaaaataaca 22500
aacatgtggg agatctgact caccacggag gaagagttat ggtaaagtta cacaaaggag 22560
tactgaaata ttacaagcga gggggtggta aagaaatgtc agcaggtagc ctgatcctac 22620
agcttagagt aaggaaagtg gtttctttct gtctttcctt tttcttttaa agcttaattc 22680
caaaatacat tcatcccata ttgatctgaa gtaagagact tttgataaat taaagtgtga 22740
atctgaaaat gtgtagtttg ggattatggg cattgcctgg ctatcttgta actgtcatta 22800
atactgttaa tttttatcaa ctcaatggct tttttttctt atgcttttag atttctacct 22860
ggacaaggac tggtactata cccacagata ggagacaaat tggatattat ttgccccaaa 22920
gtggactcta aaactgttgg ccagtatgaa tattataaag tttatatggt tgataaagac 22980
caagcagaca gatgcactat taagaaggaa aatacccctc tcctcaactg tgccaaacca 23040
gaccaagata tcaaattcac catcaagttt caagaattca gccctaacct ctggggtcta 23100
gaatttcaga agaacaaaga ttattacatt atatgtaagt ataattttat tcatttattt 23160
tatagaaatt aagataagct atataggttt gtatcaattt tttgtttcct taaaattatt 23220
gtgacaaata atttgatgaa aatctatgtg gaaaaattgt cccccccccc tttttttttt 23280
tcaaagaaaa cttcattgaa tttgggaccc tgtgctacca gtattcatta agtatacata 23340
cccaaagaga aaaaaaaaca ctagaattct taatagtatt gaaataaatg tattatatga 23400
atatattcag catctctact gacaaaacca tttttaagga ccattggtgg attttgatag 23460
gtaaatcttg tgcattgcct tttctcttca cccatccatc cattcattca ctcattcatt 23520
tcgtatttat tctgtgccag agactgtgct taagggctag ggattcagca gtgaaaggtg 23580
gtaaaatagc atgttttcct caagaagtta acagtctaga gaagatggag ctcataaatt 23640
cgaaagatgg ggatgacagg tcacattaaa accagattca gaagaaaaag acgaaacttg 23700
gtttgcttag tacattactc ttttttgcat acatatatat aatttgacac gctgtttcaa 23760
gaagagatgg tacgtatccc ttgggtcata tctgaggctg acttgtgagg atgtgaagtc 23820
agctgatgag cacatttgga gcccacgcct actatgtgca gatctctcgt cagcgtcatt 23880
cccagggccc caggtggtgt taaagtctag gtgactcaga cagctgttcg cgtcattcaa 23940
gcaatgaagt cttttttctt aatttctttg gtttaaaatt atactcataa ttaattgggt 24000
tgaattttcc agtggcttgg ttaccataga cttcagttta ttagggaact gctatctgcc 24060
actggtttat tatttgcccc aaggtggact ctaaaacttt aggtaggaga ctcttggtga 24120
tcaaactgaa actcttgcat ctcaacctat gagccgcact ttattgttat tttatttttt 24180
tagagacagg gtctagcttt gttgccgagg ctggcgtgca gtggcatgat cacagctcac 24240
tgtagccttg aactccaggg ctcaagtgat cctcccacct cagcctccaa gtagctcgga 24300
ctacaggcat gtgccactgc acccagctca agagctacac ttcaaagcac agaatgaaaa 24360
cctattttta aagccaactt gatacataga gtagcttacc aagaattagt aacaacaaca 24420
acaagaaaaa aaagagagaa tgtggtagag tatatactta gtaaggagta attattataa 24480
aataaaagca ttctgaaatg aaacaggtag atggggtggc caagtatgca gcatagtagg 24540
gaaatctttg aaaatgtaaa atagttacca ggtaaaataa atggaaactt taagcttttg 24600
gaagcctaac aatgtattta tattagtaaa gactttattt ttttatttta ttttatttta 24660
tttttgagac ggagtctctc tctttcgtca ggctggagtg cagtggcgtg atctcggctc 24720
actgcaacct ccacctcctg ggttcaagtg attctcctgc ctcagcctcc caagtagctg 24780
ggactacagg tgtgcgctaa tttttgtatt tttagtcaag acggggtttc accatgttgg 24840
ccaggatcat ctggatctct tgaccttgtg atccttccgc cttggcctcc caaagtactg 24900
ggattccagg cgtgagccac cgcgcctggc cttagtaaag acttttaaag taagactttt 24960
tcagtgaaag ctactgttag gcatgacatt tacaggcaac tgaaactgat cagatgcatt 25020
tattaagaag gttaatgccc ctaggtgggg tgggagaaag aaggtcgtgg tacgggaaga 25080
ggggacacac tagagatgag atgccctagg gcagtgaacg catgtcccta atgcgtggat 25140
gcagcccacg tccaccgata atgccgacac acccagagtc tctcttctta ctttagctta 25200
tgacttcacg aagaatgctt tgcaaattct aagttcgcac tgggcgcaag tggaatttta 25260
gtaaacatta agagtttaac ctttagtgtg aaataatatg caagatatgc aaataattgt 25320
ttaccaacat ctctttgctt aatgtggtga gcatttaata attgcttttt attaatacat 25380
gagagatttg tatttagaag cagtttaatt tataattata atattaatct acacaataac 25440
gacatctatt attttctttt tttggaaact cttcatacca cactaacagg ttcattgcag 25500
ttactgaact actctggcca tcagagctct ccttagagtt acgatttacc atgcaaaagc 25560
atatggtagc ctgggataaa tgaatctttc ttaatacaga attgagggtc tcaagtttga 25620
aactacgaga ggctatttga atgttgcttt gggggactgt cataagggct gggtggagga 25680
ctcagggcta agaagtttgc caggaagtcc agttgagact ttcagcagag ttgaaagact 25740
tccacgatgg cgtaggcaga ggaaggcgtt tcagatactt gggaaaatat agaagccaat 25800
ttctcaccca ccctacagca aagctcattg atctacaagt ttccctagaa aggaaatggg 25860
aaatgcagag aacaaatgtt aaaatagttt tagaaattaa tattgacttt gtattgcttc 25920
tgcataagtt ccaagacacc aaaacaatga atggatttta aaaagtcact actttgcata 25980
tcagacaaat gcacacacac acacacacac acacacacac acacacacac acacagtcaa 26040
gctctgtact ggcttttttg agaaggaaag tgtttgaagt tagtaatttt tatatcagta 26100
catttataaa tagtgctagg tagcatgacg gaaagtatta aaatttacat gtatattttt 26160
aacacttcaa atcgttggtt cactttgaga cagtaaataa tattagcatt tgagttcagc 26220
tttaataaat tctacatggg tttaacccca aatctgagtg tctagttggt aagcgccttc 26280
agaacgagca gtgttataat aaatatgtta ttgtgtgctg gtttctttcc atggagagga 26340
aaaagagacc tgatgctttg gaggagtgct tgacttttcc ccagtgagga gtagtccaga 26400
gggactgact tgcattgggg agtaccctac atgaacagca tttcagaaga attaaaccag 26460
gaacctagag tcctacttgc tagtcctgct tcctaagctt aatgagaaag tcaattttat 26520
ttctttgaac tttaatttat ttccctaaaa aacgctttta gtattgtcat tgttctggct 26580
aatgatggcg gtctcctcca gtttcaagcc accttagggc tgggcataca aatgcaatat 26640
aggatcactt gttagtgtgg tttcaaatgg acatgatcct ctgtaaattc tttaaaaaca 26700
tttaatttga tttgtggtgt tacctgcttt aaaatatagt catcacactt gtgagtttca 26760
gacgtgaata tgaattttta atttgaactg tatttttaaa cacactaagt attaactaag 26820
tccccttagg agatatgtgg caaactgata tgcatcctca ttcattcttc tcatagatgg 26880
ttatttgttt tttaacttgt ggcaaaatta tatatgaatg gtcaccgact taaaatagtt 26940
ccacttaaat ttttcaactt tctgatgggt ttattggagt attaaatgta ttttcaattt 27000
aatgatattt tcagcttacc ttgtgcttat caagtatcaa gacatagccc cacctaagtc 27060
atggagcatc tgtatatggg tttttattct tgtttagaat tgactttttc aagtgaccta 27120
tttcagtaat tagccctggg cctgatttgc ataatgagat ctcctaatct tcaagtaatg 27180
caaagatgga gatattatgg ccatgtggtc tgaagagacc ttttctttat tatgttcaga 27240
tctttaattg ccttaaaaat agagtagcta atttacctaa cctctagtta ttttattatt 27300
gtctttaaag ttttttttaa tgttcatgaa ataactgttc tgaaattgcc tattttcaag 27360
ggaagctgtg tcttagactt actaaatgct ccagttgata ctgggaaagc cttcttgtgt 27420
tcgtagcctt tatccgtaga gttttctttg cagcattttc tgtgcctggt ttagtttctt 27480
ttcagaggcg acacccagag ctgaatgagt cagcaggttt ggtgtgtcga ccctttgcaa 27540
cagctgtcct tacgaaggtt ctgtgggctg gttattctac cttcgcataa aaccttgcaa 27600
aataacccac aaagaggttt tcgtcacact accaaaatca tgtgagtcag agatggatga 27660
aaaatgaatg ccattgtgtt catacttttc cagtgaacag tagctacagc agagctgtta 27720
gacaaagaaa accgtattaa tgaagcgcct cccaatttag cttcatatgg cttttgcatt 27780
attttgctgc aaatccatag ctaagacaca tcttgtggca tagtccgtaa gtcatctttc 27840
cgaaggactg tttgattaaa ggttgttctg tgagatccac cctgtgttgt tcatggcatc 27900
ctcttggagg cctccctcac tctccatgcc ttggcaaagt cttccttaag gaacactgaa 27960
caagtctgga gaagctgcca tttcttaggg ccctcattgg ttcagttgtc tatagctttt 28020
tattttttat ttttttttta ataaagagta tgtaaaattg gaaagcttca caaacagctt 28080
tgctattttt tagacatgta ctccacttct aagcaaaatc acaaaataaa gtaaaatgct 28140
tccacaaata taatgaaaca atattcttaa agaatcaaag cagaagaact tcagagtctg 28200
ttgcttatgt taagcatata tttgttttct tctctgcttt tgatttactt atttctgggg 28260
tgtaggtttg gcaagtagta ctgaaacgta ctgaatgcac tgttctttag caagatagtt 28320
acaggagctt tcaaatgtcc tcttaacata tagatttctt ttagaatata gaataatgtg 28380
tgggctgtat aaagcgatta tgtgctttat ttgatgaatt atttatgtac gataaatgta 28440
gcaaaagcca catttccatc attaaatgta atcccatttg gtgatacagc aacatcagcc 28500
tgtcatttgg gtcctctgat tgaggggtga ggatttctgt ttgatacctt gtgcataatg 28560
gctgcgttca agcatttaaa ctcattttta tttctaacct acagctgtca tctttgtaat 28620
aggatattca tcagaatctt gccagagact gtgcatttgg gatcttgggg gatacagcac 28680
caccaccacc ctccccctgt ccaagagaaa cagatcaaca tcttaggttg agagtctggg 28740
gtctggaaga cccgagttcc tgagtgccct ttgacaagta acttaacccc tgtctgcctc 28800
agtctcttca tctgtaaagt ggggataatg acagcacctg cttcacaggg ttgatgggaa 28860
tccagatgtg gtgggatata gaaaatgctt attacttcca cctttgacac caaatacata 28920
taactaagag ttaactttgg agcaggggag gaagtgtgag gctccaggct ggaggcagac 28980
ctgtgttcgg ctgcaagctg gagaggatgg accccaaaag cttggctgat ttgaagtcca 29040
tccataaaat ggaactccag agagtttaca cgtttcagta atgctgcata acttaattat 29100
aagatcttct ctctttgtct tctttcagtg ttataaaagc tcttttgtcc ttgagcttcc 29160
tttaccaaga aacatgcatt tatgtatctt tttgttcatg gaattgccca agcttgttag 29220
cagatccttt gtaagaccca aaagagacag acaggggagg agtcttcaga tacatataat 29280
catttttccc aatttccatg ttaccagcct tgccaggact ttttctcagt tccctgttac 29340
acaatgaaaa tagtgtctct ttattgataa ttttagtagc atcctaatgt ggtataaatc 29400
gtcttccaga gaagaaaatg tgtcagggtt gcgttatcac tgaggctagc tgggaaagta 29460
gatcagccca ttagtctgat aattcgaagc gttgtttctg ttatttctga acatcatgtg 29520
aactcctttt ctgggtgtat taaaggtttt cccagtgtgt gtcagtgaga ctcctgattg 29580
aatttaatat gaataaagat aaattcttta catttaagga ttaaagtctc agcttctgct 29640
taacttgaga ttgcactgag aaactcctgg ctctcgggta tagcggagtc acgacctggg 29700
gatgtctgtc ccatatggct ctgtgtgtaa gaagaaaaag ctgctgtgga cggagactct 29760
gttcacatta aatgacatca cctaagccat catgacagca agaattattt aggaattgct 29820
cagaataaaa ctgccttcat tatttcataa aatgtatctt ggtatcttta gcaccttatt 29880
tatggctttt taaaggttca ctgggattta taaataattg gacaatgcta gagacctagt 29940
acaagaatga aagaggacag gcttctttct taataacctt taaacattca tcaggaagat 30000
aaaactttaa agcaaaataa aacacatgaa aatagccaag atgcacagac cagacaagca 30060
aatactactt taacttattt gtatagttct taagagtcac atttgttcct gaagtttcaa 30120
aatctcgggc tgagtgtttg atcacttagg gaagtgttgt ggccttcaca tactcttgtc 30180
tcactttgaa gtctagaaac acaggtctta gagcaatttt tatcactgtg agaaagctga 30240
aacttagtgt gagtagctta gtacaattca gttggccatc aaatgtcaga aacaaaactc 30300
agtccagggc cgctggaccc ttaggccggc gttgttagtt tacaacagtg cctcctgggt 30360
ccaaacatct aagtgcacat gtagcaatag taaagatagt atgtatgcat acataacaca 30420
tatgtagaga cagcagagta tacgtacaca catgttgcat acatagcaac agcagagaag 30480
ctcatgaact ataaaggatg gactgtatgc ttgtatcaga cattttggta ctgacgcttt 30540
gtcatatatt gtgtaacata taaccagctt gcaatcatct gcccccaaag ttgaactaag 30600
aaaatcctac agggtactag gaaaggaagg ccattgggaa aaggtggtta tagtggcaat 30660
ttgttagctc ttatgaattt tctttttctt tttagacata ctcttaattc cattttttca 30720
ataaatctat actattttgt gtttttatgt tagcaagtac tttaagcccc tcaatagaaa 30780
gttgctacat catatagtga ttaaaaataa aaatctctca aacatacaag tagaggtggt 30840
atgagacttc aaattccctt agccaagtac aagtgcagca gttttgttgg ctggctggct 30900
gcatagaagg actgatggat tggcagaccc tcaagctgga gtgtaattga tctcattaca 30960
gaggagccag gctgggtgac agttgtgctt tgcaagtggt tttttgcatt ggtgaagtag 31020
cccattttgt tgttcctgat gttaaacagg ggatgaaggt attcttttat tggcacaaac 31080
gcgggaaatt gctctggatt cttagaggat agaacatgtc ccctggacgg aataaggttc 31140
atgtgtaggg caaatttaga taggggcacc ttattggggt tactactggt ctctagatgg 31200
tcaaagcaaa caacatgtcc atctaagctg tgatgtccat ctaagctgtg tgtgtccatg 31260
agagtgacgc attttctcct ctgcagtgtt gttatattct aaactgtcag cagacattaa 31320
ttcggtcgct ggtgaagtcc caccgcctag agatgaactc tgcctccgat ggatgttttc 31380
cacttcagtg ccactcgtct cgcaattact gggtcattaa tatcattgca tgcaattagt 31440
gacagtagaa agagctagag ggttgtggga tgtgcaccct ccccaccatg aactttttac 31500
tctgaccctt tcccagctag accttttcgt atcttggcaa ggatatttta atgattgaga 31560
ctgtcagaat cttcagagca ggcactggat tatgtgctgg aaataattca ctcaaacacc 31620
tgcttctcca tggttcagaa tattttcatt agatattatc actatccctt ccctgggaag 31680
tttcattttt aaaaatctga tgcttaagta cagctaatat agacaatagg gaattatgtt 31740
ttatctttag aactcttaca ttattctttt ctttaaaaat gtgagctgag tcattgctat 31800
tgcagtggtc atctggccgc ctatttttaa aacacaattc ctctatctta gtagattttg 31860
gcccatatta agcatatcaa gaatgacttt ttttttttca agacatgggg ttttattggg 31920
ggcttatata caaggaaaga gagagtccag tggcagtggg ctggacaaga tatccacatg 31980
gccctgtggc agtgagctgg gcaggaaaac tgcaactgct tgcaaacagc atgtagttca 32040
tctatagcat tttcacttaa caccacccag ctaatgactt ccacctggca accttcattt 32100
aatccagaac ttaggacctc gagtccctgt acggcccatg ttccacagga tgggccgagg 32160
gctcagctgt tcctcataga caaggaatga ctctccacat tggccactcc cggattccct 32220
agctcaggac acatattcag gtgtgtctaa ggctggctct tctatgtgaa gttacttatt 32280
cttttaccat tgactctcat gttcccacta tattaagttt ttctgaatta ctgtggcaat 32340
aagaaacggt cccttaaatt atactagaag aaaagctttt tttttgtttt gttttttatt 32400
ttgaaattat gttaaatttt ttttcttaac tgagagattc cacctgcata aatcgtcata 32460
acttttaaca gtaagatctt agacttagaa agtgatgttt ttcctcaaca gaatttatta 32520
aaaatcaaga caccaagctg ttccaaacaa tagtttgagg ggaaataaaa taaacaactc 32580
cataaataat cttatgttgt taaacatgtc tctagcaaaa caaacaaaca aaaaagtcgg 32640
gggttggggg aggtgcagtt tattgccagt actgtctggt ctttctcaga aaagcgtcag 32700
tgtacatcac tgagcctgga cggtatgttt tcttgatcta taccccctat gtgtacatgt 32760
gcttgcacgc acacacatgt agacacgcac acatgtgcac ctgccatcac tttctgctct 32820
tccgtctttt cactcttgag tgtctgtagc cagtagcttt ccaggtctgt atagtcaaag 32880
atacctatgg ccctgaatgt cttcactgat tgctatttga cattcatacg gtttttaatg 32940
gttaaaaggc tttatgcgaa agctgtgata gaatttctcc tgttctagat gtggtgttta 33000
ttgctttatt ttgtgacttt tctctcagta gattgacctt ctccctcagt gtccaagcct 33060
cgcatagcat gatggcacct gtaaactcag ttctgtatcc tggtatcctt tctcttccca 33120
agtagaagca attaagtaat atatgtcatc aaaacctttt aagtgcacat acaaacaaaa 33180
tcaacttacc aaactgcttc aaagttgttc catgtttaac actcttcttt ctgagctctg 33240
ggtagaatgt cctattattg ttcatcatga atatttgaaa ttaaagaaat aaaactgtac 33300
cattttcttt aagagcatcc atttgtactt gataacatct tcagtcatat ttcaatgctg 33360
gcaaagagga ggggagttct aaactgtgac tcaattttag aatctacttt ttccaaatta 33420
ttctgtttag tgcagaaaac taattaatag tgttgcatag aaaagtcact gaagctaagc 33480
cagttattac ttcttaatgc atgatttact gctttaagtt ttcaaaacac aaccatagca 33540
atgtggtatt aattcaagtg attcttccta tcatattgaa cgatattttc acgggtgaaa 33600
aactcacaca tcctacatca ctgatagttt atacagtgtt ttagctgtgg ctccctgcat 33660
gcaaaataag agttaatcaa atgtcagtga gaaccatctc atcaagtaga gggcttgttt 33720
tgtttaaatt aactttgcta agtataaatt tcttcttgaa aataaattct gggccgggcg 33780
cggtggctca cgcctgtaat cctagcactt tgggaggccg aggcgggcgg atcacgaggt 33840
caggagatcg agaccaaact ggctaacact gtgaaacccc gtctctacta aaaatacaaa 33900
aaatgagccg ggtgtggtgg cgggctcctg tagtcccagc tactcgggag gctgaggcag 33960
gagaatggcg tgaacctggg aggcagagct tgtggtgagc caagatcaca ccactgcact 34020
ccagcctggg tgacagagcg agactccgtc tcaaaaaaaa aaaaaaggaa aataaattct 34080
tctgtatttt tctttcttca agtgaggcca tttaggggaa agtataccat aaaacttgct 34140
ctaagataag gcaaatttgg tattatagga tgaagtgcta tgtgatttga agtaatgctg 34200
aattttttaa atatattaaa ctaaacaaga ataatgaggc cctcggaaag tcatgattat 34260
atttctcatt tttctcattt taaagccaca gtgaaaaaca cataaaagga agaagttaga 34320
aaaaaaaatg aatgaaattc tttttttcct tttggcaaat taaatagatg tttctgtttc 34380
agaagatttt attaattaac tttaaagaaa cagtcattta tttttggcat tcagtgaaca 34440
ctatcatttc catgtttaga acttttcttc taagttagca tcttaaaaga taactgtgaa 34500
actcaaggca ttcaactaca ttaatttgag tttcagaaat tgaattcttg tttctagagt 34560
acatagtttg aattgatgtc agggtgttaa atagataaat cttagcttcc taggttgtat 34620
attcacacta attatttttt tatcagcctt cttatttttc aacttacctt attctttttg 34680
tttttttgac actcagattt gatagccctg tggtagaaga aaacagtaat acagtttggt 34740
ttgttgttgt gtttgtgttt attttaaagt cacggctttg ctttccatgt tgttactgga 34800
ttatgctttt tttaattctt cagtttgcca agataacagt cttccgatct tcagaagtct 34860
gtatcaagct taaggaaact gatgtgtagg aagactcgcc taagaagtcc aaattagcaa 34920
ggctagcatg tgaggacatg ctggaaaaga atagttccca tagatattga cagagaatgt 34980
tcataaaatg ctacttgttt tgtggttaca tgagagtaac ttgtgtccag tgcagctgta 35040
tgtaagggca acgtttttat tctgacgact ctgtggtttt catgaccctg gatgcttatc 35100
atgtctctct gttggacttc ttcaacggag ttgatacaaa tacttgcttc caagtgtcca 35160
tctgccctct cctccatcct ggccccatac aaatacgcta catttttaaa taatttgaaa 35220
taccctcaat agtatttata tttcctggtg cttcattctt tccataagaa ctgtgatacc 35280
attattctgt aggatttttt tgtgcttccc cgtttcacat ctctgtgcca gtgagaccca 35340
tatatcggtg caaatccaga agtttgattg tccatctgat tagcacactg ttagcaatgt 35400
ggtggactaa acacagccaa gatgtggggc tggagcttag cctcctggga gcagagcggt 35460
gaacatcaga tgaagacatg tgaaaatgga gtactacttc ctcttcctgg ggatgggcta 35520
aaaagcacag ccagaaatat tcttgccctt ccagtctgct ttacagttac tcactggttc 35580
tctttttttt cctactcaga taaccagtat actcttccca gtgactaaga actgcagata 35640
agtataggtg caaatagatg gcaaaccgca gatggcagct gtgtggtttc agatgtgctg 35700
cagaactttt agacgatgtg aacgcaagga acttttttgc tgagcagtaa tctctaccca 35760
ctggaaatta ggccctgggg ggaacaatgt agtgacttct atatacttac tacatgcagt 35820
tagacccctg aagcaaaagc ttttaaaaac aggctgtaaa atgcccatgt atctttatta 35880
agcctatttt ccaactggat agagaaattt tctggtaatt tttaaatttg taaagtctat 35940
ttttttcctg agccaaggga aaaaaaatat ctgggcccta aaagcttagt tataacaatg 36000
ttattttttc tatctctgaa tgattaaatg tgatttcatt tatgtagcaa tactatgatt 36060
gtggctgcat tagatcacgc tgatagaaag atacaaagaa aaactaagta taatgaacta 36120
acaatttatt ttcactcttt ctctaagtta aaaattccca gtacattcaa atgaacaatg 36180
aaaataattg cagaattgtc tcctgaaatg gaaatagatt ttttttccca agcattagca 36240
atttcttgtt atttttcaaa atcagccact aagcctttca gagcttcttg gtgactattg 36300
caggagaaat cagaatatta atcttgtggt tttatttcag agttcgctgc caggaaggag 36360
gtataattgg gataggagac tttttttttt tagctgtgtc actgttcaag gaggggggtt 36420
tggaacctca gcataagaat tacactctgt gatgaggatg tagcagggga gaagaaaggt 36480
gattttcact atgggaagct atacttacat caagtataaa atagactgaa gtcattttga 36540
attacgttat acttgtaaag tttacctcct ggagtttcag ttagtaccag tgtactaact 36600
gggttaaaac agttcatggc accttagatc atttctaact catggcaaaa atctttcctg 36660
gtggaacgtg taactgtatt ttaaatgccc ctttataagc aaccaagtat ttgggatgtt 36720
attttgatat tagtagtgaa tttttcagta tcttccagta ccctttgcaa gtcacaggtt 36780
gacttaaaag gaaaagaagc aaaatgctga atatagcaga aaaactgtct gcattcagac 36840
tgttcagccc acttttgctc cccacgtggc aagcacactc ccccaaacaa gcaatagcct 36900
gtggcttcag aggaacctac aaaggcagca tctgtagatt tttccttctt caactctaag 36960
acttgaatgt ttccctcttc cccacacact ttttttttaa accaagaaat aaaaaagttt 37020
tcactcttaa aggtgcaaag cagtttcatt cttatgcaac acagccttcc tcctactgtc 37080
ttatagtctg tggatgttaa attatagatt ccaattgaat tttaatactc tagagatttt 37140
acatttgtgg ttgtcaagac cccgttttgg taaacctagg gagctccgca caaaagcatt 37200
gatattcaga aaaggcactg acctacaaat taaaagaaaa aaaaatcaaa taatgtgcac 37260
ctcttgtgct tccagtttga caaagcagaa gtcatcagca gtttctccct ctgcagacgc 37320
agttctcaat tctatttaca agtaactgct ctactgtgcc tgtttttctc ttgctgatac 37380
tcatttaatt gtttttcttt tggatctgaa tctttgactg tcttttcccc ctcaagatta 37440
aaataaatac atctgtattc ctcccctttc tttctgtgca ctgcccttca gatctcattt 37500
tgtcattttt cagcttagtg ttgaaacttt tagcaacaaa aagtcagtta cttactttga 37560
gtaagtaact caaagtaagt taactttgag tttgagtgca cttttgcgtg taggttcatt 37620
tatgtgcttg tgaatttaaa aacattggga ttccacctga atgaagtaaa ccaaacattt 37680
taaactatca gccagataga gacatcagcc tttcacttct ttctatatgc agacatatcc 37740
taatttttta gaaaaatcaa ataggaaaat tctcaacaat taattgaaga ttatagctct 37800
gctctgaaat ggtccagaaa taggatctgc tcatagaaac tcatagtttg aagcctctgg 37860
gaggaaagga tactttaaaa tttagtcaca tatttggagg agggaaaagg gaaagagcag 37920
aatgaagaac tgaaaaaaat cacacaccgg ggcctgtcgt gaggtggggg actgggggag 37980
ggatagcatt aggagatata cctaatgtaa atgacgagtt aacaggcgca gcccaccaac 38040
atggcacacg tatacatatg taacaaacct gcacgttgtg cacatgtacc ctagaactta 38100
aagtataata aaaaaaaatt ttaatagccc cattaaataa ttaaaaagat tttttttaga 38160
ttcacagaag tgtacaaaat ttttaggttt tttttttttt aagctgtctg ctgaatagtt 38220
tcttaatggt ctacaatgtt tgtatctaca aacagatact gtctgcttct tactaccctt 38280
ccaagacaag tattattatg gcaattattg cccagtttcc cgggaaaaat ttatccacag 38340
ttacagaaga atgagatgca attgtgagac tgtaaagttt aagcaagcac tcagagaagc 38400
acagtgatat gtatgcacag aagaggcagt ctttgttttg aggaaaacag tgaaagtaaa 38460
gttaattcaa gaccacaaag acaagtaaat aagtgcctta tttttgtagt taatataatt 38520
tcagtggaat gcatatttct accataaatg catatagaac ttgtttgctg acctactgtt 38580
tggaaaacaa acaatcccat tagaagaatg tctttgggat ttatttttac cagaaaatca 38640
atcctttttt cagtcccttg caaagtacag tgttacaagc caagactttg ataatcaggt 38700
agaaaatgga tttaaattgc agaaatgtat atgaaacact tttgttcctt gccccttgaa 38760
ctttagggga atgaaaatgt ctagcactct ccaccttctt ttctctcctg gaacttgaac 38820
tgtaattcaa agcctgtttc tcattaaagt acctggcagc ctatctcttt acagcttgag 38880
ttacaaagct attcagagac ctcgctggtc taaagagaca gaacaaggat gtgtttaaat 38940
agagcatagg ctgttgaaaa aaaaaatgct gaaaatggta aaatgattct gtccttcctt 39000
ccactcctca ctgctgaggt ggagagggaa ttcagttggt gaacaccagc aagtggctgg 39060
taaaagtccc cactttctct ccagggctgc cacaggaccc agaatgagtg gtgggcatgt 39120
gtgtgaaccc tctattcagc cagagttttc ccgcaacagg tagtttggtt gaagaggttg 39180
actaaggttg acattggcag taataacacg tatgttcttc tgatttacaa aacgatggag 39240
gaaaaagggg agattttgaa gacctgattt ctggtatact tcttaagcat gcataaggct 39300
gaaaaaagaa gacaagggtt gtgggaggct cctggtctag tgtttacaga acttggatgc 39360
ttgacaaaca gagcgtcaag ctaattgttc ttgaagcagg aaatctgcag tggaggaagc 39420
aggtgtgggg ggatgattac cacgtttgga aatggctgca ttaactattt tgctcttctg 39480
agtttggccc caaaagagtc catagacttt ttgaaggatg ccatcccttt tatttataga 39540
ctaacattaa atcagtcatt tgtgaaggaa ggagaaagtg cctaaataaa tttggagtca 39600
gatagcatac gtgcggcagt gtttccgata tccatttctc tttatttctt tttctttttc 39660
tttttggctt tcagcatccc catactttca gaaaacttgt gactaagagt gaattcttat 39720
ttttcaaatt gttttcagac atttcatgtt catgtaaact tggcttattg atttcctgat 39780
ttttctttat ttttttgttt tgtccatttt atttttaatc agctacatca aatgggtctt 39840
tggagggcct ggataaccag gagggagggg tgtgccagac aagagccatg aagatcctca 39900
tgaaagttgg acaaggtaaa gaccatctgc tgcttcatga cgccactgtg acctggtgta 39960
gcccccagct agtatggtgc taatgttgcc gatgcccacc ttcattcgct cttcttttta 40020
gttttcaaag caaacccttc tgcactttga gccactgaca gatttcctca agtcaatgta 40080
ctaagctttt attggagatc taagagttaa gatcagcaag gtagaatgtc tattgccata 40140
gatagataga tagatagata gataatagat agatagatag atagatagat atttcttttt 40200
aaaaagcaaa acactttggt tcaaaatcaa aatatccaga atgaaaacta aaagcttgtg 40260
cagttttgct catttctgaa tcttgactac agaagagttt tgttcattgt gacttttcca 40320
atatagataa cctattgtgc agaaagaaat aattattctt ctaattaaaa attggtatag 40380
tagtcaatca acttgctcag ttaaattgaa atgtcatctg caatgctttg cctgccaaat 40440
gcaagaatcc ctatagtttc cacagatggc ctcacgttct aaacctctga aataactagt 40500
ataaccattt tgttttaaaa gaaaaattat attcttgtat ttcacagtac tttgcataaa 40560
gactcttatg ttcattgcta ttcatgcctg ttgaaatata tatgcagctc ctaaagctag 40620
atattgtcag atgtctgtgc cgtaattaat catttgtttt tcatatagat gcaagttctg 40680
ctggatcaac caggaataaa gatccaacaa gacgtccaga actagaagct ggtacaaatg 40740
gaagaagttc gacaacaagt ccctttgtaa aaccaaatcc aggtataaca gcatgatctg 40800
tgtgtatgga ggtctgtggg taccacattc ttagtagtat cttaaaaggt agggcagagt 40860
ctaaagactt ctaaccagtt aggattagct ggaagttaca gtgatcagga atctttgctg 40920
tcagtgagtc attattaatt acactcaata agaacaaaat aactcattcc aatgaaagtc 40980
atatattcaa aggagtagag ttcatgagct gtaagtgcca gttattagaa ctactctgtc 41040
aggccaaagg tttcattggc tgacatttta tcaagctggt tgtcaactcc agcttaaagc 41100
tgatgttaat gtatatgtaa ttaatgtgct aatccctcat ctaattatat ctaagccaca 41160
gagggtttaa ttgatcctct tctaaatttt aaatggtaac atttttaaat attgcataat 41220
agtatttttt caggtggtta tcgttatttt gtttcacatt ttccatgtaa aagaaaatat 41280
taaacaggtc cctgacaaaa gtgtagaata ccagataaaa ttgtccgtcg ttgaccttcg 41340
ttttcttaac agtcttggaa caaatagttc tgtatttgtt accatgctaa tgaaggtttt 41400
atagagtagc tgttgagcag acatcagcag ttttgtatta ggattgttgt gtgcttgctt 41460
ggtcgttgtg caaatttatc gtctgcagca atattccatc cctttccaag agtcaaggag 41520
ggaagttgtt atttctaact ttcaatgaca agatgtgtca aattcttgtg acaaactgat 41580
aaatggataa tataatgatg ccaggcagtt ttttagtgct taacatttgg gctggcagtc 41640
tgttcggtgt gagagtttct gctgccttcc aaatatattt taagtgtaaa tcaaataata 41700
cagacgagtt acgagctgaa cattttccca ggccccctca ctccttccgc gttcccgagc 41760
tgttctgttc tgccaggagg cagggctctt ctttagaagg caggcccttt gaaggtttgc 41820
atgaaactcc ctttctcaaa ggaggcggaa gagcaatacc acataaacgc tcaccgctga 41880
cctggagaat tggccacttc cctttttctt ccctgccgct gccccaggct ggctgacacg 41940
ggttagaaga tgaagcaaga tcaagggctg gctgtcaccg acagtctgtg ctcttgctgg 42000
ataatgatac aaaggaaacc ctgtggcttg ggagggtagg gaagtccctc ctagagatac 42060
ctctcatttc cttttgcgtt gagctcttag acgaggtatt ggcgaggcaa agtccagctt 42120
ctagttagta ataagcctgg cttatttttc acatttttaa gggtcataaa agcagtccgt 42180
ctgcactggg acagcagtaa ctatctctga ccttttctgt ctccgcgtct gcaggttcta 42240
gcacagacgg caacagcgcc ggacattcgg ggaacaacat cctcggttcc gaagtggcct 42300
tatttgcagg gattgcttca ggatgcatca tcttcatcgt catcatcatc acgctggtgg 42360
tcctcttgct gaagtaccgg aggagacaca ggaagcactc gccgcagcac acgaccacgc 42420
tgtcgctcag cacactggcc acacccaagc gcagcggcaa caacaacggc tcagagccca 42480
gtgacattat catcccgcta aggactgcgg acagcgtctt ctgccctcac tacgagaagg 42540
tcagcgggga ctacgggcac ccggtgtaca tcgtccagga gatgcccccg cagagcccgg 42600
cgaacattta ctacaaggtc tgagagggac cctggtggta cctgtgcttt cccagaggac 42660
acctaatgtc ccgatgcctc ccttgagggt ttgagagccc gcgtgctgga gaattgactg 42720
aagcacagca ccgggggaga gggacactcc tcctcggaag agcccgtcgc gctggacagc 42780
ttacctagtc ttgtagcatt cggccttggt gaacacacac gctccctgga agctggaaga 42840
ctgtgcagaa gacgcccatt cggactgctg tgccgcgtcc cacgtctcct cctcgaagcc 42900
atgtgctgcg gtcactcagg cctctgcaga agccaaggga agacagtggt ttgtggacga 42960
gagggctgtg agcatcctgg caggtgcccc aggatgccac gcctggaagg gccggcttct 43020
gcctggggtg catttccccc gcagtgcata ccggacttgt cacacggacc tcgggctagt 43080
taaggtgtgc aaagatctct agagtttagt ccttactgtc tcactcgttc tgttacccag 43140
ggctctgcag cacctcacct gagacctcca ctccacatct gcatcactca tggaacactc 43200
atgtctggag tcccctcctc cagccgctgg caacaacagc ttcagtccat gggtaatccg 43260
ttcatagaaa ttgtgtttgc taacaaggtg ccctttagcc agatgctagg ctgtctgcga 43320
agaaggctag gagttcatag aagggagtgg ggctggggaa agggctggct gcaattgcag 43380
ctcactgctg ctgcctctga aacagaaagt tggaaaggaa aaaagaaaaa agcaattagg 43440
tagcacagca ctttggtttt gctgagatcg aagaggccag taggagacac gacagcacac 43500
acagtggatt ccagtgcatg gggaggcact cgctgttatc aaatagcgat gtgcaggaag 43560
aaaagcccct cttcattccg gggaacaaag acgggtattg ttgggaaagg aacaggcttg 43620
gagggaaggg agaaagtagg ccgctgatga tatattcggg caggactgtt gtggtactgg 43680
caataagata cacagctccg agctgtagga gagtcggtct gctttggatg attttttaag 43740
cagactcagc tgctatactt atcacatttt attaaacaca gggaaagcat ttaggagaat 43800
agcagagagc caaatctgac ctaaaagttg aaaagccaaa ggtcaaacag gctgtaattc 43860
catcatcatc gttgttatta aagaatcctt atctataaaa ggtaggtcag atccccctcc 43920
ccccaggttc ctccttcccc tcccgattga gccttacgac actttggttt atgcggtgct 43980
gtccgggtgc cagggctgca gggtcggtac tgatggaggc tgcagcgccc ggtgctctgt 44040
gtcaaggtga agcacatacg gcagacctct tagagtcctt aagacggaag taaattatga 44100
tgtccagggg gagaaggaag ataggacgta tttataatag gtatatagaa cacaagggat 44160
ataaaatgaa agatttttac taatatatat tttaaggttg cacacagtac acaccagaag 44220
atgtgaaatt catttgtggc aattaagtgg tcccaatgct cagcgcttaa aaaaacaaat 44280
tggacagcta cttctgggaa aaacaacatc attccaaaaa gaacaataat gagagcaaat 44340
gcaaaaataa ccaagtcctc cgaaggcatc tcacggaacc gtagactagg aagtacgagc 44400
cccacagagc aggaagccga tgtgactgca tcatatattt aacaatgaca agatgttccg 44460
gcgtttattt ctgcgttggg ttttcccttg ccttatgggc tgaagtgttc tctagaatcc 44520
agcaggtcac actgggggct tcaggtgacg atttagctgt ggctccctcc tcctgtcctc 44580
ccccgcaccc cctcccttct gggaaacaag aagagtaaac aggaaaccta ctttttatgt 44640
gctatgcaaa atagacatct ttaacatagt cctgttacta tggtaacact ttgctttctg 44700
aattggaagg gaaaaaaaat gtagcgacag cattttaagg ttctcagacc tccagtgagt 44760
acctgcaaaa atgagttgtc acagaaatta tgatcctcta tttcctgaac ctggaaatga 44820
tgttggtcca aagtgcgtgt gtgtatgtgt gagtgggtgc gtggtataca tgtgtacata 44880
tatgtataat atatatctac aatatatatt atatatatct atatcatatt tctgtggagg 44940
gttgccatgg taaccagcca cagtacatat gtaattcttt ccatcacccc aacctctcct 45000
ttctgtgcat tcatgcaaga gtttcttgta agccatcaga agttactttt aggatggggg 45060
agaggggcga gaaggggaaa aatgggaaat agtctgattt taatgaaatc aaatgtatgt 45120
atcatcagtt ggctacgttt tggttctatg ctaaactgtg aaaaatcaga tgaattgata 45180
aaagagttcc ctgcaaccaa ttgaaaagtg ttctgtgcgt ctgttttgtg tctggtgcag 45240
aatatgacaa tctaccaact gtccctttgt ttgaagttgg tttagctttg gaaagttact 45300
gtaaatgcct tgcttgtatg atcgtccctg gtcacccgac tttggaattt gcaccatcat 45360
gtttcagtga agatgctgta aataggttca gattttactg tctatggatt tggggtgtta 45420
cagtagcctt attcaccttt ttaataaaaa tacacatgaa aacaagaaag aaatggcttt 45480
tcttacccag attgtgtaca tagagcaatg ttggtttttt ataaagtcta agcaagatgt 45540
tttgtataaa atctgaattt tgcaatgtat ttagctacag cttgtttaac ggcagtgtca 45600
ttcccctttg cactgtaatg aggaaaaaat ggtataaaag gttgccaaat tgctgcatat 45660
ttgtgccgta attatgtacc atgaatattt atttaaaatt tcgttgtcca atttgtaagt 45720
aacacagtat tatgcctgag ttataaatat ttttttcttt ctttgtttta ttttaatagc 45780
ctgtcatagg ttttaaatct gctttagttt cacattgcag ttagccccag aaaatgaaat 45840
ccgtgaagtc acattccaca tctgtttcaa actgaatttg ttcttaaaaa aataaaatat 45900
ttttttccta tggaaaaa 45918
<210> 102
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 针对小鼠肝配蛋白B2(EFNB2)的反义寡核苷酸
<400> 102
tcatagctag cattcg 16
<210> 103
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 针对小鼠肝配蛋白B2(EFNB2)的反义寡核苷酸
<400> 103
atcgtgaaag agtagt 16
<210> 104
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的5'末端的5'-N1-的反义寡核苷酸序列
<400> 104
aattctagac cccagaggt 19
<210> 105
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的5'末端的5'-N1-的反义寡核苷酸序列
<400> 105
attctagacc ccagaggt 18
<210> 106
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的5'末端的5'-N1-的反义寡核苷酸序列
<400> 106
ttctagaccc cagaggt 17
<210> 107
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的5'末端的5'-N1-的反义寡核苷酸序列
<400> 107
tctagacccc agaggt 16
<210> 108
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的5'末端的5'-N1-的反义寡核苷酸序列
<400> 108
ctagacccca gaggt 15
<210> 109
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的5'末端的5'-N1-的反义寡核苷酸序列
<400> 109
tagaccccag aggt 14
<210> 110
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的5'末端的5'-N1-的反义寡核苷酸序列
<400> 110
agaccccaga ggt 13
<210> 111
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的5'末端的5'-N1-的反义寡核苷酸序列
<400> 111
gaccccagag gt 12
<210> 112
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的5'末端的5'-N1-的反义寡核苷酸序列
<400> 112
accccagagg t 11
<210> 113
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的5'末端的5'-N1-的反义寡核苷酸序列
<400> 113
ccccagaggt 10
<210> 114
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的3'末端的-N2-3' 的反义寡核苷酸序列
<400> 114
aattcttgaa acttgatgg 19
<210> 115
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的3'末端的-N2-3'的反义寡核苷酸序列
<400> 115
aattcttgaa acttgatg 18
<210> 116
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的3'末端的-N2-3'的反义寡核苷酸序列
<400> 116
aattcttgaa acttgat 17
<210> 117
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的3'末端的-N2-3'的反义寡核苷酸序列
<400> 117
aattcttgaa acttga 16
<210> 118
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的3'末端的-N2-3'的反义寡核苷酸序列
<400> 118
aattcttgaa acttg 15
<210> 119
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的3'末端的-N2-3'的反义寡核苷酸序列
<400> 119
aattcttgaa actt 14
<210> 120
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的3'末端的-N2-3'的反义寡核苷酸序列
<400> 120
aattcttgaa act 13
<210> 121
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的3'末端的-N2-3'的反义寡核苷酸序列
<400> 121
aattcttgaa ac 12
<210> 122
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的3'末端的-N2-3'的反义寡核苷酸序列
<400> 122
aattcttgaa a 11
<210> 123
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1 5'-N1-TAGGGCTG-N2-3'的3'末端的-N2-3'的反义寡核苷酸序列
<400> 123
aattcttgaa 10
<210> 124
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的5'末端的5'-N1A的反义寡核苷酸序列
<400> 124
aaattctaga ccccagagg 19
<210> 125
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的5'末端的5'-N1A的反义寡核苷酸序列
<400> 125
aattctagac cccagagg 18
<210> 126
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的5'末端的5'-N1A-的反义寡核苷酸序列
<400> 126
attctagacc ccagagg 17
<210> 127
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的5'末端的5'-N1A-的反义寡核苷酸序列
<400> 127
ttctagaccc cagagg 16
<210> 128
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的5'末端的5'-N1A-的反义寡核苷酸序列
<400> 128
tctagacccc agagg 15
<210> 129
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的5'末端的5'-N1A-的反义寡核苷酸序列
<400> 129
ctagacccca gagg 14
<210> 130
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的5'末端的5'-N1A-的反义寡核苷酸序列
<400> 130
tagaccccag agg 13
<210> 131
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的5'末端的5'-N1A-的反义寡核苷酸序列
<400> 131
agaccccaga gg 12
<210> 132
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的5'末端的5'-N1A-的反义寡核苷酸序列
<400> 132
gaccccagag g 11
<210> 133
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的5'末端的5'-N1A-的反义寡核苷酸序列
<400> 133
accccagagg 10
<210> 134
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的3'末端的-N2A-3'的反义寡核苷酸序列
<400> 134
gaattcttga aacttgatg 19
<210> 135
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的3'末端的-N2A-3'的反义寡核苷酸序列
<400> 135
gaattcttga aacttgat 18
<210> 136
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的3'末端的-N2A-3'的反义寡核苷酸序列
<400> 136
gaattcttga aacttga 17
<210> 137
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的3'末端的-N2A-3'的反义寡核苷酸序列
<400> 137
gaattcttga aacttg 16
<210> 138
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的3'末端的-N2A-3'的反义寡核苷酸序列
<400> 138
gaattcttga aactt 15
<210> 139
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的3'末端的-N2A-3'的反义寡核苷酸序列
<400> 139
gaattcttga aact 14
<210> 140
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的3'末端的-N2A-3'的反义寡核苷酸序列
<400> 140
gaattcttga aac 13
<210> 141
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的3'末端的-N2A-3'的反义寡核苷酸序列
<400> 141
gaattcttga aa 12
<210> 142
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的3'末端的-N2A-3'的反义寡核苷酸序列
<400> 142
gaattcttga a 11
<210> 143
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1A 5'-N1A-TTAGGGCT-N2A-3'的3'末端的-N2A-3'的反义寡核苷酸序列
<400> 143
gaattcttga 10
<210> 144
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的5'末端的5'-N1B-的反义寡核苷酸序列
<400> 144
gaaattctag accccagag 19
<210> 145
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的5'末端的5'-N1B-的反义寡核苷酸序列
<400> 145
aaattctaga ccccagag 18
<210> 146
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的5'末端的5'-N1B-的反义寡核苷酸序列
<400> 146
aattctagac cccagag 17
<210> 147
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的5'末端的5'-N1B-的反义寡核苷酸序列
<400> 147
attctagacc ccagag 16
<210> 148
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的5'末端的5'-N1B-的反义寡核苷酸序列
<400> 148
ttctagaccc cagag 15
<210> 149
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的5'末端的5'-N1B-的反义寡核苷酸序列
<400> 149
tctagacccc agag 14
<210> 150
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的5'末端的5'-N1B-的反义寡核苷酸序列
<400> 150
ctagacccca gag 13
<210> 151
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的5'末端的5'-N1B-的反义寡核苷酸序列
<400> 151
tagaccccag ag 12
<210> 152
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的5'末端的5'-N1B-的反义寡核苷酸序列
<400> 152
agaccccaga g 11
<210> 153
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的5'末端的5'-N1B-的反义寡核苷酸序列
<400> 153
gaccccagag 10
<210> 154
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的3'末端的-N2B-3'的反义寡核苷酸序列
<400> 154
tgaattcttg aaacttgat 19
<210> 155
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的3'末端的-N2B-3'的反义寡核苷酸序列
<400> 155
tgaattcttg aaacttga 18
<210> 156
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的3'末端的-N2B-3'的反义寡核苷酸序列
<400> 156
tgaattcttg aaacttg 17
<210> 157
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的3'末端的-N2B-3'的反义寡核苷酸序列
<400> 157
tgaattcttg aaactt 16
<210> 158
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的3'末端的-N2B-3'的反义寡核苷酸序列
<400> 158
tgaattcttg aaact 15
<210> 159
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的3'末端的-N2B-3'的反义寡核苷酸序列
<400> 159
tgaattcttg aaac 14
<210> 160
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的3'末端的-N2B-3'的反义寡核苷酸序列
<400> 160
tgaattcttg aaa 13
<210> 161
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的3'末端的-N2B-3'的反义寡核苷酸序列
<400> 161
tgaattcttg aa 12
<210> 162
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的3'末端的-N2B-3'的反义寡核苷酸序列
<400> 162
tgaattcttg a 11
<210> 163
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S1B 5'-N1B-GTTAGGGC-N2B-3'的3'末端的-N2B-3'的反义寡核苷酸序列
<400> 163
tgaattcttg 10
<210> 164
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的5'末端的5'-N3-的反义寡核苷酸序列
<400> 164
gaccagggac gatcataca 19
<210> 165
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的5'末端的5'-N3-的反义寡核苷酸序列
<400> 165
accagggacg atcataca 18
<210> 166
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的5'末端的5'-N3-的反义寡核苷酸序列
<400> 166
ccagggacga tcataca 17
<210> 167
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的5'末端的5'-N3-的反义寡核苷酸序列
<400> 167
cagggacgat cataca 16
<210> 168
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的5'末端的5'-N3-的反义寡核苷酸序列
<400> 168
agggacgatc ataca 15
<210> 169
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的5'末端的5'-N3-的反义寡核苷酸序列
<400> 169
gggacgatca taca 14
<210> 170
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的5'末端的5'-N3-的反义寡核苷酸序列
<400> 170
ggacgatcat aca 13
<210> 171
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的5'末端的5'-N3-的反义寡核苷酸序列
<400> 171
gacgatcata ca 12
<210> 172
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的5'末端的5'-N3-的反义寡核苷酸序列
<400> 172
acgatcatac a 11
<210> 173
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的5'末端的5'-N3-的反义寡核苷酸序列
<400> 173
cgatcataca 10
<210> 174
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的3'末端的-N4-3'-的反义寡核苷酸序列
<400> 174
atttacagta actttacaa 19
<210> 175
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的3'末端的-N4-3'-的反义寡核苷酸序列
<400> 175
atttacagta actttaca 18
<210> 176
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的3'末端的-N4-3'-的反义寡核苷酸序列
<400> 176
atttacagta actttac 17
<210> 177
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的3'末端的-N4-3'-的反义寡核苷酸序列
<400> 177
atttacagta acttta 16
<210> 178
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的3'末端的-N4-3'-的反义寡核苷酸序列
<400> 178
atttacagta acttt 15
<210> 179
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的3'末端的-N4-3'-的反义寡核苷酸序列
<400> 179
atttacagta actt 14
<210> 180
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的3'末端的-N4-3'-的反义寡核苷酸序列
<400> 180
atttacagta act 13
<210> 181
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的3'末端的-N4-3'-的反义寡核苷酸序列
<400> 181
atttacagta ac 12
<210> 182
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的3'末端的-N4-3'-的反义寡核苷酸序列
<400> 182
atttacagta a 11
<210> 183
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2 5'-N3-AGCAAGGC-N4-3'的3'末端的-N4-3'-的反义寡核苷酸序列
<400> 183
atttacagta 10
<210> 184
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的5'末端的5'-N3A-的反义寡核苷酸序列
<400> 184
tgaccaggga cgatcatac 19
<210> 185
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的5'末端的5'-N3A-的反义寡核苷酸序列
<400> 185
gaccagggac gatcatac 18
<210> 186
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的5'末端的5'-N3A-的反义寡核苷酸序列
<400> 186
accagggacg atcatac 17
<210> 187
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的5'末端的5'-N3A-的反义寡核苷酸序列
<400> 187
ccagggacga tcatac 16
<210> 188
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的5'末端的5'-N3A-的反义寡核苷酸序列
<400> 188
cagggacgat catac 15
<210> 189
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的5'末端的5'-N3A-的反义寡核苷酸序列
<400> 189
agggacgatc atac 14
<210> 190
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的5'末端的5'-N3A-的反义寡核苷酸序列
<400> 190
gggacgatca tac 13
<210> 191
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的5'末端的5'-N3A-的反义寡核苷酸序列
<400> 191
ggacgatcat ac 12
<210> 192
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的5'末端的5'-N3A-的反义寡核苷酸序列
<400> 192
gacgatcata c 11
<210> 193
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的5'末端的5'-N3A-的反义寡核苷酸序列
<400> 193
acgatcatac 10
<210> 194
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的3'末端的-N4A-3'的反义寡核苷酸序列
<400> 194
catttacagt aactttaca 19
<210> 195
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的3'末端的-N4A-3'的反义寡核苷酸序列
<400> 195
catttacagt aactttac 18
<210> 196
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的3'末端的-N4A-3'的反义寡核苷酸序列
<400> 196
catttacagt aacttta 17
<210> 197
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的3'末端的-N4A-3'的反义寡核苷酸序列
<400> 197
catttacagt aacttt 16
<210> 198
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的3'末端的-N4A-3'的反义寡核苷酸序列
<400> 198
catttacagt aactt 15
<210> 199
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的3'末端的-N4A-3'的反义寡核苷酸序列
<400> 199
catttacagt aact 14
<210> 200
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的3'末端的-N4A-3' 的反义寡核苷酸序列
<400> 200
catttacagt aac 13
<210> 201
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的3'末端的-N4A-3'的反义寡核苷酸序列
<400> 201
catttacagt aa 12
<210> 202
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的3'末端的-N4A-3'的反义寡核苷酸序列
<400> 202
catttacagt a 11
<210> 203
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2A 5'-N3A-AAGCAAGG-N4A-3'的3'末端的-N4A-3'的反义寡核苷酸序列
<400> 203
catttacagt 10
<210> 204
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的5'末端的5'-N3B-的反义寡核苷酸序列
<400> 204
accagggacg atcatacaa 19
<210> 205
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的5'末端的5'-N3B-的反义寡核苷酸序列
<400> 205
ccagggacga tcatacaa 18
<210> 206
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的5'末端的5'-N3B-的反义寡核苷酸序列
<400> 206
cagggacgat catacaa 17
<210> 207
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的5'末端的5'-N3B-的反义寡核苷酸序列
<400> 207
agggacgatc atacaa 16
<210> 208
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的5'末端的5'-N3B-的反义寡核苷酸序列
<400> 208
gggacgatca tacaa 15
<210> 209
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的5'末端的5'-N3B-的反义寡核苷酸序列
<400> 209
ggacgatcat acaa 14
<210> 210
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的5'末端的5'-N3B-的反义寡核苷酸序列
<400> 210
gacgatcata caa 13
<210> 211
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的5'末端的5'-N3B-的反义寡核苷酸序列
<400> 211
acgatcatac aa 12
<210> 212
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的5'末端的5'-N3B-的反义寡核苷酸序列
<400> 212
cgatcataca a 11
<210> 213
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的5'末端的5'-N3B-的反义寡核苷酸序列
<400> 213
gatcatacaa 10
<210> 214
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的3'末端的-N4B-3'的反义寡核苷酸序列
<400> 214
tttacagtaa ctttacaaa 19
<210> 215
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的3'末端的-N4B-3'的反义寡核苷酸序列
<400> 215
tttacagtaa ctttacaa 18
<210> 216
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的3'末端的-N4B-3'的反义寡核苷酸序列
<400> 216
tttacagtaa ctttaca 17
<210> 217
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的3'末端的-N4B-3'的反义寡核苷酸序列
<400> 217
tttacagtaa ctttac 16
<210> 218
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的3'末端的-N4B-3'的反义寡核苷酸序列
<400> 218
tttacagtaa cttta 15
<210> 219
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的3'末端的-N4B-3'的反义寡核苷酸序列
<400> 219
tttacagtaa cttt 14
<210> 220
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的3'末端的-N4B-3'的反义寡核苷酸序列
<400> 220
tttacagtaa ctt 13
<210> 221
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的3'末端的-N4B-3'的反义寡核苷酸序列
<400> 221
tttacagtaa ct 12
<210> 222
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的3'末端的-N4B-3'的反义寡核苷酸序列
<400> 222
tttacagtaa c 11
<210> 223
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S2B 5'-N3B-GCAAGGCA-N4B-3'的3'末端的-N4B-3'的反义寡核苷酸序列
<400> 223
tttacagtaa 10
<210> 224
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的5'末端的5'-N5-的反义寡核苷酸序列
<400> 224
agctgtagct aaatacatt 19
<210> 225
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的5'末端的5'-N5-的反义寡核苷酸序列
<400> 225
gctgtagcta aatacatt 18
<210> 226
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的5'末端的5'-N5-的反义寡核苷酸序列
<400> 226
ctgtagctaa atacatt 17
<210> 227
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的5'末端的5'-N5-的反义寡核苷酸序列
<400> 227
tgtagctaaa tacatt 16
<210> 228
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的5'末端的5'-N5-的反义寡核苷酸序列
<400> 228
gtagctaaat acatt 15
<210> 229
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的5'末端的5'-N5-的反义寡核苷酸序列
<400> 229
tagctaaata catt 14
<210> 230
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的5'末端的5'-N5-的反义寡核苷酸序列
<400> 230
agctaaatac att 13
<210> 231
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的5'末端的5'-N5-的反义寡核苷酸序列
<400> 231
gctaaataca tt 12
<210> 232
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的5'末端的5'-N5-的反义寡核苷酸序列
<400> 232
ctaaatacat t 11
<210> 233
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的5'末端的5'-N5-的反义寡核苷酸序列
<400> 233
taaatacatt 10
<210> 234
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的3'末端的-N6-3'的反义寡核苷酸序列
<400> 234
cagattttat acaaaacat 19
<210> 235
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的3'末端的-N6-3'的反义寡核苷酸序列
<400> 235
cagattttat acaaaaca 18
<210> 236
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的3'末端的-N6-3'的反义寡核苷酸序列
<400> 236
cagattttat acaaaac 17
<210> 237
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的3'末端的-N6-3'的反义寡核苷酸序列
<400> 237
cagattttat acaaaa 16
<210> 238
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的3'末端的-N6-3'的反义寡核苷酸序列
<400> 238
cagattttat acaaa 15
<210> 239
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的3'末端的-N6-3'的反义寡核苷酸序列
<400> 239
cagattttat acaa 14
<210> 240
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的3'末端的-N6-3'的反义寡核苷酸序列
<400> 240
cagattttat aca 13
<210> 241
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的3'末端的-N6-3'的反义寡核苷酸序列
<400> 241
cagattttat ac 12
<210> 242
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的3'末端的-N6-3'的反义寡核苷酸序列
<400> 242
cagattttat a 11
<210> 243
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3 5'-N5-GCAAAATT-N6-3'的3'末端的-N6-3'的反义寡核苷酸序列
<400> 243
cagattttat 10
<210> 244
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的5'末端的5'-N5A-的反义寡核苷酸序列
<400> 244
gctgtagcta aatacattg 19
<210> 245
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的5'末端的5'-N5A-的反义寡核苷酸序列
<400> 245
ctgtagctaa atacattg 18
<210> 246
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的5'末端的5'-N5A-的反义寡核苷酸序列
<400> 246
tgtagctaaa tacattg 17
<210> 247
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的5'末端的5'-N5A-的反义寡核苷酸序列
<400> 247
gtagctaaat acattg 16
<210> 248
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的5'末端的5'-N5A-的反义寡核苷酸序列
<400> 248
tagctaaata cattg 15
<210> 249
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的5'末端的5'-N5A-的反义寡核苷酸序列
<400> 249
agctaaatac attg 14
<210> 250
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的5'末端的5'-N5A-的反义寡核苷酸序列
<400> 250
gctaaataca ttg 13
<210> 251
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的5'末端的5'-N5A-的反义寡核苷酸序列
<400> 251
ctaaatacat tg 12
<210> 252
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的5'末端的5'-N5A-的反义寡核苷酸序列
<400> 252
taaatacatt g 11
<210> 253
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的3'末端的-N6A-3'的反义寡核苷酸序列
<400> 253
agattttata caaaacatc 19
<210> 254
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的3'末端的-N6A-3'的反义寡核苷酸序列
<400> 254
agattttata caaaacat 18
<210> 255
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的3'末端的-N6A-3'的反义寡核苷酸序列
<400> 255
agattttata caaaaca 17
<210> 256
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的3'末端的-N6A-3'的反义寡核苷酸序列
<400> 256
agattttata caaaac 16
<210> 257
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的3'末端的-N6A-3'的反义寡核苷酸序列
<400> 257
agattttata caaaa 15
<210> 258
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的3'末端的-N6A-3'的反义寡核苷酸序列
<400> 258
agattttata caaa 14
<210> 259
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的3'末端的-N6A-3'的反义寡核苷酸序列
<400> 259
agattttata caa 13
<210> 260
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的3'末端的-N6A-3'的反义寡核苷酸序列
<400> 260
agattttata ca 12
<210> 261
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的3'末端的-N6A-3'的反义寡核苷酸序列
<400> 261
agattttata c 11
<210> 262
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的3'末端的-N6A-3'的反义寡核苷酸序列
<400> 262
agattttata 10
<210> 263
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的5'末端的5'-N5B-的反义寡核苷酸序列
<400> 263
ctgtagctaa atacattgc 19
<210> 264
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的5'末端的5'-N5B-的反义寡核苷酸序列
<400> 264
tgtagctaaa tacattgc 18
<210> 265
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的5'末端的5'-N5B-的反义寡核苷酸序列
<400> 265
gtagctaaat acattgc 17
<210> 266
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的5'末端的5'-N5B-的反义寡核苷酸序列
<400> 266
tagctaaata cattgc 16
<210> 267
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的5'末端的5'-N5B-的反义寡核苷酸序列
<400> 267
agctaaatac attgc 15
<210> 268
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的5'末端的5'-N5B-的反义寡核苷酸序列
<400> 268
gctaaataca ttgc 14
<210> 269
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的5'末端的5'-N5B-的反义寡核苷酸序列
<400> 269
ctaaatacat tgc 13
<210> 270
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的5'末端的5'-N5B-的反义寡核苷酸序列
<400> 270
taaatacatt gc 12
<210> 271
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的5'末端的5'-N5B-的反义寡核苷酸序列
<400> 271
aaatacattg c 11
<210> 272
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的3'末端的-N6B-3'的反义寡核苷酸序列
<400> 272
gattttatac aaaacatct 19
<210> 273
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的3'末端的-N6B-3'的反义寡核苷酸序列
<400> 273
gattttatac aaaacatc 18
<210> 274
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的3'末端处的-N6B-3'的反义寡核苷酸序列
<400> 274
gattttatac aaaacat 17
<210> 275
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的3'末端的-N6B-3'的反义寡核苷酸序列
<400> 275
gattttatac aaaaca 16
<210> 276
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的3'末端的-N6B-3'的反义寡核苷酸序列
<400> 276
gattttatac aaaac 15
<210> 277
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的3'末端的-N6B-3'的反义寡核苷酸序列
<400> 277
gattttatac aaaa 14
<210> 278
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的3'末端的-N6B-3'的反义寡核苷酸序列
<400> 278
gattttatac aaa 13
<210> 279
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的3'末端的-N6B-3'的反义寡核苷酸序列
<400> 279
gattttatac aa 12
<210> 280
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的3'末端的-N6B-3'的反义寡核苷酸序列
<400> 280
gattttatac a 11
<210> 281
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的3'末端的-N6B-3'的反义寡核苷酸序列
<400> 281
gattttatac 10
<210> 282
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 阴性对照
<400> 282
aacacgtcta tacgc 15
<210> 283
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于PCR定量PCR的引物: 小鼠β-肌动蛋白_Fwd
<400> 283
gaaatcgtgc gtgacatcaa ag 22
<210> 284
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于PCR定量PCR的引物: 小鼠β-肌动蛋白_Rvr
<400> 284
tgtagtttca tggatgccac ag 22
<210> 285
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 用于PCR定量PCR的引物: 小鼠Efnb2-1_Fwd
<400> 285
attatttgcc ccaaagtgga ctc 23
<210> 286
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于PCR定量PCR的引物: 小鼠Efnb2-1_Rvs
<400> 286
gcagcggggt attctccttc 20
<210> 287
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3A 5'-N5A-CAAAATTC-N6A-3'的5'末端的5'-N5A-的反义寡核苷酸序列
<400> 287
aaatacattg 10
<210> 288
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 代表在通式S3B 5'-N5B-AAAATTCA-N6B-3'的5'末端的5'-N5B-的反义寡核苷酸序列
<400> 288
aatacattgc 10
<210> 289
<211> 44008
<212> DNA
<213> 小家鼠
<400> 289
gctgactctc cgcggcgggg acagaggcac cggtcggatc gcggagctgc gcgcagagcg 60
ggtcctggcg ccctccccgc acacaaaggc ccgcgcgcgt cagacgcctg cgggggttcc 120
agtgctctcc tgactgctta gtggccgcga gttgcgagga ttcaggaggc gccctttatc 180
tctgcgctcc aggacatgga accgcgccga cgcggcgctc gcttgcccgg gccactgccc 240
gctgtcctgg atctatagtc aggcggcccc tctcggggag cagcacccgc cgcctcacac 300
cgactcgtct ctccgctgcg ggcctttgtc ccggcccagt gccctcgccg cgcccgccct 360
ccgcggctgg cccggcaccc tggagccgca cgggagccga ctgtcccagc tgcgtccggc 420
gcagcgcccc ggagccccga gtccgccgag ccgccgcgcc ccgcgcgttc gaccccaccc 480
cgcgcgctga gggacgcgca gggtgagcgc acctggcctc ggcgaccgcg ggagcggcgc 540
ggcgtgtccg ccccggagga ttgggggtcg ctgcccgcgg ccggtcccaa cgcgtcccgg 600
agtgcgcaga actgggagcg gcttgggcat ggccatggcc cggtccagga gggactctgt 660
gtggaagtac tgttggggac ttttgatggt tttgtgcaga actgcgatct ccagatcgat 720
agttttagag cctatctact ggaattcctc gaactccaag taagtggtgt ccacgagcct 780
tctctcttcc gcggtgccct cggccggcgc ccggggtacg ctgtatggtc cgggcgggag 840
gaggccttgg accctgtttc tagaacctgg ggctcctgtc ccctatcccc cacccttcca 900
catttctcta ggtggggacc ggttgatctt gagagcgcgg gttccaaggg tactctaatt 960
aggctccaac ctcaagtgct ctaggagtcc caaagccctg gcgacttggt ggcatgcccg 1020
gtaaggtgtc tgatggcgct acccggcctc ctttcttttt cgaggacgga ggacgttgcc 1080
actaacgggg ctacagacac acattggcgg gctccgagag atgctgcgct tgcgaggagc 1140
gcgggagcca cgggccgggg cccagcgaga aggcgacaag aactgagagt ctggggtggt 1200
ggagcgtccc ttagaggaag ggagctgggc ccggggcgtc cctgagccgg gatacctcgg 1260
cgccttcttg ctagcccgaa tgtgcgcggg gagctcgatg gctcagccag agagctcagg 1320
cggcgagctc tctgcatgtc ggcctctccc ttcgcgtcgg aactggtggt ctaggtccag 1380
tgcggcgcgg tccacttagg tggcttaatt ttaacgacgc cttcagggcc ctacccagtc 1440
aacgctgcag cctttgcact tggggaatcg ggagtcagac ttgcttttag caaagcgcac 1500
agtcgggaga aaaccaggcc tgagactaac tttcaggtct ggtctccctg agtgcgctcc 1560
ttgtttcgaa aatgctagcc atcccttgga atacgcagcc atggccccag taaccgtgcc 1620
tgggtgctgc ttcttacctc atttcccaac caccgccaga aagtgctgtg cggaattctg 1680
gactcagccc taggagagcg tggagacgcg gctggctcct ggttggagtc agacctttca 1740
gattagaagc aaaatcaatg gcctaattgg agttgagcgt gcggtgcacg gcttcagagt 1800
agaggtgaac gaattgtttt tgaaattacc acataagcaa agaattgtac ctactctctt 1860
gaaagtggta aatttcaaat tcagcaacat aattgaccaa acacgtttcc cttcgaaagg 1920
gcaaaaaaat ctatagttgt aaatgactca aaacattttt tttttttttg cctgctgcca 1980
ggaggccctt gttttaaact tactgcggcc cccctctaac gtagtcttga tctgttaaag 2040
aattttttcg ttttgttttg ttttttaaag caaggtgttg catttgctct cctggcgtgg 2100
tatctttgca tccacacggg atctacaggc acctggtggt gcccgaaggc gcctggctgg 2160
gatctgagcg ctgcagcctt tgccattcgg actggggccc tggtggtagc tgctgctgac 2220
gctcgcggtg cctacagagg tcacccttcc ctgccgaatg ctagctatga gcgcgcccat 2280
ccccccatcc cttccctggg ctgcctccct ctctccactt tgcactttca ctcacagcct 2340
cttttgggga ggccgagtct cccccccccc ccccactgcc tagatttaat atttatattt 2400
aagtctaatt taaagaaatt cccattaaac cccttctgag taacataacc atcttttctg 2460
ttcatagtga ccactatact tgggtgtgca gacggaagga ttagaaatac tgatttgttt 2520
aaacagcact gccaccaagt gcacgtagca cttggagaat catgtctttg atttgaaacc 2580
tgttatgtta gggagggatt tgatcttcaa caggatagtt ttccgagctg tggccacaga 2640
tgtatagaga gctgctaggg ccctgggttt tggaggagca ggcctccctg taccgtgcag 2700
ttgtgtgatt actccctggc ctccacaata aaatgtctta gaattttctt gaggatggct 2760
ggaagtcttt ggaaagcctg tggctgaatg ctgtctgtga gatcagaaag acttcttcct 2820
cggaagagta acacaaaaga gccttttagt ttttagtgcc tggcatcgcc tcccttgttc 2880
actttttcag agaaaagttt ctgtaggtaa aatgtggcag gtaggtagcc agacgcttgg 2940
aagctttacc ttactttgca tgaacaagtc acttgtcatg aaacaggcat tggtaattag 3000
atttgtttca ttctggggtc agccttttta gcaggtggtc gacacaggga gcatgcagca 3060
gctgcttgct tgtagagccc agagaatcct ttgtaaactg gagtctccat aactacttta 3120
atcacattgc ctgccatccc atcctggaga gtttatgtaa taatcagaag ttctgtgtac 3180
tcaaagatta tgtggctgcc ctgtcagatt agtcacattg tatctgaaga tgtgggcgct 3240
gtttaggtca cttttcaact atttttaagt tctggaaaga gttgcaaagc ctggcaacca 3300
tttctaatta acatttcagt agaaccccct ccccactgta gtgtcttagc cggaataaag 3360
cggtgcctgc ttgttgtggt tttgatgggt agtagtttca cttgggctta gcaactctac 3420
actggcagag gattctaaaa gaaattacac ccttgaatat ttccttccag tattaattta 3480
tgtctggttt ttttttttaa ttctataagt cacacataca tactagttaa tttacagagc 3540
actgtgcttt tcccatgcaa tgtttttcca cacataatac tgaattcctg aaattgattg 3600
agttgataca aaagaatggc tggataatat ccagataacc tgaaacacag gcctctccct 3660
agtcaggctc tgaataaata caggcctgtc aaattgataa actaaactac aatggatagc 3720
actgcttaaa taaccggtca ataacgcata tacgccagcc taccttctat tgtgtctgaa 3780
attcctattt ttgtagataa acaaatacag attcagcatt gattgaatag ccccttgaac 3840
tatgctccac agtttgcatt tgggccaatc ttgttggttt taatatagag aggggggaaa 3900
aaagcaaacc agaaagcacc ggggttggga ttggtactgc ctcacatcca cactcctcac 3960
gctttgtcag gatgataaac tatgggttgt gcgttgtcct tgttccacag cagagcctgg 4020
cagaacacaa agacaaatgt ggatgccttt tcagatgaga atctgagagt catgtgtcct 4080
gggactgaac ttcttaacct cctgcaatta cagcttccag cccccaaagg agagttgagg 4140
ctaagataat ttgctaggca cttggttcta aatctttgac aaagcttagc tcttgacact 4200
tgtcctacta atgcaaagaa atgcaaatga ccctggtgga tctgactcgg tagctggagc 4260
tcgaaagaca ggtgaatttt aagcatcccc aggaaccccc tgaaaaccgc gtgttggaat 4320
gggtttatta gctttcctag agcctcttcg cacactaaga cgaatcctgt tgctggatcc 4380
acaggatagc ctccttcaga ctagcactga gggccctgca gtaactaaat ccttgttgtc 4440
taatcttcag ctgaaatatt tcgggttgct ctccggagct taatctgaca cctgacttga 4500
agctgcattt cagaaggcat tctcggaatg ggagactatt ccagatccga gcatgactgc 4560
agggcatcgt cacagaagtg ggagtggcag ggaacagcat atatagactg taggccctgg 4620
gaaaagaatt gttttaagga acaatatttc tttgacattc taatgaaaac tttattctta 4680
aaatatctaa ttacgaattg gacactaaca agcctcttct ccaaaagatt attaaaatgt 4740
ctccagttac cgcctgcctt tgctgcctgc ataaagaacc tgtttttcag gccacttata 4800
ttcctgcata aagagaagtg ttggactgtt taaaatattt tgattaaaat atgcagatcc 4860
ggtagaactg taagcttcta gagagaagtg agctctctct aggtaggttc ccctcccccc 4920
ataaaggggt ggattagacc ccacccccca ccccccaccc ccgcccaggc aaggaataag 4980
aacaacccca aaggaaggct agcaaacgag acgtgttccg aacagcttgg aaaaaactcc 5040
tgtggcttca ttgtctctgc aaagccgaag aatacaaaag caagcagtca gcccttctcc 5100
cgtgatggga gatgcaaacc gttgacacgg ctcccctgtt taacttgttt aattctcatt 5160
ttaaattcag cactatacca gccgtgtgaa ctctgaagat ttctttagta atccattttg 5220
tagttcggaa tcaaaaacaa agtgaaaggg tctgacacaa tttgctttta tttttaggca 5280
aatcaaccct ggtcatagtt aataagggga ttacaaccca gactacgtct ttacagatgt 5340
aaagtaaatc aagggcagag cataaagaaa cggatccctt ttgattgaag tatggtaaaa 5400
aggcatagag gagctagcgg cagtaatctg attgtatggc aataaaacca ccattttctg 5460
tctttcagat aaaaataatg tggtaaatcc atgcagttca taagatgtaa aggcagataa 5520
aggggaagcc atggcaacat atagattagc ttgctgttag aaatgacacg tccctgaaaa 5580
gtgtgtgggg cgaaggccct cgctccaggc tgtttggtta tgtgagagcc acacagacct 5640
gggaacccgg attaagagtc atgaaagcgc cacttgtggt ctggggtggc caaagccgag 5700
aaagggagcc gtgcagttct tgctcattgg tgggagataa tatggccaag gtagctttca 5760
ttgacggcct ttttatagac cgagatggag gctgattaaa actcacagct cgctgcagtc 5820
cttagggcct ggaagctttt cctacttaac tcttggcctg acagagccag ccattctgta 5880
ggattaactg cccttcgccg cccttgcctt catctatttg ggcttcaggc agagacctgc 5940
tgggcagcaa cagagaccag aaggaggata ggtaggccct gaattatctg aaaagaaaac 6000
agaggccttt tgatttcagc tcccctcctc cccacaccgg gcggaggagg taggggttgt 6060
atctctgcac tgccaaggca aagttatgtt gttggccctt acctgggccg ctagctcttc 6120
tgtgaggttg gttttttctt tcctggaaac atttaagaaa aagaaaaata acacattacc 6180
atattgaaaa aagtaaaatt ttagtttaat tcaaataatc caaccagtag gtcaaaactt 6240
cgattccaga ggttctgggc cttcttgacc actgtgattg gtaatctgcg agttggctgg 6300
gacaggctcc ctggtggaaa tgacatgatt ataaaatgaa ggtgctgacc cacactaaag 6360
gcaagaacag gaactcttga tgctgttgac tttctgtcac tgccctctgt ccccaacagc 6420
ttgtaaggga actggacttt agtgctggtc ttccatgcta cccattttag tcaatagaca 6480
aagtgagcca ttgaatcctt gctgggttag gtgcagagtg acactcagaa ttggttcaag 6540
ccaccagaaa ggaaatattt gttttatcgt catcttttgg cattttcaga aagtctcagt 6600
atttcttcag gacaagggct ttcttcatgg agtgggtctt ggagttagtt tacacatgga 6660
atctggaagc tgtttaacag gaacatgaca ggtgaaagcc tcttctcagt ctgcttccat 6720
gcagatgata aagatcatca ttaaatagcc tctctagacc ggtttcatcc actttctccc 6780
tggttctcac cctggatcat agtttggggc tgtagatagg tacccgtacc cttgtggtct 6840
gtgtctctcg ctgctctgag aagtatgaga ggctttactg ttatatacca ctttgcatac 6900
ccaaacacct gccactctgt gccttccttt ccatctgaat tctgatcgta tacctaaaag 6960
atccattgga tttgctgaga ttcgtcaaag aggagggaca cccctaattt ataagctggt 7020
cacatcctag cacctttcat tctccgtgtg acaatgattg ctaatggccc attcaactaa 7080
agtatttgct tgttagcagg gaacagagaa tgataaatgt ccagcaagct tgccgcctcc 7140
ttcagctttt cacacacaga ctggtgcata tttatggcag gcaacccgac aaaaggagaa 7200
gctgaatcgc cttggcctcc agctttccgt taggagcagg gttaaagtga ttaaagagct 7260
atgcaagaaa gccctgcatc tgtttactaa ccgtccaggg gcgagctctt tactactttt 7320
ctgggctctc cattctatgg aacgtacctg catgatctgt ttagaagtgt cctctgtcag 7380
aatgcagggc ccagacaagt cgtgaggaag cagtgctggg ttcccagggc agcagccttc 7440
caagggttgc agtgtggaat cagcaggggc tcattcaaat attttccatg aacaaagtca 7500
aacatataat tctggtgcag agcatactgg gtctgtgata catacttggc tgatttcaaa 7560
ttttaaaacc acagtgggga aaaaagctct cttagagaaa acaggatctt tctgcccaga 7620
gtagttctct aaacagaaca ggaagagcaa acgggccgag tgaaggagat agagttcatg 7680
ccgtccatcc tcctcagctg gcatggggag agctggaaat aaatgcccag gtggcgcact 7740
ttccaagtgc tgtggctgag cccctggtga gctacacact cagaagacac ccttctcata 7800
ggcattgtaa atagattcta cacagaatgg ttaaaaactc cagctcattt tctctgttga 7860
aattcggttg tgtcacattt taattacaga atttatatca cttctctaat ggtgaagtcc 7920
atctcggcac caagacattc atctgtactt ttcatgaaca cttatcttga atctccctgg 7980
aatatgtgtg agggctcatt ctaagttctg tgcttgtgtg ttcagggagt gatgaggtat 8040
gtgtcttgtg gggtagcttg ctggctggcc tgtccccttg cgtctgtgca tttcatggag 8100
tttctctcct tcagaggcaa agttgccttt gagatggacc tctttcttct atgcactcat 8160
gggatagcag atgggcccaa ggcacagcat ggttggtcac agcacctgat aaaacgcttc 8220
agtgcttgcc tcccccaacc caccgtgtgt attaccttac tgagtcccta gcacattcat 8280
taattattga atgagcagga taaatcaggc aaatctccaa ctcaaaatgt atcaactgag 8340
aatttacaaa atgtcatttt ccgtgtaact atcatttgga tacttttagg tttcaaacaa 8400
actcctgtag gccttgaatc tcctttctgt gagaaaacag ctcatgaggg ttcttctaga 8460
agcatcctct tctgtagtat gtacaccaaa ccatctcttt ccagccttcc tttgcaatcc 8520
tgtaggcttg gcagttaacc caagtctcta tgtacagggc agtttccagg catgcgcagg 8580
tgcttaccac ctgacaaatc tggaaggcga gggcggactc tgcctcattg caacagttca 8640
ttcacttctg acccttgtgg gcatccagta actctttgtg ggatgggcag gcacagccca 8700
ggtttacatg cctgtgtctt tataacctgc tgtcagagat ccagtatcca ccctccagat 8760
ctcctgagct caaggtacca aagtcggttg ccttcaggga ttgtgaaagc tggtttctgg 8820
acccacccca gagtttctga ttcctgaggg ctagggtgga gctgagagat acacactttt 8880
aatgcaagct cccagatgct accaactact ggtggtggtg ggagaccata tgggagaatg 8940
gccttgggtc aacctttttt ggaagagaat ctagcagtct tcctactttc aaaggctgtt 9000
taggacccag gaggtgatct ggcctttacc ttccttttag aggttacaag ggcagtggta 9060
acttggttaa ttaattcaat aaggccctat actgagaata aagtcaaagc agaaaattct 9120
ctttacttga tttttttttt tggtgggggg gattggtttt ttgagatttc tctgagtagc 9180
cctggctctc ctggaactca ctctgtagac taggatgtcc ttgaactcag agatctgcct 9240
tcctctgtct ccctggtact gggattaaag tcatctacca ctatcacctg gctcaatctt 9300
tgagatttga aagccaaata gaaacagaaa cattccatgc taggatacca tggtgttgta 9360
tgtagagaga gggcctgggg gtccggggaa aggtggccag tcctggctag ggaagcagtc 9420
catgtaagaa gaaacttgag tttttaatga gagcagtatc tctaagcagt cacggcagat 9480
tgctgaaaaa cagtagtgcg caagccagtt tcagcctaga gtagtgtctg taatgtgttt 9540
tgtgtctctg aatatccata gcacagagtc aaatcccatg agtgggaaaa acagatcctg 9600
tgagacagca gctcattgat ttcaacagcg tttgtgatgt ggggattatc aatacccatt 9660
gttttaaaag tgagtgtcat catgggcaag tcaggcaatt gatttcacca ggacggtggc 9720
tgaccaagag ctagggcttt ggaggtcacc tgtgtgagcc aatccttgct tagccattta 9780
ttggctgtgc agtttagaac aatatgctct gtgttgctca ttcgtccacc tttaaattag 9840
agacaatcac atagtagtgg tgagagagag taataaaaca gtggtcagga ttaaatgtgt 9900
aaagggcctg gctctgagct tggcacatga aaccagtcaa catcagttac tgttagtcaa 9960
atttactgat gtctactgag taccattgac atgcaaggaa aaaaaaataa aatcactgtt 10020
aatgaagcct aacattagta ttttaagctc tctaatgatg tctagttttg tctctcgtct 10080
atcaccaggc tggaccctct ttctctgctc cccccccccc cccccgccag tgctgtctta 10140
gaactcaggt gcatgtacaa actctggata gtcttgttca actgttcagc ttctttgtac 10200
aaaaccattt tgtatattct gataaaagat gtctgtcctt gagggaatac atgaatccaa 10260
gctgaattca gggatgggca gagtggcttc tccctccctg catttagaac ccttgtttcc 10320
tattgatctg cattttatat aacagcactc attaaacttc cttgcagtca ccaaaaggaa 10380
ataatctcat attctcctct tacgactagt tggggaaact gggaccgaac tggttaaccg 10440
agtttccctg ggtcgttagg aagctaagat gcagatctgg ctgaagtgct caggtgtctg 10500
gctgttcagt tctcttacga tgacatacga agctggctac gggaaagtta agggtgtatt 10560
tgctcaaagt aatgcacaca cggtagagaa aagacaagtg ttgaatgtgg tcttcccgtg 10620
tccgtctgaa caccaagtaa ttctccttta tcctggctgt acagttccaa agagaccctg 10680
tgaagcacac ttctaacaag gtcagcctgc cggaagcaca gtcattgtca gcccaactaa 10740
gaatgactag gcagttttta tggcacatca tattaatgca tttattgtgt aggagtcctt 10800
tgactatcaa cattttcctt ttaagaactt aactgattgg tcagttcccc cttgggagaa 10860
agtctggctt ccagagtcat ctccagtttg ctgctgaatg tgtgtcaaac taaggagata 10920
gtatgacatc ttttttagag tctagtcaca attaaatgcc attttatttt ggattttggg 10980
aacggtgcca gcttccagct tgtcagagct gagaagactc aaatcaagtc caggcctatt 11040
tctacagcaa acggggaggc tggctttctg cctgtggatt cattcagttc agcccatctg 11100
gcttttgatg ttctgcaagt ttggagcagt ttgtttaagg aagccaggcg gtgaatattg 11160
gtgggcctgg ggttctctgg actccgcggt ggcgcctctg gatttgcatt ttctccactg 11220
gatctgccta agaccagaac aaactgcccg cctgacaaag caaccccgca tcttcacttc 11280
taaggctctg aagctccacc gcatggcatc atctcagctc ctcctggctc atttctctct 11340
cagcttctcc ctgcccagtt ctcttgctca atgggagcct gctggagtga ctctggggtg 11400
tcctgtgtct gggccaggga agagagttac ccaaaagccc catttgttca tgtttccacc 11460
atgtgacacg gtgaagggta atctgtatca gtaaccaatt ctactcctca tttctgttgc 11520
gtactgggtt tctcttcctc tctcttcttc cccttctcca ctggatgtga caggaggaag 11580
acaactccag ccactcccaa gggaacctgt gcctgacccc tgtgctggag cctgggaagg 11640
aggatgtgct gggaagctgc catttagggg cttgtaaagt catcgcacac aaccttgtaa 11700
actgtgttgt tgctatgatt attaggcttg cctgtcaagg agattccctc tcagacccac 11760
aaggctgagt gccatggtcc cttccgtctt tcgtgcacct actccttgtg ttgcagaagg 11820
cactgtctga gtgcctctct gtaggggaag agatgagggg taggacacgg tagggaaggg 11880
tttctgcttg ctggacacct cacagaaggg acggccttcc ttagatcaga gtgaattgat 11940
ttctacaaag gcagaacgct tctaaatgaa gaaagaaatg tatgctggtg gggatgaggg 12000
gtagagaggt gaagggacag tgtgcacagc cagcactact cctggatacc tggtcttgga 12060
gtggcaaacc actcactcct tgttaaattt acacgtagct ttcatccctg tgacttcacc 12120
actgaggtaa acgagcaaat ggctctgaaa caacagagaa ccagctgaag gtgccctttg 12180
gacctttcct ctgtgagagc catctttccc tctagggcct ggcctataaa taacatgggg 12240
tccaccttcc tttatagact cttgctaaaa gcacggctgg aaacatgacc gtgcaggtgc 12300
taacaaatta cggttgggaa agaaggctgc aatgcctcct gtcactgagg ttatgaaatc 12360
ccagtttcaa tcatggagcc gacccggttg gtttgccagc tggctagtct ggcacgtacc 12420
attacccctc ttgcttcttc agtgcacagc cccgatcctc cagctcatgc tttggtcctc 12480
aagtcttgct gtagctggcc acagaagttt tgtgaaattt tttcttttcc taattgaagg 12540
gaagtggtgt agaataggca gagaatactc ttaggtcaat tacataaatg aagacctggg 12600
tttgggtttg ttgttaattc catagcagat ttaaatagta gttttggtta acttgtaaaa 12660
gggaaaacaa acaaacaaac aaacaaaaac aaaaagacaa aacagctgtg gtatctacat 12720
cacacagctg aagtctgact cggaaatgat gaccagaaaa tacattttca acctcagtct 12780
gttacaggtg tgcccttctg cggaatgaaa gtgtttagac agtaaaaaac attgcacaga 12840
tagaattgaa gcaaatacct gtactgtttt cctgggagag gaaaagaaac tgtttaaacg 12900
gtgagaatat catctttgag cgtttcaaga taaaatttac tttagctacc agtattttgt 12960
ttagcatcat atcacaaata ggagattaat ataaaaagga gtcagttttc atgcagttgt 13020
tacagaggtg taagctgtgg catttaatgt cattgtgact cattggtgta agttaggagg 13080
gaagtatccc ccgtggtatg attgtgggat gcagtgtgag gtcatcgggc cagcaggaaa 13140
gtcctctcct agtgcttgat aactagcttg gtcccttcct ccagtgctct gtcagctccc 13200
acctgctgga gctgctgaac tggttctggg gctgtgcgct tgctctctcg cggtgcttgg 13260
atttcttctc ttctcatctt tcggctcttg aaaaggtttg gcttgtggtt ggtgtgaagg 13320
ttgaaatgca caccccaccc ctcgctgtct cccatttgga acactctaat ggtcccccaa 13380
ttgtacaacc tgctttcagg cccctgttct tatccttgaa taaatcgagc tcaagttgca 13440
cagggcattt gttttagaaa accgaaagaa agggggcacc tgtgaaaaca ggccactatt 13500
ccaacacaca tgcaccttcg aattaaagca gaaaatgtca gttaaagcct ccaattactt 13560
cctacttctt gaaggtttgg agccactaag aacgtagggg tgtgcttgct ggaagcttca 13620
gggtaattac ttgttactct gagcctggta tctggtaacc tagttctggg tgaacctgat 13680
accttagagc tagctgtaca ccccactatt tctctggttt cagaataagt ctgtgcagaa 13740
acttgttctc atgttaaagt gccaaagggg gcagtaaagt gctattcact aaaaaggggg 13800
aaaaatgatt cccaggactt tcttctggaa gctattgcag tgtctttctt gggcgctact 13860
gttttacttt tttcatctta taacaagccc ttctgttgag gacgtttcta gaacaactga 13920
ttaatccgca gcagcactct ggcagtaaat ggaactaaca cacaaccgaa tattccgccc 13980
gcttgtatca agttcacaca ctgcacggaa cattccagag aggagacttc acctgctggg 14040
gcatgctggc ctaactgcat atggaaatca caggtgctgc agagttgagg caggagactg 14100
gcctggtcct gaaagatcct agggtctata cttggtggag ggtgagccag cttacacact 14160
gccgtctcct ctttcctcta gcctttacca ctgagttaaa aagcaacaca agcattttat 14220
aaagaaaagt atgcttccca gaatgggaca gattccaagt acccttgata tacaatgctg 14280
gcttagtgta ttaatgtaac tggggtgctc ttccttctgg gatgacccag tgtgtaaaac 14340
tgggtcctta aaaatgtcag cctgttcctg attttatcag tgatgaaaat ctagttgtgt 14400
ttatctctta tttttctggt ttggataaat gtctgttcta aatttgtggg ctagaggcct 14460
gtttaacaca taggccacag tgtcacatgg tgctttctaa ggcgttgcat cagaaagtta 14520
aagtatctat aagccttaaa catttaaaat gctttccaaa atcagagcca agaaagctag 14580
tttcaaaaat atacttcagg tttttacatt tgcttattgt ttgaagtttt ggggtcccac 14640
tgggcaagcg ctacaacact aagctatctt ctcggctctt tctctgttcc ttctttcgag 14700
acttggtctc actgagtcgc cctgtactca ccctgtagtg taggcagacc ttaggactgt 14760
gacccgtttg ccctagtccc cctgagtagc tgggattaca gacctgtgtg tctaggctca 14820
gcaagtttag tttttgaagc tgtacattta aaagtaatgt ccagtttgtt cacaaaatca 14880
ctgtttgctg ggaagacttt tgaaacccac agaaacttaa aaatcaccat agttccaaaa 14940
gtttacaggt aactaactgt cagtgatgca atgttctgtg aatgttggtc tctgtggtca 15000
gtccagtgca ggccacatgg tttacaggtg ggtctatctg caggtggagt aagtcgtctg 15060
tgtgccatgg tcatacacag tcctgggttg ccttacagtg gggtgtcttc aaagaatatc 15120
tctttaggtg gatctgatac tacggctcga tgttcagact cagataattg tggcatgaac 15180
ctttccatat gtggtccatg attgaccaaa atgatgttgc aaagtgtgtg gtcacagtag 15240
atgtcatttc aaaggaaaag aaggctagaa tgttttagta gacggcactg tatattgatt 15300
ggcttatgaa tctggctttg caatgtcctg cacataggaa aacttacagt tttctgtggc 15360
tataacctgg gtgcatcatc tgctccttga actctgaggc cagacttcag atgcttatat 15420
ctggcctaat ggtgcagaaa taggaaacac ttaaatcaat ttgtctggcg aatcgtgtta 15480
ggtactgact gacattttgt catcaggagc tcttgcttgg catttctaag acacactact 15540
ccatcctgga ggagtttcac ctgacctgat tcaccaaatg tggagactgc ccatttctat 15600
gtatcgtgtg tggccacaga caccatcagc attgagtagc ttgttgtagc ttctacatta 15660
gcctttgtga tttgccaatg tgaggaaaca catggagtca tggggtgtcc gcacttaggt 15720
ccctaatgta gacactaaaa gaggagtaag gaaaattgag gttttcctgg tgaaagagaa 15780
aaacttcagg tcctcagctc agttgccctg aagtatctca tctcctatgg cacagggtca 15840
aggtcagagg caaagctggc aatagatgtc tccatctgag gcaaggctcc tggtgacatg 15900
atttgttatg ccgatagaag tcacatgctt cagccttcca tctccaaccc cgagtatgtt 15960
ttcacgcatt actccaacat ttgaaaccag tctggttcac acgaaagctt gtgctttccc 16020
ctctactcat taattctgct gcacggtctc tgccacaaac attaaggaat gtcaagtcgt 16080
gggatgctaa tcaagagctt tttttttttt ttttaacaat aaaaagtatg aagttgagat 16140
gtctaattta aattattaga gatctaattt agatcactaa atattaatgt ttaatgtaga 16200
ccattagagt tactcaaagt attctgcgta ggacactttg ttagagtcta gtttggcaaa 16260
gcactttttc gaacttgagt taaatcaata ggcaacccat gggtaaaaat agattctggc 16320
atcatatcat tttataccaa gcctctggct ttggaaagcc aacttcagag ttgcgttttt 16380
tttttttccc cagttccctt ctttccgtat tggagacaaa gtcatgggat ctattgtccg 16440
actggaaatg attcactggg gaaactgtag gagtgacctg tttctattca gtgctccctg 16500
tgagccctca gggactcccc agggaaagtg gatgggattg gtgcagaatg ccttggagtg 16560
gtgtgtggtc tctgccggct ggcagctagg tgctgatgct gtacaagtga tgtaggtgac 16620
gactggtttt ggttgcaaga tgatccttac cccggtttgc caaaacaagt cagagtatga 16680
ctccggctgt ggagaaggta gagttctgtt gactaacttg gttttaacgg gttttatggc 16740
tgcatgttta agtgtgaaac taatagtatc tgcctgtgtt gtttggagtc cgttttaagt 16800
ttacatctaa aacacagatt ttaggtcgtt gactcatttc ttcttcttgg caagggatac 16860
atgccaggtg gacacctcag agagcgctgc atatcccagc cattgttcac agggcaggca 16920
gctggatgcc tgcagttctc tgtgggattc ttgcaggcct gagtgtgtat tgactttccc 16980
tccattcccc ttaacttcat agcttatcaa tgaaaagctt gatttagaaa aacatgtatt 17040
tcccaaaacc agatttagat actactgtga acacaatggg gacgaagaca ggcagggaag 17100
gggcttttcc tattggattt cttcactctc ccttgaggga tttacgtctt atacaaggta 17160
tacacttgtg gcttagactc tggggttaga ggtgcaggga gcaaggctca gctctgcttt 17220
agactggcta tggttttgtg atttgcagcc ctggatgtaa atggtagctg ccttgtactt 17280
tatacaaagc agagttgttg aaagctatga ggacccagag agctagggca agaaactgcc 17340
tggggacagt cagtggaatg gcaccttggc ttggcttctc tttgtatttg ccctggtgaa 17400
atggcctggc ttcagagcgc cagtcttacc tgtgacctac cttcactctg gggcactttg 17460
acttcagcat atgtcgctgt taacttctat ttgttcacgc gtgtttttcc actaggacat 17520
cattttattg agcattatgg tacaataacc actgggcctt gggccctcac tgtggaatca 17580
cacacatatg ggaacagccc aacttcatgg agctgagttg ttagccccta aaaactcaat 17640
catcatctgt tacagtccct cagaacatct ggaaaaatat gcagcttggt gggcatattg 17700
attcacgttt tataatccca gcacttgggc agttgaggca gggccatcag gtaagtctca 17760
tgtacatagt aagttccagg ccagcctggg tggactcttc ccttgggaag atataagcaa 17820
gcaccttccc cctcctcata ggacaccaac gaaccaaagg acgactttat caaagtctaa 17880
cttgggggaa caatgaggtt ttatgggctc atttatagac cagggtaagg gattgcctac 17940
atgacatgga tgaccccaaa gcaaccagac ttttgaacca gaccttcacc ctagcatgga 18000
tggctacttc tttgtggctg cattaatggc ttttgccttc agtagccatt catcgtttat 18060
aaacactaac tagtacctct agtgaataca agaccatggg acagagttac acgcagctag 18120
ctggcaggtg aaggagcatt cggagtccaa acgtgcattg accttcccta taccttcttt 18180
ccataagggg aatatcagca ggcaacaggt ctgatccaca gactcttgca agtagtcaca 18240
gctattgtga tgaaaatgct ggtcatgttt ggaggaccac actctacaac acgctgtctc 18300
acaccaaaag ccccagtttg gtcatttaaa ttctatcgcc ctgggcattg gtggtgaatg 18360
cctttaatcc cagcacttgg gaggtagagg ctggtggatt tctgagttca aggtcagcct 18420
ggtttacaga gtgagttcca ggacagtcag gactacacag agaaactcaa acaaaacaaa 18480
acaaaacaaa acaaaacaaa acaaacaaaa attctgtctc tccagctctg agaaggtgag 18540
ggctctccag aggcctgtgt tgggagatca gtggctttct tgtggattgc catgcagagc 18600
ctcctgcccc ccttaatgaa cacttggaac agcaacttgt tagaagcaca agatcaaatt 18660
ctgtaattct gtttcagtgt tgctgtattg tatcttcctt gaagctttag gaagagtaga 18720
tttggccaga accccaccat acatgtgtac taaaaccgta aggtcccacc cttccgcctg 18780
tccattcatc aggttaccac gaggctccgt catcaaactg tgcaccctga atcaaaacta 18840
aacatcgagg ctgatttgca agatgaatca aaaactcatt aaattattta tgtgatttgt 18900
tcctgcagaa aacatcatga aaagcacagc catttgtgaa gccgcacaga ctggtgtggt 18960
gtgccctgtg ctcttgtcct cagcttgtca gggttaggtc tggggcctgg tgatctggtg 19020
attagagact tatctgagta tcaagagcca gatccctggg atgtcttggt taagcagtga 19080
gtgagtgaat gagtgtgtgt gtgtgtgtga gagagagaga gagagagaga acagttttca 19140
tagagaccta ggagaaattt gaatggagag agagcttaat gagccagatt tcagacctaa 19200
agaatgctat ggcaggggta ggagagtatc cccaagattc gcccagatac actggtcaga 19260
tgagctcaca aagaactgaa tgggtaggct cttggttata ccttggttag aaagaaccct 19320
gattctggaa gtctggaaag tgtagctcag acttcggttt ttatatagga gatatgtacc 19380
aagcctcgct agcactcata tggtttccca ccgtgtcagc tacaccaact actacaaaag 19440
gagaggggag agggaacatg tgacacggga tggtaagcct taggtagaaa ttggcccttg 19500
tgtttgtctg ttagtttgta taagtcttaa ggttttccct taaaggttga ggaataggca 19560
taagaatcaa gaaggtgagc aatttaatat tcctggaatt agtgtaacac ctaacaccta 19620
tctccgcgcg cccctcctcc ctgcaccttg tgttgtcctg ctaaagccac aggacacttc 19680
agaatcagtg tggggagaag aaggaatgaa tgatgtcagg cctggtggaa ctcagttgaa 19740
ttttatctag caagaagaac caagggagag tggcctttag aagttccctg gggaagttct 19800
tgagaccctg gggttgtatt ttcacaaagt ctcctgagaa ttgtagggaa ttcttcagca 19860
atatacacag gatgttttaa gtttgtcaca attttataaa ttcattttga gttctgctta 19920
acagaaagag ttcattatag atggatcccg ctcctcactc aaaaaagttt ttcttcatat 19980
ttccagggca gggctagtac acatggcggt gcactctaga gtcagaggat gacttggaag 20040
ggctgcctct ctccttccac catgtgggct cctgagatta aactcaggtc cccgggcttc 20100
gtttcaatca agcaccttta cccaccgagc catctcacct gttccagtgt tgtttttaag 20160
tgagtgaaca gtaaatatca tgtgctcttg ctaaagggac taatttagct aaacaaataa 20220
caacaagaca ctgatcagta gaccaccctc ttttttttgt catcatacaa taacatccaa 20280
ggaagtaaca agcagttttg ggtgcatgca tttgtgtgtg tgtgtgttca cctttagaaa 20340
gtttcagcaa tttcttatta tcgtcatcat catcatcacc atcgtcagaa gtcacagtgg 20400
tggcttttgg aaacggagtt tctctgtgta gtcctgggtg tgccgctgat ggattttgtt 20460
tgtttatttg ctttgctttt aagatatgaa gttgggaggg aaagggaaca tatatggggg 20520
tgggtgggga cagggaggag taagtgggac ctagagggag ggagtagaac atgggtaaga 20580
ccaagataca ttgtatacat gtacaaaatt aaaaacaaag tttaaaatat cagtcttgaa 20640
tatgagtcta cattgtgagc tgggctatct gctacttaag ttggtgtgga tttgaacttt 20700
gggagcccca tcatcctttt ctcatctgtt gcttcatcct ggccccaagg gtcatcatgg 20760
ctggtgggcc tctctggcta aatactgccc gagcccaggc tgtgagctct gggaggctct 20820
gctttgttcc ggagctttaa tattttaatg agcctgcagg ttggcggctc tctctgagtg 20880
tgctgttagt gttagcactt gcagaaggat gttcattaag aagctcttgt ttcagcgcct 20940
cagagaaact ccccattagg gaagatcttt cagcagcatg gccagcaaga gaggaaagga 21000
ggagagcttt tagctgggaa catccaagag attttgtatc cgtagtctta gttctaagga 21060
tttgcttcga agaattaatt ggagcaaata catctcaagg gaggggaaaa agggaagatt 21120
tgtagagcaa ggagggtact tgttgtcctc acaaggagag ggctcttcat cttgcagctg 21180
aatcaatacg acactaatta tttctggtta tcttttatgg gtttgtaaga catttctttt 21240
gttctgtgta ataaaaaacc cattgtttga tcagtgactg actaattatg ataagtaatt 21300
tgaaacattc ttgatgaaac ttgtctgtta attaacatca acagcgcatg gaaactacca 21360
ggacaacaaa ggctccgtgc atgctctgtt cctggaattg atgggatctc tctggcatgc 21420
ccaataaacc gagctgccag tggttaaaaa ataacaaaca ggtgggaagg tctgactccc 21480
caccagggga agagctgctg taaagttgca cagaagaaca ttggactatt acaagggcgg 21540
gtgaggacag gggaagaaga gttcctccct ttgtttcggg ggttaagcct aagagaccca 21600
ggaaggctct ttgccccagg aagacacctt tggtgactca gcacagtgct gagctgcctt 21660
gcttgaggtg attggtaacc ccgggctctt tgatgactgt ctttaagatg ttcactttta 21720
tcaactcagt ggcttttctt ttatgctttt tagatttcta cccggacaag gcctggtact 21780
atacccacag ataggagaca aattggatat tatttgcccc aaagtggact ctaaaactgt 21840
tggccagtat gaatattata aagtttatat ggttgataaa gaccaagcag acagatgcac 21900
aattaagaag gagaataccc cgctgctcaa ctgtgccaga ccagaccaag atgtgaaatt 21960
caccatcaag tttcaagaat tcagccctaa cctctggggt ctagaatttc agaagaacaa 22020
agattactac attatatgta agtatagttc tctctcttta ttttgtagga attaggataa 22080
gctaagtagg tttgtattca tttctgtttc ccttaaatta ccacggtaaa taatttgttg 22140
agaagctttt tttcatttat ttttctttta aataattgaa ttttgggacc ctgtagtaac 22200
agtattaatt aaatataact actcagcagg ggtgaacctg ccaggattct tacagtgtta 22260
aaataagtaa attacatgaa gggactcagc atctccacta actaaaccat ctttaaggac 22320
cttgggtgaa gttttgatag gtaaatctgt gtaatgcttt ttctcgccat ccatccatct 22380
gtccatccat ccatccactc attcattact gtgcattcgg ttctaagaac tgtgtttcag 22440
agccaggact tgagagagca aagagtaata gtgggacagt tcgtatcagt ccagacaggc 22500
agagctcaga gcctggaagc atggggtttt cagagaaaca ccagcagtca agcagaagtg 22560
gtcacattga gtcctgatga aaaggagtaa ggcgtgggtg tgctgcctga atgacacccc 22620
gtgtctgtca taacgctgta gcattatttc aggaatagag gatagatatc aatggagata 22680
tacctggagt gcatttgtga gctgtgccat tgtggcacat gcctactgtg cgtacgttac 22740
agctagcgcc aagcagcctt gttcccagtg tggatgatct tggtagagtg gagtctggta 22800
cacagagaca gctgctcacg ggatttaaac agtggattct ggttcagttg tttggggtct 22860
gggactcttc tttgtgggct ttttgttgtt ttaaattgtg gtgtttagga tgatactccc 22920
gatgcatgct ggcaagtact tgacccctga gctatagcca tagccctgga gttacactct 22980
ttgctctttc ctcggccttc agttccttga ggtgcagtgg gccccaggtt ggatgcctta 23040
ccattatcat tagattggaa gtctgcctct ctcctgttat gatctgctct tgacactgca 23100
gaagcagcag ctcactgtat attcatctag tgttccttgg tatgattagc gattaaagca 23160
aaggtggtca cagacagtca ttatcttgtc tgttgttgct tcaaatgcca catagactaa 23220
gaaacaattt tgaaactaac acgatgcagg atacatagag aatacatttc taagagcaac 23280
aaaaagagaa aaaggagaaa gtagtaagtt agatatttaa tggaataatt accataaagt 23340
gaaaataaaa gcattctggt atgaaacgag gcagatgggg tggtaagata atagggccat 23400
ctttgaagat ataaagtagt tacaaggtaa aataaatgga agctaaactt ttggaaacac 23460
acacacacac acacacacat gactgaagac ttttaatggg tgccatgatc cagcatgact 23520
tttatagaga atgaaactgt ccctttcaga aactttgaat cttccctgtt ccaagtgagt 23580
ggagaaagaa aggccttaag agatcgacac tcccaagatg gggaataccc aaccctgaag 23640
ctgcatgctt ctacattctg aatgatggtg ttgaaaatcc tagcttccta cctagggcaa 23700
gtgggaactt ggtaaacatt caaggtttaa ccttccattt gaaataatat acacacataa 23760
aatgcagcta aatgagtagt ttaccagctt ctcttagtgc atcatagtgt tcatgggcct 23820
gtcataacta ctctttcacg atgtacagga cgtttagact tgcgcataca gtttaatttg 23880
tagttaaaat agcagtctgc ccaacactgg cacctattgg ttttgtttgt ttttagagaa 23940
ctcattaggc cacattaatg ggtttttaat atgcttctca ctacagtggc cctcagaact 24000
gtccttagag ttagggtttt ccatgtccaa acatggggtg gcttgtaatt cgagaggcta 24060
tagcaagatg agctcaacca gaaagccatc ctgctctaca cacaagattg ctctgtattt 24120
tcaatagcta gaaaccatct ttaaaaacat ttggctgtcc tgttgcaagc aataaagcac 24180
tgtgggaatg tttcttctaa caaggtattc ccaggcctgt gagtggctca ggacttttcc 24240
aggaagccca gtgctgcttg aaaggcttcc cctacgtcac aggcagaaga gattcaaata 24300
cttagcaaca tgtagaagcc agtttctcac ccacaccgta gagcgtccat tgctgtacaa 24360
gttcccttga aaggagggaa atgataagat caaattttaa aatagtacca aaacagccta 24420
aggacttgaa aaactcacca attttcctat caaacagatg tgtacaggat gcacgcgcgc 24480
gcgcacacac acacacacac acacagtaca ttcttttttt ttcctccaga aggaaagtat 24540
gtacaggcaa tagtctctac accagtacat tcataaagag tgctgggtag cacaacagga 24600
aaagctcaga ttcacaagta tatttttaat actgcaagcg aatgatttat ttgaagatag 24660
gaaataatgt cagtatttga gtttgactct aagtcttagc atccagctgg ttggcacttt 24720
gaccccagac aatgtcagga gcatcatatg gtggtttcca ctgggggagg gtgtgctgta 24780
aaagcagctg tggttggagg agtgcttgct ataccccagt ggggaagtac acacagctct 24840
gctggtattg ggctgtctcg cagaagtgca gaacctcatg tctgttacct gagtttgacg 24900
gaagtgactt ctatttcctt ctctagaaca ttcttttatc actattgtcc cgtctgtgat 24960
ggtcagacct acagacctgg tcaccaatac ttcccagtta cagctgacag ggtctggtcc 25020
cagtttttta ataaggattt ttcatttgac ttgtagtgct acccaacttg aagtcactca 25080
ctgcatcttt gggttttata atcaacacaa gtgtgtaatt ggaatgtatt ctatacccac 25140
catctctcca ctgggttccc ttaagaagtg acatgatgga actctaggcc tcctcactaa 25200
cctccctgca cacaattgct tgctttgaca agtggcaaag tgacatatat gcagtgcctt 25260
cgtgtttaga attgacttct caagcgacct atttcagtaa tcaggcttgg gctttattta 25320
cataataaac tcttctaatc atatgcgatc ctaagatggg gatgttagga ccgcacagtc 25380
tgaaaatccc cctgctcttc attacattca gatcctcaat ggcctaaaaa acagagcttg 25440
gatttatata acctgtactt atatttttat catgtctttc acttaattgt ttatgaagca 25500
actgcatctc ctgatattat ctgcccatca tagacattca cggttggata tattatttta 25560
aacaagctgt ccggtctcta ttgggaaggc atatctactc tctgagtacc cagccttcat 25620
cactgaagtt ttcatagaga aactatccaa gcttctttag agctagcgag ctgagacagc 25680
aagctccttc tgttggccct gaagccctga ggcaggtgct ctgtgctggg gcccgactta 25740
cagattgtac atagattggt cacatgagtg aaggtggaag ctagtgaccc acactgactt 25800
caggggtgca ggagccacca cagggctatg gcctgacctc agactgctcc ttgcctttgg 25860
tcctatgtgg tttgaatgtt gttttattgt atacccatag gcagatcaca gtctcttagc 25920
atcttctaga agtcactatt tctgacttac tgtcactgag tgccttattg aagtcagctt 25980
tccatatcca ccctgccttg ctgagccatc aagtctgggg gagtcctcca tttcttaggc 26040
ctcttcactg agagagcgca aaactgggag gctccacata cactgttgga atgtttttaa 26100
gtgtacattc cactgcagag gtgggaaaaa aatcacaaaa taaagagaaa tatttgcaca 26160
agtaaaaaca aataacaata ttaaagagcc aatatgatag tttgctcctt attttggtgg 26220
agtgtatgtt gcatatcttt tttttctggc tttgatttgc tcgttttggt gatggctgtg 26280
gggagttaca ctaatacact gagtgtcctg aactgtctgt ctctttagaa aattactaaa 26340
tcccagagca gctttcagat gccccttgtc gtaaagatag cttttagaac acgtaagagc 26400
acatagcagc cataaacaga ttatggagtt tattcagtgg gttacttatg tatgggaggt 26460
gtctagcagc catgctcctt cagcgggtta tttatgtatg ggagatgtcc agtggatact 26520
ggagagcttt agtgatccag aaactacatc ctgtcttcct gtctcctggc ttaggggtga 26580
aaatttgtgt ttgataatgt cattgcaccc agttgctgag tggaggcatt taagcacatt 26640
cccagtttcc tccgtagctc ttcttgtaat ggaacttccc cagaggccat tactatagaa 26700
ggaacagaag aacagtacat gccacgctta gaaacacagt tgacccaggc gctgtgagtc 26760
caagtctggc caccttgggc tttatgtgcc aatatgtctt ctcttcctta aaatcgtcat 26820
gagcacactt gctcatgggg taaaaacatt tcccatgagg acaaatatgt caggtggcta 26880
gtgtccgtgt gtggctacca accaagaaca agttaacagt ggaactgaga ggcagtaaaa 26940
ggctggaggc tgaaggcaaa agtgggcttc atggcaagag gggttgcctg ggaaggatgg 27000
gtatagaaag catccttcat ctgtagtctg ggcatatgca aaaccagagt gttgtgcagc 27060
ctcagtcact ctgggcatct ctactcatta gcaattccca ctctgtcttc tttgactgtc 27120
actaaagccc ttttgttccc attgaccaag aagcacacac ttatgtgtgg tttgttccag 27180
aatcgcctga ccttgacagc aggttctttt acagaccctg aaggctcaga cagggaggag 27240
tgttgataca cctacagttg gggctcttac tttccagttc ataagactct cacaagctct 27300
gcttccctag gacacaggaa atatcagtca tcgtgccagg gcagccctgt ggcttccatc 27360
tgtagggagc ctctcccaag gacctggagg gtccatgttg aatttagtct aaagaaagct 27420
cagttttgca tctgcctatc tgagactgca ccaagatact cgggactccc aagtctagca 27480
gagtcatggc cacccgaatg ctagcctggg tggtgcagag gatcagagga tgaggctgcc 27540
ctgggtagga ttctgttcac agccattggc atctcctggg aaacagggac cacacactca 27600
tgtaaaccgg gcagatatag gcctgccatt accatcccct gctctgaaag taatgactga 27660
ccccagcatg aggagcaaaa attgaggaag aataaacact gaatacaaaa taagtaagat 27720
gagaaataaa ggacttcaca tagccaagaa gttattcagg aattattcag aataaaactg 27780
tctttattat ttcataaaac tcatctttat atctctaccc ttgtatttat agcttgttaa 27840
cggttcacat agatttataa ataattgaac aatgctagag acccagtgca taaaagagga 27900
cacgtttctt tcttaacagc ccttaaatat tcatcatgaa gataaaattt tcaagcaaaa 27960
taaaacactt aaaaaaatag ccaagaggca tagacagaca ttttggaggg gaaaaaaaaa 28020
gattactttg agaaaaactg atttatatag ttcttaagag gctcaaattt attcctaaag 28080
cgctaactct gagtctggat gtgtttgatc cttgggggag tgctgtgacc ttcatgcctg 28140
cctcactttc aagtctaaca gcacaagaga tagaaaattt tcactgctgt gaagaaaccc 28200
aaacagtgtt catggcttag aacactttac atgccatgaa atatcagggc caaacccaat 28260
atggggcttt caaaccctta ggtctccatt gaaaggctcc cgggccatat gtgcaccgta 28320
atgagaacat gcagatgtac atgatatatg tgtagggtta gcaaagaaag tatgcataga 28380
aaataatagt gatgatggta tccagtcacg caaagcacat gcatgacagc gcaggggctc 28440
agacacgttg catgcttaca catacataga gagggaaaag gcaagagaca ggcacaatac 28500
atgtgcaact gtattaagct cctgcaatat aaataacaaa ctcctcttct atcagacata 28560
tgttggtagt gatgccctat catacattat ataacatata actaactcag tcatatatcc 28620
tgagttgaac taagaaaacc tacgagagta taggtaagct gggtgctgtg gcatgtgctt 28680
agttctcgct acccagaaga ccaagtccag gagttgaaac taactgggca acataagacc 28740
tacacctaca gggtagaaag gtgggagaaa cacccttgtt cgcacttcaa attcttctat 28800
ttttaaatct actaataggt ttaaaatctt tttggctttt ttttccccat taaggttata 28860
ctagattgat tttatggcat tagcaagtac tttgagctca tcaacagaag ttgctaaata 28920
ataatgtaat taaaatcaag ttagttcaat ataggaacag agacattaag agttattaag 28980
cttccttggc taagtgcaag tgctgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 29040
gtgtgttaga tggtgagcga gttgatgggt ggatatatgg atggtagata tgtagactgt 29100
tggatatatg gatggtggat gtcagttgag aagataggtg gacggtgggt tcatgtgtgg 29160
gtgggtaggt ggatagcaga atggactgat agatcagccc agtcttgggc aagaacataa 29220
tcgatctcat atagagaaac cagattatgt gttgctgaat gctaactttg cttaaaagtc 29280
actttgcttt agtgaatgaa tctagctttc ctcttccttc tattaaacca tggactgaag 29340
ttaattcttt cattggaaga aatgtctgag aatctgcccc tgattctttg aatagagaag 29400
aggtgtcctg catgcatgag aaaggctcac acagaggaca gatttaaaca ggggcacttt 29460
atcatggtta ctgctggcct ctcaatggtc aaagcaaata atgtcatgac catctaaact 29520
gtgaggccac aagagcactg ctgcctcttc tgaagagtcc catccgaagc cgtcagcagg 29580
catcagttca agcgctacag aagctgctcc cacctagcca tgagctctcc tcggatggat 29640
gttttctact tcactccttc tgtaatgact gggtcattga gatcattgcc tgcaattagt 29700
gacagtcagg cgagcgagag gattgtggga tgtctttccc tagccccact gaccatggac 29760
atttcacact aacccggttc ctagctagat agttctgtgt tgccacaaag atattttaaa 29820
aaatcaagaa tgttaagaga gaaggaacca gagaggagag catgagttgt gtgctacaaa 29880
taacccagtc agctgcgcac ggctcatgat tcagggcatt ttcgtgacat gttatcactg 29940
tcttgaacag gaagtttgta ttttaaaaat ctggggtttt aagttaatgg acaatagaga 30000
attatgtctt atctttagaa ctattgtatc atttttttta aaatgtgact ttagtcatta 30060
ctattgaaat ggtcatctgg caacctattt ttaaaacaca attctctagt agttttaatt 30120
caggtcaatg gtgactcccc tgtagaggca attgttactt tattgtaggt tatactaccc 30180
tcattctaat tactatctct gcattgtagc agtaacaaac accctagaat gtctaaaata 30240
agaagagtac tttgtaaatg acattatttt taaaaattat tattattatt aatttttgcc 30300
taatgaggag tccttgcctg tgcaaatcac cacagagtta ggagtaaaat tttatactag 30360
aaagcagcat tttttttcca acagaattca ttaaaaaaaa aaaaaaacaa gagactgagt 30420
tagtgggggc aatattttga gggaaaatgc acagcttcat aagtgatttt ccatactgaa 30480
gcatcttttg agttaaacca ggaccagggg tagtttatgg tcggccttgc tttcactttt 30540
ctcaggacag tgtcagggtc ctggactgag ccaagagggt acaggctgaa cagccctgac 30600
ctgaaactca aagtccaaac aaaccccaaa acttttggta cagacaactc tgtacaaatg 30660
tccaaaatcc caaaagattc cacagtctgg aaggtttgag ggactgagcg ttgagacgtc 30720
ttgctcagcc cattgcacag cctagcctaa aagtcactat gtagaccagg ctgattcaca 30780
gagagccaac tctttctgcc tcccaagtgc tgggattaaa ggcgtgcaca ccaccatacc 30840
tggtcctcac cccgttttcc tgatgtactc tcatgtacgt cctcgcacgc acgtgcacat 30900
gtgggcatgc acacacattc tcacacatac catatagacc tgtcgcacta gcgcacgtgt 30960
ctgccatata ttcctgttcc cctcgtgtga gccgctctct tttgaggact acttttcaaa 31020
ggtaactgac tcatccagga taagcacgca cttaaccttc gtatagtttt ccgtggttga 31080
aagggtttag gagtaaccca tgataaatct tagtttcagc tatggctctc ataattagat 31140
actccagctg ttctcccata tcagaacagc ttgctagaag acgtgtccaa gtgggtacat 31200
ttttaaagac ttctgtttct aaagtgtcaa tgaaccatcc catcgtagtt catttgaggt 31260
gcttaagctc agaaaataaa attaagacag ccctcgaaac acacagaaga aaacctatct 31320
atttgcactt catccaaagc ttccgtcatt ccttaatgct ggacgagaag agggggatat 31380
ctaagtttat attttttttt agattggctt ttccaaagtc attttgccca gtgcacgagc 31440
caagagattg tgttatgtgg aagctactgg gccagttaat ctccacgtgt gaatggctgc 31500
ttggcgattg tgaaaggcag taacagtgac acagctttaa tgggagcaat tcttcctggg 31560
agctgagctc gtgttgcctt agatgagaaa cacacatgtc ctccatcccc catgctttat 31620
ggtgcctaag tctggacagt ctcctacctg caaagaaagt tcatcaaatg ggagtggagg 31680
cccagcaagg aacccagcaa agagtcacgc tgggtgcttt cttgttgtgt atgtgttatg 31740
tgttttgtgc tttgctgaat gaatgttctt gttgtgtgcg tgttttgtgt gtttgtcgaa 31800
tgaatgtttc tctttgagaa tgtcttgctt tgtgttcttg tttcttcatg ggacatttat 31860
attcttgttt cttcaccgga cgctttgagg gactgggcta tgatgctttt tgctcaagga 31920
caaggcaagc ttggtattat ggggtgagat actctaagac aaggaaggct gaactcctgc 31980
tgtttagcca gattcctctt atctctttgg aaatcaagga gatgcattcc actctttccc 32040
tcagcaggca caatggaaaa catagtttag aaaaaagaaa gagagagaga gagagagaga 32100
atttcctctt cttcccaggg ctttgaactg atgtttgttt cagacattgt ctcattgtcc 32160
tttttaagaa caggcattga tttttggctt ttcctggaca ttattatttc tgtgtttagg 32220
actttttctc cttctgtgtc agttatctca gagaatgacc ttgctaaccg agccatgaaa 32280
acgcattaac ttgggctcta gagactgaat cctgtctctg tggtatatac tctgaatctg 32340
tattgtactt tttttggaat ttaaactgat actggactaa gtgggaagat cttagcttcc 32400
cagcttgtac gttgacatta aataactgca tcttgaccag agttttgttt ctaaacttgt 32460
atgtctcgtg ctttttgttt tattttgttg gcactcagag atgtggccct ggtgggagga 32520
cacggcagtc tggtcctgtg tgttgggtga cattaaagtc gtgtgtctct ccggatgatg 32580
ctttttctgt ttgccagtta agcccctgct agggtttttt cagatgcctg tgctgaactt 32640
gggggaaggc tgtggcatta gcatggccag tgtggggtat agaatgagct ggcaagggcg 32700
gttcagatag aattggtgtt gacagagatt cttataaagt actgactgtt agttaatcaa 32760
agatactccg caagatcagc cctgggtaag gacacagctt ctgtggtttt cctgactgca 32820
tgattatcat gtgtctcttt ggtgagcttg ctttgatttg ttgacatgtt tactttcaaa 32880
tgtctgccaa tctacaagtc ccacatggcc acttgaacta gtgtgaccag aggacccaaa 32940
gatgtgccat ttgatgggat tgtcctgaat catacactgt ctctttggga acaaggccca 33000
cgtgtgggct atttcaccct ccacttgagg gtcctactct tctctactgg acacagtaca 33060
gccagcatct gtagcttggc tttgaagcag agcagataca cccacacaaa ggcacattga 33120
aatgcagtac ccatctttgt ggggatggtc caagactcag gcatcttctg tctatgtggt 33180
ctatttacca gctcccagct ctctagcact ctgtgagctc gtcctatagc cagtgtcact 33240
gcccagaaga tctgcagata actggaaaca caggcatctc aaactctgta cagttggttt 33300
gttgtttttg tgttttgaga ctgagccttc ttatgctttc tgcactgtcc ttgaaccctc 33360
aatcctcatg tcttaagctt ccgatggcta ggactgcaga catggatgct acagccagtt 33420
cagggtgctt ttctgctgag cagtgacctt tgctccttcc agaggacaca ggaaagagta 33480
gtgatgctct gagttagacc caaaaagcaa gagcttttaa aagacagcta taaaatgccc 33540
aagtatcttt ttttttcctt ttttttttct ttttgttttt tttttttttc gagacagggt 33600
ttctctgtgt agccctggct gtcctggaac tcactttgta gaccagacca ggctggcctc 33660
gaactcagag acctgcctgc ctctgcctcc caagtgctgg gatttaaggc atgtgccacc 33720
gtgcctggct ccaagtattt ttattaagcc cacctcccaa taggataaag ttttcaaata 33780
atttttaatc taataaggtc tattttcctc ccaactaagc caggggagaa gaatgtctgg 33840
gcactaaata aaagcttagg tataacaatg ttatttttcc tgtctcttgg tgattagatg 33900
caattttctc catttggtga tacaatgatt gtggccacat tagatagtgc tggtggattg 33960
atacaaagga aaactaagca taatgaagta acatttattt ttactcttta agttaaaaat 34020
tctcagggac tgccggggcc tagcaaacac agaagtggat gctcacagtc agctaatgga 34080
tggatcacag ggctcccaat ggaggagcta gagaaagtac ccaaggagct aaagggatct 34140
tcaaccctat aggtggaaca acattatgaa ctaaccagta cccctgagct cttgactcta 34200
gctgcatatg tatcaaaaga tggcctagtc ggccatcact ggaaagagag gcccattgga 34260
cacgcagact ttgtgtgccc cggtacaggg gaacgccagg gccaaagggg gggagtgggt 34320
gggtagggga atgggggtgg gtgggtaagg gggacttttg gtatagcatt ggaaatgtaa 34380
atgagctaaa tacctaataa aaaaaaattc tcagggacat tcaaatgaaa gctataaata 34440
gttgtaaaac tatctaatga aatggaaata gattttattt cccaggtatt agcaattctc 34500
ttgttatgct tcaacgggag tgctgagcct tttaaagctt ctgggttcca ggttgatggg 34560
ggcaggggga gataggggac accagcaccc tgtgatgtgt ttcagtaact catggccagg 34620
aagcaggcac aatcaagacc aagcacaggg ccattgttcc agtaggggca ggtccactag 34680
acttagaatt attctaactt ttgaggacct gtagaaaatt acacttagat cagatctaag 34740
gcttatatct catataaggc ttttattgct gtgttatact cctaaagatt tctgttggta 34800
ggaacatccg aaaatggatt tttttcagtg acaagttgtc agatggcagt cctagccata 34860
ttagttactt ctgttgcagc ttaaaggagg aagtgctcct tatggcttgc agtttatggg 34920
gataccagca gtcagtccca tgccacctga aggatgaaac tgcatgctca cctctagagg 34980
gactggaagc agtgagaggg tctgacctca gctggatttc tcatttgccc atcatcctgt 35040
cagggacccc accccaggca ctagatggtc ccactcacac gagtgtagga aagatctgac 35100
cacctcagtg atctttgtct gggaagagaa tctgacacac tcaaacaagt gacctacaaa 35160
gttcctgatc caatcaagtt gacatccgaa ttagacctca cacttcccca tgaccgttac 35220
cttttgtgga ggcatatgga acggtgccat acaattcact catttttaac aacaattgat 35280
catttcttcc caggctctac ttctgacttt cacaagtccc aagttagctt aaaagggtct 35340
accccccccc cctaccaata atgatatacc acccctcccc caccttcatt tcttcccttt 35400
tttctctttt gtcttttttc ctccccccct tttttttgtt gttgttgtta atcaaggtgg 35460
gggaaaggtt tcagctttta aagatgtgaa ttggttccct tttttttttt tttacaacct 35520
ctctccctcc cagggttctg tggtctctag gtgctaaagt acacactgaa atttgatttg 35580
aatttcttta gagatcttta ctactgggag gtggtttgct ccatctttct ggcataaacc 35640
tggagaattc agctctgatt tggaagaggg aggcactgac ctgcaaattt aaaaaagtat 35700
ttatttaggg ttggtgagat ggcttagcag gtaaaagcac tgactgctct tccaaaggtc 35760
ctgagttcaa atcccagcta ccacatggtg gctcacaacc atccgtaatg agatctgata 35820
ccttcttctg ttgtgcctga agacagccac acctcccctc cccccaacat atcccattcc 35880
tatcctcctt gactgcttgt agtcctcctc cttcctgtag tcctccccct ctgtagttct 35940
ccctgccccc tgtagtcttc tctgcccctg tactcctccc tccccctgct cagcttttag 36000
ttattactgt cctttgtcag atgggtattg agacatttag caagaaaaga aaagttgttt 36060
atttaacttt caataggatg cactttagca tgaagcacct tatgtatttg tgagtctaaa 36120
acttggcatt ctcctcagat taagcgaact agacatttga caggtggttt aacgaaccag 36180
atcacttttc tacttttttc tctatggaga cttatcctga ctcccaagaa atggtgtgag 36240
agaactctaa tcaataattg gggattcagc attgccctag atcactctag aaacagcgct 36300
caaaggaggc cccccccccc caagtcttag gagagaggct ctgaggctga gccactgttt 36360
ttgcagtaga gaaagaggag gaagatagta acaatcacaa caaaggccct ttatagaaag 36420
atgttcagaa gcagtctctc tagactgtta ttttgacttc tctggcaaac gttttctcca 36480
gtctgtgagt ggatagatgc tgtgtagctt actgcaactc cccaacaaag ttcttatggc 36540
aactaatggc aactattagg tattttccca aaaacactta agtgttagca acagcaaagg 36600
agatgcggtt atgagcgctg acttaggcac gctctcaggt aagcacaaga tatttatacg 36660
cagaaagggc atcctttgct tttagggaaa ataagagcat agaagttgat aatcctagaa 36720
cacagaagaa aatttgtgtg tactttttat cagttaccca gtgagtgcaa ccttttgcgc 36780
cagaggcatt tagaagtgtt tggtgatgat aatatgcttg gaaaaccaaa acagccaaat 36840
caagaggagt tgtgagcaca cctgtccggt tttcattctc ttccgagtgt agtgtttgta 36900
gacaggactt tgatagccaa agtggaaggt gattgaagtt acagacgtgt atatgaaaca 36960
cttctgttcc ttgccccttg aactcaaggg gaagcagtgt ccagcgcatt ccaccctctc 37020
ttcctactca aacgtgaact gtaattgaaa gcctgctcct cattacacgg attgacagcc 37080
catctcttta cagctttagt ttcaaagcca tttagagatt ttacccgcct aaggacaaac 37140
agctatgtgt ggagatagaa catggctgct ttaaaagaca gaaagacacc ttggtagaag 37200
ggatgtcttt cctctggccc ctcattgtta aggtggaaag agaatccact tggcgaatat 37260
gggataaggt ggttccccca cctggttgta gccgagttgt catggggccc agatgggaaa 37320
gtgagtgtgc taacttctgt ccagctagtg tttcctccag cagaaagcct tgctgaaaag 37380
gctcatgggg gttgctgata acacgtgctt gctggcattt acagagtgag aaggcagact 37440
cagaagacca gagttgtagg atgctccttc agtacattcc aggctggaga aaagagcaag 37500
ggcgtatgag aaggcttccc tgccagtgtt tgcagaactt ggacgattga caagcagagc 37560
atcaagttaa ttgttcttga agcaggaagt ctggagtgga ggaagcaggt gttgggagat 37620
gattgccgag ttttgaaatt accgggttag ctcctttgtg ctttctgctt ttggacccct 37680
ctcagtccgt aggcatttgg aggatgctgt cccttttacc tgtcgaggaa tcctaaatcg 37740
gatgtgcatg ggaaagggag ggtttaagcc catttagaag caggtagcat acgtgcagca 37800
atgtttccag gatccatttc tctttgtttc tgtttctgtt tctttttggc tttcagcatc 37860
ccatacattc agagaacttg tgacaaagag tgaattctta tttttcaaat tggtttcaga 37920
catttcatgt tcatgtaatc ttgcctattg atttcctgat ttttctttat ttttttgttt 37980
tgtccatttt atttttaatc agctacatca aatgggtctt tggagggcct ggataaccag 38040
gagggagggg tgtgccagac aagagccatg aagatcctca tgaaagttgg acaaggtaaa 38100
gatcatctgc ttctttgtga agccactgtg acctggtgtg tccccagcta gtgtggcacc 38160
aggtgacgct cattgtcacc cctcctttta gttttgaagg cagacccttc tctgcacttt 38220
gaaccactgg cagagtgtcc cccaaggtga aatactcagc atttcttatt ggagatctct 38280
ctaaaagttc aggtcagcaa gacagagtgt ctctgtgtta ccacagatat gcatgtttct 38340
ctttacaatg cagaacacct ctttgaaaaa tcaaagtctc cagtatgtaa acagtggttc 38400
tgcagctttg tttcattttc aaatctggac aaccaaagaa ccatgtttcc atgtagaata 38460
acctattgtg cagaaagaaa gaattattct tctaattaga aaccggtata gtagtcaatc 38520
aacttgctca gttaaattga aatgtcatct gcaatgcttt gactgccaaa tgcaagaatc 38580
cctatagttt ccacagatgg cctcccaatc taaacctcca aaataactag gataactgtt 38640
ctgattaaaa aggaagatta tattcttgta tttcacagtg ttttgcataa agagtcttat 38700
gttcgttgct attcgtgcct cttgagatat gtgtgcagct ctgaagctag ctatagtcag 38760
atgtctgtgc catgattaat cacttgttct tcatatagat gcaagttctg ctggatcagc 38820
caggaatcac ggtccaacaa gacgtccaga gctagaagct ggtacaaatg ggagaagttc 38880
aacaacaagt ccctttgtga agccaaatcc aggtacagtg gtgtggtgta tgtgtgtgag 38940
tctgtggggt gcattgtgtg gctccttgag agaatcctca gagcacgtct gcactggtgg 39000
ggttcacctc agccgtgctg cctgcgcgct gcgctcagtg agccggtatt aacttggcca 39060
ataagacaga ctaatttatt cccatcaaag tcttacagtt acagtaacag agctcgccag 39120
aagtgtcagt taccagtgac gctccaccag acgggttttc attggctgat gctgtctcct 39180
gctcactgct gacaccatcc caaagccgat ttaatgtata tataatttgt gccctaatcc 39240
ctgtctaatt acatctaatc cacaaagagc ctcaaacgat ccttttctga attttagaaa 39300
acgctgccta atgtcataac ttccaggtgg ctgttcttaa tgtttttcac attctgtgta 39360
taaaaaataa aatattatag ggcttactaa ccaaaggaca ccatgctctg taaaaatcgg 39420
ctcattttct caacagccct gcttccgtgt gctgatgtcg ttgtaaggag tagtcagtgc 39480
gctgaggatt ctacacacac acacacacac acacacacac acacaccagc acttttggac 39540
tagggatctg tgtgctggat agaggtgatg ggaatttgga tttatggtaa tattctgtct 39600
ctttccaaga gtcaagaaag gaaggttccc ccccccccaa ctttcaatga caagatgtgt 39660
caaattcttg tgacaaattg ataaatggat agtataatgg tgccaggcaa ttctttagtg 39720
ctaacatttg ggttagcagt ctgttcggtg ccagagcgtc tgctgccttc caaatatatt 39780
ttaagtgtaa atcaaataat acaaccgagt tacgagttga agcctttccc gggtcccatc 39840
actccttcct ttctggcgca tcgctgctgg taggcagggc ttctgtggaa ggcgggcgtt 39900
taaagacgga catataacac ccagtttcca gcatgaggga agagcaggcc aggccagggc 39960
tgcaccatgc tctggagtag ctgcgtgtgc cttttttcca gccgagcctg gtgcatcacc 40020
gggaagtgca gaggctagga cggcccaggg cttgctggct gtctcgccat tctgctgccg 40080
gtgacacaga caaggaagca gttggggatt gtatgagcat tggaccttga ggctcctttg 40140
ccctgtctgt caagttcgct ctgagggttg agcgttggac atgcttaatt attacatttc 40200
ggggtttctg caagaaacag ggcacaccca ggactctggt aactggctct tcttgctcct 40260
gtgcaggttc tagcaccgat ggcaacagcg cggggcattc cgggaacaat ctcctgggtt 40320
ccgaagtggc cttattcgca gggatcgcat caggatgcat catcttcatc gtcatcatca 40380
tcactttggt ggtgctgctg ctcaagtacc gcaggagaca ccgcaaacac tctccacagc 40440
acacgaccac gctgtctctc agcacactgg ccacgcccaa gcgaggtggc aacaacaatg 40500
gctcggagcc cagtgacgtt atcataccac taaggactgc agacagcgtc ttctgcccgc 40560
actacgagaa ggtcagcggg gactatgggc acccggtgta catcgtgcag gagatgcccc 40620
cacagagtcc tgccaacatt tactacaagg tctgaggcct gagacctgcg cctcccaagg 40680
gaactcgcac cttgttcttg ggcacgcagg gactgcctga gcctggctgt gggggcagga 40740
tgcctcctgg aagagcctgg atctggacag ttttgtagtc tgtagctttt ccgaccctgg 40800
ggaccacaga ccctccccgg aagctggaag actgctagga gatccccact tggactgccg 40860
cggccccacg cggacctcca agccatgcac ccagccactc aggcctctgc agagcccggg 40920
gaggacacgg taggctatgg atggcgcagc agcatcttag gagaaggttg cgcaccaggc 40980
cggcccctgc ctccacgttt cctgccgtgc acactggact tatcacttgg acctcgggtt 41040
cagtaaggtt ttcaaagatc tctagtgttt agtcctcact cactcactca ctcactcact 41100
ccttctcttg ccagggctct gcagcaaact ccctagaccc ctcactccac gtactgcatc 41160
attacgggac actcaccaca gagtcccagc tccacccttt acaccaagat caaattagat 41220
gggtattagg tacagaagaa ccctgcttgc ctggaggccg ggtcagccgg gaagcgcaga 41280
tgtgtggagg agtgaggagg tgctggctgc cacggcaggt caaggctgct tgctgcccct 41340
ggagcatagt agggatgcag gaaggaaata gataatgctt tggtttttct gagaggacag 41400
agacaggtgg gaggtgactg actggtgagt ggtggggagc ctttcactac cacacagcta 41460
tgcagcaggg aatcaaaagt ccctctcctg cggggaacaa aggggccatt gttgtgaaag 41520
gaccagctag agcacagagg gagagggcag gcctccggtg aagtgctggg gcagaactgc 41580
agaggtactg gaaataaaaa gcgcagcgca gagctgtggg agagtccgtc tgctttggga 41640
gatgttttaa gcagactcag ctgctatatt accacgtttt tattaaaaac acagggaaag 41700
catttaggag aagagcagag agccaaatct gacctagaag ttgaaaagcc aaaggtcaaa 41760
caggctgtaa gtccatcacc actgaggtta ttggagaatt ctcattagga aaggcaggtc 41820
agattcccca ggccccataa gtgccccttc cccctccctg attgagcctt acacgttggt 41880
ttttggttta tggccgtgct gtccgggctc caaggcagta cccgggctcc atgtcaaagc 41940
aaagcacaca tggcccacct cttagagtcc ttgagatgga agtaagttat gccgcggaag 42000
gaaaggcgaa gataggacat atttataata ggtgtataga acacaaggga tataaaatga 42060
aagattttta ctaatatata ttttaagatt acacacaata cacaccagaa gacgtggagt 42120
tcggtggtgg tggtggtcgt ggtggtggtg attaaagtga ccccagcgct tagtgcttta 42180
aaaagtgaaa gattgggtag ctactccccg aaacgtacca atagcaagaa aagtatccat 42240
aatgagagca aatggcaaaa ataacacggt cctgcgggaa tctcgcagaa ccgtagacta 42300
ggaatgccag ccccccaaat tgatgtgacc ctgccccggg ttagacaatg ataaaatgcg 42360
ctggccttta ttttctgtgt tgggttttcc cttgccttat gggctgaagt gttctctaga 42420
atttagcagg tcacactgag gggattccag tttaactgtg ggtccctcct cctctcctac 42480
cccatccctg cccttccaga gaataacagg aagccttcct tttttttttt ttttaagtgc 42540
tatgcaaaag agacatcttt aacagagtcc tgttactatg gtaacatttt gctttctgaa 42600
ttgggaggaa ataaaaattg taatgacagc atttgaaggt tctcagacct ccagtgagta 42660
cctgcaaaaa tgagttgtca cagagattat tccctacttc tcaaacctga aaatgatgtt 42720
ggttcgatgt gtgtgtgtgt gtatgagtgg gtgtgtggta catgtgtgta catatatgta 42780
taatatatat ctccagtata tattatatat atctatatca tatttctgtg gagggttgcc 42840
atggcaatca actgcagtac atatgtagtt ctttccatca ccctaacctc tcctgcgcat 42900
tcacacaaga gtttcttgta agccatcaaa agttaattct agggggagag ggatgaggcg 42960
gggagacatg ggaaaccgtc tgattttaat gaaatcaaat gtctgtgtca tcggttggct 43020
acgttttggt tctatgctaa actgtgaaga atcggatgaa ttgatgaaga gttgagttac 43080
ctgcaaccca ttgagaagtg tcctgtgcgt ctgttttgtg tctggtgcag aaaatgacaa 43140
tctaccaact gtccccttat ttggagttgg ttcagctttg gaaagttact gtaaatgcct 43200
tgcttgtatt atcatcccta gtcacctgac ttcggagctt gcaccatcgt gttttaagtg 43260
aagacgctgt aaataggttc agatcttacc gtctatggat tcgggtgtta cagtagcctt 43320
attcaccttt ttaataaaaa tacacatgaa aacgagacag taatggcttt tcttacccag 43380
attgtgtaca tagagcaatg ttggtttttt ataaagtcta agcaagatgt tttgtataaa 43440
atctgaattt tgcaatgtat ttagctacag cttgtttaac ggcagtgtca tcccctttgc 43500
actgtaatga ggaaaaaaaa aaggtataaa aggttgccaa attgctgcat atttgtgccg 43560
taattatgta ccatgaatat ttatttaatt tcgttgtcca atttgtaagt aacacagtat 43620
tatgcttgag ttataaatat tttttctttg ttttatttta atagcctgtc ataggttttt 43680
tttttaatct gctttagttc cacatgacag ttaagcccca gaaatgagat ccgagcagcc 43740
acattccacg tctgtttcaa aatgaatttg ttcttaaaaa aaataaaata tttttttcct 43800
atggaaaaag cgccttcaaa gtattttcct ttccttttca ttttttcttt tgattttctt 43860
tctttttctg ttgtgtatta tgatttcctt ccttttgtta tttcccaagt cacagttacc 43920
cagagacttc tgctcctgga cccttttatg cccatctcgg aagacaagtt gtgcatgtgt 43980
tacaaataaa gtttgattaa agccctga 44008
<210> 290
<211> 820
<212> DNA
<213> 人工序列
<220>
<223> 编码肝配蛋白B2的智人基因第一外显子区
<400> 290
gctgactctc ctcggcgggg accgcggcgc cggccggagc gaggagctgc gcacgcagcg 60
ggtcccggcg ccctccccgc acacaaaggc ccgcgcgcgt ccggagcccg cggcggggac 120
cgagctccct ctttcctgcc ctgggggccg ggagccgcgc ggactgagaa ggctcctgcg 180
cgcccggagg cgccctactc cgctccgtgc tccgggacat ggaaccgcgc cgacgcggcg 240
cccgcgcgct cgggccgctg cccgctgcac tggatctata gtcacaggcg gccccgctcg 300
gggcgcagcg cccgccgccc gcgccggtcg tctccgctcc gggtctttgt gtcccagccc 360
gcacccgccc cgcgcccacc cgccagccgc ggccggcccg gcaccctgga gccgcacggg 420
agtcggccgt ccgagctgcg tccggcgcgg cgccccggaa ccccgagtcc gccgcgccgc 480
cgcgccccgc gcgtgcgctc ccgccccgcg ccctgagggc cccggagagc gagcgcacct 540
ggcccggcga ccgctggagc tgcgcagcgc gcctcggagc tgcctgcggg cgcacgccgt 600
cttccccgcc agtctgcccc ggaggattgg gggtcccagc ctgcgtcccg tcagtccctt 660
cttggcccgg agtgcgcgga gctgggagtg gcttcgccat ggctgtgaga agggactccg 720
tgtggaagta ctgctggggt gttttgatgg ttttatgcag aactgcgatt tccaaatcga 780
tagttttaga gcctatctat tggaattcct cgaactccaa 820
<210> 291
<211> 284
<212> DNA
<213> 人工序列
<220>
<223> 编码肝配蛋白B2的智人基因第二外显子区
<400> 291
atttctacct ggacaaggac tggtactata cccacagata ggagacaaat tggatattat 60
ttgccccaaa gtggactcta aaactgttgg ccagtatgaa tattataaag tttatatggt 120
tgataaagac caagcagaca gatgcactat taagaaggaa aatacccctc tcctcaactg 180
tgccaaacca gaccaagata tcaaattcac catcaagttt caagaattca gccctaacct 240
ctggggtcta gaatttcaga agaacaaaga ttattacatt atat 284
<210> 292
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 编码肝配蛋白B2的智人基因第三外显子区
<400> 292
ctacatcaaa tgggtctttg gagggcctgg ataaccagga gggaggggtg tgccagacaa 60
gagccatgaa gatcctcatg aaagttggac aag 93
<210> 293
<211> 114
<212> DNA
<213> 人工序列
<220>
<223> 编码肝配蛋白B2的智人基因第四外显子区
<400> 293
atgcaagttc tgctggatca accaggaata aagatccaac aagacgtcca gaactagaag 60
ctggtacaaa tggaagaagt tcgacaacaa gtccctttgt aaaaccaaat ccag 114
<210> 294
<211> 3684
<212> DNA
<213> 人工序列
<220>
<223> 编码肝配蛋白B2的智人基因第五外显子区
<400> 294
gttctagcac agacggcaac agcgccggac attcggggaa caacatcctc ggttccgaag 60
tggccttatt tgcagggatt gcttcaggat gcatcatctt catcgtcatc atcatcacgc 120
tggtggtcct cttgctgaag taccggagga gacacaggaa gcactcgccg cagcacacga 180
ccacgctgtc gctcagcaca ctggccacac ccaagcgcag cggcaacaac aacggctcag 240
agcccagtga cattatcatc ccgctaagga ctgcggacag cgtcttctgc cctcactacg 300
agaaggtcag cggggactac gggcacccgg tgtacatcgt ccaggagatg cccccgcaga 360
gcccggcgaa catttactac aaggtctgag agggaccctg gtggtacctg tgctttccca 420
gaggacacct aatgtcccga tgcctccctt gagggtttga gagcccgcgt gctggagaat 480
tgactgaagc acagcaccgg gggagaggga cactcctcct cggaagagcc cgtcgcgctg 540
gacagcttac ctagtcttgt agcattcggc cttggtgaac acacacgctc cctggaagct 600
ggaagactgt gcagaagacg cccattcgga ctgctgtgcc gcgtcccacg tctcctcctc 660
gaagccatgt gctgcggtca ctcaggcctc tgcagaagcc aagggaagac agtggtttgt 720
ggacgagagg gctgtgagca tcctggcagg tgccccagga tgccacgcct ggaagggccg 780
gcttctgcct ggggtgcatt tcccccgcag tgcataccgg acttgtcaca cggacctcgg 840
gctagttaag gtgtgcaaag atctctagag tttagtcctt actgtctcac tcgttctgtt 900
acccagggct ctgcagcacc tcacctgaga cctccactcc acatctgcat cactcatgga 960
acactcatgt ctggagtccc ctcctccagc cgctggcaac aacagcttca gtccatgggt 1020
aatccgttca tagaaattgt gtttgctaac aaggtgccct ttagccagat gctaggctgt 1080
ctgcgaagaa ggctaggagt tcatagaagg gagtggggct ggggaaaggg ctggctgcaa 1140
ttgcagctca ctgctgctgc ctctgaaaca gaaagttgga aaggaaaaaa gaaaaaagca 1200
attaggtagc acagcacttt ggttttgctg agatcgaaga ggccagtagg agacacgaca 1260
gcacacacag tggattccag tgcatgggga ggcactcgct gttatcaaat agcgatgtgc 1320
aggaagaaaa gcccctcttc attccgggga acaaagacgg gtattgttgg gaaaggaaca 1380
ggcttggagg gaagggagaa agtaggccgc tgatgatata ttcgggcagg actgttgtgg 1440
tactggcaat aagatacaca gctccgagct gtaggagagt cggtctgctt tggatgattt 1500
tttaagcaga ctcagctgct atacttatca cattttatta aacacaggga aagcatttag 1560
gagaatagca gagagccaaa tctgacctaa aagttgaaaa gccaaaggtc aaacaggctg 1620
taattccatc atcatcgttg ttattaaaga atccttatct ataaaaggta ggtcagatcc 1680
ccctcccccc aggttcctcc ttcccctccc gattgagcct tacgacactt tggtttatgc 1740
ggtgctgtcc gggtgccagg gctgcagggt cggtactgat ggaggctgca gcgcccggtg 1800
ctctgtgtca aggtgaagca catacggcag acctcttaga gtccttaaga cggaagtaaa 1860
ttatgatgtc cagggggaga aggaagatag gacgtattta taataggtat atagaacaca 1920
agggatataa aatgaaagat ttttactaat atatatttta aggttgcaca cagtacacac 1980
cagaagatgt gaaattcatt tgtggcaatt aagtggtccc aatgctcagc gcttaaaaaa 2040
acaaattgga cagctacttc tgggaaaaac aacatcattc caaaaagaac aataatgaga 2100
gcaaatgcaa aaataaccaa gtcctccgaa ggcatctcac ggaaccgtag actaggaagt 2160
acgagcccca cagagcagga agccgatgtg actgcatcat atatttaaca atgacaagat 2220
gttccggcgt ttatttctgc gttgggtttt cccttgcctt atgggctgaa gtgttctcta 2280
gaatccagca ggtcacactg ggggcttcag gtgacgattt agctgtggct ccctcctcct 2340
gtcctccccc gcaccccctc ccttctggga aacaagaaga gtaaacagga aacctacttt 2400
ttatgtgcta tgcaaaatag acatctttaa catagtcctg ttactatggt aacactttgc 2460
tttctgaatt ggaagggaaa aaaaatgtag cgacagcatt ttaaggttct cagacctcca 2520
gtgagtacct gcaaaaatga gttgtcacag aaattatgat cctctatttc ctgaacctgg 2580
aaatgatgtt ggtccaaagt gcgtgtgtgt atgtgtgagt gggtgcgtgg tatacatgtg 2640
tacatatatg tataatatat atctacaata tatattatat atatctatat catatttctg 2700
tggagggttg ccatggtaac cagccacagt acatatgtaa ttctttccat caccccaacc 2760
tctcctttct gtgcattcat gcaagagttt cttgtaagcc atcagaagtt acttttagga 2820
tgggggagag gggcgagaag gggaaaaatg ggaaatagtc tgattttaat gaaatcaaat 2880
gtatgtatca tcagttggct acgttttggt tctatgctaa actgtgaaaa atcagatgaa 2940
ttgataaaag agttccctgc aaccaattga aaagtgttct gtgcgtctgt tttgtgtctg 3000
gtgcagaata tgacaatcta ccaactgtcc ctttgtttga agttggttta gctttggaaa 3060
gttactgtaa atgccttgct tgtatgatcg tccctggtca cccgactttg gaatttgcac 3120
catcatgttt cagtgaagat gctgtaaata ggttcagatt ttactgtcta tggatttggg 3180
gtgttacagt agccttattc acctttttaa taaaaataca catgaaaaca agaaagaaat 3240
ggcttttctt acccagattg tgtacataga gcaatgttgg ttttttataa agtctaagca 3300
agatgttttg tataaaatct gaattttgca atgtatttag ctacagcttg tttaacggca 3360
gtgtcattcc cctttgcact gtaatgagga aaaaatggta taaaaggttg ccaaattgct 3420
gcatatttgt gccgtaatta tgtaccatga atatttattt aaaatttcgt tgtccaattt 3480
gtaagtaaca cagtattatg cctgagttat aaatattttt ttctttcttt gttttatttt 3540
aatagcctgt cataggtttt aaatctgctt tagtttcaca ttgcagttag ccccagaaaa 3600
tgaaatccgt gaagtcacat tccacatctg tttcaaactg aatttgttct taaaaaaata 3660
aaatattttt ttcctatgga aaaa 3684
<210> 295
<211> 1002
<212> DNA
<213> 人工序列
<220>
<223> 编码肝配蛋白B2的智人基因和mRNA转录本变体1的蛋白质编码区
<400> 295
atggctgtga gaagggactc cgtgtggaag tactgctggg gtgttttgat ggttttatgc 60
agaactgcga tttccaaatc gatagtttta gagcctatct attggaattc ctcgaactcc 120
aaatttctac ctggacaagg actggtacta tacccacaga taggagacaa attggatatt 180
atttgcccca aagtggactc taaaactgtt ggccagtatg aatattataa agtttatatg 240
gttgataaag accaagcaga cagatgcact attaagaagg aaaatacccc tctcctcaac 300
tgtgccaaac cagaccaaga tatcaaattc accatcaagt ttcaagaatt cagccctaac 360
ctctggggtc tagaatttca gaagaacaaa gattattaca ttatatctac atcaaatggg 420
tctttggagg gcctggataa ccaggaggga ggggtgtgcc agacaagagc catgaagatc 480
ctcatgaaag ttggacaaga tgcaagttct gctggatcaa ccaggaataa agatccaaca 540
agacgtccag aactagaagc tggtacaaat ggaagaagtt cgacaacaag tccctttgta 600
aaaccaaatc caggttctag cacagacggc aacagcgccg gacattcggg gaacaacatc 660
ctcggttccg aagtggcctt atttgcaggg attgcttcag gatgcatcat cttcatcgtc 720
atcatcatca cgctggtggt cctcttgctg aagtaccgga ggagacacag gaagcactcg 780
ccgcagcaca cgaccacgct gtcgctcagc acactggcca cacccaagcg cagcggcaac 840
aacaacggct cagagcccag tgacattatc atcccgctaa ggactgcgga cagcgtcttc 900
tgccctcact acgagaaggt cagcggggac tacgggcacc cggtgtacat cgtccaggag 960
atgcccccgc agagcccggc gaacatttac tacaaggtct ga 1002
<210> 296
<211> 3295
<212> DNA
<213> 人工序列
<220>
<223> 肝配蛋白B2的智人mRNA转录本变体1的3'-非翻译区(UTR)
<400> 296
gagggaccct ggtggtacct gtgctttccc agaggacacc taatgtcccg atgcctccct 60
tgagggtttg agagcccgcg tgctggagaa ttgactgaag cacagcaccg ggggagaggg 120
acactcctcc tcggaagagc ccgtcgcgct ggacagctta cctagtcttg tagcattcgg 180
ccttggtgaa cacacacgct ccctggaagc tggaagactg tgcagaagac gcccattcgg 240
actgctgtgc cgcgtcccac gtctcctcct cgaagccatg tgctgcggtc actcaggcct 300
ctgcagaagc caagggaaga cagtggtttg tggacgagag ggctgtgagc atcctggcag 360
gtgccccagg atgccacgcc tggaagggcc ggcttctgcc tggggtgcat ttcccccgca 420
gtgcataccg gacttgtcac acggacctcg ggctagttaa ggtgtgcaaa gatctctaga 480
gtttagtcct tactgtctca ctcgttctgt tacccagggc tctgcagcac ctcacctgag 540
acctccactc cacatctgca tcactcatgg aacactcatg tctggagtcc cctcctccag 600
ccgctggcaa caacagcttc agtccatggg taatccgttc atagaaattg tgtttgctaa 660
caaggtgccc tttagccaga tgctaggctg tctgcgaaga aggctaggag ttcatagaag 720
ggagtggggc tggggaaagg gctggctgca attgcagctc actgctgctg cctctgaaac 780
agaaagttgg aaaggaaaaa agaaaaaagc aattaggtag cacagcactt tggttttgct 840
gagatcgaag aggccagtag gagacacgac agcacacaca gtggattcca gtgcatgggg 900
aggcactcgc tgttatcaaa tagcgatgtg caggaagaaa agcccctctt cattccgggg 960
aacaaagacg ggtattgttg ggaaaggaac aggcttggag ggaagggaga aagtaggccg 1020
ctgatgatat attcgggcag gactgttgtg gtactggcaa taagatacac agctccgagc 1080
tgtaggagag tcggtctgct ttggatgatt ttttaagcag actcagctgc tatacttatc 1140
acattttatt aaacacaggg aaagcattta ggagaatagc agagagccaa atctgaccta 1200
aaagttgaaa agccaaaggt caaacaggct gtaattccat catcatcgtt gttattaaag 1260
aatccttatc tataaaaggt aggtcagatc cccctccccc caggttcctc cttcccctcc 1320
cgattgagcc ttacgacact ttggtttatg cggtgctgtc cgggtgccag ggctgcaggg 1380
tcggtactga tggaggctgc agcgcccggt gctctgtgtc aaggtgaagc acatacggca 1440
gacctcttag agtccttaag acggaagtaa attatgatgt ccagggggag aaggaagata 1500
ggacgtattt ataataggta tatagaacac aagggatata aaatgaaaga tttttactaa 1560
tatatatttt aaggttgcac acagtacaca ccagaagatg tgaaattcat ttgtggcaat 1620
taagtggtcc caatgctcag cgcttaaaaa aacaaattgg acagctactt ctgggaaaaa 1680
caacatcatt ccaaaaagaa caataatgag agcaaatgca aaaataacca agtcctccga 1740
aggcatctca cggaaccgta gactaggaag tacgagcccc acagagcagg aagccgatgt 1800
gactgcatca tatatttaac aatgacaaga tgttccggcg tttatttctg cgttgggttt 1860
tcccttgcct tatgggctga agtgttctct agaatccagc aggtcacact gggggcttca 1920
ggtgacgatt tagctgtggc tccctcctcc tgtcctcccc cgcaccccct cccttctggg 1980
aaacaagaag agtaaacagg aaacctactt tttatgtgct atgcaaaata gacatcttta 2040
acatagtcct gttactatgg taacactttg ctttctgaat tggaagggaa aaaaaatgta 2100
gcgacagcat tttaaggttc tcagacctcc agtgagtacc tgcaaaaatg agttgtcaca 2160
gaaattatga tcctctattt cctgaacctg gaaatgatgt tggtccaaag tgcgtgtgtg 2220
tatgtgtgag tgggtgcgtg gtatacatgt gtacatatat gtataatata tatctacaat 2280
atatattata tatatctata tcatatttct gtggagggtt gccatggtaa ccagccacag 2340
tacatatgta attctttcca tcaccccaac ctctcctttc tgtgcattca tgcaagagtt 2400
tcttgtaagc catcagaagt tacttttagg atgggggaga ggggcgagaa ggggaaaaat 2460
gggaaatagt ctgattttaa tgaaatcaaa tgtatgtatc atcagttggc tacgttttgg 2520
ttctatgcta aactgtgaaa aatcagatga attgataaaa gagttccctg caaccaattg 2580
aaaagtgttc tgtgcgtctg ttttgtgtct ggtgcagaat atgacaatct accaactgtc 2640
cctttgtttg aagttggttt agctttggaa agttactgta aatgccttgc ttgtatgatc 2700
gtccctggtc acccgacttt ggaatttgca ccatcatgtt tcagtgaaga tgctgtaaat 2760
aggttcagat tttactgtct atggatttgg ggtgttacag tagccttatt caccttttta 2820
ataaaaatac acatgaaaac aagaaagaaa tggcttttct tacccagatt gtgtacatag 2880
agcaatgttg gttttttata aagtctaagc aagatgtttt gtataaaatc tgaattttgc 2940
aatgtattta gctacagctt gtttaacggc agtgtcattc ccctttgcac tgtaatgagg 3000
aaaaaatggt ataaaaggtt gccaaattgc tgcatatttg tgccgtaatt atgtaccatg 3060
aatatttatt taaaatttcg ttgtccaatt tgtaagtaac acagtattat gcctgagtta 3120
taaatatttt tttctttctt tgttttattt taatagcctg tcataggttt taaatctgct 3180
ttagtttcac attgcagtta gccccagaaa atgaaatccg tgaagtcaca ttccacatct 3240
gtttcaaact gaatttgttc ttaaaaaaat aaaatatttt tttcctatgg aaaaa 3295

Claims (37)

1.由10至28个核苷酸组成的反义寡核苷酸以及所述反义寡核苷酸的盐和光学异构体,并且所述10至28个核苷酸中的至少两个是LNA,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列CTGAATTTTGCAATGT(Seq.ID No.3)或AAATGCCTTGCTTGTA(Seq.IDNo.2),并且所述反义寡核苷酸包含能够与所述序列CTGAATTTTGCAATGT(Seq.ID No.3)或AAATGCCTTGCTTGTA(Seq.ID No.2)杂交的至少10个连续核苷酸的序列,
其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且
其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。
2.根据权利要求1所述的反义寡核苷酸,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域位于编码Efnb2的mRNA的3’-非翻译区(UTR)内。
3.根据权利要求1或2所述的反义寡核苷酸,其中所述反义寡核苷酸选择性地仅与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列CTGAATTTTGCAATGT(Seq.ID No.3)杂交;或其中所述反义寡核苷酸选择性地仅与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列AAATGCCTTGCTTGTA(Seq.ID No.2)杂交。
4.根据权利要求1-3中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸具有12至16个核苷酸的长度,和/或其中所述反义寡核苷酸具有在3’末端有1至5个LNA单元和在5’末端有1至5个LNA单元的gapmer结构,和/或其中所述反义寡核苷酸具有磷酸酯、硫代磷酸酯和/或二硫代磷酸酯作为核苷酸间键联。
5.根据权利要求1-4中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸由以下通式(S3)5’-N5-GCAAAATT-N6-3’(Seq.ID No.94)表示,其中
N5代表:AGCTGTAGCTAAATACATT-,GCTGTAGCTAAATACATT-,CTGTAGCTAAATACATT-,TGTAGCTAAATACATT-,GTAGCTAAATACATT-,TAGCTAAATACATT-,AGCTAAATACATT-,GCTAAATACATT-,GCTAAATACATT-,CTAAATACATT-,TAAATACATT-,AAATACATT-,AATACATT-,ATACATT-,TACATT-,ACATT-,CATT-,ATT-,TT-或T-;和
N6代表:-CAGATTTTATACAAAACAT,-CAGATTTTATACAAAACA,-CAGATTTTATACAAAAC,-CAGATTTTATACAAAA,-CAGATTTTATACAAA,-CAGATTTTATACAA,-CAGATTTTATACA,-CAGATTTTATAC,-CAGATTTTATA,-CAGATTTTAT,-CAGATTTTA,-CAGATTTT,-CAGATTT,-CAGATT,-CAGAT,-CAGA,-CAG,-CA或-C;
以及所述反义寡核苷酸的盐和光学异构体。
6.根据权利要求1-4中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸由以下通式(S3A)5’-N5A-CAAAATTC-N6A-3’(Seq.ID No.95)表示,其中
N5A代表:GCTGTAGCTAAATACATTG-,CTGTAGCTAAATACATTG-,TGTAGCTAAATACATTG-,GTAGCTAAATACATTG-,TAGCTAAATACATTG-,AGCTAAATACATTG-,GCTAAATACATTG-,GCTAAATACATTG-,CTAAATACATTG-,TAAATACATTG-,AAATACATTG-,AATACATTG-,ATACATTG-,TACATTG-,ACATTG-,CATTG-,ATTG-,TTG-,TG-或G-;和
N6A代表:-AGATTTTATACAAAACATC,-AGATTTTATACAAAACAT,-AGATTTTATACAAAACA,-AGATTTTATACAAAAC,-AGATTTTATACAAAA,-AGATTTTATACAAA,-AGATTTTATACAA,-AGATTTTATACA,-AGATTTTATAC,-AGATTTTATA,-AGATTTTAT,-AGATTTTA,-AGATTTT,-AGATTT,-AGATT,-AGAT,-AGA,-AG或-A;
以及所述反义寡核苷酸的盐和光学异构体。
7.根据权利要求1-4中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸由以下通式(S3B)5’-N5B-AAAATTCA-N6B-3’(Seq.ID No.96)表示,其中
N5B代表:CTGTAGCTAAATACATTGC-,TGTAGCTAAATACATTGC-,GTAGCTAAATACATTGC-,TAGCTAAATACATTGC-,AGCTAAATACATTGC-,GCTAAATACATTGC-,GCTAAATACATTGC-,CTAAATACATTGC-,TAAATACATTGC-,AAATACATTGC-,AATACATTGC-,ATACATTGC-,TACATTGC-,ACATTGC-,CATTGC-,ATTGC-,TTGC-,TGC-,GC-或C-;和
N6B代表:-GATTTTATACAAAACATCT,-GATTTTATACAAAACATC-GATTTTATACAAAACAT,-GATTTTATACAAAACA,-GATTTTATACAAAAC,-GATTTTATACAAAA,-GATTTTATACAAA,-GATTTTATACAA,-GATTTTATACA,-GATTTTATAC,-GATTTTATA,-GATTTTAT,-GATTTTA,-GATTTT,-GATTT,-GATT,-GAT,-GA或-G;
以及所述反义寡核苷酸的盐和光学异构体。
8.根据权利要求1-4中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸由以下通式(S2)5’-N3-AGCAAGGC-N4-3’(Seq.ID No.64)表示,其中
N3代表:GACCAGGGACGATCATACA-,ACCAGGGACGATCATACA-,CCAGGGACGATCATACA-,CAGGGACGATCATACA-,AGGGACGATCATACA-,GGGACGATCATACA-,GGACGATCATACA-,GACGATCATACA-,ACGATCATACA-,CGATCATACA-,GATCATACA-,ATCATACA-,TCATACA-,CATACA-,ATACA-,TACA-,ACA-,CA-或A-;和
N4代表:-ATTTACAGTAACTTTACAA,-ATTTACAGTAACTTTACA,-ATTTACAGTAACTTTAC,-ATTTACAGTAACTTTA,-ATTTACAGTAACTTT,-ATTTACAGTAACTT,ATTTACAGTAACT,-ATTTACAGTAAC,-ATTTACAGTAA,-ATTTACAGTA,-ATTTACAGT,-ATTTACAGT,-ATTTACAG,-ATTTACA,-ATTTAC,-ATTTA,-ATTT,-ATT,-AT或-A;
以及所述反义寡核苷酸的盐和光学异构体。
9.根据权利要求1-4中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸由以下通式(S2A)5’-N3A-AAGCAAGG-N4A-3’(Seq.ID No.65)表示,其中
N3A代表:TGACCAGGGACGATCATAC-,GACCAGGGACGATCATAC-,ACCAGGGACGATCATAC-,CCAGGGACGATCATAC-,CAGGGACGATCATAC-,AGGGACGATCATAC-,GGGACGATCATAC-,GGACGATCATAC-,GACGATCATAC-,ACGATCATAC-,CGATCATAC-,GATCATAC-,ATCATAC-,TCATAC-,CATAC-,ATAC-,TAC-,AC-或C-;和
N4A代表:-CATTTACAGTAACTTTACA,-CATTTACAGTAACTTTAC,-CATTTACAGTAACTTTA,-CATTTACAGTAACTTT,-CATTTACAGTAACTT,-CATTTACAGTAACT,-CATTTACAGTAAC,-CATTTACAGTAA,-CATTTACAGTA,-CATTTACAGT,-CATTTACAGT,-CATTTACAG,-CATTTACA,-CATTTAC,-CATTTA,-CATTT,-CATT,-CAT,-CA或-C;
以及所述反义寡核苷酸的盐和光学异构体。
10.根据权利要求1-4中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸由以下通式(S2B)5’-N3B-GCAAGGCA-N4B-3’(Seq.ID No.66)表示,其中
N3B代表:ACCAGGGACGATCATACAA-,CCAGGGACGATCATACAA-,CAGGGACGATCATACAA-,AGGGACGATCATACAA-,GGGACGATCATACAA-,GGACGATCATACAA-,GACGATCATACAA-,ACGATCATACAA-,CGATCATACAA-,GATCATACAA-,ATCATACAA-,TCATACAA-,CATACAA-,ATACAA-,TACAA-,ACAA-,CAA-,AA-或A-;和
N4B代表:-TTTACAGTAACTTTACAAA,-TTTACAGTAACTTTACAA,-TTTACAGTAACTTTACA,-TTTACAGTAACTTTAC,-TTTACAGTAACTTTA,-TTTACAGTAACTTT,-TTTACAGTAACTT,-TTTACAGTAACT,-TTTACAGTAAC,-TTTACAGTAA,-TTTACAGTA,-TTTACAGT,-TTTACAGT,-TTTACAG,-TTTACA,-TTTAC,-TTTA,-TTT,-TT或-T;
以及所述反义寡核苷酸的盐和光学异构体。
11.根据权利要求1-10中任一项所述的反义寡核苷酸,其中5’末端的最后2至4个核苷酸是LNA核苷酸,并且3’末端的最后2至4个核苷酸是LNA核苷酸,并且在5’末端的LNA核苷酸与3’末端的LNA核苷酸之间存在至少6个连续核苷酸,所述至少6个连续核苷酸是非LNA核苷酸或是DNA核苷酸。
12.根据权利要求1-11中任一项所述的反义寡核苷酸,其中所述LNA核苷酸通过硫代磷酸基团或二硫代磷酸基团彼此连接,或其中所有核苷酸通过磷酸基团或硫代磷酸基团或二硫代磷酸基团彼此连接。
13.根据权利要求1-12中任一项所述的反义寡核苷酸,其中所述LNA核苷酸选自以下的组:
其中
IL’代表-X”-P(=X’)(X-)-;
X’代表=O或=S;
X-代表-O-,-OH,-ORH,-NHRH,-N(RH)2,-OCH2CH2ORH,-OCH2CH2SRH,-BH3 -,-RH,-SH,-SRH,或-S-
X”代表-O-,-NH-,-NRH-,-CH2-或-S-;
Y是-O-,-NH-,-NRH-,-CH2-或-S-;
RC和RH各自独立地选自氢和C1-4-烷基;
B代表选自以下的组的核碱基:
腺嘌呤、胸腺嘧啶、鸟嘌呤、胞嘧啶、尿嘧啶、5-甲基胞嘧啶、5-羟甲基胞嘧啶、N4-甲基胞嘧啶、黄嘌呤、次黄嘌呤、7-脱氮黄嘌呤、2-氨基腺嘌呤、6-甲基腺嘌呤、6-甲基鸟嘌呤、6-乙基腺嘌呤、6-乙基鸟嘌呤、2-丙基腺嘌呤、2-丙基鸟嘌呤、6-羧基尿嘧啶、5,6-二氢尿嘧啶、5-丙炔尿嘧啶、5-丙炔胞嘧啶、6-氮杂尿嘧啶、6-氮杂胞嘧啶、6-氮杂胸腺嘧啶、5-尿嘧啶、4-硫代尿嘧啶、8-氟腺嘌呤、8-氯腺嘌呤、8-溴腺嘌呤、8-碘腺嘌呤、8-氨基腺嘌呤、8-硫代腺嘌呤、8-硫代烷基腺嘌呤、8-羟基腺嘌呤、8-氟鸟嘌呤、8-氯鸟嘌呤、8-溴鸟嘌呤、8-碘鸟嘌呤、8-氨基鸟嘌呤、8-硫代鸟嘌呤、8-硫代烷基鸟嘌呤、8-羟基鸟嘌呤、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、5-三氟甲基尿嘧啶、5-氟胞嘧啶、5-溴胞嘧啶、5-氯胞嘧啶、5-碘胞嘧啶、5-三氟甲基胞嘧啶、7-甲基鸟嘌呤、7-甲基腺嘌呤、8-氮杂鸟嘌呤、8-氮杂腺嘌呤、7-脱氮鸟嘌呤、7-脱氮腺嘌呤、7-脱氮-8-氮杂腺嘌呤、3-脱氮鸟嘌呤、3-脱氮腺嘌呤、2-硫代尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶。
14.根据权利要求1-13中任一项所述的反义寡核苷酸,其具有以下的gapmer结构中的一种:2-8-2,2-8-3,3-8-2,3-8-3,4-8-2,2-8-4,3-8-4,4-8-3,4-8-4,2-9-2,2-9-3,3-9-2,3-9-3,4-9-2,2-9-4,4-9-3,3-9-4,3-10-3,2-10-4,4-10-2,2-11-3,3-11-2,2-11-2。
15.根据权利要求1-14中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸与编码Efnb2的基因的区域或编码Efnb2的mRNA以100%的互补性结合,并且不与人类转录组中的任何其他区域结合。
16.根据权利要求1-15中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸由以下序列表示:CAAGCAAGGC(Seq.ID No.39),AAGCAAGGCA(Seq.ID No.40),AGCAAGGCAT(Seq.IDNo.41),TACAAGCAAGGC(Seq.ID No.44),ACAAGCAAGGCA(Seq.ID No.45),CAAGCAAGGCAT(Seq.ID No.46),AAGCAAGGCATT(Seq.IDNo.47),AGCAAGGCATTT(Seq.ID No.48),TACAAGCAAGGCATT(Seq.ID No.49),ACAAGCAAGGCATTT(Seq.ID No.50),ACAAGCAAGGC(Seq.ID No.52),CAAGCAAGGCA(Seq.ID No.53),AAGCAAGGCAT(Seq.ID No.54),AGCAAGGCATT(Seq.ID No.55),TACAAGCAAGGCA(Seq.ID No.57),ACAAGCAAGGCAT(Seq.IDNo.58),CAAGCAAGGCATT(Seq.IDNo.59),AAGCAAGGCATTT(Seq.ID No.60),TACAAGCAAGGCAT(Seq.ID No.61),ACAAGCAAGGCATT(Seq.ID No.62)CAAGCAAGGCATTT(Seq.ID No.63)TACAAGCAAGGCATTT(Seq.ID No.5),TGCAAAATTC(Seq.ID No.71),GCAAAATTCA(Seq.IDNo.72),CAAAATTCAG(Seq.ID No.73),TGCAAAATTCAG(Seq.ID No.74),ATTGCAAAATTC(Seq.ID No.77),TTGCAAAATTCA(Seq.ID No.78),ACATTGCAAAATTCA(Seq.ID No.79),CATTGCAAAATTCAG(Seq.ID No.80),ACATTGCAAAATTCAG(Seq.ID No.6),TTGCAAAATTC(Seq.ID No.84),TGCAAAATTCA(Seq.ID No.85),GCAAAATTCAG(Seq.ID No.86),CATTGCAAAATTC(Seq.ID No.88),ATTGCAAAATTCA(Seq.ID No.89),TTGCAAAATTCAG(Seq.IDNo.90),ACATTGCAAAATTC(Seq.ID No.91),CATTGCAAAATTCA(Seq.IDNo.92)或ATTGCAAAATTCAG(Seq.ID No.93),以及所述反义寡核苷酸的盐和光学异构体。
17.选自以下的组的反义寡核苷酸:
其中
b1是β-D-氧代-LNA,b2是β-D-硫代-LNA,b3是β-D-氨基-LNA,b4是α-L-氧代-LNA,b5是β-D-ENA,b6是β-D-(NH)-LNA,b7是β-D-(NCH3)-LNA,
d是2-脱氧;
C*是甲基-C(5-甲基胞嘧啶);
dC*是5-甲基-2’-脱氧胞苷;
s代表核苷酸间键联硫代磷酸基团(-O-P(O)(S-)-O-);
ss代表核苷酸间键联二硫代磷酸基团(-O-P(S)(S-)-O-),其中
以粗体显示的核苷酸是LNA核苷酸,以及
以非粗体显示的核苷酸是非LNA核苷酸。
18.由10至28个核苷酸组成的反义寡核苷酸以及所述反义寡核苷酸的盐和光学异构体,并且所述10至28个核苷酸中的至少两个是LNA,并且所述反义寡核苷酸能够与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域杂交,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含序列AATTCAGCCCTAACCT(Seq.IDNo.1),并且所述反义寡核苷酸包含能够与所述序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交的至少10个连续核苷酸的序列,
其中编码Efnb2的基因的区域位于编码Efnb2的基因的外显子区域内;并且
其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域包含在人和小鼠之间100%保守的至少28个连续核苷酸的序列。
19.根据权利要求18所述的反义寡核苷酸,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域位于编码Efnb2的基因或mRNA的区域的蛋白质编码序列内。
20.根据权利要求18或19所述的反义寡核苷酸,其中编码Efnb2的基因的区域或编码Efnb2的mRNA的区域位于编码Efnb2的基因或mRNA的区域的开放阅读框内。
21.根据权利要求18-20中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸选择性地仅与编码Efnb2的基因的区域或编码Efnb2的mRNA的区域的序列AATTCAGCCCTAACCT(Seq.ID No.1)杂交。
22.根据权利要求18-21中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸具有12至16个核苷酸的长度,和/或其中所述反义寡核苷酸具有在3’末端有1至5个LNA单元和在5’末端有1至5个LNA单元的gapmer结构,和/或其中所述反义寡核苷酸具有磷酸酯、硫代磷酸酯和/或二硫代磷酸酯作为核苷酸间键联。
23.根据权利要求18-22中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸由以下通式(S1)5’-N1-TAGGGCTG-N2-3’(Seq.ID No.7)表示,其中
N1代表:AATTCTAGACCCCAGAGGT-,ATTCTAGACCCCAGAGGT-,TTCTAGACCCCAGAGGT-,TCTAGACCCCAGAGGT-,CTAGACCCCAGAGGT-,TAGACCCCAGAGGT-,AGACCCCAGAGGT-,GACCCCAGAGGT-,ACCCCAGAGGT-,CCCCAGAGGT-,CCCAGAGGT-,CCAGAGGT-,CAGAGGT-,AGAGGT-,GAGGT-,AGGT-,GGT-,GT-或T-;和
N2代表:-AATTCTTGAAACTTGATGG,-AATTCTTGAAACTTGATG,-AATTCTTGAAACTTGAT,-AATTCTTGAAACTTGA,-AATTCTTGAAACTTG,-AATTCTTGAAACTT,-AATTCTTGAAACT,-AATTCTTGAAAC,-AATTCTTGAAA,-AATTCTTGAA,-AATTCTTGA,-AATTCTTG,-AATTCTT,-AATTCT,-AATTC,-AATT,-AAT,-AA或-A;
以及所述反义寡核苷酸的盐和光学异构体。
24.根据权利要求18-22中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸由以下通式(S1A)5’-N1A-TTAGGGCT-N2A-3’(Seq.ID No.34)表示,其中
N1A代表:AAATTCTAGACCCCAGAGG-,AATTCTAGACCCCAGAGG-,ATTCTAGACCCCAGAGG-,TTCTAGACCCCAGAGG-,TCTAGACCCCAGAGG-,CTAGACCCCAGAGG-,TAGACCCCAGAGG-,AGACCCCAGAGG-,GACCCCAGAGG-,ACCCCAGAGG-,CCCCAGAGG-,CCCAGAGG-,CCAGAGG-,CAGAGG-,AGAGGT-,GAGG-,AGG-,GG-或G-;和
N2A代表:-GAATTCTTGAAACTTGATG,-GAATTCTTGAAACTTGAT,-GAATTCTTGAAACTTGA,-GAATTCTTGAAACTTG,-GAATTCTTGAAACTT,-GAATTCTTGAAACT,-GAATTCTTGAAAC,-GAATTCTTGAAA,-GAATTCTTGAA,-GAATTCTTGA,-GAATTCTTG,-GAATTCTT,-GAATTCT,-GAATTC,-GAATT,-GAAT,-GAA,-GA或-G;
以及所述反义寡核苷酸的盐和光学异构体。
25.根据权利要求18-22中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸由以下通式(S1B)5’-N1B-GTTAGGGC-N2B-3’(Seq.ID No.35)表示,其中
N1B代表:GAAATTCTAGACCCCAGAG-,AAATTCTAGACCCCAGAG-,AATTCTAGACCCCAGAG-,ATTCTAGACCCCAGAG-,TTCTAGACCCCAGAG-,TCTAGACCCCAGAG-,CTAGACCCCAGAG-,TAGACCCCAGAG-,AGACCCCAGAG-,GACCCCAGAG-,ACCCCAGAG-,CCCCAGAG-,CCCAGAG-,CCAGAG-,CAGAG-,AGAG-,GAG-,AG-或G-;和
N2B代表:-TGAATTCTTGAAACTTGAT,-TGAATTCTTGAAACTTGA,-TGAATTCTTGAAACTTG,-TGAATTCTTGAAACTT,-TGAATTCTTGAAACT,-TGAATTCTTGAAAC,-TGAATTCTTGAAA,-TGAATTCTTGAA,-TGAATTCTTGA,-TGAATTCTTG,-TGAATTCTT,-TGAATTCT,-TGAATTC,-TGAATT,-TGAAT,-TGAA,-TGA,-TG或-T;
以及所述反义寡核苷酸的盐和光学异构体。
26.根据权利要求18-25中任一项所述的反义寡核苷酸,其中5’末端的最后2至4个核苷酸是LNA核苷酸,并且3’末端的最后2至4个核苷酸是LNA核苷酸,并且在5’末端的LNA核苷酸与3’末端的LNA核苷酸之间存在至少6个连续核苷酸,所述至少6个连续核苷酸是非LNA核苷酸或是DNA核苷酸。
27.根据权利要求18-26中任一项所述的反义寡核苷酸,其中所述LNA核苷酸通过硫代磷酸基团或二硫代磷酸基团彼此连接,或其中所有核苷酸通过磷酸基团或硫代磷酸基团或二硫代磷酸基团彼此连接。
28.根据权利要求18-27中任一项所述的反义寡核苷酸,其中所述LNA核苷酸选自以下的组:
其中
IL’代表-X”-P(=X’)(X-)-;
X’代表=O或=S;
X-代表-O-,-OH,-ORH,-NHRH,-N(RH)2,-OCH2CH2ORH,-OCH2CH2SRH,-BH3 -,-RH,-SH,-SRH或-S-
X”代表-O-,-NH-,-NRH-,-CH2-或-S-;
Y是-O-,-NH-,-NRH-,-CH2-或-S-;
RC和RH各自独立地选自氢和C1-4-烷基;
B代表选自以下的组的核碱基:
腺嘌呤、胸腺嘧啶、鸟嘌呤、胞嘧啶、尿嘧啶、5-甲基胞嘧啶、5-羟甲基胞嘧啶、N4-甲基胞嘧啶、黄嘌呤、次黄嘌呤、7-脱氮黄嘌呤、2-氨基腺嘌呤、6-甲基腺嘌呤、6-甲基鸟嘌呤、6-乙基腺嘌呤、6-乙基鸟嘌呤、2-丙基腺嘌呤、2-丙基鸟嘌呤、6-羧基尿嘧啶、5,6-二氢尿嘧啶、5-丙炔尿嘧啶、5-丙炔胞嘧啶、6-氮杂尿嘧啶、6-氮杂胞嘧啶、6-氮杂胸腺嘧啶、5-尿嘧啶、4-硫代尿嘧啶、8-氟腺嘌呤、8-氯腺嘌呤、8-溴腺嘌呤、8-碘腺嘌呤、8-氨基腺嘌呤、8-硫代腺嘌呤、8-硫代烷基腺嘌呤、8-羟基腺嘌呤、8-氟鸟嘌呤、8-氯鸟嘌呤、8-溴鸟嘌呤、8-碘鸟嘌呤、8-氨基鸟嘌呤、8-硫代鸟嘌呤、8-硫代烷基鸟嘌呤、8-羟基鸟嘌呤、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、5-三氟甲基尿嘧啶、5-氟胞嘧啶、5-溴胞嘧啶、5-氯胞嘧啶、5-碘胞嘧啶、5-三氟甲基胞嘧啶、7-甲基鸟嘌呤、7-甲基腺嘌呤、8-氮杂鸟嘌呤、8-氮杂腺嘌呤、7-脱氮鸟嘌呤、7-脱氮腺嘌呤、7-脱氮-8-氮杂腺嘌呤、3-脱氮鸟嘌呤、3-脱氮腺嘌呤、2-硫代尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶。
29.根据权利要求18-28中任一项所述的反义寡核苷酸,其具有以下的gapmer结构中的一种:2-8-2,2-8-3,3-8-2,3-8-3,4-8-2,2-8-4,3-8-4,4-8-3,4-8-4,2-9-2,2-9-3,3-9-2,3-9-3,4-9-2,2-9-4,4-9-3,3-9-4,3-10-3,2-10-4,4-10-2,2-11-3,3-11-2,2-11-2。
30.根据权利要求18-29中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸与编码Efnb2的基因的区域或编码Efnb2的mRNA以100%的互补性结合,并且不与人类转录组中的任何其他区域结合。
31.根据权利要求18-30中任一项所述的反义寡核苷酸,其中所述反义寡核苷酸由以下序列表示:GGTTAGGGCT(Seq.ID No.9),GTTAGGGCTG(Seq.ID No.10),TTAGGGCTGA(Seq.IDNo.11),AGGTTAGGGCTG(Seq.ID No.15),GGTTAGGGCTGA(Seq.ID No.16),GTTAGGGCTGAA(Seq.ID No.17),TTAGGGCTGAAT(Seq.IDNo.18),AGGTTAGGGCTGAAT(Seq.ID No.19),GGTTAGGGCTGAATT(Seq.ID No.20),GGTTAGGGCTG(Seq.IDNo.21),GTTAGGGCTGA(Seq.IDNo.22),TTAGGGCTGAA(Seq.IDNo.23),AGGTTAGGGCTGA(Seq.ID No.26),GGTTAGGGCTGAA(Seq.ID No.27),GTTAGGGCTGAAT(Seq.IDNo.28),TTAGGGCTGAATT(Seq.ID No.29),AGGTTAGGGCTGAA(Seq.ID No.30),GGTTAGGGCTGAAT(Seq.ID No.31),GTTAGGGCTGAATT(Seq.ID No.32),AGGTTAGGGCTGAATT(Seq.ID No.4)。
32.选自以下的组的反义寡核苷酸:
/>
/>
33.根据权利要求1-32中任一项所述的反义寡核苷酸,用于预防和治疗肾病和/或糖尿病中的蛋白尿和/或糖尿病肾病。
34.含有至少一种根据权利要求1-32中任一项所述的反义寡核苷酸以及至少一种药学上可接受的载体、赋性剂、佐剂、溶剂或稀释剂的药物组合物。
35.一种治疗患有选自肾病和/或糖尿病蛋白尿和/或糖尿病肾病的疾病的动物(或人或患者)的方法,包括向所述动物施用治疗或预防有效量的权利要求1-32的反义寡核苷酸或权利要求34的药物组合物。
36.一种抑制细胞或组织中的肝配蛋白-B2表达的方法,包括用有效量的权利要求1-32的反义寡核苷酸孵育所述细胞或组织。
37.一种恢复细胞或组织中的肾病蛋白功能的方法,包括用有效量的权利要求1-32的反义寡核苷酸孵育所述细胞或组织。
CN202280054813.1A 2021-06-15 2022-06-15 用于通过肝配蛋白-b2抑制防止由内皮功能障碍导致的肾功能障碍的反义寡核苷酸 Pending CN117795071A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21179667.7 2021-06-15
EP21179667.7A EP4105328A1 (en) 2021-06-15 2021-06-15 Antisense-oligonucleotides for prevention of kidney dysfunction promoted by endothelial dysfunction by ephrin-b2 suppression
PCT/EP2022/066418 WO2022263569A1 (en) 2021-06-15 2022-06-15 Antisense-oligonucleotides for prevention of kidney dysfunction promoted by endothelial dysfunction by ephrin-b2 suppression

Publications (1)

Publication Number Publication Date
CN117795071A true CN117795071A (zh) 2024-03-29

Family

ID=76483176

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280054813.1A Pending CN117795071A (zh) 2021-06-15 2022-06-15 用于通过肝配蛋白-b2抑制防止由内皮功能障碍导致的肾功能障碍的反义寡核苷酸

Country Status (7)

Country Link
EP (2) EP4105328A1 (zh)
JP (1) JP2024521974A (zh)
CN (1) CN117795071A (zh)
AU (1) AU2022294047A1 (zh)
BR (1) BR112023026411A2 (zh)
CA (1) CA3221021A1 (zh)
WO (1) WO2022263569A1 (zh)

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE237362T1 (de) 1996-02-19 2003-05-15 Amersham Health As Thermostabilisiertes kontrastmittel
US20040110150A1 (en) * 2002-12-10 2004-06-10 Isis Pharmaceuticals Inc. Modulation of Ephrin-B2 expression
DK3222722T3 (da) 2002-11-18 2019-06-17 Roche Innovation Ct Copenhagen As Antisense-design
WO2004080425A2 (en) * 2003-03-12 2004-09-23 Vasgene Therapeutics, Inc. Polypeptide compounds for inhibiting angiogenesis and tumor growth
CA2581430A1 (en) * 2004-09-23 2006-03-30 Vasgene Therapeutics, Inc. Compositions and methods for detecting and treating tumors
WO2007031091A2 (en) 2005-09-15 2007-03-22 Santaris Pharma A/S Rna antagonist compounds for the modulation of p21 ras expression
US20070218061A1 (en) * 2005-09-23 2007-09-20 Vasgene Therapeutics, Inc. Use of ephrinb2 directed agents for the treatment or prevention of viral infections
CA2640171C (en) 2006-01-27 2014-10-28 Isis Pharmaceuticals, Inc. 6-modified bicyclic nucleic acid analogs
ES2715625T3 (es) 2006-04-03 2019-06-05 Roche Innovation Ct Copenhagen As Composición farmacéutica que comprende oligonucleótidos antisentido anti-miARN
CN101490074B (zh) 2006-05-11 2013-06-26 Isis制药公司 5’-修饰的双环核酸类似物
EP2090127A2 (en) 2006-10-30 2009-08-19 Nokia Corporation Method, apparatus and system providing operator controlled mobility for user equipment
WO2008113832A2 (en) * 2007-03-22 2008-09-25 Santaris Pharma A/S SHORT RNA ANTAGONIST COMPOUNDS FOR THE MODULATION OF TARGET mRNA
WO2008150729A2 (en) 2007-05-30 2008-12-11 Isis Pharmaceuticals, Inc. N-substituted-aminomethylene bridged bicyclic nucleic acid analogs
US8278426B2 (en) 2007-06-08 2012-10-02 Isis Pharmaceuticals, Inc. Carbocyclic bicyclic nucleic acid analogs
ATE538127T1 (de) 2007-07-05 2012-01-15 Isis Pharmaceuticals Inc 6-disubstituierte bicyclische nukleinsäureanaloga
WO2009067647A1 (en) 2007-11-21 2009-05-28 Isis Pharmaceuticals, Inc. Carbocyclic alpha-l-bicyclic nucleic acid analogs

Also Published As

Publication number Publication date
EP4330397A1 (en) 2024-03-06
EP4105328A1 (en) 2022-12-21
WO2022263569A1 (en) 2022-12-22
CA3221021A1 (en) 2022-12-22
AU2022294047A9 (en) 2024-01-11
JP2024521974A (ja) 2024-06-04
BR112023026411A2 (pt) 2024-03-05
AU2022294047A1 (en) 2023-12-14

Similar Documents

Publication Publication Date Title
AU2018267625B2 (en) COMPOSITIONS AND METHODS FOR MODULATING APOLIPOPROTEIN (a) EXPRESSION
AU2020270508B2 (en) C/EBP alpha short activating RNA compositions and methods of use
KR102366078B1 (ko) Pkk 발현을 조절하는 조성물 및 방법
KR102306797B1 (ko) Pd-l1 발현의 감소를 위한 올리고뉴클레오티드
KR102365486B1 (ko) 프리칼리크레인 (pkk) 발현의 조절
DK2906226T3 (en) MODULATION OF ANDROGEN RECEPTOR EXPRESSION
AU2020204024A1 (en) Compositions and methods for modulating growth hormone receptor expression
KR20200140853A (ko) B형 간염 바이러스 감염을 치료하기 위한 fubp1 억제제의 용도
CN117795071A (zh) 用于通过肝配蛋白-b2抑制防止由内皮功能障碍导致的肾功能障碍的反义寡核苷酸
CN116157522A (zh) A1cf抑制剂用于治疗乙型肝炎病毒感染的用途
KR20240017911A (ko) 인간 염색체 9 개방 해독 프레임 72(C9orf72) iRNA 제제 조성물 및 이의 사용 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication