CN101031657A

CN101031657A - 微小rna及其用途

Info

Publication number: CN101031657A
Application number: CN 200580023699
Authority: CN
Inventors: I·本特维奇; A·阿夫尼尔; Y·卡洛夫; R·阿哈罗诺夫
Original assignee: Rosetta Genomics Ltd
Current assignee: Rosetta Genomics Ltd
Priority date: 2004-05-14
Filing date: 2005-05-14
Publication date: 2007-09-05

Abstract

此处描述了和前列腺癌以及肺癌关联的新的多核苷酸。所述多核苷酸是miRNA和miRNA前体。公开了可用于这些医学状况的诊断、预后和治疗的相关方法和组合物。此处也描述了可用于鉴定前列腺癌和肺癌的调节剂的方法。

Description

微小RNA及其用途

发明领域

本发明总的来说涉及微小RNA分子以及与其关联或从其衍生的各种核酸分子。

发明背景

微小RNA(miRNA)是参与基因调节的大约22个核苷酸的短RNA寡核苷酸。微小RNAs通过靶向mRNA以进行切割或翻译抑制来调节基因表达。尽管miRNAs存在于广泛的物种，包括秀丽隐杆线虫(C.elegans)、果蝇(Drosophila)和人中，但只是最近才对其进行了鉴定。更重的是，miRNA在疾病的发展和进展中的作用直至最近才开始得到认识。

由于其较小的大小的原因，一直以来，使用标准的方法学难以鉴定miRNAs。通过提取大量的RNA已鉴定了有限数目的miRNA。也已鉴定了对展示可通过视觉辨别的表型作出贡献的miRNA。表达阵列数据显示miRNA在不同发育阶段或不同的组织中表达。miRNA在某些组织中或有限的发育阶段上的限定表明迄今为止鉴定的miRNAs很可能只是总miRNA的小部分。

近年来已发展了用于鉴定基因组中剩余的miRNA的计算机方法。工具例如MiRscan和MiRseeker已鉴定了后来通过实验确认的miRNA。基于这些计算机工具，已估计人基因组包含200-255个miRNA基因。然而，这些估计基于这样的假设，即剩下待鉴定的miRNA具有和已鉴定的miRNA相同的性质。基于miRNA在哺乳动物生物学和疾病中的基本重要性，本领域需要鉴定未知的miRNA。本发明满足了该需要并提供了相当大数目的miRNA和其用途。

发明概述

本发明涉及包含pri-miRNA、pre-miRNA、miRNA、miRNA^*、抗-miRNA或miRNA结合位点、或其变体的序列的分离的核酸。所述核酸可包含表1中涉及的发夹结构的序列、表10的序列标志符(identifiers)6757248-6894882的序列、表17的序列标志符1-6318或18728-18960的序列、表1中涉及的miRNA的序列、表10的序列标志符1-117750或6894883-10068177的序列、表17的序列标志符6319-18727或18961-19401的序列、表4中涉及的靶基因结合位点的序列、表10的序列标志符117751-6757247的序列、其互补物、或包含和其具有至少60％同一性的至少12个邻接的核苷酸的序列。所述分离的核酸在长度上可以是5至250个核苷酸。

本发明也涉及包含所述核酸的探针。探针可包含和表2中称为在前列腺癌或肺癌中差异表达的miRNA互补的至少8至22个邻接的核苷酸。

本发明也涉及多种探针。所述多种探针可包含和表2中称为在前列腺癌中差异表达的各miRNA互补的至少一种探针。所述多种探针也可包含和表2中称为在肺癌中差异表达的各miRNA互补的至少一种探针。

本发明也涉及包含探针或多种探针的组合物。

本发明也涉及包含固体基质的生物芯片，所述基质包含多种探针。将所述探针的每一种在空间确定的地址上附着至基质上。生物芯片可包含和表2中称为在前列腺癌中差异表达的miRNA互补的探针。生物芯片也可包含和表2中称为在肺癌中差异表达的miRNA互补的探针。

本发明也涉及检测疾病关联的miRNA的差异表达的方法。可提供生物学样品并测量与下述序列具有至少70％同一性的核酸的水平，所述序列是表1中涉及的miRNA的序列、表10的序列标志符1-117750或6894883-10068177的序列、表17的序列标志符6319-18727或18961-19401的序列、或其变体。和对照相比，核酸水平上的差异指示差异表达。

本发明也涉及鉴定调节病理学状况的化合物的方法。可提供能够表达和下述序列具有至少70％的同一性的核酸的细胞，所述序列是表1中涉及的miRNA的序列、表10的序列标志符1-117750或6894883-10068177的序列、表17的序列标志符6319-18727或18961-19401的序列、或其变体。可将所述细胞和候选调节剂接触，然后测量所述核酸的表达水平。和对照相比，核酸水平上的差异鉴定该化合物为和该核酸关联的病理学状况的调节剂。

本发明也涉及抑制靶基因在细胞中表达的方法。可以以足以抑制靶基因表达的量向细胞中导入核酸。靶基因可包含基本上和表4中涉及的结合位点相同的结合位点、表10的序列标志符117751-6757247的序列、或其变体。核酸可包SEQ ID NOS：1-760616的序列、表10的序列标志符1-117750和6757248-10068177的序列、表17所示的序列、或其变体。可在体外或体内抑制靶基因的表达。

本发明也涉及在细胞中增加靶基因的表达的方法。可以以足以抑制靶基因表达的量向细胞中导入核酸。靶基因可包含基本上和表4中涉及的结合位点相同的结合位点、表10的序列标志符117751-6757247的序列、或其变体。核酸可包含和SEQ ID NOS：1-760616、表10的序列标志符1-117750和6757248-10068177的序列、表17所示的序列、或其变体基本上互补的序列。可在体外或体内抑制靶基因的表达。可在体外或体内增加靶基因的表达。

本发明也涉及治疗患有表6中所示的病症的患者的方法，其包括给需要其的患者施用这样的核酸，所述核酸包含SEQ ID NOS：1-760616的序列、表10所示的序列、表17所示的序列或其变体。

附图简述

图1展示miRNA的成熟化的模型。

图2显示19q13.42上的MC19聚簇(cluster)的示意说明。小图A显示第19号染色体的大约500,000bp的区域，从58,580,001至59,080,000(根据2004年5月USCS的装配)，其中该聚簇所处位置包括相邻的编码蛋白的基因。用矩形表示MC19-1聚簇。用线表示Mir-371、mir-372和mir-373。用大箭头表示侧翼连接该聚簇的编码蛋白的基因。小图B显示MC19-1miRNA聚簇的详细结构。显示了大约～102,000bp的区域，从58,860,001至58,962,000(根据2004年5月USCS的装配)。用黑色条表示miRNA前体。应当注意所有miRNA都处于从左至右的相同方向。围绕miRNA前体的阴影区域表示其中内嵌前体的重复单位。也显示了mir-371、mir-372和mir-373的位置。

图3是在大约690nt的不同大小上的35个人重复单位(A)和26个黑猩猩重复单位(B)的多重序列比对的图解表示。该图表是通过在使用平均10nt的滑动窗口(sliding window)的比对中计算各位置的相似性评分(最大评分-1，最小评分-0)产生的。通过ClustalW程序来比对重复单位序列。为所得比对的各位置赋予表示在该位置上的相似性程度的评分。包含miRNA前体的区域以竖线划界。用竖线标示从前体的5’茎(5p)和3’茎(3p)产生的成熟miRNA的确切位置。

图4显示MC19-1聚簇的43个A型pre-miRNA的序列比对。小图A显示使用框标示成熟miRNA位置的多重序列比对。底部显示共有序列。如下用颜色标示保守核苷酸：黑色100％、深灰色80％至99％和浅灰色(clear grey)60％至79％。小图B显示共有成熟A型miRNA和mir-371、mir-372、miR-373的上游人聚簇的序列比对。小图C显示共有成熟A型miRNA和hsa-mir-371-373小鼠直向同源聚簇的比对。

图5显示MC19-1 miRNA的表达分析。小图A显示2个选择的A型miRNA的RNA印迹分析。使用来自人脑(B)、肝脏(L)、胸腺(T)、胎盘(P)和HeLa细胞(H)的总RNA分析表达。mir-98的表达和tRNA条带的溴化乙锭染色用作对照。小图B显示包含A型miRNA前体的mRNA转录物的RT-PCR分析。使用寡脱氧胸苷进行

来自胎盘的总RNA的逆转录。之后使用指定的引物(由水平箭标标示的)进行PCR。所检查的区域在上方进行了说明。垂直黑色条表示pre-miRNA；围绕pre-miRNA的阴影区域表示重复单位；在右侧标示4个EsT的位置；用竖箭标标示聚腺苷酸(poly-A)位点，如在EST中发现的和位于AATAAA共有序列下游的位点。在聚簇区说明下方显示使用3个引物组合预期从RT-PCR获得的片段。在预期的片段下方显示了RT-PCR分析的结果。小图C显示FR2片段的测序策略。将该片段克隆入pTZ57R\T载体并使用外部(external)和内部(internal)引物进行测序。

详述

本发明提供了miRNA、其前体、其靶和相关序列的核苷酸序列。这些核酸用于诊断目的，且也用于修饰靶基因表达。通过下列本发明的描述，本发明的其他方面对于本领域技术人员而言将变得很明了。

1.定义

在公开和描述本化合物、产品和组合物以及方法之前，要理解此处所用的术语学只是用于描述特定实施方案的，而不是用于限定的。必须指出，如说明书和所附的权利要求中所用的，单数形式“一个(a)”、“一个(an)”和“该(the)”，除非上下文另外清楚地指出，包括复数指示物(plural referent)。

a.动物

此处所用的“动物”可以指鱼、两栖动物、爬行动物、鸟和哺乳动物，例如小鼠、大鼠、兔、山羊、猫、狗、母牛、猿和人。

b.附着的

如此处所用的“附着的”或“固定的”，当指探针和固体支持物时，可表示探针和固体支持物之间的结合在结合、洗涤、分析和除去(removal)的条件下足以保持稳定。结合可以是共价的或非共价的。可在探针和固体支持物之间直接形成共价键，或可通过交联剂或将特异性的反应性基团包括在固体支持物或探针上或包括在两个分子上来形成共价键。非共价结合可以是静电、亲水和疏水相互作用中的一种或多种。非共价结合包括分子例如链霉抗生物素蛋白至支持物的共价附着和生物素化的探针至链霉抗生物素蛋白的非共价结合。固定化也包括共价和非共价相互作用的组合。

c.生物学样品

此处所用的“生物学样品”可指包含核酸的生物学组织或流体样品。这些样品包括，但不限于，从动物分离的组织。生物学样品也可包括组织的切片，例如活组织检查和尸体解剖样品、采集的用于组织学目的的冷冻切片、血液、血浆、血清、痰、粪便、眼泪、粘液、毛发和皮肤。生物学样品也包括外植块和来自患者组织的原代和/或转化的细胞培养物。可通过从动物取出细胞样品来提供生物学样品，但也可通过使用以前分离的细胞(例如，由另一个人在另一个时间分离的，和/或用于另一种目的的)、或通过在体内进行本发明的方法来获得生物学样品。也可使用档案组织(archival tissue)，例如具有治疗或结果历史的组织。

d.互补

此处所用的“互补”或“互补的”可指核酸分子的核苷酸或核苷酸类似物之间的Watson-Crick或Hoogsteen碱基配对。

e.差异表达

“差异表达”可以指细胞和组织之内和之间在时间和/或细胞基因表达模式上的定性或定量差异。因此，差异表达的基因可定性地使其表达被改变，包括在例如正常组织对疾病组织中的激活或失活。相对于另一种状态，基因可在特定状态下打开或关闭，从而允许两种或更多种状态的比较。受定性调节的基因在状态或细胞类型中展现可通过标准技术检测的表达模式。一些基因将在一种状态或细胞类型中表达，但不在两种情况下都表达。可选择地，表达上的差异在例如调节表达这一点上是定量的，所述调节为上调，从而导致增加的转录物的量，或者下调，从而导致减少的转录物的量。表达相异的程度只需要大到足以通过标准的表征技术，例如表达阵列(expression arrays)、定量逆转录酶PCR、RNA印迹分析和RNA酶保护进行定量即可。

f.基因

此处所用的“基因”可以是包含转录和/或翻译调节序列和/或编码区和/或非翻译序列(例如，内含子、5′-和3′-非翻译序列)的基因组基因。基因的编码区可以是编码氨基酸序列或功能性RNA(例如tRNA、rRNA、催化性RNA、siRNA、miRNA和反义RNA)的核苷酸序列。基因也可以是对应于编码区(例如，外显子和miRNA)、任选地包含连接至其上的5’-或3’-非翻译序列的mRNA或cDNA。基因也可以是在体外产生的经修饰的核酸分子，该核酸分子包含所有或部分编码区和/或连接至其上的5’-或3’-非翻译序列。

g.宿主细胞

此处所用的“宿主细胞”可以是天然发生的细胞或包含载体和支持所述载体复制的转化的细胞。宿主细胞可以是培养的细胞、外植块、体内细胞等。宿主细胞可以是原核细胞例如大肠杆菌(E.coli)，或真核细胞，例如酵母、昆虫、两栖动物或哺乳动物细胞，例如CHO、HeLa。

h.同一性

此处在两个或更多个核酸或多肽序列的上下文中所用的“同一的”或“同一性”可以指在特定区域上具有特定百分比的相同的核苷酸或氨基酸的序列。通过如下方法来计算百分比，比较最优比对的两个序列，在特定区域上比较两个序列，确定在两个序列上都出现相同残基的位置的数目以产生匹配的位置的数目，用匹配的位置数目除以特定区域内总的位置数目，且将所得结果乘以100，以产生序列同一性的百分比。在两个序列长度不同或比对产生交错的末端和比较的特定区域只有单一序列的情况下，将单一序列的残基包含在计算的分母中而不是分子中。当比较DNA和RNA时，胸腺嘧啶(T)和尿嘧啶(U)被认为是等同的。可人工地或通过使用计算机序列算法例如BLAST或BLAST 2.0来计算同一性。

i.标记

此处所用的“标记”可以指可通过光谱、光化学、生物化学、免疫化学、化学或其他物理学手段检测的组合物。例如，有用的标记包括³²p、荧光染料、电子密试剂、酶(例如，如在ELISA中普遍使用的酶)、生物素、洋地黄毒苷或半抗原和其他可被检测的实体。可在任何位置将标记整合入核酸和蛋白。

j.核酸

此处所用的“核酸”或“寡核苷酸”或“多核苷酸”可以指至少两个共价连接在一起的核苷酸。如本领域技术人员所理解的，单链的描述也确定了互补链的序列。因此，核酸也包括被描述的单链的互补链。也如本领域技术人员所理解的，核酸的许多变体可和给定的核酸一样用于相同的目的。因此，核酸也包括其基本上相同的核酸和互补物。如本领域技术人员所认识到的，单链提供了可在严格杂交条件下和靶序列杂交的探针。因此，核酸也包含在严格杂交条件下杂交的探针。

核酸可以是单链的或双链的，或可包含双链和单链序列的部分。核酸可以是DNA，即基因组DNA和cDNA两者，RNA或杂交物，其中核酸可包含脱氧核糖核苷酸和核糖核苷酸的组合，以及碱基的组合，所述碱基包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、次黄苷、黄嘌呤次黄嘌呤、异胞嘧啶(isocytosine)和异鸟嘌呤。可通过化学合成的方法或通过重组方法获得核酸。

核酸一般包含磷酸二酯键，尽管可包括这样的核酸类似物，该类似物可具有至少一个不同的键，例如，氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯或O-甲基亚磷酰胺键以及肽核酸主链和键。其他类似物核酸包括具有正主链、非离子主链和非核糖主链的那些，包括美国专利号5,235,033和5,034,506(其在此引用作为参考)中描述的类似物核酸。核酸的一个定义也包括包含一个或多个非天然发生的或经修饰的核苷酸的核酸。经修饰的核苷酸类似物也可位于例如核酸分子的5’-末端和/或3’-末端。核苷酸类似物的代表性实例可选自糖或主链经修饰的核糖核苷酸。然而，应当指出，核碱基(nucleobase)经修饰的核糖核苷酸，即这样的核糖核苷酸也是合适的，该核糖核苷酸包含非天然发生的而不是天然发生的核碱基，例如在5位置上经修饰的尿苷或胞苷，例如5-(2-氨基)丙基尿苷、5-溴尿苷；在8位置上经修饰的腺苷和鸟苷，例如8-溴鸟苷；脱氮核苷酸，例如7-脱氮-腺苷；O-和N-烷基化核苷酸，例如N6-甲基腺苷。2′-OH基可被选自H、OR、R、卤、SH、SR、NH₂、NHR、NR₂或CN的基团取代，其中R是C₁-C₆的烷基、链烯基或炔基，且卤是F、Cl、Br或I。可因各种原因进行核糖磷酸主链的修饰，例如为了在生理学环境中增加这些分子的稳定性和半衰期或为了用作生物芯片上的探针。可制备天然发生的核酸和类似物的混合物；可选择地，可制备不同核酸类似物的混合物和天然发生的核酸和类似物的混合物。

k.可操作地连接

此处所用的“可操作地连接”可以指基因的表达在空间上与其连接的启动子的控制之下。启动子可位于在其控制之下的基因的5’(上游)或3′(下游)。启动子和基因之间的距离可以和在该启动子来源的基因中该启动子与其控制的基因之间的距离大致相同。如在本领域中已知的，可调节该距离中的变化而不丧失启动子的功能。

l.探针

此处所用的“探针”可以指这样的寡核苷酸，该寡核苷酸能够通过一种或多种类型的化学键，通常通过互补碱基配对，通常通过氢键的形成来结合互补序列的靶核酸。依赖于杂交条件的严格度，探针可以结合不完全和该探针序列互补的靶序列。可存在任何数目的碱基对错配，该碱基对错配干扰靶序列和本发明的单链核酸之间的杂交。然而，如果突变的数目这样大以致于即使在杂交条件的最低严格度下也不能发生杂交，那么所述序列不是互补的靶序列。探针可以是单链的或部分单链和部分双链的。靶序列的结构、组成和性质决定探针的链型(strandedness)。可直接标记探针或间接标记探针，例如用链霉抗生物素蛋白复合物可随后结合的生物素标记探针。

m.启动子

此处所用的“启动子”可以指能够在细胞中赋予、激活或增强核酸表达的合成的或天然衍生的分子。启动子可包含一个或多个进一步增强表达和/或改变相同基因的空间表达和/或时间表达的特异性调节元件。启动子也可包含远端增强子或阻抑物元件，其可位于离转录的起始位点多达几千碱基对的位置。启动子可来源于这样的来源，该来源包括病毒、细菌、真菌、植物、昆虫和动物。启动子可组成型地调节基因组分的表达，或关于在其中发生表达的细胞、组织或器官，或关于在其中发生表达的发育阶段，或在响应外界刺激，例如生理应激、病原体、金属离子或诱导剂中差异地调节基因组分的表达。启动子的代表性实例包括噬菌体T7启动子、噬菌体T3启动子、SP6启动子、lac操纵基因-启动子、tac启动子、SV40晚期启动子、SV40早期启动子、RSV-LTR启动子、CMV IE启动子、SV40早期启动子或SV40晚期启动子及CMV IE启动子。

n.选择标记

此处所用的“选择标记”可以指任何这样的基因，该基因为这样的细胞赋予表型，在该细胞中，表达该基因以帮助鉴定和/或选择用基因构建体转染或转化的细胞。选择标记的代表性实例包括氨苄青霉素抗性基因(Amp^r)、四环素抗性基因(Tc^r)、细菌卡那霉素抗性基因(Kan^r)、zeocin抗性基因、赋予对抗生素aureobasidin A的抗性的AURI-C基因、膦丝菌素抗性基因、新霉素磷酸转移酶基因(nptII)、潮霉素抗性基因、β-葡糖醛酸糖苷酶(GUS)基因、氯霉素乙酰转移酶(CAT)基因、编码绿色荧光蛋白的基因和萤光素酶基因。

o.严格杂交条件

此处所用的“严格杂交条件”可指这样的条件，在该条件下，在例如核酸的复杂混合物中，第一核酸序列(例如，探针)可和第二核酸序列(例如，靶)杂交，但不和其他序列杂交。严格条件是序列依赖性的，且在不同的环境中是不同的。一般地，选择严格条件，使其比在确定的离子强度pH下的特定序列的热解链温度(T_m)低大约5-10℃。T_m可以是这样的温度(在确定的离子强度、pH和核酸浓度下)，在该温度下，50％的和靶互补的探针在平衡状态和靶序列杂交(因为靶序列过量存在，所以在T_m下，50％的探针在平衡状态被占据)。严格条件可以是这样的条件，在该条件中，在pH7.0至8.3下，盐浓度低于大约1.0M钠离子，通常为大约0.01-1.0M钠离子浓度(或其他盐)，且对于短探针(例如，大约10至50个核苷酸)温度为至少大约30℃，对于长探针(例如，多于大约50个核苷酸)温度为至少大约60℃。也可通过加入去稳定剂例如甲酰胺来获得严格条件。对于选择性或特异性杂交，阳性信号可以是背景杂交的至少2至10倍。示例性严格杂交条件包括下列：50％甲酰胺、5xSSC、和1％SDS，在42℃下温育，或5xSSC、1％SDS，在65℃下温育，在65℃下在0.2xSSC、和0.1％SDS中洗涤。

p.基本上互补

此处所用的“基本上互补”可以指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50或更多个核苷酸的区域上，第一序列和第二序列的互补物具有至少60％、65％、70％、75％、80％、85％、90％、95％、97％、98％或99％的同一性，或两个序列在严格杂交条件下杂交。

q.基本上同一

此处所用的“基本上同一”可以指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50或更多个核苷酸或氨基酸的区域上，第一序列和第二序列具有至少60％、65％、70％、75％、80％、85％、90％、95％、97％、98％或99％的同一性，或者对于核酸，如果第一序列和第二序列的互补物基本上互补的话。

r.靶

此处所用的“靶”可指在严格杂交条件下可被一个或多个探针结合的多核苷酸。

s.终止子

此处所用的“终止子”可指位于转录单位末端、提供转录终止的信号的序列。终止子可以是包含多腺苷酸化信号的3’-非翻译DNA序列，该序列可帮助多腺苷酸序列加至初级转录物的3’-末端。终止子可来自这样的来源，该来源包括病毒、细菌、真菌、植物、昆虫和动物。终止子的代表性实例包括SV40多腺苷酸化信号、HSV TK多腺苷酸化信号、CYC1终止子、ADH终止子、SPA终止子、根癌土壤杆菌(Agrobacterium tumefacien)的胭脂碱合酶(NOS)基因终止子、花椰菜花叶病毒(CaMV)35S基因的终止子、来自玉蜀黍(Zea mays)的玉米醇溶蛋白基因终止子、核酮糖二磷酸羧化酶-加氧酶的小亚基基因(SSU)的基因终止子序列、subclover stunt virus(SCSV)基因序列的终止子、不依赖于ρ的大肠杆菌终止子和lacZα终止子。

t.载体

此处所用的“载体”可指包含复制起始位点的核酸序列。载体可以是质粒、噬菌体、细菌人工染色体或酵母人工染色体。载体可以是DNA或RNA载体。载体可以是自我复制的染色体外载体或整合入宿主基因组的载体。

2.微小RNA

不受理论束缚，图1显示哺乳动物miRNA的成熟化的目前的模型。可转录编码miRNA的基因，从而导致称为pri-miRNA的miRNA前体的产生。pri-miRNA可以是包含多个pri-miRNA的多顺反子RNA的部分。pri-miRNA可形成具有茎和环的发夹结构。如图1中所示，茎可包含错配的碱基。

pri-miRNA的发夹结构可被Drosha识别，其是RNA酶III内切核酸酶。Drosha可识别pri-miRNA的末端环和大致向茎内切割两个螺旋转角，以产生60-70nt的称为pre-miRNA的前体。Drosha可切割pri-miRNA，具有RNA酶III内切核酸酶的典型交错切口，以产生具有5′磷酸和大约2个核苷酸的3′突出端的pre-miRNA茎环。大约一个延伸超过Drosha切割位点的茎的螺旋转角(大约10个核苷酸)可能是有效加工所必需的。然后通过Ran-GTP和输出受体(exportreceptor)Ex-portin-5可将pre-miRNA从细胞核主动转运至胞质。

Dicer，也是RNA酶III内切核酸酶，可识别pre-miRNA。Dicer可识别pre-miRNA的双链茎。Dicer也可识别茎环基部的5’磷酸和3’突出端。Dicer可在距离茎环基部两个螺旋转角处切除末端环，从而留下另外的5′磷酸和大约2个核苷酸的3’突出端。所得的可包含错配的siRNA样双链体包含成熟的miRNA和称为miRNA^*的相似大小的片段。miRNA和miRNA^*可从pri-miRNA和pre-miRNA的相反的臂衍生。可在克隆的miRNA的文库中发现miRNA^*序列，但其频率一般低于miRNA。

尽管最初以和miRNA^*的双链种类出现，但miRNA最终可以以单链RNA的形式整合入被称为RNA诱导的沉默复合物(RISC)的核糖核蛋白复合体。各种蛋白可形成RISC，这可导致对于miRNA/miRNA^*双链体的特异性、靶基因的结合位点、miRNA的活性(抑制或激活)、miRNA/miRNA^*双链体中的哪条链被装载入RISC产生变化。

当将miRNA:miRNA^*双链体的miRNA链装载入RISC中时，可除去并降解miRNA^*。被装载入RISC中的miRNA:miRNA^*双链体的链可以是其5’末端没有紧密配对的链。在miRNA:miRNA^*的两个末端都具有大致相等的5’配对的情况下，miRNA和miRNA^*都可具有沉默基因的活性。

RISC可基于miRNA和mRNA之间的高水平的互补性，特别是通过miRNA的核苷酸2-8，来鉴定靶核酸。只有一个例子已在动物中进行了报道，在该例子中，miRNA和其靶之间的相互作用沿着miRNA的整个长度。在mir-196和Hox B8中显示了该情况，且还显示mir-196介导Hox B8mRNA的切割(Yekta等人2004，Science304-594)。在其他方面，已知这些相互作用只存在于植物中(Bartel &Bartel 2003，Plant Physiol 132-709)。

许多研究已考察了为获得足够的翻译抑制，miRNA和其mRNA靶之间的碱基配对要求(Bartel 2004，Cell 116-281的综述)。在哺乳动物细胞中，miRNA的前8个核苷酸可能是重要的(Doench & Sharp2004 GenesDev 2004-504)。然而，微小RNA的其他部分也可参与mRNA结合。此外，在3′处的充分的碱基配对可补偿在5’处的不充分配对(Brennecke等人，2005 PLoS 3-e85)。在整个基因组上分析miRNA结合的计算研究已提示miRNA的5’的碱基2-7在靶结合中的特殊作用，但也承认通常被发现为“A”的第1个核苷酸的作用(Lewis等人2005 Cell 120-15)。类似地，Krek等人(2005，Nat Genet 37-495)使用核苷酸1-7或2-8鉴定和验证靶。

mRNA中的靶位点可以在5′UTR、3′UTR或在编码区中。有趣地，多种miRNA可通过识别相同的或多个位点来调节相同的mRNA靶。在绝大部分遗传鉴定的靶中存在多个miRNA互补性位点可表明，多个RISC的协同作用提供了最有效的翻译抑制作用。

miRNA可通过两种机制：mRNA切割或翻译抑制中的任一种机制指导RISC下调基因表达。如果mRNA和miRNA具有某种程度的互补性，那么该miRNA可特异性地切割该mRNA。当miRNA指导切割时，切口可在和miRNA的残基10和11配对的核苷酸之间。可选择地，如果miRNA不具有所要求的程度的和miRNA的互补性，那么miRNA可抑制翻译。翻译抑制在动物中可能更普遍，因为动物可具有更低程度的互补性。

应当指出，在任一对miRNA和miRNA^*的5′和3′末端中可存在可变性。该可变性可能是由于Drosha和Dicer针对切割位点的酶促加工中存在的可变性造成的。miRNA和miRNA^*的5′和3′末端的可变性也可以是由于pri-miRNA和pre-miRNA的茎结构中的错配造成的。茎链的错配可导致许多不同的发夹结构。茎结构中的可变性也可导致通过Drosha和Dicer切割产生的产物中的可变性。

3.核酸

本发明涉及分离的核酸，所述分离的核酸包含SEQ ID NOS：1-760616中涉及的核苷酸序列、表10中所示的序列和表17中所示的序列、或其变体。变体可以是参照的核苷酸序列的互补物。变体也可以是基本上与参照核苷酸序列或其互补物同一的核苷酸序列。变体也可以是在严格条件下和参照核苷酸序列、其互补物或基本上和其同一的核苷酸序列杂交的核苷酸序列。

核酸可具有10至100个核苷酸的长度。核酸可具有至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80或90个核苷酸的长度。可合成核酸或使用下面描述的合成的基因在细胞中(在体外或体内)表达核酸。可以以单链分子的形式合成核酸并将其和基本上互补的核酸杂交以形成双链体，该双链体被当作本发明的核酸。可以以单链或双链的形式将核酸导入细胞、组织或器官，或能够通过使用本领域技术人员熟知的方法由合成的基因进行表达，所述方法包括美国专利号6,506,559(在此引用作为参考)中所描述的方法。

a.Pri-miRNA

本发明的核酸可包含pri-miRNA或其变体的序列。pri-miRNA序列可包含45至250、55至200、70至150或80至100个核苷酸。pri-miRNA的序列可包含下面所示的pre-miRNA、miRNA和miRNA^*。pri-miRNA也可包含miRNA或miRNA^*和其互补物以及其变体。pri-miRNA可包含至少19％的腺苷核苷酸、至少16％的胞嘧啶核苷酸、至少23％的胸腺嘧啶核苷酸和至少19％的鸟嘌呤核苷酸。

pri-miRNA可形成发夹结构。发夹结构可包含基本上互补的第一和第二核酸序列。第一和第二核酸序列可具有37至50个核苷酸。可通过8至12个核苷酸的第三序列分隔第一和第二核酸序列。如通过使用Hofacker等人，Monatshefte f.Chemie 125：167-188(1994)(其内容在此引用作为参考)中所描述的Vienna算法，利用缺省参数所计算的，发夹结构可具有少于-25千卡/摩尔的自由能。发夹结构可包含4-20、8-12或10个核苷酸的末端环。

pri-miRNA的序列可包含表1中涉及的发夹结构的序列、表10的序列标志符6757248-6894882的序列、表17的序列标志符1-6318或18728-18960的序列、或其变体。

b.Pre-miRNA

本发明的核酸也可包含pre-miRNA或其变体的序列。pre-miRNA序列可包含45至90、60至80或60至70个核苷酸。pre-miRNA的序列可包含下面所示的miRNA和miRNA^*。pre-miRNA也可包含miRNA或miRNA^*和其互补物以及其变体。pre-miRNA的序列也可以是除去pri-miRNA的5’和3’末端的0-160个核苷酸的pri-miRNA的序列。

pre-miRNA的序列可包含表1中涉及的发夹的序列、表10的序列标志符6757248-6894882的序列、表17的序列标志符1-6318或18728-18960的序列、或其变体。

c.miRNA

本发明的核酸也可包含miRNA、miRNA^*或其变体的序列。miRNA序列可包含13至33、18至24或21至23个核苷酸。miRNA的序列可以是pre-miRNA的前13至33个核苷酸。miRNA的序列可以是pre-miRNA的最后13至33个核苷酸。

miRNA的序列可包含表1中涉及的miRNA的序列、表10的序列标志符1-117750或6894883-10068177的序列、表17的序列标志符6319-18727或18961-19401的序列、或其变体。

d.抗-miRNA

本发明的核酸也可包含能够阻断miRNA或miRNA^*的活性的抗-miRNA的序列。抗-miRNA可包含总共5至100或10至60个核苷酸。抗-miRNA也可包含总共至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或26个核苷酸。抗-miRNA的序列可包含(a)基本上和miRNA的5’同一的至少5个核苷酸和基本上和所述miRNA的5’末端的靶位点的侧翼区互补的至少5-12个核苷酸，或(b)基本上和miRNA的3’同一的至少5至12个核苷酸和基本上和所述miRNA的3’末端的靶位点的侧翼区互补的至少5个核苷酸。

抗-miRNA的序列可包含表1中涉及的miRNA的序列、表10的序列标志符1-117750或6894883-10068177的序列、表17的序列标志符6319-18727或18961-19401的序列、或其变体的互补物。

e.靶的结合位点

本发明的核酸也可包含靶miRNA结合位点或其变体的序列。靶位点序列可包含总共5至100或10至60个核苷酸。靶位点序列可包含表4中涉及的靶基因结合位点的序列、表10的序列标志符117751-6757247的序列、或其变体的至少5个核苷酸。

4.合成的基因

本发明也涉及包含可操作地连接至转录和/或翻译调节序列的本发明的核酸的合成的基因。所述合成的基因能够修饰具有本发明的核酸的结合位点的靶基因的表达。可在细胞、组织或器官中修饰靶基因的表达。可合成合成的基因或通过标准的重组技术从天然发生的基因中衍生合成的基因。合成的基因也可在合成的基因序列的转录单位的3’-末端包含终止子。合成的基因也可包含选择标记。

5.载体

本发明也涉及包含本发明的合成的基因的载体。载体可以是表达载体。表达载体可以包含另外的元件。例如，表达载体可具有两种这样的复制系统，所述复制系统能够使其在两种生物中得以维持，例如在用于表达的哺乳动物或昆虫细胞和用于克隆和扩增的原核细胞中。对于整合表达载体，表达载体可包含至少一个和宿主细胞基因组同源的序列，和优选地两个侧翼连接该表达构建体的同源序列。通过选择适当的同源序列用于包括入载体可将整合性载体导向宿主细胞中的特定基因座。载体也可包含使得能够选择转化的宿主细胞的选择标记基因。

6.宿主细胞

本发明也涉及包含本发明的载体的宿主细胞。所述细胞可以是细菌、真菌、植物、昆虫或动物细胞。

7.探针

本发明也涉及包含本发明的核酸的探针。探针可用于筛选和诊断方法，如下面所概述的方法。可将探针附着至或固定在固体基质例如生物芯片上。

探针可具有8至500、10至100或20至60个核苷酸的长度。探针也可具有至少8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280或300个核苷酸的长度。探针还可包含10至60个核苷酸的接头序列。

8.生物芯片

本发明也涉及生物芯片。生物芯片可包含这样的固体基质，所述固体基质包含附着的本发明的探针或多个探针。所述探针可能能够在严格杂交条件下和靶序列杂交。可在空间上确定的地址将探针附着在基质。可使用每个靶序列超过1个探针，其中使用交叠的探针或针对特定靶序列的不同部分的探针。探针可能能够与和单一病症关联的靶序列杂交。

可以许多方法，如本领域技术人员所理解的方法将探针附着至生物芯片。可先合成探针，然后将其附着至生物芯片，或可直接在生物芯片上合成探针。

固体基质可以是这样的材料，该材料可被修饰以包含适合用于探针的附着或结合的分离的单个位点，且可按至少一种检测方法处理。基质的代表性实例包括玻璃和修饰或功能化的玻璃、塑料(包括丙烯酸类塑料、聚苯乙烯以及苯乙烯与其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、TeflonJ等)、多糖、尼龙或硝酸纤维素、树脂、硅石或基于硅石的材料(包括硅和经修饰的硅)、碳、金属、无机玻璃和塑料。所述基质可允许光学检测而不发一点荧光。

基质可以是平面的，尽管也可使用其他构型的基质。例如，对于流通样品分析(flow-through sample analysis)，可将探针置于管的内侧表面以将样品体积最小化。类似地，基质可以是能变形的，例如能变形的泡沫，包括由特殊塑料制成的闭合小室泡沫。

可用化学官能团衍生化生物芯片和探针，以用于随后的两者的附着。例如，可用化学官能团(包括，但不限于，氨基、羧基、桥氧基或硫醇基)衍生化生物芯片。使用这些官能团，可直接或间接地使用接头，利用探针上的官能团附着所述探针。可通过5′末端、3′末端或通过内部核苷酸将探针附着至固体支持物。

也可非共价地将探针附着至固体支持物。例如，可制备生物素化的寡核苷酸，其可结合用链霉抗生物素蛋白共价包被的表面，从而产生附着。可选择地，可使用技术例如光聚合和光刻法在表面合成探针。

9.miRNA表达分析

本发明也涉及鉴定和疾病或病理状况关联的miRNA的方法，其包括将生物学样品和本发明的探针或生物芯片接触并检测杂交的量。可使用PCR扩增样品中的核酸，这可以提供更高的灵敏度。

鉴定这样的miRNA的能力可提供高分辨率、高灵敏度的数据集(datasets)，所述miRNA，和对照相比，在病理细胞中超表达或表达不足，所述数据集可用于诊断、治疗、药物开发、药物遗传学、生物传感器开发领域和其他相关领域。由本方法产生的表达概况可以是关于许多miRNA的样品的状态的“指纹图谱”。尽管两种状态可具有相似表达的任何特定的miRNA，但同时估量许多miRNA使得能够产生表征细胞的状态的基因表达概况。即，可将正常组织和患病的组织区分开。通过比较处于已知的不同疾病状态的组织的表达概况，可获得关于哪种miRNA和这些状态中的每一个关联的信息。从而，可进行或确认诊断以确定组织样品是否具有正常或疾病组织的表达概况。这可以提供相关状况的分子诊断。

10.确定表达水平

本发明也涉及确定病症关联性miRNA的表达水平的方法，其包括将生物学样品和本发明的探针或生物芯片接触并测量杂交的量。疾病关联性miRNA的表达水平是多种方式的信息。例如，可将和对照相比的疾病关联性miRNA的差异表达用作对患者患有该疾病的诊断。病症关联性miRNA的表达水平也可用于监控患者的治疗和疾病状态。此外，疾病关联性miRNA的表达水平可允许筛选用于改变特定的表达概况或抑制和疾病关联的表达概况的药物候选物。

可通过将包含靶核酸的样品和生物芯片(该生物芯片包含附着的充分和靶核酸互补的探针)接触并检测高于对照水平的和探针的杂交来检测该靶核酸。

也可通过将待检查的核酸固定化在固体支持物例如尼龙膜上，并使标记的探针和该样品杂交来检测靶核酸。类似地，也可通过将标记的探针固定化在固体支持物上，并杂交包含标记的靶核酸的样品来检测靶核酸。在洗涤以除去非特异性的杂交后，可检测标记。

也可通过将透化的细胞或组织样品和标记的探针接触以允许和靶核酸杂交来在原位检测靶核酸。在洗涤以除去非特异性结合的探针后，可检测标记。

这些测定法可以是直接的杂交测定或可包含夹心测定，其包括使用多个探针，如在美国专利号5,681,702、5,597,909、5,545,730、5,594,117、5,591,584、5,571,670、5,580,731、5,571,670、5,591,584、5,624,802、5,635,352、5,594,118、5,359,100、5,124,246和5,681,697中所概述的，各专利在此引用作为参考。

可使用各种杂交条件，包括上述的高严格条件、中等严格条件和低严格条件。可在只允许探针和靶杂交的严格条件下进行测定。可通过改变这样的步骤参数来控制严格度，所述步骤参数是热力学变量，包括，但不限于温度、甲酰胺浓度、盐浓度、离液盐浓度pH或有机溶剂浓度。

可以各种方法进行杂交反应。可同时或以不同顺序依次加入反应的组分。此外，反应可包括许多种其他试剂。这些试剂包括盐、缓冲液、中性蛋白例如清蛋白、去污剂等，所述试剂可用于帮助最佳杂交和检测，和/或减少非特异性相互作用或背景相互作用。依赖于样品的制备方法和靶的纯度，适当时，也可使用在其他方面提高测定的功效的试剂，例如蛋白酶的抑制剂、核酸酶的抑制剂和抗微生物剂。

a.诊断

本发明也涉及诊断的方法，其包括检测疾病关联性miRNA在生物学样品中的差异表达水平。样品可来源于患者。患者的疾病状态的诊断使得能够预后和选择治疗策略。此外，可通过确定临时(temporarily)表达的miRNA分子来对细胞的发育阶段进行分类。

可进行标记的探针和组织阵列的原位杂交。当比较个体和标准之间的指纹图谱时，本领域技术人员可基于发现作出诊断、预后或预测。还要理解，指示诊断的基因可以和指示预后的基因不同，且细胞状况的分子特征分析(molecular profiling)可区分易起反应的状况或难治的状况或可预测结果。

b.药物筛选

本发明也涉及筛选治疗剂的方法，其包括将能够表达疾病关联性miRNA的病理细胞和候选治疗剂接触并评价药物候选物对疾病关联性miRNA的表达概况的作用。在已鉴定差异表达的miRNA后，可进行各种测定。可就调节疾病关联性miRNA的基因表达的能力筛选受试化合物。调节包括基因表达上的增加和减少。

受试化合物或药物候选物可以是就直接或间接地改变疾病表型或疾病关联性miRNA的表达的能力受检验的任何分子，例如，蛋白、寡肽、小有机分子、多糖、多核苷酸等。药物候选物包括许多化学种类，例如具有超过100和低于大约500、1,000、1,500、2,000或2,500道尔顿的分子量的小有机分子。候选化合物可包含和蛋白发生结构相互作用特别是形成氢键所必需的官能团，且一般包括至少胺基、羰基、羟基或羧基，优选地包含至少两个化学官能基团。候选试剂可包含用一个或多个上述官能团取代的环状碳(cyclical carbon)或杂环结构和/或芳族或多环芳族(polyaromatic)结构。也在生物分子(包括肽、糖、脂肪酸、类固醇、嘌呤、嘧啶、其衍生物、结构类似物或组合)中发现了候选试剂。

可就结合疾病关联性miRNA的能力或调节其活性的能力筛选潜在的调节剂的组合文库。组合文库可以是多种化合物的集合，所述化合物是通过组合许多化学结构单元例如试剂进行的化学合成或生物合成产生的。组合化学文库的制备和筛选对本领域技术人员来说是熟知的。这些组合化学文库包括，但不限于，编码的肽的肽文库、苯二氮类、diversomers例如乙内酰脲类、苯二氮类和二肽、vinylogous多肽、小化合物文库的类似有机综合体、寡氨基甲酸酯(oligocarbamates)、和/或肽基磷酸酯、核酸文库、肽核酸文库、抗体文库、糖类文库和小有机分子文库。

11.基因沉默

本发明也涉及使用本发明的核酸来减少靶基因在细胞、组织或器官中的表达的方法。可通过表达本发明的核酸(其包含基本上和靶mRNA的一个或多个结合位点互补的序列)来减少靶基因的表达。所述核酸可以是miRNA或其变体。核酸也可以是可经加工以产生miRNA的pri-miRNA、pre-miRNA或其变体。表达的miRNA可和靶mRNA上的基本上互补的结合位点杂交，这可导致RISC介导的基因沉默的激活。利用miRNA的超表达的研究的实例是Yekta等人2004，Science 304-594，其在此引用作为参考。本领域技术人员认识到通过使用本领域熟知的反义方法以及美国专利号6,506,559和6,573,099(其在此引用作为参考)中描述的RNAi方法，可将本发明的核酸用于抑制靶基因的表达。

基因沉默的靶可以是导致第二蛋白沉默的蛋白。通过抑制靶基因的表达，可增加第二蛋白的表达。miRNA表达的有效抑制的实例是Esau等人2004 JBC 275-52361；和Cheng等人2005 Nucleic Acids Res.33-1290(其在此引用作为参考)进行的研究。

12.基因增强

本发明也涉及使用本发明的核酸增加细胞、组织或器官中的靶基因的表达的方法。可通过表达本发明核酸(其包含基本上和pri-miRNA、pre-miRNA、miRNA或其变体互补的序列)来增加靶基因的表达。所述核酸可以是抗-miRNA。抗-miRNA可和pri-miRNA、pre-miRNA或miRNA杂交，从而减少其基因表达活性。也可通过表达本发明的核酸来增加靶基因的表达，所述本发明的核酸基本上和靶基因中的结合位点的部分互补，这样所述核酸与结合位点的结合可防止miRNA结合。

13.治疗

本发明也涉及这样的方法，该方法将本发明的核酸用作和发育功能异常例如癌症关联的疾病或病症的调节剂或靶。一般地，所述请求保护的核酸分子可用作至少部分地和所述核酸互补的基因表达的调节剂。此外，miRNA分子可用作筛选治疗剂的方法的靶，例如miRNA分子的抑制或激活可调节细胞分化过程，例如编程性细胞死亡。

此外，可将现有的miRNA分子用作原材料，以生产序列经修饰的miRNA分子以修饰其对例如癌基因、广谱抗药基因或另一种治疗性靶基因的靶特异性。此外，可修饰miRNA分子，目的在于对其进行加工，然后将其产生为又能抗治疗关联性靶的双链siRNA。此外，可将miRNA分子用于组织重编程方法(tissue reprogrammingprocedures)，例如，可通过向不同的细胞类型或干细胞中表达miRNA分子来转化分化的细胞系。

14.组合物

本发明也涉及包含本发明的核酸和任选地药物可接受载体的药物组合物。该组合物可用于诊断或治疗用途。可通过已知的方法施用药物组合物，在所述方法中，在体外或体内将核酸导入想要的靶细胞。通常使用的基因转移技术包括磷酸钙法、DEAE-葡聚糖法、电穿孔法、显微注射法、病毒法和阳离子脂质体。

15.试剂盒

本发明也涉及这样的试剂盒，该试剂盒包含本发明的核酸和任一种或所有下列物质：测定试剂、缓冲液、探针和/或引物以及无菌盐水或另一种药物可接受的乳剂和悬浮液基底(suspension base)。此外，试剂盒可包括包含用于实施本发明的方法的指导(例如，规程)的说明材料。

实施例1

miRNA的预测

我们使用两种和美国专利申请号60/522,459、10/709,577和10/709,572(其内容在此引用作为参考)中描述的用于预测miRNA的方法相似的计算机方法就潜在的编码miRNA的基因对整个人基因组进行了考察。简而言之，就发夹结构扫描整个人基因组的非蛋白编码区。根据热力学稳定性以及结构和上下文特征给预测的发夹结构和潜在的miRNA评分。使用Sanger数据库中的已被验证的miRNA校准算法。

1.第一次筛选

表11A-11C显示来自第一次计算机筛选的各预测的发夹结构的序列(“前体序列”)、序列标志符(“PRECUR SEQ-ID”)和来源的生物(“GAM生物”)以及预测的miRNA(“GAM名称”)。表12显示各miRNA(“GAM名称”)的序列(“GAM RNA序列”)和序列标志符(“GAM SEQ-ID”)以及来源的生物(“GAM生物”)和Dicer切割位置(“GAM POS”)。预测的发夹结构和miRNA的序列也列于表10中。

2.第二次筛选

表1列出了第二次计算机筛选的各预测的发夹结构的SEQ IDNO(“HID”)。表1也列出了各发夹结构的基因组位置(“发夹结构位置”)。基因组位置的格式是串联的<chr_id><链><起始位置>。例如，19+135460000是指第19号染色体、+链、起始位置135460000。染色体23-25是指X染色体、Y染色体和线粒体DNA。染色体的定位基于由UCSC (http://genome.ucsc.edu)进行的人基因组的hg17装配，hg17装配基于NCBI Build 35第1版且由国际人类基因测序联盟(International Human Genome Sequencing Consortium)产生。

表1也列出了发夹结构是否在进化中保守(“C”)。存在这样的选项，即存在纸件基因组版本。通过使用phastCons数据鉴定发夹结构为保守的(“Y”)或非保守的(“N”)。phastCons数据是人基因组对黑猩猩、小鼠、大鼠、狗、鸡、蛙和斑马鱼的基因组中各核苷酸的进化保守性的量度，其基于phylo-HMM，phylo-HMM使用基于BlastZ的各物种的基因组内最佳的(best-in-genome)成对比对(pair wise alignment)，然后进行8个基因组的multiZ比对(Siepel等人，J.Comput.Biol 11，413-428，2004和Schwartz等人，GenomeRes.13，103-107，2003)。如果7个物种在发夹结构茎内的任何15个核苷酸序列上的平均phastCons保守评分是至少0.9，那么发夹结构被列为保守的(Berezikov，E.等人Phylogenetic Shadowing andComputational Identification of Human microRNA Genes.Cell 120，21-24，2005)。

表1也将各发夹结构的基因组类型(“T”)列为基因间的(“G”)、内含子(“I”)或外显子(“E”)。表1也列出了各预测的miRNA和miRNA^*的SEQ ID NO(“MID”)。表1也列出了各发夹结构在0-1(1表示发夹结构最可靠)的数值范围内的预测评分级别(“P”)，如Hofacker等人，Monatshefte f.Chemie 125：167-188，1994中所描述的。如果级别是0或空，则将其变换成更小的其p-值＜0.05的PalGrade值。表1也列出了从各P评分的值的背景发夹结构计算的p-值(“Pval”)。如表中所示，少数情况下Pval大于0.05。在这些情况的每一种中，发夹结构高度保守或其已被验证(F＝Y)。

如表2中所详述的，表1也列出了是否已通过表达分析(“E”)对miRNA进行了验证(Y＝是，N＝否)。表1也列出了是否通过测序(“S”)对miRNA进行了验证(Y＝是，N＝否)。如果预测的miRNA和测序的miRNA之间存在序列差异，那么预测测序的序列。应当指出，未能测定miRNA的序列或未检测到其的表达不一定表示miRNA不存在。这些未检测到的miRNA可在除了受试的组织以外的组织中表达。此外，这些未检测到的miRNA可在受试组织中表达，但在和实验中的细胞的阶段或状况不同的阶段或状况下表达。

表1也列出了miRNA是否在至少一种疾病中显示如表2)中所详述的差异表达(“D”)(Y＝是，N＝否)。表1也列出了miRNA是否存在于(“F”)(Y＝是，N＝否)Sanger DB Release 6.0(2005年4月)( http://nar.oupjournals.org/)中，如在人或小鼠中被检测的或在人中预测的。如上所述，Sanger数据库中所列的miRNA是预测算法的组分和输出的对照。

表1也列出了这些发夹结构的基因位置聚簇(genetic locationcluster)(“LC”)，所述发夹结构相互之间相距在5,000个核苷酸之内。具有相同LC的各miRNA共有相同的基因聚簇(genetic cluster)。表1也列出了通过完全匹配由miRNA的2-7的种子将其分组的种子聚簇(seed cluster)(“SC”)。具有相同SC的各miRNA具有相同的种子。关于5个核苷酸的种子长度的讨论，参见Lewis等人，Cell，120；15-20(2005)。

实施例2

靶基因的预测

然后使用和美国专利申请号60/522,459、10/709,577和10/709,572(其内容在此引用作为参考)中描述用于预测miRNA的方法相似的计算机方法，将来自实施例1的2次计算机筛选的预测的miRNA用于预测靶基因和其结合位点。

1.第1次筛选

表13A-13C列出了来自第1次计算机筛选的预测的靶基因(“靶”)和结合位点序列(“靶结合位点序列”)以及结合位点序列标志符(“靶结合位点SEQ-ID”)，以及靶的来源生物(“靶生物”)。表14列出了和靶基因(“和疾病关联的靶基因”)关联的疾病(“疾病名称”)。表15列出了miRNA的序列标志符(“和疾病关联的GAMS的SEQ ID NOs”)以及和基于靶基因的miRNA关联的疾病(“疾病名称”)。结合位点序列的序列也列于表10。

2.第2次筛选

表4列出了来自第2次计算机筛选的各miRNA(MID)和其发夹结构(HID)的预测的靶基因。靶基因的名称采自NCBI ReferenceSequence release 9(http://www.ncbi.nlm.nih.gov；Pruitt等人，NucleicAcids Res，33(1)：D501-D504，2005；Pruitt等人，Trends Genet.，16(1)：44-47，2000；和Tatusova等人，Bioinformatics，15(7-8)：536-43，1999)。通过具有7个核苷酸的miRNA种子(位点2-8)和UTR上的A(总共＝8个核苷酸)的完美互补匹配来鉴定靶基因。关于鉴定靶基因的讨论，参见Lewis等人，Cell，120：15-20，(2005)。关于足以将miRNA结合至UTR的种子的讨论，参见Lim Lau等人，(Nature 2005)和Brenneck等人，(PLoS Biol 2005)。

然后使用过滤的靶基因数据集(通过只包含含有至少30个核苷酸的UTR的那些靶基因产生的)预测结合位点。结合位点筛选只考虑每个UTR的前4000个核苷酸，且当每个基因存在几个转录物时，考虑最长的转录物。过滤将转录物的总数从23626减少至14239。表4列出了各靶基因的预测的结合位点的SEQ ID NO。当结合位点位于剪接的mRNA上时，结合位点的序列包括结合位点的5’和3’的20个核苷酸。除只具有单个预测的结合位点的那些miRNA或已验证的那些miRNA以外，表4中的数据已被过滤，从而只指示具有至少2个结合位点的那些靶基因。

表5显示miRNA(“MID”)/发夹结构(“HID”)和其靶基因造成的疾病之间的关系。疾病的名称采自OMIM。关于将发夹结构所处的宿主基因和疾病相关连的原理的讨论，参见，Baskerville和Bartel，RNA，11：241-247(2005)和Rodriguez等人，Genome Res.，14：1902-1910(2004)。表5显示了和疾病关联的miRNA靶基因的数目(“N”)。表5也显示了和疾病关联的基因的总数(“T”)，该数目获自经预测具有miRNA的结合位点的基因。表5也显示了N在T中的百分比和超几何分析(hypergeometric analysis)的p-值(“Pval”)。表8显示了表5和6中的疾病的代码。关于超几何分析的参考资料，参见Schaum的Outline of Elements of Statistics II：Inferential Statistics。

表6显示miRNA(“MID”)/发夹结构(“HID”)和其宿主基因造成的疾病之间的关系。我们将在宿主基因的互补链上的发夹结构基因定义为位于基因上：Intron_c表示内含子和Exon_c表示外显子。我们选择互补链，因为其可导致疾病。例如，位于互补链上的miRNA中的突变。在miRNA在两条链上存在的情况下，在选择内含子和Exon_c内含子时，两种状况相似。选择的逻辑是内含子＞外显子＞lntron_c＞Exon_c＞基因间的。表9显示靶序列(“基因名称”)和疾病(“疾病代码”)之间的关系。

实施例3

miRNA的验证

1.表达分析-第1组

为确定在0上预测的发夹结构和miRNA，我们使用和美国专利申请号60/522,459、10/709,577和10/709,572(其内容在此引用作为参考)中描述的方法相似的高通量微阵列在各种组织中检测表达。对于各预测的前体miRNA，检验从发夹结构的两个茎衍生的成熟miRNA。

表2显示通过检测相关的miRNA(“MID”)的表达验证的第2预测组的发夹结构(“HID”)，和在其中检测表达的组织的代码(“组织”)。表2的组织和疾病的代码列于表7中。受试组织中的一些组织是细胞系。具有/不具有P53:H1299的肺癌细胞系(H1299)具有突变的P53。用具有P53的这样的构建体转染细胞系，该构建体是温度敏感型的(在32℃下具有活性)。在32℃下进行实验。

表2也显示芯片表达评分级别(500至65000的范围)。使用500的阈值消除非显著信号，且通过来自不同实验的MirChip探针信号来规格化评分。实验之间的荧光材料强度中的变化可能是由于RNA制剂或标记功效中的差异造成的。我们基于这样的假设进行规格化，即各样品中的miRNA的总量是相对恒定的。首先我们从各探针的原始信号中减去背景信号，其中将背景信号定义为400。接着，我们将各miRNA探针信号除以所有miRNA的平均信号，将所得结果乘以10000，再加回400的背景信号。因此，根据定义，各实验中所有miRNA的探针信号的总和是10400。

表2也显示了根据规格化的评分计算的规格化的信号的统计分析(“Spval”)。对于各miRNA，我们使用了来自完全的预测的miRNA列表的相关对照组。各miRNA具有包含错配的探针的内对照。相关对照组包含这样的探针，该探针具有相似的C和G百分比(abs diff＜5％)以具有相似的T_m。探针信号P值是对具有相同或更高信号的相关对照组探针的比率。结果是p-值≤0.05，且评分超过500。在SPVal列为0.0的情况下，该值小于0.0001。

2.表达分析—第2组

为进一步确定在0上预测的发夹结构和miRNA，我们在另外的组织中检测了表达。表16通过下列列出了miRNA的表达数据：HID：表17中所示的序列的发夹结构序列标志符；MID：表17中所示的序列的miRNA序列标记符：组织：受试组织；S：芯片表达评分级别(范围＝100-65000)；Dis.Diff.Exp.：疾病相关性差异表达和在其中对其进行检验的组织；R：疾病相关性表达的比率(范围＝0.01-99.99)；和缩写：脑混合物A-患阿尔茨海默氏病的脑组织混合物；脑混合物B-所有脑组织的混合物；和脑SN-黑质。

3.测序

为进一步验证第二次预测的发夹结构(“HID”)，通过使用和美国专利申请号60/522,459、10/709,577和10/709,572(其内容在此引用作为参考)中描述的方法相似的测序方法验证许多miRNA。表3显示通过测定所示的组织(“组织”)中的miRNA(MID)的序列验证的发夹结构(“HID”)。

实施例4

第19号染色体的miRNA

来自实施例3的成组的经验证的miRNA在胎盘中高度表达，其具有明显的序列相似性，且位于第19号染色体上的相同基因座中(图2)。这些预测的miRNA沿着19q13.42基因座中的大约100,000个核苷酸的区域散布。该基因组区域没有编码蛋白的基因并且似乎是基因间的。基因组序列的进一步分析，包括彻底检查我们的预测算法的输出，揭示了更多的推定的相关性miRNA，且将mir-371、mir-372和mir-373定位在该区域下游大约25,000bp。总共在该区域鉴定了54个推定的miRNA前体。可将该miRNA前体分成4个不同类型的关联序列(图2)。聚簇中大约75％的miRNA是高度关联的并且被标记为A型。其他三种miRNA类型，类型B、C和D分别由4、2和2个前体组成。另外3个推定的miRNA前体(S1至S3)具有非相关序列。有趣地，所有miRNA前体的方向都和相邻的mir-371、mir-372和mir-373miRNA前体的方向相同。

进一步的序列分析揭示大多数A-型miRNA内嵌于在聚簇中重复35次的大约600bp的区域中。该重复序列不出现在基因组的其他区域中，且只在灵长类动物中保守。该重复单位几乎总是被上游和下游Alu重复序列包围。这和极度缺乏Alu重复序列的MC14-1聚簇形成了鲜明的反差。

图3-A显示人中包含A-型miRNA前体的35个重复单位的序列的比较。该比较鉴定了2个表现最高序列相似性的区域。一个区域包含A-型miRNA，位于重复序列的3’区域。第2个区域位于A-型miRNA前体上游大约100个核苷酸处。然而，第2个区域在黑猩猩的重复序列单位中没有显示高度相似性，而包含A-型miRNA前体的区域则显示高度相似性(图3-B)。

检查包含A-型重复序列的区域显示，由前体的5’茎编码的miRNA的5’区域(5p miRNA)似乎比成熟的miRNA的其他区域更可变。这和从3’茎衍生的成熟的miRNA的3’区(3p miRNAs)中的可变性相匹配。如所预期的，环区域高度可变。也可在所有43个A-型miRNA的多重序列比对中观察到相同的现象(图4)。

图4中展现的多重序列比对揭示了下列关于预测的成熟miRNA的发现。可将5p miRNA分成3个组。核苷酸1至6为富含C/T的，其相对可变，且在大多数miRNA中由核苷酸3至5中的CTC基序标记。核苷酸7至15富含A/G，且除了核苷酸7和8外，其为绝大多数miRNA所共有。核苷酸16至23富含C/T，且再次显示，其在成员中是保守的。一般而言，预测的3p miRNA在家族成员中显示更高的保守性。大部分从AAA基序开始，但少数具有可能在其靶识别中至关重要的不同的5’序列。核苷酸8至15富含C/T并且显示高度保守性。最后7个核苷酸保守性稍低，但其在核苷酸17至19中包含大多数成员共有的GAG基序。

重复单位的5’区域的分析鉴定了潜在的发夹结构。然而，在大多数重复单位中，这些发夹结构未得以保存，并且从最高评分的发夹结构克隆miRNA的努力也遭到失败。存在未在长重复单位内发现的8个A-型前体。围绕这些前体的序列没有显示出和A-型重复单位或和任何其他基因组序列的相似性。对于这些A-型前体中的5个前体，存在位于显著靠近A-型序列的下游的Alu重复序列。

聚簇中其他miRNA类型显示下列特征。在大约500bp的重复区域中发现了4个B组miRNA，其中一个位于聚簇的末端。两个D-型miRNA，其相互之间相距大约2000个核苷酸，位于聚簇的起始处并且包含在1220个核苷酸的重复区域内。有趣地，两个D-型前体相同。3个非关联序列的miRNA中的2个，S1和S2，正好位于2个D型miRNA之后，且第3个位于A34和A35之间。一般地，包含该聚簇的整个大约100,000个核苷酸的区域被重复元件覆盖。这包括对于该区域特异性的包含miRNA的重复单位和大量散布在该聚簇中的基因组范围的重复元件。

实施例5

预测的miRNA的克隆

为进一步验证预测的miRNA，使用和美国专利中请号60/522,459、10/709,577和10/709,572(其内容在此引用作为参考)中描述的方法相似的方法克隆实施例4中描述的许多miRNA。简而言之，针对各预测的miRNA设计特异性的捕获寡核苷酸。使用所述寡核苷酸捕获、克隆来自富含小RNA的胎盘衍生的文库的特定miRNA并对其进行测序。

我们克隆了43个A-型miRNA中的41个miRNA和D-型miRNA，A-型miRNA中的13个miRNA没有呈递在最初的微阵列上，但只进行了计算机预测。对于预测的miRNA前体中的11个，将5p和3p预测的成熟miRNA都呈递在微阵列上，且在所有情况中两种miRNA都产生了显著的信号。因此，我们试图在所有的克隆尝试中克隆5′和3′成熟miRNA。对于43个克隆的miRNA中的27个，我们能够克隆衍生自5′和3′茎的miRNA。因为我们的克隆努力不是无遗漏的，所以可能有更多的miRNA前体同时编码5′和3′成熟miRNA。

如在许多miRNA克隆研究(Lagos-Quintana 2001，2002，2003)(Poy 2004)中所观察到的，许多克隆的miRNA已在3’末端显示不均一性。有趣地，我们也在大量克隆的miRNA的5’末端观察到不均一性。和3’-茎衍生的miRNA(6)相比，该不均一性似乎在5’-茎衍生的miRNA(9)中更普遍。在比较中，3′末端上的不均一性和3′和5′-茎衍生的miRNA(分别是19和13)的相似。5’不均一性主要包括一个核苷酸(主要是C或A)的加入，但在一种情况下加入了3个核苷酸。该现象对于第19号染色体聚簇中的miRNA不是特异性的。我们已在许多另外克隆的miRNA中，包括已知的miRNA和来自其他染色体的新的miRNA中观察到该现象(数据未显示)。

实施例6

miRNA表达的分析

为进一步检查实施例4的miRNA的表达，我们使用RNA印迹分析来分析几种组织中miRNA表达的特征。使用40μg在13％变性聚丙烯酰胺凝胶上分离的总RNA和使用³²P末端标记的寡核苷酸探针进行RNA印迹分析。寡核苷酸探针序列是5′-ACTCTAAAGAGAAGCGCTTTGT-3′(A19-3p，NCBI：HSA-MIR-RG-21)和5′-ACCCACCAAAGAGAAGCACTTT-3′(A24-3p，NCBI：HSA-MIR-RG-27)。miRNA表达为大约22个核苷酸长的RNA分子，其具有和在微阵列分析(图5-A)中观察到的组织特异性概况相同的组织特异性概况。

为了确定MC19-1聚簇是如何转录的。对该区域中的ESTs的考察只鉴定了一个包含具有多腺苷酸化信号和聚腺苷酸尾的ESTs的位置。该区域正好位于A43前体的下游。仅有的具有包含多腺苷酸化信号的ESTs的其他区域正好位于mir-373之后，从而表明mir-371、2、3位于独立的转录物上。我们进行了初步研究，所述研究集中在围绕mir-A43的区域上，以确保该区域确实被转录为聚腺苷酰化的mRNA。使用覆盖3.5kb区域的引物进行的RT-PCR实验导致获得预期的片段(图5-B)。使用5μg胎盘总RNA和使用寡脱氧胸苷作为引物进行RT-PCR分析。使用下列引物来扩增转录物：

f1：5′-GTCCCTGTACTGGAACTTGAG-3′；

f2：5′-GTGTCCCTGTACTGGAACGCA-3′；

r1：5′-GCCTGGCCATGTCAGCTACG-3′；

r2：5′-TTGATGGGAGGCTAGTGTTTC-3′；

r3：5′-GACGTGGAGGCGTTCTTAGTC-3′；和

r4：5′-TGACAACCGTTGGGGATTAC-3′。通过测序验证片段的真实性。该区域包括mir-A42和mir-A43，这显示两个miRNA都存在于相同的初级转录物上。

关于该聚簇的转录的进一步信息来自位于其内部的77个EST的分析。我们发现42个EST衍生自胎盘。由于这些ESTs沿着整个聚簇散布，因此其表明整个聚簇都在胎盘中表达。该观察和在微阵列分析中观察到的表达概况一致。因此，该聚簇中的所有miRNA都可共表达，只有D-型miRNA例外，其是唯一的在HeLa细胞中表达的miRNA。有趣地，在聚族中，位于该区域的77个EST中没有一个和miRNA前体交叠。这和通过Drosha加工从转录物中除去EST表现度(EST representation)一致。

微阵列表达概况的检查揭示miRNAs D1/2、A12、A21、A22和A34在几种接受检查的其他组织中具有反映为低至中等表达水平的稍许不同的表达概况。这可通过编码miRNA的转录物的可变剪接或通过另外的具有不同组织特异性的启动子沿聚簇的存在来解释。

3p和5p成熟miRNA的表达的比较揭示，对于许多miRNA前体，两者都表达，但在大多数情况下以不同的水平表达。对于大多数pre-miRNA，3p miRNA以高于5p miRNA的水平表达。然而，在6种情况(mir-D1，2、mir-A1、mir-A8、mir-A12、mir-A17和mir-A33)下，3p和5p miRNA以相似的水平表达，且在1种情况(mir-A32)下，5p miRNA以高于3p miRNA的水平表达。

实施例7

保守性

来自实施例4的所有4种类型的预测的miRNA的序列和其他物种(黑猩猩、猕猴、狗、鸡、小鼠、大鼠、果蝇、斑马鱼、真菌、秀丽隐杆线虫)的序列的比较揭示，聚簇中，且事实上整个区域中的所有miRNA，除了在灵长类动物中外，都不是保守的。有趣地，该区域的同源物不存在于接受检查的任何其他基因组中，包括小鼠和大鼠的基因组。因此，这是第1个对于灵长类动物特异性的并且一般不为哺乳动物共有的miRNA聚簇。黑猩猩和人之间的同源性分析显示携带有A-型miRNA的所有35个重复序列在两个物种之间是邻接的(contiguous)。此外，整个聚族在人和黑猩猩之间似乎是相同的。因此，导致MC19-1聚簇出现的多个重复(multiple duplication)必须在黑猩猩和人类分离(split)前已经发生并且在各物种的进化过程中保持稳定。应当指出，已知人第19号染色体包含许多串联簇生的基因家族和大片段重复(Grimwood等人，2004)。因此，在该方面MC19-1聚簇是第19号染色体的天然部分。

在比较中，MC14-1聚簇在小鼠中一般是保守的，并且在聚簇中只包含A7和A8miRNA，除了在灵长类动物中外，所述miRNA不是保守的(Seitz 2004)。相反地，MC19-1聚族中的所有miRNA对灵长类动物是独特的。对在Sanger中发现的所有miRNA的考察揭示，只有3种miRNA，mir-198、mir-373和mir-422a在小鼠或大鼠基因组中不是保守的，然而，其在狗基因组中是保守的，且从而对于灵长类动物不是特异性的。有趣地，和mir-373簇生的，且位于MC19-1聚族下游25kb处的mir-371和mir-372在某种程度上和A-型miRNA(图4)是同源的，但在啮齿类动物中是保守的。

A-型miRNA序列和Sanger数据库中的miRNA的比较揭示，人mir-302家族存在最大的同源性(图4-C)。该同源性比用mir-371、2、3观察到的同源性高。在覆盖690个核苷酸的5个miRNA(包括mir-367)的紧密堆积的聚簇中发现了mir-302家族(mir-302a、b、c和d)，所述家族以反义的方向位于HDCMA18p基因(检索号NM 016648)的编码蛋白的外显子内的第1个内含子中。除了miRNA同源性外，没有另外的同源性存在于mir-320聚簇和MC19-1聚簇之间。mir-371、2、3和mir-302a、b、c、d对于胚胎干细胞都是是特异性的事实是值得注意的。

实施例8

miRNA的差异表达

使用和0中描述的方法相似的芯片表达方法，使用特征提取软件(Feature Extraction Software)(版本7.1.1，Agilent)分析微阵列图像。表2显示和正常组织相比的疾病关联性表达(“R”)的比率。表2也显示规格化的信号的统计分析(“RPval”)。将各探针的信号设置为其中等强度。信号强度的变化范围为从400的背景水平至66000的饱和水平。进行2通道杂交，且将Cy3信号和Cy5信号进行比较，其中进行(正常对疾病)荧光逆转芯片(fluor reversed chip)，将探针信号设置为其平均信号。通过用已知的miRNA平均信号去除信号来规格化所述信号，从而在各实验或通道中，已知的miRNA信号的总和相同。计算疾病和正常组织之间的信号比率。信号比率大于1.5表明显著上调，p值为0.007，而信号比率大于2，则有0.003的P值。基于这些或更大的信号比率在在重复实验中的发生来评价P值。

表2中的差异表达分析表明许多miRNA的表达在疾病组织中发生了显著的改变。特别是，实施例4的MC19-1miRNA在前列腺癌和肺癌中差异表达。在来源于前列腺癌的细胞中，MC19-1区域内的杂合性丧失的鉴定支持MC19-1miRNA和癌症的关联性(Dumur等人2003)。

Claims

1.包含这样的序列的分离的核酸，该序列选自：

(a)表1中涉及的发夹结构的序列；

(b)表10的序列标志符6757248-6894882的序列；

(c)表17的序列标志符1-6318或18728-18960的序列；

(d)表1中涉及的miRNA的序列；

(e)表10的序列标志符1-117750或6894883-10068177的序列；

(f)表17的序列标志符6319-18727或18961-19401的序列；

(g)表4中涉及的靶基因结合位点的序列；

(h)表10的序列标志符117751-6757247的序列；

(i)(a)-(h)的互补物；

(j)包含和(a)-(h)具有至少60％的同一性的至少12个邻接的核苷酸的核苷酸序列；

其中所述核酸在长度上是5至250个核苷酸。

2.包含权利要求1的核酸的探针。

3.权利要求2的探针，其中所述核酸包含至少8-22个邻接的核苷酸，该邻接的核苷酸和表2中称为在前列腺癌或肺癌中差异表达的miRNA互补。

4.权利要求3的多个探针。

5.权利要求4的多个探针，其包含至少一个和表2中称为在前列腺癌中差异表达的miRNA互补的探针。

6.权利要求4的多个探针，其包含至少一个和表2中称为在肺癌中差异表达的miRNA互补的探针。

7.包含权利要求4-6中任一项的多个探针的组合物。

8.包含固体基质的生物芯片，所述基质包含权利要求4-6中任一项的多个探针，其中在空间确定的地址上将各探针附着至基质。

9.权利要求8的生物芯片，其中所述探针和表2中称为在前列腺癌中差异表达的miRNA互补。

10.权利要求8的生物芯片，其中所述探针和表2中称为在肺癌中差异表达的miRNA互补。

11.检测疾病关联性miRNA的差异表达的方法，其包括：

(a)提供生物学样品；和

(b)测量这样的核酸的水平，该核酸和(i)表1中涉及的miRNA的序列、(ii)表10的序列标志符1-117750或6894883-10068177的序列、(iii)表17的序列标志符6319-18727或18961-19401的序列或(iv)(i)-(iii)的变体具有至少70％的同一性，

其中和对照相比，核酸水平上的差异指示差异表达。

12.鉴定调节病理状况的化合物的方法，其包括：

(a)提供能够表达这样的核酸的细胞，该核酸和(i)表1中涉及的miRNA的序列、(ii)表10的序列标志符1-117750或6894883-10068177的序列、(iii)表17的序列标志符6319-18727或18961-19401的序列或(iv)(i)-(iii)的变体具有至少70％的同一性；

(b)将细胞和候选调节剂接触；

(c)测量所述核酸的表达水平，

其中和对照相比，核酸的水平上的差异鉴定该化合物为和该核酸关联的病理状况的调节剂。

13.抑制细胞中靶基因的表达的方法，其包括以足以抑制靶基因表达的量将核酸导入细胞，其中所述靶基因包含(i)基本上和表4中涉及的结合位点同一的结合位点、(ii)表10的序列标志符117751-6757247的序列、或(iii)(i)或(ii)的变体；其中所述核酸包含(a)SEQ IDNOS：1-760616的序列、(b)表10的序列标志符1-117750或6757248-10068177的序列、(c)表17中所示的序列或(d)(a)-(c)的变体。

14.权利要求12的方法，其中所述表达在体外或体内被抑制。

15.增加细胞中靶基因的表达的方法，其包括以足以增加靶基因的表达的量将核酸导入细胞，其中所述靶基因包含(i)基本上和表4中涉及的结合位点同一的结合位点、(ii)表10的序列标志符117751-6757247的序列、或(iii)(i)或(ii)的变体；其中所述核酸包含基本上和(a)SEQ ID NOS：1-760616的、(b)表10所列的、(c)表17中所列的或(d)(a)-(c)的变体的序列互补的序列。

16.权利要求15的方法，其中所述表达在体外或体内被抑制。

17.治疗患有表6中所列的病症的患者的方法，其包括给需要其的患者施用这样的核酸，该核酸包含(a)SEQ ID NOS：1-760616的、(b)表10所列的、(c)表17中所列的或(d)(a)-(c)的变体的序列。