CN102575289A

CN102575289A - 在处的单核苷酸多态性和癌症风险

Info

Publication number: CN102575289A
Application number: CN201080037526.7A
Authority: CN
Inventors: J·B·温迪哈斯; C·佩尔蒂埃
Original assignee: Yale University
Current assignee: Yale University
Priority date: 2009-06-25
Filing date: 2010-06-25
Publication date: 2012-07-11
Also published as: US20120156676A1; AU2010265889A1; US20150025230A1; EP2446056A2; JP2012531210A; IL217120A0; WO2010151841A3; WO2010151841A2; CA2766210A1

Abstract

本发明提供了用于在与乳腺癌症和卵巢癌症有关的基因内部识别突变的方法，例如，用于识别单核苷酸多态性(SNPs)的方法，所述基因修饰微RNA(miRNAs)的结合效果。在一种优选的实施方案中，本发明的方法识别一种单核苷酸多态性(SNP)，这种单核苷酸多态性(SNP)能够通过增加或者减少至少一种miRNA的结合效果来减低BRCA1基因的表达。通过在miRNA结合位点进入单核苷酸多态性(SNPs)产生的miRNA与BRCA1结合的变化能够调节或者减少BRCA1表达，并最终导致乳腺或者卵巢癌细胞未调节的细胞增殖。

Description

在处的单核苷酸多态性和癌症风险

相关申请

本申请涉及2009年6月递交的临时申请USSN 61/220,342，该申请的全部内容通过引证在此全部并入本文。

政府支持

政府支持了本发明的进行，许可号为CA124484和CA131301-01A1，这两者都是由美国国家卫生研究所授权的。政府具有本发明的某些权利。

技术领域

本发明主要涉及癌症和分子生物学领域。本发明提供了用于预测增加的发展成癌症的风险的组合物和方法。

背景技术

尽管在癌症检测方面已经实现了很多进步，但是仍然存在一种需要来识别各种各样的癌症的新的遗传标记，从而可以方便的用于临床应用。迄今为止，对于预计发展成癌症的风险的方法只有很少的选择。

发明内容

本发明的方法不仅提供了能够有效识别乳腺和卵巢癌症基因中多态性的方法，并且提供了评价这些单核苷酸多态性(SNPs)对靶向基因调节和乳腺及卵巢癌症患病风险的效果的方法，其中，所述乳腺和卵巢癌症基因有效的改善miRNAs结合靶分子能力这些方法可以用来识别具有增加的乳腺癌症及卵巢癌症患病风险的病人，这些病人在之前是不能被识别出来的。更为恰当的是，使用本发明的方法识别或者表征的单核苷酸多态性(SNPs)发生在围绕并且包括BRCA1基因的区域内，或者发生在围绕并且包括BRCA1基因的信使核糖核酸(mRNA)转录产物的区域内。

本发明提供了一种方法，这种方法用于在与乳腺癌症和卵巢癌症有关的基因的3′-未翻译的区域(UTR)中识别单核苷酸多态性(SNPs)的方法，所述与乳腺癌症和卵巢癌症有关的基因能够有效的修饰微RNAs(miRNAs)的结合能力。在一种优选的实施方案中，与乳腺癌症和卵巢癌症有关的基因是BRCA1，包括BRCA1基因本身、在该基因组附近的区域、BRCA1调节的元素和/或其信使核糖核酸(mRNA)转录产物。一些本领域内已知的数据库可以用来对所关心的单核苷酸多态性(SNPs)进行计算机识别，这些数据库包括，但是不局限于，HapMap(The InternationalHapMap Project，Nature，2003.426，789-96(发表在“自然”第426期第789-796页的“国际人类基因组单体型图计划”))、dbSNP(Sherry，S.T.et al.Genome Res 1999.9，677-9)和人类工程数据库(Ensembl Project database)(可以从以下网址获得http://www.ensembl.org)，以及一些专业算法，例如，PicTar(Landi，D.et al.DNA Cell Biol(DNA细胞生物学)(2007))、TargetScan(Lewis，B.P.et al.Cell 2005.120，15-20)、miRanda(John，B.et al.PLoS Biol 2004.2，e363)、miRNA.org(Betel，D.et al.NucleicAcids Res(核酸研究)2008.36，D 149-53)，和Microlnspector(Rusinov，V.et al.Nucleic Acids Res 2005.33，W696-700)，从而识别miRNA结合位点。

本发明还提供了一种识别乳腺和卵巢肿瘤、邻近的正常组织(当可以得到的时候)以及正常组织样品的方法，从而评价miRNA互补位点上的序列变化。在本发明方法的一种优选的实施方案中，BRCA1基因或者其mRNA转录产物包含所述miRNA互补位点。在本发明的某些实施方案中，使用邻近的正常组织来证明这些变化是否是种系单核苷酸多态性(SNPs)。做为选择，或者另外，非种系3′未翻译的区域(3′UTR)突变也被进行临床有效性分析。

此外、本发明提供了一种方法，用于体外评价识别的单核苷酸多态性(SNPs)对目标基因调节作用的效果。在本发明方法的一种优先的方面中，BRCA1基因或者其mRNA转录产物中包含所述识别的单核苷酸多态性(SNPs)。在本发明方法的另一个优选的方面中，BRCA1mRNA的3′未翻译的区域(3′UTR)中包含所述识别的单核苷酸多态性(SNPs)。在本发明的某些方面，使用一种细胞培养系统和荧光素酶试验测定表达水平，来评价单核苷酸多态性(SNPs)(Chin，LJ.et al.Cancer Res 2008(2008年的癌症研究).68，8535-40；Johnson，S.M.et al.Cell 2005.120，635-47).为了产生野生型的3′未翻译的区域(3′UTR)，使用聚合酶链式反应(PCR)从一种细胞系中放大人类基因组。为了构建变体序列，使用定点诱变的方法(Johnson，S.M.et al.Cell 2005.120，635-47)。然后，将这些构建物克隆进入荧光素酶报道基因。最终，通过使用GraphPad柱定量报道基因的表达(Chin，L.J.et al.Cancer Res 2008.68，8535-40)。

本发明进一步提供了用于估计发展成为乳腺癌症和卵巢癌症的风险的方法。在该方法的一个方面，相对于该疾病在世界人口中可预计的流行程度，将所关心的单核苷酸多态性(SNP)的流行程度与在样品癌症人口中的流行程度相比较。在本发明方法的一种优选的实施方案中，BRCA1基因或者其mRNA转录产物中包含所关心的单核苷酸多态性(SNPs)。对于新的单核苷酸多态性(SNPs)，可以在与世界人口进行比较之间，创造一种TaqMan聚合酶链反应试验(Applied Biosystems公司)，用于等位基因识别。在这里提供的方法的其他的实施方案中，所关心的单核苷酸多态性(SNPs)与乳腺癌症和卵巢癌症病例参照物相比，从而确定相对于总人口和没有携带这种单核苷酸多态性(SNP)的个体而言，发展成为乳腺癌症和/或卵巢癌症增加的患病风险有关的单核苷酸多态性(SNP)。

具体地，本发明提供了一种分离的并且纯化的BRCA1单倍体，这种分离的并且纯化的BRCA1单倍体包括至少一种单核苷酸多态性(SNP)，其中，这种单核苷酸多态性(SNPs)的存在增加了患者发展成为乳腺癌症或者卵巢癌症的风险。本发明的单倍体是分离的并且纯化的基因组或者互补DNA序列。此外，单倍体是分离地，纯化地，并且，任选地是，扩增后的序列。从其中分理处单倍体序列的基因组DNA和互补DNA序列是来自生物样品中的，所述生物样品包括，体液和组织。最常见地，衍生出单倍体的DNA序列是从，例如，血液或者肿瘤样品中分离出来的，所述血液或者肿瘤样品来自正常患者或者待检测患者之中。在这种单倍体的一个方面，每一单核苷酸多态性(SNPs)都能改变一个或者一个以上miRNA的活性。在这种单倍体的另一个方面，每个单核苷酸多态性(SNPs)都能增加或者降低一个或者一个以上miRNA的活性。在某些方面，所述单核苷酸多态性(SNP)增加或者降低一个或者一个以上miRNA与miRNA结合位点的结合效果。miRNA结合效果的改变增加或者减少了BRCA1的表达，并且，在优选的实施方案中，miRNA结合效果的改变减少了BRCA1的表达。单核苷酸多态性(SNP)可以位于BRCA1基因的非编码区域或者编码区域、在此基因周围，或者在能够调节、改变或者减少BRCA1表达的基因组的基因序列中间或者基因序列之中。位于BRCAI基因非编码区域以及编码区域的单核苷酸多态性(SNPs)位于miRNA结合位点，并且因此抑制一个或者一个以上miRNA的活性。在这个单倍体的某些实施方案中，所述单核苷酸多态性(SNP)选自由ra9911630，rs12516，rs8176318，rs3092995，rs1060915，rs799912，rs9908805，和rs17599948所组成的组中。在一种优选的实施方案中，单核苷酸多态性(SNP)选自由rs12516，rs8176318，rs3092995，rs1060915，和rs799912所组成的组中。在最具有选择性的实施方案中，所述单倍体包含rs8176318和rs1060915。做为选择，所述单核苷酸多态性(SNP)是rs8176318或rs1060915。

在这里描述的单倍体能够增加患者发展成为乳腺癌症或者卵巢癌症的风险。尽管本发明包括乳腺癌症和卵巢癌症的所有的亚类，但是乳腺癌症的某些特定的亚类通常预计是三重阴性的(TN)(ER/PR/HER2阴性的)、是雌激素受体阳性(ER+)、雌激素和孕激素受体阳性的(ER+/PR+)、并且是人类表皮生长因子受体2阳性的(HER2+)。在一种优选的实施方案中，这里描述的单倍体很少是最常见的与三重阴性(TN)的乳癌有关。不希望被任何理论所限制，在这里所列出的激素受体特异型乳癌亚类之中，三重阴性(TN)乳腺癌是最不常见的与偶发原因有关的乳腺癌，因此，这种乳腺癌最有可能是遗传的。三重阴性(TN)乳腺癌与包含rs8176318单核苷酸多态性(SNP)和/或rs1060915的单倍体正向相关，尤其是在非洲籍美国患者中。

本发明包含所有公开的单倍体。优选的单倍体包括这里描述的“罕见的”单倍体：GGACGCTA(SEQ ID NO：6)、GGCCGCTA(SEQ ID NO：9)、GGCCGCTG(SEQ ID NO：10)、GGACGCTG(SEQ ID NO：21)，或者GAACGTTG(SEQ ID NO：26)。

本发明进一步地提供了一种BRCA1多态特性，这种多态特性表明一种增加的发展成为乳腺癌症或者卵巢癌症的风险，所述特性包括确定存在或者不存在以下单核苷酸多态性(SNPs)rs8176318和rs1060915，其中，这些单核苷酸多态性(SNPs)的存在表明具有增加的发展成为乳腺癌症或者卵巢癌症的风险。在某些实施方案中，该特性进一步包括确定存在或者不存在至少一种单核苷酸多态性(SNP)，所述单核苷酸多态性(SNP)选自由以下所组成的组中：rs12516、rs3092995和rs799912。作为选择，或者另外，该特性包括确定存在或者不存在至少一种单核苷酸多态性(SNP)，所述单核苷酸多态性(SNP)选自由以下所组成的组中：rs9911630、rs9908805和rs17599948。在这种特性的一个方面，rs8176318、rs1060915、rs12516、rs3092995、rs799912、rs9911630、rs9908805、或者rs17599948能够改变至少一个微RNA(miRNA)的结合效果。做为选择，rs8176318、rs1060915、rs12516、rs3092995、rs799912、rs9911630、rs9908805，和rs17599948能够增加或者减少至少一种微RNA(miRNA)的结合效果。所述至少一种miRNA是任意人类miRNA，由，例如，miRBase(公众可以通过http://www.mirbase.org/得到)提供。在某些实施方案中，所述miRNA是miR-19a，miR-18b，miR-19b，miR-146-5p，miR-18a，miR-365，miR-210，miR-7，miR-151-3p，miR-1180。优选的，所述miRNA是miR-7。

在其他的实施方案中，该特性进一步包括识别BRCA1基因中存在或者不存在至少一种单核苷酸多态性(SNP)，所述BRCA1基因中的单核苷酸多态性(SNP)减少一种或者一种以上微RNA的结合效果。所述至少一种单核苷酸多态性(SNP)可以存在于编码区域或者非编码区域。示范性的非编码区域包括，但是不局限于，3′未翻译的区域(UTR)、一种基因内区、一种基因间的区域、一种顺式调节元素、启动子元素、增强子元素、或者5′未翻译的区域(UTR)。编码区域的一种非限制性的实施例是一种外显子。

在这里描述的特性能够决定患者发展成为乳腺癌症或者卵巢癌症的风险。尽管本发明包括乳腺癌症和卵巢癌症的所有的亚类，但是乳腺癌症的某些特定的亚类通常预计是三重阴性的(TN)(ER/PR/HER2阴性的)、是雌激素受体阳性(ER+)、雌激素和孕激素受体阳性的(ER+/PR+)、并且是人类表皮生长因子受体2阳性的(HER2+)。在一种优选的实施方案中，这里描述的特性用于确定患者，尤其是非洲籍美国人，发展成为三重阴性(TN)乳腺癌的风险。

本发明还提供了一种识别一种单核苷酸多态性(SNP)的方法，所述单核苷酸多态性(SNP)能够减少BRCA1基因的表达并且增加患者发展成为乳腺癌症或者卵巢癌症的风险，该方法包括：(a)从待检验患者中获得样品；(b)获得一种对照样品；(c)确定来自待检验的患者体内的DNA序列的至少一个miRNA结合位点中存在或者不存在单核苷酸多态性(SNP)；和(d)与该miRNA对来自对照样品的相应DNA序列的相同miRNA结合位点的结合效果相比较，评价至少一个miRNA对至少一个包含所述单核苷酸多态性(SNP)的miRNA结合位点的结合效果，其中，对照样品和待检测样品之间，如果所述至少一个miRNA与相应的结合位点之间的结合效果存在统计学上显著的变化，则说明单核苷酸多态性(SNP)的存在或者不存在会抑制miRNA-调节的保护作用或者增加miRNA-调节的BRCA1基因表达的阻遏作用，从而识别同样能够增加患者发展成为乳腺癌症或者卵巢癌症风险的单核苷酸多态性(SNP)。对照样品和待检测样品之间，如果所述至少一个miRNA与相应的结合位点之间的结合效果存在统计学上显著的增加或者减少，则表明所述单核苷酸多态性(SNP)的存在或者缺失能够抑制miRNA-调节的保护作用或者增加BRCA1基因表达的阻遏作用。在本方法的某些实施方案中，所述待检测的患者已经诊断患有乳腺癌症或者卵巢癌症。相反，对照样品是从没有没诊断出患有任何癌症的患者中获得的。此外，所述对照样品还可以是一种对照值，所述对照值来自数据库或者临床研究。体内、体外或者在活体外评价miRNA对来自待测试样品或者对照样品的DNA序列中的结合位点的结合效果。

本发明还提供了一种识别一种单核苷酸多态性(SNP)的方法，所述单核苷酸多态性(SNP)能够减少BRCA1基因的表达并且增加患者发展成为乳腺癌症或者卵巢癌症的风险，该方法包括：(a)从待检验患者中获得样品；(b)确定来自待检验的患者体内的DNA序列的至少一个miRNA结合位点中存在或者不存在单核苷酸多态性(SNP)；和(c)相对于单核苷酸多态性(SNP)在一种或者更多种世界人口中的预期发病率，评价乳腺癌症或者卵巢癌症人口中单核苷酸多态性(SNP)的发病率，其中，与一种或者一种以上世界人口相比，肿瘤样品中所述单核苷酸多态性(SNP)的存在或者不存在出现统计学上显著的增加，则说明这种单核苷酸多态性(SNP)鱼发展成乳腺癌症或者卵巢癌症的患病风险正向相关，并且，其中，在至少一个能够降低BRCA1表达的miRNA结合位点内存在或者不存在单核苷酸多态性(SNP)表明，这种单核苷酸多态性(SNP)的存在或者不存在能抑制miRNA调节的保护作用或者增加miRNA调节的BRCA1基因表达阻遏作用，从而识别同样能够增加患者发展成为乳腺癌症或者卵巢癌症风险的单核苷酸多态性(SNP)。在本方法的某些实施方案中，所述待检测的患者已经诊断患有乳腺癌症或者卵巢癌症。相反，对照样品是从没有没诊断出患有任何癌症的患者中获得的。此外，所述对照样品还可以是一种对照值，所述对照值来自数据库或者临床研究。世界人口是指地理学上有区别的人口(欧洲人或者非洲籍美国人)或者种族人口(德系犹太人的)，世界人口中的成员之间由于其身体原因或者文化原因，可以预计具有相似的遗传背景。

关于识别单核苷酸多态性(SNPs)的方法，一种miRNA结合位点是凭经验确定的、或者是从数据库中识别的，或者是使用一种计算方法来预计的。此外，单核苷酸多态性(SNP)的存在或者不存在是凭经验确定的、或者是从数据库中识别的，或者是使用一种计算方法来预计的。

此外，该发明提供了一种识别具有发展成为乳腺癌症或者卵巢癌症的风险的患者的方法，该方法包括，a)从待检测患者中获得DNA样品；和b)确定来自样品至少一种DNA序列中存在至少一种单核苷酸多态性(SNP)的，所述单核苷酸多态性(SNP)选自由rs12516、rs8176318、rs3092995和rs799912所组成的组中，其中，在至少一种DNA序列中存在至少一种单核苷酸多态性(SNP)会使患者发展为乳腺癌症或者卵巢癌症的风险与正常患者相比增加10倍。在一种优选的实施方案中，该方法进一步包括确定rs 1060915存在的步骤，其中，在至少一种DNA序列中，rs1060915和选自由rs12516、rs8176318、rs3092995和rs799912所组成的组中的至少一种单核苷酸多态性(SNP)的存在使患者发展成为乳腺癌症或者卵巢癌症的风险与正常患者相比增加100倍。所述正常患者是在rs12516、rs8176318、rs3092995、rs799912或者rs1060915处不携带公有的等位基因的患者。

本发明还提供了一种识别具有发展成为三重阴性(TN)乳腺癌的风险的患者的方法，该方法包括，a)从待检测患者中获得DNA样品；和b)确定来自样品至少一种DNA序列中存在rs8176318或者rs 1060915，其中，与正常患者相比，在至少一种DNA序列中存在rs8176318或者rs 1060915会增加患者发展为三重阴性(TN)乳腺癌的风险。在一种优选的实施方案中，该方法包括确定rs8176318和rs 1060915存在的步骤，其中，在至少一个DNA序列中结合存在rs8176318和rs 1060915进一步增加了患者发展成为三重阴性(TN)乳腺癌的风险。所述正常患者是不携带rs8176318或者rs 1060915的患者。待检测患者优选是非洲籍美国人。

如这里对单倍体、特性和方法的描述，乳腺癌是偶发性的或者遗传的。此外，卵巢癌症是偶发性的或者遗传的。

附图说明

图1是miRNAs生物发生学的示意图。

图2是一种BRCA1 3′未翻译的区域(3′UTR)的注释。

图3是癌症群体中BRCA1 3′未翻译的区域(3′UTR)的示意性比较。

通过从124个癌症DNA样品和14个耶鲁对照物DNA样品扩增整个BRCA1 3′未翻译的区域(3′UTR)获得一种序列，本发明的发现就是以此序列为基础的。

图4表示了来自46种世界人口，包括2,472个体的3中单核苷酸多态性(SNP)位点上的BRCA1 3′未翻译的区域(3′UTR)基因型。

图5是一种图解，表示了来自7种癌症群体和1种耶鲁对照物群体的总共384位个体3个单核苷酸多态性(SNP)位点处的BRCA1 3′未翻译的区域(3′UTR)基因型。

图6表示了8种单核苷酸多态性(SNPs)，这八种单核苷酸多态性(SNPs)被用于推断系谱并完成基因组BRCA1区域的单倍体分析。BRCA1基因中发现的单核苷酸多态性(SNPs)包括rs12516、rs8176318、rs3092995、rs 1060915，和rs799912。BRCA1周围发现的单核苷酸多态性(SNPs)包括ra9911630，rs9908805，和rs17599948。

图7表示了BRCA1单倍体预计的发展。这里显示了十种最常见的单倍体。每种单倍体都可以通过在其原始的单倍体(GGCCACTA，SEQ ID NO：8)上发生的变异的积累来解释。绝大部分直接观察到的单倍体都是被设计的，通过一个衍生的核苷酸变化而相互差异。关于在方框中的两个单倍体那个在谱系中先发生这里使用的单核苷酸多态性(SNPs)是不确定的。在世界范围内，AGCCATTA(SEQ ID NO：2)单倍体是目前最常观察到的单倍体。标记有“随处可见”标记的两种单倍体存在于世界所有区域(GAACAGATA(SEQ ID NO：17)和GAACGCTC(SEQID NO：18))中。该重组单倍体(AGCC-GCTG，SEQ ID NO：19)只被发现在新大陆中，新大陆表示美洲的南部、中部和北部。

图8表示了来自全世界46种群体(2,472个体)的BRCA1区域单倍体数据。

图9表示了7个癌症群体和1个耶鲁对照组(384个体)的BRCA1区域单倍体数据。群体大小：对照组：29个；乳腺/卵巢：17；子宫：55；卵巢：77；ER/PR+：44；HER2+：47；MP：39；三重阴性(TN)：76。

图10表示了BRCA1的种族分类。。

图11通过编码区域突变状态表示了BRCA1单倍体数据。对110位病人进行BRCA1测试，并进行单倍体分析。

图12是一种示意图显示了三重阴性(TN)和耶鲁对照物的BRCA1区域单倍体出现率，通过种族数据相区别。

图13是一种示意图显示了通过种族和年龄相区别的三重阴性(TN)乳腺癌组中BRCA1区域单倍体出现率。

图14是一种图表描述了在每个被选择的群体中，该衍生的等位基因在每个基因型单核苷酸多态性(SNP)(rs12516等位基因A、rs8176318等位基因A、和rs3092995等位基因G)处的出现率检测388位个体中的单核苷酸多态性(SNPs)：欧洲籍美国人和非洲籍美国人对照物，和乳腺癌群体：从左至右表示为三重阴性(TN)、HER2+、和ER+/PR+。

图15是一种图表描述了通过诊断年龄确定的乳腺癌病人之间BRCA1罕见单倍体的出现率。使用罕见的BRCA1单倍体出现率评价所有已知诊断年龄的乳腺癌患者。在诊断时将乳腺癌病人分组，分为小于或者等于52岁或者大于52岁两组。显示有5种单倍体在对照物中罕见但是在乳腺癌患者中常见。

图16A是一种图表描述了通过年龄诊断确定的乳腺癌病人之间BRCA1罕见单倍体的出现率。评价乳腺癌病人，从而得到在整个对照物群体中很少发现但是在乳腺癌病人中常见的单倍体。沿着Y轴显示五种罕见的单倍体的出现率

图16B是一种示意图描述了通过种族确定的乳腺癌之间BRCA1罕见单倍体的出现率。评价欧洲籍美国人和非洲籍美国人的乳腺癌患者的单倍体出现率。欧洲籍美国人和非洲籍美国人作为对照被引入。显示了九种共有单倍体。显示了5种其他的在对照物中罕见但是在乳腺癌患者中常见的单倍体(这些罕见的单倍体被编号，用型号标记，并加方框)。其他的非零单倍体出现率估计值被结合到其他种类中。以粗体表示三个3′未翻译的区域(3′UTR)多态性(在8个核苷酸位点中占位点2、3和4，假设位置1是最左边的核苷酸，位置8是最右边的核苷酸)，用下划线表示了3′未翻译的区域(3′UTR)内衍生的等位基因。

图17A是一种图表通过分类描述了乳腺癌病人之间BRCA1罕见单倍体的出现率。通过亚类对乳腺癌病人分组，并评价乳腺癌病人，从而得到在整个对照物群体中很少发现但是在乳腺癌病人中常见的单倍体。沿着Y轴显示五种罕见的单倍体的出现率

图17B是一种图表通过分类和种族划分描述了乳腺癌病人之间罕见单倍体的出现率。依据乳腺瘤亚类，欧洲籍和非洲籍美国人乳腺癌病人进一步地被分组，并评价其罕见单倍体出现率。欧洲籍美国人和非洲籍美国人作为对照被引入。显示有5种单倍体在对照物中罕见但是在乳腺癌患者中常见。

图18A-B是一对图表，描述了三重阴性(TN)乳腺癌细胞(显示了MDA MB231细胞)转染之后荧光素酶报道基因的转录阻遏作用，所述三重阴性(TN)乳腺癌细胞或者带有与荧光霉素报道基因融合的野生型的(WT，rs 1060915G)或者带有与荧光霉素报道基因融合的突变的BRCA1 mRNA(包含re1060915A变体等位基因)BRCA1基因元素。向细胞中转染入包含WT或者变体BRCA1mRNA元素的荧光素酶报道基因(25纳克)。转染二十四小时后，裂解转染的细胞，并检验其双重荧光素酶活性。变体等位基因(A)被规范化为原始的等位基因(G)。通过students2-tailed t-测验决定统计学显著性。结果表明在所有细胞系(9种被试验的细胞系)中WT和该变体BRCA1元素之间的荧光素酶活性存在1.85倍的变化。因此，rs1060915a是BRCA1基因内的一种调节元素。当存在rs 1060915时，miRNAs也许不会有效的结合(以相同的强度或者松紧度)BRCA1，或者不同的miRNAs与BRCA1结合，从而改变翻译的调节作用。

图19是一种示意图，显示了靶向BRCA1基因内rs 1060915周围位点的miRNAs。预计四种候选miRNAs能够与原始rs1060915等位基因或者变体rs 1060915等位基因结合，但是不与作为选择的单核苷酸多态性(SNP)等位基因结合。许多其他的miRNA预计能够结合，产生较少的剧烈的相互作用或者变化。BRCA1rs 1060915，位置61-945′-AACAGCUACCCUUCCAUCAUAAGUGACUCUUCUG-3′(SEQ ID NO：28).Hsa-miR-7，5′-UGGAAGACUAGUGAUUUUGUUGU-S′(SEQ ID NO：29).BRCA1rs 1060915，位置79-1055′-AUAAGUGACUCCUCUGCCCUUGAGGAC-S′(SEQ ID NO：30).Hsa-miR-129-5P，5′-CUUUUUGCGGUCUGGGCUUGC-S′(SEQ IDNO：31).

BRCA1rs1060915，位置45-93

5′-UGGGAGCCAGCCUUCUAACAGCUACCCUUCCAUCAUAAGUGACUCUUCU-S′(SEQ ID NO：32).Hsa-miR-185，5′-UGGAGAGAAAGGCAGUUCCUGA-S′(SEQ ID NO：33).

BRCA1rs 1060915，位置44-96

5′-AUGGGAGCCAGCCUUCUAACAGCUACCCUUCCAUCAUAAGUGACUCUUCUGCC-3′(SEQ ID NO：34).Hsa-miR-298，5′-AGCAGAAGCAGGGAGGUUCUCCCA-S′(SEQ ID NO：35).

图20A是一种图表，描述了与没有罕见单倍体的癌症病人相比，miR-7在BRCA1罕见单倍体肿瘤中显著高水平的表达(p＝0.04)。可以预计的是，miR-7表达与单倍体有关而不是与乳腺癌的亚类有关。

图20B是一种图表，描述了三重阴性(TN)乳腺癌病人中作为miRNAs函数的miRNA表达的出现率。MiR-7、miR-28、和miR-342在BRCA1肿瘤中高水平表达。例如，miR-7在三重阴性(TN)乳腺癌肿瘤中高水平表达。尽管没有对其他乳腺癌亚类进行试验，但是可以预计，其他存在罕见BRCA1单倍体是亚类也会显示高水平的miR-7表达作用。

图21是一种图表，描述了miR-7与野生型(WT)BRCA1(AA)和包含rs 1060915单核苷酸多态性(SNP)的BRCA1(GG)的结合效果。当存在rs1060915单核苷酸多态性(SNP)的情况下，MiR-7结合被改变。使用原始序列或者变体序列(包含rs1060915单核苷酸多态性(SNP)的BRCA1)转染的HCC 1937+/+细胞：(0.5nM)。MiR-7，而不是其不规则的对照物与野生型(WT)BRCA1序列结合，那就是说miR-7特异性的改变BRCA表达。值得注意的是，通过此模型中较高的荧光素酶表达显示了所述改变的表达。可以预计的是miR-7和不规则对照物(scrambled control)都不能改变变体BRCA1的表达，这是因为不能预计其中存在的带有变体等位基因的结合位点(所述变体等位基因破坏所述以其他的方式存在于野生型(WT)BRCA1中的miR-7结合位点，并假定其保护BRCA1并且使信使核糖核酸或者蛋白质以较高的水平表达)。

具体实施方式

乳腺癌是最常被诊断出的癌症，并且目前是女性主要癌症死亡原因之一。临床分类和分子分类法成功的将乳腺癌并入亚类中并且在具有预后显著性的种类中显示独特的基因表达。在本研究中出现的所有种类之间，种类分为雌激素受体(ER)阳性或者孕激素受体(PR)阳性、HER2接受基因-扩增肿瘤、和三重阴性([TN]雌激素受体(ER)/孕激素受体(PR)/HER2-肿瘤)。所述雌激素受体(ER)/孕激素受体(PR)+和HER2+肿瘤的结合是最常见(80％)的乳腺癌，基本形态的肿瘤或者三重阴性(TN)肿瘤占乳腺癌的大约15-20％(Irvin WJ，Jr.and Carey LA.Eur JCancer 2008(2008年欧洲癌症杂志)；44(18)：2799-805))。三重阴性(TN)表现型代表了一种侵害性强的且人们认知较少的癌症亚类，这类癌症在较为年轻的女性和非洲籍美国女性中最为常见。

编码BRCA1的序列突变是公知的乳腺癌风险因子，但是，这些突变占每年所有乳腺癌病例的5％。总的来讲，由BRCA1突变引起的乳腺肿瘤是最为常见的三重阴性(TN)(57％)(AtchleyDP，et al.J Clin Oncol 2008；26(26)：4282-8)或者雌激素受体(ER)+乳腺癌(34％)(Tung N，et al.Breast Cancer Res；12(1)：R12.)，和很少的HER2+乳腺癌(大约3％)(Lakhani SR，et al.J Clin Oncol2002；20(9)：2310-8.)。由于BRCA1突变是很少见的，三重阴性(TN)肿瘤通常以较低的BRCA1表达为特征(Turner N，Tutt A，Ashworth A.Nature reviews 2004；4(10)：814-9)。BRCA1突变只占三重阴性(TN)肿瘤的10-20％(Young SR et al.BMC cancer2009；9：86；Malone KE，et al.Cancer research 2006；66(16)：8297-308；Nanda R，et al.JAMA 2005；294(15)：1925-33)。这些结果说明，可能存在其他的与BRCA1错表达有关遗传因素，所述BRCA1错表达使个体倾向于发生乳腺癌。

单倍体是基因或者DNA片段内部几个相互之间处于连接不平衡(LD)状态的单核苷酸多态性(SNPs)的模型，并且因此可以作为一种遗传单位。当单倍体作为群体内所有可测量的等位基因或者不可测量的等位基因标记物时，对所关心的区域的单倍体进行研究可以缩窄搜索作为起因的单核苷酸多态性(SNPs)的范围。上述关于BRCA1单倍体与乳腺癌之间的关系的研究已经得到了相互矛盾的结果。Cox等识别了五种共有单倍体(≥5％)，这些单倍体可以通过四种标记的单核苷酸多态性(SNPs)预测。对这些单核苷酸多态性(SNPs)进行检测显示，在护士健康研究中，这些单倍体中的一个预报白人女性中偶发性乳腺癌的发病风险增加了20％(Cox DG，et al.Breast Cancer Res 2005；7(2)：R171-5)。在单倍体、阳性家族史和乳腺癌患病风险之间存在显著的相互作用(/》＝0.05)(Cox DG，et al.Breast Cancer Res(乳腺癌研究)2005；7(2)：R171-5)。相反，Freedman等人检测了多种族群组调查中的一个群组中BRCA1位点的共有变化。该组中没有显示出BRCA1上的共有变异会影响偶发性乳腺癌的患病风险(Freedman ML，et al.Cancer research 2005；65(16)：7516-22)。这些单倍体研究主要针对编码BRCA1的序列和BRCA1内部区域中单核苷酸多态性(SNPs)的变化(Dunning AM，et al.Humanmolecular genetics 1997；6(2)：285-9；Bau DT，et al.Cancer research2004；64(14)：5013-9)。

MiRNAs是一类具有22个核苷酸的非编码RNA，这种RNA是进化上保守的，并且事实上在所有癌症中都被异常表达，在所有癌症中，这种RNA发挥一种新型的致癌基因或者肿瘤抑制子的作用。miRNAs结合3′未翻译的区域(3′UTR)中信使核糖核酸(mRNA)的能力对于调节mRNA水平和蛋白质表达是至关重要的，这种结合可以收到单核苷酸多态性的影响。目前的数据表明，在癌症基因3′未翻译的区域(3′UTR)中的变异是癌症患病风险有力的遗传标记。(Chin LJ，et al.Cancer research(癌症研究)2008；68(20)：8535-40；Landi D，et al.Carcinogenesis 2008；29(3)：579-84；Pongsavee M，et al.Genetic testing and molecularbiomarkers(基因检测和分子生物标记物)2009；13(3)：307-17).

目前已经对BRCA1的3′未翻译的区域(3′UTR)进行研究，研究其中miRNA-结合位点的单核苷酸多态性(SNPs)，在泰国女性中，rs 12516和rs8176318上衍生的(和较不常见的)等位基因显示与家族遗传性的乳腺癌症和卵巢癌症具有正向相关性。该研究发现，在两个单核苷酸多态性(SNP)位点上衍生的等位基因(A)的同型接合性被发现存在于癌症病人中，且其在癌症病人中的出现率是在未感染的泰国人中观察到的出现率的三倍，因此是一种显著的癌症相关因素(p＝0.007)。功能分析显示当在相同的染色体上存在时，在两个位点都具有衍生的等位基因的BRCA1具有降低的功能活性，换言之，在rs8176318处具有衍生的等位基因的BRCA1可以观察到最大的降低(Pongsavee M，et al.Genetic testing and molecular biomarkers(基因测定和分子生物标记物)2009；13(3)：307-17).该研究还发现3′未翻译的区域(3′UTR)变体与已知的BRCA1突变无关。另外，在1998年的研究报道了BRCA1 3′未翻译的区域(3′UTR)中第三单核苷酸多态性(SNP)上的等位基因，rs3092995，在非洲籍美国女性中与增加的乳腺癌患病风险有关。与非洲籍美国人对照相比，一种罕见的衍生的G等位基因在非洲籍美国人乳腺癌病例中更为常见。在非洲籍美国女性中，乳腺癌年龄调节的OR和G等位基因是3.5(95％CI，1.2-10)(Newman B，et al.JAMA 1998；279(12)：915-21).

本发明部分的基于对单倍体的研究的，或者本发明是以对单倍体的研究为条件的，所述单倍体包括功能性的3′未翻译的区域(3′UTR)变体，并且能够更好的识别与乳腺癌患病风险有关的BRCA1单倍体。此外，由于不同乳腺癌亚类的BRCA1功能障碍是变化的，根据不同的乳腺癌亚类对这些单倍体进行评价。因此，识别乳腺癌患者中的3′未翻译的区域(3′UTR)的单核苷酸多态性(SNPs)，其中之一是个体显著的。随后，对这些变体和BRCA13′未翻译的区域(3′UTR)周围的五个单核苷酸多态性(SNPs)进行单倍体分析，从而确定单倍体与乳腺癌之间的关系。这一研究进一步确定了乳腺癌患者中共有的五种单倍体，但这五种单倍体在非癌症群体中非常少见。这种罕见的BRCA1单倍体代表了与乳腺癌患病风险有关的BRCA1功能障碍的一种新的遗传标记。

癌症是一种多层面的疾病，有不受控制的细胞增殖和能够导致肿瘤细胞形成的受损伤细胞的残留引起。细胞具有一系列防护措施，确保细胞分裂、分化和死亡发生在适当的时候。许多细胞因子能够开通或者关闭调节细胞增殖和分化的基因(Esquela-Kerscher，A.&Slack，F.J.Nat Rev Cancer，2006，6：259-69).选择对这些肿瘤抑制基因有害物和致癌基因，从而患上癌症。首先转录肿瘤抑制基因和致癌基因，然后将其翻译为蛋白并表达其作用。现有数据表明，那些小的，非编码蛋白质的RNA分子(又叫做微RNA(miRNAs))，既可以起到肿瘤抑制子的作用也可以起到致癌基因的作用。(Medina，P.P.and Slack，FJ.Cell Cycle 2008.7，2485-92).在人类疾病中，已经显示miRNAs在癌症中被异常表达或者发生突变，这说明miRNAs是一类新型的致癌基因或者肿瘤抑制子基因，更为准确的，被认为是oncomirs(Iorio，M.V.et al.Cancer Res 2005.65，7065-70).

MiRNAs是进化上保守的、短的、非编码蛋白质、单链RNA，其代表了一类新型的后转录基因调节子。研究显示在肿瘤和正常组织之间的miRNA表达存在差异(Medina，P.P.and Slack，FJ.Cell Cycle(细胞循环)2008.7，2485-92)，并且事实上，在所有研究的癌症亚类中miRNAs都处于异常水平(Esquela-Kerscher，A.&Slack，FJ.Nat Rev Cancer 2006.6，259-69)。MiRNAs与其靶向基因的3′未翻译区域(UTRs)相结合，并且分别调节许许多多不同的靶向转录产物，这意味着miRNAs可以调节人类基因组中高达30％的编码蛋白质的基因(Chen，K.et al.Carcinogenesis2008.29，1306-11).因此，性能不良的miRNA的作用可能是多效的，并且，其异常表达可以潜在的使细胞的动态平衡失衡，促进疾病发生，包括促进癌症发生。

miRNA结合信使核糖核酸(mRNA)的能力对于调节mRNA水平和蛋白质表达是至关重要的。然而，这种结合作用可以被存在于miRNA目标地区的单一核苷酸多形性(SNP)影响，所述存在于miRNA目标地区的单一核苷酸多形性(SNP)会消除存在的结合位点或者创造错误的结合位点(Chen，K.et al.Carcinogenesis 2008.29，1306-11).miRNA靶向位点单一核苷酸多形性(SNP)在疾病中的作用，包括在癌症中的作用刚刚开始被定义。

MiRNAs

MiRNAs是一大类小的非编码蛋白质的RNA分子，这种RNA分子具有大约22个核苷酸长度，在后转录基因调节过程中通过与编码蛋白质的基因的mRNA配对发挥作用。最近，已经证明miRNAs在人类癌症定位方面发挥作用，证据是，miRNAs能够调节已知对存活途径至关重要的蛋白质(Esquela-Kerscher，A.&Slack，FJ.Nat Rev Cancer 2006，6：259-69；Ambros，V.Cell 2001，107：823-6；Slack，FJ.和Weidhaas，J.B.Future Oncol 2006，2：73-82).由于miRNAs控制许多下游的靶点，因此它们很有可能作为治疗癌症的新的靶点。

图1使miRNAs的基本合成和成熟过程变得形象化(Esquela-Kerscher，A.and Slack，FJ.Nat Rev Cancer 2006.6，259-69).简单地说，使用RNA聚合酶II在细胞核中，从miRNA基因中转录得到miRNAs，从而形成长的初始RNA(前-miRNA)转录产物，将所得转录产物进行封端并聚腺甘酸化(Esquela-Kerscher，A.and Slack，FJ.Nat Rev Cancer 2006.6，259-69；Lee，Y.et al.Embo J 2002.21，4663-70).这些前-miRNAs可以是一些长度为上千个碱基，并且在细胞核中使用RNA酶III酶Drosha及其辅助因子Pasha进行，从而释放出大约70个核苷酸长度，茎环结构的miRNA前体(前-miRNA)。使用输出蛋白5使前miRNAs以Ran-三磷酸鸟嘌呤核苷(GTP)-依赖性方式从细胞核中输出到细胞质中，然后，在细胞质中被Dicer，一种核糖核酸酶III酶处理。这会释放一种长度大约为22个碱基核苷酸、双链miRNA：miRNA复式结构(miRNA duplex)，这种miRNA复式结构被整合入一种RNA-诱导的静止复合物(miRISC)中。在这一点上，所述复合物现在能够调节其靶向基因。

图1描述了根据miRNA和它的靶点之间的互补程度，基因表达调节作用如何以两种途径之一进行。结合mRNA靶分子并携带有不完成的互补区的MiRNAs靶向蛋白质翻译水平上的基因表达。使用这种机制的miRNAs的互补位点通常出现在靶分子mRNA基因的3′未翻译区域(UTR)。能够以理想的互补性结合其mRNA靶分子的MiRNAs可以诱导靶分子-mRNA裂解。使用这种机制的MiRNAs结合miRNA互补位点，所述miRNA互补位点通常发现在信使核糖核酸靶分子的编码序列或者开放阅读框(ORF)上。

在哺乳动物中，miRNAs是基因调节因子，基本上在被研究的所有癌症亚类中都可以观察到不正常水平的这种基因调节因子。合适的能够结合其靶分子基因的miRNA对于调节信使核糖核酸水平和蛋白质表达至关重要。然而，成功的结合作用可以被存在于miRNA结合部位的单一核苷酸多形性(SNP)影响，所述存在于miRNA目标地区的单一核苷酸多形性(SNP)会废除存在的结合位点或者创造错误的结合位点。因此，在miRNA结合部位的多态性对基因和蛋白质表达具有大范围的作用，并代表了另一种遗传变异性的来源，所述遗传变异性可以影响人类疾病，包括癌症的患病风险。miRNA结合部位的单一核苷酸多形性(SNP)在疾病中的作用刚刚开始被定义，并且在乳腺癌基因中识别单一核苷酸多形性(SNP)能够修饰miRNAs的结合能力，从而起到靶分子基因调节作用并影响乳腺癌症和/或卵巢癌症的患病风险。在乳腺癌基因中识别单一核苷酸多形性(SNP)可以帮助识别一种新型途径，这种途径可以确认具有增加的乳腺癌症和/或卵巢癌症患病风险的病人。

MiRNAs不但靶向靶分子信使核糖核酸和基因的非编码区域，而且靶向编码蛋白质的区域。miRNA的机制：在非编码区和编码区之间的靶分子识别是不同的。当miRNA在编码蛋白质的区域识别出一种结合位点时，与miRNA识别结果和当在非编码区域的结合时的翻译静止作用相比，miRNA结合的翻译静止作用会减少。此外，与位于非编码区域的结合位点点火区相比，位于编码蛋白质的区域内部的miRNA结合位点点火区可能需要更大量的与miRNAs结合的核苷酸。位于编码区域内部的miRNA结合位点也可能发生单一核苷酸多形性(SNP)，并且因此，影响一种或者一种以上miRNA调节靶分子基因表达的能力。

可以预计的是，在编码区域中的单一核苷酸多形性(SNP)和影响miRNA活性的单一核苷酸多形性(SNP)在对靶分子蛋白质表达的作用方面具有定量上或者定性上相似的作用。做为选择，在编码区域中的单一核苷酸多形性(SNP)和影响miRNA活性的单一核苷酸多形性(SNP)在对靶分子蛋白质表达的作用方面具有定量上或者定性上不同的作用。进一步可以预计的是，当非编码区和编码区同时存在单一核苷酸多形性(SNP)时，这些单一核苷酸多形性(SNP)都能影响一种或者一种以上miRNAs与其各自结合位点的结合，这些单独的单一核苷酸多形性(SNP)协同发挥作用，影响靶分子转录产物或者蛋白质的表达。

MiRNA的活性进一步地被细胞周期影响。在细胞周期临界点，某些miRNAs已经显示能够激活翻译作用或者诱导靶分子信使RNA的上调节(Vasudevan S.et al.Science，2007.318(5858)：1931-4).因此，miRNAs的活性在例如细胞周期的生长阶段(Gi和G2)和合成阶段(Si)的翻译阻遏作用以及细胞周期间歇期(Go)的翻译活化作用之间来回震荡。尽管不希望被任何理论限制，癌细胞进入并在不恰当的时间或者以不恰当的出现率完成细胞周期。此外，癌细胞通常在不保护功能或者足够水平的DNA修理蛋白质(包括BRCA1)的情况下完成细胞周期。由于健康的、非癌性细胞可以处于Go阶段，在此阶段，与BRCA1结合的miRNA上调节肿瘤抑制板蛋白质的表达，癌细胞最常处于生长期，在此期间，miRNA转录抑制蛋白质的表达。本发明预计，在影响至少一个miRNA结合活性的非编码区域和/或编码区域中一种单核苷酸多态性(SNP)的存在能够阻止BRCA1的上调节作用，例如，这可以诱导健康细胞进入细胞周期，在此过程中，其他的miRNAs进一步抑制BRCA1和/或其他肿瘤抑制基因的表达。

单核苷酸多态性(SNPs)

单一核苷酸多态性(单核苷酸多态性(SNP))是指同一种族的各个成员之间(或者一种个体的成对的染色体之间)基因组(或者其他共有序列)具有不同的单一核苷酸时存在的DNA序列变化。单核苷酸多态性(SNPs)可以发生在基因编码序列、基因非编码区域或者发生在基因之间的基因间区域。由于遗传密码的退化性，在编码序列内部的单核苷酸多态性(SNPs)不一定改变所产生的蛋白质的氨基酸序列。当一种单核苷酸多态性(SNP)突变导致的一种新型的DNA序列编码相同的多肽序列时，这种单核苷酸多态性(SNP)突变被命名为同义(也被称为静态突变)。相反地，当一种单核苷酸多态性(SNP)突变导致的一种新型的DNA序列编码不同的多肽序列时，这种单核苷酸多态性(SNP)突变被命名为非同义。不在蛋白质编码区域中的单核苷酸多态性(SNPs)也可能造成基因剪接、转录因子结合或者非编码RNA序列的结果。

对于本发明的方法，存在于非编码RNA区域内的单核苷酸多态性(SNPs)是非常重要的，这是由于这些区域包括调节序列，这些调节序列与miRNA分子互补并且是与其他调节因子发生相互作用所必须的。存在于基因组序列内部的单核苷酸多态性(SNPs)被转录进入信使RNA转录产物中进行退化作用或者翻译静止作用，所述转录产物被miRNA分子靶向。存在于基因组序列或者序列的信使RNA 3′未翻译的区域(UTR)内的单核苷酸多态性(SNPs)对于本发明方法是尤其重要的。

BRCA1

BRCA1(乳腺癌1，早期发病阶段)是一种人类肿瘤抑制基因。尽管BRCA1最与乳腺癌相关，但是BRCA1基因存在于人体的所有细胞上。作为一种肿瘤抑制基因，BRCA1负调节细胞增殖作用并且防止通过修复损伤DNA或者启动由于DNA受损严重而不可以被修复的细胞的细胞自杀程序来引入突变。

如果肿瘤抑制基因，例如BRCA1，被突变或者被误调节了，然后其功能受到抑制，择该细胞可以使用不完整的复制DNA进行增殖。此外，该细胞非常频繁的进入细胞周期。在这种环境中，形成肿瘤。与良性肿瘤不同，癌症性肿瘤表示不受控制的生长、入侵和破坏邻近组织、通过淋巴或者血液转移到身体其他位置。

具体地说，BRCA1通过同源重组修复DNA中的双链缺口，其中，同源重组是指一种方法，通过这一方法同源完整的核苷酸序列在两个相似或者相同的DNA链之间进行交换，例如，在来自姐妹染色单体的序列、来自同源染色体之间或者来自相同染色体(根据细胞周期的阶段)作为模板的序列之间交换。但是，这种BRCA1蛋白质不能单独发挥作用。BRCA1与其他肿瘤抑制基因蛋白质、DNA损伤传感蛋白和信号转导蛋白相结合形成一种大的多亚基蛋白质复合物，这种复合物被叫做BRCA1-相关基因组监测复合物(BASC)。

尽管所述BRCA1蛋白质可以形成一种复合物实施其细胞功能，在BRCA1基因中的突变足够解除对细胞修复和细胞增殖过程的调节作用。重要的是，本发明提供了单核苷酸多态性(SNPs)、单倍体、用于识别能够预防或者抑制一种或者一种以上miRNAs与BRCA1基因编码或者非编码区域结合功能的单核苷酸多态性(SNPs)的方法、和通过检测这里描述的至少一种多态性来预测增加的发展成为癌症的患病风险的方法。

本发明提供了用于识别并表征BRCA1内部单核苷酸多态性(SNPs)的方法。尽管不希望被局限于一定的理论，但是可以预计，这里公开的单核苷酸多态性(SNPs)和使用本发明公开的方法识别的在miRNA结合位点内存在的单核苷酸多态性(SNPs)、或者使用本发明公开的方法识别的能够相反影响miRNA活性的单核苷酸多态性(SNPs)会产生“较紧的”miRNA相互作用或者一种或者一种以上miRNA与BRCA1的结合作用，或者，有时，产生“较松的”miRNA相互作用或者这种相互作用的减少。在3′未翻译的区域(3′UTR)中的这些miRNAs增加的结合效果或者活性导致减少的BRCA1转录作用和在该细胞中整体低水平的BRCA1蛋白质。外显子内可能的结合损失还可能导致较低水平的BRCA1。因此，在这里识别的单核苷酸多态性(SNPs)抑制BRCA1肿瘤抑制基因，从而在不检测BRCA1的情况下允许细胞修复和细胞增殖基质进行。如上所述，未调节的细胞增殖作用会导致增加的发展成癌症的风险。

下面提供了示范性的BRCA1基因和转录产物。所有的GenBank记录数据(通过NCBI登记号提供)在此通过引证并入本文。

人类BRCA1转录产物变体1被NCBI登记号NM_007294和SEQ ID NO：11的核苷酸序列编码。

人类BRCA1转录产物变体2被NCBI登记号NM_007300和SEQ ID NO：12的核苷酸序列编码。

人类BRCA1转录产物变体3被NCBI登记号NM_007297和SEQ ID NO：13的核苷酸序列编码.

人类BRCA1转录产物变体4被NCBI登记号NM_007298和SEQID NO：14的核苷酸序列编码。

人类BRCA1转录产物变体5被NCBI登记号NM_007299和SEQ ID NO：15的核苷酸序列编码。

人类BRCA1转录产物变体6被NCBI登记号NR_027676和SEQID NO：16的核苷酸序列编码。

BRCA1：miRNA相互作用

明显过表达的miRNA被认为是一种致癌基因，能够通过负调节肿瘤抑制基因促进肿瘤发生。作为一种肿瘤抑制基因，BRCA1的功能之一是可以抑制一种或者一种以上miRNAs的表达。例如，MiR-7可以被BRCA1抑制，并且在缺乏BRCA1的细胞中过表达(表1)。图20进一步地表示了MiR-7在乳腺癌中高水平表达，并且，具体的说，在乳腺癌的三重阴性(TN)亚类中高水平表达。这里提供的研究说明，发展成为三重阴性(TN)乳腺癌的病人通常携带较少的包含rs1060915单核苷酸多态性(SNP)的单倍体。因此，所述单核苷酸多态性(SNP)的存在能够防止MiR-7与BRCA1结合(图21)。

MiR-7可以防止患上乳腺癌。尽管这一机制与通常认为的miRNAs抑制基因表达的概念相违背，但是当MiR-7结合位点是完整的并且，miR-7结合BRCA1时，BRCA1的表达是比较高的，并且因此，包含BRCA1的细胞含有更多的功能性蛋白质。在外显子之内结合的MiRNAs已经被报道具有这种效果。当rs1060915单核苷酸多态性(SNP)存在于BRCA1中时，miR-7的结合被阻止，BRCA1的表达水平下降，并且，因此，所述细胞具有较少的功能性蛋白质。因此，rs 1060915表达调节因子被包括在BRCA1基因内(图18A-B)。

由于具有较少的可用BRCA1蛋白质或者功能性的BRCA1蛋白质，能够保护细胞不发生DNA合成错误的DNA修复途径被削弱。因此，所述发展成癌症的患病风险被增加。

表1：被BRCA1抑制的头十种miRNAs

MiR-7被BRAC1抑制

在使用野生型BRAC1或者载体参照物转染HCC1937细胞后分析的细胞mRNA水平的表达。

所有列出的miRNA都在缺乏BRCA1中以较高的水平被表达。

分离的核苷酸分子

所述本发明提供了分离的核苷酸分子，所述分离的核苷酸分子包含一种或多种单核苷酸多态性(SNPs)。包含一种或一种以上在这里公开的单核苷酸多态性(SNPs)的分离的核苷酸分子在全文中可以相互替换的被命名为“包含单核苷酸多态性(SNP)的核苷酸分子”。分离的核苷酸分子可以任选的编码一种全长变体蛋白质或其片段。本发明分离的核苷酸分子还包括探针和引物(引物在下面的名为“单核苷酸多态性(SNP)检测试剂”部分进行了更为详细的描述)，所述探针和引物可以被用于检测这里公开的单核苷酸多态性(SNPs)，本发明分离的核苷酸分子还包括分离的全长基因、转录产物、互补DNA分子和其片段，所述片段可以用来实现表达编码蛋白质的目的。

如这里所使用的、一种″分离的核苷酸分子″总的来说，是一种包含本发明单核苷酸多态性(SNP)的分子或者与这种分子杂交的分子，例如，是一种带有互补序列的核苷酸，并且，所述分子是从所述核苷酸分子的天然来源中存在的其他核苷酸中分离出来的。此外，当使用重组方法，或者在化学合成过程中，用化学前体物或者其他试剂生产时，一种“分离的”核苷酸分子，例如，一种包含本发明所述的单核苷酸多态性(SNP)的互补DNA分子，基本上不含有其他的细胞材料或者培养基物质。核苷酸分子可以被融合到其他编码序列或者调节序列中，并且仍然被认为是“分离的”。存在于非人类转基因的动物中，但是不天然存在于动物中的核苷酸分子也被认为是“分离的”。例如，包括在载体中的重组DNA分子被认为是“分离的”。″分离的″DNA分子进一步地实施例包括存在于异种型宿主细胞中的重组DNA分子和在溶液中的纯化的(部分纯化或者基本上纯化的)DNA分子。分离的RNA分子包括含有分离的单核苷酸多态性(SNP)的本发明DNA分子体内或者体外的RNA转录产物。根据本发明，分离的核苷酸分子进一步包括合成产生的这些分子。

通常，包括一种分离的单一核苷酸多形性(SNP)的核酸分子在包括本发明公开的一种或一种以上单一核苷酸多形性(SNP)位点，在所述单一核苷酸多形性(SNP)位点的两次都具有侧面核苷酸序列。侧面序列可以包括与所述单一核苷酸多形性(SNP)位点和/或异源核苷酸序列天然相关的核苷酸残基。优选的，在单一核苷酸多形性(SNP)位置的任意一边上，侧面序列的长度高达大约500个核苷、300个核苷、100个核苷、60个核苷、50个核苷、30个核苷、25个核苷、20个核苷、15个核苷、10个核苷、8个核苷、或者4个核苷(或者在此之间的任意其他长度)，或者与全长基因一样长、或者与全部编码区或者非编码区(或者其中的任意部分，例如外显子、内含子或者5′未翻译区域或者3′未翻译区域)一样长，尤其是如果所述含有单一核苷酸多形性(SNP)的核苷酸分子被用于生产蛋白质或者蛋白质片段时。

对于全长基因和整个蛋白质编码序列，单一核苷酸多形性(SNP)侧面序列可以是，例如，在单一核苷酸多形性(SNP)两边的长度高达大约5KB、4KB、3KB、2KB或者1KB。此外，在这种情况下，所述的分离的核苷酸分子包括外显子序列(包括编码蛋白质和/或非编码蛋白质的外显子序列)，但是可能还包括内含子序列和未翻译的调节序列。因此，任意蛋白质编码序列都可能是邻接的或者是被内含子分开的。重要的问题是，将核苷酸从偏远的并且不重要的侧面序列中分离出来并具有适当的长度，从而使其可以被用于进行特点的操作或者这里所描述的应用，例如，重组蛋白质表达、探针的制备和检测单一核苷酸多形性(SNP)位点的引物，以及其他对含有单一核苷酸多形性(SNP)的核苷酸序列具有特异性的应用。

一种含有分离的单一核苷酸多形性(SNP)的核苷酸分子可以包括，例如，一种全长的基因或者转录产物，例如从基因组DNA中分离的基因(例如，通过克隆或者聚合酶链反应扩增)、一种互补DNA分子、或者一种信使RNA转录产物分子。此外，包括一种或一种以上这里公开的单一核苷酸多形性(SNP)的全长基因和转录产物的片段也被包括在本发明的范围内。

因此，本发明还包括核苷酸序列和他们的补体的片段。片段一般地包括一种连续核苷酸序列，这种连续的核苷酸序列至少具有大约8个或更多的核苷酸，更优选的至少具有大约10个或更多的核苷酸，进一步更优选的包括至少大约16个或者更多的核苷酸。进一步地，片段可以包括的长度至少为大约18个核苷、20个核苷、21个核苷、22个核苷、25个核苷、30个核苷、40个核苷、50个核苷、60个核苷、100个核苷、250个核苷或者500个核苷。片段的长度应该一起预定的应用为基础。这种片段可以使用核苷序列来分离，例如，但是不局限于，SEQ ID NOs：11-16，用于多聚核苷酸探针的合成。然后，可以使用一种标记的探针，例如，用于筛选互补DNA文库、基因组DNA文库、或者信使RNA，从而相对于所关心的区域分离核苷酸。进一步地，引物可以用于扩增反应，例如，为了检测一种或一种以上单一核苷酸多形性(SNP)位点或者为了克隆基因的特异性区域。

本发明分离的的核苷酸分子进一步包括一种含有单一核苷酸多形性(SNP)的多聚核苷酸，这种含有单一核苷酸多形性(SNP)的多聚核苷酸是多种核苷酸扩增方法中任意一种的产物，所述多种核苷酸扩增方法被用于增加核苷酸样品中所关心的多聚核苷酸的拷贝数。这些扩增方法是本领域内已知的，并且它们包括但是不局限于聚合酶链式反应(PCR)(美国专利第4,683,195号；和美国专利第4,683,202号；聚合酶链反应技术：原理和DNA扩增应用，H.A.Erlich主编，Freeman出版社，纽约，纽约州1992)、连接酶链式反应(LCR)(Wu and Wallace，Genomics 4：560，1989；Landegren et al，Science 241：1077，1988)、链取代扩增(SDA)(美国专利第5,270,184号和美国专利第5,422,252号)、转录-调节的扩增(TMA)(美国专利第5,399,491号)、连接的线性扩增(LLA)(美国专利第6,027,923号)、等等，和等温扩增方法，例如基于核苷酸序列的扩增(NASBA)、和能自给的序列复制(Guatelli et al.，Proc.Natl.Acad.Sci.USA87：1874，1990)。根据这些理论，本领域技术人员可以容易的在任意适当的区域5′和3′设计针对这里所公开的单一核苷酸多形性(SNP)的引物。这种引物可以用来扩增任意长度的DNA，所述DNA的长度可以长到在其序列中包含所有所关心的单一核苷酸多形性(SNP)。

如这里所使用的，本发明“扩增的多聚核苷酸”是一种包含单核苷酸多态性(SNP)的核苷酸分子，通过体外进行核苷酸扩增方法，与其在待检测样品中的起始量相比，这种包含单核苷酸多态性(SNP)的核苷酸分子的量增加了至少2倍。在其他优选的实施方案中，扩增的多聚核苷酸与其在待检测样品中的起始量相比，结果增加了至少10倍、至少五十倍、一百倍、一千倍、乃至一万倍。在一种常见的聚合酶链反应扩增中，与未扩增的基因组DNA相比，所关心的多聚核苷酸通常被扩增至少5万倍，但是试验所需的准确的扩增量取决于随后使用的检测方法的敏感性。

通常，被扩增的多聚核苷酸的长度至少为大约10个核苷酸。更通常，被扩增的多聚核苷酸的长度至少为大约16个核苷酸。在本发明的一种优选的实施方案中，被扩增的多聚核苷酸的长度至少为大约20个核苷酸。在本发明一种更为优选的实施方案中，被放大的多聚核苷酸的长度至少为大约21个核苷酸、22个核苷酸、23个核苷酸、24个核苷酸、25个核苷酸、30个核苷酸、35个核苷酸、40个核苷酸、45个核苷酸、50个核苷酸、或者60个核苷酸。在本发明的又一个优选的实施方案中，被扩增的多聚核苷酸的长度至少为大约100个核苷酸、大约200个核苷酸或者大约300个核苷酸。尽管本发明被扩增的多聚核苷酸的长度可以与一种外显子、一种内含子、一种5′未翻译的区域(UTR)、一种3′未翻译的区域(3′UTR)或者包括所关心的单核苷酸多态性(SNP)的全部基因一样长，但是通常，扩增产物的长度不大于大约1,000个核苷酸(尽管某些扩增方法可以产生长度大于1000个核苷酸的扩增产物)。更优选地，被扩增的多聚核苷酸的长度不大于大约600个核苷酸。可以理解的是，无论被扩增的多聚核苷酸的长度是多少，所关心的单核苷酸多态性(SNP)可以位于其序列的任意部分。

这种产物也许在其5′末端或其3′末端或者其两端都具有额外的序列。在另一个实施方案中，扩增产物的长度大约为101个核苷酸，并且包括这里公开的单核苷酸多态性(SNP)。优选的，所述单核苷酸多态性(SNP)位于扩增产物的中间(例如，当扩增产物的长度为201个核苷酸时，其位置在第101位，或者，当扩增产物的长度为101个核苷酸时，其位置在第51位)、或者在距离该扩增产物中间第1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、12个核苷酸、15个核苷酸或者第20个核苷酸之内(但是，如上所述，所关心的单核苷酸多态性(SNP)可以位于该扩增产物的任意位置)。

本发明提供了分离的核苷酸分子，所述分离的核苷酸分子包括、由或者基本上由一种或者一种以上包括这里所公开的单核苷酸多态性(SNPs)的多聚核苷酸序列、其补体或者其包含单核苷酸多态性(SNP)的片段组成。

当核苷酸序列是所属核酸分子的完全核苷酸序列时，核酸分子由核苷酸序列所组成。

当核苷酸序列在其末端核酸分子上存在一些其他的核苷酸残基时，核酸分子基本上由核苷酸序列组成。

当核苷酸序列至少是核酸分子末端核苷酸序列的一部分时，核酸分子包括核苷酸序列。在这种方式中，核酸分子可以是唯一的核苷酸序列或者具有其他的核苷残基，例如与其天然相关的残基或者异源核苷酸序列。这种核酸分子可以具有一个到几个其他的核苷酸或者可以包括许多其他的核苷酸。下面提供了如何方便的制备并分离各种各样的核酸分子种类的简要描述，这些技术对于本领域普通技术人员来讲是已知的(Sambrook and Russell，2000，Molecular Cloning：A Laboratory Manual，Cold SpringHarbor Press，NY)(Sambrook和Russell于2000年所著的“分子克隆：实验室操作指南”Cold Spring Harbor出版社，纽约)。

所述分离的核酸分子包括，但是不局限于，具有编码仅仅一种肽的序列的核酸分子、具有编码成熟肽序列和其他编码序列的核酸分子，其中，所述其他编码序列例如前导序列或者分泌序列(例如，前亲蛋白序列或者亲蛋白序列)、具有编码成熟肽序列同时具有或者不具有其他编码序列的核酸分子，以及具有其他的非编码序列的核酸分子，所述额外的非编码序列例如，内含子和非编码5′和3′序列，例如已经被转录，但是没有被翻译的序列，这种序列在，例如，转录、信使RNA加工(包括叠接和多聚腺苷酸作用信号)、核糖体结合、和/或信使RNA的稳定性。此外，所述核酸分子可以与编码，例如能够促进纯化的肽的异源标记序列所融合。

分离的核酸分子可以以RNA的形式存在，例如，信使RNA，或者以DNA的形式存在，包括互补DNA和基因组DNA，这种分离的核酸分子可以通过，例如，分子克隆的方法获得，或者通过化学合成的方法生产或者通过这些方法的结合方式生产(Sambrook and Russell，2000，Molecular Cloning：A LaboratoryManual，Cold Spring Harbor Press，NY)(Sambrook和Russell于2000年所著的“分子克隆：实验室操作指南”Cold Spring Harbor出版社，纽约)。此外，分离的核酸分子，特别是单核苷酸多态性(SNP)检测试剂，例如探针和引物，还可以部分地或者完全地以一种或者一种以上种类的核酸类似物的形式存在，所述核酸类似物，例如，肽核苷酸(PNA)(美国专利第5,539,082号；美国专利第5,527,675号；美国专利第5,623,049号；美国专利第5,714,331号)。所述核苷酸，尤其是DNA，可以是双链的或者是单链的。单链核苷酸可以是编码链(正义链)或者是互补的非编码链(反义链)。DNA、RNA或者肽核苷酸(PNA)部分可以是组装的，例如，来自人类基因组(对于DNA或者RNA的情况)或者是单一核苷酸、短低聚核苷酸连接体、或者由一系列低聚核苷酸组成，从而提供合成的核苷酸分子。核苷酸分子可以容易地使用这里提供作为参考的序列进行合成：低聚核苷酸和肽核苷酸(PNA)低聚物综合方法在本领域内是已知的(参见，例如，Corey，″Peptide nucleic acids：expanding the scope of nucleic acidrecognition″，Trends Biotechnol.1997 June；15(6)：224-9(Corey等人于1997年六月在″生物技术趋势″第15(6)卷第224-229页发表的名为“肽核苷酸：核苷酸识别的延伸区域”的文章)和Hyrupet al.，″Peptide nucleic acids(PNA)：synthesis，properties andpotential applications″，Bioorg Med Chem.1996 January；4(1)：5-23(Hyrup等人于1996年1月在“生物医药化学”第4(1)期第5-23页发表的名为“肽核苷酸(PNA)：合成、性质和有效应用”的文献))。而且，大规模的自动低聚核苷酸/肽核苷酸(PNA)合成(包括在一排阵列或者磁珠表面或者其他固体支持物上的合成)可以使用商业上可获得的核苷酸合成器方便的完成，所述核苷酸合成器例如，Applied Biosystems(福斯特市，加利福尼亚州)。3900高处理量DNA合成器或者Expedite 8909核酸合成系统，以及这里提供的序列信息。

本发明包括一种核苷酸类似物，这种核苷酸类似物包含修饰后的、合成的或者非天然存在的核苷酸或者结构成分、或者其他本领域内已知的作为选择的/修饰的核苷酸化学过程。这种核苷酸类似物可以有效用于，例如，作为检测试剂(例如，引物/探针)检测在SEQ ID NOs：21、26和27中识别的一种或者一种以上单核苷酸多态性(SNPs)。此外，包括这些类似物的试剂盒/系统(例如小珠、芯片、等等)也被包括在本发明的范围内。例如，根据本发明多态性序列的肽核苷酸(PNA)低聚物也被特异性的包括在本发明范围内。肽核苷酸(PNA)低聚物是一种DNA类似物，其中，所属磷酸盐主链被替换为肽样主链。(Lagriffoul et al.，Bioorganic&Medicinal Chemistry Letters(生物有机物和药物化学文摘)，4：1081-1082(1994)，Petersen et al.，Bioorganic&MedicinalChemistry Letters(生物有机物和药物化学文摘)，6：793-796(1996)，Kumar et al.，Organic Letters(有机文摘)3(9)：1269-1272(2001)，WO96/04000).与传统的低聚核苷酸和低聚核苷酸类似物相比，肽核苷酸(PNA)与互补RNA或者DNA以较好的亲和力和专一性杂交。肽核苷酸(PNA)的性质使其适用于新型的分子生物学和生物化学应用，所述新型的分子生物学和生物化学应用是传统的低聚核苷酸和肽所不能达到的。

其他能够改善核苷酸结合性质和/或稳定性的核苷酸修饰实施例包括碱基类似物的应用，所述碱基类似物例如次黄嘌呤核苷；包括嵌入剂(美国专利第4,835,263号)和小沟粘合剂(美国专利第5,801,115号)的应用。因此，参照这里对于核苷酸分子的描述，包含单核苷酸多态性(SNP)的核苷酸分子、单核苷酸多态性(SNP)检测试剂(例如，探针和引物)、低聚核苷酸/多核苷酸包括肽核苷酸(PNA)低聚物及其他核苷酸类似物。本领域内已知的其他的核苷酸类似物和选择性的/修饰核苷酸化学作用描述在核酸化学，John Wiley&Sons，纽约(2002)中。

核苷酸分子的进一步的变体包括但不局限于SEQ ID NOs：11-16所识别的序列，例如，天然存在的等位基因变体(以及直系同源物和旁系同源物)和经过致突变方法生产的合成的变体，这些变体可以使用本领域内已知的方法识别和/或产生。这些进一步的变体可以包括一种核苷酸序列，这种核苷酸序列与SEQ IDNOs：11-16(或其片段)所公开的核苷酸序列具有70-80％、80-85％、85-90％、91％、92％、93％、94％、95％、96％、97％、98％、或者99％的序列同一性，并且，所述进一步的变体包括一种新型的单核苷酸多态性(SNP)等位基因。本发明明确地包括分离的核苷酸分子，与SEQ ID NOs：11-16相比，这种分离的核苷酸分子具有一定程度的序列变化，而且包括一种新型的单核苷酸多态性(SNP)等位基因。

可以使用一种数学算法完成两种序列之间的序列比较和一致性百分比的确定。(Computational Molecular Biology，Lesk，A.M.，ed.，Oxford University Press，New York，1988(计算分子生物学，Lesk，A.M.编辑的，剑桥大学出版社，纽约1988年)；Biocomputing：Informatics and Genome Projects，Smith，D.W.，ed.，Academic Press，New York，1993(生物运算：信息和基因组工程，Smith，D.W.编辑的，学术出版社出版，纽约，1993年)；ComputerAnalysis of Sequence Data，Part 1，Griffin，A.M.，and Griffin，H.G.，eds.，Humana Press，New Jersey，1994(序列数据的计算机分子，第一部分，Griffin，A.M.，和Griffin，H.G.编辑的，Humana出版社出版，新泽西，1994)；Sequence Analysis in Molecular Biology(分子生物学中的序列分析)，von Heinje，G.，Academic Press(学术出版社)，1987；和Sequence Analysis Primer(序列分析引物)，Gribskov，M.and Devereux，J.，eds.(Gribskov，M.和Devereux，J.编辑的)，M Stockton出版社，纽约，1991).在一种优选的实施方案中，使用Needleman和Wunsch运算法则确定两个氨基酸序列之间的一致性百分比(J.MoI.Biol.(48)：444-453(1970))这种方法已经被整合入GCG软件包的GAP程序中，使用Blossom 62矩阵或者PAM250矩阵，以及缺口重量为16、14、12、10、8、6、或者4，以及长度重量为1、2、3、4、5或者6。

在依旧另一个优选的实施方案中，使用GCG软件包中的GAP程序，使用aNWSgapdna确定两个核苷酸序列之间的一致性百分比(Devereux，J.，et al，Nucleic Acids Res.12(1)：387(1984))。CMP矩阵和缺口重量为40、50、60、70、或者80，并且长度重量为1、2、3、4、5、或者6。在另一个实施方案中，使用E.Myers和W.Miller运算法则(CABIOS，4：11-17(1989))确定两个氨基酸序列或者核苷酸序列之间的一致性百分比，使用PAM120重量残基表、间隙长度为12，缺口值为4，这些运算法则被整合入ALIGN程序(2.0版本)中。

本发明的核苷酸和氨基酸顺序可以进一步地被用作″询问序列″，执行对序列数据库的检索，从而，例如，识别其他同族成员或者相关序列。可以使用Altschul等人(J.MoI.Biol.215：403-10(1990))的NBLAST和XBLAST程序(2.0版本)进行这种检索.使用NBLAST程序进行BLAST核苷酸检索，score＝100，wordlength＝12，从而获得与本发明所述核苷酸分子相同的核苷酸序列。使用XBLAST程序进行BLAST蛋白质检索，score＝50，wordlength＝3，从而获得与本发明所述蛋白质相同的氨基酸序列。为了获得可以实现比较目的的间断联配(Gapped Alignment)，可以如Altschul等描述的那样(Nucleic AcidsRes.25(17)：3389-3402(1997))使用间断的BLAST.当使用BLAST和间断的BLAST程序时，可以使用各自程序的缺省参数(例如，XBLAST和NBLAST)。除了BLAST之外，本领域内使用的其他检索和序列比较程序的实施例包括，但是不局限于，FASTA(Pearson，Methods MoI.Biol.25，365-389(1994))和KERR(Dufresne et al.，Nat Biotechnol 2002 December；20(12)：1269-71)。对于更多的关于生物信息学方法的信息，请参见Current Protocols in Bioinformatics，John Wiley&Sons，Inc.，N.Y(当前的生物信息学方案，John Wiley&Sons有限公司，纽约)。

单核苷酸多态性(SNP)检测试剂

在本发明方法的一个具体的方面，这里公开的序列可以被用于设计单核苷酸多态性(SNP)检测试剂。在一种优选的实施方案中，SEQ ID NOs：11-16的序列被用于设计单核苷酸多态性(SNP)检测试剂。如这里所使用的，“单核苷酸多态性(SNP)检测试剂”是一种能够特异性的检测这里公开的一种具体的靶分子单核苷酸多态性(SNP)位点的试剂，也是优选的对一种靶分子单核苷酸多态性(SNP)位点中特定的核苷酸(等位基因)具有特异性的试剂(即，所述检测试剂优选的将靶分子单核苷酸多态性(SNP)位点上不同的可互换的核苷酸区别开来，从而确定该靶分子单核苷酸多态性(SNP)位点上存在的核苷酸的一致性)。通常，这种检测试剂与一种包含单核苷酸多态性(SNP)的核苷酸分子通过碱基互补配对以序列特异性方式杂交，并且这种检测试剂能够将靶分子变体序列从其他核苷酸序列，例如本领域内已知的在检测样品中形成的其他核苷酸序列相区别。在一种优选的实施方案中，这种探针可以将靶分子单核苷酸多态性(SNP)位点上具有特定核苷酸(等位基因)的核酸与其他在相同靶分子单核苷酸多态性(SNP)位点上具有不同核苷酸的核酸相区别。此外，检测试剂可以与单核苷酸多态性(SNP)位点上的特定区域，5′和/或3′杂交，尤其是与相应的3′未翻译的区域(3′UTR)杂交。检测试剂的另一种实施例是一种引物，这种引物可以作为核苷酸沿着靶分子多聚核苷酸互补链延长的起始点。这里提供的单核苷酸多态性(SNP)序列信息也对设计引物有效，例如，设计等位基因-特异性引入，从而扩增(例如，使用聚合酶链反应)本发明的任意一种单核苷酸多态性(SNP)。

在本发明的一个优选的实施方案中，单核苷酸多态性(SNP)检测试剂是一种分离的或者合成的DNA或者RNA多聚核苷酸探针或者引物或者PNA低聚物，或者是DNA、RNA和/或PNA的结合，其与在LCS中包含单核苷酸多态性(SNP)的靶分子核酸片段杂交。以多聚核苷酸形式存在的检测试剂任选地包括修饰碱基类似物，嵌入剂或者小缝隙粘合剂。多重检测试剂(例如探针)可以，例如，附着在一种固体支持物(例如，芯片或者珠粒)上，或者位于溶液中(例如，设置用于进行聚合酶链反应、反转录-聚合酶链反应、TaqMan试验或者引物延伸反应的探针/引物)，从而形成一种单核苷酸多态性(SNP)检测试剂盒。

探针或者引物通常是一种基本上纯化的低聚核苷酸或者PNA低聚物。这种低聚核苷酸一般包括一种互补的核苷酸序列区域，所述互补的核苷酸序列区域在严格条件下与靶分子核酸中至少大约8个、10个、12个、16个、18个、20个、21个、22个、25个、30个、40个、50个、60个、100个(或者其中或者其间任意数目)或者更多的连续核苷酸杂交。根据具体的试验，所述连续的核苷酸可以包括靶分子单核苷酸多态性(SNP)位点，也可以是与邻近的5′和/或3′单核苷酸多态性(SNP)位点足够接近足以进行需要的试验的特异性区域。

对本领域普通技术人员来讲显而易见的是，这种引物和探针可以直接用作本发明单核苷酸多态性(SNPs)基因定型试剂，并且可以整合入任意试剂盒/系统格式中。

为了生产对包含靶分子单核苷酸多态性(SNP)的序列具有特异性的探针或者引物，通常使用计算机算法检测在所关心的单核苷酸多态性(SNP)周围的基因/转录产物和/或关联序列，这种计算计算法开始于核苷酸序列的5′或者3′末端。然后，典型的算法能够识别具有定义长度的低聚物，这种低聚物对于基因/单核苷酸多态性(SNP)关联序列是独特的，并且在一定范围内具有GC内含物，适合于杂交，，该低聚物缺少能够干扰杂交的二级结构和/或具有其他需要的特性或者缺少其他不需要的特性。

本发明的引物或者探针通常长度至少为大约8个核苷酸。在发明的一种实施方案中，引物或者探针的长度为至少10个核苷酸。在一种优选的实施方案中，引物或者探针的长度为至少12个核苷酸。在本发明一种更为优选的实施方案中，引物或者探针的长度至少为大约16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸、20个核苷酸、21个核苷酸、22个核苷酸、23个核苷酸、24个核苷酸或者25个核苷酸。尽管探针的最大长度可以与待检测的靶分子序列一样长，但是根据使用的试验种类不同，探针的长度一般小于大约50个核苷酸、60个核苷酸、65个核苷酸或者70个核苷酸。就引物而言，其通常长度小于大约30个核苷酸。在发明的一种具体的优选实施方案中，引物或者探针的长度为在18个核苷酸到28个核苷酸之间。然而，在其他的实施方案中，比如核酸芯片及其他探针与底物相附着的实施方案中，探针可以是较长的，例如，大约是30-70、75，80、90、100、或更多的核苷酸(参见下面题目为“单核苷酸多态性(SNP)检测试剂盒和系统”部分)。

为了分析单核苷酸多态性(SNPs)，使用对可互换的单核苷酸多态性(SNP)等位基因具有特异性的低聚核苷酸是比较恰当的。这种能够检测目标序列中单一核苷酸变化的低聚核苷酸在这里被命名为“等位基因-特异性低聚核苷酸”、“等位基因-特异性探针”或者“等位基因-特异性引物”。The design and use ofallele-specific probes for analyzing polymorphisms is described in，e.g.，Mutation Detection A Practical Approach，ed.Cotton et al.Oxford University Press，1998(Cotton等编辑的“突变检测，一种实用的方法”牛津大学出版社，1998)；Saiki et al.，Nature 324，163-166(1986)；Dattagupta，EP235.726；和Saiki等人的WO 89/11548中描述了等位基因-特异性探针的设计和用于分析多态性的使用。

尽管每个等位基因-特异性引物或者探针的设计是取决于许多变量的，例如，靶分子核酸单核苷酸多态性(SNP)位点侧面核苷酸序列的精确组合物、和引物或者探针的长度，但是在使用引物和探针时的另一个因素是严格的条件，在此严格的条件下才能进行探针或者引物与所述目标序列的杂交。较为严格的条件使用具有较低离子强度的缓冲液和/或较高的反应温度，并且为了形成稳定的双链结构往往要求探针/引物与目标序列之间更为理想的匹配。但是，如果严格性太高，可能根本不会发生杂交。相反，较不严格的条件使用具有较低离子强度的缓冲液和/或较低的反应温度，并且在探针/引物和目标序列形成的稳定的双链中允许更多的错配碱基。举例来讲，但并不作为限制，使用等位基因-特异性探针的较为严格的杂交条件的示范性条件如下所述：使用包括五倍标准盐水磷酸盐乙二胺四乙酸(SSPE)、0.5％NaDodSO4(SDS)的溶液在55摄氏度条件下预杂交，并且在相同的溶液中，以相同的温度培养探针和目标核酸分子，随后使用包含两倍盐水磷酸盐乙二胺四乙酸(SSPE)和0.1％SDS的溶液在55摄氏度或者室温中洗涤。

中度严格条件可以用于等位基因-特异性引物延长反应，在46摄氏度条件下使用包括，例如大约50mM KCl的溶液。做为选择，所述反应可以在提高的温度条件下进行，例如在60摄氏度条件下。在另一个实施方案中，适用于低聚核苷酸连接试验(OLA)的中度严格的杂交条件可以使用大约100mM KCl的溶液，在46摄氏度条件下，在所述低聚核苷酸连接试验(OLA)中，如果两个探针与目标序列完全互补的话，他们是相互结合的。

在基于杂交的实验中，根据不同的多态型存在，对来自两个个体的DNA片段分别设计等位基因-特异性探针，使其与来自一个个体的目标DNA片段杂交但是不与来自另一个个体的相应片段杂交。杂交条件应该足够严格，从而等位基因之间的杂交强度存在显著的可检测的差异，并且，优选的，实质上存在二次反应，因此，所述探针只与一个等位基因杂交或者与一个等位基因明显更剧烈的杂交。尽管可以设计一种探针与包含单核苷酸多态性(SNP)位点的目标序列杂交从而沿着该探针序列的任意方向调整该单核苷酸多态性(SNP)位点，但是优选的，设计该探针序列使其与目标序列的片段杂交，从而使该单核苷酸多态性(SNP)位点排列在探针的中心位置(例如，在探针中距离探针任意一端至少三个核苷酸的位置)。概括的说，这种探针的设计能够实现对于不同等位基因形式之间杂交的更好的识别。

在另一个实施方案中，设计探针或者引物来杂交靶点DNA片段，从而将单核苷酸多态性(SNP)结合到该探针或者引物的5′最末端或者3′最末端。在特别适合用于低聚核苷酸连接试验(美国专利第4,988,617号)的一个具体优选的实施方案中，探针的3′最末端核苷酸结合目标序列中的单核苷酸多态性(SNP)位点。

可以使用本领域已知的方法制备低聚核苷酸探针和引物。化学试剂合成方法包括，但是不局限于，磷酸三酯法，例如，Naranget al.，1979，Methods in Enzymology(酶学方法)68：90中的描述；磷酸二酯法，例如，Brown et al.，1979，Methods in Enzymology(酶学方法)68：109中的描述；二乙基磷酸化为醯胺(diethylphosphoamidate)法，例如Beaucage et al.，1981Tetrahedron Letters 22：1859；和美国专利第4,458,066号中描述的固体支持物方法。

等位基因-特异性探针通常成对使用(或者，较为不常见的，3个或者4个一组使用，例如，如果单核苷酸多态性(SNP)位点已知具有3个或者4个等位基因，或者，用于检验核酸分子双链上的目标单核苷酸多态性(SNP)等位基因时)，并且，这种成对使用的等位基因-特异性探针可以是相同的，其中只有一个代表单核苷酸多态性(SNP)位点上等位基因变体的核苷酸错配。

通常，该对中的一个与具有更为常见的单核苷酸多态性(SNP)等位基因(即，在目标群体中更为频繁出现的等位基因)的目标序列的参考形式完全匹配，该对中的另一个与具有较不常见的单核苷酸多态性(SNP)等位基因(即，在目标群体中较为罕见的等位基因)的目标序列的一种形式完全匹配。对于芯片而言，可以将多对探针对固定在相同的支持物上，同时分析其不同的多态性。

在基于聚合酶链反应的试验的一个类型中，等位基因-特异性引物与目标核酸分子上和单核苷酸多态性(SNP)位点重叠的区域杂交，并且仅仅将该引物显示理想的互补性的一种等位基因形式扩增。(Gibbs，1989，Nucleic Acid Res.172427-2448).一般，引物的3′-最末端核苷酸与目标核酸分子的单核苷酸多态性(SNP)位点结合并互补。这种引物可用于与一种第二引物结合，所述第二引物能够在末端位点结合。从这两个引物开始扩增，产生一种可检测的产物，指明在此次检测的样品中存在那种等位基因形式。通常使用第二对引物进行参照试验，该对引物中的一个在多态性位点显示单一碱基错配，另一个对末端位点显示理想的互补性。所述单碱基错配阻止扩增的进行或者很大程度上降低扩增效率，从而没有可检测的产物形成或者可检测的产物以极微量形成或者极慢的速度形成。当错配发生在低聚核苷酸的3′-最末端位点时(即，所述低聚核苷酸的3′-最末端位点结合目标单核苷酸多态性(SNP)位点)，由于这一位点是引物延长时最不稳定的位点(参见，例如，WO 93/22456)，所以这种方法通常最为有效。如下所述，这种基于聚合酶链反应的试验可以被用作TaqMan试验的一部分。

在本发明的一种具体的实施方案中，本发明的引物包括一种基本上与包括单核苷酸多态性(SNP)的目标核酸分子互补的引物，该引物与包括单核苷酸多态性(SNP)的目标核酸分子的区别仅在于所述引物在该引物的3′-最末端位点的三个核苷酸中的一个上具有错配核苷，因此，该错配核苷不予该单核苷酸多态性(SNP)位点上的特定的等位基因配成碱基对。在一种优选的实施方案中，所述引物中的错配核苷酸是从该引物的3′最末端最后一个核苷酸算起的第二个核苷酸。在一种更为优选的实施方案中，所述引物中的错配核苷酸是从该引物的3′最末端最后一个核苷酸。

在本发明的另一个实施方案中，本发明的单核苷酸多态性(SNP)检测试剂被一种荧光报道基因标记，这种荧光报道基因能够发出一种可检测信号。尽管优选的报道基因染料是荧光染料，但是属于检测试剂的任意报道基因染料，例如低聚核苷酸探针或者引物都适用于本发明。这种染料包括，但是不局限于，吖啶、AMCA、BODIPY、Cascade蓝色、Cy2、Cy3、Cy5、Cy7、淬灭物(DABCYL)、Edans、四溴荧光素、赤藓红、荧光黄、6-Fam、Tet、Joe、六氟化铀、俄勒冈绿色、罗丹明、对甲氨基酚绿色、Tamra、Rox和得克萨斯红色。

在本发明的依旧另一个实施方案中，该检测试剂可以进一步地被一种猝灭剂染料(例如Tamra)标记，尤其是当所述试剂被用作自淬火探针时，所述自淬火探针例如TaqMan(美国专利第5,210,015号和美国专利第5,538,848号)或者分子信标探针(美国专利第5,118,801号和美国专利第5,312,728号)、或者其他的无茎或者线性信标探针。(Livak et al，1995，PCR Method Appl.(聚合酶链式反应方法应用)4：357-362；Tyagi et al，1996，NatureBiotechnology(自然生物技术)14：303-308；Nazarenko et al.，1997，Nucl.Acids Res.25：2516-2521；美国专利第5,866,336号和美国专利第6,117,635号)。

本发明的检测试剂还可以包括其他标记物，包括但是不局限于，用于结合链霉亲和素的生物素、用于结合抗体的半抗原和用于结合另一个互补低聚核苷酸(例如zipcodes对)的低聚核苷酸。

本发明还包括不含有这里识别的单核苷酸多态性(SNP)核苷酸(或者与之互补)，而是用于检测这里公开的一种或一种以上单核苷酸多态性(SNPs)的试剂。例如，位于这里提供的目标单核苷酸多态性(SNP)位点侧面但不与目标单核苷酸多态性(SNP)位点直接杂交的引物可以有效用于引物延长反应中，在此引物延长反应中，所述引物与靠近目标单核苷酸多态性(SNP)位点的区域(即，在距离目标单核苷酸多态性(SNP)位点一个或一个以上核苷酸之内的区域)。在引物延长反应期间，如果存在靶向单核苷酸多态性(SNP)位点的特定的核苷酸(等位基因)的话，一般引物不能延长超过目标单核苷酸多态性(SNP)位点，并且所得引物延长产物可以方便的被检测，从而确定目标单核苷酸多态性(SNP)位点中存在哪种单核苷酸多态性(SNP)等位基因。例如，通常在引物延长反应中使用特定的ddNTP，一旦ddNTP被整合如延长产物中就可以终止引物延长(引物延长产物在其引物延长产物的3′-最末端包括一种ddNTP，并且其中，所述ddNTP与这里公开的单核苷酸多态性(SNP)相应，是一种包括在本发明范围内的组合物)。因此，能够在靠近单核苷酸多态性(SNP)位点的区域结合核酸分子的试剂也被包括在本发明的范围内，尽管被结合的序列不必须的包括该单核苷酸多态性(SNP)位点本身。

单核苷酸多态性(SNP)检测试剂盒和系统

本领域普通技术人员承认，根据单核苷酸多态性(SNP)和这里公开的有关的序列信息，可以开发检测试剂并可以分别或者结合用于测定本发明所述的任意单核苷酸多态性(SNP)，并且，这种检测试剂可以被方便的整合入已经建立起来的试剂盒或者本领域已知的系统格式中。在单核苷酸多态性(SNP)检测试剂上下文中使用的术语″试剂盒″和″系统”是指某种作为多重单核苷酸多态性(SNP)检测试剂结合物的东西，或者是一种或一种以上单核苷酸多态性(SNP)检测试剂和一种或一种以上其他种类的元素或者组分(例如，其他种类的生物化学试剂、容器、包装，例如为了商业销售涉及的包装、附着有单核苷酸多态性(SNP)检测试剂的底物、电子硬件元件、等等)相结合的东西。因此，本发明进一步提供了单核苷酸多态性(SNP)探测试剂盒和系统，包括但是不局限于，包装的探针和引物组(例如，TaqMan探针/引物组)、核酸分子的芯片/微芯片、和包含一种或一种以上探针、引物、其他用于检测本发明一种或一种以上单核苷酸多态性(SNPs)的检测试剂的珠粒。所述试剂盒/系统可以选择性地包括各种各样的电子硬件元件；例如，芯片(″DNA芯片″)和微流体系统(″芯片上的实验室(lab-on-a-chip)″系统)，这些有各种厂商提供，并通常包括硬件元件。其他试剂盒/系统(例如，探针/引物组)可以不包括电子硬件元件，但是可能由，例如，(选择性地与其他生物化学试剂一起)包装在一个或一个以上容器中的一种或一种以上单核苷酸多态性(SNP)检测试剂组成。

在一些实施方案中，单核苷酸多态性(SNP)检测试剂盒一般包含一种或一种以上检测试剂及其他组分(例如，一种缓冲剂、酶，例如DNA聚合酶或者连接酶、链延伸核苷酸，例如脱氧核苷酸三磷酸盐、和对于Sanger型脱氧核糖核酸序列反应，链终止核苷酸、阳性对照序列、阴性对照序列、等等)，这些组分是实施所述实验或者反应所必须的，例如是放大和/或检测包含单核苷酸多态性(SNP)的核酸分子所必须的。试剂盒可以进一步的包括用于确定目标核酸量的工具，和用于将这一量与标准值进行比较的工具，并且包括使用该试剂盒检测所关心的包含单核苷酸多态性(SNP)的核酸分子的说明书。在本发明的一个实施方案中，提供了一些试剂盒，这些试剂盒包含实施一种或一种以上检测这里公开的一种或一种以上单核苷酸多态性(SNPs)的试验所必须的试剂。在本发明一种优选的实施方案中，单核苷酸多态性(SNP)检测试剂盒/系统以核酸芯片的形式存在，或者以隔间化试剂盒的形式存在，其中包括微流体/芯片上的实验室(lab-on-a-chip)系统。

单核苷酸多态性(SNP)检测试剂盒/系统可以包含，例如，一种或一种以上探针、或者探针对，所述探针或者探针对于每个目标单核苷酸多态性(SNP)位点上的，或者在每个目标单核苷酸多态性(SNP)位点附近的核酸分子杂交。多个等位基因-特异性探针对可以被包括在试剂盒/系统中，从而同时检测大量单核苷酸多态性(SNPs)，其中，至少一个是本发明的单核苷酸多态性(SNP)。在一些试剂盒/系统中，所述等位基因-特异性探针被固定在一种底物上，所述底物例如一种芯片或者珠粒。

这里使用的术语“芯片”，“微芯片”，和“脱氧核糖核酸芯片”是可互换的，是指一列不同的附着在一种底物之上的多聚核苷酸，所述底物例如玻璃、塑料、纸、尼龙或者其他种类的膜、滤纸、芯片、或者任意其他合适的固体支持物。多聚核苷酸可以直接在底物上合成，或者在底物外合成然后附着到底物上。在一个实施方案中，根据美国专利第5,837,832号、Chee等，PCT申请WO95/11995(Chee等人)、Lockhart，D.J.等(1996；Nat.Biotech.14：1675-1680)和Schena，M.等(1996；Proc.Natl.Acad.Sci.93：10614-10619)中描述的方法制备并使用微芯片，所有这些文献通过引证在此全部并入本文。在其他的实施方案中，通过Brown等的美国专利第5,807,522号中描述的方法制备这种芯片。

下面的参考文献对核酸阵列进行了述评：Zammatteo et al.，″New chips for molecular biology and diagnostics″(用于分子生物学和诊断学的新型芯片)，Biotechnol Annu Rev.(生物技术年度回顾)2002；8：85-101；Sosnowski et al.，″Active microelectronicarray system for DNA hybridization，genotyping andpharmacogenomic applications″(用于DNA杂交、基因定型和药物基因组学应用的活性微电子阵列系统)，Psychiatr Genet.2002December；12(4)：181-92；Heller，″DNA microarray technology：devices，systems，and applications″(DNA微芯片技术：装置、系统和应用)，Annu Rev Biomed Eng.2002；4：129-53.Epub 2002Mar.22(2002年3月22日电子公布)；Kolchinsky et al.，″Analysisof SNPs and other genomic variations using gel-based chips″(使用基于凝胶的芯片分析单核苷酸多态性(SNPs)和其他的基因变异)，Hum Mutat.2002 April；19(4)：343-60；和McGaIl et al.，″High-density genechip oligonucleotide probe arrays″(高密度基因芯片低聚核苷酸探针阵列)，Adv Biochem Eng Biotechnol.2002；77：21-42.

许多探针(例如，等位基因-特异性探针)可以被装配在一种阵列中，并且每个探针或者探针对可以与不同的单核苷酸多态性(SNP)位点杂交。对于多聚核苷酸探针来讲，通过光-指导的化学过程可以将这些多聚核苷酸探针在底物上指定的区域合成(或者分别合成然后被附着到指定的区域)。每种DNA芯片可以包含，例如，成千上万的单独合成的多聚核苷酸探针，这种多聚核苷酸探针排列在格子样的模型中并被微型化(例如，被微型化到十分之一)。优选地，将探针按照一定顺序、按照可访问的阵列附着在一种固体支持物上。

微阵列可以由大量独特的、单链多聚核苷酸组成，通常将合成的反义多聚核苷酸或者互补DNA的片段固定在一种固体支持物上。典型的多聚核苷酸优选的长度为大约6-60个核苷酸，更优选的为大约15-30个核苷酸，并且最优选的为大约18-25个核苷酸。对于某些微阵列或者其他的检测试剂盒/系统，优选使用长度仅为7-20个核苷酸的低聚核苷酸。在其他类型的阵列(例如，与化学发光检测技术结合使用的芯片)中，优选的探针长度可以是大约15-80个核苷酸、优选长度是大约50-70个核苷酸、更优选长度是大约55-65个核苷酸、并且最优选长度是大约60个核苷酸。微阵列或者检测试剂盒可以包括多聚核苷酸，所述多聚核苷酸能够覆盖基因/转录产物或者目标单核苷酸多态性(SNP)位点已知的5′序列或者3′序列；微阵列或者检测试剂盒还可以包括连续的多聚核苷酸，所述连续的多聚核苷酸覆盖基因/转录产物的全长序列；或者，微阵列或者检测试剂盒包含独特的多聚核苷酸，这种独特的多聚核苷酸选自沿着目标基因/转录产物序列长度方向上的特定区域，尤其是相对于一种或一种以上单核苷酸多态性(SNPs)的特定区域。用于微阵列或者检测试剂盒的多聚核苷酸对于所关心的单核苷酸多态性(SNP)或者单核苷酸多态性(SNPs)是具有特异性的(例如，对目标单核苷酸多态性(SNP)位点上特定的单核苷酸多态性(SNP)等位基因具有特异性、或者对于在许多不同的单核苷酸多态性(SNP)位点上的特定的单核苷酸多态性(SNP)等位基因具有特异性)，或者对于多态性的基因/转录产物或者所关心的基因/转录产物组是具有特异性的。

基于多聚核苷酸阵列的杂交试验依赖探针对完全匹配的和错配的目标序列变体杂交稳定性的差异。对于单核苷酸多态性(SNP)基因型，总的来说，优选在杂交试验中使用的严格条件，这种严格条件足够严格，从而将相互之间的区别小到只有单一单核苷酸多态性(SNP)位点不同的核苷酸分子区别开来(例如，设计一般的单核苷酸多态性(SNP)杂交试验从而只有当单核苷酸多态性(SNP)位点存在特定的核苷酸时才发生杂交作用，但是如果在此单核苷酸多态性(SNP)位点上存在可互换的核苷酸时，不会发生杂交作用)。当使用，例如，用于单核苷酸多态性(SNP)检测的等位基因-特异性探针核酸系列时，这种高度严格的条件更为优选。在之前的部分已经描述了这种高度严格的条件，这种高度严格条件对于本领域普通技术人员是已知的，并且可以发现在，例如，Current Protocols in Molecular Biology(分子生物学当前的方案)，John Wiley&Sons，纽约(1989)，第6.3.1-6.3.6章。

在其他的实施方案中，所述阵列与化学发光检测技术结合使用。以下专利和专利申请通过引证再此全部并入本文，这些专利和专利申请提供了关于化学发光检测的其他信息：美国专利申请系列号10/620,332和美国专利申请系列号10/620,333描述了用于微阵列检测的化学发光方法；美国专利第6,124,478号、美国专利第6,107,024号、美国专利第5,994,073号、美国专利第5,981,768号、美国专利第5,871,938号、美国专利第5,843,681号、美国专利第5,800,999号和美国专利第5,773,628号描述了用于进行化学发光检测的二氧杂环丁烷组合物和方法；以及美国公开的申请US2002/0110828，描述了用于微阵列对照物的组合物和方法。

在本发明的一个实施方案中，核酸阵列还可以包括一排长度为大约15-25个核苷酸的探针。在进一步实施方案中，核酸阵列可以包括许多探针，其中，至少一个探针能够检测一种单核苷酸多态性(SNP)，和/或至少一个探针包含一种序列的片段，所述序列选自由序列表所公开的序列、其互补序列或包括至少大约8个连续核苷酸、优选包括至少大约10个连续核苷酸、12个连续核苷酸、15个连续核苷酸、16个连续核苷酸、18个连续核苷酸、20个连续核苷酸、更优选的包括22个连续核苷酸、25个连续核苷酸、30个连续核苷酸、40个连续核苷酸、47个连续核苷酸、50个连续核苷酸、55个连续核苷酸、60个连续核苷酸、65个连续核苷酸、70个连续核苷酸、80个连续核苷酸、90个连续核苷酸、100个连续核苷酸或者更多的连续核苷酸(或者在此之间的任意数字)并且包含一种新型的单核苷酸多态性(SNP)等位基因(或者与之互补)的序列所组成的组中。在一些实施方案中，所述与单核苷酸多态性(SNP)位点互补的核苷酸在探针中心其第5个核苷酸、4个核苷酸、3个核苷酸、2个核苷酸、1个核苷酸之内，更优选的，在所述探针的中心。

通过使用一种化学耦合过程和喷墨应用仪器可以在底物的表面上合成一种多聚核苷酸探针，如PCT申请WO95/251116(Baldeschweiler等)所述。该文献通过引证在此全部并入本文。在另一个方面，“格子”型阵列类似于一种点(或者长方形孔)墨迹，用于通过真空系统、热连接过程、UV连接过程、机械连接过程或者化学连接过程将互补DNA片段或者低聚核苷酸排列并连接到底物表面上。一种阵列(例如，如上所述的阵列)可以手工生产或者通过使用可以获得的装置(长方斑点印迹仪或者点印迹仪)、材料(任意合适的固体支持物)、和机器(包括机械工具)生产，并且可以包含8个多聚核苷酸、24个多聚核苷酸、96个多聚核苷酸、384个多聚核苷酸、1536个多聚核苷酸、6144个多聚核苷酸或更多的多聚核苷酸、或者任何其他数目的多聚核苷酸从而使其有效的应用于市场上可买到的测试仪中。

使用这种阵列或者其他试剂盒/系统，本发明提供了用于识别待检测样品中这里公开的单核苷酸多态性(SNPs)的方法。这种方法一般包括：培养待检测的核酸样品，所述待检测的核酸样品包括对应于本发明至少一个单核苷酸多态性(SNP)位点的一种或一种以上的探针，并且测定来自待检测样品的核酸与一种或者一种以上探针的结合。用于培养单核苷酸多态性(SNP)检测试剂(或者使用一种或一种以上这里所述的单核苷酸多态性(SNP)检测试剂的试剂盒/系统)和待检测样品的条件是变化的。培养条件取决于一些因素，例如试验方式、使用的检测方法，试验中使用的检测试剂的类型和性质。本领域普通技术人员应该承认，任意一种公众可以获得的杂交、扩增和阵列试验方式可以方便的适用于检测这里公开的单核苷酸多态性(SNPs)。

本发明的单核苷酸多态性(SNP)检测试剂盒/系统可以包括能够用于从待检测样品中制备核酸的组分，从而用于随后的包含单核苷酸多态性(SNP)的核酸分子的扩增和/或检测。这种样品制备组分可用于生产核酸提出物(包括DNA和/或RNA)、来自任意体液(例如血液、血清、血浆、尿、唾液、痰、胃液、精液、眼泪、汗液、等等)的蛋白质或者膜提出物、皮肤、毛发、细胞(特别是有核细胞)、活组织检查、口腔拭子或者组织标本。在上面描述的方法中使用的待检测样品可以是根据某些因素变化的，所述因素例如，试验方式、检测方法的性质和作为待检测样品进行试验的具体的组织、细胞或者提取物。用于制备核酸、蛋白质、和细胞提取物的方法是本领域内已知的，并且可以方便的适用于获得与所使用的系统相兼容的样品。用于从待检测样品中提取核酸的自动样品制备系统是市场上可买到的，并且其例子是Qiagen公司的BioRobot 9600，应用生物系统公司的PRISM6700、和罗氏分子系统公司的COBAS AmpliPrep系统。

本发明可预计的另一种形式的试剂盒是一种隔间化的试剂盒。隔间化的试剂盒包括任意试剂被存放于分开的容器中的试剂盒。这种容器包括，例如，小的玻璃容器、塑料容器、塑料条带、玻璃条带、或者纸条带、或者阵列材料，例如硅石。这些容器能够有效的将试剂从一个间隔室传递到另一个间隔室中，从而待检测样品盒试剂不会交叉污染，或者能够有效的将试剂从一个容器传递到另一个未包括在试剂盒之中的器皿中，并且，所述试剂或者每个容器中的溶液可以以一种定量的方式被从一个间隔室中添加到另一个间隔室中，或者到另外的器皿中。这种容器包括，例如，一种或一种以上能够承受待检测样品的容器、一种或者一种以上包括至少一个用于检测本发明的一种或一种以上单核苷酸多态性(SNPs)的探针或者其他的单核苷酸多态性(SNP)检测试剂的容器、一种或一种以上包含洗涤试剂(例如磷酸盐缓冲盐水、Tris-缓冲剂，等等)的容器，以及一种或者一种以上包含用于显示结合探针或者其他单核苷酸多态性(SNP)检测试剂存在的试剂的容器。所述试剂盒任选的进一步包括间隔室和/或试剂，用于，例如，核酸扩增或者其他酶促反应，例如引物延长反应、杂交反应、连接反应、电泳(优选的毛细管电泳)、质谱分析法、和/或激光诱导的荧光检测。所述试剂盒可以同时包括使用所述试剂盒的说明书。示范性的隔间化试剂盒包括本领域内已知的微流体装置(参见，例如，Weigl et al.，″Lab-on-a-chip for drugdevelopment″，Adv Drug Deliv Rev.2003 Feb.24；55(3)：349-77).在这种微流体装置中，容器可以被认为是，例如，微流体“间隔室”、“室”或者“管道”。

微流体装置还可以被称为“″芯片上的实验室(lab-on-a-chip)″系统”，是一种生物医学微电-机系统(bioMEMs)、或者多组分的集成系统，这种微流体装置是用于分析单核苷酸多态性(SNPs)的本发明示范性的试剂盒/系统。这种系统将一些工艺过程最小化并间隔化，所述工艺过程例如探针/靶分子杂交、核酸扩增、和在单一功能性元件中进行的毛细管电泳反应。一般的，在本系统的至少一个方面，这种微流体装置利用检测试剂，并且所述检测试剂可以用来检测一种或者一种以上本发明的单核苷酸多态性(SNPs)。微流体系统的一个实施例公开在美国专利第5,589,136号中，该专利描述了将聚合酶链反应扩增和毛细管电泳整合到芯片上。示范性的微流体系统包括一种设计在玻璃、硅、石英或者塑料片上的微孔道模型，被包括在一种微芯片中。通过在微芯片的不同区域之间使用电力、电渗作用或者静水压力来控制样品的运动，从而产生功能性的没有可动部件的微观阀门和泵。可以通过改变电压作为一种控制通过微电机管道交叉口的液体流的方式，以及作为手段来改变泵压通过微芯片不同区域的液体流速率。参见、例如，Dubrow等人的美国专利第6,153,073号和Parce等人的美国专利第6,156,181号。

为了基因定型单核苷酸多态性(SNPs)，一种示范性的微流体系统可以集成，例如，核酸扩增、引物延伸、毛细管电泳和一种检测方法(例如，激光诱导的荧光检测)。在使用这种示范性系统的示范性过程的第一步，核酸样品被扩增，优选的，通过聚合酶链反应被扩增。然后，使用ddNTPs(对四种ddNTP进行特异性荧光标记)和能够进行引物延伸反应的合适的低聚核苷酸引物，所述扩增产物经过自动引物延伸反应，所述合适的低聚核苷酸引物仅仅杂交目标单核苷酸多态性(SNP)的上游。一旦所述延伸在3′末端完成，通过毛细管电泳将引物从未整合的荧光ddNTPs中分离。毛细管电泳中使用的分离介质可以是，例如，聚丙烯酰胺、聚乙二醇或者右旋糖酐。在单核苷酸引物延长产物中整合的ddNTPs可以通过激光诱导的荧光检测识别。这种示范性的微芯片可以被用于并行的加工，例如，至少96-384个样品，或者更多。

核酸分子的应用

本发明的核酸分子具有各种各样的应用，特别是用于评价疾病的患病风险。示范性的疾病包括但是不局限于，炎症性疾病、退化性疾病、新陈代谢疾病、增殖性疾病、循环系统疾病、认知能力疾病、生殖系统疾病和行为病症。在本发明一种优选的实施方案中，所述疾病是癌症。例如，核酸分子可以用作杂交探针，例如，信使RNA、转录产物、互补DNA、基因组DNA、扩增的DNA或者其他核酸分子中的基因型单核苷酸多态性(SNPs)，或者用于分离全长互补DNA和基因组克隆株。

探针可以与包含LCS的核酸分子全部长度上任意一种核苷序列杂交。优选地，探针与包含单核苷酸多态性(SNP)的目标序列以一种序列-特异性方式杂交，从而将目标序列与其他核苷酸序列相区别，所述其他的核苷酸序列与目标序列的区别仅在于单核苷酸多态性(SNP)位点上存在的核苷酸不同。这种探针尤其可以有效的检测待检测样品中是否存在包含单核苷酸多态性(SNP)的核酸，或者用于决定特定的单核苷酸多态性(SNP)位点上存在哪种核苷酸(等位基因)。

一种核酸杂交探针可以被用来决定核酸表达的存在、水平、形式和/或分布。表达水平可以确定的核酸是DNA或者RNA。因此，对这里描述的单核苷酸多态性(SNPs)具有特异性的探针可用于评价一种给定细胞、组织、或者生物体中的存在、表达和/或基因拷贝数。这些应用疾病的诊断相关，相对于正常基因表达水平，所述疾病涉及基因表达增加或者减少。用于检测信使RNA的体外方法包括，例如，Northern blot杂交和原位杂交。用于检测DNA的体外方法包括Southern blot杂交和原位杂交(Sambrookand Russell，2000，Molecular Cloning：A Laboratory Manual(分子克隆：一种实验手册)，Cold Spring Harbor Press，Cold SpringHarbor，N.Y)。因此，本发明的核酸分子可以用作杂交探针，用于检测这里公开的单核苷酸多态性(SNPs)，从而决定含有此多态性的个体是否处于发展出一种疾病的患病风险。与疾病表现型有关的单核苷酸多态性(SNP)的检测为活性疾病和/或对某种疾病的遗传倾向性提供了一种预后工具。

本发明的核酸分子可以有效的用于设计对应于一种信使RNA的全部、或者一部分的核糖酶，所述信使RNA是由这里描述的包含单核苷酸多态性(SNP)的核酸分子表达的。

本发明的核酸分子还可以有效用于构建能够表达核酸分子和变体肽的全部或者一部分的转基因动物。具有包括这里所公开的单核苷酸多态性(SNP)的核酸分子的重组细胞和转基因动物的产生能够，例如，有效的完成治疗化合物和给药方案的临床设计。

单核苷酸多态性(SNP)基因定型方法

确定哪种具体的核苷酸(即，等位基因)存在于一种或一种以上单核苷酸多态性(SNP)位点上的过程叫做单核苷酸多态性(SNP)基因定型。本发明提供了单核苷酸多态性(SNP)基因定型的方法，例如用于筛选各种各样的疾病，或者用于确定其倾向性，或者用于确定对于治疗或者预后应是的反应，或者用于基因组地图绘制中或者单核苷酸多态性(SNP)相关性分析中，等等。对核酸样品进行基因定型，通过本领域内已知的方法确定那种等位基因存在于任意给定的所关心的遗传区域。相邻的序列可以被用于设计单核苷酸多态性(SNP)检测试剂，例如低聚核苷酸探针，并且还可以任选地被放入试剂盒形式中。示范性的单核苷酸多态性(SNP)基因定型方法被描述在：Chen et al.，″Singlenucleotide polymorphism genotyping：biochemistry，protocol，costand throughput″(“单核苷酸多态性基因定型：生物化学、方案、成本和产出”)，Pharmacogenomics J.(药剂学杂志)2003；3(2)：77-96；Kwok et al.，″Detection of single nucleotidepolymorphisms″(“单核苷酸多态性的检测”)，Curr Issues MoI.Biol(分子生物学现有问题).2003 April；5(2)：43-60；Shi，″Technologies for individual genotyping：detection of geneticpolymorphisms in drug targets and disease genes″(“单独基因定型技术：检测药物靶点和疾病基因中的遗传多态性”)，Am JPharmacogenomics.2002；2(3)：197-205；和Kwok，″Methods forgenotyping single nucleotide polymorphisms″(基因定型单核苷酸多态性的方法)，Annu Rev Genomics Hum Genet(人类基因组计划年度回顾)2001；2：235-58。用于高处理能力的单核苷酸多态性(SNP)基因定型的示范性方法描述在Marnellos等人的文献中(Marnellos，″High-throughput SNP analysis for geneticassociation studies ″(用于基因相关性研究的高处理能力的单核苷酸多态性(SNP)分析)，Curr Opin Drug Discov Devel(药物发现发展的现有观点).2003 May(2003年5月)；6(3)：317-21)。常用的单核苷酸多态性(SNP)基因定型方法包括，但是不局限于，TaqMan试验、分子信标试验、核酸芯片、等位基因-特异性引物延伸、等位基因-特异性聚合酶链反应、拍成阵列的引物延伸、同族引物延伸试验、通过质谱分析法探测的引物延伸、焦磷酸测序(Pyrosequencing)、排列在遗传阵列上的多重引物延伸、滚环扩增连接、同族连接、低聚核苷酸连接试验(OLA)(美国专利第4,988,167号)、排列在遗传阵列上的多重连接反应、限制性-片段长度多态性、单碱基延伸-标记试验和侵入物试验。这种方法可以与检测机制结合使用，所述检测机制例如，比方说，发光检测或者化学发光检测、荧光检测、时间分辨荧光检测、荧光共振能量传递、荧光偏振、质谱分析法和电检测。用于检测多态性的各种各样的方法包括，但是不局限于：一种方法，在此方法中，防止裂解剂的保护作用可以用来检测RNA/RNA或者RNA/DNA双链中错配碱基(Myers et al，Science 230：1242(1985)；Cotton et al，PNAS 85：4397(1988)；和Saleeba et al.，Meth.Enzymol.217：286-295(1992))，变体和野生型核酸分子电泳迁移率的比较(Orita et al.，PNAS 86：2766(1989)；Cotton et al.，Mutat.Res.285：125-144(1993)；和Hayashi et al.，Genet.Anal.Tech.Appl.9：73-79(1992))，以及检测聚丙烯酰胺凝胶中多态性片段或者野生型片段的运动，所述聚丙烯酰胺凝胶包含变性剂梯度，这是使用变性梯度凝胶电泳(DGGE)获得的(Myers et al.，Nature313：495(1985)).在特定位点的序列变化还可以通过核酸酶保护实验来评价，所述核酸酶保护实验例如RNase和SI保护作用或者化学裂解法。

在一种优选的实施方案中、使用TaqMan试验(该实验也叫做“5′核酸酶试验”)进行单核苷酸多态性(SNP)基因定型(美国专利第5,210,015号和美国专利第5,538,848号)。在聚合酶链反应的期间，TaqMan试验检测特异性扩增的产物累积。TaqMan试验利用一种低聚核苷酸探针，这种低聚核苷酸探针带有荧光报道基因染料和猝灭剂染料标记。通过适当波长的激光照射，可以激发报道基因染料，通过一种叫做荧光共振能量传递(FRET)的作用，报道基因染料向位于同一探针中的猝灭剂染料传递能量。当与探针相附着时，激发的报道基因燃料不会发出信号。在完整的探针中，猝灭剂染料与报道基因染料的邻近性使报道基因的荧光强度降低。报道基因染料和猝灭剂染料可以分别在5′最末端和3′最末端，或者，反之亦然。做为选择，报道基因染料可以在5′或者3′最末端，而猝灭剂染料附着于核苷酸的内部，或者反之亦然。在依旧另一个实施方案中，报道基因和淬灭剂可以彼此之间以一定间隔附着在核苷酸内部，从而降低报道基因的荧光度。

在聚合酶链反应期间，DNA聚合酶的5核酸酶活性裂解探针，从而将报道基因染料和猝灭剂染料分开并且使报道基因产生增加的荧光度。通过检测报道基因荧光度的增加可以直接检测聚合酶链反应产物的累积。只有当探针与目标包含单核苷酸多态性(SNP)的模板杂交，并且所述模板在聚合酶链反应期间扩增时，DNA聚合酶在报道基因染料和猝灭剂染料中间裂解探针。并且，只有当存在特定的单核苷酸多态性(SNP)等位基因时，探针才会与该目标单核苷酸多态性(SNP)位点杂交。

优选的TaqMan引物和探针序列可以容易地使用这里提供的单核苷酸多态性(SNP)和相关的核酸序列信息确定。许多计算机程序，例如，Primer Express(应用生物系统公司，福斯特市，加利福尼亚州)，可以用于快速获得最佳的引物/探针组。对本领域普通技术人员来讲显而易见的是，这种用于检测本发明单核苷酸多态性(SNPs)的引物和探针可以有效用于各种各样的疾病(包括癌症)的预后试验中，并且可以容易地整合入一种试剂盒格式中。本发明还包括本领域内已知的TaqMan试验的修饰，例如，通过使用分子信标探针(美国专利第5,118,801号和美国专利第5,312,728号)及其他不同形式(美国专利第5,866,336号和美国专利第6,117,635号)进行修饰。

多态性的同一性还可以使用一种错配检测技术来确定，所述错配检测技术包括但是不局限于使用RNA探针(riboprobes)进行的核糖核酸酶保护法(Winter et al，Proc.Natl.Acad Sci.USA82：7575，1985；Meyers et al，Science 230：1242，1985)以及使用能够识别核苷酸错配的蛋白质，例如大肠杆菌mutS蛋白质(Modrich，P.Ann.Rev.Genet.25：229-253，1991).做为选择，变体等位基因可以通过单链构象多态性(SSCP)分析识别(Orita etal.，Genomics 5：874-879，1989；Humphries et al.，in MolecularDiagnosis of Genetic Diseases，R.Elles，ed.，pp.321-340，1996(Humphries等人在R.Elles于1996年编辑的“基因疾病的分子诊断”第321-340页发表的文献))或者通过变性梯度凝胶电泳(DGGE)识别(Wartell et al.，Nuci.Acids Res.18：2699-2706，1990；Sheffield et al.，Proc.Nati.Acad.Sci.USA 86：232-236，1989).

聚合酶-调节的引物延伸方法也可以用来识别多态性。专利和现有科技文献中已经描述了一些这种方法，包括，″遗传分析(Genetic Bit Analysis)″方法(WO92/15712)和连接酶/聚合酶调节的遗传分析(美国专利第5,679,524号)。相关的方法公开在WO91/02087、WO90/09455、WO95/17676、美国专利第5,302,509号和美国专利第5,945,283号中。可以通过质谱分析法检测包含多态性的延长的引物，如美国专利第5,605,798号的描述。另一个引物延伸方法是等位基因特异性聚合酶链反应(Ruano et al.，Nucl.Acids Res.17：8392，1989；Ruano et al.，Nucl.Acids Res.19，6877-6882，1991；WO 93/22456；Turki et al.，J Clin.Invest.95：1635-1641，1995).此外，如Wallace等人的描述(WO89/10414))使用多组等位基因-特异性引物，通过同时扩增核酸的多个区域，可以研究多重多态性位点。

另一个用于基因定型本发明单核苷酸多态性(SNPs)的优选的方法是在低聚核苷酸连接试验(OLA)中使用两个低聚核苷酸探针(参见、例如、美国专利号4,988,617)。在此方法中，一个探针与目标核酸的片段杂交，其3′最末端与单核苷酸多态性(SNP)位点结合。第二探针与目标核酸分子的邻近片段杂交，其3′末端指向第一探针。这两种并列探针与目标核酸分子杂交，并且如果再第一探针的3′最末端与单核苷酸多态性(SNP)位点之间存在理想的互补性的话，两种并列的探针在连接剂(例如，一种连接酶)存在的情况下相连。如果存在错配，则不会发生相连。反应之后，从目标核酸分子上分离连接的探针，并且检测这种探针的存在，作为存在单核苷酸多态性(SNP)的指示剂。

下列专利、专利申请、和公布的国际性专利申请通过引证在此全部并入本文，这些专利、专利申请、和公布的国际性专利申请提供了额外的关于用于进行各种类型的低聚核苷酸连接试验(OLA)的方法的信息：美国专利第6,027,889号、美国专利第6,268,148号、美国专利第5494810号、美国专利第5830711号，和美国专利第6054564号描述了用于进行单核苷酸多态性(SNP)检测的低聚核苷酸连接试验(OLA)策略；WO 97/31256和WO 00/56927描述了使用通用阵列进行单核苷酸多态性(SNP)检测的低聚核苷酸连接试验(OLA)策略，其中，可以向杂交探针中的一个中引入编码序列，并且所得产物或者扩增产物与一种通用编码序列(zip code)阵列杂交；美国申请US01/17329(和系列号09/584,905)描述了聚合酶链反应之前的低聚核苷酸连接试验(OLA)(或者LDR)，其中，编码序列(zipcodes)被整合入低聚核苷酸连接试验(OLA)探针中，并且通过电泳或者通用编码序列阵列读出物确定扩增的聚合酶链反应产物；美国申请60/427,818、60/445,636和60/445,494描述了在进行聚合酶链反应之前，使用低聚核苷酸连接试验(OLA)进行多重单核苷酸多态性(SNP)检测的SNPlex方法和软件，其中，编码序列(zipcodes)被整合到低聚核苷酸连接试验(OLA)探针中，并且使用zipchute试剂与扩增的聚合酶链反应产物杂交，通过zipchute的电泳结果确定单核苷酸多态性(SNP)的同一性。在一些实施方案中，在聚合酶链反应(或者另一个核酸扩增方法)之前，进行低聚核苷酸连接试验(OLA)。在其他的实施方案中，在低聚核苷酸连接试验(OLA)之前，进行聚合酶链反应(或者另一个核酸扩增的方法)。

用于单核苷酸多态性(SNP)基因定型的另一种方法是以质谱分析法为基础的。质谱分析法利用DNA四种核苷酸的每一种所具有的独特的质量。通过质谱分析法测量具有可互换的单核苷酸多态性(SNP)等位基因的核酸的质量差异，可以明确的对单核苷酸多态性(SNPs)进行基因定型。MALDI-TOF(基质辅助激光解吸附飞行时间)质谱分析法是用于最为准确的确定分子质量(例如，单核苷酸多态性(SNPs)的优选方法。基于质谱分析法已经研发出多种单核苷酸多态性(SNP)分析方法。优选的基于质谱分析法的单核苷酸多态性(SNP)基因定型方法包括引物延伸试验，这一实验还可以与其他方法结合使用，例如，传统的基于凝胶的形式和微阵列。

一般地，引物延伸实验涉及设计来自目标单核苷酸多态性(SNP)位点上游(5′)的模板聚合酶链反应扩增子的引物并退火。向包含模板(例如，已经被扩增(例如，使用聚合酶链反应)的包含单核苷酸多态性(SNP)的核酸分子)、引物和DNA聚合酶的反应混合物中加入双脱氧核苷三磷酸盐(ddNTPs)和/或脱氧核苷酸三磷酸盐(dNTPs)的混合物。在模板的第一位点上，引物延伸终止，在该位点上，核苷酸与混合物中存在的双脱氧核苷三磷酸盐(ddNTPs)中的一个互补。引物可以与单核苷酸多态性(SNP)位点紧密相邻(即，引物3′末端的核苷酸与紧挨着目标单核苷酸多态性(SNP)位点的核苷酸杂交)或者与单核苷酸多态性(SNP)位点间隔两个或更多核苷酸。如果引物与目标单核苷酸多态性(SNP)位点间隔几个核苷酸，则有一个限制条件，即引物3′末端和单核苷酸多态性(SNP)位点之间的模板序列不能包含与待检测的类型相同的核苷酸，否则，会引起引物延长过早终止。做为选择，如果只有四种双脱氧核苷三磷酸盐(ddNTPs)单独加入反应混合物中，不加入脱氧核苷酸三磷酸盐(dNTPs)，则相对于目标单核苷酸多态性(SNP)位点，引物只会延长一个核苷酸。在这一情况下，设计引物使其可以与单核苷酸多态性(SNP)位点上游的一个核苷酸结合(即，引物3′末端的核苷酸与目标单核苷酸多态性(SNP)位点紧密相邻的核苷酸在目标单核苷酸多态性(SNP)位点的5′侧面杂交)。仅仅延长一个核苷酸是优选的，由于这能够最小化延长的引物的总质量，从而增加可互换的单核苷酸多态性(SNP)核苷酸酯键的质量差分辨力。此外，质量-标记的双脱氧核苷三磷酸盐(ddNTPs)可以用于在引物延伸反应中替代未改性的双脱氧核苷三磷酸盐(ddNTPs)。这会增加使用这些双脱氧核苷三磷酸盐(ddNTPs)延长的引物的质量差异，从而提供增加的灵敏性和准确度，并且对于基因定型杂合碱基位点尤其有效。质量标记也可以减轻对密集的样品制备过程的需要，并且能够降低质谱分析所需要的分辨力。

因此，延长的引物可以通过MALDI-TOF(基质辅助激光解吸附飞行时间)质谱分析法纯化并且分析，从而确定目标单核苷酸多态性(SNP)位点上存在的核苷酸的同一性。在一个分析方法中，来自引物延伸反应的产物与可以形成基质的光吸收晶体相结合。然后，用一种能量源(例如，激光)撞击基质，从而电离并且解吸核酸分子进入气相阶段。然后，将离子化的分子射入飞行管中，并在管子下部向着检测器加速。离子化作用(例如，激光脉冲)完成时间和分子与检测器的碰撞是分子的飞行时间。飞行时间与离子化分子的质量-电荷比(m/z)精确相关。具有较小质量-电荷比(m/z)的离子比具有较大质量-电荷比(m/z)的离子向着管下部运动的更快，因此，较轻的离子在较重的离子之前到达检测器。然后，将飞行时间转化为相应的，并且非常精确的质量-电荷比(m/z)。通过这种方式，根据在单一碱基位点具有不同的核苷酸的核酸分子所固有的质量的轻微差异、以及相应的飞行时间差异可以识别出单核苷酸多态性(SNPs)。对于关于将引物延长试验和MALDI-TOF(基质辅助激光解吸附飞行时间)质谱分析法结合使用进行单核苷酸多态性(SNP)基因定型的更多信息，请参见，例如，Wise等人于2003年在“快速常用的质谱分析法”第17(11)卷1195-1202页所著的“人类基因组中使用基质辅助的激光解吸/电离时间飞行质谱分析法进行单核苷酸延长的标准方法”。

下列参考文献提供了进一步的信息，描述了用于单核苷酸多态性(SNP)基因定型的基于质谱分析法的方法：Bocker，″SNPand mutation discovery using base-specific cleavage andMALDI-TOF mass spectrometry″(“使用碱基特异性分裂和MALDI-TOF(基质辅助激光解吸附飞行时间)质谱分析法发现的单核苷酸多态性(SNP)和突变”，Bioinformatics(生物信息学).2003 July；19 Suppl 1(2003年7月19日增补1刊)：144-153；Storm et al.，“MALDI-TOF mass spectrometry-based SNPgenotyping”(“基于MALDI-TOF(基质辅助激光解吸附飞行时间)质谱分析法的单核苷酸多态性(SNP)基因定型”)，MethodsMoI.Biol.(分子生物学方法)2003；212：241-62；Jurinke et al.，“Theuse of MassARRAY technology for high throughput genotyping”(“MassARRAY技术在高通量基因定型中的应用”)，AdvBiochem Eng Biotechnol.2002；77：57-74；和Jurinke et al.，″Automated genotyping using the DNA MassArray technology″(使用DNA MassArray技术进行的自动基因定型)，Methods MoI.Biol.2002；187：179-92.

单核苷酸多态性(SNPs)还可以被直接的DNA测序记录。可以使用各种各样的自动测序方法((1995)Biotechniques19：448)，包括质谱分析法测序(参见，例如，PCT国际公布号：WO94/16101；Cohen et al.，Adv.Chromatogr.36：127-162(1996)；和Griffin et al.，Appl.Biochem.Biotechnol.38：147-159(1993)).本发明的核酸序列使本领域普通技术人员可以方便的设计测序引物，用于这种自动测序过程。市售的检测设备，例如AppliedBiosystems 377、3100、3700、3730和373O.times.1 DNA分析器(福斯特市，加利福尼亚州)，是本领域通常使用的自动测序的装置。

其他可以用于对本发明单核苷酸多态性(SNPs)进行基因定型的方法包括单链构象多态性(SSCP)、和变性梯度凝胶电泳(DGGE)(Myers et al.，Nature 313：495(1985)).单链构象多态性(SSCP)通过单链PCR产物的电泳位移的变化识别碱基差异，如Orita等在“美国国家科学院年报”上的文献。单链聚合酶链反应产物可以通过加热或者相反的，使双链聚合酶链反应产物变性产生。单链核酸可以再折叠或者形成部分取决于碱基序列的二级结构。单链扩增产物不同的电泳迁移率与单核苷酸多态性(SNP)位点上的序列碱基差异有关。变性梯度凝胶电泳(DGGE)基于不同的序列依赖型稳定性和多态DNA所固有的熔化性质，以及在变性梯度凝胶电泳(DGGE)的电泳迁移模式中的相应差异区别单核苷酸多态性(SNP)等位基因。(Erlich，ed.，PCRTechnology，Principles and Applications for DNA Amplification，W.H.Freeman and Co，New York，1992，Chapter 7)(Erlich编辑的“聚合酶链反应技术、原理和在脱氧核糖核酸扩增方面的应用”，W.H.Freeman and Co公司，纽约，1992，第7章)。

序列特异性核糖酶(美国专利第5,498,531号)还可以用来记录基于核糖酶分裂位点的发现或者损失的单核苷酸多态性(SNPs)。通过核酸酶分裂消化试验或者通过熔化温度的差异，可以将完美匹配的序列和错配序列区别开来。如果单核苷酸多态性(SNP)影响限制酶裂解位点，则通过改变限制酶消化方式可以识别单核苷酸多态性(SNP)，以及通过凝胶电泳决定的核酸片段长度的相应变化。

单核苷酸多态性(SNP)基因定型可以包括以下步骤，例如：从人类主体中收集生物样品(例如，组织样品、细胞样品、体液、分泌物等等)，从样品的细胞中分离核酸(例如，基因组DNA、信使RNA或者两者)，将所得核酸与一种或一种以上引物相接触，所述引物特异性的与包含目标单核苷酸多态性(SNP)的分离核酸区域在某些情况下杂交，从而发生目标核酸区域的杂交和扩增，以及确定在所关心的单核苷酸多态性(SNP)位点上出现的核苷酸，或者，在一些试验中，检测扩增产物的存在或者不存在(可以设计试验使杂交或者扩增只在存在或者不存在特定的单核苷酸多态性(SNP)等位基因时发生)。在一些试验中，检测扩增产物的大小并与对照样品的长度相比较；例如，通过与正常基因型相比，扩增产物的尺寸变化可以检测胡删除和插入。

单核苷酸多态性(SNP)基因定型可以有效用于许多实际应用中，如下所述。这种应用的例子包括，但是不局限于，单核苷酸多态性(SNP)-疾病相关性分析、疾病倾向性筛选、疾病诊断、疾病预后、疾病进程监测、根据个体遗传型确定治疗方案(″pharmacogenomics″)、基于与病原或者对药物反应的可能性有关的单核苷酸多态性(SNP)遗传型研制治疗剂、针对一个治疗方案对病人群体分层进行临床试验、和预测个体对一种治疗剂产生有毒的副作用的可能性。

疾病筛选试验

使用多种方法可以挖掘基因型和疾病-相关表现型之间的相关性/关联性信息。例如，对于一种或一种以上单核苷酸多态性(SNPs)和一种疾病(对这种疾病有治疗方法)的发病倾向性之间的统计学上非常显著的相关性的情况来讲，检测个体中这种基因模型可以快速的调整治疗方法，或者至少调整对个体的常规检测机制。对于单核苷酸多态性(SNP)和人类疾病之间具有较弱但是仍然属于统计学上显著的相关性的情况，在检测到敏感性等位基因或者单核苷酸多态性(SNP)后，则不应当进行快速介入治疗或者检测。然而这时，应该促使主体开始简单的生活习惯(例如，饮食、锻炼、戒烟、增加检测/检查)的改变，这些改变话费很少成本或者不需花费任何成本即可完成，同时还赋予主体潜在的益处，即，即使由于具有敏感性等位基因所述主体具有增加的发展成为一种疾病的风险，这些生活习惯的改变会减低这种风险。

在一方面，本发明提供了用于识别单核苷酸多态性(SNPs)的方法，所述单核苷酸多态性(SNPs)增加了发展成一种疾病的患病风险、敏感性或者概率，所述疾病例如一种细胞增殖性疾病(例如，癌症)。在进一步的方面，本发明提供了用于识别患者的方法，所述患者具有发展成一种疾病的风险、具有确定一种疾病预后的风险或者具有可预计的一种疾病的发病风险。例如，通过检测BRCA1的3′未翻译的区域(UTR)的突变作用，可以确定患者发展成细胞增殖性疾病的风险，患有一种疾病的个体的预后、或者可预计的细胞增殖性疾病的发病。这种突变的识别显示出增加的发展成为细胞增殖性疾病的患病风险、较差的预后或者发展成为细胞增殖性疾病的较早发病。

突变是，例如，删除、插入、倒置、替换、移码或者重组。突变能够调节(例如，增加或者减少)miRNA的结合效果。所述“结合效果”指的是miRNA分子与目标基因或者目标转录产物相结合的能力，并且因此，分别停止、减少、降低、抑制或者阻止目标基因或者目标转录产物的转录或者翻译作用。通过miRNA抑制蛋白质生产或者抑制报道基因蛋白质生产的能力可以确定结合效果。做为选择，或者另外，结合效果还可以定义为结合能，通过测定最小自由能(mfe)(千卡/摩尔)测量。

在本发明上下文中出现的“风险”是指在一个特定的时间段能发生某一事件的可能性，并且可以代表主体的“绝对”风险或者“相对”风险。绝对风险可以参考对相关族群检测后的实际观察一段时间来测定，或者参考给定值测定，所述给定值是通过统计学上验证已经研究一段时间的真实群体确定的。相对风险是指与低风险群体或者平均群体风险相比，主体绝对风险的比率，根据所评价的临床风险因素不同，相对风险是变化的。优势率是指给定试验结果的阳性事件对阴性事件的比例，通常，不经过进一步的转化就可以使用优势率(优劣比是根据公式p/(1-p)得到的，其中，p是事件概率，(1-p)是不发生事件的概率)。

本发明上下文中所述的“风险评价”或者“对风险的评价”是指对一种事件或者疾病状态发生的概率、优劣比或者可能性进行预测，对事件发生速率的预测，或者对从一种疾病状态转化为另一种疾病状态(比方说，从原发肿瘤转化为转移性肿瘤或者转移为一种具有发展成为转移性肿瘤的风险)或者从原发转移性事件转化为次级转移性事件、或者从具有发生某一类型原发瘤的风险转化为发展成不同类型的一种或者一种以上原发瘤的风险的预测。风险评价还可以包括对之前测定的群体以绝对量或者相对量进行未来临床参数的预测，传统试验风险因素值的预测，或者其他癌症指数的预测。

“增加的风险”是指与不携带单核苷酸多态性(SNP)的个体相比，在BRCA1内携带有单核苷酸多态性(SNP)的个体发展成为各种各样的疾病中的至少一种(例如，癌症)的概率有所增加。在某些实施方案中，单核苷酸多态性(SNP)携带者比不携带单核苷酸多态性(SNP)的个体具有1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、5.5倍、6倍、6.5倍、7倍、7.5倍、8倍、8.5倍、9倍、9.5倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍，或者100x的可能性发展成为至少一种类型的癌症。此外，已经发展出一个癌症的在BRCA1内携带有单核苷酸多态性(SNP)的患者很可能发展出次生癌症。在某些实施方案中，在非携带者发展出至少一个次生癌症之前1年、2年、5年、7年、10年，12年，15年，17年，20年，22年，25年，27年，或者30年前，BRCA1单核苷酸多态性(SNP)携带者就发展出至少一个次生癌症。

细胞增殖性疾病包括各种各样的病况，在此病况中，细胞分裂作用不被调节。示范性的细胞增殖性疾病包括，但是不局限于，赘生物，良性肿瘤，恶性肿瘤，预癌性疾病，原地肿瘤，包囊型肿瘤，转移性瘤，液体肿瘤，实性肿瘤，免疫学肿瘤，血液学肿瘤，癌症，癌肿，白血病，淋巴瘤，肉瘤，和迅速分裂的细胞。这里所使用的术语“快速分裂的细胞”是指其分裂速率超过或者大于相同组织中邻近或者并列细胞所预计或者所观察到的速率的任意细胞。癌症包括，但是不局限于，乳腺癌症和卵巢癌症。

患者优选地是哺乳动物。所述哺乳动物可以是人类、非人灵长类动物、老鼠、小鼠、狗、猫、马或者母牛，但是哺乳动物不局限于这些实施例。除了人之外的哺乳动物可以有效的作用患者，代表特定疾病的动物模型。患者可以是雄性的或者雌性的。患者可以是之前已经诊断或者确定患病的主体，或者选择性的，可以已经经历过，或者正在经历这种疾病的介入性治疗的患者。做为选择，患者还可以是没有被诊断为具有这种疾病的患者。例如，患者可以是对一种疾病显示一种或者一种以上风险因素的患者。

生物样品可以是包含核酸的任意组织或者液体。各种各样的实施方案包括石蜡油包埋组织、冷冻组织、外科的细针穿刺、皮肤细胞、肌肉、肺部、头部和颈部、食道、肾、胰腺、口、喉管、咽、喉头、食道、筋膜、脑、前列腺、乳腺、子宫内膜、小肠、血细胞、肝、精巢、卵巢、子宫、宫颈、结肠、胃、脾、淋巴结，或者骨髓。其他实施方案包括液体样品，比如支气管刷洗液、支气管洗涤液、支气管废液(bronchial ravages)、末梢血淋巴细胞、淋巴液体、腹水、浆液、胸膜积液、痰、脑脊髓液、泪液、食道洗涤液，和粪便或者尿样品，例如膀胱洗涤液和尿。

连接不平衡(LD)指的是两个或更多不同的单核苷酸多态性(SNP)上等位基因的共有特性(例如可互换的核苷酸)，其出现率发育给定的群体中每个等位基因可预计的单独出现次数。遗传学上独立的两个等位基因的共存在的预计出现率是第一个等位基因的出现率乘以第二等位基因的出现率。以预计的出现率共存在的等位基因据说是处于“连锁平衡”状态。相反，连接不平衡(LD)指的是在两个或者两个以上不同的单核苷酸多态性(SNP)位点上存在的等位基因之间任意非随机的基因相关性，概括的说，这是由于一个染色体上两个位点的物理邻近性造成的。当两个或更多单核苷酸多态性(SNPs)位点在给定的染色体上彼此之间紧密相邻时，出现连接不平衡(LD)，并且因此，在这些单核苷酸多态性(SNP)位点上的等位基因往往在多代中维持不可分离性，造成的结果是在一个单核苷酸多态性(SNP)位点上的某种特定的核苷酸(等位基因)会与一种位于其附近不同单核苷酸多态性(SNP)位点上的特定的核苷酸(等位基因)显示出一种非随机的相关性。从而，对单核苷酸多态性(SNP)位点中的一个进行基因定型所产生的信息与对处于连接不平衡(LD)状态的另一个单核苷酸多态性(SNP)位点进行基因定型基本上相同。

为了筛选患有遗传性疾病(例如，预后或者具有患病风险)的个体，如果可以发现一种特定的单核苷酸多态性(SNP)位点用于筛选疾病，然后本领域普通技术人员可以认识到，其他与这种单核苷酸多态性(SNP)位点处于连接不平衡(LD)的单核苷酸多态性(SNP)位点也可以有效用于筛选这些条件。两个或者更多个单核苷酸多态性(SNPs)之间可以具有多种连接不平衡(LD)程度，得到的结果是与其他相比，一些单核苷酸多态性(SNPs)更为密切的相关(即，处于更强的连接不平衡(LD)状态)。此外，连接不平衡(LD)沿着染色体延伸的物理距离在基因组不同区域中有所不同，因此，两个或者更多个单核苷酸多态性(SNP)位点之间存在连接不平衡(LD)所必须的物理距离在基因组的不同区域也是不同的。

为了进行筛选应用，不是实际产生疾病(致病性)但也与致病性多态性处于连接不平衡(LD)的多态性(例如，单核苷酸多态性(SNPs)和/或单倍体)也是有效的。在这种情况下，与致病性多态性处于连接不平衡(LD)状态的多态性的基因型是可以根据所述致病性多态性的基因型预计的，并且，因此，可以预计受到这种致病性单核苷酸多态性(SNP)影响的表型(例如，疾病)。因此、与致病性多态性处于连接不平衡(LD)的多态性标记物可以有效作用标记物，并且当实际致病性多态性未知时尤其有效。

在人类基因组中的连接不平衡描述在一下文件中：Wall etal.，″Haplotype blocks and linkage disequilibrium in the humangenome″(人类基因组中的单倍体封闭和连接不平衡)，Nat RevGenet.2003 August(8月)；4(8)：587-97；Gamer et al.，″On selectingmarkers for association studies：patterns of linkage disequilibriumbetween two and three diallelic loci″(用于相关研究的标记物筛选：两种或者三种双等位基因位点之间的的连接不平衡方式)，GenetEpidemiol.2003 January(一月)；24(1)：57-67；Ardlie et al.，″Patternsof linkage disequilibrium in the human genome″(人类基因组中的连接不平衡方式)，Nat Rev Genet.2002 April(四月)；3(4)：299-309(错印在Nat Rev Genet 2002 July(7月)；3(7)：566)；和Remm et al.，″High-density genotyping and linkage disequilibrium in the humangenome using chromosome 22 as a model″(使用染色体22作为模型，人类基因组中高密度基因型和连接不平衡)；Curr Opin ChemBiol.2002 February(2月)；6(1)：24-30.

疾病表型(例如，癌症)特定的单核苷酸多态性(SNPs)和/或单核苷酸多态性(SNP)单倍体的影响或者相关性使本发明的单核苷酸多态性(SNPs)可以用于开发较高级的试验从而识别表达可检测的性状(例如，癌症)的个体，与不具有这种基因型的个体相比，具有特异性遗传型的结果是使具有这一特定遗传型的个体在随后的时间内具有增加的或者减少的发展出可检测的性状的风险。如这里的定义，筛选可以根据单一的单核苷酸多态性(SNP)进行，也可以根据一组单核苷酸多态性(SNPs)进行。为了增加倾向性/风险筛选的准确性，本发明单核苷酸多态性(SNPs)分析可以与许多其他多态性或者疾病的其他风险因素相结合，所述疾病的其他风险因素例如，病征、病理特性、家族病史、饮食习惯、环境因素或者生活习惯因素。

本发明的筛选技术可以使用各种各样的方法，从而确定待检测患者是否具有一种单核苷酸多态性(SNP)或者一种单核苷酸多态性(SNP)模型，所述单核苷酸多态性(SNP)或者单核苷酸多态性(SNP)模型与增加的或者减少的发展出一种可检测性状的风险有关，或者确定待检测患者是否患有一种可检测的性状，这种可检测的性状是特定的多态性/突变的结果，这些方法包括，例如，能够对个体的染色体进行单倍体、家族研究、单一精液DNA分析或者体组织混合物分析的方法。使用本发明诊断进行分析的性状可以是任意在病理学和疾病中可以普遍观察到的可检测的性状。

实施例

实施例1：在能够有效的改进miRNAs结合效果的乳腺癌症和卵巢癌症相关基因中单核苷酸多态性(SNPs)的识别。

临床分类和分子分类法成功的将乳腺癌并入具有生物显著性的亚类中亚类的种类是：1)雌激素受体(ER)+和/或孕激素受体(PR)+肿瘤、2)HER2+肿瘤、和3)三重阴性(TN)肿瘤(Perou，CM.et al.Nature 2000.406，747-52).雌激素受体(ER)+和/或孕激素受体(PR)+和HER2+肿瘤是最常见的(75％)，三重阴性肿瘤占乳腺癌的大约25％。不幸的是，三重阴性表型代表了一种攻击性强的并且知之甚少的乳腺癌亚类，这种乳腺癌在年轻的非洲籍美国女性(＜40)中非常流行。这一亚类比其他的亚类具有更坏的5年存活率(72％对85％)。

在来自耶鲁大学的355位原发瘤癌症病例和29位对照个体中收集DNA。在这些DNA样品中，206例来自于胸部。另外，从患有乳腺癌症和卵巢癌症的病人处收集77例卵巢癌DNA样品、55例子宫癌DNA样品、17例DNA样品。同时收集29例非癌性DNA样品，代表New Haven CT病例。要了解所有参与这次研究的每一位病人的所有重要的医学信息，例如，临床信息和病理学信息、家族病史、种族和存活时间。在这种研究中使用的样品文库继续生长。

所述BRCA1基因与增加的乳腺癌症和卵巢癌症患病风险有关，并且构成这次研究的焦点。根据加利福尼亚大学Santa Cruz基因组浏览器选择BRCA1的3′未翻译的区域(3′UTR)(公众可以从http://genome.ucsc.edu上获得)。3′未翻译的区域(3′UTR)被定义为每个基因终止密码子到最后的外显子末尾的区域。BRCA1基因的3′未翻译的区域(3′UTR)内假定的miRNA结合位点可以通过专门的算法识别，使用其各自的缺省参数(例如，PicTar、TargetScan、miRanda、miRNA.org、和Micro Inspector)。通过检索dbSNP(公众可以通过http://www.ncbi.nlm.nih.gov/projects/SNP得到)和Ensembl数据库(公众可以通过http://www.ensembl.org/index.html得到)可以识别残留在miRNA结合位点上的单核苷酸多态性(SNPs)。

对来自DNA癌症样品盒细胞系的BRCA1的3′未翻译的区域(3′UTR)进行聚合酶链反应扩增。使用极高准确度的KOD热启动DNA聚合酶(EMD)，从而最小化聚合酶链反应的突变频率。使用的热循环程序包括95℃进行2分种的一个循环，95℃进行20秒、64℃进行10秒、和72℃进行40秒的的40个循环。然后，向耶鲁生物技术资源实验室(http://keck.med.yale.edu/)发送成功的聚合酶链式反应扩增子进行测序。筛选存在新型和已知的单核苷酸多态性(SNPs)的序列。记录所有识别的单核苷酸多态性(SNPs)。

一旦获得对于BRCA1足够的测序结构，可以使用高处理能力并且更为节省时间的基因定型方法。因此，可以使用TaqMan聚合酶链反应试验(应用生物系统公司)，这种方法可以根据合适的多态性专门设计。使用两种TaqMan荧光标记的探针进行基因定型，每种分别针对一种等位基因。使用ABI PRISM 7900HT序列检测系统和SDS 2.2软件(应用生物系统公司)进行分析。在癌症样品以及整个DNA样品文库中进行TaqMan反应，使用下面的热循环程序：95℃进行10分种的一个循环、93℃进行15秒、60℃进行1分钟的50个循环。用于BRCA1的试验探针编号如下所述：

BRCA1：

C_3178665_10(rs9911630)，

C_29356_10(rs12516)，

C_3178688_10(rs8176318)，定制的RS3092995-0001(rs3092995)，

C_3178676_10_rs1060915)，

C_2615180_10(rs799912)，

C_3178692_10(rs9908805)，和C_9270454_10(rs 17599948)(图6，表2).

为了保存参与研究者的DNA样品，使用TaqMan PreAmpMaster Mix试剂盒。预扩增过程并没有扩增全部基因组，但是相反的，我们创造了一种由所关心的探针所组成的“试验库”。因此、来自5中不同染色体和7种不同基因的18个探针被并入库。超过100种样品本成功的预扩增。本发明提供了一种方法，将合适的探针集中在一起并扩增所关心的基因组区域。基本的方案是，在极低的DNA浓度下启动预放大的聚合酶链反应(结果显示DNA的浓度低至0.5纳克/微升时，1.5微升的DNA就可以得到可靠的结果)。按照1∶40的比例稀释前置放大产物，然后准备样品进行TaqMan基因定型(按照之前描述的过程)。

表2：8种多态性研究，占据267kb并且包括BRCA1

粗体字显示的多态性包括预计患者患上乳腺癌患病风险所需要的最优单核苷酸多态性(SNP)组

这八种单核苷酸多态性(SNP)占据两个基因并且大约有267kb，使用TaqMan单核苷酸多态性(SNP)基因定型试验对这八种单核苷酸多态性(SNP)进行研究。

表3：研究群体

^*数字代表对八种不同的单核苷酸多态性(SNP)进行基因定型的病人的数目。

在BRAC1中，被测序的所有病人还被进行了基因定型。

样品的数目允许直接就某些亚类测序，尤其是MP，由于所有或者许多样品是FFPE，样品的数目受到限制。

实施例2：使用来自乳腺肿瘤和卵巢肿瘤的组织、邻近的正常组织和正常组织样品评价BRCA1内miRNA互补位点的序列编码

BRCA1具有高度保守的3′未翻译的区域(3′UTR)，具有1381个核苷酸。所述3′未翻译的区域(3′UTR)具有16个已知的单核苷酸多态性(SNPs)。这些单核苷酸多态性(SNPs)中的九个位于预计的miRNA结合位点上，这九个中的4个位于预计的接种区结合位点。然而，在这里的16个单核苷酸多态性(SNPs)之中，到目前为止只有三个单核苷酸多态性(SNPs)(rs3092995、rs8176318和rs12516)被发现存在于被测序的DNA样品中。另外，已经识别出一种新型的存在于预计的miRNA结合位点的单核苷酸多态性(SNP)(SNP1)。值得注意的是，这种单核苷酸多态性(SNP)只发现存在于一位病人中，即存在于肿瘤组织中，也存在于邻近的正常组织中。这一结果是可再生的(图2和图3)。在所有四种通过测序被识别出并具有预测的miRNA结合位点的单核苷酸多态性(SNPs)中，两种(rs3092995和rs12516)位于预计的miRNA结合位点的接种区(图3)。在我们识别出的单核苷酸多态性(SNPs)中，没有一个位于预测的miRNA结合位点高度保守区中。

更为准确的说，rs3092995位于下列两个保守性较差的miRNAs预计结合的位点：hsa-miR-99b和has-miR-635。Rs3092995被预计能够结合在has-miR-635的接种区。Rs8176318位于hsa-miR-758预计可以结合的位点。SNP1位于hsa-miR-654和hsa-miR-516-3p预计可以结合的位点。最后，rs 12516位于hsa-miR-637、hsa-miR-324-3p和hsa-miR-412预计可以结合的位点。Rs 12516处于hsa-miR-637预计的接种区中(图3)。

在研究的癌症群体中，一旦测绘出BRCA1的3′未翻译的区域(3′UTR)，可以使用一种更高处理量的基因定型癌症DNA样品的方法。为了完成这一实验，使用TaqMan聚合酶链反应试验(应用生物系统公司)，这种TaqMan聚合酶链反应试验可以专门设计用于通过对癌症群体进行测序定位3个主要的单核苷酸多态性(SNPs)。使用两种TaqMan荧光标记的探针进行基因定型，每种探针分别针对一种等位基因。使用ABI PRISM 7900HT序列检测系统和SDS 2.2软件(应用生物系统公司)进行分析。在癌症样品以及全部的DNA样品中进行TaqMan反应。

实施例3：相对于整个群体，局部群体的BRCA1单核苷酸多态性(SNPs)出现率。

图4显示了来自46位世界人口总共包括2462位个体的整体文库的BRCA1 3′未翻译的区域(3′UTR)基因定型结果。如图4所示，rs8176318和rs12516在整个群体中基本上一起遗传。除了非洲人之外，他们在群体中的发现率分别为31.6和31.7％。另外，rs3092995在世界大部分群体中十分罕见。除了非洲人之外，在群体的其他人中均为发现rs3092995。然后，这两种有意思的趋势对于非洲群体均不适用。在非洲群体中(在研究中有十位非洲人，从表的最左端，Biaka Pygmy到Ethiopian Jews)，其中10.2％的非洲群体发现具有rs3092995，rs8176318和rs 12516具有减少的结合遗传的可能性。据显示，当rs8176318和rs12516一起遗传时，rs 12516比rs8176318具有更高的出现率(分别为27.8％和16.3％)。

同时，对来自7种癌症群体和一种耶鲁对照物的384为个体进行分析，其BRCA13′未翻译的区域(3′UTR)具有相同的三个单核苷酸多态性(SNPs)(图5)。有趣的是，在世界群体中观察到的趋势(图4)并没有反应在研究的癌症群体中。但是，这里有一些相似性。例如，rs3092995以1.6％的比例出现在研究的癌症群体和耶鲁对照组中。同样，在耶鲁对照组中，rs8176318和rs 12516在非-非洲的世界人口中显示相同的趋势。也就是说，在非-非洲世界人口中，这两种单核苷酸多态性(SNPs)存在于大约31％的群体中，在耶鲁对照物中，他们以28％的比例存在，通常是一起遗传的。但是，在不同的癌症群体中可以观察到一种惊人的差异，rs8176318和rs12516很少会一起遗传。这一趋势与在非洲群体中发现的趋势相似。然而，使这种趋势更有意思的是，在非洲群体内，单核苷酸多态性(SNP)rs 12516比rs8176318具有更高的出现率(分别为27.8％和16.3％)。但是，在研究的癌症群体中，在乳腺癌群体(除了HER2+)中，rs8176318比rs12516具有更高的出现率(分别为26.9％和21.3％)。

与上述结果相对应，染色体17的区域充满了更多可提供信息的单核苷酸多态性(SNPs)。我们的观点是使用两倍，来解决区域的谱系进化并开始单倍体分析。为了完成这一观点，向包括BRCA1的区域加入5种其他的可提供信息的单核苷酸多态性(图6)。由于BRCA1在反义链上，这些单核苷酸多态性(SNPs)从染色体的下部向上排列(3′到5′)。这八种单核苷酸多态性(SNPs)占据2个基因(BRCA1和NBR1)和大约267kb。尽管在进行单倍体分析时观察到有力的连接不平衡，但是这样大的染色体区域允许我们观察遗传变异性。(Gu，S.，Pakstis，AJ.and Kidd，K.K.Bioinformatics 2005.21，3938-9).单倍体分析是分析所关心的基因中单核苷酸多态性(SNPs)的影响的有效方法。进行单倍体分析背后的理论是：如果致病基因经过负选择性压力，位于携带疾病的染色体上的连接变化可以以较低的频率出现在群体中。

确定横跨在BRCA1上的八种单核苷酸多态性(SNPs)的进化(图7)。在图6中，每种单核苷酸多态性(SNP)都被指定了一种单倍体位点(1-8)。这些位点与图7中观察到的“冒牌的”单倍体位点相关联。例如，原始的序列具有8个字母“GGCCACTA(SEQ ID NO：8)”，每个字母(从左至右)都与编号位置有关。为了确定单核苷酸多态性(SNPs)的原始状态，使用与人类样品中所用过的相同的TaqMan试验，但是，这些试验用于对来自非人类的灵长类动物进行基因定型。通过原始单倍体上的变化的积累，可以解释十种最常见的单倍体。绝大部分直接观察到的单倍体都是被设计的，通过一个衍生的核苷酸变化而相互差异。更准确地说，在图7中，关于在方框中的两个单倍体哪个在谱系中先发生这里使用的单核苷酸多态性(SNPs)是不确定的。在世界范围内，AGCCATTA(SEQ ID NO：2)单倍体是目前最常观察到的单倍体。两种单倍体，GAACGCTA(SEQ IDNO：3)和GAACGCTG(SEQ ID NO：4)，存在于世界群体的全部区域。AGCC-GCTG单倍体只发现在新大陆中，新大陆指的是美洲的南部区域、中部区域和北部区域(完整的叙述参见ALFRED：http://alfred.med.yale.edu)。

比较世界群体和研究的癌症群体之间单倍体的出现率。这一比较现实，在这两个群体以及一种或者一种以上的单倍体中所观察到的单倍体之间存在重大区别，并且，所述一种或者一种以上的单倍体与增加的乳腺癌或者卵巢癌的患病风险有关。

对来自46位世界群体(包括2,472为个体)(图8)的八种单核苷酸多态性(SNPs)进行基因定型。在图8中显示的单倍体数据是可以根据单倍体进化数据预计的。更准确地说，所观察到的原始单倍体，GGCCACTA(SEQ ID NO：8)，只存在于非洲种族的群体中。最为常见的单倍体，AGCCATTA(SEQ ID NO：2)，可以发现存在于绝大部分的世界人口中。两种单倍体，GAACGCTA(SEQ ID NO：3)和GAACGCTG(SEQ ID NO：4)，也被发现存在于世界群体中。事实上，重组单倍体，AGCC-GCTG(SEQ ID NO：19)，(与通过单倍体进化论预计的一样)只被发现在新大陆群体中。这些图标使人想起当对BRCA13′未翻译的区域(3′UTR)进行基因定型时所出现的模型。如评述图4时的解释，非洲群体显现出一种非常不同的模型。再次观察也维持了这一结论。在图8中，头十位种族群体具有非洲血统(Biaka Pygmy到Ethiopian Jews)并且显示独特的单倍体模型。例如，下列单倍体：GGCCACCA(SEQ ID NO：7)、GACGACTA(SEQ ID NO：5)、GACCACTA(SEQ ID NO：20)和AGCCACTA(SEQ ID NO：1)，都是非洲人特有的。最后，标记有“剩余物”的序列很可能代表以极低的频率出现在群体中的重复的单倍体。46个群体的范围可以低至26位个体(Masia)也可以高达222个个体(Laotians)。每个群体平均具有96.6个个体。

图9显示了来自7个癌症群体和1个耶鲁对照群体总共384位个体的单倍体数据。重要的是，为了在图9中比较世界群体的趋势，对许多相同的单倍体进行观察。例如，AGCCATTA(SEQID NO：2)单倍体依旧是最常观察到的单倍体。另外，两个单倍体：GAACGCTA(SEQ ID NO：3)和GAACGCTG(SEQ ID NO：4)，被发现存在于世界群体中，并还被发现在图9所示的群体中。如图8所示，GGCCACCA(SEQ ID NO：7)单倍体在非洲群体中十分常见，这一单倍体在图9中也可以经常被观察到。这是由于在观察到GGCCACCA(SEQ ID NO：7)的群体中存在非洲籍美国人。在图9中唯一没有观察到GGCCACCA(SEQ ID NO：7)单倍体的群体是乳腺/卵巢群体，这一群体只由白种人构成(参见图10的种族数据)。然而，令人吃惊的是，在三重阴性(TN)乳腺癌亚类中观察到的单倍体不但与世界人口所观察到的具有显著的变化，而且与另外的癌症群体以及耶鲁对照组所观察到的也有显著的变化(图9)。这里有三种非常有趣的单倍体。这三种单倍体是GGACGCTA(SEQ ID NO：6)、GGCCGCTA(SEQ ID NO：9)和GGCCGCTG(SEQ ID NO：10)(图9和表4)。这三种独特的单倍体占三重阴性(TN)癌症组中所观察到的单倍体的12％，并且不存在于世界群体的单倍体中(除非以非常少的量存在)。GGCCGCTA(SEQ ID NO：9)单倍体具有一定的意义，这是由于，这种单倍体被发现存在于所有7种癌症组中。另外，三重阴性(TN)乳腺癌基团占据最大比例的剩余单倍体，几乎占到单倍体的18％(图9)。对于其他的单倍体，这一标准是在所有种类的全部样品中＜1％。在三重阴性(TN)内部，是一种单倍体“GGACGCTG”(SEQ ID NO：21)。这种单倍体占三重阴性(TN)单倍体的4％。但是，将其分类为残余物是由于这种单倍体很少出现在其他种类中(在卵巢组中观察到1次，在子宫癌组中观察到1次)。表4显示了在特有的单倍体内部和所关心的单倍体内部受到影响的单核苷酸多态性(SNPs)的精细分析。为了进行对比，这里描述了原始单倍体GGCCACTA(SEQID NO：8)和最常见的单倍体AGCCATTA(SEQ ID NO：2)。单核苷酸多态性(SNPs)rs8176318、rs1060915和rs17599948是产生特有单倍体的变化的示例性的位点。Rs8176318是重要的，这是由于它位于BRCA1的3′未翻译的区域(3′UTR)并且还位于预计的miRNA结合位点上。Rs1060915也是重要的，这是由于它位于BRCA1编码区域的外显子12上。编码区域也是miRNAs的目标位点。

表4

带下划线的dbSNP#S代表预计发展成乳腺癌症或者卵巢癌症患病风险的必需位点

rs1060915单核苷酸多态性：当变体等位基因(A)是同型体时并且这种突变的作用在不同的种族间被研究时，乳腺癌在非洲籍美国人中的相关性相对于参照物来讲是统计学上显著的(p＝0.01)。当相关性被进一步的限定为非洲籍美国人的三重阴性(TN)乳腺癌时，相对于参照物来讲，结果更为显著(p＝0.005)。

为了进一步分析这些癌症组，将所得单核苷酸多态性(SNP)数据与其他已知的三重阴性(TN)乳腺癌风险因子相关联。图11通过编码区域突变状态表示了BRCA1单倍体数据。在这些研究中，对110位病人进行BRCA1测试，并进行单倍体分析。BRCA1突变在三重阴性(TN)乳腺癌中是常见的，因此，可以预计，这些特有的单倍体中的两个，GGCCGCTA(SEQ ID NO：9)和GGCCGCTG(SEQ ID NO：10)，被发现在BRCA1突变携带者中，占该群体的8％。

绘制图12和图13，从而证实，三重阴性(TN)乳腺癌具有特有的单核苷酸多态性(SNP)特性并且不是非洲群体多样性的结果。图12证实，事实上，当在非洲籍美国人和白种人之间进行耶鲁对照物和三重阴性(TN)基团比较时，三重阴性(TN)非洲籍美国人与对照族群和三重阴性(TN)白种人都不同。尤其是GGACGCTA(SEQ ID NO：6)和GGCCGCTA(SEQ ID NO：9)，这两种单倍体在三重阴性(TN)非洲籍美国人中非常常见。这是可以预计的，由于三重阴性(TN)乳腺癌在年轻的非洲籍美国女性(即，＜40岁)中最为流行，因此受到关注。在图13中，通过进一步比较耶鲁参照物和三重阴性(TN)乳腺癌组的不同种族之间的年龄。当比较年龄时，很明显GGACGCTA(SEQID NO：6)单倍体只被发现存在于非洲籍美国人中，GGCCGCTA(SEQ ID NO：9)单倍体仅限于白种人。GGCCGCTA(SEQ IDNO：9)单倍体主要被发现存在于年轻群体(年龄＜＝51)中，但是，也被发现存在于年长的非洲籍美国人中。最后，在三重阴性(TN)非洲籍美国人(AA)群体中，原始单倍体明显的在年长的三重阴性(TN)非洲籍美国人中更为常见。在较为年轻的三重阴性(TN)非洲籍美国人(AA)组中，GGCCACCA(SEQ IDNO：7)单倍体更为常见。这与系谱数据相一致(图7)。

实施例4：与乳腺癌患病风险有关的罕见的BRCA1单倍体。

能够识别具有增加的发展成乳腺癌患病风险或者具有主要遗传风险的女性的遗传标记物依旧是难以预计的。许多BRCA1编码序列突变与乳腺癌患病风险有关，并且BRCA1多态性中破坏微RNA(miRNA)结合的突变是具有功能性的，并且可以作为癌症风险的遗传标记物。因此，假设BRCA1 3′未翻译的区域(3′UTR)中的这种多态性和包含这种功能性多态性的单倍体与乳腺癌的患病风险有关，并对这一假设进行检验。通过测序和基因定型，在BRCA1中识别出三个3′未翻译的区域(3′UTR)变体，所述BRCA1在乳腺癌群体中具有多态性，其中一个3′未翻译的区域(3′UTR)变体(rs8176318，同型接合性变体等位基因A)对非洲籍美国女性显示显著的癌症相关性，并且可以特异性的预测所述非洲籍美国女性发展出三重阴性乳腺癌的风险。通过单倍体分析，人们发现乳腺癌病人(n＝221)具有5种罕见的单倍体，包括这三种在对照群体中通常不会发现的3′未翻译区域变体(在所有乳腺癌染色体中占9.50％，对于对照染色体占0.11％，p＝0.0001)。五种罕见的单倍体中的三种包括rs8176318BRCA13′未翻译的区域(3′UTR)功能性等位基因。此外，这些单倍体不含有BRCA1编码区域突变的生物标志物，由于其在BRCA1突变型乳腺癌病人中非常罕见(1/129＝0.78％；1/129病人或者1/258个染色体)。这种罕见的BRCA1单倍体代表了与增加的乳腺癌患病风险有关的遗传标记。

研究群体的材料和方法

收集患者数据，包括年龄、种族和家族癌症病史。通过病理学分类法建立乳腺癌的亚类。从耶鲁/纽黑文厂医院募集对照物，并且，对照物中包括没有除了非-黑素瘤皮肤癌之外任何个人癌症病史的病人。所有的样品都是唾液标本。记录信息，包括年龄，种族和家族病史。对于BRCA1 3′未翻译的区域(3′UTR)的基因定型分析，使用与癌症相关的194个种系DNA对照物(92位欧洲籍美国人和102位非洲籍美国人)、205个肿瘤FFPE以及来自患有已知肿瘤亚类和种族的乳腺癌病人的种系DNA样品。通过鹿特丹家族癌症诊所，Erasmus大学医疗中心确定了129位无血缘关系的BRCA1突变携带者，并且按照如下所述方法从外周血液样品中分离DNA。

对于整个群体，我们使用耶鲁大学的2,250位无血缘关系的个体代表全世界46种群体。这些资源在遗传学研究中有着清楚的记载(Chin LJ，et al.Cancer research 2008；68(20)：8535-40；Speed WC，et al.The pharmacogenomics journal 2009；9(4)：283-90；Speed WC，et al.Am J Med Genet B Neuropsychiatr Genet2008；147B(4)：463-6；Yamtich J，et al.DNA repair2009；8(5)：579-84.).在这些研究中所述的46种群体包括10位非洲人(Biaka Pygmy、Mbuti Pygmies、约鲁巴人、Ibo、豪撒族、Chagga、马萨伊人、Sandawe、非洲籍美国人和Ethiopian Jews)、3位亚洲西南部人(Yemenite Jews、Druze和撒马利亚人)、10位欧洲人(Ashkenazi Jews、Adygei，楚瓦什人、匈牙利人、Archangel Russians、Vologda Russians、芬兰人、丹麦人、爱尔兰人和欧洲籍美国人)、2位亚洲西北部人(Komi Zyriane和Khanty)、1位南亚人(S.Indian Keralite)、1位东北西伯利亚人(雅库特人)、两位来自太平洋岛的人(Nasioi美拉尼西亚和Micronesians)、9位东亚人(老挝人、柬埔寨人、来自圣弗兰西斯科的中国人、台湾汉族人、客家人、韩国人、日本人、Ami和Atayal)、4位北美人(夏安族、美国亚利桑那州南部的印第安人、来自墨西哥的印第安人、玛雅人)、和4为南美人(奇楚亚人、Ticuna、Rondonia Surui、Karitiana)。根据监管与每一种群样品有关的人类患者研究的委员会批准的方案，所有的患者都表示同意。通过检索群体名称，可以在等位基因出现率数据库(http://alfred.med.yale.edu)和上述出版物上获得样品的描述和样品大小。(Cheung KH，et al.Nucleic acids research 2000；28(1)：361-3).从构建的或者生长的淋巴样干细胞系中提取DNA样品。现有技术中已经描述了转化、细胞培养和DNA纯化的方法(Anderson MA and Gusella JF.In vitro 1984；20(11)：856-8).所有的志愿者在外表上都是正常的并且健康的成年男性或者女性，根据所有相关的制度评定组许可的方案，在收到合适的书面同意书后开始收集样品。3′未翻译的区域(UTR)序列的评价

使用RecoverAll总核酸分离试剂盒(Ambion公司)从冷冻得FFPE肿瘤乳腺组织中分离DNA，使用DNeasy血液和组织试剂盒(Qiagen公司)从血液和唾液样品中分离DNA。使用KOD热启动DNA聚合酶(Novagen公司)和对这些序列具有特异性的DNA引物扩增BRCA1的整个3′未翻译的区域(3′UTR)：BRCA1：5′-GAGCTGGACACCTACCTGAT-3′(SEQ ID NO：22)和5′-GAGAAAGTCGGCTGGCCTA-3′(SEQ ID NO：23)。使用QIAquick聚合酶链反应纯化试剂盒161(Quiagen)纯化聚合酶链反应产物并使用成套引物测序：BRCA1：5′-CCTACCTGATACCCCAGATC-3′(SEQ ID NO：24)和5′-GGCCTAAGTCTCAAGAACAGTC-3′(SEQ ID NO：25)。

标记物分类

为了进行高通量的基因定型，设计TaqMan 5′核酸酶试验(应用生物系统公司)特异性的识别在每个单核苷酸多态性(SNP)位点的等位基因。通过使用相同的TaqMan试验对非人类灵长类动物的基因组DNA进行基因定型，我们确定了所使用的8种单核苷酸多态性(SNPs)的原始状态，其中，所述非人类灵长类动物是3个倭黑猩猩{Pan paniscus)、3个黑猩猩{Pan troglodytes)、3个长臂猿{Hylobates)、3个大猩猩{Gorilla大猩猩)、和3个猩猩{Pongo pygmaeus)。统计分析

使用相关性的卡平方测验和费雪精确概率分布检验比较种群之间基因型的出现率。使用相关性卡平方测验评价单倍体数据的显著性。如果p＞0.05就认为是统计学上显著的。单倍体内所有的位点都与各个种群对照物之间的Hardy-Weinberg平衡相一致。在没有亚群体信息的情况下，我们使用PHASE(用于从群体数据判断单倍体重新构建和复合速率的软件)推断病人和对照物个体(30，31)的单倍体。PHASE软件提供了单倍体分配必然性的判断。鉴于BRCA1基因相当简单的单倍体结构，PHASE算法的结果是非常准确的。对于确实需要判断的单倍体，PHASE测定值具有99％的必然性。

结果

识别BRCA13′未翻译的区域(3′UTR)中的单核苷酸多态性(SNPs)

目前存在很多的已知的BRCA13′未翻译的区域(3′UTR)单核苷酸多态性(SNPs)(表5)。为了识别这些已知的多态性和/或识别乳腺癌病人中新型的单核苷酸多态性(SNPs)，我们对患有三种已知乳腺癌亚类的乳腺癌病人(三重阴性(TN)＝7，HER2+＝18，和雌激素受体(ER)/孕激素受体(PR)+/HER2-＝14))的BRCA1的整个3′未翻译的区域(3′UTR)进行测序。对这些病人的整个BRCA1 3′未翻译的区域(3′UTR)进行初步筛选可以在之前报告过的功能性单核苷酸多态性(SNPs)发现变化：rs12516、rs8176318和rs3092995(表5)。另外、我们在BRCA13′未翻译的区域(3′UTR)识别出一种新的单核苷酸多态性(SNP)。所述BRCA1中的新单核苷酸多态性(SNP)是6824G/A或者5711+1113G/A。这种单核苷酸多态性(SNP)作为一种杂合子，在61岁的非洲籍HER2+美国病人中确定，是一种之前未见过的A等位基因。为了评价这些变体在群体之间的出现率，我们对由46种世界人口中2,250位非癌个体组成的群体进行特异性基因定型(图4A)。上述三种识别的BRCA13′未翻译的区域(3′UTR)单核苷酸多态性(SNPs)(rs12516、rs8176318和rs3092995)在群体中处于强烈的连接不平衡状态，并且在种族间有所差异。

表5：已知的BRCA13′未翻译的区域(3′UTR)单核苷酸多态性(SNPs)

编码链上存在的已知的BRCA1 3′未翻译的区域(3′UTR)单核苷酸多态性(SNPs)列表。根据dbSNP Build 130确定多态性的位点。

^*对三种单核苷酸多态性(SNPs)进行研究

+这些是聚A的变体，我们将其分类为STRP，或者较短的重复多态性。根据chimpanzee，或者orangatan和人类参照序列，STRP是一种复合物A_16-19G₂A_3-4。

表6：BRCA1 3′未翻译的区域(3′UTR)测序结果

对39为乳腺癌病人进行整个BRCA1 3′未翻译的区域(3′UTR)测序。观察到的基因型为G/G-C/C-C/C，A/G-A/C-C/C，A/A-A/A-C/C和G/G-A/C-G/C。位置分别是rs12516，rs8176318和rs3092995。等位基因A是rs12516，rs8176318位点衍生的等位基因。等位基因G是rs3092995位点衍生的等位基因。

由于在对照群体的种族间所识别的3′未翻译的区域(3′UTR)单核苷酸多态性(SNPs)中观察到显著的变化，随后确定不同种族的乳腺癌患者中这些单核苷酸多态性(SNPs)的变化。对130位患有乳腺癌的欧洲籍美国人和38位患有乳腺癌的非洲籍美国人进行这些单核苷酸多态性(SNPs)的基因定型，然后观察这些基因之间出现的变化(图4B)。为了确定这些单核苷酸多态性(SNPs)与肿瘤患病风险之间的相关性，比较癌症患者及其种族对照物之间的单核苷酸多态性(SNPs)出现率。已经确定，在纯合子形式中，罕见的rs8176318变体(A/A)与非洲籍美国人的乳腺癌显著相关，相关性为207(优势率(OR)，9.48；95％置信区间(CI)，1.01-88.80；p＝0.04)。在患有乳腺癌的欧洲籍美国人和所述rs8176318单核苷酸多态性(SNP)之间没有观察到肿瘤相关性(表7)。

表7：不同种族及乳腺癌亚类之间的BRCA1 3′未翻译的区域(3′UTR)单核苷酸多态性(SNPs)rs8176318和乳腺癌相关性

根据乳腺癌(BC)亚类和种族(欧洲籍美国人(EA)和非洲籍美国人(AA))，使用非条件回归模型调整优势率(OR)和95％置信区间(CI)。粗体数值显示了统计学上的肿瘤相关性。括号中的数字是指每组中病人的数字(第一行)。

由于不同的乳腺癌亚类之间BRCA1功能障碍是不同的，所以随后对不同种族和乳腺癌亚类评价三个3′未翻译的区域(3′UTR)单核苷酸多态性(SNPs)(图14)。可以确定，在非洲籍美国女性中，rs8176318的纯合子变异体形式与患有三重阴性(TN)乳腺癌的患病风险显著相关(优势率(OR)，12.19；95％置信区间(CI)，1.29-115.21，p＝0.02)。对于任意一种其他的单核苷酸多态性(SNPs)或者雌激素受体(ER)/孕激素受体(PR)+或者HER2+乳腺癌亚类都没有观察到相关性(表10)。

表10：不同种族及乳腺癌亚类之间的BRCA1 3′未翻译的区域(3′UTR)单核苷酸多态性(SNPs)rs8176318和乳腺癌相关性

BRCA1单倍体进展和出现率

为了评价BRCA1区域，我们加入五种之前报道过的标记的单核苷酸多态性(SNPs)(Kidd JR，et al，.(摘要/项目#58)。在2003年11月4-8日在加利福尼亚州洛杉矶举行的第53届美国人类遗传协会年会上，我们的发言主要关于我们在乳腺癌患者中识别的三种3′未翻译的区域(3′UTR)单核苷酸多态性(SNPs)。所述八种单核苷酸多态性(SNPs)主要占267kb(表2)。在所有八种单核苷酸多态性(SNPs)之间，整个区域具有高度连接不平衡(LD)和异型结合性，因此我们的单倍体通常较高(30-50％)(http://alfred.med.yale.edu)(Cheung KH，et al.Nucleic acidsresearch 2000；28(1)：361-3；Kidd JR，et al.(摘要/项目#58).公布于2003年11月4-8日在加利福尼亚州洛杉矶举行的第53届美国人类遗传协会年会

这八种单核苷酸多态性(SNPs)用来产生全部的单倍体出现率(图8)。通过原始单倍体上的变化的积累，可以解释所有的可以观察到的常见单倍体(图7)。大部分可以直接观察到的单倍体可以被预定的，相差只在一个衍生的核苷酸变化；在一个情况下，要求具有两种变化，并且在另外的情况下，可以观察到重组。总起来说，这造成三种分支，每个都是从原始单倍体的单一核苷酸变化开始的。值得注意的是，已经确定，与非洲之外(具有3-5个单倍体)相比，非洲内部的单倍体多样性高得多(代表性的有6-9个单倍体)。原始单倍体GGCCACTA(SEQ ID NO：8)几乎仅仅在非洲可以发现。最常见的单倍体，AGCCATTA(SEQID NO：2)，在世界范围内都可以发现，是非洲之外非常常见的单倍体。

乳腺癌病人中的BRCA1单倍体

在乳腺癌病人中，进一步研究由这八种单核苷酸多态性(SNPs)组成的单倍体，从而确定非癌症病人和乳腺癌病人之间这些BRCA1单倍体是否存在差异。识别出五种在乳腺癌群体中高度富集(在评价的总共442种乳腺癌染色体中出现42例)但是在全部参照群体中十分罕见的单倍体(GGCCGCTA[SEQ IDNO：9，#_1]、GGCCGCTG[SEQ ID NO：10，#_2]、GGACGCTA[SEQ ID NO：6，#_3]、GGACGCTG[SEQ ID NO：21，#_4]和GAACGTTG[SEQ ID NO：26，#_5])。在整个4500个非癌染色体中，在3个染色体上观察到GGACGCTA(SEQ ID NO：6)单倍体(#_3)，在两个染色体上观察到GGACGCTG(SEQ ID NO：21)单倍体(#_4)，而GGCCGCTA(SEQ ID NO：9)(#_1)、GGCCGCTG(SEQ ID NO：10)(#_2)和GAACGTTG(SEQ IDNO：26)(#_5)单倍体则没有被观察到。这代表这些单倍体在非癌性对照物中的整体出现率为0.1％，而在乳腺癌病人染色体中的出现率为9.50％(p＜0.0001)(图16A)。使用衍生的等位基因A，在单核苷酸多态性(SNP)rs8176318的3′未翻译的区域(3′UTR)内对两个单倍体(分别为#_3和#_4)进行定性。第三种罕见的单倍体(GAACGTTG(SEQ ID NO：26)，#_5)在3′未翻译的区域(3′UTR)多态性的两个(rs8176318和rs12516)中具有衍生的等位基因(A)。

由于研究结果显示这些单倍体在不同种族之间是存在变化的，为了更好的比较合适的种族群体中的罕见的乳腺癌单倍体，对乳腺癌病人及其种族匹配的对照物进一步进行评价。种族匹配的对照物由总共194位个体(102个非洲籍美国人和92位，包括一组耶鲁白种美国人和非洲籍美国人参照组)所组成。已经确定，8.84％的白种美洲乳腺癌病人和11.84％的非洲籍乳腺癌病人包括所述罕见的单倍体，并且，另外，这些单倍体很少发现在其种族匹配对照物中，只有GGACGCTA(SEQ ID NO：6)单倍体(#_3)被发现存在于一个欧洲籍美国人对照染色体中(0.26％，1/388个染色体，/KO.0001，图16B，表8)。

表8：用罕见单倍体研究乳腺癌患者

具有五种罕见单倍体的乳腺癌患者列表。在可以获得的情况下列出发病年龄和种族。NK＝无法获得信息或者未知。样品既来自于正常组织也来自于肿瘤。

根据乳腺癌亚类的乳腺癌患者中的BRCA1单倍体

由于已知的BRCA1编码序列突变在不同的乳腺癌亚类之间是存在变化的，因此，随后确定罕见的单倍体在不同的乳腺癌亚类之间如何分配。在三重阴性(TN)亚类，雌激素受体(ER)/孕激素受体(PR)+亚类和HER2+亚类之间，罕见的单倍体变化是显著的，三重阴性(TN)亚组中以最高的出现率含有这些罕见的单倍体，出现率为14.85％(30/202染色体，以其他的相比p＝0.014)，雌激素受体(ER)/孕激素受体(PR)+乳腺癌亚类其次，出现率为8.09％(11/136雌激素受体(ER)/孕激素受体(PR)+染色体)，HER2+亚类出现率最小，为1％(1/104)(图17A，表9)。GGACGCTG(SEQ ID NO：21)单倍体(#_4)仅仅与三重阴性(TN)肿瘤有关，与其他的肿瘤亚类无关。然后分别就种族性和乳腺肿瘤亚类对罕见的单倍体进行评价(图17B)。有两种单倍体(分别是#_2和#_5)是欧洲籍美国人的乳腺癌患者所特有的。有趣的是，三重阴性(TN)亚类具有最高比例的剩余单倍体(9.9％)。剩余单倍体的定义是在所有被研究的群体中出现率小于1％的所有单倍体的总和。这些发现表明在这一区域，乳腺癌的三重阴性(TN)亚类具有最高的变异量，并且与罕见的单倍体最为相关。

表9：BRCA1常见单倍体展示了欧洲人和74为非洲籍美国乳腺癌患者及其种族匹配参照之间的区别

与其种族匹配的参照物相比，评价欧洲籍美国人和非洲籍美国人乳腺癌患者的单倍体出现率变化。显示出9中产检的单倍体。在参照物间罕见但在乳腺癌患者中常见的5种罕见单倍体也被列出。剩余的单倍体(non-zone估计)被结合并表示为“RESIDUAL”。如果p＜0.05，就认为数值是显著性的。^*并不对表中的“剩余的”单倍体指定序列识别子，这是由于它代表了所有未具体命名的non-zero(非零)单倍体的累积估计值，并且，因此，并不代表单一序列。

年龄相关BRCA1单倍体和BRCA突变状态

评价不同年龄的罕见单倍体，从而确定与绝经的女性相比，是否年轻(绝经前期)女性具有更高的罕见单倍体比例。所述罕见的单倍体更常见的出现在年龄不到52岁的乳腺癌患者中；然后这一趋势并不具有统计上的显著性(图15).

已经确定，无论罕见的BRCA1单倍体是否与BRCA1编码序列突变有关，在这些研究中检测的病人的BRCA1突变状态仍然是未知的。因此，具有129个个体的组是独立的。

对欧洲乳腺癌患者杂合体进行BRCA1编码区域突变作用检测，检测其中是否存在罕见的BRCA1单倍体。只有一个BRCA1编码序列突变的病人具有罕见的单倍体(0.8％，GAACGTTG(SEQ ID NO：26)，#_5)。在这组病人中没有发现其他的四种罕见单倍体，这说明这些罕见的BRCA1单倍体不可替代常用的BRCA1编码序列突变标记物，而是这些罕见的BRCA1单倍体是特有的，并且是与乳腺癌有关的BRCA1改变的新型生物标记物。

讨论

这些研究确定，299位乳腺癌病人具有5种罕见的BRCA1单倍体，这五种罕见的BRCA1单倍体通常不会在参照群体中发现。这些单倍体包括BRCA1的3′未翻译的区域(3′UTR)单核苷酸多态性(SNPs)，其中之一(rs8176318)在非洲籍美国人当中显示显著的癌症相关性(p＞＝0.04)，并且，进一步的，与其他种族匹配的对照物相比，这一世非洲籍美国人患上三重阴性乳腺癌的风险因子(p＝0.02)。这些单倍体与常见的BRCA1编码区域突变无关。这些发现表明，罕见的BRCA1单倍体代表了一种新型遗传标记物，这种遗传标记物显示了增加的发展成乳腺癌的患病风险，并且，这种罕见的BRCA1单倍体还代表了BRCA1中影响BRCA1功能并且导致增加的乳腺癌患病风险的非编码的序列变化。

之前，已经进行了关于BRCA1区域中单倍体分析的研究，确定了其与偶发乳腺癌的相关性，但是，上述这些研究很少获得成功。(Cox DG，et al.Breast Cancer Res 2005；7(2)：R171-5；Freedman ML，et al.Cancer research 2005；65(16)：7516-22).

本研究是第一个偶发性乳腺癌BRCA1单倍体研究，这种单倍体分析的一部分包括对3′未翻译的区域(3′UTR)的非编码调节区的研究。目前正在快速的获得可以使用的证据，从而支持3′未翻译的区域(3′UTR)内的变体能够增加基因表达参照物对癌症的敏感度的理论。(Chin LJ，et al.Cancer research 2008；68(20)：8535-40；Landi D，et al.Carcinogenesis 2008；29(3)：579-84).尽管我们还不能确定在罕见的单倍体中，增加的乳腺癌患病风险是单倍体内的一个单一变体还是等位基因的结合物，但是，假定将功能性3′未翻译的区域(3′UTR)变体与另一个包括每周单倍体的变体相结合，这一结合对有意义的BRCA1功能障碍是有预见性的。

在我们的单倍体分析中，通过亚类对偶发性乳腺癌进行进一步的分析。由于由BRCA1突变引起的乳腺癌最常见的是与三重阴性(TN)有关(57％)(Atchley DP，et al.J Clin Oncol2008；26(26)：4282-8)并且与ER+乳腺癌有关(34％)(Tung N，et al.Breast Cancer Res；12(1)：R12)，且在HER2+乳腺癌中非常罕见(大约3％)(Lakhani SR，et al.J Clin Oncol 2002；20(9)：2310-8)，我们发现，罕见的单倍体主要在三重阴性(TN)乳腺癌和雌激素受体(ER)+乳腺癌中存在，这进一步支持了我们的假设，即，罕见的单倍体与实际的BRCA1功能障碍有关。

未来的研究会集中在BRCA1单倍体内部的一些个体单核苷酸多态性(SNPs)上。特别有意义的是在五种罕见单倍体中的衍生的等位基因G之内带标记的单核苷酸多态性(SNPs)rs1060915，BRCA1同义外显子突变。Rs1060915是一种未知其显著性的变体(VUS)。根据与野生型序列相比较的mRNA和蛋白水平，乳腺癌信息核心(BIC)将这些未知其显著性的变体(VUS)归类为一种中性的或者临床重要性较小的类别(http://research.nhgri.nih.gov/bic)。尽管Myriad遗传公司已经将这种单核苷酸多态性(SNP)与高患病风险女性联系在一起并且将其分类为多态性(由于它通常发现在高-患病风险病人群体中)，但是与本研究不同的是，Myriad遗传公司并没有指出这种单核苷酸多态性(SNP)作为增加的发展成为乳腺癌症或者卵巢癌症患病风险的生物标记物的作用。具体地说，Myriad公司没有认识到rs 1060915是患者发展成乳腺癌三重阴性(TN)亚类的患病风险的显著预报。

最近，BRCA1中相似的编码序列已经被证明位于miRNA结合位点中并能够影响肿瘤易感性。(Nicoloso MS，et al.Cancerresearch；70(7)：2789-98).导致miRNA分裂的3′未翻译的区域(3′UTR)单核苷酸多态性(SNPs)与影响miRNA结合的外显子单核苷酸多态性(SNPs)相结合，构成罕见的单倍体中增加的乳腺癌患病风险的机制。

在三重阴性(TN)乳腺癌亚类中，罕见的单倍体的富集是尤其显著的。与参照相比，这些亚类不仅仅显著性的与我们的罕见单倍体相关(p＜0.0001)，而且三重阴性(TN)乳腺癌是与我们的罕见单倍体有关的最常见的亚类。三重阴性(TN)乳腺癌的患病风险因素与其他形式的乳腺癌不同，这是由于三重阴性(TN)肿瘤与雌激素刺激(从未生育过的人、肥胖者、激素代替治疗)无关。三重阴性(TN)与雌激素刺激无关的事实有力的证明这里存在额外的遗传原因。由于三重阴性(TN)乳腺癌具有最坏的结果，或许，最重要的是识别具有发展成这种乳腺癌亚类风险的人。

我们研究的局限包括含有罕见单倍体的病人数目较少，妨碍了年龄和种族的相关性揭露研究。另外，BRCA1编码区域突变的欧洲乳腺癌病人杂合体主要是西部欧洲白种人，只有一小部分的混血欧洲人。由于民族种类少，这限制了在BRCA1突变携带者中发现罕见的单倍体。然而，罕见的单倍体与乳腺癌之间较高的相关性使得这些发现更具有统计学上的显著性。本研究提供了证据，证明罕见的单倍体可以被用作发展成为乳腺癌增加的患病风险的遗传标记物，并且为未来的在更大体积样品中确认结果以及进一步阐明这些单倍体的生物功能及他们等价乳腺癌患病风险的机制研究提供了支持。

其他实施方案

尽管本发明已经结合其详细的说明进行了描述，但是之前的描述只是起到说明作用，并不能作为本发明范围的限制，而本发明的范围由所述权利要求书来定义。本发明其他的方面、优点和改良也包括在随后的权利要求书的范围内。

这里所涉及的专利和科技文献构成本领域技术人员所恩那个获得的知识。这里所提到的所有的美国专利和公开的或者未公开的美国专利申请通过引证在此全部并入本文。这里所提到的所有公开的外国专利和专利申请通过引证在此全部并入本文。这里通过登记号提到的Genbank和NCBI通过引证在此全部并入本文。这里提到的所有其他公开的参考文献、文件、文稿和科学文献通过引证在此全部并入本文。

尽管本发明已经被具体的显示并参照其优选的实施方案进行了详细的描述，但是本发明所述领域普通技术人员应该理解的是，在不背离由所附权利要求书定义的本发明范围的情况下，可以进行多种形式和细节方面的改变。

Claims

1.一种BRCA1单倍体，这种BRCA1单倍体包含至少一种单核苷酸多态性(SNP)，其中，这种单核苷酸多态性(SNPs)的存在增加了患者发展成为胸部癌症或者卵巢癌症的风险。

2.根据权利要求1所述的单倍体，其中，每个单核苷酸多态性(SNP)改变一个或者一个以上miRNA的活性。

3.根据权利要求1所述的单倍体，其中所述单核苷酸多态性(SNP)位于BRCA1基因的非编码区域或者编码区域。

4.根据权利要求2所述的单倍体，其中所述单核苷酸多态性(SNP)位于BRCA1基因的非编码区域或者编码区域。

5.根据权利要求1或者4所述的单倍体，其中所述单核苷酸多态性(SNP)选自由ra9911630、rs12516，rs8176318，rs3092995，rs1060915，rs799912，rs9908805，和rs17599948所组成的组中。

6.根据权利要求1所述的单倍体，其中所述单核苷酸多态性(SNP)选自由rs12516、rs8176318、rs3092995、rs1060915和rs799912所组成的组中。

7.根据权利要求1所述的单倍体，其中所述单核苷酸多态性(SNP)是rs8176318或者rs1060915。

8.根据权利要求1所述的单倍体，其中所述单倍体包含rs8176318和rs1060915。

9.根据权利要求1所述的单倍体，其中所述单核苷酸多态性(SNP)的存在增加患者发展成为三重阴性(TN)乳腺癌的风险。

10.根据权利要求1所述的单倍体，其中所述的单倍体包括GGACGCTA(SEQ ID NO：6)、GGCCGCTA(SEQ ID NO：9)、GGCCGCTG(SEQ ID NO：10)、GGACGCTG(SEQID NO：21)，或者GAACGTTG(SEQ ID NO：26)所示的核苷酸序列。

11.一种BRCA1多态特性，这种多态特性表明一种增加的发展成为乳腺癌症或者卵巢癌症的风险，所述特性包括确定存在或者不存在以下单核苷酸多态性(SNPs)rs8176318和rs1060915，其中，这些单核苷酸多态性(SNPs)的存在表明具有增加的发展成为乳腺癌症或者卵巢癌症的风险。

12.根据权利要求11所述的特性，其中所述特性进一步包括确定选自由rs12516、rs3092995和rs799912所组成的组的至少一种单核苷酸多态性(SNP)的存在或者不存在。

13.根据权利要求11所述的特性，其中所述特性进一步包括确定选自由rs9911630、rs9908805和rs17599948所组成的组的至少一种单核苷酸多态性(SNP)的存在或者不存在。

14.根据权利要求11所述的特性、其中rs8176318和rs 1060915改变至少一个微RNA(miRNA)的结合效果。

15.根据权利要求12或者13所述的特性，其中rs12516、rs3092995、rs799912、rs9911630、rs9908805或者rs 17599948改变至少一个miRNA的结合效果。

16.根据权利要求11所述的特性，其中所述至少一个miRNA是miR-7。

17.根据权利要求1所述的特性，其中，该特性进一步包含识别BRCA1基因中存在或者不存在一个种单核苷酸多态性(SNP)，所述BRCA1基因中的单核苷酸多态性(SNP)改变一种或者一种以上微RNA的结合效果。

18.根据权利要求17所述的特性，其中所述单核苷酸多态性(SNP)存在于非编码区域或者编码区域。

19.根据权利要求18所述的特性，其中非编码区域是3′未翻译的区域(UTR)、一种基因内区、一种基因间的区域、一种顺式调节元素、启动子元素、增强子元素、或者5′未翻译的区域(UTR)。

20.根据权利要求18所述的特性，其中，所述编码区域是外显子。

21.根据权利要求11所述的特性，其中所述乳腺癌是三倍阴性乳腺癌。

22.一种识别单核苷酸多态性(SNP)的方法，所述单核苷酸多态性(SNP)降低BRCA1基因的表达并且增加患者发展成为乳腺癌症或者卵巢癌症的患病风险，所述方法包括：

(a)从待检测患者处获得样品；

(b)获得对照样品；

(C)确定来自该检测样品的DNA序列内部的至少一个miRNA结合位点中存在或者不存在单核苷酸多态性(SNP)；并且

(d)与该miRNA对来自对照样品的相应DNA序列的相同miRNA结合位点的结合效果相比较，评价至少一个miRNA对至少一个包含所述单核苷酸多态性(SNP)的miRNA结合位点的结合效果，其中，对照样品和待检测样品之间，如果所述至少一个miRNA与相应的结合位点之间的结合效果存在统计学上显著的变化，则说明单核苷酸多态性(SNP)的存在或者不存在会抑制miRNA-调节的保护作用或者增加miRNA-调节的BRCA1基因表达的阻遏作用，从而识别同样能够增加患者发展成为乳腺癌症或者卵巢癌症风险的单核苷酸多态性(SNP)。

23.一种识别一种单核苷酸多态性(SNP)的方法，所述单核苷酸多态性(SNP)能够减少BRCA1基因的表达并且增加患者发展成为乳腺癌症或者卵巢癌症的风险，该方法包括：

(a)从待检验患者中获得样品；

(b)确定来自待检验的患者体内的DNA序列的至少一个miRNA结合位点中存在或者不存在单核苷酸多态性(SNP)；和

(c)相对于单核苷酸多态性(SNP)在一种或者更多种世界人口中的预期发病率，评价乳腺癌症或者卵巢癌症人口中单核苷酸多态性(SNP)的发病率，其中，与一种或者一种以上世界人口相比，肿瘤样品中所述单核苷酸多态性(SNP)的存在或者不存在出现统计学上显著的增加，则说明这种单核苷酸多态性(SNP)鱼发展成乳腺癌症或者卵巢癌症的患病风险正向相关，并且，其中，在至少一个能够降低BRCA1表达的miRNA结合位点内存在或者不存在单核苷酸多态性(SNP)表明，这种单核苷酸多态性(SNP)的存在或者不存在能抑制miRNA调节的保护作用或者增加miRNA调节的BRCA1基因表达阻遏作用，从而识别同样能够增加患者发展成为乳腺癌症或者卵巢癌症风险的单核苷酸多态性(SNP)。

24.根据权利要求22或者23所述的方法，其中，所述待检测的患者已经诊断患有乳腺癌症或者卵巢癌症。

25.根据权利要求22所述的方法，其中，对照样品是从没有诊断出患有任何癌症的患者中获得的。

26.根据权利要求22或者23所述的方法，其中，所述miRNA结合位点是凭经验确定的、或者是从数据库中识别的，或者是使用其中所述计算方法来预计的。

27.根据权利要求22或者23所述的方法，其中，存在或者不存在单核苷酸多态性(SNP)是凭经验确定的、或者是从数据库中识别的，或者是使用一种计算方法来预计的。

28.根据权利要求22所述的方法，其中，所述结合效果是体外或者体内评价的。

29.根据权利要求22或者23所述的方法，其中，乳腺癌是偶发性的或者是遗传性的。

30.根据权利要求22或者23所述的方法，其中，卵巢癌是偶发性的或者是遗传性的。

31.一种识别具有发展成为乳腺癌症或者卵巢癌症的风险的患者的方法，该方法包括，a)从待检测患者中获得DNA样品；和b)确定来自样品至少一种DNA序列中存在至少一种单核苷酸多态性(SNP)的，所述单核苷酸多态性(SNP)选自由rs 12516、rs8176318、rs3092995和rs799912所组成的组中，其中，在至少一种DNA序列中存在至少一种单核苷酸多态性(SNP)会使患者发展为乳腺癌症或者卵巢癌症的风险与正常患者相比增加10倍。

32.根据权利要求31所述的方法，该方法进一步包括确定rs1060915存在的步骤，其中，在至少一种DNA序列中，rs1060915和选自由rs12516、rs8176318、rs3092995和rs799912所组成的组中的至少一种单核苷酸多态性(SNP)的存在使患者发展成为乳腺癌症或者卵巢癌症的风险与正常患者相比增加100倍。

33.根据权利要求31所述的方法，其中，所述正常患者是不携带rs12516、rs8176318、rs3092995、rs799912或者rs1060915的患者。

34.根据权利要求31所述的方法，其中，乳腺癌是偶发性的或者是遗传性的。

35.根据权利要求31所述的方法，其中，卵巢癌是偶发性的或者是遗传性的。

36.一种识别具有发展成为三重阴性(TN)乳腺癌的风险的患者的方法，该方法包括，a)从待检测患者中获得DNA样品；和b)确定来自样品至少一种DNA序列中存在rs8176318或者rs 1060915，其中，与正常患者相比，在至少一种DNA序列中存在rs8176318或者rs 1060915会增加患者发展为三重阴性(TN)乳腺癌的风险。

37.根据权利要求36所述的方法，其中，该方法包括确定rs8176318和rs 1060915存在的步骤，其中，在至少一个DNA序列中结合存在rs8176318和rs 1060915进一步增加了患者发展成为三重阴性(TN)乳腺癌的风险。

38.根据权利要求36或者37所述的方法，其中，乳腺癌是偶发性的或者是遗传性的。

39.根据权利要求36或者37所述的方法，其中，卵巢癌是偶发性的或者是遗传性的。

40.根据权利要求36或者37所述的方法，其中，待检测主体是非洲籍美国人。