CN101230387B

CN101230387B - 人类mgst1基因的单核苷酸多态性在诊断和治疗乳癌方面之应用

Info

Publication number: CN101230387B
Application number: CN2007100089104A
Authority: CN
Inventors: 廖凌虹; 张�浩; 吴汪黔生
Original assignee: Individual
Current assignee: Individual
Priority date: 2007-04-28
Filing date: 2007-04-28
Publication date: 2010-09-01
Anticipated expiration: 2027-04-28
Also published as: CN101230387A

Abstract

本发明涉及检测在人类微粒体谷胱甘肽巯基转移酶(MGST1)基因上的3个与乳癌(breast cancer)相关联的单核苷酸多态性(SNP)位点，以及应用这些单核苷酸多态性位点预测乳癌的易患性及筛选治疗乳癌的药物。乳癌在许多国家是很主要的癌症致死因素，本发明所提供的信息有助于预防乳癌及开发有效的新疗法。

Description

人类MGST1基因的单核苷酸多态性在诊断和治疗乳癌方面之应用

技术领域

本发明涉及检测人类微粒体谷胱甘肽巯基转移酶(MGST1)基因上的3个与乳癌(breast cancer)相关联的单核苷酸多态性(SNP)位点，以及应用这些单核苷酸多态性位点预测乳癌的易患性。本发明也提供了一种有助于预防乳癌的方法，也可应用于筛选针对不同类型乳癌的适当疗法。

背景技术

乳癌是妇女中很常见的恶性癌症，每年全世界有一百多万的新发病例并导致六十万例死亡(见IARC，WHO.Breast cancer，in Stewart B，Kleihues P(eds).World Cancer Report.Lyon：IARC Press，2003；188-19)。乳癌发病率在西方发达国家最高，如美国，澳大利亚和西欧等国。但近20年来，乳癌的发病率在亚洲国家也逐渐增高。已知的导致乳癌的风险因素有家族遗传，饮食习惯，生育史，外源雌激素的使用，抽烟饮酒等等。遗传因素大约占了25％(Lichtenstein P，Holm NV，Verkasalo PK et al.Environmental and heritable factorsin the causation of cancer--analyses of cohorts of twins from Sweden，Denmark，and Finland.N Engl J Med 2000；343：78-85)，而高致病性基因如BRCA1和BRCA2的突变则只占不到10％(Welcsh PL，Owens KN，King MC.Insights into the functions of BRCA1 and BRCA2.Trends Genet 2000；16：69-74)。因此，一直以来大家都认为存在着一些更普遍的低致病性的遗传改变，而这些改变导致了相当一部份乳癌的发生(Kammerer S，RothRB，Reneland R et al.Large-scale association study identifies ICAM gene region as breast and prostate cancersusceptibility locus.Cancer Res 2004；64：8906-10)。

异源物质代谢酶(XMEs)

异源物质是非人体固有的天然或人工合成的物质，包括药物，工业产物，杀虫剂，污染性物质，生物碱，及由细菌，真菌，植物和动物产生的毒素。许多异源物质本身或其经生物转化后的形式具有致癌性。异源物质代谢酶(XMEs)能导致各种致癌物，致癌物前体，毒素和药物的活性化，它们也能参与宿主对异源物质的防御反应。由于治疗性药物对人体而言也是异源物质，因此某些异源物质代谢酶也被称为药物代谢酶(DMEs)。参与异源物质的氧化反应和连接反应的酶分别被称为I相和II相异源物质代谢酶。I相异源物质代谢酶，例如细胞色素P450s(CYPs)基因家族，催化多种内源性和外源性的异源物质(从类固醇到污染物)的氧化反应，在这些氧化过程中可能产生亲电的和可致癌的中间产物。II相异源物质代谢酶通常以氧作为进一步代谢反应的位点，比如接上协同因子使物质变得更亲水进而有利于该物质的排出。在肠壁，血脑屏障和胎盘里存在着大量的异源物质代谢酶，暗示这些酶能限制异源物质进入主要系统并在宿主的防御机制中发挥重要作用(Jonker JW，Buitelaar M，Wagenaar E，et al.，2002.The breast cancer resistance proteinprotects against a major chlorophyll-derived dietary phototoxin and protoporphyria.Proc Natl Acad Sci U S A.99：15649-54.)。虽然异源物质的解毒总是与肝脏的代谢联系在一起，但是现在在乳癌组织中也发现这些基因的表达有着显著不同(Haas S，Pierl C，Harth V et al.Expression of xenobiotic and steroid hormonemetabolizing enzymes in human breast carcinomas.Int J Cancer 2006；119：1785-91)。

微粒体谷胱甘肽巯基转移酶1(MGST1)是一种在微粒体中广泛分布的II相异源物质代谢酶。它催化谷胱甘肽与许多异源化合物反应形成亲水的谷胱甘肽结合物，使这些异源物质更加容易被排出体外。某些可溶性的谷胱甘肽巯基转移酶(GST)，如GSTM1，已被发现与乳癌的发生有关(Sachse C.，Smith G.，Wilkie M.J.V.，et al.，2002.A pharmacogenetic study to investigate the role of dietary carcinogens in the etiology ofcolorectal cancer.Carcinogenesis 23：1839-1849)。MGST1基因定位在12号染色体的p13.1-p13.2区上，全长17,268bp，有2个可被选择的第一外显子(外显子1b和1d)及2个非功能性的第一外显子(外显子1a和1c)，还有3个能被翻译成蛋白的外显子(外显子2，3，4)。进行RNA剪切时，其中一个带有不被翻译的mRNA区域的第一外显子将与下游的其它外显子连接。外显子1b和1d是最主要的外显子；带有外显子1a和1c的mRNA还未被检测到。紧接外显子1b上游的启动子区会作出氧化应激反应，而紧接外显子1d的启动子区则不会。

单核苷酸多态性(SNP)

人类基因组中DNA序列的差异导致了个体的不同特征，包括每个人接触了异源物质(污染物，毒素和药物)后不同的反应。基因组中的单个核苷酸(A，G，C或T)发生变化就产生了单核苷酸多态性(SNP)，在传代的过程中单核苷酸多态性逐渐趋于稳定。大家越来越认识到大量已定位SNP的收集将为人类遗传学的研究提供有力的工具。此外，SNP还能作为遗传标记用于家系的连锁分析，特定人群的连锁不平衡分析以及疾病关联性分析来寻找与疾病有关的基因。像乳癌这样的多基因病，与疾病有显著关联的SNP就可以作为一种工具来辨别对疾病有较高易感性的个体。而对患乳癌的病人进行基因检测则有可能揭示一些未知的遗传病因并且优化疾病的管理和治疗。

当乳癌病人和健康对照组的SNP被发现和检测后，需要分析有关数据来确定某个SNP与乳癌之间是否存在显著的联系。这是基于：即使某个SNP“X”能直接影响乳癌的易感性，拥有这个SNP“X”也不是得乳癌的充分必要条件，但是这个SNP“X”在病人中的出现频率一定高于正常人。同样地，与此SNP“X”呈连锁不平衡(linkage disequilibrium，LD)的其它SNP也会出现这种情况。因此，对SNP与疾病的关联性的研究可以在两个方向上进行：直接检测一个有功能影响的SNP或者用这个SNP作为连锁不平衡(LD)的标记物进行关联性分析。

发明内容

本发明的目的是提供微粒体谷胱甘肽巯基转移酶1(MGST1)基因的单核苷酸多态性位点，这些位点与乳癌易感性有关联，它们可运用于开发一些新的方法在早期临床阶段对乳癌进行辅助诊断。

本发明给出了一条独立的多核苷酸片断，它具有SEQ ID NO：1的序列。该多核苷酸片断为人类MGST1基因的一部分，包括了此基因的5’不转录区。外显子1a，1b和1c，及3个多态性位点：rs4149187，rs2239675和rs2239676。

本发明还给出了一套PCR引物可用于扩增出如同SEQ ID NO：1的多核苷酸片断。该套引物中的第一条引物的序列与SEQ ID NO：2所示相同，或与SEQ ID NO：2互补；第二条引物的序列与SEQ ID NO：3所示相同，或与之互补。

此发明的另一部分给出了一种可以预测一个个体是否更容易或者更不容易得乳癌的方法。此方法包括：(a).检测该个体的核酸序列；(b).选择并确定以下3个SNP位点(rs4149187，rs2239675和rs2239676)中的一个或多个位点的核苷酸序列；或检测与上述3个SNP中一个或多个位点处于相同的单倍型或连锁不平衡(LD)的其它遗传标记。

此发明还给出了一种检测乳癌病人基因型的方法，该方法可以为病人的药物治疗提供在药学基因组学方面的指导，包括：(a).检测病人的核酸样本的序列；(b).选择并确定以下3个SNP位点：rs4149187，rs2239675和rs2239676中的一个或多个位点的核苷酸序列，或检测与上述3个SNP中一个或多个位点处于相同的单倍型或连锁不平衡(LD)的其它遗传标记。

此发明也给出了一种筛选药物的方法，可应用于鉴定治疗或预防乳癌的药物。此方法包括：(a).转染一个载体到真核细胞表达系统，该载体至少含有人类微粒体谷胱甘肽巯基转移酶1(MGST1)基因中的部份片段，而该片断包含以下3个SNP位点中的一个或几个(rs4149187，rs2239675和rs2239676)，或者包含与上述3个SNP中一个或多个位点处于相同的单倍型或连锁不平衡(LD)的其它遗传标记；(b).在细胞表达系统中表达该载体；(c).在这个细胞系统中加入被筛选的药物；(d).分析异源物质代谢酶基因的表达来研究被筛选的药物在该细胞系统中对基因表达的影响；(e).确定那些能够改变异源物质代谢酶基因表达的药物。

附图说明

以下这些图表将令该项发明的特点在后面的详细叙述中更加浅显易懂。

图1是部分基因组MGST1基因的示意图，显示了SNP：rs4149187，rs2239675和rs2239676的位置和与其邻近的外显子的相对位置。

具体实施方式

术语的定义：

在本发明的说明书和权利要求书中使用了以下各种术语，它们的定义如下所述：

术语“等位基因”(allele)指一段核苷酸序列的不同变化形式。

术语“互补的”(complementary)与“互补”(complement)指一段核苷酸序列可以通过碱基配对的原则与另一条多核苷酸序列在可以配对的区域配对。

术语“基因型”(genotype)指生物体的遗传物质组成。更确切地说，它是指个体中所含有的等位基因的类型。如某个体的两条姐妹染色单体上的特定位置核苷酸序列均为A，则该个体在此特定位点的基因型为A/A。对一个个体或一份DNA样本进行基因型检测“(Genotyping)”是指在核苷酸的水平上来确定一个个体在特定多态性位点的等位基因序列。

术语“多态性”(polymorphism)指某个基因或基因的某个部分在人群中存在多于一种的形式。“多态的，多态性的”(polymorphic)指在某一人群中可找到有两种以上的基因序列变异。“多态性位点”(polymorphic site)指核苷酸序列发生变异的基因座。

术语“寡核苷酸”(oligonucleotide)和“多核苷酸”(polynucleotide)在这里指的是在长度上多过一个核苷酸的RNA、DNA或者RNA/DNA杂交的序列。这些序列可以单链或双链的形式存在。通常将小于50个核苷酸残基组成的核酸称为寡核苷酸，大于50个核苷酸残基称为多核苷酸。

术语“聚合酶链式反应”(PCR)是一种扩增DNA序列的方法，它通过热稳定的聚合酶和一对引物，其中一条引物与正链的一端互补结合，另一条与负链的另一端互补结合，来进行DNA扩增。新合成的DNA片断可以作为模板，与同样的引物结合，经过退火，延伸和解链三个步骤的循环迅速而特异地扩增出目的序列。

术语“引物”(primer)指的是短的单链寡核苷酸。它可与DNA样本中的互补序列配对结合。引物是依赖模板的DNA合成的起始点。DNA聚合酶可在一条引物的末端位置添加脱氧核糖核酸。“一对引物”(primer pair)或“一套引物”(primer set)指的是两条引物中包含有可杂交于被扩增序列5’端位置的某条链的一条引物，和可杂交于被扩增片断3’端位置的另一条链的引物。

术语“外显子”(exon)指的是基因中编码蛋白质的DNA序列。

术语“内含子”(intron)指的是那些打断基因中编码蛋白质的DNA序列的序列。内含子序列可以被转录为RNA，但是在RNA翻译为蛋白质之前会被切除。

本发明特别关系到与乳癌有联系的单核苷酸多态性(SNP)。已经发现如果个体编码微粒体谷胱甘肽巯基转移酶1(MGST1)基因或与其互补的序列含有特定的多态性位点，则该个体可能具有相对高的乳癌易感性。

本发明给出了一些与乳癌有联系的特定的SNP位点：MGST1基因的rs4149187，rs2239675和rs2239676。以上这些SNP位点虽然之前已经被发现并报道过，但是从未将它们与乳癌相联系。

此发明现给出有关上述3个SNP位点的详细描述。SEQ ID NO：1的序列为人类基因组MGST1基因序列的一部分，包括了此基因的外显子1a，1b，1c及其侧翼序列。外显子1a起始于序列的第321碱基的位置，结束于第363碱基的位置。外显子1b起始于序列的第824碱基的位置，结束于第889碱基的位置。外显子1c起始于序列的第957碱基的位置，结束于第1077碱基的位置。对于SNP rs4149187，它的参考等位基因是如SEQ ID NO：1所示，核苷酸变化是发生在第316碱基处，由胞嘧啶(C)取代参考碱基鸟嘌呤(G)。对于SNP rs2239675，它的参考等位基因是如SEQ ID NO：1所示，核苷酸变化是发生在第510碱基处，由腺嘌呤(A)取代参考碱基鸟嘌呤(G)。对于SNP rs2239676，它的参考等位基因是如SEQ ID NO：1所示，核苷酸变化是发生在第693碱基处，由胞嘧啶(C)取代参考碱基鸟嘌呤(G)。

以下部分将给出确认这些与乳癌相关联的单核苷酸多态性位点的方法。

本发明所分析的所有健康人和乳癌病人均为中国汉族人。乳癌病人均经由组织病理学检查确认。健康对照组在性别与年龄上与病人组相匹配。挑选健康组与病人组的另一些条件包括：无家族癌症病史，从未接受过对未知病因的放化治疗。每一位经挑选的参与者贡献5ml外周血。我们使用国际通用的GFX^TM血液基因组DNA纯化试剂盒(Amersham Biosciences，NJ，USA)提取样本血液基因组DNA。用常规DNA测序的办法检测碱基突变。我们使用应用生物系统公司(Applied Biosystems，CA，USA)的热启动

GoldDNA扩增试剂盒和Eppendorf公司的梯度扩增仪扩增基因组DNA。扩增产物经琼脂糖凝胶电泳确认并纯化后，使用应用生物系统公司(AppliedBiosystems，CA，USA)的

Terminator v3.1测序试剂盒在3100遗传分析仪(Applied Biosystems，CA，USA)上测序。我们使用标准的卡方分析查找乳癌与多态性位点的关联性。计算优势比(odds ratios，OR)与95％置信区间(95％CI)时我们使用了对年龄参数作校正的逻辑回归分析。所有统计学分析均使用SPSS 12.0统计软件包(SPSS Inc.，Chicago，IL)。

表1显示了上述SNP与乳癌相关性的分析及乳癌患者在基因型频率上的关系。统计结果显示SNP位点rs4149187，rs2239675和rs2239676与乳癌的发生显著相关。对于MGST1基因的rs4149187位点，g/c基因型携带者比g/g或c/c基因型携带者的患乳癌风险要高出1.681倍(p＝0.002，95％CI：1.213-2.331)。对于MGST1基因的rs2239675位点，g/a基因型携带者比g/g或a/a基因型携带者的患乳癌风险要高出1.44倍(p＝0.028，95％CI：1.039-1.995)。对于MGST1基因的rs2239676位点，g/c基因型携带者比g/g或c/c基因型携带者的患乳癌风险要高出1.416倍(p＝0.037，95％CI：1.020-1.964)。

表1：MGST1基因的SNP位点与乳癌的相关性(P＜＝0.05为显著相关)。

SNP	基因型	对照组	乳癌组	优势比(95％置信区间)	显著性P值
SNP	基因型	对照组	乳癌组	优势比(95％置信区间)	显著性P值	rs4149187	g/g+c/c	177	136	1.681(1213-2.331)	0.002
	g/c	120	155			rs4149187	g/g+c/c	177	136	1.681(1213-2.331)	0.002
	g/c	120	155
rs2239675	g/g+a/a	160	133	1.440(1.039-1.995)	0.028
rs2239675	g/g+a/a	160	133	1.440(1.039-1.995)	0.028		g/a	132	158
							g/a	132	158
						rs2239676	g/g+c/c	159	136	1.416(1.020-1.964)	0.037
	g/c	128	155			rs2239676	g/g+c/c	159	136	1.416(1.020-1.964)	0.037

相应地，本发明也给出了检测以下SNP的方法来对乳癌的易感性作出诊断，这些SNP为：MGST1基因的rs4149187，rs2239675和rs2239676。同时也给出了对乳癌病人进行基因型检测的方法，以将MGST1基因作为有用的潜在目标来制造防治乳癌的药物。

图1展示了人类MGST1基因的基因组核酸序列上外显子的排布情况。在本发明中，那些可用于判断个体乳癌易感性的SNP的位置也同时在以上附图中标明了。

为了检测SNP rs4149187，rs2239675和rs2239676，要使用SEQ ID NO：2和SEQ ID NO：3所示的引物来扩增一段与SEQ ID NO：1相同的基因组DNA片段。然后用SEQ ID NO：2或SEQ ID NO：3所示引物对扩增片段进行测序。

上述图表和基因型检测方法对与乳癌相关的SNP位点都作了描述。

另一方面，此发明也给出了一种测定和诊断乳癌病人的基因型的方法。这种方法通过分析MGST1基因的部分序列来确定rs4149187，rs2239675和rs2239676这些SNP位点中的一个或几个位点的等位基因和(或)基因型。应用该方法首先要取得足够的人类DNA来进行序列和(或)基因型的分析才能够确定以上SNP位点中的某一个或几个的序列。此方法包括一些目前普遍使用的技术，如PCR，就象后面的范例中所描述的，用与范例相同的引物在相同的条件下检测与乳癌相关的单核苷酸多态性。也可以对这3个SNP位点使用不同于本发明中所述的引物进行检测，这些引物可以由具有相关经验的人勿须经过太多实验而设计。其它对单核苷酸多态性位点的基因型检测分析有帮助的方法都可以用于检测上述3个SNP位点和与这3个SNP位点处于连锁不平衡的其它位点。

本发明的范例还提供了筛选和(或)诊断乳癌的方法。概括地说，此发明显示，在中国汉族女性人群中，MGST1基因rs4149187位点如为g/c基因型，该个体的患乳癌风险将显著增加1.681倍(95％CI：1.213-2.331，p＝0.002)；MGST1基因rs2239675位点如为g/a基因型，该个体的患乳癌风险将显著增加1.44倍(95％CI：1.039-1.995，p＝0.028)；MGST1基因rs2239676位点如为g/c基因型，该个体的患乳癌风险将显著增加1.416倍(95％CI：1.020-1。964，p＝0.037)。

以上所述的SNP位点可以用于鉴别那些接触异源物质时更容易得乳癌的个体。某些遗传多态性不仅影响乳癌的发生也影响乳癌的发展，为此本发明提供了乳癌的与易感基因遗传多态性之间的联系。这些检测可以使用一些已知的技术，包括：基因芯片的方法(比如：Affymetrix公司的GenFlex^TMTag，Pamgene，Inc.公司的PamChip等)，把DNA固定在基质上(比如：Marligen Bioscience公司的SIGNET^TM Y-SNPIdentification System)，ABI公司的SNPaPshot^TM Multiplex系统(Applied Biosystems Inc.)，分子信标技术(Sanya Tyagi，Public Health Research Institute，New York，USA)和Pyrosequencing^TM技术(PyrosequencingAB)。检测也可以使用以下方法来完成：用等位基因特异性引物，等位基因特异性探针直接对目标区域进行测序，单链构象多态性(SSCP)和变性梯度胶电泳(DGGE)。综上所述，本发明给出了一个检测有患乳癌趋势的人的方法，它是通过对MGST1基因的rs4149187，rs2239675和rs2239676这些SNP位点进行检测来实现的。

作为本发明的另一部分，人工合成的或重组的DNA分子都可以用于检测。这些DNA分子序列包含以下3个SNP位点的任意组合：MGST1基因的rs4149187，rs2239675和rs2239676。序列可以是它们的任意一种等位基因形式和其侧翼序列，也可以是和这些SNP位点连锁不平衡的基因座。这些DNA分子序列可以是这个异源物质代谢酶基因的一条或两条DNA链。

此外，本发明还提供了一种对治疗乳癌所用药物进行评价的方法，该方法是基于上述SNP位点与乳癌的相关性。因为有些位点处于基因的启动子区或外显子和内含子的交界区，它们可以影响这些基因mRNA的调控，合成和剪接。为了检测这种影响，可以将这些SNP的不同等位基因形式依不同组合方式组成一条新序列，再将序列克隆到合适的表达载体上，并在一些乳癌细胞系中表达，这些细胞系包括：BT-20，BT-474，Hs578T等等。转染的方法可用目前普遍使用的转染试剂盒如：CellPhect转染试剂盒(Amersham PharmaciaBiotech，Inc.，USA)和哺乳动物转染系统(Promega Coporation)。转染效率可用一些已知的试剂如：磷酸钙(Life Technologies Inc.)等来提高。

如果以上一个或几个SNP位点与乳癌相关的等位基因形式会改变基因表达和(或)同族基因的结构特征，则以上提到过的细胞系也可用来筛选一些能够使基因表达恢复正常的化合物。这样的化合物在治疗和预防乳癌方面可作为非常有潜力的候选药物。

本发明进一步提供了检测与乳癌有关的SNP位点的检测试剂盒；也提供了明确无误的DNA测试方法以应用于乳癌遗传易感性的检测。

用DNA测序或其它基因型检测方法检测感兴趣的SNP位点，首先需要用PCR扩增含有以下一个或者多个SNP位点的DNA片段。这些SNP位点包括：MGST1基因的rs4149187，rs2239675和rs2239676。所获得的PCR产物可用于之后的DNA测序或别的基因型检测方法来检测多态性位点的不同等位基因形式，如：连接依赖性的多探针扩增(multiplex ligation dependent probe amplification)，单碱基延伸(single base-baseextension)，或基因芯片上的序列特异性探针杂交(microarray-based sequence-specific oligonucleotide probehybridization)，单链构象多态性(single strand conformation polymorphism)，寡核苷酸芯片上的固相PCR(solid phase PCR on oligonucleotide microarrays)，直接在寡核苷酸芯片上的复合PCR(direct multiplex PCRon oligonucleotide microarrays)等。检测结果可以用软件包，比如POLYPHARD^TM和CONCED^TM等合适的软件进行分析。一个能够用于以上检测的试剂盒可能包括下列组分中的一个或几个：PCR引物，等位基因特异性探针，DNA聚合酶，PCR反应缓冲液，氯化镁，PCR反应或引物延伸所需的4种脱氧核糖核酸。如果需要测序的话，该试剂盒还可能需要含有：测序引物，DNA聚合酶，4种标记的双脱氧核糖核酸和4种未标记的脱氧核糖核酸。

当基因型检测方法中不需要对DNA进行扩增时，被检测的DNA可直接用于检测上述3个SNP或检测与任何一个SNP相关的单倍型。

此方法给出了一个筛选药物的办法，其步骤包括：

(a)将一载体转入一个真核细胞表达系统，该载体必须含有人类MGST1基因的一部分或全部，可以是单独的某一基因也可以是几个基因在一起。

(b).在细胞表达系统中表达该载体；

(c).在这个细胞系统中加入被筛选的药物；

(d).分析基因的表达情况，此基因可以是MGST1基因的SNP位点上的所有等位基因的可能组合方式。同时也分析该细胞系统中相同家族的异源物质代谢酶基因的表达与活性。

(e).确定那些被筛选的化合物在该细胞体系中对同族的异源物质代谢酶基因表达和活性的影响。

依照以上方法，得到的化合物或制备的细胞表达体系可作为治疗和预防乳癌的潜在的候选药物。

更进一步，不仅如范例1中所述的PCR与DNA测序方法可以用于检测被测DNA样本的如下单核苷酸多态性位点：MGST1基因的rs4149187，rs2239675和rs2239676，还有其它一些类似的测序方法也可以用作这一用途。比如说：多重连接依赖的探针扩增(multiplex ligation dependent probe amplification，MLPA)，pyrosequencing测序(Pyrosequencing AB)，单链构象多态性(single strand conformation polymorphism，SSCP)，或者变性梯度胶电泳(denaturing gradient gel electrophoresis，DGGE)。另有一些方法可达到此目的，这些方法包括：使用DNA芯片的方法(比如Affymetrix公司的GenFlex^TMTag，Pamgene，Inc.公司的PamChip等)；把DNA固定在基质上的方法(比如Marligen Bioscience，Inc.公司的SIGNET^TM Y-SNP IdentificationSystem)；ABI公司的

SNPaPshotTM Multiplex System(Applied Biosystems Inc.)；或者是分子信标技术(Sanya Tyagi，Public Health Research Institute，美国纽约)。

以下将举例说明本发明。但正如一些熟知此技术领域的人所显而易见的那样，这并不意味着将本发明局限于以下示例。

实施例1：检测本发明中的单核苷酸多态性位点rs4149187，rs2239675和rs2239676。

本发明涉及到MGST1基因的rs4149187，rs2239675和rs2239676单核苷酸多态性位点。检测位点的方法介绍如下：

可用软件Primer3(http://frodo.wi.mit.edu/cgi-bin/primer3/primer3)设计一些特异性引物用于查找相关区域的多态性位点。用BLAST^TM程序(National Center for BiotechnologyInformation-http://www.ncbi.nlm.nih.gov/BLAST)检测所设计的引物相对于人类基因组序列的特异性。不论是正向还是反向引物，只有当它们在BLAST程序的特定条件下所找到的相似性序列少于5条时才会被认为是特异性的并被采纳。

用

Gold聚合酶试剂盒(Applied Biosystems，CA，美国)和

Gradient热循环仪(Eppendorf，Hamburg，德国)进行聚合酶链式反应(PCR)。聚合酶链式反应总体积为20微升，包括1.5mM镁离子，200μM四种碱基，每条引物各0.3μM，模板基因组DNA 10ng，和0.5U的聚合酶。首先用呈梯度温度变化的聚合酶链式反应来为每一对引物寻找最合适的退火温度。表2列出了一对引物序列的例子及其退火温度。聚合酶链式反应程序为：95度10分钟(1个循环)，接着进行45个循环的94度30秒，60度30秒和72度30秒。最后为72度延伸2分钟。产物用1.5％的琼脂糖凝胶电泳并用溴化乙锭染色进行分析确认为所需长度，然后将扩增产物用MultiScreen^TMPCR₉₆纯化试剂盒(Millipore Corporation，Bedford，美国)纯化除去剩余的反应物。

表2：检测单核苷酸多态性位点rs4149187，rs2239675和rs2239676基因型的引物与其最佳退火温度。

引物名称	序列(5’端到3’端)	退火温度
引物名称	序列(5’端到3’端)	退火温度	SEQ ID NO：2	AGGAAGTAGACCTTGCAACACG	60℃
SEQ ID NO：3	GCACGGGGACAGAAATACAA		SEQ ID NO：2	AGGAAGTAGACCTTGCAACACG	60℃

我们采用对PCR产物的双链分别测序的方法来查找感兴趣区域的单核苷酸多态性位点。采用的试剂盒为Terminator v3.0 Cycle Sequencing Kit(Applied Biosystems，CA，USA)。采用的测序仪器为

3100Genetic Analyzer(Applied Biosystems，CA，USA).每一个样本至少测序两次。

将测序结果输入到BioEdit软件中作序列比对与分析，以此确定单核苷酸多态性位点。

实施例2：检测人类MGST1基因上与乳癌相关的单核苷酸多态性位点

此范例描述了一个用于检测并确定上文所述的一个或几个单核苷酸多态性位点的方法。人类的MGST1基因的部分目标区域将用作模板来合成PCR产物。表3列出了特异性引物，每对可分别用于扩增特定目标区域。

表3：用于MGST1基因的PCR和DNA测序的引物

单核苷酸多态性位点名称	正向引物	反向引物	测序引物	最佳退火温度
单核苷酸多态性位点名称	正向引物	反向引物	测序引物	最佳退火温度	rs4149187	AGGAAGTAGACCTTGCAACACG(SEQ ID NO：2)	GCACGGGGACAGAAATACAA(SEQID NO：3)	SEQIDNO：2	60℃
rs2239675	AGGAAGTAGACCTTGCAACACG(SEQ ID NO：2)	GCACGGGGACAGAAATACAA(SEQID NO：3)	SEQIDNO：2	60℃	rs4149187	AGGAAGTAGACCTTGCAACACG(SEQ ID NO：2)	GCACGGGGACAGAAATACAA(SEQID NO：3)	SEQIDNO：2	60℃
rs2239675	AGGAAGTAGACCTTGCAACACG(SEQ ID NO：2)	GCACGGGGACAGAAATACAA(SEQID NO：3)	SEQIDNO：2	60℃	rs2239676	AGGAAGTAGACCTTGCAACACG(SEQ ID NO：2)	GCACGGGGACAGAAATACAA(SEQID NO：3)	SEQIDNO：3	60℃

含有单核苷酸多态性位点片段的PCR扩增与扩增产物的测序

以下试剂用于PCR扩增感兴趣的片段：1.5mM镁离子，200μM四种碱基，每条引物各0.3μM，模板基因组DNA 10ng，和0.5U的聚合酶，聚合酶链式反应总体积为20微升。

聚合酶链式反应使用Gradient热循环仪(Eppendorf，Hamburg，德国)按以下步骤进行：95度10分钟(1个循环)，接着进行45个循环的94度30秒，55到60度30秒和72度30秒。最后为72度延伸2分钟。

PCR扩增产物用MultiScreen^TMPCR₉₆纯化试剂盒(Millipore Corporation，Bedford，美国)纯化后直接用

Terminator v3.0Cycle Sequencing Kit(Applied Biosystems，CA，USA)试剂盒测序。测序反应条件为96度1分钟(1个循环)，接着进行25个循环的96度10秒，50度5秒和60度4分钟。

测序产物用含有DNA纯级别Sephadex^TMG-50的AutoSeq96^TMPlates平板(AmershamPharmaciaBiotech，Inc，USA)纯化。纯化产物经加入5μl Hi-Di Formamide(Applied Biosystems，CA，USA)95摄氏度变性。变性的测序产物用ABI公司提供的方法在

3100Genetic Analyzer(Applied Biosystems，CA，USA)测序仪上分析。将测序结果输入到BioEdit软件中作序列比对与分析。

表4列出了用此方法的测序统计结果。表格分别列出了在基因型水平上正常人与乳癌病人在多个单核苷酸多态性位点上的序列情况。

表4：在MGST1基因中与乳癌相关的单核苷酸多态性的表格

SNP	基因型	对照组	乳癌组
SNP	基因型	对照组	乳癌组	rs4149187	g/g+c/c	177	136
	g/c	120	155	rs4149187	g/g+c/c	177	136
	g/c	120	155
rs2239675	g/g+a/a	160	133
rs2239675	g/g+a/a	160	133		g/a	132	158
					g/a	132	158
				rs2239676	g/g+c/c	159	136
	g/c	128	155	rs2239676	g/g+c/c	159	136

虽然以上只介绍了一种检测与乳癌有关联的多态性位点的方法，任何熟知此方面工作的人都知道可以使用其它方法达到此目的。比方说，设计等位基因特异性探针，等位基因特异性引物延伸反应，或者使用单碱基延伸反应来检测。

实施例3：检测MGST1基因单核苷酸多态性位点rs4149187，rs2239675和rs2239676的试剂盒

此范例描述了一个试剂盒，该试剂盒用于检测并确定上文所述的一个或几个单核苷酸多态性位点的序列，从而得到被测个体的基因型。检测结果可运用于对该个体对乳癌的易感性作出预测。

该试剂盒包含以下引物：SEQ ID NO：1，SEQ ID NO：2和SED ID NO：3。该试剂盒还包含以下试剂用于PCR扩增MGST1基因的片段：1.5mM镁离子，200μM四种碱基，阳性对照人类模板基因组DNA，和聚合酶。运用试剂盒时，聚合酶链式反应总体积为20微升，聚合酶链式反应使用热循环仪按以下步骤进行：95度10分钟(1个循环)，接着进行45个循环的94度30秒，55到60度30秒和72度30秒。最后为72度延伸2分钟。

PCR扩增产物可用测序等方法来确定单核苷酸多态性位点rs4149187，rs2239675和rs2239676的序列。

核酸序列的清单

<110>廖凌虹，张浩

<120>人类MGST1基因的单核苷酸多态性在诊断和治疗乳癌方面之应用

<160>3

<210>1

<211>1080

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<222>(316)

<223>单核苷酸多态性位点rs4149187，n＝g或c

<220>

<221>misc_feature

<222>(510)

<223>单核苷酸多态性位点rs2239675，n＝g或a

<220>

<221>misc_feature

<222>(693)

<223>单核苷酸多态性位点rs2239676，n＝g或c

<400>1

aggaagtaga ccttgcaaca ggtggtgagt gtctgagata tagcactagg agagaaataa 60

tatagattga aaacagaaat ccttaaacat ttctcatata aacccatgaa agatagatcc 120

ataaatattg tggggactat ggggactagg aagcttggaa gtatccctaa tctagatagt 180

gatggtaggc taaatatcta cggcttccgt aaacgttcct ctaaacctcc ctgtaaaaaa 240

cacactaagc tgattgtgta atgagctgat ccagtacaat tgcctccaat ttcattctgg 300

accctgaaca ggaggngaca tcgtgacaaa gcaaattgtc tggtatcatg aatttggaac 360

accgtaagtg atctttactg agggttacat tctgtcattg tcagcctttt aaggaggcct 420

tgccaccagc gcaggggagg tgaagtctaa gggaaggtaa tattgtcaat gcctgctaat 480

tagttctacc ctggagattt taactttctn cgaagttttt aaaaacaact tccaaaactc 540

tgctgatcct gaaatgttcg agaattcaga gttcctagac aatggctact gtcccccttc 600

ccactgatta ggggagttgg catttcagga accagagttt ctaagggcgc caaatagaag 660

ggctcaaagg gaatcagcag gcgatggtta ctntgggcgg gtaaatcagg tgatttagag 720

gaggggtttg gcgaggttgg ggtcgggctt taaacgtggg agggctaatt aacaggagat 780

taactggaga ggggcggtgc ctgcgtccgg cccgcgcggc cacagtccct gcattgcgcg 840

cgacccggcg gcgggacagg cttgctgctt cctcctcctc ggcctcaccg tgcgtactgg 900

gaggggagaa ggggaccgca tgcaaagggt ggcaggcagg gagggccagg gtgggtggca 960

gatggaagac ttgggggggt ctctgccagc tggaagtgct tggctccact tagcagctaa 1020

acttagcttt tcaatcgatc gcttttgaaa gggaattgta tttctgtccc cgtgcgggta 1080

<210>2

<211>22

<212>DNA

<213>人工序列

<220>

<223>用来检测人类MGST1基因等位基因的变化类型的人工合成DNA序列。

<400>2

aggaagtaga ccttgcaaca cg 22

<210>3

<211>20

<212>DNA

<213>人工序列

<220>

<400>3

gcacggggac agaaatacaa 20

Claims

1.用单核苷酸多态性位点制造用于评估乳癌易感性的试剂盒的用途，该单核苷酸多态性位点是MGST1基因的位点rs4149187，即，SEQIDNO：1序列第316碱基位核苷酸由G变成C。

2.如权利要求1所述的用途，根据包含该单核苷酸多态性位点的SEQ ID NO：1来设计引物，所述试剂盒包含所述引物。