具体实施方式
术语的定义:
在本发明的说明书和权利要求书中使用了以下各种术语,它们的定义如下所述:
术语“等位基因”(allele)指一段核苷酸序列的不同变化形式。
术语“互补的”(complementary)与“互补”(complement)指一段核苷酸序列可以通过碱基配对的原则与另一条多核苷酸序列在可以配对的区域配对。
术语“基因型”(genotype)指生物体的遗传物质组成。更确切地说,它是指个体中所含有的等位基因的类型。如某个体的两条姐妹染色单体上的特定位置核苷酸序列均为A,则该个体在此特定位点的基因型为A/A。对一个个体或一份DNA样本进行基因型检测“(Genotyping)”是指在核苷酸的水平上来确定一个个体在特定多态性位点的等位基因序列。
术语“多态性”(polymorphism)指某个基因或基因的某个部分在人群中存在多于一种的形式。“多态的,多态性的”(polymorphic)指在某一人群中可找到有两种以上的基因序列变异。“多态性位点”(polymorphic site)指核苷酸序列发生变异的基因座。
术语“寡核苷酸”(oligonucleotide)和“多核苷酸”(polynucleotide)在这里指的是在长度上多过一个核苷酸的RNA、DNA或者RNA/DNA杂交的序列。这些序列可以单链或双链的形式存在。通常将小于50个核苷酸残基组成的核酸称为寡核苷酸,大于50个核苷酸残基称为多核苷酸。
术语“聚合酶链式反应”(PCR)是一种扩增DNA序列的方法,它通过热稳定的聚合酶和一对引物,其中一条引物与正链的一端互补结合,另一条与负链的另一端互补结合,来进行DNA扩增。新合成的DNA片断可以作为模板,与同样的引物结合,经过退火,延伸和解链三个步骤的循环迅速而特异地扩增出目的序列。
术语“引物”(primer)指的是短的单链寡核苷酸。它可与DNA样本中的互补序列配对结合。引物是依赖模板的DNA合成的起始点。DNA聚合酶可在一条引物的末端位置添加脱氧核糖核酸。“一对引物”(primer pair)或“一套引物”(primer set)指的是两条引物中包含有可杂交于被扩增序列5’端位置的某条链的一条引物,和可杂交于被扩增片断3’端位置的另一条链的引物。
术语“外显子”(exon)指的是基因中编码蛋白质的DNA序列。
术语“内含子”(intron)指的是那些打断基因中编码蛋白质的DNA序列的序列。内含子序列可以被转录为RNA,但是在RNA翻译为蛋白质之前会被切除。
本发明特别关系到与乳癌有联系的单核苷酸多态性(SNP)。已经发现如果个体编码微粒体谷胱甘肽巯基转移酶1(MGST1)基因或与其互补的序列含有特定的多态性位点,则该个体可能具有相对高的乳癌易感性。
本发明给出了一些与乳癌有联系的特定的SNP位点:MGST1基因的rs4149187,rs2239675和rs2239676。以上这些SNP位点虽然之前已经被发现并报道过,但是从未将它们与乳癌相联系。
此发明现给出有关上述3个SNP位点的详细描述。SEQ ID NO:1的序列为人类基因组MGST1基因序列的一部分,包括了此基因的外显子1a,1b,1c及其侧翼序列。外显子1a起始于序列的第321碱基的位置,结束于第363碱基的位置。外显子1b起始于序列的第824碱基的位置,结束于第889碱基的位置。外显子1c起始于序列的第957碱基的位置,结束于第1077碱基的位置。对于SNP rs4149187,它的参考等位基因是如SEQ ID NO:1所示,核苷酸变化是发生在第316碱基处,由胞嘧啶(C)取代参考碱基鸟嘌呤(G)。对于SNP rs2239675,它的参考等位基因是如SEQ ID NO:1所示,核苷酸变化是发生在第510碱基处,由腺嘌呤(A)取代参考碱基鸟嘌呤(G)。对于SNP rs2239676,它的参考等位基因是如SEQ ID NO:1所示,核苷酸变化是发生在第693碱基处,由胞嘧啶(C)取代参考碱基鸟嘌呤(G)。
以下部分将给出确认这些与乳癌相关联的单核苷酸多态性位点的方法。
本发明所分析的所有健康人和乳癌病人均为中国汉族人。乳癌病人均经由组织病理学检查确认。健康对照组在性别与年龄上与病人组相匹配。挑选健康组与病人组的另一些条件包括:无家族癌症病史,从未接受过对未知病因的放化治疗。每一位经挑选的参与者贡献5ml外周血。我们使用国际通用的GFX
TM血液基因组DNA纯化试剂盒(Amersham Biosciences,NJ,USA)提取样本血液基因组DNA。用常规DNA测序的办法检测碱基突变。我们使用应用生物系统公司(Applied Biosystems,CA,USA)的热启动
GoldDNA扩增试剂盒和Eppendorf公司的
梯度扩增仪扩增基因组DNA。扩增产物经琼脂糖凝胶电泳确认并纯化后,使用应用生物系统公司(AppliedBiosystems,CA,USA)的
Terminator v3.1测序试剂盒在
3100遗传分析仪(Applied Biosystems,CA,USA)上测序。我们使用标准的卡方分析查找乳癌与多态性位点的关联性。计算优势比(odds ratios,OR)与95%置信区间(95%CI)时我们使用了对年龄参数作校正的逻辑回归分析。所有统计学分析均使用SPSS 12.0统计软件包(SPSS Inc.,Chicago,IL)。
表1显示了上述SNP与乳癌相关性的分析及乳癌患者在基因型频率上的关系。统计结果显示SNP位点rs4149187,rs2239675和rs2239676与乳癌的发生显著相关。对于MGST1基因的rs4149187位点,g/c基因型携带者比g/g或c/c基因型携带者的患乳癌风险要高出1.681倍(p=0.002,95%CI:1.213-2.331)。对于MGST1基因的rs2239675位点,g/a基因型携带者比g/g或a/a基因型携带者的患乳癌风险要高出1.44倍(p=0.028,95%CI:1.039-1.995)。对于MGST1基因的rs2239676位点,g/c基因型携带者比g/g或c/c基因型携带者的患乳癌风险要高出1.416倍(p=0.037,95%CI:1.020-1.964)。
表1:MGST1基因的SNP位点与乳癌的相关性(P<=0.05为显著相关)。
SNP |
基因型 |
对照组 |
乳癌组 |
优势比(95%置信区间) |
显著性P值 |
rs4149187 |
g/g+c/c |
177 |
136 |
1.681(1213-2.331) |
0.002 |
|
g/c |
120 |
155 |
|
|
|
|
|
|
|
|
rs2239675 |
g/g+a/a |
160 |
133 |
1.440(1.039-1.995) |
0.028 |
|
g/a |
132 |
158 |
|
|
|
|
|
|
|
|
rs2239676 |
g/g+c/c |
159 |
136 |
1.416(1.020-1.964) |
0.037 |
|
g/c |
128 |
155 |
|
|
相应地,本发明也给出了检测以下SNP的方法来对乳癌的易感性作出诊断,这些SNP为:MGST1基因的rs4149187,rs2239675和rs2239676。同时也给出了对乳癌病人进行基因型检测的方法,以将MGST1基因作为有用的潜在目标来制造防治乳癌的药物。
图1展示了人类MGST1基因的基因组核酸序列上外显子的排布情况。在本发明中,那些可用于判断个体乳癌易感性的SNP的位置也同时在以上附图中标明了。
为了检测SNP rs4149187,rs2239675和rs2239676,要使用SEQ ID NO:2和SEQ ID NO:3所示的引物来扩增一段与SEQ ID NO:1相同的基因组DNA片段。然后用SEQ ID NO:2或SEQ ID NO:3所示引物对扩增片段进行测序。
上述图表和基因型检测方法对与乳癌相关的SNP位点都作了描述。
另一方面,此发明也给出了一种测定和诊断乳癌病人的基因型的方法。这种方法通过分析MGST1基因的部分序列来确定rs4149187,rs2239675和rs2239676这些SNP位点中的一个或几个位点的等位基因和(或)基因型。应用该方法首先要取得足够的人类DNA来进行序列和(或)基因型的分析才能够确定以上SNP位点中的某一个或几个的序列。此方法包括一些目前普遍使用的技术,如PCR,就象后面的范例中所描述的,用与范例相同的引物在相同的条件下检测与乳癌相关的单核苷酸多态性。也可以对这3个SNP位点使用不同于本发明中所述的引物进行检测,这些引物可以由具有相关经验的人勿须经过太多实验而设计。其它对单核苷酸多态性位点的基因型检测分析有帮助的方法都可以用于检测上述3个SNP位点和与这3个SNP位点处于连锁不平衡的其它位点。
本发明的范例还提供了筛选和(或)诊断乳癌的方法。概括地说,此发明显示,在中国汉族女性人群中,MGST1基因rs4149187位点如为g/c基因型,该个体的患乳癌风险将显著增加1.681倍(95%CI:1.213-2.331,p=0.002);MGST1基因rs2239675位点如为g/a基因型,该个体的患乳癌风险将显著增加1.44倍(95%CI:1.039-1.995,p=0.028);MGST1基因rs2239676位点如为g/c基因型,该个体的患乳癌风险将显著增加1.416倍(95%CI:1.020-1。964,p=0.037)。
以上所述的SNP位点可以用于鉴别那些接触异源物质时更容易得乳癌的个体。某些遗传多态性不仅影响乳癌的发生也影响乳癌的发展,为此本发明提供了乳癌的与易感基因遗传多态性之间的联系。这些检测可以使用一些已知的技术,包括:基因芯片的方法(比如:Affymetrix公司的GenFlexTMTag,Pamgene,Inc.公司的PamChip等),把DNA固定在基质上(比如:Marligen Bioscience公司的SIGNETTM Y-SNPIdentification System),ABI公司的SNPaPshotTM Multiplex系统(Applied Biosystems Inc.),分子信标技术(Sanya Tyagi,Public Health Research Institute,New York,USA)和PyrosequencingTM技术(PyrosequencingAB)。检测也可以使用以下方法来完成:用等位基因特异性引物,等位基因特异性探针直接对目标区域进行测序,单链构象多态性(SSCP)和变性梯度胶电泳(DGGE)。综上所述,本发明给出了一个检测有患乳癌趋势的人的方法,它是通过对MGST1基因的rs4149187,rs2239675和rs2239676这些SNP位点进行检测来实现的。
作为本发明的另一部分,人工合成的或重组的DNA分子都可以用于检测。这些DNA分子序列包含以下3个SNP位点的任意组合:MGST1基因的rs4149187,rs2239675和rs2239676。序列可以是它们的任意一种等位基因形式和其侧翼序列,也可以是和这些SNP位点连锁不平衡的基因座。这些DNA分子序列可以是这个异源物质代谢酶基因的一条或两条DNA链。
此外,本发明还提供了一种对治疗乳癌所用药物进行评价的方法,该方法是基于上述SNP位点与乳癌的相关性。因为有些位点处于基因的启动子区或外显子和内含子的交界区,它们可以影响这些基因mRNA的调控,合成和剪接。为了检测这种影响,可以将这些SNP的不同等位基因形式依不同组合方式组成一条新序列,再将序列克隆到合适的表达载体上,并在一些乳癌细胞系中表达,这些细胞系包括:BT-20,BT-474,Hs578T等等。转染的方法可用目前普遍使用的转染试剂盒如:CellPhect转染试剂盒(Amersham PharmaciaBiotech,Inc.,USA)和哺乳动物转染系统(Promega Coporation)。转染效率可用一些已知的试剂如:磷酸钙(Life Technologies Inc.)等来提高。
如果以上一个或几个SNP位点与乳癌相关的等位基因形式会改变基因表达和(或)同族基因的结构特征,则以上提到过的细胞系也可用来筛选一些能够使基因表达恢复正常的化合物。这样的化合物在治疗和预防乳癌方面可作为非常有潜力的候选药物。
本发明进一步提供了检测与乳癌有关的SNP位点的检测试剂盒;也提供了明确无误的DNA测试方法以应用于乳癌遗传易感性的检测。
用DNA测序或其它基因型检测方法检测感兴趣的SNP位点,首先需要用PCR扩增含有以下一个或者多个SNP位点的DNA片段。这些SNP位点包括:MGST1基因的rs4149187,rs2239675和rs2239676。所获得的PCR产物可用于之后的DNA测序或别的基因型检测方法来检测多态性位点的不同等位基因形式,如:连接依赖性的多探针扩增(multiplex ligation dependent probe amplification),单碱基延伸(single base-baseextension),或基因芯片上的序列特异性探针杂交(microarray-based sequence-specific oligonucleotide probehybridization),单链构象多态性(single strand conformation polymorphism),寡核苷酸芯片上的固相PCR(solid phase PCR on oligonucleotide microarrays),直接在寡核苷酸芯片上的复合PCR(direct multiplex PCRon oligonucleotide microarrays)等。检测结果可以用软件包,比如POLYPHARDTM和CONCEDTM等合适的软件进行分析。一个能够用于以上检测的试剂盒可能包括下列组分中的一个或几个:PCR引物,等位基因特异性探针,DNA聚合酶,PCR反应缓冲液,氯化镁,PCR反应或引物延伸所需的4种脱氧核糖核酸。如果需要测序的话,该试剂盒还可能需要含有:测序引物,DNA聚合酶,4种标记的双脱氧核糖核酸和4种未标记的脱氧核糖核酸。
当基因型检测方法中不需要对DNA进行扩增时,被检测的DNA可直接用于检测上述3个SNP或检测与任何一个SNP相关的单倍型。
此方法给出了一个筛选药物的办法,其步骤包括:
(a)将一载体转入一个真核细胞表达系统,该载体必须含有人类MGST1基因的一部分或全部,可以是单独的某一基因也可以是几个基因在一起。
(b).在细胞表达系统中表达该载体;
(c).在这个细胞系统中加入被筛选的药物;
(d).分析基因的表达情况,此基因可以是MGST1基因的SNP位点上的所有等位基因的可能组合方式。同时也分析该细胞系统中相同家族的异源物质代谢酶基因的表达与活性。
(e).确定那些被筛选的化合物在该细胞体系中对同族的异源物质代谢酶基因表达和活性的影响。
依照以上方法,得到的化合物或制备的细胞表达体系可作为治疗和预防乳癌的潜在的候选药物。
更进一步,不仅如范例1中所述的PCR与DNA测序方法可以用于检测被测DNA样本的如下单核苷酸多态性位点:MGST1基因的rs4149187,rs2239675和rs2239676,还有其它一些类似的测序方法也可以用作这一用途。比如说:多重连接依赖的探针扩增(multiplex ligation dependent probe amplification,MLPA),pyrosequencing测序(Pyrosequencing AB),单链构象多态性(single strand conformation polymorphism,SSCP),或者变性梯度胶电泳(denaturing gradient gel electrophoresis,DGGE)。另有一些方法可达到此目的,这些方法包括:使用DNA芯片的方法(比如Affymetrix公司的GenFlex
TMTag,Pamgene,Inc.公司的PamChip等);把DNA固定在基质上的方法(比如Marligen Bioscience,Inc.公司的SIGNET
TM Y-SNP IdentificationSystem);ABI公司的
SNPaPshotTM Multiplex System(Applied Biosystems Inc.);或者是分子信标技术(Sanya Tyagi,Public Health Research Institute,美国纽约)。
以下将举例说明本发明。但正如一些熟知此技术领域的人所显而易见的那样,这并不意味着将本发明局限于以下示例。
实施例1:检测本发明中的单核苷酸多态性位点rs4149187,rs2239675和rs2239676。
本发明涉及到MGST1基因的rs4149187,rs2239675和rs2239676单核苷酸多态性位点。检测位点的方法介绍如下:
可用软件Primer3(http://frodo.wi.mit.edu/cgi-bin/primer3/primer3)设计一些特异性引物用于查找相关区域的多态性位点。用BLASTTM程序(National Center for BiotechnologyInformation-http://www.ncbi.nlm.nih.gov/BLAST)检测所设计的引物相对于人类基因组序列的特异性。不论是正向还是反向引物,只有当它们在BLAST程序的特定条件下所找到的相似性序列少于5条时才会被认为是特异性的并被采纳。
用
Gold聚合酶试剂盒(Applied Biosystems,CA,美国)和
Gradient热循环仪(Eppendorf,Hamburg,德国)进行聚合酶链式反应(PCR)。聚合酶链式反应总体积为20微升,包括1.5mM镁离子,200μM四种碱基,每条引物各0.3μM,模板基因组DNA 10ng,和0.5U的聚合酶。首先用呈梯度温度变化的聚合酶链式反应来为每一对引物寻找最合适的退火温度。表2列出了一对引物序列的例子及其退火温度。聚合酶链式反应程序为:95度10分钟(1个循环),接着进行45个循环的94度30秒,60度30秒和72度30秒。最后为72度延伸2分钟。产物用1.5%的琼脂糖凝胶电泳并用溴化乙锭染色进行分析确认为所需长度,然后将扩增产物用MultiScreen
TMPCR
96纯化试剂盒(Millipore Corporation,Bedford,美国)纯化除去剩余的反应物。
表2:检测单核苷酸多态性位点rs4149187,rs2239675和rs2239676基因型的引物与其最佳退火温度。
引物名称 |
序列(5’端到3’端) |
退火温度 |
SEQ ID NO:2 |
AGGAAGTAGACCTTGCAACACG |
60℃ |
SEQ ID NO:3 |
GCACGGGGACAGAAATACAA |
|
我们采用对PCR产物的双链分别测序的方法来查找感兴趣区域的单核苷酸多态性位点。采用的试剂盒为
Terminator v3.0 Cycle Sequencing Kit(Applied Biosystems,CA,USA)。采用的测序仪器为
3100Genetic Analyzer(Applied Biosystems,CA,USA).每一个样本至少测序两次。
将测序结果输入到BioEdit软件中作序列比对与分析,以此确定单核苷酸多态性位点。
实施例2:检测人类MGST1基因上与乳癌相关的单核苷酸多态性位点
此范例描述了一个用于检测并确定上文所述的一个或几个单核苷酸多态性位点的方法。人类的MGST1基因的部分目标区域将用作模板来合成PCR产物。表3列出了特异性引物,每对可分别用于扩增特定目标区域。
表3:用于MGST1基因的PCR和DNA测序的引物
单核苷酸多态性位点名称 |
正向引物 |
反向引物 |
测序引物 |
最佳退火温度 |
rs4149187 |
AGGAAGTAGACCTTGCAACACG(SEQ ID NO:2) |
GCACGGGGACAGAAATACAA(SEQID NO:3) |
SEQIDNO:2 |
60℃ |
rs2239675 |
AGGAAGTAGACCTTGCAACACG(SEQ ID NO:2) |
GCACGGGGACAGAAATACAA(SEQID NO:3) |
SEQIDNO:2 |
60℃ |
rs2239676 |
AGGAAGTAGACCTTGCAACACG(SEQ ID NO:2) |
GCACGGGGACAGAAATACAA(SEQID NO:3) |
SEQIDNO:3 |
60℃ |
含有单核苷酸多态性位点片段的PCR扩增与扩增产物的测序
以下试剂用于PCR扩增感兴趣的片段:1.5mM镁离子,200μM四种碱基,每条引物各0.3μM,模板基因组DNA 10ng,和0.5U的聚合酶,聚合酶链式反应总体积为20微升。
聚合酶链式反应使用Gradient热循环仪(Eppendorf,Hamburg,德国)按以下步骤进行:95度10分钟(1个循环),接着进行45个循环的94度30秒,55到60度30秒和72度30秒。最后为72度延伸2分钟。
PCR扩增产物用MultiScreen
TMPCR
96纯化试剂盒(Millipore Corporation,Bedford,美国)纯化后直接用
Terminator v3.0Cycle Sequencing Kit(Applied Biosystems,CA,USA)试剂盒测序。测序反应条件为96度1分钟(1个循环),接着进行25个循环的96度10秒,50度5秒和60度4分钟。
测序产物用含有DNA纯级别Sephadex
TMG-50的AutoSeq96
TMPlates平板(AmershamPharmaciaBiotech,Inc,USA)纯化。纯化产物经加入5μl Hi-Di Formamide(Applied Biosystems,CA,USA)95摄氏度变性。变性的测序产物用ABI公司提供的方法在
3100Genetic Analyzer(Applied Biosystems,CA,USA)测序仪上分析。将测序结果输入到BioEdit软件中作序列比对与分析。
表4列出了用此方法的测序统计结果。表格分别列出了在基因型水平上正常人与乳癌病人在多个单核苷酸多态性位点上的序列情况。
表4:在MGST1基因中与乳癌相关的单核苷酸多态性的表格
SNP |
基因型 |
对照组 |
乳癌组 |
rs4149187 |
g/g+c/c |
177 |
136 |
|
g/c |
120 |
155 |
|
|
|
|
rs2239675 |
g/g+a/a |
160 |
133 |
|
g/a |
132 |
158 |
|
|
|
|
rs2239676 |
g/g+c/c |
159 |
136 |
|
g/c |
128 |
155 |
虽然以上只介绍了一种检测与乳癌有关联的多态性位点的方法,任何熟知此方面工作的人都知道可以使用其它方法达到此目的。比方说,设计等位基因特异性探针,等位基因特异性引物延伸反应,或者使用单碱基延伸反应来检测。
实施例3:检测MGST1基因单核苷酸多态性位点rs4149187,rs2239675和rs2239676的试剂盒
此范例描述了一个试剂盒,该试剂盒用于检测并确定上文所述的一个或几个单核苷酸多态性位点的序列,从而得到被测个体的基因型。检测结果可运用于对该个体对乳癌的易感性作出预测。
该试剂盒包含以下引物:SEQ ID NO:1,SEQ ID NO:2和SED ID NO:3。该试剂盒还包含以下试剂用于PCR扩增MGST1基因的片段:1.5mM镁离子,200μM四种碱基,阳性对照人类模板基因组DNA,和聚合酶。运用试剂盒时,聚合酶链式反应总体积为20微升,聚合酶链式反应使用热循环仪按以下步骤进行:95度10分钟(1个循环),接着进行45个循环的94度30秒,55到60度30秒和72度30秒。最后为72度延伸2分钟。
PCR扩增产物可用测序等方法来确定单核苷酸多态性位点rs4149187,rs2239675和rs2239676的序列。