检测杂合性BRCA1/2基因缺失的方法及所用引物
技术领域
本发明属于分子生物学领域,尤其是涉及一种基于二代测序检测基因缺失突变的方法。
背景技术
乳腺癌是目前全世界范围内发病率快速增长的癌症。WHO发布的乳腺癌世界地理图谱中,每10万人口发病数为:澳大利亚(83/10万)、美国、加拿大(82/10万)、欧洲(70/10万)。其次为南美国家(65/10万)、东欧(49/10万)、北非、南非、日本、以色列和阿拉伯均为(28/10万),而中非、亚洲发病率最低(16-19/10万)。
乳腺癌在女性癌症中发病率占第一位,在所有的女性癌症中占1/4以上,欧美人每7-9位女性一生中要有一位发生乳腺癌。携带有乳腺癌BRCA1致病基因的女性,70岁时患乳腺癌的机率高达80%以上;美国病理与遗传学会就明确建议每个女性都应检测BRCA1/2基因。
乳腺癌BRCA1基因定位于人类染色体17q21,共有24个外显子(其中有22个编码外显子),实际长达81kb的染色体区间。其中第10个显子特别长,达3.4kb,BRCA1编码的全部1863个氨基酸中,第10外显子编码了61%的氨基酸,所以对外显子10的研究文献众多。关于BRCA1基因突变BRCA1突变主要位于第10外显子,占全基因突变率2/3,它分为ABCD4个区,生物学上共分框移(插入),框移(缺失),错义、无义、剪切、多态,未分类,同义等9种突变亚型,医学上将其聚类为三种医学意义的突变类型,第一类为有害突变,以框移,剪切为主;第二类为可疑致病突变,它们占了突变率的大多数,表现为错义突变,无义突变,内含子大碱基(3bp)变化,还有部分单氨基酸缺失的突变。第三类为大量的未明意义的突变,以同义、多态和非编码突变、沉默突变为主,以及距外显子40bp左右的内含子突变。
乳腺癌BRCA2基因位于13号.染色体长臂12-13区,mRNA长约11kb,编码区10987bp,共有27个外显子,其中第10和第11号外显子特别长,分别为1kb和5kb。
如果BRCA1/2基因的结构发生了某些改变,那么它所具有的抑制肿瘤发生的功能就会受影响。2013年已发现的BRCA1/2的突变有数百种之多。BRCA1及BRCA2是最重要的两个乳腺肿瘤抑制基因。在调节人体细胞的复制、遗传物质DNA损伤修复、细胞的正常生长方面有重要作用。如果BRCA1和/或BRCA2发生了突变,那么它所具有的抑制肿瘤发生的功能就会受影响,拥有这个基因的家族则具有高乳腺癌发生率的倾向.研究显示有BRCA1基因突变者,患乳腺癌和卵巢癌的风险分别是50%-85%和15%-45%,有BRCA2基因突变者,患乳腺癌和卵巢癌的风险分别是50%-85%和10%-20%。除此之外,也更易患其它癌症,如前列腺癌(男性)、胰脏癌和大肠癌。通过对BRCA1/2的检测,可以反映出乳腺癌的发生发展,也可对乳腺癌、卵巢癌及其他相关恶性肿瘤的高危人群进行有效的筛检,利于该类疾病的早期发现以便及早干预、诊断以及治疗。BRCA1/2基因为显性遗传,只要发生杂合型的突变,就会导致乳腺癌的发生,因此,做基因检测时,需要对杂合性的缺失也进行检测。而传统的高通量测序,由于在文库构建时,需要用到PCR扩增,就会导致严重或者微小的扩增偏倚,导致难以准确检测杂合性缺失。
发明内容
本发明要解决的技术问题是提供一种利用二代测序技术,针对BRCA1/2基因进行检测,并且能对杂合型的BRCA1/2基因大片段缺失进行检测;从而找到BRCA1/2疾病的高危人群。
为了解决上述技术问题,本发明提供的技术方案是:
对BRCA1/2基因的编码蛋白的外显子区域设计产物为370-400bp的特异性引物,每对特异性引物至少有20bp的重叠区,在特异性引物的5’端,设计一段通用序列(uniseq)以及5个连续的N碱基,称为标签,这样正向和反向各有5个随机的碱基N,总共10个N;uniseqF通用序列为:CTACACGACGCTCTTCCGATCT;uniseqR通用序列为GAGTTCCTTGGCACCCGAGAATTC。所有序列都进行锁核酸修饰,引物在life公司(原英俊公司)合成,结构中β-D-呋喃核糖的2'-O、4'-C位通过缩水作用形成刚性结构,从而实现锁核酸修饰;序列如表1所示:
表1、BRCA1/2基因的共49个外显子的引物序列
备注说明:uniseqF/uniseqR是用于二代测序,是测序引物结合区,正反向各5个NNNNN才是标签,因此本发明的标签是10个碱基。N在分子生物学中是代表A、G、C、T中的任意一个碱基,所以5个NNNNN的排列组合就是4的5次方,10个N,就有4的10次方的组合。
本发明的具体使用方法如下:
1.将以上的特异性引物与基因组DNA进行扩增,设置两个PCR循环;将5个N和通用引物序列引入到DNA链中;体系和条件如下:
模板(200ng) |
4.5ul |
2X多重PCR酶混合液 |
12.5ul |
引物混合液(10pM) |
8ul |
总体积 |
25ul |
备注说明:上述引物混合液包含表1中的所有引物,每对引物的浓度均为10pM。
将PCR反应管放于PCR仪上,运行下表所示程序:
步骤1 |
94℃ |
5分钟 |
步骤2 |
94℃ |
20秒 |
步骤3 |
60℃ |
30秒 |
步骤4 |
72℃ |
2分钟 |
步骤5 |
|
重复步骤2~步骤4,共2循环 |
步骤6 |
4℃ |
保存 |
2.按照Beckman的纯化磁珠的标准纯化步骤进行纯化,除去多余的PCR引物,然后利用两端的通用引物进行PCR扩增,条件如下:
第1步的产物 |
4.5ul |
2X酶混合液 |
12.5ul |
引物F和引物R(10pM) |
各1ul |
总体积 |
25ul |
引物F:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCTACACGACGCTCTTCCGATCT。
下划线部分正好与uniseqF一样,用于第二轮的扩增;同时引入一个测序接头。
引物R:
CAAGCAGAAGACGGCATACGAGATGAGTTCCTTGGCACCCGAGAATTC。
下划线部分正好与uniseqR一样,用于第二轮的扩增;同时引入一个测序接头。
将PCR反应管放于PCR仪上,运行下表所示程序:
步骤1 |
94℃ |
5分钟 |
步骤2 |
94℃ |
20秒 |
步骤3 |
60℃ |
30秒 |
步骤4 |
72℃ |
1分钟 |
步骤5 |
|
重复步骤2~步骤4,共30循环 |
步骤6 |
4℃ |
保存 |
进行高通量测序,测序数据与BRCA1/2参考序列(BRCA2:http://www.ncbi.nlm.nih.gov/nuccore/NM_000059.3,BRCA1:http://www.ncbi.nlm.nih.gov/nuccore/NM_007294.3)比对,对于比对上的序列统计正反向总共10个N碱基的序列,对具有相同标签(即10个碱基序列完全相同的)的序列视为一条,最后统计序列数。
本发明的原理如图1所示。
最终统计某外显子的标签数,通过该标签数来反应原始模板量。
3、结果判断规则,将未知样本的相对标签数(相对标签数=该外显子标签数/平均标签数)与阴性样本(即,已知没有BRCA1/2突变,无乳腺癌的健康人样本)的相对标签数进行比较,并判断:等于0的,为纯合型缺失,大于0且低于(≤)1/2的为杂合型缺失,高于1/2低于(≤)0.8的为疑似杂合型缺失,不容易判断,需要进一步验证。大于0.8的为正常。
本发明的关键优势:
对于人类基因组DNA,100ng的量约含15000个拷贝,而某个基因,在正常人中都会有两个拷贝,分别一个来自父方,一个来自母方,而当某些病变情况下,其中一方的发生了缺失或重复,就会导致拷贝数发生变化,杂合型缺失情况下就会变成7500个拷贝,杂合型重复的情况下就会变成22500个拷贝。而传统的二代测序都是基于PCR扩增,而PCR扩增是非线性的,20几个循环的扩增将会破坏线性关系,导致终产物的拷贝数没有差别。而传统二代测序的分析也只统计终产物的测序深度,因此,就不能对杂合型缺失进行判断。
而本发明最重要的一点是引物标签技术,正反向引物各加5个N碱基,就能产生4的10次方的标签数量,约100万种标签。利用这100万不同的标签去结合15000个拷贝的模板,通过概率计算,2个模板具有相同标签的概率为1万亿分之一,并且后续PCR扩增,只是将相同的标签扩增出,不会引入新的标签,因此标签的总数量,与模板的拷贝数相关,并且在一开始时就确定了,不会随着PCR循环数的变化而变化。模板的拷贝数越多,检测到的标签数量就会越多。同时本发明还包括一系列的数据比对与标签归一化处理等技术,从而能对杂合型缺失进行精确检测。
本发明中所用到的试剂的货号及供应商:
1.引物:上海英潍捷基(现被thermo fisher收购)贸易有限公司;
2.血液DNA提取试剂盒:Qiagen DNeasy Blood Tissue Kit试剂盒(德国快而精公司,货号69506)
3.2X多重PCR酶混合液:天根生化科技(北京)有限公司货号:KT109
4.PCR产物纯化磁珠:美国Beckman Coulter,公司,货号A63880
综上所述,本发明是基于二代测序,利用本发明的方法,可以检测纯合型、杂合型的缺失,从而可以有效的检测BRCA1/2的潜在病患人群,从而可以通过切除乳房等方法来避免乳腺癌的发生。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细说明。
图1为本发明的原理图。
具体实施方式
实施例1、应用本发明,对1例经验证为BRCA1突变的乳腺癌患者,1例经验证为正常人的BRCA1/2基因进行检测。
一、实验方法与步骤
1.BRCA1/2阳性样本获得:经过某医院确诊的乳腺癌病人,EDTA抗凝取血2ml。用Qiagen DNeasy Blood Tissue Kit试剂盒(德国快而精公司,货号69506)进行血液中的基因组DNA提取,Nanodrop测浓度为50ng/ul。同时该样本已利用上海基康生物公司的MLPA法验证仅为BRCA1的11号外显子缺失。
2.从NCBI数据中获得BRCA1/2基因每个外显子的序列,然后设计引物(可利用primer5软件),引物见表1,引物委托英潍捷基(上海)贸易有限公司合成,HPLC纯化。
3.将以上的特异性引物混合后对基因组DNA进行扩增,设置两个PCR循环,将5个N和通用引物序列引入到DNA链中;体系和条件如下:
5个N的引物,其实就是有4^5=1024种排列组合。
模板(200ng)+水 |
4.5ul |
2X多重PCR酶混合液 |
12.5ul |
引物混合液(10pM) |
8ul |
总体积 |
25ul |
将PCR反应管放于PCR仪上,运行下表所示程序:
步骤1 |
94℃ |
5分钟 |
步骤2 |
94℃ |
20秒 |
步骤3 |
60℃ |
30秒 |
步骤4 |
72℃ |
2分钟 |
步骤5 |
|
重复步骤2~步骤4,共2循环 |
步骤6 |
4℃ |
保存 |
4.按照Beckman的纯化磁珠的标准纯化步骤进行纯化,除去多余的PCR引物,然后利用两端的通用引物进行PCR扩增,通用引物的序列如下:
引物F:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCTACACGACGCTCTTCCGATCT
下划线部分正好与uniseqF一样,用于第二轮的扩增;同时引入一个测序接头。
引物R:
CAAGCAGAAGACGGCATACGAGATGAGTTCCTTGGCACCCGAGAATTC
下划线部分正好与uniseqR一样,用于第二轮的扩增;同时引入一个测序接头。
扩增条件如下:
第3步的产物 |
4.5ul |
2X酶混合液 |
12.5ul |
引物F和引物R(10pM) |
各1ul |
总体积 |
25ul |
将PCR反应管放于PCR仪上,运行下表所示程序:
步骤1 |
94℃ |
5分钟 |
步骤2 |
94℃ |
20秒 |
步骤3 |
60℃ |
30秒 |
步骤4 |
72℃ |
1分钟 |
步骤5 |
|
重复步骤2~步骤4,共30循环 |
步骤6 |
4℃ |
保存 |
5.按照Beckman的纯化磁珠的标准纯化步骤进行纯化。
6.按标准流程进行Illumina上机,每PCR产物至少1000X测序深度。
对Illumina Miseq测序仪产生的原始数据,进行数据分析,采用BWA与参考基因组进行比对。并统计每个扩增子正反向的标签数量,十个碱基相同的标签视为一个标签。结果如表2所示。
表2.测序后2个样本每个外显子的标签数量
结果判断规则,将未知样本的相对标签数(相对标签数=该外显子标签数/平均标签数)与阴性样本的相对标签数进行比较,并判断:等于0的,为纯合型缺失,大于0且低于(≤)1/2的为杂合型缺失,高于1/2低于(≤)0.8的为疑似杂合型缺失,不容易判断,需要进一步验证。大于0.8的为正常。
举例如下:
如BRCA1第11号外显子:患者BRCA1_ex11的相对标签数为137/306=0.45,对照BRCA1_ex11的相对标签数为267/265=1,患者/对照ex11的相对标签数的比值为0.45/1=0.45,大于0小于0.5,即为杂合型缺失。
又如9号外显子:患者BRCA1_ex9的相对标签数为199/306=0.65,对照BRCA1_ex9的相对标签数为185/265=0.70,患者/对照ex19的相对标签数的比值为0.65/0.70=0.93,所以为正常。
结果与临床资料和MLPA法测定结果完全一致。
对比实施例1:利用传统的PCR加二代测序方法对1例乳腺癌病人,以及1例正常女性的BRCA1/2基因进行检测。
实验方法与步骤:
1.BRCA1/2样本获得:与实施例1完全相同。
2.从NCBI数据中获得BRCA1/2基因每个外显子的序列,然后利用primer5软件设计引物,引物见表1,然后引物委托英潍捷基(上海)贸易有限公司合成,HPLC纯化。
3.将以上的特异性引物混合后对基因组DNA进行扩增,与实例1不同的是,此次不增加5个N的标签,而是只加一段通用引物序列引入到DNA链中;体系和条件如下:
模板(200ng)+水 |
4.5ul |
2X多重PCR酶混合液 |
12.5ul |
引物混合液(10pM) |
8ul |
总体积 |
25ul |
将PCR反应管放于PCR仪上,运行下表所示程序:
步骤1 |
94℃ |
5分钟 |
步骤2 |
94℃ |
20秒 |
步骤3 |
60℃ |
30秒 |
步骤4 |
72℃ |
2分钟 |
步骤5 |
|
重复步骤2~步骤4,共2循环 |
步骤6 |
4℃ |
保存 |
其他步骤与实施例1中的4,5,6步骤完成相等同。
对Illumina Miseq测序仪产生的原始数据,进行数据分析,采用BWA与参考基因组进行比对。由于没有标签,所以只能统计测序终产物的序列总数,如表3所示:但由于PCR的效率不同,导致各扩增子之间的效率差异较大,不能将BRCA1/2携带者杂合型的11号外显子缺失找出来。
表3:对比实例的测序产物统计结果
本发明的创新之处在于设计了带有标签的扩增引物,并且在测序结束后,统计标签的数量,而标签的数量跟模板数是直接相关的,随后的PCR扩增,只能对序列进行扩增,却不能增加标签数,因此,可以有效避免PCR的非线性扩增导致的偏倚。传统的MLPA法,只能检测重复缺失,不能检测点突变,而传统PCR加二代测序方法通过只能检测突变和纯合性大片段缺失。而本发明则既可以检测点突变,也可以检测杂合型大片段缺失。这在临床检测中具有非常重要的意义,特别是对显性遗传疾病。而对隐性遗传病也可以用本方法检测可能的携带者。
为了验证本发明方法的通用性,发明人进行了大量的验证实验,结果证明以下判断规则完全正确:
结果判断规则,将未知样本的相对标签数(相对标签数=该外显子标签数/平均标签数)与阴性样本的相对标签数进行比较,并判断:等于0的,为纯合型缺失,大于0且低于(≤)1/2的为杂合型缺失,高于1/2低于(≤)0.8的为疑似杂合型缺失,不容易判断,需要进一步验证。大于0.8的为正常。
最后,还需要注意的是,以上列举的仅是本发明的若干个具体实施例。显然,本发明不限于以上实施例,还可以有许多变形。本领域的普通技术人员能从本发明公开的内容直接导出或联想到的所有变形,如其他基于标签技术的二代测序应用,均应认为是本发明的保护范围。