DNA标签、PCR引物及其应用
技术领域
本发明涉及核酸测序及分型技术领域,具体地,涉及DNA标签、PCR引物及其应用,更具体地,涉及一组DNA标签、一组PCR引物、构建核酸测序文库的方法、确定DNA样品耳聋基因是否存在突变的方法、用于确定DNA样品耳聋基因是否存在突变的试剂盒以及确定DNA样品耳聋基因是否存在突变的系统。
背景技术
耳聋是一种严重影响生活质量和交流的常见疾病。根据2006年第二次全国残疾人抽样调查,我国残疾人群8296万,其中听力残疾人群2780万,7岁以下的聋哑儿童高达80万,并以每年新生3万聋儿的速度增长。婴幼儿聋病发生60%-70%是由遗传因素导致的。迄今为止,与非综合征型耳聋相关的40个常染色体隐性遗传基因,27个常染色体显性遗传基因,3个X连锁遗传基因,2个线粒体遗传基因已经被克隆。而每个基因中又有数目众多的耳聋致病突变位点,其中以GJB2、SLC26A4和12S rRNA的突变最为常见,其它基因所占比例较小。
国内研究人员也针对中国人群耳聋的突变类型进行了大规模的流行病学调查。根据近几年的分子流行病学调查,上述3个基因和GJB3的突变比例高达40%。
耳聋早期检测的意义:第一时间发现聋病易感基因携带者及迟发型听力损失高危儿,做到早发现早干预;辅助耳聋病因诊断;检测出药物性耳聋基因携带者,指导抗生素的应用,避免药物性耳聋的发生;进行流行病学调查。因此耳聋突变基因的早发现对于聋病的预防和治疗具有重要意义。
目前传统的耳聋基因检测方法包括单链构象多态性(PCR-SSCP),限制性片段长度多态(PCR-RFLP),变性高效液相色谱分析(DHPLC),直接测序,基因芯片、飞行时间质谱检测技术等方法。这些检测方法存在较多局限性,或者检测能力低、或者通量低耗时费力、所需设备和耗材昂贵,更重要的是,这些方法除基因芯片的方法,难以同时将不同基因的多个突变位点进行高通量的检测,然而基因芯片的平台价钱昂贵,对仪器和人员的素质要求较高,难以在我国广大医疗机构中普及。
并且上文描述的那些检测方法,通量都较低。当对大规模的样品进行耳聋基因检测时,应用上述方法是耗时耗力的,并且成本高昂。因此,本领域迫切需要新的高通量、低成本的耳聋基因检测方法,以实现快速检测和规模化人群检测。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于提出一种能够高通量、低成本、快速高效地对DNA样品尤其是多个DNA样品进行耳聋基因突变检测的方法。
因而,根据本发明的一个方面,本发明提供了一组DNA标签。根据本发明实施例的一组DNA标签,其选自SEQ ID NO:1-95所示的核苷酸。本发明的一组DNA标签能够用于构建核酸测序文库,以精确地对核酸测序文库进行区分。利用上述DNA标签(在本文中有时也称为“核酸标签”),通过将DNA标签与DNA或其等同物相连,可以精确地表征DNA的样品来源。由此,利用上述DNA标签,可以同时构建多种DNA样品的用于测序的核酸测序文库(在本文中,有时也称为DNA标签文库),从而可以通过将来源于不同样品的核酸测序文库进行混合,同时进行测序,基于DNA标签对获得的测序序列进行分类,获得多种DNA样品的序列信息。从而可以充分利用高通量的测序技术,例如利用Solexa测序技术,同时对多种DNA进行测序,从而提高DNA测序的效率和通量。
根据本发明的另一方面,本发明还提供了一组PCR引物。根据本发明实施例的一组PCR引物,其选自SEQ ID NO:96-119所示的核苷酸。本发明的一组PCR引物分别与耳聋基因GJB2、GJB3、SLC26A4和12S rRNA特异相关,利用该组PCR引物将DNA样品进行多重PCR扩增,能够一步多重PCR扩增12个耳聋基因片段,经过测序即可快速获取其DNA序列,耳聋基因检测通量高,突变位点分辨能力和灵敏度好。
根据本发明的再一方面,本发明还提供了一组标签PCR引物。根据本发明实施例的一组标签PCR引物,其是通过将前面所述的一组DNA标签中的任意一种连接至前面所述的一组PCR引物的5’末端而获得的。因而,本发明的一组标签PCR引物,可以有95种形式,进而利用本发明的一组标签PCR引物最多可以一次对95种DNA样品进行耳聋基因的突变检测。
根据本发明的又一方面,本发明还提供了一种构建核酸测序文库的方法。根据本发明的实施例,该方法包括以下步骤:将DNA样品进行多重PCR扩增,以便获得PCR扩增产物,其中所述多重PCR扩增采用前面所述的一组标签PCR引物进行;以及纯化回收所述PCR扩增产物,所述PCR扩增产物构成所述核酸测序文库。利用该方法,能够有效地将根据本发明实施例的DNA标签引入到针对DNA样品所构建的用于确定DNA样品耳聋基因是否存在突变的核酸测序文库中,从而可以通过对核酸测序文库进行测序,获得DNA样品的核酸测序文库的序列信息以及DNA标签的序列信息,从而能够对多种DNA样品的核酸测序文库的序列信息的来源进行区分,进而能够有效确定所述多种DNA样品的每一种的核酸测序文库的序列信息,从而能够分别确定多种DNA样品耳聋基因是否存在突变,提高了耳聋基因突变检测的通量、效率和准确度。
根据本发明的实施例,所述构建核酸测序文库的方法进一步包括:将所述核酸测序文库依次进行末端修复、3’末端添加碱基A、连接测序接头以及纯化回收连接产物的步骤。
根据本发明的再一方面,本发明还提供了一种确定DNA样品耳聋基因是否存在突变的方法。根据本发明的实施例,该方法包括以下步骤:根据前面所述的构建核酸测序文库的方法,构建所述DNA样品的核酸测序文库;对所述核酸测序文库进行测序,以便确定所述DNA样品的核酸测序文库的序列信息;以及基于所述DNA样品的核酸测序文库的序列信息,确定所述DNA样品耳聋基因是否存在突变。基于该方法,能够有效地对DNA样品进行耳聋基因突变检测,确定所述DNA样品耳聋基因是否存在突变。
根据本发明实施例,所述耳聋基因为GJB2、GJB3、SLC26A4和12S rRNA的至少一种。
根据本发明的实施例,利用Solexa、SOLID、单分子和454测序平台的至少一种对所述核酸测序文库进行测序。由此,测序通量高,检测结果准确可靠。
根据本发明的实施例,基于所述DNA样品的核酸测序文库的序列信息,确定所述DNA样品耳聋基因是否存在突变,进一步包括:将所述DNA样品的核酸测序文库的序列信息与参考数据库进行比对;基于比对结果,确定所述DNA样品耳聋基因是否存在突变。根据本发明的一些具体示例,所述参考数据库为耳聋基因数据库,优选来自HGMD和http://deafnessvariationdatabase.com/。
根据本发明实施例,所述DNA样品为多种,所述多种为2-95种,所述方法包括以下步骤:针对所述多种DNA样品的每一种,分别独立地根据前面所述的方法构建所述DNA样品的核酸测序文库,其中,不同的DNA样品采用相互不同的DNA标签;将所述多种DNA样品的核酸测序文库进行混合,以便获得核酸测序文库混合物;对所述核酸测序文库混合物进行测序,以便获得所述多种DNA样品的核酸测序文库的序列信息以及所述DNA标签的序列信息;基于所述DNA标签的序列信息对所述多种DNA样品的核酸测序文库的序列信息进行分类,以便确定所述多种DNA样品的每一种的核酸测序文库的序列信息;以及基于所述多种DNA样品的每一种的核酸测序文库的序列信息,分别确定所述多种DNA样品耳聋基因是否存在突变。由此,能够同时构建多种DNA样品的用于耳聋基因突变检测的核酸测序文库,从而可以通过将来源于不同样品的核酸测序文库进行混合,同时进行测序,基于DNA标签对DNA样品的核酸测序文库的序列信息进行分类,获得多种DNA样品的核酸测序文库的序列信息。从而可以充分利用Solexa、SOLID、单分子和454测序平台的至少一种,同时对多种DNA进行测序和耳聋基因突变检测,从而提高了检测的效率和通量。
根据本发明的实施例,基于所述多种DNA样品的每一种的核酸测序文库的序列信息,分别确定所述多种DNA样品耳聋基因是否存在突变,进一步包括:将所述多种DNA样品的每一种的核酸测序文库的序列信息,分别与参考数据库进行比对;基于比对结果,分别确定所述多种DNA样品耳聋基因是否存在突变。根据本发明的一些具体示例,所述参考数据库为耳聋基因数据库,优选来自HGMD和http://deafnessvariationdatabase.com/。
根据本发明的另一方面,本发明还提供了一种用于确定DNA样品耳聋基因是否存在突变的试剂盒。根据本发明实施例的试剂盒,其包括:一组DNA标签,所述DNA标签选自SEQID NO:1-95所示的核苷酸;以及一组PCR引物,所述PCR引物选自SEQ ID NO:96-119所示的核苷酸。由此,利用该试剂盒,能够方便地利用本发明的DNA标签和PCR引物构建标签PCR引物,进而利用标签PCR引物,根据本发明的确定多种DNA样品耳聋基因是否存在突变的方法,一次性最多能够实现95种DNA样品的耳聋基因突变检测。
根据本发明实施例,所述耳聋基因为GJB2、GJB3、SLC26A4和12S rRNA的至少一种。
根据本发明的再一方面,本发明还提供了一种用于确定DNA样品耳聋基因是否存在突变的试剂盒。根据本发明实施例,所述试剂盒设置有前面所述的一组标签PCR引物。由此,利用该试剂盒,能够方便地利用本发明的DNA标签和PCR引物构建标签PCR引物,进而利用标签PCR引物,根据本发明的确定多种DNA样品耳聋基因是否存在突变的方法,一次性最多能够实现95种DNA样品的耳聋基因突变检测。
根据本发明实施例,所述耳聋基因为GJB2、GJB3、SLC26A4和12S rRNA的至少一种。
根据本发明的又一方面,本发明还提供了一种确定DNA样品耳聋基因是否存在突变的系统。根据本发明实施例,该系统包括:文库构建装置,所述文库构建装置用于根据前面所述的方法构建所述DNA样品的核酸测序文库:测序装置,所述测序装置与所述文库构建装置相连,用于对所述核酸测序文库进行测序,以便获得测序结果;分析装置,所述分析装置与所述测序装置相连,用于基于所述测序结果确定所述DNA样品耳聋基因是否存在突变,其中,所述测序结果包括所述DNA样品耳聋基因的序列信息。
根据本发明实施例,所述耳聋基因为GJB2、GJB3、SLC26A4和12S rRNA的至少一种。
根据本发明实施例,所述分析装置进一步包括比对单元,所述比对单元中设置有参考数据库,用于:将所述DNA样品的核酸测序文库的序列信息与参考数据库进行比对;基于比对结果,确定所述DNA样品耳聋基因是否存在突变。由此,可以准确、高效的获得突变位点,进而精确的判断DNA样品耳聋基因是否存在突变。
根据本发明实施例,当所述DNA样品为多种,所述多种为2-95种时,所述文库构建装置用于针对所述多种DNA样品的每一种,分别独立地根据前面所述的方法构建所述DNA样品的核酸测序文库,并将所述多种DNA样品的核酸测序文库进行混合,以便获得核酸测序文库混合物,其中,不同的DNA样品采用相互不同的DNA标签;所述测序装置用于对所述核酸测序文库混合物进行测序,以便获得测序结果,所述测序结果包括多种DNA样品的核酸测序文库的序列信息以及所述DNA标签的序列信息;以及所述分析装置用于基于所述DNA标签的序列信息对所述多种DNA样品的核酸测序文库的序列信息进行分类,以便确定所述多种DNA样品的每一种的核酸测序文库的序列信息,并基于所述多种DNA样品每一种核酸测序文库的序列信息,分别确定所述多种DNA样品耳聋基因是否存在突变。由此,利用该系统,能够同时构建多种DNA样品的用于耳聋基因突变检测的核酸测序文库,从而可以通过将来源于不同样品的核酸测序文库进行混合,同时进行测序,基于DNA标签对DNA样品的核酸测序文库的序列信息进行分类,获得多种DNA样品的核酸测序文库的序列信息。从而可以充分利用高通量的测序技术,例如利用Solexa、SOLID、和454测序技术的至少一种,同时对多种DNA进行测序和耳聋基因突变检测,从而提高了检测的效率和通量。
根据本发明实施例,所述分析装置进一步包括比对单元,所述比对单元用于:将所述多种DNA样品的每一种的核酸测序文库的序列信息,分别与参考数据库进行比对;以及基于比对结果,分别确定所述多种DNA样品耳聋基因是否存在突变。由此,可以准确、高效的获得突变位点,进而精确的判断多种DNA样品耳聋基因是否存在突变。
附图说明
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
图1为根据本发明实施例的确定多种DNA样品耳聋基因是否存在突变的方法的流程示意图;
图2为根据本发明实施例的确定多种DNA样品耳聋基因是否存在突变的系统的结构示意图。
具体实施方式
下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
为了更好地理解本发明,下面提供相关术语的定义和解释。
如本文中所使用的,术语“PCR”是指聚合酶链式反应。
如本文中所使用的,术语“Solexa测序法”是指近几年开发的新一代DNA测序法,也称为第二代测序法。Solexa测序法与传统测序法(例如,Sanger测序法)的不同之处在于,其采用边合成边测序的原理进行DNA序列分析。Solexa测序法具有下述优点:1)成本低,仅为传统测序成本的1%;2)通量高,可以同时对多个样品进行测序,并且进行一次的Solexa测序法可以产生大约500亿(50G)个碱基的数据;3)准确性高(高于98.4%),有效的解决了多聚重复序列的读取问题。另一方面,高测序通量在进行测序的序列的数目确定的情况下,又反过来提高了序列的测序深度(例如,针对每个序列,可以进行多次测序),从而确保了测序结果的可靠性。如本文所使用的,术语“测序深度”是指一段DNA序列在测序数据中集中出现的次数。测序深度可以通过将测序量除以基因组长度来计算,例如测序深度为10,表示测了10次的整个基因组。
Solexa测序法的应用十分广泛。其可以用于基因组测序,基因分型,基因多态性研究等等。本发明的方法将Solexa测序法用于检测耳聋基因:通过对待分析的样品进行针对耳聋基因的的测序,然后使用本领域已知的比对程序,例如BLAST和SOAP,将所得的测序结果与耳聋基因数据库进行比对,从而实现对样品的耳聋基因突变检测。本文中使用的耳聋基因突变数据库包含本领域已知的耳聋基因突变位点及突变类型,所述突变位点和突变类型可见于例如公共数据库,例如HGMD和http://deafnessvariationdatabase.com/。
如本文中可互换使用的,术语“DNA标签”、“标签(index)”或“核酸标签”是指添加在PCR引物5’末端的一小段碱基序列,其通过PCR扩增可以用于标记PCR产物,从而辨别不同模板来源的PCR产物的混合物中各个PCR产物的模板来源。通过在引物的5’末端添加标签,可以对PCR产物进行标记,从而可以将多个不同的PCR产物混合成一个文库,用于进一步的分析和处理。文库中各个不同的PCR产物各自具有独特的标签,从而根据各个PCR产物中独特的标签,可以将各个不同的PCR产物互相区分开来,并将其与PCR模板一一对应。例如,当需要对多个样品进行测序时,可以在用于各个样品的引物的5’末端添加不同的标签,然后用添加了标签的引物分别对各个样品进行PCR反应,从而对各个样品(即,PCR产物)进行标记。PCR反应后,可以将来自各个样品的带有不同标签的PCR产物混合在一起组成一个文库,然后应用高通量的Solexa测序法同时对文库中的各个PCR产物进行测序。最终,在所得的测序数据中,通过独特的标签,可以将测序结果与各个PCR产物(样品模板)一一对应。
可以仅在用于PCR扩增的引物对的一条引物中引入标签,也可以在引物对的两条引物中都引入标签。当在引物对的两条引物中都引入标签时,每个PCR引物对与一对标签组合成一对标签引物,其中正向和反向PCR引物的5’端分别具有正向标签和反向标签,并且正反标签和正反引物序列是对应的,且正向标签和反向标签可以是相同的,或不同的。
设计标签时需要考虑多种因素,包括:1)标签序列中应当避免3个或3个以上的单碱基重复序列;2)所有标签的同一位点中碱基A和碱基C的总含量应在所有碱基含量的30%-70%之间,例如,当设计100条不同的标签序列时,每一条标签序列的第二个碱基(即所谓的同一位点)中A和C占该100条序列第二个碱基总量的30%-70%;3)标签序列本身的GC含量应在40-60%之间;4)标签之间的序列差异应大于4个碱基;5)标签序列中应避免出现与用于测序的引物相似度高的序列;6)当标签序列添加到PCR扩增引物上后,应避免PCR扩增引物形成发卡结构和二聚体等二级结构。
如本文中所使用的,术语“标签PCR引物”是指带有DNA标签的引物,其包含2个部分,标签部分和引物部分,其中标签部分用于在PCR扩增反应中标记PCR产物,而引物部分与模板碱基互补配对,用于扩增模板,并且其中标签部分,连接至引物部分的5’端。
根据本发明的一个方面,本发明提供了一组DNA标签。根据本发明实施例的一组DNA标签,其选自SEQ ID NO:1-95所示的核苷酸。具体序列如下表所示:
表1
标签编号 |
标签序列 |
SEQ ID NO: |
PI-1 |
CACATAC |
1 |
PI-2 |
TGTAGTC |
2 |
PI-3 |
TGCGCGA |
3 |
PI-4 |
ATGACTA |
4 |
PI-5 |
CATCATG |
5 |
PI-6 |
TCGTCTC |
6 |
PI-7 |
CGAGTGA |
7 |
PI-8 |
ATGTAGA |
8 |
PI-9 |
CATAGAC |
9 |
PI-10 |
GAGTAGA |
10 |
PI-11 |
CACTCTG |
11 |
PI-12 |
TAGAGAC |
12 |
PI-13 |
TGTGAGA |
13 |
PI-14 |
AGCATGA |
14 |
PI-15 |
AGTGCTA |
15 |
PI-16 |
TCGCAGA |
16 |
PI-17 |
AGTCATG |
17 |
PI-18 |
TCAGAGA |
18 |
PI-19 |
CGATCTA |
19 |
PI-20 |
GTAGAGA |
20 |
PI-21 |
GAGTATG |
21 |
PI-22 |
CTCGCTG |
22 |
PI-23 |
AGTCTGA |
23 |
PI-24 |
CTGTATG |
24 |
PI-25 |
CAGTATA |
25 |
PI-26 |
CTACGTA |
26 |
PI-27 |
GCTACAC |
27 |
PI-28 |
GTCTCTC |
28 |
PI-29 |
TACGTGA |
29 |
PI-30 |
CAGTGAC |
30 |
PI-31 |
GAGCGAC |
31 |
PI-32 |
TGCTCAC |
32 |
PI-33 |
GACGATA |
33 |
PI-34 |
ACGATGA |
34 |
PI-35 |
CAGACAC |
35 |
PI-36 |
GACTGAC |
36 |
PI-37 |
ACGATAC |
37 |
PI-38 |
TGCTAGA |
38 |
PI-39 |
CATGATA |
39 |
PI-40 |
CGTGCGA |
40 |
PI-41 |
ATATCGA |
41 |
PI-42 |
CACGCTA |
42 |
PI-43 |
CACGATG |
43 |
PI-44 |
GCACTAC |
44 |
PI-45 |
CACAGTA |
45 |
PI-46 |
CGACTAC |
46 |
PI-47 |
TGATATG |
47 |
PI-48 |
CTACAGA |
48 |
PI-49 |
CTGTGTA |
49 |
PI-50 |
ATCAGAC |
50 |
PI-51 |
CTCTATA |
51 |
PI-52 |
TGTCTAC |
52 |
PI-53 |
CAGACTA |
53 |
PI-54 |
CGTAGTA |
54 |
PI-55 |
TCGACAC |
55 |
PI-56 |
GAGAGTC |
56 |
PI-57 |
GAGCATC |
57 |
PI-58 |
GTACGTC |
58 |
PI-59 |
AGAGTAC |
59 |
PI-60 |
AGCGAGA |
60 |
PI-61 |
CGTATGA |
61 |
PI-62 |
CTCATGA |
62 |
PI-63 |
GCGTCTG |
63 |
PI-64 |
ACGAGTA |
64 |
PI-65 |
CGAGATA |
65 |
PI-66 |
AGTGATC |
66 |
PI-67 |
AGTACAC |
67 |
PI-68 |
GTAGATC |
68 |
PI-69 |
GCATATC |
69 |
PI-70 |
GCTCGTA |
70 |
PI-71 |
AGCTATC |
71 |
PI-72 |
ACTCATA |
72 |
PI-73 |
CTAGCGA |
73 |
PI-74 |
CATACTG |
74 |
PI-75 |
TACTATG |
75 |
PI-76 |
TCAGCTC |
76 |
PI-77 |
TATGATG |
77 |
PI-78 |
TCGAGTC |
78 |
PI-79 |
CGATATC |
79 |
PI-80 |
CACTATC |
80 |
PI-81 |
ATCGTGA |
81 |
PI-82 |
TCGTGAC |
82 |
PI-83 |
GTCACAC |
83 |
PI-84 |
GATCGTC |
84 |
PI-85 |
ATCTGTA |
85 |
PI-86 |
CTACGAC |
86 |
PI-87 |
GCAGATA |
87 |
PI-88 |
ATGCGAC |
88 |
PI-89 |
CGTGATG |
89 |
PI-90 |
GCTGTAC |
90 |
PI-91 |
AGACAGA |
91 |
PI-92 |
GCATCTA |
92 |
PI-93 |
TAGATGA |
93 |
PI-94 |
GATGCGA |
94 |
PI-95 |
ATACTGA |
95 |
本发明的一组DNA标签能够用于构建核酸测序文库,以精确地对核酸测序文库进行区分。利用上述DNA标签(在本文中有时也称为“核酸标签”),通过将DNA标签与DNA或其等同物相连,可以精确地表征DNA的样品来源。由此,利用上述DNA标签,可以同时构建多种DNA样品的用于测序的核酸测序文库(在本文中,有时也称为DNA标签文库),从而可以通过将来源于不同样品的核酸测序文库进行混合,同时进行测序,基于DNA标签对获得的测序序列进行分类,获得多种DNA样品的序列信息。从而可以充分利用高通量的测序技术,例如利用Solexa测序技术,同时对多种DNA进行测序,从而提高DNA测序的效率和通量。
根据本发明的另一方面,本发明还提供了一组PCR引物。根据本发明实施例的一组PCR引物,其选自SEQ ID NO:96-119所示的核苷酸。各突变基因及其突变位点,以及各突变位点对应的引物序列如表2所示:
表2
其中,F表示正向引物,R表示反向引物,相同编号的F与R一一对应,例如F1与R1、F12与R12分别为相应的正、反向引物。del表示缺失,>表示点突变,如G>A表示碱基G突变为A。
需要说明的是,发明人采用琼脂糖凝胶电泳和测序法对上述引物进行实验验证,即对扩增产物进行检测,验证了扩增序列的准确性,证明了本发明的PCR引物的可用性。
本发明的一组PCR引物是针对表2耳聋基因的突变区域的特异性引物,利用该组PCR引物将DNA样品进行多重PCR扩增,最多能够一步多重PCR扩增12个耳聋基因片段,其中PCR引物及其相应的扩增产物的序列如表2所示,经测序即可快速获取其DNA序列,耳聋基因检测通量高,突变位点分辨能力和灵敏度好。
并且,将本发明的一组PCR引物的5’末端连接上前面所述的DNA标签,即可获得标签PCR引物,从而利用该标签PCR引物,能够有效地将DNA标签引入到DNA或其等同物中,并且当针对相同的样品,采用不同的标签引物,构建含有各种DNA标签的核酸测序文库时,所得到的数据结果的稳定性和可重复性非常好。
因而,根据本发明的再一方面,本发明还提供了一组标签PCR引物。根据本发明实施例的一组标签PCR引物,其是通过将前面所述的一组DNA标签中的任意一种连接至前面所述的一组PCR引物的5’末端而获得的。因而,本发明的一组标签PCR引物(在本文中有时也称为“标签引物”),可以有95种形式,进而利用本发明的一组标签PCR引物最多可以一次对95种DNA样品进行耳聋基因的突变检测。
本发明的一组标签PCR引物组(在本文中有时也称为“标签引物组”),其包含24种标签引物,所述标签引物的序列包含标签序列和PCR引物序列,并且所述标签序列,任选地连接至所述PCR引物序列的5’端,其中所述标签序列选自SEQ ID NO:1-95的任意一种,且标签引物组中的24种标签引物的每一种的标签序列都相同,所述24种标签引物的PCR引物序列分别如表2的SEQ ID NO:96-119所示。
本发明的标签引物组可扩增出12种大约200bp的产物,其对应于耳聋基因的外显子区域的目的DNA序列。因此,本发明的标签引物组可用于耳聋基因突变检测。
在一个优选实施方案中,本发明的标签引物组可用于耳聋基因测序、检测,从而其可用于检测耳聋基因突变类型,以及构建耳聋基因突变数据库,研究耳聋基因突变类型分布的地域性特点和流行病学研究等。在另一个优选实施方案中,本发明的标签引物组可用于制备试剂盒,所述试剂盒可用于耳聋基因测序、检测。
此外,本发明的一组标签PCR引物还可以表现为标签引物套组的形式,即其包含至少10个,优选至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或95个上文描述的标签引物组。优选地,标签引物套组中,各个标签引物组所使用的标签序列互不相同。更优选,标签引物套组中所使用的标签序列至少包括SEQ ID NO:1-10,或SEQID NO:11-20,或SEQ ID NO:21-30,或SEQ ID NO:31-40,或SEQ ID NO:41-50,或SEQIDNO:51-60,或SEQ ID NO:61-70,或SEQ ID NO:71-80,或SEQ ID NO:81-90,或SEQ ID NO:91-95所示的标签序列,或者它们任何两个或者多个的组合,例如SEQID NO:1-95所示的标签序列。
根据本发明的另一方面,本发明还提供了一种用于确定DNA样品耳聋基因是否存在突变的试剂盒。根据本发明实施例的试剂盒,其包括:95种DNA标签,所述DNA标签选自SEQID NO:1-95所示的核苷酸;以及24种PCR引物,所述PCR引物选自SEQ ID NO:96-119所示的核苷酸。由此,利用该试剂盒,能够方便地利用本发明的DNA标签和PCR引物构建标签PCR引物,进而利用标签PCR引物,根据本发明的确定多种DNA样品耳聋基因是否存在突变的方法,最多能够一次性实现对95种DNA样品的耳聋基因突变检测。
根据本发明实施例,所述耳聋基因为GJB2、GJB3、SLC26A4和12SrRNA。
根据本发明的另一些实施例,本发明的试剂盒,其包含上文描述的标签引物组或标签引物套组。由此,本发明的试剂盒可用于高通量耳聋基因突变检测。
进而,本发明提供了用于对一个或多个样品进行耳聋基因突变检测的方法。所述方法包括使用上文描述的标签引物组或标签引物套组或试剂盒对各个样品的DNA进行扩增、构建测序文库,然后进行测序以获得样品的测序文库序列的步骤。具体地:
根据本发明的再一方面,本发明还提供了一种用于确定DNA样品耳聋基因是否存在突变的试剂盒。根据本发明实施例,所述试剂盒设置有前面所述的一组标签PCR引物。由此,利用该试剂盒,能够方便地利用本发明的DNA标签和PCR引物构建标签PCR引物,进而利用标签PCR引物,根据本发明的确定多种DNA样品耳聋基因是否存在突变的方法,一次性最多能够实现95种DNA样品的耳聋基因突变检测。
根据本发明实施例,所述耳聋基因为GJB2、GJB3、SLC26A4和12S rRNA的至少一种。根据本发明的又一方面,本发明还提供了一种构建核酸测序文库的方法。根据本发明的实施例,该方法包括以下步骤:将DNA样品进行多重PCR扩增,以便获得PCR扩增产物,其中所述多重PCR扩增采用前面所述的一组标签PCR引物进行;以及纯化回收所述PCR扩增产物,所述PCR扩增产物构成所述核酸测序文库。利用该方法,能够有效地将根据本发明实施例的DNA标签引入到针对DNA样品所构建的用于确定DNA样品耳聋基因是否存在突变的核酸测序文库中,从而可以通过对核酸测序文库进行测序,获得DNA样品的核酸测序文库的序列信息以及DNA标签的序列信息,从而能够对多种DNA样品的核酸测序文库的序列信息的来源进行区分,进而能够有效确定所述多种DNA样品的每一种的的核酸测序文库的序列信息,从而能够分别确定多种DNA样品耳聋基因是否存在突变,提高了耳聋基因突变检测的通量、效率和准确度。
根据本发明的实施例,所述构建核酸测序文库的方法进一步包括:将所述核酸测序文库依次进行末端修复、3’末端添加碱基A、连接测序接头以及纯化回收连接产物的步骤。
根据本发明的再一方面,本发明还提供了一种确定DNA样品耳聋基因是否存在突变的方法。
根据本发明的实施例,该方法包括以下步骤:根据前面所述的构建核酸测序文库的方法,构建所述DNA样品的核酸测序文库;对所述核酸测序文库进行测序,以便确定所述DNA样品的核酸测序文库的序列信息;以及基于所述DNA样品的核酸测序文库的序列信息,确定所述DNA样品耳聋基因是否存在突变。基于该方法,能够有效地对DNA样品进行耳聋基因突变检测,确定所述DNA样品耳聋基因是否存在突变。
根据本发明实施例,其中所述耳聋基因为GJB2、GJB3、SLC26A4和12S rRNA的至少一种。
根据本发明的实施例,利用Solexa、SOLID、单分子和454测序平台的至少一种对所述核酸测序文库进行测序。由此,测序通量高,检测结果准确可靠。
根据本发明的实施例,基于所述DNA样品的核酸测序文库的序列信息,确定所述DNA样品耳聋基因是否存在突变,进一步包括:将所述DNA样品的核酸测序文库的序列信息与参考数据库进行比对;基于比对结果,确定所述DNA样品耳聋基因是否存在突变。根据本发明的一些具体示例,所述参考数据库为耳聋基因数据库,优选来自HGMD和http://deafnessvariationdatabase.com/。
根据本发明的实施例,参照图1,当所述DNA样品为多种,所述多种为2-95种时,该方法包括以下步骤:
S100:针对多种DNA样品的每一种分别独立地构建核酸测序文库
针对所述多种DNA样品的每一种,分别独立地根据前面所述的构建核酸测序文库的方法构建所述DNA样品的核酸测序文库,其中,不同的DNA样品采用相互不同的DNA标签。
S200:将多种DNA样品的核酸测序文库进行混合
将所述多种DNA样品的核酸测序文库进行混合,以便获得核酸测序文库混合物。
S300:对核酸测序文库混合物进行测序
对所述核酸测序文库混合物进行测序,以便获得所述多种DNA样品的核酸测序文库的序列信息以及所述DNA标签的序列信息。
S400:对多种DNA样品的核酸测序文库的序列信息进行分类
基于所述DNA标签的序列信息对所述多种DNA样品的核酸测序文库的序列信息进行分类,以便确定所述多种DNA样品的每一种的核酸测序文库的序列信息。
S500:确定多种DNA样品耳聋基因是否存在突变
基于所述多种DNA样品的每一种的核酸测序文库的序列信息,分别确定所述多种DNA样品耳聋基因是否存在突变。根据本发明的实施例,基于所述多种DNA样品的每一种的核酸测序文库的序列信息,分别确定所述多种DNA样品耳聋基因是否存在突变,进一步包括:将所述多种DNA样品的每一种的核酸测序文库的序列信息,分别与参考数据库进行比对;基于比对结果,分别确定所述多种DNA样品耳聋基因是否存在突变。根据本发明的一些具体示例,所述参考数据库为耳聋基因数据库,优选来自HGMD和http://deafnessvariationdatabase.com/。
由此,能够同时构建多种DNA样品的用于耳聋基因突变检测的核酸测序文库,从而可以通过将来源于不同样品的核酸测序文库进行混合,同时进行测序,基于DNA标签对DNA样品的核酸测序文库的序列信息进行分类,获得多种DNA样品的核酸测序文库的序列信息。从而可以充分利用高通量的测序技术,例如利用Solexa、SOLID、和454测序平台的至少一种,同时对多种DNA进行测序和耳聋基因突变检测,从而提高了检测的效率和通量。
根据本发明的又一方面,本发明还提供了一种确定DNA样品耳聋基因是否存在突变的系统。发明人惊奇地发现,利用该系统,能够同时构建DNA样品的用于耳聋基因突变检测的核酸测序文库,从而可以通过将来源于不同样品的核酸测序文库进行混合,同时进行测序,基于DNA标签对DNA样品的核酸测序文库的序列信息进行分类,获得多种DNA样品的核酸测序文库的序列信息。从而可以充分利用高通量的测序技术,例如利用Solexa、SOLID、和454测序技术的至少一种,同时对多种DNA进行测序和耳聋基因突变检测,从而提高了检测的效率和通量。
根据本发明实施例,参照图2,该系统1000包括:文库构建装置100、测序装置200和分析装置300。具体地:
文库构建装置100,所述文库构建装置100用于根据前面所述的方法构建所述DNA样品的核酸测序文库:测序装置200,所述测序装置200与所述文库构建装置100相连,用于对所述核酸测序文库进行测序,以便获得测序结果;分析装置300,所述分析装置300与所述测序装置200相连,用于基于所述测序结果确定所述DNA样品耳聋基因是否存在突变,其中,所述测序结果包括所述DNA样品的核酸测序文库的序列信息。
根据本发明实施例,所述测序装置200为选自Solexa、SOLID、单分子和454测序平台的至少一种。由此,测序通量高,耳聋基因测序结果准确可靠。
根据本发明实施例,所述耳聋基因为GJB2、GJB3、SLC26A4和12S rRNA的至少一种。
根据本发明实施例,所述分析装置300进一步包括比对单元,所述比对单元中设置有参考数据库,用于:将所述DNA样品的核酸测序文库的序列信息与参考数据库进行比对;以及基于比对结果,确定所述DNA样品耳聋基因是否存在突变。由此,可以准确、高效的获得突变位点,进而精确的判断DNA样品耳聋基因是否存在突变。
根据本发明实施例,在该系统中,当所述DNA样品为多种,所述多种为2-95种时:
文库构建装置100用于针对所述多种DNA样品的每一种,分别独立地根据前面所述的方法构建所述DNA样品的核酸测序文库,并将所述多种DNA样品的核酸测序文库进行混合,以便获得核酸测序文库混合物,其中,不同的DNA样品采用相互不同的DNA标签。
测序装置200,用于对所述核酸测序文库混合物进行测序,以便获得所述测序结果,所述测序结果包括多种DNA样品的核酸测序文库的序列信息以及所述DNA标签的序列信息。
分析装置300,用于基于所述DNA标签的序列信息对所述多种DNA样品的核酸测序文库的序列信息进行分类,以便确定所述多种DNA样品的每一种的核酸测序文库的序列信息,并基于所述多种DNA样品每一种核酸测序文库的序列信息,分别确定所述多种DNA样品耳聋基因是否存在突变。
由此,利用该系统,能够同时构建多种DNA样品的用于耳聋基因突变检测的核酸测序文库,从而可以通过将来源于不同样品的核酸测序文库进行混合,同时进行测序,基于DNA标签对DNA样品的核酸测序文库的序列信息进行分类,获得多种DNA样品的核酸测序文库的序列信息。从而可以充分利用高通量的测序技术,例如利用Solexa、SOLID、和454测序技术的至少一种,同时对多种DNA进行测序和耳聋基因突变检测,从而提高了检测的效率和通量。
根据本发明实施例,所述分析装置进一步包括比对单元,所述比对单元用于:将所述多种DNA样品的每一种的核酸测序文库的序列信息,分别与参考数据库进行比对;以及基于比对结果,分别确定所述多种DNA样品耳聋基因是否存在突变。由此,可以准确、高效的获得突变位点,进而精确的判断多种DNA样品耳聋基因是否存在突变。
此外,需要说明的是,本发明的有益效果如下:
(1)本发明能够一步多重PCR扩增获得12个耳聋基因片段。
(2)该方法成功的将高通量测序技术与人类耳聋基因突变检测相结合,使得突变检测更加精确、通量高、测序成本大大降低(仅为常规测序法的1%),从而耳聋基因检测成本大大降低。
(3)高通量测序与多重PCR技术相结合,实现多个样本多个位点同时测定。
下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件(例如参考J.萨姆布鲁克等著,黄培堂等译的《分子克隆实验指南》,第三版,科学出版社)或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1
采用本发明的方法,对190份样品进行耳聋基因突变分型,具体步骤如下:
1、样品提取
用5%的chelex(chelex-100品牌@BIO-RAD)从190份已知飞行时间质谱检测结果的干血片中提取DNA。提取结束后,获得3mm直径的干血片提取产物,用作下一步PCR扩增中的模板。
2、PCR扩增
把步骤1中获得的190份DNA依次编号为1-190,并平均分为2组(HL-1组:编号1-95;HL-2组:编号96-190)。根据用于扩增耳聋基因的的引物组(包括12条正向引物和12条反向引物)的各条引物的序列(SEQ ID NO:96-119),设计一套标签,共95个(SEQ ID NO:1-95)。将设计的每一个标签分别添加至引物组的各条引物的序列的5’末端,从而获得95个标签引物组,其中每个标签引物组包括相应的12条正向标签引物和12条反向标签引物,并且不同的标签引物组使用不同的标签(即,95个标签引物组与95个标签一一对应)。
在96孔板中对所有样品进行PCR反应,共使用2块板(HL-1组和HL-2组各1块板)。使用步骤1中获得的DNA作为模板,并且在HL-1组和HL-2组中,针对每个样品,使用不同的标签引物组进行PCR扩增(即,95个样品与95个标签引物组一一对应)。记录下每一个标签引物组(每一个标签)对应的样品的编号信息,具体如表3所示:
表3标签与样品的相关信息
并且,每块板中还设置一个不添加模板的阴性对照。两块板中的阴性对照所用的引物分别与样品1、96所用的引物相同。
将步骤1获得的DNA作为模板与引物混合序列进行多重PCR,PCR反应体系见表4(所有试剂均购自TAKARA公司):
表4
PCR反应在Gene Amp PCR System 9700PCR仪上运行,使用下列PCR参数进行扩增:
94℃2分钟;
(94℃20秒→56℃30秒→72℃1分钟),35个循环;
72℃5分钟→12℃∞。
3、PCR产物的混合和纯化
把HL-1组和HL-2组中剩余的PCR产物分别混合在一个3ml的EP管中(同样标记为HL-1组和HL-2组),并震荡混匀。从2管混合物中各取出500μl DNA,并根据厂商的说明书,使用Ampure Beads(Beckman CoulterGenomics)磁珠进行纯化,得到200μl DNA。使用Nanodrop2000(Thermo Fisher Scientific公司),测定纯化后的混合物的DNA浓度分别为92ng/μl(HL-1组)和98ng/μl(HL-2组)。
4、Solexa测序文库的构建
4.1末端修复反应
使用Thermomixer(Eppendorf公司),对步骤2中获得的DNA扩增产物进行末端修复反应。修复反应体系为100μL,其组成见表5(所有试剂均购自Enzymatics公司):
表5
试剂 |
体积/反应(μL) |
DNA扩增产物 |
75 |
20×多核苷酸激酶缓冲液(B904) |
10 |
dNTP混合物(各20mM) |
4 |
T4DNA聚合酶 |
5 |
Klenow片段 |
1 |
T4多核苷酸激酶 |
5 |
反应条件为:20℃,30分钟。
根据厂商的说明书,使用Ampure Beads(Beckman CoulterGenomics)磁珠进行纯化,并回收DNA末端修复反应的产物。回收的产物溶于34μl EB(QIAGEN Elution Buffer)中。
4.23’端加A反应
使用Thermomixer(Eppendorf公司),对回收的DNA进行3’末端加A反应。反应体系为50μl,其组成见表6(所有试剂均购自Enzymatics公司):
表6
试剂 |
体积/反应(μL) |
上一步所得的DNA |
32 |
dATP(1mM,GE公司) |
10 |
10xBlue缓冲液 |
5 |
Klenow(3′-5′exo-) |
3 |
总体积 |
50 |
反应条件为:37℃,30分钟。
根据厂商的说明书,使用Ampure Beads(Beckman CoulterGenomics)磁珠进行纯化,并回收3′末端加A反应的产物。回收的产物溶于15μl的EB中。
4.3添加Solexa接头
使用Thermomixer(Eppendorf公司),对上一步获得的产物添加接头以构建测序文库。记录下接头和文库的对应关系。
添加Solexa接头的反应体系为50μl,其组成见表7(所有试剂均购自illumina公司):
表7
反应条件为:20℃,15分钟。
根据厂商的说明书,使用Ampure Beads(Beckman CoulterGenomics)纯化反应产物并将产物溶于20μl EB中。
使用AgilentBioanalyzer2100(Agilent公司)和荧光定量PCR(QPCR)测定产物的DNA浓度,结果见表8:
表8
5、Solexa测序
以Agilent Bioanalyzer2100所测浓度为准,将上一步所得的2种产物各取10pmolDNA,根据厂商的说明书,使用Solexa测序仪(Illumina Genome AnalyzerIIx测序仪),用SolexaPE-75程序进行测序,以便获得测序数据。
6、数据分析以及结果报告
根据测序结果中的标签引物(标签部分和引物部分)的序列的信息,将测序结果与每个样品一一对应。然后,使用本领域已知的比对程序,例如BLAST和SOAP,将每个样品的测序结果与耳聋基因数据库(例如HGMD和http://deafnessvariationdatabase.com/)进行比对,从而实现耳聋基因突变检测。
各样品的突变检测结果与已知的各样品的质谱检测结果如表9所示,其中飞行时间质谱检测结果是利用SEQUNOME生产的PHX-1型MassARRAY Analyzer Compact质谱检测仪,依照仪器的标准操作规程获得的。
表9
由上表可知,各样品的高通量测序结果与已知的质谱检测结果完全一致。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。