技术领域
本发明属于分子生物学领域,涉及医学诊断和生物技术,涉及一种应用大规模平行测序同时检验多目标相关基因突变的方法,具体的是一种采用大规模平行测序平台技术结合优化后的目标基因捕获技术。
背景知识
下一代测序技术(NextGenerationSequencing)又称为二代测序技术当前已经广泛应用于生物研究领域。其代表技术为罗氏公司(Roche)的454测序仪(RocheGSFLXsequencer),Illumina公司的Solexa基因组分析仪(IlluminaGenomeAnalyzer)和ABI的SOLiD测序仪(ABISOLiDsequencer)。它们的共同特点为:
1.集成了生物医学、计算机、微电子学、光学、材料科学和精密加工等多学科技术。例如,RocheGSFLXsequencer的图像采集技术就借鉴现代天文望远镜的光学系统技术,即超高分辨率的CCD集成光纤束技术。
2.测序策略主要基于循环芯片测序法(Cyclic-arraysequencing),即制备DNA文库,单分子扩增,在固相载体上形成DNA簇阵列,并行地利用DNA聚合酶或者连接酶进行酶促反应(模板变性、引物退火杂交、延伸或连接),同时读取反应产生的特异性荧光信号,最终得到超大量的DNA序列信息。
3.高通量并行测序。例如,RocheGSFLXsequencer一次就可对上百万条DNA分子同时进行序列测定,一次运行通量达到400Mb以上,而传统测序(一代测序)一轮测序的通量仅为80Kb左右。
4.单分子测序。传统测序(一代测序)是对多个DNA分子的混合物进行测序,其测序结果是多个DNA分子综合的序列信息;而二代测序先对单个DNA分子进行PCR以放大DNA分子数量(相当于单个DNA分子的克隆复制),再对这些DNA分子进行测序,就可以得到原来单个DNA分子的序列信息。
新一代测序技术的应用领域相当广泛,除了在科研领域(例如通过人类基因组上的SNP位点、基因缺失、基因拷贝数变异来分析研究人类基因的多态性等),在临床医学及食品安全领域也有着广泛的应用前景。
(一)临床医学:
1.遗传病的诊断
遗传病是一种人类基因组DNA缺陷,即由基因突变或染色体畸变造成的疾病,包括单基因遗传病、多基因遗传病和染色体异常遗传病等。通过下一代测序技术强大的测序能力,就可分析出待检者的全部基因组中哪部分基因存在缺陷,一方面可以找到很多病因不明的遗传病的致病基因,另一方面结合产前筛查,可以有效的避免遗传病患儿的诞生,这对提高我们中华民族的人口质量,减少出生缺陷、残疾等至关重要。
2.传染性疾病的快速诊断
传染性疾病的突然爆发造成严重的公共安全威胁,但在疾病爆发初期往往没有有效的检测手段能快速鉴定出病原体,特别是未知的病原体。一个典型例子就是2003年的SARS(传染性冠状病毒肺炎),是由一种具有强传染性的新型冠状病毒在人群中快速传播引起。而通过下一代测序技术,我们可快速检测分析出一个个体内基因组中有无外来病原体的基因序列,根据这些序列信息就能鉴定出人群中感染的病原体,为较短时间内制定疫情防控策略提供科学依据和坚实保障,避免疾病的大规模爆发流行。
3.个体化医疗
由于人类全基因组测序工作的完成以及对疾病与基因关系的深入研究,现在的临床医学已由群体治疗向个体化医疗转变,即根据个体的遗传学信息来针对性的制定预防疾病的措施以及合理的治疗方案。肿瘤的靶向治疗就是一个成功应用。另外,临床研究表明很多重大疾病往往与多个基因密切相关,而不是由单个基因决定。这些都需要我们对个体的遗传学信息有全面准确的了解,因此具有强大的测序能力的下一代测序技术显得至关重要。
(二)食品安全:
在食品安全领域,下一代测序技术同样有着广泛应用的前景。食品安全是各国公共安全的焦点,其中相当重要的问题是致病微生物污染食品导致的食源性疾病。根据世卫组织统计,每年全球发生的食源性疾病数以亿计。发达国家如美国每年因食源性疾病带来的医疗费用及相关损失达几十亿美元。此外,群体食源性疾病的爆发还会给社会带来严重的公共安全问题。由于可污染食品的致病微生物种类繁多,如何及时有效地检测出食品中致病微生物是哪一种,目前仍是一个巨大挑战。下一代测序技术是一个很好解决方案,利用其强大测序能力,可同时对食品中等所有微生物的基因组进行测序,有效鉴定出食品是否存在以及何种致病微生物污染。
发明内容
本发明的目的是,提供一种经济的应用大规模平行测序技术检验多目标多基因的方法。这个方法可以平行进行多样本的目的基因捕获,提高基因平行测序的通量和效率,降低每个样品的检验成本。
为实现上述目的,本发明采用的技术方案是一种新的多重目标捕获再测序方法,其特征在于包括以下步骤:
a.设计并制备用于捕获目的基因片段的突变捕获探针。并将这些探针结合在磁珠、薄膜或者玻片上。
b.将待测基因组DNA样品分别片段化至100-500bp,然后将末端补平,加入的ATP使片段两端引入粘性末端。
c.分别加入设计好的一端带有标签序列的接头序列片段,加入连接酶,使每个片段都与一对接头连接,形成新的片段。标签序列的设定位置在接头的粘性末端。接头序列见附表1。
d.调节反应温度激活DNA聚合酶,用一对标准引物,引物序列见附表2。对步骤c所得不同基因组完成接头连接的片段序列混合后进行PCR扩增反应。
e.将步骤d所得PCR扩增反应产物与步骤a所设计的捕获探针杂交,杂交反应后通过多次洗脱纯化反应,得到待测片段。
f.将待测片段通过大规模平行DNA测序平台的标准方案进行测序。
g.将得到的测序结果同标准数据库进行比较,得到诊断结果。
为实现上述技术方案,步骤a所述的捕获探针可以是脱氧核糖核酸(DNA),也可以是核糖核酸(RNA)组成,但不仅限于DNA和RNA。附图1是探针设计示意图。探针的长度从10bp至100bp不等的与目标互补的片段组成,最优为22bp。探针以叠瓦式设计,完整覆盖全部待测基因片段和两端50bp范围的序列。探针间重叠部分为3-10bp最优为5bp。覆盖率根据区域特点可以设定为1×-10×,最优为3×。(见附图)
其中,步骤c所述的接头在引物结合区的下游设计标签,标签末端为粘性末端可以和基因组片段结合。
其中,步骤d的引物能够在同样条件下效率均一地扩增含有不同标签接头的片段,扩增出的片段包含作为标签的碱基序列。
本发明的主要优点在于:
1)本发明的方法可以在一次测序反应中同时进行全部目的基因的检测;全部序列直接测出,准确率可以达到99.99%。没有额外的无效数据,极大提高了测序效率。
2)本发明的方法可以一次完成1-12个样品的平行捕获,极大地降低了样品准备的成本,提高了样品准备效率。
3)本发明的试剂盒可以一次完成8-96个样品的所有目的基因检测甚至全外显子检测,充分利用设备的高通量特性,极大降低了每个样品的测序成本。
4)本发明的检测方法步骤简单,因而避免了复杂操作过程中存在的诸多不确定引物,提高了检测准确率和稳定性。
5)本发明所提供的检测方法所需时间大大少于sanger法的测序技术,检测的准确度大大优于基因芯片技术,更符合临床等实际检测要求。
实施例一、肥厚型心肌病221例检测MYH7、MYH6、MYBPC3、TNNT2、TNN13、TNNC1、ACTC1、TPM1、TTN、CSRP3、DES、DMD、LDB3、VCL、TCAP、PLN、NEXN、ACTN2、FKTN、MYPN、TMPO、ANKRD1、PSEN1、PSEN2、ABCC9、SGCD、DSG2、EYA4、DSP、SCN5A、LMNA、MURC基因外显子,寻找新的突变位点。
一、探针设计:根据人类基因组数据库公布的基因MYH7、MYH6、MYBPC3、TNNT2、TNNI3、TNNC1、ACTC1、TPM1、TTN、CSRP3、DES、DMD、LDB3、VCL、TCAP、PLN、NEXN、ACTN2、FKTN、MYPN、TMPO、ANKRD1、PSEN1、PSEN2、ABCC9、SGCD、DSG2、EYA4、DSP、SCN5A、LMNA、MURC的外显子序列设计合成探针,探针为RNA,在目标区段叠瓦式设计,探针长度20bp,重叠区域5bp,覆盖范围达到目标区段两端15bp。采用agilent公司的SureSelect缓冲系统体系。
二、基因组提取:采用QiagenFlexiGeneDNAKit(CodeNo:51204)进行提取待测96份样本的基因组,OD值达到1.8-2.0,各取5ug做为起始模板。
三、测序前样品制备
1)目的基因片段化:取定量过的96份基因组DNA,稀释至每100μL中含有5μg基因组DNA,即50ng/μL。取110μL,用超声破碎仪分别进行片段化。
2)末端补平:
取1.5mLEP管,96份基因组样品分别按下表所示,在冰盒上加入各种试剂,保持冰浴状态
试剂 |
每个反应用量(μL) |
DNA sample |
20 |
Nuclease-free water
|
10 |
10x T4DNA ligase buffer with 10mM ATP
|
4 |
dNTP mix(10mM)
|
1.6 |
T4DNA polymerase
|
2 |
DNA Polymerase I,Large(Klenow)Fragment |
0.4 |
T4PNK |
2 |
总反应体系 |
40 |
手指轻弹使之充分混合,短暂离心后。水浴锅内20℃孵育30min。
3)末端加A:
取1.5mLEP管,96份基因组样品分别按下表所示,在冰盒上加入各种试剂,保持冰浴状态。
试剂 |
每个反应用量(μL) |
DNA sample |
10 |
Nuclease free water
|
2.8 |
10x NEBuffer 2
|
2 |
dATP(1mM) |
4 |
Klenow exo-(3′to5′exo-)
|
1.2 |
总反应体系 |
20 |
手指轻弹使之充分混合,短暂离心下。干式恒温仪上37℃孵育30min。
4)加带有标签的接头:
这个步骤以片段化前的5μgDNA量为基础,12份基因组样品为一组,组内每个样品使用一种加好标签的接头。分别使用10∶1的摩尔比配比对应标签的接头。取1.5mLEP管,各样品分别按下表所示,在冰盒上加入各种试剂,保持冰浴状态。
试剂 |
每个反应用量(μL) |
DNA sample |
7.6 |
2x Quick Ligation Reaction Buffer
|
12.5 |
Adapter oligo mix(10μM)
|
2.4 |
Quick T4DNA Ligase
|
2.5 |
总反应体系 |
25 |
手指轻弹使之充分混合,短暂离心后。水浴锅上20℃孵育15min。
5)切胶取得目的片段:
1)电泳槽中上样96份的接头连接产物(30uL样品+6uLLoadingbuffer),加入不同接头的12份产物为一组;间隔一个泳道加入DNA50bpladder(8uL50bpDNALadder+3uLloadingbuffer)
2)电泳25V16小时。
3)EB后染色半小时,紫外投射仪下切胶称重,选择片段长度在250-350bp。
6)杂交前文库扩增:
a)在超净台中,取PCR管,按下表所示,在冰盒上加入各种试剂,保持冰浴状态。每12份不同标签接头DNA样品的为一组,等量混合,按照下表配置反应体系。96份样品可以分成8组。
b)PCR扩增
四、采用设计探针捕获目的片段(一)文库杂交
1、采用agilent公司的Sureselect系统的缓冲液,配制杂交缓冲液:
2、配制好的溶液直接按照每孔40uL的量分装到8连管中,室温放置待用。
3、配制捕获混合液:
i.所用到的离心管、8连管冰上预冷。
ii.取1uLRNaseBlock加入3uLnuclease-freewater稀释。
iii.使用无RNase枪头在8连管中每管加入5uL设计好的捕获探针组。
iv.每管加入2uL稀释好的RNaseBlock,来回吹吸3-4次混匀。注意不要溅到管壁上。放冰上待用。
4、用agilent公司的Sureselect系统配制SureselectBlockMix:
Reagent |
Volume for 2reaction(μL)
|
Sureselect Block#1(Green Cap)
|
5 |
Sureselect Block#2(Blue cap)
|
5 |
Sureselect Block#3(Brown cap)
|
1.2 |
Total |
11.2 |
5、预制文库的配制。
a、取8组12份样品的混合物分别加入8连管中
b、加入5.6μLSureSelectBlockmix。
c、用移液器混匀,注意不要溅到管壁上。
d、加盖密封,将8连管放在PCR的D行,运行下列程序:
Step |
Temperature |
Time |
1 |
95℃ |
5min |
2 |
65℃ |
Hold |
6、在PCR仪上使用温度为105℃的热盖来保持在PCR仪的plate为65℃。
7、将步骤1配置的hybridizationbuffer8连管放入PCR仪的B行,65℃放置5min。
8、第8步结束后,将步骤4配制好的CaptureLibrarymix8连管放入PCR仪的F行。65℃孵育2min
9、65℃环境下,使用多道移液器取13uLB行的Hybridizationbuffer加入到F行的SureSelectCaptureLibraryMix中。
10、65℃环境下,使用多道移液器将D行中所有的样品DNA文库加入F行,缓慢吹吸8-10次,充分混匀。杂交混合液体积应为27uL-29uL,取决于前期孵育时的蒸发量。
11、用105℃的热盖保持杂交混合液在65℃的环境中孵育24小时。
(二)准备M-280Streptavidin(invitrogen公司,112-06D)磁珠
1、分装3mlSureSelectWashBuffer#2在水浴锅中预热到65℃。
2、旋涡震荡使M-280Streptavidin(invitrogen公司,112-06D)磁珠充分分散。
3、每个杂交体系,加入50μL磁珠至1.5ml离心管。
4、洗涤磁珠
5、把磁珠用200ulSureSelectBindingbuffer重悬。
(三)用SureSelecte系统进行选择性杂交捕获
1、孵育24h以后的杂交液体积为:28uL
2、快速将PCR上的杂交混合液直接添加至beadsolution中,反复颠倒混匀3~5次。
3、将混合液放在脱色摇床上室温孵育30min。样品需充分混匀。
4、轻柔离心。
5、用磁力架分离磁珠和缓冲液并弃去上清液。
6、在磁珠中加入500μLSureSelectWashBuffer#1,在旋涡振荡器上混和5sec。
7、室温孵育15min。
8、清洗磁珠:
9、在磁珠中加入50μLSureSelectElutionBuffer,在旋涡振荡器上混和5s。
10、在室温中待样品孵育10min。
11、用磁力分离架分离磁珠和缓冲液。
12、用移液器将上清液转移到一个新的1.5ml的离心管中。这个上清液中包含所捕获的DNA。
13、珠子中重新加入50uLSureSelectElutionBuffer,重复步骤9-12。
14、在被捕获的DNA中加入50μLSureSelectNeutralizationBuffer。
(四)捕获溶液的脱盐
1、每份样品加入500μLPBbuffer,用移液器混合均匀。
2、检查溶液是否为黄色,确保pH在正常范围。静置2min
3、将MinElute旋转离心柱放在2ml的收集管中。
4、移取600μl样品至MinElute离心柱中,放入离心机60sec,13000rpm,弃流体。
5、加入750μl的PEbuffer至柱中,放入离心机60sec,13000rpm,弃流体。
6、将MinElute柱子放回2ml的收集管内,离心60sec,13000rpm。
7、静置2min待酒精完全挥发。
8、将MinElute柱子中放入一个新的1.5ml的收集管中,将15μl的EBbuffer直接加到MinElute滤膜上,等待5min,然后放置离心机中离心60sec,13000rpm。
9、洗脱液重新加到滤膜上,等待5min,离心60sec,13000rpm。
10、收集洗脱液,保存于-20℃。
(五)捕获样品扩增
1.8组捕获后的混合液7uL
2.配制HerculaseMasterMix。8组混合样品分别在冰上混合下列试剂,用枪头轻柔混匀。
Reagent |
Volume for 1reaction
|
Nuclease-free water
|
29.75μL |
5X Herculase II Reaction Buffer
|
10μL |
dNTP mix(10mM each)
|
1.25μL |
SureSelect GA PCR Primers
|
1μL |
Herculase II Fusion DNA Polymerase
|
1μL |
Total |
43μL |
3.43uLHerculaseMasterMix中加入7uL步骤1中混合好的捕获文库。
4.运行下列PCR程序。
五、上机测序:8组产物在flowcell上各自占据一条lane,按照illumina公司的single-end技术方案进行簇生成和在GAIIx系统进行上机测序。
六、数据分析:数据结果通过genomeCLC进行生物信息学分析。
七、结果:通过3次测序反应,30天完成221个样品所有26个目的基因446条序列的测序工作,测序总数达到98566条。,用ABI3730xl进行8个基因的平行对照,突变检出率为65%,本方案的测序突变检出率达到88%,检验准确率100%。
表1:加好标签的接头序列
编号 |
序列 |
OLG1.1-1 |
5′P-ATAGATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG 3′
|
OLG1.1-2 |
5′ACACTCTTTCCCTACACGACGCTCTTCCGATCTAT*T 3′ |
OLG1.2-1 |
5′P-CAAGATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG 3′
|
OLG1.2-2 |
5′ACACTCTTTCCCTACACGACGCTCTTCCGATCTTG*T 3′ |
OLG1.3-1 |
5′P-GCAGATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG 3′
|
OLG1.3-2 |
5′ACACTCTTTCCCTACACGACGCTCTTCCGATCTGC*T 3′ |
OLG1.4-1 |
5′P-TGAGATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG 3′
|
OLG1.4-2 |
5′ACACTCTTTCCCTACACGACGCTCTTCCGATCTCA*T 3′ |
OLG2.1-1 |
5′P-CTAGATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG 3′
|
OLG2.1-2 |
5′ACACTCTTTCCCTACACGACGCTCTTCCGATCTAG*T 3′ |
OLG2.2-1 |
5′P-GAAGATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG 3′
|
OLG2.2-2 |
5′ACACTCTTTCCCTACACGACGCTCTTCCGATCTTC*T 3′ |
OLG2.3-1 |
5′P-TCAGATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG 3′
|
OLG2.3-2 |
5′ACACTCTTTCCCTACACGACGCTCTTCCGATCTGA*T 3′ |
OLG2.4-1 |
5′P-AGAGATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG 3′
|
OLG2.4-2 |
5′ACACTCTTTCCCTACACGACGCTCTTCCGATCTCT*T 3′ |
OLG3.1-1 |
5′P-GTAGATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG 3′
|
OLG3.1-2 |
5′ACACTCTTTCCCTACACGACGCTCTTCCGATCTAC*T 3′ |
OLG3.2-1 |
5′P-TAAGATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG 3′
|
OLG3.2-2 |
5′ACACTCTTTCCCTACACGACGCTCTTCCGATCTTA*T 3′ |
OLG3.3-1 |
5′P-ACAGATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG 3′
|
OLG3.3-2 |
5′ACACTCTTTCCCTACACGACGCTCTTCCGATCTGT*T 3′ |
OLG3.4-1 |
5′P-CGAGATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG 3′
|
OLG3.4-2 |
5′ACACTCTTTCCCTACACGACGCTCTTCCGATCTCG*T 3′ |
″p-″meansphosphormodificationat5′;
″*″meansPhosphorothioateBond.
表2:扩增用的标准引物