发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。
在本发明的第一方面,本发明提出了一种基于血液样品构建测序文库的方法。根据本发明的实施例,该方法包括:
从所述血液样品分离DNA样品;
对所述DNA样品进行去磷酸化处理以便获得经过去磷酸化的DNA;
对所述经过去磷酸化的DNA进行末端修复,以便获得双链DNA片段,其中,所述双链DNA片段具有两个平端末端,并且四个末端核苷酸均缺少磷酸基团;
将相互不同的第一和第二接头与所述双链DNA片段相连,以便获得第一连接产物,其中第一和第二接头的每一个均是分离的寡核苷酸,所述分离的寡核苷酸包括:第一链,所述第一链的5’末端核苷酸具有磷酸基团,并且所述第一链的3’末端核苷酸为双脱氧核苷酸;以及第二链,所述第二链的5’末端核苷酸不具有磷酸基团,并且所述第二链的3’末端核苷酸为双脱氧核苷酸,其中,所述第一链的长度大于所述第二链的长度,并且所述第一链和所述第二链之间形成双链结构;
利用第一单链DNA置换所述第一接头的第二链,利用第二单链DNA置换所述第二接头的第二链,以便获得第二连接产物,其中,第一单链DNA适于与第一接头的第一链形成双链结构,所述第二单链DNA适于与第二接头的第一链形成双链结构;
利用第一引物和第二引物对所述第二连接产物进行扩增,其中,所述第一引物包括与所述第一单链DNA和第二单链DNA之一相同的序列,所述第二引物包括与所述第一单链DNA和第二单链DNA的另一个相同的序列,并且所述第一引物和第二引物之一具有额外的生物素标记,所述扩增产物是在两个末端分别具有一个接头的DNA片段;
从所述在两个末端分别具有一个接头的DNA片段分离单链DNA片段;以及
将所述单链DNA片段进行环化处理,以便获得单链环状DNA,所述单链环状DNA构成所述测序文库。
根据本发明的实施例,所述血液样品为血浆。根据本发明的实施例,所述DNA样品为游离核酸样品。游离核酸的长度通常为100~200bp,可以直接用于构建测序文库。根据本发明的实施例,所述DNA样品为从有核红细胞分离的基因组DNA,并且在对所述DNA样品进行所述去磷酸化处理之前,预先将所述基因组DNA进行打断,以便获得长度为100~200bp的DNA片段。
根据本发明的实施例,所述第一接头和所述第二接头的每一个分别独立地包括:
第一突出端,所述第一突出端位于所述第一链的3’端;以及
任选的第二突出端,所述第二突出端位于所述第二链的5’端。
根据本发明的实施例,所述第一突出端的长度大于所述第二突出端的长度。
根据本发明的实施例,所述第一突出端的长度为大约6~12nt。
根据本发明的实施例,所述第二突出端的长度为0~4nt。
根据本发明的实施例,所述第一链的长度为大约20~25nt。
根据本发明的实施例,所述第二链的长度为大约10~15nt。
根据本发明的实施例,将所述双链DNA片段与第一接头和第二接头进行连接的步骤是在一步反应中完成的。
根据本发明的实施例,
所述第一单链DNA与所述第一接头的第一链形成的双链结构的长度大于所述第一接头中所述第一链和所述第二链之间形成双链结构的长度;以及
所述第二单链DNA与所述第二接头的第一链形成的双链结构的长度大于所述第二接头中所述第一链和所述第二链之间形成双链结构的长度。
根据本发明的实施例,
所述第一接头的第一链的序列为:5’AAGTCGGAGGCCAAGCGGTCGT3’;
所述第一接头的第二链的序列为:5’TTGGCCTCCGACT;
所述第二接头的第一链的序列为:5’GTCTCCAGTCGAAGCCCGACGC3’;
所述第二接头的第二链的序列为:5’GCTTCGACTGGAGA3’;
所述第一单链DNA的序列为:5’TCCTAAGACCGCTTGGCCTCCG3’,所述第二单链DNA的序列为5’AGACAAGCTC(N)mGATCGGGCTTCGACGGAG3’,其中,(N)m表示长度为m个核苷酸的标签序列,其中,m为4~10中的任意整数,N=A、T、G或者C;。
根据本发明的实施例,通过热裂解-退火处理,使用第一单链DNA置换所述第一接头的第二链,并且使用第二单链DNA置换所述第二接头的第二链,
根据本发明的实施例,所述热裂解是在大约60摄氏度下进行的。
根据本发明的实施例,通过缺口补平反应,使所述第一单链DNA和所述第二单链DNA分别与所述双链DNA片段发生连接。
根据本发明的实施例,从所述两端连接有接头的DNA片段分离单链DNA片段进一步包括:
使所述两端连接有接头的DNA片段与磁珠接触,以便形成磁珠-DNA复合物,其中,所述磁珠上连接有链霉亲和素;
将所述磁珠-DNA复合物与pH高于7的溶液接触,以便获得所述单链DNA片段。
根据本发明的实施例,所述pH高于7的溶液为氢氧化钠溶液。
根据本发明的实施例,所述氢氧化钠溶液的浓度为低于大约2M。
根据本发明的实施例,所述氢氧化钠溶液的浓度为大约0.1M。
根据本发明的实施例,在从所述两端连接有接头的DNA片段分离单链DNA片段之前,预先对所述两端连接有接头的DNA片段进行筛选。
根据本发明的实施例,所述筛选是通过所述两端连接有接头的DNA片段与探针接触进行的,其中,所述探针对于预定序列是特异性的。
根据本发明的实施例,所述预定序列包括至少一个外显子。
根据本发明的实施例,所述探针是以微芯片阵列的形式提供的。
根据本发明的实施例,通过采用单链核酸分子将所述单链DNA片段进行环化,
其中,
所述单链核酸分子上限定出第一区段和第二区段,并且所述第一区段能够与包含所述单链DNA片段的5’末端核苷酸和3’末端核苷酸的之一的序列匹配,所述第二区段能够与包含所述单链DNA片段的5’末端核苷酸和3’末端核苷酸的之一的序列匹配。
根据本发明的实施例,所述第一区段和所述第二区段是毗邻连接的。
在本发明的第二方面,本发明提出了一种核酸测序方法。根据本发明的实施例,其包括:
根据前面所述的方法,构建测序文库;以及
对所述测序文库进行测序。
根据本发明的实施例,采用CG测序平台,对所述测序文库进行测序。
在本发明的又一方面,本发明提出了一种用于确定样品中胎儿遗传异常的方法,其中,所述样品是从孕妇中提取的,所述遗传异常为染色体非整倍性,所述方法包括:
(a)根据前面所述的方法,对所述样品中所包含的核酸分子的至少一部分进行测序,以便获得测序结果;
(b)将所得到的测序结果与参照人类基因组序列进行比对,以便获得经过比对的测序数据集合;
(c)确定所述经过比对的测序数据集合中所有测序数据的总和,以便获得数值M;
(d)基于所得到的经过比对的测序数据集合,确定来自染色体i的测序数据的数目,以便获得数值Ni,其中,i表示染色体编号;
(e)基于数值M和Ni,确定表示染色体i相对百分比的参数,以便获得参数R;以及
(f)基于参数R,确定对于染色体i是否存在胎儿遗传异常。
根据本发明的实施例,所述测序数据的长度为12~21。
根据本发明的实施例,所述经过比对的测序数据集合是由唯一比对的测序数据构成的。
根据本发明的实施例,参数R是Ni/M的比值。
根据本发明的实施例,进一步包括:
根据下列公式获得Z值
Zi=(Ri,j-meani)/sdi,
j表示样品编号,n表示样品的总数目;以及
将所述Z值与第一预定数值和第二预定数值进行比较。
根据本发明的实施例,所述第一和第二预定数值是基于多个已知的样品确定的。
根据本发明的实施例,所述第一预定的数值不超过-3。
根据本发明的实施例,所述第二预定的数值为至少+3。
根据本发明的实施例,所述Z值低于所述第一预定数值是样品中存在额外的一条染色体i的表示,Z值超过所述第二预定的数值是样品中缺失一条染色体i的表示。
在本发明的又一方面,本发明提出了一种基于血液样品构建测序文库的装置,其特征在于,包括:
DNA样品分离单元,用于从血液样品分离DNA样品;
去磷酸化单元,用于对所述DNA样品进行去磷酸化处理以便获得经过去磷酸化的DNA;
末端修复单元,用于对所述经过去磷酸化的DNA进行末端修复,以便获得双链DNA片段,其中,所述双链DNA片段具有两个平端末端,并且四个末端核苷酸均缺少磷酸基团;
第一连接单元,用于将相互不同的第一和第二接头与所述双链DNA片段相连,以便获得第一连接产物,其中第一和第二接头的每一个均是分离的寡核苷酸,所述分离的寡核苷酸包括:第一链,所述第一链的5’末端核苷酸具有磷酸基团,并且所述第一链的3’末端核苷酸为双脱氧核苷酸;以及第二链,所述第二链的5’末端核苷酸不具有磷酸基团,并且所述第二链的3’末端核苷酸为双脱氧核苷酸,其中,所述第一链的长度大于所述第二链的长度,并且所述第一链和所述第二链之间形成双链结构;
链置换单元,用于利用第一单链DNA置换所述第一接头的第二链,利用第二单链DNA置换所述第二接头的第二链,以便获得第二连接但愿,其中,第一单链DNA适于与第一接头的第一链形成双链结构,所述第二单链DNA适于与第二接头的第一链形成双链结构;
扩增单元,用于利用第一引物和第二引物对所述第二连接产物进行扩增,其中,所述第一引物包括与所述第一单链DNA和第二单链DNA之一相同的序列,所述第二引物包括与所述第一单链DNA和第二单链DNA的另一个相同的序列,并且所述第二引物具有额外的生物素标记,所述扩增产物是在两个末端分别具有一个接头的DNA片段;
单链DNA分离单元,用于从所述在两个末端分别具有一个接头的DNA片段分离单链DNA片段;以及
环化单元,用于将所述单链DNA片段进行环化处理,以便获得单链环状DNA,所述单链环状DNA构成所述测序文库。
根据本发明的实施例,所述血液样品为血浆。根据本发明的实施例。所述DNA样品为游离核酸样品。根据本发明的实施例,所述DNA样品为从有核红细胞分离的基因组DNA,并且进一步包括片段化单元,用于在对所述DNA样品进行所述去磷酸化处理之前,预先将所述基因组DNA进行打断,以便获得长度为100~200bp的DNA片段。
根据本发明的实施例,通过缺口补平反应,使所述第一单链DNA和所述第二单链DNA分别与所述双链DNA片段发生连接,从而形成所述第二链接产物。
根据本发明的实施例,所述单链DNA分离单元适于进行下列步骤:
使所述两端连接有接头的DNA片段与磁珠接触,以便形成磁珠-DNA复合物,其中,所述磁珠上连接有链霉亲和素;以及
将所述磁珠-DNA复合物与pH高于7的溶液接触,以便获得所述单链DNA片段。
根据本发明的实施例,在从所述两端连接有接头的DNA片段分离单链DNA片段之前,预先对所述两端连接有接头的DNA片段进行筛选。
根据本发明的实施例,所述筛选是通过所述两端连接有接头的DNA片段与探针接触进行的,其中,所述探针对于预定序列是特异性的。
根据本发明的实施例,通过采用单链核酸分子将所述单链DNA片段进行环化,
其中,
所述单链核酸分子上限定出第一区段和第二区段,并且所述第一区段能够与包含所述单链DNA片段的5’末端核苷酸和3’末端核苷酸的序列匹配,所述第二区段能够与包含所述单链DNA片段的5’末端核苷酸和3’末端核苷酸的之一的序列匹配。
在本发明的又一方面,本发明提出了一种核酸测序设备,包括:
根据前面所述的装置,用于构建测序文库;以及
测序装置,用于对所述测序文库进行测序。
根据本发明的实施例,所述测序装置为CG测序平台。
在本发明的又一方面,本发明提出了一种用于确定样品中胎儿遗传异常的系统,其中,所述样品是从孕妇中提取的,所述遗传异常为染色体非整倍性,其特征在于,所述系统包括:
根据前面所述的设备,用于对所述样品中所包含的核酸分子的至少一部分进行测序,以便获得测序结果;
分析设备,所述分析设备适于根据下列步骤分析所述测序结果:
将所得到的测序结果与参照人类基因组序列进行比对,以便获得经过比对的测序数据集合;
确定所述经过比对的测序数据集合中所有测序数据的总和,以便获得数值M;
基于所得到的经过比对的测序数据集合,确定来自染色体i的测序数据的数目,以便获得数值Ni,其中,i表示染色体编号;
基于数值M和Ni,确定表示染色体i相对百分比的参数,以便获得参数R;以及
基于参数R,确定对于染色体i是否存在胎儿遗传异常。
根据本发明的实施例,所述测序数据的长度为12~21。
根据本发明的实施例,所述经过比对的测序数据集合是由唯一比对的测序数据构成的。
根据本发明的实施例,参数R是Ni/M的比值。
根据本发明的实施例,进一步包括:
根据下列公式获得Z值
Zi=(Ri,j-meani)/sdi,
j表示样品编号,n表示样品的总数目;以及
将所述Z值与第一预定数值和第二预定数值进行比较。
根据本发明的实施例,所述第一和第二预定数值是基于多个已知的样品确定的。
根据本发明的实施例,所述第一预定的数值不超过-3。
根据本发明的实施例,所述第二预定的数值为至少+3。
根据本发明的实施例,所述Z值低于所述第一预定数值是样品中存在额外的一条染色体i的表示,Z值超过所述第二预定的数值是样品中缺失一条染色体i的表示。
根据本发明的实施例,发明人发现由于两个接头中的第一链和第二链的3’末端均为双脱氧核苷酸,并且在第二链的5’末端核苷酸不具有磷酸基团,这些末端将无法与与其他核酸片段相互连接,从而可以防止寡核苷酸之间的互相连接。由此,该分离的寡核苷酸可以作为接头用于在构建测序文库,并且在构建测序文库时可以实现同时在核酸片段的两端连接不同的接头,同时避免了接头之间的互相连接,提高了连接效率,降低了构建测序文库的经济和时间成本。进而利用本发明的测序方法以及检测方法,能够更有效地提高测序效率,今儿提高检测方法的检测效率。根据本发明的实施例的技术方法可以基于低至1毫升血液样品进行无创检测,即使孕妇仅9个孕周。另外,根据本发明的实施例,可以同时对3000~5000个样品进行分析。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
实施例:对36例孕妇血浆进行胎儿染色体三倍性变异检测。
1.样品收集及处理:
(1)取母亲孕期外周血2ml,1600g,4℃离心10分钟,将血细胞和血浆分开,血浆再以16000g,4℃离心10分钟,进一步去除残留的白细胞。孕妇血浆用SnoMagTMCirculatingDNAKit(SNOVA)提取血浆DNA,最后将DNA溶于50ulTE溶液。
2.构建测序文库
2.1rSAP处理
采用下列反应体系进行rSAP处理,以便进行去磷酸化
DNA50ul
rSAP(1U/ul)6ul
10XNEBuffer26ul
混匀后,置于PCR仪上反应,程序为:37℃/45min,65℃/10min,0.1℃/s匀速降温至4℃。
2.2末端修复
采用下列反应体系进行该反应
往上一步DNA样品中加入18ul的酶反应液,混匀后,12℃反应20分钟。
反应结束后,用120uLAmpureXP(Agencourt)磁珠纯化,溶于32ulTE溶液。
2.3接头连接
采用下列反应体系进行该反应
混匀后,置于PCR仪上反应,程序为:20℃反应30分钟。
反应结束后,用80ulAmpureXP(Agencourt)磁珠纯化,溶于42ulTE溶液。
2.4切口平移(Nicktranslation)
混匀后置于PCR仪反应,程序设为:60℃反应5min,待温度降至37℃后,往反应管中加入如下反应液:
T4DNAligase(600U/ul)2ul
Taqpolymerase(5U/ul)2ul
混匀后置于PCR仪上,37℃反应1小时。
反应完成后,用80ulAmpureXP(Agencourt)磁珠纯化,溶于45ulTE溶液。
2.5PCR扩增
采用下列反应体系进行该反应
反应程序如下:
PCR反应结束后,用50ulAmpureXP磁珠纯化,溶于20ulTE溶液。
将纯化获得的PCR产物用picogreen进行定量。取260ng的PCR产物进行后续的实验操作。
2.6单链分离
向1.5ml不粘管加入30μLMyOneC1streptavidinbeads,置于磁力架上至溶液澄清,弃上清,加入1倍体积磁珠结合缓冲液,用移液器吹打混匀后,重新放入磁力架上,如此重复三次,弃上清。加入1倍体积磁珠结合缓冲液,震荡混匀后室温静置。
将PCR产物加TE至60ul,加入20ul的4X磁珠结合缓冲液。
将步骤2的80ul样品转移至含有MyOneC1streptavidinbeads的不粘管中,混匀后室温静置15min。
将离心管放置在磁力架上,静置3min至溶液变澄清,弃上清。
向管中加入1000μL磁珠冲洗缓冲液,用移液器吹打混匀。将离心管放置在磁力架上,静置3min至溶液变澄清,弃上清。
重复步骤5一次。
加入78μL0.1MNaOH溶解磁珠,用移液器反复吹打15次混匀,室温放置10min;
样品放置在磁力架上,静置3min至溶液变澄清。小心将澄清液转移至新的1.5mlEP管中
向上步管中加入37.5μL0.3MMOPSacid混匀。
2.7环化(Circulation)
充分震荡混匀后瞬时离心,置于Thermocycler中反应,反应条件:37℃1.5h。
3.测序
取构建的单链环状DNA文库进行DNAnonoball制备、CG上机测序。测序过程严格按照CompleteGenomicsInc.的标准操作流程进行上机操作。
4.数据分析
通过对测序得到的序列,对样本的染色体数目进行分析,详细步骤如下:
a)对测试样本计算相对测序序列数:参考唯一比对序列长度选双向测序reads一端19bp,另一端12bp,统计参考唯一比对序列的数目,将人类基因组参考序列按染色体进行划分,统计落在每个染色体上的实际测序序列数ri,j,其中下标i和j分别代表染色体编号和样本编号;
b)数据标准化:计算测试样本中多条常染色体的测序序列总数nj,则待测样本每条染色体的相对百分数为Ri,j,其中:Ri,j=ri,j/nj。
c)Z-score统计:
Zi=(Ri,j-meani)/sdi,
d)染色体数目异常判定:
令Z-score服从标准正态分布,取0.001与0.999处的分位点(即-3与3)作为判定染色体数目异常的阈值。当某条染色体Z-score大于3时为该染色体数目增加,当Z-score小于-3时,为染色体数目减少。
结果总结在表1中,并采用常规的核型分析结果作为验证:
样品编号 |
核型分析结果 |
CG高通量测序检测结果 |
S1 |
13三体 |
13三体 |
S2 |
13三体 |
13三体 |
S3 |
正常 |
正常 |
S4 |
正常 |
正常 |
S5 |
正常 |
正常 |
S6 |
正常 |
正常 |
S7 |
正常 |
正常 |
S8 |
正常 |
正常 |
S9 |
正常 |
正常 |
S10 |
正常 |
正常 |
S11 |
正常 |
正常 |
S12 |
正常 |
正常 |
S13 |
正常 |
正常 |
S14 |
正常 |
正常 |
S15 |
正常 |
正常 |
S16 |
正常 |
正常 |
S17 |
正常 |
正常 |
S18 |
正常 |
正常 |
S19 |
正常 |
正常 |
S20 |
正常 |
正常 |
S21 |
正常 |
正常 |
S22 |
正常 |
正常 |
S23 |
正常 |
正常 |
S24 |
正常 |
正常 |
S25 |
正常 |
正常 |
S26 |
正常 |
正常 |
S27 |
正常 |
正常 |
S28 |
正常 |
正常 |
S29 |
正常 |
正常 |
S30 |
正常 |
正常 |
S31 |
正常 |
正常 |
S32 |
21三体 |
21三体 |
S33 |
正常 |
正常 |
S34 |
18三体 |
18三体 |
S35 |
21三体 |
21三体 |
S36 |
18三体 |
18三体 |
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。另外,需要说明的是,本领域技术人员能够理解,在本发明所提出的方案中所包含的步骤顺序,本领域技术人员可以进行调整,这也将包括在本发明的范围内。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。