CN105779434A - 试剂盒及其用途 - Google Patents

试剂盒及其用途 Download PDF

Info

Publication number
CN105779434A
CN105779434A CN201410778723.4A CN201410778723A CN105779434A CN 105779434 A CN105779434 A CN 105779434A CN 201410778723 A CN201410778723 A CN 201410778723A CN 105779434 A CN105779434 A CN 105779434A
Authority
CN
China
Prior art keywords
reference sequences
probe
optionally
genes
target area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410778723.4A
Other languages
English (en)
Inventor
蔡宇航
钱朝阳
管彦芳
朱红梅
易鑫
杨玲
朱晨晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TIANJIN BGI TECHNOLOGY Co Ltd
BGI Shenzhen Co Ltd
Original Assignee
TIANJIN BGI TECHNOLOGY Co Ltd
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TIANJIN BGI TECHNOLOGY Co Ltd, BGI Shenzhen Co Ltd filed Critical TIANJIN BGI TECHNOLOGY Co Ltd
Priority to CN201410778723.4A priority Critical patent/CN105779434A/zh
Publication of CN105779434A publication Critical patent/CN105779434A/zh
Priority to HK16112046.1A priority patent/HK1223969A1/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种试剂盒,其包含探针,所述探针固定在固相基质上或者所述探针游离于溶液中,所述探针能够特异性识别表1中的547个基因中的至少10个基因的基因区域。本发明还提供试剂盒的用途、一种构建目标区域测序文库的方法、一种测序方法、一种检测目标区域变异的方法、一种检测目标区域变异的装置、一种对癌症进行早期筛查的方法及装置。利用本发明的试剂盒和/或本发明的方法或装置,能够一次性、简单方便且高特异性的获取多种常见癌症的相关基因序列,能够准确检测分析这些相关基因序列,使检测分析结果可以辅助用于多种常见癌症的早期筛查判断或监控。

Description

试剂盒及其用途
技术领域
本发明涉及生物医学领域,具体的,涉及试剂盒及其用途,更具体的,本发明涉及一种试剂盒、试剂盒的用途、一种构建目标区域测序文库的方法、一种测序方法、一种检测目标区域变异的方法和装置、以及一种对癌症进行早期筛查的方法和装置。
背景技术
肿瘤是严重威胁人类健康的疾病之一,20世纪70年代以来,我国癌症发病及死亡率一直呈上升趋势,至90年代的20年间,癌症死亡率上升29.42%,年龄调整死亡率上升11.56%。2000年癌症发病人数约180-200万,死亡140-150万。恶性肿瘤发病率全国35岁至39岁年龄段为87.07/10万,40岁至44岁年龄段几乎翻番,达到154.53/10万;50岁以上人群发病占全部发病的80%以上,60岁以上癌症发病率超过1%,80岁达到高峰。全国肿瘤死亡率为180.54/10万,每年因癌症死亡病例达270万例。我国居民因癌症死亡的几率是13%[赫捷,陈万青.(2012).2012中国肿瘤登记年报.军事医学科学出版社:18-28.McBride,D.J.andA.K.Orpana,etal.(2010)."Useofcancer-specificgenomicrearrangementstoquantifydiseaseburdeninplasmafrompatientswithsolidtumors."GenesChromosomesCancer49(11):1062-1069.]。癌症不仅严重影响劳动人民的健康,而且成为医疗费用上涨的重要因素。我国每年耗费大量资金用于癌症病人的医疗费用,带来巨大的经济负担。
癌症的发生时一个渐进缓慢的过程,如能够对其做到早期发现,临床有效治疗,到术后复发监测进行全面控制,可有效的降低其发生率和死亡率,将有着巨大的经济效益和社会效益,寻找特异性的肿瘤标志物对早期筛查、术后监控等方面均有重要作用[KayabaH.Tumormarkers:essentialdiagnostictoolsforradiologists[J].NipponLgakuHoshasenGakkaiZasshi,2003,63(4):133-139]。
循环DNA是存在于血液、滑膜液等体液中的细胞外游离DNA,研究发现许多肿瘤患者循环DNA与正常人相比有很大差异,由于肿瘤细胞凋亡,癌症患者循环DNA中含有一定的肿瘤标志物。近年来肿瘤患者血液中循环游离DNA的基因检测诊断已成为研究热点,研究显示血液中循环肿瘤DNA有可能成为一种新的肿瘤早期诊断及预后判断的标志物。检测血液中循环游离DNA中的肿瘤标志物检测具有区别于传统组织肿瘤标志物检测方式,具有无创、随时监控和早期筛查等优势,并且对循环游离DNA的取样检测避免了当前分子诊断需要采集癌组织作为标本来源的困难,是一种很有潜力的肿瘤标志物。同时将血液肿瘤标志物与临床检验结合起来,可以辅助肿瘤的早期诊断和实时监控或者为肿瘤的早期诊断或监控提供重要线索,有可能能成为肿瘤的早期筛查和预后判断提供重要依据。
目前临床上对于这些常见高发癌症的早期诊断和术后监控,拥有许多手段,但大部分方法在特异性和准确性方面尚不足以满足临床检测的要求。如今高通量测序技术已经在肿瘤检测中得到了有效应用,但由于肿瘤发病早期的血浆游离DNA含量较低,而且测序技术本身存在一定的错误率等,采用传统的测序方法将无法分辨测序错误和肿瘤标本中低频率突变,不利于这些癌症的早期诊断和术后监控。因此开发易操作、低损伤、高准确的技术是癌症早期筛查和术后监控所急需的。
发明内容
依据本发明的一方面,本发明提供一种试剂盒,其包含探针,所述探针固定在固相基质上或者游离于溶液中,所述探针能够特异性识别以下表1中547个基因中的至少10个基因的基因区域。在本发明的一个实施例中,所述探针能够覆盖所述547个基因中的至少100个基因的基因区域。在本发明的一个实施例中,所述探针能够覆盖所述547个基因中的至少200个基因的基因区域。在本发明的一个实施例中,所述探针能够覆盖所述547个基因中的至少300个基因的基因区域。在本发明的一个实施例中,所述探针能够覆盖所述547个基因中的至少400个基因的基因区域。在本发明的一个实施例中,所述探针能够覆盖所述547个基因中的至少500个基因的基因区域。在本发明的一个实施例中,所述探针能够覆盖全部所述547个基因的基因区域。本发明的试剂盒探针能够特异性识别的基因区域组合,是发明人经过多次收集、多次筛选和多次试验组合获得的,这些基因区域组合是常见肿瘤的发生或发育相关区域。所述常见肿瘤包括肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌和肝癌。利用本发明一方面的方法能够一次性、简单方便且高特异性的获取多种常见癌症的相关基因序列。
表1
在本发明的一个实施例中,所述探针能够特异性识别所述547个基因中的表2所列的145个基因的基因区域。探针能够特异性识别的表2的145个基因的基因区域,是发明人经过多次收集、多次筛选和多次试验组合获得的,这些基因区域组合与肺癌的发生发展相关。利用本发明方法中的这一试剂盒中的探针,能够一次性的、简单方便且高特异性的获取全部肺癌相关基因序列,而且基于检测这些基因序列获取的信息能够辅助肺癌的早期筛查诊断。
表2
KRAS ALK ROS1 ADAM23 KIAA0907 KRTAP5-5 MAP1B
EGFR RB1 FGFR3 DNMT3B GAB1 TSHZ3 ZNF814
TP53 PDGFRA FGFR4 SDHAP2 OR10Z1 XIRP2 ZFHX4
BRAF KDR JAK3 DHX9 CNTNAP3B NYAP2 ZNF804A
PIK3CA FBXW7 APC CSNK2A1 IL32 NUDT11 OR5D18
ERBB2 HRAS FRG1B CNTN5 NAV3 SNAPC4 ZNF479
CDKN2A JAK2 CHEK2 ATXN3 TNRC6A ZNF598 OR51V1
NRAS ERBB4 KLK1 CLIP1 FAM135B KIAA2022 OR4N2
STK11 KIT NBPF10 OR4M2 VGLL3 DDX11L2 OR4C15
NFE2L2 SMAD4 PARG OR10G8 KRTAP4-11 MUC6 OR14C36
CTNNB1 FGFR2 FBN2 PAPPA2 ANAPC1 ATXN1 CROCC
MET DDR2 HSD17B7P2 OR8H2 FAM47C MUC16 OR2T2
PTEN ATM WASH2P PBX2 AKAP6 BEST3 PCDH11X
AKT1 RET POTEC POLDIP2 ZNF804B DSPP REG3A
KEAP1 NOTCH1 EEF1B2 SLC6A10P ZEB1 MB21D2 REG1B
DDX11 EPB41L4A TBX6 PRB2 OR2T34 NTRK3 LRRIQ3
DNAH8 OR2M2 WDR62 CNTNAP2 LPA NTRK1 EPHA5
OR2B11 OR4C16 DCAF4L2 CDH10 MMP27 NF1 OR5L2
OR4K2 KCNB2 EPHA3 CDH12 VAV3 INHBA OR2T33
FAM47A STAG3L2 PTPRD RALGAPB THSD4 FGFR1 GNA15
RYR2 KRTAP4-8 NOTCH2 FOLH1 OR4N4
在本发明的一个实施例中,所述探针能够特异性结合所述547个基因中的表3所列60个基因的基因区域。探针能够特异性识别的表3的60个基因的基因区域,是发明人经过多次收集、多次筛选和多次试验组合获得的,这些基因区域组合与结直肠癌的发生发展相关。利用本发明方法中的这一试剂盒中的探针,能够一次性的、简单方便且高特异性的获取全部结直肠癌相关基因序列,而且基于检测这些基因序列获取的信息能够辅助结直肠癌的早期筛查诊断。
表3
KRAS SRC TLR3 EP300 TMPRSS13 EPHA5
BRAF PTEN MC4R CYLD PHF2 EPHA3
APC AXIN1 MLH1 FBN2 OPRD1 PTPRD
TP53 FLG AKT1 NF1 LILRB5 NTRK3
PIK3CA LIG1 CASD1 ASXL1 COL18A1 NTRK1
CTNNB1 MAP2K1 PTCH1 SMAD4 LARP4B ALK
NRAS PIK3R1 ADAMTS18 IRF5 DMKN ROS1
EGFR ERBB2 MSH2 DOCK3 ROBO2 RET
FBXW7 STK11 BAP1 MYOM1 KCNN3 PDGFRA
ARID1A IL7R CTNNA1 NEFH INHBA FGFR1
在本发明的一个实施例中,所述探针能够特异性识别所述547个基因中的表4所列43个基因的基因区域。探针能够特异性识别的表4的43个基因的基因区域,是发明人经过多次收集、多次筛选和多次试验组合获得的,这些基因区域组合与妇科生殖道肿瘤的发生发展相关。所说的生殖道肿瘤包括卵巢癌、子宫内膜癌和宫颈癌。利用本发明方法中的这一试剂盒中的探针,能够一次性的、简单方便且高特异性的获取全部生殖道肿瘤相关基因序列,而且基于检测这些基因序列获取的信息能够辅助生殖道肿瘤的早期筛查诊断。
表4
AFF3 BRCA2 FBXW7 MED12 PDE4DIP STK11
AKAP9 CDK12 FGFR2 MLL2 PIK3CA TP53
AKT1 CDKN2A FGFR3 MLL3 PIK3R1
APC CREBBP FOXL2 MSH6 PPP2R1A
ARID1A CSMD3 GNAS NF1 PTEN
BCOR CTNNB1 HRAS NFE2L2 RB1
BRAF EGFR KIT NRAS RNF213
BRCA1 FAT3 KRAS NSD1 RNF43
在本发明的一个实施例中,所述探针的长度为25-300nt,较佳的,为50-250nt,更佳的,为80nt-120nt。为获得能够在同一反应体系中同时特异性捕获所说的基因区域组合的探针,在本发明的一个实施例中,探针是通过先获得初始探针集,再筛选所述初始探针集来确定的。获取所述初始探针集包括:确定所述基因区域的参考序列,从所述参考序列的一端开始,在所述参考序列上依次获取DNA片段直至所述参考序列的另一端,其中,一条DNA片段为一条初始探针,全部所述DNA片段构成所述初始探针集,所述DNA片段之间完全重叠、部分重叠或完全不重叠,所述初始探针集能够覆盖所述基因区域至少一次。所说的基因区域的参考序列可以从参考基因组上获取,例如从人参考基因组HG19上获得对应的基因区域,所有的HG19上的对应的基因区域构成所说的基因区域的参考序列,HG19可以从NCBI数据库下载。在本发明的一个实施例中,利用迭代算法设计获取所述初始探针集,包括:确定所述基因区域在参考基因组上的位置,获取所述基因区域的参考序列,从所述参考序列的第一个核苷酸开始拷贝所述参考序列获取第一条DNA片段,从所述参考序列的第二个核苷酸开始拷贝所述参考序列获取第二条DNA片段,从所述参考序列的第三个核苷酸开始拷贝所述参考序列获取第三条DNA片段,这样依次获取后续DNA片段直至第N条DNA片段的一端超出所述参考序列,其中,一条DNA片段为一条初始探针,全部所述DNA片段构成所述初始探针集,N为所述初始探针集中包含的初始探针的总数,以获得能够全面覆盖目标基因区域的初始探针集,而且为使最终的探针具高特异性,在本发明的一个实施例中,进一步对所述筛选初始探针集,包括:将所述DNA片段(初始探针集)与所述参考序列比对,获得每一条DNA片段在参考序列上的比对次数,过滤掉比对次数超过1的DNA片段。为使最终的探针能在同一反应体系中捕获所说的基因区域,和/或使捕获的基因区域在同一反应条件下被一起洗脱下来,进一步对所述初始探针集进行筛选,包括:去除掉GC含量不在35-70%的DNA片段。
依据本发明的另一方面,本发明提供一种上述任一试剂盒在获取常见癌症相关基因序列中的用途,所述常见癌症包括肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌和肝癌。利用本发明一方面的试剂盒能够一次性、简单方便且高特异性的获取多种常见癌症的相关基因序列。上述对本发明一方面的或者任一具体实施方式中的试剂盒的优点和技术特征的描述,同样适用本发明这一方面的试剂盒的用途,在此不再赘述。
依据本发明的再一方面,提供一种上述任一试剂盒在常见癌症早期筛查中的用途,所述常见癌症包括肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌和肝癌。利用本发明一方面的试剂盒能够一次性、简单方便且高特异性的获取多种常见癌症的相关基因序列,检测分析这些相关基因序列,检测分析结果可以用于或者辅助用于多种常见癌症的早期筛查判断,增加人为的早期干预肿瘤的发生发展的可能性和效果。目前大部分癌症如肺癌、肝癌、胃癌等在医院病理确诊时已是晚期,耽误了较早的治疗时间大大的减少治愈的可能性。上述对本发明一方面的或者任一具体实施方式中的试剂盒的优点和技术特征的描述,同样适用本发明这一方面的试剂盒的用途,在此不再赘述。
依据本发明的又一方面,本发明提供一种构建目标区域测序文库的方法,所述方法包括:(a)获取待测样本中的核酸,所述核酸由多个核酸片段组成,所述核酸片段来自断裂的基因组DNA和/或游离的DNA;(b)末端修复所述核酸片段,获得末端修复片段;(c)加碱基A至所述末端修复片段的两端,获得粘性末端片段;(d)连接接头于所述粘性末端片段的两端,获得接头连接片段;(e)对所述接头连接片段进行第一扩增,获得第一扩增产物;(f)利用上述任一试剂盒对所述第一扩增产物进行捕获,获得所述目标区域;以及(g)对所述目标区域进行第二扩增,获得第二扩增产物,所述第二扩增产物构成所述目标区域测序文库;任选地,所述接头末端为T-粘性末端。本发明的这一方面的测序文库构建方法,特别适用于样本含微量核酸的测序文库的构建,在本发明的一个实施例中,样本为含微量游离DNA片段的血浆样本,包含极其微量的目标游离DNA片段,第一扩增使得核酸的量能满足芯片/探针杂交捕获的需求,而因芯片杂交捕获会损耗一定量的核酸,第二扩增能使捕获下的目标片段获得再次扩增以满足上机测序和质控检测的要求。本发明的这一文库构建方法特别适用于总游离核酸不低于10ng或者常规组织基因组DNA不低于1μg的样本的测序文库构建,利用本发明的这一方面的方法构建的目标区域文库,测序后的下机数据质量高,基于高质量的下机数据利于后续的准确检测分析。
依据本发明的一方面,本发明提供一种测序方法,所述方法包括:根据本发明一方面的测序文库构建方法构建目标区域测序文库;对所述目标区域测序文库进行测序,获得测序数据,所述测序数据由多个读段组成。测序可以利用已知平台进行,包括但不限于Illumina的Hiseq2000/2500平台、LifeTechnologies的IonTorrent平台和单分子测序平台。测序方式可以选择单端测序,也可以是双末端测序,在本发明的一个实施例中利用双末端测序,所得的测序数据由多对读段对组成。上述对任一本发明的试剂盒和测序文库构建方法的优点和技术特征的描述,同样适用本发明的这一方面的测序方法,在此不再赘述。
依据本发明的一方面,本发明提供一种检测目标区域变异的方法,所述方法包括:(1)利用前述本发明的任一测序方法,获得目标样本的目标区域测序数据;(2)基于所述测序数据,检测所述目标区域变异,获得变异位点信息,所述变异包括SNP、InDel、SV和CNV至少之一。在本发明的一个实施例中,步骤(2)包括:将所述测序数据与参考序列进行第一比对,获得第一比对结果;将所述第一比对结果与所述参考序列的一部分进行第二比对,获得第二比对结果;基于所述第一比对结果和所述第二比对结果,同时检测所述目标区域中的SNP、InDel、SV和CNV变异中的至少两种。为使变异检测结果更准确可信,在本发明的一个实施例中,在所述第一比对之前,对所述测序数据进行过滤,所述过滤包括去除掉不确定碱基比例超过10%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段。并且任选地,在所述第二比对之前,去除掉第一比对结果中的一个读段对中的两个读段相同的读段对。所说的参考序列的一部分包括目标区域参考序列中的每个已知InDel位点,以及所述每个已知InDel位点上下游各1000bp的参考序列。这里,所说的第二比对为局部比对,第一比对为常规全局比对,可利用但不限于SOAP或BWA等软件依照其默认设置进行,获得第一比对结果,第一比对结果包括读段在参考序列上的匹配位置及匹配情况信息,在本发明的一个实施例中,进行第二比对即基于第一比对结果,对与所捕获的基因区域对应的参考序列中的所有已知INDEL附近的所有序列信息(reads)进行局部重新比对,能够消除第一比对中的错误,提高后续变异检测的准确性,第二比对可利用GATK重比对软件(https://www.broadinstitute.org/gatk/)进行。在本发明的一个实施例中,通过GATKUnifiedGenotyper软件同时检测所说的SNP和INDEL变异。利用本发明的这一方面的变异检测方法,能够准确检测出突变频率为1%的低频突变。
在本发明的一个实施例中,步骤(2)还包括,当所检测出的变异位点中的至少之一满足以下,则判定所测样本为阳性样本:在阴性对照样本中的读段支持数少于2和在阳性对照样本中的突变率大于1%。在本发明的另一个实施例中,步骤(2)还包括,当所检测出的变异位点中的至少之一满足以下,则判定所测样本为阳性样本:测序深度不小于10X,至少有3个读段的支持,在阴性对照样本中的读段支持数少于2,在阳性对照样本中的突变率大于1%,以及变异位点的读段支持量与正常对照样本(阴性对照样本)相同位点的读段支持量具有显著差异。所说的阳性样本指肿瘤样本,两个实施例中的判定条件是发明人结合目前相关数据库信息和大量文献报道信息、检测统计大量阳性样本和大量阴性样本确定下来的,具有统计意义,后者比前者更为严格,较佳的,这里的阳性或者阴性对照样本超过30个,对照样本的数据可以自己对对照样本的核酸进行提取、序列测定来获得,也可以依照他人已公开或公开数据库中的的样本测序数据,多个对照样本数据使统计判定条件/结果具有统计意义,更加可信。依据两个判定条件中的任一判定的结果可以辅助用于临床的肿瘤诊断筛查,可辅助用于了解所测样本个体癌变的可能性及病情发展情况等。需要说明的是,所说的变异位点在待测样本中的读段支持量与正常对照样本(阴性对照样本)相同位点的读段支持量具有显著差异,其中的读段支持量,可以为支持该变异的读段的数目,也可以是支持该变异的读段在比对上该位点读段中的比例,在本发明的一个实施例中,采用后者来比较,所说的具有显著差异指具有实质差异,例如对于待测样本中的变异位点A,多个阳性样本(cancer样本)中的reads支持比例都为5/400(变异5条reads,总400条reads),即阳性样本中该位点的平均变异频率1.25%,而在多个阴性对照样本中的reads支持比例都为1/200(变异1条reads,总200条reads),即阴性对照样本中的平均变异频率0.5%,若待测样本中的该变异位点的变异频率更接近1.25%,例如达到0.9%,则达到所说的显著差异或者所说的实质差异。具有显著差异,也可以指统计学上的对数据差异性的评价——显著性差异,例如对待测样本中的变异位点A进行多次检测,获得该位点的多组比对结果数据,从每组比对结果数据中都可获得一个读段支持比例,所说的读段支持比例=支持该变异位点的读段数/比对上该位点的总读段数,接着比较待测样本的变异位点A的读段支持比例(变异频率)与阴性对照样本中的该位点的突变频率的差异,例如可以利用z检验或t检验,差异具有显著性(p≤0.05),即认为达到所说的具有显著差异。
依据本发明的一方面,本发明还提供一种检测目标区域变异的装置,用以实现或执行上述本发明一方面的或者任一具体实施方式的目标区域变异检测方法,所述装置包括:数据获取单元,用于实现上述本发明一方面的测序方法,获取目标区域的测序数据,所述测序数据由多个读段组成;检测单元,用于基于来自数据获取单元的测序数据,检测所述目标区域变异,获得变异位点信息,所述变异包括SNP、InDel、SV和CNV至少之一。本领域人员可以理解,本发明的装置中的全部或部分单元,可选择的、可拆卸的包含一个或多个子单元以执行或实现前述本发明方法的各个具体实施方式。
例如,在本发明的一个实施例中,如图1所示,装置1000中的检测单元200包括第一比对子单元13、第二比对子单元15和变异识别子单元17,所述第一比对子单元13用以将来自数据获取单元100的测序数据与参考序列进行第一比对,获得第一比对结果,所述第二比对子单元15用以将来自所述第一比对子单元13的第一比对结果与所述参考序列的一部分进行第二比对,获得第二比对结果,所述变异识别子单元17用以基于来自所述第一比对子单元13的第一比对结果和来自所述第二比对子单元15的第二比对结果,同时检测所述目标区域中的SNV、InDel、SV和CNV变异中的至少两种变异,获得变异位点信息,其中,所述参考序列的一部分包括目标区域参考序列中的每个已知InDel位点,以及所述每个已知InDel位点上下游各1000bp的参考序列。在本发明的一个实施例中,如图2所示,所述装置1000的检测单元200还包括第一过滤子单元12,所述第一过滤子单元12与所述第一比对子单元13连接,用于在所述测序数据进入所述第一比对子单13元之前,对所述测序数据进行过滤,所述过滤包括去除掉不确定碱基比例超过10%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段。任选的,如图3所示,所述检测单元200还包括第二过滤子单元14,所述第二过滤子单元分别14与所述第一比对子单元13和所述第二比对子单元15连接,用于在所述第一比对结果进入所述第二比对子单元15之前,去除掉来自所述第一比对子单元13的第一比对结果中的一个读段对中的两个读段相同的读段对。上述参考序列可以为HG19,所述第一比对单元中进行的第一比对为全局比对,所述第二比对子单元中进行的第二比对为局部比对。在本发明的一个实施例中,如图4所示,所述装置1000中的检测单元200还包括判定子单元19,所述判定子单元19用以判定来自所述变异识别子单元17中的变异位点是否满足以下,当所述变异位点中的至少一个满足以下则判定所述待测样本为阳性样本:在阴性对照样本中的读段支持数少于2条和在阳性对照样本中的突变率大于1%。在本发明的另一个实施例中,所述检测单元200还包括判定子单元19,所述判定子单元19用以判定来自所述变异识别子单元17中的变异位点是否满足以下,当所述变异位点中的至少一个满足以下则判定所述待测样本为阳性样本:测序深度不小于10X,至少有3个读段的支持,在阴性对照样本中的读段支持数少于2条,在阳性对照样本中的突变率大于1%,以及变异位点的读段支持量与正常对照样本相同位点的读段支持量具有显著差异。前述对本发明一方面或者任一具体实施方式中的目标区域变异检测方法的技术特征和优点的描述,同样适用于本发明这一方面的检测装置,在此不再赘述。
依据本发明的一方面,本发明还提供一种对癌症进行早期筛查的方法,所述方法包括:获取待测样本中的核酸;利用本发明一方面的或者任一具体实施方式的试剂盒捕获所述核酸,获得目标区域;对所述目标区域进行序列测定,获得测序数据,所述测序数据由多个读段组成;基于所述测序数据,检测所述目标区域中的变异,获得变异位点信息;基于所述变异位点中的至少之一满足以下(i)或者(ii),判定所述待测样本为阳性样本:(i)在阴性对照样本中的读段支持数少于2条和在阳性对照样本中的突变率大于1%;(ii)测序深度不小于10X,至少有3个读段的支持,在阴性对照样本中的读段支持数少于2条,在阳性对照样本中的突变率大于1%,以及其读段支持量与正常对照样本相同位点的读段支持量具有显著差异。上述对本发明一方面的目标区域变异检测方法和/装置的相应技术特征和优点的描述,同样适用于本发明这一方面的癌症早期筛查方法,在此不再赘述。本领域技术人员可以理解,本发明这一方面的方法中的全部或部分步骤,可以通过包含对应功能单元的装置来实现。
本发明的方法/装置,是一种高灵敏性、高特异性、高通量的方法/装置,能够辅助用于肿瘤早期筛查、术后监控以及多种肿瘤治疗方式(放化疗、靶向药物治疗等)效果监控,适用于辅助检测所有可提供外周血样本的肿瘤类型,包括常见高发肿瘤包括肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌以及肝癌等。通过使用新一代高通量测序技术,结合本发明一方面的试剂盒包含的能特异性捕获特定基因区域的探针,能够在很短的时间内同时进行多例样本检测,并且可以基于相同数据量进行更高深度的数据挖掘,检测出低频变异,而且检测结果特异性高,具较低的假阳性率、假阴性率,能够确保得到的检测结果能够准确的反应受检者的实时外周血状况。对外周血血浆游离DNA(cfDNA)中特异分子标记物进行监控检测,能够辅助应用在相关癌症的早期筛查、手术后监控、化疗/靶向治疗监控等方面,从而利于对肿瘤发病的早期预防、术后预后的随时监控以及多种肿瘤治疗方式的效果监控,大大降低肿瘤发病率并提高患者生存率等。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
图1是本发明的一个实施例中的目标区域变异检测装置的结构示意图;
图2是本发明的一个实施例中的目标区域变异检测装置的结构示意图;
图3是本发明的一个实施例中的目标区域变异检测装置的结构示意图;
图4是本发明的一个实施例中的目标区域变异检测装置的结构示意图。
具体实施方式
本发明中的“变异”、“核酸变异”、“基因变异”可通用,本发明中的“SNP”(SNV)、“CNV”、“插入缺失”(indel)和“结构变异”(SV)同通常定义,但本发明中对各种变异的大小不作特别限定,这样这几种变异之间有的有交叉,比如当插入/缺失的为大片段甚至整条染色体时,也属于发生拷贝数变异(CNV)或是染色体非整倍性,也属于SV。这些类型变异的大小交叉并不妨碍本领域人员通过上述描述执行实现本发明的方法和/或装置并且达到所描述的结果。
本发明中的“参考序列”为已知基因组序列或者已知基因组序列的至少一部分,本发明中所使用的“第一”、“第二”等仅为方便描述指代,不能理解为指示或暗示相对重要性,也不能理解为有先后顺序关系。本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
获得本发明一方面的试剂盒、实现本发明一方面的方法和/或装置,一般包括目标区域捕获探针/芯片的设计、微量样本建库及杂交上机测序、下机数据的生物信息分析和变异数据解读。
1.目标区域捕获芯片设计
基于TCGA、ICGC、COSMIC等数据库和收集提取大量相关参考文献中的信息,采用迭代算法设计出能够用于或者辅助用于肿瘤早诊、术后监控以及肿瘤治疗(放化疗、靶向药物治疗等)效果监控的目标区域捕获芯片CANPer,CANPer为液相芯片。CANPer芯片包括了常见高发癌症的相关驱动基因(DriverGene)、高频突变基因、癌症相关12条信号通路中重要基因,共计547个基因,300Kb。基因列表详见表1。
2.以下以肺癌结节早期患者样本检测为例进行操作说明,样本来自天津妇幼保健院。
(一)样本制备
1)抽取肺癌结节早期患者外周血5-10mL,存于EDTA抗凝管中,在4-6小时内对外周血进行分离,得到游离DNA,游离DNA(cfDNA)包含肿瘤DNA(ctDNA)游离片段。
2)cfDNA定量检测。
(二)文库制备及超高深度测序
1)对cfDNA片段进行末端修复;
2)对cfDNA片段末端加A;
3)连接Adapter文库接头:文库接头(Adapter)是指经过设计的一段碱基序列,作用在于cfDNA文库扩增时与引物相结合,使DNA扩增进行,并且在上机测序时与测序引物相结合,利于测序引物与待测序位点结合辅助DNA测序进行。
4)文库进行第一轮PCR扩增;
扩增后文库质控并进行肿瘤个体化芯片杂交;
杂交文库进行第二轮PCR扩增;
6)文库定量及质控;
7)IlluminaHiSeq2500/2000上机测序,测序深度达2000X以上。
(三)目标区域捕获测序下机数据进行生物信息分析
获得下机数据后需进行如下生物信息分析,得到最终的变异结果。
SOAPnuke过滤(filter):去除低质量reads;
与reference序列比对,产生bam文件;
标记重复序列;
比对结果不好的序列重新比对,并校正质量值;
去除错配序列;
分析下机数据质控(QC);
寻找变异;
对变异结果进行注释,得到最终数据结果。
(四)变异数据解读
对生物信息分析后的变异数据进行个体化解读,参考构建的肿瘤数据库及相关文献,对受检者检出的变异进行分析,用于辅助判断此肺部结节是否有发展为肿瘤的风险,以及良恶性情况等,用以辅助结合临床检验结果给予最适合的预防及治疗方式。
以下结合具体个体样本对利用本发明的试剂盒、本发明的方法/装置获得的检测结果进行详细的描述。下面示例,仅用于解释本发明,而不能理解为对本发明的限制。除另有交待,以下实施例中涉及的未特别交待的试剂、序列(接头、标签和引物)、软件及仪器,都是常规市售产品或者开源的,比如购自Illumina公司的hiseq2000测序平台建库相关试剂盒来进行文库构建等。
实施例1
以上述肺癌结节早期患者的外周血血浆作为待检样本,内容如下:
(一)外周血样本分离
1.采集受检者外周血1-2管(5mL/管)于EDTA抗凝管中,轻柔上下颠倒(防止细胞破裂)6-8次充分混匀,在采血当天4-6小时内进行以下处理;
2.在4℃条件下1600g离心10分钟,离心后将上清(血浆)分装到多个1.5mL/2mL离心管中,在吸取过程中不能吸到中间层白细胞;
3.在4℃条件下16000g离心10分钟,去除残余细胞,将上清(血浆)转移到新的1.5mL/2mL离心管中,不能吸到管底白细胞,即得到分离后所需血浆;
4.血浆样本处理完后,分离得到的血浆及剩余血细胞均保存到-80℃冰箱中,避免反复冻融。
(二)血浆游离DNA提取(采用QIAampCirculatingNucleicAcidKit)
1.加30μL蛋白酶K至1.5mL离心管中;
2.加入300μL血浆;
3.加入240μLBufferACL和1.68μLCarrierRNA(0.2μg/μL),涡旋振荡30s,60℃温浴30min,温浴期间适当取出振荡;
4.加入540μLBufferACB,涡旋振荡15-30s,冰上或-20℃冰箱放置5min;
5.取700μL血浆混合物加入过滤柱中,7500rpm离心30s;
6.过滤柱空甩8000rpm,1min;
7.加入600μLBufferACW1,8000rpm,1min离心洗涤;
8.加入700μLBufferACW2,8000rpm,1min离心洗涤;
9.加入700μL无水乙醇,8000rpm,1min离心洗涤;
10.过滤柱空甩14000rpm,3min;
11.把过滤柱放入新收集管中,打开盖子,56℃金属浴10min;
12.将柱子放入新离心管汇总,加入60μLBufferAVE回溶3min;
13.14.000rpm离心1min,Qubit(Invitrogen,theQuant-iTTMdsDNAHSAssayKit)定量质控所提取的cfDNA。
(三)文库构建(采用KAPALTPLibraryPreparationKit)
1.末端修复
反应后加入AgencourtAMPureXPreagent120μL,磁珠纯化后,使用42μLddH2O回溶,带磁珠进行下一步反应;
2.末端加A
反应后加入PEG/NaClSPRISolution90μL,充分混合并进行磁珠纯化,下步Adapter连接反应体系中Adapter和ddH2O加入量按照下面公式进行计算:10nM*建库起始DNA量(ng)*Adaper用量(μL)=15μM(Adapter浓度)*50μL,使用ddH2O用量(μL)=35μL-Adapter用量(μL)回溶,进行下一步反应;
3.接头连接
反应后,加入PEG/NaClSPRISolution50μL,进行第一次磁珠纯化,使用50μLTris-HCl(1mM,pH8.0)回溶;
再加入PEG/NaClSPRISolution50μL,进行第二次磁珠纯化,使用25μLTris-HCl(1mM,pH8.0)回溶;
4.第一轮PCR扩增
反应后加入AgencourtAMPureXPreagent90μL,磁珠纯化后,使用31μLddH2O回溶,取上清后质控并进行芯片杂交。
5.目标区域捕获芯片杂交
本实施例中采用委托Roche合成的上述基因芯片CANPer-1.75M,参照芯片制造商提供的说明书进行杂交捕获及洗脱。最后使用21μLddH2O回溶杂交洗脱磁珠。
6.第二轮PCR扩增
反应后加入AgencourtAMPureXPreagent108μL,磁珠纯化后,使用31μLEB回溶,取上清后质控并上机测序。
7.上机测序
本实施例中,采用IlluminaHiSeq2500PE101+8+101程序进行上机测序,测序实验操作按照制造商提供的操作说明书(参见Illumina/Solexa官方公布cBot)进行上机测序操作。
(四)下机数据生物信息分析
1.SOAPnukefilter:去除n≥10%和碱基质量值≤5的碱基数目>50%的reads;
2.Bwaaln->sampe|samtoolsview|samtoolssort:与reference序列比对,产生bam文件;
3.MarkDuplicates.jar:将同一个pe的相同的reads标记为重复;
4.GenomeAnalysisTK.jar-TRealignerTargetCreator、IndelRealigner:将比对不好的reads重新比对;
5.GenomeAnalysisTK.jar-TBaseRecalibrator、PrintReads:校正质量值;
6.Filt_bam:去掉mismatch≥3的reads;
7.QC:统计芯片的捕获效率、有效reads数、平均深度、重复率、覆盖度及未被覆盖的区间等信息;
8.识别SNV/InDel/SV/CNV及筛选其中的高频变异位点:
用MuTect(http://www.broadinstitute.org/cancer/cga/mutect)、varScan
(http://massgenomics.org/varscan)流程识别出SNP变异;
用gatk(https://www.broadinstitute.org/gatk/)、varScan、ForestSV
(http://sebatlab.ucsd.edu/index.php/software-data)流程识别出InDel变异;
用contra.py(http://contra-cnv.sourceforge.net/)流程识别出CNV;
用ForestSV(http://sebatlab.ucsd.edu/index.php/software-data)流程识别出SV;
所使用的筛选参数为:测序深度≥10X,在阴性(正常)样本中的变异率≤2%,在阳性样本中的变异率≥1%,在该待测样本数据中支持该变异的reads数≥3,与正常对照(体细胞)的读段支持比例具有显著差异(p≤0.05);
9.注释
注释变异的功能、reads支持数、变异频率、氨基酸变异及数据库Cosmic中的变异等,根据变异情况辅助判断疾病的可能来源。化疗药物对肿瘤细胞的杀伤效应与特定的一种(一组)基因的表达和/或多态性显著相关,通过相关基因的检测,预测化疗药物的疗效,选择合适的药物进行个体化化疗,已经成为提高疗效、减少无效治疗的合理选择。基于化疗药物以上特点,参考PharmGKB数据库,整合目前临床上所有的化疗药物以及与疗效相关的基因及疗效预测评判,形成化疗个体化用药解读数据库。并将化疗数据整合入肿瘤个体化信息流程,完成化疗药物的自动化解读。
靶向药物在肿瘤治疗中具有药效显著、副作用少的特点,但它对靶点(包括蛋白、DNA等)有依赖性,必须先对患者做靶点分析,才能确定患者能否用药。整合目前FDA批准的靶向药物,以及处于临床Ⅲ、Ⅳ的药物。依据NCCN临床指南,临床药物基因研究整理药物靶点基因与靶药疗效关系,形成肿瘤个体化靶药解读数据库。
10.结果分析
该样本检测到EGFR基因第451位氨基酸错义突变,属于12号外显子,该变异位点位于蛋白胞外拓扑结构域内,在COSMIC数据库中暂无记载,但相同位点所产生的p.[R451H]错义突变记载1次,报道与肺癌相关(18948947)。功能预测显示该变异为有害性变异,预测可能对基因功能产生影响。
人表皮生长因子受体,原癌基因c-erbB1的表达产物,属于受体酪氨酸激酶家族成员。EGFR主要位于细胞膜表面,通过与配体的结合激活自身酪氨酸磷酸化,自磷酸化促进下游信号传导途径,包括MPAK,PI3K和JNK通路等,诱导细胞增殖,分化等。在许多实体肿瘤中存在EGFR的突变或异常表达。临床研究表明EGFR突变阳性(18号外显子突变、19号外显子缺失、21号外显子突变)的患者对EGFR-TKI敏感(23344264),而野生型患者基本无效(23883922);20号外显子的突变(T790M为主,插入突变)与EGFR-TKI继发性耐药性相关(22263058)。
实施例2肺癌
1.目标区域捕获芯片设计
基于TCGA、ICGC、COSMIC等数据库和相关和收集提取大量相关参考文献中的信息,采用迭代算法设计出能够用于或者辅助用于肺癌早筛诊断的目标区域捕获芯片LungPer。LungPer芯片包括了肺癌相关的驱动基因(DriverGene)、高频突变基因、癌症相关12条信号通路中重要基因,靶药及化疗药物相关基因等,共计145个基因,250Kb。基因列表如表2所示。
2.以受检者外周血样本检测为例进行操作说明,样本来自天津妇幼保健院。
同实施例1。
3.测序分析
按照实施例1的方法,测序结果如表5所示,检测结果见表6。
表5
表6
Gene cHGVS pHGVS Function 阳性样本变异频率(tumor_var_freq,%)
ALK c.[334G>A] p.[A112T] missense(错义) 1.22
ROS1 c.[1478G>A] p.[R493H] missense 1.07
EGFR c.[1351C>T] p.[R451C] missense 1.41
TSC1 c.[2066G>A] p.[R689H] missense 1.32
ATM c.[4723C>T] p.[R1575C] missense 1.36
该样本检测到EGFR基因第451位氨基酸错义突变,属于12号外显子,该变异位点位于蛋白胞外拓扑结构域内,在COSMIC数据库中暂无记载,但相同位点所产生的p.[R451H]错义突变记载1次,报道与肺癌相关(18948947)。功能预测显示该变异为有害性变异,预测可能对基因功能产生影响。
人表皮生长因子受体,原癌基因c-erbB1的表达产物,属于受体酪氨酸激酶家族成员。EGFR主要位于细胞膜表面,通过与配体的结合激活自身酪氨酸磷酸化,自磷酸化促进下游信号传导途径,包括MPAK,PI3K和JNK通路等,诱导细胞增殖,分化等。在许多实体肿瘤中存在EGFR的突变或异常表达。临床研究表明EGFR突变阳性(18号外显子突变、19号外显子缺失、21号外显子突变)的患者对EGFR-TKI敏感(23344264),而野生型患者基本无效(23883922);20号外显子的突变(T790M为主,插入突变)与EGFR-TKI继发性耐药性相关(22263058)。
从突变分析结果看出该受检者检出与肺癌发生发展相关的重要变异,再结合临床诊断情况,可辅助判断该受检者患结肺癌的风险及良恶性情况。
实施例3结直肠癌相关基因检测
一、芯片设计
基于TCGA、ICGC、COSMIC等数据库和相关和收集提取大量相关参考文献中的信息,采用迭代算法设计出能够用于或者辅助结直肠癌早筛诊断的目标区域捕获芯片ColorectalPer。ColorectalPer芯片包括了结直肠癌相关的驱动基因(DriverGene)、高频突变基因、癌症相关12条信号通路中重要基因,靶药及化疗药物相关基因等,共计60个基因,如表3所示,共123Kb。
二、以受检者外周血样本检测为例进行操作说明,样本来自天津妇幼保健院。
同实施例1。
三、测序分析
按照一般方法的步骤进行分析,测序数据统计结果如表7,变异检测结果如表8所示。
表7
表8
Gene cHGVS pHGVS Function tumor_var_freq(%)
KRAS c.[35G>A] p.[Gly12Asp] missense 15.07
ARID1A c.[805C>T] p.[Gln269*] nonsense 1.22
ROS1 c.[5557+750T>G] . intron 1.01
NRAS c.[291-59C>A] . intron 1.09
MSH2 c.[1663C>T] p.[Arg555*] nonsense 9.38
该样本检出KRASp.[Gly12Asp]的错义突变,该变异在COSMIC数据库中记载10303次,约60%均报道与大肠癌发病相关。KRAS第12号密码子位于GTP结构域上,是KRAS最常见突变。
KRAS属于Ras基因家族成员,编码P21蛋白,在MAPK信号通路中起作用,是致癌基因,能够与GDP/GTP结合并促进GTP酶活性。当KRAS发生突变时不能被水解酶水解失活,处于持续激活状态,引起RAF/MAPK的上调,传递多种生存通路信号,从而使细胞过度生长、增殖,抵抗EGFR-TKIs的作用。其突变可以导致多种恶性肿瘤,包括肺癌,黏蛋白腺瘤,胰腺导管癌和结肠癌等。KRAS基因被激活最常见的方式是点突变,多发生在N端的第12、13和61、146密码子,其中以第12密码子突变最常见。不同突变位点对P21蛋白的活化机制不同,第12密码子突变可以减弱P21内在的GTP酶活性,并使细胞凋亡减少,细胞间接触抑制减弱。
该样本检出MSH2p.[Arg555*]的无义突变,该变异在COSMIC数据库暂无记载。MSH2第555号密码子所在区域功能研究不详,但此无义突变的发生会导致蛋白编码的提前终止,使得基因主要功能区无法表达,可能使基因功能受到损伤或丧失。
所编码的蛋白是DNA错配修复系统(MMR)的组分之一,形成2种不同的异二聚体:MutSα(MSH2-MSH6异二聚体)以及MutSβ(MSH2-MSH3异二聚体),可与DNA错配部位相结合因此启动DNA的修复功能。在错配结合之后,MutSα或β与MutLα异二聚体形成一个三元复合物,负责指导下游的MMR事件,包括链的识别、切除以及再合成。ATP的结合及水解在错配修复功能上起重要作用,ATP酶活性与MutSα相关。MutSα还可以在DNA同源重组修复功能上起作用。此基因与遗传性非息肉性结直肠癌类型I以及子宫内膜癌相关。
从突变分析结果看出该受检者检出与结直肠癌发生发展相关的重要变异,再结合临床诊断情况,可辅助判断该受检者患结直肠癌的风险及良恶性情况。
实施例4妇科生殖道肿瘤相关基因检测
一、目标区域捕获芯片设计
基于TCGA、ICGC、COSMIC等数据库和相关和收集提取大量相关参考文献中的信息,采用迭代算法设计出能够用于或者辅助妇科生殖道肿瘤早筛诊断的目标区域捕获芯片WCNPer。WCNPer芯片包括了妇科生殖道肿瘤相关的驱动基因(DriverGene)、高频突变基因、癌症相关12条信号通路中重要基因,靶药及化疗药物相关基因等,共计43个基因,如表4所示,共300Kb。
二、以受检者的外周血血浆作为研究对象,样本来自天津妇幼保健院,参考实施例1进行试验及数据分析。
三、结果分析
测序数据统计结果如表9,变异检测结果如表10所示。
表9
表10
该样本检出BRAFp.[G469V]的错义突变,该变异在COSMIC数据库中记载17次,在肺、大肠、胆道、上呼吸道、食道等肿瘤中检测发现。BRAF第469号密码子位于蛋白激酶结构域的ATP结合区,一项黑色素瘤的研究显示该突变为激活突变,可能导致BRAF从非活性状态变为活性状态或使得BRAF信号通路异常激活,与疾病的发生发展可能相关。
BRAF基因编码MAPK通路中的丝氨酸苏氨酸蛋白激酶,该酶可将信号由Ras转导至MEK1/2,从而参与细胞功能的调控,影响细胞分类、分化和分泌。此基因产生的突变与多种类型的癌症相关,如结直肠癌、肺癌、肝癌、胰腺癌、甲状腺癌、卵巢癌等。在卵巢癌中,BRAF基因突变频率为8%,是卵巢癌发生发展过程中的driver基因。
该样本检出TP53p.[G266V]的错义突变,该变异在COSMIC数据库中记载43次,在肺部、大肠、胰腺、卵巢等肿瘤中检测发现。TP53第266号密码子位于序列特异的DNA结合结构域,是TP53发挥功能的重要结构域,该变异可能使TP53的完整功能受到影响或丧失,TP53是肿瘤发生发展中的Driver基因,完整功能受到影响或丧失,可能与疾病发生发展相关。
TP53基因是迄今发现与肿瘤相关性最高的基因之一。作为重要的抑癌基因,在细胞周期调控,DNA损伤修复、细胞分化、凋亡和衰老等过程中发挥了关键作用。TP53基因与50%以上的人类恶性肿瘤有关。临床研究证实肿瘤中95.1%的p53点突变主要发生在高度保守的175、245、248、249、273和282位点。目前很多肿瘤治疗通过调控TP53蛋白实现。TP53基因在多种癌症中均有临床应用研究。TP53(外显子5-8)发生突变的乳腺癌患者预后较差,他莫昔芬疗效也明显降低。TP53的基因突变与功能丧失是卵巢癌中最常见的基因异常之一。
从突变分析结果看出该受检者检出与妇科疾病相关的重要变异,再结合临床诊断情况,可辅助判断该受检者患妇科肿瘤的风险及良恶性情况。
上面所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通工程技术人员对本发明技术方案所做出的各种变形和改进,均应落入本发明的权利要求书确定的保护范围内。

Claims (14)

1.一种试剂盒,其包含探针,所述探针固定在固相基质上或者所述探针游离于溶液中,所述探针能够特异性识别表1所列547个基因中的至少10个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的表2所列的145个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的表3所列的60个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的表4所列的43个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的至少100个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的至少200个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的至少300个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的至少400个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因中的至少500个基因的基因区域;
任选地,所述探针能够特异性识别所述547个基因的基因区域;
任选地,所述探针的长度为25-300nt。
2.权利要求1的试剂盒,其特征在于,所述探针的获得包括,获得初始探针集以及筛选所述初始探针集。
3.权利要求2的试剂盒,其特征在于,所述获得初始探针集包括:
确定所述基因区域的参考序列,
从所述参考序列的一端开始,在所述参考序列上依次获取DNA片段直至所述参考序列的另一端,其中,
一条DNA片段为一条初始探针,全部所述DNA片段构成所述初始探针集,所述DNA片段之间完全重叠、部分重叠或完全不重叠,所述初始探针集能够覆盖所述基因区域至少一次。
4.权利要求2的试剂盒,其特征在于,所述获取初始探针集包括:
确定所述基因区域在参考基因组上的位置,获取所述基因区域的参考序列,
从所述参考序列一端的第一个核苷酸开始拷贝所述参考序列获取第一条DNA片段,
从所述参考序列一端的第二个核苷酸开始拷贝所述参考序列获取第二条DNA片段,
从所述参考序列一端的第三个核苷酸开始拷贝所述参考序列获取第三条DNA片段,
这样依次获取后续DNA片段直至第N条DNA片段的一端超出所述参考序列的另一端,其中,
一条DNA片段为一条初始探针,全部所述DNA片段构成所述初始探针集,N为所述初始探针集中包含的初始探针的总数。
5.权利要求3或4的试剂盒,其特征在于,所述筛选初始探针集包括:
将所述DNA片段与所述参考序列比对,获得每一条DNA片段在参考序列上的比对次数,过滤掉比对次数超过1的DNA片段。
6.权利要求5的试剂盒,其特征在于,所述筛选初始探针还包括,去除掉GC含量不在35-70%的DNA片段。
7.权利要求1-6任一试剂盒在获取常见癌症相关基因序列中的用途,所述常见癌症包括肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌和肝癌。
8.权利要求1-6任一试剂盒在常见癌症早期筛查中的用途,所述常见癌症包括肺癌、结直肠癌、胃癌、乳腺癌、肾癌、胰腺癌、卵巢癌、子宫内膜癌、甲状腺癌、宫颈癌、食管癌和肝癌。
9.一种构建目标区域测序文库的方法,其特征在于,包括:
(a)获取待测样本中的核酸,所述核酸由多个核酸片段组成,所述核酸片段来自断裂的基因组DNA和/或游离的DNA;
(b)末端修复所述核酸片段,获得末端修复片段;
(c)加碱基A至所述末端修复片段的两端,获得粘性末端片段;
(d)连接接头于所述粘性末端片段的两端,获得接头连接片段;
(e)对所述接头连接片段进行第一扩增,获得第一扩增产物;
(f)利用权利要求1-6任一试剂盒对所述第一扩增产物进行捕获,获得所述目标区域;以及,
(g)对所述目标区域进行第二扩增,获得第二扩增产物,所述第二扩增产物构成所述目标区域测序文库;
任选地,所述接头末端为T-粘性末端。
10.一种测序方法,其特征在于,包括:
根据权利要求9的方法构建目标区域测序文库;
对所述目标区域测序文库进行测序,获得测序数据,所述测序数据由多个读段组成;
任选地,所述测序为双末端测序,所述测序数据由多对读段对组成。
11.一种检测目标区域变异的方法,其特征在于,包括,
(1)利用权利要求10的方法,获得测序数据;
(2)基于所述测序数据,检测所述目标区域变异,获得变异位点信息,所述变异包括SNV、InDel、SV和CNV至少之一。
12.权利要求11的方法,其特征在于,步骤(2)包括,
将所述测序数据与参考序列进行第一比对,获得第一比对结果;
将所述第一比对结果与所述参考序列的一部分进行第二比对,获得第二比对结果;
基于所述第一比对结果和所述第二比对结果,同时检测所述目标区域中的SNP、InDel、SV和CNV变异中的至少两种;其中,
所述参考序列的一部分包括目标区域参考序列中的每个已知InDel位点,以及所述每个已知InDel位点上下游各1000bp的参考序列;
任选地,在所述第一比对之前,对所述测序数据进行过滤,所述过滤包括去除掉不确定碱基比例超过10%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段;
任选地,在所述第二比对之前,去除掉第一比对结果中的一个读段对中的两个读段相同的读段对;
任选地,所述参考序列为HG19;
任选地,所述第一比对为全局比对,所述第二比对为局部比对。
13.权利要求11或12的方法,其特征在于,步骤(2)还包括,当所述变异位点中的至少之一满足以下,则判定所述待测样本为阳性样本:
在阴性对照样本中的读段支持数少于2条和在阳性对照样本中的突变率大于1%;
任选地,步骤(2)还包括,当所述变异位点中的至少之一满足以下,则判定所述待测样本为阳性样本:
测序深度不小于10X,
至少有3个读段的支持,
在阴性对照样本中的读段支持数少于2条,
在阳性对照样本中的突变率大于1%,以及
变异位点的读段支持量与正常对照样本相同位点的读段支持量具有显著差异。
14.一种检测目标区域变异的装置,其特征在于,包括,
数据获取单元,用于实现权利要求10的方法,获取所述目标区域的测序数据,所述测序数据由多个读段组成;
检测单元,用于基于来自数据获取单元的测序数据,检测所述目标区域变异,获得变异位点信息,所述变异包括SNV、InDel、SV和CNV至少之一;
任选地,所述检测单元包括第一比对子单元、第二比对子单元和变异识别子单元,
所述第一比对子单元用以将来自数据获取单元的测序数据与参考序列进行第一比对,获得第一比对结果,
所述第二比对子单元用以将来自所述第一比对子单元的第一比对结果与所述参考序列的一部分进行第二比对,获得第二比对结果,
所述变异识别子单元用以基于来自所述第一比对子单元的第一比对结果和来自所述第二比对子单元的第二比对结果,同时检测所述目标区域中的SNV、InDel、SV和CNV变异中的至少两种,获得变异位点信息,其中,
所述参考序列的一部分包括目标区域参考序列中的每个已知InDel位点,以及所述每个已知InDel位点上下游各1000bp的参考序列;
任选地,所述检测单元还包括第一过滤子单元,所述第一过滤子单元与所述第一比对子单元连接,用于在所述测序数据进入所述第一比对子单元之前,对所述测序数据进行过滤,所述过滤包括去除掉不确定碱基比例超过10%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段;
任选地,所述检测单元还包括第二过滤子单元,所述第二过滤子单元分别与所述第一比对子单元和所述第二比对子单元连接,用于在所述第一比对结果进入所述第二比对子单元之前,去除掉来自所述第一比对子单元的第一比对结果中的一个读段对中的两个读段相同的读段对;
任选地,所述参考序列为HG19;
任选地,所述第一比对单元中的第一比对为全局比对,所述第二比对子单元中的第二比对为局部比对;
任选地,所述检测单元还包括判定子单元,所述判定子单元用以判定来自所述变异识别子单元中的变异位点是否满足以下,当所述变异位点中的至少一个满足以下则判定所述待测样本为阳性样本:
在阴性对照样本中的读段支持数少于2条和在阳性对照样本中的突变率大于1%;
任选地,所述检测单元还包括判定子单元,所述判定子单元用以判定来自所述变异识别子单元中的变异位点是否满足以下,当所述变异位点中的至少一个满足以下则判定所述待测样本为阳性样本:
测序深度不小于10X,
至少有3个读段的支持,
在阴性对照样本中的读段支持数少于2条,
在阳性对照样本中的突变率大于1%,以及
变异位点的读段支持量与正常对照样本相同位点的读段支持量具有显著差异。
CN201410778723.4A 2014-12-15 2014-12-15 试剂盒及其用途 Pending CN105779434A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410778723.4A CN105779434A (zh) 2014-12-15 2014-12-15 试剂盒及其用途
HK16112046.1A HK1223969A1 (zh) 2014-12-15 2016-10-19 試劑盒及其用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410778723.4A CN105779434A (zh) 2014-12-15 2014-12-15 试剂盒及其用途

Publications (1)

Publication Number Publication Date
CN105779434A true CN105779434A (zh) 2016-07-20

Family

ID=56374803

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410778723.4A Pending CN105779434A (zh) 2014-12-15 2014-12-15 试剂盒及其用途

Country Status (2)

Country Link
CN (1) CN105779434A (zh)
HK (1) HK1223969A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107723352A (zh) * 2016-08-12 2018-02-23 嘉兴允英医学检验有限公司 一种循环肿瘤dna肝癌驱动基因高通量检测方法
CN107841793A (zh) * 2017-08-02 2018-03-27 重庆市肿瘤研究所 肺癌多基因突变文库的构建方法
CN108148910A (zh) * 2017-12-18 2018-06-12 广东省人民医院(广东省医学科学院) 一种肺癌相关的285基因靶向捕获测序试剂盒及其应用
CN108315425A (zh) * 2018-04-10 2018-07-24 广东省人民医院(广东省医学科学院) 甲状腺癌转移相关基因检测用的pcr特异性引物、试剂盒及其使用方法
CN108315424A (zh) * 2018-04-10 2018-07-24 广东省人民医院(广东省医学科学院) 甲状腺结节良恶性相关基因的pcr特异性引物、检测试剂盒及检测方法
CN108588201A (zh) * 2018-05-11 2018-09-28 浙江省人民医院 一种结直肠癌西妥昔单抗耐药性痕量dna突变检测的方法及装置
CN109554475A (zh) * 2018-12-29 2019-04-02 江苏为真生物医药技术股份有限公司 用于肺结节良恶性鉴别的基因突变/融合组合及试剂盒
CN109609646A (zh) * 2019-01-23 2019-04-12 浙江大学 一种用于监测上皮性卵巢癌易感性的检测试剂盒
CN110878358A (zh) * 2019-12-19 2020-03-13 上海宝藤生物医药科技股份有限公司 一组甲状腺癌标志物及其应用
CN112391455A (zh) * 2019-08-14 2021-02-23 宁波爱她基因科技有限公司 一种用于同源重组修复缺陷检测的试剂盒
WO2021169874A1 (zh) * 2020-02-25 2021-09-02 博尔诚(北京)科技有限公司 一种检测3种管腔性器官肿瘤的探针组合物
CN113481299A (zh) * 2021-06-30 2021-10-08 苏州京脉生物科技有限公司 用于肺癌检测的靶向测序panel、试剂盒及获得靶向测序panel的方法
CN113652484A (zh) * 2021-08-03 2021-11-16 苏州京脉生物科技有限公司 测序panel的应用、试剂盒及测序文库的制备方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030194724A1 (en) * 2002-04-10 2003-10-16 Sorenson Jon M Mutation detection and identification
WO2012031008A2 (en) * 2010-08-31 2012-03-08 The General Hospital Corporation Cancer-related biological materials in microvesicles
WO2013097328A1 (zh) * 2011-12-29 2013-07-04 深圳华大基因科技服务有限公司 基因组indel位点标记方法和装置
WO2013127049A1 (zh) * 2012-02-27 2013-09-06 深圳华大基因科技有限公司 一种检测染色体sts区域微缺失的方法及其装置
CN103290137A (zh) * 2013-06-26 2013-09-11 北京迈基诺基因科技有限责任公司 一种肿瘤易感基因的筛查方法
CN103993069A (zh) * 2014-03-21 2014-08-20 深圳华大基因科技服务有限公司 病毒整合位点捕获测序分析方法
CN104059966A (zh) * 2014-05-20 2014-09-24 吴松 Stag2基因突变序列、其检测方法以及stag2基因突变在检测膀胱癌中的应用

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030194724A1 (en) * 2002-04-10 2003-10-16 Sorenson Jon M Mutation detection and identification
WO2012031008A2 (en) * 2010-08-31 2012-03-08 The General Hospital Corporation Cancer-related biological materials in microvesicles
WO2013097328A1 (zh) * 2011-12-29 2013-07-04 深圳华大基因科技服务有限公司 基因组indel位点标记方法和装置
WO2013127049A1 (zh) * 2012-02-27 2013-09-06 深圳华大基因科技有限公司 一种检测染色体sts区域微缺失的方法及其装置
CN103290137A (zh) * 2013-06-26 2013-09-11 北京迈基诺基因科技有限责任公司 一种肿瘤易感基因的筛查方法
CN103993069A (zh) * 2014-03-21 2014-08-20 深圳华大基因科技服务有限公司 病毒整合位点捕获测序分析方法
CN104059966A (zh) * 2014-05-20 2014-09-24 吴松 Stag2基因突变序列、其检测方法以及stag2基因突变在检测膀胱癌中的应用

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
CHAN, TSUN LEUNG ET AL.: "Heritable germline epimutation of MSH2 in a family with hereditary nonpolyposis colorectal cancer", 《NATURE GENETICS》 *
DAVIES, H ET AL.: "Mutations of the BRAF gene in human cancer", 《NATURE》 *
DE ROOCK ET AL.: "Effects of KRAS, BRAF, NRAS, and PIK3CA mutations on the efficacy of cetuximab plus chemotherapy in chemotherapy-refractory metastatic colorectal cancer: a retrospective consortium analysis", 《LANCET ONCOLOGY》 *
MUZNY, DM ET AL.: "Comprehensive molecular characterization of human colon and rectal cancer", 《NATURE》 *
THE CANCER GENOME ATLAS RESEARCH NETWORK: "Comprehensive molecular profiling of lung adenocarcinoma", 《NATURE》 *
THE CANCER GENOME ATLAS RESEARCH NETWORK: "Integrated genomic analyses of ovarian carcinoma", 《NATURE》 *
YUN, CAI-HONG ET AL.: "Structures of Lung Cancer-Derived EGFR Mutants and Inhibitor Complexes: Mechanism of Activation and Insights into Differential Inhibitor Sensitivity", 《CANCER CELL 》 *
张雨豪 等: "基于高通量测序数据的结构变异检测方法的研究", 《智能计算机与应用》 *
邓祯祥: "癌症基因组图谱计划数据及分析", 《中国肿瘤临床》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107723352A (zh) * 2016-08-12 2018-02-23 嘉兴允英医学检验有限公司 一种循环肿瘤dna肝癌驱动基因高通量检测方法
CN107841793A (zh) * 2017-08-02 2018-03-27 重庆市肿瘤研究所 肺癌多基因突变文库的构建方法
CN108148910A (zh) * 2017-12-18 2018-06-12 广东省人民医院(广东省医学科学院) 一种肺癌相关的285基因靶向捕获测序试剂盒及其应用
CN108315424B (zh) * 2018-04-10 2021-08-06 广东省人民医院(广东省医学科学院) 甲状腺结节良恶性相关基因的pcr特异性引物、检测试剂盒及检测方法
CN108315425A (zh) * 2018-04-10 2018-07-24 广东省人民医院(广东省医学科学院) 甲状腺癌转移相关基因检测用的pcr特异性引物、试剂盒及其使用方法
CN108315424A (zh) * 2018-04-10 2018-07-24 广东省人民医院(广东省医学科学院) 甲状腺结节良恶性相关基因的pcr特异性引物、检测试剂盒及检测方法
CN108588201A (zh) * 2018-05-11 2018-09-28 浙江省人民医院 一种结直肠癌西妥昔单抗耐药性痕量dna突变检测的方法及装置
CN109554475A (zh) * 2018-12-29 2019-04-02 江苏为真生物医药技术股份有限公司 用于肺结节良恶性鉴别的基因突变/融合组合及试剂盒
WO2020134950A1 (zh) * 2018-12-29 2020-07-02 江苏为真生物医药技术股份有限公司 用于肺结节良恶性鉴别的基因突变/融合组合及试剂盒
CN109609646A (zh) * 2019-01-23 2019-04-12 浙江大学 一种用于监测上皮性卵巢癌易感性的检测试剂盒
CN109609646B (zh) * 2019-01-23 2022-04-26 浙江大学 一种用于监测上皮性卵巢癌易感性的检测试剂盒
CN112391455A (zh) * 2019-08-14 2021-02-23 宁波爱她基因科技有限公司 一种用于同源重组修复缺陷检测的试剂盒
CN110878358B (zh) * 2019-12-19 2020-08-25 上海宝藤生物医药科技股份有限公司 一组甲状腺癌标志物及其应用
CN110878358A (zh) * 2019-12-19 2020-03-13 上海宝藤生物医药科技股份有限公司 一组甲状腺癌标志物及其应用
WO2021169874A1 (zh) * 2020-02-25 2021-09-02 博尔诚(北京)科技有限公司 一种检测3种管腔性器官肿瘤的探针组合物
CN113481299A (zh) * 2021-06-30 2021-10-08 苏州京脉生物科技有限公司 用于肺癌检测的靶向测序panel、试剂盒及获得靶向测序panel的方法
CN113481299B (zh) * 2021-06-30 2022-05-10 苏州京脉生物科技有限公司 用于肺癌检测的靶向测序panel、试剂盒及获得靶向测序panel的方法
CN113652484A (zh) * 2021-08-03 2021-11-16 苏州京脉生物科技有限公司 测序panel的应用、试剂盒及测序文库的制备方法

Also Published As

Publication number Publication date
HK1223969A1 (zh) 2017-08-11

Similar Documents

Publication Publication Date Title
CN105779434A (zh) 试剂盒及其用途
CN108424955B (zh) 一种检测多种变异类型基因的高通量测序方法及其应用
CN105780129B (zh) 目标区域测序文库构建方法
CN108753967A (zh) 一种用于肝癌检测的基因集及其panel检测设计方法
CN103797120B (zh) 前列腺癌的生物学标志物、治疗靶点及其用途
WO2016095093A1 (zh) 肿瘤筛查方法、目标区域变异检测方法和装置
Lih et al. Analytical validation and application of a targeted next-generation sequencing mutation-detection assay for use in treatment assignment in the NCI-MPACT trial
CN106047998A (zh) 一种肺癌基因的检测方法及应用
CN103981273B (zh) 一组评估乳腺癌风险的突变基因群及其检测试剂盒
CA2784613C (en) Diagnostic methods based on somatically acquired rearrangement
CN105986031B (zh) 肿瘤易感62基因及其应用
CN105779435A (zh) 试剂盒及其用途
CN107577921A (zh) 一种肿瘤靶向基因测序数据解析方法
CN113151474A (zh) 用于癌症检测的血浆dna突变分析
CN105779432A (zh) 试剂盒及其用途
Sumbal et al. Circulating tumor DNA in blood: Future genomic biomarkers for cancer detection
CN105925665A (zh) 试剂盒、建库方法以及检测目标区域变异的方法及系统
CN105779433A (zh) 试剂盒及其用途
CN105950709A (zh) 试剂盒、建库方法以及检测目标区域变异的方法及系统
CN116631508B (zh) 肿瘤特异性突变状态的检测方法及其应用
CN110004229A (zh) 多基因作为egfr单克隆抗体类药物耐药标志物的应用
Mattox et al. Detection of malignant peripheral nerve sheath tumors in patients with neurofibromatosis using aneuploidy and mutation identification in plasma
CN115298326A (zh) 用于癌症分析的方法和组合物
Krumbholz et al. Molecular composition of genomic TMPRSS2-ERG rearrangements in prostate cancer
CN106498062A (zh) 一种诊断前列腺癌的产品及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1223969

Country of ref document: HK

RJ01 Rejection of invention patent application after publication

Application publication date: 20160720

RJ01 Rejection of invention patent application after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1223969

Country of ref document: HK