CN110106063B - 基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统 - Google Patents
基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统 Download PDFInfo
- Publication number
- CN110106063B CN110106063B CN201910373158.6A CN201910373158A CN110106063B CN 110106063 B CN110106063 B CN 110106063B CN 201910373158 A CN201910373158 A CN 201910373158A CN 110106063 B CN110106063 B CN 110106063B
- Authority
- CN
- China
- Prior art keywords
- gsnp
- sample
- judging
- loh
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6858—Allele-specific amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统。该系统包括:SNP位点筛选装置、无对照样本SNP检测装置和/或有对照样本SNP检测装置,其中,SNP位点筛选装置用于根据现有数据库筛选人类1号染色体和19号染色体上的SNP位点得到第一组SNP位点,无对照样本SNP检测装置包括:第一测序模块,用于对待测样本和一组阴性样本进行测序;第一SNP检测模块;第一gSNP位点筛选模块;第二SNP检测模块;第一计算统计模块;以及第一判断模块。应用本发明的系统同时结合1q和19p上的信息对1p和19q的信息做校正,提高了检测准确性,可以高效、便捷、准确地进行1p/19q联合缺失鉴定。
Description
技术领域
本发明涉及医疗器械技术领域,具体而言,涉及一种基于二代测序的用于神经胶质瘤 1p/19q联合缺失检测的系统。
背景技术
高通量测序技术(High-Throughput Sequencing)是将DNA连接接头,制备测序文库,通过对文库中数以万计的克隆进行延伸反应,检测对应的信号,最终获取序列信息,一次对几十万到几百万条DNA分子进行测序,这是对传统一代测序的革命性改变,所以称为下一代测序(Next Generation Sequencing,NGS),同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又称为浓度测序(Deep sequencing)。
NGS检测方法通量高,可对大量的基因进行检测,满足临床检测的需求,既可以对已知突变位点进行检测,也能对未知突变位点进行检测,此外NGS检测方法还可以对各种突变类型进行检测,对临床上的各类样本,如全血、组织、FFPE样本、cfDNA等其他样本类型均能够进行检测。
当前主要的测序技术平台,主要分为:
(1)Solexa测序技术(目前主流的illumina测序平台);
(2)454测序技术(读长长,但是准确度较低,成本较高,及焦磷酸测序技术,时长占有少);
(3)Solid测序技术(双色编码技术)。
目标序列捕获测序技术(Targeted Resequencing)是针对感兴趣的基因组区域设计特异性探针,将其与基因组DNA进行杂交,富集目标基因组区域的DNA片段,而后利用高通量测序技术进行测序的检测方法。
脑胶质瘤(Glioma)是最常见的颅内原发恶性肿瘤,在成年人中,胶质瘤是最常见的原发性颅内肿瘤,约占所有脑部肿瘤的30~40%。在原发性恶性中枢神经系统肿瘤中,胶质母细胞瘤(Glioblastoma,GBM)的发病率最高,占了46.1%,约为3.20/100000,中位发病年龄为 65岁,中位总生存期为14.6个月,治疗效果并不理想。临床具有高发病率、术后高复发性及低治愈率的特点。
脑胶质瘤根据其肿瘤细胞形态学与正常脑胶质细胞的相似程度(并不一定是其真正的细胞起源),可划分为:星型细胞瘤——星形细胞;少突细胞瘤——少突细胞;室管膜瘤——室管膜细胞;混合胶质瘤——例如少突星形细胞瘤,包含了混杂类型的胶质细胞。
按照世界卫生组织(WHO)制定的分级系统,按肿瘤细胞的恶性程度可划分为1级(恶性程度最低、预后最好)到4级(恶性程度最高、预后最差)。其中,传统细胞病理学所谓的间变胶质瘤与WHO的3级相对应;胶质母细胞瘤与WHO的4级相对应。根据此分级系统,脑胶质瘤按肿瘤细胞在病理学上的恶性程度,可以进一步分类:
1)低级别胶质瘤(WHO I~II级)为分化良好的胶质瘤;虽然这类肿瘤在生物上并不属于良性肿瘤,但是患者的预后相对较好;
2)高级别胶质瘤(WHO III~IV级)为低分化胶质瘤;这类肿瘤为恶性肿瘤,患者预后较差。
2016版WHO中枢神经系统肿瘤分类首次在组织学基础上加入了分子学特征,采用“综合诊断”,该分类整合了组织病理和基因型参数,提高了胶质瘤分型、诊断、预后和治疗决策的准确性。其中1p/19q联合缺失是少突胶质瘤的重要分子指标,与O形态紧密相关,且影响患者预后和放/化疗疗效相关。
目前,常用于检测lp19q LOH的方法包括:荧光原位杂(fluorescent in situhybridization, FISH)和一代测序的方法。
其中,荧光原位杂是目前临床病理检胶质瘤样本中1p/19q联合缺失的金标准方法。但实体瘤染色体的制备和显带都比较困难,需要有丰富经验的专业人员操作。并且探针数量有限,通量小、时间长。只能检测1p、19q上小部分固定位置的缺失情况,不能像NGS可以更大范围的检测整条染色体臂上的情况。此外,不同实验室和检测机构对结果判断存在较大的偏差。
一代测序毛细电泳是目前比较成熟的分子生物学技术,需要检测者的血细胞或正常组织 DNA作对照,通过有无扩增片断的出现判断是否存在某种缺失。检测1p、19q上小部分固定 STR区间判断缺失情况,同样没有NGS判断范围大,且如果STR区间出现纯合情况不能计入判定结果,降低结果准确性。且操作繁杂,且结果多依据实验人员的主观判断,不能便捷、准确判定结果。
发明内容
本发明旨在提供一种基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统,以提高神经胶质瘤1p/19q联合缺失检测的准确性。
为了实现上述目的,根据本发明的一个方面,提供了一种基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统。该系统包括:SNP位点筛选装置、无对照样本SNP检测装置和/或有对照样本SNP检测装置,其中,SNP位点筛选装置用于根据现有数据库筛选人类1号染色体和19号染色体上的SNP位点得到第一组SNP位点,无对照样本SNP检测装置包括:第一测序模块,用于对待测样本和一组阴性样本进行测序;第一SNP检测模块,用于检测一组阴性样本中的1号染色体和19号染色体上的所有SNP位点;第一gSNP位点筛选模块,用于筛选一组阴性样本在第一组SNP位点中的gSNP位点;第二SNP检测模块,用于检测对待测样本中的1号染色体和19号染色体上的所有SNP位点;第一计算统计模块,用于计算和统计待测样本中在第一gSNP位点筛选模块中确定的gSNP位点上发生突变的gSNP位点的BAF,记第i个gSNP的LOH status ratio(Ri)为第i个gSNP的|BAF-0.5|;以及第一判断模块,用于根据待测样本的1q和19p上gSNP位点的R,对待测样本的1p和19q上R做校正并确定阈值,根据阈值判断每个gSNP位点的LOH status,再根据所有gSNP位点的LOH status判断联合缺失;
有对照样本SNP检测装置包括:第二测序模块,用于对待测样本和对照样本进行测序;第三SNP检测模块,用于检测对照样本中的1号染色体和19号染色体上的所有SNP位点;第二gSNP位点筛选模块,用于筛选对照样本在第一组SNP位点中的gSNP位点;第四SNP 检测模块,用于检测对待测样本中的1号染色体和19号染色体上的所有SNP位点;第二计算统计模块,用于统计对照样本在gSNP位点的参考序列基因型和非参考序列基因型的测序序列个数,分别记为N1和N2,以及统计待测样本在gSNP位点的参考序列基因型和非参考序列基因型的测序序列个数,分别记为T1和T2,计算每个gSNP的LOH status ratio,其中,第i个 gSNP的LOH status(Ri)定义如下:以及第二判断模块,用于根据待测样本的1q和19p上gSNP位点的R,对待测样本的1p和19q上R做校正并确定的阈值,根据阈值判断每个gSNP位点的LOH status,再根据所有gSNP位点的LOH status判断联合缺失。
进一步地,第一判断模块包括:第一统计子模块,用于分别统计1q和19p中全部gSNP 位点R的均值和方差,分别以1q和19p为基准,计算1号染色体和19号染色体上每个R的Z值;第一阈值计算子模块,用于计算一组阴性样本使用1q和19p校正过后的Z值,并取第 m百分位数为阈值;优选的,m>95;更优选的,m=99;第一判断子模块,用于针对1p和19q 上每个gSNP位点的Z值与对应的阈值比较,判断该点的LOHstatus;若超过阈值则判断该点的LOHstatus是异常,否则为正常;第二判断子模块,用于判断1p和19q是否发生LOH,分别统计1p和19q上异常和正常的个数,若异常/(异常+正常)>t1,则判断该样本在1p和19q 上发生LOH,且仅当1p和19q同时发生LOH时,判定该样本发生1p和19q的联合缺失,优选的,t1>0.6;更优选的,t1=0.8。
进一步地,第一gSNP位点筛选模块根据覆盖度、BAF和一组阴性样本中BAF的波动大小筛选一组阴性样本在第一组SNP位点中的gSNP位点;优选的,gSNP位点的筛选条件为覆盖度>100,BAF范围:0.1~0.9,一组阴性样本中样本间BAF的max-min<0.2;优选的,一组阴性样本中阴阳样本的个数大于等于30个。
进一步地,第二判断模块包括:第二统计子模块,用于分别统计1q和19p中全部gSNP 位点R的均值和方差,以1q和19p为基准,计算1号染色体和19号染色体上每个R的Z值;第二阈值计算子模块,用于分别使用1q和19p上Z值的均值加2~6倍的方差作为1p和19q 阈值;第三判断子模块,用于针对1p和19q上每个gSNP位点的Z值与对应的阈值比较,判断该点的LOHstatus;若超过阈值则判断该点的LOH status是异常,否则为正常;第四判断子模块,用于判断1p和19q是否发生LOH,分别统计1p和19q上异常和正常的个数,若异常 /(异常+正常)>t2,则判断该样本在1p/19q上发生LOH,且仅当1p和19q同时发生LOH时,判定该样本发生1p和19q的联合缺失,优选的,t2>0.6;更优选的,t2=0.9。
进一步地,第二gSNP位点筛选模块根据覆盖度和BAF筛选对照样本在第一组SNP位点中的gSNP位点;优选的,gSNP位点的筛选条件为覆盖度>100,BAF范围:0.3~0.7。
进一步地,现有数据库筛包括数据库SNP138、千人基因组、中国人群数据库;优选的, SNP位点筛选装置根据人群中等位基因突变频率0.45~0.55筛选位点SNP位点;优选的,每隔 200kb选择一个SNP位点。
进一步地,系统包括第一验证装置,第一验证装置用于基于STR的1p和19q联合缺失检测,第一验证装置包括:STR获取模块,用于从现有数据中提取已知STR;对照样本STR统计模块,用于从对照样本的比对结果文件中提取已知STR附近的测序序列,统计每条read上已知STR的重复次数,根据read对STR覆盖程度和STR区域测序覆盖度,统计每种STR重复次数read个数,提取read个数最多的2种STR重复次数,记为N3和N4;若则认为该STR为纯合型,不再用于结果判断;优选的,所述n>5;更优选的,n=10。待测样本STR统计模块,用于从对照样本的比对结果文件中提取已知STR附近的测序序列,统计每条read上已知STR的重复次数,根据read对STR覆盖程度和STR区域测序覆盖度,统计对照样本STR统计模块中确定的重复次数,记为T3和T4;计算每个STR的LOH status,其中,第i个STR的LOH status(Ri)定义如下:以及第三判断模块,用于根据待测样本的1q和19p上STR的R,对待测样本的1p和19q上R做校正并确定的阈值,根据阈值判断每个STR的LOH status,再根据所有STR的LOH status判断联合缺失;优选的,已知STR 附近的测序序列是指已知STR上游20bp和下游20bp的测序序列。
进一步地,第三判断模块包括:第五判断子模块,用于判断每个STR的LOH status,若 R<T则判断该点的LOH status是异常,否则为正常;优选的,T=0.5;如果R>1,则转换为1/R;第六判断子模块,用于判断1p和19q是否发生LOH,分别统计1p和19q上异常和正常的个数,若异常/(异常+正常)>t3,则判断该样本在1p/19q上发生LOH,且仅当1p和19q同时发生LOH时,判定该样本发生1p和19q的联合缺失,优选的,t3>0.6;更优选的,t3=0.8。
进一步地,系统包括第二验证装置,第二验证装置用于基于CNV的1p和19q联合缺失检测。
应用本发明的技术方案,同时结合1q和19p上的信息对1p和19q的信息做校正,提高了检测准确性,可以高效、便捷、准确地进行1p/19q联合缺失鉴定。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1A和图1B分别示出了实施例1中1样本的FISH 1p/19q检测结果示意图和本实施例的方法检测结果示意图;
图2A和图2B分别示出了实施例1中1样本的本实施例的方法检测结果示意图和一代测序检测结果示意图;以及
图3A和图3B分别示出了实施例1中使用本发明鉴定3种相同的2例样本结果示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
本申请中涉及的缩写含义描述如下:
Chrom:染色体编号。
Loci:位置。
R:LOHstatus ratio,缺失性杂合状态比率。
R(LOH):指发生1p/19q联合缺失阳性的样本对应的每个STR的LOH status ratio。
R(No LOH):指1p/19q联合缺失阴性的样本对应的每个STR的LOH status ratio。
/:指该STR位点为基因型纯合型,不能用于判断。
Hom:纯合型。
1p和1q:分别指1号染色体的短臂和1号染色体的长臂。
19p和19q:分别指19号染色体的短臂和19号染色体的长臂。
本申请旨在提供一种高效、便捷、准确的1p/19q联合缺失鉴定系统或方法。
本申请的基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统是基于以下原理设计:人是二倍体生物,其杂合的胚系突变的突变频率(BAF,非参考序列基因型频率)理论频率为50%,在实际中可能因为实验中各种随机因素影响导致最后得到的BAF在50%上下不大的范围内波动。对于LOH阳性的样本,会由于肿瘤细胞DNA使得这些SNP位点的BAF会偏离50%水平,且待测样本中肿瘤细胞DNA浓度越高,偏离程度越大。而LOH阴性样本,则会仍然保持在正常的50%附件的BAF。
根据本发明一种典型的实施方式,提供了一种基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统。该系统包括:SNP位点筛选装置、无对照样本SNP检测装置和/或有对照样本SNP检测装置,其中,SNP位点筛选装置用于根据现有数据库筛选人类1号染色体和19 号染色体上的SNP位点得到第一组SNP位点,无对照样本SNP检测装置包括:第一测序模块,用于对待测样本和一组阴性样本进行测序;第一SNP检测模块,用于检测一组阴性样本中的1号染色体和19号染色体上的所有SNP位点;第一gSNP位点筛选模块,用于筛选一组阴性样本在第一组SNP位点中的gSNP位点;第二SNP检测模块,用于检测对待测样本中的1号染色体和19号染色体上的所有SNP位点;第一计算统计模块,用于计算和统计待测样本中在第一gSNP位点筛选模块中确定的gSNP位点上发生突变的gSNP位点的BAF,记第i个gSNP的LOH status ratio(Ri)为第i个gSNP的|BAF-0.5|;以及第一判断模块,用于根据待测样本的1q和19p上gSNP位点的R,对待测样本的1p和19q上R做校正并确定阈值,根据阈值判断每个gSNP位点的LOH status,再根据所有gSNP位点的LOH status判断联合缺失;有对照样本SNP检测装置包括:第二测序模块,用于对待测样本和对照样本进行测序;第三SNP检测模块,用于检测对照样本中的1号染色体和19号染色体上的所有SNP位点;第二gSNP 位点筛选模块,用于筛选对照样本在第一组SNP位点中的gSNP位点;第四SNP检测模块,用于检测对待测样本中的1号染色体和19号染色体上的所有SNP位点;第二计算统计模块,用于统计对照样本在gSNP位点的参考序列基因型和非参考序列基因型的测序序列个数,分别记为N1和N2,以及统计待测样本在gSNP位点的参考序列基因型和非参考序列基因型的测序序列个数,分别记为T1和T2,计算每个gSNP的LOH status ratio,其中,第i个gSNP的LOH status(Ri)定义如下:以及第二判断模块,用于根据待测样本的 1q和19p上gSNP位点的R,对待测样本的1p和19q上R做校正并确定的阈值,根据阈值判断每个gSNP位点的LOH status,再根据所有gSNP位点的LOH status判断联合缺失。
应用本发明的技术方案,同时结合1q和19p上的信息对1p和19q的信息做校正,提高了检测准确性,可以高效、便捷、准确地进行1p/19q联合缺失鉴定。
在本发明一种典型的实施方式中,第一判断模块包括:第一统计子模块,用于分别统计 1q和19p中全部gSNP位点R的均值和方差,以1q和19p为基准,计算1号染色体和19号染色体上每个R的Z值;第一阈值计算子模块,用于计算一组阴性样本使用1q和19p校正过后的Z值,并取第m百分位数为阈值;优选的,m>95;更优选的,m=99;第一判断子模块,用于针对1p和19q上每个gSNP位点的Z值与对应的阈值比较,判断该点的LOH status;若超过阈值则判断该点的LOH status是异常,否则为正常;第二判断子模块,用于判断1p和19q 是否发生LOH,分别统计1p和19q上异常和正常的个数,若异常/(异常+正常)>t1,则判断该样本在1p和19q上发生LOH,且仅当1p和19q同时发生LOH时,判定该样本发生1p和19q 的联合缺失,优选的,t1>0.6;更优选的,t1=0.8。本申请中推荐阈值t1,是经验值,使判断条件既不会过于严格造成假阴性,也不会过于宽松造成假阳性,判断准确性高。
优选的,第一gSNP位点筛选模块根据覆盖度、BAF和一组阴性样本中BAF的波动大小筛选一组阴性样本在第一组SNP位点中的gSNP位点;优选的,gSNP位点的筛选条件为覆盖度>100,BAF范围:0.1~0.9,一组阴性样本中样本间BAF的max-min<0.2;优选的,一组阴性样本中阴阳样本的个数大于等于30个,以满足统计效应。
在本发明一种典型的实施方式中,第二判断模块包括:第二统计子模块,用于分别统计 1q和19p中全部gSNP位点R的均值和方差,以1q和19p为基准,计算1号染色体和19号染色体上每个R的Z值;第二阈值计算子模块,用于分别使用1q和19p上Z值的均值加2~6 倍的方差作为1p和19q阈值;第三判断子模块,用于针对1p和19q上每个gSNP位点的Z 值与对应的阈值比较,判断该点的LOH status;若超过阈值则判断该点的LOH status是异常,否则为正常;第四判断子模块,用于判断1p和19q是否发生LOH,分别统计1p和19q上异常和正常的个数,若异常/(异常+正常)>t2,则判断该样本在1p/19q上发生LOH,且仅当1p和 19q同时发生LOH时,判定该样本发生1p和19q的联合缺失,优选的,t2>0.6;更优选的, t2=0.9。本申请中推荐阈值t2,是经验值,使判断条件既不会过于严格造成假阴性,也不会过于宽松造成假阳性,判断准确性高。优选的,第二gSNP位点筛选模块根据覆盖度和BAF筛选对照样本在第一组SNP位点中的gSNP位点;优选的,gSNP位点的筛选条件为覆盖度>100, BAF范围:0.3~0.7。本申请中推荐阈值BAF,是经验值,使判断条件既不会过于严格造成假阴性,也不会过于宽松造成假阳性,判断准确性高。
优选的,现有数据库筛包括数据库SNP138、千人基因组、中国人群数据库;优选的,SNP 位点筛选装置根据人群中等位基因突变频率0.45~0.55筛选位点SNP位点;优选的,每隔200kb 选择一个SNP位点。
根据本发明一种典型的实施方式,系统包括第一验证装置,第一验证装置用于基于STR 的1p和19q联合缺失检测,第一验证装置包括:STR获取模块,用于从现有数据中提取已知 STR;对照样本STR统计模块,用于从对照样本的比对结果文件中提取已知STR附近的测序序列,统计每条read上已知STR的重复次数,根据read对STR覆盖程度和STR区域测序覆盖度,统计每种STR重复次数read个数,提取read个数最多的2种STR重复次数,记为N3和N4;若则认为该STR为纯合型,不再用于结果判断;优选的,所述n>5;更优选的,n=10。待测样本STR统计模块,用于从对照样本的比对结果文件中提取已知STR附近的测序序列,统计每条read上已知STR的重复次数,根据read对STR覆盖程度和STR区域测序覆盖度,统计对照样本STR统计模块中确定的重复次数,记为T3和T4;计算每个STR 的LOH status,其中,第i个STR的LOH status(Ri)定义如下:以及第三判断模块,用于根据待测样本的1q和19p上STR的R,对待测样本的1p和19q上R做校正并确定的阈值,根据阈值判断每个STR的LOH status,再根据所有STR的LOH status判断联合缺失;优选的,已知STR附近的测序序列是指已知STR上游20bp和下游20bp的测序序列,这样既不会因过长以至于增加运行时间,或过短导致提取read序列过少。优选的,第三判断模块包括:第五判断子模块,用于判断每个STR的LOH status,若R<T则判断该点的LOH status 是异常,否则为正常;优选的,T=0.5;如果R>1,则转换为1/R;第六判断子模块,用于判断1p和19q是否发生LOH,分别统计1p和19q上异常和正常的个数,若异常/(异常+正常)>t3,则判断该样本在1p/19q上发生LOH,且仅当1p和19q同时发生LOH时,判定该样本发生1p 和19q的联合缺失,优选的,t3>0.6;更优选的,t3=0.8。本申请中推荐阈值t,是经验值,使判断条件既不会过于严格造成假阴性,也不会过于宽松造成假阳性,判断准确性高。优选的,系统包括第二验证装置,第二验证装置用于基于CNV的1p和19q联合缺失检测。
在本申请的一种典型的实施例(实施例1)中,基于二代测序的用于神经胶质瘤1p/19q 联合缺失检测的系统实际上执行了下述方法:
1.panel设计
1)筛选公开数据库SNP138、千人基因组、中国人群数据库及内部数据库,根据人群中最小等位基因突变的频率范围,筛选位点。推荐范围0.45~0.55。
2)考虑1号和19号整条染色体臂上分布均一性,每隔200kb,选择一个SNP位点。
3)最终在1号染色体和19号染色体上共筛选出814个符合条件的SNP,其中包括1号染色体短臂(1p)和19号染色体长臂(19q)上的325个位点。
4)结合已发表文献的记录,设计中另包含共17个短串联重复序列(STR)区间,其中1p上11个,19q上6个。
2.基于SNP的1p和19q联合缺失鉴定方法
2.1有对照
基于本申请上述描述的原理,第一步就是要寻找待测样本的胚系杂合突变(gSNP),而不同待测样本的gSNP是不同的,对照样本就是为了准确确定gSNP。
1)使用公开SNP检测软件检测对照样本1号和19号染色体所有SNP位点;
2)根据覆盖度等质量控制参数和BAF,筛选对照样本在panel上的gSNP位点,统计参考序列基因型(REF)、非参考序列基因型(ALT)的测序序列个数,分别记为N1和N2。推荐BAF范围:0.3~0.7,覆盖度>100;
3)使用公开SNP检测软件检测待测肿瘤样本的1号和19号染色体所有SNP位点;
4)根据覆盖度等质量控制参数,并统计2)中确定的gSNP上的REF和ALT测序序列个数,分别记为T1和T2。推荐覆盖度>100;
5)计算每个gSNP的LOH status,第i个gSNP的LOH status ratio(Ri)定义如下:
a.分别统计1q/19p上全部gSNP位点R的均值和方差,以1q/19p为基准,计算chr1/chr19 上每个R的Z值;
b.分别使用1q/19p上Z值的均值加4倍的方差为1p/19q阈值。
c.针对1p/19q上每个gSNP位点的Z值与对应阈值比较,判断该点的LOH status;若超过阈值则判断该点的LOH status是异常,否则为正常;
7)判断1p/19q是否发生LOH,分别统计1p/19q上异常和正常的个数,若异常/(异常+ 正常)>t2,则判断该样本在1p/19q上发生LOH,且仅当1p和19q同时发生LOH时,判定该样本发生1p和19q的联合缺失,推荐t2=0.9。
2.2无对照
有时因为样本取材限制,并不总是能找到待测样本对应的对照样本,为此本专利另增加一种无对照的基于SNP的1p和19q联合缺失的鉴定方法。
1)准备一组阴性样本,使用公开SNP检测软件检测这组样本1号染色体和19号染色体上的所有SNP位点,推荐n=30;
2)根据覆盖度等质量控制参数、BAF和本组样本中BAF的波动大小,筛选这组样本在panel上的gSNP位点。推荐BAF范围:0.1~0.9,覆盖度>100,样本间BAF的max-min<0.2;
3)使用公开SNP检测软件检测待测肿瘤样本的1号染色体和19号染色体上的所有SNP 位点
4)根据覆盖度等质量控制参数,并统计2)中确定的gSNP且待测样本发生突变的BAF。推荐覆盖度>100;
5)计算每个gSNP的LOH status,此处LOH status ratio(Ri)既为|BAF-0.5|;
6)根据待测肿瘤样本1q和19p上gSNP位点的R,对待测肿瘤样本的1p和19q上R做校正并确定的阈值,具体步骤如下:
a.分别统计1q/19p是全部gSNP位点R的均值和方差,以1q/19p为基准,计算chr1/chr19 上每个R的Z值;
b.计算阴性样本集使用1q和19p校正过后的Z值,并取第m百分位数为阈值;推荐 m=99;
c.针对1p/19q上每个gSNP位点的Z值与对应阈值下比较,判断该点的LOH status;若超过阈值则判断该点的LOH status是异常,否则为正常;
7)判断1p/19q是否发生LOH,分别统计1p/19q上异常和正常的个数,若异常/(异常+ 正常)>t1,则判断该样本在1p/19q上发生LOH,且仅当1p和19q同时发生LOH时,判定该样本发生1p和19q的联合缺失,推荐t1=0.8。
3.基于STR的1p和19q联合缺失鉴定方法
3.1有对照
1)从对照样本比对结果文件(bam文件)中提取已知STR附近的测序序列(read),统计每条read上已知重复单元的重复次数。
2)根据read对STR覆盖程度和STR区域测序覆盖度等质量控制参数,统计每种重复次数read个数,仅取read个数最多的2种重复次数,记为N3和N4。若则认为该 STR为纯合型,不再用于结果判断;只统计完全覆盖整个STR区间的read,推荐覆盖度>100。
3)从待测样本比对结果文件(bam文件)中提取已知STR附近的测序序列(read)(STR 上游20bp和下游20bp的测序序列),统计每条read上已知重复单元的重复次数。
4)根据read对STR覆盖程度和STR区域测序覆盖度等质量控制参数,统计每种重复次数read个数,仅取2)中确定的2种重复次数,分别记为T3和T4。推荐完全覆盖整个STR区间的read,覆盖度>100。
5)计算每个STR的LOH status,第i个STR的LOH status(Ri)定义如下:
6)判断每个STR的LOH status,若R<T则判断该点的LOHstatus是异常,否则为正常。推荐T=0.5.如果R>1,则转换为1/R
7)判断1p/19q是否发生LOH,分别统计1p/19q上异常和正常的个数,若异常/(异常+ 正常)>t3,则判断该样本在1p/19q上发生LOH,且仅当1p和19q同时发生LOH时,判定该样本发生1p和19q的联合缺失,推荐t3=0.8。
4.基于CNV的1p和19q联合缺失鉴定方法
1p和19q的联合缺失,就是在1p和19q上的拷贝数就不再是2,而是变成1,所以直接从CNV结果上看,若1p和19q整条染色体臂同时发生缺失(LOSS),则判断发生了1p和19q 的联合缺失。
使用已公开发布CNV检测软件,检测1p和19q上的CNV结果;推荐使用本团队之前已公布的ctCNV方法(公开号CN108319813A)
主要步骤包括:
1)获取一组(n个)正常对照人群样本和待测样本的与人类参考基因组的比对结果文件 (推荐n>30);
2)分别针对数据量、GC含量和捕获区间长度对目标区间上的read数量做标准化;
3)提取正常对照人群比对结果文件建立基线,计算不同基因组水平的健康人波动范围及统计学打分;
4)计算待测样本与人群基线相比CNV变化倍数及统计学打分,判断显著性,输出拷贝数。
下面将结合实施例进一步说明本发明的有益效果,以下实施例中如果有为详细说明的步骤或试剂,均可采用本领域的常规操作或试剂实现,并不会从实质上影响本发明的最终结果。
实施例1
一、样本制备:组织样本DNA的打断建库及捕获步骤
(一)、组织DNA提取及打断:
使用组织提取试剂盒提取组织DNA。使用Qubit 3.0和dsDNAHS Assay Kit对提取的DNA 进行定量。
将聚四氟乙烯线用紫外灭菌后的医用剪刀,剪至1cm左右的长度,并且保证打断棒的长度均一性良好,置于干净容器中,紫外灭菌3~4小时。灭菌完成后,将1cm的聚四氟乙烯线,用灭菌后的镊子装进96孔板内。每个孔装入2根打断棒,完成后再将96孔板紫外灭菌3~4 小时。
按照qubit定量结果取300ng组织DNA样本,使用TE稀释到50μl,转移到96孔板中,将锡箔纸膜放在96孔板上,四边对齐,使用热封膜仪180℃5s封膜2次,使用微孔板离心机离心。
选择预先设定的程序Peak Power:450,Duty Factor:30,Cycles/Burst:200,Treatment time: 40s,3cycles,点击“Start position”。在Run界面点“Run”按钮,运行程序。在该程序运行完成后,取出样品板,使用微孔板离心机离心,再将样品板放到样品架上,选择程序Peak Power: 450,Duty Factor:30,Cycles/Burst:200,Treatment time:40s,4cycles。在Run界面点“Run”按钮,运行程序。在该程序运行完成后,取出样品板,使用微孔板离心机离心。打断后取1μl 进行质检。
(二)文库构建
1.末端修复并在3’末端加A尾:
1.1取50μL DNA,不足50μL的用无核酸酶水补齐至50μL,按照下表1加入反应体系:
表1
组分 | 体积 |
末端修复和加A缓冲液 | 7μL |
末端修复和加A酶 | 3μL |
DNA | 50μL |
总体积 | 60μL |
1.2涡旋混匀,微离心,放置于PCR仪中,反应程序如下表2。
表2
2.连接接头:
2.1接头(Adapter)准备:接头2.5μL,加2.5μl水稀释到5μL。
2.2按下表3向上述反应管中加入相应试剂:
表3
组分 | 体积 |
无核酸酶水 | 5μL |
连接缓冲液 | 30μL |
DNA连接酶 | 10μL |
末端修复加A反应产物 | 60μL |
总体积 | 110μL |
2.3涡旋混匀,微离心,放置于PCR仪中,反应程序如下表4:
表4
步骤 | 温度 | 时间 |
接头连接 | 20℃ | 30min |
终止 | 20℃ | ∞ |
注意:热盖温度为50℃
3.连接后纯化:
3.1分装Beckman Agencourt AMPure XP磁珠至新的八连管中,每管88μL。上一步PCR 结束后即2.3结束,取出样本,短暂离心,转入已分装的88μL磁珠离心管中。
3.2震荡混匀,室温孵育15min,使DNA与磁珠充分结合。注意:震荡时按紧管盖。短暂离心,离心管置于磁力架上待液体澄清,弃去上清(保证残余量不得超过5μL)。注意:不要吸到磁珠。
3.3加入200μL 80%乙醇孵育30sec后弃去。重复一次200μL 80%乙醇清洗步骤。注意: 80%乙醇现用现配。
3.4用10μL枪头吸尽离心管底部的残留乙醇,室温干燥3~5min至乙醇完全挥发(正面看不在反光,背面看已经干燥)。注意:磁珠过分干燥DNA产量会减少。
3.5从磁力架取下离心管,加入21μL超纯水,震荡混匀。注意:震荡时按紧管盖。室温孵育5min。
3.6短暂离心,离心管置于磁力架上待液体澄清。剩余的20μL清液转移至新的PCR管进行下一步扩增试验。
4.文库扩增:
4.1按照下表5加入反应体系:
表5
组分 | 体积 |
热启动酶 | 25μL |
引物和反应缓冲液混合物 | 5μL |
接头连接产物 | 20μL |
总体积 | 50μL |
4.2涡旋混匀,微离心,放置于PCR仪中,反应程序如下表6:
表6
5.DNA的获得
5.1分装25μL Beckman Agencourt AMPure XP磁珠至新的八连管中。
5.2待上一步(4.2)PCR结束后,取出样本。
5.3短暂离心,转入已分装的25μL Beckman Agencourt AMPure XP磁珠中。
5.4震荡混匀,室温孵育15min,使DNA与磁珠充分结合,注意震荡时按紧管盖。
5.5短暂离心,离心管置于磁力架上待液体澄清,将上清转移至另一管已分装的25μL Beckman Agencourt AMPure XP磁珠中。注意:不要吸到磁珠。
5.6震荡混匀,室温孵育15min,使DNA与磁珠充分结合。注意震荡时按紧管盖。
5.7短暂离心,离心管置于磁力架上待液体澄清,弃上清。注意:不要吸到磁珠。
5.8加入200μL 80%乙醇孵育30sec后弃去。注意:80%乙醇现用现配。重复一次200μL 80%乙醇清洗步骤。
5.9用10μL枪头吸尽离心管底部的残留乙醇,室温干燥3-5min至乙醇完全挥发(正面看不再反光,背面看已经干燥)。注意:磁珠过分干燥DNA产量会减少。
5.10从磁力架取下离心管,加入40μL超纯水,振荡混匀。
5.11室温孵育5min洗脱DNA。
5.12短暂离心,离心管置于磁力架上待液体澄清,将文库转移至新的离心管中。保存于 -20℃。
6.文库质检
取2μL DNA文库用dsDNA HS Assay Kit检测其浓度。
(三).文库杂交捕获
利用本发明设计的检测panel进行文库杂交捕获。
1.取总量1μg的文库于离心管中,按下表7加入封闭液。
表7
试剂 | 体积 |
人类Cot DNA | 5μL |
封闭寡聚核苷酸 | 2μL |
DNA文库 | 1ug |
2.用封口膜封住EP管,放入真空离心浓缩仪中蒸干(60℃,约20min-1hr)。注意随时查看是否已蒸干。
3.DNA变性与杂交
3.1向蒸干后的1.5mL离心管中加入杂交液,配置体系如下表8:
表8
试剂 | 体积 |
杂交缓冲液 | 8.5μL |
杂交增强剂 | 2.7μL |
panel | 4μL |
无核酸酶水 | 1.8μL |
3.2充分震荡混匀,短暂离心,室温孵育5min。
3.3重复步骤3.2。
3.4将3.3步骤中的液体转移至200μL PCR管中,PCR管置于PCR仪中,65℃杂交,杂交时间16h,杂交程序如下表9。
表9
4.配制洗脱工作液
4.1捕获所需缓冲液的配制方法如下表10,根据捕获的个数按下表10配制缓冲液。
表10
4.2分装需要孵育的试剂:
分装160μL洗脱工作液4至八连排中;
分装110μL洗脱工作液1至八连排中;
4.3孵育捕获磁珠和洗脱工作液1和洗脱工作液4,实验开始时开始孵育,孵育时间约 45min。孵育流程按表11进行。
表11
捕获磁珠使用前须室温平衡30min。
5.杂交后纯化:
5.1洗链链霉亲和素磁珠
5.1.1取50μLCapture beads分装于八连排中,加入100μL磁珠洗涤液震荡混匀。置于磁力架上1min至液体澄清,弃去上清。
5.1.2加入100μL磁珠洗涤液震荡混匀。置于磁力架上1min至液体澄清,弃去上清。
5.1.3加入100μL磁珠洗涤液震荡混匀。置于磁力架上1min至液体澄清,弃去上清。
5.1.4从磁力架取下八连排,短暂离心,置于磁力架上,用10μL枪头彻底弃去管底部的残留液体。
5.1.5向清洗好的磁珠里加入磁珠重悬混合液,配置体系如下表12。
表12
试剂 | 体积 |
杂交缓冲液 | 8.5μL |
杂交增强剂 | 2.7μL |
无核酸酶水 | 5.8μL |
5.1.6充分震荡混匀,短暂离心,转移至PCR管中,放置65℃(热盖温度70℃)PCR仪中孵育15min。
5.2用枪测量捕获过夜的杂交液,保证捕获过夜的杂交液体积为17μL,防止损失。
5.3将65℃孵育后带有磁珠的磁珠重悬混合液转移至捕获过夜的杂交液中,移液器吹打混匀(整个孵育过程PCR管不得脱离65℃,所有混匀步骤均用移液器在65℃PCR仪上吹打混匀)。置于PCR仪中65℃孵育45min(PCR热盖温度设为70℃),每隔一段用枪吹打一次保证磁珠悬浮。时间间隔是11min、11min、11min和12min。
5.4热洗(重要:整个热洗过程,温度尽量不要低于65℃):
5.4.1孵育完成后,往八连排中加入100μL 65℃预热的洗脱工作液1,移液器吹打混匀。置于磁力架上1min至液体澄清,弃去上清。
5.4.2从磁力架取下八连排,快速短暂离心,置于磁力架上,用10μL枪头彻底弃去管底部的残留液体。
5.4.3加入150μL 65℃预热的洗脱工作液4,移液器吹打混匀,65℃孵育5min,置于磁力架上1min至液体澄清,弃去上清。
5.4.4加入150μL 65℃预热的洗脱工作液4,移液器吹打混匀,65℃孵育5min,置于磁力架上1min至液体澄清,弃去上清。
5.4.5从磁力架取下八连排,短暂离心,置于磁力架上,用10μL枪头彻底弃去离心管底部的残留液体。
5.5常温清洗
5.5.1加入150μL室温放置的洗脱工作液1,振荡30s,静止30s,再振荡30s,静止30s(共2min),短暂离心,置于磁力架上1min至液体澄清,弃去上清。从磁力架取下八连排,短暂离心,置于磁力架上,用10μL枪头彻底弃去离心管底部的残留液体。
5.5.2加入150μL室温放置的洗脱工作液2,振荡30s,静止30s,再振荡30s,静止30s(共2min),短暂离心,置于磁力架上1min至液体澄清,弃去上清。从磁力架取下八连排,短暂离心,置于磁力架上,用10μL枪头彻底弃去离心管底部的残留液体。
5.5.3加入150μL室温放置的洗脱工作液3,振荡30s,静止30s,再振荡30s,静止30s(共2min),短暂离心,置于磁力架上1min至液体澄清,弃去上清。从磁力架取下八连排,短暂离心,置于磁力架上,用10μL枪头彻底弃去离心管底部的残留液体。
5.5.4向离心管中加入20μL超纯水洗脱,震荡混匀,进行下一步扩增试验。
6.捕获后PCR
6.1按下表13加入反应体系。
表13
试剂 | 体积 |
热启动酶 | 25μL |
引物,5μM | 5μL |
上一步洗脱的DNA | 20μL |
6.2涡旋混匀,短暂离心,置于PCR仪上,按下表14进行PCR反应。
表14
7.扩增后纯化
7.1将扩增后的捕获DNA文库置于96孔磁力板上,检测浓度,确保之前的实验准确。
7.2取出纯化磁珠,室温平衡30min备用。
7.3取75μL纯化磁珠于1.5mL低吸附离心管中,加入50μL扩增后的捕获DNA文库上清,振荡混匀,室温孵育10min。
7.4置于磁力架上1min至液体澄清,弃去上清。
7.5从磁力架取下1.5mL低吸附离心管,短暂离心,置于磁力架上,用10μL枪头彻底弃去离心管底部的残留液体。
7.6加入200μL 80%乙醇孵育30sec后弃去。注意:80%乙醇现用现配。重复一次200μL 80%乙醇清洗步骤。
7.7从磁力架取下1.5mL低吸附离心管,短暂离心,置于磁力架上,用10μL枪头彻底弃去离心管底部的残留液体,室温干燥至乙醇完全挥发(前面看磁珠不反光,背面看干燥)。注意:磁珠过分干燥DNA产量会减少。
7.8从磁力架取下离心管,加入40μL超纯水,振荡混匀。室温孵育2min。
7.9短暂离心,置于磁力架上1min至液体澄清,将捕获样本转入新的离心管中。
8.质检:
取2μL捕获样本用于Qubit浓度检测。
二、血细胞样本的打断建库及捕获步骤
使用天根提取试剂盒提取血细胞,操作过程按照产品说明书进行。使用Qubit 3.0和dsDNA HS Assay Kit对提取的DNA进行定量。
(一)文库构建
1.血细胞DNA片段化/末端修复/加A
1.1按照qubit定量结果取200ng血细胞DNA样本,使用H2O稀释到17.5μL。按下表15配制反应体系。
表15
组分名称 | 体积 |
10×FEA反应缓冲液 | 2.5μL |
DNA样本 | 17.5μL(200ng) |
5×FEA酶混合液 | 5μL |
总体积 | 25μL |
1.2涡旋混匀,微离心,放置于PCR仪中,反应程序如下表16:
表16
2.接头连接
2.1接头准备:接头2.5μL,加2.5μl水稀释到5μL。
2.2按下表17向上述反应管中加入相应试剂:
表17
组分名称 | 体积(μL) |
反应产物 | 25 |
连接酶缓冲液 | 10 |
DNA连接酶 | 5 |
无核酸酶水 | 5 |
总体积 | 45 |
2.3涡旋混匀,微离心,放置于PCR仪中,20℃孵育30min。
3.连接后纯化
3.1分装Beckman Agencourt AMPure XP磁珠至新的八连管中,每管40μL(0.8×),注意:磁珠使用前预先室温放置30min。
3.2上一步PCR结束后,取出样本,短暂离心,转入已分装的40μL磁珠离心管中,即下面的表18中的体系:
表18
试剂 | 体积 |
连接产物 | 50μL |
磁珠 | 40μL(0.8×) |
总体积 | 90μL |
3.3震荡混匀,室温孵育10min,使DNA与磁珠充分结合。注意震荡时按紧管盖。短暂离心,离心管置于磁力架上待液体澄清,弃去上清。注意:不要吸到磁珠。
3.4加入200μL 80%乙醇孵育30sec后弃去。重复一次200μL 80%乙醇清洗步骤。注意: 80%乙醇现用现配。
3.5用10μL枪头吸尽离心管底部的残留乙醇,室温干燥3-5min至乙醇完全挥发。注意:磁珠过分干燥DNA产量会减少。
3.6从磁力架取下离心管,加入13μL超纯水,震荡混匀。注意震荡时按紧管盖。室温孵育5min洗脱DNA。
3.7短暂离心,离心管置于磁力架上待液体澄清,取10μL上清液转移至新的PCR管进行下一步扩增试验。
4.文库扩增
4.1按照下表19加入反应体系:
表19
试剂组分 | 体积 |
热启动酶 | 12.5μL |
引物和反应缓冲液混合物 | 2.5μL |
接头连接文库 | 10μL |
总体积 | 25μL |
4.2充分涡旋震荡后瞬时离心,置于PCR仪上,反应程序如下表20:
表20
5.DNA的获得
5.1分装Beckman Agencourt AMPure XP磁珠至新的八连管中,17.5μL和7.5μL各一管。
5.2待上一步PCR结束后,取出样本。
5.3短暂离心,转入已分装的17.5μL Beckman Agencourt AMPure XP磁珠中。即反应体系如下表21:
表21
试剂 | 体积 |
PCR产物 | 25μL |
磁珠 | 17.5μL(0.7×) |
总体积 | 42.5μL |
5.4震荡混匀,室温孵育15min,使DNA与磁珠充分结合。注意震荡时按紧管盖。
5.5短暂离心,将离心管置于磁力架上。
5.6待液体澄清,将上清转入到7.5μL Beckman Agencourt AMPure XP磁珠中。注意:不要吸到磁珠。
5.7震荡混匀,室温孵育10min,使DNA与磁珠充分结合。注意震荡时按紧管盖。
5.8短暂离心,离心管置于磁力架上待液体澄清,弃去上清。注意:不要吸到磁珠。
5.9加入200μL 80%乙醇孵育30sec后弃去。注意:80%乙醇现用现配。重复一次200μL 80%乙醇清洗步骤。
5.10用10μL枪头吸尽离心管底部的残留乙醇,室温干燥3-5min至乙醇完全挥发。注意:磁珠过分干燥DNA产量会减少。
5.11从磁力架取下离心管,加入70μL超纯水,振荡混匀。
5.12室温孵育5min洗脱DNA。
5.13短暂离心,离心管置于磁力架上待液体澄清,将文库转移至新的离心管中。
6.文库质检:
取2μL DNA文库用于浓度检测。
(二).文库杂交捕获
杂交捕获同“组织样本DNA的打断建库及捕获”中的文库杂交捕获步骤。
(三)数据处理(使用本发明上述描述的系统)
1.处理下机fastq数据为各软件可使用的输入文件
a)比对
调用bwa-0.7.12mem将每一对fastq文件都作为paired reads比对到hg19人类参考基因组序列,除-M参数与指定Reads Group的ID外,不使用其余参数选项,生成初始bam文件;
b)排序
调用Picard-2.1.0的SortSam模块,对初始bam文件按照染色体位置进行排序,参数设置为“SORT_ORDER=coordinate”;
c)筛选
调用SAMtools-1.3view对排序后的bam文件进行筛选,采用“-F 0x900”作为参数;
d)标记重复
调用Picard-2.1.0的MarkDuplicates模块,对筛选后bam文件中的重复序列进行标记,后续的分析时,会过滤这部分重复序列,采用去重后的数据进行分析;
e)建立索引
调用SAMtools-1.3的index模块对最终生成的bam文件建立索引,生成与标记重复后的 bam文件配对的bai文件;
f)SNP检测
首先使用SAMtools的mpileup模块,根据各样本的bam文件、bed文件、人类参考基因组序列的fasta文件生成mpileup文件;再利用VarScan的mpileup2cns模块,根据mpileup文件,生成各样本的突变列表vcf文件。
2.基于有对照的SNP 1p和19q联合缺失方法
在鉴定时,使用对照样本和待测样本的SNP检测结果文件作为输入文件,使用本发明的上述系统进行筛选。
挑选1例样本同时进行FISH 1p/19q检测和本实施例的方法,结果如图1A和图1B所示, FISH和NGS检测结果均说明为1p/19q缺失。说明本实施例与FISH检测结果一致。
挑选1例样本同时进行本实施例的方法检测和一代测序检测,结果如下图2A和2B所示,一代测序结果为阳性,NGS检测(本实施例方法)结果为联合缺失阴性。因为该样本IDH为野生型,所以1p19q应该为阴性,所以此结果说明NGS检测比一代检测更准确。
3.基于无对照SNP 1p和19q联合缺失方法
a)建立对照集
使用一组60个对照样本,以60个样本的SNP检测结果文件作为输入,使用本发明的系统建立对照集文件。
b)1p和19q联合缺失鉴定
使用待测样本SNP检测结果文件及对照集作为本实施例输入,使用本发明鉴定3种相同的2例样本,结果如图3A和图3B所示,判断准确。
4.基于有对照STR 1p和19q联合缺失方法
在鉴定时,使用对照样本和待测样本的比对结果文件作为本发明的输入文件,使用本发明系统,鉴定3种2列样本,每个STR鉴定结果如下表22:
表22
最终结果整理如下表23:
表23
5.基于CNV的1p和19q联合缺失方法
a)建立cnv基线
挑选出拷贝数无异常情况的血细胞样本30个作为参考人群组样本,采用上述相同的方式对其进行捕获测序与测序数据的预处理。将30个样本的bam文件与记录捕获区间的bed文件、人类参考基因组序列fastq文件作为输入文件,采用本发明的系统,生成参考人群组的COV 与GCS文件。
b)CNV检测
输入待测样本的bam文件与参考人群组COV、GCS文件,分别对各样本被捕获区间覆盖的基因的拷贝数进行鉴定,获得各样本的RZ、COV、GCS文件与最终的两个SCNA结果文件。
c)1p/19q检测结果见表24。
表24
表24中位拷贝数,从结果可以看出LOH样本1p和19q同时发生缺失,而非LOH样本1p和19q都为中性的。说明基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统检测结果准确。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (20)
1.一种基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统,其特征在于,包括:SNP位点筛选装置、无对照样本SNP检测装置和/或有对照样本SNP检测装置,其中,所述SNP位点筛选装置用于根据现有数据库筛选人类1号染色体和19号染色体上的SNP位点得到第一组SNP位点,所述无对照样本SNP检测装置包括:
第一测序模块,用于对待测样本和一组阴性样本进行测序;
第一SNP检测模块,用于检测所述一组阴性样本中的1号染色体和19号染色体上的所有SNP位点;
第一gSNP位点筛选模块,用于筛选所述一组阴性样本在第一组SNP位点中的gSNP位点;
第二SNP检测模块,用于检测所述对待测样本中的1号染色体和19号染色体上的所有SNP位点;
第一计算统计模块,用于计算和统计所述待测样本中在所述第一gSNP位点筛选模块中确定的gSNP位点上发生突变的gSNP位点的BAF,记第i个gSNP的LOH status ratio(Ri)为第i个gSNP的|BAF-0.5|;以及
第一判断模块,用于根据所述待测样本的1q和19p上gSNP位点的R,对所述待测样本的1p和19q上R做校正并确定阈值,根据所述阈值判断每个gSNP位点的LOHstatus,再根据所有gSNP位点的LOH status判断联合缺失;
所述有对照样本SNP检测装置包括:
第二测序模块,用于对待测样本和对照样本进行测序;
第三SNP检测模块,用于检测所述对照样本中的1号染色体和19号染色体上的所有SNP位点;
第二gSNP位点筛选模块,用于筛选所述对照样本在第一组SNP位点中的gSNP位点;
第四SNP检测模块,用于检测所述对待测样本中的1号染色体和19号染色体上的所有SNP位点;
第二计算统计模块,用于统计所述对照样本在所述gSNP位点的参考序列基因型和非参考序列基因型的测序序列个数,分别记为N1和N2,以及统计所述待测样本在所述gSNP位点的参考序列基因型和非参考序列基因型的测序序列个数,分别记为T1和T2,计算每个gSNP的LOH status ratio,其中,第i个gSNP的LOH status ratio(Ri)定义如下:
第二判断模块,用于根据所述待测样本的1q和19p上gSNP位点的R,对所述待测样本的1p和19q上R做校正并确定的阈值,根据所述阈值判断每个gSNP位点的LOHstatus,再根据所有gSNP位点的LOH status判断联合缺失。
2.根据权利要求1所述的系统,其特征在于,所述第一判断模块包括:
第一统计子模块,用于分别统计1q和19p中全部gSNP位点R的均值和方差,分别以1q和19p为基准,计算1号染色体和19号染色体上每个R的Z值;
第一阈值计算子模块,
用于计算所述一组阴性样本使用1q和19p校正过后的Z值,并取第m百分位数为阈值;m>95;
第一判断子模块,用于针对1p和19q上每个gSNP位点的Z值与对应的阈值比较,判断该点的LOH status;若超过阈值则判断该点的LOH status是异常,否则为正常;
第二判断子模块,用于判断1p和19q是否发生LOH,分别统计1p和19q上异常和正常的个数,若异常/(异常+正常)>t1,则判断该样本在1p和19q上发生LOH,且仅当1p和19q同时发生LOH时,判定该样本发生1p和19q的联合缺失,所述t1>0.6。
3.根据权利要求2所述的系统,其特征在于,所述m=99。
4.根据权利要求2所述的系统,其特征在于,所述t1=0.8。
5.根据权利要求1所述的系统,其特征在于,所述第一gSNP位点筛选模块根据覆盖度、BAF和所述一组阴性样本中BAF的波动大小筛选所述一组阴性样本在第一组SNP位点中的gSNP位点。
6.根据权利要求5所述的系统,其特征在于,所述gSNP位点的筛选条件为覆盖度>100,BAF范围:0.1~0.9,所述一组阴性样本中样本间BAF的max-min<0.2。
7.根据权利要求5所述的系统,其特征在于,所述一组阴性样本中阴阳样本的个数大于等于30个。
8.根据权利要求1所述的系统,其特征在于,所述第二判断模块包括:
第二统计子模块,用于分别统计1q和19p中全部gSNP位点R的均值和方差,以1q和19p为基准,计算1号染色体和19号染色体上每个R的Z值;
第二阈值计算子模块,用于分别使用1q和19p上Z值的均值加2~6倍的方差作为1p和19q阈值;
第三判断子模块,用于针对1p和19q上每个gSNP位点的Z值与对应的阈值比较,判断该点的LOH status;若超过阈值则判断该点的LOH status是异常,否则为正常;
第四判断子模块,用于判断1p和19q是否发生LOH,分别统计1p和19q上异常和正常的个数,若异常/(异常+正常)>t2,则判断该样本在1p/19q上发生LOH,且仅当1p和19q同时发生LOH时,判定该样本发生1p和19q的联合缺失,所述t2>0.6。
9.根据权利要求8所述的系统,其特征在于,所述t2=0.9。
10.根据权利要求1所述的系统,其特征在于,所述第二gSNP位点筛选模块根据覆盖度和BAF筛选所述对照样本在第一组SNP位点中的gSNP位点。
11.根据权利要求1所述的系统,其特征在于,所述gSNP位点的筛选条件为覆盖度>100,BAF范围:0.3~0.7。
12.根据权利要求1所述的系统,其特征在于,所述现有数据库筛包括数据库SNP138、千人基因组、中国人群数据库。
13.根据权利要求12所述的系统,其特征在于,所述SNP位点筛选装置根据人群中等位基因突变频率0.45~0.55筛选位点SNP位点。
14.根据权利要求12所述的系统,其特征在于,每隔200kb选择一个SNP位点。
15.根据权利要求1至14中任一项所述的系统,其特征在于,所述系统包括第一验证装置,所述第一验证装置用于基于STR的1p和19q联合缺失检测,所述第一验证装置包括:
STR获取模块,用于从现有数据中提取已知STR;
对照样本STR统计模块,用于从对照样本的比对结果文件中提取已知STR附近的测序序列,统计每条read上已知STR的重复次数,根据read对STR覆盖程度和STR区域测序覆盖度,统计每种STR重复次数read个数,提取read个数最多的2种STR重复次数,记为N3和N4;若则认为该STR为纯合型,不再用于结果判断;所述n>5;
待测样本STR统计模块,用于从对照样本的比对结果文件中提取已知STR附近的测序序列,统计每条read上已知STR的重复次数,根据read对STR覆盖程度和STR区域测序覆盖度,统计所述对照样本STR统计模块中确定的重复次数,记为T3和T4;计算每个STR的LOH statusratio,其中,第i个STR的LOH status ratio(Ri)定义如下:
第三判断模块,用于根据所述待测样本的1q和19p上STR的R,对所述待测样本的1p和19q上R做校正并确定的阈值,根据所述阈值判断每个STR的LOH status,再根据所有STR的LOH status判断联合缺失。
16.根据权利要求15所述的系统,其特征在于,所述n=10。
17.根据权利要求15所述的系统,其特征在于,所述已知STR附近的测序序列是指所述已知STR上游20bp和下游20bp的测序序列。
18.根据权利要求15所述的系统,其特征在于,第三判断模块包括:
第五判断子模块,用于判断每个STR的LOH status,若R<T则判断该点的LOH status是异常,否则为正常;T=0.5;如果R>1,则转换为1/R;
第六判断子模块,用于判断1p和19q是否发生LOH,分别统计1p和19q上异常和正常的个数,若异常/(异常+正常)>t3,则判断该样本在1p/19q上发生LOH,且仅当1p和19q同时发生LOH时,判定该样本发生1p和19q的联合缺失,所述t3>0.6。
19.根据权利要求18所述的系统,其特征在于,所述t3=0.8。
20.根据权利要求1所述的系统,其特征在于,所述系统包括第二验证装置,所述第二验证装置用于基于CNV的1p和19q联合缺失检测。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910373158.6A CN110106063B (zh) | 2019-05-06 | 2019-05-06 | 基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统 |
US17/609,418 US20220213555A1 (en) | 2019-05-06 | 2019-09-19 | Next generation sequencing-based detection panel for glioma, detection kit, detection method and application thereof |
PCT/CN2019/106606 WO2020224159A1 (zh) | 2019-05-06 | 2019-09-19 | 基于二代测序用于脑胶质瘤的检测panel、检测试剂盒、检测方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910373158.6A CN110106063B (zh) | 2019-05-06 | 2019-05-06 | 基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110106063A CN110106063A (zh) | 2019-08-09 |
CN110106063B true CN110106063B (zh) | 2022-07-08 |
Family
ID=67488364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910373158.6A Active CN110106063B (zh) | 2019-05-06 | 2019-05-06 | 基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110106063B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220213555A1 (en) * | 2019-05-06 | 2022-07-07 | Genecast (Wuxi) Precision Medical Dignostic Laboratory | Next generation sequencing-based detection panel for glioma, detection kit, detection method and application thereof |
CN110904226A (zh) * | 2019-11-19 | 2020-03-24 | 阔然生物医药科技(上海)有限公司 | 基于NGS的SNP分析技术检测脑胶质瘤1p及19q染色体 |
CN112980961B (zh) * | 2021-05-11 | 2021-08-27 | 上海思路迪医学检验所有限公司 | 联合检测snv、cnv和fusion变异的方法和装置 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006128195A2 (en) * | 2005-05-27 | 2006-11-30 | Dana-Farber Cancer Institute | Methods of diagnosing and treating cancer by detection of chromosomal abnormalities |
CN102428190A (zh) * | 2009-03-27 | 2012-04-25 | 生命技术公司 | 用于检测等位基因变体的方法、组合物和试剂盒 |
CN103805707A (zh) * | 2014-02-19 | 2014-05-21 | 上海赛安生物医药科技有限公司 | 检测染色体缺失的复合扩增体系及其检测试剂盒 |
CA2986117A1 (en) * | 2015-05-18 | 2016-11-24 | Regeneron Pharmaceuticals, Inc. | Methods and systems for copy number variant detection |
CN106460070A (zh) * | 2014-04-21 | 2017-02-22 | 纳特拉公司 | 检测染色体片段中的突变和倍性 |
WO2017099893A1 (en) * | 2015-12-08 | 2017-06-15 | Js Yoon Memorial Cancer Research Institute, Llc | Bladder cancer detection using microsatellite analysis in paired buccal swab and urine samples |
CN107287285A (zh) * | 2017-03-28 | 2017-10-24 | 上海至本生物科技有限公司 | 一种预测同源重组缺失机制及患者对癌症治疗响应的方法 |
CN109022579A (zh) * | 2018-07-27 | 2018-12-18 | 北京先声医学检验实验室有限公司 | 染色体1p/19q杂合性缺失的检测方法、试剂盒及引物组 |
CN109390034A (zh) * | 2018-09-20 | 2019-02-26 | 成都中珠健联基因科技有限责任公司 | 一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 |
CN109666745A (zh) * | 2019-02-15 | 2019-04-23 | 领星生物科技(上海)有限公司 | 染色体1p/19q联合杂合性缺失的检测方法及试剂盒 |
CN109887548A (zh) * | 2019-01-18 | 2019-06-14 | 臻悦生物科技江苏有限公司 | 基于捕获测序的ctDNA占比的检测方法及检测装置 |
CN110129441A (zh) * | 2019-05-06 | 2019-08-16 | 臻和精准医学检验实验室无锡有限公司 | 基于二代测序用于脑胶质瘤的检测panel、检测试剂盒及其应用 |
CN111883211A (zh) * | 2020-08-07 | 2020-11-03 | 张哲� | 一种表征hrd同源重组修复缺陷的基因瘢痕及鉴定方法 |
CN112980961A (zh) * | 2021-05-11 | 2021-06-18 | 上海思路迪医学检验所有限公司 | 联合检测snv、cnv和fusion变异的方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7794940B2 (en) * | 2006-05-05 | 2010-09-14 | Mayo Foundation For Medical Education And Research | Detecting t(1;19) |
WO2017004153A1 (en) * | 2015-06-29 | 2017-01-05 | The Broad Institute Inc. | Tumor and microenvironment gene expression, compositions of matter and methods of use thereof |
-
2019
- 2019-05-06 CN CN201910373158.6A patent/CN110106063B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006128195A2 (en) * | 2005-05-27 | 2006-11-30 | Dana-Farber Cancer Institute | Methods of diagnosing and treating cancer by detection of chromosomal abnormalities |
CN102428190A (zh) * | 2009-03-27 | 2012-04-25 | 生命技术公司 | 用于检测等位基因变体的方法、组合物和试剂盒 |
CN103805707A (zh) * | 2014-02-19 | 2014-05-21 | 上海赛安生物医药科技有限公司 | 检测染色体缺失的复合扩增体系及其检测试剂盒 |
CN106460070A (zh) * | 2014-04-21 | 2017-02-22 | 纳特拉公司 | 检测染色体片段中的突变和倍性 |
CA2986117A1 (en) * | 2015-05-18 | 2016-11-24 | Regeneron Pharmaceuticals, Inc. | Methods and systems for copy number variant detection |
WO2017099893A1 (en) * | 2015-12-08 | 2017-06-15 | Js Yoon Memorial Cancer Research Institute, Llc | Bladder cancer detection using microsatellite analysis in paired buccal swab and urine samples |
CN107287285A (zh) * | 2017-03-28 | 2017-10-24 | 上海至本生物科技有限公司 | 一种预测同源重组缺失机制及患者对癌症治疗响应的方法 |
CN109022579A (zh) * | 2018-07-27 | 2018-12-18 | 北京先声医学检验实验室有限公司 | 染色体1p/19q杂合性缺失的检测方法、试剂盒及引物组 |
CN109390034A (zh) * | 2018-09-20 | 2019-02-26 | 成都中珠健联基因科技有限责任公司 | 一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 |
CN109887548A (zh) * | 2019-01-18 | 2019-06-14 | 臻悦生物科技江苏有限公司 | 基于捕获测序的ctDNA占比的检测方法及检测装置 |
CN109666745A (zh) * | 2019-02-15 | 2019-04-23 | 领星生物科技(上海)有限公司 | 染色体1p/19q联合杂合性缺失的检测方法及试剂盒 |
CN110129441A (zh) * | 2019-05-06 | 2019-08-16 | 臻和精准医学检验实验室无锡有限公司 | 基于二代测序用于脑胶质瘤的检测panel、检测试剂盒及其应用 |
CN111883211A (zh) * | 2020-08-07 | 2020-11-03 | 张哲� | 一种表征hrd同源重组修复缺陷的基因瘢痕及鉴定方法 |
CN112980961A (zh) * | 2021-05-11 | 2021-06-18 | 上海思路迪医学检验所有限公司 | 联合检测snv、cnv和fusion变异的方法和装置 |
Non-Patent Citations (4)
Title |
---|
Diagnostic application of a capture based NGS test for the concurrent detection of variants in sequence and copy number as well as LOH;A.Vetro等;《CLINICAL GENETICS》;20180331;第93卷(第3期);第545-556页 * |
Diffuse gliomas classified by 1p/19q co-deletion, TERT promoter and IDH mutation status are associated with specific genetic risk loci;Karim Labreche等;《ACTA NEUROPATHOLOGICA》;20180219;第135卷(第5期);第743-755页 * |
应用新一代基因组学技术的复杂疾病基因定位研究;白健;《中国优秀博士学位论文全文数据库 医药卫生科技辑》;20150715(第07期);第E059-53页 * |
胶质瘤1p/19q共缺失FISH检测的关键技术;李磊 等;《临床与实验病理学杂志》;20190419;第35卷(第4期);第480-482页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110106063A (zh) | 2019-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112029861B (zh) | 基于捕获测序技术的肿瘤突变负荷检测装置及方法 | |
CN109609647B (zh) | 基于二代测序的用于泛癌种靶向、化疗及免疫用药的检测Panel、检测试剂盒及其应用 | |
Grün et al. | Design and analysis of single-cell sequencing experiments | |
CN111676277B (zh) | 一种基于二代测序技术测定基因组不稳定的方法及试剂盒 | |
CN110106063B (zh) | 基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统 | |
CN110211633B (zh) | Mgmt基因启动子甲基化的检测方法、测序数据的处理方法及处理装置 | |
CN110129441B (zh) | 基于二代测序用于脑胶质瘤的检测panel、检测试剂盒及其应用 | |
CN107090494B (zh) | 与谷子码粒数性状相关的分子标记及其检测引物和应用 | |
WO2020224159A1 (zh) | 基于二代测序用于脑胶质瘤的检测panel、检测试剂盒、检测方法及其应用 | |
US11718869B2 (en) | Method and kit for determining genome instability based on next generation sequencing (NGS) | |
CN107937513B (zh) | 新生儿50种遗传病基因检测探针组及筛查方法 | |
CN108179148A (zh) | 一种检测遗传性心肌病的探针及其应用 | |
CN108319817B (zh) | 循环肿瘤dna重复序列的处理方法及装置 | |
CN111662981A (zh) | 一种基于二代测序探针捕获方法的癌症的基因检测试剂盒 | |
CN109461473B (zh) | 胎儿游离dna浓度获取方法和装置 | |
CN107077538B (zh) | 测序数据处理装置和方法 | |
CN112080554A (zh) | 一种maldi-tof质谱检测密集单核苷酸变异位点的引物和探针的设计方法 | |
US6203990B1 (en) | Method and system for pattern analysis, such as for analyzing oligonucleotide primer extension assay products | |
CN109439741B (zh) | 检测特发性癫痫病基因探针组合物、试剂盒及应用 | |
CN114875118B (zh) | 确定细胞谱系的方法、试剂盒和装置 | |
CN116121360A (zh) | 一种用于检测dba致病基因集合的试剂盒及检测方法 | |
CN110993024B (zh) | 建立胎儿浓度校正模型的方法及装置与胎儿浓度定量的方法及装置 | |
CN111172254B (zh) | 一种smn1基因突变的检测方法及试剂盒 | |
CN113564266A (zh) | Snp分型遗传标记组合、检测试剂盒及用途 | |
CN113403379A (zh) | 一种眼科疾病相关snp位点引物组合物及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |