CN110468189A - 基于单样本二代测序检测样本体细胞变异的方法及装置 - Google Patents
基于单样本二代测序检测样本体细胞变异的方法及装置 Download PDFInfo
- Publication number
- CN110468189A CN110468189A CN201910809888.6A CN201910809888A CN110468189A CN 110468189 A CN110468189 A CN 110468189A CN 201910809888 A CN201910809888 A CN 201910809888A CN 110468189 A CN110468189 A CN 110468189A
- Authority
- CN
- China
- Prior art keywords
- variation
- database
- sample
- frequency
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Pathology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于单样本二代测序检测样本体细胞变异的方法及装置。其中,该方法包括以下步骤:S1,获取待检测样本的目的基因的序列信息;以及S2,对序列信息进行分析,通过变异检出、根据已知数据库进行变异过滤及背景噪音过滤实现体细胞变异状态的确定。根据体细胞变异的生物学性状,一般属于有害变异,所以不应在大多数健康人中出现(人群频率数据库过滤),另外大多数体细胞变异由于肿瘤纯度的限制,一般情况下变异频率较低(可用变异频率过滤)。所以,应用本发明的技术方案,可确定体细胞变异状态,这样就实现了利用已知数据库过滤的方法使用单样本进行体细胞变异检测,解决了单样本检测体细胞变异的问题。
Description
技术领域
本发明涉及生物信息学技术领域,具体而言,涉及一种基于单样本二代测序检测样本体细胞变异的方法及装置。
背景技术
体细胞变异是发生在正常机体细胞中的突变,比如发生在皮肤或器官中的突变。这样的突变不会传给后代。体细胞突变与种系突变不同,后者是发生在将成为配子(gametes)(精子和卵子)的细胞中。生殖细胞的突变可传递给后代。
在二代测序的临床实践中,检测体细胞变异是一项重要的内容。采用病理组织样本和对照样本进行检测,找到特异性存在于病理组织样本的变异,即为体细胞变异。然而对于很多回顾性样本,常常缺乏白细胞对照样本导致无法准确找到体细胞变异。
因此,亟待解决开发一种针对无对照样本的情况准确检测体细胞变异。
发明内容
本发明旨在提供一种基于单样本二代测序检测样本体细胞变异的方法及装置,以实现单样本二代测序检测样本体细胞变异的准确检出。
为了实现上述目的,根据本发明的一个方面,提供了一种基于单样本二代测序检测样本体细胞变异的方法。该方法包括以下步骤:S1,获取待检测样本的目的基因的序列信息;以及S2,对序列信息进行分析,通过变异检出、根据已知数据库进行变异过滤及背景噪音过滤实现体细胞变异状态的确定。
进一步地,变异检出包括将序列信息与人类参考基因组Hg19进行比较,得到各位点发生变异的读段条数,计算出各位点的变异频率,筛选变异频率大于0.4%,且变异读段数大于8条的变异;优选的,已知数据库包括人群频率数据库和SNP数据库;更优选的,人群频率数据库包括千人基因组数据库和ExAC数据库,SNP数据库包括dbSNP数据库。
进一步地,方法还包括对检出的变异进行注释的步骤,优选的,注释包括根据变异的基因组位置和变异碱基注释出氨基酸改变、千人基因组人群频率、ExAC人群频率和dbSNP数据库记录的信息。
进一步地,变异过滤包括:去除链偏好性位点;优选的,链偏好性位点是指支持突变reads在正链或负链中为0的变异。
进一步地,变异过滤还包括:去除dbSNP数据库注释为SAO=1的变异;去除1000Genome数据库或ExAC数据库中注释为人群频率>0.01的变异;如果某变异频率大于30%且收录于测序平台胚系变异数据库之中为通过历史样本定义的胚系变异,则去除该变异。
进一步地,背景噪音过滤包括:去除通过历史样本定义的噪音变异。
进一步地,S1包括:通过目标区域捕获技术从DNA中获取目的基因的扩增产物,然后通过高通量测序方法得到序列信息。
根据本发明的另一个方面,提供一种基于单样本二代测序检测样本体细胞变异的装置。该装置包括:信息获取模块,用于获取待检测样本的目的基因的序列信息;以及变异确定模块,用于对序列信息进行分析,通过变异检出、根据已知数据库进行变异过滤及背景噪音过滤实现体细胞变异状态的确定。
进一步地,变异检出包括将序列信息与人类参考基因组Hg19进行比较,得到各位点发生变异的读段条数,计算出各位点的变异频率,筛选变异频率大于0.4%,且变异读段数大于8条的变异;优选的,已知数据库包括人群频率数据库和SNP数据库;更优选的,人群频率数据库包括千人基因组数据库和ExAC数据库,SNP数据库包括dbSNP数据库;优选的,变异确定模块还用于对检出的变异进行注释,优选的,注释包括根据变异的基因组位置和变异碱基注释出氨基酸改变、千人基因组人群频率、ExAC人群频率和dbSNP数据库记录的信息。
进一步地,变异过滤包括:去除链偏好性位点;优选的,链偏好性位点是指支持突变reads在正链或负链中为0的变异;优选的,变异过滤还包括:去除dbSNP数据库注释为SAO=1的变异;去除1000Genome数据库或ExAC数据库中注释为人群频率>0.01的变异;如果某变异频率大于30%且收录于测序平台胚系变异数据库之中为通过历史样本定义的胚系变异,则去除该变异;优选的,背景噪音过滤包括:去除通过历史样本定义的噪音变异。
根据体细胞变异的生物学性状,一般属于有害变异,所以不应在大多数健康人中出现(人群频率数据库过滤),另外大多数体细胞变异由于肿瘤纯度的限制,一般情况下变异频率较低(可用变异频率过滤)。所以,应用本发明的技术方案,通过变异检出、根据已知数据库进行变异过滤再去除平台的系统噪音,即可确定体细胞变异状态,这样就实现了利用已知数据库过滤的方法使用单样本进行体细胞变异检测,解决了单样本检测体细胞变异的问题。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了本发明一实施方式的基于单样本二代测序检测样本体细胞变异的流程示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
目前常用的体细胞变异检测方法是通过使用病理组织样本和对照样本进行检测,通过确定病理组织样本中特异的变异来确定体细胞变异。然而对于很多回顾性样本,常常缺乏白细胞对照样本导致无法准确找到体细胞变异。
因此,为了解决由于缺乏白细胞样本导致不能够准确识别体细胞变异的问题,本发明提供了一种使用单样本检测体细胞变异的方法。利用病理组织单样本的测序数据,通过数据库过滤,辅之自行设计的下游过滤方法,确定样本的体细胞变异。
根据本发明一种典型的实施方式,提供一种基于单样本二代测序检测样本体细胞变异的方法。该方法包括以下步骤:S1,获取待检测样本的目的基因的序列信息;以及S2,对序列信息进行分析,通过变异检出、根据已知数据库进行变异过滤及背景噪音过滤实现体细胞变异状态的确定。
根据体细胞变异的生物学性状,一般属于有害变异,所以不应在大多数健康人中出现(人群频率数据库过滤),另外大多数体细胞变异由于肿瘤纯度的限制,一般情况下变异频率较低(可用变异频率过滤)。所以,应用本发明的技术方案,通过变异检出、根据已知数据库进行变异过滤再去除平台的系统噪音,即可确定体细胞变异状态,这样就实现了利用已知数据库过滤的方法使用单样本进行体细胞变异检测,解决了单样本检测体细胞变异的问题。
优选的,变异检出包括将序列信息与人类参考基因组Hg19进行比较,得到各位点发生变异的读段条数,计算出各位点的变异频率,筛选变异频率大于0.4%,且变异读段数大于8条的变异;优选的,已知数据库包括人群频率数据库和SNP数据库;更优选的,人群频率数据库包括千人基因组数据库和ExAC数据库,SNP数据库包括dbSNP数据库。在本发明一实施方式中,首先将测序数据与人类参考基因组Hg19进行比对,找到所以潜在变异的位点;其次,按照筛选条件进行筛选;设置筛选条件的目的是去除假阳性变异,按上述方式筛选后可以去除由于测序错误导致的假阳性变异。
根据本发明一种典型的实施方式,该方法还包括对检出的变异进行注释的步骤,优选的,注释包括根据变异的基因组位置和变异碱基注释出氨基酸改变、千人基因组人群频率、ExAC人群频率和dbSNP数据库记录的信息等。对所有变异注释上公共数据库信息,以便可以利用注释上的公共数据库信息对变异进行过滤。在本发明一实施方式中,变异过滤包括:去除链偏好性位点,优选的,链偏好性位点是指支持突变reads在正链或负链中为0的变异,这样可以去除由于扩增偏好性导致的假阳性变异。
根据本发明一种典型的实施方式,变异过滤还包括:去除dbSNP数据库注释为SAO=1的变异;去除1000Genome数据库或ExAC数据库中注释为人群频率>0.01的变异;如果某变异频率大于30%且收录于测序平台胚系变异数据库之中(即通过历史样本定义的胚系变异),则去除该变异。一般情况下胚系变异频率为50%或者100%,即便有测序波动一般不低于30%。如此操作可以尽可能地去除胚系变异,保留体细胞变异。
根据本发明一种典型的实施方式,背景噪音过滤包括:去除通过历史样本定义的噪音变异,这样可以去除由于平台偏好性的产生的噪音变异,减少假阳性变异的产生。
优选的,S1包括:通过目标区域捕获技术从DNA中获取目的基因的扩增产物,然后通过高通量测序方法得到序列信息。结合目标区域捕获的高通量测序技术,进一步提高了该方法的灵敏性和特异性。
根据本发明一种典型的实施方式,提供一种基于单样本二代测序检测样本体细胞变异的装置。该装置包括信息获取模块和变异确定模块,其中,信息获取模块用于获取待检测样本的目的基因的序列信息;变异确定模块用于对序列信息进行分析,通过变异检出、根据已知数据库进行变异过滤及背景噪音过滤实现体细胞变异状态的确定。
根据体细胞变异的生物学性状,一般属于有害变异,所以不应在大多数健康人中出现(人群频率数据库过滤),另外大多数体细胞变异由于肿瘤纯度的限制,一般情况下变异频率较低(可用变异频率过滤)。所以,应用本发明的技术方案,通过变异检出、根据已知数据库进行变异过滤再去除平台的系统噪音,即可确定体细胞变异状态,这样就实现了利用已知数据库过滤的方法使用单样本进行体细胞变异检测,解决了单样本检测体细胞变异的问题。
优选的,变异检出包括将序列信息与人类参考基因组Hg19进行比较,得到各位点发生变异的读段条数,计算出各位点的变异频率,筛选变异频率大于0.4%,且变异读段数大于8条的变异;优选的,已知数据库包括人群频率数据库和SNP数据库;更优选的,人群频率数据库包括千人基因组数据库和ExAC数据库,SNP数据库包括dbSNP数据库。在本发明一实施方式中,首先将测序数据与人类参考基因组Hg19进行比对,找到所以潜在变异的位点;其次,按照筛选条件进行筛选;设置筛选条件的目的是去除假阳性变异,按上述方式筛选后可以去除由于测序错误导致的假阳性变异。根据本发明一种典型的实施方式,该方法还包括对检出的变异进行注释的步骤,优选的,注释包括根据变异的基因组位置和变异碱基注释出氨基酸改变、千人基因组人群频率、ExAC人群频率和dbSNP数据库记录的信息等。对所有变异注释上公共数据库信息,以便可以利用注释上的公共数据库信息对变异进行过滤。在本发明一实施方式中,变异过滤包括:去除链偏好性位点,优选的,链偏好性位点是指支持突变reads在正链或负链中为0的变异,这样可以去除由于扩增偏好性导致的假阳性变异。
根据本发明一种典型的实施方式,变异过滤还包括:去除dbSNP数据库注释为SAO=1的变异;去除1000Genome数据库或ExAC数据库中注释为人群频率>0.01的变异;如果某变异频率大于30%且收录于测序平台胚系变异数据库之中(即通过历史样本定义的胚系变异),则去除该变异。一般情况下胚系变异频率为50%或者100%,即便有测序波动一般不低于30%。如此操作可以尽可能地去除胚系变异,保留体细胞变异。根据本发明一种典型的实施方式,背景噪音过滤包括:去除通过历史样本定义的噪音变异,这样可以去除由于平台偏好性的产生的噪音变异,减少假阳性变异的产生。
本发明集合目标区域捕获的高通量测序技术,使用数据库过滤法进行单样本体细胞变异检测,该方法具有高灵敏性和高特异性的特点。
在本发明一种典型的实施方式,具体步骤如下:
第一部分:样本处理
Step1:样本DNA提取、打断、加接头、杂交捕获、洗脱、富集、测序。
第二部分:数据处理(主要分为两大部分,第一部分为检测程序外完成部分,第二部分为检测程序内完成部分),如图1所示的流程,利用BWA-mem比对软件将高通量测序序列比对到人类参考基因组上,未比对上的序列形成软截断。然后根据比对到参考基因组上的位置进行排序,并用samtools软件建立index;
数据过滤
Step1:对每例样本使用VarScan2软件进行变异检测,筛选变异频率大于0.4%,且变异读段数大于8条的变异;
Step2:使用ANNOVAR软件进行注释;
Step3:去除链偏好性位点,即支持突变reads在正链或负链中为0的变异;
Step4:去除dbSNP数据库注释为SAO=1的变异;
Step5:去除1000Genome数据库或ExAC数据库中注释为人群频率>0.01的变异(即去除高人群频率位点);
Step6:去除通过历史样本定义的胚系变异(如果该变异频率大于30%);
Step7:去除通过历史样本定义的噪音变异(如果该变异频率小于最大背景噪音频率)
利用上述步骤对所有变异进行过滤,过滤后的变异即为确定的体细胞变异。
实施例1
在本实施例中,具体操作主要分为两大部分,第一部分为检测程序外完成部分,第二部分为检测程序内完成部分。
在本实施例中,待检的样本是单样本肺癌病理样本。
在本发明的实施例中,主要试剂用品是市售的,信息如下表1:
表1
具体操作步骤如下:
1.样本预处理并提取DNA,利用荧光定量计(Qubit)进行定量,其浓度为3.8ng/μl,体积为130μl;利用超声破碎仪(Covaris)对样品进行片段化,使DNA片段大小在200~400bp之间,然后利用琼脂糖凝胶电泳检测片段大小是否符合要求。
2.先将片段化的样品进行磁珠纯化,然后进行末端修复和3’端腺苷化,体系配置见下表2,基本步骤如下:先在20℃温浴30min,其次在65℃温浴30min结束反应。
表2
末端修复和3’端腺苷化缓冲液 | 7μl |
末端修复和3’端腺苷化酶混合液 | 3μl |
DNA | 50μl(500ng) |
3.将上述修复后的DNA进行接头连接,接头(通用商业接头:NEXTflex DNABarcodes-24)连接体系详见下表3,在20℃温浴15min。
表3
试剂 | 体积 |
带标签的接头 | 2.5μl |
DNA样品 | 60μl |
连接反应液 | 30μl |
连接酶 | 10μl |
无核酸酶的水 | 7.5μl |
4.将上述接头连接后的产物进行磁珠纯化,然后进行PCR扩增,得到足量的带接头的DNA片段,基本步骤如下:先在98℃预变性45s,其次在98℃变性15s,然后在60℃退火30s,72℃延伸30s;重复变性退火延伸过程7次;最后在72℃延伸1min,结束反应。扩增体系见下表4:
表4:
试剂 | 体积 |
快速热启动聚合酶 | 25μL |
扩增引物 | 1μL |
连上接头的DNA片段 | 24μL |
5.对PCR扩增产物进行磁珠纯化后,利用Qubit定量得到浓度后,取出500ng扩增产物(P5接头端引物,SEQ ID NO.1:aatgatacggcgaccaccgaga,P7接头端引物,SEQ ID NO.2:caagcagaagacggcatacgag),使用浓缩仪将扩增产物体积浓缩到4.4μl,然后进行封闭和探针(商购自安捷伦)杂交,杂交反应体系如下表5所示。
表5
试剂 | 体积 |
封闭试剂混合液 | 5.6μl |
P5、P7封闭试剂 | 2μl |
快速封闭试剂 | 5μl |
RNA酶封闭试剂 | 2μl |
针对目标区域的生物素探针 | 2μl |
杂交缓冲液 | 6μl |
无核酸酶的水 | 3μl |
PCR扩增产物 | 4.4μl |
杂交反应条件如下表6所示:
表6
6.使用链霉亲合素磁珠对探针结合的样品进行捕获,步骤如下:将50μl磁珠加入1.5ml离心管,置于磁力架上,弃上清,用200μl连接缓冲液清洗三遍后,使用200μl连接缓冲液重悬磁珠,将与探针杂交的样品加入磁珠,混匀仪上颠倒混匀30min,置于磁力架上,弃上清,用清洗液1清洗1遍,然后用预热到65℃的清洗液2清洗3遍,期间保证磁珠和缓冲液2的温度在65℃。最后置于磁力架上,弃上清,加入38μl无核酸酶的水,重悬磁珠。
7.将磁珠捕获到的DNA片段进行PCR扩增,扩增体系见下表7,得到足量的加上接头(通用商业接头:NEXTflex DNA Barcodes-24)的DNA片段,基本步骤如下:先在98℃预变性2min,其次在98℃变性30s,然后在60℃退火30s,72℃延伸1min;重复变性退火延伸过程14次;最后在72℃延伸5min,结束反应。
表7
试剂 | 体积 |
高保真DNA聚合酶 | 1μl |
扩增引物(P5接头端引物和P7接头端引物) | 1μl |
高保真DNA聚合酶反应混和液 | 10μl |
单核苷酸混合液 | 0.5μl |
磁珠上的目标区域DNA | 37.5μl |
8.将得到的PCR扩增产物进行磁珠纯化,然后利用qPCR定量,利用2100进行片段大小检测。
9.测序,在基因测序仪上完成测序,测序平台将得到的光信号转化为碱基序列下机数据为fq文件存储所有测序片段结果。
在本实施例的第二部分中,将下机数据fq文件比对上参考基因组,去除低质量序列,使用本实施例的检测流程进行检测。
样本检测结果为:
该例样本中可以检测到经过双样本验证的9个体细胞变异,达到了与双样本检测相同的能力。
使用5例已经过双样本检测的二代测序样本进行单样本检测,单样本判定结果与双样本判定结果一致,具体结果如表8所示。
表8
样本编号 | 样本类型 | 体细胞变异个数 | 单样本判定个数(相同变异) | 个数/类别是否一致 |
S1 | 肺癌样本 | 8 | 8 | 一致 |
S2 | 肺癌样本 | 7 | 7 | 一致 |
S3 | 肺癌样本 | 10 | 10 | 一致 |
S4 | 肺癌样本 | 7 | 7 | 一致 |
S5 | 肺癌样本 | 8 | 8 | 一致 |
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:本申请集合目标区域捕获的高通量测序技术,使用数据库过滤法进行单样本体细胞变异检测,该方法具有高灵敏性和高特异性的特点。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于单样本二代测序检测样本体细胞变异的方法,其特征在于,包括以下步骤:
S1,获取待检测样本的目的基因的序列信息;以及
S2,对所述序列信息进行分析,通过变异检出、根据已知数据库进行变异过滤及背景噪音过滤实现体细胞变异状态的确定。
2.根据权利要求1所述的方法,其特征在于,所述变异检出包括将所述序列信息与人类参考基因组Hg19进行比较,得到各位点发生变异的读段条数,计算出各位点的变异频率,筛选变异频率大于0.4%,且变异读段数大于8条的变异;
优选的,所述已知数据库包括人群频率数据库和SNP数据库;
更优选的,所述人群频率数据库包括千人基因组数据库和ExAC数据库,所述SNP数据库包括dbSNP数据库。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括对检出的变异进行注释的步骤,优选的,所述注释包括根据变异的基因组位置和变异碱基注释出氨基酸改变、千人基因组人群频率、ExAC人群频率和dbSNP数据库记录的信息。
4.根据权利要求1所述的方法,其特征在于,所述变异过滤包括:去除链偏好性位点;
优选的,所述链偏好性位点是指支持突变reads在正链或负链中为0的变异。
5.根据权利要求1所述的方法,其特征在于,所述变异过滤还包括:
去除dbSNP数据库注释为SAO=1的变异;
去除1000Genome数据库或ExAC数据库中注释为人群频率>0.01的变异;
如果某变异频率大于30%且收录于测序平台胚系变异数据库之中,则去除该变异。
6.根据权利要求2所述的方法,其特征在于,所述背景噪音过滤包括:去除通过历史样本定义的噪音变异。
7.根据权利要求1所述的方法,其特征在于,所述S1包括:通过目标区域捕获技术从DNA中获取所述目的基因的扩增产物,然后通过高通量测序方法得到所述序列信息。
8.一种基于单样本二代测序检测样本体细胞变异的装置,其特征在于,包括:
信息获取模块,用于获取待检测样本的目的基因的序列信息;以及
变异确定模块,用于对所述序列信息进行分析,通过变异检出、根据已知数据库进行变异过滤及背景噪音过滤实现体细胞变异状态的确定。
9.根据权利要求8所述的装置,其特征在于,所述变异检出包括将所述序列信息与人类参考基因组Hg19进行比较,得到各位点发生变异的读段条数,计算出各位点的变异频率,筛选变异频率大于0.4%,且变异读段数大于8条的变异;
优选的,所述已知数据库包括人群频率数据库和SNP数据库;
更优选的,所述人群频率数据库包括千人基因组数据库和ExAC数据库,所述SNP数据库包括dbSNP数据库;
优选的,所述变异确定模块还用于对检出的变异进行注释,优选的,所述注释包括根据变异的基因组位置和变异碱基注释出氨基酸改变、千人基因组人群频率、ExAC人群频率和dbSNP数据库记录的信息。
10.根据权利要求8所述的装置,其特征在于,所述变异过滤包括:去除链偏好性位点;
优选的,所述链偏好性位点是指支持突变reads在正链或负链中为0的变异;
优选的,所述变异过滤还包括:
去除dbSNP数据库注释为SAO=1的变异;
去除1000Genome数据库或ExAC数据库中注释为人群频率>0.01的变异;
如果某变异频率大于30%且收录于测序平台胚系变异数据库之中,则去除该变异;
优选的,所述背景噪音过滤包括:去除通过历史样本定义的噪音变异。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910809888.6A CN110468189B (zh) | 2019-08-29 | 2019-08-29 | 基于单样本二代测序检测样本体细胞变异的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910809888.6A CN110468189B (zh) | 2019-08-29 | 2019-08-29 | 基于单样本二代测序检测样本体细胞变异的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110468189A true CN110468189A (zh) | 2019-11-19 |
CN110468189B CN110468189B (zh) | 2022-05-27 |
Family
ID=68514267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910809888.6A Active CN110468189B (zh) | 2019-08-29 | 2019-08-29 | 基于单样本二代测序检测样本体细胞变异的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110468189B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110846411A (zh) * | 2019-11-21 | 2020-02-28 | 上海仁东医学检验所有限公司 | 一种基于二代测序的单独肿瘤样本区分基因突变类型的方法 |
CN111180010A (zh) * | 2019-12-27 | 2020-05-19 | 北京优迅医学检验实验室有限公司 | 肿瘤体细胞突变位点检测方法及其装置 |
CN111718982A (zh) * | 2020-07-09 | 2020-09-29 | 深圳市海普洛斯生物科技有限公司 | 一种肿瘤组织单样本体细胞突变检测方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106909806A (zh) * | 2015-12-22 | 2017-06-30 | 广州华大基因医学检验所有限公司 | 定点检测变异的方法和装置 |
CN110060733A (zh) * | 2019-04-28 | 2019-07-26 | 上海宝藤生物医药科技股份有限公司 | 基于单样本的二代测序肿瘤体细胞变异检测装置 |
-
2019
- 2019-08-29 CN CN201910809888.6A patent/CN110468189B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106909806A (zh) * | 2015-12-22 | 2017-06-30 | 广州华大基因医学检验所有限公司 | 定点检测变异的方法和装置 |
CN110060733A (zh) * | 2019-04-28 | 2019-07-26 | 上海宝藤生物医药科技股份有限公司 | 基于单样本的二代测序肿瘤体细胞变异检测装置 |
Non-Patent Citations (1)
Title |
---|
WANG等: "Detecting somatic point mutations in cancer genome sequencing data: a comparison of mutation callers", 《GENOME MEDICINE》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110846411A (zh) * | 2019-11-21 | 2020-02-28 | 上海仁东医学检验所有限公司 | 一种基于二代测序的单独肿瘤样本区分基因突变类型的方法 |
CN110846411B (zh) * | 2019-11-21 | 2020-09-18 | 上海仁东医学检验所有限公司 | 一种基于二代测序的单独肿瘤样本区分基因突变类型的方法 |
CN111180010A (zh) * | 2019-12-27 | 2020-05-19 | 北京优迅医学检验实验室有限公司 | 肿瘤体细胞突变位点检测方法及其装置 |
CN111180010B (zh) * | 2019-12-27 | 2023-07-11 | 北京优迅医学检验实验室有限公司 | 肿瘤体细胞突变位点检测方法及其装置 |
CN111718982A (zh) * | 2020-07-09 | 2020-09-29 | 深圳市海普洛斯生物科技有限公司 | 一种肿瘤组织单样本体细胞突变检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110468189B (zh) | 2022-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11629378B2 (en) | Non-invasive prenatal diagnosis of fetal genetic condition using cellular DNA and cell free DNA | |
CN105543380B (zh) | 一种检测基因融合的方法及装置 | |
EP2749655B2 (en) | Single cell classification method, gene screening method and device thereof | |
JP5938484B2 (ja) | ゲノムのコピー数変異の有無を判断する方法、システム及びコンピューター読み取り可能な記憶媒体 | |
CN109767810B (zh) | 高通量测序数据分析方法及装置 | |
KR20210003094A (ko) | 잔류 질환의 검출을 위한 시스템 및 방법 | |
CN110468189A (zh) | 基于单样本二代测序检测样本体细胞变异的方法及装置 | |
JP7067896B2 (ja) | 品質評価方法、品質評価装置、プログラム、および記録媒体 | |
CN111349719B (zh) | 一种用于新型冠状病毒检测的特异引物及应用 | |
CN106399504A (zh) | 基于靶向新一代测序的耳聋基因检测集合、试剂盒及检测方法 | |
US20210090687A1 (en) | Methods of quality control using single-nucleotide polymorphisms in pre-implantation genetic screening | |
CN105555970B (zh) | 同时进行单体型分析和染色体非整倍性检测的方法和系统 | |
CN113160882A (zh) | 一种基于三代测序的病原微生物宏基因组检测方法 | |
CN109182483A (zh) | 基因变异解读的方法及装置 | |
CA2906725C (en) | Characterization of biological material using unassembled sequence information, probabilistic methods and trait-specific database catalogs | |
CN112126677B (zh) | 耳聋单倍型基因突变无创检测方法 | |
CN109022562A (zh) | 用于检测高通量测序中样本污染的snp位点的筛选方法及检测样本污染的方法 | |
CN116403644B (zh) | 一种用于癌症风险预测的方法及装置 | |
CN109686404A (zh) | 检测样本混淆的方法及装置 | |
CN109461473B (zh) | 胎儿游离dna浓度获取方法和装置 | |
CN111477277A (zh) | 样本质量评估方法和装置 | |
CN114410772A (zh) | 慢阻肺急性加重易感基因及其在预测易感慢阻肺急性加重中的应用 | |
CN109536588A (zh) | 检测ffpe样本氧化状态的方法及装置 | |
CN110993024B (zh) | 建立胎儿浓度校正模型的方法及装置与胎儿浓度定量的方法及装置 | |
JP2022537442A (ja) | ヒト胚におけるコピー数変異を検証するために単一ヌクレオチド変異の密度を使用するシステム、コンピュータプログラム製品及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |