CN111599408B - 基因变异顺反位置关系检测方法、装置、设备和存储介质 - Google Patents
基因变异顺反位置关系检测方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN111599408B CN111599408B CN202010295575.6A CN202010295575A CN111599408B CN 111599408 B CN111599408 B CN 111599408B CN 202010295575 A CN202010295575 A CN 202010295575A CN 111599408 B CN111599408 B CN 111599408B
- Authority
- CN
- China
- Prior art keywords
- cis
- target
- trans
- variation
- reads
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Engineering & Computer Science (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及一种能够提高检测效率且有利于提高检测结果准确性的基因变异顺反位置关系检测方法、装置、设备和存储介质。该检测方法包括获取基因变异测序数据;按照基因对所述基因变异测序数据中的变异情况进行分组,同一基因内的变异为同一组;针对同一组的任意两个待分析的目标变异,对各唯一比对read,分别获取各类型read的数目;根据获取的各类read的数目检测两个目标变异的顺反位置关系。通过使用上述基因变异顺反位置关系检测方法和装置可以对测序合格的基因变异测序数据进行自动化注释分析,直接判断两个变异是顺式位置关系还是反式位置关系,整个检测过程无需人工手动检测,节省人力成本,并且检测结果的误判或漏判率低。
Description
技术领域
本发明涉及高通量测序数据分析技术领域,尤其是涉及一种基因变异顺反位置关系检测方法、装置、设备和存储介质。
背景技术
在癌症等疾病的基因检测过程中,需要对患者的组织或者血液样本依次通过“抽提实验-文库构建实验-文库捕获实验-文库检测实验-illumina平台上机测序-生物信息技术对illumina平台测序数据进行数据质量判读及输出变异的数据-合格测序变异的数据进行注释-撰写疾病基因临床检验报告”,最后出具一份合格的疾病相关基因的临床检验报告。
传统的在“合格测序变异的数据进行注释”环节通常是依赖一种叫做IGV的软件(可以对测序unique reads(只能map到一个位置的reads)进行可视化读取)进行人工判断,人工读取时是根据每个变异所在的染色体位置一一输入寻找该变异,判定其真假,并通过肉眼观察发现该变异是否和其他变异存在顺反(in cis/in trans)的位置关系。此方法会花费大量的人力,并且人工核查的过程中,一些距离较远或者测序深度较高的变异,由于不容易在同一个IGV显示界面上显示,顺反的位置关系容易被遗漏。
发明内容
基于此,有必要提供一种能够提高检测效率且有利于提高检测结果准确性的基因变异顺反位置关系检测方法、装置、设备和存储介质。
一种基因变异顺反位置关系检测方法,包括如下步骤:
获取基因变异测序数据;
按照基因对所述基因变异测序数据中的变异情况进行分组,同一基因内的变异为同一组;
针对同一组的任意两个待分析的目标变异,对各唯一比对read,分别获取满足如下条件的read的数目:
获取满足两个目标变异位于同一连续read上的read的数目;
获取满足只含有位置靠前的目标变异且read末端位置比另一个目标变异所在位置更靠前的read的数目;
获取满足只含有位置靠后的目标变异且read起始位置比另一个目标变异所在位置更靠后的read的数目;
获取满足在两个目标变异所在位置之间连续且只含有位置靠前的目标变异的read的数目;
获取满足在两个目标变异所在位置之间连续且只含有位置靠后的目标变异的read的数目;
根据获取的各类read的数目检测两个目标变异的顺反位置关系。
在其中一个实施例中,在获取所述read的数目之前还包括:
将各组的变异按照其在相应染色体上的位置从小到大进行排序。
在其中一个实施例中,所述根据获取的各类read的数目检测两个目标变异的顺反位置关系包括:
根据顺式关系判断条件和反式关系判断条件检测两个目标变异的顺反位置关系;
所述顺式关系判断条件为:m≥1且m+n+x≥3;
所述反式关系判断条件为:p≥1,q≥1且p+q≥3;
其中,m为两个目标变异位于同一连续read上的read的数目;
n为只含有位置靠前的目标变异且read末端位置比另一个目标变异所在位置更靠前的read的数目;
x为只含有位置靠后的目标变异且read起始位置比另一个目标变异所在位置更靠后的read的数目;
p为在两个目标变异所在位置之间连续且只含有位置靠前的目标变异的read的数目;
q为在两个目标变异所在位置之间连续且只含有位置靠后的目标变异的read的数目。
在其中一个实施例中,所述根据顺式关系判断条件和反式关系判断条件检测两个目标变异的顺反位置关系包括检测两个目标变异为顺式关系,或者为反式关系,或者为同时满足顺式关系和反式关系,或者为既不满足顺式关系也不满足反式关系的常规变异。
在其中一个实施例中,所述基因变异顺反位置关系检测方法还包括:
在顺式关系下计算合并后变异的丰度AF(in cis)=(2m+n+x)/(Dvar1+Dvar2);
其中,Dvar1和Dvar2分别为两个目标变异所在位置处的测序深度。
在其中一个实施例中,所述基因变异顺反位置关系检测方法还包括:
在反式关系下分别计算两个目标变异的丰度AF(var1)和AF(var2):AF(var1)=var1的总丰度,AF(var2)=var2的总丰度,var1和var2分别代表两个目标变异。
在其中一个实施例中,所述基因变异顺反位置关系检测方法还包括:
在同时满足顺式关系和反式关系下分别计算顺式关系下合并后变异的丰度AF(incis)和反式关系下两个目标变异的丰度AF(var1)与AF(var2):
AF(in cis)=(2m+n+x)/(Dvar1+Dvar2),
AF(var1)=p/Dvar1,
AF(var2)=q/Dvar2;
其中,Dvar1和Dvar2分别为两个目标变异所在位置处的测序深度。
一种基因变异顺反位置关系检测装置,包括:
测序数据获取模块,用于获取基因变异测序数据;
分组模块,用于按照基因对所述基因变异测序数据中的变异情况进行分组,同一基因内的变异为同一组;
read数目获取模块,用于针对同一组的任意两个待分析的目标变异,对各唯一比对read,获取满足两个目标变异位于同一连续read上的read的数目、获取满足只含有位置靠前的目标变异且read末端位置比另一个目标变异所在位置更靠前的read的数目、获取满足只含有位置靠后的目标变异且read起始位置比另一个目标变异所在位置更靠后的read的数目、获取满足在两个目标变异所在位置之间连续且只含有位置靠前的目标变异的read的数目、以及获取满足在两个目标变异所在位置之间连续且只含有位置靠后的目标变异的read的数目;以及
顺反检测模块,用于根据获取的各类read的数目检测两个目标变异的顺反位置关系。
在其中一个实施例中,所述基因变异顺反位置关系检测装置还包括排序模块,所述排序模块用于将各组的变异按照其在相应染色体上的位置从小到大进行排序。
在其中一个实施例中,所述顺反检测模块是用于根据顺式关系判断条件和反式关系判断条件检测两个目标变异的顺反位置关系;
所述顺式关系判断条件为:m≥1且m+n+x≥3;
所述反式关系判断条件为:p≥1,q≥1且p+q≥3;
其中,m为两个目标变异位于同一连续read上的read的数目;
n为只含有位置靠前的目标变异且read末端位置比另一个目标变异所在位置更靠前的read的数目;
x为只含有位置靠后的目标变异且read起始位置比另一个目标变异所在位置更靠后的read的数目;
p为在两个目标变异所在位置之间连续且只含有位置靠前的目标变异的read的数目;
q为在两个目标变异所在位置之间连续且只含有位置靠后的目标变异的read的数目。
在其中一个实施例中,所述基因变异顺反位置关系检测装置还包括顺式丰度计算模块,所述顺式丰度计算模块用于在顺式关系下计算合并后变异的丰度AF(in cis)=(2m+n+x)/(Dvar1+Dvar2),Dvar1和Dvar2分别为两个目标变异所在位置处的测序深度。
在其中一个实施例中,所述基因变异顺反位置关系检测装置还包括反式丰度计算模块,所述反式丰度计算模块用于在反式关系下分别计算两个目标变异的丰度AF(var1)和AF(var2):AF(var1)=var1的总丰度,AF(var2)=var2的总丰度,var1和var2分别代表两个目标变异。
在其中一个实施例中,所述基因变异顺反位置关系检测装置还包括顺反丰度计算模块,所述顺反丰度计算模块用于在同时满足顺式关系和反式关系下分别计算顺式关系下合并后变异的丰度AF(in cis)和反式关系下两个目标变异的丰度AF(var1)与AF(var2):
AF(in cis)=(2m+n+x)/(Dvar1+Dvar2),
AF(var1)=p/Dvar1,
AF(var2)=q/Dvar2;
其中,Dvar1和Dvar2分别为两个目标变异所在位置处的测序深度。
一种计算机设备,具有处理器和存储器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例所述的基因变异顺反位置关系检测方法的步骤。
一种计算机存储介质,其上存储有计算机程序,所述计算机程序被执行时实现如上述任一实施例所述的基因变异顺反位置关系检测方法的步骤。
通过使用上述基因变异顺反位置关系检测方法和装置可以对测序合格的基因变异测序数据进行自动化分析注释,直接判断两个变异是顺式(in cis)位置关系还是反式(in trans)位置关系,整个检测过程效率高,无需人工手动检测,有利于节省人力成本,并且检测结果的误判或漏判率低,准确性显著提高。
附图说明
图1为本发明一实施例的基因变异顺反位置关系检测方法流程示意图;
图2为将所有满足条件的变异按照所在基因进行分组及排序示意图;
图3为两个目标变异var1和var2均位于同一连续read的情况示意图;
图4为只含有位置靠前的目标变异var1且read末端位置(position end)比另一个目标变异var2所在位置(position B)更靠前的read的情况示意图;
图5为只含有位置靠后的目标变异var2且read起始位置(position start)比另一个目标变异var1所在位置(position A)更靠后的read的情况示意图;
图6为在两个目标变异var1和var2所在位置(position A和position B)之间连续且只含有位置靠前的目标变异var1或只含有位置靠后的目标变异var2的read的情况示意图;
图7为本发明一实施例的基因变异顺反位置关系检测装置的模块结构示意图;
图8为具体检测案例中步骤(1)的分析流程图;
图9为具体检测案例中EGFR p.T790M与p.C797G变异按照染色体位置排序相对位置及测序唯一比对read按照染色体位置从小到大排列,不同reads按照从上到下排序示意图;
图10为具体检测案例中m值所在的唯一比对read示意图;
图11为具体检测案例中n值所在的唯一比对read示意图;
图12为具体检测案例中x值所在的唯一比对read示意图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本文所述的“read”是指测序仪产生的测序数据,实际上就是一小段的DNA片段,一条read就对应测序数据中的一条记录,其中唯一比对read是二代高通量双端测序(paired-end sequencing)检测结果中能够唯一匹配(mapping)到基因组的特定位置的read,又称为unique read;人体正常细胞是二倍体(Diploid),每个基因位点有两个等位基因(allele),分别遗传自父本和母本,两个变异(variant)在同一染色体上的为顺式位置关系,即incis,两个变异在不同染色体上的为反式位置关系,即in trans;测序深度是指测序得到的总碱基数与待测基因组大小的比值,例如一个基因组的重测序,基因组大小约为5G,测序获得100G的数据量,则测序深度为20X;覆盖度是指测序获得的序列占整个基因组的比例,由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖到所有的区域,这部分没有获得的区域成为Gap,例如一个全基因组测序,覆盖率是98%,那么说明有2%的序列区域是没有通过测序获得的;变异丰度是指某个基因位点所有的等位基因中,变异的等位基因所占的相对比例(相对于野生型等位基因),即等于变异型/(变异型+野生型)。
如图1所示,本发明一实施例提供了一种基因变异顺反位置关系检测方法,其包括如下步骤S110~S140。
步骤S110:获取基因变异测序数据。
该基因变异测序数据如果是来源于体细胞(somatic)的测序数据,可源自但不限于肿瘤组织的测序数据等。具体地,对于肿瘤组织的测序质量及样本要求:平均覆盖度(mean coverage)>700X,样本取样时间与测序时间间隔<6个月,肿瘤变异细胞含量≥20%,优先适用变异丰度≥1的变异。如果非体细胞测序数据无此测序质量及样本要求。
在一个具体示例中,所述基因变异包括但不限于碱基置换突变(substitution)、缺失突变(deletion,可选地,<50bp)、插入突变(insertion,包含重复突变duplication和缺失插入突变deletion-insertion,可选地,<50bp)等变异。
步骤S120:按照基因对基因变异测序数据中的变异情况进行分组,同一基因内的变异为同一组。
如图2所示,本步骤是将所有满足条件的变异按照所在基因进行分组,在同一基因上的变异归为同一组。
可选地,在一个具体示例中,还包括将各组的变异按照其在相应染色体上的位置进行排序。进一步可选地,按照位置坐标的大小从小到大依次排序。
例如在图2中,将变异var1、var2、var3……var9……varN按照基因GeneN进行分组,并对每组上的变异进一步按照位置坐标position从小到大依次排列。
步骤S130:针对同一组的任意两个待分析的目标变异,对各唯一比对read,分别获取各类型read的数目:
获取满足两个目标变异位于同一连续read上的read的数目;
获取满足只含有位置靠前的目标变异且read末端位置比另一个目标变异所在位置更靠前的read的数目;
获取满足只含有位置靠后的目标变异且read起始位置比另一个目标变异所在位置更靠后的read的数目;
获取满足在两个目标变异所在位置之间连续且只含有位置靠前的目标变异的read的数目;
获取满足在两个目标变异所在位置之间连续且只含有位置靠后的目标变异的read的数目。
所述位置即相应基因变异在染色体上的位置。
本实施例根据目标变异的位置和数量对每种类型的read进行分类,依照read数量判定两个目标变异是顺式位置关系还是反式位置关系。
图3所示的即为两个目标变异var1和var2均位于同一连续read的情况;
图4所示的即为只含有位置靠前的目标变异var1且read末端位置(position end)比另一个目标变异var2所在位置(position B)更靠前的read的情况;
图5所示的即为只含有位置靠后的目标变异var2且read起始位置(positionstart)比另一个目标变异var1所在位置(position A)更靠后的read的情况;
图6所示的即为在两个目标变异var1和var2所在位置(position A和position B)之间连续且只含有位置靠前的目标变异var1或只含有位置靠后的目标变异var2的read的情况。
步骤S140:根据获取的各类read的数目检测两个目标变异的顺反位置关系。
在一个具体示例中,所述根据获取的各类read的数目检测两个目标变异的顺反位置关系包括:
根据顺式关系判断条件和反式关系判断条件检测两个目标变异的顺反位置关系;
顺式关系判断条件为:m≥1且m+n+x≥3;
反式关系判断条件为:p≥1,q≥1且p+q≥3;
其中,m为两个目标变异位于同一连续read上的read的数目;
n为只含有位置靠前的目标变异且read末端位置比另一个目标变异所在位置更靠前的read的数目;
x为只含有位置靠后的目标变异且read起始位置比另一个目标变异所在位置更靠后的read的数目;
p为在两个目标变异所在位置之间连续且只含有位置靠前的目标变异的read的数目;
q为在两个目标变异所在位置之间连续且只含有位置靠后的目标变异的read的数目。
在检测判定为顺式位置关系或反式位置关系后,还包括以HGVS(sequencevariant nomenclature)命名标准格式合并输出顺式位置关系结果(例如p.[variant1;variant2])或反式位置关系结果(例如p.[variant1];[variant2])。
所述根据顺式关系判断条件和反式关系判断条件检测两个目标变异的顺反位置关系包括检测两个目标变异为顺式关系,或者为反式关系,或者为同时满足顺式关系和反式关系,或者为既不满足顺式关系也不满足反式关系的常规变异。
在一个更具体的示例中,该基因变异顺反位置关系检测方法还包括:
在顺式关系下计算合并后变异的丰度AF(in cis)=(2m+n+x)/(Dvar1+Dvar2);
其中,Dvar1和Dvar2分别为两个目标变异所在位置处的测序深度。
在一个更具体的示例中,基因变异顺反位置关系检测方法还包括:
在反式关系下分别计算两个目标变异的丰度AF(var1)和AF(var2):AF(var1)=var1的总丰度,AF(var2)=var2的总丰度,var1和var2分别代表两个目标变异。
在一个更具体的示例中,基因变异顺反位置关系检测方法还包括:
在同时满足顺式关系和反式关系下分别计算顺式关系下合并后变异的丰度AF(incis)和反式关系下两个目标变异的丰度AF(var1)与AF(var2):
AF(in cis)=(2m+n+x)/(Dvar1+Dvar2),
AF(var1)=p/Dvar1,
AF(var2)=q/Dvar2;
其中,Dvar1和Dvar2分别为两个目标变异所在位置处的测序深度。
可选地,对于既不支持顺式又不支持反式位置关系的read,不纳入统计结果。
如图7所示,本发明进一步还提供了一种基因变异顺反位置关系检测装置200,其包括测序数据获取模块210、分组模块220、read数目获取模块230以及顺反检测模块240。
其中,测序数据获取模块210用于获取基因变异测序数据。
分组模块220用于按照基因对基因变异测序数据中的变异情况进行分组,同一基因内的变异为同一组。
read数目获取模块230用于针对同一组的任意两个待分析的目标变异,对各唯一比对read,获取满足两个目标变异位于同一连续read上的read的数目、获取满足只含有位置靠前的目标变异且read末端位置比另一个目标变异所在位置更靠前的read的数目、获取满足只含有位置靠后的目标变异且read起始位置比另一个目标变异所在位置更靠后的read的数目、获取满足在两个目标变异所在位置之间连续且只含有位置靠前的目标变异的read的数目、以及获取满足在两个目标变异所在位置之间连续且只含有位置靠后的目标变异的read的数目。
顺反检测模块240用于根据获取的各类read的数目检测两个目标变异的顺反位置关系。
进一步,在一个具体示例中,该基因变异顺反位置关系检测装置200还包括排序模块。排序模块250用于将各组的变异按照其在相应染色体上的位置从小到大进行排序。
在一个具体示例中,顺反检测模块240是用于根据顺式关系判断条件和反式关系判断条件检测两个目标变异的顺反位置关系;
顺式关系判断条件为:m≥1且m+n+x≥3;
反式关系判断条件为:p≥1,q≥1且p+q≥3;
其中,m为两个目标变异位于同一连续read上的read的数目;
n为只含有位置靠前的目标变异且read末端位置比另一个目标变异所在位置更靠前的read的数目;
x为只含有位置靠后的目标变异且read起始位置比另一个目标变异所在位置更靠后的read的数目;
p为在两个目标变异所在位置之间连续且只含有位置靠前的目标变异的read的数目;
q为在两个目标变异所在位置之间连续且只含有位置靠后的目标变异的read的数目。
在一个具体示例中,该基因变异顺反位置关系检测装置200还包括顺式丰度计算模块。顺式丰度计算模块用于在顺式关系下计算合并后变异的丰度AF(in cis)=(2m+n+x)/(Dvar1+Dvar2),Dvar1和Dvar2分别为两个目标变异所在位置处的测序深度。
在一个具体示例中,该基因变异顺反位置关系检测装置200还包括反式丰度计算模块。反式丰度计算模块用于在反式关系下分别计算两个目标变异的丰度AF(var1)和AF(var2):AF(var1)=var1的总丰度,AF(var2)=var2的总丰度,var1和var2分别代表两个目标变异。
在一个具体示例中,该基因变异顺反位置关系检测装置200还包括顺反丰度计算模块。顺反丰度计算模块用于在同时满足顺式关系和反式关系下分别计算顺式关系下合并后变异的丰度AF(in cis)和反式关系下两个目标变异的丰度AF(var1)与AF(var2):
AF(in cis)=(2m+n+x)/(Dvar1+Dvar2),
AF(var1)=p/Dvar1,
AF(var2)=q/Dvar2;
其中,Dvar1和Dvar2分别为两个目标变异所在位置处的测序深度。
通过使用上述基因变异顺反位置关系检测方法和装置可以对测序合格的基因变异测序数据进行自动化注释分析,直接判断两个变异是顺式(in cis)位置关系还是反式(in trans)位置关系,整个检测过程效率高,无需人工手动检测,有利于节省人力成本,并且检测结果的误判或漏判率低,准确性显著提高。
基于如上所述的实施例和/或具体示例,本发明还提供了一种可用于检测基因变异顺反位置关系的计算机设备,其具有处理器和存储器,存储器上存储有计算机程序,处理器执行该计算机程序时实现上述任一具体示例的基因变异顺反位置关系检测方法的步骤。
本领域普通技术人员可以理解实现上述方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性的计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
据此,本发明还提供了一种可用于检测基因变异顺反位置关系的计算机存储介质,其上存储有计算机程序,计算机程序被执行时实现上述任一实施例的基因变异顺反位置关系检测方法的步骤。
以下结合一具体检测案例对本发明的基因变异顺反位置关系检测方法作进一步说明。
本具体检测案例用于自动判定肿瘤患者S样本SSS的somatic变异中EGFR p.T790M与p.C797G的in cis关系,检测步骤如下。
(1)在样本SSS的众多体细胞变异中,EGFR p.T790M与p.C797G变异都属于EGFR基因,所以分到EGFR基因一组,并按照染色体上位置大小排序,流程图如图8及排列位置如图9所示;
(2)如图9所示,可以自动检测到有26条,即m=25,如图10所示,支持EGFR p.T790M与p.C797G变异同时在一条唯一比对read上,即m>3,因而满足m≥1,且m+n+x≥3的条件,且此样本的这两个变异只满足两个目标变异位于同一连续read上的情况,因此EGFR p.T790M与p.C797关系为顺式位置关系。
(3)查看生物信息技术环节处理得到EGFR p.T790M处测序深度为1800X,EGFRp.T797G处测序深度为1800X,自动可读出m=26,n=9(图11),x=2(图12),因此,计算在顺式位置关系下的变异的丰度AF(in cis)=(26*2+9+2)/(1800+1800)=1.75%。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (15)
1.一种基因变异顺反位置关系检测方法,其特征在于,包括如下步骤:
获取基因变异测序数据;
按照基因对所述基因变异测序数据中的变异情况进行分组,同一基因内的变异为同一组;
针对同一组的任意两个待分析的目标变异,对各唯一比对read,分别获取满足如下条件的read的数目:
获取满足两个目标变异位于同一连续read上的read的数目;
获取满足只含有位置靠前的目标变异且read末端位置比另一个目标变异所在位置更靠前的read的数目;
获取满足只含有位置靠后的目标变异且read起始位置比另一个目标变异所在位置更靠后的read的数目;
获取满足在两个目标变异所在位置之间连续且只含有位置靠前的目标变异的read的数目;
获取满足在两个目标变异所在位置之间连续且只含有位置靠后的目标变异的read的数目;
根据获取的各类read的数目检测两个目标变异的顺反位置关系。
2.如权利要求1所述的基因变异顺反位置关系检测方法,其特征在于,在获取所述read的数目之前还包括:
将各组的变异按照其在相应染色体上的位置从小到大进行排序。
3.如权利要求1或2所述的基因变异顺反位置关系检测方法,其特征在于,所述根据获取的各类read的数目检测两个目标变异的顺反位置关系包括:
根据顺式关系判断条件和反式关系判断条件检测两个目标变异的顺反位置关系;
所述顺式关系判断条件为:m≥1且m+n+x≥3;
所述反式关系判断条件为:p≥1,q≥1且p+q≥3;
其中,m为两个目标变异位于同一连续read上的read的数目;
n为只含有位置靠前的目标变异且read末端位置比另一个目标变异所在位置更靠前的read的数目;
x为只含有位置靠后的目标变异且read起始位置比另一个目标变异所在位置更靠后的read的数目;
p为在两个目标变异所在位置之间连续且只含有位置靠前的目标变异的read的数目;
q为在两个目标变异所在位置之间连续且只含有位置靠后的目标变异的read的数目。
4.如权利要求3所述的基因变异顺反位置关系检测方法,其特征在于,所述根据顺式关系判断条件和反式关系判断条件检测两个目标变异的顺反位置关系包括检测两个目标变异为顺式关系,或者为反式关系,或者为同时满足顺式关系和反式关系,或者为既不满足顺式关系也不满足反式关系的常规变异。
5.如权利要求3所述的基因变异顺反位置关系检测方法,其特征在于,还包括:
在顺式关系下计算合并后变异的丰度AF(in cis)=(2m+n+x)/(Dvar1+Dvar2);
其中,Dvar1和Dvar2分别为两个目标变异所在位置处的测序深度。
6.如权利要求3所述的基因变异顺反位置关系检测方法,其特征在于,还包括:
在反式关系下分别计算两个目标变异的丰度AF(var1)和AF(var2):AF(var1)=var1的总丰度,AF(var2)=var2的总丰度,var1和var2分别代表两个目标变异。
7.如权利要求3所述的基因变异顺反位置关系检测方法,其特征在于,还包括:
在同时满足顺式关系和反式关系下分别计算顺式关系下合并后变异的丰度AF(incis)和反式关系下两个目标变异的丰度AF(var1)与AF(var2):
AF(in cis)=(2m+n+x)/(Dvar1+Dvar2),
AF(var1)=p/Dvar1,
AF(var2)=q/Dvar2;
其中,Dvar1和Dvar2分别为两个目标变异所在位置处的测序深度。
8.一种基因变异顺反位置关系检测装置,其特征在于,包括:
测序数据获取模块,用于获取基因变异测序数据;
分组模块,用于按照基因对所述基因变异测序数据中的变异情况进行分组,同一基因内的变异为同一组;
read数目获取模块,用于针对同一组的任意两个待分析的目标变异,对各唯一比对read,获取满足两个目标变异位于同一连续read上的read的数目、获取满足只含有位置靠前的目标变异且read末端位置比另一个目标变异所在位置更靠前的read的数目、获取满足只含有位置靠后的目标变异且read起始位置比另一个目标变异所在位置更靠后的read的数目、获取满足在两个目标变异所在位置之间连续且只含有位置靠前的目标变异的read的数目、以及获取满足在两个目标变异所在位置之间连续且只含有位置靠后的目标变异的read的数目;以及
顺反检测模块,用于根据获取的各类read的数目检测两个目标变异的顺反位置关系。
9.如权利要求8所述的基因变异顺反位置关系检测装置,其特征在于,还包括排序模块,所述排序模块用于将各组的变异按照其在相应染色体上的位置从小到大进行排序。
10.如权利要求8所述的基因变异顺反位置关系检测装置,其特征在于,所述顺反检测模块是用于根据顺式关系判断条件和反式关系判断条件检测两个目标变异的顺反位置关系;
所述顺式关系判断条件为:m≥1且m+n+x≥3;
所述反式关系判断条件为:p≥1,q≥1且p+q≥3;
其中,m为两个目标变异位于同一连续read上的read的数目;
n为只含有位置靠前的目标变异且read末端位置比另一个目标变异所在位置更靠前的read的数目;
x为只含有位置靠后的目标变异且read起始位置比另一个目标变异所在位置更靠后的read的数目;
p为在两个目标变异所在位置之间连续且只含有位置靠前的目标变异的read的数目;
q为在两个目标变异所在位置之间连续且只含有位置靠后的目标变异的read的数目。
11.如权利要求10所述的基因变异顺反位置关系检测装置,其特征在于,还包括顺式丰度计算模块,所述顺式丰度计算模块用于在顺式关系下计算合并后变异的丰度AF(in cis)=(2m+n+x)/(Dvar1+Dvar2),Dvar1和Dvar2分别为两个目标变异所在位置处的测序深度。
12.如权利要求10所述的基因变异顺反位置关系检测装置,其特征在于,还包括反式丰度计算模块,所述反式丰度计算模块用于在反式关系下分别计算两个目标变异的丰度AF(var1)和AF(var2):AF(var1)=var1的总丰度,AF(var2)=var2的总丰度,var1和var2分别代表两个目标变异。
13.如权利要求10所述的基因变异顺反位置关系检测装置,其特征在于,还包括顺反丰度计算模块,所述顺反丰度计算模块用于在同时满足顺式关系和反式关系下分别计算顺式关系下合并后变异的丰度AF(in cis)和反式关系下两个目标变异的丰度AF(var1)与AF(var2):
AF(in cis)=(2m+n+x)/(Dvar1+Dvar2),
AF(var1)=p/Dvar1,
AF(var2)=q/Dvar2;
其中,Dvar1和Dvar2分别为两个目标变异所在位置处的测序深度。
14.一种计算机设备,其特征在于,具有处理器和存储器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~7中任一项所述的基因变异顺反位置关系检测方法的步骤。
15.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时实现如权利要求1~7中任一项所述的基因变异顺反位置关系检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010295575.6A CN111599408B (zh) | 2020-04-15 | 2020-04-15 | 基因变异顺反位置关系检测方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010295575.6A CN111599408B (zh) | 2020-04-15 | 2020-04-15 | 基因变异顺反位置关系检测方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111599408A CN111599408A (zh) | 2020-08-28 |
CN111599408B true CN111599408B (zh) | 2022-05-06 |
Family
ID=72192167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010295575.6A Active CN111599408B (zh) | 2020-04-15 | 2020-04-15 | 基因变异顺反位置关系检测方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111599408B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115798584B (zh) * | 2022-12-14 | 2024-03-29 | 上海华测艾普医学检验所有限公司 | 一种同时检测egfr基因t790m和c797s顺反式突变的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016208827A1 (ko) * | 2015-06-24 | 2016-12-29 | 사회복지법인 삼성생명공익재단 | 유전자를 분석하는 방법 및 장치 |
CN106603591A (zh) * | 2015-10-14 | 2017-04-26 | 北京聚道科技有限公司 | 一种面向基因组检测数据传输和预处理的处理方法及系统 |
CN108664766A (zh) * | 2018-05-18 | 2018-10-16 | 广州金域医学检验中心有限公司 | 拷贝数变异的分析方法、分析装置、设备及存储介质 |
CN109949860A (zh) * | 2017-11-09 | 2019-06-28 | 国立癌症研究中心 | 序列解析方法及装置、参照序列生成方法及装置及程序及记录介质 |
CN110797088A (zh) * | 2019-10-17 | 2020-02-14 | 南京医基云医疗数据研究院有限公司 | 全基因组重测序分析及用于全基因组重测序分析的方法 |
-
2020
- 2020-04-15 CN CN202010295575.6A patent/CN111599408B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016208827A1 (ko) * | 2015-06-24 | 2016-12-29 | 사회복지법인 삼성생명공익재단 | 유전자를 분석하는 방법 및 장치 |
CN106603591A (zh) * | 2015-10-14 | 2017-04-26 | 北京聚道科技有限公司 | 一种面向基因组检测数据传输和预处理的处理方法及系统 |
CN109949860A (zh) * | 2017-11-09 | 2019-06-28 | 国立癌症研究中心 | 序列解析方法及装置、参照序列生成方法及装置及程序及记录介质 |
CN108664766A (zh) * | 2018-05-18 | 2018-10-16 | 广州金域医学检验中心有限公司 | 拷贝数变异的分析方法、分析装置、设备及存储介质 |
CN110797088A (zh) * | 2019-10-17 | 2020-02-14 | 南京医基云医疗数据研究院有限公司 | 全基因组重测序分析及用于全基因组重测序分析的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111599408A (zh) | 2020-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210174894A1 (en) | Methods and processes for non-invasive assessment of genetic variations | |
US20210272650A1 (en) | Methods and Processes for Non-Invasive Assessment of Genetic Variations | |
CN107423578B (zh) | 检测体细胞突变的装置 | |
CN105779280B (zh) | 由母本生物样品进行胎儿基因组的分析 | |
CN109880910A (zh) | 一种肿瘤突变负荷的检测位点组合、检测方法、检测试剂盒及系统 | |
CN110029157B (zh) | 一种检测肿瘤单细胞基因组单倍体拷贝数变异的方法 | |
US20120197533A1 (en) | Identifying rearrangements in a sequenced genome | |
CN114743594B (zh) | 一种用于结构变异检测的方法、装置和存储介质 | |
CN110093417B (zh) | 一种检测肿瘤单细胞体细胞突变的方法 | |
CN115052994A (zh) | 确定胚胎细胞染色体中预定位点碱基类型的方法及其应用 | |
CN111139291A (zh) | 一种单基因遗传性疾病高通量测序分析方法 | |
US20090228213A1 (en) | Display method and display apparatus of gene information | |
CN111599408B (zh) | 基因变异顺反位置关系检测方法、装置、设备和存储介质 | |
CN114694750A (zh) | 一种基于ngs平台的单样本肿瘤体细胞突变判别及tmb检测方法 | |
CN107967411B (zh) | 一种脱靶位点的检测方法、装置及终端设备 | |
CN112614541A (zh) | 基因编辑位点的自动筛选方法、系统、装置及存储介质 | |
Tross et al. | 3D reconstruction identifies loci linked to variation in angle of individual sorghum leaves | |
US20110301862A1 (en) | System for array-based DNA copy number and loss of heterozygosity analyses and reporting | |
JP3469542B2 (ja) | cDNA配列とゲノム配列との対応表示方法、記録媒体、シーケンサ装置及びプライマ設計方法 | |
Jouenne | Critical issues in the processing of cDNA microarray images | |
CN114242158B (zh) | ctDNA单核苷酸变异位点检测方法、装置、存储介质及设备 | |
JP4414823B2 (ja) | 遺伝子情報の表示方法及び表示装置 | |
CN114974416B (zh) | 一种检测相邻多核苷酸变异的方法及装置 | |
WO2023181370A1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP3773092B2 (ja) | 遺伝子発現パターン表示方法および装置並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |