CN110379458A - 致病性变异位点判定方法、装置、计算机设备及存储介质 - Google Patents

致病性变异位点判定方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110379458A
CN110379458A CN201910634602.5A CN201910634602A CN110379458A CN 110379458 A CN110379458 A CN 110379458A CN 201910634602 A CN201910634602 A CN 201910634602A CN 110379458 A CN110379458 A CN 110379458A
Authority
CN
China
Prior art keywords
variation
pathogenic
evidence
sample
tested
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910634602.5A
Other languages
English (en)
Inventor
卜枫啸
程静
曾园媛
李厦戎
徐晓飞
张倩
何明敏
王雪刚
卢宇
袁慧军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanfang Hospital
First Affiliated Hospital of PLA Military Medical University
Original Assignee
First Affiliated Hospital of PLA Military Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of PLA Military Medical University filed Critical First Affiliated Hospital of PLA Military Medical University
Priority to CN201910634602.5A priority Critical patent/CN110379458A/zh
Publication of CN110379458A publication Critical patent/CN110379458A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明适用于生物技术领域,提供了致病性变异位点判定方法、装置,计算机设备及存储介质,该方法包括:对待注释矩阵中的变异位点进行遗传变异注释;将变异位点标注的变异特征值转化为变异的致病性证据;对变异的致病性证据进行解读,得到每个待测样本的每个变异位点的变异致病性解读结果;根据用户针对待测样本的变异位点的变异致病性解读结果中的变异致病性证据的修改操作,生成新的变异致病性证据;将新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中,并重复上述步骤,直至不再增加新的变异致病性证据时,输出每个待测样本的遗传变异位点列表。本发明实施例提供的测定方法对于遗传变异位点的解读精确率和召回率高。

Description

致病性变异位点判定方法、装置、计算机设备及存储介质
技术领域
本发明属于生物技术领域,尤其涉及一种致病性变异位点判定方法、装置,计算机设备及存储介质。
背景技术
随着科技的进步,基因组计划也得到了飞速的发展,而基因数据重分析技术已广泛用于发现和检测孟德尔遗传疾病的致病变异位点。
目前常规的基因数据重分析方法主要是通过对特征进行层层严格筛选,得到候选的致病性变异,再结合变异的致病性报道,得到高置信度的致病变异。该方法将单个待测样本的变异位点通过多种特征严格的筛选,以此减少致病性变异评估的基数,再结合表型信息,可以得到较为精准的致病变异,但这样严格的初筛标准也会导致潜在的致病性变异被过滤掉,造成较高的假阴性率。
为了解决上述方法的假阴性率较高的问题,提出了只对变异进行测序质量、基因型质量方面的初步筛选,再通过注释信息、人群数据等来为所有变异生成证据,期间不会损失潜在的致病性变异,通过初步筛选的每个变异都会进入证据转化、致病性解读步骤,但是该方法仍然存在一定的局限性,例如,可能由于其证据不足,过多依赖与已知致病性变异,而导致召回率和精确率低。
发明内容
本发明实施例提供一种致病性变异位点判定方法,旨在解决现有的遗传变异位点解读的精确率和召回率低的问题。
本发明实施例是这样实现的,一种致病性变异位点判定方法,包括如下步骤:
获取待测样本的测序序列,并将所述待测样本的测序序列与参考基因组序列进行比对,生成待注释矩阵;
利用基因注释工具,对所述待注释矩阵中的变异位点进行遗传变异注释,得到已注释的遗传变异矩阵;
根据预设的变异致病性证据转化规则,将所述变异位点标注的变异特征值转化为变异的致病性证据;
根据预设的变异致病性解读规则,对所述变异的致病性证据进行分析,得到每个待测样本的变异位点的变异致病性解读结果;
根据用户针对所述待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据的修改操作,生成新的变异致病性证据;
将所述新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中,并重复对所述待测样本的变异位点的变异致病性证据转化、变异致病性解读和人工校正的步骤,直至不再增加新的变异致病性证据时,输出每个待测样本的遗传变异位点列表。
本发明实施例还提供一种致病性变异位点判定装置,包括:
获取单元,用于获取待测样本的测序序列,并将所述待测样本的测序序列与参考基因组序列进行比对,生成待注释矩阵;
遗传变异注释单元,用于利用基因注释工具,对所述待注释矩阵中的变异位点进行遗传变异注释,得到已注释的遗传变异矩阵;
变异致病性证据转化单元,用于根据预设的变异致病性证据转化规则,将所述变异位点标注的变异特征值转化为变异的致病性证据;
变异致病性解读单元,用于根据预设的变异致病性解读规则,对所述变异的致病性证据进行分析,得到每个待测样本的变异位点的变异致病性解读结果;
变异致病性证据修改单元,用于根据用户针对所述待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据的修改操作,生成新的变异致病性证据。
遗传变异位点列表输出单元,用于将所述新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中,并重复对所述待测样本的变异位点的变异致病性证据转化、变异致病性解读和人工校正的步骤,直至不再增加新的变异致病性证据时,输出每个待测样本的遗传变异位点列表。
本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述的致病性变异位点判定方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述的致病性变异位点判定方法的步骤。
本发明实施例提供的致病性变异位点判定方法,通过用户针对待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据的修改操作,生成新的变异致病性证据,并将新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中,并重复对待测样本的变异位点的变异致病性证据转化、变异致病性解读和人工校正的步骤,扩大了已知变异致病性证据库中的变异致病性证据的数量,从而可找到更多与变异位点相关联的变异致病性证据,挖掘出更多的潜在的致病性变异位点,减少“不确定”的解读结果,提高召回率。
附图说明
图1是本发明实施例一提供的致病性变异位点判定方法的实现流程图;
图2是本发明实施例提供的某待测样本的变异文件中的部分内容;
图3是本发明实施例二提供的致病性变异位点判定方法的实现流程图;
图4是本发明实施例提供的已注释的遗传变异矩阵的VCF格式列表的示意图;
图5是本发明实施例三提供的致病性变异位点判定方法的实现流程图;
图6是本发明实施例提供的一种致病性变异位点判定装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
本发明实施例提供的致病性变异位点判定方法,通过用户针对待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据的修改操作,生成新的变异致病性证据,并将新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中,并重复对待测样本的变异位点的变异致病性证据转化、变异致病性解读和人工校正的步骤,扩大了已知变异致病性证据库中的变异致病性证据的数量,从而可找到更多与变异位点相关联的变异致病性证据,挖掘出更多的潜在的致病性变异位点,减少“不确定”的解读结果,提高召回率。
图1是本发明实施例一提供的一种致病性变异位点判定方法的实现流程图,如图1所示,致病性变异位点判定方法,包括如下步骤:
在步骤S102中,获取待测样本的测序序列,并将待测样本的测序序列与参考基因组序列进行比对,生成待注释矩阵。
在本发明实施例中,待测样本为含有核酸的样本,核酸的类型并不受特别限制,可以是脱氧核糖核酸(DNA),也可以是核糖核酸(RNA),优选DNA。本领域技术人员可以理解,对于RNA,可以通过实验方法逆转录成DNA,进行后续检测和分析。
参考基因组序列指具有唯一碱基排列方式的基因序列片段,通过与这种片段的比对可以确定地定位染色体上的位置。本发明实施例中可采用版本号为hg38、hg19或hg18的参考基因组序列。
在本发明实施例中,可利用基因比对和变异鉴定工具,将待测样本的测序序列与参考基因组序列进行比对,生成各个待测样本的变异列表,再合并待测样本的变异列表生成待注释矩阵。
在步骤S104中,利用基因注释工具,对待注释矩阵中的变异位点进行遗传变异注释,得到已注释的遗传变异矩阵。
在本发明实施例中,基因注释工具可以为VEP(variant Effect Predictor,突变注释工具),ANNOVAR等。
变异位点通常包括:点突变(SNV),短的插入缺失(Indel)等。
对待注释矩阵中的变异位点进行遗传变异注释,注释的内容包括:①变异在基因组中的位置,包括DNA水平的基因、RNA水平的转录本、蛋白质水平的结构域等;②变异的类型,表明对翻译蛋白质的影响,如无义突变、错义突变、同义突变;③变异在人群中的频率,如千人基因组,gnomAD(Genome Aggregation Database,基因组突变频率数据库),ExAC(Exome Aggregation Consortium,外显子组测序项目)等数据库收集的样本中的频率等。
假设上述矩阵显示的是待测样本1和待测样本2中的某个基因位点(变异位点)上的碱基序列与参考基因组序列的比对结果。下面以待测样本1为例进行说明,参考基因组序列中的编码第一个氨基酸的碱基为ACC(苏氨酸),编码第二个氨基酸的碱基为GGC(甘氨酸),而待测样本1中编码第一个氨基酸的碱基为AT(U)C(异亮氨酸),编码第二个氨基酸的碱基为CGT(U)(精氨酸)。即待测样本1中在该基因位点上的单碱基变异导致了其氨基酸的种类的改变,此时,可在该变异位点处进行注释“错义突变”。
在步骤S106中,根据预设的变异致病性证据转化规则,将变异位点标注的变异特征值转化为变异的致病性证据。
在本发明实施例中,预设的变异致病性证据转化规则参考美国医学遗传学与基因组学学会(ACMG,American College of Medical Genetics and Genomics)制定的序列变异解读指南中的证据规则。根据ACMG中的证据转化规则将变异位点标注的变异特征值转化为变异的致病性证据。
以变异位点中已注释的变异特征值gnomAD等位基因频率为例,gnomAD数据库收录的是正常人群,当注释的变异特征值为某变异位点的变异在该人群中的频率大于一定的阈值(如0.1%)时,则认为该变异位点的变异为致病变异的概率非常小,则在该变异位点处标记良性的证据BA1。
另外,基于待测样本信息的证据转化,以PP4为例,ACMG指南中的证据规则之一为:如果样本具有耳聋前庭导水管扩大的表型,且患有Pendred综合征(又名家族性甲状腺肿先天性聋综合征),那么该待测样本发生在SLC26A4基因内的变异可能为致病性变异,则在SLC26A4基因处标记致病证据PP4。
在步骤S108中,根据预设的变异致病性解读规则,对变异的致病性证据进行解读,得到每个待测样本的变异位点的变异致病性解读结果。
经过上述步骤S106的处理后,将得到每个待测样本(个体)的变异文件,其中该变异文件为一矩阵,该矩阵中的每行表示一个变异位点的变异,每列表示每个变异位点的变异致病性证据。根据该变异文件中每个变异位点所显示的变异致病性证据进行解读,得到每个待测样本的变异位点的变异致病性解读结果。
具体的,证据分为致病证据和良性证据,证据的权重划分为四个等级,分别为非常强,强,中等和支持,通过证据强度组合规则进行致病性解读,得到的致病性结果分为五类:致病,可能致病,良性,可能良性和无法确定,比如1条非常强致病证据和至少1条强致病证据组合解读结果为致病;2条以上强良性证据解读结果为良性等。
以上述两条规则为例:1条非常强致病证据和至少1条强致病证据组合解读结果为致病;2条以上强良性证据解读结果为良性等。如果某变异被标记PVS1(非常强)、PS1(强)证据,则该变异位点解读为致病变异;如果某变异被标记BS1(强)、BS2(强)证据,则该变异位点解读为良性变异。
图2示出了某待测样本的部分变异位点的致病性变异证据,以图2中所示的第一行为例进行说明,第一行显示了6号染色体上33152074基因组位置处发生了的插入G的变异,该变异被标记的致病性变异证据有PVS1=0;PM2=3;PP5=0;PM3=1,数字表示证据的强度,0-3强度递减,根据ACMG指南中的遗传变异分类联合标准规则中的相关描述可知,其解读结果为致病。以此类推,对每个变异文件中的每个变异位点中所显示的变异致病性证据进行解读,得到每个待测样本所有的变异位点的变异致病性解读结果。
在步骤S110中,根据用户针对所述待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据的修改操作,生成新的变异致病性证据。
在本发明实施例中,用户对待测样本的变异位点的变异致病性解读结果进行校正,校正主要针对致病性解读结果中标注为致病的变异位点,具体的,用户结合待测样本表型数据和查阅的文献资料等对该变异点位进行致病性解读结果的确认和更正,得到高置信度的致病变异,最后将更正的致病变异与公共数据库中的致病变异合并,以用于生成新的变异致病性证据。
在本发明实施例中,用户指的是遗传咨询师等专业人员,用户对每个待测样本的变异位点的变异致病性解读结果进行查阅,并挑出其中与预设的致病性证据转化规则不相符的变异位点的变异致病性证据,并进行修改保存。根据修改的内容生成新的变异致病性证据。
在步骤S112中,判断是否有增加新的变异致病性证据,若是,则执行步骤S114,将新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中;若否,则执行步骤S116,输出每个待测样本的遗传变异位点列表。
在本发明实施例中,通过循环分析是否有新增的变异致病性证据,可以不断地更新完善变异致病性证据库,扩大了已知变异致病性证据库中的变异致病性证据的数量,从而可找到更多与变异位点相关联的变异致病性证据,挖掘出更多的潜在的致病性变异位点,减少“不确定”的解读结果,提高召回率和检测的精确度。
在本发明实施例中,将新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中,具体为,将上述步骤S110得到的新的变异致病性证据添加到ACMG中的变异致病性证据库中,从而提高变异解读的精确度和召回率。
在本发明实施例中,输出的每个待测样本的遗传变异位点列表中每行显示一个变异位点的变异及其致病性解读结果(即致病性评级):致病,可能致病,良性,可能良性或无法确定。
本发明实施例提供的致病性变异位点判定方法,通过用户针对待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据的修改操作,生成新的变异致病性证据,并将新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中,并重复对待测样本的变异位点的变异致病性证据转化、变异致病性解读和人工校正的步骤,扩大了已知变异致病性证据库中的变异致病性证据的数量,从而可找到更多与变异位点相关联的变异致病性证据,挖掘出更多的潜在的致病性变异位点,减少“不确定”的解读结果,提高召回率。
在本发明的一个实施例中,上述步骤S102具体为:获取待测样本的测序序列,并将所述待测样本的测序序列与参考基因组序列进行比对,得到每个待测样本的DNA变异列表,鉴定并合并每个待测样本的DNA变异列表,生成待注释矩阵。
在本发明实施例中,基因比对工具可以为BWA软件,ANNOVAR注释软件等;变异鉴定工具可以为GATK(The Genome Analysis Toolkit),FreeBayes(贝叶斯遗传变异检测器)等。待测矩阵采用多样本VCF文件格式,具体为:每一列定义一个待测样本,每一行定义一个变异位点。若待测样本1携带变异位点1的杂合突变,则标记为0/1;若待测样本1携带变异位点1的纯合突变,则标记为1/1;若待测样本1携带变异位点1的半合突变,则标记为./1;若待测样本1不携带变异位点1的突变,则标记为0/0;若无法判断待测样本1在变异位点1的突变情况(例如该区域测序数据质量较差,无法进行变异鉴定),则标记为./.;若所有待测样本均不携带某种变异,则该变异位点不在矩阵中列出。
示例性的,待测样本1和待测样本2的变异列表如下表1所示。
表1
变异位点 待测样本1 待测样本2
1 0/1 0/0
2 1/1 1/1
3 0/0 ./.
... ... ...
图3是本发明实施例二提供的一种致病性变异位点判定方法的实现流程图,如图3所示,本发明实施例与上述实施例一基本相同,其不同之处仅在于:上述步骤S110具体包括步骤S202。
在步骤S202中,根据用户针对待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据修改操作,生成符合预设的致病性证据转化规则的新的变异致病性证据。
在本发明的一个示例性实施例中,在耳聋疾病中,变异位点7:107302082:A,T显示不符合PVS1规则,但却标记有非常强的致病证据,此时,专业人员将会结合自身掌握的经验知识和现有数据库记载的关于该变异位点7:107302082:A,T的致病性数据,为该变异位点添加可靠的ACMG变异致病性证据。
作为本发明的一个实施例,上述实施例一中的步骤S104具体为:利用基因注释工具,对所述待注释矩阵中的变异位点在基因组中的位置、变异的类型和变异在人群中的频率进行注释,得到已注释的遗传变异矩阵,格式为VCF文件格式(如图4所示,图中仅示出其中的部分)。
在本发明实施例中,变异注释步骤将在遗传变异的VCF文件中添加注释信息。VCF格式文件分为以“#”开头的注释部分和没有“#”开头的主体部分。主体部分每行代表一个变异位点,至少包括CHROM、POS、ID、REF、ALT、QUAL、FILTER、INFO八列信息,分别表示变异的染色体、基因组位置、变异位点号、参考基因组碱基、改变碱基、变异质量、过滤、变异详细信息。
遗传变异注释的信息将会存于INFO列,在INFO列中以如下格式显示:
“gnomAD_AF_raw=0.0001601;gnomAD_AN=108404;gnomAD_AN_AFR=9550”。表示该变异位点在gnomAD数据库中基因型过滤前的频率是0.0001601,在gnomAD数据库中的108404个样本中被检测到,其中有9550个样本的人种信息为非裔美国。
图5是本发明实施例三提供的一种致病性变异位点判定方法的实现流程图,如图5所示,本发明实施例与上述实施例一基本相同,其不同之处仅在于:上述步骤S106具体包括步骤S502。
在步骤S502中,建立待注释矩阵中的变异位点与从公共数据库中调取出来的已知致病性变异位点的关联关系,将变异位点标注的变异特征值转化为变异的致病性证据。
在本发明实施例中,建立所述待注释矩阵中的变异位点与从公共数据库(例如,ClinVar、HGMD、OMIM、DVD等)中调取出来的已知致病性变异位点的关联关系,包括与已知致病变异位点导致同样的氨基酸变化、复合杂合、连锁等关系,从而判断变异位点为致病变异位点的可能性,并转化为相应强度的变异致病性证据。
示例性的,假设来自公共数据库的已知致病变异V1的注释信息为“NP_065756.1:p.Arg40Cys”,即表示该变异导致蛋白质NP_065756.1的第40位精氨酸变为了半胱氨酸。若检测到变异V2的DNA改变与V1不同,但注释信息同样为“NP_065756.1:p.Arg40Cys”,则变异V2与变异V1导致了相同的氨基酸改变,即变异V2构成与变异V1导致同样的氨基酸变化的关系。基于此,可推测变异V2的DNA改变导致了蛋白质NP_065756.1的第40位精氨酸变为了半胱氨酸,并将“变异V2的DNA改变导致了蛋白质NP_065756.1的第40位精氨酸变为了半胱氨酸”转化为相应强度的变异致病性证据。
又例如,待测样本在某基因G1中的被鉴定出两个罕见杂合变异V3和V4,且V3和V4分别来自父方和母方,则V3和V4组成复合杂合变异关系。根据单基因遗传疾病的致病原理,一个纯合致病性变异或两个组成复合杂合关系的致病变异则会致病。以PM3证据为例,当V3和V4其中一个杂合变异为致病变异时,则另一个变异被标记PM3的证据。
再例如,待测样本在某基因G2中的被鉴定出两个变异V5和V6,且V5和V6均来自父方(或母方),则V5和V6构成相互连锁关系。以BP2证据为例,在该待测样本中,当两个连锁的变异V5和V6其中一个为致病变异时,则另一个变异被标记BP2的证据。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
下述为本发明公开的致病性变异位点判定装置实施例,可以用于执行本发明实施例公开的遗传变异位点致病性判定方法实施例。对于本发明公开的致病性变异位点判定装置实施例中未披露的细节,请参照本发明公开的方法实施例。
图6是本发明实施例还提供了一种致病性变异位点判定装置的框图,为了便于描述,图中仅示出与本发明相关的部分。如图6所示,该致病性变异位点判定装置包括:获取单元610、遗传变异注释单元620、变异致病性证据转化单元630、变异致病性解读单元640、变异致病性证据修改单元650和遗传变异位点列表输出单元660。
获取单元610被配置为获取待测样本的测序序列,并将所述待测样本的测序序列与参考基因组序列进行比对,生成待注释矩阵。
遗传变异注释单元620,被配置为利用基因注释工具,对所述待注释矩阵中的变异位点进行遗传变异注释,得到已注释的遗传变异矩阵。
变异致病性证据转化单元630,被配置为根据预设的变异致病性证据转化规则,将所述变异位点标注的变异特征值转化为变异的致病性证据;
变异致病性解读单元640,被配置为根据预设的变异致病性解读规则,对所述变异的致病性证据进行分析,得到每个待测样本的变异位点的变异致病性解读结果。
变异致病性证据修改单元650,被配置为根据用户针对所述待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据的修改操作,生成新的变异致病性证据;
遗传变异位点列表输出单元660,被配置为将所述新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中,并重复对所述待测样本的变异位点的变异致病性证据转化、变异致病性解读和人工校正的步骤,直至不再增加新的变异致病性证据时,输出每个待测样本的遗传变异位点列表。
本发明实施例提供的致病性变异位点判定装置,通过用户针对待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据的修改操作,生成新的变异致病性证据,并将新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中,并重复对待测样本的变异位点的变异致病性证据转化、变异致病性解读和人工校正的步骤,扩大了已知变异致病性证据库中的变异致病性证据的数量,从而可找到更多与变异位点相关联的变异致病性证据,挖掘出更多的潜在的致病性变异位点,减少“不确定”的解读结果,提高召回率。
优选的,上述获取单元610,被配置为获取待测样本的测序序列,并将所述待测样本的测序序列与参考基因组序列进行比对,得到每个待测样本的DNA变异列表,鉴定并合并每个待测样本的DNA变异列表,生成待注释矩阵。
优选的,上述变异致病性证据修改单元650,被配置为根据用户针对所述待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据修改操作,生成符合预设的致病性证据转化规则的新的变异致病性证据。
优选的,上述遗传变异注释单元620,被配置为利用基因注释工具,对所述待注释矩阵中的变异位点在基因组中的位置、变异的类型和变异在人群中的频率进行注释,得到已注释的遗传变异矩阵。
优选的,上述变异致病性证据转化单元630,被配置为建立所述待注释矩阵中的变异位点与从公共数据库中调取出来的已知致病性变异位点的关联关系,将所述变异位点标注的变异特征值转化为变异的致病性证据。
关于上述实施例中的装置,其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细描述说明。
在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待测样本的测序序列,并将所述待测样本的测序序列与参考基因组序列进行比对,生成待注释矩阵;
利用基因注释工具,对所述待注释矩阵中的变异位点进行遗传变异注释,得到已注释的遗传变异矩阵;
根据预设的变异致病性证据转化规则,将所述变异位点标注的变异特征值转化为变异的致病性证据;
根据预设的变异致病性解读规则,对所述变异的致病性证据进行分析,得到每个待测样本的变异位点的变异致病性解读结果;
根据用户针对所述待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据的修改操作,生成新的变异致病性证据;
将所述新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中,并重复对所述待测样本的变异位点的变异致病性证据转化、变异致病性解读和人工校正的步骤,直至不再增加新的变异致病性证据时,输出每个待测样本的遗传变异位点列表。
在一个实施例中,提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
获取待测样本的测序序列,并将所述待测样本的测序序列与参考基因组序列进行比对,得到待注释矩阵;
利用基因注释工具,对所述待注释矩阵中的变异位点进行遗传变异注释,生成已注释的遗传变异矩阵;
根据预设的变异致病性证据转化规则,将所述变异位点标注的变异特征值转化为变异的致病性证据;
根据预设的变异致病性解读规则,对所述变异的致病性证据进行分析,得到每个待测样本的变异位点的变异致病性解读结果;
根据用户针对所述待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据的修改操作,生成新的变异致病性证据;
将所述新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中,并重复对所述待测样本的变异位点的变异致病性证据转化、变异致病性解读和人工校正的步骤,直至不再增加新的变异致病性证据时,输出每个待测样本的遗传变异位点列表。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
为了进一步说明本发明的技术效果,以下通过具体的试验例来进行阐述:
通过分别采用本发明实施例提供的致病性变异位点判定方法和现有的致病性变异位点分析方法,对11475名耳聋患者的基因测序数据进行致病性变异位点分析,经过三轮循环分析确定基因诊断率。基因诊断是指通过基因检测和遗传分析,确定导致患者患病的基因变异。其中诊断率=可诊断人数/患者总数×100%。测试结果如下表2所示:
测试方法 可诊断人数(人) 诊断率(%)
本发明实施例提供的方法 2654 23.12
现有的分析方法 2257 19.67
从上表2的试验结果可以看出,采用现有的分析方法确定的可诊断人数为2257人,诊断率为23.12%,而采用本发明实施例提供的致病性变异位点判定方法确定的可诊断人数为2654人,诊断率为19.67%。可见,对于孟德尔遗传疾病的致病变异位点的测定,在本次3次循环的测试中,本发明实施例提供的致病性变异位点判定方法相较于现有的分析方法,其诊断率提高了近五分之一,即提高了对致病性变异位点的筛查诊断的召回率和准确度。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种致病性变异位点判定方法,其特征在于,包括如下步骤:
获取待测样本的测序序列,并将所述待测样本的测序序列与参考基因组序列进行比对,生成待注释矩阵;
利用基因注释工具,对所述待注释矩阵中的变异位点进行遗传变异注释,得到已注释的遗传变异矩阵;
根据预设的变异致病性证据转化规则,将所述变异位点标注的变异特征值转化为变异的致病性证据;
根据预设的变异致病性解读规则,对所述变异的致病性证据进行分析,得到每个待测样本的变异位点的变异致病性解读结果;
根据用户针对所述待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据的修改操作,生成新的变异致病性证据;
将所述新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中,并重复对所述待测样本的变异位点的变异致病性证据转化、变异致病性解读和人工校正的步骤,直至不再增加新的变异致病性证据时,输出每个待测样本的遗传变异位点列表。
2.如权利要求1所述的致病性变异位点判定方法,其特征在于,所述根据用户针对所述待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据的修改操作,生成新的变异致病性证据的步骤,具体包括:
根据用户针对所述待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据修改操作,生成符合预设的致病性证据转化规则的新的变异致病性证据。
3.如权利要求1所述的致病性变异位点判定方法,其特征在于,所述利用基因注释工具,对所述待注释矩阵中的变异位点进行遗传变异注释的步骤,具体包括:
利用基因注释工具,对所述待注释矩阵中的变异位点在基因组中的位置、变异的类型和变异在人群中的频率进行注释,得到已注释的遗传变异矩阵。
4.如权利要求1所述的致病性变异位点判定方法,其特征在于,所述根据预设的变异致病性证据转化规则,将所述变异位点标注的变异特征值转化为变异的致病性证据的步骤,具体包括:
建立所述待注释矩阵中的变异位点与从公共数据库中调取出来的已知致病性变异位点的关联关系,将所述变异位点标注的变异特征值转化为变异的致病性证据。
5.如权利要求1所述的致病性变异位点判定方法,其特征在于,所述获取待测样本的测序序列,并将所述待测样本的测序序列与参考基因组序列进行比对,生成待注释矩阵的步骤,包括:
获取待测样本的测序序列,并将所述待测样本的测序序列与参考基因组序列进行比对,得到每个待测样本的DNA变异列表,鉴定并合并每个待测样本的DNA变异列表,生成待注释矩阵。
6.一种致病性变异位点判定装置,其特征在于,包括:
获取单元,用于获取待测样本的测序序列,并将所述待测样本的测序序列与参考基因组序列进行比对,生成待注释矩阵;
遗传变异注释单元,用于利用基因注释工具,对所述待注释矩阵中的变异位点进行遗传变异注释,得到已注释的遗传变异矩阵;
变异致病性证据转化单元,用于根据预设的变异致病性证据转化规则,将所述变异位点标注的变异特征值转化为变异的致病性证据;
变异致病性解读单元,用于根据预设的变异致病性解读规则,对所述变异的致病性证据进行分析,得到每个待测样本的变异位点的变异致病性解读结果;
变异致病性证据修改单元,用于根据用户针对所述待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据的修改操作,生成新的变异致病性证据;以及
遗传变异位点列表输出单元,用于将所述新的变异致病性证据更新到预设的致病性证据转化规则中的变异致病性证据库中,并重复对所述待测样本的变异位点的变异致病性证据转化、变异致病性解读和人工校正的步骤,直至不再增加新的变异致病性证据时,输出每个待测样本的遗传变异位点列表。
7.如权利要求6所述的致病性变异位点判定装置,其特征在于,所述变异致病性证据修改单元,具体用于:
根据用户针对所述待测样本的变异位点的变异致病性解读结果中与预设的致病性证据转化规则不相符的变异位点输入的变异致病性证据修改操作,生成符合预设的致病性证据转化规则的新的变异致病性证据。
8.如权利要求5所述的致病性变异位点判定装置,其特征在于,所述变异致病性证据转化单元,具体用于:
建立所述待注释矩阵中的变异位点与从公共数据库中调取出来的已知致病性变异位点的关联关系,将所述变异位点标注的变异特征值转化为变异的致病性证据。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至5中任一项权利要求所述的致病性变异位点判定方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至5中任一项权利要求所述的致病性变异位点判定方法的步骤。
CN201910634602.5A 2019-07-15 2019-07-15 致病性变异位点判定方法、装置、计算机设备及存储介质 Pending CN110379458A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910634602.5A CN110379458A (zh) 2019-07-15 2019-07-15 致病性变异位点判定方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910634602.5A CN110379458A (zh) 2019-07-15 2019-07-15 致病性变异位点判定方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN110379458A true CN110379458A (zh) 2019-10-25

Family

ID=68253142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910634602.5A Pending CN110379458A (zh) 2019-07-15 2019-07-15 致病性变异位点判定方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110379458A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110957006A (zh) * 2019-12-14 2020-04-03 杭州联川基因诊断技术有限公司 一种brca1/2基因变异的解读方法
CN111798926A (zh) * 2020-06-30 2020-10-20 广州金域医学检验中心有限公司 致病基因位点数据库及其建立方法
CN112489727A (zh) * 2020-12-24 2021-03-12 厦门基源医疗科技有限公司 一种快速获取罕见病致病位点的方法和系统
CN112735520A (zh) * 2021-02-03 2021-04-30 深圳裕康医学检验实验室 肿瘤个体化免疫治疗基因检测结果的解读方法、系统和存储介质
CN112795635A (zh) * 2020-12-31 2021-05-14 南昌瑞因康生物科技有限公司 一种马凡综合征及相关基因的检测方法、装置和存储介质
CN112908412A (zh) * 2021-02-10 2021-06-04 北京贝瑞和康生物技术有限公司 用于复合杂合变异致病证据适用性的方法、设备和介质
CN113808662A (zh) * 2021-09-01 2021-12-17 基诺莱(重庆)生物技术有限公司 基于神经网络的基因变异位点可致病性的预测方法及系统
CN114429785A (zh) * 2022-04-01 2022-05-03 普瑞基准生物医药(苏州)有限公司 一种基因变异的自动分类方法、装置和电子设备
CN114496080A (zh) * 2022-01-17 2022-05-13 中国人民解放军总医院第一医学中心 耳聋致病性基因的筛查方法、装置、存储介质及服务器
CN115171781A (zh) * 2022-07-13 2022-10-11 广州市金圻睿生物科技有限责任公司 肿瘤变异位点是否为噪音的识别方法、系统、装置和介质
WO2024092681A1 (zh) * 2022-11-04 2024-05-10 深圳华大基因股份有限公司 一种判断功能丧失型致病性证据的方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156538A (zh) * 2016-06-29 2016-11-23 天津诺禾医学检验所有限公司 一种全基因组变异数据的注释方法和注释系统
CN106599613A (zh) * 2016-12-15 2017-04-26 博奥生物集团有限公司 一种判定遗传性肿瘤变异位点分级的方法
AU2017100960A4 (en) * 2017-07-13 2017-08-10 Macau University Of Science And Technology Method of identifying a gene associated with a disease or pathological condition of the disease
CN107247890A (zh) * 2017-06-30 2017-10-13 张巍 一种用于临床诊断和预测的基因数据系统
CN109182483A (zh) * 2018-09-04 2019-01-11 天津诺禾致源生物信息科技有限公司 基因变异解读的方法及装置
CN109616155A (zh) * 2018-11-19 2019-04-12 江苏科技大学 一种编码区域遗传变异致病性分类的数据处理系统与方法
CN109920481A (zh) * 2019-01-31 2019-06-21 北京诺禾致源科技股份有限公司 Brca1/2基因变异解读数据库及其构建方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156538A (zh) * 2016-06-29 2016-11-23 天津诺禾医学检验所有限公司 一种全基因组变异数据的注释方法和注释系统
CN106599613A (zh) * 2016-12-15 2017-04-26 博奥生物集团有限公司 一种判定遗传性肿瘤变异位点分级的方法
CN107247890A (zh) * 2017-06-30 2017-10-13 张巍 一种用于临床诊断和预测的基因数据系统
AU2017100960A4 (en) * 2017-07-13 2017-08-10 Macau University Of Science And Technology Method of identifying a gene associated with a disease or pathological condition of the disease
CN109182483A (zh) * 2018-09-04 2019-01-11 天津诺禾致源生物信息科技有限公司 基因变异解读的方法及装置
CN109616155A (zh) * 2018-11-19 2019-04-12 江苏科技大学 一种编码区域遗传变异致病性分类的数据处理系统与方法
CN109920481A (zh) * 2019-01-31 2019-06-21 北京诺禾致源科技股份有限公司 Brca1/2基因变异解读数据库及其构建方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110957006B (zh) * 2019-12-14 2023-08-11 杭州联川基因诊断技术有限公司 一种brca1/2基因变异的解读方法
CN110957006A (zh) * 2019-12-14 2020-04-03 杭州联川基因诊断技术有限公司 一种brca1/2基因变异的解读方法
CN111798926A (zh) * 2020-06-30 2020-10-20 广州金域医学检验中心有限公司 致病基因位点数据库及其建立方法
CN111798926B (zh) * 2020-06-30 2023-09-29 广州金域医学检验中心有限公司 致病基因位点数据库及其建立方法
CN112489727B (zh) * 2020-12-24 2023-06-23 厦门基源医疗科技有限公司 一种快速获取罕见病致病位点的方法和系统
CN112489727A (zh) * 2020-12-24 2021-03-12 厦门基源医疗科技有限公司 一种快速获取罕见病致病位点的方法和系统
CN112795635A (zh) * 2020-12-31 2021-05-14 南昌瑞因康生物科技有限公司 一种马凡综合征及相关基因的检测方法、装置和存储介质
CN112735520B (zh) * 2021-02-03 2021-07-20 深圳裕康医学检验实验室 肿瘤个体化免疫治疗基因检测结果的解读方法、系统和存储介质
CN112735520A (zh) * 2021-02-03 2021-04-30 深圳裕康医学检验实验室 肿瘤个体化免疫治疗基因检测结果的解读方法、系统和存储介质
CN112908412A (zh) * 2021-02-10 2021-06-04 北京贝瑞和康生物技术有限公司 用于复合杂合变异致病证据适用性的方法、设备和介质
CN113808662A (zh) * 2021-09-01 2021-12-17 基诺莱(重庆)生物技术有限公司 基于神经网络的基因变异位点可致病性的预测方法及系统
CN114496080A (zh) * 2022-01-17 2022-05-13 中国人民解放军总医院第一医学中心 耳聋致病性基因的筛查方法、装置、存储介质及服务器
CN114429785A (zh) * 2022-04-01 2022-05-03 普瑞基准生物医药(苏州)有限公司 一种基因变异的自动分类方法、装置和电子设备
CN115171781A (zh) * 2022-07-13 2022-10-11 广州市金圻睿生物科技有限责任公司 肿瘤变异位点是否为噪音的识别方法、系统、装置和介质
WO2024092681A1 (zh) * 2022-11-04 2024-05-10 深圳华大基因股份有限公司 一种判断功能丧失型致病性证据的方法及装置

Similar Documents

Publication Publication Date Title
CN110379458A (zh) 致病性变异位点判定方法、装置、计算机设备及存储介质
Zook et al. A robust benchmark for germline structural variant detection
Mandelker et al. Navigating highly homologous genes in a molecular diagnostic setting: a resource for clinical next-generation sequencing
CN107849612B (zh) 比对和变体测序分析管线
Faust et al. YAHA: fast and flexible long-read alignment with optimal breakpoint detection
US20200165683A1 (en) Systems and methods for analyzing circulating tumor dna
Smadbeck et al. C opy number variant analysis using genome‐wide mate‐pair sequencing
US11961589B2 (en) Models for targeted sequencing
Sun et al. SHOREmap v3. 0: fast and accurate identification of causal mutations from forward genetic screens
Turkahia et al. Pandemic-scale phylogenomics reveals elevated recombination rates in the SARS-CoV-2 spike region
US20240105282A1 (en) Methods for detecting bialllic loss of function in next-generation sequencing genomic data
US11923049B2 (en) Methods for processing next-generation sequencing genomic data
CA3119328A1 (en) Cancer tissue source of origin prediction with multi-tier analysis of small variants in cell-free dna samples
Bickhart et al. Generation of lineage-resolved complete metagenome-assembled genomes by precision phasing
SoRelle et al. Assembling and validating bioinformatic pipelines for next-generation sequencing clinical assays
Kuster et al. ngsComposer: an automated pipeline for empirically based NGS data quality filtering
Holt et al. Reducing Sanger confirmation testing through false positive prediction algorithms
Niaré et al. An optimized GATK4 pipeline for Plasmodium falciparum whole genome sequencing variant calling and analysis
Okumura et al. Construction of a virtual Mycobacterium tuberculosis consensus genome and its application to data from a next generation sequencer
TW201928797A (zh) 針對標靶定序的定點雜訊模型
Kaiser et al. Automated structural variant verification in human genomes using single-molecule electronic DNA mapping
Vats et al. Case study: Systematic detection and prioritization of gene fusions in cancer by RNA-Seq: A DIY toolkit
CN110476215A (zh) 用于多序列文件的签名-散列
Reis et al. Using synthetic chromosome controls to evaluate the sequencing of difficult regions within the human genome
Vilov et al. DeepSom: a CNN-based approach to somatic variant calling in WGS samples without a matched normal

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191025

RJ01 Rejection of invention patent application after publication