CN111710432A - 基于表型的致病基因定量测算方法及设备 - Google Patents

基于表型的致病基因定量测算方法及设备 Download PDF

Info

Publication number
CN111710432A
CN111710432A CN202010686744.9A CN202010686744A CN111710432A CN 111710432 A CN111710432 A CN 111710432A CN 202010686744 A CN202010686744 A CN 202010686744A CN 111710432 A CN111710432 A CN 111710432A
Authority
CN
China
Prior art keywords
gene
clinical symptom
phenotype
patient
pathogenic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010686744.9A
Other languages
English (en)
Other versions
CN111710432B (zh
Inventor
董欣然
卢宇蓝
周文浩
吴冰冰
王慧君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Childrens Hospital of Fudan University
Original Assignee
Childrens Hospital of Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Childrens Hospital of Fudan University filed Critical Childrens Hospital of Fudan University
Priority to CN202010686744.9A priority Critical patent/CN111710432B/zh
Publication of CN111710432A publication Critical patent/CN111710432A/zh
Application granted granted Critical
Publication of CN111710432B publication Critical patent/CN111710432B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请涉及一种基于表型的致病基因定量测算方法,包括:获取患者临床症状和基因检测结果,根据患者临床症状和基因检测结果,基于预设的基因与临床症状表型相关性模型,得到基因检测结果中各致病基因与临床症状表型的相关性分值。因为基因并不一定会100%导致某个临床症状表型,因此需要一个定量的指标来描述这种可能性,本申请中,根据患者就诊时所表现出的临床症状,和通过基因测序得到基因检测结果,计算基因检测结果中各致病基因与临床症状表型的相关性分值,致病基因与某个临床症状表型的相关性分值越高,证明致病基因越容易导致该临床症状表型。方便遗传咨询师评估导致患者疾病症状的致病基因。

Description

基于表型的致病基因定量测算方法及设备
技术领域
本申请涉及生物信息技术领域,尤其涉及一种基于表型的致病基因定量测算方法及设备。
背景技术
遗传病的分子诊断过程中,需要结合患者临床症状表型和基因检测结果,寻找能够解释患者表型的基因突变的过程。现有的二代测序技术能够对个体基因突变进行大规模检测,但由于突变数量巨大,突变和表型之间关系复杂的原因,难以从测序结果直接进行遗传病的临床诊断。
发明内容
为至少在一定程度上克服相关技术中存在的问题,本申请提供一种基于表型的致病基因定量测算方法及设备。
本申请的方案如下:
根据本申请实施例的第一方面,提供一种基于表型的致病基因定量测算方法,包括:
获取患者临床症状和基因检测结果;
根据所述患者临床症状和基因检测结果,基于预设的基因与临床症状表型相关性模型,得到所述基因检测结果中各致病基因与临床症状表型的相关性分值。
优选的,在本申请一种可实现的方式中,还包括:
根据所述致病基因与临床症状表型的相关性分值和患者临床症状表型,基于预设的算法,得到所述致病基因与患者临床症状表型的匹配程度分值;
基于REVEL评分算法,计算所述致病基因的突变损害评分;
根据所述致病基因与患者临床症状表型的匹配程度分值,以及所述致病基因的突变损害评分,基于预设的算法,计算所述基因检测结果中全部致病基因的结论分值;所述致病基因的结论分值用于表示所述致病基因是导致患者出现所有临床症状表型的致病基因的可能性评分;
根据所述致病基因的结论分值对所述基因检测结果中全部致病基因进行排序,并输出预设排名的致病基因。
优选的,在本申请一种可实现的方式中,还包括:
获取多个患者的历史诊断结论作为样本数据;
根据所述样本数据训练所述基因与临床症状表型相关性模型。
优选的,在本申请一种可实现的方式中,所述根据所述样本数据训练所述基因与临床症状表型相关性模型,具体包括:
在所述患者的历史诊断结论,定义患者的临床症状表型类别,以及各个致病基因的诊断结论;所述致病基因的诊断结论包括:阳性或者阴性;
基于预设的算法,分别计算当所述致病基因的诊断结论为阳性时,患者携带有各类临床症状表型的概率,将所述概率确定为所述致病基因与临床症状表型的相关性分值。
优选的,在本申请一种可实现的方式中,所述计算当致病基因的诊断结论为阳性时,患者携带有各类临床症状表型的概率,具体包括:
分别计算致病基因与临床症状表型的关联有数据库支持时,致病基因的诊断结论为阳性,患者携带有各类临床症状表型的概率;以及,
致病基因与临床症状表型的关联无数据库支持时,致病基因的诊断结论为阳性,患者携带有各类临床症状表型的概率。
优选的,在本申请一种可实现的方式中,计算当致病基因的诊断结论为阳性时,患者携带有各类临床症状表型的概率的算法公式包括:
当致病基因与临床症状表型的关联有数据库支持时:
Figure BDA0002587840520000031
当致病基因与临床症状表型的关联无数据库支持时:
Figure BDA0002587840520000032
其中,cGPSk,n表示致病基因n的诊断结论为阳性,患者携带有第k类临床症状表型的概率;Rn表示致病基因n的诊断结论,1代表阳性,0代表阴性;Sk表示患者是否有第k类临床症状表型,1代表有,0代表无;#()代表患者集合的大小;f(Sk=1)表示多个患者中第k类临床症状表型的百分比;α取值区间为0-1。
优选的,在本申请一种可实现的方式中,根据所述致病基因与临床症状表型的相关性分值和患者临床症状表型,得到所述致病基因与患者临床症状表型的匹配程度分值的算法公式包括:
Figure BDA0002587840520000033
其中,PhenotypeScoren表示所述致病基因与患者临床症状表型的匹配程度分值;cGPSk,n表示致病基因n的诊断结论为阳性,患者携带有第k类临床症状表型的概率;Sk表示患者是否有第k类临床症状表型,1代表有,0代表无。
优选的,在本申请一种可实现的方式中,根据所述致病基因与患者临床症状表型的匹配程度分值,以及所述致病基因的突变损害评分,得到所述致病基因的结论分值的算法公式包括:
ConsistencyScoern=PhenotypeScoren*PathogenicityScoren
其中,ConsistencyScoern表示所述致病基因的结论分值;所述PhenotypeScoren表示所述致病基因与患者临床症状表型的匹配程度分值;所述PathogenicityScoren表示所述致病基因的突变损害评分。
优选的,在本申请一种可实现的方式中,所述基于REVEL评分算法,计算所述致病基因的突变损害评分,具体包括:
基于REVEL评分算法,计算所述致病基因经过滤后每一个变异位点的分值之和;
若所述致病基因的变异类型为严重影响蛋白质的变异类型,则将所述致病基因严重影响蛋白质的变异位点的分值确定为1;
若所述致病基因经过滤后每一个变异位点的分值之和大于1,则将所述致病基因的突变损害评分确定为1。
根据本申请实施例的第二方面,提供一种基于表型的致病基因定量测算设备,包括:
处理器和存储器;
所述处理器与存储器通过通信总线相连接:
其中,所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器,用于存储程序,所述程序至少用于执行如以上任一项所述的基于表型的致病基因定量测算方法。
本申请提供的技术方案可以包括以下有益效果:本申请中的基于表型的致病基因定量测算方法,包括:获取患者临床症状和基因检测结果,根据患者临床症状和基因检测结果,基于预设的基因与临床症状表型相关性模型,得到基因检测结果中各致病基因与临床症状表型的相关性分值。因为基因并不一定会100%导致某个临床症状表型,因此需要一个定量的指标来描述这种可能性,本申请中,根据患者就诊时所表现出的临床症状,和通过基因测序得到基因检测结果,计算基因检测结果中各致病基因与临床症状表型的相关性分值,致病基因与某个临床症状表型的相关性分值越高,证明致病基因越容易导致该临床症状表型。方便遗传咨询师评估导致患者疾病症状的致病基因。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请一个实施例提供的一种基于表型的致病基因定量测算方法的流程示意图;
图2是本申请一个实施例提供的一种基于表型的致病基因定量测算方法中训练基因与临床症状表型相关性模型的流程示意图;
图3是本申请一个实施例提供的一种基于表型的致病基因定量测算方法中训练基因与临床症状表型相关性模型的具体流程示意图;
图4是本申请另一个实施例提供的一种基于表型的致病基因定量测算方法的流程示意图;
图5是本申请一个实施例提供的一种基于表型的致病基因定量测算设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
图1是本申请一个实施例提供的一种基于表型的致病基因定量测算方法的流程示意图,参照图1,一种基于表型的致病基因定量测算方法,包括:
S11:获取患者临床症状和基因检测结果;
S12:根据患者临床症状和基因检测结果,基于预设的基因与临床症状表型相关性模型,得到基因检测结果中各致病基因与临床症状表型的相关性分值。
现有的二代测序技术能够对个体基因突变进行大规模检测,但由于突变数量巨大、突变和表型之间关系复杂的原因,难以从测序结果直接进行遗传病的临床诊断。在突变数量方面,以一份平均测序深度120倍的全外显子检测数据为例。经标准流程处理后,即从二代测序技术得到的二代测序数据的原始文件出发,与参考基因组对比寻找变异位点,一个样本所产生的变异位点数量大约在10万个左右。在对变异位点进行客观的注释和筛选后,一般能将位点数量缩减到100个左右。在突变和表型的关联方面,以现有的OMIM数据库为例,其中记录了4835种基因和7271种表型的关联,一种基因可能导致多种表型(最多可达415种),一种表型可能来源于多种基因(最多可达169种)。
本申请中,计算每个已知致病基因在19种临床症状类别中的倾向值,从而定量地根据患者就诊时所表现出的临床症状和基因检测结果,基于预设的基因与临床症状表型相关性模型,得到基因检测结果中各致病基因与临床症状表型的相关性分值。
模型的训练参照图2,包括:
S121:获取多个患者的历史诊断结论作为样本数据;
S122:根据样本数据训练基因与临床症状表型相关性模型,参照图3,具体包括:
S1221:在患者的历史诊断结论,定义患者的临床症状表型类别,以及各个致病基因的诊断结论;其中致病基因的诊断结论包括:阳性或者阴性;
S1222:基于预设的算法,分别计算当致病基因的诊断结论为阳性时,患者携带有各类临床症状表型的概率,将概率确定为致病基因与临床症状表型的相关性分值。
计算当致病基因的诊断结论为阳性时,患者携带有各类临床症状表型的概率,具体包括:
分别计算致病基因与临床症状表型的关联有数据库支持时,致病基因的诊断结论为阳性,患者携带有各类临床症状表型的概率;以及,
致病基因与临床症状表型的关联无数据库支持时,致病基因的诊断结论为阳性,患者携带有各类临床症状表型的概率。
计算当致病基因的诊断结论为阳性时,患者携带有各类临床症状表型的概率的算法公式包括:
当致病基因与临床症状表型的关联有数据库支持时:
Figure BDA0002587840520000071
当致病基因与临床症状表型的关联无数据库支持时:
Figure BDA0002587840520000072
本实施例中,将对致病基因和临床症状表型表型间相关性进行度量的评分算法,命名为cGPS。
假设在M例患者的诊断结论中涉及到N个基因和K类临床症状表型的关联关系。
在患者m的诊断结论中,定义并计算如下值:
其中,cGPSk,n表示致病基因n的诊断结论为阳性,患者携带有第k类临床症状表型的概率;Rn表示致病基因n的诊断结论,1代表阳性,0代表阴性;Sk表示患者是否有第k类临床症状表型,1代表有,0代表无;#()代表患者集合的大小;f(Sk=1)表示多个患者中第k类临床症状表型的百分比;α取值区间为0-1。
参考朴素贝叶斯模型,在整个患者群体M中定义cGPSk,n,代表当基因n是某个患者的阳性诊断结论时,该患者也带有临床表现k的概率,即:
当致病基因与临床症状表型的关联有数据库支持时:
Figure BDA0002587840520000081
当致病基因与临床症状表型的关联无数据库支持时:
Figure BDA0002587840520000082
α取值区间为0-1,以保证更大的集合(满足条件的患者数量)其分值更高,以α为0.5为例,比如,2/(2+0.5)>1/(1+0.5),而非2/2=1/1。
本实施例中,cGPSk,n取值区间为0-1。
本实施例中的基于表型的致病基因定量测算方法,包括:获取患者临床症状和基因检测结果,根据患者临床症状和基因检测结果,基于预设的基因与临床症状表型相关性模型,得到基因检测结果中各致病基因与临床症状表型的相关性分值。因为基因并不一定会100%导致某个临床症状表型,因此需要一个定量的指标来描述这种可能性,本申请中,根据患者就诊时所表现出的临床症状,和通过基因测序得到基因检测结果,计算基因检测结果中各致病基因与临床症状表型的相关性分值,致病基因与某个临床症状表型的相关性分值越高,证明致病基因越容易导致该临床症状表型。方便遗传咨询师评估导致患者疾病症状的致病基因。
进一步的,参照图4,基于表型的致病基因定量测算方法还包括:
S21:根据致病基因与临床症状表型的相关性分值和患者临床症状表型,基于预设的算法,得到致病基因与患者临床症状表型的匹配程度分值;
根据致病基因与临床症状表型的相关性分值和患者临床症状表型,得到致病基因与患者临床症状表型的匹配程度分值的算法公式包括:
Figure BDA0002587840520000083
其中,PhenotypeScoren表示致病基因与患者临床症状表型的匹配程度分值;cGPSk,n表示致病基因n的诊断结论为阳性,患者携带有第k类临床症状表型的概率;Sk表示患者是否有第k类临床症状表型,1代表有,0代表无。
本实施例中,致病基因与患者临床症状表型的匹配程度分值阈值为0-1。
S22:基于REVEL评分算法,计算致病基因的突变损害评分;
REVEL评分算法是现有技术中一种已经成熟的计算致病基因的突变损害评分的算法,本实施例中对现有的REVEL评分算法进行改进,具体包括:
基于REVEL评分算法,计算致病基因经过滤后每一个变异位点的分值之和;
若致病基因的变异类型为严重影响蛋白质的变异类型(包括新发终止突变、移码突变、剪切位点改变),由于现有技术中的REVEL评分算法对这种情况不予评分,本实施例中,将致病基因严重影响蛋白质的变异位点的分值确定为1;
若致病基因经过滤后每一个变异位点的分值之和大于1,则将致病基因的突变损害评分确定为1。
因为REVEL评分算法本身阈值为0-1,是针对每一个变异位点的分值。本实施例中计算致病基因的突变损害评分时是针对致病基因进行计算,会把该致病基因上的变异位点REVEL评分进行加和,所以需要再进行最大值为1的转化。
本实施例中,致病基因的突变损害评分阈值为0到1。
S23:根据致病基因与患者临床症状表型的匹配程度分值,以及致病基因的突变损害评分,基于预设的算法,计算基因检测结果中全部致病基因的结论分值;致病基因的结论分值用于表示致病基因是导致患者出现所有临床症状表型的致病基因的可能性评分;
S24:根据致病基因的结论分值对基因检测结果中全部致病基因进行排序,并输出预设排名的致病基因。
根据致病基因与患者临床症状表型的匹配程度分值,以及致病基因的突变损害评分,得到致病基因的结论分值的算法公式包括:
ConsistencyScoern=PhenotypeScoren*PathogenicityScoren
其中,ConsistencyScoern表示致病基因的结论分值;PhenotypeScoren表示致病基因与患者临床症状表型的匹配程度分值;PathogenicityScoren表示致病基因的突变损害评分。
ConsistencyScoern用于描述基因n是导致患者m出现所有临床症状表型的致病基因的可能性评分。
根据致病基因的结论分值对患者基因检测结果中的所有致病基因进行排序,优选的,输出排名前十的致病基因。遗传咨询师可以根据结论分值排名前十的致病基因快速确定导致患者临床症状表型的致病基因。
一种基于表型的致病基因定量测算设备,包括:
处理器31和存储器32;
处理器31与存储器2通过通信总线相连接:
其中,处理器31,用于调用并执行存储器32中存储的程序;
存储器32,用于存储程序,程序至少用于执行以上任一实施例中的基于表型的致病基因定量测算方法。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于表型的致病基因定量测算方法,其特征在于,包括:
获取患者临床症状和基因检测结果;
根据所述患者临床症状和基因检测结果,基于预设的基因与临床症状表型相关性模型,得到所述基因检测结果中各致病基因与临床症状表型的相关性分值。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据所述致病基因与临床症状表型的相关性分值和患者临床症状表型,基于预设的算法,得到所述致病基因与患者临床症状表型的匹配程度分值;
基于REVEL评分算法,计算所述致病基因的突变损害评分;
根据所述致病基因与患者临床症状表型的匹配程度分值,以及所述致病基因的突变损害评分,基于预设的算法,计算所述基因检测结果中全部致病基因的结论分值;所述致病基因的结论分值用于表示所述致病基因是导致患者出现所有临床症状表型的致病基因的可能性评分;
根据所述致病基因的结论分值对所述基因检测结果中全部致病基因进行排序,并输出预设排名的致病基因。
3.根据权利要求2所述的方法,其特征在于,还包括:
获取多个患者的历史诊断结论作为样本数据;
根据所述样本数据训练所述基因与临床症状表型相关性模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述样本数据训练所述基因与临床症状表型相关性模型,具体包括:
在所述患者的历史诊断结论,定义患者的临床症状表型类别,以及各个致病基因的诊断结论;其中所述致病基因的诊断结论包括:阳性或者阴性;
基于预设的算法,分别计算当所述致病基因的诊断结论为阳性时,患者携带有各类临床症状表型的概率,将所述概率确定为所述致病基因与临床症状表型的相关性分值。
5.根据权利要求4所述的方法,其特征在于,所述计算当致病基因的诊断结论为阳性时,患者携带有各类临床症状表型的概率,具体包括:
分别计算致病基因与临床症状表型的关联有数据库支持时,致病基因的诊断结论为阳性,患者携带有各类临床症状表型的概率;以及,
致病基因与临床症状表型的关联无数据库支持时,致病基因的诊断结论为阳性,患者携带有各类临床症状表型的概率。
6.根据权利要求5所述的方法,其特征在于,计算当致病基因的诊断结论为阳性时,患者携带有各类临床症状表型的概率的算法公式包括:
当致病基因与临床症状表型的关联有数据库支持时:
Figure FDA0002587840510000021
当致病基因与临床症状表型的关联无数据库支持时:
Figure FDA0002587840510000022
其中,cGPSk,n表示致病基因n的诊断结论为阳性,患者携带有第k类临床症状表型的概率;Rn表示致病基因n的诊断结论,1代表阳性,0代表阴性;Sk表示患者是否有第k类临床症状表型,1代表有,0代表无;#()代表患者集合的大小;f(Sk=1)表示多个患者中第k类临床症状表型的百分比;α取值区间为0-1。
7.根据权利要求6所述的方法,其特征在于,根据所述致病基因与临床症状表型的相关性分值和患者临床症状表型,得到所述致病基因与患者临床症状表型的匹配程度分值的算法公式包括:
Figure FDA0002587840510000023
其中,PhenotypeScoren表示所述致病基因与患者临床症状表型的匹配程度分值;cGPSk,n表示致病基因n的诊断结论为阳性,患者携带有第k类临床症状表型的概率;Sk表示患者是否有第k类临床症状表型,1代表有,0代表无。
8.根据权利要求7所述的方法,其特征在于,根据所述致病基因与患者临床症状表型的匹配程度分值,以及所述致病基因的突变损害评分,得到所述致病基因的结论分值的算法公式包括:
ConsistencyScoern=PhenotypeScoren*PathogenicityScoren
其中,ConsistencyScoern表示所述致病基因的结论分值;所述PhenotypeScoren表示所述致病基因与患者临床症状表型的匹配程度分值;所述PathogenicityScoren表示所述致病基因的突变损害评分。
9.根据权利要求2所述的方法,其特征在于,所述基于REVEL评分算法,计算所述致病基因的突变损害评分,具体包括:
基于REVEL评分算法,计算所述致病基因经过滤后每一个变异位点的分值之和;
若所述致病基因的变异类型为严重影响蛋白质的变异类型,则将所述致病基因严重影响蛋白质的变异位点的分值确定为1;
若所述致病基因经过滤后每一个变异位点的分值之和大于1,则将所述致病基因的突变损害评分确定为1。
10.一种基于表型的致病基因定量测算设备,其特征在于,包括:
处理器和存储器;
所述处理器与存储器通过通信总线相连接:
其中,所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器,用于存储程序,所述程序至少用于执行权利要求1-9任一项所述的基于表型的致病基因定量测算方法。
CN202010686744.9A 2020-07-16 2020-07-16 基于表型的致病基因定量测算方法及设备 Active CN111710432B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010686744.9A CN111710432B (zh) 2020-07-16 2020-07-16 基于表型的致病基因定量测算方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010686744.9A CN111710432B (zh) 2020-07-16 2020-07-16 基于表型的致病基因定量测算方法及设备

Publications (2)

Publication Number Publication Date
CN111710432A true CN111710432A (zh) 2020-09-25
CN111710432B CN111710432B (zh) 2023-05-12

Family

ID=72546382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010686744.9A Active CN111710432B (zh) 2020-07-16 2020-07-16 基于表型的致病基因定量测算方法及设备

Country Status (1)

Country Link
CN (1) CN111710432B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112599210A (zh) * 2020-12-16 2021-04-02 首都医科大学附属北京同仁医院 一种数据管理方法、装置、电子设备及存储介质
CN113270144A (zh) * 2021-06-23 2021-08-17 北京易奇科技有限公司 一种基于表型的基因优先级排序方法和电子设备
CN113299400A (zh) * 2021-06-23 2021-08-24 复旦大学附属儿科医院 新生儿危重症遗传风险评估方法、装置及设备
CN113611361A (zh) * 2021-08-10 2021-11-05 飞科易特(广州)基因科技有限公司 一种用于婚恋匹配的单基因常染色体隐性遗传病的匹配方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160283484A1 (en) * 2013-10-03 2016-09-29 Personalis, Inc. Methods for analyzing genotypes
CN109473169A (zh) * 2018-10-18 2019-03-15 安吉康尔(深圳)科技有限公司 一种疾病诊断方法、装置及终端设备
CN110021364A (zh) * 2017-11-24 2019-07-16 上海暖闻信息科技有限公司 基于病人临床症状数据和全外显子组测序数据筛选单基因遗传病致病基因的分析检测系统
US20190325988A1 (en) * 2018-04-18 2019-10-24 Rady Children's Hospital Research Center Method and system for rapid genetic analysis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160283484A1 (en) * 2013-10-03 2016-09-29 Personalis, Inc. Methods for analyzing genotypes
CN110021364A (zh) * 2017-11-24 2019-07-16 上海暖闻信息科技有限公司 基于病人临床症状数据和全外显子组测序数据筛选单基因遗传病致病基因的分析检测系统
US20190325988A1 (en) * 2018-04-18 2019-10-24 Rady Children's Hospital Research Center Method and system for rapid genetic analysis
CN109473169A (zh) * 2018-10-18 2019-03-15 安吉康尔(深圳)科技有限公司 一种疾病诊断方法、装置及终端设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄俊恒;孙玉山;杜宇;: "利用蛋白质-表型网络的致病基因预测方法研究" *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112599210A (zh) * 2020-12-16 2021-04-02 首都医科大学附属北京同仁医院 一种数据管理方法、装置、电子设备及存储介质
CN112599210B (zh) * 2020-12-16 2022-04-12 首都医科大学附属北京同仁医院 一种数据管理方法、装置、电子设备及存储介质
CN113270144A (zh) * 2021-06-23 2021-08-17 北京易奇科技有限公司 一种基于表型的基因优先级排序方法和电子设备
CN113299400A (zh) * 2021-06-23 2021-08-24 复旦大学附属儿科医院 新生儿危重症遗传风险评估方法、装置及设备
CN113299400B (zh) * 2021-06-23 2023-02-21 复旦大学附属儿科医院 新生儿危重症遗传风险评估方法、装置及设备
CN113611361A (zh) * 2021-08-10 2021-11-05 飞科易特(广州)基因科技有限公司 一种用于婚恋匹配的单基因常染色体隐性遗传病的匹配方法
CN113611361B (zh) * 2021-08-10 2023-08-08 飞科易特(广州)基因科技有限公司 一种用于婚恋匹配的单基因常染色体隐性遗传病的匹配方法

Also Published As

Publication number Publication date
CN111710432B (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
CN111710432A (zh) 基于表型的致病基因定量测算方法及设备
CN109686439B (zh) 遗传病基因检测的数据分析方法、系统及存储介质
CN110021364B (zh) 基于病人临床症状数据和全外显子组测序数据筛选单基因遗传病致病基因的分析检测系统
CN105442052A (zh) 一种检测诊断主动脉夹层病致病基因的dna文库及其应用
US20220367063A1 (en) Polygenic risk score for in vitro fertilization
CN116356001B (zh) 一种基于血液循环肿瘤dna的双重背景噪声突变去除方法
CN113571158A (zh) 一种智慧智能ai智能心理健康检测与分析测评系统
Yuan et al. Likelihood-based Mendelian randomization analysis with automated instrument selection and horizontal pleiotropic modeling
CN116287204A (zh) 检测特征基因的突变情况在制备静脉血栓栓塞症风险检测产品中的应用
KR101693717B1 (ko) 개인 전장 유전체의 유전변이정보를 이용한 생리활성변이 분석 시스템
CN111739599B (zh) 一种教学病历生成方法和装置
KR20180069651A (ko) 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법
CN116312764A (zh) 变异危害性分级装置、方法及其应用
KR20190000341A (ko) 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법
Parsons et al. Clinical prediction models in Epidemiological studies: lessons from the application of Qrisk3 to UK Biobank data
CN114242166A (zh) 一种基于snp易感位点的高度近视预测模型及其应用
CN114783613A (zh) 一种近视的预测分析方法
CN114067908A (zh) 一种评估单样本同源重组缺陷的方法、装置和存储介质
CN111863129A (zh) 一种脑脊液中突变的检测方法及检测装置
CN116209777A (zh) 基于无创产前基因检测数据的亲缘关系判定方法和装置
WO2022264189A1 (ja) 遺伝的特徴推定装置、制御方法、及び非一時的なコンピュータ可読媒体
Hua et al. Combining protein-protein interactions information with support vector machine to identify chronic obstructive pulmonary disease related genes
Sundberg et al. Discovering and validating mouse models of human diseases: the Cinderella Effect
CN115458160B (zh) 乳腺肿瘤患者全程的智能化管理系统、方法、设备及介质
KR20190000340A (ko) 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant