CN108710781B - 一种遗传突变的排序方法及装置 - Google Patents

一种遗传突变的排序方法及装置 Download PDF

Info

Publication number
CN108710781B
CN108710781B CN201810291733.3A CN201810291733A CN108710781B CN 108710781 B CN108710781 B CN 108710781B CN 201810291733 A CN201810291733 A CN 201810291733A CN 108710781 B CN108710781 B CN 108710781B
Authority
CN
China
Prior art keywords
mutation
gene
genetic
individual
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810291733.3A
Other languages
English (en)
Other versions
CN108710781A (zh
Inventor
吴超
张乔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Henghua Yongli Electric Power Engineering Co ltd
Original Assignee
Beijing Henghua Yongli Electric Power Engineering Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Henghua Yongli Electric Power Engineering Co ltd filed Critical Beijing Henghua Yongli Electric Power Engineering Co ltd
Priority to CN201810291733.3A priority Critical patent/CN108710781B/zh
Publication of CN108710781A publication Critical patent/CN108710781A/zh
Application granted granted Critical
Publication of CN108710781B publication Critical patent/CN108710781B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种遗传突变的排序方法,所述方法包括:对遗传突变本身携带的信息进行打分,确定第一得分,所述遗传突变本身携带的信息包括:遗传突变的破坏性和是否为已知致病突变;对遗传突变所在的基因和个体表型特征的关系进行打分,确定第二得分;将所述第一得分和所述第二得分进行加权处理,得到第三得分;根据所述第三得分,对筛选后的所述遗传突变进行排序。由此,减少了后续的分子诊断和治疗成本。

Description

一种遗传突变的排序方法及装置
技术领域
本发明涉及突变或遗传工程技术领域,具体涉及一种遗传突变的排序方法及装置。
背景技术
基因(遗传因子)是具有遗传效应的脱氧核糖核酸(Deoxyribonucleic acid,DNA)片段。基因支持着生命的基本构造和性能。储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息。生物体的生、长、衰、病、老、死等一切生命现象都与基因有关。它也是决定生命健康的内在因素。
遗传性疾病一般以"垂直方式"出现。父母传给子女,子女再传给他们的子女,一代传一代传递。患者携带的致病基因会通过后代的繁衍而继续遗传下去,而无血缘关系的家庭成员(如夫妻)之间,互相没有影响。
突变(Mutation),即基因突变在生物学上的含义,是指细胞中的遗传基因(通常指存在于细胞核中的脱氧核糖核酸)发生的改变。它包括单个碱基改变所引起的点突变,或多个碱基的缺失、重复和插入。原因可以是细胞分裂时遗传基因的复制发生错误、或受化学物质、辐射或病毒的影响。
突变通常会导致细胞运作不正常或死亡,甚至可以在较高等生物中引发癌症。但同时,突变也被视为物种进化的“推动力”。不理想的突变会经天择过程被淘汰,而对物种有利的突变则会被累积下去。
2007年5月3日,詹姆斯.希尼茨发表了“评估遗传性病症的方法”的文章,该文章中所涉及的遗传学疾病的评估方法,通过对比患有遗传病的个体中拷贝数变异和至少100个健康的正常个体中的拷贝数变异来确定患病个体中的拷贝数变异和所述疾病之间的相关性。
但是该方法不能区别对待不同的罕见病患,该些罕见病个体中的基因突变各不相同。同时,此方法也未能综合考虑已知的基因突变在不同疾病中所起的作用。最后,在存在多个可能的致病基因突变的情况下,此方法不能根据各突变同病患表型特征之间的关系来进行排序。因此,这种评估遗传性疾病的方法极大的增加了后续的分子诊断和治疗成本。
发明内容
本发明的目的在于提供一种遗传突变的排序方法,用以解决现有技术中的评估遗传性疾病的方法中诊断不到位,诊断成本高的问题。
为实现上述目的,第一方面,本发明提供了一种遗传突变的排序方法,所述方法包括:
对遗传突变本身携带的信息进行打分,确定第一得分,所述遗传突变本身携带的信息包括:遗传突变的破坏性和是否为已知致病突变;
对遗传突变所在的基因和个体表型特征的关系进行打分,确定第二得分;
将所述第一得分和所述第二得分进行加权处理,得到第三得分;
根据所述第三得分,对筛选后的所述遗传突变进行排序。
在一种可能的实现方式中,所述对遗传突变所在的基因和个体表型特征的关系进行打分,确定第二得分,具体包括:
将个体的表型特征对应到人体表型特征树;
在表型特征树的基础上生成个体化的树状图;
提取与所述树状图中任何节点相关的基因,生成个体的个性化基因列表;
根据PageRank with Priors算法对个性化树状图中的所有表型特征节点进行打分;
确定个体的基因列表和承载过滤后的突变的基因列表中的共同基因;
根据每个共同基因与各个表型特征节点之间的关系对每个共同基因进行打分。
在一种可能的实现方式中,根据下列方法进行遗传突变的筛选:
确定个体的遗传突变特征,所述遗传突变特征包括:突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率;
根据所述突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率,进行遗传突变的筛选。
通过预设的遗传突变的破坏性以及预设的遗传突变所在的基因和个体表型特征的关系,对筛选后的所述遗传突变进行排序。
在一种可能的实现方式中,所述确定个体的遗传突变特征具体包括:
利用突变注释软件对遗传突变的基因进行注释,确定所述遗传突变的基因的突变是否影响基因产生蛋白质变质;
将所述遗传突变的基因和基因组聚合数据库人类基因突变大数据库和人类基因突变遗传疾病大数据库HGMD进行比对,确定所述遗传突变的基因的突变已知的致病性和突变的频率。
在一种可能的实现方式中,所述根据所述突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的罕见性,进行遗传突变的筛选具体包括:
将所述突变的频率和预设的突变频率阈值进行比较,当所述突变在正常人群中出现的频率小于突变频率阈值时,且所述遗传突变会影响生成蛋白质功能时,将所述遗传突变保留进入下一步的分析。
第二方面,本发明提供了一种遗传突变的排序装置,所述装置包括:
打分单元,所述打分单元用于对遗传突变本身携带的信息进行打分,确定第一得分,所述遗传突变本身携带的信息包括:遗传突变的破坏性和是否为已知致病突变;
所述打分单元还用于,对遗传突变所在的基因和个体表型特征的关系进行打分,确定第二得分;
处理单元,所述处理单元用于将所述第一得分和所述第二得分进行加权处理,得到第三得分;
排序单元,所述排序单元用于根据所述第三得分,对筛选后的所述遗传突变进行排序。
在一种可能的实现方式中,所述打分单元具体用于:
将个体的表型特征对应到人体表型特征树;
在表型特征树的基础上生成个体化的树状图;提取与所述树状图中任何节点相关的基因,生成个体的个性化基因列表;
根据PageRank with Priors算法对个性化树状图中的所有表型特征节点进行打分;
确定个体的基因列表和承载过滤后的突变的基因列表中的共同基因;
根据每个共同基因与各个表型特征节点之间的关系对每个共同基因进行打分。
在一种可能的实现方式中,筛选单元;
所述筛选单元具体用于,确定个体的遗传突变特征,所述遗传突变特征包括:突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率;
根据所述突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率,进行遗传突变的筛选。
通过预设的遗传突变的破坏性以及预设的遗传突变所在的基因和个体表型特征的关系,对筛选后的所述遗传突变进行排序。
在一种可能的实现方式中,确定单元,所述确定单元用于,确定个体的遗传突变特征;
所述确定单元具体用于,利用突变注释软件对遗传突变的基因进行注释,确定所述遗传突变的基因的突变是否影响基因产生蛋白质变质;
将所述遗传突变的基因和基因组聚合数据库人类基因突变大数据库和人类基因突变遗传疾病大数据库HGMD进行比对,确定所述遗传突变的基因的突变已知的致病性和突变的频率。
在一种可能的实现方式中,所述筛选单元还用于,
将所述突变的频率和预设的突变频率阈值进行比较,当所述突变在正常人群中出现的频率小于突变频率阈值时,且所述遗传突变会影响生成蛋白质功能时,将所述遗传突变保留进入下一步的分析。
本发明具有如下优点:减少了后续的诊断和治疗成本。
附图说明
图1为本发明实施例提供的遗传突变的排序方法流程图;
图2本发明实施例提供的图1的具体流程图;
图3本发明实施例提供的遗传突变所在的基因和个体表型特征之间的关系示意图;
图4为本发明实施例提供的遗传突变的筛选流程图;
图5为本发明实施例提供的步骤410的具体流程图;
图6本发明实施例提供的步骤420的具体流程图;
图7本发明实施例提供的个性化表型特征和基因列表示意图;
图8为本发明实施例提供的遗传突变的排序装置结构示意图。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例1
图1为本发明实施例提供的遗传突变的排序方法流程图。如图1所示,该方法的执行主体可以是客户端,比如个人电脑(Personal Computer,PC)、台式机等。该方法包括以下步骤:
步骤110,对遗传突变本身携带的信息进行打分,确定第一得分,所述遗传突变本身携带的信息包括:遗传突变的破坏性和是否为已知致病突变;
步骤120,对遗传突变所在的基因和个体表型特征的关系进行打分,确定第二得分;
步骤130,将所述第一得分和所述第二得分进行加权处理,得到第三得分;
步骤140,根据所述第三得分,对筛选后的所述遗传突变进行排序。
具体的,如图2所示,其中,遗传突变的破坏性主要体现在对基因生成蛋白质的影响。本申请以splice_donor和splice_accepptor为最具破坏性,下一层级为其他splice_region_variant,frameshift,stop_gained,start_loss和stop_loss;inframe和missense为破坏性最低。另一个特征为该遗传突变所在基因和个体表型特征之间的关系,如图3所示。本申请首先通过个体的表型特征对应到人体表型特征树(Human PhenotypeOntology),在表型特征树的基础上生成个体化的树状图,并提取与树状图中任何节点相关的基因,形成个体的个性化基因列表。具体步骤如下:
在表型特征树上从每一个已知的个体表型特征节点出发,向下遍历这个表型特征节点所有的子表型特征节点,直到遇到表型特征树的叶(没有向下的子节点)为止(虚线);同时向上摘取这个表型特征节点的所有直接相连的父表型特征节点(双点虚线)。上述所有表型特征节点一起构成个体的个性化树状图,参见图7,图7中,在一个例子中,起始点为下肢骨骼异常。父节点为下肢异常和四肢骨骼异常。子节点为跖骨异常和髓质空腔加宽型跖骨膨大。初始的表型特征节点为主节点(单点虚线),其他遍历过程(向上及向下)中遇到的表型特征节点为辅节点。同个性化树状图中任意表型特征节点(主节点及辅节点)相关的基因一起构成个体的个性化基因列表。
在这之后根据网络拓扑的算法对这些个性表型特征进行打分,本申请采用PageRank with Priors算法。具体步骤如下:
PageRank with Priors模拟了一个网络爬虫的随机过程。网络爬虫在初始状态下停留在一个主节点上,之后根据节点之间的有方向的连接关系随机选择跳跃前往下一个节点,之后不断重复这一过程。在任何一次跳跃过程中,网络爬虫有β的可能性回到任意一个主节点上。在任意时刻,网络爬虫停留在网络节点n上的概率为:
Figure BDA0001617716620000071
此处,β为网络爬虫回到任意主节点的可能性,π(n)i+1是网络爬虫在i+1时间点上停留在网络节点n上的概率,u是节点n的所有邻居集合中的任意一个节点(从u到n有连接)。π(u)i是网络爬虫在i时间点上停留在网络节点u上的概率。pn是网络爬虫在初始时刻停留在网络节点n的概率。假设一共有m个主节点,并且n属于m集合,那么pn为1/m。如果n不是一个主节点,那么pn为零。
这一随机过程随着网络爬虫在整个网络拓扑内任意时刻的分布趋于稳定而结束。每个节点最终的分数对应网络爬虫在任意时刻停留在此表型特征节点上的概率。而每一个基因的分数为该基因相关的表型特征节点的分数之和。
在这之后,每一个突变获取其所在基因上的分数。最终,本申请通过大量临床全基因组数据和gradient descent算法来演算出两个特征各自的权重(突变致病性权重0.2,基因表型特征关系权重0.8),并为每一个过滤后的遗传突变形成一个统一的分数。这个分数代表了这个突变为该个体致病基因的可能性。本申请最终返回按照这个分数排序的基因突变列表。由此,减少了后续的分子诊断和治疗成本。
以下步骤为遗传突变的筛选的具体过程,如图4所示,图4为本发明实施例提供的遗传突变的筛选流程图,图4包括以下步骤:
步骤410,确定个体的遗传突变特征,所述遗传突变特征包括:突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率。
进一步的,所述确定个体的遗传突突变特征具体包括:利用突变注释软件,如SnpEff,对遗传突变的基因进行注释,确定所述遗传突变的基因的突变是否影响基因产生蛋白质变质;将所述遗传突变的基因和基因组聚合数据库人类基因突变大数据库gnomAD和人类基因突变大数据库HGMD进行比对,确定所述遗传突变的基因的突变已知的致病性和突变的罕见性。
具体的,如图5所示,利用开源软件如SnpEff对基因突变发生的位置,比如哪个基因发生突变、发生突变的基因处在哪个外显子上,以及转录transcript、符合人类基因组变异协会规定(Human Genome Variation Society,HGVS)的描述,突变是否影响基因产生蛋白质变质等进行确定。后续,可以将这几个特征作为后续进行遗传突变筛选的依据。而在本申请中,是将突变是否影响基因产生蛋白质变质作为一个主要特征,可以理解的是,可以根据需要,将其他任一特征作为确定进行遗传突变筛选的依据,本申请对此并不限定。
之后,通过对比gnomAD和HGMD,进一步注释在病患个体中发现的遗传突变的基因的突变已知的致病性和在各健康人群中的突变的频率。
步骤420,根据所述突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率,进行遗传突变的筛选。
如图6所示,根据每个遗传突变的三个特征进行筛选和过滤,具体来说,在一个例子中,所述根据所述突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率,进行遗传突变的筛选具体包括:
可以将所述突变的频率和预设的突变频率阈值进行比较,当所述突变的频率小于突变频率阈值时,且所述遗传突变会影响生成蛋白质功能时,将所述遗传突变筛选出来,删除出来的遗传突变可以根据所在基因构成基因列表,以作为下一步骤130的分析。此时,可以根据需要,设定突变频率阈值,比如0.5%作为健康人群中的突变频率阈值(罕见遗传病分析所需要的阈值一般较低)。可能会产生蛋白质变质功能的突变包括以下情况:
剪接区域变体splice_region_variant
停止保留stop_retained
起始密码子initiator_codon
无义突变stop_gained
止损stop_loss
开始丢失start_lost
移码突变frame shift
框内缺失inframe_deletion
框内插入inframe_insertion
错义突变missense
如果一个基因突变且在各个健康人群中出现的频率极低,并且会影响基因产生蛋白质变质,则可以保留该遗传突变的基因,并将其加入遗传突变的基因列表中。
也可以当确定所述遗传突变会导致疾病时,将所述遗传突变保留进入下一步的分析。
在另一个例子中,所述根据所述突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率,进行遗传突变的筛选,具体包括:
当确定所述遗传突变会导致疾病时,将所述遗传突变保留进入下一步的分析。
实施例2
图8为本发明实施例提供的遗传突变的排序装置结构示意图。如图8所示,该装置包括:打分单元810、处理单元820、排序单元830。
打分单元810用于对遗传突变本身携带的信息进行打分,确定第一得分,所述遗传突变本身携带的信息包括:遗传突变的破坏性和是否为已知致病突变;
打分单元810还用于,对遗传突变所在的基因和个体表型特征的关系进行打分,确定第二得分;
处理单元820用于将所述第一得分和所述第二得分进行加权处理,得到第三得分;
排序单元830用于根据所述第三得分,对筛选后的所述遗传突变进行排序。
进一步地,所述打分单元具体用于:
将个体的表型特征对应到人体表型特征树;
在表型特征树的基础上生成个体化的树状图;提取与所述树状图中任何节点相关的基因,生成个体的个性化基因列表;
根据PageRank with Priors算法对个性化树状图中的所有表型特征节点进行打分;
确定个体的基因列表和承载过滤后的突变的基因列表中的共同基因;
根据每个共同基因与各个表型特征节点之间的关系对每个共同基因进行打分。
进一步地,该装置还包括筛选单元840。
所述筛选单元840具体用于,确定个体的遗传突变特征,所述遗传突变特征包括:突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率;
根据所述突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率,进行遗传突变的筛选。
通过预设的遗传突变的破坏性以及预设的遗传突变所在的基因和个体表型特征的关系,对筛选后的所述遗传突变进行排序。
进一步地,所述装置还包括:确定单元850,所述确定单元850用于,确定个体的遗传突变特征;
所述确定单元850具体用于,利用突变注释软件对遗传突变的基因进行注释,确定所述遗传突变的基因的突变是否影响基因产生蛋白质变质;
将所述遗传突变的基因和基因组聚合数据库人类基因突变大数据库和人类基因突变遗传疾病大数据库HGMD进行比对,确定所述遗传突变的基因的突变已知的致病性和突变的频率。
进一步地,所述筛选单元840还用于,
将所述突变的频率和预设的突变频率阈值进行比较,当所述突变在正常人群中出现的频率小于突变频率阈值时,且所述遗传突变会影响生成蛋白质功能时,将所述遗传突变保留进入下一步的分析。
由此,减少了后续的诊断和治疗成本。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (8)

1.一种遗传突变的排序方法,其特征在于,所述方法包括:
对遗传突变本身携带的信息进行打分,确定第一得分,所述遗传突变本身携带的信息包括:遗传突变的破坏性和是否为已知致病突变;
对遗传突变所在的基因和个体表型特征的关系进行打分,确定第二得分;
将所述第一得分和所述第二得分进行加权处理,得到第三得分;
根据所述第三得分,对筛选后的所述遗传突变进行排序;
所述对遗传突变所在的基因和个体表型特征的关系进行打分,确定第二得分,具体包括:
将个体的表型特征对应到人体表型特征树;
在表型特征树的基础上生成个体化的树状图;提取与所述树状图中任何节点相关的基因,生成个体的个性化基因列表;
根据PageRank with Priors算法对个性化树状图中的所有表型特征节点进行打分;
确定个体的基因列表和承载过滤后的突变的基因列表中的共同基因;
根据每个共同基因与各个表型特征节点之间的关系对每个共同基因进行打分;
在表型特征树上从每一个已知的个体表型特征节点出发,向下遍历这个表型特征节点所有的子表型特征节点,直到遇到表型特征树的叶为止;同时向上摘取这个表型特征节点的所有直接相连的父表型特征节点。
2.根据权利要求1所述的方法,其特征在于,根据下列方法进行遗传突变的筛选:
确定个体的遗传突变特征,所述遗传突变特征包括:突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率;
根据所述突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率,进行遗传突变的筛选;
通过预设的遗传突变的破坏性以及预设的遗传突变所在的基因和个体表型特征的关系,对筛选后的所述遗传突变进行排序。
3.根据权利要求2所述的方法,其特征在于,所述确定个体的遗传突变特征具体包括:
利用突变注释软件对遗传突变的基因进行注释,确定所述遗传突变的基因的突变是否影响基因产生蛋白质变质;
将所述遗传突变的基因和基因组聚合数据库人类基因突变大数据库HGMD和人类基因突变遗传疾病大数据库gnomAD 进行比对,确定所述遗传突变的基因的突变已知的致病性和突变的频率。
4.根据权利要求1所述的方法,其特征在于,根据下列步骤,进行遗传突变的筛选具体包括:
将所述突变的频率和预设的突变频率阈值进行比较,当所述突变在正常人群中出现的频率小于突变频率阈值时,且所述遗传突变会影响生成蛋白质功能时,将所述遗传突变保留进入下一步的分析。
5.一种遗传突变的排序装置,其特征在于,所述装置包括:
打分单元,所述打分单元用于对遗传突变本身携带的信息进行打分,确定第一得分,所述遗传突变本身携带的信息包括:遗传突变的破坏性和是否为已知致病突变;
所述打分单元还用于,对遗传突变所在的基因和个体表型特征的关系进行打分,确定第二得分;
处理单元,所述处理单元用于将所述第一得分和所述第二得分进行加权处理,得到第三得分;
排序单元,所述排序单元用于根据所述第三得分,对筛选后的所述遗传突变进行排序;
所述打分单元具体用于:
将个体的表型特征对应到人体表型特征树;
在表型特征树的基础上生成个体化的树状图;提取与所述树状图中任何节点相关的基因,生成个体的个性化基因列表;
根据PageRank with Priors算法对个性化树状图中的所有表型特征节点进行打分;
确定个体的基因列表和承载过滤后的突变的基因列表中的共同基因;
根据每个共同基因与各个表型特征节点之间的关系对每个共同基因进行打分;
在表型特征树上从每一个已知的个体表型特征节点出发,向下遍历这个表型特征节点所有的子表型特征节点,直到遇到表型特征树的叶为止;同时向上摘取这个表型特征节点的所有直接相连的父表型特征节点。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:筛选单元;
所述筛选单元具体用于,确定个体的遗传突变特征,所述遗传突变特征包括:突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率;
根据所述突变是否影响基因产生蛋白质变质、突变已知的致病性和突变的频率,进行遗传突变的筛选;
通过预设的遗传突变的破坏性以及预设的遗传突变所在的基因和个体表型特征的关系,对筛选后的所述遗传突变进行排序。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:确定单元,所述确定单元用于,确定个体的遗传突变特征;
所述确定单元具体用于,利用突变注释软件对遗传突变的基因进行注释,确定所述遗传突变的基因的突变是否影响基因产生蛋白质变质;
将所述遗传突变的基因和基因组聚合数据库人类基因突变大数据库HGMD和人类基因突变遗传疾病大数据库gnomAD进行比对,确定所述遗传突变的基因的突变已知的致病性和突变的频率。
8.根据权利要求7所述的装置,其特征在于,所述筛选单元还用于,将所述突变的频率和预设的突变频率阈值进行比较,当所述突变在正常人群中出现的频率小于突变频率阈值时,且所述遗传突变会影响生成蛋白质功能时,将所述遗传突变保留进入下一步的分析。
CN201810291733.3A 2018-03-30 2018-03-30 一种遗传突变的排序方法及装置 Active CN108710781B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810291733.3A CN108710781B (zh) 2018-03-30 2018-03-30 一种遗传突变的排序方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810291733.3A CN108710781B (zh) 2018-03-30 2018-03-30 一种遗传突变的排序方法及装置

Publications (2)

Publication Number Publication Date
CN108710781A CN108710781A (zh) 2018-10-26
CN108710781B true CN108710781B (zh) 2022-03-25

Family

ID=63866978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810291733.3A Active CN108710781B (zh) 2018-03-30 2018-03-30 一种遗传突变的排序方法及装置

Country Status (1)

Country Link
CN (1) CN108710781B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111139291A (zh) * 2020-01-14 2020-05-12 首都医科大学附属北京安贞医院 一种单基因遗传性疾病高通量测序分析方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279369A (zh) * 2015-09-06 2016-01-27 苏州协云和创生物科技有限公司 一种基于二代测序的冠心病遗传风险评估方法
CN106575321A (zh) * 2014-01-14 2017-04-19 欧米希亚公司 用于基因组分析的方法和系统
CN107229841A (zh) * 2017-05-24 2017-10-03 重庆金域医学检验所有限公司 一种基因变异评估方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140088942A1 (en) * 2012-09-27 2014-03-27 Ambry Genetics Molecular genetic diagnostic system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106575321A (zh) * 2014-01-14 2017-04-19 欧米希亚公司 用于基因组分析的方法和系统
CN105279369A (zh) * 2015-09-06 2016-01-27 苏州协云和创生物科技有限公司 一种基于二代测序的冠心病遗传风险评估方法
CN107229841A (zh) * 2017-05-24 2017-10-03 重庆金域医学检验所有限公司 一种基因变异评估方法及系统

Also Published As

Publication number Publication date
CN108710781A (zh) 2018-10-26

Similar Documents

Publication Publication Date Title
CN108682457B (zh) 患者长期预后定量预测和干预系统及方法
JPWO2020142551A5 (zh)
CN105404793B (zh) 基于概率框架和重测序技术快速发现表型相关基因的方法
CA3005791A1 (en) Methods for detecting copy-number variations in next-generation sequencing
CN111883210B (zh) 基于临床特征和序列变异的单基因病名称推荐方法及系统
EP4008007B1 (en) Clustering of matched segments to determine linkage of dataset in a database
CN109310332A (zh) 用于分析数字数据的方法
CN108710781B (zh) 一种遗传突变的排序方法及装置
CN109215738B (zh) 阿尔茨海默症相关基因的预测方法
Zhang et al. XGBoost imputation for time series data
CN108509767B (zh) 一种遗传突变的处理方法及装置
CN117219166B (zh) 一种高度近视致病变异体的筛选方法、系统及设备
CN111128308B (zh) 一种神经精神疾病新发突变信息知识平台
CN110895969A (zh) 房颤预测决策树及其剪枝的方法
CN111897857A (zh) 主动脉夹层心脏手术后icu时长预测方法
EP3931835A1 (en) Graphical user interface displaying relatedness based on shared dna
CN114566215B (zh) 一种双端成对的剪接位点预测方法
CN106503489A (zh) 心血管系统对应的基因的突变位点的获取方法及装置
CN113035279A (zh) 基于miRNA测序数据的帕金森疾病演化关键模块识别方法
CN111192639A (zh) 一种基于复杂网络的肿瘤转移关键基因检索方法
CN116631572B (zh) 基于人工智能的急性心肌梗死临床决策支持系统及设备
CN113808665B (zh) 全基因组致病snp精细定位的因果关联分析方法
Jyothi et al. Computerized Prediction of Hereditary Diseases Through DNA Sequence Using Support Vector Machine (SVM)
CN110993031A (zh) 自闭症候选基因的分析方法、分析装置、设备及存储介质
CN116994650A (zh) 弥漫大b细胞淋巴瘤基因型分类方法、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant