CN109295198A - 用于检测遗传性疾病基因变异的方法、装置及终端设备 - Google Patents

用于检测遗传性疾病基因变异的方法、装置及终端设备 Download PDF

Info

Publication number
CN109295198A
CN109295198A CN201811021290.2A CN201811021290A CN109295198A CN 109295198 A CN109295198 A CN 109295198A CN 201811021290 A CN201811021290 A CN 201811021290A CN 109295198 A CN109295198 A CN 109295198A
Authority
CN
China
Prior art keywords
site
sequencing data
mutational site
gene sequencing
annotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811021290.2A
Other languages
English (en)
Inventor
陈玥茏
刘永初
刘阳
李阳
吕佩涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anji Kang Er (shenzhen) Technology Co Ltd
Original Assignee
Anji Kang Er (shenzhen) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anji Kang Er (shenzhen) Technology Co Ltd filed Critical Anji Kang Er (shenzhen) Technology Co Ltd
Priority to CN201811021290.2A priority Critical patent/CN109295198A/zh
Publication of CN109295198A publication Critical patent/CN109295198A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明适用于遗传变异检测技术领域,提供了用于检测遗传性疾病基因变异的方法、装置及终端设备,所述方法包括:获取遗传性疾病样本的基因测序数据;对基因测序数据进行重测序数据分析,检测基因测序数据中的突变位点;根据预设疾病数据库对突变位点进行突变注释,得到突变位点的注释结果;根据突变位点的注释结果,确定突变位点的突变检测结果。本发明能够实现遗传性疾病相关基因变异的准确判断,减少假阳性位点和假阴性位点,提高基因变异检测的准确性。

Description

用于检测遗传性疾病基因变异的方法、装置及终端设备
技术领域
本发明属于遗传变异检测技术领域,尤其涉及用于检测遗传性疾病基因变异的方法、装置及终端设备。
背景技术
家族性高胆固醇血症(FH)是一种遗传性疾病,其特征在于高胆固醇水平,特别是血液和早期心血管疾病中的高密度脂蛋白(low density lipoprotein,LDL)既“坏胆固醇”。由于具有FH潜在身体生物化学的个体略有不同,其高胆固醇水平对胆固醇控制方法的反应较少,这些方法通常在没有FH的人(例如饮食调整和他汀类药片)中更有效。
FH被归类为2型家族性血脂异常。有五种类型的家族性血脂异常(不包括亚型),并且每种都是由于遗传异常或脂质谱来进行划分。例如,高LDL(通常由LDL受体缺陷引起)是2型。其他包括乳糜微粒代谢缺陷,甘油三酯代谢和其他含胆固醇颗粒的代谢,例如极低密度脂蛋白VLDL和分化抑制因子IDL。
大约1/300到1/500的低密度脂蛋白(LDLR)基因突变,其编码LDL受体蛋白,通常从循环中去除LDL或载脂蛋白B(ApoB),LDL和载脂蛋白B是与受体结合的一部分。杂合子FH是一种常见的遗传性疾病,以常染色体显性遗传方式遗传,在大多数国家以1:500的比例发生;纯合子FH更为罕见,在百万分之一的婴儿中发生。
由于FH的遗传特征,所以相关的基因检测也进入了临床应用。近年来,由于分子生物学技术的发展,对家族性高胆固醇血症遗传学改变的了解也不断深入。家族性高胆固醇血症相关的基因突变是遗传变异。本领域技术人员已经认识到大部分的家族性高胆固醇血症中存在着染色体结构畸变,包括缺失、重复、倒位、易位等。
针对于家族性高胆固醇血症的基因检测的难点在于,家族性高胆固醇血症的相关基因并不是只有一个,而是多个,并且相关基因的变异中还存在与疾病无关的多态性位点,而这些多态性位点除了与疾病无关,由于序列的相似性,可能造成假阳性位点。如何区分真正的的相关变异与二代测序中发生的PCR错误、测序假阳性及比对不准确等带来的噪音是当前面临的一大难题。
发明内容
有鉴于此,本发明实施例提供了一种用于检测遗传性疾病基因变异的方法、装置及终端设备,以解决现有技术中遗传性疾病相关基因检测准确率低的问题。
本发明实施例的第一方面提供了一种用于检测遗传性疾病基因变异的方法,包括:
获取遗传性疾病样本的基因测序数据;
对基因测序数据进行重测序数据分析,检测基因测序数据中的突变位点;
根据预设疾病数据库对突变位点进行突变注释,得到突变位点的注释结果;
根据突变位点的注释结果,确定突变位点的突变检测结果。
本发明实施例的第二方面提供了一种用于检测遗传性疾病基因变异的装置,包括:
基因测序数据获取模块,用于获取遗传性疾病样本的基因测序数据;
突变位点检测模块,用于对基因测序数据进行重测序数据分析,检测基因测序数据中的突变位点;
注释结果获取模块,用于根据预设疾病数据库对突变位点进行突变注释,得到突变位点的注释结果;
突变检测结果获取模块,用于根据突变位点的注释结果,确定突变位点的突变检测结果。
本发明实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上用于检测遗传性疾病基因变异的方法的步骤。
本发明实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上用于检测遗传性疾病基因变异的方法的步骤。
本发明实施例与现有技术相比存在的有益效果是:本发明实施例首先获取遗传性疾病样本的基因测序数据;然后对基因测序数据进行重测序数据分析,检测基因测序数据中的突变位点;根据预设疾病数据库对突变位点进行突变注释,得到突变位点的注释结果;最后根据突变位点的注释结果,确定突变位点的突变检测结果。本发明实施例能够实现遗传性疾病相关基因变异的准确判断,减少假阳性位点和假阴性位点,提高基因变异检测的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的用于检测遗传性疾病基因变异的方法的实现流程示意图;
图2是本发明实施例提供的图1中S101的实现流程示意图;
图3是本发明实施例提供的图1中S102的实现流程示意图;
图4是本发明实施例提供的图3中S301的实现流程示意图;
图5是本发明实施例提供的图1中S104的实现流程示意图;
图6是本发明实施例提供的图5中S503的实现流程示意图;
图7是本发明实施例提供的用于检测遗传性疾病基因变异的装置的结构示意图;
图8是本发明实施例提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明的技术方案,下面通过具体实施例来进行说明。
实施例一
图1示出了本发明的一个实施例提供的一种用于检测遗传性疾病基因变异的方法的实现流程,其过程详述如下:
在S101中,获取遗传性疾病样本的基因测序数据。
以家族性高胆固醇血症为例,遗传性疾病样本可以为患有遗传性疾病的病患的DNA样本,例如家族性高胆固醇血症患者的血浆或血清,可以通过二代测序仪测序得到家族性高胆固醇血症DNA样本的基因测序数据。
在S102中,对基因测序数据进行重测序数据分析,检测基因测序数据中的突变位点。
在本实施例中,通过GATK(The Genome Analysis Toolkit,基因组分析工具包)对基因测序数据进行检测,得到基因测序数据中的突变位点,位点是染色体上一个基因或者标记的位置,突变位点表示基因发生突变的位置。
在S103中,根据预设疾病数据库对突变位点进行突变注释,得到突变位点的注释结果。
在本实施例中,预设疾病数据库中存储有已知疾病的注释信息及突变位点的对应关系,根据预设疾病数据库中已知疾病的注释信息及突变位点的对应关系,对存在已知疾病的注释信息的突变位点进行突变注释,得到突变位点的注释结果,此处已知疾病可以为家族性高胆固醇血症,注释信息可以为已知遗传性疾病的症状信息。
在S104中,根据突变位点的注释结果,确定突变位点的突变检测结果。
在本实施例中,根据突变位点的注释结果,可以得到与家族性高胆固醇血症相关的突变位点。
从上述实施例可知,本发明实施例首先获取遗传性疾病样本的基因测序数据;然后对基因测序数据进行重测序数据分析,检测基因测序数据中的突变位点;根据预设疾病数据库对突变位点进行突变注释,得到突变位点的注释结果;最后根据突变位点的注释结果,确定突变位点的突变检测结果。本发明实施例能够实现遗传性疾病相关基因变异的准确判断,减少假阳性位点和假阴性位点,提高基因变异检测的准确性。
如图2所示,在本发明的一个实施例中,图2示出了图1中S101的具体实现流程,其过程详述如下:
在S201中,获取遗传性疾病相关样本的初始基因测序数据。
在S202中,对初始基因测序数据进行过滤,得到基因测序数据。
在本实施例中,首先对遗传性疾病样本进行测序,得到初始基因测序数据,然后对初始基因测序数据进行质检,过滤去除掉低质量的测序数据,从而降低突变位点的假阳性和假阴性,获取高质量的基因测序数据,为后续基因变异的准确判断提供准确数据。
如图3所示,在本发明的一个实施例中,图3示出了图1中S102的具体实现流程,其过程详述如下:
在S301中,将基因测序数据与参考序列进行比对,得到基因测序数据在基因组中对应的位点。
在S302中,计算各个基因测序数据对应的可信度值,并将可信度值大于预设可信度阈值的基因测序数据对应的位点作为突变位点。
在本实施例中,首先通过基因测序数据与参考序列进行比对,从而得到基因测序数据在基因组中的位点,然后计算各个基因测序数据的位点的可信度值,从而得到基因测序数据中的突变位点,基因测序数据的位点的可信度值LOD计算公式如式1-3所示。
其中,M0表示在该位点没有变异,参考位点为参考序列中的位点,任何的非参考位点的碱基都被认为是测序噪音;bi表示第i条序列在这个位置上的碱基的符号表示,表示在该位点有真实的m突变,并且等位基因f表示频率。M0相当于f=0时的频率f可通过下述公式4得到。
参考位点为r∈{A,T,C,G},而对于每条read i(i=1…d),覆盖这个位点的碱基为bi,这个碱基的错误概率为ei(此错误概率由每个碱基的质量值ei得到,P表示在观察到的(ei,r,m,f)的条件下,该位置检测到的碱基为bi概率。
在本实施例中,将可信度值大于预设可信度阈值的位点作为突变位点。
如图4所示,在本发明的一个实施例中,图4示出了图3中S301的具体实现流程,其过程详述如下:
在S401中,将基因测序数据与参考序列进行比对,得到基因测序数据在基因组中对应的初始位点。
在S402中,检测基因测序数据对应的初始位点中是否存在第一位点。
在S403中,若基因测序数据对应的初始位点中存在第一位点,则将第一位点及第一位点的相邻位点对应的基因测序数据作为重比对数据,第一位点包括单核苷酸多态性SNP位点和插入缺失标记INDEL位点。
在S404中,基于SNP位点和INDEL位点,对重比对数据与参考序列进行再次比对,得到基因测序数据在基因组中对应的位点。
在本实施例中,首先通过基因测序数据与参考序列的比对,得到基因测序数据在基因组中对应的初始位点;然后检测基因测序数据对应的初始位点中是否存在第一位点,第一位点包括SNP位点和INDEL位点,若存在,则获取第一位点的相邻位点,将第一位点和相邻位点进行重新比对。相邻位点可以为第一位点前相邻且连续的预设数量的位点及第一位点后相邻且连续的预设数量的位点,并将第一位点及相邻位点对应的基因测序数据作为重比对数据,对重比对数据进行重新比对。
在本实施例中,由于基因组的基因数量庞大,且参考序列取的是普通人的相关基因序列,而普通人群的相关基因序列中也可能存在高频变异。但是,在首次与参考序列比对时,由于基因数量庞大,可能忽略了SNP位点及INDEL位点对于基因测序数据的影响,因此,取SNP位点或INDEL位点附近的序列作为重比对数据,对重比对数据与参考序列进行重新比对,此时需要考虑SNP位点和INDEL位点对于基因测序数据的位点的影响,从而为后续区分一般多态性位点和变异位点提供准确的位点数据支持。
例如,若基因测序数据中存在第一位点,则与参考序列进行第一次比对时,第一位点之前的基因测序数据对应的位点正确,但由于第一位点的存在,第一位点之后的序列会相应的位置错后,且由于第一位点的存在,第一位点与对应的参考序列的位点不同,终端设备可能错误的将第一位点判定为突变位点。因此,需要对第一位点附近的重比对数据进行重新比对,当比对到第一位点时,忽略第一位点,并继续将第一位点之后的数据与第一位点对应的参考序列的位点比对,从而将第一位点之后的基因测序数据比对到正确的位点处。
从上述实施例可知,通过加入重比对步骤,去除本身人群中的高频变异对检测步骤造成的影响,能够更准确地将系统错误与真实的变异进行区分,提高基因测序数量位点的准确性。
如图5所示,在本发明的一个实施例中,图5示出了图1中S104的具体实现流程,其过程详述如下:
在S501中,获取突变位点的蛋白质序列的保守性数据。
在S502中,根据蛋白质序列的保守性数据与有害度评分的关系,确定突变位点的有害度评分。
在S503中,根据突变位点的有害度评分和注释结果,确定突变位点的突变检测结果。
在本实施例中,蛋白质序列保守性越高,则突变位点的变异对蛋白质功能的影响越大,为了判断突变位点是否为显著性的有害位点,需要首先获取突变位点对应的蛋白质序列的保守性数据,保守性数据可以为保守性分值,终端设备中预存有保守性数据与有害度评分的对应关系,根据保守性数据及有害度评分的关系及各个突变位点对应的蛋白质序列的保守性数据,得到各个突变位点的有害度评分。
在本实施例中,综合考虑突变位点的注释结果和有害度评分,得到突变位点的突变检测结果,从而既能得到突变位点是否为有害变异,又能确定突变位点是否与遗传性疾病相关,提高了遗传性疾病基因突变检测结果的准确性。
从上述实施例可知,通过获取蛋白质序列的保守性数据,可以得到突变位点的有害度评分,从而预测基因突变对蛋白质功能的影响。
如图6所示,在本发明的一个实施例中,图6示出了图5中S503的具体实现流程,其过程详述如下:
在S601中,若突变位点的注释结果包括遗传性疾病注释,且突变位点的有害度评分大于或等于预设有害度评分阈值,则判定突变位点的突变检测结果为与遗传性疾病相关的有害变异;
在S602中,若突变位点的注释结果不包括遗传性疾病注释,且突变位点的有害度评分大于或等于预设有害度评分阈值,则判定突变位点的突变检测结果为与遗传性疾病无关的有害变异;
在S603中,若突变位点的注释结果不包括遗传性疾病注释,且突变位点的有害度评分小于预设有害度评分阈值,则判定突变位点的突变检测结果为无害变异。
在本实施例中,通过综合突变位点的考虑突变注释及有害度评分,可以剔除大量与待检测的遗传性疾病无关的突变位点,得到与待检测的遗传性疾病相关的突变位点,同时通过有害度评分,去除无害的基因突变,得到真实的有害基因突变,从而将测序错误与真实的有害突变进行准确区分,提高基因变异的检测精度,得到真实的且与待检测的遗传性疾病相关的突变位点。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例二
如图7所示,本发明的一个实施例提供的用于检测遗传性疾病基因变异的装置100,用于执行图1所对应的实施例中的方法步骤,其包括:
基因测序数据获取模块110,用于获取遗传性疾病样本的基因测序数据;
突变位点检测模块120,用于对基因测序数据进行重测序数据分析,检测基因测序数据中的突变位点;
注释结果获取模块130,用于根据预设疾病数据库对突变位点进行突变注释,得到突变位点的注释结果;
突变检测结果获取模块140,用于根据突变位点的注释结果,确定突变位点的突变检测结果。
本发明实施例首先获取遗传性疾病样本的基因测序数据;然后对基因测序数据进行重测序数据分析,检测基因测序数据中的突变位点;根据预设疾病数据库对突变位点进行突变注释,得到突变位点的注释结果;最后根据突变位点的注释结果,确定突变位点的突变检测结果。本发明实施例能够实现遗传性疾病相关基因变异的准确判断,减少假阳性位点和假阴性位点,提高基因变异检测的准确性。
在本发明的一个实施例中,图7中基因测序数据获取模块110还包括用于执行图2所对应的实施例中的方法步骤的结构,其包括:
初始数据获取单元,用于获取遗传性疾病相关样本的初始基因测序数据;
基因测序数据获取单元,用于对初始基因测序数据进行过滤,得到基因测序数据。
在本发明的一个实施例中,图7中突变位点检测模块120还包括用于执行图3所对应的实施例中的方法步骤的结构,其包括:
比对单元,用于将基因测序数据与参考序列进行比对,得到基因测序数据在基因组中对应的位点;
突变位点获取单元,用于计算各个基因测序数据对应的可信度值,并将可信度值大于预设可信度阈值的基因测序数据对应的位点作为突变位点。
在本发明的一个实施例中,比对单元还包括用于执行图4所对应的实施例中的方法步骤的结构,其包括:
初始比对子单元,用于将基因测序数据与参考序列进行比对,得到基因测序数据在基因组中对应的初始位点;
第一位点检测子单元,用于检测基因测序数据对应的初始位点中是否存在第一位点;
重比对数据获取子单元,用于若基因测序数据对应的初始位点中存在第一位点,则将第一位点及第一位点的相邻位点对应的基因测序数据作为重比对数据,第一位点包括单核苷酸多态性SNP位点和插入缺失标记INDEL位点;
重比对子单元,用于基于SNP位点和INDEL位点,对重比对数据与参考序列进行再次比对,得到基因测序数据在基因组中对应的位点。
从上述实施例可知,通过加入重比对步骤,去除了本身人群中的高频变异对检测步骤造成的影响,能够更准确地将系统错误与真实的变异进行区分,提高了基因测序数量位点的准确性。
在本发明的一个实施例中,突变检测结果获取模块140还包括用于执行图5所对应的实施例中的方法步骤的结构,其包括:
保守性数据获取单元,用于获取突变位点的蛋白质序列的保守性数据;
有害度评分获取单元,用于根据蛋白质序列的保守性数据与有害度评分的关系,确定突变位点的有害度评分;
突变检测结果获取单元,用于根据突变位点的有害度评分和注释结果,确定突变位点的突变检测结果。
从上述实施例可知,通过获取蛋白质序列的保守性数据,可以得到突变位点的有害度评分,从而预测基因突变对蛋白质功能的影响。
在本发明的一个实施例中,突变检测结果获取单元还包括用于执行图6所对应的实施例中的方法步骤的结构,其包括:
若突变位点的注释结果包括遗传性疾病注释,且突变位点的有害度评分大于或等于预设有害度评分阈值,则判定突变位点的突变检测结果为与遗传性疾病相关的有害变异;
若突变位点的注释结果不包括遗传性疾病注释,且突变位点的有害度评分大于或等于预设有害度评分阈值,则判定突变位点的突变检测结果为与遗传性疾病无关的有害变异;
若突变位点的注释结果不包括遗传性疾病注释,且突变位点的有害度评分小于预设有害度评分阈值,则判定突变位点的突变检测结果为无害变异。
从上述实施例可知,通过综合突变位点的考虑突变注释及有害度评分,可以剔除大量与检测的遗传性疾病无关的突变位点,得到与待检测的遗传性疾病相关的突变位点,同时通过有害度评分,去除无害的基因突变,得到真实的有害基因突变,将测序错误与真实的有害突变进行准确区分,提高基因变异的检测精度,得到真实的且与待检测的遗传性疾病相关的突变位点。
在一个实施例中,用于检测遗传性疾病基因变异的方法100还包括其他功能模块/单元,用于实现实施例1中各实施例中的方法步骤。
实施例三
图8是本发明一实施例提供的终端设备的示意图。如图8所示,该实施例的终端设备8包括:处理器80、存储器81以及存储在存储器81中并可在处理器80上运行的计算机程序82。所述处理器80执行所述计算机程序82时实现上述各个用于检测遗传性疾病基因变异的方法方法实施例中的步骤,例如图1所示的步骤101至104。或者,所述处理器80执行所述计算机程序82时实现上述各装置实施例中各模块/单元的功能,例如图7所示模块110至140的功能。
示例性的,所述计算机程序82可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器81中,并由所述处理器80执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序82在所述终端设备8中的执行过程。
所述终端设备8可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器80、存储器81。本领域技术人员可以理解,图8仅仅是终端设备8的示例,并不构成对终端设备8的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器80可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器81可以是所述终端设备8的内部存储单元,例如终端设备8的硬盘或内存。所述存储器81也可以是所述终端设备8的外部存储设备,例如所述终端设备8上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器81还可以既包括所述终端设备8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用于检测遗传性疾病基因变异的方法,其特征在于,包括:
获取遗传性疾病样本的基因测序数据;
对所述基因测序数据进行重测序数据分析,检测所述基因测序数据中的突变位点;
根据预设疾病数据库对所述突变位点进行突变注释,得到所述突变位点的注释结果;
根据所述突变位点的注释结果,确定所述突变位点的突变检测结果。
2.如权利要求1所述的用于检测遗传性疾病基因变异的方法,其特征在于,所述获取遗传性疾病相关样本的基因测序数据,包括:
获取所述遗传性疾病相关样本的初始基因测序数据;
对所述初始基因测序数据进行过滤,得到基因测序数据。
3.如权利要求1所述的用于检测遗传性疾病基因变异的方法,其特征在于,所述对所述基因测序数据进行重测序数据分析,检测所述基因测序数据中的突变位点,包括:
将所述基因测序数据与参考序列进行比对,得到所述基因测序数据在基因组中对应的位点;
计算各个基因测序数据对应的可信度值,并将可信度值大于预设可信度阈值的基因测序数据对应的位点作为突变位点。
4.如权利要求3所述的用于检测遗传性疾病基因变异的方法,其特征在于,所述将所述基因测序数据与参考序列进行比对,得到所述基因测序数据在基因组中对应的位点,包括:
将所述基因测序数据与参考序列进行比对,得到所述基因测序数据在基因组中对应的初始位点;
检测所述基因测序数据对应的初始位点中是否存在第一位点;
若所述基因测序数据对应的初始位点中存在第一位点,则将所述第一位点及所述第一位点的相邻位点对应的基因测序数据作为重比对数据,所述第一位点包括单核苷酸多态性SNP位点和插入缺失标记INDEL位点;
基于所述SNP位点和所述INDEL位点,对所述重比对数据与参考序列进行再次比对,得到所述基因测序数据在基因组中对应的位点。
5.如权利要求1至4任一项所述的用于检测遗传性疾病基因变异的方法,其特征在于,所述根据所述突变位点的注释结果,确定所述突变位点的突变检测结果,包括:
获取所述突变位点的蛋白质序列的保守性数据;
根据蛋白质序列的保守性数据与有害度评分的关系,确定所述突变位点的有害度评分;
根据所述突变位点的有害度评分和注释结果,确定所述突变位点的突变检测结果。
6.如权利要求5所述的用于检测遗传性疾病基因变异的方法,其特征在于,所述根据所述突变位点的有害度评分和注释结果,确定所述突变位点的突变检测结果,包括:
若所述突变位点的注释结果包括遗传性疾病注释,且所述突变位点的有害度评分大于或等于预设有害度评分阈值,则判定所述突变位点的突变检测结果为与所述遗传性疾病相关的有害变异;
若所述突变位点的注释结果不包括所述遗传性疾病注释,且所述突变位点的有害度评分大于或等于预设有害度评分阈值,则判定所述突变位点的突变检测结果为与所述遗传性疾病无关的有害变异;
若所述突变位点的注释结果不包括所述遗传性疾病注释,且所述突变位点的有害度评分小于预设有害度评分阈值,则判定所述突变位点的突变检测结果为无害变异。
7.一种用于检测遗传性疾病基因变异的装置,其特征在于,包括:
基因测序数据获取模块,用于获取遗传性疾病样本的基因测序数据;
突变位点检测模块,用于对所述基因测序数据进行重测序数据分析,检测所述基因测序数据中的突变位点;
注释结果获取模块,用于根据预设疾病数据库对所述突变位点进行突变注释,得到所述突变位点的注释结果;
突变检测结果获取模块,用于根据所述突变位点的注释结果,确定所述突变位点的突变检测结果。
8.如权利要求7所述的一种用于检测遗传性疾病基因变异的装置,其特征在于,所述基因测序数据获取模块包括:
初始数据获取单元,用于获取遗传性疾病相关样本的初始基因测序数据;
基因测序数据获取单元,用于对所述初始基因测序数据进行过滤,得到基因测序数据。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述方法的步骤。
CN201811021290.2A 2018-09-03 2018-09-03 用于检测遗传性疾病基因变异的方法、装置及终端设备 Pending CN109295198A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811021290.2A CN109295198A (zh) 2018-09-03 2018-09-03 用于检测遗传性疾病基因变异的方法、装置及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811021290.2A CN109295198A (zh) 2018-09-03 2018-09-03 用于检测遗传性疾病基因变异的方法、装置及终端设备

Publications (1)

Publication Number Publication Date
CN109295198A true CN109295198A (zh) 2019-02-01

Family

ID=65166119

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811021290.2A Pending CN109295198A (zh) 2018-09-03 2018-09-03 用于检测遗传性疾病基因变异的方法、装置及终端设备

Country Status (1)

Country Link
CN (1) CN109295198A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109920480A (zh) * 2019-03-14 2019-06-21 深圳市海普洛斯生物科技有限公司 一种校正高通量测序数据的方法和装置
CN111091873A (zh) * 2019-12-13 2020-05-01 北京市商汤科技开发有限公司 基因变异的识别方法及装置、电子设备和存储介质
CN111139291A (zh) * 2020-01-14 2020-05-12 首都医科大学附属北京安贞医院 一种单基因遗传性疾病高通量测序分析方法
CN111312331A (zh) * 2020-03-27 2020-06-19 武汉古奥基因科技有限公司 一种利用二代和三代转录组测序数据的基因组注释方法
CN112233727A (zh) * 2020-10-29 2021-01-15 北京诺禾致源科技股份有限公司 数据分区存储方法及装置
WO2021107567A1 (ko) * 2019-11-28 2021-06-03 주식회사 쓰리빌리언 Ngs를 이용한 열성유전병 원인 유전변이 판별 방법 및 장치
WO2021133351A1 (en) * 2019-12-25 2021-07-01 İdea Teknoloji̇ Çözümleri̇ Bi̇lgi̇sayar Sanayi̇ Ve Ti̇caret Anoni̇m Şi̇rketi̇ A prioritization and scoring method
WO2023124779A1 (zh) * 2021-12-28 2023-07-06 成都齐碳科技有限公司 基于三代测序数据检测点突变的分析方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894211A (zh) * 2010-06-30 2010-11-24 深圳华大基因科技有限公司 一种基因注释方法和系统
US20160357903A1 (en) * 2013-09-20 2016-12-08 University Of Washington Through Its Center For Commercialization A framework for determining the relative effect of genetic variants
CN107229841A (zh) * 2017-05-24 2017-10-03 重庆金域医学检验所有限公司 一种基因变异评估方法及系统
CN107710185A (zh) * 2015-06-22 2018-02-16 康希尔公司 预测基因序列变异的致病性的方法
CN107766696A (zh) * 2016-08-23 2018-03-06 武汉生命之美科技有限公司 基于RNA‑seq数据的真核生物可变剪接分析方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894211A (zh) * 2010-06-30 2010-11-24 深圳华大基因科技有限公司 一种基因注释方法和系统
US20160357903A1 (en) * 2013-09-20 2016-12-08 University Of Washington Through Its Center For Commercialization A framework for determining the relative effect of genetic variants
CN107710185A (zh) * 2015-06-22 2018-02-16 康希尔公司 预测基因序列变异的致病性的方法
CN107766696A (zh) * 2016-08-23 2018-03-06 武汉生命之美科技有限公司 基于RNA‑seq数据的真核生物可变剪接分析方法和系统
CN107229841A (zh) * 2017-05-24 2017-10-03 重庆金域医学检验所有限公司 一种基因变异评估方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
金晶等: "《分子诊断学实验指导》", 31 August 2015 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109920480A (zh) * 2019-03-14 2019-06-21 深圳市海普洛斯生物科技有限公司 一种校正高通量测序数据的方法和装置
CN109920480B (zh) * 2019-03-14 2020-02-21 深圳市海普洛斯生物科技有限公司 一种校正高通量测序数据的方法和装置
WO2021107567A1 (ko) * 2019-11-28 2021-06-03 주식회사 쓰리빌리언 Ngs를 이용한 열성유전병 원인 유전변이 판별 방법 및 장치
CN111091873A (zh) * 2019-12-13 2020-05-01 北京市商汤科技开发有限公司 基因变异的识别方法及装置、电子设备和存储介质
CN111091873B (zh) * 2019-12-13 2023-07-18 北京市商汤科技开发有限公司 基因变异的识别方法及装置、电子设备和存储介质
WO2021133351A1 (en) * 2019-12-25 2021-07-01 İdea Teknoloji̇ Çözümleri̇ Bi̇lgi̇sayar Sanayi̇ Ve Ti̇caret Anoni̇m Şi̇rketi̇ A prioritization and scoring method
CN111139291A (zh) * 2020-01-14 2020-05-12 首都医科大学附属北京安贞医院 一种单基因遗传性疾病高通量测序分析方法
CN111312331A (zh) * 2020-03-27 2020-06-19 武汉古奥基因科技有限公司 一种利用二代和三代转录组测序数据的基因组注释方法
CN111312331B (zh) * 2020-03-27 2022-05-24 武汉古奥基因科技有限公司 一种利用二代和三代转录组测序数据的基因组注释方法
CN112233727A (zh) * 2020-10-29 2021-01-15 北京诺禾致源科技股份有限公司 数据分区存储方法及装置
CN112233727B (zh) * 2020-10-29 2024-01-26 北京诺禾致源科技股份有限公司 数据分区存储方法及装置
WO2023124779A1 (zh) * 2021-12-28 2023-07-06 成都齐碳科技有限公司 基于三代测序数据检测点突变的分析方法和装置

Similar Documents

Publication Publication Date Title
CN109295198A (zh) 用于检测遗传性疾病基因变异的方法、装置及终端设备
Vuckovic et al. The polygenic and monogenic basis of blood traits and diseases
Gamazon et al. Using an atlas of gene regulation across 44 human tissues to inform complex disease-and trait-associated variation
Ritchie et al. The search for gene-gene interactions in genome-wide association studies: challenges in abundance of methods, practical considerations, and biological interpretation
Anand et al. Next generation sequencing of pooled samples: guideline for variants’ filtering
Lee et al. Rare-variant association analysis: study designs and statistical tests
Kopelman et al. Clumpak: a program for identifying clustering modes and packaging population structure inferences across K
Thompson et al. BAliBASE 3.0: latest developments of the multiple sequence alignment benchmark
Nair et al. V ari B ench: A benchmark database for variations
Bartenhagen et al. Robust and exact structural variation detection with paired-end and soft-clipped alignments: SoftSV compared with eight algorithms
JP5479431B2 (ja) バイオマーカー抽出装置および方法
US20140143188A1 (en) Method of machine learning, employing bayesian latent class inference: combining multiple genomic feature detection algorithms to produce an integrated genomic feature set with specificity, sensitivity and accuracy
Sboner et al. A primer on precision medicine informatics
Sadowski et al. Spatial chromatin architecture alteration by structural variations in human genomes at the population scale
US20110257893A1 (en) Methods for classifying samples based on network modularity
Muller et al. OutLyzer: software for extracting low-allele-frequency tumor mutations from sequencing background noise in clinical practice
Lee et al. Prioritizing disease‐linked variants, genes, and pathways with an interactive whole‐genome analysis pipeline
Höllbacher et al. Seq-ing answers: Current data integration approaches to uncover mechanisms of transcriptional regulation
Pal et al. CAGI4 Crohn's exome challenge: Marker SNP versus exome variant models for assigning risk of Crohn disease
Umlai et al. Genome sequencing data analysis for rare disease gene discovery
Nunez Villavicencio-Diaz et al. Bioinformatics tools for the functional interpretation of quantitative proteomics results
Rajaby et al. SurVIndel: improving CNV calling from high-throughput sequencing data through statistical testing
Heger et al. The global trace graph, a novel paradigm for searching protein sequence databases
Saukkonen et al. Highly accurate quantification of allelic gene expression for population and disease genetics
Zhu et al. A robust pipeline for ranking carrier frequencies of autosomal recessive and X-linked Mendelian disorders

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190201

RJ01 Rejection of invention patent application after publication