CN112592969A - 一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质 - Google Patents

一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质 Download PDF

Info

Publication number
CN112592969A
CN112592969A CN202011631464.4A CN202011631464A CN112592969A CN 112592969 A CN112592969 A CN 112592969A CN 202011631464 A CN202011631464 A CN 202011631464A CN 112592969 A CN112592969 A CN 112592969A
Authority
CN
China
Prior art keywords
database
variation
disease
pathogenicity
twenty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011631464.4A
Other languages
English (en)
Inventor
罗宏敏
吴莉萍
辜清泉
杨旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ruiao Kangchen Biotechnology Co ltd
Original Assignee
Shenzhen Ruiao Kangchen Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Ruiao Kangchen Biotechnology Co ltd filed Critical Shenzhen Ruiao Kangchen Biotechnology Co ltd
Priority to CN202011631464.4A priority Critical patent/CN112592969A/zh
Publication of CN112592969A publication Critical patent/CN112592969A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Genetics & Genomics (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Bioethics (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Microbiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请公开了一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质,包括:靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取二十一个靶标基因序列;测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;reo‑hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,获得待测样本的致病性评价信息;报告生成步骤,包括根据所述reo‑hit解读步骤的结果,输出致病性评价报告。本申请仅通过二十一个基因的高通量测序panel完成遗传性主动脉疾病的相关基因检测,减少了遗传性主动脉疾病的基因检测成本,并且大大提高了遗传性主动脉疾病的疾病筛查效率。

Description

一种遗传性主动脉疾病及相关基因的检测方法、装置和存储 介质
技术领域
本申请涉及遗传性主动脉疾病基因检测领域,具体涉及一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质。
背景技术
遗传性主动脉疾病以主动脉扩张、主动脉瘤/夹层为特征,可发生于马凡综合征(MFS)、Loeys-Dietz综合征(LDS)、血管型Ehlers-Danlos综合征(vEDS)、家族性胸主动脉瘤/夹层(FTAAD)等多种疾病。这些疾病有着不同程度的临床表型重合,异质性高,诊断和筛查都很困难,尤其是早期发病期。遗传性主动脉疾病是明确的单基因遗传病,可以采用基因检测手段,在未发病或发病早期筛查出携带者,实现早期管理。
但是,当前产界缺少单独对遗传性主动脉疾病的基因检测手段,大部分是将其包括在数百个基因的高通量测序panel上,因而遗传性主动脉疾病的检测手段成本过高,不适用于大规模人群筛查。
如何简化遗传性主动脉疾病致病基因的检测方法,降低检测成本,以使其适应大规模人群是遗传性主动脉疾病筛查的难点。
发明内容
本申请的目的是提供一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质,以适用于大规模人群的遗传性主动脉疾病筛查。
为了实现上述目的,本申请采用了以下技术方案:
本申请的第一方面公开了一种遗传性主动脉疾病及相关基因的检测方法,其特征在于,包括:
靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;
测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;
reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;
报告生成步骤,包括根据reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
需要说明的是,本申请的关键在于通过reo-hit解读系统将遗传性主动脉疾病二十一个致病基因的高通量测序数据中变异特征的50个评价参数自动转化为ACMG指南的28项评价参数,进而得到遗传性主动脉疾病致病性评价,实现了仅通过二十一个基因的高通量测序panel完成遗传性主动脉疾病的相关基因检测,单独对遗传性主动脉疾病基因的致病性进行评价,从而减少了遗传性主动脉疾病的基因检测成本,并且大大提高了遗传性主动脉疾病的疾病筛查效率。
本申请的一种实现方式中,二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列。
本申请的一种实现方式中,高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%。
本申请的一种实现方式中,人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库;
优选的,疾病数据库包括OMIM数据库和CGD数据库;
优选的,变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;
优选的,致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmm MKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100way vertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种;
优选的,reo-hit解读步骤还包括采用GWAS-catalog数据库进行补充注释。
本申请的第二方面还公开了一种用于遗传性主动脉疾病及相关基因检测的多重PCR引物,多重PCR引物用于扩增FBN1、TGFBR1、TGFBR2、SMAD3、TGFB2、TGFB3和SKI,七个靶标基因序列。
本申请的一种实现方式中,多重PCR引物覆盖七个靶标基因的外显子区及其剪切位点外延至少15bp的序列。
本申请的第三方面还公开了一种遗传性主动脉疾病及相关基因的检测装置,包括靶标序列获取模块、测序模块、reo-hit解读模块、报告生成模块,
靶标序列获取模块,包括用于通过PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;
测序模块,包括用于对获取的二十一个靶标基因序列进行高通量测序;
reo-hit解读模块,包括用于根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;
报告生成模块,包括用于根据reo-hit解读模块的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
本申请的一种实现方式中,二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列;
优选的,高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%;
优选的,人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库;
优选的,疾病数据库包括OMIM数据库和CGD数据库;
优选的,变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;
优选的,致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmm MKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100way vertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种;
优选的,reo-hit解读步骤还包括采用GWAS-catalog数据库进行补充注释。
本申请的第四方面还包括一种遗传性主动脉疾病及相关基因的检测装置,装置包括存储器和处理器;
存储器,包括用于存储程序;
处理器,包括用于通过执行存储器存储的程序以实现上述遗传性主动脉疾病及相关基因的检测方法。
本申请的第五方面还公开了一种计算机可读存储介质,存储介质中存储有程序,程序能够被处理器执行以实现上述遗传性主动脉疾病及相关基因的检测方法。
由于采用以上技术方案,本申请的有益效果在于:
本申请通过reo-hit解读系统将遗传性主动脉疾病二十一个致病基因的高通量测序数据中变异特征的50个评价参数自动转化为ACMG指南的28项评价参数,进而得到遗传性主动脉疾病致病性评价,实现了仅通过二十一个基因的高通量测序panel完成遗传性主动脉疾病的相关基因检测,并单独对遗传性主动脉疾病基因的致病性进行评价,减少了遗传性主动脉疾病的基因检测成本,并且大大提高了遗传性主动脉疾病的疾病筛查效率。
附图说明
图1为本申请实施例提供的一种遗传性主动脉疾病及相关基因的检测方法的流程框图;
图2为本申请实施例中提供的一种遗传性主动脉疾病及相关基因的检测装置的结构框图。
具体实施方式
下面通过具体实施方式对本申请作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
如图1所示,本实施例提供了一种遗传性主动脉疾病及相关基因的检测方法,包括以下步骤,
S201、靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;
具体地,具体地,待测样本可以为血液或口腔拭子采集的口腔黏膜细胞,待测样本的基因组序通过对待测样本进行DNA提取得到。本实施例DNA提取的方式可以采用本领域常规的方式进行提取,在此不作特别限制。本实施例根据遗传性主动脉疾病的二十一个致病基因ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,设计多重PCR引物对和探针,对待测样本的基因组序列进行多重PCR扩增,以获取待测样本中遗传性主动脉疾病相关的二十一个靶标基因序列,用于后续进行高通量测序。本实施例的一种实现方式中,多重PCR扩增的退火温度范围从55摄氏度到70摄氏度,循环数范围在25-35个循环。本实施例的一个实现方式中,二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列。
S202、测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;
对扩增后的基因序列进行高通量测序,从而获得待测样本关于上述二十一个致病基因的高通量测序数据,并对高通量测序数据进行变异检测以获取待测样本的变异特征。本实施例的一种实现方式中,高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%。
具体地,由于测序后原始下机数据中包含接头(adapter)序列、测序质量很低的碱基、未测出的碱基(以N表示),会对后续的reo-hit解读造成很大的干扰,因而首先对原始下机数据进行过滤得到高质量的数据(clean data或clean reads),而后使用比对软件BWA(Burrows-Wheeler Aligner)将每个样本的clean data比对到人的参考基因组(GRCh37),得到BAM格式的比对结果文件。基于比对结果,去除PCR重复reads,用GATK对BAM格式的数据进行变异检测和过滤以获得样本测序数据的变异特征。
S203、reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;
具体地,所述人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库,用于提供更多的频率信息;所述疾病数据库包括OMIM数据库和CGD数据库;所述变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;所述致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmmMKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100wayvertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种,不同软件的预测算法各有不同,互为补充,能更综合地预测变异的致病性。
人类频率数据库、疾病数据库、变异数据库用于提供ACMG证据集,预测致病性软件用于找出符合ACMG证据定义的变异特征并高亮显示,进而进行综合分析以对变异特征进行注释,每个变异特征采集50个评价参数,再将50个评价参数自动转化为ACMG指南的28项评价参数,根据ACMG指南的28项评价参数生成遗传性主动脉疾病致病性评价。
具体地,50个评价参数包括变异基本信息、功能注释、频率信息、基因与疾病关联以及变异与疾病关联等信息,其中,变异基本信息包括染色体位置,碱基变化,发生变异的基因;功能注释包括错义突变,剪切突变,移码突变等;频率信息包括1000genome,ExAC,EVS,In-house等数据库提取的变异频率数据;基因与疾病关联用于说明根据CGD数据库和OMIM数据库报道,基因能够造成什么疾病;变异与疾病关联用于说明根据OMIM,clinvar,HGMD报道,该变异能够造成什么疾病。
进一步,以ACMG指南中PVS1、PS1、PS2、PS3、PS4、PM1、PM2、PM3、PM4、PM5、PM6、PP1、PP2、PP3、PP4、PP5、BA1、BS1、BS2、BS3、BS4、BP1、BP2、BP3、BP4、BP5、BP6、BP7,28个证据定义的规则,将上述50个评价参数自动转化为ACMG指南的28项评价参数。
例如,对于人群频率为0的变异特征,根据ACMG指南的PM2证据的定义,可以得到ACMG PM2评价参数:本变异为极罕见变异,在1000genome数据库,ExAC数据库,EVS数据库,及自有数据库中均无记载;对于功能注释为移码突变的变异特征,根据ACMG指南的PVS1证据的定义:某些类型的变异(如无义突变,移码突变,±2以内的剪切位点突变,起始密码子突变,单个或多个外显子删除)通常被假定为完全造成基因产物的缺失,导致基因功能的中断,可以得到ACMG PVS1评价参数:本变异通常被假定为完全造成基因产物的缺失,导致基因功能的中断。
本实施例的一种实现方式中,对ACMG中模糊的、难以生成自动化评价参数的规则,例如,PS1:有报道同一位置相同氨基酸的改变是一个明确的致病变异,显示本变异也是致病变异的可能性较大;PS4:对该疾病的群体研究显示,本变异在病人群体中的频率,要显著高于正常人群体中的频率;PM5:有报道同一位置不同氨基酸的改变是一个明确的致病变异,显示本变异有一定的可能性也是致病变异;PP2:本变异是个错义突变,已知错义突变是该基因的一种普遍致病机制,且在基因上的错义突变良性率较低;BS1:在人群频率数据库中搜索本变异,与目标疾病的致病变异期望频率比较,当本变异的人群频率大于致病变异期望频率,可能表示本变异不是致病变异;reo-hit解读步骤也能够通过ClinicalSequencing Exploratory Research Consortium 9个实验室的解读实操经验定义ACMG证据,自动化生成相应的ACMG指南的评价参数。例如,ACMG的PP2证据:本变异是个错义突变,已知错义突变是该基因的一种普遍致病机制,且在基因上的错义突变良性率较低,然而如何定义PP2证据,ACMG指南中没有做更多的解释,本实施例中的reo-hit解读步骤将PP2证据定义为该基因上60%以上错义突变是恶性的,从而实现根据该证据的定义自动生成相应的ACMG指南的评价参数。
本实施例的一种实现方式中,所述reo-hit解读步骤还包括采用GWAS-catalog数据库进行补充注释,例如,对PS4证据:对该疾病的群体研究显示,本变异在病人群体中的频率,要显著高于正常人群体中的频率,进行自动化补充注释。
S204、报告生成步骤,包括根据reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
具体地,根据患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数等模块生成遗传性主动脉疾病相关基因检测报告。本实施例的一种实现方式,可以根据需求对报告的不同模块选择添加或删减,以向用户提供更简要的报告信息。
本实施例实现了仅通过二十一个基因的高通量测序panel完成遗传性主动脉疾病的相关基因检测,单独对遗传性主动脉疾病基因的致病性进行评价,从而减少了遗传性主动脉疾病的基因检测成本,并且大大提高了遗传性主动脉疾病的疾病筛查效率。
本实施例的还提供了一种用于遗传性主动脉疾病及相关基因检测的多重PCR引物,所述多重PCR引物用于扩增FBN1、TGFBR1、TGFBR2、SMAD3、TGFB2、TGFB3和SKI,七个靶标基因序列,其中,每个靶标基因序列包括若干个扩增片段,多重PCR引物的序列及其扩增片段具体如表1所示:
表1
Figure BDA0002880147290000081
Figure BDA0002880147290000091
Figure BDA0002880147290000101
Figure BDA0002880147290000111
Figure BDA0002880147290000121
Figure BDA0002880147290000131
Figure BDA0002880147290000141
Figure BDA0002880147290000151
Figure BDA0002880147290000161
Figure BDA0002880147290000171
Figure BDA0002880147290000181
Figure BDA0002880147290000191
Figure BDA0002880147290000201
Figure BDA0002880147290000211
本实施例的一种实现方式中,所述多重PCR引物覆盖七个靶标基因的外显子区及其剪切位点外延至少15bp的序列。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
因此,如图2所示,本申请一实施例中,遗传性主动脉疾病及相关基因的检测装置,包括:靶标序列获取模块301、测序模块302、reo-hit解读模块303、报告生成模块304。
具体地,靶标序列获取模块301,包括用于通过PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;本实施例的一种实现方式中,二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列。
测序模块302,包括用于对获取的二十一个靶标基因序列进行高通量测序;本实施例的一种实现方式中,高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%。
reo-hit解读模块303,包括用于根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;本实施例的一种实现方式中,人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库;疾病数据库包括OMIM数据库和CGD数据库;变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmm MKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100way vertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种。
本实施例的一种实现方式中,reo-hit解读模块还包括GWAS-catalog数据库,用以进行补充注释。
报告生成模块304,包括用于根据reo-hit解读模块的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
本申请另一实施例还提供一种遗传性主动脉疾病及相关基因的检测装置,包括:存储器,用于存储程序;处理器,用于通过执行上述存储器存储的程序以实现如下方法:靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;报告生成步骤,包括根据reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
本申请另一种实施例还提供一种计算机可读存储介质,包括程序,该程序能够被处理器执行以实现如下方法:靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;报告生成步骤,包括根据reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
下面通过具体实施例对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明,不应理解为对本申请的限制。
实施例1
获取一主动脉病人血液样本,已知受检者临床主诉类马凡氏综合症,有动脉瘤,手指骨骼细长,存在家族史,但不排除Loeys-Dietz综合症。受检者血液样本经过基因组DNA提取和纯化后,构建基因组文库,经多重PCR引物对ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,21个靶标基因的编码区以及相邻的内含子区域(15bp)进行扩增,并通过NGS高通量测序仪测序获得测序数据,其中,测序覆盖度结果如表1所示:
表1
测序质量参数 数值
目标区域长度(bp) 80k
目标区域覆盖度 100.0%
目标区域平均覆盖深度 2288.41
目标区域平均覆盖深度>20×占比 100.0%
测序数据采用BWA工具与人类参考序列GRCh37比对,采用GATK流程检测变异,获取变异信息,在受检者TGFBR2基因上发现一个疑似致病错义突变,突变发生在6号外显子区发。进一步,基于上述变异信息,根据人类频率数据库、疾病数据库、变异数据库和致病性预测软件采集50个评价参数,得到对TGFBR2基因变异注释的评价参数具体如表2所示:
表2
Figure BDA0002880147290000241
由此可知,本次检测在受检者TGFBR2基因上发现杂合突变c.1427C>T,属于错义突变,突变导致第476位氨基酸由丙氨酸变成缬氨酸,进而导致蛋白功能的改变。进一步,根据ACMG指南定义的规则将上述对TGFBR2基因变异注释的评价参数自动转化为ACMG指南的评价参数,具体包括:
ACMG PM1:本变异处在一个致病变异的热点区域,或在一个研究完善的功能区域未发现良性变异。这表示该区域功能极为重要,处在该区域的变异为恶性变异的可能性高;
ACMG PM2:该变异为极罕见变异,在1000genome东亚数据库,ExAC东亚数据库及自有数据库中均无记载,极为罕见是致病变异的一种特征;
ACMG PP3:使用PolyPhen2和SIFT等多种软件对本变异进行蛋白功能预测,一致预测本变异可能是有害的变异;
ACMG PM5:有报道同一位置不同氨基酸的改变是一个明确的致病变异显示本变异有一定的可能性也是致病变异;
ACMG PP4:该受检者的表型及家族史可能支持Loeys-Dietz综合症特征;
ACMG PP1:在多个家族成员中发现本变异与疾病存在共分离现象。
其中,ACMG PM1证据为中等致病证据,ACMG PM2证据为中等致病证据,ACMG PP3证据为弱致病证据,ACMG PM5证据为中等致病证据,ACMG PP4证据为弱致病证据,ACMG PP1证据为弱致病证据。综合以上ACMG证据,判定该变异为疑似致病突变。
由于在受检者的马凡氏综合症所属FBN1基因中,未发现变异,在TGFBR2基因中,发现了错义突变c.1427C>T(p.Ala476Val),符合致病变异特征,而TGFBR2属于Loeys-Dietz综合症的致病基因,因此该受检者可诊断为Loeys-Dietz综合征,避免了马凡综合症的误诊。根据上述患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果和实验质控参数输出患者的遗传性主动脉疾病基因检测报告。
以上应用了具体个例对本申请进行阐述,只是用于帮助理解本申请,并不用以限制本申请。对于本申请所属技术领域的技术人员,依据本申请的思想,还可以做出若干简单推演、变形或替换。

Claims (10)

1.一种遗传性主动脉疾病及相关基因的检测方法,其特征在于,包括:
靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;
测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;
reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;所述人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;所述疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;所述变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;
报告生成步骤,包括根据所述reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
2.根据权利要求1所述的检测方法,其特征在于:所述二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列。
3.根据权利要求1所述的检测方法,其特征在于:所述高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%。
4.根据权利要求1所述的检测方法,其特征在于:所述人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库;
优选的,所述疾病数据库包括OMIM数据库和CGD数据库;
优选的,所述变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;
优选的,所述致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmm MKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100way vertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种;
优选的,所述reo-hit解读步骤还包括采用GWAS-catalog数据库进行补充注释。
5.一种用于遗传性主动脉疾病及相关基因检测的多重PCR引物,其特征在于,所述多重PCR引物用于扩增FBN1、TGFBR1、TGFBR2、SMAD3、TGFB2、TGFB3和SKI,七个靶标基因序列。
6.根据权利要求5所述的多重PCR引物,其特征在于:所述多重PCR引物覆盖七个靶标基因的外显子区及其剪切位点外延至少15bp的序列。
7.一种遗传性主动脉疾病及相关基因的检测装置,其特征在于:包括靶标序列获取模块、测序模块、reo-hit解读模块、报告生成模块,
所述靶标序列获取模块,包括用于通过PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;
测序模块,包括用于对获取的二十一个靶标基因序列进行高通量测序;
reo-hit解读模块,包括用于根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;所述人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;所述疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;所述变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;
报告生成模块,包括用于根据所述reo-hit解读模块的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
8.根据权利要求7所述的检测装置,其特征在于:所述二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列;
优选的,所述高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%;
优选的,所述人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库;
优选的,所述疾病数据库包括OMIM数据库和CGD数据库;
优选的,所述变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;
优选的,所述致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmm MKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100way vertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种;
优选的,所述reo-hit解读步骤还包括采用GWAS-catalog数据库进行补充注释。
9.一种遗传性主动脉疾病及相关基因的检测装置,其特征在于:所述装置包括存储器和处理器;
所述存储器,包括用于存储程序;
所述处理器,包括用于通过执行所述存储器存储的程序以实现权利要求1-4任一项所述的遗传性主动脉疾病及相关基因的检测方法。
10.一种计算机可读存储介质,其特征在于:所述存储介质中存储有程序,所述程序能够被处理器执行以实现权利要求1-4任一项所述的遗传性主动脉疾病及相关基因的检测方法。
CN202011631464.4A 2020-12-31 2020-12-31 一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质 Pending CN112592969A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011631464.4A CN112592969A (zh) 2020-12-31 2020-12-31 一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011631464.4A CN112592969A (zh) 2020-12-31 2020-12-31 一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质

Publications (1)

Publication Number Publication Date
CN112592969A true CN112592969A (zh) 2021-04-02

Family

ID=75206612

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011631464.4A Pending CN112592969A (zh) 2020-12-31 2020-12-31 一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN112592969A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112795635A (zh) * 2020-12-31 2021-05-14 南昌瑞因康生物科技有限公司 一种马凡综合征及相关基因的检测方法、装置和存储介质
CN114350783A (zh) * 2022-01-06 2022-04-15 昆明市延安医院 一种遗传早发主动脉夹层风险基因筛查panel及筛查方法
CN114496072A (zh) * 2022-01-17 2022-05-13 北京安琪尔基因医学科技有限公司 耳聋致病分析等级分类方法、装置、计算机可读存储介质及服务器
CN115976187A (zh) * 2022-10-11 2023-04-18 深圳市第二人民医院(深圳市转化医学研究院) 一种Loeys-Dietz综合征检测试剂盒

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109811048A (zh) * 2019-01-30 2019-05-28 中国人民解放军总医院 一种用于检测遗传性主动脉疾病的致病/易感基因的探针组
CN110029158A (zh) * 2019-02-01 2019-07-19 北京大学第三医院 一种马凡综合征检测panel及其应用
CN110863045A (zh) * 2019-12-31 2020-03-06 深圳瑞奥康晨生物科技有限公司 用于筛查遗传性心脏病的基因组合及其用途
CN111778562A (zh) * 2020-07-08 2020-10-16 复旦大学附属华山医院 一种用于获取颅颈动脉夹层致病基因突变相关信息的dna文库及应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109811048A (zh) * 2019-01-30 2019-05-28 中国人民解放军总医院 一种用于检测遗传性主动脉疾病的致病/易感基因的探针组
CN110029158A (zh) * 2019-02-01 2019-07-19 北京大学第三医院 一种马凡综合征检测panel及其应用
CN110863045A (zh) * 2019-12-31 2020-03-06 深圳瑞奥康晨生物科技有限公司 用于筛查遗传性心脏病的基因组合及其用途
CN111778562A (zh) * 2020-07-08 2020-10-16 复旦大学附属华山医院 一种用于获取颅颈动脉夹层致病基因突变相关信息的dna文库及应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ERIC M ISSELBACHER等: "Hereditary Influence in Thoracic Aortic Aneurysm and Dissection", 《CIRCULATION》, vol. 133, no. 24, 14 June 2016 (2016-06-14), pages 2516 - 2528 *
于长江等: "家族性胸主动脉瘤及主动脉夹层突变基因的研究进展", 《中国血管外科杂志(电子版)》, vol. 12, no. 04, 20 December 2020 (2020-12-20), pages 348 - 352 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112795635A (zh) * 2020-12-31 2021-05-14 南昌瑞因康生物科技有限公司 一种马凡综合征及相关基因的检测方法、装置和存储介质
CN114350783A (zh) * 2022-01-06 2022-04-15 昆明市延安医院 一种遗传早发主动脉夹层风险基因筛查panel及筛查方法
CN114496072A (zh) * 2022-01-17 2022-05-13 北京安琪尔基因医学科技有限公司 耳聋致病分析等级分类方法、装置、计算机可读存储介质及服务器
CN115976187A (zh) * 2022-10-11 2023-04-18 深圳市第二人民医院(深圳市转化医学研究院) 一种Loeys-Dietz综合征检测试剂盒

Similar Documents

Publication Publication Date Title
CN112592969A (zh) 一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质
CN107002122B (zh) 确定导致无细胞dna的产生的组织和/或细胞类型的方法以及使用其鉴定疾病或紊乱的方法
Feng et al. Improved molecular diagnosis by the detection of exonic deletions with target gene capture and deep sequencing
EP3625802B1 (en) Scansoft : a method for the detection of genomic deletions and duplications in massive parallel sequencing data
Rentas et al. Diagnosing Cornelia de Lange syndrome and related neurodevelopmental disorders using RNA sequencing
KR20220003142A (ko) 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
CN110910957A (zh) 一种基于单肿瘤样本高通量测序微卫星不稳定性探测位点筛选方法
KR102405245B1 (ko) 전장유전체 시퀀싱 기반의 염색체 이상 검출 방법 및 그 용도
Vali-Pour et al. The impact of rare germline variants on human somatic mutation processes
CN112820354B (zh) 一种双倍体组装的方法、装置和存储介质
CN112795635A (zh) 一种马凡综合征及相关基因的检测方法、装置和存储介质
Wang et al. An autoimmune pleiotropic SNP modulates IRF5 alternative promoter usage through ZBTB3-mediated chromatin looping
Zhao et al. Profiling long noncoding RNA of multi-tissue transcriptome enhances porcine noncoding genome annotation
Zhang et al. A cautionary note for retrocopy identification: DNA-based duplication of intron-containing genes significantly contributes to the origination of single exon genes
CN106906220A (zh) 一种突变的col4a5基因及其应用
CN113823354A (zh) 一种brca1/2基因变异的分类评价方法
Nunes et al. Prognostic genome and transcriptome signatures in colorectal cancers
Pezzoli et al. A new mutational mechanism for hypertrophic cardiomyopathy
Grochowski et al. Chromoanagenesis event underlies a de novo pericentric and multiple paracentric inversions in a single chromosome causing coffin–siris syndrome
Orgeur et al. A dual transcript-discovery approach to improve the delimitation of gene features from RNA-seq data in the chicken model
KR102472050B1 (ko) 환자 맞춤형 패널을 이용한 암의 재발을 예측하는 방법
CN105838720B (zh) Ptprq基因突变体及其应用
CN111128308A (zh) 一种神经精神疾病新发突变信息知识平台
CN112639129A (zh) 确定新发突变在胚胎中的遗传状态的方法和装置
KR20210120782A (ko) 피검 대상 맞춤형 변이체 기반 레퍼런스 데이터 세트의 구축 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination