CN112592969A - 一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质 - Google Patents
一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质 Download PDFInfo
- Publication number
- CN112592969A CN112592969A CN202011631464.4A CN202011631464A CN112592969A CN 112592969 A CN112592969 A CN 112592969A CN 202011631464 A CN202011631464 A CN 202011631464A CN 112592969 A CN112592969 A CN 112592969A
- Authority
- CN
- China
- Prior art keywords
- database
- variation
- disease
- pathogenicity
- twenty
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 122
- 208000025494 Aortic disease Diseases 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims abstract description 19
- 230000007918 pathogenicity Effects 0.000 claims abstract description 60
- 201000010099 disease Diseases 0.000 claims abstract description 59
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 59
- 238000011156 evaluation Methods 0.000 claims abstract description 59
- 238000001514 detection method Methods 0.000 claims abstract description 39
- 238000012165 high-throughput sequencing Methods 0.000 claims abstract description 37
- 238000012163 sequencing technique Methods 0.000 claims abstract description 25
- 238000012408 PCR amplification Methods 0.000 claims abstract description 10
- 230000035772 mutation Effects 0.000 claims description 65
- 230000002068 genetic effect Effects 0.000 claims description 36
- 230000001717 pathogenic effect Effects 0.000 claims description 34
- 108010082684 Transforming Growth Factor-beta Type II Receptor Proteins 0.000 claims description 15
- 102000004060 Transforming Growth Factor-beta Type II Receptor Human genes 0.000 claims description 15
- CDKIEBFIMCSCBB-UHFFFAOYSA-N 1-(6,7-dimethoxy-3,4-dihydro-1h-isoquinolin-2-yl)-3-(1-methyl-2-phenylpyrrolo[2,3-b]pyridin-3-yl)prop-2-en-1-one;hydrochloride Chemical compound Cl.C1C=2C=C(OC)C(OC)=CC=2CCN1C(=O)C=CC(C1=CC=CN=C1N1C)=C1C1=CC=CC=C1 CDKIEBFIMCSCBB-UHFFFAOYSA-N 0.000 claims description 13
- 101000809594 Escherichia coli (strain K12) Shikimate kinase 1 Proteins 0.000 claims description 13
- 102100031509 Fibrillin-1 Human genes 0.000 claims description 13
- 101000846893 Homo sapiens Fibrillin-1 Proteins 0.000 claims description 13
- 101000863692 Homo sapiens Ski oncogene Proteins 0.000 claims description 13
- 101000635958 Homo sapiens Transforming growth factor beta-2 proprotein Proteins 0.000 claims description 13
- 101710143111 Mothers against decapentaplegic homolog 3 Proteins 0.000 claims description 13
- 102100025748 Mothers against decapentaplegic homolog 3 Human genes 0.000 claims description 13
- 102100029969 Ski oncogene Human genes 0.000 claims description 13
- 102100033456 TGF-beta receptor type-1 Human genes 0.000 claims description 13
- 108010011702 Transforming Growth Factor-beta Type I Receptor Proteins 0.000 claims description 13
- 102100030737 Transforming growth factor beta-2 proprotein Human genes 0.000 claims description 13
- 102000056172 Transforming growth factor beta-3 Human genes 0.000 claims description 13
- 108090000097 Transforming growth factor beta-3 Proteins 0.000 claims description 13
- 102100028067 EGF-containing fibulin-like extracellular matrix protein 2 Human genes 0.000 claims description 10
- 101000929319 Homo sapiens Actin, aortic smooth muscle Proteins 0.000 claims description 10
- 101001060248 Homo sapiens EGF-containing fibulin-like extracellular matrix protein 2 Proteins 0.000 claims description 10
- 101000851054 Homo sapiens Elastin Proteins 0.000 claims description 10
- 101001022780 Homo sapiens Myosin light chain kinase, smooth muscle Proteins 0.000 claims description 10
- 101001000104 Homo sapiens Myosin-11 Proteins 0.000 claims description 10
- 101000687673 Homo sapiens Small integral membrane protein 6 Proteins 0.000 claims description 10
- 101001046426 Homo sapiens cGMP-dependent protein kinase 1 Proteins 0.000 claims description 10
- 101710159002 L-lactate oxidase Proteins 0.000 claims description 10
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 claims description 10
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 claims description 10
- 102100035044 Myosin light chain kinase, smooth muscle Human genes 0.000 claims description 10
- 102100036639 Myosin-11 Human genes 0.000 claims description 10
- 108010029755 Notch1 Receptor Proteins 0.000 claims description 10
- 102000001759 Notch1 Receptor Human genes 0.000 claims description 10
- 102100026858 Protein-lysine 6-oxidase Human genes 0.000 claims description 10
- 102100024806 Small integral membrane protein 6 Human genes 0.000 claims description 10
- 102100022422 cGMP-dependent protein kinase 1 Human genes 0.000 claims description 10
- 238000007403 mPCR Methods 0.000 claims description 10
- 238000003908 quality control method Methods 0.000 claims description 10
- 102100036732 Actin, aortic smooth muscle Human genes 0.000 claims description 9
- 102100033601 Collagen alpha-1(I) chain Human genes 0.000 claims description 9
- 102100031611 Collagen alpha-1(III) chain Human genes 0.000 claims description 9
- 102100031457 Collagen alpha-1(V) chain Human genes 0.000 claims description 9
- 102100036213 Collagen alpha-2(I) chain Human genes 0.000 claims description 9
- 102100031502 Collagen alpha-2(V) chain Human genes 0.000 claims description 9
- 101000993285 Homo sapiens Collagen alpha-1(III) chain Proteins 0.000 claims description 9
- 101000941708 Homo sapiens Collagen alpha-1(V) chain Proteins 0.000 claims description 9
- 101000875067 Homo sapiens Collagen alpha-2(I) chain Proteins 0.000 claims description 9
- 101000941594 Homo sapiens Collagen alpha-2(V) chain Proteins 0.000 claims description 9
- 108010029483 alpha 1 Chain Collagen Type I Proteins 0.000 claims description 9
- -1 and accordingly Proteins 0.000 claims description 8
- 238000002474 experimental method Methods 0.000 claims description 8
- 101000741396 Chlamydia muridarum (strain MoPn / Nigg) Probable oxidoreductase TC_0900 Proteins 0.000 claims description 6
- 101000741399 Chlamydia pneumoniae Probable oxidoreductase CPn_0761/CP_1111/CPj0761/CpB0789 Proteins 0.000 claims description 6
- 101000741400 Chlamydia trachomatis (strain D/UW-3/Cx) Probable oxidoreductase CT_610 Proteins 0.000 claims description 6
- 238000003776 cleavage reaction Methods 0.000 claims description 3
- 230000007017 scission Effects 0.000 claims description 3
- 208000004476 Acute Coronary Syndrome Diseases 0.000 claims description 2
- 241000700605 Viruses Species 0.000 claims description 2
- 208000011580 syndromic disease Diseases 0.000 claims description 2
- 238000010008 shearing Methods 0.000 claims 1
- 238000012216 screening Methods 0.000 abstract description 8
- 239000000523 sample Substances 0.000 description 24
- 230000006870 function Effects 0.000 description 8
- 201000005978 Loeys-Dietz syndrome Diseases 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 208000001826 Marfan syndrome Diseases 0.000 description 5
- 101150093886 TGFBR2 gene Proteins 0.000 description 4
- 235000001014 amino acid Nutrition 0.000 description 4
- 150000001413 amino acids Chemical class 0.000 description 4
- 230000003321 amplification Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000037433 frameshift Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 2
- 208000002251 Dissecting Aneurysm Diseases 0.000 description 2
- 101100484967 Solanum tuberosum PVS1 gene Proteins 0.000 description 2
- 208000034259 Vascular Ehlers-Danlos syndrome Diseases 0.000 description 2
- 208000007474 aortic aneurysm Diseases 0.000 description 2
- 206010002895 aortic dissection Diseases 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002224 dissection Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 231100000221 frame shift mutation induction Toxicity 0.000 description 2
- 230000003211 malignant effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003950 pathogenic mechanism Effects 0.000 description 2
- 230000004853 protein function Effects 0.000 description 2
- 206010002329 Aneurysm Diseases 0.000 description 1
- 206010057453 Aortic dilatation Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 101150062966 FBN1 gene Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 208000028782 Hereditary disease Diseases 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 201000008982 Thoracic Aortic Aneurysm Diseases 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000011511 automated evaluation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 208000003457 familial thoracic 1 aortic aneurysm Diseases 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 210000004553 finger phalanx Anatomy 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002200 mouth mucosa Anatomy 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Organic Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Genetics & Genomics (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Bioethics (AREA)
- Analytical Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Microbiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Immunology (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本申请公开了一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质,包括:靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取二十一个靶标基因序列;测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;reo‑hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,获得待测样本的致病性评价信息;报告生成步骤,包括根据所述reo‑hit解读步骤的结果,输出致病性评价报告。本申请仅通过二十一个基因的高通量测序panel完成遗传性主动脉疾病的相关基因检测,减少了遗传性主动脉疾病的基因检测成本,并且大大提高了遗传性主动脉疾病的疾病筛查效率。
Description
技术领域
本申请涉及遗传性主动脉疾病基因检测领域,具体涉及一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质。
背景技术
遗传性主动脉疾病以主动脉扩张、主动脉瘤/夹层为特征,可发生于马凡综合征(MFS)、Loeys-Dietz综合征(LDS)、血管型Ehlers-Danlos综合征(vEDS)、家族性胸主动脉瘤/夹层(FTAAD)等多种疾病。这些疾病有着不同程度的临床表型重合,异质性高,诊断和筛查都很困难,尤其是早期发病期。遗传性主动脉疾病是明确的单基因遗传病,可以采用基因检测手段,在未发病或发病早期筛查出携带者,实现早期管理。
但是,当前产界缺少单独对遗传性主动脉疾病的基因检测手段,大部分是将其包括在数百个基因的高通量测序panel上,因而遗传性主动脉疾病的检测手段成本过高,不适用于大规模人群筛查。
如何简化遗传性主动脉疾病致病基因的检测方法,降低检测成本,以使其适应大规模人群是遗传性主动脉疾病筛查的难点。
发明内容
本申请的目的是提供一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质,以适用于大规模人群的遗传性主动脉疾病筛查。
为了实现上述目的,本申请采用了以下技术方案:
本申请的第一方面公开了一种遗传性主动脉疾病及相关基因的检测方法,其特征在于,包括:
靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;
测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;
reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;
报告生成步骤,包括根据reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
需要说明的是,本申请的关键在于通过reo-hit解读系统将遗传性主动脉疾病二十一个致病基因的高通量测序数据中变异特征的50个评价参数自动转化为ACMG指南的28项评价参数,进而得到遗传性主动脉疾病致病性评价,实现了仅通过二十一个基因的高通量测序panel完成遗传性主动脉疾病的相关基因检测,单独对遗传性主动脉疾病基因的致病性进行评价,从而减少了遗传性主动脉疾病的基因检测成本,并且大大提高了遗传性主动脉疾病的疾病筛查效率。
本申请的一种实现方式中,二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列。
本申请的一种实现方式中,高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%。
本申请的一种实现方式中,人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库;
优选的,疾病数据库包括OMIM数据库和CGD数据库;
优选的,变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;
优选的,致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmm MKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100way vertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种;
优选的,reo-hit解读步骤还包括采用GWAS-catalog数据库进行补充注释。
本申请的第二方面还公开了一种用于遗传性主动脉疾病及相关基因检测的多重PCR引物,多重PCR引物用于扩增FBN1、TGFBR1、TGFBR2、SMAD3、TGFB2、TGFB3和SKI,七个靶标基因序列。
本申请的一种实现方式中,多重PCR引物覆盖七个靶标基因的外显子区及其剪切位点外延至少15bp的序列。
本申请的第三方面还公开了一种遗传性主动脉疾病及相关基因的检测装置,包括靶标序列获取模块、测序模块、reo-hit解读模块、报告生成模块,
靶标序列获取模块,包括用于通过PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;
测序模块,包括用于对获取的二十一个靶标基因序列进行高通量测序;
reo-hit解读模块,包括用于根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;
报告生成模块,包括用于根据reo-hit解读模块的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
本申请的一种实现方式中,二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列;
优选的,高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%;
优选的,人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库;
优选的,疾病数据库包括OMIM数据库和CGD数据库;
优选的,变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;
优选的,致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmm MKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100way vertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种;
优选的,reo-hit解读步骤还包括采用GWAS-catalog数据库进行补充注释。
本申请的第四方面还包括一种遗传性主动脉疾病及相关基因的检测装置,装置包括存储器和处理器;
存储器,包括用于存储程序;
处理器,包括用于通过执行存储器存储的程序以实现上述遗传性主动脉疾病及相关基因的检测方法。
本申请的第五方面还公开了一种计算机可读存储介质,存储介质中存储有程序,程序能够被处理器执行以实现上述遗传性主动脉疾病及相关基因的检测方法。
由于采用以上技术方案,本申请的有益效果在于:
本申请通过reo-hit解读系统将遗传性主动脉疾病二十一个致病基因的高通量测序数据中变异特征的50个评价参数自动转化为ACMG指南的28项评价参数,进而得到遗传性主动脉疾病致病性评价,实现了仅通过二十一个基因的高通量测序panel完成遗传性主动脉疾病的相关基因检测,并单独对遗传性主动脉疾病基因的致病性进行评价,减少了遗传性主动脉疾病的基因检测成本,并且大大提高了遗传性主动脉疾病的疾病筛查效率。
附图说明
图1为本申请实施例提供的一种遗传性主动脉疾病及相关基因的检测方法的流程框图;
图2为本申请实施例中提供的一种遗传性主动脉疾病及相关基因的检测装置的结构框图。
具体实施方式
下面通过具体实施方式对本申请作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
如图1所示,本实施例提供了一种遗传性主动脉疾病及相关基因的检测方法,包括以下步骤,
S201、靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;
具体地,具体地,待测样本可以为血液或口腔拭子采集的口腔黏膜细胞,待测样本的基因组序通过对待测样本进行DNA提取得到。本实施例DNA提取的方式可以采用本领域常规的方式进行提取,在此不作特别限制。本实施例根据遗传性主动脉疾病的二十一个致病基因ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,设计多重PCR引物对和探针,对待测样本的基因组序列进行多重PCR扩增,以获取待测样本中遗传性主动脉疾病相关的二十一个靶标基因序列,用于后续进行高通量测序。本实施例的一种实现方式中,多重PCR扩增的退火温度范围从55摄氏度到70摄氏度,循环数范围在25-35个循环。本实施例的一个实现方式中,二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列。
S202、测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;
对扩增后的基因序列进行高通量测序,从而获得待测样本关于上述二十一个致病基因的高通量测序数据,并对高通量测序数据进行变异检测以获取待测样本的变异特征。本实施例的一种实现方式中,高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%。
具体地,由于测序后原始下机数据中包含接头(adapter)序列、测序质量很低的碱基、未测出的碱基(以N表示),会对后续的reo-hit解读造成很大的干扰,因而首先对原始下机数据进行过滤得到高质量的数据(clean data或clean reads),而后使用比对软件BWA(Burrows-Wheeler Aligner)将每个样本的clean data比对到人的参考基因组(GRCh37),得到BAM格式的比对结果文件。基于比对结果,去除PCR重复reads,用GATK对BAM格式的数据进行变异检测和过滤以获得样本测序数据的变异特征。
S203、reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;
具体地,所述人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库,用于提供更多的频率信息;所述疾病数据库包括OMIM数据库和CGD数据库;所述变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;所述致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmmMKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100wayvertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种,不同软件的预测算法各有不同,互为补充,能更综合地预测变异的致病性。
人类频率数据库、疾病数据库、变异数据库用于提供ACMG证据集,预测致病性软件用于找出符合ACMG证据定义的变异特征并高亮显示,进而进行综合分析以对变异特征进行注释,每个变异特征采集50个评价参数,再将50个评价参数自动转化为ACMG指南的28项评价参数,根据ACMG指南的28项评价参数生成遗传性主动脉疾病致病性评价。
具体地,50个评价参数包括变异基本信息、功能注释、频率信息、基因与疾病关联以及变异与疾病关联等信息,其中,变异基本信息包括染色体位置,碱基变化,发生变异的基因;功能注释包括错义突变,剪切突变,移码突变等;频率信息包括1000genome,ExAC,EVS,In-house等数据库提取的变异频率数据;基因与疾病关联用于说明根据CGD数据库和OMIM数据库报道,基因能够造成什么疾病;变异与疾病关联用于说明根据OMIM,clinvar,HGMD报道,该变异能够造成什么疾病。
进一步,以ACMG指南中PVS1、PS1、PS2、PS3、PS4、PM1、PM2、PM3、PM4、PM5、PM6、PP1、PP2、PP3、PP4、PP5、BA1、BS1、BS2、BS3、BS4、BP1、BP2、BP3、BP4、BP5、BP6、BP7,28个证据定义的规则,将上述50个评价参数自动转化为ACMG指南的28项评价参数。
例如,对于人群频率为0的变异特征,根据ACMG指南的PM2证据的定义,可以得到ACMG PM2评价参数:本变异为极罕见变异,在1000genome数据库,ExAC数据库,EVS数据库,及自有数据库中均无记载;对于功能注释为移码突变的变异特征,根据ACMG指南的PVS1证据的定义:某些类型的变异(如无义突变,移码突变,±2以内的剪切位点突变,起始密码子突变,单个或多个外显子删除)通常被假定为完全造成基因产物的缺失,导致基因功能的中断,可以得到ACMG PVS1评价参数:本变异通常被假定为完全造成基因产物的缺失,导致基因功能的中断。
本实施例的一种实现方式中,对ACMG中模糊的、难以生成自动化评价参数的规则,例如,PS1:有报道同一位置相同氨基酸的改变是一个明确的致病变异,显示本变异也是致病变异的可能性较大;PS4:对该疾病的群体研究显示,本变异在病人群体中的频率,要显著高于正常人群体中的频率;PM5:有报道同一位置不同氨基酸的改变是一个明确的致病变异,显示本变异有一定的可能性也是致病变异;PP2:本变异是个错义突变,已知错义突变是该基因的一种普遍致病机制,且在基因上的错义突变良性率较低;BS1:在人群频率数据库中搜索本变异,与目标疾病的致病变异期望频率比较,当本变异的人群频率大于致病变异期望频率,可能表示本变异不是致病变异;reo-hit解读步骤也能够通过ClinicalSequencing Exploratory Research Consortium 9个实验室的解读实操经验定义ACMG证据,自动化生成相应的ACMG指南的评价参数。例如,ACMG的PP2证据:本变异是个错义突变,已知错义突变是该基因的一种普遍致病机制,且在基因上的错义突变良性率较低,然而如何定义PP2证据,ACMG指南中没有做更多的解释,本实施例中的reo-hit解读步骤将PP2证据定义为该基因上60%以上错义突变是恶性的,从而实现根据该证据的定义自动生成相应的ACMG指南的评价参数。
本实施例的一种实现方式中,所述reo-hit解读步骤还包括采用GWAS-catalog数据库进行补充注释,例如,对PS4证据:对该疾病的群体研究显示,本变异在病人群体中的频率,要显著高于正常人群体中的频率,进行自动化补充注释。
S204、报告生成步骤,包括根据reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
具体地,根据患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数等模块生成遗传性主动脉疾病相关基因检测报告。本实施例的一种实现方式,可以根据需求对报告的不同模块选择添加或删减,以向用户提供更简要的报告信息。
本实施例实现了仅通过二十一个基因的高通量测序panel完成遗传性主动脉疾病的相关基因检测,单独对遗传性主动脉疾病基因的致病性进行评价,从而减少了遗传性主动脉疾病的基因检测成本,并且大大提高了遗传性主动脉疾病的疾病筛查效率。
本实施例的还提供了一种用于遗传性主动脉疾病及相关基因检测的多重PCR引物,所述多重PCR引物用于扩增FBN1、TGFBR1、TGFBR2、SMAD3、TGFB2、TGFB3和SKI,七个靶标基因序列,其中,每个靶标基因序列包括若干个扩增片段,多重PCR引物的序列及其扩增片段具体如表1所示:
表1
本实施例的一种实现方式中,所述多重PCR引物覆盖七个靶标基因的外显子区及其剪切位点外延至少15bp的序列。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
因此,如图2所示,本申请一实施例中,遗传性主动脉疾病及相关基因的检测装置,包括:靶标序列获取模块301、测序模块302、reo-hit解读模块303、报告生成模块304。
具体地,靶标序列获取模块301,包括用于通过PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;本实施例的一种实现方式中,二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列。
测序模块302,包括用于对获取的二十一个靶标基因序列进行高通量测序;本实施例的一种实现方式中,高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%。
reo-hit解读模块303,包括用于根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;本实施例的一种实现方式中,人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库;疾病数据库包括OMIM数据库和CGD数据库;变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmm MKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100way vertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种。
本实施例的一种实现方式中,reo-hit解读模块还包括GWAS-catalog数据库,用以进行补充注释。
报告生成模块304,包括用于根据reo-hit解读模块的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
本申请另一实施例还提供一种遗传性主动脉疾病及相关基因的检测装置,包括:存储器,用于存储程序;处理器,用于通过执行上述存储器存储的程序以实现如下方法:靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;报告生成步骤,包括根据reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
本申请另一种实施例还提供一种计算机可读存储介质,包括程序,该程序能够被处理器执行以实现如下方法:靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;报告生成步骤,包括根据reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
下面通过具体实施例对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明,不应理解为对本申请的限制。
实施例1
获取一主动脉病人血液样本,已知受检者临床主诉类马凡氏综合症,有动脉瘤,手指骨骼细长,存在家族史,但不排除Loeys-Dietz综合症。受检者血液样本经过基因组DNA提取和纯化后,构建基因组文库,经多重PCR引物对ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,21个靶标基因的编码区以及相邻的内含子区域(15bp)进行扩增,并通过NGS高通量测序仪测序获得测序数据,其中,测序覆盖度结果如表1所示:
表1
测序质量参数 | 数值 |
目标区域长度(bp) | 80k |
目标区域覆盖度 | 100.0% |
目标区域平均覆盖深度 | 2288.41 |
目标区域平均覆盖深度>20×占比 | 100.0% |
测序数据采用BWA工具与人类参考序列GRCh37比对,采用GATK流程检测变异,获取变异信息,在受检者TGFBR2基因上发现一个疑似致病错义突变,突变发生在6号外显子区发。进一步,基于上述变异信息,根据人类频率数据库、疾病数据库、变异数据库和致病性预测软件采集50个评价参数,得到对TGFBR2基因变异注释的评价参数具体如表2所示:
表2
由此可知,本次检测在受检者TGFBR2基因上发现杂合突变c.1427C>T,属于错义突变,突变导致第476位氨基酸由丙氨酸变成缬氨酸,进而导致蛋白功能的改变。进一步,根据ACMG指南定义的规则将上述对TGFBR2基因变异注释的评价参数自动转化为ACMG指南的评价参数,具体包括:
ACMG PM1:本变异处在一个致病变异的热点区域,或在一个研究完善的功能区域未发现良性变异。这表示该区域功能极为重要,处在该区域的变异为恶性变异的可能性高;
ACMG PM2:该变异为极罕见变异,在1000genome东亚数据库,ExAC东亚数据库及自有数据库中均无记载,极为罕见是致病变异的一种特征;
ACMG PP3:使用PolyPhen2和SIFT等多种软件对本变异进行蛋白功能预测,一致预测本变异可能是有害的变异;
ACMG PM5:有报道同一位置不同氨基酸的改变是一个明确的致病变异显示本变异有一定的可能性也是致病变异;
ACMG PP4:该受检者的表型及家族史可能支持Loeys-Dietz综合症特征;
ACMG PP1:在多个家族成员中发现本变异与疾病存在共分离现象。
其中,ACMG PM1证据为中等致病证据,ACMG PM2证据为中等致病证据,ACMG PP3证据为弱致病证据,ACMG PM5证据为中等致病证据,ACMG PP4证据为弱致病证据,ACMG PP1证据为弱致病证据。综合以上ACMG证据,判定该变异为疑似致病突变。
由于在受检者的马凡氏综合症所属FBN1基因中,未发现变异,在TGFBR2基因中,发现了错义突变c.1427C>T(p.Ala476Val),符合致病变异特征,而TGFBR2属于Loeys-Dietz综合症的致病基因,因此该受检者可诊断为Loeys-Dietz综合征,避免了马凡综合症的误诊。根据上述患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果和实验质控参数输出患者的遗传性主动脉疾病基因检测报告。
以上应用了具体个例对本申请进行阐述,只是用于帮助理解本申请,并不用以限制本申请。对于本申请所属技术领域的技术人员,依据本申请的思想,还可以做出若干简单推演、变形或替换。
Claims (10)
1.一种遗传性主动脉疾病及相关基因的检测方法,其特征在于,包括:
靶标序列获取步骤,包括采用PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;
测序步骤,包括对获取的二十一个靶标基因序列进行高通量测序;
reo-hit解读步骤,包括根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;所述人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;所述疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;所述变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;
报告生成步骤,包括根据所述reo-hit解读步骤的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
2.根据权利要求1所述的检测方法,其特征在于:所述二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列。
3.根据权利要求1所述的检测方法,其特征在于:所述高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%。
4.根据权利要求1所述的检测方法,其特征在于:所述人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库;
优选的,所述疾病数据库包括OMIM数据库和CGD数据库;
优选的,所述变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;
优选的,所述致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmm MKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100way vertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种;
优选的,所述reo-hit解读步骤还包括采用GWAS-catalog数据库进行补充注释。
5.一种用于遗传性主动脉疾病及相关基因检测的多重PCR引物,其特征在于,所述多重PCR引物用于扩增FBN1、TGFBR1、TGFBR2、SMAD3、TGFB2、TGFB3和SKI,七个靶标基因序列。
6.根据权利要求5所述的多重PCR引物,其特征在于:所述多重PCR引物覆盖七个靶标基因的外显子区及其剪切位点外延至少15bp的序列。
7.一种遗传性主动脉疾病及相关基因的检测装置,其特征在于:包括靶标序列获取模块、测序模块、reo-hit解读模块、报告生成模块,
所述靶标序列获取模块,包括用于通过PCR扩增,从待测样本的基因组序列中获取ACTA2,COL1A1,COL1A2,COL3A1,COL5A1,COL5A2,EFEMP2,ELN,FBN1,LOX,MYH11,MYLK,NOTCH1,PRKG1,SKI,SMAD3,SMAD4,TGFB2,TGFB3,TGFBR1,TGFBR2,二十一个靶标基因序列;
测序模块,包括用于对获取的二十一个靶标基因序列进行高通量测序;
reo-hit解读模块,包括用于根据高通量测序结果,获得变异信息,采用人类频率数据库、疾病数据库、变异数据库和致病性预测软件,对每个变异进行注释,每个变异采集至少50个评价参数,并转化为ACMG指南的28项评价参数,获得待测样本的致病性评价信息;所述人类频率数据库通过变异频率的高低,提示该变异致病性的高低,频率越高,致病性越低;所述疾病数据库用于提示疾病与基因的关联,据此寻找跟病人表型相关的基因和变异;所述变异数据库用于提示已有报道的致病变异或良性变异,用于调整检测获得的变异的权重;
报告生成模块,包括用于根据所述reo-hit解读模块的结果,输出患者信息、疾病描述信息、基因信息、变异特征、证据列表、致病性评价结果、意义未明变异信息和实验质控参数中的至少一组。
8.根据权利要求7所述的检测装置,其特征在于:所述二十一个靶标基因序列包括涵盖二十一个基因的外显子区及其剪切位点外延至少15bp的序列;
优选的,所述高通量测序的条件为,测序深度>300×,1×覆盖度>99%,20×覆盖度>98%;
优选的,所述人类频率数据库包括1000genome数据库、ExAC数据库、GenomeAD数据库、EVS数据库和In-house数据库;
优选的,所述疾病数据库包括OMIM数据库和CGD数据库;
优选的,所述变异数据库包括clinvar数据库、HGMD数据库和OMIM数据库;
优选的,所述致病性预测软件包括LRT、MutationTaster、FATHMM、PROVEAN、MetaSVM、MetaLR、CADD、fathmm MKL coding、phyloP100way vertebrate、phyloP20way mammalian、phastCons100way vertebrate、phastCons20way mammalian、SiPhy 29way logOdds中的至少一种;
优选的,所述reo-hit解读步骤还包括采用GWAS-catalog数据库进行补充注释。
9.一种遗传性主动脉疾病及相关基因的检测装置,其特征在于:所述装置包括存储器和处理器;
所述存储器,包括用于存储程序;
所述处理器,包括用于通过执行所述存储器存储的程序以实现权利要求1-4任一项所述的遗传性主动脉疾病及相关基因的检测方法。
10.一种计算机可读存储介质,其特征在于:所述存储介质中存储有程序,所述程序能够被处理器执行以实现权利要求1-4任一项所述的遗传性主动脉疾病及相关基因的检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011631464.4A CN112592969A (zh) | 2020-12-31 | 2020-12-31 | 一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011631464.4A CN112592969A (zh) | 2020-12-31 | 2020-12-31 | 一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112592969A true CN112592969A (zh) | 2021-04-02 |
Family
ID=75206612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011631464.4A Pending CN112592969A (zh) | 2020-12-31 | 2020-12-31 | 一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112592969A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112795635A (zh) * | 2020-12-31 | 2021-05-14 | 南昌瑞因康生物科技有限公司 | 一种马凡综合征及相关基因的检测方法、装置和存储介质 |
CN114350783A (zh) * | 2022-01-06 | 2022-04-15 | 昆明市延安医院 | 一种遗传早发主动脉夹层风险基因筛查panel及筛查方法 |
CN114496072A (zh) * | 2022-01-17 | 2022-05-13 | 北京安琪尔基因医学科技有限公司 | 耳聋致病分析等级分类方法、装置、计算机可读存储介质及服务器 |
CN115976187A (zh) * | 2022-10-11 | 2023-04-18 | 深圳市第二人民医院(深圳市转化医学研究院) | 一种Loeys-Dietz综合征检测试剂盒 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109811048A (zh) * | 2019-01-30 | 2019-05-28 | 中国人民解放军总医院 | 一种用于检测遗传性主动脉疾病的致病/易感基因的探针组 |
CN110029158A (zh) * | 2019-02-01 | 2019-07-19 | 北京大学第三医院 | 一种马凡综合征检测panel及其应用 |
CN110863045A (zh) * | 2019-12-31 | 2020-03-06 | 深圳瑞奥康晨生物科技有限公司 | 用于筛查遗传性心脏病的基因组合及其用途 |
CN111778562A (zh) * | 2020-07-08 | 2020-10-16 | 复旦大学附属华山医院 | 一种用于获取颅颈动脉夹层致病基因突变相关信息的dna文库及应用 |
-
2020
- 2020-12-31 CN CN202011631464.4A patent/CN112592969A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109811048A (zh) * | 2019-01-30 | 2019-05-28 | 中国人民解放军总医院 | 一种用于检测遗传性主动脉疾病的致病/易感基因的探针组 |
CN110029158A (zh) * | 2019-02-01 | 2019-07-19 | 北京大学第三医院 | 一种马凡综合征检测panel及其应用 |
CN110863045A (zh) * | 2019-12-31 | 2020-03-06 | 深圳瑞奥康晨生物科技有限公司 | 用于筛查遗传性心脏病的基因组合及其用途 |
CN111778562A (zh) * | 2020-07-08 | 2020-10-16 | 复旦大学附属华山医院 | 一种用于获取颅颈动脉夹层致病基因突变相关信息的dna文库及应用 |
Non-Patent Citations (2)
Title |
---|
ERIC M ISSELBACHER等: "Hereditary Influence in Thoracic Aortic Aneurysm and Dissection", 《CIRCULATION》, vol. 133, no. 24, 14 June 2016 (2016-06-14), pages 2516 - 2528 * |
于长江等: "家族性胸主动脉瘤及主动脉夹层突变基因的研究进展", 《中国血管外科杂志(电子版)》, vol. 12, no. 04, 20 December 2020 (2020-12-20), pages 348 - 352 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112795635A (zh) * | 2020-12-31 | 2021-05-14 | 南昌瑞因康生物科技有限公司 | 一种马凡综合征及相关基因的检测方法、装置和存储介质 |
CN114350783A (zh) * | 2022-01-06 | 2022-04-15 | 昆明市延安医院 | 一种遗传早发主动脉夹层风险基因筛查panel及筛查方法 |
CN114496072A (zh) * | 2022-01-17 | 2022-05-13 | 北京安琪尔基因医学科技有限公司 | 耳聋致病分析等级分类方法、装置、计算机可读存储介质及服务器 |
CN115976187A (zh) * | 2022-10-11 | 2023-04-18 | 深圳市第二人民医院(深圳市转化医学研究院) | 一种Loeys-Dietz综合征检测试剂盒 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112592969A (zh) | 一种遗传性主动脉疾病及相关基因的检测方法、装置和存储介质 | |
CN107002122B (zh) | 确定导致无细胞dna的产生的组织和/或细胞类型的方法以及使用其鉴定疾病或紊乱的方法 | |
Feng et al. | Improved molecular diagnosis by the detection of exonic deletions with target gene capture and deep sequencing | |
EP3625802B1 (en) | Scansoft : a method for the detection of genomic deletions and duplications in massive parallel sequencing data | |
Rentas et al. | Diagnosing Cornelia de Lange syndrome and related neurodevelopmental disorders using RNA sequencing | |
KR20220003142A (ko) | 유전적 변이의 비침습 평가를 위한 방법 및 프로세스 | |
CN110910957A (zh) | 一种基于单肿瘤样本高通量测序微卫星不稳定性探测位点筛选方法 | |
KR102405245B1 (ko) | 전장유전체 시퀀싱 기반의 염색체 이상 검출 방법 및 그 용도 | |
Vali-Pour et al. | The impact of rare germline variants on human somatic mutation processes | |
CN112820354B (zh) | 一种双倍体组装的方法、装置和存储介质 | |
CN112795635A (zh) | 一种马凡综合征及相关基因的检测方法、装置和存储介质 | |
Wang et al. | An autoimmune pleiotropic SNP modulates IRF5 alternative promoter usage through ZBTB3-mediated chromatin looping | |
Zhao et al. | Profiling long noncoding RNA of multi-tissue transcriptome enhances porcine noncoding genome annotation | |
Zhang et al. | A cautionary note for retrocopy identification: DNA-based duplication of intron-containing genes significantly contributes to the origination of single exon genes | |
CN106906220A (zh) | 一种突变的col4a5基因及其应用 | |
CN113823354A (zh) | 一种brca1/2基因变异的分类评价方法 | |
Nunes et al. | Prognostic genome and transcriptome signatures in colorectal cancers | |
Pezzoli et al. | A new mutational mechanism for hypertrophic cardiomyopathy | |
Grochowski et al. | Chromoanagenesis event underlies a de novo pericentric and multiple paracentric inversions in a single chromosome causing coffin–siris syndrome | |
Orgeur et al. | A dual transcript-discovery approach to improve the delimitation of gene features from RNA-seq data in the chicken model | |
KR102472050B1 (ko) | 환자 맞춤형 패널을 이용한 암의 재발을 예측하는 방법 | |
CN105838720B (zh) | Ptprq基因突变体及其应用 | |
CN111128308A (zh) | 一种神经精神疾病新发突变信息知识平台 | |
CN112639129A (zh) | 确定新发突变在胚胎中的遗传状态的方法和装置 | |
KR20210120782A (ko) | 피검 대상 맞춤형 변이체 기반 레퍼런스 데이터 세트의 구축 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |