CN112331290A - 一种基因体检报告自动化生成方法及系统 - Google Patents

一种基因体检报告自动化生成方法及系统 Download PDF

Info

Publication number
CN112331290A
CN112331290A CN202011333557.9A CN202011333557A CN112331290A CN 112331290 A CN112331290 A CN 112331290A CN 202011333557 A CN202011333557 A CN 202011333557A CN 112331290 A CN112331290 A CN 112331290A
Authority
CN
China
Prior art keywords
gene
report
genotyping
examination report
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202011333557.9A
Other languages
English (en)
Inventor
罗奇斌
申玉林
廖胜光
任毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Qiyun Nord Biomedical Co ltd
Original Assignee
Tianjin Qiyun Nord Biomedical Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Qiyun Nord Biomedical Co ltd filed Critical Tianjin Qiyun Nord Biomedical Co ltd
Priority to CN202011333557.9A priority Critical patent/CN112331290A/zh
Publication of CN112331290A publication Critical patent/CN112331290A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及基因体检技术领域,且公开了一种基因体检报告自动化生成方法及系统,该系统包括基因数据获取模块、基因数据分析处理模块、基因数据存储模块、基因分型信息及表型数据库模块、表型说明及指导建议数据库模块、基因体检报告内容自定义模块和报告生成模块。本发明从基因层面分析个体各种表型及健康情况,表型涵盖了疾病风险、个体遗传特征、精准用药指导等,出具的报告适用于多种场景,适用性强;基因分型信息及表型数据库和SNP分型频率使用背景数据的人群分布特异性明显,因此更加合理和准确,并保证了技术性;报告内容支持自定义,可根据需求进行选择和调整,更好地满足实际应用场景;同时本发明提供的方法由计算机自动化控制,简化了报告生成环节并降低了人工成本,提升了报告生成效率。

Description

一种基因体检报告自动化生成方法及系统
技术领域
本发明涉及基因体检技术领域,具体为一种基因体检报告自动化生成方法及系统。
背景技术
随着本世纪初人类基因组计划的完成,基因组与健康相关的行业迅速发展,大量研究成果涌现,越来越多和疾病相关的基因和位点被确定,如BRCA1或BRCA2中的某些突变大大增加了个体患乳腺癌和卵巢癌的风险。通过对这些易感基因的检测也使得对疾病的预防、干预和风险评估成为可能,对于大部分疾病,其病因都可以在基因中发现,因此遗传分析和解读也成为了疾病相关分析中重要的一环,通过对疾病发生风险进行评估,并根据评估结果报告提供专业的遗传咨询指导建议。基因体检的基础之一是大样本量基因单核苷酸多态性(SNP)位点与表型的关联性分析和研究。SNP是指在基因组水平上由单个核苷酸的变异引起的DNA序列的多态性,占人类基因已知多态性的90%以上,一些基因上的SNP可能直接影响蛋白质的结构或表达水平,同时可以相对稳定地遗传,这些特性使得SNP被应用于到了多种基于群体的表型关联研究中,这些研究中多揭示了基因(SNP)分型与疾病、遗传特征等的关系和机理。
基因体检的使用场景可总结为如下四个:疾病的诊断和分型,多种恶性肿瘤的诊断和分类都需要通过基因体检手段,如白血病等;疾病的预防和预测,对健康人群的基因分型可以预测疾病发生的风险,并可根据风险等级提供生活方式改善建议,避免疾病的发生;基因特征的了解,通过检查基因分型可以发现个体现有或潜在的特性,如酒精代谢快慢等;精准安全用药指导,药物对不同个体的效果或副作用不尽相同,通过基因体检的方式可以了解不同药物的效果,指导更合理的用药,提升药效并避免药物危害。
为了满足人们日益增长的基因健康管理需求,公开号为CN110033839A的中国专利公开了一种自动生成用于指导精准用药的基因检测报告的方法。该方法包括上传实验结果文件、系统匹配和判断、报告自动生成和人工审核四个步骤,该方法的优势是能够快速、准确的给出用于指导精准用药的基因检测报告,但该方法存在功能单一、适用性差的缺点,仅用于指导精准用药的使用场景。又如公开号为CN109754856A的中国专利公开了自动生成基因检测报告的方法及装置、电子设备,该方法包括遗传信息收集、模板选取、设置遗传信息筛选条件、获取筛选出的注释结果和基因检测报告的生成五个步骤。该方法的优势在于可以自动生成癌症基因检测报告,缺点在于适用场景单一,且筛选过滤步骤繁琐,需要先根据筛选结果查询生物医学数据库,再注释变异文件。
目前国内尚缺少一个使用场景全面、合理且自动化程度高的基因体检报告生成系统,因此,设计了一种基因体检报告自动化生成方法及系统,适用于多种场景的基因体检,提升了生成报告的自动化程度,功能多样、适用性强,具有现实意义和良好的应用前景。
发明内容
针对上述背景技术中的不足,本发明的目的在于提供一种可以避免上述技术缺陷的一种基因体检报告自动化生成方法及系统,适用于多种基因体检场景、自动化程度高、功能多样且适用性强。
为实现上述目的,本发明提供如下技术方案:
一种基因体检报告自动化生成系统,包括基因数据获取模块、基因数据分析处理模块、基因数据存储模块、基因分型信息及表型数据库模块、表型说明及指导建议数据库模块、基因体检报告内容自定义模块和报告生成模块。
一种基因体检报告自动化生成方法,包括以下步骤:
步骤1)基因分型信息及表型数据库的构建;
步骤2)表型说明及指导建议数据库的构建;
步骤3)获取个体体液或组织液样本,并进行基因测序;
步骤4)基因数据的分析和处理,获得基因分型数据;
步骤5)基因分型数据的存储,对个体每个SNP位点的分型信息进行储存记录操作,并获取个体每个位点的SNP分型频率;
步骤6)自定义基因体检报告的内容;
步骤7)自动化生成基因体检报告,根据个体基因分型数据、SNP分型频率、对应的基因分型及表型信息、对应表型描述及指导建议、自定义报告内容自动化生成定制化的基因体检报告。
进一步地,所述步骤1)具体为:根据已发表的权威论文和开源数据库建立的针对不同表型的SNP位点分型信息数据库,包括SNP对应的表型、SNP的不同基因分型、所在的基因和SNP的比值比(OR值)等信息。
进一步地,所述SNP对应的表型涵盖了不同疾病、药物、遗传特性等。
进一步地,所述步骤2)具体为:权威医师、营养师和遗传咨询师建立的描述不同表型特征和针对每个表型高/中/低风险或不同分类的关于生活方式、营养补充、体检内容等多方面的指导建议的数据库。
进一步地,所述步骤3)具体为:采集个体的体液或组织液样本,并通过基因芯片分型的方式进行基因测序。
进一步地,所述步骤4)具体为:对样本的基因芯片分型原始数据进行统一的SNP位点信息注释和格式调整等操作,获得标准基因分型数据文件。
进一步地,所述步骤5)中的SNP分型频率是根据开源数据库(如National Centerfor Biotechnology Information ( NCBI) ,Human Gene Mutation Database(HGMD),Clinvar等)中相关大型项目人群频率结合奇云诺德收集到的大量中国人群频率整理计算出的。
进一步地,所述步骤6)具体为:根据待生成报告的使用场景,选择报告中展示的表型、报告尺寸、报告语言、报告模板等相关参数。
本发明提供的一种基因体检报告自动化生成方法及系统与现有技术相比,具备以下有益效果:
1. 表型涵盖了疾病风险、个体遗传特征、精准用药指导等,使出具的报告可适用于多种使用场景,适用性强;
2. 报告内容支持自定义,可根据实际应用需求进行选择和调整,更好地满足实际应用场景;
3. 基因分型信息及表型数据库是根据已发表的针对亚洲人群的权威论文和开源数据库建立的,SNP分型频率是根据开源数据库(如National Center for BiotechnologyInformation ( NCBI) ,Human Gene Mutation Database(HGMD),Clinvar等)中相关大型项目人群频率结合奇云诺德收集到的大量中国人群频率整理计算出的,所用数据的人群分布特异性明显,因此更加合理和准确,并保证了技术性;
4. 本发明提供的方法由计算机自动控制,简化了报告生成环节并降低了人工成本,提升了报告生成效率。
附图说明
图1为一种基因体检报告自动化生成系统的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基因体检报告自动化生成系统,包括基因数据获取模块、基因数据分析处理模块、基因数据存储模块、基因分型信息及表型数据库模块、表型说明及指导建议数据库模块、基因体检报告内容自定义模块和报告生成模块。以上模块均为由计算机实现的功能模块。基因分型信息及表型数据库中存储与多种表型相关的SNP基因分型信息、所在的基因信息和SNP的比值比等,同时数据库能够根据权威研究文献和数据库不断扩充。
一种基因体检报告自动化生成方法,包括以下步骤:
步骤1)基因分型信息及表型数据库的构建,构建好的数据库即为基因分型信息及表型数据库模块;
步骤2)表型说明及指导建议数据库的构建,构建好的数据库即表型说明及指导建议数据库模块;
步骤3)获取个体体液或组织液样本,并进行基因测序;步骤3)是通过基因数据获取模块实现的;
步骤4)基因数据的分析和处理,获得基因分型数据;步骤4)是通过基因数据分析处理模块实现的;
步骤5)基因分型数据的存储,对个体每个SNP位点的分型信息进行记录操作,并获取个体每个位点的SNP分型频率,并记录在基因数据存储模块中;
步骤6)自定义基因体检报告的内容,例如若出具报告的使用场景是癌症病人用药管理,则只选择针对这一癌症相关的药物表型出具报告即可;步骤6)是通过基因体检报告内容自定义模块实现的;
步骤7)自动化生成基因体检报告,根据个体基因分型数据、SNP分型频率、对应的基因分型及表型信息、自定义报告内容自动化生成定制化的基因体检报告;步骤7)是通过报告生成模块实现的。
所述步骤1)具体为:根据已发表的权威论文和开源数据库建立的针对不同表型的SNP位点分型信息数据库,包括SNP对应的表型、SNP的不同基因分型、所在的基因和SNP的比值比(OR值)等信息。
所述步骤1)SNP对应的表型涵盖了不同疾病、药物、遗传特性等。
所述步骤2)具体为:权威医师、营养师和遗传咨询师建立的描述不同表型特征和针对每个表型高/中/低风险或不同分类的关于生活方式、营养补充、体检内容等多方面的指导建议的数据库。
所述步骤3)具体为:采集个体的体液或组织液样本,并通过基因芯片分型的方式进行基因测序。
所述步骤4)具体为:对样本的基因芯片分型原始数据进行统一的SNP位点信息注释和格式调整等操作,获得标准基因分型数据文件。
所述步骤5)中的SNP分型频率是根据开源数据库(如National Center forBiotechnology Information ( NCBI) ,Human Gene Mutation Database(HGMD),Clinvar等)中相关大型项目人群频率结合奇云诺德收集到的大量中国人群频率整理计算出的。
所述步骤6)具体为:根据待生成报告的使用场景,选择报告中展示的表型、报告尺寸、报告语言、报告模板等相关参数。
本发明提供一种基因体检报告自动化生成方法及系统,从基因层面分析个体各种表型及健康情况,表型涵盖了疾病风险、个体遗传特征、精准用药指导等,使出具的报告可适用于多种使用场景,适用性强;基因分型信息及表型数据库和SNP分型频率使用的背景数据的人群分布特异性明显,因此更加合理和准确,并保证了技术性;报告内容支持自定义,可根据实际应用需求进行选择和调整,更好地满足实际应用场景;同时本发明提供的方法由计算机自动控制,简化了报告生成环节并降低了人工成本,提升了报告生成效率。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
以上所述仅为本发明的优选实例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基因体检报告自动化生成系统,其特征在于,包括基因数据获取模块、基因数据分析处理模块、基因数据存储模块、基因分型信息及表型数据库模块、表型说明及指导建议数据库模块、基因体检报告内容自定义模块和报告生成模块。
2.一种基因体检报告自动化生成方法,包括以下步骤:步骤1)基因分型信息及表型数据库的构建;步骤2)表型说明及指导建议数据库的构建;步骤3)获取个体体液或组织液样本,并进行基因测序;步骤4)基因数据的分析和处理,获得基因分型数据;步骤5)基因分型数据的存储,对个体每个SNP位点的分型信息进行储存记录操作,并获取个体每个位点的SNP分型频率;步骤6)自定义基因体检报告的内容;步骤7)自动化生成基因体检报告,根据个体基因分型数据、SNP分型频率、对应的基因分型及表型信息、对应表型描述及指导建议、自定义报告内容自动化生成定制化的基因体检报告。
3.根据权利要求2所述的一种基因体检报告生成方法,其特征在于,所述步骤1)具体为:根据已发表的权威论文和开源数据库建立的针对不同表型的SNP位点分型信息数据库,包括SNP对应的表型、SNP的不同基因分型、所在的基因和SNP的比值比(OR值)等信息。
4.根据权利要求2所述的一种基因体检报告生成方法,其特征在于,所述的SNP对应的表型涵盖了不同疾病、药物、遗传特性等。
5.根据权利要求2所述的一种基因体检报告生成方法,其特征在于,所述步骤2)具体为:权威医师、营养师和遗传咨询师建立的描述不同表型特征和针对每个表型高/中/低风险或不同分类的关于生活方式、营养补充、体检内容等多方面的指导建议的数据库。
6.根据权利要求2所述的一种基因体检报告生成方法,其特征在于,所述步骤3)具体为:采集个体的体液或组织液样本,并通过基因芯片分型的方式进行基因测序。
7.根据权利要求2所述的一种基因体检报告生成方法,其特征在于,所述步骤4)具体为:对样本的基因芯片分型原始数据进行统一的SNP位点信息注释和格式调整等操作,获得标准基因分型数据文件。
8.根据权利要求2所述的一种基因体检报告生成方法,其特征在于,所述步骤5)中的SNP分型频率是根据开源数据库(如National Center for Biotechnology Information( NCBI) ,Human Gene Mutation Database(HGMD),Clinvar等)中相关大型项目人群频率结合奇云诺德收集到的大量中国人群频率整理计算出的。
9.根据权利要求2所述的一种基因体检报告生成方法,其特征在于,所述步骤6)具体为:根据待生成报告的使用场景,选择报告中展示的表型、报告尺寸、报告语言、报告模板等相关参数。
CN202011333557.9A 2020-11-25 2020-11-25 一种基因体检报告自动化生成方法及系统 Withdrawn CN112331290A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011333557.9A CN112331290A (zh) 2020-11-25 2020-11-25 一种基因体检报告自动化生成方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011333557.9A CN112331290A (zh) 2020-11-25 2020-11-25 一种基因体检报告自动化生成方法及系统

Publications (1)

Publication Number Publication Date
CN112331290A true CN112331290A (zh) 2021-02-05

Family

ID=74307866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011333557.9A Withdrawn CN112331290A (zh) 2020-11-25 2020-11-25 一种基因体检报告自动化生成方法及系统

Country Status (1)

Country Link
CN (1) CN112331290A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113223710A (zh) * 2021-04-23 2021-08-06 武汉大学 一种大数据健康体检结果展示系统及控制方法
CN117649948A (zh) * 2024-01-29 2024-03-05 深圳市早知道科技有限公司 一种基于基因检测的微生物感染风险预测方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113223710A (zh) * 2021-04-23 2021-08-06 武汉大学 一种大数据健康体检结果展示系统及控制方法
CN117649948A (zh) * 2024-01-29 2024-03-05 深圳市早知道科技有限公司 一种基于基因检测的微生物感染风险预测方法及系统
CN117649948B (zh) * 2024-01-29 2024-05-10 深圳市早知道科技有限公司 一种基于基因检测的微生物感染风险预测方法及系统

Similar Documents

Publication Publication Date Title
Eckardt et al. Application of machine learning in the management of acute myeloid leukemia: current practice and future prospects
US11756655B2 (en) Population based treatment recommender using cell free DNA
US8107693B2 (en) Artificial intelligence system for genetic analysis
AU785341B2 (en) Artificial intelligence system for genetic analysis
De et al. Bioinformatics challenges in genome-wide association studies (GWAS)
EP1774323B1 (en) Automated analysis of multiplexed probe-traget interaction patterns: pattern matching and allele identification
CN109686439B (zh) 遗传病基因检测的数据分析方法、系统及存储介质
CN106650256A (zh) 一种分子诊疗精准医学平台
EP2666115A1 (en) Method for processing genomic data
US20220215900A1 (en) Systems and methods for joint low-coverage whole genome sequencing and whole exome sequencing inference of copy number variation for clinical diagnostics
Xie et al. MOBCdb: a comprehensive database integrating multi-omics data on breast cancer for precision medicine
CN107092770A (zh) 医学分析系统
CN112331290A (zh) 一种基因体检报告自动化生成方法及系统
AU2020326626A1 (en) Data-based mental disorder research and treatment systems and methods
Dou et al. Single-nucleotide variant calling in single-cell sequencing data with Monopogen
Tseng et al. An open dataset of annotated metaphase cell images for chromosome identification
Ahmad et al. A review of genetic variant databases and machine learning tools for predicting the pathogenicity of breast cancer
CN114927191B (zh) 血液系统疾病ngs报告解读方法
Lavrichenko et al. SeeCiTe: a method to assess CNV calls from SNP arrays using trio data
CN111243661A (zh) 基于基因数据的基因体检系统
Chanwigoon et al. inCNV: An integrated analysis tool for copy number variation on whole exome sequencing
Rahm et al. The GeWare data warehouse platform for the analysis of molecular-biological and clinical data
De Filippis et al. Computational strategies in nutrigenetics: constructing a reference dataset of nutrition-associated genetic polymorphisms
Yashin et al. The accuracy of statistical estimates in genetic studies of aging can be significantly improved
Díez-Obrero et al. The Colon Transcriptome Explorer (CoTrEx) 2.0: a Reference Web-Based Resource for Exploring Population-Based Normal Colon Gene Expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210205

WW01 Invention patent application withdrawn after publication