CN111243661A - 基于基因数据的基因体检系统 - Google Patents

基于基因数据的基因体检系统 Download PDF

Info

Publication number
CN111243661A
CN111243661A CN202010029895.7A CN202010029895A CN111243661A CN 111243661 A CN111243661 A CN 111243661A CN 202010029895 A CN202010029895 A CN 202010029895A CN 111243661 A CN111243661 A CN 111243661A
Authority
CN
China
Prior art keywords
database
data
gene
genetic
typing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010029895.7A
Other languages
English (en)
Inventor
罗奇斌
申玉林
廖胜光
任毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qiyunnord Information Technology Co Ltd
Original Assignee
Beijing Qiyunnord Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qiyunnord Information Technology Co Ltd filed Critical Beijing Qiyunnord Information Technology Co Ltd
Priority to CN202010029895.7A priority Critical patent/CN111243661A/zh
Publication of CN111243661A publication Critical patent/CN111243661A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Genetics & Genomics (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明涉及基因体检技术领域,且公开了基于基因数据的基因体检系统,包括数据库和体检报告自动化生成系统,数据库由SNP位点分型数据库和分型结果个性化解读数据库构成。该基于基因数据的基因体检系统,建立了针对国人的SNP位点分型数据库和分型结果个性化解读数据库,将分析结果直接关联到性状疾病等的解读,使结论更具针对性,同时提高操作效率,且现有基因测序下机数据的分析中使用多种软件,操作过程繁琐耗时,本基于基因数据的基因体检系统,通过建立SNP位点分型数据库和分型结果个性化解读数据库,可直接将测序后的基因数据与数据库数据比对,做到一键式分析,节省时间人力成本,提高操作效率。

Description

基于基因数据的基因体检系统
技术领域
本发明涉及基因体检技术领域,具体为基于基因数据的基因体检系统。
背景技术
基因是携带遗传信息的DNA片段,目前已知的人类基因组共有2-3万个基因,由DNA上30亿对碱基构成,基因通过复制把遗传信息传递给下一代,从而控制生物个体的性状;
基因体检的基础是基因测序技术的飞速发展和科学家对基因研究的日益深入,上世纪九十年代,人类启动了“人类基因组计划”,利用荧光标记碱基后捕捉荧光信号,从而获得基因碱基序列信息,测序技术从第一代到如今的第三代第四代测序技术,发展经历了三十多年,测序通量、准确率大幅提高,耗时、成本大幅降低,根据使用场景,基因检测分为科研及、临川及和消费级,随着基因检测由单独用于科研发展到临床级别和消费级别,市场对基因数据的高效准确处理的要求也越来越高;
消费级基因体检在美国起步较早,10年前美国已出现了面向大众的消费级基因体检产品,2013年前后,消费级基因体检登陆我国,并迅速发展,据统计目前国内的消费级基因体检公司已超过200家,随着用户量和基因数的积累,数据可用于药物研发、健康险设计等,也有助于推动国人基因组学研究的发展,推动精准医疗;
消费级基因检测流程包括样本收集、基因测序、基因数据分析、遗传信息解读和健康报告出具,针对不同的测序方法,基因数据的分析方法也不尽相同,大致流程都包括数据质量评估、参考序列比对、SNP检测注释等步骤,获得SNP数据后,需要通过位点数据库将其与疾病、个体特征、用药情况等关联起来,解读成为消费者可理解内容,并个性化给出生活方式上的指导建议。
然而,一般的消费级基因检测流程,是通过样品采集——基因测序——数据分析——信息解读——出具报告,其中基因数据分析、遗传信息解读和出具报告过程繁琐耗时,从而不仅降低了基因体检的效率,且同时容易在操作过程中出现操作失误。
发明内容
本发明提供了基于基因数据的基因体检系统,具备提高基因体检效率、降低人工成本和操作失误的优点,解决了一般的消费级基因检测流程,是通过样品采集——基因测序——数据分析——信息解读——出具报告,其中基因数据分析、遗传信息解读和出具报告过程繁琐耗时,从而不仅降低了基因体检的效率,且同时容易在操作过程中出现操作失误的问题。
本发明提供如下技术方案:基于基因数据的基因体检系统,包括数据库和体检报告自动化生成系统,所述数据库由SNP位点分型数据库和分型结果个性化解读数据库构成。
基于基因数据的基因体检系统的数据库建立方法,包括以下步骤:
S1、通过样本采集对基因数据进行采集;
S2、利用基因测序对步骤1中采集的基因数据进行测序;
S3、通过数据分析对步骤2测序的基因数据进行质量评估(5)、序列比对和SNP检测,从而将原始序列信息转化为与疾病、性状等相关的位点信息,即获得SNP位点数据;
S4、通过步骤3中获得的SNP位点数据建立SNP位点分型数据库,并根据SNP位点数据所计算出的患病风险建立出相关的分型结果个性化解读数据库。
精选的,所述序列比对是对待分析的序列和标准的序列进行比对。
精选的,所述质量评估、序列比对和SNP检测三个检测过程中需要使用到大量生物信息分析软件进行分析,如fastqc、SOAPnuke、fastp、BWA、samtools、GATK、Annovar等,逐个操作这些生物信息软件,最后得到SNP位点数据。
精选的,所述SNP位点分型数据库由大量GWAS(全基因组关联性研究)论文进行扩充,针对某一疾病的某个位点进行大量信息挖掘,找出了位点与疾病的相关性,同时结合多个位点,使用相应算法,计算出多个位点与同一疾病的相关性。
精选的,所述分型结果个性化解读数据库是针对SNP位点数据计算出的患病风险,给出相关衣食住行用药等多方面个性化指导方案的数据库,该数据库的建立一方面参考了大量论文,另一方面也结合了资深营养师、遗传咨询师、药剂师等的专业意见,保证了结果的准确性和可读性。
基于基因数据的基因体检系统的体检报告自动化生成系统,包括以下步骤:
S1、通过样本采集对基因数据进行采集;
S2、利用基因测序对步骤1中采集的基因数据进行测序;
S3、将步骤2中测序获得的基因数据输入到SNP位点分型数据库中,与SNP位点分型数据库中所储存的基因数据进行比对并利用分型结果个性化解读数据库给出合理化的建议,并生成PDF或者H5格式的健康管理报告,方便消费者的阅读。
本发明具备以下有益效果:
1、该基于基因数据的基因体检系统,通过采集基因体检过程中产生的SNP站点数据信息配合大量论文,进行深度数据挖掘,建立了针对国人的SNP位点分型数据库和分型结果个性化解读数据库,做到了将分析结果直接关联到性状疾病等的解读,使结论更具针对性,同时提高操作效率,且现有技术在基因测序下机数据的分析中使用多种软件,每个软件都需要单独操作,过程繁琐耗时,本基于基因数据的基因体检系统,通过建立SNP位点分型数据库和分型结果个性化解读数据库,可直接将测序后的基因数据与数据库数据比对,做到一键式分析,节省时间人力成本,提高操作效率。
2、该基于基因数据的基因体检系统,通过将基因体检系统化和流程化,通过不同参数的选择,一键式可视化生成基因健康管理报告,可避免操作人员在分步操作中可能出现的操作失误。
附图说明
图1为本发明数据库建立流程图;
图2为本发明体检报告自动化生成流程图。
图中:1、样本采集;2、基因测序;3、数据分析;4、序列比对;5、质量评估;6、SNP检测;7、SNP位点分型数据库;8、分型结果个性化解读数据库。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,基于基因数据的基因体检系统,包括数据库和体检报告自动化生成系统,数据库由SNP位点分型数据库7和分型结果个性化解读数据库8构成;
数据库中的SNP位点分型数据库7由对基因数据进行采集的样本采集1、对采集的基因数据进行测序的基因测序2、对测序的基因数据进行分析的数据分析3、由SNP位点数据并由大量GWAS论文进行扩充后建立的SNP位点分型数据库7和由SNP位点数据所计算出的患病风险、参考大量论文,并结合资深营养师、遗传咨询师、药剂师等的专业意见建立出相关的分型结果个性化解读数据库8构成,SNP位点分型数据库7由大量GWAS全基因组关联性研究论文进行扩充,针对某一疾病的某个位点进行大量信息挖掘,找出了位点与疾病的相关性,同时结合多个位点,使用相应算法,计算出多个位点与同一疾病的相关性,分型结果个性化解读数据库8是针对SNP位点数据计算出的患病风险,给出相关衣食住行用药等多方面个性化指导方案的数据库,该数据库的建立一方面参考了大量论文,另一方面也结合了资深营养师、遗传咨询师、药剂师等的专业意见,保证了结果的准确性和可读性,其中,数据分析3由对测序的基因数据进行分析的质量评估5、对待分析的序列和标准的序列进行比对的序列比对4和SNP位点数据进行检测的SNP检测6构成,质量评估5、序列比对4和SNP检测6三个检测过程中需要使用到大量生物信息分析软件进行分析,如fastqc、SOAPnuke、fastp、BWA、samtools、GATK、Annovar等,逐个操作这些生物信息软件,最后得到SNP位点数据;
体检报告自动化生成系统由样本采集1、基因测序2、SNP位点分型数据库7、分型结果个性化解读数据库8和PDF/H5报告构成,该体检报告自动化生成系统通过样本采集1采集基因数据,经过基因测序2测序后,直接与SNP位点分型数据库7中的基因数据信息进行比对,并利用分型结果个性化解读数据库8给出合理化的建议,并生成PDF或者H5格式的健康管理报告,方便消费者的阅读。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。同时在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (7)

1.基于基因数据的基因体检系统,包括数据库和体检报告自动化生成系统,其特征在于:所述数据库由SNP位点分型数据库(7)和分型结果个性化解读数据库(8)构成。
2.基于基因数据的基因体检系统的数据库建立方法,其特征在于,包括以下步骤:
S1、通过样本采集(1)对基因数据进行采集;
S2、利用基因测序(2)对步骤1中采集的基因数据进行测序;
S3、通过数据分析(3)对步骤2测序的基因数据进行质量评估(5)、序列比对(4)和SNP检测(6),从而将原始序列信息转化为与疾病、性状等相关的位点信息,即获得SNP位点数据;
S4、通过步骤3中获得的SNP位点数据建立SNP位点分型数据库(7),并根据SNP位点数据所计算出的患病风险建立出相关的分型结果个性化解读数据库(8)。
3.根据权利要求2所述的基于基因数据的基因体检系统的数据库建立方法,其特征在于:所述序列比对(4)是对待分析的序列和标准的序列进行比对。
4.根据权利要求2所述的基于基因数据的基因体检系统的数据库建立方法,其特征在于:所述质量评估(5)、序列比对(4)和SNP检测(6)三个检测过程中需要使用到大量生物信息分析软件进行分析,如fastqc、SOAPnuke、fastp、BWA、samtools、GATK、Annovar等,逐个操作这些生物信息软件,最后得到SNP位点数据。
5.根据权利要求2所述的基于基因数据的基因体检系统的数据库建立方法,其特征在于:所述SNP位点分型数据库(7)由大量GWAS(全基因组关联性研究)论文进行扩充,针对某一疾病的某个位点进行大量信息挖掘,找出了位点与疾病的相关性,同时结合多个位点,使用相应算法,计算出多个位点与同一疾病的相关性。
6.根据权利要求2所述的基于基因数据的基因体检系统的数据库建立方法,其特征在于:所述分型结果个性化解读数据库(8)是针对SNP位点数据计算出的患病风险,给出相关衣食住行用药等多方面个性化指导方案的数据库,该数据库的建立一方面参考了大量论文,另一方面也结合了资深营养师、遗传咨询师、药剂师等的专业意见,保证了结果的准确性和可读性。
7.基于基因数据的基因体检系统的体检报告自动化生成系统,其特征在于,包括以下步骤:
S1、通过样本采集(1)对基因数据进行采集;
S2、利用基因测序(2)对步骤1中采集的基因数据进行测序;
S3、将步骤2中测序获得的基因数据输入到SNP位点分型数据库(7)中,与SNP位点分型数据库(7)中所储存的基因数据进行比对并利用分型结果个性化解读数据库(8)给出合理化的建议,并生成PDF或者H5格式的健康管理报告,方便消费者的阅读。
CN202010029895.7A 2020-01-13 2020-01-13 基于基因数据的基因体检系统 Pending CN111243661A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010029895.7A CN111243661A (zh) 2020-01-13 2020-01-13 基于基因数据的基因体检系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010029895.7A CN111243661A (zh) 2020-01-13 2020-01-13 基于基因数据的基因体检系统

Publications (1)

Publication Number Publication Date
CN111243661A true CN111243661A (zh) 2020-06-05

Family

ID=70876243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010029895.7A Pending CN111243661A (zh) 2020-01-13 2020-01-13 基于基因数据的基因体检系统

Country Status (1)

Country Link
CN (1) CN111243661A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116205475A (zh) * 2022-12-01 2023-06-02 哈尔滨海吉雅科技有限公司 基于基因组算法的健康体检流程优化调度方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512508A (zh) * 2014-09-22 2016-04-20 深圳华大基因研究院 自动生成基因检测报告的方法及装置
CN106202936A (zh) * 2016-07-13 2016-12-07 为朔医学数据科技(北京)有限公司 一种疾病风险预测方法及系统
CN107437004A (zh) * 2017-08-07 2017-12-05 深圳华大基因研究院 一种用于肿瘤个体化基因检测智能解读的系统
CN107978345A (zh) * 2017-12-21 2018-05-01 扬州医联生物科技有限公司 基于基因序列分析的健康数据分析报告生成系统和方法
CN108251520A (zh) * 2018-01-31 2018-07-06 杭州同欣基因科技有限公司 一种基于高通量测序技术的吸烟成瘾风险预测方法及戒烟指导方法
CN108399939A (zh) * 2018-05-31 2018-08-14 周倩珍 基于基因检测为导向的个人健康管理系统
CN110111890A (zh) * 2019-03-29 2019-08-09 杭州高六博生物科技有限公司 一种基于基因测序技术的个体精准养生方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512508A (zh) * 2014-09-22 2016-04-20 深圳华大基因研究院 自动生成基因检测报告的方法及装置
CN106202936A (zh) * 2016-07-13 2016-12-07 为朔医学数据科技(北京)有限公司 一种疾病风险预测方法及系统
CN107437004A (zh) * 2017-08-07 2017-12-05 深圳华大基因研究院 一种用于肿瘤个体化基因检测智能解读的系统
CN107978345A (zh) * 2017-12-21 2018-05-01 扬州医联生物科技有限公司 基于基因序列分析的健康数据分析报告生成系统和方法
CN108251520A (zh) * 2018-01-31 2018-07-06 杭州同欣基因科技有限公司 一种基于高通量测序技术的吸烟成瘾风险预测方法及戒烟指导方法
CN108399939A (zh) * 2018-05-31 2018-08-14 周倩珍 基于基因检测为导向的个人健康管理系统
CN110111890A (zh) * 2019-03-29 2019-08-09 杭州高六博生物科技有限公司 一种基于基因测序技术的个体精准养生方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116205475A (zh) * 2022-12-01 2023-06-02 哈尔滨海吉雅科技有限公司 基于基因组算法的健康体检流程优化调度方法

Similar Documents

Publication Publication Date Title
US20200395100A1 (en) Population based treatment recommender using cell free dna
JP5966109B1 (ja) 遺伝子分析用人工知能システム
US8693751B2 (en) Artificial intelligence system for genetic analysis
CN109686439B (zh) 遗传病基因检测的数据分析方法、系统及存储介质
JP5171254B2 (ja) 多重プローブターゲット相互作用パターンの自動分析:パターンマッチング及び対立遺伝子同定
CN106650256A (zh) 一种分子诊疗精准医学平台
US20020179097A1 (en) Method for providing clinical diagnostic services
CN106021984A (zh) 一种全外显子组测序数据分析系统
CN106971071A (zh) 一种临床决策支持系统及方法
CN111139291A (zh) 一种单基因遗传性疾病高通量测序分析方法
CN109599157A (zh) 一种精准智能诊疗大数据系统
CN112270960A (zh) 一种二级肿瘤诊断知识库及肿瘤突变解析系统
CN115458052A (zh) 基于一代测序的基因突变分析方法、设备和存储介质
CN101110095B (zh) 一种对常见脑疾病易感基因的批量检测方法
Ahmad et al. A review of genetic variant databases and machine learning tools for predicting the pathogenicity of breast cancer
CN111243661A (zh) 基于基因数据的基因体检系统
CN112435712B (zh) 用于分析基因测序数据的方法及系统
CN112331290A (zh) 一种基因体检报告自动化生成方法及系统
WO2002093454A1 (en) System, method and computer readable medium for analysis of clusters of gene expression data
CN110111890A (zh) 一种基于基因测序技术的个体精准养生方法
WO2002099724A2 (en) Analysis apparatus for genetic data
CN101743320A (zh) 来自基因转录产物检测的具有广泛基础的疾病结合
CN118588170A (zh) 基于游离dna组学特征的泛癌早筛方法
JP3773092B2 (ja) 遺伝子発現パターン表示方法および装置並びに記録媒体
Haas Bioinformatic tool developments with applications to RNA-seq data analysis and clinical cancer research

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200605

RJ01 Rejection of invention patent application after publication