CN112259161A - 一种疾病风险评估系统、方法、装置及存储介质 - Google Patents

一种疾病风险评估系统、方法、装置及存储介质 Download PDF

Info

Publication number
CN112259161A
CN112259161A CN202011133873.1A CN202011133873A CN112259161A CN 112259161 A CN112259161 A CN 112259161A CN 202011133873 A CN202011133873 A CN 202011133873A CN 112259161 A CN112259161 A CN 112259161A
Authority
CN
China
Prior art keywords
disease
sample
target
snp
risk assessment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011133873.1A
Other languages
English (en)
Other versions
CN112259161B (zh
Inventor
刘小双
徐啸
孙瑜尧
徐衔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202011133873.1A priority Critical patent/CN112259161B/zh
Publication of CN112259161A publication Critical patent/CN112259161A/zh
Application granted granted Critical
Publication of CN112259161B publication Critical patent/CN112259161B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请实施例提供了一种疾病风险评估系统、方法、装置及存储介质,应用于医疗科技领域,其中系统包括:通信设备、风险评估设备和存储设备,通信设备用于接收携带有目标用户标识的疾病风险评估请求,疾病风险评估请求用于指示确定目标用户患目标疾病的风险概率;风险评估设备用于根据目标用户标识从存储设备中获取目标用户的SNP位点的位点信息包括SNP位点对应的基因型;调用目标疾病评估模型对SNP位点对应的基因型进行数据分析;并根据数据分析结果确定目标用户患目标疾病的风险概率,可以提高对目标疾病预测的准确性,本申请涉及区块链技术,如可将目标用户的SNP位点的位点信息写入区块链中,以用于对确定目标用户进行患目标疾病的风险概率等场景。

Description

一种疾病风险评估系统、方法、装置及存储介质
技术领域
本申请涉及智能决策技术领域,具体应用于医疗技术领域,尤其涉及一种疾病风险评估系统、方法、装置及存储介质。
背景技术
目前,随着社会的发展,出现越来越多的复杂疾病,该复杂疾病的发生通常受控于多位点,单个位点的效应较弱,无法准确预测疾病,因此需要综合多多位点信息。目前,多基因风险评分(polygenic risk score,PRS)是比较常用的策略。基于PRS方法通过筛选多个变异位点,量化这些变异位点的累积效应,从而将大量的变异位点信息浓缩成衡量个体疾病易感性的分值,但这种方法仅仅是将大量变异位点进行浓缩,同样无法保证对复杂疾病的预测的准确性。
发明内容
本申请实施例提供了一种疾病风险评估系统、方法、装置及存储介质,可以根据SNP位点对应基因之间的调控关系确定出较为准确的患目标疾病的风险概率,从而提高对目标疾病的预测的准确性。
本申请实施例第一方面提供了一种疾病风险评估系统,所述系统包括通信设备、风险评估设备和存储设备,其中,所述存储设备存储有目标用户的单核苷酸多态性SNP位点信息;
所述通信设备,用于接收携带有目标用户标识的疾病风险评估请求,所述疾病风险评估请求用于指示确定所述目标用户患目标疾病的风险概率;
所述风险评估设备,用于根据所述目标用户标识从所述存储设备中获取所述目标用户的SNP位点的位点信息,所述位点信息包括所述SNP位点对应的基因型;调用目标疾病评估模型对所述SNP位点对应的基因型进行数据分析,所述目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,所述调控网络图表征了各样本SNP位点对应基因之间的调控关系,所述各样本是指患有所述目标疾病的用户;根据所述数据分析结果确定所述目标用户患目标疾病的风险概率。
本申请实施例第二方面提供了一种疾病风险评估方法,所述疾病风险评估方法应用于疾病风险评估系统中疾病风险评估设备,所述方法包括:
接收携带有目标用户标识的疾病风险评估请求,所述疾病风险评估请求用于指示确定所述目标用户患目标疾病的风险概率;
根据所述目标用户标识获取所述目标用户的SNP位点的位点信息,所述位点信息包括所述SNP位点对应的基因型;
调用目标疾病评估模型对所述SNP位点对应的基因型进行数据分析,所述目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,所述调控网络图表征了各样本SNP位点对应基因之间的调控关系,所述各样本是指患有所述目标疾病的用户;
根据所述数据分析结果确定所述目标用户患目标疾病的风险概率。
本申请实施例第三方面提供了一种疾病风险评估装置,所述疾病风险评估装置部署于风险评估设备,所述装置包括:
通信模块,用于接收携带有目标用户标识的疾病风险评估请求,所述疾病风险评估请求用于指示确定所述目标用户患目标疾病的风险概率;
获取模块,用于根据所述目标用户标识获取所述目标用户的SNP位点的位点信息,所述位点信息包括所述SNP位点对应的基因型;
调用模块,用于调用目标疾病评估模型对所述SNP位点对应的基因型进行数据分析,所述目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,所述调控网络图表征了各样本SNP位点对应基因之间的调控关系,所述各样本是指患有所述目标疾病的用户;
确定模块,用于根据所述数据分析结果确定所述目标用户患目标疾病的风险概率。
本申请实施例第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第二方面所述的方法。
在本申请实施例中,可以接收携带有目标用户标识的疾病风险评估请求,该疾病风险评估请求用于指示确定目标用户患目标疾病的风险概率,并根据目标用户标识从存储设备中获取目标用户的SNP位点的位点信息,该位点信息包括SNP位点对应的基因型;进一步调用目标疾病评估模型对SNP位点对应的基因型进行数据分析,该目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,该调控网络图表征了各样本SNP位点对应基因之间的调控关系,根据数据分析结果确定目标用户患目标疾病的风险概率,通过这样的方式,可以利用SNP位点对应基因之间的调控关系对目标疾病的效应进行评估,从而比较准确地确定出目标用户患目标疾病的风险概率,提高对疾病风险评估的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种疾病风险评估系统的结构示意图;
图2是本申请实施例提供的一种疾病风险评估方法的流程示意图;
图3是本申请实施例提供的一种SNP位点对应的调控网络图的示意图;
图4是本申请实施例提供的一种疾病风险评估装置的结构示意图;
图5是本申请实施例提供的一种风险评估设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前针对该复杂疾病的风险评估主要利用PRS方法,该方法主要通过筛选多个变异位点,并量化这些变异位点的累积效应,从而将大量的变异位点信息浓缩成衡量个体疾病易感性的分值,从而实现对复杂疾病的风险评估。但是该方法忽略了变异位点之间的调控关系,导致无法对该复杂疾病的风险进行准确地评估。针对上述缺点,本申请实施例提供一种疾病风险评估方法,通过调用目标疾病评估模型,该目标疾病评估模型是通过多个样本中各样本的样本单核苷酸多态性SNP(single nucleotide polymorphism,SNP)位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,该调控网络图表征了各样本SNP位点对应基因之间的调控关系,可以较为准确地确定目标用户患目标疾病风险。在具体实现中,接收携带有目标用户标识的疾病风险评估请求,该疾病风险评估请求用于指示确定目标用户患目标疾病的风险概率;根据目标用户标识获取目标用户的SNP位点的位点信息,位点信息包括SNP位点对应的基因型;并调用目标疾病评估模型对SNP位点对应的基因型进行数据分析,该目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,调控网络图表征了各样本SNP位点对应基因之间的调控关系,根据数据分析结果确定目标用户患目标疾病的风险概率。
需要说明的是,通过基因之间的调控关系可以较为准确地确定目标用户患目标疾病风险,由于多个SNP位点可以确定一个基因,则在确定目标用户患目标疾病的风险概率时,能够保证利用该基因之间的调控关系比较准确地确定目标用户患目标疾病的风险概率。因此建立该SNP位点对应基因之间的调控关系可以提高对目标疾病风险评估的准确性。
请参阅图1,图1为本申请实施例提供的一种疾病风险评估系统的结构示意图。其中,所述疾病风险评估系统包括通信设备、风险评估设备和存储设备,该通信设备可以是终端设备,例如手机。所述存储设备存储有目标用户的单核苷酸多态性SNP位点信息,该风险评估设备可以是针对疾病风险评估的设备,该存储设备可以是各种存储器,也可以是U盘等等。
通信设备,用于接收携带有目标用户标识的疾病风险评估请求,该疾病风险评估请求用于指示确定该目标用户患目标疾病的风险概率,其中,该疾病风险评估请求中还可以携带有该目标用户的身份信息,根据该目标用户的身份信息可以从存储设备中获取目标用户对应的数据,如,目标用户的单核苷酸多态性SNP位点信息。该目标用户标识可以是数字、字母等,即该目标用户标识唯一能够指示该用户的身份信息,该目标疾病可以是复杂性疾病,如癌症等。
风险评估设备,用于根据目标用户标识从存储设备中获取目标用户的SNP位点的位点信息,该位点信息包括SNP位点对应的基因型;其中,存储设备中存储有大量用户的SNP位点信息,每个用户有对应的标识,根据该标识可与获取对应用户的SNP位点信息,该基因分型可以为0,1,2。
风险评估设备,用于调用目标疾病评估模型对SNP位点对应的基因型进行数据分析,该目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,该调控网络图表征了各样本SNP位点对应基因之间的调控关系,该各样本是指患有该目标疾病的用户;根据该数据分析结果确定该目标用户患目标疾病的风险概率。在具体实现中,风险评估设备可以先对预设疾病模型进行训练,当得到目标疾病评估模型后,调用该目标疾病评估模型对SNP位点对应的基因型进行数据分析。其中该预设疾病评估模型可以是包括图注意力神经网络模型和前反馈神经网络模型中至少一种。
风险评估设备确定多个样本SNP位点对应的调控网络图,该调控网络图包括各样本SNP位点对应基因之间的调控关系和任意两个SNP位点之间的权重,在基因调控网络图中任意两个SNP位点之间的权重为对应基因之间的相互作用的分值,该多个样本SNP位点为多个样本中的所有样本SNP位点,并获取多个样本中各样本的样本SNP位点的位点信息,该各样本的样本SNP位点的位点信息包括该各样本的样本SNP位点对应的基因型,进而根据该调控网络图与该各样本的样本SNP位点对应的基因型对预设疾病评估模型进行训练,得到目标疾病评估模型。
在本申请实施例中,可以通过通信设备接收携带有目标用户标识的疾病风险评估请求,该疾病风险评估请求用于指示确定所述目标用户患目标疾病的风险概率;风险评估设备根据目标用户标识从存储设备中获取目标用户的SNP位点的位点信息,该位点信息包括SNP位点对应的基因型;调用目标疾病评估模型对所述SNP位点对应的基因型进行数据分析,所述目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,该调控网络图表征了各样本SNP位点对应基因之间的调控关系,根据数据分析结果确定目标用户患目标疾病的风险概率。
由上述可知,通过实施本申请实施例,利用SNP位点对应基因之间的调控关系,可以比较准确地确定出目标用户患目标疾病的风险概率,从而提高了对目标疾病的评估的准确性。
请参阅图2,图2为本申请实施例提供的一种疾病风险评估方法的流程示意图。本实施例中所描述的疾病风险评估方法,所述疾病风险评估方法应用于上述风险评估设备,包括:
201、接收携带有目标用户标识的疾病风险评估请求,该疾病风险评估请求用于指示确定该目标用户患目标疾病的风险概率。
其中,目标用户标识可以是通过数字或者字符进行表示,该目标用户标识唯一能够指示该用户的身份信息,该目标疾病可以是复杂性疾病,如癌症等。
在一种可行的实施例中,当目标用户想要知道自身患目标疾病的风险概率,可以发送携带有目标用户标识的疾病风险请求,当风险评估设备接收携带有目标用户标识的疾病风险评估请求,可以获取该疾病风险评估请求中携带的目标用户标识,以使得风险评估设备确定该目标用户患目标疾病的风险概率。
202、根据目标用户标识获取目标用户的SNP位点的位点信息,该位点信息包括SNP位点对应的基因型。
在一种可行的实施例中,风险评估设备可以根据目标用户标识从预设存储区域中查询目标用户标识对应的SNP位点的位点信息,当查询到目标用户标识对应的SNP位点的位点信息,则获取该目标用户的SNP位点的位点信息,其中该预设存储区域可以是存储全基因数据库结果的存储区域,或者可以是区块链网络中的存储区域等等,本申请实施例不做限定。
在一种可行的实施例中,风险评估设备可以根据目标用户标识获取该目标用户的基因信息,并对该目标用户的基因信息中的基因进行基因测序,从而获得目标用户的SNP位点信息。
203、调用目标疾病评估模型对SNP位点对应的基因型进行数据分析,该目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,该调控网络图表征了各样本SNP位点对应基因之间的调控关系。
其中,该各样本是指患有目标疾病的用户,基因之间的调控关系是指可编码的基因之间的调控关系,例如信使核糖核酸之间的调控关系。
具体的,在调用目标疾病评估模型之前,风险评估设备需要获取大量目标疾病的用户数据,将该大量目标疾病的用户数据放入预先设置的目标疾病评估模型中进行训练,从而得到目标疾病评估模型,以用于后续调用目标疾病评估模型进行数据处理。
在一种可行的实施例中,在调用目标疾病评估模型对SNP位点对应的基因型进行数据分析之前,风险评估设备可以获取基因之间的调控信息,以及多个样本SNP位点,并根据多个样本SNP位点和基因之间的调控信息确定多个样本SNP位点对应的调控网络图。其中,风险评估设备可以从数据库中获取可编码的基因之间的调控信息,该数据库可以是string(基因蛋白互相作用)数据库,可编码的基因是指最终可以翻译成蛋白质的基因,例如,通过数据库获取到A基因编码的蛋白和B基因编码的蛋白具有相互作用,则可以确定A基因和B基因之间有调控关系。在本申请实施例中,主要是指信使核糖核酸(messengerribonucleic acid,mRNA)之间的调控信息,上述多个样本SNP位点主要是指患有多个患目标疾病的用户对应的样本SNP位点。
在一种可行的实施例中,该基因之间的调控信息可以包括基因之间的调控关系以及基因之间的调控的权重,风险评估设备根据多个样本SNP位点、基因之间的调控关系以及基因之间的权重确定多个样本SNP位点对应的调控网络图。可以理解的是,确定的多个样本SNP位点对应的调控网络图中样本SNP位点之间的权重其实就是基因之间的权重。
在一种可行的实施例中,风险评估设备根据多个样本SNP位点和可编码的基因之间的调控信息确定多个样本SNP位点对应的调控网络图的具体实现方式为:获取多个样本SNP位点中各样本SNP位点的位点信息,该各样本SNP位点的位点信息包括各样本SNP位点的位置信息,并根据各样本SNP位点的位置信息和基因之间的调控信息确定该多个样本SNP位点对应的调控网络图,该各样本SNP位点的位置信息用于指示该各样本SNP位点在对应基因上的位置。在具体实现中,风险评估设备根据各样本SNP位点的位置信息将各样本SNP位点映射到对应的基因上,从而根据基因之间的调控关系生成该多个样本SNP位点对应的调控网络图。可选地,风险评估设备将各样本SNP位点映射到对应的基因上,并为各样本SNP位点打上基因位置标签,根据基因之间的调控关系以及基因位置标签生成由多个样本SNP位点构成的调控网络图。如图3所示,该图3实例性的给出SNP位点对应调控网络图,其中,任意两SNP位点之间的连线,表征两个SNP位点对应基因之间的调控关系,任意两SNP位点之间的连线上的数字表示两个SNP位点对应基因之间的调控的权重。
在一中可行的实施例中,进一步地,在确定多个样本SNP位点对应的调控网络图后,可以获取多个样本中各样本的样本SNP位点的位点信息,该各样本的样本SNP位点的位点信息包括各样本的样本SNP位点对应的基因型,并根据调控网络图与各样本的样本SNP位点对应的基因型对预设疾病评估模型进行训练,得到目标疾病评估模型,该预设疾病评估模型包括图注意力神经网络模型和前反馈神经网络模型中至少一种。其中,调控网络图包括各样本SNP位点对应基因之间的调控关系,该多个样本SNP位点为多个样本中的所有样本SNP位点。其中,该基因分型结果可以为0,1,2,其中,基因型为0表示野生,基因型为1表示杂合突变(该杂合突变是指只有一个等位基因发生突变,如该基因型为AA变为Aa),基因型为2表示为纯合突变(该纯合突变是指两个等位基因发生突变,如该基因型aa变为AA)。
在一种可行的实施例中,实例性地,以该预设疾病模型为图注意神经网络模型和前反馈神经网络模型结合进行模型训练为例,风险评估设备获取多个样本中各样本的样本SNP位点的位点信息,该各样本的样本SNP位点的位点信息包括各样本的样本SNP位点对应的基因型,并将各样本的样本SNP位点对应的基因型输入图注意力神经网络中,从而确定各样本对应的样本SNP位点的表征向量,将各样本对应的样本SNP位点的表征向量与样本SNP位点对应的基因型进行相乘,并通过基于权重attention的池化操作,从而确定出各样本的调控网络图对应的表征向量。其中,上述样本SNP位点的表征向量用于表征SNP位点的基因特征,各样本的调控网络图对应的表征向量用于表征该样本对应的所有基因特征。
进一步地,在确定出各样本的调控网络图对应的表征向量后,将各样本的调控网络图的表征向量,输入到前馈神经网络,得到目标样本患目标疾病的风险概率。在具体实现中,将通过各样本的调控网络图的表征信息输入到前馈神经网络,并前馈神经网络通过隐层和输出层处理,得到输出向量,根据输出向量连接sigmoid激活函数,从而确定各样本患目标疾病的风险概率,从而完成初步地训练过程。需要说明的是,该sigmoid激活函数得到的值范围对应患目标疾病风险的概率。其中,前馈神经网络包括输入层、多个隐层、输出层。
在一种可行的实施例中,进一步地,在完成对预设疾病评估模型初步训练之后,风险评估设备根据预设评价规则对训练后的疾病评估模型进行评价,得到评价结果,根据评价结果利用反向传播技术和梯度下降算法优化训练后的疾病评估模型中的参数,得到目标疾病评估模型。其中,该预设评价规则可以根据该训练后的疾病评估模型得到的数据进行设置。例如,将上述对预设疾病评估模型训练中得到各样本患该目标疾病的风险概率与各样本患目标疾病风险概率进行误差评价,若误差评价太大,则利用反向传播技术和梯度下降算法优化训练后的疾病评估模型中的参数,得到目标疾病评估模型。
204、根据数据分析结果确定目标用户患目标疾病的风险概率。
在一种可行的实施例中,风险评估设备在根据数据分析结果确定目标用户患目标疾病的风险概率后,可以判断目标用户患目标疾病的风险概率是否超过阈值,若该目标用户患目标疾病的风险概率超过阈值,则获取针对目标疾病的注意事项,该治疗事项包括预防该目标疾病的措施和治疗该目标疾病的方法,并将风险概率和注意事项发送给目标用户,以使得目标用户可以提前进行预防等。
在一种可行的实施例中,风险评估设备在根据数据分析结果确定目标用户患目标疾病的风险概率后,风险评估设备输出提示信息,该提示信息用于指示是否将所述风险概率上传区块链网络,若检测到针对提示信息的确认操作,则风险评估设备可以获取目标用户的身份标识,并将该身份标识与该风险概率上传区块链网络,从而保证该风险概率的有效性。
在本申请实施例中,可以接收携带有目标用户标识的疾病风险评估请求,该疾病风险评估请求用于指示确定目标用户患目标疾病的风险概率,并根据目标用户标识获取目标用户的SNP位点的位点信息,该位点信息包括SNP位点对应的基因型;进一步调用目标疾病评估模型对SNP位点对应的基因型进行数据分析,该目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,该调控网络图表征了各样本SNP位点对应基因之间的调控关系,根据数据分析结果确定目标用户患目标疾病的风险概率,通过这样的方式,可以利用SNP位点对应基因之间的调控关系对目标疾病的效应进行评估,从而能够比较准确地确定出目标用户患目标疾病的风险概率,提高对疾病风险评估的准确性。
请参见图4,图4为本申请实施例提供的一种疾病风险评估装置的结构示意图。本实施例中所描述的疾病风险评估装置,所述疾病分类装置配置于风险评估设备,包括:
通信模块401,用于接收携带有目标用户标识的疾病风险评估请求,所述疾病风险评估请求用于指示确定所述目标用户患目标疾病的风险概率;
获取模块402,用于根据所述目标用户标识获取所述目标用户的SNP位点的位点信息,所述位点信息包括所述SNP位点对应的基因型;
调用模块403,用于调用目标疾病评估模型对所述SNP位点对应的基因型进行数据分析,所述目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,所述调控网络图表征了各样本SNP位点对应基因之间的调控关系,所述各样本是指患有所述目标疾病的用户;
确定模块404,用于根据所述数据分析结果确定所述目标用户患目标疾病的风险概率。
在一种可行的实施例中,所述确定模块404,还用于确定多个样本SNP位点对应的调控网络图,所述调控网络图包括所述各样本SNP位点对应基因之间的调控关系,所述多个样本SNP位点为多个样本中的所有样本SNP位点;
所述获取模块402,还用于获取所述多个样本中各样本的样本SNP位点的位点信息,所述各样本的样本SNP位点的位点信息包括所述各样本的样本SNP位点对应的基因型;
所述确定模块404,还用于根据所述调控网络图与所述各样本的样本SNP位点对应的基因型对预设疾病评估模型进行训练,得到目标疾病评估模型,所述预设疾病评估模型包括图注意力神经网络模型和前反馈神经网络模型中至少一种。
在一种可行的实施例中,所述获取模块402,还用于获取基因之间的调控信息,以及所述多个样本SNP位点;所述确定模块404,还用于根据所述多个样本SNP位点和所述基因之间的调控信息确定所述多个样本SNP位点对应的调控网络图。
在一种可行的实施例中,所述获取模块402,还用于获取所述多个样本SNP位点中各样本SNP位点的位点信息,所述各样本SNP位点的位点信息包括各样本SNP位点的位置信息,所述各样本SNP位点的位置信息用于指示所述各样本SNP位点在对应基因上的位置;
所述确定模块404,还用于根据所述各样本SNP位点的位置信息和所述基因之间的调控信息确定所述多个样本SNP位点对应的调控网络图。
在一种可行的实施例中,所述确定模块404,具体用于:
根据预设评价规则对训练后的疾病评估模型进行评价,得到评价结果;
根据所述评价结果利用反向传播技术和梯度下降算法优化训练后的疾病评估模型中的参数,得到目标疾病评估模型。
在一种可行的实施例中,所述装置还包括:判断模块405,其中:
所述判断模块405,用于判断所述目标用户患目标疾病的风险概率是否超过阈值;
所述获取模块402,用于若所述目标用户患目标疾病的风险概率超过阈值,则获取针对目标疾病的注意事项,所述治疗事项包括预防所述目标疾病的措施和治疗所述目标疾病的方法;
所述通信模块401,用于将所述风险概率和所述注意事项发送给目标用户。
在一种可行的实施例中,所述通信模块401,还用于输出提示信息,所述提示信息用于指示是否将所述风险概率上传区块链网络;
所述获取模块402,还用于若检测到针对所述提示信息的确认操作,则获取所述目标用户的身份标识;
所述通信模块401,还用于将所述身份标识与所述风险概率上传区块链网络。
可以理解的是,本实施例的疾病风险评估装置的各功能模块可根据上述方法实施例图2中的方法具体实现,其具体实现过程可以参照上述方法实施例图2的相关描述,此处不再赘述。
请参阅图5,图5为本申请实施例提供的一种风险评估设备的结构示意图,该风险评估设备可以是手机、电脑等终端设备。该风险评估设备可以包括:一个或多个处理器501;通信接口502和存储器503。上述处理器501、通信接口502和存储器503通过总线504连接。存储器503用于存储计算机程序,所述计算机程序包括程序指令,处理器501用于执行存储器503存储的程序指令,执行以下操作:通过通信接口502接收携带有目标用户标识的疾病风险评估请求,所述疾病风险评估请求用于指示确定所述目标用户患目标疾病的风险概率;根据所述目标用户标识获取所述目标用户的SNP位点的位点信息,所述位点信息包括所述SNP位点对应的基因型;调用目标疾病评估模型对所述SNP位点对应的基因型进行数据分析,所述目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,所述调控网络图表征了各样本SNP位点对应基因之间的调控关系,所述各样本是指患有所述目标疾病的用户;根据所述数据分析结果确定所述目标用户患目标疾病的风险概率。具体实现中,本申请实施例中所描述的处理器501、通信接口502和存储器503可执行本申请实施例提供的疾病风险评估方法图2所描述的实现方式,也可执行本申请实施例所描述的疾病风险评估装置图4的实现方式,在此不再赘述。
在一种可行的实施例中,所述处理器501,还用于:
确定多个样本SNP位点对应的调控网络图,所述调控网络图包括所述各样本SNP位点对应基因之间的调控关系,所述多个样本SNP位点为多个样本中的所有样本SNP位点;获取所述多个样本中各样本的样本SNP位点的位点信息,所述各样本的样本SNP位点的位点信息包括所述各样本的样本SNP位点对应的基因型;根据所述调控网络图与所述各样本的样本SNP位点对应的基因型对预设疾病评估模型进行训练,得到目标疾病评估模型,所述预设疾病评估模型包括图注意力神经网络模型和前反馈神经网络模型中至少一种。具体实现中,本申请实施例中所描述的处理器501的具体实现方式可执行前述实施例步骤203所描述的相关实现方式,此处不再赘述。
在一种可行的实施例中,所述处理器501,具体用于:获取基因之间的调控信息,以及所述多个样本SNP位点;根据所述多个样本SNP位点和所述基因之间的调控信息确定所述多个样本SNP位点对应的调控网络图。具体实现中,本申请实施例中所描述的处理器501的具体实现方式可执行前述实施例步骤203所描述的相关实现方式,此处不再赘述。
在一种可行的实施例中,所述处理器501,具体用于:获取所述多个样本SNP位点中各样本SNP位点的位点信息,所述各样本SNP位点的位点信息包括各样本SNP位点的位置信息,所述各样本SNP位点的位置信息用于指示所述各样本SNP位点在对应基因上的位置;根据所述各样本SNP位点的位置信息和所述基因之间的调控信息确定所述多个样本SNP位点对应的调控网络图。具体实现中,本申请实施例中所描述的处理器501的具体实现方式可执行前述实施例步骤203所描述的相关实现方式,此处不再赘述。
在一种可行的实施例中,所述处理器501,还用于:根据预设评价规则对训练后的疾病评估模型进行评价,得到评价结果;根据所述评价结果利用反向传播技术和梯度下降算法优化训练后的疾病评估模型中的参数,得到目标疾病评估模型。具体实现中,本申请实施例中所描述的处理器501的具体实现方式可执行前述实施例步骤203所描述的相关实现方式,此处不再赘述。
在一种可行的实施例中,所述处理器501,还用于:判断所述目标用户患目标疾病的风险概率是否超过阈值;若所述目标用户患目标疾病的风险概率超过阈值,则获取针对目标疾病的注意事项,所述治疗事项包括预防所述目标疾病的措施和治疗所述目标疾病的方法;将所述风险概率和所述注意事项通过通信设备发送给目标用户。具体实现中,本申请实施例中所描述的处理器501的具体实现方式可执行前述实施例步骤203所描述的相关实现方式,此处不再赘述。
在一种可行的实施例中,所述处理器501,还用于:输出提示信息,所述提示信息用于指示是否将所述风险概率上传区块链网络;若检测到针对所述提示信息的确认操作,则获取所述目标用户的身份标识,并将所述身份标识与所述风险概率上传区块链网络。具体实现中,本申请实施例中所描述的处理器501的具体实现方式可执行前述实施例步骤204所描述的相关实现方式,此处不再赘述。
在本申请的另一实施例中提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现本申请实施例提供的图2所述的方法实施所描述的实现方式,所述计算机可读存储介质可以是前述任一实施例所述的服务器的内部存储单元,例如服务器的硬盘或内存。所述计算机可读存储介质也可以是所述服务器的外部存储设备,例如所述服务器上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述服务器的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述服务器所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取可读存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。
其中,所述的可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
其中,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所揭露的仅为本申请的部分实施例而已,当然不能以此来限定本申请之权利范围,本领域普通技术工作人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要求所作的等同变化,仍属于本申请所涵盖的范围。

Claims (10)

1.一种疾病风险评估系统,其特征在于,所述系统包括通信设备、风险评估设备和存储设备,其中,所述存储设备存储有目标用户的单核苷酸多态性SNP位点信息;
所述通信设备,用于接收携带有目标用户标识的疾病风险评估请求,所述疾病风险评估请求用于指示确定所述目标用户患目标疾病的风险概率;
所述风险评估设备,用于根据所述目标用户标识从所述存储设备中获取所述目标用户的SNP位点的位点信息,所述位点信息包括所述SNP位点对应的基因型;调用目标疾病评估模型对所述SNP位点对应的基因型进行数据分析,所述目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,所述调控网络图表征了各样本SNP位点对应的基因之间的调控关系,所述各样本是指患有所述目标疾病的用户;根据所述数据分析结果确定所述目标用户患目标疾病的风险概率。
2.根据权利要求1所述的疾病风险评估系统,其特征在于,所述风险评估设备,还用于:
确定多个样本SNP位点对应的调控网络图,所述调控网络图包括所述各样本SNP位点对应基因之间的调控关系,所述多个样本SNP位点为多个样本中的所有样本SNP位点;
获取所述多个样本中各样本的样本SNP位点的位点信息,所述各样本的样本SNP位点的位点信息包括所述各样本的样本SNP位点对应的基因型;
根据所述调控网络图与所述各样本的样本SNP位点对应的基因型对预设疾病评估模型进行训练,得到目标疾病评估模型,所述预设疾病评估模型包括图注意力神经网络模型和前反馈神经网络模型中至少一种。
3.根据权利要求2所述的疾病风险评估系统,其特征在于,所述风险评估设备,具体用于:
获取基因之间的调控信息,以及所述多个样本SNP位点;
根据所述多个样本SNP位点和所述基因之间的调控信息确定所述多个样本SNP位点对应的调控网络图。
4.根据权利要求3所述的疾病风险评估系统,其特征在于,所述风险评估设备,具体用于:
获取所述多个样本SNP位点中各样本SNP位点的位点信息,所述各样本SNP位点的位点信息包括各样本SNP位点的位置信息,所述各样本SNP位点的位置信息用于指示所述各样本SNP位点在对应基因上的位置;
根据所述各样本SNP位点的位置信息和所述基因之间的调控信息确定所述多个样本SNP位点对应的调控网络图。
5.根据权利要求2所述的疾病风险评估系统,其特征在于,所述风险评估设备,还用于:
根据预设评价规则对训练后的疾病评估模型进行评价,得到评价结果;
根据所述评价结果利用反向传播技术和梯度下降算法优化训练后的疾病评估模型中的参数,得到目标疾病评估模型。
6.根据权利要求1所述的疾病风险评估系统,其特征在于,所述风险评估设备,还用于:
判断所述目标用户患目标疾病的风险概率是否超过阈值;
若所述目标用户患目标疾病的风险概率超过阈值,则获取针对目标疾病的注意事项,所述治疗事项包括预防所述目标疾病的措施和治疗所述目标疾病的方法;
将所述风险概率和所述注意事项通过通信设备发送给目标用户。
7.根据权利要求1所述的疾病风险评估系统,其特征在于,所述风险评估设备,还用于:
输出提示信息,所述提示信息用于指示是否将所述风险概率上传区块链网络;
若检测到针对所述提示信息的确认操作,则获取所述目标用户的身份标识,并将所述身份标识与所述风险概率上传区块链网络。
8.一种疾病风险评估方法,其特征在于,所述疾病风险评估方法应用于疾病风险评估系统中的风险评估设备,所述方法包括:
接收携带有目标用户标识的疾病风险评估请求,所述疾病风险评估请求用于指示确定所述目标用户患目标疾病的风险概率;
根据所述目标用户标识获取所述目标用户的SNP位点的位点信息,所述位点信息包括所述SNP位点对应的基因型;
调用目标疾病评估模型对所述SNP位点对应的基因型进行数据分析,所述目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,所述调控网络图表征了各样本SNP位点对应基因之间的调控关系,所述各样本是指患有所述目标疾病的用户;
根据所述数据分析结果确定所述目标用户患目标疾病的风险概率。
9.一种疾病风险评估装置,其特征在于,所述装置包括:
通信模块,用于接收携带有目标用户标识的疾病风险评估请求,所述疾病风险评估请求用于指示确定所述目标用户患目标疾病的风险概率;
获取模块,用于根据所述目标用户标识获取所述目标用户的SNP位点的位点信息,所述位点信息包括所述SNP位点对应的基因型;
调用模块,用于调用目标疾病评估模型对所述SNP位点对应的基因型进行数据分析,所述目标疾病评估模型是通过多个样本中各样本的样本SNP位点对应的基因型和调控网络图对预设疾病评估模型进行训练得到,所述调控网络图表征了各样本SNP位点对应的基因之间的调控关系,所述各样本是指患有所述目标疾病的用户;
确定模块,用于根据所述数据分析结果确定所述目标用户患目标疾病的风险概率。
10.一种计算机可读存储介质,其特征在于,该计算机存储介质中存储有程序指令,该程序指令被执行时,用于实现如权利要求8所述的方法。
CN202011133873.1A 2020-10-21 2020-10-21 一种疾病风险评估系统、方法、装置及存储介质 Active CN112259161B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011133873.1A CN112259161B (zh) 2020-10-21 2020-10-21 一种疾病风险评估系统、方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011133873.1A CN112259161B (zh) 2020-10-21 2020-10-21 一种疾病风险评估系统、方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN112259161A true CN112259161A (zh) 2021-01-22
CN112259161B CN112259161B (zh) 2024-03-01

Family

ID=74264432

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011133873.1A Active CN112259161B (zh) 2020-10-21 2020-10-21 一种疾病风险评估系统、方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN112259161B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113066531A (zh) * 2021-04-13 2021-07-02 平安国际智慧城市科技股份有限公司 风险预测方法、装置、计算机设备及存储介质
CN113724878A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 基于机器学习的医疗风险信息推送方法及装置
CN113838576A (zh) * 2021-07-14 2021-12-24 北京航空航天大学 一种中国人中风风险的评估方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017204482A2 (ko) * 2016-05-27 2017-11-30 ㈜메디젠휴먼케어 Snp를 이용한 질병 관련 유전체 분석 시스템 및 장치
CN109493972A (zh) * 2018-10-30 2019-03-19 平安医疗健康管理股份有限公司 基于预测模型的数据处理方法、装置、服务器及存储介质
CN110246581A (zh) * 2019-07-02 2019-09-17 广东瑞昊生物技术有限公司 基于基因检测的评估系统
CN111128298A (zh) * 2019-12-24 2020-05-08 大连海事大学 一种基于深度学习模型获取多基因风险评分的方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017204482A2 (ko) * 2016-05-27 2017-11-30 ㈜메디젠휴먼케어 Snp를 이용한 질병 관련 유전체 분석 시스템 및 장치
CN109493972A (zh) * 2018-10-30 2019-03-19 平安医疗健康管理股份有限公司 基于预测模型的数据处理方法、装置、服务器及存储介质
CN110246581A (zh) * 2019-07-02 2019-09-17 广东瑞昊生物技术有限公司 基于基因检测的评估系统
CN111128298A (zh) * 2019-12-24 2020-05-08 大连海事大学 一种基于深度学习模型获取多基因风险评分的方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113066531A (zh) * 2021-04-13 2021-07-02 平安国际智慧城市科技股份有限公司 风险预测方法、装置、计算机设备及存储介质
CN113066531B (zh) * 2021-04-13 2023-12-12 深圳平安智慧医健科技有限公司 风险预测方法、装置、计算机设备及存储介质
CN113838576A (zh) * 2021-07-14 2021-12-24 北京航空航天大学 一种中国人中风风险的评估方法、装置、设备及介质
CN113724878A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 基于机器学习的医疗风险信息推送方法及装置
CN113724878B (zh) * 2021-08-31 2024-05-10 平安科技(深圳)有限公司 基于机器学习的医疗风险信息推送方法及装置

Also Published As

Publication number Publication date
CN112259161B (zh) 2024-03-01

Similar Documents

Publication Publication Date Title
CN112259161A (zh) 一种疾病风险评估系统、方法、装置及存储介质
Shahmuradov et al. Plant promoter prediction with confidence estimation
Mather et al. A practical introduction to sequentially Markovian coalescent methods for estimating demographic history from genomic data
Collin et al. Extending approximate Bayesian computation with supervised machine learning to infer demographic history from genetic polymorphisms using DIYABC Random Forest
CN110119847B (zh) 一种配送时长的预测方法、装置、存储介质和电子设备
CN111667267B (zh) 一种区块链交易风险识别方法及装置
CN109388675B (zh) 数据分析方法、装置、计算机设备及存储介质
CN110832597A (zh) 基于深度神经网络的变体分类器
Calus et al. Efficient genomic prediction based on whole-genome sequence data using split-and-merge Bayesian variable selection
US20170329899A1 (en) Display of estimated parental contribution to ancestry
CN112560964A (zh) 基于半监督学习训练中草药病虫害识别模型的方法与系统
CN110619545B (zh) 基于大数据的车险数据推送方法、系统、设备及存储介质
US20200082910A1 (en) Systems and Methods for Determining Effects of Genetic Variation of Splice Site Selection
CN112597745A (zh) 一种智能图表的生成方法、装置、计算机系统及可读存储介质
Ahrens et al. Regarding the F‐word: The effects of data filtering on inferred genotype‐environment associations
CN115280415A (zh) 致病性模型的应用和其训练
CN112017732B (zh) 一种终端设备、装置、疾病分类方法及可读存储介质
Quinn et al. Colonialism in South Africa leaves a lasting legacy of reduced genetic diversity in Cape buffalo
US20160259882A1 (en) Method and system for estimating genomic health
CN116402625B (zh) 客户评估方法、装置、计算机设备及存储介质
CN117010272A (zh) 基于强化学习的决策生成方法、装置、计算机设备和介质
CN111666991A (zh) 基于卷积神经网络的模式识别方法、装置和计算机设备
Araujo et al. SNP‐and haplotype‐based single‐step genomic predictions for body weight, wool, and reproductive traits in North American Rambouillet sheep
Zhang et al. Comparison of gene-based rare variant association mapping methods for quantitative traits in a bovine population with complex familial relationships
Hudson et al. Compression distance can discriminate animals by genetic profile, build relationship matrices and estimate breeding values

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant