CN114373546A - 疾病风险评估方法、装置及存储介质 - Google Patents

疾病风险评估方法、装置及存储介质 Download PDF

Info

Publication number
CN114373546A
CN114373546A CN202111675675.2A CN202111675675A CN114373546A CN 114373546 A CN114373546 A CN 114373546A CN 202111675675 A CN202111675675 A CN 202111675675A CN 114373546 A CN114373546 A CN 114373546A
Authority
CN
China
Prior art keywords
disease
data
detected
preset
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111675675.2A
Other languages
English (en)
Inventor
操利超
巴颖
张核子
程云阳
卢晓萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Nuclear Gene Technology Co ltd
Original Assignee
Shenzhen Nuclear Gene Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Nuclear Gene Technology Co ltd filed Critical Shenzhen Nuclear Gene Technology Co ltd
Priority to CN202111675675.2A priority Critical patent/CN114373546A/zh
Publication of CN114373546A publication Critical patent/CN114373546A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种疾病风险评估方法、装置及存储介质。疾病风险评估方法包括:接收疾病类型、疾病影响因素的待检测数据和待检测基因位点数据;根据预设赋值关系表分别对待检测数据和待检测基因位点数据进行赋值以得到对应的待检测分值,预设赋值关系表包括疾病影响因素的数据范围、基因位点数据和待检测分值的匹配信息;根据疾病类型和预设模型数据库确定目标疾病评估模型,预设模型数据库包括疾病类型和目标疾病评估模型的匹配信息,目标疾病评估模型通过多个训练样本数据对预设疾病评估模型进行训练得到;将待检测分值输入目标疾病评估模型得到疾病评估结果。本发明综合考虑基因位点和疾病影响因素来进行疾病评估,从而提高疾病评估的准确性。

Description

疾病风险评估方法、装置及存储介质
技术领域
本发明涉及大数据分析的技术领域,尤其是涉及一种疾病风险评估方法、装置及存储介质。
背景技术
随着智能医疗技术的发展,采用大数据进行疾病数据分析也成为疾病研究的主流。其中,医学研究表明,除了外伤几乎所有的疾病都和基因有关系,但除了与基因有关系,也跟患者的生活习惯和家族遗传相关。但是在相关技术中,主要根据基因来进行疾病风险评估,由于复杂疾病涉及到的因素很多,因此,对于疾病风险评估的准确性不高。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种疾病风险评估方法,能够提高疾病评估的准确性。
本发明还提出一种疾病风险评估装置。
本发明还提出一种计算机可读存储介质。
根据本发明的第一方面实施例的疾病风险评估方法,包括:
接收待检测样本数据和疾病类型,所述待检测样本数据包括:疾病影响因素的待检测数据和待检测基因位点数据;
根据预设赋值关系表分别对所述待检测数据和所述待检测基因位点数据进行赋值,以得到所述疾病影响因素和所述待检测基因位点数据对应的待检测分值,所述预设赋值关系表包括所述疾病影响因素的数据范围、所述基因位点数据和待检测分值的匹配信息;
根据所述疾病类型和预设模型数据库确定目标疾病评估模型,所述预设模型数据库包括所述疾病类型和所述目标疾病评估模型的匹配信息,所述目标疾病评估模型通过多个训练样本数据对预设疾病评估模型进行训练得到;
将所述待检测分值输入所述目标疾病评估模型,以得到疾病评估结果。
根据本发明实施例的疾病风险评估方法,至少具有如下有益效果:通过对待检测数据和待检测基因位点数据进行赋值以得到对应的待检测分值,然后根据疾病类型从预设模型数据库中获取对应的目标疾病评估模型,则可以将待检测分值输入目标疾病评估模型进行评估以得到疾病评估结果。因此综合考虑基因位点和疾病影响因素来进行疾病评估,从而提高疾病评估的准确性。
根据本发明的一些实施例,所述方法还包括:
获取预设文献数据库中与所述疾病类型相关的多个候选基因位点的候选数据;
对所述多个候选基因位点的候选数据进行相关性和可靠性评估,以得到候选基因位点的评估值;
获取所述评估值大于预设评估阈值的所述候选基因位点作为所述目标疾病评估模型的目标基因位点。
根据本发明的一些实施例,所述对所述多个候选基因位点进行相关性和可靠性评估,以得到候选基因位点的评估值,包括:
通过ZETA信用风险模型对所述多个候选基因位点的候选数据进行相关性和可靠性评估,以得到所述候选基因位点的评估值。
根据本发明的一些实施例,所述疾病影响因素包括:不可控因素和可控因素,所述不可控因素包括:性别、年龄、患所述疾病类型的家族史;可控因素包括:疾病类型相关的疾病诊断指标。
根据本发明的一些实施例,所述目标疾病评估模型通过多个训练样本数据对预设疾病评估模型进行训练得到,包括:
获取多个训练样本数据中的训练基因位点数据、疾病影响因素的训练数据和患病概率;
根据所述预设赋值关系表对所述训练基因位点数据、所述疾病影响因素的训练数据分别进行赋值,以得到训练分值;
根据所述训练分值和所述患病概率对所述预设疾病评估模型进行训练,以得到所述目标疾病评估模型。
根据本发明的一些实施例,所述根据所述训练分值和所述患病概率对所述预设疾病评估模型进行训练,以得到所述目标疾病评估模型,包括:
根据所述训练分值代入预设线性回归模型;
根据所述患病概率调节所述预设线性回归模型,以使所述预设线性回归模型输出的预测发病概率和所述患病概率逼近,以得到所述目标疾病评估模型。
根据本发明的一些实施例,所述将所述分值输入所述目标疾病评估模型,以得到疾病评估结果,包括:
将所述待检测分值输入所述目标疾病评估模型,以得到预测发病概率;
根据所述预测发病概率和预设发病阈值确定所述疾病评估结果。
根据本发明的一些实施例,所述根据所述预测发病概率和预设发病阈值确定所述疾病评估结果,包括:
若所述预测发病概率大于所述预设发病阈值,所述疾病评估结果为患病;
若所述预测发病概率小于所述预设发病阈值,所述疾病评估结果为健康。
根据本发明的第二方面实施例的疾病风险评估装置,包括:
接收模块,用于接收待检测样本数据和疾病类型,所述待检测样本数据包括:疾病影响因素的待检测数据和待检测基因位点数据;
赋值模块,用于根据预设赋值关系表分别对所述待检测数据和所述待检测基因位点数据进行赋值,以得到所述疾病影响因素和所述待检测基因位点数据对应的待检测分值,所述预设赋值关系表包括所述疾病影响因素的数据范围、所述基因位点和待检测分值的匹配信息;
模型确定模块,用于根据所述疾病类型和预设模型数据库确定目标疾病评估模型,所述预设模型数据库包括所述疾病类型和所述目标疾病评估模型的匹配信息,所述目标疾病评估模型通过多个训练样本数据对预设疾病评估模型进行训练得到;
评估模块,用于将所述待检测分值输入所述目标疾病评估模型,以得到疾病评估结果。
根据本发明实施例的疾病风险评估装置,至少具有如下有益效果:通过对待检测数据和待检测基因位点数据进行赋值以得到对应的待检测分值,然后根据疾病类型从预设模型数据库中获取对应的目标疾病评估模型,则可以将待检测分值输入目标疾病评估模型进行评估以得到疾病评估结果。因此综合考虑基因位点和疾病影响因素来进行疾病评估,从而提高疾病评估的准确性。
根据本发明的第三方面实施例的计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上述的疾病风险评估方法。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明实施例中疾病风险评估方法的一具体实施例流程示意图;
图2是本发明实施例中疾病风险评估方法的另一具体实施例流程示意图;
图3是本发明实施例中疾病风险评估方法的另一具体实施例流程示意图;
图4是本发明实施例中疾病风险评估方法的另一具体实施例流程示意图;
图5是图4中步骤S830的一具体实施例流程示意图;
图6是图1中步骤S400的一具体实施例流程示意图;
图7是图6中步骤S420的一具体实施例流程示意图;
图8是本发明实施例中疾病风险评估装置的一具体实施例模块框图。
附图标记:
100、接收模块;200、赋值模块;300、模型确定模块;400、评估模块。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
随着人工智能机器学习等技术的快速发展,机器学习算法被运用在医疗健康的方方面面。机器学习是研究如何实用机器来模拟人类学习活动的学科。一种更为严格的定义是:机器学习是一门研究机器获取新知识和新技能,并识别现有知识的学问。机器学习主要研究的是让机器人从过去的经历中学习经验,对数据的不确定性进行建模,并在未来进行预测。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。
经过现代医学研究表明,除外伤外,几乎所有的疾病都和基因有关系。其中,复杂疾病除了基因因素相关外,还跟性别、年龄、家族史、生活环境、生活方式等密切相关。为了更加准确地评估复杂疾病的患病风险,需要将这些相关因素整合进行综合评估。然而,相关技术中,只考虑了基因因素对复杂疾病的影响,并未综合考虑基因因素和其他相关因素进行疾病的患病概率进行评估。
基于此,本申请通过根据基因位点数据和疾病影响因素综合进行患病评估,不仅限于提高基因预测患病概率,且提高患病评估的准确性。
参照图1,本发明实施例公开了一种疾病风险评估方法,包括但不限于包括步骤S100至步骤S400。
S100、接收待检测样本数据和疾病类型,待检测样本数据包括:疾病影响因素的待检测数据和待检测基因位点数据;
由于疾病的患病风险不仅与基因位点相关,且与患者的日常生活习惯、家族患病史等等相关。因此当需要对患者进行疾病评估时,需要采集患者的待检测样本数据和疾病类型,且主要采集患者的疾病影响因素的待检测数据和待检测基因位点数据。
其中,获取的待检测基因位点数据主要获取与疾病类型相关的基因位点数据。例如疾病类型为2型糖尿病,则获取患者与2型糖尿病相关的基因位点数据,以得到待检测基因位点数据。
S200、根据预设赋值关系表分别对待检测数据和待检测基因位点数据进行赋值,以得到疾病影响因素和待检测基因位点数据对应的待检测分值,预设赋值关系表包括疾病影响因素的数据范围、基因位点数据和待检测分值的匹配信息;
由于获取的待检测数据和待检测基因位点数据并不能直接进行计算以确定疾病评估结果,因此通过预设赋值关系表对待检测数据和待检测基因位点数据进行赋值,以得到对应的待检测分值,则可以直接根据多个待检测分值进行疾病评估,使得疾病评估更加简易。
S300、根据疾病类型和预设模型数据库确定目标疾病评估模型,预设模型数据库包括疾病类型和目标疾病评估模型的匹配信息,目标疾病评估模型通过多个训练样本数据对预设疾病评估模型进行训练得到;
由于预设模型数据库存储多个目标疾病评估模型和疾病类型的匹配信息,所以当接收疾病类型,根据疾病类型从预设模型数据库存储的匹配信息中获取与疾病类型匹配的目标疾病评估模型。
例如,若接收的疾病类型为2型糖尿病,则获取的目标疾病评估模型主要是用于对2型糖尿病进行评估的模型,即可通过目标疾病评估模型对待检测样本数据进行评估,以得到疾病评估结果。
S400、将待检测分值输入目标疾病评估模型,以得到疾病评估结果。
通过执行步骤S100至步骤S400,获取疾病影响因素的待检测数据和待检测基因位点数据,并根据预设赋值关系表分别对待检测数据和待检测基因位点数据进行赋值,以得到对应的待检测分值。然后根据疾病类型和预设模型数据库确定与疾病类型匹配的目标疾病评估模型,则通过将待检测数据和待检测基因位点数据输入目标疾病评估模型进行计算,以得到疾病评估结果。因此,通过综合考虑基因位点数据和待检测数据,同时采用目标疾病评估模型进行计算以得到疾病评估结果,使得疾病评估更加准确且操作简易。
在一些实施例中,参照图2,疾病风险评估方法还包括但不限于包括步骤S500至步骤S700。
S600、获取预设文献数据库中与疾病类型相关的多个候选基因位点的候选数据;
由于某一种疾病相关的基因位点很多,但是基于目前研究并没有一个疾病确定的基因位点。因此通过获取预设文献数据库中与疾病类型相关的多个候选基因位点的候选数据,其中,预设文献数据库存储预设期间对于疾病类型相关的所有文献,且预设文献数据库存储的文献主要来源于各个互联网平台,通过疾病类型获取多个互联网平台相关的文献,并将文献存储至预设文献数据库中。其中,多个互联网平台包括:知网、专利网站、谷歌网站等,在此对于互联网平台不做限制。因此,通过获取预设文献数据库中与疾病类型相关的多个候选基因位点的候选数据,主要根据基因类型获取对应文献,然后获取文献中的基因位点以得到多个候选基因位点。
其中,候选数据为候选基因位点的参数,其中,候选数据包括:候选基因位点出现在多个训练样本数据中的样本量、候选基因位点对应的文献发表的影响因子、候选基因位点对应的文献的发表时间、候选基因位点在预设文献数据库中的文献记载次数、文献所发表的平台的影响因子总和以及候选基因位点在信号通路中的具体功能。
S600、对多个候选基因位点的候选数据进行相关性和可靠性评估,以得到候选基因位点的评估值;
得到多个候选基因位点后需要确定候选基因位点是否属于影响疾病类型的基因位点,因此需要对多个候选基因位点的候选数据进行相关性和可靠性评估,以得到候选基因位点的评估值。因此,通过对每一个候选基因位点进行相关性和可靠性评估,以确定可以作为影响疾病的基因位点,也即确定预设疾病评估模型的目标基因位点。
S700、获取评估值大于预设评估阈值的候选基因位点作为目标疾病评估模型的目标基因位点。
其中,获取评估值大于预设评估阈值的候选基因位点作为目标基因位点,则根据疾病类型即可获取与目标基因位点匹配的待检测基因位点数据。
例如,若2类糖尿病的目标基因位点包括A、B、C、D、E,则根据目标基因位点获取待检测基因位点可以为B、D、E,且根据预设疾病评估模型的目标基因位点,以根据目标基因位点计算疾病评估结果。
在一些实施例中,参照图3,步骤S600可以包括但不限于包括步骤S610。
S610、通过ZETA信用风险模型对多个候选基因位点的候选数据进行相关性和可靠性评估,以得到候选基因位点的评估值。
其中,ZETA信用风险模型是继Z模型后的第二代信用评分模型,变量由原始模型的五个增加到了七个,适用范围更宽,对相关性和可靠性评估大大提高。ZETA信用风险模型为:
ZETA=ax1+bx2+cx3+dx4+ex5+fx6+gx7 (1)
式中,a、b、c、d、e、f、g,分别是该模型中各变量的系数。x1、x2、x3、x4、x5、x6、x7分别表示模型中的7个变量,此7个变量依次为:候选基因位点出现在多个训练样本数据中的样本量、候选基因位点对应的文献发表的影响因子、候选基因位点对应的文献的发表时间、候选基因位点在预设文献数据库中的文献记载次数、文献所发表的平台的影响因子总和以及候选基因位点在信号通路中的具体功能。
因此,通过将候选基因位点的候选数据输入公式(1)以进行候选基因位点的相关性和可靠性评估以得到候选基因位点的评估值。即可获取评估值大于预设评估阈值的候选基因位点作为目标基因位点,以根据目标基因位点的数据来计算疾病评估结果,从而提高疾病评估结果的准确性。
在一些实施例中,疾病影响因素包括:不可控因素和可控因素,不可控因素包括:性别、年龄、患疾病类型的家族史;可控因素包括:疾病类型相关的疾病诊断指标,其中不同的疾病类型对应疾病诊断指标不同。
由于疾病影响因素主要是疾病类型相关的因素,除了基因位点还存在其他的因素。其中,不同疾病类型对应的疾病诊断指标不同。例如,以2型糖尿病为例,2型糖尿病的疾病诊断指标主要包括:身体质量指数、血压水平、总胆固醇水平、高密度脂蛋白水平、低密度脂蛋白水平。因此,根据预设阈值关系表分别对疾病影响因素的待检测数据进行赋值,以得到疾病影响因素对应的待检测分值,即可将待检测分值输入目标疾病评估模型进行预测,以得到疾病评估结果。
在一些实施例中,参照图4,目标疾病评估模型通过多个训练样本数据对预设疾病评估模型进行训练得到,包括但不限于包括步骤S810至步骤S830。
S810、获取多个训练样本数据中的训练基因位点数据、疾病影响因素的训练数据和患病概率;
需要说明的是,每一种疾病类型都存在一个专属的分类器,以通过分类器根据预设训练样本数据库中存储的训练样本数据进行分类,以根据疾病类型划分训练样本数据。因此获取多个训练样本数据,且获取与疾病类型相关的多个训练样本数据,则获取多个训练样本数据中的训练基因位点是与疾病类型相关的基因位点,同时也需要获取与疾病类型相关的疾病影响因素的训练数据和患病概率。
其中,由于已经确定了同一种疾病类型对应的目标基因位点和疾病影响因素,所以采集的多个训练样本数据的样本数量是疾病影响因素的10-20倍,则通过多个训练样本数据进行预设疾病评估模型的训练更加准确。
S820、根据预设赋值关系表对训练基因位点数据、疾病影响因素的训练数据分别进行赋值,以得到训练分值;
需要说明的是,由于预设疾病评估模型进行训练主要是通过同一类型的数据进行数据训练得到目标疾病评估模型,所以需要根据预设赋值关系表对训练基因位点数据和疾病影响因素的训练数据进行赋值,以作为预设疾病评估模型的评估指标,从而得到目标疾病评估模型。
其中,训练基因位点数据主要是基因位点的OR值,且OR主要指病例组中暴露人数与非暴露人数的比值,是作为病例对照研究中的一个常用指标。因此,训练基因位点数据跟患病概率相关,以通过OR值确定训练基因位点是否突变,从而确定患病概率。因此根据预设赋值关系表确定训练基因位点数据对应的训练分值,主要是根据OR值确定训练基因位点数据对应的训练分值。例如,某个疾病对应的n个训练基因位点,且每个训练基因位点的OR值分别为OR1,OR2,OR3,OR4…,ORn,对应的突变概率为f1,f2,f3,…,fn,因此可以计算加权平均数,也即确定训练分值。所以根据预设赋值关系表确定训练分值为突变概率为f1,f2,f3,…,fn。由于根据OR值可以计算每个训练基因位点导致患病概率的提高倍数,所以根据预设赋值关系表确定对应的训练分值为突变概率。
例如,若疾病类型为2型糖尿病,则关于疾病影响因素对应的预设赋值关系表如表1所示,根据表1对应疾病影响因素的训练数据对应训练分值。
表1
Figure BDA0003451896540000091
Figure BDA0003451896540000101
因此,通过表1确定2型糖尿病中疾病影响因素的训练数据对应的训练分值。
S830、根据训练分值和患病概率对预设疾病评估模型进行训练,以得到目标疾病评估模型。
确定了训练基因位点数据和疾病影响因素对应的训练分值后,根据训练分值和患病概率对预设疾病评估模型进行训练,以得到可以准确进行疾病评估的目标疾病评估模型。
在一些实施例中,参照图5,预设疾病评估模型为预设线性回归模型。步骤S930可以包括但不限于包括步骤S831至步骤S832。
S831、根据训练分值代入预设线性回归模型;
S832、根据患病概率调节预设线性回归模型,以使预设线性回归模型输出的预测发病概率和患病概率逼近,以得到目标疾病评估模型。
需要说明的是,由于疾病评估需要考虑基因位点和疾病影响因素,所以需要综合考虑各种因素后再确定目标疾病评估模型。因此采用预设线性回归模型,且预设线性回归模型为Logistic回归分析模型,主要在流行病学中应用较多,比较常用的情形是探索某疾病的危险因素,根据危险因素预测某疾病发生概率。因此,将多个训练分值分别代入到预设线性回归模型的参数中,然后根据对应的患病概率调节预设线性回归模型,使得输出的预测发病概率和患病概率比较,以得到目标疾病评估模型。因此,根据不同疾病类型对应的目标疾病评估模型,使得疾病评估自动化,无需人工进行评估,既节省人力且提高疾病评估的准确性。
其中,完成目标疾病评估模型的建立后,需要验证目标疾病评估模型的准确性,以通过验证样本数据和对应的患病概率输入到目标疾病评估模型,以得到预测发病概率,根据预测发病概率和患病概率进行比对,以确定目标疾病评估模型的准确性。若验证样本数据主要有100例,则只有6例样本得到预测发病概率和患病概率不同,则目标疾病评估模型的准确性为93%。
在一些实施例中,参照图6,步骤400可以包括但不限于包括步骤S410至步骤S420。
S410、将待检测分值输入目标疾病评估模型,以得到预测发病概率;
S420、根据预测发病概率和预设发病阈值确定疾病评估结果。
需要说明的是,目标疾病评估模型输出的预测发病概率,则需要设置一个预设发病阈值,以通过预测发病概率和预设发病阈值进行比较以确定疾病评估结果。
在一些实施例中,参照图7,步骤S420可以包括但不限于包括步骤S421至步骤S422。
S421、若预测发病概率大于预设发病阈值,疾病评估结果为患病;
S422、若预测发病概率小于预设发病阈值,疾病评估结果为健康。
通过判断目标疾病评估模型输出的预测发病概率与预设发病阈值比较,若预测发病概率大于预设发病阈值,则疾病评估结果为患病,若预测发病概率小于预设发病阈值,则疾病评估结果为健康。以通过预测发病概率和预设发病阈值比较确定疾病评估结果,以直接得到疾病评估结果。
例如,若预设发病阈值为0.5,则获取十个患者患2型糖尿病的预测发病概率和对应的疾病评估结果如表2所示。
表2
Figure BDA0003451896540000111
Figure BDA0003451896540000121
因此,通过目标疾病评估模型得到预测发病概率,然后将预测发病概率和预设发病阈值比较以确定疾病评估结果,可以直观的判断患者是健康还是患病。
另外,参照图8,本发明实施例还公开了一种疾病风险评估装置,包括:接收模块100、赋值模块200、模型确定模块300和评估模块400;接收模块用于接收待检测样本数据和疾病类型,待检测样本数据包括:疾病影响因素的待检测数据和待检测基因位点数据;赋值模块用于根据预设赋值关系表分别对待检测数据和所述待检测基因位点数据进行赋值,以得到疾病影响因素和待检测基因位点数据对应的待检测分值,预设赋值关系表包括所述疾病影响因素的数据范围、基因位点和待检测分值的匹配信息;模型确定模块用于根据疾病类型和预设模型数据库确定目标疾病评估模型,预设模型数据库包括疾病类型和目标疾病评估模型的匹配信息,目标疾病评估模型通过多个训练样本数据对预设疾病评估模型进行训练得到;评估模块,用于将所述待检测分值输入所述目标疾病评估模型,以得到疾病评估结果。
通过获取疾病影响因素的待检测数据和待检测基因位点数据,并根据预设赋值关系表分别对待检测数据和待检测基因位点数据进行赋值,以得到对应的待检测分值。然后根据疾病类型和预设模型数据库确定与疾病类型匹配的目标疾病评估模型,则通过将待检测数据和待检测基因位点数据输入目标疾病评估模型进行计算,以得到疾病评估结果。因此,通过综合考虑基因位点数据和待检测数据,同时采用目标疾病评估模型进行计算以得到疾病评估结果,使得疾病评估更加准确且操作简易。
另外,本发明实施例还公开了一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上述的疾病风险评估方法。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所述技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (10)

1.一种疾病风险评估方法,其特征在于,包括:
接收待检测样本数据和疾病类型,所述待检测样本数据包括:疾病影响因素的待检测数据和待检测基因位点数据;
根据预设赋值关系表分别对所述待检测数据和所述待检测基因位点数据进行赋值,以得到所述疾病影响因素和所述待检测基因位点数据对应的待检测分值,所述预设赋值关系表包括所述疾病影响因素的数据范围、所述基因位点数据和待检测分值的匹配信息;
根据所述疾病类型和预设模型数据库确定目标疾病评估模型,所述预设模型数据库包括所述疾病类型和所述目标疾病评估模型的匹配信息,所述目标疾病评估模型通过多个训练样本数据对预设疾病评估模型进行训练得到;
将所述待检测分值输入所述目标疾病评估模型,以得到疾病评估结果。
2.根据权利要求1所述的疾病风险评估方法,其特征在于,所述方法还包括:
获取预设文献数据库中与所述疾病类型相关的多个候选基因位点的候选数据;
对所述多个候选基因位点的候选数据进行相关性和可靠性评估,以得到候选基因位点的评估值;
获取所述评估值大于预设评估阈值的所述候选基因位点作为所述目标疾病评估模型的目标基因位点。
3.根据权利要求2所述的疾病风险评估方法,其特征在于,所述对所述多个候选基因位点进行相关性和可靠性评估,以得到候选基因位点的评估值,包括:
通过ZETA信用风险模型对所述多个候选基因位点的候选数据进行相关性和可靠性评估,以得到所述候选基因位点的评估值。
4.根据权利要求1所述的疾病风险评估方法,其特征在于,所述疾病影响因素包括:不可控因素和可控因素,所述不可控因素包括:性别、年龄、患所述疾病类型的家族史;可控因素包括:疾病类型相关的疾病诊断指标。
5.根据权利要求1至4任一项所述的疾病风险评估方法,其特征在于,所述目标疾病评估模型通过多个训练样本数据对预设疾病评估模型进行训练得到,包括:
获取多个训练样本数据中的训练基因位点数据、疾病影响因素的训练数据和患病概率;
根据所述预设赋值关系表对所述训练基因位点数据、所述疾病影响因素的训练数据分别进行赋值,以得到训练分值;
根据所述训练分值和所述患病概率对所述预设疾病评估模型进行训练,以得到所述目标疾病评估模型。
6.根据权利要求5所述的疾病风险评估方法,其特征在于,所述根据所述训练分值和所述患病概率对所述预设疾病评估模型进行训练,以得到所述目标疾病评估模型,包括:
根据所述训练分值代入预设线性回归模型;
根据所述患病概率调节所述预设线性回归模型,以使所述预设线性回归模型输出的预测发病概率和所述患病概率逼近,以得到所述目标疾病评估模型。
7.根据权利要求1至4任一项所述的疾病风险评估方法,其特征在于,所述将所述分值输入所述目标疾病评估模型,以得到疾病评估结果,包括:
将所述待检测分值输入所述目标疾病评估模型,以得到预测发病概率;
根据所述预测发病概率和预设发病阈值确定所述疾病评估结果。
8.根据权利要求7所述的疾病风险评估方法,其特征在于,所述根据所述预测发病概率和预设发病阈值确定所述疾病评估结果,包括:
若所述预测发病概率大于所述预设发病阈值,所述疾病评估结果为患病;
若所述预测发病概率小于所述预设发病阈值,所述疾病评估结果为健康。
9.一种疾病风险评估装置,其特征在于,包括:
接收模块,用于接收待检测样本数据和疾病类型,所述待检测样本数据包括:疾病影响因素的待检测数据和待检测基因位点数据;
赋值模块,用于根据预设赋值关系表分别对所述待检测数据和所述待检测基因位点数据进行赋值,以得到所述疾病影响因素和所述待检测基因位点数据对应的待检测分值,所述预设赋值关系表包括所述疾病影响因素的数据范围、所述基因位点和待检测分值的匹配信息;
模型确定模块,用于根据所述疾病类型和预设模型数据库确定目标疾病评估模型,所述预设模型数据库包括所述疾病类型和所述目标疾病评估模型的匹配信息,所述目标疾病评估模型通过多个训练样本数据对预设疾病评估模型进行训练得到;
评估模块,用于将所述待检测分值输入所述目标疾病评估模型,以得到疾病评估结果。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至8任一项所述的疾病风险评估方法。
CN202111675675.2A 2021-12-31 2021-12-31 疾病风险评估方法、装置及存储介质 Pending CN114373546A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111675675.2A CN114373546A (zh) 2021-12-31 2021-12-31 疾病风险评估方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111675675.2A CN114373546A (zh) 2021-12-31 2021-12-31 疾病风险评估方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN114373546A true CN114373546A (zh) 2022-04-19

Family

ID=81142904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111675675.2A Pending CN114373546A (zh) 2021-12-31 2021-12-31 疾病风险评估方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN114373546A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117423451A (zh) * 2023-12-19 2024-01-19 菏泽德康医学检验所有限公司 一种基于大数据分析的智能分子诊断方法及系统
CN118155710A (zh) * 2024-03-26 2024-06-07 中山大学孙逸仙纪念医院 一种遗传病风险智能评估系统
CN118155710B (zh) * 2024-03-26 2024-10-25 中山大学孙逸仙纪念医院 一种遗传病风险智能评估系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117423451A (zh) * 2023-12-19 2024-01-19 菏泽德康医学检验所有限公司 一种基于大数据分析的智能分子诊断方法及系统
CN117423451B (zh) * 2023-12-19 2024-05-03 菏泽德康医学检验所有限公司 一种基于大数据分析的智能分子诊断方法及系统
CN118155710A (zh) * 2024-03-26 2024-06-07 中山大学孙逸仙纪念医院 一种遗传病风险智能评估系统
CN118155710B (zh) * 2024-03-26 2024-10-25 中山大学孙逸仙纪念医院 一种遗传病风险智能评估系统

Similar Documents

Publication Publication Date Title
US9997260B2 (en) Retrieval of similar patient cases based on disease probability vectors
US9996889B2 (en) Identifying group and individual-level risk factors via risk-driven patient stratification
CN112599218B (zh) 药物敏感预测模型的训练方法、预测方法及相关装置
CN110197720A (zh) 糖尿病的预测方法及装置、存储介质、计算机设备
US20180211727A1 (en) Automated Evidence Based Identification of Medical Conditions and Evaluation of Health and Financial Benefits Of Health Management Intervention Programs
CN112017789B (zh) 分诊数据处理方法、装置、设备及介质
RU2011116406A (ru) Система и способ для объединения клинических признаков и признаков изображений для диагностики с применением компьютера
JP2023526241A (ja) 複数の機械学習モデルに基づく臨床予測器
CN112183572B (zh) 一种生成预测肺炎严重程度的预测模型的方法及装置
US20240331813A1 (en) Computer-implemented method and device for carrying out a medical laboratory value analysis
CN113539460A (zh) 用于远程医疗平台的智能导诊方法和装置
CN111091907A (zh) 基于相似病例库的健康医疗知识检索方法和系统
CN114373546A (zh) 疾病风险评估方法、装置及存储介质
CN117152827A (zh) 一种近视预测模型的训练方法、近视预测方法及装置
CN115239945A (zh) 图像标注可靠性预测方法、装置、电子设备及存储介质
CN112382382B (zh) 一种代价敏感的集成学习分类方法及系统
CN111968740B (zh) 一种诊断标签推荐方法、装置、存储介质及电子设备
KR20050043869A (ko) 적응 퍼지-뉴럴 네트워크를 이용한 유방암 자동 진단기의개발
CN115188475A (zh) 一种狼疮肾炎患者风险预测方法
US20240055121A1 (en) Diagnostic Tool
CN112669973B (zh) 基于大数据深度学习的疾病协同递进预测方法和机器人
US20230070796A1 (en) Method for evaluating results of an automatic classification
CN108510350A (zh) 融合多平台征信数据的征信分析方法、装置及终端
CN113066580A (zh) 一种医疗评分确定方法、装置、电子设备及存储介质
EP3839970A1 (en) Estimating the risk of a subject reaching a particular medical outcome

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination