CN112768064A - 疾病预测装置及设备、症状信息处理方法、装置及设备 - Google Patents

疾病预测装置及设备、症状信息处理方法、装置及设备 Download PDF

Info

Publication number
CN112768064A
CN112768064A CN202110106243.3A CN202110106243A CN112768064A CN 112768064 A CN112768064 A CN 112768064A CN 202110106243 A CN202110106243 A CN 202110106243A CN 112768064 A CN112768064 A CN 112768064A
Authority
CN
China
Prior art keywords
symptom
target disease
target
disease
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110106243.3A
Other languages
English (en)
Inventor
何峻青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202110106243.3A priority Critical patent/CN112768064A/zh
Publication of CN112768064A publication Critical patent/CN112768064A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本申请公开了一种疾病预测装置及设备,症状信息处理方法、装置及设备。疾病预测装置通过第一获取单元,获取用户当前症状特征集合。通过第二获取单元,从医疗知识图谱中获取目标疾病的先验概率及在目标疾病下的各症状特征的条件概率。通过第一计算单元,根据目标疾病的先验概率、目标疾病条件下各症状特征的条件概率及各症状特征的特征值,计算目标疾病的评估值。通过预测单元对得到评估值的各疾病按照评估值进行排序,将排序符合条件的疾病确定为用户当前症状特征集合对应的预测疾病。基于医疗知识图谱进行疾病预测,无需使用标注数据进行模型训练,减少成本。利用医疗知识图谱中先验概率、条件概率计算目标疾病的评估值,提高疾病预测的准确度。

Description

疾病预测装置及设备、症状信息处理方法、装置及设备
技术领域
本申请涉及数据处理技术领域,具体涉及一种疾病预测装置及设备,一种症状信息处理方法、装置及设备。
背景技术
自动问诊系统用于在线向用户提供问诊服务。用户可以将出现的症状输入至自动问诊系统,得到自动问诊系统输出的该症状可能对应的疾病,以便用户可以根据得到的疾病进行后续的就医或者是自行治疗。
目前,自动问诊系统中对于疾病的预测一般是基于大量的标注数据建立机器学习模型或者神经网络模型实现的,建立机器学习模型或者神经网络模型所需要的成本较高,训练时间较长。并且,自动问诊系统中疾病预测的准确程度,容易受到标注数据质量的影响。
发明内容
有鉴于此,本申请实施例提供一种疾病预测装置及设备,一种症状信息处理方法、装置及设备,可以通过较低成本实现对于疾病的准确预测。
为解决上述问题,本申请实施例提供的技术方案如下:
一种疾病预测装置,所述装置包括:
第一获取单元,用于获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
第二获取单元,用于从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
第一计算单元,用于根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
预测单元,用于对得到所述评估值的各个疾病按照所述评估值进行排序,将排序符合预设条件的疾病确定为所述用户当前症状特征集合对应的预测疾病。
在一种可能的实现方式中,所述第一计算单元,包括:
确定子单元,用于将所述在目标疾病的条件下目标症状特征的条件概率与所述目标症状特征对应的特征值相乘,得到在目标疾病的条件下所述目标症状特征的概率值;所述目标症状特征分别为所述用户当前症状特征集合包括的症状特征的每一个;
第一计算子单元,用于根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值。
在一种可能的实现方式中,所述第一计算子单元,包括:
第二计算子单元,用于将各个大于零的在目标疾病的条件下症状特征的概率值连乘,得到的乘积再与所述目标疾病的先验概率相乘,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述第一计算子单元,包括:
第三计算子单元,用于分别计算各个大于零的在目标疾病的条件下症状特征的概率值取对数后的第一对数值;
第四计算子单元,用于计算所述目标疾病的先验概率取对数后的第二对数值;
第五计算子单元,用于将各个所述第一对数值相加后再与所述第二对数值相加,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述第一计算子单元,包括:
第一转换子单元,用于将各个大于零的在目标疾病的条件下症状特征的概率值分别作为目标函数的变量,得到所述目标函数的第一函数值;
第二转换子单元,用于将所述目标疾病的先验概率作为所述目标函数的变量,得到所述目标函数的第二函数值;
第六计算子单元,用于将各个所述第一函数值相加后再与所述第二函数值相加,得到所述目标疾病的评估值;
所述目标函数满足在变量大于零的区间内单调递增,且函数值的增幅随变量的增大而增大。
在一种可能的实现方式中,所述装置还包括:
第三获取单元,用于从所述医疗知识图谱中获取所述目标疾病在所述用户所属年龄区间的年龄影响系数;
第二计算单元,用于将得到的所述目标疾病的评估值与所述年龄影响系数相加,更新所述目标疾病的评估值。
在一种可能的实现方式中,所述装置还包括:
第四获取单元,用于从所述医疗知识图谱中获取疾病预测规则信息,所述疾病预测规则信息包括条件与动作的对应关系,所述条件为目标症状特征对应的目标特征值,所述动作为对相应疾病的评估值的处理方式;
第一判断单元,用于判断所述用户当前症状特征集合中是否存在符合目标条件的症状特征;所述目标条件为所述条件中的任一条;
第一处理单元,用于如果所述第一判断单元的判断结果为是,确定所述用户当前症状特征集合中符合所述目标条件的症状特征,获取所述目标条件对应的目标动作中的相应疾病,将所述目标动作中的相应疾病的评估值按照该相应疾病的评估值的处理方式进行处理,更新该相应疾病的评估值。
一种症状信息处理方法,所述方法包括:
获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
对得到所述评估值的各个疾病按照所述评估值进行排序。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值,包括:
将所述在目标疾病的条件下目标症状特征的条件概率与所述目标症状特征对应的特征值相乘,得到在目标疾病的条件下所述目标症状特征的概率值;所述目标症状特征分别为所述用户当前症状特征集合包括的症状特征的每一个;
根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值连乘,得到的乘积再与所述目标疾病的先验概率相乘,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
分别计算各个大于零的在目标疾病的条件下症状特征的概率值取对数后的第一对数值;
计算所述目标疾病的先验概率取对数后的第二对数值;
将各个所述第一对数值相加后再与所述第二对数值相加,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值分别作为目标函数的变量,得到所述目标函数的第一函数值;
将所述目标疾病的先验概率作为所述目标函数的变量,得到所述目标函数的第二函数值;
将各个所述第一函数值相加后再与所述第二函数值相加,得到所述目标疾病的评估值;
所述目标函数满足在变量大于零的区间内单调递增,且函数值的增幅随变量的增大而增大。
在一种可能的实现方式中,所述方法还包括:
从所述医疗知识图谱中获取所述目标疾病在所述用户所属年龄区间的年龄影响系数;
将得到的所述目标疾病的评估值与所述年龄影响系数相加,更新所述目标疾病的评估值。
在一种可能的实现方式中,所述方法还包括:
从所述医疗知识图谱中获取疾病预测规则信息,所述疾病预测规则信息包括条件与动作的对应关系,所述条件为目标症状特征对应的目标特征值,所述动作为对相应疾病的评估值的处理方式;
判断所述用户当前症状特征集合中是否存在所述目标症状特征对应的目标特征值;
如果判断结果为是,将得到的相应疾病的评估值按照所述相应疾病的评估值的处理方式进行处理,重新得到所述相应疾病的评估值。
一种疾病预测设备,所述设备包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
对得到所述评估值的各个疾病按照所述评估值进行排序,将排序符合预设条件的疾病确定为所述用户当前症状特征集合对应的预测疾病。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值,包括:
将所述在目标疾病的条件下目标症状特征的条件概率与所述目标症状特征对应的特征值相乘,得到在目标疾病的条件下所述目标症状特征的概率值;所述目标症状特征分别为所述用户当前症状特征集合包括的症状特征的每一个;
根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值连乘,再与所述目标疾病的先验概率相乘,得到的乘积得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
分别计算各个大于零的在目标疾病的条件下症状特征的概率值取对数后的第一对数值;
计算所述目标疾病的先验概率取对数后的第二对数值;
将各个所述第一对数值相加后再与所述第二对数值相加,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值分别作为目标函数的变量,得到所述目标函数的第一函数值;
将所述目标疾病的先验概率作为所述目标函数的变量,得到所述目标函数的第二函数值;
将各个所述第一函数值相加后再与所述第二函数值相加,得到所述目标疾病的评估值;
所述目标函数满足在变量大于零的区间内单调递增,且函数值的增幅随变量的增大而增大。
在一种可能的实现方式中,所述指令还包括:
从所述医疗知识图谱中获取所述目标疾病在所述用户所属年龄区间的年龄影响系数;
将得到的所述目标疾病的评估值与所述年龄影响系数相加,更新所述目标疾病的评估值。
在一种可能的实现方式中,所述指令还包括:
从所述医疗知识图谱中获取疾病预测规则信息,所述疾病预测规则信息包括条件与动作的对应关系,所述条件为目标症状特征对应的目标特征值,所述动作为对相应疾病的评估值的处理方式;
判断所述用户当前症状特征集合中是否存在符合目标条件的症状特征;所述目标条件为所述条件中的任一条;
如果判断结果为是,确定所述用户当前症状特征集合中符合所述目标条件的症状特征,获取所述目标条件对应的目标动作中的相应疾病,将所述目标动作中的相应疾病的评估值按照该相应疾病的评估值的处理方式进行处理,更新该相应疾病的评估值。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种疾病预测方法,所述方法包括:
获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
从医疗知识图谱中获取目标疾病的先验概率并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
对得到所述评估值的各个疾病按照所述评估值进行排序,将排序符合预设条件的疾病确定为所述用户当前症状特征集合对应的预测疾病。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值,包括:
将所述在目标疾病的条件下目标症状特征的条件概率与所述目标症状特征对应的特征值相乘,得到在目标疾病的条件下所述目标症状特征的概率值;所述目标症状特征分别为所述用户当前症状特征集合包括的症状特征的每一个;
根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值连乘,得到的乘积再与所述目标疾病的先验概率相乘,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
分别计算各个大于零的在目标疾病的条件下症状特征的概率值取对数后的第一对数值;
计算所述目标疾病的先验概率取对数后的第二对数值;
将各个所述第一对数值相加后再与所述第二对数值相加,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值分别作为目标函数的变量,得到所述目标函数的第一函数值;
将所述目标疾病的先验概率作为所述目标函数的变量,得到所述目标函数的第二函数值;
将各个所述第一函数值相加后再与所述第二函数值相加,得到所述目标疾病的评估值;
所述目标函数满足在变量大于零的区间内单调递增,且函数值的增幅随变量的增大而增大。
在一种可能的实现方式中,所述疾病预测方法还包括:
从所述医疗知识图谱中获取所述目标疾病在所述用户所属年龄区间的年龄影响系数;
将得到的所述目标疾病的评估值与所述年龄影响系数相加,更新得到所述目标疾病的评估值。
在一种可能的实现方式中,所述疾病预测方法还包括:
从所述医疗知识图谱中获取疾病预测规则信息,所述疾病预测规则信息包括条件与动作的对应关系,所述条件为目标症状特征对应的目标特征值,所述动作为对相应疾病的评估值的处理方式;
判断所述用户当前症状特征集合中是否存在符合目标条件的症状特征;所述目标条件为所述条件中的任一条;
如果判断结果为是,确定所述用户当前症状特征集合中符合所述目标条件的症状特征,获取所述目标条件对应的目标动作中的相应疾病,将所述目标动作中的相应疾病的评估值按照该相应疾病的评估值的处理方式进行处理,更新该相应疾病的评估值。
一种症状信息处理装置,所述装置包括:
第五获取单元,用于获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
第六获取单元,用于从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
第三计算单元,用于根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
排序单元,用于对得到所述评估值的各个疾病按照所述评估值进行排序。
在一种可能的实现方式中,所述第三计算单元,包括:
概率值计算子单元,用于将所述在目标疾病的条件下目标症状特征的条件概率与所述目标症状特征对应的特征值相乘,得到在目标疾病的条件下所述目标症状特征的概率值;所述目标症状特征分别为所述用户当前症状特征集合包括的症状特征的每一个;
第一评估值计算子单元,用于根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值。
在一种可能的实现方式中,所述第一评估值计算子单元,包括:
第二评估值计算子单元,用于将各个大于零的在目标疾病的条件下症状特征的概率值连乘,得到的乘积再与所述目标疾病的先验概率相乘,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述第一评估值计算子单元,包括:
第一对数值计算子单元,用于分别计算各个大于零的在目标疾病的条件下症状特征的概率值取对数后的第一对数值;
第二对数值计算子单元,用于计算所述目标疾病的先验概率取对数后的第二对数值;
第三评估值计算子单元,用于将各个所述第一对数值相加后再与所述第二对数值相加,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述第一评估值计算子单元,包括:
第一函数值计算子单元,用于将各个大于零的在目标疾病的条件下症状特征的概率值分别作为目标函数的变量,得到所述目标函数的第一函数值;
第二函数值计算子单元,用于将所述目标疾病的先验概率作为所述目标函数的变量,得到所述目标函数的第二函数值;
第四评估值计算子单元,用于将各个所述第一函数值相加后再与所述第二函数值相加,得到所述目标疾病的评估值;
所述目标函数满足在变量大于零的区间内单调递增,且函数值的增幅随变量的增大而增大。
在一种可能的实现方式中,所述装置还包括:
第七获取单元,用于从所述医疗知识图谱中获取所述目标疾病在所述用户所属年龄区间的年龄影响系数;
第四计算单元,用于将得到的所述目标疾病的评估值与所述年龄影响系数相加,更新所述目标疾病的评估值。
在一种可能的实现方式中,所述装置还包括:
第八获取单元,用于从所述医疗知识图谱中获取疾病预测规则信息,所述疾病预测规则信息包括条件与动作的对应关系,所述条件为目标症状特征对应的目标特征值,所述动作为对相应疾病的评估值的处理方式;
第二判断单元,用于判断所述用户当前症状特征集合中是否存在符合目标条件的症状特征;所述目标条件为所述条件中的任一条;
第二处理单元,用于如果所述第二判断单元的判断结果为是,确定所述用户当前症状特征集合中符合所述目标条件的症状特征,获取所述目标条件对应的目标动作中的相应疾病,将所述目标动作中的相应疾病的评估值按照该相应疾病的评估值的处理方式进行处理,更新该相应疾病的评估值。
一种症状信息处理设备,所述设备包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
对得到所述评估值的各个疾病按照所述评估值进行排序。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值,包括:
将所述在目标疾病的条件下目标症状特征的条件概率与所述目标症状特征对应的特征值相乘,得到在目标疾病的条件下所述目标症状特征的概率值;所述目标症状特征分别为所述用户当前症状特征集合包括的症状特征的每一个;
根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值连乘,得到的乘积再与所述目标疾病的先验概率相乘,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
分别计算各个大于零的在目标疾病的条件下症状特征的概率值取对数后的第一对数值;
计算所述目标疾病的先验概率取对数后的第二对数值;
将各个所述第一对数值相加后再与所述第二对数值相加,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值分别作为目标函数的变量,得到所述目标函数的第一函数值;
将所述目标疾病的先验概率作为所述目标函数的变量,得到所述目标函数的第二函数值;
将各个所述第一函数值相加后再与所述第二函数值相加,得到所述目标疾病的评估值;
所述目标函数满足在变量大于零的区间内单调递增,且函数值的增幅随变量的增大而增大。
在一种可能的实现方式中,所述指令还包括:
从所述医疗知识图谱中获取所述目标疾病在所述用户所属年龄区间的年龄影响系数;
将得到的所述目标疾病的评估值与所述年龄影响系数相加,更新所述目标疾病的评估值。
在一种可能的实现方式中,所述指令还包括:
从所述医疗知识图谱中获取疾病预测规则信息,所述疾病预测规则信息包括条件与动作的对应关系,所述条件为目标症状特征对应的目标特征值,所述动作为对相应疾病的评估值的处理方式;
判断所述用户当前症状特征集合中是否存在符合目标条件的症状特征;所述目标条件为所述条件中的任一条;
如果判断结果为是,确定所述用户当前症状特征集合中符合所述目标条件的症状特征,获取所述目标条件对应的目标动作中的相应疾病,将所述目标动作中的相应疾病的评估值按照该相应疾病的评估值的处理方式进行处理,更新该相应疾病的评估值。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够实现上述症状信息处理方法。
由此可见,本申请实施例具有如下有益效果:
本申请实施例提供一种疾病预测装置及设备,先通过第一获取单元,获取用户当前症状特征集合,可以确定用户的当前疾病的症状特征以及是否出现对应的症状特征。再通过第二获取单元,从医疗知识图谱中获取目标疾病的先验概率以及在目标疾病下的各个症状特征的条件概率。之后,通过第一计算单元,根据目标疾病的先验概率、目标疾病条件下各个症状特征的条件概率以及各个症状特征对应的特征值,可以计算得到目标疾病的评估值。如此可以实现利用医疗知识图谱中的先验概率和条件概率进行目标疾病所对应的评估值的计算,无需使用标注数据进行机器学习模型或者神经网络模型模型的训练,减少了建立疾病预测装置的成本。最后,通过预测单元对得到评估值的各个疾病按照评估值进行排序,将排序符合预设条件的疾病确定为用户当前症状特征集合对应的预测疾病。基于较为准确的医疗知识图谱中的知识以及利用先验概率、条件概率计算目标疾病的评估值进行疾病预测可以提高疾病预测装置的准确程度,实现高准确度的疾病预测。
附图说明
图1为本申请实施例提供的一种疾病预测装置的示例性应用场景的框架示意图;
图2为本申请实施例提供的一种疾病预测装置的结构示意图;
图3为本申请实施例提供的一种症状信息处理方法的流程图;
图4为本申请实施例提供的一种设备的结构示意图;
图5是申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。
为便于理解本申请提供的技术方案,下面将先对本申请的背景技术进行说明。
发明人在对传统的疾病预测系统进行研究后发现,目前的疾病预测系统大多是采用数据驱动的方式形成的。先获取大量的病历数据,对病历数据进行标注,利用标注数据训练生成对应的机器学习模型或者神经网络模型。利用得到的机器学习模型或者神经网络模型进行疾病的预测。对病历数据的处理和标记需要耗费大量的成本,并且基于数据驱动方法建立的疾病预测系统的准确度受到病历数据本身质量的影响。在病历数据质量较差的基础上,得到的疾病预测系统的准确度较低。
基于此,本申请实施例提供一种疾病预测装置,装置包括:第一获取单元,用于获取用户当前症状特征集合,用户当前症状特征集合包括至少一个症状特征以及各个症状特征对应的特征值;症状特征对应的特征值表征是否出现该症状特征;第二获取单元,用于从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征对应的特征值的条件概率;目标疾病为医疗知识图谱包括的疾病集合中的任一个;第一计算单元,用于根据目标疾病的先验概率、在目标疾病的条件下各个症状特征对应的特征值的条件概率以及各个症状特征对应的特征值,计算目标疾病的评估值;预测单元,用于对得到评估值的各个疾病按照评估值进行排序,将排序符合预设条件的疾病确定为用户当前症状特征集合对应的预测疾病。该疾病预测装置基于医疗知识图谱进行疾病预测,降低了建立疾病预测装置所花费的成本,提高了疾病预测装置预测疾病的准确性。
为了便于理解本申请实施例提供的疾病预测装置,下面先结合图1对本申请实施例提供的疾病预测装置的应用场景进行说明。其中,图1为本申请实施例提供的一种疾病预测装置的示例性应用场景的框架示意图。本申请实施例提供的疾病预测装置可以建立于服务器。
在实际应用中,疾病预测装置10获取用户通过客户端20输入的病症信息,获取用户当前症状特征集合,用户当前症状特征集合中具有当前疾病的至少一个症状特征以及各个症状特征对应的特征值。疾病预测装置10从医疗知识图谱中获取目标疾病的先验概率以及在目标疾病的条件下各个症状特征的条件概率;根据目标疾病的先验概率、在目标疾病的条件下各个症状特征对应的特征值的条件概率以及各个症状特征对应的特征值,计算目标疾病的评估值。最后利用评估值对各个疾病进行排序,并将符合预设条件的疾病确定为当前基本特征集合对应的预测疾病。疾病预测装置10将得到的预测疾病通过反馈信息反馈至客户端20,客户端20可以根据反馈信息显示预测疾病。
本领域技术人员可以理解,图1所示的框架示意图仅是本申请的实施方式可以在其中得以实现的一个示例。本申请实施方式的适用范围不受到该框架任何方面的限制。
需要注意的是,客户端20所在的用户终端可以是现有的、正在研发的或将来研发的、能够通过任何形式的有线和/或无线连接(例如,Wi-Fi、LAN、蜂窝、同轴电缆等)相互交互的任何用户设备,包括但不限于:现有的、正在研发的或将来研发的智能可穿戴设备、智能手机、非智能手机、平板电脑、膝上型个人计算机、桌面型个人计算机、小型计算机、中型计算机、大型计算机等。本申请的实施方式在此方面不受任何限制。还需要注意的是,本申请实施例中疾病预测装置10所在的服务器可以是现有的、正在研发的或将来研发的、能够执行上述操作的设备的一个示例。本申请的实施方式在此方面不受任何限制。
为便于理解本申请实施例提供的技术方案,下面将结合附图对本申请实施例提供的疾病预测装置进行说明。
参见图2,该图为本申请实施例提供的一种疾病预测装置的结构示意图,如图2所示,疾病预测装置包括:
第一获取单元201,用于获取用户当前症状特征集合,用户当前症状特征集合包括至少一个症状特征以及各个症状特征对应的特征值;症状特征对应的特征值表征是否出现该症状特征。
用户当前症状特征集合是根据用户的输入信息确定的。用户输入的信息一般包括用户对自己当前出现的症状特征进行描述的内容。
用户当前症状特征集合中包括至少一个症状特征以及各个症状特征对应的特征值。其中,症状特征可以是具体的疾病症状以及风险因子。疾病症状是指出现的症状,例如,发烧、咳嗽、消化不良等等。风险因子是指与症状相关的其他因素,具体可以包括家族病史、患者病史、接触史以及诱因等。各个症状特征具有对应的特征值,特征值用于表示是否出现该症状特征。特征值具体取值可以为1、0和-1,其中,1可以表示出现该症状特征,0表示不确定是否出现该症状特征,-1表示没有出现该症状特征。
在一种具体的场景中,用户当前症状特征集合可以是通过线上问诊得到的。客户端可以向用户显示症状特征以及对应的是否出现的选项,以便用户进行选择。例如,可以向用户显示“发烧”以及对应的“出现”、“未出现”以及“不清楚”的按键,以便用户通过触发相应的按键确定“发烧”这一症状特征对应的特征值。
在另一种具体的场景中,可以根据获取的用户输入的文本进行文本提取,得到对应的症状特征以及症状特征对应的特征值。例如,用户输入的文本为“出现咳嗽和流鼻涕的症状,但是没有发烧”,对用户输入文本进行提取后可以得到“咳嗽”、“流鼻涕”和“发烧”的症状特征,对应的特征值为“1”、“1”和“-1”。
第二获取单元202,用于从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;目标疾病为医疗知识图谱包括的疾病集合中的任一个。
医疗知识图谱是基于医疗知识建立的,医疗知识可以来源于医学书籍、医学文章、医学网页信息以及医生经验等。
医疗知识图谱中具有各个疾病的先验概率,先验概率是指该疾病在临床中出现的占比。先验概率可以通过医院中的诊断数据、流行病学调查、医学书籍以及医生经验等计算得到。
医疗知识图谱中还具有在各个疾病的条件下各个症状特征的条件概率,即具有在任一疾病的条件下任一症状特征的条件概率,用于表示在该疾病出现的条件下该症状特征出现的概率值。
将医疗知识图谱包括的疾病集合中的任一个疾病作为目标疾病,获取目标疾病的先验概率,和在目标疾病的条件下当前症状特征集合中各个症状特征的条件概率,以便利用先验概率和条件概率计算目标疾病的评估值。
第一计算单元203,用于根据目标疾病的先验概率、在目标疾病的条件下各个症状特征的条件概率以及各个症状特征对应的特征值,计算目标疾病的评估值。
利用从医疗知识图谱中获取得到的目标疾病条件下各个症状特征的条件概率和各个症状特征对应的特征值,可以计算得到在目标疾病条件下各个症状特征对应的特征值所对应的条件概率。再根据目标疾病的先验概率可以计算得到目标疾病的评估值。目标疾病的评估值用于评估用户当前症状特征集合对应的疾病是否为目标疾病。
本申请实施例提供了三种第一计算单元203实现计算目标疾病的评估值的具体实施方式,请参见下文。
预测单元204,用于对得到评估值的各个疾病按照评估值进行排序,将排序符合预设条件的疾病确定为用户当前症状特征集合对应的预测疾病。
对具有评估值的各个疾病按照评估值的大小进行排序,从排序后的疾病中选取符合预设条件的疾病作为用户当前症状特征集合所对应的预测疾病。本申请实施例中不限定具体的预设条件,预设条件可以根据所选择的预测疾病进行设置,例如,预设条件可以是选取预测疾病的个数,也可以是评估值的阈值等。
基于上述内容可知,本申请实施例提供的疾病预测装置,基于医疗知识图谱实现对获取的用户当前症状特征集合进行对应的疾病预测。如此可以减少建立疾病预测装置所需的成本,并且提高疾病预测装置预测疾病的准确程度。
在一种可能的实现方式中,第一计算单元203,包括:确定子单元和第一计算子单元。
确定子单元,用于将在目标疾病的条件下目标症状特征的条件概率与目标症状特征对应的特征值相乘,得到在目标疾病的条件下目标症状特征的概率值;目标症状特征分别为用户当前症状特征集合包括的症状特征的每一个;
第一计算子单元,用于根据目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算目标疾病的评估值。
症状特征可以是与目标疾病相关联的症状特征。可以理解的是,部分特征在具有目标疾病时出现,此类症状特征可以属于阳性症状特征。而部分症状特征在具有目标疾病时必定不会出现,此类症状特征可以属于阴性症状特征。
将用户当前症状特征集合中的每一个症状特征分别作为目标症状特征,将目标疾病条件下目标症状特征的条件概率与该目标症状特征对应的特征值相乘,可以得到在目标疾病的条件下目标症状特征的概率值。其中,目标症状特征的特征值的取值可以为“1”、“0”和“-1”,特征值“1”表示目标症状特征出现,“0”表示不清楚目标症状特征是否出现,“-1”表示目标症状特征不出现。通过计算目标疾病条件下目标症状特征的条件概率与目标症状特征对应的特征值相乘,可以得到在目标疾病出现的情况下目标症状特征出现的概率值。
在一种可能的实现方式中,对于阳性症状特征,在目标症状特征出现时表示用户可能具有目标疾病,则在目标疾病条件下目标症状特征的条件概率是大于零的正数。当目标症状特征对应的特征值为“1”时,可以利用目标疾病条件下目标症状特征的条件概率与“1”相乘,得到的概率值大于零,用于进行目标疾病的评估。当目标症状特征对应的特征值为“0”时,利用目标疾病条件下目标症状特征的条件概率与“0”相乘,得到的概率值等于零,不用于进行目标疾病的评估。当目标症状特征对应的特征值为“-1”时,利用目标疾病条件下目标症状特征的条件概率与“-1”相乘,得到的概率值小于零,不用于进行目标疾病的评估。
对于阴性症状特征,在目标症状特征为不出现时表示用户可能具有目标疾病,则在目标疾病条件下目标症状特征的条件概率是小于零的负数。当目标症状特征对应的特征值为“-1”时,可以利用目标疾病条件下目标症状特征的条件概率与“-1”相乘,得到的概率值大于零,用于进行目标疾病的评估。当目标症状特征对应的特征值为“0”时,利用目标疾病条件下目标症状特征的条件概率与“0”相乘,得到的概率值等于零,不用于进行目标疾病的评估。当目标症状特征对应的特征值为“1”时,利用目标疾病条件下目标症状特征的条件概率与“1”相乘,得到的概率值小于零,不用于进行目标疾病的评估。
因此,利用目标疾病的先验概率和大于零的目标疾病的条件下症状特征的概率值,计算得到目标疾病的评估值。可以将与确定目标疾病评估无关的概率值去除,能够满足多种症状特征对应的概率值的计算需要,得到更为准确的评估值。
基于上述内容可知,通过选取大于零的目标疾病的条件下症状特征的概率值可以实现对于概率值的筛选,选取可以有效评估目标疾病的概率值。如此计算得到的目标疾病的评估值可以更加准确地用于预测疾病。
进一步的,第一计算子单元可以有多种具体实施方式。
在第一种可能的实现方式中,第一计算子单元包括:第二计算子单元。
第二计算子单元,用于将各个大于零的在目标疾病的条件下症状特征的概率值连乘,得到的乘积再与目标疾病的先验概率相乘,得到目标疾病的评估值。
将各个大于零的在目标疾病的条件下症状特征的概率值连乘,得到各个症状特征在目标疾病条件下共同出现的概率值。再将连乘得到的概率值与目标疾病的先验概率相乘,得到用户当前症状特征集合对应的疾病是目标疾病的概率值,也就是目标疾病的评估值。例如,当医疗知识图谱中的疾病集合为D={d1,d2…dn},其中,dj为疾病,j的取值范围为1至n,n为大于或者等于1的整数。用户当前症状特征集合为A={f1=x1,fi=xi,…,fz=xz},其中fi为症状特征,xi为特征值,i的取值范围为1至z,z为大于或者等于1的整数,xi的取值范围为{1,0,-1}。在目标疾病的条件下各个症状特征出现的条件概率为p(fi|dj),将p(fi|dj)与各个症状特征对应的特征值相乘,得到目标疾病的条件下各个症状特征的概率值p′(fi|dj)。需要注意的是,当某一目标症状特征未与目标疾病对应,即该目标症状特征不在目标疾病的症状特征列表中,代表该目标症状特征基本上不会在目标疾病中出现,则可以将在目标疾病条件下该目标症状特征的条件概率设置为很小的正数值,例如0.0001。
评估值的计算公式可以由公式(1)表示:
Figure BDA0002917511400000131
其中,P(dj|A)表示目标疾病的评估值,P(dj)表示目标疾病的先验概率,P(A)表示用户当前症状特征集合中各个症状特征共同出现的概率;p′(fi|dj)为在目标疾病的条件下各个症状特征的概率值,i的取值范围为1至z,z为大于或者等于1的整数。
对于同一个用户当前症状特征集合,包括的各个症状特征共同出现的概率是相同的。因此基于同一个用户当前症状特征集合计算不同目标疾病的评估值时,公式(1)中P(A)的数值是相同的,不影响各个目标疾病的评估值排序的顺序。因此,可以对公式(1)进行简化,得到公式(2)。
Figure BDA0002917511400000141
其中,∝表示正比例关系。如此通过各个大于零的概率值连乘计算,可以得到目标疾病的评估值是具有一定数值的正数,以便后续利用评估值对目标疾病进行排序。
概率值和先验概率的取值范围为0到1,通过乘法运算后得到的数值较低,可能出现位数溢出的问题,导致各个目标疾病的评估值在精度范围内相同,影响目标疾病的评估值的排序。并且乘法运算的计算效率较低,计算过程较为复杂,不能实现较为简单的快速运算。
基于此,本申请实施例提供第二种第一计算子单元的具体实施方式,第一计算子单元,包括:第三计算子单元、第四计算子单元和第五计算子单元。
第三计算子单元,用于分别计算各个大于零的在目标疾病的条件下症状特征的概率值取对数后的第一对数值。
第四计算子单元,用于计算目标疾病的先验概率取对数后的第二对数值。
第五计算子单元,用于将各个第一对数值相加后再与第二对数值相加,得到目标疾病的评估值。
对各个大于零的在目标疾病下的各个症状特征的概率值进行取对数运算,得到第一对数值。
需要说明的是,进行对数运算时,底数的取值范围可以为大于1。
类似的,当某一目标症状特征未与目标疾病对应,也就是说该目标症状特征是否出现与是否具有目标疾病不相关时,可以将在目标疾病条件下该目标症状特征的条件概率设置为很小的正数值,例如0.0001。
然后,对p′(fi|dj)进行取对数运算,得到第一对数值logp′(fi|dj)。
对目标疾病的先验概率进行取对数运算,得到第二对数值。
以上述示例为例,对P(dj)进行取对数运算,得到logP(dj)。
将得到的第一对数值进行相加,再将相加的结果与第二对数值进行相加,得到目标疾病的评估值。
结合公式(2),对公式(2)两边同时取对数,可以得到公式(3):
Figure BDA0002917511400000142
其中,log(P(dj|A))为目标疾病的评估值。
则如此通过对数运算得到的数值相加计算得到的目标疾病的评估值具有一定数值,以便后续利用评估值对目标疾病进行排序。
在本申请实施例中,通过取对数运算,可以将乘法运算转换为加法运算,便于进行快速计算,并且得到的评估值的位数较少,不会造成位数溢出,可以确保在一定的精度范围内评估值的数值不同,便于对评估值进行排序。
基于底数大于1的对数函数的函数性质可知,当先验概率或者是概率值的数值越大时,对评估值的影响越小。这与概率值的数值越大对评估值的影响越大的评估值的数据分析需求不同。
基于上述问题,本申请实施例提供第三种第一计算子单元的具体实施方式,具体包括:第一转换子单元、第二转换子单元和第六计算单元。
第一转换子单元,用于将各个大于零的在目标疾病的条件下症状特征的概率值分别作为目标函数的变量,得到目标函数的第一函数值。
第二转换子单元,用于将目标疾病的先验概率作为目标函数的变量,得到目标函数的第二函数值。
第六计算子单元,用于将各个第一函数值相加后再与第二函数值相加,得到目标疾病的评估值。
目标函数是满足在变量大于零的区间内单调递增,并且函数值的增幅随变量的增大而增大的函数。将在目标疾病的条件下各个症状特征的概率值作为目标函数的变量,利用目标函数计算得到第一函数值。
例如,若目标函数为g(x),分别将p′(fi|dj)作为变量代入至目标函数中,得到第一函数值g(p′(fi|dj))。
将目标疾病的先验概率作为目标函数的变量,计算得到目标函数的第二函数值。
例如,将P(dj)代入至目标函数g(x)中,得到目标函数的第二函数值g(P(dj))。
将得到的第一函数值相加,并将得到的相加结果与第二函数值相加,得到目标疾病的评估值。
目标疾病的评估值可以通过公式(4)表示:
Figure BDA0002917511400000151
其中,g(P(dj|A))为目标疾病的评估值。
需要说明的是,鉴于目标疾病的评估值是通过将目标函数的函数值进行相加得到的,部分加数为零时不影响得到的目标疾病的评估值得到具体的数值。则当某一目标症状特征未与目标疾病对应,也就是说该目标症状特征是否出现与是否具有目标疾病不相关时,可以将在目标疾病条件下目标症状特征的条件概率设置为0或者一个很小的正数值,例如0.0001。
在本申请实施例中,利用目标函数可以保证当先验概率或者是概率值的数值较大时,对计算得到的评估值的影响较大,使得计算得到的评估值更符合对疾病评估的需要。
可以理解的是,疾病的发病概率与患者的年龄相关,在不同年龄区间内的疾病的发病概率不同。在一种可能的实现方式中,本申请实施例提供的疾病预测装置还可以包括:第三获取单元和第二计算单元。
第三获取单元,用于从医疗知识图谱中获取目标疾病在所述用户所属年龄区间的年龄影响系数;
第二计算单元,用于将第一计算单元203得到的目标疾病的评估值与年龄影响系数相加,更新目标疾病的评估值。
医疗知识图谱中具有各个疾病对应的不同年龄区间的年龄影响系数。例如,目标疾病的高发年龄为15岁到30岁,对应的,15岁到30岁的年龄区间的年龄影响系数可以为0.8,其余年龄区间的年龄影响系数为0.2。
所述用户所属年龄区间为用户的年龄值所属的年龄区间,可以根据用户输入的年龄值或与年龄相关的特征来确定。例如,用户输入“3岁”,即为年龄值;用户输入“二年级学生”,即为与年龄相关的特征。
从医疗知识图谱中获取到目标疾病在当前用户所属年龄区间的年龄影响系数。
将得到的目标疾病的评估值和年龄影响系数相加,得到目标疾病的评估值。
在本申请实施例中,通过在得到的目标疾病的评估值的基础上加入年龄影响系数,得到更为准确的目标疾病的评估值,如此可以提高疾病预测模型的预测准确程度。
在一种可能的实现方式中,部分疾病是否出现无法通过概率值确定。例如,没有腹泻就不是病毒性肠炎。对于此类诊断知识,无法通过概率值影响目标疾病的评估值。
进一步,本申请实施例提供的疾病预测装置还可以包括:第四获取单元、第一判断单元和第一处理单元。
第四获取单元,用于从医疗知识图谱中获取疾病预测规则信息,疾病预测规则信息包括条件与动作的对应关系,条件为目标症状特征对应的目标特征值,动作为对相应疾病的评估值的处理方式;
第一判断单元,用于判断用户当前症状特征集合中是否符合目标条件的症状特征;所述目标条件为所述条件中的任一条;
第一处理单元,用于如果第一判断单元的判断结果为是,确定所述用户当前症状特征集合中符合所述目标条件的症状特征,获取所述目标条件对应的目标动作中的相应疾病,将所述目标动作中的相应疾病的评估值按照该相应疾病的评估值的处理方式进行处理,更新该相应疾病的评估值。
对于不能通过概率值影响目标疾病的医疗知识,可以对应地建立疾病预测规则信息。疾病预测规则信息中包括条件以及动作的对应关系。条件为目标症状特征所对应的目标特征值。
对于获取的用户当前症状特征集合,利用第一判断单元判断是否存在符合目标条件的症状特征所述目标症状特征对应的目标特征值;所述目标条件为所述条件中的任一条。若第一判断单元输出的判断结果为是,则确定用户当前症状特征集合中具有满足疾病预测规则信息条件的症状特征,即符合该规则的条件。将该规则的动作中各个疾病的评估值,按照疾病预测规则信息中动作中规定的相应疾病的评估值的处理方式进行处理,得到新的相应疾病的评估值。
在一种可能的实现方式中,疾病预测规则信息集合为R={r1,r2,…rm},其中,ra表示每条疾病预测规则信息,a的取值范围为1至m,m为大于或者等于1的整数。ra包括条件ca={f1=x1,…,fb=xb,…,fk=xk}和对应的动作Acta={d1:a1,……,dt:at,……,dq:aq}。其中,fb表示症状特征,xb表示症状特征的目标特征值,b的取值范围为1至k,k为大于或者等于1的整数。dt表示疾病,at表示需要对相应疾病的评估值的处理方式。t的取值范围为1至q,q为大于或者等于1的整数。满足条件ca时,动作列表中所有疾病按照对应的值对评估值进行操作。
例如,获取的疾病预测规则信息集合为R={r1,r2,…rm}中r2包括的条件为c2={腹泻=-1},对应的动作为Acta={病毒性肠炎:-5}。判断用户当前症状特征集合中是否存在符合目标条件的症状特征,如判断是否存在目标症状特征“腹泻”对应的目标特征值“-1”。如果通过第一判断单元得到的判断结果为是,动作中的疾病“病毒性肠炎”的评估值按照疾病所对应的动作Acta,执行对应的处理方式。将“病毒性肠炎”的评估值减去5,得到新的“病毒性肠炎”的评估值。
基于上述内容可知,通过获取医疗知识图谱中的疾病预测规则信息,可以对满足疾病预测规则信息中的条件的相应疾病的评估值进行对应的处理,实现利用不能通过概率值计算的诊断知识得到更为准确的疾病的评估值。从排序后的各个疾病中选取得到的预测疾病较为准确,提高疾病预测装置的准确性。
本申请实施例还提供一种症状信息处理方法,为了便于理解本申请实施例提供的技术方案,下面结合附图对本申请实施例提供的一种症状信息处理方法进行说明。
参见图3所示,该图为本申请实施例提供的一种症状信息处理方法的流程图,该方法包括S301-S304:
S301:获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征。
S302:从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个。
S303:根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值。
S301-S303的具体实施方式与上述第一获取单元201、第二获取单元202和第一计算单元203类似,在此不再赘述。
S304:对得到所述评估值的各个疾病按照所述评估值进行排序。
各个疾病具有的评估值不同,利用评估值对各个疾病进行排序。在一种可能的实现方式中,可以利用评估值的数值大小对疾病进行排序,以便利用排序结果对疾病的选择。
基于上述S301-S304的相关内容可知,先通过获取用户当前症状特征集合,可以确定用户的当前疾病的症状特征以及是否出现对应的症状特征。再从医疗知识图谱中获取目标疾病的先验概率以及在目标疾病下的各个症状特征的条件概率。之后,根据目标疾病的先验概率、目标疾病条件下各个症状特征的条件概率以及各个症状特征对应的特征值,可以计算得到目标疾病的评估值。如此可以实现利用医疗知识图谱中的先验概率和条件概率进行目标疾病所对应的评估值的计算,无需使用标注数据进行机器学习模型或者神经网络模型模型的训练,减少了对症状信息处理的成本。最后,基于医疗知识图谱中的知识以及利用先验概率、条件概率计算目标疾病的评估值,能够得到较为准确的目标疾病的评估值,实现对于症状信息的准确处理。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值,包括:
将所述在目标疾病的条件下目标症状特征的条件概率与所述目标症状特征对应的特征值相乘,得到在目标疾病的条件下所述目标症状特征的概率值;所述目标症状特征分别为所述用户当前症状特征集合包括的症状特征的每一个;
根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值连乘,得到的乘积再与所述目标疾病的先验概率相乘,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
分别计算各个大于零的在目标疾病的条件下症状特征的概率值取对数后的第一对数值;
计算所述目标疾病的先验概率取对数后的第二对数值;
将各个所述第一对数值相加后再与所述第二对数值相加,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值分别作为目标函数的变量,得到所述目标函数的第一函数值;
将所述目标疾病的先验概率作为所述目标函数的变量,得到所述目标函数的第二函数值;
将各个所述第一函数值相加后再与所述第二函数值相加,得到所述目标疾病的评估值;
所述目标函数满足在变量大于零的区间内单调递增,且函数值的增幅随变量的增大而增大。
在一种可能的实现方式中,所述方法还包括:
从所述医疗知识图谱中获取所述目标疾病在所述用户所属年龄区间的年龄影响系数;
将得到的所述目标疾病的评估值与所述年龄影响系数相加,更新所述目标疾病的评估值。
在一种可能的实现方式中,所述方法还包括:
从所述医疗知识图谱中获取疾病预测规则信息,所述疾病预测规则信息包括条件与动作的对应关系,所述条件为目标症状特征对应的目标特征值,所述动作为对相应疾病的评估值的处理方式;
判断所述用户当前症状特征集合中是否存在符合目标条件的症状特征;所述目标条件为所述条件中的任一条;
如果判断结果为是,确定所述用户当前症状特征集合中符合所述目标条件的症状特征,获取所述目标条件对应的目标动作中的相应疾病,将所述目标动作中的相应疾病的评估值按照该相应疾病的评估值的处理方式进行处理,更新该相应疾病的评估值。
图4示出了一种用于疾病预测设备1200的框图。例如,设备1200可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,设备1200可以包括以下一个或多个组件:处理组件1202,存储器1204,电源组件1206,多媒体组件1208,音频组件1210,输入/输出(I/O)的接口1212,传感器组件1214,以及通信组件1216。
处理组件1202通常控制设备1200的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件1202可以包括一个或多个处理器1220来执行指令,以完成以下方法的全部或部分步骤。此外,处理组件1202可以包括一个或多个模块,便于处理组件1202和其他组件之间的交互。例如,处理部件1202可以包括多媒体模块,以方便多媒体组件1208和处理组件1202之间的交互。
存储器1204被配置为存储各种类型的数据以支持在设备1200的操作。这些数据的示例包括用于在设备1200上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1204可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件1206为设备1200的各种组件提供电力。电源组件1206可以包括电源管理系统,一个或多个电源,及其他与为设备1200生成、管理和分配电力相关联的组件。
多媒体组件1208包括在所述设备1200和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1208包括一个前置摄像头和/或后置摄像头。当设备1200处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1210被配置为输出和/或输入音频信号。例如,音频组件1210包括一个麦克风(MIC),当设备1200处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1204或经由通信组件1216发送。在一些实施例中,音频组件1210还包括一个扬声器,用于输出音频信号。
I/O接口为处理组件1202和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1214包括一个或多个传感器,用于为设备1200提供各个方面的状态评估。例如,传感器组件1214可以检测到设备1200的打开/关闭状态,组件的相对定位,例如所述组件为设备1200的显示器和小键盘,传感器组件1214还可以检测设备1200或设备1200一个组件的位置改变,用户与设备1200接触的存在或不存在,设备1200方位或加速/减速和设备1200的温度变化。传感器组件1214可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1214还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1214还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1216被配置为便于设备1200和其他设备之间有线或无线方式的通信。设备1200可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件1216经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件1216还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,设备1200可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,
第一方面,设备1200用于执行下述疾病预测方法:
获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
对得到所述评估值的各个疾病按照所述评估值进行排序,将排序符合预设条件的疾病确定为所述用户当前症状特征集合对应的预测疾病。
在一种可能的实现方式中,所述疾病预测方法,包括:
将所述在目标疾病的条件下目标症状特征的条件概率与所述目标症状特征对应的特征值相乘,得到在目标疾病的条件下所述目标症状特征的概率值;所述目标症状特征分别为所述用户当前症状特征集合包括的症状特征的每一个;
根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值。
在一种可能的实现方式中,所述疾病预测方法,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值连乘,得到的乘积再与所述目标疾病的先验概率相乘,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述疾病预测方法,包括:
分别计算各个大于零的在目标疾病的条件下症状特征的概率值取对数后的第一对数值;
计算所述目标疾病的先验概率取对数后的第二对数值;
将各个所述第一对数值相加后再与所述第二对数值相加,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述疾病预测方法,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值分别作为目标函数的变量,得到所述目标函数的第一函数值;
将所述目标疾病的先验概率作为所述目标函数的变量,得到所述目标函数的第二函数值;
将各个所述第一函数值相加后再与所述第二函数值相加,得到所述目标疾病的评估值;
所述目标函数满足在变量大于零的区间内单调递增,且函数值的增幅随变量的增大而增大。
在一种可能的实现方式中,所述方法还包括:
从所述医疗知识图谱中获取所述目标疾病在所述用户所属年龄区间的年龄影响系数;
将得到的所述目标疾病的评估值与所述年龄影响系数相加,更新所述目标疾病的评估值。
在一种可能的实现方式中,所述方法还包括:
从所述医疗知识图谱中获取疾病预测规则信息,所述疾病预测规则信息包括条件与动作的对应关系,所述条件为目标症状特征对应的目标特征值,所述动作为对相应疾病的评估值的处理方式;
判断所述用户当前症状特征集合中是否存在符合目标条件的症状特征;所述目标条件为所述条件中的任一条;
如果判断结果为是,确定所述用户当前症状特征集合中符合所述目标条件的症状特征,获取所述目标条件对应的目标动作中的相应疾病,将所述目标动作中的相应疾病的评估值按照该相应疾病的评估值的处理方式进行处理,更新该相应疾病的评估值。
第二方面,设备1200用于执行下述症状信息处理方法:
获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
对得到所述评估值的各个疾病按照所述评估值进行排序。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值,包括:
将所述在目标疾病的条件下目标症状特征的条件概率与所述目标症状特征对应的特征值相乘,得到在目标疾病的条件下所述目标症状特征的概率值;所述目标症状特征分别为所述用户当前症状特征集合包括的症状特征的每一个;
根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值连乘,得到的乘积再与所述目标疾病的先验概率相乘,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
分别计算各个大于零的在目标疾病的条件下症状特征的概率值取对数后的第一对数值;
计算所述目标疾病的先验概率取对数后的第二对数值;
将各个所述第一对数值相加后再与所述第二对数值相加,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值分别作为目标函数的变量,得到所述目标函数的第一函数值;
将所述目标疾病的先验概率作为所述目标函数的变量,得到所述目标函数的第二函数值;
将各个所述第一函数值相加后再与所述第二函数值相加,得到所述目标疾病的评估值;
所述目标函数满足在变量大于零的区间内单调递增,且函数值的增幅随变量的增大而增大。
在一种可能的实现方式中,所述方法还包括:
从所述医疗知识图谱中获取所述目标疾病在所述用户所属年龄区间的年龄影响系数;
将得到的所述目标疾病的评估值与所述年龄影响系数相加,更新所述目标疾病的评估值。
在一种可能的实现方式中,所述方法还包括:
从所述医疗知识图谱中获取疾病预测规则信息,所述疾病预测规则信息包括条件与动作的对应关系,所述条件为目标症状特征对应的目标特征值,所述动作为对相应疾病的评估值的处理方式;
判断所述用户当前症状特征集合中是否存在符合目标条件的症状特征;所述目标条件为所述条件中的任一条;
如果判断结果为是,确定所述用户当前症状特征集合中符合所述目标条件的症状特征,获取所述目标条件对应的目标动作中的相应疾病,将所述目标动作中的相应疾病的评估值按照该相应疾病的评估值的处理方式进行处理,更新该相应疾病的评估值。图5是本发明实施例中服务器的结构示意图。该服务器1300可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1322(例如,一个或一个以上处理器)和存储器1332,一个或一个以上存储应用程序1342或数据1344的存储介质1330(例如一个或一个以上海量存储设备)。其中,存储器1332和存储介质1330可以是短暂存储或持久存储。存储在存储介质1330的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1322可以设置为与存储介质1330通信,在服务器1300上执行存储介质1330中的一系列用于执行上述疾病预测的方法的指令操作。
终端1300还可以包括一个或一个以上电源1326,一个或一个以上有线或无线网络接口1350,一个或一个以上输入输出接口1356,一个或一个以上键盘1356,和/或,一个或一个以上操作系统1341,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
另外,本申请实施例还一种非临时性计算机可读存储介质。
第一方面,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种疾病预测方法,所述方法包括:
获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
对得到所述评估值的各个疾病按照所述评估值进行排序,将排序符合预设条件的疾病确定为所述用户当前症状特征集合对应的预测疾病。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值,包括:
将所述在目标疾病的条件下目标症状特征的条件概率与所述目标症状特征对应的特征值相乘,得到在目标疾病的条件下所述目标症状特征的概率值;所述目标症状特征分别为所述用户当前症状特征集合包括的症状特征的每一个;
根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值连乘,得到的乘积再与所述目标疾病的先验概率相乘,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
分别计算各个大于零的在目标疾病的条件下症状特征的概率值取对数后的第一对数值;
计算所述目标疾病的先验概率取对数后的第二对数值;
将各个所述第一对数值相加后再与所述第二对数值相加,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值分别作为目标函数的变量,得到所述目标函数的第一函数值;
将所述目标疾病的先验概率作为所述目标函数的变量,得到所述目标函数的第二函数值;
将各个所述第一函数值相加后再与所述第二函数值相加,得到所述目标疾病的评估值;
所述目标函数满足在变量大于零的区间内单调递增,且函数值的增幅随变量的增大而增大。
在一种可能的实现方式中,所述疾病预测方法还包括:
从所述医疗知识图谱中获取所述目标疾病在所述用户所属年龄区间的年龄影响系数;
将得到的所述目标疾病的评估值与所述年龄影响系数相加,更新所述目标疾病的评估值。
在一种可能的实现方式中,所述疾病预测方法还包括:
从所述医疗知识图谱中获取疾病预测规则信息,所述疾病预测规则信息包括条件与动作的对应关系,所述条件为目标症状特征对应的目标特征值,所述动作为对相应疾病的评估值的处理方式;
判断所述用户当前症状特征集合中是否存在符合目标条件的症状特征所述目标症状特征对应的目标特征值;所述目标条件为所述条件中的任一条;
如果判断结果为是,确定所述用户当前症状特征集合中符合所述目标条件的症状特征,获取所述目标条件对应的目标动作中的相应疾病,将所述目标动作中的相应疾病的评估值按照该相应疾病的评估值的处理方式进行处理,更新该相应疾病的评估值。
如此可以实现利用医疗知识图谱中的先验概率和条件概率进行目标疾病所对应的评估值的计算,无需使用标注数据进行机器学习模型或者神经网络模型模型的训练,减少了疾病预测的成本。最后,对得到评估值的各个疾病按照评估值进行排序,将排序符合预设条件的疾病确定为用户当前症状特征集合对应的预测疾病。基于较为准确的医疗知识图谱中的知识以及利用先验概率、条件概率计算目标疾病的评估值进行疾病预测可以提高疾病预测的准确程度,实现高准确度的疾病预测。
第二方面,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述的症状信息处理方法,所述方法包括:
获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
对得到所述评估值的各个疾病按照所述评估值进行排序。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值,包括:
将所述在目标疾病的条件下目标症状特征的条件概率与所述目标症状特征对应的特征值相乘,得到在目标疾病的条件下所述目标症状特征的概率值;所述目标症状特征分别为所述用户当前症状特征集合包括的症状特征的每一个;
根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值连乘,得到的乘积再与所述目标疾病的先验概率相乘,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
分别计算各个大于零的在目标疾病的条件下症状特征的概率值取对数后的第一对数值;
计算所述目标疾病的先验概率取对数后的第二对数值;
将各个所述第一对数值相加后再与所述第二对数值相加,得到所述目标疾病的评估值。
在一种可能的实现方式中,所述根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值,包括:
将各个大于零的在目标疾病的条件下症状特征的概率值分别作为目标函数的变量,得到所述目标函数的第一函数值;
将所述目标疾病的先验概率作为所述目标函数的变量,得到所述目标函数的第二函数值;
将各个所述第一函数值相加后再与所述第二函数值相加,得到所述目标疾病的评估值;
所述目标函数满足在变量大于零的区间内单调递增,且函数值的增幅随变量的增大而增大。
在一种可能的实现方式中,所述方法还包括:
从所述医疗知识图谱中获取所述目标疾病在所述用户所属年龄区间的年龄影响系数;
将得到的所述目标疾病的评估值与所述年龄影响系数相加,更新所述目标疾病的评估值。
在一种可能的实现方式中,所述方法还包括:
从所述医疗知识图谱中获取疾病预测规则信息,所述疾病预测规则信息包括条件与动作的对应关系,所述条件为目标症状特征对应的目标特征值,所述动作为对相应疾病的评估值的处理方式;
判断所述用户当前症状特征集合中是否存在符合目标条件的症状特征所述目标症状特征对应的目标特征值;所述目标条件为所述条件中的任一条;
如果判断结果为是,确定所述用户当前症状特征集合中符合所述目标条件的症状特征,获取所述目标条件对应的目标动作中的相应疾病,将所述目标动作中的相应疾病的评估值按照该相应疾病的评估值的处理方式进行处理,更新该相应疾病的评估值。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种疾病预测装置,其特征在于,所述装置包括:
第一获取单元,用于获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
第二获取单元,用于从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
第一计算单元,用于根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
预测单元,用于对得到所述评估值的各个疾病按照所述评估值进行排序,将排序符合预设条件的疾病确定为所述用户当前症状特征集合对应的预测疾病。
2.根据权利要求1所述的装置,其特征在于,所述第一计算单元,包括:
确定子单元,用于将所述在目标疾病的条件下目标症状特征的条件概率与所述目标症状特征对应的特征值相乘,得到在目标疾病的条件下所述目标症状特征的概率值;所述目标症状特征分别为所述用户当前症状特征集合包括的症状特征的每一个;
第一计算子单元,用于根据所述目标疾病的先验概率以及各个大于零的在目标疾病的条件下症状特征的概率值,计算所述目标疾病的评估值。
3.根据权利要求2所述的装置,其特征在于,所述第一计算子单元,包括:
第二计算子单元,用于将各个大于零的在目标疾病的条件下症状特征的概率值连乘,得到的乘积再与所述目标疾病的先验概率相乘,得到所述目标疾病的评估值。
4.根据权利要求2所述的装置,其特征在于,所述第一计算子单元,包括:
第三计算子单元,用于分别计算各个大于零的在目标疾病的条件下症状特征的概率值取对数后的第一对数值;
第四计算子单元,用于计算所述目标疾病的先验概率取对数后的第二对数值;
第五计算子单元,用于将各个所述第一对数值相加后再与所述第二对数值相加,得到所述目标疾病的评估值。
5.一种症状信息处理方法,其特征在于,所述方法包括:
获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
对得到所述评估值的各个疾病按照所述评估值进行排序。
6.一种疾病预测设备,其特征在于,所述设备包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
对得到所述评估值的各个疾病按照所述评估值进行排序,将排序符合预设条件的疾病确定为所述用户当前症状特征集合对应的预测疾病。
7.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种疾病预测方法,所述方法包括:
获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
从医疗知识图谱中获取目标疾病的先验概率并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
对得到所述评估值的各个疾病按照所述评估值进行排序,将排序符合预设条件的疾病确定为所述用户当前症状特征集合对应的预测疾病。
8.一种症状信息处理装置,其特征在于,所述装置包括:
第五获取单元,用于获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
第六获取单元,用于从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
第三计算单元,用于根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
排序单元,用于对得到所述评估值的各个疾病按照所述评估值进行排序。
9.一种症状信息处理设备,其特征在于,所述设备包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户当前症状特征集合,所述用户当前症状特征集合包括至少一个症状特征以及各个所述症状特征对应的特征值;所述症状特征对应的特征值表征是否出现该症状特征;
从医疗知识图谱中获取目标疾病的先验概率,并针对用户当前症状特征集合中包括的症状特征,获取在目标疾病的条件下各个症状特征的条件概率;所述目标疾病为所述医疗知识图谱包括的疾病集合中的任一个;
根据所述目标疾病的先验概率、所述在目标疾病的条件下各个症状特征的条件概率以及各个所述症状特征对应的特征值,计算所述目标疾病的评估值;
对得到所述评估值的各个疾病按照所述评估值进行排序。
10.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求5所述的症状信息处理方法。
CN202110106243.3A 2021-01-26 2021-01-26 疾病预测装置及设备、症状信息处理方法、装置及设备 Pending CN112768064A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110106243.3A CN112768064A (zh) 2021-01-26 2021-01-26 疾病预测装置及设备、症状信息处理方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110106243.3A CN112768064A (zh) 2021-01-26 2021-01-26 疾病预测装置及设备、症状信息处理方法、装置及设备

Publications (1)

Publication Number Publication Date
CN112768064A true CN112768064A (zh) 2021-05-07

Family

ID=75705879

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110106243.3A Pending CN112768064A (zh) 2021-01-26 2021-01-26 疾病预测装置及设备、症状信息处理方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112768064A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI776638B (zh) * 2021-08-17 2022-09-01 臺中榮民總醫院 以人工智慧技術輔助多疾病決策與即時資訊回饋的醫療照護系統
CN116389647A (zh) * 2023-06-02 2023-07-04 深圳市尚哲医健科技有限责任公司 急诊急救一体化平台

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018120430A (ja) * 2017-01-25 2018-08-02 株式会社メドレー 医療情報提供方法、医療情報提供装置、及びプログラム
US20190155993A1 (en) * 2017-11-20 2019-05-23 ThinkGenetic Inc. Method and System Supporting Disease Diagnosis
CN110504028A (zh) * 2019-08-22 2019-11-26 上海软中信息系统咨询有限公司 一种疾病问诊方法、装置、系统、计算机设备和存储介质
CN111326251A (zh) * 2020-02-13 2020-06-23 北京百度网讯科技有限公司 一种问诊问题输出方法、装置以及电子设备
CN111816301A (zh) * 2020-07-07 2020-10-23 平安科技(深圳)有限公司 医疗问诊辅助方法、装置、电子设备及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018120430A (ja) * 2017-01-25 2018-08-02 株式会社メドレー 医療情報提供方法、医療情報提供装置、及びプログラム
US20190155993A1 (en) * 2017-11-20 2019-05-23 ThinkGenetic Inc. Method and System Supporting Disease Diagnosis
CN110504028A (zh) * 2019-08-22 2019-11-26 上海软中信息系统咨询有限公司 一种疾病问诊方法、装置、系统、计算机设备和存储介质
CN111326251A (zh) * 2020-02-13 2020-06-23 北京百度网讯科技有限公司 一种问诊问题输出方法、装置以及电子设备
CN111816301A (zh) * 2020-07-07 2020-10-23 平安科技(深圳)有限公司 医疗问诊辅助方法、装置、电子设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李飞宇: "《医用高等数学》", 30 September 2006, 湖南科学技术出版社, pages: 294 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI776638B (zh) * 2021-08-17 2022-09-01 臺中榮民總醫院 以人工智慧技術輔助多疾病決策與即時資訊回饋的醫療照護系統
CN116389647A (zh) * 2023-06-02 2023-07-04 深圳市尚哲医健科技有限责任公司 急诊急救一体化平台
CN116389647B (zh) * 2023-06-02 2023-08-08 深圳市尚哲医健科技有限责任公司 急诊急救一体化平台

Similar Documents

Publication Publication Date Title
CN109800325B (zh) 视频推荐方法、装置和计算机可读存储介质
CN109359056B (zh) 一种应用程序测试方法及装置
CN110874145A (zh) 一种输入方法、装置及电子设备
CN109933714B (zh) 一种词条权重的计算方法、搜索方法及相关装置
CN109670077B (zh) 视频推荐方法、装置和计算机可读存储介质
CN109543066A (zh) 视频推荐方法、装置和计算机可读存储介质
CN112148923B (zh) 搜索结果的排序方法、排序模型的生成方法、装置及设备
CN112148980B (zh) 基于用户点击的物品推荐方法、装置、设备和存储介质
CN112768064A (zh) 疾病预测装置及设备、症状信息处理方法、装置及设备
US11546663B2 (en) Video recommendation method and apparatus
CN111104807A (zh) 一种数据处理方法、装置和电子设备
CN111813932B (zh) 文本数据的处理方法、分类方法、装置及可读存储介质
CN117453933A (zh) 一种多媒体数据推荐方法、装置、电子设备及存储介质
CN107436896A (zh) 一种输入推荐方法、装置及电子设备
CN107301188B (zh) 一种获取用户兴趣的方法及电子设备
CN112951405B (zh) 一种实现特征排序的方法、装置及设备
CN110020206B (zh) 一种搜索结果排序方法及装置
CN114201665A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN110929055A (zh) 多媒体质量检测方法、装置、电子设备及存储介质
CN113312475B (zh) 一种文本相似度确定方法及装置
CN112307353B (zh) 数据的处理方法、装置、电子设备、存储介质
CN111309959B (zh) 歌曲推荐方法和装置
US20240047069A1 (en) Methods and apparatuses for determining state information and health index information
CN111666436B (zh) 一种数据处理方法、装置和电子设备
CN107544969B (zh) 一种优化静态词库尺寸的方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination