CN107908819A - 预测用户状态变化的方法和装置 - Google Patents

预测用户状态变化的方法和装置 Download PDF

Info

Publication number
CN107908819A
CN107908819A CN201710976803.4A CN201710976803A CN107908819A CN 107908819 A CN107908819 A CN 107908819A CN 201710976803 A CN201710976803 A CN 201710976803A CN 107908819 A CN107908819 A CN 107908819A
Authority
CN
China
Prior art keywords
data
user
physical sign
sign parameters
sign
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710976803.4A
Other languages
English (en)
Other versions
CN107908819B (zh
Inventor
杨明
张启
刘子威
刘诗媛
张朝棋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen H&T Intelligent Control Co Ltd
Original Assignee
Shenzhen H&T Intelligent Control Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen H&T Intelligent Control Co Ltd filed Critical Shenzhen H&T Intelligent Control Co Ltd
Priority to CN201710976803.4A priority Critical patent/CN107908819B/zh
Publication of CN107908819A publication Critical patent/CN107908819A/zh
Application granted granted Critical
Publication of CN107908819B publication Critical patent/CN107908819B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • Computing Systems (AREA)
  • Child & Adolescent Psychology (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供预测用户状态变化的方法和装置,其中,所述方法包括:获取预设状态用户的多个体征数据,所述体征数据包括动态体征参数的特征数据和静态体征参数对应的数据;根据所述多个体征数据以及参数相关性确定至少一个目标体征数据,其中,所述参数相关性为所述动态体征参数与所述静态体征参数之间的相关性;根据所述至少一个目标体征数据以及预设的基于极限梯度增强自适应算法的用户状态预测模型预测所述预设状态用户的状态变化发生概率;输出所述预设状态用户的状态变化发生概率。采用本发明的技术方案,可以提高预测的精度。

Description

预测用户状态变化的方法和装置
技术领域
本发明涉及概率预测领域,尤其涉及预测用户状态变化的方法和装置。
背景技术
数据预测是指通过对样本数据(历史数据)的输入值和输出值进行关联性学习,得到预测模型,在利用该预测模型对未来的输入值进行输出值预测,从而得到一个预测数据。数据预测可以用于用户行为预测、人体健康预测、灾难灾害预测、环境变迁预测等应用领域。
数据预测主要采用决策树方法、人工神经网络、支持向量机、正则化方法、朴素贝叶斯等机器学习算法建立数据模型,从而用该数据模型进行预测。在目前的一些方案中,一般采用多变量逻辑回归算法对用户状态变化概率进行预测,但是,采用多变量逻辑回归算法得到的模型很难捕捉到复杂数据中的非线性关系,模型的预测精度不高。
发明内容
本发明实施例提供预测用户状态变化的方法和装置,可以提高模型的预测精度。
本发明实施例第一方面提供一种预测用户状态变化的方法,包括:
获取预设状态用户的多个体征数据,所述体征数据包括动态体征参数的特征数据和静态体征参数对应的数据;
根据所述多个体征数据以及参数相关性确定至少一个目标体征数据,其中,所述参数相关性为所述动态体征参数与所述静态体征参数之间的相关性;
根据所述至少一个目标体征数据以及预设的基于极限梯度增强自适应算法的用户状态预测模型预测所述预设状态用户的状态变化发生概率;
输出所述预设状态用户的状态变化发生概率。
本发明实施例第二方面提供预测用户状态变化的装置,包括:
获取单元,用于获取预设状态用户的多个体征数据,所述体征数据包括动态体征参数的特征数据和静态体征参数对应的数据;
第一确定单元,用于根据所述多个体征数据以及参数相关性确定至少一个目标体征数据,其中,所述参数相关性为所述动态体征参数与所述静态体征参数之间的相关性;
预测单元,用于根据所述至少一个目标体征数据以及预设的基于极限梯度增强自适应算法的用户状态预测模型预测所述预设状态用户的状态变化发生概率;
输出单元,用于输出所述预设状态用户的状态变化发生概率。
本发明实施例第三方面提供一种预测用户状态变化的装置,包括处理器、存储器以及输入输出接口,所述处理器、存储器和输入输出接口相互连接,其中,所述输入输出接口用于输入输出数据,所述存储器用于存储预测用户状态变化的装置执行上述方法的应用程序代码,所述处理器被配置用于执行上述第一方面的方法。
本发明实施例第四方面提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
本发明实施例中,通过对预设状态用户的动态体征参数的特征数据和静态体征参数对应的数据进行处理,得到目标体征数据,将目标体征数据作为输入值采用基于极限梯度增强自适应算法的用户状态预测模型对预设状态用户的状态变化发生概率进行预测,采用基于极限梯度增强自适应算法得到的用户状态预测模型可以提高预测的精度,另外,对用户的动态体征参数和静态体征参数处理可以简化模型的复杂度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种预测用户状态变化的方法;
图2是本发明实施例提供的另一种预测用户状态变化的方法的流程示意图;
图3是本发明实施例提供的一种分类树模型的示意图;
图4是本发明实施例提供的一种预测用户状态变化的装置的结构示意图;
图5是本发明实施例提供的另一种预测用户状态变化的装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先参见图1,图1是本发明实施例提供的一种预测用户状态变化的方法的流程示意图,如图所示,所述方法至少包括:
S101,获取预设状态用户的多个体征数据,所述体征数据包括动态体征参数的特征数据和静态体征参数对应的数据。
其中,预设状态用户指具有共同特征或属性的一类用户,例如预设状态用户为重症用户、中风的用户、患糖尿病的用户,等等。
这里,多个特征数据由动态体征参数的特征数据和静态体征参数对应的数据构成,动态体征参数和静态体征参数均不限于一个。
可选地,静态体征参数可以为年龄、体重、性别、身高、病症类型、用户所在的病房类型等在一段时间内数据固定不变或变化很小的反映用户的基本特征的体征参数。
可选地,动态体征参数可以为格拉斯哥昏迷指数(Glasgow Coma Score,GCS)、血浆蛋白(Albumin)、碱性磷酸酶(Alkaline phosphatase,ALP)、谷丙转氨酶(Alaninetransaminase,ALT)、谷草转氨酶(Aspartate transaminase,AST)、胆红素(Bilirubin)、血尿素氮(Blood urea nitrogen,BUN)、胆固醇(Cholesterol)、肌氨酸酐(Serumcreatinine,Creatinine)、有创舒张动脉血压(Invasive diastolic arterial bloodpressure)、有创收缩动脉血压(Invasive systolic arterial blood pressure,SysABP)、指吸入氧浓度(Fractional inspired O2,FiO2)、血糖(Serum glucose,Glucose)、血清碳酸氢盐(Serum bicarbonate,HCO3)、红细胞比容(Hematocrit,HCT)、心率(Heart rate,HR)、血清钾(Serum potassium,K)、全血乳酸(Lactate)、血清镁(Serum magnesium,Mg)、侵入性平均动脉压(nvasive mean arterial blood pressure,MAP)、机械通气呼吸(Mechanical ventilation respiration,MechVent)、血清钠(Serum sodium,Na)、无创舒张动脉血压(Non-invasive diastolic arterial blood pressure,NIDiasABP)、无创收缩动脉血压(Non-invasive systolic arterial blood pressure,NISysABP)、无创平均动脉血压(Non-invasive mean arterial blood pressure,NIMAP)、血氧分压(Partialpressure of arterial O2,PaO2)、酸碱值(Arterial pH,pH)、血小板(Platelets)、呼吸速率(RespRate)、动脉血氧饱和度(O2saturation in hemoglobin,SaO2)、体温(Temperature,Temp)、肌钙蛋白(Troponin-I,TropI)、尿排出量(Urine output,Urine)、白细胞数量(White blood cell count,WBC)等在一段时间内数据呈动态变化且反映用户的身体机能或身体状况的特征参数。
在一种可能的实现方式中,可以在一段时间内分别采集各个动态体征参数的多个数据,构成各个动态参数的时序数据,其中,时序数据指在不同的时刻采集到的同一个动态体征参数对应的数据;然后分别对各个动态体征参数的时序数据进行处理,最后对每个动态体征参数只保留一个或多个具有代表性的特征数据作为该动态体征参数的特征数据,即获取预设状态用户的多个动态体征参数的特征数据包括:分别获取所述预设状态用户在第二时间范围内各个动态体征参数对应的时序数据;分别对各个动态体征参数对应的时序数据进行数据处理得到所述各个动态体征参数的特征数据,进而确定多个动态体征参数的特征数据。
可选地,动态体征参数的特征数据可以为动态体征参数对应的时序数据的平均值、动态体征参数对应的时序数据的最大值、动态体征参数对应的时序数据的最小值、动态体征参数对应的时序数据的方差以及动态体征参数对应的时序数据的标准差中的至少一种特征数据。
下面举例对获取预设状态用户的多个动态体征参数的特征数据进行说明,假设动态体征参数分别为血小板(正常范围为100~300)、白细胞数量(正常范围为4~10)、心率(正常范围为60~100)、体温(36.1~37),第二时间范围为10:00~14:00,特征数据为最大值和平均值,假设在第二时间范围内一共对用户的动态体征参数进行了四次采集,采集情况如表1所示:
表1
则可以获取到该用户的血小板对应的时序数据为150,150,151,152;白细胞数量对应的时序数据为5,5,5,7;心率对应的时序数据为70,75,88,78;体温对应的时序数据为36,36.5,37.1,37.5。对血小板的时序数据进行处理得到血小板的最大值为152,平均值为150.75;对白细胞的时序数据进行处理得到白细胞数据的最大值为7,平均值为5.4;对心率的时序数据进行处理得到心率的最大值为88,平均值为77.75;对体温的时序数据进行处理得到体温的最大值为37.5,平均值为36.775。
然后可以确定血小板的特征数据为152,150.75;白细胞的特征数据为7,5.4;心率的特征数据为88,77.75;体温的特征数据为37.5,36.775,进而确定该用户的多个动态体征参数的特征数据为152,150.75,7,5.4,88,77.75,37.5,36.775。
S102,根据所述多个体征数据以及参数相关性确定至少一个目标体征数据,其中,所述参数相关性为所述动态体征参数与所述静态体征参数之间的相关性。
在一种可能的实现方式中,在获取到的动态体征参数的特征数据的数量与静态体征参数对应的数据的数量之和小于第一预设阈值的情况下,可以将所述动态体征参数的特征数据和所述静态体征参数对应的数据确定为目标体征数据。
在另一种可能的实现方式中,在获取到的动态体征参数的特征数据的数量与静态体征参数对应的数据的数量之和大于第一预设阈值的情况下,可以对获取到的动态体征参数的特征数据与静态体征参数对应的数据进行降维处理,将降维得到的数据确定为目标体征数据。即根据所述多个体征数据以及参数相关性确定至少一个目标体征数据包括:根据所述多个体征数据构建N维数据,其中,N等于所述动态体征参数的特征数据的数量与所述静态体征参数对应的数据的数量之和;根据所述参数相关性对所述N维数据进行降维处理得到M维数据,其中,M为正整数且小于N;将所述M维数据中的各个数据确定为目标体征数据。其中,M可以小于或等于第一预设阈值。
在一种可能的实现方式中,可以根据参数相关性采用主成分分析(PrincipleComponent Analysis,PCA)算法或自编码(Autoencoder)算法对所述N维数据进行降维处理得到M维数据。
在另一种可能的实现方式中,可以根据参数相关性将所述N维数据划分为M个数据分组;分别保留所述M个数据分组中的一个数据得到M维数据。
下面举例来对确定目标体征数据来进行说明。假设第一预设阈值为10。
第一种情况:获取到的动态体征参数的特征数据的数量和静态体征参数对应的数据的数量之和小于10。假设动态体征参数分别为血小板、白细胞数量、心率、体温、格拉斯哥昏迷指数以及血糖,静态体征参数为身高、年龄,其中,获取到的血小板的特征数据为152,获取到的白细胞数量的特征数据为7,获取到的心率的特征数据为88,获取到的体温的特征数据为37.5,获取到的格拉斯昏迷指数为12,获取到的血糖的特征数据为7.8;获取到的身高数据为158获取到的年龄数据为55,其中,动态体征参数的特征数据的数据与静态体征参数对应的数据的数量之和为8,小于10,则将动态体征参数的特征数据和静态体征对应的数据确定为目标体征数据,即目标体征数据为152、7、88、37.5、12、7.8、158、55。
第二种情况:获取到的动态体征参数的特征数据的数量和静态体征参数对应的数据的数量之和大于10,假设获取到的静态参数对应的数据为158(身高,单位:厘米)、55(年龄,单位:岁)、女(性别),获取到的动态体征参数的特征数据如表2所示:
动态体征参数 最大值 平均值
血小板(细胞/nL) 152 150
白细胞数量(细胞/nL) 7 6
心率(次/分) 90 80
体温(摄氏度) 37 36
格拉斯哥昏迷指数(分) 12 12
血糖(毫摩/升) 9.5 7
血清钾(毫摩/升) 5.1 4
血清钠(毫摩/升) 150 140
表2
其中,动态体征参数的特征数据的数量(16个)与静态体征参数对应的数据的数量(3个)之和为19,大于10,则需要对多个体征数据进行降维处理。
降维处理过程如下:
1)根据多个数据构建N维数据,这里N等于动态体征参数的特征数据的数量(16个)与静态体征参数对应的数据的数量(3个)之和,即N=19,构建的N维数据为(158、55、女、152、150、7、6、90、80、37、36、12、12、9.5、7、5.1、4、150、140);
2)根据参数相关性对所述N维数据进行降维处理得到M维数据。
在一种可能的实现方式中,采用基于线性映射或非线性映射的降维算法对N维数据进行降维,具体实现中,根据N维数据之间的参数相关性通过线性映射或非线性映射的方式将N维数据(158、55、女、152、150、7、6、90、80、37、36、12、12、9.5、7、5.1、4、150、140)投影到一个低维的数据空间中,从而起到数据降维的作用,该低维数据空间中的数据即为目标体征数据。在可选实施方式中,该降维算法可以为PCA算法、自编码算法(Autoencoder)等。
在另一种可能的实现方式中,根据N维数据之间的相关性将N维数据划分为M个分组,假设M=8,同一动态参数的特征数据相关联,性别与年龄相关联,体温与心率相关联,血清钾与血清钠相关联,则N维数据(158、55、女、152、150、7、6、90、80、37、36、12、12、9.5、7、5.1、4、150、140)可以为划分为数据分组1(158)、数据分组2(55、女)、数据分组3(152、150),数据分组4(7、6),数据分组5(90、80、37、36),数据分组6(12、12),数据分组7(9.5、7),数据分组8(5.1、4、150、140),然后分别从8个数据分组中选择其中一个数据作为目标体征数据。
在可选实施方式中,可以事先采集多个预设状态用户的动态体征参数的特征数据以及静态体征参数对应的数据,对这些数据进行分析实验和训练,从而确定动态体征参数与静态体征参数相互之间的相关性,即确定参数相关性。
S103,根据所述至少一个目标体征数据以及预设的基于极限梯度增强自适应算法的用户状态预测模型预测所述预设状态用户的状态变化发生概率。
具体实现中,将至少一个目标体征数据作为输入值送入用户状态预测模型中,从而得到所述预设状态用户的状态变化发生概率。
其中,预设状态用户的状态变化发生概率可以指预设状态用户由存活变为死亡的发生概率、预设状态用户由健康变为患上某一疾病的发生概率,预设状态用户由患病变为健康的发生概率等用户从预设状态变为其他状态的发生概率。
S104,输出所述预设状态用户的状态变化发生概率。
具体实现中,可以通过视图界面、声音提示等输出方式输出所述预设状态用户的状态变化发生概率。
在可选实施方式中,在所述状态变化发生概率大于预设阈值的情况下,可以以告警的方式输出所述预设状态用户的状态变化发生概率。例如,以声音报警、警示灯报警方式输出所述预设状态用户的状态变化发生概率,以起到提醒的作用。
在本发明实施例中,通过对预设状态用户的动态体征参数特征数据和静态体征参数对应的数据进行处理,得到目标体征数据,将目标体征数据作为输入值采用基于极限梯度增强自适应算法的用户状态预测模型对用户的状态变化发生概率进行预测,提前预知用户的状态变化发生概率可以防止意外事件发生,基于极限梯度增强自适应算法得到的用户状态预测模型内部结构透明,具备良好的解释性,同时可以提高预测的精度,另外,对用户的动态体征参数和静态体征参数进行降维处理可以简化模型的复杂度。
在一种可能的实现方式中,可以通过获取多个预设状态用户的历史数据以及实际的状态变化发生概率对用户状态预测模型进行训练,以得到最接近实际情况的用户状态预测模型,提高用户状态预测模型的精度。
再请参见图2,图2是本发明实施例提供的另一种预测用户状态变化的方法的流程示意图,如图所示所述方法包括:
S201,确定第一时间范围内的多个预设状态用户的目标体征数据和所述多个预设状态用户的用户状态。
具体实现中,首先,可以参照图1对应的实施例步骤S101的具体实现方式,分别获取各个预设状态用户的多个体征数据,该多个体征数据由各个预设状态用户的多个动态特征参数的特征数据和多个静态特征参数对应的数据构成,然后,参照图1对应的实施例步骤S102的具体实现方式,根据各个用户的多个体征数据以及参数相关性确定各个预设状态用户的目标体征数据,最后,再分别确定各个预设状态用户的用户状态。
在可选实施方式中,可以用0来代表用户发生状态变化之前的状态,用1代表发生状态变化之后的状态。例如,用户的状态变化发生概率为用户由存活变为死亡的发生概率,则可以用0代表用户的存活状态,用1代表用户的死亡状态;又如,用户的状态变化发生概率为用户由健康变为换上某一疾病的发生概率,则可以用0代表用户的健康状态,用1代表用户患上疾病的状态;又如,用户的状态变化发生概率为用户由患病变为健康的发生概率,则可以用0表示用户的患病状态,用1表示用户的健康状态。
S202,将所述多个预设状态用户的目标体征数据以及所述多个预设状态用户的用户状态作为训练样本,采用极限梯度增强自适应算法对用户状态预测模型进行训练得到最逼近所述训练样本的用户状态预测模型。
极限梯度增强自适应算法是一种自适应算法,通过在代价函数里加入正则项用于控制模型的复杂度,正则项中包含树的叶子节点个数、每个叶子节点上输出得分的L2模的平方和,使得学习出来的模型更加简单,防止拟合。
下面简单介绍采用极限梯度增强自适应算法对用户状态预测模型进行训练的过程,假设获取到的多个预设状态用户的目标体征数据以及用户状态如表3所示:
用户编号 用户状态 年龄 性别 格拉斯哥昏迷指数 心率
A 0 52 7 82
B 0 48 12 85
C 1 60 8 78
D 1 45 15 76
表3
首先,可以构建初始的分类树,例如,构建的分类树的初始模型如图3所示,其中,分类树1用于根据年龄和性别对用户进行分类,分类树2用于根据心率对用户进行分类,分类树3用于根据格拉斯哥昏迷指数对用户进行分类,a,b,c,d,e,f,g为每个叶子节点的初始权重系数,通过图3的分类树模型,可以得到用户A的总权重系数为:c+d+f,用户B的总权重系数为a+d+g,用户C的总权重系数为:c+e+f,用户D的总权重系数为b+e+g。
然后,根据预设的对应关系将各个用户的总权重系数转化为范围在0~1的状态转移概率,分别将转化得到的状态转移概率与各个用户状态的真实值相比较,判断c+d+f对应的状态转移概率是否接近于0、a+d+g对应的状态转移概率是否接近于0、c+e+f对应的状态转移概率是否接近于1以及b+e+g对应的状态转移概率是否接入于1,然后根据具体的判断结果调整各个叶子节点的权重系数或者重新划分分类树的节点等方式得到新的分类树或新的权重系数,再次计算各个用户的权重系数并转化为状态变化发生概率,再与用户状态的真实值相比较。通过多次调整,直到构建出最接近真实情况的分类树模型。
最后,将最接近真实情况的分类树模型作为用户状态预测模型。在后续过程中,则可以获取预设状态用户的目标体征数据,根据预设状态用户的目标体征数据在每棵分类树上找到匹配该用户的叶子节点,再将该匹配该用户的所有叶子节点对应的概率相加,即可得到预设状态用户的状态变化概率。
在可选实施方式中,得到用户状态预测模型后,在通过该模型预测用户的状态变化发生概率的同时,若用户的状态发生变化,可将该用户的目标体征数据和用户的真实状态值输入该模型中,以不断对用户状态预测模型进行修正。例如,通过该用户状态模型预测得到用户从存活变为死亡的概率为0.8,当该用户死亡时,可在该用户状态模型中将该用户的用户状态变化概率修正为1,以通过学习的方式对该模型进行调整。
S203,获取目标预设状态用户的目标体征数据。
S204,根据所述目标预设状态用户的目标体征数据以及所述用户状态预测模型预测所述目标预设状态用户的状态变化发生概率。
S205,输出所述目标预设状态用户的状态变化发生概率。
步骤S203~S205的具体实现方式可参考图1对应的实施例中步骤S102~S104,不再赘述。
在本发明实施例中,通过获取多个预设状态用户的历史数据以及实际的状态变化发生概率,采用极限梯度增强自适应算法对用户状态预测模型进行训练可以得到用户状态预测模型,通过获取目标预设状态用户的目标体征数据并将目标预设状态用户的目标体征数据送入用户状态预测模型中即可得到目标预设状态用户的状态变化发生概率,实现对用户的状态变化发生概率的预测,提前预知状态变化发生概率可以防止意外事件发生,另外,极限梯度增强自适应算法通过在代价函数里加入正则项,在提高预测精度的情况下可以控制模型的复杂度。
参见图4,图4是本发明实施例提供的一种预测用户状态变化的装置的结构示意图,如图所示,所述装置包括:
获取单元410,用于获取预设状态用户的多个体征数据,所述体征数据包括动态体征参数的特征数据和静态体征参数对应的数据;
在一种可能的实现方式中,获取单元410可以在一段时间内分别采集各个动态体征参数的多个数据,构成各个动态参数的时序数据,其中,时序数据指获取单元410在不同的时刻采集到的同一个动态体征参数对应的数据;然后获取单元410对各个动态体征参数的时序数据进行处理,最后对每个动态体征参数获取单元410只保留一个或多个具有代表性的特征数据作为该动态体征参数的特征数据,即获取单元410具体用于:分别获取处于所述预设状态用户在第二时间范围内各个动态体征参数对应的时序数据;分别对各个动态体征参数对应的时序数据进行数据处理得到所述各个动态体征参数的特征数据,进而确定所述多个动态体征参数的特征数据。
可选地,动态体征参数的特征数据可以为动态体征参数对应的时序数据的平均值、动态体征参数对应的时序数据的最大值、动态体征参数对应的时序数据的最小值、动态体征参数对应的时序数据的方差以及动态体征参数对应的时序数据的标准差中的至少一种特征数据。
第一确定单元420,用于根据所述多个体征数据以及参数相关性确定至少一个目标体征数据,其中,所述参数相关性为所述动态体征参数与所述静态体征参数之间的相关性;
在一种可能的实现方式中,在获取到的动态体征参数的特征数据的数量与静态体征参数对应的数据的数量之和小于第一预设阈值的情况下,第一确定单元420将所述动态体征参数的特征数据和所述静态体征参数对应的数据确定为目标体征数据。
在另一种可能的实现方式中,在获取到的动态体征参数的特征数据的数量与静态体征参数对应的数据的数量之和大于第一预设阈值的情况下,第一确定单元420对获取到的动态体征参数的特征数据与静态体征参数对应的数据进行降维处理,将降维得到的数据确定为目标体征数据。即第一确定单元420具体用于:根据所述多个体征数据构建N维数据,其中,N等于所述多个动态体征参数的特征数据的数量与所述静态体征参数对应的数据的数量之和;根据所述参数相关性对所述N维数据进行降维处理得到M维数据,其中,M为正整数且小于N;将所述M维数据中的各个数据确定为目标体征数据。其中,M可以小于或等于第一预设阈值。
在一种可能的实现方式中,第一确定单元420根据参数相关性采用主成分分析(Principle Component Analysis,PCA)算法或自编码(Autoencoder)算法对所述N维数据进行降维处理得到M维数据。
在另一种可能的实现方式中,第一确定单元420根据所述参数相关性将所述N维数据划分为M个数据分组;分别保留所述M个数据分组中的一个数据得到M维数据。
预测单元430,用于根据所述至少一个目标体征数据以及预设的基于极限梯度增强自适应算法的用户状态预测模型预测所述预设状态用户的状态变化发生概率;
具体实现中,预测单元430将至少一个目标体征数据作为输入值送入用户状态预测模型中,从而得到所述预设状态用户的状态变化发生概率。
输出单元440,用于根据所述状态变化发生概率输出所述预设状态用户的状态变化发生概率。
具体实现中,输出单元440通过视图界面、声音提示等输出方式输出所述预设状态用户的状态变化发生概率。
在可选实施方式中,在所述状态变化发生概率大于预设阈值的情况下,输出单元440以告警的方式输出所述预设状态用户的状态变化发生概率。例如,以声音报警、警示灯报警方式输出所述预设状态用户的状态变化发生概率。
可选地,所述装置还包括:
第二确定单元450,用于确定第一时间范围内的多个预设状态用户的目标体征数据和所述多个预设状态用户的用户状态;
具体实现中,第二确定单元450分别获取各个预设状态用户的多个体征数据,根据多个体征数据以及参数相关性确定各个预设状态用户的目标体征数据,再分别确定各个预设状态用户的用户状态。
训练单元460,用于将所述多个预设状态用户的目标体征数据以及所述多个预设状态用户的用户状态作为训练样本,采用极限梯度增强自适应算法对用户状态预测模型进行训练得到所述用户状态预测模型。
本发明实施例中,预测用户状态变化的装置通过获取用户的目标体征数据并将目标体征数据送入用户状态预测模型中即可得到用户的状态变化发生概率,实现对用户的状态变化发生概率的预测,防止意外事件发生。
参见图5,图5是本发明实施例提供的另一种预测用户状态变化的装置的结构示意图,该装置包括处理器51、存储器52以及输入输出接口53。处理器51连接到存储器52和输入输出接口53,例如处理器51可以通过总线连接到存储器52和输入输出接口53。
处理器51被配置为支持所述预测用户状态变化的装置执行图1或图2所述的预测用户状态变化的方法中相应的功能。该处理器51可以是中央处理器(central processingunit,CPU),网络处理器(network processor,NP),硬件芯片或者其任意组合。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,ASIC),可编程逻辑器件(programmable logic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device,CPLD),现场可编程逻辑门阵列(field-programmable gate array,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。
存储器52用于存储程序代码等。存储器52可以包括易失性存储器(英文:volatilememory),例如随机存取存储器(random access memory,缩写:RAM);存储器72也可以包括非易失性存储器(non-volatile memory),例如只读存储器(read-only memory,ROM),快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);存储器52还可以包括上述种类的存储器的组合。
输入输出接口53用于输入或输出数据,输入输出接口包括但不限于键盘、写字板、麦克风、音响、显示器、显示灯。
处理器51可以调用所述程序代码以执行以下操作:
通过所述输入输出接口53获取预设状态用户的多个体征数据,所述体征数据包括动态体征参数的特征数据和静态体征参数对应的数据;
根据所述多个体征数据以及参数相关性确定至少一个目标体征数据,其中,所述参数相关性为所述动态体征参数与所述静态体征参数之间的相关性;
根据所述至少一个目标体征数据以及预设的基于极限梯度增强自适应算法的用户状态预测模型预测所述预设状态用户的状态变化发生概率;
通过所述输入输出接口53根据所述状态变化发生概率输出所述预设状态用户的状态变化发生概率。
需要说明的是,各个操作的实现还可以对应参照图1或图2所示的方法实施例的相应描述。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (14)

1.一种预测用户状态变化的方法,其特征在于,包括:
获取预设状态用户的多个体征数据,所述体征数据包括动态体征参数的特征数据和静态体征参数对应的数据;
根据所述多个体征数据以及参数相关性确定至少一个目标体征数据,其中,所述参数相关性为所述动态体征参数与所述静态体征参数之间的相关性;
根据所述至少一个目标体征数据以及预设的基于极限梯度增强自适应算法的用户状态预测模型预测所述预设状态用户的状态变化发生概率;
输出所述预设状态用户的状态变化发生概率。
2.根据权利要求1所述的方法,其特征在于,所述获取预设状态用户的多个体征数据之前还包括:
确定第一时间范围内的多个预设状态用户的目标体征数据和所述多个预设状态用户的用户状态;
将所述多个预设状态用户的目标体征数据以及所述多个预设状态用户的用户状态作为训练样本,采用极限梯度增强自适应算法对用户状态预测模型进行训练得到所述用户状态预测模型。
3.根据权利要求1所述的方法,其特征在于,所述获取预设状态用户的多个动态体征参数的特征数据包括:
分别获取所述预设状态用户在第二时间范围内各个动态体征参数对应的时序数据;
分别对各个动态体征参数对应的时序数据进行数据处理得到所述各个动态体征参数的特征数据,进而确定多个动态体征参数的特征数据。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述动态体征参数的特征数据包括:动态体征参数对应的时序数据的平均值、动态体征参数对应的时序数据的最大值、动态体征参数对应的时序数据的最小值、动态体征参数对应的时序数据的方差以及动态体征参数对应的时序数据的标准差中的至少一种特征数据。
5.根据权利要求1所述的方法,其特征在于,所述根据所述多个体征数据以及参数相关性确定至少一个目标体征数据包括:
根据所述多个体征数据构建N维数据,其中,N等于所述动态体征参数的特征数据的数量与所述静态体征参数对应的数据的数量之和;
根据所述参数相关性对所述N维数据进行降维处理得到M维数据,其中,M为正整数且小于N;
将所述M维数据中的各个数据确定为目标体征数据。
6.根据权利要求5所述的方法,其特征在于,所述根据所述参数相关性对所述N维数据进行降维处理得到M维数据包括:
根据所述参数相关性采用主成分分析算法或自编码算法对所述N维数据进行降维处理得到M维数据。
7.根据权利要求5所述的方法,其特征在于,所述根据所述参数相关性对所述N维数据进行降维处理得到M维数据包括:
根据所述参数相关性将所述N维数据划分为M个数据分组;
分别保留所述M个数据分组中的一个数据得到M维数据。
8.根据权利要求1所述的方法,其特征在于,所述输出所述预设状态用户的状态变化发生概率包括:
在所述状态变化发生概率大于预设阈值的情况下,以告警提示的方式输出所述预设状态用户的状态变化发生概率。
9.一种预测用户状态变化的装置,其特征在于,包括:
获取单元,用于获取预设状态用户的多个体征数据,所述体征数据包括动态体征参数的特征数据和静态体征参数对应的数据;
第一确定单元,用于根据所述多个体征数据以及参数相关性确定至少一个目标体征数据,其中,所述参数相关性为所述动态体征参数与所述静态体征参数之间的相关性;
预测单元,用于根据所述至少一个目标体征数据以及预设的基于极限梯度增强自适应算法的用户状态预测模型预测所述预设状态用户的状态变化发生概率;
输出单元,用于输出所述预设状态用户的状态变化发生概率。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二确定单元,用于确定第一时间范围内的多个预设状态用户的目标体征数据和所述多个预设状态用户的用户状态;
训练单元,用于将所述多个预设状态用户的目标体征数据以及所述多个预设状态用户的用户状态作为训练样本,采用极限梯度增强自适应算法对用户状态预测模型进行训练得到所述用户状态预测模型。
11.根据权利要求9所述的装置,其特征在于,所述获取单元具体用于:
分别获取所述预设状态用户在第二时间范围内各个动态体征参数对应的时序数据;
分别对各个动态体征参数对应的时序数据进行数据处理得到所述各个动态体征参数的特征数据,进而确定多个动态体征参数的特征数据。
12.根据权利要求9所述的装置,其特征在于,所述第一确定单元具体用于:
根据所述多个体征数据构建N维数据,其中,N等于所述动态体征参数的特征数据的数量与所述静态体征参数对应的数据的数量之和;
根据所述参数相关性对所述N维数据进行降维处理得到M维数据,其中,M为正整数且小于N;
将所述M维数据中的各个数据确定为目标体征数据。
13.一种预测用户状态变化的装置,其特征在于,包括处理器、存储器以及输入输出接口,所述处理器、存储器和输入输出接口相互连接,其中,所述输入输出接口用于输入输出数据,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,执行如权利要求1-8任一项所述的方法。
14.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-8任一项所述的方法。
CN201710976803.4A 2017-10-19 2017-10-19 预测用户状态变化的方法和装置 Active CN107908819B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710976803.4A CN107908819B (zh) 2017-10-19 2017-10-19 预测用户状态变化的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710976803.4A CN107908819B (zh) 2017-10-19 2017-10-19 预测用户状态变化的方法和装置

Publications (2)

Publication Number Publication Date
CN107908819A true CN107908819A (zh) 2018-04-13
CN107908819B CN107908819B (zh) 2021-05-11

Family

ID=61841508

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710976803.4A Active CN107908819B (zh) 2017-10-19 2017-10-19 预测用户状态变化的方法和装置

Country Status (1)

Country Link
CN (1) CN107908819B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108986915A (zh) * 2018-07-24 2018-12-11 戴松世 人工智能的急性肾损伤的早期预测方法和装置
CN108992049A (zh) * 2018-06-14 2018-12-14 深圳鑫想科技有限责任公司 一种智能手机血压测试方法及系统
CN110998648A (zh) * 2018-08-09 2020-04-10 北京嘀嘀无限科技发展有限公司 一种分配订单的系统和方法
CN111126103A (zh) * 2018-10-30 2020-05-08 百度在线网络技术(北京)有限公司 用户人生阶段状态的判断方法和装置
CN111222577A (zh) * 2019-12-11 2020-06-02 上海联影智能医疗科技有限公司 态势感知的系统和方法
CN111612491A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 状态分析模型构建方法、分析方法及装置
CN111899862A (zh) * 2020-09-08 2020-11-06 平安科技(深圳)有限公司 一种呼吸机参数获取方法、装置、设备及存储介质
CN112989278A (zh) * 2019-12-12 2021-06-18 北京沃东天骏信息技术有限公司 确定状态数据的方法和装置
CN113057586A (zh) * 2021-03-17 2021-07-02 上海电气集团股份有限公司 一种病症预警方法、装置、设备及介质
CN113057588A (zh) * 2021-03-17 2021-07-02 上海电气集团股份有限公司 一种病症预警方法、装置、设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090138252A1 (en) * 2007-11-23 2009-05-28 Institute For Information Industry Method and system of evaluating disease severity
US20100179441A1 (en) * 2007-06-08 2010-07-15 Etsuko Kanai Device control device and device control method
CN103189883A (zh) * 2010-09-07 2013-07-03 里兰斯坦福初级大学理事会 医学评分系统及方法
CN104657574A (zh) * 2014-06-13 2015-05-27 苏州大学 一种医疗诊断模型的建立方法及装置
US20160342905A1 (en) * 2015-05-21 2016-11-24 Tata Consultancy Services Limited Multi-dimensional sensor data based human behaviour determination system and method
US20170147777A1 (en) * 2015-11-25 2017-05-25 Electronics And Telecommunications Research Institute Method and apparatus for predicting health data value through generation of health data pattern
CN106777891A (zh) * 2016-11-21 2017-05-31 中国科学院自动化研究所 一种数据特征选择和预测方法及装置
CN106874663A (zh) * 2017-01-26 2017-06-20 中电科软件信息服务有限公司 心脑血管疾病风险预测方法及系统
CN106951719A (zh) * 2017-04-10 2017-07-14 荣科科技股份有限公司 临床诊断模型的构建方法及构建系统、临床诊断系统
CN107066791A (zh) * 2016-12-19 2017-08-18 银江股份有限公司 一种基于病人检验结果的辅助疾病诊断方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100179441A1 (en) * 2007-06-08 2010-07-15 Etsuko Kanai Device control device and device control method
US20090138252A1 (en) * 2007-11-23 2009-05-28 Institute For Information Industry Method and system of evaluating disease severity
CN103189883A (zh) * 2010-09-07 2013-07-03 里兰斯坦福初级大学理事会 医学评分系统及方法
CN104657574A (zh) * 2014-06-13 2015-05-27 苏州大学 一种医疗诊断模型的建立方法及装置
US20160342905A1 (en) * 2015-05-21 2016-11-24 Tata Consultancy Services Limited Multi-dimensional sensor data based human behaviour determination system and method
US20170147777A1 (en) * 2015-11-25 2017-05-25 Electronics And Telecommunications Research Institute Method and apparatus for predicting health data value through generation of health data pattern
CN106777891A (zh) * 2016-11-21 2017-05-31 中国科学院自动化研究所 一种数据特征选择和预测方法及装置
CN107066791A (zh) * 2016-12-19 2017-08-18 银江股份有限公司 一种基于病人检验结果的辅助疾病诊断方法
CN106874663A (zh) * 2017-01-26 2017-06-20 中电科软件信息服务有限公司 心脑血管疾病风险预测方法及系统
CN106951719A (zh) * 2017-04-10 2017-07-14 荣科科技股份有限公司 临床诊断模型的构建方法及构建系统、临床诊断系统

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108992049A (zh) * 2018-06-14 2018-12-14 深圳鑫想科技有限责任公司 一种智能手机血压测试方法及系统
CN108986915B (zh) * 2018-07-24 2021-07-06 戴松世 人工智能的急性肾损伤的早期预测方法和装置
CN108986915A (zh) * 2018-07-24 2018-12-11 戴松世 人工智能的急性肾损伤的早期预测方法和装置
CN110998648A (zh) * 2018-08-09 2020-04-10 北京嘀嘀无限科技发展有限公司 一种分配订单的系统和方法
CN111126103A (zh) * 2018-10-30 2020-05-08 百度在线网络技术(北京)有限公司 用户人生阶段状态的判断方法和装置
CN111126103B (zh) * 2018-10-30 2023-09-26 百度在线网络技术(北京)有限公司 用户人生阶段状态的判断方法和装置
CN111612491B (zh) * 2019-02-25 2024-01-26 北京嘀嘀无限科技发展有限公司 状态分析模型构建方法、分析方法及装置
CN111612491A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 状态分析模型构建方法、分析方法及装置
CN111222577B (zh) * 2019-12-11 2024-01-26 上海联影智能医疗科技有限公司 态势感知的系统和方法
CN111222577A (zh) * 2019-12-11 2020-06-02 上海联影智能医疗科技有限公司 态势感知的系统和方法
US11966852B2 (en) 2019-12-11 2024-04-23 Shanghai United Imaging Intelligence Co., Ltd. Systems and methods for situation awareness
CN112989278A (zh) * 2019-12-12 2021-06-18 北京沃东天骏信息技术有限公司 确定状态数据的方法和装置
CN111899862A (zh) * 2020-09-08 2020-11-06 平安科技(深圳)有限公司 一种呼吸机参数获取方法、装置、设备及存储介质
CN111899862B (zh) * 2020-09-08 2024-03-19 平安科技(深圳)有限公司 一种呼吸机参数获取方法、装置、设备及存储介质
CN113057588A (zh) * 2021-03-17 2021-07-02 上海电气集团股份有限公司 一种病症预警方法、装置、设备及介质
CN113057586A (zh) * 2021-03-17 2021-07-02 上海电气集团股份有限公司 一种病症预警方法、装置、设备及介质
CN113057586B (zh) * 2021-03-17 2024-03-12 上海电气集团股份有限公司 一种病症预警方法、装置、设备及介质

Also Published As

Publication number Publication date
CN107908819B (zh) 2021-05-11

Similar Documents

Publication Publication Date Title
CN107908819A (zh) 预测用户状态变化的方法和装置
Kumar et al. Performance analysis of machine learning algorithms on diabetes dataset using big data analytics
WO2021120936A1 (zh) 一种基于多任务学习模型的慢病预测系统
Zohora et al. Forecasting the risk of type ii diabetes using reinforcement learning
Ho et al. Septic shock prediction for patients with missing data
Lee Patient-specific predictive modeling using random forests: an observational study for the critically ill
Al-Mualemi et al. A deep learning-based sepsis estimation scheme
Ho et al. Imputation-enhanced prediction of septic shock in ICU patients
CN113270192A (zh) 基于动静态数据结合与深度自编码器的血透风险预测系统
Sonet et al. Analyzing patterns of numerously occurring heart diseases using association rule mining
Dervishi Fuzzy risk stratification and risk assessment model for clinical monitoring in the ICU
Xie et al. AutoScore-Survival: Developing interpretable machine learning-based time-to-event scores with right-censored survival data
Moreno-Sánchez Data-driven early diagnosis of chronic kidney disease: development and evaluation of an explainable AI model
Alghatani et al. Precision clinical medicine through machine learning: using high and low quantile ranges of vital signs for risk stratification of ICU patients
CN105718726A (zh) 基于粗糙集的医疗辅助检查系统知识获取和推理方法
Du et al. The effects of deep network topology on mortality prediction
CN114049952A (zh) 一种基于机器学习的术后急性肾损伤智能预测方法及装置
CN115985513B (zh) 一种基于多组学癌症分型的数据处理方法、装置及设备
Arzeno et al. Designing optimal mortality risk prediction scores that preserve clinical knowledge
Zhang et al. Modelling EHR timeseries by restricting feature interaction
Silva et al. Fuzzy modeling for predicting patient survival rate in icu with aki
CN114880429A (zh) 基于实体关系映射的医学成果推荐方法及系统
Hu et al. Dynamic prediction of life-threatening events for patients in intensive care unit
Madhuri et al. Novel Internet of Things Based Disease Diagnosis Framework for Smart Healthcare Schemes using Combined Optimized Artificial Intelligence Approach
Cunha et al. Fuzzy modeling to predict short and long-term mortality among patients with acute kidney injury

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant