发明内容
有鉴于此,本发明的目的在于提供一种健康画像的方法、装置、设备和系统,以克服目前普通用户无法获取健康数据的问题。
为实现以上目的,本发明采用如下技术方案:
一方面,本发明提供了一种健康画像的方法,包括:
获取目标用户在预设的医疗平台的医疗数据;
通过预定义的质控规则,对所述医疗数据进行质量控制处理,以得到有效性和稀疏性均处于预设范围的质控数据;
对所述质控数据进行降维处理,得到主要维度数据;
通过BP算法,计算所述主要维度数据中各个维度对应的初始权重信息;
将各个主要维度数据,以及,各个主要维度数据对应的初始权重信息输入到预先训练的分类模型中,得到输出的维度类别和各个维度类别对应的类别权重数据;其中,每个维度类别包括至少一个主要维度数据;
根据类别权重数据,对归一化处理后的各个维度类别中的主要维度数据进行加权统计,得到各个维度类别的评分信息;
根据所述维度类别,以及所述维度类别对应的评分信息,确定所述目标用户的健康画像报告。
进一步地,以上所述的健康画像的方法,所述将各个主要维度数据,以及,各个主要维度数据对应的初始权重信息输入到预先训练的分类模型中之前,包括:
将预设数量的样本维度和样本权重信息作为训练样本;
将所述训练样本输入到预先构建的分类初始模型中进行训练,得到所述分类模型。
进一步地,以上所述的健康画像的方法,所述分类初始模型包括SVM分类函数;
所述SVM分类函数的表达式为:
其中,ai表示引入的拉格朗日乘子,ai≥0;i=1,2,3,…,n;xi,yi表示在特征空间的样本数据;x表示特征向量;b表示截距。
进一步地,以上所述的健康画像的方法,所述预设的医疗平台包括院前急救平台、创伤救治平台、HIS、PACS、LIS、RAS、基层公卫系统、家庭医生系统和绩效平台的至少一种。
进一步地,以上所述的健康画像的方法,所述预定义的质控规则包括数据非空判断规则和日期型数据验证规则的至少一种。
进一步地,以上所述的健康画像的方法,所述维度类别包括个人行为、社会环境、遗传生理、医疗保健和环境因素的至少一种。
另一方面,本发明还提供了一种健康画像的装置,包括:
获取模块,用于获取目标用户在预设的医疗平台的医疗数据;
质控模块,用于通过预定义的质控规则,对所述医疗数据进行质量控制处理,以得到有效性和稀疏性均处于预设范围的质控数据;
降维模块,用于对所述质控数据进行降维处理,得到主要维度数据;
计算模块,用于通过BP算法,计算所述主要维度数据中各个维度对应的初始权重信息;
输入模块,用于将各个主要维度数据,以及,各个主要维度数据对应的初始权重信息输入到预先训练的分类模型中,得到输出的维度类别和各个维度类别对应的类别权重数据;其中,每个维度类别包括至少一个主要维度数据;
统计模块,用于根据类别权重数据,对归一化处理后的各个维度类别中的主要维度数据进行加权统计,得到各个维度类别的评分信息;
确定模块,用于根据所述维度类别,以及所述维度类别对应的评分信息,确定所述目标用户的健康画像报告。
进一步地,以上所述的健康画像的装置,还包括训练模块;
所述训练模块,用于将各个主要维度数据,以及,各个主要维度数据对应的初始权重信息输入到预先训练的分类模型中之前,将预设数量的样本维度和样本权重信息作为训练样本;将所述训练样本输入到预先构建的分类初始模型中进行训练,得到所述分类模型。
另一方面,本发明还提供了一种健康画像的设备,包括处理器和存储器,所述处理器与所述存储器相连:
其中,所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器,用于存储所述程序,所述程序至少用于执行以上任一项所述的方法。
另一方面,本发明还提供了一种健康画像的系统,包括医院协同平台、基层系统平台,以及,以上所述的健康画像的设备;
所述健康画像的设备分别与所述医院协同平台、所述基层系统平台进行数据传输。
本发明的健康画像的方法、装置、设备和系统,方法包括获取目标用户在预设的医疗平台的医疗数据;通过预定义的质控规则,对医疗数据进行质量控制处理,以得到有效性和稀疏性均处于预设范围的质控数据;对质控数据进行降维处理,得到主要维度数据;通过BP算法,计算主要维度数据中各个维度对应的初始权重信息;将各个主要维度数据,以及,各个主要维度数据对应的初始权重信息输入到预先训练的分类模型中,得到输出的维度类别和各个维度类别对应的类别权重数据;其中,每个维度类别包括至少一个主要维度数据;根据类别权重数据,对归一化处理后的各个维度类别中的主要维度数据进行加权统计,得到各个维度类别的评分信息;根据维度类别,以及维度类别对应的评分信息,确定目标用户的健康画像报告。本申请的技术方案,面对海量异构数据时,能够快速有效的获取与处理健康画像有效数据,最终得到个人健康画像数据,而且本申请整合了多个医疗平台的医疗数据,为普通用户提供了多维度的健康画像。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
图1是本发明健康画像的方法一种实施例提供的流程图。
如图1所示,本实施例的健康画像的方法可以包括以下步骤:
S11、获取目标用户在预设的医疗平台的医疗数据。
本申请中,可以与预设的医疗平台对接,获取目标用户在预设的医疗平台的医疗数据。
其中,预设的医疗平台可以包括医院协同平台和基层系统平台中的至少一个平台。
医院协同平台是提供医养数据的医疗卫生单位,包括院前急救平台、创伤救治平台、医院信息系统(Hospital Information System,HIS)、医学影像信息系统(PictureArchiving and Communication Systems,PACS)、实验室信息管理系统(LaboratoryInformation Management System,LIS)和远程访问服务系统(Remote Access Service,RAS)中的至少一种。需要说明的是,此处并没有形成对医院协同平台的限定,医院协同平台还可以包括其他系统,本实施例不做一一说明。
基层系统平台是现有的医疗卫生平台,包括基层公卫系统、家庭医生系统和绩效平台中的至少一种。需要说明的是,此处并没有形成对基层系统平台的限定,基层系统平台还可以包括其他系统,本实施例不做一一说明。
基层公卫系统提供药品、材料、疾病名称以及患者主索引(Enterprise MasterPatient Index,EMPI)等信息;家庭医生系统提诊后跟踪信息、大病/慢病历史信息以及患者访谈信息等;绩效系统获取病案首页信息以及院内绩效系统指标监控数据。
需要说明的是,以上医疗数据均获得授权,同时对患者信息进行脱敏处理,仅在卫生系统内部网络内使用。
医疗数据本质上是异构数据,在一些可选的实施例中,可以通过ETL(Extract-Transform-Load)模块,对接提供医养数据的医疗卫生单位和现有的医疗卫生平台中的异构数据,即医疗数据。
在一些可选的实施例中,可以配置更多维度的数据,采用爬虫爬取公开信息。例如,爬取医院内部的科室或医护人员信息、医院周边环境信息,用于分析环境对卫生健康的影响权重。具体地,可以在爬取完成后判断是否需要增加维度数据,如果是的话,可以继续进行数据的爬取工作,如果不需要增加维度数据,可以不再进行数据的爬取工作,继续后面的处理流程。
S12、通过预定义的质控规则,对医疗数据进行质量控制处理,以得到有效性和稀疏性均处于预设范围的质控数据。
预定义的质控规则包括数据非空判断规则和日期型数据验证规则中的至少一种。
本实施例中,获取到医疗数据后,通过预定义的质控规则,如:数据非空判断规则和日期型数据验证规则等,保证维度数据有效性和稀疏性处于合理范围。
S13、对质控数据进行降维处理,得到主要维度数据。
在很多情形下,异构数据中的维度之间可能存在相关性,从而导致问题的分析更加复杂。如果分别对每个维度对应的指标进行分析,分析往往是孤立的,无法完全利用数据中的信息。而盲目减少指标会损失很多有用的信息,从而产生错误的结论。
由于各维度信息之间存在一定的相关性,可以对异构数据中的维度进行主成分分析,将多个关系紧密的维度变成尽可能少的新维度,以进行降维处理,使产生的新维度是两两不相关的,那么就可以用较少的综合指标分别代表存在于各个维度中的信息。本实施例中,将新维度作为主要维度信息。
S14、通过BP算法,计算主要维度数据中各个维度对应的初始权重信息。
本实施例中,通过误差反向传播(Error Back Propagation, BP)算法,计算主要维度数据中各个维度对应的初始权重信息。
S15、将各个主要维度数据,以及,各个主要维度数据对应的初始权重信息输入到预先训练的分类模型中,得到输出的维度类别和各个维度类别对应的类别权重数据。
本实施例中,预先训练有分类模型。将各个主要维度数据,以及,各个主要维度数据对应的初始权重信息输入到预先训练的分类模型中,得到输出的维度类别和各个维度类别对应的类别权重数据。其中,每个维度类别包括至少一个主要维度数据。
也就是说,通过预先训练的分类模型,将主要维度数据进行了分类,得到多个维度类别,每个维度类别对应新的类别权重数据。
图2是本发明健康画像的方法一种实施例提供的计算引擎处理模型。
如图2所示,输入层(Input Layer)输入的主要维度数据,包括10个维度,在隐藏层(Hidden Layer)进行分类处理,处理后包括6个维度,在输出层(Output Layer)输出对应的维度类别,包括1个类别。
例如,输入的主要维度数据包括:
锻炼频率、每次锻炼时长、坚持锻炼时长、吸烟状况、日吸烟量、开始吸烟年龄、戒烟年龄、饮酒频率、日饮酒量、戒酒标志、戒酒年龄、开始饮酒年龄、醉酒标志、精神系统疾病、老年人健康状态自我评估、老年人认知功能、老年人情感状态、低收入人口标识、药物过敏史、手术史、外伤史、遗传病史、运动功能状态、健康评价异常、是否老年人、是否高血压、是否2型糖尿病、是否严重精神障碍患者、是否残疾、职业病危险因素、家庭厕所类别、家庭禽畜栏类别、环境危险因素暴露类别。
输出的维度类别包括个人行为、社会环境、遗传生理、医疗保健、环境因素。其中:
个人行为:权重0.4。包括健康体检信息表:锻炼频率、每次锻炼时长、坚持锻炼时长、吸烟状况、日吸烟量、开始吸烟年龄、戒烟年龄、饮酒频率、日饮酒量、戒酒标志、戒酒年龄、开始饮酒年龄、醉酒标志、精神系统疾病、老年人健康状态自我评估、老年人认知功能、老年人情感状态;
社会环境:权重0.27。包括个人基本信息表:低收入人口标识;
遗传生理:权重0.25。包括健康体检信息表:药物过敏史、手术史、外伤史、遗传病史、运动功能状态、健康评价异常、是否老年人、是否高血压、是否2型糖尿病、是否严重精神障碍患者、是否残疾;
医疗保健:权重0;
环境因素:权重0.08。包括职业病危险因素、家庭厕所类别、家庭禽畜栏类别、环境危险因素暴露类别。
S16、根据类别权重数据,对归一化处理后的各个维度类别中的主要维度数据进行加权统计,得到各个维度类别的评分信息。
因不同特征的量化范围不同,需要对主要维度数据进行归一化处理,获取每个主要维度数据归一化后的数值。
根据类别权重数据,对各个维度类别中的归一化后的数值进行多元一次方程求加权值,得到各个维度类别的评分信息。
S17、根据维度类别,以及维度类别对应的评分信息,确定目标用户的健康画像报告。
根据维度类别,以及维度类别对应的评分信息,确定目标用户的健康画像报告。健康画像报告输出时,可以根据维度类别对应的时间,按照时间序列进行排列,进而使目标用户能够得到有时间序列的个人健康画像数据。
本实施例的健康画像的方法,包括获取目标用户在预设的医疗平台的医疗数据;通过预定义的质控规则,对医疗数据进行质量控制处理,以得到有效性和稀疏性均处于预设范围的质控数据;对质控数据进行降维处理,得到主要维度数据;通过BP算法,计算主要维度数据中各个维度对应的初始权重信息;将各个主要维度数据,以及,各个主要维度数据对应的初始权重信息输入到预先训练的分类模型中,得到输出的维度类别和各个维度类别对应的类别权重数据;其中,每个维度类别包括至少一个主要维度数据;根据类别权重数据,对归一化处理后的各个维度类别中的主要维度数据进行加权统计,得到各个维度类别的评分信息;根据维度类别,以及维度类别对应的评分信息,确定目标用户的健康画像报告。本实施例的技术方案,面对海量异构数据时,能够快速有效的获取与处理健康画像有效数据,最终得到个人健康画像数据,而且本申请整合了多个医疗平台的医疗数据,为普通用户提供了多维度的健康画像。
进一步地,在以上实施例的S15对应的步骤之前,还可以执行以下步骤:
将预设数量的样本维度和样本权重信息作为训练样本;将训练样本输入到预先构建的分类初始模型中进行训练,得到分类模型。
具体地,可以选择预设数量的样本维度和样本权重信息作为训练样本,将训练样本分期训练集和测试集,使用训练集中的样本迭代训练分类初始模型,使用测试集中的样本对分类初始模型进行测试,按测试结果的准确率和召回率进行评估,当准确率和召回率达到预设的标准值时,训练完成,得到分类模型。
可选的,分类初始模型包括SVM分类函数;
SVM分类函数的表达式为:
其中,ai表示引入的拉格朗日乘子,ai≥0;i=1,2,3,…,n;xi,yi表示在特征空间的样本数据;x表示特征向量;b表示截距。
可选的,由于测试集中不同的用户在计算所需的维度中可能会缺失SVM计算出来的某个分类器特征信息,可以在测试集下分别测试N个分类器的分类效果,统计错误分类个数。分类效果可以与测试集进行对比,按准确率和召回率进行评估。
基于一个总的发明构思,本发明还提供了一种健康画像的装置,用于实现上述方法实施例。
图3是本发明健康画像的装置一种实施例提供的结构示意图。
如图3所示,本实施例的健康画像的装置,包括:
获取模块21,用于获取目标用户在预设的医疗平台的医疗数据;
质控模块22,用于通过预定义的质控规则,对医疗数据进行质量控制处理,以得到有效性和稀疏性均处于预设范围的质控数据;
降维模块23,用于对质控数据进行降维处理,得到主要维度数据;
计算模块24,用于通过BP算法,计算主要维度数据中各个维度对应的初始权重信息;
输入模块25,用于将各个主要维度数据,以及,各个主要维度数据对应的初始权重信息输入到预先训练的分类模型中,得到输出的维度类别和各个维度类别对应的类别权重数据;其中,每个维度类别包括至少一个主要维度数据;
统计模块26,用于根据类别权重数据,对归一化处理后的各个维度类别中的主要维度数据进行加权统计,得到各个维度类别的评分信息;
确定模块27,用于根据维度类别,以及维度类别对应的评分信息,确定目标用户的健康画像报告。
本实施例的健康画像的装置,获取模块21获取目标用户在预设的医疗平台的医疗数据;质控模块22通过预定义的质控规则,对医疗数据进行质量控制处理,以得到有效性和稀疏性均处于预设范围的质控数据;降维模块23对质控数据进行降维处理,得到主要维度数据;计算模块24通过BP算法,计算主要维度数据中各个维度对应的初始权重信息;输入模块25将各个主要维度数据,以及,各个主要维度数据对应的初始权重信息输入到预先训练的分类模型中,得到输出的维度类别和各个维度类别对应的类别权重数据;其中,每个维度类别包括至少一个主要维度数据;统计模块26根据类别权重数据,对归一化处理后的各个维度类别中的主要维度数据进行加权统计,得到各个维度类别的评分信息;确定模块27根据维度类别,以及维度类别对应的评分信息,确定目标用户的健康画像报告。本实施例的技术方案,面对海量异构数据时,能够快速有效的获取与处理健康画像有效数据,最终得到个人健康画像数据,而且本申请整合了多个医疗平台的医疗数据,为普通用户提供了多维度的健康画像。
在一些可选的实施例中,还包括训练模块;
训练模块,用于将各个主要维度数据,以及,各个主要维度数据对应的初始权重信息输入到预先训练的分类模型中之前,将预设数量的样本维度和样本权重信息作为训练样本;将训练样本输入到预先构建的分类初始模型中进行训练,得到分类模型。
分类初始模型包括SVM分类函数;
SVM分类函数的表达式为:
其中,ai表示引入的拉格朗日乘子,ai≥0;i=1,2,3,…,n;xi,yi表示在特征空间的样本数据;x表示特征向量;b表示截距。
预设的医疗平台包括院前急救平台、创伤救治平台、HIS、PACS、LIS、RAS、基层公卫系统、家庭医生系统和绩效平台的至少一种。
预定义的质控规则包括数据非空判断规则和日期型数据验证规则的至少一种。
维度类别包括个人行为、社会环境、遗传生理、医疗保健和环境因素的至少一种。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于一个总的发明构思,本发明还提供了一种健康画像的设备,用于实现上述方法实施例。
图4是本发明健康画像的设备一种实施例提供的结构示意图。
如图4所示,本实施例的健康画像的设备包括处理器31和存储器32,处理器31与存储器32相连。其中,处理器31用于调用并执行存储器32中存储的程序;存储器32用于存储程序,程序至少用于执行以上实施例中的健康画像的方法。
基于一个总的发明构思,本发明还提供了一种健康画像的系统,用于实现上述方法实施例。
图5是本发明健康画像的系统一种实施例提供的结构示意图。
如图5所示,本实施例的健康画像的系统包括医院协同平台41、基层系统平台42,以及,以上实施例的健康画像的设备43;
健康画像的设备43分别与医院协同平台41、基层系统平台42通过无线网络相连,以进行数据传输。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。