发明内容
为了解决如何对物联网健康大数据多种数据样本进行安全风险管理、风险态势预测、排查、治理的问题,本发明提供一种物联网健康大数据的处理方法。
根据本发明实施例的物联网健康大数据的处理方法,包括如下步骤:
S1、确定物联网健康医疗大数据的安全数据格式要求,采用数据采集模块收集物联网健康医疗大数据,采用统一格式对通信通道中被篡改以及丢失的数据等异常数据进行数据采集和预处理后统一编码;
S2、对步骤S1采集到的数据由分级引擎模块进行风险分级处理,分级方法为对在节点采集到的数据进行特征提取,并利用不同的特征子集对物联网健康大数据样本进行分类;
S3、采用神经网络特征提取并学习的分类算法同时引入AdaBoost集成学习方法神经网络特征提取到的物联网健康大数据态势点集进行迭代优化,生成物联网健康大数据网络态势模型。
根据本发明的一些实施例,在所述步骤S2,通过安全风险分级管理机制和风险排查治理机制相结合的模式对物联网医疗健康大数据网络安全领域实现高精准的等级保护。
根据本发明的一些实施例,在所述步骤S2包括如下具体步骤:
S21、对物联网健康大数据集采用规范化矢量表示,即,V(d)={d1,w1(d),d2,w2(d),...,dn,wn(d)},其中,dn为物联网健康大数据集D中的一条数据,wn(d)为dn在D中的权值,权值累计为1;
S22、对物联网健康大数据集进行评价函数构建。
根据本发明的一些实施例,在所述步骤S22包括如下具体步骤:
S221、假设有n个评价对象,m个数据指标;
S222、建立评价对象因素指标集U={u1,u2,…,un};
S223、建立评价集V={v1,v2,…,vm};
S224、建立单因素评价,即建立一个从U到F(V)的映射;
γ:→F(V)
由γ可以诱导出基本关系,得到相关矩阵:
S225、确定评价函数,
设A=(a1,…,am)表示各因素权重,则评价函数为:
采用算子(·,+)计算,
且
对向量(b
1,…b
m)去模糊化,m个评价依次记为1,2,…,m,整体评价分数为:
根据本发明的一些实施例,在所述步骤S3中,分类算法采用神经网络对物联网健康大数据进行特征学习的方法,建立物联网健康大数据网络态势初始模型,再采用AdaBoost集成学习方法对初始模型进行迭代优化,并对异常数据进行排查,形成物联网健康大数据网络态势模型。
根据本发明的一些实施例,在所述步骤S3中,所述机器学习采用神经网络对物联网健康大数据进行特征学习的过程由正向传播和误差反向传播两个环节组成,所述正向传播是利用t时期的数据特征值与t-1时期的数据特征值的差值(变化率)和t时期的数据特征值与t-1时期的时间间隔组成的向量作为输入,经网络连接权值和偏差的求和计算传递到隐含层,并通过传递函数计算得到隐含层的输出,然后传送到输出层;所述反向传播是将误差信号按原来连接通路反向计算,调整各层神经元之间的连接权值和偏差以提高准确性。
根据本发明的一些实施例,在所述步骤S3包括如下具体步骤:
S31、假设m个初始学习的特征样本集为:s={(x
1,y
1),(x
2,x
2),…(x
m,y
m)},其中x
m为特征样本,y
m表示不同的风险问题分类,各个样本初始权重d
1,d
2,…d
m均设置为
算法的最大迭代次数为T,初始迭代次数为1;
S32、针对m个训练集,通过AdaBoost集成学习方法对神经网络的连接点权重值进行优化,得到最优的连接点的权重值;
S33、利用优化后的神经网络对m个训练集进行训练,获得第t次的物联网健康大数据网络态势模型ht;
S34、计算并保存第t次的物联网健康大数据网络态势模型h
t的权重ω
t,根据物联网健康大数据网络态势模型h
t,对m个训练集的预测误差绝对值和小于设定值或达到最大迭代次数,得到最终的物联网健康大数据网络态势模型:
根据本发明的一些实施例,在所述步骤S1中,所述数据采集模块包括数据过滤模块和数据预处理模块,所述数据采集模块用于筛除物联网健康医疗大数据中的错误数据和无效数据。
根据本发明的一些实施例,在所述步骤S2中,采用分级引擎模块对物联网健康医疗大数据的特征进行提取、分类和分级,所述分级引擎模块包括特征提取模块和分级模型模块。
根据本发明实施例的物联网健康大数据的处理方法,数据模型更加精确,运用神经网络模式处理数据,大大促进了物联网医疗健康大数据态势预测、风险排查、治理,隐私数据安全采用风险分级管控模式可以更好的对隐私数据进行等级保护,可以辅助安全相关部门及早做好应对措施。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面参照图1描述根据本发明实施例的物联网健康大数据的处理方法。
根据本发明实施例的物联网健康大数据的处理方法,包括如下步骤:
S1、确定物联网健康医疗大数据的安全数据格式要求,采用数据采集模块收集物联网健康医疗大数据,采用统一格式对通信通道中被篡改以及丢失的数据等异常数据进行数据采集和预处理后统一编码;其中,物联网健康医疗大数据包括:患者的住院信息、住院病案信息、人口个案信息、电子健康档案和电子健康卡注册使用信息等,这些信息都记录在各大医院、社区等的服务器数据库,网络协议/网络IP地址以及连接方式等也都不尽相同,健康数据的显示/存储方式主要有电子文档、图像、纸质文件、不同尺寸/材质的影像图片等,针对不同的数据类型进行风险分级,产生不同的分类,并定期进行风险排查的方式进行漏洞扫描,降低预测误差,保证数据安全可靠。
S2、对步骤S1采集到的数据由分级引擎模块进行风险分级处理,分级方法为对在节点采集到的数据进行特征提取,并利用不同的特征子集对物联网健康大数据样本进行分类;
S3、采用神经网络特征提取并学习的分类算法同时引入AdaBoost集成学习方法神经网络特征提取到的物联网健康大数据态势点集进行迭代优化,生成物联网健康大数据网络态势模型。
根据本发明的一些实施例,在所述步骤S2,通过安全风险分级管理机制和风险排查治理机制相结合的模式对物联网医疗健康大数据网络安全领域实现高精准的等级保护,由此可以提升数据的保护效果,防止数据被篡改、丢失或是泄漏。
根据本发明的一些实施例,在所述步骤S2包括如下具体步骤:
S21、对物联网健康大数据集采用规范化矢量表示,即,V(d)={d1,w1(d),d2,w2(d),...,dn,wn(d)},其中,dn为物联网健康大数据集D中的一条数据,wn(d)为dn在D中的权值,权值累计为1;
S22、对物联网健康大数据集进行评价函数构建。
根据本发明的一些实施例,在所述步骤S22包括如下具体步骤:
S221、假设有n个评价对象,m个数据指标;
S222、建立评价对象因素指标集U={u1,u2,…,un};
S223、建立评价集V={v1,v2,…,vm};
S224、建立单因素评价,即建立一个从U到F(V)的映射;
γ:→F(V)
由γ可以诱导出基本关系,得到相关矩阵:
S225、确定评价函数,
设A=(a1,…,am)表示各因素权重,则评价函数为:
采用算子(·,+)计算,
且
对向量(b
1,…b
m)去模糊化,m个评价依次记为1,2,…,m,整体评价分数为:
根据本发明的一些实施例,在所述步骤S3中,分类算法采用神经网络对物联网健康大数据进行特征学习的方法,建立物联网健康大数据网络态势初始模型,再采用AdaBoost集成学习方法对初始模型进行迭代优化,并对异常数据进行排查,形成物联网健康大数据网络态势模型,神经网络特征学习和AdaBoost集成学习的相结合,可以提升态势模型的学习能力和效果,进而提升数据模型的准确度和模拟的真实性。
根据本发明的一些实施例,在所述步骤S3中,所述机器学习采用神经网络对物联网健康大数据进行特征学习的过程由正向传播和误差反向传播两个环节组成,所述正向传播是利用t时期的数据特征值与t-1时期的数据特征值的差值(变化率)和t时期的数据特征值与t-1时期的时间间隔组成的向量作为输入,经网络连接权值和偏差的求和计算传递到隐含层,并通过传递函数计算得到隐含层的输出,然后传送到输出层;所述反向传播是将误差信号按原来连接通路反向计算,调整各层神经元之间的连接权值和偏差以提高准确性。
根据本发明的一些实施例,在所述步骤S3包括如下具体步骤:
S31、假设m个初始学习的特征样本集为:s={(x
1,y
1),(x
2,x
2),…(x
m,y
m)},其中x
m为特征样本,y
m表示不同的风险问题分类,各个样本初始权重d
1,d
2,…d
m均设置为
算法的最大迭代次数为T,初始迭代次数为1;
S32、针对m个训练集,通过AdaBoost集成学习方法对神经网络的连接点权重值进行优化,得到最优的连接点的权重值;
S33、利用优化后的神经网络对m个训练集进行训练,获得第t次的物联网健康大数据网络态势模型ht;
S34、计算并保存第t次的物联网健康大数据网络态势模型h
t的权重ω
t,根据物联网健康大数据网络态势模型h
t,对m个训练集的预测误差绝对值和小于设定值或达到最大迭代次数,得到最终的物联网健康大数据网络态势模型:
根据本发明的一些实施例,在所述步骤S1中,不同数据类型的实时网络数据流(包括MAC层、网络层、传输层、应用层),由数据采集模块进行收集进入,所述数据采集模块包括数据过滤模块和数据预处理模块,所述数据采集模块用于筛除物联网健康医疗大数据中的错误数据和无效数据。
根据本发明的一些实施例,在所述步骤S2中,采用分级引擎模块对物联网健康医疗大数据的特征进行提取、分类和分级,所述分级引擎模块包括特征提取模块和分级模型模块。
具体而言,对步骤S1采集到的数据由分级引擎模块进行风险分级处理,分级引擎模块由两个小模块组成,分别是特征提取模块和分级模型模块。
根据本发明的一些实施例,在所述步骤S3中,评价函数的权重来自于外部攻击,权重最高;通信节点的数据量大小,权重按大小分配;通信交叉点越多,权重越大。
方法是:对在节点采集到的数据进行特征提取,并利用不同的特征子集对物联网健康大数据样本进行分类,具体包括如下步骤:
对物联网健康大数据集采用规范化矢量表示,
即V(d)={d1,w1(d),d2,w2(d),...,dn,wn(d)},其中dn为物联网健康大数据集D中的一条数据,wn(d)为dn在D中的权值,
权重的评价函数如下:
(1)外部攻击,权重最高;
(2)通信节点的数据量大小,权重按大小分配;
(3)通信交叉点越多,权重越大。
在所述步骤S2中,对物联网健康大数据集进行评价函数构建,评价函数过程如下:
S221、假设有n个评价对象,m个数据指标;
S222、建立评价对象因素指标集U={u1,u2,…,un};
S223、建立评价集V={v1,v2,…,vm};
S24、建立单因素评价,即建立一个从U到F(V)的映射;
γ:→F(V)
由γ可以诱导出基本关系,得到相关矩阵:
S225、确定评价函数,
设A=(a1,…,am)表示各因素权重,则评价函数为:
采用算子(·,+)计算,
且
对向量(b
1,…b
m)去模糊化,m个评价依次记为1,2,…,m,整体评价分数为:
根据本发明的一些实施例,在所述步骤S3中,分类算法采用神经网络对物联网健康大数据进行特征学习的方法,建立物联网健康大数据网络态势初始模型,再采用AdaBoost集成学习方法,对这个初始模型进行迭代优化,也就是进行异常数据的排查,形成物联网健康大数据网络态势模型,其中,机器学习主要包括以下步骤:首先确定网络层数,接着选取节点数,接着选择隐含神经元数目,最后设计算法。
所述机器学习采用神经网络对物联网健康大数据进行特征学习的过程由正向传播和误差反向传播两个环节组成,所述正向传播是利用t时期的数据特征值与t-1时期的数据特征值的差值(也就是变化率)和t时期的数据特征值与t-1时期的时间间隔组成的向量作为输入,经网络连接权值和偏差的求和计算传递到隐含层,并通过传递函数计算得到隐含层的输出,然后传送到输出层;所述反向传播是将误差信号按原来连接通路反向计算,调整各层神经元之间的连接权值和偏差以提高准确性,体步骤如下:
S31、假设m个初始学习的特征样本集为:s={(x
1,y
1),(x
2,x
2),…(x
m,y
m)},
S32、针对m个训练集,通过AdaBoost集成学习方法对神经网络的连接点权重值进行优化,得到最优的连接点的权重值;
S33、利用优化后的神经网络对m个训练集进行训练,获得第t次的物联网健康大数据网络态势模型ht;
S34、计算并保存第t次的物联网健康大数据网络态势模型h
t的权重ω
t,根据物联网健康大数据网络态势模型h
t,对m个训练集的预测误差绝对值和小于设定值或达到最大迭代次数,得到最终的物联网健康大数据网络态势模型:
以此,可以根据现有数据以及新增数据进行风险排查迭代模拟,提前将影响到物联网医疗健康大数据安全的各项安全隐患设置防护措施,降低风险。
根据本发明实施例的物联网健康大数据的处理方法,数据模型更加精确,运用神经网络模式处理数据,大大促进了物联网医疗健康大数据态势预测、风险排查、治理,隐私数据安全采用风险分级管控模式可以更好的对隐私数据进行等级保护,可以辅助安全相关部门及早做好应对措施。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。