CN110300159B - 一种基于边缘计算的传感云数据安全低成本存储方法 - Google Patents
一种基于边缘计算的传感云数据安全低成本存储方法 Download PDFInfo
- Publication number
- CN110300159B CN110300159B CN201910496964.2A CN201910496964A CN110300159B CN 110300159 B CN110300159 B CN 110300159B CN 201910496964 A CN201910496964 A CN 201910496964A CN 110300159 B CN110300159 B CN 110300159B
- Authority
- CN
- China
- Prior art keywords
- data
- metadata
- cloud
- sample set
- residual error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/568—Storing data temporarily at an intermediate stage, e.g. caching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W84/00—Network topologies
- H04W84/18—Self-organising networks, e.g. ad-hoc networks or sensor networks
Abstract
本发明涉及一种基于边缘计算的传感云数据安全低成本存储方法,包括:底层传感器将收集的数据发送至边缘服务器;所述边缘服务器对接收的传感数据进行预处理,利用差分算法把传感数据分为元数据与残差两部分;所述边缘服务器对元数据与残差进行加密,并将残差发送至云端服务器进行存储,并将元数据部分存储在边缘服务器,另一部分发送至本地服务器存储。本发明对传感数据差分处理成元数据以及残差两部分,对数据加密后基于冗余策略将数据分块存储,残差部分的数据块存储在云端,元数据部分数据块存储在边缘层,部分数据块存储在本地以防止数据恢复,进一步提高了数据安全,提高资源利用率,降低云端存储成本并减少了传输带宽消耗。
Description
技术领域
本发明属于传感云系统中的数据存储的隐私安全领域,特别涉及一种基于边缘计算的传感云数据安全低成本存储方法。
背景技术
无处不在的计算和传感云系统的发展持续消除着物理和数字世界之间的界限。传感云作为无线传感器网络的计算模型,促进了资源共享,实现了大规模的传感器网络。为了应对传感器数据存储和处理的日益增长的需求,云计算提供了必要的计算和存储资源,实现了大规模的数据采集、处理和存储,然而这种新的数据外包服务模式,导致了数据安全问题,同时随着大数据时代的发展,大量数据存储在云端也给其造成了一定的压力,也增加了这种按需付费模式的用户成本。
实现传感云数据安全低成本的存储主要在于两个方面,一方面保护数据的隐私安全在于保证数据的机密性、完整性和可用性。另一方面降低云端的存储成本有利于将资源利用最大化,提高存储效率。对于如何保护数据的隐私安全,一类常见的方式就是在云端采用各种加密政策,例如基于属性的加密方案,该方案可以很好地保护数据内容和特征不受攻击,并防止用户非法检索到。但这种方式的主要问题是基于云服务提供商是可信的,然而在大多数情况下云服务提供商“诚实且好奇”的,一旦云服务提供商不可信,那这种方法就会失效。
对于如何降低云端存储成本,一种方法是对存储的数据采取去重算法,它通过对重复的数据去冗余来减少所需要存储的数据,然而这种方法是以放弃数据的安全性为代价的,删除过多的冗余块将使数据承受一定的风险。再如还有的一类方法采用数据压缩方法,例如字典编码算法,它通过压缩重复的字符和字符串对数据进行编码,使用一些代码替换这些字符和字符串,进行压缩数据,但这种压缩模式效率过低,并且在恢复数据时可能是有损的,失去了一定的安全性。
云存储能够给用户带来各种便利,而与此同时带来的事安全性与成本的问题,目前针对这些问题都有一些解决方案,不幸的是,以上方案都无法并行解决所存在的两类问题,同时技术上也存在一定的复杂性是云端负载增加。除此之外,上述研究方案都没有解决云服务提供商本身“诚实且好奇”的根本特性。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于边缘计算的传感云数据安全低成本存储方法,引入边缘计算对云存储进行改善,利用边缘计算的数据处理能力与缓存能力对无线传感网络收集的数据进行预处理,再将处理过后的数据分别存入本地-边缘-云,形成三层存储以保证数据安全以及降低云端存储成本。
为了实现上述目的,本发明的技术方案是:
一种基于边缘计算的传感云数据安全低成本存储方法,包括:
底层传感器将收集的数据发送至边缘服务器;
所述边缘服务器对接收的传感数据进行预处理,利用差分算法把传感数据分为元数据与残差两部分;其中残差为原始传感数据与元数据的偏差;
所述边缘服务器对元数据与残差进行加密,并将残差发送至云端服务器进行存储,并将元数据部分存储在边缘服务器,另一部分发送至本地服务器存储。
优选的,所述差分算法包括低误差差分算法,具体为获取使偏差达到最小的数据作为元数据,如下:
其中,x为使偏差Re达到最小的数据,x1,x2,...,xn表示传感数据数据对象中的某个属性值,n表示属性个数。
优选的,所述差分算法包括基于聚类的差分算法,具体包括:
令X={X1,X2,...,Xi,...,Xn}作为一个样本集,其中包括n个对象数据,每个样本具有p个属性,即Xi={Xi1,Xi2,...,Xip};首先对样本集进行抽样,并根据BWP指标选择在[kmin,kmax]范围内的最佳聚类数kopt,其中,kmin=2,
空间中任意两点之间的平均距离定义为样本之间的距离除以次数之和,这两个样本是从样本集中任意选取的,表示如下:
定义样本Xi的密度Dens(Xi)为:以Xi为中心,以α×avgDist为半径画圆中包含的数据对象,即当满足条件d(Xi,Xj)≤α×avgDist时,count()函数累计递增1,α表示半径调整系数,默认为1,如下:
样本集X的平均密度被定义为:
高密度点集定义为数据对象的集合,这些数据对象的密度是样本集X平均密度的倍数,表示如下:
D={Xh}
其中,Xh((Xh)∈X)是满足Dens(Xh)≥β×avgDens的数据对象,表示高密度点,β为密度调整系数,默认为1;样本集X的簇中心为X的平均值,定义如下:
由此将获得的每个簇中心作为元数据,并由相应的元数据计算出残差。
采用上述方案后,本发明的有益效果是:
(1)本发明利用边缘层对需要存储到云端的数据进行处理找出最佳的元数据或是元数据群,并利用边缘计算的计算能力得到该组数据的相对应的残差,即原始数据与元数据的偏差,进而将其加密并按照一定的比例对其进行三层存储以避免敌手利用冗余策略恢复完整数据盗取隐私;
(2)本发明基于边缘计算的计算能力,能够减轻云端的负担;
(3)本发明基于边缘计算的缓存能力,能暂存及时消息,减少传输时间,同时减轻云端的存储负担;
(4)优化后的结果提高了数据的安全性,减少了传输带宽消耗。
以下结合附图及实施例对本发明作进一步详细说明,但本发明的一种基于边缘计算的传感云数据安全低成本存储方法不局限于实施例。
附图说明
图1为本发明的基于边缘计算的三层存储架构图;
图2为本发明的差分存储基本结构图;
图3为本发明的加密流程图;
图4为基于正态分布的不同算法效率比较图;
图5为基于正态分布数据量的带宽消耗比较图;
图6为基于正态分布块数解码与传输时间比较图;
图7为基于正态分布不同数据量加解密时间比较图。
具体实施方式
以下将结合本发明附图,对本发明实施例中的技术方案进行详细描述和讨论。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
研究发现,无线传感网络收集的数据大多围绕某一个或多个值上下波动,将该值称之为元数据。本发明一种基于边缘计算的传感云数据安全低成本存储方法,利用边缘层对需要存储到云端的数据进行处理找出最佳的元数据或是元数据群,并利用边缘计算的计算能力得到该组数据的相对应的残差,即原始数据与元数据的偏差,进而将其加密并按照一定的比例对其进行三层存储以避免敌手利用冗余策略恢复完整数据盗取隐私。通过本发明方法,打破了用户不再控制外包数据的传统模式并达到了保证数据安全、降低云存储成本、降低传输带宽消耗的三重目的。
参见图1所示,本发明中,当无线传感网络中有大量数据需要传送到云端(云服务器)的时候,首先利用边缘计算对数据做一个预处理,把数据分为元数据(即特定值)与残差两部分分别处理。利用加密算法对两部分数据进行加密,将残差块存储在云端,并从反向利用冗余策略将处理后的元数据块按比例存储在边缘端(边缘服务器)以及本地(本地服务器),充分利用资源,进而高效解决传感云数据安全存储问题。
具体的,所述预处理方法包括低误差差分算法和基于聚类的差分算法。
低误差差分算法基于均方根误差的思想,找出与其他数据偏差最小的值作为元数据。算法的输入是物理传感器收集到的一组数据,输出该组数据中的一个基本元数据。首先,求出偏差公式。然后,基于数学原理求出最小偏差。最后将使得到最小偏差的值作为元数据并利用元数据进行三层存储,具体算法表示如下:
基于聚类的差分算法的具体实现如下:
假设X={X1,X2,...,Xi,...,Xn}作为一个样本集,其中包括n个对象数据,每个样本具有p个属性,即Xi={Xi1,Xi2,...,Xip}。首先对样本集进行抽样,并根据BWP(Between-within-Proportion)指标选择在[kmin,kmax]范围内的最佳聚类数kopt(一般情况下),将该样本集划分为kopt个簇,即每个簇中包含b个样本,将簇中心设置为空间中两个点的欧氏距离可以被定义为:
空间中任意两点之间的平均距离定义为样本之间的距离除以次数之和。这两个样本是从样本集中任意选取的,公式可以描述为:
样本Xi的密度定义为:以Xi为中心,以α×avgDist为半径画圆(包括边缘)中包含的数据对象,即当满足条件d(Xi,Xj)≤α×avgDist时,count()函数累计递增1,α是半径调整系数,默认值为1,表示如下:
其中,i=1,2,...,n;j=1,2,...,n。样本集X的平均密度可以被定义为:
高密度点集定义为数据对象的集合,这些数据对象的密度是样本集X平均密度的倍数,可以被描述为:
D={Xh} (5)
其中,Xh((Xh)∈X)是满足Dens(Xh)≥β×avgDens的数据对象,表示高密度点,β为密度调整系数,默认为1。样本集X的簇中心是X的平均值,可以定义为:
由此可以得出每个簇中心作为元数据,并由相应的元数据计算出残差,利用所提取到的这两个关键信息分级存储,这将大大减少云的负担,提高数据的安全性,并为用户降低一定的成本。基于聚类的差分数据算法表示如下:
参见图2所示,为差分存储基本结构,用户将数据传给边缘设备之后,边缘设备将数据差分处理成元数据以及残差两部分,再进行加密之后开始传输。
参见图3所示,为差分数据之后的整个加密流程,首先进行AES加密之后再基于冗余思想分块处理,为之后传输相应块数的数据给云端以及本地打下基础。
参见图4所示,为基于正态分布的不同算法效率比较图,其中,POSS是左边占原数据大小的百分比,POSS-算法1指的是用算法一做的POSS实验,POSS-算法2指的是用算法二做的POSS实验,TOT-算法1指的是用算法一做的TOT实验,TOT-算法2指的是用算法二做的TOT实验;图5为基于正态分布数据量的带宽消耗比较图,其中,传统算法指直接将数据传输到云端的算法;图6为基于正态分布块数解码与传输时间比较图;图7为基于正态分布不同数据量加解密时间比较图。从图4至图7可以看出,本发明的基于边缘计算的三层差分存储能有效的降低云端存储成本,降低传输的带宽消耗,并在一定程度上提高数据存储的安全性能。
以上仅为本发明实例中一个较佳的实施方案。但是,本发明并不限于上述实施方案,凡按本发明所做的任何均等变化和修饰,所产生的功能作用未超出本方案的范围时,均属于本发明的保护范围。
Claims (1)
1.一种基于边缘计算的传感云数据安全低成本存储方法,其特征在于,包括:
底层传感器将收集的数据发送至边缘服务器;
所述边缘服务器对接收的传感数据进行预处理,利用差分算法把传感数据分为元数据与残差两部分;其中残差为原始传感数据与元数据的偏差;
所述边缘服务器对元数据与残差进行加密,并将残差发送至云端服务器进行存储,并将元数据部分存储在边缘服务器,另一部分发送至本地服务器存储;
所述差分算法包括低误差差分算法,具体为获取使偏差达到最小的数据作为元数据,如下:
其中,x为使偏差Re达到最小的数据,x1,x2,…,xn表示传感数据数据对象中的某个属性值,n表示属性个数;
所述差分算法包括基于聚类的差分算法,具体包括:
令X={X1,X2,…,Xi,…,Xn}作为一个样本集,其中包括n个对象数据,每个样本具有p个属性,即Xi={Xi1,Xi2,…,Xip};首先对样本集进行抽样,并根据BWP指标选择在[kmin,kmax]范围内的最佳聚类数kopt,其中,kmin=2,
空间中任意两点之间的平均距离定义为样本之间的距离除以次数之和,这两个样本是从样本集中任意选取的,表示如下:
定义样本Xi的密度Dens(Xi)为:以Xi为中心,以α×avgDist为半径画圆中包含的数据对象,即当满足条件d(Xi,Xj)≤α×avgDist时,count()函数累计递增1,α表示半径调整系数,默认为1,如下:
样本集X的平均密度被定义为:
高密度点集定义为数据对象的集合,这些数据对象的密度是样本集X平均密度的倍数,表示如下:
D={Xh}
其中,Xh((Xh)∈X)是满足Dens(Xh)≥β×avgDens的数据对象,表示高密度点,β为密度调整系数,默认为1;样本集X的簇中心为X的平均值,定义如下:
由此将获得的每个簇中心作为元数据,并由相应的元数据计算出残差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910496964.2A CN110300159B (zh) | 2019-06-10 | 2019-06-10 | 一种基于边缘计算的传感云数据安全低成本存储方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910496964.2A CN110300159B (zh) | 2019-06-10 | 2019-06-10 | 一种基于边缘计算的传感云数据安全低成本存储方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110300159A CN110300159A (zh) | 2019-10-01 |
CN110300159B true CN110300159B (zh) | 2021-08-31 |
Family
ID=68027777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910496964.2A Active CN110300159B (zh) | 2019-06-10 | 2019-06-10 | 一种基于边缘计算的传感云数据安全低成本存储方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110300159B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110933154A (zh) * | 2019-11-23 | 2020-03-27 | 上海上实龙创智慧能源科技股份有限公司 | 一种面向污水处理物联网应用的边云数据协同方法及系统 |
CN113114661A (zh) * | 2021-04-08 | 2021-07-13 | 湘潭大学 | 一种面向智能楼宇物联网设备的云边协同轻量化数据处理方法 |
CN115632881B (zh) * | 2022-12-07 | 2023-05-12 | 深圳市亲邻科技有限公司 | 社区服务系统架构及社区服务数据保存方法 |
CN115934298A (zh) * | 2023-01-12 | 2023-04-07 | 南京南瑞信息通信科技有限公司 | 一种前后端协作的电力监控mec卸载方法、系统及存储介质 |
CN116841754B (zh) * | 2023-08-31 | 2023-12-15 | 中国电子信息产业集团有限公司第六研究所 | 一种低轨卫星边缘计算服务系统及方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104135362A (zh) * | 2014-07-21 | 2014-11-05 | 南京大学 | 一种基于差分隐私发布的数据的可用性计算方法 |
CN107241321A (zh) * | 2017-05-26 | 2017-10-10 | 陕西科技大学 | 一种个人医疗信息隐私保护方法 |
CN108040056A (zh) * | 2017-12-15 | 2018-05-15 | 福州大学 | 基于物联网的安全医疗大数据系统 |
CN108093401A (zh) * | 2017-12-13 | 2018-05-29 | 电子科技大学 | 一种基于边缘计算的移动智能终端隐私保护系统及方法 |
CN109495476A (zh) * | 2018-11-19 | 2019-03-19 | 中南大学 | 一种基于边缘计算的数据流差分隐私保护方法及系统 |
KR20190040834A (ko) * | 2017-10-11 | 2019-04-19 | 에스케이텔레콤 주식회사 | 가상 네트워크 보안 장치 및 가상 네트워크 보안 방법 |
CN109740346A (zh) * | 2018-12-29 | 2019-05-10 | 南方电网科学研究院有限责任公司 | 基于电力系统边缘计算的隐私保护方法及系统 |
CN109743727A (zh) * | 2018-12-26 | 2019-05-10 | 南京邮电大学 | 基于雾计算的高效隐私保护感知大数据收集方法 |
-
2019
- 2019-06-10 CN CN201910496964.2A patent/CN110300159B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104135362A (zh) * | 2014-07-21 | 2014-11-05 | 南京大学 | 一种基于差分隐私发布的数据的可用性计算方法 |
CN107241321A (zh) * | 2017-05-26 | 2017-10-10 | 陕西科技大学 | 一种个人医疗信息隐私保护方法 |
KR20190040834A (ko) * | 2017-10-11 | 2019-04-19 | 에스케이텔레콤 주식회사 | 가상 네트워크 보안 장치 및 가상 네트워크 보안 방법 |
CN108093401A (zh) * | 2017-12-13 | 2018-05-29 | 电子科技大学 | 一种基于边缘计算的移动智能终端隐私保护系统及方法 |
CN108040056A (zh) * | 2017-12-15 | 2018-05-15 | 福州大学 | 基于物联网的安全医疗大数据系统 |
CN109495476A (zh) * | 2018-11-19 | 2019-03-19 | 中南大学 | 一种基于边缘计算的数据流差分隐私保护方法及系统 |
CN109743727A (zh) * | 2018-12-26 | 2019-05-10 | 南京邮电大学 | 基于雾计算的高效隐私保护感知大数据收集方法 |
CN109740346A (zh) * | 2018-12-29 | 2019-05-10 | 南方电网科学研究院有限责任公司 | 基于电力系统边缘计算的隐私保护方法及系统 |
Non-Patent Citations (1)
Title |
---|
Big Data Reduction for a Smart City’s Critical Infrastructural Health Monitoring;Tian Wang;《IEEE》;20180315;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110300159A (zh) | 2019-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110300159B (zh) | 一种基于边缘计算的传感云数据安全低成本存储方法 | |
CN107465656B (zh) | 一种基于云计算的安防监控大数据处理方法及系统 | |
CN101859323B (zh) | 密文全文检索系统 | |
CN107154945A (zh) | 一种基于纠删码的多云碎片化安全存储方法及系统 | |
US8156168B2 (en) | Method and system for data security | |
CN107046812A (zh) | 一种数据保存方法和装置 | |
CN110166221B (zh) | 一种密文数据压缩存储结构rcpe及数据动态读写方法 | |
CN110636141A (zh) | 基于云雾协同的多云存储系统及其管理方法 | |
Barik et al. | GeoBD2: Geospatial big data deduplication scheme in fog assisted cloud computing environment | |
CN114153374A (zh) | 一种元数据与数据共同存储的分布式存储系统 | |
CN110968452A (zh) | 一种智能电网云存储中可安全去重的数据完整性验证方法 | |
CN109783456B (zh) | 去重结构搭建方法、去重方法、文件取回方法、去重系统 | |
CN103248713A (zh) | 一种同步盘数据安全保护方法 | |
WO2014089843A1 (zh) | 一种数据加密、解密的方法及设备 | |
CN102855292B (zh) | 密文全文检索系统的安全覆盖网构建方法及对应的全文检索方法 | |
Zheng et al. | An efficient multikeyword fuzzy ciphertext retrieval scheme based on distributed transmission for Internet of Things | |
CN114791788B (zh) | 一种基于区块链的数据存储方法及装置 | |
CN113986853A (zh) | 一种区块链数据存储与共享方法、系统、设备及终端 | |
Gang et al. | Dynamic deduplication algorithm for cross-user duplicate data in hybrid cloud storage | |
Preetha Bini et al. | Proof of retrieval and ownership for secure fuzzy deduplication of multimedia data | |
Rajput et al. | Analysis on deduplication techniques for storage of data in cloud | |
Guo et al. | A high-efficiency blockchain sharded storage expansion model | |
Chhabraa et al. | An optimized data duplication strategy for cloud computing: Dedup with ABE and bloom filters | |
He et al. | Cloud computing data privacy protection method based on blockchain | |
Gao et al. | Secure deduplication method based on tag clustering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |