CN116307294B - 基于差分隐私和改进萤火虫的lbs空间众包任务分配方法 - Google Patents

基于差分隐私和改进萤火虫的lbs空间众包任务分配方法 Download PDF

Info

Publication number
CN116307294B
CN116307294B CN202310573280.4A CN202310573280A CN116307294B CN 116307294 B CN116307294 B CN 116307294B CN 202310573280 A CN202310573280 A CN 202310573280A CN 116307294 B CN116307294 B CN 116307294B
Authority
CN
China
Prior art keywords
task
data set
worker
space
differential privacy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310573280.4A
Other languages
English (en)
Other versions
CN116307294A (zh
Inventor
谢贻富
陈磊
王光云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei City Cloud Data Center Co ltd
Original Assignee
Hefei City Cloud Data Center Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei City Cloud Data Center Co ltd filed Critical Hefei City Cloud Data Center Co ltd
Priority to CN202310573280.4A priority Critical patent/CN116307294B/zh
Publication of CN116307294A publication Critical patent/CN116307294A/zh
Application granted granted Critical
Publication of CN116307294B publication Critical patent/CN116307294B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063114Status monitoring or status determination for a person or group
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/02Protecting privacy or anonymity, e.g. protecting personally identifiable information [PII]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/03Protecting confidentiality, e.g. by encryption
    • H04W12/033Protecting confidentiality, e.g. by encryption of the user plane, e.g. user's traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及基于差分隐私和改进萤火虫的LBS空间众包任务分配方法,与现有技术相比解决了对用户及工作者隐私保护不足、无法保证LBS运行效率的缺陷。本发明包括以下步骤:获取任务数据集和工作者数据集;数据集的聚类划分;差分隐私加噪;聚类结果匹配及加噪;LBS空间众包任务的分配。本发明解决了空间众包任务分配过程中工作者位置隐私及用户位置隐私泄露的问题,可在确保数据隐私安全与可用性的同时,降低总旅行距离,提高任务分配成功率,实现空间众包任务的有效分配。

Description

基于差分隐私和改进萤火虫的LBS空间众包任务分配方法
技术领域
本发明涉及大数据分析处理技术领域,具体来说是基于差分隐私和改进萤火虫的LBS空间众包任务分配方法。
背景技术
随着互联网和智能终端设备的快速发展,社会上出现大量的基于位置的服务(Location Based Services, LBS)和应用软件(见文献冯登国,张敏,叶宇桐. 基于差分隐私模型的位置轨迹发布技术研究.电子与信息学报,2020,42(01):74-88.)。
这些服务和应用通常需要用户持续地提供动态的位置和相关信息,导致用户隐私暴露的风险性较大,带来严重的安全威胁。如Strava发布了用户活动热图,网友挖掘出基地位置、个人住址等。HMM模型可以识别出Gowalla数据集中大部分的匿名用户(见文献CHENZhenyu, FU Yanyan, ZHANG Min, et al. The de anonymization method based onuser spatio-temporal mobility trace. The 19th International Conference onInformation and Communications Security, Beijing, China, 2017: 459–471.)。
根据文献记载,30个LBS应用中有一半的应用存在用户位置泄露的情况(见文献ZHAO P, LI J, ZENG F, et al. ILLIA: enabling k-anonymity-based privacypreserving against location injection attacks in continuous LBS queries. IEEEInternet of Things Journal, 2018, 5(2): 1033-1042.)。
如何在提升隐私保护的前提下保证LBS应用的正常运行效率,这是IT界、电商产业等领域共同面临和研究的重要方向。空间众包作为LBS应用的主要类别之一,指用户根据需求发布自定义的任务,平台根据用户者需求和工作者技能、位置距离等属性进行匹配并安排工作者到达指定位置完成任务的一类新兴发展的众包,如美团外卖、滴滴打车等等。
目前空间众包的任务分配主要基于平台服务器,用户在发布任务时需要上传位置及相关信息,工作者为了能够接单需要动态上传实时位置,而空间众包平台服务器的安全性能目前普遍不能很好保证。
因此,如何在保持甚至提高原有的空间众包任务分配效果的同时加强数据隐私保护是当下亟需解决的一个问题。
发明内容
本发明的目的是为了解决现有技术中对用户及工作者隐私保护不足、无法保证LBS运行效率的缺陷,提供一种基于差分隐私和改进萤火虫的LBS空间众包任务分配方法来解决上述问题。
为了实现上述目的,本发明的技术方案如下:
一种基于差分隐私和改进萤火虫的LBS空间众包任务分配方法,包括以下步骤:
获取任务数据集和工作者数据集:待时空单元发布空间众包任务后,空间众包服务器获取到任务数据集U,并向可信服务器上传请求,可信服务器根据时空单元提供的时空单元信息提取到工作者数据集W;
数据集的聚类划分:对任务数据集U和工作者数据集W进行聚类划分;
差分隐私加噪:可信服务器采用中心化差分隐私方法在中加入拉普拉斯噪声,中加入拉普拉斯噪声,得到噪声数据集/>;聚类结果匹配及加噪:空间众包服务器通过优化目标函数/>将数据集/>和数据集/>进行匹配,得到最优的匹配结果/>、/>,并将其上传至可信服务器;可信服务器采用中心化差分隐私方法在/>、/>中加入拉普拉斯噪声,即/>,并将其再次回传至空间众包服务器;LBS空间众包任务的分配:空间众包服务器采用改进的萤火虫算法,对加噪后的/>和/>进行匹配,并生成任务分配方案,按此任务分配方案,LBS进行空间众包任务分配。所述数据集的聚类划分包括以下步骤:
可信服务器利用K-means聚类方法对工作者数据集W进行聚类,生成W1、W2⋯⋯Wk等K个不同的聚类结果,对应质心的数据集,对应簇的数据集;空间众包服务器利用K-means聚类方法对任务数据集U进行聚类,生成U1、U2⋯⋯Uk等K个不同的聚类结果,对应质心的数据集/>,对应簇的数据集/>。所述的差分隐私加噪包括以下步骤:
初始化数据集;对数据集/>加入Laplace噪声,得到噪声数据集,其中,/>是可信服务器对工作者数据集W聚类分析后生成的聚类结果所对应的质心数据集,/>为拉普拉斯函数,/>为函数/>的全局敏感度,/>为差分隐私预算,/>是加入拉普拉斯噪声后的质心数据集。
所述的聚类结果匹配及加噪包括以下步骤:对空间众包服务器输入噪声数据集和数据集/>;设定优化目标函数/>,通过计算目标函数/>的最小值得到最优匹配结果/>、/>,/>的计算公式为:/> 其中,/>为目标函数,表示修正后的工作者位置数据集和任务数据集之间的平均距离,距离越小则两者匹配性越好,距离越大则两者匹配性越差;/>为约束条件,假设在空间众包任务分配时对位置数据集进行k-means均值聚类,且有k个簇,当簇为k时工作者位置数据集聚类得到的一组质心为/>,对应簇包含工作者的数量为/>,空间众包任务数据集聚类得到的一组质心为/>,对应的簇的任务数量为/>,/>表示某个工作者和某个任务的距离;将根据目标函数/>计算得到的最小值,也即最优匹配结果/>、/>上传至可信服务器;可信服务器采用中心化差分隐私方法在/>、/>中加入拉普拉斯噪声,即、/>,其中,/>为函数/>的全局敏感度,/>为差分隐私预算,/>为拉普拉斯函数;可信服务器将加噪后的/>回传至空间众包服务器。
所述的LBS空间众包任务的分配包括以下步骤:
监测工作者实时状态,当工作者处于在线状态且位置实时上传中心服务器时,工作者待分配任务;若工作者正在完成任务则无法接收新的任务,而且任务发布到达截止时间后自动取消;
空间众包服务器采用改进的萤火虫算法进行任务匹配,输出任务分配方案并将其发送给对应工作者;
改进的萤火虫算法以离散萤火虫算法DGSO为基础,并在变异因子引入五种新的移动策略,以提高寻优效率;其中五种新的移动策略保证移动后的解依旧是可行解,包括:内侧反演(/>)、外侧反演(/>)、左侧反演(/>)、右侧反演(/>)、插队(/>);任务分配的具体步骤包括:输入最优匹配的工作者数据集/>和任务数据集/>;随机初始化改进的萤火虫算法的参数,初始化编码,并对应任务分配;在自适应因子调整下,通过轮盘赌或反演、互换等移动策略不断更新萤火虫荧光素,计算对应的目标函数值;
检查和处理不可行解;
对比公告板,如比公告板更优,则替代之;
当达到迭代次数时,输出任务分配方案并进行解码,其中目标函数计算公式为:,其中,/>代表总旅行距离,越小越好;/>代表分配成功率,越大越好; />、/>是让目标函数中两部分数据出于统一量纲的系数;/>和/>分别表示任务集合、空间众包服务器给任务分配的对应的工作者集合;工作者接收到任务分配方案后,若选择接受任务则自身不再属于可工作的工作者,任务结束前不会再被分配新的任务;若选择不接受则依旧属于可工作的工作者,被分配其它的任务。
有益效果
本发明的一种基于差分隐私和改进萤火虫的LBS空间众包任务分配方法,与现有技术相比解决了空间众包任务分配过程中工作者位置隐私及用户位置隐私泄露的问题,可在确保数据隐私安全与可用性的同时,降低总旅行距离,提高任务分配成功率,实现空间众包任务的有效分配。
本发明通过结合差分隐私加噪和聚类匹配的方法,得到差分隐私保护的可用性较强的数据集,加强了隐私工作者位置隐私及用户位置隐私保护;通过划分时空单元和“延迟匹配”策略,将空间众包任务分配这个动态问题转化为静态地组合优化问题,并用改进的萤火虫算法优化空间众包任务分配的结果,实现空间众包任务的有效分配。
附图说明
图1为本发明的方法顺序图;
图2为本发明所涉及的算法流程框架图;
图3a为本发明在小规模数据集sd1下的总旅行距离展示图;
图3b为本发明在小规模数据集sd2下的总旅行距离展示图;
图3c为本发明在小规模数据集sd3下的总旅行距离展示图;
图3d为本发明在小规模数据集sd4下的总旅行距离展示图;
图3e为本发明在小规模数据集sd5下的总旅行距离展示图;
图3f为本发明在小规模数据集sd6下的总旅行距离展示图;
图4a为本发明在小规模数据集sd1下的任务分配成功率展示图;
图4b为本发明在小规模数据集sd2下的任务分配成功率展示图;
图4c为本发明在小规模数据集sd3下的任务分配成功率展示图;
图4d为本发明在小规模数据集sd4下的任务分配成功率展示图;
图4e为本发明在小规模数据集sd5下的任务分配成功率展示图;
图4f为本发明在小规模数据集sd6下的任务分配成功率展示图。
具体实施方式
为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:
本发明所述的一种基于差分隐私和改进萤火虫的LBS空间众包任务分配方法,一方面提出了两阶段加噪的模式,首先对空间位置数据进行聚类,对数据进行降维,其次对降维后的数据进行差分隐私加噪,可以显著降低噪声对任务分配结果的影响,提升任务分配的成功率和可用性;另一方面使用离散编码、改进移动策略等方式改进萤火虫算法,使其适用于离散空间和任务分配问题,对空间众包任务分配场景使用时空单元划分,并使用“延时匹配”策略,进一步提高任务分配策略。本发明所述方法可以在加强用户及工作者隐私保护的同时保证LBS的运行效率。如图1所示,其包括以下步骤:
第一步,获取任务数据集和工作者数据集:待时空单元发布空间众包任务后,空间众包服务器获取到任务数据集U,并向可信服务器上传请求,可信服务器根据时空单元提供的时空单元信息提取到工作者数据集W。
第二步,数据集的聚类划分:对任务数据集U和工作者数据集W进行聚类划分。
所述数据集的聚类划分包括以下步骤:
(1)可信服务器利用K-means聚类方法对工作者数据集W进行聚类,生成W1、W2⋯⋯Wk等K个不同的聚类结果,对应质心的数据集
,对应簇的数据集/>;(2)空间众包服务器利用K-means聚类方法对任务数据集U进行聚类,生成U1、U2⋯⋯Uk等K个不同的聚类结果,对应质心的数据集/>,对应簇的数据集/>。第三步,差分隐私加噪:可信服务器采用中心化差分隐私方法在/>中加入拉普拉斯噪声,得到噪声数据集/>。(1)初始化数据集/>;(2)对数据集/>加入Laplace噪声,
得到噪声数据集,其中,/>是可信服务器对工作者数据集W聚类分析后生成的聚类结果所对应的质心数据集,/>为拉普拉斯函数,/>为函数/>的全局敏感度,/>为差分隐私预算,/>是加入拉普拉斯噪声后的质心数据集。第四步,聚类结果匹配及加噪:空间众包服务器通过优化目标函数/>将数据集/>和数据集/>进行匹配,得到最优的匹配结果/>、/>,并将其上传至可信服务器;可信服务器采用中心化差分隐私方法在/>、/>中加入拉普拉斯噪声,即、/>,并将其再次回传至空间众包服务器。
在空间众包数据任务分配时基于存在可信服务器存储数据(中心化差分隐私)的模式下,为了改进传输数据直接差分隐私带来的数据扰动较大结果可用性变差的现状,创新了两阶段加噪的模式。第一步是对空间位置数据进行聚类,目的是为了对数据降维处理,第二步在降维后数据进行差分隐私加噪,可以显著降低噪声对任务分配结果的影响,提升任务分配的成功率和可用性。由于空间众包研究处于起步阶段,大部分研究集中在实时分配方向使用贪婪算法计算,但此种分配方式效率较低且没有考虑隐私保护,目前很少有使用萤火虫算法且结合兼顾隐私分配的任务分配应用研究。
所述的聚类结果匹配及加噪包括以下步骤:(1)对空间众包服务器输入噪声数据集和数据集/>;(2)设定优化目标函数/>,通过计算目标函数/>的最小值得到最优匹配结果/>、/>,/>的计算公式为:
其中,/>为目标函数,表示修正后的工作者位置数据集和任务数据集之间的平均距离,距离越小则两者匹配性越好,距离越大则两者匹配性越差;/>为约束条件,假设在空间众包任务分配时对位置数据集进行k-means均值聚类,且有k个簇,当簇为k时工作者位置数据集聚类得到的一组质心为/>,对应簇包含工作者的数量为/>,空间众包任务数据集聚类得到的一组质心为/>,对应的簇的任务数量为/>表示某个工作者和某个任务的距离;(3)将根据目标函数/>计算得到的最小值,也即最优匹配结果/>、/>上传至可信服务器;(4)可信服务器采用中心化差分隐私方法在/>、/>中加入拉普拉斯噪声,即/>,其中/>为函数/>的全局敏感度,/>为差分隐私预算,为拉普拉斯函数;(5)可信服务器将加噪后的/>、/>回传至空间众包服务器。第五步,LBS空间众包任务的分配:空间众包服务器采用改进的萤火虫算法,对加噪后的和/>进行匹配,并生成任务分配方案,按此任务分配方案,LBS进行空间众包任务分配。萤火虫算法只适用于连续空间,使用离散编码、改进移动策略等方式改进萤火虫算法使其适用于离散空间和任务分配问题。对空间众包任务分配场景使用时空单元划分,并使用“延时匹配”策略,进一步提高任务分配策略。使用改进的萤火虫算法对时空单元内的任务和工作者进行任务分配,进一步提高任务分配效率。该方法创新建立了一套系统的任务分配的方法,包括使用“延时匹配”策略、划分时空单元、离散萤火虫算法、兼顾隐私保护等方面,因而具有创新性和系统性。
所述的LBS空间众包任务的分配包括以下步骤:
(1)监测工作者实时状态,当工作者处于在线状态且位置实时上传中心服务器时,工作者待分配任务;若工作者正在完成任务则无法接收新的任务,而且任务发布到达截止时间后自动取消;
(2)空间众包服务器采用改进的萤火虫算法进行任务匹配,输出任务分配方案并将其发送给对应工作者;
改进的萤火虫算法以离散萤火虫算法DGSO为基础,并在变异因子引入五种新的移动策略,以提高寻优效率;
其中五种新的移动策略保证移动后的解依旧是可行解,详见表1,包括:内侧反演()、外侧反演(/>)、左侧反演(/>)、右侧反演()、插队(/>)。
表1 萤火虫的移动策略表
任务分配的具体步骤包括:A1)输入最优匹配的工作者数据集和任务数据集;A2)随机初始化改进的萤火虫算法的参数,初始化编码,并对应任务分配;
A3)在自适应因子调整下,通过轮盘赌或反演、互换等移动策略不断更新萤火虫荧光素,计算对应的目标函数值;A4)检查和处理不可行解;
A5)对比公告板,如比公告板更优,则替代之;
A6)当达到迭代次数时,输出任务分配方案并进行解码,其中目标函数计算公式为:,其中,/>代表总旅行距离,越小越好;/>代表分配成功率,越大越好;/>、/>是让目标函数中两部分数据出于统一量纲的系数;/>和/>分别表示任务集合、空间众包服务器给任务分配的对应的工作者集合。
(3)工作者接收到任务分配方案后,若选择接受任务则自身不再属于可工作的工作者,任务结束前不会再被分配新的任务;若选择不接受则依旧属于可工作的工作者,被分配其它的任务。
为了对本发明方法的有效性进行验证,下面将在真实数据集上采用具体的实验进行验证与说明。实验环境:Windows7操作系统,CPU Intel(R)Core(TM)i5-4460(3.2GHz),8GB内存。所涉及算法代码在Matlab R2016a中实现。
参数设置:IGSO算法和DGSO算法的参数选择及理由具体参看文献(见文献Research on incentive strategy based on service quality in spatial crowd-sourcing task allocation[J].Journal of Intelligent & Fuzzy Systems,2022,43:5551-5566.)。
实验数据:位置数据是在聚数力网站中下载(见文献JU S L. UberNew York Citytravel data[EB/OL]. http://dataju.cn/Dataju/web/datasetInstanceDetail/210,2017,7.),删除重复位置信息后,得到实验所需要的3000个地理位置坐标。按比例映射到[0,200]区间,其他数据通过实验、合成的方式产生,具体相关数据和取值范围见表2。
表2 相关数据和取值范围表
其中,e表示隐私预算,k代表聚类簇的数量。小规模数据集SD包含6个规模的子数据集sd1~sd6,较大规模数据集BD共包含6种规模的子数据集bd1~bd6。每个数据集包含工作者和用户对应时间的空间位置信息lulw
实验对比OR-DGSOTSC、DP-DGSOTSC、TDPKC-DGSOTSC、TDPKC-IGSOTSC四种方法的任务分配性能。其中,OR-DGSOTSC、DP-DGSOTSC、TDPKC-DGSOTSC分别表示使用DGSO在原始数据集、差分隐私直接加噪数据集和基于k-means聚类的差分隐私两阶段加噪数据集的空间众包任务分配,TDPKC-IGSOTSC表示使用IGSO在基于k-means聚类的差分隐私两阶段加噪数据集的空间众包任务分配。
在小规模数据集SD的6个子规模数据集sd1~sd6上实验20次得到的总旅行距离的平均结果分别如图3a、图3b、图3c、图3d、图3e、图3f所示。在SD的6个子数据集上,TDPKC-DGSOTSC得到的总旅行距离始终小于DP-DGSOTSC,说明DGSOTSC在TDPKC模式下能有效降低总旅行距离;IGSOTSC得到的总旅行距离均小于DGSOTSC,说明IGSO比DGSO有更好的最优解搜索的能力,提高了任务分配的性能。在小规模数据集SD的6个子规模数据集sd1~sd6上实验20次得到的任务分配成功率的平均结果分别如图4a、图4b、图4c、图4d、图4e、图4f所示。在SD的6个子数据集上,TDPKC-DGSOTSC的成功率始终大于DP-DGSOTSC,说明DGSOTSC在TDPKC模式下有效提高了分配成功率;而且,IGSOTSC得到的分配成功率均大于DGSOTSC,说明IGSO比DGSO有更好的解搜索的能力,提高了任务分配的性能。
在进行较大规模数据集实验时,将每个数据集根据时空单元的具体情况分解成若干个子数据集,根据累加计算获得结果。相关实验取20次实验的平均结果,详见表3。
表3不同隐私预算分配对应的总旅行距离对比表
在数据集bd1~bd6上的实验结果显示,TDPKC-DGSOTSC、TDPKC-IGSOTSC计算得到的总旅行距离始终介于OR-DGSOTSC和DP-DGSOTSC之间,这说明TDPKC-DGSOTSC、TDPKC-IGSOTSC方法在较大规模数据集上依然是有效的,且TDPKC-IGSOTSC结果始终优于TDPKC-DGSOTSC结果,进一步验证了IGSO相较于DGSO有更好的寻优求解性能。在进行较大规模数据集的任务分配实验时,将每个数据集根据时空单元的具体情况分解成若干个子数据集,根据平均值获得结果。相关实验取20次实验的平均结果,详见表4。
表4 不同K对应的总旅行距离对比表
TDPKC-DGSOTSC、TDPKC-IGSOTSC计算得到的任务分配成功率始终介于OR-DGSOTSC和DP-DGSOTSC之间,这说明TDPKC-DGSOTSC、TDPKC-IGSOTSC方法在较大规模数据集上依然是有效的,且TDPKC-IGSOTSC的结果始终优于TDPKC-DGSOTSC,进一步验证了IGSO相较于DGSO有更好的寻优求解性能。
本发明提出了基于差分隐私和改进萤火虫算法的空间众包任务分配方法。首先,通过结合差分隐私加噪和聚类匹配的方法,得到差分隐私保护的可用性较强的数据集;然后,通过划分时空单元和“延迟匹配”策略,将空间众包任务分配这个动态问题转化为静态地组合优化问题,并采用改进后的萤火虫算法计算得到空间众包任务分配方案。通过在真实数据集上开展实验,从总旅行时间和任务分配成功率两个方面验证了本发明方法的有效性。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

Claims (4)

1.一种基于差分隐私和改进萤火虫的LBS空间众包任务分配方法,其特征在于,包括以下步骤:
11)获取任务数据集和工作者数据集:待时空单元发布空间众包任务后,空间众包服务器获取到任务数据集U,并向可信服务器上传请求,可信服务器根据时空单元提供的时空单元信息提取到工作者数据集W;
12)数据集的聚类划分:对任务数据集U和工作者数据集W进行聚类划分;
13)差分隐私加噪:可信服务器采用中心化差分隐私方法在中加入拉普拉斯噪声,得到噪声数据集
14)聚类结果匹配及加噪:空间众包服务器通过优化目标函数将数据集/>和数据集进行匹配,得到最优的匹配结果/>、/>,并将其上传至可信服务器;可信服务器采用中心化差分隐私方法在/>、/>中加入拉普拉斯噪声,即、/>,并将其再次回传至空间众包服务器;
15)LBS空间众包任务的分配:空间众包服务器采用改进的萤火虫算法,对加噪后的和/>进行匹配,并生成任务分配方案,按此任务分配方案,LBS进行空间众包任务分配;
所述的LBS空间众包任务的分配包括以下步骤:
151)监测工作者实时状态,当工作者处于在线状态且位置实时上传中心服务器时,工作者待分配任务;若工作者正在完成任务则无法接收新的任务,而且任务发布到达截止时间后自动取消;
152)空间众包服务器采用改进的萤火虫算法进行任务匹配,输出任务分配方案并将其发送给对应工作者;改进的萤火虫算法以离散萤火虫算法DGSO为基础,并在变异因子引入五种新的移动策略,以提高寻优效率;其中五种新的移动策略保证移动后的解依旧是可行解,包括:内侧反演(/>)、外侧反演(/>)、左侧反演()、右侧反演(/>)、插队(/>);任务分配的具体步骤包括:
1521)输入最优匹配的工作者数据集和任务数据集/>
1522)随机初始化改进的萤火虫算法的参数,初始化编码,并对应任务分配;
1523)在自适应因子调整下,通过轮盘赌、反演或互换的移动策略不断更新萤火虫荧光素,计算对应的目标函数值;
1524)检查和处理不可行解;
1525)对比公告板,如比公告板更优,则替代之;
1526)当达到迭代次数时,输出任务分配方案并进行解码,其中目标函数计算公式为:,其中,/>代表总旅行距离,越小越好;/>代表分配成功率,越大越好;/>、/>是让目标函数中两部分数据出于统一量纲的系数;/>和/>分别表示任务集合、空间众包服务器给任务分配的对应的工作者集合;
153)工作者接收到任务分配方案后,若选择接受任务则自身不再属于可工作的工作者,任务结束前不会再被分配新的任务;若选择不接受则依旧属于可工作的工作者,被分配其它的任务。
2.根据权利要求1所述的基于差分隐私和改进萤火虫的LBS空间众包任务分配方法,其特征在于,所述数据集的聚类划分包括以下步骤:
21)可信服务器利用K-means聚类方法对工作者数据集W进行聚类,生成1、W2⋯⋯Wk等K个不同的聚类结果,对应质心的数据集,对应簇的数据集
22)空间众包服务器利用K-means聚类方法对任务数据集U进行聚类,生成U1、U2⋯⋯Uk等K个不同的聚类结果,对应质心的数据集,对应簇的数据集
3.根据权利要求1所述的基于差分隐私和改进萤火虫的LBS空间众包任务分配方法,其特征在于,所述的差分隐私加噪包括以下步骤:
31)初始化数据集
32)对数据集加入Laplace噪声,得到噪声数据集其中,/>是可信服务器对工作者数据集W聚类分析后生成的聚类结果所对应的质心数据集,/>为拉普拉斯函数,/>为函数/>的全局敏感度,/>为差分隐私预算, />是加入拉普拉斯噪声后的质心数据集。
4.根据权利要求1所述的基于差分隐私和改进萤火虫的LBS空间众包任务分配方法,其特征在于,所述的聚类结果匹配及加噪包括以下步骤:
41)对空间众包服务器输入噪声数据集和数据集/>
42)设定优化目标函数,通过计算目标函数/>的最小值得到最优匹配结果/>,/>的计算公式为:/>
其中,为目标函数,表示修正后的工作者位置数据集和任务数据集之间的平均距离,距离越小则两者匹配性越好,距离越大则两者匹配性越差;/>为约束条件,假设在空间众包任务分配时对位置数据集进行k-means均值聚类,且有k个簇,当簇为k时工作者位置数据集聚类得到的一组质心为/>,对应簇包含工作者的数量为/>,空间众包任务数据集聚类得到的一组质心为/>,对应的簇的任务数量为/>,/>表示某个工作者和某个任务的距离;
43)将根据目标函数计算得到的最小值,也即最优匹配结果/>、/>上传至可信服务器;
44)可信服务器采用中心化差分隐私方法在、/>中加入拉普拉斯噪声,即
,其中,/>为函数/>的全局敏感度,/>为差分隐私预算,/>为拉普拉斯函数;
45)可信服务器将加噪后的、/>回传至空间众包服务器。
CN202310573280.4A 2023-05-22 2023-05-22 基于差分隐私和改进萤火虫的lbs空间众包任务分配方法 Active CN116307294B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310573280.4A CN116307294B (zh) 2023-05-22 2023-05-22 基于差分隐私和改进萤火虫的lbs空间众包任务分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310573280.4A CN116307294B (zh) 2023-05-22 2023-05-22 基于差分隐私和改进萤火虫的lbs空间众包任务分配方法

Publications (2)

Publication Number Publication Date
CN116307294A CN116307294A (zh) 2023-06-23
CN116307294B true CN116307294B (zh) 2023-08-01

Family

ID=86801770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310573280.4A Active CN116307294B (zh) 2023-05-22 2023-05-22 基于差分隐私和改进萤火虫的lbs空间众包任务分配方法

Country Status (1)

Country Link
CN (1) CN116307294B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109472155A (zh) * 2018-10-11 2019-03-15 电子科技大学 一种空间众包中的差分隐私空间数据发布方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8775341B1 (en) * 2010-10-26 2014-07-08 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
CN107222302B (zh) * 2017-07-03 2019-05-07 深圳大学 用部分同态加密方案构建的空间众包任务分配系统及方法
US11455427B2 (en) * 2018-07-24 2022-09-27 Arizona Board Of Regents On Behalf Of Arizona State University Systems, methods, and apparatuses for implementing a privacy-preserving social media data outsourcing model
US11736973B2 (en) * 2018-08-29 2023-08-22 Carleton University Enabling wireless network personalization using zone of tolerance modeling and predictive analytics
CN109840714B (zh) * 2019-02-19 2023-06-06 浙江师范大学 地理不可区分保护下的基于数据质量的签到激励机制方法
CN111105142B (zh) * 2019-11-25 2023-06-30 哈尔滨工程大学 一种面向用户个性化隐私保护的众包任务分配方法
CN111144888B (zh) * 2019-12-24 2022-08-02 安徽大学 一种差分隐私保护的移动群智感知任务分配方法
CN111191952A (zh) * 2020-01-06 2020-05-22 合肥城市云数据中心股份有限公司 加入空间众包工作者评分要素的空间众包任务分配方法
CN112131603A (zh) * 2020-09-24 2020-12-25 合肥城市云数据中心股份有限公司 一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法
CN115186174A (zh) * 2022-06-02 2022-10-14 合肥工业大学 基于机器学习的众包任务个性化推荐方法和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109472155A (zh) * 2018-10-11 2019-03-15 电子科技大学 一种空间众包中的差分隐私空间数据发布方法

Also Published As

Publication number Publication date
CN116307294A (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
Zhang et al. Joint resource allocation for latency-sensitive services over mobile edge computing networks with caching
Zhang et al. Deep reinforcement learning assisted federated learning algorithm for data management of IIoT
Liu et al. Multiobjective optimization for computation offloading in fog computing
Zhang Intelligent Internet of things service based on artificial intelligence technology
Chen et al. Evolutionary heterogeneous clustering for rating prediction based on user collaborative filtering
Abd Elaziz et al. IoT workflow scheduling using intelligent arithmetic optimization algorithm in fog computing
Wang et al. An optimized transaction verification method for trustworthy blockchain-enabled IIoT
Zhang et al. Digital twin-assisted edge computation offloading in industrial Internet of Things with NOMA
Zhang et al. Edge-cloud collaborative entity state data caching strategy toward networking search service in CPSs
CN112822707A (zh) 一种计算资源有限mec中任务卸载与资源分配方法
CN116307294B (zh) 基于差分隐私和改进萤火虫的lbs空间众包任务分配方法
Zhang et al. Maximum delay anonymous clustering feature tree based privacy-preserving data publishing in social networks
CN105335313B (zh) 一种基础数据的传输方法及装置
Liu et al. Digital twin-assisted edge service caching for consumer electronics manufacturing
Zhang et al. Multiaccess edge integrated networking for Internet of Vehicles: A blockchain-based deep compressed cooperative learning approach
Wang et al. Joint service caching, resource allocation and computation offloading in three-tier cooperative mobile edge computing system
CN111626354B (zh) 应用于车联网中的基于任务依赖性的聚类方法
Kshetri et al. Major computing technologies of the past 75 years
Ju et al. Innovation trend of edge computing technology based on patent perspective
Zhu et al. A Resource scheduling method for enterprise management based on artificial intelligence deep learning
Walton et al. Ecosystems thinking and modern platform-based ecosystem theory
Zhang et al. Application of federated learning in industrial internet with device identifier
CN104503974B (zh) 一种基于云平台的关系数据库自动优化方法
CN113313809A (zh) 一种渲染方法和装置
Zhu et al. An evolutionary game theory-based channel access mechanism for wireless multimedia sensor network with rate-adaptive applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant