CN112541037B - 一种基于区块链和深度强化学习的空间众包方法及终端 - Google Patents

一种基于区块链和深度强化学习的空间众包方法及终端 Download PDF

Info

Publication number
CN112541037B
CN112541037B CN202011336649.2A CN202011336649A CN112541037B CN 112541037 B CN112541037 B CN 112541037B CN 202011336649 A CN202011336649 A CN 202011336649A CN 112541037 B CN112541037 B CN 112541037B
Authority
CN
China
Prior art keywords
task
block chain
requester
information
grade
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011336649.2A
Other languages
English (en)
Other versions
CN112541037A (zh
Inventor
林晖
彭敏
汪晓丁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Normal University
Original Assignee
Fujian Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Normal University filed Critical Fujian Normal University
Priority to CN202011336649.2A priority Critical patent/CN112541037B/zh
Publication of CN112541037A publication Critical patent/CN112541037A/zh
Application granted granted Critical
Publication of CN112541037B publication Critical patent/CN112541037B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Bioethics (AREA)
  • Computer Security & Cryptography (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Hardware Design (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供了一种基于区块链和深度强化学习的空间众包方法及终端,获取请求端发送的注册请求,包括请求者标识及请求者等级;获取区块链信息,包括区块链等级;根据请求者等级确定对应的区块链等级,将请求者标识注册到与此区块链等级所对应的区块链上,以使得请求者标识所对应的请求端能够查询区块链上的区块;获取发布端发送的任务发布信息,包括位置信息;根据位置信息确定对应的区块链等级,将任务发布信息打包成区块发布到与所述任务等级相对应的区块链等级所对应的区块链上;本发明通过将任务发布信息、区块链和请求者分等级,等级相同的任务发布信息在同一区块链上并且只能够被相应等级的请求者查看,实现任务发布的高隐私性。

Description

一种基于区块链和深度强化学习的空间众包方法及终端
技术领域
本发明涉及空间众包领域,尤其涉及一种基于区块链和深度强化学习的空间众包方法及终端。
背景技术
空间众包是指任务发布方向空间众包服务器发布任务,任务包括具体的地理位置,服务器将任务分配给任务地理位置附近的请求者,请求者接受分配的任务后前往指定地点执行任务,在执行任务的过程中进行相关数据采集并上传到空间众包任务服务器。随着先进的低成本传感器、通信技术和智能手机技术的迅速发展,空间众包技术被广泛应用于物联网领域。空间众包作为一种高效便捷的数据采集技术,能够为各种物联网应用提供数据,是实现各种物联网应用的前提。
空间众包技术在带来便利的同时也存在许多挑战,其中,在空间众包任务分配和执行的过程中数据隐私泄露的问题是空间众包技术最应关注的问题。造成空间众包数据隐私安全的原因主要有以下几个方面:第一,空间任务收集的数据具有较高的隐私性,但由于现有的任务发布没有任务保护机制,任务对所有请求者都是可见的。可能有一些恶意请求者前往空间任务的位置窃取他们需要收集的数据导致高隐私数据的泄露。第二,空间众包系统没有完善的任务分配机制。许多现有的空间众包系统采用服务器分配模式或是采用请求者自主申请的方式,在下发任务到请求者的过程中没有考虑请求者本身的素质,如果请求者是恶意参与者,那么可能在任务执行的过程中窃取任务采集的数据。第三,传统的空间众包系统采用集中式结构,整个系统过于依赖众包服务器,一旦服务器受到攻击,所有数据都会丢失。
如何保证空间众包的数据隐私安全是实现空间众包技术的前提和基础。因此,研究空间众包数据隐私的保护问题已经成为了空间众包技术领域的热点。目前已经出现了一些相关的研究成果,Wu等人(IEEE Transactions on Network Science and Engineering,2019)提出了一种空间任务分配策略,通过结合雾计算和同态加密技术,防止任务分配服务器获取数据隐私信息。Hu等人(IEEE Internet of Things Journal,vol.5,no.6,pp.4663–4671,2018)提出了一种基于数据可信度的数据感知策略,以提高感知用户的声誉,降低隐私攻击概率,进而实现空间众包数据隐私保护。Wang等人(IEEE Transactions onIndustrial Informatics,vol.16,no.6,pp.4242-4251,2020)设计了一种基于内容隐私、分组和组内机制的个性化k-匿名机制,从而达到空间众包数据隐私保护的目的。Qian等人(IEEE Network,vol.34,no.2,pp.46–51,2020.)提出了一种基于区块链的空间众包数据隐私感知内容缓存架构,通过采用区块链技术将已完成的内容交易记录下来,在协商机制完成后写入块中,解决了内容缓存过程中用户隐私数据泄露问题。
现有的研究成果能够在一定程度上保护空间众包数据隐私,但是仍然存在以下不足之处:(1)未考虑如何防止恶意请求者前往任务地点窃取高度敏感空间任务中包含的数据隐私;(2)未考虑如何将任务分配给可信的请求者去执行。(3)未考虑如何从空间众包服务器的单点故障问题上防止数据隐私泄露。(4)未考虑如何在增强数据隐私安全与保证系统性能之间取得平衡。
发明内容
本发明所要解决的技术问题是:提供一种基于区块链和深度强化学习的空间众包方法及终端,实现高隐私的空间众包任务发布。
为了解决上述技术问题,本发明采用的一种技术方案为:
一种基于区块链和深度强化学习的空间众包方法,包括步骤:
S1、获取请求端发送的注册请求,所述注册请求包括请求者标识及请求者等级;
S2、获取区块链信息,所述区块链信息包括区块链等级;
S3、根据所述请求者等级确定对应的区块链等级,将所述请求者标识注册到与所述请求者等级相对应的区块链等级所对应的区块链上,以使得所述请求者标识所对应的请求端能够查询所述区块链上的区块;
S4、获取发布端发送的任务发布信息,所述任务发布信息包括位置信息;
S5、根据所述位置信息确定对应的区块链等级,将所述任务发布信息打包成区块发布到与所述任务等级相对应的区块链等级所对应的区块链上。
为了解决上述技术问题,本发明采用的另一种技术方案为:
一种基于区块链和深度强化学习的空间众包终端,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
S1、获取请求端发送的注册请求,所述注册请求包括请求者标识及请求者等级;
S2、获取区块链信息,所述区块链信息包括区块链等级;
S3、根据所述请求者等级确定对应的区块链等级,将所述请求者标识注册到与所述请求者等级相对应的区块链等级所对应的区块链上,以使得所述请求者标识所对应的请求端能够查询所述区块链上的区块;
S4、获取发布端发送的任务发布信息,所述任务发布信息包括位置信息;
S5、根据所述位置信息确定对应的区块链等级,将所述任务发布信息打包成区块发布到与所述任务等级相对应的区块链等级所对应的区块链上。
本发明的有益效果在于:采用任务分级管理和请求者分级管理,将任务所在的区域按照隐私安全需求划分为不同等级,将请求者按照信用划分为不同等级;根据任务和请求者等级划分结果,将不同等级的任务和请求者放入相应等级的子区块链中,只有在该子区块链上注册的请求者才有权查看获取子区块链中发布的任务信息,任务不对所有请求者可见,有效防止了恶意请求者前往任务地点窃取高度敏感空间任务中包含的数据隐私的情况;此外,采用子区块链架构作为分布式服务器,通过将不同的任务作为交易存储在不同的子区块链上,克服了传统众包服务器的单点故障而造成的数据隐私泄露问题。
附图说明
图1为本发明实施例的一种基于区块链和深度强化学习的空间众包方法的步骤流程图;
图2为本发明实施例的一种基于区块链和深度强化学习的空间众包终端的结构示意图;
图3为本发明实施例的一种基于区块链和深度强化学习的空间众包方法在一种实际场景中的步骤流程图
标号说明:
1、一种基于区块链和深度强化学习的空间众包终端;2、处理器;3、存储器。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
请参照图1,一种基于区块链和深度强化学习的空间众包方法,包括步骤:
S1、获取请求端发送的注册请求,所述注册请求包括请求者标识及请求者等级;
S2、获取区块链信息,所述区块链信息包括区块链等级;
S3、根据所述请求者等级确定对应的区块链等级,将所述请求者标识注册到与所述请求者等级相对应的区块链等级所对应的区块链上,以使得所述请求者标识所对应的请求端能够查询所述区块链上的区块;
S4、获取发布端发送的任务发布信息,所述任务发布信息包括位置信息;
S5、根据所述位置信息确定对应的区块链等级,将所述任务发布信息打包成区块发布到与所述任务等级相对应的区块链等级所对应的区块链上。
从上述描述可知,本发明的有益效果在于:采用任务分级管理和请求者分级管理,将任务所在的区域按照隐私安全需求划分为不同等级,将请求者按照信用划分为不同等级;根据任务和请求者等级划分结果,将不同等级的任务和请求者放入相应等级的子区块链中,只有在该子区块链上注册的请求者才有权查看获取子区块链中发布的任务信息,任务不对所有请求者可见,有效防止了恶意请求者前往任务地点窃取高度敏感空间任务中包含的数据隐私的情况;此外,采用子区块链架构作为分布式服务器,通过将不同的任务作为交易存储在不同的子区块链上,克服了传统众包服务器的单点故障而造成的数据隐私泄露问题。
进一步的,所述S2之前还包括:
设置多条区块链,为每条所述区块链分配区块链等级,每条所述区块链的所述区块链等级均不相同。
由上述描述可知,设置多条区块链,每条区块链的等级不同,不同等级的任务存储到相应等级的区块链中,实现不同等级任务的存储之间互相独立,便于后续管理。
进一步的,所述S5之前还包括:
获取任务区域,将所述任务区域分为多个任务子区域,为每个所述任务子区域设置区域等级;
设置所述区域等级与所述区块链等级的对应关系;
所述S5中所述根据所述位置信息确定对应的区块链等级具体为:
确定所述位置信息所处的第一任务子区域,获取所述第一任务子区域的第一区域等级;
获取所述第一区域等级所对应的第一区块链等级作为所述位置信息所对应的区块链等级。
由上述描述可知,将任务区域分为多个子区域,为每个子区域设定区域等级并设定区块链等级与区域等级的对应关系,在获取到任务发布信息后,能够及时通过其中的位置信息确定其所在区域的区域等级,最终确定出区块链等级将任务发布信息在相应区块链等级的区块链上进行发布,实现对任务发布信息的分等级发布。
进一步的,所述S5中将所述任务发布信息打包成区块发布到与所述任务等级相对应的区块链等级所对应的区块链上具体为:
根据第一DQN算法将所述任务发布信息打包成区块并确定所述区块的部署方式;
根据所述部署方式将所述任务发布信息发布到与所述任务等级相对应的区块链等级所对应的区块链上。
由上述描述可知,在将任务发布信息打包成区块并发布的过程中,采取DQN算法获取最佳参数,保证了在进行任务发布信息的发布时的效率,即通过DQN算法确定了进行区块打包和区块发布用时最少的相应参数。
进一步的,所述S5具体为:
S51、获取区块产生节点的计算能力集合及截止至第一时刻的交易大小集合,根据所述交易大小集合及所述区块链节点计算能力集合确定所述第一DQN算法的第一状态空间:
S1 (t1)=[TSizet1,Nc](t1)
其中,S1 (t1)表示所述第一状态空间,t1表示所述第一时刻,TSizet1表示截止至所述第一时刻t1的交易大小集合,Nc表示区块产生节点的计算能力集合;
S52、定义所述第一DQN算法的动作空间:
A1 (t1)=[Bn,Bc,Bt,Bs](t1)
其中,A1 (t1)表示所述第一DQN算法的第一动作空间,Bn表示区块产生节点,Bn∈{O1,O2,...,On},{O1,O2,...,On}表示区块产生节点集合,Bc表示区块链共识算法,Bt表示区块产生时间间隔,Bt∈{0,5,1,...,Bt max},Bs表示区块大小;
S53、根据梯度下降策略确定最优的所述第一动作空间,根据最优的所述第一动作空间中的最优区块产生节点、最优共识算法、最优区块产生时间间隔及最优区块大小确定所述区块的部署方式;
其中,所述梯度下降策略为:
Figure BDA0002797346810000061
i表示一时刻,θ表示网络权重参数;
S54、根据所述部署方式将所述任务发布信息发布到与所述任务等级相对应的区块链等级所对应的区块链上。
由上述描述可知,引入DQN算法,确定状态空间和动作空间,根据动作空间更新状态空间,最终采用梯度下降策略使得动作空间中的最终结果满足目标值或目标范围,DQN的迭代速度快且效果好,能够快速确定区块生成和部署方式,提高任务发布到区块链上的速度,且通过DQN算法得到的参数最优值在一定程度上实现了隐私保护和实际性能需求之间的平衡。
进一步的,所述S5之后还包括:
S6、接收请求端发送的任务搜索请求,所述任务搜索请求包括所述请求者标识,获取所述请求者标识所注册的区块链上的区块中的任务发布信息,并将所述任务发布信息返回给所述请求端。
由上述描述可知,请求段所发送的任务搜索请求中包括请求者标识,区块链只识别在其上注册过的请求者标识,即请求者标识所发送的任务搜索请求只能被其注册过的区块链所识别,获取其注册过的区块链上的任务发布信息,而请求者只能在与其等级相匹配的区块链上进行注册,通过这种等级匹配实现了请求者只能够搜索到与其等级相匹配的任务发布信息,即请求者只能够在与其等级相匹配的任务发布信息中选择任务进行完成。
进一步的,所述S4中所述任务发布信息包括任务标识;
所述S6之后还包括:
S7、接收请求端发送的任务选择请求,所述任务选择请求包括所述任务标识、所述请求者标识及请求者位置;
获取所述任务标识所对应的第一任务发布信息中的第一位置信息;
判断所述任务标识是否对应多条所述任务选择请求,若是,则通过第二DQN算法确定与所述第一位置信息对应的所述请求者位置所在的所述第一任务选择请求;
绑定所述第一任务选择请求中的所述任务标识及所述第一任务选择请求中的所述请求者标识。
由上述描述可知,若同时接收到多个请求端对同一个任务发布信息所发送的任务选择请求,会使用DQN算法确定与此任务发布信息最匹配的一个请求端,将其所发送的请求者标识与任务发布信息的任务标识进行绑定,保证了发布方所发布的任务能够被最合适的请求者完成,其中优先考虑任务发布信息中的位置信息与任务选择请求中的请求者位置,特别适用于空间众包的场景。
进一步的,所述S4中所述任务发布信息包括任务完成时限;
所述S7中所述通过第二DQN算法确定与所述第一位置信息对应的所述请求者位置所在的所述第一任务选择请求具体为:
S71、获取第二预设时间段内的位置信息集合、请求者位置集合及任务完成时限集合,根据所述位置信息集合、所述请求者位置集合及所述任务完成时限集合确定所述第二DQN算法的第二状态空间:
S2 (t2)=[LT,LW,Tl](t2)
其中,S2 (t2)表示所述第二状态空间,LT表示所述位置信息,LT=(xt2,yt2),LW表示所述请求者位置集合,LW=(xw,yw),Tl表示所述任务完成时限集合;
S72、获取所述位置信息与所述请求者位置之间的距离dist(t2,w)
Figure BDA0002797346810000081
S73、定义所述第二DQN算法的第二动作空间A(t2)
A2 (t2)=[Creditw,dw](t2)
其中,Creditw表示请求者信用,dw表示请求者可移动距离,dmax表示所述请求者可移动距离的最大值;
S74、根据梯度下降策略确定最优的所述第二动作空间,根据最优的所述第二动作空间中的最优请求者信用及最优可移动距离确定所述最优请求者信用所对应的请求者标识;
其中,所述梯度下降策略为:
Figure BDA0002797346810000082
j表示一时刻,θ表示网络权重参数;
S75、绑定所述请求者标识及所述位置信息所对应的任务标识。
由上述描述可知,以请求者位置和任务发布信息中的位置信息的距离及请求者的信用作为选择最优请求者的依据,综合考虑了请求者的素质和请求者接收任务之后赶到任务场地的时间多少,对任务完成效率和任务完成质量进行平衡。
进一步的,所述S7之后还包括:
接收所述请求端发送的任务完成信息,对所述任务完成信息进行评分;
根据所述评分发送报酬。
由上述描述可知,接收请求端发送的任务完成信息并进行评分,最终根据评分发放报酬,请求者完成任务不仅需要数量,还需要确保每个任务完成的质量才能取得相关报酬,提高了请求者高质量完成任务的积极性。
请参照图2,一种基于区块链和深度强化学习的空间众包终端,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
S1、获取请求端发送的注册请求,所述注册请求包括请求者标识及请求者等级;
S2、获取区块链信息,所述区块链信息包括区块链等级;
S3、根据所述请求者等级确定对应的区块链等级,将所述请求者标识注册到与所述请求者等级相对应的区块链等级所对应的区块链上,以使得所述请求者标识所对应的请求端能够查询所述区块链上的区块;
在一种可选的实施方式中,区块链中的CA证书机构为请求者标识发送证书,表示请求者表示注册到该区块链上;
S4、获取发布端发送的任务发布信息,所述任务发布信息包括位置信息;
S5、根据所述位置信息确定对应的区块链等级,将所述任务发布信息打包成区块发布到与所述任务等级相对应的区块链等级所对应的区块链上。
本发明的有益效果在于:采用任务分级管理和请求者分级管理,将任务所在的区域按照隐私安全需求划分为不同等级,将请求者按照信用划分为不同等级;根据任务和请求者等级划分结果,将不同等级的任务和请求者放入相应等级的子区块链中,只有在该子区块链上注册的请求者才有权查看获取子区块链中发布的任务信息,任务不对所有请求者可见,有效防止了恶意请求者前往任务地点窃取高度敏感空间任务中包含的数据隐私的情况;此外,采用子区块链架构作为分布式服务器,通过将不同的任务作为交易存储在不同的子区块链上,克服了传统众包服务器的单点故障而造成的数据隐私泄露问题。
请参照图1,本发明的实施例一为:
一种基于区块链和深度强化学习的空间众包方法,包括步骤:
S1、获取请求端发送的注册请求,所述注册请求包括请求者标识及请求者等级;
S2、获取区块链信息,所述区块链信息包括区块链等级;
S3、根据所述请求者等级确定对应的区块链等级,将所述请求者标识注册到与所述请求者等级相对应的区块链等级所对应的区块链上,以使得所述请求者标识所对应的请求端能够查询所述区块链上的区块;
S4、获取发布端发送的任务发布信息,所述任务发布信息包括位置信息、任务完成时限、预计报酬及任务标识;或,获取发布端发送的初始任务发布信息,所述初始任务发布信息包括位置信息、任务完成时限及预计报酬,为所述初始任务发布信息分配任务标识得到任务发布信息;
任务完成时限用于标识任务的有效期,请求者需在有效期内提交任务才能获取报酬;
S5、根据所述位置信息确定对应的区块链等级,将所述任务发布信息打包成区块发布到与所述任务等级相对应的区块链等级所对应的区块链上;
在本实施例中将所述任务发布信息打包成区块发布到与所述任务等级相对应的区块链等级所对应的区块链上具体为:根据第一DQN(Deep Q Network,深度Q网络)算法将所述任务发布信息打包成区块并确定所述区块的部署方式;根据所述部署方式将所述任务发布信息发布到与所述任务等级相对应的区块链等级所对应的区块链上;
S6、接收请求端发送的任务搜索请求,所述任务搜索请求包括所述请求者标识,获取所述请求者标识所注册的区块链上的区块中的任务发布信息,并将所述任务发布信息返回给所述请求端;
S7、接收请求端发送的任务选择请求,所述任务选择请求包括所述任务标识、所述请求者标识及请求者位置;获取所述任务标识所对应的第一任务发布信息中的第一位置信息;判断所述任务标识是否对应多条所述任务选择请求,若是,则通过第二DQN算法确定与所述第一位置信息对应的所述请求者位置所在的所述第一任务选择请求;绑定所述第一任务选择请求中的所述任务标识及所述第一任务选择请求中的所述请求者标识;
S8、接收所述请求端发送的任务完成信息,对所述任务完成信息进行评分;根据所述评分发送报酬;具体的,根据所述评分确定比例,按照所述比例及所述预计报酬发放报酬;
在本实施例中,步骤S2之前还包括:设置多条区块链,为每条所述区块链分配区块链等级,每条所述区块链的所述区块链等级均不相同;
在本实施例中,步骤S5之前还包括:
获取任务区域,将所述任务区域分为多个任务子区域,为每个所述任务子区域设置区域等级;设置所述区域等级与所述区块链等级的对应关系;
在一种可选的实施方式中,区域等级与区块链等级均为A、B、C;
所述S5中所述根据所述位置信息确定对应的区块链等级具体为:
确定所述位置信息所处的第一任务子区域,获取所述第一任务子区域的第一区域等级;
获取所述第一区域等级所对应的第一区块链等级作为所述位置信息所对应的区块链等级;
在一种可选的实施方式中,本实施例中区块链多链结构为Hyperledger Fabric架构。
本发明的实施例二为:
一种基于区块链和深度强化学习的空间众包方法,其与实施例一的不同之处在于:
所述S5具体为:
S51、获取与所述任务等级相对应的区块链等级所对应的区块链上的区块产生节点的计算能力集合及截止至第一时刻的交易大小集合,根据所述交易大小集合及所述区块链节点计算能力集合确定所述第一DQN算法的第一状态空间:
S1 (t1)=[TSizet1,Nc](t1)
其中,S1 (t1)表示所述第一状态空间,t1表示所述第一时刻,TSizet1表示截止至所述第一时刻t1的交易大小集合,Nc表示区块产生节点的计算能力集合;
具体的,交易大小集合表示截止至第一时刻所确定的区块链中所有任务的大小构成的集合,如TSizet1={2kb,5kb,8kb}表示截止至t1时刻区块链中共有三个任务,三个任务的大小分别为2kb、5kb及8kb;
S52、定义所述第一DQN算法的动作空间:
A1 (t1)=[Bn,Bc,Bt,Bs](t1)
其中,A1 (t1)表示所述第一DQN算法在第一时刻的第一动作空间,Bn表示区块产生节点,Bn∈{O1,O2,...,On},{O1,O2,...,On}表示区块产生节点集合,Bc表示区块链共识算法,Bt表示区块产生时间间隔,Bt∈{0,5,1,...,Bt max},Bs表示区块大小;
其中,区块产生节点集合、所有备选的区块链共识算法、所有预设的区块产生时间间隔及及所有预设的区块大小为所述动作空间的取值范围,在计算过程中动作空间的取值范围不变;
其中,Bt max可根据具体情况设定不同值;
S53、将当前的所述动作空间A1 (t1)输入到当前网络中,即根据状态空间从动作空间的取值范围内选择动作组成动作空间,为所述状态空间中的所述区块产生节点Bn、所述区块链共识算法Bc,所述区块产生的时间间隔Bt及所述区块大小Bs分别随机选择节点待测值、算法待测值、时间间隔待测值及区块大小待测值;
计算各个所述节点待测值、各个所述算法待测值、各个所述时间间隔待测值及各个所述区块大小待测值所对应的Q值,确定Q值最大的所述节点待测值、所述算法待测值、所述时间间隔待测值及所述区块大小待测值,分别作为备选区块产生节点、备选共识算法、备选区块产生的时间间隔及备选区块大小;
根据所述备选区块产生节点、所述备选区块产生的时间间隔及所述备选区块大小确定备选动作空间A1 (t1)′执行所述备选动作空间A1 (t1)′;
S54、计算执行所述备选动作空间A1 (t1)′后的奖励R1 (t1)并得到更新后的第一状态空间S1 (t1+1)
Figure BDA0002797346810000121
S55、将S1 (t1)、A1 (t1)′、R1 (t1)及S1 (t1+1)存入第一DQN算法的经验库中作为t1时刻的一条测验信息;
S56、随机从经验库中取出mini-batch1条测验信息,mini-batch1表示第一DQN算法的迭代次数;
S57、根据梯度下降策略确定最优的所述第一动作空间,根据最优的所述第一动作空间中的最优区块产生节点、最优共识算法、最优区块产生时间间隔及最优区块大小确定所述区块的部署方式;
其中,所述梯度下降策略为:
Figure BDA0002797346810000131
i表示一时刻,θ表示网络权重参数,对所述网络参数进行调整能够实现选择更好的动作空间,每一次网络权重参数的更新就是一次动作空间的选择,直到选择到最佳的动作空间为止;
满足所述梯度下降策略的A1 (i)中的区块产生节点、共识算法、区块产生时间间隔及区块大小即为最优区块产生节点、最优共识算法、最优区块产生时间间隔及最优区块大小;
S58、根据所述部署方式将所述任务发布信息发布到与所述任务等级相对应的区块链等级所对应的区块链上;
S7中所述通过第二DQN算法确定与所述第一位置信息对应的所述请求者位置所在的所述第一任务选择请求具体为:
S71、获取截止至第二时刻的位置信息集合、请求者位置集合及任务完成时限集合,根据所述位置信息集合、所述请求者位置集合及所述任务完成时限集合确定所述第二DQN算法的第二状态空间:
S2 (t2)=[LT,LW,Tl](t2)
其中,S2 (t2)表示第二时刻的所述第二状态空间,LT表示所述位置信息,LT=(xt,yt),(xt,yt)表示所述位置信息的横坐标及纵坐标;LW表示所述请求者位置集合,LW=(xw,yw),(xw,yw)表示所述请求者位置的横坐标及纵坐标;Tl表示所述任务完成时限集合;
S72、获取所述位置信息与所述请求者位置之间的距离dist(t2,w)
Figure BDA0002797346810000132
S73、定义所述第二DQN算法的第二动作空间A(t2)
A2 (t2)=[Creditw,dw](t2)
其中,Creditw表示请求者信用,dw表示请求者可移动距离,dw∈(0,dmax],dmax表示所述请求者可移动距离的最大值;
在一种可选的实施方式中,在步骤S7所发送的任务选择请求中包括请求者可移动距离的最大值;
S74、将当前的所述动作空间A2 (t2)输入到当前网络中,为所述状态空间中的请求者信用Creditw及请求者可移动距离dw分别随机选择信用待测值及可移动距离待测值;
计算各个信用待测值及各个可移动距离待测值所对应的Q值,确定Q值最大的信用待测值及可移动距离待测值,分别作为备选请求者信用及备选可移动距离;
根据备选请求者信用及备选可移动距离确定备选动作空间A2 (t2)′执行所述备选动作空间A2 (t2)′;
S75、计算执行所述备选动作空间A2 (t2)′后的奖励R2 (t2)并得到更新后的第二状态空间S2 (t2+1)
Figure BDA0002797346810000141
S76、将S2 (t2)、A2 (t2)′、R2 (t2)及S2 (t2+1)存入第二DQN算法的经验库中作为t2时刻的一条测验信息;
S77、随机从经验库中取出mini-batch2条测验信息,mini-batch2表示第二DQN算法的迭代次数;
S78、根据梯度下降策略确定最优的所述第二动作空间,根据最优的所述第二动作空间中的最优请求者信用及最优可移动距离确定所述最优请求者信用所对应的请求者标识;
其中,所述梯度下降策略为:
Figure BDA0002797346810000142
j表示一时刻,θ表示网络权重参数;
S79、绑定所述请求者标识及所述位置信息所对应的任务标识。
本发明的实施例三为:
一种基于区块链和深度强化学习的空间众包方法,其与实施例一或实施例二的不同之处在于:
所述S53之后具体为:
S54、根据所述备选动作空间确定所述区块的部署方式,根据所述部署方式将所述任务发布信息发布到与所述任务等级相对应的区块链等级所对应的区块链上;
S55、计算执行所述备选动作空间A1 (t1)′后的奖励R1 (t1)并得到更新后的第一状态空间S1 (t1+1)
Figure BDA0002797346810000151
S55、将S1 (t1)、A1 (t1)′、R1 (t1)及S1 (t1+1)存入第一DQN算法的经验库中作为t1时刻的一条测验信息;
S56、随机从经验库中取出mini-batch1条测验信息,mini-batch1表示第一DQN算法的迭代次数;
S57、根据梯度下降策略更新所述第一DQN算法;
其中,所述梯度下降策略为:
Figure BDA0002797346810000152
i表示一时刻,θ表示网络权重参数;
所述S74之后具体为:
S75、根据备选动作空间中的备选请求者信用及备选可移动距离确定备选请求者信用所对应的请求者标识,绑定请求者标识及所述位置信息对应的任务标识;
S76、计算执行所述备选动作空间A2 (t2)′后的奖励R2 (t2)并得到更新后的第二状态空间S2 (t2+1);第二状态空间用于第二时刻后下一时刻的备选动作空间的确定;
Figure BDA0002797346810000153
S77、将S2 (t2)、A2 (t2)′、R2 (t2)及S2 (t2+1)存入第二DQN算法的经验库中作为t2时刻的一条测验信息;
S78、随机从经验库中取出mini-batch2条测验信息,mini-batch2表示第二DQN算法的迭代次数;
S78、根据梯度下降策略更新所述第二DQN算法;
其中,所述梯度下降策略为:
Figure BDA0002797346810000154
j表示一时刻,θ表示网络权重参数。
请参照图3,本发明的实施四为:
一种基于区块链和深度强化学习的空间众包方法,其与实施例一、实施例二或实施例三的不同之处在于:
S8具体为:
S81、获取任务完成信息所对应的评分,评分包括时间分数TScore及质量分数Qscore;
在一种可选的实施方式中,从任务发布方处获取评分;
S82、根据时间分数和质量分数更新请求者信用:
Figure BDA0002797346810000161
其中,Creditupdate表示更新后的请求者信用,Creditw表示当前的请求者信用,Tw表示请求者完成任务的实际时间,Tl表示任务发布放所发布的任务发布信息中的任务完成时限,Tlevel表示任务发布信息所对应的区块链等级的权重,β表示预计报酬,dw′表示请求者的移动距离,dw′∈(0,dmax];
在一种可选的实施方式中,预计报酬与任务发布信息所在的区块链等级相关,A、B及C等级的区块链中的任务发布信息所对应的预计报酬分别为:3、2及1;
其中,Tlevel的计算方式为:
Figure BDA0002797346810000162
其中,TASCLL表示恩物发布信息所对应的区块链等级的ASCLL码,m表示请求者执行过的任务发布信息的总数,
Figure BDA0002797346810000163
表示请求者执行过的所有任务的ASCLL码的和。
请参照图2,本发明的实施例五为:
一种基于区块链和深度强化学习的空间众包终端1,包括处理器2、存储器3及存储在存储器3上并可在所述处理器2上运行的计算机程序,所述处理器2执行所述计算机程序时实现实施例一、实施例二、实施例三或实施例四中的各个步骤。
综上所述,本发明提供了一种基于区块链和深度强化学习的空间众包方法及终端,利用区块链的分布式特性,将区块链多链结构作为空间众包的分布式任务服务器,克服了传统众包集中式任务服务器单点故障问题,并通过DQN算法算法确定任务发布信息产生区块的方式及区块的发布方式,提高了区块链的交易处理能力(将区块发布在区块链上即视为一次交易)提高区块链的交易处理能力,能够有效应对空间众包应用时的各种场景;设计了基于Hyperledger Fabric的区块链多链结构,将不同等级的任务发布信息和请求者放入相应等级的区块链中,每个区块链创建一个交易账本,只有在该区块链上注册过的请求者才有权查看获取区块链中发布的任务发布信息,任务发布信息不对所有请求者可见,有效防止了恶意请求者获取任务内容后前往任务地点窃取高度敏感空间任务中包含的数据隐私;同时结合新的众包任务分配方案,通过DRL(Deep Reinforcement Learning,深度强化学习)算法动态根据请求者信用及请求者位置选择可靠的请求者,避免了因任务分配不当而造成的数据隐私泄露;并且还设计了任务评估机制,请求者所获得的信用和报酬都与任务完成情况直接相关,平台上每个请求者都能够通过认真完成任务来提高自己的信用和获得报酬,任务等级越高,获得的报酬越丰富,提供了公平性的保证。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (7)

1.一种基于区块链和深度强化学习的空间众包方法,其特征在于,包括步骤:
S1、获取请求端发送的注册请求,所述注册请求包括请求者标识及请求者等级;
S2、获取区块链信息,所述区块链信息包括区块链等级;
S3、根据所述请求者等级确定对应的区块链等级,将所述请求者标识注册到与所述请求者等级相对应的区块链等级所对应的区块链上,以使得所述请求者标识所对应的请求端能够查询所述区块链上的区块;
S4、获取发布端发送的任务发布信息,所述任务发布信息包括位置信息;
S5、根据所述位置信息确定对应的区块链等级,将所述任务发布信息打包成区块发布到与所述任务等级相对应的区块链等级所对应的区块链上;
所述S2之前还包括:
设置多条区块链,为每条所述区块链分配区块链等级,每条所述区块链的所述区块链等级均不相同;
所述S5之前还包括:
获取任务区域,将所述任务区域分为多个任务子区域,为每个所述任务子区域设置区域等级;
设置所述区域等级与所述区块链等级的对应关系;
所述S5中所述根据所述位置信息确定对应的区块链等级具体为:
确定所述位置信息所处的第一任务子区域,获取所述第一任务子区域的第一区域等级;
获取所述第一区域等级所对应的第一区块链等级作为所述位置信息所对应的区块链等级;
所述S5中将所述任务发布信息打包成区块发布到与所述任务等级相对应的区块链等级所对应的区块链上具体为:
根据第一DQN算法将所述任务发布信息打包成区块并确定所述区块的部署方式;
根据所述部署方式将所述任务发布信息发布到与所述任务等级相对应的区块链等级所对应的区块链上。
2.根据权利要求1所述的一种基于区块链和深度强化学习的空间众包方法,其特征在于,所述S5具体为:
S51、获取区块产生节点的计算能力集合及截止至第一时刻的交易大小集合,根据所述交易大小集合及所述区块链节点计算能力集合确定所述第一DQN算法的第一状态空间:
S1 (t1)=[TSizet1,Nc](t1)
其中,S1 (t1)表示所述第一状态空间,t1表示所述第一时刻,TSizet1表示截止至所述第一时刻t1的交易大小集合,Nc表示区块产生节点的计算能力集合;
S52、定义所述第一DQN算法的动作空间:
A1 (t1)=[Bn,Bc,Bt,Bs](t1)
其中,A1 (t1)表示所述第一DQN算法的第一动作空间,Bn表示区块产生节点,Bn∈{O1,O2,...,On},{O1,O2,...,On}表示区块产生节点集合,Bc表示区块链共识算法,Bt表示区块产生时间间隔,Bt∈{0,5,1,...,Bt max},Bs表示区块大小;
S53、根据梯度下降策略确定最优的所述第一动作空间,根据最优的所述第一动作空间中的最优区块产生节点、最优共识算法、最优区块产生时间间隔及最优区块大小确定所述区块的部署方式;
其中,所述梯度下降策略为:
Figure FDA0003665785420000021
i表示一时刻,θ表示网络权重参数;
S54、根据所述部署方式将所述任务发布信息发布到与所述任务等级相对应的区块链等级所对应的区块链上。
3.根据权利要求1所述的一种基于区块链和深度强化学习的空间众包方法,其特征在于,所述S5之后还包括:
S6、接收请求端发送的任务搜索请求,所述任务搜索请求包括所述请求者标识,获取所述请求者标识所注册的区块链上的区块中的任务发布信息,并将所述任务发布信息返回给所述请求端。
4.根据权利要求3所述的一种基于区块链和深度强化学习的空间众包方法,其特征在于,所述S4中所述任务发布信息包括任务标识;
所述S6之后还包括:
S7、接收请求端发送的任务选择请求,所述任务选择请求包括所述任务标识、所述请求者标识及请求者位置;
获取所述任务标识所对应的第一任务发布信息中的第一位置信息;
判断所述任务标识是否对应多条所述任务选择请求,若是,则通过第二DQN算法确定与所述第一位置信息对应的所述请求者位置所在的第一任务选择请求;
绑定所述第一任务选择请求中的所述任务标识及所述第一任务选择请求中的所述请求者标识。
5.根据权利要求4所述的一种基于区块链和深度强化学习的空间众包方法,其特征在于,所述S4中所述任务发布信息包括任务完成时限;
所述S7中所述通过第二DQN算法确定与所述第一位置信息对应的所述请求者位置所在的所述第一任务选择请求具体为:
S71、获取第二预设时间段内的位置信息集合、请求者位置集合及任务完成时限集合,根据所述位置信息集合、所述请求者位置集合及所述任务完成时限集合确定所述第二DQN算法的第二状态空间:
S2 (t2)=[LT,LW,Tl](t2)
其中,S2 (t2)表示所述第二状态空间,LT表示所述位置信息,LT=(xt2,yt2),LW表示所述请求者位置集合,LW=(xw,yw),Tl表示所述任务完成时限集合;
S72、获取所述位置信息与所述请求者位置之间的距离dist(t2,w)
Figure FDA0003665785420000031
S73、定义所述第二DQN算法的第二动作空间A(t2)
A2 (t2)=[Creditw,dw](t2)
其中,Creditw表示请求者信用,dw表示请求者可移动距离,dmax表示所述请求者可移动距离的最大值;
S74、根据梯度下降策略确定最优的所述第二动作空间,根据最优的所述第二动作空间中的最优请求者信用及最优可移动距离确定所述最优请求者信用所对应的请求者标识;
其中,所述梯度下降策略为:
Figure FDA0003665785420000041
j表示一时刻,θ表示网络权重参数;
S75、绑定所述请求者标识及所述位置信息所对应的任务标识。
6.根据权利要求4所述的一种基于区块链和深度强化学习的空间众包方法,其特征在于,所述S7之后还包括:
接收所述请求端发送的任务完成信息,对所述任务完成信息进行评分;
根据所述评分发送报酬。
7.一种基于区块链和深度强化学习的空间众包终端,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-6任一所述的一种基于区块链和深度强化学习的空间众包方法。
CN202011336649.2A 2020-11-25 2020-11-25 一种基于区块链和深度强化学习的空间众包方法及终端 Active CN112541037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011336649.2A CN112541037B (zh) 2020-11-25 2020-11-25 一种基于区块链和深度强化学习的空间众包方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011336649.2A CN112541037B (zh) 2020-11-25 2020-11-25 一种基于区块链和深度强化学习的空间众包方法及终端

Publications (2)

Publication Number Publication Date
CN112541037A CN112541037A (zh) 2021-03-23
CN112541037B true CN112541037B (zh) 2022-09-06

Family

ID=75015203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011336649.2A Active CN112541037B (zh) 2020-11-25 2020-11-25 一种基于区块链和深度强化学习的空间众包方法及终端

Country Status (1)

Country Link
CN (1) CN112541037B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052744A (zh) * 2021-03-30 2021-06-29 浙江工业大学 一种基于区块链的智慧社区系统
CN114282645B (zh) * 2021-11-24 2023-04-21 杭州电子科技大学 一种基于dqn的时空众包任务分配方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291862A (zh) * 2017-06-12 2017-10-24 腾讯科技(深圳)有限公司 业务数据存储方法、装置、存储介质及电子设备
CN109246176A (zh) * 2018-07-03 2019-01-18 北京邮电大学 软件定义网络中基于区块链的多控制器同步方法及装置
CN109544332A (zh) * 2018-10-17 2019-03-29 贵阳信息技术研究院(中科院软件所贵阳分部) 一种基于用户等级的区块链交易出块的方法
CN110620772A (zh) * 2019-09-20 2019-12-27 西安电子科技大学 基于区块链的空间众包多级位置隐私保护方法
CN110727735A (zh) * 2019-10-17 2020-01-24 腾讯科技(深圳)有限公司 基于区块链技术协作完成任务事件的方法、装置及设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10438170B2 (en) * 2017-01-05 2019-10-08 International Business Machines Corporation Blockchain for program code credit and programmer contribution in a collective
CN108632045A (zh) * 2018-05-10 2018-10-09 阿里巴巴集团控股有限公司 一种区块链数据处理方法、装置、处理设备及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291862A (zh) * 2017-06-12 2017-10-24 腾讯科技(深圳)有限公司 业务数据存储方法、装置、存储介质及电子设备
CN109246176A (zh) * 2018-07-03 2019-01-18 北京邮电大学 软件定义网络中基于区块链的多控制器同步方法及装置
CN109544332A (zh) * 2018-10-17 2019-03-29 贵阳信息技术研究院(中科院软件所贵阳分部) 一种基于用户等级的区块链交易出块的方法
CN110620772A (zh) * 2019-09-20 2019-12-27 西安电子科技大学 基于区块链的空间众包多级位置隐私保护方法
CN110727735A (zh) * 2019-10-17 2020-01-24 腾讯科技(深圳)有限公司 基于区块链技术协作完成任务事件的方法、装置及设备

Also Published As

Publication number Publication date
CN112541037A (zh) 2021-03-23

Similar Documents

Publication Publication Date Title
US11509462B2 (en) Secure data distribution protocol using blockchains
Peng et al. Vfchain: Enabling verifiable and auditable federated learning via blockchain systems
Dai et al. Deep reinforcement learning and permissioned blockchain for content caching in vehicular edge computing and networks
Cao et al. Toward on-device federated learning: A direct acyclic graph-based blockchain approach
CN111062044B (zh) 基于区块链的模型联合训练方法及装置
Fei et al. A K-anonymity based schema for location privacy preservation
JP6574168B2 (ja) 端末識別方法、ならびにマシン識別コードを登録する方法、システム及び装置
CN112541037B (zh) 一种基于区块链和深度强化学习的空间众包方法及终端
KR102254809B1 (ko) 블록체인에 기반한, 자원 공유에 따른 보상 제공하는 분산형 컴퓨팅 자원 공유 시스템 및 컴퓨팅 장치
CN112765677A (zh) 一种基于区块链的联邦学习方法、装置和系统
JP2013522733A5 (zh)
AU2018346326B2 (en) Declarative smart contracts
CN112035880B (zh) 一种基于偏好感知的轨迹隐私保护服务推荐方法
Tang et al. A Trust‐Based Model for Security Cooperating in Vehicular Cloud Computing
CN105430615A (zh) 一种连续位置服务请求下基于假位置的位置隐私保护方法
Wang et al. The truthful evolution and incentive for large-scale mobile crowd sensing networks
CN114417398A (zh) 一种基于区块链和联邦学习的数据共享方法
CN111797433B (zh) 一种基于差分隐私的lbs服务隐私保护方法
Haddaji et al. Federated learning with blockchain approach for trust management in IoV
CN110874638B (zh) 面向行为分析的元知识联邦方法、装置、电子设备及系统
CN108040321B (zh) 一种路网环境下抗重放攻击的位置匿名方法
Yang et al. Participant selection strategy with privacy protection for internet of things search
CN106875175B (zh) 一种便于支付主体扩展的方法和装置
Guo et al. A k‐nearest neighbor query method based on trust and location privacy protection
CN114826684B (zh) 支持高效隐私保护的去中心化众包方法、系统及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant