CN116777042A - 一种基于区块链与联邦学习融合的交通流预测方法 - Google Patents
一种基于区块链与联邦学习融合的交通流预测方法 Download PDFInfo
- Publication number
- CN116777042A CN116777042A CN202310506019.2A CN202310506019A CN116777042A CN 116777042 A CN116777042 A CN 116777042A CN 202310506019 A CN202310506019 A CN 202310506019A CN 116777042 A CN116777042 A CN 116777042A
- Authority
- CN
- China
- Prior art keywords
- traffic flow
- client
- roadside unit
- edge server
- flow prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000004927 fusion Effects 0.000 title claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 33
- 238000009826 distribution Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 7
- 230000005284 excitation Effects 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 25
- 230000007246 mechanism Effects 0.000 claims description 15
- 230000004913 activation Effects 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 11
- 230000002776 aggregation Effects 0.000 claims description 10
- 238000004220 aggregation Methods 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 9
- 230000006403 short-term memory Effects 0.000 claims description 7
- 230000006835 compression Effects 0.000 claims description 6
- 238000007906 compression Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000005304 joining Methods 0.000 claims description 3
- 230000015654 memory Effects 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- RUPBZQFQVRMKDG-UHFFFAOYSA-M Didecyldimethylammonium chloride Chemical compound [Cl-].CCCCCCCCCC[N+](C)(C)CCCCCCCCCC RUPBZQFQVRMKDG-UHFFFAOYSA-M 0.000 claims 1
- 238000010801 machine learning Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/098—Distributed learning, e.g. federated learning
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Business, Economics & Management (AREA)
- Computer Security & Cryptography (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于区块链与联邦学习融合的交通流预测方法,包括:主边缘服务器下发初始化模型;客户端路边单元搭建交通流预测模型并训练;客户端路边单元将交通流预测模型的参数与准确率上传至附近的边缘服务器来获得信誉激励;产生新的区块加入区块链中,给出对应的信誉值进行奖励分配;得到全局模型及其参数,将全局模型的参数上传至区块链;客户端路边单元从区块链中下载全局模型的参数进行本地更新,返回步骤(2)。将区块链与联邦学习结合,保障了客户端路边单元数据的隐私性同时激励更多的路边单元参与联邦学习任务中,还可以保护隐私的同时提高交通流预测的准确性,帮助城市更好地规划和处理交通问题,同时提高居民的出行效率和舒适度。
Description
技术领域
本发明涉及智能交通技术领域,尤其是一种基于区块链与联邦学习融合的交通流预测方法。
背景技术
随着智能交通领域的发展,使用交通流数据基于机器学习方法在保证安全性的同时进行准确预测,对解决道路的交通拥塞问题、避免产生的环境污染和提高交通出行效率具有重要意义。这一领域的发展与创新有助于改善城市道路状况,影响整个城市的交通系统运营管理,对提升城市交通效率和安全至关重要。
近年来对交通流量如何进行准确预测引起了广泛的关注,现有技术大多考虑采用线性和机器学习方法来预测交通流量,包括自回归模型(AR)、随机森林、长短期记忆网络(LSTM)和门控制循环单元GRU等,AR方法采用线性的时序分析模型,而其他机器学习方法先进行预处理得到数据特征值,根据历史时间间隙的交通流数据预测下一时间序列的交通流。大多都只是在单设备中进行预测或采用集中式学习进行预测,AR方法会导致预测准确率不高,其他机器学习方法会造成隐私交通流数据的泄露问题。因此,采用联邦学习保证数据隐私前提下的流量预测方法被提出。但是,联邦学习也存在“单点故障”的安全性问题。由于区块链具有去中心化、安全性和无第三方等特点的分布式账本,将联邦学习与区块链结合用于交通流预测,可以解决联邦学习存在“单点故障”的安全性问题,保证联邦学习过程的安全。
然而,将区块链和联邦学习结合用于交通流预测还存在以下问题:其一,由于客户端路边单元的交通流数据集不同,如何构建客户端路边单元模型对交通流进行预测才能提取数据特征并进行准确的流量预测;其二,当客户端路边单元过多时,服务器如何筛选高质量的模型参数;其三,基于区块链与联邦学习的系统缺乏有效的激励机制,让更多路边单元愿意参与到联邦学习任务模型的训练中。
发明内容
为解决客户端路边单元对交通流预测精度低、边缘服务器可能会聚合较差的交通流预测模型参数,以及很多客户端路边单元不愿意参与联邦学习任务进行高质量聚合的问题,本发明的目的在于提供一种能够实时预测避免城市交通拥堵,并且激励更多的路边单元参与联邦学习任务训练中的基于区块链与联邦学习融合的交通流预测方法。
为实现上述目的,本发明采用了以下技术方案:一种基于区块链与联邦学习融合的交通流预测方法,该方法包括下列顺序的步骤:
(1)在位于客户端路边单元附近的边缘服务器和客户端路边单元之间构建区块链和联邦学习的训练环境,当接收到服务需求方发布的联邦学习任务与赏金时,主边缘服务器下发初始化模型;
(2)客户端路边单元搭建交通流预测模型并训练:首先获取本地交通流量数据集并进行预处理,客户端路边单元从区块链中下载初始化模型以及客户端路边单元迭代的次数,所述初始化模型采用LSTM网络,客户端路边单元在LSTM网络的基础上增加注意力机制模块构建交通流预测模型,将经过预处理后的本地交通流量数据集输入交通流预测模型进行训练,得到交通流预测模型的参数和准确率;
(3)客户端路边单元将交通流预测模型的参数与准确率打包后进行数字签名封装成交易的形式上传至附近的边缘服务器来获得信誉激励;
(4)边缘服务器根据接收的交易,首先检验客户端路边单元的数字签名之后对交通流预测模型的参数进行交叉验证,产生新的区块加入区块链中,并根据智能合约校验交通流预测模型的参数的准确度,给出对应的信誉值进行奖励分配;
(5)主边缘服务器采用Topk算法对交通流预测模型进行压缩和参数聚合,得到全局模型及其参数,将全局模型的参数上传至区块链;
(6)客户端路边单元从区块链中下载全局模型的参数进行本地更新,返回步骤(2),继续进行模型训练直至交通流预测模型收敛。
所述步骤(2)具体包括以下步骤:
(2a)获取本地交通流量数据集并进行预处理:
将各待测路边单元收集到的交通流量数据进行汇总统计,构建基于区块链和联邦学习的本地交通流量数据集,本地交通流量数据集采用待测路边单元收集到的80%的数据作为历史交通流数据,得到各待测路边单元的某时段一维历史进站交通流量序列数据Ps:
其中,s是待测路边单元,i表示t从1到n的时间间隔,Ps为待测路边单元收集到的历史交通流量数据序列,pt s为在第t个时间段内经过路边单元s交通流数据;
采用min-max归一化方法对本地交通流量数据集进行归一化处理:
其中,P为被进行归一化的交通流数据,Pmin为历史交通流数据中的最小值,Pmax为历史交通流数据中的最大值,X为经归一化处理后的输出数据;
(2b)构建交通流预测模型并进行训练:
将归一化得到的一维交通流数据序列形式作为LSTM网络的输入进行时间特征提取,再依次经过Dropout层、LSTM层、遗忘门、输入门和输出门的训练后,得到如下表达式:
O(t)=σ(wg[ht,pt]+b) (3)
其中,ht是短期记忆参数,Ht s为在待测路边单元s输入交通流预测模型后的最终输出序列,O(t)是输出门,Ct为长记忆学习参数,*表示element-wise乘积,w和b分别为权重和偏置;g[]是包含输入及短期记忆参数集合;
在隐藏层中添加注意力机制模块,注意力机制模块在Dropout层后增添dense层,即增加一个softmax激活函数,softmax激活函数将神经元输出映射到(0,1)区间内,通过softmax激活函数来计算对应的权重:
其中,pi为当前计算预测客流数据所需的历史客流数据,pt为当前预测需计算权重的数据,αt是LSTM网络输出数据ht s对应的权重,将得到的αt与对应的数据相乘得到增强后的数据,并将其作为下一次的数据输入,最终得到一维序列被输出层接收;
在路边单元每一次预测训练结束后,通过预测的结果与真实值之间计算损失函数,通过模型优化器对参数进行更新,增加预测的准确率同时减少损失函数值;采用选择Adam作为模型的优化算法,选择均方误差MSE作为损失函数:
其中,S为要输入的预测交通流路边单元总数,xi为真实交通流数据,为交通流预测模型预测的交通流数据值,/>为交通流预测模型准确率。
所述步骤(4)具体是指:将边缘服务器作为边缘服务器,根据收到的客户端路边单元的上传的交易,验证客户端路边单元的数字签名,在边缘服务器组内交叉验证客户端路边单元交通流预测模型的准确率,并由智能合约根据准确率设置不同的信誉值进行奖励分配,产生新的区块加入区块链中,首先根据第r个客户端路边单元上传的准确率在交叉验证时的计算信誉值权重,根据智能合约边缘服务器对客户端路边单元进行信誉值评估如下:
其中,ar表示第r个客户端路边单元对应的交通流预测模型的准确性,r=1,2,···,n,ai表示边缘服务器组中第i个边缘服务器验证的准确率,n表示客户端路边单元的数量,M表示边缘服务器组的数量,m表示为最近的边缘服务器且m∈M,λm,r t表示第t次迭代时通过边缘服务器m对客户端路边单元r的信誉评价,λM,r t表示第t次迭代时通过边缘服务器组M其他边缘服务器对第r个客户端路边单元的信誉评价,表示第t次迭代时通过边缘服务器m对第r个客户端路边单元的全局信誉评价,λr t表示第t次迭代时边缘服务器对第r个客户端路边单元评估的信誉值;
根据边缘服务器对第r个客户端路边单元准确率进行信誉值评估后,根据信誉值进行奖励分配,信誉值越高奖励越多,信誉值越低奖励越少:
其中,ur t表示第t次迭代时客户端路边单元分配到的奖励,R表示任务需求方最初下发的联邦学习任务预算。
所述步骤(5)具体是指:在主边缘服务器中设置选择聚合交通流预测模型的参数数量的阈值k,边缘服务器由设置的阈值选择K个客户端身份Kt参加第t次的全局迭代;根据区块链,从边缘服务器选定的第i个客户端路边单元将下载最新参数wi t=wt,然后执行E次本地迭代,在每个客户端路边单元迭代后导出的小批量的梯度下降如下:
其中,Bt i表示交通流预测模型选取batch大小的样本个数,表示第i个客户端路边单元第t+1次全局迭代的梯度参数,η表示学习率,/>表示损失函数,gt+E i表示第i个客户端路边单元的交通流预测模型更新通过E次的交通流预测模型迭代训练进行第t次全局迭代,定义为/> 表示经过E次的本地迭代后,通过区块链中记录的信息,选定的客户端路边单元将交通流预测模型更新上传到边缘服务器,用于全局聚合,得到全局模型:
其中,pi表示客户端路边单元权重,边缘服务器通过参与不同的客户端路边单元来开始新一轮的全局迭代,wt+E表示第t次全局迭代时的第E次本地迭代的参数,即全局模型的参数;来自第i个客户端路边单元的交通流预测模型更新为在联邦学习中,全局模型更新采用压缩模型的方法对接收到的交通流量预测模型参数进行压缩更新,全局更新轮次为t∈L={E,2E,3E,…};
主边缘服务器更新定义为Topk算法如下:
其中,为误差补偿,用于调整边缘服务器中全局模型参数的补偿误差,定义为/>Topk算法在边缘服务器中将k个信誉值较高的交通流预测模型作为全局聚合参数更新,剩下d-k个交通流预测模型参数作为误差补偿,进行交通流预测模型压缩,之后在边缘服务器进行模型参数聚合操作。
由上述技术方案可知,本发明的有益效果为:第一,考虑共享客户端路边单元的本地交通流量数据集进行联合训练,采用联邦学习方法进行交通流预测,在不共享原始私有交通流数据的前提下,解决“数据孤岛”的问题;第二,采用交通流预测模型进行客户端路边单元交通流训练,在LSTM网络的隐藏层中添加了注意力机制模块,注意力机制模块在Dropout层之后增添dense层,即增加一个softmax的激活函数,通过激活函数来计算对应的权重,以达到在交通流预测模型训练过程中自动学习权重参数的目的;第三,采用集中式的模型聚合器,存在例如单点故障等严重的安全问题和缺乏激励机制,而基于区块链的去中心化、安全性及不可篡改等特点,将区块链与联邦学习结合,保障了客户端路边单元数据的隐私性同时激励更多的路边单元参与联邦学习任务中;第四,本发明所提出的区块链和联邦学习结合框架进行交通流预测不仅可以防止恶意节点激励本地客户端路边单元积极参与整个流量预测任务的训练中,还可以保护隐私的同时提高交通流预测的准确性,对城市管理运营至关重要,帮助城市更好地规划和处理交通问题,同时提高居民的出行效率和舒适度。
附图说明
图1为本发明的方法流程图;
图2为本发明实施例提供利用区块链技术构建的联邦学习环境架构图;
图3为本发明中交通流预测模型的实现原理图;
图4为本发明实施例提供的区块链中区块结构示意图。
具体实施方式
如图1所示,一种基于区块链与联邦学习融合的交通流预测方法,该方法包括下列顺序的步骤:
(1)在位于客户端路边单元附近的边缘服务器和客户端路边单元之间构建区块链和联邦学习的训练环境,当接收到服务需求方发布的联邦学习任务与赏金时,主边缘服务器下发初始化模型;
(2)客户端路边单元搭建交通流预测模型并训练:首先获取本地交通流量数据集并进行预处理,客户端路边单元从区块链中下载初始化模型以及客户端路边单元迭代的次数,所述初始化模型采用LSTM网络,客户端路边单元在LSTM网络的基础上增加注意力机制模块构建交通流预测模型,将经过预处理后的本地交通流量数据集输入交通流预测模型进行训练,得到交通流预测模型的参数和准确率;
(3)客户端路边单元将交通流预测模型的参数与准确率打包后进行数字签名封装成交易的形式上传至附近的边缘服务器来获得信誉激励;
(4)边缘服务器根据接收的交易,首先检验客户端路边单元的数字签名之后对交通流预测模型的参数进行交叉验证,产生新的区块加入区块链中,并根据智能合约校验交通流预测模型的参数的准确度,给出对应的信誉值进行奖励分配,鼓励更多的路边单元参与联邦学习任务当中;
(5)主边缘服务器采用Topk算法对交通流预测模型进行压缩和参数聚合,得到全局模型及其参数,将全局模型的参数上传至区块链;
(6)客户端路边单元从区块链中下载全局模型的参数进行本地更新,返回步骤(2),继续进行模型训练直至交通流预测模型收敛。
所述步骤(2)具体包括以下步骤:
(2a)获取本地交通流量数据集并进行预处理:
将各待测路边单元收集到的交通流量数据进行汇总统计,构建基于区块链和联邦学习的本地交通流量数据集,本地交通流量数据集采用待测路边单元收集到的80%的数据作为历史交通流数据,得到各待测路边单元的某时段一维历史进站交通流量序列数据Ps:
其中,s是待测路边单元,i表示t从1到n的时间间隔,Ps为待测路边单元收集到的历史交通流量数据序列,pt s为在第t个时间段内经过路边单元s交通流数据;
采用min-max归一化方法对本地交通流量数据集进行归一化处理:
其中,P为被进行归一化的交通流数据,Pmin为历史交通流数据中的最小值,Pmax为历史交通流数据中的最大值,X为经归一化处理后的输出数据;
(2b)构建交通流预测模型并进行训练:
将归一化得到的一维交通流数据序列形式作为LSTM网络的输入进行时间特征提取,再依次经过Dropout层、LSTM层、遗忘门、输入门和输出门的训练后,得到如下表达式:
O(t)=σ(wg[ht,pt]+b) (3)
其中,ht是短期记忆参数,Ht s为在待测路边单元s输入交通流预测模型后的最终输出序列,O(t)是输出门,Ct为长记忆学习参数,*表示element-wise乘积,w和b分别为权重和偏置;g[]是包含输入及短期记忆参数集合;
在隐藏层中添加注意力机制模块,注意力机制模块在Dropout层后增添dense层,即增加一个softmax激活函数,softmax激活函数将神经元输出映射到(0,1)区间内,通过softmax激活函数来计算对应的权重:
其中,pi为当前计算预测客流数据所需的历史客流数据,pt为当前预测需计算权重的数据,αt是LSTM网络输出数据ht s对应的权重,将得到的αt与对应的数据相乘得到增强后的数据,并将其作为下一次的数据输入,最终得到一维序列被输出层接收;
在路边单元每一次预测训练结束后,通过预测的结果与真实值之间计算损失函数,通过模型优化器对参数进行更新,增加预测的准确率同时减少损失函数值;采用选择Adam作为模型的优化算法,Adam能够克服梯度骤降,使模型较快收敛,选择均方误差MSE作为损失函数:
其中,S为要输入的预测交通流路边单元总数,xi为真实交通流数据,为交通流预测模型预测的交通流数据值,/>为交通流预测模型准确率。
所述步骤(4)具体是指:将边缘服务器作为边缘服务器,根据收到的客户端路边单元的上传的交易,验证客户端路边单元的数字签名,在边缘服务器组内交叉验证客户端路边单元交通流预测模型的准确率,并由智能合约根据准确率设置不同的信誉值进行奖励分配,产生新的区块加入区块链中,首先根据第r个客户端路边单元上传的准确率在交叉验证时的计算信誉值权重,根据智能合约边缘服务器对客户端路边单元进行信誉值评估如下:
其中,ar表示第r个客户端路边单元对应的交通流预测模型的准确性,r=1,2,···,n,ai表示边缘服务器组中第i个边缘服务器验证的准确率,n表示客户端路边单元的数量,M表示边缘服务器组的数量,m表示为最近的边缘服务器且m∈M,λm,r t表示第t次迭代时通过边缘服务器m对客户端路边单元r的信誉评价,λM,r t表示第t次迭代时通过边缘服务器组M其他边缘服务器对第r个客户端路边单元的信誉评价,表示第t次迭代时通过边缘服务器m对第r个客户端路边单元的全局信誉评价,λr t表示第t次迭代时边缘服务器对第r个客户端路边单元评估的信誉值;
根据边缘服务器对第r个客户端路边单元准确率进行信誉值评估后,根据信誉值进行奖励分配,信誉值越高奖励越多,信誉值越低奖励越少:
其中,ur t表示第t次迭代时客户端路边单元分配到的奖励,R表示任务需求方最初下发的联邦学习任务预算。
因此,若交通流预测模型预测准确率越高,根据智能合约得到的信誉评估值越高,所分配的奖励越多。因此,激励更多的客户端路边单元进行联邦学习任务,同时激励客户端路边单元进行高质量的模型预测。
所述步骤(5)具体是指:当与边缘服务器通信的客户端路边单元过多时,会造成很大的通信开销,因此,在主边缘服务器中设置选择聚合交通流预测模型的参数数量的阈值k,边缘服务器由设置的阈值选择K个客户端身份Kt参加第t次的全局迭代;根据区块链,从边缘服务器选定的第i个客户端路边单元将下载最新参数wi t=wt,然后执行E次本地迭代,在每个客户端路边单元迭代后导出的小批量的梯度下降如下:
其中,Bt i表示交通流预测模型选取batch大小的样本个数,表示第i个客户端路边单元第t+1次全局迭代的梯度参数,η表示学习率,▽Fi()表示损失函数,gt+E i表示第i个客户端路边单元的交通流预测模型更新通过E次的交通流预测模型迭代训练进行第t次全局迭代,定义为/> 表示经过E次的本地迭代后,通过区块链中记录的信息,选定的客户端路边单元将交通流预测模型更新上传到边缘服务器,用于全局聚合,得到全局模型:
其中,pi表示客户端路边单元权重,边缘服务器通过参与不同的客户端路边单元来开始新一轮的全局迭代,wt+E表示第t次全局迭代时的第E次本地迭代的参数,即全局模型的参数;来自第i个客户端路边单元的交通流预测模型更新为在联邦学习中,全局模型更新采用压缩模型的方法对接收到的交通流量预测模型参数进行压缩更新,全局更新轮次为t∈L={E,2E,3E,…};
主边缘服务器更新定义为Topk算法如下:
其中,为误差补偿,用于调整边缘服务器中全局模型参数的补偿误差,定义为/>Topk算法在边缘服务器中将k个信誉值较高的交通流预测模型作为全局聚合参数更新,剩下d-k个交通流预测模型参数作为误差补偿,进行交通流预测模型压缩,之后在边缘服务器进行模型参数聚合操作。
综上所述,考虑共享客户端路边单元的本地交通流量数据集进行联合训练,本发明采用联邦学习方法进行交通流预测,在不共享原始私有交通流数据的前提下,解决“数据孤岛”的问题;采用交通流预测模型进行客户端路边单元交通流训练,在LSTM网络的隐藏层中添加了注意力机制模块,注意力机制模块在Dropout层之后增添dense层,即增加一个softmax的激活函数,通过激活函数来计算对应的权重,以达到在交通流预测模型训练过程中自动学习权重参数的目的。
Claims (4)
1.一种基于区块链与联邦学习融合的交通流预测方法,其特征在于:该方法包括下列顺序的步骤:
(1)在位于客户端路边单元附近的边缘服务器和客户端路边单元之间构建区块链和联邦学习的训练环境,当接收到服务需求方发布的联邦学习任务与赏金时,主边缘服务器下发初始化模型;
(2)客户端路边单元搭建交通流预测模型并训练:首先获取本地交通流量数据集并进行预处理,客户端路边单元从区块链中下载初始化模型以及客户端路边单元迭代的次数,所述初始化模型采用LSTM网络,客户端路边单元在LSTM网络的基础上增加注意力机制模块构建交通流预测模型,将经过预处理后的本地交通流量数据集输入交通流预测模型进行训练,得到交通流预测模型的参数和准确率;
(3)客户端路边单元将交通流预测模型的参数与准确率打包后进行数字签名封装成交易的形式上传至附近的边缘服务器来获得信誉激励;
(4)边缘服务器根据接收的交易,首先检验客户端路边单元的数字签名之后对交通流预测模型的参数进行交叉验证,产生新的区块加入区块链中,并根据智能合约校验交通流预测模型的参数的准确度,给出对应的信誉值进行奖励分配;
(5)主边缘服务器采用Topk算法对交通流预测模型进行压缩和参数聚合,得到全局模型及其参数,将全局模型的参数上传至区块链;
(6)客户端路边单元从区块链中下载全局模型的参数进行本地更新,返回步骤(2),继续进行模型训练直至交通流预测模型收敛。
2.根据权利要求1所述的基于区块链与联邦学习融合的交通流预测方法,其特征在于:所述步骤(2)具体包括以下步骤:
(2a)获取本地交通流量数据集并进行预处理:
将各待测路边单元收集到的交通流量数据进行汇总统计,构建基于区块链和联邦学习的本地交通流量数据集,本地交通流量数据集采用待测路边单元收集到的80%的数据作为历史交通流数据,得到各待测路边单元的某时段一维历史进站交通流量序列数据Ps:
其中,s是待测路边单元,i表示t从1到n的时间间隔,Ps为待测路边单元收集到的历史交通流量数据序列,pt s为在第t个时间段内经过路边单元s交通流数据;
采用min-max归一化方法对本地交通流量数据集进行归一化处理:
其中,P为被进行归一化的交通流数据,Pmin为历史交通流数据中的最小值,Pmax为历史交通流数据中的最大值,X为经归一化处理后的输出数据;
(2b)构建交通流预测模型并进行训练:
将归一化得到的一维交通流数据序列形式作为LSTM网络的输入进行时间特征提取,再依次经过Dropout层、LSTM层、遗忘门、输入门和输出门的训练后,得到如下表达式:
O(t)=σ(wg[ht,pt]+b) (3)
其中,ht是短期记忆参数,Ht s为在待测路边单元s输入交通流预测模型后的最终输出序列,O(t)是输出门,Ct为长记忆学习参数,*表示element-wise乘积,w和b分别为权重和偏置;g[]是包含输入及短期记忆参数集合;
在隐藏层中添加注意力机制模块,注意力机制模块在Dropout层后增添dense层,即增加一个softmax激活函数,softmax激活函数将神经元输出映射到(0,1)区间内,通过softmax激活函数来计算对应的权重:
其中,pi为当前计算预测客流数据所需的历史客流数据,pt为当前预测需计算权重的数据,αt是LSTM网络输出数据ht s对应的权重,将得到的αt与对应的数据相乘得到增强后的数据,并将其作为下一次的数据输入,最终得到一维序列被输出层接收;
在路边单元每一次预测训练结束后,通过预测的结果与真实值之间计算损失函数,通过模型优化器对参数进行更新,增加预测的准确率同时减少损失函数值;采用选择Adam作为模型的优化算法,选择均方误差MSE作为损失函数:
其中,S为要输入的预测交通流路边单元总数,xi为真实交通流数据,为交通流预测模型预测的交通流数据值,/>为交通流预测模型准确率。
3.根据权利要求1所述的基于区块链与联邦学习融合的交通流预测方法,其特征在于:所述步骤(4)具体是指:将边缘服务器作为边缘服务器,根据收到的客户端路边单元的上传的交易,验证客户端路边单元的数字签名,在边缘服务器组内交叉验证客户端路边单元交通流预测模型的准确率,并由智能合约根据准确率设置不同的信誉值进行奖励分配,产生新的区块加入区块链中,首先根据第r个客户端路边单元上传的准确率在交叉验证时的计算信誉值权重,根据智能合约边缘服务器对客户端路边单元进行信誉值评估如下:
其中,ar表示第r个客户端路边单元对应的交通流预测模型的准确性,r=1,2,···,n,ai表示边缘服务器组中第i个边缘服务器验证的准确率,n表示客户端路边单元的数量,M表示边缘服务器组的数量,m表示为最近的边缘服务器且m∈M,λm,r t表示第t次迭代时通过边缘服务器m对客户端路边单元r的信誉评价,λM,r t表示第t次迭代时通过边缘服务器组M其他边缘服务器对第r个客户端路边单元的信誉评价,表示第t次迭代时通过边缘服务器m对第r个客户端路边单元的全局信誉评价,λr t表示第t次迭代时边缘服务器对第r个客户端路边单元评估的信誉值;
根据边缘服务器对第r个客户端路边单元准确率进行信誉值评估后,根据信誉值进行奖励分配,信誉值越高奖励越多,信誉值越低奖励越少:
其中,ur t表示第t次迭代时客户端路边单元分配到的奖励,R表示任务需求方最初下发的联邦学习任务预算。
4.根据权利要求1所述的基于区块链与联邦学习融合的交通流预测方法,其特征在于:所述步骤(5)具体是指:在主边缘服务器中设置选择聚合交通流预测模型的参数数量的阈值k,边缘服务器由设置的阈值选择K个客户端身份Kt参加第t次的全局迭代;根据区块链,从边缘服务器选定的第i个客户端路边单元将下载最新参数wi t=wt,然后执行E次本地迭代,在每个客户端路边单元迭代后导出的小批量的梯度下降如下:
其中,Bt i表示交通流预测模型选取batch大小的样本个数,表示第i个客户端路边单元第t+1次全局迭代的梯度参数,η表示学习率,/>表示损失函数,gt+E i表示第i个客户端路边单元的交通流预测模型更新通过E次的交通流预测模型迭代训练进行第t次全局迭代,定义为/> 表示经过E次的本地迭代后,通过区块链中记录的信息,选定的客户端路边单元将交通流预测模型更新上传到边缘服务器,用于全局聚合,得到全局模型:
其中,pi表示客户端路边单元权重,边缘服务器通过参与不同的客户端路边单元来开始新一轮的全局迭代,wt+E表示第t次全局迭代时的第E次本地迭代的参数,即全局模型的参数;来自第i个客户端路边单元的交通流预测模型更新为在联邦学习中,全局模型更新采用压缩模型的方法对接收到的交通流量预测模型参数进行压缩更新,全局更新轮次为t∈L={E,2E,3E,…};
主边缘服务器更新定义为Topk算法如下:
其中,为误差补偿,用于调整边缘服务器中全局模型参数的补偿误差,定义为Topk算法在边缘服务器中将k个信誉值较高的交通流预测模型作为全局聚合参数更新,剩下d-k个交通流预测模型参数作为误差补偿,进行交通流预测模型压缩,之后在边缘服务器进行模型参数聚合操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310506019.2A CN116777042A (zh) | 2023-05-08 | 2023-05-08 | 一种基于区块链与联邦学习融合的交通流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310506019.2A CN116777042A (zh) | 2023-05-08 | 2023-05-08 | 一种基于区块链与联邦学习融合的交通流预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116777042A true CN116777042A (zh) | 2023-09-19 |
Family
ID=87988546
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310506019.2A Pending CN116777042A (zh) | 2023-05-08 | 2023-05-08 | 一种基于区块链与联邦学习融合的交通流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116777042A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117112369A (zh) * | 2023-10-19 | 2023-11-24 | 凌雄技术(深圳)有限公司 | 一种基于区块链的设备管理SaaS系统 |
-
2023
- 2023-05-08 CN CN202310506019.2A patent/CN116777042A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117112369A (zh) * | 2023-10-19 | 2023-11-24 | 凌雄技术(深圳)有限公司 | 一种基于区块链的设备管理SaaS系统 |
CN117112369B (zh) * | 2023-10-19 | 2024-03-01 | 凌雄技术(深圳)有限公司 | 一种基于区块链的设备管理SaaS系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109285346B (zh) | 一种基于关键路段的城市路网交通状态预测方法 | |
CN108197739B (zh) | 一种城市轨道交通乘客流量预测方法 | |
Vlahogianni et al. | Spatio‐temporal short‐term urban traffic volume forecasting using genetically optimized modular networks | |
CN109886444A (zh) | 一种交通短时客流预测方法、装置、设备和存储介质 | |
CN110766212B (zh) | 用于历史数据缺失电场的超短期光伏功率预测方法 | |
CN106781489B (zh) | 一种基于递归神经网络的路网状态预测方法 | |
CN108009674A (zh) | 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法 | |
CN109919358A (zh) | 一种基于神经网络时空注意力机制的实时站点流量预测方法 | |
CN113283588B (zh) | 一种基于深度学习的近岸单点海浪浪高预报方法 | |
CN111860989B (zh) | 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法 | |
CN110400015A (zh) | 一种时间估计方法及其装置、设备 | |
CN108564391A (zh) | 一种考虑主客观信息的共享电动汽车需求预测方法及系统 | |
CN109785618A (zh) | 一种基于组合逻辑的短时交通流预测方法 | |
CN110570656B (zh) | 定制公共交通线路方法及装置 | |
CN107704970A (zh) | 一种基于Spark的需求侧负荷预测方法 | |
CN116777042A (zh) | 一种基于区块链与联邦学习融合的交通流预测方法 | |
CN113506445B (zh) | 考虑出行者长期遵从行为变化的实时交通诱导系统及方法 | |
CN112529683A (zh) | 一种基于cs-pnn的客户信贷风险的评估方法及系统 | |
CN113344467A (zh) | 一种电力工程资金预测方法和装置 | |
CN113672797A (zh) | 一种内容推荐方法及装置 | |
Beljkaš et al. | Application of artificial intelligence for the estimation of concrete and reinforcement consumption in the construction of integral bridges | |
Lai et al. | Bus arrival time prediction using wavelet neural network trained by improved particle swarm optimization | |
CN116662815B (zh) | 时间预测模型的训练方法以及相关设备 | |
CN115170006B (zh) | 发车调度方法、装置、设备和存储介质 | |
CN110119884B (zh) | 一种基于近邻传播聚类的高速铁路客流时段划分方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |