CN116777042A

CN116777042A - 一种基于区块链与联邦学习融合的交通流预测方法

Info

Publication number: CN116777042A
Application number: CN202310506019.2A
Authority: CN
Inventors: 智慧; 段苗苗; 王雅宁; 费洁; 黄彧
Original assignee: Anhui University
Current assignee: Anhui University
Priority date: 2023-05-08
Filing date: 2023-05-08
Publication date: 2023-09-19

Abstract

本发明涉及一种基于区块链与联邦学习融合的交通流预测方法，包括：主边缘服务器下发初始化模型；客户端路边单元搭建交通流预测模型并训练；客户端路边单元将交通流预测模型的参数与准确率上传至附近的边缘服务器来获得信誉激励；产生新的区块加入区块链中，给出对应的信誉值进行奖励分配；得到全局模型及其参数，将全局模型的参数上传至区块链；客户端路边单元从区块链中下载全局模型的参数进行本地更新，返回步骤(2)。将区块链与联邦学习结合，保障了客户端路边单元数据的隐私性同时激励更多的路边单元参与联邦学习任务中，还可以保护隐私的同时提高交通流预测的准确性，帮助城市更好地规划和处理交通问题，同时提高居民的出行效率和舒适度。

Description

一种基于区块链与联邦学习融合的交通流预测方法

技术领域

本发明涉及智能交通技术领域，尤其是一种基于区块链与联邦学习融合的交通流预测方法。

背景技术

随着智能交通领域的发展，使用交通流数据基于机器学习方法在保证安全性的同时进行准确预测，对解决道路的交通拥塞问题、避免产生的环境污染和提高交通出行效率具有重要意义。这一领域的发展与创新有助于改善城市道路状况，影响整个城市的交通系统运营管理，对提升城市交通效率和安全至关重要。

近年来对交通流量如何进行准确预测引起了广泛的关注，现有技术大多考虑采用线性和机器学习方法来预测交通流量，包括自回归模型(AR)、随机森林、长短期记忆网络(LSTM)和门控制循环单元GRU等，AR方法采用线性的时序分析模型，而其他机器学习方法先进行预处理得到数据特征值，根据历史时间间隙的交通流数据预测下一时间序列的交通流。大多都只是在单设备中进行预测或采用集中式学习进行预测，AR方法会导致预测准确率不高，其他机器学习方法会造成隐私交通流数据的泄露问题。因此，采用联邦学习保证数据隐私前提下的流量预测方法被提出。但是，联邦学习也存在“单点故障”的安全性问题。由于区块链具有去中心化、安全性和无第三方等特点的分布式账本，将联邦学习与区块链结合用于交通流预测，可以解决联邦学习存在“单点故障”的安全性问题，保证联邦学习过程的安全。

然而，将区块链和联邦学习结合用于交通流预测还存在以下问题：其一，由于客户端路边单元的交通流数据集不同，如何构建客户端路边单元模型对交通流进行预测才能提取数据特征并进行准确的流量预测；其二，当客户端路边单元过多时，服务器如何筛选高质量的模型参数；其三，基于区块链与联邦学习的系统缺乏有效的激励机制，让更多路边单元愿意参与到联邦学习任务模型的训练中。

发明内容

为解决客户端路边单元对交通流预测精度低、边缘服务器可能会聚合较差的交通流预测模型参数，以及很多客户端路边单元不愿意参与联邦学习任务进行高质量聚合的问题，本发明的目的在于提供一种能够实时预测避免城市交通拥堵，并且激励更多的路边单元参与联邦学习任务训练中的基于区块链与联邦学习融合的交通流预测方法。

为实现上述目的，本发明采用了以下技术方案：一种基于区块链与联邦学习融合的交通流预测方法，该方法包括下列顺序的步骤：

(1)在位于客户端路边单元附近的边缘服务器和客户端路边单元之间构建区块链和联邦学习的训练环境，当接收到服务需求方发布的联邦学习任务与赏金时，主边缘服务器下发初始化模型；

(2)客户端路边单元搭建交通流预测模型并训练：首先获取本地交通流量数据集并进行预处理，客户端路边单元从区块链中下载初始化模型以及客户端路边单元迭代的次数，所述初始化模型采用LSTM网络，客户端路边单元在LSTM网络的基础上增加注意力机制模块构建交通流预测模型，将经过预处理后的本地交通流量数据集输入交通流预测模型进行训练，得到交通流预测模型的参数和准确率；

(3)客户端路边单元将交通流预测模型的参数与准确率打包后进行数字签名封装成交易的形式上传至附近的边缘服务器来获得信誉激励；

(4)边缘服务器根据接收的交易，首先检验客户端路边单元的数字签名之后对交通流预测模型的参数进行交叉验证，产生新的区块加入区块链中，并根据智能合约校验交通流预测模型的参数的准确度，给出对应的信誉值进行奖励分配；

(5)主边缘服务器采用Top_k算法对交通流预测模型进行压缩和参数聚合，得到全局模型及其参数，将全局模型的参数上传至区块链；

(6)客户端路边单元从区块链中下载全局模型的参数进行本地更新，返回步骤(2)，继续进行模型训练直至交通流预测模型收敛。

所述步骤(2)具体包括以下步骤：

(2a)获取本地交通流量数据集并进行预处理：

将各待测路边单元收集到的交通流量数据进行汇总统计，构建基于区块链和联邦学习的本地交通流量数据集，本地交通流量数据集采用待测路边单元收集到的80％的数据作为历史交通流数据，得到各待测路边单元的某时段一维历史进站交通流量序列数据P^s：

其中，s是待测路边单元，i表示t从1到n的时间间隔，P^s为待测路边单元收集到的历史交通流量数据序列，p_t ^s为在第t个时间段内经过路边单元s交通流数据；

采用min-max归一化方法对本地交通流量数据集进行归一化处理：

其中，P为被进行归一化的交通流数据，P_min为历史交通流数据中的最小值，P_max为历史交通流数据中的最大值，X为经归一化处理后的输出数据；

(2b)构建交通流预测模型并进行训练：

将归一化得到的一维交通流数据序列形式作为LSTM网络的输入进行时间特征提取，再依次经过Dropout层、LSTM层、遗忘门、输入门和输出门的训练后，得到如下表达式：

O(t)＝σ(wg[h_t,p_t]+b) (3)

其中，h_t是短期记忆参数，H_t ^s为在待测路边单元s输入交通流预测模型后的最终输出序列，O(t)是输出门，C_t为长记忆学习参数，*表示element-wise乘积，w和b分别为权重和偏置；g[]是包含输入及短期记忆参数集合；

在隐藏层中添加注意力机制模块，注意力机制模块在Dropout层后增添dense层，即增加一个softmax激活函数，softmax激活函数将神经元输出映射到(0,1)区间内，通过softmax激活函数来计算对应的权重：

其中，p_i为当前计算预测客流数据所需的历史客流数据，p_t为当前预测需计算权重的数据，α_t是LSTM网络输出数据h_t ^s对应的权重，将得到的α_t与对应的数据相乘得到增强后的数据，并将其作为下一次的数据输入，最终得到一维序列被输出层接收；

在路边单元每一次预测训练结束后，通过预测的结果与真实值之间计算损失函数，通过模型优化器对参数进行更新，增加预测的准确率同时减少损失函数值；采用选择Adam作为模型的优化算法，选择均方误差MSE作为损失函数：

其中，S为要输入的预测交通流路边单元总数，x_i为真实交通流数据，为交通流预测模型预测的交通流数据值，/>为交通流预测模型准确率。

所述步骤(4)具体是指：将边缘服务器作为边缘服务器，根据收到的客户端路边单元的上传的交易，验证客户端路边单元的数字签名，在边缘服务器组内交叉验证客户端路边单元交通流预测模型的准确率，并由智能合约根据准确率设置不同的信誉值进行奖励分配，产生新的区块加入区块链中，首先根据第r个客户端路边单元上传的准确率在交叉验证时的计算信誉值权重，根据智能合约边缘服务器对客户端路边单元进行信誉值评估如下：

其中，a^r表示第r个客户端路边单元对应的交通流预测模型的准确性，r＝1,2,···,n，aⁱ表示边缘服务器组中第i个边缘服务器验证的准确率，n表示客户端路边单元的数量，M表示边缘服务器组的数量，m表示为最近的边缘服务器且m∈M，λ_m，r ^t表示第t次迭代时通过边缘服务器m对客户端路边单元r的信誉评价，λ_M，r ^t表示第t次迭代时通过边缘服务器组M其他边缘服务器对第r个客户端路边单元的信誉评价，表示第t次迭代时通过边缘服务器m对第r个客户端路边单元的全局信誉评价，λ_r ^t表示第t次迭代时边缘服务器对第r个客户端路边单元评估的信誉值；

根据边缘服务器对第r个客户端路边单元准确率进行信誉值评估后，根据信誉值进行奖励分配，信誉值越高奖励越多，信誉值越低奖励越少：

其中，u_r ^t表示第t次迭代时客户端路边单元分配到的奖励，R表示任务需求方最初下发的联邦学习任务预算。

所述步骤(5)具体是指：在主边缘服务器中设置选择聚合交通流预测模型的参数数量的阈值k，边缘服务器由设置的阈值选择K个客户端身份K_t参加第t次的全局迭代；根据区块链，从边缘服务器选定的第i个客户端路边单元将下载最新参数wⁱ _t＝w_t，然后执行E次本地迭代，在每个客户端路边单元迭代后导出的小批量的梯度下降如下：

其中，B_t ⁱ表示交通流预测模型选取batch大小的样本个数，表示第i个客户端路边单元第t+1次全局迭代的梯度参数，η表示学习率，/>表示损失函数，g_t+E ⁱ表示第i个客户端路边单元的交通流预测模型更新通过E次的交通流预测模型迭代训练进行第t次全局迭代，定义为/> 表示经过E次的本地迭代后，通过区块链中记录的信息，选定的客户端路边单元将交通流预测模型更新上传到边缘服务器，用于全局聚合，得到全局模型：

其中，p_i表示客户端路边单元权重，边缘服务器通过参与不同的客户端路边单元来开始新一轮的全局迭代，w_t+E表示第t次全局迭代时的第E次本地迭代的参数，即全局模型的参数；来自第i个客户端路边单元的交通流预测模型更新为在联邦学习中，全局模型更新采用压缩模型的方法对接收到的交通流量预测模型参数进行压缩更新，全局更新轮次为t∈L＝{E,2E,3E,…}；

主边缘服务器更新定义为Top_k算法如下：

其中，为误差补偿，用于调整边缘服务器中全局模型参数的补偿误差，定义为/>Top_k算法在边缘服务器中将k个信誉值较高的交通流预测模型作为全局聚合参数更新，剩下d-k个交通流预测模型参数作为误差补偿，进行交通流预测模型压缩，之后在边缘服务器进行模型参数聚合操作。

由上述技术方案可知，本发明的有益效果为：第一，考虑共享客户端路边单元的本地交通流量数据集进行联合训练，采用联邦学习方法进行交通流预测，在不共享原始私有交通流数据的前提下，解决“数据孤岛”的问题；第二，采用交通流预测模型进行客户端路边单元交通流训练，在LSTM网络的隐藏层中添加了注意力机制模块，注意力机制模块在Dropout层之后增添dense层，即增加一个softmax的激活函数，通过激活函数来计算对应的权重，以达到在交通流预测模型训练过程中自动学习权重参数的目的；第三，采用集中式的模型聚合器，存在例如单点故障等严重的安全问题和缺乏激励机制，而基于区块链的去中心化、安全性及不可篡改等特点，将区块链与联邦学习结合，保障了客户端路边单元数据的隐私性同时激励更多的路边单元参与联邦学习任务中；第四，本发明所提出的区块链和联邦学习结合框架进行交通流预测不仅可以防止恶意节点激励本地客户端路边单元积极参与整个流量预测任务的训练中，还可以保护隐私的同时提高交通流预测的准确性，对城市管理运营至关重要，帮助城市更好地规划和处理交通问题，同时提高居民的出行效率和舒适度。

附图说明

图1为本发明的方法流程图；

图2为本发明实施例提供利用区块链技术构建的联邦学习环境架构图；

图3为本发明中交通流预测模型的实现原理图；

图4为本发明实施例提供的区块链中区块结构示意图。

具体实施方式

如图1所示，一种基于区块链与联邦学习融合的交通流预测方法，该方法包括下列顺序的步骤：

(4)边缘服务器根据接收的交易，首先检验客户端路边单元的数字签名之后对交通流预测模型的参数进行交叉验证，产生新的区块加入区块链中，并根据智能合约校验交通流预测模型的参数的准确度，给出对应的信誉值进行奖励分配，鼓励更多的路边单元参与联邦学习任务当中；

所述步骤(2)具体包括以下步骤：

(2a)获取本地交通流量数据集并进行预处理：

(2b)构建交通流预测模型并进行训练：

O(t)＝σ(wg[h_t,p_t]+b) (3)

在路边单元每一次预测训练结束后，通过预测的结果与真实值之间计算损失函数，通过模型优化器对参数进行更新，增加预测的准确率同时减少损失函数值；采用选择Adam作为模型的优化算法，Adam能够克服梯度骤降，使模型较快收敛，选择均方误差MSE作为损失函数：

因此，若交通流预测模型预测准确率越高，根据智能合约得到的信誉评估值越高，所分配的奖励越多。因此，激励更多的客户端路边单元进行联邦学习任务，同时激励客户端路边单元进行高质量的模型预测。

所述步骤(5)具体是指：当与边缘服务器通信的客户端路边单元过多时，会造成很大的通信开销，因此，在主边缘服务器中设置选择聚合交通流预测模型的参数数量的阈值k，边缘服务器由设置的阈值选择K个客户端身份K_t参加第t次的全局迭代；根据区块链，从边缘服务器选定的第i个客户端路边单元将下载最新参数wⁱ _t＝w_t，然后执行E次本地迭代，在每个客户端路边单元迭代后导出的小批量的梯度下降如下：

其中，B_t ⁱ表示交通流预测模型选取batch大小的样本个数，表示第i个客户端路边单元第t+1次全局迭代的梯度参数，η表示学习率，▽F_i()表示损失函数，g_t+E ⁱ表示第i个客户端路边单元的交通流预测模型更新通过E次的交通流预测模型迭代训练进行第t次全局迭代，定义为/> 表示经过E次的本地迭代后，通过区块链中记录的信息，选定的客户端路边单元将交通流预测模型更新上传到边缘服务器，用于全局聚合，得到全局模型：

主边缘服务器更新定义为Top_k算法如下：

综上所述，考虑共享客户端路边单元的本地交通流量数据集进行联合训练，本发明采用联邦学习方法进行交通流预测，在不共享原始私有交通流数据的前提下，解决“数据孤岛”的问题；采用交通流预测模型进行客户端路边单元交通流训练，在LSTM网络的隐藏层中添加了注意力机制模块，注意力机制模块在Dropout层之后增添dense层，即增加一个softmax的激活函数，通过激活函数来计算对应的权重，以达到在交通流预测模型训练过程中自动学习权重参数的目的。

Claims

1.一种基于区块链与联邦学习融合的交通流预测方法，其特征在于：该方法包括下列顺序的步骤：

2.根据权利要求1所述的基于区块链与联邦学习融合的交通流预测方法，其特征在于：所述步骤(2)具体包括以下步骤：

(2a)获取本地交通流量数据集并进行预处理：

(2b)构建交通流预测模型并进行训练：

O(t)＝σ(wg[h_t,p_t]+b) (3)

3.根据权利要求1所述的基于区块链与联邦学习融合的交通流预测方法，其特征在于：所述步骤(4)具体是指：将边缘服务器作为边缘服务器，根据收到的客户端路边单元的上传的交易，验证客户端路边单元的数字签名，在边缘服务器组内交叉验证客户端路边单元交通流预测模型的准确率，并由智能合约根据准确率设置不同的信誉值进行奖励分配，产生新的区块加入区块链中，首先根据第r个客户端路边单元上传的准确率在交叉验证时的计算信誉值权重，根据智能合约边缘服务器对客户端路边单元进行信誉值评估如下：

其中，a^r表示第r个客户端路边单元对应的交通流预测模型的准确性，r＝1,2,···,n，aⁱ表示边缘服务器组中第i个边缘服务器验证的准确率，n表示客户端路边单元的数量，M表示边缘服务器组的数量，m表示为最近的边缘服务器且m∈M，λ_m,r ^t表示第t次迭代时通过边缘服务器m对客户端路边单元r的信誉评价，λ_M,r ^t表示第t次迭代时通过边缘服务器组M其他边缘服务器对第r个客户端路边单元的信誉评价，表示第t次迭代时通过边缘服务器m对第r个客户端路边单元的全局信誉评价，λ_r ^t表示第t次迭代时边缘服务器对第r个客户端路边单元评估的信誉值；

4.根据权利要求1所述的基于区块链与联邦学习融合的交通流预测方法，其特征在于：所述步骤(5)具体是指：在主边缘服务器中设置选择聚合交通流预测模型的参数数量的阈值k，边缘服务器由设置的阈值选择K个客户端身份K_t参加第t次的全局迭代；根据区块链，从边缘服务器选定的第i个客户端路边单元将下载最新参数wⁱ _t＝w_t，然后执行E次本地迭代，在每个客户端路边单元迭代后导出的小批量的梯度下降如下：

主边缘服务器更新定义为Top_k算法如下：

其中，为误差补偿，用于调整边缘服务器中全局模型参数的补偿误差，定义为Top_k算法在边缘服务器中将k个信誉值较高的交通流预测模型作为全局聚合参数更新，剩下d-k个交通流预测模型参数作为误差补偿，进行交通流预测模型压缩，之后在边缘服务器进行模型参数聚合操作。