CN112288162B

CN112288162B - 短时公交站客流预测方法、装置、计算机设备及存储介质

Info

Publication number: CN112288162B
Application number: CN202011182335.1A
Authority: CN
Inventors: 王健宗; 肖京; 何安珣
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-10-29
Filing date: 2020-10-29
Publication date: 2024-05-10
Anticipated expiration: 2040-10-29
Also published as: CN112288162A; WO2021189950A1

Abstract

本申请实施例属于人工智能技术领域，应用于智慧交通领域中，涉及一种短时公交站客流预测方法、装置、计算机设备及存储介质，包括：接收公交站位置信息和目标公交站，构建公交站无向网络，确定公交站无向网络中符合预设条件的公交站，作为联合公交站；接收目标公交站对应的目标服务器传输的模型梯度信息和联合公交站对应的联合服务器传输的随机数；基于所述模型梯度信息和所述随机数计算模型更新参数，并将所述模型更新参数传输至目标服务器和各个联合服务器，以使所述目标服务器和联合服务器通过所述模型更新参数迭代更新回归预测模型。其中，训练后的回归预测模型可存储于区块链中。本申请有效提高回归预测模型对短时公交车客流的预测效果。

Description

短时公交站客流预测方法、装置、计算机设备及存储介质

技术领域

本申请涉及人工智能技术领域，尤其涉及短时公交站客流预测方法、装置、计算机设备及存储介质。

背景技术

公共交通对提供交通运力，缓解交通拥堵起着重要作用，然而目前国内大部分城市的公共交通运力不足，特别是高峰时段的城市公交运力不足，于是预估公交站上车客流量的各种方法应运而生，通过对公交站上车客流量的预估，实现交通运力的及时调整，甚至可以将预估结果发送至相关用户的客户端，便于人们的出行安排等。

目前，有关于通过回归预测模型预估公交站上车客流量的方法包括基于单个公交站点或者区域公交站进行公交车客流预测。对于单个公交站点的方案来说，训练样本较为单一，训练效果较差，未能考虑周边公交站的客流对目标公交站的影响。对于区域公交站的方案来说，仅基于区域来确定公交站，确定的公交站与目标公交站之间的相关性较弱，导致预测效果较差。

发明内容

本申请实施例的目的在于提出一种短时公交站客流预测方法、装置、计算机设备及存储介质，提升了回归预测模型对于短时公交车客流预测的准确性。

第一方面，本申请实施例提供一种短时公交站客流预测方法，采用了如下所述的技术方案：

一种短时公交站客流预测方法，应用于中心服务器，包括下述步骤：

接收公交站位置信息和目标公交站，基于所述公交站位置信息构建公交站无向网络，并基于所述目标公交站确定所述公交站无向网络中符合预设条件的公交站，作为联合公交站，其中，目标公交站对应目标服务器，每个所述联合公交站各自对应一个联合服务器；

接收目标公交站对应的目标服务器传输的模型梯度信息和联合公交站对应的联合服务器传输的随机数，并基于所述模型梯度信息和所述随机数计算模型更新参数，并将所述模型更新参数传输至目标服务器和各个联合服务器，以使所述目标服务器和联合服务器通过所述模型更新参数迭代更新回归预测模型。

第二方面，本申请实施例提供一种短时公交站客流预测方法，采用了如下所述的技术方案：

一种短时公交站客流预测方法，应用于联合服务器，包括下述步骤：

接收目标时间窗和对应的联合公交站的乘客乘车信息，基于所述乘客乘车信息和所述目标时间窗构建对应的联合公交站的训练样本集合；

基于所述训练样本集合构建所述联合公交站的回归预测模型，直至达到预设的构建条件，获得构建后的回归预测模型的模型参数；

接收中心服务器传输的对应的联合公交站的边权，计算所述边权与回归预测模型的模型参数之积，作为计算结果，并基于所述计算结果生成多个随机数，将所述随机数分发至各个所述联合服务器；

所有所述联合服务器将接收到的随机数传输至中心服务器，以使所述中心服务器利用所述梯度信息和所述随机数计算模型更新参数；

当目标服务器和各个联合服务器接收到所述中心服务器传输的模型更新参数时，基于所述模型更新参数迭代回归预测模型，直至达到预设的停止条件，获得训练后的回归预测模型。

第三方面，本申请实施例还提供一种短时公交站客流预测装置，采用了如下所述的技术方案：

一种短时公交站客流预测装置，所述短时公交站客流预测装置包括中心服务器，所述中心服务器包括：

网络构建模块，用于接收公交站位置信息和目标公交站，基于所述公交站位置信息构建公交站无向网络，并基于所述目标公交站确定所述公交站无向网络中符合预设条件的公交站，作为联合公交站，其中，目标公交站对应目标服务器，每个所述联合公交站各自对应一个联合服务器；

参数计算模块，用于接收目标公交站对应的目标服务器传输的模型梯度信息，和联合公交站对应的联合服务器传输的随机数，并基于所述模型参数和所述随机数计算模型更新参数，并将所述模型更新参数传输至目标服务器和各个联合服务器，以使所述目标服务器和联合服务器通过所述模型更新参数迭代更新回归预测模型。

第五方面，本申请实施例还提供一种短时公交站客流预测装置，采用了如下所述的技术方案：

一种短时公交站客流预测装置，所述短时公交站客流预测装置包括联合服务器，所述联合服务器包括：

联合样本构建模块，用于接收目标时间窗和对应的联合公交站的乘客乘车信息，基于所述乘客乘车信息和所述目标时间窗构建对应的联合公交站的训练样本集合；

联合模型构建模块，用于基于所述训练样本集合构建所述联合公交站的回归预测模型，直至达到预设的构建条件，获得各自的构建后的回归预测模型的模型参数；

分发模块，用于接收中心服务器传输的对应的联合公交站的边权，计算所述边权与回归预测模型的模型参数之积，作为计算结果，并基于所述计算结果生成多个随机数，将所述随机数分发至各个所述联合服务器；

联合数据传输模块，用于将接收到的随机数传输至中心服务器，以使所述中心服务器利用所述梯度信息和所述随机数计算模型更新参数；

联合迭代更新模块，用于当接收到所述中心服务器传输的模型更新参数时，基于所述模型更新参数迭代回归预测模型，直至达到预设的停止条件，获得训练后的回归预测模型。

第六方面，本申请实施例还提供一种计算机设备，采用了如下所述的技术方案：

一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现上述的短时公交站客流预测方法的步骤。

第七方面，本申请实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案：

一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现上述的短时公交站客流预测方法的步骤。

与现有技术相比，本申请实施例主要有以下有益效果：

中心服务器通过公交站位置信息建立公交站无向网络，便于后续通过公交站无向网络来计算出符合条件的联合公交站。相对于仅是通过区域划分确定联合学习的公交站的方式来说，本申请通过公交站无向网络计算从而确定的联合公交站与目标公交站的相关联性较强。联合服务器均通过目标时间窗确定公交站基于目标时间窗的客流量，基于目标时间窗内的客流量构建各自的回归预测模型，实现公交车的短时预测的模型构建。联合服务器将构建后的回归预测模型的参数与联合公交站对应的边权相乘，并生成随机数进行分发，保护了联合公交站数据的隐私性，防止在传输过程中泄露。中心服务器基于目标服务器传输的模型梯度信息和联合服务器传输的随机数综合计算模型更新参数，实现了目标公交站和与目标公交站相关性较强的联合公交站之间的联合学习，通过迭代获得最终训练后的回归预测模型，提升了回归预测模型预测的准确性。

附图说明

为了更清楚地说明本申请中的方案，下面将对本申请实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请可以应用于其中的示例性系统架构图；

图2是根据本申请的短时公交站客流预测方法的一个实施例的流程图；

图3是根据本申请的短时公交站客流预测方法的公交站无向网络的结构示意图；

图4是根据本申请的短时公交站客流预测装置的一个实施例的结构示意图；

图5是根据本申请的计算机设备的一个实施例的结构示意图。

附图标记：101、网络构建模块；102、参数计算模块；201、目标样本构建模块；202、目标模型构建模块；203、目标数据传输模块；204、目标迭代更新模块；301、联合样本构建模块；302、联合模型构建模块；303、分发模块；304、联合数据传输模块；305、联合迭代更新模块。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案，下面将结合附图，对本申请实施例中的技术方案进行清楚、完整地描述。

本申请实施例的短时公交客流预测方法应用于短时公交客流预测系统中。如图1所示，系统架构包括中心服务器、目标服务器、联合服务器、第一客户端和第二客户端。目标服务器与中心服务器之间、联合服务器与中心服务器之间、第一客户端与目标服务器之间、第二客户端与联合服务器之间均通过网络进行连接，网络可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用第一客户端或第二客户端通过网络与目标服务器或联合服务器交互，以接收或发送消息等。第一客户端和第二客户端上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

第一客户端和第二客户端可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

应该理解，图1中的中心服务器、目标服务器、联合服务器、第一客户端和第二客户端的数目仅仅是示意性的。根据实现需要，可以具有任意数目的中心服务器、目标服务器、联合服务器、第一客户端和第二客户端。

继续参考图2，示出了根据本申请的短时公交站客流预测方法的一个实施例的流程图。所述的短时公交站客流预测方法，包括以下步骤：

S1：中心服务器接收公交站位置信息和目标公交站，基于所述公交站位置信息构建公交站无向网络，并基于所述目标公交站确定所述公交站无向网络中符合预设条件的公交站，作为联合公交站，其中，目标公交站对应目标服务器，每个所述联合公交站各自对应一个联合服务器。

在本实施例中，可以根据实际需要进行调整。基于所述目标公交站确定所述公交站无向网络中的联合公交站，提升后续联合公交站的相关数据与目标公交站的数据之间的相关性。其中，目标公交站和每个联合公交站分别对应一个数据中心，后续各公交站基于训练样本的模型构建过程，在各自的数据中心完成，避免数据泄露。

在本实施例中，短时公交站客流预测方法运行于其上的电子设备(例如图1所示的中心服务器)可以通过有线连接方式或者无线连接方式接收公交站位置信息和目标公交站。需要指出的是，上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。

具体的，在步骤S1中，即所述基于所述公交站位置信息构建公交站无向网络，并基于所述目标公交站确定所述公交站无向网络中符合预设条件的公交站，作为联合公交站的步骤包括：

基于所述公交站位置信息将所述公交站作为所述公交站无向网络的节点；

将任意两个公交站均进行连线，作为所述公交站无向网络的边，获得所述公交站无向网络；

计算所述目标公交站与各公交站之间的边权S_if；

将对应的边权小于预设阈值的公交站作为所述联合公交站。

在本实施例中，公交站为网络的节点，任意两公交站的连线为网络的边，通过边权确定联合公交站，联合公交站即为与目标公交站i关系较为密切的公交站，便于后续与目标公交站联合学习，避免了单个公交站点训练数据维度低，预测结果不准确的情况。

如图3所示，图3是根据本申请的短时公交站客流预测方法的公交站无向网络的结构示意图。其中，通过如下公式计算所述边权S_if：

S_if＝a·DIS_if+b·|POP_if|

其中，a，b均为超参数，且满足a+b＝1，DIS_if为所述目标公交站i与任意公交站f之间的距离，POP_if为目标公交站i与公交站f在预设范围内的人口总数差值为。

在本实施例中，POP_if为目标公交站i与公交站f在预设范围内的人口总数差值。其中，所述预设范围为以公交站为圆心，N(km)为半径的圆形覆盖区域，N为自定义数值。人口总数＝人口密度×预设范围的面积，其中，人口密度即表示单位土地面积上的人口数量，可通过调用浏览器查询获得。通过上述公式计算边权，充分考虑了人口密度的情况，而不仅仅只是考虑上车客流量，扩展了后续模型更新参数的维度。

S2：第一客户端通过预设的本地差分隐私算法，扰动本地存储的目标公交站的乘客乘车信息，生成第一扰动数据，并将第一扰动数据发送至目标服务器。

在本实施例中，本申请中乘客乘车信息指乘客搭公交车时的对应的公交站和上车时间,需要加密的内容为乘客是否在当前公交站上车,每个记录都有其对应的时间信息。用户刷卡记录存储在自己手机，银行卡中，第一客户端通过本地差分隐私算法扰动目标公交站的乘客乘车信息，保护了用户的隐私，避免了直接将用户的刷卡记录发送至目标服务器。目标服务器根据扰动数据估算上车总客流量。具体为：对于真实集合中的每一个数据都添加扰动，即添加一个概率计算，形成概率集合，将概率集合发送至目标服务器。目标服务器根据所述概率集合随机生成y′_ij＝0或者1。将随机生成的y_ij’通过如下公式计算即可得到公交站的总上车人数其中，j指第j个用户，通过时间窗可以筛选扰动数据，进而通过上述方式获得时间窗对应的上车人数，即上车客流量。

具体的，通过如下公式计算所述第一扰动数据：

P(y′_ij＝0)＝1-P(y′_ij＝1)

其中，y_ij∈[0,1]，1表示用户在目标公交站刷卡上车，0表示用户未在目标公交站刷卡上车，ε为超参数。

在本实施例中，本申请通过上述公式对乘客乘车信息添加扰动，实现数据中心既无法获知实际数据，保护了用户的隐私，又可以根据扰动数据估算上车客流量，进行后续计算。

S3：所述目标公交站对应的目标服务器接收目标时间窗和第一客户端发送的第一扰动数据，基于所述第一扰动数据和所述目标时间窗构建所述目标公交站的训练样本集合。

在本实施例中，本申请中目标时间窗是自定义的。目标服务器基于目标时间窗构建训练样本集合，使得训练样本集合与目标时间窗具有相关性，从而能实现后续的通过训练后的回归预测模型准确预测目标时间窗内的上车客流量。

具体的，在步骤S3中，即所述基于所述第一扰动数据和所述目标时间窗构建公交站的训练样本集合的步骤包括：

基于所述第一扰动数据，计算在预设天数中，所述目标时间窗同时段之前的预设个数D的时间窗对应的上车客流量，作为训练样本的第一输入参数X，所述目标时间窗同时段的上车客流量，作为训练样本的第二输入参数Y，生成训练样本集合(X₁，Y₁)(X₂，Y₂)(X₃，Y₃)......(X_m，Y_m),其中，所述X_m具有的特征维数为D，D为整数，m表示第m天。

在本实施例中，以所述目标公交站点在n天中与目标时间窗同时段之前的D个时间窗内的公交客流量作为训练样本的特征，即第一输入参数X，以所述目标区域公交站点在n天中与目标时间窗同时段的上车客流量作为训练样本的第二输入参数Y，构建训练样本{(X₁,Y₁),(X₂,Y₂),…,(X_m,Y_m),…(X_n,Y_n)},每一个样本(X_m,Y_m)都包含两个输入参数，其中，X_m具有的特征维数为D，D为整数。

以下以D为2，即特征维度数为2进行举例说明：

第一天的下午1点至2点的客流量和下午2点至3点的客流量组成X1(2维向量，包括两个客流量)，第一天的下午3点至4点的客流量为Y1,(X₁,Y₁)组成一对训练样本；第二天的下午1点至2点的客流量和下午2点至3点的客流量组成X2(2维向量，包括两个客流量)，第二天的下午3点至4点的客流量为Y2,(X₂,Y₂)组成一对训练样本。第m天的下午1点至2点的客流量和下午2点至3点的客流量组成X_m(2维向量，包括两个客流量)，第m天的下午3点至4点的客流量为Y_m，(X_m,Y_m)组成一对训练样本。

S4：目标服务器基于所述训练样本集合构建所述目标公交站的回归预测模型，直至达到预设的构建条件，获得构建后的回归预测模型的模型参数。

在本实施例中，构建目标公交站的回归预测模型，完成回归预测模型的初步训练，获得构建后的回归预测模型的模型参数，便于后续的进一步处理。

具体的，在步骤S4中，所述目标服务器基于所述训练样本集合构建所述目标公交站的回归预测模型，直至达到预设的构建条件，获得构建后的回归预测模型的模型参数的步骤包括：

目标服务器随机初始化预设的回归预测模型的模型参数，其中，每一天分别对应一个预设的回归预测模型；

基于所述训练样本集合中的训练样本分别训练每天对应的回归预测模型其中，所述回归预测模型的公式为：

其中，表示模型预测的第m天的目标时间窗同时段的上车客流量；W₀和W_d为所述随机初始化参数；X_d表示在第d个时间窗中的上车客流量；

直至所述回归预测模型达到预设的构建条件，获得构建后的回归预测模型的模型参数，其中，所述预设的构建条件为：

其中，y_m表示第m天的目标时间窗同时段的上车客流量。

在本实施例中，argmin指使其后面的式子达到最小值时的变量的取值，本申请通过该构建条件，实现基于各公交站对应的训练样本对各公交站的回归预测模型的初步训练。

S5：目标服务器基于所述模型参数计算目标公交站的模型梯度信息，并将所述模型梯度信息传输至中心服务器。

在本实施例中，根据如下公式计算所述目标公交站的模型梯度信息：

是目标公交站i在t次迭代时候的模型参数梯度，d表示维度，即第d个时间窗。

S6：第二客户端分别通过预设的本地差分隐私算法，扰动本地存储的联合公交站的乘客乘车信息，分别生成第二扰动数据，并将第二扰动数据发送至各自对应的联合服务器。

在本实施例中，本申请中乘客乘车信息指乘客搭公交车时的对应的公交站和上车时间,需要加密的内容为乘客是否在当前公交站上车,每个记录都有其对应的时间信息。用户刷卡记录存储在自己手机，银行卡中，第二客户端通过本地差分隐私算法扰动目标公交站的乘客乘车信息，保护了用户的隐私，避免了直接将用户的刷卡记录发送至联合服务器。联合服务器根据扰动数据估算上车总客流量。具体为：对于真实集合中的每一个数据都添加扰动，即添加一个概率计算，形成概率集合，将概率集合发送至联合服务器。联合服务器根据所述概率集合随机生成y′_ij＝0或者1。将随机生成的y_ij’通过如下公式计算即可得到公交站的总上车人数其中，j指第j个用户，通过时间窗可以筛选扰动数据，进而通过上述方式获得时间窗对应的上车人数，即上车客流量。

具体的，通过如下公式生成第二扰动数据：

P(y′_ij＝0)＝1-P(y′_ij＝1)

其中，y_ij∈[0,1]，1表示用户在当前联合公交站刷卡上车，0表示用户未在当前联合公交站刷卡上车，ε为超参数。

S7：所述联合公交站对应的联合服务器接收目标时间窗和各自对应的第二扰动数据，基于所述第二扰动数据和所述目标时间窗构建各自的联合公交站的训练样本集合。

在本实施例中，本申请中目标时间窗是自定义的。联合服务器分别基于目标时间窗构建各自的训练样本集合，使得训练样本集合与目标时间窗具有相关性，从而能实现后续的通过训练后的回归预测模型准确预测目标时间窗内的上车客流量。

具体的，在步骤S7中，即所述基于所述第二扰动数据和所述目标时间窗构建各自的联合公交站的训练样本集合的步骤包括：

基于各自对应的所述第二扰动数据，计算在预设天数中，各自所述目标时间窗同时段之前的预设个数D的时间窗对应的上车客流量，作为训练样本的第一输入参数X，所述目标时间窗同时段的上车客流量，作为训练样本的第二输入参数Y，生成各自的联合公交站的训练样本集合(X₁，Y₁)(X₂，Y₂)(X₃，Y₃)......(X_m，Y_m),其中，所述X_m具有的特征维数为D，D为整数，m表示第m天。

以下以D为2，即特征维度数为2进行举例说明：

S8：联合服务器基于各自的联合公交站的训练样本集合构建所述联合公交站的回归预测模型，直至达到预设的构建条件，获得各自对应的构建后的回归预测模型的模型参数。

在本实施例中，各自构建联合公交站的回归预测模型，完成回归预测模型的初步训练，获得各自对应的构建后的回归预测模型的模型参数，便于后续的进一步处理。

具体的，在步骤S8中，即所述联合服务器基于所述训练样本集合构建所述联合公交站的回归预测模型，直至达到预设的构建条件，获得构建后的回归预测模型的模型参数的步骤包括：

联合服务器各自基于所述联合公交站的训练样本集合构建各自联合公交站的回归预测模型，直至达到预设的构建条件，获得各自对应的构建后的联合公交站的回归预测模型的模型参数的步骤包括：

联合服务器各自随机初始化预设的回归预测模型的模型参数，其中，每一天分别对应一个预设的回归预测模型；

联合服务器各自基于所述训练样本集合中的训练样本分别训练每天对应的回归预测模型其中，所述回归预测模型的公式为：

直至所述回归预测模型达到预设的构建条件，获得各自对应的构建后的回归预测模型的模型参数，其中，所述预设的构建条件为：

其中，y_m表示第m天的目标时间窗同时段的上车客流量。

S9：联合服务器接收中心服务器传输的对应的联合公交站的边权，计算所述边权与回归预测模型的模型参数之积，作为计算结果，并基于所述计算结果生成多个随机数，将所述随机数分发至各个所述联合服务器。

在本实施例中，各个联合服务器分别计算对应联合公交站的边权与对应的联合公交站在t次迭代时的模型参数之积并将边权与模型参数之积/>由密钥分享算法随机生成k个随机数分配给各个联合服务器。其中，所述k个数的和等于所有联合服务器接收到的随机数之和即为/>通过随机数的方式保护了联合公交站中的模型参数，提高了数据的隐私性。

S10：所有所述联合服务器将接收到的随机数传输至中心服务器，以使所述中心服务器利用所述模型梯度信息和所述随机数计算模型更新参数。

在本实施例中，所有所述联合服务器将接收到的随机数传输至中心服务器，所有联合服务器接收到的随机数之和即为通过传输随机数的方式提高数据隐私性，避免了传输过程中数据的泄露和篡改。

S11：中心服务器接收目标公交站对应的目标服务器传输的模型梯度信息和联合公交站对应的联合服务器传输的随机数，并基于所述模型梯度信息和所述随机数计算模型更新参数，并将所述模型更新参数传输至目标服务器和各个联合服务器，以使所述目标服务器和联合服务器通过所述模型更新参数迭代更新回归预测模型。

在本实施例中，通过目标公交站的模型梯度信息和联合公交站的随机数计算模型更新参数。其中，由上述可知，联合公交站是通过边权确定，与目标公交站有较强的关联性，避免了仅通过单个公交站点或区域公交站简单进行模型更新参数的计算，而导致训练结果不佳，预测效果差的情况。本申请通过目标公交站和与目标公交站之间具有符合边权筛选条件的联合公交站联邦训练，综合计算模型更新参数，提升了模型的预测效果。

需要说明的是：本申请的联合公交站区别于区域公交站，区域公交站仅考虑公交站之间的地理位置关系，并未考虑公交站之间在一定区域内的人口数量关系。

具体的，在步骤S11中，即所述基于所述模型梯度信息和所述随机数计算模型更新参数，并将所述模型更新参数传输至目标服务器和各个联合服务器的步骤包括：

所述模型更新参数的计算公式为：

其中，N(i)为所述联合公交站组成的集合，为接收到的所有随机数之和，α为学习率，/>为模型梯度信息；

将所述模型更新参数传输至目标服务器和各个联合服务器。

在本实施例中，N(i)是与公交站i进行联邦学习的公交站集合，即联合公交站组成的集合。其中，公式中的来自于上文提及的由联合服务器传输的随机数之和。α为学习率，本文中设置α为0.001，在实际应用中，可以根据实际需要改变学习率的大小，适用即可。通过此公式可以明确得知模型更新参数的计算方式。

S12：当目标服务器和各个联合服务器接收到所述中心服务器传输的模型更新参数时，基于所述模型更新参数迭代回归预测模型，直至达到预设的停止条件，获得训练后的回归预测模型。

在本实施例中，目标服务器和各个联合服务器均接收中心服务器传回的模型更新参数，根据模型更新参数更新各自的回归预测模型，再根据训练样本进行训练，重复执行上述训练步骤，并将训练结果即目标公交站的模型梯度信息和联合公交站的随机数发送至中心服务器，等待接收中心服务器下一次的模型更新参数。如此循环迭代各自的回归预测模型，直到达到预设的迭代次数T，获得训练后的回归预测模型。

需要说明的是，获得的训练后的回归预测模型用于预测目标公交站在目标时间窗同时段的客流量。训练后的回归预测模型可以传输给中心服务器，也可以存储在目标服务器或联合服务器中直接调用。完成模型训练后，通过中心服务器、目标服务器或联合服务器接收构建好的预测样本，将预测样本输入训练后的回归预测模型，即得到目标公交站在目标时间窗的客流量。例如：要预测某天下午3点至下午4点的客流量Y，在维度D为2时，对应的预测样本X为该天下午1点至2点的客流量和下午2点至3点的客流量。此时把X输进模型即可得到。

需要强调的是，为进一步保证上述训练后的回归预测模型的私密和安全性，上述训练后的回归预测模型还可以存储于一区块链的节点中。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

本申请可应用于智慧交通领域中，从而推动智慧城市的建设。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，该计算机可读指令可存储于一计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图3，作为对上述图2所示方法的实现，本申请提供了一种短时公交站客流预测装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图3所示，本实施例所述的短时公交站客流预测装置包括：中心服务器、目标服务器和联合服务器、第一客户端和第二客户端。

所述中心服务器包括网络构建模块101和参数计算模块102。

网络构建模块101，用于接收公交站位置信息和目标公交站，基于所述公交站位置信息构建公交站无向网络，并基于所述目标公交站确定所述公交站无向网络中符合预设条件的公交站，作为联合公交站，其中，目标公交站对应目标服务器，每个所述联合公交站各自对应一个联合服务器；

参数计算模块102，用于接收目标公交站对应的目标服务器传输的模型梯度信息，和联合公交站对应的联合服务器传输的随机数，并基于所述模型参数和所述随机数计算模型更新参数，并将所述模型更新参数传输至目标服务器和各个联合服务器，以使所述目标服务器和联合服务器通过所述模型更新参数迭代更新回归预测模型。

第一客户端用于通过预设的本地差分隐私算法，扰动本地存储的目标公交站的乘客乘车信息，生成第一扰动数据，并将第一扰动数据发送至目标服务器。

所述目标服务器包括：目标样本构建模块201、目标模型构建模块202、目标数据传输模块203和目标迭代更新模块204。

目标样本构建模块201，用于接收目标时间窗和第一客户端发送的第一扰动数据，基于所述第一扰动数据和所述目标时间窗构建目标公交站的训练样本集合；

目标模型构建模块202，用于基于所述训练样本集合构建所述目标公交站的回归预测模型，直至达到预设的构建条件，获得构建后的回归预测模型的模型参数；

目标数据传输模块203，用于基于所述模型参数计算目标公交站的模型梯度信息，并将所述模型梯度信息传输至中心服务器；

目标迭代更新模块204，用于当接收到所述中心服务器传输的模型更新参数时，基于所述模型更新参数迭代回归预测模型，直至达到预设的停止条件，获得训练后的回归预测模型；

第二客户端用于分别通过预设的本地差分隐私算法，扰动本地存储的联合公交站的乘客乘车信息，分别生成第二扰动数据，并将第二扰动数据发送至各自对应的联合服务器。

所述联合服务器包括：联合样本构建模块301、联合模型构建模块302、分发模块303、联合数据传输模块304和联合迭代更新模块305。

联合样本构建模块301，用于接收目标时间窗和各自对应的各自对应的第二扰动数据，基于所述第二扰动数据和所述目标时间窗构建各自的联合公交站的训练样本集合；

联合模型构建模块302，用于基于所述训练样本集合构建所述联合公交站的回归预测模型，直至达到预设的构建条件，获得各自的构建后的回归预测模型的模型参数；

分发模块303，用于接收中心服务器传输的对应的联合公交站的边权，计算所述边权与回归预测模型的模型参数之积，作为计算结果，并基于所述计算结果生成多个随机数，将所述随机数分发至各个所述联合服务器；

联合数据传输模块304，用于将接收到的随机数传输至中心服务器，以使所述中心服务器利用所述模型梯度信息和所述随机数计算模型更新参数；

联合迭代更新模块305，用于当接收到所述中心服务器传输的模型更新参数时，基于所述模型更新参数迭代回归预测模型，直至达到预设的停止条件，获得训练后的回归预测模型。

网络构建模块101包括节点子模块、连线子模块、边权子模块和阈值子模块。节点子模块用于基于所述公交站位置信息将所述公交站作为所述公交站无向网络的节点；连线子模块用于将任意两个公交站均进行连线，作为所述公交站无向网络的边，获得所述公交站无向网络；边权子模块用于计算所述目标公交站与各公交站之间的边权S_if；阈值子模块用于将对应的边权小于预设阈值的公交站作为所述联合公交站。

在本实施例的一些可选的实现方式中，上述边权子模块进一步用于：通过如下公式计算所述边权S_if：S_if＝a·DIS_if+b·|POP_if|，其中，a，b均为超参数，且满足a+b＝1，DIS_if为所述目标公交站i与任意公交站f之间的距离，POP_if为目标公交站i与公交站f在预设范围内的人口总数差值。

在本实施例的一些可选的实现方式中，上述第一客户端进一步用于通过如下公式计算所述第一扰动数据：P(y′_ij＝0)＝1-P(y′_ij＝1)，其中，y_ij∈[0,1]，1表示用户在目标公交站刷卡上车，0表示用户未在目标公交站刷卡上车，ε为超参数。

在本实施例的一些可选的实现方式中，上述目标样本构建模块201进一步用于：基于所述第一扰动数据，计算在预设天数中，所述目标时间窗同时段之前的预设个数D的时间窗对应的上车客流量，作为训练样本的第一输入参数X，所述目标时间窗同时段的上车客流量，作为训练样本的第二输入参数Y，生成训练样本集合(X₁，Y₁)(X₂，Y₂)(X₃，Y₃)......(X_m，Y_m),其中，所述X_m具有的特征维数为D，D为整数，m表示第m天。

目标模型构建模块202包括第一初始化子模块、第一训练子模块和第一构建子模块。第一初始化子模块用于随机初始化预设的回归预测模型的模型参数，其中，每一天分别对应一个预设的回归预测模型；第一训练子模块用于基于所述训练样本集合中的训练样本分别训练每天对应的回归预测模型其中，所述回归预测模型的公式为：其中，/>表示模型预测的第m天的目标时间窗同时段的上车客流量；W₀和W_d为所述随机初始化参数；X_d表示在第d个时间窗中的上车客流量；第一构建子模块用于直至所述回归预测模型达到预设的构建条件，获得构建后的回归预测模型的模型参数，其中，所述预设的构建条件为：/>其中，y_m表示第m天的目标时间窗同时段的上车客流量。

在本实施例的一些可选的实现方式中，上述目标迭代更新模块204进一步用于：根据如下公式计算所述目标公交站的模型梯度信息：

其中，是目标公交站i在t次迭代时候的模型参数梯度，d表示维度，即第d个时间窗。

在本实施例的一些可选的实现方式中，上述第二客户端进一步用于：通过如下公式生成第二扰动数据：P(y′_ij＝0)＝1-P(y′_ij＝1)，其中，y_ij∈[0,1]，1表示用户在当前联合公交站刷卡上车，0表示用户未在当前联合公交站刷卡上车，ε为超参数。

在本实施例的一些可选的实现方式中，上述联合样本构建模块301进一步用于基于各自对应的所述第二扰动数据，计算在预设天数中，各自所述目标时间窗同时段之前的预设个数D的时间窗对应的上车客流量，作为训练样本的第一输入参数X，所述目标时间窗同时段的上车客流量，作为训练样本的第二输入参数Y，生成各自的联合公交站的训练样本集合(X₁，Y₁)(X₂，Y₂)(X₃，Y₃)......(X_m，Y_m),其中，所述X_m具有的特征维数为D，D为整数，m表示第m天。

联合模型构建模块302包括第二初始化子模块、第二训练子模块和第二构建子模块。第二初始化子模块用于随机初始化预设的回归预测模型的模型参数，其中，每一天分别对应一个预设的回归预测模型；第二训练子模块用于基于所述训练样本集合中的训练样本分别训练每天对应的回归预测模型其中，所述回归预测模型的公式为：其中，/>表示模型预测的第m天的目标时间窗同时段的上车客流量；W₀和W_d为所述随机初始化参数；X_d表示在第d个时间窗中的上车客流量；第二构建子模块用于直至所述回归预测模型达到预设的构建条件，获得各自对应的构建后的回归预测模型的模型参数，其中，所述预设的构建条件为：argmin/>其中，y_m表示第m天的目标时间窗同时段的上车客流量。

在本实施例的一些可选的实现方式中，上述参数计算模块102进一步用于：通过如下公式计算所述模型更新参数：

其中，N(i)为所述联合公交站组成的集合，/>为接收到的所有随机数之和，α为学习率，/>为模型梯度信息。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图5，图5为本实施例计算机设备基本结构框图。

所述计算机设备400包括通过系统总线相互通信连接存储器401、处理器402、网络接口403。需要指出的是，图中仅示出了具有组件401-403的计算机设备400，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器401至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器401可以是所述计算机设备400的内部存储单元，例如该计算机设备400的硬盘或内存。在另一些实施例中，所述存储器401也可以是所述计算机设备400的外部存储设备，例如该计算机设备400上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器401还可以既包括所述计算机设备400的内部存储单元也包括其外部存储设备。本实施例中，所述存储器401通常用于存储安装于所述计算机设备400的操作系统和各类应用软件，例如短时公交站客流预测方法的计算机可读指令等。此外，所述存储器401还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器402在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器402通常用于控制所述计算机设备400的总体操作。本实施例中，所述处理器402用于运行所述存储器401中存储的计算机可读指令或者处理数据，例如运行所述短时公交站客流预测方法的计算机可读指令。

所述网络接口403可包括无线网络接口或有线网络接口，该网络接口403通常用于在所述计算机设备400与其他电子设备之间建立通信连接。

在本实施例中，实现了目标公交站和与目标公交站相关性较强的联合公交站之间的联合学习，提升了回归预测模型预测的准确性。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如上述的短时公交站客流预测方法的步骤。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

1.一种短时公交站客流预测方法，应用于中心服务器，其特征在于，包括下述步骤：

2.根据权利要求1所述的短时公交站客流预测方法，其特征在于，所述基于所述公交站位置信息构建公交站无向网络，并基于所述目标公交站确定所述公交站无向网络中符合预设条件的公交站，作为联合公交站的步骤包括：

计算所述目标公交站与各公交站之间的边权S_if；

将对应的边权小于预设阈值的公交站作为所述联合公交站。

3.根据权利要求1所述的短时公交站客流预测方法，其特征在于，所述基于所述模型梯度信息和所述随机数计算模型更新参数，并将所述模型更新参数传输至目标服务器和各个联合服务器的步骤包括：

所述模型更新参数的计算公式为：

将所述模型更新参数传输至目标服务器和各个联合服务器。

4.一种短时公交站客流预测方法，应用于联合服务器，其特征在于，包括下述步骤：

所有所述联合服务器均将接收到的随机数传输至中心服务器，以使所述中心服务器利用模型梯度信息和所述随机数计算模型更新参数；

当接收到所述中心服务器传输的模型更新参数时，基于所述模型更新参数迭代回归预测模型，直至达到预设的停止条件，获得训练后的回归预测模型。

5.根据权利要求4所述的短时公交站客流预测方法，其特征在于，所述基于所述乘客乘车信息和所述目标时间窗构建对应的联合公交站的训练样本集合的步骤包括：

基于所述乘客乘车信息，计算各自的联合公交站在预设天数中，所述目标时间窗同时段之前的预设个数D的时间窗对应的上车客流量，作为训练样本的第一输入参数X，所述目标时间窗同时段的上车客流量，作为训练样本的第二输入参数Y，各自生成联合公交站的训练样本集合(X₁，Y₁)(X₂，Y₂)(X₃，Y₃)......(X_m，Y_m),其中，所述X_m具有的特征维数为D，D为整数，m表示第m天。

6.根据权利要求5所述的短时公交站客流预测方法，其特征在于，所述基于所述训练样本集合构建所述联合公交站的回归预测模型，直至达到预设的构建条件，获得构建后的回归预测模型的模型参数的步骤包括：

随机初始化预设的回归预测模型的模型参数，其中，每一天分别对应一个预设的回归预测模型；

基于所述联合公交站的训练样本集合中的训练样本分别训练每天对应的回归预测模型，其中，所述回归预测模型的公式为：

其中，表示模型预测的第m天的目标时间窗同时段的上车客流量；W₀和W_d为随机初始化参数；X_d表示在第d个时间窗中的上车客流量；

其中，y_m表示联合公交站第m天的目标时间窗同时段的上车客流量。

7.一种短时公交站客流预测装置，其特征在于，所述短时公交站客流预测装置包括中心服务器，所述中心服务器包括：

参数计算模块，用于接收目标公交站对应的目标服务器传输的模型梯度信息，和联合公交站对应的联合服务器传输的随机数，并基于所述模型梯度信息和所述随机数计算模型更新参数，并将所述模型更新参数传输至目标服务器和各个联合服务器，以使所述目标服务器和联合服务器通过所述模型更新参数迭代更新回归预测模型。

8.一种短时公交站客流预测装置，其特征在于，所述短时公交站客流预测装置包括联合服务器，所述联合服务器包括：

联合数据传输模块，用于将接收到的随机数传输至中心服务器，以使所述中心服务器利用模型梯度信息和所述随机数计算模型更新参数；

9.一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如权利要求1至3中任一项所述的短时公交站客流预测方法的步骤，或者，所述处理器执行所述计算机可读指令时实现如权利要求4至6任一项所述的短时公交站客流预测方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如权利要求1至3中任一项所述的短时公交站客流预测方法的步骤，或者，所述计算机可读指令被处理器执行时实现如权利要求4至6任一项所述的短时公交站客流预测方法的步骤。