CN118761567A

CN118761567A - 基于物理信息多任务模型的城际网约车长期可用运力预测方法、装置、设备及介质

Info

Publication number: CN118761567A
Application number: CN202411247314.1A
Authority: CN
Inventors: 王成; 蔡致震; 陈珞瑶; 缑锦; 吴志雄; 高稳仁
Original assignee: Huaqiao University; Linewell Software Co Ltd
Current assignee: Huaqiao University; Linewell Software Co Ltd
Priority date: 2024-09-06
Filing date: 2024-09-06
Publication date: 2024-10-11
Anticipated expiration: 2044-09-06
Also published as: CN118761567B

Abstract

本发明提供了基于物理信息多任务模型的城际网约车长期可用运力预测方法、装置、设备及介质，包括：获取历史订单、运力数据，并进行预处理；根据时间将运营时间切片作为可用运力量特征，对切片特征进行编码，获取特征编码；根据城际运力守恒原则设计损失函数；按时间顺序排序并归一化，按预设时长分割数据，获取模型输入数据；通过多任务预测框架，同时预测两城可用运力，使用双向长短时记忆网络作为共享专家网络提取两个任务的共性特征，使用门控网络根据不同任务的特定需求分配不同专家网络的特征贡献，经位置编码处理后生成各任务特定的特征表示，为每个任务设计独立的Transformer层来获取预测结果。本方法提高了城际网约车可用运力预测的准确性和效率。

Description

基于物理信息多任务模型的城际网约车长期可用运力预测方法、装置、设备及介质

技术领域

本发明涉及城际网约车运力技术领域，具体涉及基于物理信息多任务模型的城际网约车长期可用运力预测方法、装置、设备及介质。

背景技术

随着现代科技和城市交通网络的快速扩展，城际网约车作为连接各城市的重要桥梁，其重要性愈加突显。它不仅推动了经济的快速增长，还促进了区域间的交流与合作。然而，随着对城际网约车需求的急剧上升，城际网约车也面临着许多挑战，如供需失衡、高峰期交通堵塞以及服务质量的不稳定等。因此，对于城际运营平台而言，能提前预测可用运力，对避免出现需求不匹配变得非常重要。这不仅能有效缓解潜在的供需矛盾，还能提升整体服务水平。

当前，在现有的网约车运力预测方法中，仅以城市内的短期运力预测为目标，短期预测通过较少的影响因素，简单的模型即可满足需求，但只适用于即时决策、调度操作空间有限。而城际网约车因其长距离行驶，存在运力供给的滞后性，因此对城际网约车的可用运力进行长期预测尤为重要。而长期预测则需在更多的数据和更复杂的模型下提前捕获未来长期趋势，提供更充裕的调度时间，优化车辆资源的分配。其中，短期预测是预测未来一个时间切片、两个时间切片、三个时间切片等的数据，长期预测是预测未来一天时间切片、两天时间切片、三天时间切片等的数据。同时，城际网约车在两城市的运力变化存在关联性，存在运力守恒原则，即运力的位置有3种情况，在A城、在B城、在两城来往的路上。因此对城际网约车单个城市的预测不仅需考虑本城市的信息，还需考虑另一个城市的信息。

有鉴于此，提出本申请。

发明内容

本发明提供了一种基于物理信息多任务模型的城际网约车长期可用运力预测方法、装置、设备及介质，能至少部分的改善上述问题。

为实现上述目的，本发明采用以下技术方案：

一种基于物理信息多任务模型的城际网约车长期可用运力预测方法，其包括：

获取当前路线的城际网约车的历史订单数据和历史运力数据，并对所述历史订单数据和历史运力数据进行预处理；

根据预设的时间区间获取可用运力量，将与所述可用运力量相对应的运营时间切片作为可用运力量特征，并对所述运营时间切片的多个特征进行编码，得到各个时间切片对应的多个编码特征，其中，所述编码特征包括时间特征、外部特征、历史数据特征、流动特征、需求特征；

根据城际运力守恒原则设计总损失函数，其中，所述总损失函数为均方误差损失与运力平衡损失的加权和；

按照时间顺序对所述运营时间切片的编码特征进行排序，对排序后的特征进行归一化处理，得到数据集，按照预设的时间步长分割归一化处理后的数据集，获得预测模型的输入数据；

通过预设的预测模型的多任务预测框架，同时预测两个城市的可用运力，采用双向长短时记忆网络BiLSTM作为共享专家网络，提取两个任务的共性特征，使用门控网络根据不同任务的特定需求分配不同专家网络的特征贡献，并经位置编码处理后生成各任务特定的特征表示，为每个任务设计独立的Transformer层，以获取当前路线两个城市的长期可用运力的预测结果。

本发明还提供了一种装置，其包括：

历史数据获取单元，用于获取当前路线的城际网约车的历史订单数据和历史运力数据，并对所述历史订单数据和历史运力数据进行预处理；

编码单元，用于根据预设的时间区间获取可用运力量，将与所述可用运力量相对应的运营时间切片作为可用运力量特征，并对所述运营时间切片的多个特征进行编码，得到各个时间切片对应的多个编码特征，其中，所述编码特征包括时间特征、外部特征、历史数据特征、流动特征、需求特征；

损失函数单元，用于根据城际运力守恒原则设计总损失函数，其中，所述总损失函数为均方误差损失与运力平衡损失的加权和；

数据分割单元，用于按照时间顺序对所述运营时间切片的编码特征进行排序，对排序后的特征进行归一化处理，得到数据集，按照预设的时间步长分割归一化处理后的数据集，获得预测模型的输入数据；

预测单元，用于通过预设的预测模型的多任务预测框架，同时预测两个城市的可用运力，采用双向长短时记忆网络BiLSTM作为共享专家网络，提取两个任务的共性特征，使用门控网络根据不同任务的特定需求分配不同专家网络的特征贡献，并经位置编码处理后生成各任务特定的特征表示，为每个任务设计独立的Transformer层，以获取当前路线两个城市的长期可用运力的预测结果。

本发明还提供了一种基于物理信息多任务模型的城际网约车长期可用运力预测设备，其包括存储器以及处理器，所述存储器内存储有计算机程序，所述计算机程序能够被所述处理器执行，以实现如上任意一项所述的基于物理信息多任务模型的城际网约车长期可用运力预测方法。

本发明还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序能够被所述计算机可读存储介质所在设备的处理器执行，以实现如上任意一项所述的基于物理信息多任务模型的城际网约车长期可用运力预测方法。

综上，所述基于物理信息多任务模型的城际网约车长期可用运力预测方法基于历史数据信息挖掘相关影响因素，针对城际网约车存在的特性，设计遵循运力守恒原则的损失函数，通过多任务预测框架，同时提取和利用两城数据，该集成方法有效捕捉长时间依赖、长距离依赖，提高城际网约车长时可用运力预测结果的准确性和遵循物理一致性，使相关交通机构不仅拥有充裕地调度时间，还能提前部署需求管理的策略，缓解潜在的需求和供给不匹配的问题。

附图说明

图1是本发明第一实施例提供的基于物理信息多任务模型的城际网约车长期可用运力预测方法的流程示意图；

图2是本发明第一实施例提供的基于物理信息多任务模型的城际网约车长期可用运力预测方法的订单数据预处理的流程示意图；

图3是本发明第一实施例提供的基于物理信息多任务模型的城际网约车长期可用运力预测方法的运力数据预处理的流程示意图；

图4是本发明第一实施例提供的基于物理信息多任务模型的城际网约车长期可用运力预测方法的预测模型结构示意图；

图5是本发明第二实施例提供的基于物理信息多任务模型的城际网约车长期可用运力预测装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，下面结合实施例，进一步详细说明本发明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

参考图1、图4所示，本发明第一实施例公开了一种基于物理信息多任务模型的城际网约车长期可用运力预测方法，其可由基于物理信息多任务模型的城际网约车长期可用运力预测设备（以下简称预测设备）来执行，特别的，由所述预测设备内的一个或者多个处理器来执行，以实现如下方法：

S1，获取当前路线的城际网约车的历史订单数据和历史运力数据，并对所述历史订单数据和历史运力数据进行预处理；

具体地，步骤S1包括：清洗所述历史订单数据中的干扰数据，其中，所述干扰数据包括重复数据、非乘客乘坐数据、无效数据；

清洗所述历史运力数据中的缺失数。

具体的，在本实施例中，可用运力（即：可用运力量）是指可用车辆数。有效数据指拼车订单数据、包车订单数据。历史数据中存在所述干扰数据包括重复数据、非乘客乘坐数据、无效数据，因此需要对历史数据进行清洗，清洗过程如图2和图3所示。

重复数据是指一名乘客在同一天内发出多次出行请求却只被成功服务一次或都未被服务的情况，对于此类数据，可根据乘客ID的唯一性，对重复数据进行判断是否保留，若同一乘客在同一天有多次出行请求的订单且都未被服务，则判断各订单是否在同一时间切片，若同一时间切片存在两单或两单以上，则保留该时间切片的第一单；若同一乘客在同一天内有多次出行请求的订单且有一单被服务，则删除其余出行请求失败的订单。非乘客乘坐订单是指货件订单，用户下单委托城际运营商跨城派送，此类订单时间约束范围大，一般认为干扰数据，予以删除。无效数据是指躺补订单，即城际运营商跨城派车补充邻城运力的订单，该类订单没有起点和终点，无实际出行需求意义，一般认为干扰数据，予以删除。其中，缺失数据是指某些时间区间，运力信息未被记录或无法获得的数据。

S2，根据预设的时间区间获取可用运力量，将与所述可用运力量相对应的运营时间切片作为可用运力量特征，并对所述运营时间切片的多个特征进行编码，得到各个时间切片对应的多个编码特征，其中，所述编码特征包括时间特征、外部特征、历史数据特征、流动特征、需求特征；

具体地，步骤S2包括：根据预设的时间窗大小，将网约车的运营时间划分为多个运营时间切片，并获取所述运营时间切片所指的时间区间内的可用运力量特征，将所述可用运力量特征作为预测的标签；

对所述运营时间切片的多个特征进行编码处理，获取各个时间切片的多个特征编码，其中，采用读热编码处理分类特征，采用数值编码处理其余特征，所述分类特征包括星期特征、节假日特征、天气特征、降水量特征。

在本实施例中，每个切片表示的时间区间为，表示切片所对应的时刻，表示时间窗大小。获取时间区间为的可用运力信息，提取可用运力量特征，可用运力量特征作为预测的标签。

根据运力守恒原则，将不同来源的数据进行编码以融合多源数据，构造符合模型训练所需的时间特征、外部特征、历史数据特征、流动特征、需求特征。采用数值编码处理非分类特征，读热编码处理分类特征。

星期特征为时间切片所属日期属于周几的特征，采用读热编码，,其中，值为0或1，0代表不是该天，1代表是该天。各变量依次表示为周一、周二、周三、周四、周五、周六、周日。

节假日特征，表示时间切片所属日期的节假日特征，采用读热编码，,其中，值为0或1，0代表不是该类节日，1代表是该类节日。各变量依次表示为节假日、正常天。

天气特征为时间切片所属日期的天气特征，采用读热编码，，其中，值为0或1，0代表不是该类天气，1代表是该类天气。各变量依次表示为晴、多云、阴、小雨、其他。

降水量特征为时间切片所属日期的降水量特征，采用数值编码，表示降水量大小。

温度特征为时间切片所属日期的温度特征，采用数值编码，，各变量依次表示为最高温度、最低温度、平均温度。

历史数据特征为时间切片所属日期的历史数据特征，采用数值编码，，其中变量表示时间切片对应的时间区间的历史可用运力量，各变量依次表示为两周前、一周前、一周前、二天前、一天前的历史可用运力量。

流动特征为时间切片所属日期的流动特征，采用数值编码，，各变量依次表示为前二时间切片的可用运力流动量、前一时间切片的可用运力流动量、当前时间切片至少流出的运力量。

需求特征为时间切片所属日期的需求特征，采用数值编码，表示当前时间切片的出行需求人数。

S3，根据城际运力守恒原则设计总损失函数，其中，所述总损失函数为均方误差损失与运力平衡损失的加权和；

具体地，步骤S3包括：根据城际运力守恒原则设计运力平衡损失，公式为：

；

其中，为运力平衡损失，是时间步数，为A城的真实可用运力量，为A城的预测可用运力量，为B城的真实可用运力量，为B城的预测可用运力量；

设计均方误差损失，公式为：

；

其中，为均方误差损失；

根据运力平衡损失和均方误差损失，得到总损失函数，公式为：

其中，为总损失，是平衡均方误差损失和运力平衡损失的超参数。

在本实施例中，运力平衡损失目的是使预测的总可用运力接近实际的总可用运力。

S4，按照时间顺序对所述运营时间切片的编码特征进行排序，对排序后的特征进行归一化处理，得到数据集，按照预设的时间步长分割归一化处理后的数据集，获得预测模型的输入数据；

具体地，步骤S4包括：所述数据集按比例分为训练数据集和测试数据集，在训练模型时，模型的输入数据包含输入样本和输出样本。

在本实施例中，步骤S4用于获取模型的输入样本和输出样本。其中，数据集按比例分为训练数据集和测试数据集，在训练时，模型的输入数据包含输入样本和输出样本。对特征编码处理后的多源数据，以时间切片从小到大排序组装成新数据集。然后采用最大最小归一化方法标准化数据集。

接着，将处理后的数据集，按比例划分为训练数据集和测试数据集。按规定的输入步长和输出步长构建多任务预测模型的输入样本、和输出样本。

模型输入：两城市时刻历史个时间切片数据和。其中，表示城的数据，表示城的数据，表示输入的历史时间步长，时间切片数据，为时间特征（包含星期、节假日特征），为外部特征（包含天气、降水量、温度），为历史数据特征，为流动特征，为当前时间切片的需求量特征，为当前时间切片的可用运力量特征。

。

模型输出：两城市时刻未来个时间切片的可用运力量和。其中，表示城的可用运力量，表示城的可用运力量，表示输出的时间步长。

。

S5，通过预设的预测模型的多任务预测框架，同时预测两个城市的可用运力，采用双向长短时记忆网络BiLSTM作为共享专家网络，提取两个任务的共性特征，使用门控网络根据不同任务的特定需求分配不同专家网络的特征贡献，并经位置编码处理后生成各任务特定的特征表示，为每个任务设计独立的Transformer层，以获取当前路线两个城市的长期可用运力的预测结果。

具体地，步骤S5包括：通过预设的预测模型的多任务预测框架，同时预测两个城市的可用运力，其中，所述多任务预测框架是通过同时处理和利用两个城市的数据，以确保预测模型在预测一个城市的运力时能借鉴另一个城市的运力信息；

使用所述共享专家网络通过一个共享的特征提取模块，捕捉两个任务之间的共性特征，表达式：

；

式中，输入数据和经过共享特征提取模块，输出共享特征，每个专家网络从中提取其认为最重要的特征，并对这些特征处理后生成特定的特征表示。

使用所述门控网络根据不同任务的特定需求，动态计算加权和系数，分配不同专家网络的特征贡献，将所有的共享专家网络的输出特征与门控网络的加权系数相乘后再相加，生成任务特定的特征表示，表达式：

；

式中，是第个专家网络的加权系数，采用softmax函数计算得到，是第个专家网络的输出特征，是任务在时间的特征表示，即所有专家网络输出特征的加权和，是任务对第个专家网络输出特征的加权系数，是任务在时间的特征表示，是任务对第个专家网络输出特征的加权系数。

对从各任务中提取到的特征表示添加位置编码，以提升时序信息，其中，所述位置编码采用正弦和余弦函数的组合；

对位置编码处理后的数据，引入Transformer模型，每个任务设计独立的Transformer层，以更好适应每个任务的特定需求和特征。表达式：

；

式中，是任务的预测结果，是任务的预测结果，是任务处理后的最终数据，是任务处理后的最终数据。

在本实施例中，输入两城数据，模型能根据两城数据的关联性，同时预测两个任务目标。选择双向长短期记忆网络（BiLSTM）作为共享专家网络，利用其能够捕捉时间序列数据的双向依赖关系的特点，有助于更好的满足长时预测。对各任务提取到的特征表示添加位置编码，提高对长时依赖关系的捕捉能力和长时预测的准确性。位置编码采用正弦和余弦函数的组合，确保编码信号的唯一性。设计独立的Transformer层，能确保每个任务都能从共享的特征表示中提取与自身高度相关的高级特征，同时Transformer能有效捕捉长距离依赖关系，进而提高长时预测的准确性。

在本实施例中，所述基于物理信息多任务模型的城际网约车长期可用运力预测方法基于历史数据信息挖掘相关影响因素，针对城际网约车存在的特性，设计遵循运力守恒原则的损失函数，通过多任务预测框架，同时提取和利用两城数据，捕捉长时间依赖、长距离依赖，能有效提高城际网约车长时可用运力预测结果的准确性和遵循物理一致性，使相关交通机构不仅拥有充裕地调度时间，还能提前部署需求管理的策略，缓解潜在的需求和供给不匹配的问题。

所述基于物理信息多任务模型的城际网约车长期可用运力预测方法在训练时对模型实验参数的设置采用网格搜索方法，获得最优参数组合。以一个具体的案例对本发明实施例一的一种基于物理信息多任务模型的城际网约车长期可用运力预测方法进行说明，以验证本发明方法的有效性。

选取某城际运营公司的某线路城际网约车历史订单数据和运力数据作为研究对象，如表1和表2所示。具体时间为2023年3月1日至2023年5月31日，时间窗大小30分钟，按运营时间06:00-22:00划分为32个时间切片。

表1 历史订单数据

表2 历史运力数据

对数据进行清洗后，以时间窗大小为30分钟划分运营时间，构造模型训练所需的特征，模型特征示例如表3所示。

表3 模型特征描述

将特征编码处理后的特征组装成数据集，按4：1的比例划分训练集和测试集，按输入步长为224（一周的时间切片数据）、输出步长为32（一天的时间切片数据）构造模型的输入样本和输出样本，预测目标即为用两城市一周的历史数据和，预测未来一天的可用运力量和。构建的时间切片量和样本数量如表4所示。

表4 时间切片量和样本数量

模型训练的参数设置采用网络搜索最有参数组合，所得模型参数组合如表5所示。

表5 模型参数

完成城际网约车长时可用运力预测模型训练后，将测试集输入模型中进行测试，对所有预测结果进行评价，采用评价指标均方根误差（RMSE）、平均绝对误差（MAE）、对称平均绝对百分比误差（SMAPE）对模型的预测精度进行评价，值越低代表模型的预测精度越好。三个评价指标计算公式如下：

；

其中，表示的是真实值，表示的是预测值，为样本总数。

所述基于物理信息多任务模型的城际网约车长期可用运力预测方法对比下列6种目前典型的预测模型方法。

（1）长短期记忆网络（LSTM）是一种循环神经网络（RNN），专门用于处理和预测时序数据。LSTM通过引入记忆单元和门控机制，能够更有效地捕捉长序列中的长期依赖关系，解决传统RNN在长序列处理中存在的梯度消失问题。

（2）双向长短期记忆网络（BiLSTM）是LSTM的一种扩展，通过同时处理序列的前向和后向信息，增强了对时序数据的理解能力。这种结构使BiLSTM能够更全面地捕捉序列中的依赖关系，适用于需要考虑上下文信息的任务。

（3）Autoformer是一种基于自动特征学习和Transformer的模型，专为时间序列预测设计。它通过学习数据的特征和结构，自动适应不同的时间序列模式，生成准确的预测结果。Autoformer具有很强的适应性，能够处理多种时间序列数据。

（4）Informer是Transformer模型的变体，设计用于捕捉序列中的长距离依赖关系。它具有较强的泛化能力，适用于各种时间序列预测任务。Informer通过优化自注意力机制，能够高效处理长序列数据。

（5）图块时间序列网络（PatchTST）是一种使用图卷积网络（GCN）和自注意力机制的模型，用于时间序列数据的预测和分析。PatchTST重点在于捕捉数据中的空间关系和周期性特征，适用于具有复杂空间依赖和周期性的时序数据。

（6）Transformer是一种基于自注意力机制的神经网络模型，最初用于自然语言处理任务，但也广泛应用于时间序列预测。Transformer通过自注意力机制捕捉序列中的依赖关系，具有并行处理能力，能够高效处理长序列数据。

上述方法在预测效果上的表现如表6所示：

表6 不同方法的预测效果

通过对比不同方法的MAE、RMSE、SMAPE，可以发现本发明提供的基于物理信息多任务的城际网约车长时可用运力预测方法，在多任务预测模型考虑两个任务关联性和运力守恒原则下，三个评价指标均明显低于其他预测模型，在长时预测表现出较好的准确率。

本实施例还对比了有无流动特征的预测模型的表现，如表7所示：

表7 有无流动特征的预测效果

通过对比有无流动特征的预测效果，结果表明，引入流动特征为模型提供丰富的上下文信息，帮助模型更准确理解运力变化趋势，提高模型预测能力。本实施例还做了相应的消融实验，如表8所示。

表8 消融实验

通过消融实验的对比结果来看，（1）去除门控网络情况下，所有专家网络的输出被平均处理，模型失去灵活性，无法专注于最重要的特征，导致模型的性能出现下降，表明门控网络能根据不同任务需求合理分配不同专家网络的特征贡献，提高模型性能。（2）多任务共享Transformer层情况下，所有任务使用相同的特征变换，模型无法满足每个任务的特定需求，导致不同任务的预测结果出现不同程度的下降。表明为每个任务设计单独的Transformer层可以更好适应每个任务的特定模式，提高模型的整体表现。（3）去除运力平衡约束情况下，模型性能出现下降，表明运力守恒约束使模型在预测过程中遵循物理上的合理性，提高预测能力。（4）去除共享专家网络后的单任务模型，模型性能显著下降，表明多任务预测模型能够捕捉和利用不同任务之间存在的关联和互补关系，提高模型整体性能。

综上，所述基于物理信息多任务模型的城际网约车长期可用运力预测方法，基于历史数据信息挖掘相关影响因素，针对城际网约车存在的特性，设计遵循运力守恒原则的损失函数，通过多任务预测框架，同时提取和利用两城数据，捕捉长时间依赖、长距离依赖，能有效提高城际网约车长时可用运力预测结果的准确性和遵循物理一致性，使相关交通机构不仅拥有充裕地调度时间，还能提前部署需求管理的策略，缓解潜在的需求和供给不匹配的问题。

请参阅图5，本发明第二实施例还提供了一种基于物理信息多任务模型的城际网约车长期可用运力预测装置，其包括：

历史数据获取单元101，用于获取当前路线的城际网约车的历史订单数据和历史运力数据，并对所述历史订单数据和历史运力数据进行预处理；

编码单元102，用于根据预设的时间区间获取可用运力量，将与所述可用运力量相对应的运营时间切片作为可用运力量特征，并对所述运营时间切片的多个特征进行编码，得到各个时间切片对应的多个编码特征，其中，所述编码特征包括时间特征、外部特征、历史数据特征、流动特征、需求特征；

损失函数单元103，用于根据城际运力守恒原则设计总损失函数，其中，所述总损失函数为均方误差损失与运力平衡损失的加权和；

数据分割单元104，用于按照时间顺序对所述运营时间切片的编码特征进行排序，对排序后的特征进行归一化处理，得到数据集，按照预设的时间步长分割归一化处理后的数据集，获得预测模型的输入数据；

预测单元105，用于通过预设的预测模型的多任务预测框架，同时预测两个城市的可用运力，采用双向长短时记忆网络BiLSTM作为共享专家网络，提取两个任务的共性特征，使用门控网络根据不同任务的特定需求分配不同专家网络的特征贡献，并经位置编码处理后生成各任务特定的特征表示，为每个任务设计独立的Transformer层，以获取当前路线两个城市的长期可用运力的预测结果。

本发明第三实施例还提供了一种基于物理信息多任务模型的城际网约车长期可用运力预测设备，其包括存储器以及处理器，所述存储器内存储有计算机程序，所述计算机程序能够被所述处理器执行，以实现如上任意一项所述的基于物理信息多任务模型的城际网约车长期可用运力预测方法。

本发明第四实施例还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序能够被所述计算机可读存储介质所在设备的处理器执行，以实现如上任意一项所述的基于物理信息多任务模型的城际网约车长期可用运力预测方法。

示例性的，上述的各个装置以及各个流程步骤可通过计算机程序来实现，所述计算机程序可以被分割成一个或多个单元，所述一个或者多个单元被存储在所述存储器中，并由所述处理器执行，以完成本发明。

所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列 (Field-Programmable Gate Array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现本发明的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如声音播放功能、图像播放功能等）等；存储数据区可存储根据手机的使用所创建的数据（比如音频数据、电话本等）等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡（Smart Media Card, SMC），安全数字（Secure Digital, SD）卡，闪存卡（FlashCard）、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

其中，所述电子设备或者打印机集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本发明提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种基于物理信息多任务模型的城际网约车长期可用运力预测方法，其特征在于，包括：

2.根据权利要求1所述的基于物理信息多任务模型的城际网约车长期可用运力预测方法，其特征在于，对所述历史订单数据和历史运力数据进行预处理，具体为：

清洗所述历史订单数据中的干扰数据，其中，所述干扰数据包括重复数据、非乘客乘坐数据、无效数据；

清洗所述历史运力数据中的缺失数据。

3.根据权利要求1所述的基于物理信息多任务模型的城际网约车长期可用运力预测方法，其特征在于，根据预设的时间区间获取可用运力量，将与所述可用运力量相对应的运营时间切片作为可用运力量特征，并对所述运营时间切片的多个特征进行编码，得到各个时间切片对应的多个编码特征，具体为：

根据预设的时间窗大小，将网约车的运营时间划分为多个运营时间切片，并获取所述运营时间切片所指的时间区间内的可用运力量特征，将所述可用运力量特征作为预测的标签；

4.根据权利要求1所述的基于物理信息多任务模型的城际网约车长期可用运力预测方法，其特征在于，根据城际运力守恒原则设计总损失函数，具体为：

根据城际运力守恒原则设计运力平衡损失，公式为：

；

设计均方误差损失，公式为：

；

其中，为均方误差损失；

；

5.根据权利要求1所述的基于物理信息多任务模型的城际网约车长期可用运力预测方法，其特征在于，所述数据集按照预设的时间步长进行分割，构建多任务预测模型的输入数据，并按比例分为训练数据集和测试数据集。

6.根据权利要求1所述的基于物理信息多任务模型的城际网约车长期可用运力预测方法，其特征在于，结合多种现有技术，通过预设的预测模型的多任务预测框架，同时预测两个城市的可用运力，采用双向长短时记忆网络BiLSTM作为共享专家网络，提取两个任务的共性特征，使用门控网络根据不同任务的特定需求分配不同专家网络的特征贡献，并经位置编码处理后生成各任务特定的特征表示，为每个任务设计独立的Transformer层，以获取当前路线两个城市的长期可用运力的预测结果，具体为：

通过预设的预测模型的多任务预测框架，同时预测两个城市的可用运力，其中，所述多任务预测框架是通过同时处理和利用两个城市的数据，以确保预测模型在预测一个城市的运力时能借鉴另一个城市的运力信息；

；

式中，输入数据和经过共享特征提取模块，输出共享特征，每个专家网络从中提取其认为最重要的特征，并对这些特征处理后生成特定的特征表示；

；

式中，是第个专家网络的加权系数，采用softmax函数计算得到，是第个专家网络的输出特征，是任务在时间的特征表示，即所有专家网络输出特征的加权和，是任务对第个专家网络输出特征的加权系数，是任务在时间的特征表示，是任务对第个专家网络输出特征的加权系数；

对位置编码处理后的数据，引入Transformer模型，每个任务设计独立的Transformer层，以更好适应每个任务的特定需求和特征，表达式：

；

7.一种基于物理信息多任务模型的城际网约车长期可用运力预测装置，其特征在于，包括：

8.一种基于物理信息多任务模型的城际网约车长期可用运力预测设备，其特征在于，包括存储器以及处理器，所述存储器内存储有计算机程序，所述计算机程序能够被所述处理器执行，以实现如权利要求1至6任意一项所述的基于物理信息多任务模型的城际网约车长期可用运力预测方法。

9.一种计算机可读存储介质，其特征在于，存储有计算机程序，所述计算机程序能够被所述计算机可读存储介质所在设备的处理器执行，以实现如权利要求1至6任意一项所述的基于物理信息多任务模型的城际网约车长期可用运力预测方法。