CN112329962B

CN112329962B - 数据处理方法、装置、电子设备和存储介质

Info

Publication number: CN112329962B
Application number: CN202011174084.2A
Authority: CN
Inventors: 郑嘉; 罗世楷; 朱宏图
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2020-10-28
Filing date: 2020-10-28
Publication date: 2024-03-29
Anticipated expiration: 2040-10-28
Also published as: CN112329962A

Abstract

公开了一种数据处理方法、装置、电子设备和存储介质。通过在计算目标节点的需求量时，加入上一周期的发单且未被接单的订单数量，在计算目标节点的供给量时，加入临近单元区域内的空闲运力，并通过空闲运力的时长计算空闲运力个数。由此，可以提高参考数据的精确度，使得对于目标节点的描述更加准确，为目标节点的订单与车辆的调度提供更加合理的依据。

Description

数据处理方法、装置、电子设备和存储介质

技术领域

本发明涉及数据处理技术领域，尤其涉及一种数据处理方法、装置、电子设备和存储介质。

背景技术

近年来，随着移动互联网行业的迅速发展，网络约车服务(简称网约车)已经成为用户出行的一个重要方式，网约车可满足用户在不同出行场景中的使用需求，用户规模持续、稳定地增长，其在短时间内迅速占据了大量的用户市场，也为用户出行带来了极大的便利。

为了对订单与车辆进行合理的调配，通常基于标准的地理信息系统定义的各子系统，以每个格子为空间节点(独立的单位空间元素)，以预定时间段(例如，半个小时或一个小时)为一个时间节点(独立的单位时间段)，分别计算每一个时空节点的供需指标，以反映供需错配、供需失衡等问题，以实现对订单与车辆进行合理的调配进行合理的调配。

但是，现有技术对于供需指标的量化过于简单，无法精确反应各时空节点的供需情况。

发明内容

有鉴于此，本公开的实施例的目的在于提供一种数据处理方法、装置、电子设备和存储介质，可以提高参考数据的精确度，使得对于目标节点的描述更加准确，为目标节点的订单与车辆的调度提供更加合理的依据。

第一方面，本公开的实施例提供了一种数据处理方法，所述方法包括：

基于历史数据获取目标节点的关联参数，所述目标节点为在目标周期内的目标单元区域，所述目标节点的关联参数包括目标单元区域在所述目标周期的发单数量、目标单元区域在目标周期的上一周期的发单且未被接单的订单数量、目标单元区域在目标周期的完单数量、目标周期内目标单元区域和临近单元区域内的空闲运力个数，所述空闲运力个数根据所述空闲运力时间获取；

根据所述关联参数获取所述目标节点的参考数据，所述参考数据包括运力的需求量和供给量，所述需求量包括所述目标单元区域在所述目标周期的发单数量和在所述目标周期的上一周期的发单且未被接单的订单数量，所述供给量包括所述目标单元区域在目标周期的完单数量和空闲运力个数，其中，所述参考数据用于为目标节点的运力调度提供依据。

第二方面，本公开的实施例提供了一种数据处理装置，所述装置包括：

关联参数获取单元，用于基于历史数据获取目标节点的关联参数，所述目标节点为在目标周期内的目标单元区域，所述目标节点的关联参数包括目标单元区域在所述目标周期的发单数量、目标单元区域在目标周期的上一周期的发单且未被接单的订单数量、目标单元区域在目标周期的完单数量、目标周期内目标单元区域和临近单元区域内的空闲运力个数，所述空闲运力个数根据所述空闲运力时间获取；

参考数据获取单元，用于根据所述关联参数获取所述目标节点的参考数据，所述参考数据包括运力的需求量和供给量，所述需求量包括所述目标单元区域在所述目标周期的发单数量和在所述目标周期的上一周期的发单且未被接单的订单数量，所述供给量包括所述目标单元区域在目标周期的完单数量和空闲运力个数，其中，所述参考数据用于为目标节点的运力调度提供依据。

第三方面，本公开的实施例提供了一种电子设备，包括存储器和处理器，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面所述的方法。

第四方面，本发明实施例提供了一种计算机可读存储介质，其上存储计算机程序指令，所述计算机程序指令在被处理器执行时实现如第一方面所述的方法。

本公开的实施例的技术方案通过在计算目标节点的需求量时，加入上一周期的发单且未被接单的订单数量，在计算目标节点的供给量时，加入临近单元区域内的空闲运力，并通过空闲运力的时长计算空闲运力个数。由此，可以提高参考数据的精确度，使得对于目标节点的描述更加准确，为目标节点的订单与车辆的调度提供更加合理的依据。

附图说明

通过以下参照附图对本发明实施例的描述，本发明的上述以及其它目的、特征和优点将更为清楚，在附图中：

图1是本发明实施例的数据处理方法的流程图；

图2是本发明实施例的一个区域的节点的示意图；

图3是本发明实施例的计算参考数据的流程图；

图4是本发明实施例的计算热力值的流程图；

图5是本发明实施例的计算长期价值的流程图；

图6是本发明实施例的确定目标区域的流程图；

图7是本发明实施例的第一区域划分算法的流程图；

图8是本发明实施例的窗口期的示意图；

图9是本发明实施例的单元区域的数据曲线的示意图；

图10是本发明实施例的邻域的示意图；

图11是本发明实施例的连通区域的示意图；

图12是本发明实施例的第二区域划分算法的流程图；

图13是本发明实施例的网络嵌入的示意图；

图14是本发明实施例的随机游走的示意图；

图15是本发明实施例的层次聚类的示意图；

图16是本发明实施例的确定交集区域的示意图；

图17是本发明实施例的空闲运力的状态图；

图18是本发明实施例的服务运力的状态图；

图19是本发明实施例的数据处理装置的示意图；

图20是本发明实施例的电子设备的示意图。

具体实施方式

以下基于实施例对本发明进行描述，但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中，详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质，公知的方法、过程、流程、元件和电路并没有详细叙述。

此外，本领域普通技术人员应当理解，在此提供的附图都是为了说明的目的，并且附图不一定是按比例绘制的。

除非上下文明确要求，否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义；也就是说，是“包括但不限于”的含义。

在本发明的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

图1是本发明实施例的数据处理方法的流程图。如图1所示，本发明实施例的数据处理方法包括如下步骤：

步骤S100、基于历史数据获取目标节点的关联参数。

在本实施例中，节点为具有时空特性的节点，也即，在某一时间段内某一单元区域的状态。

进一步地，图2示出了一个区域的节点。具体地，如图2所示，对于A区域，以单元区域为六边形格子，将A区域分成了10个单元区域X1-X10。其中，每一个格子为一个单元区域。

具体地，以图中单元区域X1-X3为例进行说明，在t1时刻，单元区域X1-X3对应的节点可以描述为S1(t1，X1)、S2(t1，X2)、S3(t1，X3)。对应的，在t2时刻，单元区域X1-X3对应的节点可以描述为S1(t2，X1)、S2(t2，X2)、S3(t2，X3)。在t3时刻，单元区域X1-X3对应的节点可以描述为S1(t3，X1)、S2(t3，X2)、S3(t3，X3)。其中，在Sm(ti，Xj)中，Sm为节点标识，(ti，Xj)表示节点Sm为单元区域Xj在时刻ti下的状态。

进一步地，所述目标节点为在目标周期内的目标单元区域。

可选地，单元区域的六边形格子的边长可以为600米。

应理解，上述将一个区域划分为10个单元区域仅为本发明的一个示例，而在实际应用中，根据区域的大小和单元区域的大小的不同，划分结果也不一样。

还应理解，本发明实施例以所述单元区域为规则的六边形格子为例进行说明，但本发明实施例对此不作限制，单元区域的形状可以根据实际使用场景确定。例如，单元区域也可以是其它规则的形状，例如规则的三角形、四边形、五边形等，单元区域还可以是不规则的形状，或者，单元区域是规则和/或不规则的形状的组合。

进一步地，基于历史数据获取目标节点的关联参数，所述目标节点的关联参数包括目标单元区域在所述目标周期的发单数量、目标单元区域在目标周期的上一周期的发单且未被接单的订单数量、目标单元区域在目标周期的完单数量、目标周期内目标单元区域和临近单元区域内的空闲运力个数，所述空闲运力个数根据所述空闲运力时间获取。

具体地，获取各单元区域的历史数据，所述历史数据包括各单元区域的各个周期的实际信息。可选地，所述实际信息包括用户的发单数量、司机的接单数量、用户的冒泡数量、未被接单的数量、完单数量、空闲运力等。

其中，用户的发单数量为需要打车的用户发起的订单的总数量，司机的接单数量为司机接受的订单的总数量，用户的冒泡数量为用户选择出发地和目的地之后但是并未发起订单的总数量，未被接单的数量为该周期结束时未被接单的订单的总数量，完单数量该周期内司机完成的订单的数量，空闲运力为该周期内为接收到订单的运力。

可选地，将一天分为多个周期，统计若干个周数的历史记录，计算各周中同一天中同一周期的数据的平均值，以获取上述需要的历史数据。

例如，以根据历史记录获取发单数量为例进行说明，可以根据如下方式获取：以一个小时为周期，获取12个周(每周为7天)中每一天中各周期内的发单数量。目标节点为Si，其对应的目标单元区域为Xi，对应的目标周期为ti，假设目标周期ti为星期一的第8个周期，则获取单元区域Xi的12个周中每个星期一的第8个周期的发单数量(共12个)，计算平均值，将所述平均值作为目标节点的发单数量。

进一步地，目标单元区域的临近区域为与所述目标单元区域相邻的区域。例如，假设目标单元区域为图2中的X5，则临近区域包括X1、X2、X3、X4、X6和X7。

进一步地，对于目标节点的其它关联参数，也可以根据上述同样的方法获取。

应理解，上述以周期为一个小时为例进行说明，但本发明实施例对此不作限制，例如，周期也可以是两个小时、30分钟、10分钟等。

进一步地，本发明实施例还可以通过预训练的机器学习模型获取关联参数。具体地，建立一个初始模型，选取单元区域标识和周期标识为特征，根据历史数据训练所述初始模型，以使得训练的模型能够输出上述需要的关联参数。

可选地，所述机器学习模型可以通过人工神经网络(Artificial neuralnetworks)算法、k最近邻(k-nearest neighbor，kNN)算法等实现，在此不作限制。

进一步地，在训练机器学习模型时，也可以加入其它特征，例如天气因素等，可以使得模型输出的结果更加准确。

应理解，本发明实施例以一个模型获取所有的关联参数为例进行说明，但本发明对此不作限制。也可以训练多个模型，使得每一个模型输出上述一个或多个关联参数。

由此，即可获取所述目标节点的关联参数。

步骤S200、根据所述关联参数获取所述目标节点的参考数据。

在本实施例中，根据上述获取的关联参数获取所述目标节点的参考数据，所述参考数据包括供给量、需求量、供需差、热力值、预估效率和长期价值中的一种或多种。

进一步地，所述参考数据用于描述目标节点的供需情况，并为目标节点的运力调度提供依据。

进一步地，本发明实施例以所述运力为网约车为例进行说明。

应理解，本发明中的运力为可以提供使用载具将对象从一个地点运输到另一个地点的运输服务，例如出租车、顺风车、三轮车、摩托车等，对象可能包括乘客和/或货物。本发明中的“乘客”、“请求者”、“服务请求者”和“客户”可互换使用以指代可请求或预定服务的个体、实体或工具。另外，本发明中的“司机”“驾驶员”、“提供者”、“服务提供者”和“供应者”可互换使用以指代可提供服务或促进提供服务的个体、实体或工具。

具体地，计算各参考数据的方法如图3所示，包括如下步骤：

步骤S210、获取需求量。

在本实施例中，所述需求量包括所述目标单元区域在所述目标周期的发单数量和在所述目标周期的上一周期的发单且未被接单的订单数量。

进一步地，目标单元区域的所述目标周期的发单数量包括拼车类发单数量和非拼车类发单数量，其中，对于拼车类的发单，网约车的司机可以同时接受多个订单，对于非拼车类的发单，网约车的司机只能接受一个订单。

进一步地，为例更加准确的反应目标节点的需求量，需求量还包括在目标周期的上一周期的发单且未被接单的订单数量。

步骤S220、获取供给量。

在本实施例中，所述供给量包括所述目标单元区域在目标周期的完单数量和空闲运力个数，其中，所述参考数据用于为目标节点的运力调度提供依据。

进一步地，所述空闲运力为在目标周期内未接单的运力。

进一步地，为了更加精确的反应空闲运力所能够提供的服务数量，本发明实施例将空闲运力的时间转换为空闲运力的个数。

具体地，假设周期为T，目标周期内未接单的网约车的个数为m，目标周期内各个订单的平均服务时长为t，则空闲运力为：

其中，K为空闲运力的个数，T为周期，m为目标周期内未接单的网约车的个数，t为目标周期内各个订单的平均服务时长。

进一步地，目标周期内各个订单的平均服务时长t可以根据历史数据获取。

由此，即可获取需求量和供给量。

应理解，上述步骤S210和步骤S220不分执行顺序，可以是先后执行，也可以同时执行。

由此，可以以所述需求量和供给量为依据进行运力调度。

例如，假设目标节点S1的需求量大于供给量，目标节点S2的需求量小于供给量，则可将目标节点S2的运力调往目标节点S1。其中，目标节点S1和目标节点S2的目标单元区域不同，且目标周期相同。

本发明实施例在计算需求时，考虑当前时空节点的需求，以及之前时空节点流转的需求，在时间切片粒度，同时计算拼车需求和快车需求，并求和，来刻画需求量。在供给侧，分别计算服务中的运力和空闲运力，并求和来反应该时空节点的供给量，其中由于派单系统播单半径的存在，在空间上同时计算了邻近格子(播单半径内)的空闲运力量。与此同时，考虑拼车业务所能提供的多重运力。由于观测数据并不能确定，如果接单的话，空闲司机可以服务多少订单，因此，通过单均服务时长，将空闲运力的时长转化为空闲运力的个数，来反应供给量。

进一步地，计算参考数据还包括：

步骤S230、计算供需差。

在本实施例中，所述供需差为所述需求量和所述供给量的差值，具体计算公式如下：

ΔF＝F_d-F_s

其中，ΔF为供需差，F_d为需求量，F_s为供给量。

由此，可以通过供需差对目标节点进行描述。

例如，预先设置阈值F_th，F_th大于0。当ΔF＞F_th时，表示目标节点的供给量不足。当ΔF＜-F_th时，表示目标节点的供给量过量。-F_th≤ΔF≤F_th时，表示供给平衡。

进一步地，可以以所述供需差为依据进行运力调度。

例如，假设目标节点S1的供需差ΔF₁＞F_th，目标节点S2的供需差ΔF₂＜-F_th，则可将目标节点S2的运力调往目标节点S1。其中，目标节点S1和目标节点S2的目标单元区域不同，且目标周期相同。

应理解，所述供需差还可以为所述供给量和所述需求量的差值，具体计算公式如下：

ΔF＝F_s-F_d

其中，ΔF为供需差，F_d为需求量，F_s为供给量。

具体地，预先设置阈值F_th，F_th大于0。当ΔF＞F_th时，表示目标节点的供给量过量。当ΔF＜-F_th时，表示目标节点的供给量不足。-F_th≤ΔF≤F_th时，表示供给平衡。

进一步地，可以以所述供需差为依据进行运力调度。

例如，假设目标节点S1的供需差ΔF₁＞F_th，目标节点S2的供需差ΔF₂＜-F_th，则可将目标节点S1的运力调往目标节点S2。其中，目标节点S1和目标节点S2的目标单元区域不同，且目标周期相同。

由此，通过运力调度可以使得各目标区域运力均衡。

如前所述，当前供需诊断流程在供需指标、区域划分、价值计算等方面都存在没有打破的桎梏，且不能做到精细、稳定、以及具有前瞻性(长远预期)。具体缺点阐述如下，供需指标方面，应答率和供需匹配度都从比率的角度反应供需错配的情况，然而，比率掩盖了绝对值的具体量级。未播量虽然体现了绝对量，然而其对供给的量化过于简单，除了被应答的订单可以用来反映供给外，还需要考虑播单半径内的司机，以及当前区域存在的完单后空闲的司机，以及当前处于空闲状态，但没有应答的司机。具体地，比率掩盖了绝对量，如需求数仅为2，其中1个需求未被满足，那么应答率为50％，相比有些需求密集的区域，尽管密集区域的应答率为89％，但其未被满足的订单可能是11个需求。未播量没有考虑潜在供给，如区域被应答的订单为4，但即将完单的司机未2，当前没有应答订单的空闲司机为3，播单半径内可应答的司机为5，以及其他潜在供给。

在理想情况下，假设通过上述运力调度后可以使得所有运力都可以接单，为了更加直观的描述各单元区域，计算参考数据还包括：

步骤S240、计算热力值。

在本实施例中，所述热力值用于表征所述目标节点的价值。

进一步地，所述目标节点的关联参数还包括第一单均价和第二单均价，所述第一单均价为被满足订单的平均价值，所述第二单均价为未被满足订单的平均价值。

进一步地，如上所述，在所有运力都接单的情况下，所述被满足的订单的数量为供给量，未被满足订单的数量为供需差ΔF，其中，ΔF＝F_d-F_s，其中，F_d为需求量，F_s为供给量。

具体地，计算所述热力值的方法如图4所示，包括如下步骤：

步骤S241、根据所述供给量和第一单均价计算所述第一价值。

在本实施例中，所述第一价值为被满足订单对应的价值。

进一步地，所述第一单均价为被满足订单的平均价值。

可选地，所述第一单均价为完成的订单的价值的平均值，具体获取方法可参照步骤S100中所述，在此不再赘述。

进一步地，所述第一价值为第一单均价与供给量的乘积。具体计算公式如下：

V_y＝V₁*F_s

其中，V_y为所述第一价值，V₁为第一单均价，F_s为供给量。

步骤S242、根据所述供需差和第二单均价计算所述第二价值。

在本实施例中，所述第二价值为未被满足订单对应的价值。

进一步地，所述第二单均价为未被满足订单的平均价值。

可选地，所述第二单均价为在目标周期对应的历史周期内，发单且未被接单的订单的价值的平均值，具体获取方法可参照步骤S100中所述，在此不再赘述。

进一步地，所述第二价值为第二单均价与供需差的乘积。具体计算公式如下：

V_s＝V₂*ΔF

其中，V_s为所述第二价值，V₁为第二单均价，ΔF为供需差。

步骤S243、对所述第一价值与第二价值加权求和以获取所述热力值。

在本实施例中，对所述第一价值与第二价值加权求和以获取所述热力值，具体计算公式如下：

H＝V_y+αV_s

其中，H为热力值，V_y为所述第一价值，V_s为所述第二价值，α为权重系数。

进一步地，所述权重系数可以根据实际应用场景设置。

由此，即可获取热力值，通过热力值来反应在理想情况下，该目标区域的价值，进而根据价值来决定是否需要对该目标区域进行调度。

进一步地，为了更加精确的描述目标节点的价值，计算参考价值还包括：

步骤S250、计算预估效率。

在本实施例中，所述预估效率用于表征单位时间内每个订单的平均价值。

进一步地，所述目标节点的关联参数还包括第一效率和第二效率，所述第一效率为被满足订单的效率，所述第二效率为未被满足订单的效率。

进一步地，获取目标周期对应的历史周期内的历史数据，获取其中的完成的订单和各订单对应的价值，计算所述第一效率，具体计算公式如下：

其中，GPM₁为第一效率，N为目标周期对应的历史周期内的完成的订单总数，GMV_i为第i个订单的价值，T_i为完成第i个订单的时间。

进一步地，Ti为从接单时刻到完成订单时刻的时间段。

进一步地，获取目标周期对应的历史周期内的历史数据，获取其中的发单且未接单的订单和各订单对应的价值，计算所述第二效率，具体计算公式如下：

其中，GPM₂为第二效率，N为目标周期对应的历史周期内的发单且未接单的订单总数，GMV_j为第j个订单的价值，T_j为完成第j个订单的时间。

进一步地，由于发单且未接单的订单实际上并未进行订单处理，因此，GMV_j为第j个订单的预估的价值，T_j为完成第j个订单的预估的时间。具体地，预估的价值和预估的时间可以通过现有的各种预测模型实现，在此不做限制。

在本实施例中，通过对所述第一效率和第二效率加权求和以获取所述预估效率，具体公式如下：

GPM_h＝GPM₁+β*GPM₂

其中，GMP_h为预估效率，GPM₁为第一效率，GPM₂为第二效率，β为权重系数。

可选地，α＝β。

可选地，α＝β＝20。

由此，可以通过预估效率来表示单位时间内目标节点的价值，进而根据价值来决定是否需要对该目标区域进行调度。

本发明实施例通过对时空节点的完单司机、空闲司机的空闲时长、拼车业务线的多重运力进行有效折算，反应真实的供给，利用供需差，反应该时空节点的“量”。并分别计算被满足订单和未被满足订单的订单价值，利用价值的加权和，反应该时空节点的“价”；通过在计算“价”时，考虑整个等待、接单、接驾、送驾、完单的时长，计算每分钟的订单“价”，反应该时空节点的“效率”。

进一步地，上述参考数据都是从节点的角度来描述供需情况，为了更加精确的描述节点，计算参考价值还包括：

步骤S260、计算长期价值。

在本实施例中，所述长期价值用于表征目标区域内的运力的价值，具体如图5所示，包括如下步骤：

步骤S261、获取目标区域。

在本实施例中，所述目标区域包括所述目标节点和对应的相似节点。

进一步地，获取目标区域的方法如图6所示，包括如下步骤：

步骤S2611、根据第一区域划分算法进行区域划分获取多个第一区域。

在本实施例中，所述第一区域包括至少一个单元区域。

进一步地，本发明实施例通过空间划分的方法获取相似的节点，从而减少由于观测数据的波动与时空偏移而带来的不合理的价值度量，减少异常值的影响，平稳价值指标，减小极差。

具体地，空间划分是在地理信息的格子系统层面之上，建立更符合供需特征(供需语义)的局部划分。例如，具有相同供需语义的区域，比如同一个居民区或者办公区，其需求量是趋同的，虽然因为某些时刻因为偶然的人为因素或天气因素，导致需求高峰在时间上前推或后退半小时，地理空间上，左移或右移一定距离，但整体来看，不会出现过大偏差。这种相关性可以从长期数据中得到充分体现，然而，发单需求又是具有季节变化的，过长的时间会改变需求-时间曲线。因此，需要再一定的时间范围内，利用历史数据衡量地理格子的供需相似性(局部的)，并将相似的单元区域视为一个整体，来计算供需指标。具体地，本发明实施例利用需求量-时间曲线的相似性，衡量两个单元区域的相似性。

具体地，根据第一区域划分算法进行区域划分获取多个第一区域的方法如图7所示，包括如下步骤：

步骤S26111、确定划分数据。

在本实施例中，所述划分数据包括发单数量、完单数量、需求量和供给量中的一种或多种。

步骤S26112、获取各单元区域的划分数据与时间的关系曲线。

在本实施例中，获取各单元区域的划分数据与时间的关系曲线。

进一步地，划分数据与时间的关系曲线为一个单元区域在所述窗口期内的关系曲线。

进一步地，以划分数据为需求量为例进行说明，图8为一个窗口期的示意图。如图8所示，将历史12周(84天)作为一个窗口期，其中，T₀、T_-7、T_-14等表示历史的某一天。T₊₇表示目标节点在未来的某一天。获取窗口期内各个周期对应的历史数据中的需求量的平均值，以建立24小时内的需求量与时间的关系曲线。

例如，假设需要获取星期三的需求量与时间的关系曲线，则需要历史12周中星期三的数据，也即，得到12个星期三的历史数据，获取每一个星期三中各个周期的需求量。对于任何一个周期，获取该周期在12个星期三中的需求量，计算平均值得到该周期的需求量。由此，即可得到每一个周期的需求量，进而建立需求量与时间的关系曲线。

进一步地，以图9中的三个单元区域进行说明，其中，设置周期为1小时，一天内共有24＝144个周期，三个单元区域在一天内的划分数据与时间的关系曲线如图9所示，其中，横坐标为时间，纵坐标为发单量。

由此，即可得到各单元区域的划分数据与时间的关系曲线。

步骤S26113、计算各单元区域的关系曲线的相似度。

在本实施例中，计算各单元区域的关系曲线的相似度。

进一步地，可以通过欧几里得距离(Eucledian Distance)算法计算曲线相似度。具体地，记两条曲线中的一条曲线为L₁，一条曲线为L₁，另一条曲线为L₂。在同一以坐标系下，横坐标为(t₁，t₂，t₃，……，t_n)对应的L₁的纵坐标为(Y₁，Y₂，Y₃，……，Y_n)，横坐标为(t₁，t₂，t₃，……，t_n)对应的L₂的纵坐标为(Z₁，Z₂，Z₃，……，Z_n)，则曲线L₁和曲线L₂的相似度为：

其中，d为曲线L₁和L₂的相似度，Y_i为曲线L₁的第_i个点的纵坐标，Z_i为曲线L₂的第_i个点的纵坐标。

应理解，上述计算曲线相似度的方法仅为本发明的一个示例，本发明对此不作限制，也可以通过其它算法计算曲线相似度。例如，曼哈顿距离算法、余弦相似度算法、皮尔森相关系数算法等。

由此，即可获取各单元区域的关系曲线的相似度。

步骤S26114、按照预定顺序选择一个单元区域。

在本实施例中，按照预定顺序选择一个单元区域。

可选地，将各单元区域按照需求量排序，按照排序结果选择一个单元区域。

可选地，可以选择排序最为靠前或排序最为靠后的单元区域。

应理解，本发明实施例也可以按照其它参数进行排序，例如，上述获取的供需差、热力值、预估效率等中一个或多个。当选择其中多个参数进行排序时，可以通过设置各参数的权重来实现。

步骤S26115、根据广度优先搜索获取预定范围内与选择的单元区域相似的单元区域以获取所述第一区域。

在本实施例中，设置预定范围，根据广度优先搜索获取预定范围内与选择的单元区域相似的单元区域以获取所述第一区域。

进一步地，本发明实施例以设置的预定范围为3圈邻域。具体地，如图10所示，假设步骤S26114中选择的单元区域为X1，则3圈邻域的单元区域如图中所示。

进一步地，本发明实施例根据广度优先搜索获取预定范围内与选择的单元区域相似的单元区域以获取所述第一区域。

具体如图11所示，在图11中，假设步骤S26114中选择的单元区域为X1，根据广度优先搜索算法搜索与单元区域X1的临近的单元区域，如图所示，单元区域X1公有六条边，与单元区域X1的临近的单元区域有六个，分别与单元区域X1共用一条边，分别获取与六个临近的单元区域的曲线相似度，选择相似度小于阈值的单元区域作为相似单元区域，假设相似的单元区域为X2和X3。进一步地，接着搜索与单元区域X2和X3临近的单元区域，假设相似的单元区域为X4、X5和X6。进一步地，接着搜索与单元区域X4、X5和X6临近的单元区域，假设相似的单元区域为X7、X8和X9。由此，可以得到单元区域X1的相似的单元区域包括单元区域X2-X9，将X1-X9连通以获取一个连通的区域，作为一个第一区域。

进一步地，根据上述排序选择下一个单元区域，如果选择的单元区域在上述确定第一区域内，结束本步骤，再次选择下一个单元区域，以此类推。如果不在上述确定的第一区域内，根据上述步骤确定选择的单元区域的相似的单元区域确定一个第一区域。重复上述步骤，即可将该区域分为多个第一区域。

步骤S2612、根据第二区域划分算法进行区域划分获取多个第二区域。

在本实施例中，根据第二区域划分算法进行区域划分获取多个第二区域，所述第二区域包括至少一个单元区域。

进一步地，所述第二区域划分算法为O-D(Origin-Destination，起点-终点)流图算法。

具体地，根据第二区域划分算法进行区域划分获取多个第二区域的方法如图12所示，包括如下步骤：

步骤S26121、确定划分类型。

在本实施例中，所述划分类型包括完单、发单和冒泡单中的一种或多种。其中，完单表示网约车司机完成的订单，发单表示乘客发起的订单，冒泡单表示乘客选择了出发地和目的地但并未发起约车请求的订单。

进一步地，本发明实施例以划分类型包括完单、发单和冒泡单为例进行说明。

步骤S26122、获取各订单的订单信息。

在本实施例中，获取目标周期内各单元区域的完单、发单和冒泡单的订单信息，所述订单信息包括起点和终点。其中，起点为出发地对应的单元区域，终点为目的地对应的单元区域。

步骤S26123、根据订单的起点和终点确定各划分类型对应的网络。

在本实施例中，根据订单的起点和终点确定各划分类型对应的网络。

进一步地，如图13所示，将每个单元区域看做一个点，对于完单中的订单，将每个订单的起点和终点连接形成第一网络Ef，其中，每两个连接的点具有权重，所述权重可以用订单量表示，例如，对于单元区域X1对应的点D1，对于单元区域X2对应的点D2，单元区域X1和X2之间的完单量为m，则点D1和D2之间的权重为m。同理，通过同样的方法可以获取发单对应的第二网络Es，以及，第二网络中各点对(连接的两点)的权重。同理，通过同样的方法可以获取冒泡单对应的第三网络Eb，以及，第三网络中各点对(连接的两点)的权重。

应理解，图13中的第一网络、第二网络、第三网络和聚合网络仅为本发明的一个示例，并不代表网络中各节点的实际的连接关系。

步骤S26124、将各划分类型对应的网络进行拼接以获取聚合网络。

在本实施例中，将上述得到的第一网络、第二网络和第三网络进行拼接以获取聚合网络。

进一步地，分别对第一网络、第二网络和第三网络进行网络表征学习网络嵌入(network embedding，NE)以获取网络的向量表示。其中网络嵌入是用低维、稠密、实值的向量表示网络中的节点，也即映射到K维的隐空间。

具体地，以图14中的网络为例进行说明，包括节点D1-D5，利用参数控制随机游走同时考虑到网络的局部和宏观的信息，以同时捕捉节点的结构一致性和同质性两个特征，具有较高适应性。

首先，进行随机游走。具体地，通过两个参数p和q，实现参数控制跳转概率的随机游走。若网络中存在边(D1，D4)，当游走到的节点为D1时，则D1将以传递概率选择下一节点。参数p控制重新返回该节点的概率，该值越大，越不可能采样一个已经经过的节点，反之，该值越小越有可能返回原来的节点，即更容易让随机游走变得原地化，对应于BFS(BreathFirst Search，广度优先搜索)，如图中从D4跳到D1以后，有1/p的概率在节点D1处再跳回到D4。参数q控制回溯和离开的概率，如果q>1随机游走会趋向于采样比较近的点，如果q<1随机游走会趋向于采样那些较远的节点，对应于DFS(Deep First Search，深度优先搜索)。由此，通过随机游走即可得到节点序列。

其次，将上述得到的节点序列输入到Skip-gram(跳跃)模型中，以输出各节点对应向量。将上述得到的节点序列输入到预先训练的Skip-gram模型中获取网络的向量表示。

进一步地，借用自然语言处理中的Skip-Gram的方法进行网络中节点的表征学习，最终目标是学习隐层的权重矩阵即为该网络节点的表征学习。利用随机游走得到Network中节点的临近节点，随机游走随机均匀地选取网络节点，并生成固定长度的随机游走序列，将此序列类比为自然语言中的句子(节点序列＝句子，序列中的节点＝句子中的单词)，应用skip-gram模型学习节点的分布式表示。

具体地，Skip-Gram是一个三层神经网络，包括输入层(input)、隐层(hidden)和输出层(output)。其中，输入层和输出层输出的都是one-hot(独热)编码。具体地，选择一个节点，确定选择的节点的独热向量，各节点的独热向量为：各节点的独热向量包含的元素个数与选取的样本个数相同，各节点的独热向量只有一个元素为1，其它元素均为0，其中，各节点在选取的样本中的位置对应于在独热向量元素为1的位置。将选择的节点的独热向量输入到Skip-gram模型中，以输出选择的节点与其它节点临近的概率。通过训练是要使得输出层输出的概率最大，最终得到的隐层的权重矩阵即为网络的向量表示。

由此，通过上述方法即可得到第一网络、第二网络和第三网络的矩阵W1、W2和W3。

进一步地，将上述得到的第一网络、第二网络和第三网络的矩阵W1、W2和W3进行拼接以获取聚合网络的矩阵W。

具体地，拼接方法可以采用现有各种技术，在此不做限制。

步骤S26125、通过聚类模型进行层次聚类以获取所述第二区域。

在本实施例中，通过聚类模型对所述聚合网络进行层次聚类以获取所述第二区域。

进一步地，计算聚合网络中各个节点之间的相似度。具体地，选择一个节点，获取该节点的独热向量，将该节点的独热向量与上述得到的矩阵W相乘以获取该节点的向量。由此，重复上述步骤可以获取各个节点的向量。

根据各个节点的向量计算相似度。具体计算公式如下：

其中，sim(x,y)为节点x和节点y的相似度，x_i为节点x的向量的第i个元素，y_i为节点y的向量的第i个元素，n为节点的向量的维度，i＝1，2，3，……，n。

由此，即可获取各节点之间的相似度。

进一步地，根据各个节点之间的相似度通过聚类模型对所述聚合网络进行层次聚类以获取所述第二区域。

进一步地，本发明实施例采用的聚类模型为Agglomerative Clustering(层次聚类)模型。具体地，Agglomerative Clustering具有三种聚类方法，包括：Single-linkage(单联聚类)、Complete-linkage(全联聚类)Group average(平均聚类)。其中，Single-linkage要比较的距离为元素对之间的最小距离。Complete-linkage要比较的距离为元素对之间的最大距离。Group average要比较的距离为类之间的平均距离，平均距离的定义与计算：假设有A，B两个类，A中有n个元素，B中有m个元素。在A与B中各取一个元素，可得到他们之间的距离。将nm个这样的距离相加，得到距离和。最后距离和除以nm得到A，B两个类的平均距离。

进一步地，由于余弦距离越大，相似度越高，因此，本实施例采用全联聚类的方式。

具体地，以图14中的五个节点D1-D5为例进行说明。聚类的示意图如图15所示。计算D1-D5五个节点的相似度，得知D1与D2之间的相似度最大，将D1和D2聚类形成D6，并获取D6的向量，具体可根据D1和D2的向量获取。计算节点D3、D4、D5、D6之间相似度，得知D3与D6之间的相似度最大，将D3和D6聚类形成D7，并获取D7的向量，具体可根据D3和D6的向量获取。计算节点D4、D5、D7之间相似度，得知D4与D5之间的相似度最大，将D4和D5聚类形成D8。将D7和D8聚类形成D9。

由此，即可完成聚类。

进一步地，预先设置聚类数量，可将节点分为对应数量的类别。例如，对于图15中的节点，假设设置的聚类数量为2，则可将节点分为两类，第一类为(D1，D2，D3)，第二类为(D4，D5)。又例如，假设设置的聚类数量为3，则可将节点分为三类，第一类为(D1，D2)第二类为(D3)，第三类为(D4，D5)。

由此，即可通过聚类模型进行层次聚类以获取多个第二区域。

步骤S2613、将所述第一区域和所述第二区域的交集区域确定为所述目标区域。

在本实施例中，确定第一区域和第二区域的交集区域，将目标节点所在的交集区域确定为所述目标区域。

进一步地，以图2中的A区域为例进行说明，假设通过第一划分算法得到的三个第一区域A1、A2和A3，其中，第一区域A1包括单元区域X1、X2、X4和X5，第一区域A2包括单元区域X3、X7、X8和X10，第一区域A3包括单元区域X6和X9。通过第二划分算法得到的三个第二区域A4、A5和A6，其中，第二区域A4包括单元区域X1、X2和X3，第二区域A5包括单元区域X7、X8和X10，第二区域A6包括单元区域X4、X5、X6和X9。

进一步地，将所述第一区域和所述第二区域的交集区域确定为所述目标区域。具体地，从图16可以看出，获取第一区域和第二区域的交集区域包括A7-A11，其中，区域A7包括单元区域X1和X2，区域A8包括单元区域X4和X5，区域A9包括单元区域X6和X9，区域A10包括单元区域X7、X8和X10，区域A11包括单元区域X1。其中，各交集区域内的每两个单元区域都具有局部相似性和全局相似性。

进一步地，从上述获取的交集区域中选择一个交集区域确定为目标区域。

由此，即可确定目标区域，所述目标区域包括所述目标节点和对应的相似节点。

本发明实施例同时考虑局部相似性和全局相似性，能够有效的发掘诸如场站、办公区、居民区等POI(Point of Information，信息点)，更符合供需诊断系统的实际需求，提高区域划分的准确性。

现有技术在区域划分方面，存在非供需数据驱动、与供需诊断目标偏差较大，边界界定过于固定、死板，或过于模糊不清的问题。同时，缺乏对内在联系的量化。具体地，基于行政区域的区域过于宽泛，和供需状态的相似性几乎没有关系，且极少变动，不会随着城市规划的改变和供需热区的迁移而调整。而基于POI划分的方法，虽然考虑了同一商圈的需求特点，但没有考虑商圈间的相似性，且商圈边界没有明确的定义。此外，这两种方法，只考虑了时空节点自身的供需特征(节点属性)，没有考虑时空节点之间的关联关系和相互影响(即某种边属性)，因此过于局部，没有兼顾局部和全局的内在联系。

本发明实施例分别考虑局部和全局两个角度。局部方面，利用发单-时间曲线，反应空间节点在每一个时间节点(时间片)的需求量，通过计算一个空间节点(格子)邻域内的每对空间节点的发单-时间曲线相似度，判断这对格子是否具有相似的需求时间分布。这样的格子理论上的需求“量”“价”特性是趋同的，可以过滤不合理的异常和突变、减少极差。全局方面，通过发单、完单OD流的数据构建，多视图的OD流网络，分别对不同视图进行网络嵌入；最后，拼接多视图的嵌入结果，利用层次聚类方法对嵌入的向量进行聚类，实现区域划分。具有相同局部和全局类别的时空节点，被视为同一划分区域，并最终用来计算时空长期价值。

步骤S262、基于半马尔可夫模型获取所述目标区域的长期价值。

在本实施例中，基于半马尔可夫模型获取所述目标区域的长期价值。其中，半马尔科夫过程是除了转移时间和概率依赖于系统达到当前状态的时间之外，其它特征与马尔科夫过程相似。具体计算公式如下：

V(s)←V(s)+α[R+γ^Δt*V(s′)-V(s)]

其中，V(s)表示当前状态下的预估奖励，V(s′)表示下一状态的预估奖励，R表示实际奖励，γ为报酬衰减系数，0＜γ＜1，α为学习系数，箭头表示赋值，Δt表示当前状态和下一状态的相差的周期数。

进一步地，R+γ^Δt*V(s′)表示下一状态的现实值。

进一步地，R+γ^Δt*V(s′)-V(s)，表示现实值与预估值之间的差距。

进一步地，上述公式可以描述为：

新的V(s)＝原始V(s)+α*差距。

由此，根据如上公式进行价值迭代，可以获取目标区域内的长期价值。

进一步地，所述长期价值用于表征在所述目标区域内的司机的价值的预估值。

进一步地，图17是本发明实施例处于空闲运力的状态的示意图。如图17所示，S₀(T₀，X)表示在T₀周期，司机在单元区域X，S₁(T₁，X)表示在T₁周期，司机在单元区域X。此时，该司机的长期价值为：

V(S₀)←V(S₀)+α[R+γ*V(S₁)-V(S₀)]

其中，V(S₀)表示在状态S₀下的预估奖励，V(S₁)表示在状态S₁下的预估奖励，R表示实际奖励，γ为报酬衰减系数，0＜γ＜1，α为学习系数，箭头表示赋值。

进一步地，图18是本发明实施例处于服务中的运力的状态的示意图。如图18所示，S₀(T₀，X)表示在T₀周期，司机在单元区域X，S₃(T₃，Y)表示在T₃周期，司机在单元区域Y。此时，该司机的长期价值为：

V(S₀)←V(S₀)+α[R+γ³*V(S₃)-V(S₀)]

其中，V(S₀)表示在状态S₀下的预估奖励，V(S₃)表示在状态S₃下的预估奖励，R表示实际奖励，γ为报酬衰减系数，0＜γ＜1，α为学习系数，箭头表示赋值。

现有技术在价值计算方面，只计算了订单的一步(当前价值，即订单价格)，并没有像派单、调度等流程一样，去估计时空节点的长期价值，因此，相对短视，无法达到长期最优的效果。即便照搬当前派单、调度的价值计算方法，仍然存在数据噪声大、方差高，计算出的价值在局部时空存在极差大等不合理的现象，即长期价值的合理性和稳定性有所欠缺。同时，由于时空节点的数量较多，其计算复杂度较高，更新迭代慢，无法适应短期的供需变化。

计算长期价值利用上述空间划分内的，被接订单的整个订单生命周期的时长(接单、接驾、送驾、完单)和订单价值，通过semi-mdp的方法，进行价值迭代，得该时空区域的长期价值。

本发明实施例对各个时空节点的供需情况，进行精细、稳定的量化描述，以及识别存在供需错配的时空节点，并估算该时空节点为双边市场提供的长期价值。

本发明实施例针对具有时空特性的双边交易市场，进行供需诊断，精细、稳定的刻画某一时空位置当前的供需状态，以及较为长期的潜在价值。以此诊断方法所产生的量化指标为基础，对双边市场进行监控、调节，以达到供需的动态平衡、实现供需双方以及服务提供平台三方的共同利益最大化。

本发明实施例通过在计算目标节点的需求量时，加入上一周期的发单且未被接单的订单数量，在计算目标节点的供给量时，加入临近单元区域内的空闲运力，并通过空闲运力的时长计算空闲运力个数。由此，可以提高参考数据的精确度，使得对于目标节点的描述更加准确，为目标节点的订单与车辆的调度提供更加合理的依据。

综上，本发明实施例在供需指标计算层面，采用绝对量反应供需实际情况，并且采用多种折算方法，反映潜在供给，精确刻画供给和需求的实际量，同时，在度量供需错配时兼顾被满足的需求和未被满足的需求，以关注重点核心区域，而不是边缘区域。此外，在单步量价转换方面，引入效率指标。在区域划分层面，从供需语义的角度出发，比较时空节点之间的局部需求-时间分布曲线，计算需求-时间分布的相似度，确保划分的区域内需求的一致性；同时，利用OD流信息，将时空节点建立为发单、完单网络，以时空节点的发单量、完单量、空闲运力等为节点属性，进行网络嵌入学习，在此基础上，运用聚类算法，进行时空节点聚类，以反映全局信息。结合局部需求分布和OD网络嵌入的信息进行区域划分，作为和长期价值计算的基础单元，确保空间稳定性。在长期价值计算方面，以上述聚合区域作为空间节点(空间基础单元)通过SEMI-MDP(Semi-Markov decision process，半马尔可夫决策过程)的价值迭代方法，在城市-工作日粒度，计算各个时空节点，即每个格子-时间片对的长期价值

图19是本发明实施例的数据处理装置的示意图。如图19所示，本发明实施例的数据处理装置包括关联参数获取单元191和参考数据获取单元192。其中，关联参数获取单元191用于基于历史数据获取目标节点的关联参数，所述目标节点为在目标周期内的目标单元区域，所述目标节点的关联参数包括目标单元区域在所述目标周期的发单数量、目标单元区域在目标周期的上一周期的发单且未被接单的订单数量、目标单元区域在目标周期的完单数量、目标周期内目标单元区域和临近单元区域内的空闲运力个数，所述空闲运力个数根据所述空闲运力时间获取。参考数据获取单元192用于根据所述关联参数获取所述目标节点的参考数据，所述参考数据包括运力的需求量和供给量，所述需求量包括所述目标单元区域在所述目标周期的发单数量和在所述目标周期的上一周期的发单且未被接单的订单数量，所述供给量包括所述目标单元区域在目标周期的完单数量和空闲运力个数，其中，所述参考数据用于为目标节点的运力调度提供依据。

进一步地，所述参考数据还包括供需差。

进一步地，所述装置还包括：

供需差计算单元，用于根据所述需求量和供给量获取供需差；

其中，所述供需差为所述需求量和所述供给量的差值。

进一步地，所述参考数据还包括热力值，所述热力值用于表征所述目标节点的价值。

进一步地，所述目标节点的关联参数还包括第一单均价和第二单均价，所述第一单均价为被满足订单的平均价值，所述第二单均价为未被满足订单的平均价值；

所述装置还包括：

第一价值计算单元，用于根据所述供给量和第一单均价计算所述第一价值，所述第一价值为被满足订单对应的价值；

第二价值计算单元，用于根据所述供需差和第二单均价计算所述第二价值，所述第二价值为未被满足订单对应的价值；以及

热力值计算单元，用于对所述第一价值与第二价值加权求和以获取所述热力值。

进一步地，所述参考数据还包括预估效率，所述效率用于表征单位时间内每个订单的平均价值。

进一步地，所述目标节点的关联参数还包括第一效率和第二效率，所述第一效率为被满足订单的效率，所述第二效率为未被满足订单的效率；

所述装置还包括：

效率计算单元，用于对所述第一效率和第二效率加权求和以获取所述预估效率。

进一步地，所述参考数据还包括长期价值，所述长期价值用于表征目标节点所在目标区域的价值。

进一步地，所述装置还包括：

目标区域获取单元，用于获取目标区域，所述目标区域包括所述目标节点和对应的相似节点；以及

长期价值获取单元，用于基于半马尔可夫模型获取所述目标区域的长期价值。

进一步地，所述目标区域获取单元包括：

第一区域确定子单元，用于根据第一区域划分算法进行区域划分获取多个第一区域，所述第一区域包括至少一个单元区域；

第二区域确定子单元，用于根据第二区域划分算法进行区域划分获取多个第二区域，所述第二区域包括至少一个单元区域；以及

目标区域确定子单元，用于将所述第一区域和所述第二区域的交集区域确定为所述目标区域。

进一步地，所述第一区域确定子单元包括：

数据确定模块，用于确定划分数据，所述划分数据包括发单数量、完单数量、需求量和供给量中的一种或多种；

曲线获取模块，用于获取各单元区域的划分数据与时间的关系曲线；

相似度计算模块，用于计算各单元区域的关系曲线的相似度；

选择模块，按照预定顺序选择一个单元区域；以及

搜索模块，用于根据广度优先搜索获取预定范围内与选择的单元区域相似的单元区域以获取所述第一区域。

进一步地，所述第二区域确定子单元包括：

类型确定模块，用于确定划分类型，所述划分类型包括完单、发单和冒泡单中的一种或多种；

信息获取模块，用于获取各订单的订单信息，所述订单信息包括起点和终点；

网络确定模块，用于根据订单的起点和终点确定各划分类型对应的网络；

聚合模块，用于将各划分类型对应的网络进行拼接以获取聚合网络；以及

层次聚类模块，用于通过聚类模型进行层次聚类以获取所述第二区域。

图20是本发明实施例的电子设备的示意图。图20所示的电子设备为通用数据处理装置，其包括通用的计算机硬件结构，其至少包括处理器201和存储器202。处理器201和存储器202通过总线203连接。存储器202适于存储处理器201可执行的指令或程序。处理器201可以是独立的微处理器，也可以是一个或者多个微处理器集合。由此，处理器201通过执行存储器202所存储的指令，从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其它装置的控制。总线203将上述多个组件连接在一起，同时将上述组件连接到显示控制器204和显示装置以及输入/输出(I/O)装置205。输入/输出(I/O)装置205可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地，输入/输出装置205通过输入/输出(I/O)控制器206与系统相连。

本领域的技术人员应明白，本发明的实施例可提供为方法、装置(设备)或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品。

本发明是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图来描述的。应理解可由计算机程序指令实现流程图中的每一流程。

这些计算机程序指令可以存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现流程图一个流程或多个流程中指定的功能。

也可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程中指定的功能的装置。

以上所述仅为本发明的优选实施例，并不用于限制本发明，对于本领域技术人员而言，本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种数据处理方法，其特征在于，所述方法包括：

基于历史数据获取目标节点的关联参数，所述目标节点为在目标周期内的目标单元区域，所述目标节点的关联参数包括目标单元区域在所述目标周期的发单数量、目标单元区域在目标周期的上一周期的发单且未被接单的订单数量、目标单元区域在目标周期的完单数量、目标周期内目标单元区域和临近单元区域内的空闲运力个数，所述空闲运力个数根据空闲运力时间获取；

2.根据权利要求1所述的方法，其特征在于，所述参考数据还包括供需差。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

根据所述需求量和供给量获取供需差；

其中，所述供需差为所述需求量和所述供给量的差值。

4.根据权利要求2所述的方法，其特征在于，所述参考数据还包括热力值，所述热力值用于表征所述目标节点的价值。

5.根据权利要求4所述的方法，其特征在于，所述目标节点的关联参数还包括第一单均价和第二单均价，所述第一单均价为被满足订单的平均价值，所述第二单均价为未被满足订单的平均价值；

所述方法还包括：

根据所述供给量和第一单均价计算第一价值，所述第一价值为被满足订单对应的价值；

根据所述供需差和第二单均价计算第二价值，所述第二价值为未被满足订单对应的价值；以及

对所述第一价值与第二价值加权求和以获取所述热力值。

6.根据权利要求2所述的方法，其特征在于，所述参考数据还包括预估效率，所述预估效率用于表征单位时间内每个订单的平均价值。

7.根据权利要求6所述的方法，其特征在于，所述目标节点的关联参数还包括第一效率和第二效率，所述第一效率为被满足订单的效率，所述第二效率为未被满足订单的效率；

所述方法还包括：

对所述第一效率和第二效率加权求和以获取所述预估效率。

8.根据权利要求2所述的方法，其特征在于，所述参考数据还包括长期价值，所述长期价值用于表征目标区域内的运力的价值。

9.根据权利要求8所述的方法，其特征在于，所述方法还包括：

获取目标区域，所述目标区域包括所述目标节点和对应的相似节点；以及

基于半马尔可夫模型获取所述目标区域的长期价值。

10.根据权利要求9所述的方法，其特征在于，所述获取目标区域包括：

根据第一区域划分算法进行区域划分获取多个第一区域，所述第一区域包括至少一个单元区域；

根据第二区域划分算法进行区域划分获取多个第二区域，所述第二区域包括至少一个单元区域；以及

将所述第一区域和所述第二区域的交集区域确定为所述目标区域。

11.根据权利要求10所述的方法，其特征在于，根据第一区域划分算法进行区域划分获取多个第一区域包括：

确定划分数据，所述划分数据包括发单数量、完单数量、需求量和供给量中的一种或多种；

获取各单元区域的划分数据与时间的关系曲线；

计算各单元区域的关系曲线的相似度；

按照预定顺序选择一个单元区域；以及

根据广度优先搜索获取预定范围内与选择的单元区域相似的单元区域以获取所述第一区域。

12.根据权利要求10所述的方法，其特征在于，根据第二区域划分算法进行区域划分获取多个第二区域包括：

确定划分类型，所述划分类型包括完单、发单和冒泡单中的一种或多种；

获取各订单的订单信息，所述订单信息包括起点和终点；

根据订单的起点和终点确定各划分类型对应的网络；

将各划分类型对应的网络进行拼接以获取聚合网络；以及

通过聚类模型进行层次聚类以获取所述第二区域。

13.一种数据处理装置，其特征在于，所述装置包括：

关联参数获取单元，用于基于历史数据获取目标节点的关联参数，所述目标节点为在目标周期内的目标单元区域，所述目标节点的关联参数包括目标单元区域在所述目标周期的发单数量、目标单元区域在目标周期的上一周期的发单且未被接单的订单数量、目标单元区域在目标周期的完单数量、目标周期内目标单元区域和临近单元区域内的空闲运力个数，所述空闲运力个数根据空闲运力时间获取；

14.一种电子设备，包括存储器和处理器，其特征在于，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-12中任一项所述的方法。

15.一种计算机可读存储介质，其上存储计算机程序指令，其特征在于，所述计算机程序指令在被处理器执行时实现如权利要求1-12中任一项所述的方法。