CN114677048A

CN114677048A - 一种需求区域挖掘方法

Info

Publication number: CN114677048A
Application number: CN202210427623.1A
Authority: CN
Inventors: 滕志勇; 刘永威; 刘丁
Original assignee: Beijing Apoco Blue Technology Co ltd
Current assignee: Beijing Apoco Blue Technology Co ltd
Priority date: 2022-04-22
Filing date: 2022-04-22
Publication date: 2022-06-28
Anticipated expiration: 2042-04-22
Also published as: CN114677048B

Abstract

本发明涉及数据挖掘技术领域，特别涉及一种需求区域挖掘方法，用于在为共享车辆建立车站前进行需求区块的挖掘，以为车站的选址提供参考，包括以下步骤：在预设区域内划分基础地理单元，根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分；对同等级的邻近基础地理单元进行聚合，形成需求区域，用于提供该区域的需求信息，为车站的选址提供参考。可以理解的，先通过预设区域的共享车辆订单量对基础地理单元进行分级，再对同等级的邻近基础地理单元进行聚合，利于保证聚合结果内部不同位置实际的需求是相同或相近的。

Description

一种需求区域挖掘方法

技术领域

本发明涉及数据挖掘技术领域，特别涉及一种需求区域挖掘方法。

背景技术

共享车辆在进行运营时，往往需要在对应的城镇内选定区域来建立车站，以对城镇内的共享车辆进行管理。

而在用来建立车站的区域是不能随意选定的，对于城市内部服务区域划分，需要反应各个不同区域内的需求，目前的方式是把车辆的运营区域按照经纬度分割成一定大小的方形地理块，并按照这个方法去计算各个地理块的停车强度、取车强度、需求强度等信息，再结合这些信息选定需求区块。

但该方案存在的问题是，对于一般的区域来说，分割后获得的地理块面积过小，通常需要聚合周围的多个邻居块的统计数据来进行训练和推理。而对于热点区域来说，分割后获得的地理块来说过大，特别是在热门建筑物附近，容易出现实际上同一地理块内部不同位置实际的需求不同的情况。

发明内容

为解决同一地理块内部不同位置实际的需求可能不同的问题，本发明提供了一种需求区域挖掘方法。

本发明解决技术问题的方案是提供一种需求区域挖掘方法，用于在为共享车辆建立车站前进行需求区块的挖掘，以为车站的选址提供参考，包括以下步骤：

在预设区域内划分基础地理单元，根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分；

对同等级的邻近基础地理单元进行聚合，形成需求区域，用于提供该区域的需求信息，为车站的选址提供参考。

优选地，所述根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分，具体包括以下步骤：

采用Uber H3划分基础地理单元；

获取每个基础地理单元在预定期限内的订单量，以所有订单量的分位数作为阈值，将对应的基础地理单元划分为不同的等级。

优选地，所述对同等级的邻近基础地理单元进行聚合，形成需求区域，具体包括以下步骤：

选定初始基础地理单元，对初始基础地理单元的所有邻接基础地理单元进行遍历，将与初始基础地理单元等级相同的基础地理单元确定为拟聚合基础地理单元，并与初始基础地理单元进行聚合得到初始聚合区域；

对每一拟聚合基础地理单元的所有邻接基础地理单元进行遍历，并将与该拟聚合基础地理单元等级相同的基础地理单元与该拟聚合基础地理单元进行聚合，直至每一拟聚合基础地理单元的邻接基础地理单元中不存在与该拟聚合基础地理单元等级相同的基础地理单元而得到单个或多个二次聚合区域，将初始聚合区域与得到的二次聚合区域聚合得到同等级基础地理单元的聚合形成需求区域。

优选地，所述需求区域挖掘方法还包括以下步骤：

在需求区域内，使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类，根据聚类结果得到聚类区块。

优选地，所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类并根据聚类结果得到聚类区块具体包括：

基于密度峰值确定需求区域的中心，并根据需求区域内各个基础地理单元的局部密度及其到中心的距离进行聚类，从而得到聚类区块。

优选地，所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类，根据聚类结果得到聚类区块之前还包括：

对CFSFDP模型进行超参数调节；

使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类，根据聚类结果得到聚类区块。

优选地，所述使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类，根据聚类结果得到聚类区块，具体包括以下步骤：

使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类，得到聚类结果；

对聚类结果进行切分，得到初始区块；

以初始区块为基准，生成聚类区块。

优选地，所述需求区域挖掘方法还包括以下步骤：

根据预设区域内的地理信息将聚类区块进行切分，得到至少一个需求区块，选定需求区块为可用于建立车站的区域。

优选地，所述根据预设区域内的地理信息将聚类区块进行切分，得到至少一个需求区块，选定需求区块为可用于建立车站的区域，具体包括以下步骤：

根据地理信息对聚类区块进行切分；

将聚类区块中兴趣点数量小于预设阈值的区域删除；

沿着路网两侧生成可行区域；

将完成区域删除的聚类区块与可行区域取交集，得到需求区块。

优选地，所述需求区域挖掘方法还包括以下步骤：

基于需求区块的形状和/或重叠区域和/或面积对需求区块进行优化。

与现有技术相比，本发明的需求区域挖掘方法具有以下优点：

1、需求区域挖掘方法，用于在为共享车辆建立车站前进行需求区块的挖掘，以为车站的选址提供参考，包括以下步骤：在预设区域内划分基础地理单元，根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分；对同等级的邻近基础地理单元进行聚合，形成需求区域，用于提供该区域的需求信息，为车站的选址提供参考。可以理解的，先通过预设区域内各个基础地理单元对应的的共享车辆订单量对基础地理单元进行分级，再对同等级的邻近基础地理单元进行聚合，利于保证聚合结果内部不同位置的实际需求是相同或相近的，从而保证所挖掘的需求区域的精准度。

2、本发明中，所述根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分，得到多个等级相同或不同的基础地理单元，具体包括以下步骤：采用UberH3划分基础地理单元；获取每个基础地理单元在预定期限内的订单量，以所有订单量的分位数作为阈值，将对应的基础地理单元划分为不同的等级。可以理解的，Uber H3摒弃了传统的地图投影方式，直接在地球上铺满六边形，采用多层网格映射的方式来建立基础地理单元，可以有效地避免现有的基础地理单元划分方式存在的不同精度下网格的形状不一且精度的变化幅度时小时大以及邻域到中心网格的距离不相等的问题；利于提高划分基础地理单元的精准度，从而提高本需求区域挖掘方法的精准度。

3、本发明中，所述对同等级的邻近基础地理单元进行聚合，形成需求区域，具体包括以下步骤：选定初始基础地理单元，对初始基础地理单元的所有邻接基础地理单元进行遍历，将与初始基础地理单元等级相同的基础地理单元确定为拟聚合基础地理单元，并与初始基础地理单元进行聚合得到初始聚合区域；对每一拟聚合基础地理单元的所有邻接基础地理单元进行遍历，并将与该拟聚合基础地理单元等级相同的基础地理单元与该拟聚合基础地理单元进行聚合，直至每一拟聚合基础地理单元的邻接基础地理单元中不存在与该拟聚合基础地理单元等级相同的基础地理单元而得到单个或多个二次聚合区域，将初始聚合区域与得到的二次聚合区域聚合得到同等级基础地理单元的聚合形成需求区域。可以理解的，通过对基础地理单元进行遍历的方式，可以保证将所有的邻近同等级基础地理单元进行聚合，不会出现遗漏的情况，可靠性高。

4、本发明的需求区域挖掘方法还包括以下步骤：在需求区域内，使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类，根据聚类结果得到聚类区块。可以理解的，通过密度峰值聚类算法模型CFSFDP计算获得的聚类区块形状更加规整，利于为车站的选址提供更加精准的位置参考信息。

5、所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类并根据聚类结果得到聚类区块具体包括：基于密度峰值确定需求区域的中心，并根据需求区域内各个基础地理单元的局部密度及其到中心的距离进行聚类，从而得到聚类区块。可以理解的，通过密度峰值聚类算法模型CFSFDP计算获得的聚类区块通过基于密度峰值确定需求区域的中心，并根据局部密度及距离进行聚类，去除噪音，可以让得到的聚类区块形状更加规整，利于为车站的选址提供更加精准的位置参考信息。

6、本发明中，所述所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类，根据聚类结果得到聚类区块之前还包括：对CFSFDP模型进行超参数调节；使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类，根据聚类结果得到聚类区块。可以理解的，在机器学习中，超参数是在开始学习过程之前设置值的参数，而不是通过训练得到的参数数据。通常情况下，需要对超参数进行优化，给学习机选择一组最优超参数，以提高学习的性能和效果，因此，对CFSFDP模型进行超参数调节，利于优化聚类结果，从而得到更符合需求的聚类区块。

7、本发明中，所述使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类，根据聚类结果得到聚类区块，具体包括以下步骤：使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类，得到聚类结果；对聚类结果进行切分，得到初始区块；以初始区块为基准，生成聚类区块。可以理解的，在聚类完成之后，可能会出现不同等级的聚类区块在地理上实际相连的情况，因此需要对其进行切分，从而得到明确区分的初始区块；而此时初始区块还是对基础地理单元的聚合结果，因此是多个六边形的连接组合，相对来说形状并不是非常地规整，因此，以初始区块为基准，生成聚类区块，利于为车站的选址提供更加精准的位置参考信息。

8、本发明的需求区域挖掘方法还包括以下步骤：根据预设区域内的地理信息将聚类区块进行切分，得到至少一个需求区块，选定需求区块为可用于建立车站的区域。可以理解的，车站通常是沿着路网等地理位置设置，而聚类区块内可能会存在着很多远离路网等地理位置的区域，因此根据预设区域内的地理信息将聚类区块进行切分得到的需求区块，可以更加贴合车站的选址需求，从而提高本需求区域挖掘方法的实用性。

9、本发明中，所述根据预设区域内的地理信息将聚类区块进行切分，得到至少一个需求区块，选定需求区块为可用于建立车站的区域，具体包括以下步骤：根据地理信息对聚类区块进行切分；

将聚类区块中兴趣点数量小于预设阈值的区域删除；沿着路网两侧生成可行区域；将完成区域删除的聚类区块与可行区域取交集，得到需求区块。可以理解的，通过将完成区域删除的聚类区块与可行区域取交集的方式，可以进一步约束需求区块的面积，保证需求区块的精准度和可实施性。

10、本发明的需求区域挖掘方法还包括以下步骤：基于需求区块的形状和/或重叠区域和/或面积对需求区块进行优化。此设计利于进一步提高需求区块的精准度和可实施性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明第一实施例提供的需求区域挖掘方法流程图。

图2是本发明第一实施例提供的需求区域挖掘方法流之S1的流程图。

图3是本发明第一实施例提供的需求区域挖掘方法流之S2的流程图。

图4是本发明第一实施例提供的另一需求区域挖掘方法流程图。

图5是本发明第一实施例提供的需求区域挖掘方法流之S3的前序步骤的流程图。

图6是本发明第一实施例提供的需求区域挖掘方法流之S301的流程图。

图7是本发明第一实施例提供的需求区域挖掘方法流之S302的流程图。

图8是本发明第一实施例提供的另一需求区域挖掘方法中聚类结果进行切分后的示意图。

图9是本发明第一实施例提供的另一需求区域挖掘方法中生成规整的聚类区块的示意图。

图10是本发明第一实施例提供的另一需求区域挖掘方法流程图。

图11是本发明第一实施例提供的需求区域挖掘方法流之S4的流程图。

图12是本发明第一实施例提供的另一需求区域挖掘方法流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施实例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本文所使用的术语“垂直的”、“水平的”、“左”、“右”、“上”、“下”、“左上”、“右上”、“左下”、“右下”以及类似的表述只是为了说明的目的。

请参阅图1，本发明第一实施例提供一种需求区域挖掘方法，用于在为共享车辆建立车站前进行需求区块的挖掘，以为车站的选址提供参考，包括以下步骤：

步骤S1：在预设区域内划分基础地理单元，根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分；

步骤S2：对同等级的邻近基础地理单元进行聚合，形成需求区域，用于提供该区域的需求信息，为车站的选址提供参考。

可以理解的，先通过预设区域内各个基础地理单元对应的的共享车辆订单量对基础地理单元进行分级，再对同等级的邻近基础地理单元进行聚合，利于保证聚合结果内部不同位置的实际需求是相同或相近的，从而保证所挖掘的需求区域的精准度。不难理解，由于基础地理单元的分级是基于预设区域在预定期限内的共享车辆订单量进行的，因此同等级的基础地理单元在预定期限内的共享车辆订单量是相近的，从而由这些基础地理单元聚合合成的需求区域在不同位置的实际需求是相同或相近的。

需要说明的是，预设区域可以是任意可供电动车辆运营的区域。具体的，本实施例中，预设区域界定为城市内的一个区。

具体的，本实施例中，预定期限为过去的一年。可以理解的，在其他实施例中，预定期限可以是任意可以产生累计订单量的时间段。

请结合图1和图2，步骤S1具体包括以下步骤：

步骤S11：采用Uber H3（Uber’s Hexagonal Hierarchical Spatial Index）划分基础地理单元；Uber H3是一种六边形分层索引网格系统。

步骤S12：获取每个基础地理单元在预定期限内的订单量，以所有订单量的分位数作为阈值，将对应的基础地理单元划分为不同的等级。

可以理解的，Uber H3摒弃了传统的地图投影方式，直接在地球上铺满六边形，采用多层网格映射的方式来建立基础地理单元，可以有效地避免现有的基础地理单元划分方式存在的不同精度下网格的形状不一且精度的变化幅度时小时大以及邻域到中心网格的距离不相等的问题；利于提高划分基础地理单元的精准度，从而提高本需求区域挖掘方法的精准度。

进一步的，在对基础地理单元进行等级划分时，以所有订单量的四分位数作为阈值，从而将基础地理单元分为四个不同等级。可以理解的，在其他实施例中，也可以采用其他的分位数作为阈值，从而划分更多或更少的等级。

请结合图1和图3，步骤S2具体包括以下步骤：

步骤S21：选定初始基础地理单元，对初始基础地理单元的所有邻接基础地理单元进行遍历，将与初始基础地理单元等级相同的基础地理单元确定为拟聚合基础地理单元，并与初始基础地理单元进行聚合得到初始聚合区域；

步骤S22：对每一拟聚合基础地理单元的所有邻接基础地理单元进行遍历，并将与该拟聚合基础地理单元等级相同的基础地理单元与该拟聚合基础地理单元进行聚合，直至每一拟聚合基础地理单元的邻接基础地理单元中不存在与该拟聚合基础地理单元等级相同的基础地理单元而得到单个或多个二次聚合区域，将初始聚合区域与得到的二次聚合区域聚合得到同等级基础地理单元的聚合形成需求区域。

可以理解的，通过对基础地理单元进行遍历的方式，可以保证将所有的邻近同等级基础地理单元进行聚合，不会出现遗漏的情况，可靠性高。

需要说明的是，遍历是指沿着某条搜索路线，依次对树或图中每个节点均做一次访问。在本实施例中，则是沿预定路线对与初始基础地理单元相邻的基础地理单元进行访问。

可选的，预定路线可以是沿顺时针方向或逆时针方向的路线，也可以是按其他规则制定的路线，比如说先东方，后西方，然后再南北，只要确保能完成对初始基础地理单元相邻的全部基础地理单元的访问即可。

可以理解的，在步骤S22中，若被聚合的基础地理单元的所有邻接基础地理单元中存在已被遍历的基础地理单元，则可以放弃对该基础地理单元的遍历操作。

可选的，初始基础地理单元可以为单个或多个。具体的，本实施例中，在实行步骤S21时，会同时选择多个初始基础地理单元。

请参阅图4，需求区域挖掘方法还包括以下步骤：

步骤S3：在需求区域内，使用密度峰值聚类算法模型CFSFDP（Clustering by fastsearch and find of density peaks）对基础地理单元进行聚类，根据聚类结果得到聚类区块。

可以理解的，通过密度峰值聚类算法模型CFSFDP计算获得的聚类区块形状更加规整，利于为车站的选址提供更加精准的位置参考信息。

进一步的，步骤S3具体包括：

S31：基于密度峰值确定需求区域的中心，并根据需求区域内各个基础地理单元的局部密度及其到中心的距离进行聚类，从而得到聚类区块。

可以理解的，由于CFSFDP能够识别非凸的聚类簇且能够支持多维的数据特征嵌入，所以采用CFSFDP能很好地完成对历史订单坐标点的聚类。通过密度峰值聚类算法模型CFSFDP计算获得的聚类区块通过基于密度峰值确定需求区域的中心，并根据局部密度及距离进行聚类，去除噪音，可以让得到的聚类区块形状更加规整，利于为车站的选址提供更加精准的位置参考信息。

请结合图4和图5，在步骤S3之前还包括以下步骤：

步骤S301：对CFSFDP模型进行超参数调节；

步骤S302：使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类，根据聚类结果得到聚类区块。

可以理解的，在机器学习中，超参数是在开始学习过程之前设置值的参数，而不是通过训练得到的参数数据。通常情况下，需要对超参数进行优化，给学习机选择一组最优超参数，以提高学习的性能和效果，因此，对CFSFDP模型进行超参数调节，利于优化聚类结果，从而得到更符合需求的聚类区块。

进一步的，针对基础地理单元的不同等级需要分别预设一组超参数。

进一步的，预设的超参数包括比例percent及邻近基础地理单元到中心的截断距离阈值rate1和密度阈值rate2。其中，比例percent用于辅助求取截断距离阈值rate1。

比如说，假设点对（i，j）的数量为n，点对（i，j）的距离为d（i，j）。先将点对d（i，j）从小到大排序得到排序后列表D，然后计算pos = percent * n，截断距离dc = D[pos]。其中，pos是位置索引。D是排序后的列表，D[pos]是取对于索引的元素。

请结合图4至图6，步骤S31具体包括以下步骤：

步骤S3011：定义最小化算法优化函数，设定随机采样比例，计算每一个采样的损失，进而确定全局损失，从而最小化全局损失获得全局较优的参数组合；

步骤S3012：针对超参数建立多目标优化函数；

步骤S3013：确定超参数的搜索空间，然后采用贝叶斯优化的方案取得多目标优化函数最小时的超参数组合。

可以理解的，通过定义最小化算法优化函数，利于最小化地优化全局损失，从而获得全局较优的参数组合，避免出现只能实现局部最优的情况。

进一步的，步骤S3011具体包括以下步骤：

S30111：定义最小化算法优化函数GlobalAssessment：

sample_loss = Sum（daviesbouldinscore）

其中，需设定随机采样比例，计算每一个采样的loss，进而确定全局损失global_loss，从而最小化优化全局损失获得全局较优的参数组合；

S30112：定义object函数ObjectiveOptimizer：

{'loss': global_loss, 'params': params, 'status': STATUS_OK}

用于确定global_loss和params的映射组合；

S3113：进行贝叶斯优化HyperoptSearch：

space =

{ 'rate1': hp.uniform（'rate1', 0.001, 1.0）,

'rate2': hp.uniform（'rate2', 0.001, 1.0）,

'percent': hp.uniform（'percent', 0.1, 1.0）}

best_param=fmin（fn=ObjectiveOptimizer, space=space, algo=tpe.suggest,max_evals=max_rounds, trials=Trails（）

以此确定超参数的搜索空间，然后采用贝叶斯优化的方案取得object函数最小下的超参数组合。

比如说，最终得到的针对基础地理单元的四个等级的调参结果可以如下所示：

一级：{'percent':0.11744281378765406, 'rate1':0.18599766858327682,'rate2':0.5007287606931133}。

二级：{'percent':0.3245490282544487, 'rate1': 0.04180421590760723,'rate2':0.06139478657679253}。

三级：{'percent':0.7517425696463437, 'rate1': 0.30408660755205535,'rate2':0.005555217525321576}。

四级：{'percent': 0.4244716326811009, 'rate1':0.541793525737832,'rate2':0.41854132672008815}。

请结合图4、图5及图7至图9，步骤S32具体包括以下步骤：

步骤S3021：使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类，得到聚类结果；

步骤S3022：对聚类结果进行切分，得到初始区块（参见图8）；

步骤S3023：以初始区块为基准，生成聚类区块（参见图9）。

可以理解的，在聚类完成之后，可能会出现不同等级的聚类区块在地理上实际相连的情况，因此需要对其进行切分，从而得到明确区分的初始区块；而此时初始区块还是对基础地理单元的聚合结果，因此是多个六边形的连接组合，相对来说形状并不是非常地规整，因此，以初始区块为基准，生成聚类区块，利于为车站的选址提供更加精准的位置参考信息。

具体的，本实施例中，先取初始区块的最大内含四边形，再取该最大内含四边形的最小外接矩形，从而获得规整的聚类区块。

请参阅参阅图10，需求区域挖掘方法还包括以下步骤：

步骤S4：根据预设区域内的地理信息将聚类区块进行切分（请参阅图11），得到至少一个需求区块，选定需求区块为可用于建立车站的区域。

可以理解的，车站通常是沿着路网等地理位置设置，而聚类区块内可能会存在着很多远离路网等地理位置的区域，因此根据预设区域内的地理信息将聚类区块进行切分得到的需求区块，可以更加贴合车站的选址需求，从而提高本需求区域挖掘方法的实用性。

请结合图10至图11，步骤S4具体包括以下步骤：

步骤S41：根据地理信息对聚类区块进行切分；

步骤S42：将聚类区块中兴趣点数量小于预设阈值的区域删除；

步骤S43：沿着路网两侧生成可行区域；

步骤S44：将完成区域删除的聚类区块与可行区域取交集，得到需求区块。

可以理解的，通过将完成区域删除的聚类区块与可行区域取交集的方式，可以进一步约束需求区块的面积，保证需求区块的精准度和可实施性。

请参阅图12，需求区域挖掘方法还包括以下步骤：

步骤S5：基于需求区块的形状和/或重叠区域和/或面积对需求区块进行优化。可以理解的，此设计利于进一步提高需求区块的精准度和可实施性。

进一步的，基于需求区块的形状对需求区块进行优化指对形状不规则的需求区块进行优化。

具体的，本实施例中，将需求区块的形状优化为矩形。

具体的，本实施例中，基于需求区块的重叠区域对需求区块进行优化指删除部分重叠区域。

进一步的，基于需求区块的面积对需求区块进行优化指去除面积过小的需求区块。本实施例中，去除面积小于25㎡的需求区块。

6、本发明中，所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类，根据聚类结果得到聚类区块之前还包括：对CFSFDP模型进行超参数调节；使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类，根据聚类结果得到聚类区块。可以理解的，在机器学习中，超参数是在开始学习过程之前设置值的参数，而不是通过训练得到的参数数据。通常情况下，需要对超参数进行优化，给学习机选择一组最优超参数，以提高学习的性能和效果，因此，对CFSFDP模型进行超参数调节，利于优化聚类结果，从而得到更符合需求的聚类区块。

以上对本发明实施例公开的一种需求区域挖掘方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制，凡在本发明的原则之内所作的任何修改，等同替换和改进等均应包含本发明的保护范围之内。

Claims

1.一种需求区域挖掘方法，用于在为共享车辆建立车站前进行需求区块的挖掘，以为车站的选址提供参考，其特征在于，包括以下步骤：

2.如权利要求1所述的需求区域挖掘方法，其特征在于，所述根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分，具体包括以下步骤：

采用Uber H3划分基础地理单元；

3.如权利要求1所述的需求区域挖掘方法，其特征在于，所述对同等级的邻近基础地理单元进行聚合，形成需求区域，具体包括以下步骤：

4.如权利要求1所述的需求区域挖掘方法，其特征在于，还包括以下步骤：

5.如权利要求4所述的需求区域挖掘方法，其特征在于，所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类并根据聚类结果得到聚类区块具体包括：

6.如权利要求4所述的需求区域挖掘方法，其特征在于，所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类，根据聚类结果得到聚类区块之前还包括：

对CFSFDP模型进行超参数调节；

7.如权利要求6所述的需求区域挖掘方法，其特征在于，所述使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类，根据聚类结果得到聚类区块，具体包括以下步骤：

对聚类结果进行切分，得到初始区块；

以初始区块为基准，生成聚类区块。

8.如权利要求1所述的需求区域挖掘方法，其特征在于，还包括以下步骤：

9.如权利要求1所述的需求区域挖掘方法，其特征在于，所述根据预设区域内的地理信息将聚类区块进行切分，得到至少一个需求区块，选定需求区块为可用于建立车站的区域，具体包括以下步骤：

根据地理信息对聚类区块进行切分；

将聚类区块中兴趣点数量小于预设阈值的区域删除；

沿着路网两侧生成可行区域；

10.如权利要求1所述的需求区域挖掘方法，其特征在于，所述需求区域挖掘方法还包括以下步骤：