CN114677048A - 一种需求区域挖掘方法 - Google Patents

一种需求区域挖掘方法 Download PDF

Info

Publication number
CN114677048A
CN114677048A CN202210427623.1A CN202210427623A CN114677048A CN 114677048 A CN114677048 A CN 114677048A CN 202210427623 A CN202210427623 A CN 202210427623A CN 114677048 A CN114677048 A CN 114677048A
Authority
CN
China
Prior art keywords
clustering
area
basic geographic
demand
units
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210427623.1A
Other languages
English (en)
Other versions
CN114677048B (zh
Inventor
滕志勇
刘永威
刘丁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Apoco Blue Technology Co ltd
Original Assignee
Beijing Apoco Blue Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Apoco Blue Technology Co ltd filed Critical Beijing Apoco Blue Technology Co ltd
Priority to CN202210427623.1A priority Critical patent/CN114677048B/zh
Publication of CN114677048A publication Critical patent/CN114677048A/zh
Application granted granted Critical
Publication of CN114677048B publication Critical patent/CN114677048B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Finance (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Accounting & Taxation (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Instructional Devices (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据挖掘技术领域,特别涉及一种需求区域挖掘方法,用于在为共享车辆建立车站前进行需求区块的挖掘,以为车站的选址提供参考,包括以下步骤:在预设区域内划分基础地理单元,根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分;对同等级的邻近基础地理单元进行聚合,形成需求区域,用于提供该区域的需求信息,为车站的选址提供参考。可以理解的,先通过预设区域的共享车辆订单量对基础地理单元进行分级,再对同等级的邻近基础地理单元进行聚合,利于保证聚合结果内部不同位置实际的需求是相同或相近的。

Description

一种需求区域挖掘方法
技术领域
本发明涉及数据挖掘技术领域,特别涉及一种需求区域挖掘方法。
背景技术
共享车辆在进行运营时,往往需要在对应的城镇内选定区域来建立车站,以对城镇内的共享车辆进行管理。
而在用来建立车站的区域是不能随意选定的,对于城市内部服务区域划分,需要反应各个不同区域内的需求,目前的方式是把车辆的运营区域按照经纬度分割成一定大小的方形地理块,并按照这个方法去计算各个地理块的停车强度、取车强度、需求强度等信息,再结合这些信息选定需求区块。
但该方案存在的问题是,对于一般的区域来说,分割后获得的地理块面积过小,通常需要聚合周围的多个邻居块的统计数据来进行训练和推理。而对于热点区域来说,分割后获得的地理块来说过大,特别是在热门建筑物附近,容易出现实际上同一地理块内部不同位置实际的需求不同的情况。
发明内容
为解决同一地理块内部不同位置实际的需求可能不同的问题,本发明提供了一种需求区域挖掘方法。
本发明解决技术问题的方案是提供一种需求区域挖掘方法,用于在为共享车辆建立车站前进行需求区块的挖掘,以为车站的选址提供参考,包括以下步骤:
在预设区域内划分基础地理单元,根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分;
对同等级的邻近基础地理单元进行聚合,形成需求区域,用于提供该区域的需求信息,为车站的选址提供参考。
优选地,所述根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分,具体包括以下步骤:
采用Uber H3划分基础地理单元;
获取每个基础地理单元在预定期限内的订单量,以所有订单量的分位数作为阈值,将对应的基础地理单元划分为不同的等级。
优选地,所述对同等级的邻近基础地理单元进行聚合,形成需求区域,具体包括以下步骤:
选定初始基础地理单元,对初始基础地理单元的所有邻接基础地理单元进行遍历,将与初始基础地理单元等级相同的基础地理单元确定为拟聚合基础地理单元,并与初始基础地理单元进行聚合得到初始聚合区域;
对每一拟聚合基础地理单元的所有邻接基础地理单元进行遍历,并将与该拟聚合基础地理单元等级相同的基础地理单元与该拟聚合基础地理单元进行聚合,直至每一拟聚合基础地理单元的邻接基础地理单元中不存在与该拟聚合基础地理单元等级相同的基础地理单元而得到单个或多个二次聚合区域,将初始聚合区域与得到的二次聚合区域聚合得到同等级基础地理单元的聚合形成需求区域。
优选地,所述需求区域挖掘方法还包括以下步骤:
在需求区域内,使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类,根据聚类结果得到聚类区块。
优选地,所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类并根据聚类结果得到聚类区块具体包括:
基于密度峰值确定需求区域的中心,并根据需求区域内各个基础地理单元的局部密度及其到中心的距离进行聚类,从而得到聚类区块。
优选地,所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类,根据聚类结果得到聚类区块之前还包括:
对CFSFDP模型进行超参数调节;
使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,根据聚类结果得到聚类区块。
优选地,所述使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,根据聚类结果得到聚类区块,具体包括以下步骤:
使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,得到聚类结果;
对聚类结果进行切分,得到初始区块;
以初始区块为基准,生成聚类区块。
优选地,所述需求区域挖掘方法还包括以下步骤:
根据预设区域内的地理信息将聚类区块进行切分,得到至少一个需求区块,选定需求区块为可用于建立车站的区域。
优选地,所述根据预设区域内的地理信息将聚类区块进行切分,得到至少一个需求区块,选定需求区块为可用于建立车站的区域,具体包括以下步骤:
根据地理信息对聚类区块进行切分;
将聚类区块中兴趣点数量小于预设阈值的区域删除;
沿着路网两侧生成可行区域;
将完成区域删除的聚类区块与可行区域取交集,得到需求区块。
优选地,所述需求区域挖掘方法还包括以下步骤:
基于需求区块的形状和/或重叠区域和/或面积对需求区块进行优化。
与现有技术相比,本发明的需求区域挖掘方法具有以下优点:
1、需求区域挖掘方法,用于在为共享车辆建立车站前进行需求区块的挖掘,以为车站的选址提供参考,包括以下步骤:在预设区域内划分基础地理单元,根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分;对同等级的邻近基础地理单元进行聚合,形成需求区域,用于提供该区域的需求信息,为车站的选址提供参考。可以理解的,先通过预设区域内各个基础地理单元对应的的共享车辆订单量对基础地理单元进行分级,再对同等级的邻近基础地理单元进行聚合,利于保证聚合结果内部不同位置的实际需求是相同或相近的,从而保证所挖掘的需求区域的精准度。
2、本发明中,所述根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分,得到多个等级相同或不同的基础地理单元,具体包括以下步骤:采用UberH3划分基础地理单元;获取每个基础地理单元在预定期限内的订单量,以所有订单量的分位数作为阈值,将对应的基础地理单元划分为不同的等级。可以理解的,Uber H3摒弃了传统的地图投影方式,直接在地球上铺满六边形,采用多层网格映射的方式来建立基础地理单元,可以有效地避免现有的基础地理单元划分方式存在的不同精度下网格的形状不一且精度的变化幅度时小时大以及邻域到中心网格的距离不相等的问题;利于提高划分基础地理单元的精准度,从而提高本需求区域挖掘方法的精准度。
3、本发明中,所述对同等级的邻近基础地理单元进行聚合,形成需求区域,具体包括以下步骤:选定初始基础地理单元,对初始基础地理单元的所有邻接基础地理单元进行遍历,将与初始基础地理单元等级相同的基础地理单元确定为拟聚合基础地理单元,并与初始基础地理单元进行聚合得到初始聚合区域;对每一拟聚合基础地理单元的所有邻接基础地理单元进行遍历,并将与该拟聚合基础地理单元等级相同的基础地理单元与该拟聚合基础地理单元进行聚合,直至每一拟聚合基础地理单元的邻接基础地理单元中不存在与该拟聚合基础地理单元等级相同的基础地理单元而得到单个或多个二次聚合区域,将初始聚合区域与得到的二次聚合区域聚合得到同等级基础地理单元的聚合形成需求区域。可以理解的,通过对基础地理单元进行遍历的方式,可以保证将所有的邻近同等级基础地理单元进行聚合,不会出现遗漏的情况,可靠性高。
4、本发明的需求区域挖掘方法还包括以下步骤:在需求区域内,使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类,根据聚类结果得到聚类区块。可以理解的,通过密度峰值聚类算法模型CFSFDP计算获得的聚类区块形状更加规整,利于为车站的选址提供更加精准的位置参考信息。
5、所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类并根据聚类结果得到聚类区块具体包括:基于密度峰值确定需求区域的中心,并根据需求区域内各个基础地理单元的局部密度及其到中心的距离进行聚类,从而得到聚类区块。可以理解的,通过密度峰值聚类算法模型CFSFDP计算获得的聚类区块通过基于密度峰值确定需求区域的中心,并根据局部密度及距离进行聚类,去除噪音,可以让得到的聚类区块形状更加规整,利于为车站的选址提供更加精准的位置参考信息。
6、本发明中,所述所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类,根据聚类结果得到聚类区块之前还包括:对CFSFDP模型进行超参数调节;使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,根据聚类结果得到聚类区块。可以理解的,在机器学习中,超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果,因此,对CFSFDP模型进行超参数调节,利于优化聚类结果,从而得到更符合需求的聚类区块。
7、本发明中,所述使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,根据聚类结果得到聚类区块,具体包括以下步骤:使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,得到聚类结果;对聚类结果进行切分,得到初始区块;以初始区块为基准,生成聚类区块。可以理解的,在聚类完成之后,可能会出现不同等级的聚类区块在地理上实际相连的情况,因此需要对其进行切分,从而得到明确区分的初始区块;而此时初始区块还是对基础地理单元的聚合结果,因此是多个六边形的连接组合,相对来说形状并不是非常地规整,因此,以初始区块为基准,生成聚类区块,利于为车站的选址提供更加精准的位置参考信息。
8、本发明的需求区域挖掘方法还包括以下步骤:根据预设区域内的地理信息将聚类区块进行切分,得到至少一个需求区块,选定需求区块为可用于建立车站的区域。可以理解的,车站通常是沿着路网等地理位置设置,而聚类区块内可能会存在着很多远离路网等地理位置的区域,因此根据预设区域内的地理信息将聚类区块进行切分得到的需求区块,可以更加贴合车站的选址需求,从而提高本需求区域挖掘方法的实用性。
9、本发明中,所述根据预设区域内的地理信息将聚类区块进行切分,得到至少一个需求区块,选定需求区块为可用于建立车站的区域,具体包括以下步骤:根据地理信息对聚类区块进行切分;
将聚类区块中兴趣点数量小于预设阈值的区域删除;沿着路网两侧生成可行区域;将完成区域删除的聚类区块与可行区域取交集,得到需求区块。可以理解的,通过将完成区域删除的聚类区块与可行区域取交集的方式,可以进一步约束需求区块的面积,保证需求区块的精准度和可实施性。
10、本发明的需求区域挖掘方法还包括以下步骤:基于需求区块的形状和/或重叠区域和/或面积对需求区块进行优化。此设计利于进一步提高需求区块的精准度和可实施性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明第一实施例提供的需求区域挖掘方法流程图。
图2是本发明第一实施例提供的需求区域挖掘方法流之S1的流程图。
图3是本发明第一实施例提供的需求区域挖掘方法流之S2的流程图。
图4是本发明第一实施例提供的另一需求区域挖掘方法流程图。
图5是本发明第一实施例提供的需求区域挖掘方法流之S3的前序步骤的流程图。
图6是本发明第一实施例提供的需求区域挖掘方法流之S301的流程图。
图7是本发明第一实施例提供的需求区域挖掘方法流之S302的流程图。
图8是本发明第一实施例提供的另一需求区域挖掘方法中聚类结果进行切分后的示意图。
图9是本发明第一实施例提供的另一需求区域挖掘方法中生成规整的聚类区块的示意图。
图10是本发明第一实施例提供的另一需求区域挖掘方法流程图。
图11是本发明第一实施例提供的需求区域挖掘方法流之S4的流程图。
图12是本发明第一实施例提供的另一需求区域挖掘方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施实例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本文所使用的术语“垂直的”、“水平的”、“左”、“右”、“上”、“下”、“左上”、“右上”、“左下”、“右下”以及类似的表述只是为了说明的目的。
请参阅图1,本发明第一实施例提供一种需求区域挖掘方法,用于在为共享车辆建立车站前进行需求区块的挖掘,以为车站的选址提供参考,包括以下步骤:
步骤S1:在预设区域内划分基础地理单元,根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分;
步骤S2:对同等级的邻近基础地理单元进行聚合,形成需求区域,用于提供该区域的需求信息,为车站的选址提供参考。
可以理解的,先通过预设区域内各个基础地理单元对应的的共享车辆订单量对基础地理单元进行分级,再对同等级的邻近基础地理单元进行聚合,利于保证聚合结果内部不同位置的实际需求是相同或相近的,从而保证所挖掘的需求区域的精准度。不难理解,由于基础地理单元的分级是基于预设区域在预定期限内的共享车辆订单量进行的,因此同等级的基础地理单元在预定期限内的共享车辆订单量是相近的,从而由这些基础地理单元聚合合成的需求区域在不同位置的实际需求是相同或相近的。
需要说明的是,预设区域可以是任意可供电动车辆运营的区域。具体的,本实施例中,预设区域界定为城市内的一个区。
具体的,本实施例中,预定期限为过去的一年。可以理解的,在其他实施例中,预定期限可以是任意可以产生累计订单量的时间段。
请结合图1和图2,步骤S1具体包括以下步骤:
步骤S11:采用Uber H3(Uber’s Hexagonal Hierarchical Spatial Index)划分基础地理单元;Uber H3是一种六边形分层索引网格系统。
步骤S12:获取每个基础地理单元在预定期限内的订单量,以所有订单量的分位数作为阈值,将对应的基础地理单元划分为不同的等级。
可以理解的,Uber H3摒弃了传统的地图投影方式,直接在地球上铺满六边形,采用多层网格映射的方式来建立基础地理单元,可以有效地避免现有的基础地理单元划分方式存在的不同精度下网格的形状不一且精度的变化幅度时小时大以及邻域到中心网格的距离不相等的问题;利于提高划分基础地理单元的精准度,从而提高本需求区域挖掘方法的精准度。
进一步的,在对基础地理单元进行等级划分时,以所有订单量的四分位数作为阈值,从而将基础地理单元分为四个不同等级。可以理解的,在其他实施例中,也可以采用其他的分位数作为阈值,从而划分更多或更少的等级。
请结合图1和图3,步骤S2具体包括以下步骤:
步骤S21:选定初始基础地理单元,对初始基础地理单元的所有邻接基础地理单元进行遍历,将与初始基础地理单元等级相同的基础地理单元确定为拟聚合基础地理单元,并与初始基础地理单元进行聚合得到初始聚合区域;
步骤S22:对每一拟聚合基础地理单元的所有邻接基础地理单元进行遍历,并将与该拟聚合基础地理单元等级相同的基础地理单元与该拟聚合基础地理单元进行聚合,直至每一拟聚合基础地理单元的邻接基础地理单元中不存在与该拟聚合基础地理单元等级相同的基础地理单元而得到单个或多个二次聚合区域,将初始聚合区域与得到的二次聚合区域聚合得到同等级基础地理单元的聚合形成需求区域。
可以理解的,通过对基础地理单元进行遍历的方式,可以保证将所有的邻近同等级基础地理单元进行聚合,不会出现遗漏的情况,可靠性高。
需要说明的是,遍历是指沿着某条搜索路线,依次对树或图中每个节点均做一次访问。在本实施例中,则是沿预定路线对与初始基础地理单元相邻的基础地理单元进行访问。
可选的,预定路线可以是沿顺时针方向或逆时针方向的路线,也可以是按其他规则制定的路线,比如说先东方,后西方,然后再南北,只要确保能完成对初始基础地理单元相邻的全部基础地理单元的访问即可。
可以理解的,在步骤S22中,若被聚合的基础地理单元的所有邻接基础地理单元中存在已被遍历的基础地理单元,则可以放弃对该基础地理单元的遍历操作。
可选的,初始基础地理单元可以为单个或多个。具体的,本实施例中,在实行步骤S21时,会同时选择多个初始基础地理单元。
请参阅图4,需求区域挖掘方法还包括以下步骤:
步骤S3:在需求区域内,使用密度峰值聚类算法模型CFSFDP(Clustering by fastsearch and find of density peaks)对基础地理单元进行聚类,根据聚类结果得到聚类区块。
可以理解的,通过密度峰值聚类算法模型CFSFDP计算获得的聚类区块形状更加规整,利于为车站的选址提供更加精准的位置参考信息。
进一步的,步骤S3具体包括:
S31:基于密度峰值确定需求区域的中心,并根据需求区域内各个基础地理单元的局部密度及其到中心的距离进行聚类,从而得到聚类区块。
可以理解的,由于CFSFDP能够识别非凸的聚类簇且能够支持多维的数据特征嵌入,所以采用CFSFDP能很好地完成对历史订单坐标点的聚类。通过密度峰值聚类算法模型CFSFDP计算获得的聚类区块通过基于密度峰值确定需求区域的中心,并根据局部密度及距离进行聚类,去除噪音,可以让得到的聚类区块形状更加规整,利于为车站的选址提供更加精准的位置参考信息。
请结合图4和图5,在步骤S3之前还包括以下步骤:
步骤S301:对CFSFDP模型进行超参数调节;
步骤S302:使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,根据聚类结果得到聚类区块。
可以理解的,在机器学习中,超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果,因此,对CFSFDP模型进行超参数调节,利于优化聚类结果,从而得到更符合需求的聚类区块。
进一步的,针对基础地理单元的不同等级需要分别预设一组超参数。
进一步的,预设的超参数包括比例percent及邻近基础地理单元到中心的截断距离阈值rate1和密度阈值rate2。其中,比例percent用于辅助求取截断距离阈值rate1。
比如说,假设点对(i,j)的数量为n,点对(i,j)的距离为d(i,j)。先将点对d(i,j)从小到大排序得到排序后列表D,然后计算pos = percent * n,截断距离dc = D[pos]。其中,pos是位置索引。D是排序后的列表,D[pos]是取对于索引的元素。
请结合图4至图6,步骤S31具体包括以下步骤:
步骤S3011:定义最小化算法优化函数,设定随机采样比例,计算每一个采样的损失,进而确定全局损失,从而最小化全局损失获得全局较优的参数组合;
步骤S3012:针对超参数建立多目标优化函数;
步骤S3013:确定超参数的搜索空间,然后采用贝叶斯优化的方案取得多目标优化函数最小时的超参数组合。
可以理解的,通过定义最小化算法优化函数,利于最小化地优化全局损失,从而获得全局较优的参数组合,避免出现只能实现局部最优的情况。
进一步的,步骤S3011具体包括以下步骤:
S30111:定义最小化算法优化函数GlobalAssessment:
sample_loss = Sum(daviesbouldinscore)
其中,需设定随机采样比例,计算每一个采样的loss,进而确定全局损失global_loss,从而最小化优化全局损失获得全局较优的参数组合;
S30112:定义object函数ObjectiveOptimizer:
{'loss': global_loss, 'params': params, 'status': STATUS_OK}
用于确定global_loss和params的映射组合;
S3113:进行贝叶斯优化HyperoptSearch:
space =
{ 'rate1': hp.uniform('rate1', 0.001, 1.0),
'rate2': hp.uniform('rate2', 0.001, 1.0),
'percent': hp.uniform('percent', 0.1, 1.0)}
best_param=fmin(fn=ObjectiveOptimizer, space=space, algo=tpe.suggest,max_evals=max_rounds, trials=Trails()
以此确定超参数的搜索空间,然后采用贝叶斯优化的方案取得object函数最小下的超参数组合。
比如说,最终得到的针对基础地理单元的四个等级的调参结果可以如下所示:
一级:{'percent':0.11744281378765406, 'rate1':0.18599766858327682,'rate2':0.5007287606931133}。
二级:{'percent':0.3245490282544487, 'rate1': 0.04180421590760723,'rate2':0.06139478657679253}。
三级:{'percent':0.7517425696463437, 'rate1': 0.30408660755205535,'rate2':0.005555217525321576}。
四级:{'percent': 0.4244716326811009, 'rate1':0.541793525737832,'rate2':0.41854132672008815}。
请结合图4、图5及图7至图9,步骤S32具体包括以下步骤:
步骤S3021:使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,得到聚类结果;
步骤S3022:对聚类结果进行切分,得到初始区块(参见图8);
步骤S3023:以初始区块为基准,生成聚类区块(参见图9)。
可以理解的,在聚类完成之后,可能会出现不同等级的聚类区块在地理上实际相连的情况,因此需要对其进行切分,从而得到明确区分的初始区块;而此时初始区块还是对基础地理单元的聚合结果,因此是多个六边形的连接组合,相对来说形状并不是非常地规整,因此,以初始区块为基准,生成聚类区块,利于为车站的选址提供更加精准的位置参考信息。
具体的,本实施例中,先取初始区块的最大内含四边形,再取该最大内含四边形的最小外接矩形,从而获得规整的聚类区块。
请参阅参阅图10,需求区域挖掘方法还包括以下步骤:
步骤S4:根据预设区域内的地理信息将聚类区块进行切分(请参阅图11),得到至少一个需求区块,选定需求区块为可用于建立车站的区域。
可以理解的,车站通常是沿着路网等地理位置设置,而聚类区块内可能会存在着很多远离路网等地理位置的区域,因此根据预设区域内的地理信息将聚类区块进行切分得到的需求区块,可以更加贴合车站的选址需求,从而提高本需求区域挖掘方法的实用性。
请结合图10至图11,步骤S4具体包括以下步骤:
步骤S41:根据地理信息对聚类区块进行切分;
步骤S42:将聚类区块中兴趣点数量小于预设阈值的区域删除;
步骤S43:沿着路网两侧生成可行区域;
步骤S44:将完成区域删除的聚类区块与可行区域取交集,得到需求区块。
可以理解的,通过将完成区域删除的聚类区块与可行区域取交集的方式,可以进一步约束需求区块的面积,保证需求区块的精准度和可实施性。
请参阅图12,需求区域挖掘方法还包括以下步骤:
步骤S5:基于需求区块的形状和/或重叠区域和/或面积对需求区块进行优化。可以理解的,此设计利于进一步提高需求区块的精准度和可实施性。
进一步的,基于需求区块的形状对需求区块进行优化指对形状不规则的需求区块进行优化。
具体的,本实施例中,将需求区块的形状优化为矩形。
具体的,本实施例中,基于需求区块的重叠区域对需求区块进行优化指删除部分重叠区域。
进一步的,基于需求区块的面积对需求区块进行优化指去除面积过小的需求区块。本实施例中,去除面积小于25㎡的需求区块。
与现有技术相比,本发明的需求区域挖掘方法具有以下优点:
1、需求区域挖掘方法,用于在为共享车辆建立车站前进行需求区块的挖掘,以为车站的选址提供参考,包括以下步骤:在预设区域内划分基础地理单元,根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分;对同等级的邻近基础地理单元进行聚合,形成需求区域,用于提供该区域的需求信息,为车站的选址提供参考。可以理解的,先通过预设区域内各个基础地理单元对应的的共享车辆订单量对基础地理单元进行分级,再对同等级的邻近基础地理单元进行聚合,利于保证聚合结果内部不同位置的实际需求是相同或相近的,从而保证所挖掘的需求区域的精准度。
2、本发明中,所述根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分,得到多个等级相同或不同的基础地理单元,具体包括以下步骤:采用UberH3划分基础地理单元;获取每个基础地理单元在预定期限内的订单量,以所有订单量的分位数作为阈值,将对应的基础地理单元划分为不同的等级。可以理解的,Uber H3摒弃了传统的地图投影方式,直接在地球上铺满六边形,采用多层网格映射的方式来建立基础地理单元,可以有效地避免现有的基础地理单元划分方式存在的不同精度下网格的形状不一且精度的变化幅度时小时大以及邻域到中心网格的距离不相等的问题;利于提高划分基础地理单元的精准度,从而提高本需求区域挖掘方法的精准度。
3、本发明中,所述对同等级的邻近基础地理单元进行聚合,形成需求区域,具体包括以下步骤:选定初始基础地理单元,对初始基础地理单元的所有邻接基础地理单元进行遍历,将与初始基础地理单元等级相同的基础地理单元确定为拟聚合基础地理单元,并与初始基础地理单元进行聚合得到初始聚合区域;对每一拟聚合基础地理单元的所有邻接基础地理单元进行遍历,并将与该拟聚合基础地理单元等级相同的基础地理单元与该拟聚合基础地理单元进行聚合,直至每一拟聚合基础地理单元的邻接基础地理单元中不存在与该拟聚合基础地理单元等级相同的基础地理单元而得到单个或多个二次聚合区域,将初始聚合区域与得到的二次聚合区域聚合得到同等级基础地理单元的聚合形成需求区域。可以理解的,通过对基础地理单元进行遍历的方式,可以保证将所有的邻近同等级基础地理单元进行聚合,不会出现遗漏的情况,可靠性高。
4、本发明的需求区域挖掘方法还包括以下步骤:在需求区域内,使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类,根据聚类结果得到聚类区块。可以理解的,通过密度峰值聚类算法模型CFSFDP计算获得的聚类区块形状更加规整,利于为车站的选址提供更加精准的位置参考信息。
5、所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类并根据聚类结果得到聚类区块具体包括:基于密度峰值确定需求区域的中心,并根据需求区域内各个基础地理单元的局部密度及其到中心的距离进行聚类,从而得到聚类区块。可以理解的,通过密度峰值聚类算法模型CFSFDP计算获得的聚类区块通过基于密度峰值确定需求区域的中心,并根据局部密度及距离进行聚类,去除噪音,可以让得到的聚类区块形状更加规整,利于为车站的选址提供更加精准的位置参考信息。
6、本发明中,所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类,根据聚类结果得到聚类区块之前还包括:对CFSFDP模型进行超参数调节;使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,根据聚类结果得到聚类区块。可以理解的,在机器学习中,超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果,因此,对CFSFDP模型进行超参数调节,利于优化聚类结果,从而得到更符合需求的聚类区块。
7、本发明中,所述使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,根据聚类结果得到聚类区块,具体包括以下步骤:使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,得到聚类结果;对聚类结果进行切分,得到初始区块;以初始区块为基准,生成聚类区块。可以理解的,在聚类完成之后,可能会出现不同等级的聚类区块在地理上实际相连的情况,因此需要对其进行切分,从而得到明确区分的初始区块;而此时初始区块还是对基础地理单元的聚合结果,因此是多个六边形的连接组合,相对来说形状并不是非常地规整,因此,以初始区块为基准,生成聚类区块,利于为车站的选址提供更加精准的位置参考信息。
8、本发明的需求区域挖掘方法还包括以下步骤:根据预设区域内的地理信息将聚类区块进行切分,得到至少一个需求区块,选定需求区块为可用于建立车站的区域。可以理解的,车站通常是沿着路网等地理位置设置,而聚类区块内可能会存在着很多远离路网等地理位置的区域,因此根据预设区域内的地理信息将聚类区块进行切分得到的需求区块,可以更加贴合车站的选址需求,从而提高本需求区域挖掘方法的实用性。
9、本发明中,所述根据预设区域内的地理信息将聚类区块进行切分,得到至少一个需求区块,选定需求区块为可用于建立车站的区域,具体包括以下步骤:根据地理信息对聚类区块进行切分;
将聚类区块中兴趣点数量小于预设阈值的区域删除;沿着路网两侧生成可行区域;将完成区域删除的聚类区块与可行区域取交集,得到需求区块。可以理解的,通过将完成区域删除的聚类区块与可行区域取交集的方式,可以进一步约束需求区块的面积,保证需求区块的精准度和可实施性。
10、本发明的需求区域挖掘方法还包括以下步骤:基于需求区块的形状和/或重叠区域和/或面积对需求区块进行优化。此设计利于进一步提高需求区块的精准度和可实施性。
以上对本发明实施例公开的一种需求区域挖掘方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制,凡在本发明的原则之内所作的任何修改,等同替换和改进等均应包含本发明的保护范围之内。

Claims (10)

1.一种需求区域挖掘方法,用于在为共享车辆建立车站前进行需求区块的挖掘,以为车站的选址提供参考,其特征在于,包括以下步骤:
在预设区域内划分基础地理单元,根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分;
对同等级的邻近基础地理单元进行聚合,形成需求区域,用于提供该区域的需求信息,为车站的选址提供参考。
2.如权利要求1所述的需求区域挖掘方法,其特征在于,所述根据预设区域在预定期限内的共享车辆订单量对基础地理单元进行等级划分,具体包括以下步骤:
采用Uber H3划分基础地理单元;
获取每个基础地理单元在预定期限内的订单量,以所有订单量的分位数作为阈值,将对应的基础地理单元划分为不同的等级。
3.如权利要求1所述的需求区域挖掘方法,其特征在于,所述对同等级的邻近基础地理单元进行聚合,形成需求区域,具体包括以下步骤:
选定初始基础地理单元,对初始基础地理单元的所有邻接基础地理单元进行遍历,将与初始基础地理单元等级相同的基础地理单元确定为拟聚合基础地理单元,并与初始基础地理单元进行聚合得到初始聚合区域;
对每一拟聚合基础地理单元的所有邻接基础地理单元进行遍历,并将与该拟聚合基础地理单元等级相同的基础地理单元与该拟聚合基础地理单元进行聚合,直至每一拟聚合基础地理单元的邻接基础地理单元中不存在与该拟聚合基础地理单元等级相同的基础地理单元而得到单个或多个二次聚合区域,将初始聚合区域与得到的二次聚合区域聚合得到同等级基础地理单元的聚合形成需求区域。
4.如权利要求1所述的需求区域挖掘方法,其特征在于,还包括以下步骤:
在需求区域内,使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类,根据聚类结果得到聚类区块。
5.如权利要求4所述的需求区域挖掘方法,其特征在于,所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类并根据聚类结果得到聚类区块具体包括:
基于密度峰值确定需求区域的中心,并根据需求区域内各个基础地理单元的局部密度及其到中心的距离进行聚类,从而得到聚类区块。
6.如权利要求4所述的需求区域挖掘方法,其特征在于,所述使用密度峰值聚类算法模型CFSFDP对基础地理单元进行聚类,根据聚类结果得到聚类区块之前还包括:
对CFSFDP模型进行超参数调节;
使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,根据聚类结果得到聚类区块。
7.如权利要求6所述的需求区域挖掘方法,其特征在于,所述使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,根据聚类结果得到聚类区块,具体包括以下步骤:
使用调节完超参数后的CFSFDP模型对基础地理单元进行聚类,得到聚类结果;
对聚类结果进行切分,得到初始区块;
以初始区块为基准,生成聚类区块。
8.如权利要求1所述的需求区域挖掘方法,其特征在于,还包括以下步骤:
根据预设区域内的地理信息将聚类区块进行切分,得到至少一个需求区块,选定需求区块为可用于建立车站的区域。
9.如权利要求1所述的需求区域挖掘方法,其特征在于,所述根据预设区域内的地理信息将聚类区块进行切分,得到至少一个需求区块,选定需求区块为可用于建立车站的区域,具体包括以下步骤:
根据地理信息对聚类区块进行切分;
将聚类区块中兴趣点数量小于预设阈值的区域删除;
沿着路网两侧生成可行区域;
将完成区域删除的聚类区块与可行区域取交集,得到需求区块。
10.如权利要求1所述的需求区域挖掘方法,其特征在于,所述需求区域挖掘方法还包括以下步骤:
基于需求区块的形状和/或重叠区域和/或面积对需求区块进行优化。
CN202210427623.1A 2022-04-22 2022-04-22 一种需求区域挖掘方法 Active CN114677048B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210427623.1A CN114677048B (zh) 2022-04-22 2022-04-22 一种需求区域挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210427623.1A CN114677048B (zh) 2022-04-22 2022-04-22 一种需求区域挖掘方法

Publications (2)

Publication Number Publication Date
CN114677048A true CN114677048A (zh) 2022-06-28
CN114677048B CN114677048B (zh) 2024-01-16

Family

ID=82079612

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210427623.1A Active CN114677048B (zh) 2022-04-22 2022-04-22 一种需求区域挖掘方法

Country Status (1)

Country Link
CN (1) CN114677048B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103295394A (zh) * 2013-06-24 2013-09-11 东南大学 基于广义gps数据的出租车候客站点备选地址确定方法
CN107168263A (zh) * 2017-06-16 2017-09-15 江南大学 一种基于大数据挖掘的针织mes生产计划与调度方法
CN107369317A (zh) * 2017-08-31 2017-11-21 曹珠艳 一种引导车辆停放的系统、方法和设备
CN108427965A (zh) * 2018-03-05 2018-08-21 重庆邮电大学 一种基于路网聚类的热点区域挖掘方法
CN108898239A (zh) * 2018-05-29 2018-11-27 贵州黔驰信息股份有限公司 一种基于数据分析的配电变压器选址方法
US20190012755A1 (en) * 2017-07-10 2019-01-10 Benjamin Williams Multi-driver, multi-law enforcement officer tracking, mapping, matching, and communication system for traffic stops using encrypted volunteered driver information
CN109887324A (zh) * 2019-03-13 2019-06-14 南京理工大学 一种基于区块链的停车位共享系统及方法
CN109949088A (zh) * 2019-03-15 2019-06-28 中科钢研节能科技有限公司 一种新共享经济项目自动挖掘分析方法
CN110288263A (zh) * 2019-07-03 2019-09-27 北京首汽智行科技有限公司 一种基于用车行为的共享汽车停车网点确定方法
CN112115385A (zh) * 2020-08-25 2020-12-22 北京交通大学 一种考虑充电时间的单向共享汽车系统选址优化方法
CN112131330A (zh) * 2020-09-16 2020-12-25 上海交通大学 一种自由流动模式下共享汽车的运营区域选址布局方法
US20210073711A1 (en) * 2018-04-20 2021-03-11 Kobelco Construction Machinery Co., Ltd. Work selection system and work selection method
CN113077181A (zh) * 2021-04-22 2021-07-06 上海钧正网络科技有限公司 一种停车站点设置方法、装置、介质及电子设备
CN113283754A (zh) * 2021-05-27 2021-08-20 哈尔滨工业大学(深圳) 一种车站选址方法、装置、计算设备和存储介质
CN113393030A (zh) * 2021-06-11 2021-09-14 上海钧正网络科技有限公司 车辆运营区域潜力站点选址方法、系统、终端及介质

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103295394A (zh) * 2013-06-24 2013-09-11 东南大学 基于广义gps数据的出租车候客站点备选地址确定方法
CN107168263A (zh) * 2017-06-16 2017-09-15 江南大学 一种基于大数据挖掘的针织mes生产计划与调度方法
US20190012755A1 (en) * 2017-07-10 2019-01-10 Benjamin Williams Multi-driver, multi-law enforcement officer tracking, mapping, matching, and communication system for traffic stops using encrypted volunteered driver information
CN107369317A (zh) * 2017-08-31 2017-11-21 曹珠艳 一种引导车辆停放的系统、方法和设备
CN108427965A (zh) * 2018-03-05 2018-08-21 重庆邮电大学 一种基于路网聚类的热点区域挖掘方法
US20210073711A1 (en) * 2018-04-20 2021-03-11 Kobelco Construction Machinery Co., Ltd. Work selection system and work selection method
CN108898239A (zh) * 2018-05-29 2018-11-27 贵州黔驰信息股份有限公司 一种基于数据分析的配电变压器选址方法
CN109887324A (zh) * 2019-03-13 2019-06-14 南京理工大学 一种基于区块链的停车位共享系统及方法
CN109949088A (zh) * 2019-03-15 2019-06-28 中科钢研节能科技有限公司 一种新共享经济项目自动挖掘分析方法
CN110288263A (zh) * 2019-07-03 2019-09-27 北京首汽智行科技有限公司 一种基于用车行为的共享汽车停车网点确定方法
CN112115385A (zh) * 2020-08-25 2020-12-22 北京交通大学 一种考虑充电时间的单向共享汽车系统选址优化方法
CN112131330A (zh) * 2020-09-16 2020-12-25 上海交通大学 一种自由流动模式下共享汽车的运营区域选址布局方法
CN113077181A (zh) * 2021-04-22 2021-07-06 上海钧正网络科技有限公司 一种停车站点设置方法、装置、介质及电子设备
CN113283754A (zh) * 2021-05-27 2021-08-20 哈尔滨工业大学(深圳) 一种车站选址方法、装置、计算设备和存储介质
CN113393030A (zh) * 2021-06-11 2021-09-14 上海钧正网络科技有限公司 车辆运营区域潜力站点选址方法、系统、终端及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋丽华;: "客车企业的订单管理及发展趋势", 人民公交, no. 12 *

Also Published As

Publication number Publication date
CN114677048B (zh) 2024-01-16

Similar Documents

Publication Publication Date Title
CN110677859B (zh) 弱覆盖区域的确定方法、装置和计算机可读存储介质
JP5081734B2 (ja) 交通情報を生成するための交通情報提供システム、及び、カーナビゲーションシステム
CN105160889B (zh) 一种城市内涝情景下路网交通流的多源点协同疏导方法
CN110688442A (zh) 一种基于多层网格分块的电子地图点位聚合方法
CN111581325B (zh) 一种基于时空影响距离的K-means站点区域划分方法
CN113222271B (zh) 综合交通运输体系下的中小机场选址布局方法
CN116542709A (zh) 一种基于交通态势感知的电动汽车充电站规划分析方法
CN110659774B (zh) 大数据方法驱动的停车需求预测方法
CN116703132B (zh) 共享车辆动态调度的管理方法、装置及计算机设备
CN105741280A (zh) 一种模糊数学矢量分区评价方法及装置
CN114677048A (zh) 一种需求区域挖掘方法
CN111008730B (zh) 基于城市空间结构的人群聚集度预测模型构建方法及装置
Mahmud et al. Facility location models development to maximize total service area
CN114877901B (zh) 基于地图栅格化融合与A-star搜索的城市应急路径规划方法
CN113516732B (zh) 一种基于金字塔的散点图采样方法及系统
AU2021102429A4 (en) Method for selecting roads in a small-mesh accumulation area
CN114999162A (zh) 一种道路交通流量获取方法和装置
CN108090617A (zh) 一种城市内涝监测点的优化布置方法
Liang et al. Optimizing bus stop spacing using the simulated annealing algorithm with spatial interaction coverage model
CN110738373A (zh) 一种土地交通生成和分布预测方法及系统
Mirzahossein et al. Land-Use Modification Based on Transit-Oriented Development Adjacent to Historical Context (Case Study: Qazvin City)
CN111915889A (zh) 一种基于遗传蚁群混合算法的车联网路侧单元部署方法
CN111639805A (zh) 一种基于gis的垃圾填埋场的选址方法
Hanna Route choice from local information: Comparing theories of movement and intelligibility
CN113886507B (zh) 一种基于动态网格划分的轨道交通站点选址预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant