CN113570004A - 一种乘车热点区域预测方法、装置、设备及可读存储介质 - Google Patents

一种乘车热点区域预测方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN113570004A
CN113570004A CN202111117958.5A CN202111117958A CN113570004A CN 113570004 A CN113570004 A CN 113570004A CN 202111117958 A CN202111117958 A CN 202111117958A CN 113570004 A CN113570004 A CN 113570004A
Authority
CN
China
Prior art keywords
information
cluster
clustering
value
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111117958.5A
Other languages
English (en)
Other versions
CN113570004B (zh
Inventor
杨柳
梁琨
李昕陆
唐优华
马征
刘恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Jiaoda Big Data Technology Co ltd
Southwest Jiaotong University
Original Assignee
Chengdu Jiaoda Big Data Technology Co ltd
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Jiaoda Big Data Technology Co ltd, Southwest Jiaotong University filed Critical Chengdu Jiaoda Big Data Technology Co ltd
Priority to CN202111117958.5A priority Critical patent/CN113570004B/zh
Publication of CN113570004A publication Critical patent/CN113570004A/zh
Application granted granted Critical
Publication of CN113570004B publication Critical patent/CN113570004B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及数据处理技术领域,具体而言,涉及一种乘车热点区域预测方法、装置、设备及可读存储介质,将需要聚类时间段的车辆载客信息进行处理,然后使用OPTICS聚类算法进行聚类,得到车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息;将所述每个所述聚类簇的对象个数与第一阈值进行对比,若所述聚类簇中的对象个数大于所述第一阈值,则将对象个数大于所述第一阈值的聚类簇输入第二模型,得到最佳K值,所述K值为所述聚类簇中心的数量;将所述最佳K值使用K‑means算法对所述第二信息进行聚类,得到为乘车的热点区域。本发明通过对车辆车载信息进行处理,然后进行二次聚类,以此来预测在给定时间段内给定区域的打车需求量。

Description

一种乘车热点区域预测方法、装置、设备及可读存储介质
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种乘车热点区域预测方法、装置、设备及可读存储介质。
背景技术
多年来车辆运营模式并未有明显优化,乘客仍以路边招手的形式打车,热点地区供大于求,非热点地区打车困难,司机拒载偏远行程的情况常有出现。且传统车辆行业正受到网约车、顺风车等新兴交通模式的冲击,因此迫切需要对车辆的运营模式做出优化,那么就需要一种可以准确地预测在给定时间段内打车热点区域的方法,并且可以提前向该区域调度一定数量的车辆,以增加该区域中车辆的数量。
发明内容
本发明的目的在于提供一种乘车热点区域预测方法、装置、设备及可读存储介质,以改善上述问题。为了实现上述目的,本发明采取的技术方案如下:
一方面,本申请提供了一种乘车热点区域预测方法,所述方法包括:
获取第一信息和第一阈值,所述第一信息包括需要聚类时间段的车辆载客信息,所述第一阈值为车辆载客信息的簇内对象个数的阈值;
将所述第一信息输入第一模型,得到第二信息,所述第一模型为对所述第一信息进行处理后使用OPTICS聚类算法进行聚类的模型,所述第二信息为车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息;
将所述第二信息中每个所述聚类簇的对象个数与第一阈值进行对比,若所述聚类簇中的对象个数大于所述第一阈值,则将对象个数大于所述第一阈值的聚类簇输入第二模型,得到第三信息,所述第三信息为最佳K值,所述K值为所述聚类簇中心的数量,所述第二模型为根据所述第二信息计算得到簇内误差平方和,并根据所述簇内误差平方和来评估最佳K值的模型;
将所述第二信息和所述第三信息输入第三模型,得到第四信息,所述第三模型为使用K-means算法对所述第二信息进行聚类的模型,所述第四信息为乘车的热点区域。
可选地,所述将所述第一信息输入第一模型,得到第二信息,包括:
将所述聚类时间段的车辆载客信息进行数据处理,清除所述第一信息内的残缺数据和无效数据,得到第一子信息;
通过坐标转化算法将所述第一子信息的坐标转化为国际通用的经纬度地理坐标,并根据所述国际通用的经纬度地理坐标确定所述第一子信息的坐标的行政区域,得到第二子信息;
将所述第二子信息导入所述OPTICS聚类算法模型中进行计算,得到车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息。
可选地,所述若所述聚类簇中的对象个数大于所述第一阈值,则将对象个数大于所述第一阈值的聚类簇输入第二模型,得到第三信息,包括:
将所述聚类簇中的对象个数大于所述第一阈值的聚类簇使用枚举法,得到不同K值情况下的簇内误差平方和;
将所述不同K值情况下的簇内误差平方和进行对比,得到簇内误差平方和与K之的关系曲线;
将所述簇内误差平方和与K值的关系曲线中的曲率进行计算,得到曲率最大的点的K值,所述曲率最大的点的K值为最佳K值。
可选地,所述若所述聚类簇中的对象个数信息大于所述第一阈值,则将对象个数大于所述第一阈值的聚类簇输入第二模型,得到第三信息,还包括:
若所述聚类簇中的对象个数均小于所述第一阈值,则直接将所述K值标为0,并根据所有所述聚类簇中心点坐标进行计算其均值,得到所有所述聚类簇中心点坐标的中心坐标;
将所有所述聚类簇中心点坐标的中心坐标标注为高亮点,并发送第一命令,所述第一命令为将所述高亮点的坐标发送至管理人员的通讯设备,并提示管理人员所述坐标为所有聚类簇中心点坐标的中心坐标。
第二方面,本申请实施例提供了一种乘车热点区域预测装置,所述装置包括:
第一获取单元,用于获取第一信息和第一阈值,所述第一信息包括需要聚类时间段的车辆载客信息,所述第一阈值为车辆载客信息的簇内对象个数的阈值;
第一处理单元,用于将所述第一信息输入第一模型,得到第二信息,所述第一模型为对所述第一信息进行处理后使用OPTICS聚类算法进行聚类的模型,所述第二信息为车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息;
第二处理单元,用于将所述第二信息中每个所述聚类簇的对象个数与第一阈值进行对比,若所述聚类簇中的对象个数大于所述第一阈值,则将对象个数大于所述第一阈值的聚类簇输入第二模型,得到第三信息,所述第三信息为最佳K值,所述K值为所述聚类簇中心的数量,所述第二模型为根据所述第二信息计算得到簇内误差平方和,并根据所述簇内误差平方和来评估最佳K值的模型;
第三处理单元,用于将所述第二信息和所述第三信息输入第三模型,得到第四信息,所述第三模型为使用K-means算法对所述第二信息进行聚类的模型,所述第四信息为乘车的热点区域。
可选地,所述装置包括:
第一处理子单元,用于将所述聚类时间段的车辆载客信息进行数据处理,清除所述第一信息内的残缺数据和无效数据,得到第一子信息;
第二处理子单元,用于通过坐标转化算法将所述第一子信息的坐标转化为国际通用的经纬度地理坐标,并根据所述国际通用的经纬度地理坐标确定所述第一子信息的坐标的行政区域,得到第二子信息;
第三处理子单元,用于将所述第二子信息导入所述OPTICS聚类算法模型中进行计算,得到车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息。
可选地,所述装置包括:
第四处理子单元,用于将所述聚类簇中的对象个数大于所述第一阈值的聚类簇使用枚举法,得到不同K值情况下的簇内误差平方和;
第五处理子单元,用于将所述不同K值情况下的簇内误差平方和进行对比,得到簇内误差平方和与K之的关系曲线;
第六处理子单元,用于将所述簇内误差平方和与K值的关系曲线中的曲率进行计算,得到曲率最大的点的K值,所述曲率最大的点的K值为最佳K值。
可选地,所述装置还包括:
第一判断单元,用于若所述聚类簇中的对象个数均小于所述第一阈值,则直接将所述K值标为0,并根据所有所述聚类簇中心点坐标进行计算其均值,得到所有所述聚类簇中心点坐标的中心坐标;
第一发送单元,用于将所有所述聚类簇中心点坐标的中心坐标标注为高亮点,并发送第一命令,所述第一命令为将所述高亮点的坐标发送至管理人员的通讯设备,并提示管理人员所述坐标为所有聚类簇中心点坐标的中心坐标。
第三方面,本申请实施例提供了一种乘车热点区域预测设备,所述设备包括存储器和处理器。存储器用于存储计算机程序;处理器用于执行所述计算机程序时实现上述乘车热点区域预测方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述乘车热点区域预测方法的步骤。
本发明的有益效果为:
本发明主要解决对密度分布不均匀的数据进行聚类时部分类别过大的问题,通过设置用于判定是否为大簇的阈值,对过大的簇进行二次聚类,能排除掉数据中密度过低噪声点,能够输出聚类中心,聚类得到的各个簇较为平均,而且本发明通过各个簇的聚类中心来对车辆的乘车热点区域进行预测,以此来调整车辆运营地点,解决车辆供需不平衡的缺点。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例中所述的一种乘车热点区域预测方法流程示意图;
图2为本发明实施例中所述的一种乘车热点区域预测装置结构示意图;
图3是本发明实施例中所述的一种乘车热点区域预测设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1
如图1所示,本实施例提供了一种乘车热点区域预测方法,其所述方法包括步骤S1、步骤S2、步骤S3和步骤S4。
步骤S1、获取第一信息和第一阈值,所述第一信息包括需要聚类时间段的车辆载客信息,所述第一阈值为车辆载客信息的簇内对象个数的阈值;
步骤S2、将所述第一信息输入第一模型,得到第二信息,所述第一模型为对所述第一信息进行处理后使用OPTICS聚类算法进行聚类的模型,所述第二信息为车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息;
可以理解的是本步骤是预测系统通过获取人工输入的聚类时间段的车辆载客信息和车辆载客信息的簇内对象个数的阈值,并通过识别任何错误或损坏的数据,更正或删除它们,或根据需要手动处理以防止再次发生错误,来确保数据正确性、一致性和可用性;首先要清除无用数据,在本文获取的车辆数据中,有如车辆自编号与车辆号意义重复的字段,如卡厂商等与本文无关数据字段;保留有用字段后,对有用字段中的残缺数据、重复数据清洗,与本文相关的关键字段出现残缺、格式不正确、相同数据重复出现等进行进一步清洗。
步骤S3、将所述第二信息中每个所述聚类簇的对象个数与第一阈值进行对比,若所述聚类簇中的对象个数大于所述第一阈值,则将对象个数大于所述第一阈值的聚类簇输入第二模型,得到第三信息,所述第三信息为最佳K值,所述K值为所述聚类簇中心的数量,所述第二模型为根据所述第二信息计算得到簇内误差平方和,并根据所述簇内误差平方和来评估最佳K值的模型;
步骤S4、将所述第二信息和所述第三信息输入第三模型,得到第四信息,所述第三模型为使用K-means算法对所述第二信息进行聚类的模型,所述第四信息为乘车的热点区域。
可以理解的是本发明中的OPTICS算法基于密度聚类将连续的所在密度较高的点划分成一类,将所在区域密度较低的点视作噪声点,并删除非热点区域坐标点的聚类,然后根据枚举法对簇内误差平方和进行计算得到最佳K值。由于在OPTICS算法去除噪声点的基础上,K-means算法可以很好的进行距离划分聚类,聚类中心不再受离散点距离牵制而偏移,所述本步骤使用K-means算法进行二次聚类,以此来确定乘车的热点区域。本实施例中,所述车辆可以是出租车。
在本公开的一种具体实施方式中,所述步骤S2包括步骤S21、步骤S22和步骤S23。
步骤S21、将所述聚类时间段的车辆载客信息进行数据处理,清除所述第一信息内的残缺数据和无效数据,得到第一子信息;
步骤S22、通过坐标转化算法将所述第一子信息的坐标转化为国际通用的经纬度地理坐标,并根据所述国际通用的经纬度地理坐标确定所述第一子信息的坐标的行政区域,得到第二子信息;
可以理解的是本步骤是通过坐标转换算法将原数据的坐标系转换为经纬度坐标系,并且提出并优化了射线逆地址解析行政区算法,该算法用于判别经纬度坐标点所在行政区,与百度地图的逆地址解析接口相比性能有大幅提高、不受网络连接影响且有极高的经济性。
步骤S23、将所述第二子信息导入所述OPTICS聚类算法模型中进行计算,得到车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息。
可以理解的是本步骤是通过使用将车辆载客信息导入OPTICS聚类算法模型中进行聚类,得到车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息。并且本步骤基于密度聚类将连续的所在密度较高的点划分成一类,将所在区域密度较低的点视作噪声点,以此来得到聚类簇。
在本公开的一种具体实施方式中,所述步骤S3包括步骤S31、步骤S32和步骤S33。
步骤S31、将所述聚类簇中的对象个数大于所述第一阈值的聚类簇使用枚举法,得到不同K值情况下的簇内误差平方和;
步骤S32、将所述不同K值情况下的簇内误差平方和进行对比,得到簇内误差平方和与K之的关系曲线;
步骤S33、将所述簇内误差平方和与K值的关系曲线中的曲率进行计算,得到曲率最大的点的K值,所述曲率最大的点的K值为最佳K值。
可以理解的是在进行二次聚类的过程中会涉及到K-Means聚类算法的K值的选择,不同的K值得到的聚类效果也不同。因此使用枚举法计算出聚类效果最佳情况下的K值,并使用K-Means算法对过大的簇进行二次聚类,在二次聚类之前通过枚举法选出最佳K值,最后提取各个簇的聚类中心。
在本公开的一种具体实施方式中,所述步骤S3之后包括步骤S5和步骤S6。
步骤S5、若所述聚类簇中的对象个数均小于所述第一阈值,则直接将所述K值标为0,并根据所有所述聚类簇中心点坐标进行计算其均值,得到所有所述聚类簇中心点坐标的中心坐标;
步骤S6、将所有所述聚类簇中心点坐标的中心坐标标注为高亮点,并发送第一命令,所述第一命令为将所述高亮点的坐标发送至管理人员的通讯设备,并提示管理人员所述坐标为所有聚类簇中心点坐标的中心坐标。
可以理解的是本步骤是在所有聚类簇中的对象个数均小于所述第一阈值时,直接使用所有所述聚类簇中心点坐标标为零,然后直接求取所有所述聚类簇中心点坐标的中心点,该点就是所有所述聚类簇中心点坐标的中心坐标,然后根据所述中心点坐标的中心坐标,对车辆的需求进行预测,得到预测结果,并发送给管理人员。
在本公开的一种具体实施方式中,所述步骤S4之后包括步骤S7、步骤S8和步骤S9。
步骤S7、将所述最佳K值作为所述K-means聚类算法的K值,调用与最佳K值相同数量的聚类簇中心坐标;
步骤S8、将所述与最佳K值相同数量的聚类簇中心坐标输入K-means聚类算法模型进行计算,得到所述车辆载客信息的聚类结果;
步骤S9、根据所述租车载客信息的聚类结果在地图上标记出其聚类区域,将聚类区域作为乘车的热点区域。
可以理解的是本发明通过在 OPTICS 算法去除噪声点的基础上,K-means算法可以很好的进行距离划分聚类,聚类中心不再受离散点距离牵制而偏移,其中使用最佳K值作为K-means算法的K值,以此来计算出车辆载客信息的聚类结果,并划分聚类得到乘车的热点区域。
在本公开的一种具体实施方式中,所述步骤S4之后包括步骤S10、步骤S11、步骤S12和步骤S13。
步骤S10、将所述乘车的热点区域的中心点进行计算均值,得到所述得到所述乘车的热点区域的中心点的中心坐标;
步骤S11、调用第五信息,所述第五信息为离所述乘车的热点区域的中心坐标的均值最近的热点区域的车辆载客信息;
步骤S12、将所述第五信息按每隔15分钟进行时间序列划分,并将划分好的第五信息分为训练集和验证集;
步骤S13、将所述训练集和所述验证集采用LSTM算法对进行车辆需求进行预测,得到预测数据。
可以理解的是本发明通过选取具有代表性的某一热点区域的时间序列数据进行训练和预测,对该区域车辆出行需求量数进行了时间相关性分析,然后构建深度循环神经网络的LSTM算法车辆出行需求预测模型,依据相关分析结果确定模型结构;以此步骤的到的预测数据不受周期性数据影响,预测结果更加稳定,对于车辆投放是一种很重要的手段。
实施例2
如图2所示,本实施例提供了一种乘车热点区域预测装置,所述装置包括第一获取单元701、第一处理单元702、第二处理单元703和第三处理单元704。
第一获取单元701,用于获取第一信息和第一阈值,所述第一信息包括需要聚类时间段的车辆载客信息,所述第一阈值为车辆载客信息的簇内对象个数的阈值;
第一处理单元702,用于将所述第一信息输入第一模型,得到第二信息,所述第一模型为对所述第一信息进行处理后使用OPTICS聚类算法进行聚类的模型,所述第二信息为车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息;
第二处理单元703,用于将所述第二信息中每个所述聚类簇的对象个数与第一阈值进行对比,若所述聚类簇中的对象个数大于所述第一阈值,则将对象个数大于所述第一阈值的聚类簇输入第二模型,得到第三信息,所述第三信息为最佳K值,所述K值为所述聚类簇中心的数量,所述第二模型为根据所述第二信息计算得到簇内误差平方和,并根据所述簇内误差平方和来评估最佳K值的模型;
第三处理单元704,用于将所述第二信息和所述第三信息输入第三模型,得到第四信息,所述第三模型为使用K-means算法对所述第二信息进行聚类的模型,所述第四信息为乘车的热点区域。
在本公开的一种具体实施方式中,所述第一处理单元702包括第一处理子单元7021、第二处理子单元7022和第三处理子单元7023。
第一处理子单元7021,用于将所述聚类时间段的车辆载客信息进行数据处理,清除所述第一信息内的残缺数据和无效数据,得到第一子信息;
第二处理子单元7022,用于通过坐标转化算法将所述第一子信息的坐标转化为国际通用的经纬度地理坐标,并根据所述国际通用的经纬度地理坐标确定所述第一子信息的坐标的行政区域,得到第二子信息;
第三处理子单元7023,用于将所述第二子信息导入所述OPTICS聚类算法模型中进行计算,得到车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息。
在本公开的一种具体实施方式中,所述第二处理单元703包括第四处理子单元7031、第五处理子单元7032和第六处理子单元7033。
第四处理子单元7031,用于将所述聚类簇中的对象个数大于所述第一阈值的聚类簇使用枚举法,得到不同K值情况下的簇内误差平方和;
第五处理子单元7032,用于将所述不同K值情况下的簇内误差平方和进行对比,得到簇内误差平方和与K之的关系曲线;
第六处理子单元7033,用于将所述簇内误差平方和与K值的关系曲线中的曲率进行计算,得到曲率最大的点的K值,所述曲率最大的点的K值为最佳K值。
在本公开的一种具体实施方式中,所述第二处理单元703之后还包括第一判断单元705和第一发送单元706。
第一判断单元705,用于若所述聚类簇中的对象个数均小于所述第一阈值,则直接将所述K值标为0,并根据所有所述聚类簇中心点坐标进行计算其均值,得到所有所述聚类簇中心点坐标的中心坐标;
第一发送单元706,用于将所有所述聚类簇中心点坐标的中心坐标标注为高亮点,并发送第一命令,所述第一命令为将所述高亮点的坐标发送至管理人员的通讯设备,并提示管理人员所述坐标为所有聚类簇中心点坐标的中心坐标。
在本公开的一种具体实施方式中,所述第三处理单元704之后还包括第四处理单元707、第五处理单元708和第六处理单元709。
第四处理单元707,用于将所述最佳K值作为所述K-means聚类算法的K值,调用与最佳K值相同数量的聚类簇中心坐标;
第五处理单元708,用于将所述与最佳K值相同数量的聚类簇中心坐标输入K-means聚类算法模型进行计算,得到所述车辆载客信息的聚类结果;
第六处理单元709,用于根据所述租车载客信息的聚类结果在地图上标记出其聚类区域,将聚类区域作为乘车的热点区域。
在本公开的一种具体实施方式中,所述第三处理单元704之后还包括第七处理单元710、第八处理单元711、第九处理单元712和第十处理单元713。
第七处理单元710,用于将所述乘车的热点区域的中心点进行计算均值,得到所述得到所述乘车的热点区域的中心点的中心坐标;
第八处理单元711,用于调用第五信息,所述第五信息为离所述乘车的热点区域的中心坐标的均值最近的热点区域的车辆载客信息;
第九处理单元712,用于将所述第五信息按每隔15分钟进行时间序列划分,并将划分好的第五信息分为训练集和验证集;
第十处理单元713,用于将所述训练集和所述验证集采用LSTM算法对进行车辆需求进行预测,得到预测数据。
需要说明的是,关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
实施例3
相应于上面的方法实施例,本公开实施例还提供了一种乘车热点区域预测设备,下文描述的一种乘车热点区域预测设备与上文描述的一种乘车热点区域预测方法可相互对应参照。
图3是根据一示例性实施例示出的一种乘车热点区域预测设备800的框图。如图3所示,该乘车热点区域预测设备800可以包括:处理器801,存储器802。该乘车热点区域预测设备800还可以包括多媒体组件803,输入/输出(I/O)接口804,以及通信组件805中的一者或多者。
其中,处理器801用于控制该乘车热点区域预测设备800的整体操作,以完成上述的乘车热点区域预测方法中的全部或部分步骤。存储器802用于存储各种类型的数据以支持在该乘车热点区域预测设备800的操作,这些数据例如可以包括用于在该乘车热点区域预测设备800上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器802可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random AccessMemory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable ProgrammableRead-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable ProgrammableRead-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件803可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器802或通过通信组件805发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口804为处理器801和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件805用于该乘车热点区域预测设备800与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件805可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,乘车热点区域预测设备800可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal ProcessingDevice,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的一种乘车热点区域预测方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的乘车热点区域预测方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器802,上述程序指令可由乘车热点区域预测设备800的处理器801执行以完成上述的乘车热点区域预测方法。
实施例4
相应于上面的方法实施例,本公开实施例还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种乘车热点区域预测方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的乘车热点区域预测方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种乘车热点区域预测方法,其特征在于,包括:
获取第一信息和第一阈值,所述第一信息包括需要聚类时间段的车辆载客信息,所述第一阈值为车辆载客信息的簇内对象个数的阈值;
将所述第一信息输入第一模型,得到第二信息,所述第一模型为对所述第一信息进行处理后使用OPTICS聚类算法进行聚类的模型,所述第二信息为车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息;
将所述第二信息中每个所述聚类簇的对象个数与第一阈值进行对比,若所述聚类簇中的对象个数大于所述第一阈值,则将对象个数大于所述第一阈值的聚类簇输入第二模型,得到第三信息,所述第三信息为最佳K值,所述K值为所述聚类簇中心的数量,所述第二模型为根据所述第二信息计算得到簇内误差平方和,并根据所述簇内误差平方和来评估最佳K值的模型;
将所述第二信息和所述第三信息输入第三模型,得到第四信息,所述第三模型为使用K-means算法对所述第二信息进行聚类的模型,所述第四信息为乘车的热点区域。
2.根据权利要求1所述的乘车热点区域预测方法,其特征在于,所述将所述第一信息输入第一模型,得到第二信息,包括:
将所述聚类时间段的车辆载客信息进行数据处理,清除所述第一信息内的残缺数据和无效数据,得到第一子信息;
通过坐标转化算法将所述第一子信息的坐标转化为国际通用的经纬度地理坐标,并根据所述国际通用的经纬度地理坐标确定所述第一子信息的坐标的行政区域,得到第二子信息;
将所述第二子信息导入所述OPTICS聚类算法模型中进行计算,得到车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息。
3.根据权利要求1所述的乘车热点区域预测方法,其特征在于,所述若所述聚类簇中的对象个数大于所述第一阈值,则将对象个数大于所述第一阈值的聚类簇输入第二模型,得到第三信息,包括:
将所述聚类簇中的对象个数大于所述第一阈值的聚类簇使用枚举法,得到不同K值情况下的簇内误差平方和;
将所述不同K值情况下的簇内误差平方和进行对比,得到簇内误差平方和与K之的关系曲线;
将所述簇内误差平方和与K值的关系曲线中的曲率进行计算,得到曲率最大的点的K值,所述曲率最大的点的K值为最佳K值。
4.根据权利要求1所述的乘车热点区域预测方法,其特征在于,所述若所述聚类簇中的对象个数信息大于所述第一阈值,则将对象个数大于所述第一阈值的聚类簇输入第二模型,得到第三信息,还包括:
若所述聚类簇中的对象个数均小于所述第一阈值,则直接将所述K值标为0,并根据所有所述聚类簇中心点坐标进行计算其均值,得到所有所述聚类簇中心点坐标的中心坐标;
将所有所述聚类簇中心点坐标的中心坐标标注为高亮点,并发送第一命令,所述第一命令为将所述高亮点的坐标发送至管理人员的通讯设备,并提示管理人员所述坐标为所有聚类簇中心点坐标的中心坐标。
5.一种乘车热点区域预测装置,其特征在于,包括:
第一获取单元,用于获取第一信息和第一阈值,所述第一信息包括需要聚类时间段的车辆载客信息,所述第一阈值为车辆载客信息的簇内对象个数的阈值;
第一处理单元,用于将所述第一信息输入第一模型,得到第二信息,所述第一模型为对所述第一信息进行处理后使用OPTICS聚类算法进行聚类的模型,所述第二信息为车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息;
第二处理单元,用于将所述第二信息中每个所述聚类簇的对象个数与第一阈值进行对比,若所述聚类簇中的对象个数大于所述第一阈值,则将对象个数大于所述第一阈值的聚类簇输入第二模型,得到第三信息,所述第三信息为最佳K值,所述K值为所述聚类簇中心的数量,所述第二模型为根据所述第二信息计算得到簇内误差平方和,并根据所述簇内误差平方和来评估最佳K值的模型;
第三处理单元,用于将所述第二信息和所述第三信息输入第三模型,得到第四信息,所述第三模型为使用K-means算法对所述第二信息进行聚类的模型,所述第四信息为乘车的热点区域。
6.根据权利要求5所述的乘车热点区域预测装置,其特征在于,所述装置包括:
第一处理子单元,用于将所述聚类时间段的车辆载客信息进行数据处理,清除所述第一信息内的残缺数据和无效数据,得到第一子信息;
第二处理子单元,用于通过坐标转化算法将所述第一子信息的坐标转化为国际通用的经纬度地理坐标,并根据所述国际通用的经纬度地理坐标确定所述第一子信息的坐标的行政区域,得到第二子信息;
第三处理子单元,用于将所述第二子信息导入所述OPTICS聚类算法模型中进行计算,得到车辆载客信息中的聚类簇的个数和每个所述聚类簇中的对象个数信息。
7.根据权利要求5所述的乘车热点区域预测装置,其特征在于,所述装置包括:
第四处理子单元,用于将所述聚类簇中的对象个数大于所述第一阈值的聚类簇使用枚举法,得到不同K值情况下的簇内误差平方和;
第五处理子单元,用于将所述不同K值情况下的簇内误差平方和进行对比,得到簇内误差平方和与K之的关系曲线;
第六处理子单元,用于将所述簇内误差平方和与K值的关系曲线中的曲率进行计算,得到曲率最大的点的K值,所述曲率最大的点的K值为最佳K值。
8.根据权利要求5所述的乘车热点区域预测装置,其特征在于,所述装置还包括:
第一判断单元,用于若所述聚类簇中的对象个数均小于所述第一阈值,则直接将所述K值标为0,并根据所有所述聚类簇中心点坐标进行计算其均值,得到所有所述聚类簇中心点坐标的中心坐标;
第一发送单元,用于将所有所述聚类簇中心点坐标的中心坐标标注为高亮点,并发送第一命令,所述第一命令为将所述高亮点的坐标发送至管理人员的通讯设备,并提示管理人员所述坐标为所有聚类簇中心点坐标的中心坐标。
9.一种乘车热点区域预测设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述乘车热点区域预测方法的步骤。
10.一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述乘车热点区域预测方法的步骤。
CN202111117958.5A 2021-09-24 2021-09-24 一种乘车热点区域预测方法、装置、设备及可读存储介质 Active CN113570004B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111117958.5A CN113570004B (zh) 2021-09-24 2021-09-24 一种乘车热点区域预测方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111117958.5A CN113570004B (zh) 2021-09-24 2021-09-24 一种乘车热点区域预测方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN113570004A true CN113570004A (zh) 2021-10-29
CN113570004B CN113570004B (zh) 2022-01-07

Family

ID=78174177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111117958.5A Active CN113570004B (zh) 2021-09-24 2021-09-24 一种乘车热点区域预测方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN113570004B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792945A (zh) * 2021-11-17 2021-12-14 西南交通大学 一种营运车辆的派遣方法、装置、设备及可读存储介质

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763401A (zh) * 2009-12-30 2010-06-30 暨南大学 一种网络舆情的热点预测和分析方法
CN103870845A (zh) * 2014-04-08 2014-06-18 重庆理工大学 点云聚类去噪过程中新的k值优化方法
CN104199853A (zh) * 2014-08-12 2014-12-10 南京信息工程大学 一种聚类方法
CN107103758A (zh) * 2017-06-08 2017-08-29 厦门大学 一种基于深度学习的城市区域交通流量预测方法
CN107357844A (zh) * 2017-06-26 2017-11-17 广州视源电子科技股份有限公司 离群点检测方法和装置
CN108241819A (zh) * 2016-12-23 2018-07-03 高德软件有限公司 路面标记的识别方法及装置
CN108875996A (zh) * 2017-05-12 2018-11-23 宏碁股份有限公司 乘车热点预测的方法及其伺服器与可读存储介质
CN108985475A (zh) * 2018-06-13 2018-12-11 厦门大学 基于深度神经网络的网约车召车需求预测方法
CN110096350A (zh) * 2019-04-10 2019-08-06 山东科技大学 基于集群节点负载状态预测的冷热区域划分节能存储方法
CN110444008A (zh) * 2019-08-22 2019-11-12 欧拉信息服务有限公司 一种车辆调度方法及装置
CN110458336A (zh) * 2019-07-23 2019-11-15 内蒙古工业大学 一种基于深度学习的网约车供需预测方法
CN110674999A (zh) * 2019-10-08 2020-01-10 国网河南省电力公司电力科学研究院 基于改进聚类和长短期记忆深度学习的小区负荷预测方法
CN111753910A (zh) * 2020-06-27 2020-10-09 长安大学 基于lstm的滴滴订单需求预测方法及装置
CN111881243A (zh) * 2020-07-30 2020-11-03 河北工程大学 一种出租车轨迹热点区域分析方法及系统
CN112328880A (zh) * 2020-11-05 2021-02-05 北京嘀嘀无限科技发展有限公司 地理区域聚类方法、装置、存储介质和电子设备
CN112884222A (zh) * 2021-02-10 2021-06-01 武汉大学 一种面向时间段的lstm交通流密度预测方法
CN113112076A (zh) * 2021-04-14 2021-07-13 北京航空航天大学 一种客流集散模式发现及预测方法
CN113395699A (zh) * 2021-05-26 2021-09-14 哈尔滨工业大学 一种基于协作的分簇与频率资源分配方法

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763401A (zh) * 2009-12-30 2010-06-30 暨南大学 一种网络舆情的热点预测和分析方法
CN103870845A (zh) * 2014-04-08 2014-06-18 重庆理工大学 点云聚类去噪过程中新的k值优化方法
CN104199853A (zh) * 2014-08-12 2014-12-10 南京信息工程大学 一种聚类方法
CN108241819A (zh) * 2016-12-23 2018-07-03 高德软件有限公司 路面标记的识别方法及装置
CN108875996A (zh) * 2017-05-12 2018-11-23 宏碁股份有限公司 乘车热点预测的方法及其伺服器与可读存储介质
CN107103758A (zh) * 2017-06-08 2017-08-29 厦门大学 一种基于深度学习的城市区域交通流量预测方法
CN107357844A (zh) * 2017-06-26 2017-11-17 广州视源电子科技股份有限公司 离群点检测方法和装置
CN108985475A (zh) * 2018-06-13 2018-12-11 厦门大学 基于深度神经网络的网约车召车需求预测方法
CN110096350A (zh) * 2019-04-10 2019-08-06 山东科技大学 基于集群节点负载状态预测的冷热区域划分节能存储方法
CN110458336A (zh) * 2019-07-23 2019-11-15 内蒙古工业大学 一种基于深度学习的网约车供需预测方法
CN110444008A (zh) * 2019-08-22 2019-11-12 欧拉信息服务有限公司 一种车辆调度方法及装置
CN110674999A (zh) * 2019-10-08 2020-01-10 国网河南省电力公司电力科学研究院 基于改进聚类和长短期记忆深度学习的小区负荷预测方法
CN111753910A (zh) * 2020-06-27 2020-10-09 长安大学 基于lstm的滴滴订单需求预测方法及装置
CN111881243A (zh) * 2020-07-30 2020-11-03 河北工程大学 一种出租车轨迹热点区域分析方法及系统
CN112328880A (zh) * 2020-11-05 2021-02-05 北京嘀嘀无限科技发展有限公司 地理区域聚类方法、装置、存储介质和电子设备
CN112884222A (zh) * 2021-02-10 2021-06-01 武汉大学 一种面向时间段的lstm交通流密度预测方法
CN113112076A (zh) * 2021-04-14 2021-07-13 北京航空航天大学 一种客流集散模式发现及预测方法
CN113395699A (zh) * 2021-05-26 2021-09-14 哈尔滨工业大学 一种基于协作的分簇与频率资源分配方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
KAI FUNG CHU等: ""Travel Demand Prediction using Deep Multi-Scale Convolutional LSTM Network"", 《INTERNATIONAL CONFERENCE ON INTELLIGENT TRANSPORTATION SYSTEMS》 *
NAVIN RANJAN等: ""City-Wide Traffic Congestion Prediction Based on CNN,LSTM and Transpose CNN"", 《IEEE ACCESS》 *
席殷飞等: ""网约车出行需求预测方法"", 《上海大学学报(自然科学版)》 *
徐伟: ""基于机器学习的共享单车热点区域识别及需求预测"", 《交通发展改革专题》 *
江慧娟等: ""出租车载客热点精细提取的改进DBSCAN算法"", 《地理空间信息》 *
金之榆等: ""基于DBSCAN和改进K-Means聚类算法的电力负荷聚类研究"", 《东北电力技术》 *
陆妍玲等: ""提取热点区域的时空轨迹数据聚类分析"", 《数学的实践与认识》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792945A (zh) * 2021-11-17 2021-12-14 西南交通大学 一种营运车辆的派遣方法、装置、设备及可读存储介质
CN113792945B (zh) * 2021-11-17 2022-02-08 西南交通大学 一种营运车辆的派遣方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN113570004B (zh) 2022-01-07

Similar Documents

Publication Publication Date Title
WO2021232229A1 (zh) 虚拟场景生成方法、装置、计算机设备和存储介质
JP6918137B2 (ja) 運転行為評価方法、装置及びコンピュータが読み取り可能な記憶媒体
WO2018161729A1 (zh) 用户轨迹恢复方法及装置
CN109360421B (zh) 一种基于机器学习的交通信息预测方法及装置、电子终端
CN110570652B (zh) 车辆套牌检测提醒方法及相关产品
CN113570867B (zh) 一种城市交通状态预测方法、装置、设备及可读存储介质
CN110309923A (zh) 横向联邦学习方法、装置、设备及计算机存储介质
CN108460685A (zh) 用于挖掘车险风险因子之间的关联规则的方法和装置
CN113570004B (zh) 一种乘车热点区域预测方法、装置、设备及可读存储介质
CN111340355A (zh) 行程订单的匹配方法、装置、服务器和介质
CN111723835A (zh) 车辆移动轨迹区分方法、装置和电子设备
CN107463941A (zh) 一种车主身份识别方法及装置
CN113902210A (zh) 一种网约车偏航检测方法、装置、电子设备及存储介质
CN115829124A (zh) 充电桩选址方法、装置、设备及存储介质
CN111721312B (zh) 一种运行轨迹生成方法和装置
CN111754261B (zh) 一种车辆出租意愿的评估方法、装置及终端设备
CN110083529A (zh) 自动化测试方法、装置、介质和电子设备
CN112182132A (zh) 一种地铁用户的识别方法、系统、设备和存储介质
CN110852042A (zh) 字符类型转换方法和装置
US20220164723A1 (en) Method for determining boarding information, electronic device, and storage medium
CN114187751B (zh) 预警系统的适应性评价方法、装置、设备及可读存储介质
CN107391728B (zh) 数据挖掘方法以及数据挖掘装置
CN115465152A (zh) 一种动力电池监测方法、装置、设备及存储介质
CN111049892B (zh) 一种感知终端的数据处理方法及装置
CN112419366B (zh) 车辆的追踪方法、系统及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant