CN115545252A - 一种共享出行站点的流量预测方法及系统 - Google Patents
一种共享出行站点的流量预测方法及系统 Download PDFInfo
- Publication number
- CN115545252A CN115545252A CN202110733332.0A CN202110733332A CN115545252A CN 115545252 A CN115545252 A CN 115545252A CN 202110733332 A CN202110733332 A CN 202110733332A CN 115545252 A CN115545252 A CN 115545252A
- Authority
- CN
- China
- Prior art keywords
- data
- site
- flow
- historical
- station
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 49
- 238000012549 training Methods 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 34
- 238000010801 machine learning Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 9
- 230000007613 environmental effect Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000000611 regression analysis Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0645—Rental transactions; Leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Educational Administration (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供了一种共享出行站点的流量预测方法及系统,涉及交通流量预测领域,包括以下;采集站点的历史基础信息及所述站点对应的历史流量信息;根据位置数据、容量数据采用预设规则计算所述站点的承载度;从数据库中获取与所述站点的承载度相似度超出第一阈值的站点生成站点集合;计算所述站点所在站点集合的复杂度并匹配对应算法建立流量预测模型;采用所述历史基础信息和历史流量信息对所述流量预测模型进行训练;采集当前站点的实时基础数据,根据所述实时基础数据采用训练后的预测模型进行处理,以预测目标时间段的流量数据,解决现有技术中租赁点的车辆数量分配不合理,缺乏考虑出行站点流量而分配不合理的问题。
Description
技术领域
本发明涉及交通流量预测领域,尤其涉及一种共享出行站点的流量预测方法及系统。
背景技术
共享汽车的出现,降低了私人车辆的拥有量,一定程度上缓解了交通拥堵,并为节能减排做出了巨大贡献。由于城市居民出行需求时空分布的不均,租借时某些网点车辆利用率极低,造成车辆资源的极大浪费,而在另一些网点车辆供不应求,而且用户使用结束不必将车辆还至取车租赁点,这种还车服务在为用户提供灵活性的同时,也导致系统中车辆的分布变得不均衡,用户很容易出现借不到车或者没车位还车的情况,造成用户需求无法得到最大满足降低用户体验。
因此,各个租赁点的车辆数量合理分配以及车辆管理是目前汽车共享租赁产业运营管理中一个很重要的问题,为了提高对各个租赁点的车辆数量分配的合理性,以减少上述租赁点车辆供过于求或供不应求的情况,需要一种出行站点流量的预测方法,以根据站点流量实现车辆数量的合理分配。
发明内容
为了克服上述技术缺陷,本发明的目的在于提供一种共享出行站点的流量预测方法及系统,用于解决现有技术中租赁点的车辆数量分配不合理,缺乏考虑出行站点流量而分配不合理的问题。
本发明公开了一种共享出行站点的流量预测方法,包括以下:
采集站点的历史基础信息及所述站点对应的历史流量信息;其中,所述基础信息包括位置数据、时间数据以及容量数据,所述历史流量信息包括订单数据、可用车辆数据以及不可用车辆数据;
根据位置数据、容量数据采用预设规则计算所述站点的承载度;
从数据库中获取与所述站点的承载度相似度超出第一阈值的站点生成站点集合;
计算所述站点所在站点集合的复杂度并匹配对应算法建立流量预测模型;
采用所述历史基础信息和历史流量信息对所述流量预测模型进行训练;
采集当前站点的实时基础数据,根据所述实时基础数据采用训练后的预测模型进行处理,以预测目标时间段的流量数据。
优选地,所述基于所述站点所在站点集合的站点数量匹配对应算法建立流量预测模型,包括以下:
当所述站点集合的站点数量超出第二阈值,则采用聚类算法和/或逐步回归分析预测算法和/或马尔科夫分析预测算法建立流量预测模型;
当所述站点集合的站点数量未超出第二阈值,则采用平均值法建立流量预测模型。
优选地,当采用平均值法建立流量预测模型,所述采用训练后的预测模型进行处理,以预测目标时间段的流量数据,包括以下:
基于所述站点的历史基础信息及历史流量信息获取预设时间周期下的站点流量数据;
计算所述预设时间周期下的站点流量数据平均值和标准差;
以所述预设时间周期下的站点流量数据平均值与预设倍数的标准差预测目标时间段的流量数据。
优选地,当采用聚类建模法建立流量预测模型,所述采用训练后的预测模型进行处理,以预测目标时间段的流量数据,包括以下:
在站点集合内采用预设聚类算法进行站点聚类,以生成至少一个群内相似、群外相异的站点群;
基于各个站点群匹配预设机器学习算法并建立回归模型作为流量预测模型;
根据当前站点的实时基础数据,获取与当前站点匹配的站点群;
采用训练后与所述与当前站点匹配的站点群对应的流量预测模型对所述站点进行流量预测,以预测目标时间段的流量数据。
优选地,采用训练后与所述与当前站点匹配的站点群对应的流量预测模型对所述站点进行流量预测,以预测目标时间段的流量数据,包括以下:
基于所述当前站点的实时基础数据,获取站点用户特征、站点位置、站点车辆数以及环境数据;
基于所述站点用户特征、站点位置、站点车辆数以及环境数据对所述站点进行目标时间段的流量预测,获取初始结果;
获取各个站点群之间的关联关系,和/或基于所述环境数据查找历史流量信息,并基于所述关联关系和/或所述环境数据对应的历史流量信息更新所述初始结果以生成目标时间段的流量数据。
优选地,所述基于所述历史基础信息和历史流量信息对所述流量预测模型进行训练,当采用平均值法建立流量预测模型,包括以下:
基于所述站点的历史基础信息及历史流量信息生成第一样本数据,其中所述第一样本数据包括以预设第一时间段下的历史流量数据作为第一输入样本和预设第二时间段下的历史流量数据作为第一输出样本,所述预设第一时间段先于所述第二时间段;
采用第一输入样本输入所述流量预测模型,计算平均值与预设倍数的标准差加和,以获取第一处理结果,并与第一输出样本比对,以调整所述流量预测模型,迭代直至完成训练过程。
优选地,所述基于所述历史基础信息和历史流量信息对所述流量预测模型进行训练,当采用聚类建模法建立流量预测模型,包括以下:
基于所述站点的历史基础信息及历史流量信息生成第二样本数据,其中所述第二样本数据包括以预设第一时间段下站点群的历史流量数据作为第二输入样本和预设第二时间段下站点群的历史流量数据作为第二输出样本,所述预设第一时间段先于所述第二时间段;
基于站点群匹配机器学习算法,并基于所述机器学习算法生成流量预测模型;
对所述流量预测模型执行模型前提假设检验,若检验失败,则再次匹配机器学习算法,迭代,直至检验成功,以生成待训练的流量预测模型;
采用第二输入样输入所述流量预测模型,并输出第二处理结果,与所述第二输出样本对比以调整所述流量预测模型,迭代直至完成训练过程。
优选地,在采集站点的历史基础信息及所述站点对应的历史流量信息后,还包括以下:
对所述站点的历史基础信息和历史流量信息进行清洗。
优选地,在预测目标时间段的流量数据后,还包括以下:
基于当前站点的实时基础数据以及预测的目标时间段的流量数据,生成用于所述站点的调度策略;
将所述调度策略在预设范围内广播,以在预设范围内执行所述调度策略;
实时接收调度响应站点信息,并基于所述调度响应站点信息进行调度路径规划并发送至所述当前站点。
本发明还提供一种共享出行站点的流量预测系统,包括:
数据采集模块,用于采集站点的历史基础信息及所述站点对应的历史流量信息;其中,所述基础信息包括位置数据、时间数据以及容量数据,所述历史流量信息包括订单数据、可用车辆数据以及不可用车辆数据;
计算模块,用于根据位置数据、容量数据采用预设规则计算所述站点的承载度;
预处理模块,用于从数据库中获取与所述站点的承载度相似度超出第一阈值的站点生成站点集合;
模型建立模块,用于计算所述站点所在站点集合的复杂度并匹配对应算法建立流量预测模型;
训练模块,用于基于所述历史基础信息和历史流量信息对所述流量预测模型进行训练;
预测模块,用于采集当前站点的实时基础数据,根据所述实时基础数据采用训练后的预测模型进行处理,以预测目标时间段的流量数据。
采用了上述技术方案后,与现有技术相比,具有以下有益效果:
在本实施方式中,通过采集站点的历史基础信息及历史流量信息,根据站点的承载度选择采用平均值法或聚类建模法建立流量预测模型,基于采集的历史基础信息及历史流量信息对目标时间段的流量数据进行预测,对于较复杂的站点(即承载度超出第二阈值),对所述站点进行目标时间段的流量预测,还结合各个站点群之间的关联关系,获得预测结果,可根据预测结果进行站点车辆调度,解决现有技术中租赁点的车辆数量分配不合理,缺乏考虑出行站点流量而分配不合理的问题。
附图说明
图1为本发明所述一种共享出行站点的流量预测方法及系统的实施例一的流程图;
图2为本发明所述一种共享出行站点的流量预测方法及系统的实施例一中当采用平均值法建立流量预测模型,所述采用训练后的预测模型进行处理,以预测目标时间段的流量数据的流程图;
图3为本发明所述一种共享出行站点的流量预测方法及系统的实施例一中当采用聚类建模法建立流量预测模型,上述采用训练后的预测模型进行处理,以预测目标时间段的流量数据流程图;
图4为本发明所述一种共享出行站点的流量预测方法及系统的实施例一中采用训练后与所述与当前站点匹配的站点群对应的流量预测模型对所述站点进行流量预测,以预测目标时间段的流量数据流程图;
图5为本发明所述一种共享出行站点的流量预测方法及系统的实施例一中在预测目标时间段的流量数据后的流程图;
图6为本发明所述一种共享出行站点的流量预测方法及系统的实施例中对所述流量预测模型执行模型前提假设检验的流程图;
图7为本发明所述一种共享出行站点的流量预测方法及系统的实施例二的模块示意图。
附图标记:8-流量预测系统;81-数据采集模块;82-计算模块;83-预处理模块;84-模型建立模块;85-训练模块;86-预测模块。
具体实施方式
以下结合附图与具体实施例进一步阐述本发明的优点。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,“模块”与“部件”可以混合地使用。
实施例一:本实施例公开了一种共享出行站点的流量预测方法,参阅图1,包括以下:
S100:采集站点的历史基础信息及所述站点对应的历史流量信息;其中,所述基础信息包括位置数据、时间数据以及容量数据,所述历史流量信息包括订单数据、可用车辆数据以及不可用车辆数据;
具体的,在本实施方式中,将站点的历史流量作为历史基础数据存储进hadoop服务器,该位置数据包括但不限于该站点所出的地段是否处于居民区或商业中心区(关联位置数据)、周围的人口密集度、周围的出行方式或交通工具的种类和数量、该区域内投放相关营销广告的数量、该地区互联网普及率、配套设施数据等;容量数据包括站点面积等;订单数据包括但不限于基于该站点的借和还车的订单数,人数、订单发生时的天气、节假日、具体时间段、当时的站点正在预约的车辆数等;不可用车辆数据包括用户待还车辆数量等。
由于采集到的历史基础数据种类较多且数据量较大,在采集站点的历史基础信息及所述站点对应的历史流量信息后,还包括以下:对所述站点的历史基础信息和历史流量信息进行清洗。具体的,所述清洗包括但不限于插值填充、异常值处理、分组分析或格式转换等,在实际处理场景下,现有中常用用于数据补充或数据预处理的方法可适用于此,以使得处理后的历史基础数据清洗且方便后续步骤使用即可。
S200:根据位置数据、容量数据采用预设规则计算所述站点的承载度;
具体的,上述站点的承载度即为根据位置数据和容量数据计算出的该站点的承载能力,具体的,可以以历史流量最大值,或者根据预设公式计算的理论流量来确定,作为举例的,位置数据与容量数据以权重加和计算。
S300:从数据库中获取与所述站点的承载度相似度超出第一阈值的站点生成站点集合;
具体的,在上述步骤中,数据库中包含若干站点及各个站点对应的历史基础数据,在本方案中,需要根据站点的复杂度选择平均值法或聚类建模法建模,所述站点的复杂度即为是否存在相似站点群和/或站点群的大小,即相似站点群中的站点数量,因此需要根据站点的承载度获取与其相似的站点生成站点群,具体的,相似度计算可以采用现有常见的算法,包括但不限于欧几里得距离等。
S400:计算所述站点所在站点集合的复杂度并匹配对应算法建立流量预测模型;
具体的,如上述,由站点集合的站点数量用于体现站点的复杂程度,在上述步骤中,包括但不限于根据所述站点所在站点集合内的站点数量,和/或影响预测结果的维度数量,和/或影响预测结果的维度变化选择算法建立流量预测模型,包括以下:
当所述站点集合的站点数量超出第二阈值,则采用聚类算法和/或逐步回归分析预测算法和/或马尔科夫分析预测算法建立流量预测模型;
在上述步骤中,当站点集合的站点数量超出第二阈值,则该站点为较复杂的站点,此时采用聚类建模法进行建模,具体来说聚类建模是首先进行站点聚类,而后选择算法进行建模。逐步回归分析预测算法,在实时基础数据(或实时位置数据)比较复杂时采影响因子较多的可以使用。马尔科夫分析预测,则在各个算子(影响因素或者预测维度)变化的比较频繁时使用。
在上述步骤中,当站点集合的站点数量未超出第二阈值,则该站点为较简单的站点,平均值法即为利用历史基本信息和历史流量信息基于平均值计算建模。
S500:采用所述历史基础信息和历史流量信息对所述流量预测模型进行训练;
基于上述步骤S400中采用平均值法或聚类建模法建立模型后需要对建立的模型进行训练,通过机器学习的人工智能方式来自动化的运算和纠正该模型的完整度及成熟度。
具体的,当采用平均值法建立流量预测模型,所述基于所述历史基础信息和历史流量信息对所述流量预测模型进行训练,包括以下:
基于所述站点的历史基础信息及历史流量信息生成第一样本数据,其中所述第一样本数据包括以预设第一时间段下的历史流量数据作为第一输入样本和预设第二时间段下的历史流量数据作为第一输出样本,所述预设第一时间段先于所述第二时间段;
作为补充的,优选上述第一时间段长度长于第二时间段长度,作为举例的,用测试集数据3.1-3.31日(即第一时间段)预测4.1-4.7日(即第二时间端)的数据,将输入第一输入样本后预测的数据和真实的数据(即第一输出数据)进行比对。
采用第一输入样本输入所述流量预测模型,计算平均值与预设倍数的标准差加和,以获取第一处理结果,并与第一输出样本比对,以调整所述流量预测模型,迭代直至完成训练过程。
在上述训练过程中,与下述步骤S611-S613的执行步骤相似,不同之处在于在将第一处理结果和第一输出样本比对后对建立的流量预测模型进行调整,迭代周期可以设置为以日的维度或者以月的维度均可,可自主选择。
具体的,当采用聚类建模法建立流量预测模型,所述基于所述历史基础信息和历史流量信息对所述流量预测模型进行训练,包括以下:
基于所述站点的历史基础信息及历史流量信息生成第二样本数据,其中所述第二样本数据包括以预设第一时间段下站点群的历史流量数据作为第二输入样本和预设第二时间段下站点群的历史流量数据作为第二输出样本,所述预设第一时间段先于所述第二时间段;
作为补充的,上述第二样本数据可以与上述步骤中采用平均值法建立的流量预测模型一致,也可以不一致。
基于站点群匹配机器学习算法,并基于所述机器学习算法生成流量预测模型;
具体的,匹配的机器学习算法包括但不限于如考虑时间特征和频次的时间序列算法、考虑天气、温度、湿度、时间等特征的随机森林算法等。
对所述流量预测模型执行模型前提假设检验,若检验失败,则再次匹配机器学习算法,迭代,直至检验成功,以生成待训练的流量预测模型;
具体的,参阅图6,假设检验是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法,在本方案中,采用前提假设检验来检验该机器学习算法是否适用,当检验失败,则更换机器学习算法再次进行检验。
采用第二输入样输入所述流量预测模型,并输出第二处理结果,与第二输出样本所述对比以调整所述流量预测模型,迭代直至完成训练过程。
与上述采用平均值法建立的流量预测模型训练方法类似的,上述训练过程与下述步骤S621-S624的处理过程中相似,且在第二处理结果与第二输出样本对比后进行模型自主调整。
S600:采集当前站点的实时基础数据,根据所述实时基础数据采用训练后的预测模型进行处理,以预测目标时间段的流量数据。
在上述步骤中,获取站点的实时基础数据传输至数据服务器,获取的内容包括但不限于实时天气、节假日、具体时间段、当时正在预约的车辆数、站点可用的车辆数等,前述实时基础数据进入训练后的流量预测模型内,进行流数据处理,基于该站点的历史流量得出当前站点未来一段时间内的订单需求度,即预测目标时间段的流量数据。
具体的,当采用平均值法建立流量预测模型,所述采用训练后的预测模型进行处理,以预测目标时间段的流量数据,参阅图2,包括以下:
S611:基于所述站点的历史基础信息及历史流量信息获取预设时间周期下的站点流量数据;
具体的,作为举例的,上述预设周期可以以时间点为流量数据采集点,也可以以工作日或节假日分类作为流量数据采集周期。
S612:计算所述预设时间周期下的站点流量数据平均值和标准差;
S613:以所述预设时间周期下的站点流量数据平均值与预设倍数的标准差加和,以预测目标时间段的流量数据。
在上述步骤中,以平均数+3个标准差为标准,预测该站点预测目标时间段(如工作日/节假日)状态下,超出预设概率下借出的车辆。
当采用聚类建模法建立流量预测模型,上述采用训练后的预测模型进行处理,以预测目标时间段的流量数据,参阅图3,包括以下:
S621:在站点集合内采用预设聚类算法进行站点聚类,以生成至少一个群内相似、群外相异的站点群;
具体的,在本实施方式中,采用的聚类算法包括但不限于主成分降维、K-mean聚类等,可根据实际使用场景选择合适的算法处理。作为补充,聚类后对这各个站点群进行建模,同一个站点群中的各个站点使用同一个模型。
S622:基于各个站点群匹配预设机器学习算法并建立回归模型作为流量预测模型;
具体的,如上述训练过程中所述,预设机器学习算法包括但不限于如考虑时间特征和频次的时间序列算法、考虑天气、温度、湿度、时间等特征的随机森林算法等,同时通过回归模型在训练过程中采用模型前架设检验,以确定选择的机器学习算法是否满足需求。
S623:根据当前站点的实时基础数据,获取与当前站点匹配的站点群;
在上述步骤中,如上所述同一个站点群中的各个站点使用同一个模型,因此需要根据当前站点匹配的站点群获取与其对应建立的流量预测模型。
S624:采用训练后与所述与当前站点匹配的站点群对应的流量预测模型对所述站点进行流量预测,以预测目标时间段的流量数据。
具体的,上述采用训练后与所述与当前站点匹配的站点群对应的流量预测模型对所述站点进行流量预测,以预测目标时间段的流量数据,参阅图4,包括以下:
S624-1:基于所述当前站点的实时基础数据,获取站点用户特征、站点位置、站点车辆数以及环境数据;
作为解释的,上述用户特征基于站点维度固定,具体的如在某一站点使用高于预设频次的车辆用户集合(包括但不限于性别、年龄、注册APP时长、活跃时长、用车时段等),站点位置包括但不限于商圈、政务中心、学校等,还可包括站点密集度等,站点车辆数包括但不限于在线车辆数、故障车辆数、低电车辆数等,环境数据包括但不限于天气(湿度、温度、是否下雨)、季节、工作日/非工作日、早晚高峰、社会活动等。
S624-2:基于所述站点用户特征、站点位置、站点车辆数以及环境数据对所述站点进行目标时间段的流量预测,获取初始结果;
S624-3:获取各个站点群之间的关联关系,取各个站点群之间的关联关系,和/或基于所述环境数据查找历史流量信息,并基于所述关联关系和/或所述环境数据对应的历史流量信息更新所述初始结果,以生成目标时间段的流量数据。
作为进一步补充说明的,上述各个站点群之间的关联关系具体体现包括但不限于由流量较多的站点组成的站点群对其关联站点群的流量影响较大,由流量较少的站点组成的站点群对其关联站点群的流量影响较小等,在上述步骤中考虑到各个站点群之间的关联关系,进一步提高流量数据预测的准确性。基于所述环境数据查找历史流量信主要是考虑一些特殊环境因素造成的特定场景,如大型聚集活动,包括但不限于演唱会,此时作为举例的,可预先采集演唱会信息,并根据演唱会信息在演唱会开始和结束时间段根据预设规则增加流量数据,或者查找历史同类型场景,即演唱会场景下历史流量数据进行流量预测。
在本实施方式中,在上述步骤S600在预测目标时间段的流量数据后,参阅图5,还包括以下:
S710:基于当前站点的实时基础数据以及预测的目标时间段的流量数据,生成用于所述站点的调度策略;
在本实施方式中,基于上述步骤S100-S600可以根据各个站点的历史流量预测目标时间段的流量数据,由此工作人员即可根据预测结果进行各个站点车辆的分配,进而提高各个站点车辆分配的合理性,其中,调度策略包括但不限于调度车辆数量、车辆维修时间调整等。
S720:将所述调度策略在预设范围内广播,以在预设范围内执行所述调度策略。
在上述步骤中,将调度策略在预设范围内广播,可以被预设范围内各个站点均可接收,并基于该调度策略进行响应。作为补充的,还可实时接收调度响应站点信息,并基于所述调度响应站点信息进行调度路径规划并发送至所述当前站点,即根据相应站点信息确认响应站点的位置以及响应站点与当前站点之间的距离和路况,基于上述信息进行路径规划和筛选,以在调度策略中提供优选路径推荐,进一步提高工作人员执行调度策略的效率。
在本实施方式中,通过采集站点的历史基础信息及历史流量信息,根据站点的承载度选择采用平均值法或聚类建模法建立流量预测模型,基于采集的历史基础信息及历史流量信息对目标时间段的流量数据进行预测,对于较复杂的站点(即承载度超出第二阈值),在站点集合中进行聚类,生成至少一个群内相似、群外相异的站点群,并选择算法建立模型,在训练过程中采用模型前提假设检验进行算法适用性验证,以确保模型处理结果的准确性,基于所述站点用户特征、站点位置、站点车辆数以及环境数据对所述站点进行目标时间段的流量预测,并结合各个站点群之间的关联关系,获得预测结果,解决有技术中租赁点的车辆数量分配不合理,缺乏考虑出行站点流量而分配不合理的问题,可根据预测结果进行站点车辆调度,以减少现有技术出现的各个站点供过于求或供不应求的情况。
实施例二:本实施例提供一种共享出行站点的流量预测系统8,参阅图7,包括以下:
数据采集模块81,用于采集站点的历史基础信息及所述站点对应的历史流量信息;其中,所述基础信息包括位置数据、时间数据以及容量数据,所述历史流量信息包括订单数据、可用车辆数据以及不可用车辆数据;
计算模块82,用于根据位置数据、容量数据采用预设规则计算所述站点的承载度;
上述站点的承载度即为根据位置数据和容量数据计算出的该站点的承载能力,具体的,可以以历史流量最大值,或者根据预设公式计算的理论流量来确定。
预处理模块83,用于从数据库中获取与所述站点的承载度相似度超出第一阈值的站点生成站点集合;
模型建立模块84,用于计算所述站点所在站点集合的复杂度并匹配对应算法建立流量预测模型;
具体的,本实施方式中通过站点集合的站点数量来体现站点集合的复杂度,在实际使用场景下还可使用其他参数来体现站点集合的复杂度,包括但不限于站点集合内站点位置、人流量等等,在本实施方式中,当站点集合的站点数量超出第二阈值,则该站点为较复杂的站点,此时采用聚类建模法进行建模,具体来说聚类建模是首先进行站点聚类,而后选择算法进行建模。逐步回归分析预测算法,在实时基础数据(或实时位置数据)比较复杂时采影响因子较多的可以使用。马尔科夫分析预测,则在各个算子(影响因素或者预测维度)变化的比较频繁时使用。
训练模块85,用于基于所述历史基础信息和历史流量信息对所述流量预测模型进行训练;
上述训练模块通过机器学习的人工智能方式来自动化的运算和纠正该模型的完整度及成熟度。
预测模块86,用于采集当前站点的实时基础数据,根据所述实时基础数据采用训练后的预测模型进行处理,以预测目标时间段的流量数据。
在上述预测模块中,实时基础数据进入训练后的预测模型内,进行流数据处理,得出预测目标时间段的订单需求度,以便后续根据该预测结果进行调度,解决有技术中租赁点的车辆数量分配不合理,缺乏考虑出行站点流量而分配不合理的问题。
应当注意的是,本发明的实施例有较佳的实施性,且并非对本发明作任何形式的限制,任何熟悉该领域的技术人员可能利用上述揭示的技术内容变更或修饰为等同的有效实施例,但凡未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何修改或等同变化及修饰,均仍属于本发明技术方案的范围内。
Claims (10)
1.一种共享出行站点的流量预测方法,其特征在于,包括以下:
采集站点的历史基础信息及所述站点对应的历史流量信息;其中,所述基础信息包括位置数据、时间数据以及容量数据,所述历史流量信息包括订单数据、可用车辆数据以及不可用车辆数据;
根据位置数据、容量数据采用预设规则计算所述站点的承载度;
从数据库中获取与所述站点的承载度相似度超出第一阈值的站点生成站点集合;
计算所述站点所在站点集合的复杂度并匹配对应算法建立流量预测模型;
采用所述历史基础信息和历史流量信息对所述流量预测模型进行训练;
采集当前站点的实时基础数据,根据所述实时基础数据采用训练后的预测模型进行处理,以预测目标时间段的流量数据。
2.根据权利要求1所述的流量预测方法,其特征在于,所述计算所述站点所在站点集合的复杂度匹配对应算法建立流量预测模型,包括以下:
当所述站点集合的站点数量超出第二阈值,则采用聚类算法和/或逐步回归分析预测算法和/或马尔科夫分析预测算法建立流量预测模型;
当所述站点集合的站点数量未超出第二阈值,则采用平均值法建立流量预测模型。
3.根据权利要求2所述的流量预测方法,其特征在于,当采用平均值法建立流量预测模型,所述采用训练后的预测模型进行处理,以预测目标时间段的流量数据,包括以下:基于所述站点的历史基础信息及历史流量信息获取预设时间周期下的站点流量数据;
计算所述预设时间周期下的站点流量数据平均值和标准差;
以所述预设时间周期下的站点流量数据平均值与预设倍数的标准差预测目标时间段的流量数据。
4.根据权利要求2所述的流量预测方法,其特征在于,当采用聚类建模法建立流量预测模型,所述采用训练后的预测模型进行处理,以预测目标时间段的流量数据,包括以下:
在站点集合内采用预设聚类算法进行站点聚类,以生成至少一个群内相似、群外相异的站点群;
基于各个站点群匹配预设机器学习算法并建立回归模型作为流量预测模型;
根据当前站点的实时基础数据,获取与当前站点匹配的站点群;
采用训练后与所述与当前站点匹配的站点群对应的流量预测模型对所述站点进行流量预测,以预测目标时间段的流量数据。
5.根据权利要求4所述的流量预测方法,其特征在于,采用训练后与所述与当前站点匹配的站点群对应的流量预测模型对所述站点进行流量预测,以预测目标时间段的流量数据,包括以下:
基于所述当前站点的实时基础数据,获取站点用户特征、站点位置、站点车辆数以及环境数据;
基于所述站点用户特征、站点位置、站点车辆数以及环境数据对所述站点进行目标时间段的流量预测,获取初始结果;
获取各个站点群之间的关联关系,和/或基于所述环境数据查找历史流量信息,并基于所述关联关系和/或所述环境数据对应的历史流量信息更新所述初始结果,以生成目标时间段的流量数据。
6.根据权利要求1所述的流量预测方法,其特征在于,所述基于所述历史基础信息和历史流量信息对所述流量预测模型进行训练,当采用平均值法建立流量预测模型,包括以下:
基于所述站点的历史基础信息及历史流量信息生成第一样本数据,其中所述第一样本数据包括以预设第一时间段下的历史流量数据作为第一输入样本和预设第二时间段下的历史流量数据作为第一输出样本,所述预设第一时间段先于所述第二时间段;
采用第一输入样本输入所述流量预测模型,计算平均值与预设倍数的标准差加和,以获取第一处理结果,并与第一输出样本比对,以调整所述流量预测模型,迭代直至完成训练过程。
7.根据权利要求1所述的流量预测方法,其特征在于,所述基于所述历史基础信息和历史流量信息对所述流量预测模型进行训练,当采用聚类建模法建立流量预测模型,包括以下:
基于所述站点的历史基础信息及历史流量信息生成第二样本数据,其中所述第二样本数据包括以预设第一时间段下站点群的历史流量数据作为第二输入样本和预设第二时间段下站点群的历史流量数据作为第二输出样本,所述预设第一时间段先于所述第二时间段;
基于站点群匹配机器学习算法,并基于所述机器学习算法生成流量预测模型;
对所述流量预测模型执行模型前提假设检验,若检验失败,则再次匹配机器学习算法,迭代,直至检验成功,以生成待训练的流量预测模型;
采用第二输入样输入所述流量预测模型,并输出第二处理结果,与所述第二输出样本对比以调整所述流量预测模型,迭代直至完成训练过程。
8.根据权利要求1所述的流量预测方法,其特征在于,在采集站点的历史基础信息及所述站点对应的历史流量信息后,还包括以下:
对所述站点的历史基础信息和历史流量信息进行清洗。
9.根据权利要求1所述的流量预测方法,其特征在于,在预测目标时间段的流量数据后,还包括以下:
基于当前站点的实时基础数据以及预测的目标时间段的流量数据,生成用于所述站点间的调度策略;
将所述调度策略在预设范围内广播,以在预设范围内执行所述调度策略;
实时接收调度响应站点信息,并基于所述调度响应站点信息进行调度路径规划并发送至所述当前站点。
10.一种共享出行站点的流量预测系统,其特征在于,包括:
数据采集模块,用于采集站点的历史基础信息及所述站点对应的历史流量信息;其中,所述基础信息包括位置数据、时间数据以及容量数据,所述历史流量信息包括订单数据、可用车辆数据以及不可用车辆数据;
计算模块,用于根据位置数据、容量数据采用预设规则计算所述站点的承载度;
预处理模块,用于从数据库中获取与所述站点的承载度相似度超出第一阈值的站点生成站点集合;
模型建立模块,用于计算所述站点所在站点集合的复杂度并匹配对应算法建立流量预测模型;
训练模块,用于基于所述历史基础信息和历史流量信息对所述流量预测模型进行训练;
预测模块,用于采集当前站点的实时基础数据,根据所述实时基础数据采用训练后的预测模型进行处理,以预测目标时间段的流量数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110733332.0A CN115545252A (zh) | 2021-06-30 | 2021-06-30 | 一种共享出行站点的流量预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110733332.0A CN115545252A (zh) | 2021-06-30 | 2021-06-30 | 一种共享出行站点的流量预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115545252A true CN115545252A (zh) | 2022-12-30 |
Family
ID=84716857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110733332.0A Pending CN115545252A (zh) | 2021-06-30 | 2021-06-30 | 一种共享出行站点的流量预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115545252A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116363854A (zh) * | 2023-05-31 | 2023-06-30 | 北京阿帕科蓝科技有限公司 | 共享出行车辆调度方法、装置和计算机设备 |
CN116611565A (zh) * | 2023-05-23 | 2023-08-18 | 岭南师范学院 | 基于数据分析的用户行为监控系统 |
-
2021
- 2021-06-30 CN CN202110733332.0A patent/CN115545252A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116611565A (zh) * | 2023-05-23 | 2023-08-18 | 岭南师范学院 | 基于数据分析的用户行为监控系统 |
CN116611565B (zh) * | 2023-05-23 | 2023-12-29 | 岭南师范学院 | 基于数据分析的用户行为监控系统 |
CN116363854A (zh) * | 2023-05-31 | 2023-06-30 | 北京阿帕科蓝科技有限公司 | 共享出行车辆调度方法、装置和计算机设备 |
CN116363854B (zh) * | 2023-05-31 | 2023-10-24 | 北京阿帕科蓝科技有限公司 | 共享出行车辆调度方法、装置和计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10639995B2 (en) | Methods, circuits, devices, systems and associated computer executable code for driver decision support | |
Pevec et al. | A data‐driven statistical approach for extending electric vehicle charging infrastructure | |
CN103632212B (zh) | 一种时变用户均衡动态网络演化客流预测系统和方法 | |
Gao et al. | Optimize taxi driving strategies based on reinforcement learning | |
Tekouabou | Intelligent management of bike sharing in smart cities using machine learning and Internet of Things | |
CN105303882B (zh) | 基于时空维度动态停车收费策略的停车管理系统及方法 | |
JP2022099235A (ja) | MaaSアーキテクチャにおけるフリート車両の充電、燃料注入、および駐車のオーバヘッドの最適化 | |
CN115545252A (zh) | 一种共享出行站点的流量预测方法及系统 | |
JP2019145087A (ja) | 交換可能エネルギー貯蔵装置に対する需要を予測するためのシステムおよび方法 | |
Hu et al. | A two-stage dynamic capacity planning approach for agricultural machinery maintenance service with demand uncertainty | |
CN115796393B (zh) | 基于多能互动的能源网管理优化方法、系统及存储介质 | |
CN113033110B (zh) | 一种基于交通流模型的重点区域人员应急疏散系统及方法 | |
CN115049159B (zh) | 人口分布预测方法和装置、存储介质及电子设备 | |
CN103606299A (zh) | 基于智能手机的停车位信息共享方法 | |
CN112381398B (zh) | 考虑用户有限理性出行的电动汽车充电站选址方法及系统 | |
US20230057564A1 (en) | Methods for managing cleaning routes in smart cities, internet of things systems, and storage mediums | |
CN113935505A (zh) | 基于列生成和蚁群算法融合的共享电动汽车运营优化方法 | |
CN113674524A (zh) | 基于lstm-gasvr的多尺度短时交通流预测建模、预测方法及系统 | |
Li et al. | Trajectory-driven planning of electric taxi charging stations based on cumulative prospect theory | |
CN115984769A (zh) | 一种智慧城市垃圾清扫点确定方法和物联网系统 | |
CN116050581A (zh) | 一种智慧城市地铁行车调度优化方法和物联网系统 | |
CN116050742A (zh) | 一种共享车辆运维人员智能调度配置方法及系统 | |
CN111915078B (zh) | 一种基于数据驱动的柔性化卷烟配送线路规划方法及系统 | |
CN116959288A (zh) | 一种基于历史数据的停车场推荐方法、装置和分布式系统 | |
CN111144628A (zh) | 一种分布式供能的冷热电负荷预测模型系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |