CN111753910A - 基于lstm的滴滴订单需求预测方法及装置 - Google Patents
基于lstm的滴滴订单需求预测方法及装置 Download PDFInfo
- Publication number
- CN111753910A CN111753910A CN202010593477.0A CN202010593477A CN111753910A CN 111753910 A CN111753910 A CN 111753910A CN 202010593477 A CN202010593477 A CN 202010593477A CN 111753910 A CN111753910 A CN 111753910A
- Authority
- CN
- China
- Prior art keywords
- data
- order
- area
- sub
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000007787 long-term memory Effects 0.000 claims abstract description 18
- 230000006403 short-term memory Effects 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000007621 cluster analysis Methods 0.000 claims abstract description 11
- 238000004140 cleaning Methods 0.000 claims abstract description 7
- 238000012216 screening Methods 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000001413 cellular effect Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000013277 forecasting method Methods 0.000 description 2
- YOBAEOGBNPPUQV-UHFFFAOYSA-N iron;trihydrate Chemical compound O.O.O.[Fe].[Fe] YOBAEOGBNPPUQV-UHFFFAOYSA-N 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于LSTM的滴滴订单需求预测方法,包括以下步骤:对获取的GPS订单数据进行筛选清洗得到预处理数据,将预处理数据匹配到实际地图道路网络中;对预处理数据进行聚类分析得到区域数据簇,根据区域数据簇将实际地图道路网络划分若干子区域;根据子区域中的预处理数据训练基于长短期记忆网络的订单预测模型;通过订单预测模型预测每一子区域每一时段内的起点订单数量和终点订单数量,寻找热点区域;计算热点区域的订单差值,根据订单差值判断子区域该时段的车辆实际需求量。本发明还公开了一种基于LSTM的滴滴订单需求预测装置,本发明有利于提高滴滴司机的经济效益并提升乘客的乘车体验。
Description
技术领域
本发明涉及涉及数据分析技术领域,尤其涉及一种基于LSTM的滴滴订单需求预测方法及装置。
背景技术
随着社会经济的快速发展,我国汽车保有量逐年增长,路网结构也日趋完善,但是交通拥堵制约城市发展,滴滴与乘客之间的供求关系是导致交通拥堵的一大重点因素。滴滴GPS数据包含海量信息,能够全方位覆盖城市路网交通,既能反映滴滴载客规律也能反映乘客需求特征和出现规律。
借助于数据挖掘技术对滴滴的海量GPS数据进行分析,发现其中蕴含的信息和滴滴与乘客供求关系将有助于滴滴高效寻找乘客,也可大大缓解交通拥堵情况。目前已经有基于滴滴GPS数据分析了滴滴的巡航行为和历史载客点信息,以及多种短时交通流模型预测方法,包括基于数学统计的模型,利用数理统计的理论和方法对交通流数据进行分析并预测,主要包括时间序列预测模型、非参数回归模型、卡尔曼滤波模型等;还包括基于神经网络的预测模型,由一系列简单但相互连接的处理单元构成的一个计算系统,也包括基于组合模型的预测方法,将两种或两种以上不同类型的预测模型组合起来进行最终预测,充分发挥各个预测模型的优点,克服各自的缺陷。
但是上述研究均未涉及到某一时段内某一区域交通流对滴滴载客的影响,因此亟需设计一种基于某一时段某一区域交通流的信息来帮助司机寻找乘客的方法。
发明内容
针对上述现有技术存在不足,本发明提供基于LSTM的滴滴订单需求预测方法及装置。能够提取交通数据中的空间依赖关系,完成对目标地区交通需求的预测。
本发明采用的技术方案为:
基于LSTM(Long Short-Term Memory,长短期记忆网络)的滴滴订单需求预测方法,包括以下步骤:
对获取的GPS订单数据进行筛选清洗得到预处理数据,将预处理数据匹配到实际地图道路网络中;
对预处理数据进行聚类分析得到区域数据簇,根据区域数据簇将实际地图道路网络划分若干子区域;
根据子区域中的区域数据簇训练基于长短期记忆网络的订单预测模型;
通过订单预测模型预测每一子区域每一时段内的起点订单数量和终点订单数量,寻找热点区域;
计算热点区域的订单差值,根据订单差值判断子区域该时段的滴滴需求量。
作为本发明的进一步技术方案为:所述对获取到的GPS订单数据进行筛选清洗得到预处理数据,将预处理数据匹配到实际地图道路网络中;具体包括:
清除获取的GPS订单数据中的空值及缺失数据;
清除GPS订单数据中的轨迹信息,保留每一订单中的起点和终点数据信息;
根据起点和终点数据的经纬度信息将其匹配到路网。
进一步的,所述GPS订单数据包括司机ID,乘客ID,移动轨迹信息、上下车经纬度,上下车时间,所述预处理数据包括上下车经纬度及上下车时间。
进一步的,所述根据起点和终点数据的经纬度信息将其匹配到路网,具体为:采用QGIS或MAPGIS或ArcGIS标记软件,将订单数据的起点和终点匹配到路网上。
作为本发明的进一步技术方案为:所述对预处理数据进行聚类分析得到区域数据簇,根据区域数据簇将实际地图道路网络划分若干子区域;具体包括:
第一步,对预处理数据进行k-means聚类分析,从预处理数据选择k个初始中心点,作为聚类中心;
第二步,计算预处理数据中各点分别到k个聚类中心的距离,将该点分到最近的聚类中心,行成k个簇,其计算公式如下:
其中di表示第i个点到k个聚类中心的最小距离,xi、yi分别表示第i个点的经度和纬度,xj、yj分别表示第j个聚类中心的经度和纬度,i=1,2,3…n,j=1,2,3,…k;
第三步,计算每个组别内所有对象数据的均值,并将得到的均值作为新的质心;
第四步,重复第二步和第三步,直到质心的位置不再发生变化形成区域数据簇;
第四步,根据区域数据簇将实际地图道路网络划分若干子区域。
作为本发明的进一步技术方案为:所述根据子区域中的区域数据簇训练基于长短期记忆网络的订单预测模型,具体包括:
将所获每一天的预处理数据依据时间划分为二十四个时段;
统计每一时段内每一子区域内每隔10min的该区域为起点的订单总量和以该区域为终点的订单总量;
通过Z-score方法,将每一子区域内以该区域为起点的订单总量和以该区域为终点的订单总量标准化;
使用子区域的订单总量中第一时间段数据进行网络模型的训练,选择第二时间段数据作为测试数据以评估模型性能;
长短期记忆网络的细胞状态更新具体计算公式如下:
Ct=Ct-1⊙ft+it⊙at';
其中,Ct为细胞状态,ft为遗忘门的输出,it和at为输入门的两个输出。
作为本发明的进一步技术方案为:通过订单预测模型预测每一子区域每一时段内的起点订单数量和终点订单数量,寻找热点区域,主要包括以下内容:
将区域数据簇输入至基于长短期记忆网络的订单预测模型;
其中,为标准化后第i时段以第j区域为起点的订单数据量,Sij为第i时段以第j区域为起点的订单数据量,μijs为第i时段以第j区域为起点的订单数据的均值,σijs为第i时段以第j区域为起点的订单数据的标准差,为标准化后第i时段以第j区域为终点的订单数据,Eij反标准化后第i时段以第j区域为终点的订单数据量,μije为第i时段以第j区域为终点的订单数据的均值,σije为第i时段以第j区域为终点的订单数据的标准差。
作为本发明的进一步技术方案为:所述计算热点区域的订单差值,根据订单差值判断子区域该时段的滴滴需求量,具体包括:
计算每一时段每一区域的订单差值ΔCij,订单差值越大说明该区域在该时段滴滴缺口越大,司机搭载到乘客的几率越大,其中计算公式如下:
ΔCij=Sij-Eij;
其中,ΔCij为第i时刻第j区域内的订单差值;ΔCij越大说明该子区域该时段的滴滴需求量比较大。
本发明还提出基于LSTM的滴滴订单需求预测装置,包括:
预处理单元,用于对获取的GPS订单数据进行筛选清洗得到预处理数据,将预处理数据匹配到实际地图道路网络中;
区域划分单元,用于对预处理数据进行聚类分析得到区域数据簇,根据区域数据簇将实际地图道路网络划分若干子区域;
预测模型构建单元,用于根据子区域中的预处理数据训练基于长短期记忆网络的订单预测模型;
数据处理单元,用于通过订单预测模型预测每一子区域每一时段内的起点订单数量和终点订单数量,寻找热点区域;
差值判断单元,用于计算热点区域的订单差值,根据订单差值判断子区域该时段的滴滴需求量。
本发明的有益效果为:
本发明提出的基于LSTM的滴滴需求预测方法,结合聚类分析与深度学习方法,完成目标地区订单量预测并得到乘客热点区域,通过对运营车辆的GPS数据的信息挖掘,寻找到其中包含的滴滴等运营车辆与乘客间的供求关系,找到某时段滴滴缺口较大的区域,并将该指标作为需求预测各区域滴滴需求的重要参考因素,完善滴滴需求预测方法,有利于提高滴滴司机经济效益和提升乘客乘车体验,缓解城市交通拥堵状况,对于改善滴滴等运营车辆资源分布不均衡的现状,充分发挥滴滴在城市交通中的补充作用具有重要意义。
附图说明
图1为本发明提出的基于LSTM的滴滴订单需求预测方法及装置流程图;
图2为本发明的一具体实施例流程图;
图3为本发明提出的划分若干子区域具体实施例流程图;
图4为本发明提出的训练订单预测模型流程图;
图5为本发明的一具体实施例流程图;
图6为本发明提出的寻找热点区域实施例流程图;
图7为本发明提出的基于LSTM的滴滴订单需求预测装置结构图。
具体实施方式
本发明提供的技术方案总体思路如下:
本发明提供基于LSTM的滴滴订单需求预测方法及装置,通过k-means聚类方法划分西安市为若干子区域,通过长短期记忆网络LSTM模型实现短时交通流预测,最终得到新的订单需求预测指标。本发明显著地改进了当前滴滴订单需求预测机制,得到更为准确全面的的订单需求预测方法,为司机寻客提供了更加全面可靠的参照信息。
长短期记忆网络模型LSTM是递归神经网络的一种,对于机器人控制,文本识别及预测,语音识别,基于时间序列的预测具有非常好的效果,本发明利用LSTM网络模型进行短时交通流的预测较为理想。本发明滴滴需求预测模型具有普适性,其模型中滴滴GPS数据只要是运营车辆并且能够获得订单数据的运营车辆均可,并不只针对某一种特定类型的车辆。
以上是本申请的核心思想,为了使本技术领域的人员更好地理解本申请方案,下面结合附图对本申请作进一步的详细说明。应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
如图1所示,为本发明提出的基于LSTM的滴滴订单需求预测方法及装置流程图。
参照图1,基于LSTM的滴滴订单需求预测方法及装置,包括以下步骤:
步骤101,对获取的GPS订单数据进行筛选清洗得到预处理数据,将预处理数据匹配到实际地图道路网络中;
步骤102,对预处理数据进行聚类分析得到区域数据簇,根据区域数据簇将实际地图道路网络划分若干子区域;
步骤103,根据子区域中的预处理数据训练基于长短期记忆网络的订单预测模型;
步骤104,通过订单预测模型预测每一子区域每一时段内的起点订单数量和终点订单数量,寻找热点区域;
步骤105,计算每一时段每一子区域的订单差值,并将该指标作为需求预测各区域滴滴需求的重要参考因素。
其中,GPS订单数据包括司机ID,乘客ID,移动轨迹信息、上下车经纬度,上下车时间,所述预处理数据包括司机ID,乘客ID、上下车经纬度及上下车时间。
本发明实施例中,对获取到的GPS订单数据进行筛选清洗得到预处理数据,将预处理数据匹配到实际地图道路网络中;具体包括:
清除获取的GPS订单数据中的空值及缺失数据;
清除GPS订单数据中的轨迹信息,保留每一订单中的起点和终点数据信息;
根据起点和终点数据的经纬度信息将其匹配到路网。
在具体操作时,由于订单数据中存在数据缺失,有的订单轨迹数据包括空值,有的订单数据缺失,例如缺少经纬度信息或时间等,需要将这些缺失及空值进行删选排除,得到有效的处理数据。采用QGIS或MAPGIS或ArcGIS标记软件,将订单数据的起点和终点匹配到路网上。
参见图2,以2019年10月1日至2019年10月31日西安市滴滴GPS数据集为例通过基于LSTM的滴滴需求预测方法,对获取到的GPS订单数据进行筛选清洗,将清洗后的数据匹配到路网,包括以下内容:
使用西安市2019年10月1日至2019年10月31日的滴滴GPS数据集训练和评估我们的模型。每条轨迹数据都包含司机ID,乘客ID,上车经纬度数据,下车经纬度数据,和上下车的时间,包含8000万余条数据。我们对每条轨迹数据进行筛选,仅保留上下车时的信息,包括司机ID,乘客ID,上车经纬度数据,下车经纬度数据,和上下车的时间数据,最终得到330万余条预处理数据。
将预处理数据根据其GPS信息通过QGIS软件匹配到实际地图上,初步观察数据的特征。
参见图3,在步骤102中,对预处理数据进行聚类分析得到区域数据簇,根据区域数据簇将实际地图道路网络划分若干子区域;具体包括:
步骤121,对预处理数据进行k-means聚类分析,从预处理数据选择k个初始中心点,作为聚类中心;
步骤122,计算预处理数据中各点分别到k个聚类中心的距离,将该点分到最近的聚类中心,行成k个簇,其计算公式如下:
其中di表示第i个点到k个聚类中心的最小距离,xi、yi分别表示第i个点的经度和纬度,xj、yj分别表示第j个聚类中心的经度和纬度,i=1,2,3…n,j=1,2,3,…k;
步骤123,计算每个组别内所有对象数据的均值,并将得到的均值作为新的质心;
步骤124,重复步骤122和步骤123,直到质心的位置不再发生变化形成区域数据簇;即完成数据集的聚类形成区域数据簇;
步骤125,根据区域数据簇将实际地图道路网络划分若干子区域。
聚类分析之后我们将整个西安市划分为若干个小的区域,进一步的研究对象也从整个西安市具体化为每一子区域。
参见图4和图5,在步骤103中,根据子区域中的区域数据簇训练基于长短期记忆网络的订单预测模型,具体包括:
步骤131,将所获每一天的预处理数据依据时间划分为二十四个时段;
步骤132,统计每一时段内每一子区域内每隔10min的该区域为起点的订单总量和以该区域为终点的订单总量;
步骤133,通过Z-score方法,将每一子区域内以该区域为起点的订单总量和以该区域为终点的订单总量标准化;
步骤134,使用子区域的订单总量中第一时间段数据进行网络模型的训练,选择第二时间段数据作为测试数据以评估模型性能;
长期记忆网络是一种新型的递归神经网络,它的优点是可以学习和记住长序列,并不依赖于预先指定的窗口滞后观测值作为输入。我们使用数据集中前25天即2019年10月1日至2019年10月25日的数据进行长短期记忆网络网络模型的训练,选择最后6天即2019年10月26日至10月31日的数据作为测试数据以评估模型性能;
其中模型使用的长短期记忆网络(LSTM)包括三种门控结构遗忘门,输入门和输出门,其每个门控的计算公式如下:
遗忘门:ft=σ(Wfht-1+Ufxt+bf);
其中ft为遗忘门的输出,σ为激励函数sigmind,ht-1为上一序列的隐藏状态,xt为本序列的数据,Wf、Uf、bf为线性关系的系数和偏倚;
其中it和at为输入门的两个输出,σ为激励函数sigmind,tanh为激励函数tanh,Wi,Ui,bi,Wa,Ua,ba为线性关系的系数和偏倚;
其中,ot为输出门的第一部分输出,σ为激励函数sigmind,Wo,Uo,bo为线性关系的系数和偏倚,ht为输出门的输出,Ct为细胞状态,tanh为激励函数tanh;
长短期记忆网络的细胞状态更新具体计算公式如下:
Ct=Ct-1⊙ft+it⊙at;
其中,Ct为细胞状态,ft为遗忘门的输出,it和at为输入门的两个输出。
参见图6,本发明实施例中,通过订单预测模型预测每一子区域每一时段内的起点订单数量和终点订单数量,寻找热点区域,主要包括以下内容:
步骤141,将区域数据簇输入至基于长短期记忆网络的订单预测模型;
其中,为标准化后第i时段以第j区域为起点的订单数据量,Sij为第i时段以第j区域为起点的订单数据量,μijs为第i时段以第j区域为起点的订单数据的均值,σijs为第i时段以第j区域为起点的订单数据的标准差,为标准化后第i时段以第j区域为终点的订单数据,Eij反标准化后第i时段以第j区域为终点的订单数据量,μije为第i时段以第j区域为终点的订单数据的均值,σije为第i时段以第j区域为终点的订单数据的标准差。
将得到的每隔10min的数据量汇总,得到每一小时内每一子区域的以该区域为起点的订单总量Sij和以该区域为终点的订单总量Eij;
步骤144,计算每一时段每一区域的订单差值ΔCij,订单差值越大说明该区域在该时段滴滴缺口越大,司机搭载到乘客的几率越大,其中计算公式如下:
ΔCij=Sij-Eij;
其中ΔCij为第i时刻第j区域内的订单差值;
ΔCij越大说明该子区域该时段的滴滴缺口越大,即乘客较多,滴滴需求量比较大,司机在对应时段去该区域寻客则有较大的几率搭载到合适的乘客。
本发明实施例中,计算每一时段每一子区域的订单差值,并将该指标作为需求预测各区域滴滴需求的重要参考因素;
得到每一时段每一区域的订单差值ΔCij后可将其作为一项重要的指标需求预测各区域滴滴需求情况,订单差值ΔCij越大表示该区域的滴滴缺口越大,则该区域滴滴需求量也越大。
参见图7,本发明还提出基于LSTM的滴滴订单需求预测装置,其特征在于,包括:
预处理单元201,用于对获取的GPS订单数据进行筛选清洗得到预处理数据,将预处理数据匹配到实际地图道路网络中;
区域划分单元202,用于对预处理数据进行聚类分析得到区域数据簇,根据区域数据簇将实际地图道路网络划分若干子区域;
预测模型构建单元203,用于根据子区域中的预处理数据训练基于长短期记忆网络的订单预测模型;
数据处理单元204,用于通过订单预测模型预测每一子区域每一时段内的起点订单数量和终点订单数量,寻找热点区域;
差值判断单元205,用于计算热点区域的订单差值,根据订单差值判断子区域该时段的滴滴需求量。
本发明提出的一种基于LSTM的滴滴需求预测方法,结合聚类分析与深度学习方法,完成目标地区订单量预测并得到乘客热点区域,通过对运营车辆的GPS数据的信息挖掘,寻找到其中包含的滴滴等运营车辆与乘客间的供求关系,找到某时段滴滴缺口较大的区域,并将该指标作为需求预测各区域滴滴需求的重要参考因素,完善滴滴需求预测方法,有利于提高滴滴司机经济效益和提升乘客乘车体验,缓解城市交通拥堵状况,对于改善滴滴等运营车辆资源分布不均衡的现状,充分发挥滴滴在城市交通中的补充作用具有重要意义。
对于滴滴司机而言,本发明可以大大降低其空载的时间和距离,帮助其在短时间内找到最佳订单,显著提升经济效益;对于乘客而言,本发明有助于其在短时间内搭载到合适的滴滴,降低等待时间和出行成本,为出行减少不必要的时间浪费,提升乘车体验;对于城市道路交通而言,缓解滴滴与乘客之间资源分布关系后,可以一定程度上缓解交通拥堵,提高道路运行效率,减少环境污染,塑造文明城市,进一步推进城市经济的发展建设。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,所属领域的普通技术人员参照上述实施例依然可以对本发明的具体实施方式进行修改或者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发明的权利要求保护范围之内。
Claims (9)
1.基于LSTM的滴滴订单需求预测方法及装置,其特征在于,包括以下步骤:
对获取的GPS订单数据进行筛选清洗得到预处理数据,将预处理数据匹配到实际地图道路网络中;
对预处理数据进行聚类分析得到区域数据簇,根据区域数据簇将实际地图道路网络划分若干子区域;
根据子区域中的区域数据簇训练基于长短期记忆网络的订单预测模型;
通过订单预测模型预测每一子区域每一时段内的起点订单数量和终点订单数量,寻找热点区域;
计算热点区域的订单差值,根据订单差值判断子区域该时段的滴滴需求量。
2.根据权利要求1所述的方法,其特征在于,所述对获取到的GPS订单数据进行筛选清洗得到预处理数据,将预处理数据匹配到实际地图道路网络中;具体包括:
清除获取的GPS订单数据中的空值及缺失数据;
清除GPS订单数据中的轨迹信息,保留每一订单中的起点和终点数据信息;
根据起点和终点数据的经纬度信息将其匹配到路网。
3.根据权利要求2所述的方法,其特征在于,所述GPS订单数据包括司机ID,乘客ID,移动轨迹信息、上下车经纬度,上下车时间,所述预处理数据包括上下车经纬度及上下车时间。
4.根据权利要求2所述的方法,其特征在于,所述根据起点和终点数据的经纬度信息将其匹配到路网,具体为:采用QGIS、MAPGIS或ArcGIS标记软件,将订单数据的起点和终点匹配到路网上。
5.根据权利要求1所述的方法,其特征在于,对预处理数据进行聚类分析得到区域数据簇,根据区域数据簇将实际地图道路网络划分若干子区域;具体包括:
第一步,对预处理数据进行k-means聚类分析,从预处理数据选择k个初始中心点,作为聚类中心;
第二步,计算预处理数据中各点分别到k个聚类中心的距离,将该点分到最近的聚类中心,行成k个簇,其计算公式如下:
其中di表示第i个点到k个聚类中心的最小距离,xi、yi分别表示第i个点的经度和纬度,xj、yj分别表示第j个聚类中心的经度和纬度,i=1,2,3…n,j=1,2,3,…k;
第三步,计算每个组别内所有对象数据的均值,并将得到的均值作为新的质心;
第四步,重复第二步和第三步,直到质心的位置不再发生变化形成区域数据簇;
第四步,根据区域数据簇将实际地图道路网络划分若干子区域。
6.根据权利要求1所述的方法,其特征在于,所述根据子区域中的区域数据簇训练基于长短期记忆网络的订单预测模型,具体包括:
将所获每一天的预处理数据依据时间划分为二十四个时段;
统计每一时段内每一子区域内每隔10min的该区域为起点的订单总量和以该区域为终点的订单总量;
通过Z-score方法,将每一子区域内以该区域为起点的订单总量和以该区域为终点的订单总量标准化;
使用子区域的订单总量中第一时间段数据进行网络模型的训练,选择第二时间段数据作为测试数据以评估模型性能;
长短期记忆网络的细胞状态更新具体计算公式如下:
Ct=Ct-1⊙ft+it⊙at;
其中,Ct为细胞状态,ft为遗忘门的输出,it和at为输入门的两个输出。
7.根据权利要求1所述的方法,其特征在于,通过订单预测模型预测每一子区域每一时段内的起点订单数量和终点订单数量,寻找热点区域,主要包括以下内容:
将区域数据簇输入至基于长短期记忆网络的订单预测模型;
9.根据权利要求1-8中任一所述的方法提出一种基于LSTM的滴滴订单需求预测装置,其特征在于,包括:
预处理单元,用于对获取的GPS订单数据进行筛选清洗得到预处理数据,将预处理数据匹配到实际地图道路网络中;
区域划分单元,用于对预处理数据进行聚类分析得到区域数据簇,根据区域数据簇将实际地图道路网络划分若干子区域;
预测模型构建单元,用于根据子区域中的预处理数据训练基于长短期记忆网络的订单预测模型;
数据处理单元,用于通过订单预测模型预测每一子区域每一时段内的起点订单数量和终点订单数量,寻找热点区域;
差值判断单元,用于计算热点区域的订单差值,根据订单差值判断子区域该时段的滴滴需求量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010593477.0A CN111753910A (zh) | 2020-06-27 | 2020-06-27 | 基于lstm的滴滴订单需求预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010593477.0A CN111753910A (zh) | 2020-06-27 | 2020-06-27 | 基于lstm的滴滴订单需求预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111753910A true CN111753910A (zh) | 2020-10-09 |
Family
ID=72677298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010593477.0A Pending CN111753910A (zh) | 2020-06-27 | 2020-06-27 | 基于lstm的滴滴订单需求预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111753910A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111967698A (zh) * | 2020-10-23 | 2020-11-20 | 北京国新智电新能源科技有限责任公司 | 基于移动充电桩调度的电动汽车充电系统及装置 |
CN112016771A (zh) * | 2020-10-23 | 2020-12-01 | 北京国新智电新能源科技有限责任公司 | 基于电动汽车需求预测的移动充电桩调度方法及系统 |
CN112861925A (zh) * | 2021-01-18 | 2021-05-28 | 中国科学院自动化研究所 | 基于深度学习网络的多区域车辆需求预测方法及系统 |
CN113393030A (zh) * | 2021-06-11 | 2021-09-14 | 上海钧正网络科技有限公司 | 车辆运营区域潜力站点选址方法、系统、终端及介质 |
CN113570004A (zh) * | 2021-09-24 | 2021-10-29 | 西南交通大学 | 一种乘车热点区域预测方法、装置、设备及可读存储介质 |
WO2022174434A1 (zh) * | 2021-02-22 | 2022-08-25 | 长安大学 | 基于lstm的滴滴订单需求预测方法及装置 |
CN115423393A (zh) * | 2022-08-12 | 2022-12-02 | 北京邮电大学 | 一种基于lstm的动态自适应调度周期的订单调度方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107392389A (zh) * | 2017-08-03 | 2017-11-24 | 重庆大学 | 基于arima模型的出租车调度处理方法 |
CN109190795A (zh) * | 2018-08-01 | 2019-01-11 | 中山大学 | 一种区域间出行需求预测方法及装置 |
CN109859469A (zh) * | 2019-02-15 | 2019-06-07 | 重庆邮电大学 | 一种基于集成lstm神经网络的车流量预测方法 |
CN110458336A (zh) * | 2019-07-23 | 2019-11-15 | 内蒙古工业大学 | 一种基于深度学习的网约车供需预测方法 |
CN110633871A (zh) * | 2019-09-25 | 2019-12-31 | 大连理工大学 | 一种基于卷积长短期记忆网络的区域交通需求预测方法 |
-
2020
- 2020-06-27 CN CN202010593477.0A patent/CN111753910A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107392389A (zh) * | 2017-08-03 | 2017-11-24 | 重庆大学 | 基于arima模型的出租车调度处理方法 |
CN109190795A (zh) * | 2018-08-01 | 2019-01-11 | 中山大学 | 一种区域间出行需求预测方法及装置 |
CN109859469A (zh) * | 2019-02-15 | 2019-06-07 | 重庆邮电大学 | 一种基于集成lstm神经网络的车流量预测方法 |
CN110458336A (zh) * | 2019-07-23 | 2019-11-15 | 内蒙古工业大学 | 一种基于深度学习的网约车供需预测方法 |
CN110633871A (zh) * | 2019-09-25 | 2019-12-31 | 大连理工大学 | 一种基于卷积长短期记忆网络的区域交通需求预测方法 |
Non-Patent Citations (1)
Title |
---|
崔斌 等: "《R语言在生物医学领域的应用》", 31 October 2016 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111967698A (zh) * | 2020-10-23 | 2020-11-20 | 北京国新智电新能源科技有限责任公司 | 基于移动充电桩调度的电动汽车充电系统及装置 |
CN112016771A (zh) * | 2020-10-23 | 2020-12-01 | 北京国新智电新能源科技有限责任公司 | 基于电动汽车需求预测的移动充电桩调度方法及系统 |
CN111967698B (zh) * | 2020-10-23 | 2021-01-29 | 北京国新智电新能源科技有限责任公司 | 基于移动充电桩调度的电动汽车充电系统及装置 |
CN112861925A (zh) * | 2021-01-18 | 2021-05-28 | 中国科学院自动化研究所 | 基于深度学习网络的多区域车辆需求预测方法及系统 |
CN112861925B (zh) * | 2021-01-18 | 2023-04-07 | 中国科学院自动化研究所 | 基于深度学习网络的多区域车辆需求预测方法及系统 |
WO2022174434A1 (zh) * | 2021-02-22 | 2022-08-25 | 长安大学 | 基于lstm的滴滴订单需求预测方法及装置 |
CN113393030A (zh) * | 2021-06-11 | 2021-09-14 | 上海钧正网络科技有限公司 | 车辆运营区域潜力站点选址方法、系统、终端及介质 |
CN113570004A (zh) * | 2021-09-24 | 2021-10-29 | 西南交通大学 | 一种乘车热点区域预测方法、装置、设备及可读存储介质 |
CN115423393A (zh) * | 2022-08-12 | 2022-12-02 | 北京邮电大学 | 一种基于lstm的动态自适应调度周期的订单调度方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753910A (zh) | 基于lstm的滴滴订单需求预测方法及装置 | |
Badii et al. | Predicting available parking slots on critical and regular services by exploiting a range of open data | |
Ma et al. | Bus travel time prediction with real-time traffic information | |
Ma et al. | Driving style recognition and comparisons among driving tasks based on driver behavior in the online car-hailing industry | |
Liu et al. | Bus arrival time prediction based on LSTM and spatial-temporal feature vector | |
Zhang et al. | A framework for passengers demand prediction and recommendation | |
CN110458336B (zh) | 一种基于深度学习的网约车供需预测方法 | |
CN112700072A (zh) | 交通状况预测方法、电子设备和存储介质 | |
JP4796167B2 (ja) | イベント判断装置 | |
CN110390349A (zh) | 基于XGBoost模型的公交车客流量预测建模方法 | |
CN115790636B (zh) | 基于大数据的无人驾驶零售车巡航路径规划方法及装置 | |
CN112906948B (zh) | 一种基于私家车轨迹大数据的城市区域吸引力预测方法、设备及介质 | |
CN111507762A (zh) | 基于多任务共预测神经网络的城市出租车需求预测方法 | |
CN111598333B (zh) | 客流数据的预测方法及装置 | |
Chen et al. | A multiscale-grid-based stacked bidirectional GRU neural network model for predicting traffic speeds of urban expressways | |
CN110796317B (zh) | 一种基于需求预测的城市出租车调度方法 | |
CN114493191A (zh) | 一种基于网约车数据的驾驶行为建模分析方法 | |
CN115830848A (zh) | 一种基于lstm模型的共享停车位智能分配系统及方法 | |
Lin et al. | Path travel time estimation using attribute-related hybrid trajectories network | |
Xu et al. | A taxi dispatch system based on prediction of demand and destination | |
CN114418606A (zh) | 基于时空卷积网络的网约车订单需求预测方法 | |
CN117436653A (zh) | 一种网约车出行需求的预测模型构建方法和预测方法 | |
Mor et al. | Multivariate short-term traffic flow prediction based on real-time expressway toll plaza data using non-parametric techniques | |
Sharmila et al. | Bus arrival time prediction and measure of uncertainties using survival models | |
CN115713206A (zh) | 一种公交个体出行决策模型 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |