CN112330215B - 一种城市用车需求量预测方法、设备及存储介质 - Google Patents
一种城市用车需求量预测方法、设备及存储介质 Download PDFInfo
- Publication number
- CN112330215B CN112330215B CN202011350498.6A CN202011350498A CN112330215B CN 112330215 B CN112330215 B CN 112330215B CN 202011350498 A CN202011350498 A CN 202011350498A CN 112330215 B CN112330215 B CN 112330215B
- Authority
- CN
- China
- Prior art keywords
- inputting
- vehicle demand
- time
- facilities
- output result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012549 training Methods 0.000 claims abstract description 32
- 230000002123 temporal effect Effects 0.000 claims abstract description 30
- 238000003062 neural network model Methods 0.000 claims abstract description 21
- 230000015654 memory Effects 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 6
- 230000036541 health Effects 0.000 claims description 3
- 238000001556 precipitation Methods 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 2
- 230000007246 mechanism Effects 0.000 description 16
- 239000011159 matrix material Substances 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000013136 deep learning model Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- NAXKFVIRJICPAO-LHNWDKRHSA-N [(1R,3S,4R,6R,7R,9S,10S,12R,13S,15S,16R,18S,19S,21S,22S,24S,25S,27S,28R,30R,31R,33S,34S,36R,37R,39R,40S,42R,44R,46S,48S,50R,52S,54S,56S)-46,48,50,52,54,56-hexakis(hydroxymethyl)-2,8,14,20,26,32,38,43,45,47,49,51,53,55-tetradecaoxa-5,11,17,23,29,35,41-heptathiapentadecacyclo[37.3.2.23,7.29,13.215,19.221,25.227,31.233,37.04,6.010,12.016,18.022,24.028,30.034,36.040,42]hexapentacontan-44-yl]methanol Chemical compound OC[C@H]1O[C@H]2O[C@H]3[C@H](CO)O[C@H](O[C@H]4[C@H](CO)O[C@H](O[C@@H]5[C@@H](CO)O[C@H](O[C@H]6[C@H](CO)O[C@H](O[C@H]7[C@H](CO)O[C@@H](O[C@H]8[C@H](CO)O[C@@H](O[C@@H]1[C@@H]1S[C@@H]21)[C@@H]1S[C@H]81)[C@H]1S[C@@H]71)[C@H]1S[C@H]61)[C@H]1S[C@@H]51)[C@H]1S[C@@H]41)[C@H]1S[C@H]31 NAXKFVIRJICPAO-LHNWDKRHSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0645—Rental transactions; Leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Educational Administration (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种城市用车需求量预测方法、设备及存储介质,方法包括:将待预测区域划分成若干网格;采集各个网格内的时态数据和空间数据作为训练集,时态数据包括历史需求、气象特征和事件特征,空间数据包括各区域中各种POIs的数量;将训练集输入至基于BERT的深度空时神经网络模型中进行训练;通过训练完成的模型对待预测区域中任意区域的下一时段的用车需求量进行预测。本发明充分考虑了气象特征和事件特征等外部因素和区域内POIs对用车需求量的影响,以时态数据和空间数据作为训练集,能够提升模型预测的准确度;本方法还使用了基于BERT的深度空时神经网络模型,模型可以并行计算,相较于现有预测模型,能够极大的提升时间效率。
Description
技术领域
本发明涉及数据挖掘技术领域,特别涉及一种城市用车需求量预测方法、设备及存储介质。
背景技术
目前通过对城市用车需求量(包括出租车用车需求和网约车用车需求等)的预测方法主要是将用车需要量视为时间序列,训练学习模型,最后进行预测。学习模型主要有传统的机器学习模型、传统的深度学习模型和基于注意力机制的深度学习模型。但这三种技术还存在着以下缺陷:
(1)传统的机器学习模型主要是使用回归综合移动平均(ARIMA)及其变体技术,其利用前几个时间段的历史需求数据来实现未来用车需求量的预测,因为时间周期是动态的,同时用车需求易受气候、节假日等诸多外在因素的影响,这导致传统的机器学习模型的预测准确度较低。
(2)传统的深度学习模型使用递归神经网络(RNN),如门控循环单元(GRU)和长短记忆(LSTM),但传统的深度学习模型的RNN单元无法并行计算,易出现训练和计算效率低下等问题。
(3)基于注意力机制的深度学习模型利用用车需求量数据与其他地区用车需求量数据之间的相似度来做匹配,其中引入一种与Transformer结构相同的多头注意力模型来预测城市用车需求,同时时空注意力机制捕捉了城市用车需求的时空关系。虽然这些研究是最早利用注意力机制从复杂的时空关系来预测出租车需求的,但其忽视各区域功能相似性的重要性,因为功能相似的地区可能会有不同的用车需求,如居民区和商业区中用车需求量是不同的,对于某一地区、某一时刻,商业区的用车需求量高峰期在晚上下班时间,居民区对于用车需求量高峰区在早上上班的时候,因此目前基于注意力机制的深度学习模型无法对某颗粒度区域某时刻用车需求量进行较为精准的预测。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种城市用车需求量预测方法、设备及存储介质,能够对城市各区域各时段的用车需求量进行细粒度、高精度的预测,提高城市车辆资源的利用率。
本发明的第一方面,提供了一种城市用车需求量预测方法,包括以下步骤:
S100、将待预测区域划分成若干网格;
S200、采集各个所述网格内的时态数据和空间数据作为训练集,所述时态数据包括气象特征、事件特征和历史需求,所述空间数据包括全部所述网格中各类POIs的数量;
S300、将所述训练集输入至预设的基于BERT的深度空时神经网络模型进行训练;
S400、通过训练完成的所述基于BERT的深度空时神经网络模型对所述待预测区域中任意区域的下一时段的用车需求量进行预测。
根据本发明的实施例,至少具有如下技术效果:
本方法采集的时态数据包括气象特征、事件特征和历史需求,空间数据包括若干POIs,在数据采集上,充分考虑了气象特征和事件特征等外部因素和POIs所代表的地区功能相似性对用车需求量的影响,能够提升用车需求量预测的准确度;本方法还使用了基于BERT的深度空时神经网络模型进行训练和预测,模型基于BERT的架构,可以实现并行计算,相较于现有神经网络预测模型,本模型能够极大的提升训练和预测的时间效率。
根据本发明的一些实施例,所述基于BERT的深度空时神经网络模型的预测,包括步骤:
对所述时态数据和所述空间数据进行预处理;
将预处理后的所述时态数据输入至位置嵌入层进行时间顺序调整;
将所述位置嵌入层的输出结果输入至时空嵌入层,所述时空嵌入层包括一个多层感知器;
将所述时空嵌入层的输出结果输入至至少一个编码器中,所述至少一个编码器的输出结果输入至全连接层,得到第一输出结果;
将预处理后的所述空间数据输入至依次连接的编码器和全连接层中,得到第二输出结果;
将所述第一输出结果和所述第二输出结果进行级联并输入全连接层中,得到预测结果。
根据本发明的一些实施例,所述至少一个编码器为两个并行独立运行的编码器。
根据本发明的一些实施例,将所述训练集输入至预设的基于BERT的深度空时神经网络模型中进行训练之后,还包括步骤:通过测试集对训练完成的所述基于BERT的深度空时神经网络模型进行测试。
根据本发明的一些实施例,所述对所述时态数据进行预处理,包括步骤:
将所述气象特征和所述时态特征分别输入至对应的第一全连接层;
将两个所述第一全连接层的输出结果和所述历史需求共同输入至第二全连接层,得到所述时态数据的预处理结果。
根据本发明的一些实施例,所述气象特征包括:温度、湿度、能见度、风速、降水量和天气情况。
根据本发明的一些实施例,所述事件特征包括:节假日事件、工作日事件和周末事件。
根据本发明的一些实施例,所述POIs包括住宅区、教育设施、文化设施、娱乐设施、社会服务设施、交通设施、商业设施、政府设施、宗教设施、卫生服务设施、公共安全设施和水源设施。
本发明的第二方面,提供了一种城市用车需求量预测设备,包括:至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如本发明第一方面所述的城市用车需求量预测方法。
本发明的第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如本发明第一方面所述的城市用车需求量预测方法。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例提供的一种城市用车需求量预测方法的流程示意图;
图2为本发明实施例提供的一组纽约市划分的网格地图;
图3为本发明实施例提供的一组纽约市19151网格三个时间间隔内的实际出租车用车需求的示意图;
图4为本发明实施例提供的一组纽约市21584网格的周末和工作日的实际出租车用车需求的比较示意图;
图5为本发明实施例提供的一组居民区和商业区一天24小时对于出租车用车需求的示意图;
图6为本发明实施例提供的通过模型训练所得数据集验证细粒度内预配置用车数量的结果正确性的流程示意图;
图7为本发明实施例提供的检验训练完成的模型的预测准确度的流程示意图;
图8为本发明实施例提供的基于BERT的深度空时神经网络模型的结构示意图;
图9为本发明实施例提供的编码器的内部结构示意图;
图10为本发明实施例提供的一种城市用车需求量预测设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
第一实施例;
参照图1,提供了一种城市用车需求量预测方法,包括以下步骤:
S100、将待预测区域划分成若干网格。
在步骤S100中,由于本方法实施例的目的是要对各区域内下一时刻的用车需求量进行高精度和细粒度的预测,所以首先将待预测区域划分成若干个网格,例如将一个城市划分为多个不相连的m×n多个矩形网格。网格地图可以将原始的异质时空特征直接输入到每个网格中,形成一个矩阵或张量作为模型的输入,从左到右、从上到下依次对网格进行编号,并将矩阵(即网格地图的网格ID)展平为一个向量,过滤不在城市中的网格。如图2所示,图2示出一组纽约市划分的网格,将纽约市划分为多个不相连的200m×200m网格,由于纽约市的边界是多边形,所以过滤不在纽约市中的区域,图2中已将纽约市中的区域设置为半透明,而不在纽约市中的区域已设置为透明。需要注意的是,除特别声明外,本文所指的用车需求量包括但不仅限于出租车的用车需求量、网约车的用车需求量和大巴车的用车需求量,后文均以出租车的用车需求为例作为示例。
S200、采集各个网格内的时态数据和空间数据作为训练集,时态数据包括气象特征、事件特征和历史需求,空间数据包括全部网格中各类POIs的数量。
根据现有研究结果,如图3和图4所示,图3示出纽约市19151网格三个时间间隔内的实际出租车用车需求,其中2016年2月8日上午12点和下午24点下雪。图4示出纽约市21584网格周末和工作日的实际出租车用车需求的比较。根据图中结果可知气象条件会直接影响出租车用车需求,从整体上发现每个月的上班时间和假期对于出租车用车需求基本趋势不相同。从某一天的各个不同的时刻来看,受到节假日的影响,在不同的时刻出租车用车需求有不同,同时需求结果也符合客观事实,如:在周一到周五上班时间早上8点左右需求最大,而在周六日早上8点需求很明显很少。图5显示居民区和商业区一天24小时对于出租车用车需求,居民区出租车用车需求在上午8点左右达到小高峰,下午13点至18点保持较高水平,而商业网点的出租车用车需求则在上午10点至13点和晚上20点至22点出现。
于是在步骤S200中,训练集为采集的各个网格内的时态数据和空间数据,其中时态数据包括历史需求、气象特征和事件特征,空间数据包括根据各个网格中POIs位置而采集的若干POIs。作为一种可选的实施方式,气象特征包括但不仅限于:温度、湿度、能见度、风速、降水量和天气情况。事件特征包括但不仅限于:节假日事件、工作日事件和周末事件。历史需求包括但不仅限于:上下车区域、上下车日期、上下车时间、上车人数和下车人数,由于历史需求为本领域现有模型预测出租车用车需求的必需数据,本实施例不进行细述。POIs用于表示一个细粒度区域的功能,POI表示物理世界一个特定的设施的类别,一个区域内各种POIs的密度反映了该区域的功能和社会环境,在本实施例中,POIs包括但不仅限于:住宅区设施、教育设施、文化设施、娱乐设施、社会服务设施、交通设施、商业设施、政府设施、宗教设施、卫生服务设施、公共安全设施、水源设施以及其它设施。步骤S200充分考虑了气象特征和事件特征等外部因素以及POIs所表示的区域功能相似性对出租车用车需求量的影响,通过由以上数据组成的训练集对模型进行训练,能够极大的提升模型预测的准确度。
S300、将训练集输入至预设的基于BERT的深度空时神经网络模型进行训练。
由于现有大部分使用深度学习的预测模型都采用基于RNN的方式处理时间序列,而RNN及其变体(如GRU、LSTM)是无法并行计算的。而本实施例使用的基于BERT的深度空时神经网络模型是基于BERT的架构,采用了Multi-Head Attention(表示多重自我注意力机制的结合)机制,它利用Positional Embedding(位置嵌入)对时间序列的顺序进行标注,并用自注意力机制可以并行计算。相较于目前的出租车用车需求预测模型,本模型能够提升模型训练和预测的时间效率,可参见第二实施例的实验结果。
作为一种可选的实施方式,基于BERT的深度空时神经网络模型训练完成后,具备一定的学习和对结果的预判能力,此时进一步通过测试集对训练完成的模型进行测试,通过MAPE和RMSE来对模型进行性能评估。如图6和图7所示,图6示出了通过模型训练所得数据集,来验证细粒度内预配置用车数量的结果正确性与否的流程图;图7示出了检验训练完成的模型的预测准确度的判断。
S400、通过训练完成的基于BERT的深度空时神经网络模型对待预测区域中任意区域的下一时段的用车需求量进行预测。
如图8所示,作为一种可选的实施方式,基于BERT的深度空时神经网络模型的预测,包括步骤:
S401、对时态数据和空间数据进行预处理。
预处理的过程对应图8中的a部分,其中时态数据的预处理过程为:
S4011、将气象特征和事件特征分别输入至对应的第一全连接层。
两个第一全连接层分别对气象特征和事件特征进行处理,用以获得更准确的数据,同时能够避免模型对高维数据的预设偏差。需要注意的是,图8中FC表示全连接层,Encoder表示编码器。
S4012、将两个第一全连接层的输出结果和历史需求共同输入至第二全连接层,得到时态数据的预处理结果。
第二全连接层的计算公式如下:
其中为时间间隔t内的气象特征;/>为时间间隔t内的事件特征,为时间间隔t内各网格的上下车次数矩阵;/>为第二全连接层的输出结果;和/>分别表示两个第一全连接层的输出结果。
空间数据的预处理过程为:将空间数据输入至一个全连接层中。
全连接层计算公式如下:
hp=f(wfpFp+bfp) (2)
其中wfp和bfp为学习参数,Fp网格中的若干种POI数量。
S402、将预处理后的时态数据输入至位置嵌入层进行时间顺序调整。
由于时态数据的处理中涉及到时间序列,因此需要使用位置嵌入层(对应图8中b部分的Positional Embedding)进行时间顺序调整,用于解决BERT中的编码器无法处理数据的顺序问题。位置嵌入层主要是定义一个位置嵌入矩阵P来指示特征在时间间隔的三个周期(即接近度、周期和趋势)中的时间顺序,其中P初始化为服从标准正态分布,并可以通过反向传播作为参数来学习,位置嵌入层输出是其计算如下:
其中P为位置嵌入矩阵。
S403、将位置嵌入层的输出结果输入至时空嵌入层,时空嵌入层包括一个多层感知器。
步骤S402和S403对应图8中b部分。由于不同的区域可以共享相似的用车需求,例如,一个城市中的大多数住宅区在工作日的早高峰对出租车有很高的需求,而对于商业区,高峰期一般在中午和晚高峰时,因此相距遥远的地区可能有相似的用车需求。因此需要时空嵌入层来训练原始时态数据的新表示,以获得所有区域之间的用车需求相似性。
在本实施例中,时空嵌入层(对应图8中Spatiotemporal Embedding)包含一个多层感知器(MLP),MLP是4个堆叠的全连接层。MLP的输出可以表示为:
S404、将时空嵌入层的输出结果输入至至少一个编码器中,至少一个编码器的输出结果输入至全连接层,得到第一输出结果。
编码器(对应图8中的Encoder)内部结构如图9所示,其中Multi-Head Attention是多重自我注意力机制的结合。具体过程如:X的输入值的大小为(Dm,Dn),第一个自我注意力机制在第一次运行时初始化为三个矩阵WQ,WK,WV,这三个矩阵具有相同的高度即Dn,宽度为DQ,DK,DV,DQ=DK,自我注意力机制使用以下公式将输入的X编码为三个矩阵,命名为查询Q、键K、值V,该公式可表示如下:
Q=X·WQ (5)
K=X·WK (6)
V=X·WV (7)
自我注意力机制输出值的加权和,通过查询和键乘积计算权重:
Multi-head Attention并行运行自我注意力机制,独立的自注意机制输出经过级联和线性变换成为其最终的输出,可表示如下:
MultiHead(X)=Concat(head1,head2,...,headd)WO (9)
where headi=Attention(X·Wi Q,X·Wi K,X·Wi V) (10)
其中d为head的数量,WO为要学习的参数矩阵。
随后,用一个由全连接层实现的前馈神经网络将其输入数据的形状转换成Dn的大小和编码器原始输入数据的形状相同。另一个带残差的LayerNormalization模块给出编码器的最终输出(即步骤S404的第一输出结果)。给定输入编码器的输出的结果可表示为:
作为一种可选的实施方式,步骤S404中的至少一个编码器包括两个并行独立运行的编码器(对应图8中b部分的Encoder),本实施例命名为talking-encoder。两个编码器的输出结果相加,即/>然后将he输入至全连接层中,其可定义为:
hb=f(wfbhe+bfb) (13)
其中wfb和bfb都是可学习的参数。
需要说明的是,步骤S404中可将时空嵌入层的输出结果输入至一个编码器中,但根据实验结果,本实施例设计的talking-encoder的预测效果会明显优于只有一个编码器的情况。步骤S404中还可将时空嵌入层的输出结果输入至并行且独立的三个以上编码器中,但这种情况取决于计算机算力,通常情况下不选择这种情况。
S405、将预处理后的空间数据输入至依次连接的编码器和全连接层中,得到第二输出结果。
此步骤对应图8中c部分。空间数据在经过步骤S401的预处理之后,本步骤使用与talking-encoder结构相同的编码器(对应图8中c部分的Encoder)来建模所有区域的功能相似性,由于空间数据的POIs与时间序列无关,所以在输入编码器之前不需要进行位置编码。
S406、将第一输出结果和第二输出结果进行级联并输入全连接层中,得到预测结果。此步骤对应图8中d部分。
综上,本方法使用了基于BERT的深度空时神经网络模型进行训练和预测,模型利用Positional Embedding对时间序列的顺序进行标注;模型中的编码器采用了Multi-headAttention机制,并用自注意力机制可以并行计算,借鉴了RoBERTa+中提出的Multi-HeadAttention算法,能够通过设计更大的维度查询和键矩阵来提高模型拟合能力;另外加入本实施例设计的talking-encoder结构,能够进一步提升模型的拟合能力。与现有的神经网络预测模型相比较,本模型由于不包含RNN单元,能够支持并行运行,因此能够极大的提升训练和预测的时间效率。而且由于加入包括历史需求、气象特征和事件特征的时态数据和包括若干POIs的空间数据作为训练集对模型进行训练,充分考虑了气象特征和事件特征等外部因素和POIs所代表的地区功能相似性对用车需求量的影响,极大的提升了模型预测的准确度。
作为一种可选的实施方式,选择使用Tensorflow实现上述基于BERT的深度空时神经网络模型的构建,Tensorflow是一个开源的、基于Python的机器学习框架,其在图形分类、音频处理、推荐系统和自然语言处理等场景下有着丰富的应用。本实施例设置模型参数如下:在图8 b部分中,Encoder的个数为2,而编码器的头数为3,每个头的密钥大小为64(即3个头为3×64)。在图8c部分中,编码器的头数是1,每个头的密钥大小是64(即总数也是1*64=64)。所有编码器的下降率设置为0.1;使用的所有激活函数都是elu;使用Adam作为优化来最小化,其中β1设为0.9,β2设为0.98,epsilon设为le-9。
第二实施例;
使用基于第一实施例训练完成的模型进行预测,其中模型通过Tensorflow实现,参数的设置与第一实施例相同。
下表1为使用本模型方法与使用现有预测模型方法在性能MAPE和RMSE方面所产生的效果对比表:
表1
其中,HA通过对整个训练集中每天相应时间间隔内该区域的历史需求进行平均,来预测未来的需求;ARIMA(回归综合移动平均)是由自回归滑动平均(ARMA)模型推广而来的时间序列分析和预测的著名模型;XGBoost是一个基于boosting树的高效机器学习库,它通过前n个时间间隔的历史需求指标为输入;MLP(多层感知器)是由多个完全连接的层组成的深层神经网络。实验时,建立了一个包含4个隐层的MLP模型,分别由128、64、32、8个神经元组成。与XGBoost类似,MLP模型使用以前的n个时间间隔作为输入;ConvLSTM是LSTM的一个变种,它在LSTM单元的每个门处用CNN代替矩阵乘法,现在是一个著名的时空数据建模模型。ConvLSTM利用近n个时间间隔和邻近的s*s区域作为输入,预测下一个时间间隔内每个区域的用车需求;DMVST网是一种基于深度学习的预测未来用车需求的方法。该方法利用局部CNN捕捉邻近区域的局部空间关系,LSTM利用过去几个时间间隔内的数据捕捉时间关系。CSTN是一个包含局部空间上下文、时间演化上下文和全局关联上下文的上下文化时空用车需求预测网络。
从表1可以看出本模型方法优于现有方法。在进行比较的所有方法中,本模型的MAPE最低(0.244),RMSE最低(7.887)。ARIMA是最差的方法,它不能捕捉动态的时间关系,忽略了空间特征,同样差的还包括HA、XGBoost和MLP。ConvLSTM、DMVST-Net和CSTN利用时间和空间特征预测未来用车需求,但未能捕捉到用车需求的动态弱周期性时间关系,也忽略了功能相似性对用车需求的影响。
表2
其中表2不同方法的效率对比表。
第三实施例;
参照图10,提供了一种城市用车需求量预测设备,该设备可以是任意类型的智能终端,例如手机、平板电脑、个人计算机等。具体地,该设备包括:一个或多个控制处理器和存储器,这里以一个控制处理器为例。控制处理器和存储器可以通过总线或者其他方式连接,这里以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态性计算机可执行程序以及模块,如本发明实施例中的城市用车需求量预测设备对应的程序指令/模块。控制处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而实现上述方法实施例的城市用车需求量预测方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于控制处理器远程设置的存储器,这些远程存储器可以通过网络连接至该城市用车需求量预测设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器中,当被所述一个或者多个控制处理器执行时,执行上述方法实施例中的城市用车需求量预测方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器执行上述方法实施例中的城市用车需求量预测方法。
通过以上的实施方式的描述,本领域技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现。本领域技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read Only Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (8)
1.一种城市用车需求量预测方法,其特征在于,包括以下步骤:
S100、将待预测区域划分成若干网格;
S200、采集各个所述网格内的时态数据和空间数据作为训练集,所述时态数据包括气象特征、事件特征和历史需求,所述空间数据包括全部所述网格中各类POIs的数量;所述事件特征包括:节假日事件、工作日事件和周末事件;
S300、将所述训练集输入至预设的基于BERT的深度空时神经网络模型进行训练;
S400、通过训练完成的所述基于BERT的深度空时神经网络模型对所述待预测区域中任意区域的下一时段的用车需求量进行预测;
所述基于BERT的深度空时神经网络模型的预测,包括步骤:对所述时态数据和所述空间数据进行预处理;
将预处理后的所述时态数据输入至位置嵌入层进行时间顺序调整;
将所述位置嵌入层的输出结果输入至时空嵌入层,所述时空嵌入层包括一个多层感知器;
将所述时空嵌入层的输出结果输入至至少一个编码器中,所述至少一个编码器的输出结果输入至全连接层,得到第一输出结果;
将预处理后的所述空间数据输入至依次连接的编码器和全连接层中,得到第二输出结果;
将所述第一输出结果和所述第二输出结果进行级联并输入全连接层中,得到预测结果。
2.根据权利要求1所述的城市用车需求量预测方法,其特征在于,所述至少一个编码器为两个并行独立运行的编码器。
3.根据权利要求1所述的城市用车需求量预测方法,其特征在于,将所述训练集输入至预设的基于BERT的深度空时神经网络模型中进行训练之后,还包括步骤:通过测试集对训练完成的所述基于BERT的深度空时神经网络模型进行测试。
4.根据权利要求1所述的城市用车需求量预测方法,其特征在于,所述对所述时态数据进行预处理,包括步骤:
将所述气象特征和所述事件特征分别输入至对应的第一全连接层;
将两个所述第一全连接层的输出结果和所述历史需求共同输入至第二全连接层,得到所述时态数据的预处理结果。
5.根据权利要求1所述的城市用车需求量预测方法,其特征在于,所述气象特征包括:温度、湿度、能见度、风速、降水量和天气情况。
6.根据权利要求1所述的城市用车需求量预测方法,其特征在于,所述POIs包括住宅区、教育设施、文化设施、娱乐设施、社会服务设施、交通设施、商业设施、政府设施、宗教设施、卫生服务设施、公共安全设施和水源设施。
7.一种城市用车需求量预测设备,其特征在于,包括:至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如权利要求1至6任一项所述的城市用车需求量预测方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至6任一项所述的城市用车需求量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011350498.6A CN112330215B (zh) | 2020-11-26 | 2020-11-26 | 一种城市用车需求量预测方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011350498.6A CN112330215B (zh) | 2020-11-26 | 2020-11-26 | 一种城市用车需求量预测方法、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112330215A CN112330215A (zh) | 2021-02-05 |
CN112330215B true CN112330215B (zh) | 2024-02-02 |
Family
ID=74308910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011350498.6A Active CN112330215B (zh) | 2020-11-26 | 2020-11-26 | 一种城市用车需求量预测方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112330215B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113222287A (zh) * | 2021-06-01 | 2021-08-06 | 平安科技(深圳)有限公司 | 网约车需求预测方法、装置、设备及存储介质 |
CN113469739B (zh) * | 2021-06-25 | 2024-05-28 | 广州宸祺出行科技有限公司 | 一种用于网约车的打车需求的预测方法及系统 |
CN113537459B (zh) * | 2021-06-28 | 2024-04-26 | 淮阴工学院 | 一种药品库房温湿度预测方法 |
CN113379164B (zh) * | 2021-07-16 | 2024-03-26 | 国网江苏省电力有限公司苏州供电分公司 | 基于深度自注意力网络的负荷预测方法及系统 |
CN113689721B (zh) * | 2021-07-30 | 2022-09-20 | 深圳先进技术研究院 | 一种自动驾驶车速控制方法、系统、终端以及存储介质 |
CN113920390B (zh) * | 2021-09-17 | 2024-10-18 | 北京交通大学 | 一种基于多模态深度学习模型的列车延误预测方法 |
CN113850444B (zh) * | 2021-10-14 | 2024-03-26 | 重庆邮电大学 | 一种基于引导注意机制的旅游需求时间序列预测方法 |
CN114154740A (zh) * | 2021-12-10 | 2022-03-08 | 杭州电子科技大学上虞科学与工程研究院有限公司 | 基于兴趣点时空残差神经网络的多方向交通流量预测方法 |
CN114239971A (zh) * | 2021-12-20 | 2022-03-25 | 浙江大学 | 基于Transformer注意力机制的日降水量预测方法 |
CN114118630B (zh) * | 2022-01-24 | 2022-05-17 | 中汽数据(天津)有限公司 | 一种基于气象事件的需求量预测方法和系统 |
CN114091361B (zh) * | 2022-01-24 | 2022-05-17 | 中汽数据(天津)有限公司 | 基于气象事件的transformer模型构建方法 |
CN116341773A (zh) * | 2023-06-01 | 2023-06-27 | 北京阿帕科蓝科技有限公司 | 车辆需求预测方法、装置、计算机设备和存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012043296A (ja) * | 2010-08-20 | 2012-03-01 | Ntt Docomo Inc | 需要予測システム及び需要予測方法 |
CN107529651A (zh) * | 2017-08-18 | 2018-01-02 | 北京航空航天大学 | 一种基于深度学习的城市交通客流预测方法和设备 |
CN108629503A (zh) * | 2018-04-28 | 2018-10-09 | 南通大学 | 一种基于深度学习的出租车上车需求量的预测方法 |
CN108985475A (zh) * | 2018-06-13 | 2018-12-11 | 厦门大学 | 基于深度神经网络的网约车召车需求预测方法 |
CN110599767A (zh) * | 2019-09-04 | 2019-12-20 | 广东工业大学 | 一种基于网约车出行需求的长短期预测方法 |
CN111310008A (zh) * | 2020-03-20 | 2020-06-19 | 北京三快在线科技有限公司 | 搜索意图识别方法、装置、电子设备和存储介质 |
CN111340543A (zh) * | 2020-02-25 | 2020-06-26 | 上海大学 | 一种基于注意力机制的细粒度打车需求预测方法 |
CN111507762A (zh) * | 2020-04-15 | 2020-08-07 | 中国科学院自动化研究所 | 基于多任务共预测神经网络的城市出租车需求预测方法 |
CN111833088A (zh) * | 2019-09-17 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种供需预测方法及装置 |
CN111862579A (zh) * | 2020-06-10 | 2020-10-30 | 深圳大学 | 一种基于深度强化学习的出租车调度方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10102485B2 (en) * | 2015-01-29 | 2018-10-16 | Conduent Business Services, Llc | Method and system for predicting demand for vehicles |
JP6802916B2 (ja) * | 2017-05-11 | 2020-12-23 | 株式会社Nttドコモ | 需要予測装置 |
-
2020
- 2020-11-26 CN CN202011350498.6A patent/CN112330215B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012043296A (ja) * | 2010-08-20 | 2012-03-01 | Ntt Docomo Inc | 需要予測システム及び需要予測方法 |
CN107529651A (zh) * | 2017-08-18 | 2018-01-02 | 北京航空航天大学 | 一种基于深度学习的城市交通客流预测方法和设备 |
CN108629503A (zh) * | 2018-04-28 | 2018-10-09 | 南通大学 | 一种基于深度学习的出租车上车需求量的预测方法 |
CN108985475A (zh) * | 2018-06-13 | 2018-12-11 | 厦门大学 | 基于深度神经网络的网约车召车需求预测方法 |
CN110599767A (zh) * | 2019-09-04 | 2019-12-20 | 广东工业大学 | 一种基于网约车出行需求的长短期预测方法 |
CN111833088A (zh) * | 2019-09-17 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种供需预测方法及装置 |
CN111340543A (zh) * | 2020-02-25 | 2020-06-26 | 上海大学 | 一种基于注意力机制的细粒度打车需求预测方法 |
CN111310008A (zh) * | 2020-03-20 | 2020-06-19 | 北京三快在线科技有限公司 | 搜索意图识别方法、装置、电子设备和存储介质 |
CN111507762A (zh) * | 2020-04-15 | 2020-08-07 | 中国科学院自动化研究所 | 基于多任务共预测神经网络的城市出租车需求预测方法 |
CN111862579A (zh) * | 2020-06-10 | 2020-10-30 | 深圳大学 | 一种基于深度强化学习的出租车调度方法及系统 |
Non-Patent Citations (11)
Title |
---|
BERT-Based Deep Spatial-Temporal Network for Taxi Demand Prediction;Dun Cao等;《IEEE Transactions on Intelligent Transportation Systems》;第23卷(第7期);9442-9454 * |
Contextualized Spatial–Temporal Network for Taxi Origin-Destination Demand Prediction;Lingbo Liu等;《 IEEE Transactions on Intelligent Transportation Systems》;第20卷(第10期);3875 - 3887 * |
Mingming Wu等.Multi-Task Spatial-Temporal Graph Attention Network for Taxi Demand Prediction.《ICMAI '20: Proceedings of the 2020 5th International Conference on Mathematics and Artificial Intelligence》.2020,224–228. * |
基于BP神经网络的网约车出行需求短时预测;郭瑞雪;《中国优秀硕士学位论文全文数据库 (信息科技辑)》(第01期);I140-223 * |
基于GWO-LSTM的网约车需求短时预测模型;许伦辉等;《自动化与仪表》;第35卷(第05期);86-90+108 * |
基于供需平衡的高铁站片区交通组织优化研究——以潍坊高铁城为例;张沛;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》(第09期);C034-325 * |
基于深度CNN-LSTM-ResNet组合模型的出租车需求预测;段宗涛等;《交通运输系统工程与信息》;第18卷(第04期);215-223 * |
基于深度学习的交通预测方法研究;张宇等;《电脑知识与技术》;第15卷(第36期);182-183 * |
数据智能:趋势与挑战;吴俊杰等;《系统工程理论与实践》;第40卷(第08期);2116-2149 * |
时空序列预测方法综述;黎维等;《计算机应用研究》;第37卷(第10期);2881-2888 * |
网约车出行需求预测方法;席殷飞等;《上海大学学报(自然科学版)》;第26卷(第03期);328-341 * |
Also Published As
Publication number | Publication date |
---|---|
CN112330215A (zh) | 2021-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112330215B (zh) | 一种城市用车需求量预测方法、设备及存储介质 | |
Chen et al. | Uncertainty in urban mobility: Predicting waiting times for shared bicycles and parking lots | |
Li et al. | Deep learning based parking prediction on cloud platform | |
Kim et al. | Idle vehicle relocation strategy through deep learning for shared autonomous electric vehicle system optimization | |
CN111009129B (zh) | 基于时空深度学习模型的城市道路交通流预测方法及装置 | |
CN113762338B (zh) | 一种基于多重图注意力机制的交通流预测方法、设备及介质 | |
CN114692984B (zh) | 基于多步耦合图卷积网络的交通预测方法 | |
CN110210664B (zh) | 多个个体车辆使用行为短时预测的深度学习方法 | |
CN111242395B (zh) | 用于od数据的预测模型构建方法及装置 | |
CN113362637B (zh) | 一种区域性多场点空余停车位预测方法及系统 | |
Su et al. | Operating status prediction model at EV charging stations with fusing spatiotemporal graph convolutional network | |
CN113112791A (zh) | 一种基于滑动窗口长短时记忆网络的交通流量预测方法 | |
CN113935580A (zh) | 一种电动汽车协调充电优化调度系统 | |
CN110796317A (zh) | 一种基于需求预测的城市出租车调度方法 | |
CN112382081A (zh) | 一种基于多任务的交通流量预测方法 | |
Zhao et al. | Unifying Uber and taxi data via deep models for taxi passenger demand prediction | |
CN114066503A (zh) | 一种基于构建虚拟服务片区进行出租车需求预测的方法 | |
CN113674524A (zh) | 基于lstm-gasvr的多尺度短时交通流预测建模、预测方法及系统 | |
Huang et al. | Predicting urban rail traffic passenger flow based on LSTM | |
CN116153125A (zh) | 一种基于ida-rnn模型的空间维度公交到达时间预测方法 | |
CN113821547B (zh) | 快速高效的停车场占有率短时预测方法、系统及存储介质 | |
CN113947250B (zh) | 一种基于有限数据资源的城市细粒度流量预测方法及系统 | |
CN117272849B (zh) | 区域停车场饱和度的预测方法、系统及可读存储介质 | |
CN110490365A (zh) | 一种基于多源数据融合预测网约车订单量的方法 | |
CN115860798A (zh) | 一种城市出租车需求预测系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |