WO2024065954A1

WO2024065954A1 - 停车场泊位占用率短时域预测方法、系统、设备及终端

Info

Publication number: WO2024065954A1
Application number: PCT/CN2022/129957
Authority: WO
Inventors: 晏鹏宇; 谢皓宇; 蔡小强
Original assignee: 电子科技大学长三角研究院(湖州)
Priority date: 2022-09-28
Filing date: 2022-11-04
Publication date: 2024-04-04
Also published as: CN115564078A

Abstract

一种停车场泊位占用率短时域预测方法、系统、设备及终端，属于数据分析技术领域。该方法包括：基于停车场的历史泊位占用率数据，构建泊位占用率时序数据（S101）；通过时序数据矩阵构建方法，将时序数据拆分为长度相同的时序数据子集，构建时序数据矩阵（S102）；随机选取时序数据矩阵中的数据，结合梯度上升决策树模型，对模型进行训练（S103）；使用训练后的梯度上升决策树模型对停车场的占用率进行预测（S104）。将常规泊位占用率预测中使用的时序数据，扩充为一个时序数据矩阵，在时序数据矩阵的基础上，随机选取矩阵中的数据结合梯度上升决策树模型对模型进行训练和预测，从而使模型能更好地学习到泊位占用率变化的规律，提高停车场泊位占用率短时域预测的准确度。

Description

停车场泊位占用率短时域预测方法、系统、设备及终端

技术领域

本发明属于数据分析技术领域，尤其涉及一种停车场泊位占用率短时域预测方法、系统、设备及终端。

背景技术

目前，国内外停车场泊位占用率预测方法主要使用停车场历史泊位占用率这一单变量时间序列数据对未来较长时域内以天或者周为时间单位的停车场泊位占用率进行预测。近年来随着智慧停车技术的发展，部分方法考虑短时域(如5分钟～180分钟)内泊位占用率预测。短时域的泊位预约结果将为未来智慧城市建设中预约停车等静态交通服务提供泊位资源使用的实时数据。但由于短时域的泊位占用率受到多种随机因素的影响，在有限的数据中很难完整捕捉到泊位占用率的规律，因此目前这类预测方法效果欠佳，无法较为准确的预测泊位占用率在较短时间内的变化。其原因之一在于这些预测方法对于停车场历史占用率数据这一时序数据的处理方式都是将其作为一条数据按照时间先后顺序进行训练集和测试集的拆分，前部分时间的数据作为模型的训练部分，也就是说模型学习到的只是前部分时间数据的规律，且后部分时间的数据规律并不能进行有效学习，因此当后部分的数据规律与前部分差异较大时，会导致模型的预测效果有所欠缺。而本发明提出的基于时序数据矩阵的停车场泊位占用率短时域预测方法有效地解决了这一问题。

通过上述分析，现有技术存在的问题及缺陷之一为：由于短时域的泊位占用率受到多种随机因素的影响，前后数据的变化规律往往不同，而现有技术的数据处理方法只能使得预测方法学习到前半段的泊位占用率规律，故目前短时域的泊位预测方法在后半段数据上的预测效果欠佳，无法较为准确的预测泊位占用率在较短时间内的变化。

发明内容

针对现有技术存在的问题，本发明提供了一种停车场泊位占用率短时域预测方法、系统、设备及终端，尤其涉及一种基于时序数据矩阵的停车场泊位占用率短时域预测方法、系统、设备及终端。

本发明是这样实现的，一种停车场泊位占用率短时域预测方法，所述停车场泊位占用率短时域预测方法包括：利用停车场收费管理系统后台记录的车辆出入记录，通过数据整理与统计，得到历史泊位占用率数据，使用本发明提出的时序矩阵构建方法，构建出时序数据矩阵作为后续预测方法的将使用到的数据，并随机选取矩阵中的数据结合梯度上升决策树模型对模型进行训练和测试，提高停车场泊位占用率短时域预测的准确度。

进一步，所述停车场泊位占用率短时域预测方法包括以下步骤：

步骤一，利用停车场收费管理系统后台记录的车辆出入记录，通过数据整理与统计，得到历史泊位占用率数据，数据获取简单，不涉及隐私数据，为后续时序数据矩阵的构建提供了数据基础；

步骤二，使用时序数据矩阵构建方法，将时序数据拆分为长度相同的时序数据子集，构建时序数据矩阵，矩阵中的每一行数据都是一条可供后续预测模型训练与测试的一条相邻时间段内的数据，保证后续随机选取数据时模型能学习到泊位占用率变化的规律；

步骤三，随机选取时序数据矩阵中的数据，结合梯度上升决策树模型，对模型进行训练，随机选取数据使得模型能学习到整个泊位占用率记录时间段内的泊位占用率变化规律，同时梯度上升决策树模型本身具有较强的泛化性能，使得泊位占用率的预测准确度上升；

步骤四，使用训练后的梯度上升决策树模型对停车场的占用率进行预测，这是本方法最终输出的部分，相比用一条时序数据进行训练的模型得出更加准确的预测结果。

进一步，所述步骤一中的泊位占用率时序数据，是指按时间顺序构建的等时间间隔的停车场泊位占用率数据；泊位占用率是指某时刻停车场已使用的车位数与总车位数的比值，时间间隔取任意时长。

进一步，构建泊位占用率时序数据时，所述时间间隔优先选取5～180分钟。

进一步，所述步骤二中的时序数据矩阵构建方法，用于根据一条泊位占用率时序数据，将其拆分为大小相同的时序数据子集，构建一个时序数据矩阵。

所述时序数据矩阵构建方法具体包括：

当某停车场的在某天运营时段内泊位占用率时序数据为O＝(O ₁,O ₂,…,O _t,…,O _T)，长度为T，其中O _t表示t时刻停车场的泊位占用率值；所述时序数据子集是指长度小于T的泊位占用率时序数据，且时序数据子集中的数据为相邻时刻的泊位占用率，如(O ₁,O ₂,O ₃)为前述时序数据O的子集；建立列数为N的时序数据矩阵，对应的时序数据子集为

共有M＝T-N+1个子集，并将其按行拼接为时序数据矩阵；当时序数据矩阵的列数为N，实际意义为使用前N-1个时刻的泊位占用率数据，作为模型输入，预测第N个时刻的泊位占用率，作为模型输出。

进一步，所述步骤三中的梯度上升决策树模型，是指串行生成一系列CART回归树，每一颗树不断拟合上一棵树学习后的残差，逐渐学习到真实值的模型，其训练数据为所述时序数据矩阵中随机选取的数据。

在梯度上升决策树模型的训练与测试中，将时序数据矩阵中的数据按任意比例分为训练集和测试集；其中，所述训练集和测试集的比例优选为7：3。

本发明的另一目的在于提供一种应用所述的停车场泊位占用率短时域预测方法的停车场泊位占用率短时域预测系统，所述停车场泊位占用率短时域预测系统包括：

时序数据构建模块，用于基于停车场的历史泊位占用率数据，构建泊位占用率时序数据；

时序数据矩阵构建模块，用于通过时序数据矩阵构建方法，将时序数据拆分为长度相同的时序数据子集，构建时序数据矩阵；

模型训练模块，用于随机选取时序数据矩阵中的数据，结合梯度上升决策树模型，对模型进行训练；

停车场占用率预测模块，用于使用训练后的梯度上升决策树模型对停车场的占用率进行预测。

本发明的另一目的在于提供一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行所述的停车场泊位占用率短时域预测方法的步骤。

本发明的另一目的在于提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行所述的停车场泊位占用率短时域预测方法的步骤。

本发明的另一目的在于提供一种信息数据处理终端，所述信息数据处理终端用于实现所述的停车场泊位占用率短时域预测系统。

结合上述的技术方案和解决的技术问题，本发明所要保护的技术方案所具备的优点及积极效果为：

本发明提供的停车场泊位占用率短时域预测方法，主要利用停车场后台记录的历史泊位占用率数据，其核心在于使用原始数据，构建时序数据矩阵。首先，获取停车场的历史泊位占用率数据，构建一条占用率时序数据；然后，使用本发明提出的时序数据矩阵构建方法，将原始数据数据构建为一个时序数据矩阵，矩阵中的每一条数据都是原始时序数据的一个子集；其次，随机选取时序数据矩阵中的数据，结合梯度上升决策树模型，对模型进行训练；最后使用训练后的梯度上升决策树模型对停车场的泊位占用率进行预测。本发明将常规泊位占用率预测中使用的一条时序数据，扩充为一个时序数据矩阵，在时序数据矩阵的基础上，随机选取时序数据供泊位占用率预测模型进行训练，从而使模型能更好地学习到泊位占用率变化的规律，提高泊位占用率的预测准确度。

本发明提供了一种基于时序数据矩阵的停车场泊位占用率短时域预测方法，利用停车场收费管理系统后台记录的车辆出入记录，通过数据整理与统计，得到历史泊位占用率数据，使用本发明提出的时序矩阵构建方法，构建出时序数据矩阵作为后续预测方法的将使用到的数据，矩阵中的每一行数据都是一条可供后续预测模型训练与测试的一条相邻时间段内的数据，保证后续随机选取数据时模型能学习到泊位占用率变化的规律，并随机选取矩阵中的数据结合梯度上升决策树模型对模型进行训练和测试，随机选取数据使得模型能学习到整个泊位占用率记录时间段内的泊位占用率变化规律，提高停车场泊位占用率短时域预测的准确度

本发明的技术方案转化后的预期收益和商业价值为：目前各大城市开始推进建设城市级的智慧停车系统，该系统集查询、预约、导航和收费于一体，将该方法嵌入到智慧停车系统为智慧停车预约系统提供更加准确的泊位占用率预测。有益效果为，第一：更准确的泊位占用率预测，用户在进行查询预约车位时，更好地了解其到达目的地附近时停车场的拥挤情况，可以帮助用户根据自身情况更好地选择预约停车位，有效避免出现因预测效果与实际差距较大而影响用户满意度降低的情况，同时帮助用户在停车时避免拥堵和减少寻位时间；第二，更准确的泊位占用率预测，可以帮助系统更好地为用户进行停车场推荐和停车场定价决策，可优先推荐空闲车场，有效地调整区域内停车场泊位占用率的平衡，减少因停车场拥挤而带来的交通拥堵和环境污染。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图做简单的介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的停车场泊位占用率短时域预测方法流程图；

图2是本发明实施例提供的时序数据矩阵构建方法将一条长度为T的时序数据构建为列数为N的时序数据矩阵的示意图；

图3是本发明实施例提供的某停车场下使用一条时序数据顺序选取时序数据(常规方法)和时序数据矩阵随机选取时序数据(本发明提出的方法)作为模型的训练集训练后在测试集上的泊位占用率预测结果对比图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

针对现有技术存在的问题，本发明提供了一种停车场泊位占用率短时域预测方法、系统、设备及终端，下面结合附图对本发明作详细的描述。

为了使本领域技术人员充分了解本发明如何具体实现，该部分是对权利要求技术方案进行展开说明的解释说明实施例。

实施例1

如图1所示，本发明实施例提供的停车场泊位占用率短时域预测方法包括以下步骤：

S101，基于停车场的历史泊位占用率数据，构建泊位占用率时序数据；

S102，通过时序数据矩阵构建方法，将时序数据拆分为长度相同的时序数据子集，构建时序数据矩阵；

S103，随机选取时序数据矩阵中的数据，结合梯度上升决策树模型，对模型进行训练；

S104，使用训练后的梯度上升决策树模型对停车场的占用率进行预测。

本发明实施例提供的泊位占用率时序数据，是指按时间顺序构建的等时间间隔的停车场泊位占用率数据，泊位占用率是指某时刻停车场已使用的车位数与总车位数的比值，时间间隔可取任意时长；优选地，时间间隔选取5～180分钟。

本发明实施例提供的时序数据矩阵构建方法，用于根据一条泊位占用率时序数据，将其拆分为大小相同的时序数据子集，构建一个时序数据矩阵。

本发明实施例提供的时序数据矩阵构建方法，具体为：

假设某停车场的在某天运营时段内泊位占用率时序数据为O＝(O ₁,O ₂,…,O _t,…,O _T)，其长度为T，其中O _t表示t时刻停车场的泊位占用率值。所述时序数据子集是指长度小于T的泊位占用率时序数据，且时序数据子集中的数据为相邻时刻的泊位占用率，如(O ₁,O ₂,O ₃)为前述时序数据O的子集。建立列数为N的时序数据矩阵，对应的时序数据子集为

一共有M＝T-N+1个子集，并将其按行拼接为时序数据矩阵。假设时序数据矩阵的列数为N，其实际意义为使用前N-1个时刻的泊位占用率数据，作为模型输入，预测第N个时刻的泊位占用率，作为模型输出。

本发明实施例提供的梯度上升决策树模型，是指串行生成一系列CART回归树，每一颗树不断拟合上一棵树学习后的残差，逐渐学习到真实值的模型，其训练数据为所述时序数据矩阵中随机选取的数据。

本发明实施例中，在梯度上升决策树模型的训练与测试中，将时序数据矩阵中的数据按任意比例，如7：3，分为训练集和测试集。

本发明实施例提供的停车场泊位占用率短时域预测系统包括：

实施例2

作为优选实施例，本发明实施例提供的基于时序数据矩阵的停车场泊位占用率短时域预测方法，利用停车场后台记录的历史泊位占用率数据，构建出时序数据矩阵，并随机选取矩阵中的数据结合梯度上升决策树模型对模型进行训练和预测。其中，本发明实施例提供的时序数据矩阵构建方法为：

如图2所示，假设某停车场的泊位占用率时序数据为O＝(O ₁,O ₂,O ₃,O ₄,O ₅)，其长度为5，其中O ₁＝55％，O ₂＝50％，O ₃＝65％，O ₄＝58％，O ₅＝52％。假设时序数据矩阵的列数为3，对应的时序数据子集为

一共3个子集，并将其按行拼接为矩阵。

为了证明本发明的技术方案的创造性和技术价值，该部分是对权利要求技术方案进行具体产品上或相关技术上的应用实施例。

本发明实施例提供在某省会城市某医院停车在2019.8.1-2020.8.21期间的782362条真实数据值下，分别使用一条时序数据顺序选取时序数据(常规方法)和时序数据矩阵随机选取时序数据(本发明实施例提出的方法)作为模型的训练集训练后，在测试集上的泊位占用率预测结果；本发明实施例分别采用了三种常用的泊位占用率预测模型：线性回归、梯度上升决策树、神经网络，评价指标为平均绝对误差，表达式如下：

其中M为测试集的中时序数据子集数，

为模型在t时刻的预测值，y _t为车场在t时刻的真实值。

如图3所示，为本发明实施例分别采用三种常用的泊位占用率预测模型的泊位占用率预测结果对比图，可以看到，使用本发明的时序数据矩阵选取训练集，能够减小预测的平均绝对误差，即能够有效提高预测准确度。

本发明实施例在研发或者使用过程中取得了一些积极效果，和现有技术相比的确具备很大的优势，下面内容结合试验过程的数据、图表等进行描述。

下面我们将对本发明提出的方法在测试集带来的效果提升提供简单的数学理论分析：

假设按传统的数据处理方法即按时间先后顺序拆开训练集和测试集，训练集的数据(数据记录时间段内前部分时间的数据)分布服从随机变量

其中μ ₁为X ₁的均值，

为X ₁的方差，测试集的数据(数据记录时间段内后部分时间的数据)分布服从随机变量

传统的数据处理方法，模型学习到的数据分布只是X ₁，本发明提出的时序矩阵构建方法，将一条时序数据构建为时序数据矩阵，并随机选取数据为模型提供训练后，模型学习到的数据分布是X ₁和X ₂的加权平均。

情况1：随机变量X ₁和X ₂服从相同或相似的分布，即数据记录时间段内前后段时间内的数据变化规律相同或相似，假设那么通过传统数据处理方法和本发明提出的时序数据矩阵，模型训练结果均与X ₁具有相同或相似的分布，两者在测试集上的预测结果也相同或相似，其实我们提出的方法效果不差于传统方法；

情况2：随机变量X ₁和X ₂服从的分布差距很大，可认为X ₁和X ₂相互独立，假设训练集和测试集的比例为a:b，在传统方法下模型学习的数据分布服从随机变量

其与测试集的平均绝对误差为：

在本发明提出的方法下模型学习的数据分布服从随机变量

其与测试集(其数据分布也服从

)的平均绝对误差为：

即在训练集和测试集中的数据都仅服从一个分布时，理想情况下，我们提出的方法会是预测误差降为0，优于传统方法。

但预测误差一般不为0，因为训练集和测试集中，相同分布的随机变量的比例不一定是相同的，而且这些数据往往都不只服从一个分布，即模型学习到的数据分布只是众多的随机变量的加权平均，在相同分布随机变量集合中测试，也会存在误差，参考线性回归。而我们提出的方法能有效降低当训练集和测试集的数据服从的随机变量分布不同时带来的误差，使得模型的预测效果更好。

应当注意，本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现；软件部分可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用由各种类型的处理器执行的软件实现，也可以由上述硬件电路和软件的结合例如固件来实现。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，都应涵盖在本发明的保护范围之内。

Claims

一种停车场泊位占用率短时域预测方法，其特征在于，所述停车场泊位占用率短时域预测方法包括：利用停车场收费管理系统后台记录的历史泊位占用率数据，构建出时序数据矩阵，并随机选取矩阵中的数据结合梯度上升决策树模型对模型进行训练和预测，确定停车场泊位占用率短时域。
如权利要求1所述的停车场泊位占用率短时域预测方法，其特征在于，所述停车场泊位占用率短时域预测方法包括以下步骤：

步骤一，基于停车场的历史泊位占用率数据，构建泊位占用率时序数据；

步骤二，通过时序数据矩阵构建方法，将时序数据拆分为长度相同的时序数据子集，构建时序数据矩阵；

步骤三，随机选取时序数据矩阵中的数据，结合梯度上升决策树模型，对模型进行训练；

步骤四，使用训练后的梯度上升决策树模型对停车场的占用率进行预测。
如权利要求2所述的停车场泊位占用率短时域预测方法，其特征在于，所述步骤一中的泊位占用率时序数据，是指按时间顺序构建的等时间间隔的停车场泊位占用率数据；泊位占用率是指某时刻停车场已使用的车位数与总车位数的比值，时间间隔取任意时长。
如权利要求3所述的停车场泊位占用率短时域预测方法，其特征在于，构建泊位占用率时序数据时，所述时间间隔优先选取5～180分钟。
如权利要求2所述的停车场泊位占用率短时域预测方法，其特征在于，所述步骤二中的时序数据矩阵构建方法，用于根据一条泊位占用率时序数据，拆分为大小相同的时序数据子集，构建一个时序数据矩阵；

所述时序数据矩阵构建方法具体包括：

当停车场在运营时段内泊位占用率时序数据为O＝(O ₁,O ₂,…,O _t,…,O _T)，长度为T，其中O _t表示t时刻停车场的泊位占用率值；所述时序数据子集是指长度小于T的泊位占用率时序数据，且时序数据子集中的数据为相邻时刻的泊位占用率；建立列数为N的时序数据矩阵，对应的时序数据子集为

共有M＝T-N+1个子集，并按行拼接为时序数据矩阵。
如权利要求2所述的停车场泊位占用率短时域预测方法，其特征在于，所述步骤三中的梯度上升决策树模型，是指串行生成一系列CART回归树，每一颗树不断拟合上一棵树学习后的残差，逐渐学习到真实值的模型，其训练数据为所述时序数据矩阵中随机选取的数据；

在梯度上升决策树模型的训练与测试中，将时序数据矩阵中的数据按任意比例分为训练集和测试集；其中，所述训练集和测试集的比例优选为7：3。
一种应用如权利要求1～6任意一项所述的停车场泊位占用率短时域预测方法的停车场泊位占用率短时域预测系统，其特征在于，所述停车场泊位占用率短时域预测系统包括：

时序数据构建模块，用于基于停车场的历史泊位占用率数据，构建泊位占用率时序数据；

时序数据矩阵构建模块，用于通过时序数据矩阵构建方法，将时序数据拆分为长度相同的时序数据子集，构建时序数据矩阵；

模型训练模块，用于随机选取时序数据矩阵中的数据，结合梯度上升决策树模型，对模型进行训练；

停车场占用率预测模块，用于使用训练后的梯度上升决策树模型对停车场的占用率进行预测。
一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1～6任意一项所述的停车场泊位占用率短时域预测方法的步骤。
一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1～6任意一项所述的停车场泊位占用率短时域预测方法的步骤。
一种信息数据处理终端，其特征在于，所述信息数据处理终端用于实现如权利要求7所述的停车场泊位占用率短时域预测系统。