CN111932037A - 基于机器学习的车位状态预测方法及系统 - Google Patents

基于机器学习的车位状态预测方法及系统 Download PDF

Info

Publication number
CN111932037A
CN111932037A CN202011009981.8A CN202011009981A CN111932037A CN 111932037 A CN111932037 A CN 111932037A CN 202011009981 A CN202011009981 A CN 202011009981A CN 111932037 A CN111932037 A CN 111932037A
Authority
CN
China
Prior art keywords
parking
tree model
state
model
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011009981.8A
Other languages
English (en)
Inventor
梁坚
管海慧
柳希广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZHEJIANG INNOTEK CO Ltd
Original Assignee
ZHEJIANG INNOTEK CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZHEJIANG INNOTEK CO Ltd filed Critical ZHEJIANG INNOTEK CO Ltd
Priority to CN202011009981.8A priority Critical patent/CN111932037A/zh
Publication of CN111932037A publication Critical patent/CN111932037A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/14Traffic control systems for road vehicles indicating individual free spaces in parking areas
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/14Traffic control systems for road vehicles indicating individual free spaces in parking areas
    • G08G1/145Traffic control systems for road vehicles indicating individual free spaces in parking areas where the indication depends on the parking areas
    • G08G1/148Management of a network of parking areas

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开一种基于机器学习的车位状态预测方法,基于历史数据,建立回归决策树模型,进而构建改进决策树模型,对每个区域的停车率进行预测,基于停车率和用户喜好度为用户推荐相应的停车区域,获取相应停车区域中每个车位在不同时间段停车状态的历史数据,形成停车状态历史数据集并分别提取特征变量集和目标变量集;将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型;根据上一时间段停车区域中每个车位的停车状态数据通过构建好的GPR模型得到本次时间段停车状态的预测值,并进一步构建残差预测GPR模型,得到残差的预测值,并对停车状态预测值进行修正。本发明方法能够精准的预测出每个车位停车状态,进而对停车有更好的控制。

Description

基于机器学习的车位状态预测方法及系统
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于机器学习的车位状态预测方法及系统。
背景技术
在现有技术中,大部分的停车场是采用停车检测设备对停车位进行监测,根据停车库的不同,通常使用不同类型的感应器来完成停车检测。而检测设备中的感应器本身由于安置位置或地理环境不同,或本身出厂校正偏差,给正确判断停车状态带来挑战,会导致停车检测数据不够精准。
随着大数据和人工智能的应用,虽然有一直在尝试采用大数据或者人工智能对停车场的车位进行预测,但是,预测结果不够精准,导致用户停车还是很不方便。
发明内容
本发明针对现有技术中的缺点,提供了一种基于机器学习的车位状态预测方法及系统。
为了解决上述技术问题,本发明通过下述技术方案得以解决:
一种基于机器学习的车位状态预测方法,包括以下步骤:
获取停车场所有时间段所有区域的停车数量和未停车数量的历史数据,形成停车数据历史数据集,其中,停车场根据停车规则被划分为多个停车区域,将24小时划分为若干个等比例时间段;
对所述停车数据历史数据集中的所有数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;
基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型;
将测试数据集样本输入至改进决策树模型,对下一个时间段停车场中所有区域停车数量和未停车数量进行预测,得到每个停车区域的停车率;
基于停车率和用户喜好度为用户推荐相应的停车区域,获取相应停车区域中每个车位在不同时间段停车状态的历史数据,形成停车状态历史数据集并分别提取特征变量集和目标变量集;
将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型;
根据相应停车区域中本次时间段的上一个时间段下每个车位的停车状态数据通过构建好的GPR模型得到本次时间段停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,并利用所述残差的预测值对所述停车状态的预测值进行修正,得到修正后的车位状态值。
作为一种可实施方式,所述将测试数据集样本输入至改进决策树模型步骤之前,还包括优化迭代步骤,所述优化迭代步骤具体为:
采用交叉验证法对改进决策树模型的模型参数进行选取,得到优化后的改进决策树模型。
作为一种可实施方式,所述对所述停车数据历史数据集中的所有数据进行归一化处理,具体为:
Figure 966961DEST_PATH_IMAGE001
其中,z k 为归一化后的数据;D k 为归一化前实测数据;D k,min 为参数中的最小值,D k,max 为参数中的最大值。
作为一种可实施方式,所述基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型,具体为:
基于训练数据集,建立回归树模型,将训练数据集记作
Figure 198661DEST_PATH_IMAGE002
,其中,x表示输入变量,y表示相对应的输出变量,假设 每棵回归树的叶子为J m ,将输入空间划分为J m 个不相交区域:
Figure 618141DEST_PATH_IMAGE003
,并在每 个区域上确定输出的常量值,假设b jm 为区域R jm 的常量值,则回归树模型表达式为:
Figure 969488DEST_PATH_IMAGE004
Figure 525234DEST_PATH_IMAGE005
其中,
Figure 202203DEST_PATH_IMAGE006
表示J m 个不相交区域,I表示区域判断输出表达式,g m(x) 表 示回归树模型;
通过Huber损失函数对建立好的回归树模型进行初始化,得到初始化后的回归树模型,并对初始化后的回归树模型进行训练,初始化后的回归树模型表示为:
Figure 108979DEST_PATH_IMAGE007
;其中,N表示数量,L表示损失函数,x表示 输入变量,y表示相对应的输出变量,f(x)表示一个拟合函数;
对初始化后的回归树模型进行训练,得到回归树模型的梯度下降的步长;
基于确立好的梯度下降的步长,对初始化后的回归树模型进行更新,更新后的回归树模型表示为:
Figure 264017DEST_PATH_IMAGE008
其中,lr表示学习率,x表示输入变量,
Figure 205428DEST_PATH_IMAGE009
表示梯度下降的步长,
Figure 53298DEST_PATH_IMAGE010
表示回归树 模型,
Figure 447371DEST_PATH_IMAGE011
表示更新后的回归树模型,
Figure 140520DEST_PATH_IMAGE012
表示更新前的回归树模型;
基于最小化损失函数的期望值对更新后的回归树模型进行不断更新,最终输出稳定的改进决策树模型。
作为一种可实施方式,所述对初始化后的回归树模型进行训练,得到回归树模型的梯度步长,具体为:
迭代生成M 棵回归树,
Figure 670859DEST_PATH_IMAGE013
m表示第m棵树;
将样本数据集中的数据记作N,
Figure 424051DEST_PATH_IMAGE014
i表示第i个样本,获得损失函数的负梯度 值,并将所述负梯度值作为残差的估计值r im ,残差的估计值表示如下:
Figure 305419DEST_PATH_IMAGE015
其中,f m-1 (x i )表示m-1棵树的第i个样本所对应的回归树模型,y i 表示第i个样本所对应的输出变量;
基于产生的残差生成一棵回归树模型
Figure 67839DEST_PATH_IMAGE016
将第m棵树的输入空间分割成J个不相交 区域:
Figure 718263DEST_PATH_IMAGE017
,计算梯度下降的步长,梯度下降的步长表示为:
Figure 376778DEST_PATH_IMAGE018
式中,
Figure 11021DEST_PATH_IMAGE019
表示梯度下降的步长,
Figure 43044DEST_PATH_IMAGE020
是通过线性搜索法确定的步长。
作为一种可实施方式,将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型的具体步骤为:
初始化过程:采用平方指数协方差函数,设定协方差函数和超参数初始值;
训练过程:建立所述训练样本条件概率的负对数似然函数,根据负对数似然函数对超参数求偏导数;采用共轭梯度法对所述偏导数进行最小化处理,得到GPR模型的超参数的最优解,最终建立GPR模型。
作为一种可实施方式,所述根据相应停车区域中本次时间段的上一个时间段下每个车位的停车状态数据通过构建好的GPR模型得到本次时间段停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,具体步骤为:
将相应停车区域中本次时间段的上一个时间段下的每个车位的停车状态数据代入到构建好的所述GPR模型中,得到本次时间段相应停车区域中每个车位停车状态的预测值;
利用所述停车状态的预测值与实际停车状态值获得每次预测的残差,建立残差集,利用所述残差集建立残差特征变量集和残差目标变量集;
根据所述残差特征变量集和所述残差目标变量集,构建用于进行残差预测的残差预测GPR模型;
将停车状态的预测值代入所述残差预测GPR模型,得到本次预测残差的预测值。
作为一种可实施方式,所述利用所述残差集建立残差特征变量集和残差目标变量集的过程为:
从所述残差集中第一个元素开始依次取出连续j个残差作为特征变量,相应地,取出第j+1个残差作为目标变量,依次类推,可构建共l-j个特征变量集与l-j个目标变量集。
一种基于机器学习的车位状态预测系统,包括第一数据获取模块、第一处理模块、第一训练模块、第一预测模块、第二数据获取模块、第二训练模块和第二处理模块;
所述第一数据获取模块,用于获取停车场所有时间段所有区域的停车数量和未停车数量的历史数据,形成停车数据历史数据集,其中,停车场根据停车规则被划分为多个停车区域,将24小时划分为若干个等比例时间段;
所述第一处理模块,用于对所述停车数据历史数据集中的所有数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;
所述第一训练模块,用于基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型;
所述第一预测模块,用于将测试数据集样本输入至改进决策树模型,对下一个时间段停车场中所有区域停车数量和未停车数量进行预测,得到每个停车区域的停车率;
所述第二数据获取模块,用于基于停车率和用户喜好度为用户推荐相应的停车区域,获取相应停车区域中每个车位在不同时间段停车状态的历史数据,形成停车状态历史数据集并分别提取特征变量集和目标变量集;
所述第二训练模块,用于将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型;
所述第二处理模块,用于根据相应停车区域中本次时间段的上一个时间段下每个车位的停车状态数据通过构建好的GPR模型得到本次时间段停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,并利用所述残差的预测值对所述停车状态的预测值进行修正,得到修正后的车位状态值。
作为一种可实施方式,还包括优化迭代模块,所述优化迭代模块用于采用交叉验证法对改进决策树模型的模型参数进行选取,得到优化后的改进决策树模型。
本发明由于采用了以上技术方案,具有显著的技术效果:
本发明公开获取停车场所有时间段所有区域的停车数量和未停车数量的历史数据,形成停车数据历史数据集,其中,停车场根据停车规则被划分为多个停车区域,将24小时划分为若干个等比例时间段;
对所述停车数据历史数据集中的所有数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;
基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型;
将测试数据集样本输入至改进决策树模型,对下一个时间段停车场中所有区域停车数量和未停车数量进行预测,得到每个停车区域的停车率;
基于停车率和用户喜好度为用户推荐相应的停车区域,获取相应停车区域中每个车位在不同时间段停车状态的历史数据,形成停车状态历史数据集并分别提取特征变量集和目标变量集;
将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型;
根据本次停车区域中每个车位的停车状态数据通过构建好的GPR模型得到停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,并利用所述残差的预测值对所述停车状态的预测值进行修正,得到修正后的车位状态值。
通过本发明的方法,能够预测出每个区域的停车率,基于用户的停车喜好以及停车率,可以推荐用户去相应的区域停车,再指引的过程中可以精准的预测出该区域中每个停车位的停车状态,能更好的引导用户去停车,方便快捷。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明方法的整体流程示意图;
图2是本发明系统的整体结构示意图。
具体实施方式
下面结合实施例对本发明做进一步的详细说明,以下实施例是对本发明的解释而本发明并不局限于以下实施例。
在现有技术中,大部分的停车场是采用停车检测设备对停车位进行监测,根据停车库的不同,通常使用不同类型的感应器来完成停车检测。而检测设备中的感应器本身由于安置位置或地理环境不同,或本身出厂校正偏差,给正确判断停车状态带来挑战,会导致停车检测数据不够精准。
随着大数据和人工智能的应用,虽然有一直在尝试采用大数据或者人工智能对停车场的车位进行预测,但是,预测经过不够精准,导致用户停车还是很不方便。是否可以将各种算法模型相互融合,并且能够精准的预测出每个区域停车位的使用状态呢,并且还能够根据用户的喜好或者需求来指引用户进行停车呢。本发明就是基于这一构思提出了一种新的车位状态预测方法。
实施例1:
一种基于机器学习的车位状态预测方法,如图1所示,包括以下步骤:
S100、获取停车场所有时间段所有区域的停车数量和未停车数量的历史数据,形成停车数据历史数据集,其中,停车场根据停车规则被划分为多个停车区域,将24小时划分为若干个等比例时间段;
S200、对所述停车数据历史数据集中的所有数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;
S300、基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型;
S400、将测试数据集样本输入至改进决策树模型,对下一个时间段停车场中所有区域停车数量和未停车数量进行预测,得到每个停车区域的停车率;
S500、基于停车率和用户喜好度为用户推荐相应的停车区域,获取相应停车区域中每个车位在不同时间段停车状态的历史数据,形成停车状态历史数据集并分别提取特征变量集和目标变量集;
S600、将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型;
S700、根据相应停车区域中本次时间段的上一个时间段下每个车位的停车状态数据通过构建好的GPR模型得到本次时间段停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,并利用所述残差的预测值对所述停车状态的预测值进行修正,得到修正后的车位状态值。
通过本发明的方法,能够预测出每个区域的停车率,基于用户的停车喜好以及停车率,可以推荐用户去相应的区域停车,再指引的过程中可以精准的预测出该区域中每个停车位的停车状态,能更好的引导用户去停车,方便快捷。
现有的决策树模型可以预测出每个区域中停车位所挺车辆的多少,但是,在实际应用中,预测结果不够准确,因此,在本发明中对决策树模型做了相应的改进,改进之后,预测出的结果会更加准确;再者,为了能够真实的解决用户停车难以及停车不方便的问题,在司机或者用户进场的时候或者基于历史停车记录判断出司机或者用户的停车喜好,比如:喜欢停在商场电梯厅附近、或者是电动车充电站附近、或者是洗车厅附近等,结合司机或者用户的需求,再结合每个停车区域的停车率,通过残差预测GPR模型,得到残差的预测值,并利用所述残差的预测值对所述停车状态的预测值进行修正,得到修正后的车位状态值,就能精确的知道此区域中每个停车位的停车状态,然后就把这个结果告知用户或者司机,指导其停车。其中,每个停车区域的停车率就是根据改进决策树模型预测出的对下一个时间段停车场中所有区域停车数量和未停车数量,基于停车数量和未停车数量得到每个停车区域的停车率。
获取司机或者用户的停车喜好有很多方式,比如说,进停车场时通过人工采集、或者是通过停车喜好装置进行采集,或者就是基于历史停车记录进行采集,由于不是本发明所要研究的重点,在此不再赘述。
在采集停车数据的过程中,可以将24小时划分为若干个等比例时间段来取值,比如说,间隔一个小时取值一次,当然,为了结果更精确一点,也可以隔半个小时取值一次,由于停车场的特殊性,建议隔一个小时取值一次。另外,停车场根据停车规则被划分为多个停车区域,比如,按照离电梯厅出入口的远近对停车场进行划分,也可以按照客户停车的喜好对停车场进行区域划分,不过现有的大部分停车场为了让客户更容易找到爱车,都已经标注好了ABCD等区域标识,因此,可以直接利用现成的区域标识对停车场进行区域划分,比如,就是停车场A区,B区等。
更加具体地,在步骤所述将测试数据集样本输入至改进决策树模型步骤之前,还包括优化迭代步骤,所述优化迭代步骤具体为:
采用交叉验证法对改进决策树模型的模型参数进行选取,得到优化后的改进决策树模型。
此步骤其实就是为了能够得到更优的改进决策树模型,这样的话,预测结果就会更加准确。
于一个实施例中,步骤S200所述对所述停车数据历史数据集中的所有数据进行归一化处理,选择了以下的处理方式:
Figure 813554DEST_PATH_IMAGE001
其中,z k 为归一化后的数据;D k 为归一化前实测数据;D k,min 为参数中的最小值,D k,max 为参数中的最大值。
在一个实施例中,步骤S300所述基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型,其构建方式的具体过程如下:
基于训练数据集,建立回归树模型,将训练数据集记作
Figure 642969DEST_PATH_IMAGE002
,其中,x表示输入变量,y表示相对应的输出变量,假设 每棵回归树的叶子为J m ,将输入空间划分为J m 个不相交区域:
Figure 764509DEST_PATH_IMAGE003
,并在每 个区域上确定输出的常量值,假设b jm 为区域R jm 的常量值,则回归树模型表达式为:
Figure 603152DEST_PATH_IMAGE004
Figure 962589DEST_PATH_IMAGE005
其中,
Figure 228485DEST_PATH_IMAGE006
表示J m 个不相交区域,I表示区域判断输出表达式,g m(x) 表 示回归树模型;
通过Huber损失函数对建立好的回归树模型进行初始化,得到初始化后的回归树模型,并对初始化后的回归树模型进行训练,初始化后的回归树模型表示为:
Figure 306163DEST_PATH_IMAGE007
;其中,N表示数量,L表示损失函数,x表示 输入变量,y表示相对应的输出变量,f(x)表示一个拟合函数;
对初始化后的回归树模型进行训练,得到回归树模型的梯度下降的步长;
基于确立好的梯度下降的步长,对初始化后的回归树模型进行更新,更新后的回归树模型表示为:
Figure 948497DEST_PATH_IMAGE008
其中,lr表示学习率,x表示输入变量,
Figure 428020DEST_PATH_IMAGE009
表示梯度下降的步长,
Figure 864817DEST_PATH_IMAGE010
表示回归树 模型,
Figure 695370DEST_PATH_IMAGE011
表示更新后的回归树模型,
Figure 875816DEST_PATH_IMAGE012
表示更新前的回归树模型;
基于最小化损失函数的期望值对更新后的回归树模型进行不断更新,最终输出稳定的改进决策树模型。
由于传统的决策树模型有以下缺点,一是深层的(Deep)决策树视觉上和解释上都比较困难;二是决策树容易过分微调于样本数据而失去稳定性和抗震荡性;三是决策树对样本量(Sample Size)的需求比较大;四是处理缺失值的功能非常有限。由于停车场的历史数据有限以及预测的精准性和稳定性,因此就决策树模型做了相应的改进,构建出了改进决策树模型,基于改进决策树模型对每个区域的停车情况进行预测。
具体地,所述对初始化后的回归树模型进行训练,得到回归树模型的梯度步长,具体为:
迭代生成M 棵回归树,
Figure 475424DEST_PATH_IMAGE013
m表示第m棵树;
将样本数据集中的数据记作N,
Figure 83123DEST_PATH_IMAGE014
i表示第i个样本,获得损失函数的负梯度 值,并将所述负梯度值作为残差的估计值r im ,残差的估计值表示如下:
Figure 135393DEST_PATH_IMAGE015
其中,f m-1 (x i )表示m-1棵树的第i个样本所对应的回归树模型,y i 表示第i个样本所对应的输出变量;
基于产生的残差生成一棵回归树模型
Figure 119529DEST_PATH_IMAGE016
将第m棵树的输入空间分割成J个不相交 区域:
Figure 573644DEST_PATH_IMAGE017
,计算梯度下降的步长,梯度下降的步长表示为:
Figure 355174DEST_PATH_IMAGE018
式中,
Figure 160319DEST_PATH_IMAGE019
表示梯度下降的步长,
Figure 682567DEST_PATH_IMAGE020
是通过线性搜索法确定的步长。
此过程是求解梯度下降的步长的一个具体过程,当然,还有其他实施方式也可以实现,在此不再赘述。
于其他实施例中,步骤S600中将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型的具体步骤为:
初始化过程:采用平方指数协方差函数,设定协方差函数和超参数初始值;
训练过程:建立所述训练样本条件概率的负对数似然函数,根据负对数似然函数对超参数求偏导数;采用共轭梯度法对所述偏导数进行最小化处理,得到GPR模型的超参数的最优解,最终建立GPR模型。
具体地,所述根据相应停车区域中本次时间段的上一个时间段下每个车位的停车状态数据通过构建好的GPR模型得到本次时间段停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,具体步骤为:
将相应停车区域中本次时间段的上一个时间段下的每个车位的停车状态数据代入到构建好的所述GPR模型中,得到本次时间段相应停车区域中每个车位停车状态的预测值;
利用所述停车状态的预测值与实际停车状态值获得每次预测的残差,建立残差集,利用所述残差集建立残差特征变量集和残差目标变量集;
根据所述残差特征变量集和所述残差目标变量集,构建用于进行残差预测的残差预测GPR模型;
将停车状态的预测值代入所述残差预测GPR模型,得到本次预测残差的预测值。
此步骤就是想得到每个停车区域中每个停车位的状态而建立的过程,假设,将停车位上有车辆的状态记作为1,没有车辆的状态记作为0,通过获取到此区域的历史数据来进行处理,最终训练出残差预测GPR模型,通过上一个时间段的停车状态来预测本次时间段的相应区域的停车状态,停车状态的预测值代入所述残差预测GPR模型,得到本次预测残差的预测值。
还有,所述利用所述残差集建立残差特征变量集和残差目标变量集的过程为:
从所述残差集中第一个元素开始依次取出连续j个残差作为特征变量,相应地,取出第j+1个残差作为目标变量,依次类推,可构建共l-j个特征变量集与l-j个目标变量集。
更加具体地,利用残差预测修正停车状态的预测值,修正的停车状态的预测值为:修正值=停车状态的预测值+残差的预测值,修正值即为最终的停车状态值。
以上过程就是本发明实现能够预测每个停车区域中每个停车位的停车状态的过程,基于此方法,能够预测出每个区域的停车率,基于用户的停车喜好以及停车率,可以推荐用户去相应的区域停车,再指引的过程中可以精准的预测出该区域中每个停车位的停车状态,能更好的引导用户去停车,方便快捷。
在本发明中对决策树模型做了相应的改进,改进之后,预测出的结果会更加准确;再者,为了能够真实的解决用户停车难以及停车不方便的问题,在司机或者用户进场的时候或者基于历史停车记录判断出司机或者用户的停车喜好,比如:喜欢停在商场电梯厅附近、或者是电动车充电站附近、或者是洗车厅附近等,结合司机或者用户的需求,再结合每个停车区域的停车率,通过残差预测GPR模型,得到残差的预测值,并利用所述残差的预测值对所述停车状态的预测值进行修正,得到修正后的车位状态值,就能精确的知道此区域中每个停车位的停车状态,然后就把这个结果告知用户或者司机,指导其停车。真正的实现车位状态相对精准的预测。
实施例2:
一种基于机器学习的车位状态预测系统,如图2所示,包括第一数据获取模块100、第一处理模块200、第一训练模块300、第一预测模块400、第二数据获取模块500、第二训练模块600和第二处理模块700;
所述第一数据获取模块100,用于获取停车场所有时间段所有区域的停车数量和未停车数量的历史数据,形成停车数据历史数据集,其中,停车场根据停车规则被划分为多个停车区域,将24小时划分为若干个等比例时间段;
所述第一处理模块200,用于对所述停车数据历史数据集中的所有数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;
所述第一训练模块300,用于基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型;
所述第一预测模块400,用于将测试数据集样本输入至改进决策树模型,对下一个时间段停车场中所有区域停车数量和未停车数量进行预测,得到每个停车区域的停车率;
所述第二数据获取模块500,用于基于停车率和用户喜好度为用户推荐相应的停车区域,获取相应停车区域中每个车位在不同时间段停车状态的历史数据,形成停车状态历史数据集并分别提取特征变量集和目标变量集;
所述第二训练模块600,用于将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型;
所述第二处理模块700,用于根据相应停车区域中本次时间段的上一个时间段下每个车位的停车状态数据通过构建好的GPR模型得到本次时间段停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,并利用所述残差的预测值对所述停车状态的预测值进行修正,得到修正后的车位状态值。
在一个实施例中,还包括优化迭代模块,所述优化迭代模块用于采用交叉验证法对改进决策树模型的模型参数进行选取,得到优化后的改进决策树模型。
在一个实施例中,所述第一处理模块200被设置为:所述对所述停车数据历史数据集中的所有数据进行归一化处理,具体为:
Figure 256768DEST_PATH_IMAGE001
其中,z k 为归一化后的数据;D k 为归一化前实测数据;D k,min 为参数中的最小值,D k,max 为参数中的最大值。
在一个实施例中,所述第一训练模块300被设置为:所述基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型,具体为:
基于训练数据集,建立回归树模型,将训练数据集记作
Figure 206270DEST_PATH_IMAGE002
,其中,x表示输入变量,y表示相对应的输出变量,假设 每棵回归树的叶子为J m ,将输入空间划分为J m 个不相交区域:
Figure 967552DEST_PATH_IMAGE003
,并在每 个区域上确定输出的常量值,假设b jm 为区域R jm 的常量值,则回归树模型表达式为:
Figure 293491DEST_PATH_IMAGE004
Figure 722199DEST_PATH_IMAGE005
其中,
Figure 842601DEST_PATH_IMAGE006
表示J m 个不相交区域,I表示区域判断输出表达式,g m(x) 表 示回归树模型;
通过Huber损失函数对建立好的回归树模型进行初始化,得到初始化后的回归树模型,并对初始化后的回归树模型进行训练,初始化后的回归树模型表示为:
Figure 622339DEST_PATH_IMAGE007
;其中,N表示数量,L表示损失函数,x表示 输入变量,y表示相对应的输出变量,f(x)表示一个拟合函数;
对初始化后的回归树模型进行训练,得到回归树模型的梯度下降的步长;
基于确立好的梯度下降的步长,对初始化后的回归树模型进行更新,更新后的回归树模型表示为:
Figure 486389DEST_PATH_IMAGE008
其中,lr表示学习率,x表示输入变量,
Figure 504024DEST_PATH_IMAGE009
表示梯度下降的步长,
Figure 326486DEST_PATH_IMAGE010
表示回归树 模型,
Figure 62361DEST_PATH_IMAGE011
表示更新后的回归树模型,
Figure 730103DEST_PATH_IMAGE012
表示更新前的回归树模型;
基于最小化损失函数的期望值对更新后的回归树模型进行不断更新,最终输出稳定的改进决策树模型。
在一个实施例中,所述第一训练模块300被设置为:所述对初始化后的回归树模型进行训练,得到回归树模型的梯度步长,具体为:
迭代生成M 棵回归树,
Figure 867823DEST_PATH_IMAGE013
m表示第m棵树;
将样本数据集中的数据记作N,
Figure 595608DEST_PATH_IMAGE014
i表示第i个样本,获得损失函数的负梯度 值,并将所述负梯度值作为残差的估计值r im ,残差的估计值表示如下:
Figure 84358DEST_PATH_IMAGE015
其中,f m-1 (x i )表示m-1棵树的第i个样本所对应的回归树模型,y i 表示第i个样本所对应的输出变量;
基于产生的残差生成一棵回归树模型
Figure 290211DEST_PATH_IMAGE016
将第m棵树的输入空间分割成J个不相交 区域:
Figure 282438DEST_PATH_IMAGE017
,计算梯度下降的步长,梯度下降的步长表示为:
Figure 443774DEST_PATH_IMAGE018
式中,
Figure 888661DEST_PATH_IMAGE019
表示梯度下降的步长,
Figure 898206DEST_PATH_IMAGE020
是通过线性搜索法确定的步长。
在一个实施例中,所述第二训练模块600被设置为:将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型的具体步骤为:
初始化过程:采用平方指数协方差函数,设定协方差函数和超参数初始值;
训练过程:建立所述训练样本条件概率的负对数似然函数,根据负对数似然函数对超参数求偏导数;采用共轭梯度法对所述偏导数进行最小化处理,得到GPR模型的超参数的最优解,最终建立GPR模型。
在一个实施例中,所述第二处理模块700,被设置为:所述根据相应停车区域中本次时间段的上一个时间段下每个车位的停车状态数据通过构建好的GPR模型得到本次时间段停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,具体步骤为:
将相应停车区域中本次时间段的上一个时间段下的每个车位的停车状态数据代入到构建好的所述GPR模型中,得到本次时间段相应停车区域中每个车位停车状态的预测值;
利用所述停车状态的预测值与实际停车状态值获得每次预测的残差,建立残差集,利用所述残差集建立残差特征变量集和残差目标变量集;
根据所述残差特征变量集和所述残差目标变量集,构建用于进行残差预测的残差预测GPR模型;
将停车状态的预测值代入所述残差预测GPR模型,得到本次预测残差的预测值。
在一个实施例中,所述第二处理模块700,所述利用所述残差集建立残差特征变量集和残差目标变量集的过程为:
从所述残差集中第一个元素开始依次取出连续j个残差作为特征变量,相应地,取出第j+1个残差作为目标变量,依次类推,可构建共l-j个特征变量集与l-j个目标变量集。
实施例3:
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现以下的方法步骤:
S100、获取停车场所有时间段所有区域的停车数量和未停车数量的历史数据,形成停车数据历史数据集,其中,停车场根据停车规则被划分为多个停车区域,将24小时划分为若干个等比例时间段;
S200、对所述停车数据历史数据集中的所有数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;
S300、基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型;
S400、将测试数据集样本输入至改进决策树模型,对下一个时间段停车场中所有区域停车数量和未停车数量进行预测,得到每个停车区域的停车率;
S500、基于停车率和用户喜好度为用户推荐相应的停车区域,获取相应停车区域中每个车位在不同时间段停车状态的历史数据,形成停车状态历史数据集并分别提取特征变量集和目标变量集;
S600、将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型;
S700、根据相应停车区域中本次时间段的上一个时间段下每个车位的停车状态数据通过构建好的GPR模型得到本次时间段停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,并利用所述残差的预测值对所述停车状态的预测值进行修正,得到修正后的车位状态值。
在一个实施例中,处理器执行计算机程序时,实现所述将测试数据集样本输入至改进决策树模型步骤之前,还包括优化迭代步骤,所述优化迭代步骤具体为:
采用交叉验证法对改进决策树模型的模型参数进行选取,得到优化后的改进决策树模型。
在一个实施例中,处理器执行计算机程序时,实现所述对所述停车数据历史数据集中的所有数据进行归一化处理,具体为:
Figure 276097DEST_PATH_IMAGE001
其中,z k 为归一化后的数据;D k 为归一化前实测数据;D k,min 为参数中的最小值,D k,max 为参数中的最大值。
在一个实施例中,处理器执行计算机程序时,实现所述基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型,具体为:
基于训练数据集,建立回归树模型,将训练数据集记作
Figure 80105DEST_PATH_IMAGE002
,其中,x表示输入变量,y表示相对应的输出变量,假设 每棵回归树的叶子为J m ,将输入空间划分为J m 个不相交区域:
Figure 543448DEST_PATH_IMAGE003
,并在每 个区域上确定输出的常量值,假设b jm 为区域R jm 的常量值,则回归树模型表达式为:
Figure 91104DEST_PATH_IMAGE004
Figure 57923DEST_PATH_IMAGE005
其中,
Figure 298411DEST_PATH_IMAGE006
表示J m 个不相交区域,I表示区域判断输出表达式,g m(x) 表 示回归树模型;
通过Huber损失函数对建立好的回归树模型进行初始化,得到初始化后的回归树模型,并对初始化后的回归树模型进行训练,初始化后的回归树模型表示为:
Figure 983470DEST_PATH_IMAGE007
;其中,N表示数量,L表示损失函数,x表示 输入变量,y表示相对应的输出变量,f(x)表示一个拟合函数;
对初始化后的回归树模型进行训练,得到回归树模型的梯度下降的步长;
基于确立好的梯度下降的步长,对初始化后的回归树模型进行更新,更新后的回归树模型表示为:
Figure 334817DEST_PATH_IMAGE008
其中,lr表示学习率,x表示输入变量,
Figure 421722DEST_PATH_IMAGE009
表示梯度下降的步长,
Figure 833112DEST_PATH_IMAGE010
表示回归树 模型,
Figure 5467DEST_PATH_IMAGE011
表示更新后的回归树模型,
Figure 894926DEST_PATH_IMAGE012
表示更新前的回归树模型;
基于最小化损失函数的期望值对更新后的回归树模型进行不断更新,最终输出稳定的改进决策树模型。
在一个实施例中,处理器执行计算机程序时,实现所述对初始化后的回归树模型进行训练,得到回归树模型的梯度步长,具体为:
迭代生成M 棵回归树,
Figure 836337DEST_PATH_IMAGE013
m表示第m棵树;
将样本数据集中的数据记作N,
Figure 153049DEST_PATH_IMAGE014
i表示第i个样本,获得损失函数的负梯度 值,并将所述负梯度值作为残差的估计值r im ,残差的估计值表示如下:
Figure 812700DEST_PATH_IMAGE015
其中,f m-1 (x i )表示m-1棵树的第i个样本所对应的回归树模型,y i 表示第i个样本所对应的输出变量;
基于产生的残差生成一棵回归树模型
Figure 505850DEST_PATH_IMAGE016
将第m棵树的输入空间分割成J个不相交 区域:
Figure 316416DEST_PATH_IMAGE017
,计算梯度下降的步长,梯度下降的步长表示为:
Figure 69608DEST_PATH_IMAGE018
式中,
Figure 216556DEST_PATH_IMAGE019
表示梯度下降的步长,
Figure 447817DEST_PATH_IMAGE020
是通过线性搜索法确定的步长。
在一个实施例中,处理器执行计算机程序时,实现将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型的具体步骤为:
初始化过程:采用平方指数协方差函数,设定协方差函数和超参数初始值;
训练过程:建立所述训练样本条件概率的负对数似然函数,根据负对数似然函数对超参数求偏导数;采用共轭梯度法对所述偏导数进行最小化处理,得到GPR模型的超参数的最优解,最终建立GPR模型。
在一个实施例中,处理器执行计算机程序时,实现所述根据相应停车区域中本次时间段的上一个时间段下每个车位的停车状态数据通过构建好的GPR模型得到本次时间段停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,具体步骤为:
将相应停车区域中本次时间段的上一个时间段下的每个车位的停车状态数据代入到构建好的所述GPR模型中,得到本次时间段相应停车区域中每个车位停车状态的预测值;
利用所述停车状态的预测值与实际停车状态值获得每次预测的残差,建立残差集,利用所述残差集建立残差特征变量集和残差目标变量集;
根据所述残差特征变量集和所述残差目标变量集,构建用于进行残差预测的残差预测GPR模型;
将停车状态的预测值代入所述残差预测GPR模型,得到本次预测残差的预测值。
在一个实施例中,处理器执行计算机程序时,实现所述利用所述残差集建立残差特征变量集和残差目标变量集的过程为:
从所述残差集中第一个元素开始依次取出连续j个残差作为特征变量,相应地,取出第j+1个残差作为目标变量,依次类推,可构建共l-j个特征变量集与l-j个目标变量集。
实施例4:
在一个实施例中,提供了一种基于机器学习的车位状态预测的装置,该基于机器学习的车位状态预测的装置可以是服务器也可以是移动终端或者是车位检测器。该基于机器学习的车位状态预测的装置包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该基于机器学习的车位状态预测的装置的处理器用于提供计算和控制能力。该基于机器学习的车位状态预测的装置的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该数据库用于存储基于机器学习的车位状态预测的装置的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现基于机器学习的车位状态预测的方法。所述处理器执行所述计算机程序时实现以下的方法步骤:
S100、获取停车场所有时间段所有区域的停车数量和未停车数量的历史数据,形成停车数据历史数据集,其中,停车场根据停车规则被划分为多个停车区域,将24小时划分为若干个等比例时间段;
S200、对所述停车数据历史数据集中的所有数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;
S300、基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型;
S400、将测试数据集样本输入至改进决策树模型,对下一个时间段停车场中所有区域停车数量和未停车数量进行预测,得到每个停车区域的停车率;
S500、基于停车率和用户喜好度为用户推荐相应的停车区域,获取相应停车区域中每个车位在不同时间段停车状态的历史数据,形成停车状态历史数据集并分别提取特征变量集和目标变量集;
S600、将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型;
S700、根据相应停车区域中本次时间段的上一个时间段下每个车位的停车状态数据通过构建好的GPR模型得到本次时间段停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,并利用所述残差的预测值对所述停车状态的预测值进行修正,得到修正后的车位状态值。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质( 包括但不限于磁盘存储器、CD-ROM、光学存储器等) 上实施的计算机程序产品的形式。
本发明是参照根据本发明的方法、终端设备( 系统)、和计算机程序产品的流程图和/ 或方框图来描述的。应理解可由计算机程序指令实现流程图和/ 或方框图中的每一流程和/ 或方框、以及流程图和/ 或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/ 或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/ 或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/ 或方框图一个方框或多个方框中指定的功能的步骤。
需要说明的是:
说明书中提到的“ 一个实施例”或“ 实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,说明书通篇各个地方出现的短语 “ 一个实施例”或“ 实施例”并不一定均指同一个实施例。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
此外,需要说明的是,本说明书中所描述的具体实施例,其零、部件的形状、所取名称等可以不同。凡依本发明专利构思所述的构造、特征及原理所做的等效或简单变化,均包括于本发明专利的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (10)

1.一种基于机器学习的车位状态预测方法,其特征在于,包括以下步骤:
获取停车场所有时间段所有区域的停车数量和未停车数量的历史数据,形成停车数据历史数据集,其中,停车场根据停车规则被划分为多个停车区域,将24小时划分为若干个等比例时间段;
对所述停车数据历史数据集中的所有数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;
基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型;
将测试数据集样本输入至改进决策树模型,对下一个时间段停车场中所有区域停车数量和未停车数量进行预测,得到每个停车区域的停车率;
基于停车率和用户喜好度为用户推荐相应的停车区域,获取相应停车区域中每个车位在不同时间段停车状态的历史数据,形成停车状态历史数据集并分别提取特征变量集和目标变量集;
将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型;
根据相应停车区域中本次时间段的上一个时间段下每个车位的停车状态数据通过构建好的GPR模型得到本次时间段停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,并利用所述残差的预测值对所述停车状态的预测值进行修正,得到修正后的车位状态值。
2.根据权利要求1所述的基于机器学习的车位状态预测方法,其特征在于,所述将测试数据集样本输入至改进决策树模型步骤之前,还包括优化迭代步骤,所述优化迭代步骤具体为:
采用交叉验证法对改进决策树模型的模型参数进行选取,得到优化后的改进决策树模型。
3.根据权利要求1所述的基于机器学习的车位状态预测方法,其特征在于,所述对所述停车数据历史数据集中的所有数据进行归一化处理,具体为:
Figure 236782DEST_PATH_IMAGE001
其中,z k 为归一化后的数据;D k 为归一化前实测数据;D k,min 为参数中的最小值,D k,max 为参数中的最大值。
4.根据权利要求1所述的基于机器学习的车位状态预测方法,其特征在于,所述基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型,具体为:
基于训练数据集,建立回归树模型,将训练数据集记作
Figure 622764DEST_PATH_IMAGE002
,其中,x表示输入变量,y表示相对应的输出变量,假设 每棵回归树的叶子为J m ,将输入空间划分为J m 个不相交区域:
Figure 605764DEST_PATH_IMAGE003
,并在每 个区域上确定输出的常量值,假设b jm 为区域R jm 的常量值,则回归树模型表达式为:
Figure 735394DEST_PATH_IMAGE004
Figure 18608DEST_PATH_IMAGE005
其中,
Figure 575491DEST_PATH_IMAGE006
表示J m 个不相交区域,I表示区域判断输出表达式,g m(x) 表 示回归树模型;
通过Huber损失函数对建立好的回归树模型进行初始化,得到初始化后的回归树模型,并对初始化后的回归树模型进行训练,初始化后的回归树模型表示为:
Figure 311366DEST_PATH_IMAGE007
;其中,N表示数量,L表示损失函数,x表示输 入变量,y表示相对应的输出变量,f(x)表示一个拟合函数;
对初始化后的回归树模型进行训练,得到回归树模型的梯度下降的步长;
基于确立好的梯度下降的步长,对初始化后的回归树模型进行更新,更新后的回归树模型表示为:
Figure 993756DEST_PATH_IMAGE008
其中,lr表示学习率,x表示输入变量,
Figure 397055DEST_PATH_IMAGE009
表示梯度下降的步长,
Figure 859261DEST_PATH_IMAGE010
表示回归树模 型,
Figure 348011DEST_PATH_IMAGE011
表示更新后的回归树模型,
Figure 553864DEST_PATH_IMAGE012
表示更新前的回归树模型;
基于最小化损失函数的期望值对更新后的回归树模型进行不断更新,最终输出稳定的改进决策树模型。
5.根据权利要求4所述的基于机器学习的车位状态预测方法,其特征在于,所述对初始化后的回归树模型进行训练,得到回归树模型的梯度步长,具体为:
迭代生成M 棵回归树,
Figure 811670DEST_PATH_IMAGE013
m表示第m棵树;
将样本数据集中的数据记作N,
Figure 710356DEST_PATH_IMAGE014
i表示第i个样本,获得损失函数的负梯度 值,并将所述负梯度值作为残差的估计值r im ,残差的估计值表示如下:
Figure 420823DEST_PATH_IMAGE015
其中,f m-1 (x i )表示m-1棵树的第i个样本所对应的回归树模型,y i 表示第i个样本所对应的输出变量;
基于产生的残差生成一棵回归树模型
Figure 164788DEST_PATH_IMAGE016
将第m棵树的输入空间分割成J个不相交 区域:
Figure 277101DEST_PATH_IMAGE017
,计算梯度下降的步长,梯度下降的步长表示为:
Figure 81109DEST_PATH_IMAGE018
式中,
Figure 544451DEST_PATH_IMAGE019
表示梯度下降的步长,
Figure 92107DEST_PATH_IMAGE020
是通过线性搜索法确定的步长。
6.根据权利要求1所述的基于机器学习的车位状态预测方法,其特征在于,将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型的具体步骤为:
初始化过程:采用平方指数协方差函数,设定协方差函数和超参数初始值;
训练过程:建立所述训练样本条件概率的负对数似然函数,根据负对数似然函数对超参数求偏导数;采用共轭梯度法对所述偏导数进行最小化处理,得到GPR模型的超参数的最优解,最终建立GPR模型。
7.根据权利要求1所述的基于机器学习的车位状态预测方法,其特征在于,所述根据相应停车区域中本次时间段的上一个时间段下每个车位的停车状态数据通过构建好的GPR模型得到本次时间段停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,具体步骤为:
将相应停车区域中本次时间段的上一个时间段下的每个车位的停车状态数据代入到构建好的所述GPR模型中,得到本次时间段相应停车区域中每个车位停车状态的预测值;
利用所述停车状态的预测值与实际停车状态值获得每次预测的残差,建立残差集,利用所述残差集建立残差特征变量集和残差目标变量集;
根据所述残差特征变量集和所述残差目标变量集,构建用于进行残差预测的残差预测GPR模型;
将停车状态的预测值代入所述残差预测GPR模型,得到本次预测残差的预测值。
8.根据权利要求7所述的基于机器学习的车位状态预测方法,其特征在于,所述利用所述残差集建立残差特征变量集和残差目标变量集的过程为:
从所述残差集中第一个元素开始依次取出连续j个残差作为特征变量,相应地,取出第j+1个残差作为目标变量,依次类推,可构建共l-j个特征变量集与l-j个目标变量集。
9.一种基于机器学习的车位状态预测系统,其特征在于,包括第一数据获取模块、第一处理模块、第一训练模块、第一预测模块、第二数据获取模块、第二训练模块和第二处理模块;
所述第一数据获取模块,用于获取停车场所有时间段所有区域的停车数量和未停车数量的历史数据,形成停车数据历史数据集,其中,停车场根据停车规则被划分为多个停车区域,将24小时划分为若干个等比例时间段;
所述第一处理模块,用于对所述停车数据历史数据集中的所有数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;
所述第一训练模块,用于基于训练数据集中的训练样本,通过迭代算法建立回归决策树模型,基于回归决策树模型构建改进决策树模型;
所述第一预测模块,用于将测试数据集样本输入至改进决策树模型,对下一个时间段停车场中所有区域停车数量和未停车数量进行预测,得到每个停车区域的停车率;
所述第二数据获取模块,用于基于停车率和用户喜好度为用户推荐相应的停车区域,获取相应停车区域中每个车位在不同时间段停车状态的历史数据,形成停车状态历史数据集并分别提取特征变量集和目标变量集;
所述第二训练模块,用于将所述特征变量集和所述目标变量集作为训练样本,初始化并训练GPR模型;
所述第二处理模块,用于根据本次停车区域中每个车位的停车状态数据通过构建好的GPR模型得到停车状态的预测值,通过所述停车状态的预测值与实际停车状态得到预测残差,并进一步构建残差预测GPR模型,得到残差的预测值,并利用所述残差的预测值对所述停车状态的预测值进行修正,得到修正后的车位状态值。
10.根据权利要求9所述的基于机器学习的车位状态预测系统,其特征在于,还包括优化迭代模块,所述优化迭代模块用于采用交叉验证法对改进决策树模型的模型参数进行选取,得到优化后的改进决策树模型。
CN202011009981.8A 2020-09-23 2020-09-23 基于机器学习的车位状态预测方法及系统 Pending CN111932037A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011009981.8A CN111932037A (zh) 2020-09-23 2020-09-23 基于机器学习的车位状态预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011009981.8A CN111932037A (zh) 2020-09-23 2020-09-23 基于机器学习的车位状态预测方法及系统

Publications (1)

Publication Number Publication Date
CN111932037A true CN111932037A (zh) 2020-11-13

Family

ID=73335068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011009981.8A Pending CN111932037A (zh) 2020-09-23 2020-09-23 基于机器学习的车位状态预测方法及系统

Country Status (1)

Country Link
CN (1) CN111932037A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112396862A (zh) * 2021-01-19 2021-02-23 武汉中科通达高新技术股份有限公司 停车管理方法及装置
CN112632380A (zh) * 2020-12-24 2021-04-09 北京百度网讯科技有限公司 兴趣点推荐模型的训练方法和推荐兴趣点的方法
CN113793507A (zh) * 2021-11-16 2021-12-14 湖南工商大学 可用车位预测方法、装置、计算机设备及存储介质
CN113838303A (zh) * 2021-09-26 2021-12-24 千方捷通科技股份有限公司 停车场推荐方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303882A (zh) * 2015-11-16 2016-02-03 东南大学 基于时空维度动态停车收费策略的停车管理系统及方法
CN107038488A (zh) * 2017-02-25 2017-08-11 浙江大学 一种基于泊位预测和停车选择的停车场实时泊位预约方法
CN108323797A (zh) * 2018-02-09 2018-07-27 杭州安脉盛智能技术有限公司 基于gpr模型的烟支重量控制系统启动位置预测方法及系统
CN110245802A (zh) * 2019-06-20 2019-09-17 杭州安脉盛智能技术有限公司 基于改进梯度提升决策树的卷烟空头率预测方法及系统
CN111326015A (zh) * 2020-03-27 2020-06-23 北京骑胜科技有限公司 一种停车点推荐方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303882A (zh) * 2015-11-16 2016-02-03 东南大学 基于时空维度动态停车收费策略的停车管理系统及方法
CN107038488A (zh) * 2017-02-25 2017-08-11 浙江大学 一种基于泊位预测和停车选择的停车场实时泊位预约方法
CN108323797A (zh) * 2018-02-09 2018-07-27 杭州安脉盛智能技术有限公司 基于gpr模型的烟支重量控制系统启动位置预测方法及系统
CN110245802A (zh) * 2019-06-20 2019-09-17 杭州安脉盛智能技术有限公司 基于改进梯度提升决策树的卷烟空头率预测方法及系统
CN111326015A (zh) * 2020-03-27 2020-06-23 北京骑胜科技有限公司 一种停车点推荐方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112632380A (zh) * 2020-12-24 2021-04-09 北京百度网讯科技有限公司 兴趣点推荐模型的训练方法和推荐兴趣点的方法
CN112396862A (zh) * 2021-01-19 2021-02-23 武汉中科通达高新技术股份有限公司 停车管理方法及装置
CN112396862B (zh) * 2021-01-19 2021-04-27 武汉中科通达高新技术股份有限公司 停车管理方法及装置
CN113838303A (zh) * 2021-09-26 2021-12-24 千方捷通科技股份有限公司 停车场推荐方法、装置、电子设备及存储介质
CN113793507A (zh) * 2021-11-16 2021-12-14 湖南工商大学 可用车位预测方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN111932037A (zh) 基于机器学习的车位状态预测方法及系统
CN110390396B (zh) 用于估计观测变量之间的因果关系的方法、装置和系统
Biegert et al. De novo identification of highly diverged protein repeats by probabilistic consistency
CN111460076B (zh) 驾驶路线熟悉度确定方法、装置、计算机设备和存储介质
CN112946484B (zh) 一种基于bp神经网络的soc估计方法、系统、终端设备及可读存储介质
CN108920863B (zh) 一种机器人伺服系统能耗估计模型的建立方法
CN110068330B (zh) 基于arma模型实现的机器人的自主定位方法
CN112215169B (zh) 基于无人机被动遥感的作物株高及生物量自适应解算方法
JP6451736B2 (ja) 価格推定装置、価格推定方法、及び、価格推定プログラム
CN114443331A (zh) 时序数据异常检测方法和装置
CN112128950B (zh) 一种基于多种模型对比的机房温湿度预测方法及系统
CN117236529B (zh) 基于大数据的大型活动人流量预测方法
JP4875010B2 (ja) 運動クラス類別装置及び追尾処理装置
CN107885651B (zh) 移动终端定位算法的自动化系统回归测试方法及其装置
CN116362782A (zh) 基于大数据分析的用户兴趣点识别方法及系统
CN115240056A (zh) 一种基于深度学习的序列图像场景识别方法
CN113984055A (zh) 室内导航定位方法和相关装置
CN117349670B (zh) 一种肿瘤检测模型训练系统、方法、设备及存储介质
US20230032634A1 (en) Aggregating a dataset into a function term with the aid of transformer networks
CN112833912B (zh) 一种v-slam地图校验方法、装置及设备
CN114858200B (zh) 车辆传感器检测到的对象的质量评价方法及装置
US11937153B2 (en) Method for improving the estimation of existence probabilities
CN117271959B (zh) 一种pm2.5浓度预测结果的不确定性评估方法及设备
CN117131465B (zh) 单管塔损伤识别方法、装置、电子设备及可读存储介质
CN111832597A (zh) 一种车辆类型的判定方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201113

RJ01 Rejection of invention patent application after publication