CN115481813B - 基于机器学习的新能源公交车能耗预测方法 - Google Patents
基于机器学习的新能源公交车能耗预测方法 Download PDFInfo
- Publication number
- CN115481813B CN115481813B CN202211226921.0A CN202211226921A CN115481813B CN 115481813 B CN115481813 B CN 115481813B CN 202211226921 A CN202211226921 A CN 202211226921A CN 115481813 B CN115481813 B CN 115481813B
- Authority
- CN
- China
- Prior art keywords
- data
- battery
- segment
- energy consumption
- new energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005265 energy consumption Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000010801 machine learning Methods 0.000 title claims abstract description 19
- 230000008569 process Effects 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims abstract description 13
- 230000008859 change Effects 0.000 claims abstract description 13
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 238000012795 verification Methods 0.000 claims abstract description 6
- 230000001133 acceleration Effects 0.000 claims description 18
- 238000010276 construction Methods 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 12
- 230000007613 environmental effect Effects 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 239000012634 fragment Substances 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 claims description 3
- 238000001556 precipitation Methods 0.000 claims description 3
- 238000007637 random forest analysis Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000013517 stratification Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 abstract description 3
- 238000011160 research Methods 0.000 abstract description 3
- 238000012797 qualification Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/60—Other road transportation technologies with climate change mitigation effect
- Y02T10/70—Energy storage systems for electromobility, e.g. batteries
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Electric Propulsion And Braking For Vehicles (AREA)
Abstract
本发明提出了基于机器学习的新能源公交车能耗预测方法,通过新能源公交车行驶过程中的各项数据,采用数据驱动的方式,充分考虑了各种影响因素,基于三大类构造特征与温度分层的回归预测模型,结合网格搜索优化模型选取最优的参数组合,建立XGBoost回归预测模型,使之获得最佳的模型性能,最后经过合格验证,使得模型具有较高的准确性以及可靠性。本发明的方法具有一定的普适性,即通过少量的改变,就可以运用到其他线路、其他车型的新能源公交车能耗预测当中,建立能耗预测平台,对能耗实时监督,规劝驾驶员进行节能驾驶,为充电需求测算、生态轨迹规划和电池参数匹配方面的研究奠定基础。
Description
技术领域
本发明属于智能汽车技术领域,涉及新能源公交车能耗预测方法。
背景技术
新能源公交车具有环保、低噪声、燃料经济性好等优点,尤其是在当今节能减排、生态保护的大背景下,新能源公交车的应用成为解决交通与环境间矛盾的重要突破口之一。准确预估新能源公交车的交通能耗不仅可以保证新能源公交车安全、可靠的运行,还可为后续的充电需求测算、生态轨迹规划和电池参数匹配等方面奠定基础,对推广和普及新能源公交车具有重要意义。
发明内容
为解决背景技术中所述的问题,本发明提出了基于机器学习的新能源公交车能耗预测方法。
本发明的技术方案包括以下步骤:
步骤一、收集获取新能源公交车运行过程中的数据:车辆状态信息、电池状态信息、车辆使用信息、环境信息;
步骤二、对获取的数据进行预处理:包括划分充放电片段、修正错误标记数据、修复缺失数据和状态滞后数据、匹配工作路径以及切分去回程路径;
步骤三、将预处理后的数据,从电池状态信息、车辆使用信息、环境信息三个维度对公交车能耗进行特征构造,得到三大类构造特征;
步骤四、使用k-means算法对温度能耗数据进行聚类,根据聚类结构建立温度分层的回归预测模型;
步骤五、基于三大类构造特征与温度分层的回归预测模型,结合网格搜索优化模型选取最优的参数组合,建立XGBoost回归预测模型;
步骤六、将测试集数据输入到XGBoost回归预测模型当中,计算预测结果与真实能耗的误差,对XGBoost回归预测模型进行精度验证,若未达到误差要求,则重复步骤二至步骤五,若达到误差要求,则将其作为新能源公交车能耗预测模型,对新能源公交车的能耗进行预测。
进一步地,所述车辆状态信息包括以下特征:车辆状态、充电状态、运行模式数据;所述步骤一中,电池状态信息包括以下特征:电池总电流、电池总电压、电池荷电量、电池历史能耗、电池单体温度最高最低值、电池单体电压最高最低数据;所述车辆使用信息包括以下特征:车速、行驶累积里程、车辆经纬度、档位、加速踏板行程值、制动踏板状态数据;所述环境信息包括以下特征:环境温度、降雨量、风速、风向数据。
进一步地,所述步骤二中,根据车辆状态信息和车辆使用信息,对数据进行充放电片段的划分,对错误标记数据进行修正;对大量字段缺失的数据进行删除;对少量字段缺失的数据及状态滞后数据采用片段内逻辑填补和机器学习算法填补;按照经纬度变化规律对新能源公交车的工作路径进行匹配,对新能源公交车的去回程路径进行切分。所述错误标记数据为车辆处于充电状态且速度为0的情况下但是车辆状态却为行驶状态的数据,将这样的车辆状态数据修正为停车状态;所述大量字段缺失的数据为除了时间特征,其余特征全为空值的数据;所述少量字段缺失的数据为电池总电流、电池总电压、电池荷电量均缺失但其他特征未缺失的数据,或者行驶累积里程缺失但其他特征未缺失的数据;所述状态滞后数据为车辆停车熄火状态下但是车速连续不为零的数据。
更进一步地,所述步骤二获取的数据中,当电池总电流、电池总电压、电池荷电量均缺失但其他特征未缺失时,电池总电流采用0进行填补,电池总电压采用采用随机森林法进行填补,电池荷电量采用上一条电池荷电量数据进行填补;当行驶累积里程缺失但其他特征未缺失时,行驶累积里程采用上下两条数据取均值的方式进行填补;车辆停车熄火状态下但是车速连续不为零时,车速采用0进行填补。
更进一步地,所述新能源公交车的工作路径匹配中,将车辆维修或者车辆突发意外需要绕道偏离原有的行驶路径的情况剔除后,对新能源公交车的工作路径进行匹配;所述新能源公交车的去回程路径的路径切分中,基于纬度最低点进行周期的初步定位,然后通过工作路径中的多个特殊点作为纬度定位锚点,然后通过经度最大值处的速度变化情况实现去回程路径的切分。
更进一步地,所述步骤三中,电池状态信息的构造特征包括:电池起始荷电量、电池结束荷电量、电池容量、片段最大电压、片段最小电压、片段电压均值、片段电压方差值、片段电流最大值、片段电流最小值、片段电流平均值、片段电流方差、温度一致性评分、电压一致性评分;车辆使用信息的构造特征包括:行驶车速、片段车速最大值、片段车速最小值、片段车速方差、总行驶里程、片段内行驶里程、加速度、片段内加速度最大值,片段内加速度最小值,片段内加速度方差、片段加速比例、片段减速比例、片段匀速比例、加速踏板行程值、制动踏板状态、片段持续时间、片段开始时间、片段结束时间;环境信息的构造特征包括:环境温度、小时平均风速、小时平均风向、小时平均降水量。
更进一步地,所述电池容量CI(i)为:
其中,CI(i)为电池容量值,C(t)为温度修正后的电池容量值,C2(i)为电流修正系数;Ci为电池理论容量值,C1(t)代表温度修正系数,t代表该片段的平均温度,i为片段内平均电流;n代表某个充电过程中的窗口数量,n1,n2代表窗口起点和终点时刻,socn1,socn2代表该窗口的电池起始荷电量和电池结束荷电量。
更进一步地,所述步骤四中,k-means算法的计算公式如下:
式中,xj,yj分别代表在第j个维度的横、纵坐标;
计算流程如下:
(1)选择K个聚类中心;
(2)计算各个样本到聚类中心的距离;
(3)计算每个类别的新聚类中心;
(4)重复步骤(2)-(3),直到聚类中心不再发生变化。
更进一步地,所述步骤五中,所述步骤五中,结合网格搜索优化模型选取最优的参数组合,优化的参数如下:树最大深度:max_depth、叶子结点的数量:num_leaves、每个叶子结点的最小数据量:min_data_in_leaf、每次迭代中随机选择特征的比例:feature_fraction、非重复采样每次迭代中随机选择部分样本来训练:bagging_fraction、L1正则化系数:lambda_l1、学习率:learning_rate。
更进一步地,所述预测结果与真实能耗的误差要求≤5%。
本发明与现有技术相比,通过新能源公交车行驶过程中的各项数据,采用数据驱动的方式,充分考虑了各种影响因素,基于三大类构造特征与温度分层的回归预测模型,结合网格搜索优化模型选取最优的参数组合,建立XGBoost回归预测模型,使之获得最佳的模型性能,最后经过合格验证,使得模型具有较高的准确性以及可靠性。本发明的方法具有一定的普适性,即通过少量的改变,就可以运用到其他线路、其他车型的新能源公交车能耗预测当中,建立能耗预测平台,对能耗实时监督,规劝驾驶员进行节能驾驶,为充电需求测算、生态轨迹规划和电池参数匹配方面的研究奠定基础。
附图说明
图1为本发明的流程图。
图2为本发明实施例的路径匹配锚点图。
图3为本发明实施例的路径匹配结果图。
图4为本发明实施例的温度聚类结果图。
图5为本发明实施例的真实能耗与预测结果的相对误差图。
具体实施方式
下面结合附图详细说明本发明的实施情况,但它们并不构成对本发明的限定,仅做举例而已,同时通过说明,将更加清楚地理解本发明的优点。本领域的普通的技术人员能从本发明公开的内容直接导出或联想到的所有变形,均应认为是本发明的保护范围。实施例中所述的位置关系均与附图所示一致,实施例中其他未详细说明的部分均为现有技术。
本发明的流程图如图1所示,下面对各个步骤进行详细说明。
1.数据收集
收集获取新能源公交车运行过程中的数据:车辆状态信息、电池状态信息、车辆使用信息、环境信息。
其中,车辆状态信息包括以下特征:车辆状态、充电状态、运行模式数据;电池状态信息包括以下特征:电池总电流、电池总电压、电池荷电量、电池历史能耗、电池单体温度最高最低值、电池单体电压最高最低数据;车辆使用信息包括以下特征:车速、行驶累积里程、车辆经纬度、档位、加速踏板行程值、制动踏板状态数据;环境信息包括以下特征:环境温度、降雨量、风速、风向数据。
2.数据预处理
对获取的数据进行预处理:包括划分充放电片段、修正错误标记数据、修复缺失数据和状态滞后数据、匹配工作路径以及切分汽车的去回程路径。
具体地,根据车辆状态信息和车辆使用信息,对数据进行充放电片段的划分,保证划分的片段内车辆状态不改变,充电状态不改变,对错误标记数据进行修正;然后对大量字段缺失的数据进行删除;对少量字段缺失的数据及状态滞后数据采用片段内逻辑填补和机器学习算法填补;按照经纬度变化规律对新能源公交车的工作路径进行匹配,对新能源公交车的去回程路径进行切分。
其中,错误标记数据为车辆处于充电状态且速度为0的情况下但是车辆状态却为行驶状态的数据,将这样的车辆状态数据修正为停车状态。
大量字段缺失的数据指的是除了时间特征,其余特征全为空值的数据,对于这样的数据直接删除处理。
少量字段缺失的数据为电池总电流、电池总电压、电池荷电量均缺失但其他特征未缺失的数据,或者行驶累积里程缺失但其他特征未缺失的数据。当电池总电流、电池总电压、电池荷电量均缺失但其他特征未缺失时,电池总电流采用0进行填补,电池总电压采用采用随机森林法进行填补,电池荷电量采用上一条电池荷电量数据进行填补;当行驶累积里程缺失但其他特征未缺失时,行驶累积里程采用上下两条数据取均值的方式进行填补;车辆停车熄火状态下但是车速连续不为零时,车速采用0进行填补。
状态滞后数据为车辆停车熄火状态下但是车速连续不为零的数据。
因为公交车工作的特性,其运行时间段与工作路径是高度固定的,但是一些特殊情况下,例如车辆维修或者车辆突发意外需要绕道的情况下,车辆会偏离原有的行驶路径,但是这样的特殊情况一般很少,难以对这样的特殊情况进行单独的建模和分析,因此,将这部分数据剔除后,即可对公交车的工作路径进行匹配。
新能源公交车的去回程路径进行切分中,首先基于维度最低点进行周期的初步定位,然后通过工作路径中的多个特殊点作为维度定位锚点,然后通过经度最大值处的速度变化情况实现去回程的路径的切分。
3.特征构造
将预处理后的数据,从电池状态信息、车辆使用信息、环境信息三个维度对汽车能耗进行特征构造,得到三大类构造特征。
3.1电池状态信息的构造特征
针对电池状态信息,首先对电池荷电量采用电流插值法平滑处理,因为原始数据荷电量的采集精度问题,使得电池荷电量呈现阶梯状分布,为保证其余特征的构造精度以及后续模型的准确性,需要对电池荷电量进行插值平滑处理,处理公式如下:
式中:NSOC(n)为第n个点的插值结果,即电池结束荷电量;OSOC为电池起始荷电量值;为第n和n+1个点的电流均值;Δt(n)为n和n+1个点的时间间隔;k为荷电量不变的数据数量。
通过安时积分法,应用滑动窗口移动平均计算电池容量,具体公式如下:
式中:Ci为电池理论容量值,n代表某个充电过程中的窗口数量,n1,n2代表窗口起点和终点时刻,socn1,socn2代表该窗口的起始荷电量和结束荷电量。
因为温度以及放电电流对于电池容量具有巨大的影响作用,为使理论计算结果与实际容量相吻合,采用下述修正公式对电池理论容量值进行温度修正以及电流修正:
C1(t)=1.7·e-0.005058t-0.8204·e-0.01984t
C2(i)=0.00415i+0.9305
式中:CI(i)为电池容量值,C(t)为温度修正后的电池容量值,C2(i)为电流修正系数;Ci为电池理论容量值,C1(t)代表温度修正系数,t代表该片段的平均温度,i为片段内平均电流。
基于上述计算过程,电池状态信息的构造特征如下:电池起始荷电量、电池结束荷电量、电池容量、片段最大电压、片段最小电压、片段电压均值、片段电压方差值、片段电流最大值、片段电流最小值、片段电流平均值、片段电流方差、温度一致性评分、电压一致性评分。
3.2车辆使用信息的构造特征
基于所述车辆使用信息,对速度进行微分,计算车辆加速度信息,车辆加速度计算公式如下:
式中,a代表加速度值;v2,v1分别代表后一时刻与当前时刻的速度差值;t2,t1分别表示后一时刻时间与当前时刻时间。
基于上述计算结果,车辆使用信息的构造特征如下:行驶车速、片段车速最大值、片段车速最小值、片段车速方差、总行驶里程、片段内行驶里程、加速度、片段内加速度最大值,片段内加速度最小值,片段内加速度方差、片段加速比例、片段减速比例、片段匀速比例、加速踏板行程值、制动踏板状态、片段持续时间、片段开始时间、片段结束时间。
3.3环境信息的构造特征
基于新能源汽车工作路径的经纬度信息以及行驶日期,利用网络爬虫技术,在网络上搜索车辆行驶时的环境信息,特征构造如下:环境温度、小时平均风速、小时平均风向、小时平均降水量。
4.温度影响
因为温度对能耗的巨大影响作用,若只是将环境温度作为特征放入模型当中,模型可能并不会识别到这项特征的重要性。因此,依据新能源公交车运行过程中的数据,得到新能源公交车的温度数据和能耗数据,采用k-means算法对温度能耗数据进行聚类,根据聚类结果建立温度分层的回归预测模型,其中k-means算法的计算公式如下:
式中,xj,yj分别代表在第j个维度的横、纵坐标;
计算流程如下:
(1)选择K个聚类中心;
(2)计算各个样本到聚类中心的距离;
(3)计算每个类别的新聚类中心;
(4)重复步骤(2)-(3),直到聚类中心不再发生变化。
5.建立模型
基于上述构造的三大类特征以及温度分层的回归预测模型,建立XGBoost回归预测模型,为获得效果最优的模型性能与准确度,结合网格搜索优化模型选取最优的参数组合,优化的参数如下:树最大深度:max_depth、叶子结点的数量:num_leaves、每个叶子结点的最小数据量:min_data_in_leaf、每次迭代中随机选择特征的比例:feature_fraction、非重复采样每次迭代中随机选择部分样本来训练:bagging_fraction、L1正则化系数:lambda_l1、学习率:learning_rate。
6.精度验证
将测试集数据输入到XGBoost回归预测模型当中,计算预测结果与真实能耗的误差,对XGBoost回归预测模型进行精度验证,若未达到误差要求,则重复上述1至5,若达到误差要求,则将其作为新能源公交车能耗预测模型,对新能源公交车的能耗进行预测。为达到预期的能耗预测结构,预测结果与真实能耗的误差要求≤5%。
之后每一次对同款新能源公交车,收集获取新能源公交车运行过程中的数据:车辆状态信息、电池状态信息、车辆使用信息、环境信息;将上述数据输入至新能源公交车能耗预测模型中,即可对新能源公交车的能耗进行预测。
实施例
以某公交车为研究对象,通过上述方法实现能耗预测,得到结果如下:
图2为公交车工作的纬度变化情况,根据其纬度变化特点标定的路径匹配锚点图及锚点说明。图3是根据经度最大时的速度变化划分的来去程情况,对公交车的工作路径及来去程实现了准确的区分。
图4为能耗温度聚类结果,可见根据温度的分布差异,能耗呈现明显的分层情况。基于构造的三大类特征以及温度分层的回归预测模型,建立XGBoost回归预测模型建立,实现对公交车的能耗预测,结合网格搜索优化模型选取最优的参数组合,图5是真实能耗与预测结果的相对误差图,误差基本处于≤5%的水平。
必须说明由于统计手段、统计时间或者其他因素影响,在图5中可能会造成误差过大的情况,但此部分数据较少,可不予考虑。
以上结合附图及具体实施例详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
Claims (7)
1.基于机器学习的新能源公交车能耗预测方法,其特征在于,包括以下步骤:
步骤一、收集获取新能源公交车运行过程中的数据:车辆状态信息、电池状态信息、车辆使用信息、环境信息;
步骤二、对获取的数据进行预处理:包括划分充放电片段、修正错误标记数据、修复缺失数据和状态滞后数据、匹配工作路径以及切分去回程路径;
所述新能源公交车的工作路径匹配中,将车辆维修或者车辆突发意外需要绕道偏离原有的行驶路径的情况剔除后,对新能源公交车的工作路径进行匹配;所述新能源公交车的去回程路径的路径切分中,基于纬度最低点进行周期的初步定位,然后通过工作路径中的多个特殊点作为纬度定位锚点,然后通过经度最大值处的速度变化情况实现去回程路径的切分;
步骤三、将预处理后的数据,从电池状态信息、车辆使用信息、环境信息三个维度对公交车能耗进行特征构造,得到三大类构造特征;
所述电池状态信息的构造特征包括:电池起始荷电量、电池结束荷电量、电池容量、片段最大电压、片段最小电压、片段电压均值、片段电压方差值、片段电流最大值、片段电流最小值、片段电流平均值、片段电流方差、温度一致性评分、电压一致性评分;
所述车辆使用信息的构造特征包括:行驶车速、片段车速最大值、片段车速最小值、片段车速方差、总行驶里程、片段内行驶里程、加速度、片段内加速度最大值,片段内加速度最小值,片段内加速度方差、片段加速比例、片段减速比例、片段匀速比例、加速踏板行程值、制动踏板状态、片段持续时间、片段开始时间、片段结束时间;
所述环境信息的构造特征包括:环境温度、小时平均风速、小时平均风向、小时平均降水量;
步骤四、使用k-means算法对温度能耗数据进行聚类,根据聚类结构建立温度分层的回归预测模型;
步骤五、基于三大类构造特征与温度分层的回归预测模型,建立XGBoost回归预测模型,为获得效果最优的模型性能与准确度,结合网格搜索优化模型选取最优的参数组合,优化的参数如下:树最大深度:max_depth、叶子结点的数量:num_leaves、每个叶子结点的最小数据量:min_data_in_leaf、每次迭代中随机选择特征的比例:feature_fraction、非重复采样每次迭代中随机选择部分样本来训练:bagging_fraction、L1正则化系数:lambda_l1、学习率:learning_rate;
步骤六、将测试集数据输入到XGBoost回归预测模型当中,计算预测结果与真实能耗的误差,对XGBoost回归预测模型进行精度验证,若未达到误差要求,则重复步骤二至步骤五,若达到误差要求,则将其作为新能源公交车能耗预测模型,对新能源公交车的能耗进行预测。
2.根据权利要求1所述的基于机器学习的新能源公交车能耗预测方法,其特征在于:所述步骤一中,
车辆状态信息包括以下特征:车辆状态、充电状态、运行模式数据;
所述电池状态信息包括以下特征:电池总电流、电池总电压、电池荷电量、电池历史能耗、电池单体温度最高最低值、电池单体电压最高最低数据;
所述车辆使用信息包括以下特征:车速、行驶累积里程、车辆经纬度、档位、加速踏板行程值、制动踏板状态数据;
所述环境信息包括以下特征:环境温度、降雨量、风速、风向数据。
3.根据权利要求2所述的基于机器学习的新能源公交车能耗预测方法,其特征在于:所述步骤二中,根据车辆状态信息和车辆使用信息,对数据进行充放电片段的划分,对错误标记数据进行修正;对大量字段缺失的数据进行删除;对少量字段缺失的数据及状态滞后数据采用片段内逻辑填补和机器学习算法填补;按照经纬度变化规律对新能源公交车的工作路径进行匹配,对新能源公交车的去回程路径进行切分;
所述错误标记数据为车辆处于充电状态且速度为0的情况下但是车辆状态却为行驶状态的数据,将这样的车辆状态数据修正为停车状态;所述大量字段缺失的数据为除了时间特征,其余特征全为空值的数据;所述少量字段缺失的数据为电池总电流、电池总电压、电池荷电量均缺失但其他特征未缺失的数据,或者行驶累积里程缺失但其他特征未缺失的数据;所述状态滞后数据为车辆停车熄火状态下但是车速连续不为零的数据。
4.根据权利要求3所述的基于机器学习的新能源公交车能耗预测方法,其特征在于:所述步骤二获取的数据中,当电池总电流、电池总电压、电池荷电量均缺失但其他特征未缺失时,电池总电流采用0进行填补,电池总电压采用采用随机森林法进行填补,电池荷电量采用上一条电池荷电量数据进行填补;当行驶累积里程缺失但其他特征未缺失时,行驶累积里程采用上下两条数据取均值的方式进行填补;车辆停车熄火状态下但是车速连续不为零时,车速采用0进行填补。
5.根据权利要求4所述的基于机器学习的新能源公交车能耗预测方法,其特征在于:所述电池容量CI(i)为:
其中,CI(i)为电池容量值,C(t)为温度修正后的电池容量值,C2(i)为电流修正系数;Ci为电池理论容量值,C1(t)代表温度修正系数,t代表该片段的平均温度,i为片段内平均电流;n代表某个充电过程中的窗口数量,n1,n2代表窗口起点和终点时刻,socn1,socn2代表该窗口的电池起始荷电量和电池结束荷电量。
6.根据权利要求1-5中任意一项所述的基于机器学习的新能源公交车能耗预测方法,其特征在于:所述步骤四中,
k-means算法的计算公式如下:
式中,xj,yj分别代表在第j个维度的横、纵坐标;
计算流程如下:
(1)选择K个聚类中心;
(2)计算各个样本到聚类中心的距离;
(3)计算每个类别的新聚类中心;
(4)重复步骤(2)-(3),直到聚类中心不再发生变化。
7.根据权利要求6所述的基于机器学习的新能源公交车能耗预测方法,其特征在于:所述步骤六中,预测结果与真实能耗的误差要求≤5%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211226921.0A CN115481813B (zh) | 2022-10-09 | 2022-10-09 | 基于机器学习的新能源公交车能耗预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211226921.0A CN115481813B (zh) | 2022-10-09 | 2022-10-09 | 基于机器学习的新能源公交车能耗预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115481813A CN115481813A (zh) | 2022-12-16 |
CN115481813B true CN115481813B (zh) | 2024-05-31 |
Family
ID=84394472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211226921.0A Active CN115481813B (zh) | 2022-10-09 | 2022-10-09 | 基于机器学习的新能源公交车能耗预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115481813B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118312862B (zh) * | 2024-06-06 | 2024-10-11 | 广汽埃安新能源汽车股份有限公司 | 一种汽车能耗预测方法、装置、存储介质及设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103744978A (zh) * | 2014-01-14 | 2014-04-23 | 清华大学 | 一种基于网格搜索技术用于支持向量机的参数寻优方法 |
CN105291845A (zh) * | 2015-11-13 | 2016-02-03 | 华晨汽车集团控股有限公司 | 一种电动汽车动态能耗及续驶里程的监测系统 |
CN107315884A (zh) * | 2017-07-04 | 2017-11-03 | 北京首钢自动化信息技术有限公司 | 一种基于线性回归的建筑能耗建模方法 |
CN108806021A (zh) * | 2018-06-12 | 2018-11-13 | 重庆大学 | 基于物理模型和道路特征参数的电动汽车目标路段能耗预测方法 |
CN109558988A (zh) * | 2018-12-13 | 2019-04-02 | 北京理工新源信息科技有限公司 | 一种基于大数据融合的电动汽车能耗预测方法及系统 |
CN110148023A (zh) * | 2019-05-15 | 2019-08-20 | 山大地纬软件股份有限公司 | 基于逻辑回归的电力积分商品推荐方法及系统 |
CN111832230A (zh) * | 2020-07-20 | 2020-10-27 | 南京信大气象科学技术研究院有限公司 | 基于相关性分析和数据均衡的能见度分层预测模型 |
CN112258337A (zh) * | 2020-09-14 | 2021-01-22 | 陕西讯格信息科技有限公司 | 一种自我补全修正的基站能耗模型预测方法 |
CN114676495A (zh) * | 2021-12-10 | 2022-06-28 | 北京新能源汽车股份有限公司 | 一种汽车能耗的预测方法、装置和设备 |
-
2022
- 2022-10-09 CN CN202211226921.0A patent/CN115481813B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103744978A (zh) * | 2014-01-14 | 2014-04-23 | 清华大学 | 一种基于网格搜索技术用于支持向量机的参数寻优方法 |
CN105291845A (zh) * | 2015-11-13 | 2016-02-03 | 华晨汽车集团控股有限公司 | 一种电动汽车动态能耗及续驶里程的监测系统 |
CN107315884A (zh) * | 2017-07-04 | 2017-11-03 | 北京首钢自动化信息技术有限公司 | 一种基于线性回归的建筑能耗建模方法 |
CN108806021A (zh) * | 2018-06-12 | 2018-11-13 | 重庆大学 | 基于物理模型和道路特征参数的电动汽车目标路段能耗预测方法 |
CN109558988A (zh) * | 2018-12-13 | 2019-04-02 | 北京理工新源信息科技有限公司 | 一种基于大数据融合的电动汽车能耗预测方法及系统 |
CN110148023A (zh) * | 2019-05-15 | 2019-08-20 | 山大地纬软件股份有限公司 | 基于逻辑回归的电力积分商品推荐方法及系统 |
CN111832230A (zh) * | 2020-07-20 | 2020-10-27 | 南京信大气象科学技术研究院有限公司 | 基于相关性分析和数据均衡的能见度分层预测模型 |
CN112258337A (zh) * | 2020-09-14 | 2021-01-22 | 陕西讯格信息科技有限公司 | 一种自我补全修正的基站能耗模型预测方法 |
CN114676495A (zh) * | 2021-12-10 | 2022-06-28 | 北京新能源汽车股份有限公司 | 一种汽车能耗的预测方法、装置和设备 |
Also Published As
Publication number | Publication date |
---|---|
CN115481813A (zh) | 2022-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110570014B (zh) | 一种基于蒙特卡洛和深度学习的电动汽车充电负荷预测方法 | |
WO2021244632A1 (zh) | 一种电动汽车能耗预测方法及系统 | |
CN108550261B (zh) | 基于rfid电子车牌的城市交通od计算方法 | |
CN111009134A (zh) | 一种基于前车与自车互动的短期车速工况实时预测方法 | |
CN110174117A (zh) | 一种电动汽车充电路线规划方法 | |
CN111815948B (zh) | 基于工况特征的车辆行驶工况预测方法 | |
CN110991757A (zh) | 一种混合动力电动汽车综合预测能量管理方法 | |
CN108761509A (zh) | 一种基于历史数据的汽车行驶轨迹及里程预测方法 | |
CN106427589A (zh) | 基于工况预测和模糊能耗的电动汽车续驶里程估算方法 | |
CN110682905B (zh) | 基于行驶里程的时域中电池荷电状态参考变化量获取方法 | |
CN108417032B (zh) | 一种城市中心区路边停车需求分析预测方法 | |
CN104792543A (zh) | 一种道路循环工况的构建方法 | |
CN114103924A (zh) | 一种混合动力车辆能量管理控制方法及装置 | |
CN115481813B (zh) | 基于机器学习的新能源公交车能耗预测方法 | |
CN116187161A (zh) | 一种智能网联环境下混合动力客车智能能量管理方法及系统 | |
CN115935672A (zh) | 一种融合工况预测信息的燃料电池汽车能耗计算方法 | |
CN113159435B (zh) | 一种新能源车辆剩余驾驶里程预测方法及系统 | |
Croce et al. | Energy consumption of electric vehicles: Models’ estimation using big data (FCD) | |
CN112580251A (zh) | 基于交通信息和模型预测控制的混动汽车能量管理方法 | |
CN113642768A (zh) | 一种基于工况重构的车辆行驶能耗预测方法 | |
CN109493449A (zh) | 一种基于货车gps轨迹数据和高速交易数据的货车载货状态估计方法 | |
Kang et al. | Link-based emission model for eco routing | |
CN111967686B (zh) | 一种基于用电概率分布函数的随机负荷预测方法 | |
Zhang et al. | Neural network based vehicle speed prediction for specific urban driving | |
CN115759347A (zh) | 一种基于特征数据的电动公交车行程能耗快速预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |