CN117389791A - 一种柴油车能耗异常归因方法 - Google Patents

一种柴油车能耗异常归因方法 Download PDF

Info

Publication number
CN117389791A
CN117389791A CN202311710544.2A CN202311710544A CN117389791A CN 117389791 A CN117389791 A CN 117389791A CN 202311710544 A CN202311710544 A CN 202311710544A CN 117389791 A CN117389791 A CN 117389791A
Authority
CN
China
Prior art keywords
minute
energy consumption
vehicle
data
average value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311710544.2A
Other languages
English (en)
Other versions
CN117389791B (zh
Inventor
刘杨
王欣然
侍勇绗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Sea Level Data Technology Co ltd
Original Assignee
Jiangsu Sea Level Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Sea Level Data Technology Co ltd filed Critical Jiangsu Sea Level Data Technology Co ltd
Priority to CN202311710544.2A priority Critical patent/CN117389791B/zh
Publication of CN117389791A publication Critical patent/CN117389791A/zh
Application granted granted Critical
Publication of CN117389791B publication Critical patent/CN117389791B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0736Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function
    • G06F11/0739Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function in a data processing system embedded in automotive or aircraft systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明提出的是一种柴油车能耗异常归因方法,该方法包括:1)特征因子构建阶段;2)归因发现与定义阶段;3)标准能耗训练阶段;4)能耗异常归因应用阶段;所述特征因子构建阶段包括:1‑1)训练集构建及清洗,1‑2)定义训练集中每个车辆的运行状态及特征因子,1‑3)特征因子计算;所述归因发现与定义阶段包括:2‑1)自动化归因发现,找出问题特征因子,2‑2)归因定义;所述标准能耗训练阶段包括:3‑1)计算得到标准能耗MAP,3‑2)归因特征因子分布计算;所述能耗异常归因应用阶段包括:4‑1)能耗异常数据检出,4‑2)异常归因定位;本发明解决了如何对柴油车能耗异常的原因进行归因的问题。

Description

一种柴油车能耗异常归因方法
技术领域
本发明涉及一种柴油车能耗异常归因方法,属于大数据处理分析技术及车辆能耗分析领域。
背景技术
在传统柴油车辆的全生命周期成本中,能耗成本的占比超过37%;对于整车厂商而言,其车辆的能耗水平是产品竞争力的重要评价指标;然而,实际用车过程中,车辆的能耗水平与多种因素有关,譬如不良的驾驶行为可能导致能耗偏高,复杂的行车路线与工况也会导致能耗偏高,车辆潜在的故障同样会导致能耗处于异常的水平。
当前车联网条件下,用于评价车辆能耗水平的标准主要基于“百公里能耗”指标,即每百公里燃油的消耗量,也有一些专利提出了根据车辆的实际工况对能耗异常进行检测的方法(例如发明名称为“一种基于车联网大数据的车辆能耗评价方法”,专利号为ZL2021102488645的发明专利);但目前尚缺少发现能耗异常后,对造成能耗异常问题的归因方法;若无法定位到造成异常的原因,研发与售后很难针对某车型共性的问题进行调整或主动服务来解决车辆存在的能耗问题。
柴油车动力总成构成复杂,进气系统、润滑系统、后处理系统等不同系统间存在复杂的控制逻辑,直接通过故障码等方式难以对能耗情况做出判断;同时柴油车通常用于商业运输领域,其驾驶循环数量多,发动机持续作业时长,容易覆盖多种存在差异的作业工况,复杂的工况环境使得与柴油机能耗相关的各种数据系统关联复杂,造成对柴油车的能耗异常归因困难,现有技术无法对柴油车的能耗异常进行归因。
因此,构建一种针对柴油车的车辆能耗异常归因的方法,对于应用能耗异常发现的结果、为业务提供真正有价值的意见、降低柴油车车辆的不合理能耗具有重要的应用价值。
发明内容
本发明提出的是一种柴油车能耗异常归因方法,其目的旨在解决现有技术在发现柴油车能耗异常后,无法对造成能耗异常的原因进行归因的问题。
本发明的技术解决方案:一种柴油车能耗异常归因方法,该方法包括:1)特征因子构建阶段;2)归因发现与定义阶段;3)标准能耗训练阶段;4)能耗异常归因应用阶段;所述特征因子构建阶段包括:1-1)训练集构建及清洗,1-2)定义训练集中每个车辆的运行状态及特征因子,1-3)特征因子计算;所述归因发现与定义阶段包括:2-1)自动化归因发现,找出问题特征因子,2-2)归因定义;所述标准能耗训练阶段包括:3-1)计算得到标准能耗MAP,3-2)归因特征因子分布计算;所述能耗异常归因应用阶段包括:4-1)能耗异常数据检出,4-2)异常归因定位。
进一步地,所述训练集构建及清洗,具体包括:
1-1-1)针对同一类车型及用途的车辆,从车联网历史数据中抽取不小于一整年、且不少于100辆车辆的车联网历史数据作为训练集;
1-1-2)根据训练集中每辆车每天的数据情况,按照剔除规则按天剔除相应车辆的无效数据;所述剔除规则为:若某辆车某一天的数据满足该车辆当日行驶里程≤2km、该车辆当日发动机启动时长≤600s、该车辆当日油门踏板开度持续为0%中的任一条,则当天该车辆的所有数据就作为无效数据进行剔除。
进一步地,所述定义训练集中每个车辆的运行状态及特征因子,具体包括:
1-2-1)定义训练集中每个车辆的运行状态;
1-2-2)定义训练集中每个车辆的特征因子;定义每个车辆的特征因子包括分钟级车速平均值、分钟级车速最大值、分钟级车速最小值、分钟级车速中位数、分钟级车速标准差,分钟级发动机转速平均值、分钟级发动机转速最大值、分钟级发动机转速最小值、分钟级发动机转速中位数、分钟级发动机转速标准差,分钟级发动机功率平均值、分钟级发动机功率最大值、分钟级发动机功率最小值、分钟级发动机功率中位数、分钟级发动机功率标准差、分钟级发动机燃料流量平均值、分钟级发动机冷却液温度平均值、分钟级环境温度平均值、分钟级进气量平均值、分钟级大气压力平均值、分钟级油门踏板开度平均值、分钟级急踩油门踏板最大值、分钟级蓄电池电压平均值、分钟级机油压力平均值、分钟级DPF碳载量平均值、分钟级发动机工作时长;
所述特征因子计算,具体包括:根据定义的特征因子,按照车辆识别码、运行状态、时间三个维度,对训练集中原始1Hz数据进行聚合计算得到每个车辆的特征因子,若某车辆在某一分钟内存在多种运行状态,则该车辆该分钟内的特征因子数据需要被剔除,得到每辆车每分钟的特征因子结果,将训练集从秒级数据转换为分钟级数据。
进一步地,所述自动化归因发现,找出问题特征因子,具体包括:
2-1-1)从训练集中区分正常能耗训练集与高能耗训练集;首先,将训练集中的分钟级车速平均值和分钟级发动机功率平均值均按照四舍五入法取整;然后,将训练集中分钟级车速平均值和分钟级发动机功率平均值均相同的车辆的特征因子放入同一个数据分箱内,形成若干不同的数据分箱;同一个数据分箱内所有车辆的分钟级车速平均值相同,所有车辆的分钟级发动机功率平均值也相同;再然后,根据每个数据分箱内分钟级发动机燃料流量平均值,将每个数据分箱内分钟级发动机燃料流量平均值从高到低排,分钟级发动机燃料流量平均值高的排在前,分钟级发动机燃料流量平均值低的排在后,将分钟级发动机燃料流量平均值排在前10%的车辆的车联网历史数据中相应分钟级数据对应的车辆识别号、运行状态、时间做标记形成训练集中的高能耗训练集,训练集中其余的车联网历史数据形成正常能耗训练集;
2-1-2)训练集标准化;所述训练集标准化的具体计算包括正常能耗训练集的标准化计算和高能耗训练集的标准化计算;
所述正常能耗训练集的标准化计算,具体如公式(1):
公式(1);
公式(1)中,N代表正常能耗训练集,m代表第m个特征因子,代表正常能耗训练集中第m个特征因子标准化后的标准值,/>代表正常能耗训练集中第m个特征因子的原始数据值,/>代表正常能耗训练集中第m个特征因子的均值,/>代表正常能耗训练集中第m个特征因子的标准差;
所述高能耗训练集的标准化计算,具体如公式(2):
公式(2);
公式(2)中,A代表高能耗训练集,代表高能耗训练集中第m个特征因子标准化后的标准值,/>代表高能耗训练集中第m个特征因子的原始数据值,/>代表正常能耗训练集中第m个特征因子的均值,/>表正常能耗训练集中第m个特征因子的标准差;正常能耗训练集中的第m个特征因子与高能耗训练集中的第m个特征因子为同样的特征因子;
2-1-3)基于二维核密度估计方法计算每个数据分箱内特征因子之间的联合概率密度,具体如下:
公式(3);
式中表示第k个数据分箱内的联合概率密度函数,对于一组特征因子组合——特征因子一与特征因子二,定义/>代表每个数据分箱内某车第i分钟的标准化后的特征因子一,/>代表同一个数据分箱内某车第i分钟的标准化后的特征因子二,K代表使用高斯核函数,n为该数据分箱内总的分钟数,h为设置的带宽参数,带宽参数设置为0.3;/>、/>分别表示对应分箱内标准化后的特征因子一与标准化后的特征因子二可能的取值;正常能耗训练集与高能耗训练集分别计算第k个数据分箱内的概率密度函数,记为/>与/>
2-1-4)问题特征因子确定;根据每个数据分箱内的联合概率密度函数,对于正常能耗训练集与高能耗训练集中相同分钟级车速平均值与分钟级发动机功率平均值的数据分箱内,计算各标准化后的特征因子间联合概率密度函数的差异,发现存在问题的特征因子;使用KL散度度量单个数据分箱内正常能耗训练集与高能耗训练集中相同特征因子组合对应的联合概率密度函数的差异;KL散度的计算如公式(4):
公式(4);
公式(4)中,为第j组标准化后的特征因子组合在第k个数据分箱内计算的KL散度值,第j组标准化后的特征因子组合为所有特征因子组合中的某一组标准化后的特征因子组合;
通过比较正常能耗训练集和高能耗训练集各数据分箱内的KL散度分布,按照以下筛选条件,实现问题特征因子的定位:单个数据分箱中,如果某个标准化后的特征因子组合的KL散度大于5,则判断第k个分箱内对应的特征因子组合可能存在异常;从该特征因子组合的所有数据分箱来看,被判断为异常的数据分箱数量占所有数据分箱的比例大于或等于30%时,判定为该特征因子组合是可疑的异常归因组合;若某一特征因子的所有组合中,有大于或等于30%被判定为可疑的异常归因组合,则认定该特征因子是造成高能耗的原因即问题特征因子;通过以上筛选,实现对问题特征因子的定位。
进一步地,所述归因定义,具体包括:
2-2-1)从问题特征因子对应的车辆历史工况数据中的变量确定相应的归因;特征因子与车辆历史工况数据中的变量对应关系包括:分钟级发动机冷却液温度平均值与冷却液温度对应;分钟级环境温度平均值与环境温度对应;分钟级进气量平均值与进气量对应;分钟级大气压力平均值与大气压力对应;分钟级油门踏板开度平均值、分钟级急踩油门踏板最大值与油门踏板开度对应;分钟级蓄电池电压平均值与蓄电池电压对应;分钟级机油压力平均值与机油压力对应;分钟级DPF碳载量平均值与DPF碳载量对应;分钟级发动机转速标准差均与发动机转速对应;
2-2-2)梳理对应特征因子的归因列表:分钟级发动机冷却液温度平均值出现异常对应冷车行驶、分钟级环境温度平均值出现异常对应环境温度低、分钟级进气量平均值异常对应进气量异常、分钟级大气压力平均值异常对应大气压力低、分钟级油门踏板开度平均值异常对应深踩油门、分钟级急踩油门踏板最大值异常对应急踩油门、分钟级蓄电池电压平均值异常对应蓄电池电压低、分钟级机油压力平均值异常对应机油压力异常、分钟级DPF碳载量平均值异常对应DPF碳载量高、分钟级发动机转速标准差异常对应发动机转速波动大共10类归因,作为后续模型应用的归因参考;同时记录每个归因相关联的特征因子。
进一步地,所述计算得到标准能耗MAP,具体包括:使用正常能耗训练集构建标准能耗MAP;按照分钟级车速平均值与分钟级发动机功率平均值两个维度对数据进行数据分箱,对每个数据分箱中的的分钟级发动机燃料流量平均值再取一次平均值,形成标准能耗MAP;标准能耗MAP中记录了每一个分钟级车速平均值与分钟级发动机功率平均值组合下,对应的一个标准能耗值。
进一步地,所述归因特征因子分布计算,具体为根据定义的归因,找到每个数据分箱中与相应归因对应的标准化后的特征因子,对每一个归因所对应的标准化后的特征因子在数据分箱内再取一次均值与标准差,得到对应标准能耗MAP每个数据分箱内的归因对应的标准化后的特征因子的均值与标准差。
进一步地,所述能耗异常数据检出是使用标准能耗MAP,对在线车辆最近24小时的分钟级数据进行能耗对比的参照,并根据与标准能耗的差异,判断某辆车当天是否存在能耗异常,具体包括:
4-1-1)抽取待分析的车联网在线数据:从车联网数据平台中,每日抽取最近24小时内对应车型的全部车联网在线数据,按照步骤1-2),根据车联网在线数据判断车辆的分钟级运行状态,并根据车联网在线数据计算相应的特征因子,得到分钟级待分析的分析数据集;同时需要对其中与归因相关的特征因子进行标准化;
4-1-2)判断车辆能耗是否异常;针对每一辆车,按照分钟级车速平均值与分钟级发动机功率平均值对车联网在线数据进行数据分箱,比较每分钟该车的分钟级发动机燃料流量平均值与对应标准能耗MAP中相应的数据分箱的发动机燃料流量平均值,当车辆的分钟级燃料流量平均值高于标准能耗MAP中相应数据分箱的发动机燃料流量平均值的占比超过当天该车所有分钟级燃料流量平均值数据量的65%时,认为该车在最近24小时的数据中存在能耗异常问题。
进一步地,所述异常归因定位,具体包括:
4-2-1)对判定为能耗异常的车辆,按照归因列表中每一条归因所对应的标准化后的特征因子,计算对应标准化后的特征因子组合的联合概率密度估计结果;
4-2-2)根据车联网在线数据得到该车辆分钟级车速平均值与分钟级发动机功率平均值分布,从正常能耗训练集中随机抽取与车联网在线数据中分钟级车速平均值与分钟级发动机功率平均值相等的分钟级数据,包含全部标准化后的特征因子;对抽样的数据同样按照归因列表中每一条归因所对应的特征因子,计算该标准化后的特征因子与其它标准化后的特征因子的联合概率密度函数估计结果;
4-2-3)针对每个归因对应的特征因子,计算与该归因所对应标准化后的特征因子所关联的标准化后的特征因子的联合概率密度函数估计结果,判断该特征因子是否满足问题特征因子的判定条件;若满足,则认为该车辆存在对应特征因子的归因问题,实现对车辆能耗异常归因的判断。
进一步地,所述能耗异常归因应用阶段还包括可节约能耗计算,所述可节约能耗计算包括:
4-3-1)统计该车辆计算的所有分钟级发动机燃料流量平均值中高于标准能耗MAP中对应数据分箱的发动机燃料流量平均值的所有分钟级发动机燃料流量平均值,计算该车辆分钟级发动机燃料流量平均值与标准能耗MAP中对应数据分箱的发动机燃料流量平 均值的差值,并与发动机运行时长乘积,进行求和得到之前24小时内的可节约能耗,记为
4-3-2)使用标准能耗MAP中每个数据分箱内已归因的标准化后的特征因子对应的均值与标准差,按照以下公式(5)计算该车辆某一个已确认归因的分布偏离度:
公式(5);
公式(5)中m代表某个已确认归因对应的特征因子,为第m个特征因子对应归因的分布偏离度,k表示该车辆分钟级燃料流量平均值高于标准能耗MAP中对应数据分箱的发动机燃料流量平均值的第k个数据分箱,n为该车辆分钟级燃料流量平均值高于标准能耗MAP中对应数据分箱的发动机燃料流量平均值对应的分箱数量,1≤kn,/>代表对应第k个分箱中该特征因子标准分布的均值,/>代表对应第k个分箱中该标准化后的特征因子标准分布的标准差,/>代表对应第k个分箱中该标准化后的特征因子的均值;通过以上标准化方法,度量不同归因对应特征因子的偏离度,剔除量纲的影响;
4-3-3)采用归一化方法,根据不同归因的偏离度,按照公式(6)计算对应归因的可节约能耗:
公式(6);
公式(6)中为已归因的第m个特征因子可节约的能耗,/>为步骤4-3-1)中计算的之前24小时内的可节约能耗,/>为步骤4-3-2)中得到的第m个特征因子对应归因的分布偏离度,/>为所有存在能耗异常问题的特征因子分布偏离度求和。
本发明的有益效果:
1)本发明解决了发现柴油车车辆能耗异常后,如何对造成能耗异常的原因进行归因的问题,本发明适用于对柴油车车辆能耗的异常归因;
2)本发明通过对柴油车能耗异常原因进行准确的定位,便于向售后与研发提供可直接参考的信息,便于后期帮助售后与研发通过服务形式改善车辆能耗水平或针对共性问题进行车辆配置或标定修正,有助于降低车辆的综合能耗水平;
3)本发明可以根据归因的类别,方便通过后市场方式为柴油车车主实现能耗的节约,有利于降低能源成本。
附图说明
附图1为本发明一种柴油车能耗异常归因方法的流程示意图。
附图2为本发明使用二维核密度估计得到的标准化后特征因子间联合概率密度函数的样例示意图。
具体实施方式
一种柴油车能耗异常归因方法,该方法包括以下步骤:
1)特征因子构建阶段;2)归因发现与定义阶段;3)标准能耗训练阶段;4)能耗异常归因应用阶段。
本发明中特征因子构建阶段、归因发现与定义阶段、标准能耗训练阶段均使用车联网历史数据;本发明中能耗异常归因应用阶段则使用车联网在线数据。
所述车联网历史数据指的是通过T-Box(Telematics BOX,简称车载T-BOX)采集与传输,存放在车联网数据平台的车辆历史工况数据;所有车辆历史工况数据通过T-Box采集时的采样频率均优选为1Hz;所述车联网在线数据指的是通过T-Box采集与传输的存放在车联网数据平台上最近24小时内的车联网工况数据,车联网在线数据的优选采样频率为1Hz;车联网历史数据和车联网在线数据均包括车速、发动机模式、发动机转速、燃料流量、机油温度、发动机实际扭矩、发动机摩擦扭矩、发动机参考扭矩、冷却液温度、环境温度、进气量、大气压力、油门踏板开度、蓄电池电压、机油压力、DPF碳载量、当日行驶里程。
所述特征因子构建阶段,具体包括以下步骤:1-1)训练集构建及清洗;1-2)定义训练集中每个车辆的运行状态及特征因子;1-3)特征因子计算。
所述训练集构建及清洗,具体包括以下步骤:
1-1-1)针对同一类车型及用途的车辆,从车联网历史数据中抽取不小于一整年、且不少于100辆车辆的车联网历史数据,作为训练集,所述一整年指一个完整的自然年;所述车联网历史数据包括车速、发动机模式、发动机转速、燃料流量、机油温度、发动机实际扭矩、发动机摩擦扭矩、发动机参考扭矩、冷却液温度、环境温度、进气量、大气压力、油门踏板开度、蓄电池电压、机油压力、DPF碳载量、当日行驶里程;
1-1-2)根据训练集中每辆车每天的数据情况,按照剔除规则按天剔除相应车辆的无效数据;所述剔除规则具体为:只要某个车辆某天的数据满足剔除条件中的任一条件,就将该车辆当天的数据作为无效数据进行剔除;所述剔除条件包括该车辆当日行驶里程≤2km、该车辆当日发动机启动时长(即当日发动机转速>0的数据量)≤600s、该车辆当日油门踏板开度持续为0%;若某辆车某一天的数据满足该车辆当日行驶里程≤2km、该车辆当日发动机启动时长(即当日发动机转速>0的数据量)≤600s、该车辆当日油门踏板开度持续为0%中的任一条,则当天该车辆的所有数据就作为无效数据进行剔除,不会再纳入后续计算。
所述定义训练集中每个车辆的运行状态及特征因子,具体包括以下步骤:
1-2-1)定义训练集中每个车辆的运行状态;优选根据发动机模式定义训练集中每个车辆的运行状态,将发动机模式定义为车辆的运行状态;所述发动机模式具体包括正常行驶模式、SCR加热模式、驻车主动再生模式、行车主动再生模式;比如,当发动机模式为正常行驶模式时,车辆的运行状态就定义为正常行驶模式;
1-2-2)定义训练集中每个车辆的特征因子;定义每个车辆的特征因子包括分钟级车速平均值、分钟级车速最大值、分钟级车速最小值、分钟级车速中位数、分钟级车速标准差,分钟级发动机转速平均值、分钟级发动机转速最大值、分钟级发动机转速最小值、分钟级发动机转速中位数、分钟级发动机转速标准差,分钟级发动机功率平均值、分钟级发动机功率最大值、分钟级发动机功率最小值、分钟级发动机功率中位数、分钟级发动机功率标准差、分钟级发动机燃料流量平均值、分钟级发动机冷却液温度平均值、分钟级环境温度平均值、分钟级进气量平均值、分钟级大气压力平均值、分钟级油门踏板开度平均值、分钟级急踩油门踏板最大值、分钟级蓄电池电压平均值、分钟级机油压力平均值、分钟级DPF碳载量平均值、分钟级发动机工作时长;
所述发动机功率按照下式计算:
所述急踩油门踏板最大值是基于分钟内相邻两秒之间油门踏板开度的变化值,统计该分钟内对应的油门踏板开度变化值的最大值,用来描述用户驾驶的激烈程度;所有特征因子均通过聚合计算的方式得到;所述特征因子的聚合计算方法为基于车辆的秒级数据,经过相应计算或求值得到的每分钟内相应车辆历史工况数据对应的数据;例如分钟级车速平均值具体为根据车辆的每秒的车速值在分钟内取平均值,得到对应分钟内车速的平均值。
所述特征因子计算,具体包括以下步骤:根据步骤1-2)中定义的特征因子,按照车辆识别码、运行状态、时间三个维度,对训练集中原始1Hz数据进行聚合计算得到每个车辆的特征因子,若某车辆在某一分钟内存在多种运行状态,则该车辆该分钟内的特征因子数据需要被剔除,得到每辆车每分钟的特征因子结果,将训练集从秒级数据转换为分钟级数据。
所述归因发现与定义阶段,具体包括以下步骤:2-1)自动化归因发现,找出问题特征因子;2-2)归因定义。
所述自动化归因发现,找出问题特征因子,目的为从训练集中自动地抽取可能导致能耗偏高的特征因子,具体包括以下步骤:
2-1-1)从训练集中区分正常能耗训练集与高能耗训练集;按照分钟级车速平均值与分钟级发动机功率平均值,使用数据分箱方法确定同一分钟级车速平均值与分钟级发动机功率平均值下的数据;
所述使用数据分箱方法确定同一分钟级车速平均值与分钟级发动机功率平均值下的数据,具体为:
首先,将训练集中的分钟级车速平均值和分钟级发动机功率平均值均按照四舍五入法取整;
然后,将训练集中分钟级车速平均值和分钟级发动机功率平均值均相同的车辆的特征因子放入同一个数据分箱内,形成若干不同的数据分箱;同一个数据分箱内所有车辆的分钟级车速平均值相同,所有车辆的分钟级发动机功率平均值也相同;
再然后,根据每个数据分箱内分钟级发动机燃料流量平均值,将每个数据分箱内分钟级发动机燃料流量平均值从高到低排,分钟级发动机燃料流量平均值高的排在前,分钟级发动机燃料流量平均值低的排在后,将分钟级发动机燃料流量平均值排在前10%的车辆的车联网历史数据中相应分钟级数据对应的车辆识别号、运行状态、时间做标记形成训练集中的高能耗训练集,训练集中其余的车联网历史数据形成正常能耗训练集;
所述数据分箱方法是一种将连续性数据转换为离散型数据的方法,例如步骤2-1-1)中根据分钟级车速平均值与分钟级发动机功率平均值进行分箱,训练集中对应的特征因子为连续性数据,通过四舍五入法取整后,根据不同的分钟级车速平均值与分钟级发动机功率平均值进行组合,将以上两个特征因子相等的数据行认为是可横向对比的数据,即数据在同一个数据分箱内,再对同一个数据分箱内的数据进行操作;
2-1-2)训练集标准化;由于高能耗训练集中的数据量明显偏少(历史数据集中,高能耗数据指的是明显偏离正常范围的,考虑到每个数据分箱内的能耗基本呈现正态分布,按照分位数原则只能选取少量的数据作为高能耗数据,否则就不具备分析价值、且正常能耗训练集中的数据会无法反映实际数据分布),在进行归因发现前,需要对正常能耗训练集与高能耗训练集中所有的特征因子进行标准化;训练集标准化的方法为根据正常能耗训练集中各特征因子的均值与方差,对正常能耗训练集与高能耗训练集同时进行均值-方差标准差,得到标准化后的特征因子;
所述训练集标准化的具体计算包括正常能耗训练集的标准化计算和高能耗训练集的标准化计算;
所述正常能耗训练集的标准化计算,具体如公式(1):
公式(1);
公式(1)中,N代表正常能耗训练集,m代表第m个特征因子,代表正常能耗训练集中第m个特征因子标准化后的标准值,/>代表正常能耗训练集中第m个特征因子的原始数据值,/>代表正常能耗训练集中第m个特征因子的均值,/>代表正常能耗训练集中第m个特征因子的标准差;
所述高能耗训练集的标准化计算,具体如公式(2):
公式(2);
公式(2)中,A代表高能耗训练集,代表高能耗训练集中第m个特征因子标准化后的标准值,/>代表高能耗训练集中第m个特征因子的原始数据值,/>代表正常能耗训练集中第m个特征因子的均值,/>代表正常能耗训练集中第m个特征因子的标准差;
正常能耗训练集中的第m个特征因子与高能耗训练集中的第m个特征因子为同样的特征因子;比如:如果正常能耗训练集中的第1个特征因子为分钟级车速平均值,则高能耗训练集中的第1个特征因子也为分钟级车速平均值,即:正常能耗训练集中和高能耗训练集中的特征因子排序相同;
所述高能耗训练集使用正常能耗训练集进行标准化的原因为高能耗训练集中可能存在数值异常的特征因子,纳入计算会影响特征因子的常规分布;
2-1-3)基于二维核密度估计方法计算每个数据分箱内特征因子之间的联合概率密度;车辆在使用过程中,各特征因子之间会存在明显的关联性,例如车辆正常行驶模式下,面对同样的平均车速与平均发动机功率时,机油压力与冷却液温度在冷却液温度小于70℃时会存在明显的相关性;为定位造成高能耗的特征因子,需要剔除特征因子间的关联影响,进行联立分布的异常判断;特征因子的列表参照步骤1-2-2);在进行特征因子之间的联立概率密度计算时,不考虑用于数据分箱的特征因子即分钟级车速平均值与分钟级发动机功率平均值,同时也不考虑分钟级车速最大值、分钟级车速最小值、分钟级车速中位数、分钟级发动机功率最大值、分钟级发动机功率最小值、分钟级发动机功率中位数;将标准化后的分钟级车速标准差,分钟级发动机转速平均值、分钟级发动机转速最大值、分钟级发动机转速最小值、分钟级发动机转速中位数、分钟级发动机转速标准差,分钟级发动机功率标准差、分钟级发动机燃料流量平均值、分钟级发动机冷却液温度平均值、分钟级环境温度平均值、分钟级进气量平均值、分钟级大气压力平均值、分钟级油门踏板开度平均值、分钟级急踩油门踏板最大值、分钟级蓄电池电压平均值、分钟级机油压力平均值、分钟级DPF碳载量平均值、分钟级发动机工作时长共18个特征因子两两组合形成18*18=324组特征因子组合,针对每个标准化后的特征因子组合进行二维核密度估计,在每一个数据分箱内进行324次二维核密度估计;
在应用二维核密度估计时,由于数据已经经过标准化,因此均采用高斯核函数,带宽参数设置为0.3,按照以上固定参数进行二维核密度估计;部分二维核密度估计样例如附图2所示,附图2展示了标准化后的分钟级机油压力平均值与标准化后的分钟级发动机冷却液温度平均值的联合概率密度;所述二维核密度估计方法是一种拓展的核密度估计方法,核密度估计是通过平滑的峰值函数来拟合样本数据,利用连续的密度曲线描述随机变量的分布形态,具有稳健性强、模型依赖性弱的特性,二维核密度估计则是同时基于两个变量,按照公式(3)进行联合概率密度函数计算,具体如下:
公式(3);
式中表示第k个数据分箱内的联合概率密度函数,对于一组特征因子组合——特征因子一与特征因子二,定义/>代表每个数据分箱内某车第i分钟的标准化后的特征因子一,/>代表同一个数据分箱内某车第i分钟的标准化后的特征因子二,K代表使用高斯核函数,n为该数据分箱内总的分钟数,h为设置的带宽参数,带宽参数优选设置为0.3,/>为联合概率密度函数的自变量,分别表示对应分箱内标准化后的特征因子一与标准化后的特征因子二可能的取值;优选地,由于已经经过标准化,/>的精度需具体到0.01,且取值范围均为[-10,10];利用二维核密度估计分别计算出每个分箱内各个标准化后的特征因子组合之间的联合概率密度函数;正常能耗训练集与高能耗训练集分别计算第k个数据分箱内的概率密度函数,记为/>
2-1-4)问题特征因子确定;根据每个数据分箱内的联合概率密度函数,对于正常能耗训练集与高能耗训练集中相同分钟级车速平均值与分钟级发动机功率平均值的数据分箱内,计算各标准化后的特征因子间联合概率密度函数的差异,发现存在问题的特征因子;使用KL散度(相对熵)度量单个数据分箱内正常能耗训练集与高能耗训练集中相同特征因子组合对应的联合概率密度函数的差异;KL散度的计算如公式(4):
公式(4);
公式(4)中,j组标准化后的特征因子组合在第k个数据分箱内计算的KL散度值,第j组标准化后的特征因子组合为324组特征因子组合中的某一组标准化后的特征因子组合;
通过比较正常能耗训练集和高能耗训练集各数据分箱内的KL散度分布,按照以下筛选条件,实现问题特征因子的定位:单个数据分箱中,如果某个标准化后的特征因子组合的KL散度大于5,则判断第k个分箱内对应的特征因子组合可能存在异常;从该特征因子组合的所有数据分箱来看,被判断为异常的数据分箱数量占所有数据分箱的比例大于或等于30%时,判定为该特征因子组合是可疑的异常归因组合;若某一特征因子的所有组合中,有大于或等于30%被判定为可疑的异常归因组合,则认定该特征因子是造成高能耗的原因即问题特征因子;通过以上筛选,实现对问题特征因子的定位;所述KL散度阈值5,数据分箱占比超过30%,特征因子组合占比大于30%是基于某柴油车车型一年的历史数据训练得到的优选比例。
所述归因定义,具体包括以下步骤:
2-2-1)根据步骤2-1)中得到的问题特征因子,从问题特征因子对应的车辆历史工况数据中的变量确定相应的归因;例如若定位到分钟级机油压力平均值是问题特征因子,同时分钟级机油压力平均值对应车辆历史工况数据中的机油压力变量,则可定义该归因为机油压力异常,对应的处置建议为检查机油品质,及时更换机油;
特征因子与车辆历史工况数据中的变量对应关系为:分钟级发动机冷却液温度平均值与冷却液温度对应;分钟级环境温度平均值与环境温度对应;分钟级进气量平均值与进气量对应;分钟级大气压力平均值与大气压力对应;分钟级油门踏板开度平均值、分钟级急踩油门踏板最大值与油门踏板开度对应;分钟级蓄电池电压平均值与蓄电池电压对应;分钟级机油压力平均值与机油压力对应;分钟级DPF碳载量平均值与DPF碳载量对应;分钟级发动机转速标准差均与发动机转速对应;
由于分钟级车速平均值、分钟级车速最大值、分钟级车速最小值、分钟级车速中位数、分钟级车速标准差、分钟级发动机功率平均值、分钟级发动机功率最大值、分钟级发动机功率最小值、分钟级发动机功率中位数、分钟级发动机功率标准差是数据分箱的相关变量,无需作为待归因的特征因子;同时,分钟级发动机转速平均值、分钟级发动机转速最大值、分钟级发动机转速最小值、分钟级发动机转速中位数与车速和功率强相关,也无需作为归因的特征因子;分钟级发动机工作时长只是与时间有关,也无需作为归因的特征因子;
2-2-2)按照步骤2-2-1)中提到的归因定义的方法,梳理对应特征因子的归因列表,具体归因包括:分钟级发动机冷却液温度平均值出现异常对应冷车行驶、分钟级环境温度平均值出现异常对应环境温度低、分钟级进气量平均值异常对应进气量异常、分钟级大气压力平均值异常对应大气压力低、分钟级油门踏板开度平均值异常对应深踩油门、分钟级急踩油门踏板最大值异常对应急踩油门、分钟级蓄电池电压平均值异常对应蓄电池电压低、分钟级机油压力平均值异常对应机油压力异常、分钟级DPF碳载量平均值异常对应DPF碳载量高、分钟级发动机转速标准差异常对应发动机转速波动大共10类归因,作为后续模型应用的归因参考;同时需要记录每个归因相关联的特征因子,用于后续的计算。
所述标准能耗训练阶段,具体包括以下步骤:
3-1)计算得到标准能耗MAP;
3-2)归因特征因子分布计算。
所述MAP图是一类用于发动机ECU(Electronic Control Unit,电子控制单元,又称"行车电脑"、"车载电脑"等)控制逻辑的数据结构,常用于发动机标定领域,指的是在两个变量不同取值组合的情况下,对应目标变量的数值。
所述计算得到标准能耗MAP,具体包括:使用正常能耗训练集构建标准能耗MAP;按照分钟级车速平均值与分钟级发动机功率平均值两个维度对数据进行数据分箱,具体数据分箱方法参照步骤2-1-1),对每个数据分箱中的分钟级发动机燃料流量平均值再取一次平均值,形成标准能耗MAP;标准能耗MAP中记录了每一个分钟级车速平均值与分钟级发动机功率平均值组合下,对应的一个标准能耗值。
所述归因特征因子分布计算,具体为根据步骤2-2-2)中定义的10种归因,找到每个数据分箱中与相应归因对应的标准化后的特征因子,对每一个归因所对应的的标准化后的特征因子在数据分箱内再取一次均值与标准差,得到对应标准能耗MAP每个数据分箱内的归因对应的标准化后的特征因子的均值与标准差。
所述能耗异常归因应用阶段,具体包括以下步骤:
4-1)能耗异常数据检出;
4-2)异常归因定位;
4-3)可节约能耗计算。
所述能耗异常数据检出是使用步骤3)标准能耗训练阶段得到的标准能耗MAP,对在线车辆最近24小时的分钟级数据进行能耗对比的参照,并根据与标准能耗的差异,判断某辆车当天是否存在能耗异常,具体包括以下步骤:
4-1-1)抽取待分析的车联网在线数据:从车联网数据平台中,每日抽取最近24小时内对应车型的全部车联网在线数据,按照步骤1-2),根据车联网在线数据判断车辆的分钟级运行状态,并根据车联网在线数据计算相应的特征因子,得到分钟级待分析的分析数据集;同时需要对其中与归因相关的特征因子按照步骤2-1-2)进行标准化;
4-1-2)判断车辆能耗是否异常;针对每一辆车,按照分钟级车速平均值与分钟级发动机功率平均值对车联网在线数据进行数据分箱,比较每分钟该车的分钟级发动机燃料流量平均值与对应标准能耗MAP中相应的数据分箱的发动机燃料流量平均值,当车辆的分钟级燃料流量平均值高于标准能耗MAP中相应数据分箱的发动机燃料流量平均值的占比超过当天该车所有分钟级燃料流量平均值数据量的65%时,认为该车在最近24小时的数据中存在能耗异常问题。
所述异常归因定位根据步骤2-2)定义的归因列表,验证某车的特征因子分布是否与标准能耗MAP对应特征因子的分布有所差异,具体包括以下步骤:
4-2-1)参照步骤2-2)中的二维核密度估计方法,对判定为能耗异常的车辆,按照归因列表中每一条归因所对应的标准化后的特征因子,计算对应标准化后的特征因子组合的联合概率密度估计结果;
4-2-2)使用蒙特卡洛抽样法,根据车联网在线数据得到该车辆分钟级车速平均值与分钟级发动机功率平均值分布,从步骤2-1)中的正常能耗训练集中随机抽取与车联网在线数据中分钟级车速平均值与分钟级发动机功率平均值相等的分钟级数据,包含全部标准化后的特征因子;且抽取的数据须满足抽样要求:正常能耗训练集抽取的分钟级数据:该车辆分钟级车联网在线数据比例为3:1;对抽样的数据同样按照归因列表中每一条归因所对应的特征因子,计算该标准化后的特征因子与其它标准化后的特征因子的联合概率密度函数估计结果;
4-2-3)针对每个归因对应的特征因子,计算与该归因所对应标准化后的特征因子所关联的标准化后的特征因子的联合概率密度函数估计结果,按照步骤2-1-4)中问题特征因子的确定方法,判断该特征因子是否满足2-1-4)中问题特征因子的判定条件;若满足,则认为该车辆存在对应特征因子的归因问题,实现对车辆能耗异常归因的判断。
所述步骤4-3)可节约能耗计算,对车辆存在的归因问题进行定位后,需要量化评价该归因导致的能耗浪费,具体包括:
4-3-1)统计步骤4-1)中该车辆计算的所有分钟级发动机燃料流量平均值中高于标准能耗MAP中对应数据分箱的发动机燃料流量平均值的所有分钟级发动机燃料流量平均值,计算该车辆分钟级发动机燃料流量平均值与标准能耗MAP中对应数据分箱的发动机燃料流量平均值的差值,并与发动机运行时长乘积,进行求和得到之前24小时内的可节约能耗,记为
4-3-2)使用步骤3-2)得到标准能耗MAP图中每个数据分箱内已归因的标准化后的特征因子对应的均值与标准差,按照以下公式(5)计算该车辆某一个已确认归因的分布偏离度:
公式(5);
公式(5)中m代表某个已确认归因对应的特征因子,m个特征因子对应归因的分布偏离度,k表示该车辆分钟级燃料流量平均值高于标准能耗MAP中对应数据分箱的发动机燃料流量平均值的第k个数据分箱,n为该车辆分钟级燃料流量平均值高于标准能耗MAP中对应数据分箱的发动机燃料流量平均值对应的分箱数量,1≤kn,/>代表对应第k个分箱中该特征因子标准分布的均值,/>代表对应第k个分箱中该标准化后的特征因子标准分布的标准差,/>代表对应第k个分箱中该标准化后的特征因子的均值;通过以上标准化方法,可以度量不同归因对应特征因子的偏离度,剔除量纲的影响;
4-3-3)采用归一化方法,根据不同归因的偏离度,按照下式计算对应归因的可节约能耗:
上式中为已归因的第m个特征因子可节约的能耗,/>步骤4-3-1)中计算的之前24小时内的可节约能耗,/>为步骤4-3-2)中得到的第m个特征因子对应归因的分布偏离度,/>为所有存在能耗异常问题的特征因子分布偏离度求和。
至此,实现对该车可节约能耗的计算,相关的归因与可节约能耗数值将可以用于业务中,帮助用户进行相关的处理决策。

Claims (10)

1.一种柴油车能耗异常归因方法,其特征是该方法包括:1)特征因子构建阶段;2)归因发现与定义阶段;3)标准能耗训练阶段;4)能耗异常归因应用阶段;所述特征因子构建阶段包括:1-1)训练集构建及清洗,1-2)定义训练集中每个车辆的运行状态及特征因子,1-3)特征因子计算;所述归因发现与定义阶段包括:2-1)自动化归因发现,找出问题特征因子,2-2)归因定义;所述标准能耗训练阶段包括:3-1)计算得到标准能耗MAP,3-2)归因特征因子分布计算;所述能耗异常归因应用阶段包括:4-1)能耗异常数据检出,4-2)异常归因定位。
2.根据权利要求1所述的一种柴油车能耗异常归因方法,其特征是所述训练集构建及清洗,具体包括:
1-1-1)针对同一类车型及用途的车辆,从车联网历史数据中抽取不小于一整年、且不少于100辆车辆的车联网历史数据作为训练集;
1-1-2)根据训练集中每辆车每天的数据情况,按照剔除规则按天剔除相应车辆的无效数据;所述剔除规则为:若某辆车某一天的数据满足该车辆当日行驶里程≤2km、该车辆当日发动机启动时长≤600s、该车辆当日油门踏板开度持续为0%中的任一条,则当天该车辆的所有数据就作为无效数据进行剔除。
3.根据权利要求1所述的一种柴油车能耗异常归因方法,其特征是所述定义训练集中每个车辆的运行状态及特征因子,具体包括:
1-2-1)定义训练集中每个车辆的运行状态;
1-2-2)定义训练集中每个车辆的特征因子;定义每个车辆的特征因子包括分钟级车速平均值、分钟级车速最大值、分钟级车速最小值、分钟级车速中位数、分钟级车速标准差,分钟级发动机转速平均值、分钟级发动机转速最大值、分钟级发动机转速最小 值、分钟级发动机转速中位数、分钟级发动机转速标准差,分钟级发动机功率平均值、分钟级发动机功率最大值、分钟级发动机功率最小值、分钟级发动机功率中位数、分钟级发动机功率标准差、分钟级发动机燃料流量平均值、分钟级发动机冷却液温度平均值、分钟级环境温度平均值、分钟级进气量平均值、分钟级大气压力平均值、分钟级油门踏板开度平均值、分钟级急踩油门踏板最大值、分钟级蓄电池电压平均值、分钟级机油压力平均值、分钟级DPF碳载量平均值、分钟级发动机工作时长;
所述特征因子计算,具体包括:根据定义的特征因子,按照车辆识别码、运行状态、时间三个维度,对训练集中原始1Hz数据进行聚合计算得到每个车辆的特征因子,若某车辆在某一分钟内存在多种运行状态,则该车辆该分钟内的特征因子数据需要被剔除,得到每辆车每分钟的特征因子结果,将训练集从秒级数据转换为分钟级数据。
4.根据权利要求1所述的一种柴油车能耗异常归因方法,其特征是所述自动化归因发现,找出问题特征因子,具体包括:
2-1-1)从训练集中区分正常能耗训练集与高能耗训练集;首先,将训练集中的分钟级车速平均值和分钟级发动机功率平均值均按照四舍五入法取整;然后,将训练集中分钟级车速平均值和分钟级发动机功率平均值均相同的车辆的特征因子放入同一个数据分箱内,形成若干不同的数据分箱;同一个数据分箱内所有车辆的分钟级车速平均值相同,所有车辆的分钟级发动机功率平均值也相同;再然后,根据每个数据分箱内分钟级发动机燃料流量平均值,将每个数据分箱内分钟级发动机燃料流量平均值从高到低排,分钟级发动机燃料流量平均值高的排在前,分钟级发动机燃料流量平均值低的排在后,将分钟级发动机燃料流量平均值排在前10%的车辆的车联网历史数据中相应分钟级数据对应的车辆识别号、运行状态、时间做标记形成训练集中的高能耗训练集,训练集中其余的车联网历史数据形成正常能耗训练集;
2-1-2)训练集标准化;所述训练集标准化的具体计算包括正常能耗训练集的标准化计算和高能耗训练集的标准化计算;
所述正常能耗训练集的标准化计算,具体如公式(1):
公式(1);
公式(1)中,N代表正常能耗训练集,m代表第m个特征因子,代表正常能耗训练集中第m个特征因子标准化后的标准值,/>代表正常能耗训练集中第m个特征因子的原始数据值,/>代表正常能耗训练集中第m个特征因子的均值,/>代表正常能耗训练集中第m个特征因子的标准差;
所述高能耗训练集的标准化计算,具体如公式(2):
公式(2);
公式(2)中,A代表高能耗训练集,代表高能耗训练集中第m个特征因子标准化后的标准值,/>代表高能耗训练集中第m个特征因子的原始数据值,/>代表正常能耗训练集中第m个特征因子的均值,/>代表正常能耗训练集中第m个特征因子的标准差;正常能耗训练集中的第m个特征因子与高能耗训练集中的第m个特征因子为同样的特征因子;
2-1-3)基于二维核密度估计方法计算每个数据分箱内特征因子之间的联合概率密度,具体如下:
公式(3);
式中表示第k个数据分箱内的联合概率密度函数,对于一组特征因子组合— —特征因子一与特征因子二,定义/>代表每个数据分箱内某车第i分钟的标准化后的特征因子一,/>代表同一个数据分箱内某车第i分钟的标准化后的特征因子二,K代表使用高斯核函数,n为该数据分箱内总的分钟数,h为设置的带宽参数,带宽参数设置为0.3;/>、/>分别表示对应分箱内标准化后的特征因子一与标准化后的特征因子二可能的取值;正常能耗训练集与高能耗训练集分别计算第k个数据分箱内的概率密度函数,记为/>与/>
2-1-4)问题特征因子确定;根据每个数据分箱内的联合概率密度函数,对于正常能耗训练集与高能耗训练集中相同分钟级车速平均值与分钟级发动机功率平均值的数据分箱内,计算各标准化后的特征因子间联合概率密度函数的差异,发现存在问题的特征因子;使用KL散度度量单个数据分箱内正常能耗训练集与高能耗训练集中相同特征因子组合对应的联合概率密度函数的差异;KL散度的计算如公式(4):
公式(4);
公式(4)中,为第j组标准化后的特征因子组合在第k个数据分箱内计算的KL散度值,第j组标准化后的特征因子组合为所有特征因子组合中的某一组标准化后的特征因子组合;
通过比较正常能耗训练集和高能耗训练集各数据分箱内的KL散度分布,按照以下筛选条件,实现问题特征因子的定位:单个数据分箱中,如果某个标准化后的特征因子组合的KL散度大于5,则判断第k个分箱内对应的特征因子组合可能存在异常;从该特征因子组合的所有数据分箱来看,被判断为异常的数据分箱数量占所有数据分箱的比例大于或等于30%时,判定为该特征因子组合是可疑的异常归因组合;若某一特征因子的所有组合中,有大于或等于30%被判定为可疑的异常归因组合,则认定该特征因子是造成高能耗的原因即问题特征因子;通过以上筛选,实现对问题特征因子的定位。
5.根据权利要求1所述的一种柴油车能耗异常归因方法,其特征是所述归因定义,具体包括:
2-2-1)从问题特征因子对应的车辆历史工况数据中的变量确定相应的归因;特征因子与车辆历史工况数据中的变量对应关系包括:分钟级发动机冷却液温度平均值与冷却液温度对应;分钟级环境温度平均值与环境温度对应;分钟级进气量平均值与进气量对应;分钟级大气压力平均值与大气压力对应;分钟级油门踏板开度平均值、分钟级急踩油门踏板最大值与油门踏板开度对应;分钟级蓄电池电压平均值与蓄电池电压对应;分钟级机油压力平均值与机油压力对应;分钟级DPF碳载量平均值与DPF碳载量对应;分钟级发动机转速标准差均与发动机转速对应;
2-2-2)梳理对应特征因子的归因列表:分钟级发动机冷却液温度平均值出现异常对应冷车行驶、分钟级环境温度平均值出现异常对应环境温度低、分钟级进气量平均值异常对应进气量异常、分钟级大气压力平均值异常对应大气压力低、分钟级油门踏板开度平均值异常对应深踩油门、分钟级急踩油门踏板最大值异常对应急踩油门、分钟级蓄电池电压平均值异常对应蓄电池电压低、分钟级机油压力平均值异常对应机油压力异常、分钟级DPF碳载量平均值异常对应DPF碳载量高、分钟级发动机转速标准差异常对应发动机转速波动大共10类归因,作为后续模型应用的归因参考;同时记录每个归因相关联的特征因子。
6.根据权利要求1所述的一种柴油车能耗异常归因方法,其特征是所述计算得到标准能耗MAP,具体包括:使用正常能耗训练集构建标准能耗MAP;按照分钟级车速平均值与分钟级发动机功率平均值两个维度对数据进行数据分箱,对每个数据分箱中的的分钟级发动机燃料流量平均值再取一次平均值,形成标准能耗MAP;标准能耗MAP中记录了每一个分钟级车速平均值与分钟级发动机功率平均值组合下,对应的一个标准能耗值。
7.根据权利要求1所述的一种柴油车能耗异常归因方法,其特征是所述归因特征因子分布计算,具体为根据定义的归因,找到每个数据分箱中与相应归因对应的标准化后的特征因子,对每一个归因所对应的标准化后的特征因子在数据分箱内再取一次均值与标准差,得到对应标准能耗MAP每个数据分箱内的归因对应的标准化后的特征因子的均值与标准差。
8.根据权利要求1所述的一种柴油车能耗异常归因方法,其特征是所述能耗异常数据检出是使用标准能耗MAP,对在线车辆最近24小时的分钟级数据进行能耗对比的参照,并根据与标准能耗的差异,判断某辆车当天是否存在能耗异常,具体包括:
4-1-1)抽取待分析的车联网在线数据:从车联网数据平台中,每日抽取最近24小时内对应车型的全部车联网在线数据,按照步骤1-2),根据车联网在线数据判断车辆的分钟级运行状态,并根据车联网在线数据计算相应的特征因子,得到分钟级待分析的分析数据集;同时需要对其中与归因相关的特征因子进行标准化;
4-1-2)判断车辆能耗是否异常;针对每一辆车,按照分钟级车速平均值与分钟级发动机功率平均值对车联网在线数据进行数据分箱,比较每分钟该车的分钟级发动机燃料流量平均值与对应标准能耗MAP中相应的数据分箱的发动机燃料流量平均值,当车辆的分钟级燃料流量平均值高于标准能耗MAP中相应数据分箱的发动机燃料流量平均值的占比超过当天该车所有分钟级燃料流量平均值数据量的65%时,认为该车在最近24小时的数据中存在能耗异常问题。
9.根据权利要求8所述的一种柴油车能耗异常归因方法,其特征是所述异常归因定位,具体包括:
4-2-1)对判定为能耗异常的车辆,按照归因列表中每一条归因所对应的标准化后的特征因子,计算对应标准化后的特征因子组合的联合概率密度估计结果;
4-2-2)根据车联网在线数据得到该车辆分钟级车速平均值与分钟级发动机功率平均值分布,从正常能耗训练集中随机抽取与车联网在线数据中分钟级车速平均值与分钟级发动机功率平均值相等的分钟级数据,包含全部标准化后的特征因子;对抽样的数据同样按照归因列表中每一条归因所对应的特征因子,计算该标准化后的特征因子与其它标准化后的特征因子的联合概率密度函数估计结果;
4-2-3)针对每个归因对应的特征因子,计算与该归因所对应标准化后的特征因子所关联的标准化后的特征因子的联合概率密度函数估计结果,判断该特征因子是否满足问题特征因子的判定条件;若满足,则认为该车辆存在对应特征因子的归因问题,实现对车辆能耗异常归因的判断。
10.根据权利要求9所述的一种柴油车能耗异常归因方法,其特征是所述能耗异常归因应用阶段还包括可节约能耗计算,所述可节约能耗计算包括:
4-3-1)统计该车辆计算的所有分钟级发动机燃料流量平均值中高于标准能耗MAP中对应数据分箱的发动机燃料流量平均值的所有分钟级发动机燃料流量平均值,计算该车辆分钟级发动机燃料流量平均值与标准能耗MAP中对应数据分箱的发动机燃料流量平均值的差值,并与发动机运行时长乘积,进行求和得到之前24小时内的可节约能耗,记为
4-3-2)使用标准能耗MAP中每个数据分箱内已归因的标准化后的特征因子对应的均值与标准差,按照以下公式(5)计算该车辆某一个已确认归因的分布偏离度:
公式(5);
公式(5)中m代表某个已确认归因对应的特征因子,为第m个特征因子对应归因的分布偏离度,k表示该车辆分钟级燃料流量平均值高于标准能耗MAP中对应数据分箱的发动机燃料流量平均值的第k个数据分箱,n为该车辆分钟级燃料流量平均值高于标准能耗MAP中对应数据分箱的发动机燃料流量平均值对应的分箱数量,1≤kn,/>代表对应第k个分箱中该特征因子标准分布的均值,/>代表对应第k个分箱中该标准化后的特征因子标准分布的标准差,/>代表对应第k个分箱中该标准化后的特征因子的均值;通过以上标准化方法,度量不同归因对应特征因子的偏离度,剔除量纲的影响;
4-3-3)采用归一化方法,根据不同归因的偏离度,按照公式(6)计算对应归因的可节约能耗:
公式(6);
公式(6)中为已归因的第m个特征因子可节约的能耗,/>为步骤4-3-1)中计算的之前24小时内的可节约能耗,/>为步骤4-3-2)中得到的第m个特征因子对应归因的分布偏离度,/>为所有存在能耗异常问题的特征因子分布偏离度求和。
CN202311710544.2A 2023-12-13 2023-12-13 一种柴油车能耗异常归因方法 Active CN117389791B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311710544.2A CN117389791B (zh) 2023-12-13 2023-12-13 一种柴油车能耗异常归因方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311710544.2A CN117389791B (zh) 2023-12-13 2023-12-13 一种柴油车能耗异常归因方法

Publications (2)

Publication Number Publication Date
CN117389791A true CN117389791A (zh) 2024-01-12
CN117389791B CN117389791B (zh) 2024-02-23

Family

ID=89441456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311710544.2A Active CN117389791B (zh) 2023-12-13 2023-12-13 一种柴油车能耗异常归因方法

Country Status (1)

Country Link
CN (1) CN117389791B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10570819B1 (en) * 2017-01-30 2020-02-25 Daryl Bear Energy test method for determining fuel consumption of a vehicle
US20200108732A1 (en) * 2018-10-09 2020-04-09 Regents Of The University Of Minnesota Physical model-guided machine learning framework for energy management of vehicles
CN112633781A (zh) * 2021-03-08 2021-04-09 江苏海平面数据科技有限公司 一种基于车联网大数据的车辆能耗评价方法
CN115237686A (zh) * 2021-04-23 2022-10-25 Aptiv技术有限公司 检测车载嵌入式计算机的功能异常的方法及装置
CN115330071A (zh) * 2022-08-23 2022-11-11 江苏海平面数据科技有限公司 一种基于车联网大数据的doc异常检测方法
CN115758227A (zh) * 2021-09-03 2023-03-07 宇通客车股份有限公司 一种高能耗车辆识别和原因诊断方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10570819B1 (en) * 2017-01-30 2020-02-25 Daryl Bear Energy test method for determining fuel consumption of a vehicle
US20200108732A1 (en) * 2018-10-09 2020-04-09 Regents Of The University Of Minnesota Physical model-guided machine learning framework for energy management of vehicles
CN112633781A (zh) * 2021-03-08 2021-04-09 江苏海平面数据科技有限公司 一种基于车联网大数据的车辆能耗评价方法
CN115237686A (zh) * 2021-04-23 2022-10-25 Aptiv技术有限公司 检测车载嵌入式计算机的功能异常的方法及装置
CN115758227A (zh) * 2021-09-03 2023-03-07 宇通客车股份有限公司 一种高能耗车辆识别和原因诊断方法
CN115330071A (zh) * 2022-08-23 2022-11-11 江苏海平面数据科技有限公司 一种基于车联网大数据的doc异常检测方法

Also Published As

Publication number Publication date
CN117389791B (zh) 2024-02-23

Similar Documents

Publication Publication Date Title
CN111581893B (zh) 一种电驱动总成机械系统可靠性试验载荷谱的编制方法
CN111859294A (zh) 一种基于大数据的电动汽车评估方法及系统
CN114169424A (zh) 基于k近邻回归算法和用电数据的排污量预测方法
CN114662954A (zh) 车辆性能评估系统
CN112486962A (zh) 一种提取组合短片段计算重型柴油车NOx排放的方法
CN116558834A (zh) Pems排放分析方法、装置、计算机设备和存储介质
CN117389791B (zh) 一种柴油车能耗异常归因方法
CN111348029A (zh) 一种考虑工况的混合动力汽车标定参数最优值确定方法
CN114646888A (zh) 一种动力电池容量衰减的评估方法及系统
CN115758227A (zh) 一种高能耗车辆识别和原因诊断方法
CN117171921A (zh) 柴油颗粒物尾气净化装置健康状态评估处理方法和装置
CN114419894B (zh) 一种路内停车泊位设置与使用监测的方法与系统
CN114060132B (zh) 一种基于排放远程监控的NOx传感器作弊甄别方法
Beşkardeş et al. Data-driven-based fuzzy control system design for a hybrid electric vehicle
Pang et al. Safety Evaluation of Commercial Vehicle Driving Behavior Using the AHP—CRITIC Algorithm
CN112685461A (zh) 一种基于预判模型的窃电用户判断方法
Li et al. Emission Evaluation for Diesel Vehicles Under Typical Operating Conditions
Wang et al. MixPCD: a novel method of constructing driving cycle for electric bus with sparse data
CN109086494A (zh) 一种基于工况的多模型融合列车轴温估计方法
CN117093829B (zh) 一种基于车载诊断数据的劣质油品加油点识别方法和系统
CN115292386B (zh) 一种关于车辆滑行状态的节省油耗计算方法及装置
CN114925766A (zh) 一种基于车联网大数据的柴油发动机机油更换识别方法
CN117727111A (zh) 一种车辆行驶工况合理性评价方法
CN114965898A (zh) 重型车氮氧化物和二氧化碳排放的远程在线监测方法
CN117147166A (zh) 一种发动机标定方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant