CN113344352A - 一种基于机器学习算法的蓄电池馈电风险识别方法 - Google Patents

一种基于机器学习算法的蓄电池馈电风险识别方法 Download PDF

Info

Publication number
CN113344352A
CN113344352A CN202110590179.0A CN202110590179A CN113344352A CN 113344352 A CN113344352 A CN 113344352A CN 202110590179 A CN202110590179 A CN 202110590179A CN 113344352 A CN113344352 A CN 113344352A
Authority
CN
China
Prior art keywords
data
storage battery
risk
model
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110590179.0A
Other languages
English (en)
Inventor
石林
冯绪杨
邵国君
黄中原
吴锐
谢乐成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Changan Automobile Co Ltd
Original Assignee
Chongqing Changan Automobile Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Changan Automobile Co Ltd filed Critical Chongqing Changan Automobile Co Ltd
Priority to CN202110590179.0A priority Critical patent/CN113344352A/zh
Publication of CN113344352A publication Critical patent/CN113344352A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明提出一种基于机器学习算法的蓄电池馈电风险识别方法,在不增加硬件的情况下,利用云端采集上传的蓄电池相关网络信号数据,进行数据探索挖掘,特征变量构造,然后通过机器学习算法进行训练,得出较完善的馈电风险预测模型,利用训练好的模型,当云端监测到有实时蓄电池相关数据上传时,即可输出蓄电池馈电风险预测结果,及时对车主进行馈电风险预警提醒。后续随着蓄电池故障样本数据不断累积,特征变量以及算法参数能够不断优化,预测模型的准确性也逐步提高。

Description

一种基于机器学习算法的蓄电池馈电风险识别方法
技术领域
本发明属于汽车安全技术领域,更具体涉及蓄电池健康状态识别预测技术。
背景技术
汽车是人们常用的交通工具,在长期使用过程中会产生故障。由于汽车本身结构的复杂性,以及汽车故障的不确定性和模糊性,给汽车故障诊断与维修带来很大困难。蓄电池是电源系的心脏,对蓄电池的耗电状态进行监测并对故障状态进行分析,给出蓄电池故障现象及馈电风险预测,对于车用蓄电池的寿命预估,提供车主合理化用电建议,以及蓄电池维修更换提醒来说有着重要的意义。
目前来说,对于燃油车蓄电池馈电风险或电池健康状态监测预警等领域成果较为匮乏,但由于蓄电池馈电导致车辆无法出行的问题在日常用车过程中尤为重要,因此行业内也在积极探索。
传统电池健康状态的研究主要基于蓄电池物理参数通过测算蓄电池内阻相对于健康度为100%时内阻的变化率,计算出蓄电池的健康度,由于蓄电池的老化体现在蓄电池内阻的变化上,例如CN201910119993.7提出了一种基于内阻变化率的蓄电池健康度的高精度在线实时方法,该方法主要存在以下弊端:通过物理参数构建评估模型固然准确,但对于各参数的测定和设置有着很高的要求,而且参数配置较为复杂。由于汽车本身结构较为复杂,蓄电池物理参数难以测定,因此很难满足高精确度的要求。同时,物理参数的采集需增加额外硬件成本,不利于效益最大化。
另一种方法,通过数据驱动法不需要复杂的物理参数测定和计算,只需提取能够与电池健康状态相关的外部参数便可以实时有效的对电池健康状态进行评估,因此受到了越来越广泛的探索应用。例如CN202010005272.6 一种确定车辆电池健康状态的方法及装置,其实基于电池状态信息及里程采用加权方式判定电池健康状态,该方法主要存在以下弊端:仍需要采集诸多电池状态信息,同时判断可靠性依赖于运行时期,如前期电池状态信息少、里程数少,则会影响识别准确率,同时需配置权重,需要业务专家提供更多的专业知识,探索深度有限。
因此,如果能在云端,通过现有的车辆上传数据,同时依靠本身连网车辆数较大的大数据优势,实现对蓄电池馈电风险的预测,这样既不增加硬件成本,无需额外的物理参数测定和计算,又能实时的给车主发出馈电风险预警,在减少了用户因馈电导致无法出行产生抱怨的同时,在一定程度上也对蓄电池寿命预测及维修建议方面提供了指导。
随机孤立森林即孤立森林,是一种机器学习算法,主要针对的是连续性结构化数据中的异常点检测,其算法基础有两点:异常数据占总样本量的比例很小、异常点的特征值与正常点的差异很大。因其精准度较高,在处理大数据时速度快,所以目前在工业界的应用范围比较广,常见场景包括:网络安全中的攻击检测、金融交易欺诈检测、噪声数据过滤等。
发明内容
本发明针对现有技术存在的问题,提出一种基于机器学习算法的蓄电池馈电风险识别方法,在不增加硬件的情况下,利用云端采集的蓄电池数据,基于孤立森林算法建立和优化模型,预测蓄电池馈电风险,并可以进一步根据预测结果,主动向车主发出实时蓄电池馈电风险预警信息。
本发明的技术方案如下:
一种蓄电池馈电风险识别方法,包括以下步骤:
(1)获取蓄电池异常耗电的样本数据,构造特征变量,得出特征数据训练集;
(2)基于孤立森林构建异常识别算法模型;
(3)对算法模型进行调优,进行蓄电池风险实时预测,并给出预警结果信息。
所述步骤(1)中,获取蓄电池异常耗电的样本数据包括:
(1.1)数据采集:采集云端足够多辆车,T-1日的车辆蓄电池相关网络数据,数据包括异常事件、开始时刻、结束时刻、单次故障时间等。
(1.2)数据清洗:对数据进行清洗,去除因格式或采集错误产生的错误数据,建立异常数据表。
所述步骤(1)中构造特征变量,得出特征数据训练集包括:
(1.3) 构造特征变量:基于异常数据表,计算单车单天累计故障次数,以及单车单天累计异常时间。
(1.4)特征数据训练集构造:将特征变量数据进行随机抽样,得到目标特征数据集训练集。
所述步骤(2)中,基于孤立森林构建异常识别算法模型的过程包括:
(2.1)模型构建:对每个抽样的数据集建立一棵树模型,即用抽样的数据集传入bulid_tree方法(即建立一个node节点类用来保存树中的每个节点,对经过节点的样本取值进行随机分割,将每个节点类使用递归的方式连接起来)构建一棵树模型,重复上述过程建立n棵树结构,并输出平均路径长度集。
(2.2)聚类分析:根据不同蓄电池异常特征输出的平均路径长,通过聚类模型,筛选识别出蓄电池正常耗电车辆、蓄电池馈电低风险车辆以及蓄电池馈电高风险车辆。
进一步还有包括,(2.3)数据验证:根据筛选出的预测馈电风险车辆,进行电话回访,验证车主最近实际馈电无法启动的情况;同时针对售后反馈的历史已馈电车辆,通过对已馈电车辆发生馈电时刻之前历史数据进行预测,比对预测结果及实际馈电情况,进行准确率验证。
所述步骤(3)中,对算法模型进行调优是通过积累样本数据,使模型不断学习从而参数调优。
所述步骤(3)中,当监控到有新的蓄电池相关网络数据上传时,使用该模型进行预测,得到蓄电池馈电风险预测结果,如果馈电风险发生,则向车主推送车辆馈电预警信息,提前告知车主馈电风险。
本发明的优点如下:
本发明在不增加硬件的情况下,利用云端采集上传的蓄电池相关网络信号数据,进行数据探索挖掘,特征变量构造,然后通过机器学习算法进行训练,得出较完善的馈电风险预测模型,利用训练好的模型,当云端监测到有实时蓄电池相关数据上传时,即可输出蓄电池馈电风险预测结果,及时对车主进行馈电风险预警提醒。后续随着蓄电池故障样本数据不断累积,特征变量以及算法参数能够不断优化,预测模型的准确性也逐步提高。
附图说明
图1 特征变量构造过程图;
图2 模型构建流程图;
图3 馈电风险预测流程图。
具体实施方式
以下结合附图,对本发明进行进一步描述:
本发明所述的一种蓄电池馈电风险识别方法,是基于云端采集的蓄电池故障时刻,故障类型,故障次数,故障时长等数据,采用随机孤立森林方法构建并优化预测模型,预测蓄电池馈电风险,并根据预测结果,主动向车主发出实时蓄电池馈电风险预警信息。
具体实施步骤如下:
1、首先挖掘出蓄电池异常耗电的样本数据,构造特征变量,得出特征数据训练集,参见图1,具体包括以下步骤:
(1.1)数据采集:采集云端1000辆车,T-1日的车辆蓄电池相关网络数据,这些数据包括但不限于异常事件、开始时刻、结束时刻、单次故障时间、车辆ID、时间戳等,其中车辆ID作为区分不同车辆的标志符。
(1.2)数据清洗:根据数据的有效性规则,对读取的数据进行数据清洗,从而去除因格式、采集错误或网络错误等产生的无效数据,减少无效分散数据对模型结果的影响,构建出异常数据表。
(1.3)特征变量构造:基于异常数据表,计算单车单天累计异常耗电次数,以及单车单天累计异常耗电时间,其中单天累计异常耗电次数为异常事件行数累计值,单天累计异常耗电时间为Sum(n次异常结束时刻-n次异常开始时刻)。
(1.4)特征数据初步分析:根据对单车单天累计异常耗电次数、以及单车单天累计异常耗电时长进行正态分布分析,理论上异常次数越多,异常耗电时长越长越容易出现馈电风险。单车单天累计异常耗电次数、以及单车单天累计异常耗电时长为后续构建特征数据集的数据基础。此处的正态分布仅供单一数据维度初步统计分析,仅作为数据处理阶段数据有效性的验证手段之一,可以与后续建模结果相互佐证。
2、然后通过构造特征数据训练集,进行异常识别模型构建,参见图2,具体包括以下步骤:
(2.1)特征数据训练集构造:首先将特征变量做归一化处理,为保证算法模型差异性,将特征变量数据进行随机抽样,得到目标特征数据集训练集,从而增强数据识别结果的准确性。
(2.2)模型构建:对每个抽样的数据集建立一个树模型,即用采样的数据集传入bulid_tree方法构建一棵树模型,在树模型中每个结点node对数据的取值进行随机划分,重复上述过程建立n棵树结构。
假设m表示特征数据的样本总量,则树的平均路径长度为c(m)=2ln(m-1)+ξ-2(m-1/m),ξ为欧拉常数,即c(m)为给定样本数m时,路径长度的平均值,用来标准化样本x的路径长度h(x),样本点x的路径长度h(x)为从树的根节点到叶子节点所经过的边的数量。
上述异常概率即树模型中各个样本点距离根节点的距离h(x),因为在树模型中各个结点是随机分割的,密度越低的样本被分割的次数就会越少,对应的距离根节点的距离就越近,它是异常点的概率就越大。
(2.3)聚类分析:根据不同蓄电池异常特征输出的平均路径长,通过聚类模型进行分析,寻找出各状态类别中心,并输出对应聚类结果,即筛选识别出蓄电池正常耗电车辆、蓄电池馈电低风险车辆、以及蓄电池馈电高风险车辆。
(2.4)数据验证:根据筛选出的预测馈电风险车辆,针对这些车辆车主进行电话回访,验证车主最近实际馈电无法启动的情况;同时针对售后反馈的历史已馈电车辆,通过已馈电车辆发生馈电时刻之前历史数据进行预测,比对预测结果及实际馈电情况,进行准确率验证。此验证过程可通过简单的数据分析完成。
3、最终通过参数调优得到最优模型参数,进行模型部署上线,预测,参见图3,具体预测流程步骤如下:
(3.1)模型调优:通过积累样本数据,模型不断学习从而参数调优,得到较完善、满意度较高的模型。
(3.2)实时预测:系统实时监测新上传到云端的蓄电池相关网络数据,对数据进行预处理,把处理好的特征数据,传入模型中,得到预测结果,若连续N次,该车均出现蓄电池馈电风险,则推送预警信息给车主和HU。
即是,当监控到有新的蓄电池相关网络数据上传时,使用该模型进行预测,得到蓄电池馈电风险预测结果,如果馈电风险发生,则向车主推送车辆馈电预警信息,提前告知车主馈电风险,车主可进一步采取远程启动等方式,防止馈电发生,为出行造成困扰。

Claims (7)

1.一种基于机器学习算法的蓄电池馈电风险识别方法,包括以下步骤:
(1)获取蓄电池异常耗电的样本数据,构造特征变量,得出特征数据训练集;
(2)基于孤立森林构建异常识别算法模型;
(3)对算法模型进行调优,进行蓄电池风险实时预测,并给出预警结果信息。
2.根据权利要求1所述的蓄电池馈电风险识别方法,其特征在于,所述步骤(1)获取蓄电池异常耗电的样本数据包括:
(1.1)数据采集:采集云端足够多辆车,T-1日的车辆蓄电池相关网络数据,数据包括异常事件、开始时刻、结束时刻、单次故障时间;
(1.2)数据清洗:对数据进行清洗,去除因格式或采集错误产生的错误数据,建立异常数据表。
3.根据权利要求1所述的蓄电池馈电风险识别方法,其特征在于,所述步骤(1)构造特征变量,得出特征数据训练集包括:
(1.3) 构造特征变量:基于异常数据表,计算单车单天累计故障次数,以及单车单天累计异常时间;
(1.4)特征数据训练集构造:将特征变量数据进行随机抽样,得到目标特征数据训练集。
4.根据权利要求1所述的蓄电池馈电风险识别方法,其特征在于,所述步骤(2)所述基于孤立森林构建异常识别算法模型的过程包括:
(2.1)模型构建:对每个目标特征数据训练集建立一棵树模型,即用目标特征数据训练集传入bulid_tree方法从而构建一棵树模型,重复上述过程建立n棵树结构,并输出平均路径长度集;
(2.2)聚类分析:根据不同蓄电池异常特征输出的平均路径长,通过聚类模型,识别出蓄电池正常耗电车辆、蓄电池馈电低风险车辆以及蓄电池馈电高风险车辆。
5.根据权利要求1所述的蓄电池馈电风险识别方法,其特征在于,所述步骤(2)还包括:
(2.3)数据验证:针对以上算法识别出的馈电风险车辆,进行电话回访,验证车主最近实际馈电无法启动的情况;同时针对售后反馈的历史已馈电车辆,基于已馈电车辆发生馈电时刻之前的历史数据,利用以上算法进行识别,比对算法识别结果及实际馈电情况,进行准确率验证。
6.根据权利要求1所述的蓄电池馈电风险识别方法,其特征在于,所述步骤(3)对算法模型进行调优是通过积累样本数据,使模型不断学习从而参数调优。
7.根据权利要求1所述的蓄电池馈电风险识别方法,其特征在于,所述步骤(2)中,当监控到有新的蓄电池相关网络数据上传时,使用该模型进行预测,得到蓄电池馈电风险预测结果,如果馈电风险发生,则向车主推送车辆馈电预警信息,提前告知车主馈电风险。
CN202110590179.0A 2021-05-28 2021-05-28 一种基于机器学习算法的蓄电池馈电风险识别方法 Pending CN113344352A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110590179.0A CN113344352A (zh) 2021-05-28 2021-05-28 一种基于机器学习算法的蓄电池馈电风险识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110590179.0A CN113344352A (zh) 2021-05-28 2021-05-28 一种基于机器学习算法的蓄电池馈电风险识别方法

Publications (1)

Publication Number Publication Date
CN113344352A true CN113344352A (zh) 2021-09-03

Family

ID=77472534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110590179.0A Pending CN113344352A (zh) 2021-05-28 2021-05-28 一种基于机器学习算法的蓄电池馈电风险识别方法

Country Status (1)

Country Link
CN (1) CN113344352A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241154A (zh) * 2020-01-02 2020-06-05 浙江吉利新能源商用车集团有限公司 一种基于大数据的蓄电池故障预警方法及系统
CN111381166A (zh) * 2018-12-29 2020-07-07 北京骑胜科技有限公司 一种监测电池状态的方法及系统
CN112505549A (zh) * 2020-11-26 2021-03-16 西安电子科技大学 基于孤立森林算法的新能源汽车电池异常检测方法
CN112630660A (zh) * 2020-12-14 2021-04-09 湖北工业大学 一种基于支持向量机的电池故障识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111381166A (zh) * 2018-12-29 2020-07-07 北京骑胜科技有限公司 一种监测电池状态的方法及系统
CN111241154A (zh) * 2020-01-02 2020-06-05 浙江吉利新能源商用车集团有限公司 一种基于大数据的蓄电池故障预警方法及系统
CN112505549A (zh) * 2020-11-26 2021-03-16 西安电子科技大学 基于孤立森林算法的新能源汽车电池异常检测方法
CN112630660A (zh) * 2020-12-14 2021-04-09 湖北工业大学 一种基于支持向量机的电池故障识别方法

Similar Documents

Publication Publication Date Title
CN110414155B (zh) 一种带有单测点的风机部件温度异常检测和报警方法
CN110263846B (zh) 基于故障数据深度挖掘及学习的故障诊断方法
CN108556682B (zh) 一种续驶里程预测方法、装置及设备
CN110414154B (zh) 一种带有双测点的风机部件温度异常检测和报警方法
CN112987675A (zh) 一种异常检测的方法、装置、计算机设备和介质
CN110059845B (zh) 基于时序演化基因模型的计量装置时钟误差趋势预测方法
CN111242484A (zh) 基于转移概率的车辆风险综合评价方法
CN115170000A (zh) 一种基于电能表通信模块的远程监测方法及系统
CN113562562A (zh) 一种电梯安全预警监测系统及其判断方法
CN109491339B (zh) 一种基于大数据的变电站设备运行状态预警系统
CN112232405A (zh) 齿轮箱的故障预测、监测和诊断方法及相应装置
CN116308305B (zh) 一种桥梁健康监测数据管理系统
CN114596700A (zh) 一种基于门架数据的高速公路路段实时流量估计方法
CN108306997B (zh) 域名解析监控方法及装置
CN117235655B (zh) 基于联邦学习的智慧供热异常工况识别方法及系统
CN112131796B (zh) 一种基于基因表达式编程的硬岩tbm滚刀磨损实时评估方法
CN113344352A (zh) 一种基于机器学习算法的蓄电池馈电风险识别方法
CN102509020A (zh) 基于传感器网络的复杂环境下多目标信息融合方法
CN108241183A (zh) 集中管理测风数据方法以及测风塔集中管理装置
Fu et al. Trimming outliers using trees: winning solution of the large-scale energy anomaly detection (LEAD) competition
CN113569491B (zh) 一种轮对尺寸检测数据的分析和校正方法及装置
CN115270637A (zh) 一种基于gbrt的地下排水管道最大应力预测方法
CN115858606A (zh) 时序数据的异常检测方法、装置、设备及存储介质
CN101923605A (zh) 铁路防灾风预警方法
CN117593101B (zh) 基于多维数据的金融风险数据处理分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210903