CN114386537A - 基于CatBoost的锂电池故障诊断方法、装置及电子设备 - Google Patents

基于CatBoost的锂电池故障诊断方法、装置及电子设备 Download PDF

Info

Publication number
CN114386537A
CN114386537A CN202210290668.9A CN202210290668A CN114386537A CN 114386537 A CN114386537 A CN 114386537A CN 202210290668 A CN202210290668 A CN 202210290668A CN 114386537 A CN114386537 A CN 114386537A
Authority
CN
China
Prior art keywords
data
fault
sample
fault diagnosis
lithium battery
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210290668.9A
Other languages
English (en)
Other versions
CN114386537B (zh
Inventor
王宁
刘明义
曹曦
韦宇
雷浩东
宋吉硕
裴杰
曹传钊
孙周婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaneng Clean Energy Research Institute
Original Assignee
Huaneng Clean Energy Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaneng Clean Energy Research Institute filed Critical Huaneng Clean Energy Research Institute
Priority to CN202210290668.9A priority Critical patent/CN114386537B/zh
Publication of CN114386537A publication Critical patent/CN114386537A/zh
Application granted granted Critical
Publication of CN114386537B publication Critical patent/CN114386537B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E60/00Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
    • Y02E60/10Energy storage using batteries

Abstract

本公开提供了一种基于CatBoost的锂电池故障诊断方法、装置及电子设备,涉及故障诊断领域。具体步骤为:检测并获取锂电池历史的动态数据、静态数据和故障类别数据,并进行数据清洗;根据各故障类别的样本数量进行样本扩增;提取所述样本中所述动态数据和静态数据的特征,获取第一特征数据;对所述第一特征数据进行主成分分析,并进行标准化处理,获取第二特征数据;根据所述第二特征数据训练故障诊断模型。本公开通过获取锂电池的动态数据和静态数据并对样本较少的故障类别进行样本扩增,实现了对故障类别的检测,提高了模型的检测能力。

Description

基于CatBoost的锂电池故障诊断方法、装置及电子设备
技术领域
本公开涉及故障诊断,尤其涉及一种基于CatBoost的锂电池故障诊断方法、装置及电子设备。
背景技术
能源是当今世界赖以生存的重要物质基础之一,也是目前经济发展的基本驱动力。锂离子电池由于工作电压高、比能量大、循环寿命长、自放电率低、无记忆效应等优点在储能系统等领域广泛应用,其电池故障诊断已成为电池安全管理、储能电站运维等多个领域的热点问题。但是,锂电池作为典型化学储能单元,是一个极其复杂难控的强非线性系统。在锂电池运行过程中,老化及故障诱因复杂且随机,最终导致锂电池安全事故频频发生。与此同时,大数据及机器学习技术的发展突破了复杂非线性系统难以建模的束缚,使得基于数据驱动的电池故障诊断成为可能。
传统的数据驱动方式需要大量的历史故障信息去拟合数据模型、故障种类单一、故障正常比严重不平衡,导致模型拟合效果较差,不具有预防性。
发明内容
本公开提供一种基于CatBoost的锂电池故障诊断方法、装置及电子设备,以至少解决相关技术中数据量较少的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种基于CatBoost的锂电池故障诊断方法,包括:
检测并获取锂电池历史的动态数据、静态数据和故障类别数据,并进行数据清洗;
根据各故障类别的样本数量进行样本扩增;
提取所述样本中所述动态数据和静态数据的特征,获取第一特征数据;
对所述第一特征数据进行主成分分析,并进行标准化处理,获取第二特征数据;
根据所述第二特征数据训练故障诊断模型。
可选的,所述动态数据包括以下至少一项指标:
电压、电流、静止极化电压差、直流内阻值、充放电温度、充放电温差、开路电压、自放电率、充放电状态、健康性能状态。
可选的,所述静态数据包括:电池静态参数和运行环境数据;
其中,所述电池静态参数包括以下至少一项指标:基础信息、生产时间、生产批次、电池包型号信息、额定功率、额定容量;
所述运行环境数据包括以下至少一项指标:经纬度、天气数据、外界温度、晴雨天占比数据。
可选的,所述故障类别包括:失效类别和故障源,其中,所述失效类别包括性能失效或安全失效;
其中,所述性能失效包括以下至少一项:内阻增大、一致性差、电压异常、电流异常;
所述安全失效包括以下至少一项:热失控、微短路、断路、析锂、变形、漏液、胀气。
可选的,所述根据各故障类别的样本数量进行样本扩增,包括:
将所述样本数量少于预设的数量阈值的故障类别确定为待扩增故障类别;
在特征空间中计算所述待扩增故障类别中的第一样本与其他样本的距离,根据所述距离的排名获取第一近邻样本;
根据样本不平衡比例确定采样倍率,并根据所述采样倍率从所述第一近邻样本中获取第二近邻样本;
根据所述第二近邻样本和所述第一样本构建扩增样本,所述扩增样本的获取方法为:x new =x+rand (a,b) ∗(x'−x),其中,x new 为所述扩增样本,x为所述第一样本,x'为所述第二近邻样本,rand()为随机数生成函数,(a,b)为随机数的范围。
可选的,所述提取所述样本中所述动态数据和静态数据的特征,包括以下至少一项:
数据编码;
数据变换;
数据离散化;
数据分类统计;
数据特征组合。
可选的,所述标准化处理,包括:
计算所述第一特征数据中各类所有样本中各个指标的算术平均值和标准差;
根据所述算术平均值和所述标准差对所述第一特征数据进行标准化处理,获取所述第二特征数据,具体公式为:
Figure 533488DEST_PATH_IMAGE001
,其中,
Figure 466809DEST_PATH_IMAGE002
为所述第二特征数据中样本里指标的值,
Figure DEST_PATH_IMAGE003
为第一特征数据中样本里指标的值,
Figure 666846DEST_PATH_IMAGE004
为所述算术平均值,s为所述标准差。
可选的,所述根据所述第二特征数据训练故障诊断模型,包括:
根据Catboost框架构建所述故障诊断模型;
将所述第二特征数据中的样本分为训练集和验证集;
根据遗传算法调整所述故障诊断模型中的参数;
将所述训练集中的第二特征数据输入所述故障诊断模型,并训练所述故障诊断模型使其收敛;
根据验证集中的样本验证所述故障诊断模型。
根据本公开实施例的第二方面,提供一种基于CatBoost的锂电池故障诊断方法,包括:
检测并获取锂电池的实时动态数据和静态数据;
对所述实时动态数据进行数据清洗,并提取其中的特征,获取第一特征数据;
对所述第一特征数据进行主成分分析,并进行标准化处理,获取第二特征数据;
将所述第二特征数据输入所述故障诊断模型,获取故障类别预测结果和对应的置信度。
可选的,还包括:
根据所述故障类别预测结果和对应的置信度获取可视化图表,其中,所述可视化图表包括以下至少一项:条形图、折线图、散点图、饼图、时序表图和透视表。
根据本公开实施例的第三方面,提供一种基于CatBoost的锂电池故障诊断装置,包括:
数据获取模块,用于检测并获取锂电池过往的动态数据、静态数据和故障类别数据,并进行数据清洗;
扩展模块,用于根据各故障类别的样本数量进行样本扩增;
第一特征提取模块,用于提取所述动态数据和静态数据的特征,获取第一特征数据;
第一数据处理模块,用于对所述第一特征数据进行主成分分析,并进行标准化处理,获取第二特征数据;
训练模块,用于根据所述第二特征数据训练故障诊断模型。
根据本公开实施例的第四方面,提供一种基于CatBoost的锂电池故障诊断装置,包括:
检测模块,用于检测并获取锂电池的实时动态数据和静态数据;
第二特征提取模块,用于对所述实时动态数据进行数据清洗,并提取其中的特征,获取第一特征数据;
第二数据处理模块,用于对所述第一特征数据进行主成分分析,并进行标准化处理,获取第二特征数据;
故障预测模块,用于将所述第二特征数据输入所述故障诊断模型,获取故障类别预测结果和对应的置信度。
本公开的实施例提供的技术方案至少带来以下有益效果:
本公开通过获取锂电池的动态数据和静态数据并对样本较少的故障类别进行样本扩增,实现了对故障类别的检测,提高了模型的检测能力。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断方法的流程图。
图2是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断方法的流程图。
图3是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断方法的流程图。
图4是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断方法的流程图。
图5是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断方法的流程图。
图6是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断装置的框图。
图7是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断装置的框图。
图8是数据样本扩增原理图。
图9是故障诊断模型损失函数变化图。
图10是所述故障诊断模型预测分布图。
图11是用来实施本公开的实施例的示例电子设备的示意性框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的本公开的一些方面相一致的装置和方法的例子。
能源是当今世界赖以生存的重要物质基础之一,也是目前经济发展的基本驱动力。锂离子电池由于工作电压高、比能量大、循环寿命长、自放电率低、无记忆效应等优点在储能系统等领域广泛应用,其电池故障诊断已成为电池安全管理、储能电站运维等多个领域的热点问题。但是,锂电池作为典型化学储能单元,是一个极其复杂难控的强非线性系统。在锂电池运行过程中,老化及故障诱因复杂且随机,最终导致锂电池安全事故频频发生。与此同时,大数据及机器学习技术的发展突破了复杂非线性系统难以建模的束缚,使得基于数据驱动的电池故障诊断成为可能。
传统的数据驱动方式需要大量的历史故障信息去拟合数据模型、故障种类单一、故障正常比严重不平衡,导致模型拟合效果较差,不具有预防性。为此,本发明提出一种基于CatBoost的锂电池故障诊断方法,该方法通过收集不同种类故障数据,采用SMOTE方法增加不同种类故障数据量,且采用集成学习算法CatBoost建模提高了故障诊断模型的准确性和泛化能力,并通过可视化方式诊断结果直观的进行展示、告警等。
图1是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断方法的流程图。如图1所示,所述方法包括以下步骤。
在步骤101中,检测并获取锂电池过往的动态数据、静态数据和故障类别数据,并进行数据清洗。
本申请实施例中,每个数据样本对应一个时间点或一个时间段内所述锂电池的多种参数。所述动态数据为所述锂电池使用过程中动态变化的数据,反映了锂电池在放电或充电过程中的状态,可选的,所述动态数据包括以下至少一项指标:
电压、电流、静止极化电压差、直流内阻值、充放电温度、充放电温差、开路电压、自放电率、充放电状态、健康性能状态。
所述静态数据为锂电池中的一些较为固定的性能参数和锂电池周围环境的参数,锂电池的运行环境有一定的要求,运行环境过于极端会引起锂电池的故障。例如,能够充分发挥锂离子电池性能的工作范围在0~40℃之间,如果在高于40℃的环境下使用和存储锂电池,均会导致其寿命的加速衰减,安全性也会下降;在低于0℃的低温充放电时不仅因为内阻的增加,导致锂电池的能量输出降低,低温充电更会使得负极锂支晶析出,严重影响锂电池的循环寿命,更有严重的安全隐患。
可选的,所述静态数据包括:电池静态参数和运行环境数据;
其中,所述电池静态参数包括以下至少一项指标:基础信息、生产时间、生产批次、电池包型号信息、额定功率、额定容量;
所述运行环境数据包括以下至少一项指标:经纬度、天气数据、外界温度、晴雨天占比数据。
所述故障类别同时包括所述锂电池发生的失效类别和故障源两种参数。在锂电池发生故障时,所述锂电池失效,失效的类别即所述失效类别。所述故障源为引起所述失效的源头。可选的,所述故障类别包括:失效类别和故障源,其中,所述失效类别包括性能失效或安全失效;
其中,所述性能失效包括以下至少一项:内阻增大、一致性差、电压异常、电流异常;
所述安全失效包括以下至少一项:热失控、微短路、断路、析锂、变形、漏液、胀气。
数据清洗的方式包括但不限于识别异常数据、删除重复数据、填充缺失数据。
在步骤102中,根据各故障类别的样本数量进行样本扩增。
本申请实施例中,为了解决相关技术中某些故障类别发生概率较低导致该故障类别中样本数量过少的问题,本申请根据故障类别中样本数量进行扩增,设置数量阈值,对样本数量少于所述数量阈值的故障类别进行样本扩增,提升样本数量,避免训练得到的故障诊断模型无法准确对故障类别,提升预设结果准确率。
在步骤103中,提取所述样本中所述动态数据和静态数据的特征,获取第一特征数据;
本申请实施例中,为了更好地训练所述故障诊断模型,需要对所述样本中的数据进行特征工程处理,将所述样本中的所述动态数据和所述静态数据转换成故障诊断模型更容易读取的数据类型。在一种可能的实施例中,通过onehot编码对所述动态数据和所述静态数据进行编码,将所述样本变为二进制向量,使所述动态数据和所述静态数据数字化,用数字表示出所述样本中的各种数据。将分类映射到整数值中,再将整数值映射到二进制向量中。
在一种可能的实施例中,所述样本中电池包型号信息包括型号A、型号B和型号C三种型号,经onehot编码,先令整数“0”对应型号A,“1”对应型号B,“2”对应型号C;再将整数映射到二进制向量中,最终“00”对应型号A,“01”对应型号B,“10”对应型号C。
在步骤104中,对所述第一特征数据进行主成分分析,并进行标准化处理,获取第二特征数据。
本申请实施例中,为了降低建模特征维度,对所述第一特征数据进行主成分分析。主成分分析(Principal Component Analysis,PCA),是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
同时,所述第一特征数据中各种数据的量纲不同会降低后续模型训练的效果,所以本申请采用数据标准化处理来降低数据量纲的影像。
在步骤105中,根据所述第二特征数据训练故障诊断模型。
本申请实施例中,采用基于CatBoost的故障诊断模型,CatBoost是CategoricalFeatures(类别型特征)+Gradient Boosting(梯度提升) ,也是基于梯度提升决策树的机器学习框架。
相关技术中的梯度提升算法利用决策树作为基本预测器。对于数值型特征使用决策树很方便,但是实际中,许多数据集包括类别型特征,这些特征对预测也很重要。类别型特征具有离散的值,比如省份名,城市名等。梯度提升算法中处理这类特征的最常用的方法就是在学习之前,也就是数据预处理阶段,将这些特征的值转换为数字。
而Catboost可以很好的处理类别型特征的梯度提升算法,该算法的改进之处就在于在学习的时候处理这些特征,而不是在数据预处理阶段,不需要任何显式的预处理来将类别转换为数字。
根据所述第二特征数据训练所述故障诊断模型,优化所述故障诊断模型中的参数,使所述故障诊断模型收敛,较为准确地根据所述第二特征数据检测出其对应的所述故障类别数据。
图2是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断方法的流程图。如图2所示,所述方法包括以下步骤。
在步骤201中,将所述样本数量少于预设的数量阈值的故障类别确定为待扩增故障类别。
由于随机过采样采取简单复制样本的策略来增加少数类样本,这样在训练模型的过程中容易产生模型过拟合的问题,即使得模型学习到的信息过于特别而不够泛化,本申请的基本思想是对少数类样本进行分析并根据少数类样本人工合成新样本添加到数据集中。设置数量阈值,获取样本类别少于所述数量阈值的故障类别,将其设置为待扩增类别。在一种可能的实施例中,所述数量阈值为100,样本数量少于100的故障类别被确定为待扩增故障类别。
在步骤202中,在特征空间中计算所述待扩增故障类别中的第一样本与其他样本的距离,根据所述距离的排名获取第一近邻样本。
本申请实施例中,对于一个待扩增故障类别,将其中的样本映射到特征空间中,计算样本到该待扩增故障类别中其他样本的欧式距离,并对所述欧式距离从小到大排序,将前k个样本作为所述样本的k近邻,也即所述第一近邻样本,其中,k为近邻数量,可以由实施者根据实际情况设置k的具体数值。
在步骤203中,根据样本不平衡比例确定采样倍率,并根据所述采样倍率从所述第一近邻样本中获取第二近邻样本。
根据样本不平衡率确定采样倍率N,则可以确定从所述第一近邻样本中选取的样本数量,即从所述第一近邻样本中选取N个样本,作为所述第二近邻样本。
在步骤204中,根据所述第二近邻样本和所述第一样本构建扩增样本,所述扩增样本的获取方法为:x new =x+rand (a,b) ∗(x'−x),其中,x new 为所述扩增样本,x为所述第一样本,x'为所述第二近邻样本,rand()为随机数生成函数,(a,b)为随机数的范围。
图8是数据样本扩增原理图。如图8所示,根据所述第二近邻样本x'和所述第一样本x在欧式空间中的位置新建样本,来扩展样本数据量。所述扩增样本x new 在所述第二近邻样本和所述第一样本之间的连线上,与所述第二近邻样本和所述第一样本较为接近。
可选的,所述提取所述样本中所述动态数据和静态数据的特征,包括以下至少一项:
数据编码;
数据变换;
数据离散化;
数据分类统计;
数据特征组合。
图3是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断方法的流程图。如图3所示,所述方法包括以下步骤。
在步骤301中,计算所述第一特征数据中各类所有样本中各个指标的算术平均值和标准差。
在步骤302中,根据所述算术平均值和所述标准差对所述第一特征数据进行标准化处理,获取所述第二特征数据,具体公式为:
Figure 320595DEST_PATH_IMAGE001
,其中,
Figure 809345DEST_PATH_IMAGE002
为所述第二特征数据中样本里指标的值,
Figure 343095DEST_PATH_IMAGE003
为第一特征数据中样本里指标的值,
Figure 600901DEST_PATH_IMAGE004
为所述算术平均值,s为所述标准差。
本申请实施例中,所述第一特征数据中包含大量指标,每个指标的性质、量纲、数量级、可用性等特征均可能存在差异,导致我们无法直接用其分析研究对象的特征和规律。当各指标间的水平相差很大时,如果直接用指标原始值进行分析,数值较高的指标在综合分析中的作用就会被放大,相对地,会削弱数值水平较低的指标的作用。
当遇到某个指标的最大值和最小值未知的情况,或有超出取值范围的离群数值时,采用标准差标准化法进行数据标准化处理,生成所述第二特征数据。
图4是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断方法的流程图。如图4所示,所述方法包括以下步骤。
在步骤401中,根据Catboost框架构建所述故障诊断模型。
本申请实施例中,CatBoost算法无需调参即可获得较高的模型质量,采用默认参数就可以获得非常好的结果,减少在调参上面花的时间。CatBoost算法支持类别型变量,无需对非数值型特征进行预处理,且快速、可扩展的GPU版本,可以用基于GPU的梯度提升算法实现来训练模型。
在步骤402中,将所述第二特征数据中的样本分为训练集和验证集。
在一种可能的实施例中,将所述第二特征数据中70%的样本作为所述训练集,30%的样本作为所述验证集。
在步骤403中,根据遗传算法调整所述故障诊断模型中的参数。
遗传算法可以智能地探索数千种可能的算法参数以找到最适合的值,从而使算法中最繁琐的部分自动化,让模型迭代速度更快,提高模型的运行效率。
在步骤404中,将所述训练集中的第二特征数据输入所述故障诊断模型,并训练所述故障诊断模型使其收敛。
图9是故障诊断模型损失函数变化图。如图9所示,横坐标为训练的样本数量,纵坐标为在训练过程中所述故障诊断模型的损失函数。由图可知,在训练过程中所述损失函数的值逐渐减小,模型趋于稳定。在训练超过175个样本之后所述故障诊断模型损失函数值基本稳定,故障诊断模型训练完成。
在步骤405中,根据验证集中的样本验证所述故障诊断模型。
图5是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断方法的流程图。如图5所示,所述方法包括以下步骤。
在步骤501中,检测并获取锂电池的实时动态数据和静态数据。
本申请实施例中,在训练好所述故障诊断模型后,即可应用所述故障诊断模型对实时获取的锂电池的动态数据和静态数据进行分析,预测锂电池是否发生故障,以及发生的故障类别。
在步骤502中,对所述实时动态数据进行数据清洗,并提取其中的特征,获取第一特征数据。
在步骤503中,对所述第一特征数据进行主成分分析,并进行标准化处理,获取第二特征数据。
在步骤504中,将所述第二特征数据输入所述故障诊断模型,获取故障类别预测结果和对应的置信度。
可选的,还包括:
根据所述故障类别预测结果和对应的置信度获取可视化图表,其中,所述可视化图表包括以下至少一项:条形图、折线图、散点图、饼图、时序表图和透视表。
图10是所述故障诊断模型预测分布图。如图10所示,根据所述故障诊断模型可以分析得到各个样本数据对应的故障类型和各个故障类型的发生概率,即结果输出值。所述结果输出值越大,说明所述故障发生的概率越大。
图6是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断装置框图。参照图6,该装置包括数据获取模块610,扩展模块620,第一特征提取模块630,第一数据处理模块640,训练模块650。
数据获取模块610,用于检测并获取锂电池过往的动态数据、静态数据和故障类别数据,并进行数据清洗;
扩展模块620,用于根据各故障类别的样本数量进行样本扩增;
第一特征提取模块630,用于提取所述动态数据和静态数据的特征,获取第一特征数据;
第一数据处理模块640,用于对所述第一特征数据进行主成分分析,并进行标准化处理,获取第二特征数据;
训练模块650,用于根据所述第二特征数据训练故障诊断模型。
图7是根据一示例性实施例示出的一种基于CatBoost的锂电池故障诊断装置框图。参照图7,该装置包括检测模块710,第二特征提取模块720,第二数据处理模块730,故障预测模块740。
检测模块710,用于检测并获取锂电池的实时动态数据和静态数据;
第二特征提取模块720,用于对所述实时动态数据进行数据清洗,并提取其中的特征,获取第一特征数据;
第二数据处理模块730,用于对所述第一特征数据进行主成分分析,并进行标准化处理,获取第二特征数据;
故障预测模块740,用于将所述第二特征数据输入所述故障诊断模型,获取故障类别预测结果和对应的置信度。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图11示出了可以用来实施本公开的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图11所示,设备1100包括计算单元1101,其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序,来执行各种适当的动作和处理。在RAM 1103中,还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
设备1100中的多个部件连接至I/O接口1105,包括:输入单元1106,例如键盘、鼠标等;输出单元1107,例如各种类型的显示器、扬声器等;存储单元1108,例如磁盘、光盘等;以及通信单元1109,例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理,例如所述基于CatBoost的锂电池故障诊断方法。例如,在一些实施例中,所述基于CatBoost的锂电池故障诊断方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1108。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到RAM 1103并由计算单元1101执行时,可以执行上文描述的所述基于CatBoost的锂电池故障诊断方法的一个或多个步骤。备选地,在其他实施例中,计算单元1101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行所述基于CatBoost的锂电池故障诊断方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称 "VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (12)

1.一种基于CatBoost的锂电池故障诊断方法,其特征在于,包括:
检测并获取锂电池历史的动态数据、静态数据和故障类别数据,并进行数据清洗;
根据各故障类别的样本数量进行样本扩增;
提取所述样本中所述动态数据和静态数据的特征,获取第一特征数据;
对所述第一特征数据进行主成分分析,并进行标准化处理,获取第二特征数据;
根据所述第二特征数据训练故障诊断模型。
2.根据权利要求1所述的方法,其特征在于,所述动态数据包括以下至少一项指标:
电压、电流、静止极化电压差、直流内阻值、充放电温度、充放电温差、开路电压、自放电率、充放电状态、健康性能状态。
3.根据权利要求1所述的方法,其特征在于,所述静态数据包括:电池静态参数和运行环境数据;
其中,所述电池静态参数包括以下至少一项指标:基础信息、生产时间、生产批次、电池包型号信息、额定功率、额定容量;
所述运行环境数据包括以下至少一项指标:经纬度、天气数据、外界温度、晴雨天占比数据。
4.根据权利要求1所述的方法,其特征在于,所述故障类别包括:失效类别和故障源,其中,所述失效类别包括性能失效或安全失效;
其中,所述性能失效包括以下至少一项:内阻增大、一致性差、电压异常、电流异常;
所述安全失效包括以下至少一项:热失控、微短路、断路、析锂、变形、漏液、胀气。
5.根据权利要求4所述的方法,其特征在于,所述根据各故障类别的样本数量进行样本扩增,包括:
将所述样本数量少于预设的数量阈值的故障类别确定为待扩增故障类别;
在特征空间中计算所述待扩增故障类别中的第一样本与其他样本的距离,根据所述距离的排名获取第一近邻样本;
根据样本不平衡比例确定采样倍率,并根据所述采样倍率从所述第一近邻样本中获取第二近邻样本;
根据所述第二近邻样本和所述第一样本构建扩增样本,所述扩增样本的获取方法为:x new =x+rand (a,b) ∗(x'−x),其中,x new 为所述扩增样本,x为所述第一样本,x'为所述第二近邻样本,rand()为随机数生成函数,(a,b)为随机数的范围。
6.根据权利要求1所述的方法,其特征在于,所述提取所述样本中所述动态数据和静态数据的特征,包括以下至少一项:
数据编码;
数据变换;
数据离散化;
数据分类统计;
数据特征组合。
7.根据权利要求6所述的方法,其特征在于,所述标准化处理,包括:
计算所述第一特征数据中各类所有样本中各个指标的算术平均值和标准差;
根据所述算术平均值和所述标准差对所述第一特征数据进行标准化处理,获取所述第二特征数据,具体公式为:
Figure 19903DEST_PATH_IMAGE001
,其中,
Figure 415112DEST_PATH_IMAGE002
为所述第二特征数据中样本里指标的值,
Figure 229484DEST_PATH_IMAGE003
为第一特征数据中样本里指标的值,
Figure 786367DEST_PATH_IMAGE004
为所述算术平均值,s为所述标准差。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第二特征数据训练故障诊断模型,包括:
根据Catboost框架构建所述故障诊断模型;
将所述第二特征数据中的样本分为训练集和验证集;
根据遗传算法调整所述故障诊断模型中的参数;
将所述训练集中的第二特征数据输入所述故障诊断模型,并训练所述故障诊断模型使其收敛;
根据验证集中的样本验证所述故障诊断模型。
9.一种基于CatBoost的锂电池故障诊断方法,其特征在于,应用于权利要求1-8中任一项所述的故障诊断模型,包括:
检测并获取锂电池的实时动态数据和静态数据;
对所述实时动态数据进行数据清洗,并提取其中的特征,获取第一特征数据;
对所述第一特征数据进行主成分分析,并进行标准化处理,获取第二特征数据;
将所述第二特征数据输入所述故障诊断模型,获取故障类别预测结果和对应的置信度。
10.根据权利要求9所述的方法,其特征在于,还包括:
根据所述故障类别预测结果和对应的置信度获取可视化图表,其中,所述可视化图表包括以下至少一项:条形图、折线图、散点图、饼图、时序表图和透视表。
11.一种基于CatBoost的锂电池故障诊断装置,其特征在于,包括:
数据获取模块,用于检测并获取锂电池过往的动态数据、静态数据和故障类别数据,并进行数据清洗;
扩展模块,用于根据各故障类别的样本数量进行样本扩增;
第一特征提取模块,用于提取所述动态数据和静态数据的特征,获取第一特征数据;
第一数据处理模块,用于对所述第一特征数据进行主成分分析,并进行标准化处理,获取第二特征数据;
训练模块,用于根据所述第二特征数据训练故障诊断模型。
12.一种基于CatBoost的锂电池故障诊断装置,其特征在于,应用于权利要求11所述的故障诊断模型,包括:
检测模块,用于检测并获取锂电池的实时动态数据和静态数据;
第二特征提取模块,用于对所述实时动态数据进行数据清洗,并提取其中的特征,获取第一特征数据;
第二数据处理模块,用于对所述第一特征数据进行主成分分析,并进行标准化处理,获取第二特征数据;
故障预测模块,用于将所述第二特征数据输入所述故障诊断模型,获取故障类别预测结果和对应的置信度。
CN202210290668.9A 2022-03-23 2022-03-23 基于CatBoost的锂电池故障诊断方法、装置及电子设备 Active CN114386537B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210290668.9A CN114386537B (zh) 2022-03-23 2022-03-23 基于CatBoost的锂电池故障诊断方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210290668.9A CN114386537B (zh) 2022-03-23 2022-03-23 基于CatBoost的锂电池故障诊断方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN114386537A true CN114386537A (zh) 2022-04-22
CN114386537B CN114386537B (zh) 2023-02-07

Family

ID=81205974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210290668.9A Active CN114386537B (zh) 2022-03-23 2022-03-23 基于CatBoost的锂电池故障诊断方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114386537B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115184813A (zh) * 2022-08-04 2022-10-14 爱德曼(淄博)氢能科技有限公司 一种基于神经网络的氢燃料电池状态诊断方法及系统
CN115187013A (zh) * 2022-06-24 2022-10-14 中国华能集团清洁能源技术研究院有限公司 一种锂电池性能评分计算方法及系统
CN115343636A (zh) * 2022-10-18 2022-11-15 中国华能集团清洁能源技术研究院有限公司 一种锂电池的异常检测方法及装置
CN116401585A (zh) * 2023-04-19 2023-07-07 江苏果下科技有限公司 一种基于大数据的储能电池失效风险评估方法
WO2023226355A1 (zh) * 2022-05-27 2023-11-30 深圳先进技术研究院 基于多源感知的双向锂离子电池故障检测方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784325A (zh) * 2017-10-20 2018-03-09 河北工业大学 基于数据驱动增量融合的螺旋式故障诊断模型
CN111090050A (zh) * 2020-01-21 2020-05-01 合肥工业大学 一种基于支持向量机和k均值的锂电池故障诊断方法
CN111275193A (zh) * 2020-01-15 2020-06-12 杭州华网信息技术有限公司 一种国家电网雷击预测方法
CN112070125A (zh) * 2020-08-19 2020-12-11 西安理工大学 一种基于孤立森林学习的不平衡数据集的预测方法
WO2021017416A1 (zh) * 2019-07-30 2021-02-04 重庆邮电大学 一种感知对抗生成下的深度压缩动力锂电池故障诊断方法
CN113821976A (zh) * 2021-09-26 2021-12-21 中国华能集团清洁能源技术研究院有限公司 一种基于集成算法的锂电池故障诊断建模方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784325A (zh) * 2017-10-20 2018-03-09 河北工业大学 基于数据驱动增量融合的螺旋式故障诊断模型
WO2021017416A1 (zh) * 2019-07-30 2021-02-04 重庆邮电大学 一种感知对抗生成下的深度压缩动力锂电池故障诊断方法
CN111275193A (zh) * 2020-01-15 2020-06-12 杭州华网信息技术有限公司 一种国家电网雷击预测方法
CN111090050A (zh) * 2020-01-21 2020-05-01 合肥工业大学 一种基于支持向量机和k均值的锂电池故障诊断方法
CN112070125A (zh) * 2020-08-19 2020-12-11 西安理工大学 一种基于孤立森林学习的不平衡数据集的预测方法
CN113821976A (zh) * 2021-09-26 2021-12-21 中国华能集团清洁能源技术研究院有限公司 一种基于集成算法的锂电池故障诊断建模方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023226355A1 (zh) * 2022-05-27 2023-11-30 深圳先进技术研究院 基于多源感知的双向锂离子电池故障检测方法及系统
CN115187013A (zh) * 2022-06-24 2022-10-14 中国华能集团清洁能源技术研究院有限公司 一种锂电池性能评分计算方法及系统
CN115184813A (zh) * 2022-08-04 2022-10-14 爱德曼(淄博)氢能科技有限公司 一种基于神经网络的氢燃料电池状态诊断方法及系统
CN115343636A (zh) * 2022-10-18 2022-11-15 中国华能集团清洁能源技术研究院有限公司 一种锂电池的异常检测方法及装置
CN115343636B (zh) * 2022-10-18 2023-02-07 中国华能集团清洁能源技术研究院有限公司 一种锂电池的异常检测方法及装置
CN116401585A (zh) * 2023-04-19 2023-07-07 江苏果下科技有限公司 一种基于大数据的储能电池失效风险评估方法
CN116401585B (zh) * 2023-04-19 2023-11-10 江苏果下科技有限公司 一种基于大数据的储能电池失效风险评估方法

Also Published As

Publication number Publication date
CN114386537B (zh) 2023-02-07

Similar Documents

Publication Publication Date Title
CN114386537B (zh) 基于CatBoost的锂电池故障诊断方法、装置及电子设备
CN109409444B (zh) 一种基于先验概率的多元电网故障类型的判别方法
CN111833583B (zh) 电力数据异常检测模型的训练方法、装置、设备和介质
CN112966879A (zh) 环境试验箱故障预测方法、装置、计算机设备及存储介质
CN111695620A (zh) 一种电力系统时间序列异常数据检测与修正方法及系统
KR102615145B1 (ko) 딥러닝 기반의 배터리 유효 충전 데이터 식별 방법, 장비 및 매체
CN110348683A (zh) 电能质量扰动事件主成因分析方法、装置设备及存储介质
CN113837596A (zh) 一种故障确定方法、装置、电子设备及存储介质
CN112949201B (zh) 一种风速预测方法、装置、电子设备及存储介质
CN111738348B (zh) 一种电力数据异常检测方法和装置
CN113554229A (zh) 三相电压不平衡异常检测方法及装置
CN116400266A (zh) 基于数字孪生模型的变压器故障检测方法、装置及介质
CN116050250A (zh) 基于混合驱动模型的电网数字孪生模型建模方法及装置
CN116127326B (zh) 一种复合绝缘子检测方法、装置、电子设备及存储介质
Lu et al. Anomaly Recognition Method for Massive Data of Power Internet of Things Based on Bayesian Belief Network
CN115169234B (zh) 一种基于大数据分析的电力网络可靠性评估方法
Bai et al. Abnormal Detection Scheme of Substation Equipment based on Intelligent Fusion Terminal
CN117406007B (zh) 一种充电桩充电数据检测方法及系统
CN116992274B (zh) 基于改进主成分回归模型的短期风速预测方法及系统
CN117277422B (zh) 一种直驱风电场稳定评估方法、系统、终端及介质
CN114298495A (zh) 基于细粒度数据驱动的电网可靠性评估方法
He et al. Method of Equipment Fault Diagnosis Based on Frequent Itemsets Mining
CN116840696A (zh) 蓄电池剩余寿命的预测方法、装置、电子设备及存储介质
CN117828364A (zh) 还原度确定方法、装置、设备及存储介质
Miao et al. Topology Identification in LV Distribution Network Based on SAE and Modified DBSCAN

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20220422

Assignee: Northern shangduzheng Lanqi new energy Co.,Ltd.

Assignor: HUANENG CLEAN ENERGY Research Institute

Contract record no.: X2023110000091

Denomination of invention: CatBoost based lithium battery fault diagnosis method, device, and electronic equipment

Granted publication date: 20230207

License type: Common License

Record date: 20230809

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20220422

Assignee: Wushi County Huaneng New Energy Co.,Ltd.

Assignor: HUANENG CLEAN ENERGY Research Institute

Contract record no.: X2023110000097

Denomination of invention: CatBoost based lithium battery fault diagnosis method, device, and electronic equipment

Granted publication date: 20230207

License type: Common License

Record date: 20230821