CN116224112A - 一种基于XGBoost模型的电池阻抗谱频率重要性分析方法 - Google Patents

一种基于XGBoost模型的电池阻抗谱频率重要性分析方法 Download PDF

Info

Publication number
CN116224112A
CN116224112A CN202310108009.3A CN202310108009A CN116224112A CN 116224112 A CN116224112 A CN 116224112A CN 202310108009 A CN202310108009 A CN 202310108009A CN 116224112 A CN116224112 A CN 116224112A
Authority
CN
China
Prior art keywords
frequency
model
impedance spectrum
battery
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310108009.3A
Other languages
English (en)
Inventor
胡志超
潘多昭
常伟
夏紫阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Lejia Smart Energy Technology Co ltd
Original Assignee
Shanghai Lejia Smart Energy Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Lejia Smart Energy Technology Co ltd filed Critical Shanghai Lejia Smart Energy Technology Co ltd
Priority to CN202310108009.3A priority Critical patent/CN116224112A/zh
Publication of CN116224112A publication Critical patent/CN116224112A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/36Arrangements for testing, measuring or monitoring the electrical condition of accumulators or electric batteries, e.g. capacity or state of charge [SoC]
    • G01R31/389Measuring internal impedance, internal conductance or related variables
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/36Arrangements for testing, measuring or monitoring the electrical condition of accumulators or electric batteries, e.g. capacity or state of charge [SoC]
    • G01R31/367Software therefor, e.g. for battery testing using modelling or look-up tables
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/36Arrangements for testing, measuring or monitoring the electrical condition of accumulators or electric batteries, e.g. capacity or state of charge [SoC]
    • G01R31/385Arrangements for measuring battery or accumulator variables
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/36Arrangements for testing, measuring or monitoring the electrical condition of accumulators or electric batteries, e.g. capacity or state of charge [SoC]
    • G01R31/396Acquisition or processing of data for testing or for monitoring individual cells or groups of cells within a battery

Abstract

本发明公开一种基于XGBoost模型的电池阻抗谱频率重要性分析方法,具体实现如下:步骤1:测试并采集电池电化学阻抗谱数据;步骤2.构建XGBoost预测模型,在电池阻抗谱数据采集完毕后,构建XGBoost预测模型;步骤3.训练和检验XGBoost模型,在模型训练中,将数据集按照8:2的比例分成训练集合和测试集合,在训练集合上进行模型训练,在测试集合上验证模型效果。步骤4.计算频率重要性,采取特征在节点分裂时,给模型带来的信息增益优化的平均值作为特征的贡献度;步骤5.计算频率相关性。本发明通过XGBoost树模型的特征贡献度来衡量电池阻抗谱中频率的重要程度,从电池阻抗谱频率中选取若干重要频率,从而缩小测试电池阻抗谱数据时的频率范围,实现计算阻抗谱频率重要性目的。

Description

一种基于XGBoost模型的电池阻抗谱频率重要性分析方法
技术领域
本发明涉及电池电化学技术领域,尤其是一种基于XGBoost模型的电池阻抗谱频率重要性分析方法。
背景技术
电池电化学阻抗谱(Electrochemical Impedance Spectroscopy,EIS)是电池的一种非侵入性的特征,是电化学领域的研究热点之一。电池阻抗谱最常见的研究内容就是预测电池的某些属性,如剩余容量、剩余寿命和健康度等。已经有大量的研究结果表明阻抗谱数据具有良好的预测以上电池属性的能力。
然而阻抗谱数据一般都是覆盖几十个频率范围,在测试和应用时,比较繁琐。因此通过一些方法找出其中起到关键作用的频率,则可以缩小阻抗检测的范围,起到减少测试数量和简化流程的作用,是目前急需要解决的问题。
发明内容
为了解决上述技术问题,本发明提供一种基于XGBoost模型的电池电化学阻抗谱数据中各个频率重要性的计算方法,本发明将电池阻抗谱频率作为输入特征,通过XGBoost模型构建了EIS与电池属性之间的映射关系,电池属性选取电池剩余容量,然后通过计算每个特征的贡献度来判定阻抗谱频率的重要程度,从而实现计算阻抗谱频率重要性的目的。
本发明解决其技术问题所采用的技术方案是:
一种基于XGBoost模型的电池阻抗谱频率重要性分析方法,包括如下几个步骤:
步骤1: 1.测试并采集电池电化学阻抗谱数据:测用专业的阻抗谱测试仪器,并且覆盖一定的频率范围,频率范围设置10-2HZ至105HZ,在频率范围中间按一定间隔选取多个频率值。
步骤2:构建XGBoost预测模型:在电池阻抗谱数据采集完毕之后,构建XGBoost预测模型。输入数据就是电池的电化学阻抗数据,特征维度是频率从高到低对应的阻抗的实部和虚部数据。
步骤3:训练和检验XGBoost模型:在模型训练中,将数据集按照8:2的比例分成训练集合和测试集合,在训练集合上进行模型训练,在测试集合上验证模型效果,检验指标是预测值和真实值之间的均方误差。
步骤4:计算频率重要性:训练好XGBoost模型之后,计算特征的贡献度,本发明采取特征在节点分裂时,给模型带来的信息增益优化的平均值,作为特征的贡献度。
步骤5:计算频率相关性:在计算频率重要性的基础上,选取最重要的前15个频率作为重要频率,然后计算这些重要频率的样本值的Person相关系数,并根据相关系数来判断哪些频率之间高度相关。
进一步的,在步骤1中,采集数据时,需要记录每个频率对应的阻抗的实部和虚部数据,以及需要预测的目标值,比如相对应的电池容量数据、循环次数等。
进一步的,在步骤2中,可以采用其他树模型,如随机森林、GBDT等也可以用于构建预测模型。
进一步的,在步骤5中计算频率相关时,取阈值0.7以上为高度相关,选取代表性的频率,去掉其他冗余的频率,起到进一步精简重要频率的作用。
本发明的有益效果是:
传统的电池阻抗谱检测需要覆盖较多频率,存在检测时间长,后续利用计算量大等问题。本发明充分利用了XGBoost模型的计算速度快、预测效果好,特别是能够计算特征重要性的优点,构建了电池阻抗谱数据与电池剩余容量之间的映射关系,利用XGBoost树模型的特征贡献度来衡量输入特征的重要程度,从电池阻抗谱检测频率中,选取了最重要的若干频率,为检测电池阻抗谱数据时,缩小检测范围提供了依据。
附图说明
图1是基于XGBoost模型的阻抗谱频率重要性计算流程图。
图2是本发明重要频率相关性热力图。
实施方式
图1 基于XGBoost模型的阻抗谱频率重要性计算流程图,如图1所示,首先,需要通过实验的方式采集电池阻抗谱和剩余容量数据;其次,构建XGBoost预测模型,用电池EIS预测电池SOC;再次,训练并检验XGBoost模型;然后,计算频率贡献度,确定重要性频率;最后,计算重要性频率之间的相关系数,选取代表性频率,去掉冗余频率。
本发明在具体实现上,分为以下几个详细步骤:
步骤1.测试并采集电池电化学阻抗谱数据:
测试和采集电池电化学阻抗谱数据需要专业的阻抗谱测试仪器,并且需要覆盖一定的频率范围,频率范围可以设置10-2HZ至105HZ,在频率范围中间按一定间隔选取多个频率值,比如60个。
采集数据时,需要记录每个频率对应的阻抗的实部和虚部数据,以及需要预测的目标值,比如相对应的电池容量数据、循环次数等。
步骤2.构建XGBoost预测模型
在电池阻抗谱数据采集完毕之后,构建XGBoost预测模型。输入数据就是电池的电化学阻抗数据,特征维度是频率从高到低对应的阻抗的实部和虚部数据。
比如如果频率范围中选取了60个频率值,则前60维度的数据对应于60个频率测试得到的阻抗的实部数据,接下来的60维度的数据对应于60个频率测试得到的阻抗的虚部数据,共120维度。
本发明以XGBoost模型为例,其他树模型,如随机森林、GBDT等也可以用于构建预测模型。
在Python中使用xgboost软件包进行编程,构建XGBoost预测模型,涉及的参数主要有:
base_score,所有样本的初始预测分值,默认值为0.5;
booster,提升器参数,默认值为'gbtree';
importance_type,贡献度类型,默认值为'gain';
learning_rate,学习率,默认值为0.3,;
max_depth,树的最大深度,默认值为6;
min_child_weight,子节点权重的最小总和,默认值为1;
n_estimators,树的数量,默认值为100。
以上参数均取默认值。
步骤3.训练和检验XGBoost模型:
在模型训练中,将数据集按照8:2的比例分成训练集合和测试集合,在训练集合上进行模型训练,在测试集合上验证模型效果,检验指标是预测值和真实值之间的均方误差。
在回归预测模型中,均方误差(Mean Square Error, MSE)是检验模型优劣的指标之一,它是检测样本的真实值与预测值的差值的平方求和的平均值,一般用来检测模型的预测值和真实值之间的偏差。均方误差越小,说明模型拟合的越好,效果也越好。
步骤4.计算频率重要性
训练好XGBoost模型之后,计算特征的贡献度,本发明采取特征在节点分裂时,给模型带来的信息增益优化的平均值,作为特征的贡献度。
假设特征k=1,2,...,K,则k的特征贡献度计算公式为:
Figure SMS_1
其中,k表示某节点;
V(k)表示特征k的贡献度;
T表示所有树的数量;
N(t)表示第t棵树的非叶子节点数量;
β(t,i)表示第t棵树的第i个非叶子节点的划分特征,β(t,i)∈{1,2,……,K};
I(.)表示指示函数;
Gγ(t,i,L),Gγ(t,i,R)分别表示落在第t棵树上第i个非叶子节点的左、右节点上的一阶导数之和;
Hγ(t,i,L),Hγ(t,i,R)分别表示落在第t棵树上第i个非叶子节点的左、右节点上的二阶导数之和;
Gγ(t,i),Hγ(t,i)分别表示落在第t棵树的第i个非叶子节点上所有样本的一阶导数和二阶导数之和,并且Gγ(t,i)=Gγ(t,i,L)+Gγ(t,i,R),Hγ(t,i)=Hγ(t,i,L)+Hγ(t,i,R)
λ是正则化项的超参数。
步骤5.计算频率相关性
在计算频率重要性的基础上,选取最重要的前15个频率作为重要频率,然后计算这些重要频率的样本值的Person相关系数,并根据相关系数来判断哪些频率之间高度相关,一般取阈值0.7以上为高度相关。在这些高度相关的频率之中,选取代表性的频率,去掉其他冗余的频率,可以起到进一步精简重要频率的作用。
假设向量X和Y分别为
Figure SMS_2
,则X和Y的Person相关系数计算公式为:/>
Figure SMS_3
其中,r表示Person相关系数,
Figure SMS_4
表示向量X的均值,/>
Figure SMS_5
表示向量Y的均值。
实施例
本发明在公开数据集合上测试效果,使用其中的阻抗数据来预测电池剩余容量。将数据集按照8:2的比例分成训练集合和测试集合,在训练集合上训练XGBoost模型,在测试集合上计算每个特征的重要性。XGBoost模型训练时,参数均选用默认值。测试数据共有120个特征,特征序号依次是1至120,前60个特征是频率从高到低对应的阻抗数据的实部数据,后60个特征是频率从高到低对应的阻抗数据的虚部数据。
测试集合的均值为30.6003,方差为4.0861,预测集合的均值为30.6338,方差为4.0484,这表明预测结果的数据分布与真实数据的数据分布基本一致。预测集合和测试集合的均方误差只有0.1048,说明模型的预测效果良好。
在模型效果优良的前提下,输出每个特征的贡献度,表1展示了部分权重排名靠前的频率以及相关信息。
表1 阻抗频率重要性一览表(部分)
Figure SMS_6
从表1可以看出,在电池容量预测数据中,重要的频率主要集中在2个区间,一个区间是f86至f118,覆盖0.03192HZ至57.36816HZ,该区间对应的低频区域,特征值都来自于阻抗复数表达式中的虚部数据;另一个区间是f3至f4,覆盖9909.4424HZ至12516.703HZ,该区间对应的是高频区域,特征值都来自于阻抗复数表达式中的实部数据。
进一步,可以计算重要频率的相关性,去掉冗余特征。
通过计算重要频率f94至f96、f116至f117的输入值的Person相关系数,并做出热力图,可以发现相关度高的频率。如图2所示,从图2中可以发现重要性频率可以分成二类,这二类频率内部彼此高度相关,而外部彼此相关度不高,其中f86至f118对应的频率的相关度都很高,因此只需要保留其中一个即可,如选取f90对应的特征;f3和f4对应的频率的相关度很高,可以选取f3对应的特征。综上所述,最终的重要频率可以确定为f3和f90。

Claims (4)

1.一种基于XGBoost模型的电池阻抗谱频率重要性分析方法,其特征在于,包括如下几个步骤:
步骤1.测试并采集电池电化学阻抗谱数据:测用专业的阻抗谱测试仪器,并且覆盖一定的频率范围,频率范围设置10-2HZ至105HZ,在频率范围中间按一定间隔选取多个频率值;
步骤2.构建XGBoost预测模型:在电池阻抗谱数据采集完毕之后,构建XGBoost预测模型;
输入数据就是电池的电化学阻抗数据,特征维度是频率从高到低对应的阻抗的实部和虚部数据;
步骤3.训练和检验XGBoost模型:将数据集按照8:2的比例分成训练集合和测试集合,在训练集合上进行模型训练,在测试集合上验证模型效果,检验指标是预测值和真实值之间的均方误差;
步骤4.计算频率重要性:训练好XGBoost模型之后,采取特征在节点分裂时,给模型带来的信息增益优化的平均值,作为特征的贡献度;
步骤5.计算频率相关性:选取最重要的前15个频率作为重要频率,然后计算这些重要频率的样本值的Person相关系数,并根据相关系数来判断哪些频率之间高度相关。
2.根据权利要求1所述的一种基于XGBoost模型的电池阻抗谱频率重要性分析方法,其特征在于,在步骤1中,采集数据时,记录每个频率对应的阻抗的实部和虚部数据,以及需要预测的目标值,比如相对应的电池容量数据、循环次数。
3.根据权利要求1所述的一种基于XGBoost模型的电池阻抗谱频率重要性分析方法,其特征在于,在步骤2中,采用其他树模型,如随机森林、GBDT用于构建预测模型。
4.根据权利要求1所述的一种基于XGBoost模型的电池阻抗谱频率重要性分析方法,其特征在于,在步骤5中计算频率相关时,取阈值0.7以上为高度相关,选取代表性的频率,去掉其他冗余的频率,起到进一步精简重要频率的作用。
CN202310108009.3A 2023-02-14 2023-02-14 一种基于XGBoost模型的电池阻抗谱频率重要性分析方法 Pending CN116224112A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310108009.3A CN116224112A (zh) 2023-02-14 2023-02-14 一种基于XGBoost模型的电池阻抗谱频率重要性分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310108009.3A CN116224112A (zh) 2023-02-14 2023-02-14 一种基于XGBoost模型的电池阻抗谱频率重要性分析方法

Publications (1)

Publication Number Publication Date
CN116224112A true CN116224112A (zh) 2023-06-06

Family

ID=86583835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310108009.3A Pending CN116224112A (zh) 2023-02-14 2023-02-14 一种基于XGBoost模型的电池阻抗谱频率重要性分析方法

Country Status (1)

Country Link
CN (1) CN116224112A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116774051A (zh) * 2023-06-28 2023-09-19 上海炙云新能源科技有限公司 考虑时频域多维数据特征的电池容量快速估计方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116774051A (zh) * 2023-06-28 2023-09-19 上海炙云新能源科技有限公司 考虑时频域多维数据特征的电池容量快速估计方法
CN116774051B (zh) * 2023-06-28 2024-02-02 上海炙云新能源科技有限公司 考虑时频域多维数据特征的电池容量快速估计方法

Similar Documents

Publication Publication Date Title
CN108777873A (zh) 基于加权混合孤立森林的无线传感网络异常数据检测方法
CN109752656B (zh) 一种在多时间尺度下用电动汽车电池soh评估方法
CN113109715B (zh) 基于特征选择和支持向量回归的电池健康状况预测方法
CN111340248A (zh) 一种基于智能集成算法的变压器故障诊断方法及系统
CN116224112A (zh) 一种基于XGBoost模型的电池阻抗谱频率重要性分析方法
CN111832221A (zh) 基于特征筛选的锂电池寿命预测方法
CN112270129A (zh) 一种基于大数据分析的植物长势预测方法
CN111950645A (zh) 一种通过改进随机森林提高类不平衡分类性能的方法
CN115201692A (zh) 一种锂电池剩余寿命分析预测方法
CN111693487A (zh) 基于遗传算法和极限学习机的水果糖度检测方法及系统
CN114331238A (zh) 智能模型算法优选方法、系统、存储介质及计算机设备
CN114325454A (zh) 一种多特征对电池健康度影响的确定方法、装置、设备及介质
CN114117953A (zh) 水文模型结构诊断方法、径流预报方法及装置
CN117198517B (zh) 基于机器学习的运动反应性评估和预测模型的建模方法
CN117517963A (zh) 一种基于膨胀力的多尺度的锂离子电池荷电状态评估方法
CN111880957A (zh) 一种基于随机森林模型的程序错误定位方法
CN114280490B (zh) 一种锂离子电池荷电状态估计方法及系统
CN111178383A (zh) 一种基于多核支持向量机的电池单体品质分类方法
CN113889274B (zh) 一种孤独症谱系障碍的风险预测模型构建方法及装置
TWI762853B (zh) 利用自動化機制挑選影響力指標的方法及電子裝置
CN115153549A (zh) 一种基于bp神经网络的人机交互界面认知负荷预测方法
CN113901721A (zh) 基于鲸鱼优化算法的模型生成方法及数据预测方法
CN115840154A (zh) 一种基于神经网络的电池阻抗谱频率重要性分析方法
CN116298893A (zh) 一种基于神经网络和阻抗谱数据预测电池剩余容量方法
CN113035363B (zh) 一种概率密度加权的遗传代谢病筛查数据混合采样方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 307, Building 10A, Zilang Science and Technology City, No. 60 Chongzhou Avenue, Development Zone, Nantong City, Jiangsu Province, 226010

Applicant after: Nantong Le Chuangxin Energy Co.,Ltd.

Address before: Room 1801, Building 19, No. 1515, Gumei Road, Xuhui District, Shanghai, 201102

Applicant before: Shanghai Lejia Smart Energy Technology Co.,Ltd.

CB02 Change of applicant information