CN116500456B - 一种基于机器学习的三元锂电池容量检测方法 - Google Patents
一种基于机器学习的三元锂电池容量检测方法 Download PDFInfo
- Publication number
- CN116500456B CN116500456B CN202310744741.XA CN202310744741A CN116500456B CN 116500456 B CN116500456 B CN 116500456B CN 202310744741 A CN202310744741 A CN 202310744741A CN 116500456 B CN116500456 B CN 116500456B
- Authority
- CN
- China
- Prior art keywords
- data
- battery
- battery capacity
- capacity detection
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 56
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 title claims abstract description 34
- 229910052744 lithium Inorganic materials 0.000 title claims abstract description 34
- 238000010801 machine learning Methods 0.000 title claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 47
- 230000009467 reduction Effects 0.000 claims abstract description 15
- 238000011156 evaluation Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims description 32
- 238000003066 decision tree Methods 0.000 claims description 24
- 238000007637 random forest analysis Methods 0.000 claims description 22
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 239000002131 composite material Substances 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 description 25
- 238000009826 distribution Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 238000005259 measurement Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 5
- 230000032683 aging Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- HBBGRARXTFLTSG-UHFFFAOYSA-N Lithium ion Chemical compound [Li+] HBBGRARXTFLTSG-UHFFFAOYSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 229910001416 lithium ion Inorganic materials 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 230000020169 heat generation Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/36—Arrangements for testing, measuring or monitoring the electrical condition of accumulators or electric batteries, e.g. capacity or state of charge [SoC]
- G01R31/367—Software therefor, e.g. for battery testing using modelling or look-up tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E60/00—Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
- Y02E60/10—Energy storage using batteries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Secondary Cells (AREA)
- Tests Of Electric Status Of Batteries (AREA)
Abstract
本发明公开了一种基于机器学习的三元锂电池容量检测方法,其中,包括以下步骤:获取电池数据,并基于所述电池数据构建数据集;将所述数据集进行数据降维以及标准化处理;构建电池容量检测模型,通过所述数据集对电池容量检测模型进行训练,并对训练后的模型进行评估;将新采集的电池数据输入到完成评估后的电池容量检测模型中,即可实现对电池容量的实时在线检测。本发明解决了如何准确且快速的对电池容量进行精准无损检测并输出结果的技术问题。
Description
技术领域
本发明涉及电池技术领域,尤其涉及一种基于机器学习的三元锂电池容量检测方法。
背景技术
随着清洁能源的快速发展,储能电池、动力电池等被广泛运用,迫切需要实现对电池容量的快速无损检测,提升电池的可靠性水平、降低安全风险。锂离子电池具有高能量密度、长使用寿命、较高单体工作电压、低自放电率和绿色环保的特点,随着我国移动通讯、新能源汽车、先进制造业等行业的迅猛发展,对锂电池的需求会不断增长,三元锂电池的原料来源丰富、成本低、安全性能好,但随着电池的循环使用,伴随电池老化而出现的容量损失、内阻变大、性能衰退以及起火爆炸等问题接踵而来,且一直是电池管理领域研究的重点。而电池的老化无法直接测量,而且具有非线性的特征,因此,对三元锂电池老化后的性能衰退进行研究,并对可用容量进行实时准确估计,在实际应用中显得尤为重要。
目前,现有的电池容量检测方法通常有两种,第一种根据电池厂商提供的出厂设定参数,该方法考虑了电池容量会随着使用的时间逐渐衰减,逐渐进行容量的下调,但容量测量精度不准;第二种采用人工定期修正电池的容量,但该方法没有考虑电池在实际运行的情况,例如电池工作温度,电池充放电状态以及是否收到挤压装机等影响,均无法实时准确的进行容量测量。因此,亟待提出一种基于机器学习的三元锂电池容量检测方法,解决如何准确且快速的对电池容量进行精准无损检测并输出结果的技术问题。
发明内容
本发明的主要目的是提供一种基于机器学习的三元锂电池容量检测方法,旨在解决如何准确且快速的对电池容量进行精准无损检测并输出结果的技术问题。
为实现上述目的,本发明提供一种基于机器学习的三元锂电池容量检测方法,其中,所述基于机器学习的三元锂电池容量检测方法包括以下步骤:
S1、获取电池数据,并基于所述电池数据构建数据集;
S2、将所述数据集进行数据降维以及标准化处理;
S3、构建电池容量检测模型,通过所述数据集对电池容量检测模型进行训练,并对训练后的模型进行评估;
S4、将新采集的电池数据输入到完成评估后的电池容量检测模型中,即可实现对电池容量的实时在线检测。
优选方案之一,所述电池数据包括电池低频噪声数据、电池电压、电池内阻、电池充放电循环次数和电池容量。
优选方案之一,所述电池低频噪声数据包括频域数据和时域数据。
优选方案之一,所述频域数据为:
其中,为频域数据,/>为粉红噪声的频率,B为粉红噪声的幅度,/>为粉红噪声的频率指数因子,C为复合噪声的幅度,/>为粉红噪声和复合噪声的转折频率,/>为粉红噪声和复合噪声的指数因子。
优选方案之一,所述时域数据包括均值、方差、峰值、偏度和能量参数。
优选方案之一,所述步骤S1获取电池数据,并基于所述电池数据构建数据集之后,还包括:数据预处理,识别所述数据集中异常、缺失及标注错误的电池数据,并进行删除。
优选方案之一,所述步骤S2将所述数据集进行数据降维,具体为:
编码,提取所述数据集中电池数据的有效特征;
解码,将提取的所述有效特征进行重构,得到数据降维后的数据集。
优选方案之一,所述步骤S2中标准化处理,具体为:将经过数据降维后的数据集中的电池数据进行数据归一化,将电池数据映射到0-1。
优选方案之一,所述电池容量检测模型采用随机森林回归模型。
优选方案之一,所述电池容量检测模型采用自主采样法进行训练。
本发明的上述技术方案中,该基于机器学习的三元锂电池容量检测方法包括以下步骤:获取电池数据,并基于所述电池数据构建数据集;将所述数据集进行数据降维以及标准化处理;构建电池容量检测模型,通过所述数据集对电池容量检测模型进行训练,并对训练后的模型进行评估;将新采集的电池数据输入到完成评估后的电池容量检测模型中,即可实现对电池容量的实时在线检测。本发明解决了如何准确且快速的对电池容量进行精准无损检测并输出结果的技术问题。
在本发明中,通过获取电池的低频噪声数据、电池电压、电池内阻、电池充放电循环次数和电池容量,识别数据中是否有缺失值和异常值,对该缺失值和异常值进行预处理,并进行数据降维,最后将处理后的数据基于随机森林回归模型识别电池的容量,更能实时、动态且准确的检测电池容量。
附图说明
为了更清楚地说明本发明实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明实施例一种基于机器学习的三元锂电池容量检测方法的第一示意图;
图2为本发明实施例一种基于机器学习的三元锂电池容量检测方法的第二示意图;
图3为本发明实施例三元锂电池的原理示意图;
图4为本发明实施例频域数据的示意图;
图5为本发明实施例时域数据的示意图;
图6为本发明实施例1/f噪声拟合示意图;
图7为本发明实施例自动编码器示意图;
图8为本发明实施例随机森林回归模型的示意图;
图9为本发明实施例随机森林回归模型的流程示意图;
图10为本发明实施例特征重要性分析图;
图11为本发明实施例OOB分析图;
图12为本发明实施例随机森林训练集拟合图;
图13为本发明实施例随机森林测试集拟合图。
本发明目的的实现、功能特点及优点将结合实施方式,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明的一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
并且,本发明各个实施方式之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参见图1-图3,根据本发明的一方面,本发明提供一种基于机器学习的三元锂电池容量检测方法,其中,所述基于机器学习的三元锂电池容量检测方法包括以下步骤:
S1、获取电池数据,并基于所述电池数据构建数据集;
S2、将所述数据集进行数据降维以及标准化处理;
S3、构建电池容量检测模型,通过所述数据集对电池容量检测模型进行训练,并对训练后的模型进行评估;
S4、将新采集的电池数据输入到完成评估后的电池容量检测模型中,即可实现对电池容量的实时在线检测。
具体地,在本实施例中,获取电池数据,所述电池数据包括电池低频噪声数据、电池电压、电池内阻、电池充放电循环次数和电池容量;所述数据集包括训练集和测试集;所述低频噪声数据包括频域数据和时域数据;低频噪声为器件内部微观结构引起的电流或电压低频随机涨落,频率在0.1Hz-300kHz,随着充放电次数的增加,电池内部微观结构逐渐产生变化并出现缺陷,导致锂离子的运动变得无序,电流密度分布不均匀,致使产热不均、内阻及容量劣化,低频噪声也发生相应变化。所述电池低频噪声数据的产生与电池内部材料的微观结构和物理化学机制有关,其中,频域数据和时域数据均在非屏蔽房以0.01H采样频率下获取,具体地电池数据获取步骤为:随机选取D颗三元锂电池,将其分为a,b两组,进行轮换充放电循环和测量低频噪声及其他相关参数,充放电循环以4.5个循环次数为一个周期,即电池低电量时经历“充电-放电-充电-放电-充电-放电-充电-放电-充电”循环,分别对每一颗电池的电压、内阻及低频噪声数据进行测试记录,每一次以放电为结束循环中,就记录最后一次的放电容量用以表示此时三元锂电池的容量,在本发明中,除最后一工步外,其余工步均采用6A电流,充电截止电压4.2V,放电截止电压2.5V,最后一个工步增加1A电流充/放电,确保电池电量状态的一致性,本发明不进行具体限定,具体保持电量状态一致即可;由于4.5个周期的充放电循环使电池老化缓慢,因此,在46次充放电循环后,将测试周期由原来的4.5个循环周期调整位9.5个循环,即在两次低频噪声测试间增加5次充放电循环,并且在循环过程中加入“过放”,除最后一个工步外,其余工步的放电电压降低至1V,以缩短电池老化过程所需时间,同样的,每个充放电周期后均会记录电压电压、容量、内阻和低频噪声数据。
具体地,在本实施例中,所述频域数据为:
其中,为频域数据,/>为粉红噪声的频率,B为粉红噪声的幅度,/>为粉红噪声的频率指数因子,C为复合噪声的幅度,/>为粉红噪声和复合噪声的转折频率,/>为粉红噪声和复合噪声的指数因子;
不同的噪声分量以及各个分量的不同表征参数往往具有不同的物理意义,对应电池的不同结构特性和缺陷量;其中,粉红噪声即为1/f噪声,所述频域数据即为噪声功率谱密度;对于仅含有1/f噪声的频域数据为:
此函数为非线性的,将其拟合比较困难,因此需将其转化为线性拟合,即对公式两边取对数变为;
令,得:/>;
已知实测噪声频谱曲线的频率点为,相应的功率谱密度值为,/>为功率谱密度值总数;设1/f噪声的主导频率区间为/>,白噪声的主导频率区间为/>,由最小二乘法拟合,噪声参数/>分别为:
其中,M为噪声参数中的临时变量;由上述参数得到的拟合噪声谱为:
对应的拟合曲线与实测曲线的残差平均值为:
令则得到/>组的/>值。设其中最小的/>值对应的/>值为/>,则/>即为最佳拟合参数值作为特征参数;
根据最优的提特征参数计算白噪声与1/f噪声区的转折频率为:
。
具体地,在本实施例中,所述时域数据包括均值、方差、峰值、偏度和能量参数;所述均值为将所有输入的时域数据的数值相加除以数值个数,用以反映样本的集中趋势,公式为:
其中,average为均值,N为时域数据样本个数,为第i个时域数据的数值;
方差用于一组数据波动程度的度量,当样本数据比较分散时,各个数据与平均值的差的平方和较大,方差就大,当数据分布比较集中时,各个数据与均值的差的平方和就小,方差小,输入的时域数据的数值的方差为:
其中,var为方差;
峰度表示概率密度分布曲线在均值处峰值高低的特征数,直观来看,峰度反映了峰部的尖度;样本的峰度和正态分布相比较而的统计量,如果峰度大于3,峰的形状比较尖,比正态分布的峰更为陡峭,反之亦然;若知道分布有可能在峰度上偏移正态分布时,可用峰度来检验分布的正态性;峰度的取值范围:下限不低于1,上限不高于数据的个数,输入的时域数据的数值的峰度为:
其中,kurtosis为峰度;
偏度为表示概率密度分布曲线相对于平均值不对称程度的特征数,正态分布的偏度为0,两侧尾部长度对称。若以bs表示偏度。bs<0称分布具有负偏离,也称左偏态,此时数据位于均值左边的比位于右边的少,直观表现为左边的尾部相对于与右边的尾部要长,因为有少数变量值很小,使曲线左侧尾部拖得很长;bs>0称分布具有正偏离,也称右偏态,此时数据位于均值右边的比位于左边的少,直观表现为右边的尾部相对于与左边的尾部要长,因为有少数变量值很大,使曲线右侧尾部拖得很长;而bs接近0则可认为分布是对称的,若知道分布有可能在偏度上偏离正态分布时,可用偏度来检验分布的正态性;右偏时一般算术平均数>中位数>众数,左偏时相反,即众数>中位数>平均数,正态分布三者相等;输入的时域数据的数值的偏度为:
其中,skewness为偏度;
能量用于表示在有限的时间内统计信号的能量,输入的时域数据的数值的能量为:
其中,power为能量。
具体地,在本实施例中,所述步骤S1获取电池数据,并基于所述电池数据构建数据集之后,还包括:数据预处理,识别所述数据集中异常、缺失及标注错误的电池数据,并进行删除;具体为:通过功率谱密度值的对数坐标图、时域数据的坐标图和数据记录表、实际测量的数据文件对应判断数据集中异常、缺失和标注错误的电池数据;异常数据识别通过loglog函数绘制功率谱密度值的对数坐标图,参见图4,以40颗三元锂电池为例,对40颗三元锂电池在第181次电池充放电循环测试满电量模式下重复测试的第三次测量,可以看出明显偏离正常值范围,同时,通过plot函数绘制时域数据图得到明显偏移正常值的数据,参见图5,为40颗三元锂电池在第181次电池充放电循环测试满电量模式下测试的第三次测量;电池的噪声测量有可能因为电池的损坏或漏测等导致测量数据的丢失或者因为外界的干扰导致噪声测量失败而丢失数据等,标注错误由于数据记录表和电池测量数据记录文件不一致导致,如数据记录表1所示;
表1
异常、缺失和标注错误的电池数据的处理方式为删除与本条数据相关的所有数据。
具体地,在本实施例中,所述步骤S2将所述数据集进行数据降维,具体为:编码,提取所述数据集中电池数据的有效特征;解码,将提取的所述有效特征进行重构,得到数据降维后的数据集;本发明采用自动编码器进行数据降维,所述自动编码器为一种非监督的神经网络,包含编码和解码;相比于PCA算法进行数据降维更能有效提取电池数据的有效特征,所述自动编码器的结构参见图7;
将输入的电池数据x进行编码,编码式为:
其中,W为编码权重,c为编码偏置项;在线性组合之后加上sigmod非线性的激活函数,利用新的有效特征y可以对输入的电池数据x重构,即解码过程,为:
其中,为解码权重,/>为编码偏置项,为了使重构出的/>和输入的x的值一样,采用最小化负对数似然的损失函数来训练模型,公式如下:
通常需要在自动编码器加上一些限制来捕获更多有价值的信息,通常会设定。
具体地,在本实施例中,所述步骤S2中标准化处理,具体为:将经过数据降维后的数据集中的电池数据进行数据归一化,将电池数据映射到0-1;具体为,在进行电池容量检测模型训练之前,因为电池的不同测量方式使相关数据可能相差较大,为消除由数据相差较大可能带来的不合理的影响,长采用变量归一化的方法,即
其中,为输出矩阵Y的每一行的最大值,/>代表输出矩阵Y的每一行的最小值,/>代表要处理的矩阵,指定为/>矩阵;/>代表输入矩阵/>的每一行的最大值, />代表输出矩阵/>的每一行的最小值。
具体地,在本实施例中,所述电池容量检测模型采用随机森林回归模型;所述随机森林模型是集成学习的一种,采用Bagging即将多个弱分类器进行集成以达到强分类器的效果,Bagging具体为:每次有放回的从训练集中取出N个训练样本,组成新的训练集,利用新的训练集,训练得到H个子模型,对于回归,采用常规的平均法得到其预测值即可,本发明不进行具体限定;随机森林回归模型以决策树位基本单位,通过集成大量的决策树,构成随机森林,决策树包括样本和特征;样本,对于训练集T,T中共有t个样本,每次有放回的随机选择N个样本,虽有放回,但N并未遍历所有样本,通过选择的N个样本用来训练一个决策树;特征,假设训练集的特征个数为d,每次仅选择k个构建决策树,其中,k<d;随机森林的结构示意图参见图8,随机森林回归模型构造过程如下:在训练集T中随机有放回的选择N个样本,将选择的N个样本用来训练一个决策树,作为决策树根节点处的样本;当每个样本有Z个属性时,在决策树的每个节点需要分裂时,随机从这Z个属性中选出z个属性,满足;然后从这z个属性中采用如信息增益等策略选择一个属性作为该节点的分裂属性;决策树形成过程中每个节点均按上述步骤进行分裂,直至不能够再分裂为止,其中,决策树形成过程没有进行剪枝;重复上述步骤即可建立一定数量的决策树,即构成了随机森林。
具体地,在本实施例中,所述电池容量检测模型采用自主采样法进行训练;模型性
能的好坏依赖于模型评估的方式,本申请所述电池容量检测模型采用包外误差(out-of-
bagerror,以下简称OOB),训练集预测图,测试集预测图和计算预测精度进行模型评估;所
述自主采样法为有放回的采样,此种方式会导致约有36%的样本不会被采样到,具体计算
过程为:假设有假设有个样本,有放回的采样,每次被采样到的概率是,每次不被采
样到的概率是;则的次方,当取无穷时,极限为,约等于36%,其中
36%的样本不会被采样到指对所有树来说,存在36%的样本不会在任何一颗树的训练集中
出现,该36%的样本,就是包外数据,采用所述包外数据进行评估,就相当于采用测试集来
做模型评估,因此,本申请可以不在采用测试集进行评估;随机森林基于Bagging做了一个
扩展:随机选择属性,也即随机选择特征,通过从训练集中进行多次有放回的采样,构造出
多个训练集;模型的训练集预测图包含训练集的原始标签值和模型预测值,将其绘制成图
可直观观察,同理,模型测试集预测图包含测试集的原始标签值和模型预测值;模型预测精
度主要使用样本的原始标签和预测标签,公式为:
其中,代表训练集的预测精度,/>代表训练集原始标签,代表训练集预测标签,/>代表测试集的预测精度,/>为测试集原始标签,/>为测试集预测标签。
具体地,在本实施例中,以40颗三元锂电池为例进行说明,采用高精度的低频噪声测试仪获取三元锂电池噪声数据,得到250万个点的频域数据和500万个点的时域数据,取前1000个点作为特征点,表2为单元锂电池第181次循环低频噪声测试数据表;
表2
将频域数据拟合可得到,拟合示意图参见图6,表3为三元锂电池第181次循环重复三次低频噪声测试频域数据拟合参数表;
表3
时域数据计算其均值、方差、峰度、偏度、能量参见表4,表4为三元锂电池第181次循环重复三次低频噪声测试时时域数据相关参数表;
表4
电池电压、电池内阻、电池充放电循环次数、电池容量从数据记录表中获取,数据记录表示每个周期循环测试测量的相关值,参见表1。
40颗三元锂电池共循环测试181次,每个样本重复测试3次,每循环测试10次记录一次即1,11,21,31,41,...181共19个记录表;取第三次重复测试的数据集共19*40=760条数据,选择其中一次循环测试的40个样本进行绘制频域数据图,参见图4,观察频域数据图可以看出大部分数据集中在一起仅仅只有四个数据明显偏离正常值,则这四个就是异常数据;参见图5,时域数据图观察时域数据图大部分都集中在正负0.5之内,正负0.5之外的数据,为异常数据;观察图像筛选出严重偏离正常值的数据将其标记并将所有相关是数据剔除;缺失值和标注错误值通过分析数据记录表的备注信息可以知道哪些电池是损坏的,哪些是标注错误的,哪些是缺失的,将这些数据同样也采用剔除处理;760个样本数据经过数据分析之后剩余756个样本数据。
通过数据的获取和分析,得到的样本总数为756个,其中,一个样本包含样本标签数1个,样本特征点数2013个,样本特征是由频域数据1000个、时域数据1000个、频域拟合数据5个、时域相关参数5个,电池电压、电池内阻、电池循环次数组成;电池容量作为标签不参与降维。数据特征的维度比较高计算量非常大,对于模型的计算非常耗时,因此,采用自动编码器将样本特征维度降到200个点,自动编码器使用单隐藏层结构,隐藏层神经元数为200个,降维后的数据示例表为5;
表5
不同评价标准往往具有不同的量纲和量纲单位,这种情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性;原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价;简而言之,归一化的目的就是使得预处理的数据被限定在一定的范围内,比如[0,1],从而消除奇异样本数据导致的不良影响;奇异样本数据是指相对于其他输入样本特别大或特别小的样本矢量,即特征向量,数据归一化后的数据示例表6如下:
表6
将样本数据按照图9的过程进行训练,数据集大小位756*200,不含标签,然后进行电池容量的预测,随机森林的预测结果是由内部所有决策树的预测结果取平均值得到的,也即最终回归分数即为随机森林回归模型的预测结果;决策树的预测过程主要包括以下步骤:
步骤一,针对输入样本,从决策树的根节点起,判断当前节点是否为叶子节点,如果是则返回叶子节点的预测值,即当前叶子中样本目标变量的平均值,如果不是则进入下一步;
步骤二、根据当前节点的切分变量和切分值,将样本中对应变量的值与节点的切分值对比;如果样本变量值小于等于当前节点切分值,则访问当前节点的左子节点;如果样本变量值大于当前节点切分值,则访问当前节点的右子节点;
循环步骤二,直到访问到叶子节点,并返回叶子节点的预测值;
计算数据特征重要性,特征的重要性表示特征对预测结果影响的程度,某一特征重要性越大,表明该特征对预测结果的影响就越大,重要性越小,表明该特征对预测结果影响就越小。随机森林中某一特征的重要性,是该特征在内部所有决策树重要性的平均值,而在决策树中,计算某一个特征的重要性可以采用如下方法:使用训练数据训练模型;计算训练数据在模型上依据某一度量标准的评分,记为;遍历训练数据集中的每一个特征,每次在原训练数据集的基础上将对应的特征进行打乱操作,然后使用模型得到打乱后数据集的评分,记为/>,最后通过/>计算出第/>个特征的重要性;然后选取特征重要性大于0.1的值作为新特征重新训练电池容量检测模型,特征重要性参见图10,模型预测部分结果如表7所示;
表7
参见图11-图13,根据模型评估方法分别绘制OOB图、模型训练集预测图、模型测试集预测图,从图10中可以看到模型训练的包外误差是逐渐减小的并在一定数量的决策树后包外误差趋近稳定,为0.0068;从图11可以得到训练集上数据的预测情况和原始数据标签差距小;模型的训练集预测精度位97%,模型测试集预测精度位93%。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围。
Claims (6)
1.一种基于机器学习的三元锂电池容量检测方法,其特征在于,包括以下步骤:
S1、获取电池数据,并基于所述电池数据构建数据集;所述电池数据包括电池低频噪声数据、电池电压、电池内阻、电池充放电循环次数和电池容量;所述电池低频噪声数据包括频域数据和时域数据;所述时域数据包括均值、方差、峰值、偏度和能量参数;
S2、将所述数据集进行数据降维以及标准化处理;
S3、构建电池容量检测模型,通过所述数据集对电池容量检测模型进行训练,并对训练后的模型进行评估;所述电池容量检测模型采用随机森林回归模型,所述随机森林回归模型以决策树为基本单位,通过集成大量决策树,构成随机森林;构建电池容量检测模型具体为:
从数据集中随机有放回的选择N个样本,将选择的N个样本用于训练一个决策树,作为决策树根节点处的样本;
当每个样本有Z个属性时,随机从Z个属性中选出z个属性,满足,从z个属性中选择一个属性作为当前节点的分裂属性进行分裂,直至不能够再分裂为止;
重复上述步骤,从而完成电池容量检测模型的构建;
电池容量检测模型的预测结果由内部所有决策树的预测结果取平均值得到,也即最终回归分数即为随机森林回归模型的预测结果,决策树的预测过程包括以下步骤:
步骤一,针对输入样本,从决策树的根节点起,判断当前节点是否为叶子节点,如果是则返回叶子节点的预测值,即当前叶子中样本目标变量的平均值,如果不是则进入下一步;
步骤二、根据当前节点的切分变量和切分值,将样本中对应变量的值与节点的切分值对比;如果样本变量值小于等于当前节点切分值,则访问当前节点的左子节点;如果样本变量值大于当前节点切分值,则访问当前节点的右子节点;
循环步骤二,直到访问到叶子节点,并返回叶子节点的预测值;
其中,随机森林回归模型还包括计算数据特征重要性,特征的重要性表示对预测结果的影响程度,包括以下步骤:
使用训练数据集中训练数据训练模型,计算训练数据在模型上依据度量标准的评分,记为;
遍历训练数据集中每一特征,每次在原训练数据集的基础上将对应的特征进行打乱操作,然后通过模型得到打乱后的训练数据集中训练数据的评分,记为;
最后通过计算出第i个特征的重要性,选取特征重要性大于0.1的值作为新特征重新训练电池容量检测模型;
S4、将新采集的电池数据输入到完成评估后的电池容量检测模型中,即可实现对电池容量的实时在线检测。
2.根据权利要求1所述的一种基于机器学习的三元锂电池容量检测方法,其特征在于,所述频域数据为:
;
其中,为频域数据,/>为粉红噪声的频率,B为粉红噪声的幅度,/>为粉红噪声的频率指数因子,C为复合噪声的幅度,/>为粉红噪声和复合噪声的转折频率,/>为粉红噪声和复合噪声的指数因子。
3.根据权利要求1-2任意一项所述的一种基于机器学习的三元锂电池容量检测方法,其特征在于,所述步骤S1获取电池数据,并基于所述电池数据构建数据集之后,还包括:数据预处理,识别所述数据集中异常、缺失及标注错误的电池数据,并进行删除。
4.根据权利要求1-2任意一项所述的一种基于机器学习的三元锂电池容量检测方法,其特征在于,所述步骤S2将所述数据集进行数据降维,具体为:
编码,提取所述数据集中电池数据的有效特征;
解码,将提取的所述有效特征进行重构,得到数据降维后的数据集。
5.根据权利要求4所述的一种基于机器学习的三元锂电池容量检测方法,其特征在于,所述步骤S2中标准化处理,具体为:将经过数据降维后的数据集中的电池数据进行数据归一化,将电池数据映射到0-1。
6.根据权利要求1-2任意一项所述的一种基于机器学习的三元锂电池容量检测方法,其特征在于,所述电池容量检测模型采用自主采样法进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310744741.XA CN116500456B (zh) | 2023-06-25 | 2023-06-25 | 一种基于机器学习的三元锂电池容量检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310744741.XA CN116500456B (zh) | 2023-06-25 | 2023-06-25 | 一种基于机器学习的三元锂电池容量检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116500456A CN116500456A (zh) | 2023-07-28 |
CN116500456B true CN116500456B (zh) | 2023-10-10 |
Family
ID=87318677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310744741.XA Active CN116500456B (zh) | 2023-06-25 | 2023-06-25 | 一种基于机器学习的三元锂电池容量检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116500456B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113125960A (zh) * | 2019-12-31 | 2021-07-16 | 河北工业大学 | 一种基于随机森林模型的车载锂离子电池荷电状态预测方法 |
CN114221619A (zh) * | 2021-06-30 | 2022-03-22 | 东莞豪泽电子科技有限公司 | 一种基于低频噪声的太阳能电池可靠性分类方法 |
CN116068402A (zh) * | 2022-12-23 | 2023-05-05 | 星河智联汽车科技有限公司 | 新能源汽车锂电池状态预测方法、装置、设备及存储介质 |
-
2023
- 2023-06-25 CN CN202310744741.XA patent/CN116500456B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113125960A (zh) * | 2019-12-31 | 2021-07-16 | 河北工业大学 | 一种基于随机森林模型的车载锂离子电池荷电状态预测方法 |
CN114221619A (zh) * | 2021-06-30 | 2022-03-22 | 东莞豪泽电子科技有限公司 | 一种基于低频噪声的太阳能电池可靠性分类方法 |
CN116068402A (zh) * | 2022-12-23 | 2023-05-05 | 星河智联汽车科技有限公司 | 新能源汽车锂电池状态预测方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
锂亚硫酰氯电池的低频噪声测试;孙志端 等;电池;第532页摘要,第533页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116500456A (zh) | 2023-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102106775B1 (ko) | 딥러닝을 이용한 전지 진단 방법 | |
CN116502112B (zh) | 一种新能源电源测试数据管理方法及系统 | |
CN113866642A (zh) | 一种基于梯度提升树的锂离子电池故障诊断方法 | |
CN113671394A (zh) | 一种锂离子电池期望寿命预测方法及系统 | |
CN111062620B (zh) | 基于混合计费数据的电力计费公平性智能分析系统及方法 | |
CN113821976A (zh) | 一种基于集成算法的锂电池故障诊断建模方法 | |
CN112308436A (zh) | 一种配电网评估诊断分析方法、装置、设备及存储介质 | |
CN116306806A (zh) | 故障诊断模型确定方法、装置及非易失性存储介质 | |
CN114720899A (zh) | 退役电池梯次利用分选方法及系统、电子设备、存储介质 | |
CN114167284A (zh) | 基于bms大数据和集成学习的锂电池rul预测方法及设备 | |
CN115480180A (zh) | 一种新能源电池健康诊断分析方法 | |
Tan et al. | Intelligent online health estimation for lithium-ion batteries based on a parallel attention network combining multivariate time series | |
CN113918642A (zh) | 一种基于电力物联网设备的数据过滤监测预警方法 | |
CN116295948A (zh) | 大温差环境下工业温度传感器的异常检测方法、系统及存储介质 | |
CN113533995B (zh) | 一种动力电池一致性检测方法 | |
CN113076689B (zh) | 一种基于自动编码器的电池状态评估方法 | |
CN114548493A (zh) | 一种电能表电流过载预测方法与系统 | |
CN114325433A (zh) | 基于电化学阻抗谱测试的锂离子电池故障检测方法和系统 | |
CN114330486A (zh) | 基于改进Wasserstein GAN的电力系统不良数据辨识方法 | |
CN116500456B (zh) | 一种基于机器学习的三元锂电池容量检测方法 | |
CN116910655A (zh) | 一种基于装置量测数据的智能电能表故障预测方法 | |
CN115128468A (zh) | 一种化学储能电池phm欠压故障预测方法 | |
CN111881259A (zh) | 一种基于文本挖掘的设备故障概率评估方法及系统 | |
CN111537889A (zh) | 一种数据驱动的梯次电池rul预测与分类方法 | |
CN117406007B (zh) | 一种充电桩充电数据检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |