CN110850297A - 一种通过大数据预测轨交锂电池soh的方法 - Google Patents
一种通过大数据预测轨交锂电池soh的方法 Download PDFInfo
- Publication number
- CN110850297A CN110850297A CN201910901073.0A CN201910901073A CN110850297A CN 110850297 A CN110850297 A CN 110850297A CN 201910901073 A CN201910901073 A CN 201910901073A CN 110850297 A CN110850297 A CN 110850297A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- soh
- battery
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 title claims abstract description 13
- 229910052744 lithium Inorganic materials 0.000 title claims abstract description 13
- 230000004083 survival effect Effects 0.000 claims abstract description 46
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 35
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000004364 calculation method Methods 0.000 claims abstract description 20
- 230000008569 process Effects 0.000 claims abstract description 17
- 238000004140 cleaning Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000012795 verification Methods 0.000 claims abstract description 9
- 238000011156 evaluation Methods 0.000 claims abstract description 8
- 238000009826 distribution Methods 0.000 claims description 29
- 230000000694 effects Effects 0.000 claims description 29
- 230000002776 aggregation Effects 0.000 claims description 18
- 238000004220 aggregation Methods 0.000 claims description 18
- 230000002159 abnormal effect Effects 0.000 claims description 15
- 238000005096 rolling process Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 7
- 238000012512 characterization method Methods 0.000 claims description 5
- 238000002790 cross-validation Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 claims description 3
- 238000000528 statistical test Methods 0.000 claims description 3
- 238000010200 validation analysis Methods 0.000 claims 1
- 238000010801 machine learning Methods 0.000 abstract description 6
- 238000012423 maintenance Methods 0.000 abstract description 3
- 238000005457 optimization Methods 0.000 abstract 1
- 238000012360 testing method Methods 0.000 description 12
- 238000007599 discharging Methods 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 7
- 101150014715 CAP2 gene Proteins 0.000 description 6
- 101100260872 Mus musculus Tmprss4 gene Proteins 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000036541 health Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 101150077194 CAP1 gene Proteins 0.000 description 2
- 101100245221 Mus musculus Prss8 gene Proteins 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/36—Arrangements for testing, measuring or monitoring the electrical condition of accumulators or electric batteries, e.g. capacity or state of charge [SoC]
- G01R31/367—Software therefor, e.g. for battery testing using modelling or look-up tables
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/005—Testing of electric installations on transport means
- G01R31/008—Testing of electric installations on transport means on air- or spacecraft, railway rolling stock or sea-going vessels
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/36—Arrangements for testing, measuring or monitoring the electrical condition of accumulators or electric batteries, e.g. capacity or state of charge [SoC]
- G01R31/382—Arrangements for monitoring battery or accumulator variables, e.g. SoC
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/36—Arrangements for testing, measuring or monitoring the electrical condition of accumulators or electric batteries, e.g. capacity or state of charge [SoC]
- G01R31/382—Arrangements for monitoring battery or accumulator variables, e.g. SoC
- G01R31/3828—Arrangements for monitoring battery or accumulator variables, e.g. SoC using current integration
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/36—Arrangements for testing, measuring or monitoring the electrical condition of accumulators or electric batteries, e.g. capacity or state of charge [SoC]
- G01R31/392—Determining battery ageing or deterioration, e.g. state of health
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Secondary Cells (AREA)
- Tests Of Electric Status Of Batteries (AREA)
Abstract
本发明涉及轨道交通锂电池维护技术领域,尤其是一种通过大数据预测轨交锂电池SOH的方法;该方法由相应的应用架构、流程、计算模型组成。这种方法首先对电动轨道交通电池运行过程中采集的电池实时数据,以及电动轨道交通车辆其它的运行数据,进行数据整理和清洗,并对数据进行特征化处理,通过大数据机器学习建立模型和训练验证算法,其中建模主要使用了非线性混合算法模型和生存模型,并对结果进行不同角度的评估和优化,从而建立电动轨道交通电池SOH预测的模型,优化电池的维修和更换,提高车主的安全性指标,达到系统性能和经济效益的平衡。
Description
技术领域
本发明涉及轨道交通锂电池维护技术领域,尤其是一种通过大数据预测轨交锂电池SOH 的方法。
背景技术
电池的健康度(SOH,State of Health),是指在一定条件下,电池使用一段时间后某些直接可测或间接计算得到的性能参数的实际值与标称值的比值,用来判断电池健康状况,一般以百分比的形式表现。SOH不仅仅与电池本身的电化学体系和电池制造工艺相关,还与轨道交通行驶工况和电池组内部的工作环境相关。
部分轨道交通方式采用锂电池组作为动力源,故电池的健康程度关乎该方式下的轨道交通安全。
业内大多采用脉冲电压跌落值等方式进行SOH的预估,这些技术方案都没有利用历史数据,对于未来可能出现的情况判断较为粗略,并不符合电池内部的变化规律。
发明内容
针对现有技术的不足,本发明提供一种在依赖于轨道交通数据采集的长周期情况下,从电池的额定信息和状态监测数据(电压、电流、温度、SOC等)挖掘其中隐含的电池健康状态信息及其演变规律,实现电池SOH预测的方法。
本发明的技术方案为:
一种通过大数据预测轨交锂电池SOH的方法,它包括以下步骤:
S001数据准备步骤,获取与轨道交通电池使用相关的数据。
在本步骤中,所述轨道交通电池的数据包括轨道交通的监控数据,监控数据每十秒采集一次,在轨道交通的不同整车状态中,例如行驶、充电过程中,都会产生。所述电池的监控数据包括在正常使用时与电池相关的电池自身数据以及轨道交通状态数据,一共超过200个数据变量。
所述电池的使用数据均是基于时间序列的流式数据,包括进行机器学习相关的电流、电压、温度、剩余电量(SOC)等。
S002数据整理步骤,对所述轨道交通电池使用相关的数据进行清洗并将清洗后的所述轨道交通电池使用相关的数据基于时间单元进行数据构建。
清洗方法:
首先将所有采集到的数据导入Matlab中进行全部数据的自动补全,其好处是无需人工干涉,自动生成;然后是采用统计方法来检测所述数据的数值型属性,计算字段值的均值和标准差,利用每个字段的置信区间来识别异常字段和记录,采用聚类方法用于检测异常记录,发现不符合现有模式的异常记录或者关联规则方法发现数据集中不符合具有高置信度和支持度规则的异常数据;所有异常数据剔除,然后再次将所有数据导入Matlab进行二次补全,由于Matlab进行数据补全的时候会进行平滑处理,故数据连续性强,不影响后续建模。
S003数据特征化步骤,将通过数据整理步骤得到的数据进行总结和抽取,获取特征化后的数据。
由于在后续的处理步骤中需要对数据进行处理和计算,为了便于计算和识别数据的特征,首先需要对整理后的数据进行特征化以便于显现所述数据的各种特征从而便于计算和识别。
在本步骤中,对于数据的总结和抽取包括滚动聚合。所述滚动聚合是指设定一个时间窗口,计算在预定的变量在该时间窗口内的聚合值,所述聚合值可以是数据的总和、平均值或者是标准差。例如t1节点,设定时间窗是3,它的滚动聚合就是计算t1节点以及在所述t1 节点之间的3个节点的总和、均值或者标准差。
在本步骤中,为了能够对学习算法提供更好,甚至是附加的学习和预测能力,需要更多变量数据,发明从基于时间序列的电池数据进行总结和抽取,从而将初始的S001中的特征变量进行扩展。例如,在步骤S001中具有126个特征变量时,在本示例中,进行扩展的数据主要是两类:第一大类是对初始126个特征变量根据滚动聚合的均值,增加126-2=124个;第二类是对初始的126个特征变量根据滚动聚合的标准差,增加126-2=124个;这样最后获得的变量为126+124+124=374个。这样就能够提供更多变量数据,从而有利于学习算法提供更好和预测能力。
S004目标确定步骤,计算用于学习的SOH值,并进行特定点捕捉用于校验。
对于每一条电池数据的采集记录,经过特征化后,需要进行目标值,即SOH的计算。
第一步:得到电池基本数据,用于计算第二步和第三步中的SOH
所述基本数据,也可以称为出厂数据,包括:电池容量(Cap_BOL)、电池容量与温度的对应关系表以及电池理想工况下循环次数与容量衰减的对应关系表。
所述电池容量可以由电池厂提供,因为一般的电池都会标注容量;电池容量与温度的对应关系表,也可以由电池厂提供,若无法提供,通过数据去学习温度T与电池容量Cap关系表(充电时SOC从20%以下到100%);电池理想工况下循环次数与容量衰减的对应关系表中的理想情况是指电池1C放电,0.5C充电(其中所述C是指是电池放电速率),在25℃的环境下,放电到0%SOC,一次充放电算循环一次。
第二步:统计t时刻的SOH
从电池出厂开始运行时开始统计吞吐量其中Δt为采样时间间隔,包含了所有的充电和放电过程,It为充放电时电流,充电时It为负,放电时It为正。由于在电池的实际运作过程中并不处于25℃,1C放电,0.5C充电,满充满放的理想情况下,所以需要根据当前实际的SOC(剩余电量),T(温度),C(电池放电速率),通过查第一步的容量和温度对应关系表得到衰减系数P,故实际吞吐量为此时电池的理想状态下充放电循环次数为然后依据循环次数与容量衰减Cap Fade Curve查出Nt对应的 Capt,t时刻的SOH可表示为
第三步:捕捉SOC从20%以下充电到100%
此过程主要用于校验用,对第二步的SOH进行校验。
以一次有效捕捉为例:记充电开始的信息:时间t0,SOC0,记充电结束的信息:时间t1, SOC1=100,温度T1,电压V1计算步骤如下:
首先计算电池容量:Cap0=∑tIt*Δt,其中△t为采集时间间隔,充电过程中对电流It按时间t积分,因为电池SOC是从SOC0(非放空状态)充电到100%,故需要跟理想情况下SOC从0充电到100%作对比,故需要做一次折算得到电池容量Cap1,公式如下:
因为SOC充电到100%时温度是T1,而需要跟理想情况下25℃作对比,故需要做第二次运算,系数q根据电池容量与温度的对应关系表,得到最终修正的电池容量Cap2为:
评估充电充满时的电压一致性,单体电压极差和电压标准差,对容量衰减的原因进行一致性方面的分析,若Cap2低可能是一致性差,故需先评估一致性,若一致性好,Cap2低是因为本身电池性能变差;得到本次充电充满时的SOH为:
通过上述三个步骤,对每个电池数据都进行了SOH的计算,其中第三步中获得的SOH主要用于对第二步中获得的SOHt进行校验,然后将第二步中获得的SOHt作为学习的目标。
S005数据计算步骤,基于特征化后的数据建立电池SOH预测的模型。
对于电池SOH预测的问题,本具体实施方式中采用非线性混合效应模型和生存模型来建立所述电池预测SOH模型。
该模型从一组样本数据出发,确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著。
以t时刻的SOHt作为Y,对每个数据从时间上进行标签化;经过步骤S001、S002和S003 后得到的数据设为x,建立模型Y=f(x),其中f()为机器基于大数据学习得到的模型;在轨道交通实际的运行和使用过程中,电池SOH是难以实时监测的,目前传统的方法主要是基于现有的经验公式来大致预测SOH,此种方法主要的缺点为,首先不能实时计算SOH且精度不高,而且由于单体差异性,不能对每一个单体SOH很好地预测。基于大数据建立的模型可以很好地解决以上的问题。模型的输入为时间t以及t时刻采集的数据,模型的输出为t时刻电池 SOHt,在轨道交通实时运行和使用过程中,依据采集的数据x即可以准确的利用模型推出SOHt。
其中非线性混合效应模型,是线性混合效应模型的一种扩展,其固定效应和随机效应部分均可以以非线性的形式纳入模型,相对于线性模型的正态假定,非线性模型对资料的分布无特殊要求,资料可以是正态分布,也可以是二项分布、Poisson分布,同时非线性混合效应模型在对缺失数据的处理上具有更好的稳健性。其算法的模型为Y=f(x+Φ)+e,其中f ()为非线性函数,Φ=Aβ+Bb中A,B为设计的矩阵,β为固定效应参数向量和b为随机效应参数向量,e为误差向量,其中β为输入数据x中对于电池SOH预测相关的固定效应数据,而b则为对于SOH预测不相关的随机效应数据。其参数A和B的估计可以通过伪数据步和线性混合效应步两步之间的迭代完成,可分别使用Gauss-Newton迭代法和EM算法解决。由于轨道交通在日常的使用过程中,电池容量是在不断的衰减,而且是动态非线性的变化,所以非线性混合效应模型模型中的非线性函数可以更好的拟合动态非线性的电池容量变化,而且由于采集的电池参数中有部分参数与电池容量存在相关性,而部分没有属于随即分布,所以在非线性混合效应模型中的固定效应项和随即效应项则可以很好地去描述两类参数。
其中生存分析就是用来研究生存时间的分布规律以及生存时间和相关因素之间关系,根据试验或调查得到的数据,对生物或人等的生存时间进行分析和推断。生存分析的研究集中在预测反应的概率、生存概率、平均寿命。主要方法有:描述法、非参数法、参数法、半参数法。其中描述法根据样本观测值提供的信息,直接用公式计算出每一个时间点或每一个时间区间上的生存函数、死亡函数、风险函数等,并采用列表或绘图的形式显示生存时间的分布规律;非参数法估计生存函数时对生存时间的分布没有要求,并且检验危险因素对生存时间的影响时采用的是非参数检验方法;参数法根据样本观测值来估计假定的分布模型中的参数,获得生存时间的概率分布模型;半参数法不需要对生存时间的分布做出假定,但是却可以通过一个模型来分析生存时间的分布规律,以及危险因素对生存时间的影响。生存模型算法中其中t为电池的使用时间,x为基于时间序列采集的数据,f(x)为研究对象生存时间分布的概率密度函数,S(t)为研究对象生存时间长于t的概率。SOH的算法模型为Y=f(S(t),x),其中f()为生存算法模型。由于电池的SOH从初始的100%到退役时的80%,相当于一个从出生到死亡生存的过程,因此在大数据建模过程中,根据建模得到的概率密度分布函数,则可以很好地预测基于SOH参数的电池寿命。
在本实施方案中,非线性混合效应模型和生存模型并行进行,根据最后S007的效果来选择最合适的模型,并且这种选择也是动态调整的。
S006训练验证步骤,对模型进行训练和验证以优化该自适应模型。
在建立上述模型的基础上,需要进行训练和验证的工作来优化模型。以便提高模型的准确性。
在本具体实施方式中,所述训练验证步骤优选包括交叉验证和少数类采样。
所述交叉验证方法中对于各个模型的参数框架进行优化。算法的可靠性依赖参数框架,就是说哪些电池数据对于产生的结果是最有效的。
在本具体实施方式中,为了提高参数框架的质量,首先把原始的数据随机分成K个部分。在这K个部分中,选择其中一个部分作为测试数据,剩下的K-1个部分作为训练数据得到相应的实验结果。然后,挑选另外一个部分作为测试数据,剩下的K-1个部分作为训练数据,以此类推,重复进行K次交叉检验的。每次实验都从K个部分中选择一个不同的部分作为测试数据,保证K个部分的数据都分别做过测试数据,剩下的K-1个当作训练数据进行实验。最后把得到的K个实验结果平均,所述实验结果可以为预测值和校验值的差值,使得差值越小越好,从而确定最佳的分类,实现模型的训练。在本应用中,可以将获得轨道交通的数据随即分成K个部分,首先将其中K-1个部分的数据用于建立SOH预测模型,然后利用新建模型去验证剩下最后一部分的数据是否满足该模型。以此类推。
所述少数类采样是针对一类数据仅仅有很少数量的训练样本时,数据集不平衡的情况时采用的。当一类数据仅仅有少量的训练样本时,本具体实施方式中可以通过将少数的故障样本数据合成新的少数类样本数据来进行模型的训练。例如在电池的数据收集中,当只采集到少量样本时,为了从少量数据中产生更多进行机器学习的数据,需要进行数据合成。具体而言,对每个少数类样本A,从它的最近邻中随机选一个样本B,这里的距离是根据时间和变量图中的距离进行计算,然后在A和B之间的连线上随机选择一点作为新合成的少数类样本。通过这样不断的合成,可以将少量的样本A,变成具备多数据的样本A+,从而达到预测电池 SOH的数据要求,即不会产生计算中的因为数据不平衡导致的过拟合或者扭曲。
S007算法评估步骤,评估数据在不同算法下的预测结果,基于评估选择最优的算法。
在电池SOH预测中,基于不同的预测目标或者是不同的数据源,采用不同的算法所得到的结果也是不同的,这样就需要针对不同的情况选择较佳的算法。
通常在SOH预测中,可以使用预测值和S004中的校验值的差值,评估预测结果,比较在不同情况下采用不同的算法所得到的结果是否最优,从而选择最优的算法。
其中,差值是针对预测结果而言所述模型预测电池SOH和校验值的差距是多少,一般是越低越好。
本发明的有益效果为:针对该核心问题进行数据的获取和标定、以及进行数据整合和特征工程,明确数据定义并进行初步处理,通过预定义的规则进行特征和标签的定义。最后是进行模型训练和评估,通过数据导入,利用机器学习的不同模型,选择不同算法进行匹配验证,并进行发布,成为结构化的产品,并随着时间累积和数据丰富,模型的预测准确性会不断提升。
附图说明
图1为本发明的示意图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明:
如图1所示,一种通过大数据预测轨交锂电池SOH的方法,它包括以下步骤:
S001数据准备步骤,获取与轨道交通电池使用相关的数据。
在本步骤中,所述轨道交通电池的数据包括轨道交通的监控数据,监控数据每十秒采集一次,在轨道交通的不同整车状态中,例如行驶、充电过程中,都会产生。所述电池的监控数据包括在正常使用时与电池相关的电池自身数据以及轨道交通状态数据,一共超过200个数据变量。
所述电池的使用数据均是基于时间序列的流式数据,包括进行机器学习相关的电流、电压、温度、剩余电量(SOC)等。
S002数据整理步骤,对所述轨道交通电池使用相关的数据进行清洗并将清洗后的所述轨道交通电池使用相关的数据基于时间单元进行数据构建。
清洗方法:
首先将所有采集到的数据导入Matlab中进行全部数据的自动补全,其好处是无需人工干涉,自动生成;然后是采用统计方法来检测所述数据的数值型属性,计算字段值的均值和标准差,利用每个字段的置信区间来识别异常字段和记录,采用聚类方法用于检测异常记录,发现不符合现有模式的异常记录或者关联规则方法发现数据集中不符合具有高置信度和支持度规则的异常数据;所有异常数据剔除,然后再次将所有数据导入Matlab进行二次补全,由于Matlab进行数据补全的时候会进行平滑处理,故数据连续性强,不影响后续建模。
S003数据特征化步骤,将通过数据整理步骤得到的数据进行总结和抽取,获取特征化后的数据。
由于在后续的处理步骤中需要对数据进行处理和计算,为了便于计算和识别数据的特征,首先需要对整理后的数据进行特征化以便于显现所述数据的各种特征从而便于计算和识别。
在本步骤中,对于数据的总结和抽取包括滚动聚合。所述滚动聚合是指设定一个时间窗口,计算在预定的变量在该时间窗口内的聚合值,所述聚合值可以是数据的总和、平均值或者是标准差。例如t1节点,设定时间窗是3,它的滚动聚合就是计算t1节点以及在所述t1 节点之间的3个节点的总和、均值或者标准差。
在本步骤中,为了能够对学习算法提供更好,甚至是附加的学习和预测能力,需要更多变量数据,发明从基于时间序列的电池数据进行总结和抽取,从而将初始的S001中的特征变量进行扩展。例如,在步骤S001中具有126个特征变量时,在本示例中,进行扩展的数据主要是两类:第一大类是对初始126个特征变量根据滚动聚合的均值,增加126-2=124个;第二类是对初始的126个特征变量根据滚动聚合的标准差,增加126-2=124个;这样最后获得的变量为126+124+124=374个。这样就能够提供更多变量数据,从而有利于学习算法提供更好和预测能力。
S004目标确定步骤,计算用于学习的SOH值,并进行特定点捕捉用于校验。
对于每一条电池数据的采集记录,经过特征化后,需要进行目标值,即SOH的计算。
第一步:得到电池基本数据,用于计算第二步和第三步中的SOH
所述基本数据,也可以称为出厂数据,包括:电池容量(Cap_BOL)、电池容量与温度的对应关系表以及电池理想工况下循环次数与容量衰减的对应关系表。
所述电池容量可以由电池厂提供,因为一般的电池都会标注容量;电池容量与温度的对应关系表,也可以由电池厂提供,若无法提供,通过数据去学习温度T与电池容量Cap关系表(充电时SOC从20%以下到100%);电池理想工况下循环次数与容量衰减的对应关系表中的理想情况是指电池1C放电,0.5C充电(其中所述C是指是电池放电速率),在25℃的环境下,放电到0%SOC,一次充放电算循环一次。
第二步:统计t时刻的SOH
从电池出厂开始运行时开始统计吞吐量其中Δt为采样时间间隔,包含了所有的充电和放电过程,It为充放电时电流,充电时It为负,放电时It为正。由于在电池的实际运作过程中并不处于25℃,1C放电,0.5C充电,满充满放的理想情况下,所以需要根据当前实际的SOC(剩余电量),T(温度),C(电池放电速率),通过查第一步的容量和温度对应关系表得到衰减系数P,故实际吞吐量为此时电池的理想状态下充放电循环次数为然后依据循环次数与容量衰减Cap Fade Curve查出Nt对应的 Capt,t时刻的SOH可表示为
第三步:捕捉SOC从20%以下充电到100%
此过程主要用于校验用,对第二步的SOH进行校验。
以一次有效捕捉为例:记充电开始的信息:时间t0,SOC0,记充电结束的信息:时间t1, SOC1=100,温度T1,电压V1计算步骤如下:
首先计算电池容量:Cap0=∑tIt*Δt,其中△t为采集时间间隔,充电过程中对电流It按时间t积分,因为电池SOC是从SOC0(非放空状态)充电到100%,故需要跟理想情况下SOC从0充电到100%作对比,故需要做一次折算得到电池容量Cap1,公式如下:
因为SOC充电到100%时温度是T1,而需要跟理想情况下25℃作对比,故需要做第二次运算,系数q根据电池容量与温度的对应关系表,得到最终修正的电池容量Cap2为:
评估充电充满时的电压一致性,单体电压极差和电压标准差,对容量衰减的原因进行一致性方面的分析,若Cap2低可能是一致性差,故需先评估一致性,若一致性好,Cap2低是因为本身电池性能变差;得到本次充电充满时的SOH为:
通过上述三个步骤,对每个电池数据都进行了SOH的计算,其中第三步中获得的SOH主要用于对第二步中获得的SOHt进行校验,然后将第二步中获得的SOHt作为学习的目标。
S005数据计算步骤,基于特征化后的数据建立电池SOH预测的模型。
对于电池SOH预测的问题,本具体实施方式中采用非线性混合效应模型和生存模型来建立所述电池预测SOH模型。
该模型从一组样本数据出发,确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著。
以t时刻的SOHt作为Y,对每个数据从时间上进行标签化;经过步骤S001、S002和S003 后得到的数据设为x,建立模型Y=f(x),其中f()为机器基于大数据学习得到的模型;在轨道交通实际的运行和使用过程中,电池SOH是难以实时监测的,目前传统的方法主要是基于现有的经验公式来大致预测SOH,此种方法主要的缺点为,首先不能实时计算SOH且精度不高,而且由于单体差异性,不能对每一个单体SOH很好地预测。基于大数据建立的模型可以很好地解决以上的问题。模型的输入为时间t以及t时刻采集的数据,模型的输出为t时刻电池 SOHt,在轨道交通实时运行和使用过程中,依据采集的数据x即可以准确的利用模型推出SOHt。
其中非线性混合效应模型,是线性混合效应模型的一种扩展,其固定效应和随机效应部分均可以以非线性的形式纳入模型,相对于线性模型的正态假定,非线性模型对资料的分布无特殊要求,资料可以是正态分布,也可以是二项分布、Poisson分布,同时非线性混合效应模型在对缺失数据的处理上具有更好的稳健性。其算法的模型为Y=f(x+Φ)+e,其中f ()为非线性函数,Φ=Aβ+Bb中A,B为设计的矩阵,β为固定效应参数向量和b为随机效应参数向量,e为误差向量,其中β为输入数据x中对于电池SOH预测相关的固定效应数据,而b则为对于SOH预测不相关的随机效应数据。其参数A和B的估计可以通过伪数据步和线性混合效应步两步之间的迭代完成,可分别使用Gauss-Newton迭代法和EM算法解决。由于轨道交通在日常的使用过程中,电池容量是在不断的衰减,而且是动态非线性的变化,所以非线性混合效应模型模型中的非线性函数可以更好的拟合动态非线性的电池容量变化,而且由于采集的电池参数中有部分参数与电池容量存在相关性,而部分没有属于随即分布,所以在非线性混合效应模型中的固定效应项和随即效应项则可以很好地去描述两类参数。
其中生存分析就是用来研究生存时间的分布规律以及生存时间和相关因素之间关系,根据试验或调查得到的数据,对生物或人等的生存时间进行分析和推断。生存分析的研究集中在预测反应的概率、生存概率、平均寿命。主要方法有:描述法、非参数法、参数法、半参数法。其中描述法根据样本观测值提供的信息,直接用公式计算出每一个时间点或每一个时间区间上的生存函数、死亡函数、风险函数等,并采用列表或绘图的形式显示生存时间的分布规律;非参数法估计生存函数时对生存时间的分布没有要求,并且检验危险因素对生存时间的影响时采用的是非参数检验方法;参数法根据样本观测值来估计假定的分布模型中的参数,获得生存时间的概率分布模型;半参数法不需要对生存时间的分布做出假定,但是却可以通过一个模型来分析生存时间的分布规律,以及危险因素对生存时间的影响。生存模型算法中其中t为电池的使用时间,x为基于时间序列采集的数据,f(x)为研究对象生存时间分布的概率密度函数,S(t)为研究对象生存时间长于t的概率。SOH的算法模型为Y=f(S(t),x),其中f()为生存算法模型。由于电池的SOH从初始的100%到退役时的80%,相当于一个从出生到死亡生存的过程,因此在大数据建模过程中,根据建模得到的概率密度分布函数,则可以很好地预测基于SOH参数的电池寿命。
在本实施方案中,非线性混合效应模型和生存模型并行进行,根据最后S007的效果来选择最合适的模型,并且这种选择也是动态调整的。
S006训练验证步骤,对模型进行训练和验证以优化该自适应模型。
在建立上述模型的基础上,需要进行训练和验证的工作来优化模型。以便提高模型的准确性。
在本具体实施方式中,所述训练验证步骤优选包括交叉验证和少数类采样。
所述交叉验证方法中对于各个模型的参数框架进行优化。算法的可靠性依赖参数框架,就是说哪些电池数据对于产生的结果是最有效的。
在本具体实施方式中,为了提高参数框架的质量,首先把原始的数据随机分成K个部分。在这K个部分中,选择其中一个部分作为测试数据,剩下的K-1个部分作为训练数据得到相应的实验结果。然后,挑选另外一个部分作为测试数据,剩下的K-1个部分作为训练数据,以此类推,重复进行K次交叉检验的。每次实验都从K个部分中选择一个不同的部分作为测试数据,保证K个部分的数据都分别做过测试数据,剩下的K-1个当作训练数据进行实验。最后把得到的K个实验结果平均,所述实验结果可以为预测值和校验值的差值,使得差值越小越好,从而确定最佳的分类,实现模型的训练。在本应用中,可以将获得轨道交通的数据随即分成K个部分,首先将其中K-1个部分的数据用于建立SOH预测模型,然后利用新建模型去验证剩下最后一部分的数据是否满足该模型。以此类推。
所述少数类采样是针对一类数据仅仅有很少数量的训练样本时,数据集不平衡的情况时采用的。当一类数据仅仅有少量的训练样本时,本具体实施方式中可以通过将少数的故障样本数据合成新的少数类样本数据来进行模型的训练。例如在电池的数据收集中,当只采集到少量样本时,为了从少量数据中产生更多进行机器学习的数据,需要进行数据合成。具体而言,对每个少数类样本A,从它的最近邻中随机选一个样本B,这里的距离是根据时间和变量图中的距离进行计算,然后在A和B之间的连线上随机选择一点作为新合成的少数类样本。通过这样不断的合成,可以将少量的样本A,变成具备多数据的样本A+,从而达到预测电池 SOH的数据要求,即不会产生计算中的因为数据不平衡导致的过拟合或者扭曲。
S007算法评估步骤,评估数据在不同算法下的预测结果,基于评估选择最优的算法。
在电池SOH预测中,基于不同的预测目标或者是不同的数据源,采用不同的算法所得到的结果也是不同的,这样就需要针对不同的情况选择较佳的算法。
通常在SOH预测中,可以使用预测值和S004中的校验值的差值,评估预测结果,比较在不同情况下采用不同的算法所得到的结果是否最优,从而选择最优的算法。
其中,差值是针对预测结果而言所述模型预测电池SOH和校验值的差距是多少,一般是越低越好。
上述实施例和说明书中描述的只是说明本发明的原理和最佳实施例,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
Claims (4)
1.一种通过大数据预测轨交锂电池SOH的方法,它包括以下步骤:
S001数据准备步骤,获取与轨道交通电池使用相关的数据;
S002数据整理步骤,对所述轨道交通电池使用相关的数据进行清洗并将清洗后的所述轨道交通电池使用相关的数据基于时间单元进行数据构建;
清洗方法:
首先将所有采集到的数据导入Matlab中进行全部数据的自动补全,然后是采用统计方法来检测所述数据的数值型属性,计算字段值的均值和标准差,利用每个字段的置信区间来识别异常字段和记录,采用聚类方法用于检测异常记录,发现不符合现有模式的异常记录或者关联规则方法发现数据集中不符合具有高置信度和支持度规则的异常数据;所有异常数据剔除,然后再次将所有数据导入Matlab进行二次补全;
S003数据特征化步骤,将通过数据整理步骤得到的数据进行总结和抽取,获取特征化后的数据;
S004目标确定步骤,计算用于学习的SOH值,并进行特定点捕捉用于校验;
S005数据计算步骤,基于特征化后的数据建立电池SOH预测的模型;
S006训练验证步骤,对模型进行训练和验证以优化该自适应模型;
所述训练验证步骤优选包括交叉验证和少数类采样;
S007算法评估步骤,评估数据在不同算法下的预测结果,基于评估选择最优的算法。
2.根据权利要求1所述的一种通过大数据预测轨交锂电池SOH的方法,其特征在于:所述S003中,首先需要对整理后的数据进行特征化以便于显现所述数据的各种特征从而便于计算和识别;
在本步骤中,对于数据的总结和抽取包括滚动聚合;所述滚动聚合是指设定一个时间窗口,计算在预定的变量在该时间窗口内的聚合值,所述聚合值可以是数据的总和、平均值或者是标准差;在本步骤中,从基于时间序列的电池数据进行总结和抽取,从而将初始的S001中的特征变量进行扩展。
3.根据权利要求1所述的一种通过大数据预测轨交锂电池SOH的方法,其特征在于:所述S004中,对于每一条电池数据的采集记录,经过特征化后,需要进行目标值,即SOH的计算;
第一步:得到电池基本数据,用于计算第二步和第三步中的SOH
第二步:统计t时刻的SOH
第三步:捕捉SOC从20%以下充电到100%
通过上述三个步骤,对每个电池数据都进行了SOH的计算,其中第三步中获得的SOH主要用于对第二步中获得的SOHt进行校验,然后将第二步中获得的SOHt作为学习的目标。
4.根据权利要求1所述的一种通过大数据预测轨交锂电池SOH的方法,其特征在于:所述S005中对于电池SOH预测的问题,本具体实施方式中采用非线性混合效应模型和生存模型来建立所述电池预测SOH模型;
该模型从一组样本数据出发,确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著;
以t时刻的SOHt作为Y,对每个数据从时间上进行标签化;经过步骤S001、S002和S003后得到的数据设为x,建立模型Y=f(x),其中f()为机器基于大数据学习得到的模型;模型的输入为时间t以及t时刻采集的数据,模型的输出为t时刻电池SOHt,在轨道交通实时运行和使用过程中,依据采集的数据x即可以准确的利用模型推出SOHt;
其中非线性混合效应模型,是线性混合效应模型的一种扩展,其固定效应和随机效应部分均可以以非线性的形式纳入模型,相对于线性模型的正态假定,非线性模型对资料的分布无特殊要求,资料可以是正态分布,也可以是二项分布、Poisson分布,同时非线性混合效应模型在对缺失数据的处理上具有更好的稳健性;其算法的模型为Y=f(x+Φ)+e,其中f()为非线性函数,Φ=Aβ+Bb中A,B为设计的矩阵,β为固定效应参数向量和b为随机效应参数向量,e为误差向量,其中β为输入数据x中对于电池SOH预测相关的固定效应数据,而b则为对于SOH预测不相关的随机效应数据;其参数A和B的估计可以通过伪数据步和线性混合效应步两步之间的迭代完成,可分别使用Gauss-Newton迭代法和EM算法解决;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910901073.0A CN110850297A (zh) | 2019-09-23 | 2019-09-23 | 一种通过大数据预测轨交锂电池soh的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910901073.0A CN110850297A (zh) | 2019-09-23 | 2019-09-23 | 一种通过大数据预测轨交锂电池soh的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110850297A true CN110850297A (zh) | 2020-02-28 |
Family
ID=69595987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910901073.0A Pending CN110850297A (zh) | 2019-09-23 | 2019-09-23 | 一种通过大数据预测轨交锂电池soh的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110850297A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111445991A (zh) * | 2020-03-31 | 2020-07-24 | 深圳市恒泰生命科学技术发展有限公司 | 一种基于细胞转录组数据进行临床免疫监测的方法 |
CN112327168A (zh) * | 2020-10-31 | 2021-02-05 | 国网河北省电力有限公司雄安新区供电公司 | 一种基于XGBoost的电动汽车电池消耗预测方法 |
CN112986839A (zh) * | 2021-02-25 | 2021-06-18 | 北京理工大学 | 基于置信区间的锂离子动力电池组的故障诊断方法与系统 |
CN116593896A (zh) * | 2023-01-30 | 2023-08-15 | 华北电力大学 | 一种电池储能系统的状态检测方法、系统及电子设备 |
WO2023194833A1 (en) * | 2022-04-08 | 2023-10-12 | Ses Holdings Pte. Ltd. | Methods of operating electrochemical storage devices based on anomaly clustering, and software and systems including same |
CN117236507A (zh) * | 2023-09-25 | 2023-12-15 | 广州汇锦能效科技有限公司 | 一种城市公交绿色智慧能源管理系统、方法及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105183814A (zh) * | 2015-08-27 | 2015-12-23 | 湖南人文科技学院 | 一种物联网数据清洗方法 |
CN106250556A (zh) * | 2016-08-17 | 2016-12-21 | 贵州数据宝网络科技有限公司 | 用于大数据分析的数据挖掘方法 |
CN106776951A (zh) * | 2016-12-02 | 2017-05-31 | 航天星图科技(北京)有限公司 | 一种清洗对比入库方法 |
CN109584553A (zh) * | 2018-11-29 | 2019-04-05 | 中电海康集团有限公司 | 一种基于时空信息的路段关联度缺失补全方法 |
CN109934294A (zh) * | 2019-03-18 | 2019-06-25 | 常伟 | 一种基于大数据机器学习进行电动汽车电池soh预测的方法 |
CN109934408A (zh) * | 2019-03-18 | 2019-06-25 | 常伟 | 一种基于大数据机器学习进行汽车电池rul预测的应用分析方法 |
-
2019
- 2019-09-23 CN CN201910901073.0A patent/CN110850297A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105183814A (zh) * | 2015-08-27 | 2015-12-23 | 湖南人文科技学院 | 一种物联网数据清洗方法 |
CN106250556A (zh) * | 2016-08-17 | 2016-12-21 | 贵州数据宝网络科技有限公司 | 用于大数据分析的数据挖掘方法 |
CN106776951A (zh) * | 2016-12-02 | 2017-05-31 | 航天星图科技(北京)有限公司 | 一种清洗对比入库方法 |
CN109584553A (zh) * | 2018-11-29 | 2019-04-05 | 中电海康集团有限公司 | 一种基于时空信息的路段关联度缺失补全方法 |
CN109934294A (zh) * | 2019-03-18 | 2019-06-25 | 常伟 | 一种基于大数据机器学习进行电动汽车电池soh预测的方法 |
CN109934408A (zh) * | 2019-03-18 | 2019-06-25 | 常伟 | 一种基于大数据机器学习进行汽车电池rul预测的应用分析方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111445991A (zh) * | 2020-03-31 | 2020-07-24 | 深圳市恒泰生命科学技术发展有限公司 | 一种基于细胞转录组数据进行临床免疫监测的方法 |
CN112327168A (zh) * | 2020-10-31 | 2021-02-05 | 国网河北省电力有限公司雄安新区供电公司 | 一种基于XGBoost的电动汽车电池消耗预测方法 |
CN112986839A (zh) * | 2021-02-25 | 2021-06-18 | 北京理工大学 | 基于置信区间的锂离子动力电池组的故障诊断方法与系统 |
WO2023194833A1 (en) * | 2022-04-08 | 2023-10-12 | Ses Holdings Pte. Ltd. | Methods of operating electrochemical storage devices based on anomaly clustering, and software and systems including same |
CN116593896A (zh) * | 2023-01-30 | 2023-08-15 | 华北电力大学 | 一种电池储能系统的状态检测方法、系统及电子设备 |
CN116593896B (zh) * | 2023-01-30 | 2023-12-01 | 华北电力大学 | 一种电池储能系统的状态检测方法、系统及电子设备 |
CN117236507A (zh) * | 2023-09-25 | 2023-12-15 | 广州汇锦能效科技有限公司 | 一种城市公交绿色智慧能源管理系统、方法及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110850297A (zh) | 一种通过大数据预测轨交锂电池soh的方法 | |
Deng et al. | Battery health estimation with degradation pattern recognition and transfer learning | |
JP5203394B2 (ja) | 蓄電池の性能を分析するためのエキスパート診断方法 | |
CN112904219B (zh) | 一种基于大数据的动力电池健康状态的预测方法 | |
CN109934294A (zh) | 一种基于大数据机器学习进行电动汽车电池soh预测的方法 | |
CN108664700B (zh) | 基于不确定数据包络分析的加速退化信息融合建模方法 | |
US20110191278A1 (en) | System and method for estimating long term characteristics of battery | |
CN110609233A (zh) | 一种基于大数据进行储能电池soh预测的方法 | |
CN114651183A (zh) | 电池性能预测 | |
US20230059529A1 (en) | Characterization of Rechargeable Batteries Using Machine-Learned Algorithms | |
WO2023024851A1 (zh) | 电池均衡方法及系统 | |
CN114236393A (zh) | 基于大数据的在线检测电池异常的方法及系统 | |
US20230305073A1 (en) | Method and apparatus for providing a predicted aging state of a device battery based on a predicted usage pattern | |
CN114462259B (zh) | 基于soc的电池剩余寿命预测方法、系统、汽车及介质 | |
CN114114039A (zh) | 一种电池系统的单体电芯一致性的评估方法和装置 | |
CN114545234A (zh) | 一种基于电池温度梯度变化监测电池状态的方法 | |
CN115366683A (zh) | 一种新能源汽车动力电池多维模型融合的故障诊断策略 | |
CN115219932A (zh) | 用于评价设备电池组的相对老化状态的方法和装置 | |
CN113820615A (zh) | 一种电池健康度检测方法与装置 | |
CN117805649A (zh) | 基于soh量化电池容量衰减对异常电芯进行识别的方法 | |
CN114036647A (zh) | 一种基于实车数据的动力电池安全风险评估方法 | |
Wang et al. | Dynamic early recognition of abnormal lithium-ion batteries before capacity drops using self-adaptive quantum clustering | |
CN116482540A (zh) | 电池电压不一致性的分析预测方法、装置及系统 | |
CN110596595A (zh) | 一种通过大数据预测轨交锂电池rul的方法 | |
CN112327169B (zh) | 一种锂电池剩余寿命预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |