CN116680992B - 建立电芯容量预测模型的方法、装置、计算机设备及介质 - Google Patents
建立电芯容量预测模型的方法、装置、计算机设备及介质 Download PDFInfo
- Publication number
- CN116680992B CN116680992B CN202310936905.9A CN202310936905A CN116680992B CN 116680992 B CN116680992 B CN 116680992B CN 202310936905 A CN202310936905 A CN 202310936905A CN 116680992 B CN116680992 B CN 116680992B
- Authority
- CN
- China
- Prior art keywords
- machine learning
- sample data
- cell capacity
- learning models
- super
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000010801 machine learning Methods 0.000 claims abstract description 169
- 238000011156 evaluation Methods 0.000 claims abstract description 75
- 238000012549 training Methods 0.000 claims abstract description 35
- 238000004519 manufacturing process Methods 0.000 claims description 67
- 238000003860 storage Methods 0.000 claims description 24
- 238000003066 decision tree Methods 0.000 claims description 14
- 230000015572 biosynthetic process Effects 0.000 claims description 13
- 238000007637 random forest analysis Methods 0.000 claims description 12
- 239000002994 raw material Substances 0.000 claims description 12
- 238000012706 support-vector machine Methods 0.000 claims description 12
- 238000012417 linear regression Methods 0.000 claims description 10
- 230000001419 dependent effect Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000005096 rolling process Methods 0.000 claims description 7
- 238000000576 coating method Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 5
- 239000011248 coating agent Substances 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 9
- 230000009471 action Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 239000011149 active material Substances 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000004134 energy conservation Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000003792 electrolyte Substances 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007773 negative electrode material Substances 0.000 description 1
- 239000007774 positive electrode material Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E60/00—Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
- Y02E60/10—Energy storage using batteries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Secondary Cells (AREA)
Abstract
本申请提供一种建立电芯容量预测模型的方法、装置、计算机设备及介质,属于电池技术领域。建立电芯容量预测模型的方法包括:基于一组样本数据,对多个机器学习模型进行训练和评估,得到任意一个超参数组合下多个机器学习模型各自的评估结果;基于多个机器学习模型在每个超参数组合下各自的评估结果,确定多个机器学习模型各自的相应最优超参数组合;基于一组样本数据中的至少部分样本数据,得到具有相应最优超参数组合的多个机器学习模型各自对电芯容量的第一预测值;以及至少基于多个机器学习模型各自的第一预测值和与第一预测值对应的电芯容量真实值,拟合电芯容量预测模型。
Description
技术领域
本申请涉及电池技术领域,尤其涉及一种建立电芯容量预测模型的方法、装置、计算机设备及介质。
背景技术
节能减排是汽车产业可持续发展的关键,电动车辆由于其节能环保的优势成为汽车产业可持续发展的重要组成部分。对于电动车辆而言,电池技术又是关乎其发展的一项重要因素。
电池容量是评估电池品质的重要技术指标之一,因此,电芯作为电池的重要组成部分,对电芯容量的检测十分重要。然而在电池的生产过程中,往往需要对电芯进行完整的充放电实验来检测电芯容量,检测结果准确性有待提高。
发明内容
本申请的一个目的在于提供一种建立电芯容量预测模型的方法,以缓解、减轻或消除相关技术中的问题。
本申请第一方面的实施例提供一种建立电芯容量预测模型的方法,该方法包括:针对预测电芯容量的多个机器学习模型各自的多个超参数组合中的每个超参数组合:基于与一组样本电芯相关联的一组样本数据,对多个机器学习模型进行训练和评估,得到该超参数组合下多个机器学习模型各自的评估结果,其中,一组样本数据包括一组样本电芯的生产过程参数;基于多个机器学习模型在每个超参数组合下各自的评估结果,确定多个机器学习模型各自的多个超参数组合中的相应最优超参数组合;基于一组样本数据中的至少部分样本数据,使用具有相应最优超参数组合的多个机器学习模型预测电芯容量,得到多个机器学习模型各自对电芯容量的第一预测值;以及至少基于多个机器学习模型各自的第一预测值和与第一预测值对应的电芯容量真实值,拟合与一组样本数据对应的电芯容量预测模型。
本申请实施例的技术方案中,使用了多个机器学习模型,并对每个机器学习模型都进行了训练和评估,得到具有相应最优超参数组合的多个机器学习模型,同时,基于具有相应最优超参数组合的多个机器学习模型各自对电芯容量的预测值和与预测值对应的电芯容量真实值,得到电芯容量预测模型。在建立电芯容量预测模型的过程中,组合了多种建模方式,提高了电芯容量预测模型的泛化能力,使得电芯容量的预测结果更加准确。
在一些实施例中,基于与一组样本电芯相关联的一组样本数据,对多个机器学习模型进行训练和评估,得到该超参数组合下多个机器学习模型各自的评估结果包括:针对多个机器学习模型中的每个机器学习模型,执行以下操作:将一组样本数据划分成k个子集,其中,k为大于1的整数;针对k个子集中的第i个子集,将该子集作为验证集,其余子集作为训练集,对该机器学习模型进行训练和评估,得到与该子集对应的子集评估结果,其中,i为整数且1≤i≤k;以及将与k个子集各自对应的子集评估结果取平均值,得到该机器学习模型的评估结果。通过上述方法,对多个机器学习模型进行训练和评估,使得多个机器学习模型的预测结果更接近真实值,改善了多个机器学习模型的准确性。
在一些实施例中,子集评估结果包括在上述操作中利用训练集进行训练后的多个机器学习模型各自对电芯容量的第二预测值和与第二预测值对应的电芯容量真实值之间的误差。使用利用训练集进行训练后的多个机器学习模型各自对电芯容量的第二预测值和与第二预测值对应的电芯容量真实值之间的误差作为子集评估结果,能够使得对机器学习模型的训练更加充分,使预测结果更加接近真实值。
在一些实施例中,基于多个机器学习模型在每个超参数组合下各自的评估结果,确定多个机器学习模型各自的多个超参数组合中的相应最优超参数组合包括:针对多个机器学习模型中的每个机器学习模型,执行以下操作:遍历该机器学习模型的多个超参数组合,得到该机器学习模型分别在多个超参数组合下相应的评估结果;确定该机器学习模型分别在多个超参数组合下相应的评估结果中的最优评估结果;以及确定该机器学习模型的多个超参数组合中与最优评估结果对应的超参数组合,作为该机器学习模型的最优超参数组合。通过确定多个机器学习模型各自对应的一组最优超参数组合,并将其应用到相应的机器学习模型中,对机器学习模型进行了优化,进一步提高了预测的准确性。
在一些实施例中,至少基于多个机器学习模型各自的第一预测值和与第一预测值对应的电芯容量真实值,拟合与一组样本数据对应的电芯容量预测模型包括:将与第一预测值对应的电芯容量真实值作为因变量,将多个机器学习模型各自的第一预测值作为自变量,进行线性回归建模,得到电芯容量预测模型。基于多个机器学习模型对电芯容量的预测值以及与预测值对应的电芯容量真实值,进行线性回归建模,可以使得到的电芯容量预测模型泛化能力更强,预测结果更准确。
在一些实施例中,自变量还包括与电芯原材料相关的一个或多个参数。与电芯原材料相关的参数对电芯容量存在影响,将这些参数也作为自变量,可以使得电芯容量预测模型的预测结果更准确。
在一些实施例中,与电芯原材料相关的一个或多个参数包括首次放电克容量和首次充电克容量中的至少一个。通过将首次放电克容量和首次充电克容量中的至少一个也作为自变量,可以进一步提高预测结果的准确性。
在一些实施例中,多个机器学习模型包括随机森林模型、支持向量机模型、梯度提升决策树模型中的至少两者。使用多个机器学习模型,能够使得电芯容量预测模型具有多个机器学习模型各自的优点,提高电芯容量预测模型的泛化能力。
在一些实施例中,一组样本数据是多组样本数据中的一组,多组样本数据包括相应多组样本电芯的生产过程参数,建立电芯容量预测模型的方法还包括:基于多组样本数据中除一组样本数据之外的其余各组样本数据,执行上述步骤,以得到分别与其余各组样本数据对应的相应电芯容量预测模型。分别对每一组样本数据分别建立电芯容量预测模型,可以使得电芯容量预测模型的预测结果更为接近真实值,提高预测结果的准确性。
在一些实施例中,多组样本数据是对样本数据集进行聚类得到的,聚类包括:确定多组样本数据的组别数量n,其中,n为大于1的整数;选择样本数据集中的n个样本数据分别作为n组样本数据各自的聚类中心;反复执行以下操作,直到满足聚类终止条件:计算样本数据集中的各个样本数据与n组样本数据各自的聚类中心之间的距离;基于该距离,确定各个样本数据各自的最近聚类中心;将样本数据集中的每个样本数据与该样本数据的最近聚类中心划分成同一组样本数据,以形成n组样本数据;计算n组样本数据各自的质心作为n组样本数据各自的聚类中心。通过对样本数据集进行聚类,划分为多个组别,可以使得电芯容量预测模型的预测结果更为接近真实值,提高预测结果的准确性。
在一些实施例中,样本数据集是对原始样本数据集进行预处理得到的,原始样本数据集包括多个样本电芯的生产过程参数,其中,预处理包括:获取每个生产过程参数的缺失率,缺失率指示多个样本电芯中具有该生产过程参数的可用数据的样本电芯占多个样本电芯的比例;以及响应于确定任意生产过程参数的缺失率不大于阈值,将多个样本电芯对应的该任意生产过程参数的数据加入样本数据集。通过对原始样本数据集进行预处理,提前排除缺失率较高的生产过程参数,可以提高建立电芯容量预测模型的效率,同时使得预测结果更准确。
在一些实施例中,生产过程参数包括:涂布重量、辊压压力、化成损失量、化成最高温度、电芯电压、电芯阻抗中的至少一个。通过采集这些生产过程参数,能够进一步提高预测结果的准确性。
本申请第二方面的实施例提供一种电芯容量预测方法,包括:获取与目标电芯相关联的目标数据,目标数据包括目标电芯的生产过程参数;基于目标电芯的生产过程参数,使用电芯容量预测模型对目标电芯的电芯容量进行预测,其中,电芯容量预测模型是通过如上述实施例中的方法建立的。
本申请第三方面的实施例提供一种建立电芯容量预测模型的装置,其包括训练评估模块、寻优模块、预测模块和建模模块,训练评估模块用于针对预测电芯容量的多个机器学习模型各自的多个超参数组合中的每个超参数组合:基于与一组样本电芯相关联的一组样本数据,对多个机器学习模型进行训练和评估,得到该超参数组合下多个机器学习模型各自的评估结果,其中,一组样本数据包括一组样本电芯的生产过程参数;寻优模块用于基于多个机器学习模型在每个超参数组合下各自的评估结果,确定多个机器学习模型各自的多个超参数组合中的相应最优超参数组合;预测模块用于基于一组样本数据中的至少部分样本数据,使用具有相应最优超参数组合的多个机器学习模型预测电芯容量,得到多个机器学习模型各自对电芯容量的第一预测值;以及建模模块用于至少基于多个机器学习模型各自的第一预测值和与第一预测值对应的电芯容量真实值,拟合与一组样本数据对应的电芯容量预测模型。
本申请第四方面的实施例提供一种电芯容量预测装置,其包括第一模块和第二模块,第一模块用于获取与目标电芯相关联的目标数据,目标数据包括目标电芯的生产过程参数;第二模块用于基于目标电芯的生产过程参数,使用电芯容量预测模型对目标电芯的电芯容量进行预测,其中,电芯容量预测模型是通过如上述实施例中的方法建立的。
本申请第五方面的实施例提供一种计算机设备,其包括至少一个处理器;以及至少一个存储器,其上存储有指令,其中,指令在被处理器执行时,使处理器执行如上述实施例中的方法。
本申请第六方面的实施例提供一种计算机可读设备,其上存储有指令,指令被处理器执行时,使处理器执行如上述实施例中的方法。
本申请的第七方面的实施例提供一种计算机程序产品,包括指令,指令被处理器执行时,使处理器执行如上述实施例中的方法。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。应该理解,这些附图仅描绘了根据本申请公开的一些实施方式,而不应将其视为是对本申请范围的限制。
图1为根据一些实施例的建立电芯容量预测模型的方法的流程示意图;
图2为根据一些实施例的对机器学习模型进行训练和评估并得到评估结果的流程示意图;
图3为根据一些实施例的确定机器学习模型的相应最优超参数组合的流程示意图;
图4为根据一些实施例的对样本数据集进行聚类的流程示意图;
图5为根据一些实施例的电芯容量预测方法的流程示意图;
图6为根据一些实施例的建立电芯容量预测模型的装置的示例性框图;
图7为根据一些实施例的电芯容量预测装置的示例性框图;
图8为能够应用于示例性实施例的示例性计算机设备的框图。
具体实施方式
下面将结合附图对本申请技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本申请的技术方案,因此只作为示例,而不能以此来限制本申请的保护范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。
在本申请实施例的描述中,技术术语“第一”“第二”等仅用于区别不同对象,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量、特定顺序或主次关系。在本申请实施例的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
在本申请实施例的描述中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
在本申请实施例的描述中,术语“多个”指的是两个以上(包括两个),同理,“多组”指的是两组以上(包括两组),“多片”指的是两片以上(包括两片)。
目前,从市场形势的发展来看,动力电池的应用越加广泛。动力电池不仅被应用于水力、火力、风力和太阳能电站等储能电源系统,而且还被广泛应用于电动自行车、电动摩托车、电动汽车等电动交通工具,以及军事装备和航空航天等多个领域。随着动力电池应用领域的不断扩大,其市场的需求量也在不断地扩增。
电池容量是评估电池品质的重要技术指标之一。电芯作为电池的重要组成部分,在电池的生产过程中,对于电芯容量的检测十分重要。目前,对于电芯容量的检测往往需要进行完整的充放电实验来获得电芯的实际容量。而这样的检测过程效率较低,耗时较久,并且电芯在检测过程中可能出现膨胀,降低电芯的可靠性,并且影响后续的电池模组装配过程。
因此,需要一种能够预测电芯容量的方法,其中,通过抽样测试样本电芯的电芯容量,建立电芯容量预测模型,然后可以利用电芯容量预测模型对生产出的电芯进行电芯容量的预测,识别出容量异常的电芯,使其不会流入之后的工序。
目前,预测模型的建立大多使用单一的机器学习模型,而现有的各个机器学习模型都存在各自的缺点,单一的机器学习模型也无法兼顾不同使用场景下的预测,这同样也会影响最终预测结果的准确性。
基于以上考虑,为了实现对电芯容量进行快速且准确的预测,提出了一种建立电芯容量预测模型的方法,通过组合多个机器学习模型,分别对每个机器学习模型进行训练和评估,并且对其各自的超参数进行优化,得到具有相应最优超参数组合的多个机器学习模型,进一步得到最终的电芯容量预测模型。这样建立的电芯容量预测模型,具备各个机器学习模型相应的特点,能够适应各个机器学习模型的适用场景,提高了电芯容量预测模型的泛化能力,也提高了对电芯容量预测结果的准确性。
本申请实施例公开的建立电芯容量预测模型的方法,可以用于各种电池生产过程中对电芯容量的预测,包括但不限于可以用于对电芯容量的在线预测,将电芯容量预测模型部署到产线控制系统,实现在生产过程中对电芯容量进行在线预测,提前识别出容量异常的电芯。
本申请实施例提供了一种建立电芯容量预测模型的方法100,请参照图1。
在步骤110,针对预测电芯容量的多个机器学习模型各自的多个超参数组合中的每个超参数组合:基于与一组样本电芯相关联的一组样本数据,对多个机器学习模型进行训练和评估,得到该超参数组合下多个机器学习模型各自的评估结果。上述一组样本数据包括一组样本电芯的生产过程参数。在实施例中,对每个机器模型各自的每组超参数组合均执行该步骤,得到每个机器学习模型在各自的每组超参数组合下的评估结果。
在步骤120,基于多个机器学习模型在每个超参数组合下各自的评估结果,确定多个机器学习模型各自的多个超参数组合中的相应最优超参数组合。在实施例中,从多个机器学习模型在每个超参数组合下各自的评估结果中,确定每个机器模型各自的相应最优超参数组合。
在步骤130,基于一组样本数据中的至少部分样本数据,使用具有相应最优超参数组合的多个机器学习模型预测电芯容量,得到多个机器学习模型各自对电芯容量的第一预测值。在实施例中,多个机器学习模型分别预测电芯容量,得到每个机器学习模型各自对电芯容量的第一预测值。
在步骤140,至少基于多个机器学习模型各自的第一预测值和与第一预测值对应的电芯容量真实值,拟合与一组样本数据对应的电芯容量预测模型。
在本文中,术语“超参数”是指在机器学习模型开始学习过程之前设定的参数,它是一种人为设定的参数。通常情况下,需要对超参数进行优化,得到一组最优超参数,以提高机器学习模型的性能。
在本文中,术语“生产过程参数”包括但不限于电芯生产过程中测试阶段之前的一个或多个与生产工艺和/或生产阶段相关的参数。
在步骤130中,可以将一组样本数据中的部分或全部样本数据都用于供多个机器学习模型预测电芯容量。例如,假定一组样本数据包括100条样本数据,那么可以将其中部分样本数据(例如,80条样本数据)或者全部100条样本数据都馈送到多个机器学习模型,使这些机器学习模块基于这些样本数据来预测电芯容量。
通过组合多个具有最优超参数组合的机器学习模型,得到具有最优超参数组合的多个机器学习模型各自对电芯容量的预测值,并结合与该预测值对应的电芯容量真实值,拟合得到电芯容量预测模型。根据上述步骤得到的电芯容量预测模型,具有各个机器学习模型各自的特点,能够适应各个机器学习模型各自的应用场景,泛化能力得到了提高,同时预测结果的准确性也得到了提升。
根据本申请的一些实施例,请参照图2,步骤110可以针对多个机器学习模型中的每个机器学习模型执行。
在步骤210,将一组样本数据划分成k个子集,其中,k为大于1的整数。
在步骤220,针对k个子集中的第i个子集,将该子集作为验证集,其余子集作为训练集,对该机器学习模型进行训练和评估,得到与该子集对应的子集评估结果。i为整数且1≤i≤k。在实施例中,对k个子集中的每个子集均执行该步骤,得到与每个子集分别对应的子集评估结果。
在步骤230,将与k个子集各自对应的子集评估结果取平均值,得到该机器学习模型的评估结果。
在实施例中,将一组样本数据划分成k个样本子集,依次遍历这k个样本子集,每次取其中一个样本子集作为验证集,剩下的k-1个样本子集作为训练集,对该机器学习模型进行训练和评估,得到与每个样本子集对应的子集评估结果。将与k个样本子集各自对应的子集评估结果取平均值,得到该机器学习模型的评估结果。
其中,k的取值可以根据使用场景人为进行设定。
使用如上述实施例的操作对每个机器学习模型进行训练和评估,由于遍历了每个样本子集,可以实现对样本数据的充分利用,同时,可以降低过拟合和欠拟合的风险,改善机器学习模型预测结果的准确性。
根据本申请的一些实施例,子集评估结果包括在如上述实施例的操作中利用训练集进行训练后的多个机器学习模型各自对电芯容量的第二预测值和与第二预测值对应的电芯容量真实值之间的误差。
在本文中,“误差”可以包括但不限于均方根误差、标准差、均方根对数误差。
将预测值和与预测值对应的真实值之间的误差作为评估结果,可以对各个子集进行更充分的评估,提高预测结果的准确性。
根据本申请的一些实施例,请参照图3,可以针对多个机器学习模型中的每个机器学习模型执行步骤120。步骤120可以包括以下操作。
在步骤310,遍历该机器学习模型的多个超参数组合,得到该机器学习模型分别在多个超参数组合下相应的评估结果。
在步骤320,从该机器学习模型分别在多个超参数组合下相应的评估结果中确定最优评估结果。
在步骤330,确定与最优评估结果对应的超参数组合,作为该机器学习模型的最优超参数组合。
在实施例中,针对每个机器学习模型,遍历该机器学习模型的多个超参数组合,并得到每个超参数组合下该机器学习模型相应的评估结果,从中找到评估结果最优时对应的一组最优超参数组合,将其应用到该机器学习模型中。
遍历多个超参数组合的方法,包括但不限于随机搜索、网格搜索。
通过确定一组最优超参数组合,得到具有最优超参数组合的机器学习模型,进一步提高了机器学习模型的预测结果的准确性,使预测结果更为接近真实值。
根据本申请的一些实施例,步骤140包括:将与第一预测值对应的电芯容量真实值作为因变量,将多个机器学习模型各自的第一预测值作为自变量,进行线性回归建模,得到电芯容量预测模型。
在本文中,术语“线性回归建模”是指用一条曲线拟合一个或多个自变量与因变量之间的关系。
在实施例中,使用具有相应最优超参数组合的多个机器学习模型分别预测得到每个机器学习模型各自对电芯容量的第一预测值,并将其作为自变量,将与第一预测值对应的电芯容量真实值作为因变量,进行线性回归建模,得到电芯容量预测模型。
基于多个机器学习模型各自对电芯容量的预测值和与预测值对应的真实值,使用线性回归建模,最终得到的电芯容量预测模型具有多个机器学习模型各自的特点,提高了其泛化能力。同时也使得预测结果更接近真实值,减小预测结果的误差,提高预测结果的准确性。
根据本申请的一些实施例,自变量还包括与电芯原材料相关的一个或多个参数。
电芯的原材料包括但不限于:正极材料、负极材料、隔膜、电解液中的至少一者。
在得到电芯容量预测模型的过程中,可以将与电芯原材料相关的参数也作为自变量,进行线性回归建模,得到电芯容量预测模型。
电芯生产过程中使用的原材料会对电芯容量产生一定的影响,将与电芯原材料相关的参数也作为自变量,可以使得电芯容量预测模型的预测结果更为准确。
根据本申请的一些实施例,与电芯原材料相关的一个或多个参数包括首次放电克容量和首次充电克容量中的至少一个。
在本文中,术语“首次放电克容量”是指每克活性物质首次放电结束时的放电容量,术语“首次充电克容量”是指每克活性物质首次充电结束时的充电容量。
首次放电克容量和首次充电克容量是评估电芯原材料性能的重要参数,将其中的至少一个作为自变量,可以进一步提高预测结果的准确性。
根据本申请的一些实施例,多个机器学习模型包括随机森林模型、支持向量机模型、梯度提升决策树模型中的至少两者。
在本文中,“随机森林”是一种利用多棵树对样本进行训练并预测的分类器;“支持向量机”是一类按监督学习方式对数据进行二元分类的广义线性分类器;“梯度提升决策树”是一种迭代的决策树算法,该算法由多棵决策树组成。
将随机森林模型、支持向量机模型、梯度提升决策树模型中的至少两者作为建立电芯容量预测模型的方法中使用的机器学习模型。
随机森林模型、支持向量机模型、梯度提升决策树模型分别具有不同的优点和不同的适用场景,将其中的至少两者应用到建立电芯容量预测模型的方法中,可以提高电芯容量预测模型的泛化能力。
根据本申请的一些实施例,一组样本数据是多组样本数据中的一组,多组样本数据包括相应多组样本电芯的生产过程参数。在这样的实施例中,上述方法100还包括:基于多组样本数据中除该组样本数据之外的其余各组样本数据,执行上述步骤110至140,以得到分别与其余各组样本数据对应的相应电芯容量预测模型。
将样本数据划分为多组,每一组样本数据都包括相应一组样本电芯的生产过程参数,针对每一组样本数据,得到与该组样本数据对应的相应电芯容量预测模型。
对多组数据中的每组样本数据分别建立对应的电芯容量预测模型,得到的电芯容量预测模型和与其对应的一组样本数据的相关性更高,可以进一步提高预测结果的准确性。
根据本申请的一些实施例,请参照图4,多组样本数据是对样本数据集进行聚类400得到的。聚类400可以包括:
在步骤410,确定多组样本数据的组别数量n,其中,n为大于1的整数。
在步骤420,选择样本数据集中的n个样本数据分别作为n组样本数据各自的聚类中心。
在步骤430,计算样本数据集中的各个样本数据与n组样本数据各自的聚类中心之间的距离。
在步骤440,基于该距离,确定各个样本数据各自的最近聚类中心。
在步骤450,将样本数据集中的每个样本数据与该样本数据的最近聚类中心划分成同一组样本数据,以形成n组样本数据。
在步骤460,计算n组样本数据各自的质心作为n组样本数据各自的聚类中心。
反复执行步骤430至460,直到满足聚类终止条件:
在实施例中,可以通过非监督式机器学习算法对样本数据集进行聚类。将样本数据集分为n组,随机选取样本数据集中的n个数据作为n组样本数据各自的初始聚类中心。计算样本数据集中每个样本数据与n组样本数据各自的初始聚类中心之间的距离,将每个样本数据分配给距离该样本数据最近的一个初始聚类中心,以形成n组样本数据。每组样本数据的聚类中心会根据每组样本数据中现有的样本数据被重新计算。每组样本数据的聚类中心被重新确定后,重新计算每个样本数据与每个重新确定的聚类中心之间的距离,并对每个样本数据进行重新分配。这个过程将不断重复直到满足聚类终止条件。
聚类终止条件包括但不限于以下任意一个条件:
(1)没有样本数据被重新分配给不同组别样本数据;
(2)没有聚类中心再发生变化;
(3)重复次数超过预先设定的重复次数阈值。
在模型建立阶段,对样本数据集进行聚类得到多组样本数据,并对聚类后得到的多组数据分别建立对应的电芯容量预测模型。在模型应用阶段,在对目标电芯的电芯容量的预测过程中,可以先对目标电芯的生产过程参数进行组别的判定,将其划分到相应的一组样本数据中,并使用该组样本数据对应的电芯容量预测模型对目标电芯的电芯容量进行预测,可以提高预测结果的准确性。
根据本申请的一些实施例,样本数据集是对原始样本数据集进行预处理得到的。原始样本数据集包括多个样本电芯的生产过程参数。预处理可以包括:
首先,获取每个生产过程参数的缺失率。缺失率指示多个样本电芯中具有该生产过程参数的可用数据的样本电芯占多个样本电芯的比例。
其次,响应于确定任意生产过程参数的缺失率不大于阈值,将多个样本电芯对应的该任意生产过程参数的数据加入样本数据集。也即,保留原始样本数据集中缺失率不大于阈值的生产过程参数,并并将它们加入样本数据集。
在对样本电芯的生产过程参数进行获取的过程中,会存在部分生产过程参数缺失的情况。对包括多个样本电芯的生产过程参数的原始数据集进行预处理,去除缺失率大于阈值(例如,10%)的生产过程参数,保留缺失率不大于阈值的生产过程参数以形成样本数据集。
对原始样本数据集进行预处理,去除缺失率较高的生产过程参数,可以减少对电芯容量预测模型无影响或影响较小的参数,提高建立电芯容量预测模型的效率,同时降低对建立电芯容量预测模型的干扰,提高预测结果的准确性。
根据本申请的一些实施例,生产过程参数包括:涂布重量、辊压压力、化成损失量、化成最高温度、电芯电压、电芯阻抗中的至少一个。
在本文中,术语“涂布重量”是指在涂布工序中涂抹在基层上的浆料的重量;术语“辊压压力”是指在辊压工序中辊压棍之间的压力;术语“化成”是指通过一定的充放电方式将电芯内部正负极物质激活,改善电芯的性能的过程,“化成损失量”是指在化成过程中电芯内部正负极物质的损失量,术语“化成最高温度”是指在化成过程中电芯所处的环境最高温度;术语“电芯电压” 是指电芯的正极和负极之间的电压;术语“电芯阻抗”是电流通过电芯内部时会受到阻力,此阻力即电芯阻抗。
通过确定一个或多个对电芯容量影响较大的生产过程参数,将这些生产过程参数作为样本数据,可以提高电芯容量预测模型对电芯容量预测结果的准确性。
本申请实施例提供了一种电芯容量预测方法500,请参照图5。
在步骤510,获取与目标电芯相关联的目标数据,目标数据包括目标电芯的生产过程参数。
在步骤520,基于目标电芯的生产过程参数,使用电芯容量预测模型对目标电芯的电芯容量进行预测。电芯容量预测模型是通过如上述实施例中的方法建立的。
在针对一组样本电芯建立了一个电芯容量预测模型的实施例中,可以使用该电芯容量预测模型对目标电芯的电芯容量进行预测。
在针对多组样本电芯分别建立了多个电芯容量预测模型的实施例中,可以对目标电芯的生产过程参数进行判别,将目标电芯划分至对应组别中,使用针对该组样本电芯建立的电芯容量预测模型对目标电芯的电芯容量进行预测。
关于建立电芯容量预测模型的方法已在上文中具体阐述,为了简洁起见,此处不再赘述。
通过使用上述实施例中的方法建立的电芯容量预测模型,可以使得对目标电芯的电芯容量的预测结果更加准确。
本申请实施例提供了一种建立电芯容量预测模型的装置600,请参照图6。建立电芯容量预测模型的装置600包括训练评估模块610、寻优模块620、预测模块630和建模模块640。
训练评估模块610用于针对预测电芯容量的多个机器学习模型,从其各自的多个超参数组合中任意选择一组超参数组合,基于一组样本数据,对多个机器学习模型进行训练和评估,得到该超参数组合下多个机器学习模型各自的评估结果,对每个机器模型各自的每组超参数组合均执行该步骤,得到每个机器学习模型在各自的每组超参数组合下的评估结果。
寻优模块620用于从多个机器学习模型在每个超参数组合下各自的评估结果中,确定每个机器模型各自的相应最优超参数组合。
预测模块630用于使用具有相应最优超参数组合的多个机器学习模型,基于一组样本数据中的至少部分样本数据,分别预测电芯容量,得到每个机器学习模型各自对电芯容量的第一预测值。
建模模块640用于至少基于多个机器学习模型各自的第一预测值和与第一预测值对应的电芯容量真实值,拟合与一组样本数据对应的电芯容量预测模型。
建立电芯容量预测模型的装置600中的训练评估模块610、寻优模块620、预测模块630和建模模块640可以分别对应于如图1所示的方法100中的步骤110至140,为了简洁起见,此处不再赘述。应当理解,与方法100的实施例相对应,建立电芯容量预测模型的装置600的实施例还可以包括更多的模块。
本申请实施例提供了一种电芯容量预测装置700,请参照图7。电芯容量预测装置700包括第一模块710和第二模块720。
第一模块710用于获取与目标电芯相关联的目标数据,目标数据包括目标电芯的生产过程参数。
第二模块720用于基于目标电芯的生产过程参数,使用电芯容量预测模型对目标电芯的电芯容量进行预测。电芯容量预测模型是通过如上述实施例中的方法建立的。
电芯容量预测装置700中的第一模块710和第二模块720可以分别对应于如图5所示的方法500中的步骤510和520,为了简洁起见,此处不再赘述。应当理解,与方法500的实施例相对应,电芯容量预测装置700的实施例还可以包括更多的模块。
应当注意,本文讨论的各个模块的功能可以分为多个模块,和/或多个模块的至少一些功能可以组合成单个模块。本文讨论的特定模块执行动作包括该特定模块本身执行该动作,或者替换地该特定模块调用或以其他方式访问执行该动作(或结合该特定模块一起执行该动作)的另一个组件或模块。因此,执行动作的特定模块可以包括执行动作的该特定模块本身和/或该特定模块调用或以其他方式访问的、执行动作的另一模块。
还应当理解,本文可以在软件硬件元件或程序模块的一般上下文中描述各种技术。上面关于图6和图7描述的各个模块可以在硬件中或在结合软件和/或固件的硬件中实现。例如,这些模块可以被实现为计算机程序代码/指令,该计算机程序代码/指令被配置为在一个或多个处理器中执行并存储在计算机可读存储介质中。可替换地,这些模块可以被实现为硬件逻辑/电路。硬件逻辑/电路可以包括集成电路芯片(其包括处理器(例如,中央处理单元(Central Processing Unit, CPU)、微控制器、微处理器、数字信号处理器(Digital Signal Processor, DSP)等)、存储器、一个或多个通信接口、和/或其他电路中的一个或多个部件),并且可以可选地执行所接收的程序代码和/或包括嵌入式固件以执行功能。
本申请实施例提供了一种计算机设备800,如图8所示。图8示出了可以被用来实施本文所描述的方法的计算机设备800的示例配置。举例来说,上述建立电芯容量预测模型的装置600和电芯容量预测装置700可以全部或至少部分地由计算机设备800或类似设备或系统实现。
计算机设备800可以包括能够诸如通过系统总线804或其他适当的连接彼此通信的至少一个处理器805、存储器807、(多个)通信接口802、显示设备801、其他输入/输出(I/O)设备803以及一个或更多大容量存储设备806。存储器807上存储有指令,指令在被处理器805执行时,使处理器805执行如上述实施例中的方法。
计算机设备800可以是各种不同类型的设备。计算机设备800的示例包括但不限于:台式计算机、服务器计算机、笔记本电脑或上网本计算机、移动设备(例如,平板电脑、蜂窝或其他无线电话(例如,智能电话)、记事本计算机、移动台)、可穿戴设备(例如,眼镜、手表)、娱乐设备(例如,娱乐器具、通信地耦合到显示设备的机顶盒、游戏机)、电视或其他显示设备、汽车计算机等等。
处理器805可以是单个处理单元或多个处理单元,所有处理单元可以包括单个或多个计算单元或者多个核心。处理器805可以被实施成一个或更多微处理器、微型计算机、微控制器、数字信号处理器、中央处理单元、状态机、逻辑电路和/或基于操作指令来操纵信号的任何设备。除了其他能力之外,处理器805可以被配置成获取并且执行存储在存储器807、大容量存储设备806或者其他计算机可读介质中的计算机可读指令,诸如操作系统808的程序代码、应用程序809的程序代码、其他程序810的程序代码等。
存储器807和大容量存储设备806是用于存储指令的计算机可读存储介质的示例,所述指令由处理器805执行来实施前面所描述的各种功能。举例来说,存储器807一般可以包括易失性存储器和非易失性存储器二者(例如RAM、ROM等等)。此外,大容量存储设备806一般可以包括硬盘驱动器、固态驱动器、可移除介质、包括外部和可移除驱动器、存储器卡、闪存、软盘、光盘(例如CD、DVD)、存储阵列、网络附属存储、存储区域网等等。存储器807和大容量存储设备806在本文中都可以被统称为存储器或计算机可读存储介质,并且可以是能够把计算机可读、处理器可执行程序指令存储为计算机程序代码的非暂态介质,所述计算机程序代码可以由处理器805作为被配置成实施在本文的示例中所描述的操作和功能的特定机器来执行。
多个程序可以存储在大容量存储设备806上。这些程序包括操作系统808、一个或多个应用程序809、其他程序810和程序数据811,并且它们可以被加载到存储器807以供执行。这样的应用程序或程序模块的示例可以包括例如用于实现以下部件/功能的计算机程序逻辑(例如,计算机程序代码或指令):建立电芯容量预测模型的装置600(包括训练评估模块610、寻优模块620、预测模块630和建模模块640)、电芯容量预测装置700(包括第一模块710和第二模块720)、方法100和/或方法500(包括方法100、500的任何合适的步骤)、和/或本文描述的另外的实施例。
虽然在图8中被图示成存储在计算机设备800的存储器807中,但是操作系统808、应用程序809、其他程序810和程序数据811或者其部分可以使用可由计算机设备800访问的任何形式的计算机可读介质来实施。
一个或更多通信接口802用于诸如通过网络、直接连接等等与其他设备交换数据。这样的通信接口可以是以下各项中的一个或多个:任何类型的网络接口(例如,网络接口卡(NIC))、有线或无线(诸如IEEE 802.11无线LAN(WLAN))无线接口、全球微波接入互操作(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、BluetoothTM接口、近场通信(NFC)接口等。通信接口802可以促进在多种网络和协议类型内的通信,其中包括有线网络(例如LAN、电缆等等)和无线网络(例如WLAN、蜂窝、卫星等等)、因特网等等。通信接口802还可以提供与诸如存储阵列、网络附属存储、存储区域网等等中的外部存储装置(未示出)的通信。
在一些示例中,可以包括诸如监视器之类的显示设备801,以用于向用户显示信息和图像。其他I/O设备803可以是接收来自用户的各种输入并且向用户提供各种输出的设备,并且可以包括触摸输入设备、手势输入设备、摄影机、键盘、遥控器、鼠标、打印机、音频输入/输出设备等等。
本文描述的技术可以由计算机设备800的这些各种配置来支持,并且不限于本文所描述的技术的具体示例。例如,该功能还可以通过使用分布式系统在“云”上全部或部分地实现。云包括和/或代表用于资源的平台。平台抽象云的硬件(例如,服务器)和软件资源的底层功能。资源可以包括在远离计算机设备800的服务器上执行计算处理时可以使用的应用和/或数据。资源还可以包括通过因特网和/或通过诸如蜂窝或Wi-Fi网络的订户网络提供的服务。平台可以抽象资源和功能以将计算机设备800与其他计算机设备连接。因此,本文描述的功能的实现可以分布在整个云内。例如,功能可以部分地在计算机设备800上以及部分地通过抽象云的功能的平台来实现。
本申请实施例还提供了一种计算机可读存储介质,其上存储有指令,指令被处理器执行时,使处理器执行如上述任意实施例中的方法。
计算机可读存储介质包括通过用于存储信息的任何方法或技术实施的易失性和非易失性、可移除和不可移除介质,信息诸如是计算机可读指令、数据结构、程序模块或者其他数据。计算机可读存储介质包括而不限于RAM、ROM、EEPROM、闪存或其他存储器技术,CD-ROM、数字通用盘(DVD)、或其他光学存储装置,磁盒、磁带、磁盘存储装置或其他磁性存储设备,或者可以被用来存储信息以供计算机设备访问的任何其他非传送介质。
本申请实施例还提供了一种计算机程序产品,包括指令,该指令被处理器执行时,使处理器执行如上述任意实施例中的方法。
根据本申请的一些实施例,如图1-4所示,提供了一种建立电芯容量预测模型的方法。
(1)在同一批次待测试的电芯中进行抽样,抽取一定数量的样本电芯进行电芯容量测试,得到所有样本电芯的电芯容量真实值。采集所有样本电芯的生产过程参数,形成原始样本数据集。在一个示例中,生产过程参数可以包括:涂布重量、辊压压力、化成损失量、化成最高温度、电芯电压、电芯阻抗中的至少一个。
(2)对原始样本数据集进行预处理,去除其中缺失率大于10%的生产过程参数,将缺失率不大于10%的生产过程参数加入样本数据集。
(3)对样本数据集使用K均值聚类算法进行聚类,将样本数据集分成5组样本数据,随机选择样本数据集中的5个样本数据分别作为5组样本数据各自的聚类中心。之后反复执行以下操作,直到满足聚类终止条件:计算样本数据集中的各个样本数据与5组样本数据各自的聚类中心之间的距离;基于该距离,确定各个样本数据各自的最近聚类中心;将样本数据集中的每个样本数据与该样本数据的最近聚类中心划分成同一组样本数据,以形成5组样本数据;计算5组样本数据各自的质心作为5组样本数据各自的聚类中心。
样本数据集经过聚类后得到了A组样本数据、B组样本数据、C组样本数据、D组样本数据和E组样本数据。
(4)针对其中的A组样本数据,使用随机森林模型、支持向量机模型和梯度提升决策树模型。基于A组样本数据,针对三个机器学习模型各自的多个超参数组合中的每个超参数组合,对三个机器学习模型分别进行训练和评估,得到该超参数组合下三个机器学习模型各自的评估结果。
在一个示例中,将A组样本数据划分成5个子集,针对5个子集中的任意一个子集,将该子集作为验证集,其余4个子集作为训练集,对三个机器学习模型分别进行训练和评估,得到每个机器学习模型各自与该子集对应的子集评估结果。将5个子集各自对应的子集评估结果取平均值,得到每个机器学习模型各自的评估结果。子集评估结果可以包括利用训练集进行训练后的该机器学习模型对电芯容量的第二预测值和与第二预测值对应的电芯容量真实值之间的均方根误差均值。
(5)针对随机森林模型、支持向量机模型和梯度提升决策树模型中的每个机器学习模型,遍历该机器学习模型的多个超参数组合,得到该机器学习模型分别在多个超参数组合下相应的评估结果。从多个超参数组合下相应的评估结果中确定最优评估结果,并确定与最优评估结果对应的一组超参数组合,作为该机器学习模型的最优超参数组合。
(6)基于A组样本数据,使用具有相应最优超参数组合的随机森林模型、具有相应最优超参数组合的支持向量机模型和具有相应最优超参数组合的梯度提升决策树模型分别预测电芯容量,得到随机森林模型、支持向量机模型和梯度提升决策树模型各自对电芯容量的第一预测值。
(7)将随机森林模型、支持向量机模型和梯度提升决策树模型各自对电芯容量的第一预测值、首次放电克容量和首次充电克容量作为自变量,将与第一预测值对应的电芯容量真实值作为因变量,进行线性回归建模,得到A组样本数据对应的电芯容量预测模型。
(8)针对B组样本数据、C组样本数据、D组样本数据和E组样本数据,分别执行上述(4)至(7)的操作,得到B组样本数据对应的电芯容量预测模型、C组样本数据对应的电芯容量预测模型、D组样本数据对应的电芯容量预测模型和E组样本数据对应的电芯容量预测模型。
在实施例中,对目标电芯的电芯容量进行预测时,可以首先对目标电芯的生产过程参数进行判定,将其划分到A组样本数据、B组样本数据、C组样本数据、D组样本数据、E组样本数据中相应的组别,并使用与该组样本数据对应的电芯容量预测模型对目标电芯的电芯容量进行预测。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,其均应涵盖在本申请的权利要求和说明书的范围当中。尤其是,只要不存在结构冲突,各个实施例中所提到的各项技术特征均可以任意方式组合起来。本申请并不局限于文中公开的特定实施例,而是包括落入权利要求的范围内的所有技术方案。
Claims (14)
1.一种建立电芯容量预测模型的方法,其特征在于,包括以下步骤:
针对预测电芯容量的多个机器学习模型各自的多个超参数组合中的每个超参数组合:
基于与一组样本电芯相关联的一组样本数据,对所述多个机器学习模型进行训练和评估,得到该超参数组合下所述多个机器学习模型各自的评估结果,包括:
针对所述多个机器学习模型中的每个机器学习模型,执行以下操作:
将所述一组样本数据划分成k个子集,其中,k为大于1的整数;
针对所述k个子集中的第i个子集,将该子集作为验证集,其余子集作为训练集,对该机器学习模型进行训练和评估,得到与该子集对应的子集评估结果,其中,i为整数且1≤i≤k;以及
将与所述k个子集各自对应的子集评估结果取平均值,得到该机器学习模型的所述评估结果,其中,所述一组样本数据包括所述一组样本电芯的生产过程参数,所述子集评估结果包括在所述操作中利用所述训练集进行训练后的所述多个机器学习模型各自对所述电芯容量的第二预测值和与所述第二预测值对应的电芯容量真实值之间的误差;
基于所述多个机器学习模型在每个超参数组合下各自的评估结果,确定所述多个机器学习模型各自的多个超参数组合中的相应最优超参数组合;
基于所述一组样本数据中的至少部分样本数据,使用具有所述相应最优超参数组合的所述多个机器学习模型预测所述电芯容量,得到所述多个机器学习模型各自对所述电芯容量的第一预测值;以及
至少基于所述多个机器学习模型各自的第一预测值和与所述第一预测值对应的电芯容量真实值,拟合与所述一组样本数据对应的电芯容量预测模型,包括:将与所述第一预测值对应的所述电芯容量真实值作为因变量,将所述多个机器学习模型各自的第一预测值作为自变量,进行线性回归建模,得到所述电芯容量预测模型。
2.根据权利要求1所述的方法,其特征在于,基于所述多个机器学习模型在每个超参数组合下各自的评估结果,确定所述多个机器学习模型各自的多个超参数组合中的相应最优超参数组合包括:
针对所述多个机器学习模型中的每个机器学习模型,执行以下操作:
遍历该机器学习模型的所述多个超参数组合,得到该机器学习模型分别在所述多个超参数组合下相应的评估结果;
确定该机器学习模型分别在所述多个超参数组合下所述相应的评估结果中的最优评估结果;以及
确定该机器学习模型的所述多个超参数组合中与所述最优评估结果对应的超参数组合,作为该机器学习模型的最优超参数组合。
3.根据权利要求1所述的方法,其特征在于,所述自变量还包括与电芯原材料相关的一个或多个参数。
4.根据权利要求3所述的方法,其特征在于,所述与电芯原材料相关的一个或多个参数包括首次放电克容量和首次充电克容量中的至少一个。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述多个机器学习模型包括随机森林模型、支持向量机模型、梯度提升决策树模型中的至少两者。
6.根据权利要求1-4中任一项所述的方法,其特征在于,所述一组样本数据是多组样本数据中的一组,所述多组样本数据包括相应多组样本电芯的所述生产过程参数,所述方法还包括:
基于所述多组样本数据中除所述一组样本数据之外的其余各组样本数据,执行所述步骤,以得到分别与所述其余各组样本数据对应的相应电芯容量预测模型。
7.根据权利要求6所述的方法,其特征在于,所述多组样本数据是对样本数据集进行聚类得到的,所述聚类包括:
确定所述多组样本数据的组别数量n,其中,n为大于1的整数;
选择所述样本数据集中的n个样本数据分别作为n组样本数据各自的聚类中心;
反复执行以下操作,直到满足聚类终止条件:
计算所述样本数据集中的各个样本数据与所述n组样本数据各自的聚类中心之间的距离;
基于所述距离,确定所述各个样本数据各自的最近聚类中心;
将所述样本数据集中的每个样本数据与该样本数据的最近聚类中心划分成同一组样本数据,以形成n组样本数据;
计算所述n组样本数据各自的质心作为所述n组样本数据各自的聚类中心。
8.根据权利要求7所述的方法,其特征在于,所述样本数据集是对原始样本数据集进行预处理得到的,所述原始样本数据集包括多个样本电芯的生产过程参数,其中,所述预处理包括:
获取每个生产过程参数的缺失率,所述缺失率指示所述多个样本电芯中具有该生产过程参数的可用数据的样本电芯占所述多个样本电芯的比例;以及
响应于确定任意生产过程参数的缺失率不大于阈值,将所述多个样本电芯对应的该任意生产过程参数的数据加入所述样本数据集。
9.根据权利要求1-4中任一项所述的方法,其特征在于,所述生产过程参数包括:涂布重量、辊压压力、化成损失量、化成最高温度、电芯电压、电芯阻抗中的至少一个。
10.一种电芯容量预测方法,其特征在于,包括:
获取与目标电芯相关联的目标数据,所述目标数据包括所述目标电芯的生产过程参数;
基于所述目标电芯的生产过程参数,使用电芯容量预测模型对所述目标电芯的电芯容量进行预测,其中,所述电芯容量预测模型是通过权利要求1-9中任一项所述的方法建立的。
11.一种建立电芯容量预测模型的装置,其特征在于,包括:
训练评估模块,用于针对预测电芯容量的多个机器学习模型各自的多个超参数组合中的每个超参数组合:基于与一组样本电芯相关联的一组样本数据,对所述多个机器学习模型进行训练和评估,得到该超参数组合下所述多个机器学习模型各自的评估结果,包括:
针对所述多个机器学习模型中的每个机器学习模型,执行以下操作:
将所述一组样本数据划分成k个子集,其中,k为大于1的整数;
针对所述k个子集中的第i个子集,将该子集作为验证集,其余子集作为训练集,对该机器学习模型进行训练和评估,得到与该子集对应的子集评估结果,其中,i为整数且1≤i≤k;以及
将与所述k个子集各自对应的子集评估结果取平均值,得到该机器学习模型的所述评估结果,其中,所述一组样本数据包括所述一组样本电芯的生产过程参数,所述子集评估结果包括在所述操作中利用所述训练集进行训练后的所述多个机器学习模型各自对所述电芯容量的第二预测值和与所述第二预测值对应的电芯容量真实值之间的误差;
寻优模块,用于基于所述多个机器学习模型在每个超参数组合下各自的评估结果,确定所述多个机器学习模型各自的多个超参数组合中的相应最优超参数组合;
预测模块,用于基于所述一组样本数据中的至少部分样本数据,使用具有所述相应最优超参数组合的所述多个机器学习模型预测所述电芯容量,得到所述多个机器学习模型各自对所述电芯容量的第一预测值;以及
建模模块,用于至少基于所述多个机器学习模型各自的第一预测值和与所述第一预测值对应的电芯容量真实值,拟合与所述一组样本数据对应的电芯容量预测模型,包括:将与所述第一预测值对应的所述电芯容量真实值作为因变量,将所述多个机器学习模型各自的第一预测值作为自变量,进行线性回归建模,得到所述电芯容量预测模型。
12.一种电芯容量预测装置,其特征在于,包括:
第一模块,用于获取与目标电芯相关联的目标数据,所述目标数据包括所述目标电芯的生产过程参数;
第二模块,用于基于所述目标电芯的生产过程参数,使用电芯容量预测模型对所述目标电芯的电芯容量进行预测,其中,所述电芯容量预测模型是通过权利要求1-9中任一项所述的方法建立的。
13.一种计算机设备,其特征在于,包括:
至少一个处理器;以及
至少一个存储器,其上存储有指令,
其中,所述指令在被所述至少一个处理器执行时,使所述至少一个处理器执行权利要求1至9中任一项所述的建立电芯容量预测模型的方法或权利要求10所述的电芯容量预测方法。
14.一种计算机可读存储介质,其上存储有指令,所述指令被一个或多个处理器执行时,使所述一个或多个处理器执行权利要求1至9中任一项所述的建立电芯容量预测模型的方法或权利要求10所述的电芯容量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310936905.9A CN116680992B (zh) | 2023-07-28 | 2023-07-28 | 建立电芯容量预测模型的方法、装置、计算机设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310936905.9A CN116680992B (zh) | 2023-07-28 | 2023-07-28 | 建立电芯容量预测模型的方法、装置、计算机设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116680992A CN116680992A (zh) | 2023-09-01 |
CN116680992B true CN116680992B (zh) | 2023-12-29 |
Family
ID=87789400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310936905.9A Active CN116680992B (zh) | 2023-07-28 | 2023-07-28 | 建立电芯容量预测模型的方法、装置、计算机设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116680992B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117972620B (zh) * | 2024-04-02 | 2024-05-28 | 深圳和润达科技有限公司 | 基于逻辑回归算法的电芯异常预测方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291894A (zh) * | 2018-11-21 | 2020-06-16 | 第四范式(北京)技术有限公司 | 超参数优化过程中的资源调度方法、装置、设备及介质 |
CN113064091A (zh) * | 2021-03-10 | 2021-07-02 | 北京理工新源信息科技有限公司 | 一种电池剩余寿命的预测方法及系统 |
CN113848480A (zh) * | 2021-09-23 | 2021-12-28 | 广东恒翼能科技有限公司 | 锂电池分容工艺的放电总容量预测方法 |
CN115291124A (zh) * | 2022-08-04 | 2022-11-04 | 广州领博科技有限公司 | 一种容量预测方法及装置 |
CN115698737A (zh) * | 2020-11-13 | 2023-02-03 | 株式会社Lg化学 | 电池容量测量装置和方法,以及包括电池容量测量装置的电池控制系统 |
CN115952418A (zh) * | 2022-12-30 | 2023-04-11 | 浙江大学嘉兴研究院 | 一种基于模型超参数的机器学习模型优化的方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11580325B2 (en) * | 2019-01-25 | 2023-02-14 | Yahoo Assets Llc | Systems and methods for hyper parameter optimization for improved machine learning ensembles |
US11809968B2 (en) * | 2020-02-24 | 2023-11-07 | Capital One Services, Llc | Control of hyperparameter tuning based on machine learning |
-
2023
- 2023-07-28 CN CN202310936905.9A patent/CN116680992B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291894A (zh) * | 2018-11-21 | 2020-06-16 | 第四范式(北京)技术有限公司 | 超参数优化过程中的资源调度方法、装置、设备及介质 |
CN115698737A (zh) * | 2020-11-13 | 2023-02-03 | 株式会社Lg化学 | 电池容量测量装置和方法,以及包括电池容量测量装置的电池控制系统 |
CN113064091A (zh) * | 2021-03-10 | 2021-07-02 | 北京理工新源信息科技有限公司 | 一种电池剩余寿命的预测方法及系统 |
CN113848480A (zh) * | 2021-09-23 | 2021-12-28 | 广东恒翼能科技有限公司 | 锂电池分容工艺的放电总容量预测方法 |
CN115291124A (zh) * | 2022-08-04 | 2022-11-04 | 广州领博科技有限公司 | 一种容量预测方法及装置 |
CN115952418A (zh) * | 2022-12-30 | 2023-04-11 | 浙江大学嘉兴研究院 | 一种基于模型超参数的机器学习模型优化的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116680992A (zh) | 2023-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112181666B (zh) | 一种基于边缘智能的设备评估和联邦学习重要性聚合方法 | |
CN116680992B (zh) | 建立电芯容量预测模型的方法、装置、计算机设备及介质 | |
JP7450741B2 (ja) | リチウム電池のsoc推定方法、装置及びコンピュータ読み取り可能な記憶媒体 | |
CN113985294B (zh) | 一种电池剩余寿命的预估方法及装置 | |
CN109471040B (zh) | 容量判定方法、装置、电子设备及计算机可读存储介质 | |
CN112084459A (zh) | 电池充放电循环寿命的预测方法、装置、电子终端、及存储介质 | |
CN111816936A (zh) | 电池梯次利用配组方法、系统、终端设备及存储介质 | |
CN115221795A (zh) | 容量预测模型的训练方法、预测方法、装置、设备及介质 | |
CN115729796A (zh) | 基于人工智能的异常操作分析方法及大数据应用系统 | |
CN113721149A (zh) | 一种基于半监督迁移学习的锂电池容量预测方法 | |
CN112287980A (zh) | 基于典型特征向量的动力电池筛选方法 | |
CN117996242B (zh) | 用于动力电池的智能均衡控制方法及系统 | |
CN115656824A (zh) | 基于cnn-lstm模型的锂电池核电状态预测方法 | |
CN115902641A (zh) | 电池容量跳水的预测方法、装置及存储介质 | |
CN114510871A (zh) | 基于思维进化和lstm的云服务器性能衰退预测方法 | |
CN117744856A (zh) | 锂电池剩余寿命预测方法、系统、计算机设备和存储介质 | |
CN117289167A (zh) | 基于多重神经网络的电池剩余寿命预测方法、装置及介质 | |
CN117110884A (zh) | 基于多核相关向量机的锂电池剩余使用寿命预测方法 | |
CN115267556A (zh) | 电池寿命衰降分析方法、存储介质及电子设备 | |
CN114783215A (zh) | 无人机分簇方法、装置和电子设备 | |
CN114565105A (zh) | 处理数据的方法和深度学习模型的训练方法、装置 | |
CN117148172B (zh) | 电池状态检测方法、装置、计算设备和介质 | |
CN117574111B (zh) | 基于场景状态的bms算法选择方法、装置、设备和介质 | |
CN116541252B (zh) | 一种机房故障日志数据处理方法及装置 | |
Yu et al. | A fusion method for capacity estimation of fast-charging lithium-ion battery under varied degradation mode |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |