CN113326652B - 基于经验贝叶斯的数据批次效应处理方法、装置及介质 - Google Patents
基于经验贝叶斯的数据批次效应处理方法、装置及介质 Download PDFInfo
- Publication number
- CN113326652B CN113326652B CN202110512287.6A CN202110512287A CN113326652B CN 113326652 B CN113326652 B CN 113326652B CN 202110512287 A CN202110512287 A CN 202110512287A CN 113326652 B CN113326652 B CN 113326652B
- Authority
- CN
- China
- Prior art keywords
- welding spot
- process parameter
- parameter data
- standardized
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000000694 effects Effects 0.000 title claims abstract description 156
- 238000003672 processing method Methods 0.000 title claims abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 284
- 238000003466 welding Methods 0.000 claims abstract description 251
- 230000008569 process Effects 0.000 claims abstract description 219
- 238000012545 processing Methods 0.000 claims abstract description 119
- 238000009826 distribution Methods 0.000 claims abstract description 61
- 238000006073 displacement reaction Methods 0.000 claims abstract description 11
- 229910000679 solder Inorganic materials 0.000 claims description 49
- 238000004590 computer program Methods 0.000 claims description 16
- 238000003860 storage Methods 0.000 claims description 7
- 239000000654 additive Substances 0.000 claims description 6
- 230000000996 additive effect Effects 0.000 claims description 6
- 238000013461 design Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000013398 bayesian method Methods 0.000 abstract description 7
- 238000004519 manufacturing process Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 6
- 230000009467 reduction Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/15—Vehicle, aircraft or watercraft design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/17—Mechanical parametric or variational design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/10—Numerical modelling
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Geometry (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Pure & Applied Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Mathematics (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Manufacturing & Machinery (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Fuzzy Systems (AREA)
- Medical Informatics (AREA)
- Aviation & Aerospace Engineering (AREA)
- Automation & Control Theory (AREA)
- Resistance Welding (AREA)
Abstract
本发明公开了一种基于经验贝叶斯的数据批次效应处理方法、装置及介质,所述方法包括:获取电阻点焊过程中的焊点工艺参数数据集;其中,焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;对焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;根据标准化后的焊点工艺参数数据集建立概率分布模型,并对概率分布模型中的超参数进行参数估计;根据参数估计的结果建立批次效应处理模型,对标准化后的焊点工艺参数数据集进行批次效应处理。本发明基于经验贝叶斯方法对焊点工艺参数数据进行批次效应处理,将批次内样本数据值收缩到批次间总体样本均值,从而实现消除焊点工艺参数数据的批次效应。
Description
技术领域
本发明涉及电阻点焊技术领域,尤其涉及一种基于经验贝叶斯的数据批次效应处理方法、装置及介质。
背景技术
目前,汽车行业主要采用人工抽检的方法来检测车身焊点质量,但是该方法存在被检测焊点覆盖面窄、抽检频率低等问题,容易造成大量不合格焊点流出,导致安全隐患。为了解决这个问题,汽车行业正在尝试通过对车身电阻点焊的工艺参数进行大数据分析来建立焊接工艺参数对焊点质量的影响模型,通过对电阻点焊过程中工艺参数的实时监测来判断焊点质量,实现车身焊点质量的全检,消除不合格焊点流出导致的安全隐患。
但是,在分析大量焊点工艺参数数据的过程中,往往涉及不同生产线、不同车型与板材配合、不同焊枪、不同时间采集到的工艺参数数据。由于不同的生产线环境和焊接设备,以及相同设备在不同时间段不可避免的存在差异,可能会对采集到的数据产生明显的噪声干扰,造成不同批次的点焊数据产生与样本质量无关的随机性差异,即产生显著的批次效应。如果不能通过数据预处理消除批次效应带来的差异,就会导致后续分析及质量预测产生较大的偏差,无法反映真实的焊接质量情况。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于经验贝叶斯的数据批次效应处理方法、装置及介质,基于经验贝叶斯方法对焊点工艺参数数据进行批次效应处理,将批次内样本数据值收缩到批次间总体样本均值,从而实现消除焊点工艺参数数据的批次效应。
为了实现上述目的,本发明实施例提供了一种基于经验贝叶斯的数据批次效应处理方法,包括:
获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;
对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;
根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;
根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。
作为上述方案的改进,所述获取电阻点焊过程中的焊点工艺参数数据集,具体包括:
通过数据采集系统采集电阻点焊过程中的焊点工艺参数数据;
对采集到的焊点工艺参数数据建立焊点工艺参数数据集D,
其中,b为批次数,b=1...B;s为焊点样本数,s=1...S;c为特征参数,c=1...C。
作为上述方案的改进,所述对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集,具体包括:
建立所述焊点工艺参数数据集的标准化处理模型为:
其中,焊点工艺参数数据dbsc表示在批次b中样本s的特征c的值;rc表示特征c的平均表达值;A表示焊点样本的设计矩阵;νc表示对应A的回归系数向量;θbc表示焊点数据的加性批次效应,φbc表示焊点数据的乘性批次效应;误差项服从正态分布/>φc表示所有焊点样本中特征c的标准差;
其中,m表示样本数量,m=1...M,M为样本总数,M=B×S×C;
根据Z-means标准化方法得到标准化数据公式为:
作为上述方案的改进,所述根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计,具体包括:
根据所述标准化后的焊点工艺参数数据集建立概率分布模型为:即标准化后的焊点工艺参数数据zbsc服从期望为θbc,方差为/>的正态分布;其中,焊点工艺参数数据的期望θbc服从期望为μb,方差为τb 2的正态分布,即θbc~N(μb,τb 2);焊点工艺参数数据的方差/>服从参数为αb,βb的逆伽马分布,即
作为上述方案的改进,所述根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应,具体包括:
根据参数估计的结果建立批次效应处理模型为:
本发明实施例还提供了一种基于经验贝叶斯的数据批次效应处理装置,包括:
数据集获取模块,用于获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;
标准化处理模块,用于对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;
参数估计模块,用于根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;
批次效应处理模块,用于根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。
本发明实施例还提供了一种基于经验贝叶斯的数据批次效应处理装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的基于经验贝叶斯的数据批次效应处理方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任一项所述的基于经验贝叶斯的数据批次效应处理方法。
相对于现有技术,本发明实施例提供的一种基于经验贝叶斯的数据批次效应处理方法、装置及介质的有益效果在于:通过获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。本发明实施例基于经验贝叶斯方法对焊点工艺参数数据进行批次效应处理,将批次内样本数据值收缩到批次间总体样本均值,从而实现消除焊点工艺参数数据的批次效应。并且,本实施例在电阻点焊数据样本尺寸较小时,同样能够鲁棒地处理高维数据,消除不同批次数据间的批次效应。
附图说明
图1是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例的流程示意图;
图2是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例中处理批次效应前的焊点数据t-SNE降维图;
图3是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例中处理批次效应后的焊点数据t-SNE降维图;
图4是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例中采用不同分类器处理批次效应前后结果对比图;
图5是本发明提供的一种基于经验贝叶斯的数据批次效应处理装置的一个优选实施例的结构示意图;
图6是本发明提供的一种基于经验贝叶斯的数据批次效应处理装置的另一个优选实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例的流程示意图。所述基于经验贝叶斯的数据批次效应处理方法方法,包括:
S1,获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;
S2,对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;
S3,根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;
S4,根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。
具体的,本实施例首先获取在车身制造工艺中电阻点焊过程中的焊点工艺参数数据集,其中,焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值,由于这些数据为不同生产线、不同车型与板材配合、不同焊枪、不同时间采集到的工艺参数数据,因此存在显著的批次效应。并且,由于采集到的每一个焊点的工艺参数种类较多,数值差异较大,造成不同种类的工艺参数之间存在较大差异,如果不加考虑较大的数值差别,在使用经验贝叶斯方法时会产生较大偏差,本实施例为了避免这种现象,在获取到焊点工艺参数数据集后,需要对焊点工艺参数数据进行标准化处理,得到标准化后的焊点工艺参数数据集,使每个焊点的数值具有相似的总体均值和标准差。然后,根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;最后,根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。
需要说明的是,针对车身制造过程中焊点工艺参数数据存在批次效应的问题,本发明实施例采用基于经验贝叶斯方法对焊点工艺参数数据进行批次效应处理。经验贝叶斯方法的主要思想是基于“位置与尺度”模型,具体是先通过汇总每个批次间焊点工艺参数数据来估计模型参数,将批次内样本数据值收缩到批次间总体样本均值,从而对样本数据值进行调整,消除样本的批次效应。
本实施例通过对焊点工艺参数数据进行分析,从而确定批次效应处理模型,实现消除由不同采集时间、不同生产线和不同焊接设备等因素带来的焊点工艺参数的批次效应。
在另一个优选实施例中,所述S1,获取电阻点焊过程中的焊点工艺参数数据集,具体包括:
S101,通过数据采集系统采集电阻点焊过程中的焊点工艺参数数据;
S102,对采集到的焊点工艺参数数据建立焊点工艺参数数据集D,
其中,b为批次数,b=1...B;s为焊点样本数,s=1...S;c为特征参数,c=1...C。
具体的,通过数据采集系统采集电阻点焊过程中的焊点工艺参数数据,该焊点工艺参数数据包括每个焊点在焊接过程中的动态电阻值、动态电流值、动态电压值、电极位移及焊枪能量值;对采集到的焊点工艺参数数据进行汇总,建立焊点工艺参数数据集D,
其中,b为批次数,b=1...B;s为焊点样本数,s=1...S;c为特征参数,c=1...C
在又一个优选实施例中,所述S2,对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集,具体包括:
S201,建立所述焊点工艺参数数据集的标准化处理模型为:
其中,焊点工艺参数数据dbsc表示在批次b中样本s的特征c的值;rc表示特征c的平均表达值;A表示焊点样本的设计矩阵;νc表示对应A的回归系数向量;θbc表示焊点数据的加性批次效应,φbc表示焊点数据的乘性批次效应;误差项服从正态分布/>φc表示所有焊点样本中特征c的标准差;
其中,m表示样本数量,m=1...M,M为样本总数,M=B×S×C;
S232,根据Z-means标准化方法得到标准化数据公式为:
具体的,在获取到电阻点焊过程中的焊点工艺参数数据集后,首先建立焊点工艺参数数据集的标准化处理模型为:
其中,焊点工艺参数数据dbsc表示在批次b中样本s的特征c的值;rc表示特征c的平均表达值;A表示焊点样本的设计矩阵;νc表示对应A的回归系数向量;θbc表示焊点数据的加性批次效应,φbc表示焊点数据的乘性批次效应;误差项服从正态分布/>φc表示所有焊点样本中特征c的标准差;然后,采用最小二乘法对所述标准化处理模型中的参数rc,νc,θbc进行估计,得到参数估计值/>其中,最小二乘法公式为:
其中,m表示样本数量,m=1...M,M为样本总数,M=B×S×C;
需要注意的是,这里的样本指的是焊点工艺参数数据集中每个焊点的特征值,是焊点工艺参数数据集的整体样本空间。例如,焊点工艺参数数据集中有3个批次,每个批次150个焊点,每个焊点有150维特征,则一共有3x150x150个数据,即M=3x150x150。
本实施例通过对焊点工艺参数数据进行分析,从而确定批次效应处理模型,实现消除由不同采集时间、不同生产线和不同焊接设备等因素带来的焊点工艺参数的批次效应。
在又一个优选实施例中,所述S3,根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计,具体包括:
S301,根据所述标准化后的焊点工艺参数数据集建立概率分布模型为:即标准化后的焊点工艺参数数据zbsc服从期望为θbc,方差为/>的正态分布;其中,焊点工艺参数数据的期望θbc服从期望为μb,方差为τb 2的正态分布,即θbc~N(μb,τb 2);焊点工艺参数数据的方差/>服从参数为αb,βb的逆伽马分布,即
需要说明的是,经验贝叶斯方法需要进行模型参数估计,通过对焊点工艺参数数据的分析,假设模型参数的分布,再对其分布进行参数估计。其参数估计又选用正态分布和逆伽马分布,其中正态分布符合焊点数据批次效应的误差变化,逆伽马分布能估计正态分布的样本方差。
其中,焊点工艺参数数据的期望θbc服从期望为μb,方差为τb 2的正态分布,即θbc~N(μb,τb 2);
在又一个优选实施例中,所述S4,根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应,具体包括:
S401,根据参数估计的结果建立批次效应处理模型为:
本实施例采用的方法在电阻点焊数据样本尺寸较小时,同样能够鲁棒地处理高维数据,消除不同批次数据间的批次效应。
例如,本实施例在车身制造过程中采集到了656个焊点工艺参数数据,每个焊点都采集到了其焊接过程中的动态电阻值、动态电流值与焊枪能量值,共150维数据。656个电阻点焊数据是采集第1、2、3、4、5天共5天的数据。
请参阅图2,图2是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例中处理批次效应前的焊点数据t-SNE降维图。为了更加清楚地展示这5天的焊点数据及其批次效应,本实施例采用t-SNE的降维可视化方法,将150维数据降到二维,以便能更加清楚地看出数据之间的差异,结果如图2所示。从图2中看出第1天、第2天和第3,4,5天分成了两个集合,产生了明显的批次效应。为了消除批次效应,减少环境等因素对焊点质量预测的影响,本实施例采用基于经验贝叶斯的电阻点焊数据批次效应处理方法。经过基于经验贝叶斯的电阻点焊数据批次效应处理后,本实施例仍采用t-SNE的方法降维观察批次效应处理后的情况,结果如图3所示,图3是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例中处理批次效应后的焊点数据t-SNE降维图。从图2和图3的对比中,可以明显看出对采集到的电阻点焊数据经过本实施例的批次效应处理后,其批次效应得到了极大的减弱。
在此基础之上,本实施例还基于消除批次效应后的焊点工艺参数数据建立支持向量机分类模型用来进行焊点质量预测。结果表明,消除批次效应后的焊点工艺参数数据能够为焊点质量预测提供更准确的样本差异信息,从而显著提升智能化焊点质量预测的结果。具体的,本实施例采用5折交叉验证的方式,每折取80%的样本数据作为训练集,分类器模型选用支持向量机;取20%的数据作为测试集,统计每折测试集上的分类准确率,详情见表1。
请参阅图4,图4是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例中采用不同分类器处理批次效应前后结果对比图。采用不同分类器方法,对批次效应处理前后的焊点工艺参数数据进行焊点质量预测,其预测结果同样得到了明显改善。
相应地,本发明还提供一种基于经验贝叶斯的数据批次效应处理装置,能够实现上述实施例中的基于经验贝叶斯的数据批次效应处理方法的所有流程。
请参阅图5,图5是本发明提供的一种基于经验贝叶斯的数据批次效应处理装置的一个优选实施例的结构示意图。所述基于经验贝叶斯的数据批次效应处理装置,包括:
数据集获取模块501,用于获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;
标准化处理模块502,用于对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;
参数估计模块503,用于根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;
批次效应处理模块504,用于根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。
优选地,所述数据集获取模块501,具体用于:
通过数据采集系统采集电阻点焊过程中的焊点工艺参数数据;
对采集到的焊点工艺参数建立焊点工艺参数数据集D,
其中,b为批次数,b=1...B;s为焊点样本数,s=1...S;c为特征参数,c=1...C。
优选地,所述标准化处理模块502,具体用于:
建立所述焊点工艺参数数据集的标准化处理模型为:
其中,焊点工艺参数数据dbsc表示在批次b中样本s的特征c的值;rc表示特征c的平均表达值;A表示焊点样本的设计矩阵;νc表示对应A的回归系数向量;θbc表示焊点数据的加性批次效应,φbc表示焊点数据的乘性批次效应;误差项服从正态分布/>φc表示所有焊点样本中特征c的标准差;
其中,m表示样本数量,m=1...M,M为样本总数,M=B×S×C;
根据Z-means标准化方法得到标准化数据公式为:
优选地,所述参数估计模块503,具体用于:
根据所述标准化后的焊点工艺参数数据集建立概率分布模型为:即标准化后的焊点工艺参数数据zbsc服从期望为θbc,方差为/>的正态分布;其中,焊点工艺参数数据的期望θbc服从期望为μb,方差为τb 2的正态分布,即θbc~N(μb,τb 2);焊点工艺参数数据的方差/>服从参数为αb,βb的逆伽马分布,即
优选地,所述批次效应处理模块504,具体用于:
根据参数估计的结果建立批次效应处理模型为:
在具体实施当中,本发明实施例提供的基于经验贝叶斯的数据批次效应处理装置的工作原理、控制流程及实现的技术效果,与上述实施例中的基于经验贝叶斯的数据批次效应处理方法对应相同,在此不再赘述。
请参阅图6,图6是本发明提供的一种基于经验贝叶斯的数据批次效应处理装置的另一个优选实施例的结构示意图。所述基于经验贝叶斯的数据批次效应处理装置包括处理器601、存储器602以及存储在所述存储器602中且被配置为由所述处理器601执行的计算机程序,所述处理器601执行所述计算机程序时实现上述任一实施例所述的基于经验贝叶斯的数据批次效应处理方法。
优选地,所述计算机程序可以被分割成一个或多个模块/单元(如计算机程序1、计算机程序2、……),所述一个或者多个模块/单元被存储在所述存储器602中,并由所述处理器601执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备中的执行过程。
所述处理器601可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,通用处理器可以是微处理器,或者所述处理器601也可以是任何常规的处理器,所述处理器601是所述终端设备的控制中心,利用各种接口和线路连接所述终端设备的各个部分。
所述存储器602主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序等,数据存储区可存储相关数据等。此外,所述存储器602可以是高速随机存取存储器,还可以是非易失性存储器,例如插接式硬盘,智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡和闪存卡(Flash Card)等,或所述存储器602也可以是其他易失性固态存储器件。
需要说明的是,上述基于经验贝叶斯的数据批次效应处理装置可包括,但不仅限于,处理器、存储器,本领域技术人员可以理解,图6的结构示意图仅仅是上述终端设备的示例,并不构成对上述终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任一实施例所述的基于经验贝叶斯的数据批次效应处理方法。
本发明实施例提供了一种基于经验贝叶斯的数据批次效应处理方法、装置及介质,通过获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。本发明实施例基于经验贝叶斯方法对焊点工艺参数数据进行批次效应处理,将批次内样本数据值收缩到批次间总体样本均值,从而实现消除焊点工艺参数数据的批次效应。并且,本实施例在电阻点焊数据样本尺寸较小时,同样能够鲁棒地处理高维数据,消除不同批次数据间的批次效应。
需说明的是,以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的系统实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (8)
1.一种基于经验贝叶斯的数据批次效应处理方法,其特征在于,包括:
获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;
对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;
根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;
根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应;
其中,所述对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集,具体包括:
建立所述焊点工艺参数数据集的标准化处理模型为:
其中,焊点工艺参数数据dbsc表示在批次b中样本s的特征c的值;rc表示特征c的平均表达值;A表示焊点样本的设计矩阵;νc表示对应A的回归系数向量;θbc表示焊点数据的加性批次效应,φbc表示焊点数据的乘性批次效应;表示批次误差项,误差项/>服从正态分布N~(0,φc 2),φc表示所有焊点样本中特征c的标准差;
其中,mb表示焊点工艺参数数据中批次b的样本数量,m=1...M,M为样本总数,M=B×S×C,B、S、C分别表示对应的b、s、c的总数;
根据Z-means标准化方法得到标准化数据公式为:
5.如权利要求4所述的基于经验贝叶斯的数据批次效应处理方法,其特征在于,所述根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应,具体包括:
根据参数估计的结果建立批次效应处理模型为:
其中,表示/>的估计值,/>表示焊点工艺参数数据的期望理论值, 表示/>的估计值,/>表示焊点工艺参数数据的标准差理论值,/> mb表示焊点工艺参数数据中批次b的样本数量,ms为采集到不同焊点数据的批次;/>为处理批次效应后的焊点工艺参数数据;
6.一种基于经验贝叶斯的数据批次效应处理装置,其特征在于,包括:
数据集获取模块,用于获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;
标准化处理模块,用于对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;
参数估计模块,用于根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;
批次效应处理模块,用于根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应;
其中,所述标准化处理模块,具体用于:
建立所述焊点工艺参数数据集的标准化处理模型为:
其中,焊点工艺参数数据dbsc表示在批次b中样本s的特征c的值;rc表示特征c的平均表达值;A表示焊点样本的设计矩阵;νc表示对应A的回归系数向量;θbc表示焊点数据的加性批次效应,φbc表示焊点数据的乘性批次效应;表示批次误差项,误差项/>服从正态分布/>φc表示所有焊点样本中特征c的标准差;
其中,mb表示焊点工艺参数数据中批次b的样本数量,m=1...M,M为样本总数,M=B×S×C,B、S、C分别表示对应的b、s、c的总数;
根据Z-means标准化方法得到标准化数据公式为:
7.一种基于经验贝叶斯的数据批次效应处理装置,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5中任意一项所述的基于经验贝叶斯的数据批次效应处理方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至5中任意一项所述的基于经验贝叶斯的数据批次效应处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110512287.6A CN113326652B (zh) | 2021-05-11 | 2021-05-11 | 基于经验贝叶斯的数据批次效应处理方法、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110512287.6A CN113326652B (zh) | 2021-05-11 | 2021-05-11 | 基于经验贝叶斯的数据批次效应处理方法、装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113326652A CN113326652A (zh) | 2021-08-31 |
CN113326652B true CN113326652B (zh) | 2023-06-20 |
Family
ID=77415231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110512287.6A Active CN113326652B (zh) | 2021-05-11 | 2021-05-11 | 基于经验贝叶斯的数据批次效应处理方法、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113326652B (zh) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3354321B2 (ja) * | 1994-11-08 | 2002-12-09 | 統市 渡辺 | 亜鉛めっき鋼板のスポット溶接自動組付け方法 |
CN107247873B (zh) * | 2017-03-29 | 2020-04-14 | 电子科技大学 | 一种差异甲基化位点识别方法 |
DE102018217364A1 (de) * | 2018-10-11 | 2020-04-16 | Robert Bosch Gmbh | Verfahren zum Überprüfen der Qualität bei einem Widerstandsschweißen von Werkstücken |
CA3133639A1 (en) * | 2019-03-22 | 2020-10-01 | Inflammatix, Inc. | Systems and methods for deriving and optimizing classifiers from multiple datasets |
US11599889B2 (en) * | 2019-11-04 | 2023-03-07 | The Boeing Company | Qualification of second-source raw materials in the presence of multiple batch effects |
CN111142065A (zh) * | 2019-12-20 | 2020-05-12 | 郑州大学 | 一种低复杂度稀疏贝叶斯矢量的估计方法及系统 |
CN113270191A (zh) * | 2021-06-18 | 2021-08-17 | 上海交通大学 | 一种数据校正及分类方法及存储介质 |
-
2021
- 2021-05-11 CN CN202110512287.6A patent/CN113326652B/zh active Active
Non-Patent Citations (1)
Title |
---|
小批量生产过程贝叶斯质量控制模型;符兴干;何桢;施亮星;崔宝;;制造业自动化(第24期);第120-123页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113326652A (zh) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108805180B (zh) | 目标对象的检测方法及装置 | |
CN111126822B (zh) | 一种工业机器人健康评估方法、装置及存储介质 | |
CN109753762B (zh) | 基于类别修正的配电网两阶段网络拓扑识别方法及装置 | |
CN110647913B (zh) | 基于聚类算法的异常数据检测方法及装置 | |
EP4050527A1 (en) | Estimation program, estimation method, information processing device, relearning program, and relearning method | |
CN113820333A (zh) | 电池极片异常检测方法、装置、上位机及检测系统 | |
CN114972339A (zh) | 用于推土机结构件生产异常检测的数据增强系统 | |
CN113326652B (zh) | 基于经验贝叶斯的数据批次效应处理方法、装置及介质 | |
CN117237678A (zh) | 用电行为异常检测方法、装置、设备及存储介质 | |
CN115601564B (zh) | 基于图像识别的胶体轮廓检测方法及系统 | |
CN117193088A (zh) | 一种工业设备监控方法、装置以及服务器 | |
CN113870754B (zh) | 一种面板检测电子信号缺陷判定的方法和系统 | |
CN115329902A (zh) | 一种数控卷板机产品异常数据分析识别方法 | |
CN115270861A (zh) | 一种产品成分数据监测方法、装置、电子设备及存储介质 | |
CN113188235A (zh) | 空调系统内传感器多源故障诊断方法、系统及设备 | |
CN112149546B (zh) | 一种信息处理方法、装置、电子设备及存储介质 | |
CN114398964A (zh) | 故障诊断方法、装置、电子设备和存储介质 | |
CN107862126B (zh) | 一种部件级信息多样性条件下的系统可靠性评估方法 | |
DE112016006839T5 (de) | Längenmessungskontrollvorrichtung, Fertigungssystem, Längenmessungskontrollverfahren und Längenmessungskontrollprogramm | |
CN108537092B (zh) | 变异红细胞识别方法及装置 | |
CN110598768B (zh) | 一种齿轮故障分类方法、分类装置及可读存储介质 | |
CN113657558B (zh) | 一种针对骶髂关节ct图像的分类评级方法及装置 | |
CN117055537B (zh) | 一种基于物联网的摩托车电控系统故障诊断方法 | |
CN116150666B (zh) | 储能系统故障检测方法、装置及智能终端 | |
CN113409025B (zh) | 一种业务数据提取方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |