CN113326652A - 基于经验贝叶斯的数据批次效应处理方法、装置及介质 - Google Patents
基于经验贝叶斯的数据批次效应处理方法、装置及介质 Download PDFInfo
- Publication number
- CN113326652A CN113326652A CN202110512287.6A CN202110512287A CN113326652A CN 113326652 A CN113326652 A CN 113326652A CN 202110512287 A CN202110512287 A CN 202110512287A CN 113326652 A CN113326652 A CN 113326652A
- Authority
- CN
- China
- Prior art keywords
- welding spot
- process parameter
- batch effect
- data set
- welding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000694 effects Effects 0.000 title claims abstract description 154
- 238000003672 processing method Methods 0.000 title claims abstract description 33
- 238000003466 welding Methods 0.000 claims abstract description 264
- 238000000034 method Methods 0.000 claims abstract description 251
- 230000008569 process Effects 0.000 claims abstract description 215
- 238000012545 processing Methods 0.000 claims abstract description 103
- 238000009826 distribution Methods 0.000 claims abstract description 60
- 238000006073 displacement reaction Methods 0.000 claims abstract description 11
- 238000004590 computer program Methods 0.000 claims description 17
- 238000003860 storage Methods 0.000 claims description 8
- 239000000654 additive Substances 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 5
- 238000013461 design Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000011425 standardization method Methods 0.000 claims description 5
- 238000013398 bayesian method Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 8
- 230000006872 improvement Effects 0.000 description 6
- 230000009467 reduction Effects 0.000 description 5
- 238000007689 inspection Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/15—Vehicle, aircraft or watercraft design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/17—Mechanical parametric or variational design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/10—Numerical modelling
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Geometry (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Pure & Applied Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Mathematics (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Manufacturing & Machinery (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Fuzzy Systems (AREA)
- Medical Informatics (AREA)
- Aviation & Aerospace Engineering (AREA)
- Automation & Control Theory (AREA)
- Resistance Welding (AREA)
Abstract
本发明公开了一种基于经验贝叶斯的数据批次效应处理方法、装置及介质,所述方法包括:获取电阻点焊过程中的焊点工艺参数数据集;其中,焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;对焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;根据标准化后的焊点工艺参数数据集建立概率分布模型,并对概率分布模型中的超参数进行参数估计;根据参数估计的结果建立批次效应处理模型,对标准化后的焊点工艺参数数据集进行批次效应处理。本发明基于经验贝叶斯方法对焊点工艺参数数据进行批次效应处理,将批次内样本数据值收缩到批次间总体样本均值,从而实现消除焊点工艺参数数据的批次效应。
Description
技术领域
本发明涉及电阻点焊技术领域,尤其涉及一种基于经验贝叶斯的数据批次效应处理方法、装置及介质。
背景技术
目前,汽车行业主要采用人工抽检的方法来检测车身焊点质量,但是该方法存在被检测焊点覆盖面窄、抽检频率低等问题,容易造成大量不合格焊点流出,导致安全隐患。为了解决这个问题,汽车行业正在尝试通过对车身电阻点焊的工艺参数进行大数据分析来建立焊接工艺参数对焊点质量的影响模型,通过对电阻点焊过程中工艺参数的实时监测来判断焊点质量,实现车身焊点质量的全检,消除不合格焊点流出导致的安全隐患。
但是,在分析大量焊点工艺参数数据的过程中,往往涉及不同生产线、不同车型与板材配合、不同焊枪、不同时间采集到的工艺参数数据。由于不同的生产线环境和焊接设备,以及相同设备在不同时间段不可避免的存在差异,可能会对采集到的数据产生明显的噪声干扰,造成不同批次的点焊数据产生与样本质量无关的随机性差异,即产生显著的批次效应。如果不能通过数据预处理消除批次效应带来的差异,就会导致后续分析及质量预测产生较大的偏差,无法反映真实的焊接质量情况。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于经验贝叶斯的数据批次效应处理方法、装置及介质,基于经验贝叶斯方法对焊点工艺参数数据进行批次效应处理,将批次内样本数据值收缩到批次间总体样本均值,从而实现消除焊点工艺参数数据的批次效应。
为了实现上述目的,本发明实施例提供了一种基于经验贝叶斯的数据批次效应处理方法,包括:
获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;
对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;
根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;
根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。
作为上述方案的改进,所述获取电阻点焊过程中的焊点工艺参数数据集,具体包括:
通过数据采集系统采集电阻点焊过程中的焊点工艺参数数据;
对采集到的焊点工艺参数数据建立焊点工艺参数数据集D,
其中,b为批次数,b=1...B;s为焊点样本数,s=1...S;c为特征参数,c=1...C。
作为上述方案的改进,所述对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集,具体包括:
建立所述焊点工艺参数数据集的标准化处理模型为:
其中,焊点工艺参数数据dbsc表示在批次b中样本s的特征c的值;rc表示特征c的平均表达值;A表示焊点样本的设计矩阵;νc表示对应A的回归系数向量;θbc表示焊点数据的加性批次效应,φbc表示焊点数据的乘性批次效应;误差项服从正态分布φc表示所有焊点样本中特征c的标准差;
其中,m表示样本数量,m=1...M,M为样本总数,M=B×S×C;
根据Z-means标准化方法得到标准化数据公式为:
作为上述方案的改进,所述根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计,具体包括:
根据所述标准化后的焊点工艺参数数据集建立概率分布模型为:即标准化后的焊点工艺参数数据zbsc服从期望为θbc,方差为的正态分布;其中,焊点工艺参数数据的期望θbc服从期望为μb,方差为τb 2的正态分布,即θbc~N(μb,τb 2);焊点工艺参数数据的方差服从参数为αb,βb的逆伽马分布,即
作为上述方案的改进,所述根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应,具体包括:
根据参数估计的结果建立批次效应处理模型为:
本发明实施例还提供了一种基于经验贝叶斯的数据批次效应处理装置,包括:
数据集获取模块,用于获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;
标准化处理模块,用于对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;
参数估计模块,用于根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;
批次效应处理模块,用于根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。
本发明实施例还提供了一种基于经验贝叶斯的数据批次效应处理装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的基于经验贝叶斯的数据批次效应处理方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任一项所述的基于经验贝叶斯的数据批次效应处理方法。
相对于现有技术,本发明实施例提供的一种基于经验贝叶斯的数据批次效应处理方法、装置及介质的有益效果在于:通过获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。本发明实施例基于经验贝叶斯方法对焊点工艺参数数据进行批次效应处理,将批次内样本数据值收缩到批次间总体样本均值,从而实现消除焊点工艺参数数据的批次效应。并且,本实施例在电阻点焊数据样本尺寸较小时,同样能够鲁棒地处理高维数据,消除不同批次数据间的批次效应。
附图说明
图1是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例的流程示意图;
图2是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例中处理批次效应前的焊点数据t-SNE降维图;
图3是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例中处理批次效应后的焊点数据t-SNE降维图;
图4是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例中采用不同分类器处理批次效应前后结果对比图;
图5是本发明提供的一种基于经验贝叶斯的数据批次效应处理装置的一个优选实施例的结构示意图;
图6是本发明提供的一种基于经验贝叶斯的数据批次效应处理装置的另一个优选实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例的流程示意图。所述基于经验贝叶斯的数据批次效应处理方法方法,包括:
S1,获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;
S2,对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;
S3,根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;
S4,根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。
具体的,本实施例首先获取在车身制造工艺中电阻点焊过程中的焊点工艺参数数据集,其中,焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值,由于这些数据为不同生产线、不同车型与板材配合、不同焊枪、不同时间采集到的工艺参数数据,因此存在显著的批次效应。并且,由于采集到的每一个焊点的工艺参数种类较多,数值差异较大,造成不同种类的工艺参数之间存在较大差异,如果不加考虑较大的数值差别,在使用经验贝叶斯方法时会产生较大偏差,本实施例为了避免这种现象,在获取到焊点工艺参数数据集后,需要对焊点工艺参数数据进行标准化处理,得到标准化后的焊点工艺参数数据集,使每个焊点的数值具有相似的总体均值和标准差。然后,根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;最后,根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。
需要说明的是,针对车身制造过程中焊点工艺参数数据存在批次效应的问题,本发明实施例采用基于经验贝叶斯方法对焊点工艺参数数据进行批次效应处理。经验贝叶斯方法的主要思想是基于“位置与尺度”模型,具体是先通过汇总每个批次间焊点工艺参数数据来估计模型参数,将批次内样本数据值收缩到批次间总体样本均值,从而对样本数据值进行调整,消除样本的批次效应。
本实施例通过对焊点工艺参数数据进行分析,从而确定批次效应处理模型,实现消除由不同采集时间、不同生产线和不同焊接设备等因素带来的焊点工艺参数的批次效应。
在另一个优选实施例中,所述S1,获取电阻点焊过程中的焊点工艺参数数据集,具体包括:
S101,通过数据采集系统采集电阻点焊过程中的焊点工艺参数数据;
S102,对采集到的焊点工艺参数数据建立焊点工艺参数数据集D,
其中,b为批次数,b=1...B;s为焊点样本数,s=1...S;c为特征参数,c=1...C。
具体的,通过数据采集系统采集电阻点焊过程中的焊点工艺参数数据,该焊点工艺参数数据包括每个焊点在焊接过程中的动态电阻值、动态电流值、动态电压值、电极位移及焊枪能量值;对采集到的焊点工艺参数数据进行汇总,建立焊点工艺参数数据集D,
其中,b为批次数,b=1...B;s为焊点样本数,s=1...S;c为特征参数,c=1...C
在又一个优选实施例中,所述S2,对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集,具体包括:
S201,建立所述焊点工艺参数数据集的标准化处理模型为:
其中,焊点工艺参数数据dbsc表示在批次b中样本s的特征c的值;rc表示特征c的平均表达值;A表示焊点样本的设计矩阵;νc表示对应A的回归系数向量;θbc表示焊点数据的加性批次效应,φbc表示焊点数据的乘性批次效应;误差项服从正态分布φc表示所有焊点样本中特征c的标准差;
其中,m表示样本数量,m=1...M,M为样本总数,M=B×S×C;
S232,根据Z-means标准化方法得到标准化数据公式为:
具体的,在获取到电阻点焊过程中的焊点工艺参数数据集后,首先建立焊点工艺参数数据集的标准化处理模型为:
其中,焊点工艺参数数据dbsc表示在批次b中样本s的特征c的值;rc表示特征c的平均表达值;A表示焊点样本的设计矩阵;νc表示对应A的回归系数向量;θbc表示焊点数据的加性批次效应,φbc表示焊点数据的乘性批次效应;误差项服从正态分布φc表示所有焊点样本中特征c的标准差;然后,采用最小二乘法对所述标准化处理模型中的参数rc,νc,θbc进行估计,得到参数估计值其中,最小二乘法公式为:
其中,m表示样本数量,m=1...M,M为样本总数,M=B×S×C;
需要注意的是,这里的样本指的是焊点工艺参数数据集中每个焊点的特征值,是焊点工艺参数数据集的整体样本空间。例如,焊点工艺参数数据集中有3个批次,每个批次150个焊点,每个焊点有150维特征,则一共有3x150x150个数据,即M=3x150x150。
本实施例通过对焊点工艺参数数据进行分析,从而确定批次效应处理模型,实现消除由不同采集时间、不同生产线和不同焊接设备等因素带来的焊点工艺参数的批次效应。
在又一个优选实施例中,所述S3,根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计,具体包括:
S301,根据所述标准化后的焊点工艺参数数据集建立概率分布模型为:即标准化后的焊点工艺参数数据zbsc服从期望为θbc,方差为的正态分布;其中,焊点工艺参数数据的期望θbc服从期望为μb,方差为τb 2的正态分布,即θbc~N(μb,τb 2);焊点工艺参数数据的方差服从参数为αb,βb的逆伽马分布,即
需要说明的是,经验贝叶斯方法需要进行模型参数估计,通过对焊点工艺参数数据的分析,假设模型参数的分布,再对其分布进行参数估计。其参数估计又选用正态分布和逆伽马分布,其中正态分布符合焊点数据批次效应的误差变化,逆伽马分布能估计正态分布的样本方差。
其中,焊点工艺参数数据的期望θbc服从期望为μb,方差为τb 2的正态分布,即θbc~N(μb,τb 2);
在又一个优选实施例中,所述S4,根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应,具体包括:
S401,根据参数估计的结果建立批次效应处理模型为:
本实施例采用的方法在电阻点焊数据样本尺寸较小时,同样能够鲁棒地处理高维数据,消除不同批次数据间的批次效应。
例如,本实施例在车身制造过程中采集到了656个焊点工艺参数数据,每个焊点都采集到了其焊接过程中的动态电阻值、动态电流值与焊枪能量值,共150维数据。656个电阻点焊数据是采集第1、2、3、4、5天共5天的数据。
请参阅图2,图2是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例中处理批次效应前的焊点数据t-SNE降维图。为了更加清楚地展示这5天的焊点数据及其批次效应,本实施例采用t-SNE的降维可视化方法,将150维数据降到二维,以便能更加清楚地看出数据之间的差异,结果如图2所示。从图2中看出第1天、第2天和第3,4,5天分成了两个集合,产生了明显的批次效应。为了消除批次效应,减少环境等因素对焊点质量预测的影响,本实施例采用基于经验贝叶斯的电阻点焊数据批次效应处理方法。经过基于经验贝叶斯的电阻点焊数据批次效应处理后,本实施例仍采用t-SNE的方法降维观察批次效应处理后的情况,结果如图3所示,图3是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例中处理批次效应后的焊点数据t-SNE降维图。从图2和图3的对比中,可以明显看出对采集到的电阻点焊数据经过本实施例的批次效应处理后,其批次效应得到了极大的减弱。
在此基础之上,本实施例还基于消除批次效应后的焊点工艺参数数据建立支持向量机分类模型用来进行焊点质量预测。结果表明,消除批次效应后的焊点工艺参数数据能够为焊点质量预测提供更准确的样本差异信息,从而显著提升智能化焊点质量预测的结果。具体的,本实施例采用5折交叉验证的方式,每折取80%的样本数据作为训练集,分类器模型选用支持向量机;取20%的数据作为测试集,统计每折测试集上的分类准确率,详情见表1。
请参阅图4,图4是本发明提供的一种基于经验贝叶斯的数据批次效应处理方法的一个优选实施例中采用不同分类器处理批次效应前后结果对比图。采用不同分类器方法,对批次效应处理前后的焊点工艺参数数据进行焊点质量预测,其预测结果同样得到了明显改善。
相应地,本发明还提供一种基于经验贝叶斯的数据批次效应处理装置,能够实现上述实施例中的基于经验贝叶斯的数据批次效应处理方法的所有流程。
请参阅图5,图5是本发明提供的一种基于经验贝叶斯的数据批次效应处理装置的一个优选实施例的结构示意图。所述基于经验贝叶斯的数据批次效应处理装置,包括:
数据集获取模块501,用于获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;
标准化处理模块502,用于对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;
参数估计模块503,用于根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;
批次效应处理模块504,用于根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。
优选地,所述数据集获取模块501,具体用于:
通过数据采集系统采集电阻点焊过程中的焊点工艺参数数据;
对采集到的焊点工艺参数建立焊点工艺参数数据集D,
其中,b为批次数,b=1...B;s为焊点样本数,s=1...S;c为特征参数,c=1...C。
优选地,所述标准化处理模块502,具体用于:
建立所述焊点工艺参数数据集的标准化处理模型为:
其中,焊点工艺参数数据dbsc表示在批次b中样本s的特征c的值;rc表示特征c的平均表达值;A表示焊点样本的设计矩阵;νc表示对应A的回归系数向量;θbc表示焊点数据的加性批次效应,φbc表示焊点数据的乘性批次效应;误差项服从正态分布φc表示所有焊点样本中特征c的标准差;
其中,m表示样本数量,m=1...M,M为样本总数,M=B×S×C;
根据Z-means标准化方法得到标准化数据公式为:
优选地,所述参数估计模块503,具体用于:
根据所述标准化后的焊点工艺参数数据集建立概率分布模型为:即标准化后的焊点工艺参数数据zbsc服从期望为θbc,方差为的正态分布;其中,焊点工艺参数数据的期望θbc服从期望为μb,方差为τb 2的正态分布,即θbc~N(μb,τb 2);焊点工艺参数数据的方差服从参数为αb,βb的逆伽马分布,即
优选地,所述批次效应处理模块504,具体用于:
根据参数估计的结果建立批次效应处理模型为:
在具体实施当中,本发明实施例提供的基于经验贝叶斯的数据批次效应处理装置的工作原理、控制流程及实现的技术效果,与上述实施例中的基于经验贝叶斯的数据批次效应处理方法对应相同,在此不再赘述。
请参阅图6,图6是本发明提供的一种基于经验贝叶斯的数据批次效应处理装置的另一个优选实施例的结构示意图。所述基于经验贝叶斯的数据批次效应处理装置包括处理器601、存储器602以及存储在所述存储器602中且被配置为由所述处理器601执行的计算机程序,所述处理器601执行所述计算机程序时实现上述任一实施例所述的基于经验贝叶斯的数据批次效应处理方法。
优选地,所述计算机程序可以被分割成一个或多个模块/单元(如计算机程序1、计算机程序2、……),所述一个或者多个模块/单元被存储在所述存储器602中,并由所述处理器601执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备中的执行过程。
所述处理器601可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,通用处理器可以是微处理器,或者所述处理器601也可以是任何常规的处理器,所述处理器601是所述终端设备的控制中心,利用各种接口和线路连接所述终端设备的各个部分。
所述存储器602主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序等,数据存储区可存储相关数据等。此外,所述存储器602可以是高速随机存取存储器,还可以是非易失性存储器,例如插接式硬盘,智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡和闪存卡(Flash Card)等,或所述存储器602也可以是其他易失性固态存储器件。
需要说明的是,上述基于经验贝叶斯的数据批次效应处理装置可包括,但不仅限于,处理器、存储器,本领域技术人员可以理解,图6的结构示意图仅仅是上述终端设备的示例,并不构成对上述终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任一实施例所述的基于经验贝叶斯的数据批次效应处理方法。
本发明实施例提供了一种基于经验贝叶斯的数据批次效应处理方法、装置及介质,通过获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。本发明实施例基于经验贝叶斯方法对焊点工艺参数数据进行批次效应处理,将批次内样本数据值收缩到批次间总体样本均值,从而实现消除焊点工艺参数数据的批次效应。并且,本实施例在电阻点焊数据样本尺寸较小时,同样能够鲁棒地处理高维数据,消除不同批次数据间的批次效应。
需说明的是,以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的系统实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种基于经验贝叶斯的数据批次效应处理方法,其特征在于,包括:
获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;
对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;
根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;
根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。
3.如权利要求2所述的基于经验贝叶斯的数据批次效应处理方法,其特征在于,所述对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集,具体包括:
建立所述焊点工艺参数数据集的标准化处理模型为:
其中,焊点工艺参数数据dbsc表示在批次b中样本s的特征c的值;rc表示特征c的平均表达值;A表示焊点样本的设计矩阵;νc表示对应A的回归系数向量;θbc表示焊点数据的加性批次效应,φbc表示焊点数据的乘性批次效应;误差项服从正态分布φc表示所有焊点样本中特征c的标准差;
8.一种基于经验贝叶斯的数据批次效应处理装置,其特征在于,包括:
数据集获取模块,用于获取电阻点焊过程中的焊点工艺参数数据集;其中,所述焊点工艺参数包括动态电阻值、动态电流值、动态电压值、电极位移和焊枪能量值;
标准化处理模块,用于对所述焊点工艺参数数据集进行标准化处理,得到标准化后的焊点工艺参数数据集;
参数估计模块,用于根据所述标准化后的焊点工艺参数数据集建立概率分布模型,并对所述概率分布模型中的超参数进行参数估计;
批次效应处理模块,用于根据参数估计的结果建立批次效应处理模型,对所述标准化后的焊点工艺参数数据集进行批次效应处理,以消除焊点工艺参数数据集的批次效应。
9.一种基于经验贝叶斯的数据批次效应处理装置,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述的基于经验贝叶斯的数据批次效应处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至7中任意一项所述的基于经验贝叶斯的数据批次效应处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110512287.6A CN113326652B (zh) | 2021-05-11 | 2021-05-11 | 基于经验贝叶斯的数据批次效应处理方法、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110512287.6A CN113326652B (zh) | 2021-05-11 | 2021-05-11 | 基于经验贝叶斯的数据批次效应处理方法、装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113326652A true CN113326652A (zh) | 2021-08-31 |
CN113326652B CN113326652B (zh) | 2023-06-20 |
Family
ID=77415231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110512287.6A Active CN113326652B (zh) | 2021-05-11 | 2021-05-11 | 基于经验贝叶斯的数据批次效应处理方法、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113326652B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5793011A (en) * | 1994-11-08 | 1998-08-11 | Toichi Watanabe | Automatic assembling system of galvanized steel sheet by spot welding |
CN107247873A (zh) * | 2017-03-29 | 2017-10-13 | 电子科技大学 | 一种差异甲基化位点识别方法 |
US20200116767A1 (en) * | 2018-10-11 | 2020-04-16 | Robert Bosch Gmbh | Method for Checking Quality when Resistance-Welding Workpieces |
CN111142065A (zh) * | 2019-12-20 | 2020-05-12 | 郑州大学 | 一种低复杂度稀疏贝叶斯矢量的估计方法及系统 |
US20200303078A1 (en) * | 2019-03-22 | 2020-09-24 | Inflammatix, Inc. | Systems and Methods for Deriving and Optimizing Classifiers from Multiple Datasets |
US20210133767A1 (en) * | 2019-11-04 | 2021-05-06 | The Boeing Company | Qualification of second-source raw materials in the presence of multiple batch effects |
CN113270191A (zh) * | 2021-06-18 | 2021-08-17 | 上海交通大学 | 一种数据校正及分类方法及存储介质 |
-
2021
- 2021-05-11 CN CN202110512287.6A patent/CN113326652B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5793011A (en) * | 1994-11-08 | 1998-08-11 | Toichi Watanabe | Automatic assembling system of galvanized steel sheet by spot welding |
CN107247873A (zh) * | 2017-03-29 | 2017-10-13 | 电子科技大学 | 一种差异甲基化位点识别方法 |
US20200116767A1 (en) * | 2018-10-11 | 2020-04-16 | Robert Bosch Gmbh | Method for Checking Quality when Resistance-Welding Workpieces |
US20200303078A1 (en) * | 2019-03-22 | 2020-09-24 | Inflammatix, Inc. | Systems and Methods for Deriving and Optimizing Classifiers from Multiple Datasets |
US20210133767A1 (en) * | 2019-11-04 | 2021-05-06 | The Boeing Company | Qualification of second-source raw materials in the presence of multiple batch effects |
CN111142065A (zh) * | 2019-12-20 | 2020-05-12 | 郑州大学 | 一种低复杂度稀疏贝叶斯矢量的估计方法及系统 |
CN113270191A (zh) * | 2021-06-18 | 2021-08-17 | 上海交通大学 | 一种数据校正及分类方法及存储介质 |
Non-Patent Citations (13)
Title |
---|
JERMAIN2014: "电阻点焊工艺参数分布研究", 《原创力文档》 * |
JERMAIN2014: "电阻点焊工艺参数分布研究", 《原创力文档》, 7 May 2018 (2018-05-07), pages 1 - 10 * |
JOHNSON W E ET AL.: "Adjusting batch effects in microarray expression data using empirical Bayes methods", 《BIOSTATISTICS》 * |
JOHNSON W E ET AL.: "Adjusting batch effects in microarray expression data using empirical Bayes methods", 《BIOSTATISTICS》, 21 April 2006 (2006-04-21), pages 118 - 127 * |
MULLER C ET AL.: "Removing batch effects from longitudinal gene expression-quantile normalization plus comBat as best approach for microarray transcriptome data", 《PLOS ONE》 * |
MULLER C ET AL.: "Removing batch effects from longitudinal gene expression-quantile normalization plus comBat as best approach for microarray transcriptome data", 《PLOS ONE》, 30 June 2016 (2016-06-30), pages 1 - 5 * |
刘奇 等: "基于UG二次开发的汽车焊点数据智能化提取与应用研究", 《模具工业》 * |
刘奇 等: "基于UG二次开发的汽车焊点数据智能化提取与应用研究", 《模具工业》, 15 July 2020 (2020-07-15), pages 68 - 72 * |
李飒 等: "基因表达数据批次效应去除方法的研究进展", 《南京农业大学学报》 * |
李飒 等: "基因表达数据批次效应去除方法的研究进展", 《南京农业大学学报》, 15 March 2019 (2019-03-15), pages 389 - 397 * |
符兴干;何桢;施亮星;崔宝;: "小批量生产过程贝叶斯质量控制模型", 制造业自动化, no. 24, pages 120 - 123 * |
邹见效 等: "一种基于最小二乘法的FPN与规则权值优化新方法", 《电子测量与仪器学报》 * |
邹见效 等: "一种基于最小二乘法的FPN与规则权值优化新方法", 《电子测量与仪器学报》, 15 July 2010 (2010-07-15), pages 667 - 672 * |
Also Published As
Publication number | Publication date |
---|---|
CN113326652B (zh) | 2023-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108923952B (zh) | 基于服务监控指标的故障诊断方法、设备及存储介质 | |
US20030185436A1 (en) | Method and system of object classification employing dimension reduction | |
CN111126822B (zh) | 一种工业机器人健康评估方法、装置及存储介质 | |
CN115359846A (zh) | 一种组学数据的批次矫正方法、装置、存储介质及电子设备 | |
CN117783745B (zh) | 用于换电柜的数据在线监测方法及系统 | |
DE112012003403T5 (de) | Verfahren, Vorrichtung und Computerprogramm zum Erkennen eines Auftretens von Abnormität | |
CN114580572B (zh) | 一种异常值的识别方法、装置、电子设备及存储介质 | |
CN116593897A (zh) | 动力电池故障诊断方法、系统、车辆及存储介质 | |
Bator et al. | Feature extraction and reduction applied to sensorless drive diagnosis | |
CN117630678A (zh) | 电动汽车电池电压异常波动故障在线诊断方法及系统 | |
CN113326652A (zh) | 基于经验贝叶斯的数据批次效应处理方法、装置及介质 | |
CN115329902A (zh) | 一种数控卷板机产品异常数据分析识别方法 | |
CN115270861A (zh) | 一种产品成分数据监测方法、装置、电子设备及存储介质 | |
CN114398964A (zh) | 故障诊断方法、装置、电子设备和存储介质 | |
CN110097922B (zh) | 基于在线机器学习的Hi-C接触矩阵中层级式TADs差异分析方法 | |
CN113188235A (zh) | 空调系统内传感器多源故障诊断方法、系统及设备 | |
CN114192583A (zh) | 一种基于Scada平台的带钢轧制过程质量监控方法和系统 | |
CN111597934A (zh) | 用于为统计应用处理训练数据的系统和方法 | |
CN114814707A (zh) | 一种智能电表应力误差分析方法、设备、终端及可读介质 | |
CN111553396A (zh) | 一种配电自动化终端在线检测方法和装置 | |
CN117055537B (zh) | 一种基于物联网的摩托车电控系统故障诊断方法 | |
CN116150666B (zh) | 储能系统故障检测方法、装置及智能终端 | |
CN116736173B (zh) | 一种储能电池模型构建和储能电池状态判定方法、装置 | |
CN108957296B (zh) | 一种基于纠缠关系判别的电路健康检测方法 | |
CN117668579A (zh) | 基于mest多旋翼无人机故障诊断方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |