CN113553762A - 基于焊接曲线进行焊点分析的神经网络及建立方法 - Google Patents
基于焊接曲线进行焊点分析的神经网络及建立方法 Download PDFInfo
- Publication number
- CN113553762A CN113553762A CN202110730090.XA CN202110730090A CN113553762A CN 113553762 A CN113553762 A CN 113553762A CN 202110730090 A CN202110730090 A CN 202110730090A CN 113553762 A CN113553762 A CN 113553762A
- Authority
- CN
- China
- Prior art keywords
- neural network
- welding
- data
- curve
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003466 welding Methods 0.000 title claims abstract description 205
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 144
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000012549 training Methods 0.000 claims abstract description 63
- 238000012360 testing method Methods 0.000 claims abstract description 43
- 230000008569 process Effects 0.000 claims abstract description 39
- 238000001514 detection method Methods 0.000 claims abstract description 30
- 238000007619 statistical method Methods 0.000 claims abstract description 7
- 238000007405 data analysis Methods 0.000 claims abstract description 6
- 238000013507 mapping Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 82
- 238000004458 analytical method Methods 0.000 claims description 22
- 238000003062 neural network model Methods 0.000 claims description 19
- 230000004913 activation Effects 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000002159 abnormal effect Effects 0.000 claims description 10
- 230000000306 recurrent effect Effects 0.000 claims description 9
- 239000000463 material Substances 0.000 claims description 8
- 238000005265 energy consumption Methods 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 229910000679 solder Inorganic materials 0.000 claims description 5
- 230000002457 bidirectional effect Effects 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 230000001537 neural effect Effects 0.000 claims description 3
- 230000010355 oscillation Effects 0.000 claims description 3
- 230000035945 sensitivity Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000002184 metal Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000009021 linear effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000000280 densification Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000007769 metal material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000009659 non-destructive testing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于焊接曲线进行焊点分析的神经网络及建立方法。包括数据采集模块,用于获取历史的焊点数据,焊点数据包括焊点检测数据和焊接工艺参数,焊点检测数据包括焊接曲线数据;数据分析模块,用于对焊接曲线数据利用统计学分析方法提取特征值;标签映射模块,用于通过数据标注对焊点检测数据中的每个子数据和焊接工艺参数中的每个子参数分别给定对应的标签;神经网络模块,用于将焊接曲线数据或特征值和标签汇总成的数据集按比例分为训练集和测试集,利用训练集中焊接曲线数据或特征值和标签生成神经网络训练数据集,并为焊接曲线数据或特征值建立对应的神经网络,利用神经网络训练集对神经网络进行训练,得到训练完成的神经网络。
Description
技术领域
本发明属于焊接工艺技术领域,具体涉及一种基于焊接曲线进行焊点分析的神经网络及建立方法。
背景技术
焊接工艺以焊枪为工具,以焊点的形式将两种或两种以上同种或异种金属材料通过原子或分子之间的结合和扩散连接成一体,焊点质量的优劣将对包括汽车、建筑、船舶等钢结构质量产生极大的影响。
通过搜集焊接过程中焊枪传感器检测到的数据,可以绘制出单一焊点焊接时,电压、电流、电阻、功率随时间变化的曲线,如图1所示,简称为焊接曲线。图1描述了一个焊点焊接过程中,金属贴合致密、金属升温融化、焊核形成焊接完毕三个阶段焊接曲线(焊点电流、电压、电阻和功率)的特征变化。
现有技术通过图像识别技术检测焊接质量、焊点,这类方法存在数据量大、计算量大、噪声干扰、效率低等缺点。工业中积累了大量自动实时采集的焊接工艺数据,不适用这类方法。而焊接曲线分析方向的研究很少。
利用神经网络等先进的计算机智能方法,在焊接过程中,产生的焊接曲线是每个焊点独有的,其中蕴藏了极具价值的数据,对焊接工业大数据进行数据分析挖掘、异常识别、故障诊断,这种非破坏性的检测、预测分析,将极大节约故障识别成本,提供更多焊点优化、流程优化、工艺优化的方法。
如中国发明专利申请号201310133509.9公开了一种机器人焊接质量视觉检测装置及其检测方法。该方法的视觉系统将接收的图片信息与标准配方数据进行比对,对焊接前焊接拼接误差、焊接后的焊点质量及焊接过程进行实时检测和判断。
该专利具有以下缺点:需要耗费极大的数据储存空间。一张普通数码相机的高清照片通常在3MB~14MB大小,而一个焊点电流、电压、电阻、功率的焊接曲线文件仅有24KB,一份包含了27000多个焊点特征值的文件仅仅只占27MB的储存空间。工业中的焊点数巨大,不可能对每个焊点进行图像拍摄、图像处理、焊点识别,识别过的图像由于占用空间巨大,也不便于进行长时间保存。
如中国发明专利申请号201410256520.9公开了一种焊缝焊接质量自动检测装置,采用超声波探测头进行测试。
该专利具有以下缺点:需要耗费极大的计算能力。神经网络所需的计算能力在很大程度上取决于数据的大小。一张的高清照片,每个像素点的RGB值都将作为输入数据传入神经网络,远远高出只有含有特征值的焊接曲线输入数据。
如德国柏林BAM公司C.Jacobsen等人提出了使用神经网络检测数字化底片中裂纹缺陷的方法,方法先对射线图像进行形态学滤波、高斯滤波、GWIMV滤波、FFT滤波、小波变换等处理,再对各线灰度波形在滤波效果中提取特征并采用设计网络判别该线灰度波形是否包含裂纹缺陷,
该专利具有以下缺点:存在信息损失和误判的问题。通常图像识别技术需要利用图像切割、降低分辨率等方式进行输入数据的预处理,一定会造成焊点信息损失或误判的问题,从而降低了神经网络的准确率。
综上,通过图像识别技术判断异常焊点的方法,需要在储存空间、计算能力、设备环境等产生巨大投入,且无法避免效率低、信息损失、误判的缺点。
发明内容
本发明的目的就是为了解决上述背景技术存在的不足,提供一种基于焊接曲线进行焊点分析的神经网络及建立方法。
本发明采用的技术方案是:一种基于焊接曲线进行焊点分析的神经网络,包括数据采集模块,用于获取历史的焊点数据,焊点数据包括焊点检测数据和焊接工艺参数,焊点检测数据包括焊接曲线数据;
数据分析模块,用于对焊接曲线数据利用统计学分析方法提取特征值;
标签映射模块,用于通过数据标注对焊点检测数据中的每个子数据和焊接工艺参数中的每个子参数分别给定对应的标签;
神经网络模块,用于将焊接曲线数据或特征值和标签汇总成的数据集按比例分为训练集和测试集,利用训练集中焊接曲线数据或特征值和标签生成神经网络训练数据集,并为焊接曲线数据或特征值建立对应的神经网络,利用神经网络训练集对神经网络进行训练,得到训练完成的神经网络。
焊点数据包括焊点检测数据以及焊接工艺参数。其中焊点检测数据包括自动实时采集的焊接过程中电流、电压、电阻曲线数据、能耗检测数据、焊接探伤数据、破坏性检测数据等;焊接工艺参数包括焊接电流、电弧电压、焊条直径,被焊工件的材质、牌号、化学成分,焊件结构类型,被选焊枪的型号等。
焊接曲线数据:通过焊枪传感器接收电压、电流、电阻、功率随时间变化的数值,整合成一张单个焊点实际采集数据表(明细表),存入硬盘。同时,综合数据表(主表)中增加该焊接曲线的相关数据,包括时间、焊接曲线文件名、明细表储存路径、产品号、焊点索引等数据信息。
常用如统计学中的一些基础指标来做数据分析,比如平均数、众数、中位数、最大值、最小值、时间导数等;然后提取焊点曲线中电压、电流、电阻的特征值。
数据特征提取,得到每个焊点焊接曲线的特征值,常见的特征值包括:焊接材料致密时的时间点、电阻值、梯度,金属升温融化时时间点、电阻值、梯度,飞溅点个数,能耗等。
标签可以由多方面数据综合得到,例如对焊接电阻曲线分析时,标签可以为特征值与异常曲线的关系;标签可以结合实际生产情况,焊接材料、焊接工艺、焊点质量、检测结果,判断特征值与实际异常焊点的关系;标签可以为特征值与焊接飞溅之间的关系;标签可以为特征值与能耗之间的关系等。
还包括测试数据模块,用于将测试集中焊接曲线数据或特征值和标签输入到已完成训练的神经网络中进行准确率测试。
还包括调试模块,用于基于测试数据模块中的准确率测试结果优化神经网络。
建立神经网络的过程为:
利用全连接神经网络模型用于焊点分析:
对于数据集D=(x1,y1),(x2,y2),…,(xN,yN),其中N为样本数量,当焊点判断为是否异常的结果时,yi={0,1}∈Y,即此处为二分类结果,同理,当标签为焊点异常的多种分类结果时,焊点材质分类、能耗分类、存在飞溅点个数分类、修磨参数分类,即对于数据集 D,yi={a,b,c...}∈Y,同样可以采用全连接神经网络,
(1)、按比例确定神经网络的训练数据集、验证数据集和确定训练回合数epoch;
(2)、定义神经网络的输入层,焊接曲线特征值的个数作为输入层的节点数,输入为一个一维张量X∈RM,M为特征数量;
(4)、设置神经网络的每层隐藏层的激活函数,由神经网络的输入层得到每层隐藏层的输出值Ot=σ(X·W+b),b为偏置项。将每层隐藏层的输出值作为下一个隐藏层的输入值;
(5)、设置神经网络的输出层的节点个数,节点个数即为yi中的元素个数,设置输出层的激活函数,输出层得到的 Ot=σ(X·W+b)为前向传播的结果;
(6)、设置神经网络的损失函数,将前向传播的结果与标签值通过损失函数计算,得到loss张量;
(7)、选择神经网络的反向传播算法,导入损失函数结果,对所有权重值求偏导,利用选择的优化器优化权重参数,优化器选择SGD(随机梯度下降法)便于利用学习率衰减,抑制震荡,不断调整神经网络中的所有权重参数,使得计算出的交叉熵趋向于零,从而使得损失函数得到的loss张量降低到最小,设置学习率,得到权重值与神经网络模型即为训练的结果;
(8)、将测试数据中的特征值导入到训练好的神经网络模型中,求得标签的预测结果,利用准确率计算公式得到神经网络预测结果的准确率,评判该模型的准确度,继续优化网络参数,提高准确度。
建立神经网络的过程为:
利用循环神经网络用于焊点分析:
(1)、按比例确定神经网络的训练数据集、验证数据集和确定训练回合数epoch;
(2)、定义神经网络的输入层,焊接曲线特征值的个数作为输入层的节点数,输入为一个一维张量X∈RM,M为特征数量;
(3)、设置隐藏层,定义隐藏层ht层数,循环神经网络RNN 分为单向RNN和双向RNN,单向RNN从过去获取信息从而来处理后面的信息,而双向RNN从过去和未来分别获取上下文的信息,单向RNN,W为输入层xi到隐藏层ht的权重,U为隐藏层间的权重,V为隐藏层ht到输出层yi的权重;
(4)、设置激活函数,由步骤(3)中的输入值及权重得到以下公式
yt=g(Vht)
ht=f(Wxt+Uht-1)
将ht不断带入yt可以描述前向神经网络的计算过程;
(5)、设置输出层的节点个数,节点个数即为yi中的元素个数;
(6)、设置损失函数,选择交叉熵作为损失函数,将输出层得到的结果,即前向传播的结果与标签值通过损失函数计算,得到loss;
(7)、设置反向传播规则,导入损失函数结果,对权重值求偏导,利用选择的优化器优化参数,优化器选择RMSProp优化器,会将梯度除以最近幅度的移动平均值,不断调整网络中的权重参数,使得计算出的交叉熵慢慢趋向于零,使得损失函数降低到最小,设置学习率,得到权重值与神经网络模型即为训练的结果;
(8)、将测试数据中的特征值导入到训练好的神经网络模型中,求得标签的预测结果,利用准确率计算公式得到神经网络预测结果的准确率,评判该模型的准确度,继续优化网络参数,提高准确度。
激活函数包括Sigmoid函数,公式定义:其中,x为输入值,e为自然常数;或ReLU函数,公式定义: f(u)=max(0,u),其中,u为输入值;或Softmax函数,公式定义:其中,e为自然常数,zi为多分类问题的各个预测结果。
损失函数包括二元交叉熵binary_crossentropy函数,公式定义:
Hp(q)=-∑q(x)log2p(x)
其中,p(x)是多分类问题中x的预测概率,q(x)为x的分布。
一种建立基于焊接曲线进行焊点分析的神经网络的方法,包括以下步骤:
步骤1:获取历史的焊点数据,焊点数据包括焊点检测数据和焊接工艺参数,焊点检测数据包括焊接曲线数据;
步骤2:通过对焊接曲线数据利用统计学分析方法提取特征值;
步骤3:通过数据标注对焊点检测数据中的每个子数据和焊接工艺参数中的每个子参数分别给定对应的标签;
步骤4:将焊接曲线数据或特征值和标签汇总成的数据集按比例分为训练集和测试集,利用训练集中焊接曲线数据或特征值和标签生成神经网络训练数据集,并为焊接曲线数据或特征值建立对应的神经网络,利用神经网络训练集对神经网络进行训练,得到训练完成的神经网络。
将测试集中焊接曲线数据或特征值和标签输入到已完成训练的神经网络中进行准确率测试。
基于准确率测试结果优化神经网络。
通过进行归一化处理后的将数据集,其中70%的数据作为训练数据,30%的数据作为测试数据,输入至神经网络模型中,进行迭代训练,当数据足够大时,可以将训练数据比例提高至90%以上,然后将训练。
为达到更高的准确率(标准或者条件),进行调参优化,例如神经网络层数、每层神经元的个数、初始化权值与偏置、训练集数、学习率、迭代次数等,从而使得神经网络模型通过测试数据得到的准确率趋近最大化。
本发明的有益效果是:对于利用超声波、X光射线、照相等技术进行的焊接焊点焊缝的检测,本质为利用图像识别技术进行焊点接检测的方法。而对于每个焊点形成过程中,产生的焊接曲线是独有的,其中蕴藏了极具价值的数据,利用焊接曲线的特征值进行神经网络训练,具有以下优点:
1.可以进行非破坏性检测。
2.储存空间极大减少,利于数据长久储存。
3.所需要的计算能力少。
4.不存在图像噪声问题。
5.由于数据量极大减少,所需要的储存空间、计算能力减少,从而使神经网络训练、预测的耗时减少,提高了效率。
附图说明
图1为现有技术示意图;
图2为本发明的结构示意图;
图3为本发明流程示意图;
图4为全连接神经网络(Fully-connected Neural Network)解决二分类问题示例模型图;
图5为循环神经网络RNN隐藏层结构图;
图6为Sigmoid函数示意图;
图7为ReLU函数示意图;
图8为反向传播的RNN模型结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细说明,便于清楚地了解本发明,但它们不对本发明构成限定。
如图2所示,本发明包括数据采集模块,用于获取历史的焊点数据,焊点数据包括焊点检测数据和焊接工艺参数,焊点检测数据包括焊接曲线数据;
数据分析模块,用于对焊接曲线数据利用统计学分析方法提取特征值;
标签映射模块,用于通过数据标注对焊点检测数据中的每个子数据和焊接工艺参数中的每个子参数分别给定对应的标签;
神经网络模块,用于将焊接曲线数据或特征值和标签汇总成的数据集按比例分为训练集和测试集,利用训练集中焊接曲线数据或特征值和标签生成神经网络训练数据集,并为焊接曲线数据或特征值建立对应的神经网络,利用神经网络训练集对神经网络进行训练,得到训练完成的神经网络。
还包括测试数据模块,用于将测试集中焊接曲线数据或特征值和标签输入到已完成训练的神经网络中进行准确率测试。
还包括调试模块,用于基于测试数据模块中的准确率测试结果优化神经网络。
关于神经网络模型的选择,优选的:例如在特征数量较少的情况下,可以选用多层全连接神经网络模型(Fully-connected Neural Network),并利用反向传播算法(backpropagation)模型进行训练;将焊接曲线直接作为输入值时,由于输入的焊接曲线数据可视为含有依赖性且是序列模式的特征值,所以可以使用循环神经网络(Recurrent NeuralNetwork,RNN),对判断提供预测。其次在运算平台与计算框架的选择上,可以利用诸如TensorFlow、PyTorch等流行的机器学习框架在本地部署,或者利用诸如华为ModelArts、百度EasyDL等云端AI开发平台,能快速实现神经网络模型的构建与训练。
建立神经网络的过程为:
如图5所示,利用全连接神经网络模型(Fully-connected Neural Network)用于焊点分析:
对于数据集D=(x1,y1),(x2,y2),…,(xN,yN),其中N为样本数量,当焊点判断为是否异常的结果时,yi={0,1}∈Y,即此处为二分类结果,同理,当标签为焊点异常的多种分类结果时,焊点材质分类、能耗分类、存在飞溅点个数分类、修磨参数分类,即对于数据集 D,yi={a,b,c...}∈Y,同样可以采用全连接神经网络,
(1)、按比例确定神经网络的训练数据集、验证数据集和确定训练回合数epoch;
(2)、定义神经网络的输入层,焊接曲线特征值的个数作为输入层的节点数,输入为一个一维张量X∈RM,M为特征数量;
(4)、设置神经网络的每层隐藏层的激活函数,由神经网络的输入层得到每层隐藏层的输出值Ot=σ(X·W+b),b为偏置项。将每层隐藏层的输出值作为下一个隐藏层的输入值;
(5)、设置神经网络的输出层的节点个数,节点个数即为yi中的元素个数,设置输出层的激活函数,输出层得到的 Ot=σ(X·W+b)为前向传播的结果;
(6)、设置神经网络的损失函数,将前向传播的结果与标签值通过损失函数计算,得到loss张量;
(7)、选择神经网络的反向传播算法,导入损失函数结果,对所有权重值求偏导,利用选择的优化器优化权重参数,优化器选择SGD(随机梯度下降法)便于利用学习率衰减,抑制震荡,不断调整神经网络中的所有权重参数,使得计算出的交叉熵趋向于零,从而使得损失函数得到的loss张量降低到最小,设置学习率,得到权重值与神经网络模型即为训练的结果;
(8)、将测试数据中的特征值导入到训练好的神经网络模型中,求得标签的预测结果,利用准确率计算公式得到神经网络预测结果的准确率,评判该模型的准确度,继续优化网络参数,提高准确度。
建立神经网络的过程为:
利用循环神经网络用于焊点分析:
将焊接曲线作为输入时,每一个时间点对应的电压值、电流值、电阻值即为样本数量。值得注意的是,输入特征需要进行标准化,由于每次焊接点完成时间不同,需要填充数据,保证输入的一维数组,即具有相同的长度。
(1)、按比例确定神经网络的训练数据集、验证数据集和确定训练回合数epoch;
(2)、定义神经网络的输入层,焊接曲线特征值的个数作为输入层的节点数,输入为一个一维张量X∈RM,M为特征数量;
(3)、设置隐藏层,定义隐藏层ht层数,循环神经网络RNN 分为单向RNN和双向RNN,单向RNN从过去获取信息从而来处理后面的信息。而双向RNN从过去和未来分别获取上下文的信息,单向RNN,W为输入层xi到隐藏层ht的权重,U为隐藏层间的权重,v为隐藏层ht到输出层yi的权重(参考图6所示);
(4)、设置激活函数,由步骤(3)中的输入值及权重得到以下公式
yt=g(Vht)
ht=f(Wxt+Uht-1)
将ht不断带入yt可以描述前向神经网络的计算过程;
(5)、设置输出层的节点个数,节点个数即为yi中的元素个数;
(6)、设置损失函数,选择交叉熵作为损失函数,将输出层得到的结果,即前向传播的结果与标签值通过损失函数计算,得到loss;
(7)、设置反向传播规则,导入损失函数结果,对权重值求偏导,利用选择的优化器优化参数,优化器选择RMSProp优化器,会将梯度除以最近幅度的移动平均值,不断调整网络中的权重参数,使得计算出的交叉熵慢慢趋向于零,使得损失函数降低到最小,设置学习率,得到权重值与神经网络模型即为训练的结果;
(8)、将测试数据中的特征值导入到训练好的神经网络模型中,求得标签的预测结果,利用准确率计算公式得到神经网络预测结果的准确率,评判该模型的准确度,继续优化网络参数,提高准确度。
如图7、图8所示,激活函数包括Sigmoid函数,公式定义:其中,x为输入值,e为自然常数;或ReLU函数,公式定义:f(u)=max(0,u),其中,u为输入值;或Softmax 函数,公式定义:其中,e为自然常数,zi为多分类问题的各个预测结果。
Sigmoid函数,由于两端饱和,在传播过程中容易丢弃信息,造成梯度消失问题。而ReLU函数作为激活函数的训练结果效果有提高。多项研究也证明,由于其分段线性性质,导致其前传、后传、求导均为分段线性,使梯度下降以及反向传播更加有效率,避免了梯度爆炸和梯度消失问题,使神经网络更容易学习优化[5] [6]。相较于Sigmoid函数,隐藏层使用ReLU函数达到相同准确率更节省时间。在浅层神经网络中,推荐组合多种激活函数,进行训练。
最后一层可以不设置激活函数,也可以选择Sigmoid函数, O∈[0,1],使得输出值落在[0,1]的区间,最大值为预测结果。同样也可以选择Softmax函数(归一化指数函数),O∈[0,1],输出值落在[0,1]的区间,并且所有输出值之和为1,预测值中最大的即为预测结果,例如[0.7,0.3]则预测结果为焊点异常。
Softmax函数由以下公式定义:
在许多开源的深度学习框架中,Softmax函数被集成到所谓的CrossEntropy的损失函数中。例如Pytorch中 CrossEntropyLoss损失函数是Log-Softmax函数和负对数似然函数(NLLoss)的组合,即调用该函数时,没有必要再在全连接层后面加入Softmax函数。
损失函数包括二元交叉熵binary_crossentropy函数,公式定义:
Hp(q)=-∑q(x)log2p(x)
其中,p(x)是多分类问题中x的预测概率,q(x)为x的分布。
二分类问题的判断结果标签,yi={0,1},即yi是符合Bernoulli 分布,θ为标签为1时出现的概率,即模型预测的分布参数,并且有:
Pθ(y=1)=θ
Pθ(y=0)=1-θ
由此可以得到:
Pθ(y=1)=θy(1-θ)(1-y)
对于数据集D,其对数似然,即目标函数为:
将对数似然函数加上负号可得损失函数,即为yi与θ的交叉熵Hy(θ):
对负的对数似然函数Hy(θ)求导:
α为学习率,θ的更新方式为
以下从数学角度,简单介绍使用交叉熵作为损失函数,利用焊接曲线和循环神经网络进行焊点分析:
输出层预测结果为ot,真实值为yt
准确率Accuracy由以下公式定义:
其中,nTP为预测焊点异常时判断正确的个数,nFP为预测焊点正常时判断正确的个数,nTN为预测焊点异常时判断错误的个数,nFN为预测焊点正常时判断错误个数。
如图3所示,一种建立基于焊接曲线进行焊点分析的神经网络的方法,包括以下步骤:
步骤1:获取历史的焊点数据,焊点数据包括焊点检测数据和焊接工艺参数,焊点检测数据包括焊接曲线数据;
步骤2:通过对焊接曲线数据利用统计学分析方法提取特征值;
步骤3:通过数据标注对焊点检测数据中的每个子数据和焊接工艺参数中的每个子参数分别给定对应的标签;标签可以由多方面数据综合得到,例如对焊接电阻曲线分析时,标签可以为特征值与异常曲线的关系;标签可以结合实际生产情况,焊接材料、焊接工艺、焊点质量、检测结果,判断特征值与实际异常焊点的关系;标签可以为特征值与焊接飞溅之间的关系;标签可以为特征值与能耗之间的关系等。如图4所示,T1与T2点重合,可以视作特殊曲线,或者结合焊接材料添加标签;
步骤4:将焊接曲线数据或特征值和标签汇总成的数据集按比例分为训练集和测试集,利用训练集中焊接曲线数据或特征值和标签生成神经网络训练数据集,并为焊接曲线数据或特征值建立对应的神经网络,利用神经网络训练集对神经网络进行训练,得到训练完成的神经网络。
将测试集中焊接曲线数据或特征值和标签输入到已完成训练的神经网络中进行准确率测试。
基于准确率测试结果优化神经网络。
本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (10)
1.一种基于焊接曲线进行焊点分析的神经网络,其特征在于:包括
数据采集模块,用于获取历史的焊点数据,焊点数据包括焊点检测数据和焊接工艺参数,焊点检测数据包括焊接曲线数据;
数据分析模块,用于对焊接曲线数据利用统计学分析方法提取特征值;
标签映射模块,用于通过数据标注对焊点检测数据中的每个子数据和焊接工艺参数中的每个子参数分别给定对应的标签;
神经网络模块,用于将焊接曲线数据或特征值和标签汇总成的数据集按比例分为训练集和测试集,利用训练集中焊接曲线数据或特征值和标签生成神经网络训练数据集,并为焊接曲线数据或特征值建立对应的神经网络,利用神经网络训练集对神经网络进行训练,得到训练完成的神经网络。
2.根据权利要求1所述的基于焊接曲线进行焊点分析的神经网络,其特征在于:还包括测试数据模块,用于将测试集中焊接曲线数据或特征值和标签输入到已完成训练的神经网络中进行准确率测试。
3.根据权利要求2所述的基于焊接曲线进行焊点分析的神经网络,其特征在于:还包括调试模块,用于基于测试数据模块中的准确率测试结果优化神经网络。
4.根据权利要求1所述的基于焊接曲线进行焊点分析的神经网络,其特征在于:建立神经网络的过程为:
利用全连接神经网络模型用于焊点分析:
对于数据集D=(x1,y1),(x2,y2),…,(xN,yN),其中N为样本数量,当焊点判断为是否异常的结果时,yi={0,1}∈Y,即此处为二分类结果,同理,当标签为焊点异常的多种分类结果时,焊点材质分类、能耗分类、存在飞溅点个数分类、修磨参数分类,即对于数据集D,yi={a,b,c...}∈Y,同样可以采用全连接神经网络,
(1)、按比例确定神经网络的训练数据集、验证数据集和确定训练回合数epoch;
(2)、定义神经网络的输入层,焊接曲线特征值的个数作为输入层的节点数,输入为一个一维张量X∈RM,M为特征数量;
(4)、设置神经网络的每层隐藏层的激活函数,由神经网络的输入层得到每层隐藏层的输出值ot=σ(X·W+b),b为偏置项。将每层隐藏层的输出值作为下一个隐藏层的输入值;
(5)、设置神经网络的输出层的节点个数,节点个数即为yi中的元素个数,设置输出层的激活函数,输出层得到的ot=σ(X·W+b)为前向传播的结果;
(6)、设置神经网络的损失函数,将前向传播的结果与标签值通过损失函数计算,得到loss张量;
(7)、选择神经网络的反向传播算法,导入损失函数结果,对所有权重值求偏导,利用选择的优化器优化权重参数,优化器选择SGD便于利用学习率衰减,抑制震荡,不断调整神经网络中的所有权重参数,使得计算出的交叉熵趋向于零,从而使得损失函数得到的loss张量降低到最小,设置学习率,得到权重值与神经网络模型即为训练的结果;
(8)、将测试数据中的特征值导入到训练好的神经网络模型中,求得标签的预测结果,利用准确率计算公式得到神经网络预测结果的准确率,评判该模型的准确度,继续优化网络参数,提高准确度。
5.根据权利要求1所述的基于焊接曲线进行焊点分析的神经网络,其特征在于:建立神经网络的过程为:
利用循环神经网络用于焊点分析:
(1)、按比例确定神经网络的训练数据集、验证数据集和确定训练回合数epoch;
(2)、定义神经网络的输入层,焊接曲线特征值的个数作为输入层的节点数,输入为一个一维张量X∈RM,M为特征数量;
(3)、设置隐藏层,定义隐藏层ht层数,循环神经网络RNN分为单向RNN和双向RNN,单向RNN从过去获取信息从而来处理后面的信息,而双向RNN从过去和未来分别获取上下文的信息,单向RNN,W为输入层xi到隐藏层ht的权重,U为隐藏层间的权重,V为隐藏层ht到输出层yi的权重;
(4)、设置激活函数,由步骤(3)中的输入值及权重得到以下公式
yt=g(Vht)
ht=f(Wxt+Uht-1)
将ht不断带入yt可以描述前向神经网络的计算过程;
(5)、设置输出层的节点个数,节点个数即为yi中的元素个数;
(6)、设置损失函数,选择交叉熵作为损失函数,将输出层得到的结果,即前向传播的结果与标签值通过损失函数计算,得到loss;
(7)、设置反向传播规则,导入损失函数结果,对权重值求偏导,利用选择的优化器优化参数,优化器选择RMSProp优化器,会将梯度除以最近幅度的移动平均值,不断调整网络中的权重参数,使得计算出的交叉熵慢慢趋向于零,使得损失函数降低到最小,设置学习率,得到权重值与神经网络模型即为训练的结果;
(8)、将测试数据中的特征值导入到训练好的神经网络模型中,求得标签的预测结果,利用准确率计算公式得到神经网络预测结果的准确率,评判该模型的准确度,继续优化网络参数,提高准确度。
7.根据权利要求5或6所述的基于焊接曲线进行焊点分析的神经网络,其特征在于:损失函数包括二元交叉熵binary_crossentropy函数,公式定义:
Hp(q)=-∑q(x)log2p(x)
其中,p(x)是多分类问题中x的预测概率,q(x)为x的分布。
8.一种建立基于焊接曲线进行焊点分析的神经网络的方法,其特征在于:包括以下步骤:
步骤1:获取历史的焊点数据,焊点数据包括焊点检测数据和焊接工艺参数,焊点检测数据包括焊接曲线数据;
步骤2:通过对焊接曲线数据利用统计学分析方法提取特征值;
步骤3:通过数据标注对焊点检测数据中的每个子数据和焊接工艺参数中的每个子参数分别给定对应的标签;
步骤4:将焊接曲线数据或特征值和标签汇总成的数据集按比例分为训练集和测试集,利用训练集中焊接曲线数据或特征值和标签生成神经网络训练数据集,并为焊接曲线数据或特征值建立对应的神经网络,利用神经网络训练集对神经网络进行训练,得到训练完成的神经网络。
9.根据权利要求8所述的基于焊接曲线进行焊点分析的神经网络的方法,其特征在于:还包括以下步骤:将测试集中焊接曲线数据或特征值和标签输入到已完成训练的神经网络中进行准确率测试。
10.根据权利要求8所述的基于焊接曲线进行焊点分析的神经网络的方法,其特征在于:还包括以下步骤:基于准确率测试结果优化神经网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110730090.XA CN113553762A (zh) | 2021-06-29 | 2021-06-29 | 基于焊接曲线进行焊点分析的神经网络及建立方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110730090.XA CN113553762A (zh) | 2021-06-29 | 2021-06-29 | 基于焊接曲线进行焊点分析的神经网络及建立方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113553762A true CN113553762A (zh) | 2021-10-26 |
Family
ID=78102508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110730090.XA Pending CN113553762A (zh) | 2021-06-29 | 2021-06-29 | 基于焊接曲线进行焊点分析的神经网络及建立方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113553762A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023078170A1 (zh) * | 2021-11-04 | 2023-05-11 | 北京北方华创微电子装备有限公司 | 半导体工艺配方获取方法、系统及半导体工艺设备 |
CN116644863A (zh) * | 2023-07-25 | 2023-08-25 | 山东德丰重工有限公司 | 钢结构焊缝质量预测管理方法及系统 |
CN116989694A (zh) * | 2023-08-04 | 2023-11-03 | 深圳市汇和通传感技术有限公司 | 基于3d轮廓扫描的尺寸定位检测系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1480713A (zh) * | 2003-07-23 | 2004-03-10 | 天津大学 | 多信息融合技术确定铝合金板材电阻点焊熔核面积的方法 |
CN101241001A (zh) * | 2008-02-28 | 2008-08-13 | 河北工业大学 | 一种铝合金电阻点焊熔核直径实时检测的方法 |
CN104730109A (zh) * | 2015-02-28 | 2015-06-24 | 重庆理工大学 | 一种基于动态电阻曲线的电阻点焊焊点质量检测方法 |
CN111047225A (zh) * | 2020-01-10 | 2020-04-21 | 惠州光弘科技股份有限公司 | 一种基于边缘侧模型处理的smt表面组装组件焊点的质量评定方法 |
-
2021
- 2021-06-29 CN CN202110730090.XA patent/CN113553762A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1480713A (zh) * | 2003-07-23 | 2004-03-10 | 天津大学 | 多信息融合技术确定铝合金板材电阻点焊熔核面积的方法 |
CN101241001A (zh) * | 2008-02-28 | 2008-08-13 | 河北工业大学 | 一种铝合金电阻点焊熔核直径实时检测的方法 |
CN104730109A (zh) * | 2015-02-28 | 2015-06-24 | 重庆理工大学 | 一种基于动态电阻曲线的电阻点焊焊点质量检测方法 |
CN111047225A (zh) * | 2020-01-10 | 2020-04-21 | 惠州光弘科技股份有限公司 | 一种基于边缘侧模型处理的smt表面组装组件焊点的质量评定方法 |
Non-Patent Citations (3)
Title |
---|
夏裕俊: "电阻点焊质量监控技术研究进展与分析", 《中国机械工程》 * |
王广勇: "车身焊接技术现状及发展趋势", 《汽车工艺与材料》 * |
魏雷: "镀锌板电阻点焊质量评判方法的研究", 《中国优秀硕士学位论文全文数据库 (工程科技Ⅰ辑)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023078170A1 (zh) * | 2021-11-04 | 2023-05-11 | 北京北方华创微电子装备有限公司 | 半导体工艺配方获取方法、系统及半导体工艺设备 |
CN116644863A (zh) * | 2023-07-25 | 2023-08-25 | 山东德丰重工有限公司 | 钢结构焊缝质量预测管理方法及系统 |
CN116644863B (zh) * | 2023-07-25 | 2023-10-20 | 山东德丰重工有限公司 | 钢结构焊缝质量预测管理方法及系统 |
CN116989694A (zh) * | 2023-08-04 | 2023-11-03 | 深圳市汇和通传感技术有限公司 | 基于3d轮廓扫描的尺寸定位检测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113553762A (zh) | 基于焊接曲线进行焊点分析的神经网络及建立方法 | |
US10417524B2 (en) | Deep active learning method for civil infrastructure defect detection | |
Liu et al. | Survey: State of the art in NDE data fusion techniques | |
CN111915572B (zh) | 一种基于深度学习的自适应齿轮点蚀定量检测系统及方法 | |
CN110363746B (zh) | 一种基于卷积神经网络的超声无损检测信号分类方法 | |
CN110992349A (zh) | 一种基于深度学习的地下管道异常自动化定位与识别方法 | |
CN112070134A (zh) | 电力设备图像分类方法、装置、电力设备及存储介质 | |
CN111783616B (zh) | 一种基于数据驱动自学习的无损检测方法 | |
KR102360769B1 (ko) | 시편의 검사를 위한 알고리즘 모듈들의 자동 선택 | |
CN115439458A (zh) | 基于深度图注意力的工业图像缺陷目标检测算法 | |
CN116258175A (zh) | 一种基于主动学习的焊缝缺陷智能识别模型进化方法 | |
Ghoshal et al. | On cost-sensitive calibrated uncertainty in deep learning: An application on covid-19 detection | |
CN112183555B (zh) | 焊接质量的检测方法、系统、电子设备和存储介质 | |
CN113283467A (zh) | 一种基于平均损失和逐类选择的弱监督图片分类方法 | |
Huang et al. | Quality control on manufacturing computer keyboards using multilevel deep neural networks | |
Tsekhmystro et al. | Study of methods for searching and localizing objects in images from aircraft using convolutional neural networks | |
Maalmi et al. | Towards automatic analysis of ultrasonic time-of-flight diffraction data using genetic-based Inverse Hough Transform | |
EP4016388A1 (en) | Automatic inspection using artificial intelligence models | |
CN117787480B (zh) | 基于Res-LSTM的焊缝成形质量实时预测方法 | |
Momot et al. | Analysis of the influence of the threshold level of binarization on the efficiency of segmentation of images of surface defects in steel by the U-NET network | |
Zhu et al. | A Bidirectional Self-Rectifying Network with Bayesian Modelling for Vision-Based Crack Detection | |
Cherkasov et al. | Detection of Defects in Welded Butt Joints Based on Laser Scanning: Neural Networks Approach | |
Zhang et al. | Research of integrating prior knowledge into abnormal behavior recognition model of EV charging station | |
AlShareef et al. | CNN-Based Detection Of Welding Crack Defects In Radiographic Non-Destructive Testing | |
Medak | Deep learning-based methods for defect detection from ultrasound images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211026 |
|
RJ01 | Rejection of invention patent application after publication |