CN116520772A - 基于多任务迁移学习的薄板零件数控加工质量预测方法 - Google Patents
基于多任务迁移学习的薄板零件数控加工质量预测方法 Download PDFInfo
- Publication number
- CN116520772A CN116520772A CN202310596101.9A CN202310596101A CN116520772A CN 116520772 A CN116520772 A CN 116520772A CN 202310596101 A CN202310596101 A CN 202310596101A CN 116520772 A CN116520772 A CN 116520772A
- Authority
- CN
- China
- Prior art keywords
- task
- data set
- transfer learning
- distribution
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013526 transfer learning Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000003754 machining Methods 0.000 title claims abstract description 55
- 238000009826 distribution Methods 0.000 claims abstract description 91
- 238000012549 training Methods 0.000 claims abstract description 36
- 238000012360 testing method Methods 0.000 claims abstract description 26
- 238000010276 construction Methods 0.000 claims abstract description 14
- 230000000694 effects Effects 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims description 87
- 238000005520 cutting process Methods 0.000 claims description 17
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 238000012805 post-processing Methods 0.000 claims description 5
- 238000013508 migration Methods 0.000 abstract description 16
- 230000005012 migration Effects 0.000 abstract description 16
- 230000006870 function Effects 0.000 description 21
- 230000008569 process Effects 0.000 description 21
- 238000004364 calculation method Methods 0.000 description 11
- 230000004913 activation Effects 0.000 description 8
- 230000006978 adaptation Effects 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 108700041286 delta Proteins 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000005553 drilling Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000003801 milling Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 241000512668 Eunectes Species 0.000 description 1
- 208000037004 Myoclonic-astatic epilepsy Diseases 0.000 description 1
- 239000000956 alloy Substances 0.000 description 1
- 229910045601 alloy Inorganic materials 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- HAPOVYFOVVWLRS-UHFFFAOYSA-N ethosuximide Chemical compound CCC1(C)CC(=O)NC1=O HAPOVYFOVVWLRS-UHFFFAOYSA-N 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000874 microwave-assisted extraction Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/408—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by data handling or data format, e.g. reading, buffering or conversion of data
- G05B19/4086—Coordinate conversions; Other special calculations
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/35—Nc in input of data, input till input file format
- G05B2219/35356—Data handling
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Abstract
一种基于多任务迁移学习的薄板零件数控加工质量预测方法,先形成数控加工的原始加工特征数据集集合D,对集合D内每个数据集进行预处理;针对预处理后的特征数据集集合D′,选择分布差异小的源域和目标域进行迁移,对选择的源域和目标域数据集进行训练集和测试集划分;再构建多任务特征提取的共享层网络E;然后构建基于动态分布自适应的任务专有层网络L;最后动态调整每个任务总损失的权重,完成多任务迁移学习模型R构建;本发明实现未知工况下的质量预测与并行输出多个质量指标的预测结果,多质量指标并行输出的结果精度高,质量预测的迁移效果可靠性高。
Description
技术领域
本发明属于薄板零件数控加工技术领域,具体涉及一种基于多任务迁移学习的薄板零件数控加工质量预测方法。
背景技术
数控加工是指由控制系统发出指令使刀具符合要求的各种运动,以数字和字母形式表示工件的形状和尺寸等技术要求和加工工艺要求进行加工,其可以解决加工特征复杂、精度高的零件的自动化加工。零件的数控加工变形误差是加工质量的主要体现,对其进行提前预测可以更好地控制加工变形,提高零件的合格率,降低材料损耗。随着航空航天、汽车生产、雷达通讯等行业的发展,对薄板零件的要求不断向高合格率、高精度等方面发展,而薄板零件加工特征复杂并且每个加工特征具有多个质量指标,对其数控加工质量的高效而准确地预测造成了更大困难。传统的质量预测方法往往基于机器学习与深度学习,此类方法的局限性在于构建模型的数据具有同一分布和仅对单一质量指标进行预测。然而在实际数控加工过程中,薄板零件的加工特征复杂并且加工工况会发生变化,而且每种加工特征具有多个质量指标,导致了泛化性能较差的传统质量预测方法准确率下降且建模效率低下。
苏欣等人在其发表的论文“基于机器学习的零件加工质量预测及优化”(信息技术,2021年5月)中采用某平板裂缝天线为研究对象,利用机器学习算法XGBoost对零件多个加工特征的数控加工质量进行预测,并利用遗传算法对预测结果进行质量优化,该方法采用XGBoost算法可对同一加工特征,即相同数据分布的加工特征构建预测模型,验证了加工工艺参数与加工质量间的关系,并且取得了较好的预测效果;但是,该方法仍存在不足之处,XGBoost针对相同分布的数据时建模效果较好,而在实际加工过程中,由于加工特征复杂且加工工况发生变化,导致记录的数据分布发生变化,造成XGBoost的预测性能严重下降。沈慧等人在其发表论文“面向加工领域的数字孪生模型自适应迁移方法”(上海交通大学学报,2022年1月)中采用钻选为研究对象,利用一维卷积神经网络进行数字孪生自适应迁移方法研究,实现钻削质量不同工艺参数工况下的预测;但是只是实现了单任务的学习,没有涉及到多任务的联合迁移学习,不适应多任务联合迁移场景。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供了一种基于多任务迁移学习的薄板零件数控加工质量预测方法,实现未知工况下的质量预测与并行输出多个质量指标的预测结果,多质量指标并行输出的结果精度高,质量预测的迁移效果可靠性高。
为实现上述目的,本发明采取的技术方案为:
一种基于多任务迁移学习的薄板零件数控加工质量预测方法,包括以下步骤:
步骤1)数控加工数据的采集与整理:对于采集数据集,利用相关仪器对切削力时序数据、加工工艺参数和加工质量数据进行采集;整理数据集过程中,对工件上每个加工特征的X向、Y向、Z向切削力信号数据提取时域指标,包括均值、最大值、峰峰值、标准差、均方根、偏斜度指标、峭度指标、峰值指标、脉冲指标,并与切削三要素转速、切深、进给组合成30维的数据特征;对于矩形和裂缝加工特征,其具有两个质量指标,分别为长与宽的加工质量误差;对于圆孔加工特征,其具有两个质量指标,分别为相互垂直的两个半径的加工质量误差;并将每个加工特征的数据特征与相应的两个质量指标结合,最终形成包含的9个加工特征数据集的原始加工特征数据集集合D;
步骤2)对原始加工特征数据集集合D内每个数据集进行预处理:针对原始加工特征数据集集合D,基于结合四分位数法与箱线图的方法,计算原始加工特征数据集集合D内每个数据集的统计量,依据统计量判断原始加工特征数据集集合D内每个数据集的异常值,然后删除原始加工特征数据集集合D内每个数据集的异常值,得到预处理后加工特征数据集集合D′;
步骤3)选择预处理后加工特征数据集集合D′中分布差异小的两个数据集进行迁移:针对预处理后加工特征数据集集合D′,任选其中一个数据集作为源域,其余作为目标域,依次计算与它们之间的Wasserstein距离(WD)作为两个数据集的分布相似度;然后依次以其他数据集为源域,遍历预处理后加工特征数据集集合D′得到一个分布相似度集合;计算分布相似度集合的中位数,将其作为阈值,并选择小于阈值的数据集组合作为构建多任务迁移学习模型R的源域和目标域;
步骤4)对选择的源域和目标域数据集进行训练集和测试集划分:对选择的源域数据集,将其全部数据作为训练集用于多任务迁移学习模型R的训练;对于选择的目标域数据集,将其按照7:3的比例划分为训练集和测试集,其中目标域70%的数据用于训练多任务迁移学习模型R,30%的数据用于测试多任务迁移学习模型R的训练效果;
步骤5)构建基于多任务特征提取的共享层网络E:针对选择的源域和目标域的训练集,输入由切削力与三要素组成的30维数据特征,基于多任务学习MMoE模型,构建多个并行的专家网络并行对输入的数据进行深层特征提取,然后构建以线性变化矩阵和激活函数Softmax为基础的门网络,筛选得到每个任务专有的深层特征,完成多任务特征提取的共享层网络E的构建;
步骤6)构建基于动态分布自适应的任务专有层网络L:针对共享层网络E提取的源域和目标域每个任务的深层特征,构建以线性层为基础的塔网络对多个任务进行并行的质量回归预测,并计算回归损失;同时进行每个任务的动态域适应,包括边缘域适应和条件域适应,依据多核最大均值差(MK-MMD)计算边缘分布损失并依据条件最大均值差异(CMMD)计算条件分布损失,然后利用分布动态因子动态调整两个分布损失之间的权重,最后对每个任务的回归损失、边缘分布损失、条件分布损失进行求和,计算每个任务的总损失,完成基于动态分布自适应的任务专有层网络L的构建;
步骤7)动态调整每个任务总损失的权重,完成多任务迁移学习模型R构建:针对基于动态分布自适应的任务专有层网络L得到的每个任务的损失,计算每个任务的权重动态因子,并利用任务动态因子调整多个任务之间的权重,对所有任务的损失进行求和计算多任务迁移学习模型R的总损失,然后依据多任务迁移学习模型R的总损失反向更新多任务迁移学习模型R,完成多任务迁移学习模型R的训练,得到最终的预测模型;测试多任务迁移学习模型性能,并进行超参数调优,完成多任务迁移学习模型R构建。
与现有的技术相比,本发明的技术优势为:
多质量指标并行输出的结果精度高:通过构建多任务特征提取的共享层网络,利用专家网络与门网络提取源域和目标域的深层特征,保证每个任务均能提取到自身专有的深层特征,为多任务下的迁移学习提供良好的特征准备,同时保证多任务迁移学习模型R能对加工特征的多个质量指标进行准确预测;将每个任务的总损失通过任务动态因子联结起来,得到多任务迁移学习模型R的总损失,避免了某一任务的总损失过大起主导作用,使得所有任务的总损失在训练过程中都能得到很好的下降,保证加工特征的每个质量指标均能达其最佳的预测结果;
质量预测的迁移效果可靠性高:通过Wasserstein距离(WD)在薄板零件的多个加工特征之间选择出数据分布相似的源域和目标域,有效避免了盲目选择数据集而导致的负迁移;通过构建基于动态分布自适应的任务专有层网络,同时考虑了迁移学习中的边缘分布和条件分布的域适应,并利用分布动态因子调整两者之间的权重,使其更接近于数据集的真实分布,有效地提升了迁移学习的效果,实现了薄板零件的从源域(有标签的加工特征)对目标域(无标签的加工特征)的跨加加工特征的多个质量预测,能够为实际数控加工中薄板零件提供可靠的质量预测结果。
附图说明
图1是本发明总体流程框图。
图2是本发明实施例多任务迁移学习模型的网络架构。(以任务数为2为例,若模型的任务数量多于2,可添加相应的任务专有层网络与门网络数量以预测更多的质量指标。)
图3是本发明实施例的具体网络结构。
图4是本发明实施例矩形隶属度函数的曲线图。
图5是本发明实施例目标域(矩形5.2×5.2)的任务1(质量指标1)的真实值与预测值的曲线图。
图6是本发明实施例目标域(矩形5.2×5.2)的任务2(质量指标2)的真实值与预测值的曲线图。
具体实施方式
下面结合附图和实施例对本发明进行详细说明。
实施例:在现有的数控加工中,难以对工件上数据分布不同的加工特征进行跨加工特征的质量预测,尤其在加工特征具有多个质量指标的情况下。平板裂缝天线是一种典型的薄板类零件,其具有结构轻巧、强度高、结构紧凑、质量轻等优越性能。平板裂缝天线在数控铣削过程中材料去除率高,同时刚度低容易变形,最终导致加工精度降低,加工过程不稳定的异常现象,造成了加工质量的降低与原材料的浪费。本实施例基于现有平板裂缝天线加工过程中难以进行多个加工质量指标预测和难以进行跨加工特征质量预测的问题,提出了面向薄板零件的多任务迁移学习的数控加工质量预测方法,以加工零件平板裂缝天线为加工对象,其由多个不同开槽方式的薄壁腔体组成,并且总体上有两类加工特征:矩形、裂缝和圆孔,具体上有9种加工特征(单位均为mm):矩形8.6×8.6、矩形5.2×5.2、矩形13.0×13.0、裂缝3.0×8.1、裂缝1.0×8.1、圆孔1d6.0、圆孔2d6.0、圆孔3d6.0、圆孔4d6.0。在平板表面上顺矩形平板长的方向依次独立的设有4个矩形状的封闭槽、1个矩形状的裂缝和4个相同的圆形状的通孔,其中矩形槽的中间是贯通的,裂缝的长方向与平板的长方向平行,4个圆形状的通孔放在一个矩形槽内,在数控机床加工时,按照矩形、裂缝和圆孔的顺序进行铣削加工。
参见图1,一种基于多任务迁移学习的薄板零件数控加工质量预测方法,包括以下步骤:
步骤1)数控加工数据的收集与整理:
步骤1a)采集数据集:数控机床的刀具参数信息为整体立铣刀,直径1,材质为硬质合金;加工特征为:矩形,裂缝和圆孔;加工工艺参数为:转速、切深和进给,数控机床按照矩形、裂缝和圆孔的顺序进行铣削加工,通过型号9527Ad Kistler测力仪采集加工过程的切削力时序数据,通过数控机床的MDC模块采集平板裂缝天线的工艺参数数据,通过三坐标测量仪采集平板裂缝天线的加工特征矩形、裂缝和圆孔的加工质量数据;加工特征矩形的多个加工质量指标指的是矩形封闭槽长和宽两个加工误差,裂缝的数据指的是裂缝长和宽两个加工误差,圆孔的数据指的是圆孔相互垂直方向上的两个半径的加工误差;加工误差为加工特征的设计尺寸与真实尺寸的差值;
步骤1b)整理数据集:将平板裂缝天线的矩形、裂缝和圆孔的9种尺寸不同的加工特征的数据提取出来逐一与切削力时序信号,工艺参数转速、切深和进给相对应,并且对相应的加工特征的X向、Y向、Z向的切削力时序信号进行时域指标提取,包括:均值、最大值、峰峰值、标准差、均方根、偏斜度指标、峭度指标、峰值指标、脉冲指标,使得每个加工特征包含30维的数据特征;并将每个加工特征得数据特征与相应的两个质量指标结合,最终形成包含的9个加工特征数据集的原始加工特征数据集集合D;
本发明在数控加工数据的采集中,针对平板裂缝天线零件的三种加工特征的共9个数据集,按照加工特征的种类和加工尺寸,对它们采集的加工过程数据和工艺参数数据与相应的质量数据进行对应,从而形成原始加工特诊数据集集合D,实现了各加工特征对应数据集的划分;在数据的整理过程中,针对采集的数控加工过程的切削力数据,有效地利用其时域指标对过程状态进行表征,为后续的多任务迁移学习模型R的构建提供了加工状态与质量指标之间的联系。
步骤2)对原始加工特征数据集集合D内每个数据集进行预处理:
步骤2a)计算原始加工特征数据集集合D的统计量:针对原始加工特征数据集集合D内的每个数据集,进行统计量的计算,包括上四分位数、中位数、下四分位数、四分位间距;
步骤2b)判断原始加工特诊数据集集合D的异常值:依据(1)式,原始加工特征数据集集合D内的每个数据集的两个质量指标的数据进行异常值判断:
其中,Outlier表示每个质量指标的异常值,由(1)式可知,异常值位于区间[QL-1.5×IQR,QU+1.5×IQR]之外;QU表示每个质量指标的上四分位数,QL表示每个质量指标的上四分位数,IQR表示每个质量指标的四分位间距,即IQR=QU-QL;
步骤2c)删除原始加工特征数据集集合D的异常值:将步骤2b)中检测出的异常值对应的数据进行删除,得到预处理后加工特征数据集集合D′;
本发明利用四分位数与箱线图对原始加工特征数据集进行异常值检测,由于四分位数与箱线图可以直观地检查数据分布情况(均值、分散情况),并识别异常值;故经过步骤2)处理后,可以提高加工特征原始加工特征数据集集合D的质量,为后续多任务迁移学习模型R的准确预测提供良好的数据基础,避免了多任务迁移学习模型R拟合异常点造成精度下降;
步骤3)选择预处理后加工特征数据集集合D′中分布差异小的两个数据集进行迁移:
步骤3a)计算预处理后加工特征数据集集合D′间的数据分布相似度:随机选择加工特征中任一数据集作为源域,依次将其他数据作为目标域,利用其数据特征计算一阶Wasserstein距离(WD)作为两者的相似度;一阶Wasserstein距离(WD)在度量空间(M,ρ)上定义,其计算公式如(2)式所示:
其中P为源域数据的概率分布,Q为目标域数据的概率分布;a为源域中的数据点,b为目标域中的数据点;M为以{a,b}构成的集合,ρ表示集合M中的两个数据点的距离函数,如欧氏距离;表示联合概率分布,其边缘分布为P和Q;Γ是在集合M×M内所有以P和Q为边缘分布的联合分布;
步骤3b)计算阈值并选择数据集:依据公式(2)遍历预处理后加工特征数据集集合D′,得到相似度集合O,计算相似度集合O的中位数V并将其作为阈值,将相似度低于阈值V的数据集组合选择为源域和目标域;经过计算后,本实施例选择矩形8.6×8.6作为源域,矩形5.2×5.2作为目标域的组合作为示例,目标域的数据不含有真实标签(多个质量指标的真实值);
本发明利用Wasserstein距离(WD)选择分布相似度小的两个数据进行迁移,由于Wasserstein距离(WD)可以在两个数据分布存在很少重合甚至不存在重合时,仍然可以定量计算两个分布间的距离,故经过步骤3)处理后,可以定量计算预处理后加工特征数据集集合D′中任两个数据集之间分布的距离,从中选择分布差异小的进行迁移,从而有效地避免了负迁移的发生,提高多任务迁移学习模型R的预测精度;
步骤4)对选择的源域和目标域数据集进行训练集和测试集划分:
步骤4a)源域数据集的划分:针对选择的源域数据集矩形8.6×8.6,将其全部数据作为训练集输入多任务迁移学习模型R,进行训练;
步骤4b)目标域数据集的划分:针对选择的目标域数据集矩形5.2×5.2,将其按照7:3的比例划分,其中70%的数据作为训练集与源域的训练集共同输入多任务迁移学习模型,进行训练;30%的数据作为测试集,测试多任务迁移学习模型R的效果;
本发明针对源域和目标域的数据集进行训练集和测试集的划分,由于划分的训练集可用于多任务迁移学习模型R的训练,拟合特征数据和质量指标数据之间的关系;划分的测试集可用于衡量多任务迁移学习模型R的性能,并进行超参数的寻优,故经过步骤4)处理后,可以为后续多任务迁移学习模型R的训练、性能评估和超参数选择提供准备;
步骤5)构建基于多任务特征提取的共享层网络E:
步骤5a)构建多个并行的专家网络:参照图2与图3,构建以卷积网络为基础架构的专家网络,其网络结构顺序为:卷积层1、激活函数、池化层1、卷积层2、激活函数、池化层2的单个专家网络,然后复制n份形成n个并行的专家网络,对源域和目标域输入的特征数据进行深层特征提取;参照图3,针对于本实施例,专家网络的具体结构为:一维卷积层1(in_channel=1,out_channel=2,kernel_size=2,stride=2,padding=1)、激活函数(ReLU)、一维最大池化层1(stride=2,kernel_size=2)、一维卷积层2(in_channel=2,out_channel=4,kernel_size=2,stride=2,padding=1)、激活函数(ReLU)、一维最大池化层2(stride=2,kernel_size=2);其数量设置为6,即利用6个专家网络对源域数据集矩形8.6×8.6和目标域数据集矩形5.2×5.2输入的特征数据进行深层特征提取;
步骤5b)构建门网络:参照图2与图3,构建以线性变换矩阵和激活函数Softmax为基础的门网络,将源域和目标域的输入数据与矩阵相乘进行线性变换,然后将矩阵输出结果与每个专家网络输出的深层特征进行加权相乘求和,筛选得到每个任务专有的深层特征;门网络的数量与任务数量一致,多任务特征提取的共享层网络E的计算过程如(3)(4)式所示:
其中x为多任务迁移学习模型R输入的数据特征,即表征数控加工状态的切削力时域指标数据和工艺参数数据,对于源域其表示为xs,对于目标域其表示为xt;k∈{1,2,...,K}表示第k个任务,K为多任务迁移学习模型R总的任务数量n表示专家网络的数量;表示第k个任务对应的线性变换矩阵,维度为(n,d),d为输入数据特征的维度;f表示单个专家网络的映射函数;gk表示第k个门网络的映射函数;Fk(x)表示第k个任务专有的深层数据特征,对源域其表示为/>对目标域其表示为/>
针对于本实施例,任务数量为2,即K设置为2;专家网络数量为6,即n设置为6;门网络的线性变换矩阵维度为(6,30),即(n,d)设置为(6,30);
本发明构建多任务特征提取的共享层网络E,由于共享层网E利用多个并行的专家网络同时提取输入的数据特征,并同时利用门网络对它们提取的深层特征进行选择,从而形成每个任务专有的深层特征,有效地保证每个质量预测任务既能利用自身独有的特征信息,又能包含与其他任务关联的特征信息,故经过步骤5)处理后,每个任务包含的专有性和多样性的深层特征被输入任务专有层网络L,用于实施质量预测与动态域自适应,这不仅使得每个任务可以实现自身较高精度的质量预测,而且使得进行动态域自适应时每个任务的深层特征更能表征自身的数据分布状况,从而更好地对齐源域和目标域相应任务的数据分布;
步骤6)构建基于动态分布自适应的任务专有层网络L:
步骤6a)构建塔网络:参照图2与图3,针对共享层网络E提取的源域和目标域每个任务的深层特征,构建以线性层网络为基础架构的塔网络;其网络结构顺序为:线性层1、批归一化层、激活函数、Dropout层、线性层2,其数量与任务数保持一致;参照图3,针对于本实施例,塔网络的具体结构为:线性层1(8×4)、批归一化层(4)、激活函数(ReLU)、Dropout层(0.4)、线性层2(4×1);
步骤6b)进行多个任务的质量回归预测,并计算回归预测损失:针对共享层网络E提取的源域多个任务的深层特征,塔网络利用其对多个任务进行回归预测,并以均方损失函数(MSE)对源域的预测结果计算回归预测损失;第k个回归任务的塔网络预测的计算过程如(5)(6)式所示:
其中vk表示第k个塔网络的映射函数;表示源域第k个任务的预测标签;/>表示源域第k个任务的真实标签;MSE表示均方损失函数;/>表示第k个任务的回归预测损失;对全部K个回归任务的预测结果即为任务专有层网络L的预测结果;
步骤6c)进行多个任务的动态域自适应,并计算分布损失:针对输入的源域和目标域多个任务的深层特征,利用多核最大均值差异(MK-MMD)进行边缘域自适应并计算边缘分布损失,多核最大均值差异利用多个单核的最大均值差异(MMD)计算两个数据分布的差异,然后进行求和得到;第k个任务的边缘域自适应的计算过程可由(7)式表示:
其中h∈H表示核函数的种类,H={hG(u,e),hP(u,e),...}表示核函数种类的集合,其中hG(u,e)表示使用高斯核函数映射数据u和e,hP(u,e)表示利用多项式核函数映射数据u和e;MMD表示最大均值差异;表示目标域第k个任务的深层特征;/>表示源域和目标域第k个任务的边缘分布损失;
针对步骤6b)中得到的源域和目标域得到的所有任务的预测标签,根据模糊集理论,利用矩形分布隶属度函数将预测标签离散化三个模糊类,其模糊边界分别为预测标签的上四分位数、中位数、下四分位数,如图4所示;依据划分的三个模糊类标签,利用条件最大均值差异(CMMD)对输入的源域和目标域多个任务的深层特征进行条件分布的对齐,并计算条件分布损失;第k个任务的边缘域自适应的计算过程可由(8)式表示:
其中和/>分别表示用矩形分布隶属度函数离散后的源域和目标域的第k个任务的深层特征;CMMD表示条件最大均值差异;/>表示源域和目标域第k个任务的条件分布损失;
针对得到的每个任务的边缘分布损失和条件分布损失,利用动态分布因子调整两者之间的权重,使两者可以更精确地描述数据集的真实分布情况;第k个任务的动态分布因子的计算和更新过程如(9)式所示:
其中表示第k个任务的边缘分布距离;/>表示第k个任务的条件分布距离;两者的计算过程如(10)式所示:
步骤6d)计算每个任务的总损失:参照图2,根据步骤6a)~6c)得到的每个任务各个部分的损失,对其进行求和得到每个任务的总损失;第k个任务总损失的计算过程如(11)式所示:
其中Lossk表示第k个任务总损失;λ表示动态自适应损失所的占比权重,是一个超参数,每个任务的λ均设置相同;
本发明构建基于动态分布自适应的任务专有层网络L,由于任务专有层网络L中同时进行每个任务的质量预测和动态域自适应,对源域每个任务进行质量预测可以保证多任务迁移学习模型R拟合源域的输入特征和质量指标的关系,从而使多任务迁移学习模型R学习源域的知识;对源域和目标域进行动态域适应可以将源域边缘分布和条件分布与目标域进行对齐,从而使得目标域更好地学习源域的分布知识;而动态分布因子可以动态调整边缘分布和条件分布的相对权重,使得它们更符合源域和目标域真实的数据分布情况,故经过步骤6)处理后,多任务迁移学习模型R不仅可以学到可靠的源域知识,还可以将源域的知识迁移到目标域的多个任务上,保证每个任务都能得到精确的质量预测结果,提升了多任务迁移学习模型R预测的可信度。
步骤7)动态调整每个任务总损失的权重,完成多任务迁移学习模型R构建:
步骤7a)计算每个任务的权重动态因子:针对步骤6)得到的每个任务的总损失,利用权重动态因子对其进行动态调整,避免损失过大的任务起主导作用的现象;第k个任务的权重动态因子的计算过程如(12)式所示:
其中wk表示第k个任务的权重因子,代表每个任务总损失所占的权重;γ表示控制权重动态因子柔软度的温度,是一个超参数;exp为指数函数;δ表示多任务迁移学习模型R当前的迭代次数;εk(δ-1)表示第δ-1次迭代时第k个任务总损失的相对下降率,其计算过程如(13)式所示:
其中εk(δ-1)从多任务迁移学习模型R的第3次迭代开始计算;当δ=1,2时,εk设置成1,不再计算εk(δ-1);
步骤7b)计算多任务迁移学习模型R的总损失:联结步骤6d)中得到的第k个任务的总损失以及7a)中相对应的第k个任务的权重动态因子,得到模型R的总损失,并依据其进行模型R的训练和反向更新;模型R总损失的计算过程可由(14)式表示:
步骤7c)测试多任务迁移学习模型R性能,并进行超参数调优:在多任务迁移学习模型R的每一次迭代过程中,利用源域和目标域的训练集进行训练后,向多任务迁移学习模型R中输入目标域的测试集,使用两个性能评价指标:平均绝对值误差(MAE)、均方根误差(RMSE),对目标域测试集的多个质量指标的预测值进行评价,并依据评价结果对多任务迁移学习模型R的超参数进行调优;影响多任务迁移学习模型R的超参数及其遍历列表具体有:数据集批次大小(batch size)[32,64,128]、模型学习率(learning rate)[0.0001,0.001.0.01]、自适应部分比重(λ)[0.5,1,2,4,8]、影响权重动态因子的温度(γ)[1,2,4,8];使用for循环对上述多种超参数的组合进行遍历,构建每种组合对应的多任务迁移学习模型,比较每个模型下目标域测试集的平均绝对值误差和均方根误差,选择精度最高的模型对应的超参数组合,实现多任务迁移学习模型R的调优;
经过循环遍历,本实施例多任务迁移学习模型R的最佳超参数组合为:数据集批次大小(batch size):32、模型学习率(learning rate):0.001、自适应部分比重(λ):2、影响权重动态因子的温度(γ):2。
本发明动态调整每个任务总损失的权重,完成多任务迁移学习模型R构建,由于多任务迁移学习模型R的训练过程中会不可避免地出现某个任务训练损失过大而主导多任务迁移学习模型R训练的情况,导致其训练效果好而其他任务预测效果差。而引入权重动态因子则可以保证每个任务训练损失占比达到动态平衡,使得多任务迁移学习模型R中每个任务均能到达理想的最优状态。基于多任务迁移学习模型R性能的测试情况进行超参数调优,可以保证各项超参数的选择达到最优,从而使多任务迁移学习模型R更好地拟合特征与多个质量指标之间的关系,并具备较强的泛化能力。故经过步骤7)处理后,不仅使得多任务迁移学习模型R对目标域多个任务的预测达到最优,而且还可以通过最优的各项超参数保证多任务迁移学习模型R的整体预测效果达到最好,保证预测结果具有较高的可靠性。
下面结合仿真实验对本实施例的技术效果进行说明:
仿真条件与内容:
1)仿真条件:本实施例仿真采用12th Gen Intel(R)Core(TM)i5-12500H 2.5GHz处理器,编译器使用PyCharm(Community Edition)version:11.0.15+10-b2043.56 amd64,编译语言使用Python 3.9.12,编译环境为anaconda version:conda 4.12.0;
2)仿真内容:基于平板裂缝天线的9种加工特征,选择数据分布相似的数据集组合:源域(矩形8.6×8.6)、目标域(矩形5.2×5.2),完成基于两者的多任务迁移学习预测模型的构建,实现从源域(矩形8.6×8.6)向目标域(矩形5.2×5.2)数据分布知识的迁移,输出目标域测试集中多个任务(质量指标)的预测结果、性能评价指标和预测的可视化效果图;
实验结果与分析:
1)多任务迁移学习模型R的性能评价指标:
本实施例通过仿真,得到多任务迁移学习模型R的目标域(矩形5.2×5.2),参见表1,表1为本实施例针对目标域(矩形5.2×5.2)测试集得到的多任务迁移学习模型两个任务的性能评价指标表:
表1
从表1中可以看出,本实施例中目标域(矩形)测试集的两项性能评价指标都较低,说明多任务迁移学习模型R的预测效果好,精度高;
2)预测结果的可视化效果图:
本实施例的预测曲线还能可视化展示,目标域(矩形5.2×5.2)测试集任务1(矩形长误差)的真实值与预测值的曲线如图5所示,任务2(矩形宽误差)的真实值与预测值的曲线如图6所示,图5和图6的横坐标均为加工工件的编号,纵坐标均为目标域对应任务的加工误差,图中预测曲线的类型均为虚线,加工零件的真实数据曲线的类型均为实线。从目标域测试集的两个任务的预测值曲线可以看出,预测曲线十分接近真实曲线,而且变化趋势相同,两个任务整体的平均绝对值误差和均方误差否在合理范围内。总的来说本实施例的目标域(矩形5.2×5.2)两个任务的预测曲线都较大程度上接近于真实曲线,预测效果较好。
综上所述,本发明公开了一种基于多任务迁移学习的薄板零件数控加工质量预测方法,解决了对薄板零件多个加工特征跨数据分布预测和并行预测多个质量指标的问题,实现步骤包括:采集并整理数据集;对整理的数据集进行预处理;选择数据分布相似的源域和目标域;划分源域和目标域的训练集和测试集;构建多任务特征提取的共享层网络;构建基于动态自适应的任务专有层网络;输出目标域测试集多个任务的预测结果,进行模型调优,完成多任务迁移学习模型的构建;本发明将多任务学习和迁移学习相结合进行薄板零件的跨数据分布的多个质量指标预测,得到目标域高精度的预测结果。整个方案严谨,完整,建模效率和预测精度高,用于薄板零件的多个质量指标的预测,有效提升建模效率。
Claims (8)
1.一种基于多任务迁移学习的薄板零件数控加工质量预测方法,其特征在于,包括以下步骤:
步骤1)形成数控加工的原始加工特征数据集集合D;
步骤2)对原始加工特征数据集集合D内每个数据集进行预处理;
步骤3)选择预处理后加工特征数据集集合D′中分布差异小的两个数据集进行迁移;
步骤4)对选择的源域和目标域数据集进行训练集和测试集划分;
步骤5)构建多任务特征提取的共享层网络E;
步骤6)构建基于动态分布自适应的任务专有层网络L;
步骤7)动态调整每个任务总损失的权重,完成多任务迁移学习模型R构建。
2.根据权利要求1所述的方法,其特征在于,所述的步骤1)具体为:对工件上每个加工特征的X向、Y向、Z向切削力信号数据提取时序特征,包括均值、最大值、峰峰值、标准差、均方根、偏斜度指标、峭度指标、峰值指标、脉冲指标,并与切削三要素转速、切深、进给组合成30维的数据特征;对于矩形和裂缝加工特征,其具有两个质量指标,分别为长与宽的加工质量误差;对于圆孔加工特征,其具有两个质量指标,分别为相互垂直的两个半径的加工质量误差;并将每个加工特征的数据特征与相应的两个质量指标结合,最终形成包含的9个加工特征数据集的原始加工特征数据集集合D。
3.根据权利要求1所述的方法,其特征在于,所述的步骤2)具体为:针对原始加工特征数据集集合D,结合四分位数法与箱线图对原始加工特征数据集集合D内每个数据集的两个质量指标的异常值进行检测,并对异常值进行删除,得到预处理后加工特征数据集集合D′。
4.根据权利要求1所述的方法,其特征在于,所述的步骤3)具体为:针对预处理后加工特征数据集集合D′,首先其中任一个作为源域,其余作为目标域,依次计算与它们之间的Wasserstein距离(WD)作为数据集的分布相似度;然后依次以其他为源域,遍历整个预处理后加工特征数据集集合D′得到一个分布相似度集合;计算分布相似度集合的中位数,将其作为阈值,并选择小于阈值的数据集组合作为构建模型的源域和目标域。
5.根据权利要求1所述的方法,其特征在于,所述的步骤4)具体为:对选择的源域数据集,将其全部数据作为训练集用于多任务迁移学习模型R的训练;对于选择的目标域数据集,将其按照7:3的比例划分为训练集和测试集,其中目标域70%的数据用于多任务迁移学习模型R的训练,30%的数据用于测试多任务迁移学习模型R的训练效果。
6.根据权利要求1所述的方法,其特征在于,所述的步骤5)具体为:针对选择的源域和目标域的训练集,输入由切削力与三要素组成的30维数据特征,基于多任务学习MMoE模型,利用多个由卷积层构成的专家网络并行提取输入数据的深层特征,然后由Softmax层构成的门网络筛选对每个任务重要的特征,分别得到每个任务的专有深层特征,完成多任务特征提取的共享层网络E的构建。
7.根据权利要求1所述的方法,其特征在于,所述的步骤6)具体为:针对共享层网络E提取的源域和目标域每个任务的深层特征,基于动态分布自适DDAN模型,利用由线性层构成的塔网络对多个任务进行并行的质量回归预测,并计算回归损失;同时进行每个任务的边缘分布自适应和条件分布自适应,依据多核最大均值差(MK-MMD)与条件最大均值差异(CMMD)计算两个自适应模块的分布损失,然后利用分布动态因子动态调整两个分布损失之间的权重,最后对每个任务的回归损失、边缘分布损失、条件分布损失进行求和,得到每个任务的总损失,完成基于动态分布自适应的任务专有层网络L的构建。
8.根据权利要求1所述的方法,其特征在于,所述的步骤7)具体为:针对基于动态分布自适应的任务专有层网络L得到的每个任务的损失,利用任务动态因子调整多个任务之间的权重,对所有任务的损失进行求和得到多任务迁移学习模型R的总损失,然后依据多任务迁移学习模型R的总损失反向更新多任务迁移学习模型R,完成多任务迁移学习模型R的训练,得到预测模型;再利用目标域的测试集对预测模型的评价,然后依据评价结果对预测模型的超参数进行调优,完成任务迁移学习模型R构建。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310596101.9A CN116520772A (zh) | 2023-05-24 | 2023-05-24 | 基于多任务迁移学习的薄板零件数控加工质量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310596101.9A CN116520772A (zh) | 2023-05-24 | 2023-05-24 | 基于多任务迁移学习的薄板零件数控加工质量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116520772A true CN116520772A (zh) | 2023-08-01 |
Family
ID=87406432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310596101.9A Pending CN116520772A (zh) | 2023-05-24 | 2023-05-24 | 基于多任务迁移学习的薄板零件数控加工质量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116520772A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117112857A (zh) * | 2023-10-23 | 2023-11-24 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 一种适用于工业智能制造的加工路径推荐方法 |
CN117407693A (zh) * | 2023-10-20 | 2024-01-16 | 湖北大学 | 基于部分域自适应和分位数回归的非侵入式负荷检测方法 |
CN117649906A (zh) * | 2024-01-30 | 2024-03-05 | 浙江大学 | 一体化铝合金结构件铸造质量预测方法、电子设备、介质 |
-
2023
- 2023-05-24 CN CN202310596101.9A patent/CN116520772A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407693A (zh) * | 2023-10-20 | 2024-01-16 | 湖北大学 | 基于部分域自适应和分位数回归的非侵入式负荷检测方法 |
CN117112857A (zh) * | 2023-10-23 | 2023-11-24 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 一种适用于工业智能制造的加工路径推荐方法 |
CN117112857B (zh) * | 2023-10-23 | 2024-01-05 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 一种适用于工业智能制造的加工路径推荐方法 |
CN117649906A (zh) * | 2024-01-30 | 2024-03-05 | 浙江大学 | 一体化铝合金结构件铸造质量预测方法、电子设备、介质 |
CN117649906B (zh) * | 2024-01-30 | 2024-04-26 | 浙江大学 | 一体化铝合金结构件铸造质量预测方法、电子设备、介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116520772A (zh) | 基于多任务迁移学习的薄板零件数控加工质量预测方法 | |
CN113176761B (zh) | 多加工特征薄板零件质量预测与工艺参数优化方法 | |
CN103745273B (zh) | 一种半导体制造过程的多性能预测方法 | |
CN110303380A (zh) | 一种数控机床刀具剩余寿命预测方法 | |
CN115276006A (zh) | 一种用于电力集成系统的负荷预测的方法及系统 | |
CN108241901B (zh) | 一种基于预测数据的变压器预警评估方法及装置 | |
CN113065703A (zh) | 一种结合多种模型的时间序列预测方法 | |
CN110569566B (zh) | 一种板带力学性能预测方法 | |
CN109472088A (zh) | 一种页岩气调产井生产压力动态预测方法 | |
CN111985845B (zh) | 一种异构Spark集群的节点优先级调优方法 | |
CN114905335A (zh) | 一种结合域对抗和卷积神经网络的刀具磨损预测方法 | |
CN116502455A (zh) | 一种激光选区熔化技术的工艺参数确定方法及系统 | |
CN113705897A (zh) | 一种面向工业铜箔生产的产品质量预测方法及系统 | |
CN115034140A (zh) | 一种基于关键控制因子的地表水水质变化趋势预测方法 | |
CN111062118B (zh) | 一种基于神经网络预测分层的多层软测量建模系统及方法 | |
CN114066135A (zh) | 一种水质模型参数自动优化方法及系统 | |
CN112330029A (zh) | 一种基于多层convLSTM的渔场预测计算方法 | |
CN108363830B (zh) | 一种面向功能性晾衣架的原理方案非合作-合作博弈决策方法 | |
CN112365022A (zh) | 一种基于多阶段的发动机轴承故障预测方法 | |
Sun et al. | A soft-sensing model for predicting cement-specific surface area based on inception-residual-quasi-recurrent neural networks | |
CN116736796B (zh) | 一种钢材尺寸的高精度工控方法 | |
CN117732886B (zh) | 一种基于级联智能诊断的热轧质量预控制方法 | |
CN117495211B (zh) | 基于自适应周期发现的工业母机加工工件质量预测方法 | |
Xu et al. | Cutting-state identification of machine tools based on improved Dempster-Shafer evidence theory | |
CN116757545A (zh) | 一种基于多任务深度学习的多级制造系统质量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |