发明内容
本发明的目的在于针对目前塑性加工领域工艺规则获取困难、同时又对塑性成形仿真所产生的结果数据开发利用不足,提出一种新的基于数值仿真与决策树算法的塑性成形工艺规则获取方法,对数值模拟结果数据蕴涵的大量的潜在工艺知识进行挖掘,获取易于计算机表示与存储的显式规则,缩短工艺规则库的建立周期,提高规则库质量,同时为仿真结果的深层次定向解释提供有效途径,将数值仿真从设计验证层次提升到设计驱动层次。
为实现这样的目的,本发明基于数值模拟技术与数据挖掘中的决策树算法,提出一种新颖的数值仿真与决策树算法相结合的塑性成形工艺规则获取方法。首先建立塑性成形工艺过程数值仿真模型,在从工艺条件参数中选取条件属性集合、确定评价成形性能的决策属性集合后,进行数值模拟试验设计,通过仿真试验得到大量计算结果数据,即塑性成形工艺信息源。对数值仿真结果数据进行离散化预处理,形成以离散数据表示的决策表。对于决策表组成的数据集合,根据计算决策属性关于整个集合的期望信息量、各条件属性的期望信息量与信息熵(Entropy),进而计算各条件属性的信息增益比。根据各条件属性信息增益比的大小确定条件属性对于集合的重要程度,按条件属性重要程度依次确定决策树的根节点与各级子节点,对数据表进行划分后得到初始的决策树。通过比较子树的预测错误率和单独一个子叶的预测错误率的方法对决策树进行修剪。最后从修剪后的决策树上从根到树叶的各条路径归纳得到工艺规则。
本发明方法的整个过程包括塑性成形过程数值仿真建模与计算、数值仿真结果数据的预处理、决策树生成、决策树的修剪获取四个基本步骤:
1、塑性成形过程的数值仿真建模与计算
根据产品的要求,从塑性成形工艺相关参数中选取条件属性集合,确定评价成形性能的决策属性集合;将设计参数与工艺参数作为设计变量进行正交拉丁方的实验设计,得到一个用于数值模拟实验的设计参数与工艺参数的精简集合。然后采用塑性成形数值模拟软件建立塑性成形过程仿真模型,根据实验设计方案对产品塑性成形过程进行数值仿真计算,获得各种物理量在产品成形中分布演化的大量结果数据,也就是用于知识挖掘所需的塑性成形工艺信息源数据。这些数据是海量的,一般都以平面文件(Flat File)的形式存储在计算机硬盘上。
2、数值仿真结果数据的预处理
将数值仿真结果数据经检查、清理后集成到数据库中,从仿真结果数据库中提取相应的设计特征与工艺特征,(比如冲压产品的破裂、起皱等)。根据领域常识或采用自动离散化方法(如等距离划分、等频率划分、聚类分析、适应性划分等)对这些通常以浮点型表示的连续型数据进行离散化处理,获得离散型数据(如整型、字符串型、枚举型等),以便于为粗糙集算法所利用。以产品的设计特征和工艺特征作为条件属性,产品评价特征作为决策属性,建立决策表(Decision Table),决策表中的数值用离散数据表达。通常条件属性用数字1、2、3、…来表示不同的条件等级,决策属性分别用具有描述意义的单词来表示。
3、决策树生成
将决策表组成的数据集合作为论域,根据决策属性的取值划分计算整个论域的期望信息量;然后分别以每个条件属性对决策属性进行分类,计算每个条件属性期望信息量,然后计算每个条件属性的信息熵,用以表示以该条件属性为扩展属性分类后集合的不纯度。以整个论域的期望信息量和各条件属性的期望信息量之差作为各条件属性的信息增益量,信息增益量与各自的期望信息量即为条件属性的信息增益比。以信息增益比最大的条件属性作为根属性(即决策树的根节点)去划分论域,得到若干个根属性子集。在各个根属性子集上计算其它条件属性关于根属性子集的信息增益比,以信息增益比最大的属性作为第二级节点。在剩余条件属性中取对于第二级节点属性子集信息增益比最大的属性作为第三级节点。依此类推,直到所有的条件属性都成为决策树节点。决策树的各级节点反映了其对应的条件属性的重要程度,于是就按条件属性重要程度完成了对数据决策表的划分,得到初始的决策树。
4、决策树的修剪
比较子树的预测错误率和单独一个子叶的预测错误率,如果单叶的错误率并不比子树的错误率更高,就用子叶代替子树。修剪后的决策树上从根到树叶的每条路径对应一条工艺规则,沿着路径的每个属性值组合形成规则前件(“IF”部分),叶节点包含类预测,形成规则后件(“THEN”部分)。于是在修剪后的决策树上从根到树叶的各条路径归纳得到工艺规则。
本发明基于数值仿真与决策树算法获取塑性成形工艺规则,一方面可以避免领域专家知识获取困难问题,扩展塑性成形领域知识来源;另一方面提高了塑性成形仿真结果数据的利用价值,打破了数据和信息之间的鸿沟,将数据“坟墓”转变为知识“金块”。通过本发明可以将数值模拟从设计验证层次上升至设计驱动层次,是一种有效和简捷的塑性成形工艺规则获取新途径。
本发明可用于塑性成形新产品新工艺的工艺规则获取,可用于新型钢板研发、汽车覆盖件制造、电子冲压件产品开发、飞机钣金件制造、铝型材挤压等领域。
具体实施方式
为更好地理解本发明的技术方案,以下结合附图和具体的实施例作进一步描述。
在本发明实施中,首先建立塑性成形工艺过程数值仿真模型,在从各种工艺条件参数中选取条件属性集合、确定评价成形性能的决策属性集合后,进行数值模拟试验设计,通过仿真试验得到大量计算结果数据。对数值仿真结果数据进行离散化预处理,形成决策表,即塑性成形工艺信息源。对于决策表组成的数据集合,根据计算决策属性关于整个集合的期望信息量、各条件属性的期望信息量与信息熵,进而计算各条件属性的信息增益比。根据各条件属性信息增益比的大小确定条件属性对于集合的重要程度,按条件属性重要程度依次确定决策树的根节点与各级子节点,对数据表进行划分后得到初始的决策树。通过比较子树的预测错误率和单独一个子叶的预测错误率的方法对决策树进行修剪。最后从修剪后的决策树上从根到树叶的各条路径归纳得到工艺规则。工艺规则可以充实到产品的工艺规则库,支持产品设计。
实施例
方盒形零件拉深成形是一种具有代表性的塑性加工过程。本发明以图1所示的方盒形零件拉深成形为例。板料为AKDQ钢板,模具由冲头、凹模、压边圈三部分组成,在压边圈四边布置相等长度和深度的拉延筋。在本实施例中考虑的重要工艺参数包括压边力、板料与工具之间的摩擦系数、拉延筋距离中心线的距离、拉延筋长度和拉延筋的深度。本发明的具体实施步骤如下:
1、塑性成形过程的数值仿真建模与计算
以压边力、摩擦系数、拉延筋距离中心线的距离、拉延筋长度以及拉延筋的高度作为条件属性(分别由BHF、FC、ODB、LDB和DDB表示),以冲压过程常见的两种成形缺陷---破裂与起皱(分别由Cracking和Wrinkling表示)作为决策属性,以法兰外缘法向最大高度差值衡量起皱程度,以厚度减薄率作为拉裂的判据。根据正交拉丁方的实验设计方法,共取52组不同的工艺、材料参数设置,建立如图2所示的仿真模型,采用板材成形模拟软件ETA-DYNAFORM对方盒件拉深成形进行模拟。模拟实验设计及相应的计算结果列于表1。
表1
摩擦 拉延筋的 拉延筋距离
编 压边力 拉延筋长度 是否破裂 是否起皱
系数 高 度 中心线的距
号 BHF(N) LDB(mm) Cracking Wrinkling
FC DDB(mm) 离ODB(mm)
1 5000 0.01 2 45 10 0 0
2 5000 0.03 2.5 48 15 0 1
… … … … … … … …
52 20000 0.2 5 65 35 1 0
2、数值仿真结果数据的预处理
从仿真计算结果的数据文件中提取相关特征值(法兰外缘法向最大高度差和厚度减薄率)作为决策属性,以设计参数与工艺参数作为条件属性,构造决策表,决策表的每一行表示一个对象或实例,每一列表示一个属性。通过数据聚类方法并结合领域常识,对数值仿真所产生的连续数据进行离散化。条件属性数据离散化标准如表2所示。在决策属性中,是否破裂按减薄率划分为两个取值范围:safe,crack;是否起皱按起皱高度也划分为两个取值范围:safe,wrinkle。
表2
离散取值 压边力 摩擦系数 拉延筋的 拉延筋距 拉延筋长
BHF(N) FC 高度 离中心线 度
DDB(mm) 的距离 LDB(mm)
ODB(mm)
1 [5000,10000] [0,0.1] [2,3] [40,50] [10,25]
2 (10000,15000] (0.1,0.15] (3,4] (50,60] (25,45]
3 (15000,20000] (0.15,0.2] (4,5] (60,70] (45,65)
分别取值为1、2、3来表示各条件属性取值的低、中、高程度。离散化后的结果形成决策表如表3所示。
表3
编号 |
压边力BHF |
摩擦系数FC |
拉延筋的高度DDB |
拉延筋距离中心线的距离ODB |
拉延筋长度LDB |
是否破裂与起皱CRACKING & WRINKLING |
1 |
1 |
1 |
1 |
1 |
1 |
safe safe |
2 |
1 |
1 |
1 |
1 |
1 |
safe wrinkle |
… |
… |
… |
… |
… |
… |
… |
52 |
3 |
3 |
3 |
3 |
2 |
crack safe |
3、决策树的生成
将决策表组成的数据集合作为论域,根据决策属性的取值类别划分,可以将数据集合分成四类:s1:crack & safe(3),s2:crack & wrinkle(9),s3:safe & safe(15),s4:safe & wrinkle(13)),这四类数据分别在52个样本中占3、9、15、13个样本,比例分别为p1=3/52,p1=3/52,p1=3/52,p1=3/52,则整个论域完全分类的期望信息量为
然后分别以每个条件属性对决策属性进行分类,计算该条件属性包含的信息量,以及该条件属性各个值的信息量,进而求得该属性的信息熵。
以条件属性压边力(BHF)为例说明,以条件属性BHF对数据集合重新划分并列于表4。
表4
属性BHF三个取值上的样本数分别为28、11和13,因此BHF包含的信息量为
BHF在三个取值(1、2、3)上的信息量分别为
于是属性BHF的信息熵为
则根据BHF划分集合的增益可由下式得出为:
Gain(BHF)=I(s1,s2,s3,s4)-E(BHF)=1.7708-1.24051=0.530296
其信息增益比可由下式得出:
同理,可以得到其他四个条件属性的增益比如下:
FC:I(FC)=1.248,Gain(FC)=0.239 GainRatio(FC)=0.192
DDB:I(DDB)=1.57,Gain(DDB)=0.171,GainRatio(DDB)=0.109
ODB:I(ODB)=1.491,Gain(ODB)=0.151,GainRatio(ODB)=0.101
LDB:I(LDB)=1.273,Gain(LDB)=0.203,GainRatio(LDB)=0.159
由于属性BHF的信息增益比最大,因此将该属性定为根属性对数据集合进行划分。表5为BHF=1分支对应的子集表。在根属性的各个分支对其余属性进一步划分。
以BHF=1这一分支为例,在BHF=1这个分支,继续计算剩余各属性的信息增益比为:
I(FC)=1.201,Gain(FC)=0.082,GainRatio(FC)=0.068
I(DDB)=1.577,Gain(DDB)=0.115,GainRatio(DDB)=0.073
I(ODB)=1.530,Gain(ODB)=0.139,GainRatio(ODB)=0.091
I(LDB)=1.379,Gain(LDB)=0.395,GainRatio(LDB)=0.286
LDB属性的信息增益比最大,因此将其作为下一子节点,按LDB的取值继续划分子表。
依此类推,直到最后一个属性划分完毕,于是可以得到以属性重要度依次对数据表划分生成了的一个决策树,如图3所示(树叶上面的a∶b表示样例数与反例的个数)。
表5
编号 |
摩擦系数(FC) |
拉延筋高度(DDB) |
是否破裂与起皱(CRACKING & WRINKLING) |
1 |
1 |
1 |
safe safe |
2 |
1 |
1 |
safe wrinkle |
14 |
2 |
2 |
safe safe |
15 |
3 |
1 |
safe wrinkle |
19 |
1 |
3 |
safe wrinkle |
20 |
2 |
2 |
crack wrinkle |
25 |
1 |
3 |
safe wrinkle |
4、决策树的修剪
修剪决策树是用一个叶子来代替整个子树的过程。比较子树的预测错误率和单独一个子叶的预测错误率,如果单叶的错误率并不比子树的错误率更高,就用子叶代替子树。
以子树BHF=1 LDB=1 ODB=1为例,其上的样例总数为7个,整个子树的误分类数为2个,如果将该子树用其最频繁项[Safe Wrinkle]代替,那么误分类数仍为2个,错误率并没有降低,因此可以将该子树用其最频繁项[Safe Wrinkle]代替。于是决策树可以简化为图4所示新的决策树。
同理依次进行,经过这样剪枝后,决策树简化为图5所示的精简决策树。
修剪后的决策树上从根到树叶的每条路径对应一条工艺规则。沿着路径的每个属性值组合形成规则前件(“IF”部分),叶节点包含类预测,形成规则后件(“THEN”部分),图5所示精简决策树对应的规则为:
rule1:IF DDB=3 ODB=1 THEN safe wrinkle
rule2:IF BHF=1 LDB=2 THEN safe wrinkle
rule3:IF ODB=3 LDB=1 THEN safe safe
rule4:IF BHF=3 FC=1 THEN safe safe
rule5:IF BHF=2 THEN safe safe
rule6:IF BHF=3 FC=3 THEN crack safe
rule7:IF BHF=3 FC=2 THEN crack safe
rule8:IF BHF=1 LDB=3 THEN crack wrinkle
rule9:IF BHF=1 ODB=2 LDB=1 THEN crack wrinkle
将上述产生的显式工艺规则添加进原有工艺知识库中,可以用于指导成形工艺设计,为以后的类似产品的设计提供决策支持。
本发明提出的基于数据模拟技术与决策树算法的塑性成形工艺规则获取方法,利用数值模拟获取工艺信息数据源,通过决策树方法进行数据挖掘,获取显式的产生式工艺规则(IF-THEN形式)。通过这种技术可以大大拓展塑性成形工艺知识的来源,将数值模拟技术从技术验证层次提高到知识驱动层次,促进产品设计从经验设计向科学设计飞跃。