CN111353551B

CN111353551B - 一种面向产品装配工艺的非均匀样本均衡化方法及系统

Info

Publication number: CN111353551B
Application number: CN202010175032.0A
Authority: CN
Inventors: 冷杰武; 阮国磊; 刘强; 张定; 严都喜
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2020-03-13
Filing date: 2020-03-13
Publication date: 2020-12-08
Anticipated expiration: 2040-03-13
Also published as: CN111353551A; US20210286326A1; US11429070B2

Abstract

本发明公开了一种面向产品装配工艺的非均匀样本均衡化方法及系统，方法包括以下步骤：步骤A，计算不同样本之间的相似度；步骤B，构建表示所有样本之间相似度的模糊相容矩阵S，通过模糊相容矩阵S来构建具有不同粒层的模糊相容空间X；步骤C，基于粒计算的方式从所述模糊相容空间X中筛选出信息增量和样本间相似度的综合值最大的粒层作为最优粒层；步骤D，对最优粒层的样本进行均衡化处理。解决产品装配工艺非均匀样本的均衡化问题，提高最终预测结果的准确性和模型的泛化能力；解决了样本内部数据关联性强引起的样本不易均匀化的问题，从最优粒层上对每个样本粒子中的样本数量均匀处理，使均衡后的效果更加具有代表性。

Description

一种面向产品装配工艺的非均匀样本均衡化方法及系统

技术领域

本发明涉及智能制造领域，尤其涉及一种面向产品装配工艺的非均匀样本均衡化方法及系统。

背景技术

随着智能制造的兴起，越来越多的制造公司将机器学习算法应用到实际生产中来提高生产过程中的效率和降低人力成本消耗，比如在产品装配工艺过程中通过机器学习来建立模型，以预测产品的生产成本和所需时间等。而对于机器学习而言，初始样本数据是及其重要的一部分。初始数据的准确性和均匀性会对机器学习算法最终结果的准确性和泛化能力造成影响。

而不同款式的同种产品装配工艺过程是存在着样本非均匀的问题。因为不同款式的同种产品会有功能上的细微差异，这些细微差异会导致产品的装配工艺过程有所不同。一款产品有主要功能和多个附加功能，每个附加功能对产品的销量的提示效果不同，对产品销量提升大的附加功能，生产厂商就会针对有较大销量提升效果的附加功能进行更多款式的设计，使较多款式产品拥有该附加功能，那种对产品销量提升效果不显著的附加功能，拥有该附加功能的产品款式就会少一些，这样就造成了产品装配过程样本非均匀性，从而导致模型就会偏向更加符合于产量多的那款产品的装配工艺过程特性，模型的泛化能力不够。并且，对于不同款式的同种产品装配工艺过程，样本内部数据关联性强引起样本不易均匀化。

发明内容

本发明的目的在于提出一种面向产品装配工艺的非均匀样本均衡化方法及系统，以解决上述问题。

为达此目的，本发明采用以下技术方案：

一种面向产品装配工艺的非均匀样本均衡化方法，以产品的装配工艺流程拓扑结构作为样本，不同款式的同种产品的装配工艺流程拓扑结构为不同的样本，包括以下步骤：

步骤A，计算不同样本之间的相似度；

步骤B，构建表示所有样本之间相似度的模糊相容矩阵S，通过模糊相容矩阵S来构建具有不同粒层的模糊相容空间X，通过所述模糊相容空间X对所有样本进行聚类，所述模糊相容空间X是根据样本之间的相似度分成多个不同的粒层；

步骤C，基于粒计算的方式从所述模糊相容空间X中筛选出信息增量和样本间相似度的综合值最大的粒层作为最优粒层；

步骤D，对最优粒层的样本进行均衡化处理。

一种面向产品装配工艺的非均匀样本均衡化系统，以产品的装配工艺流程拓扑结构作为样本，不同款式的同种产品的装配工艺流程拓扑结构为不同的样本，包括：

相似度生成模块，用于计算不同样本之间的相似度；

模糊相容空间构建模块，用于构建表示所有样本之间相似度的模糊相容矩阵S，通过模糊相容矩阵S来构建具有不同粒层的模糊相容空间X，通过所述模糊相容空间X对所有样本进行聚类，所述模糊相容空间X是根据样本之间的相似度分成多个不同的粒层；

最优粒层生成模块，用于基于粒计算的方式从所述模糊相容空间X中筛选出信息增量和样本间相似度的综合值最大的粒层作为最优粒层；

和均衡化模块，用于对最优粒层的样本进行均衡化处理。

所述面向产品装配工艺的非均匀样本均衡化方法解决产品装配工艺非均匀样本的均衡化问题，提高最终预测结果的准确性和模型的泛化能力；还考虑了不同款式的同种产品的装配工艺流程拓扑结构的相似度，从这个角度出发对样本进行聚类，解决了样本内部数据关联性强引起的样本不易均匀化的问题，更加符合产品装配工艺这种样本的特性，使最后均衡化的结果更加科学。通过构建模糊相容空间X可以将样本聚类到不同粒层，可以从多个粒层观察和分析样本,从而求出一个最优粒层C(λ_o)，这样可以获得更具有代表性和更精确的样本粒子，从最优粒层C(λ_o)上对每个样本粒子中的样本数量均匀处理，使均衡后的效果更加具有代表性。

附图说明

附图对本发明做进一步说明，但附图中的内容不构成对本发明的任何限制。

图1是本发明其中一个实施例的面向产品装配工艺的非均匀样本均衡化方法流程图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。

实施例1

本实施例的面向产品装配工艺的非均匀样本均衡化方法，以产品的装配工艺流程拓扑结构作为样本，不同款式的同种产品的装配工艺流程拓扑结构为不同的样本，如图1所示，包括以下步骤：

步骤A，计算不同样本之间的相似度；

步骤D，对最优粒层的样本进行均衡化处理。

所述面向产品装配工艺的非均匀样本均衡化方法解决产品装配工艺非均匀样本的均衡化问题，提高最终预测结果的准确性和模型的泛化能力；还考虑了不同款式的同种产品的装配工艺流程拓扑结构的相似度，从这个角度出发对样本进行聚类，解决了样本内部数据关联性强引起的样本不易均匀化的问题，更加符合产品装配工艺这种样本的特性，使最后均衡化的结果更加科学。不同款式的同种产品可以为不同款式的手机，款式为老年机、全面屏手机、曲面屏手机、三摄手机、单摄手机等。

所述面向产品装配工艺的非均匀样本均衡化方法通过构建模糊相容空间X可以将样本聚类到不同粒层，可以从多个粒层观察和分析样本,从而求出一个最优粒层C(λ_o)，这样可以获得更具有代表性和更精确的样本粒子，从最优粒层C(λ_o)上对每个样本粒子中的样本数量均匀处理，使均衡后的效果更加具有代表性。

优选地，所述步骤A具体包括：

步骤A1，计算不同样本之间的节点相似度：

其中，i表示第i款的同种产品，j表示第j款的同种产品，S_node(v_i，v_j)表示第i款的同种产品的装配工艺流程拓扑结构v_i和第j款的同种产品的装配工艺流程拓扑结构v_j的节点相似度；m_i，j表示所述装配工艺流程拓扑结构v_i和所述装配工艺流程拓扑结构v_j中的节点匹配数量；e_i表示所述装配工艺流程拓扑结构v_i中所有节点数量之和；e_j表示所述装配工艺流程拓扑结构v_j中所有节点数量之和；

步骤A2，计算不同样本之间的拓扑关系相似度：

其中，S_rel(v_i,v_j)表示第i款的同种产品的装配工艺流程拓扑结构v_i和第j款的同种产品的装配工艺流程拓扑结构v_j的拓扑关系相似度；M_i，j表示所述装配工艺流程拓扑结构v_i和所述装配工艺流程拓扑结构v_j中的关系边匹配数量；E_i表示所述装配工艺流程拓扑结构v_i中所有关系边数量之和；E_j表示所述装配工艺流程拓扑结构v_j中所有关系边数量之和；

步骤A3，计算不同样本之间的拓扑结构相似度：

S(i,j)＝S_node(v_i,v_j)×W_node+S_rel(v_i,v_j)×W_rel，

其中，S(i,j)表示第i款的同种产品的装配工艺流程拓扑结构v_i和第j款的同种产品的装配工艺流程拓扑结构v_j的拓扑结构相似度，W_node为预设的节点权重参数，W_rel为预设的关系边权重参数。W_node表示节点对整个拓扑结构影响程度大小，W_rel表示关系边对整个拓扑结构影响程度的大小,W_node和W_rel可以由设计师根据工艺的重要性和在装配过程中的重要性来人为给定。

将每一款产品的装配工艺过程的拓扑结构表示出来时，不同款式的产品的装配工艺流程基本相似，不同款式产品装配可能会多几道工艺，而更多的差异是不同款式产品在同一种装配工艺上的参数不同。所以不同款式的产品装配工艺过程拓扑结构的差异主要是在节点上。步骤A通过综合考虑产品装配工艺过程拓扑结构中的节点和拓扑关系的差异来计算整个拓扑结构的差异性。

优选地，所述步骤B具体包括：

步骤B1，构建表示所有样本的集合V＝{v₁,v₂,v₃,...,v_n}之间的所有拓扑结构相似度的模糊相容矩阵S：

步骤B2，以模糊相容矩阵S为输入并经过以下方法构建具有不同粒层的模糊相容空间X，通过所述模糊相容空间X对所有样本进行聚类：

步骤B21，设定阈值λ，且有1＝λ₁＞λ₂＞λ₃＞...＞λ_n＝0,分别当阈值λ的取值分别为λ₁,λ₂,λ₃,...,λ_n时，计算V＝{v₁,v₂,v₃,...,v_n}中样本v_i与其他样本v_j的相似度S(i,j)，其中i∈(1,n)；

步骤B22，根据

求出当λ＝λ_i时满足S_λ(i，j)＝1的所有样本来构成样本粒子G_i，i＝1,2，3，...,n，然后所有样本粒子G_i构成对应的粒层C(λ_i)，最后由所有的粒层C(λ_i)构建出模糊相容空间X。

当λ_i的取值越大，则样本粒子G_i中的样本数量越少，即粒层C(λ_i)的粒度越细；当λ_i的取值越小，粒层C(λ_i)中样本粒子G_i的数量越多，粒层C(λ_i)的粒度越粗。

优选地，所述步骤C具体包括：

步骤C1，计算粒层C(λ_i)的粒度，i＝1，2，3，...，n：

其中G_i，k为粒层C(λ_i)中第k个样本粒子；|G_i，k|为第k个样本粒子中所含有的样本的个数；log₂(|G_i，k|)为完全区分样本粒子G_i，k中所有粒子所需的信息量的表示；g表示粒层C(λ_i)中的样本粒子个数；

步骤C2，计算粒层C(λ_i)的信息增量IG[C(λ_i)]，其中i＝1，2，3，...，n：

IG[C(λ_i)]＝E[C(λ_i)]-E[C(λ_i-1)]；

步骤C3，计算粒层C(λ_i)的信息增量和样本间相似度的综合值D_i，其中i＝1，2，3，...，n：

D_i＝IG[C(λ_i)]*W_ig+λ_iW_λ；

其中，W_ig为粒层C(λ_i)的信息增量的权重，W_λ为粒层C(λ_i)的样本相似度阈值的权重；

步骤C4，筛选出综合值D_i最大的粒层作为最优粒层C(λ_o)。

将粒层C(λ_i)的粒度看成完全区分粒层中所有样本粒子所需的平均信息量，当粗粒层C(λ_i)向细粒层C(λ_i-1)转化时会发生信息增益，当粒层转化时的信息增量越大转化越有意义，同时样本粒子中的样本相似性程度也会对最终均衡化的有效性产生影响，阈值λ越大，样本相似度越高，均衡化效果越差，因此需要综合考虑粒层C(λ_i)的信息增量和样本的相似程度来综合确定最优粒层C(λ_o)，即要求最优粒层C(λ_o)同时应该拥有大的信息增量和最小的相似度。

权重W_ig、W_λ先用之前的样本数据中随机抽取，然后通过算出最优粒层C(λ_o)的确定样本，将第一次确定的样本用去后面的机器学习算法模型训练，得出结果；后根据结果对权重W_ig、W_λ进行调整，多次迭代，使最后的结果最优，得到最后的权重值。

优选地，所述步骤D具体包括：

步骤D1，计算最优粒层C(λ_o)中每个样本粒子G_i的平均样本数量

步骤D2，对最优粒层C(λ_o)中每个样本粒子G_i采用随机抽样的方法进行样本数量的扩充和删减，使得每一个样本粒子G_i中的样本个数相同，完成均衡化处理：

若

则将样本粒子G_i，k多出的样本随机剔除，使样本粒子G_i，k的样本个数|G_i，k|下降至

若

则将样本粒子G_i，k中原有的样本重新复制到样本粒子G_i，k，使样本粒子G_i，k的样本个数|G_i，k|增加至

实施例2

本实施例的面向产品装配工艺的非均匀样本均衡化系统，以产品的装配工艺流程拓扑结构作为样本，不同款式的同种产品的装配工艺流程拓扑结构为不同的样本，包括：

相似度生成模块，用于计算不同样本之间的相似度；

和均衡化模块，用于对最优粒层的样本进行均衡化处理。

所述面向产品装配工艺的非均匀样本均衡化系统解决产品装配工艺非均匀样本的均衡化问题，提高最终预测结果的准确性和模型的泛化能力；还考虑了不同款式的同种产品的装配工艺流程拓扑结构的相似度，从这个角度出发对样本进行聚类，解决了样本内部数据关联性强引起的样本不易均匀化的问题，更加符合产品装配工艺这种样本的特性，使最后均衡化的结果更加科学。不同款式的同种产品可以为不同款式的手机，款式为老年机、全面屏手机、曲面屏手机、三摄手机、单摄手机等。

所述面向产品装配工艺的非均匀样本均衡化系统通过构建模糊相容空间X可以将样本聚类到不同粒层，可以从多个粒层观察和分析样本,从而求出一个最优粒层C(λ_o)，这样可以获得更具有代表性和更精确的样本粒子，从最优粒层C(λ_o)上对每个样本粒子中的样本数量均匀处理，使均衡后的效果更加具有代表性。

优选地，所述相似度生成模块包括：

节点相似度生成子模块，用于计算不同样本之间的节点相似度：

拓扑关系相似度生成子模块，计算不同样本之间的拓扑关系相似度：

和拓扑关系相似度生成子模块，计算不同样本之间的拓扑结构相似度：

S(i,j)＝S_node(v_i,v_j)×W_node+S_rel(v_i,v_j)×W_rel，

其中，S(i,j)表示第i款的同种产品的装配工艺流程拓扑结构v_i和第j款的同种产品的装配工艺流程拓扑结构v_j的拓扑结构相似度，W_node为预设的节点权重参数，W_rel为预设的关系边权重参数。

W_node表示节点对整个拓扑结构影响程度大小，W_rel表示关系边对整个拓扑结构影响程度的大小,W_node和W_rel可以由设计师根据工艺的重要性和在装配过程中的重要性来人为给定。

将每一款产品的装配工艺过程的拓扑结构表示出来时，不同款式的产品的装配工艺流程基本相似，不同款式产品装配可能会多几道工艺，而更多的差异是不同款式产品在同一种装配工艺上的参数不同。所以不同款式的产品装配工艺过程拓扑结构的差异主要是在节点上。相似度生成模块通过综合考虑产品装配工艺过程拓扑结构中的节点和拓扑关系的差异来计算整个拓扑结构的差异性。

优选地，所述模糊相容空间构建模块包括：

模糊相容矩阵生成子模块，用于构建表示所有样本的集合V＝{v₁,v₂,v₃,...,v_n}之间的所有拓扑结构相似度的模糊相容矩阵S：

和粒层生成子模块，用于以模糊相容矩阵S为输入并经过以下单元构建具有不同粒层的模糊相容空间X，通过所述模糊相容空间X对所有样本进行聚类：

第一单元，用于设定阈值λ，且有1＝λ₁＞λ₂＞λ₃＞...＞λ_n＝0,分别当阈值λ的取值分别为λ₁,λ₂,λ₃,...,λ_n时，计算V＝{v₁,v₂,v₃,...,v_n}中样本v_i与其他样本v_j的相似度S(i,j)，其中i∈(1,n)；

第二单元，用于根据

求出当λ＝λ_i时满足S_λ(i,j)＝1的所有样本来构成样本粒子G_i，i＝1,2，3，...,n，然后所有样本粒子G_i构成对应的粒层C(λ_i)，最后由所有的粒层C(λ_i)构建出模糊相容空间X。

优选地，所述最优粒层生成模块包括：

粒度计算子模块，用于计算粒层C(λ_i)的粒度，i＝1,2，3，...,n：

其中G_i，k为粒层C(λ_i)中第k个样本粒子；|G_i，_k|为第k个样本粒子中所含有的样本的个数；log₂(|G_i，k|)为完全区分样本粒子G_i，k中所有粒子所需的信息量的表示；g表示粒层C(λ_i)中的样本粒子个数；

信息增量计算子模块，用于计算粒层C(λ_i)的信息增量IG[C(λ_i)]，其中i＝1,2，3，...,n：

IG[C(λ_i)]＝E[C(λ_i)]-E[C(λ_i-1)]；

综合值计算子模块，用于计算粒层C(λ_i)的信息增量和样本间相似度的综合值D_i，其中i＝1,2，3，...,n：

D_i＝IG[C(λ_i)]*W_ig+λ_iW_λ；

和筛选子模块，用于筛选出综合值D_i最大的粒层作为最优粒层C(λ_o)。

优选地，所述均衡化模块包括：

平均样本数量计算子模块，用于计算最优粒层C(λ_o)中每个样本粒子G_i的平均样本数量

样本扩减子模块，用于对最优粒层C(λ_o)中每个样本粒子G_i采用随机抽样的方法进行样本数量的扩充和删减，使得每一个样本粒子G_i中的样本个数相同，完成均衡化处理：

若

若

以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理，而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释，本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式，这些方式都将落入本发明的保护范围之内。

Claims

1.一种面向产品装配工艺的非均匀样本均衡化方法，以产品的装配工艺流程拓扑结构作为样本，不同款式的同种产品的装配工艺流程拓扑结构为不同的样本，其特征在于，包括以下步骤：

步骤A，计算不同样本之间的相似度；

步骤D，对最优粒层的样本进行均衡化处理；

所述步骤D具体包括：

其中，设定阈值λ，阈值λ的取值分别为λ₁,λ₂,λ₃,...,λ_n,且有1＝λ₁＞λ₂＞λ₃＞...＞λ_n＝0,G_i，k为粒层C(λ_i)中第k个样本粒子；|G_i，k|为第k个样本粒子中所含有的样本的个数；g表示粒层C(λ_i)中的样本粒子个数；

若

若

2.根据权利要求1所述的面向产品装配工艺的非均匀样本均衡化方法，其特征在于，所述步骤A具体包括：

步骤A1，计算不同样本之间的节点相似度：

其中，i表示第i款的同种产品，j表示第j款的同种产品，S_node(v_i,v_j)表示第i款的同种产品的装配工艺流程拓扑结构v_i和第j款的同种产品的装配工艺流程拓扑结构v_j的节点相似度；m_i，j表示所述装配工艺流程拓扑结构v_i和所述装配工艺流程拓扑结构v_j中的节点匹配数量；e_i表示所述装配工艺流程拓扑结构v_i中所有节点数量之和；e_j表示所述装配工艺流程拓扑结构v_j中所有节点数量之和；

步骤A2，计算不同样本之间的拓扑关系相似度：