CN111353551B - 一种面向产品装配工艺的非均匀样本均衡化方法及系统 - Google Patents

一种面向产品装配工艺的非均匀样本均衡化方法及系统 Download PDF

Info

Publication number
CN111353551B
CN111353551B CN202010175032.0A CN202010175032A CN111353551B CN 111353551 B CN111353551 B CN 111353551B CN 202010175032 A CN202010175032 A CN 202010175032A CN 111353551 B CN111353551 B CN 111353551B
Authority
CN
China
Prior art keywords
samples
sample
lambda
assembly process
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010175032.0A
Other languages
English (en)
Other versions
CN111353551A (zh
Inventor
冷杰武
阮国磊
刘强
张定
严都喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202010175032.0A priority Critical patent/CN111353551B/zh
Publication of CN111353551A publication Critical patent/CN111353551A/zh
Application granted granted Critical
Publication of CN111353551B publication Critical patent/CN111353551B/zh
Priority to US17/134,369 priority patent/US11429070B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/0275Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using fuzzy logic only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Fuzzy Systems (AREA)
  • Automation & Control Theory (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Manufacturing & Machinery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种面向产品装配工艺的非均匀样本均衡化方法及系统,方法包括以下步骤:步骤A,计算不同样本之间的相似度;步骤B,构建表示所有样本之间相似度的模糊相容矩阵S,通过模糊相容矩阵S来构建具有不同粒层的模糊相容空间X;步骤C,基于粒计算的方式从所述模糊相容空间X中筛选出信息增量和样本间相似度的综合值最大的粒层作为最优粒层;步骤D,对最优粒层的样本进行均衡化处理。解决产品装配工艺非均匀样本的均衡化问题,提高最终预测结果的准确性和模型的泛化能力;解决了样本内部数据关联性强引起的样本不易均匀化的问题,从最优粒层上对每个样本粒子中的样本数量均匀处理,使均衡后的效果更加具有代表性。

Description

一种面向产品装配工艺的非均匀样本均衡化方法及系统
技术领域
本发明涉及智能制造领域,尤其涉及一种面向产品装配工艺的非均匀样本均衡化方法及系统。
背景技术
随着智能制造的兴起,越来越多的制造公司将机器学习算法应用到实际生产中来提高生产过程中的效率和降低人力成本消耗,比如在产品装配工艺过程中通过机器学习来建立模型,以预测产品的生产成本和所需时间等。而对于机器学习而言,初始样本数据是及其重要的一部分。初始数据的准确性和均匀性会对机器学习算法最终结果的准确性和泛化能力造成影响。
而不同款式的同种产品装配工艺过程是存在着样本非均匀的问题。因为不同款式的同种产品会有功能上的细微差异,这些细微差异会导致产品的装配工艺过程有所不同。一款产品有主要功能和多个附加功能,每个附加功能对产品的销量的提示效果不同,对产品销量提升大的附加功能,生产厂商就会针对有较大销量提升效果的附加功能进行更多款式的设计,使较多款式产品拥有该附加功能,那种对产品销量提升效果不显著的附加功能,拥有该附加功能的产品款式就会少一些,这样就造成了产品装配过程样本非均匀性,从而导致模型就会偏向更加符合于产量多的那款产品的装配工艺过程特性,模型的泛化能力不够。并且,对于不同款式的同种产品装配工艺过程,样本内部数据关联性强引起样本不易均匀化。
发明内容
本发明的目的在于提出一种面向产品装配工艺的非均匀样本均衡化方法及系统,以解决上述问题。
为达此目的,本发明采用以下技术方案:
一种面向产品装配工艺的非均匀样本均衡化方法,以产品的装配工艺流程拓扑结构作为样本,不同款式的同种产品的装配工艺流程拓扑结构为不同的样本,包括以下步骤:
步骤A,计算不同样本之间的相似度;
步骤B,构建表示所有样本之间相似度的模糊相容矩阵S,通过模糊相容矩阵S来构建具有不同粒层的模糊相容空间X,通过所述模糊相容空间X对所有样本进行聚类,所述模糊相容空间X是根据样本之间的相似度分成多个不同的粒层;
步骤C,基于粒计算的方式从所述模糊相容空间X中筛选出信息增量和样本间相似度的综合值最大的粒层作为最优粒层;
步骤D,对最优粒层的样本进行均衡化处理。
一种面向产品装配工艺的非均匀样本均衡化系统,以产品的装配工艺流程拓扑结构作为样本,不同款式的同种产品的装配工艺流程拓扑结构为不同的样本,包括:
相似度生成模块,用于计算不同样本之间的相似度;
模糊相容空间构建模块,用于构建表示所有样本之间相似度的模糊相容矩阵S,通过模糊相容矩阵S来构建具有不同粒层的模糊相容空间X,通过所述模糊相容空间X对所有样本进行聚类,所述模糊相容空间X是根据样本之间的相似度分成多个不同的粒层;
最优粒层生成模块,用于基于粒计算的方式从所述模糊相容空间X中筛选出信息增量和样本间相似度的综合值最大的粒层作为最优粒层;
和均衡化模块,用于对最优粒层的样本进行均衡化处理。
所述面向产品装配工艺的非均匀样本均衡化方法解决产品装配工艺非均匀样本的均衡化问题,提高最终预测结果的准确性和模型的泛化能力;还考虑了不同款式的同种产品的装配工艺流程拓扑结构的相似度,从这个角度出发对样本进行聚类,解决了样本内部数据关联性强引起的样本不易均匀化的问题,更加符合产品装配工艺这种样本的特性,使最后均衡化的结果更加科学。通过构建模糊相容空间X可以将样本聚类到不同粒层,可以从多个粒层观察和分析样本,从而求出一个最优粒层C(λo),这样可以获得更具有代表性和更精确的样本粒子,从最优粒层C(λo)上对每个样本粒子中的样本数量均匀处理,使均衡后的效果更加具有代表性。
附图说明
附图对本发明做进一步说明,但附图中的内容不构成对本发明的任何限制。
图1是本发明其中一个实施例的面向产品装配工艺的非均匀样本均衡化方法流程图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
实施例1
本实施例的面向产品装配工艺的非均匀样本均衡化方法,以产品的装配工艺流程拓扑结构作为样本,不同款式的同种产品的装配工艺流程拓扑结构为不同的样本,如图1所示,包括以下步骤:
步骤A,计算不同样本之间的相似度;
步骤B,构建表示所有样本之间相似度的模糊相容矩阵S,通过模糊相容矩阵S来构建具有不同粒层的模糊相容空间X,通过所述模糊相容空间X对所有样本进行聚类,所述模糊相容空间X是根据样本之间的相似度分成多个不同的粒层;
步骤C,基于粒计算的方式从所述模糊相容空间X中筛选出信息增量和样本间相似度的综合值最大的粒层作为最优粒层;
步骤D,对最优粒层的样本进行均衡化处理。
所述面向产品装配工艺的非均匀样本均衡化方法解决产品装配工艺非均匀样本的均衡化问题,提高最终预测结果的准确性和模型的泛化能力;还考虑了不同款式的同种产品的装配工艺流程拓扑结构的相似度,从这个角度出发对样本进行聚类,解决了样本内部数据关联性强引起的样本不易均匀化的问题,更加符合产品装配工艺这种样本的特性,使最后均衡化的结果更加科学。不同款式的同种产品可以为不同款式的手机,款式为老年机、全面屏手机、曲面屏手机、三摄手机、单摄手机等。
所述面向产品装配工艺的非均匀样本均衡化方法通过构建模糊相容空间X可以将样本聚类到不同粒层,可以从多个粒层观察和分析样本,从而求出一个最优粒层C(λo),这样可以获得更具有代表性和更精确的样本粒子,从最优粒层C(λo)上对每个样本粒子中的样本数量均匀处理,使均衡后的效果更加具有代表性。
优选地,所述步骤A具体包括:
步骤A1,计算不同样本之间的节点相似度:
Figure GDA0002704378590000051
其中,i表示第i款的同种产品,j表示第j款的同种产品,Snode(vi,vj)表示第i款的同种产品的装配工艺流程拓扑结构vi和第j款的同种产品的装配工艺流程拓扑结构vj的节点相似度;mi,j表示所述装配工艺流程拓扑结构vi和所述装配工艺流程拓扑结构vj中的节点匹配数量;ei表示所述装配工艺流程拓扑结构vi中所有节点数量之和;ej表示所述装配工艺流程拓扑结构vj中所有节点数量之和;
步骤A2,计算不同样本之间的拓扑关系相似度:
Figure GDA0002704378590000052
其中,Srel(vi,vj)表示第i款的同种产品的装配工艺流程拓扑结构vi和第j款的同种产品的装配工艺流程拓扑结构vj的拓扑关系相似度;Mi,j表示所述装配工艺流程拓扑结构vi和所述装配工艺流程拓扑结构vj中的关系边匹配数量;Ei表示所述装配工艺流程拓扑结构vi中所有关系边数量之和;Ej表示所述装配工艺流程拓扑结构vj中所有关系边数量之和;
步骤A3,计算不同样本之间的拓扑结构相似度:
S(i,j)=Snode(vi,vj)×Wnode+Srel(vi,vj)×Wrel
其中,S(i,j)表示第i款的同种产品的装配工艺流程拓扑结构vi和第j款的同种产品的装配工艺流程拓扑结构vj的拓扑结构相似度,Wnode为预设的节点权重参数,Wrel为预设的关系边权重参数。Wnode表示节点对整个拓扑结构影响程度大小,Wrel表示关系边对整个拓扑结构影响程度的大小,Wnode和Wrel可以由设计师根据工艺的重要性和在装配过程中的重要性来人为给定。
将每一款产品的装配工艺过程的拓扑结构表示出来时,不同款式的产品的装配工艺流程基本相似,不同款式产品装配可能会多几道工艺,而更多的差异是不同款式产品在同一种装配工艺上的参数不同。所以不同款式的产品装配工艺过程拓扑结构的差异主要是在节点上。步骤A通过综合考虑产品装配工艺过程拓扑结构中的节点和拓扑关系的差异来计算整个拓扑结构的差异性。
优选地,所述步骤B具体包括:
步骤B1,构建表示所有样本的集合V={v1,v2,v3,...,vn}之间的所有拓扑结构相似度的模糊相容矩阵S:
Figure GDA0002704378590000071
步骤B2,以模糊相容矩阵S为输入并经过以下方法构建具有不同粒层的模糊相容空间X,通过所述模糊相容空间X对所有样本进行聚类:
步骤B21,设定阈值λ,且有1=λ1>λ2>λ3>...>λn=0,分别当阈值λ的取值分别为λ123,...,λn时,计算V={v1,v2,v3,...,vn}中样本vi与其他样本vj的相似度S(i,j),其中i∈(1,n);
步骤B22,根据
Figure GDA0002704378590000072
求出当λ=λi时满足Sλ(i,j)=1的所有样本来构成样本粒子Gi,i=1,2,3,...,n,然后所有样本粒子Gi构成对应的粒层C(λi),最后由所有的粒层C(λi)构建出模糊相容空间X。
当λi的取值越大,则样本粒子Gi中的样本数量越少,即粒层C(λi)的粒度越细;当λi的取值越小,粒层C(λi)中样本粒子Gi的数量越多,粒层C(λi)的粒度越粗。
优选地,所述步骤C具体包括:
步骤C1,计算粒层C(λi)的粒度,i=1,2,3,...,n:
Figure GDA0002704378590000081
其中Gi,k为粒层C(λi)中第k个样本粒子;|Gi,k|为第k个样本粒子中所含有的样本的个数;log2(|Gi,k|)为完全区分样本粒子Gi,k中所有粒子所需的信息量的表示;g表示粒层C(λi)中的样本粒子个数;
步骤C2,计算粒层C(λi)的信息增量IG[C(λi)],其中i=1,2,3,...,n:
IG[C(λi)]=E[C(λi)]-E[C(λi-1)];
步骤C3,计算粒层C(λi)的信息增量和样本间相似度的综合值Di,其中i=1,2,3,...,n:
Di=IG[C(λi)]*WigiWλ
其中,Wig为粒层C(λi)的信息增量的权重,Wλ为粒层C(λi)的样本相似度阈值的权重;
步骤C4,筛选出综合值Di最大的粒层作为最优粒层C(λo)。
将粒层C(λi)的粒度看成完全区分粒层中所有样本粒子所需的平均信息量,当粗粒层C(λi)向细粒层C(λi-1)转化时会发生信息增益,当粒层转化时的信息增量越大转化越有意义,同时样本粒子中的样本相似性程度也会对最终均衡化的有效性产生影响,阈值λ越大,样本相似度越高,均衡化效果越差,因此需要综合考虑粒层C(λi)的信息增量和样本的相似程度来综合确定最优粒层C(λo),即要求最优粒层C(λo)同时应该拥有大的信息增量和最小的相似度。
权重Wig、Wλ先用之前的样本数据中随机抽取,然后通过算出最优粒层C(λo)的确定样本,将第一次确定的样本用去后面的机器学习算法模型训练,得出结果;后根据结果对权重Wig、Wλ进行调整,多次迭代,使最后的结果最优,得到最后的权重值。
优选地,所述步骤D具体包括:
步骤D1,计算最优粒层C(λo)中每个样本粒子Gi的平均样本数量
Figure GDA0002704378590000091
Figure GDA0002704378590000092
步骤D2,对最优粒层C(λo)中每个样本粒子Gi采用随机抽样的方法进行样本数量的扩充和删减,使得每一个样本粒子Gi中的样本个数相同,完成均衡化处理:
Figure GDA0002704378590000093
则将样本粒子Gi,k多出的样本随机剔除,使样本粒子Gi,k的样本个数|Gi,k|下降至
Figure GDA0002704378590000101
Figure GDA0002704378590000102
则将样本粒子Gi,k中原有的样本重新复制到样本粒子Gi,k,使样本粒子Gi,k的样本个数|Gi,k|增加至
Figure GDA0002704378590000103
实施例2
本实施例的面向产品装配工艺的非均匀样本均衡化系统,以产品的装配工艺流程拓扑结构作为样本,不同款式的同种产品的装配工艺流程拓扑结构为不同的样本,包括:
相似度生成模块,用于计算不同样本之间的相似度;
模糊相容空间构建模块,用于构建表示所有样本之间相似度的模糊相容矩阵S,通过模糊相容矩阵S来构建具有不同粒层的模糊相容空间X,通过所述模糊相容空间X对所有样本进行聚类,所述模糊相容空间X是根据样本之间的相似度分成多个不同的粒层;
最优粒层生成模块,用于基于粒计算的方式从所述模糊相容空间X中筛选出信息增量和样本间相似度的综合值最大的粒层作为最优粒层;
和均衡化模块,用于对最优粒层的样本进行均衡化处理。
所述面向产品装配工艺的非均匀样本均衡化系统解决产品装配工艺非均匀样本的均衡化问题,提高最终预测结果的准确性和模型的泛化能力;还考虑了不同款式的同种产品的装配工艺流程拓扑结构的相似度,从这个角度出发对样本进行聚类,解决了样本内部数据关联性强引起的样本不易均匀化的问题,更加符合产品装配工艺这种样本的特性,使最后均衡化的结果更加科学。不同款式的同种产品可以为不同款式的手机,款式为老年机、全面屏手机、曲面屏手机、三摄手机、单摄手机等。
所述面向产品装配工艺的非均匀样本均衡化系统通过构建模糊相容空间X可以将样本聚类到不同粒层,可以从多个粒层观察和分析样本,从而求出一个最优粒层C(λo),这样可以获得更具有代表性和更精确的样本粒子,从最优粒层C(λo)上对每个样本粒子中的样本数量均匀处理,使均衡后的效果更加具有代表性。
优选地,所述相似度生成模块包括:
节点相似度生成子模块,用于计算不同样本之间的节点相似度:
Figure GDA0002704378590000111
其中,i表示第i款的同种产品,j表示第j款的同种产品,Snode(vi,vj)表示第i款的同种产品的装配工艺流程拓扑结构vi和第j款的同种产品的装配工艺流程拓扑结构vj的节点相似度;mi,j表示所述装配工艺流程拓扑结构vi和所述装配工艺流程拓扑结构vj中的节点匹配数量;ei表示所述装配工艺流程拓扑结构vi中所有节点数量之和;ej表示所述装配工艺流程拓扑结构vj中所有节点数量之和;
拓扑关系相似度生成子模块,计算不同样本之间的拓扑关系相似度:
Figure GDA0002704378590000121
其中,Srel(vi,vj)表示第i款的同种产品的装配工艺流程拓扑结构vi和第j款的同种产品的装配工艺流程拓扑结构vj的拓扑关系相似度;Mi,j表示所述装配工艺流程拓扑结构vi和所述装配工艺流程拓扑结构vj中的关系边匹配数量;Ei表示所述装配工艺流程拓扑结构vi中所有关系边数量之和;Ej表示所述装配工艺流程拓扑结构vj中所有关系边数量之和;
和拓扑关系相似度生成子模块,计算不同样本之间的拓扑结构相似度:
S(i,j)=Snode(vi,vj)×Wnode+Srel(vi,vj)×Wrel
其中,S(i,j)表示第i款的同种产品的装配工艺流程拓扑结构vi和第j款的同种产品的装配工艺流程拓扑结构vj的拓扑结构相似度,Wnode为预设的节点权重参数,Wrel为预设的关系边权重参数。
Wnode表示节点对整个拓扑结构影响程度大小,Wrel表示关系边对整个拓扑结构影响程度的大小,Wnode和Wrel可以由设计师根据工艺的重要性和在装配过程中的重要性来人为给定。
将每一款产品的装配工艺过程的拓扑结构表示出来时,不同款式的产品的装配工艺流程基本相似,不同款式产品装配可能会多几道工艺,而更多的差异是不同款式产品在同一种装配工艺上的参数不同。所以不同款式的产品装配工艺过程拓扑结构的差异主要是在节点上。相似度生成模块通过综合考虑产品装配工艺过程拓扑结构中的节点和拓扑关系的差异来计算整个拓扑结构的差异性。
优选地,所述模糊相容空间构建模块包括:
模糊相容矩阵生成子模块,用于构建表示所有样本的集合V={v1,v2,v3,...,vn}之间的所有拓扑结构相似度的模糊相容矩阵S:
Figure GDA0002704378590000131
和粒层生成子模块,用于以模糊相容矩阵S为输入并经过以下单元构建具有不同粒层的模糊相容空间X,通过所述模糊相容空间X对所有样本进行聚类:
第一单元,用于设定阈值λ,且有1=λ1>λ2>λ3>...>λn=0,分别当阈值λ的取值分别为λ123,...,λn时,计算V={v1,v2,v3,...,vn}中样本vi与其他样本vj的相似度S(i,j),其中i∈(1,n);
第二单元,用于根据
Figure GDA0002704378590000132
求出当λ=λi时满足Sλ(i,j)=1的所有样本来构成样本粒子Gi,i=1,2,3,...,n,然后所有样本粒子Gi构成对应的粒层C(λi),最后由所有的粒层C(λi)构建出模糊相容空间X。
当λi的取值越大,则样本粒子Gi中的样本数量越少,即粒层C(λi)的粒度越细;当λi的取值越小,粒层C(λi)中样本粒子Gi的数量越多,粒层C(λi)的粒度越粗。
优选地,所述最优粒层生成模块包括:
粒度计算子模块,用于计算粒层C(λi)的粒度,i=1,2,3,...,n:
Figure GDA0002704378590000141
其中Gi,k为粒层C(λi)中第k个样本粒子;|Gik|为第k个样本粒子中所含有的样本的个数;log2(|Gi,k|)为完全区分样本粒子Gi,k中所有粒子所需的信息量的表示;g表示粒层C(λi)中的样本粒子个数;
信息增量计算子模块,用于计算粒层C(λi)的信息增量IG[C(λi)],其中i=1,2,3,...,n:
IG[C(λi)]=E[C(λi)]-E[C(λi-1)];
综合值计算子模块,用于计算粒层C(λi)的信息增量和样本间相似度的综合值Di,其中i=1,2,3,...,n:
Di=IG[C(λi)]*WigiWλ
其中,Wig为粒层C(λi)的信息增量的权重,Wλ为粒层C(λi)的样本相似度阈值的权重;
和筛选子模块,用于筛选出综合值Di最大的粒层作为最优粒层C(λo)。
将粒层C(λi)的粒度看成完全区分粒层中所有样本粒子所需的平均信息量,当粗粒层C(λi)向细粒层C(λi-1)转化时会发生信息增益,当粒层转化时的信息增量越大转化越有意义,同时样本粒子中的样本相似性程度也会对最终均衡化的有效性产生影响,阈值λ越大,样本相似度越高,均衡化效果越差,因此需要综合考虑粒层C(λi)的信息增量和样本的相似程度来综合确定最优粒层C(λo),即要求最优粒层C(λo)同时应该拥有大的信息增量和最小的相似度。
权重Wig、Wλ先用之前的样本数据中随机抽取,然后通过算出最优粒层C(λo)的确定样本,将第一次确定的样本用去后面的机器学习算法模型训练,得出结果;后根据结果对权重Wig、Wλ进行调整,多次迭代,使最后的结果最优,得到最后的权重值。
优选地,所述均衡化模块包括:
平均样本数量计算子模块,用于计算最优粒层C(λo)中每个样本粒子Gi的平均样本数量
Figure GDA0002704378590000161
Figure GDA0002704378590000162
样本扩减子模块,用于对最优粒层C(λo)中每个样本粒子Gi采用随机抽样的方法进行样本数量的扩充和删减,使得每一个样本粒子Gi中的样本个数相同,完成均衡化处理:
Figure GDA0002704378590000163
则将样本粒子Gi,k多出的样本随机剔除,使样本粒子Gi,k的样本个数|Gi,k|下降至
Figure GDA0002704378590000164
Figure GDA0002704378590000165
则将样本粒子Gi,k中原有的样本重新复制到样本粒子Gi,k,使样本粒子Gi,k的样本个数|Gi,k|增加至
Figure GDA0002704378590000166
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。

Claims (8)

1.一种面向产品装配工艺的非均匀样本均衡化方法,以产品的装配工艺流程拓扑结构作为样本,不同款式的同种产品的装配工艺流程拓扑结构为不同的样本,其特征在于,包括以下步骤:
步骤A,计算不同样本之间的相似度;
步骤B,构建表示所有样本之间相似度的模糊相容矩阵S,通过模糊相容矩阵S来构建具有不同粒层的模糊相容空间X,通过所述模糊相容空间X对所有样本进行聚类,所述模糊相容空间X是根据样本之间的相似度分成多个不同的粒层;
步骤C,基于粒计算的方式从所述模糊相容空间X中筛选出信息增量和样本间相似度的综合值最大的粒层作为最优粒层;
步骤D,对最优粒层的样本进行均衡化处理;
所述步骤D具体包括:
步骤D1,计算最优粒层C(λo)中每个样本粒子Gi的平均样本数量
Figure FDA0002737825120000011
Figure FDA0002737825120000012
其中,设定阈值λ,阈值λ的取值分别为λ123,...,λn,且有1=λ1>λ2>λ3>...>λn=0,Gi,k为粒层C(λi)中第k个样本粒子;|Gi,k|为第k个样本粒子中所含有的样本的个数;g表示粒层C(λi)中的样本粒子个数;
步骤D2,对最优粒层C(λo)中每个样本粒子Gi采用随机抽样的方法进行样本数量的扩充和删减,使得每一个样本粒子Gi中的样本个数相同,完成均衡化处理:
Figure FDA0002737825120000021
则将样本粒子Gi,k多出的样本随机剔除,使样本粒子Gi,k的样本个数|Gi,k|下降至
Figure FDA0002737825120000022
Figure FDA0002737825120000023
则将样本粒子Gi,k中原有的样本重新复制到样本粒子Gi,k,使样本粒子Gi,k的样本个数|Gi,k|增加至
Figure FDA0002737825120000024
2.根据权利要求1所述的面向产品装配工艺的非均匀样本均衡化方法,其特征在于,所述步骤A具体包括:
步骤A1,计算不同样本之间的节点相似度:
Figure FDA0002737825120000025
其中,i表示第i款的同种产品,j表示第j款的同种产品,Snode(vi,vj)表示第i款的同种产品的装配工艺流程拓扑结构vi和第j款的同种产品的装配工艺流程拓扑结构vj的节点相似度;mi,j表示所述装配工艺流程拓扑结构vi和所述装配工艺流程拓扑结构vj中的节点匹配数量;ei表示所述装配工艺流程拓扑结构vi中所有节点数量之和;ej表示所述装配工艺流程拓扑结构vj中所有节点数量之和;
步骤A2,计算不同样本之间的拓扑关系相似度:
Figure FDA0002737825120000031
其中,Srel(vi,vj)表示第i款的同种产品的装配工艺流程拓扑结构vi和第j款的同种产品的装配工艺流程拓扑结构vj的拓扑关系相似度;Mi,j表示所述装配工艺流程拓扑结构vi和所述装配工艺流程拓扑结构vj中的关系边匹配数量;Ei表示所述装配工艺流程拓扑结构vi中所有关系边数量之和;Ej表示所述装配工艺流程拓扑结构vj中所有关系边数量之和;
步骤A3,计算不同样本之间的拓扑结构相似度:
S(i,j)=Snode(vi,vj)×Wnode+Srel(vi,vj)×Wrel
其中,S(i,j)表示第i款的同种产品的装配工艺流程拓扑结构vi和第j款的同种产品的装配工艺流程拓扑结构vj的拓扑结构相似度,Wnode为预设的节点权重参数,Wrel为预设的关系边权重参数。
3.根据权利要求2所述的面向产品装配工艺的非均匀样本均衡化方法,其特征在于,所述步骤B具体包括:
步骤B1,构建表示所有样本的集合V={v1,v2,v3,...,vn}之间的所有拓扑结构相似度的模糊相容矩阵S:
Figure FDA0002737825120000041
步骤B2,以模糊相容矩阵S为输入并经过以下方法构建具有不同粒层的模糊相容空间X,通过所述模糊相容空间X对所有样本进行聚类:
步骤B21,设定阈值λ,且有1=λ1>λ2>λ3>...>λn=0,分别当阈值λ的取值分别为λ123,...,λn时,计算V={v1,v2,v3,...,vn}中样本vi与其他样本vj的相似度S(n,j),其中i∈(1,n);
步骤B22,根据
Figure FDA0002737825120000042
求出当λ=λi时满足Sλ(i,j)=1的所有样本来构成样本粒子Gi,i=1,2,3,...,n,然后所有样本粒子Gi构成对应的粒层C(λi),最后由所有的粒层C(λi)构建出模糊相容空间X。
4.根据权利要求3所述的面向产品装配工艺的非均匀样本均衡化方法,其特征在于,所述步骤C具体包括:
步骤C1,计算粒层C(λi)的粒度,i=1,2,3,...,n:
Figure FDA0002737825120000051
其中Gi,k为粒层C(λi)中第k个样本粒子;|Gi,k|为第k个样本粒子中所含有的样本的个数;log2(|Gi,k|)为完全区分样本粒子Gi,k中所有粒子所需的信息量的表示;g表示粒层C(λi)中的样本粒子个数;
步骤C2,计算粒层C(λi)的信息增量IG[C(λi)],其中i=1,2,3,...,n:
IG[C(λi)]=E[C(λi)]-E[C(λi-1)];
步骤C3,计算粒层C(λi)的信息增量和样本间相似度的综合值Di,其中i=1,2,3,...,n:
Di=IG[C(λi)]*WigiWλ
其中,Wig为粒层C(λi)的信息增量的权重,Wλ为粒层C(λi)的样本相似度阈值的权重;
步骤C4,筛选出综合值Di最大的粒层作为最优粒层C(λo)。
5.一种面向产品装配工艺的非均匀样本均衡化系统,以产品的装配工艺流程拓扑结构作为样本,不同款式的同种产品的装配工艺流程拓扑结构为不同的样本,其特征在于,包括:
相似度生成模块,用于计算不同样本之间的相似度;
模糊相容空间构建模块,用于构建表示所有样本之间相似度的模糊相容矩阵S,通过模糊相容矩阵S来构建具有不同粒层的模糊相容空间X,通过所述模糊相容空间X对所有样本进行聚类,所述模糊相容空间X是根据样本之间的相似度分成多个不同的粒层;
最优粒层生成模块,用于基于粒计算的方式从所述模糊相容空间X中筛选出信息增量和样本间相似度的综合值最大的粒层作为最优粒层;
和均衡化模块,用于对最优粒层的样本进行均衡化处理;
所述均衡化模块包括:
平均样本数量计算子模块,用于计算最优粒层C(λo)中每个样本粒子Gi的平均样本数量
Figure FDA0002737825120000061
Figure FDA0002737825120000062
其中,设定阈值λ,阈值λ的取值分别为λ123,...,λn,且有1=λ1>λ2>λ3>...>λn=0,Gi,k为粒层C(λi)中第k个样本粒子;|Gi,k|为第k个样本粒子中所含有的样本的个数;g表示粒层C(λi)中的样本粒子个数;
样本扩减子模块,用于对最优粒层C(λo)中每个样本粒子Gi采用随机抽样的方法进行样本数量的扩充和删减,使得每一个样本粒子Gi中的样本个数相同,完成均衡化处理:
Figure FDA0002737825120000063
则将样本粒子Gi,k多出的样本随机剔除,使样本粒子Gi,k的样本个数|Gi,k|下降至
Figure FDA0002737825120000071
Figure FDA0002737825120000072
则将样本粒子Gi,k中原有的样本重新复制到样本粒子Gi,k,使样本粒子Gi,k的样本个数|Gi,k|增加至
Figure FDA0002737825120000073
6.根据权利要求5所述的面向产品装配工艺的非均匀样本均衡化系统,其特征在于,所述相似度生成模块包括:
节点相似度生成子模块,用于计算不同样本之间的节点相似度:
Figure FDA0002737825120000074
其中,i表示第i款的同种产品,j表示第j款的同种产品,Snode(vi,vj)表示第i款的同种产品的装配工艺流程拓扑结构vi和第j款的同种产品的装配工艺流程拓扑结构vj的节点相似度;mi,j表示所述装配工艺流程拓扑结构vi和所述装配工艺流程拓扑结构vj中的节点匹配数量;ei表示所述装配工艺流程拓扑结构vi中所有节点数量之和;ej表示所述装配工艺流程拓扑结构vj中所有节点数量之和;
拓扑关系相似度生成子模块,计算不同样本之间的拓扑关系相似度:
Figure FDA0002737825120000075
其中,Srel(vi,vj)表示第i款的同种产品的装配工艺流程拓扑结构vi和第j款的同种产品的装配工艺流程拓扑结构vj的拓扑关系相似度;Mi,j表示所述装配工艺流程拓扑结构vi和所述装配工艺流程拓扑结构vj中的关系边匹配数量;Ei表示所述装配工艺流程拓扑结构vi中所有关系边数量之和;Ej表示所述装配工艺流程拓扑结构vj中所有关系边数量之和;
和拓扑关系相似度生成子模块,计算不同样本之间的拓扑结构相似度:
S(i,j)=Snode(vi,vj)×Wnode+Srel(vi,vj)×Wrel
其中,S(i,j)表示第i款的同种产品的装配工艺流程拓扑结构vi和第j款的同种产品的装配工艺流程拓扑结构vj的拓扑结构相似度,Wnode为预设的节点权重参数,Wrel为预设的关系边权重参数。
7.根据权利要求6所述的面向产品装配工艺的非均匀样本均衡化系统,其特征在于,所述模糊相容空间构建模块包括:
模糊相容矩阵生成子模块,用于构建表示所有样本的集合V={v1,v2,v3,...,vn}之间的所有拓扑结构相似度的模糊相容矩阵S:
Figure FDA0002737825120000091
和粒层生成子模块,用于以模糊相容矩阵S为输入并经过以下单元构建具有不同粒层的模糊相容空间X,通过所述模糊相容空间X对所有样本进行聚类:
第一单元,用于设定阈值λ,且有1=λ1>λ2>λ3>...>λn=0,分别当阈值λ的取值分别为λ123,...,λn时,计算V={v1,v2,v3,...,vn}中样本vi与其他样本vj的相似度S(i,j),其中i∈(1,n);
第二单元,用于根据
Figure FDA0002737825120000092
求出当λ=λi时满足Sλ(i,j)=1的所有样本来构成样本粒子Gi,i=1,2,3,...,n,然后所有样本粒子Gi构成对应的粒层C(λi),最后由所有的粒层C(λi)构建出模糊相容空间X。
8.根据权利要求7所述的面向产品装配工艺的非均匀样本均衡化系统,其特征在于,所述最优粒层生成模块包括:
粒度计算子模块,用于计算粒层C(λi)的粒度,i=1,2,3,...,n:
Figure FDA0002737825120000101
其中Gi,k为粒层C(λi)中第k个样本粒子;|Gi,k|为第k个样本粒子中所含有的样本的个数;log2(|Gi,k|)为完全区分样本粒子Gi,k中所有粒子所需的信息量的表示;g表示粒层C(λi)中的样本粒子个数;
信息增量计算子模块,用于计算粒层C(λi)的信息增量IG[C(λi)],其中i=1,2,3,...,n:
IG[C(λi)]=E[C(λi)]-E[C(λi-1)];
综合值计算子模块,用于计算粒层C(λi)的信息增量和样本间相似度的综合值Di,其中i=1,2,3,...,n:
Di=IG[C(λi)]*WigiWλ
其中,Wig为粒层C(λi)的信息增量的权重,Wλ为粒层C(λi)的样本相似度阈值的权重;
和筛选子模块,用于筛选出综合值Di最大的粒层作为最优粒层C(λo)。
CN202010175032.0A 2020-03-13 2020-03-13 一种面向产品装配工艺的非均匀样本均衡化方法及系统 Active CN111353551B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010175032.0A CN111353551B (zh) 2020-03-13 2020-03-13 一种面向产品装配工艺的非均匀样本均衡化方法及系统
US17/134,369 US11429070B2 (en) 2020-03-13 2020-12-26 Inhomogeneous sample equalization method and system for product assembly process

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010175032.0A CN111353551B (zh) 2020-03-13 2020-03-13 一种面向产品装配工艺的非均匀样本均衡化方法及系统

Publications (2)

Publication Number Publication Date
CN111353551A CN111353551A (zh) 2020-06-30
CN111353551B true CN111353551B (zh) 2020-12-08

Family

ID=71194529

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010175032.0A Active CN111353551B (zh) 2020-03-13 2020-03-13 一种面向产品装配工艺的非均匀样本均衡化方法及系统

Country Status (2)

Country Link
US (1) US11429070B2 (zh)
CN (1) CN111353551B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11783389B2 (en) * 2019-12-06 2023-10-10 Proto Labs, Inc. Methods and systems for predicting a price of any subtractively manufactured part utilizing artificial intelligence at a computing device
CN114023063B (zh) * 2021-11-02 2022-10-21 大连理工大学 一种基于认知网络的智能交通系统协同决策方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006138525A2 (en) * 2005-06-16 2006-12-28 Strider Labs System and method for recognition in 2d images using 3d class models
CN104657418B (zh) * 2014-12-18 2018-01-19 北京航空航天大学 一种基于隶属度传播的复杂网络模糊社团挖掘方法
WO2016120463A1 (en) * 2015-01-31 2016-08-04 Ventana Medical Systems, Inc. Systems and methods for area-of-interest detection using slide thumbnail images
CN105868791A (zh) * 2016-04-15 2016-08-17 上海交通大学 基于模糊聚类的多分辨率社区发现方法
CN110766055A (zh) * 2019-09-23 2020-02-07 西安交通大学 一种基于语素划分和人工神经网络的智能装配工艺设计方法
CN111291818B (zh) 2020-02-18 2022-03-18 浙江工业大学 一种面向云掩膜的非均匀类别的样本均衡化方法
CN111832664A (zh) 2020-07-31 2020-10-27 华北电力大学(保定) 基于Borderline SMOTE的电力变压器故障样本均衡化和故障诊断方法

Also Published As

Publication number Publication date
US11429070B2 (en) 2022-08-30
CN111353551A (zh) 2020-06-30
US20210286326A1 (en) 2021-09-16

Similar Documents

Publication Publication Date Title
CN111095302B (zh) 稀疏深度卷积网络权重的压缩
CN111353551B (zh) 一种面向产品装配工艺的非均匀样本均衡化方法及系统
CN112364975A (zh) 基于图神经网络的终端运行状态预测方法及系统
CN109388565B (zh) 基于生成式对抗网络的软件系统性能优化方法
CN111461286B (zh) 基于进化神经网络的Spark参数自动优化系统和方法
CN109740481B (zh) 基于跳跃连接的cnn与lstm结合的房颤信号分类系统
Cai et al. Model slicing for supporting complex analytics with elastic inference cost and resource constraints
CN111985845B (zh) 一种异构Spark集群的节点优先级调优方法
CN111832839B (zh) 基于充分增量学习的能耗预测方法
CN111008726A (zh) 一种电力负荷预测中类图片转换方法
CN114066073A (zh) 电网负荷预测方法
CN113255844A (zh) 基于图卷积神经网络交互的推荐方法及系统
Halpin An EM algorithm for Hawkes process
CN109460872B (zh) 一种面向移动通信用户流失不平衡数据预测方法
CN110688722B (zh) 一种基于深度学习的零部件属性矩阵自动生成方法
CN112884513A (zh) 基于深度因子分解机的营销活动预测模型结构和预测方法
CN108921287A (zh) 一种神经网络模型的优化方法及系统
CN109636014B (zh) 一种基于成纱质量预测的配棉方法
CN113297185A (zh) 一种特征衍生方法及装置
CN113034343B (zh) 参数自适应的高光谱图像分类gpu并行方法
CN108230174B (zh) 一种基于谱分析的工业互联网社团检测的方法
CN111680846A (zh) 一种基于l1和l2范数的简化宽度学习系统
CN113032648A (zh) 一种数据筛选方法、装置、计算机设备及存储介质
TWI797089B (zh) 製程參數相關性分群與分析方法及製程參數相關性分群與分析系統
CN112734010A (zh) 一种适用于图像识别的卷积神经网络模型压缩方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant