CN113420375A - 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法 - Google Patents

基于Apriori建立工艺-质量-不平衡量关联关系模型的方法 Download PDF

Info

Publication number
CN113420375A
CN113420375A CN202110657757.8A CN202110657757A CN113420375A CN 113420375 A CN113420375 A CN 113420375A CN 202110657757 A CN202110657757 A CN 202110657757A CN 113420375 A CN113420375 A CN 113420375A
Authority
CN
China
Prior art keywords
unbalance
data
chi
association
quality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110657757.8A
Other languages
English (en)
Other versions
CN113420375B (zh
Inventor
王明微
邓伟
周竞涛
张惠斌
李智昂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202110657757.8A priority Critical patent/CN113420375B/zh
Publication of CN113420375A publication Critical patent/CN113420375A/zh
Application granted granted Critical
Publication of CN113420375B publication Critical patent/CN113420375B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/17Mechanical parametric or variational design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于Apriori建立工艺‑质量‑不平衡量关联关系模型的方法,首先调取装配留档数据库内数据以及云端大数据,对数据进行预处理;再对连续数据Chi‑merge离散化,之后形成事务数据集;然后对事务数据集进行关联分析,得到事务或项集与不平衡量之间的关联关系支持度和置信度;接下来基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;最后基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,分析计算其中相关性影响因子的影响比重,并对不平衡量增减影响进行定量分析。本发明能为航空发动机低压风扇转子的设计、制造和装配提供建设性建议根据。

Description

基于Apriori建立工艺-质量-不平衡量关联关系模型的方法
技术领域
本发明属于发动机技术领域,具体涉及一种建立工艺-质量-不平衡量关联关系模型的方法。
背景技术
研究转子不平衡量与工艺、质量因素相互耦合的信息作用规律,挖掘工艺、质量和不平衡量之间的内在关系、研究隐藏在低压风扇转子装配过程中海量数据间的潜在价值,得到其中相关性影响因子的影响比重,对航空发动机低压风扇转子的装配有着重要意义。
文献“高速铁路动车组故障关联关系分析的研究”分析了目前国内外动车组和数据挖掘的研究现状,梳理了动车组故障信息数据的种类,分析了动车组数据存在的问题,给出了数据清洗、数据转换等数据预处理方案,提出了基于加权思想的FP-Growth关联挖掘算法,称为WFPAM算法,通过设置权值来表示动车组故障数据中不同项目的重要程度;为了提高算法的执行效率和性能,采用深度优先搜索方法对FP-tree进行先根遍历,避免了挖掘FP-tree产生条件模式基时多次回溯的问题;使用FP-Growth,WFPAM,MR-WFPAM三种算法进行了动车组故障数据关联关系挖掘实验,最终找出了与列车组故障关联程度较大的因素,有效地对故障提前进行预防。
发明内容
为了克服现有技术的不足,本发明提供了一种基于Apriori建立工艺-质量-不平衡量关联关系模型的方法,首先调取装配留档数据库内数据以及云端大数据,对数据进行预处理;再对连续数据Chi-merge离散化,之后形成事务数据集;然后对事务数据集进行关联分析,得到事务或项集与不平衡量之间的关联关系支持度和置信度;接下来基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;最后基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,分析计算其中相关性影响因子的影响比重,并对不平衡量增减影响进行定量分析。本发明能为航空发动机低压风扇转子的设计、制造和装配提供建设性建议根据。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:调取装配留档数据库中的止口配合面粗糙度、端面跳动、拧紧力矩数据以及存储在云端的大数据,对数据进行预处理;
去除无用项和重复项,删除数据中与正常值偏差超过给定阈值的数值;数据中的缺失项使用平均值填充;
步骤2:连续数据Chi-merge离散化;
步骤2-1:初始化;
根据离散属性对步骤1处理过的数据按照数值从大到小排序,将每个样本归属于一个不同的区间;
步骤2-2:通过公式(1)计算每一对相邻区间的卡方值:
Figure BDA0003113989790000021
式中,m=2,表示每次比较两个相邻区间,k表示类别的数量,Aij表示第i区间第j类的样本数量,Eij表示Aij的期望,
Figure BDA0003113989790000022
式中,
Figure BDA0003113989790000023
为i区间中样本数,
Figure BDA0003113989790000024
为j类样本的个数,
Figure BDA0003113989790000025
为总样本个数;
步骤2-3:选择显著性水平,根据自由度确定卡方阈值;卡方值小于卡方阈值的区间合并,大于卡方阈值的区间不进行合并;
步骤2-4:将原始数据映射为Chi-merge离散化结果,即0、1、2...;
步骤3:形成事务数据集;
将离散化后的所有数据按照指定顺序整理为一个统一的事务数据集的集合T={I1,I2,I3,…,Ik,…};
步骤4:对集合T进行关联分析,得到T中事务Ik或项集X与不平衡量之间的关联关系,并可以得到这些关联关系的支持度和置信度;
步骤5:基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;
其中,支持度和置信度计算公式如下:
Figure BDA0003113989790000026
Figure BDA0003113989790000027
式中,X表示工艺、质量影响因素,Y表示不平衡量;
步骤6:基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,筛选出大于最小支持度与最小置信度的强关联规则,并基于这些强关联规则建立参数集。
本发明的有益效果如下:
本发明提供了一种基于“大数据”思想利用Apriori算法建立工艺-质量-不平衡量关联关系模型的方法,使用Chi-merge离散化方法,将连续数据映射为离散数值,实现了多维连续数据的关联关系挖掘,弥补了传统数据挖掘方法只能进行布尔型数据挖掘的缺点。本发明建立的关联关系模型可以有效挖掘工艺、质量因素和不平衡量之间的潜在关系,实现设计、制造与装配过程参数化,为参数调整提供支持,为航空发动机低压风扇转子的设计、制造和装配提供建设性建议根据。
附图说明
图1是本发明模型的建立框架示意图;
图2是本发明实施算例分析记录示意图
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本发明的目的是为了克服现有技术的不足,提供一种基于Apriori算法建立工艺-质量-不平衡量关联关系模型的方法,能够实现基于“大数据”的思维方式,利用数据挖掘关联分析技术研究隐藏在低压风扇转子装配中海量数据间的潜在价值。
一种基于Apriori建立工艺-质量-不平衡量关联关系模型的方法,包括如下步骤:
步骤1:调取装配留档数据库中的止口配合面粗糙度、端面跳动、拧紧力矩数据以及存储在云端的大数据,对数据进行预处理;
去除无用项和重复项,删除数据中与正常值偏差超过给定阈值的数值;数据中的缺失项使用平均值填充;
步骤2:连续数据Chi-merge离散化;
步骤2-1:初始化;
根据离散属性对步骤1处理过的数据按照数值从大到小排序,将每个样本归属于一个不同的区间;
步骤2-2:通过公式(1)计算每一对相邻区间的卡方值:
Figure BDA0003113989790000041
式中,m=2,表示每次比较两个相邻区间,k表示类别的数量,Aij表示第i区间第j类的样本数量,Eij表示Aij的期望,
Figure BDA0003113989790000042
式中,
Figure BDA0003113989790000043
为i区间中样本数,
Figure BDA0003113989790000044
为j类样本的个数,
Figure BDA0003113989790000045
为总样本个数;
步骤2-3:选择显著性水平,根据自由度确定卡方阈值;卡方值小于卡方阈值的区间合并,大于卡方阈值的区间不进行合并;
步骤2-4:将原始数据映射为Chi-merge离散化结果,即0、1、2...;
步骤3:形成事务数据集;
将离散化后的所有数据按照指定顺序整理为一个统一的事务数据集的集合T={I1,I2,I3,…,Ik,…};
步骤4:对集合T进行关联分析,得到T中事务Ik或项集X与不平衡量之间的关联关系,并可以得到这些关联关系的支持度和置信度;
步骤5:基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;
其中,支持度和置信度计算公式如下:
Figure BDA0003113989790000046
Figure BDA0003113989790000047
式中,X表示工艺、质量影响因素,Y表示不平衡量;
步骤6:基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,筛选出大于最小支持度与最小置信度的强关联规则,并基于这些强关联规则建立参数集。
通过上述方案,基于现有的数据库,可以是以往的装配单位历史数据库,利用数据预处理,连续数据chi-merge离散化,对其一致性、及时性、适用性、准确性进行审核,形成事务数据集,再进行关联分析,通过互相之间的关联关系,得到这些关联关系的支持度和置信度,并以之建立不平衡量关联关系模型,用于挖掘工艺、质量因素和不平衡量之间的关联关系。
具体实施例:
利用本发明提出的基于Apriori算法建立工艺-质量-不平衡关联关系模型,对西安某企业管理系统中低压风扇转子的装配数据进行分析,并寻找其中的数据关联。
算例中Apriori算法的程序实现基于Python程序语言开发中的Efficient-apriori库。
对事务数据库进行大数据关联分析,设置最小支持度为10%,最小置信度为50%,对关联结果进行整理,去除无用项,得到关联分析结果如图2所示。

Claims (1)

1.一种基于Apriori建立工艺-质量-不平衡量关联关系模型的方法,其特征在于,包括以下步骤:
步骤1:调取装配留档数据库中的止口配合面粗糙度、端面跳动、拧紧力矩数据以及存储在云端的大数据,对数据进行预处理;
去除无用项和重复项,删除数据中与正常值偏差超过给定阈值的数值;数据中的缺失项使用平均值填充;
步骤2:连续数据Chi-merge离散化;
步骤2-1:初始化;
根据离散属性对步骤1处理过的数据按照数值从大到小排序,将每个样本归属于一个不同的区间;
步骤2-2:通过公式(1)计算每一对相邻区间的卡方值:
Figure FDA0003113989780000011
式中,m=2,表示每次比较两个相邻区间,k表示类别的数量,Aij表示第i区间第j类的样本数量,Eij表示Aij的期望,
Figure FDA0003113989780000012
式中,
Figure FDA0003113989780000013
为i区间中样本数,
Figure FDA0003113989780000014
为j类样本的个数,
Figure FDA0003113989780000015
为总样本个数;
步骤2-3:选择显著性水平,根据自由度确定卡方阈值;卡方值小于卡方阈值的区间合并,大于卡方阈值的区间不进行合并;
步骤2-4:将原始数据映射为Chi-merge离散化结果,即0、1、2...;
步骤3:形成事务数据集;
将离散化后的所有数据按照指定顺序整理为一个统一的事务数据集的集合T={I1,I2,I3,…,Ik,…};
步骤4:对集合T进行关联分析,得到T中事务Ik或项集X与不平衡量之间的关联关系,并可以得到这些关联关系的支持度和置信度;
步骤5:基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;
其中,支持度和置信度计算公式如下:
Figure FDA0003113989780000021
Figure FDA0003113989780000022
式中,X表示工艺、质量影响因素,Y表示不平衡量;
步骤6:基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,筛选出大于最小支持度与最小置信度的强关联规则,并基于这些强关联规则建立参数集。
CN202110657757.8A 2021-06-14 2021-06-14 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法 Active CN113420375B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110657757.8A CN113420375B (zh) 2021-06-14 2021-06-14 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110657757.8A CN113420375B (zh) 2021-06-14 2021-06-14 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法

Publications (2)

Publication Number Publication Date
CN113420375A true CN113420375A (zh) 2021-09-21
CN113420375B CN113420375B (zh) 2022-05-31

Family

ID=77788427

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110657757.8A Active CN113420375B (zh) 2021-06-14 2021-06-14 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法

Country Status (1)

Country Link
CN (1) CN113420375B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6385608B1 (en) * 1997-11-11 2002-05-07 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for discovering association rules
CN108806767A (zh) * 2018-06-15 2018-11-13 中南大学 基于电子病历的疾病症状关联分析方法
CN110163511A (zh) * 2019-05-24 2019-08-23 重庆大学 一种基于关联规则挖掘和模糊决策的制造质量控制方法
CN111538760A (zh) * 2020-04-21 2020-08-14 国网信通亿力科技有限责任公司 一种基于Apriori算法建立配电负荷线损关联分析模型的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6385608B1 (en) * 1997-11-11 2002-05-07 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for discovering association rules
CN108806767A (zh) * 2018-06-15 2018-11-13 中南大学 基于电子病历的疾病症状关联分析方法
CN110163511A (zh) * 2019-05-24 2019-08-23 重庆大学 一种基于关联规则挖掘和模糊决策的制造质量控制方法
CN111538760A (zh) * 2020-04-21 2020-08-14 国网信通亿力科技有限责任公司 一种基于Apriori算法建立配电负荷线损关联分析模型的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUANXUN SHAO 等: "Software defect prediction based on correlation weighted class association rule mining", 《KNOWLEDGE-BASED SYSTEMS》 *
李先飞: "基于数据挖掘的零件加工质量规则获取与质量预测研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *

Also Published As

Publication number Publication date
CN113420375B (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
CN101093559B (zh) 一种基于知识发现的专家系统构造方法
CN108170769A (zh) 一种基于决策树算法的装配制造质量数据处理方法
CN110619419B (zh) 城市轨道交通的客流预测方法
CN113688558B (zh) 一种基于大数据库样本的汽车行驶工况构建方法及系统
CN111581454A (zh) 基于深度图压缩算法的并行查询表现预测系统及方法
Zou et al. Survey on learnable databases: A machine learning perspective
CN113420375B (zh) 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法
CN113706328A (zh) 基于fassa-bp算法的智能制造能力成熟度评价方法
CN113761032A (zh) 基于可拓关联规则挖掘的航空发动机故障诊断方法及系统
Dongnan et al. Parallel design of apriori algorithm based on the method of “determine infrequent items & remove infrequent itemsets”
Wei et al. Manufacturing data-driven process adaptive design method
Adhikari et al. Study of select items in different data sources by grouping
Singh et al. Knowledge based retrieval scheme from big data for aviation industry
CN110990907A (zh) 基于特征-资源知识的船用柴油机关重件可制造性三级优化方法
Hassan et al. Sampling technique selection framework for knowledge discovery
CN106021401A (zh) 可扩展的基于倒排索引的实体解析算法
CN112306730B (zh) 基于历史项目伪标签生成的缺陷报告严重程度预测方法
CN115409541A (zh) 基于数据血缘的卷烟品牌数据处理方法
Syahrir et al. Improvement of Apriori Algorithm Performance Using the TID-List Vertical Approach and Data Partitioning.
Ghosh Statistical Databases for Automated Manufacturing
Chawla et al. Reverse apriori approach—an effective association rule mining algorithm
CN114943060B (zh) 基于深度学习与插值回归的页岩气总有机碳预测方法
CN114880588B (zh) 基于知识图谱的新闻热度预测方法
Zhu et al. An experimental study on four models of customer churn prediction
Luo et al. An interpretable prediction model for pavement performance prediction based on XGBoost and SHAP

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant