CN113420375B - 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法 - Google Patents

基于Apriori建立工艺-质量-不平衡量关联关系模型的方法 Download PDF

Info

Publication number
CN113420375B
CN113420375B CN202110657757.8A CN202110657757A CN113420375B CN 113420375 B CN113420375 B CN 113420375B CN 202110657757 A CN202110657757 A CN 202110657757A CN 113420375 B CN113420375 B CN 113420375B
Authority
CN
China
Prior art keywords
unbalance
data
chi
association
quality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110657757.8A
Other languages
English (en)
Other versions
CN113420375A (zh
Inventor
王明微
邓伟
周竞涛
张惠斌
李智昂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202110657757.8A priority Critical patent/CN113420375B/zh
Publication of CN113420375A publication Critical patent/CN113420375A/zh
Application granted granted Critical
Publication of CN113420375B publication Critical patent/CN113420375B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/17Mechanical parametric or variational design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于Apriori建立工艺‑质量‑不平衡量关联关系模型的方法,首先调取装配留档数据库内数据以及云端大数据,对数据进行预处理;再对连续数据Chi‑merge离散化,之后形成事务数据集;然后对事务数据集进行关联分析,得到事务或项集与不平衡量之间的关联关系支持度和置信度;接下来基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;最后基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,分析计算其中相关性影响因子的影响比重,并对不平衡量增减影响进行定量分析。本发明能为航空发动机低压风扇转子的设计、制造和装配提供建设性建议根据。

Description

基于Apriori建立工艺-质量-不平衡量关联关系模型的方法
技术领域
本发明属于发动机技术领域,具体涉及一种建立工艺-质量-不平衡量关联关系模型的方法。
背景技术
研究转子不平衡量与工艺、质量因素相互耦合的信息作用规律,挖掘工艺、质量和不平衡量之间的内在关系、研究隐藏在低压风扇转子装配过程中海量数据间的潜在价值,得到其中相关性影响因子的影响比重,对航空发动机低压风扇转子的装配有着重要意义。
文献“高速铁路动车组故障关联关系分析的研究”分析了目前国内外动车组和数据挖掘的研究现状,梳理了动车组故障信息数据的种类,分析了动车组数据存在的问题,给出了数据清洗、数据转换等数据预处理方案,提出了基于加权思想的FP-Growth关联挖掘算法,称为WFPAM算法,通过设置权值来表示动车组故障数据中不同项目的重要程度;为了提高算法的执行效率和性能,采用深度优先搜索方法对FP-tree进行先根遍历,避免了挖掘FP-tree产生条件模式基时多次回溯的问题;使用FP-Growth,WFPAM,MR-WFPAM三种算法进行了动车组故障数据关联关系挖掘实验,最终找出了与列车组故障关联程度较大的因素,有效地对故障提前进行预防。
发明内容
为了克服现有技术的不足,本发明提供了一种基于Apriori建立工艺-质量-不平衡量关联关系模型的方法,首先调取装配留档数据库内数据以及云端大数据,对数据进行预处理;再对连续数据Chi-merge离散化,之后形成事务数据集;然后对事务数据集进行关联分析,得到事务或项集与不平衡量之间的关联关系支持度和置信度;接下来基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;最后基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,分析计算其中相关性影响因子的影响比重,并对不平衡量增减影响进行定量分析。本发明能为航空发动机低压风扇转子的设计、制造和装配提供建设性建议根据。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:调取装配留档数据库中的止口配合面粗糙度、端面跳动、拧紧力矩数据以及存储在云端的大数据,对数据进行预处理;
去除无用项和重复项,删除数据中与正常值偏差超过给定阈值的数值;数据中的缺失项使用平均值填充;
步骤2:连续数据Chi-merge离散化;
步骤2-1:初始化;
根据离散属性对步骤1处理过的数据按照数值从大到小排序,将每个样本归属于一个不同的区间;
步骤2-2:通过公式(1)计算每一对相邻区间的卡方值:
Figure BDA0003113989790000021
式中,m=2,表示每次比较两个相邻区间,k表示类别的数量,Aij表示第i区间第j类的样本数量,Eij表示Aij的期望,
Figure BDA0003113989790000022
式中,
Figure BDA0003113989790000023
为i区间中样本数,
Figure BDA0003113989790000024
为j类样本的个数,
Figure BDA0003113989790000025
为总样本个数;
步骤2-3:选择显著性水平,根据自由度确定卡方阈值;卡方值小于卡方阈值的区间合并,大于卡方阈值的区间不进行合并;
步骤2-4:将原始数据映射为Chi-merge离散化结果,即0、1、2...;
步骤3:形成事务数据集;
将离散化后的所有数据按照指定顺序整理为一个统一的事务数据集的集合T={I1,I2,I3,…,Ik,…};
步骤4:对集合T进行关联分析,得到T中事务Ik或项集X与不平衡量之间的关联关系,并可以得到这些关联关系的支持度和置信度;
步骤5:基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;
其中,支持度和置信度计算公式如下:
Figure BDA0003113989790000026
Figure BDA0003113989790000027
式中,X表示工艺、质量影响因素,Y表示不平衡量;
步骤6:基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,筛选出大于最小支持度与最小置信度的强关联规则,并基于这些强关联规则建立参数集。
本发明的有益效果如下:
本发明提供了一种基于“大数据”思想利用Apriori算法建立工艺-质量-不平衡量关联关系模型的方法,使用Chi-merge离散化方法,将连续数据映射为离散数值,实现了多维连续数据的关联关系挖掘,弥补了传统数据挖掘方法只能进行布尔型数据挖掘的缺点。本发明建立的关联关系模型可以有效挖掘工艺、质量因素和不平衡量之间的潜在关系,实现设计、制造与装配过程参数化,为参数调整提供支持,为航空发动机低压风扇转子的设计、制造和装配提供建设性建议根据。
附图说明
图1是本发明模型的建立框架示意图;
图2是本发明实施算例分析记录示意图
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本发明的目的是为了克服现有技术的不足,提供一种基于Apriori算法建立工艺-质量-不平衡量关联关系模型的方法,能够实现基于“大数据”的思维方式,利用数据挖掘关联分析技术研究隐藏在低压风扇转子装配中海量数据间的潜在价值。
一种基于Apriori建立工艺-质量-不平衡量关联关系模型的方法,包括如下步骤:
步骤1:调取装配留档数据库中的止口配合面粗糙度、端面跳动、拧紧力矩数据以及存储在云端的大数据,对数据进行预处理;
去除无用项和重复项,删除数据中与正常值偏差超过给定阈值的数值;数据中的缺失项使用平均值填充;
步骤2:连续数据Chi-merge离散化;
步骤2-1:初始化;
根据离散属性对步骤1处理过的数据按照数值从大到小排序,将每个样本归属于一个不同的区间;
步骤2-2:通过公式(1)计算每一对相邻区间的卡方值:
Figure BDA0003113989790000041
式中,m=2,表示每次比较两个相邻区间,k表示类别的数量,Aij表示第i区间第j类的样本数量,Eij表示Aij的期望,
Figure BDA0003113989790000042
式中,
Figure BDA0003113989790000043
为i区间中样本数,
Figure BDA0003113989790000044
为j类样本的个数,
Figure BDA0003113989790000045
为总样本个数;
步骤2-3:选择显著性水平,根据自由度确定卡方阈值;卡方值小于卡方阈值的区间合并,大于卡方阈值的区间不进行合并;
步骤2-4:将原始数据映射为Chi-merge离散化结果,即0、1、2...;
步骤3:形成事务数据集;
将离散化后的所有数据按照指定顺序整理为一个统一的事务数据集的集合T={I1,I2,I3,…,Ik,…};
步骤4:对集合T进行关联分析,得到T中事务Ik或项集X与不平衡量之间的关联关系,并可以得到这些关联关系的支持度和置信度;
步骤5:基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;
其中,支持度和置信度计算公式如下:
Figure BDA0003113989790000046
Figure BDA0003113989790000047
式中,X表示工艺、质量影响因素,Y表示不平衡量;
步骤6:基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,筛选出大于最小支持度与最小置信度的强关联规则,并基于这些强关联规则建立参数集。
通过上述方案,基于现有的数据库,可以是以往的装配单位历史数据库,利用数据预处理,连续数据chi-merge离散化,对其一致性、及时性、适用性、准确性进行审核,形成事务数据集,再进行关联分析,通过互相之间的关联关系,得到这些关联关系的支持度和置信度,并以之建立不平衡量关联关系模型,用于挖掘工艺、质量因素和不平衡量之间的关联关系。
具体实施例:
利用本发明提出的基于Apriori算法建立工艺-质量-不平衡关联关系模型,对西安某企业管理系统中低压风扇转子的装配数据进行分析,并寻找其中的数据关联。
算例中Apriori算法的程序实现基于Python程序语言开发中的Efficient-apriori库。
对事务数据库进行大数据关联分析,设置最小支持度为10%,最小置信度为50%,对关联结果进行整理,去除无用项,得到关联分析结果如图2所示。

Claims (1)

1.一种基于Apriori建立工艺-质量-不平衡量关联关系模型的方法,其特征在于,包括以下步骤:
步骤1:调取装配留档数据库中的止口配合面粗糙度、端面跳动、拧紧力矩数据以及存储在云端的大数据,对数据进行预处理;
去除无用项和重复项,删除数据中与正常值偏差超过给定阈值的数值;数据中的缺失项使用平均值填充;
步骤2:连续数据Chi-merge离散化;
步骤2-1:初始化;
根据离散属性对步骤1处理过的数据按照数值从大到小排序,将每个样本归属于一个不同的区间;
步骤2-2:通过公式(1)计算每一对相邻区间的卡方值:
Figure FDA0003113989780000011
式中,m=2,表示每次比较两个相邻区间,k表示类别的数量,Aij表示第i区间第j类的样本数量,Eij表示Aij的期望,
Figure FDA0003113989780000012
式中,
Figure FDA0003113989780000013
为i区间中样本数,
Figure FDA0003113989780000014
为j类样本的个数,
Figure FDA0003113989780000015
为总样本个数;
步骤2-3:选择显著性水平,根据自由度确定卡方阈值;卡方值小于卡方阈值的区间合并,大于卡方阈值的区间不进行合并;
步骤2-4:将原始数据映射为Chi-merge离散化结果,即0、1、2...;
步骤3:形成事务数据集;
将离散化后的所有数据按照指定顺序整理为一个统一的事务数据集的集合T={I1,I2,I3,…,Ik,…};
步骤4:对集合T进行关联分析,得到T中事务Ik或项集X与不平衡量之间的关联关系,并可以得到这些关联关系的支持度和置信度;
步骤5:基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;
其中,支持度和置信度计算公式如下:
Figure FDA0003113989780000021
Figure FDA0003113989780000022
式中,X表示工艺、质量影响因素,Y表示不平衡量;
步骤6:基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,筛选出大于最小支持度与最小置信度的强关联规则,并基于这些强关联规则建立参数集。
CN202110657757.8A 2021-06-14 2021-06-14 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法 Active CN113420375B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110657757.8A CN113420375B (zh) 2021-06-14 2021-06-14 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110657757.8A CN113420375B (zh) 2021-06-14 2021-06-14 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法

Publications (2)

Publication Number Publication Date
CN113420375A CN113420375A (zh) 2021-09-21
CN113420375B true CN113420375B (zh) 2022-05-31

Family

ID=77788427

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110657757.8A Active CN113420375B (zh) 2021-06-14 2021-06-14 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法

Country Status (1)

Country Link
CN (1) CN113420375B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6385608B1 (en) * 1997-11-11 2002-05-07 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for discovering association rules
CN108806767A (zh) * 2018-06-15 2018-11-13 中南大学 基于电子病历的疾病症状关联分析方法
CN110163511A (zh) * 2019-05-24 2019-08-23 重庆大学 一种基于关联规则挖掘和模糊决策的制造质量控制方法
CN111538760A (zh) * 2020-04-21 2020-08-14 国网信通亿力科技有限责任公司 一种基于Apriori算法建立配电负荷线损关联分析模型的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6385608B1 (en) * 1997-11-11 2002-05-07 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for discovering association rules
CN108806767A (zh) * 2018-06-15 2018-11-13 中南大学 基于电子病历的疾病症状关联分析方法
CN110163511A (zh) * 2019-05-24 2019-08-23 重庆大学 一种基于关联规则挖掘和模糊决策的制造质量控制方法
CN111538760A (zh) * 2020-04-21 2020-08-14 国网信通亿力科技有限责任公司 一种基于Apriori算法建立配电负荷线损关联分析模型的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Software defect prediction based on correlation weighted class association rule mining;Yuanxun Shao 等;《Knowledge-Based Systems》;20200323;第196卷;第1-25页 *
基于数据挖掘的零件加工质量规则获取与质量预测研究;李先飞;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20201215(第12期);第C029-55页 *

Also Published As

Publication number Publication date
CN113420375A (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
CN101093559B (zh) 一种基于知识发现的专家系统构造方法
CN110458336B (zh) 一种基于深度学习的网约车供需预测方法
CN108417033A (zh) 基于多维因素的高速路交通事故分析预测方法
CN113688558B (zh) 一种基于大数据库样本的汽车行驶工况构建方法及系统
CN108170769A (zh) 一种基于决策树算法的装配制造质量数据处理方法
Dorfeshan et al. A new enhanced ARAS method for critical path selection of engineering projects with interval type-2 fuzzy sets
WO2021128523A1 (zh) 一种基于科技大数据的技术成熟度判断方法和系统
CN116739376A (zh) 一种基于数据挖掘的公路路面预防性养护决策方法
CN117453764A (zh) 一种数据挖掘分析方法
CN113420375B (zh) 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法
CN113761032A (zh) 基于可拓关联规则挖掘的航空发动机故障诊断方法及系统
CN113420506A (zh) 掘进速度的预测模型建立方法、预测方法及装置
Dongnan et al. Parallel design of apriori algorithm based on the method of “determine infrequent items & remove infrequent itemsets”
Wei et al. Manufacturing data-driven process adaptive design method
CN112580951A (zh) 基于乘客出行的城市地面公交运行监测关键指标筛选方法
CN114819417B (zh) 基于费用间相关性的航空发动机大修费用预测方法及系统
CN110990907A (zh) 基于特征-资源知识的船用柴油机关重件可制造性三级优化方法
Hassan et al. Sampling technique selection framework for knowledge discovery
CN115409541A (zh) 基于数据血缘的卷烟品牌数据处理方法
CN112306730B (zh) 基于历史项目伪标签生成的缺陷报告严重程度预测方法
Ghosh Statistical Databases for Automated Manufacturing
CN114880588B (zh) 基于知识图谱的新闻热度预测方法
Luo et al. An interpretable prediction model for pavement performance prediction based on XGBoost and SHAP
CN114943060B (zh) 基于深度学习与插值回归的页岩气总有机碳预测方法
CN112836926B (zh) 基于电力大数据的企业经营状况评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant