CN113420375B - 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法 - Google Patents
基于Apriori建立工艺-质量-不平衡量关联关系模型的方法 Download PDFInfo
- Publication number
- CN113420375B CN113420375B CN202110657757.8A CN202110657757A CN113420375B CN 113420375 B CN113420375 B CN 113420375B CN 202110657757 A CN202110657757 A CN 202110657757A CN 113420375 B CN113420375 B CN 113420375B
- Authority
- CN
- China
- Prior art keywords
- unbalance
- data
- chi
- association
- quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/15—Vehicle, aircraft or watercraft design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/17—Mechanical parametric or variational design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Geometry (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Automation & Control Theory (AREA)
- Aviation & Aerospace Engineering (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于Apriori建立工艺‑质量‑不平衡量关联关系模型的方法,首先调取装配留档数据库内数据以及云端大数据,对数据进行预处理;再对连续数据Chi‑merge离散化,之后形成事务数据集;然后对事务数据集进行关联分析,得到事务或项集与不平衡量之间的关联关系支持度和置信度;接下来基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;最后基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,分析计算其中相关性影响因子的影响比重,并对不平衡量增减影响进行定量分析。本发明能为航空发动机低压风扇转子的设计、制造和装配提供建设性建议根据。
Description
技术领域
本发明属于发动机技术领域,具体涉及一种建立工艺-质量-不平衡量关联关系模型的方法。
背景技术
研究转子不平衡量与工艺、质量因素相互耦合的信息作用规律,挖掘工艺、质量和不平衡量之间的内在关系、研究隐藏在低压风扇转子装配过程中海量数据间的潜在价值,得到其中相关性影响因子的影响比重,对航空发动机低压风扇转子的装配有着重要意义。
文献“高速铁路动车组故障关联关系分析的研究”分析了目前国内外动车组和数据挖掘的研究现状,梳理了动车组故障信息数据的种类,分析了动车组数据存在的问题,给出了数据清洗、数据转换等数据预处理方案,提出了基于加权思想的FP-Growth关联挖掘算法,称为WFPAM算法,通过设置权值来表示动车组故障数据中不同项目的重要程度;为了提高算法的执行效率和性能,采用深度优先搜索方法对FP-tree进行先根遍历,避免了挖掘FP-tree产生条件模式基时多次回溯的问题;使用FP-Growth,WFPAM,MR-WFPAM三种算法进行了动车组故障数据关联关系挖掘实验,最终找出了与列车组故障关联程度较大的因素,有效地对故障提前进行预防。
发明内容
为了克服现有技术的不足,本发明提供了一种基于Apriori建立工艺-质量-不平衡量关联关系模型的方法,首先调取装配留档数据库内数据以及云端大数据,对数据进行预处理;再对连续数据Chi-merge离散化,之后形成事务数据集;然后对事务数据集进行关联分析,得到事务或项集与不平衡量之间的关联关系支持度和置信度;接下来基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;最后基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,分析计算其中相关性影响因子的影响比重,并对不平衡量增减影响进行定量分析。本发明能为航空发动机低压风扇转子的设计、制造和装配提供建设性建议根据。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:调取装配留档数据库中的止口配合面粗糙度、端面跳动、拧紧力矩数据以及存储在云端的大数据,对数据进行预处理;
去除无用项和重复项,删除数据中与正常值偏差超过给定阈值的数值;数据中的缺失项使用平均值填充;
步骤2:连续数据Chi-merge离散化;
步骤2-1:初始化;
根据离散属性对步骤1处理过的数据按照数值从大到小排序,将每个样本归属于一个不同的区间;
步骤2-2:通过公式(1)计算每一对相邻区间的卡方值:
式中,m=2,表示每次比较两个相邻区间,k表示类别的数量,Aij表示第i区间第j类的样本数量,Eij表示Aij的期望,
步骤2-3:选择显著性水平,根据自由度确定卡方阈值;卡方值小于卡方阈值的区间合并,大于卡方阈值的区间不进行合并;
步骤2-4:将原始数据映射为Chi-merge离散化结果,即0、1、2...;
步骤3:形成事务数据集;
将离散化后的所有数据按照指定顺序整理为一个统一的事务数据集的集合T={I1,I2,I3,…,Ik,…};
步骤4:对集合T进行关联分析,得到T中事务Ik或项集X与不平衡量之间的关联关系,并可以得到这些关联关系的支持度和置信度;
步骤5:基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;
其中,支持度和置信度计算公式如下:
式中,X表示工艺、质量影响因素,Y表示不平衡量;
步骤6:基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,筛选出大于最小支持度与最小置信度的强关联规则,并基于这些强关联规则建立参数集。
本发明的有益效果如下:
本发明提供了一种基于“大数据”思想利用Apriori算法建立工艺-质量-不平衡量关联关系模型的方法,使用Chi-merge离散化方法,将连续数据映射为离散数值,实现了多维连续数据的关联关系挖掘,弥补了传统数据挖掘方法只能进行布尔型数据挖掘的缺点。本发明建立的关联关系模型可以有效挖掘工艺、质量因素和不平衡量之间的潜在关系,实现设计、制造与装配过程参数化,为参数调整提供支持,为航空发动机低压风扇转子的设计、制造和装配提供建设性建议根据。
附图说明
图1是本发明模型的建立框架示意图;
图2是本发明实施算例分析记录示意图
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本发明的目的是为了克服现有技术的不足,提供一种基于Apriori算法建立工艺-质量-不平衡量关联关系模型的方法,能够实现基于“大数据”的思维方式,利用数据挖掘关联分析技术研究隐藏在低压风扇转子装配中海量数据间的潜在价值。
一种基于Apriori建立工艺-质量-不平衡量关联关系模型的方法,包括如下步骤:
步骤1:调取装配留档数据库中的止口配合面粗糙度、端面跳动、拧紧力矩数据以及存储在云端的大数据,对数据进行预处理;
去除无用项和重复项,删除数据中与正常值偏差超过给定阈值的数值;数据中的缺失项使用平均值填充;
步骤2:连续数据Chi-merge离散化;
步骤2-1:初始化;
根据离散属性对步骤1处理过的数据按照数值从大到小排序,将每个样本归属于一个不同的区间;
步骤2-2:通过公式(1)计算每一对相邻区间的卡方值:
式中,m=2,表示每次比较两个相邻区间,k表示类别的数量,Aij表示第i区间第j类的样本数量,Eij表示Aij的期望,
步骤2-3:选择显著性水平,根据自由度确定卡方阈值;卡方值小于卡方阈值的区间合并,大于卡方阈值的区间不进行合并;
步骤2-4:将原始数据映射为Chi-merge离散化结果,即0、1、2...;
步骤3:形成事务数据集;
将离散化后的所有数据按照指定顺序整理为一个统一的事务数据集的集合T={I1,I2,I3,…,Ik,…};
步骤4:对集合T进行关联分析,得到T中事务Ik或项集X与不平衡量之间的关联关系,并可以得到这些关联关系的支持度和置信度;
步骤5:基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;
其中,支持度和置信度计算公式如下:
式中,X表示工艺、质量影响因素,Y表示不平衡量;
步骤6:基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,筛选出大于最小支持度与最小置信度的强关联规则,并基于这些强关联规则建立参数集。
通过上述方案,基于现有的数据库,可以是以往的装配单位历史数据库,利用数据预处理,连续数据chi-merge离散化,对其一致性、及时性、适用性、准确性进行审核,形成事务数据集,再进行关联分析,通过互相之间的关联关系,得到这些关联关系的支持度和置信度,并以之建立不平衡量关联关系模型,用于挖掘工艺、质量因素和不平衡量之间的关联关系。
具体实施例:
利用本发明提出的基于Apriori算法建立工艺-质量-不平衡关联关系模型,对西安某企业管理系统中低压风扇转子的装配数据进行分析,并寻找其中的数据关联。
算例中Apriori算法的程序实现基于Python程序语言开发中的Efficient-apriori库。
对事务数据库进行大数据关联分析,设置最小支持度为10%,最小置信度为50%,对关联结果进行整理,去除无用项,得到关联分析结果如图2所示。
Claims (1)
1.一种基于Apriori建立工艺-质量-不平衡量关联关系模型的方法,其特征在于,包括以下步骤:
步骤1:调取装配留档数据库中的止口配合面粗糙度、端面跳动、拧紧力矩数据以及存储在云端的大数据,对数据进行预处理;
去除无用项和重复项,删除数据中与正常值偏差超过给定阈值的数值;数据中的缺失项使用平均值填充;
步骤2:连续数据Chi-merge离散化;
步骤2-1:初始化;
根据离散属性对步骤1处理过的数据按照数值从大到小排序,将每个样本归属于一个不同的区间;
步骤2-2:通过公式(1)计算每一对相邻区间的卡方值:
式中,m=2,表示每次比较两个相邻区间,k表示类别的数量,Aij表示第i区间第j类的样本数量,Eij表示Aij的期望,
步骤2-3:选择显著性水平,根据自由度确定卡方阈值;卡方值小于卡方阈值的区间合并,大于卡方阈值的区间不进行合并;
步骤2-4:将原始数据映射为Chi-merge离散化结果,即0、1、2...;
步骤3:形成事务数据集;
将离散化后的所有数据按照指定顺序整理为一个统一的事务数据集的集合T={I1,I2,I3,…,Ik,…};
步骤4:对集合T进行关联分析,得到T中事务Ik或项集X与不平衡量之间的关联关系,并可以得到这些关联关系的支持度和置信度;
步骤5:基于Apriori关联算法,对装配过程中的影响因素与不平衡量进行关联分析,建立不平衡量关联关系模型;
其中,支持度和置信度计算公式如下:
式中,X表示工艺、质量影响因素,Y表示不平衡量;
步骤6:基于不平衡量关联关系模型,挖掘工艺、质量和不平衡量之间的内在关系,筛选出大于最小支持度与最小置信度的强关联规则,并基于这些强关联规则建立参数集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110657757.8A CN113420375B (zh) | 2021-06-14 | 2021-06-14 | 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110657757.8A CN113420375B (zh) | 2021-06-14 | 2021-06-14 | 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113420375A CN113420375A (zh) | 2021-09-21 |
CN113420375B true CN113420375B (zh) | 2022-05-31 |
Family
ID=77788427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110657757.8A Active CN113420375B (zh) | 2021-06-14 | 2021-06-14 | 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113420375B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6385608B1 (en) * | 1997-11-11 | 2002-05-07 | Mitsubishi Denki Kabushiki Kaisha | Method and apparatus for discovering association rules |
CN108806767A (zh) * | 2018-06-15 | 2018-11-13 | 中南大学 | 基于电子病历的疾病症状关联分析方法 |
CN110163511A (zh) * | 2019-05-24 | 2019-08-23 | 重庆大学 | 一种基于关联规则挖掘和模糊决策的制造质量控制方法 |
CN111538760A (zh) * | 2020-04-21 | 2020-08-14 | 国网信通亿力科技有限责任公司 | 一种基于Apriori算法建立配电负荷线损关联分析模型的方法 |
-
2021
- 2021-06-14 CN CN202110657757.8A patent/CN113420375B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6385608B1 (en) * | 1997-11-11 | 2002-05-07 | Mitsubishi Denki Kabushiki Kaisha | Method and apparatus for discovering association rules |
CN108806767A (zh) * | 2018-06-15 | 2018-11-13 | 中南大学 | 基于电子病历的疾病症状关联分析方法 |
CN110163511A (zh) * | 2019-05-24 | 2019-08-23 | 重庆大学 | 一种基于关联规则挖掘和模糊决策的制造质量控制方法 |
CN111538760A (zh) * | 2020-04-21 | 2020-08-14 | 国网信通亿力科技有限责任公司 | 一种基于Apriori算法建立配电负荷线损关联分析模型的方法 |
Non-Patent Citations (2)
Title |
---|
Software defect prediction based on correlation weighted class association rule mining;Yuanxun Shao 等;《Knowledge-Based Systems》;20200323;第196卷;第1-25页 * |
基于数据挖掘的零件加工质量规则获取与质量预测研究;李先飞;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20201215(第12期);第C029-55页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113420375A (zh) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101093559B (zh) | 一种基于知识发现的专家系统构造方法 | |
CN110458336B (zh) | 一种基于深度学习的网约车供需预测方法 | |
CN108417033A (zh) | 基于多维因素的高速路交通事故分析预测方法 | |
CN113688558B (zh) | 一种基于大数据库样本的汽车行驶工况构建方法及系统 | |
CN108170769A (zh) | 一种基于决策树算法的装配制造质量数据处理方法 | |
Dorfeshan et al. | A new enhanced ARAS method for critical path selection of engineering projects with interval type-2 fuzzy sets | |
WO2021128523A1 (zh) | 一种基于科技大数据的技术成熟度判断方法和系统 | |
CN116739376A (zh) | 一种基于数据挖掘的公路路面预防性养护决策方法 | |
CN117453764A (zh) | 一种数据挖掘分析方法 | |
CN113420375B (zh) | 基于Apriori建立工艺-质量-不平衡量关联关系模型的方法 | |
CN113761032A (zh) | 基于可拓关联规则挖掘的航空发动机故障诊断方法及系统 | |
CN113420506A (zh) | 掘进速度的预测模型建立方法、预测方法及装置 | |
Dongnan et al. | Parallel design of apriori algorithm based on the method of “determine infrequent items & remove infrequent itemsets” | |
Wei et al. | Manufacturing data-driven process adaptive design method | |
CN112580951A (zh) | 基于乘客出行的城市地面公交运行监测关键指标筛选方法 | |
CN114819417B (zh) | 基于费用间相关性的航空发动机大修费用预测方法及系统 | |
CN110990907A (zh) | 基于特征-资源知识的船用柴油机关重件可制造性三级优化方法 | |
Hassan et al. | Sampling technique selection framework for knowledge discovery | |
CN115409541A (zh) | 基于数据血缘的卷烟品牌数据处理方法 | |
CN112306730B (zh) | 基于历史项目伪标签生成的缺陷报告严重程度预测方法 | |
Ghosh | Statistical Databases for Automated Manufacturing | |
CN114880588B (zh) | 基于知识图谱的新闻热度预测方法 | |
Luo et al. | An interpretable prediction model for pavement performance prediction based on XGBoost and SHAP | |
CN114943060B (zh) | 基于深度学习与插值回归的页岩气总有机碳预测方法 | |
CN112836926B (zh) | 基于电力大数据的企业经营状况评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |