CN113946621A - 一种基于关联规则的制丝车间数据波动关系的挖掘方法 - Google Patents
一种基于关联规则的制丝车间数据波动关系的挖掘方法 Download PDFInfo
- Publication number
- CN113946621A CN113946621A CN202111286338.4A CN202111286338A CN113946621A CN 113946621 A CN113946621 A CN 113946621A CN 202111286338 A CN202111286338 A CN 202111286338A CN 113946621 A CN113946621 A CN 113946621A
- Authority
- CN
- China
- Prior art keywords
- fluctuation
- parameter
- data
- positive
- negative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000005065 mining Methods 0.000 title claims abstract description 31
- 238000004364 calculation method Methods 0.000 claims description 12
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 10
- 238000004519 manufacturing process Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 5
- 238000007418 data mining Methods 0.000 abstract description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 238000007781 pre-processing Methods 0.000 abstract 1
- 238000002156 mixing Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Manufacturing & Machinery (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于关联规则的制丝车间数据波动关系的挖掘方法,属于数据挖掘领域。针对制丝工艺参数间波动关系难以描述的问题,本发明借助关联规则充分挖掘不同变量间的波动关系。依托数据离散化设计面向制丝数据关联规则挖掘的数据预处理方法,将制丝数据转换成蕴含原始数据信息的波动数据;进一步利用关联规则原理来设计待挖掘数据的波动规则公式。本发明充分挖掘了不同工艺参数间的波动规则,提高了规则的可解释性和关联结果的准确性,可以准确判断制丝车间各工艺参数之间是否存在波动关系,有利于制丝车间工艺参数的统计与管理,便于制丝产品质量出现问题时可通过调节工艺参数来优化工艺过程。
Description
技术领域
本发明涉及一种基于关联规则的制丝车间数据波动关系的挖掘方法,属于数据挖掘领域。
背景技术
随着云计算、大数据、物联网、人工智能等信息技术的快速发展和传统产业数字化的转型,我们进入了数据爆炸式增长即大数据的时代。对于制丝数据类似的时序数据挖掘是当今时代的研究热点。但传统方法在时序数据方面挖掘数据要素间的波动关系上略显不足,不能准确判断制丝车间各工艺参数之间是否存在波动关系,而在工业大数据中要素间的变动关系是其中数据挖掘的重要环节。
发明内容
本申请的目的是提供一种基于关联规则的制丝车间数据波动关系的挖掘方法,针对现有技术中制丝车间中各工艺参数间波动关系难以准确直观的描述问题,通过利用关联规则来充分挖掘制丝车间中工艺参数的波动规则,并且所挖掘的规则可解释性强,有效解决了现有方法满足不了制丝车间时序数据关联挖掘分析需求的问题。
本申请实现上述目的的技术方案主要是提供一种基于关联规则的制丝车间数据波动关系的挖掘方法,包括以下步骤:
步骤(1):根据需要确定波动关系的工艺参数,获取相应的制丝数据,根据各个工艺参数数据的最大波动来进行离散化处理得到待挖掘数据;
步骤(2):根据待挖掘数据间的波动情况,将工艺参数间的波动细分成四种类型:正向低波动幅度-正负向高波动幅度;正向高波动幅度-正负向强烈波动幅度;负向低波动幅度-正负向高波动幅度;负向高波动幅度-正负向强烈波动幅度;
步骤(3):设计基于制丝数据和数据波动类型的支持度计算公式,确定工艺参数中的频繁项集;
步骤(4):设计基于制丝数据和数据波动类型的置信度计算公式;
步骤(5):根据支持度及置信度的公式计算出的结果和设定的最小支持度阈值和最小置信度阈值,判断所述工艺参数间是否存在波动关系。
具体地,步骤(1)中进行离散化处理的具体步骤包括:
步骤(1.1):遍历获取到的每一个制丝数据所有时刻的数值与其前一时刻数值的差值,以差值中绝对值最大值作为基准划分成若干等份;
步骤(1.2):按照各差值的绝对值在各等份区间的划分重新进行赋值,在同一个区间内的数据值相同,具体为:将各等份区间依次顺序的赋予数值,第一个区间内的所有值都为1,第二个区间内的所有值都为2,以此类推;
步骤(1.3):若制丝数据某一时刻的数值相对于前一个时刻增加,则在重新赋值的数据前添加“+”;若相对于前一时刻减小,则在重新赋值的数据前添加“-”;对制丝数据某一时刻的数值大小相对于前一时刻相同,则全部重新赋值为“0”。
具体地,步骤(2)的具体步骤为:
分析两个参数之间波动关系,只有在某一时刻其中一个参数发生变化同时引发另一个参数发生有效变化的波动关系才能作为关联规则中的波动关系规则;
参数A和参数B的划分区间都为α时,在β时刻参数A的数值为X,参数B的数值为Y:
具体地,步骤(3)中设计的的工艺参数间支持度计算公式如下:
S(A,B)=s(AB)+s(BA)
其中:
S(A,B)表示制丝车间参数A和参数B的总支持度,s(AB)表示挖掘二阶频繁项集将参数A与对应的某一时刻中的数据进行频繁项挖掘,分别得出以参数A为波动基准,参数A和参数B的支持度,同理,s(BA)则表示挖掘二阶频繁项集将参数B与对应的某一时刻中的数据进行频繁项挖掘,分别得出以参数B为波动基准时,参数A与参数B的支持度。表示参数A的正波动幅度较小时引发参数B的正负波动幅度较大时的支持度,其他依次类推。
具体地,步骤(4)中设计的工艺参数间置信度计算公式如下:
具体地,步骤(5)中所得到的参数间波动结果如下:
步骤(5.1)对步骤(1)中需要确定波动关系的每一个工艺参数设定支持度最小阈值和置信度的最小阈值,对于每一个工艺参数,当由支持度公式计算出的数值高于设定的支持度最小阈值时,则这一工艺参数为频繁项;
步骤(5.2)所有得到的频繁项构成频繁项集;
步骤(5.3)从频繁项集中提取两两频繁项利用置信度公式计算置信度,当计算出的结果高于设定的最小置信度阈值时,则该两两工艺参数间具有高置信度波动规则。
本发明的有益效果是:
1、通过数据离散化处理后利用关联规则和不同波动类型挖掘出制丝数据间的波动关联规则。
2、基于制丝车间数据设计支持度和置信度公式,排除了要素间无关联规则和波动强度低的规则同时提高了规则的可解释行以及关联结果的准确性。
3、制丝产品质量出现问题时可通过调节工艺参数来优化工艺过程。
附图说明
图1是本发明所述的一种基于关联规则的制丝车间数据波动关系的挖掘方法的流程图。
图2是本发明所述的制丝部分数据展示;
图3是本发明所述的经离散化后的制丝部分数据展示;
图4是本发明所述的一种基于关联规则的制丝车间数据波动关系的挖掘方法与其他方法的对比测试结果图。
具体实施方式
下面将结合附图和实施例对本发明进一步说明,但本发明的内容并不限于所属范围。
实施例1:如图1-4所示,一种基于关联规则的制丝车间数据波动关系的挖掘方法,主要包括以下步骤:
步骤(1):根据需要确定波动关系的工艺参数,获取相应的制丝数据,根据各个工艺参数数据的最大波动来进行离散化处理得到待挖掘数据;
步骤(2):根据待挖掘数据间的波动情况,将工艺参数间的波动细分成四种类型:正向低波动幅度-正负向高波动幅度;正向高波动幅度-正负向强烈波动幅度;负向低波动幅度-正负向高波动幅度;负向高波动幅度-正负向强烈波动幅度;
步骤(3):设计基于制丝数据和数据波动类型的支持度计算公式,由于工艺参数间的波动是相对的,即参数A对参数B和参数B对参数A的波动情况不同,设计支持度公式来确定工艺参数中的频繁项集;
步骤(4):设计基于制丝数据和数据波动类型的置信度计算公式;
步骤(5):根据支持度及置信度的公式计算出的结果和设定的最小支持度阈值和最小置信度阈值,判断所述工艺参数间是否存在波动关系。
进一步地,步骤(1)中进行离散化处理的具体步骤包括:
步骤(1.1):制丝数据属于时序数据,制造生产中涉及工艺众多,在本申请中以比例掺配和加香工艺为例举对象,如图2所示,其中涉及11道加工参数和1道质量指标。加工参数比例掺配中的梗丝瞬时掺配比例、梗丝瞬时配比精度、气流丝瞬时掺配比例、气流丝瞬时配比精度、薄板丝累计量、梗丝累计量及气流丝累计量和加香中的加香累计量、物料累计量、瞬时加香比例及瞬时加香精度;质量指标为加香中的出料含水率。以梗丝瞬时掺配比例为例,遍历每一个制丝数据所有时刻的数值与其前一时刻数值的差值,以差值中绝对值最大值为基准划分成若干等份,即根据具体分析的问题进行等份分组,在实施案例中以差值中绝对值最大值为基准划分成10个等份。
步骤(1.2):按照各差值的绝对值在各等份区间的划分重新进行赋值,在同一个区间内的数据值相同,具体为:将各等份区间依次顺序的赋予数值,即第一个区间内的所有值都为1,第二个区间内的所有值都为2,以此类推。
步骤(1.3):若所述制丝数据某一时刻的数值相对于前一个时刻增加,则在重新赋值的数据前添加“+”;若相对于前一时刻减小,则在重新赋值的数据前添加“-”;对所述制丝数据某一时刻的数值大小相对于前一时刻相同,则全部重新赋值为“0”,最后离散化结果如图3所示。
进一步地,步骤(2)的具体步骤为:
分析两个参数之间波动关系,只有在某一时刻其中一个参数发生变化同时引发另一个参数发生有效变化的波动关系才能作为关联规则中的波动关系规则;
参数A和参数B的划分区间都为α时,在β时刻参数A的数值为X,参数B的数值为Y:
进一步地,步骤(3)中设计的的工艺参数间支持度计算公式如下:
S(A,B)=s(AB)+s(BA)
其中:
S(A,B)表示制丝车间参数A和参数B的总支持度,s(AB)表示挖掘二阶频繁项集将参数A与对应的某一时刻中的数据进行频繁项挖掘,分别得出以参数A为波动基准,参数A和参数B的支持度,同理,s(BA)则表示挖掘二阶频繁项集将参数B与对应的某一时刻中的数据进行频繁项挖掘,分别得出以参数B为波动基准时,参数A与参数B的支持度。表示参数A的正波动幅度较小时引发参数B的正负波动幅度较大时的支持度度,其他依次类推。具体而言,所述挖掘方法限制最大频繁项阶数为2阶,即限制参数网络挖掘阶数为2,即计算每两个参数之间的支持度与置信度。
进一步地,步骤(4)中设计的工艺参数间置信度计算公式如下:
进一步地,步骤(5)中所得到的参数间波动结果如下:
步骤(5.1)对步骤(1)中需要确定波动关系的每一个工艺参数设定支持度最小阈值和置信度的最小阈值,对于每一个工艺参数,当由支持度公式计算出的数值高于设定的支持度最小阈值时,则这一工艺参数为频繁项;
步骤(5.2)所有得到的频繁项构成频繁项集;
步骤(5.3)从频繁项集中提取两两频繁项利用置信度公式计算置信度,当计算出的结果高于设定的最小置信度阈值时,则该两两工艺参数间具有高置信度波动规则。
参见图4,为本发明所述的一种制丝数据的关联规则挖掘方法的对比测试结果图。将本申请提供的关联规则挖掘方法与传统关联规则算法FP-growth算法及Apriori算法进行对比,将本申请的挖掘方法命名为UNDULA算法,各算法的参数设置如下:
(1)UNDULA:Smin=5%(其中S(AB)min=2.5%,S(BA)min=2.5%),Cmin=75%;
(2)Apriori:Smin=5%,Cmin=75%;
(3)FP-growth:Smin=5%,Cmin=75%;
其中,Smin表示最小支持度阈值,Cmin表示最小置信度阈值,S(AB)min表示以参数A为数据间的波动基准,参数A和参数B的最小支持度阈值,S(BA)min表示以参数A为数据间的波动基准,参数A和参数B的最小支持度阈值。
在相同条件下,采用包含10000条数据的数据库,取Smin=5%,Cmin=75%对计算出的关联规则进行过滤,由图4可知,在较小规模数据下集中算法挖掘结果三种算法挖掘出的规则数量大致相同,但随着数据规模的增加,UNDULA算法与其余两种算法相比,在相同参数,能够得到较多可解释的关联规则。
本发明充分挖掘了不同工艺参数间的波动规则,提高了规则的可解释性和关联结果的准确性,可以准确判断制丝车间各工艺参数之间是否存在波动关系,有利于制丝车间工艺参数的统计与管理,便于制丝产品质量出现问题时可通过调节工艺参数来优化工艺过程。
上面结合附图对本发明的具体实施方式作了详细说明,上述实施例只是本发明的一个实例,并不是用来限制本发明的实施与权利范围,凡与本发明权利要求所述内容相同或等同的技术方案,均应包括在本发明保护范围内。
Claims (6)
1.一种基于关联规则的制丝车间数据波动关系的挖掘方法,其特征在于:包括以下步骤:
步骤(1):根据需要确定波动关系的工艺参数,获取相应的制丝数据,根据各个工艺参数数据的最大波动来进行离散化处理得到待挖掘数据;
步骤(2):根据待挖掘数据间的波动情况,将工艺参数间的波动细分成四种类型:正向低波动幅度-正负向高波动幅度;正向高波动幅度-正负向强烈波动幅度;负向低波动幅度-正负向高波动幅度;负向高波动幅度-正负向强烈波动幅度;
步骤(3):设计基于制丝数据和数据波动类型的支持度计算公式,确定工艺参数中的频繁项集;
步骤(4):设计基于制丝数据和数据波动类型的置信度计算公式;
步骤(5):根据支持度及置信度的公式计算出的结果和设定的最小支持度阈值和最小置信度阈值,判断所述工艺参数间是否存在波动关系。
2.根据权利要求1所述的基于关联规则的制丝车间数据波动关系的挖掘方法,其特征在于:步骤(1)中进行离散化处理的具体步骤包括:
步骤(1.1):遍历获取到的每一个制丝数据所有时刻的数值与其前一时刻数值的差值,以差值中绝对值最大值作为基准划分成若干等份;
步骤(1.2):按照各差值的绝对值在各等份区间的划分重新进行赋值,在同一个区间内的数据值相同,具体为:将各等份区间依次顺序的赋予数值,第一个区间内的所有值都为1,第二个区间内的所有值都为2,以此类推;
步骤(1.3):若制丝数据某一时刻的数值相对于前一个时刻增加,则在重新赋值的数据前添加“+”;若相对于前一时刻减小,则在重新赋值的数据前添加“-”;对制丝数据某一时刻的数值大小相对于前一时刻相同,则全部重新赋值为“0”。
3.根据权利要求1所述的基于关联规则的制丝车间数据波动关系的挖掘方法,其特征在于:步骤(2)的具体步骤为:
分析两个参数之间波动关系,只有在某一时刻其中一个参数发生变化同时引发另一个参数发生有效变化的波动关系才能作为关联规则中的波动关系规则;
参数A和参数B的划分区间都为α时,在β时刻参数A的数值为X,参数B的数值为Y:
6.根据权利要求1所述的基于关联规则的制丝车间数据波动关系的挖掘方法,其特征在于,步骤(5)中所得到的参数间波动结果如下:
步骤(5.1)对步骤(1)中需要确定波动关系的每一个工艺参数设定支持度最小阈值和置信度的最小阈值,对于每一个工艺参数,当由支持度公式计算出的数值高于设定的支持度最小阈值时,则这一工艺参数为频繁项;
步骤(5.2)所有得到的频繁项构成频繁项集;
步骤(5.3)从频繁项集中提取两两频繁项利用置信度公式计算置信度,当计算出的结果高于设定的最小置信度阈值时,则该两两工艺参数间具有高置信度波动规则。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111286338.4A CN113946621A (zh) | 2021-11-02 | 2021-11-02 | 一种基于关联规则的制丝车间数据波动关系的挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111286338.4A CN113946621A (zh) | 2021-11-02 | 2021-11-02 | 一种基于关联规则的制丝车间数据波动关系的挖掘方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113946621A true CN113946621A (zh) | 2022-01-18 |
Family
ID=79337286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111286338.4A Pending CN113946621A (zh) | 2021-11-02 | 2021-11-02 | 一种基于关联规则的制丝车间数据波动关系的挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113946621A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116664172A (zh) * | 2023-08-02 | 2023-08-29 | 果子(青岛)数字技术有限公司 | 基于大数据的食品销售数据挖掘分析方法 |
-
2021
- 2021-11-02 CN CN202111286338.4A patent/CN113946621A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116664172A (zh) * | 2023-08-02 | 2023-08-29 | 果子(青岛)数字技术有限公司 | 基于大数据的食品销售数据挖掘分析方法 |
CN116664172B (zh) * | 2023-08-02 | 2023-11-21 | 同心县启胜新能源科技有限公司 | 基于大数据的食品销售数据挖掘分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107169628B (zh) | 一种基于大数据互信息属性约简的配电网可靠性评估方法 | |
CN112987666B (zh) | 电厂机组运行优化调控方法及系统 | |
CN112801388B (zh) | 一种基于非线性时间序列算法的电力负荷预测方法及系统 | |
CN107146035B (zh) | 针织服装大货生产中批量系数的计算方法 | |
CN115063056B (zh) | 基于图拓扑分析改进的建造行为安全风险动态分析方法 | |
CN114169434A (zh) | 一种负荷预测方法 | |
CN113946621A (zh) | 一种基于关联规则的制丝车间数据波动关系的挖掘方法 | |
CN115795380A (zh) | 一种基于孤立森林和加权随机森林的烟气制酸数据清洗及优化方法 | |
CN109670695B (zh) | 基于离群数据挖掘的机械产品加工工序异常并行检测方法 | |
CN117314202B (zh) | 一种基于工业互联网的产品碳效监测及优化方法及系统 | |
CN117313017B (zh) | 一种彩叶研发数据处理方法及系统 | |
CN110705099A (zh) | 一种检定风电场出力相关性的方法 | |
CN112559591B (zh) | 一种用于冷轧辊制造过程的离群检测系统及其检测方法 | |
CN112783948A (zh) | 区域经济运行数据分析方法、设备及存储介质 | |
CN112765746A (zh) | 基于多项式混沌的涡轮叶顶气热性能不确定性量化系统 | |
CN109034486B (zh) | 一种基于大数据分层聚类的棉花生产工艺优化方法 | |
CN112151185A (zh) | 一种儿童呼吸疾病与环境数据关联分析方法及系统 | |
CN111125082B (zh) | 基于关联规则挖掘的水泥工艺参数数据分析方法 | |
CN115374570A (zh) | 一种用于穿越工程隧道变形预测的多源加权训练集构建方法 | |
Li et al. | Control chart pattern recognition under small shifts based on multi-scale weighted ordinal pattern and ensemble classifier | |
CN116383645A (zh) | 一种基于异常检测的系统健康度智能监测评估方法 | |
Zhou et al. | Study on Optimization of Data-Driven Anomaly Detection | |
CN115619280A (zh) | 一种基于工艺标准图谱与cnn-gru网络模型的工艺质量预测方法 | |
Ompusunggu et al. | Implementation of Data Mining To Predict the Value of Indonesian Oil and Non-Oil and Gas Import Exports Using the Linear Regression Method | |
CN112767026A (zh) | 一种基于arm-mlr的农产品价格预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |