## Description

Apriori中最重要的两个指标为规则

$\mathrm{support}\left(X⇒Y\right)=\mathrm{support}\left(X∪Y=\right)=|\left\{T:X∪Y⊆T,T∈D\right\}|/|D|.$

$\mathrm{confidence}\left(X⇒Y\right)=\mathrm{support}\left(X∪Y\right)/\mathrm{support}\left(X\right)=|\left\{T:X∪Y⊆T,T∈D\right\}|/|\left\{T:X⊆T,T∈D\right\}|$

1、Ai∩Aj=φ，i≠j,i,j=1,2,…,n
$2,\underset{i=1}{\overset{n}{∪}}{A}_{i}=\mathrm{Ω}$

$\mathrm{Confidence}\left(\mathrm{AB}⇒G\right)=P\left(G/\mathrm{AB}\right)=\frac{\mathrm{Support}\left(\mathrm{ABG}\right)}{\mathrm{Support}\left(\mathrm{AB}\right)}$

①求频繁1-项集L1

②求候选k-项集Ck(k≥2)：

●若li,lj的第(k-1)项分别为同一监测点的不同属性值时，则l1∪l2=φ，即两项集不能连接；
●若li,lj的第(k-1)项的监测点不同时，则两项集进行连接，为l1∪l2
③求频繁k-项集Lk

④若频繁k-项集Lk不为空，则转至②，否则结束；
⑤计算各个潜在故障类型的发生概率值；

1、本发明将历史数据按照典型故障类型进行分组分别挖掘，可以产生每个典型故障类型的最大频繁项集，减少漏报，提高了故障预警的准确性；
2、本发明仅挖掘带有故障信息的规则，避免了经典Apriori带来的无效规则，减少了故障预警的误报率；
3、本发明约束了同一监测点的不同区域值必须且只能出现一次，且链接的条件是后项相同且前项监测点不冲突的（k-1）项集，因此使得链接次数大大减少，显著降低了计算复杂度。

●从历史数据库中获取温度、压力、震动、转速等项的数据，清洗去除异常数据；为了防止具有较大值的属性相对于较小值的属性权重过大，将数据进行归一化处理；再将上述归一化处理的数据按比例缩放，使其落在[0，1]上；
●由于所需数据表为布尔形式，而监控数据是连续变化的实数，因此将上一步得到的连续性历史数据进行离散化，得到各类数据所属聚类范围的概化结果，从而得到概化后的设备监控数据集。具体如表1所示，数据集A包括液压设备4个监测指标A、B、C、D，和潜在故障类型值R；其中A表示监测点1的温度值，B表示监测点2的温度值，C表示监测点1的振动值，D表示监测点2的振动值，R表示潜在故障类型值。监测点A由专家和工程师确定阈值，分为A1、A2两个区域，A点监测数据必定且仅能属于A1或A2区域之一；

 事务数（TID） 状态组 事务数（TID） 状态组 1 A1 B1 C1 D2 R1 5 A2 B1 C2 D2 R3 2 A1 B2 C2 D3 R2 6 A1 B1 C1 D3 R3 3 A2 B1 C1 D1 R3 7 A2 B2 C2 D3 R1 4 A1 B1 C2 D3 R1 8 A2 B2 C2 D2 R3

（1）化简数据集，构造初始数据库；

 事务数(TID) 状态组 事务数(TID) 状态组 1 A1 B1 C1 D2 R1 5 A1 B1 C1 D3 R3 2 A2 B1 C1 D1 R3 6 A2 B2 C2 D3 R1 3 A1 B1 C2 D3 R1 7 A2 B2 C2 D2 R3 4 A2 B1 C2 D2 R3
（2）扫描初始数据库，对样本按照故障类型R1、R3分组，构造分组数据库D1D3，如表4、5所示；

 事务数（TID） 状态组 事务数（TID） 状态组 1 A1 B1 C1 D2 3 A2 B2 C2 D3 2 A1 B1 C2 D3

 事务数（TID） 状态组 事务数（TID） 状态组 1 A2 B1 C1 D1 3 A2 B2 C2 D3 2 A2 B1 C2 D2 4 A2 B2 C2 D2

${A}_{2}{C}_{2}{D}_{2}⇒{R}_{3};$

$P\left({R}_{1}/{A}_{1}{B}_{1}\right)=\mathrm{Confidence}\left({A}_{1}{B}_{1}⇒{R}_{1}\right)=\frac{\mathrm{Support}\left({A}_{1}{B}_{1}{R}_{1}\right)}{\mathrm{Support}\left({A}_{1}{B}_{1}\right)}=\frac{2}{3}=66.6%$

$P\left({R}_{1}/{C}_{2}{D}_{3}\right)=\mathrm{Confidence}\left({C}_{2}{D}_{3}⇒{R}_{1}\right)=\frac{\mathrm{Support}\left({C}_{2}{D}_{3}{R}_{1}\right)}{\mathrm{Support}\left({C}_{2}{D}_{3}\right)}=\frac{2}{3}=66%$

$P\left({R}_{3}/{A}_{2}{C}_{2}{D}_{2}\right)=\mathrm{Confidence}\left({A}_{2}{C}_{2}{D}_{2}⇒{R}_{3}\right)=\frac{\mathrm{Support}\left({A}_{2}{C}_{2}{D}_{2}{R}_{3}\right)}{\mathrm{Support}\left({A}_{2}{C}_{2}{D}_{2}\right)}=\frac{2}{2}=100%$

1、故障挖掘库D包含300条故障信息，共含有19个故障类型；
2、测试库S1含有150条监控数据，其中包含正常运行数据120条和故障数据30条；
3、测试库S2含有300条监控数据，其中包含正常运行数据220条和故障数据80条；
4、测试库S3含有500条监控数据，其中包含正常运行数据350条和故障数据150条；

 记录条目数 故障类型 产生规则数
 Apriori FFPMM 300 19 20 17

## Claims (3)

1.一种基于故障频繁模式的液压设备故障预警方法，其特征在于：它包括如下步骤：

2.根据权利要求1所述的一种基于故障频繁模式的液压设备故障预警方法，其特征在于：步骤二中所述的建立故障频繁模式挖掘模型包括如下步骤：

3.根据权利要求2所述的一种基于故障频繁模式的液压设备故障预警方法，其特征在于：所述的在分组数据库Di中进行关联规则的挖掘，其具体步骤如下：
①求频繁1-项集L1

②求候选k-项集Ck(k≥2)：

●若li,lj的第(k-1)项分别为同一监测点的不同属性值时，则l1∪l2=φ，即两项集不能连接；
●若li,lj的第(k-1)项的监测点不同时，则两项集进行连接，为l1∪l2
③求频繁k-项集Lk

④若频繁k-项集Lk不为空，则转至②，否则结束；
⑤计算各个潜在故障类型的发生概率值。
