CN102915447B

CN102915447B - 一种基于二叉树支持向量机的分类方法

Info

Publication number: CN102915447B
Application number: CN201210352700.8A
Authority: CN
Inventors: 毛清华; 马宏伟; 张旭辉; 陈海瑜; 张大伟; 姜俊英
Original assignee: Xian University of Science and Technology
Current assignee: Xian University of Science and Technology
Priority date: 2012-09-20
Filing date: 2012-09-20
Publication date: 2015-07-08
Anticipated expiration: 2032-09-20
Also published as: CN102915447A

Abstract

本发明公开了一种基于二叉树支持向量机的分类方法，包括步骤：一、信号采集：采用状态信息检测单元对被检测对象在N种不同工作状态时的工作状态信息分别进行检测，并将所检测信号同步传送至数据处理器，相应获得与N种不同工作状态相对应的N组工作状态检测信息；二、特征提取；三、训练样本获取：分别在经特征提取后的N组工作状态检测信息中，随机抽取m个检测信号组成训练样本集；四、分类优先级别确定；五、多分类模型建立；六、多分类模型训练；七、信号实时采集及同步分类。本发明设计合理、操作简便、实现方便且使用效果好、实用价值高，不仅可以选出SVM分类器的最优参数，且能减少噪声和孤立点对分类的影响，提高了分类速度和精度。

Description

一种基于二叉树支持向量机的分类方法

技术领域

本发明属于缺陷识别技术领域，尤其是涉及一种基于二叉树支持向量机的分类方法。

背景技术

缺陷的智能识别是在缺陷特征提取的基础上，确定识别算法，设计出相应的分类器，并用样本集合进行训练，最后完成对缺陷的自动分类。目前主要有统计分类方法、基于规则的分类方法和基于学习的分类方法。常见的分类器有决策树分类、贝叶斯分类、模糊分类法、人工神经网络分类法和支持向量机分类法等，在数据信号处理方面应用较多的是后两种。其中，人工神经网络分类法由于人工神经网络没有专门的训练和学习函数来确定网络结构，且需要大量训练样本，因而实际应用中条件往往难以满足。

支持向量机(Support Vector Machine，SVM)是上世纪九十年代一种新的模式识别方法，其通过非线性变换将输入空间映射到高维空间，在新空间中求得最优分类超平面。由于实际样本中，可能存在孤立点或者噪声，它对常用的C-SVM或者v-SVM的最优分类超平面影响较大。针对该问题，有些学者提出了模糊支持向量机FSVM(Fuzzy Support Vector MachineFSVM)。孙波等人提出一种计算样本隶属度的新方法，降低噪声点的隶属度，提高了支持向量对最优分类面的贡献。陈小娟等人针对分类问题的支持向量机方法中存在对噪声和野值敏感的问题，提出了一种新的隶属度函数确定方法。徐鲁强等人提出了一种符合高斯形式的构建模糊隶属度函数方法，减弱了野点样本对分类的影响，提高了情感状态识别效果。Qi Xu等人应用模糊支持向量机对带有噪声和孤立点的脑电图信号进行分类，结果表明FSVM分类性能减少了噪声和孤立点对分类的影响。

SVM本身是一个两分类方法，如何将其推广到多分类，以适应实际中缺陷或故障快速、准确识别，是一个迫切需要解决的问题。目前，多类SVM成为多类模式识别研究与应用的热点。现在已有的多类SVM分类方法大致可分为两种：直接求解算法和分解重构算法。直接求解法是在所有训练样本上求解一个大型二次规划问题，同时将所有类别分开。该方法变量个数多，计算复杂度很高，尤其当类别数目较多时，它的训练速度很低，分类精度也不高；分解重构法是一种将多类分类问题转化为多个两类分类问题，并采用某种策略将多个两类分类器组合起来实现多类分类的方法。分解重构法比直接求解法更适合于实际应用，用它实现多类分类需要解决两个关键问题：模糊类的生成和多个两类分类器的组合策略。当前应用较广泛的SVM分解重构算法有1-a-r(one-against-rest)方法，1-a-1(one-against-one)方法、DAGSVM(Directed Acyclic Graph SupportVector Machines)方法，DTSVM(Decision Tree Support Vector Machines)方法以及HSVM方法(Hierarchical Support Vector Machines)等。这些方法在多分类中各有优缺点，研究表明：1-a-r分类方法简单、有效，可用于大规模数据，但当工作集过大时，训练速度将会很慢；同时它存在误分、拒分区域，泛化能力较差。1-a-1分类速度，比传统的1-a-r方法快，而且其分类精度也较1-a-r高；但其缺点是：如果单个两类分类器不规范，则整个分类器将趋向于过学习，分类器的数目随类数急剧增加，导致在决策时速度很慢，存在推广误差无界及误分、拒分区域。DAGSVM方法较1-a-1方法提高了测试速度，而且不存在拒分区域；另外，由于其特殊的结构，故有一定的容错性，分类精度较一般的二叉树方法高，但该方法的泛化能力与各子分类器在有向无环图中的位置有关。DTSVM和HSVM采用树结构的组合策略，具有较高的训练和分类速度，但分类树存在错分积累，如果选择合理的树结构可以获得较高的分类速度和精度。通过以上多分类方法特点比较，二叉树SVM综合性能较好，关键是要选择合理的二叉树结构。

综合分析神经网络和支持向量机在缺陷多分类方面的优缺点，为了有效提高缺陷或故障分类的可靠性、实时性，必须对现有的分类方法进行改进。

发明内容

本发明所要解决的技术问题在于针对上述现有技术中的不足，提供一种基于二叉树支持向量机的分类方法，其设计合理、操作简便、实现方便且使用效果好、实用价值高，不仅可以选出SVM分类器的最优参数，且能减少噪声和孤立点对分类的影响，提高了分类速度和精度。

为解决上述技术问题，本发明采用的技术方案是：一种基于二叉树支持向量机的分类方法，其特征在于该方法包括以下步骤：

步骤一、信号采集：采用状态信息检测单元对被检测对象在N种不同工作状态时的工作状态信息分别进行实时检测，并将所检测信号同步传送至数据处理器，相应获得与N种不同工作状态相对应的N组工作状态检测信息，N组所述工作状态检测信息中均包括所述状态信息检测单元在不同采样时刻检测到的多个检测信号，其中N为正整数且N≥3；

步骤二、特征提取：待数据处理器接收到所述状态信息检测单元所传送的检测信号时，自各检测信号中分别提取出能代表并区别该检测信号的一组特征参数，且该组特征参数包括W个特征量，并对W个所述特征量进行编号，W个所述特征量组成一个特征向量，其中W≥2；

步骤三、训练样本获取：分别在经特征提取后的N组所述工作状态检测信息中，随机抽取m个检测信号组成训练样本集；

所述训练样本集中相应包括l个训练样本，其中m≥2，l=m×N；l个所述训练样本分属于N种样本类，每一个样本类中均包括被检测对象工作于同一个工作状态时的m个训练样本，N种样本类分别与被检测对象的N种不同工作状态相对应的样本类1、样本类2…样本类N；N种样本类中的每一个训练样本均记作X_ks，其中k为样本类的类别标号且k=1、2…N，s为各样本类中所包括m个训练样本的样本序号且s=1、2…m；X_ks为样本类k中第s个训练样本的特征向量，X_ks∈R^d，其中d为X_ks的向量维数且d=W；

步骤四、分类优先级别确定，其确定过程如下：

步骤401、样本类的类中心计算：采用数据处理器对N种所述样本类中任一个样本类k的类中心进行计算；

且对样本类k的类中心进行计算时，根据公式计算得出样本类k中所有训练样本的各特征量均值；式中k=1、2…N，p=1、2…d，X_ks(p)为样本类k中第s个训练样本的第p个特征量，为样本类k中所有训练样本的第p个特征量均值；

步骤402、类间距离计算：采用数据处理器且根据公式对步骤201中所述任一个样本类k与N种所述样本类中任一个样本类h之间的间距分别进行计算，其中为样本类k中所有训练样本的第p个特征量均值，为样本类h中所有训练样本的第p个特征量均值，且h=1、2…N；

步骤403、类间距之和计算：采用数据处理器且根据公式对步骤401中所述任一个样本类k的类间距之和；

步骤404、多次重复步骤401至步骤403，直至计算得出N种所述样本类中所有样本类的类间距之和；

步骤405、按照步骤404中计算得出的所有样本类的类间距之和由大到小的顺序，采用数据处理器确定出N种所述样本类的分类优先级别Y，其中Y=1、2…N；其中，类间距之和最大的样本类的分类优先级别最高且其分类级别为1，类间距之和最大的样本类的分类优先级别最低且其分类级别为N；

步骤五、多分类模型建立：所建立的多分类模型包括N-1个二分类模型，且N-1个所述二分类模型均为支持向量机模型；N-1个所述二分类模型按照步骤405中所确定的分类优先级别，将N种所述样本类自所述训练样本集中由先至后逐类分出来，N-1个所述二分类模型的建立方法均相同且均采用数据处理器进行建立；

对于N-1个所述二分类模型中的任一个二分类模型z来说，其建立过程如下：

步骤501、核函数选取：选用径向基函数作为二分类模型z的核函数；

步骤502、分类函数确定：待惩罚参数C与步骤501中所选用径向基函数的核参数γ确定后，获得二分类模型z的分类函数，完成二分类模型z的建立过程；其中，0＜C≤1000，0＜γ≤1000；

所建立的二分类模型z为待分类优先级别高于z的所有样本类自所述训练样本集中分出来后，将分类优先级别为z的样本类自所述训练样本集中剩余的N-z+1个样本类中分出来的二分类模型，其中z=1、2…N-1；

步骤503、二分类模型分类优先级别设定：根据步骤502中所述二分类模型z自所述训练样本集中剩余的N-z+1个样本类中分出来的样本类的分类优先级别z，对二分类模型z的分类优先级别R进行设定，且R=z；

步骤504、多次重复步骤501至步骤503，直至获得N-1个所述二分类模型的分类函数，便完成N-1个所述二分类模型的建立过程，获得建立完成的多分类模型；

步骤六、多分类模型训练：将步骤三中所述训练样本集中的l个训练样本输入到步骤五中所建立的多分类模型进行训练；

步骤七、信号实时采集及同步分类：采用所述状态信息检测单元对被检测对象的当前工作状态进行实时检测，且将所检测信号同步输入至步骤五中所建立的多分类模型中，并自动输出被检测对象当前工作状态的类别。

上述一种基于二叉树支持向量机的分类方法，其特征是：步骤三中获取训练样本的同时，还需分别在N组所述工作状态检测信息中随机抽取b个检测信号组成测试样本集；所述测试样本集中相应包括Q个测试样本，其中b≥2，Q=b×N；Q个所述测试样本分属于N种所述样本类；步骤六中对所建立的多分类模型进行训练后，还需输入Q个所述测试样本，对所建立多分类模型的分类正确率进行测试。

上述一种基于二叉树支持向量机的分类方法，其特征是：步骤一中N种所述不同工作状态为被检测对象发生故障时的多种不同故障状态或出现缺陷时的多种不同缺陷状态，且所述状态信息检测单元所检测信号为被检测对象发生故障时的故障信号或出现缺陷时的缺陷信号，步骤七中自动输出的被检测对象当前工作状态的类别为被检测对象当前发生的故障类别或当前出现的缺陷类别。

上述一种基于二叉树支持向量机的分类方法，其特征是：步骤五中N-1个所述分类模型均为模糊支持向量机模型，且步骤三中进行训练样本获取时，N种样本类中的每一个训练样本中均包括模糊隶属度μ_ks，其中μ_ks为X_ks对其所属样本类k的模糊隶属度。

上述一种基于二叉树支持向量机的分类方法，其特征是：步骤五中对模糊隶属度μ_ks进行确定时，采用模糊统计法、例证法、专家经验法、二元对比排序法或基于线性距离的隶属度函数进行确定。

上述一种基于二叉树支持向量机的分类方法，其特征是：步骤502中对惩罚参数C与所选用径向基函数的核参数进行确定时，所选用的径向基函数为RBF核函数，核参数为RBF核函数中的核参数γ，其中对惩罚参数C与核参数γ进行确定时，采用改进的遗传算法对所选取的惩罚参数C与核参数γ进行优化，其优化过程如下：

步骤5021、种群初始化：将惩罚参数C的一个取值与核参数γ的一个取值作为一个个体，并将多个个体集合为一个种群，同时所述种群中的所有个体均进行二进制编码后形成初始化种群；其中，惩罚参数C的一个取值和核参数γ的一个取值均为自区间(0，1000]中随机抽取的一个数值；

步骤5022、初始化种群中各个体适应度值计算：初始化种群中所有个体的适应度值计算方法均相同；初始化种群中多个所述个体，分别对应多个不同的分类模型z；

对于所述初始化种群中的任一个个体来说，采用步骤三中所述训练样本集中剩余的N-Z+1个样本类，对与该个体对应的分类模型z进行训练，且以该分类模型z的分类准确率作为该个体的适应度值；

待所述初始化种群中所有个体的适应度值均计算出来后，再相应计算出所述初始化种群的种群平均适应度值；

步骤5023、选择操作：根据步骤5022中计算得出的所述初始化种群中所有个体的适应度值，选出所述初始化种群中适应度值高的多个个体作为子代群体；

步骤5024、交叉操作与变异操作：对选取的子代群体进行交叉操作与变异操作，获得新一代的子代群体；

步骤5025、子代群体中各个体适应度值计算：子代群体中所有个体的适应度值计算方法均相同；子代群体中多个所述个体，分别对应多个不同的分类模型z；

对于所述子代群体中的任一个个体来说，采用步骤三中所述训练样本集中剩余的N-Z+1个样本类，对与该个体对应的分类模型z进行训练，且以该分类模型z的分类准确率作为该个体的适应度值；

待所述子代群体中所有个体的适应度值均计算出来后，再相应计算出所述子代群体的种群平均适应度值；

步骤5026、选择操作：根据步骤5025中计算得出的所述子代群体中所有个体的适应度值，选出所述子代群体中适应度值高的多个个体作为子代群体；

步骤5027、判断是否满足终止条件：当进化代数超过预先设定的最大进化代数itmax或者子代群体中个体的最大适应度值大于或等于预先设定的适应度设定值时，遗传算法终止并输出当前所获得所述子代群体中适应度值最高的个体；否则，返回步骤5024。

上述一种基于二叉树支持向量机的分类方法，其特征是：步骤5024中进行交叉操作与变异操作时，按照交叉概率p_c进行交叉操作，且按照变异概率p_m进行变异操作；其中，

p_{c} = \{\begin{matrix} p_{c \max} - (\frac{p_{c \max} - p_{c \min}}{it \max}) \times iter, & f^{'} > f_{avg} \\ p_{c \max,} & f^{'} \leq f_{avg} \end{matrix},

p_{m} = \{\begin{matrix} p_{m \max} - (\frac{p_{m \max} - p_{m \min}}{it \max}) \times iter, & f > f_{avg} \\ p_{m \max,} & f \leq f_{avg} \end{matrix};

式中，p_cmax为预先设定的最大交叉概率，p_cmin为预先设定的最小交叉概率，p_mmax为预先设定的最大变异概率，p_mmin为预先设定的最小变异概率，itmax为预先设定的最大进化代数，iter为当前的进化代数，f_avg为当前进行交叉操作与变异操作的子代群体的种群平均适应度值，f′表示在要交叉的两个个体中较大的适应度值，f表示要变异的个体适应度值。

上述一种基于二叉树支持向量机的分类方法，其特征是：步骤202中计算得出样本类k与N种所述样本类中任一个样本类h之间的间距d_kh后，获得样本类k的类间距离数据；步骤204中多次重复步骤201至步骤203后，获得N种所述样本类的类间距离数据和类间距之和；随后，所述数据处理器将N种所述样本类的类间距离数据组成一个类间距离对称矩阵D_k×k，且每一个所述样本类的类间距离数据位于类间距离对称矩阵D_k×k的同一行上；N种所述样本类的类间距之和分别为类间距离对称矩阵D_k×k中的各行数据之和，且类间距离对称矩阵D_k×k中的各行数据之和组成一个数组（Sumd(1)，Sumd(2)…Sumd(N)）；

步骤205中对N种所述样本类的分类优先级别Y进行确定时，其确定过程如下：

步骤2051、初始参数设定：对分类优先级别Y和样本总数n的初始值分别进行设定，其中分类优先级别Y=0，样本总数n=N；

步骤2052、比较数组（Sumd(1)，Sumd(2)…Sumd(N)）中当前所有数据的大小，从中选出最大值Sumd(L)，其中L=1、2…N，并将样本类L的分类优先级别为Y+1，且此时Y=Y+1，n=N-1；同时，将类间距离对称矩阵D_k×k中的第L行数据全部置0，将数组（Sumd(1)，Sumd(2)…Sumd(N)）中的Sumd(L)置0；

步骤2053、多次重复步骤2052，直至n=0为止。

上述一种基于二叉树支持向量机的分类方法，其特征是：步骤502中对惩罚参数C与所选用径向基函数的核参数进行确定时，所选用的径向基函数为RBF核函数，核参数为RBF核函数中的核参数γ，其中对惩罚参数C与核参数γ进行确定时，采用网格搜索法进行确定，并利用步骤三中所述训练样本集中的l个训练样本，且采用K折交叉验证法对所建立的二分类模型z进行验证。

上述一种基于二叉树支持向量机的分类方法，其特征是：步骤5024中进行交叉操作与变异操作时，交叉操作采用多点交叉，且变异操作采用实值变异；且进行交叉操作与变异操作时，还需对当前的进化代数iter进行统计；预先设定的最大交叉概率p_cmax=0.6，预先设定的最小交叉概率p_cmin=0.9，预先设定的最大变异概率p_mmax=0.1，预先设定的最小变异概率p_mmin=0.0001，预先设定的最大进化代数itmax=100；步骤5021中进行种群初始化之前，将进化代数iter的初始值设定为1。

本发明与现有技术相比具有以下优点：

1、所采用的分类系统硬件电路设计合理、接线方便、安装布设方便且投入成本较低、使用效果好。

2、所采用的分类方法步骤简单、设计合理、实现方便且分类速度快、分类精度高，分类速度为0.015秒左右，且其分类精度高达91.5%。

3、所采用的分类方法与以FSVM（模糊支持向量机）二类分类算法为基础，且该分类方法为一种基于类的距离之和的模糊二叉树支持向量机多类分类方法，其利用多个样本类的距离之和确定分类优先级别，之后按照确定的分类优先级别将多个样本类由先至后逐一分出来，简便且大幅度地提高分类精度和速度。同时，所采用的模糊支持向量机可以减少孤立点和噪声对分类的影响，更进步保证分类速度和精度。因而，本发明所采用的分类方法将支持向量机这一两分类方法有效推广至多分类场合，实现方便，并能适应钢丝绳芯输送带缺陷快速、准确识别的目的。

4、实际进行分类时，支持向量机参数对分类精度影响较大，而实际应用中，支持向量机参数选取比较困难，本发明采用一种改进后的遗传算法对支持向量机的参数进行优化，该改进后的遗传算法具有以下优点：①有效地避免了标准遗传算法的早熟问题，具有良好的全局优化能力；有效地避免了锯齿问题，具有优良的局部优化能力；③遗传算子操作具有明确的方向，具有良好的收敛性能。试验证明，该改进后的遗传算法可以较快地获得支持向量机参数，并且所获得分类模型的分类精度高，训练速度快，支持向量个数少，并且对于含有噪声数据的分类比常用支持向量机多分类算法具有更高的分类精度和更少的支持向量。

5、使用效果好且实用价值高，能有效解决目前煤矿生产中所存在的钢丝绳芯输送安全在线检测这一亟待解决的技术难题，实现了煤矿钢丝绳芯输送带缺陷电磁检测的自动化，识别速度快且识别精度高，有效提高了输送带缺陷检测的可靠性和效率，对确保输送带安全可靠运行具有重要意义。

6、所采用的多传感器信息融合特征提取和特征约简方法设计合理，大幅度减少了计算量，并且能有效提取本质特征向量。

7、适用范围较广，能对各种类型检测信号进行分类识别，尤其适用于对被检测对象的故障识别或缺陷识别中，应用领域广泛。

综上所述，本发明设计合理、使用操作简便、实现方便且使用效果好、实用价值高，提出了一种基于改进遗传算法的模糊二叉树支持向量机多类分类方法，不仅可以选出SVM分类器的最优参数，并且能减少噪声和孤立点对分类的影响，提高分类速度和精度，大幅度提高了输送带缺陷检测的可靠性和缺陷识别效率。同时，适用范围广，能有效推广适用至各种故障信号或缺陷信号的智能识别过程。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明所采用分类方法的方法流程框图。

图2为本发明所采用硬件系统的电路原理框图。

图3为本发明所采用水平向电磁检测单元与水平向电磁检测单元的布设位置示意图。

附图标记说明:

1-1—水平向电磁检测单元； 1-2—竖直向电磁检测单元；

2—数据处理器； 3—数据存储器； 5—信号调理电路；

6—A/D转换电路； 9—ST系列钢丝绳芯输送带。

具体实施方式

如图1所示的一种基于二叉树支持向量机的分类方法，包括以下步骤：

步骤一、信号采集：采用状态信息检测单元对被检测对象在N种不同工作状态时的工作状态信息分别进行实时检测，并将所检测信号同步传送至数据处理器2，相应获得与N种不同工作状态相对应的N组工作状态检测信息，N组所述工作状态检测信息中均包括所述状态信息检测单元在不同采样时刻检测到的多个检测信号，其中N为正整数且N≥3。

步骤二、特征提取：待数据处理器2接收到所述状态信息检测单元所传送的检测信号时，自各检测信号中分别提取出能代表并区别该检测信号的一组特征参数，且该组特征参数包括W个特征量，并对W个所述特征量进行编号，W个所述特征量组成一个特征向量，其中W≥2。

步骤三、训练样本获取：分别在经特征提取后的N组所述工作状态检测信息中，随机抽取m个检测信号组成训练样本集。

所述训练样本集中相应包括l个训练样本，其中m≥2，l=m×N；l个所述训练样本分属于N种样本类，每一个样本类中均包括被检测对象工作于同一个工作状态时的m个训练样本，N种样本类分别与被检测对象的N种不同工作状态相对应的样本类1、样本类2…样本类N；N种样本类中的每一个训练样本均记作X_ks，其中k为样本类的类别标号且k=1、2…N，s为各样本类中所包括m个训练样本的样本序号且s=1、2…m；X_ks为样本类k中第s个训练样本的特征向量，X_ks∈R^d，其中d为X_ks的向量维数且d=W。

步骤四、分类优先级别确定，其确定过程如下：

步骤401、样本类的类中心计算：采用数据处理器2对N种所述样本类中任一个样本类k的类中心进行计算；

步骤402、类间距离计算：采用数据处理器2且根据公式

对步骤201中所述任一个样本类k与N种所述样本类中任一个样本类h之间的间距分别进行计算，其中为样本类k中所有训练样本的第p个特征量均值，为样本类h中所有训练样本的第p个特征量均值，且h=1、2…N；

步骤403、类间距之和计算：采用数据处理器2且根据公式对步骤401中所述任一个样本类k的类间距之和。

步骤405、按照步骤404中计算得出的所有样本类的类间距之和由大到小的顺序，采用数据处理器2确定出N种所述样本类的分类优先级别Y，其中Y=1、2…N；其中，类间距之和最大的样本类的分类优先级别最高且其分类级别为1，类间距之和最大的样本类的分类优先级别最低且其分类级别为N。

步骤五、多分类模型建立：所建立的多分类模型包括N-1个二分类模型，且N-1个所述二分类模型均为支持向量机模型；N-1个所述二分类模型按照步骤405中所确定的分类优先级别，将N种所述样本类自所述训练样本集中由先至后逐类分出来，N-1个所述二分类模型的建立方法均相同且均采用数据处理器2进行建立。

步骤504、多次重复步骤501至步骤503，直至获得N-1个所述二分类模型的分类函数，便完成N-1个所述二分类模型的建立过程，获得建立完成的多分类模型。

例如，当z=1时，二分类模型1为将分类优先级别为1的样本类自所述训练样本集中分出来的二分类模型。

步骤六、多分类模型训练：将步骤三中所述训练样本集中的l个训练样本输入到步骤五中所建立的多分类模型进行训练。

实际使用时，步骤一中N种所述不同工作状态为被检测对象发生故障时的多种不同故障状态或出现缺陷时的多个不同缺陷状态，且所述状态信息检测单元所检测信号为被检测对象发生故障时的故障信号或出现缺陷时的缺陷信号，步骤七中自动输出的被检测对象当前工作状态的类别为被检测对象当前发生的故障类别或当前出现的缺陷类别。

本实施例中，被检测对象为煤矿钢丝绳芯输送带，所述状态信息检测单元为对被检测煤矿钢丝绳芯输送带内的剩磁进行检测的电磁检测单元。相应地，步骤一中N种所述不同工作状态为被检测煤矿钢丝绳芯输送带的N种不同的缺陷状态。所获得的N组工作状态检测信息为与被检测煤矿钢丝绳芯输送带的N种不同缺陷状态相对应的N组缺陷状态信息。其中，N种不同的缺陷状态包括钢丝绳断绳、断丝、疲劳和接头位移等缺陷状态。对应地，步骤七中自动输出的被检测煤矿钢丝绳芯输送带当前缺陷状态的类别，包括钢丝绳断绳、断丝、疲劳和接头位移等缺陷类别。

实际使用过程中，采用本发明也可以对其它被检测对象的缺陷类别进行识别。相应地，也可以采用本发明对其它被检测对象出现故障时的故障类别进行识别。且对故障类别进行识别时，所述状态信息检测单元为对被检测对象的故障状态进行检测的故障信号检测单元。相应地，步骤一中N种所述不同工作状态为被检测对象的N种不同的故障状态。所获得的N组工作状态检测信息为与被检测对象的N种不同故障状态相对应的N组故障状态信息。对应地，步骤七中自动输出的被检测对象当前故障状态的类别。

本实施例中，实际操作时，信号采集之前，应先采用电磁加载装置对被检测煤矿钢丝绳芯输送带进行电磁加载。

所述电磁检测单元为强磁传感器或弱磁传感器。

本实施例中，所采用的电磁加载装置为弱磁加载模块，具体采用TCK-GMS型弱磁加载装置，也可以采用其它类型的弱磁加载装置。相应地，所采用的电磁检测单元为弱磁传感器，具体为TCK弱磁传感器。其中，TCK弱磁检测是基于“空间磁场矢量合成”原理，采用宽距、非接触式弱磁能势感应装置，通过提取已施加磁载的铁磁性材料上弱磁能势分布差异信息，完成定位、定量和定性识别钢丝绳内外部各种缺陷的电磁无损检测方法。所采用的TCK弱磁传感器为高灵敏度传感器，且其由释磁元件和磁衡元件组成，其中释磁元件提供一定的弱磁场B_x，与经过弱磁规划后的钢丝绳芯体积元剩余弱磁场B关联出磁场B_y，磁衡元件则能够灵敏并准确地将B_y变化量并转换为对应的电信号，B_y与被检测煤矿钢丝绳芯输送带中钢丝绳芯缺陷产生的漏磁场和钢丝绳芯内部磁场有关，根据B_y的变化量，可以反映钢丝绳芯的缺陷状况，从而实现对煤矿钢丝绳芯输送带的缺陷检测。

本实施例中，被检测煤矿钢丝绳芯输送带为ST系列钢丝绳芯输送带7，实际使用时，也可以对其它类型的钢丝绳芯输送带缺陷进行智能识别。

实际使用时，结合图2，所述电磁检测单元包括对被检测煤矿钢丝绳芯输送带内水平方向上的剩磁进行实时检测的水平向电磁检测单元1-1和/或对被检测煤矿钢丝绳芯输送带内竖直方向上的剩磁进行实时检测的竖直向电磁检测单元1-2。所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2均布设在被检测煤矿钢丝绳芯输送带上。当所述电磁检测单元包括水平向电磁检测单元1-1和竖直向电磁检测单元1-2时，所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2同步对被检测煤矿钢丝绳芯输送带内同一位置处的剩磁进行检测，且所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2的采样频率相同。

步骤一中所获得的N组所述缺陷状态检测信息相应为N组水平向剩磁检测信息和/或N组竖直向剩磁检测信息；其中，N组所述水平向剩磁检测信息均包括所述水平向电磁检测单元1-1在不同采样时段检测到的多个检测信号，且N组所述竖直向剩磁检测信息均包括所述竖直向电磁检测单元1-2在不同采样时段检测到的多个检测信号。

本实施例中，所述电磁检测单元包括对被检测煤矿钢丝绳芯输送带内水平方向上的剩磁进行实时检测的水平向电磁检测单元1-1和对被检测煤矿钢丝绳芯输送带内竖直方向上的剩磁进行实时检测的竖直向电磁检测单元1-2。实际布设时，所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2均布设在被检测煤矿钢丝绳芯输送带上，且所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2同步对被检测煤矿钢丝绳芯输送带内同一位置处的剩磁进行检测。实际进行信号采集时，所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2的采样频率相同，相应地，步骤一中所获得的N组所述缺陷状态检测信息分为两类，包括N组水平向剩磁检测信息和N组竖直向剩磁检测信息。其中，N组所述水平向剩磁检测信息均包括所述水平向电磁检测单元1-1在不同采样时段检测到的多个检测信号，且N组所述竖直向剩磁检测信息均包括所述竖直向电磁检测单元1-2在不同采样时段检测到的多个检测信号。

相应地，所述水平向电磁检测单元1-1和所述竖直向剩磁检测信息所检测到的每一个所述检测信号均为一个采样时段所检测到的一个采样序列。

本实施例中，所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2均为弱磁传感器，且具体为TCK弱磁传感器。

实际进行信号采集时，所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2均按照设定的采样频率进行采集，且采样频率为1KHz～8KHz。本实施例中，所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2的采样频率均为4KHz，实际使用时，可根据具体需要，对所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2的采样频率在1KHz～8KHz内进行相应调整。

本实施例中，所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2所检测的检测信号均为一个采样序列X(i)，其中i＝1、2、3…n，n为采样序列X(i)中的采样点数量。

本实施例中，步骤二中进行特征提取时，所提出的特征参数包括检测信号的12个时域特征，即M=12，12个时域特征分别是峰峰值、均方根值、平均幅值、方差、方根幅值、峭度、波宽、波形指标、峰值指标、脉冲指标、裕度指标和峭度指标。

实际进行特征提取时，按照步骤二中所述的特征提取方法，对N组所述水平向剩磁检测信息和/或N组所述竖直向剩磁检测信息分别进行特征提取，相应获得经特征提取后的N组所述水平向剩磁检测信息和/或经特征提取后的N组所述竖直向剩磁检测信息。

本实施例中，实际对所述电磁检测单元所检测的各检测信号进行特征提取时，对所述电磁检测单元中所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2所检测的各检测信号分别进行特征提取。

对于所述水平向电磁检测单元1-1所检测的任一个检测信号（即采样序列X(i)）进行特征提取时，12个时域特征的求解过程如下：根据公式X_p-p=max{x_i}-min{x_i}，计算得出峰峰值X_p-p，式中max{x_i}为采样序列X(i)中的最大值，min{x_i}为采样序列X(i)中的最小值；根据公式计算得出均方根值X_rms；根据公式计算得出平均幅值X_av；根据公式计算得出方差σ_x ²，式中根据公式计算得出方根幅值X_r；根据公式计算得出峭度β′；对宽度W进行计算时，当被检测煤矿钢丝绳芯输送带的缺陷状态为接头位移时，宽度W为同一采样时刻所述竖直向电磁检测单元1-2所检测信号中波峰与波谷之间的间距；当被检测煤矿钢丝绳芯输送带的缺陷状态为接头位移之外的其它缺陷状态时，宽度W的起始点为同一采样时刻所述竖直向电磁检测单元1-2所检测信号中幅值大于0.244V的上升沿，且其终止点为同一采样时刻所述竖直向电磁检测单元1-2所检测信号中幅值小于0.244V的下降沿；根据公式计算得出波形指标S，式中X_rms为均方根值，X_av为平均幅值；根据公式计算得出峰值指标C，式中X_max为采样序列X(i)中的最大值，X_rms为均方根值；根据公式计算得出脉冲指标I，式中X_max为采样序列X(i)中的最大值，X_av为平均幅值；根据公式计算得出裕度指标L，式中X_max为采样序列X(i)中的最大值，X_r为方根幅值；根据公式计算得出峭度指标K，式中β′为峭度，X_rms为均方根值。

对于所述竖直向电磁检测单元1-2所检测的任一个检测信号进行特征提取时，除宽度W之外，其余特征量的提取方法与所述水平向电磁检测单元1-1所检测信号的特征提取方法相同。对于宽度W而言，当被检测煤矿钢丝绳芯输送带的缺陷状态为接头位移时，宽度W为该检测信号中波峰与波谷之间的间距；当被检测煤矿钢丝绳芯输送带的缺陷状态为接头位移之外的其它缺陷状态时，宽度W的起始点为该检测信号中幅值大于0.244V的上升沿，且其终止点为该检测信号中幅值小于0.244V的下降沿。

本实施例中，由于N组所述缺陷状态检测信息分为N组水平向剩磁检测信息和N组竖直向剩磁检测信息。实际进行特征提取时，对N组所述水平向剩磁检测信息分别进行特征提取，获得经特征提取后的N组所述水平向剩磁检测信息；与此同时，对N组所述竖直向剩磁检测信息分别进行特征提取，获得经特征提取后的N组所述竖直向剩磁检测信息。

步骤三中获取所述训练样本集时，由于N个样本类的类别分别与被检测煤矿钢丝绳芯输送带的N种不同缺陷状态相对应，因而按照被检测煤矿钢丝绳芯输送带的N种不同缺陷状态名称对N个样本类的类别分别进行命名。

实际操作过程中，在N组所述缺陷状态检测信息中随机抽取m个检测信号时，采用数据处理器2进行随机抽取。

本实施例中，m=50。实际进行训练样本集获取时，也可以根据具体需要，对m的取值进行相应调整。

实际对所述训练样本集进行获取时，按照步骤三中所述的训练样本集获取方法，相应获得训练样本集一和/或训练样本集二；其中，所述训练样本集一为分别在经特征提取后的N组所述水平向剩磁检测信息中，随机抽取m个检测信号组成的一个训练样本集；所述训练样本集二为分别在经特征提取后的N组所述竖直向剩磁检测信息中，随机抽取m个检测信号组成的一个训练样本集；所述训练样本集一和所述训练样本集二的结构相同，二者均包括l个训练样本，所述训练样本集一和所述训练样本集二中的l个所述训练样本均分属于N个样本类。

本实施例中，由于N组所述缺陷状态检测信息分为N组水平向剩磁检测信息和N组竖直向剩磁检测信息。

因而，获取训练样本集时，按照本步骤中所述训练样本集的获取方法，分别在经特征提取后的N组所述水平向剩磁检测信息中，随机抽取m个检测信号组成一个训练样本集（即训练样本集一）；与此同时，按照步骤三中所述训练样本集的获取方法，分别在经特征提取后的N组所述竖直向剩磁检测信息中，随机抽取m个检测信号组成另一个训练样本集（即训练样本集二）。所述训练样本集一和所述训练样本集二的结构相同，二者均包括l个训练样本，所述训练样本集一和所述训练样本集二中的l个所述训练样本均分属于N个样本类。

本实施例中，步骤402中计算得出样本类q与N个所述样本类中任一个样本类h之间的间距d_qh后，获得样本类q的类间距离数据；步骤404中多次重复步骤401至步骤403后，获得N个所述样本类的类间距离数据和类间距之和；随后，所述数据处理器2将N个所述样本类的类间距离数据组成一个类间距离对称矩阵D_N×N，且每一个所述样本类的类间距离数据位于类间距离对称矩阵D_N×N同一行上的同行数据；N个所述样本类的类间距之和分别为类间距离对称矩阵D_N×N中的各行数据之和，且类间距离对称矩阵D_N×N中的各行数据之和组成一个数组（Sumd(1)，Sumd(2)…Sumd(N)）。

相应地，步骤405中对N个所述样本类的分类优先级别Y进行确定时，其确定过程如下：

步骤4051、初始参数设定：对分类优先级别Y和样本总数n′的初始值分别进行设定，其中分类优先级别Y=0，样本总数n′=N；

步骤4052、比较数组（Sumd(1)，Sumd(2)…Sumd(N)）中当前所有数据的大小，从中选出最大值Sumd(L)，其中L=1、2…N，并将样本类L的分类优先级别为Y+1，且此时Y=Y+1，n′=N-1；同时，将类间距离对称矩阵D_N×N中的第L行数据全部置0，将数组（Sumd(1)，Sumd(2)…Sumd(N)）中的Sumd(L)置0；

步骤4053、多次重复步骤4052，直至n′=0为止。

实际进行分类优先级别确定时，按照步骤401至步骤405中所述的分类优先级别确定方法，分别对所述训练样本集一和/或所述训练样本集二中多个样本类的分类优先级别分别进行确定。

本实施例中，按照步骤401至步骤405中所述的分类优先级别确定方法，分别对所述训练样本集一和所述训练样本集二中多个样本类的分类优先级别分别进行确定。

实际进行分类时，支持向量机通过最优超平面将训练样本划分为互相对立的两个类。然而实际应用中，由于每个样本并不能完全划归到某一类，并且样本中可能存在噪声或孤立点，因而采用模糊支持向量机(FuzzySupport Vector Machine FSVM)通过给样本增加一个模糊隶属度，使孤立点或噪声的模糊隶属度很小，从而减少孤立点和噪声对最优分类超平面的影响。因而，模糊支持向量机根据训练样本对分类作用的不同，给不同样本加以不同的错分惩罚来克服孤立点和噪声对分类的不利影响，而模糊隶属度的确定非常重要。

因此，本实施例中，步骤五中N-1个所述二分类模型均为模糊支持向量机模型，且步骤三中进行训练样本获取时，N个样本类中的每一个训练样本中均包括模糊隶属度μ_Qs，其中μ_Qs为X_Qs对其所属样本类Q的模糊隶属度。

实际对模糊隶属度μ_ks进行确定时，可以采用模糊统计法、例证法、专家经验法或二元对比排序法进行确定。其中，模糊统计法的基本思想是对论域U（研究的范围，一般指实数集）中的一个确定元素A₀是否属于论域中的一个可变动的清晰集合A^*做出清晰的判断。对于不同的试验者，清晰集合A^*可以有不同的边界，但它相对应于同一个模糊集A。模糊统计法的计算步骤是：在每次统计中，A₀是确定的，A^*的值是可变的，作n次试验，其模糊统计可按照下式进行计算：A₀对A的隶属频率=A₀∈A的次数/试验总次数n。随着n的增大，隶属频率也会趋向稳定，这个稳定就是A₀对A的隶属度值。这种方法较直观地反映了模糊概念中的隶属程度，但其计算量非常大。

例证法的主要思想是从已知有限个μ_A的值来估计论域中模糊子集A的隶属函数。如论域U代表全体人类，A是“高个子的人”，显然A是一个模糊子集。为了确定μ_A，先确定一个高度值h，然后选定一个语言真值（即一句话的真实程度）中的一个来回答某人是否算“高个子”。如语言真值可分为“真的”“大致真的”“似真似假”“大致假的”和“假的”五种情况，并且分别用数据1、0.75、0.5、0.25、0来表示这些语言真值。对N种不同高度h1、h2、h 3…hn都做同样的询问，即可以得到A的隶属度函数的离散表示。

专家经验法是根据专家的实际经验给出模糊信息的处理算式或相应权系数值来确定隶属度函数的一种方法。在许多情况下，通常是初步确定粗略的隶属度函数，然后再通过“学习”和实践经验逐步修改和完善，而实际效果正是检验和调整隶属度函数的依据。

二元对比排序法是一种较实用的确定隶属度函数的方法，它通过对多个事物之间的两两对比来确定某种特征下的顺序，由此来决定这些事物对该特征的隶属函数的大体形状。二元对比排序法根据对比测度不同，可分为相对比较法、对比平均法、优先关系定序法和相似优先对比法等。

本实施例中，对μ_Qs进行确定时，通过数据处理器2且采用基于线性距离的隶属度函数进行确定，其中基于线性距离的隶属度函数的确定是将样本的隶属度看作是特征空间中样本与其所在样本类的类中心之间距离的函数，样本离类中心的距离越近，隶属度越大，反之隶属度越小，详见2009年8月公开的《兰州理工大学学报》第35卷第4期，张秋余、竭洋等发表的《模糊支持向量机中隶属度确定的新方法》一文。

本实施例中，由于所选用的径向基函数为RBF核函数，则核参数为RBF核函数中的参数步骤502中对惩罚参数C与核参数γ进行确定时，采用改进的遗传算法对所选取的惩罚参数C与核参数γ进行优化，其优化过程如下：

其中，与各个体对应的分类模型z，即为各个体中惩罚参数C与核参数γ确定后对应的支持向量机分类模型；

本实施例中，预先设定的最大交叉概率p_cmax=0.6，预先设定的最小交叉概率p_cmin=0.9，预先设定的最大变异概率p_mmax=0.1，预先设定的最小变异概率p_mmin=0.0001，预先设定的最大进化代数itmax=100。

步骤5021中进行种群初始化之前，将进化代数iter的初始值设定为1。

本实施例中，步骤5023进行选择操作之前，按照轮盘赌选择法，计算出所述初始化种群中所有个体的适应度值。步骤5026中进行选择操作之前，按照轮盘赌选择法，计算出所述子代群体中所有个体的适应度值。

实际进行参数确定时，步骤5024中进行交叉操作与变异操作时，交叉操作采用多点交叉，且变异操作采用实值变异。本实施例中，步骤5024中进行交叉操作与变异操作时，交叉操作采用两点交叉。

本实施例中，步骤5024中进行交叉操作与变异操作时，还需对当前的进化代数iter进行统计。

本实施例中，步骤5024中进行交叉操作与变异操作时，按照交叉概率p_c进行交叉操作，且按照变异概率p_m进行变异操作；其中，

p_{c} = \{\begin{matrix} p_{c \max} - (\frac{p_{c \max} - p_{c \min}}{it \max}) \times iter, & f^{'} > f_{avg} \\ p_{c \max,} & f^{'} \leq f_{avg} \end{matrix},

p_{m} = \{\begin{matrix} p_{m \max} - (\frac{p_{m \max} - p_{m \min}}{it \max}) \times iter, & f > f_{avg} \\ p_{m \max}, & f \leq f_{avg} \end{matrix};

也就是说，根据适应度值及进化代数来调节个体的交叉概率p_c和变异概率p_m，如果个体适应度值小于种群平均适应度值，对其给予较大的交叉概率和变异概率；如果个体比较优良，即其适应度值大于种群平均适应度值，则根据其迭代状态和优良程度赋予此个体相应的交叉概率和变异概率，迭代代数越接近最大设定代数itmax，个体交叉概率和变异概率就越小，此种交叉概率、变异概率调节方法在进化初期具有较强的全局搜索能力和较弱的局部搜索能力，随着进化的进行，全局优化能力逐渐减弱，局部优化能力逐渐增强。该改进方法有利于保护优良个体，便于获得全局最优解，可以防止出现“早熟”现象。

步骤5023和步骤5026中进行选择操作时，采用最优个体保留策略。由于在遗传算法的操作算子中，选择算子可以确保选出的个体都是优良的，但是交叉算子和变异算子只是引入了新的个体，这两个操作算子不能确保产生的新个体是优良的。因此采用最优个体保留策略来获得最优个体。最优保留策略是在进行交叉和变异后比较产生的新个体适应度值是增加还是减小，如果产生的新个体适应度值增加就保留该新个体，否则保留原个体。该改进策略可以有效地保证遗传操作所产生的都是优良新个体，确定了进化的方向，避免了个别个体在进化过程中退化现象，增强了算法的收敛性能。

实际对惩罚参数C与所选用径向基函数的核参数γ进行确定时，也可以采用网格搜索法进行确定，并利用步骤三中所述训练样本集中的l个训练样本，且采用K折交叉验证法对所建立的二分类模型z进行验证。

相应地，实际进行多分类模型建立时，按照步骤五所述的多分类模型建立方法，相应获得多分类模型一和/或多分类模型二；其中，所述多分类模型一为将所述训练样本集一中的多个样本类逐一分出来的多分类模型，所述多分类模型二为将所述训练样本集二中的多个样本类逐一分出来的多分类模型。

本实施例中，按照步骤五中所述的多分类模型建立方法，分别建立将所述训练样本集一中的多个样本类逐一分出来的多分类模型一和将所述训练样本集二中的多个样本类逐一分出来的多分类模型二。

相应地，步骤六中进行多分类模型训练时，相应对所述多分类模型一和/或多分类模型二分别进行训练；其中，对所述多分类模型一进行训练时，将所述训练样本集一中的l个训练样本输入到所述多分类模型一进行训练；对所述多分类模型二进行训练时，将所述训练样本集二中的l个训练样本输入到所述多分类模型二进行训练。

本实施例中，将所述训练样本集一中的l个训练样本输入到多分类模型一进行训练；与此同时，将所述训练样本集二中的l个训练样本输入到多分类模型二进行训练。

相应地，步骤七中被检测煤矿钢丝绳芯输送带的缺陷类别包括钢丝绳断绳、断丝、疲劳和接头位移等类别。

本实施例中，步骤七中采用数据处理器2对所检测信号进行特征提取之前，还需对所检测信号进行降噪处理。且特征提取之后，还应对所提取的特征参数进行特征约简，且其特征提取方法与步骤二中所述的特征提取方法相同。

实际使用过程中，当被检测煤矿钢丝绳芯输送带出现缺陷时，采用所述电磁检测单元对被检测煤矿钢丝绳芯输送带内的剩磁进行实时检测，且此时所检测信号为缺陷信号，且将所述缺陷信号输入至步骤五中所建立的多分类模型中，自动输出当前状态下被检测煤矿钢丝绳芯输送带的缺陷类别。并且，所述缺陷信号为一个采样序列。

本步骤中进行信号实时采集及同步分类时，相应对水平向电磁检测单元1-1和/或竖直向电磁检测单元1-2实时所检测信号，分别进行同步分类。其中，对水平向电磁检测单元1-1实时所检测信号分别进行同步分类时，所述水平向电磁检测单元1-1对被检测煤矿钢丝绳芯输送带内水平方向上的剩磁进行实时检测，且对所检测信号进行特征提取后输入至所建立的多分类模型一中，之后自动输出被检测煤矿钢丝绳芯输送带的缺陷类别；对竖直向电磁检测单元1-2实时所检测信号分别进行同步分类时，所述竖直向电磁检测单元1-2对被检测煤矿钢丝绳芯输送带内竖直方向上的剩磁进行实时检测，且对所检测信号进行特征提取后输入至所建立的多分类模型二中，之后自动输出被检测煤矿钢丝绳芯输送带的缺陷类别。

本实施例中，所述水平向电磁检测单元1-1对被检测煤矿钢丝绳芯输送带内水平方向上的剩磁进行实时检测，并对所检测信号进行特征提取后输入至所建立的多分类模型一中，之后自动输出被检测煤矿钢丝绳芯输送带的缺陷类别。与此同时，所述电磁检测单元中的竖直向电磁检测单元1-2对被检测煤矿钢丝绳芯输送带内竖直方向上的剩磁进行实时检测，并对所检测信号进行特征提取后输入至所建立的多分类模型二中，之后自动输出被检测煤矿钢丝绳芯输送带的缺陷类别。

本实施例中，步骤二中进行特征提取之后，所述数据处理器2还需对所述电磁检测单元所检测的所有检测信号分别进行降噪处理，且所述电磁检测单元所检测的所有检测信号的降噪处理方法均相同。

本实施例中，由于所述电磁检测单元包括所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2，因而步骤三中进行特征提取之后，所述数据处理器2需对所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2所检测的所有检测信号均进行降噪处理，且所述水平向电磁检测单元1-1和竖直向电磁检测单元1-2所检测的所有检测信号的降噪处理方法均相同。

实际对所述水平向电磁检测单元1-1或竖直向电磁检测单元1-2所检测的检测信号进行降噪处理时，采用小波变换或LMS自适应滤波进行降噪处理。

实际操作过程中，步骤三中获取训练样本的同时，还需分别在N组所述工作状态检测信息中随机抽取b个检测信号组成测试样本集；所述测试样本集中相应包括Q个测试样本，其中b≥2，Q=b×N；Q个所述测试样本分属于N种所述样本类；步骤六中对所建立的多分类模型进行训练后，还需输入Q个所述测试样本，对所建立多分类模型的分类正确率进行测试。

本实施例中，步骤三中获取训练样本的同时，还需分别在N组所述缺陷状态检测信息中随机抽取b个检测信号组成测试样本集。

本实施例中，b=150。实际进行训练样本集获取时，也可以根据具体需要，对b的取值进行相应调整。

本实施例中，步骤三中获取训练样本的同时，按照步骤三中所述训练样本集的获取方法，在N组所述水平向剩磁检测信息中，随机抽取b个检测信号组成一个测试样本集（即测试样本集一）；与此同时，按照步骤四中所述训练样本集的获取方法，分别在经特征提取后的N组所述竖直向剩磁检测信息中，随机抽取b个检测信号组成另一个测试样本集（即测试样本集二）。所述测试样本集一和所述测试样本集二的结构相同，二者均包括F个训练样本，所述测试样本集一和所述测试样本集二中的l个所述训练样本均分属于N个样本类。

相应地，步骤六中对所建立的多分类模型一和多分类模型二进行训练后，还需输入所述测试样本集一中的F个所述测试样本，对所建立多分类模型一的分类正确率进行测试；与此同时，还需输入所述测试样本集二中的F个所述测试样本，对所建立多分类模型二的分类正确率进行测试。

实际使用过程中，由于被检测煤矿钢丝绳芯输送带内部钢丝绳较多，磁场覆盖范围宽，需要多个同类型传感器同时检测输送带缺陷，因此必须采用多个传感器信息融合来获取缺陷信息。

本实施例中，步骤二中所述电磁检测单元的数量为多个，多个所述电磁检测单元沿被检测煤矿钢丝绳芯输送带的宽度方向进行均匀布设。多个所述电磁检测单元均与信号调理电路5相接，所述信号调理电路5与A/D转换电路6相接，所述A/D转换电路6与数据处理器2相接，并且所述数据处理器2与数据存储器3相接。

且步骤二中进行特征提取之后，所述数据处理器2还需调用多传感器数据融合处理模块，对多个所述电磁检测单元所检测信号进行融合处理。本实施例中，对多个所述电磁检测单元所检测信号进行融合处理时，采用加权平均法，且具体是特征级加权融合。

另外，由于步骤二中所提取的特征量较多，计算量大，因而需要从多个特征量中提取出主要特征量，即对特征进行约简。也就是说，步骤二中进行特征提取后，还需采用数据处理器2对所提取出的特征参数进行特征约简。粗糙集理论是一种很好的特征约简方法，在特征约简领域具有广泛的应用，提取出缺陷信号的主要特征，减少缺陷识别的特征量，以有效提高缺陷识别的速度。

实际进行特征约简时，可以采用以下常用的几种粗糙集属性约简方法：Pawlak属性约简算法、区别矩阵属性约简算法、属性重要度约简算法、信息熵属性约简算法和邻域粗糙集约简算法。对步骤二中所提取特征参数进行特征约简后，不仅大量降低数据维数，而且提高了分类精度。

本实施例中，结合图3，所述水平向电磁检测单元1-1和所述竖直向电磁检测单元1-2的数量均为多个且二者的数量相同。多个所述水平向电磁检测单元1-1布设在与被检测煤矿钢丝绳芯输送带的中心线相垂直的一条直线上，且多个所述竖直向电磁检测单元1-2布设在与被检测煤矿钢丝绳芯输送带的中心线相垂直的一条直线上。

步骤二中进行特征提取之后，所述数据处理器2调用多传感器数据融合处理模块，对多个所述水平向电磁检测单元1-1在同一采样时刻所检测信号进行融合处理，随后再对经融合处理后所获得的检测信号一进行特征提取；与此同时，所述数据处理器2调用多传感器数据融合处理模块，对多个所述竖直向电磁检测单元1-2在同一采样时刻所检测信号进行融合处理，随后再对经融合处理后所获得的检测信号二进行特征提取。

本实施例中，所述数据处理器2为ARM处理器。

另外，实际使用过程中，步骤一中所述的电磁检测单元也可以仅为对被检测煤矿钢丝绳芯输送带内水平方向上的剩磁进行实时检测的水平向电磁检测单元1-1，或者仅为对被检测煤矿钢丝绳芯输送带内竖直方向上的剩磁进行实时检测的竖直向电磁检测单元1-2。实际使用时，根据水平向电磁检测单元1-1与竖直向电磁检测单元1-2所检测信号的缺陷识别准确率，选择水平向电磁检测单元1-1或竖直向电磁检测单元1-2。

这样，步骤一中所获得的N组所述缺陷状态检测信息相应为N组水平向剩磁检测信息或N组竖直向剩磁检测信息。步骤二中进行特征提取时，相应只需对N组所述水平向剩磁检测信息或N组所述竖直向剩磁检测信息进行特征提取，相应获得经特征提取后的N组所述水平向剩磁检测信息或经特征提取后的N组所述竖直向剩磁检测信息。步骤三中获取训练样本集时，相应获得训练样本集一或训练样本集二。步骤四中进行分类优先级别确定时，按照步骤401至步骤405中所述的分类优先级别确定方法，分别对所述训练样本集一或所述训练样本集二中多个样本类的分类优先级别分别进行确定。步骤五进行多分类模型建立时，相应获得多分类模型一或多分类模型二。步骤六中进行多分类模型训练时，相应对所述多分类模型一或多分类模型二分别进行训练；步骤七中进行信号实时采集及同步分类时，相应对水平向电磁检测单元1-1或竖直向电磁检测单元1-2实时所检测信号进行同步分类。

以上所述，仅是本发明的较佳实施例，并非对本发明作任何限制，凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效结构变化，均仍属于本发明技术方案的保护范围内。

Claims

1.一种基于二叉树支持向量机的分类方法，其特征在于该方法包括以下步骤：

步骤一、信号采集：采用状态信息检测单元对被检测对象在N种不同工作状态时的工作状态信息分别进行实时检测，并将所检测信号同步传送至数据处理器(2)，相应获得与N种不同工作状态相对应的N组工作状态检测信息，N组所述工作状态检测信息中均包括所述状态信息检测单元在不同采样时刻检测到的多个检测信号，其中N为正整数且N≥3；

步骤二、特征提取：待数据处理器(2)接收到所述状态信息检测单元所传送的检测信号时，自各检测信号中分别提取出能代表并区别该检测信号的一组特征参数，且该组特征参数包括W个特征量，并对W个所述特征量进行编号，W个所述特征量组成一个特征向量，其中W≥2；

所述训练样本集中相应包括l个训练样本，其中m≥2，l＝m×N；l个所述训练样本分属于N种样本类，每一个样本类中均包括被检测对象工作于同一个工作状态时的m个训练样本，N种样本类分别为与被检测对象的N种不同工作状态相对应的样本类1、样本类2…样本类N；N种样本类中的每一个训练样本均记作X_ks，其中k为样本类的类别标号且k＝1、2…N，s为各样本类中所包括m个训练样本的样本序号且s＝1、2…m；X_ks为样本类k中第s个训练样本的特征向量，X_ks∈R^d，其中d为X_ks的向量维数且d＝W；

步骤四、分类优先级别确定，其确定过程如下：

步骤401、样本类的类中心计算：采用数据处理器(2)对N种所述样本类中任一个样本类k的类中心进行计算；

且对样本类k的类中心进行计算时，根据公式计算得出样本类k中所有训练样本的各特征量均值；式中k＝1、2…N，p＝1、2…d，X_ks(p)为样本类k中第s个训练样本的第p个特征量，为样本类k中所有训练样本的第p个特征量均值；

步骤402、类间距离计算：采用数据处理器(2)且根据公式对步骤201中所述任一个样本类k与N种所述样本类中任一个样本类h之间的间距分别进行计算，其中为样本类k中所有训练样本的第p个特征量均值，为样本类h中所有训练样本的第p个特征量均值，且h＝1、2…N；

步骤403、类间距之和计算：采用数据处理器(2)且根据公式对步骤401中所述任一个样本类k的类间距之和进行计算；

步骤405、按照步骤404中计算得出的所有样本类的类间距之和由大到小的顺序，采用数据处理器(2)确定出N种所述样本类的分类优先级别Y，其中Y＝1、2…N；其中，类间距之和最大的样本类的分类优先级别最高且其分类级别为1，类间距之和最大的样本类的分类优先级别最低且其分类级别为N；

步骤五、多分类模型建立：所建立的多分类模型包括N-1个二分类模型，且N-1个所述二分类模型均为支持向量机模型；N-1个所述二分类模型按照步骤405中所确定的分类优先级别，将N种所述样本类自所述训练样本集中由先至后逐类分出来，N-1个所述二分类模型的建立方法均相同且均采用数据处理器(2)进行建立；

所建立的二分类模型Z为待分类优先级别高于z的所有样本类自所述训练样本集中分出来后，将分类优先级别为z的样本类自所述训练样本集中剩余的N-z+1个样本类中分出来的二分类模型，其中z＝1、2…N-1，Z＝z；

步骤503、二分类模型分类优先级别设定：根据步骤502中所述二分类模型Z自所述训练样本集中剩余的N-z+1个样本类中分出来的样本类的分类优先级别z，对二分类模型Z的分类优先级别R进行设定，且R＝z；

2.按照权利要求1所述的一种基于二叉树支持向量机的分类方法，其特征在于：步骤三中获取训练样本的同时，还需分别在N组所述工作状态检测信息中随机抽取b个检测信号组成测试样本集；所述测试样本集中相应包括Q个测试样本，其中b≥2，Q＝b×N；Q个所述测试样本分属于N种所述样本类；步骤六中对所建立的多分类模型进行训练后，还需输入Q个所述测试样本，对所建立多分类模型的分类正确率进行测试。

3.按照权利要求1或2所述的一种基于二叉树支持向量机的分类方法，其特征在于：步骤一中N种所述不同工作状态为被检测对象发生故障时的多种不同故障状态或出现缺陷时的多种不同缺陷状态，且所述状态信息检测单元所检测信号为被检测对象发生故障时的故障信号或出现缺陷时的缺陷信号，步骤七中自动输出的被检测对象当前工作状态的类别为被检测对象当前发生的故障类别或当前出现的缺陷类别。

4.按照权利要求1或2所述的一种基于二叉树支持向量机的分类方法，其特征在于：步骤五中N-1个所述分类模型均为模糊支持向量机模型，且步骤三中进行训练样本获取时，N种样本类中的每一个训练样本中均包括模糊隶属度μ_ks，其中μ_ks为X_ks对其所属样本类k的模糊隶属度。

5.按照权利要求2所述的一种基于二叉树支持向量机的分类方法，其特征在于：步骤五中对模糊隶属度μ_ks进行确定时，采用模糊统计法、例证法、专家经验法、二元对比排序法或基于线性距离的隶属度函数进行确定。

6.按照权利要求1或2所述的一种基于二叉树支持向量机的分类方法，其特征在于：步骤202中计算得出样本类k与N种所述样本类中任一个样本类h之间的间距d_kh后，获得样本类k的类间距离数据；步骤204中多次重复步骤201至步骤203后，获得N种所述样本类的类间距离数据和类间距之和；随后，所述数据处理器(2)将N种所述样本类的类间距离数据组成一个类间距离对称矩阵D_k×k，且每一个所述样本类的类间距离数据位于类间距离对称矩阵D_k×k的同一行上；N种所述样本类的类间距之和分别为类间距离对称矩阵D_k×k中的各行数据之和，且类间距离对称矩阵D_k×k中的各行数据之和组成一个数组(Sumd(1)，Sumd(2)…Sumd(N))；

步骤2051、初始参数设定：对分类优先级别Y和样本总数n的初始值分别进行设定，其中分类优先级别Y＝0，样本总数n＝N；

步骤2052、比较数组(Sumd(1)，Sumd(2)…Sumd(N))中当前所有数据的大小，从中选出最大值Sumd(L)，其中L＝1、2…N，并将样本类L的分类优先级别为Y+1，且此时Y＝Y+1，n＝N-1；同时，将类间距离对称矩阵D_k×k中的第L行数据全部置0，将数组(Sumd(1)，Sumd(2)…Sumd(N))中的Sumd(L)置0；

步骤2053、多次重复步骤2052，直至n＝0为止。