CN110837871B - 一种基于特征组组合的传感器阵列优化及特征选择方法 - Google Patents

一种基于特征组组合的传感器阵列优化及特征选择方法 Download PDF

Info

Publication number
CN110837871B
CN110837871B CN201911102231.2A CN201911102231A CN110837871B CN 110837871 B CN110837871 B CN 110837871B CN 201911102231 A CN201911102231 A CN 201911102231A CN 110837871 B CN110837871 B CN 110837871B
Authority
CN
China
Prior art keywords
feature
feature group
group
score
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911102231.2A
Other languages
English (en)
Other versions
CN110837871A (zh
Inventor
孙彤
邹东尧
席广永
张建伟
钱慎一
任洁
肖林声
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University of Light Industry
Original Assignee
Zhengzhou University of Light Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University of Light Industry filed Critical Zhengzhou University of Light Industry
Priority to CN201911102231.2A priority Critical patent/CN110837871B/zh
Publication of CN110837871A publication Critical patent/CN110837871A/zh
Application granted granted Critical
Publication of CN110837871B publication Critical patent/CN110837871B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明公开了一种基于特征组组合的传感器阵列优化及特征选择方法,依次包括以下步骤:A:选择本传感器阵列特征提取方法及原始特征,建立特征集L0;B:得到特征组列表L1;C:按照特征组列表L1的顺序进行2元特征组选择;D:在2元特征组的基础上,依次得到4元特征组,8元特征组,……,及对应的4元特征组列表L4、8元特征组列表L8,……;E:假设当前应用场景需要8元特征组,则将8元特征组列表L8中第一个8元特征组L8(1)作为初始重要特征组I,其评分记为SI;然后对初始重要特征组I进行后向顺序去除操作,得到的最优特征组K。本发明能够有效选择出最佳特征及传感器组合,提高传感器阵列检测性能,降低传感器阵列使用成本。

Description

一种基于特征组组合的传感器阵列优化及特征选择方法
技术领域
本发明涉及一种传感器阵列优化及特征选择方法,尤其涉及一种基于特征组组合的传感器阵列优化及特征选择方法。
背景技术
目前,在使用传感器阵列进行检测时,需要针对具体检测场景进行传感器阵列优化和特征选择,不仅能够起到降低传感器阵列成本的作用,而且能够进一步提高传感器阵列的检测性能。但目前普遍采用的传感器阵列优化方法,均基于单个传感器进行优化操作,优化效果不理想。
发明内容
本发明的目的是提供一种基于特征组组合的传感器阵列优化及特征选择方法,能够有效选择出最佳特征及最佳传感器组合,从而提高传感器阵列检测性能,降低传感器阵列的使用成本。
本发明采用下述技术方案:
一种基于特征组组合的传感器阵列优化及特征选择方法,依次包括以下步骤:
A:对待选的传感器阵列特征提取方法进行识别性能评估,然后根据识别性能评估结果,选择识别性能高的若干种传感器阵列特征提取方法,作为本传感器阵列特征提取方法使用;并利用所选择的若干种本传感器阵列特征提取方法对传感器阵列进行特征提取,将所得到的传感器阵列特征作为原始特征,然后对原始特征进行标准化处理得到初始特征,并利用所得到的初始特征构成特征集L0;
B:在训练集上,对特征集L0中的每一个特征评分并进行降序排序,得到特征组列表L1;
C:按照特征组列表L1的顺序,分别经过初选步骤、排序步骤和再选步骤完成2元特征组选择;2元特征组即每个特征组含有2个特征;
D:在2元特征组的基础上,按照步骤C经过初选步骤、排序步骤和再选步骤3个步骤依次得到4元特征组,8元特征组,……,2n元特征组,n为自然数,直到达到应用中需求的特征数目为止,分别得到对应的4元特征组列表L4、8元特征组列表L8,……,2n元特征组列表L2n
E:假设当前应用场景需要8元特征组,则将8元特征组列表L8中第一个8元特征组L8(1)作为初始重要特征组I,其评分记为SI;然后对初始重要特征组I进行后向顺序去除操作,得到的最优特征组K,最优特征组K即为选择出的重要特征组,最优特征组K中的特征即为重要特征,重要特征对应的传感器即为最终优化的传感器阵列。
所述的步骤A中:采用传感器阵列的识别精度作为识别性能评价标准,对各种传感器特征提取方法进行逐一评价;选取识别精度高的若干种传感器阵列特征提取方法,识别精度按照多次随机划分数据集下的测试集平均识别率计算。
所述的步骤A中:
利用所选择的若干种本传感器阵列特征提取方法对传感器阵列进行特征提取,构成原始特征数据集X=[xi,j]p×n,其中,p代表特征维度,n代表样本个数,i是第i维特征,j是第j个样本,i,j均为自然数;按照公式(1)对原始特征数据集X进行标准化,得到标准化后的初始特征数据集
Figure BDA0002270204790000031
Figure BDA0002270204790000032
其中,xi,j是原始特征数据,
Figure BDA0002270204790000033
代表矩阵
Figure BDA0002270204790000034
中的元素,即标准化后的初始特征数据,i,j为矩阵
Figure BDA0002270204790000035
中的第i行和第j列,μi是第i维原始特征均值,σi是第i维原始特征标准差。
所述的步骤B中:对特征集L0中的每一个特征按照公式(2)计算其评分,然后按照得到的每个特征组的评分大小将特征组进行降序排列,得到特征组列表L1,L1(i)表示特征组列表L1中的第i个特征;
Figure BDA0002270204790000036
其中,f是输入的特征组所对应的数据,λk是对f进行LDA变换得到的第k个投影方向所对应的特征值,THF是设定的阈值,λ1为对f进行LDA变换得到的第1个投影方向所对应的特征值。
所述的步骤C包含以下具体步骤:
C1:初选步骤
用n1表示特征组列表L1中的特征组的数目,把特征组列表L1中的第1个特征组L1(1)作为1个选择特征组,特征组列表L1中其余的特征组依次作为第1个、第2个、……、第(n1-1)个备选特征组;将特征组列表L1中的第1个特征组L1(1)即选择特征组,分别与其他每一个备选特征组进行组合,然后按照公式(2)进行评分,评分最大的组合中所选择的备选特征组,与特征组列表L1中的第1个特征L1(1)即选择特征组,共同组成第1个2元特征组L2(1);
然后进行下一个2元特征组即L2(2)的确定;
如果特征组列表L1中的第2个特征L1(2)在C1步骤中没有被特征组列表L1中的第1个特征L1(1)选择,则取L1(2)作为1个选择特征组,然后按照步骤C1中同样的方法选择出备选特征组,共同组成第2个2元特征组L2(2);如果特征组列表L1中的第2个特征L1(2)在C1步骤中被特征组列表L1中的第1个特征L1(1)选择,则顺次取特征组列表L1中的第3个特征L1(3)作为1个选择特征组,然后按照步骤C1中同样的方法选择出备选特征组,共同组成第2个2元特征组L2(2);
以此类推,顺次选取下一个选择特征组和对应的备选特征组组成下一个2元特征组;在选取下一个选择特征组的过程中,若特征组列表L1中顺次选择的准备作为选择特征组的特征,已被特征组列表L1中的之前的其他特征所选择,则继续顺次选择特征组列表L1中的下一个特征,直至寻找到没有被特征组列表L1中的之前的其他特征所选择的特征作为下一个选择特征组,并选择出对应的备选特征组组成下一个2元特征组;
直到特征组列表L1中的所有特征,在选择特征组的选择过程中已顺次被全部判断选择过,最终得到n2个2元特征组列表L2,n2=[n1/2],[]表示向下取整,如果最终特征组列表L1中剩余一个特征,则将剩余的一个特征排除;
C2:排序步骤
按照公式(2)对2元特征组列表L2中的每一个2元特征组进行评分,并按照其评分对2元特征组列表L2中的2元特征组进行降序排列,得到新的2元特征组列表L2*;
C3:再选步骤
从新的2元特征组列表L2*中的第一个2元特征组L2*(1)开始,依次检查2元特征组L2*(1)在2元特征组列表L2和新的2元特征组列表L2*中排位的变化情况;如果新的2元特征组列表L2*中的某个特征组L2*(i)的排位i,相对于该特征组L2*(i)在2元特征组列表L2中的排序j有所上升,即i<j,则该特征组L2*(i)要对新的2元特征组列表L2*中位于特征组L2*(i)排位之后的每一个特征组L2*(k)进行评分检查,k>i,并将L2*(i)特征组和L2*(k)特征组中的特征进行重新安排;
评分检查具体包括如下2种情况的4个评分:
(1)交叉选择评分
①、令特征组L2*(i)中的选择特征组作为评分检查组合P1中的选择特征组,特征组L2*(k)的选择特征组作为评分检查组合P1中的备选特征组,按照公式(2)计算评分检查组合P1的评分;
②、令特征组L2*(i)中的选择特征组作为评分检查组合P2中的选择特征组,特征组L2*(k)的备选特征组作为评分检查组合P2中的备选特征组,按照公式(2)计算评分检查组合P2的评分;
(2)变异选择评分
③、令特征组L2*(i)中的备选特征组作为评分检查组合P3中的选择特征组,特征组L2*(k)的选择特征组作为评分检查组合P3中的备选特征组,按照公式(2)计算评分检查组合P3的评分;
④、令特征组L2*(i)中的备选特征组作为评分检查组合P4中的选择特征组,特征组L2*(k)的备选特征组作为评分检查组合P4中的备选特征组,按照公式(2)计算评分检查组合P4的评分;
如果上述2种评分检查操作中的4个评分中的最大评分比当前特征组L2*(i)的评分小,则检查特征组L2*(i)下一个的特征组;
如果上述2种评分检查操作中的4个评分中的最大评分比当前特征组L2*(i)的评分大,则按照如下规则对特征组L2*(i)和特征组L2*(k)进行重新安排,然后再检查特征组L2*(i)后一个的特征组;
(1)若评分①在评分检查中的4个评分中最大,并且大于当前特征组L2*(i)的评分,则用P1组合作为新的特征组L2*(i);然后,用原先特征组L2*(i)中的备选特征组作为选择特征组,原先L2*(k)的备选特征组作为备选特征组,构成新的特征组L2*(k);
(2)若评分②在评分检查中的4个评分中最大,并且大于当前特征组L2*(i)的评分,则用P2组合作为新的特征组L2*(i);然后,用原先特征组L2*(i)中的备选特征组作为选择特征组,原先特征组L2*(k)的选择特征组作为备选特征组,构成新的特征组L2*(k);
(3)若评分③在评分检查中的4个评分中最大,并且大于当前特征组L2*(i)的评分,则用P3组合作为新的特征组L2*(i);然后,用原先特征组L2*(i)中的选择特征组作为选择特征组,原先特征组L2*(k)的备选特征组作为备选特征组,构成新的特征组L2*(k);
(4)若评分④在评分检查中的4个评分中最大,并且大于当前特征组L2*(i)的评分,则用P4组合作为新的特征组L2*(i);然后,用原先特征组L2*(i)中的选择特征组作为选择特征组,原先特征组L2*(k)的选择特征组作为备选特征组,构成新的特征组L2*(k);
新的2元特征组列表L2*中的每一个2元特征组均检查结束之后,返回循环进行C2和C3步,直到当前的2元特征组的排位不再变化为止。
所述的步骤E中后向顺序去除操作包括以下步骤:
(1)依次去掉初始重要特征组I中的每一个特征,并按照公式(2)分别对剩余特征所组成的一个特征组进行评分,得到8组评分结果,然后取评分最大的特征组中所包含的7个特征得到7元特征组R;
(2)依次选择特征集L0中除R之外的每1个特征,和R分别组成一个待判定8元特征组,并按照公式(2)分别计算每一个待判定8元特征组的得分;得分中最大的得分记为S;如果S–SI>Δ,阈值Δ是根据实际需要确定的正数,则用得分S所对应的待判定8元特征组作为新的重要特征组I,并再次执行第(1)步和第(2)步,直至特征集L0中除R之外的每1个特征和R所组成8元待判定特征组均比较完毕;如果S–SI<Δ,则后向顺序去除操作结束;最终得到最大的S所对应的待判定8元特征组作为新的重要特征组I,即最优特征组K。
本发明提供一种基于特征组组合的传感器阵列优化及特征选择方法,能够有效选择出最佳特征及最佳传感器组合,从而提高传感器阵列检测性能,降低传感器阵列的使用成本。
附图说明
图1为本发明的流程示意图。
具体实施方式
以下结合附图和实施例对本发明作以详细的描述:
如图1所示,本发明所述的基于特征组组合的传感器阵列优化及特征选择方法,依次包括以下步骤:
A:对待选的传感器阵列特征提取方法进行识别性能评估,然后根据识别性能评估结果,选择识别性能高的若干种传感器阵列特征提取方法,作为本传感器阵列特征提取方法使用;并利用所选择的若干种本传感器阵列特征提取方法对传感器阵列进行特征提取,将所得到的传感器阵列特征作为原始特征,然后对原始特征进行标准化处理得到初始特征,并利用所得到初始特征构成特征集L0。
目前,常用的传感器特征包括最大值、差值、峰面积、最大斜率和相空间等。针对某种应用场景,需要对传感器阵列进行优化,即:降低所需传感器的数目以降低硬件成本,同时尽可能保持或者提高整个传感器阵列系统的性能。本发明中采用传感器阵列的识别精度(正确率)作为识别性能评价标准,用于评价各种传感器阵列特征提取方法和传感器阵列特征,以确定合适的本传感器阵列特征提取方法及特征。
本实施例中,在对传感器阵列进行优化之前,需要挑选出合适的传感器阵列特征提取方法,即:对各种传感器特征提取方法进行逐一评价,选取识别精度高的若干种传感器阵列特征提取方法。精度按照多次(100次以上)随机划分数据集下的测试集平均识别率计算。然后,用本申请所述的传感器阵列优化及特征选择方法,对由所选择的若干种本传感器阵列特征提取方法得到的特征数据集进行特征选择并完成阵列优化。假设样本数据集为D,有M1到M7共7种原始特征提取方法,首先分别使用这7种原始特征提取方法分别对样本数据集D进行特征提取,得到F1到F7共7个特征数据集。然后根据选定的分类模型C,分别在特征数据集F1到F7上进行随机测试。按照精度进行降序排列并选择前若干种传感器特征作为原始特征;同时,将选取的这若干种原始特征所对应的传感器阵列特征提取方法,作为本传感器阵列特征提取方法使用。
利用所选择的若干种本传感器阵列特征提取方法对传感器阵列进行特征提取,构成原始特征数据集X=[xi,j]p×n,其中,p代表特征维度,n代表样本个数,i是第i维特征,j是第j个样本,i,j均为自然数;按照公式(1)对原始特征数据集X进行标准化,得到初始特征数据集
Figure BDA0002270204790000091
Figure BDA0002270204790000092
其中,xi,j是原始特征数据,
Figure BDA0002270204790000093
代表矩阵
Figure BDA0002270204790000094
中的元素,即标准化后的初始特征数据,i,j为矩阵
Figure BDA0002270204790000095
中的第i行和第j列,μi是第i维原始特征均值,σi是第i维原始特征标准差;
利用所得到的初始特征构成特征集L0;
B:在训练集上,对特征集L0中的每一个特征评分并进行降序排序,得到特征组列表L1;
对特征集L0中的每一个特征按照公式(2)计算其评分。特征集L0中的每一个特征均为含有1个特征的1元特征组。然后按照得到的每个特征组的评分大小将特征组进行降序排列,得到特征组列表L1,L1(i)表示特征组列表L1中的第i个特征。
Figure BDA0002270204790000096
其中,f是输入的特征组所对应的数据(此处对应的是特征组列表L1的某个特征组所对应的数据),λk是对f进行LDA(Linear Discriminant Analysis:线性判决分析)变换得到的第k个投影方向所对应的特征值,即f的协方差矩阵做特征值分解后的第k个最大特征值,THF是设定的阈值,用于排除较低的特征值,λ1为对f进行LDA变换得到的第1个投影方向所对应的特征值,即f的协方差矩阵做特征值分解后的第1个最大特征值;
C:按照特征组列表L1的顺序,进行2元特征组选择;2元特征组即每个特征组含有2个特征。2元特征组选择过程依次包括初选步骤、重排序步骤和再次选择步骤3个步骤,具体过程如下:
C1:初选步骤
用n1表示特征组列表L1中的特征组的数目。把特征组列表L1中的第1个特征组L1(1)作为1个选择特征组,特征组列表L1中其余的特征组依次作为第1个、第2个、……、第(n1-1)个备选特征组。将特征组列表L1中的第1个特征组L1(1)即选择特征组,分别与其他每一个备选特征组进行组合,然后按照公式(2)进行评分,评分最大的组合中所选择的备选特征组,与特征组列表L1中的第1个特征L1(1)即选择特征组,共同组成第1个2元特征组L2(1)。
然后进行下一个2元特征组即L2(2)的确定;
如果特征组列表L1中的第2个特征L1(2)在C1步骤中没有被特征组列表L1中的第1个特征L1(1)选择,则取L1(2)作为1个选择特征组,然后按照步骤C1中同样的方法选择出备选特征组,共同组成第2个2元特征组L2(2);如果特征组列表L1中的第2个特征L1(2)在C1步骤中被特征组列表L1中的第1个特征L1(1)选择,则顺次取特征组列表L1中的第3个特征L1(3)作为1个选择特征组,然后按照步骤C1中同样的方法选择出备选特征组,共同组成第2个2元特征组L2(2);
以此类推,顺次选取下一个选择特征组和对应的备选特征组组成下一个2元特征组;在选取下一个选择特征组的过程中,若特征组列表L1中顺次选择的准备作为选择特征组的特征,已被特征组列表L1中的之前的其他特征所选择,则继续顺次选择特征组列表L1中的下一个特征,直至寻找到没有被特征组列表L1中的之前的其他特征所选择的特征作为下一个选择特征组,并选择出对应的备选特征组组成下一个2元特征组。
举例说明,若准备选取特征组列表L1中的第9个特征L1(9)作为1个选择特征组,而特征L1(9)在C1步骤中被特征组列表L1中之前的第7个特征L1(7)所选择,则顺次取特征组列表L1中的第10个特征L1(10)作为1个选择特征组,若特征L1(10)在C1步骤中没有被特征组列表L1中之前特征所选择,则确定特征L1(10)作为1个选择特征组,并选取对应的备选特征组组成下一个2元特征组,若特征L1(10)在C1步骤中被特征组列表L1中之前的特征如第5个特征L1(5)所选择,则顺次取特征组列表L1中的第11个特征L1(12)作为1个选择特征组,并继续判断。
直到特征组列表L1中的所有特征,在选择特征组的选择过程中已顺次被全部判断选择过,最终得到n2个2元特征组列表L2,n2=[n1/2],[]表示向下取整,如果最终特征组列表L1中剩余一个特征,则将剩余的一个特征排除。2元特征组列表L2中的每个2元特征组均由1个选择特征组和1个备选特征组构成。
C2:排序步骤
按照公式(2)对2元特征组列表L2中的每一个2元特征组进行评分,并按照其评分对2元特征组列表L2中的2元特征组进行降序排列,得到新的2元特征组列表L2*。
C3:再选步骤
从新的2元特征组列表L2*中的第一个2元特征组L2*(1)开始,依次检查2元特征组L2*(1)在2元特征组列表L2和新的2元特征组列表L2*中排位的变化情况;如果新的2元特征组列表L2*中的某个特征组L2*(i)的排位i,相对于该特征组L2*(i)在2元特征组列表L2中的排序j有所上升,即i<j,则该特征组L2*(i)要对新的2元特征组列表L2*中位于特征组L2*(i)排位之后的每一个特征组L2*(k)进行评分检查,k>i,并将L2*(i)特征组和L2*(k)特征组中的特征进行重新安排。
评分检查具体包括如下2种情况的4个评分:
(1)交叉选择评分
①、令特征组L2*(i)中的选择特征组作为评分检查组合P1中的选择特征组,特征组L2*(k)的选择特征组作为评分检查组合P1中的备选特征组,按照公式(2)计算评分检查组合P1的评分;
②、令特征组L2*(i)中的选择特征组作为评分检查组合P2中的选择特征组,特征组L2*(k)的备选特征组作为评分检查组合P2中的备选特征组,按照公式(2)计算评分检查组合P2的评分;
(2)变异选择评分
③、令特征组L2*(i)中的备选特征组作为评分检查组合P3中的选择特征组,特征组L2*(k)的选择特征组作为评分检查组合P3中的备选特征组,按照公式(2)计算评分检查组合P3的评分;
④、令特征组L2*(i)中的备选特征组作为评分检查组合P4中的选择特征组,特征组L2*(k)的备选特征组作为评分检查组合P4中的备选特征组,按照公式(2)计算评分检查组合P4的评分;
如果上述2种评分检查操作中的4个评分中的最大评分比当前特征组L2*(i)的评分小,则检查特征组L2*(i)后一个的特征组;
如果上述2种评分检查操作中的4个评分中的最大评分比当前特征组L2*(i)的评分大,则按照如下规则对特征组L2*(i)和特征组L2*(k)进行重新安排,然后再检查特征组L2*(i)后一个的特征组。
(1)若评分①在评分检查中的4个评分中最大,并且大于当前特征组L2*(i)的评分,则用P1组合作为新的特征组L2*(i);然后,用原先特征组L2*(i)中的备选特征组作为选择特征组,原先L2*(k)的备选特征组作为备选特征组,构成新的特征组L2*(k);
(2)若评分②在评分检查中的4个评分中最大,并且大于当前特征组L2*(i)的评分,则用P2组合作为新的特征组L2*(i);然后,用原先特征组L2*(i)中的备选特征组作为选择特征组,原先特征组L2*(k)的选择特征组作为备选特征组,构成新的特征组L2*(k);
(3)若评分③在评分检查中的4个评分中最大,并且大于当前特征组L2*(i)的评分,则用P3组合作为新的特征组L2*(i);然后,用原先特征组L2*(i)中的选择特征组作为选择特征组,原先特征组L2*(k)的备选特征组作为备选特征组,构成新的特征组L2*(k);
(4)若评分④在评分检查中的4个评分中最大,并且大于当前特征组L2*(i)的评分,则用P4组合作为新的特征组L2*(i);然后,用原先特征组L2*(i)中的选择特征组作为选择特征组,原先特征组L2*(k)的选择特征组作为备选特征组,构成新的特征组L2*(k);
新的2元特征组列表L2*中的每一个2元特征组均检查结束之后,返回循环进行C2和C3步,直到当前的2元特征组的排位不再变化为止。
D:在2元特征组的基础上,按照步骤C1至C3,经过初选步骤、排序步骤和再选步骤3个步骤依次得到4元特征组,8元特征组,……,2n元特征组,n为自然数,直到达到应用中需求的特征数目为止,其中,由于4元特征组选择过程中,在C1步骤中所选择的选择特征组和备选特征组均各自包含两个特征,因此经步骤C2及步骤C3最终得到的特征组包括四个特征,即为4元特征组,同理,得到8元特征组,……,2n元特征组,分别得到对应的4元特征组列表L4、8元特征组列表L8,……,2n元特征组列表L2n
E:假设当前应用场景需要8元特征组,则将8元特征组列表L8中第一个8元特征组L8(1)作为初始重要特征组I,其评分记为SI。然后对I进行后向顺序去除操作,具体做法如下:
(1)依次去掉初始重要特征组I中的每一个特征,并按照公式(2)分别对剩余特征所组成的一个特征组进行评分,得到8组评分结果,然后取评分最大的特征组中所包含的7个特征得到7元特征组R;
(2)依次选择特征集L0中除R之外的每1个特征,和R分别组成一个待判定8元特征组,并按照公式(2)分别计算每一个待判定8元特征组的得分。得分中最大的得分记为S。如果S–SI>Δ,阈值Δ是根据实际需要确定的正数,则用得分S所对应的待判定8元特征组作为新的重要特征组I,并再次执行第(1)步和第(2)步,直至特征集L0中除R之外的每1个特征和R所组成8元待判定特征组均比较完毕;如果S–SI<Δ,则后向顺序去除操作结束;最终得到最大的S所对应的待判定8元特征组作为新的重要特征组I,即最优特征组K。
最终得到的最优特征组K即为算法选择出的重要特征组。该特征组中的特征即为重要特征,这些特征对应的传感器即为最终优化的传感器阵列。
以下结合具体实施例对本发明做出进一步阐述:
实施例:
现有包含30个传感器的原始传感器阵列(传感器分别编号1到30),要通过气味检测来识别新鲜肉类和腐败肉类。为此,共采集到数据样本600个(其中新鲜肉类样本300个,腐败肉类样本300个),每个数据样本都包含了30个传感器响应曲线。初选最大值、峰面积、最大差值、最大斜率共4种特征提取方法。优化目标为:将30个传感器优化至不超过8个传感器。
A:首先评估各种特征提取方法的性能,即:分别用每一种特征提取方法单独提取特征送入SVM分类器进行新鲜肉类和腐败肉类的判别。各方法最好的识别结果为:最大值法的识别率为81%,峰面积法的识别率为75%,最大差值法的识别率为78%,最大斜率法的识别率为61%。由于最大斜率法的识别相对其他3种较低,因此将其排除。同时,利用最大值、峰面积和最大差值法从每个传感器响应曲线上提取出特征,每种特征提取方法均在一条响应曲线上提取出1个实数特征;
利用步骤A中选择的每种特征提取方法对每个传感器提取特征,分别表示为一个90×1的向量,600个数据样本提取出的原始特征数据集为X=[xi,j]90×600,其中每一行代表一个原始特征变量的观测值,每一列代表一个样本;将上述原始特征经标准化处理得到初始特征,并利用初始特征得到特征集L0;
B:在训练集上,对特征集L0中的每一个特征评分并进行降序排序,得到特征组列表L1;
C:按照列表L1的顺序,经过初选步骤、排序步骤和再选步骤3个步骤依次进行2元特征组选择。
D:在2元特征组的基础上,经过初选步骤、排序步骤和再选步骤3个步骤依次得到4元特征组,8元特征组,……,2n元特征组,并得到对应的4元特征组列表L4、8元特征组列表L8,……,2n元特征组列表L2n
E:对I进行后向顺序去除,得到重要特征组K,K对应的8个特征情况如表1所示。从表1可知,当前8个特征对应7个传感器:4号,10号,13号,18号,21号,25号,26号。这7个传感器就是最终的阵列优化结果,7个传感器对应的这8种特征就是最终选择的特征。
表1-8元组特征情况表
Figure BDA0002270204790000161

Claims (4)

1.一种基于特征组组合的传感器阵列优化及特征选择方法,其特征在于,依次包括以下步骤:
A:对待选的传感器阵列特征提取方法进行识别性能评估,然后根据识别性能评估结果,选择识别性能高的若干种传感器阵列特征提取方法,作为本传感器阵列特征提取方法使用;并利用所选择的若干种本传感器阵列特征提取方法对传感器阵列进行特征提取,将所得到的传感器阵列特征作为原始特征,然后对原始特征进行标准化处理得到初始特征,并利用所得到的初始特征构成特征集L0;
B:在训练集上,对特征集L0中的每一个特征评分并进行降序排序,得到特征组列表L1;
所述的步骤B中:对特征集L0中的每一个特征按照公式(2)计算其评分,然后按照得到的每个特征组的评分大小将特征组进行降序排列,得到特征组列表L1;
Figure 495155DEST_PATH_IMAGE001
(2)
其中,f是输入的特征组所对应的数据,
Figure 639698DEST_PATH_IMAGE002
是对f进行LDA变换得到的第
Figure 501343DEST_PATH_IMAGE003
个投影方向所对应的特征值,THF是设定的阈值,
Figure 161081DEST_PATH_IMAGE004
为对f进行LDA变换得到的第1个投影方向所对应的特征值;
C:按照特征组列表L1的顺序,分别经过初选步骤、排序步骤和再选步骤完成2元特征组选择;2元特征组即每个特征组含有2个特征;
所述的步骤C包含以下具体步骤:
C1:初选步骤
用 n1表示特征组列表L1中的特征组的数目,把特征组列表L1中的第1个特征组L1(1)作为1个选择特征组,特征组列表L1中其余的特征组依次作为第1个、第2个、……、第(n1-1)个备选特征组;将特征组列表L1中的第1个特征组L1(1)即选择特征组,分别与其他每一个备选特征组进行组合,然后按照公式(2)进行评分,评分最大的组合中所选择的备选特征组,与特征组列表L1中的第1个特征L1(1) 即选择特征组,共同组成第1个2元特征组L2(1);
然后进行下一个2元特征组即L2(2)的确定;
如果特征组列表L1中的第2个特征L1(2)在C1步骤中没有被特征组列表L1中的第1个特征L1(1)选择,则取L1(2)作为1个选择特征组,然后按照步骤C1中同样的方法选择出备选特征组,共同组成第2个2元特征组L2(2);如果特征组列表L1中的第2个特征L1(2)在C1步骤中被特征组列表L1中的第1个特征L1(1)选择,则顺次取特征组列表L1中的第3个特征L1(3)作为1个选择特征组,然后按照步骤C1中同样的方法选择出备选特征组,共同组成第2个2元特征组L2(2);
以此类推,顺次选取下一个选择特征组和对应的备选特征组组成下一个2元特征组;在选取下一个选择特征组的过程中,若特征组列表L1中顺次选择的准备作为选择特征组的特征,已被特征组列表L1中的之前的其他特征所选择,则继续顺次选择特征组列表L1中的下一个特征,直至寻找到没有被特征组列表L1中的之前的其他特征所选择的特征作为下一个选择特征组,并选择出对应的备选特征组组成下一个2元特征组;
直到特征组列表L1中的所有特征,在选择特征组的选择过程中已顺次被全部判断选择过,最终得到n2个2元特征组列表L2,n2=[n1/ 2] ,[ ]表示向下取整,如果最终特征组列表L1中剩余一个特征,则将剩余的一个特征排除;
C2:排序步骤
按照公式(2)对2元特征组列表L2中的每一个2元特征组进行评分,并按照其评分对2元特征组列表L2中的2元特征组进行降序排列,得到新的2元特征组列表L2*;
C 3:再选步骤
从新的2元特征组列表L2*中的第一个2元特征组L2*(1)开始,依次检查2元特征组L2*(1)在2元特征组列表L2和新的2元特征组列表L2*中排位的变化情况;如果新的2元特征组列表L2*中的某个特征组L2*(i)的排位i,相对于该特征组L2*(i)在2元特征组列表L2中的排序j有所上升,即i<j,则该特征组L2*(i)要对新的2元特征组列表L2*中位于特征组L2*(i)排位之后的每一个特征组L2*(k)进行评分检查,k>i,并将L2*(i)特征组和L2*(k)特征组中的特征进行重新安排;
评分检查具体包括如下2种情况的4个评分:
(1)交叉选择评分
①、令特征组L2*(i)中的选择特征组作为评分检查组合P1中的选择特征组,特征组L2*(k)的选择特征组作为评分检查组合P1中的备选特征组,按照公式(2)计算评分检查组合P1的评分;
②、令特征组L2*(i)中的选择特征组作为评分检查组合P2中的选择特征组,特征组L2*(k)的备选特征组作为评分检查组合P2中的备选特征组,按照公式(2)计算评分检查组合P2的评分;
(2)变异选择评分
③、令特征组L2*(i)中的备选特征组作为评分检查组合P3中的选择特征组,特征组L2*(k)的选择特征组作为评分检查组合P3中的备选特征组,按照公式(2)计算评分检查组合P3的评分;
④、令特征组L2*(i)中的备选特征组作为评分检查组合P4中的选择特征组,特征组L2*(k)的备选特征组作为评分检查组合P4中的备选特征组,按照公式(2)计算评分检查组合P4的评分;
如果上述2种评分检查操作中的4个评分中的最大评分比当前特征组L2*(i)的评分小,则检查特征组L2*(i)下一个的特征组;
如果上述2种评分检查操作中的4个评分中的最大评分比当前特征组L2*(i)的评分大,则按照如下规则对特征组L2*(i)和特征组L2*(k)进行重新安排,然后再检查特征组L2*(i)后一个的特征组;
(1)若评分①在评分检查中的4个评分中最大,并且大于当前特征组L2*(i)的评分,则用P1组合作为新的特征组L2*(i);然后,用原先特征组L2*(i)中的备选特征组作为选择特征组,原先L2*(k)的备选特征组作为备选特征组,构成新的特征组L2*(k);
(2)若评分②在评分检查中的4个评分中最大,并且大于当前特征组L2*(i)的评分,则用P2组合作为新的特征组L2*(i);然后,用原先特征组L2*(i)中的备选特征组作为选择特征组,原先特征组L2*(k)的选择特征组作为备选特征组,构成新的特征组L2*(k);
(3)若评分③在评分检查中的4个评分中最大,并且大于当前特征组L2*(i)的评分,则用P3组合作为新的特征组L2*(i);然后,用原先特征组L2*(i)中的选择特征组作为选择特征组,原先特征组L2*(k)的备选特征组作为备选特征组,构成新的特征组L2*(k);
(4)若评分④在评分检查中的4个评分中最大,并且大于当前特征组L2*(i)的评分,则用P4组合作为新的特征组L2*(i);然后,用原先特征组L2*(i)中的选择特征组作为选择特征组,原先特征组L2*(k)的选择特征组作为备选特征组,构成新的特征组L2*(k);
新的2元特征组列表L2*中的每一个2元特征组均检查结束之后,返回循环进行C2和C3步,直到当前的2元特征组的排位不再变化为止;
D:在2元特征组的基础上,按照步骤C经过初选步骤、排序步骤和再选步骤3个步骤依次得到4元特征组,8元特征组,……,2n元特征组,n为自然数,直到达到应用中需求的特征数目为止,分别得到对应的4元特征组列表L4、8元特征组列表L8,……,2n元特征组列表L2n
E:假设当前应用场景需要8元特征组,则将8元特征组列表L8中第一个8元特征组L8(1)作为初始重要特征组I,其评分记为SI;然后对初始重要特征组I进行后向顺序去除操作,得到的最优特征组K,最优特征组K即为选择出的重要特征组,最优特征组K中的特征即为重要特征,重要特征对应的传感器即为最终优化的传感器阵列。
2.根据权利要求1所述的基于特征组组合的传感器阵列优化及特征选择方法,其特征在于,所述的步骤A中:采用传感器阵列的识别精度作为识别性能评价标准,对各种传感器特征提取方法进行逐一评价;选取识别精度高的若干种传感器阵列特征提取方法,识别精度按照多次随机划分数据集下的测试集平均识别率计算。
3.根据权利要求1所述的基于特征组组合的传感器阵列优化及特征选择方法,其特征在于,所述的步骤A中:
利用所选择的若干种本传感器阵列特征提取方法对传感器阵列进行特征提取,构成原始特征数据集
Figure 981139DEST_PATH_IMAGE005
,其中,p代表特征维度,
Figure 347398DEST_PATH_IMAGE006
代表样本个数,
Figure 888101DEST_PATH_IMAGE007
是第
Figure 921785DEST_PATH_IMAGE007
维特征,
Figure 381585DEST_PATH_IMAGE008
是第
Figure 500719DEST_PATH_IMAGE008
个样本,
Figure 969747DEST_PATH_IMAGE007
Figure 592358DEST_PATH_IMAGE008
均为自然数;按照公式(1)对原始特征数据集X进行标准化,得到标准化后的初始特征数据集
Figure 629584DEST_PATH_IMAGE009
Figure 704856DEST_PATH_IMAGE010
(1);
其中,
Figure 977575DEST_PATH_IMAGE011
是原始特征数据,
Figure 454693DEST_PATH_IMAGE012
代表矩阵
Figure 787454DEST_PATH_IMAGE013
中的元素,即标准化后的初始特征数据,
Figure 615601DEST_PATH_IMAGE014
也表示矩阵
Figure 160852DEST_PATH_IMAGE013
中的第
Figure 899001DEST_PATH_IMAGE007
行和第
Figure 148803DEST_PATH_IMAGE008
列,
Figure 464247DEST_PATH_IMAGE015
是第
Figure 78768DEST_PATH_IMAGE007
维原始特征均值,
Figure 530478DEST_PATH_IMAGE016
是第
Figure 939462DEST_PATH_IMAGE007
维原始特征标准差。
4.根据权利要求3所述的基于特征组组合的传感器阵列优化及特征选择方法,其特征在于,所述的步骤E中后向顺序去除操作包括以下步骤:
(1)依次去掉初始重要特征组I中的每一个特征,并按照公式(2)分别对剩余特征所组成的一个特征组进行评分,得到8组评分结果,然后取评分最大的特征组中所包含的7个特征得到7元特征组R;
(2)依次选择特征集L0中除R之外的每一个特征,和R分别组成一个待判定8元特征组,并按照公式(2)分别计算每一个待判定8元特征组的得分;得分中最大的得分记为S;如果S– SI > Δ,阈值Δ是根据实际需要确定的正数,则用得分S所对应的待判定8元特征组作为新的重要特征组I,并再次执行第(1)步和第(2)步,直至特征集L0中除R之外的每一 个特征和R所组成8元待判定特征组均比较完毕;如果S – SI <Δ,则后向顺序去除操作结束;最终得到最大的S所对应的待判定8元特征组作为新的重要特征组I,即最优特征组K。
CN201911102231.2A 2019-11-12 2019-11-12 一种基于特征组组合的传感器阵列优化及特征选择方法 Active CN110837871B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911102231.2A CN110837871B (zh) 2019-11-12 2019-11-12 一种基于特征组组合的传感器阵列优化及特征选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911102231.2A CN110837871B (zh) 2019-11-12 2019-11-12 一种基于特征组组合的传感器阵列优化及特征选择方法

Publications (2)

Publication Number Publication Date
CN110837871A CN110837871A (zh) 2020-02-25
CN110837871B true CN110837871B (zh) 2021-12-28

Family

ID=69574813

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911102231.2A Active CN110837871B (zh) 2019-11-12 2019-11-12 一种基于特征组组合的传感器阵列优化及特征选择方法

Country Status (1)

Country Link
CN (1) CN110837871B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109002859A (zh) * 2018-07-25 2018-12-14 郑州轻工业学院 基于主成分分析的传感器阵列特征选择和阵列优化方法
CN109447130A (zh) * 2018-09-30 2019-03-08 江苏大学 一种基于可视化气敏阵列的哈败腊肉检测装置与方法
CN209085657U (zh) * 2017-08-02 2019-07-09 强力物联网投资组合2016有限公司 用于与化工生产工艺有关的或工业环境的数据收集系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11511156B2 (en) * 2016-03-12 2022-11-29 Arie Shavit Training system and methods for designing, monitoring and providing feedback of training
JP6809128B2 (ja) * 2016-10-24 2021-01-06 富士通株式会社 画像処理装置、画像処理方法、および画像処理プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN209085657U (zh) * 2017-08-02 2019-07-09 强力物联网投资组合2016有限公司 用于与化工生产工艺有关的或工业环境的数据收集系统
CN109002859A (zh) * 2018-07-25 2018-12-14 郑州轻工业学院 基于主成分分析的传感器阵列特征选择和阵列优化方法
CN109447130A (zh) * 2018-09-30 2019-03-08 江苏大学 一种基于可视化气敏阵列的哈败腊肉检测装置与方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Sensor Array Optimization for Mobile Electronic Nose:Wavelet Transform and Filter Based Feature Selection Approach;Dedy Rahman Wijaya 等;《ResearchGate》;20160831;第659-671页 *
Sensor Array Optimization of Electronic Nose for Detection of Bacteria in Wound Infection;Hao Sun 等;《IEEE》;20170930;第7350-7358页 *
基于传感器阵列多特征优化融合的茶叶品质检测研究;张红梅 等;《传感器学报》;20180331;第491-496页 *

Also Published As

Publication number Publication date
CN110837871A (zh) 2020-02-25

Similar Documents

Publication Publication Date Title
Hu et al. Deep learning for use in lumber classification tasks
CN109002859B (zh) 基于主成分分析的传感器阵列特征选择和阵列优化方法
CN110657985B (zh) 基于奇异值谱流形分析的齿轮箱故障诊断方法及系统
CN108960319A (zh) 一种面向全局的机器阅读理解建模中的候选答案筛选方法
CN108491864B (zh) 基于自动确定卷积核大小卷积神经网络的高光谱图像分类
CN111079283B (zh) 对信息饱和度不均衡数据的处理方法
CN106708943A (zh) 一种基于排列融合的图像检索重排序方法及系统
CN101980251A (zh) 二叉树多类支持向量机遥感分类方法
CN103440508A (zh) 基于视觉词袋模型的遥感图像目标识别方法
CN107766695B (zh) 一种获取外周血基因模型训练数据的方法及装置
CN106951728B (zh) 一种基于粒子群优化和打分准则的肿瘤关键基因识别方法
CN110837871B (zh) 一种基于特征组组合的传感器阵列优化及特征选择方法
CN111985550B (zh) 基于Gap度量下的工业化工数据预处理的分类方法
CN117079226A (zh) 一种基于多尺度注意力机制的车辆重识别方法
CN112488188A (zh) 一种基于深度强化学习的特征选择方法
KR100464062B1 (ko) 패턴 분류 방법 및 그 장치, 및 컴퓨터에 의해 읽기가능한 기억매체
Kang et al. CST-YOLO: A Novel Method for Blood Cell Detection Based on Improved YOLOv7 and CNN-Swin Transformer
JP6831221B2 (ja) 学習装置及び学習方法
CN105117607B (zh) 一种基于化学计量学方法对不同质量的大曲分类的方法
CN110826640B (zh) 一种无监督式的传感器阵列干扰特征去除方法
CN111709440A (zh) 基于FSA-Choquet模糊积分的特征选择方法
CN110992334A (zh) 用于dcgan网络生成图像的质量评估方法
CN110852355B (zh) 一种基于knn的标签数据分类方法
Dhivya et al. An Automated Plant Leaf Diseases Classification using AKMC and AKNN Machine Learning Techniques
CN107527061B (zh) 基于归一化多维互信息和克隆选择的高光谱波段选择方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant