CN109598275A - 特征选择装置、方法及电子设备 - Google Patents
特征选择装置、方法及电子设备 Download PDFInfo
- Publication number
- CN109598275A CN109598275A CN201710914975.9A CN201710914975A CN109598275A CN 109598275 A CN109598275 A CN 109598275A CN 201710914975 A CN201710914975 A CN 201710914975A CN 109598275 A CN109598275 A CN 109598275A
- Authority
- CN
- China
- Prior art keywords
- feature
- information gain
- conditional
- selection
- selecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000004364 calculation method Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 5
- 238000003909 pattern recognition Methods 0.000 abstract description 23
- 230000003247 decreasing effect Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 22
- 238000013459 approach Methods 0.000 description 12
- 230000008901 benefit Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 241000287196 Asthenes Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种特征选择装置、方法及电子设备,根据待选择特征与已选择特征的条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定待选择特征的选择结果,将选择出的特征用于模式识别,能够使得区分模式种类的能力最大化以保证模式识别的高精度,同时,能够减少选择出的特征之间的冗余度,从而,能够进一步降低特征维度以降低计算量,从而提高了模式识别的实时性。
Description
技术领域
本发明涉及信息技术领域,尤其涉及一种特征选择装置、方法及电子设备。
背景技术
近年来,模式识别在各个领域应用广泛。模式识别包括人体动作识别、语音识别、指纹识别、人脸识别等。例如,人体动作识别在医疗健康、智能看护、动作捕捉等领域具有广泛的应用。人体动作识别可基于视频影像或基于集成了惯性传感单元(IMU,Inertialmeasurement unit)的可穿戴设备来进行特征提取,进一步通过模式识别算法进行动作类型的判别。
在模式识别系统中,进行特征提取时一般提取的特征维度较大,例如,对于基于IMU可穿戴设备的特征提取,提取的特征维度可达数百个;但是,模式识别的精度并不是特征维度越大精度越高,相反,过高的维度可能会产生维度灾难而导致识别精度下降,计算复杂度也大大提高,降低了识别的实时性。
目前,一般通过传统的降维方法或者基于信息论的信息增益方法来选择特征。传统的降维方法主要包括主成分分析(PCA,Principal component analysis)和基于Fisher准则的线性判别分析(LDA,linear discriminant analysis)。其中,PCA降维方法通过将原特征进行线性变换映射至低维空间来尽可能的代表原始高维特征空间;LDA降维方法选择主要特征能够使类内离散度最小,类间离散度最大,数据线性可分。而基于信息论的信息增益方法通过计算特征对模式种类的分类的信息不确定度的减少量来提取特征。
应该注意,上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
发明人发现,传统的PCA降维方法所选择的特征集能最大化单个特征对模式种类的区分能力,但所选特征之间还具有一定的冗余性;LDA降维方法能够将冗余的特征进行消除,但不能消除一些对模式种类区分能力弱的特征,这些特征将会对模式识别产生干扰而降低性能;而基于信息论的信息增益方法选择出的特征之间仍然存在冗余,使得选择出的特征对于模式的分类具有重复性。
本发明实施例提供一种特征选择装置、方法及电子设备,根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,其中,根据待选择特征与已选择特征的条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定待选择特征的选择结果,将选择出的特征用于模式识别,能够使得区分模式种类的能力最大化以保证模式识别的高精度,同时,能够减少选择出的特征之间的冗余度,从而,能够进一步降低特征维度以降低计算量,从而提高了模式识别的实时性。
根据本发明实施例的第一方面,提供一种特征选择装置,所述装置包括:计算单元,其用于计算待选择的各个特征的条件信息增益;选择单元,其用于根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,其中,所述选择单元计算待选择特征与已选择特征的条件互信息增益,并根据所述条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定所述待选择特征的选择结果。
根据本发明实施例的第二方面,提供一种电子设备,包括根据本发明实施例的第一方面所述的装置。
根据本发明实施例的第三方面,提供一种特征选择方法,所述方法包括:计算待选择的各个特征的条件信息增益;根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,其中,计算待选择特征与已选择特征的条件互信息增益,并根据所述条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定所述待选择特征的选择结果。
本发明的有益效果在于:根据待选择特征与已选择特征的条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定待选择特征的选择结果,将选择出的特征用于模式识别,能够使得区分模式种类的能力最大化以保证模式识别的高精度,同时,能够减少选择出的特征之间的冗余度,从而,能够进一步降低特征维度以降低计算量,从而提高了模式识别的实时性。
参照后文的说明和附图,详细公开了本发明的特定实施方式,指明了本发明的原理可以被采用的方式。应该理解,本发明的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本发明的实施方式包括许多改变、修改和等同。
针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。
附图说明
所包括的附图用来提供对本发明实施例的进一步的理解,其构成了说明书的一部分,用于例示本发明的实施方式,并与文字描述一起来阐释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例1的特征选择装置的示意图;
图2是本发明实施例1的选择单元102的示意图;
图3是本发明实施例1的第一选择单元201的示意图;
图4是本发明实施例1的第二选择单元202的示意图;
图5是本发明实施例2的电子设备的示意图;
图6是本发明实施例2的电子设备的系统构成的示意框图;
图7是本发明实施例3的特征选择方法的示意图;
图8是本发明实施例3的特征选择方法的另一示意图;
图9是本发明实施例3的特征选择方法的又一示意图。
具体实施方式
参照附图,通过下面的说明书,本发明的前述以及其它特征将变得明显。在说明书和附图中,具体公开了本发明的特定实施方式,其表明了其中可以采用本发明的原则的部分实施方式,应了解的是,本发明不限于所描述的实施方式,相反,本发明包括落入所附权利要求的范围内的全部修改、变型以及等同物。
实施例1
本实施例提供一种特征选择装置,图1是本发明实施例1的特征选择装置的示意图。如图1所示,特征选择装置100包括:
计算单元101,其用于计算待选择的各个特征的条件信息增益;
选择单元102,其用于根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,其中,选择单元102计算待选择特征与已选择特征的条件互信息增益,并根据该条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定该待选择特征的选择结果。
在本实施例中,该特征选择装置可用于各种模式识别系统,将由该特征选择装置选择出的特征用于模式识别系统中的分类和识别。在本实例中,以动作识别系统为例进行示例性的说明。
由上述实施例可知,根据待选择特征与已选择特征的条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定待选择特征的选择结果,将选择出的特征用于模式识别,能够使得区分模式种类的能力最大化以保证模式识别的高精度,同时,能够减少选择出的特征之间的冗余度,从而,能够进一步降低特征维度以降低计算量,从而提高了模式识别的实时性。
在本实施例中,待选择的各个特征可以根据需要识别的模式种类而确定。例如,将所有模式种类的集合设为Y={y1,y2,…,yN},N为大于1的整数。然后从测试数据中提取特征作为待选择特征,假设提取的各特征总集合即待选择特征的总集合为X={x1,x2,…,xM},M为大于1的整数。
例如,对于人体动作识别,需要识别的动作种类可以包括站、走、坐、躺、摔等。针对这些动作种类,分别进行测试并提取测试数据,然后从测试数据中提取特征。例如,提取的特征可以包括信号的频域、时域特征,例如频域幅值特性、时域峰值、均值、方差、积分等特征。
在本实施例中,该特征选择装置100还可以包括:
归一化单元103,其用于在计算该条件信息增益之前,对待选择的各个特征进行归一化处理。
例如,对于第i个特征xi,i∈{1,2,…,M},根据所有动作种类的该特征数据进行归一化,例如可采用线性归一化,即从特征xi中统计xi的值域中的最大值和最小值即然后根据以下的公式(1)进行归一化:
其中,为第i个特征xi的值域和分别为值域中的最大值和最小值。
这样,通过归一化处理,有利于进行信息增益的计算以及模式识别算法的训练。
在本实施例中,计算单元101用于计算待选择的各个特征的条件信息增益。以下对其计算方法进行示例性的说明。
首先,对各个模式种类yn,n∈{1,2,…,N},统计测试样本次数βn,则模式种类为Yn的概率为则整个测试样本下的所有模式种类的信息熵可以用以下的公式(2)表示:
其中,H(Y)表示模式种类集Y的信息熵,Pr(yn)表示模式种类为yn的概率。
然后,对M个特征中的第i个特征xi的样本进行统计,例如,归一化后其值域在[0,1]之间。其中,样本量统计可按值域的多区间或单值进行统计。
例如,按值域的多区间进行统计时,将在值域[0,1]划分为J个子区间,例如,J=10,子区间间隔0.1,即[0,0.1],(0.1,0.2],…,(0.9,1],然后按子区间统计各样本个数。
例如,按值域的单值进行统计时,统计样本的所有的可能值,然后按照此所有值依次统计样本个数。
在本实施例中,可以按照测试样本的值域的多个区间进行样本统计,这样能够有效减小计算量。
在本实施例中,在进行样本统计后,可以使用现有方法计算特征的条件信息增益,例如,可以根据以下的公式(3)计算特征的条件信息增益:
InfoGain(x;;Y)=H(Y)-H(Y|xi) (3)
其中,InfoGain(xi;Y)表示特征xi对于作为条件的模式种类集Y的信息增益,H(Y)表示模式种类集Y的信息熵,H(Y|xi)表示在特征xi下对作为条件的种类集Y的条件熵。
在本实施例中,H(Y)可以通过以上的公式(2)计算得出,而H(Y|xi)可以根据以下的公式(4)-(6)进行计算:
其中,(Y|xi)表示在特征xi下对作为条件的种类集Y的条件熵,表示模式种类为yn,特征时的联合概率值,表示在观测特征xi值为时判断为类型yn的后验概率,表示模式种类yn中特征xi的值为的样本数量,Num(Y,xi)表示所有动作种类中特征xi所有值的样本总量,表示为在模式种类为yn时,特征xi的值为的概率,Pr(yn)表示模式种类为yn的概率,表示在所有模式种类的测试样本中特征xi的值为的概率。
在本实施例中,在计算单元101计算出待选择的各个特征的条件信息增益之后,选择单元102根据该条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择。
以下对选择单元102结构以及具体的选择方法进行示例性的说明。
图2是本发明实施例1的选择单元102的示意图。如图2所示,选择单元102包括:
第一选择单元201,其用于对待选择特征进行聚类,依次确定每个类具有的特征。
图3是本发明实施例1的第一选择单元201的示意图。如图3所示,第一选择单元201包括:
第一确定单元301,其用于将未被聚类的待选择特征中具有最大的条件信息增益的特征作为该类的第一特征;
第二确定单元302,其用于分别计算该第一特征与未被聚类的其他待选择特征之间的条件互信息增益,当该条件互信息增益与该第一特征的条件信息增益之差小于或等于预设阈值时,将该其他待选择特征确定为属于该类;
第三确定单元303,其用于当该聚类的聚类结果中类的数量Q大于或等于预设的特征选择数量K时,按照该类的顺序从K个类中分别选择具有最大的该条件信息增益的特征作为选择的K个特征,K和Q均为正整数。
例如,从未被聚类的待选择特征中选择具有最大信息增益的特征作为第k类的第一个特征初始k=1;从剩余的未被聚类的特征集中依次计算与的条件互信息增益xj为未被聚类的待选择特征中的特征;当 时,则将特征xj归并为第k类,Infoth为大于等于零的预设阈值,该预设阈值的具体数值可以根据实际情况而设置;若该条件不满足,则将特征xj保留到下一次聚类;在遍历计算并归类后,若还有未被聚类的特征,则返回重新遍历得到第k+1类;直到所有未被聚类的待选择特征都被聚类,获得Q个类;当类的数量Q大于或等于预设的特征选择数量K时,按照类的顺序从K个类中分别选择具有最大的条件信息增益的特征作为选择的K个特征。
在本实施例中,可以使用现有方法计算特征之间的条件互信息增益,例如,可以根据以下的公式(7)计算特征之间的条件互信息增益:
其中,表示特征xi与已选择特征集的对于作为条件的模式种类集Y的互信息增益,H(Y)表示模式种类集Y的信息熵,表示特征xi与已选择特征集的对于作为条件的模式种类集Y的互信息熵。
在本实施例中,第一选择单元201还可以包括:
第四确定单元304,其用于当该聚类的聚类结果中类的数量Q小于预设的特征选择数量K时,只从Q个类中分别选择具有最大的条件信息增益的特征作为选择的Q个特征,或者,
第五确定单元305,其用于当该聚类的聚类结果中类的数量Q小于预设的特征选择数量K时,从Q个类中分别选择具有最大的条件信息增益的特征作为选择的Q个特征,并从剩余的待选择特征中根据该信息增益选择(K-Q)个特征,或者,
第六确定单元306,其用于当该聚类的聚类结果中类的数量Q小于预设的特征选择数量K时,重新确定待选择的各个特征,并使得该计算单元101和该选择单元102根据重新确定待选择的各个特征计算待选择的各个特征的条件信息增益,并根据该条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,直到该聚类的聚类结果中类的数量Q大于或等于预设的特征选择数量K为止,第六确定单元按照该类的顺序从K个类中分别选择具有最大的所述条件信息增益的特征作为选择的K个特征,
其中,K和Q均为正整数。
以上,对第一选择单元201的结构以及使用聚类法进行特征选择的方法进行了说明。使用聚类法进行特征选择,其计算量较小,能够快速得到选择出的一组特征。
在本实施例中,选择单元102还可以包括:
第二选择单元202,其用于根据该条件信息增益最大的预设数量的待选择特征,分别确定该条件信息增益最大的各个待选择特征的选择特征子集,获得该预设数量的选择特征子集;
第三选择单元203,其用于从该预设数量的选择特征子集中,选择具有最大条件互信息增益的选择特征子集,将该选择特征子集中的特征作为选择的特征。
在本实施例中,第二选择单元202将条件信息增益最大的一个待选择特征作为该选择特征子集的第一已选特征,并依次确定该选择特征子集中的每个已选特征。
图4是本发明实施例1的第二选择单元202的示意图。如图4所示,第二选择单元202包括:
排除单元401,其用于计算该选择特征子集中已选特征组成的集合或与各个其他待选择特征之间的条件互信息增益,当该条件互信息增益与该已选特征组成的集合的条件信息增益之差小于或等于预设阈值时,将该其他待选择排除在待选择特征之外;
第七确定单元402,其用于从未被排除的待选择特征中选择条件互信息增益最大的待选择特征作为该选择特征子集中的已选特征。
例如,在条件互信息增益最大的前T个特征里依次选择一个特征作为第t个选择特征子集中的第一个被选择的特征;假设第t个选择特征子集中,x1为第一个被选择的特征,记为然后计算与其他各个特征之间的条件互信息增益,当该条件互信息增益与的条件信息增益之差小于或等于Infoth时,说明xi与的联合并未对模式种类集Y的分类判决有增益,则将xi排除在后续步骤选择范围内,Infoth为大于等于零的预设阈值,该预设阈值的具体数值可以根据实际情况而设置;排除的特征集合记为然后从未被排除的待选择特征中选择出条件互信息增益最大的待选择特征作为第二个特征添加到选择特征子集中,类似的,在后续k时刻选取第k+1个特征时,则依次计算剩余未被排除的待选择特征与的条件互信息增益,根据类似的判断条件进行排除,然后从未被排除的待选择特征中选择出条件互信息增益最大的待选择特征作为第k+1个特征,并添加到中,即,当所有特征排除完且k<K则停止选择,否则,直到选择出K个特征。
这样,最终获得了T个选择特征子集,每个选择特征子集均具有K个特征。第三选择单元203从该T个选择特征子集中,选择具有最大条件互信息增益的选择特征子集,将该选择特征子集中的特征作为选择的特征。
例如,可以根据以下的公式(8)选择该选择特征子集:
其中,表示选择出的选择特征子集,表示第t个选择特征子集对于作为条件的模式种类集Y的互信息增益。
以上,对第二选择单元202的结构以及使用排除法进行特征选择的方法进行了说明。使用排除法进行特征选择,能够获得多组选择出的特征,并能够在这多组选择出的特征中进一步选择。
由上述实施例可知,根据待选择特征与已选择特征的条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定待选择特征的选择结果,将选择出的特征用于模式识别,能够使得区分模式种类的能力最大化以保证模式识别的高精度,同时,能够减少选择出的特征之间的冗余度,从而,能够进一步降低特征维度以降低计算量,从而提高了模式识别的实时性。
实施例2
本发明实施例还提供了一种电子设备,图5是本发明实施例2的电子设备的示意图。如图5所示,电子设备500包括特征选择装置501,其中,特征选择装置501的结构和功能与实施例1中的记载相同,此处不再赘述。
图6是本发明实施例2的电子设备的系统构成的示意框图。如图6所示,电子设备600可以包括中央处理器601和存储器602;存储器602耦合到中央处理器601。该图是示例性的;还可以使用其它类型的结构,来补充或代替该结构,以实现电信功能或其它功能。
如图6所示,该电子设备600还可以包括:输入单元603、显示器604、电源605。
在一个实施方式中,实施例1所述的特征选择装置的功能可以被集成到中央处理器601中。其中,中央处理器601可以被配置为:计算待选择的各个特征的条件信息增益;根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,其中,计算待选择特征与已选择特征的条件互信息增益,并根据所述条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定所述待选择特征的选择结果。
例如,所述根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,包括:对待选择特征进行聚类,依次确定每个类具有的特征,其中,所述确定每个类具有的特征包括:将未被聚类的待选择特征中具有最大的条件信息增益的特征作为所述类的第一特征;分别计算所述第一特征与未被聚类的其他待选择特征之间的条件互信息增益,当所述条件互信息增益与所述第一特征的条件信息增益之差小于或等于所述预设阈值时,将所述其他待选择特征确定为属于所述类。
例如,所述根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,还包括:当所述聚类的聚类结果中类的数量Q大于或等于预设的特征选择数量K时,按照所述类的顺序从K个类中分别选择具有最大的所述条件信息增益的特征作为选择的K个特征,K和Q均为正整数。
例如,所述根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,还包括:当所述聚类的聚类结果中类的数量Q小于预设的特征选择数量K时,只从Q个类中分别选择具有最大的条件信息增益的特征作为选择的Q个特征,或者,从Q个类中分别选择具有最大的条件信息增益的特征作为选择的Q个特征,并从剩余的待选择特征中根据所述信息增益选择(K-Q)个特征,或者,重新确定待选择的各个特征并重新计算待选择的各个特征的条件信息增益,并根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,直到所述聚类的聚类结果中类的数量Q大于或等于预设的特征选择数量K为止,并按照所述类的顺序从K个类中分别选择具有最大的所述条件信息增益的特征作为选择的K个特征,其中,K和Q均为正整数。
例如,所述根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,包括:根据所述条件信息增益最大的预设数量的待选择特征,分别确定所述条件信息增益最大的各个待选择特征的选择特征子集,获得所述预设数量的选择特征子集;从所述预设数量的选择特征子集中,选择具有最大条件互信息增益的选择特征子集,将该选择特征子集中的特征作为选择的特征。
例如,所述确定所述条件信息增益最大的各个待选择特征的选择特征子集,包括:依次确定所述选择特征子集中的每个已选特征,其中,确定所述选择特征子集中的每个已选特征,包括:计算所述选择特征子集中已选特征组成的集合或与各个其他待选择特征之间的条件互信息增益,当所述条件互信息增益与该已选特征组成的集合的条件信息增益之差小于或等于所述预设阈值时,将该其他待选择排除在待选择特征之外;从未被排除的待选择特征中选择所述条件互信息增益最大的待选择特征作为该选择特征子集中的已选特征。
例如,所述确定所述条件信息增益最大的各个待选择特征的选择特征子集,还包括:将所述条件信息增益最大的一个待选择特征作为该选择特征子集的第一已选特征。
例如,中央处理器601还可以被配置为:在计算所述条件信息增益之前,对待选择的各个特征进行归一化处理。
例如,在计算待选择的各个特征的条件信息增益时,按照测试样本的值域的多个区间进行样本统计。
在另一个实施方式中,实施例1所述的特征选择装置可以与中央处理器601分开配置,例如可以将特征选择装置配置为与中央处理器601连接的芯片,通过中央处理器601的控制来实现特征选择装置的功能。
在本实施例中电子设备600也并不是必须要包括图6中所示的所有部件。
如图6所示,中央处理器601有时也称为控制器或操作控件,可以包括微处理器或其它处理器装置和/或逻辑装置,中央处理器601接收输入并控制电子设备600的各个部件的操作。
存储器602,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。并且中央处理器601可执行该存储器602存储的该程序,以实现信息存储或处理等。其它部件的功能与现有类似,此处不再赘述。电子设备600的各部件可以通过专用硬件、固件、软件或其结合来实现,而不偏离本发明的范围。
由上述实施例可知,根据待选择特征与已选择特征的条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定待选择特征的选择结果,将选择出的特征用于模式识别,能够使得区分模式种类的能力最大化以保证模式识别的高精度,同时,能够减少选择出的特征之间的冗余度,从而,能够进一步降低特征维度以降低计算量,从而提高了模式识别的实时性。
实施例3
本发明实施例还提供一种特征选择方法,其对应于实施例1的特征选择装置。图7是本发明实施例3的特征选择方法的示意图。如图7所示,该方法包括:
步骤701:计算待选择的各个特征的条件信息增益;
步骤702:根据该条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,其中,计算待选择特征与已选择特征的条件互信息增益,并根据该条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定该待选择特征的选择结果。
图8是本发明实施例3的特征选择方法的另一示意图。如图8所示,该方法包括:
步骤801:确定待选择的特征;
步骤802:计算待选择的各个特征的条件信息增益;
步骤803:k=1;
步骤804:将未被聚类的待选择特征中具有最大的条件信息增益的特征作为第k类的第一特征;
步骤805:分别计算该第一特征与未被聚类的其他待选择特征之间的条件互信息增益;
步骤806:判断该条件互信息增益与该第一特征的条件信息增益之差是否小于或等于预设阈值,当判断为“是”时,进入步骤807,当判断为“否”时,进入步骤808;
步骤807:将该其他待选择特征确定为属于第k类;
步骤808:保留该其他特征作为未被聚类的待选择特征;
步骤809:判断未被聚类的待选择特征数量是否大于0,当判断为“是”时,进入步骤810,当判断为“否”时,进入步骤811;
步骤810:k=k+1;
步骤811:判断聚类结果中类的数量Q是否大于或等于预设的特征选择数量K,当判断结果为“是”时,进入步骤812,当判断结果为“否”时,进入步骤813、814、815中的任一个;
步骤812:按照类的顺序从K个类中分别选择具有最大的所述条件信息增益的特征作为选择的K个特征;
步骤813:只从Q个类中分别选择具有最大的条件信息增益的特征作为选择的Q个特征;
步骤814:从Q个类中分别选择具有最大的条件信息增益的特征作为选择的Q个特征,并从剩余的待选择特征中根据所述信息增益选择(K-Q)个特征;
步骤815:重新确定待选择的各个特征。
图9是本发明实施例3的特征选择方法的又一示意图。如图9所示,该方法包括:
步骤901:确定待选择的特征;
步骤902:计算待选择的各个特征的条件信息增益;
步骤903:t=1;
步骤904:在条件互信息增益最大的前T个特征里的第t个特征作为第t个选择特征子集中的第一个被选择的特征;
步骤905:计算第t个选择特征子集中已选特征组成的集合或与各个其他待选择特征之间的条件互信息增益;
步骤906:判断该条件互信息增益与该已选特征组成的集合的条件信息增益之差是否小于或等于预设阈值,当判断结果为“是”时,进入步骤907,当判断结果为“否”时,进入步骤908;
步骤907:将该其他待选择排除在待选择特征之外;
步骤908:将该其他待选择保留为待选择特征;
步骤909:从未被排除的待选择特征中选择条件互信息增益最大的待选择特征作为第t个选择特征子集中的已选特征;
步骤910:判断t是否小于T,当判断结果为“是”时,进入步骤911,当判断结果为“否”时,进入步骤912;
步骤911:t=t+1;
步骤912:从T个选择特征子集中,选择具有最大条件互信息增益的选择特征子集,将该选择特征子集中的特征作为选择的特征。
在本实施例中,上述各个步骤中的具体实现方法与实施例1中的记载相同,此处不再赘述。
由上述实施例可知,根据待选择特征与已选择特征的条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定待选择特征的选择结果,将选择出的特征用于模式识别,能够使得区分模式种类的能力最大化以保证模式识别的高精度,同时,能够减少选择出的特征之间的冗余度,从而,能够进一步降低特征维度以降低计算量,从而提高了模式识别的实时性。
本发明实施例还提供一种计算机可读程序,其中当在特征选择装置或电子设备中执行所述程序时,所述程序使得计算机在所述特征选择装置或电子设备中执行实施例3所述的特征选择方法。
本发明实施例还提供一种存储有计算机可读程序的存储介质,其中所述计算机可读程序使得计算机在特征选择装置或电子设备中执行实施例3所述的特征选择方法。
结合本发明实施例描述的在特征选择装置或电子设备中执行特征选择方法可直接体现为硬件、由处理器执行的软件模块或二者组合。例如,图1中所示的功能框图中的一个或多个和/或功能框图的一个或多个组合,既可以对应于计算机程序流程的各个软件模块,亦可以对应于各个硬件模块。这些软件模块,可以分别对应于图7所示的各个步骤。这些硬件模块例如可利用现场可编程门阵列(FPGA)将这些软件模块固化而实现。
软件模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域已知的任何其它形式的存储介质。可以将一种存储介质耦接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息;或者该存储介质可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。该软件模块可以存储在移动终端的存储器中,也可以存储在可插入移动终端的存储卡中。例如,若设备(例如移动终端)采用的是较大容量的MEGA-SIM卡或者大容量的闪存装置,则该软件模块可存储在该MEGA-SIM卡或者大容量的闪存装置中。
针对图1描述的功能框图中的一个或多个和/或功能框图的一个或多个组合,可以实现为用于执行本申请所描述功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑器件、分立硬件组件、或者其任意适当组合。针对图1描述的功能框图中的一个或多个和/或功能框图的一个或多个组合,还可以实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、与DSP通信结合的一个或多个微处理器或者任何其它这种配置。
以上结合具体的实施方式对本发明进行了描述,但本领域技术人员应该清楚,这些描述都是示例性的,并不是对本发明保护范围的限制。本领域技术人员可以根据本发明的精神和原理对本发明做出各种变型和修改,这些变型和修改也在本发明的范围内。
关于包括以上实施例的实施方式,还公开下述的附记:
附记1、一种特征选择装置,所述装置包括:
计算单元,其用于计算待选择的各个特征的条件信息增益;
选择单元,其用于根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,其中,所述选择单元计算待选择特征与已选择特征的条件互信息增益,并根据所述条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定所述待选择特征的选择结果。
附记2、根据附记1所述的装置,其中,所述选择单元包括:
第一选择单元,其用于对待选择特征进行聚类,依次确定每个类具有的特征,
其中,所第一选择单元包括:
第一确定单元,其用于将未被聚类的待选择特征中具有最大的条件信息增益的特征作为所述类的第一特征;
第二确定单元,其用于分别计算所述第一特征与未被聚类的其他待选择特征之间的条件互信息增益,当所述条件互信息增益与所述第一特征的条件信息增益之差小于或等于所述预设阈值时,将所述其他待选择特征确定为属于所述类。
附记3、根据附记2所述的装置,其中,所述第一选择单元还包括:
第三确定单元,其用于当所述聚类的聚类结果中类的数量Q大于或等于预设的特征选择数量K时,按照所述类的顺序从K个类中分别选择具有最大的所述条件信息增益的特征作为选择的K个特征,K和Q均为正整数。
附记4、根据附记2所述的方法,其中,所述第一选择单元还包括:
第四确定单元,其用于当所述聚类的聚类结果中类的数量Q小于预设的特征选择数量K时,只从Q个类中分别选择具有最大的条件信息增益的特征作为选择的Q个特征,或者,
第五确定单元,其用于当所述聚类的聚类结果中类的数量Q小于预设的特征选择数量K时,从Q个类中分别选择具有最大的条件信息增益的特征作为选择的Q个特征,并从剩余的待选择特征中根据所述信息增益选择(K-Q)个特征,或者,
第六确定单元,其用于当所述聚类的聚类结果中类的数量Q小于预设的特征选择数量K时,重新确定待选择的各个特征,并使得所述计算单元和所述选择单元根据重新确定待选择的各个特征计算待选择的各个特征的条件信息增益,并根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,直到所述聚类的聚类结果中类的数量Q大于或等于预设的特征选择数量K为止,第六确定单元按照所述类的顺序从K个类中分别选择具有最大的所述条件信息增益的特征作为选择的K个特征,
其中,K和Q均为正整数。
附记5、根据附记1所述的装置,其中,所述选择单元包括:
第二选择单元,其用于根据所述条件信息增益最大的预设数量的待选择特征,分别确定所述条件信息增益最大的各个待选择特征的选择特征子集,获得所述预设数量的选择特征子集;
第三选择单元,其用于从所述预设数量的选择特征子集中,选择具有最大条件互信息增益的选择特征子集,将该选择特征子集中的特征作为选择的特征。
附记6、根据附记5所述的装置,其中,所述第二选择单元依次确定所述选择特征子集中的每个已选特征,
所述第二选择单元包括:
排除单元,其用于计算所述选择特征子集中已选特征组成的集合或与各个其他待选择特征之间的条件互信息增益,当所述条件互信息增益与该已选特征组成的集合的条件信息增益之差小于或等于所述预设阈值时,将该其他待选择排除在待选择特征之外;
第七确定单元,其用于从未被排除的待选择特征中选择所述条件互信息增益最大的待选择特征作为该选择特征子集中的已选特征。
附记7、根据附记6所述的装置,其中,所述第二选择单元将所述条件信息增益最大的一个待选择特征作为该选择特征子集的第一已选特征。
附记8、根据附记1所述的装置,其中,所述装置还包括:
归一化单元,其用于在计算所述条件信息增益之前,对待选择的各个特征进行归一化处理。
附记9、根据附记1所述的装置,其中,
所述计算单元在计算待选择的各个特征的条件信息增益时,按照测试样本的值域的多个区间进行样本统计。
附记10、一种电子设备,包括根据附记1-9中的任一项所述的装置。
附记11、一种特征选择方法,所述方法包括:
计算待选择的各个特征的条件信息增益;
根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,其中,计算待选择特征与已选择特征的条件互信息增益,并根据所述条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定所述待选择特征的选择结果。
附记12、根据附记11所述的方法,其中,所述根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,包括:
对待选择特征进行聚类,依次确定每个类具有的特征,
其中,所述确定每个类具有的特征包括:
将未被聚类的待选择特征中具有最大的条件信息增益的特征作为所述类的第一特征;
分别计算所述第一特征与未被聚类的其他待选择特征之间的条件互信息增益,当所述条件互信息增益与所述第一特征的条件信息增益之差小于或等于所述预设阈值时,将所述其他待选择特征确定为属于所述类。
附记13、根据附记12所述的方法,其中,所述根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,还包括:
当所述聚类的聚类结果中类的数量Q大于或等于预设的特征选择数量K时,按照所述类的顺序从K个类中分别选择具有最大的所述条件信息增益的特征作为选择的K个特征,K和Q均为正整数。
附记14、根据附记12所述的方法,其中,所述根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,还包括:
当所述聚类的聚类结果中类的数量Q小于预设的特征选择数量K时,
只从Q个类中分别选择具有最大的条件信息增益的特征作为选择的Q个特征,或者,
从Q个类中分别选择具有最大的条件信息增益的特征作为选择的Q个特征,并从剩余的待选择特征中根据所述信息增益选择(K-Q)个特征,或者,
重新确定待选择的各个特征,并根据重新确定待选择的各个特征计算计算待选择的各个特征的条件信息增益,并根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,直到所述聚类的聚类结果中类的数量Q大于或等于预设的特征选择数量K为止,并按照所述类的顺序从K个类中分别选择具有最大的所述条件信息增益的特征作为选择的K个特征,
其中,K和Q均为正整数。
附记15、根据附记11所述的方法,其中,所述根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,包括:
根据所述条件信息增益最大的预设数量的待选择特征,分别确定所述条件信息增益最大的各个待选择特征的选择特征子集,获得所述预设数量的选择特征子集;
从所述预设数量的选择特征子集中,选择具有最大条件互信息增益的选择特征子集,将该选择特征子集中的特征作为选择的特征。
附记16、根据附记15所述的方法,其中,所述确定所述条件信息增益最大的各个待选择特征的选择特征子集,包括:
依次确定所述选择特征子集中的每个已选特征,
其中,确定所述选择特征子集中的每个已选特征,包括:
计算所述选择特征子集中已选特征组成的集合或与各个其他待选择特征之间的条件互信息增益,当所述条件互信息增益与该已选特征组成的集合的条件信息增益之差小于或等于所述预设阈值时,将该其他待选择排除在待选择特征之外;
从未被排除的待选择特征中选择所述条件互信息增益最大的待选择特征作为该选择特征子集中的已选特征。
附记17、根据附记16所述的方法,其中,所述确定所述条件信息增益最大的各个待选择特征的选择特征子集,还包括:
将所述条件信息增益最大的一个待选择特征作为该选择特征子集的第一已选特征。
附记18、根据附记11所述的方法,其中,所述方法还包括:
在计算所述条件信息增益之前,对待选择的各个特征进行归一化处理。
附记19、根据附记11所述的方法,其中,
在计算待选择的各个特征的条件信息增益时,按照测试样本的值域的多个区间进行样本统计。
Claims (10)
1.一种特征选择装置,所述装置包括:
计算单元,其用于计算待选择的各个特征的条件信息增益;
选择单元,其用于根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,其中,所述选择单元计算待选择特征与已选择特征的条件互信息增益,并根据所述条件互信息增益与已选择特征的条件信息增益之差与预设阈值的比较结果,确定所述待选择特征的选择结果。
2.根据权利要求1所述的装置,其中,所述选择单元包括:
第一选择单元,其用于对待选择特征进行聚类,依次确定每个类具有的特征,其中,所第一选择单元包括:
第一确定单元,其用于将未被聚类的待选择特征中具有最大的条件信息增益的特征作为所述类的第一特征;
第二确定单元,其用于分别计算所述第一特征与未被聚类的其他待选择特征之间的条件互信息增益,当所述条件互信息增益与所述第一特征的条件信息增益之差小于或等于所述预设阈值时,将所述其他待选择特征确定为属于所述类。
3.根据权利要求2所述的装置,其中,所述第一选择单元还包括:
第三确定单元,其用于当所述聚类的聚类结果中类的数量Q大于或等于预设的特征选择数量K时,按照所述类的顺序从K个类中分别选择具有最大的所述条件信息增益的特征作为选择的K个特征,K和Q均为正整数。
4.根据权利要求2所述的方法,其中,所述第一选择单元还包括:
第四确定单元,其用于当所述聚类的聚类结果中类的数量Q小于预设的特征选择数量K时,只从Q个类中分别选择具有最大的条件信息增益的特征作为选择的Q个特征,或者,
第五确定单元,其用于当所述聚类的聚类结果中类的数量Q小于预设的特征选择数量K时,从Q个类中分别选择具有最大的条件信息增益的特征作为选择的Q个特征,并从剩余的待选择特征中根据所述信息增益选择(K-Q)个特征,或者,
第六确定单元,其用于当所述聚类的聚类结果中类的数量Q小于预设的特征选择数量K时,重新确定待选择的各个特征,并使得所述计算单元和所述选择单元根据重新确定待选择的各个特征计算待选择的各个特征的条件信息增益,并根据所述条件信息增益的大小并基于特征之间的条件互信息增益进行特征选择,直到所述聚类的聚类结果中类的数量Q大于或等于预设的特征选择数量K为止,第六确定单元按照所述类的顺序从K个类中分别选择具有最大的所述条件信息增益的特征作为选择的K个特征,
其中,K和Q均为正整数。
5.根据权利要求1所述的装置,其中,所述选择单元包括:
第二选择单元,其用于根据所述条件信息增益最大的预设数量的待选择特征,分别确定所述条件信息增益最大的各个待选择特征的选择特征子集,获得所述预设数量的选择特征子集;
第三选择单元,其用于从所述预设数量的选择特征子集中,选择具有最大条件互信息增益的选择特征子集,将该选择特征子集中的特征作为选择的特征。
6.根据权利要求5所述的装置,其中,所述第二选择单元依次确定所述选择特征子集中的每个已选特征,
所述第二选择单元包括:
排除单元,其用于计算所述选择特征子集中已选特征组成的集合或与各个其他待选择特征之间的条件互信息增益,当所述条件互信息增益与该已选特征组成的集合的条件信息增益之差小于或等于所述预设阈值时,将该其他待选择排除在待选择特征之外;
第七确定单元,其用于从未被排除的待选择特征中选择所述条件互信息增益最大的待选择特征作为该选择特征子集中的已选特征。
7.根据权利要求6所述的装置,其中,所述第二选择单元将所述条件信息增益最大的一个待选择特征作为该选择特征子集的第一已选特征。
8.根据权利要求1所述的装置,其中,所述装置还包括:
归一化单元,其用于在计算所述条件信息增益之前,对待选择的各个特征进行归一化处理。
9.根据权利要求1所述的装置,其中,
所述计算单元在计算待选择的各个特征的条件信息增益时,按照测试样本的值域的多个区间进行样本统计。
10.一种电子设备,包括根据权利要求1-9中的任一项所述的装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710914975.9A CN109598275A (zh) | 2017-09-30 | 2017-09-30 | 特征选择装置、方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710914975.9A CN109598275A (zh) | 2017-09-30 | 2017-09-30 | 特征选择装置、方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109598275A true CN109598275A (zh) | 2019-04-09 |
Family
ID=65955707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710914975.9A Pending CN109598275A (zh) | 2017-09-30 | 2017-09-30 | 特征选择装置、方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109598275A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110378391A (zh) * | 2019-06-25 | 2019-10-25 | 北京三快在线科技有限公司 | 计算模型的特征筛选方法、装置、电子设备和存储介质 |
CN111860894A (zh) * | 2020-07-29 | 2020-10-30 | 宁波大学 | 斜拉桥病害属性选择方法 |
CN114580557A (zh) * | 2022-03-10 | 2022-06-03 | 北京中知智慧科技有限公司 | 基于语义分析的文献相似度确定方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103945531A (zh) * | 2014-05-12 | 2014-07-23 | 哈尔滨工业大学 | 基于信息熵的WLAN室内定位Radio Map更新方法 |
US20140207711A1 (en) * | 2013-01-21 | 2014-07-24 | International Business Machines Corporation | Transductive feature selection with maximum-relevancy and minimum-redundancy criteria |
CN104050242A (zh) * | 2014-05-27 | 2014-09-17 | 哈尔滨理工大学 | 基于最大信息系数的特征选择、分类方法及其装置 |
CN105183813A (zh) * | 2015-08-26 | 2015-12-23 | 山东省计算中心(国家超级计算济南中心) | 基于互信息的用于文档分类的并行特征选择方法 |
CN106407304A (zh) * | 2016-08-30 | 2017-02-15 | 北京大学 | 一种基于互信息的数据离散化与特征选择集成方法及装置 |
WO2017113232A1 (zh) * | 2015-12-30 | 2017-07-06 | 中国科学院深圳先进技术研究院 | 一种基于深度学习的产品分类方法及装置 |
CN107193804A (zh) * | 2017-06-02 | 2017-09-22 | 河海大学 | 一种面向词和组合词的垃圾短信文本特征选择方法 |
-
2017
- 2017-09-30 CN CN201710914975.9A patent/CN109598275A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140207711A1 (en) * | 2013-01-21 | 2014-07-24 | International Business Machines Corporation | Transductive feature selection with maximum-relevancy and minimum-redundancy criteria |
CN103945531A (zh) * | 2014-05-12 | 2014-07-23 | 哈尔滨工业大学 | 基于信息熵的WLAN室内定位Radio Map更新方法 |
CN104050242A (zh) * | 2014-05-27 | 2014-09-17 | 哈尔滨理工大学 | 基于最大信息系数的特征选择、分类方法及其装置 |
CN105183813A (zh) * | 2015-08-26 | 2015-12-23 | 山东省计算中心(国家超级计算济南中心) | 基于互信息的用于文档分类的并行特征选择方法 |
WO2017113232A1 (zh) * | 2015-12-30 | 2017-07-06 | 中国科学院深圳先进技术研究院 | 一种基于深度学习的产品分类方法及装置 |
CN106407304A (zh) * | 2016-08-30 | 2017-02-15 | 北京大学 | 一种基于互信息的数据离散化与特征选择集成方法及装置 |
CN107193804A (zh) * | 2017-06-02 | 2017-09-22 | 河海大学 | 一种面向词和组合词的垃圾短信文本特征选择方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110378391A (zh) * | 2019-06-25 | 2019-10-25 | 北京三快在线科技有限公司 | 计算模型的特征筛选方法、装置、电子设备和存储介质 |
CN111860894A (zh) * | 2020-07-29 | 2020-10-30 | 宁波大学 | 斜拉桥病害属性选择方法 |
CN111860894B (zh) * | 2020-07-29 | 2024-01-09 | 宁波大学 | 斜拉桥病害属性选择方法 |
CN114580557A (zh) * | 2022-03-10 | 2022-06-03 | 北京中知智慧科技有限公司 | 基于语义分析的文献相似度确定方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Local temporal pattern and data augmentation for micro-expression spotting | |
CN109543526B (zh) | 基于深度差异性特征的真假面瘫识别系统 | |
CN107958230B (zh) | 人脸表情识别方法及装置 | |
Gurovich et al. | DeepGestalt-identifying rare genetic syndromes using deep learning | |
CN111563891B (zh) | 基于颜色认知的疾病预测系统 | |
Bu | Human motion gesture recognition algorithm in video based on convolutional neural features of training images | |
Huan et al. | Deep convolutional neural networks for classifying body constitution based on face image | |
Liu et al. | Finger vein recognition with superpixel-based features | |
CN109598275A (zh) | 特征选择装置、方法及电子设备 | |
CN110786849B (zh) | 基于多视图鉴别分析的心电信号身份识别方法及系统 | |
CN109697447A (zh) | 基于随机森林的分类模型构建装置、方法及电子设备 | |
CN114469120A (zh) | 一种基于相似度阈值迁移的多尺度Dtw-BiLstm-Gan心电信号生成方法 | |
Chen et al. | Patient emotion recognition in human computer interaction system based on machine learning method and interactive design theory | |
CN104978569A (zh) | 一种基于稀疏表示的增量人脸识别方法 | |
CN115937953A (zh) | 心理变化检测方法、装置、设备及存储介质 | |
CN115906002A (zh) | 一种基于多粒度数据融合的学习投入状态评估方法 | |
CN104679967A (zh) | 一种判断心理测试可靠性的方法 | |
Li et al. | Feature selection framework for functional connectome fingerprinting | |
CN107103289B (zh) | 利用笔迹轮廓特征来进行笔迹鉴别的方法及系统 | |
Taiana et al. | On the purity of training and testing data for learning: The case of pedestrian detection | |
CN103544421A (zh) | 一种生物特征综合识别系统及方法 | |
CN110929583A (zh) | 一种高检测精度人脸识别方法 | |
CN113469053B (zh) | 眼动轨迹鉴别方法及系统 | |
CN111507555B (zh) | 人体状态检测方法、课堂教学质量的评价方法及相关装置 | |
Zhong et al. | Facial micro-expression recognition based on local region of the key frame |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20240621 |