CN112488188B - 一种基于深度强化学习的特征选择方法 - Google Patents

一种基于深度强化学习的特征选择方法 Download PDF

Info

Publication number
CN112488188B
CN112488188B CN202011369962.6A CN202011369962A CN112488188B CN 112488188 B CN112488188 B CN 112488188B CN 202011369962 A CN202011369962 A CN 202011369962A CN 112488188 B CN112488188 B CN 112488188B
Authority
CN
China
Prior art keywords
feature
selection
subset
network
action
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011369962.6A
Other languages
English (en)
Other versions
CN112488188A (zh
Inventor
李欣倩
唐丽娟
任佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Sci Tech University ZSTU
Original Assignee
Zhejiang Sci Tech University ZSTU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Sci Tech University ZSTU filed Critical Zhejiang Sci Tech University ZSTU
Priority to CN202011369962.6A priority Critical patent/CN112488188B/zh
Publication of CN112488188A publication Critical patent/CN112488188A/zh
Application granted granted Critical
Publication of CN112488188B publication Critical patent/CN112488188B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24143Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度强化学习的特征选择方法,包括如下步骤:步骤1、获取数据集,得到初始特征空间;步骤2、根据ε‑greedy策略对初始特征空间中的特征进行动作选择,得到当前特征子集;步骤3、将当前特征子集送入分类器进行评估,进入下一特征的选择;步骤4、运用深度强化学习方法优化动作选择策略;步骤5、重复执行步骤2‑步骤4,输出最优特征子集SBest以及该特征子集的分类准确率。采用本发明的方法,能实现在海量的大数据中提取符合需要且有价值的信息。

Description

一种基于深度强化学习的特征选择方法
技术领域
本发明涉及特征选择领域,特别是涉及一种基于深度强化学习的特征选择方法。
背景技术
近年来,随着数据网络技术的蓬勃发展以及智能终端的普及,电子商务、社交网络、金融等诸多领域均需要存储应用大量的数据信息。这些海量数据的背后蕴含着丰富的知识,因此从复杂的大规模数据中提取出有意义的、有价值的信息变得尤为重要。
作为一门多领域交叉学科,机器学习主要利用概率论、统计学、逼近论等领域的思想,通过设计一些算法从数据中自动分析获取规律,并根据规律对未知数据进行预测。典型的监督型机器学习任务是通过数据集中的特征来预测样本所对应的目标值。
针对实际样本中常包含大量冗余特征的现象,特征选择通过给定评价函数选取与当前工作有关的特征,剔除无关数据。该方法能够在一定程度上解决维度灾难,提升机器学习任务中模型的学习性能。作为一种重要的数据预处理技术,特征选择方法主要分为三种:过滤式(filter)、包装式(wrapper)、嵌入式(embedded)。Filter方法独立于分类器,将数据内部性质作为评价特征的标准,算法实现简单,但所选特征子集并非最适合每个分类器。Wrapper方法以分类器的准确率为评估标准,所选特征子集分类准确率高,但计算成本大易出现过拟合。Embedded方法将特征选择嵌入到训练过程中,可以减少模型的计算成本,但构建优化函数较困难。由此可见,传统的特征选择算法仍存在一定的改进空间,而具有决策和自主学习能力的强化学习为特征选择的实现提供了一种新的思路。因此,需要一种结合强化学习的特征选择方法实现最优特征子集的选择。
发明内容
本发明要解决的技术问题在于针对现有技术的缺陷,提供一种基于深度强化学习的特征选择方法,实现在海量的大数据中提取符合需要且有价值的信息。本发明从优化搜索动作策略的角度出发,利用深度Q学习算法(Deep Q-Network,DQN)求解特征选择问题,确定最优特征子集的动作策略,实现最优特征子集的选择。
为了解决上述技术问题,本发明提供一种基于深度强化学习的特征选择方法,包括如下步骤:
步骤1、获取数据集,得到初始特征空间;
步骤2、根据ε-greedy策略对初始特征空间中的特征进行动作选择,得到当前特征子集;
步骤3、将当前特征子集送入分类器进行评估,进入下一特征的选择;
步骤4、运用深度强化学习方法优化动作选择策略;
步骤5、重复执行步骤2---步骤4,输出最优特征子集SBest以及该特征子集的分类准确率。
作为本发明一种基于深度强化学习的特征选择方法的改进,所述步骤1包括以下过程:
步骤1.1、首先,从上位机中收集数据样本,整理每个数据样本的特征信息,并给每个样本标记分类标签,然后将特征信息和分类标签设置为数据集,进行预处理,去除每个样本的序号、删除数据集中包含缺失值的样本,获得预处理后的数据集;
步骤1.2、预处理后的数据集包括:初始特征空间和分类标签,表示如下:
Dataset={S,C},
其中,Dataset为给定数据集中特征空间和分类标签的集合,S表示初始特征空间,C表示数据集对应的分类标签;
对S中的所有特征编号,S={s1,s2,...,st,...,sn},st为初始特征空间中的第t个特征(t=1,2,...,n),n为初始特征空间中所含特征总数。
作为本发明一种基于深度强化学习的特征选择方法的进一步改进,所述步骤2包括以下过程:
步骤2.1、从初始特征空间S中取出特征st,根据ε-greedy策略以ε∈{0.1,1}的概率随机选择或以1-ε的概率根据评估网络输出的动作值函数对特征st进行动作at;ε初始设置为1,每轮特征选择结束后,以ε=0.97ε的速度进行衰减,ε=0.1时,停止衰减;动作空间表示为:
A={a1,a2,...,at,...,an}
其中,A为对所有特征进行选择的动作集合,n为动作的数量,at=1表示保留特征st,at=0表示删除特征st
步骤2.2、更新初始特征空间S中的特征st的状态,得到当前特征子集,特征st被删除时,表示为st=0,保留时为st=1。
作为本发明一种基于深度强化学习的特征选择方法的进一步改进,所述步骤3包括:
将当前特征子集送入K近邻分类器中,根据预测的分类标签与数据集实际分类标签C的对比结果得到分类准确率,计算奖励rt,再对下一特征st+1进行选择动作,奖励的具体设置如下:
R={r1,r2,...,rt,...,rn}
R表示一轮特征选择结束时所得到的奖励集合,n为奖励的数量,rt为特征st经过动作at后得到的评估奖励:
其中,acc(st)是选择t次后特征子集的准确率,maxacc(st-1)表示在t-1次特征选择过程中的历史最高准确率,ra=0.5,rb=-0.1,rc=-5为对应情况下的奖励值,Fitness(st)表示为:
α是与分类性能相关的参数,α=0.99,γR(D)表示分类器的分类误差,C,R分别表示数据集的初始特征数与所选特征数。
作为本发明一种基于深度强化学习的特征选择方法的进一步改进,所述步骤4包括如下过程:
步骤4.1、初始化特征空间,根据实际容量初始化经验回放池,并随机初始化深度强化学习方法DQN模型中Q网络的网络参数:评估网络的参数θ和目标网络的参数θ-,包括学习率β、折扣因子γ以及Q网络结构和参数;
步骤4.2、将步骤S2、S3中的四个参数当前特征st、动作at、奖励rt、下一特征st+1,作为经验序列(st,at,rt,st+1)存入经验回放池;
步骤4.3、当经验回放池中的数据达到最大容量capacity=2000时,随机取出32条经验序列(sj,aj,rj,sj+1),将特征sj经过选择后得到的候选特征子集作为向量输入评估网络,得到对应动作aj的Q值Q(sj,aj;θ),θ为评估网络的参数总和;将特征sj+1经过选择后得到的候选特征子集输入目标网络,并对比所有得到的Q值大小,选择最大Q值θ-为目标网络的参数总和,计算目标网络的估计值yj
其中,折扣因子γ=0.995,当j+1为终止时刻,代表sj+1为特征空间中最后一个待选特征;当j+1非终止时刻,代表sj+1并非特征空间中最后一个待选特征;
步骤4.4、根据随机梯度下降法,求得损失函数:
L(θ)=(yj-Q(sj,aj;θ))2
更新评估网络参数θ:
其中学习率β=0.001;
将评估网络中的参数θ复制给目标网络的参数θ-
作为本发明一种基于深度强化学习的特征选择方法的进一步改进,所述步骤5包括如下过程:
重复执行步骤2---步骤4,训练深度强化学习方法至少500轮后停止,选择训练中得到的最高奖励值所在轮次获得的的特征子集作为最优特征子集SBest
SBest={s1,s2,...,sm}(m≤n)
其中,m为所选特征个数,sm为保留的第m个特征;
在上位机中输出所选的最优特征子集和该特征子集的分类准确率。
本发明的有益效果主要体现在:
1、本发明提出一种新型的特征选择方法及框架,能够有效避免传统特征选择方法中存在的所选特征子集并非最适合每个分类器、易出现过拟合等问题;
2、本发明将深度强化学习技术应用于特征选择任务上,从优化搜索的角度出发,通过尝试各种特征子集组合,以特征子集的特征数、准确率作为评估标准,不断优化动作选择策略,使得算法能够自动学习到最优特征子集,提高本发明的准确率。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细说明。
图1是本发明中基于深度强化学习的特征选择方法流程示意图。
具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此:
实施例1、一种基于深度强化学习的特征选择方法,在与特征空间的交互过程中,通过不断更新Q网络参数,根据收敛的值函数学习最优策略,得到最优特征子集,适应复杂的特征选择问题。如图1所示,本发明的具体方法包括如下步骤:
S1、获取数据集,得到初始特征空间;
S1.1、从上位机中收集一定量的数据样本,整理每个数据样本的特征信息,并标记每个样本的分类标签,然后将特征信息和分类标签设置为数据集,并进行预处理,即去除每个样本的序号、检查数据集中是否包含缺失值,若含有缺失值,则删除该样本;
在本实施例中,上位机对获取的一定数量的乳腺肿块的细针抽吸(FNA)的数字化图像作为样本进行处理,记录样本的代码编号,并提取每个样本的相关特征:团块厚度、细胞大小的均匀性、细胞形状的均匀性、附着力、单层上皮细胞大小、裸核、乏味染色质、正常核仁、线粒体;然后,将每个样本数据的分类标签标记为良性和恶性;最后将提取的每个样本的相关特征和分类标签设置为数据集,对数据集进行预处理,即去除每个样本的序号、删除数据集中有缺失值的样本,获得预处理后的数据集;
S1.2、预处理后的数据集包括:初始特征空间和分类标签,表示如下:
Dataset={S,C},
其中,Dataset为给定数据集中特征空间和分类标签的集合,S表示初始特征空间,为S1中提取的样本的特征集合,C表示数据集对应的分类标签,即良性或恶性;对S中的所有特征编号,S={s1,s2,...,st,...,sn},st为初始特征空间中的第t个特征(t=1,2,...,n),n为初始特征空间中所含特征的总数。
S2、根据ε-greedy策略对初始特征空间中的特征进行动作选择,得到当前特征子集;
S2.1、从初始特征空间S中取出特征st,根据ε-greedy策略以ε的概率随机选择或以1-ε的概率根据评估网络输出的动作价值函数(Q值)对特征st进行动作at;在ε-greedy策略中,ε∈{0.1,1},ε初始设置为1,每轮特征选择结束后,以ε=0.97ε的速度进行衰减,ε=0.1时,停止衰减;动作空间表示为:
A={a1,a2,...,at,...,an}
其中,A为对所有特征进行选择的动作集合,n为动作的数量,对于特征st,at=1表示保留特征st,at=0表示删除特征st;该动作设置可以保证在特征选择过程中,具体分析每个特征的状态,考虑特征组合间的相关性,避免特征漏选、多选的情况;
S2.2、更新初始特征空间S中特征st的状态,得到当前特征子集,特征st被删除时,表示为st=0,保留时为st=1。
S3、将当前特征子集送入分类器进行评估,进入下一特征的选择;
将当前特征子集送入K近邻(KNN)分类器中,根据预测的分类标签与数据集实际的分类标签C的对比结果得到分类准确率,计算奖励值rt,再对下一特征st+1进行选择动作;奖励的具体设置如下:
R={r1,r2,...,rt,...,rn}
R表示一轮特征选择结束时所得到的奖励集合,是评估特征子集优劣的指标,n为奖励的数量,rt为特征st经过动作at后得到的奖励,具体设置如下:
其中,acc(st)是选择t次后特征子集的准确率,maxacc(st-1)表示在t-1次特征选择过程中的历史最高准确率,ra=0.5,rb=-0.1,rc=-5为对应情况下的奖励值,Fitness(st)表示为:
α是与分类性能相关的参数,α=0.99,γR(D)表示分类器的分类误差,C,R分别表示数据集的初始特征数与所选特征数;
在特征选择过程中,根据当前准确率和最优分类准确率结果对比计算奖励值,动态地衡量当前特征采取的选择动作是否合理,从而选择适合于分类器的特征;在一轮特征选择结束时,将Fitness(st)作为评估标准,从特征子集和准确率出发全面地评估所选特征子集,为后续训练过程指明优化方向。
S4、运用深度强化学习方法优化动作选择策略
S4.1、初始化特征空间,根据实际容量初始化经验回放池,并随机初始化深度强化学习方法DQN(Deep Q Network)中Q网络的网络参数:评估网络的参数θ和目标网络的参数θ-,包括学习率β、折扣因子γ以及Q网络结构和参数;
Q网络包括评估网络和目标网络,评估网络和目标网络为网络结构相同的神经网络,网络结构共四层,均为:
第一层为输入层,输入向量为经过特征选择后的特征子集构成的状态向量,表示为:
s(t)=(s1(t),s2(t),...,sn(t))T
其中s(t)为第t次训练的特征子集的状态向量集合,sn(t)表示第t次训练时第n个特征的状态;
第二层为隐藏层,输入为第一层的输入向量s(t),计算公式为:
其中,i表示隐藏层中的第i个神经元,该隐藏层共有32个神经元;和b1i分别为隐藏层的第i个神经元的权重系数和截距,/>为隐藏层的第i个神经元的输出;
经过激活函数ReLU后,隐藏层输出为:
其中:为隐藏层的第i个神经元的输出;
第三层为隐藏层,以第二层隐藏层的输出作为输入,计算公式为:
其中,j表示该层中的第j个神经元,共有神经元个数为16;和b2j分别为第j个神经元的权重系数和截距;经过激活函数ReLU后,输出为:
其中:为第三层的第j个神经元的输出;
第四层为输出层,以第三层的输出作为输入,计算公式为:
其中,k表示该层中的第k个神经元,共有神经元个数为2;和b3k分别为第k个神经元的权重系数和截距;输出值yout(t)=(Q(s(t),a1),Q(s(t),a2)),即特征选择问题中当前状态对应所有动作的Q值,当数据集包含特征较多时,Q网络可以近似整个动作价值函数(Q值),并在每次学习时更新整个函数;
S4.2、将步骤S2、S3中的四个参数当前特征st、动作at、奖励rt、下一特征st+1,作为经验序列(st,at,rt,st+1)存入经验回放池;
S4.3、当经验回放池中的数据达到最大容量capacity=2000时,随机取出32条经验序列(sj,aj,rj,sj+1),将特征sj经过选择后得到的候选特征子集作为向量输入评估网络,得到对应动作aj的Q值Q(sj,aj;θ),θ为评估网络的参数总和;将特征sj+1经过选择后得到的候选特征子集作为向量输入目标网络,并对比所有得到的Q值,选择最大Q值θ-为目标网络的参数总和,计算目标网络的估计值yj
其中,折扣因子γ=0.995,当j+1为终止时刻,代表sj+1为特征空间中最后一个待选特征;当j+1非终止时刻,代表sj+1并非特征空间中最后一个待选特征;
S4.4、根据随机梯度下降法,求得损失函数:
L(θ)=(yj-Q(sj,aj;θ))2
更新评估网络参数θ:
其中学习率β=0.001,每轮特征选择结束时,将评估网络中的参数θ复制给目标网络的参数θ-,实现评估网络和目标网络的参数更新。
S5:重复执行步骤S2—S4,训练深度强化学习方法,并输出结果
重复执行步骤S2—S4若干轮训练深度强化学习方法,每轮训练时,不断更新评估网络的参数θ和目标网络的参数θ-,实现Q网络的收敛以及特征选择中动作策略的优化,采用Q网络优化动作策略,可以有效避免传统特征选择中的过拟合问题;
本实施例中,步骤S2—S4重复执行500轮后结束深度强化学习方法的训练;选择500轮训练中得到的奖励值的最高值(最高值时的特征子集分类准确率最大)时通过评估网络的计算输出的特征子集作为最优特征子集SBest
SBest={s1,s2,...,sm}(m≤n)
其中,m为所选特征个数,sm为保留的第m个特征;
本实施例中,第166轮训练所选特征子集得到的奖励值为最高值,因此第166轮所选的特征子集为最优特征子集,在上位机中输出所选的最优特征子集SBest={团块厚度、裸核、乏味染色质、正常核仁},以及该特征子集的分类准确率为97.0%(步骤S3中的输出)。
实验1:
以UCI网站上的乳腺癌数据集(Breast Cancer Wisconsin)为例,对上述实施例1中提出的基于深度强化学习的特征选择方法进行系统的测试和验证。
本实施例中的数据集来自于Uci Machine Learning Repository,使用的是Breast Cancer Wisconsin(Original)Data Set。数据取样于威斯康星大学医院,用于预测乳腺癌为良性还是恶性。该数据集有样本699个,其中良性458个,恶性241个,该数据集共有10个特征:
1)样本代码编号:ID编号
2)团块厚度:1-10;
3)细胞大小的均匀性:1-103;
4)细胞形状的均匀性:1-10;
5)边缘附着力:1-10;
6)单层上皮细胞大小:1-10;
7)裸核:1-10;
8)乏味染色质:1-10;
9)正常核仁:1-10;
10)线粒体:1-10;
该数据集的分类标签具有两个值:2和4,其中2表示乳腺癌为良性,4表示乳腺癌为恶性。
本发明的实验平台为python,实验的上位机为Intel Core(TM)i7-9700 CPU,NVIDIA 1080Ti GPU,16.0G RAM,在实验的上位机中下载UCI网站上的乳腺癌的数据集。
本实验总共运行五轮,每轮实验均采用十折交叉验证,同时每轮实验时均对比计算未经过特征选择的分类准确率的平均值,用于验证本发明的有效性:
1、首先将乳腺癌的数据集进行预处理,将预处理好的数据集分成十份数据,将其中九份用于训练一份用于测试;为取得准确的实验结果,每轮开始时均将预处理好的数据集重新分成十份;
2、按实施例1所述步骤S1-S6运行十折交叉验证,最终获得最优特征子集SBest和最优特征子集的分类准确率,采用得到的十次分类准确率的平均值作为本轮的分类准确率;
3、作为对比,将步骤1中的十份数据轮流输入KNN分类器,运行十折交叉验证,采用得到的十次分类准确率的平均值作为本轮未经过特征选择的分类准确率。
取上述五轮实验得到的分类准确率和特征选择率的平均值作为最终的实验结果,
五轮实验所选最优特征子集SBest如表1:
表1五次实验所选最优特征子集SBest
实验轮数 最优特征子集SBest
1 2)4)6)7)8)9)10)
2 2)7)8)9)
3 2)4)6)7)8)9)10)
4 2)4)6)7)8)9)
5 2)6)7)8)9)
五轮实验所得最优特征子集的分类准确率和特征选择率如表2,其中,特征选择率为每轮实验所选最优特征子集的数量与原有特征数量(即为10个特征)的比值:
表2五次实验所得准确率和特征选择率
最终,实验结果为:平均分类准确率:0.970和平均特征选择率:0.58;而未进行特征选择得到的平均分类准确率为0.468。相比之下,本发明基于深度强化学习的特征选择方法仅用58%的特征就可以将分类准确率提高50.2%,由此可知,本发明提出的深度强化学习方法明显优于未进行特征选择的分类性能。
最后,还需要注意的是,以上列举的仅是本发明的若干个具体实施例。显然,本发明不限于以上实施例,还可以有许多变形。本领域的普通技术人员能从本发明公开的内容直接导出或联想到的所有变形,均应认为是本发明的保护范围。

Claims (5)

1.一种基于深度强化学习的特征选择方法,其特征在于,以数字化图像作为样本进行处理,包括如下步骤:
步骤1、获取数据集,得到初始特征空间;
步骤2、根据ε-greedy策略对初始特征空间中的特征进行动作选择,得到当前特征子集;
步骤3、将当前特征子集送入分类器进行评估,进入下一特征的选择;
所述步骤3包括:
将当前特征子集送入K近邻分类器中,根据预测的分类标签与数据集实际分类标签C的对比结果得到分类准确率,计算奖励rt,再对下一特征st+1进行选择动作,奖励的具体设置如下:
R={r1,r2,...,rt,...,rn}
R表示一轮特征选择结束时所得到的奖励集合,n为奖励的数量,rt为特征st经过动作at后得到的评估奖励:
其中,acc(st)是选择t次后特征子集的准确率,maxacc(st-1)表示在t-1次特征选择过程中的历史最高准确率,ra=0.5,rb=-0.1,rc=-5为对应情况下的奖励值,Fitness(st)表示为:
α是与分类性能相关的参数,α=0.99,γR(D)表示分类器的分类误差,C,R分别表示数据集的初始特征数与所选特征数;
步骤4、运用深度强化学习方法优化动作选择策略;
步骤5、重复执行步骤2---步骤4,输出最优特征子集SBest以及该特征子集的分类准确率。
2.根据权利要求1所述的一种基于深度强化学习的特征选择方法,其特征在于:所述步骤1包括以下步骤:
步骤1.1、从上位机中收集数据样本,整理每个数据样本的特征信息,并给每个样本标记分类标签,然后将特征信息和分类标签设置为数据集,进行预处理,去除每个样本的序号、删除数据集中包含缺失值的样本,获得预处理后的数据集;
步骤1.2、预处理后的数据集包括:初始特征空间和分类标签,表示如下:
Dataset={S,C},
其中,Dataset为给定数据集中特征空间和分类标签的集合,S表示初始特征空间,C表示数据集对应的分类标签;
对S中的所有特征编号,S={s1,s2,...,st,...,sn},st为初始特征空间中的第t个特征(t=1,2,...,n),n为初始特征空间中所含特征总数。
3.根据权利要求2所述的一种基于深度强化学习的特征选择方法,其特征在于:所述步骤2包括以下步骤:
步骤2.1、从初始特征空间S中取出特征st,根据ε-greedy策略以ε∈{0.1,1}的概率随机选择或以1-ε的概率根据评估网络输出的动作值函数对特征st进行动作at;ε初始设置为1,每轮特征选择结束后,以ε=0.97ε的速度进行衰减,ε=0.1时,停止衰减;动作空间表示为:
A={a1,a2,...,at,...,an}
其中,A为对所有特征进行选择的动作集合,n为动作的数量,at=1表示保留特征st,at=0表示删除特征st
步骤2.2、更新初始特征空间S中的特征st的状态,得到当前特征子集,特征st被删除时,表示为st=0,保留时为st=1。
4.根据权利要求3所述的一种基于深度强化学习的特征选择方法,其特征在于:所述步骤4包括如下步骤:
步骤4.1、初始化特征空间,根据实际容量初始化经验回放池,并随机初始化深度强化学习方法DQN模型中Q网络的网络参数:评估网络的参数θ和目标网络的参数θ-,包括学习率β、折扣因子γ以及Q网络结构和参数;
步骤4.2、将步骤S2、S3中的四个参数当前特征st、动作at、奖励rt、下一特征st+1,作为经验序列(st,at,rt,st+1)存入经验回放池;
步骤4.3、当经验回放池中的数据达到最大容量capacity=2000时,随机取出32条经验序列(sj,aj,rj,sj+1),将特征sj经过选择后得到的候选特征子集作为向量输入评估网络,得到对应动作aj的Q值Q(sj,aj;θ),θ为评估网络的参数总和;将特征sj+1经过选择后得到的候选特征子集输入目标网络,并对比所有得到的Q值大小,选择最大Q值θ-为目标网络的参数总和,计算目标网络的估计值yj
其中,折扣因子γ=0.995,当j+1为终止时刻,代表sj+1为特征空间中最后一个待选特征;当j+1非终止时刻,代表sj+1并非特征空间中最后一个待选特征;
步骤4.4、根据随机梯度下降法,求得损失函数:
L(θ)=(yj-Q(sj,aj;θ))2
更新评估网络参数θ:
其中学习率β=0.001;
将评估网络中的参数θ复制给目标网络的参数θ-
5.根据权利要求4所述的一种基于深度强化学习的特征选择方法,其特征在于:所述步骤5包括如下步骤:
重复执行步骤2---步骤4,训练深度强化学习方法至少500轮后停止,选择训练中得到的最高奖励值所在轮次获得的的特征子集作为最优特征子集SBest
SBest={s1,s2,...,sm}(m≤n)
其中,m为所选特征个数,sm为保留的第m个特征;
在上位机中输出所选的最优特征子集和该特征子集的分类准确率。
CN202011369962.6A 2020-11-30 2020-11-30 一种基于深度强化学习的特征选择方法 Active CN112488188B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011369962.6A CN112488188B (zh) 2020-11-30 2020-11-30 一种基于深度强化学习的特征选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011369962.6A CN112488188B (zh) 2020-11-30 2020-11-30 一种基于深度强化学习的特征选择方法

Publications (2)

Publication Number Publication Date
CN112488188A CN112488188A (zh) 2021-03-12
CN112488188B true CN112488188B (zh) 2023-12-19

Family

ID=74937400

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011369962.6A Active CN112488188B (zh) 2020-11-30 2020-11-30 一种基于深度强化学习的特征选择方法

Country Status (1)

Country Link
CN (1) CN112488188B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780334A (zh) * 2021-07-09 2021-12-10 浙江理工大学 基于两阶段混合特征选择的高维数据分类方法
CN117390536B (zh) * 2023-12-11 2024-04-02 深圳市宝腾互联科技有限公司 基于人工智能的运维管理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070121346A (ko) * 2006-06-22 2007-12-27 중앙대학교 산학협력단 감성인식 시스템 및 그 시스템에 있어서 특징집합 선택방법
CN108596335A (zh) * 2018-04-20 2018-09-28 浙江大学 一种基于深度强化学习的自适应众包方法
CN111368936A (zh) * 2020-03-18 2020-07-03 中南大学 基于改进svm-rfe的特征选择方法
CN111652378A (zh) * 2019-05-23 2020-09-11 谷歌有限责任公司 学习来选择类别特征的词汇

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070121346A (ko) * 2006-06-22 2007-12-27 중앙대학교 산학협력단 감성인식 시스템 및 그 시스템에 있어서 특징집합 선택방법
CN108596335A (zh) * 2018-04-20 2018-09-28 浙江大学 一种基于深度强化学习的自适应众包方法
CN111652378A (zh) * 2019-05-23 2020-09-11 谷歌有限责任公司 学习来选择类别特征的词汇
CN111368936A (zh) * 2020-03-18 2020-07-03 中南大学 基于改进svm-rfe的特征选择方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A New Feature Selection Algorithm Based on Deep Q-Network;Xinqian Li et.al;《Proceedings of the 40th Chinese Control Conference》;第7100-7105页 *
Simplifying Reinforced Feature Selection via Restructured Choice Strategy of Single Agent;Xiaosa Zhao et.al;《arXiv:2009.09230v1 [cs.LG] 》;第2-8页 *
基于强化学习的特征选择算法;朱振国 等;《计算机系统应用》;第27卷(第10期);第214-218页 *

Also Published As

Publication number Publication date
CN112488188A (zh) 2021-03-12

Similar Documents

Publication Publication Date Title
Zhu et al. Breast cancer histopathology image classification through assembling multiple compact CNNs
CN111798921B (zh) 一种基于多尺度注意力卷积神经网络的rna结合蛋白预测方法及装置
US20200410660A1 (en) Image segmentation into overlapping tiles
Springenberg et al. Improving deep neural networks with probabilistic maxout units
Lin et al. Parameter tuning, feature selection and weight assignment of features for case-based reasoning by artificial immune system
Badawi et al. A hybrid memetic algorithm (genetic algorithm and great deluge local search) with back-propagation classifier for fish recognition
Silva-Rodriguez et al. Self-learning for weakly supervised gleason grading of local patterns
CN112488188B (zh) 一种基于深度强化学习的特征选择方法
Beikmohammadi et al. SWP-LeafNET: A novel multistage approach for plant leaf identification based on deep CNN
CN110163262A (zh) 模型训练方法、业务处理方法、装置、终端及存储介质
CN111370073B (zh) 一种基于深度学习的药物互作规则预测方法
US20200364549A1 (en) Predicting optical fiber manufacturing performance using neural network
CN112732583A (zh) 一种基于聚类和多种群遗传算法的软件测试数据生成方法
CN115331732A (zh) 基于图神经网络的基因表型训练、预测方法及装置
Sanida et al. Tomato leaf disease identification via two–stage transfer learning approach
CN111767216B (zh) 一种可缓解类重叠问题的跨版本深度缺陷预测方法
Too et al. Deep pruned nets for efficient image-based plants disease classification
Rojas-Thomas et al. Neural networks ensemble for automatic DNA microarray spot classification
JP3896868B2 (ja) パターンの特徴選択方法及び分類方法及び判定方法及びプログラム並びに装置
Shin et al. A novel method for fashion clothing image classification based on deep learning
Qu et al. Rethinking multiple instance learning for whole slide image classification: A good instance classifier is all you need
Ayan Genetic algorithm-based hyperparameter optimization for convolutional neural networks in the classification of crop pests
CN111445024B (zh) 一种医学影像识别训练方法
Nimitha et al. An improved deep convolutional neural network architecture for chromosome abnormality detection using hybrid optimization model
da Silva et al. A novel multi-objective grammar-based framework for the generation of convolutional neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant