CN112215290A - 基于Fisher得分的Q学习辅助数据分析方法及系统 - Google Patents

基于Fisher得分的Q学习辅助数据分析方法及系统 Download PDF

Info

Publication number
CN112215290A
CN112215290A CN202011110501.7A CN202011110501A CN112215290A CN 112215290 A CN112215290 A CN 112215290A CN 202011110501 A CN202011110501 A CN 202011110501A CN 112215290 A CN112215290 A CN 112215290A
Authority
CN
China
Prior art keywords
feature
current
subset
training
value table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011110501.7A
Other languages
English (en)
Other versions
CN112215290B (zh
Inventor
张莉
干敏
王邦军
屈蕴茜
周伟达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN202011110501.7A priority Critical patent/CN112215290B/zh
Publication of CN112215290A publication Critical patent/CN112215290A/zh
Application granted granted Critical
Publication of CN112215290B publication Critical patent/CN112215290B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • G06F18/21322Rendering the within-class scatter matrix non-singular
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • G06F18/21322Rendering the within-class scatter matrix non-singular
    • G06F18/21324Rendering the within-class scatter matrix non-singular involving projections, e.g. Fisherface techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于Fisher得分的Q学习辅助数据分析方法及系统,包括:将待处理数据输入训练样本中,初始化Q值表;从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态;判断本轮子集是否已满,若未满,则返回上一步,若已满,则继续判断是否满足迭代次数,若未满,则返回第二步,若已满,进入下一步;根据Q值表获得当前排序,返回目标子集。本发明不但提升速度快、更加稳定,且具有更好的泛化性能,时间复杂度较低。

Description

基于Fisher得分的Q学习辅助数据分析方法及系统
技术领域
本发明涉及数据分析的技术领域,尤其是指一种基于Fisher得分的Q学习辅助数据分析方法及系统。
背景技术
大数据时代来临,数据样本量和特征数都有不断增长的趋势,数据更新的速度和多样性等特点给现有的特征选择方法带来了新的挑战。将强化学习的方法应用到特征选择问题中来,使得特征选择可以应对数据结构的变化做出反应,并且随着数据增加而自动进行更新选择。Q学习是一种与模型无关的强化学习算法,以马尔科夫决策过程为理论基础。Q为状态行为对的Q价值,即在某一个时刻的状态s下,采取动作a能够获得收益的期望。算法的主要思想就是将s和a构建成一张Q值表来存储Q值,然后根据Q值来选取能够获得最大收益的策略。
Moran等人提出的好奇特征选择(CFS)就是一种应用Q学习形成的特征选择方法,其动作空间等于数据特征空间,状态空间为数据特征空间加上包含初始状态,奖励为当前迭代中部分数据测试精确度。CFS直接使用学习算法分类性能作为特征重要性程度的评价标准,虽然拥有较高的精确度,但泛化能力较差,时间复杂度较高。为了减少训练时间,同时可用于在线学习,每次片段只截取训练集中的部分数据模拟数据流。每个片段中的样本数据不多,受不同数据集分布情况影响,在获得奖励时的精确度不能很好代表数据集的真实情况,受异常值影响较大,反而效果不佳。
发明内容
为此,本发明所要解决的技术问题在于克服现有技术中泛化性能差,时间复杂度较高的问题,从而提供一种泛化性能好,时间复杂度较低的基于Fisher得分的Q学习辅助数据分析方法及系统。
为解决上述技术问题,本发明的一种基于Fisher得分的Q学习辅助数据分析方法,包括:将待处理数据输入训练样本中,初始化Q值表;从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态;判断本轮子集是否已满,若未满,则返回步骤S3,若已满,则继续判断是否满足迭代次数,若未满,则返回步骤S2,若已满,进入步骤S5;步骤S5:根据Q值表获得当前排序,返回目标子集。
在本发明的一个实施例中,初始化Q值表的方法为:设动作空间等于数据特征空间,状态空间为当前特征子集中特征个数空间,使每个状态代表先前已选择的特征个数,每个动作表示下一个要选择的特征索引。
在本发明的一个实施例中,所述状态空间s0表示还未选择任何特征,当前本轮选择的特征子集中特征个数为0,即s0=0。
在本发明的一个实施例中,计算所述片段中每个特征类内距离和类间距离的方法为:第k个特征的类内距离
Figure BDA0002728447200000021
Figure BDA0002728447200000022
所述类间距离
Figure BDA0002728447200000023
Figure BDA0002728447200000024
Figure BDA0002728447200000025
其中ni是第i类样本的样本数,
Figure BDA0002728447200000026
Figure BDA0002728447200000027
分别表示第i类样本中第k个特征的平均值和方差,μk是所有类中第k个特征的方差。
在本发明的一个实施例中,初始化本轮训练特征子集,获得本轮学习率和更新概率的方法为:初始化本轮训练特征子集
Figure BDA0002728447200000028
以及特征子集当前状态st=s0,本轮的学习率
Figure BDA0002728447200000029
和概率
Figure BDA00027284472000000210
T为当前迭代次数。
在本发明的一个实施例中,更新Q值表及本轮子集状态后,在当前状态st<d时,根据ε-贪婪从中选择一个特征at加入Fsel,其中d是特征个数Fsel
在本发明的一个实施例中,所述根据ε-贪婪从中选择一个特征at加入Fsel的方法为:
Figure BDA00027284472000000211
其中
Figure BDA00027284472000000212
表示从当前状态st下的可选特征
Figure BDA00027284472000000213
中选择Q值最大的特征,random(0,1)表示在0到1之间取任意实数,即模拟概率,
Figure BDA00027284472000000214
表示在
Figure BDA00027284472000000215
随机取一个特征,更新本轮训练特征子集Fsel=Fsel∪{at},
Figure BDA00027284472000000216
在本发明的一个实施例中,更新本轮训练特征子集Fsel后,计算本次行为特征子集的Fisher得分作为在当前状态下选择该动作后的奖励:
Figure BDA0002728447200000031
Figure BDA0002728447200000032
为第i个特征的类间距离,
Figure BDA0002728447200000033
为第i个特征的类内距离,其中i∈Fsel
在本发明的一个实施例中,计算Fisher得分后,计算Fisher得分后,更新Q值表及当前状态st
本发明还提供了一种基于Fisher得分的Q学习辅助数据分析系统,包括:数据预处理模块,用于将待处理数据输入训练样本中,初始化Q值表;片段初始模块,用于从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;片段训练模块,用于根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态;判断模块,用于判断本轮子集是否已满,若未满,则返回所述片段训练模块,若已满,则继续判断是否满足迭代次数,若未满,则返回所述片段初始模块,若已满,进入选择模块;选择模块:用于根据Q值表获得当前排序,返回目标子集。
本发明的上述技术方案相比现有技术具有以下优点:
本发明所述的基于Fisher得分的Q学习辅助数据分析方法及系统,所述步骤S1中,将待处理数据输入训练样本中,初始化Q值表,从而有利于对数据进行预处理;所述步骤S2中,从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率,模拟数据流从而有利于推广到动态特征选择中,特征选择时不需要在一开始获得所有样本,当样本增多时,不需要重新开始训练,可以在原来训练结果的基础上不断完善;所述步骤S3中,根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态,使用Q值表可以考虑到后续选择对当前选择的影响,将强化学习结合到特征选择中可以不断完善策略,可用于动态特征选择中;所述步骤S4中,判断本轮子集是否已满,若未满,则返回步骤S3,若已满,则继续判断是否满足迭代次数,若未满,则返回步骤S2;所述步骤S5中,根据Q值表获得当前排序,返回目标子集。整个过程,不但提升速度快、更加稳定,且具有更好的泛化性能,时间复杂度较低。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中
图1是本发明基于Fisher得分的Q学习辅助数据分析方法流程图;
图2是本发明使用不同算法进行特征选择后使用kNN分类器后的判断精确度的对比图;
图3是本发明使用不同算法进行特征选择后使用kNN分类器后的乳腺癌预后精确度的对比图。
具体实施方式
实施例一
如图1所示,本实施例提供一种基于Fisher得分的Q学习辅助数据分析方法,包括如下步骤:步骤S1:将待处理数据输入训练样本中,初始化Q值表;步骤S2:从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;步骤S3:根据Q值表选择当前状态下的动作,新更Q值表及本轮子集状态;步骤S4:判断本轮子集是否已满,若未满,则返回步骤S3,若已满,则继续判断是否满足迭代次数,若未满,则返回步骤S2;步骤S5:根据Q值表获得当前排序,返回目标子集。
本实施例所述基于Fisher得分的Q学习辅助数据分析方法,所述步骤S1中,将待处理数据输入训练样本中,初始化Q值表,从而有利于对数据进行预处理;所述步骤S2中,从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率,模拟数据流从而有利于推广到动态特征选择中,特征选择时不需要在一开始获得所有样本,当样本增多时,不需要重新开始训练,可以在原来训练结果的基础上不断完善;所述步骤S3中,根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态,使用Q值表可以考虑到后续选择对当前选择的影响,将强化学习结合到特征选择中可以不断完善策略,可用于动态特征选择中;所述步骤S4中,判断本轮子集是否已满,若未满,则返回步骤S3,若已满,则继续判断是否满足迭代次数,若未满,则返回步骤S2,若已满,进入步骤S5,从而有利于判断训练是否完成;所述步骤S5中,根据Q值表获得当前排序,返回目标子集。整个过程,不但提升速度快、更加稳定,且具有更好的泛化性能,时间复杂度较低。
所述步骤S1中,将待处理数据输入训练样本中的具体方法为:输入带标签训练数据集
Figure BDA0002728447200000051
n是训练数据的样本数,训练集中每一个样本可表示为xi=[fi1,fi2,...fid]t,特征向量为fk=[f1k,f2k,...,fnk]T,d是特征个数。
初始化Q值表的方法为:设动作空间等于数据特征空间,状态空间为当前特征子集中特征个数空间,使每个状态代表先前已选择的特征个数,每个动作表示下一个要选择的特征索引。
所述状态空间s0表示还未选择任何特征,当前本轮选择的特征子集中特征个数为0,即s0=0。
具体地,设动作空间等于数据特征空间,状态空间为当前特征子集中特征个数空间,即每个状态代表先前已选择的特征个数,例如状态空间s0表示还未选择任何特征,当前本轮选择的特征子集中特征个数为0,即s0=0。而每个动作表示下一个要选择的特征索引。
Figure BDA0002728447200000052
其中横轴表示状态,纵轴表示该状态下对应的行为。
参数:每个片段中数据样本个数Nepi;迭代次数即进行训练的片段个数Itr;衰减因子γ;学习率α和ε-贪婪的更新概率ε。
所述步骤S2中,计算所述片段中每个特征类内距离和类间距离的方法为:第k个特征的类内距离
Figure BDA0002728447200000053
为:
Figure BDA0002728447200000054
所述类间距离
Figure BDA0002728447200000055
为:
Figure BDA0002728447200000056
Figure BDA0002728447200000057
其中ni是第i类样本的样本数,
Figure BDA0002728447200000058
Figure BDA0002728447200000059
分别表示第i类样本中第k个特征的平均值和方差,μk是所有类中第k个特征的方差。
初始化本轮训练特征子集,获得本轮学习率和更新概率的方法为:初始化本轮训练特征子集
Figure BDA00027284472000000625
以及特征子集状态st=s0,本轮的学习率α和概率ε在设置时应随着迭代次数的增加而不断减小,如本轮的学习率
Figure BDA0002728447200000061
和概率
Figure BDA0002728447200000062
Figure BDA0002728447200000063
其中T为当前迭代次数,即已训练片段个数。
所述步骤S3中,更新Q值表及本轮子集状态后,在当前状态st<d时,根据ε-贪婪从中选择一个特征at加入Fsel,其中d是特征个数,Fsel是本轮训练特征子集。
根据ε-贪婪从中选择一个特征at加入Fsel的方法为:
Figure BDA0002728447200000064
Figure BDA0002728447200000065
其中
Figure BDA0002728447200000066
表示从当前状态st下的可选特征
Figure BDA0002728447200000067
中选择Q值最大的特征,random(0,1)表示在0到1之间取任意实数,即模拟概率,
Figure BDA0002728447200000068
表示在
Figure BDA0002728447200000069
随机取一个特征,更新本轮训练特征子集Fsel=Fsel∪{at},
Figure BDA00027284472000000610
更新本轮训练特征子集Fsel后,计算本次行为特征子集的Fisher得分作为在当前状态下选择该动作后的奖励:
Figure BDA00027284472000000611
Figure BDA00027284472000000612
为第i个特征的类间距离,
Figure BDA00027284472000000613
为第i个特征的类内距离,其中i∈Fsel
计算Fisher得分后,更新Q值表及当前状态st
下面详细论述每轮迭代的具体形式如下:
首先,初始化:从数据集中任意选择Nepi个数据组成本轮迭代的片段,设本轮训练特征子集
Figure BDA00027284472000000614
剩余可选特征
Figure BDA00027284472000000615
当前状态st=0,设置本轮的学习率α和概率ε。
其次,为该片段中每个特征计算类内距离和类间距离,且第k个特征的类内距离
Figure BDA00027284472000000616
和类间距离
Figure BDA00027284472000000617
可以计算为:
Figure BDA00027284472000000618
Figure BDA00027284472000000619
其中ni是第i类样本的样本数,
Figure BDA00027284472000000620
Figure BDA00027284472000000621
分别表示第i类样本中第k个特征的平均值和方差,μk是所有类中第k个特征的方差。
当st<d时,根据ε-贪婪从中选择一个特征at加入Fsel,选择的原则为:
Figure BDA00027284472000000622
Figure BDA00027284472000000623
表示从当前状态st下的可选特征
Figure BDA00027284472000000624
中选择Q值最大的特征,random(0,1)表示在0到1之间取任意实数,即模拟概率,
Figure BDA0002728447200000071
表示在
Figure BDA0002728447200000072
随机取一个特征;更新本轮训练特征子集Fsel=Fsel∪{at},
Figure BDA0002728447200000073
再次,计算本次行为的即时奖励r,即本轮训练特征子集的Fisher得分:
Figure BDA0002728447200000074
为第i个特征的类间距离,
Figure BDA0002728447200000075
为第i个特征的类内距离,其中i∈Fsel
最后,更新Q值表和特征子集当前状态,返回上一步进行下一个状态的选择,即返回至特征子集当前状态st<d时,根据ε-贪婪从中选择一个特征at加入Fsel。更新公式:
Figure BDA0002728447200000076
st=st+1
当st≥d时,本片段训练结束。
当Itr次迭代结束后,根据Q值表按需要选择前m个特征,返回目标特征子集G。具体步骤如下:
首先,初始化:特征子集
Figure BDA0002728447200000077
特征子集当前状态st=0。
当st<m时,选择一个特征at加入特征子集G中
Figure BDA0002728447200000078
更新G=G∪{at},
Figure BDA0002728447200000079
和当前状态st=st+1。
当st≥m时,由于st是当前已经选择的特征个数,总共要选择m个,因此当大于时可直接退出,直接返回目标特征子集G。
根据上述返回的目标特征子集生成新的样本矩阵,对新的待测样本在目标特征子集下用分类器L进行分类,得出分类结果判断。具体地,将处理好的数据可以放入分类器KNN、DT、Bayes、SVM等进行分类。
下面以在威斯康星州诊断乳腺癌(wdbc)和威斯康星州预后乳腺癌(wpbc)数据集上进行实施,给出了详细的实施方式和过程,但本发明的适用范围不限于下述的实例。
wdbc数据集中总共包含了569个乳腺癌实例,其中良性357例,恶性212例。数据集中共有32个属性,包括ID、诊断结果和30个实值输入特征。分别为每个细胞核的半径(从中心到周界各点的平均距离)、纹理(灰度值的标准偏差)、周长、面积、平滑度(半径长度的局部变化)、密实度(周长^2/面积-1.0)、凹度(轮廓凹陷部分的严重程度)、凹点(轮廓凹面部分的数量)、对称性、分形维数(“海岸线近似值”-1)等10个实值特征的平均值、标准误差和“最差”或最大值实验中将诊断结果作为目标,30个实值作为输入特征。
wdpc数据集总共包含了194个预后乳腺癌实例,其中复发46例,非复发148例。数据集中共有34个属性,包括ID、复发结果和32个实值输入特征。除与wdbc数据集相同的30个实值外,wdpc数据集中包括了复发时间。将除复发结果外的33个实值作为输入特征。
按4:1随机将两个数据集分为训练集和测试集,共进行30次实验。具体实施步骤如下:
对数据进行预处理,将待处理数据输入训练样本中,具体地,输入乳腺癌诊断带标签训练数据集
Figure BDA0002728447200000081
n是训练数据的样本数,训练集中每一个样本可表示为xi=[fi1,fi2,...fid]T,特征向量为fk=[f1k,f2k,…,fnk]T,d是特征个数为30(33),n为样本个数,为455(155)。在本实施例中,由于使用了两个数据集,但是两个数据集的大小并不一致,括号内的数据代表第二数据集的大小。
初始化Q值表,具体地,设动作空间等于数据特征空间,状态空间为当前特征子集中特征个数空间,即每个状态代表先前已选择的特征个数,例如状态空间s0表示还未选择任何特征,当前本轮选择的特征子集中特征个数为0,即s0=0。而每个动作表示下一个要选择的特征索引。
Figure BDA0002728447200000082
其中横轴表示状态,纵轴表示该状态下对应的行为。
参数:每个片段中数据样本个数Nepi=100;迭代次数即进行训练的片段个数Itr=2000;衰减因子γ=0.01;学习率α和ε-贪婪的更新概率ε。
从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集以及特征子集当前状态,获得本轮学习率和更新概率。
每轮迭代具体形式如下:
初始化:从数据集中任意选择Nepi个数据组成本轮迭代的片段,设本轮训练特征子集
Figure BDA0002728447200000091
剩余可选特征
Figure BDA0002728447200000092
特征子集当前状态st=s0,设置本轮的学习率
Figure BDA0002728447200000093
和概率
Figure BDA0002728447200000094
其中T为当前迭代次数,即已训练片段个数,T为当前迭代次数。
为该片段中每个特征计算类内距离和类间距离。第k个特征的类内距离
Figure BDA0002728447200000095
和类间距离
Figure BDA0002728447200000096
可以计算为:
Figure BDA0002728447200000097
Figure BDA0002728447200000098
其中ni是第i类样本的样本数,
Figure BDA0002728447200000099
Figure BDA00027284472000000910
分别表示第i类样本中第k个特征的平均值和方差,μk是所有类中第k个特征的方差。当st<d时,根据ε-贪婪从中选择一个特征at加入Fsel,选择的原则为
Figure BDA00027284472000000911
Figure BDA00027284472000000912
表示从初始状态st下的可选特征
Figure BDA00027284472000000913
中选择Q值最大的特征;random(0,1)表示在0到1之间取任意实数,即模拟概率;
Figure BDA00027284472000000914
表示在
Figure BDA00027284472000000915
取任意特征,更新Fsel=Fsel∪{at},
Figure BDA00027284472000000916
计算本次行为的即时奖励r,即特征子集的Fisher得分:
Figure BDA00027284472000000917
其中i∈Fsel
更新Q值表和特征子集当前迭代状态,返回上一步进行下一个状态的选择,即返回至当前状态st<d时,根据ε-贪婪从中选择一个特征at加入Fsel。更新公式:
Figure BDA00027284472000000918
st=st+1
当st≥d时,本片段训练结束。
当Itr次迭代结束后,根据Q值表按需要选择前m个特征,返回目标特征子集G。具体步骤如下:
初始化:特征子集
Figure BDA0002728447200000101
初始状态st=0;当st<m时,选择一个特征at加入特征子集G中
Figure BDA0002728447200000102
更新G=G∪{at},
Figure BDA0002728447200000103
和当前状态st=st+1。
根据上述返回的目标特征子集生成新的样本矩阵,对新的待测样本在目标特征子集下用分类器L进行分类,得出分类结果判断。
本发明的效果可以通过如下实验验证:
使用本发明的基于Fisher得分的Q学习辅助数据分析方法,以部分威斯康星州乳腺癌实例作为训练数据,对剩余实例作为测试数据集进行测试,可以发现本发明对乳腺癌的相关数据有效地完成了特征选择的任务。其中Base_line为不使用任何特征选择方法将所有特征放入分类器后的结果,FS是使用Fisher得分进行特征选择后的分类结果。为了公平起见,所有算法不设置阈值,获得子集排序后,精确度只计算最优策略。
在wdbc数据集中,传统FS方法选择的最佳特征子集中的特征个数为20。由图2可得,FS虽然排除了几个无关特征,但在最终分类时对精确度并无提升,与基准线持平皆为93.27%。加入强化学习后的两个算法都在一定程度上提高了最后的分类精度,并且随着迭代次数的增加,精确度逐渐提高并稳定,其中CFS最后稳定在94.2%左右,本方法则达到了95.2%左右。
如图3可得,在wpbc数据集中,基准线为72.9%,FS算法选择了2个特征精确度为73.16%。加入强化学习后,CFS精确度得到了提升,随着迭代次数的增加,精确度仍有波动。本方法在迭代过程中能够快速获得分类效果较好的特征子集,且比CFS具有更好的稳定性,最后结果达到了81.3%左右。
在这两个乳腺癌数据集上,本方法的选择结果从迭代初期就很快拥有良好的表现,与CFS方法相比,提升速度快且更加稳定。由此可知,在乳腺癌数据集上,通过部分样本计算得出的Fisher得分,比通过预测个别样本的精确度结果进行判别更能代表全局分布。
实施例二
基于同一发明构思,本实施例提供了一种基于Fisher得分的Q学习辅助数据分析系统,其解决问题的原理与所述基于Fisher得分的Q学习辅助数据分析方法类似,重复之处不再赘述。
本实施例提供一种基于Fisher得分的Q学习辅助数据分析系统,包括:
数据预处理模块,用于将待处理数据输入训练样本中,初始化Q值表;
片段初始模块,用于从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;
片段训练模块,用于根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态;
判断模块,用于判断本轮子集是否已满,若未满,则返回所述片段训练模块,若已满,则继续判断是否满足迭代次数,若未满,则返回所述片段初始模块,若已满,进入选择模块;
选择模块,用于根据Q值表获得当前排序,返回目标子集。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (10)

1.一种基于Fisher得分的Q学习辅助数据分析方法,其特征在于,包括如下步骤:
步骤S1:将待处理数据输入训练样本中,初始化Q值表;
步骤S2:从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;
步骤S3:根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态;
步骤S4:判断本轮子集是否已满,若未满,则返回步骤S3,若已满,则继续判断是否满足迭代次数,若未满,则返回步骤S2,若已满,进入步骤S5;
步骤S5:根据Q值表获得当前排序,返回目标子集。
2.根据权利要求1所述的基于Fisher得分的Q学习辅助数据分析方法,其特征在于:初始化Q值表的方法为:设动作空间等于数据特征空间,状态空间为当前特征子集中特征个数空间,使每个状态代表先前已选择的特征个数,每个动作表示下一个要选择的特征索引。
3.根据权利要求2所述的基于Fisher得分的Q学习辅助数据分析方法,其特征在于:所述状态空间s0表示还未选择任何特征,当前本轮选择的特征子集中特征个数为0,即s0=0。
4.根据权利要求1所述的基于Fisher得分的Q学习辅助数据分析方法,其特征在于:计算所述片段中每个特征类内距离和类间距离的方法为:第k个特征的类内距离
Figure FDA0002728447190000011
为:
Figure FDA0002728447190000012
所述类间距离
Figure FDA0002728447190000013
为:
Figure FDA0002728447190000014
其中ni是第i类样本的样本数,
Figure FDA0002728447190000015
Figure FDA0002728447190000016
分别表示第i类样本中第k个特征的平均值和方差,μk是所有类中第k个特征的方差。
5.根据权利要求1所述的基于Fisher得分的Q学习辅助数据分析方法,其特征在于:初始化本轮训练特征子集,获得本轮学习率和更新概率的方法为:初始化本轮训练特征子集
Figure FDA0002728447190000021
以及特征子集当前状态st=s0,本轮的学习率
Figure FDA0002728447190000022
和概率
Figure FDA0002728447190000023
T为当前迭代次数。
6.根据权利要求5所述的基于Fisher得分的Q学习辅助数据分析方法,其特征在于:更新Q值表及本轮子集状态后,在特征子集当前状态st<d时,根据ε-贪婪从中选择一个特征at加入Fsel,其中d是特征个数Fsel
7.根据权利要求6所述的基于Fisher得分的Q学习辅助数据分析方法,其特征在于:所述根据ε-贪婪从中选择一个特征at加入Fsel的方法为:
Figure FDA0002728447190000024
Figure FDA0002728447190000025
其中
Figure FDA0002728447190000026
表示从当前状态st下的可选特征
Figure FDA0002728447190000027
中选择Q值最大的特征,random(0,1)表示在0到1之间取任意实数,即模拟概率,
Figure FDA0002728447190000028
表示在
Figure FDA0002728447190000029
随机取一个特征,更新本轮训练特征子集Fsel=Fsel∪{at},
Figure FDA00027284471900000210
8.根据权利要求7所述的基于Fisher得分的Q学习辅助数据分析方法,其特征在于:更新本轮训练特征子集Fsel后,计算本次行为特征子集的Fisher得分作为在当前状态下选择该动作后的奖励:
Figure FDA00027284471900000211
Figure FDA00027284471900000212
为第i个特征的类间距离,
Figure FDA00027284471900000213
为第i个特征的类内距离,其中i∈Fsel
9.根据权利要求8所述的基于Fisher得分的Q学习辅助数据分析方法,其特征在于:计算Fisher得分后,更新Q值表及当前状态st
10.一种基于Fisher得分的Q学习辅助数据分析系统,其特征在于,包括:
数据预处理模块,用于将待处理数据输入训练样本中,初始化Q值表;
片段初始模块,用于从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;
片段训练模块,用于根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态;
判断模块,用于判断本轮子集是否已满,若未满,则返回所述片段训练模块,若已满,则继续判断是否满足迭代次数,若未满,则返回所述片段初始模块,若已满,进入选择模块;
选择模块,用于根据Q值表获得当前排序,返回目标子集。
CN202011110501.7A 2020-10-16 2020-10-16 基于Fisher得分的Q学习辅助数据分析方法及系统 Active CN112215290B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011110501.7A CN112215290B (zh) 2020-10-16 2020-10-16 基于Fisher得分的Q学习辅助数据分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011110501.7A CN112215290B (zh) 2020-10-16 2020-10-16 基于Fisher得分的Q学习辅助数据分析方法及系统

Publications (2)

Publication Number Publication Date
CN112215290A true CN112215290A (zh) 2021-01-12
CN112215290B CN112215290B (zh) 2024-04-09

Family

ID=74055598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011110501.7A Active CN112215290B (zh) 2020-10-16 2020-10-16 基于Fisher得分的Q学习辅助数据分析方法及系统

Country Status (1)

Country Link
CN (1) CN112215290B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200135A (zh) * 2014-08-30 2014-12-10 北京工业大学 基于MFA score和排除冗余的基因表达谱特征选择方法
CN105740653A (zh) * 2016-01-27 2016-07-06 北京工业大学 基于LLRFC和相关性分析去除冗余的特征选择方法LLRFC score+
CN106601235A (zh) * 2016-12-02 2017-04-26 厦门理工学院 一种半监督多任务特征选择的语音识别方法
CN109726866A (zh) * 2018-12-27 2019-05-07 浙江农林大学 基于q学习神经网络的无人船路径规划方法
CN110287177A (zh) * 2019-06-11 2019-09-27 嘉兴深拓科技有限公司 一种基于特权信息的特征选择方法
CN110688934A (zh) * 2019-09-23 2020-01-14 云南电网有限责任公司电力科学研究院 一种空间采样主动学习分类方法、电子设备及存储介质
CN110753383A (zh) * 2019-07-24 2020-02-04 北京工业大学 雾计算中一种基于强化学习的安全中继节点选择方法
CN111009321A (zh) * 2019-08-14 2020-04-14 电子科技大学 一种机器学习分类模型在青少年孤独症辅助诊断中的应用方法
CN111368936A (zh) * 2020-03-18 2020-07-03 中南大学 基于改进svm-rfe的特征选择方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200135A (zh) * 2014-08-30 2014-12-10 北京工业大学 基于MFA score和排除冗余的基因表达谱特征选择方法
CN105740653A (zh) * 2016-01-27 2016-07-06 北京工业大学 基于LLRFC和相关性分析去除冗余的特征选择方法LLRFC score+
CN106601235A (zh) * 2016-12-02 2017-04-26 厦门理工学院 一种半监督多任务特征选择的语音识别方法
CN109726866A (zh) * 2018-12-27 2019-05-07 浙江农林大学 基于q学习神经网络的无人船路径规划方法
CN110287177A (zh) * 2019-06-11 2019-09-27 嘉兴深拓科技有限公司 一种基于特权信息的特征选择方法
CN110753383A (zh) * 2019-07-24 2020-02-04 北京工业大学 雾计算中一种基于强化学习的安全中继节点选择方法
CN111009321A (zh) * 2019-08-14 2020-04-14 电子科技大学 一种机器学习分类模型在青少年孤独症辅助诊断中的应用方法
CN110688934A (zh) * 2019-09-23 2020-01-14 云南电网有限责任公司电力科学研究院 一种空间采样主动学习分类方法、电子设备及存储介质
CN111368936A (zh) * 2020-03-18 2020-07-03 中南大学 基于改进svm-rfe的特征选择方法

Also Published As

Publication number Publication date
CN112215290B (zh) 2024-04-09

Similar Documents

Publication Publication Date Title
US8756174B2 (en) Forward feature selection for support vector machines
CN107305637B (zh) 基于K-Means算法的数据聚类方法和装置
CN107292097B (zh) 基于特征组的中医主症选择方法
CN108877947B (zh) 基于迭代均值聚类的深度样本学习方法
CN111062425B (zh) 基于c-k-smote算法的不平衡数据集处理方法
Zhang et al. Feature selection for high dimensional imbalanced class data based on F-measure optimization
Solorio-Fernández et al. A systematic evaluation of filter Unsupervised Feature Selection methods
CN113541985B (zh) 物联网故障诊断方法、模型的训练方法及相关装置
Xue et al. An archive based particle swarm optimisation for feature selection in classification
CN114663770A (zh) 一种基于集成聚类波段选择的高光谱图像分类方法及系统
CN114882531A (zh) 一种基于深度学习的跨域行人再识别方法
CN114417095A (zh) 一种数据集划分方法及装置
CN112215290A (zh) 基于Fisher得分的Q学习辅助数据分析方法及系统
CN117036897A (zh) 一种基于Meta RCNN的少样本目标检测方法
WO2019149133A1 (zh) 资源处理方法、存储介质和计算机设备
CN116629376A (zh) 一种基于无数据蒸馏的联邦学习聚合方法和系统
CN110796198A (zh) 基于混合蚁群优化算法的高维特征筛选方法
CN112686881B (zh) 基于影像统计特征和lstm复合网络的颗粒物料混合均匀性检测方法
Ma et al. A membership-based resampling and cleaning algorithm for multi-class imbalanced overlapping data
CN113837293A (zh) mRNA亚细胞定位模型训练方法、定位方法及可读存储介质
Wang et al. Prediction of protein structural class based on reliefF-SVM
Liang et al. ASE: Anomaly Scoring Based Ensemble Learning for Imbalanced Datasets
Ding et al. Credit scoring using ensemble classification based on variable weighting clustering
CN111108516A (zh) 使用深度学习算法来评价输入数据
US11875555B2 (en) Applying self-confidence in multi-label classification to model training

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant