CN112215290B - 基于Fisher得分的Q学习辅助数据分析方法及系统 - Google Patents
基于Fisher得分的Q学习辅助数据分析方法及系统 Download PDFInfo
- Publication number
- CN112215290B CN112215290B CN202011110501.7A CN202011110501A CN112215290B CN 112215290 B CN112215290 B CN 112215290B CN 202011110501 A CN202011110501 A CN 202011110501A CN 112215290 B CN112215290 B CN 112215290B
- Authority
- CN
- China
- Prior art keywords
- feature
- subset
- round
- training
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000007405 data analysis Methods 0.000 title claims abstract description 21
- 238000012549 training Methods 0.000 claims abstract description 83
- 230000009471 action Effects 0.000 claims abstract description 25
- 206010006187 Breast cancer Diseases 0.000 claims description 12
- 208000026310 Breast neoplasm Diseases 0.000 claims description 12
- 230000006399 behavior Effects 0.000 claims description 9
- 238000004088 simulation Methods 0.000 claims description 9
- 239000012634 fragment Substances 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 210000003855 cell nucleus Anatomy 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 5
- 238000004590 computer program Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000002787 reinforcement Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000010187 selection method Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
- G06F18/21322—Rendering the within-class scatter matrix non-singular
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
- G06F18/21322—Rendering the within-class scatter matrix non-singular
- G06F18/21324—Rendering the within-class scatter matrix non-singular involving projections, e.g. Fisherface techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于Fisher得分的Q学习辅助数据分析方法及系统,包括:将待处理数据输入训练样本中,初始化Q值表;从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态;判断本轮子集是否已满,若未满,则返回上一步,若已满,则继续判断是否满足迭代次数,若未满,则返回第二步,若已满,进入下一步;根据Q值表获得当前排序,返回目标子集。本发明不但提升速度快、更加稳定,且具有更好的泛化性能,时间复杂度较低。
Description
技术领域
本发明涉及数据分析的技术领域,尤其是指一种基于Fisher得分的Q学习辅助数据分析方法及系统。
背景技术
大数据时代来临,数据样本量和特征数都有不断增长的趋势,数据更新的速度和多样性等特点给现有的特征选择方法带来了新的挑战。将强化学习的方法应用到特征选择问题中来,使得特征选择可以应对数据结构的变化做出反应,并且随着数据增加而自动进行更新选择。Q学习是一种与模型无关的强化学习算法,以马尔科夫决策过程为理论基础。Q为状态行为对的Q价值,即在某一个时刻的状态s下,采取动作a能够获得收益的期望。算法的主要思想就是将s和a构建成一张Q值表来存储Q值,然后根据Q值来选取能够获得最大收益的策略。
Moran等人提出的好奇特征选择(CFS)就是一种应用Q学习形成的特征选择方法,其动作空间等于数据特征空间,状态空间为数据特征空间加上包含初始状态,奖励为当前迭代中部分数据测试精确度。CFS直接使用学习算法分类性能作为特征重要性程度的评价标准,虽然拥有较高的精确度,但泛化能力较差,时间复杂度较高。为了减少训练时间,同时可用于在线学习,每次片段只截取训练集中的部分数据模拟数据流。每个片段中的样本数据不多,受不同数据集分布情况影响,在获得奖励时的精确度不能很好代表数据集的真实情况,受异常值影响较大,反而效果不佳。
发明内容
为此,本发明所要解决的技术问题在于克服现有技术中泛化性能差,时间复杂度较高的问题,从而提供一种泛化性能好,时间复杂度较低的基于Fisher得分的Q学习辅助数据分析方法及系统。
为解决上述技术问题,本发明的一种基于Fisher得分的Q学习辅助数据分析方法,包括:将待处理数据输入训练样本中,初始化Q值表;从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态;判断本轮子集是否已满,若未满,则返回步骤S3,若已满,则继续判断是否满足迭代次数,若未满,则返回步骤S2,若已满,进入步骤S5;步骤S5:根据Q值表获得当前排序,返回目标子集。
在本发明的一个实施例中,初始化Q值表的方法为:设动作空间等于数据特征空间,状态空间为当前特征子集中特征个数空间,使每个状态代表先前已选择的特征个数,每个动作表示下一个要选择的特征索引。
在本发明的一个实施例中,所述状态空间s0表示还未选择任何特征,当前本轮选择的特征子集中特征个数为0,即s0=0。
在本发明的一个实施例中,计算所述片段中每个特征类内距离和类间距离的方法为:第k个特征的类内距离为/>所述类间距离/>为/> 其中ni是第i类样本的样本数,/>和/>分别表示第i类样本中第k个特征的平均值和方差,μk是所有类中第k个特征的方差。
在本发明的一个实施例中,初始化本轮训练特征子集,获得本轮学习率和更新概率的方法为:初始化本轮训练特征子集以及特征子集当前状态st=s0,本轮的学习率/>和概率/>T为当前迭代次数。
在本发明的一个实施例中,更新Q值表及本轮子集状态后,在当前状态st<d时,根据ε-贪婪从中选择一个特征at加入Fsel,其中d是特征个数Fsel。
在本发明的一个实施例中,所述根据ε-贪婪从中选择一个特征at加入Fsel的方法为:其中/>表示从当前状态st下的可选特征中选择Q值最大的特征,random(0,1)表示在0到1之间取任意实数,即模拟概率,/>表示在/>随机取一个特征,更新本轮训练特征子集Fsel=Fsel∪{at},/>
在本发明的一个实施例中,更新本轮训练特征子集Fsel后,计算本次行为特征子集的Fisher得分作为在当前状态下选择该动作后的奖励: 为第i个特征的类间距离,/>为第i个特征的类内距离,其中i∈Fsel。
在本发明的一个实施例中,计算Fisher得分后,计算Fisher得分后,更新Q值表及当前状态st。
本发明还提供了一种基于Fisher得分的Q学习辅助数据分析系统,包括:数据预处理模块,用于将待处理数据输入训练样本中,初始化Q值表;片段初始模块,用于从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;片段训练模块,用于根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态;判断模块,用于判断本轮子集是否已满,若未满,则返回所述片段训练模块,若已满,则继续判断是否满足迭代次数,若未满,则返回所述片段初始模块,若已满,进入选择模块;选择模块:用于根据Q值表获得当前排序,返回目标子集。
本发明的上述技术方案相比现有技术具有以下优点:
本发明所述的基于Fisher得分的Q学习辅助数据分析方法及系统,所述步骤S1中,将待处理数据输入训练样本中,初始化Q值表,从而有利于对数据进行预处理;所述步骤S2中,从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率,模拟数据流从而有利于推广到动态特征选择中,特征选择时不需要在一开始获得所有样本,当样本增多时,不需要重新开始训练,可以在原来训练结果的基础上不断完善;所述步骤S3中,根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态,使用Q值表可以考虑到后续选择对当前选择的影响,将强化学习结合到特征选择中可以不断完善策略,可用于动态特征选择中;所述步骤S4中,判断本轮子集是否已满,若未满,则返回步骤S3,若已满,则继续判断是否满足迭代次数,若未满,则返回步骤S2;所述步骤S5中,根据Q值表获得当前排序,返回目标子集。整个过程,不但提升速度快、更加稳定,且具有更好的泛化性能,时间复杂度较低。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中
图1是本发明基于Fisher得分的Q学习辅助数据分析方法流程图;
图2是本发明使用不同算法进行特征选择后使用kNN分类器后的判断精确度的对比图;
图3是本发明使用不同算法进行特征选择后使用kNN分类器后的乳腺癌预后精确度的对比图。
具体实施方式
实施例一
如图1所示,本实施例提供一种基于Fisher得分的Q学习辅助数据分析方法,包括如下步骤:步骤S1:将待处理数据输入训练样本中,初始化Q值表;步骤S2:从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;步骤S3:根据Q值表选择当前状态下的动作,新更Q值表及本轮子集状态;步骤S4:判断本轮子集是否已满,若未满,则返回步骤S3,若已满,则继续判断是否满足迭代次数,若未满,则返回步骤S2;步骤S5:根据Q值表获得当前排序,返回目标子集。
本实施例所述基于Fisher得分的Q学习辅助数据分析方法,所述步骤S1中,将待处理数据输入训练样本中,初始化Q值表,从而有利于对数据进行预处理;所述步骤S2中,从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率,模拟数据流从而有利于推广到动态特征选择中,特征选择时不需要在一开始获得所有样本,当样本增多时,不需要重新开始训练,可以在原来训练结果的基础上不断完善;所述步骤S3中,根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态,使用Q值表可以考虑到后续选择对当前选择的影响,将强化学习结合到特征选择中可以不断完善策略,可用于动态特征选择中;所述步骤S4中,判断本轮子集是否已满,若未满,则返回步骤S3,若已满,则继续判断是否满足迭代次数,若未满,则返回步骤S2,若已满,进入步骤S5,从而有利于判断训练是否完成;所述步骤S5中,根据Q值表获得当前排序,返回目标子集。整个过程,不但提升速度快、更加稳定,且具有更好的泛化性能,时间复杂度较低。
所述步骤S1中,将待处理数据输入训练样本中的具体方法为:输入带标签训练数据集n是训练数据的样本数,训练集中每一个样本可表示为xi=[fi1,fi2,...fid]t,特征向量为fk=[f1k,f2k,...,fnk]T,d是特征个数。
初始化Q值表的方法为:设动作空间等于数据特征空间,状态空间为当前特征子集中特征个数空间,使每个状态代表先前已选择的特征个数,每个动作表示下一个要选择的特征索引。
所述状态空间s0表示还未选择任何特征,当前本轮选择的特征子集中特征个数为0,即s0=0。
具体地,设动作空间等于数据特征空间,状态空间为当前特征子集中特征个数空间,即每个状态代表先前已选择的特征个数,例如状态空间s0表示还未选择任何特征,当前本轮选择的特征子集中特征个数为0,即s0=0。而每个动作表示下一个要选择的特征索引。
设其中横轴表示状态,纵轴表示该状态下对应的行为。
参数:每个片段中数据样本个数Nepi;迭代次数即进行训练的片段个数Itr;衰减因子γ;学习率α和ε-贪婪的更新概率ε。
所述步骤S2中,计算所述片段中每个特征类内距离和类间距离的方法为:第k个特征的类内距离为:/>所述类间距离/>为:/> 其中ni是第i类样本的样本数,/>和/>分别表示第i类样本中第k个特征的平均值和方差,μk是所有类中第k个特征的方差。
初始化本轮训练特征子集,获得本轮学习率和更新概率的方法为:初始化本轮训练特征子集以及特征子集状态st=s0,本轮的学习率α和概率ε在设置时应随着迭代次数的增加而不断减小,如本轮的学习率/>和概率/> 其中T为当前迭代次数,即已训练片段个数。
所述步骤S3中,更新Q值表及本轮子集状态后,在当前状态st<d时,根据ε-贪婪从中选择一个特征at加入Fsel,其中d是特征个数,Fsel是本轮训练特征子集。
根据ε-贪婪从中选择一个特征at加入Fsel的方法为: 其中/>表示从当前状态st下的可选特征/>中选择Q值最大的特征,random(0,1)表示在0到1之间取任意实数,即模拟概率,/>表示在/>随机取一个特征,更新本轮训练特征子集Fsel=Fsel∪{at},/>
更新本轮训练特征子集Fsel后,计算本次行为特征子集的Fisher得分作为在当前状态下选择该动作后的奖励: 为第i个特征的类间距离,/>为第i个特征的类内距离,其中i∈Fsel。
计算Fisher得分后,更新Q值表及当前状态st。
下面详细论述每轮迭代的具体形式如下:
首先,初始化:从数据集中任意选择Nepi个数据组成本轮迭代的片段,设本轮训练特征子集剩余可选特征/>当前状态st=0,设置本轮的学习率α和概率ε。
其次,为该片段中每个特征计算类内距离和类间距离,且第k个特征的类内距离和类间距离/>可以计算为:
其中ni是第i类样本的样本数,和/>分别表示第i类样本中第k个特征的平均值和方差,μk是所有类中第k个特征的方差。
当st<d时,根据ε-贪婪从中选择一个特征at加入Fsel,选择的原则为:
表示从当前状态st下的可选特征/>中选择Q值最大的特征,random(0,1)表示在0到1之间取任意实数,即模拟概率,/>表示在/>随机取一个特征;更新本轮训练特征子集Fsel=Fsel∪{at},/>
再次,计算本次行为的即时奖励r,即本轮训练特征子集的Fisher得分:为第i个特征的类间距离,/>为第i个特征的类内距离,其中i∈Fsel
最后,更新Q值表和特征子集当前状态,返回上一步进行下一个状态的选择,即返回至特征子集当前状态st<d时,根据ε-贪婪从中选择一个特征at加入Fsel。更新公式:
st=st+1
当st≥d时,本片段训练结束。
当Itr次迭代结束后,根据Q值表按需要选择前m个特征,返回目标特征子集G。具体步骤如下:
首先,初始化:特征子集特征子集当前状态st=0。
当st<m时,选择一个特征at加入特征子集G中
更新G=G∪{at},和当前状态st=st+1。
当st≥m时,由于st是当前已经选择的特征个数,总共要选择m个,因此当大于时可直接退出,直接返回目标特征子集G。
根据上述返回的目标特征子集生成新的样本矩阵,对新的待测样本在目标特征子集下用分类器L进行分类,得出分类结果判断。具体地,将处理好的数据可以放入分类器KNN、DT、Bayes、SVM等进行分类。
下面以在威斯康星州诊断乳腺癌(wdbc)和威斯康星州预后乳腺癌(wpbc)数据集上进行实施,给出了详细的实施方式和过程,但本发明的适用范围不限于下述的实例。
wdbc数据集中总共包含了569个乳腺癌实例,其中良性357例,恶性212例。数据集中共有32个属性,包括ID、诊断结果和30个实值输入特征。分别为每个细胞核的半径(从中心到周界各点的平均距离)、纹理(灰度值的标准偏差)、周长、面积、平滑度(半径长度的局部变化)、密实度(周长^2/面积-1.0)、凹度(轮廓凹陷部分的严重程度)、凹点(轮廓凹面部分的数量)、对称性、分形维数(“海岸线近似值”-1)等10个实值特征的平均值、标准误差和“最差”或最大值实验中将诊断结果作为目标,30个实值作为输入特征。
wdpc数据集总共包含了194个预后乳腺癌实例,其中复发46例,非复发148例。数据集中共有34个属性,包括ID、复发结果和32个实值输入特征。除与wdbc数据集相同的30个实值外,wdpc数据集中包括了复发时间。将除复发结果外的33个实值作为输入特征。
按4:1随机将两个数据集分为训练集和测试集,共进行30次实验。具体实施步骤如下:
对数据进行预处理,将待处理数据输入训练样本中,具体地,输入乳腺癌诊断带标签训练数据集n是训练数据的样本数,训练集中每一个样本可表示为xi=[fi1,fi2,...fid]T,特征向量为fk=[f1k,f2k,…,fnk]T,d是特征个数为30(33),n为样本个数,为455(155)。在本实施例中,由于使用了两个数据集,但是两个数据集的大小并不一致,括号内的数据代表第二数据集的大小。
初始化Q值表,具体地,设动作空间等于数据特征空间,状态空间为当前特征子集中特征个数空间,即每个状态代表先前已选择的特征个数,例如状态空间s0表示还未选择任何特征,当前本轮选择的特征子集中特征个数为0,即s0=0。而每个动作表示下一个要选择的特征索引。
设其中横轴表示状态,纵轴表示该状态下对应的行为。
参数:每个片段中数据样本个数Nepi=100;迭代次数即进行训练的片段个数Itr=2000;衰减因子γ=0.01;学习率α和ε-贪婪的更新概率ε。
从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集以及特征子集当前状态,获得本轮学习率和更新概率。
每轮迭代具体形式如下:
初始化:从数据集中任意选择Nepi个数据组成本轮迭代的片段,设本轮训练特征子集剩余可选特征/>特征子集当前状态st=s0,设置本轮的学习率/>和概率/>其中T为当前迭代次数,即已训练片段个数,T为当前迭代次数。
为该片段中每个特征计算类内距离和类间距离。第k个特征的类内距离和类间距离/>可以计算为:
其中ni是第i类样本的样本数,和/>分别表示第i类样本中第k个特征的平均值和方差,μk是所有类中第k个特征的方差。当st<d时,根据ε-贪婪从中选择一个特征at加入Fsel,选择的原则为
表示从初始状态st下的可选特征/>中选择Q值最大的特征;random(0,1)表示在0到1之间取任意实数,即模拟概率;/>表示在/>取任意特征,更新Fsel=Fsel∪{at},/>
计算本次行为的即时奖励r,即特征子集的Fisher得分:其中i∈Fsel。
更新Q值表和特征子集当前迭代状态,返回上一步进行下一个状态的选择,即返回至当前状态st<d时,根据ε-贪婪从中选择一个特征at加入Fsel。更新公式:
st=st+1
当st≥d时,本片段训练结束。
当Itr次迭代结束后,根据Q值表按需要选择前m个特征,返回目标特征子集G。具体步骤如下:
初始化:特征子集初始状态st=0;当st<m时,选择一个特征at加入特征子集G中
更新G=G∪{at},和当前状态st=st+1。
根据上述返回的目标特征子集生成新的样本矩阵,对新的待测样本在目标特征子集下用分类器L进行分类,得出分类结果判断。
本发明的效果可以通过如下实验验证:
使用本发明的基于Fisher得分的Q学习辅助数据分析方法,以部分威斯康星州乳腺癌实例作为训练数据,对剩余实例作为测试数据集进行测试,可以发现本发明对乳腺癌的相关数据有效地完成了特征选择的任务。其中Base_line为不使用任何特征选择方法将所有特征放入分类器后的结果,FS是使用Fisher得分进行特征选择后的分类结果。为了公平起见,所有算法不设置阈值,获得子集排序后,精确度只计算最优策略。
在wdbc数据集中,传统FS方法选择的最佳特征子集中的特征个数为20。由图2可得,FS虽然排除了几个无关特征,但在最终分类时对精确度并无提升,与基准线持平皆为93.27%。加入强化学习后的两个算法都在一定程度上提高了最后的分类精度,并且随着迭代次数的增加,精确度逐渐提高并稳定,其中CFS最后稳定在94.2%左右,本方法则达到了95.2%左右。
如图3可得,在wpbc数据集中,基准线为72.9%,FS算法选择了2个特征精确度为73.16%。加入强化学习后,CFS精确度得到了提升,随着迭代次数的增加,精确度仍有波动。本方法在迭代过程中能够快速获得分类效果较好的特征子集,且比CFS具有更好的稳定性,最后结果达到了81.3%左右。
在这两个乳腺癌数据集上,本方法的选择结果从迭代初期就很快拥有良好的表现,与CFS方法相比,提升速度快且更加稳定。由此可知,在乳腺癌数据集上,通过部分样本计算得出的Fisher得分,比通过预测个别样本的精确度结果进行判别更能代表全局分布。
实施例二
基于同一发明构思,本实施例提供了一种基于Fisher得分的Q学习辅助数据分析系统,其解决问题的原理与所述基于Fisher得分的Q学习辅助数据分析方法类似,重复之处不再赘述。
本实施例提供一种基于Fisher得分的Q学习辅助数据分析系统,包括:
数据预处理模块,用于将待处理数据输入训练样本中,初始化Q值表;
片段初始模块,用于从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;
片段训练模块,用于根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态;
判断模块,用于判断本轮子集是否已满,若未满,则返回所述片段训练模块,若已满,则继续判断是否满足迭代次数,若未满,则返回所述片段初始模块,若已满,进入选择模块;
选择模块,用于根据Q值表获得当前排序,返回目标子集。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (4)
1.一种基于Fisher得分的Q学习辅助数据分析方法,其特征在于,包括如下步骤:
步骤S1:将待处理数据输入训练样本中,初始化Q值表,包括:输入乳腺癌诊断带标签训练数据集n是训练数据的样本数,训练集中每一个样本可表示为xi=[fi1,fi2,…fid]T,特征向量为fk=[f1k,f2k,...,fnk]T,d是特征个数;设动作空间等于数据特征空间,状态空间为当前特征子集中特征个数空间,使每个状态代表先前已选择的特征个数,每个动作表示下一个要选择的特征索引,其中xi为实值输入特征,yi为诊断结果,且所述实值输入特征包括每个细胞核的半径、纹理、周长、面积、平滑度、密实度、凹度、凹点、对称性、分形维数的平均值、标准误差和最差或最大值;
步骤S2:从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;每轮迭代具体形式如下:
初始化:从数据集中任意选择Nepi个数据组成本轮迭代的片段,设本轮训练特征子集剩余可选特征/>特征子集当前状态st=s0,设置本轮的学习率和概率/>其中T为当前迭代次数,即已训练片段个数;
为该片段中每个特征计算类内距离和类间距离,第k个特征的类内距离和类间距离可以计算为:
其中ni是第i类样本的样本数,和/>分别表示第i类样本中第k个特征的平均值和方差,μk是所有类中第k个特征的方差,当st<d时,根据ε-贪婪从中选择一个特征at加入Fsel,选择的原则为
表示从初始状态st下的可选特征/>中选择Q值最大的特征;random(0,1)表示在0到1之间取任意实数,即模拟概率;/>表示在/>取任意特征,更新Fsel=Fsel∪{at},/>
计算本次行为的即时奖励r,即特征子集的Fisher得分:其中i∈Fsel;
步骤S3:根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态;
步骤S4:判断本轮子集是否已满,若未满,则返回步骤S3,若已满,则继续判断是否满足迭代次数,若未满足,则返回步骤S2,若已满足,进入步骤S5;
步骤S5:根据Q值表获得当前排序,返回目标子集,根据所述目标子集生成新的样本矩阵,对新的待测样本在目标特征子集下用分类器进行分类,判断分类结果;
其中更新Q值表和特征子集当前迭代状态,返回上一步进行下一个状态的选择,即返回至当前状态st<d时,根据ε-贪婪从中选择一个特征at加入Fsel,更新公式:
st=st+1
当st≥d时,本片段训练结束;
当Itr次迭代结束后,根据Q值表按需要选择前m个特征,返回目标特征子集G,具体步骤如下:
初始化:特征子集初始状态st=0;当st<m时,选择一个特征at加入特征子集G中
更新G=G∪{at},和当前状态st=st+1;
根据上述返回的目标特征子集生成新的样本矩阵,对新的待测样本在目标特征子集下用分类器L进行分类,得出分类结果判断。
2.根据权利要求1所述的基于Fisher得分的Q学习辅助数据分析方法,其特征在于:所述状态空间s0表示还未选择任何特征,当前本轮选择的特征子集中特征个数为0,即s0=0。
3.根据权利要求1所述的基于Fisher得分的Q学习辅助数据分析方法,其特征在于:计算Fisher得分后,更新Q值表及当前状态st。
4.一种基于Fisher得分的Q学习辅助数据分析系统,其特征在于,包括:
数据预处理模块,用于将待处理数据输入训练样本中,初始化Q值表,包括:输入乳腺癌诊断带标签训练数据集n是训练数据的样本数,训练集中每一个样本可表示为xi=[fi1,fi2,…fid]T,特征向量为fk=[f1k,f2k,...,fnk]T,d是特征个数;设动作空间等于数据特征空间,状态空间为当前特征子集中特征个数空间,使每个状态代表先前已选择的特征个数,每个动作表示下一个要选择的特征索引,其中xi为实值输入特征,yi为诊断结果,且所述实值输入特征包括每个细胞核的半径、纹理、周长、面积、平滑度、密实度、凹度、凹点、对称性、分形维数的平均值、标准误差和最差或最大值;
片段初始模块,用于从所述训练样本中任意选择多个数据组成本轮迭代的片段,计算所述片段中每个特征类内距离和类间距离,初始化本轮训练特征子集,获得本轮学习率和更新概率;每轮迭代具体形式如下:
初始化:从数据集中任意选择Nepi个数据组成本轮迭代的片段,设本轮训练特征子集剩余可选特征/>特征子集当前状态st=s0,设置本轮的学习率和概率/>其中T为当前迭代次数,即已训练片段个数;
为该片段中每个特征计算类内距离和类间距离,第k个特征的类内距离和类间距离可以计算为:
其中ni是第i类样本的样本数,和/>分别表示第i类样本中第k个特征的平均值和方差,μk是所有类中第k个特征的方差,当st<d时,根据ε-贪婪从中选择一个特征at加入Fsel,选择的原则为
表示从初始状态st下的可选特征/>中选择Q值最大的特征;random(0,1)表示在0到1之间取任意实数,即模拟概率;/>表示在/>取任意特征,更新Fsel=Fsel∪{at},/>
计算本次行为的即时奖励r,即特征子集的Fisher得分:其中i∈Fsel;
片段训练模块,用于根据Q值表选择当前状态下的动作,更新Q值表及本轮子集状态;
判断模块,用于判断本轮子集是否已满,若未满,则返回所述片段训练模块,若已满,则继续判断是否满足迭代次数,若未满足,则返回所述片段初始模块,若已满足,进入选择模块;
选择模块,用于根据Q值表获得当前排序,返回目标子集,根据所述目标子集生成新的样本矩阵,对新的待测样本在目标特征子集下用分类器进行分类,判断分类结果;其中更新Q值表和特征子集当前迭代状态,返回上一步进行下一个状态的选择,即返回至当前状态st<d时,根据ε-贪婪从中选择一个特征at加入Fsel,更新公式:
st=st+1
当st≥d时,本片段训练结束;
当Itr次迭代结束后,根据Q值表按需要选择前m个特征,返回目标特征子集G,具体步骤如下:
初始化:特征子集初始状态st=0;当st<m时,选择一个特征at加入特征子集G中
更新G=G∪{at},和当前状态st=st+1;
根据上述返回的目标特征子集生成新的样本矩阵,对新的待测样本在目标特征子集下用分类器L进行分类,得出分类结果判断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011110501.7A CN112215290B (zh) | 2020-10-16 | 2020-10-16 | 基于Fisher得分的Q学习辅助数据分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011110501.7A CN112215290B (zh) | 2020-10-16 | 2020-10-16 | 基于Fisher得分的Q学习辅助数据分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112215290A CN112215290A (zh) | 2021-01-12 |
CN112215290B true CN112215290B (zh) | 2024-04-09 |
Family
ID=74055598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011110501.7A Active CN112215290B (zh) | 2020-10-16 | 2020-10-16 | 基于Fisher得分的Q学习辅助数据分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112215290B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104200135A (zh) * | 2014-08-30 | 2014-12-10 | 北京工业大学 | 基于MFA score和排除冗余的基因表达谱特征选择方法 |
CN105740653A (zh) * | 2016-01-27 | 2016-07-06 | 北京工业大学 | 基于LLRFC和相关性分析去除冗余的特征选择方法LLRFC score+ |
CN106601235A (zh) * | 2016-12-02 | 2017-04-26 | 厦门理工学院 | 一种半监督多任务特征选择的语音识别方法 |
CN109726866A (zh) * | 2018-12-27 | 2019-05-07 | 浙江农林大学 | 基于q学习神经网络的无人船路径规划方法 |
CN110287177A (zh) * | 2019-06-11 | 2019-09-27 | 嘉兴深拓科技有限公司 | 一种基于特权信息的特征选择方法 |
CN110688934A (zh) * | 2019-09-23 | 2020-01-14 | 云南电网有限责任公司电力科学研究院 | 一种空间采样主动学习分类方法、电子设备及存储介质 |
CN110753383A (zh) * | 2019-07-24 | 2020-02-04 | 北京工业大学 | 雾计算中一种基于强化学习的安全中继节点选择方法 |
CN111009321A (zh) * | 2019-08-14 | 2020-04-14 | 电子科技大学 | 一种机器学习分类模型在青少年孤独症辅助诊断中的应用方法 |
CN111368936A (zh) * | 2020-03-18 | 2020-07-03 | 中南大学 | 基于改进svm-rfe的特征选择方法 |
-
2020
- 2020-10-16 CN CN202011110501.7A patent/CN112215290B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104200135A (zh) * | 2014-08-30 | 2014-12-10 | 北京工业大学 | 基于MFA score和排除冗余的基因表达谱特征选择方法 |
CN105740653A (zh) * | 2016-01-27 | 2016-07-06 | 北京工业大学 | 基于LLRFC和相关性分析去除冗余的特征选择方法LLRFC score+ |
CN106601235A (zh) * | 2016-12-02 | 2017-04-26 | 厦门理工学院 | 一种半监督多任务特征选择的语音识别方法 |
CN109726866A (zh) * | 2018-12-27 | 2019-05-07 | 浙江农林大学 | 基于q学习神经网络的无人船路径规划方法 |
CN110287177A (zh) * | 2019-06-11 | 2019-09-27 | 嘉兴深拓科技有限公司 | 一种基于特权信息的特征选择方法 |
CN110753383A (zh) * | 2019-07-24 | 2020-02-04 | 北京工业大学 | 雾计算中一种基于强化学习的安全中继节点选择方法 |
CN111009321A (zh) * | 2019-08-14 | 2020-04-14 | 电子科技大学 | 一种机器学习分类模型在青少年孤独症辅助诊断中的应用方法 |
CN110688934A (zh) * | 2019-09-23 | 2020-01-14 | 云南电网有限责任公司电力科学研究院 | 一种空间采样主动学习分类方法、电子设备及存储介质 |
CN111368936A (zh) * | 2020-03-18 | 2020-07-03 | 中南大学 | 基于改进svm-rfe的特征选择方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112215290A (zh) | 2021-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112766379B (zh) | 一种基于深度学习多权重损失函数的数据均衡方法 | |
Jörnsten | Clustering and classification based on the L1 data depth | |
CN108595913A (zh) | 鉴别mRNA和lncRNA的有监督学习方法 | |
CN111062425B (zh) | 基于c-k-smote算法的不平衡数据集处理方法 | |
CN108877947B (zh) | 基于迭代均值聚类的深度样本学习方法 | |
CN112488992B (zh) | 表皮生长因子受体突变状态判断方法、介质及电子设备 | |
Bennet et al. | A Hybrid Approach for Gene Selection and Classification Using Support Vector Machine. | |
CN114596467A (zh) | 基于证据深度学习的多模态影像分类方法 | |
CN114741603A (zh) | 基于用户聚类和商品聚类的混合协同过滤推荐算法 | |
CN114882531A (zh) | 一种基于深度学习的跨域行人再识别方法 | |
CN110010204B (zh) | 基于融合网络和多打分策略的预后生物标志物识别方法 | |
Al Mamun et al. | Pan-cancer feature selection and classification reveals important long non-coding RNAs | |
CN112215290B (zh) | 基于Fisher得分的Q学习辅助数据分析方法及系统 | |
CN112215826A (zh) | 一种基于深度图像特征预测胶质瘤分子亚型及预后方法 | |
Liang et al. | ASE: Anomaly Scoring Based Ensemble Learning for Imbalanced Datasets | |
CN110211638A (zh) | 一种考虑基因相关度的基因选择方法与装置 | |
Wei et al. | Robust feature selection based on regularized brownboost loss | |
CN116453209A (zh) | 模型训练方法、行为分类方法、电子设备及存储介质 | |
CN112686881B (zh) | 基于影像统计特征和lstm复合网络的颗粒物料混合均匀性检测方法 | |
CN114996446A (zh) | 一种文本分类方法、装置及存储介质 | |
CN112766403A (zh) | 一种基于信息增益权重的增量聚类方法及装置 | |
Wang et al. | Prediction of protein structural class based on reliefF-SVM | |
CN113971984A (zh) | 分类模型构建方法及装置、电子设备、存储介质 | |
CN112769540A (zh) | 一种侧信道信息泄露的诊断方法、系统、设备及存储介质 | |
Brahim et al. | New prior knowledge based extensions for stable feature selection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |