CN111523647B - 网络模型训练方法及装置、特征选择模型、方法及装置 - Google Patents
网络模型训练方法及装置、特征选择模型、方法及装置 Download PDFInfo
- Publication number
- CN111523647B CN111523647B CN202010339933.9A CN202010339933A CN111523647B CN 111523647 B CN111523647 B CN 111523647B CN 202010339933 A CN202010339933 A CN 202010339933A CN 111523647 B CN111523647 B CN 111523647B
- Authority
- CN
- China
- Prior art keywords
- features
- feature selection
- feature
- determining
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 63
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000010187 selection method Methods 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000013527 convolutional neural network Methods 0.000 claims description 30
- 238000013507 mapping Methods 0.000 claims description 22
- 238000011176 pooling Methods 0.000 claims description 21
- 230000008878 coupling Effects 0.000 claims description 18
- 238000010168 coupling process Methods 0.000 claims description 18
- 238000005859 coupling reaction Methods 0.000 claims description 18
- 230000000968 intestinal effect Effects 0.000 claims description 13
- 230000009466 transformation Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 235000013619 trace mineral Nutrition 0.000 claims description 9
- 239000011573 trace mineral Substances 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 claims description 2
- 210000001503 joint Anatomy 0.000 claims 2
- 239000010410 layer Substances 0.000 description 57
- 238000010586 diagram Methods 0.000 description 12
- 238000003032 molecular docking Methods 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 230000004913 activation Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011423 initialization method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种网络模型训练方法、网络模型训练装置、特征选择模型、特征选择方法、特征选择装置、计算机可读存储介质及电子设备。该特征选择方法包括:基于预设需求信息确定与预设需求信息具有第一关联度的多个第一特征;基于多个第一特征生成多个第一特征各自对应的第二特征;将多个第一特征和多个第一特征各自对应的第二特征输入至特征选择模型,以确定与预设需求信息具有第二关联度的第一特征。本发明能够提高特征选择模型在处理线性问题时的可解释性。尤其当第二特征为仿制特征时,本发明实施例通过将仿制特征与特征选择模型相结合的方式,提高了特征选择的速度以及精准度。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及网络模型训练方法、网络模型训练装置、特征选择模型、特征选择方法、特征选择装置、计算机可读存储介质及电子设备。
背景技术
众所周知,在数据处理领域,特征选择的精准度直接影响后续基于特征进行相关分析及处理操作的精准度,比如基于图像特征进行的图像分割等操作。在现有技术中,通常基于深度神经网络(Deep Neural Networks,DNN)模型实现特征选择的目的,选择精准度差且选择速度较慢。
发明内容
有鉴于此,本发明实施例致力于提供一种网络模型训练方法、网络模型训练装置、特征选择模型、特征选择方法、特征选择装置、计算机可读存储介质及电子设备,以解决现有特征选择方法选择精准度差且选择速度慢等问题。
第一方面,本发明一实施例提供了一种特征选择方法,该特征选择方法包括:基于预设需求信息确定与预设需求信息具有第一关联度的多个第一特征;基于多个第一特征生成多个第一特征各自对应的第二特征;将多个第一特征和多个第一特征各自对应的第二特征输入至特征选择模型,以确定与预设需求信息具有第二关联度的第一特征。
在本发明一实施例中,基于多个第一特征生成多个第一特征各自对应的第二特征,包括:基于多个第一特征确定多个第一特征各自对应的仿制特征;基于多个第一特征各自对应的仿制特征生成多个第一特征各自对应的第二特征。
在本发明一实施例中,基于多个第一特征确定多个第一特征各自对应的仿制特征,包括:基于多个第一特征和Model-X仿制框架确定多个第一特征各自对应的仿制特征。
第二方面,本发明一实施例提供了一种网络模型训练方法,该网络模型训练方法包括:基于预设需求信息确定与预设需求信息具有第一关联度的多个第一特征;基于多个第一特征生成多个第一特征各自对应的第二特征;基于多个第一特征和多个第一特征各自对应的第二特征生成训练数据;确定初始网络模型,并基于训练数据训练初始网络模型,以生成特征选择模型,其中,特征选择模型用于确定与预设需求信息具有第二关联度的第一特征。
第三方面,本发明一实施例提供了一种特征选择模型,该特征选择模型包括:对称耦合模块,用于基于多个第一特征和多个第一特征各自对应的第二特征确定多个第一特征各自对应的第一映射信息,其中,多个第一特征与预设需求信息具有第一关联度;与对称耦合模块信号连接的对接变换模块,用于将第一映射信息转换为具有预设空间结构的第二映射信息;与对接变换模块信号连接的卷积神经网络模块,用于基于第二映射信息确定多个第一特征各自对应的第三映射信息,并基于第三映射信息确定与预设需求信息具有第二关联度的第一特征。
在本发明一实施例中,卷积神经网络模块包括第一卷积层、第一池化层、第二卷积层、第二池化层、第一Inception层、第二Inception层、Flatten层、全连接层和输出层。
在本发明一实施例中,卷积神经网络模块进一步包括位于第二Inception层和Flatten层之间的第三Inception层和第三池化层。
第四方面,本发明一实施例提供了一种特征选择装置,该特征选择装置包括:第一确定模块,用于基于预设需求信息确定与预设需求信息具有第一关联度的多个第一特征;第二确定模块,用于基于多个第一特征生成多个第一特征各自对应的第二特征;第三确定模块,用于将多个第一特征和多个第一特征各自对应的第二特征输入至特征选择模型,以确定与预设需求信息具有第二关联度的第一特征。
第五方面,本发明一实施例提供了一种网络模型训练装置,该网络模型训练装置包括:第一特征确定模块,用于基于预设需求信息确定与预设需求信息具有第一关联度的多个第一特征;第二特征确定模块,用于基于多个第一特征生成多个第一特征各自对应的第二特征;训练数据生成模块,用于基于多个第一特征和多个第一特征各自对应的第二特征生成训练数据;训练模块,用于确定初始网络模型,并基于训练数据训练初始网络模型,以生成特征选择模型,其中,特征选择模型用于确定与预设需求信息具有第二关联度的第一特征。
第六方面,本发明一实施例提供了一种计算机可读存储介质,该存储介质存储有计算机程序,该计算机程序用于执行上述任一实施例所提及的特征选择方法,或执行上述任一实施例所提及的网络模型训练方法。
第七方面,本发明一实施例提供了一种电子设备,该电子设备包括处理器和用于存储所述处理器可执行指令的存储器,该处理器用于执行上述任一实施例所提及的特征选择方法,或执行上述任一实施例所提及的网络模型训练方法。
本发明实施例提供的特征选择方法,通过将与预设需求信息具有第一关联度的多个第一特征以及多个第一特征各自对应的第二特征输入至特征选择模型的方式,实现了确定与预设需求信息具有第二关联度的第一特征的目的。本发明实施例能够提高特征选择模型在处理线性问题时的可解释性。尤其当第二特征为仿制特征时,本发明实施例通过将仿制特征与特征选择模型相结合的方式,提高了特征选择的速度以及精准度。
本发明实施例提供的网络模型训练方法,通过借助与预设需求信息具有第一关联度的多个第一特征以及多个第一特征各自对应的第二特征训练初始网络模型的方式,实现了生成用于确定与预设需求信息具有第二关联度的第一特征的特征选择模型的目的。本发明实施例能够提高所训练的特征选择模型在处理线性问题时的可解释性。尤其当第二特征为仿制特征时,本发明实施例能够提高特征选择模型的选择速度以及选择精准度。
附图说明
通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1所示为本发明一示例性实施例提供的特征选择方法的流程示意图。
图2所示为本发明一示例性实施例提供的基于多个第一特征生成多个第一特征各自对应的第二特征的流程示意图。
图3所示为本发明一示例性实施例提供的网络模型训练方法的流程示意图。
图4所示为本发明一示例性实施例提供的特征选择模型的结构示意图。
图5所示为本发明另一示例性实施例提供的特征选择模型的结构示意图。
图6所示为本发明一示例性实施例提供的特征选择装置的结构示意图。
图7所示为本发明一示例性实施例提供的网络模型训练装置的结构示意图。
图8所示为本发明一示例性实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1所示为本发明一示例性实施例提供的特征选择方法的流程示意图。如图1所示,本发明实施例提供的特征选择方法包括如下步骤。
步骤10,基于预设需求信息确定与预设需求信息具有第一关联度的多个第一特征。
在本发明一实施例中,根据公式y=Xβ+ε构造模拟数据。其中,y=(Y1,…,Yn)T∈Rn表征响应变量Y;X∈Rn×p为随机矩阵,表征第一特征(即原始特征);β=(β1,β2,…,βn)T∈Rp表征系数向量,ε=(ε1,ε2,…,εn)T∈Rn表征噪音向量。X是服从正态分布随机生成的n×p维的二维矩阵,ε也是服从正态分布随机生成的1×n维矩阵。例如,如果n=1000,即有一千条数据,p=1000,即每条数据有一千个特征,该矩阵的分布满足正太分布。β的维度为1×1000,从1000维中随机选出30维值不为0,其余各维值皆为0。ε为生成的噪声,则有y=Xβ+ε。在此场景中,响应y只与多个第一特征X中的30个特征有关,而与其余特征无关。
示例性地,本发明实施例提供的特征选择方法用于确定214种肠道微量元素对身体质量指数(Body Mass Index,BMI)的关联度。那么,步骤10中提及的多个第一特征可以为上述提及的214中肠道微量元素,即共有214个第一特征;步骤10中提及的预设需求信息可以为确定214种肠道微量元素中与BMI的关联度排序为前30名的肠道微量元素。
步骤20,基于多个第一特征生成多个第一特征各自对应的第二特征。
示例性地,第二特征是基于第一特征生成的,并且第二特征和第一特征之间存在一一对应的关系。比如,第二特征为第一特征的仿制(knockoff)特征。
步骤30,将多个第一特征和多个第一特征各自对应的第二特征输入至特征选择模型,以确定与预设需求信息具有第二关联度的第一特征。
在本发明一实施例中,步骤30中提及的特征选择模型为卷积神经网络(Convolutional Neural Networks,CNN)模型。
示例性地,第二关联度对应的关联强度高于第一关联度对应的关联强度。即,从多个第一特征中筛选出与预设需求信息关联强度较高的第一特征。
在实际应用过程中,首先基于预设需求信息确定与预设需求信息具有第一关联度的多个第一特征,并基于多个第一特征生成多个第一特征各自对应的第二特征,继而将多个第一特征和多个第一特征各自对应的第二特征输入至特征选择模型,以确定与预设需求信息具有第二关联度的第一特征。
本发明实施例提供的特征选择方法,通过将与预设需求信息具有第一关联度的多个第一特征以及多个第一特征各自对应的第二特征输入至特征选择模型的方式,实现了确定与预设需求信息具有第二关联度的第一特征的目的。本发明实施例能够提高特征选择模型在处理线性问题时的可解释性。尤其当第二特征为仿制特征时,本发明实施例通过将仿制特征与特征选择模型相结合的方式,提高了特征选择的速度以及精准度。
图2所示为本发明一示例性实施例提供的基于多个第一特征生成多个第一特征各自对应的第二特征的流程示意图。在本发明图1所示实施例的基础上延伸出本发明图2所示实施例,下面着重叙述图2所示实施例与图1所示实施例的不同之处,相同之处不再赘述。
如图2所示,在本发明实施例提供的特征选择方法中,基于多个第一特征生成多个第一特征各自对应的第二特征步骤,包括如下步骤。
步骤21,基于多个第一特征确定多个第一特征各自对应的仿制特征。
在本发明一实施例中,步骤21中提及的多个第一特征利用x=(X1,…,Xp)T表示,多个第一特征各自对应的仿制特征利用表示。其中,第一特征和仿制特征之间满足两个条件:1)对于任意集合/>满足/>其中,swap(S)表示对于每个j∈S交换Xj和/> 表示同分布;2)/> 独立于第一特征x的响应Y。
由此可见,仿制特征的构造完全独立于响应Y。并且,仿制特征的构造在(FalseDiscovery Rate,FDR)伪发现率控制中具有关键作用。
在本发明一实施例中,基于多个第一特征确定多个第一特征各自对应的仿制特征步骤,包括:基于Model-X仿制框架确定多个第一特征各自对应的仿制特征。Model-X仿制框架可以在有限样本及其响应和特征之间具有任意依赖关系结构中,以某个目标级别q的特征选择为设置,实现FDR控制。简而言之,knockoff筛选器通过两步实现FDR控制:1)knockoff特征的构建;2)使用knockoff统计的筛选。
比如,x~N(0,∑),而∑∈Rp×p是协方差矩阵,则可轻松构造Model-X仿制特征。更具体而言,如果x~N(0,∑),则仿制特征可基于下述公式(1)构造。
在公式(1)中,所有s均为正的,diag{s}表示一个对角矩阵,并且,条件协方差矩阵为正定矩阵。
基于上述方式构造仿制特征后,第一特征和仿制特征具有以下联合分布:
直观地,较大的s值表示构造的仿制特征(即第二特征)与原始特征(即第一特征)有很大不同,因此可以增加特征选择方法的选择精准度。
借助构建的仿制特征通过knockoff统计/>来量化重要特征,其中,1≤j≤p,Zj和/>分别表示第j个第一特征Xj和其对应的仿制特征/>的重要程度度量,gi(·,·)是满足/>的反对称函数。需要说明的是,特征重要性度量以及knockoff统计信息取决于用于拟合模型的特定算法。例如,在线性回归模型中,可以分别选择Zj和/>作为Xj和/>的套索回归系数,并且一个有效的knockoff统计量可以为原则上,knockoff统计量Wj应满足硬币翻转特性,以便交换任意对Xj及其对应的/>只会改变Wj的正负符号,而保留其他Wk的符号(k≠j)不变。
给定knockoff统计作为特征重要性的量度,我们以降序对|Wj|进行排序,并选择Wj超过某个阈值T的特征。
示例性地,采用下述公式(3)所示的两种阈值。
其中,W={|Wj|:1≤j≤p}\{0}是由|Wj|得出的唯一非零值的集合,q∈(0,1)是用户指定的所需FDR级别。
此外,需要说明的是,当x的联合分布未知时,要构建仿制特征,需要从数据中估计这种分布。对于高斯设计,近似的仿制特征可以通过用估计的精度矩阵代替上述公式(1)中的∑-1来构造。
步骤22,基于多个第一特征各自对应的仿制特征生成多个第一特征各自对应的第二特征。
示例性地,将多个第一特征各自对应的仿制特征确定为多个第一特征各自对应的第二特征。
本发明实施例提供的特征选择方法,通过基于多个第一特征确定多个第一特征各自对应的仿制特征,并基于多个第一特征各自对应的仿制特征生成多个第一特征各自对应的第二特征的方式,实现了基于多个第一特征生成多个第一特征各自对应的第二特征的目的。由于仿制特征能够利用识别受FDR控制的相关输入特征的子集辅助提高特征选择模型在处理线性问题时的可解释性,因此本发明实施例能够进一步提高特征选择的精准度。
图3所示为本发明一示例性实施例提供的网络模型训练方法的流程示意图。如图3所示,本发明实施例提供的网络模型训练方法包括如下步骤。
步骤61,基于预设需求信息确定与预设需求信息具有第一关联度的多个第一特征。
步骤62,基于多个第一特征生成多个第一特征各自对应的第二特征。
示例性地,第二特征是基于第一特征生成的,并且第二特征和第一特征之间存在一一对应的关系。比如,第二特征为第一特征的仿制(knockoff)特征。
步骤63,基于多个第一特征和多个第一特征各自对应的第二特征生成训练数据。
步骤64,确定初始网络模型,并基于训练数据训练初始网络模型,以生成特征选择模型,其中,特征选择模型用于确定与预设需求信息具有第二关联度的第一特征。
示例性地,初始网络模型为CNN模型。由于卷积神经网络中的隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量应对格点化(grid-like topology)特征,因此,效果稳定且对数据没有额外的特征工程(featureengineering)要求。
示例性地,初始网络模型和特征选择模型的模型结构是相同的,初始网络模型和特征选择模型之间的差异为模型的网络参数差异。即,初始网络模型中的网络参数为初始网络参数,然后利用训练数据对初始网络模型进行训练,训练过程中会调整初始网络参数,以最终生成特征选择模型中的网络参数。比如,基于梯度下降法不断调节初始网络模型的网络参数,以最终生成特征选择模型中的网络参数。
在实际应用过程中,首先基于预设需求信息确定与预设需求信息具有第一关联度的多个第一特征,并基于多个第一特征生成多个第一特征各自对应的第二特征,继而基于多个第一特征和多个第一特征各自对应的第二特征生成训练数据,最后确定初始网络模型,并基于训练数据训练初始网络模型,以生成特征选择模型。
本发明实施例提供的网络模型训练方法,通过借助与预设需求信息具有第一关联度的多个第一特征以及多个第一特征各自对应的第二特征训练初始网络模型的方式,实现了生成用于确定与预设需求信息具有第二关联度的第一特征的特征选择模型的目的。本发明实施例能够提高所训练的特征选择模型在处理线性问题时的可解释性。尤其当第二特征为仿制特征时,本发明实施例能够提高特征选择模型的选择速度以及选择精准度。
应当理解,利用本发明实施例提供的网络模型训练方法所生成的特征选择模型可以为上述任一特征选择方法实施例中提及的特征选择模型。
图4所示为本发明一示例性实施例提供的特征选择模型的结构示意图。如图4所示,本发明实施例提供的特征选择模型包括对称耦合模块41、与对称耦合模块41信号连接的对接变换模块42和与对接变换模块42信号连接的卷积神经网络模块43。
应当理解,上述提及的信号连接指的是信号连接的双方或多方之间具备数据传输关系。
对称耦合模块41用于基于多个第一特征和多个第一特征各自对应的第二特征确定多个第一特征各自对应的第一映射信息,其中,多个第一特征与预设需求信息具有第一关联度。
示例性地,第一映射信息为基于对称耦合模块41确定的多个第一特征各自对应的权重信息。
优选地,对称耦合模块41采用线性激活函数鼓励特征之间的竞争。
对接变换模块42用于将第一映射信息转换为具有预设空间结构的第二映射信息。由于卷积神经网络模块43利用卷积核学习特征,即利用卷积核学习一种特定的空间结构。那么,通常情况下,当将第一特征和第二特征输入到对称耦合模块41后,对称耦合模块41输出的第一映射信息为一维数据。基于此,本发明实施例利用对接变换模块42将第一映射信息转换为有利于卷积核学习其特定的空间结构的第二映射信息,以便卷积神经网络模块43在高维数据中学习特定的空间结构。
卷积神经网络模块43用于基于第二映射信息确定多个第一特征各自对应的第三映射信息,并基于第三映射信息确定与预设需求信息具有第二关联度的第一特征。
可选地,卷积神经网络模块43包括多个卷积层、池化层、全连接层和非线性激活层。
本发明实施例提供的特征选择模型,利用对称耦合模块和卷积神经网络模块实现了权重共享的目的,进而降低了特征选择模型的参数量,进而提高了特征选择模型的选择速度。
在本发明一实施例中,卷积神经网络模块43采用Adam优化器训练均方误差损失。示例性地,初始学习率为0.001,批量大小为10。Adam优化器能够基于训练数据迭代地更新神经网络权重,具有计算高效和占用内存少等优势,并且能够适用于解决含大规模数据和参数的优化问题以及包含很高噪声或稀疏梯度的问题,因此,本发明实施例能够利用Adam优化器提高模型训练效率,减少模型占用的内存,并优化调参操作。
图5所示为本发明另一示例性实施例提供的特征选择模型的结构示意图。如图5所示,本发明实施例提供的特征选择模型包括对称耦合模块51、与对称耦合模块51信号连接的对接变换模块52和与对接变换模块52信号连接的卷积神经网络模块53。
在本发明实施例中,对称耦合模块51包括P个筛选器,即F1,…,Fp,并且,对称耦合模块51中还包括一层局部连接层。其中,第j个筛选器连接第一特征Xj以及该第一特征对应的仿制特征应当理解,在训练过程中,筛选器的权重Zj和/>彼此对抗。因此,直观上,如果Zj和/>相差较大,则表明第一特征Xj很重要;如果Zj和/>的值相差不大,则表明第一特征Xj并不重要。
需要说明的是,每个第一特征除了与自身对应的仿制特征(即第二特征)竞争外,多个第一特征之间也相互竞争。优选地,在对称耦合模块51中使用线性激活函数,以鼓励竞争。
继续参照图5所示,W0表征筛选器利用对接变换模块52连接到卷积神经网络模块53的权重向量。
示例性地,重要性度量Zj和利用两个因素确定。其中,第一因素为,Xj和/>之间的相对重要性,该相对重要性由筛选器权重Z=(Z1,…,ZP)T和/>确定。第二因素为,由权重矩阵编码的所有P个第一特征中第j个第一特征的相对重要性w=W0。因此,定义Zj和/>为:
Zj=zj×W0 (4)
基于重要性度量Zj和可以将knockoff统计确定为:
继续参照图5所示,对称耦合模块51的输出结果输入到对接变换模块52,经对接变换模块52的形状重塑后,塑造为具有预设空间构造(比如预设长宽尺寸)的数据,并输出至卷积神经网络模块53。示例性地,对接变换模块52包括一层局部连接层。
在本发明实施例中,卷积神经网络模块53包括依次连接的第一卷积层531、第一池化层532、第二卷积层533、第二池化层534、第一Inception层535、第二Inception层536、Flatten层537、全连接层538和输出层539。
具体而言,本发明实施例提及的卷积神经网络模块53的结构细节为:
第一卷积层531:卷积核数为64,卷积核大小为7*7,步长为2*2,填充方式为same;
第一池化层532:池化大小为3*3,步长为2*2,填充方式为same;
第二卷积层533:卷积核数为128,卷积核大小为3*3,步长为1*1,填充方式为same;
第二池化层534:池化大小为3*3,步长为2*2,填充方式为same;
第一Inception层535:卷积核数为64;
第二Inception层536:卷积核数为64;
Flatten层537:用以将第二Inception层536的输出压平,以方便输入到全连接层538;
全连接层538:神经元数为p,激活方式为relu,权重初始化方法为glorot_normal;
输出层539:权重初始化方法为glorot_normal,输出一个预测值。
本发明实施例提供的卷积神经网络模块的具体结构,能够进一步鼓励第一特征和与其对应的第二特征之间的竞争,进而提高特征选择模型的选择精准度。发明人经大量实验后确认,采用上述结构的卷积神经网络模块,不仅能够很好地选择出与预设需求信息具有第二关联度(比如较高关联度)的特征,而且能够降低运算量。
在本发明图5所示实施例基础上延伸出本发明另一实施例。在本发明实施例中,卷积神经网络模块53中的第二Inception层536和Flatten层537之间进一步包括第三Inception层和第三池化层。
并且,本发明实施例提及的卷积神经网络模块53的结构细节为:
第一卷积层531:卷积核数为64,卷积核大小为7*7,步长为2*2,填充方式为same;
第一池化层532:池化大小为3*3,步长为2*2,填充方式为same;
第二卷积层533:卷积核数为128,卷积核大小为3*3,步长为1*1,填充方式为same;
第二池化层534:池化大小为3*3,步长为2*2,填充方式为same;
第一Inception层535:卷积核数为64;
第二Inception层536:卷积核数为64;
第三Inception层:卷积核数为128;
第三池化层:池化大小为3*3,步长为2*2,填充方式为same;
Flatten层537:用以将第三池化层的输出压平,以方便输入到全连接层538;
全连接层538:神经元数为p,激活方式为relu;
输出层539:权重初始化方法为glorot_normal,输出一个预测值。
图6所示为本发明一示例性实施例提供的特征选择装置的结构示意图。如图6所示,本发明实施例提供的特征选择装置包括:
第一确定模块100,用于基于预设需求信息确定与预设需求信息具有第一关联度的多个第一特征;
第二确定模块200,用于基于多个第一特征生成多个第一特征各自对应的第二特征;
第三确定模块300,用于将多个第一特征和多个第一特征各自对应的第二特征输入至特征选择模型,以确定与预设需求信息具有第二关联度的第一特征。
在本发明另一实施例中,第二确定模块200还用于基于多个第一特征确定多个第一特征各自对应的仿制特征,并基于多个第一特征各自对应的仿制特征生成多个第一特征各自对应的第二特征。
图7所示为本发明一示例性实施例提供的网络模型训练装置的结构示意图。如图7所示,本发明实施例提供的网络模型训练装置包括:
第一特征确定模块610,用于基于预设需求信息确定与预设需求信息具有第一关联度的多个第一特征;
第二特征确定模块620,用于基于多个第一特征生成多个第一特征各自对应的第二特征;
训练数据生成模块630,用于基于多个第一特征和多个第一特征各自对应的第二特征生成训练数据;
训练模块640,用于确定初始网络模型,并基于训练数据训练初始网络模型,以生成特征选择模型,其中,特征选择模型用于确定与预设需求信息具有第二关联度的第一特征。
应当理解,图6提供的特征选择装置中包括的第一确定模块100、第二确定模块200和第三确定模块300的操作和功能可以参考上述图1和图2提供的特征选择方法,为了避免重复,在此不再赘述。
此外,应当理解,图7提供的网络模型训练装置中包括的第一特征确定模块610、第二特征确定模块620、训练数据生成模块630和训练模块640的操作和功能可以参考上述图3提供的网络模型训练方法,为了避免重复,在此不再赘述。
下面,参考图8来描述根据本发明实施例的电子设备。图8所示为本发明一示例性实施例提供的电子设备的结构示意图。
如图8所示,电子设备70包括一个或多个处理器701和存储器702。
处理器701可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备70中的其他组件以执行期望的功能。
存储器702可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器701可以运行所述程序指令,以实现上文所述的本发明的各个实施例的网络模型训练方法、特征选择方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如第一特征、第二特征等各种内容。
在一个示例中,电子设备70还可以包括:输入装置703和输出装置704,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置703可以包括例如键盘、鼠标等等。
该输出装置704可以向外部输出各种信息,包括确定出的与预设需求信息具有第二关联度的第一特征等。该输出装置704可以包括例如显示器、通信网络及其所连接的远程输出设备等等。
当然,为了简化,图8中仅示出了该电子设备70中与本发明有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备70还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本发明的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种实施例的网络模型训练方法和特征选择方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本发明实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本发明的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种实施例的网络模型训练方法和特征选择方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,在本发明中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本发明的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本发明为必须采用上述具体的细节来实现。
本发明中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本发明的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本发明。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本发明的范围。因此,本发明不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本发明的实施例限制到在此公开的形式。尽管以上已经讨论了多个实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (11)
1.一种特征选择方法,所述方法应用于数据处理技术领域,其特征在于,用于确定214种肠道微量元素对身体质量指数的关联度,包括:
基于预设需求信息确定与所述预设需求信息具有第一关联度的多个第一特征,所述多个第一特征为所述214种肠道微量元素;
基于所述多个第一特征生成所述多个第一特征各自对应的第二特征;
将所述多个第一特征和所述多个第一特征各自对应的第二特征输入至特征选择模型,以确定与所述预设需求信息具有第二关联度的第一特征,其中,所述第二关联度对应的关联强度高于第一关联度对应的关联强度,所述特征选择模型为卷积神经网络模型。
2.根据权利要求1所述的特征选择方法,其特征在于,所述基于所述多个第一特征生成所述多个第一特征各自对应的第二特征,包括:
基于所述多个第一特征确定所述多个第一特征各自对应的仿制特征;
基于所述多个第一特征各自对应的仿制特征生成所述多个第一特征各自对应的第二特征。
3.根据权利要求2所述的特征选择方法,其特征在于,所述基于所述多个第一特征确定所述多个第一特征各自对应的仿制特征,包括:
基于所述多个第一特征和Model-X仿制框架确定所述多个第一特征各自对应的仿制特征。
4.一种网络模型训练方法,所述方法应用于数据处理技术领域,其特征在于,用于确定214种肠道微量元素对身体质量指数的关联度,包括:
基于预设需求信息确定与所述预设需求信息具有第一关联度的多个第一特征,所述多个第一特征为所述214种肠道微量元素;
基于所述多个第一特征生成所述多个第一特征各自对应的第二特征;
基于所述多个第一特征和所述多个第一特征各自对应的第二特征生成训练数据;
确定初始网络模型,并基于所述训练数据训练所述初始网络模型,以生成特征选择模型,其中,所述特征选择模型用于确定与所述预设需求信息具有第二关联度的第一特征,其中,所述第二关联度对应的关联强度高于第一关联度对应的关联强度,所述特征选择模型为卷积神经网络模型。
5.一种特征选择模型,所述特征选择模型应用于数据处理技术领域,其特征在于,用于确定214种肠道微量元素对身体质量指数的关联度,包括:
对称耦合模块,用于基于多个第一特征和所述多个第一特征各自对应的第二特征确定所述多个第一特征各自对应的第一映射信息,其中,所述多个第一特征与预设需求信息具有第一关联度,所述多个第一特征为所述214种肠道微量元素;
与所述对称耦合模块信号连接的对接变换模块,用于将所述第一映射信息转换为具有预设空间结构的第二映射信息;
与所述对接变换模块信号连接的卷积神经网络模块,用于基于所述第二映射信息确定所述多个第一特征各自对应的第三映射信息,并基于所述第三映射信息确定与所述预设需求信息具有第二关联度的第一特征,其中,所述第二关联度对应的关联强度高于第一关联度对应的关联强度,所述特征选择模型为卷积神经网络模型。
6.根据权利要求5所述的特征选择模型,其特征在于,所述卷积神经网络模块包括第一卷积层、第一池化层、第二卷积层、第二池化层、第一Inception层、第二Inception层、Flatten层、全连接层和输出层。
7.根据权利要求6所述的特征选择模型,其特征在于,所述卷积神经网络模块进一步包括位于所述第二Inception层和所述Flatten层之间的第三Inception层和第三池化层。
8.一种特征选择装置,所述特征选择装置应用于数据处理技术领域,其特征在于,用于确定214种肠道微量元素对身体质量指数的关联度,包括:
第一确定模块,用于基于预设需求信息确定与所述预设需求信息具有第一关联度的多个第一特征,所述多个第一特征为所述214种肠道微量元素;
第二确定模块,用于基于所述多个第一特征生成所述多个第一特征各自对应的第二特征;
第三确定模块,用于将所述多个第一特征和所述多个第一特征各自对应的第二特征输入至特征选择模型,以确定与所述预设需求信息具有第二关联度的第一特征,其中,所述第二关联度对应的关联强度高于第一关联度对应的关联强度,所述特征选择模型为卷积神经网络模型。
9.一种网络模型训练装置,所述网络模型训练装置应用于数据处理技术领域,其特征在于,用于确定214种肠道微量元素对身体质量指数的关联度,包括:
第一特征确定模块,用于基于预设需求信息确定与所述预设需求信息具有第一关联度的多个第一特征,所述多个第一特征为所述214种肠道微量元素;
第二特征确定模块,用于基于所述多个第一特征生成所述多个第一特征各自对应的第二特征;
训练数据生成模块,用于基于所述多个第一特征和所述多个第一特征各自对应的第二特征生成训练数据;
训练模块,用于确定初始网络模型,并基于所述训练数据训练所述初始网络模型,以生成特征选择模型,其中,所述特征选择模型用于确定与所述预设需求信息具有第二关联度的第一特征,其中,所述第二关联度对应的关联强度高于第一关联度对应的关联强度,所述特征选择模型为卷积神经网络模型。
10.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1至3任一所述的特征选择方法,或执行上述权利要求4所述的网络模型训练方法。
11.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于执行上述权利要求1至3任一所述的特征选择方法,或执行上述权利要求4所述的网络模型训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010339933.9A CN111523647B (zh) | 2020-04-26 | 2020-04-26 | 网络模型训练方法及装置、特征选择模型、方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010339933.9A CN111523647B (zh) | 2020-04-26 | 2020-04-26 | 网络模型训练方法及装置、特征选择模型、方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111523647A CN111523647A (zh) | 2020-08-11 |
CN111523647B true CN111523647B (zh) | 2023-11-14 |
Family
ID=71902986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010339933.9A Active CN111523647B (zh) | 2020-04-26 | 2020-04-26 | 网络模型训练方法及装置、特征选择模型、方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111523647B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116313131B (zh) * | 2023-05-24 | 2023-09-15 | 山东大学 | 基于仿造变量的脑网络差异识别系统、设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107529650A (zh) * | 2017-08-16 | 2018-01-02 | 广州视源电子科技股份有限公司 | 网络模型的构建和闭环检测方法、相应装置及计算机设备 |
CN108445752A (zh) * | 2018-03-02 | 2018-08-24 | 北京工业大学 | 一种自适应选择深度特征的随机权神经网络集成建模方法 |
CN108733675A (zh) * | 2017-04-14 | 2018-11-02 | 北大方正集团有限公司 | 基于大量样本数据的情感评价方法及装置 |
CN109446090A (zh) * | 2018-10-31 | 2019-03-08 | 南开大学 | 基于深度神经网络和概率决策森林的软件缺陷预测模型 |
CN109814527A (zh) * | 2019-01-11 | 2019-05-28 | 清华大学 | 基于lstm循环神经网络工业设备故障预测方法及装置 |
CN110288286A (zh) * | 2019-05-21 | 2019-09-27 | 深圳壹账通智能科技有限公司 | 基于身份验证的物品入库方法、装置、设备及存储介质 |
CN110569322A (zh) * | 2019-07-26 | 2019-12-13 | 苏宁云计算有限公司 | 地址信息解析方法、装置、系统及数据获取方法 |
CN110998601A (zh) * | 2017-08-08 | 2020-04-10 | 三星电子株式会社 | 用于识别对象的方法和装置 |
CN110991518A (zh) * | 2019-11-28 | 2020-04-10 | 山东大学 | 一种基于进化多任务的两阶段特征选择方法及系统 |
-
2020
- 2020-04-26 CN CN202010339933.9A patent/CN111523647B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108733675A (zh) * | 2017-04-14 | 2018-11-02 | 北大方正集团有限公司 | 基于大量样本数据的情感评价方法及装置 |
CN110998601A (zh) * | 2017-08-08 | 2020-04-10 | 三星电子株式会社 | 用于识别对象的方法和装置 |
CN107529650A (zh) * | 2017-08-16 | 2018-01-02 | 广州视源电子科技股份有限公司 | 网络模型的构建和闭环检测方法、相应装置及计算机设备 |
CN108445752A (zh) * | 2018-03-02 | 2018-08-24 | 北京工业大学 | 一种自适应选择深度特征的随机权神经网络集成建模方法 |
CN109446090A (zh) * | 2018-10-31 | 2019-03-08 | 南开大学 | 基于深度神经网络和概率决策森林的软件缺陷预测模型 |
CN109814527A (zh) * | 2019-01-11 | 2019-05-28 | 清华大学 | 基于lstm循环神经网络工业设备故障预测方法及装置 |
CN110288286A (zh) * | 2019-05-21 | 2019-09-27 | 深圳壹账通智能科技有限公司 | 基于身份验证的物品入库方法、装置、设备及存储介质 |
CN110569322A (zh) * | 2019-07-26 | 2019-12-13 | 苏宁云计算有限公司 | 地址信息解析方法、装置、系统及数据获取方法 |
CN110991518A (zh) * | 2019-11-28 | 2020-04-10 | 山东大学 | 一种基于进化多任务的两阶段特征选择方法及系统 |
Non-Patent Citations (3)
Title |
---|
基于优化卷积神经网络的人耳识别;弭博雯;田莹;王诗宁;;辽宁科技大学学报(第04期);全文 * |
基于卷积神经网络多层特征提取的目标识别;江彤彤;成金勇;鹿文鹏;;计算机系统应用(第12期);全文 * |
多特征混合神经网络模型在ADR分类中的应用;赵鑫;李正光;吴镝;方金朋;;大连交通大学学报(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111523647A (zh) | 2020-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Han et al. | An improved evolutionary extreme learning machine based on particle swarm optimization | |
CN114048331A (zh) | 一种基于改进型kgat模型的知识图谱推荐方法及系统 | |
CN116415654A (zh) | 一种数据处理方法及相关设备 | |
CN112861936B (zh) | 一种基于图神经网络知识蒸馏的图节点分类方法及装置 | |
CN107506590A (zh) | 一种基于改进深度信念网络的心血管疾病预测模型 | |
Li et al. | Two-level multi-surrogate assisted optimization method for high dimensional nonlinear problems | |
JP7381814B2 (ja) | マルチタスク向けの予めトレーニング言語モデルの自動圧縮方法及びプラットフォーム | |
WO2021238568A1 (zh) | 一种更新参数的方法、装置及存储介质 | |
CN117193772A (zh) | 基于用户反馈的深度学习无代码应用布局优化方法及系统 | |
JP7554194B2 (ja) | 訓練装置、推定装置、訓練方法、推定方法、プログラム及びコンピュータ読み取り可能な非一時的記憶媒体 | |
Shi et al. | Multivariate time series prediction of complex systems based on graph neural networks with location embedding graph structure learning | |
CN107515978B (zh) | 基于遗传算法构建响应面模型的方法及应用其的系统 | |
CN118318222A (zh) | 使用序列到序列转换器的自动笔记本补全 | |
CN115424660A (zh) | 一种使用预测模型预测多源信息关系的方法、装置 | |
CN111523647B (zh) | 网络模型训练方法及装置、特征选择模型、方法及装置 | |
CN111859785B (zh) | 流体特征提取方法、系统、计算机可读存储介质及设备 | |
Huai et al. | Latency-constrained DNN architecture learning for edge systems using zerorized batch normalization | |
Xi et al. | Air Combat Maneuver Trajectory Prediction Model of Target Based on Chaotic Theory and IGA‐VNN | |
Zhang et al. | The expressivity and training of deep neural networks: Toward the edge of chaos? | |
Rathee et al. | A machine learning approach to predict the next word in a statement | |
Jia et al. | An optimized classification algorithm by neural network ensemble based on PLS and OLS | |
CN116560731A (zh) | 一种数据处理方法及其相关装置 | |
He et al. | A meta-trained generator for quantum architecture search | |
Pang et al. | Qml-ainet: an immune network approach to learning qualitative differential equation models | |
Wang et al. | A short-term hybrid wind speed prediction model based on decomposition and improved optimization algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |