CN109063759A - 一种应用于图片多属性预测的神经网络结构搜索方法 - Google Patents
一种应用于图片多属性预测的神经网络结构搜索方法 Download PDFInfo
- Publication number
- CN109063759A CN109063759A CN201810802108.0A CN201810802108A CN109063759A CN 109063759 A CN109063759 A CN 109063759A CN 201810802108 A CN201810802108 A CN 201810802108A CN 109063759 A CN109063759 A CN 109063759A
- Authority
- CN
- China
- Prior art keywords
- neural network
- attribute
- picture
- network structure
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种应用于图片多属性预测的神经网络结构搜索方法,用于在图片多属性预测问题中搜索最优的神经网络结构。具体包括如下步骤:获取用于训练神经网络的图片多属性预测数据集,并定义训练目标;贪心搜索最优的神经网络结构;重新训练神经网络的参数,并预测新的输入图片样本的属性。本发明适用于真实图片多属性预测问题的神经网络结构的自动搜索,面对各类复杂情况具有较佳的效果和鲁棒性。
Description
技术领域
本发明属于计算机视觉领域,特别地涉及一种应用于图像处理中图片多属性预测的神经网络结构搜索方法。
背景技术
图片多属性预测是计算机视觉领域的研究者长期重点关注的课题,该问题在目标跟踪、目标检测、身份识别等具体应用上具有广泛的实际应用价值。但同样,该问题具有较大的挑战性。一是其多个属性之间常具有较高的相关性,算法需要建模属性间的相关性以提高性能。二是算法建模属性相关性的同时需要合理保留各属性的不同信息,以提高模型的判别能力。
目前的图片属性预测方法主要可以分为基于传统计算机视觉技术的多属性预测方法和基于深度学习技术的多属性预测方法。近年来,基于深度学习技术的图片属性预测方法展现出良好的性能与鲁棒性,主要原因是其能够对原始输入图片进行深度多层次的特征信息提取。然而,该种方法主要存在以下几个问题:1)通常深度神经网络的结构是由专家基于领域特有的专业知识所设计,缺乏对不同任务的泛化能力,当面临不同任务时需要重新制定深度神经网络的结构;2)需要设计者拥有丰富的神经网络设计与参数调整经验,一个好的神经网络结构通常需要设计者的精心调整,这个过程将花费设计者大量的时间与精力。
发明内容
为解决上述问题,本发明的目的在于提供一种应用于图像处理领域中图片多属性预测的神经网络结构搜索方法。该方法基于贪心的搜索策略,可高效地自动搜索给定任务的最优神经网络模型结构,面对各类复杂情况具有较佳的效果和鲁棒性。
为实现上述目的,本发明的技术方案为:
一种应用于图片多属性预测的神经网络结构搜索方法,包括以下步骤:
S1、获取用于训练神经网络的图片多属性预测数据集,并定义训练目标;
S2、贪心搜索最优的神经网络结构;
S3、重新训练神经网络的参数,并预测新的输入图片样本的属性。
进一步的,所述的用于训练神经网络模型的图片多属性预测数据集为含有训练数据集Dtrain和验证数据集Dvalid的图片多属性预测数据集,指定的神经网络层数M,以及每层的神经网络单元数目Bl,l=1,2,...,M;
定义训练目标为:预测目标样本的属性值。
进一步的,步骤S2中,贪心搜索最优的神经网络结构具体包括:
S21、随机初始化符合公式(1)条件的树型神经网络结构A
其中表示神经网络中第l层第i个单元和第l+1层第j个单元有连接,反之
S22、随机初始化对应A的神经网络参数W[A];
S23、循环遍历神经网络层l=1,2,...,M-1和每层的每个单元b=1,2,...,Bl,记为循环S;
S24、在循环S下,依照公式(2)重置神经网络第l层的结构
S25、在循环S下,使用随机梯度下降算法在训练数据集Dtrain上训练神经网络结构A对应的参数W[A];
S26、在循环S下,在验证数据集Dvalid上测试属性n的预测准确率rn,n=1,2,...,N;
S27、依照公式(3)更新神经网络第l层的结构
公式(3)中,对于每个属性n,具有最佳预测准确率rn的单元间连接被选中并设为有连接。除此N条被选中的连接外,第l层与第l+1层其余单元之间均设为无连接。
S28、重复上述S23、S24、S25、S26、S27步骤直到神经网络结构A和神经网络参数W[A]收敛,将收敛的神经网络结构A记为
进一步的,步骤S3中,重训练神经网络的参数,并预测新的输入样本具体包括:
S31、合并训练数据集Dtrain和验证数据集Dvalid为新的数据集Dtrainval
S32、在数据集Dtrainval上使用随机梯度下降算法训练由步骤S2得到的神经网络结构的参数
S33、对于新的输入图片样本dtest,使用神经网络结构及其参数预测其属性。
本发明的应用于图片多属性预测的神经网络结构搜索方法,相比于现有的多属性预测方法,具有以下有益效果:
首先,本发明公开的神经网络结构的自动搜索方法导出的神经网络结构为树型结构,其在深度神经网络的底层共享特征信息,在深度神经网络的高层分叉建模各属性特有的特征信息,符合多属性预测问题里建模属性间相关性与属性特有信息的需求,从而保证神经网络在复杂的多属性图片数据上具有较佳的效果。
其次,本发明的自动搜索方法基于高效的贪心搜索策略,大量减少神经网络结构的自动搜索所需的时间。同时,这也使算法能够搜索足够大的网络结构空间以得到好的网络结构。
最后,本发明的自动搜索方法是一种无参数和无超参数的算法,能够很好地适应各类应用场景,而无需额外的人力对算法进行调整,保证了算法的鲁棒性。
本发明的多属性神经网络结构的自动搜索方法,在图片多属性分析中具有广泛的实际应用价值,能够有效减少设计和调整神经网络结构所需的时间,自动搜索出最优的网络结构。
附图说明
图1为本发明的多属性神经网络结构的自动搜索方法实施例的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
参考图1,在本发明的较佳实施例中,一种应用于图片多属性预测的神经网络结构搜索方法,包括以下步骤:
首先,获取用于训练神经网络的图片多属性预测数据集,并定义训练目标。
其中,用于训练神经网络的图片多属性预测数据集为含有训练数据集Dtrain和验证数据集Dvalid的图片多属性预测数据集,指定的神经网络层数M,以及每层的神经网络单元数目Bl,l=1,2,...,M;
定义训练目标为:预测目标样本的属性值。
其次,贪心搜索最优的神经网络结构。具体的,其包括如下步骤:
第一步,在公式(1)的条件下随机初始化树型神经网络结构A
其中表示神经网络中第l层第i个单元和第l+1层第j个单元有连接,反之
第二步,随机初始化对应A的神经网络参数W[A];
第三步,循环遍历神经网络层l=1,2,...,M-1和每层的每个单元b=1,2,...,Bl,记为循环S;
第四步,在循环S下,依照公式(2)重置神经网络第l层的结构
第五步,在循环S下,使用随机梯度下降算法在训练数据集Dtrain上训练神经网络结构A对应的参数W[A];
第六步,在循环S下,在验证数据集Dvalid上测试属性n的预测准确率rn,n=1,2,...,N;
第七步,依照公式(3)更新神经网络第l层的结构
公式(3)中,对于每个属性n,具有最佳预测准确率rn的单元间连接被选中并设为有连接。除此N条被选中的连接外,第l层与第l+1层其余单元之间均设为无连接。
第八步,重复上述第三至第七步直到神经网络结构A和神经网络参数W[A]收敛,将收敛的神经网络结构A记为
接下来,重新训练神经网络的参数,并预测新的输入图片样本属性。具体的,其包括如下步骤:
第一步,合并训练数据集Dtrain和验证数据集Dvalid为新的数据集Dtrainval;
第二步,在数据集Dtrainval上使用随机梯度下降算法训练由步骤S2得到的神经网络结构的参数
第三步,对于新的输入样本dtest,使用神经网络结构及其参数进行预测。
上述实施例中,本发明的神经网络结构的贪心搜索方法逐层遍历神经网络的结构,在每次更新时固定住其它层的网络结构,以探索当前层的最优网络结构。整个算法将经历多次遍历过程,直至网络结构与网络参数均收敛。之后,把搜索到的最优网络结构在训练集与验证集上重训练,以得到性能和鲁棒性俱佳的图片多属性预测神经网络。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种应用于图片多属性预测的神经网络结构搜索方法,其特征在于,包括以下步骤:
S1、获取用于训练神经网络的图片多属性预测数据集,并定义训练目标;
S2、贪心搜索最优的神经网络结构;
S3、重新训练神经网络的参数,并预测新的输入图片样本的属性。
2.如权利要求1所述的应用于图片多属性预测的神经网络结构搜索方法,其特征在于,步骤S1中,所述的用于训练神经网络的图片多属性预测数据集为含有训练数据集Dtrain和验证数据集Dvalid的图片多属性预测数据集,指定的神经网络层数M,以及每层的神经网络单元数目Bl,l=1,2,...,M;
定义训练目标为:预测目标样本的属性值。
3.如权利要求2所述的应用于图片多属性预测的神经网络结构搜索方法,其特征在于,步骤S2具体包括:
S21、随机初始化符合公式(1)条件的树型神经网络结构A
其中表示神经网络中第l层第i个单元和第l+1层第j个单元有连接,反之
S22、随机初始化对应A的神经网络参数W[A];
S23、循环遍历神经网络层l=1,2,...,M-1和每层的每个单元b=1,2,...,Bl,记为循环S;
S24、在循环S下,依照公式(2)重置神经网络第l层的结构
S25、在循环S下,使用随机梯度下降算法在训练数据集Dtrain上训练神经网络结构A对应的参数W[A];
S26、在循环S下,在验证数据集Dvalid上测试属性n的预测准确率rn,n=1,2,...,N;
S27、依照公式(3)更新神经网络第l层的结构
公式(3)中,对于每个属性n,具有最佳预测准确率rn的单元间连接被选中并设为有连接。除此N条被选中的连接外,第l层与第l+1层其余单元之间均设为无连接。
S28、重复上述S23、S24、S25、S26、S27步骤直到神经网络结构A和神经网络参数W[A]收敛,将收敛的神经网络结构A记为
4.如权利要求3所述的应用于图片多属性预测的神经网络结构搜索方法,其特征在于,步骤S3具体包括:
S31、合并训练数据集Dtrain和验证数据集Dvalid为新的数据集Dtrainval
S32、在数据集Dtrainval上使用随机梯度下降算法训练由步骤S2得到的神经网络结构的参数
S33、对于新的输入图片样本dtest,使用神经网络结构及其参数预测其属性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810802108.0A CN109063759A (zh) | 2018-07-20 | 2018-07-20 | 一种应用于图片多属性预测的神经网络结构搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810802108.0A CN109063759A (zh) | 2018-07-20 | 2018-07-20 | 一种应用于图片多属性预测的神经网络结构搜索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109063759A true CN109063759A (zh) | 2018-12-21 |
Family
ID=64817775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810802108.0A Withdrawn CN109063759A (zh) | 2018-07-20 | 2018-07-20 | 一种应用于图片多属性预测的神经网络结构搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109063759A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111123232A (zh) * | 2019-11-11 | 2020-05-08 | 浙江大学 | 一种具有任务适应性的雷达个体识别系统 |
CN111191785A (zh) * | 2019-12-20 | 2020-05-22 | 沈阳雅译网络技术有限公司 | 一种基于拓展搜索空间的结构搜索方法 |
CN111353601A (zh) * | 2020-02-25 | 2020-06-30 | 北京百度网讯科技有限公司 | 用于预测模型结构的延时的方法和装置 |
CN112052258A (zh) * | 2019-06-05 | 2020-12-08 | 北京地平线机器人技术研发有限公司 | 网络结构搜索方法、装置、存储介质与电子设备 |
WO2021043193A1 (zh) * | 2019-09-04 | 2021-03-11 | 华为技术有限公司 | 神经网络结构的搜索方法、图像处理方法和装置 |
WO2021056914A1 (zh) * | 2019-09-25 | 2021-04-01 | 苏州浪潮智能科技有限公司 | 一种目标检测模型的自动建模方法及装置 |
CN113706530A (zh) * | 2021-10-28 | 2021-11-26 | 北京矩视智能科技有限公司 | 基于网络结构的表面缺陷区域分割模型生成方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529402A (zh) * | 2016-09-27 | 2017-03-22 | 中国科学院自动化研究所 | 基于多任务学习的卷积神经网络的人脸属性分析方法 |
CN106570148A (zh) * | 2016-10-27 | 2017-04-19 | 浙江大学 | 一种基于卷积神经网络的属性抽取方法 |
CN106934392A (zh) * | 2017-02-28 | 2017-07-07 | 西交利物浦大学 | 基于多任务学习卷积神经网络的车标识别及属性预测方法 |
CN107993250A (zh) * | 2017-09-12 | 2018-05-04 | 北京飞搜科技有限公司 | 一种快速多目标行人追踪和分析方法及其智能装置 |
-
2018
- 2018-07-20 CN CN201810802108.0A patent/CN109063759A/zh not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529402A (zh) * | 2016-09-27 | 2017-03-22 | 中国科学院自动化研究所 | 基于多任务学习的卷积神经网络的人脸属性分析方法 |
CN106570148A (zh) * | 2016-10-27 | 2017-04-19 | 浙江大学 | 一种基于卷积神经网络的属性抽取方法 |
CN106934392A (zh) * | 2017-02-28 | 2017-07-07 | 西交利物浦大学 | 基于多任务学习卷积神经网络的车标识别及属性预测方法 |
CN107993250A (zh) * | 2017-09-12 | 2018-05-04 | 北京飞搜科技有限公司 | 一种快速多目标行人追踪和分析方法及其智能装置 |
Non-Patent Citations (1)
Title |
---|
SIYU HUANG等: "《GNAS: A Greedy Neural Architecture Search Method for Multi-Attribute Learning》", 《ARXIV》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052258A (zh) * | 2019-06-05 | 2020-12-08 | 北京地平线机器人技术研发有限公司 | 网络结构搜索方法、装置、存储介质与电子设备 |
CN112052258B (zh) * | 2019-06-05 | 2023-08-08 | 北京地平线机器人技术研发有限公司 | 网络结构搜索方法、装置、存储介质与电子设备 |
WO2021043193A1 (zh) * | 2019-09-04 | 2021-03-11 | 华为技术有限公司 | 神经网络结构的搜索方法、图像处理方法和装置 |
WO2021056914A1 (zh) * | 2019-09-25 | 2021-04-01 | 苏州浪潮智能科技有限公司 | 一种目标检测模型的自动建模方法及装置 |
CN111123232A (zh) * | 2019-11-11 | 2020-05-08 | 浙江大学 | 一种具有任务适应性的雷达个体识别系统 |
CN111123232B (zh) * | 2019-11-11 | 2022-03-18 | 浙江大学 | 一种具有任务适应性的雷达个体识别系统 |
CN111191785A (zh) * | 2019-12-20 | 2020-05-22 | 沈阳雅译网络技术有限公司 | 一种基于拓展搜索空间的结构搜索方法 |
CN111191785B (zh) * | 2019-12-20 | 2023-06-23 | 沈阳雅译网络技术有限公司 | 用于命名实体识别的基于拓展搜索空间的结构搜索方法 |
CN111353601A (zh) * | 2020-02-25 | 2020-06-30 | 北京百度网讯科技有限公司 | 用于预测模型结构的延时的方法和装置 |
CN113706530A (zh) * | 2021-10-28 | 2021-11-26 | 北京矩视智能科技有限公司 | 基于网络结构的表面缺陷区域分割模型生成方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109063759A (zh) | 一种应用于图片多属性预测的神经网络结构搜索方法 | |
CN110135295A (zh) | 一种基于迁移学习的无监督行人重识别方法 | |
Zhang et al. | Deep representation learning of activity trajectory similarity computation | |
CN109670528A (zh) | 面向行人重识别任务的基于成对样本随机遮挡策略的数据扩充方法 | |
CN110929918A (zh) | 一种基于CNN和LightGBM的10kV馈线故障预测方法 | |
CN111339818B (zh) | 一种人脸多属性识别系统 | |
CN110019889A (zh) | 训练特征提取模型及计算图片与查询词相关性系数的方法和相关装置 | |
CN109345332A (zh) | 一种航空订票恶意行为的智能检测方法 | |
CN109657147A (zh) | 基于萤火虫和加权极限学习机的微博异常用户检测方法 | |
Huang et al. | Research on urban modern architectural art based on artificial intelligence and GIS image recognition system | |
CN115545758A (zh) | 城市服务设施自适应增量选址的方法和系统 | |
CN116108984A (zh) | 基于流量-poi因果关系推理的城市流量预测方法 | |
CN114399235B (zh) | 一种基于雨情数据判定灾害风险等级的方法及系统 | |
Xue et al. | Forecasting hourly attraction tourist volume with search engine and social media data for decision support | |
CN111506760A (zh) | 一种基于困难感知的深度集成度量图像检索方法 | |
CN114897085A (zh) | 一种基于封闭子图链路预测的聚类方法及计算机设备 | |
CN111311001A (zh) | 基于DBSCAN算法和特征选择的Bi-LSTM网络短期负荷预测方法 | |
CN112883133B (zh) | 基于时序数据和功能演变数据的流量预测方法 | |
CN110197200A (zh) | 一种基于机器视觉的服装电子标签生成方法 | |
CN113343123A (zh) | 一种生成对抗多关系图网络的训练方法和检测方法 | |
CN117217779A (zh) | 预测模型的训练方法、装置及信息预测方法、装置 | |
CN116843069A (zh) | 一种基于人群活动强度特征的通勤流量估计方法及系统 | |
CN114566048B (zh) | 一种基于多视角自适应时空图网络的交通控制方法 | |
Pan et al. | Exploring the historical evolution of tourism-environment interaction in protected area: A case study of Mt. Bogda | |
CN111062484B (zh) | 基于多任务学习的数据集选取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20181221 |