CN109063759A

CN109063759A - 一种应用于图片多属性预测的神经网络结构搜索方法

Info

Publication number: CN109063759A
Application number: CN201810802108.0A
Authority: CN
Inventors: 黄思羽; 李玺; 张仲非
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2018-07-20
Filing date: 2018-07-20
Publication date: 2018-12-21

Abstract

本发明公开了一种应用于图片多属性预测的神经网络结构搜索方法，用于在图片多属性预测问题中搜索最优的神经网络结构。具体包括如下步骤：获取用于训练神经网络的图片多属性预测数据集，并定义训练目标；贪心搜索最优的神经网络结构；重新训练神经网络的参数，并预测新的输入图片样本的属性。本发明适用于真实图片多属性预测问题的神经网络结构的自动搜索，面对各类复杂情况具有较佳的效果和鲁棒性。

Description

一种应用于图片多属性预测的神经网络结构搜索方法

技术领域

本发明属于计算机视觉领域，特别地涉及一种应用于图像处理中图片多属性预测的神经网络结构搜索方法。

背景技术

图片多属性预测是计算机视觉领域的研究者长期重点关注的课题，该问题在目标跟踪、目标检测、身份识别等具体应用上具有广泛的实际应用价值。但同样，该问题具有较大的挑战性。一是其多个属性之间常具有较高的相关性，算法需要建模属性间的相关性以提高性能。二是算法建模属性相关性的同时需要合理保留各属性的不同信息，以提高模型的判别能力。

目前的图片属性预测方法主要可以分为基于传统计算机视觉技术的多属性预测方法和基于深度学习技术的多属性预测方法。近年来，基于深度学习技术的图片属性预测方法展现出良好的性能与鲁棒性，主要原因是其能够对原始输入图片进行深度多层次的特征信息提取。然而，该种方法主要存在以下几个问题：1)通常深度神经网络的结构是由专家基于领域特有的专业知识所设计，缺乏对不同任务的泛化能力，当面临不同任务时需要重新制定深度神经网络的结构；2)需要设计者拥有丰富的神经网络设计与参数调整经验，一个好的神经网络结构通常需要设计者的精心调整，这个过程将花费设计者大量的时间与精力。

发明内容

为解决上述问题，本发明的目的在于提供一种应用于图像处理领域中图片多属性预测的神经网络结构搜索方法。该方法基于贪心的搜索策略，可高效地自动搜索给定任务的最优神经网络模型结构，面对各类复杂情况具有较佳的效果和鲁棒性。

为实现上述目的，本发明的技术方案为：

一种应用于图片多属性预测的神经网络结构搜索方法，包括以下步骤：

S1、获取用于训练神经网络的图片多属性预测数据集，并定义训练目标；

S2、贪心搜索最优的神经网络结构；

S3、重新训练神经网络的参数，并预测新的输入图片样本的属性。

进一步的，所述的用于训练神经网络模型的图片多属性预测数据集为含有训练数据集D_train和验证数据集D_valid的图片多属性预测数据集，指定的神经网络层数M，以及每层的神经网络单元数目B_l，l＝1，2，...，M；

定义训练目标为：预测目标样本的属性值。

进一步的，步骤S2中，贪心搜索最优的神经网络结构具体包括：

S21、随机初始化符合公式(1)条件的树型神经网络结构A

其中表示神经网络中第l层第i个单元和第l+1层第j个单元有连接，反之

S22、随机初始化对应A的神经网络参数W[A]；

S23、循环遍历神经网络层l＝1，2，...，M-1和每层的每个单元b＝1，2，...，B_l，记为循环S；

S24、在循环S下，依照公式(2)重置神经网络第l层的结构

S25、在循环S下，使用随机梯度下降算法在训练数据集D_train上训练神经网络结构A对应的参数W[A]；

S26、在循环S下，在验证数据集D_valid上测试属性n的预测准确率r_n，n＝1，2，...，N；

S27、依照公式(3)更新神经网络第l层的结构

公式(3)中，对于每个属性n，具有最佳预测准确率r_n的单元间连接被选中并设为有连接。除此N条被选中的连接外，第l层与第l+1层其余单元之间均设为无连接。

S28、重复上述S23、S24、S25、S26、S27步骤直到神经网络结构A和神经网络参数W[A]收敛，将收敛的神经网络结构A记为

进一步的，步骤S3中，重训练神经网络的参数，并预测新的输入样本具体包括：

S31、合并训练数据集D_train和验证数据集D_valid为新的数据集D_trainval

S32、在数据集D_trainval上使用随机梯度下降算法训练由步骤S2得到的神经网络结构的参数

S33、对于新的输入图片样本d_test，使用神经网络结构及其参数预测其属性。

本发明的应用于图片多属性预测的神经网络结构搜索方法，相比于现有的多属性预测方法，具有以下有益效果：

首先，本发明公开的神经网络结构的自动搜索方法导出的神经网络结构为树型结构，其在深度神经网络的底层共享特征信息，在深度神经网络的高层分叉建模各属性特有的特征信息，符合多属性预测问题里建模属性间相关性与属性特有信息的需求，从而保证神经网络在复杂的多属性图片数据上具有较佳的效果。

其次，本发明的自动搜索方法基于高效的贪心搜索策略，大量减少神经网络结构的自动搜索所需的时间。同时，这也使算法能够搜索足够大的网络结构空间以得到好的网络结构。

最后，本发明的自动搜索方法是一种无参数和无超参数的算法，能够很好地适应各类应用场景，而无需额外的人力对算法进行调整，保证了算法的鲁棒性。

本发明的多属性神经网络结构的自动搜索方法，在图片多属性分析中具有广泛的实际应用价值，能够有效减少设计和调整神经网络结构所需的时间，自动搜索出最优的网络结构。

附图说明

图1为本发明的多属性神经网络结构的自动搜索方法实施例的流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

相反，本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步，为了使公众对本发明有更好的了解，在下文对本发明的细节描述中，详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。

参考图1，在本发明的较佳实施例中，一种应用于图片多属性预测的神经网络结构搜索方法，包括以下步骤：

首先，获取用于训练神经网络的图片多属性预测数据集，并定义训练目标。

其中，用于训练神经网络的图片多属性预测数据集为含有训练数据集D_train和验证数据集D_valid的图片多属性预测数据集，指定的神经网络层数M，以及每层的神经网络单元数目B_l，l＝1，2，...，M；

定义训练目标为：预测目标样本的属性值。

其次，贪心搜索最优的神经网络结构。具体的，其包括如下步骤：

第一步，在公式(1)的条件下随机初始化树型神经网络结构A

第二步，随机初始化对应A的神经网络参数W[A]；

第三步，循环遍历神经网络层l＝1，2，...，M-1和每层的每个单元b＝1，2，...，B_l，记为循环S；

第四步，在循环S下，依照公式(2)重置神经网络第l层的结构

第五步，在循环S下，使用随机梯度下降算法在训练数据集D_train上训练神经网络结构A对应的参数W[A]；

第六步，在循环S下，在验证数据集D_valid上测试属性n的预测准确率r_n，n＝1，2，...，N；

第七步，依照公式(3)更新神经网络第l层的结构

第八步，重复上述第三至第七步直到神经网络结构A和神经网络参数W[A]收敛，将收敛的神经网络结构A记为

接下来，重新训练神经网络的参数，并预测新的输入图片样本属性。具体的，其包括如下步骤：

第一步，合并训练数据集D_train和验证数据集D_valid为新的数据集D_trainval；

第二步，在数据集D_trainval上使用随机梯度下降算法训练由步骤S2得到的神经网络结构的参数

第三步，对于新的输入样本d_test，使用神经网络结构及其参数进行预测。

上述实施例中，本发明的神经网络结构的贪心搜索方法逐层遍历神经网络的结构，在每次更新时固定住其它层的网络结构，以探索当前层的最优网络结构。整个算法将经历多次遍历过程，直至网络结构与网络参数均收敛。之后，把搜索到的最优网络结构在训练集与验证集上重训练，以得到性能和鲁棒性俱佳的图片多属性预测神经网络。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种应用于图片多属性预测的神经网络结构搜索方法，其特征在于，包括以下步骤：

S2、贪心搜索最优的神经网络结构；

2.如权利要求1所述的应用于图片多属性预测的神经网络结构搜索方法，其特征在于，步骤S1中，所述的用于训练神经网络的图片多属性预测数据集为含有训练数据集D_train和验证数据集D_valid的图片多属性预测数据集，指定的神经网络层数M，以及每层的神经网络单元数目B_l，l＝1，2，...，M；

定义训练目标为：预测目标样本的属性值。

3.如权利要求2所述的应用于图片多属性预测的神经网络结构搜索方法，其特征在于，步骤S2具体包括：

S21、随机初始化符合公式(1)条件的树型神经网络结构A

S22、随机初始化对应A的神经网络参数W[A]；

S24、在循环S下，依照公式(2)重置神经网络第l层的结构

S27、依照公式(3)更新神经网络第l层的结构

4.如权利要求3所述的应用于图片多属性预测的神经网络结构搜索方法，其特征在于，步骤S3具体包括：