WO2021102655A1

WO2021102655A1 - 网络模型训练方法、图像属性识别方法、装置及电子设备

Info

Publication number: WO2021102655A1
Application number: PCT/CN2019/120749
Authority: WO
Inventors: 高洪涛
Original assignee: 深圳市欢太科技有限公司; Oppo广东移动通信有限公司
Priority date: 2019-11-25
Filing date: 2019-11-25
Publication date: 2021-06-03
Also published as: CN114450690A

Abstract

一种网络模型训练方法、图像属性识别方法、图像属性识别装置（500）及电子设备（600）。所述网络模型训练方法包括：获取图像样本集（101）；构建基础模型及所述基础模型对应的目标损失函数（102）；根据图像样本集和损失函数对基础模型进行训练，直至基础模型收敛；将收敛的基础模型作为识别图像属性的识别模型（105）。

Description

网络模型训练方法、图像属性识别方法、装置及电子设备

技术领域

本申请实施例涉及计算机技术，尤其涉及一种网络模型训练方法、图像属性识别方法、装置及电子设备。

背景技术

图像识别，是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对象的技术，是应用深度学习算法的一种实践应用。目前的图像识别方法，是直接将图像送入到卷积神经网络中进行特征提取，对提取的特征在卷积神经网络的全连接层中进行处理，从而得到图像的最终预测结果。

但是，通过这样的图像识别得到的图像识别结果会忽略许多图像属性以及图像属性之间的关联性及顺序性，例如，在对人体图像进行识别时，如果人体图像中有帽子、眼镜、上衣、包包、下衣、鞋子等，上衣和下衣之间会存在关联性和顺序性，若直接通过上述现有技术识别，会对上衣和下衣之间的关联性和顺序性忽略，导致不准确的识别效果。

发明内容

本申请提供了一种网络模型训练方法、图像属性识别方法、装置及电子设备，可以准确识别出图像属性及各属性之间的关联性。

第一方面，本申请实施例提供了一种网络模型训练方法，所述方法包括：

获取图像样本集，所述图像样本集包括多个图像属性初始值；

构建基础模型及所述基础模型对应的目标损失函数，所述基础模型包括卷积神经网络模型和循环神经网络模型；

将所述图像样本集输入至所述基础模型之中进行图像属性识别，以获取根据所述循环神经网络模型得到的第一训练结果和根据所述卷积神经网络模型得到的第二训练结果；

根据所述第一训练结果、所述第二训练结果、所述图像属性初始值和所述目标损失函数对所述卷积神经网络模型和所述循环神经网络模型进行联合训练，直至所述基础模型收敛；

将收敛的所述基础模型作为识别图像属性的识别模型。

第二方面，本申请实施例还提供了一种图像属性识别方法，其中，包括：

接收图像属性识别请求；

根据所述图像属性识别请求获取待识别图像；

调用预先训练的图像属性识别模型；

将所述待识别图像输入至预先训练的图像属性识别模型，对所述待识别图像的图像属性进行识别，以得到图像属性识别结果；

其中，所述图像属性识别模型采用本申请实施例提供的网络模型的训练方法训练得到的图像属性识别模型。

第三方面，本申请实施例提供了一种网络模型的训练装置，包括：

第一获取模块，用于获取图像样本集，所述图像样本集包括多个图像属性初始值；

构建模块，用于构建基础模型及所述基础模型对应的目标损失函数，所述基础模型包括卷积神经网络模型和循环神经网络模型；

第一识别模块，用于将所述图像样本集输入至所述基础模型之中进行图像属性识别，以获取根据所述循环神经网络模型得到的第一训练结果和根据所述卷积神经网络模型得到的第二训练结果；

训练模块，用于根据所述第一训练结果、所述第二训练结果、所述图像属性初始值和所述目标损失函数对所述卷积神经网络模型和所述循环神经网络模型进行联合训练，直至所述基础模型收敛；

确定模块，用于将收敛的所述基础模型作为识别图像属性的识别模型。

第四方面，本申请实施例提供了一种图像属性识别装置，包括：

接收模块，用于接收图像属性识别请求；

第二获取模块，用于根据所述图像属性识别请求获取待识别图像；

调用模块，用于调用预先训练的图像属性识别模型；

第二识别模块，用于将所述待识别图像输入至预先训练的图像属性识别模型，对所述待识别图像的图像属性进行识别，以得到图像属性识别结果；

其中，所述图像属性识别模型采用本申请实施例提供的网络模型训练方法得到的图像属性识别模型。

第五方面，本申请实施例提供一种存储介质，其上存储有计算机程序，其中，当所述计算机程序在计算机上执行时，使得所述计算机执行本实施例提供的网络模型的训练方法或图像属性识别方法。

第六方面，本申请实施例提供一种电子设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器通过调用所述存储器中存储的所述计算机程序，用于执行：

将收敛的所述基础模型作为识别图像属性的识别模型。

第七方面，本申请实施例提供一种电子设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器通过调用所述存储器中存储的所述计算机程序，用于执行：

接收图像属性识别请求；

根据所述图像属性识别请求获取待识别图像；

调用预先训练的图像属性识别模型；

附图说明

下面结合附图，通过对本申请的具体实施方式详细描述，将使本申请的技术方案及其有益效果显而易见。

图1是本申请实施例提供的网络模型训练方法的第一流程示意图。

图2是本申请实施例提供的网络模型训练方法的第二流程示意图。

图3是本申请实施例提供的图像属性识别方法的流程示意图。

图4是本申请实施例提供的网络模型训练装置的结构示意图。

图5是本申请实施例提供的图像属性识别装置的结构示意图。

图6是本申请实施例提供的电子设备的第一结构示意图。

图7是本申请实施例提供的电子设备的第二结构示意图。

具体实施方式

请参照图示，其中相同的组件符号代表相同的组件，本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例，其不应被视为限制本申请未在此详述的其它具体实施例。

请参阅图1，图1是本申请实施例提供的网络模型训练方法的第一种流程示意图。该网络模型训练方法的流程可以包括：

101、获取图像样本集，该图像样本集包括多种图像，例如人体图像、动物图像、植物图像等等，在本申请实施例中，可以采取图像样本集中多张人体图像来作为网络模型的训练图像。

例如，从网络图库中随机下载图片，将包含人体图像的图片筛选出来组合形成一个图像样本集。或者根据模型训练的方向选择多张人体图像来作为图像样本集，比如，模型训练的方向是寻找关于人体图像中衣物之间的关联性，则图像样本集中的图像可以选择包含多种不同穿着搭配的人体图像。

需要说明的是，为了保证在神经网络中输入的向量维数保持固定，保证神经网络不发生动态变化，在人体图像获取的过程中，可以将不同的人体图像进行裁剪，使得裁剪后的每一张人体图像尺寸大小都是相同的，从而实现网络模型训练目的。

可以理解的是，根据网络模型训练的方向，还可以选择面部五官之间的关联性或者肢体之间的关联性等来作为模型训练的方向。此时在图像样本集的获取过程中，可以对多张人体图像中包含面部五官的图像进行裁剪成同一尺寸的不同图像，例如，获取人体图像中脸部的预设数量的特征点，若获取完成，则对该人体图像中包含面部五官的图像进行拆建，反之，若从人体图像中获取的特征点数量未达到预设特征点数量，则认为该人体图像并不能作为图像样本集。

需要说明的是，在获取到图像样本集之后，图像样本集中的每一张训练图像都有各自对应的图像属性初始值，例如，人体图像中包含上衣、下衣、帽子、鞋子等属性，其中上衣和下衣之间的关联性为10％，则上衣和下衣之间的关联性10％就可以作为图像属性初始值，图像属性初始值可以是多个，也可以是一个，具体的需要根据训练图像中的属性多少及属性之间的关联度来决定。

102、构建基础模型及基础模型对应的目标损失函数。

基础模型可以采取不同类型的网络模型来共同创建，例如，可以采取卷积神经网络模型(Convolutional Neural Networks,CNN)和循环神经网络(Recurrent Neural Network,RNN)模型来共同创建基础模型。

在一些实施方式中，可以设置一个输入层，输入层用于输入图像样本集中的训练图像至基础模型中，然后将输入层与卷积层连接，卷积层分别与池化层和循环神经网络连接，循环神经网络与第一全连接层连接，池化层与第二全连接层连接，第一全连接层和第二全连接层作为该基础模型的输出层。

需要说明的是，其中输入层、卷积层、池化层以及第二全连接层依次连接可以形成卷积神经网络，循环神经网络设置在卷积层和第一全连接层之间。

在一些实施方式中，训练样本输入是连续的序列,且序列的长短不一，比如基于时间的序列：一段连续的语音，一段连续的手写文字。此时可以由循环神经网络来处理此类输入训练值不确定的问题。但是由于循环神经网络也有梯度消失的问题，因此很难处理长序列的数据，因此，循环神经网络可以采用门控循环单元网络(Gated Recurrent Unit networks,GRU)，门控循环单元网络的循环单元仅包含两个门控：更新门和复位门，其中，更新门和复位门两个门控不形成自循环，而是直接在系统状态间递归。

对于卷积神经网络和门控循环单元网络组合形成的基础模型，其中门控循环单元网络对应着第一损失函数，卷积神经网络对应着第二损失函数，第一损失函数和第二损失函数可以是不同类型的损失函数，也可以是相同类型的损失函数，基础模型对应的目标损失函数由第一损失函数和第二损失函数得到。

在一些实施方式中，可以将第一损失函数乘以损失系数，然后加上第二损失函数得到基础模型对应的目标函数，其中，损失系数可以是通过实验得到的参数，可以设置为0.8到1之间。

103、将图像样本集输入至基础模型之中进行图像属性识别，以获取根据循环神经网络模型得到的第一训练结果和根据卷积神经网络模型得到的第二训练结果。

在输入层中输入图像样本集中的训练图像，其中该训练图像可以为人体图像，通过构建的基础模型及基础模型对应的目标函数对图像的属性进行识别。

其中，训练图像首先经过卷积层进行计算得到第一特征值，卷积层最后一层输出的第一特征值再分别输入至池化层和循环神经网络，其中循环神经网络输出的第二特征值输入至第一全连接层得到第一训练结果，池化层输入的第三特征值输入至第二全连接层得到第二训练结果。

需要说明的是，第一训练结果和第二训练结果不是完全相同的，基础模型得到的最终训练结果是根据第一训练结果和第二训练结果得到的。比如，可以对第一训练结果和第二训练结果取交集，交集中的目标训练结果就是基础模型得到的最终训练结果。

在一些实施方式中，还可以选择将第一训练结果和第二训练结果相加得到最终的训练结果，还可以根据预设规则在第一训练结果中和第二训练结果中选择部分训练结果作为最终的训练结果。

104、根据第一训练结果、第二训练结果、图像属性初始值和目标损失函数对卷积神经网络模型和循环神经网络模型进行联合训练，直至基础模型收敛。

在一些实施例中，通过输入不同的训练图像，根据基础模型得到多个第一训练结果和第二训练结果，再根据第一训练结果和第二训练结果得到最终训练结果，通过将最终训练结果及图像属性初始值输入到目标损失函数中就可以得到目标损失值。

例如，将输入的训练图像为人体图像，其中人体图像中人物穿着有上衣、下衣、鞋子、帽子等多个穿戴物，每个穿戴物可以视为人体图像的属性之一，各属性之间有特定的关联性和关联性对应的关联度，关联度可以视为图像属性初始值。

在一些实施例中，在获取到最终训练结果和图像属性初始值之后，将二者输入到目标损失函数得到对应的目标损失值，可以判断目标损失值是否接近预设损失值，若目标损失值距离预设损失值在预设范围内，则认为基础模型已经训练完成，处于收敛状态。

例如，电子设备将人体图像输入至基础模型中，在第一全连接层输出第一训练结果，在第二全连接层输入第二训练结果。其中，第一全连接层输出的结果中包含各属性之间的关联性，比如第一训练结果有棉服、手套及短裤三个属性，其中棉服和手套之间有关联性，而棉服和短裤之间没有关联性。第二训练结果中有棉服、手套及短裙三个属性。可以取第一训练结果和第二训练结果中的交集为最终训练结果，则最终训练结果中含有棉服和手套两个属性以及棉服和手套之间的关联性。

将最终训练结果输入至目标损失函数得到目标损失值，将目标损失值和预设损失值对比，判断目标损失值是否符合预设条件，例如距离预设损失值的预设范围为1-10，当预设损失值为80，当目标损失值为75时，可以判定目标损失值在预设范围内，则目标损失值达到预设条件，认为该基础模型已经收敛。

在一些实施例中，可以直接将第一训练结果和图像属性初始值输入到第一损失函数，将第二训练结果和图像属性初始值输入至第二损失函数，由于目标损失函数是根据第一损失函数和第二损失函数得到的，在得到第一训练结果和第二训练结果的情况下可以通过损失函数直接计算出目标损失值。将目标损失值和预设损失值进行对比，来判断基础模型是否收敛。比如，当目标损失值小于或者等于预设损失值时，则认为目标损失值达到预设条件，此时认为基础模型收敛。

需要说明的是，在基础模型的训练中，训练次数可以为多次，通过卷积神经网络模型和循环神经网络模型的联合训练，最终使得基础模型收敛，达到基础模型训练的预期效果。

105、将收敛的基础模型作为识别图像属性的识别模型。

其中，将收敛的基础模型作为图像属性识别的图像属性识别模型，可以将图像属性识别模型应用于电子设备中，以根据图像属性识别模型对用户存储至电子设备中图像属性识别，既可以根据图像属性识别结果得到图像属性之间的关联性，还可以提高对图像属性识别的准确率。

由上述可知，本申请实施例提供的网络模型训练方法，通过获取图像样本集，图像样本集包括多个图像属性初始值；构建基础模型及基础模型对应的目标损失函数，基础模型包括卷积神经网络模型和循环神经网络模型；将图像样本集输入至基础模型之中进行图像属性识别，以获取根据循环神经网络模型得到的第一训练结果和根据卷积神经网络模型得到的第二训练结果；根据第一训练结果、第二训练结果、图像属性初始值和目标损失函数对卷积神经网络模型和循环神经网络模型进行联合训练，直至基础模型收敛；将收敛的基础模型作为识别图像属性的识别模型。

通过此方式获取的图像属性识别模型，能够提高图像属性识别的准确率，还能够识别图像属性之间的关联性。

请参阅图2，图2是本申请实施例提供的网络模型训练方法的第二流程示意图。该网络模型训练方法可以包括：

201、获取图像样本集。

该图像样本集包括多种图像，例如人体图像、动物图像、植物图像等等，在本申请实施例中，可以采取图像样本集中多张人体图像来作为网络模型的训练图像。

在一些实施例中，多张人体图像作为训练图像，可以提取每一张人体图像的属性以及属性之间的关联度。例如，在一张人体图像中，有帽子、眼镜、上衣、下衣、鞋子等图像属性，不同的属性之间关联性是不同的，比如戴眼镜和穿上衣之间没有比较紧密的关联性，穿鞋子和戴帽子之间没有紧密的关联性。此时可以获取具备关联性的属性，比如鞋子和下衣，上衣和下衣之间的关联性以及关联属性之间对应的关联度，具体的，运动鞋、运动裤、运动上衣三者之间是具备关联性的，三者之间也是具备关联度的，可以将图像的属性和图像属性之间对应的关联度作为一个图像属性初始值。

202、根据卷积神经网络和循环神经网络构建基础模型。

其中，可以先设置一个输入层，输入层用于输入训练图像，然后设置一个卷积层，卷积层用于对输入的训练图像进行初步的图像特征提取以得到第一特征值，再将第一特征值输入至下一层基础模型结构之中。

将卷积层与循环神经网络连接，循环神经网络可以对卷积层输出的第一特征值进行处理并输入第二特征值，循环神经网络的另一侧连接有第一全连接层，第一全连接层可以作为该基础模型的一个输出层，用于对第二特征值进行处理并输出第一训练结果。

将输入层、卷积层、池化层、第二全连接层依次连接，形成卷积神经网络，其中卷积层输出的第一特征值经池化层处理得到第三特征值，最后第二全连接层对第三特征值进行处理并输出第二训练结果。整个基础模型可以看作是卷积神经网络模型和循环神经网络共同构成的。

在一些实施例中，卷积层可以设置多层，例如，卷积层包括conv3、conv6、conv9等，输入的人体图像经过多层卷积层处理之后得到一定维度上的特征图(Feature Map)，将该特征图作为第一特征值。其中循环神经网络可以是门控循环单元网络，即GRU神经网络。

203、构建循环神经网络的第一损失函数和卷积神经对应的第二损失函数。

其中，第一损失函数和第二损失函数可以为相同类型的损失函数，也可以为不同类型的损失函数，例如，第一损失函数和第二损失函数都可以为交叉熵损失函数。

比如，可以通过softmax算法对卷积神经网络的最后一层的输出进行处理，这一步通常是求取输出属于某一类的概率，对于单样本而言，输出就是一个向量。其中softmax的公式为：

然后将softmax后的输出向量和样本的实际标签做一个交叉熵，公式如下：

H _y’(y)＝-∑ _iy’ _ilog(y ⁱs；

y’ _i代表实际的标签中第i个的值，y _i就是softmax的输出向量[Y1,Y2,Y3...]中第i个元素。

204、根据第一损失函数和第二损失函数构建基础模型对应的目标损失函数。

可以理解的是，根据基础模型的训练方向，对目标损失函数的设置也需要根据训练方向二调整，在第一损失函数之前设置损失系数与第一损失函数相乘，是对目标函数进行调整的一种方式。

205、将图像样本集输入至基础模型之中进行图像属性识别，以获取根据循环神经网络模型得到的第一训练结果和根据卷积神经网络模型得到的第二训练结果。

206、将第一训练结果、第二训练结果和图像属性初始值输入至目标损失函数得到目标损失值。

在一些实施例中，可以直接将第一训练结果和图像属性初始值输入到第一损失函数，将第二训练结果和图像属性初始值输入至第二损失函数，由于目标损失函数是根据第一损失函数和第二损失函数的来的，在得到第一训练结果和第二训练结果的情况下可以通过损失函数直接计算出目标损失值。将目标损失值和预设损失值进行对比，来判断基础模型是否收敛。比如，当目标损失值小于或者等于预设损失值时，则认你为目标损失值达到预设条件，此时认为基础模型收敛。

207、根据目标损失值对基础模型的参数进行调整，直至基础模型收敛。

在一些实施例中，当目标损失值未达到预设条件时，例如，目标损失值未在预设范围之内，或者目标损失值未达到预设损失值的时候，可以视为基础模型训练并未完成，基础模型输出的训练结果不能达到预期结果，所以需要对基础模型的模型参数进行调整。

在一些实施方式中，由于基础模型的建立是根据卷积神经网络模型和循环神经网络模型建立的，在对基础模型的参数进行调整时，可以对卷积神经网络模型和循环神经网络模型中的一些模型参数进行调整。其中，可以通过反向传播算法来对模型的参数进行调整。

208、将收敛的基础模型作为识别图像属性的识别模型。

例如，在收敛的基础模型中输入随机一张人体图像，能够准确识别出人体图像中穿戴的衣物类型及各衣物之间的关联性；或者能够准确识别人体五官特征及五官之间的关联性。说明收敛的基础模型已经能够准确识别出输入图像的属性及各属性之间的关联性了，收敛的基础模型可以作为图像属性识别模型。

综上所述，本申请实施例提供的网络模型训练方法，通过获取图像样本集及图像样本集包括的图像属性初始值，然后根据卷积神经网络和循环神经网络构建基础模型，对循环神经网络设置第一损失函数，对卷积神经网络设置第二损失函数，根据第一损失函数和第二损失函数得到目标损失函数；将图像样本集输入到基础模型中对基础模型进行训练，得到第一训练结果和第二训练结果，最后根据图像属性初始值、目标损失函数、第一训练结果和第二训练结果来对基础模型的参数进行调整，直至基础模型收敛，将收敛的模型作为图像属性识别模型，用于准确识别出图像属性及各属性之间的关联度。

请参阅图3，图3是本申请实施例提供的图像属性识别方法的流程示意图。该图像属性识别方法可以包括以下流程：

301、接收图像属性识别请求。

图像属性识别请求可以是通过电子设备接收触控操作、语音操作、接收相应目标应用的开启指令等方式进行触发。另外，还可以在间隔预设时长或者基于一定的触发规则去自动触发图像属性识别请求。例如，当检测到电子设备当前显示界面包括多个图像时，如检测到电子设备启动浏览器应用进行浏览包含图像的文章页面时，可以自动触发生成图像属性识别请求，根据图像属性识别模型对多个图像进行图像属性识别。使得电子设备可以准确识别出图像属性以及各属性之间的关联性。

在一些实施方式中，在用户使用电子设备进行网络购物时，可以在虚拟人体图像中输入多种衣物或者饰品，其中上衣、下衣、鞋子、帽子、耳环、项链等都可以是人体图像的属性信息，用户可以将这些物品输入到虚拟人体图像中，并穿戴在对应的位置以得到新的虚拟人体图像，在用户输入完成之后，就可以选择识别，电子设备接收图像属性识别请求对新的虚拟人体图像进行识别。

302、根据图像属性识别请求获取待识别图像。

在一些实施方式中，当用户浏览的界面包含多个图像时，用户可以在电子设备上点击特定位置或者用手指来划分区域来选择想要识别的图像，此时电子设备可以根据用户的选择位置或者区域获取待识别图像。

在一些实施方式中，用户在输入图像属性识别请求之后，电子设备可以根据图像识别请求主动获取用户需要识别的图像，例如，用户在浏览图片时，电子设备可以根据图像识别请求主动寻找需要待识别图片。

303、根据图像属性识别请求识别待识别图像中的目标主体。

在一些实施例中，图像属性识别请求中包含了目标主体具体类型，当电子设备接收到图像属性识别请求时，能够对待识别图像中的目标主体进行获取，例如，用户一张合影照里面有多个人物，可以对需要识别的人物主体进行主体提取；一张风景照里有多种植物或动物，可以对需要识别的动物图像进行主体提取，在对图像属性识别的过程中，需要排除非识别对象，保留目标主体。

304、根据目标主体获取待识别图像中的目标图像。

在一些实施例中，获取目标主体后可以对目标主体所在的图像进行裁切以得到目标图像，可以在图像属性识别的过程中避免不需要识别的主体干扰目标主体的识别，使得在图像属性识别的过程中识别速度更快，识别结果更加准确。

305、调用预先训练的图像属性识别模型。

其中，图像属性识别模型采用本实施例提供的网络模型的训练方法训练得到的图像属性识别模型。具体网络模型的训练过程可以参见上述实施例的相关描述，在此不再赘述。

306、将目标图像输入至预先训练的图像属性识别模型，以得到图像属性识别结果。

其中，将目标图像输入至图像属性识别模型之后进行图像属性识别，得到图像中多个属性的识别结果以及各属性之间的关联性。

例如，在识别的人体图像中，图像属性识别模型能够识别出人体衣物之间的关联性，例如短裤和短袖之间的关联度为100％，牛仔裤和运动鞋之间的关联性为80％，帽子和眼镜之间的关联度为50％等等，从而得到各穿戴物、衣物之间的关联性，用户能够更好的参考如何对衣物进行搭配。

由上述可知，本申请实施例提供的图像属性识别方法，通过接收图像属性识别请求，根据图像属性识别请求获取待识别图像，然后调用预先训练的图像属性识别模型，将待识别图像输入至预先训练的图像属性识别模型，对待识别图像的图像属性进行识别，以得到图像属性识别结果，从而得到图像各属性之间的关联性。

请参阅图4，图4是本申请实施例提供的网络模型的训练装置的结构示意图。该网络模型的训练装置400可以包括：第一获取模块410、构建模块420、第一识别模块430、训练模块440和确定模块450。

第一获取模块410，用于获取图像样本集，所述图像样本集包括多个图像属性初始值；

构建模块420，用于构建基础模型及所述基础模型对应的目标损失函数，所述基础模型包括卷积神经网络模型和循环神经网络模型；

第一识别模块430，用于将所述图像样本集输入至所述基础模型之中进行图像属性识别，以获取根据所述循环神经网络模型得到的第一训练结果和根据所述卷积神经网络模型得到的第二训练结果；

训练模块440，用于根据所述第一训练结果、所述第二训练结果、所述图像属性初始值和所述目标损失函数对所述卷积神经网络模型和所述循环神经网络模型进行联合训练，直至所述基础模型收敛；

确定模块450，用于将收敛的所述基础模型作为识别图像属性的识别模型。

在一些实施方式中，构建模块420包括设置子模块421、第一连接子模块422、第二连接子模块423，其中，设置子模块421，用于设置卷积层、池化层、第一全连接层及第二全连接层；第一连接子模块422，用于将所述卷积层、所述池化层及所述第二全连接层连接，以得到所述卷积神经网络模型；第二连接子模块423，用于将所述循环神经网络与所述卷积层连接，以及将所述循环神经网络与所述第一全连接层连接，以得到所述循环神经网络模型。

构建模块420，具体用于构建所述卷积神经网络模型对应的第一损失函数，构建所述循环神经网络模型对应的第二损失函数，根据所述第一损失函数和所述第二损失函数得到所述基础模型对应的目标损失函数。例如，可以将所述第二损失函数乘以损失系数以得到目标第二损失函数，将所述目标第二损失函数与所述第一损失函数相加得到所述目标损失函数。

在一些实施例中，训练模块440，具体用于将所述第一训练结果、所述第二训练结果和所述图像属性初始值输入至所述目标损失函数，以得到目标损失值；根据所述目标损失值对所述基础模型的参数进行调整。

在一些实施例中，确定模块450，具体用于将所述图像样本集输入至所述卷积层以得到所述第一特征值；将所述第一特征值输入至所述循环神经网络以得到所述第二特征值；将所述第二特征值输入至所述第一全连接层以得到所述第一训练结果。

由上述可知，第一获取模块410获取图像样本集，图像样本集包括多个图像属性初始值；构建模块420构建基础模型及所述基础模型对应的目标损失函数，基础模型包括卷积神经网络模型和循环神经网络模型；第一识别模块430将所述图像样本集输入至基础模型之中进行图像属性识别，以获取根据循环神经网络模型得到的第一训练结果和根据卷积神经网络模型得到的第二训练结果；训练模块440根据第一训练结果、第二训练结果、图像属性初始值和目标损失函数对卷积神经网络模型和循环神经网络模型进行联合训练，直至基础模型收敛；确定模块450将收敛的基础模型作为识别图像属性的识别模型。训练后的基础网络模型，可以提高图像属性识别的准确率，以及识别出各个图像属性之间的关联性。

应当说明的是，本申请实施例提供的网络模型的训练装置与上文实施例中的网络模型的训练方法属于同一构思，在网络模型的训练装置上可以运行网络模型的训练方法实施例中提供的任一方法，其具体实现过程详见网络模型的训练方法实施例，此处不再赘述。

请参阅图5为本申请实施例提供的图像属性识别装置的结构示意图。该图像属性识别装置500可以包括：接收模块510、第二获取模块520、调用模块530和第二识别模块540。

接收模块510，用于接收图像属性识别请求；

第二获取模块520，用于根据所述图像属性识别请求获取待识别图像；

调用模块530，用于调用预先训练的图像属性识别模型；

第二识别模块540，用于将所述待识别图像输入至预先训练的图像属性识别模型，对所述待识别图像的图像属性进行识别，以得到图像属性识别结果。

在一些实施方式中，第二获取模块520具体用于根据图像属性识别请求识别所述待识别图像中的目标主体，根据所述目标主体获取所述待识别图像中的目标图像。

由上述可知，本申请实施例提供的图像属性识别装置500通过接收模块510接收图像属性识别请求；第二获取模块520根据图像属性识别请求获取待识别图像；调用模块530调用预先训练的图像属性识别模型；第二识别模块540将待识别图像输入至预先训练的图像属性识别模型，对待识别图像的图像属性进行识别，以得到图像属性识别结果。通过上述网络模型训练方法训练的图像属性识别装置，能够准确识别出图像中的各个属性以及各属性之间的关联性，提高了图像属性识别的准确率。

应当说明的是，本申请实施例提供的图像属性识别装置与上文实施例中的图像属性识别方法属于同一构思，在图像属性识别装置上可以运行图像属性是被方法实施例中提供的任一方法，其具体实现过程详见图像的处理方法实施例，此处不再赘述。

本申请实施例提供一种计算机可读的存储介质，其上存储有计算机程序，当其存储的计算机程序在计算机上执行时，使得计算机执行如本申请实施例提供的网络模型的训练方法或图像的处理方法。

其中，存储介质可以是磁碟、光盘、只读存储器(Read Only Memory，ROM，)或者随机存取器(Random Access Memory，RAM)等。

本申请实施例还提供一种电子设备，包括存储器，处理器，所述存储器中存储有计算机程序，所述处理器通过调用所述存储器中存储的所述计算机程序，用于执行如本申请实施例提供的网络模型的训练方法或图像属性识别方法。

例如，上述电子设备可以是诸如平板电脑或者智能手机等移动终端。请参阅图6，图6为本申请实施例提供的电子设备的第一种结构示意图。

该电子设备500可以包括存储器601、处理器602等部件。本领域技术人员可以理解，图7中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

存储器601可用于存储软件程序以及模块，处理器602通过运行存储在存储器601的计算机程序以及模块，从而执行各种功能应用以及数据处理。存储器601可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据电子设备的使用所创建的数据等。

处理器602是电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器601内的应用程序，以及调用存储在存储器601内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。

此外，存储器601可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器601还可以包括存储器控制器，以提供处理器602对存储器601的访问。

在本实施例中，电子设备中的处理器602会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行代码加载到存储器601中，并由处理器602来运行存储在存储器601中的应用程序，从而实现流程：

将收敛的所述基础模型作为识别图像属性的识别模型。

在一些实施方式中，处理器602执行构建所述基础模型对应的目标损失函数时，可以执行：

构建所述卷积神经网络模型对应的第一损失函数；

构建所述循环神经网络模型对应的第二损失函数；

根据所述第一损失函数和所述第二损失函数得到所述基础模型对应的目标损失函数。

具体的，处理器602在执行根据所述第一损失函数和所述第二损失函数得到所述基础模型对应的目标损失函数时，可以执行：

将所述第二损失函数乘以损失系数以得到目标第二损失函数；

将所述目标第二损失函数与所述第一损失函数相加得到所述目标损失函数。

在一些实施方式中，处理器602执行根据所述第一训练结果、所述第二训练结果、所述图像属性初始值和所述目标损失函数对所述卷积神经网络模型和所述循环神经网络模型进行联合训练，直至所述基础模型收敛时，可以执行：

将所述第一训练结果、所述第二训练结果和所述图像属性初始值输入至所述目标损失函数，以得到目标损失值；

根据所述目标损失值对所述基础模型的参数进行调整。

在一些实施方式中，处理器602执行构建基础模型时，可以执行：

设置卷积层、池化层、第一全连接层及第二全连接层；

将所述卷积层、所述池化层及所述第二全连接层连接，以得到所述卷积神经网络模型；

将所述循环神经网络与所述卷积层连接，以及将所述循环神经网络与所述第一全连接层连接，以得到所述循环神经网络模型。

在一些实施方式中，处理器602执行将所述图像样本集输入至所述基础模型之中进行图像属性识别，以获取根据所述循环神经网络模型得到的第一训练结果时，可以执行：

将所述图像样本集输入至所述卷积层以得到所述第一特征值；

将所述第一特征值输入至所述循环神经网络以得到所述第二特征值；

将所述第二特征值输入至所述第一全连接层以得到所述第一训练结果。

在本实施例中，电子设备中的处理器602会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行代码加载到存储器601中，并由处理器501来运行存储在存储器601中的应用程序，从而实现流程：

接收图像属性识别请求；

根据所述图像属性识别请求获取待识别图像；

调用预先训练的图像属性识别模型；

将所述待识别图像输入至预先训练的图像属性识别模型，对所述待识别图像的图像属性进行识别，以得到图像属性识别结果。

在一些实施方式中，处理器602执行根据所述图像属性识别请求获取待识别图像时，可以执行：

根据图像属性识别请求识别所述待识别图像中的目标主体；

根据所述目标主体获取所述待识别图像中的目标图像。

请参照图7，图7为本申请实施例提供的电子设备的第二结构示意图，与图6所示电子设备的区别在于，电子设备还包括：摄像组件603、射频电路604、音频电路605以及电源606。其中，显示器603、射频电路604、音频电路605以及电源606分别与处理器602电性连接。

该显示器603可以用于显示由用户输入的信息或提供给用户的信息以及各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示器603可以包括显示面板，在某些实施方式中，可以采用液晶显示器(Liquid Crystal Display，LCD)、或者有机发光二极管(Organic Light-Emitting Diode，OLED)等形式来配置显示面板。

射频电路604可以用于收发射频信号，以通过无线通信与网络设备或其他电子设备建立无线通讯，与网络设备或其他电子设备之间收发信号。

音频电路605可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。

电源606可以用于给电子设备600的各个部件供电。在一些实施例中，电源606可以通过电源管理系统与处理器602逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管图7中未示出，电子设备600还可以包括摄像组件、蓝牙模块等，摄像组件可以包括图像处理电路，图像处理电路可以利用硬件和/或软件组件实现，可包括定义图像信号处理(Image Signal Processing)管线的各种处理单元。图像处理电路至少可以包括：多个摄像头、图像信号处理器(Image Signal Processor，ISP处理器)、控制逻辑器、图像存储器以及显示器等。其中每个摄像头至少可以包括一个或多个透镜和图像传感器。图像传感器可包括色彩滤镜阵列(如Bayer滤镜)。图像传感器可获取用图像传感器的每个成像像素捕捉的光强度和波长信息，并提供可由图像信号处理器处理的一组原始图像数据。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见上文针对网络模型的训练方法/图像的处理方法的详细描述，此处不再赘述。

本申请实施例提供的所述网络模型的训练方法/图像的处理方法装置与上文实施例中的网络模型的训练方法/图像的处理方法属于同一构思，在所述网络模型的训练方法/图像的处理方法装置上可以运行所述网络模型的训练方法/图像的处理方法实施例中提供的任一方法，其具体实现过程详见所述网络模型的训练方法/图像的处理方法实施例，此处不再赘述。

需要说明的是，对本申请实施例所述网络模型的训练方法/图像的处理方法而言，本领域普通技术人员可以理解实现本申请实施例所述网络模型的训练方法/图像的处理方法的全部或部分流程，是可以通过计算机程序来控制相关的硬件来完成，所述计算机程序可存储于一计算机可读取存储介质中，如存储在存储器中，并被至少一个处理器执行，在执行过程中可包括如所述网络模型的训练方法/图像的处理方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)等。

对本申请实施例的所述网络模型的训练方法/图像的处理方法装置而言，其各功能模块可以集成在一个处理芯片中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中，所述存储介质譬如为只读存储器，磁盘或光盘等。

以上对本申请实施例所提供的一种网络模型的训练方法、图像的处理方法、装置、存储介质及电子设备进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种网络模型训练方法，其中，所述方法包括：

获取图像样本集，所述图像样本集包括多个图像属性初始值；

构建基础模型及所述基础模型对应的目标损失函数，所述基础模型包括卷积神经网络模型和循环神经网络模型；

将所述图像样本集输入至所述基础模型之中进行图像属性识别，以获取根据所述循环神经网络模型得到的第一训练结果和根据所述卷积神经网络模型得到的第二训练结果；

根据所述第一训练结果、所述第二训练结果、所述图像属性初始值和所述目标损失函数对所述卷积神经网络模型和所述循环神经网络模型进行联合训练，直至所述基础模型收敛；

将收敛的所述基础模型作为识别图像属性的识别模型。
根据权利要求1所述的网络模型训练方法，其中，所述构建所述基础模型对应的目标损失函数，包括：

构建所述卷积神经网络模型对应的第一损失函数；

构建所述循环神经网络模型对应的第二损失函数；

根据所述第一损失函数和所述第二损失函数得到所述基础模型对应的目标损失函数。
根据权利要求2所述的网络模型训练方法，其中，所述根据所述第一损失函数和所述第二损失函数得到所述基础模型对应的目标损失函数，包括：

将所述第二损失函数乘以损失系数以得到目标第二损失函数；

将所述目标第二损失函数与所述第一损失函数相加得到所述目标损失函数。
根据权利要求3所述的网络模型训练方法，其中，所述根据所述第一训练结果、所述第二训练结果、所述图像属性初始值和所述目标损失函数对所述卷积神经网络模型和所述循环神经网络模型进行联合训练，直至所述基础模型收敛，包括：

将所述第一训练结果、所述第二训练结果和所述图像属性初始值输入至所述目标损失函数，以得到目标损失值；

根据所述目标损失值对所述基础模型的参数进行调整。
根据权利要求1所述的图像属性识别方法，其中，所述构建基础模型，包括：

设置卷积层、池化层、第一全连接层及第二全连接层；

将所述卷积层、所述池化层及所述第二全连接层连接，以得到所述卷积神经网络模型；

将所述循环神经网络与所述卷积层连接，以及将所述循环神经网络与所述第一全连接层连接，以得到所述循环神经网络模型。
根据权利要求5所述的网络模型，其中，所述将所述图像样本集输入至所述基础模型之中进行图像属性识别，以获取根据所述循环神经网络模型得到的第一训练结果，包括：

将所述图像样本集输入至所述卷积层以得到所述第一特征值；

将所述第一特征值输入至所述循环神经网络以得到所述第二特征值；

将所述第二特征值输入至所述第一全连接层以得到所述第一训练结果。
一种图像属性识别方法，其中，所述方法包括：

接收图像属性识别请求；

根据所述图像属性识别请求获取待识别图像；

调用预先训练的图像属性识别模型；

将所述待识别图像输入至所述预先训练的图像属性识别模型，对所述待识别图像的图像属性进行识别，以得到图像属性识别结果；

其中，所述图像属性识别模型为采用权利要求1至6任一项所述的所述网络模型的训练方法训练得到的图像属性识别模型。
根据权利要求7所述的图像属性识别方法，其中，所述根据所述图像属性识别请求获取待识别图像，包括：

根据图像属性识别请求识别所述待识别图像中的目标主体；

根据所述目标主体获取所述待识别图像中的目标图像。
一种网络模型的训练装置，其中，包括：

第一获取模块，用于获取图像样本集，所述图像样本集包括多个图像属性初始值；

构建模块，用于构建基础模型及所述基础模型对应的目标损失函数，所述基础模型包括卷积神经网络模型和循环神经网络模型；

第一识别模块，用于将所述图像样本集输入至所述基础模型之中进行图像属性识别，以获取根据所述循环神经网络模型得到的第一训练结果和根据所述卷积神经网络模型得到的第二训练结果；

训练模块，用于根据所述第一训练结果、所述第二训练结果、所述图像属性初始值和所述目标损失函数对所述卷积神经网络模型和所述循环神经网络模型进行联合训练，直至所述基础模型收敛；

确定模块，用于将收敛的所述基础模型作为识别图像属性的识别模型。
根据权利要求9所述的训练装置，其中，所述构建模块包括：

设置子模块，用于设置卷积层、池化层、第一全连接层及第二全连接层；

第一连接子模块，用于将所述卷积层、所述池化层及所述第二全连接层连接，以得到所述卷积神经网络模型；

第二连接子模块，用于将所述循环神经网络与所述卷积层连接，以及将所述循环神经网络与所述第一全连接层连接，以得到所述循环神经网络模型。
一种图像属性的识别装置，其中，包括：

接收模块，用于接收图像属性识别请求；

第二获取模块，用于根据所述图像属性识别请求获取待识别图像；

调用模块，用于调用预先训练的图像属性识别模型；

第二识别模块，用于将所述待识别图像输入至所述预先训练的图像属性识别模型，对所述待识别图像的图像属性进行识别，以得到图像属性识别结果；

其中，所述图像属性识别模型为采用权利要求1至6任一项所述的网络模型训练方法得到的图像属性识别模型。
一种存储介质，其中，所述存储介质中存储有计算机程序，当所述计算机程序在计算机上运行时，使得所述计算机执行权利要求1至6任一项所述的网络模型训练方法或权利要求7、8所述的图像属性识别方法。
一种电子设备，其中，所述电子设备包括处理器和存储器，所述存储器中存储有计算机程序，所述处理器通过调用所述存储器中存储的所述计算机程序，用于执行：

获取图像样本集，所述图像样本集包括多个图像属性初始值；

构建基础模型及所述基础模型对应的目标损失函数，所述基础模型包括卷积神经网络模型和循环神经网络模型；

将所述图像样本集输入至所述基础模型之中进行图像属性识别，以获取根据所述循环神经网络模型得到的第一训练结果和根据所述卷积神经网络模型得到的第二训练结果；

根据所述第一训练结果、所述第二训练结果、所述图像属性初始值和所述目标损失函数对所述卷积神经网络模型和所述循环神经网络模型进行联合训练，直至所述基础模型收敛；

将收敛的所述基础模型作为识别图像属性的识别模型。
根据权利要求13所述的电子设备，其中，所述处理器用于执行：

构建所述卷积神经网络模型对应的第一损失函数；

构建所述循环神经网络模型对应的第二损失函数；

根据所述第一损失函数和所述第二损失函数得到所述基础模型对应的目标损失函数。
根据权利要求14所述的电子设备，其中，所述处理器用于执行：

将所述第二损失函数乘以损失系数以得到目标第二损失函数；

将所述目标第二损失函数与所述第一损失函数相加得到所述目标损失函数。
根据权利要求15所述的电子设备，其中，所述处理器用于执行：

将所述第一训练结果、所述第二训练结果和所述图像属性初始值输入至所述目标损失函数，以得到目标损失值；

根据所述目标损失值对所述基础模型的参数进行调整。
根据权利要求13所述的电子设备，其中，所述处理器用于执行：

设置卷积层、池化层、第一全连接层及第二全连接层；

将所述卷积层、所述池化层及所述第二全连接层连接，以得到所述卷积神经网络模型；

将所述循环神经网络与所述卷积层连接，以及将所述循环神经网络与所述第一全连接层连接，以得到所述循环神经网络模型，所述循环神经网络模型和所述卷积神经网络模型组合形成所述基础模型。
根据权利要求17所述的电子设备，其中，所述处理器用于执行：

将所述图像样本集输入至所述卷积层以得到所述第一特征值；

将所述第一特征值输入至所述循环神经网络以得到所述第二特征值；

将所述第二特征值输入至所述第一全连接层以得到所述第一训练结果。
一种电子设备，其中，所述电子设备包括处理器和存储器，所述存储器中存储有计算机程序，所述处理器通过调用所述存储器中存储的所述计算机程序，用于执行：

接收图像属性识别请求；

根据所述图像属性识别请求获取待识别图像；

调用预先训练的图像属性识别模型；

将所述待识别图像输入至所述预先训练的图像属性识别模型，对所述待识别图像的图像属性进行识别，以得到图像属性识别结果；

其中，所述图像属性识别模型为采用权利要求1至6任一项所述的所述网络模型的训练方法训练得到的图像属性识别模型。
根据权利要求19所述的电子设备，其中，所述处理器用于执行：

根据图像属性识别请求识别所述待识别图像中的目标主体；

根据所述目标主体获取所述待识别图像中的目标图像。