CN111414922B

CN111414922B - 特征提取方法、图像处理方法、模型训练方法及装置

Info

Publication number: CN111414922B
Application number: CN201910011794.4A
Authority: CN
Inventors: 王永攀; 郑琪; 许永超; 黄腾腾; 白翔; 柏松
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2019-01-07
Filing date: 2019-01-07
Publication date: 2022-11-15
Anticipated expiration: 2039-01-07
Also published as: CN111414922A

Abstract

本申请实施例提供一种特征提取方法、图像处理方法、模型训练方法及装置，其中，神经网络模型中插入至少一个特征层，该特征层可以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入所述特征层连接的后一网络层；本申请实施例提高了图像识别准确度。

Description

特征提取方法、图像处理方法、模型训练方法及装置

技术领域

本申请实施例涉及图像处理技术领域，尤其涉及特征提取方法、图像处理方法、模型训练方法以及装置。

背景技术

利用神经网络模型进行图像识别是目前人工智能领域常用的技术手段，图像识别是指识别图像中的目标对象或者实现对图像中的目标对象的分割，如基于人体组成结构，进行人体分割等。

其中，利用神经网络模型进行图像识别需要预先训练神经网络模型，主要是利用样本图像及样本图像标注的标签进行训练，以实现人体分割为例，训练神经网络模型时，样本图像标注的标签包括样本图像中各个像素点的标签，各个像素点的标签用以表明各个像素点所属的人体组成部位，从而利用训练好的神经网络模型对待处理图像进行处理时，获得的识别结果即为待处理图像中各个像素点的分类结果，也即各个像素点的标签，从而根据各个像素点的标签表明的人体组成部位，即可以实现对待处理图像的分割。

但是，目前的神经网络模型进行图像识别时会出现不一致性问题，也即提取的目标对象容易出现弥散或色斑现象，目标对象的相邻部位没有紧密连接，分割边界不清晰等，从而影响图像识别准确度。

发明内容

本申请实施例提供一种特征提取方法、图像处理方法、模型训练方法及装置，用以解决现有技术中图像识别准确度低的技术问题。

第一方面，本申请实施例中提供了一种特征提取方法，包括：

接收神经网络模型中特征层连接的前一网络层输出的第一图像特征；其中，所述第一图像特征包括多个像素点的第一像素特征；所述特征层位于神经网络模型的输入层以及输出层之间；

根据任意像素点与其所在目标区域内的至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征；

由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征；其中，所述第二图像特征用于输入所述特征层连接的后一网络层。

第二方面，本申请实施例中提供了一种模型训练方法，包括：

将样本图像输入神经网络模型，获得实际识别结果；其中，所述神经网络模型包括输入层、输出层、位于所述输入层以及所述输出层之间的至少一个隐藏层及至少一个特征层构成；所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层；

根据所述实际识别结果与所述样本图像的期望识别结果，对所述神经网络模型进行参数优化；

其中，所述神经网络模型用以识别待处理图像。

第三方面，本申请实施例中提供了一种图像处理方法，包括：

确定神经网络模型；其中，所述神经网络模型包括输入层、输出层、位于所述输入层以及所述输出层之间的至少一个隐藏层及至少一个特征层构成；所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层；

将待处理图像输入所述神经网络模型，获得所述待处理图像的目标识别结果。

第四方面，本申请实施例中提供了一种模型构建方法，包括：

构建输入层、输出层及位于所述输入层以及所述输出层之间的至少一个隐藏层；

构建至少一个特征层；

将所述至少一个特征层插入所述输入层以及所述输出层之间，获得用于进行图像识别的神经网络模型；

其中，所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与其连接的后一网络层。

第五方面，本申请实施例中提供了一种特征提取装置，包括：

接收模块，用于接收神经网络模型中特征层连接的前一网络层输出的第一图像特征；其中，所述第一图像特征包括多个像素点的第一像素特征；所述特征层位于神经网络模型的输入层以及输出层之间；

特征融合模块，用于根据任意像素点与其所在目标区域内的至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征；

特征构成模块，用于由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征；其中，所述第二图像特征用于输入所述特征层连接的后一网络层。

第六方面，本申请实施例中提供了一种模型训练装置，包括：

训练识别模块，用于将样本图像输入神经网络模型，获得实际识别结果；其中，所述神经网络模型包括输入层、输出层、位于所述输入层以及所述输出层之间的至少一个隐藏层及至少一个特征层构成；所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层；

训练优化模块，用于根据所述实际识别结果与所述样本图像的期望识别结果，对所述神经网络模型进行参数优化，获得所述神经网络模型的模型训练参数；

其中，所述神经网络模型用以识别待处理图像。

第七方面，本申请实施例中提供了一种图像处理装置，包括：

模型确定模块，用于确定神经网络模型；其中，所述神经网络模型包括输入层、输出层、位于所述输入层以及所述输出层之间的至少一个隐藏层及至少一个特征层构成；所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层；

图像处理模块，用于将待处理图像输入所述神经网络模型，获得所述待处理图像的目标识别结果。

第八方面，本申请实施例中提供了一种模型构建装置，包括：

第一构建模块，构建输入层、输出层及位于所述输入层以及所述输出层之间的至少一个隐藏层；

第二构建模块，用于构建至少一个特征层；

模型构建模块，用于将所述至少一个特征层插入所述输入层以及所述输出层之间，获得用于进行图像识别的神经网络模型；

第九方面，本申请实施例中提供了一种计算设备，包括存储组件以及处理组件；

所述存储组件存储一条或多条计算机指令，其中，所述一条或多条计算机指令供所述处理组件调用执行。

所述处理组件用于：

第十方面，本申请实施例中提供了一种计算设备，包括存储组件以及处理组件；

所述处理组件用于：

其中，所述神经网络模型用以识别待处理图像。

第十一方面，本申请实施例中提供了一种计算设备，包括存储组件以及处理组件；

所述处理组件用于：

第十二方面，本申请实施例中提供了一种计算设备，包括存储组件以及处理组件；

所述处理组件用于：

构建至少一个特征层；

本申请实施例中，神经网络模型中插入了至少一个特征层，该特征层可以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层；也即通过该特征层隐含地利用了相邻同类像素点语义一致性高的性质，考虑了相邻像素点的相关性，引入了相邻像素点特征进行融合，达到产生语义一致且平滑的识别结果，因此提高了图像识别准确度。

本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请提供的一种模型构建方法一个实施例的方法流程图；

图2示出了本申请提供的一种特征提取方法一个实施例的方法流程图；

图3示出了本申请实施例在一个实际应用中的特征融合示意图；

图4示出了本申请提供的一种模型训练方法一个实施例的方法流程图；

图5示出了本申请提供的一种图像处理方法一个实施例的方法流程图；

图6示出了本申请提供的一种模型构建装置一个实施例的结构示意图；

图7示出了本申请提供的一种计算设备一个实施例的结构示意图；

图8示出了本申请提供的一种特征提取装置一个实施例的结构示意图；

图9示出了本申请提供的一种计算设备又一个实施例的结构示意图；

图10示出了本申请提供的一种模型训练装置一个实施例的结构示意图；

图11示出了本申请提供的一种计算设备又一个实施例的结构示意图；

图12示出了本申请提供的一种图像处理装置一个实施例的结构示意图；

图13示出了本申请提供的一种计算设备又一个实施例的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

在本申请的说明书和权利要求书及上述附图中的描述的一些流程中，包含了按照特定顺序出现的多个操作，但是应该清楚了解，这些操作可以不按照其在本文中出现的顺序来执行或并行执行，操作的序号如101、102等，仅仅是用于区分开各个不同的操作，序号本身不代表任何的执行顺序。另外，这些流程可以包括更多或更少的操作，并且这些操作可以按顺序执行或并行执行。需要说明的是，本文中的“第一”、“第二”等描述，是用于区分不同的消息、设备、模块等，不代表先后顺序，也不限定“第一”和“第二”是不同的类型。

本申请实施例的技术方案可以应用于任意涉及图像识别的应用场景中，如背景技术中所述，图像识别可以是指识别图像中的目标对象或者实现对图像中的目标对象的分割，如基于人体组成结构，进行人体分割等。而目前通常采用多层的神经网络模型进行图像识别，如卷积神经网络(Convolutional Neural Networks,CNN)模型。

神经网络模型通常由多层网络层构成，每一层网络层包括多个神经元(节点)，神经网络模型的多层网络层由输入层、输出层及位于输入层以及输出层之间的至少一个隐藏层构成，至少一个隐藏层可以对输入层输入的待处理图像进行逐级计算处理，以获得对待处理图像的深入表达，因此，隐藏层的输出为可以表征待处理图像的图像特征，不同隐藏层输出的图像特征不同，每一层隐藏层对于其前一层隐藏层的特征表示更深入，每一层隐藏层的图像特征通常是一个多维特征，可以表示为D*H*W结构，由于通过每一层隐藏层的计算处理，每一层隐藏层也会对应一个待处理图像的特征图，因此，H*W分别表示特征图的长与宽，D为图像特征的特征维度，可知特征图即包括H*W个像素点，每一层隐藏层的图像特征即由各个像素点的像素特征构成，每一个像素特征为一个D维特征，因此可以得到D*H*W结构的图像特征表示。

由于目前的神经网络模型进行图像识别时会出现不一致性问题，特别是进行图像中目标对象的分割时，由于目标对象是连续的，而采用神经网络模型进行识别往往会出现目标对象的分割边界不清晰、相邻部位(如头部和上身部位)没有紧密连接，使得出现弥散或色斑现象，从而影响图像识别的准确度。

发明人在实现本申请技术方案的过程中研究发现，基于神经网络模型进行图像识别，特别是进行图像分割时，是采用对每个像素点进行分类的方法实现，像素点之间的关系并不会显式地考虑进来，因此会造成不一致性问题。且不一致性问题往往出现的局部，因此，发明人想到，如果可以引入像素点的周边上下文信息，利用相邻同类像素点语义一致性高的性质，考虑像素点之间的相关性，是否即可以解决不一致性问题，据此，发明人提出了本申请的技术方案，在本申请实施例中，在神经网络模型中插入了至少一个特征层，该特征层可以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层；也即通过该特征层隐含地利用了相邻同类像素点语义一致性高的性质，考虑了相邻像素点的相关性，引入了相邻像素点特征进行融合，达到产生语义一致且平滑的识别结果，因此提高了图像识别准确度。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

图1为本申请实施例提供的一种模型构建方法一个实施例的流程图，该方法可以包括以下几个步骤：

101：构建输入层、输出层及位于所述输入层以及所述输出层之间的至少一个隐藏层。

102：构建至少一个特征层。

103：将所述至少一个特征层插入所述输入层以及所述输出层之间，获得用于进行图像识别的神经网络模型。

其中，所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入其连接的后一网络层。

其中，任意特征层可以具体连接在任意隐藏层之后。

神经网络模型中其它网络层的处理与现有技术相同，在此不再赘述。本实施例中，在神经网络模型中加入特征层，利用了相邻同类像素点语义一致性高的性质，引入了相邻像素点的特征进行融合，从而降低了由于现有技术中未考虑相邻像素点的相关性导致的不一致性问题，因此提高了图像识别准确度，特别是在图像分割时，可以产生语义一致且平滑的分割结果，可以保证分割边界清晰，相邻部位连接紧密。且本申请实施例的特征层，仅引入了局部信息，也未引入外部信息，不会造成计算量的大量增加，训练以及部署成本均较低。

此外，该神经网络模型中也可以插入其它引用层，其它引用层可以融合全图上下文信息或者姿势估计信息等，对于其它引用层的插入，不影响本申请实施例的特征层，本申请实施例包括插入特征层的神经网络模型，对于该神经网络模型中是否插入其它引用层，本申请并不此进行具体限制，可以理解的是，只要包含本申请实施例所述的特征层的神经网络模型均应在本申请实施例的保护范围内。

在实际应用中，可以利用卷积神经网络(CNN)模型进行图像识别，在具体需要进行图像分割时，可以利用全卷积神经网络(Fully Convolutional Networks，FCN)实现，因此作为又一个实施例，所述至少一个隐藏层包括至少一个卷积层；

所述将所述特征层插入所述输入层以及所述输出层之间，获得用于进行图像识别的神经网络模型可以包括：

将所述特征层插入所述至少一个隐藏层中获得用于进行图像识别的神经网络模型。

因此，任意特征层具体连接在任意卷积层之后。

在某些情况下，该至少一个隐藏从还可以包括至少一个池化层和/或至少一个全连接层，此时，任意特征层可以连接在任意卷积层或任意池化层之后。

当然，本申请实施例的神经网络模型还可以是指深度神经网络模型、循环神经网络模型等，本申请不对神经网络模型的类型进行具体限定。

下面从特征层进行特征提取的角度对本申请技术方案进行详细描述。图2为本申请实施例提供的一种特征提取方法一个实施例的流程图，本实施例从一个特征层的角度进行描述，该方法可以包括以下几个步骤：

201：接收神经网络模型中特征层连接的前一网络层输出的第一图像特征。

其中，所述第一图像特征包括多个像素点的第一像素特征。

该特征层位于神经网络模型的输入层以及输出层之间；具体地，所述神经网络模型可以包括输入层、输出层、至少一个隐藏层及位于任意隐藏层之后的特征层构成，具体结构描述可以参见图1所示实施例中所述。

其中，特征层连接的前一网络层可以是神经网络模型的任意隐藏层，第一图像特征与该任意隐藏层处理获得，隐藏层的处理方式与现有神经网络模型的处理方式相同，在此将不再赘述。当然，特征层连接的前一网络层也可以是一个特征层，第一图像特征的获得即为本实施例的特征提取方式相同。

202：根据任意像素点与其所在目标区域内的至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征。

其中，任意像素点所在目标区域内的至少一个像素点可以是指该任意像素点的4邻接、8邻接或者m邻接的像素点。

任意像素点所在目标区域内可以是指任意像素点的4邻域、8邻域或者m邻域等。

203：由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征。

其中，所述第二图像特征即用于输入与所述特征层连接的后一网络层。

其中，特征层连接的后一网络层可以是神经网络模型的任意隐藏层或者输出层等，该任意隐藏层或者输出层对该第二图像特征的处理与现有神经网络模型中相应网络层的处理方式相同，在此将不再赘述。

当然，特征层连接的后一网络层可以是一个特征层，其对第二图像特征的处理与本实施例中对第一图像特征的处理相同。

本实施例中，通过特征层提取的第二图像特征，融合了相邻像素点的像素特征，利用了相邻同类像素点语义一致性高的性质，从而降低了由于现有技术中未考虑相邻像素点的相关性导致的不一致性问题，因此提高了图像识别准确度，特别是在图像分割时，可以产生语义一致且平滑的分割结果，可以保证分割边界清晰，相邻部位连接紧密。

在某些实施例中，所述根据任意像素点与其所在目标区域内的至少一个像素点的相似程度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征可以包括：

计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度；

根据所述任意像素点与所述至少一个像素点的特征相似度，确定所述任意像素点与所述至少一个像素点的相似权重系数；

利用所述任意像素点与所述至少一个像素点的相似权重系数，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行加权求和，获得所述任意像素点的第二像素特征。

该相似权重系数可以表示与该任意像素点的相关性或相似程度。

可选地，该相似权重系数可以通过对特征相似度进行归一化处理获得，因此，在某些实施例中，所述根据所述任意像素点与所述至少一个像素点的特征相似度，确定所述任意像素点与所述至少一个像素点的相似权重系数可以包括：

将所述任意像素点与所述至少一个像素点的特征相似度进行归一化处理，获得所述任意像素点与所述至少一个像素点的相似权重系数。

其中，归一化处理可以通过特征层的sigmoid函数(一种激活函数)实现，该相似权重系数可以为大于0以及小于1的数值。

因此，通过相似权重系数，可以将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行加权求和，由于相似权重系数为小于0大于1的数值，也即求解任意像素点的第一像素特征与所述至少一个像素点的第一像素特征的加权平均值作为任意像素点的第二像素特征。

其中，该任意像素点自身的相似权重系数可以为1，认为任意像素点与自身完全相同。该至少一个像素点的相似权重系数可以通过对特征相似度进行归一化处理获得。

当然，该任意像素点自身的相似权重系数可以通过其与自身的特征相似度进行归一化处理获得。

因此，可选地，在某些实施例中，所述根据任意像素点与其所在目标区域内的至少一个像素点的相似程度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征可以包括：

计算任意像素点与自身以及其所在目标区域内的至少一个像素点的特征相似度；

根据所述任意像素点与自身的相似度以及与所述至少一个像素点的特征相似度，确定所述任意像素点与所述至少一个像素点的相似权重系数；

利用所述任意像素点与所述至少一个像素点的相似权重系数，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行加权融合，获得所述任意像素点的第二像素特征。

其中，作为一种可选实现方式，所述计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度可以是通过计算任意像素点的第一像素特征分别与至少一个像素点的像素特征的向量距离实现，该向量距离即可以作为特征相似度，该向量距离可以是指余弦距离、欧式距离等。

作为另一种可选实现方式，所述计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度可以包括：

利用预设卷积核对所述任意像素点所在目标区域进行卷积运算，将获得的至少一个卷积特征作为与其所在目标区域内的至少一个像素点的特征相似度。

也即通过卷积运算来获得任意像素点与其所在目标区域内的至少一个像素点的特征相似度。

该预设卷积核可以为1*1，像素特征为D维特征时，该预设卷积核即具体为1*1*D。

在某些实施例中，所述利用所述任意像素点与所述至少一个像素点的相似权重系数，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行加权求和也即利用相似权重系数，将任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行加权求和。

可以选地，可以采用如下融合公式计算任意像素点的第二像素特征：

其中，F_C(p)表示任意像素点p的第二像素特征；k表示任意像素点p所在目标区域内的至少一个像素点的个数，k+1即表示包括任意像素点以及至少一个像素点在内的像素点个数；A_p(k)表示k+1个像素点中的第i个像素点的相似权重系数，F_i(N_p(i))表示第i个像素点的第一像素特征。

为了方便理解，如图3所示，示出了融合处理的一种交互示意图，对于任意像素点p，其所在目标区域为其4邻域，至少一个像素点为其4邻接的四个像素点k1、k2、k3、k4为例，根据像素点p与像素点p、k1、k2、k3、k4的特征相似度，可以确定像素点p、k1、k2、k3、k4的相似权重系数，将像素点p、k1、k2、k3、k4的第一像素特征进行加权求和即可以得到像素点p的第二像素特征，由多个像素点的第二像素特征即构成第二图像特征。

本申请实施例提供的神经网络模型可以用于进行图像识别，根据不同图像识别应用，可以得到不同识别结果，例如对待处理图像中目标对象进行分割的应用中，识别结果即为待处理图像中各个像素点所属标签。神经网络模型使用之前需要进行训练，在对待处理图像中目标对象进行分割的应用中，样本图像的训练标签即包括各个像素点的训练标签。

如图4所示，为本申请实施例提供的一种模型训练方法一个实施例的流程图，该方法可以包括以下几个步骤：

401：将样本图像输入神经网络模型，获得实际识别结果。

其中，所述神经网络模型包括输入层、输出层、位于所述输入层以及所述输出层之间的至少一个隐藏层及至少一个特征层构成；所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层。

其中，神经网络模型中各个模型参数的初始值可以为随机数值。

402：根据所述实际识别结果与所述样本图像的期望识别结果，对所述神经网络模型进行参数优化。

其中，所述神经网络模型用以识别待处理图像。

其中，根据所述实际识别结果与所述样本图像的期望识别结果，对所述神经网络模型进行参数优化可以具体利用损失函数(loss function)实现，损失函数是用来估量模型的实际识别结果与期望识别结果的不一致程度，通常是一个非负实值函数。

可选地，该损失函数可以具体为交叉熵(Cross Entropy)loss。

对神经网络模型进行参数优化，可以获得神经网络模型中各个模型参数的调整系数，利用各个模型参数的调整系数对各个模型参数进行数值调整，即可以得到神经网络模型的模型参数。

利用损失函数进行参数优化的方式与现有技术相同，在此不再进行过多赘述。

在一个实际应用中，该神经网络模型用以对待处理图像进行分割时，该期望识别结果即可以是指样本图像中各个像素点的训练标签，各个像素点的训练标签用以表明各个像素点的内容类型，如进行人体分割，该训练标签可以包括头部、上装部位、下装部位、手部、脚部、胳膊、腿部以及图像背景等等。进行模型训练的训练样本与现有技术相同，不同之处主要在于本申请实施例提供的神经网络模型加入了至少一个特征层，使得对训练样本的处理过程不同。

此外，由于神经网络模型中插入了至少一个特征层，也可以对该至少一个特征层进行相关性训练。

因此，在某些实施例中，所述方法还可以包括：

基于所述样本图像，确定任意特征层的前一网络层输出的第一样本特征；

利用所述特征层，计算所述第一样本特征中任意像素点与其所在目标区域的至少一个像素点的实际特征相似度；

根据所述第一样本特征中任意像素点与所述至少一个像素点的实际特征相似度及期望特征相似度，对所述特征层进行参数优化，获得所述特征层的模型参数对应的第一调整系数；

所述根据所述实际识别结果与所述样本图像的期望识别结果，对所述神经网络模型进行参数优化包括：

根据所述实际识别结果与所述样本图像的期望识别结果，对所述神经网络模型进行参数优化，获得所述神经网络模型中各个模型参数对应的候选调整系数；

将所述特征层对应的候选调整系数以及所述第一候选调整系数进行加权处理，获得所述特征层对应的调整系数；

利用所述特征层的调整系数对所述特征层的模型参数进行数值调整。

而对于神经网络模型中的非特征层的其它网络层，按照各自对应的候选调整系数调整各自对应的模型参数的参数数值。

其中，任意像素点与其所在目标区域的至少一个像素点的期望特征相似度可以根据任意像素点与所述至少一个像素点是否属于同一内容类型进行预先设定。

其中，对特征层进行参数优化可以采用损失函数实现，该损失函数可以具体为交叉熵loss等。

可选地，可以具体是将所述特征层对应的候选调整系数以及所述第一候选调整系数进行加权处理，其中，特征层对应的候选调整系数的权重系数以及第一调整系数的权重系数，可以结合实际应用情况进行设定，比如均为0.5时，候选调整系数为增加3，第一调整系数为减去1，则特征层的调整系数即可以为3*0.5+(-1)*0.5，将调整系数叠加到特征层的模型参数的当前参数值中，即可以实现数值调整。

此外，在某些实施例中，所述方法还可以包括：

利用所述特征层，计算所述第一样本特征中任意像素点以及其所在目标区域的至少一个像素点的实际相似权重系数；

根据所述第一样本特征中任意像素点以及所述至少一个像素点的实际相似权重系数及期望相似权重系数，对所述特征层进行参数优化，获得所述特征层的模型参数对应的第二调整系数；

根据所述实际识别结果与所述样本图像的期望识别结果，对所述神经网络模型进行参数优化，获得所述神经网络模型中各个模型参数的候选调整系数；

将所述特征层对应的候选调整系数以及所述第二调整系数进行加权处理，获得所述特征层对应的调整系数；

其中，任意像素点与其所在目标区域的至少一个像素点的期望相似权重系数可以根据任意像素点与所述至少一个像素点是否属于同一内容类型进行预先计算获得。

其中，对特征层进行参数优化可以采用损失函数实现，该损失函数可以具体交叉熵loss等。

可选地，可以具体是将所述特征层对应的候选调整系数以及所述第二候选调整系数进行加权处理，其中，特征层对应的候选调整系数的权重系数以及第二调整系数的权重系数，可以结合实际应用情况进行设定。

基于训练好的神经网络模型即可以进行图像处理，如图5所示，为本申请实施例提供的一种图像处理方法一个实施例的流程图，该方法可以包括以下几个步骤：

501：确定神经网络模型。

其中，所述神经网络模型包括输入层、输出层、位于所述输入层以及所述输出层之间的至少一个隐藏层及至少一个特征层构成；所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层；

502：将待处理图像输入所述神经网络模型，获得所述待处理图像的目标识别结果。

在一个实际应用中，该神经网络模型用以对待处理图像进行分割时，该目标识别结果即可以是指待处理图像中各个像素点所属的标签，各个像素点的所属标签用以表明各个像素点的内容类型，

如进行人体分割，其所属标签可以包括头部、上装部位、下装部位、手部、脚部、胳膊、腿部以及图像背景等等。

图6为本申请提供的一种模型构建装置一个实施例的结构示意图，该装置可以包括：

第一构建模块601，构建输入层、输出层及位于所述输入层以及所述输出层之间的至少一个隐藏层；

第二构建模块601，用于构建至少一个特征层；

模型构建模块603，用于将所述至少一个特征层插入所述输入层以及所述输出层之间，获得用于进行图像识别的神经网络模型；

在某些实施例中，所述至少一个隐藏层可以包括至少一个卷积层；

所述模型构建模型具体用于将所述特征层插入所述至少一个隐藏层中，获得用于进行图像识别的神经网络模型；其中任意特征层连接在任意卷积层之后。

图6所述的模型构建装置可以执行图1所示实施例所述的模型构建方法，其实现原理和技术效果不再赘述。对于上述实施例中的模型构建装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

在一个可能的设计中，图6所示实施例的模型构建装置可以实现为计算设备，如图7所示，该计算设备可以包括存储组件701以及处理组件702；

所述存储组件701存储一条或多条计算机指令，其中，所述一条或多条计算机指令供所述处理组件调用执行。

所述处理组件702用于：

构建至少一个特征层；

其中，处理组件702可以包括一个或多个处理器来执行计算机指令，以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

存储组件701被配置为存储各种类型的数据以支持在计算设备的操作。存储组件可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

当然，计算设备必然还可以包括其他部件，例如输入/输出接口、通信组件等。

输入/输出接口为处理组件和外围接口模块之间提供接口，上述外围接口模块可以是输出设备、输入设备等。

通信组件被配置为便于计算设备和其他设备之间有线或无线方式的通信等。

本申请实施例还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被计算机执行时可以实现上述图1所示实施例的模型构建方法。

图8为本申请实施例提供的一种特征提取装置一个实施例的结构示意图，该装置可以包括：

接收模块801，用于接收神经网络模型中特征层连接的前一网络层输出的第一图像特征；其中，所述第一图像特征包括多个像素点的第一像素特征；所述特征层位于神经网络模型的输入层以及输出层之间；

特征融合模块802，用于根据任意像素点与其所在目标区域内的至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征；

特征构成模块803，用于由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征；其中，所述第二图像特征用于输入与所述特征层连接的后一网络层。

在某些实施例中，所述特征融合模块具体用于计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度；根据所述任意像素点与所述至少一个像素点的特征相似度，确定所述任意像素点与所述至少一个像素点的相似权重系数；利用所述任意像素点与所述至少一个像素点的相似权重系数，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行加权求和，获得所述任意像素点的第二像素特征。

在某些实施例中，所述特征融合模块计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度可以是利用预设卷积核对所述任意像素点所在目标区域进行卷积运算，将获得的至少一个卷积特征作为与其所在目标区域内的至少一个像素点的特征相似度。

在某些实施例中，所述特征融合模块根据所述任意像素点与所述至少一个像素点的特征相似度，确定所述任意像素点与所述至少一个像素点的相似权重系数具体是将所述任意像素点与所述至少一个像素点的特征相似度进行归一化处理，获得所述任意像素点与所述至少一个像素点的相似权重系数。

在某些实施例中，所述至少一个隐藏层包括至少一个卷积层；所述特征层插入所述至少一个隐藏层中，具体位于任意卷积层之后。

图8所述的模型构建装置可以执行图2所示实施例所述的特征提取方法，其实现原理和技术效果不再赘述。对于上述实施例中的模型构建装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

在一个可能的设计中，图8所示实施例的模型构建装置可以实现为计算设备，如图9所示，该计算设备可以包括存储组件901以及处理组件902；

所述存储组件901存储一条或多条计算机指令，其中，所述一条或多条计算机指令供所述处理组件调用执行。

所述处理组件902用于：

由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征；其中，所述第二图像特征用于输入与所述特征层连接的后一网络层。

其中，处理组件902可以包括一个或多个处理器来执行计算机指令，以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

存储组件901被配置为存储各种类型的数据以支持在计算设备的操作。存储组件可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

本申请实施例还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被计算机执行时可以实现上述图2所示实施例的特征提取方法。

图10为本申请提供的一种模型训练装置一个实施例的结构示意图，该装置可以包括：

训练识别模块1001，用于将样本图像输入神经网络模型，获得实际识别结果；其中，所述神经网络模型包括输入层、输出层、位于所述输入层以及所述输出层之间的至少一个隐藏层及至少一个特征层构成；所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层；

训练优化模块1002，用于根据所述实际识别结果与所述样本图像的期望识别结果，对所述神经网络模型进行参数优化；

其中，所述神经网络模型用以识别待处理图像。

在某些实施例中，该装置还包括：

第一参数优化模块，用于基于所述样本图像，确定任意特征层的前一网络层输出的第一样本特征；利用所述特征层，计算所述第一样本特征中任意像素点与其所在目标区域的至少一个像素点的实际特征相似度；根据所述第一样本特征中任意像素点与所述至少一个像素点的实际特征相似度及期望特征相似度，对所述特征层进行参数优化，获得所述特征层的模型参数对应的第一调整系数；

所述训练优化模块具体根据所述实际识别结果与所述样本图像的期望识别结果，对所述神经网络模型进行参数优化，获得所述神经网络模型中各个模型参数对应的候选调整系数；将所述特征层对应的候选调整系数以及所述第一候选调整系数进行加权处理，获得所述特征层对应的调整系数；利用所述特征层的调整系数对所述特征层的模型参数进行数值调整。

在某些实施例中，该装置还包括：

第二参数优化模块，用于基于所述样本图像，确定任意特征层的前一网络层输出的第一样本特征；利用所述特征层，计算所述第一样本特征中任意像素点以及其所在目标区域的至少一个像素点的实际相似权重系数；根据所述第一样本特征中任意像素点以及所述至少一个像素点的实际相似权重系数及期望相似权重系数，对所述特征层进行参数优化，获得所述特征层的模型参数对应的第二调整系数；

所述训练优化模块具体用于根据所述实际识别结果与所述样本图像的期望识别结果，对所述神经网络模型进行参数优化，获得所述神经网络模型中各个模型参数的候选调整系数；将所述特征层对应的候选调整系数以及所述第二调整系数进行加权处理，获得所述特征层对应的调整系数；利用所述特征层的调整系数对所述特征层的模型参数进行数值调整。

图10所述的模型训练装置可以执行图4所示实施例所述的模型训练方法，其实现原理和技术效果不再赘述。对于上述实施例中的模型训练装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

在一个可能的设计中，图10所示实施例的模型训练装置可以实现为计算设备，如图11所示，该计算设备可以包括存储组件1101以及处理组件1102；

所述存储组件1101存储一条或多条计算机指令，其中，所述一条或多条计算机指令供所述处理组件调用执行。

所述处理组件1102用于：

其中，所述神经网络模型用以识别待处理图像。

其中，处理组件1102可以包括一个或多个处理器来执行计算机指令，以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

存储组件1101被配置为存储各种类型的数据以支持在计算设备的操作。存储组件可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

本申请实施例还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被计算机执行时可以实现上述图4所示实施例的模型训练方法。

图12为本申请提供的一种图像处理装置一个实施例的结构示意图，该装置可以包括：

模型确定模块1201，用于确定神经网络模型；其中，所述神经网络模型包括输入层、输出层、位于所述输入层以及所述输出层之间的至少一个隐藏层及至少一个特征层构成；所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由所述多个像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层；

图像处理模块1202，用于将待处理图像输入所述神经网络模型，获得所述待处理图像的目标识别结果。

在某些实施例中，所述目标识别结果包括所述待处理图像中各个像素点所属的标签。

图12所述的模型训练装置可以执行图3所示实施例所述的图像处理方法，其实现原理和技术效果不再赘述。对于上述实施例中的模型训练装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

在一个可能的设计中，图12所示实施例的图像处理装置可以实现为计算设备，如图13所示，该计算设备可以包括存储组件1301以及处理组件1302；

所述存储组件1301存储一条或多条计算机指令，其中，所述一条或多条计算机指令供所述处理组件调用执行。

所述处理组件1302用于：

其中，处理组件1302可以包括一个或多个处理器来执行计算机指令，以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

存储组件1301被配置为存储各种类型的数据以支持在计算设备的操作。存储组件可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

本申请实施例还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被计算机执行时可以实现上述图5所示实施例的图像处理方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种图像特征提取方法，其特征在于，包括：

由多个任意像素点的第二像素特征构成所述特征层输出的第二图像特征；其中，所述第二图像特征用于输入所述特征层连接的后一网络层；

所述神经网络模型按照如下方式进行训练：

将样本图像输入所述神经网络模型，获得实际识别结果；其中，所述神经网络模型包括输入层、输出层、位于所述输入层以及所述输出层之间的至少一个隐藏层及至少一个特征层构成；

根据所述实际识别结果与所述样本图像的期望识别结果，对所述神经网络模型进行参数优化，获得所述神经网络模型中各个模型参数对应的候选调整系数；所述各个模型参数对应的候选调整系数包括所述特征层的模型参数对应的候选调整系数；

所述特征层的模型参数按照如下方式调整获得；

将所述特征层对应的第一调整系数以及所述特征层对应的候选调整系数进行加权处理，获得所述特征层对应的调整系数；

利用所述特征层的调整系数对所述特征层的模型参数进行数值调整；

或者，所述特征层的模型参数按照如下方式调整获得：

将所述特征层对应的第二调整系数以及所述特征层对应的候选调整系数进行加权处理，获得所述特征层对应的调整系数；

2.根据权利要求1所述的方法，其特征在于，所述根据任意像素点与其所在目标区域内的至少一个像素点的相似程度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征包括：

3.根据权利要求2所述的方法，其特征在于，所述计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度包括：

4.根据权利要求2所述的方法，其特征在于，所述根据所述任意像素点与所述至少一个像素点的特征相似度，确定所述任意像素点与所述至少一个像素点的相似权重系数包括：

5.一种图像识别神经网络模型训练方法，其特征在于，包括：

将样本图像输入神经网络模型，获得实际识别结果；其中，所述神经网络模型包括输入层、输出层、位于所述输入层以及所述输出层之间的至少一个隐藏层及至少一个特征层构成；所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由多个任意像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层；

其中，所述神经网络模型用以识别待处理图像。

6.一种图像识别神经网络模型训练方法，其特征在于，包括：

其中，所述神经网络模型用以识别待处理图像。

7.一种图像处理方法，其特征在于，包括：

确定神经网络模型；其中，所述神经网络模型包括输入层、输出层、位于所述输入层以及所述输出层之间的至少一个隐藏层及至少一个特征层构成；所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由多个任意像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层；

将待处理图像输入所述神经网络模型，获得所述待处理图像的目标识别结果；

所述神经网络模型按照如下方式进行训练：

将样本图像输入所述神经网络模型，获得实际识别结果；

所述特征层的模型参数按照如下方式调整获得；

或者，所述特征层的模型参数按照如下方式调整获得：

8.根据权利要求7所述的方法，其特征在于，所述目标识别结果包括所述待处理图像中各个像素点所属的标签。

9.一种图像识别神经网络模型构建方法，其特征在于，包括：

构建至少一个特征层；

其中，所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由多个任意像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与其连接的后一网络层；

所述神经网络模型按照如下方式进行训练：

将样本图像输入所述神经网络模型，获得实际识别结果；

所述特征层的模型参数按照如下方式调整获得；

或者，所述特征层的模型参数按照如下方式调整获得：

10.根据权利要求9所述的方法，其特征在于，所述至少一个隐藏层包括至少一个卷积层；

所述将所述特征层插入所述输入层以及所述输出层之间，获得用于进行图像识别的神经网络模型包括：

将所述特征层插入所述至少一个隐藏层中，获得用于进行图像识别的神经网络模型；其中，任意特征层连接在任意卷积层之后。

11.一种图像特征提取装置，其特征在于，包括：

特征构成模块，用于由多个任意像素点的第二像素特征构成所述特征层输出的第二图像特征；其中，所述第二图像特征用于输入所述特征层连接的后一网络层；

所述神经网络模型按照如下方式进行训练：

所述特征层的模型参数按照如下方式调整获得；

或者，所述特征层的模型参数按照如下方式调整获得：

12.一种图像识别神经网络模型训练装置，其特征在于，包括：

训练识别模块，用于将样本图像输入神经网络模型，获得实际识别结果；其中，所述神经网络模型包括输入层、输出层、位于所述输入层以及所述输出层之间的至少一个隐藏层及至少一个特征层构成；所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由多个任意像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层；

训练优化模块，用于根据所述实际识别结果与所述样本图像的期望识别结果，对所述神经网络模型进行参数优化，获得所述神经网络模型的模型训练参数以及所述神经网络模型中各个模型参数对应的候选调整系数；所述各个模型参数对应的候选调整系数包括所述特征层的模型参数对应的候选调整系数；基于所述样本图像，确定任意特征层的前一网络层输出的第一样本特征；利用所述特征层，计算所述第一样本特征中任意像素点与其所在目标区域的至少一个像素点的实际特征相似度；根据所述第一样本特征中任意像素点与所述至少一个像素点的实际特征相似度及期望特征相似度，对所述特征层进行参数优化，获得所述特征层的模型参数对应的第一调整系数；将所述特征层对应的第一调整系数以及所述特征层对应的候选调整系数进行加权处理，获得所述特征层对应的调整系数；利用所述特征层的调整系数对所述特征层的模型参数进行数值调整；

其中，所述神经网络模型用以识别待处理图像。

13.一种图像识别神经网络模型训练装置，其特征在于，包括：

训练优化模块，用于根据所述实际识别结果与所述样本图像的期望识别结果，对所述神经网络模型进行参数优化，获得所述神经网络模型的模型训练参数以及所述神经网络模型中各个模型参数对应的候选调整系数；所述各个模型参数对应的候选调整系数包括所述特征层的模型参数对应的候选调整系数；基于所述样本图像，确定任意特征层的前一网络层输出的第一样本特征；利用所述特征层，计算所述第一样本特征中任意像素点以及其所在目标区域的至少一个像素点的实际相似权重系数；根据所述第一样本特征中任意像素点以及所述至少一个像素点的实际相似权重系数及期望相似权重系数，对所述特征层进行参数优化，获得所述特征层的模型参数对应的第二调整系数；将所述特征层对应的第二调整系数以及所述特征层对应的候选调整系数进行加权处理，获得所述特征层对应的调整系数；利用所述特征层的调整系数对所述特征层的模型参数进行数值调整；

其中，所述神经网络模型用以识别待处理图像。

14.一种图像处理装置，其特征在于，包括：

模型确定模块，用于确定神经网络模型；其中，所述神经网络模型包括输入层、输出层、位于所述输入层以及所述输出层之间的至少一个隐藏层及至少一个特征层构成；所述特征层用以根据其连接的前一网络层输出的第一图像特征，计算任意像素点与其所在目标区域内的至少一个像素点的特征相似度，并根据所述任意像素点与所述至少一个像素点的特征相似度，将所述任意像素点的第一像素特征与所述至少一个像素点的第一像素特征进行融合，获得所述任意像素点的第二像素特征，并由多个任意像素点的第二像素特征构成所述特征层输出的第二图像特征，以及将所述第二图像特征输入与所述特征层连接的后一网络层；

图像处理模块，用于将待处理图像输入所述神经网络模型，获得所述待处理图像的目标识别结果；

所述神经网络模型按照如下方式进行训练：

将样本图像输入所述神经网络模型，获得实际识别结果；

所述特征层的模型参数按照如下方式调整获得；

或者，所述特征层的模型参数按照如下方式调整获得：

15.一种图像识别神经网络模型构建装置，其特征在于，包括：

第二构建模块，用于构建至少一个特征层；

所述神经网络模型按照如下方式进行训练：

将样本图像输入所述神经网络模型，获得实际识别结果；

所述特征层的模型参数按照如下方式调整获得；

或者，所述特征层的模型参数按照如下方式调整获得：