WO2019076188A1

WO2019076188A1 - 一种图像目标识别方法、装置及计算机设备

Info

Publication number: WO2019076188A1
Application number: PCT/CN2018/108301
Authority: WO
Inventors: 程战战; 钮毅; 罗兵华
Original assignee: 杭州海康威视数字技术股份有限公司
Priority date: 2017-10-18
Filing date: 2018-09-28
Publication date: 2019-04-25
Also published as: US11347977B2; US20200334504A1; CN109685058B; EP3699818A4; CN109685058A; EP3699818A1

Abstract

本申请实施例提供了一种图像目标识别方法、装置及计算机设备，其中，图像目标识别方法包括：分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到图像的横向特征序列和纵向特征序列；将横向特征序列及纵向特征序列进行融合，得到融合特征；利用预设激活函数，对融合特征进行激活，得到图像特征；通过对图像特征进行解码，识别图像中的目标。通过本方案可以提高目标识别的效率。

Description

一种图像目标识别方法、装置及计算机设备

本申请要求于2017年10月18日提交中国专利局、申请号为201710969721.7发明名称为“一种图像目标识别方法、装置及计算机设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及机器视觉技术领域，特别涉及一种图像目标识别方法、装置及计算机设备。

背景技术

图像目标识别主要是指在给定的图像上定位识别出预先指定的目标。在图像处理领域，主要通过如下三种方法进行目标识别：模板匹配法、特征点匹配法和深度学习的方法。但是，在实际目标识别场景中，存在很多倾斜、旋转、弯曲的目标，上述三种方法均是基于预先指定的目标的特征信息进行目标识别，该指定的目标的特征信息往往限定为具有固定姿态的目标的特征信息，如果图像中的目标发生倾斜或者变形，利用上述三种方法则无法识别出准确的目标。

针对上述问题，相应的提出了能识别多角度目标的图像检测方法，在进行目标识别之前，利用角度辨识器判断图像的角度，基于该角度，利用目标分类器生成装置生成针对该角度的目标分类器，使用目标分类器从图像中识别指定的目标。

但是，如果一个图像中有多个目标的角度发生倾斜，则需要分别针对每个倾斜角度生成目标分类器，并且，需要对每个目标的角度预先进行判断，如果串行运行会导致运行速率较慢，如果并行运行则需要处理器具有高效的处理能力，因此，上述方法的目标识别的效率较低。

发明内容

本申请实施例的目的在于提供一种图像目标识别方法、装置及计算机设备，以提高目标识别的效率。具体技术方案如下：

第一方面，本申请实施例提供了一种图像目标识别方法，所述方法包括：

分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列；

将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征；

利用预设激活函数，对所述融合特征进行激活，得到图像特征；

通过对所述图像特征进行解码，识别所述图像中的目标。

可选的，所述分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列，包括：

沿图像的水平视角方向进行卷积操作，得到第一卷积结果；将所述第一卷积结果确定为横向特征序列；

沿所述图像的垂直视角方向进行卷积操作，得到第二卷积结果；将所述第二卷积结果确定为纵向特征序列。

可选的，在所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征之前，所述方法还包括：

基于所述横向特征序列及所述纵向特征序列，对所述图像进行卷积操作，提取用于表示所述横向特征序列及所述纵向特征序列分别在图像形变中所占权值的形变参数；

所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征，包括：

根据所述形变参数，以加权和的方式，将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征。

沿图像的水平视角方向进行卷积操作，得到第一卷积结果；

将所述第一卷积结果中的行向量进行反向排列，得到第一反向序列；

将所述第一卷积结果及所述第一反向序列确定为横向特征序列；

沿所述图像的垂直视角方向进行卷积操作，得到第二卷积结果；

将所述第二卷积结果中的列向量进行反向排列，得到第二反向序列；

将所述第二卷积结果及所述第二反向序列确定为纵向特征序列。

基于所述横向特征序列中的第一卷积结果、第一反向序列，以及所述纵向特征序列中的第二卷积结果、第二反向序列，对所述图像进行卷积操作，提取用于表示所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列分别在图像形变中所占权值的形变参数；

根据所述形变参数，以加权和的方式，将所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列进行融合，得到融合特征。

可选的，所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征，包括：

以拼接融合的方式，将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征。

第二方面，本申请实施例提供了一种图像目标识别装置，所述装置包括：

特征提取模块，用于分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列；

融合模块，用于将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征；

激活模块，用于利用预设激活函数，对所述融合特征进行激活，得到图像特征；

解码模块，用于通过对所述图像特征进行解码，识别所述图像中的目标。

可选的，所述特征提取模块，具体用于：

可选的，所述装置还包括：

第一形变参数提取模块，用于基于所述横向特征序列及所述纵向特征序列，对所述图像进行卷积操作，提取用于表示所述横向特征序列及所述纵向特征序列分别在图像形变中所占权值的形变参数；

所述融合模块，具体用于：

可选的，所述特征提取模块，具体用于：

沿图像的水平视角方向进行卷积操作，得到第一卷积结果；

可选的，所述装置还包括：

第二形变参数提取模块，用于基于所述横向特征序列中的第一卷积结果、第一反向序列，以及所述纵向特征序列中的第二卷积结果、第二反向序列，对所述图像进行卷积操作，提取用于表示所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列分别在图像形变中所占权值的形变参数；

所述融合模块，具体用于：

可选的，所述融合模块，具体用于：

第三方面，本申请实施例提供了一种计算机设备，包括处理器和存储器，其中，

所述存储器，用于存放计算机程序；

所述处理器，用于执行所述存储器上所存放的计算机程序时，实现如第一方面所述的方法步骤。

综上可见，本申请实施例提供的方案中，基于沿图像的水平视角方向和垂直视角方向分别进行特征提取，能够得到图像的横向特征序列和纵向特征序列，然后将横向特征序列和纵向特征序列进行融合，得到融合特征，最后，通过对融合特征进行激活后得到的图像特征进行解码，识别图像中的目标。针对发生倾斜的目标，目标在不同视角方向上的分量不同，因此，通过沿不同视角进行特征提取，然后经过特征融合的方式，得到目标在各视角下的完整的特征信息，再利用预设激活函数，将融合特征进行激活，得到能够与模板匹配的图像特征，最后通过解码即可识别目标，此方法无需提前对发生倾斜的目标进行角度判断，也就不需要针对不同角度的目标生成各种目标分类器，简化了目标识别的实现步骤，在保证目标识别的准确率的基础上，提高了目标识别的效率。

附图说明

为了更清楚地说明本申请实施例和现有技术的技术方案，下面对实施例和现有技术中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为现实的目标识别场景中目标发生倾斜的示意图；

图2为本申请实施例的图像目标识别方法的一种流程示意图；

图3a为本申请实施例的图像横向卷积示意图；

图3b为本申请实施例的图像纵向卷积示意图；

图4为本申请实施例的图像目标识别方法的另一种流程示意图；

图5为本申请实施例的目标识别示例图；

图6为本申请实施例的图像目标识别装置的一种结构示意图；

图7为本申请实施例的图像目标识别装置的另一种结构示意图；

图8为本申请实施例的图像目标识别装置的再一种结构示意图；

图9为本申请实施例的计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案、及优点更加清楚明白，以下参照附图并举实施例，对本申请进一步详细说明。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

下面通过具体实施例，对本申请进行详细的说明。

在现实的目标识别场景中，存在很多倾斜、旋转、透视及弯曲的目标，例如倒置的文字等，如图1所示。传统的目标识别方法受限于模板的固定，无法准确识别出发生倾斜、旋转、透视或者弯曲的目标。因此，为了能够准确识别出上述目标，并且提高目标识别的效率，本申请实施例提供了一种图像目标识别方法、装置及计算机设备。下面，首先对本申请实施例所提供的图像目标识别方法进行介绍。

本申请实施例所提供的一种图像目标识别方法的执行主体可以为具有图像识别功能的计算机设备，也可以为具有图像识别功能的摄像机，执行主体中至少包括具有数据处理能力的核心处理芯片。实现本申请实施例所提供的一种图像目标识别方法的方式可以为设置于执行主体中的软件、硬件电路和逻辑电路的至少一种方式。

如图2所示，为本申请实施例所提供的一种图像目标识别方法，该图像目标识别方法可以包括如下步骤。

S201，分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到图像的横向特征序列和纵向特征序列。

对于一图像，可以沿两个视角方向分别进行特征提取，即分别沿图像的水平视角方向和垂直视角方向进行特征提取。沿图像的水平视角方向进行特征提取的方式，可以是沿图像的水平视角方向进行卷积操作，称之为横向卷积，如图3a所示；沿图像的垂直视角方向进行特征提取的方式，可以是沿图像的垂直视角方向进行卷积操作，称之为纵向卷积，如图3b所示。当然，特征提取的方式还可以为其他特征提取的方式，可以提取到沿图像的水平视角方向的特征以及沿图像的垂直视角方向的特征即可，这里不再一一赘述。

为了能够进一步提高处理效率，沿两个视角方向分别进行特征提取可以是并行执行的。通过特征提取，相应地可以得到图像的横向特征序列和纵向特征序列。其中，横向特征序列为列数等效为1的特征序列，纵向特征序列为行数等效为1的特征序列，在这里，列数或者行数等效为1，并不表示列数或者行数一定等于1，仅表示可以作为一个整体的数据进行处理。

S202，将横向特征序列及纵向特征序列进行融合，得到融合特征。

由于横向特征序列及纵向特征序列是图像在不同视角下的特征集合，对图像中的目标进行识别，需要图像完整的特征信息，因此，需要对横向特征序列及纵向特征序列进行融合，得到的融合特征具有图像完整的特征信息。特征融合可以是通过拼接融合Concat的方式，将横向特征序列和纵向特征序列直接拼接到一起，得到融合特征；也可以是通过特征点叠加Eltwise Add的方式，将对应的特征值相加，得到融合特征；还可以是基于用于表示横向特征序列和纵向特征序列的形变程度的权值，通过加权和的方式，得到融合特征。当然这三种特征融合的方式只是举例说明，特征融合的方式不仅限于此，其他特征融合的方式均属于本申请实施例的保护范围，这里不再一一赘述。

S203，利用预设激活函数，对融合特征进行激活，得到图像特征。

通过融合得到的融合特征可以体现图像完整的特征信息，但是，同一个目标的特征往往较为分散，需要将融合特征通过预设激活函数把各目标的特征保留并映射出来，得到图像特征，所得到的图像特征可以与模板匹配。其中，预设激活函数可以为非线性激活函数中的双曲线tanh函数、S型生长曲线Sigmoid函数、修正线性单元ReLU函数等，也可以为其他类别的激活函数，这里不再一一列举。

S204，通过对图像特征进行解码，识别图像中的目标。

在通过激活得到图像特征后，可以通过后接解码器，对图像特征进行解码，针对不同的目标可以采用不同的解码器，例如，需要识别的指定目标为文字，则可以选择Attention解码器。当然，也可以选择常规的目标分类器，通过置信度对目标的类别进行识别。

应用本实施例，基于沿图像的水平视角方向和垂直视角方向分别进行特征提取，能够得到图像的横向特征序列和纵向特征序列，然后将横向特征序列和纵向特征序列进行融合，得到融合特征，最后，通过对融合特征进行激活后得到的图像特征进行解码，识别图像中的目标。针对发生倾斜的目标，目标在不同视角方向上的分量不同，因此，通过沿不同视角进行特征提取，然后经过特征融合的方式，得到目标在各视角下的完整的特征信息，再利用预设激活函数，将融合特征进行激活，得到能够与模板匹配的图像特征，最后通过解码即可识别目标，此方法无需提前对发生倾斜的目标进行角度判断，也就不需要针对不同角度的目标生成各种目标分类器，简化了目标识别的实现步骤，在保证目标识别的准确率的基础上，提高了目标识别的效率。

基于图2所示实施例，本申请实施例还提供了另一种图像目标识别方法，如图4所示，该图像目标识别方法包括如下步骤。

S401，分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到图像的横向特征序列和纵向特征序列。

本实施例中，为了提高特征提取的效率，采用卷积运算，沿图像的水平视角方向进行卷积操作，得到第一卷积结果，并将第一卷积结果确定为横向特征序列；沿图像的垂直视角方向进行卷积操作，得到第二卷积结果，并将第二卷积结果确定为纵向特征序列。也就是说，横向特征序列中仅包含对图像的行向量进行卷积操作得到的卷积结果，纵向特征序列中仅包括对图像的列向量进行卷积操作得到的卷积结果。

S402，基于横向特征序列及纵向特征序列，对图像进行卷积操作，提取用于表示横向特征序列及纵向特征序列分别在图像形变中所占权值的形变参数。

针对得到的横向特征序列和纵向特征序列，特征序列的长度、参数等属性，说明了该视角方向的特征所占比重，即该视角方向的特征序列在图像形变中所占权值，通过对图像进行横纵卷积操作，可以提取到各视角方向对应的权值。

S403，根据形变参数，以加权和的方式，将横向特征序列及纵向特征序列进行融合，得到融合特征。

在得到形变参数之后，形变参数表示了各视角方向的特征序列在图像形变中所占比重，则可以通过加权和的方式，将不同视角方向对应的特征序列进行融合，融合后得到的融合特征可以反映各视角方向的形变程度。例如，通过特征提取，得到的横向特征序列为v、纵向特征序列为h，通过卷积操作得到的形变参数为(0.6,0.4)，则融合特征中每个特征值为0.6×v _ij+0.4×h _ij。

S404，利用预设激活函数，对融合特征进行激活，得到图像特征。

S405，通过对图像特征进行解码，识别图像中的目标。

本实施例中S404、S405与图2所示实施例中的S203、S204相同，这里不再赘述。

应用本实施例，基于沿图像的水平视角方向和垂直视角方向分别进行特征提取，能够得到图像的横向特征序列和纵向特征序列，然后将横向特征序列和纵向特征序列进行融合，得到融合特征，最后，通过对融合特征进行激活后得到的图像特征进行解码，识别图像中的目标。针对发生倾斜的目标，目标在不同视角方向上的分量不同，因此，通过沿不同视角进行特征提取，然后经过特征融合的方式，得到目标在各视角下的完整的特征信息，再利用预设激活函数，将融合特征进行激活，得到能够与模板匹配的图像特征，最后通过解码即可识别目标，此方法无需提前对发生倾斜的目标进行角度判断，也就不需要针对不同角度的目标生成各种目标分类器，简化了目标识别的实现步骤，在保证目标识别的准确率的基础上，提高了目标识别的效率。并且，通过对横向特征序列和纵向特征序列进行卷积操作，得到用于表示横向特征序列及纵向特征序列分别在图像形变中所占权值的形变参数，通过加权和的方式进行特征融合，使得融合特征可以更真实的反映目标在不同视角方向的形变程度，可以进一步提高目标识别的准确性。

为了保证目标识别的高准确性，本申请实施例还可以在沿图像水平视角方向对图像的行向量进行卷积操作得到第一卷积结果之后，再将第一卷积结果中的行向量进行反向排列得到第一反向序列，在沿图像垂直视角方向对图像的列向量进行卷积操作得到第二卷积结果之后，再将第二卷积结果中的列向量进行反向排列得到第二反向序列。将第一卷积结果和第一反向序列确定为横向特征序列、将第二卷积结果和第二反向序列确定为纵向特征序列。横向特征序列和纵向特征序列中，通过卷积结果的正向排列和反向排列，可以更为直观的表示目标的倾斜情况。下面，结合具体实例，对该实施例进行介绍。

如图5所示，为本申请实施例的目标识别示例图。

第一步，沿图像的水平视角方向，对图像的行向量进行横向卷积，得到第一卷积结果，如图5中所示，第一卷积结果为

将第一卷积结果中的行向量进行反向排列，得到第一反向序列

将第一卷积结果及第一反向序列确定为横向特征序列。

第二步，沿图像的垂直视角方向，对图像的列向量进行卷积操作，得到第二卷积结果，如图5中所示，第二卷积结果为

将第二卷积结果中的列向量进行反向排列，得到第二反向序列

将第二卷积结果及第二反向序列确定为纵向特征序列。

第三步，基于横向特征序列中的第一卷积结果、第一反向序列，以及纵向特征序列中的第二卷积结果、第二反向序列，对图像进行卷积操作，提取用于表示第一卷积结果、第一反向序列、第二卷积结果及第二反向序列分别在图像形变中所占权值的形变参数α:(α ₁,β ₁,α ₂,β ₂) ^T。

第四步，根据形变参数，以加权和的方式，通过公式(1)，将第一卷积结果、第一反向序列、第二卷积结果及第二反向序列进行融合，得到n×1的融合特征

第五步，利用预设的双曲线激活函数，通过公式(2)，对融合特征进行激活，得到图像特征h。

第六步，通过对图像特征进行解码，识别图像中的目标。

通过本方案，针对发生倾斜的目标，目标在不同视角方向上的分量不同，因此，通过沿不同视角进行特征提取，然后经过特征融合的方式，得到目标在各视角下的完整的特征信息，再利用预设激活函数，将融合特征进行激活，得到能够与模板匹配的图像特征，最后通过解码即可识别目标，此方法无需提前对发生倾斜的目标进行角度判断，也就不需要针对不同角度的目标生成各种目标分类器，简化了目标识别的实现步骤，在保证目标识别的准确率的基础上，提高了目标识别的效率。并且，横向特征序列和纵向特征序列中，通过卷积结果的正向排列和反向排列，可以更为直观的表示目标的倾斜情况，通过对横向特征序列和纵向特征序列进行卷积操作，得到用于表示横向特征序列及纵向特征序列分别在图像形变中所占权值的形变参数，通过加权和的方式进行特征融合，使得融合特征可以更真实的反映目标在不同视角方向的形变程度，可以进一步提高目标识别的准确性。

相应于上述方法实施例，本申请实施例提供了一种图像目标识别装置，如图6所示，该图像目标识别装置可以包括：

特征提取模块610，用于分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列。

融合模块620，用于将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征。

激活模块630，用于利用预设激活函数，对所述融合特征进行激活，得到图像特征。

解码模块640，用于通过对所述图像特征进行解码，识别所述图像中的目标。

可选的，所述融合模块620，具体可以用于：以拼接融合的方式，将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征。

本申请实施例的图像目标识别装置为应用如图2所示实施例的图像目标识别方法的装置，则图2所示实施例的图像目标识别方法的所有实施例均适用于该图像目标识别装置，且均能达到相同或相似的有益效果。

基于图6所示实施例，本申请实施例提供了另一种图像目标识别装置，如图7所示，该图像目标识别装置可以包括：

特征提取模块710，用于沿图像的水平视角方向进行卷积操作，得到第一卷积结果；将所述第一卷积结果确定为横向特征序列；沿所述图像的垂直视角方向进行卷积操作，得到第二卷积结果；将所述第二卷积结果确定为纵向特征序列。

第一形变参数提取模块720，用于基于所述横向特征序列及所述纵向特征序列，对所述图像进行卷积操作，提取用于表示所述横向特征序列及所述纵向特征序列分别在图像形变中所占权值的形变参数。

融合模块730，用于根据所述形变参数，以加权和的方式，将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征。

激活模块740，用于利用预设激活函数，对所述融合特征进行激活，得到图像特征。

解码模块750，用于通过对所述图像特征进行解码，识别所述图像中的目标。

基于图6所示实施例，本申请实施例提供了另一种图像目标识别装置，如图8所示，该图像目标识别装置可以包括：

特征提取模块810，用于沿图像的水平视角方向进行卷积操作，得到第一卷积结果；将所述第一卷积结果中的行向量进行反向排列，得到第一反向序列；将所述第一卷积结果及所述第一反向序列确定为横向特征序列；沿所述图像的垂直视角方向进行卷积操作，得到第二卷积结果；将所述第二卷积结果中的列向量进行反向排列，得到第二反向序列；将所述第二卷积结果及所述第二反向序列确定为纵向特征序列。

第二形变参数提取模块820，用于基于所述横向特征序列中的第一卷积结果、第一反向序列，以及所述纵向特征序列中的第二卷积结果、第二反向序列，对所述图像进行卷积操作，提取用于表示所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列分别在图像形变中所占权值的形变参数。

融合模块830，用于根据所述形变参数，以加权和的方式，将所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列进行融合，得到融合特征。

激活模块840，用于利用预设激活函数，对所述融合特征进行激活，得到图像特征。

解码模块850，用于通过对所述图像特征进行解码，识别所述图像中的目标。

应用本实施例，针对发生倾斜的目标，目标在不同视角方向上的分量不同，因此，通过沿不同视角进行特征提取，然后经过特征融合的方式，得到目标在各视角下的完整的特征信息，再利用预设激活函数，将融合特征进行激活，得到能够与模板匹配的图像特征，最后通过解码即可识别目标，此方法无需提前对发生倾斜的目标进行角度判断，也就不需要针对不同角度的目标生成各种目标分类器，简化了目标识别的实现步骤，在保证目标识别的准确率的基础上，提高了目标识别的效率。并且，横向特征序列和纵向特征序列中，通过卷积结果的正向排列和反向排列，可以更为直观的表示目标的倾斜情况，通过对横向特征序列和纵向特征序列进行卷积操作，得到用于表示横向特征序列及纵向特征序列分别在图像形变中所占权值的形变参数，通过加权和的方式进行特征融合，使得融合特征可以更真实的反映目标在不同视角方向的形变程度，可以进一步提高目标识别的准确性。

另外，相应于上述实施例提供的卷积运算方法，本申请实施例提供了一种计算机设备，如图9所示，包括处理器901和存储器902，其中，存储器902，用于存放计算机程序；处理器901，用于执行存储器902上所存放的计算机程序时，实现如下步骤：

分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列；将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征；利用预设激活函数，对所述融合特征进行激活，得到图像特征；通过对所述图像特征进行解码，识别所述图像中的目标。

可选的，所述处理器901在实现所述分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列的步骤时，具体可以实现如下步骤：沿图像的水平视角方向进行卷积操作，得到第一卷积结果；将所述第一卷积结果确定为横向特征序列；沿所述图像的垂直视角方向进行卷积操作，得到第二卷积结果；将所述第二卷积结果确定为纵向特征序列。

可选的，所述处理器901还可以实现如下步骤：基于所述横向特征序列及所述纵向特征序列，对所述图像进行卷积操作，提取用于表示所述横向特征序列及所述纵向特征序列分别在图像形变中所占权值的形变参数。

所述处理器901在实现所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征的步骤时，具体可以实现如下步骤：根据所述形变参数，以加权和的方式，将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征。

可选的，所述处理器901在实现所述分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列的步骤时，具体可以实现如下步骤：沿图像的水平视角方向进行卷积操作，得到第一卷积结果；将所述第一卷积结果中的行向量进行反向排列，得到第一反向序列；将所述第一卷积结果及所述第一反向序列确定为横向特征序列；沿所述图像的垂直视角方向进行卷积操作，得到第二卷积结果；将所述第二卷积结果中的列向量进行反向排列，得到第二反向序列；将所述第二卷积结果及所述第二反向序列确定为纵向特征序列。

可选的，所述处理器901还可以实现如下步骤：基于所述横向特征序列中的第一卷积结果、第一反向序列，以及所述纵向特征序列中的第二卷积结果、第二反向序列，对所述图像进行卷积操作，提取用于表示所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列分别在图像形变中所占权值的形变参数。

所述处理器901在实现所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征的步骤时，具体可以实现如下步骤：根据所述形变参数，以加权和的方式，将所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列进行融合，得到融合特征。

可选的，所述处理器901在实现所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征的步骤时，具体可以实现如下步骤：以拼接融合的方式，将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征。

存储器902与处理器901之间可以通过有线连接或者无线连接的方式进行数据传输，并且计算机设备可以通过有线通信接口或者无线通信接口与其他的设备进行通信。需要说明的一点，图9中只给出了处理器901与存储器902之间通过总线传输数据的示例，并不是对具体传输方式的限定。

上述存储器可以包括RAM(Random Access Memory，随机存取存储器)，也可以包括NVM(Non-volatile Memory，非易失性存储器)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离上述处理器的存储装置。

上述处理器可以是通用处理器，包括CPU(Central Processing Unit，中央处理器)、NP(Network Processor，网络处理器)等；还可以是DSP(Digital Signal Processor，数字信号处理器)、ASIC(Application Specific Integrated Circuit，专用集成电路)、FPGA(Field-Programmable Gate Array，现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本实施例中，该计算机设备的处理器通过读取并运行存储器中存储的计算机程序，该计算机程序在运行时执行本申请实施例所提供的图像目标识别方法，因此能够实现：针对发生倾斜的目标，目标在不同视角方向上的分量不同，因此，通过沿不同视角进行特征提取，然后经过特征融合的方式，得到目标在各视角下的完整的特征信息，再利用预设激活函数，将融合特征进行激活，得到能够与模板匹配的图像特征，最后通过解码即可识别目标，此方法无需提前对发生倾斜的目标进行角度判断，也就不需要针对不同角度的目标生成各种目标分类器，简化了目标识别的实现步骤，在保证目标识别的准确率的基础上，提高了目标识别的效率。

另外，相应于上述实施例所提供的图像目标识别方法，本申请实施例提供了一种计算机可读存储介质，用于存储计算机程序，所述计算机程序用于在运行时执行：本申请实施例所提供的图像目标识别方法。

本实施例中，计算机可读存储介质存储有在运行时执行本申请实施例所提供的图像目标识别方法的计算机程序，因此能够实现：针对发生倾斜的目标，目标在不同视角方向上的分量不同，因此，通过沿不同视角进行特征提取，然后经过特征融合的方式，得到目标在各视角下的完整的特征信息，再利用预设激活函数，将融合特征进行激活，得到能够与模板匹配的图像特征，最后通过解码即可识别目标，此方法无需提前对发生倾斜的目标进行角度判断，也就不需要针对不同角度的目标生成各种目标分类器，简化了目标识别的实现步骤，在保证目标识别的准确率的基础上，提高了目标识别的效率。

另外，相应于上述实施例所提供的图像目标识别方法，本申请实施例提供了一种应用程序，用于在运行时执行：本申请实施例所提供的图像目标识别方法。

本实施例中，应用程序在运行时执行本申请实施例所提供的图像目标识别方法，因此能够实现：针对发生倾斜的目标，目标在不同视角方向上的分量不同，因此，通过沿不同视角进行特征提取，然后经过特征融合的方式，得到目标在各视角下的完整的特征信息，再利用预设激活函数，将融合特征进行激活，得到能够与模板匹配的图像特征，最后通过解码即可识别目标，此方法无需提前对发生倾斜的目标进行角度判断，也就不需要针对不同角度的目标生成各种目标分类器，简化了目标识别的实现步骤，在保证目标识别的准确率的基础上，提高了目标识别的效率。

对于计算机设备、计算机可读存储介质以及应用程序实施例而言，由于其所涉及的方法内容基本相似于前述的方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、计算机设备、计算机可读存储介质以及应用程序实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

一种图像目标识别方法，其特征在于，所述方法包括：

分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列；

将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征；

利用预设激活函数，对所述融合特征进行激活，得到图像特征；

通过对所述图像特征进行解码，识别所述图像中的目标。
根据权利要求1所述的方法，其特征在于，所述分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列，包括：

沿图像的水平视角方向进行卷积操作，得到第一卷积结果；将所述第一卷积结果确定为横向特征序列；

沿所述图像的垂直视角方向进行卷积操作，得到第二卷积结果；将所述第二卷积结果确定为纵向特征序列。
根据权利要求2所述的方法，其特征在于，在所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征之前，所述方法还包括：

基于所述横向特征序列及所述纵向特征序列，对所述图像进行卷积操作，提取用于表示所述横向特征序列及所述纵向特征序列分别在图像形变中所占权值的形变参数；

所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征，包括：

根据所述形变参数，以加权和的方式，将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征。
根据权利要求1所述的方法，其特征在于，所述分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列，包括：

沿图像的水平视角方向进行卷积操作，得到第一卷积结果；

将所述第一卷积结果中的行向量进行反向排列，得到第一反向序列；

将所述第一卷积结果及所述第一反向序列确定为横向特征序列；

沿所述图像的垂直视角方向进行卷积操作，得到第二卷积结果；

将所述第二卷积结果中的列向量进行反向排列，得到第二反向序列；

将所述第二卷积结果及所述第二反向序列确定为纵向特征序列。
根据权利要求4所述的方法，其特征在于，在所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征之前，所述方法还包括：

基于所述横向特征序列中的第一卷积结果、第一反向序列，以及所述纵向特征序列中的第二卷积结果、第二反向序列，对所述图像进行卷积操作，提取用于表示所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列分别在图像形变中所占权值的形变参数；

所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征，包括：

根据所述形变参数，以加权和的方式，将所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列进行融合，得到融合特征。
根据权利要求1所述的方法，其特征在于，所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征，包括：

以拼接融合的方式，将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征。
一种图像目标识别装置，其特征在于，所述装置包括：

特征提取模块，用于分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列；

融合模块，用于将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征；

激活模块，用于利用预设激活函数，对所述融合特征进行激活，得到图像特征；

解码模块，用于通过对所述图像特征进行解码，识别所述图像中的目标。
根据权利要求7所述的装置，其特征在于，所述特征提取模块，具体用于：

沿图像的水平视角方向进行卷积操作，得到第一卷积结果；将所述第一卷积结果确定为横向特征序列；

沿所述图像的垂直视角方向进行卷积操作，得到第二卷积结果；将所述第二卷积结果确定为纵向特征序列。
根据权利要求8所述的装置，其特征在于，所述装置还包括：

第一形变参数提取模块，用于基于所述横向特征序列及所述纵向特征序列，对所述图像进行卷积操作，提取用于表示所述横向特征序列及所述纵向特征序列分别在图像形变中所占权值的形变参数；

所述融合模块，具体用于：

根据所述形变参数，以加权和的方式，将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征。
根据权利要求7所述的装置，其特征在于，所述特征提取模块，具体用于：

沿图像的水平视角方向进行卷积操作，得到第一卷积结果；

将所述第一卷积结果中的行向量进行反向排列，得到第一反向序列；

将所述第一卷积结果及所述第一反向序列确定为横向特征序列；

沿所述图像的垂直视角方向进行卷积操作，得到第二卷积结果；

将所述第二卷积结果中的列向量进行反向排列，得到第二反向序列；

将所述第二卷积结果及所述第二反向序列确定为纵向特征序列。
根据权利要求10所述的装置，其特征在于，所述装置还包括：

第二形变参数提取模块，用于基于所述横向特征序列中的第一卷积结果、第一反向序列，以及所述纵向特征序列中的第二卷积结果、第二反向序列，对所述图像进行卷积操作，提取用于表示所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列分别在图像形变中所占权值的形变参数；

所述融合模块，具体用于：

根据所述形变参数，以加权和的方式，将所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列进行融合，得到融合特征。
根据权利要求7所述的装置，其特征在于，所述融合模块，具体用于：

以拼接融合的方式，将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征。
一种计算机设备，其特征在于，包括处理器和存储器，其中，

所述存储器，用于存放计算机程序；

所述处理器，用于执行所述存储器上所存放的计算机程序时，实现如下步骤：

分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列；

将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征；

利用预设激活函数，对所述融合特征进行激活，得到图像特征；

通过对所述图像特征进行解码，识别所述图像中的目标。
根据权利要求13所述的计算机设备，其特征在于，所述处理器在实现所述分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列的步骤时，具体实现如下步骤：

沿图像的水平视角方向进行卷积操作，得到第一卷积结果；将所述第一卷积结果确定为横向特征序列；

沿所述图像的垂直视角方向进行卷积操作，得到第二卷积结果；将所述第二卷积结果确定为纵向特征序列。
根据权利要求14所述的计算机设备，其特征在于，所述处理器还实现如下步骤：

基于所述横向特征序列及所述纵向特征序列，对所述图像进行卷积操作，提取用于表示所述横向特征序列及所述纵向特征序列分别在图像形变中所占权值的形变参数；

所述处理器在实现所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征的步骤时，具体实现如下步骤：

根据所述形变参数，以加权和的方式，将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征。
根据权利要求13所述的计算机设备，其特征在于，所述处理器在实现所述分别沿图像的水平视角方向和垂直视角方向进行特征提取，相应得到所述图像的横向特征序列和纵向特征序列的步骤时，具体实现如下步骤：

沿图像的水平视角方向进行卷积操作，得到第一卷积结果；将所述第一卷积结果中的行向量进行反向排列，得到第一反向序列；

将所述第一卷积结果及所述第一反向序列确定为横向特征序列；沿所述图像的垂直视角方向进行卷积操作，得到第二卷积结果；

将所述第二卷积结果中的列向量进行反向排列，得到第二反向序列；

将所述第二卷积结果及所述第二反向序列确定为纵向特征序列。
根据权利要求16所述的计算机设备，其特征在于，所述处理器还实现如下步骤：

基于所述横向特征序列中的第一卷积结果、第一反向序列，以及所述纵向特征序列中的第二卷积结果、第二反向序列，对所述图像进行卷积操作，提取用于表示所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列分别在图像形变中所占权值的形变参数；

所述处理器在实现所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征的步骤时，具体实现如下步骤：

根据所述形变参数，以加权和的方式，将所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列进行融合，得到融合特征。
根据权利要求13所述的计算机设备，其特征在于，所述处理器在实现所述将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征的步骤时，具体实现如下步骤：

以拼接融合的方式，将所述横向特征序列及所述纵向特征序列进行融合，得到融合特征。