CN113128526A

CN113128526A - 图像识别方法、装置、电子设备和计算机可读存储介质

Info

Publication number: CN113128526A
Application number: CN202110673982.0A
Authority: CN
Inventors: 孙宇飞; 黄余格; 沈鹏程; 李绍欣
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-06-17
Filing date: 2021-06-17
Publication date: 2021-07-16
Anticipated expiration: 2041-06-17
Also published as: CN113128526B

Abstract

本发明实施例公开了一种图像识别方法、装置、电子设备和计算机可读存储介质；本发明实施例在获取待识别图像后，对待识别图像进行特征提取，得到待识别对象的身份特征和群体特征，然后，在身份特征中识别出与群体特征关联的特征，得到群体关联特征，并在群体特征中识别出与身份特征关联的特征，得到身份关联特征，然后，根据群体关联特征和身份关联特征，对身份特征和群体特征进行修正，然后，基于修正后身份特征和修正后群体特征，确定所述待识别对象的身份信息；该方案可以提升不同类型的图像识别的准确率。

Description

图像识别方法、装置、电子设备和计算机可读存储介质

技术领域

本发明涉及通信技术领域，具体涉及一种图像识别方法、装置、电子设备和计算机可读存储介质。

背景技术

近年来，随着互联网技术的飞速发展，将神经网络应用于图像识别领域也有了长足的发展。由于现有图像的类型各异，对于不同类型的图像，在图像识别过程中，又往往期望神经网络能够有相同的识别性能。为了实现这一点，现有通常会采用属性抑制的方法来进行图像识别。

然而，在对现有技术的研究和实践过程中，本申请的发明人发现采用属性抑制的方式虽然可以针对不同类型的图像具有相同的识别性能，但是图像识别的精度较低，因此导致图像识别的准确率较低。

发明内容

本发明实施例提供一种图像识别方法、装置、电子设备和计算机可读存储介质，可以提高图像识别的准确率。

一种图像识别方法，包括：

获取待识别图像，所述待识别图像包括至少一个待识别对象；

对所述待识别图像进行特征提取，得到所述待识别对象的身份特征和群体特征，所述群体特征用于指示所述待识别对象的类型；

在所述身份特征中识别出与所述群体特征关联的特征，得到群体关联特征，并在所述群体特征中识别出与所述身份特征关联的特征，得到身份关联特征；

根据所述群体关联特征和身份关联特征，对所述身份特征和群体特征进行修正；

基于修正后身份特征和修正后群体特征，确定所述待识别对象的身份信息。

相应的，本发明实施例提供一种图像识别装置，包括：

获取单元，用于获取待识别图像，所述待识别图像包括至少一个待识别对象；

提取单元，用于对所述待识别图像进行特征提取，得到所述待识别对象的身份特征和群体特征，所述群体特征用于指示所述待识别对象的类型；

识别单元，用于在所述身份特征中识别出与所述群体特征关联的特征，得到群体关联特征，并在所述群体特征中识别出与所述身份特征关联的特征，得到身份关联特征；

修正单元，用于根据所述群体关联特征和身份关联特征，对所述身份特征和群体特征进行修正；

确定单元，用于基于修正后身份特征和修正后群体特征，确定所述待识别对象的身份信息。

可选的，在一些实施例中，所述识别单元，具体可以用于获取所述身份特征和群体特征在所述待识别图像中的位置信息，以得到所述身份特征对应的身份位置特征和所述群体特征对应的群体位置特征；根据所述身份位置特征，在所述身份特征中识别出与所述群体特征关联的特征，得到群体关联特征；基于所述群体位置特征，在所述群体特征中识别出与所述身份特征关联的特征，得到身份关联特征。

可选的，在一些实施例中，所述识别单元，具体可以用于获取所述身份特征和群体特征在所述待识别图像中的位置信息，得到所述身份特征对应的身份位置信息和所述群体特征对应的群体位置信息；根据所述身份位置信息，对所述待识别图像中的像素进行位置编码，得到所述身份特征对应的身份位置特征；基于所述群体位置信息，对所述待识别图像中的像素进行位置编码，得到所述群体特征对应的群体位置特征。

可选的，在一些实施例中，所述识别单元，具体可以用于在所述身份特征中提取出用于特征交互的身份特征，得到第一查询特征和第一值特征；在所述群体特征中提取出用于特征交互的群体特征，得到第一键特征；将所述第一查询特征与第一键特征进行特征交互，得到第一交互特征，并将所述第一交互特征、所述身份位置特征和第一值特征进行融合，得到群体关联特征。

可选的，在一些实施例中，所述识别单元，具体可以用于获取所述身份特征的特征通道数量；将所述第一查询特征与第一键特征进行融合，得到初始交互特征；计算所述初始交互特征与所述特征通道数量的比值，得到所述第一交互特征。

可选的，在一些实施例中，所述识别单元，具体可以用于将所述第一交互特征与所述身份位置特征进行融合，得到融合后特征；对所述融合后特征进行归一化处理，得到关联权重，所述关联权重用于指示所述身份特征中的特征与所述群体特征的关联关系；根据所述关联权重，对所述第一值特征进行加权，得到所述群体关联特征。

可选的，在一些实施例中，所述识别单元，具体可以用于在所述群体特征中提取出用于特征交互的群体特征，得到第二查询特征和第二值特征；在所述身份特征中提取出用于特征交互的身份特征，得到第二键特征；将所述第二查询特征与第二键特征进行特征交互，得到第二交互特征，并将所述第二交互特征、群体位置特征和第二值特征进行融合，得到身份关联特征。

可选的，在一些实施例中，所述修正单元，具体可以用于根据所述群体关联特征，在所述身份特征中筛选出需要消除的身份特征，得到目标身份特征；基于所述身份关联特征，在所述群体特征中筛选出需要消除的群体特征，得到目标群体特征；在所述身份特征中删除所述目标身份特征，得到修正后身份特征，并在所述群体特征中删除所述目标群体特征，得到修正后群体特征。

可选的，在一些实施例中，所述修正单元，具体可以用于获取所述群体关联特征对应的消除权重；根据所述消除权重，对所述群体关联特征进行加权，将加权后群体关联特征作为所述身份特征中需要消除的身份特征，得到目标身份特征。

可选的，在一些实施例中，所述确定单元，具体可以用于对所述修正后身份特征和修正后群体特征进行特征提取，并对提取到的身份特征和群体特征进行修正；返回执行所述对所述修正后身份特征和修正后群体特征进行特征提取的步骤，直至所述身份特征的修正次数达到预设次数，得到目标修正后身份特征；采用训练后识别模型对所述目标修正后身份特征进行识别，得到所述待识别对象的身份信息。

可选的，在一些实施例中，所述图像识别装置还可以包括训练单元，所述训练单元，具体可以用于获取至少一个图像样本，所述图像样本包括标注标签的对象；采用预设识别模型对所述图像样本中对象的身份和类型进行预测，得到预测标签；根据所述预测标签和标注标签对所述预设识别模型进行收敛，得到所述训练后识别模型。

可选的，在一些实施例中，所述训练单元，具体可以用于根据所述原始身份标签和预测身份标签，确定所述图像样本的身份损失信息；基于所述原始类型标签和预测类型标签，确定所述图像样本的群体损失信息；将所述身份损失信息和群体损失信息进行融合，并采用融合后损失信息对所述预设识别模型进行收敛，得到所述训练后识别模型。

可选的，在一些实施例中，所述训练单元，具体可以用于获取所述原始类型标签对应的目标身份特征，并计算所述图像样本的身份特征与所述目标身份特征之间的特征差值；计算所述原始身份标签与预测身份标签之间的标签差值，并将所述特征差值和标签差值进行融合，得到融合后差值；根据所述图像样本的数量，计算所述融合后差值的均值，得到所述图像样本的身份损失信息。

此外，本发明实施例还提供一种电子设备，包括处理器和存储器，所述存储器存储有应用程序，所述处理器用于运行所述存储器内的应用程序实现本发明实施例提供的图像识别方法。

此外，本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本发明实施例所提供的任一种图像识别方法中的步骤。

本申请实施例在获取待识别图像后，对待识别图像进行特征提取，得到待识别对象的身份特征和群体特征，然后，在身份特征中识别出与群体特征关联的特征，得到群体关联特征，并在群体特征中识别出与身份特征关联的特征，得到身份关联特征，然后，根据群体关联特征和身份关联特征，对身份特征和群体特征进行修正，然后，基于修正后身份特征和修正后群体特征，确定所述待识别对象的身份信息；由于该方案不仅提取出身份特征和群体特征，而且还可以通过识别出身份关联特征和群体关联特征对身份特征和群体特征进行修正，从而得到更加精准的身份特征和群体特征，并通过群体特征进行辅助识别，因此，可以大大提升不同类型的图像识别的准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的图像识别方法的场景示意图；

图2是本发明实施例提供的图像识别方法的流程示意图；

图3是本发明实施例提供的群体特征和身份特征的特征交互示意图；

图4是本发明实施例提供的传统的特征图的特征交互示意图；

图5是本发明实施例提供的采用训练后识别模型对图像识别的示意图；

图6是本发明实施例提供的训练预设识别模型的示意图；

图7是本发明实施例提供的图像识别方法的另一流程示意图；

图8是本发明实施例提供的图像识别装置的结构示意图；

图9是本发明实施例提供的图像识别装置的另一结构示意图；

图10是本发明实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供一种图像识别方法、装置、电子设备和计算机可读存储介质。其中，该图像识别装置可以集成在电子设备中，该电子设备可以是服务器，也可以是终端等设备。

其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务（Content Delivery Network，CDN）、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

例如，参见图1，以图像识别装置集成在电子设备中为例，电子设备在获取待识别图像后，对待识别图像进行特征提取，得到待识别对象的身份特征和群体特征，然后，在身份特征中识别出与群体特征关联的特征，得到群体关联特征，并在群体特征中识别出与身份特征关联的特征，得到身份关联特征，然后，根据群体关联特征和身份关联特征，对身份特征和群体特征进行修正，然后，基于修正后身份特征和修正后群体特征，确定所述待识别对象的身份信息，进而提升不同类型的图像的识别准确率。

其中，本申请实施例提供的图像识别方法涉及到人工智能领域的计算机视觉技术，即在本申请实施例中，可以利用人工智能的计算机视觉技术对待识别图像进行特征提取，并在提取出的身份特征中识别出与群体特征关联的特征、以及在提取出的群体特征中识别出与身份特征关联的特征，以对身份特征和群体特征进行修正，从而确定待识别图像中待识别对象的身份信息。

其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。其中，人工智能软件技术主要包括计算机视觉技术、机器学习/深度学习等方向。

其中，计算机视觉技术(Computer Vision，CV)是一门研究如何使机器“看”的科学，更进一步的说，就是指通过计算机代替人眼对目标进行识别、测量等的机器视觉，并进一步进行图像处理，使图像经过计算机处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别等技术，还包括常见的人脸识别、人体姿态识别等生物特征识别技术。

以下分别进行详细说明。需要说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。

本实施例将从图像识别装置的角度进行描述，该图像识别装置具体可以集成在电子设备中，该电子设备可以是服务器，也可以是终端等设备；其中，该终端可以包括平板电脑、笔记本电脑、以及个人计算机（PC，Personal Computer）、可穿戴设备、虚拟现实设备或其他可以进行图像识别的智能设备等设备。

一种图像识别方法，包括：

获取待识别图像，该待识别图像包括至少一个待识别对象，对待识别图像进行特征提取，得到待识别对象的身份特征和群体特征，该群体特征用于指示待识别对象的类型，在身份特征中识别出与群体特征关联的特征，得到群体关联特征，并在群体特征中识别出与身份特征关联的特征，得到身份关联特征，根据群体关联特征和身份关联特征，对身份特征和群体特征进行修正，基于修正后身份特征和修正后群体特征，确定待识别对象的身份信息。

如图2所示，该图像识别方法的具体流程如下：

101、获取待识别图像。

其中，待识别图像包括至少一个待识别对象，所谓待识别对象可以为需要识别的对象，该对象的类型可以有多种，比如，可以为人或者人的某一个区域，譬如人脸等，或者，还可以为物品、动物、建筑或设备等等。

其中，获取待识别图像的方式可以有多种，比如，可以直接获取待识别图像，或者，当待识别图像的内存较大或者数量较多时，也可以采用间接的方式获取该待识别图像，等等，具体可以如下：

（1）直接获取待识别图像；

例如，图像识别装置可以直接接收用户通过终端上传的待识别图像，或者，可以在网络上获取包含待识别对象的图像作为待识别图像，或者，还可以在图像数据库中提取出候选图像，对候选图像进行检测，将包含待识别对象的图像作为待识别图像。

（2）间接获取待识别图像；

例如，当待识别图像的内存较大或者数量较多是，图像识别装置可以接收终端发送的图像识别请求，其中，该图像识别请求可以包括用户或者内容服务商存储待识别图像的存储地址，然后，图像识别装置在图像识别请求中提取出存储地址，根据该存储地址，在内存、缓存或者第三方数据库中获取待识别图像。

可选的，当成功获取到该待识别图像之后，图像识别装置还可以向终端发送提示信息，以提示终端当前已成功获取待识别图像。

可选的，图像识别装置在根据存储地址获取待识别图像时，除了可以逐个获取待识别图像之外，还可以批量同时获取，或者，还可以根据负载请求，分批或在预设时间内获取待识别图像，等等，在此不作赘述。

102、对待识别图像进行特征提取，得到待识别对象的身份特征和群体特征。

其中，群体特征用于指示待识别对象的类型，可以理解待识别对象的类型对应的特征信息，比如，可以包括大小、年龄、性别、民族或位置等特征信息。与之对应的身份特征就可以为指示待识别用户的身份的特征信息，比如，可以包括姓名、身份标识、身份ID等自身的特征信息等。

其中，对待识别图像进行特征提取的方式可以有多种，比如，可以采用训练后识别模型的身份特征提取网络提取出待识别对象的身份特征，采用训练后识别模型的群体特征提取网络提取出待识别对象的群体特征，具体可以如下：

（1）采用训练后识别模型的身份特征提取网络提取出待识别对象的身份特征。

例如，可以采用卷积神经网络作为训练后识别模型的身份特征提取网络，对待识别图像进行特征提取，得到待识别图像的身份特征。

其中，卷积神经网络的网络结构可以有多种，比如，可以为残差卷积神经网络、密集神经网络或者其他类型的卷积神经网络，其中，对于残差卷积神经网络来说，又可以包括多种深度的残差网络结构，比如，IR34残差网络、IR18残差网络或者其他深度的残差网络结构。

（2）采用训练后识别模型的群体特征提取网络，对待识别图像进行特征提取，得到待识别图像的群体特征。

例如，可以采用卷积神经网络作为训练后识别模型的群体特征提取网络对待识别图像进行特征提取，得到待识别图像的身份特征。

其中，卷积神经网络的结构可以有多种，比如，可以为残差卷积神经网络、密集神经网络或者其他类型的卷积神经网络，其中，对于残差卷积神经网络来说，又可以包括多种深度的残差网络结构，比如，IR34残差网络、IR18残差网络或者其他深度的残差网络结构。

其中，对于身份特征提取网络和群体特征提取网络分别对应的卷积神经网络的网络结构可以相同也可以不同，但是身份特征提取网络和群体特征提取网络分别对应的卷积神经网络的网络参数不同，比如，身份特征提取网络和群体特征提取网络都可以为残差卷积神经网络，残差卷积神经网络的网络参数不同。

103、在身份特征中识别出与群体特征关联的特征，得到群体关联特征，并在群体特征中识别出与身份特征关联的特征，得到身份关联特征。

其中，群体关联特征可以为身份特征中与群体特征（群体信息）相关的特征信息，身份关联特征可以为群体特征中与身份特征（身份信息）相关的特征信息。

其中，识别群体关联特征和身份关联特征的方式可以有多种，比如，可以获取身份特征和群体特征在待识别图像中的位置信息，以得到身份特征对应的身份位置特征和群体特征对应的群体位置特征，根据身份位置特征，在身份特征中识别出与群体特征关联的特征，得到群体关联特征，基于群体位置特征，在群体特征中识别出与身份特征关联的特征，得到身份关联特征，具体可以如下：

S1、获取身份特征和群体特征在待识别图像中的位置信息，以得到身份特征对应的身份位置特征和群体特征对应的群体位置特征。

例如，可以获取身份特征和群体特征在待识别图像中的位置信息，得到身份特征对应的身份位置信息和群体特征对应的群体位置信息，根据身份位置信息，对待识别图像中的像素进行位置编码，得到身份位置特征，基于群体位置信息，对待识别图像中的像素进行位置编码，得到群体特征对应的群体位置特征，具体可以如下：

（1）获取身份特征和群体特征在待识别图像中的位置信息，得到身份特征对应的身份位置信息和群体特征对应的群体位置信息。

例如，在待识别图像中识别出身份特征和群体特征对应的像素，获取该像素在待识别图像中的位置，从而就可以得到身份特征对应的身份位置信息和群体特征对应的群体位置信息。

其中，识别出身份特征和群体特征对应的像素的方式可以有多种，比如，可以在身份特征中提取出身份特征信息，在待识别图像的像素集合中筛选出身份特征信息对应的像素，在群体特征中提取出群体特征信息，在待识别图像的像素集合中筛选出群体特征信息对应的像素。这个识别的过程可以看作是特征提取的逆过程，比如，从A像素中提取出A身份特征信息，则A身份特征信息对应的像素就可以为A像素，群体特征信息的识别也是同样的方式。

（2）根据身份位置信息，对待识别图像中的像素进行位置编码，得到身份特征对应的身份位置特征。

例如，可以直接对身份位置信息进行独热编码，并将得到编码添加至身份特征中，从而得到身份特征对应的身份位置特征，或者，还可以采用三角函数相关的函数对身份位置信息进行表示，比如，在每个身份位置信息的偶数位置添加sin（正弦函数）变量，奇数位置添加cos（余弦函数）变量，以此来填满整个位置矩阵，然后，将位置矩阵与身份特征进行融合，得到身份特征对应的身份位置特征。

（3）根据群体位置信息，对待识别图像中的像素进行位置编码，得到群体特征对应的群体位置特征。

例如，可以直接对群体位置信息进行独热编码，并将得到编码添加至群体特征中，从而得到群体特征对应的群体位置特征，或者，还可以采用三角函数相关的函数群体位置信息进行表示，比如，在每个群体位置信息的偶数位置添加sin变量，奇数位置添加cos变量，以此来填满整个位置矩阵，然后，将位置矩阵与群体特征进行融合，得到群体特征对应的群体位置特征。

S2、根据身份位置特征，在身份特征中识别出与群体特征关联的特征，得到群体关联特征。

例如，在身份特征中提取出用于特征交互的身份特征，得到第一查询特征和第一值特征，在群体特征中提取出用于特征交互的群体特征，得到第一键特征，将第一查询特征与第一键特征进行特征交互，得到第一交互特征，并将第一交互特征、身份位置特征和第一值特征进行融合，得到群体关联特征。

其中，第一查询特征可以为在特征交互中查询身份特征中与群体特征关联的信息的特征，通常可以为查询向量或者查询矩阵的形式，第一值特征和第一键特征通常组成特征交互过程中的键值对，计算该键值对中特征的交互权重，就可以得到身份特征中与群体特征关联的特征。

其中，提取出第一查询特征、第一值特征和第一键特征的方式可以有多种，比如，采用卷积层分别对身份特征进行卷积处理，得到第一查询特征和第一值特征，采用卷积层对群体特征进行卷积处理，得到第一键特征。卷积层的尺寸可以根据实际应用进行设定，比如，可以为1*1或者其他尺寸，对身份特征和群体特征进行卷积处理的卷积层可以相同也可以不同。或者，还可以获取预设的查询参数、值参数和键参数，将查询参数与身份特征进行融合，得到第一查询特征，将值参数与身份特征进行融合，得到第一值特征，将键参数与群体特征进行融合，得到第一键特征。

在提取出第一查询特征、第一值特征和第一键特征之后，便可以进行特征交互，特征交互的方式可以有多种，比如，可以采用注意力网络将第一查询特征和第一键特征进行融合，从而得到注意力特征，将注意力特征作为交互特征。

其中，采用注意力网络将第一查询特征和第一键特征进行融合的过程可以有多种，比如，可以获取身份特征的特征通道数量，将第一查询特征与第一键特征进行融合，得到初始交互特征，计算初始交互特征与特征通道数量的比值，得到第一交互特征，其中融合的过程可以为采用矩阵乘法将第一查询特征对应的查询矩阵与第一键特征对应的键矩阵进行矩阵乘法，并将矩阵乘法得到的乘积除以特征通道数量，就可以得到第一交互特征，具体可以如公式（1）所示。

其中，

为第一交互特征，

为第一查询特征，

为第一键特征，D为特征通道数量。

在得到第一交互特征之后，便可以将第一交互特征、身份位置特征和第一值特征进行融合，得到群体关联特征，融合的方式可以有多种，比如，可以将第一交互特征与身份位置特征进行融合，得到融合后特征，对融合后特征进行归一化处理，得到关联权重，该关联权重用于指示身份特征中的特征与群体特征的关联关系，根据关联权重，对第一值特征进行加权，得到群体关联特征。

其中，第一交互特征与身份位置特征进行融合的方式可以有多种，比如，可以将第一交互特征与身份位置特征相加，或者，还可以将第一交互特征与身份位置特征进行特征拼接，从而得到融合后特征。

在将第一交互特征与身份位置特征进行融合之后，便可以对融合后特征进行归一化处理，从而得到关联权重，归一化的方式可以有多种，比如，可以采用softmax（一种归一化函数）函数对融合后特征进行归一化处理，或者，还可以其他归一化函数对融合后特征进行归一化处理，从而得到待识别图像的像素间的注意力得分S，将注意力得分S作为每个像素中的身份特征中与群体特征关联的关联权重，以归一化函数为softmax为例，具体可以公式（2）所示。

S=softmax(A_id+PE_xid ) （2）

其中，S为注意力得分，

为第一交互特征，

为身份位置特征。

在得到关联权重之后，就可以根据关联权重，对第一值特征进行加权，得到群体关联特征，比如，将关联权重与第一值特征对应的值矩阵做矩阵乘法，得到群体关联特征，这里的群体关联特征为注意力网络的输出，输出的群体关联特征可以为一个新的特征图，具体可以如公式（3）所示：

其中，T_id为群体关联特征，A_id为第一交互特征，PE_xid为身份位置特征，V_id为第一值特征。

其中，对群体特征和身份特征进行特征交互主要通过卷积层和注意力网络来完成，卷积层对群体特征和身份特征进行特征提取，提取出第一查询特征、第一值特征和第一键特征，注意力网络将第一查询特征、第一值特征和第一键特征进行特征交互，从而输出群体关联特征，具体可以如图3所示。相对传统的Transformer（一种神经网络模型）应用在图像分类模型时，给定一个图像的特征图（图像特征），在图像特征中提取出查询矩阵、值矩阵和键矩阵，并进行特征交互，得到新的特征图，如图4所示，本方案中是通过两个不同的特征分别提取出的特征交互的矩阵，从而得到身份特征中与群体特征关联的特征和群体特征中与身份特征关联的特征。

S3、基于群体位置特征，在群体特征中识别出与身份特征关联的特征，得到身份关联特征。

例如，可以在群体特征中提取出用于特征交互的群体特征，得到第二查询特征和第二值特征，在身份特征中提取出用于特征交互的身份特征，得到第二键特征，将第二查询特征与第二键特征进行特征交互，得到第二交互特征，并将第二交互特征、群体位置特征和第二值特征进行融合，得到身份关联特征。其中，得到身份关联特征的过程也可以通过注意力网络进行特征交互而来，具体的过程可以参见群体关联特征的过程，再此就不再一一赘述。

其中，得到身份关联特征和群体关联特征最大的区别在于用于特征交互的特征不同，输出群体关联特征的过程中，从身份特征中提取出第一查询特征和第一值特征，从群体特征中提取出第一键特征，而输出身份关联特征的过程中，从身份特征中提取出第二键特征，从群体特征中提取出第二查询特征和第二值特征。

104、根据群体关联特征和身份关联特征，对身份特征和群体特征进行修正。

例如，可以根据群体关联特征，在身份特征中筛选出需要消除的身份特征，得到目标身份特征，基于身份关联特征，在群体特征中筛选出需要消除的群体特征，得到目标群体特征，在身份特征中删除目标身份特征，得到修正后身份特征，并在群体特征中删除目标群体特征，得到修正后群体特征。

其中，根据群体关联特征，在身份特征中筛选出需要消除的身份特征的方式可以有多种，比如，可以获取群体关联特征对应的消除权重，根据消除权重，对群体关联特征进行加权，将加权后群体关联特征作为身份特征中需要消除的身份特征，得到目标身份特征。在筛选出目标身份特征之后，便可以在身份特征中删除该目标身份特征，从而得到修正后身份特征，具体可以如公式（4）所示：

其中，

为修正后身份特征，

为身份特征，

为群体关联特征，

为群体关联特征对应的消除权重。

其中，根据身份关联特征，在群体特征中筛选出需要消除的群体身份特征，得到目标群体特征，具体过程可以参见目标身份特征的筛选，在此就不再一一赘述。在筛选出目标群体特征之后，便可以在群体特征中筛选出该目标群体特征，从而得到修正后群体特征，具体可以如公式（5）所示：

其中，

为修正后群体特征，

为群体特征，

为身份关联特征，

为身份关联特征对应的消除权重。

105、基于修正后身份特征和修正后群体特征，确定待识别对象的身份信息。

其中，身份信息可以指示待识别对象身份的信息，比如，可以包括待识别对象的姓名、标识、ID或者其他可以指示其身份的信息。

其中，确定待识别对象的身份信息的方式可以有多种，具体可以如下：

例如，可以对修正后身份特征和修正后群体特征进行特征提取，并对提取到的身份特征和群体特征进行修正，返回执行对修正后身份特征和修正后群体特征进行特征提取的步骤，直至身份特征的修正次数达到预设次数，得到目标修正后身份特征，采用训练后识别模型对目标修正后身份特征进行识别，得到待识别对象的身份信息。

其中，对修正后身份特征和修正后群体特征进行特征提取的方式可以有多种，比如，可以采用训练后识别模型的身份特征提取网络对修正后身份特征进行特征提取，采用训练后识别模型的群体特征提取网络对修正后群体特征进行特征提取，具体的特征提取过程可以参见上文，在此就不再一一赘述。

对修正后身份特征和修正后群体特征进行特征提取之后，就可以对提取到的身份特征和群体特征进行修正，修正的方式可以有多种，比如，可以采用训练后识别模型的注意力网络将提取到的身份特征和群体特征进行特征交互，以识别身份特征中与群体特征关联的特征和群体特征中与身份特征关联的特征，具体的识别过程可以参见上文，在此就不再一一赘述。

其中，对身份特征和群体特征进行修正可以看作多次修正的过程，因此，训练后识别模型可以包括识别网络和一个或多个修正子模型，修正子模型中可以包括身份特征提取网络、群体特征提取网络和注意力网络，其中，注意力网络与身份特征提取网络和群体特征提取网络之间的相互独立的，修正子模型中可以包括一个或多个注意力网络，注意力网络与身份特征提取网络和群体特征提取网络和交互方式也可以有多种，比如，可以串行连接或者并行连接，等等。通过修正子模型对身份特征和群体特征进行修正，修正的主要过程就是消除身份特征中与群体特征关联的特征，并消除群体特征中与身份特征关联的特征，当身份特征达到预设修正次数之后，也就意味着训练后识别模型中全部的修正子模型都对身份特征和群体特征进行修正了，就可以得到目标修正后身份特征。

在得到目标修正后身份特征之后，便可以通过训练后识别模型的识别网络确定待识别对象的身份信息，确定的方式可以有多种，比如，可以通过识别网络将目标修正后身份特征与预设的候选用户的身份特征进行对比，对比的方式可以为计算目标修正后身份特征与预先采集的候选用户的身份特征的内积，当内积结果超过预设阈值时，就可以确定该用户为候选用户，进而得到用户的身份信息，或者，还可以通过分类器对目标修正后身份特征进行分类，从而得到候选身份信息对应的分类概率，根据分类概率，在候选身份信息中筛选出待识别对象的身份信息，具体可以如图5所示。

对于待识别图像中待识别用户的身份信息识别来说，可以以本方案应用在门禁系统为例说明，首选进行用户（人脸）登记，即利用训练后识别模型提取人脸的身份特征，将该身份特征存储到数据库中，然后，图像采集装置采集到用户的人脸图像之后，对图像进行特征提取，并对提取的身份特征进行修正之后，得到目标修正后身份特征，计算目标修正后身份特征与预先采集的候选用户的身份特征的内积，当内积结果超过预设阈值时，就可以确定该用户为候选用户，进而得到用户的身份信息。当数据库中所有候选用户的身份特征与目标修正后身份特征的内积都小于预设阈值时，就可以确定该用户没有进行用户（人脸）登记，属于非法人员。

其中，该训练后识别模型可以根据实际应用的需求进行设置，另外，需要说的是，该训练后识别模型可以由维护人员预先进行设置，也可以由图像识别装置自行进行训练，即步骤“采用训练后识别模型对目标修正后身份特征进行识别，得到待识别对象的身份信息”之前，该图像识别方法还可以包括：

获取至少一个图像样本，该图像样本包括标注标签的对象，采用预设识模型对图像样本中对象的身份和类型进行预测，得到预测标签，根据预测标签和标注标签对预设识别模型进行收敛，得到训练后识别模型，具体可以如下：

（1）获取至少一个图像样本。

其中，图像样本包括标注标签的对象，标注标签可以包括原始身份标签和原始类型标签，所谓原始身份标签指示对象的身份信息，原始类型标签指示对象的类型信息。

其中，获取图像样本的方式可以有多种，具体可以如下：

例如，可以直接获取图像样本，或者，还可以获取原始图像，并将原始图像发送至标注服务器进行标注，接收标注服务器返回的标注后的原始图像，得到图像样本。

可选的，还可以对标注后的原始图像进行预处理，从而得到图像样本，预处理的方式可以有多种，比如，可以对原始图像的尺寸或者像素进行调整，得到图像样本。

（2）采用预设识别模型对图像样本中对象的身份和类型进行预测，得到预测标签。

例如，采用预设识别模型对图像样本进行特征提取，得到对象的样本身份特征和样本群体特征，在样本身份特征中识别出与样本群体关联的特征，得到样本群体关联特征，并在样本身份特征中识别出与样本身份特征关联的特征，得到样本身份关联特征，根据样本群体关联特征和样本身份关联特征，对样本身份特征和样本群体特征进行修正，基于修正后样本身份特征和修正后样本群体特征，对图像样本中对象的身份和类型进行预测，得到预测标签。

（3）根据预测标签和标注标签对预设识别模型进行收敛，得到训练后识别模型。

其中，标注标签包括原始身份标签和原始类型标签，预测标签包括预测身份标签和预测类型标签。

其中，对预设识别模型进行收敛的方式可以有多种，比如，可以根据原始身份标签和预测身份标签，确定图像样本的身份损失信息，基于原始类型标签和预测类型标签，确定图像样本的群体损失信息，将身份损失信息和群体损失信息进行融合，得到训练后识别模型。

其中，确定图像样本的身份损失信息的方式可以有多种，比如，获取原始类型标签对应的目标身份特征，并计算图像样本的身份特征与目标身份特征之间的特征差值，计算原始身份标签与预测身份标签之间的标签差值，并将特征差值和标签差值进行融合，得到融合后差值，根据图像样本的数量，计算融合后差值的均值，得到图像样本的身份损失信息。

其中，特征差值可以为图像的特征与原始类型标签对应的目标身份特征的中心向量的夹角，标签差值可以为原始身份标签与预测身份标签之间的余弦距离等，因此，图像样本的身份损失信息可以如公式（6）所示：

其中，L_id为身份损失信息，N为训练集中的图像样本的数量，

为图像样本的特征与第j类中心特征向量的夹角，K为身份标签的数量，yi为第i个图像样本的原始身份标签，s 和m分别表示scale和margin超参数，该超参数可以根据实际应用来设定，比如，可以分别为 64和0.5，或者其他数值。

其中，确定群体损失信息的方式也可以有多种，比如，可以采用交叉嫡损失函数根据原始类型标签和预测类型标签来确定群体损失信息，或者，还可以采用其他损失函数根据原始类型标签和预测类型标签来确定群体损失信息，等等。

在确定身份损失信息和群体损失信息之后，便可以将身份损失信息和群体损失信息进行融合，融合的方式可以有多种，比如，可以直接将身份损失信息和群体损失信息相加，得到融合后损失信息，具体可以如公式（7）所示：

Loss=L_r+L_id（7）

其中，Loss为融合后损失信息，L_r为群体损失信息，L_id为身份损失信息。

采用融合后损失信息对预设识别模型进行收敛，得到训练后识别模型，收敛的方式可以有多种，比如，可以采用梯段下降算法根据融合后损失信息对预设识别模型的修正子模型和识别网络的参数进行更新，以收敛预设识别模型，得到训练后识别模型，或者，还可以采用其他收敛算法对预设识别模型的修正子模型和识别网络的参数进行更新，以收敛预设识别模型，得到训练后识别模型。

其中，对预设识别模型的训练过程和使用过程最大的区别在于，对预设识别模型进行训练时，需要输出预测身份标签和预测类型标签，通过预测身份标签和预测类型标签对预设识别模型进行收敛，具体可以如图6所示，而在训练后识别模型的使用过程中，需要输出身份信息即可。

在预设识别模型的训练通过对类型特征进行不断修正，消除群体特征中包含的身份信息，可以提高群体分类的精度，可以提高分类的精度，同时可以有效的降低不同群体之间的识别方差，使得识别模型具有更好的公平性。

可选的，在一实施例中，该图像识别还包括将待识别对象的身份信息存储至区块链上。

由以上可知，本申请实施例在获取待识别图像后，对待识别图像进行特征提取，得到待识别对象的身份特征和群体特征，然后，在身份特征中识别出与群体特征关联的特征，得到群体关联特征，并在群体特征中识别出与身份特征关联的特征，得到身份关联特征，然后，根据群体关联特征和身份关联特征，对身份特征和群体特征进行修正，然后，基于修正后身份特征和修正后群体特征，确定所述待识别对象的身份信息；由于该方案不仅提取出身份特征和群体特征，而且还可以通过识别出身份关联特征和群体关联特征对身份特征和群体特征进行修正，从而得到更加精准的身份特征和群体特征，并通过群体特征进行辅助识别，因此，可以大大提升不同类型的图像识别的准确率。

根据上面实施例所描述的方法，以下将举例作进一步详细说明。

在本实施例中，将以该图像识别装置具体集成在电子设备，电子设备为服务器待识别图像为待识别人脸图像为例进行说明。

（一）服务器训练识别模型

（1）服务器获取至少一个人脸图像样本。

例如，服务器可以直接获取人脸图像样本，或者，还可以获取原始图像，并将原始图像发送至标注服务器进行标注，接收标注服务器返回的标注后的原始图像，得到人脸图像样本。

可选的，服务器在接收到标注后的原始图像之后，还可以对原始图像的尺寸或者像素进行调整，得到人脸图像样本。

（2）服务器采用预设识别模型对人脸图像样本中对象的身份和类型进行预测，得到预测标签。

例如，服务器采用预设识别模型对人脸图像样本进行特征提取，得到对象的样本身份特征和样本群体特征，在样本身份特征中识别出与样本群体关联的特征，得到样本群体关联特征，并在样本身份特征中识别出与样本身份特征关联的特征，得到样本身份关联特征，根据样本群体关联特征和样本身份关联特征，对样本身份特征和样本群体特征进行修正，基于修正后样本身份特征和修正后样本群体特征，对人脸图像样本中对象的身份和类型进行预测，得到预测标签。

（3）服务器根据预测标签和标注标签对预设识别模型进行收敛，得到训练后识别模型。

例如，服务器获取原始类型标签对应的目标身份特征，并计算人脸图像样本的身份特征与目标身份特征之间的特征差值，计算原始身份标签与预测身份标签之间的标签差值，并将特征差值和标签差值进行融合，得到融合后差值，根据人脸图像样本的数量，计算融合后差值的均值，得到人脸图像样本的身份损失信息，具体可以如公式（6）所示。

服务器还可以采用交叉嫡损失函数根据原始类型标签和预测类型标签来确定群体损失信息，或者，还可以采用其他损失函数根据原始类型标签和预测类型标签来确定群体损失信息，等等。

服务器可以直接将身份损失信息和群体损失信息相加，得到融合后损失信息，然后，采用梯段下降算法根据融合后损失信息对预设识别模型的修正子模型和识别网络的参数进行更新，以收敛预设识别模型，得到训练后识别模型，或者，还可以采用其他收敛算法对预设识别模型的修正子模型和识别网络的参数进行更新，以收敛预设识别模型，得到训练后识别模型。

（二）采用训练后识别模型对待识别人脸图像进行识别

其中，训练后识别模型包括识别网络和多个修正子模型，其中修正子模型可以包括身份特征提取网络、群体特征提取网络和注意力网络等。

如图7所示，一种图像识别方法，具体流程如下：

201、服务器获取待识别人脸图像。

例如，服务器可以直接接收用户通过终端上传的待识别人脸图像，或者，可以在网络上获取包含待识别对象的图像作为待识别人脸图像，或者，还可以在图像数据库中提取出候选图像，对候选图像进行检测，将包含待识别对象的图像作为待识别人脸图像。

当待识别人脸图像的内存较大或者数量较多是，服务器可以接收终端发送的图像识别请求，其中，该图像识别请求可以包括用户或者内容服务商存储待识别人脸图像的存储地址，然后，服务器在图像识别请求中提取出存储地址，根据该存储地址，在内存、缓存或者第三方数据库中获取待识别人脸图像。当成功获取到该待识别人脸图像之后，服务器还可以向终端发送提示信息，以提示终端当前已成功获取待识别人脸图像。

202、服务器对待识别人脸图像进行特征提取，得到待识别对象的身份特征和群体特征。

例如，服务器可以采用训练后识别模型的身份特征提取网络提取出待识别对象的身份特征，采用训练后识别模型的群体特征提取网络提取出待识别对象的群体特征，具体可以如下：

（1）服务器采用训练后识别模型的身份特征提取网络提取出待识别对象的身份特征。

例如，服务器采用IR34残差网络作为身份特征提取网络对待识别人脸图像进行特征提取，得到待识别人脸图像的身份特征。

（2）服务器采用训练后识别模型的群体特征提取网络，对待识别人脸图像进行特征提取，得到待识别人脸图像的群体特征。

例如，服务器采用IR18残差网络作为群体特征提取网络对待识别人脸图像进行特征提取，得到待识别人脸图像的群体特征。

203、服务器获取身份特征和群体特征在待识别人脸图像中的位置信息，以得到身份特征对应的身份位置特征和群体特征对应的群体位置特征。

例如，服务器可以获取身份特征和群体特征在待识别人脸图像中的位置信息，得到身份特征对应的身份位置信息和群体特征对应的群体位置信息，根据身份位置信息，对待识别人脸图像中的像素进行位置编码，得到身份位置特征，基于群体位置信息，对待识别人脸图像中的像素进行位置编码，得到群体特征对应的群体位置特征，具体可以如下：

（1）服务器获取身份特征和群体特征在待识别人脸图像中的位置信息，得到身份特征对应的身份位置信息和群体特征对应的群体位置信息。

例如，服务器在身份特征中提取出身份特征信息，在待识别人脸图像的像素集合中筛选出身份特征信息对应的像素，在群体特征中提取出群体特征信息，在待识别人脸图像的像素集合中筛选出群体特征信息对应的像素，获取该像素在待识别人脸图像中的位置，从而就可以得到身份特征对应的身份位置信息和群体特征对应的群体位置信息。

（2）服务器根据身份位置信息，对待识别人脸图像中的像素进行位置编码，得到身份特征对应的身份位置特征。

例如，服务器可以直接对身份位置信息进行独热编码，并将得到编码添加至身份特征中，从而得到身份特征对应的身份位置特征，或者，还可以在每个身份位置信息的偶数位置添加sin变量，奇数位置添加cos变量，以此来填满整个位置矩阵，然后，将位置矩阵与身份特征进行融合，得到身份特征对应的身份位置特征。

（3）服务器根据群体位置信息，对待识别人脸图像中的像素进行位置编码，得到群体特征对应的群体位置特征。

例如，服务器可以直接对群体位置信息进行独热编码，并将得到编码添加至群体特征中，从而得到群体特征对应的群体位置特征，或者，还可以在每个群体位置信息的偶数位置添加sin变量，奇数位置添加cos变量，以此来填满整个位置矩阵，然后，将位置矩阵与群体特征进行融合，得到群体特征对应的群体位置特征。

204、服务器根据身份位置特征，在身份特征中识别出与群体特征关联的特征，得到群体关联特征。

例如，服务器采用1*1卷积层分别对身份特征进行卷积处理，得到第一查询特征和第一值特征，采用卷积层对群体特征进行卷积处理，得到第一键特征。获取身份特征的特征通道数量，将第一查询特征与第一键特征进行融合，得到初始交互特征，计算初始交互特征与特征通道数量的比值，得到第一交互特征，其中融合的过程可以为采用矩阵乘法将第一查询特征对应的查询矩阵与第一键特征对应的键矩阵进行矩阵乘法，并将矩阵乘法得到的乘积除以特征通道数量，就可以得到第一交互特征，具体可以如公式（1）所示。

在得到第一交互特征之后，可以将第一交互特征与身份位置特征相加，或者，还可以将第一交互特征与身份位置特征进行特征拼接，从而得到融合后特征，采用softmax函数对融合后特征进行归一化处理，从而得到待识别人脸图像的像素间的注意力得分S，将注意力得分S作为每个像素中的身份特征中与群体特征关联的关联权重，该关联权重用于指示身份特征中的特征与群体特征的关联关系，将关联权重与第一值特征对应的值矩阵做矩阵乘法，得到群体关联特征，这里的群体关联特征为注意力网络的输出，输出的群体关联特征可以为一个新的特征图，具体可以如公式（3）所示。

205、服务器基于群体位置特征，在群体特征中识别出与身份特征关联的特征，得到身份关联特征。

例如，服务器可以在群体特征中提取出用于特征交互的群体特征，得到第二查询特征和第二值特征，在身份特征中提取出用于特征交互的身份特征，得到第二键特征，将第二查询特征与第二键特征进行特征交互，得到第二交互特征，并将第二交互特征、群体位置特征和第二值特征进行融合，得到身份关联特征。其中，得到身份关联特征的过程也可以通过注意力网络进行特征交互而来，具体的过程可以参见群体关联特征的过程，再此就不再一一赘述。

206、服务器根据群体关联特征和身份关联特征，对身份特征和群体特征进行修正。

例如，服务器可以获取群体关联特征对应的消除权重，根据消除权重，对群体关联特征进行加权，将加权后群体关联特征作为身份特征中需要消除的身份特征，得到目标身份特征。在筛选出目标身份特征之后，便可以在身份特征中删除该目标身份特征，从而得到修正后身份特征，具体可以如公式（4）所示。

服务器根据身份关联特征，在群体特征中筛选出需要消除的群体身份特征，得到目标群体特征，具体过程可以参见目标身份特征的筛选，在此就不再一一赘述。在筛选出目标群体特征之后，便可以在群体特征中筛选出该目标群体特征，从而得到修正后群体特征，具体可以如公式（5）所示。

207、服务器基于修正后身份特征和修正后群体特征，确定待识别对象的身份信息。

例如，服务器可以对修正后身份特征和修正后群体特征进行特征提取，并采用训练后识别模型的注意力网络将提取到的身份特征和群体特征进行特征交互，以识别身份特征中与群体特征关联的特征和群体特征中与身份特征关联的特征，就可以对提取到的身份特征和群体特征进行修正。返回执行对修正后身份特征和修正后群体特征进行特征提取的步骤，直至身份特征的修正次数达到预设次数，得到目标修正后身份特征，然后，通过识别网络将目标修正后身份特征与预设的候选用户的身份特征进行对比，对比的方式可以为计算目标修正后身份特征与预先采集的候选用户的身份特征的内积，当内积结果超过预设阈值时，就可以确定该用户为候选用户，进而得到用户的身份信息，或者，还可以通过分类器对目标修正后身份特征进行分类，从而得到候选身份信息对应的分类概率，根据分类概率，在候选身份信息中筛选出待识别对象的身份信息。

由以上可知，本实施例的服务器在获取待识别人脸图像后，对待识别人脸图像进行特征提取，得到待识别对象的身份特征和群体特征，然后，在身份特征中识别出与群体特征关联的特征，得到群体关联特征，并在群体特征中识别出与身份特征关联的特征，得到身份关联特征，然后，根据群体关联特征和身份关联特征，对身份特征和群体特征进行修正，然后，基于修正后身份特征和修正后群体特征，确定所述待识别对象的身份信息；由于该方案不仅提取出身份特征和群体特征，而且还可以通过识别出身份关联特征和群体关联特征对身份特征和群体特征进行修正，从而得到更加精准的身份特征和群体特征，并通过群体特征进行辅助识别，因此，可以大大提升不同类型的图像识别的准确率。

为了更好地实施以上方法，本发明实施例还提供一种图像识别装置，该图像识别装置可以集成在电子设备，比如服务器或终端等设备中，该终端可以包括平板电脑、笔记本电脑和/或个人计算机等。

例如，如图8所示，该图像识别装置可以包括获取单元301、提取单元302、识别单元303、修正单元304和确定单元305，如下：

（1）获取单元301；

获取单元301，用于获取待识别图像，该待识别图像包括至少一个待识别对象。

例如，获取单元301，具体可以用于直接接收用户通过终端上传的待识别图像，或者，可以在网络上获取包含待识别对象的图像作为待识别图像，或者，还可以在图像数据库中提取出候选图像，对候选图像进行检测，将包含待识别对象的图像作为待识别图像；当待识别图像的内存较大或者数量较多是，图像识别装置可以接收终端发送的图像识别请求，其中，该图像识别请求可以包括用户或者内容服务商存储待识别图像的存储地址，然后，图像识别装置在图像识别请求中提取出存储地址，根据该存储地址，在内存、缓存或者第三方数据库中获取待识别图像。

（2）提取单元302；

提取单元302，用于对待识别图像进行特征提取，得到待识别对象的身份特征和群体特征，该群体特征用于指示待识别对象的类型。

例如，提取单元302，具体可以用于采用卷积神经网络作为训练后识别模型的身份特征提取网络，对待识别图像进行特征提取，得到待识别图像的身份特征，并采用卷积神经网络作为训练后识别模型的群体特征提取网络对待识别图像进行特征提取，得到待识别图像的身份特征。

（3）识别单元303；

识别单元303，用于在身份特征中识别出与群体特征关联的特征，得到群体关联特征，并在群体特征中识别出与身份特征关联的特征，得到身份关联特征。

例如，识别单元303，具体可以用于获取身份特征和群体特征在待识别图像中的位置信息，以得到身份特征对应的身份位置特征和群体特征对应的群体位置特征，根据身份位置特征，在身份特征中识别出与群体特征关联的特征，得到群体关联特征，基于群体位置特征，在群体特征中识别出与身份特征关联的特征，得到身份关联特征。

（4）修正单元304；

修正单元304，用于根据群体关联特征和身份关联特征，对身份特征和群体特征进行修正。

例如，修正单元304，具体可以用于根据群体关联特征，在身份特征中筛选出需要消除的身份特征，得到目标身份特征，基于身份关联特征，在群体特征中筛选出需要消除的群体特征，得到目标群体特征，在身份特征中删除目标身份特征，得到修正后身份特征，并在群体特征中删除目标群体特征，得到修正后群体特征。

（5）确定单元305；

确定单元305，用于基于修正后身份特征和修正后群体特征，确定待识别对象的身份信息。

例如，确定单元305，具体可以用于对修正后身份特征和修正后群体特征进行特征提取，并对提取到的身份特征和群体特征进行修正，返回执行对修正后身份特征和修正后群体特征进行特征提取的步骤，直至身份特征的修正次数达到预设次数，得到目标修正后身份特征，采用训练后识别模型对目标修正后身份特征进行识别，得到待识别对象的身份信息。

可选的，图像识别装置还可以包括训练单元306，可以如图9所示，具体可以如下：

训练单元306，用于对预设识别模型进行训练，得到训练后识别模型。

例如，训练单元306，具体可以用于获取至少一个图像样本，该图像样本包括标注标签的对象，采用预设识模型对图像样本中对象的身份和类型进行预测，得到预测标签，根据预测标签和标注标签对预设识别模型进行收敛，得到训练后识别模型。

具体实施时，以上各个单元可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元的具体实施可参见前面的方法实施例，在此不再赘述。

由以上可知，本实施例在获取单元301获取待识别图像后，提取单元302对待识别图像进行特征提取，得到待识别对象的身份特征和群体特征，然后，识别单元303在身份特征中识别出与群体特征关联的特征，得到群体关联特征，并在群体特征中识别出与身份特征关联的特征，得到身份关联特征，然后修正单元304，根据群体关联特征和身份关联特征，对身份特征和群体特征进行修正，然后，确定单元305基于修正后身份特征和修正后群体特征，确定所述待识别对象的身份信息；由于该方案不仅提取出身份特征和群体特征，而且还可以通过识别出身份关联特征和群体关联特征对身份特征和群体特征进行修正，从而得到更加精准的身份特征和群体特征，并通过群体特征进行辅助识别，因此，可以大大提升不同类型的图像识别的准确率。

本发明实施例还提供一种电子设备，如图10所示，其示出了本发明实施例所涉及的电子设备的结构示意图，具体来讲：

该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解，图10中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器401是该电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。可选的，处理器401可包括一个或多个处理核心；优选的，处理器401可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块，处理器401通过运行存储在存储器402的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如声音播放功能、图像播放功能等）等；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器402还可以包括存储器控制器，以提供处理器401对存储器402的访问。

电子设备还包括给各个部件供电的电源403，优选的，电源403可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该电子设备还可包括输入单元404，该输入单元404可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，电子设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，电子设备中的处理器401会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中，并由处理器401来运行存储在存储器402中的应用程序，从而实现各种功能，如下：

例如，电子设备直接接收用户通过终端上传的待识别图像，或者，可以在网络上获取包含待识别对象的图像作为待识别图像，或者，还可以在图像数据库中提取出候选图像，对候选图像进行检测，将包含待识别对象的图像作为待识别图像；当待识别图像的内存较大或者数量较多是，图像识别装置可以接收终端发送的图像识别请求，其中，该图像识别请求可以包括用户或者内容服务商存储待识别图像的存储地址，然后，图像识别装置在图像识别请求中提取出存储地址，根据该存储地址，在内存、缓存或者第三方数据库中获取待识别图像。

电子设备采用卷积神经网络作为训练后识别模型的身份特征提取网络，对待识别图像进行特征提取，得到待识别图像的身份特征，并采用卷积神经网络作为训练后识别模型的群体特征提取网络对待识别图像进行特征提取，得到待识别图像的身份特征。获取身份特征和群体特征在待识别图像中的位置信息，以得到身份特征对应的身份位置特征和群体特征对应的群体位置特征，根据身份位置特征，在身份特征中识别出与群体特征关联的特征，得到群体关联特征，基于群体位置特征，在群体特征中识别出与身份特征关联的特征，得到身份关联特征。

电子设备根据群体关联特征，在身份特征中筛选出需要消除的身份特征，得到目标身份特征，基于身份关联特征，在群体特征中筛选出需要消除的群体特征，得到目标群体特征，在身份特征中删除目标身份特征，得到修正后身份特征，并在群体特征中删除目标群体特征，得到修正后群体特征。对修正后身份特征和修正后群体特征进行特征提取，并对提取到的身份特征和群体特征进行修正，返回执行对修正后身份特征和修正后群体特征进行特征提取的步骤，直至身份特征的修正次数达到预设次数，得到目标修正后身份特征，采用训练后识别模型对目标修正后身份特征进行识别，得到待识别对象的身份信息。

以上各个操作的具体实施可参见前面的实施例，在此不作赘述。

由以上可知，本发明实施例在获取待识别图像后，对待识别图像进行特征提取，得到待识别对象的身份特征和群体特征，然后，在身份特征中识别出与群体特征关联的特征，得到群体关联特征，并在群体特征中识别出与身份特征关联的特征，得到身份关联特征，然后，根据群体关联特征和身份关联特征，对身份特征和群体特征进行修正，然后，基于修正后身份特征和修正后群体特征，确定所述待识别对象的身份信息；由于该方案不仅提取出身份特征和群体特征，而且还可以通过识别出身份关联特征和群体关联特征对身份特征和群体特征进行修正，从而得到更加精准的身份特征和群体特征，并通过群体特征进行辅助识别，因此，可以大大提升不同类型的图像识别的准确率。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本发明实施例提供一种计算机可读存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本发明实施例所提供的任一种图像识别方法中的步骤。例如，该指令可以执行如下步骤：

例如，可以直接接收用户通过终端上传的待识别图像，或者，可以在网络上获取包含待识别对象的图像作为待识别图像，或者，还可以在图像数据库中提取出候选图像，对候选图像进行检测，将包含待识别对象的图像作为待识别图像；当待识别图像的内存较大或者数量较多是，图像识别装置可以接收终端发送的图像识别请求，其中，该图像识别请求可以包括用户或者内容服务商存储待识别图像的存储地址，然后，图像识别装置在图像识别请求中提取出存储地址，根据该存储地址，在内存、缓存或者第三方数据库中获取待识别图像。

采用卷积神经网络作为训练后识别模型的身份特征提取网络，对待识别图像进行特征提取，得到待识别图像的身份特征，并采用卷积神经网络作为训练后识别模型的群体特征提取网络对待识别图像进行特征提取，得到待识别图像的身份特征。获取身份特征和群体特征在待识别图像中的位置信息，以得到身份特征对应的身份位置特征和群体特征对应的群体位置特征，根据身份位置特征，在身份特征中识别出与群体特征关联的特征，得到群体关联特征，基于群体位置特征，在群体特征中识别出与身份特征关联的特征，得到身份关联特征。

根据群体关联特征，在身份特征中筛选出需要消除的身份特征，得到目标身份特征，基于身份关联特征，在群体特征中筛选出需要消除的群体特征，得到目标群体特征，在身份特征中删除目标身份特征，得到修正后身份特征，并在群体特征中删除目标群体特征，得到修正后群体特征。对修正后身份特征和修正后群体特征进行特征提取，并对提取到的身份特征和群体特征进行修正，返回执行对修正后身份特征和修正后群体特征进行特征提取的步骤，直至身份特征的修正次数达到预设次数，得到目标修正后身份特征，采用训练后识别模型对目标修正后身份特征进行识别，得到待识别对象的身份信息。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

其中，该计算机可读存储介质可以包括：只读存储器（ROM，Read Only Memory）、随机存取记忆体（RAM，Random Access Memory）、磁盘或光盘等。

由于该计算机可读存储介质中所存储的指令，可以执行本发明实施例所提供的任一种图像识别方法中的步骤，因此，可以实现本发明实施例所提供的任一种图像识别方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

其中，根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述图像识别方面或者人脸识别方面的各种可选实现方式中提供的方法。

以上对本发明实施例所提供的一种图像识别方法、装置、电子设备和计算机可读存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种图像识别方法，其特征在于，包括：

2.根据权利要求1所述的图像识别方法，其特征在于，所述在所述身份特征中识别出与所述群体特征关联的特征，得到群体关联特征，并在所述群体特征中识别出与所述身份特征关联的特征，得到身份关联特征，包括：

获取所述身份特征和群体特征在所述待识别图像中的位置信息，以得到所述身份特征对应的身份位置特征和所述群体特征对应的群体位置特征；

根据所述身份位置特征，在所述身份特征中识别出与所述群体特征关联的特征，得到群体关联特征；

基于所述群体位置特征，在所述群体特征中识别出与所述身份特征关联的特征，得到身份关联特征。

3.根据权利要求2所述的图像识别方法，其特征在于，所述获取所述身份特征和群体特征在所述待识别图像中的位置信息，以得到所述身份特征对应的身份位置特征和所述群体特征对应的群体位置特征，包括：

获取所述身份特征和群体特征在所述待识别图像中的位置信息，得到所述身份特征对应的身份位置信息和所述群体特征对应的群体位置信息；

根据所述身份位置信息，对所述待识别图像中的像素进行位置编码，得到所述身份特征对应的身份位置特征；

基于所述群体位置信息，对所述待识别图像中的像素进行位置编码，得到所述群体特征对应的群体位置特征。

4.根据权利要求2所述的图像识别方法，其特征在于，所述根据所述身份位置特征，在所述身份特征中识别出与所述群体特征关联的特征，得到群体关联特征，包括：

在所述身份特征中提取出用于特征交互的身份特征，得到第一查询特征和第一值特征；

在所述群体特征中提取出用于特征交互的群体特征，得到第一键特征；

将所述第一查询特征与第一键特征进行特征交互，得到第一交互特征，并将所述第一交互特征、所述身份位置特征和第一值特征进行融合，得到群体关联特征。

5.根据权利要求4所述的图像识别方法，其特征在于，所述将所述第一查询特征与第一键特征进行特征交互，得到第一交互特征，包括：

获取所述身份特征的特征通道数量；

将所述第一查询特征与第一键特征进行融合，得到初始交互特征；

计算所述初始交互特征与所述特征通道数量的比值，得到所述第一交互特征。

6.根据权利要求4所述的图像识别方法，其特征在于，所述将所述第一交互特征、所述身份位置特征和第一值特征进行融合，得到群体关联特征，包括：

将所述第一交互特征与所述身份位置特征进行融合，得到融合后特征；

对所述融合后特征进行归一化处理，得到关联权重，所述关联权重用于指示所述身份特征中的特征与所述群体特征的关联关系；

根据所述关联权重，对所述第一值特征进行加权，得到所述群体关联特征。

7.根据权利要求2所述的图像识别方法，其特征在于，所述基于所述群体位置特征，在所述群体特征中识别出与所述身份特征关联的特征，得到身份关联特征，包括：

在所述群体特征中提取出用于特征交互的群体特征，得到第二查询特征和第二值特征；

在所述身份特征中提取出用于特征交互的身份特征，得到第二键特征；

将所述第二查询特征与第二键特征进行特征交互，得到第二交互特征，并将所述第二交互特征、群体位置特征和第二值特征进行融合，得到身份关联特征。

8.根据权利要求1至7任一项所述的图像识别方法，其特征在于，所述根据所述群体关联特征和身份关联特征，对所述身份特征和群体特征进行修正，包括：

根据所述群体关联特征，在所述身份特征中筛选出需要消除的身份特征，得到目标身份特征；

基于所述身份关联特征，在所述群体特征中筛选出需要消除的群体特征，得到目标群体特征；

在所述身份特征中删除所述目标身份特征，得到修正后身份特征，并在所述群体特征中删除所述目标群体特征，得到修正后群体特征。

9.根据权利要求8所述的图像识别方法，其特征在于，所述根据所述群体关联特征，在所述身份特征中筛选出需要消除的身份特征，得到目标身份特征，包括：

获取所述群体关联特征对应的消除权重；

根据所述消除权重，对所述群体关联特征进行加权，将加权后群体关联特征作为所述身份特征中需要消除的身份特征，得到目标身份特征。

10.根据权利要求1至7任一项所述的图像识别方法，其特征在于，所述基于修正后身份特征和修正后群体特征，确定所述待识别对象的身份信息，包括：

对所述修正后身份特征和修正后群体特征进行特征提取，并对提取到的身份特征和群体特征进行修正；

返回执行所述对所述修正后身份特征和修正后群体特征进行特征提取的步骤，直至所述身份特征的修正次数达到预设次数，得到目标修正后身份特征；

采用训练后识别模型对所述目标修正后身份特征进行识别，得到所述待识别对象的身份信息。

11.根据权利要求10所述的图像识别方法，其特征在于，所述采用训练后识别模型对所述目标修正后身份特征进行识别，得到所述待识别对象的身份信息之前，还包括：

获取至少一个图像样本，所述图像样本包括标注标签的对象；

采用预设识别模型对所述图像样本中对象的身份和类型进行预测，得到预测标签；

根据所述预测标签和标注标签对所述预设识别模型进行收敛，得到所述训练后识别模型。

12.根据权利要求11所述的图像识别方法，其特征在于，所述标注标签包括原始身份标签和原始类型标签，所述预测标签包括预测身份标签和预测类型标签，所述根据所述预测标签和标注标签对所述预设识别模型进行收敛，得到所述训练后识别模型，包括：

根据所述原始身份标签和预测身份标签，确定所述图像样本的身份损失信息；

基于所述原始类型标签和预测类型标签，确定所述图像样本的群体损失信息；

将所述身份损失信息和群体损失信息进行融合，并采用融合后损失信息对所述预设识别模型进行收敛，得到所述训练后识别模型。

13.根据权利要求12所述的图像识别方法，其特征在于，所述根据所述原始身份标签和预测身份标签，确定所述图像样本的身份损失信息，包括：

获取所述原始类型标签对应的目标身份特征，并计算所述图像样本的身份特征与所述目标身份特征之间的特征差值；

计算所述原始身份标签与预测身份标签之间的标签差值，并将所述特征差值和标签差值进行融合，得到融合后差值；

根据所述图像样本的数量，计算所述融合后差值的均值，得到所述图像样本的身份损失信息。

14.一种图像识别装置，其特征在于，包括：

15.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有应用程序，所述处理器用于运行所述存储器内的应用程序，以执行权利要求1至13任一项所述的图像识别方法中的步骤。

16.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至13任一项所述的图像识别方法中的步骤。