CN111652331A

CN111652331A - 一种图像识别方法、装置和计算机可读存储介质

Info

Publication number: CN111652331A
Application number: CN202010775335.6A
Authority: CN
Inventors: 蔺越檀; 蒋仕彪; 陈超; 王文全; 沈鹏程; 李绍欣; 李季檩; 黄飞跃; 吴永坚
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-08-05
Filing date: 2020-08-05
Publication date: 2020-09-11
Anticipated expiration: 2040-08-05
Also published as: CN111652331B

Abstract

本发明实施例公开了一种图像识别方法、装置和计算机可读存储介质；本发明实施例在获取待识别图像对和待识别图像对的时空信息后，该待识别图像对包括第一对象图像和第二对象图像，对待识别图像对中的图像进行多维度特征提取，得到图像特征对，并计算图像特征对中的图像特征的相似度，基于时空信息，确定第一对象图像和第二对象图像之间的时空关联信息，根据时空关联信息，确定第一对象图像和第二对象图像属于同一对象的先验概率，对相似度和先验概率进行融合，得到第一对象图像与第二对象图像属于同一对象的目标概率，基于目标概率，对第一对象图像和第二对象图像中对象的同一性进行识别，得到图像识别结果；该方案可以提升图像识别的准确率。

Description

一种图像识别方法、装置和计算机可读存储介质

技术领域

本发明涉及通信技术领域，具体涉及一种图像识别方法、装置和计算机可读存储介质。

背景技术

近年来，随着互联网技术的飞速发展，图像识别技术也有了长足的进步。为了提升图像识别的准确性，往往可以将多维度的图像特征进行融合来识别。现有的特征融合的图像识别方法主要通过计算图像特征的相似度，再结合人工给定的先验概率来进行概率融合得到图像识别结果。

在对现有技术的研究和实践过程中，本发明的发明人发现人工给定的先验概率精度不足，而且对于任何样本都采用相同的先验概率，从而使得图像识别的准确率大大降低。

发明内容

本发明实施例提供一种图像识别方法、装置和计算机可读存储介质。可以提高图像识别的准确率。

一种图像识别方法，包括：

获取待识别图像对和所述待识别图像对的时空信息，所述待识别图像对包括第一对象图像和第二对象图像，所述时空信息指示所述待识别图像对的位置信息和时间信息；

对所述待识别图像对中的图像进行多维度特征提取，得到图像特征对，并计算所述图像特征对中的多维度图像特征的相似度，所述图像特征对包括第一对象的多维度图像特征和第二对象的多维度图像特征；

基于所述时空信息，确定所述第一对象图像和第二对象图像之间的时空关联信息；

根据所述时空关联信息，确定所述第一对象图像和第二对象图像属于同一对象的先验概率；

对所述相似度和先验概率进行融合，得到所述第一对象图像与第二对象图像属于同一对象的目标概率；

基于所述目标概率，对所述第一对象图像和第二对象图像中对象的同一性进行识别，得到图像识别结果。

相应的，本发明实施例提供一种图像识别装置，包括：

获取单元，用于获取待识别图像对和所述待识别图像对的时空信息，所述待识别图像对包括第一对象图像和第二对象图像，所述时空信息指示所述待识别图像对的位置信息和时间信息；

提取单元，用于对所述待识别图像对中的图像进行多维度特征提取，得到图像特征对，并计算所述图像特征对中的多维度图像特征的相似度，所述图像特征对包括第一对象的多维度图像特征和第二对象的多维度图像特征；

第一确定单元，用于基于所述时空信息，确定所述第一对象图像和第二对象图像之间的时空关联信息；

第二确定单元，用于根据所述时空关联信息，确定所述第一对象图像和第二对象图像属于同一对象的先验概率；

融合单元，用于对所述相似度和先验概率进行融合，得到所述第一对象图像与第二对象图像属于同一对象的目标概率；

识别单元，用于基于所述目标概率，对所述第一对象图像和第二对象图像中对象的同一性进行识别，得到图像识别结果。

可选的，在一些实施例中，所述第一确定单元，具体可以用于在所述时空信息中提取出所述第一对象图像和第二对象的位置信息和时间信息；根据所述位置信息和时间信息，确定所述第一对象图像和第二对象图像之间的时间距离和空间位置关系；基于所述时间距离和空间位置关系，构建所述第一对象图像和第二对象图像之间的时空关联信息。

可选的，在一些实施例中，所述第二确定单元，具体可以用于获取用于预测同一对象的先验概率集合，所述先验概率集合包括多个候选时空关联信息对应的候选先验概率；在所述先验概率集合中筛选出所述时空关联信息对应的目标先验概率，将所述目标先验概率作为所述第一对象图像和第二对象图像属于同一对象的先验概率。

可选的，在一些实施例中，所述第二确定单元，具体可以用于获取已标注对象身份的多个图像样本对和所述图像样本对的时空信息样本，所述图像样本对包括两个图像样本；根据所述时空信息样本，确定所述图像样本对的时空关联信息样本；基于所述对象身份，计算所述时空关联信息样本对应的图像样本属于同一对象的先验概率，得到先验概率集合。

可选的，在一些实施例中，所述融合单元，具体可以用于将所述脸部相似度转换为脸部概率密度，并将所述本体相似度转换为本体概率密度；对所述脸部概率密度、本体概率密度和先验概率进行融合，得到所述第一对象图像和第二对象图像属于同一对象的目标概率。

可选的，在一些实施例中，所述融合单元，具体可以用于获取预设相似度阈值集合和所述相似度阈值集合对应的累计密度；根据所述预设相似度阈值集合和累计密度，确定相似度与概率密度之间的映射关系；基于所述映射关系，对所述脸部相似度和本体相似度进行映射，得到脸部概率密度和本体概率密度。

可选的，在一些实施例中，所述融合单元，具体可以用于在所述预设相似度阈值集合中计算出各个相似度阈值之间的阈值差值；根据所述阈值差值和累计密度，确定所述相似度阈值与概率密度之间的映射关系。

可选的，在一些实施例中，所述融合单元，具体可以用于对所述本体概率密度和先验概率进行融合，得到所述第一对象图像和第二对象图像属于同一对象的初始概率，并将所述初始概率作为融合先验概率；将所述脸部概率密度和所述融合先验概率进行融合，得到所述第一对象图像和第二对象图像属于同一对象的目标概率。

可选的，在一些实施例中，所述识别单元，具体可以用于获取用于识别对象的同一性的预设概率阈值；将所述预设概率阈值与所述目标概率进行对比；当所述目标概率超过所述预设概率阈值时，确定所述第一对象图像和第二对象图像属于同一对象。

可选的，在一些实施例中，所述提取单元，具体可以用于在所述待识别图像对的图像中识别出对象的脸部区域和本体区域；根据所述脸部区域和本体区域，分别在所述第一对象图像和第二对象图像中提取出脸部图像和本体图像，得到脸部图像对和本体图像对；分别对脸部图像对和本体图像对中的图像进行特征提取，得到脸部特征对和本体特征对。

可选的，在一些实施例中，所述提取单元，具体可以用于在所述待识别图像对的图像中识别出对象的脸部区域；将所述脸部区域按照预设比例进行调整，得到所述对象的本体区域。

可选的，在一些实施例中，所述获取单元，具体可以用于获取待识别视频数据和所述待识别视频数据的属性信息；采集所述待识别视频数据中的画面帧，得到画面帧集合；在所述画面帧集合中筛选出第一对象图像和第二对象图像，得到待识别图像对；根据所述属性信息，确定所述待识别图像对的时空信息。

可选的，在一些实施例中，所述获取单元，具体可以用于对所述画面帧集合中的画面帧进行对象检测；当所述画面帧中检测到对象时，将所述画面帧作为候选待识别图像，得到候选待识别图像集合；在所述候选待识别图像集合中筛选出所述第一对象图像和第二对象图像，得到所述待识别图像对。

此外，本发明实施例还提供一种电子设备，包括处理器和存储器，所述存储器存储有应用程序，所述处理器用于运行所述存储器内的应用程序实现本发明实施例提供的图像识别方法。

此外，本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本发明实施例所提供的任一种图像识别方法中的步骤。

本发明实施例在获取待识别图像对和待识别图像对的时空信息后，该待识别图像对包括第一对象图像和第二对象图像，时空信息指示待识别图像对的位置信息和时间信息，对待识别图像对中的图像进行多维度特征提取，得到图像特征对，并计算图像特征对中的图像特征的相似度，该图像特征对包括第一对象的多维度图像特征和第二对象的多维度图像特征，基于时空信息，确定第一对象图像和第二对象图像之间的时空关联信息，根据时空关联信息，确定第一对象图像和第二对象图像属于同一对象的先验概率，对相似度和先验概率进行融合，得到第一对象图像与第二对象图像属于同一对象的目标概率，基于目标概率，对第一对象图像和第二对象图像中对象的同一性进行识别，得到图像识别结果；由于该方案通过获取待识别图像对的时空信息，确定第一对象图像和第二对象图像的时空关联信息，并基于时空关联信息得到第一对象图像和第二对象图像属于同一对象的先验概率，将时空信息与先验概率结合起来，使得先验概率的准确率大大增加，从而可以提升图像识别的准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的图像识别方法的场景示意图；

图2是本发明实施例提供的图像识别方法的流程示意图；

图3是本发明实施例提供的图像识别方法的另一流程示意图；

图4是本发明实施例提供的图像识别装置的结构示意图；

图5是本发明实施例提供的图像识别装置的第一确定单元的结构示意图；

图6是本发明实施例提供的图像识别装置的融合单元的结构示意图；

图7是本发明实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供一种图像识别方法、装置和计算机可读存储介质。其中，该图像识别装置可以集成在电子设备中，该电子设备可以是服务器，也可以是终端等设备。

其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务（Content Delivery Network，CDN）、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

其中，对图像进行识别属于计算机视觉技术(Computer Vision, CV)计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。

例如，参见图1，以图像识别装置集成在电子设备中为例，电子设备在获取待识别图像对和待识别图像对的时空信息后，该待识别图像对包括第一对象图像和第二对象图像，时空信息指示待识别图像对的位置信息和时间信息，然后，对待识别图像对中的图像进行多维度特征提取，得到图像特征对，并计算图像特征对中的图像特征的相似度，该图像特征对包括第一对象的多维度图像特征和第二对象的多维度图像特征，然后，基于时空信息，确定第一对象图像和第二对象图像之间的时空关联信息，根据时空关联信息，确定第一对象图像和第二对象图像属于同一对象的先验概率，对相似度和先验概率进行融合，得到第一对象图像与第二对象图像属于同一对象的目标概率，基于目标概率，对第一对象图像和第二对象图像中对象的同一性进行识别，得到图像识别结果。

其中，可以在服务器器中对待识别图像对中的图像进行多维度特征提取，还可以在云服务器中对相似度和先验概率进行融合，而云服务器中主要通过云存储来存储内容数据，云存储(cloud storage)是在云计算概念上延伸和发展出来的一个新的概念，分布式云存储系统 (以下简称存储系统）是指通过集群应用、网格技术以及分布存储文件系统等功能，将网络中大量各种不同类型的存储设备（存储设备也称之为存储节点）通过应用软件或应用接口集合起来协同工作，共同对外提供数据存储和业务访问功能的一个存储系统。

目前，存储系统的存储方法为：创建逻辑卷，在创建逻辑卷时，就为每个逻辑卷分配物理存储空间，该物理存储空间可能是某个存储设备或者某几个存储设备的磁盘组成。客户端在某一逻辑卷上存储数据，也就是将数据存储在文件系统上，文件系统将数据分成许多部分，每一部分是一个对象，对象不仅包含数据而且还包含数据标识（ID，ID entity)等额外的信息，文件系统将每个对象分别写入该逻辑卷的物理存储空间，且文件系统会记录每个对象的存储位置信息，从而当客户端请求访问数据时，文件系统能够根据每个对象的存储位置信息让客户端对数据进行访问。

存储系统为逻辑卷分配物理存储空间的过程，具体为：按照对存储于逻辑卷的对象的容量估量（该估量往往相对于实际要存储的对象的容量有很大余量）和独立冗余磁盘阵列（RAID，Redundant Array of Independent Disk)的组别，预先将物理存储空间划分成分条，一个逻辑卷可以理解为一个分条，从而为逻辑卷分配了物理存储空间。

以下分别进行详细说明。需要说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。

本实施例将从图像识别装置的角度进行描述，该图像识别装置具体可以集成在电子设备中，该电子设备可以是服务器，也可以是终端等设备；其中，该终端可以包括平板电脑、笔记本电脑、以及个人计算机（PC，Personal Computer）、可穿戴设备、虚拟现实设备或其他可以图像识别的智能设备等设备。

一种图像识别方法，包括：

获取待识别图像对和待识别图像对的时空信息，该待识别图像对包括第一对象图像和第二对象图像，时空信息指示待识别图像对的位置信息和时间信息，对待识别图像对中的图像进行多维度特征提取，得到图像特征对，并计算图像特征对中的图像特征的相似度，该图像特征对包括第一对象的多维度图像特征和第二对象的多维度图像特征，基于时空信息，确定第一对象图像和第二对象图像之间的时空关联信息，根据时空关联信息，确定第一对象图像和第二对象图像属于同一对象的先验概率，对相似度和先验概率进行融合，得到第一对象图像与第二对象图像属于同一对象的目标概率，基于目标概率，对第一对象图像和第二对象图像中对象的同一性进行识别，得到图像识别结果。

如图2所示，该图像识别方法的具体流程如下：

101、获取待识别图像对和待识别图像对的时空信息。

其中，待识别图像对包括第一对象图像和第二对象图像，对象图像可以理解为包含了对象的图像，譬如，对象可以为人、动物、建筑或机械设备等。时空信息用于指示待识别图像对的位置信息和时间信息，比如，可以包括待识别图像对中的图像的采集、识别、或下载的时间信息和位置信息。

例如，可以获取待识别视频数据和待识别视频数据的属性信息，采集待识别视频数据中的画面帧，得到画面帧集合，在画面帧集合中筛选出第一对象图像和第二对象图像，得到待识别图像对，根据属性信息，确定待识别图像对的时空信息。具体可以如下：

（1）获取待识别视频数据和待识别视频数据的属性信息。

其中，待识别视频数据的属性信息可以包括待识别视频数据的采集位置、视频时长和每一画面帧对应的采集时间等信息。

例如，可以获取多个视频采集装置采集的待识别视频数据，比如，可以从互联网上或者视频监控系统中获取到多个摄像头采集到的待识别视频数据。根据获取到的待识别视频数据中的内容，获取到待识别视频数据的属性信息，比如，采集或获取位置、视频总时长和画面帧对应的时间信息等信息。

（2）采集待识别视频数据中的画面帧，得到画面帧集合。

例如，可以在待识别视频数据中提取出画面帧，得到画面帧集合，比如，获取待识别视频数据的帧数，根据获取的帧数对待适配数据进行截图，得到画面帧集合。

（3）在画面帧集合中筛选出第一对象图像和第二对象图像，得到待识别图像对。

例如，对画面帧集合中的画面帧进行对象检测，比如，在画面帧集合中的每一画面帧上检测是否存在对象。当画面帧中检测到对象时，将画面帧作为待识别图像，得到候选待识别图像集合。在候选待识别图像集合中筛选出第一对象图像和第二对象图像，得到待识别图像对。

（4）根据属性信息，确定待识别图像对的时空信息。

例如，在属性信息中分别提取出第一对象图像和第二对象图像的时间信息和位置信息，将时间信息和位置信息作为待识别图像对的时空信息，比如，在属性信息中提取出第一对象图像和第二对象图像获取的时间和位置，将获取时间和位置作为时间信息和位置信息，将时间信息和位置信息作为待识别图像对中的图像的时空信息。

102、对待识别图像对中的图像进行多维度特征提取，得到图像特征对，并计算图像特征对中的多维度图像特征的相似度。

其中，图像特征对包括第一对象图像的多维度图像特征和第二对象图像的多维度图像特征。

例如，在待识别图像对的图像中识别出对象的脸部区域和本体区域，根据脸部区域和本体区域，分别在第一对象图像和第二对象图像中提取出脸部图像和本体图像，得到脸部图像对和本体图像对，分别对脸部图像对和本体图像对中的图像进行特征提取，得到脸部特征对和本体特征对，计算图像特征对中的多维度图像特征的相似度，具体可以如下：

（1）在待识别图像对的图像中识别出对象的脸部区域和本体区域。

其中，脸部区域可以为对象的脸部在待识别图像对的图像中区域，本体区域可以为对象本体在待识别图像对的图像中的区域，比如，可以为人体区域、动物本体或建筑物本体等区域。

例如，在待识别图像对的图像中识别出对象的脸部区域，比如，可以在待识别图像中识别出脸部边缘位置信息，根据脸部边缘位置信息，确定出脸部区域。将脸部区域按照预设比例进行调整，得到对象的本体区域，比如，可以按照固定比例将脸部区域向外扩大一定区域，将扩大的区域和/或脸部区域共同作为对象的本体区域。

（2）根据脸部区域和本体区域，分别在第一对象图像和第二对象图像中提取出脸部图像和本体图像，得到脸部图像对和本体图像对。

例如，根据脸部区域和本体区域，分别在第一对象图像和第二对象图像中提取出脸部图像和本体图像，比如，可以分别在第一对象图像和第二对象图像中截取出脸部区域的图像作为脸部图像，分别在第一对象图像和第二对象图像中截取出本体区域的图像作为本体图像，将第一对象图像和第二对象图像对应的脸部图像进行组合，得到脸部图像对，将第一对象图像和第二对象图像对应的本体图像进行组合，得到本体图像对。

（3）分别对脸部图像对和本体图像对中的图像进行特征提取，得到脸部特征对和本体特征对。

例如，可以分别对脸部图像对和本体图像对中的脸部图像和本体图像进行特征提取，比如，可以利用已经训练好的脸部和本体识别模型，分别在脸部图像对和本体图像对中的脸部图像和本体图像进行特征提取，得到脸部特征对和本体特征对，脸部特征对中包含第一对象图像对应的脸部图像的脸部特征和第二对象图像对应的脸部图像的脸部特征，本体特征对包括第一对象图像对应的本体图像的本体特征和第二对象图像对应的本体图像的本体特征。

（4）计算图像特征对中的多维度图像特征的相似度。

例如，可以分别计算脸部特征对中的脸部特征的脸部相似度和本体特征对中的本体特征的本体相似度，比如，可以计算脸部特征对中的脸部特征的余弦相似度，将脸部特征的余弦相似度作为脸部相似度，并计算本体特征对中本体特征的余弦相似度，将本体特征的余弦相似度作为本体相似度。

103、基于时空信息，确定第一对象图像和第二对象图像之间的时空关联信息。

其中，时空关联信息可以为两个图像在时空上存在关联的一些信息，比如，采集两张图像之间的时间距离或空间位置关系，这些都是将两个图像从时空上关联起来的信息。

例如，可以在时空信息中提取出第一对象图像和第二对象图像的位置信息和时间信息，比如，可以在时空信息中出提取出第一对象图像和第二对象图像被图像获取装置获取时的时间信息和位置信息。根据位置信息和时间信息，确定第一对象图像和第二对象图像之间的时空关联信息，比如，根据获取到的第一对象图像和第二对象图像获取时间之间的时间距离，譬如，第一对象图像是12:00获取的，第二对象图像是12:01获取的，将两个获取时间相减就可以得到第一对象图像和第二对象图像之间的时间距离为1分钟，还可以根据获取到的第一对象图像和第二对象图像的获取位置之间的空间位置关系，该空间位置关系可以为两个获取位置之间的空间距离或者空间的分层的位置关系等。基于时间距离和空间位置关系，构建第一对象图像和第二对象图像之间的时空关联信息，比如，可以根据时间距离和空间位置关系，构建时空信息二元组（pos，gap），其中pos为第一对象图像和第二对象图像的获取位置之间的空间位置关系，gap为第一对象图像和第二对象图像的获取位置之间的时间距离，还可以直接构建时空信息三元组（pos1，pos2，gap），其中，pos1为第一对象图像的获取位置或者采集第一对象图像的图像采集设备的编号等，pos2为第二对象图像的获取位置或者采集第二对象图像的图像采集设备的编号等，将时空信息二元组或时空信息三元组作为第一对象图像和第二对象图像之间的时空关联信息。

104、根据时空关联信息，确定第一对象图像和第二对象图像属于同一对象的先验概率。

其中，先验概率（prior probability）是指根据以往经验和分析得到的概率，如全概率公式，它往往作为"由因求果"问题中的"因"出现的概率。通常在在贝叶斯统计推断中进行应用，在贝叶斯统计推断中，不确定数量的先验概率分布是在考虑一些因素之前表达对这一数量的置信程度的概率分布。例如，先验概率分布可能代表在将来的选举中投票给特定政治家的选民相对比例的概率分布。未知的数量可以是模型的参数或者是潜在变量。

例如，获取用于预测同一对象的先验概率集合，该先验概率集合包括多个候选时空关联信息对应的候选先验概率，在先验概率集合中筛选出时空关联信息对应的目标先验概率，将目标先验概率作为第一对象图像和第二对象图像属于同一对象的先验概率，比如，以第一对象图像和第二对象图像之间的时空关联信息为A为例，就在获取到的同一对象的先验概率表中查表得到时空关联信息A对应的目标先验概率，将这个目标先验概率作为第一对象图像和第二对象图像属于同一对象的先验概率。

可选的，在获取到同一对象的先验概率集合之前，还可以利用获取到的已标注对象身份的图像样本和图像样本对应的时空信息样本来构建用于预测同一对象的先验概率集合，因此，在步骤“获取用于预测同一对象的先验概率集合”之前，图像识别方法，还可以包括：

获取已标注对象身份的多个图像样本对和图像样本对的时空信息样本，该图像样本对包括两个图像样本，根据时空信息样本，确定图像样本对的时空关联信息样本，基于对象身份，计算时空关联信息样本对应的图像样本属于同一对象的先验概率，得到先验概率集合。

例如，获取已标注对象身份的多个图像样本对和图像样本对的时空信息样本，比如，获取多个标注对象身份的图像样本对，标注的身份可以为某个特定的人物、动物或者其他对象，根据获取到的图像样本对，确定该图像样本对的时空信息样本，譬如，该图像样本对中的图像样本的获取时间和获取位置，将这些信息作为图像样本对的时空信息样本。根据时空信息样本，确定图像样本对的时空关联信息样本，比如，在时空信息样本中提取出图像样本的位置信息和时间信息，根据位置信息和时间信息，确定图像样本对中的图像样本之间的时间距离和空间位置关系，基于时间距离和空间位置关系，构建图像样本对中图像样板之间的时空关联信息。基于对象身份，计算时空关联信息样本对应的图像样本属于同一概率的先验概率，得到先概率集合，比如，对先验概率映射进行初始化，将时空关联信息样本输入至先验概率映射，根据每个图像样本标注的对象身份，计算每两个位置之间和每个时间距离区间段的先验概率，譬如，可以计算位置A和位置B在一个特定时间距离内图像样本中的对象属于同一身份的先验概率，还可以计算在两个固定的位置之间，不同的时间距离区间内图像样本中的对象属于同一对象的先验概率，得到先验概率集合。

105、对相似度和先验概率进行融合，得到第一对象图像和第二对象图像属于同一对象的目标概率。

其中，相似度可以包括脸部相似度和本体相似度。

例如，可以将脸部相似度转换为脸部概率密度，并将本体相似度转换为本体概率密度，对脸部概率密度、本体概率密度和先验概率密度进行融合，得到第一对象图像和第二对象图像属于同一对象的目标概率，具体可以如下：

S1、将脸部相似度转换为脸部概率密度，并将本体相似度转换为本体概率密度。

其中，概率指事件随机发生的机率，对于均匀分布函数，概率密度等于一段区间(事件的取值范围)的概率除以该段区间的长度，它的值是非负的，可以很大也可以很小。

例如，可以获取相似度阈值集合和相似度阈值集合对应的累计密度，比如，可以由给定模型针对一组固定的误识率（False Acceptance Rate, FAR），计算得到对应的相似度阈值和召回率（True Positive Rate, TPR），得到相似度阈值集合和相似度阈值集合对应的召回率，将FAR作为不同对象的累计密度，将TPR作为同一对象的累计密度。根据预设相似度阈值集合和累计密度，确定相似度与概率密度之间的映射关系，根据特定的相似度阈值t，确定同一对象的累计密度c_T与相似度阈值t之间的映射关系c_T(t)，同理，还可以确定不同对象的累计密度c_F与相似度阈值t之间的映射关系c_F(t)。在预设相似度阈值集合中计算出相邻的各个相似度阈值之间的阈值差值∆，利用各个相邻阈值的阈值差值对c_T(t)和c_F(t)近似求导，就可以得到同一对象和不同对象的概率密度函数f_T(t)和f_F(t)，即相似度和概率密度之间的映射关系，映射关系的公式（1）和（2）如下：

其中，∆ 取相邻阈值的差，t为相似度阈值，c_T (t)和c_F (t)分别为同一对象的累计密度函数和不同对象的累计密度函数；由于阈值是离散的，我们采用二次插值计算给定相似度下脸部和本体共同的概率密度。

基于映射关系，对脸部相似度和本体相似度进行映射，得到脸部概率密度和本体概率密度，比如，以脸部相似度为s_f，本体相似度为s_b为例，将脸部相似度为s_f，本体相似度为s_b输入至同一对象和不同对象的概率密度函数f_T(t)和f_F(t)中进行映射，得到脸部为同一对象的概率密度f_T(s_f)和脸部为不同对象的概率密度为f_F(s_f)，还可以得到本体为同一对象的概率密度f_T (s_b)和本体为不同对象的概率密度为f_F (s_b)。

S2、对脸部概率密度、本体概率密度和先验概率进行融合，得到第一对象图像和第二对象图像属于同一对象的目标概率。

例如，可以对本体概率密度和先验概率进行融合，得到第一对象图像和第二对象图像属于同一对象的初始概率，并将初始概率作为融合先验概率，将脸部概率密度和融合先验概率进行融合，得到第一对象图像和第二对象图像属于同一对象的目标概率，具体可以如下：

（1）对本体概率密度和先验概率进行融合，得到第一对象图像和第二对象图像属于同一对象的初始概率，并将初始概率作为融合先验概率。

例如，可以对本体概率密度和先验概率进行融合，得到第一对象图像和第二对象图像属于同一对象的初始概率，比如，可以利用贝叶斯定理，以本体相似度为s_b，本体为同一对象的概率密度f_T(s_b)和本体为不同对象的概率密度为f_F(s_b)为例，可以采用以下公式（3）来计算同一对象事件A的初始概率p(A│s_b,T)，其中同一对象事件为第一对象图像和第二对象图像属于同一对象的：

其中，T为第一对象图像和第二对象图像属于或不属于同一对象的全部事件，A为同一对象事件，T和s_b相互独立。将将初始概率作为融合先验概率。

（2）将脸部概率密度和融合先验概率进行融合，得到第一对象图像和第二对象图像属于同一对象的目标概率。

例如，将脸部概率密度和融合先验概率进行融合，得到第一对象图像和第二对象图像属于同一对象的目标概率，比如，可以再次利用贝叶斯定理，以脸部相似度为s_f，脸部为同一对象的概率密度f_T(s_f)和脸部为不同对象的概率密度为f_F(s_f)为例，可以采用以下公式（4）来计算同一对象事件A的目标概率p(A│s_b,s_f,T)，其中同一对象事件为第一对象图像和第二对象图像属于同一对象的：

其中，T为第一对象图像和第二对象图像属于或不属于同一对象的全部事件，A为同一对象事件，T和s_b相互独立，s_f和s_b相互独立。

106、基于目标概率，对第一对象图像和第二对象图像的同一性进行识别，得到图像识别结果。

例如，获取用于识别对象的同一性的预设概率阈值，比如，根据需要识别的对象的类型，从预设概率阈值集合中筛选出需要识别的对象的类型对应的预设概率阈值，譬如，需要识别的对象为人，则在预设概率阈值集合中筛选出人类对应的预设概率阈值，如果需要识别的对象为动物，则在预设概率阈值集合中筛选出动物对应的预设概率阈值，当然，还可以对类型进行更加细化的分类，比如，通过性别或年龄进行进一步的细分，细分的越细，预设概率阈值的粒度就越小，识别结果就越精确。将预设概率阈值与计算出的目标概率进行对比，当目标概率超过预设概率阈值时，可以确定第一对象图像和第二对象图像属于同一对象，比如，以需要识别的对象为人类为例，当计算出的目标概率超过人类对应的预设概率阈值时，就可以确定第一对象图像中人与第二对象图像中的人是同一个人，也可以将第一对象图像和第二对象图像称之为同人图像。当目标概率未超过预设概率阈值时，就可以确定第一对象图像和第二对象图像不属于同一对象。比如，以需要识别的对象为人类为例，当计算出的目标概率未超过人类对应的预设概率阈值时，就可以确定第一对象图像中人与第二对象图像中的人不为同一个人，也可以将第一对象图像和第二对象图像称之为非同人图像。

由以上可知，本发明实施例在获取待识别图像对和待识别图像对的时空信息后，该待识别图像对包括第一对象图像和第二对象图像，时空信息指示待识别图像对的位置信息和时间信息，对待识别图像对中的图像进行多维度特征提取，得到图像特征对，并计算图像特征对中的图像特征的相似度，该图像特征对包括第一对象的多维度图像特征和第二对象的多维度图像特征，基于时空信息，确定第一对象图像和第二对象图像之间的时空关联信息，根据时空关联信息，确定第一对象图像和第二对象图像属于同一对象的先验概率，对相似度和先验概率进行融合，得到第一对象图像与第二对象图像属于同一对象的目标概率，基于目标概率，对第一对象图像和第二对象图像中对象的同一性进行识别，得到图像识别结果；由于该方案通过获取待识别图像对的时空信息，确定第一对象图像和第二对象图像的时空关联信息，并基于时空关联信息得到第一对象图像和第二对象图像属于同一对象的先验概率，将时空信息与先验概率结合起来，使得先验概率的准确率大大增加，从而可以提升图像识别的准确率。

根据上面实施例所描述的方法，以下将举例作进一步详细说明。

在本实施例中，将以该图像识别装置具体集成在电子设备，电子设备为服务器，第一对象图像和第二对象图像中的对象为人为例进行说明。

如图3所示，一种图像识别方法，具体流程如下：

201、服务器获取待识别图像对和待识别图像对的时空信息。

例如，服务器可以获取待识别视频数据和待识别视频数据的属性信息，采集待识别视频数据中的画面帧，得到画面帧集合，在画面帧集合中筛选出第一对象图像和第二对象图像，得到待识别图像对，根据属性信息，确定待识别图像对的时空信息。具体可以如下：

（1）服务器获取待识别视频数据和待识别视频数据的属性信息。

例如，服务器可以从互联网上或者视频监控系统中获取到多个摄像头采集到的待识别视频数据。根据获取到的待识别视频数据中的内容，获取到待识别视频数据的属性信息，比如，采集或获取位置、视频总时长和画面帧对应的时间信息等信息。

（2）服务器采集待识别视频数据中的画面帧，得到画面帧集合。

例如，服务器可以获取待识别视频数据的帧数，根据获取的帧数对待适配数据进行截图，得到画面帧集合。

（3）服务器在画面帧集合中筛选出第一对象图像和第二对象图像，得到待识别图像对。

例如，服务器在画面帧集合中的每一画面帧上检测是否存在人脸。当画面帧中检测到人脸时，将画面帧作为待识别图像，得到候选待识别图像集合。在候选待识别图像集合中筛选出第一对象图像和第二对象图像，得到待识别图像对。

（4）服务器根据属性信息，确定待识别图像对的时空信息。

例如，服务器在属性信息中提取出第一对象图像和第二对象图像获取的时间和位置，将获取时间和位置作为时间信息和位置信息，将时间信息和位置信息作为待识别图像对中的图像的时空信息。

202、服务器对待识别图像对中的图像进行多维度特征提取，得到图像特征对。

例如，服务器在待识别图像对的图像中识别出对象的人脸区域和人体区域，根据人脸区域和人体区域，分别在第一对象图像和第二对象图像中提取出人脸图像和人体图像，得到人脸图像对和人体图像对，分别对人脸图像对和人体图像对中的图像进行特征提取，得到人脸特征对和人体特征对，具体可以如下：

（1）服务器在待识别图像对的图像中识别出对象的人脸区域和人体区域。

例如，服务器可以在待识别图像中识别出人脸边缘位置信息，根据人脸边缘位置信息，确定出人脸区域。按照固定比例将人脸区域向外扩大一定区域，将扩大的区域和/或人脸区域共同作为对象的人体区域。

（2）服务器根据人脸区域和人体区域，分别在第一对象图像和第二对象图像中提取出人脸图像和人体图像，得到人脸图像对和人体图像对。

例如，服务器分别在第一对象图像和第二对象图像中截取出人脸区域的图像作为人脸图像，分别在第一对象图像和第二对象图像中截取出人体区域的图像作为人体图像，将第一对象图像和第二对象图像对应的人脸图像进行组合，得到人脸图像对，将第一对象图像和第二对象图像对应的人体图像进行组合，得到人体图像对。

（3）服务器分别对人脸图像对和人体图像对中的图像进行特征提取，得到人脸特征对和人体特征对。

例如，服务器可以利用已经训练好的人脸和人体识别模型，分别在人脸图像对和人体图像对中的人脸图像和人体图像进行特征提取，得到人脸特征对和人体特征对，人脸特征对中包含第一对象图像对应的人脸图像的人脸特征和第二对象图像对应的人脸图像的人脸特征，人体特征对包括第一对象图像对应的人体图像的人体特征和第二对象图像对应的人体图像的人体特征。

203、服务器计算图像特征对中的多维度图像特征的相似度。

例如，服务器可以计算人脸特征对中的人脸特征的余弦相似度，将人脸特征的余弦相似度作为人脸相似度，并计算人体特征对中人体特征的余弦相似度，将人体特征的余弦相似度作为人体相似度。

204、服务器基于时空信息，确定第一对象图像和第二对象图像之间的时空关联信息。

例如，服务器可以在时空信息中出提取出第一对象图像和第二对象图像被图像获取装置获取时的时间信息和位置信息。根据获取到的第一对象图像和第二对象图像获取时间之间的时间距离，比如，第一对象图像是12:00获取的，第二对象图像是12:01获取的，将两个获取时间相减就可以得到第一对象图像和第二对象图像之间的时间距离为1分钟，还可以根据获取到的第一对象图像和第二对象图像的获取位置之间的空间位置关系，比如，该空间位置关系具体可以为两个获取位置之间的空间距离或者空间的分层的位置关系等。根据时间距离和空间位置关系，构建时空信息二元组（pos，gap），其中pos为第一对象图像和第二对象图像的获取位置之间的空间位置关系，gap为第一对象图像和第二对象图像的获取位置之间的时间距离，还可以直接构建时空信息三元组（pos1，pos2，gap），其中，pos1为第一对象图像的获取位置或者采集第一对象图像的图像采集设备的编号等，pos2为第二对象图像的获取位置或者采集第二对象图像的图像采集设备的编号等，将时空信息二元组或时空信息三元组作为第一对象图像和第二对象图像之间的时空关联信息。

205、服务器根据时空关联信息，确定第一对象图像和第二对象图像属于同人的先验概率。

例如，服务器获取用于预测同一个人（以下简称同人）的先验概率集合，该先验概率集合包括多个候选时空关联信息对应的候选先验概率，在先验概率集合中筛选出时空关联信息对应的目标先验概率，将目标先验概率作为第一对象图像和第二对象图像属于同人的先验概率。

可选的，在获取到同一对象的先验概率集合之前，还可以利用获取到的已标注人类身份的图像样本和图像样本对应的时空信息样本来构建用于预测同一个人的先验概率集合，因此，在步骤“获取用于预测同人的先验概率集合”之前，图像识别方法，还可以包括：

获取已标注人类身份的多个图像样本对和图像样本对的时空信息样本，该图像样本对包括两个图像样本，根据时空信息样本，确定图像样本对的时空关联信息样本，基于对象身份，计算时空关联信息样本对应的图像样本属于同人的先验概率，得到先验概率集合。

例如，获取多个标注人类身份的图像样本对，并获取该图像样本对中的图像样本的采集时间和采集位置，将这些信息作为图像样本对的时空信息样本。在时空信息样本中提取出图像样本的位置信息和时间信息，根据位置信息和时间信息，确定图像样本对中的图像样本之间的时间距离和空间位置关系，基于时间距离和空间位置关系，构建图像样本对中图像样板之间的时空关联信息。对先验概率映射进行初始化，将时空关联信息样本输入至先验概率映射，根据每个图像样本标注的人类身份，计算每两个位置之间和每个时间距离区间段的先验概率，譬如，可以计算位置A和位置B在一个特定时间距离内图像样本中的人类属于同一个人的先验概率，还可以计算在两个固定的位置之间，不同的时间距离区间内图像样本中的人类属于同人的先验概率，得到先验概率集合。

206、服务器将人脸相似度转换为人脸概率密度，并将人体相似度转换为人体概率密度。

例如，服务器可以由通过给定模型针对一组固定的FAR，计算得到对应的相似度阈值和TPR，得到相似度阈值集合和相似度阈值集合对应的召回率，将FAR作为非同人的累计密度，将TPR作为同人的累计密度。根据预设相似度阈值集合和累计密度，确定相似度与概率密度之间的映射关系，根据特定的相似度阈值t，确定同人的累计密度c_T与相似度阈值t之间的映射关系c_T(t)，同理，还可以确定非同人的累计密度c_F与相似度阈值t之间的映射关系c_F(t)。在预设相似度阈值集合中计算出相邻的各个相似度阈值之间的阈值差值∆，利用各个相邻阈值的阈值差值对c_T(t)和c_F(t)近似求导，就可以得到同人和非同人的概率密度函数f_T(t)和f_F(t)，即相似度和概率密度之间的映射关系，映射关系的公式可以参照上文的公式（1）和公式（2）。

基于映射关系，对人脸相似度和人体相似度进行映射，得到人脸概率密度和人体概率密度，比如，以人脸相似度为s_f，人体相似度为s_b为例，将人脸相似度为s_f，人体相似度为s_b输入至同人和非同人的概率密度函数f_T(t)和f_F(t)中进行映射，得到脸部为同人的概率密度f_T(s_f)和脸部为非同人的概率密度为f_F(s_f)，还可以得到本体为同人的概率密度f_T(s_b)和本体为非同人的概率密度为f_F(s_b)。

207、服务器对人体概率密度和先验概率进行融合，得到第一对象图像和第二对象图像属于同人的初始概率，并将初始概率作为融合先验概率。

例如，服务器可以利用贝叶斯定理，以人体相似度为s_b，人体为同人的概率密度f_T(s_b)和人体为非同人的概率密度为f_F(s_b)为例，可以采用上文所示的公式（3）计算同人事件A的初始概率p(A│s_b,T)，其中同人事件为第一对象图像和第二对象图像属于同人。

208、服务器将人脸概率密度和融合先验概率进行融合，得到第一对象图像和第二对象图像属于同人的目标概率。

例如，服务器可以再次利用贝叶斯定理，以人脸相似度为s_f，人脸为同人的概率密度f_T (s_f)和脸部为非同人的概率密度为f_F(s_f)为例，可以采用上文所示的公式（4）计算同人事件A的目标概率p(A│s_b,s_f,T)，其中同人事件为第一对象图像和第二对象图像属于同人。

209、服务器基于目标概率，对第一对象图像和第二对象图像的同一性进行识别，得到图像识别结果。

例如，服务器可以获取预设概率阈值集合，并在预设概率阈值集合中筛选出人类对应的预设概率阈值，将预设概率阈值与计算出的目标概率进行对比，当计算出的目标概率超过人类对应的预设概率阈值时，就可以确定第一对象图像中人与第二对象图像中的人是同一个人，也可以将第一对象图像和第二对象图像称之为同人图像。当计算出的目标概率未超过人类对应的预设概率阈值时，就可以确定第一对象图像中人与第二对象图像中的人不为同一个人，也可以将第一对象图像和第二对象图像称之为非同人图像。

由以上可知，本实施例中服务器在获取待识别图像对和待识别图像对的时空信息后，该待识别图像对包括第一对象图像和第二对象图像，时空信息指示待识别图像对的位置信息和时间信息，对待识别图像对中的图像进行多维度特征提取，得到图像特征对，并计算图像特征对中的图像特征的相似度，该图像特征对包括第一对象的多维度图像特征和第二对象的多维度图像特征，基于时空信息，确定第一对象图像和第二对象图像之间的时空关联信息，根据时空关联信息，确定第一对象图像和第二对象图像属于同一对象的先验概率，对相似度和先验概率进行融合，得到第一对象图像与第二对象图像属于同一对象的目标概率，基于目标概率，对第一对象图像和第二对象图像中对象的同一性进行识别，得到图像识别结果；由于该方案通过获取待识别图像对的时空信息，确定第一对象图像和第二对象图像的时空关联信息，并基于时空关联信息得到第一对象图像和第二对象图像属于同一对象的先验概率，将时空信息与先验概率结合起来，使得先验概率的准确率大大增加，从而可以提升图像识别的准确率。

为了更好地实施以上方法，本发明实施例还提供一种图像识别装置，该图像识别装置可以集成在电子设备，比如服务器或终端等设备中，该终端可以包括平板电脑、笔记本电脑和/或个人计算机等。

例如，如图4所示，该文本标签生成装置可以包括获取单元301、提取单元302、第一确定单元303、第二确定单元304、融合单元305和识别单元306，如下：

（1）获取单元301；

获取单元301，用于获取待识别图像对和待识别图像对的时空信息，该待识别图像对包括第一对象图像和第二对象图像，时空信息指示待识别图像对的位置信息和时间信息。

例如，获取单元301，具体可以用于获取待识别视频数据和待识别视频数据的属性信息，采集待识别视频数据中的画面帧，得到画面帧集合，在画面帧集合中筛选出第一对象图像和第二对象图像，得到待识别图像对，根据属性信息，确定待识别图像对的时空信息。

（2）提取单元302；

提取单元302，用于对待识别图像对中的图像进行多维度特征提取，得到图像特征对，并计算图像特征对中的多维度图像特征的相似度，该图像特征对包括第一对象的多维度图像特征和第二对象的多维度图像特征。

例如，提取单元302，具体可以同于在待识别图像对的图像中识别出对象的脸部区域和本体区域，根据脸部区域和本体区域，分别在第一对象图像和第二对象图像中提取出脸部图像和本体图像，得到脸部图像对和本体图像对，分别对脸部图像对和本体图像对中的图像进行特征提取，得到脸部特征对和本体特征对，计算图像特征对中的多维度图像特征的相似度。

（3）第一确定单元303；

第一确定单元303，用于基于时空信息，确定第一对象图像和第二对象图像之间的时空关联信息。

其中，第一确定单元303还可以包括提取子单元3031、确定子单元3032和构建子单元3033，如图5所示，具体如下：

提取子单元3031，用于在时空信息中提取出第一对象图像和第二对象的位置信息和时间信息；

确定子单元3032，用于根据位置信息和时间信息，确定第一对象图像和第二对象图像之间的时间距离和空间位置关系；

构建子单元3033，用于基于时间距离和空间位置关系，构建第一对象图像和第二对象图像之间的时空关联信息。

例如，提取子单元3031在时空信息中提取出第一对象图像和第二对象的位置信息和时间信息，确定子单元3032根据位置信息和时间信息，确定第一对象图像和第二对象图像之间的时间距离和空间位置关系，构建子单元3033基于时间距离和空间位置关系，构建第一对象图像和第二对象图像之间的时空关联信息。

（4）第二确定单元304；

第二确定单元304，用于根据时空关联信息，确定第一对象图像和第二对象图像属于同一对象的先验概率。

例如，第二确定单元304，具体可以用于获取用于预测同一对象的先验概率集合，该先验概率集合包括多个候选时空关联信息对应的候选先验概率，在先验概率集合中筛选出时空关联信息对应的目标先验概率，将目标先验概率作为第一对象图像和第二对象图像属于同一对象的先验概率。

（5）融合单元305；

融合单元305，用于对相似度和先验概率进行融合，得到第一对象图像与第二对象图像属于同一对象的目标概率；

其中，融合单元305还可以包括转换子单元3051和融合子单元3052，如图6所示，具体如下：

转换子单元3051，用于将脸部相似度转换为脸部概率密度，并将本体相似度转换为本体概率密度；

融合子单元3052，用于对脸部概率密度、本体概率密度和先验概率进行融合，得到第一对象图像和第二对象图像属于同一对象的目标概率。

（6）识别单元306；

识别单元306，用于基于目标概率，对第一对象图像和第二对象图像中对象的同一性进行识别，得到图像识别结果。

例如，识别单元306，具体可以用于获取用于识别对象的同一性的预设概率阈值，将预设概率阈值与目标概率进行对比，当目标概率超过预设概率阈值时，确定第一对象图像和第二对象图像属于同一对象。

具体实施时，以上各个单元可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元的具体实施可参见前面的方法实施例，在此不再赘述。

由以上可知，本实施例在获取单元301获取待识别图像对和待识别图像对的时空信息后，该待识别图像对包括第一对象图像和第二对象图像，时空信息指示待识别图像对的位置信息和时间信息，提取单元302对待识别图像对中的图像进行多维度特征提取，得到图像特征对，并计算图像特征对中的图像特征的相似度，该图像特征对包括第一对象的多维度图像特征和第二对象的多维度图像特征，第一确定单元303基于时空信息，确定第一对象图像和第二对象图像之间的时空关联信息，第二确定单元304根据时空关联信息，确定第一对象图像和第二对象图像属于同一对象的先验概率，融合单元305对相似度和先验概率进行融合，得到第一对象图像与第二对象图像属于同一对象的目标概率，识别单元306基于目标概率，对第一对象图像和第二对象图像中对象的同一性进行识别，得到图像识别结果；由于该方案通过获取待识别图像对的时空信息，确定第一对象图像和第二对象图像的时空关联信息，并基于时空关联信息得到第一对象图像和第二对象图像属于同一对象的先验概率，将时空信息与先验概率结合起来，使得先验概率的准确率大大增加，从而可以提升图像识别的准确率。

本发明实施例还提供一种电子设备，如图7所示，其示出了本发明实施例所涉及的电子设备的结构示意图，具体来讲：

该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解，图7中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器401是该电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。可选的，处理器401可包括一个或多个处理核心；优选的，处理器401可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块，处理器401通过运行存储在存储器402的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如声音播放功能、图像播放功能等）等；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器402还可以包括存储器控制器，以提供处理器401对存储器402的访问。

电子设备还包括给各个部件供电的电源403，优选的，电源403可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该电子设备还可包括输入单元404，该输入单元404可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，电子设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，电子设备中的处理器401会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中，并由处理器401来运行存储在存储器402中的应用程序，从而实现各种功能，如下：

例如，获取待识别视频数据和待识别视频数据的属性信息，采集待识别视频数据中的画面帧，得到画面帧集合，在画面帧集合中筛选出第一对象图像和第二对象图像，得到待识别图像对，根据属性信息，确定待识别图像对的时空信息。在待识别图像对的图像中识别出对象的脸部区域和本体区域，根据脸部区域和本体区域，分别在第一对象图像和第二对象图像中提取出脸部图像和本体图像，得到脸部图像对和本体图像对，分别对脸部图像对和本体图像对中的图像进行特征提取，得到脸部特征对和本体特征对，计算图像特征对中的多维度图像特征的相似度。在时空信息中提取出第一对象图像和第二对象图像的位置信息和时间信息，根据获取到的第一对象图像和第二对象图像获取时间之间的时间距离，还可以根据获取到的第一对象图像和第二对象图像的获取位置之间的空间位置关系，基于时间距离和空间位置关系，构建第一对象图像和第二对象图像之间的时空关联信息。获取用于预测同一对象的先验概率集合，该先验概率集合包括多个候选时空关联信息对应的候选先验概率，在先验概率集合中筛选出时空关联信息对应的目标先验概率，将目标先验概率作为第一对象图像和第二对象图像属于同一对象的先验概率。将脸部相似度转换为脸部概率密度，并将本体相似度转换为本体概率密度。对本体概率密度和先验概率进行融合，得到第一对象图像和第二对象图像属于同一对象的初始概率，并将初始概率作为融合先验概率，将脸部概率密度和融合先验概率进行融合，得到第一对象图像和第二对象图像属于同一对象的目标概率。获取用于识别对象的同一性的预设概率阈值，将预设概率阈值与计算出的目标概率进行对比，当目标概率超过预设概率阈值时，可以确定第一对象图像和第二对象图像属于同一对象。

以上各个操作的具体实施可参见前面的实施例，在此不作赘述。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本发明实施例提供一种计算机可读存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本发明实施例所提供的任一种图像识别方法中的步骤。例如，该指令可以执行如下步骤：

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

其中，该计算机可读存储介质可以包括：只读存储器（ROM，Read Only Memory）、随机存取记忆体（RAM，Random Access Memory）、磁盘或光盘等。

由于该计算机可读存储介质中所存储的指令，可以执行本发明实施例所提供的任一种图像识别方法中的步骤，因此，可以实现本发明实施例所提供的任一种图像识别方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

其中，根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述图像识别方面或者图像中对象同一性识别方面的各种可选实现方式中提供的方法。

以上对本发明实施例所提供的一种图像识别方法、装置和计算机可读存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种图像识别方法，其特征在于，包括：

2.根据权利要求1所述的图像识别方法，其特征在于，所述基于所述时空信息，确定所述第一对象图像和第二对象图像之间的时空关联信息，包括：

在所述时空信息中提取出所述第一对象图像和第二对象的位置信息和时间信息；

根据所述位置信息和时间信息，确定所述第一对象图像和第二对象图像之间的时间距离和空间位置关系；

基于所述时间距离和空间位置关系，构建所述第一对象图像和第二对象图像之间的时空关联信息。

3.根据权利要求2所述的图像识别方法，其特征在于，所述根据所述时空关联信息，确定所述第一对象图像和第二对象图像属于同一对象的先验概率，包括：

获取用于预测同一对象的先验概率集合，所述先验概率集合包括多个候选时空关联信息对应的候选先验概率；

在所述先验概率集合中筛选出所述时空关联信息对应的目标先验概率，将所述目标先验概率作为所述第一对象图像和第二对象图像属于同一对象的先验概率。

4.根据权利要求3所述的图像识别方法，其特征在于，所述获取用于预测同一对象的先验概率集合之前，还包括：

获取已标注对象身份的多个图像样本对和所述图像样本对的时空信息样本，所述图像样本对包括两个图像样本；

根据所述时空信息样本，确定所述图像样本对的时空关联信息样本；

基于所述对象身份，计算所述时空关联信息样本对应的图像样本属于同一对象的先验概率，得到先验概率集合。

5.根据权利要求1所述的图像识别方法，其特征在于，所述相似度包括脸部相似度和本体相似度；所述对所述相似度和先验概率进行融合，得到所述第一对象图像与第二对象图像属于同一对象的目标概率，包括：

将所述脸部相似度转换为脸部概率密度，并将所述本体相似度转换为本体概率密度；

对所述脸部概率密度、本体概率密度和先验概率进行融合，得到所述第一对象图像和第二对象图像属于同一对象的目标概率。

6.根据权利要求5所述的图像识别方法，其特征在于，所述将所述脸部相似度转换为脸部概率密度，并将所述本体相似度转换为本体概率密度，包括：

获取预设相似度阈值集合和所述相似度阈值集合对应的累计密度；

根据所述预设相似度阈值集合和累计密度，确定相似度与概率密度之间的映射关系；

基于所述映射关系，对所述脸部相似度和本体相似度进行映射，得到脸部概率密度和本体概率密度。

7.根据权利要求6所述的图像识别方法，其特征在于，所述根据所述预设相似度阈值集合和累计密度，确定相似度与概率密度之间的映射关系，包括：

在所述预设相似度阈值集合中计算出各个相似度阈值之间的阈值差值；

根据所述阈值差值和累计密度，确定所述相似度阈值与概率密度之间的映射关系。

8.根据权利要求5所述的图像识别方法，其特征在于，所述对所述脸部概率密度、本体概率密度和先验概率进行融合，得到所述第一对象图像和第二对象图像属于同一对象的目标概率，包括：

对所述本体概率密度和先验概率进行融合，得到所述第一对象图像和第二对象图像属于同一对象的初始概率，并将所述初始概率作为融合先验概率；

将所述脸部概率密度和所述融合先验概率进行融合，得到所述第一对象图像和第二对象图像属于同一对象的目标概率。

9.根据权利要求8所述的图像识别方法，其特征在于，所述基于所述目标概率，对所述第一对象图像和第二对象图像中对象的同一性进行识别，得到图像识别结果，包括：

获取用于识别对象的同一性的预设概率阈值；

将所述预设概率阈值与所述目标概率进行对比；

当所述目标概率超过所述预设概率阈值时，确定所述第一对象图像和第二对象图像属于同一对象。

10.根据权利要求1所述的图像识别方法，其特征在于，所述对所述待识别图像对中的图像进行多维度特征提取，得到图像特征对，包括：

在所述待识别图像对的图像中识别出对象的脸部区域和本体区域；

根据所述脸部区域和本体区域，分别在所述第一对象图像和第二对象图像中提取出脸部图像和本体图像，得到脸部图像对和本体图像对；

分别对脸部图像对和本体图像对中的图像进行特征提取，得到脸部特征对和本体特征对。

11.根据权利要求10所述的图像识别方法，其特征在于，所述在所述待识别图像对的图像中识别出对象的脸部区域和本体区域，包括：

在所述待识别图像对的图像中识别出对象的脸部区域；

将所述脸部区域按照预设比例进行调整，得到所述对象的本体区域。

12.根据权利要求1所述的图像识别方法，其特征在于，所述获取待识别图像对和所述待识别图像对的时空信息，包括：

获取待识别视频数据和所述待识别视频数据的属性信息；

采集所述待识别视频数据中的画面帧，得到画面帧集合；

在所述画面帧集合中筛选出第一对象图像和第二对象图像，得到待识别图像对；

根据所述属性信息，确定所述待识别图像对的时空信息。

13.根据权利要求12所述的图像识别方法，其特征在于，所述在所述画面帧集合中筛选出第一对象图像和第二对象图像，得到待识别图像对，包括：

对所述画面帧集合中的画面帧进行对象检测；

当所述画面帧中检测到对象时，将所述画面帧作为候选待识别图像，得到候选待识别图像集合；

在所述候选待识别图像集合中筛选出所述第一对象图像和第二对象图像，得到所述待识别图像对。

14.一种图像识别装置，其特征在于，包括：

获取单元，用于获取待识别图像对和所述待识别图像对的时空信息，所述待识别图像对包括第一对象图像和第二对象图像，所述时空信息指示所述待识别图像对的位置信息和时间信息；提取单元，用于对所述待识别图像对中的图像进行多维度特征提取，得到图像特征对，并计算所述图像特征对中的多维度图像特征的相似度，所述图像特征对包括第一对象的多维度图像特征和第二对象的多维度图像特征；

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至13任一项所述的图像识别方法中的步骤。