CN109359517A

CN109359517A - 图像识别方法和装置、电子设备、存储介质、程序产品

Info

Publication number: CN109359517A
Application number: CN201811011751.8A
Authority: CN
Inventors: 陈世哲; 旷章辉; 张伟
Original assignee: Shenzhen Sensetime Technology Co Ltd
Current assignee: Shenzhen Sensetime Technology Co Ltd
Priority date: 2018-08-31
Filing date: 2018-08-31
Publication date: 2019-02-19

Abstract

本申请实施例公开了一种图像识别方法和装置、电子设备、存储介质、程序产品，其中，方法包括：对图像集中每个图像进行特征提取，获得至少两个图像特征；基于图像特征确定图像集中每两个图像之间的相似度；基于每两个图像之间的相似度和标注图像的标注类别，确定图像集中未标注图像的类别；通过图像之间的相似度结合标注图像的标注类别，实现在具有少量标注样本的情况下，将类别进行扩散，进而估计出大量无标记图像的类别。

Description

图像识别方法和装置、电子设备、存储介质、程序产品

技术领域

本申请涉及计算机视觉技术，尤其是一种图像识别方法和装置、电子设备、存储介质、程序产品。

背景技术

视频结构化是一种视频内容信息提取的技术，它对视频中包含的人物、物体、场景等采用检测、跟踪、识别等方法，获得其对应的类别和属性信息。这些信息可以从视频中提取出来并处理为文本文件，方便存储和进行快速搜索，对视频理解有很大的实用价值。而对这些目标进行识别的过程通常需要大量的人工数据标注作为支持。

发明内容

本申请实施例提供的一种图像识别技术。

根据本申请实施例的一个方面，提供的一种图像识别方法，包括：

对图像集中每个图像进行特征提取，获得至少两个图像特征，所述图像集中包括至少一个标注图像和至少一个未标注图像，所述标注图像具有标注类别；

基于所述图像特征确定所述图像集中每两个所述图像之间的相似度；

基于所述每两个图像之间的相似度和所述标注图像的标注类别，确定所述图像集中未标注图像的类别。

可选地，在本申请上述实施例的图像识别方法中，在对图像集中每个图像进行特征提取，获得至少两个图像特征之前，还包括：

对所述图像集中至少一个图像进行识别处理，获得至少一个类别识别结果；

基于所述至少一个类别识别结果确定标注图像。

可选地，在本申请上述实施例的图像识别方法中，所述基于所述至少一个类别识别结果确定标注图像，包括：

响应于所述至少一个类别识别结果正确的情况，将每个类别识别结果的标注类别作为所述类别识别结果对应的图像的标注类别，并将所述类别识别结果对应的图像作为所述标注图像。

可选地，在本申请上述实施例的图像识别方法中，所述对所述图像集中至少一个图像进行识别处理，获得至少一个类别识别结果，包括：

基于深度神经网络对所述图像集中至少一个图像进行识别处理，获得所述图像分别对应至少一个类别的概率值；

从所述类别对应的至少一个概率值中获取至少一个大于预设值的概率值，将大于预设值的概率值对应的类别识别结果。

可选地，在本申请上述实施例的图像识别方法中，所述基于所述图像特征确定所述图像集中每两个所述图像之间的相似度，包括：

基于预先训练的相似度图确定所述图像集中每两个所述图像之间的相似度。

可选地，在本申请上述实施例的图像识别方法中，所述相似度图的训练过程包括：

基于所述图像特征确定所述图像集中每两个所述图像之间的初始相似度；

将所述每个图像作为节点，同时将所述初始相似度作为边，建立所述相似度图。

可选地，在本申请上述实施例的图像识别方法中，所述基于所述图像特征确定所述图像集中每两个所述图像之间的初始相似度，包括：

基于所述图像集中每两个所述图像对应的图像特征之间的距离，确定所述图像集中每两个所述图像之间的初始相似度。

可选地，在本申请上述实施例的图像识别方法中，所述基于预先训练的相似度图确定所述图像集中每两个所述图像之间的相似度，包括：

对所述相似度图中的边进行优化处理，获得优化后的相似度图；

基于所述优化后的相似度图获得对应的邻接矩阵；

对所述邻接矩阵执行对称处理和归一化处理，确定所述图像集中每两个所述图像之间的相似度。

可选地，在本申请上述实施例的图像识别方法中，所述对所述邻接矩阵执行对称处理和归一化处理，确定所述图像集中每两个所述图像之间的相似度，包括：

对所述邻接矩阵执行对称处理和归一化处理，获得目标矩阵；

基于所述目标矩阵确定所述图像集中每两个所述图像之间的相似度。

可选地，在本申请上述实施例的图像识别方法中，所述基于所述每两个图像之间的相似度和所述标注图像的标注类别，确定所述图像集中未标注图像的类别，包括：

基于所述图像集中的所有标注图像和所有未标注图像，建立对应至少一个类别的初始类别矩阵；

对所述初始类别矩阵与所述目标矩阵进行矩阵乘法，获得目标识别结果矩阵；

基于所述目标识别结果矩阵确定所述未标注图像的类别。

可选地，在本申请上述实施例的图像识别方法中，所述基于所述图像集中的图像，建立对应至少一个类别的初始类别矩阵，包括：

分别将所述图像集中的每个图像对应每个所述类别的概率值作为矩阵中的元素，其中，每个所述标注图像对应标注类别的概率值为1，对应其他类别的概率值为0；每个所述未标注数据对应所有类别的概率值为0。

可选地，在本申请上述实施例的图像识别方法中，所述基于所述目标识别结果矩阵确定所述未标注图像的类别，包括：

基于所述目标识别结果矩阵确定至少一个所述未标注图像的类别，将所述确定的类别作为所述未标注图像的标注类别，获得更新后的图像集；

基于所述更新后的图像集中的所有标注图像和所有未标注图像，建立对应至少一个类别的初始类别矩阵；

基于所述目标识别结果矩阵确定至少一个所述未标注图像的类别，直到识别出所有所述未标注图像的类别。

根据本申请实施例的另一个方面，提供的一种图像识别装置，包括：

特征提取单元，用于对图像集中每个图像进行特征提取，获得至少两个图像特征，所述图像集中包括至少一个标注图像和至少一个未标注图像，所述标注图像具有标注类别；

相似度确定单元，用于基于所述图像特征确定所述图像集中每两个所述图像之间的相似度；

类别标注单元，用于基于所述每两个图像之间的相似度和所述标注图像的标注类别，确定所述图像集中未标注图像的类别。

可选地，在本申请上述实施例的图像识别装置中，所述装置还包括：

类别识别单元，用于对所述图像集中至少一个图像进行识别处理，获得至少一个类别识别结果；

标注图像确定单元，用于基于所述至少一个类别识别结果确定标注图像。

可选地，在本申请上述实施例的图像识别装置中，所述标注图像确定单元，具体用于响应于所述至少一个类别识别结果正确的情况，将每个类别识别结果的标注类别作为所述类别识别结果对应的图像的标注类别，并将所述类别识别结果对应的图像作为所述标注图像。

可选地，在本申请上述实施例的图像识别装置中，所述类别识别单元，具体用于基于深度神经网络对所述图像集中至少一个图像进行识别处理，获得所述图像分别对应至少一个类别的概率值；从所述类别对应的至少一个概率值中获取至少一个大于预设值的概率值，将大于预设值的概率值对应的类别识别结果。

可选地，在本申请上述实施例的图像识别装置中，所述相似度确定单元，具体用于基于预先训练的相似度图确定所述图像集中每两个所述图像之间的相似度。

可选地，在本申请上述实施例的图像识别装置中，所述相似度确定单元，还用于基于所述图像特征确定所述图像集中每两个所述图像之间的初始相似度；将所述每个图像作为节点，同时将所述初始相似度作为边，建立所述相似度图。

可选地，在本申请上述实施例的图像识别装置中，所述相似度确定单元在基于所述图像特征确定所述图像集中每两个所述图像之间的初始相似度时，用于基于所述图像集中每两个所述图像对应的图像特征之间的距离，确定所述图像集中每两个所述图像之间的初始相似度。

可选地，在本申请上述实施例的图像识别装置中，所述相似度确定单元在基于预先训练的相似度图确定所述图像集中每两个所述图像之间的相似度时，包括：

图优化模块，用于对所述相似度图中的边进行优化处理，获得优化后的相似度图；

邻接矩阵模块，用于基于所述优化后的相似度图获得对应的邻接矩阵；

处理模块，用于对所述邻接矩阵执行对称处理和归一化处理，确定所述图像集中每两个所述图像之间的相似度。

可选地，在本申请上述实施例的图像识别装置中，所述处理模块，用于对所述邻接矩阵执行对称处理和归一化处理，获得目标矩阵；基于所述目标矩阵确定所述图像集中每两个所述图像之间的相似度。

可选地，在本申请上述实施例的图像识别装置中，所述类别标注单元，具体用于基于所述图像集中的所有标注图像和所有未标注图像，建立对应至少一个类别的初始类别矩阵；对所述初始类别矩阵与所述目标矩阵进行矩阵乘法，获得目标识别结果矩阵；基于所述目标识别结果矩阵确定所述未标注图像的类别。

可选地，在本申请上述实施例的图像识别装置中，所述类别标注单元在基于所述图像集中的图像，建立对应至少一个类别的初始类别矩阵时，用于分别将所述图像集中的每个图像对应每个所述类别的概率值作为矩阵中的元素，其中，每个所述标注图像对应标注类别的概率值为1，对应其他类别的概率值为0；每个所述未标注数据对应所有类别的概率值为0。

可选地，在本申请上述实施例的图像识别装置中，所述类别标注单元在基于所述目标识别结果矩阵确定所述未标注图像的类别时，用于基于所述目标识别结果矩阵确定至少一个所述未标注图像的类别，将所述确定的类别作为所述未标注图像的标注类别，获得更新后的图像集；基于所述更新后的图像集中的所有标注图像和所有未标注图像，建立对应至少一个类别的初始类别矩阵；对所述初始类别矩阵与所述目标矩阵进行矩阵乘法，获得目标识别结果矩阵；基于所述目标识别结果矩阵确定至少一个所述未标注图像的类别，直到识别出所有所述未标注图像的类别。

根据本申请实施例的又一个方面，提供的一种电子设备，包括处理器，所述处理器包括如上任意一项所述的图像识别装置。

根据本申请实施例的还一个方面，提供的一种电子设备，包括：存储器，用于存储可执行指令；

以及处理器，用于与所述存储器通信以执行所述可执行指令从而完成如上任意一项所述图像识别方法的操作。

根据本申请实施例的再一个方面，提供的一种计算机可读存储介质，用于存储计算机可读取的指令，所述指令被执行时执行如上任意一项所述图像识别方法的操作。

根据本申请实施例的再一个方面，提供的一种计算机程序产品，包括计算机可读代码，当所述计算机可读代码在设备上运行时，所述设备中的处理器执行用于实现如上任意一项所述图像识别方法的指令。

基于本申请上述实施例提供的一种图像识别方法和装置、电子设备、存储介质、程序产品，对图像集中每个图像进行特征提取，获得至少两个图像特征；基于图像特征确定图像集中每两个图像之间的相似度；基于每两个图像之间的相似度和标注图像的标注类别，确定图像集中未标注图像的类别；通过图像之间的相似度结合标注图像的标注类别，实现在具有少量标注样本的情况下，将类别进行扩散，进而估计出大量无标记图像的类别。

下面通过附图和实施例，对本申请的技术方案做进一步的详细描述。

附图说明

构成说明书的一部分的附图描述了本申请的实施例，并且连同描述一起用于解释本申请的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本申请，其中：

图1为本申请图像识别方法一个实施例的流程示意图。

图2为本申请图像识别方法另一个实施例的流程示意图。

图3为本申请图像识别方法一个可选示例的流程示意图。

图4为本申请图像识别方法另一可选示例中训练相似度图的流程示意图。

图5为本申请图像识别方法另一可选示例中确定图像集中每两个图像之间的相似度的流程示意图。

图6为本申请实施例涉及的经过优化后的k近邻图的结构示意图。

图7为本申请图像识别方法另一可选示例中对邻接矩阵执行对称处理和归一化处理的流程示意图。

图8为本申请图像识别方法又一实施例中标注类别扩散的流程示意图。

图9为本申请图像识别方法又一实施例中确定未标注图像的类别的流程示意图。

图10为本申请图像识别装置一个实施例的结构示意图。

图11为适于用来实现本申请实施例的终端设备或服务器的电子设备的结构示意图。

具体实施方式

现在将参照附图来详细描述本申请的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本申请及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

图1为本申请图像识别方法一个实施例的流程示意图。如图1所示，该实施例方法包括：

步骤110，对图像集中每个图像进行特征提取，获得至少两个图像特征。

其中，图像集中包括至少一个标注图像和至少一个未标注图像，标注图像具有标注类别，标注图像的标注类别可以是通过识别获得的或通过人工标注获得，本申请实施例对标注图像的获取方式不做限定。

可选地，为了获得图像间的相似度，需要提取图像集中所有图像的图像特征。

可选地，可以通过深度神经网络对图像进行特征提取，图像特征可以是基于深度神经网络中的某一层的输出获得，而该深度神经网络可以经过离线训练过，即，该深度神经网络经过训练，可获得较为准确的图像特征。

步骤120，基于图像特征确定图像集中每两个图像之间的相似度。

两个图像之间的相似度可以基于两个图像对应的图像特征之间的距离(例如：欧氏距离、余弦距离等)确定，距离越小说明两个图像越相似，反之，距离越大说明两个图像越不相似；当两个图像的相似度大于设定值时，可以认为这两个图像对应同一标注类别。在本实施例中，可以将相似度大于设定值中的一个图像的标注类别扩散到另一个图像上，即根据已标注图像的标注类别获取未标注图像的标注类别。

步骤130，基于每两个图像之间的相似度和标注图像的标注类别，确定图像集中未标注图像的类别。

在本实施例中，基于标注类别和相似度共同确定未标注图像的类别，提高了未标注图像类别标注的准确性。

基于本申请上述实施例提供的一种图像识别方法，对图像集中每个图像进行特征提取，获得至少两个图像特征；基于图像特征确定图像集中每两个图像之间的相似度；基于每两个图像之间的相似度和标注图像的标注类别，确定图像集中未标注图像的类别；通过图像之间的相似度结合标注图像的标注类别，实现在具有少量标注样本的情况下，将类别进行扩散，进而估计出大量无标记图像的类别。

图2为本申请图像识别方法另一个实施例的流程示意图。如图2所示，本实施例方法可以包括：

步骤210，对图像集中至少一个图像进行识别处理，获得至少一个类别识别结果。

本实施例中，在图像集中不包括标注图像时，第一次类别扩散的情况比较特殊，此时还没有标记样本作为类别扩散的起始点，因此需要将每一类中得分最大的n个点给人工修改和/或确认后作为起始点，本实施例可通过神经网络对至少一个图像进行识别处理，或其他方式对至少一个图像进行识别处理，本申请不限制获得类别识别结果的具体方式。

步骤220，基于至少一个类别识别结果确定标注图像。

至少一个类别识别结果是基于神经网络获取的，由于未标注图像的类别需要基于标注图像的标注类别获得，为了保证标注图像的标注类别的准确性，需要保证标注图像的标注类别的准确性，因此，需要从至少一个类别识别结果中筛选确定标注图像，可选地，其筛选过程可以结合人工判断或其他方式。

步骤230，对图像集中每个图像进行特征提取，获得至少两个图像特征。

在本实施例中，可以通过深度神经网络对图像进行特征提取，也可以采用其他特征提取方法进行特征提取这里不做具体限定。

步骤240，基于图像特征确定图像集中每两个图像之间的相似度。

两个图像之间的相似度可以基于两个图像对应的图像特征之间的距离(例如：欧氏距离、余弦距离等)获得，具体可参照上述图1所示实施例中的步骤120，也可以采用其他方式确定每两个图像之间的相似度，这里不做具体限定。

步骤250，基于每两个图像之间的相似度和标注图像的标注类别，确定图像集中未标注图像的类别。

该步骤实现的方法可参照上述图1所示实施例中的步骤130，这里不再赘述。本实施例通过识别处理获得标注图像的标注类别，为标注类别的扩散提供了基础，提高了类别扩散的准确度。

可选地，基于至少一个类别识别结果确定标注图像，包括：

响应于至少一个类别识别结果正确的情况，将每个类别识别结果的标注类别作为类别识别结果对应的图像的标注类别，并将类别识别结果对应的图像作为标注图像。

在本实施中，为了确定类别识别结果是否正确，可结合少量的用户反馈(通过人工确认类别识别结果是否正确)，还可以通过其他方式确认类别识别结果的正确性，本申请不限制具体确定类别识别结果正确性的方法；通过加入用户反馈这种交互式的方法可以快速预测视频中各物体序列的类别，速度快，准确度更高。对于新出现的未标注图像，只需要用户标记几个样本就可以进行类标扩散，扩展性强。

图3为本申请图像识别方法一个可选示例的流程示意图。如图3所示，步骤210可以包括：

步骤212，基于深度神经网络对图像集中至少一个图像进行识别处理，获得图像分别对应至少一个类别的概率值。

图像的类别识别结果是基于深度神经网络对图像集中部分或全部图像进行识别获得的，通过深度神经网络的处理可以获得每个被识别图像对应不同类别的概率，多种分类类别对应多个概率，例如：一个图像的得分(识别结果)包括：对应类别1的概率为0.9、对应类别2的概率为0.2和对应类别3的概率为0.1等。

步骤214，从类别对应的至少一个概率值中获取至少一个大于预设值的概率值，将大于预设值的概率值对应的类别识别结果。

在本实施例中，可通过概率值的大小确定该图像对应的类别，如上述例子中，设定的预设值为0.8，可以将该图像的类别识别结果标注为类别1(由于该图像对应类别1的概率值为0.9，大于0.8)，其他图像如果对应所有类别的概率值都小于预设值0.8的话，则其他图像不具有类别识别结果。

在一个或多个可选的实施例中，步骤120可以包括：

基于预先训练的相似度图确定图像集中每两个图像之间的相似度。

可选地，本实施例通过基于图像特征建立相似度图，基于相似度图确定图像集中每两个图像之间的相似度，本实施例中所建立的相似度图是通过预先训练的，图4为本申请图像识别方法另一可选示例中训练相似度图的流程示意图。如图4所示，该预先训练相似度图的过程可以包括：

步骤410，基于图像特征确定图像集中每两个图像之间的初始相似度。

其中，可选地，基于图像集中每两个图像对应的图像特征之间的距离，确定图像集中每两个图像之间的初始相似度。

两个图像特征之间的距离可以包括但不限于：欧氏距离、余弦距离等；通过两个图像特征之间的距离可对两个图像特征对应的图像之间的相似程度进行衡量，两个图像特征之间的距离越小，说明对应的两个图像越相似，在建立相似度图时，可通过边的长度体现距离的大小，距离越小两个图像之间的边越短，距离越大，两个图像之间的边越长。

步骤420，将每个图像作为节点，同时将初始相似度作为边，建立相似度图。

在本实施例中，基于初始相似度将相似的多个图像进行连接，获得相似度图(数学图)，在相似度图中存在多条边，每条边连接两个相似的图像，通过对相似度图进行处理，可确定哪些边可以保留，哪些边可以去除，进而确定两个图像之间的更准确的相似度。

图5为本申请图像识别方法另一可选示例中确定图像集中每两个图像之间的相似度的流程示意图。如图5所示，步骤410可以包括：

步骤412，对相似度图中的边进行优化处理，获得优化后的相似度图。

可选地，直接通过相似度图和初始识别结果获得目标识别结果存在计算量和计算复杂的问题，因此，本实施例通过优化，将相似度图中一些相似度较小的去除，以减少计算量。

可选地，优化处理包括以下至少一种：将相似度图优化为k近邻图、将相似度图优化为全连接图、将相似度图优化为ε近邻图。

k近邻(k-Nearest Neighbor，KNN)分类算法是最简单的机器学习算法之一。该方法的思路是：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别；本实施例获得k近邻图是将与一个图像相似度最大的前k个值置为1，其他相似度较小的置为0，例如：以k＝3为例，以图像1为基准，计算其他所有图像与该图像1的相似度，将与图像1的相似度最大的3个图像对应的矩阵中的值置为1，其他图像对应的值置为0。

全连接算法对形成簇的要求严格，新形成的簇必须是一个最大完全子图，也就是说簇中的每个点之间都必须相连。

ε近邻图是以一个设定值为临界点，将大于或等于该设定值的值都置为1，将小于该设定值的值都置为0，即将相似度图中的所有值替换为0和1。

在一个可选示例中，假设包括N个人脸图像，基于相似度图获得的邻接矩阵可以表示成一个N×N的矩阵W，其W_i,j表示序列i和j之间的初始相似度。图6为本申请实施例涉及的经过优化后的k近邻图的结构示意图。如图6所示，以k近邻图为例(取k＝3进行说明)，如果序列j是序列i的k近邻，则W_i,j＝1，否则为0。进一步地，可以对W做对称化和归一化，定义D矩阵为对角阵，D_i,i＝∑_jW_i,j，则W←D^-1(W+W^T)，其中，←表示赋值。这里的邻接矩阵可以使用其他定义，例如：全连接图或ε近邻图等，不局限于k近邻图。这样，W刻画了人脸序列之间的相似度，定义了后续步骤的信息传播路径。

步骤414，基于优化后的相似度图获得对应的邻接矩阵。

例如：包括N个人脸图像，邻接矩阵可以表示成一个N×N的矩阵W，其W_i,j表示序列i和j之间的初始相似度。

步骤416，对邻接矩阵执行对称处理和归一化处理，确定图像集中每两个图像之间的相似度。

在本实施例中，对称处理和归一化处理使图像量控制在可计算的范围内，防止图像量越计算越大，通过对称处理和归一化处理在保证了计算准确度的同时，减小了计算量。

图7为本申请图像识别方法另一可选示例中对邻接矩阵执行对称处理和归一化处理的流程示意图。如图7所示，步骤416可以包括：

步骤4162，对邻接矩阵执行对称处理和归一化处理，获得目标矩阵。

对邻接矩阵执行对称化处理，将获得另一个矩阵，将两个矩阵执行矩阵乘法，将获得新的矩阵，为了使这个矩阵中每个元素可以表达每两个图像之间的相似程度，可将这些值进行归一化，以便于后续计算，将归一化处理后的矩阵作为目标矩阵。

步骤4164，基于目标矩阵确定图像集中每两个图像之间的相似度。

可选地，上述步骤获得的目标矩阵中的每个元素表达每两个图像之间的相似度，因此，基于该目标矩阵即可确定图像集中每两个图像之间的相似度。

图8为本申请图像识别方法又一实施例中标注类别扩散的流程示意图。如图8所示，步骤130可以包括：

步骤132，基于图像集中的所有标注图像和所有未标注图像，建立对应至少一个类别的初始类别矩阵。

可选地，可以分别将图像集中的每个图像对应每个类别的概率值作为矩阵中的元素，其中，每个标注图像对应标注类别的概率值为1，对应其他类别的概率值为0；每个未标注数据对应所有类别的概率值为0。

在一个可选的示例中，假设图像集包括N个图像，对应的类别为C个类别，定义N×C的矩阵L(初始类别矩阵)，L的每一行L_i对应了一个样本i在C个类别上的得分(概率值)。对于具有标注类别的标注图像，将L_i初始化为独热编码的形式，即对应标注类别处的得分为1，其它的都为0；对于不具有标注类别的未标注图像，L_i全部置为0。

步骤134，对初始类别矩阵与目标矩阵进行矩阵乘法，获得目标识别结果矩阵。

基于上述步骤得到的初始类别矩阵L，结合基于相似度图的中连接及权重确定的目标矩阵可获得目标识别结果矩阵，具体可包括：L中的已知标注类别可以根据相似度向近邻扩散，进而估计出未标注图像的类别，表示为L←WL，其中，←表示赋值，W表示目标矩阵或邻接矩阵，WL表示将初始类别矩阵与目标矩阵或邻接矩阵进行矩阵乘法，并以矩阵乘法的结果为目标识别结果矩阵赋值。

步骤136，基于目标识别结果矩阵确定未标注图像的类别。

本实施例通过将初始类别矩阵与目标矩阵进行矩阵乘法，实现通过图像之间的相似度将标注图像的类别扩散到未标注图像的目的，例如：一个图像1对应类别1的概率为0.5，而与其相似度较高的图像2具有已知的标注类别表示为类别1，此时即可通过相似度图中的权重确定该图像1的分类类别为类别1。

图9为本申请图像识别方法又一实施例中确定未标注图像的类别的流程示意图。如图9所示，步骤136可以包括：

步骤1361，基于目标识别结果矩阵确定至少一个未标注图像的类别，将确定的类别作为未标注图像的标注类别，获得更新后的图像集。

初始情况下，为了减少人工参与，具有标注类别的标注图像的数量较少，因此，与具有标注类别的标注图像关联性达到标注类别扩散标准的图像有限。因此，需要基于目标识别结果矩阵确定未标注图像的类别，将确定的类别作为未标注图像的标注类别，并将确定类别后的未标注图像划分为已标注图像，从而获得更新后的图像集。

步骤1362，基于更新后的图像集中的所有标注图像和所有未标注图像，建立对应至少一个类别的初始类别矩阵。

更新后的图像集中包括两个集合，一个集合中所有图像都具有标注类别的标注图像，另一个集合中所有图像都是不具有标注类别的未标注图像；基于集合中的标注图像的标注类别进行类别扩散。

步骤1363，对初始类别矩阵与目标矩阵进行矩阵乘法，获得目标识别结果矩阵。

该步骤实现的方法可参照上述图8所示实施例中的步骤134，这里不再赘述。

步骤1364，基于目标识别结果矩阵确定至少一个未标注图像的类别。

该步骤实现的方法可参照上述图8所示实施例中的步骤136，这里不再赘述。

步骤1365，判断图像集中是否还包括未识别的未标注图像，如果是，执行步骤1361；否则，结束。

即对于图像集，直到识别出所有未标注图像的类别，结束标注。

通过判断图像集中是否还包括未识别的未标注图像，为本实施例方法的结束提供了结束条件，当满足图像集中不包括未识别的未标注图像时，即可认为满足结束条件，即可结束标注；而当未满足结束条件时，需要循环执行步骤1361，以保证对所有未标注图像进行类别标注。

由于每次可标注类别的未标注图像数量有限，为了将图像集中所有未标注图像都进行类别标注，需要不断循环，将新标注类别的图像作为具有标注类别的标注图像，再将与新标注类别的图像关联性达到扩散标准进行类别标注，通过多次循环，即可实现在图像集中全部图像的标签扩展。

本申请上述实施方法可以对检测到的人脸、物体、服饰等物体做识别、属性分类等任务、这种方法通用性强，且能大量减少用户的工作量；对视频结构化的初始结果进行快速修正，速度较快，工作量小。

本申请上述实施方法还可以应用于进行多种任务结果的修正，包括人脸检测和识别，物体检测和识别等类似任务。

可选地，为了增加本申请方法标注类别的准确性，还可以在类别扩散后，增加用户确认和/或修正过程，对于类别未知的图像i，选择L_i中最大的得分对应的类别作为预测结果，每个类别选取得分最大的n个点返回给用户，用户修改其中错误的类别，没有修改的图像代表预测正确并经过用户确认，这个步骤增加了一批新的标注图像。返回第二步继续进行类别扩散的操作，不断迭代直到所有的未标注图像被确定。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

图10为本申请图像识别装置一个实施例的结构示意图。该实施例的装置可用于实现本申请上述各方法实施例。如图10所示，该实施例的装置包括：

特征提取单元101，用于对图像集中每个图像进行特征提取，获得至少两个图像特征。

相似度确定单元102，用于基于图像特征确定图像集中每两个图像之间的相似度。

类别标注单元103，用于基于每两个图像之间的相似度和标注图像的标注类别，确定图像集中未标注图像的类别。

基于本申请上述实施例提供的一种图像识别装置，对图像集中每个图像进行特征提取，获得至少两个图像特征；基于图像特征确定图像集中每两个图像之间的相似度；基于每两个图像之间的相似度和标注图像的标注类别，确定图像集中未标注图像的类别；通过图像之间的相似度结合标注图像的标注类别，实现在具有少量标注样本的情况下，将类别进行扩散，进而估计出大量无标记图像的类别。

在一个或多个可选的实施例中，本实施例装置还可以包括：

类别识别单元，用于对图像集中至少一个图像进行识别处理，获得至少一个类别识别结果；

标注图像确定单元，用于基于至少一个类别识别结果确定标注图像。

本实施例通过识别处理获得标注图像的标注类别，为标注类别的扩散提供了基础，提高了类别扩散的准确度。除了根据第一次类别扩散确定少量图像的标注类别，还可以将部分已知类别的图像加入图像集，以减少第一次类别扩散中的人工参与，以标注图像的标注类别进行类别扩散，保证了扩散后的类别的准确性。

可选地，标注图像确定单元，具体用于响应于至少一个类别识别结果正确的情况，将每个类别识别结果的标注类别作为类别识别结果对应的图像的标注类别，并将类别识别结果对应的图像作为标注图像。

可选地，类别识别单元，具体用于基于深度神经网络对图像集中至少一个图像进行识别处理，获得图像分别对应至少一个类别的概率值；从类别对应的至少一个概率值中获取至少一个大于预设值的概率值，将大于预设值的概率值对应的类别识别结果。

在一个或多个可选的实施例中，相似度确定单元102，具体用于基于预先训练的相似度图确定图像集中每两个图像之间的相似度。

可选地，本实施例通过基于图像特征建立相似度图，基于相似度图确定图像集中每两个图像之间的相似度，本实施例中所建立的相似度图是通过预先训练的。

可选地，相似度确定单元102，还用于基于图像特征确定图像集中每两个图像之间的初始相似度；将每个图像作为节点，同时将初始相似度作为边，建立相似度图。

可选地，相似度确定单元102在基于图像特征确定图像集中每两个图像之间的初始相似度时，用于基于图像集中每两个图像对应的图像特征之间的距离，确定图像集中每两个图像之间的初始相似度。

可选地，相似度确定单元102在基于预先训练的相似度图确定图像集中每两个图像之间的相似度时，包括：

图优化模块，用于对相似度图中的边进行优化处理，获得优化后的相似度图；

邻接矩阵模块，用于基于优化后的相似度图获得对应的邻接矩阵；

处理模块，用于对邻接矩阵执行对称处理和归一化处理，确定图像集中每两个图像之间的相似度。

可选地，处理模块，用于对邻接矩阵执行对称处理和归一化处理，获得目标矩阵；基于目标矩阵确定图像集中每两个图像之间的相似度。

在一个或多个可选的实施例中，类别标注单元103，具体用于基于图像集中的所有标注图像和所有未标注图像，建立对应至少一个类别的初始类别矩阵；对初始类别矩阵与目标矩阵进行矩阵乘法，获得目标识别结果矩阵；基于目标识别结果矩阵确定未标注图像的类别。

可选地，类别标注单元103在基于图像集中的图像，建立对应至少一个类别的初始类别矩阵时，用于分别将图像集中的每个图像对应每个类别的概率值作为矩阵中的元素，其中，每个标注图像对应标注类别的概率值为1，对应其他类别的概率值为0；每个未标注数据对应所有类别的概率值为0。

可选地，类别标注单元103在基于目标识别结果矩阵确定未标注图像的类别时，用于基于目标识别结果矩阵确定至少一个未标注图像的类别，将确定的类别作为未标注图像的标注类别，获得更新后的图像集；基于更新后的图像集中的所有标注图像和所有未标注图像，建立对应至少一个类别的初始类别矩阵；对初始类别矩阵与目标矩阵进行矩阵乘法，获得目标识别结果矩阵；基于目标识别结果矩阵确定至少一个未标注图像的类别，直到识别出所有未标注图像的类别。

根据本申请实施例的另一个方面，提供的一种电子设备，包括处理器，该处理器包括如上任意一实施例的图像识别装置。

根据本申请实施例的另一个方面，提供的一种电子设备，包括：存储器，用于存储可执行指令；

以及处理器，用于与该存储器通信以执行可执行指令从而完成如上任意一实施例的图像识别方法的操作。

本发明实施例还提供了一种电子设备，例如可以是移动终端、个人计算机(PC)、平板电脑、服务器等。下面参考图11，其示出了适于用来实现本申请实施例的终端设备或服务器的电子设备1100的结构示意图：如图11所示，电子设备1100包括一个或多个处理器、通信部等，所述一个或多个处理器例如：一个或多个中央处理单元(CPU)1101，和/或一个或多个图像处理器(GPU)1113等，处理器可以根据存储在只读存储器(ROM)1102中的可执行指令或者从存储部分1108加载到随机访问存储器(RAM)1103中的可执行指令而执行各种适当的动作和处理。通信部1112可包括但不限于网卡，所述网卡可包括但不限于IB(Infiniband)网卡。

处理器可与只读存储器1102和/或随机访问存储器1103中通信以执行可执行指令，通过总线1104与通信部1112相连、并经通信部1112与其他目标设备通信，从而完成本申请实施例提供的任一项方法对应的操作，例如，对图像集中每个图像进行特征提取，获得至少两个图像特征，图像集中包括至少一个标注图像和至少一个未标注图像，标注图像具有标注类别；基于图像特征确定图像集中每两个图像之间的相似度；基于每两个图像之间的相似度和标注图像的标注类别，确定图像集中未标注图像的类别。

此外，在RAM 1103中，还可存储有装置操作所需的各种程序和数据。CPU1101、ROM1102以及RAM1103通过总线1104彼此相连。在有RAM1103的情况下，ROM1102为可选模块。RAM1103存储可执行指令，或在运行时向ROM1102中写入可执行指令，可执行指令使中央处理单元(CPU)1101执行上述通信方法对应的操作。输入/输出(I/O)接口1105也连接至总线1104。通信部1112可以集成设置，也可以设置为具有多个子模块(例如多个IB网卡)，并在总线链接上。

以下部件连接至I/O接口1105：包括键盘、鼠标等的输入部分1106；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107；包括硬盘等的存储部分1108；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口1105。可拆卸介质1111，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器1110上，以便于从其上读出的计算机程序根据需要被安装入存储部分1108。

需要说明的，如图11所示的架构仅为一种可选实现方式，在具体实践过程中，可根据实际需要对上述图11的部件数量和类型进行选择、删减、增加或替换；在不同功能部件设置上，也可采用分离设置或集成设置等实现方式，例如GPU1113和CPU1101可分离设置或者可将GPU1113集成在CPU1101上，通信部可分离设置，也可集成设置在CPU1101或GPU1113上，等等。这些可替换的实施方式均落入本发明公开的保护范围。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，计算机程序包含用于执行流程图所示的方法的程序代码，程序代码可包括对应执行本申请实施例提供的方法步骤对应的指令，例如，对图像集中每个图像进行特征提取，获得至少两个图像特征，图像集中包括至少一个标注图像和至少一个未标注图像，标注图像具有标注类别；基于图像特征确定图像集中每两个图像之间的相似度；基于每两个图像之间的相似度和标注图像的标注类别，确定图像集中未标注图像的类别。在这样的实施例中，该计算机程序可以通过通信部分1109从网络上被下载和安装，和/或从可拆卸介质1111被安装。在该计算机程序被中央处理单元(CPU)1101执行时，执行本申请的方法中限定的上述功能。

根据本申请实施例的另一个方面，提供的一种计算机可读存储介质，用于存储计算机可读取的指令，该指令被执行时执行如上任意一实施例的图像识别方法的操作。

根据本申请实施例的另一个方面，提供的一种计算机程序产品，包括计算机可读代码，当该计算机可读代码在设备上运行时，设备中的处理器执行用于实现如上任意一实施例的图像识别方法的指令。

本说明书中各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言，由于其与方法实施例基本对应，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

可能以许多方式来实现本申请的方法和装置。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本申请的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明，本申请的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本申请实施为记录在记录介质中的程序，这些程序包括用于实现根据本申请的方法的机器可读指令。因而，本申请还覆盖存储用于执行根据本申请的方法的程序的记录介质。

本申请的描述是为了示例和描述起见而给出的，而并不是无遗漏的或者将本申请限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本申请的原理和实际应用，并且使本领域的普通技术人员能够理解本申请从而设计适于特定用途的带有各种修改的各种实施例。

Claims

1.一种图像识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在对图像集中每个图像进行特征提取，获得至少两个图像特征之前，还包括：

基于所述至少一个类别识别结果确定标注图像。

3.根据权利要求2所述的方法，其特征在于，所述基于所述至少一个类别识别结果确定标注图像，包括：

4.根据权利要求2或3所述的方法，其特征在于，所述对所述图像集中至少一个图像进行识别处理，获得至少一个类别识别结果，包括：

5.根据权利要求1-4任一所述的方法，其特征在于，所述基于所述图像特征确定所述图像集中每两个所述图像之间的相似度，包括：

6.一种图像识别装置，其特征在于，包括：

7.一种电子设备，其特征在于，包括处理器，所述处理器包括权利要求6所述的图像识别装置。

8.一种电子设备，其特征在于，包括：存储器，用于存储可执行指令；

以及处理器，用于与所述存储器通信以执行所述可执行指令从而完成权利要求1至5任意一项所述图像识别方法的操作。

9.一种计算机可读存储介质，用于存储计算机可读取的指令，其特征在于，所述指令被执行时执行权利要求1至5任意一项所述图像识别方法的操作。

10.一种计算机程序产品，包括计算机可读代码，其特征在于，当所述计算机可读代码在设备上运行时，所述设备中的处理器执行用于实现权利要求1至5任意一项所述图像识别方法的指令。