CN108665441B

CN108665441B - 一种近似重复图像检测方法及装置，电子设备

Info

Publication number: CN108665441B
Application number: CN201810277058.9A
Authority: CN
Inventors: 康丽萍; 魏晓明
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2018-03-30
Filing date: 2018-03-30
Publication date: 2019-09-17
Anticipated expiration: 2038-03-30
Also published as: US20210019872A1; EP3772036A4; EP3772036A1; WO2019184464A1; CN108665441A

Abstract

本申请实施例公开了一种近似重复图像检测方法，属于计算机技术领域，解决现有技术中近似重复图像检测准确率低的问题。所述方法包括：多任务网络模型分别确定输入图像对中目标图像的第一特征和第二特征，其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反映类内差异的图像特征；根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征；根据所述融合特征，确定所述目标图像是否互为近似重复图像。本申请公开的近似重复图像检测方法，通过结合图像的类内信息和类间信息构建图像的融合特征，进一步提升了图像融合特征的全面性和准确性，进而提升了近似重复图像检测的准确率。

Description

一种近似重复图像检测方法及装置，电子设备

技术领域

本申请涉及计算机技术领域，特别是涉及一种近似重复图像检测方法及装置，电子设备。

背景技术

近似重复图像是指仅有色彩、饱和度、裁切、拍摄角度、水印等区别的图像，在UGC(User Generated Content，用户产生内容)数据中存在多种类型的近似重复图像。这些近似重复图像的出现，会给搜索和推荐模型的训练、搜索推荐结果的展示带来负面影响。例如，会降低模型的准确性、降低平台的利用率，也不利于商户输出更多的有价值的信息，同时，还会影响用户体验。因此，迫切需要一种近似重复图像检测方法，来检测近似图像。

现有技术中的一种近似重复图像检测方法，在获取图像特征时，主要是通过分类方法获取，对于不同类别的图像，该方法获取的特征具有较好的区分性。但是在近似重复图检测场景中，候选集合中的图像大多是相同类别的，因此，采用现有技术中的图像特征表达会存在检测准确率低的问题。

综上，现有技术中的近似重复图像检测方法至少存在检测准确率低的缺陷。

发明内容

本申请提供一种近似重复图像检测方法，至少解决现有技术中近似重复图像检测准确率低的问题。

为了解决上述问题，第一方面，本申请实施例提供了一种近似重复图像检测方法包括：

通过多任务网络模型分别确定输入图像对中目标图像的第一特征和第二特征，其中，所述第一特征为包含类间信息和类内信息的图像特征，所述第二特征为反应类内差异的图像特征；

根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征；

根据所述融合特征，确定所述目标图像是否互为近似重复图像。

第二方面，本申请实施例提供了一种信息检索装置，包括：

特征提取模块，用于通过多任务网络模型分别确定输入图像对中目标图像的第一特征和第二特征，其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反应类内差异的图像特征；

特征融合模块，用于根据所述特征提取模块提取的目标图像的第一特征和第二特征，构造所述目标图像的融合特征；

近似重复图像检测模块，用于根据所述特征融合模块确定的融合特征，确定所述目标图像是否互为近似重复图像。

第三方面，本申请实施例还公开了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本申请实施例所述的近似重复图像检测方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时本申请实施例公开的近似重复图像检测方法的步骤。

本申请实施例公开的近似重复图像检测方法，通过多任务网络模型分别确定输入图像对中目标图像的第一特征和第二特征，其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反应类内差异的图像特征；根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征；根据所述融合特征，确定所述目标图像是否互为近似重复图像，解决了现有技术中近似重复图像检测准确率低的问题。本申请公开的近似重复图像检测方法通过结合图像的类内信息和类间信息构建图像的融合特征，进一步提升了图像融合特征的全面性和准确性，进而提升了近似重复图像检测的准确率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例一的近似重复图像检测方法流程图；

图2是本申请实施例二的近似重复图像检测方法流程图；

图3是本申请实施例二的分类模型结构示意图；

图4是本申请实施例二的多任务网络而结构示意图；

图5为近似重复图像对示意图；

图6为非近似重复图像对示意图；

图7是本申请实施例三的近似重复图像检测装置的结构示意图之一；

图8是本申请实施例三的近似重复图像检测装置的结构示意图之二；

图9是本申请实施例三的近似重复图像检测装置的结构示意图之三。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

实施例一

本实施例公开的一种近似重复图像检测方法，如图1所示，该方法包括：步骤110至步骤130。

步骤110，通过多任务网络模型分别确定输入图像对中目标图像的第一特征和第二特征。

其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反应类内差异的图像特征。

本申请具体实施时，预先训练多任务网络模型。所述多任务网络模型包括多个子网络，如：分类网络、相似性度量网络等，所述分类网络和相似性度量网络共享基础网络。其中，所述基础网络用于提取输入图像的第一特征，所述相似性度量网络用于提取输入图像的第二特征。其中，所述分类网络的优化目标为类间方差最大化，所述相似性度量网络的优化目标为减小近似重复图像之间的类内方差和增大非近似重复图像之间的类内方差。

所述分类网络和相似性度量网络为卷积神经网络，分别包括多个卷积层、特征提取层。具体实施时，所述分类网络可以选择如MobileNet等深度卷积神经网络，然后，选择某一特征提取层的输出作为输入图像的第一特征。具体实施时特征提取层本质上也是卷积层，本实施例中将基础网络的网络结构中最后一个卷积层作为图像的特征表达，所以可以称为特征提取层。所述相似性度量网络可以选择对称卷积神经网络，然后，选择某一卷积层(如相似性度量网络最后一个卷积层)的输出作为输入图像的第二特征。具体实施时，将输入图像对中的每幅称为目标图像，对于每幅目标图像，输入至所述多任务网络模型，可以得到每幅目标图像的第一特征和第二特征。

步骤120，根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征。

在确定了待检测图像对中目标图像的第一特征和第二特征之后，对于其中的每幅目标图像，根据该图像的第一特征和第二特征，构造所述目标图像的融合特征。具体实施时，可以直接将该图像的第一特征和第二特征进行拼接，得到该图像的融合特征；也可以进一步对该图像的第一特征和第二特征分别进行编码转换，如进行哈希编码转换，并通过转换得到的编码，确定该图像的融合特征。

具体实施时，由于图像对中每幅图像的第一特征是基础网络提取的输入图像的通用特征，即第一特征为包含反映类间差异和类内差异的图像特征，因此，可以进一步对所述第一特征通过分类网络进行卷积处理，得到单独反映类间差异的第三特征，然后，基于所述第三特征和第二特征，构造相应图像的融合特征。具体实施时，可以直接将该图像的第三特征和第二特征进行拼接，得到该图像的融合特征；也可以进一步对该图像的第三特征和第二特征分别进行编码转换，如进行哈希编码转换，并通过转换得到的编码，确定该图像的融合特征。

步骤130，根据所述融合特征，确定所述目标图像是否互为近似重复图像。

对于待检测图像，如查询图像和候选图像集中的图像，通过前述步骤可以分别获得查询图像和候选图像集中每幅图像的融合特征。进一步的，基于所述查询图像的融合特征和候选图像集中任意一幅候选图像的融合特征，通过现有技术中的相似度度量方法，即可确定所述查询图像和所述候选图像是否互为近似重复图像。

实施例二

本实施例公开的一种近似重复图像检测方法，如图2所示，该方法包括：步骤210至步骤260。

步骤210，基于包括近似重复图像的图像样本，训练分类模型。

本申请实施例中所述的近似重复图像可以由同一对象的不同图像组成，例如在不同光照条件下拍摄的同一对象的图像，或者，由某一对象的原始图像和对所述原始图像进行裁切、旋转、亮度调节处理后得到的图像组成。本申请实施例中所述的非近似重复图像是指不同图像组成的图像对。

具体实施时，首先搜集平台上不同品类的相似图像，做为图像样本以训练分类模型。用于训练分类模型的训练样本包括近似重复图像。在实际使用过程中因为很难收集到大量与原图近似重复的图像做为训练数据，所以需要基于已有图像合成训练样本。以美团点评平台为例，首先收集整理覆盖该平台所有业务场景的所有业务类型的图像(如22种业务类型)。具体实施时，图像样本类型的确定主要考虑实际应用场景。图像类别与业务场景匹配，如：酒店、菜品、丽人等。具体实施时，某一原始图像的近似重复图像可以为对该原始图像经过变换的版本，常见的变换操作有:几何仿射变换、模糊、噪声污染、图像内容增强以及压缩等。相应的，各应用场景下主要涉及的图像处理类型包括：亮度变化、对比度变化、裁切、旋转、水印等。具体实施时，基于收集的图像进行自动合成处理，得到用于训练分类模型的图像样本。其中，所述自动合成包括：调节亮度、调节对比度、裁切、旋转、水印等变换处理。

然后，基于合成的所述图像样本，训练分类模型。

具体实施时，可以通过卷积神经网络，基于前述合成的包括近似重复图像的图像样本，训练分类模型。例如，通过MobileNet训练分类模型。MobileNet是基于一个流线型的架构，它使用深度可分离的卷积来构建轻量级的深度神经网络，该网络在速度和准确率之间有较好的性能折中。如图3所示，所述分类模型包括多个卷积层和特征提取层。本申请具体是实施时，选择MobileNet网络的pool6层做为特征提取层，该层有1024个节点数目，将该层的输出做为输入图像的特征向量的表达。具体实施时，分类模型的优化目标为最大化类间方差。训练的到的分类模型获取的特征主要用于区分不同类别之间的图像特征。经过训练，将得到分类模型的最优权重参数。

步骤220，基于训练得到的所述分类模型的参数，初始化所述多任务网络模型。

如图4所示，本申请实施例中的多任务网络模型包括：分类网络410和相似性度量网络420。具体实施时，所述分类网络410和相似性度量网络420为卷积神经网络，分别包括多个卷积层、特征提取层。所述分类网络410和相似性度量网络420均包括基础网络，所述基础网络包括卷积层和特征提取层。具体实施时，所述分类网络410和相似性度量网络420共享基础网络。如图4所示，分类网络410和相似性度量网络420共用了一部分卷积层和特征提取层。具体实施时，所述分类网络410和相似性度量网络420也可以为独立的网络结构，但是基础网络的参数是共享的。

无论分类网络410和相似性度量网络420是否共用部分卷积层和特征提取层，为了提升训练效率，可以通过前述步骤训练的分类模型的网络参数初始化所述分类网络410和相似性度量网络420的部分网络参数。然后，进一步通过训练所述多任务网络模型，进行网络参数微调和优化。

步骤230，基于包括近似重复图像对和非近似重复图像对的图像对样本，训练所述多任务网络模型。

多任务网络初始化完成之后，基于真实业务场景的测试图像，构建近似重复图像对和非近似重复图像对，用于训练所述多任务网络模型。具体实施时，所述图像对样本中包括匹配指定图像处理类型的图像对，所述指定图像处理类型通过以下方法确定：通过训练得到的所述分类模型，确定测试图像对中每幅图像的图像特征；根据所述测试图像对中两幅图像的图像特征之间的距离，进行近似重复图像判别；根据对匹配不同图像处理类型的图像对进行近似重复图像判别的准确率，确定指定图像处理类型。

具体实施时，近似重复图像对由原始图像经过预设图像处理后得到的图像和所述原始图像中的任意两幅图像组成，即近似重复图像对是对一幅原始图像经过指定图像处理类型处理后得到的图像和原始图像，或者，原始图像经过图像处理后得到的两幅图像构成的图像对。其中，所述指定图像处理类型包括但不限于以下任意一种：裁切、旋转、水印、亮度变化、对比度变化等。例如，对图5中的原始图像510进行裁切后得到图像520，以及，对原始图像510进行旋转后得到图像530，那么原始图像510和图像520构成一个近似重复图像对、原始图像510和图像530构成一个近似重复图像对、图像520和图像530也可以构成一个近似重复图像对。而非近似重复图像对由不同的两幅图像组成，如图6所示，图像610和图像620两幅不同的图像构成一个非近似重复图像对。

然后，将基于真实业务场景的测试图像获得的近似重复图像对和非近似重复图像对分别做为测试图像对，输入至步骤210训练的得到分类模型，确定输入的测试图像对中，每一幅图像的图像特征。通过将图像输入至所述分类模型，获取模型pool6层输出的1024维度特征作为图像特征，然后，计算图像对中2幅图像的图像特征的距离，以确定两幅图像是否相似。具体实施时，测试图像对设置有是否为近似重复图像对的标签。如果，一个近似重复图像对中的两幅图像被识别为不相似，则认为对该图像对的近似重复图像判别失败，或者一个非近似重复图像对中的两幅图像根据图像特征距离，被认定为相似，则认为该图像对的近似重复图像判别失败。最后，统计判别失败的近似重复图像对匹配的图像处理类型，即判别失败的近似重复图像对是经过哪些类型的图像处理得到的。如果经过某一图像处理类型得到的近似重复图像对的判别准确率低于设定的准确率阈值，则确定所述分类模型较难对经过该种图像处理类型得到的近似重复图像对进行分类识别，则将该图像处理类型标识为hard类型。所述hard类型的近似重复图像对为通过pool6层提取的1024维度的特征较难区分的图像对。

具体实施时，hard类型的近似重复图像对为仅利用分类获取的特征较难区分的图像对，比如裁切、模糊、logo和旋转等图像处理后得到的近似重复图像对。进一步的，基于挖掘得到的hard类型数据构建近似重复图像对。例如，将标识为hard类型的测试图像对做为近似重复图像对，或者，选择大量hard类型的测试图像对构建近似重复图像对。同时，利用同一类别的不同图像构建非近似重复图像对。

然后，基于构建的近似重复图像对和非近似重复图像对，训练所述多任务网络模型。

具体实施时，如图4所示，所述多任务网络模型包括：分类网络和相似性度量网络，所述分类网络和所述相似性度量网络共享基础网络。具体实施时，所述多任务网络模型的训练方法为：通过求解同时满足所述分类网络和所述相似性度量网络的优化目标的网络参数，训练所述多任务网络模型；其中，所述分类网络的优化目标为增大近似重复图像之间的类间方差；所述相似性度量网络的优化目标为减小近似重复图像之间的类内方差和增大非近似重复图像之间的类内方差。输入至所述多任务网络模型的近似重复图像对和非近似重复图像对中的每幅图像都包括类别标签，具体实施时，可以将所述近似重复图像对和非近似重复图像对中的每幅图像或只选择其中一幅图像输入至所述分类网络，以训练所述分类网络。分类网络的输入数据形式为{图像，类别}，即具有类别标签的图像。所述分类网络的损失函数为softmaxloss()，优化目标为类间方差最大化。

在训练相似性度量网络时。所述相似性度量网络的输入数据形式为{(图像1，类别)，(图像2，类别),是否近似重复图像对}。所述相似性度量网络为对对称卷积神经网络，的损失函数为Contrastiveloss()，优化目标为减小近似重复图像之间的类内方差和增大非近似重复图像之间的类内方差。

多任务网络模型的具体训练过程，参见现有技术，本实施例中不再赘述。本申请中的多任务网络模型与现有技术中的网络模型的区别在于网络结构和输入的训练数据、优化目标，以及，结合初步训练的分类模型的网络参数对多任务网络模型中相应网络进行初始化。模型的优化过程可参见现有技术的模型训练过程。通过训练分类网络和相似性度度量网络，可以得到包括基础网络在内的所述多任务网络中分类网络和相似性度量网络的各层的最优参数。

步骤240，通过多任务网络模型分别确定输入图像对中目标图像的第一特征和第二特征。

具体实施时，所述通过多任务网络模型分别确定输入图像对中目标图像的第一特征和第二特征，包括：通过所述基础网络确定输入图像对中目标图像的第一特征；通过所述相似性度量网络对所述第一特征进行卷积运算，确定输入图像对中目标图像的第二特征。其中，所述相似性度量网络的优化目标为减小近似重复图像之间的类内方差和增大非近似重复图像之间的类内方差。

在多任务网络模型训练结束后，可以通过所述多任务网络模型，提取输入至所述多任务网络模型的图像的图像特征。具体实施时，根据所述多任务网络模型的网络结构，选择所述分类网络和相似性度量网络共享的基础网络的最后一个特征提取层的输出做为输入图像的第一特征，即所述第一特征包含反映类间差异和类内差异的图像特征，如图4中特征提取层430(即基础网络的最后一个卷积层)输出的图像特征。然后，选择所述相似性度量网络的最后一个卷积层的输出做为输入图像的第二特征，例如，图4中的440的输出。其中，所述第二特征为对所述第一特征进行卷积运算后，得到的图像特征。

本实施例中，以分类网络为MobileNet网络举例，可以将MobileNet网络pool6层提取的1024维度的特征做为输入图像的第一特征。将相似性度量网络对所述MobileNet网络pool6层提取的1024维度的特征进行进一步卷积处理后得到的256维特征，做为所述输入图像的第二特征。其中，所述MobileNet网络pool6层提取的1024维度的特征为输入图像的通用特征，同时反映类间差异和类内差异的图像特征。而通过相似性度量网络进行卷积处理后得到的256维特征，则为更细粒度的，反应类内差异的图像特征。

具体应用时，对于待检测图像，如查询图像和候选图像集中的图像，将所述查询图像和候选图像集中的任意一幅图像输入至所述多任务网络模型，可以得到所述输入图像的第一特征和第二特征。进一步的，根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征。最后，基于所述查询图像的融合特征和候选图像集中任意一幅候选图像的融合特征，通过现有技术中的相似度度量方法，即可确定所述查询图像和所述候选图像是否为近似重复图像。

步骤250，根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征。

具体实施时，可以直接将目标图像的第一特征和第二特征进行拼接，将拼接得到的特征，做为所述目标图像的融合特征。例如，将1024维的第一特征和256维的第二特征，依序拼接为1280维的特征向量，做为一幅目标图像的融合特征。

具体实施时，根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征，还包括：通过对所述目标图像的所述第一特征进行卷积运算，确定所述目标图像的第三特征，其中，所述第三特征为反应类间差异的图像特征，所述第一特征时通过所述基础网络确定的；根据所述目标图像的所述第三特征和所述第二特征，构造所述目标图像的融合特征。例如，通过分类网络的卷积层，对所述第一特征进行卷积运算，得到单独反映类间差异的第三特征，然后，将所述第三特征和第二特征，依序拼接为多维的特征向量，做为一幅图像的融合特征。通过对第一特征进一步进行卷积运算，提取单独反映类间差异的第三特征，然后基于所述第三特征和第二特征，构建图像的融合特征，可以减少图像特征的数据量，提升图像比对的效率。

优选的，所述根据所述目标图像的所述第三特征和所述第二特征，构造所述目标图像的融合特征，还包括：确定所述目标图像的第三特征对应的哈希编码和所述第二特征对应的哈希编码；将所述第三特征对应的哈希编码和所述第二特征对应的哈希编码进行拼接，得到所述目标图像的融合特征。为了进一步减小图像特征的数据量，可以将图像特征进行哈希编码，用哈希编码进行图像的融合特征。例如，512维度的第三特征为[0.7,0.6,0.2…0.3,0.8]，通过与阈值0.5进行比较，大于阈值0.5认为该维特征对应的哈希编码为1，小于等于阈值0.5认为该维特征对应的哈希编码为0，则512维的第三特征进行哈希编码后表示为[110…01]。按照同样的方法，对256维的第二特征进行哈希编码，得到的哈希编码表示为[10…000]。对哈希编码进行拼接后，最终得到的图像融合特征为[110…0110…000]。

如果直接根据第一特征和第二特征，构造相应的图像融合特征，则直接对第一特征和第二特征分别进行哈希编码，并将哈希编码进行拼接。优选的，所述根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征，包括：分别确定所述目标图像的第一特征对应的哈希编码和所述第二特征对应的哈希编码；将所述第一特征对应的哈希编码和所述第二特征对应的哈希编码进行拼接，得到所述目标图像的融合特征。例如，1024维度的第一特征为[0.6,0.6,0.3…0.7,0.2]，通过与阈值0.5进行比较，大于阈值0.5认为该维特征对应的哈希编码为1，小于等于阈值0.5认为该维特征对应的哈希编码为0，则1024维的第一特征进行哈希编码后表示为[110…10]。按照同样的方法，对256维的第二特征进行哈希编码，得到的哈希编码表示为[10…000]。对哈希编码进行拼接后，最终得到的图像融合特征为[110…1010…000]。

对于多任务网络而言，第二特征的编码长度需要在合理的范围内，如果过短则类内约束的作用不明显，类似于欠拟合；过长则粒度过细，类似于过拟合，本申请选择第一特征编码长度为1024，第二特征编码长度为256，可以很好地平衡类内差异对检测结果的影响。在训练网络不变的情况下，如果在使用过程中只使用第一特征编码，则检测结果受第二特征编码长度影响较大。本申请通过将第一特征或第三特征与第二特征进行拼接，使得最终得到的图像的融合特征稳定性更高。

步骤260，根据所述融合特征，确定所述目标图像是否互为近似重复图像。

本申请实施例公开的近似重复图像检测方法，通过基于包括近似重复图像的图像样本，训练分类模型，然后，基于训练得到的所述分类模型的参数，初始化所述多任务网络模型；并基于包括近似重复图像对和非近似重复图像对的图像对样本，训练所述多任务网络模型；在具体应用过程中，通过多任务网络模型分别确定输入图像对中目标图像的第一特征和第二特征；根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征；最后，根据所述融合特征，确定所述目标图像是否互为近似重复图像，解决了现有技术中近似重复图像检测准确率低的问题。本申请公开的近似重复图像检测方法通过基于卷积神经网络进行分类模型的预训练，用于增大图像类间特征方差，并利用学习到的分类模型的参数微调分类及相似性度量多任务网络，进一步增大非近似重复图的类内方差，使得在图像检测过程中，将优化得到的反映类间差异与类内差异的图像特征和更细粒度的反映类内差异的图像特征进行拼接做为图像的融合特征，在增大类间特征方差的同时，可进一步增大非近似重复图的类内方差，有利于提升近似重复图像检测的准确率。

本申请公开的多任务网络模型中，通过将分类网络和相似度量网络输出的特征进行拼接，提升了特征的表达能力。同时，相比单纯使用反映类间差异与类内差异的图像特征，拼接后的图像特征受反映类内差异的特征影响较小，特征稳定性更高。

实施例三

本实施例公开的一种近似重复图像检测装置，如图7所示，所述装置包括：

特征提取模块710，用于通过多任务网络模型分别确定输入图像对中目标图像的第一特征和第二特征，其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反应类内差异的图像特征；

特征融合模块720，用于根据所述特征提取模块710提取的目标图像的第一特征和第二特征，构造所述目标图像的融合特征；

近似重复图像检测模块730，用于根据所述特征融合模块720确定的融合特征，确定所述目标图像是否互为近似重复图像。

可选的，所述多任务网络模型包括：分类网络和相似性度量网络，所述分类网络和所述相似性度量网络共享基础网络，可选的，所述多任务网络模型的训练方法为：通过求解同时满足所述分类网络和所述相似性度量网络的优化目标的网络参数，训练所述多任务网络模型；其中，所述分类网络的优化目标为增大近似重复图像之间的类间方差；所述相似性度量网络的优化目标为减小近似重复图像之间的类内方差和增大非近似重复图像之间的类内方差。

可选的，如图8所示，所述特征提取模块710进一步包括：

第一特征提取单元7101，用于通过所述基础网络确定输入图像对中目标图像的第一特征；

第二特征提取单元7102，用于通过所述相似性度量网络对所述第一特征进行卷积运算，确定输入图像对中目标图像的第二特征，其中，所述相似性度量网络的优化目标为减小近似重复图像之间的类内方差和增大非近似重复图像之间的类内方差。

本申请实施例公开的近似重复图像检测装置，通过多任务网络模型分别确定输入图像对中目标图像的第一特征和第二特征，其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反应类内差异的图像特征；根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征；根据所述融合特征，确定所述目标图像是否互为近似重复图像，解决了现有技术中近似重复图像检测准确率低的问题。本申请公开的近似重复图像检测方法通过结合图像的类内信息和类间信息构建图像的融合特征，进一步提升了图像融合特征的全面性和准确性，进而提升了近似重复图像检测的准确率。

可选的，如图8所示，所述装置还包括：

分类模型训练模块740，用于基于包括近似重复图像的图像样本，训练分类模型；

多任务网络模型初始化模块750，用于基于训练得到的所述分类模型的参数，初始化所述多任务网络模型；

多任务网络模型训练模块760，用于基于包括近似重复图像对和非近似重复图像对的图像对样本，训练所述多任务网络模型，其中，所述近似重复图像对由原始图像经过预设图像处理后得到的图像和所述原始图像中的任意两幅图像组成，所述非近似重复图像对由不同的两幅图像组成。

可选的，所述图像对样本中包括匹配指定图像处理类型的图像对，所述指定图像处理类型通过以下方法确定：

通过训练得到的所述分类模型，确定测试图像对中每幅图像的图像特征；

根据所述测试图像对中两幅图像的图像特征之间的距离，进行近似重复图像判别；

根据对匹配不同图像处理类型的图像对进行近似重复图像判别的准确率，确定指定图像处理类型。

可选的，如图8所示，所述特征融合模块720进一步包括：

第三特征提取单元7201，用于通过对所述目标图像的所述第一特征进行卷积运算，确定所述目标图像的第三特征，其中，所述第三特征为反应类间差异的图像特征，所述第一特征时通过所述基础网络确定的；

第一特征融合单元7202，用于根据目标图像的所述第三特征和所述第二特征，构造所述目标图像的融合特征。

可选的，所述特征融合模块720还包括：

第一编码单元7203，用于确定所述目标图像的第三特征对应的哈希编码和所述第二特征对应的哈希编码；

所述第一特征融合单元7202，还用于将所述第三特征对应的哈希编码和所述第二特征对应的哈希编码进行拼接，得到所述目标图像的融合特征。

在另一实施例中，如图9所示，所述特征融合模块720进一步包括：

第二编码单元7204，用于分别确定所述目标图像的第一特征对应的哈希编码和所述第二特征对应的哈希编码；

第二特征融合单元7205，用于将所述第一特征对应的哈希编码和所述第二特征对应的哈希编码进行拼接，得到所述目标图像的融合特征。

本申请公开的近似重复图像检测装置，通过基于卷积神经网络进行分类模型的预训练，用于增大图像类间特征方差，并利用学习到的分类模型的参数微调分类及相似性度量多任务网络，进一步增大非近似重复图的类内方差，使得在图像检测过程中，将优化得到的反映类间差异与类内差异的图像特征和更细粒度的反映类内差异的图像特征进行拼接做为图像的融合特征，在增大类间特征方差的同时，可进一步增大非近似重复图的类内方差，有利于提升近似重复图像检测的准确率。

相应的，本申请还公开了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如本申请实施例一和实施例二所述的近似重复图像检测方法。所述电子设备可以为PC机、移动终端、个人数字助理、平板电脑等。

本申请还公开了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请实施例一和实施例二所述的近似重复图像检测方法的步骤。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上对本申请提供的一种近似重复图像检测方法及装置进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件实现。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

Claims

1.一种近似重复图像检测方法，其特征在于，包括：

通过多任务网络模型分别确定输入图像对中目标图像的包含反映类间差异和类内差异的图像特征以及反映类内差异的图像特征；根据所述目标图像的所述包含反映类间差异和类内差异的图像特征以及反映类内差异的图像特征，构造所述目标图像的融合特征；

2.根据权利要求1所述的方法，其特征在于，所述多任务网络模型包括：分类网络和相似性度量网络，所述分类网络和所述相似性度量网络共享基础网络，所述多任务网络模型的训练方法为：

通过求解同时满足所述分类网络和所述相似性度量网络的优化目标的网络参数，训练所述多任务网络模型；其中，

所述分类网络的优化目标为增大近似重复图像之间的类间方差；

所述相似性度量网络的优化目标为减小近似重复图像之间的类内方差和增大非近似重复图像之间的类内方差。

3.根据权利要求2所述的方法，其特征在于，所述通过多任务网络模型分别确定输入图像对中目标图像的包含反映类间差异和类内差异的图像特征以及反映类内差异的图像特征的步骤，包括：

通过所述基础网络确定输入图像对中目标图像的包含反映类间差异和类内差异的图像特征；

通过所述相似性度量网络对所述包含反映类间差异和类内差异的图像特征进行卷积运算，确定输入图像对中目标图像的反映类内差异的图像特征。

4.根据权利要求2或3所述的方法，其特征在于，所述通过多任务网络模型分别确定输入图像对中目标图像的包含反映类间差异和类内差异的图像特征和反映类内差异的图像特征的步骤之前，还包括：

基于包括近似重复图像的图像样本，训练分类模型；

基于训练得到的所述分类模型的参数，初始化所述多任务网络模型；

基于包括近似重复图像对和非近似重复图像对的图像对样本，训练所述多任务网络模型，其中，所述近似重复图像对由原始图像经过预设图像处理后得到的图像和所述原始图像中的任意两幅图像组成，所述非近似重复图像对由不同的两幅图像组成。

5.根据权利要求4所述的方法，其特征在于，所述图像对样本中包括匹配指定图像处理类型的图像对，所述指定图像处理类型通过以下方法确定：

6.根据权利要求2或3所述的方法，其特征在于，所述根据目标图像的包含反映类间差异和类内差异的图像特征以及反映类内差异的图像特征，构造所述目标图像的融合特征的步骤，包括：

通过对所述目标图像的所述包含反映类间差异和类内差异的图像特征进行卷积运算，确定所述目标图像的反映类间差异的图像特征，所述包含反映类间差异和类内差异的图像特征是通过所述基础网络确定的；

根据所述目标图像的所述包含反映类间差异的图像特征和所述反映类内差异的图像特征，构造所述目标图像的融合特征。

7.根据权利要求6所述的方法，其特征在于，所述根据所述目标图像的所述包含反映类间差异的图像特征和所述反映类内差异的图像特征，构造所述目标图像的融合特征的步骤，还包括：

分别确定所述目标图像的反映类间差异的图像特征对应的哈希编码和所述反映类内差异的图像特征对应的哈希编码；

将所述反映类间差异的图像特征对应的哈希编码和所述反映类内差异的图像特征对应的哈希编码进行拼接，得到所述目标图像的融合特征。

8.根据权利要求1至3任一项所述的方法，其特征在于，所述根据所述目标图像的包含反映类间差异和类内差异的图像特征以及反映类内差异的图像特征，构造所述目标图像的融合特征的步骤，包括：

分别确定所述目标图像的包含反映类间差异和类内差异的图像特征对应的哈希编码和所述反映类内差异的图像特征对应的哈希编码；

将所述包含反映类间差异和类内差异的图像特征对应的哈希编码和所述反映类内差异的图像特征对应的哈希编码进行拼接，得到所述目标图像的融合特征。

9.一种近似重复图像检测装置，其特征在于，包括：

特征提取模块，用于通过多任务网络模型分别确定输入图像对中目标图像的包含反映类间差异和类内差异的图像特征以及反映类内差异的图像特征；

特征融合模块，用于根据所述特征提取模块提取的目标图像的包含反映类间差异和类内差异的图像特征以及反映类内差异的图像特征，构造所述目标图像的融合特征；

10.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至8任意一项所述的近似重复图像检测方法。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至8任意一项所述的近似重复图像检测方法的步骤。