WO2019184464A1

WO2019184464A1 - 检测近似重复图像

Info

Publication number: WO2019184464A1
Application number: PCT/CN2018/122069
Authority: WO
Inventors: 康丽萍; 魏晓明
Original assignee: 北京三快在线科技有限公司
Priority date: 2018-03-30
Filing date: 2018-12-19
Publication date: 2019-10-03
Also published as: US20210019872A1; EP3772036A1; CN108665441B; CN108665441A; EP3772036A4

Abstract

一种近似重复图像检测方法、装置、电子设备和计算机可读存储介质。所述方法包括：在通过多任务网络模型分别确定输入的目标图像的第一特征和第二特征之后，其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反映类内差异的图像特征，可根据所述目标图像的所述第一特征和所述第二特征构造所述目标图像的融合特征，并根据所述融合特征确定所述目标图像是否为候选图像的近似重复图像。

Description

检测近似重复图像

相关申请的交叉引用

本专利申请要求于2018年03月30日提交的、申请号为201810277058.9、发明名称为“一种近似重复图像检测方法及装置，电子设备”的中国专利申请的优先权，该申请的全文以引用的方式并入本文中。

技术领域

本申请涉及计算机技术领域，特别是涉及检测近似重复图像。

背景技术

近似重复图像是指仅有色彩、饱和度、裁切、拍摄角度、水印等区别的图像，在UGC(User Generated Content，用户产生内容)数据中存在多种类型的近似重复图像。这些近似重复图像的出现，会给搜索和推荐模型的训练、搜索推荐结果的展示带来负面影响。从而影响用户体验。

发明内容

有鉴于此，本申请提供一种近似重复图像检测方法，以提高现有技术中近似重复图像检测的准确率。

第一方面，本申请实施例提供了一种近似重复图像检测方法，包括：通过多任务网络模型分别确定输入的目标图像的第一特征和第二特征，其中，所述第一特征为包含类间信息和类内信息的图像特征，所述第二特征为反映类内差异的图像特征；根据所述目标图像的所述第一特征和所述第二特征，构造所述目标图像的融合特征；根据所述融合特征，确定所述目标图像是否为候选图像的近似重复图像。

第二方面，本申请实施例提供了一种信息检索装置，包括：特征提取模块，用于通过多任务网络模型分别确定输入的目标图像的第一特征和第二特征，其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反映类内差异的图像特征；特征融合模块，用于根据所述特征提取模块提取的所述目标图像的所述第一特征和所述第二特征，构造所述目标图像的融合特征；近似重复图像检测模块，用于根据所述特征融合模块确定的所述融合特征，确定所述目标图像是否为候选图像的近似重复图像。

第三方面，本申请实施例还公开了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本申请实施例所述的近似重复图像检测方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时本申请实施例公开的近似重复图像检测方法的步骤。

本申请实施例公开的近似重复图像检测方法，通过多任务网络模型分别确定输入的目标图像的第一特征和第二特征，其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反映类内差异的图像特征；根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征；根据所述融合特征，确定所述目标图像是否为候选图像的近似重复图像。本申请公开的近似重复图像检测方法通过结合图像的类内信息和类间信息构建图像的融合特征，使得图像融合特征更全面，进而提升了近似重复图像检测的准确率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例一的近似重复图像检测方法流程图；

图2是本申请实施例二的近似重复图像检测方法流程图；

图3是本申请实施例二的分类模型结构示意图；

图4是本申请实施例二的多任务网络而结构示意图；

图5为近似重复图像的示意图；

图6为非近似重复图像对的示意图；

图7是本申请实施例三的近似重复图像检测装置的结构示意图之一；

图8是本申请实施例三的近似重复图像检测装置的结构示意图之二；

图9是本申请实施例三的近似重复图像检测装置的结构示意图之三。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在某些应用中，首先通过分类方法获取图像特征，然后再检测图像。对于不同类别的图像，获取的特征具有较好的区分性。但是在近似重复图检测场景中，候选集合中的图像大多是相同类别的，采用图像特征表达的方法检测图像，会存在检测准确率低的问题。

为此，本申请提供的近似重复图像检测方法，可以提高近似重复图像的检测准确率。以下结合具体实施例进行说明。

实施例一

本实施例公开的一种近似重复图像检测方法，如图1所示，该方法包括步骤110至步骤130。

步骤110，通过多任务网络模型分别确定输入的目标图像的第一特征和第二特征。

其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反映类内差异的图像特征。

本申请具体实施时，预先训练多任务网络模型。所述多任务网络模型包括多个子网络，如：分类网络、相似性度量网络等，所述分类网络和相似性度量网络共享基础网络。其中，所述基础网络用于提取输入图像的第一特征，所述相似性度量网络用于提取输入图像的第二特征。其中，所述分类网络的优化目标为类间方差最大化，所述相似性度量网络的优化目标为减小近似重复图像之间的类内方差和增大非近似重复图像之间的类内方差。优化过程中增大类间方差是使的不同类别的图像特征具有更大的区分性，优化过程中减小类内方差是使得同一个类别的图像特征尽可能接近。

所述分类网络和相似性度量网络为卷积神经网络，分别包括多个卷积层、特征提取层。具体实施时，所述分类网络可以选择如MobileNet等深度卷积神经网络，然后，可以选择基础网络的某一特征提取层的输出作为输入图像的第一特征。该特征提取层本质上也是一个卷积层，本实施例中将基础网络的网络结构中最后一个卷积层作为图像的特征表达，可以称为特征提取层。所述相似性度量网络可以选择对称卷积神经网络，然后，选择某一卷积层(如相似性度量网络最后一个卷积层)的输出作为输入图像的第二特征。每幅输入图像被称为目标图像，对于每幅目标图像，输入至所述多任务网络模型，可以得到每幅目标图像的第一特征和第二特征。

步骤120，根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征。

在确定了待检测图像对中目标图像的第一特征和第二特征之后，对于其中的每幅目标图像，根据该图像的第一特征和第二特征，构造所述目标图像的融合特征。在一个实施方式中，可以直接将该图像的第一特征和第二特征进行拼接，得到该图像的融合特征。在另一个实施方式中，也可以进一步对该图像的第一特征和第二特征分别进行编码转换，如进行哈希编码转换，并通过转换得到的编码，确定该图像的融合特征。

由于每幅目标图像的第一特征是基础网络提取的输入图像的通用特征，即第一特征为包含反映类间差异和类内差异的图像特征，因此，可以进一步对所述第一特征通过分类网络进行卷积处理，得到单独反映类间差异的第三特征，然后，基于所述第三特征和第二特征，构造相应图像的融合特征。在一个实施方式中，可以直接将该图像的第三特征和第二特征进行拼接，得到该图像的融合特征。在另一个实施方式中，也可以进一步对该图像的第三特征和第二特征分别进行编码转换，如进行哈希编码转换，并通过转换得到的编码，确定该图像的融合特征。

步骤130，根据所述融合特征，确定所述目标图像是否为候选图像的近似重复图像。

对于目标图像，通过前述步骤可以分别获得目标图像的融合特征。此外，预先存有候选图像集，并通过前述步骤获得了候选图像集中的每幅图像的融合特征。进一步的，基于所述目标图像的融合特征和候选图像集中任意一幅候选图像的融合特征，通过现有技术中的相似度度量方法进行比较，即可确定所述目标图像和所述候选图像是否互为近似重复图像。

实施例二

本实施例公开的一种近似重复图像检测方法，如图2所示，该方法包括步骤210至步骤260。

步骤210，基于包括多个近似重复图像的多个图像样本，训练分类模型。

本实施例中所述的多个近似重复图像可以由同一对象的不同图像组成，例如在不同光照条件下拍摄的同一对象的多幅图像，或者，由某一对象的原始图像和对所述原始图像进行裁切、旋转、亮度调节处理后得到的图像组成。本申请实施例中所述的非近似重复图像是指拍摄对象不同的至少两幅图像。

首先搜集平台上已有的不同品类的多个相似图像，作为多个图像样本以训练分类模型。用于训练分类模型的多个训练样本包括多个近似重复图像。在实际使用过程中因为很难收集到大量与原图近似重复的图像作为训练数据，所以可以基于已有图像合成训练样本。以美团点评平台为例，首先收集整理覆盖该平台所有业务场景的所有业务类型的多个图像(如22种业务类型)。图像类别的确定主要考虑实际应用场景。图像类别与业务场景匹配，如：酒店、菜品、丽人等。图像类型的分布尽可能覆盖较多的业务场景，以提升使用图像训练出来的模型的准确度。然后，对每个类型的多个图像进行合成，得到多组近似重复图像，作为多个图像样本。在实际应用场景中，某一原始图像的近似重复图像可以为对该原始图像经过变换的版本，常见的变换操作有:几何仿射变换、模糊、噪声污染、图像内容增强以及压缩等。相应的，为贴近实际应用场景下的近似重复图像，在构成图像样本时，主要涉及的图像处理类型可以包括：亮度变化、对比度变化、裁切、旋转、水印等。对每个类型的多个图像可以进行自动合成处理，得到用于训练分类模型的图像样本。其中，所述自动合成包括：调节亮度、调节对比度、裁切、旋转、水印等变换处理。

然后，基于所述多个图像样本，训练分类模型。

基于前述包括多个近似重复图像的多个图像样本，训练分类模型。例如，分类模型可以是基于MobileNet架构的卷积神经网络。MobileNet是一个流线型的架构，它使用深度可分离的卷积来构建轻量级的深度神经网络，在速度和准确率之间有较好的性能折中。如图3所示，所述分类模型包括多个卷积层310和一个特征提取层320。可以选择MobileNet网络的pool6层做为特征提取层，该层有1024个节点数目，将该层的输出作为输入图像的特征向量的表达。此外，所述分类模型还包括最后一个卷积层330，用于产生样本可能为某个类别的置信度大小，以及损失函数softmaxLoss340，用于衡量模型学习的好坏。具体实施时，分类模型的优化目标为最大化类间方差。训练得到的分类模型获取的特征主要用于区分不同类别之间的图像特征。经过训练，可以得到分类模型的最优权重参数。

步骤220，基于训练得到的所述分类模型的参数，初始化所述多任务网络模型。

如图4所示，本申请实施例中的多任务网络模型包括：分类网络410和相似性度量网络420。所述分类网络410和相似性度量网络420为卷积神经网络，分别包括多个卷积层、特征提取层。所述分类网络410和相似性度量网络420均包括基础网络，所述基础网络包括特征提取层430和特征提取层之前的卷积层。在一个实施方式中，所述分类网络410和相似性度量网络420可以共享基础网络。如图4所示，分类网络410和相似性度量网络420共用了一部分卷积层和特征提取层。在另一个实施方式中，所述分类网络410和相似性度量网络420也可以为独立的网络结构，但是基础网络的参数是共享的。多任务网络模型还包括：卷积层440，为相似性度量网络学习的特征提取层，归一化层，以使图像得到的特征归一化后具有可比性，以及损失函数contrastiveLoss，用于对网络进行优化

无论分类网络410和相似性度量网络420是否共用部分卷积层和特征提取层，为了提升训练效率，可以通过前述步骤训练的分类模型的网络参数初始化所述分类网络410和相似性度量网络420的基础网络参数。。然后，进一步通过训练所述多任务网络模型，进行网络参数微调和优化。

步骤230，基于包括多个近似重复图像对和多个非近似重复图像对的多个图像对样本，训练所述多任务网络模型。

多任务网络初始化完成之后，基于真实业务场景的测试图像，构建多个近似重复图像对和多个非近似重复图像对，用于训练所述多任务网络模型。所述图像对样本中包括匹配指定图像处理类型的图像对，所述指定图像处理类型通过以下方法确定：通过训练得到的所述分类模型，确定测试图像对中每幅图像的图像特征；根据所述测试图像对中两幅图像的图像特征之间的距离，进行近似重复图像判别；根据对匹配不同图像处理类型的图像对进行近似重复图像判别的准确率，确定指定图像处理类型。其中，所述距离是特征向量之间的距离度量，可以为欧式距离，也可以为余弦距离。本公开对此不作限定。

一幅原始图像经过各类预设图像处理后可以得到至少一幅处理图像，近似重复图像对由至少一幅处理图像和所述原始图像中的任意两幅图像组成。近似重复图像对可以是一幅处理图像和一幅原始图像，或者，近似重复图像对也可以是两幅处理图像。其中，各类预设的图像处理包括但不限于以下任意一种：裁切、旋转、水印、亮度变化、对比度变化等。例如，对图5中的原始图像510进行裁切后得到图像520，以及，对原始图像510进行旋转后得到图像530，那么原始图像510和图像520可以构成一个近似重复图像对、原始图像510和图像530可以构成一个近似重复图像对、图像520和图像530也可以构成一个近似重复图像对。而非近似重复图像对由不同的两幅图像组成，如图6所示，图像610和图像620构成一个非近似重复图像对。

然后，上述构建的多个近似重复图像对和多个非近似重复图像对作为测试图像对，输入至步骤210训练得到的分类模型，以确定测试图像对中每一幅图像的图像特征。通过将图像输入至所述分类模型，获取模型pool6层输出的1024维度特征作为图像特征，然后，计算图像对中的2幅图像的图像特征的距离，以确定两幅图像是否相似。测试图像对设置有是否为近似重复图像对的标签。如果，一个近似重复图像对中的两幅图像被识别为不相似，则认为对该图像对的近似重复图像判别失败，或者一个非近似重复图像对中的两幅图像根据图像特征距离，被认定为相似，则认为该图像对的近似重复图像判别失败。最后，统计判别失败的近似重复图像对的图像处理类型，即判别失败的近似重复图像对是经过哪类的图像处理得到的。如果经过某一类图像处理得到的近似重复图像对的判别准确率低于设定的准确率阈值，则确定所述分类模型较难对经过该类图像处理得到的近似重复图像对进行分类识别，则将该类图像处理标识为hard类型。

hard类型的近似重复图像对为仅利用分类获取的特征较难区分的图像对，比如经过裁切、模糊、logo或旋转等图像处理后得到的近似重复图像对。进一步的，基于上述方法可以得到至少一个hard类型，然后基于hard类型构建多个近似重复图像对。例如，将标识为hard类型的测试图像对作为近似重复图像对，或者，选择大量hard类型的测试图像对构建近似重复图像对。同时，根据测试图像对的标签，利用同一类别的不同图像构建非近似重复图像对。

然后，针对hard类型构建的多个近似重复图像对和多个非近似重复图像对，训练所述多任务网络模型。

如图4所示，所述多任务网络模型包括：分类网络和相似性度量网络，所述分类网络和所述相似性度量网络共享基础网络。所述多任务网络模型的训练方法为：通过输入的多个样本，并不断调整网络参数，使得所述分类网络和所述相似性度量网络的输出，尽可能同时接近所述分类网络和所述相似性度量网络的优化目标。其中，所述分类网络的优化目标为增大近似重复图像之间的类间方差；所述相似性度量网络的优化目标为减小近似重复图像之间的类内方差和增大非近似重复图像之间的类内方差。输入至所述多任务网络模型的近似重复图像对和非近似重复图像对中的每幅图像都包括类别标签。训练分类网络时，每次可以同时输入两幅图像或只输入一幅图像。分类网络的输入数据形式可以为{图像，类别}，即具有类别标签的图像。所述分类网络的损失函数为softmaxloss()，优化目标为类间方差最大化。

在训练相似性度量网络时。所述相似性度量网络的输入数据形式可以为{(图像1，类别)，(图像2，类别),是否近似重复图像对}。所述相似性度量网络为对称卷积神经网络，损失函数为Contrastiveloss()，优化目标为减小近似重复图像之间的类内方差和增大非近似重复图像之间的类内方差。需要注意的是，上述输入数据的形式仅仅是在训练时使用的，在后续查询时，可以使用不同的输入格式。

多任务网络模型的具体训练过程，参见现有技术，本实施例中不再赘述。本申请中的多任务网络模型与现有技术中的网络模型的区别在于网络结构和输入的训练数据、优化目标，以及，结合初步训练的分类模型的网络参数对多任务网络模型中相应网络进行初始化。模型的优化过程可参见现有技术的模型训练过程。通过训练分类网络和相似性度量网络，可以得到所述多任务网络中分类网络和相似性度量网络的各层的最优参数。

步骤240，通过多任务网络模型分别确定输入的目标图像的第一特征和第二特征。

通过所述多任务网络模型的基础网络确定目标图像的第一特征；通过所述相似性度量网络对所述第一特征进行卷积运算，确定目标图像的第二特征。

在多任务网络模型训练结束后，可以通过训练好的多任务网络模型，提取输入至所述多任务网络模型的图像的图像特征。根据所述多任务网络模型的网络结构，选择所述分类网络和相似性度量网络共享的基础网络的最后一个特征提取层的输出作为输入图像的第一特征，即所述第一特征包含反映类间差异和类内差异的图像特征，如图4中一个特征提取层430(即基础网络的最后一个卷积层)输出的图像特征。虽然图4中画有两个特征提取层430，但是这两个特征提取层430共享参数，所以输出结果是一样的。当只输入一幅图像时，可以任选其中的一支输出图像特征。然后，选择所述相似性度量网络的最后一个卷积层的输出作为输入图像的第二特征，例如，图4中的440的输出。其中，所述第二特征为对所述第一特征进行卷积运算后，得到的图像特征。

本实施例中，以分类网络为MobileNet网络举例，可以将MobileNet网络pool6层提取的1024维度的特征作为输入图像的第一特征。将相似性度量网络对所述MobileNet网络pool6层提取的1024维度的特征进行进一步卷积处理后得到的256维度的特征，作为所述输入图像的第二特征。其中，所述MobileNet网络pool6层提取的1024维度的特征为输入图像的通用特征，同时反映类间差异和类内差异的图像特征。而通过相似性度量网络进行卷积处理后得到的256维度的特征，则为更细粒度的，反映类内差异的图像特征。

步骤250，根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征。

在一个实施方式中，可以直接将目标图像的第一特征和第二特征进行拼接，将拼接得到的特征，作为所述目标图像的融合特征。例如，将1024维的第一特征和256维的第二特征，依序拼接为1280维的特征向量，作为该目标图像的融合特征。

在另一个实施方式中，根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征，还包括：通过分类网络对所述目标图像的所述第一特征进行卷积运算，得到所述目标图像的第三特征，其中，所述第三特征为反映类间差异的图像特征。根据所述目标图像的所述第三特征和所述第二特征，构造所述目标图像的融合特征。例如，通过分类网络的卷积层，对所述第一特征进行卷积运算，得到单独反映类间差异的第三特征，然后，将所述第三特征和第二特征，依序拼接为多维的特征向量，作为一幅图像的融合特征。通过对第一特征提取单独反映类间差异的第三特征，然后基于所述第三特征和第二特征，构建图像的融合特征，可以减少图像特征的数据量，提升图像比对的效率。

可选的，根据所述目标图像的所述第三特征和所述第二特征，构造所述目标图像的融合特征，还包括：确定所述目标图像的第三特征对应的哈希编码和所述第二特征对应的哈希编码；将所述第三特征对应的哈希编码和所述第二特征对应的哈希编码进行拼接，得到所述目标图像的融合特征。为了进一步减小图像特征的数据量，可以将图像特征进行哈希编码，用哈希编码表示图像的融合特征。例如，512维度的第三特征为[0.7,0.6,0.2,…,0.3,0.8]，通过与阈值0.5进行比较，大于阈值0.5认为该维特征对应的哈希编码为1，小于等于阈值0.5认为该维特征对应的哈希编码为0，则512维的第三特征进行哈希编码后表示为[110…01]。按照同样的方法，对256维的第二特征进行哈希编码，得到的哈希编码表示为[10…000]。对哈希编码进行拼接后，最终得到的图像融合特征为[110…0110…000]。

如果直接根据第一特征和第二特征，构造相应的图像融合特征，可以则对第一特征和第二特征分别进行哈希编码，并将哈希编码进行拼接。可选的，根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征，包括：分别确定所述目标图像的第一特征对应的哈希编码和所述第二特征对应的哈希编码；将所述第一特征对应的哈希编码和所述第二特征对应的哈希编码进行拼接，得到所述目标图像的融合特征。例如，1024维度的第一特征为[0.6,0.6,0.3,…,0.7,0.2]，通过与阈值0.5进行比较，大于阈值0.5认为该维特征对应的哈希编码为1，小于等于阈值0.5认为该维特征对应的哈希编码为0，则1024维的第一特征进行哈希编码后表示为[110…10]。按照同样的方法，对256维的第二特征进行哈希编码，得到的哈希编码表示为[10…000]。对哈希编码进行拼接后，最终得到的图像融合特征为[110…1010…000]。

对于多任务网络而言，第二特征的编码长度需要在合理的范围内，如果过短则类内约束的作用不明显，类似于欠拟合；过长则粒度过细，类似于过拟合，本申请选择第一特征编码长度为1024，第二特征编码长度为256，可以很好地平衡类内差异对检测结果的影响。在训练网络不变的情况下，如果在使用过程中只使用第一特征编码，则检测结果受第二特征编码长度影响较大。本申请通过将第一特征或第三特征与第二特征进行拼接，使得最终得到的图像的融合特征稳定性更高。

步骤260，根据所述融合特征，确定所述目标图像是否为候选图像的近似重复图像。

本申请实施例公开的近似重复图像检测方法，通过基于包括近似重复图像的图像样本，训练分类模型，然后，基于训练得到的所述分类模型的参数，初始化所述多任务网络模型；并基于包括近似重复图像对和非近似重复图像对的图像对样本，训练所述多任务网络模型。通过多任务网络模型确定输入的目标图像的第一特征和第二特征；根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征；最后，根据所述融合特征，确定所述目标图像是否为候选图像的近似重复图像。本申请公开的近似重复图像检测方法通过基于卷积神经网络进行分类模型的预训练，增大图像类间特征方差，并利用学习到的分类模型的参数微调分类及相似性度量多任务网络，进一步增大非近似重复图的类内方差，使得在图像检测过程中，将优化得到的反映类间差异与类内差异的图像特征和更细粒度的反映类内差异的图像特征进行拼接作为图像的融合特征，在增大类间特征方差的同时，可进一步增大非近似重复图的类内方差，有利于提升近似重复图像检测的准确率。

本申请公开的多任务网络模型中，通过将分类网络和相似度量网络输出的特征进行拼接，提升了特征的表达能力。同时，相比单纯使用反映类间差异与类内差异的图像特征，拼接后的图像特征受反映类内差异的特征影响较小，特征稳定性更高。

实施例三

本实施例公开的一种近似重复图像检测装置，如图7所示，所述装置包括：

特征提取模块710，用于通过多任务网络模型分别确定输入的目标图像的第一特征和第二特征，其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反映类内差异的图像特征。

特征融合模块720，用于根据所述特征提取模块710提取的所述目标图像的所述第一特征和所述第二特征，构造所述目标图像的融合特征。

近似重复图像检测模块730，用于根据所述特征融合模块720确定的所述融合特征，确定所述目标图像是否为候选图像的近似重复图像。

可选的，所述多任务网络模型包括：分类网络和相似性度量网络，所述分类网络和所述相似性度量网络共享基础网络。可选的，所述多任务网络模型的训练方法为：通过求解同时满足所述分类网络和所述相似性度量网络的优化目标的网络参数，训练所述多任务网络模型，其中，所述分类网络的优化目标为增大近似重复图像之间的类间方差；所述相似性度量网络的优化目标为减小近似重复图像之间的类内方差和增大非近似重复图像之间的类内方差。

可选的，如图8所示，所述特征提取模块710进一步包括：

第一特征提取单元7101，用于通过所述基础网络确定所述目标图像的第一特征。

第二特征提取单元7102，用于通过所述相似性度量网络对所述第一特征进行卷积运算，确定输入图像对中目标图像的第二特征，其中，所述相似性度量网络的优化目标为减小近似重复图像之间的类内方差和增大非近似重复图像之间的类内方差。

本申请实施例公开的近似重复图像检测装置，通过多任务网络模型分别确定输入的目标图像的第一特征和第二特征，其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反映类内差异的图像特征；根据所述目标图像的第一特征和第二特征，构造所述目标图像的融合特征；根据所述融合特征，确定所述目标图像是否为候选图像的近似重复图像。本申请公开的近似重复图像检测装置通过结合图像的类内信息和类间信息构建图像的融合特征，得到的图像融合特征更全面，进而提升了近似重复图像检测的准确率。

可选的，如图8所示，所述装置还包括：

分类模型训练模块740，用于基于包括多个近似重复图像的多个图像样本，训练分类模型。

多任务网络模型初始化模块750，用于基于训练得到的所述分类模型的参数，初始化所述多任务网络模型。

多任务网络模型训练模块760，用于基于包括多个近似重复图像对和多个非近似重复图像对的图像对样本，训练所述多任务网络模型，其中，所述近似重复图像对由原始图像和和所述原始图像经过预设图像处理后得到的至少一幅图像中的任意两幅图像组成，所述非近似重复图像对由不同的两幅图像组成。

可选的，所述图像对样本中包括匹配指定图像处理类型的图像对，所述指定图像处理类型通过以下方法确定：

通过训练得到的所述分类模型，确定测试图像对中每幅图像的图像特征；根据所述测试图像对中两幅图像的图像特征之间的距离，进行近似重复图像判别；根据对匹配不同图像处理类型的图像对进行近似重复图像判别的准确率，确定指定图像处理类型。

可选的，如图8所示，所述特征融合模块720进一步包括：

第三特征提取单元7201，用于通过对所述目标图像的所述第一特征进行卷积运算，确定所述目标图像的第三特征，其中，所述第三特征为反映类间差异的图像特征。

第一特征融合单元7202，用于根据目标图像的所述第三特征和所述第二特征，构造所述目标图像的融合特征。

可选的，所述第一特征融合模块7202还包括：

第一编码单元72021，用于确定所述目标图像的第三特征对应的哈希编码和所述第二特征对应的哈希编码。

所述第一特征拼接单元72022，还用于将所述第三特征对应的哈希编码和所述第二特征对应的哈希编码进行拼接，得到所述目标图像的融合特征。

在另一实施例中，如图9所示，所述特征融合模块720进一步包括：

第二编码单元7204，用于分别确定所述目标图像的第一特征对应的哈希编码和所述第二特征对应的哈希编码；

第二特征融合单元7205，用于将所述第一特征对应的哈希编码和所述第二特征对应的哈希编码进行拼接，得到所述目标图像的融合特征。

本申请公开的近似重复图像检测装置，通过基于卷积神经网络进行分类模型的预训练，用于增大图像类间特征方差，并利用学习到的分类模型的参数微调分类及相似性度量多任务网络，进一步增大非近似重复图的类内方差，使得在图像检测过程中，将优化得到的反映类间差异与类内差异的图像特征和更细粒度的反映类内差异的图像特征进行拼接做为图像的融合特征，在增大类间特征方差的同时，可进一步增大非近似重复图的类内方差，有利于提升近似重复图像检测的准确率。

相应的，本申请还公开了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如本申请实施例一和实施例二所述的近似重复图像检测方法。所述电子设备可以为PC机、移动终端、个人数字助理、平板电脑等。

本申请还公开了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请实施例一和实施例二所述的近似重复图像检测方法的步骤。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上对本申请提供的一种近似重复图像检测方法及装置进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件实现。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

Claims

一种近似重复图像检测方法，包括：

通过多任务网络模型分别确定输入的目标图像的第一特征和第二特征，其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反映类内差异的图像特征；

根据所述目标图像的所述第一特征和所述第二特征，构造所述目标图像的融合特征；

根据所述融合特征，确定所述目标图像是否为候选图像的近似重复图像。
根据权利要求1所述的方法，其特征在于，

所述多任务网络模型包括：分类网络和相似性度量网络，所述分类网络和所述相似性度量网络共享基础网络，

所述多任务网络模型的训练方法为：

通过求解同时满足所述分类网络和所述相似性度量网络的优化目标的网络参数，训练所述多任务网络模型，其中，

所述分类网络的优化目标为增大近似重复图像之间的类间方差；

所述相似性度量网络的优化目标为减小近似重复图像之间的类内方差和增大非近似重复图像之间的类内方差。
根据权利要求2所述的方法，其特征在于，通过所述多任务网络模型分别确定所述目标图像的所述第一特征和所述第二特征，包括：

通过所述基础网络确定所述目标图像的所述第一特征；

通过所述相似性度量网络对所述第一特征进行卷积运算，确定所述目标图像的所述第二特征。
根据权利要求2或3所述的方法，其特征在于，通过所述多任务网络模型分别确定所述目标图像的第一特征和第二特征之前，还包括：

基于包括多个近似重复图像的多个图像样本，训练分类模型；

基于训练得到的所述分类模型的参数，初始化所述多任务网络模型；

基于包括多个近似重复图像对和多个非近似重复图像对的图像对样本，训练所述多任务网络模型，其中，

所述近似重复图像对由原始图像和所述原始图像经过预设图像处理后得到的至少一幅图像中的任意两幅图像组成，

所述非近似重复图像对由不同的两幅图像组成。
根据权利要求4所述的方法，其特征在于，

所述图像对样本中包括匹配指定图像处理类型的图像对，

所述指定图像处理类型通过以下方法确定：

通过训练得到的所述分类模型，确定测试图像对中每幅图像的图像特征；

根据所述测试图像对中两幅图像的所述图像特征之间的距离，进行近似重复图像判别；

根据对匹配不同图像处理类型的图像对进行近似重复图像判别的准确率，确定所述指定图像处理类型。
根据权利要求1所述的方法，其特征在于，根据所述目标图像的所述第一特征和所述第二特征，构造所述目标图像的所述融合特征，包括：

通过对所述目标图像的所述第一特征进行卷积运算，确定所述目标图像的第三特征，其中，所述第三特征为反映类间差异的图像特征；

根据所述目标图像的所述第三特征和所述第二特征，构造所述目标图像的所述融合特征。
根据权利要求6所述的方法，其特征在于，根据所述目标图像的所述第三特征和所述第二特征，构造所述目标图像的所述融合特征，还包括：

分别确定所述目标图像的所述第三特征对应的哈希编码和所述第二特征对应的哈希编码；

将所述第三特征对应的哈希编码和所述第二特征对应的哈希编码进行拼接，得到所述目标图像的所述融合特征。
根据权利要求1至3任一项所述的方法，其特征在于，根据所述目标图像的所述第一特征和所述第二特征，构造所述目标图像的所述融合特征，包括：

分别确定所述目标图像的所述第一特征对应的哈希编码和所述第二特征对应的哈希编码；

将所述第一特征对应的哈希编码和所述第二特征对应的哈希编码进行拼接，得到所述目标图像的所述融合特征。
一种近似重复图像检测装置，包括：

特征提取模块，用于通过多任务网络模型分别确定输入的目标图像的第一特征和第二特征，其中，所述第一特征包含反映类间差异和类内差异的图像特征，所述第二特征为反映类内差异的图像特征；

特征融合模块，用于根据所述特征提取模块提取的所述目标图像的所述第一特征和所述第二特征，构造所述目标图像的融合特征；

近似重复图像检测模块，用于根据所述特征融合模块确定的所述融合特征，确定所述目标图像是否为候选图像的近似重复图像。
一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至8任意一项所述的近似重复图像检测方法。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至8任意一项所述的近似重复图像检测方法的步骤。