WO2020244437A1

WO2020244437A1 - 图像处理方法、装置及计算机设备

Info

Publication number: WO2020244437A1
Application number: PCT/CN2020/092834
Authority: WO
Inventors: 揭泽群; 袁粒; 冯佳时
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2019-06-06
Filing date: 2020-05-28
Publication date: 2020-12-10
Also published as: CN110188223A; EP3982275A1; CN110188223B; US20210382937A1; EP3982275A4

Abstract

一种图像处理方法、装置及计算机设备，依据卷积神经网络，得到各训练图像在特征嵌入空间对应的特征点，及各训练图像所属第二数量类图像各自的特征中心点，通过中心碰撞方式进行网络训练，得到各类图像对应的目标特征中心点，之后，得到的各特征点及各目标特征中心点映射到汉明空间，得到第一数量个哈希码及第二数量个哈希中心点，此时，仍可以通过中心碰撞方式进行网络训练，得到图像哈希模型。通过学习各训练图像的哈希码之间的相似度，以及训练图像特征点与对应的中心点之间的相似度，不仅学习到图像的全局分布，且极大缩短了网络训练时间，提高了学习效率及图像哈希码的精度。

Description

图像处理方法、装置及计算机设备

本申请要求于2019年06月06日提交中国国家知识产权局、申请号为201910492017.6、申请名称为“图像处理方法、装置及计算机设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像检索技术领域，具体涉及一种图像处理方法、装置及计算机设备。

背景技术

随着互联网图像的日益增多，如何快速且准确地为用户提供所需的图像资源显得越来越重要，目前常用的图像检索方法是通过提取图像的底层特性对图像内容进行描述，然后再利用特征比对判断是否为相似图像。

为了提高检索准确率，往往需要提取成百上千维的图像特征，这就需要庞大的存储空间来保存图像特征库，且每次特征比对的工作量很大，极大降低了检索速度。

如何提供一种高效的、精准的图像检索方法成为亟待解决的技术问题。

发明内容

有鉴于此，本申请实施例提供一种图像处理方法、装置及计算机设备，通过中心碰撞方式实现图像哈希模型的训练，极大提高了训练效率及准确性。

为实现上述目的，本申请实施例提供如下技术方案：

本申请提供了一种图像处理方法，由图像处理系统执行，所述方法包括：

接收检索目标的描述信息；

根据所述描述信息从图像哈希码数据库中确定目标哈希码，所述图像哈希码数据库中的每个哈希码是通过图像哈希模型对图像进行学习得到，所述图像哈希模型是使得相似图像投射到空间中同一中心点的数学模型；

根据所述目标哈希码以及图像与哈希码的对应关系，从图像库中确定所述检索目标。

获取第一数量个训练图像；

依据卷积神经网络，得到所述第一数量个训练图像在特征嵌入空间各自对应的特征点，及所述第一数量个训练图像所属第二数量类图像各自的特征中心点；

获取第一数量个特征点与对应特征中心点碰撞的特征条件概率分布，及预设的理想条件概率分布；

利用所述特征条件概率分布与所述理想条件概率分布进行网络训练，得到所述第二数量类图像各自的目标特征中心点；

将所述第一数量个特征点及第二数量个目标特征中心点分别映射到汉明空间，得到所述第一数量个训练图像各自的哈希码及所述第二数量类图像各自的哈希中心点；

获取第一数量个哈希码与对应哈希中心点碰撞的哈希条件概率分布；

利用所述哈希条件概率分布与所述理想条件概率分布进行网络训练，得到图像哈希模型及图像哈希码数据库，所述图像哈希码数据库包括网络训练得到的所述第一数量个训练图像各自的目标哈希码。

本申请还提供了一种图像处理装置，所述装置包括：

通信模块，用于接收检索目标的描述信息；

检索模块，用于根据所述描述信息从图像哈希码数据库中确定目标哈希码，所述图像哈希码数据库中的每个哈希码是通过图像哈希模型对图像进行学习得到，所述图像哈希模型是使得相似图像投射到空间中同一中心点的数学模型；

确定模块，用于确定根据所述目标哈希码以及图像与哈希码的对应关系，从图像库中确定所述检索目标。

本申请还提供了一种图像处理装置，所述装置包括：第一获取模块，用于获取第一数量个训练图像；

第一处理模块，用于依据卷积神经网络，得到所述第一数量个训练图像在特征嵌入空间各自对应的特征点，及所述第一数量个训练图像所属第二数量类图像各自的特征中心点；

第二获取模块，用于获取第一数量个特征点与对应特征中心点碰撞的特征条件概率分布，及预设的理想条件概率分布；

第一网络训练模块，用于利用所述特征条件概率分布与所述理想条件概率分布进行网络训练，得到所述第二数量类图像各自的目标特征中心点；

映射模块，用于将所述第一数量个特征点及第二数量个目标特征中心点分别映射到汉明空间，得到所述第一数量个训练图像各自的哈希码及所述第二数量类图像各自的哈希中心点；

第三获取模块，用于获取第一数量个哈希码与对应哈希中心点碰撞的哈希条件概率分布；

第二网络训练模块，用于利用所述哈希条件概率分布与所述理想条件概率分布进行网络训练，得到图像哈希模型及图像哈希码数据库，所述图像哈希码数据库包括网络训练得到的所述第一数量个训练图像各自的目标哈希码。

本申请还提供了一种存储介质，其上存储有程序，所述程序被处理器执行，实现如上图像处理方法的各步骤。

本申请还提供了一种计算机集群，所述计算机集群包括至少一台计算机设备，所述计算机设备包括：

通信接口；

存储器，用于存储实现如上图像处理方法的程序；

处理器，用于加载并执行所述存储器存储的程序，实现如上图像处理方法的各步骤。

基于上述技术方案，本申请实施例提供的一种图像处理方法。该方法基于相似的图像投射到空间(例如是特征空间和/或汉明空间)中的同一中心点这一原理训练出的图像哈希模型对图像库中的图像进行处理，得到各图像的哈希码，从而获得图像哈希码数据库。在检索图像时，利用上述哈希码代替图像特征进行检索，提高了检索效率。

进一步地，上述图像哈希模型是学习图像特征点与相似图像形成的一类图像的中心点之间相似度，而不是各图像之间的相似度，一方面可以学习到图像的全局分布，可以提高哈希码的质量，提高检索精度。另一方面，大幅度降低了图像哈希模型学习的复杂度，缩短了训练时间，提高了学习效率。

附图说明

为了更清楚地说明本申请实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1A为本申请实施例提供的一种图像处理方法的流程示意图；

图1B为本申请实施例提供的一种图像处理方法的流程示意图；

图2为本申请实施例提供的另一种图像处理方法的流程示意图；

图3为本申请实施例提供的一种图像处理方法的应用示意图；

图4为本申请实施例提供的又一种图像处理方法的流程示意图；

图5a为本申请实施例提供的图像处理方法中，一种图像检索应用示意图；

图5b为本申请实施例提供的图像处理方法中，另一种图像检索应用示意图；

图6为本申请实施例提供的一种图像处理装置的结构示意图；

图7为本申请实施例提供的另一种图像处理装置的结构示意图；

图8为本申请实施例提供的另一种图像处理装置的结构示意图；

图9为本申请实施例提供的又一种图像处理装置的结构示意图；

图10为本申请实施例提供的一种计算机设备的硬件结构示意图。

具体实施方式

本申请的发明人发现，已有的基于哈希算法的图像检索方法应用中，对于待检索的n个图像，其时间复杂度为O(log(n！))，在实际应用场景中，n的取值往往很大，导致很难学习到图像的全局分布，针对该问题，本申请的发明人不断对已有的图像库检索方法进行改善。

在研究过程中，发明人注意到，如卷积神经网络等深度学习算法，在如图像分类、物体识别、人脸识别等众多计算机视觉任务的准确度上，能够实现一个飞跃。其中，卷积神经网络依据其具备的特征提取能力，能够很好地适用于基于内容的图像检索(content-based image retrieval，CBIR)任务。所以，本申请提出将卷积神经网络与基于哈希算法的图像检索方法结合起来，即通过训练一个卷积神经网络将图像映射成低维度的特征，再将特征转化为二进制码进行检索，以达到提高检索精度及检索效率的目的。

并且，发明人注意到，相关的图像库检索方法中，无论是利用图像特征，直接计算图像之间的相似度，还是通过哈希码计算图像之间的相似度，进而实现模型训练，该过程都是样本图像之间的数据处理，需要花费大量时间进行学习，导致图像库检索的时间复杂度很大。

基于上述分析，本申请提出在常用的哈希算法基础上，设计一种基于可学习的动态数据中心相似性的哈希方法，实现更加精确且高效的图像处理方案，其可以用于图像检索应用场景。

该方法是基于一个简单的几何直觉，即当所有相似的数据被投射到空间(例如特征空间和/或汉明空间)中的相同点，不相似的数据被投射到空间中的不同点时，可以得到这些数据理想的哈希码，利用这些理想状态下的哈希码，可以实现高精度的图像库检索。

具体的，本申请可以在训练图像的特征空间学习一系列的中心点，该中心点可以称为特征中心点，这些特征中心点保留着图像的语意信息，及与原始图像之间的相似性，之后，可以将每个训练图像的特征点与其相应的特征中心点(即该图像特征点所属类别的特征中心点)碰撞，即中心碰撞。其中，碰撞是由撞库衍生而来，在本申请实施例中，训练图像的特征点与其相应的特征中心点碰撞是指特征点与特征中心点的相似度达到预设阈值。也就是说，每一类图像对应一个特征中心点，对于待检索的图像，可以直接将其特征点与特征中心点比较，快速识别待检索的图像所属类别，基于该类别可以快速检索到需要的图像。

同时，本申请还可以将得到的训练图像的特征点和特征中心点，通过哈希层投射到汉明空间，得到各训练图像对应的哈希码及特征中心点对应的哈希中心点。按照上述方式，中心碰撞也会发生在汉明空间。这样，中心碰撞发生在特征空间和汉明空间这两个空间中，可以保持中心相似性在特征空间与汉明空间的一致性。

本申请将上述构思应用于大规模的图像库检索中，相对于相关的基于哈希算法的图像库检索方法(如上述背景技术部分描述的方法)，不仅能够学习到数据的全局分布，同时中心碰撞哈希每次可以从多个数据点学习相似度信息，极大提高了学习效率，缩短了训练时间，进而提高了图像检索效率且准确性。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供的图像处理方法可以应用于图像处理系统。该图像处理系统可以部署在云计算集群(包括至少一台云计算设备)中，通过人工智能云服务，一般也被称作是AIaaS(AI as a Service，中文为“AI即服务”)的方式提供给用户使用。具体地，用户通过浏览器在云计算集群中创建图像处理系统的实例，然后通过浏览器与图像处理系统的实例交互，实现图像处理。

在一些实现方式中，图像处理系统也可以部署在物理设备，如终端和/或服务器中，以客户端的形式提供给用户使用。具体地，终端可以获取图像处理系统的安装包，然后运行该安装包，以实现在终端上部署图像处理系统的客户端。终端运行该客户端，实现图像处理。当然，在一些情况下，终端运行客户端，并与服务器上部署的图像处理系统的服务端交互，实现图像处理。

为了使得本申请的技术方案更加清楚、易于理解，下面将从图像处理系统的角度对本申请提供的图像处理方法进行介绍。

参见图1A所示的图像处理方法的流程图，该方法包括：

S102：图像处理系统接收检索目标的描述信息。

检索目标是指需要检索的图像。在图像检索场景中，为了检索出需要检索的图像，用户可以通过图形用户界面(graphical user interface，GUI)输入上述检索目标的描述信息，该描述信息可以是文字，也可以是图像。也即该方法支持以文字检索图像，或者以图像检索图像。

目标的描述信息是文字时，该描述信息可以是至少一条语句。例如，该描述信息可以是“今天天气很好，草地上有一只金毛狗在欢快地撒野”。在一些实现方式中，描述信息也可以是至少一个关键词。例如，该描述信息可以是“晴天、草地、金毛狗、撒野”。

目标的描述信息是图像时，该图像具体是与检索目标相似的图像，甚至可以是与检索目标相同的图像。例如，描述信息可以是清晰度较低的图像或者带有水印的图像，用户可以输入该描述信息进行检索获得清晰度较高的图像，或者不带水印的图像。

还需要说明的是，在一些实现方式中，用户可以通过语音的方式输入上述描述信息。例如，用户可以通过语音输入语句或者关键词，或者输入图像的地址等。图像处理系统可以将语音转换为文字，或者根据语音中输入图像的地址获得输入图像，然后以文字检索图像，或者以图像检索图像。

在一些实现方式中，应用也可以通过该图像处理系统检索图像。具体地，图像处理系统也可以接收应用发送的、检索目标的描述信息。

S104：图像处理系统根据所述描述信息从图像哈希码数据库中确定目标哈希码。

所述图像哈希码数据库中的每个哈希码是通过图像哈希模型对图像进行学习得到，所述图像哈希模型是使得相似图像投射到空间中同一中心点的数学模型。

其中，每一类图像对应一个中心点。根据相似图像投射空间不同，中心点还可以分为不同类型。例如，相似图像投射到特征空间时，该中心点为特征中心点，相似图像投射到汉明空间时，该中心点为哈希中心点。基于此，在一些实现方式中每一类图像可以对应一个特征中心点和/或一个哈希中心点。

图像处理系统可以基于描述信息确定与该描述信息相对应的中心点(例如特征中心点或哈希中心点)，然后基于该中心点确定目标哈希码。

具体地，描述信息为文字时，图像处理系统可以根据描述信息确定检索目标所属的类别，然后确定与该类别相对应的哈希中心点，根据该哈希中心点从所述图像哈希码数据库中确定目标哈希码。

描述信息为图像时，图像处理系统可以确定该图像对应的哈希码，具体是将图像输入图像哈希模型，从而获得哈希码，该哈希码可以称为参考哈希码。然后图像处理系统可以从图像哈希码数据库中确定与所述参考哈希码匹配的目标哈希码。具体地，图像处理系统可以将参考哈希码附近的哈希码(即与参考哈希码的距离在预设范围以内的哈希码)确定为目标哈希码。

S106：图像处理系统根据所述目标哈希码以及图像与哈希码的对应关系，从图像库中确定所述检索目标。

图像哈希码数据库中的哈希码与图像库中的图像是一一对应的，图像处理系统可以根据该对应关系，从图像库中确定与目标哈希码匹配的图像，作为检索目标。其中，与目标哈希码匹配的图像可以是与目标哈希码对应的图像。

在一些实现方式中，图像处理系统还可以通过GUI呈现所述检索目标，以便用户查看。

图1A所示实施例中，图像处理的关键即在于图像哈希模型。该图像哈希模型可以通过训练得到。具体地，图像处理系统可以构建一个初始图像哈希模型，该初始图像哈希模型包括特征提取网络和特征嵌入网络。

其中，特征提取网络用于提取图像的特征。该特征提取网络可以是卷积神经网络(convolutional neural networks，CNN)、循环神经网络(recurrent neural networks,RNN)或者深度神经网络(deep neural networks,DNN)等。

所述特征嵌入网络包括特征嵌入层和哈希层，其中，特征嵌入层用于将特征提取网络提取的特征投射到嵌入空间(即特征空间)得到特征点，哈希层用于将特征点投射到汉明空间。其中，哈希层可以包括多层全连接层，在多层全连接层之后还可以包括一个双曲正切函数，以将连续向量整合为二值化的向量。

所述初始图像哈希模型的损失函数(也可以称为目标函数)可以根据相似图像被投射到特征空间的第一损失函数和/或相似图像被投射到汉明空间的第二损失函数确定。如果仅在特征空间进行中心碰撞，则初始图像哈希模型的损失函数根据上述第一损失函数确定，如果仅在汉明空间进行中心碰撞，则初始图像哈希模型的损失函数根据上述第而损失函数确定，如果在特征空间和汉明空间均进行中心碰撞，则初始图像哈希模型的损失函数根据上述第一损失函数和第二损失函数确定。

接着，图像处理系统根据训练图像输入所述初始图像哈希模型，通过所述损失函数确定的损失值更新所述初始图像哈希模型的参数，以训练所述初始图像哈希模型得到图像哈希模型。

需要说明的是，所述第一损失函数可以根据特征条件概率分布和理想条件概率分布确定。其中，所述特征条件概率分布用于表征一个特征点被投射到一个特征中心点的概率。

所述第二损失函数可以根据哈希条件概率分布和理想条件概率分布确定。其中，所述哈希条件概率分布用于表征一个哈希码被投射到哈希中心点的概率。

在一些可能的实现方式中，所述初始图像哈希模型的损失函数根据相似图像被投射到特征空间的第一损失函数、相似图像被投射到汉明空间的第二损失函数以及所述特征空间的特征向量进行二值化的第三损失函数确定。

以上主要从用户交互的角度对图像处理方法进行介绍，接下来从技术的角度对图像处理方法进行介绍。

参照图1B，为本申请实施例提供的一种图像处理方法的流程示意图，本实施提供的方法可以应用于计算机设备，该计算机设备可以是服务器或终端设备，本申请对该计算机设备的产品类型不作限定，且本实施例主要描述图像检索应用场景所使用的图像哈希模型的训练过程，即如何通过中心碰撞方式，训练得到图像哈希模型的实现过程，如图1B所示，该方法可以包括但并不局限于以下步骤：

步骤S11，获取第一数量个训练图像；

本申请对训练图像的来源不作限定，为了方便技术方案的描述，本实施例可以将第一数量个训练图像依次记为{x ₁，x ₂，…，x _i，…，x _n}，可见，第一数量可以记为n，本实施例对n的具体数值大小不做限定。

在本实施例中，可以将n个训练图像组成的图像库记为训练图像库，且在模型训练之前，可以提前确定上述n个训练图像包含的第二数量个图像类别，该第二数量可以记为z，其具体数值不做限定。

另外，本申请还可以按照图像类别，对训练图像库中的每个训练图像进行标注，得到每个训练图像对应的标签l _i，因此，上述n个训练图像对应标注的标签可以记为{l ₁，l ₂，…，l _i，…，l _n}，且对于上述n个训练图像中的相似训练图像，如x _i、x _j，两者标注的标签可以相同，即l _i＝l _j，相应地，用于指示这两个训练图像是否相似的指示函数δ(l _i，l _j)＝1；否则为0。可见，同类别训练图像可以标注相同的标签。

需要说明，本申请对上述训练图像的标签的确定方法不做限定，在实际应用中，确定训练图像标签的一组编号后，可以一直使用该标签进行后续条件概率的计算。

步骤S12，依据卷积神经网络，得到第一数量个训练图像在特征嵌入空间各自的特征点，及第一数量个训练图像所属第二数量类图像各自的特征中心点；

本实施例中，可以将第一数量个训练图像依次输入卷积神经网络，得到各训练图像的图像特征，再将图像特征映射到特征嵌入空间，得到第一数量个训练图像对应的特征点。其中，卷积神经网络可以包括卷积层、池化层、全连接层等，本实施例可以利用多层卷积层，实现对训练图像的特征提取，得到图像特征，具体卷积层的处理过程不做详述。

另外，将提取的图像特征映射到特征嵌入空间的过程实际上是一个降维过程，即将高维度的特征向量(即由提取的图像特征构成)映射到低维度空间(即本实施例中的特征空间)，本实施例对该特征映射实现过程不做详述。

可选的，本实施例可以采用词嵌入方式，具体可以使用但并不局限于Embedding module(词袋模型)这种嵌入模型，将卷积神经网络得到的高维度的向量转换为低维度的特征向量，这种词嵌入方式的具体实现方法本申请不做详述，且对于本申请提出的特征向量降维处理的方法，并不局限于本申请给出的这种词嵌入方式。

按照上述方式，本实施例可以得到n个训练图像在特征嵌入空间对应的特征点，依次可以记为{v ₁，v ₂，…，v _i，…，v _n}，每一个特征点可以是一个多维度向量，用来可以表征相应训练图像的内容，本申请对各特征点的内容不作限定。

对于上述特征中心点的获取过程，可以利用卷积神经网络的全连接层的学习结果得到，如可以将由1构成的参数向量输入全连接层，学习得到特征中心点，通常情况下，此时得到的特征中心点往往不够准确，还需要通过网络训练，进一步对特征中心点进行优化，具体实现过程可以参照下文实施例相应部分的描述。

需要说明，在多次网络训练过程中，需要经过全连接层得到的特征中心点，受到损失函数(如下文实施例给出的目标函数)最小化训练后，与同类训练图像的特征点的距离之和最小，可以认为本次得到的特征中心点即为该类图像的最佳特征中心点，网络训练过程可以参照下文实施例相应部分的描述。

步骤S13，获取第一数量个特征点与对应特征中心点碰撞的特征条件概率分布，及预设的理想条件概率分布；

本实施例按照上述方式得到每一类训练图像的特征中心点c _k，以及各训练图像的特征点v _i后，针对该类图像中的每一个训练图像的特征点v _i，可以利用以下公式(1)，获取该特征点v _i与对应类图像的特征中心点c _k碰撞的特征条件概率分布，但并不局限于这种计算方式：

其中，v _i可以表示第i个训练图像的特征点，c _k可以表示第k类图像的特征中心点，p(c _k|v _i)可以是条件概率函数，具体可以表示特征点v _i与对应的可能的特征中心点c _k碰撞的条件概率，该特征中心点c _k是指具有该特征点v _i的训练图像所属图像类的特征中心点，exp{}可以表示自然数e为底的指数函数，D()可以表示距离函数，如计算欧式距离或其他距离的参数，因此，D(v _i,c _k)具体可以表示特征点v _i与对应的可能的特征中心点c _k的特征距离，D(v _i,c _m具体可以表示特征点v _i与对应的可能的特征中心点c _m的特征距离；∑()可以是求和函数，m可以为累加求和符合∑的动态编号，可以从[1，z]之间取值；δ(l _i,l _m)可以是指示标签l _i，l _m分别对应的训练图像是否相似的指示函数，如δ(l _i,l _m)＝1可以表示这两个训练图像相似；δ(l _i,l _m)＝0可以表示这两个训练图像不相似，该指示函数可以在模型训练前生成，如在对训练图像标注标签时生成；θ可以表示条件概率配置参数，本申请对θ的数值可以不做限定，且在实际应用中，可以通过改变θ的数值，调整上述条件概率函数的准确性。

本实施例中，上述公式(1)这一条件概率函数具体可以是正态函数，该正态函数的极大值可以对应特征中心点c _k，对于训练图像的特征点v _i越靠近该特征中心点c _k，对应的条件概率越大，若某训练图像的特征点v _i与特征中心点c _k碰撞，即中心碰撞，对应的条件概率可以是极大值，说明该训练图像确定属于该特征中心点对应的图像类；反之，某训练图像的特征点v _i与特征中心点c _k的条件概率越小，说明该训练图像与该特征中心点对应的图像类的差距越大，也就是说，上文对该训练图像的图像类别划分可能有误，该训练图像可能不属于该类图像。

可见，本申请可以利用上文得到的条件概率，实现对训练图像的准确分类，具体实现过程本实施例不做详述，对于如何利用公式(1)实现步骤S13的具体方法也不作详述，且步骤S13的实现方法也并不局限于公式(1)表示的计算方法。

另外，结合上文对本申请技术构思的分析，理想情况下，上述训练图像库中，相似的训练图像可能被投射到对应类图像的特征中心点，不相似的训练图像可能被投射到不同类图像的特征中心点，由此得到的理想特征条件概率分布可以为：

如公式(2)所示，某训练图像的标签l _i与对应的图像的类别k相等，该训练图像的特征点与该类图像的特征中心点碰撞，该训练图像属于该类图像。因此，若p(c _k|v _i)＝p ₀(c _k|v _i)，

说明所有相似训练图像的特征点碰撞到相应的特征中心点。

步骤S14，利用特征条件概率分布与理想条件概率分布进行网络训练，得到第二数量类图像各自的目标特征中心点；

可选的，本申请可以按照特征条件概率分布与理想条件概率分布的第一相似要求，调整卷积神经网络的配置参数，得到第二数量类图像各自的目标特征中心点。

其中，对于特征条件概率分布与理想条件概率分布的相似度或者匹配程度，可以采用KL散度(Kullback–Leibler divergence)方式确定，该KL散度描述这两个概率分布的差异，具体计算原理不做详述。

具体的，本申请可以按照上述方式进行中心碰撞学习，获取各类训练图像更加准确的特征中心点，即确定各类图像的中心碰撞的目标特征中心点。且本实施例可以将上述方式作为中心碰撞学习的目标函数，即由该目标函数控制实现中心碰撞学习，其中，该目标函数(即上文所述的第一损失函数)可以为但并不局限于公式(3)：

上述公式(3)中，B可以表示各训练图像对应的特征点组成的集合，本申请对KL散度的具体计算过程不做详述。

由此可见，本申请利用上述目标函数进行中心碰撞学习中，每一次学习得到的特征中心点后，若利用该特征中心及各训练图像的特征点，按照上述方式得到的特征条件概率分布，与理想特征条件概率分布的匹配程度不满足第一条件，说明本次学习得到的特征中心点不够准确，所以，本实施例可以对上述卷积神经网络的配置参数，如权重值，进而利用调整后的配置参数，重新获取新的特征中心点，即更新上述得到的z个特征中心点，直至新得到的特征条件概率分布与理想条件概率分布的满足第一相似要求，并并将最后得到的多个特征中心点作为目标特征中心点。

步骤S15，将第一数量个特征点及第二数量个目标特征中心点分别映射到汉明空间，得到第一数量个训练图像各自的哈希码及第二数量类图像各自的哈希中心点；

本实施例可以通过哈希层，将第一数量个训练图像对应的特征点，映射到汉明空间，得到相应训练图像的哈希码h _i，同理，可以将上文得到的z个目标特征中心点输入哈希层，投射到汉明空间，得到对应的哈希中心点。

可选的，在实际应用中，由于通过哈希层的数据很难被完全整合为二值化向量，也就是说，将特征点及特征中心点输入哈希层，直接得到的哈希码和哈希中心点可能不都是二值数据，因此，本实施例可以利用如下公式(4)所示的损失函数，先将得到的各训练图像的特征点和特征中心点，进一步整合为二值化的数据，该损失函数(即上文所述的第三损失函数)可以为：

步骤S16，获取第一数量个哈希码与对应哈希中心点碰撞的哈希条件概率分布；

步骤S17，利用哈希条件概率分布与理想条件概率分布进行网络训练，得到图像哈希模型；

本实施例中，哈希中心碰撞学习与上述特征中心碰撞学习的实现方法类似，如按照哈希条件概率分布与所述理想条件概率分布的第二相似要求，调整哈希条件概率配置参数，该第二相似要求可以是哈希条件概率分布与所述理想条件概率分布的匹配程度达到相似阈值。

具体的，可以采用如下公式(5)来获取各训练图像的目标哈希码h _i与对应类图像的哈希中心点c _k ^h匹配的哈希条件概率分布：

其中，h _i可以表示第i个训练图像的目标哈希码，c _k ^h可以表示第k类图像的哈希中心点，θ表示哈希条件概率配置参数，本申请对其具体数值不做限定。

在汉明空间中，实现哈希中心碰撞学习的目标函数(即上文所述的第二损失函数)可以为如下公式(6)，但并不局限于此：

可见，如图3所示，本申请进行中心碰撞学习的全局目标函数可以为：

L＝L ^v _collapsing+λ ₁L ^h _collapsing+λ ₂L _Q； (7)

其中，λ ₁和λ ₂可以表示相应目标函数或损失函数，在整个全局目标函数中的权重，具体数值不做限定，本申请对如何利用全局目标函数实现网络训练，得到所需的图像哈希模型的实现过程不再详述。

因此，在本实施例实际应用中，将训练图像的图像特征映射到特征嵌入空间后，在该特征嵌入空间，可以利用上述公式(3)的目标函数，控制中心碰撞学习，得到各类训练图像的更准确的目标特征中心；利用上述公式(4)的量化损失函数，实现对目标特征中心及特征点的二值化处理，再将处理后的目标特征中心及特征点映射到汉明空间后，在汉明空间，可以利用上述公式(6)的目标函数，控制哈希中心碰撞学习，得到各类训练图像更准确的哈希码，同时，确定得到训练图像最佳特征中心点和最佳哈希码所使用的哈希函数，并将其作为图像哈希模型，用来在实际应用中，快速且准确获取输入图像的哈希码。

由此可见，相对于相关技术中，学习各训练图像的哈希码之间的相似度，本申请这种学习训练图像特征点与对应的中心点之间的相似度，不仅学习到图像的全局分布，且极大缩短了网络训练时间，提高了学习效率及图像哈希码的精度。

参照图2所示的本申请提供的一种图像处理方法的细化实施例的流程示意图，以及图3所示图像处理方法的应用示意图，该图像处理方法的细化方法可以包括：

步骤S21，获取第一数量个训练图像及其对应标注的标签；

步骤S22，依据获取的标签，得到训练图像相似的指示函数；

其中，关于训练图像的标签以及该指示函数δ(l _i，l _j)的确定方式，可以参照上述实施例相应部分的描述。

步骤S23，将第一数量个训练图像依次输入卷积神经网络，得到各训练图像的图像特征；

步骤S24，将第一数量个训练图像各自的图像特征映射到特征嵌入空间，得到相应训练图像的特征点；

步骤S25，经卷积神经网络的一全连接层的学习，得到第一数量个训练图像所属的多类图像各自的特征中心点；

本实施例中，继上文描述，如图3所示，可以将1构成的参数向量输入卷积神经网络的全连接层进行学习，生成每一类训练图像的一个特征中心点c _j，并将得到的各类训练图像的特征中心点作为向量元素，构成特征中心点向量。

其中，这一层全连接层的尺寸为z×d，上述j＝1、2、…、z，z表示上述n个训练图像存在的特征中心点的个数，也就是n个训练图像包含的训练图像类别数量，即一类训练图像对应有一个特征中心点，d表示卷积层提取得到的图像特征组成的特征向量的维度，本申请对z和d的具体数值不做限定。基于此，步骤S25得到的多个特征中心点依次可以记为{c ₁，c ₂，…，c _z}。

步骤S26，获取第一数量个特征点各自与对应特征中心点的特征距离；

步骤S27，利用指示函数及获取的特征距离，获取第一数量个特征点各自与对应特征中心点的特征条件概率；

步骤S28，由获取的特征条件概率，确定第一数量个特征点与对应特征中心点碰撞的特征条件概率分布；

结合上述公式(1)表示的条件概率的计算方法，实现第一数量个特征点与对应特征中心点碰撞的特征条件概率分布，因此，步骤S26～步骤S28的具体实现方法，可以参照上述实施例相应部分的描述。

步骤S29，获取的特征条件概率分布与理想条件概率分布的第一KL散度；

步骤S210，利用该第一KL散度，调整卷积神经网络的配置参数，直至利用调整后的配置参数得到的新的第一KL散度满足第一相似要求；

为了提高训练图像分类的准确性，本申请需要利用训练图像的特征点及特征中心点，得到的特征条件概率分布，能够与上述理想特征条件概率分布匹配，因此，步骤S29中的第一相似要求可以是实际获取的特征条件概率分布与理想特征条件概率分布的匹配程度大于阈值，即该特征条件概率分布与理想特征条件概率分布非常接近，甚至可以是要求该特征条件概率分布与理想特征条件概率分布相同。

步骤S211，将最后得到的第二数量类图像各自的特征中心点作为相应类图像的目标特征中心点；

步骤S212，分别对第一数量个特征点和所述第二数量个目标特征中心点进行二值化处理；

本实施例可以利用上述公式(4)实现步骤S212，但并不局限于这种二值化处理方法。

步骤S213，将第一数量个二值化特征点和第二数量个二值化目标特征中心点分别映射到汉明空间，得到相应训练图像的哈希码及各类图像的哈希中心点；

步骤S214，获取各训练图像的哈希码与对应类图像的哈希中心点匹配的哈希条件概率分布；

本实施例中，哈希条件概率分布的获取方式与特征条件概率分布的获取方式类似，因此，结合上述公式(5)，步骤S214可以包括：

获取第一数量个哈希码各自与对应哈希中心点的哈希码距离；

利用指示函数及获取的哈希码距离，获取第一数量个哈希码各自与对应哈希中心点的哈希条件概率；

由获取的哈希条件概率，确定第一数量个哈希码各自与对应哈希中心点碰撞的哈希条件概率分布。

步骤S215，按照所述哈希条件概率分布与所述理想条件概率分布的第二相似要求，调整哈希条件概率配置参数，得到图像哈希模型及第一数量个训练图像各自的目标哈希码；

在汉明空间的网络训练过程，与上述特征嵌入空间的网络训练过程类似，因此，结合公式(6)，步骤S215具体可以包括：

获取哈希条件概率分布与理想条件概率分布的第二KL散度，

利用第二KL散度，调整调整哈希条件概率配置参数，直至利用调整后的配置参数得到的新的第二KL散度满足第二相似要求，得到图像哈希模型；

将最后得到的第一数量个哈希码作为相应训练图像的目标哈希码。

如上述分析，在特征嵌入空间和汉明空间发生的中心碰撞，保证了这两个空间中的中心点相似性的一致性，进而保证了图像检索的可靠性和准确性。并且，本申请还可以利用上述步骤中进行图像特征提取、特征嵌入空间的特征映射以及哈希层的处理方法所使用的公式，构成哈希函数，并将最后学习得到的哈希函数作为图像哈希模型，其具体内容本实施例不做详述。

步骤S216，利用第一数量个训练图像的目标哈希码，生成图像哈希码数据库。

可见，本实施例可以按照上述方法，利用中心碰撞哈希实现对训练图像库的高效编码，得到各训练图像的目标哈希码，并利用这些训练图像的目标哈希码，构建图像哈希码数据库，用来在实际应用场景中进行图像检索。

需要说明，本申请对图像哈希码检索库中各目标哈希码的存储方式不做限定，可以将不同特征中心点及其对应的目标哈希码，生成多个哈希码组，并由这多个哈希码组构成该图像哈希码检索库，即对该图像哈希码检索库中的目标哈希码进行分类存储，但并不局限于这种哈希码存储方式。

综上，本申请可以通过深度学习网络提取图像的深度特征，并通过中心碰撞哈希法，得到图像哈希模型，可见，对于n个训练图像和z个中心点，本申请这种学习方法的时间复杂度是O(nz)，相对于相关技术，极大提高了学习效率，缩短了训练时间，而且还能够学习到数据的全局分布，提高了所得图像哈希模型输出数据的准确性。

在上述各实施例的基础上，参照图4所示的另一种图像处理方法实施例的流程示意图，本实施例主要对所得图像哈希模型及图形哈希码数据库，在图像检索应用场景的使用方法进行说明，如图4所示，该方法可以包括：

步骤S31，获取检索图像；

步骤S32，将检索图像输入图像哈希模型，得到该检索图像的哈希码；

关于检索图像输入图像哈希模型(即图5a所示的哈希函数)，得到对应的哈希码的实现过程如图5a所示，关于哈希函数的处理过程可以参照上述实施例相应部分的描述。

可选的，本申请还可以利用检索图像的哈希码，更新图像哈希码数据库，以扩充图像哈希码数据库，提高图像检索的可靠性及准确性。

步骤S33，获取检索图像的哈希码与图像哈希码数据库中的哈希码的汉明距离；

本实施例对汉明距离的具体获取方法不做详述。

步骤S34，利用所述汉明距离的大小，得到图像检索结果。

可选的，本申请可以利用汉明距离的k近邻法进行图像检索，但并不局限于这一种图像检索方式。

综上，参照图5b所示的图像检索的应用示意图，在图像实际检索应用中，可以将检索图像直接输入上述学习得到的哈希函数，即图像哈希模型，得到该检索图像的哈希码，之后，通过比对该检索图像的哈希码与图像哈希码检索库中的哈希码的汉明距离，再通过k邻近点等方式进行图像检索，以得到用户所需的与待查询图像相似的至少一个图像，或与待查询图像不相似的至少一个图像等检索结果等等，满足用户的图像检索需求。

如上述分析，本实施例在图像检索过程中，并不是直接利用各图像哈希码，得到相应图像之间的相似度，而是将图像的哈希码与各类图像的哈希中心点进行比对，快速且准确得到该图像所属图像类型，即极大缩短了训练时间，提高了图像分类检索的效率及准确性。

根据本申请实施例提供的上述图像处理方法，本申请实施例还提供一种图像处理装置，所述装置包括：

通信模块，用于接收检索目标的描述信息；

在一些实现方式中，所述描述信息为文字；

所述检索模块具体用于：

根据所述描述信息确定所述检索目标所属的类别；

确定与所述类别相对应的哈希中心点；

根据所述哈希中心点从所述图像哈希码数据库中确定目标哈希码。

在一些实现方式中，所述描述信息为图像；

所述检索模块具体用于：

根据所述描述信息确定参考哈希码；

从图像哈希码数据库中确定与所述参考哈希码匹配的目标哈希码。

在一些实现方式中，所述通信模块具体用于:

接收用户通过图形用户界面(GUI)输入的检索目标的描述信息；

所述装置还包括：

呈现模块，用于通过所述GUI呈现所述检索目标。

在一些实现方式中，所述装置还包括：

构建模块，用于构建初始图像哈希模型，所述初始图像哈希模型包括特征提取网络和特征嵌入网络，所述特征嵌入网络包括特征嵌入层和哈希层，所述初始图像哈希模型的损失函数根据相似图像被投射到特征空间的第一损失函数和/或相似图像被投射到汉明空间的第二损失函数确定；

训练模块，用于根据训练图像输入所述初始图像哈希模型，通过所述损失函数确定的损失值更新所述初始图像哈希模型的参数，以训练所述初始图像哈希模型得到图像哈希模型。

在一些实现方式中，所述第一损失函数根据特征条件概率分布和理想条件概率分布确定，所述特征条件概率分布用于表征一个特征点被投射到一个特征中心点的概率。

在一些实现方式中，所述第二损失函数根据哈希条件概率分布和理想条件概率分布确定，所述哈希条件概率分布用于表征一个哈希码被投射到哈希中心点的概率。

在一些实现方式中，所述初始图像哈希模型的损失函数根据相似图像被投射到特征空间的第一损失函数、相似图像被投射到汉明空间的第二损失函数以及所述特征空间的特征向量进行二值化的第三损失函数确定。

参照图6，为本申请实施例提供的一种图像处理装置的结构示意图，该装置可以应用于计算机设备，如图6所示，该装置可以包括：

第一获取模块101，用于获取第一数量个训练图像；

第一处理模块102，用于依据卷积神经网络，得到所述第一数量个训练图像在特征嵌入空间各自对应的特征点，及所述第一数量个训练图像所属第二数量类图像各自的特征中心点；

可选的，如图7所示，该第一处理模块102可以包括：

第一处理单元1021，用于将所述第一数量个训练图像输入卷积神经网络，得到所述第一数量个训练图像各自的图像特征；

特征映射单元1022，用于将所述第一数量个训练图像各自的所述图像特征映射到特征嵌入空间，得到相应训练图像的特征点；

第二处理单元1023，用于利用所述卷积神经网络的一全连接层的学习结果，得到所述第一数量个训练图像所属第二数量类图像各自的特征中心点。

第二获取模块103，用于获取第一数量个特征点与对应特征中心点碰撞的特征条件概率分布，及预设的理想条件概率分布；

可选的，该装置还可以包括：

标注模块，用于获取所述第一数量个训练图像各自标注的标签，其中，相似训练图像标注的标签相同；

指示函数获取模块，用于依据所述标签，得到训练图像相似的指示函数；

相应地，上述第二获取模块103可以包括：

第一获取单元，用于获取第一数量个特征点各自与对应特征中心点的特征距离；

第二获取单元，用于利用所述指示函数及获取的特征距离，获取所述第一数量个特征点各自与对应特征中心点的特征条件概率；

第一确定单元，用于由获取的所述特征条件概率，确定所述第一数量个特征点与对应特征中心点碰撞的特征条件概率分布；

本实施例中，上述理想条件概率分布结果可以表征：各相似的训练图像被映射到对应的中心点，各不相似的训练图像被映射到不同的中心点，所述中心点包括所述特征中心点和所述哈希中心点。

第一网络训练模块104，用于利用所述特征条件概率分布与所述理想条件概率分布进行网络训练，得到所述第二数量类图像各自的目标特征中心点；

可选的，该第一网络训练模块104具体可以用于按照所述特征条件概率分布与所述理想条件概率分布的第一相似要求，调整所述卷积神经网络的配置参数，得到所述第二数量类图像各自的目标特征中心点。

本实施例中，第一网络训练模块104可以包括：

第三获取单元，用于获取所述特征条件概率分布与所述理想条件概率分布的第一KL散度，

第一调整单元，用于利用所述第一KL散度，调整所述卷积神经网络的配置参数，直至利用调整后的配置参数得到的新的第一KL散度满足第一相似要求；

第二确定单元，用于将最后得到的第二数量类图像各自的特征中心点作为相应类图像的目标特征中心点；

映射模块105，用于将所述第一数量个特征点及第二数量个目标特征中心点分别映射到汉明空间，得到所述第一数量个训练图像各自的哈希码及所述第二数量类图像各自的哈希中心点；

第三获取模块106，用于获取第一数量个哈希码与对应哈希中心点碰撞的哈希条件概率分布；

可选的，该第三获取模块106可以包括：

第四获取单元，用于获取第一数量个哈希码各自与对应哈希中心点的哈希码距离；

第五获取单元，用于利用所述指示函数及获取的哈希码距离，获取所述第一数量个哈希码各自与对应哈希中心点的哈希条件概率；

第三确定单元，用于由获取的所述哈希条件概率，确定所述第一数量个哈希码各自与对应哈希中心点碰撞的哈希条件概率分布。

第二网络训练模块107，用于利用所述哈希条件概率分布与所述理想条件概率分布进行网络训练，得到图像哈希模型。

本实施例中，该第二网络训练模块107具体可以用于按照所述哈希条件概率分布与所述理想条件概率分布的第二相似要求，调整哈希条件概率配置参数，得到图像哈希模型。

可选的，该第二网络训练模块107可以包括：

第六获取单元，用于获取所述哈希条件概率分布与所述理想条件概率分布的第二KL散度，

第二调整单元，用于利用所述第二KL散度，调整调整哈希条件概率配置参数，直至利用调整后的配置参数得到的新的第二KL散度满足第二相似要求；

第四确定单元，用于将最后得到的第一数量个哈希码作为相应训练图像的目标哈希码。

可选的，在上述实施例的基础上，如图8所示，该装置还可以包括：

二值化处理模块108，用于分别对所述第一数量个特征点和所述第二数量个目标特征中心点进行二值化处理；

相应地，上述映射模块105具体可以用于将所述第一数量个二值化的特征点及所述第二数量个二值化的目标特征中心点，分别映射到汉明空间，得到所述第一数量个训练图像各自的哈希码及所述第二数量类图像各自的哈希中心点。

在上述各实施例的基础上，如图8所示，该装置还可以包括：

目标哈希码获取模块109，用于按照所述哈希条件概率分布与所述理想条件概率分布的第二相似要求，调整哈希条件概率配置参数，得到所述第一数量个训练图像各自的目标哈希码；

哈希码数据库获取模块110，用于由得到的第一数量个目标哈希码，构成图像哈希码数据库。

可选的，在上述各实施例的基础上，如图9所示，上述装置还可以包括：

图像获取模块111，用于获取检索图像；

第二处理模块112，用于将所述检索图像输入所述图像哈希模型，得到所述检索图像的哈希码；

汉明距离获取模块113，用于获取所述检索图像的哈希码与所述图像哈希码数据库中的哈希码的汉明距离；

图像检索模块114，用于利用所述汉明距离的大小，得到图像检索结果。

本申请还提供了一种存储介质的实施例，其上存储有计算机程序，该计算机程序被处理器执行，实现上述图像处理方法的各步骤，该图像处理方法的实现过程可以参照上述方法实施例的描述。

如图10所示，本申请实施例还提供了一种计算机设备的硬件结构示意图，该计算机设备可以是实现上述图像处理方法的服务器，也可以是终端设备等，本申请对该计算机设备的产品类型不作限定，如图10所示，该计算机设备可以包括通信接口21、存储器22和处理器23；

在本申请实施例中，通信接口21、存储器22、处理器23可以通过通信总线实现相互间的通信，且该通信接口21、存储器22、处理器23及通信总线的数量可以为至少一个。

可选的，通信接口21可以为通信模块的接口，如GSM模块的接口；

处理器23可能是一个中央处理器CPU，或者是特定集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本申请实施例的一个或多个集成电路。

存储器22可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

其中，存储器22存储有程序，处理器23调用存储器22所存储的程序，以实现上述应用于计算机设备的图像处理方法的各步骤，具体实现过程可以参照上述方法实施例相应部分的描述。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、计算机设备而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计第一条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的核心思想或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

一种图像处理方法，由图像处理系统执行，所述方法包括：

接收检索目标的描述信息；

根据所述描述信息从图像哈希码数据库中确定目标哈希码，所述图像哈希码数据库中的每个哈希码是通过图像哈希模型对图像进行学习得到，所述图像哈希模型是使得相似图像投射到空间中同一中心点的数学模型；

根据所述目标哈希码以及图像与哈希码的对应关系，从图像库中确定所述检索目标。
根据权利要求1所述的方法，其特征在于，所述描述信息为文字；

所述根据所述描述信息从图像哈希码数据库中确定目标哈希码，包括：

根据所述描述信息确定所述检索目标所属的类别；

确定与所述类别相对应的哈希中心点；

根据所述哈希中心点从所述图像哈希码数据库中确定目标哈希码。
根据权利要求1所述的方法，其特征在于，所述描述信息为图像；

所述根据所述描述信息从图像哈希码数据库中确定目标哈希码，包括：

根据所述描述信息确定参考哈希码；

从图像哈希码数据库中确定与所述参考哈希码匹配的目标哈希码。
根据权利要求1至3任一项所述的方法，其特征在于，所述接收检索目标的描述信息，包括：

接收用户通过图形用户界面(GUI)输入的检索目标的描述信息；

所述方法还包括：

通过所述GUI呈现所述检索目标。
根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：

构建初始图像哈希模型，所述初始图像哈希模型包括特征提取网络和特征嵌入网络，所述特征嵌入网络包括特征嵌入层和哈希层，所述初始图像哈希模型的损失函数根据相似图像被投射到特征空间的第一损失函数和/或相似图像被投射到汉明空间的第二损失函数确定；

根据训练图像输入所述初始图像哈希模型，通过所述损失函数确定的损失值更新所述初始图像哈希模型的参数，以训练所述初始图像哈希模型得到图像哈希模型。
根据权利要求5所述的方法，其特征在于，所述第一损失函数根据特征条件概率分布和理想条件概率分布确定，所述特征条件概率分布用于表征一个特征点被投射到一个特征中心点的概率。
根据权利要求5所述的方法，其特征在于，所述第二损失函数根据哈希条件概率分布和理想条件概率分布确定，所述哈希条件概率分布用于表征一个哈希码被投射到哈希中心点的概率。
根据权利要求5所述的方法，其特征在于，所述初始图像哈希模型的损失函数根据相似图像被投射到特征空间的第一损失函数、相似图像被投射到汉明空间的第二损失函数以及所述特征空间的特征向量进行二值化的第三损失函数确定。
一种图像处理方法，由图像处理系统执行，所述方法包括：

获取第一数量个训练图像；

依据卷积神经网络，得到所述第一数量个训练图像在特征嵌入空间各自的特征点，及所述第一数量个训练图像所属第二数量类图像各自的特征中心点；

获取第一数量个特征点与对应特征中心点碰撞的特征条件概率分布，及预设的理想条件概率分布；

利用所述特征条件概率分布与所述理想条件概率分布进行网络训练，得到所述第二数量类图像各自的目标特征中心点；

将所述第一数量个特征点及第二数量个目标特征中心点分别映射到汉明空间，得到所述第一数量个训练图像各自的哈希码及所述第二数量类图像各自的哈希中心点；

获取第一数量个哈希码与对应哈希中心点碰撞的哈希条件概率分布；

利用所述哈希条件概率分布与所述理想条件概率分布进行网络训练，得到图像哈希模型。
根据权利要求9所述的方法，所述方法还包括：

分别对所述第一数量个特征点和所述第二数量个目标特征中心点进行二值化处理；

所述将所述第一数量个特征点及第二数量个目标特征中心点分别映射到汉明空间，得到所述第一数量个训练图像各自的哈希码及所述第二数量类图像各自的哈希中心点，包括：

将所述第一数量个二值化的特征点及所述第二数量个二值化的目标特征中心点，分别映射到汉明空间，得到所述第一数量个训练图像各自的哈希码及所述第二数量类图像各自的哈希中心点。
根据权利要求9所述的方法，所述依据卷积神经网络，得到所述第一数量个训练图像在特征嵌入空间各自对应的特征点，及所述第一数量个训练图像所属第二数量类图像各自的特征中心点，包括：

将所述第一数量个训练图像输入卷积神经网络，得到所述第一数量个训练图像各自的图像特征；

将所述第一数量个训练图像各自的所述图像特征映射到特征嵌入空间，得到相应训练图像的特征点；

利用所述卷积神经网络的一全连接层的学习结果，得到所述第一数量个训练图像所属第二数量类图像各自的特征中心点。
根据权利要求9所述的方法，所述方法还包括：

获取所述第一数量个训练图像各自标注的标签，其中，相似训练图像标注的标签相同；

依据所述标签，得到训练图像相似的指示函数；

所述获取第一数量个特征点与对应特征中心点碰撞的特征条件概率分布，包括：

获取第一数量个特征点各自与对应特征中心点的特征距离；

利用所述指示函数及获取的特征距离，获取所述第一数量个特征点各自与对应特征中心点的特征条件概率；

由获取的所述特征条件概率，确定所述第一数量个特征点与对应特征中心点碰撞的特征条件概率分布；

所述获取第一数量个哈希码与对应哈希中心点碰撞的哈希条件概率分布，包括：

获取第一数量个哈希码各自与对应哈希中心点的哈希码距离；

利用所述指示函数及获取的哈希码距离，获取所述第一数量个哈希码各自与对应哈希中心点的哈希条件概率；

由获取的所述哈希条件概率，确定所述第一数量个哈希码各自与对应哈希中心点碰撞的哈希条件概率分布。
根据权利要求9至12任一项所述的方法，所述利用所述特征条件概率分布与所述理想条件概率分布进行网络训练，得到所述第二数量类图像各自的目标特征中心点，包括：

按照所述特征条件概率分布与所述理想条件概率分布的第一相似要求，调整所述卷积神经网络的配置参数，得到所述第二数量类图像各自的目标特征中心点；

在训练得到所述图像哈希模型的过程中，所述方法还包括：

按照所述哈希条件概率分布与所述理想条件概率分布的第二相似要求，调整哈希条件概率配置参数，得到所述第一数量个训练图像各自的目标哈希码；

由得到的第一数量个目标哈希码，构成图像哈希码数据库。
根据权利要求13所述的方法，所述方法还包括：

获取检索图像；

将所述检索图像输入所述图像哈希模型，得到所述检索图像的哈希码；

获取所述检索图像的哈希码与所述图像哈希码数据库中的哈希码的汉明距离；

利用所述汉明距离的大小，得到图像检索结果。
根据权利要求9所述的方法，所述理想条件概率分布结果表征：各相似的训练图像被映射到对应的中心点，各不相似的训练图像被映射到不同的中心点，所述中心点包括所述特征中心点和所述哈希中心点。
根据权利要求13所述的方法，所述按照所述特征条件概率分布与所述理想条件概率分布的第一相似要求，调整所述卷积神经网络的配置参数，得到所述第二数量类图像各自的目标特征中心点，包括：

获取所述特征条件概率分布与所述理想条件概率分布的第一KL散度，

利用所述第一KL散度，调整所述卷积神经网络的配置参数，直至利用调整后的配置参数得到的新的第一KL散度满足第一相似要求；

将最后得到的第二数量类图像各自的特征中心点作为相应类图像的目标特征中心点；

所述按照所述哈希条件概率分布与所述理想条件概率分布的第二相似要求，调整哈希条件概率配置参数，得到所述第一数量个训练图像各自的目标哈希码，包括：

获取所述哈希条件概率分布与所述理想条件概率分布的第二KL散度，

利用所述第二KL散度，调整调整哈希条件概率配置参数，直至利用调整后的配置参数得到的新的第二KL散度满足第二相似要求；

将最后得到的第二数量类图像各自的哈希中心点作为相应类图像的目标哈希中心点。
一种图像处理装置，所述装置包括：

通信模块，用于接收检索目标的描述信息；

检索模块，用于根据所述描述信息从图像哈希码数据库中确定目标哈希码，所述图像哈希码数据库中的每个哈希码是通过图像哈希模型对图像进行学习得到，所述图像哈希模型是使得相似图像投射到空间中同一中心点的数学模型；

确定模块，用于确定根据所述目标哈希码以及图像与哈希码的对应关系，从图像库中确定所述检索目标。
根据权利要求17所述的装置，所述描述信息为文字；

所述检索模块具体用于：

根据所述描述信息确定所述检索目标所属的类别；

确定与所述类别相对应的哈希中心点；

根据所述哈希中心点从所述图像哈希码数据库中确定目标哈希码。
根据权利要求17所述的装置，所述描述信息为图像；

所述检索模块具体用于：

根据所述描述信息确定参考哈希码；

从图像哈希码数据库中确定与所述参考哈希码匹配的目标哈希码。
根据权利要求17至19任一项所述的装置，所述通信模块具体用于：

接收用户通过图形用户界面(GUI)输入的检索目标的描述信息；

所述装置还包括：

呈现模块，用于通过所述GUI呈现所述检索目标。
根据权利要求17至20任一项所述的装置，所述装置还包括：

构建模块，用于构建初始图像哈希模型，所述初始图像哈希模型包括特征提取网络和特征嵌入网络，所述特征嵌入网络包括特征嵌入层和哈希层，所述初始图像哈希模型的损失函数根据相似图像被投射到特征空间的第一损失函数和/或相似图像被投射到汉明空间的第二损失函数确定；

训练模块，用于根据训练图像输入所述初始图像哈希模型，通过所述损失函数确定的损失值更新所述初始图像哈希模型的参数，以训练所述初始图像哈希模型得到图像哈希模型。
根据权利要求21所述的装置，所述第一损失函数根据特征条件概率分布和理想条件概率分布确定，所述特征条件概率分布用于表征一个特征点被投射到一个特征中心点的概率。
根据权利要求21所述的装置，所述第二损失函数根据哈希条件概率分布和理想条件概率分布确定，所述哈希条件概率分布用于表征一个哈希码被投射到哈希中心点的概率。
根据权利要求21所述的装置，所述初始图像哈希模型的损失函数根据相似图像被投射到特征空间的第一损失函数、相似图像被投射到汉明空间的第二损失函数以及所述特征空间的特征向量进行二值化的第三损失函数确定。
一种图像处理装置，所述装置包括：

第一获取模块，用于获取第一数量个训练图像；

第一处理模块，用于依据卷积神经网络，得到所述第一数量个训练图像在特征嵌入空间各自对应的特征点，及所述第一数量个训练图像所属第二数量类图像各自的特征中心点；

第二获取模块，用于获取第一数量个特征点与对应特征中心点碰撞的特征条件概率分布，及预设的理想条件概率分布；

第一网络训练模块，用于利用所述特征条件概率分布与所述理想条件概率分布进行网络训练，得到所述第二数量类图像各自的目标特征中心点；

映射模块，用于将所述第一数量个特征点及第二数量个目标特征中心点分别映射到汉明空间，得到所述第一数量个训练图像各自的哈希码及所述第二数量类图像各自的哈希中心点；

第三获取模块，用于获取第一数量个哈希码与对应哈希中心点碰撞的哈希条件概率分布；

第二网络训练模块，用于利用所述哈希条件概率分布与所述理想条件概率分布进行网络训练，得到图像哈希模型。
一种计算机集群，所述计算机集群包括至少一台计算机，所述至少一台计算机包括：

通信接口；

存储器，用于存储实现如权利要求1至8或者9至16任意一项所述的图像处理方法的程序；

处理器，用于加载并执行所述存储器存储的程序，实现如权利要求1至8或者9至16任意一项所述的图像处理方法的各步骤。
一种包括指令的计算机程序产品，当其在计算机上运行时，使得所述计算机执行权利要求1至8或者9至16任意一项所述的图像处理方法。