CN111428073A - 一种深度监督量化哈希的图像检索方法 - Google Patents

一种深度监督量化哈希的图像检索方法 Download PDF

Info

Publication number
CN111428073A
CN111428073A CN202010243021.1A CN202010243021A CN111428073A CN 111428073 A CN111428073 A CN 111428073A CN 202010243021 A CN202010243021 A CN 202010243021A CN 111428073 A CN111428073 A CN 111428073A
Authority
CN
China
Prior art keywords
hash
attention mechanism
quantization
loss
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010243021.1A
Other languages
English (en)
Other versions
CN111428073B (zh
Inventor
程述立
汪烈军
杜安钰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinjiang University
CERNET Corp
Original Assignee
Xinjiang University
CERNET Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinjiang University, CERNET Corp filed Critical Xinjiang University
Priority to CN202010243021.1A priority Critical patent/CN111428073B/zh
Publication of CN111428073A publication Critical patent/CN111428073A/zh
Application granted granted Critical
Publication of CN111428073B publication Critical patent/CN111428073B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种深度监督量化哈希的图像检索方法,所述方法包括:对输入的图像检索数据进行特征提取,将特征提取部分提取的特征输入哈希层生成哈希码,通过构造不同的损失函数训练哈希层的网络参数;其中,在特征提取部分,采用ResNet101作为主干网络集合双通道注意力机制实现网络模型的构建以进行图像特征提取,所述双通道注意力机制包括通道注意力机制以及空间注意力机制。本发明主要从网络模型选取、损失函数构建中去弥补现有算法中的不足,提升算法检索性能,从而可应用于大规模检索引擎、医学计算机辅助诊断及人脸数据库中。

Description

一种深度监督量化哈希的图像检索方法
技术领域
本发明主要涉及计算机视觉、图像检索相关技术领域,具体是医学计算机辅助、各大搜索引擎等使用的一种深度监督量化哈希的图像检索方法。
背景技术
随着多媒体技术的不断发展,哈希算法已成为大数据时代多媒体数据搜索的关键技术。同时,海量数据的存储和查询消耗大量的存储空间和计算复杂度。为了解决传统方法对存储空间和检索时间的不现实要求,近年来,哈希技术广泛被关注。由于哈希算法能减少了其空间和时间需求,并且哈希算法具有更好的检索结果,因此哈希算法成为一种用于多媒体数据快速搜索的实用解决方案。
随着互联网及医学成像设备的不断完善,图像数据成为当前主流数据类型,然而医学计算机辅助设计和搜索引擎均关注检索时效性。此时,深度哈希算法成为计算机辅助诊断及搜索引擎的主流算法,成为当前研究热点。当前相关技术存在的缺陷如下:(1)基于多特征融合算法图像检索,算法以人工特征为出发点,算法特征表达能力有待提升并且适应性不强。(2)基于深度学习的图像检索,传统的做法是基于深度学习模型提取图像特征,通常选取全连接层的输出作为图像特征,但浮点型数据类型及特征维度较高需要消耗较多的存储量和计算量,因此该算法不适合医学计算机辅助诊断及大规模图像检索。
发明内容
为解决目前技术的不足,本发明结合现有技术,从实际应用出发,提供一种深度监督量化哈希的图像检索方法,本发明主要从网络模型选取、损失函数构建中去弥补现有算法中的不足,提升算法检索性能,从而可应用于大规模检索引擎、医学计算机辅助诊断及人脸数据库中。
为实现上述目的,本发明的技术方案如下:
一种深度监督量化哈希的图像检索方法,其特征在于,所述方法包括:对输入的图像检索数据进行特征提取,将特征提取部分提取的特征输入哈希层生成哈希码,通过构造不同的损失函数训练哈希层的网络参数;
其中,在特征提取部分,采用ResNet101作为主干网络集合双通道注意力机制实现网络模型的构建以进行图像特征提取,所述双通道注意力机制包括通道注意力机制以及空间注意力机制。
进一步,在通道注意力机制结构中,用最大池化和均值池化去压缩特征图,然后引入多层感知器,基于求和操作去得到输出特征图;
在空间注意力机制结构中,输出层的每个位置都与其他位置信息进行融合,输入特征图和输出特征图具有相同的大小。
进一步,所述哈希层的激活函数是双曲正弦函数。
进一步,所述损失函数采用如下所示公式:
Jours=J1+J2+J3+J4 (1)
其中,J1是成对的语义相似度损失,其具体公式如下所示:
Figure BDA0002433184040000021
J2是算法的量化损失,主要测量实际输出与预期输出之间的差异,其具体公式如下所示:
Figure BDA0002433184040000022
J3是算法的量化损失,一方面,损失函数可以限制错误率,另一方面,它可以最小化实际输出和预期输出的量化误差总和,其具体公式如下所示:
Figure BDA0002433184040000031
J4是交叉熵损失,其主要目标是更合理地利用标签信息,其具体公式如下所示:
Figure BDA0002433184040000032
上述公式中,S是监督矩阵,sij为图像i和图像j的相似性,
Figure BDA0002433184040000033
T表示转置,bi和bj为成对的哈希码,α为超参数,n为图像数目,ui为期望的哈希码,yi为真实标签,yi′为网络预测的标签。
本发明的有益效果:
1)首先在网络模型中提出了一种新的双重关注机制,可以进一步获得更有效的语义信息。2)构造了一个新的目标函数(主要是:成对损失,量化损失,softmax损失,正则项)来训练网络参数。3)医学计算机辅助设计方面,本发明所提出算法可应用在组织病理学(KIMIA Path960和KIMIA Path24)、公用图像检索数据库(CIFAR-10和NUW-WIDE)、少数民族人脸数据库(FD-XJ)中;因此本发明所提出的深度监督量化哈希检索方法在医学计算机辅助诊断和进一步构造智能检索系统中具有较好的应用价值。
附图说明
附图1为本发明的深度监督量化哈希的图像检索架构;
附图2为本发明的通道注意力机制的结构;
附图3为本发明的空间注意力机制的结构。
具体实施方式
结合附图和具体实施例,对本发明作进一步说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所限定的范围。
如图1~3所示,为本发明所提供的一种深度监督量化哈希的图像检索方法相关系统的架构图。
在深度哈希算法中,其主要目标是学习哈希函数以提取质量更好的哈希码。当前技术中,有两个关键的科学问题需要进一步解决:如何更好地表征图像并从图像中获得更有效的语义特征(特征提取部分);如何测量语义空间和汉明空间之间的相似性(损失函数部分)。因此本发明的目标是提出一种新颖的深度哈希算法,该算法将框架中的特征学习部分和度量学习部分结合在一起。该算法的主要目标是学习更有效的哈希码。该算法使用的主要数据集是用于深度哈希算法研究的主流数据集(CIFAR10和NUSWIDE)。在特征学习模块中,针对残差网络和注意力机制的最新研究已被广泛提出来处理与图像处理相关的任务。然而,对基于残差的哈希算法和基于注意力的哈希算法的研究很少。因此,本发明主要探讨基于残差块和双通道关注机制的特征学习部分,目的是获得图像更鲁棒的特征表示。
本发明其目标是获取更为有效的哈希码,提高图像检索性能,其过程如图1所示。
检索数据输入:在图1中,该架构使用的主要数据集是用于深度哈希算法研究的主流数据集(CIFAR10和NUSWIDE),因此检索架构的数据输入来源于当前主流数据集CIFAR10和NUSWIDE数据库以及采集的部分少数民族数据库。具体细节如下:数据集是用于深度哈希算法的公共数据集,具体实施方式如下:CIFAR-10数据集由10个类的60000个32x32彩色图像组成,每个类6000个图像。有50000张训练图像和10000张测试图像。本发明通过DPSH,DSDH,DDSH等算法测试,随机选择1000张图像作为查询点,其余图像作为检索点。在检索集中,本发明随机选择5000张图像作为训练数据集。NUW-WIDE是一个真实的网络图像数据库。该数据集包含269,648张图像和Flickr的相关标签,总共有5,018个唯一标签。在检索集中,本发明仅选择21个最频繁分类的2100张图像作为测试数据集。本发明选择每个班级500张图像作为训练数据集,其余图像作为检索点。KIMIA Path24是组织病理学搜索的主要数据集之一。它包含24类组织病理学图像。该数据集包含27,055个组织病理学图像。在实际测试中,本发明随机选择1325个组织病理学图像来测试算法性能,并使用其他组织病理学图像来训练网络参数。KIMIA Path960是组织病理学搜索的主要数据集之一。它包含20个类别组织病理学图像。该数据集包含960个组织病理学图像。在实际测试中,本发明随机选择了192个组织病理学图像来测试算法表现和其他组织病理学图像训练网络参数。除此之外,本发明的算法还可在一些少数民族人脸数据库中进行应用。
在本发明的特征提取部分:特征提取部分主要基于本发明的关键问题一提出,其主要目标是更好地表征图像并从图像中获得更有效的语义特征。特征提取部分的重点是网络模型构建,在所提出的深度监督量化哈希架构中,本发明采用ResNet101作为主干网络,结合双通道注意力机制(通道注意力机制和空间注意力机制)去获取更好的图像描述。本发明所提出的双通道注意力机制启发来源于两部分:(1)DANet中的位置注意力机制;(2)CBAM中的通道注意力机制。结合这两部分我们提出了新的双通道注意力机制(通道注意力机制如图2所示和空间注意力机制如图3所示),该注意力机制也是首次被提出在图像检索架构中。除此之外,本发明采用ResNet101结合通道注意力机制和空间注意力机制去获取图像特征的方式也是首次展现在深度哈希算法中。图像检索架构中,这种新的特征提取方式也是首次被提出。如图2所示,在通道注意力机制结构中,输入特征图经过最大池化、均值池化进入共享多层感知器,然后多层感知器最大值池化输出、多层感知器均值池化输出进行求和,经过激活函数后输出特征图。在通道注意力机制中,本发明关注特征图中每个通道的重要性相关性。在技术层面上,本发明使用最大池化和均值池化去压缩特征图,然后引入多层感知器,基于求和操作去得到输出特征图。如图3所示,在空间注意力机制结构中,输出层的每个位置都与其他位置信息融合在一起,输入特征图和输出特征图具有相同的大小。
本发明的哈希层:为了进一步减少计算存储量及计算量,哈希层被引入去训练哈希函数并且生成哈希码,哈希层的输入为特征提取部分提取的特征,哈希层的激活函数是双曲正切函数。
本发明的损失函数部分:度量学习模块主要通过构造不同的损失函数来训练网络参数。在深度哈希算法的研究中,如何保持语义空间和汉明空间之间的相似性一直是研究人员关注的焦点。这个问题仍然是研究人员的热门话题。一些经典的工作被研究者们提出,例如深度成对监督哈希,深度离散监督哈希和深度监督离散哈希。
公式1给出了深度成对监督哈希的损失函数:
Figure BDA0002433184040000061
其中B是二进制代码,U是网络输出,S是监督矩阵,bi和bj是成对的哈希码,η是超参数,第一项代表成对语义相似度损失,第二项代表量化损失;sij为图像i和图像j的相似性,
Figure BDA0002433184040000071
n为图像数目,ui为期望的哈希码。
公式2给出了深度量化哈希的损失函数:
Figure BDA0002433184040000072
其中S是相似度矩阵,
Figure BDA0002433184040000073
和oj是网络输出,λ是超参数,第一项代表成对语义相似度损失,第二项代表量化损失,T表示转置,C表示旋转矩阵,hi表示期望哈希码。
本发明提出的度量学习模块损失函数如公式3所示:
Jours=J1+J2+J3+J4 (3)
J1是成对的语义相似度损失,其具体描述如公式4所示:
Figure BDA0002433184040000074
J2是算法的量化损失,主要测量实际输出与预期输出之间的差异,其具体描述如公式5所示:
Figure BDA0002433184040000075
J3也是算法的量化损失。一方面,损失函数可以限制错误率,另一方面,它可以最小化实际输出和预期输出的量化误差总和。其具体描述如公式6所示:
Figure BDA0002433184040000076
J4是交叉熵损失,其主要目标是更合理地利用标签信息。其具体描述如公式7所示:
Figure BDA0002433184040000077
α为超参数,ui为期望的哈希码,yi为真实标签,yi′为网络预测的标签。
本发明提出的度量学习策略如公式3所示。与当前深度哈希算法相比,本发明的算法具有以下主要优点:(1)在J1中,本发明将残差网络用作骨干网络,并使用新的双通道注意力机制,提取更有效的语义特征,可以在一定程度上减少语义相似度的损失;(2)在量化损失上,当语义空间和汉明空间相似性一致时,J2和J3可以进一步减少错误比特的数量,同时能够减少量化造成的语义损失。(3)J4是引入标签信息下的分类损失,引入分类损失可以充分利用标签信息。改损失函数也是首次被提出用来训练图像检索系统去生成更为有效的哈希码。
综上可知,本发明的主要贡献如下:1)本发明首先提出了一种新的深度哈希检索架构,即深度监督量化哈希(DSQH),该图像检索架构可以用于医学计算机辅助诊断以及高效图像检索系统。2)在深度监督量化哈希中,网络模型部分提出了一种新的双重关注机制,结合ResNet101主干网可以进一步获得更有效的语义信息。2)构造了一个新的目标函数(包括:成对损失,量化损失,分类损失)来训练网络参数。3)医学计算机辅助设计方面,本发明所提出算法可应用在组织病理学(KIMIA Path960和KIMIA Path24)、公用图像检索数据库(CIFAR-10和NUW-WIDE)、部分少数民族人脸数据库(FD-XJ)中。因此本发明所提出的深度监督量化哈希检索方法在医学计算机辅助诊断和进一步构造智能检索系统中具有较好的应用价值。

Claims (4)

1.一种深度监督量化哈希的图像检索方法,其特征在于,所述方法包括:对输入的图像检索数据进行特征提取,将特征提取部分提取的特征输入哈希层生成哈希码,通过构造不同的损失函数训练哈希层的网络参数;
其中,在特征提取部分,采用ResNet101作为主干网络集合双通道注意力机制实现网络模型的构建以进行图像特征提取,所述双通道注意力机制包括通道注意力机制以及空间注意力机制。
2.根据权利要求1所述的一种深度监督量化哈希的图像检索方法,其特征在于,在通道注意力机制结构中,用最大池化和均值池化去压缩特征图,然后引入多层感知器,基于求和操作去得到输出特征图;
在空间注意力机制结构中,输出层的每个位置都与其他位置信息进行融合,输入特征图和输出特征图具有相同的大小。
3.根据权利要求1所述的一种深度监督量化哈希的图像检索方法,其特征在于,所述哈希层的激活函数是双曲正弦函数。
4.根据权利要求1所述的,一种深度监督量化哈希的图像检索方法,其特征在于,所述损失函数采用如下所示公式:
Jours=J1+J2+J3+J4 (1)
其中,J1是成对的语义相似度损失,其具体公式如下所示:
Figure FDA0002433184030000011
J2是算法的量化损失,主要测量实际输出与预期输出之间的差异,其具体公式如下所示:
Figure FDA0002433184030000012
J3是算法的量化损失,一方面,损失函数可以限制错误率,另一方面,它可以最小化实际输出和预期输出的量化误差总和,其具体公式如下所示:
Figure FDA0002433184030000021
J4是交叉熵损失,其主要目标是更合理地利用标签信息,其具体公式如下所示:
Figure FDA0002433184030000022
上述公式中,S是监督矩阵,sij为图像i和图像j的相似性,
Figure FDA0002433184030000023
T表示转置,bi和bj为成对的哈希码,α为超参数,n为图像数目,ui为期望的哈希码,yi为真实标签,yi′为网络预测的标签。
CN202010243021.1A 2020-03-31 2020-03-31 一种深度监督量化哈希的图像检索方法 Active CN111428073B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010243021.1A CN111428073B (zh) 2020-03-31 2020-03-31 一种深度监督量化哈希的图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010243021.1A CN111428073B (zh) 2020-03-31 2020-03-31 一种深度监督量化哈希的图像检索方法

Publications (2)

Publication Number Publication Date
CN111428073A true CN111428073A (zh) 2020-07-17
CN111428073B CN111428073B (zh) 2022-08-09

Family

ID=71550729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010243021.1A Active CN111428073B (zh) 2020-03-31 2020-03-31 一种深度监督量化哈希的图像检索方法

Country Status (1)

Country Link
CN (1) CN111428073B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111832514A (zh) * 2020-07-21 2020-10-27 内蒙古科技大学 基于软多标签的无监督行人重识别方法及装置
CN112101267A (zh) * 2020-09-23 2020-12-18 浙江浩腾电子科技股份有限公司 一种基于深度学习和哈希编码的快速人脸检索方法
CN112365480A (zh) * 2020-11-13 2021-02-12 哈尔滨市科佳通用机电股份有限公司 制动夹钳装置闸片丢失故障识别方法
CN112529018A (zh) * 2020-12-22 2021-03-19 北京百度网讯科技有限公司 图像局部特征的训练方法、装置及存储介质
CN112667841A (zh) * 2020-12-28 2021-04-16 山东建筑大学 一种弱监督的深度上下文感知图像表征方法及系统
CN112766458A (zh) * 2021-01-06 2021-05-07 南京瑞易智能科技有限公司 一种联合分类损失的双流有监督深度哈希图像检索方法
CN113268826A (zh) * 2021-05-06 2021-08-17 上海大学 一种改进多任务卷积神经网络的斜齿轮箱故障诊断方法
CN113537384A (zh) * 2021-07-30 2021-10-22 中国海洋大学 基于通道注意力的哈希遥感图像检索方法、装置及介质
CN113704522A (zh) * 2021-10-28 2021-11-26 山东建筑大学 基于人工智能的目标图像快速检索方法及系统
CN113723256A (zh) * 2021-08-24 2021-11-30 北京工业大学 一种花粉颗粒识别方法及装置
CN115357747A (zh) * 2022-10-18 2022-11-18 山东建筑大学 一种基于序数哈希的图像检索方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101162470A (zh) * 2007-11-16 2008-04-16 北京交通大学 一种基于分层匹配的视频广告识别方法
CN106886768A (zh) * 2017-03-02 2017-06-23 杭州当虹科技有限公司 一种基于深度学习的视频指纹算法
CN109063112A (zh) * 2018-07-30 2018-12-21 成都快眼科技有限公司 一种基于多任务学习深度语义哈希的快速图像检索方法、模型及模型构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101162470A (zh) * 2007-11-16 2008-04-16 北京交通大学 一种基于分层匹配的视频广告识别方法
CN106886768A (zh) * 2017-03-02 2017-06-23 杭州当虹科技有限公司 一种基于深度学习的视频指纹算法
CN109063112A (zh) * 2018-07-30 2018-12-21 成都快眼科技有限公司 一种基于多任务学习深度语义哈希的快速图像检索方法、模型及模型构建方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
FU J 等: "Dual Attention Network for Scene Segmentation", 《PROCEEDINGS OF THE IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》, 9 January 2020 (2020-01-09), pages 3146 - 3154 *
VISHAL V 等: "Robotic surgical instrument segmentation using Dual Global Attention Upsample", 《HTTPS://WWW.DOC.IC.AC.UK/~BGLOCKER/PUBLIC/MEDNIPS2018/MED-NIPS_2018_PAPER_106.PDF》, 31 December 2018 (2018-12-31), pages 1 - 4 *
WOO S 等: "CBAM: Convolutional Block Attention Module", 《PROCEEDINGS OF THE EUROPEAN CONFERENCE ON COMPUTER VISION》, 6 October 2010 (2010-10-06), pages 3 - 19 *
Y. ZHOU 等: "Deep hashing with triplet quantization loss", 《2017 IEEE VISUAL COMMUNICATIONS AND IMAGE PROCESSING 》, 1 March 2018 (2018-03-01), pages 1 - 4 *
彭天强 等: "基于深度卷积神经网络和二进制哈希学习的图像检索方法", 《电子与信息学报》, vol. 38, no. 08, 24 June 2016 (2016-06-24), pages 2068 - 2075 *
翟启: "深度强化的图像检索技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 2019, 15 September 2019 (2019-09-15), pages 138 - 888 *
陈思秀: "哈希码学习及其在图像检索中的应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 2018, 15 February 2018 (2018-02-15), pages 138 - 2539 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111832514A (zh) * 2020-07-21 2020-10-27 内蒙古科技大学 基于软多标签的无监督行人重识别方法及装置
CN112101267B (zh) * 2020-09-23 2022-04-29 浙江浩腾电子科技股份有限公司 一种基于深度学习和哈希编码的快速人脸检索方法
CN112101267A (zh) * 2020-09-23 2020-12-18 浙江浩腾电子科技股份有限公司 一种基于深度学习和哈希编码的快速人脸检索方法
CN112365480A (zh) * 2020-11-13 2021-02-12 哈尔滨市科佳通用机电股份有限公司 制动夹钳装置闸片丢失故障识别方法
CN112529018A (zh) * 2020-12-22 2021-03-19 北京百度网讯科技有限公司 图像局部特征的训练方法、装置及存储介质
CN112667841A (zh) * 2020-12-28 2021-04-16 山东建筑大学 一种弱监督的深度上下文感知图像表征方法及系统
CN112766458A (zh) * 2021-01-06 2021-05-07 南京瑞易智能科技有限公司 一种联合分类损失的双流有监督深度哈希图像检索方法
CN113268826A (zh) * 2021-05-06 2021-08-17 上海大学 一种改进多任务卷积神经网络的斜齿轮箱故障诊断方法
CN113268826B (zh) * 2021-05-06 2022-12-27 上海大学 一种改进多任务卷积神经网络的斜齿轮箱故障诊断方法
CN113537384A (zh) * 2021-07-30 2021-10-22 中国海洋大学 基于通道注意力的哈希遥感图像检索方法、装置及介质
CN113537384B (zh) * 2021-07-30 2023-11-28 中国海洋大学 基于通道注意力的哈希遥感图像检索方法、装置及介质
CN113723256A (zh) * 2021-08-24 2021-11-30 北京工业大学 一种花粉颗粒识别方法及装置
CN113704522A (zh) * 2021-10-28 2021-11-26 山东建筑大学 基于人工智能的目标图像快速检索方法及系统
CN115357747A (zh) * 2022-10-18 2022-11-18 山东建筑大学 一种基于序数哈希的图像检索方法及系统
CN115357747B (zh) * 2022-10-18 2024-03-26 山东建筑大学 一种基于序数哈希的图像检索方法及系统

Also Published As

Publication number Publication date
CN111428073B (zh) 2022-08-09

Similar Documents

Publication Publication Date Title
CN111428073B (zh) 一种深度监督量化哈希的图像检索方法
WO2022068196A1 (zh) 跨模态的数据处理方法、装置、存储介质以及电子装置
CN112802568A (zh) 基于病历文本的多标签胃部疾病分类方法及装置
CN111753189A (zh) 一种少样本跨模态哈希检索共同表征学习方法
CN113177141B (zh) 基于语义嵌入软相似性的多标签视频哈希检索方法及设备
CN110598022B (zh) 一种基于鲁棒深度哈希网络的图像检索系统与方法
CN116204706A (zh) 一种文本内容结合图像分析的多模态内容检索方法与系统
Zhang et al. OMCBIR: Offline mobile content-based image retrieval with lightweight CNN optimization
CN115080801A (zh) 基于联邦学习和数据二进制表示的跨模态检索方法及系统
CN103473307A (zh) 跨媒体稀疏哈希索引方法
CN111368176A (zh) 基于监督语义耦合一致的跨模态哈希检索方法及系统
Hou et al. Remote sensing image retrieval with deep features encoding of Inception V4 and largevis dimensionality reduction
CN113935458A (zh) 基于卷积自编码深度学习的空气污染多站点联合预测方法
CN116595343B (zh) 基于流形排序学习的在线无监督跨模态检索方法及系统
CN116186350B (zh) 基于知识图谱和主题文本的输电线路工程搜索方法和装置
CN116955650A (zh) 基于小样本知识图谱补全的信息检索优化方法及其系统
CN116543339A (zh) 一种基于多尺度注意力融合的短视频事件检测方法及装置
CN115995029A (zh) 一种基于双向连接的图像情感分析方法
CN112650877B (zh) 一种基于改进的深度残差卷积神经网络和深度哈希的高清遥感图像快速检索方法
CN115017366A (zh) 基于多粒度语境化和多结构保存的无监督视频哈希检索方法
Yu et al. Deep hash image retrieval method based on anti-autoencoder
CN111339782B (zh) 一种基于多层次语义解析的手语翻译系统及方法
Long et al. A deep hashing method based on attention module for image retrieval
Zhang et al. Compressing knowledge graph embedding with relational graph auto-encoder
Fan et al. Research and application of automated search engine based on machine learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant