CN105989094B - 基于隐层语义中层表达的图像检索方法 - Google Patents

基于隐层语义中层表达的图像检索方法 Download PDF

Info

Publication number
CN105989094B
CN105989094B CN201510076112.XA CN201510076112A CN105989094B CN 105989094 B CN105989094 B CN 105989094B CN 201510076112 A CN201510076112 A CN 201510076112A CN 105989094 B CN105989094 B CN 105989094B
Authority
CN
China
Prior art keywords
vector
query
vlad
generating
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510076112.XA
Other languages
English (en)
Other versions
CN105989094A (zh
Inventor
袁媛
卢孝强
梅剑寒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XiAn Institute of Optics and Precision Mechanics of CAS
Original Assignee
XiAn Institute of Optics and Precision Mechanics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XiAn Institute of Optics and Precision Mechanics of CAS filed Critical XiAn Institute of Optics and Precision Mechanics of CAS
Priority to CN201510076112.XA priority Critical patent/CN105989094B/zh
Publication of CN105989094A publication Critical patent/CN105989094A/zh
Application granted granted Critical
Publication of CN105989094B publication Critical patent/CN105989094B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种基于隐层语义中层表达的图像检索方法,主要解决现有方法检索精度不高无法进行细粒度检索工作的问题。其实现步骤是:(1)对图像库中的图像划分训练样本集和测试样本集;(2)生成用于训练中层表达模型的训练向量集;(3)选取输入向量集使用基于隐层语义的中层表达方法训练生成映射矩阵M;(4)生成查询向量;(5)计算检索精度与响应用户查询。本发明与现有方法相比,学习了图片直接表达向量之间的隐层语义模型,在图片表达和其标记之间建立了良好的映射模型,因此获得了更好的系统检索精度。以医学图像应用为例,可以用于大规模图像数据的检索管理和医学临床诊断的辅助系统。

Description

基于隐层语义中层表达的图像检索方法
技术领域
本发明属于图像处理技术领域,特别涉及一种图像检索技术,以医学图像的应用为例,可以用于大规模图像数据的检索管理和医学临床诊断的辅助系统。
背景技术
医学图像是现代医学临床诊断中一种有效的辅助诊断工具。随着医学照影技术的不断发展和广泛应用,被用于辅助临床诊断的医学图像呈爆炸式增长。这使得应用于大规模图像数据的管理工具被迫切需求。传统的图像检索系统主要利用现在已经非常成熟的文本检索技术,通过检索事先对图片做好的标记实现对图像的检索。但这种方法过分地依赖于人工对图片的标记,当人工的经验标记出现错误,或标记格式出现问题时,该类型的图像检索系统性能会大幅的下降。同时,现代医学临床诊断在解读医学图像时,也不再单一依靠诊断者的经验,更多的时候还需要参考数据库中的已有病例。因此,为了进一步辅助临床诊断,医学图像检索系统应该能返回与图像语义最相关的目标,而不仅仅是选出人工划分的疾病类型。而这些都是传统的基于文本的图像检索系统无法实现的。
为了解决上述问题,近年来基于图像内容的图像检索技术被广泛研究。该类系统不同于基于文本的图像检索系统,其不再依赖于查找人工标记返回目标图片,而是通过计算机视觉对图像的理解实现以图搜图,从而返回与查询请求内容最相关的图片。
随着计算视觉技术的发展,基于图像内容的图像检索系统性能也在不断提高。早期,随着最初用于文本检索检索BoVW(Bag-of-Visual-Word)模型被引入图像分类与检索的领域,多种可应用于图像检索的图片表达方法基于该模型框架被提出,经典方法如“Jégou,H.,Perronnin,F.,Douze,M.,Sánchez,J.,Pérez,P.,&Schmid,C.Aggregating localimage descriptors into compact codes.IEEE Trans,Pattern Analysis and MachineIntelligence,34(9),1704-1716,2012.”中介绍的Fisher Vector和VLAD(Vector ofLocally Aggregated Descriptors)等。该类方法致力于将图片的底层局部特征聚合表示为与图片语义相关的空间向量,最后通过对向量的距离比较,可以实现系统的检索排序。但基于该类方法的检索系统性能很大程度上依赖于从图像提取的底层特征性质,使其无法很好地应用于高精度和细粒度的图像检索工作。随后,子空间映射模型被广泛研究,并被应用到图片向量的比较排序中。在“Yang,L.,Jin,R.,Mummert,L.,Sukthankar,R.,Goode,A.,Zheng,B.,...&Satyanarayanan,M.A boosting framework for visuality-preservingdistance metric learning and its application to medical image retrieval.IEEETrans,Pattern Analysis and Machine Intelligence,32(1),30-44,2010.”和“Simonyan,K.,Vedaldi,A.,&Zisserman,A.Learning local feature descriptors usingconvex optimisation.IEEE Trans,Pattern Analysis and Machine Intelligence,2(4),2014.”中分别列举了用图片表达的距离度量学习和局部特征空间映射两种方法来改进检索系统中对查询图片向量的排序性能。通常使用该类方法的系统能较直接应用图片表达向量的系统在精度上有所提升,但有时该类方法无法很好地解释特征映射子空间与语义相关度的关系。
发明内容
本发明的目的在于针对上述现有方法的不足,提出一种基于隐层语义中层表达的图像检索方法,通过矩阵分解提取数据库图像的隐层语义从而实现图片表达空间到图片标记空间更好的映射,以提高基于内容的医学图像检索系统的检索精度,并实现大规模医学图像数据的有效管理和临床疾病诊断的有效辅助。
本发明的具体技术方案包括如下步骤:
一种基于隐层语义中层表达的图像检索方法,其特征在于,包括以下步骤:
1)从医学图像数据库划分训练样本集和测试样本集;
1.1)在训练医学图像数据库的每个类别中选取等量的样本作为训练样本集;所述训练医学图像数据库是带分类标签的医学图像数据;
1.2)将测试医学图像数据库和全部的训练医学图像数据库作为测试样本集;
2)生成训练样本集对应的VLAD向量集以及训练样本集对应的标记向量集;
2.1)选取全部的训练样本集,利用VLAD方法将训练样本集中的每幅图像表示为VLAD向量,生成训练样本集的对应VLAD向量集Xtrain
2.2)将训练样本集中的每幅图像对应的标记制作成标记向量,生成训练样本集对应的标记向量集Ytrain;所述标记向量集为图片对应的标记二值列向量,若图片属于步骤1.1)中的所述类别,则标记该图片,否则不标记;
3)生成映射矩阵M;
3.1)选取步骤2)生成的VLAD向量集Xtrain和标记向量集Ytrain作为训练模型的输入集;
3.2)使用基于隐层语义的中层表达式建立VLAD向量集Xtrain和标记向量集Ytrain之间的映射模型,生成映射矩阵M;具体如下:
将VLAD向量集Xtrain和标记向量集Ytrain带入以下目标式中的X和Y:
Figure GDA0002496502340000031
其中,α,β1,β2,β3,β4为权重参数;W为标记映射矩阵;θ为中层表达映射矩阵;U,V为矩阵分解乘子;
通过优化求解上式,可以得到映射矩阵M:
M=Wθ;
4)生成测试样本查询向量集;
4.1)选取测试样本集,利用VLAD方法将其中每幅图片表示为VLAD向量,生成测试样本集对应的VLAD向量集Xtest
4.2)通过映射矩阵M与VLAD向量集Xtest中各向量的乘积生成测试样本集对应的测试样本查询向量集Qtest
5)计算检索精度与响应用户查询;
5.1)生成训练样本查询向量集并计算检索精度;
5.1.1)从训练样本集的每个类别中随机选取等量共N幅图像作为查询集,利用VLAD方法将查询集中每幅图像表示为VLAD向量,生成查询集对应的VLAD向量集Xquery
5.1.2)通过映射矩阵M与VLAD向量集Xquery中各向量的乘积生成查询集对应的训练样本查询向量集Qquery
5.1.3)通过比较训练样本查询向量集Qquery中的每个查询向量与测试样本查询向量集Qtest中每个查询向量的距离并排序,生成训练样本查询向量集Qquery对应的排序集R;
5.1.4)计算排序集R各个排序向量对应的排序精度并生成排序集对应的精度向量AP,得出系统的平均精度性能指标mAP;
mAP=(∑AP)/N
其中,N为步骤5.1.1)中从训练样本集的各类别中随机抽取的等量共N幅图像;
5.2)生成用户查询向量集并返回检索排序;
5.2.1)选取用户查询图像,利用VLAD方法将查询图像表示为用户查询VLAD向量,生成用户查询图像对应的用户查询VLAD向量Xuser
5.2.2)通过映射矩阵M与用户查询VLAD向量Xuser相乘生成用户查询VLAD向量对应的用户查询向量集Quser
5.2.3)通过比较用户查询向量集Quser中的每个查询向量与测试样本查询向量集Qtest中每个向量的距离并排序,生成用户查询向量集Quser中对应的排序Ruser,通过排序序号返回用户所需的查询图片作为输出以实现检索功能。
上述的VLAD方法,其包括以下步骤:
A、图片的局部描述特征提取;对需表达的图片提取D维度的SIFT特征;
B、通过最近邻查找将图片的SIFT特征映射到有K个词汇的字典上,生成每个词汇对应的SIFT特征集Wi;字典通过事先在训练样本集对应的SIFT集上聚类得到,聚类方法采用k-means算法;
C、将图片中完成映射的词汇按其所属词汇求和,并按照词汇顺序拼接,生成图片VLAD表达向量V如下所示:
V=[∑W1,∑EW2,......,∑WK]
其中,[.]表示向量拼接运算;
由此便得到K×D维的图片VLAD表达向量V。
本发明的优点在于:
本发明由于提取了医学图像数据库的隐层语义,使得图片表达能够更好地映射到图片标记空间,映射模型具有良好的鲁棒性,能较好地对类内目标和类间目标进行建模,通过使用映射后的空间向量进行查询,能够在很大程度上提高检索系统的检索精度。
附图说明
图1为本发明基于隐层语义中层表达的图像检索的流程图;
具体实施方式
本发明提供了一种基于隐层语义中层表达的图像检索方法以下面结合附图,对本发明实现的步骤作进一步的详细描述:
参照图1,本发明实现的步骤如下:
步骤1,从医学图像数据库划分训练样本集和测试样本集。
步骤1.1)在训练医学图像数据库的每个类别中选取等量的样本作为训练样本集;其中,训练医学图像数据库是带分类标签的医学图像数据;
步骤1.2)将测试医学图像数据库和全部的训练医学图像数据库作为测试样本集;
步骤2,生成用于训练中层表达模型的训练向量集。
步骤2.1)选取全部的训练集,利用VLAD(Vector of Locally AggregatedDescriptors)请给出方法将其中的每一幅图片表示为VLAD向量,生成训练样本集的对应VLAD向量集Xtrain
上所述的VLAD方法是一种成熟的现有技术,其包括图片的局部描述特征提取、局部特征的聚类、局部特征的中心最近邻映射、图片词汇的聚合表达,其步骤如下:
图片的局部描述特征提取;对需表达的图片提取D维度的SIFT特征(特征的中文为:尺度不变特征变换;特征的提取方法由文献提供:Lowe,David G."Object recognitionfrom local scale-invariant features."Computer vision.The proceedings of theseventh IEEE international conference on.Vol.2.IEEE,1999.)
步骤2.2)通过最近邻查找将图片的SIFT特征映射到有K个词汇的字典上,生成每个词汇对应的SIFT特征集Wi;字典通过事先在训练样本集对应的SIFT集上聚类得到,聚类方法采用k-means算法;
步骤2.3)将图片中完成映射的词汇按其所属词汇求和,并按照词汇顺序拼接,生成图片VLAD表达向量V如下所示:
V=[∑W1,∑EW2,......,∑WK]
其中,[.]表示向量拼接运算;
由此便得到K×D维的图片VLAD表达向量V。
步骤2.2)将训练集中的每幅图像对应的标记制作成标记向量,生成训练样本集对应的标记向量集Ytrain,标记向量集为图片对应的标记列向量,若图片属于步骤1.1)中的类别,则标记该图片,否则不标记;
步骤3,选取输入向量集训练生成映射矩阵M。
步骤3)生成映射矩阵M;
步骤3.1)选取步骤2)生成的VLAD向量集Xtrain和标记向量集Ytrain作为训练模型的输入集;
步骤3.2)使用基于隐层语义的中层表达式建立VLAD向量集Xtrain和标记向量集Ytrain之间的映射模型,生成映射矩阵M;具体如下:
将VLAD向量集Xtrain和标记向量集Ytrain带入以下目标式中的X和Y:
Figure GDA0002496502340000071
其中,α,β1,β2,β3,β4为权重参数;W为标记映射矩阵;θ为中层表达映射矩阵;U,V为矩阵分解乘子;
通过优化求解上式,可以得到映射矩阵M:
M=Wθ;
步骤4,生成测试样本查询向量集;
4)生成测试样本查询向量集;
4.1)选取测试样本集,利用VLAD方法将其中每幅图片表示为VLAD向量,生成测试样本集对应的VLAD向量集Xtest
4.2)通过映射矩阵M与VLAD向量集Xtest中各向量的乘积生成测试样本集对应的测试样本查询向量集Qtest
步骤5,计算检索精度与响应用户查询。
步骤5.1)生成训练样本查询向量集并计算精度
步骤5.1.1)从训练样本集的每个类别中随机选取等量共N幅图像作为查询集,利用VLAD方法将查询集中每幅图像表示为VLAD向量,生成查询集对应的VLAD向量集Xquery
步骤5.1.2)通过映射矩阵M与VLAD向量集Xquery中各向量的乘积生成查询集对应的训练样本查询向量集Qquery
步骤5.1.3)通过比较训练样本查询向量集Qquery中的每个查询向量与测试样本查询向量集Qtest中每个向量的距离并排序,生成训练样本查询向量集Qquery对应的排序集R;
5.1.4)计算排序集R各个排序向量对应的排序精度并生成排序集对应的精度向量AP,得出系统的平均精度性能指标mAP;
mAP=(∑AP)/N
其中,N为步骤5.1.1)中从训练样本集的各类别中随机抽取的等量共N幅图像;
5.2)生成用户查询向量集并返回检索排序;
5.2.1)选取用户查询图像,利用VLAD方法将查询图像表示为用户查询VLAD向量,生成用户查询图像对应的用户查询VLAD向量Xuser
5.2.2)通过映射矩阵M与用户查询VLAD向量Xuser相乘生成用户查询VLAD向量对应的用户查询向量集Quser
5.2.3)通过比较用户查询向量集Quser中的每个查询向量与测试样本查询向量集Qtest中每个向量的距离并排序,生成用户查询向量集Quser中对应的排序Ruser,通过排序序号返回用户所需的查询图片作为输出以实现检索功能。
为了了更好证明本发明的技术方案的系统检索精度高,是申请人就本发明的技术方案与现有技术的技术方案进行的对比验证;
对比验证:
从医学图像数据库中的20个人体X光分类中,每类随机选取10张图片作为查询请求。
本发明:利用本发明的方法计算全部查询的mAP作为检索系统的评价指标。
现有技术:采用传统的直接使用VLAD向量作为查询向量的检索方法计算查询的mAP作为检索系统的评价指标。
表1表示直接使用VLAD向量的检索方法与本发明检索方法最终检索的结果:
表1系统检索精度
Figure GDA0002496502340000091
从表1可见,试验1的本发明的平均检索精度(mAP)较试验2的直接使用VLAD向量的方法提高64.34%。这是因为本发明学习了图片直接表达向量之间的隐层语义模型,在图片表达和其标记之间建立了良好的映射模型,因此获得了更好的系统检索精度,进一步验证了本发明的先进性。
注:本发明是在中央处理器为Intel(R)Core(TM)i3-21303.40GHZ、内存16G、WINDOWS 7操作系统上,运用MATLAB软件进行的仿真。
实施例中使用的医学图像数据库为文献“Xia H,Hoi S,Jin R,P Zhao.OnlineMultiple Kernel Similarity Learning for Visual Search.IEEE Trans,PatternAnalysis and Machine Intelligence,2012.”中公开的从ImageCLEF中获取的X光数据库。

Claims (2)

1.一种基于隐层语义中层表达的图像检索方法,其特征在于,包括以下步骤:
1)从医学图像数据库划分训练样本集和测试样本集;
1.1)在训练医学图像数据库的每个类别中选取等量的样本作为训练样本集;所述训练医学图像数据库是带分类标签的医学图像数据;
1.2)将测试医学图像数据库和全部的训练医学图像数据库作为测试样本集;
2)生成训练样本集对应的VLAD向量集以及训练样本集对应的标记向量集;
2.1)选取全部的训练样本集,利用VLAD方法将训练样本集中的每幅图像表示为VLAD向量,生成训练样本集的对应VLAD向量集Xtrain
2.2)将训练样本集中的每幅图像对应的标记制作成标记向量,生成训练样本集对应的标记向量集Ytrain;所述标记向量集为图片对应的标记二值列向量,若图片属于步骤1.1)中的所述类别,则标记该图片,否则不标记;
3)生成映射矩阵M;
3.1)选取步骤2)生成的VLAD向量集Xtrain和标记向量集Ytrain作为训练模型的输入集;
3.2)使用基于隐层语义的中层表达式建立VLAD向量集Xtrain和标记向量集Ytrain之间的映射模型,生成映射矩阵M;具体如下:
将VLAD向量集Xtra1n和标记向量集Ytrain带入以下目标式中的X和Y:
Figure FDA0002496502330000011
其中,α,β1,β2,β3,β4为权重参数;W为标记映射矩阵;θ为中层表达映射矩阵;U,V为矩阵分解乘子;
通过优化求解上式,可以得到映射矩阵M:
M=Wθ;
4)生成测试样本查询向量集;
4.1)选取测试样本集,利用VLAD方法将其中每幅图片表示为VLAD向量,生成测试样本集对应的VLAD向量集Xtest
4.2)通过映射矩阵M与VLAD向量集Xtest中各向量的乘积生成测试样本集对应的测试样本查询向量集Qtest
5)计算检索精度与响应用户查询;
5.1)生成训练样本查询向量集并计算检索精度;
5.1.1)从训练样本集的每个类别中随机选取等量共N幅图像作为查询集,利用VLAD方法将查询集中每幅图像表示为VLAD向量,生成查询集对应的VLAD向量集Xquery
5.1.2)通过映射矩阵M与VLAD向量集Xquery中各向量的乘积生成查询集对应的训练样本查询向量集Qquery
5.1.3)通过比较训练样本查询向量集Qquery中的每个查询向量与测试样本查询向量集Qtest中每个查询向量的距离并排序,生成训练样本查询向量集Qquery对应的排序集R;
5.1.4)计算排序集R各个排序向量对应的排序精度并生成排序集对应的精度向量AP,得出系统的平均精度性能指标mAP;
mAP=(∑AP)/N
其中,N为步骤5.1.1)中从训练样本集的各类别中随机抽取的等量共N幅图像;
5.2)生成用户查询向量集并返回检索排序;
5.2.1)选取用户查询图像,利用VLAD方法将查询图像表示为用户查询VLAD向量,生成用户查询图像对应的用户查询VLAD向量Xuser
5.2.2)通过映射矩阵M与用户查询VLAD向量Xuser相乘生成用户查询VLAD向量对应的用户查询向量集Quser
5.2.3)通过比较用户查询向量集Quser中的每个查询向量与测试样本查询向量集Qtest中每个向量的距离并排序,生成用户查询向量集Quser中对应的排序Ruser,通过排序序号返回用户所需的查询图片作为输出以实现检索功能。
2.根据权利要求1所述的基于隐层语义中层表达的图像检索方法,其特征在于:所述的VLAD方法,其包括以下步骤:
A、图片的局部描述特征提取;对需表达的图片提取D维度的SIFT特征;
B、通过最近邻查找将图片的SIFT特征映射到有K个词汇的字典上,生成每个词汇对应的SIFT特征集Wi;字典通过事先在训练样本集对应的SIFT集上聚类得到,聚类方法采用k-means算法;
C、将图片中完成映射的词汇按其所属词汇求和,并按照词汇顺序拼接,生成图片VLAD表达向量V如下所示:
V=[∑W1,∑W2,……,∑WK]
其中,[.]表示向量拼接运算;
由此便得到K×D维的图片VLAD表达向量V。
CN201510076112.XA 2015-02-12 2015-02-12 基于隐层语义中层表达的图像检索方法 Active CN105989094B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510076112.XA CN105989094B (zh) 2015-02-12 2015-02-12 基于隐层语义中层表达的图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510076112.XA CN105989094B (zh) 2015-02-12 2015-02-12 基于隐层语义中层表达的图像检索方法

Publications (2)

Publication Number Publication Date
CN105989094A CN105989094A (zh) 2016-10-05
CN105989094B true CN105989094B (zh) 2020-09-01

Family

ID=57041243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510076112.XA Active CN105989094B (zh) 2015-02-12 2015-02-12 基于隐层语义中层表达的图像检索方法

Country Status (1)

Country Link
CN (1) CN105989094B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107066520B (zh) * 2017-02-14 2021-05-18 苏州飞搜科技有限公司 一种基于多个语义层次的图片检索方法及系统
CN109241327A (zh) * 2017-07-03 2019-01-18 北大方正集团有限公司 图像检索方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778227A (zh) * 2014-01-23 2014-05-07 西安电子科技大学 从检索图像中筛选有用图像的方法
CN103927559A (zh) * 2014-04-17 2014-07-16 深圳大学 超声图像胎儿颜面部标准切面自动识别方法及系统
CN104216949A (zh) * 2014-08-13 2014-12-17 中国科学院计算技术研究所 一种融合空间信息的图像特征聚合表示方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7715597B2 (en) * 2004-12-29 2010-05-11 Fotonation Ireland Limited Method and component for image recognition

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778227A (zh) * 2014-01-23 2014-05-07 西安电子科技大学 从检索图像中筛选有用图像的方法
CN103927559A (zh) * 2014-04-17 2014-07-16 深圳大学 超声图像胎儿颜面部标准切面自动识别方法及系统
CN104216949A (zh) * 2014-08-13 2014-12-17 中国科学院计算技术研究所 一种融合空间信息的图像特征聚合表示方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
大规模互联网图像检索与模式挖掘;张磊;《中国科学》;20131231;第43卷(第12期);第1641-1653页 *

Also Published As

Publication number Publication date
CN105989094A (zh) 2016-10-05

Similar Documents

Publication Publication Date Title
CN110795543B (zh) 基于深度学习的非结构化数据抽取方法、装置及存储介质
CN107330100B (zh) 基于多视图联合嵌入空间的图像-文本双向检索方法
CN106202256B (zh) 基于语义传播及混合多示例学习的Web图像检索方法
CN110750959A (zh) 文本信息处理的方法、模型训练的方法以及相关装置
Yu et al. Multimodal unified attention networks for vision-and-language interactions
CN106844518B (zh) 一种基于子空间学习的不完整跨模态检索方法
CN108388639B (zh) 一种基于子空间学习与半监督正则化的跨媒体检索方法
CN111666427A (zh) 一种实体关系联合抽取方法、装置、设备及介质
CN108595546B (zh) 基于半监督的跨媒体特征学习检索方法
CN110647904A (zh) 一种基于无标记数据迁移的跨模态检索方法及系统
CN111324765A (zh) 基于深度级联跨模态相关性的细粒度草图图像检索方法
Xu et al. Instance-level coupled subspace learning for fine-grained sketch-based image retrieval
CN113889228A (zh) 基于混合注意的语义增强哈希医学图像检索方法
CN112214335A (zh) 基于知识图谱和相似度网络的Web服务发现方法
CN116611024A (zh) 一种基于事实和情感对立性的多模态反讽检测方法
CN114239612A (zh) 一种多模态神经机器翻译方法、计算机设备及存储介质
CN110442736B (zh) 一种基于二次判别分析的语义增强子空间跨媒体检索方法
CN109857892B (zh) 基于类标传递的半监督跨模态哈希检索方法
CN113239159B (zh) 基于关系推理网络的视频和文本的跨模态检索方法
CN114579794A (zh) 特征一致性建议的多尺度融合地标图像检索方法及系统
CN105989094B (zh) 基于隐层语义中层表达的图像检索方法
Guo et al. Matching visual features to hierarchical semantic topics for image paragraph captioning
JP2008181296A (ja) 画像検索方法および画像検索プログラム
CN107633259A (zh) 一种基于稀疏字典表示的跨模态学习方法
CN111104481B (zh) 一种识别匹配字段的方法、装置及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant