CN109857893A - 图片检索方法、装置、计算机设备及存储介质 - Google Patents
图片检索方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN109857893A CN109857893A CN201910041076.1A CN201910041076A CN109857893A CN 109857893 A CN109857893 A CN 109857893A CN 201910041076 A CN201910041076 A CN 201910041076A CN 109857893 A CN109857893 A CN 109857893A
- Authority
- CN
- China
- Prior art keywords
- picture
- user
- label
- retrieved
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了图片检索方法、装置、计算机设备及存储介质。该方法包括:若用户模式是用户账户登录模式,判断用户账号登录模式对应的用户账号是否设置有用户职业标签;若用户账号登录模式对应的用户账号设置有用户职业标签,将用户职业标签转化为标签词向量;通过卷积神经网络模型对待检索图片进行特征提取,得到对应的图片特征向量;根据标签词向量定位目标图片库,在其中获取与图片特征向量之间的近似度超出近似度阈值的图片,以组成检索结果;将检索结果推送至待检索图片对应的上传端。该方法实现了结合用户的实际职业来确定检索的图片库,以作为待检索图片的近似图片的获取来源,无需与海量的图片都进行比对,从而提高了检索效率。
Description
技术领域
本发明涉及图像匹配技术领域,尤其涉及一种图片检索方法、装置、计算机设备及存储介质。
背景技术
目前,用户在检索图片时,一般是在图片搜索引擎中直接上传图片,以搜索相同或相似的图片。但是在根据上传的图片检索获得结果图像时,是根据搜索引擎来进行检索,也就是需要将上传的图片与服务器中海量的图片进行比对,以获取初步的结果图像,这就导致在获取结果图像时所需比对时间较长。
发明内容
本发明实施例提供了一种图片检索方法、装置、计算机设备及存储介质,旨在解决现有技术中上传图片进行检索时需要将上传的图片与服务器中海量的图片进行比对,以获取初步的结果图像,这就导致在获取结果图像时所需比对时间较长的问题。
第一方面,本发明实施例提供了一种图片检索方法,其包括:
接收用户所上传的待检索图片,判断用户模式是否为用户账户登录模式;
若用户模式是用户账户登录模式,判断用户账号登录模式对应的用户账号是否设置有用户职业标签;
若用户账号登录模式对应的用户账号设置有用户职业标签,将所述用户职业标签转化为标签词向量;
通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量,将所述标签词向量与所述图片特征向量进行组合得到图片特征向量集;
根据所述图片特征向量集中所述标签词向量定位目标图片库,在所述目标图片库中获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以组成检索结果;以及
将所述检索结果推送至所述待检索图片对应的上传端。
第二方面,本发明实施例提供了一种图片检索装置,其包括:
用户模式判断单元,用于接收用户所上传的待检索图片,判断用户模式是否为用户账户登录模式;
职业标签判断单元,用于若用户模式是用户账户登录模式,判断用户账号登录模式对应的用户账号是否设置有用户职业标签;
标签词向量获取单元,用于若用户账号登录模式对应的用户账号设置有用户职业标签,将所述用户职业标签转化为标签词向量;
第一特征向量提取单元,用于通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量,将所述标签词向量与所述图片特征向量进行组合得到图片特征向量集;
目标库检索单元,用于根据所述图片特征向量集中所述标签词向量定位目标图片库,在所述目标图片库中获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以组成检索结果;以及
检索结果发送单元,用于将所述检索结果推送至所述待检索图片对应的上传端。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的图片检索方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的图片检索方法。
本发明实施例提供了一种图片检索方法、装置、计算机设备及存储介质。该方法包括接收用户所上传的待检索图片,判断用户模式是否为用户账户登录模式;若用户模式是用户账户登录模式,判断用户账号登录模式对应的用户账号是否设置有用户职业标签;若用户账号登录模式对应的用户账号设置有用户职业标签,将所述用户职业标签转化为标签词向量;通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量,将所述标签词向量与所述图片特征向量进行组合得到图片特征向量集;根据所述图片特征向量集中所述标签词向量定位目标图片库,在所述目标图片库中获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以组成检索结果;以及将所述检索结果推送至所述待检索图片对应的上传端。该方法实现了结合用户的实际职业来确定检索的图片库,通过用户的实际职业对应的目标图片集合作为待检索图片的近似图片的获取来源,无需与海量的图片每一张都进行比对,从而提高了检索效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的图片检索方法的应用场景示意图;
图2为本发明实施例提供的图片检索方法的流程示意图;
图3为本发明实施例提供的图片检索方法的另一流程示意图;
图4为本发明实施例提供的图片检索方法的子流程示意图;
图5为本发明实施例提供的图片检索方法的另一子流程示意图;
图6为本发明实施例提供的图片检索装置的示意性框图;
图7为本发明实施例提供的图片检索装置的另一示意性框图;
图8为本发明实施例提供的图片检索装置的子单元示意性框图;
图9为本发明实施例提供的图片检索装置的另一子单元示意性框图;
图10为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的图片检索方法的应用场景示意图,图2为本发明实施例提供的图片检索方法的流程示意图,该图片检索方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。
如图2所示,该方法包括步骤S110~S160。
S110、接收用户所上传的待检索图片,判断用户模式是否为用户账户登录模式。
在本实施例中,当用户使用终端(如智能手机、平板电脑等)作为上传端将需要进行检索的待检索图片通过服务器提供的图片检索引擎的UI界面中上传后,服务器接收所述待检索图片。之后判断用户模式是为了判断用户是否启用专业检索模式,用户在非登录模式下进行图片检索时,是将待检索图片与图片数据库中海量的数据进行比对寻找近似图片;而在用户账户登录模式下进行图片检索,可以先确定用户的身份标签,根据用户的身份标签寻找对应的图片库,实现小范围的图片检索。
其中,用户所上传的待检索图片的获取方式,一般可采用如下方式:拍摄获取,在上传端本地的文件夹中选中本地图片作为待检索图片,截屏获取,或者是用户手绘草图。通过上述四种方式,实现了待检索图片的获取。
S120、若用户模式是用户账户登录模式,判断用户账号登录模式对应的用户账号是否设置有用户职业标签。
在本实施例中,若用户模式不是用户账户登录模式,执行以下步骤:
通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量;
获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以作组成检索结果。
其中,设置用户账号的职业标签,是为了满足不同职业人员的不同检索需求。例如从事商标申请岗的人员,其常用的图片检索功能是对各种商标进行检索,一旦系统检索到用户职业标签为商标申请岗,则用户上传的待检索图片的目标搜索库就局限到商标图片库。例如从事服装设计的人员,其常用的图片检索功能是对各种服装样式图片进行检索,一旦系统检索到用户职业标签为服装设计岗,则用户上传的待检索图片的目标搜索库就局限到服装样式图片库。通过对用户账号设置用户职业标签,能快速定位服务器中与用户职业标签对应的目标图片库,以缩小检索范围。
S130、若用户账号登录模式对应的用户账号设置有用户职业标签,将所述用户职业标签转化为标签词向量。
在一实施例中,步骤S130中包括:
通过用于将词语转化为向量的Word2Vec模型将所述用户职业标签转化为标签词向量。
在本实施例中,Word2Vec是从大量文本语料中以无监督的方式学习语义知识的一种模型,能将分词结果中每一词语转化成对应的词向量,具体可将分词结果每一词语都转化为一个k维的向量。将所述用户职业标签转化为标签词向量,即可与服务器的多个图片库中各图片库的标签进行比对,以搜索到目标库。
S140、通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量,将所述标签词向量与所述图片特征向量进行组合得到图片特征向量集。
在一实施例中,如图4所示,步骤S140包括:
S141、获取所述待检索图片对应的像素矩阵;
S142、将所述像素矩阵输入至所述卷积神经网络模型的卷积层,得到多个特征图;
S143、将多个特征图均输入至所述卷积神经网络模型的池化层,得到每一特征图对应的池化结果;
S144、将每一特征图对应的池化结果输入至所述卷积神经网络模型的全连接层,得到与所述待检索图片对应的图片特征向量。
在本实施例中,通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量,是为了后续与目标库中个图片的图片特征向量进行比对以获取近似图片。
将待检索图片对应的像素矩阵作为已训练的卷积神经网络模型中输入层的输入,得到多个特征图;输入层通过卷积操作得到若干个Feature Map(Feature Map可以理解为特征图),卷积窗口的大小为h×k,其中h表示纵向像素的个数,而k表示向量的维数。通过这样一个大型的卷积窗口,将得到若干个列数为1的Feature Map。
在已训练的卷积神经网络模型的池化层中,可采用从上述多个一维的FeatureMap中提出最大的值,最终池化层的输出为各个Feature Map的最大值,即一个一维的向量。
在已训练的卷积神经网络模型的全连接层中,全连接层的每一个结点都与上一层的所有结点相连,用于将池化层所提取到的特征综合起来,得到一个1*n的图片特征向量,例如得到一个1*200的图片特征向量。通过卷积神经网络模型能有效提取出待检索图片中更深层次的特征,使得后续的相似图片的判断结果更加准确。
S150、根据所述图片特征向量集中所述标签词向量定位目标图片库,在所述目标图片库中获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以组成检索结果。
在本实施例中,若用户在用户账号登录模式下,由于设置了用户职业标签,此时用户的职业已知,此时服务器在检索与待检索图片近似的图片时,目标图片库是服务器中与登录的用户账号具有相同用户职业标签的图片库。即,此时先通过图片特征向量集中包括的标签词向量定位目标图片库,从而快速的缩小检索范围。
在一实施例中,如图5所示,步骤S150包括:
S151、将所述图片特征向量通过PCA降维,得到待检索图片主向量;
S152、将所述待检索图片主向量与目标图片库中各图片的主向量进行皮尔逊相似度计算,获取与所述待检索图片主向量的皮尔逊相似度大于预设相似度阈值的主向量所对应图片,以作为检索结果。
在本实施例中,PCA(主成分分析)算法目的是在“信息”损失较小的前提下,将高维的数据转换到低维,通过析取主成分显出的最大的个别差异,也可以用来削减回归分析和聚类分析中变量的数目,从而减小计算量。PCA是一种较为常用的降维技术,PCA的思想是将维特征映射到维上,这维是全新的正交特征。这维特征称为主元,是重新构造出来的维特征。在PCA中,数据从原来的坐标系转换到新的坐标系下,新的坐标系的选择与数据本身是密切相关的。第一个新坐标轴选择的是原始数据中方差最大的方向,第二个新坐标轴选择和第一个坐标轴正交且具有最大方差的方向。该过程一直重复,重复次数为原始数据中特征的数目。大部分方差都包含在最前面的几个新坐标轴中。因此,可以忽略余下的坐标轴,即对数据进行降维处理。
在计算待检索图片主向量与目标图片库中各图片的主向量的相似程度时,可以皮尔逊相似度作为参考标准。皮尔逊相似度的取值范围是0~1,若越接近1则表示相似程度越高,若越接近0表示相似程度低。
计算任意两个列向量之间的皮尔逊相关系数,可以通过以下公式进行计算:
其中,E表示数学期望;
ρX,Y的取值范围是(0,1),当ρX,Y越接近1表示两个列向量的相似程度越高,当ρX,Y越接近0表示两个列向量的相似程度越低。
S160、将所述检索结果推送至所述待检索图片对应的上传端。
在本实施例中,当完成了对所述待检索图片的检索后,将检索结果推送至上传端并在上传端的UI界面上显示。
在一实施例中,如图3所示,步骤S120之后还包括:
S170、若用户账号登录模式对应的用户账号未设置用户职业标签,通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量;
S180、获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以作组成检索结果。
在本实施例中,步骤S180执行完成后跳转执行步骤S160,即将所述检索结果推送至所述待检索图片对应的上传端。若用户在非登录模式下,由于无用户职业标签,此时用户的职业未知,服务器在检索与待检索图片近似的图片时,目标图片库是服务器中存储的所有图片。此时为了快速获取与待检索图片近似的图片,可以通过卷积神经网络模型对所述待检索图片进行特征提取,得到图片特征向量,通过计算待检索图片对应的图片特征向量与服务器中存储的所有图片的图片特征向量进行比对(例如计算向量之间的皮尔逊相似度),即可获取待检索图片的近似图片,以作为检索结果。
该方法实现了结合用户的实际职业来确定检索的图片库,以作为待检索图片的近似图片的获取来源,无需与海量的图片都进行比对,从而提高了检索效率。
本发明实施例还提供一种图片检索装置,该图片检索装置用于执行前述图片检索方法的任一实施例。具体地,请参阅图6,图6是本发明实施例提供的图片检索装置的示意性框图。该图片检索装置100可以配置于服务器中。
如图6所示,图片检索装置100包括用户模式判断单元110、职业标签判断单元120、标签词向量获取单元130、第一特征向量提取单元140、目标库检索单元150、检索结果发送单元160。
用户模式判断单元110,用于接收用户所上传的待检索图片,判断用户模式是否为用户账户登录模式。
在本实施例中,当用户使用终端(如智能手机、平板电脑等)作为上传端将需要进行检索的待检索图片通过服务器提供的图片检索引擎的UI界面中上传后,服务器接收所述待检索图片。之后判断用户模式是为了判断用户是否启用专业检索模式,用户在非登录模式下进行图片检索时,是将待检索图片与图片数据库中海量的数据进行比对寻找近似图片;而在用户账户登录模式下进行图片检索,可以先确定用户的身份标签,根据用户的身份标签寻找对应的图片库,实现小范围的图片检索。
其中,用户所上传的待检索图片的获取方式,一般可采用如下方式:拍摄获取,在上传端本地的文件夹中选中本地图片作为待检索图片,截屏获取,或者是用户手绘草图。通过上述四种方式,实现了待检索图片的获取。
职业标签判断单元120,用于若用户模式是用户账户登录模式,判断用户账号登录模式对应的用户账号是否设置有用户职业标签。
在本实施例中,设置用户账号的职业标签,是为了满足不同职业人员的不同检索需求。例如从事商标申请岗的人员,其常用的图片检索功能是对各种商标进行检索,一旦系统检索到用户职业标签为商标申请岗,则用户上传的待检索图片的目标搜索库就局限到商标图片库。例如从事服装设计的人员,其常用的图片检索功能是对各种服装样式图片进行检索,一旦系统检索到用户职业标签为服装设计岗,则用户上传的待检索图片的目标搜索库就局限到服装样式图片库。通过对用户账号设置用户职业标签,能快速定位服务器中与用户职业标签对应的目标图片库,以缩小检索范围。
标签词向量获取单元130,用于若用户账号登录模式对应的用户账号设置有用户职业标签,将所述用户职业标签转化为标签词向量。
在一实施例中,标签词向量获取单元130具体用于:
通过用于将词语转化为向量的Word2Vec模型将所述用户职业标签转化为标签词向量。
在本实施例中,Word2Vec是从大量文本语料中以无监督的方式学习语义知识的一种模型,能将分词结果中每一词语转化成对应的词向量,具体可将分词结果每一词语都转化为一个k维的向量。将所述用户职业标签转化为标签词向量,即可与服务器的多个图片库中各图片库的标签进行比对,以搜索到目标库。
第一特征向量提取单元140,用于通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量,将所述标签词向量与所述图片特征向量进行组合得到图片特征向量集。
在一实施例中,如图8所示,第一特征向量提取单元140包括:
像素矩阵获取单元141,用于获取所述待检索图片对应的像素矩阵;
卷积单元142,用于将所述像素矩阵输入至所述卷积神经网络模型的卷积层,得到多个特征图;
池化单元143,用于将多个特征图均输入至所述卷积神经网络模型的池化层,得到每一特征图对应的池化结果;
全连接单元144,用于将每一特征图对应的池化结果输入至所述卷积神经网络模型的全连接层,得到与所述待检索图片对应的图片特征向量。
在本实施例中,通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量,是为了后续与目标库中个图片的图片特征向量进行比对以获取近似图片。
将待检索图片对应的像素矩阵作为已训练的卷积神经网络模型中输入层的输入,得到多个特征图;输入层通过卷积操作得到若干个Feature Map(Feature Map可以理解为特征图),卷积窗口的大小为h×k,其中h表示纵向像素的个数,而k表示向量的维数。通过这样一个大型的卷积窗口,将得到若干个列数为1的Feature Map。
在已训练的卷积神经网络模型的池化层中,可采用从上述多个一维的FeatureMap中提出最大的值,最终池化层的输出为各个Feature Map的最大值,即一个一维的向量。
在已训练的卷积神经网络模型的全连接层中,全连接层的每一个结点都与上一层的所有结点相连,用于将池化层所提取到的特征综合起来,得到一个1*n的图片特征向量,例如得到一个1*200的图片特征向量。通过卷积神经网络模型能有效提取出待检索图片中更深层次的特征,使得后续的相似图片的判断结果更加准确。
目标库检索单元150,用于根据所述图片特征向量集中所述标签词向量定位目标图片库,在所述目标图片库中获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以组成检索结果。
在本实施例中,若用户在用户账号登录模式下,由于设置了用户职业标签,此时用户的职业已知,此时服务器在检索与待检索图片近似的图片时,目标图片库是服务器中与登录的用户账号具有相同用户职业标签的图片库。即,此时先通过图片特征向量集中包括的标签词向量定位目标图片库,从而快速的缩小检索范围。
在一实施例中,如图9所示,目标库检索单元150包括:
降维单元151,用于将所述图片特征向量通过PCA降维,得到待检索图片主向量;
相似度计算单元152,用于将所述待检索图片主向量与目标图片库中各图片的主向量进行皮尔逊相似度计算,获取与所述待检索图片主向量的皮尔逊相似度大于预设相似度阈值的主向量所对应图片,以作为检索结果。
在本实施例中,PCA(主成分分析)算法目的是在“信息”损失较小的前提下,将高维的数据转换到低维,通过析取主成分显出的最大的个别差异,也可以用来削减回归分析和聚类分析中变量的数目,从而减小计算量。PCA是一种较为常用的降维技术,PCA的思想是将维特征映射到维上,这维是全新的正交特征。这维特征称为主元,是重新构造出来的维特征。在PCA中,数据从原来的坐标系转换到新的坐标系下,新的坐标系的选择与数据本身是密切相关的。第一个新坐标轴选择的是原始数据中方差最大的方向,第二个新坐标轴选择和第一个坐标轴正交且具有最大方差的方向。该过程一直重复,重复次数为原始数据中特征的数目。大部分方差都包含在最前面的几个新坐标轴中。因此,可以忽略余下的坐标轴,即对数据进行降维处理。
在计算待检索图片主向量与目标图片库中各图片的主向量的相似程度时,可以皮尔逊相似度作为参考标准。皮尔逊相似度的取值范围是0~1,若越接近1则表示相似程度越高,若越接近0表示相似程度低。
计算任意两个列向量之间的皮尔逊相关系数,可以通过以下公式进行计算:
其中,E表示数学期望;
ρX,Y的取值范围是(0,1),当ρX,Y越接近1表示两个列向量的相似程度越高,当ρX,Y越接近0表示两个列向量的相似程度越低。
检索结果发送单元160,用于将所述检索结果推送至所述待检索图片对应的上传端。
在本实施例中,当完成了对所述待检索图片的检索后,将检索结果推送至上传端并在上传端的UI界面上显示。
在一实施例中,如图7所示,图片检索装置100还包括:
第二特征向量提取单元170,用于若用户账号登录模式对应的用户账号未设置用户职业标签,通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量;
全库检索单元180,用于获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以作组成检索结果。
在本实施例中,若用户在非登录模式下,由于无用户职业标签,此时用户的职业未知,服务器在检索与待检索图片近似的图片时,目标图片库是服务器中存储的所有图片。此时为了快速获取与待检索图片近似的图片,可以通过卷积神经网络模型对所述待检索图片进行特征提取,得到图片特征向量,通过计算待检索图片对应的图片特征向量与服务器中存储的所有图片的图片特征向量进行比对(例如计算向量之间的皮尔逊相似度),即可获取待检索图片的近似图片,以作为检索结果。
该装置实现了结合用户的实际职业来确定检索的图片库,以作为待检索图片的近似图片的获取来源,无需与海量的图片都进行比对,从而提高了检索效率。
上述图片检索装置可以实现为计算机程序的形式,该计算机程序可以在如图10所示的计算机设备上运行。
请参阅图10,图10是本发明实施例提供的计算机设备的示意性框图。该计算机设备500是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图10,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行图片检索方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行图片检索方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图10中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下功能:接收用户所上传的待检索图片,判断用户模式是否为用户账户登录模式;若用户模式是用户账户登录模式,判断用户账号登录模式对应的用户账号是否设置有用户职业标签;若用户账号登录模式对应的用户账号设置有用户职业标签,将所述用户职业标签转化为标签词向量;通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量,将所述标签词向量与所述图片特征向量进行组合得到图片特征向量集;根据所述图片特征向量集中所述标签词向量定位目标图片库,在所述目标图片库中获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以组成检索结果;以及将所述检索结果推送至所述待检索图片对应的上传端。
在一实施例中,处理器502在执行所述若用户模式是用户账户登录模式,判断用户账号登录模式对应的用户账号是否设置有用户职业标签的步骤之后,还执行如下操作:若用户账号登录模式对应的用户账号未设置用户职业标签,通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量;获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以作组成检索结果。
在一实施例中,处理器502在执行所述将所述用户职业标签转化为标签词向量的步骤时,执行如下操作:通过用于将词语转化为向量的Word2Vec模型将所述用户职业标签转化为标签词向量。
在一实施例中,处理器502在执行所述通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量的步骤时,执行如下操作:获取所述待检索图片对应的像素矩阵;将所述像素矩阵输入至所述卷积神经网络模型的卷积层,得到多个特征图;将多个特征图均输入至所述卷积神经网络模型的池化层,得到每一特征图对应的池化结果;将每一特征图对应的池化结果输入至所述卷积神经网络模型的全连接层,得到与所述待检索图片对应的图片特征向量。
在一实施例中,处理器502在执行在所述目标图片库中获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以组成检索结果的步骤时,执行如下操作:将所述图片特征向量通过PCA降维,得到待检索图片主向量;将所述待检索图片主向量与目标图片库中各图片的主向量进行皮尔逊相似度计算,获取与所述待检索图片主向量的皮尔逊相似度大于预设相似度阈值的主向量所对应图片,以作为检索结果。
本领域技术人员可以理解,图10中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图10所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:接收用户所上传的待检索图片,判断用户模式是否为用户账户登录模式;若用户模式是用户账户登录模式,判断用户账号登录模式对应的用户账号是否设置有用户职业标签;若用户账号登录模式对应的用户账号设置有用户职业标签,将所述用户职业标签转化为标签词向量;通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量,将所述标签词向量与所述图片特征向量进行组合得到图片特征向量集;根据所述图片特征向量集中所述标签词向量定位目标图片库,在所述目标图片库中获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以组成检索结果;以及将所述检索结果推送至所述待检索图片对应的上传端。
在一实施例中,所述若用户模式是用户账户登录模式,判断用户账号登录模式对应的用户账号是否设置有用户职业标签之后,还包括:若用户账号登录模式对应的用户账号未设置用户职业标签,通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量;获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以作组成检索结果。
在一实施例中,所述将所述用户职业标签转化为标签词向量,包括:通过用于将词语转化为向量的Word2Vec模型将所述用户职业标签转化为标签词向量。
在一实施例中,所述通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量,包括:获取所述待检索图片对应的像素矩阵;将所述像素矩阵输入至所述卷积神经网络模型的卷积层,得到多个特征图;将多个特征图均输入至所述卷积神经网络模型的池化层,得到每一特征图对应的池化结果;将每一特征图对应的池化结果输入至所述卷积神经网络模型的全连接层,得到与所述待检索图片对应的图片特征向量。
在一实施例中,所述在所述目标图片库中获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以组成检索结果,包括:将所述图片特征向量通过PCA降维,得到待检索图片主向量;将所述待检索图片主向量与目标图片库中各图片的主向量进行皮尔逊相似度计算,获取与所述待检索图片主向量的皮尔逊相似度大于预设相似度阈值的主向量所对应图片,以作为检索结果。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种图片检索方法,其特征在于,包括:
接收用户所上传的待检索图片,判断用户模式是否为用户账户登录模式;
若用户模式是用户账户登录模式,判断用户账号登录模式对应的用户账号是否设置有用户职业标签;
若用户账号登录模式对应的用户账号设置有用户职业标签,将所述用户职业标签转化为标签词向量;
通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量,将所述标签词向量与所述图片特征向量进行组合得到图片特征向量集;
根据所述图片特征向量集中所述标签词向量定位目标图片库,在所述目标图片库中获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以组成检索结果;以及
将所述检索结果推送至所述待检索图片对应的上传端。
2.根据权利要求1所述的图片检索方法,其特征在于,所述若用户模式是用户账户登录模式,判断用户账号登录模式对应的用户账号是否设置有用户职业标签之后,还包括:
若用户账号登录模式对应的用户账号未设置用户职业标签,通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量;
获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以作组成检索结果。
3.根据权利要求1所述的图片检索方法,其特征在于,所述将所述用户职业标签转化为标签词向量,包括:
通过用于将词语转化为向量的Word2Vec模型将所述用户职业标签转化为标签词向量。
4.根据权利要求1或2所述的图片检索方法,其特征在于,所述通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量,包括:
获取所述待检索图片对应的像素矩阵;
将所述像素矩阵输入至所述卷积神经网络模型的卷积层,得到多个特征图;
将多个特征图均输入至所述卷积神经网络模型的池化层,得到每一特征图对应的池化结果;
将每一特征图对应的池化结果输入至所述卷积神经网络模型的全连接层,得到与所述待检索图片对应的图片特征向量。
5.根据权利要求1所述的图片检索方法,其特征在于,所述在所述目标图片库中获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以组成检索结果,包括:
将所述图片特征向量通过PCA降维,得到待检索图片主向量;
将所述待检索图片主向量与目标图片库中各图片的主向量进行皮尔逊相似度计算,获取与所述待检索图片主向量的皮尔逊相似度大于预设相似度阈值的主向量所对应图片,以作为检索结果。
6.一种图片检索装置,其特征在于,包括:
用户模式判断单元,用于接收用户所上传的待检索图片,判断用户模式是否为用户账户登录模式;
职业标签判断单元,用于若用户模式是用户账户登录模式,判断用户账号登录模式对应的用户账号是否设置有用户职业标签;
标签词向量获取单元,用于若用户账号登录模式对应的用户账号设置有用户职业标签,将所述用户职业标签转化为标签词向量;
第一特征向量提取单元,用于通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量,将所述标签词向量与所述图片特征向量进行组合得到图片特征向量集;
目标库检索单元,用于根据所述图片特征向量集中所述标签词向量定位目标图片库,在所述目标图片库中获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以组成检索结果;以及
检索结果发送单元,用于将所述检索结果推送至所述待检索图片对应的上传端。
7.根据权利要求6所述的图片检索装置,其特征在于,还包括:
第二特征向量提取单元,用于若用户账号登录模式对应的用户账号未设置用户职业标签,通过卷积神经网络模型对所述待检索图片进行特征提取,得到对应的图片特征向量;
全库检索单元,用于获取与所述图片特征向量之间的近似度超出预设近似度阈值的图片以作组成检索结果。
8.根据权利要求6所述的图片检索装置,其特征在于,所述目标库检索单元,包括:
降维单元,用于将所述图片特征向量通过PCA降维,得到待检索图片主向量;
相似度计算单元,用于将所述待检索图片主向量与目标图片库中各图片的主向量进行皮尔逊相似度计算,获取与所述待检索图片主向量的皮尔逊相似度大于预设相似度阈值的主向量所对应图片,以作为检索结果。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的图片检索方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至5任一项所述的图片检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910041076.1A CN109857893A (zh) | 2019-01-16 | 2019-01-16 | 图片检索方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910041076.1A CN109857893A (zh) | 2019-01-16 | 2019-01-16 | 图片检索方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109857893A true CN109857893A (zh) | 2019-06-07 |
Family
ID=66895042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910041076.1A Pending CN109857893A (zh) | 2019-01-16 | 2019-01-16 | 图片检索方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109857893A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457434A (zh) * | 2019-07-19 | 2019-11-15 | 平安科技(深圳)有限公司 | 基于搜索的网页取证方法、装置、可读存储介质及服务器 |
CN110532866A (zh) * | 2019-07-22 | 2019-12-03 | 平安科技(深圳)有限公司 | 视频数据检测方法、装置、计算机设备及存储介质 |
CN110532411A (zh) * | 2019-07-22 | 2019-12-03 | 平安科技(深圳)有限公司 | 图片搜索热度获取方法、装置、计算机设备及存储介质 |
CN110674837A (zh) * | 2019-08-15 | 2020-01-10 | 深圳壹账通智能科技有限公司 | 视频相似度获取方法、装置、计算机设备及存储介质 |
CN110765832A (zh) * | 2019-08-15 | 2020-02-07 | 深圳壹账通智能科技有限公司 | 基于图像识别的信息推送方法、装置、及计算机设备 |
CN111598137A (zh) * | 2020-04-24 | 2020-08-28 | 北京金山云网络技术有限公司 | 用于提供推理服务的方法、装置及电子设备 |
CN112100412A (zh) * | 2020-09-01 | 2020-12-18 | 深圳市欢太科技有限公司 | 图片检索方法、装置、计算机设备和存储介质 |
CN115168637A (zh) * | 2022-06-17 | 2022-10-11 | 杭州晶彩数字科技有限公司 | 一种图片添加标签方法、系统及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017107865A1 (zh) * | 2015-12-22 | 2017-06-29 | 成都理想境界科技有限公司 | 图像检索系统、服务器、数据库及相关的方法 |
WO2017177661A1 (zh) * | 2016-04-15 | 2017-10-19 | 乐视控股(北京)有限公司 | 基于卷积神经网络的视频检索方法及系统 |
CN107315770A (zh) * | 2017-05-22 | 2017-11-03 | 朗动信息咨询(上海)有限公司 | 一种基于搜索引擎技术的科技信息检索系统 |
CN108846047A (zh) * | 2018-05-30 | 2018-11-20 | 百卓网络科技有限公司 | 一种基于卷积特征的图片检索方法及系统 |
CN109033107A (zh) * | 2017-06-09 | 2018-12-18 | 腾讯科技(深圳)有限公司 | 图像检索方法和装置、计算机设备和存储介质 |
-
2019
- 2019-01-16 CN CN201910041076.1A patent/CN109857893A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017107865A1 (zh) * | 2015-12-22 | 2017-06-29 | 成都理想境界科技有限公司 | 图像检索系统、服务器、数据库及相关的方法 |
WO2017177661A1 (zh) * | 2016-04-15 | 2017-10-19 | 乐视控股(北京)有限公司 | 基于卷积神经网络的视频检索方法及系统 |
CN107315770A (zh) * | 2017-05-22 | 2017-11-03 | 朗动信息咨询(上海)有限公司 | 一种基于搜索引擎技术的科技信息检索系统 |
CN109033107A (zh) * | 2017-06-09 | 2018-12-18 | 腾讯科技(深圳)有限公司 | 图像检索方法和装置、计算机设备和存储介质 |
CN108846047A (zh) * | 2018-05-30 | 2018-11-20 | 百卓网络科技有限公司 | 一种基于卷积特征的图片检索方法及系统 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457434A (zh) * | 2019-07-19 | 2019-11-15 | 平安科技(深圳)有限公司 | 基于搜索的网页取证方法、装置、可读存储介质及服务器 |
CN110457434B (zh) * | 2019-07-19 | 2023-10-27 | 平安科技(深圳)有限公司 | 基于搜索的网页取证方法、装置、可读存储介质及服务器 |
CN110532866A (zh) * | 2019-07-22 | 2019-12-03 | 平安科技(深圳)有限公司 | 视频数据检测方法、装置、计算机设备及存储介质 |
CN110532411A (zh) * | 2019-07-22 | 2019-12-03 | 平安科技(深圳)有限公司 | 图片搜索热度获取方法、装置、计算机设备及存储介质 |
CN110532411B (zh) * | 2019-07-22 | 2024-07-02 | 平安科技(深圳)有限公司 | 图片搜索热度获取方法、装置、计算机设备及存储介质 |
CN110674837A (zh) * | 2019-08-15 | 2020-01-10 | 深圳壹账通智能科技有限公司 | 视频相似度获取方法、装置、计算机设备及存储介质 |
CN110765832A (zh) * | 2019-08-15 | 2020-02-07 | 深圳壹账通智能科技有限公司 | 基于图像识别的信息推送方法、装置、及计算机设备 |
CN111598137A (zh) * | 2020-04-24 | 2020-08-28 | 北京金山云网络技术有限公司 | 用于提供推理服务的方法、装置及电子设备 |
CN112100412A (zh) * | 2020-09-01 | 2020-12-18 | 深圳市欢太科技有限公司 | 图片检索方法、装置、计算机设备和存储介质 |
CN112100412B (zh) * | 2020-09-01 | 2024-04-12 | 深圳市欢太科技有限公司 | 图片检索方法、装置、计算机设备和存储介质 |
CN115168637A (zh) * | 2022-06-17 | 2022-10-11 | 杭州晶彩数字科技有限公司 | 一种图片添加标签方法、系统及存储介质 |
CN115168637B (zh) * | 2022-06-17 | 2023-03-17 | 杭州晶彩数字科技有限公司 | 一种图片添加标签方法、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109857893A (zh) | 图片检索方法、装置、计算机设备及存储介质 | |
CN108205655B (zh) | 一种关键点预测方法、装置、电子设备及存储介质 | |
EP3937124A1 (en) | Image processing method, device and apparatus, and storage medium | |
CN109189991A (zh) | 重复视频识别方法、装置、终端及计算机可读存储介质 | |
CN109783582A (zh) | 一种知识库对齐方法、装置、计算机设备及存储介质 | |
CN109840530A (zh) | 训练多标签分类模型的方法和装置 | |
CN109840531A (zh) | 训练多标签分类模型的方法和装置 | |
CN115953665B (zh) | 一种目标检测方法、装置、设备及存储介质 | |
CN110838125A (zh) | 医学图像的目标检测方法、装置、设备、存储介质 | |
CN110163061B (zh) | 用于提取视频指纹的方法、装置、设备和计算机可读介质 | |
CN114969417B (zh) | 图像重排序方法、相关设备及计算机可读存储介质 | |
US9690969B2 (en) | Information processing apparatus, non-transitory computer readable medium, and information processing method | |
CN109857864A (zh) | 文本情感分类方法、装置、计算机设备及存储介质 | |
CN110532413A (zh) | 基于图片匹配的信息检索方法、装置、计算机设备 | |
CN116580257A (zh) | 特征融合模型训练及样本检索方法、装置和计算机设备 | |
CN115410717B (zh) | 模型训练方法、数据检索方法、影像数据检索方法和装置 | |
CN107315984B (zh) | 一种行人检索的方法及装置 | |
CN107944931A (zh) | 种子用户拓展方法、电子设备及计算机可读存储介质 | |
CN114022748B (zh) | 目标识别方法、装置、设备及存储介质 | |
CN110427870B (zh) | 眼部图片识别方法、目标识别模型训练方法及装置 | |
CN116468947A (zh) | 刀具图像识别方法、装置、计算机设备及存储介质 | |
CN113761262B (zh) | 图像的检索类别确定方法、系统以及图像检索方法 | |
CN113128278B (zh) | 一种图像识别方法及装置 | |
CN111191065B (zh) | 一种同源图像确定方法及装置 | |
Hu et al. | Informative retrieval framework for histopathology whole slides images based on deep hashing network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |