CN102521233B - 自适应图像检索数据库 - Google Patents

自适应图像检索数据库 Download PDF

Info

Publication number
CN102521233B
CN102521233B CN201110352692.2A CN201110352692A CN102521233B CN 102521233 B CN102521233 B CN 102521233B CN 201110352692 A CN201110352692 A CN 201110352692A CN 102521233 B CN102521233 B CN 102521233B
Authority
CN
China
Prior art keywords
image
feature
code book
inquired
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110352692.2A
Other languages
English (en)
Other versions
CN102521233A (zh
Inventor
杨林军
田奇
倪冰冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN102521233A publication Critical patent/CN102521233A/zh
Application granted granted Critical
Publication of CN102521233B publication Critical patent/CN102521233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及自适应图像检索数据库。自适应图像检索图像允许检索更有可能反映用户偏好和/或兴趣的当前趋势的图像,从而可向图像搜索提供相关结果。自适应图像检索包括从一个或多个客户机接收图像查询日志数据,并基于接收到的查询日志数据更新特征码本。图像查询日志数据包括在预定时间段内由一个或多个客户机查询的图像。

Description

自适应图像检索数据库
技术领域
本发明涉及检索,尤其涉及图像检索。
背景技术
随着因特网技术的发展,诸如等搜索引擎当前向因特网用户提供基于文本的图像搜索服务。这些图像搜索服务允许用户输入描述用户想要寻找的图像的关键字,并基于所输入的关键字检索一个或多个数据库图像。然而,为了检索所需的图像,输入的关键字需要准确地和/或充分地描述图像。此外,这种类型的图像搜索要求数据库图像具有一个或多个文本注释以便允许对该特定数据库图像进行比较和检索。考虑到因特网上存在数百万个图像,这不可避免地对搜索引擎施加了巨大的工作负担。而且,必须用文本注释准确且完整地标记图像以便使用文本搜索查询来发现图像。
考虑到基于文本的图像搜索的缺点,一些搜索引擎现在提供基于内容的图像检索(CBIR)服务。用户向搜索引擎提交查询图像,搜索引擎随后分析查询图像的实际内容(例如,颜色、形状和纹理)。基于分析的结果,搜索引擎检索与查询图像类似或相关的图像。然而,这种类型的基于内容的图像检索仍处于不成熟的阶段。正积极地进行研究以确定有效且准确的图像搜索和检索策略和/或算法。此外,当前技术水平的基于内容的图像检索方法是以数据为中心而不是以用户为中心的。例如,现有的图像检索系统不考虑用户的偏好。
发明内容
提供本概述以便介绍将在以下详细描述中进一步描述的自适应图像检索系统的一些简化概念。本概述并不旨在标识所要求保护的主题的必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
本申请描述了自适应图像检索的示例实施例。在一个实施例中,自适应图像检索系统从一个或多个客户机接收图像查询日志数据。图像查询日志数据包括在预定时间段内由一个或多个客户机查询的或提交供查询的图像。系统至少基于此接收到的查询日志数据来更新特征码本。
附图说明
参考附图阐述详细描述。在附图中,附图标记中最左边的数字标识该附图标记首次出现的附图。在不同附图中使用同一附图标记指示相似或相同的项。
图1示出了包括示例自适应图像检索系统的示例性环境。
图2更详细地示出了图1的示例自适应图像检索系统。
图3示出了基于图像查询日志数据来更新图像搜索/检索算法的示例性方法。
图4示出了响应于由客户机所提交的图像查询来检索一个或多个数据库图像的第一示例性方法。
图5示出了响应于由客户机所提交的图像查询来检索一个或多个数据库图像的第二示例性方法。
图6示出了响应于由客户机所提交的图像查询来检索一个或多个数据库图像的第三示例性方法。
具体实施方式
概览
如上文所指出的,当前技术的CBIR(基于内容的图像检索)系统不考虑用户的偏爱,并返回不能反映用户的偏好和/或兴趣的当前趋势的图像。这些系统检索图像时不考虑某些图像比较频繁地被用户查询,而其他图像可能很少被访问。此外,用户偏好和兴趣会随着时间而变化。过去用户感兴趣的图像可能现在用户没有兴趣。此外,新颖的并且新的图像查询不能被并入图像搜索/检索算法的构建中。典型示例是关于汽车的图像查询。例如,大多数用户可能对新车型感兴趣。如果用户提交包括汽车的查询图像,则搜索引擎需要察觉到用户可能希望获得新车型的图像,而不是旧车型。简言之,现有技术的图像搜索不能满足并反映用户偏好和/或兴趣的这种趋势。这常常导致返回尽管类似于查询图像但是不是用户所希望的那些图像。
本发明描述了将图像查询日志数据并入到搜索策略和/或算法中并便于反映用户的当前偏好和兴趣的图像的检索的自适应图像检索。
一般而言,自适应图像检索系统从一个或多个客户机接收图像查询日志数据。此图像查询日志数据可以包括以前由一个或多个客户机所提交的多个查询图像。基于日志数据,系统更新或重构其搜索策略和/或算法,以便于检索更加可能与客户机的当前兴趣更为相关的图像。例如,如果系统使用特征码本来标识和检索图像,则可以基于接收到的图像查询日志数据来重构此特征码本。然后,使得到的重构的码本的特征偏向代表由用户最近查询的图像的特征。另外地或另选地,可以基于图像查询日志数据,更新图像非相似度度量,以便使重构的码本的特征偏离与由用户最近查询的图像的特征不同的特征。换句话说,自适应图像检索系统可以被配置成增加将返回具有类似于由用户最近查询的图像的特征的图像的似然率和/或降低将返回具有与由用户最近查询的图像不同的特征的图像作为搜索结果的似然率。
所描述的系统允许图像检索反映用户偏好和/或兴趣的趋势,因此,降低当将不相关的图像(尽管类似于查询图像)返回给用户时用户遇到的挫折感。
下面将描述多个不同的实现和实施例。在下面的部分,描述了适于实施各种实现的示例性环境。在此讨论之后,描述了自适应图像检索系统的系统、设备和过程的说明性实现。
示例性体系结构
图1示出了可被用来实现自适应图像检索系统的示例性环境100。环境100包括一个或多个用户102-1,102-2,...102-M(统称为102)、网络104和自适应图像检索系统106。用户102使用一个或多个设备108-1,108-2,...108-N(统称为108)通过网络104与自适应图像检索系统106进行通信。
设备108可以被实现为各种常规计算设备,包括,例如,服务器、台式PC、笔记本或便携式计算机、工作站、大型计算机、移动计算设备、手持式设备、移动电话、因特网设备、网络路由器等等或其组合。
网络104可以是无线或有线网络,或其组合。网络104可以是彼此互连并用作单个大型网络的各单独网络的集合(例如,因特网或内联网)。这样的单独网络的示例包括,但不仅限于,局域网(LAN)、广域网(WAN)、以及城域网(MAN)。此外,各个网络也可以是无线或有线网络,或其组合。
在一个实施例中,设备108包括耦合到存储器112的处理器110。存储器112包括浏览器114及其他程序数据116。存储器112可以耦合到诸如网络服务器、路由器和/或其他设备108之类的其他设备,或与它们相关联,和/或可以它们被访问。
在一个实施例中,用户102使用设备108的浏览器114将图像查询提交到自适应图像检索系统106。在为图像查询检索一个或多个相关图像之后,自适应图像检索系统106将相关图像返回给用户102。
图2更详细地示出了自适应图像检索系统106。在一个实施例中,系统106可以包括,但不限于,处理器202、网络接口204、系统存储器206,以及输入/输出接口208。
存储器206包括诸如随机存取存储器(RAM)之类的易失性存储器形式的计算机可读介质和/或诸如只读存储器(ROM)或闪存RAM之类的非易失性存储器形式的计算机可读介质。存储器206包括程序模块210和程序数据212。存储器206是计算机可读存储介质的一个示例。程序数据212可以包括图像查询日志数据214、图像数据库216,及其他程序数据218。虽然此处将图像数据库216描述为被包括在系统106的存储器206中,但是,图像数据库216也可以与系统106分开并可被系统106访问。可以从一个或多个客户机直接收集图像查询日志数据214。另选地或另外地,可以从一个或多个其他系统106或搜索引擎(未示出)收集图像查询日志数据214。图像查询日志数据214可以包括在预定时间段内(例如,可以是一天、一星期或一个月)收集的多个图像。在一个实施例中,这多个图像可以包括已经由一个或多个客户机102查询或提交供查询的图像。在另一实施例中,这多个图像还可以包括响应于相应的图像查询已经返回给一个或多个客户机102的数据库图像。另选地或另外地,这多个图像可以包括已经实际上被一个或多个客户机102选定的那些已返回的数据库图像。在多个图像包括所选数据库图像的情况下,图像查询日志数据214还可以包括所选数据库图像的相应的相似度分数。所选数据库图像的相似度分数表示所选数据库图像相对于对应的查询图像的相对相似性,该相对相似性基于,例如,所选数据库图像的特征和对应的查询图像的特征之间的相似度。例如,第一图像相对于第二图像的相对相似性可以基于对于第一和第二图像共同的特征的数量相对于两个图像的特征的平均数的比率。图像查询日志数据214还可以包括在预定时间段内收集的多个图像的各自的查询频率。另选地或另外地,图像查询日志数据214还可以包括在预定时间段内收集的多个图像的各自的查询时间。在一个实施例中,图像查询日志数据214还可以包括已经提交多个图像的一个或多个客户机的信息。客户机的信息可以包括,但不限于,客户机的标识信息、以及客户机提交图像查询所使用的计算设备的信息。在收集有关客户机的个人信息的情况下,可以给予客户机选择停止将这样的信息作为个人可识别的信息进行共享的机会。此外,代替将实际图像存储在图像查询日志数据214中,可以将存储在图像数据库216中的实际图像的指针、索引或散列值存储在图像查询日志数据214中。
程序模块210可以包括查询接收模块220。查询接收模块220从客户机接收图像查询。图像查询包括客户机用来查找他/她希望的图像的查询图像。在接收到图像查询之后,查询接收模块220可以将接收到的查询图像记录到图像查询日志数据214中,连同诸如对应的查询时间之类的额外的信息。可另选地,查询接收模块220可以等待直到到达预定的记录时间,并将所有查询图像连同相应的额外的信息记录到在该预定记录时间内获得的图像查询日志数据214中。查询接收模块220还可以将查询图像传输到特征提取模块222,该特征提取模块222提取代表查询图像的特征。特征提取模块222可以采用诸如奇异矢量分解(SVD)、视觉关键词袋等等之类的一种或多种特征提取技术。特征的示例包括,但不限于,尺度不变特征变换(SIFT),以及强度直方图。
取决于系统200在哪一种模式下执行,所提取的特征可以被馈送到搜索分层模块224、码本重构模块226、相似度测量模块228,或者其任何组合中的任何一个。
在一个实施例中,响应于从特征提取模块222接收到所提取的特征,搜索分层模块224将所提取的特征与现有特征码本进行比较。特征码本,有时也叫做“视觉关键词”,可以例如通过将图像特征聚集成多个簇来生成。码本的特征或视觉关键词可以被定义为,例如多个簇中的一个簇的中心。在此类型的码本构造之下,可以通过将每一所提取的特征分配到其最近的簇中心,利用视觉关键词/特征的出现次数的直方图来表示图像。在将每一所提取的特征分配到码本的其中一个视觉关键词之后,可以根据图像相似度度量,将这些分配的视觉关键词与每一数据库图像的视觉关键词进行比较。图像相似度度量是两个图像之间的相似度的度量,并可以返回表示数据库图像相对于查询图像的相对相似性的相似度/非相似度分数。在一个实施例中,相似度测量模块228基于所提取的特征或分配的视觉关键词,计算数据库图像相对于查询图像的相似度/非相似度分数。例如,相似度测量模块228基于查询图像和数据库图像的共同的特征或视觉关键词的数量相对于它们的特征或视觉关键词的平均数的比率,来计算相似度/非相似度分数。
在另一实施例中,代替与每一数据库图像的视觉关键词进行比较,相似度测量模块228可以将分配的视觉关键词与每一图像类(例如,汽车类)的代表性的视觉关键词进行比较,每一图像类都包括共享预定数量或百分比的共同的视觉关键词的多个数据库图像。此预定数量或百分比的共同的视觉关键词可以由系统106的管理员或操作员来进行设置。
在又一个实施例中,相似度测量模块228可以使用具有多个级别的搜索分层结构。搜索分层结构的每一级别都可以包括n个节点,其中,n可以是大于零的任何整数。搜索分层结构的每一个节点都具有代表性的视觉特征集合。
在一个实施例中,节点的代表性的视觉特征集合可以是属于该节点以及其子节点的所有图像的视觉关键词的簇中心。可以将所提取的特征或分配的视觉关键词与一个级别的每一个节点的代表性的视觉特征集合进行比较。在找到具有该级别的相对于所提取的特征或分配的视觉关键词的最近的视觉特征集合的节点之后,比较下一级别的对应的一个或多个子节点,以此类推,直到到达叶节点。然后,可以将与此叶节点相关联的一个或多个数据库图像作为图像查询的结果返回给客户机。此外,相似度测量模块228还可以获得这些数据库图像相对于查询图像的一个或多个相似度/非相似度分数。返回的图像查询的结果可以具有根据它们的相似度/非相似度分数排列的一个或多个数据库图像,例如,按照它们的相似度分数/非相似度分数的降序排列。虽然被描述为单独的模块,但是,搜索分层模块224和相似度测量模块228可以被视为执行其所有上文所描述的操作的单个模块。
当更新或重构系统106的图像搜索/检索策略或算法时,可以更新或重构图像相似度度量、特征码本或两者。在一个实施例中,可以定期地,例如,每天、每一星期、每个月或每年,更新或重构系统106的图像搜索或检索策略或算法。在另一实施例中,可以响应于图像查询日志数据中的图像的数量达到预定数量阈值来更新或重构系统106的图像搜索/检索策略或算法。预定数量阈值可以被设置为图像数据库216中的图像的总数的某一百分比(例如,1%)或一绝对值(例如,1000个图像)。在又一个实施例中,可以响应于图像查询日志数据214中的所有选定数据库图像的相似度分数的平均值(即,平均相似度分数)小于预定相似度分数阈值,来更新或重构系统106的图像搜索或检索策略或算法。可另选地,可以响应于图像查询日志数据214中的所有选定数据库图像的非相似度分数的平均值大于预定非相似度分数阈值,来更新或重构系统106的图像搜索或检索策略或算法。例如,如果查询图像和数据库图像之间的完美匹配具有相似度分数1或非相似度分数0,则可以响应于例如平均相似度分数小于0.7或平均非相似度分数大于0.3,来更新或重构码本。可另选地,可以将上面的三个策略组合起来,每当达到上面的预定时间或阈值中的一个,或当达到两者时,就更新或重构图像搜索/检索策略或算法。应该注意,上面的时间、百分比和分数值只用于说明性用途。可以根据,例如,准确性和/或计算要求,由系统106的管理员或操作员使用和设置任何值。
按如下方式来描述两个示例性更新/重构算法。所描述的更新/重构算法相对于具有低于第一查询频率的第二查询频率的第二查询的图像的特征,增大了检索到具有第一查询频率的第一查询的图像的特征的似然率。然而,下列更新/重构算法只用于说明性用途。当前说明书涵盖了将图像查询日志数据包括到图像搜索/检索策略或算法的更新/重构的任何算法。
示例图像相似度度量
此算法的一个目的是将来自图像查询日志数据的用户的行为信息包括到视觉关键词加权框架中。直观地,更频繁访问的视觉关键词(来自图像查询)将具有更高的权重,增大检索到具有更频繁访问的视觉关键词的那些数据库图像的似然率。更具体而言,根据基于查询-日志加权和常规tf-idf加权方案,形成均匀的概率性框架。从用户的偏好和数据分布的观点来看,查询-日志相关的组件和词频组件可以被视为互补的先验信息。视觉关键词的词频被定义为视觉关键词出现在图像中的次数。通过边缘化相对于数据库图像和图像类的每一词频,获取每一个视觉关键词的查询-日志相关的先验概率,并将其充当用于对每一视觉关键词重新加权的重要权重。此新的视觉关键词重要性加权方案被定义为qf-tf-idf(其中,qf表示查询频率),并可以充当用户同心CBIR系统的重要构件。
为了描述,此处首先定义某些记号。令图像集合表示为D,第i个图像表示成Ii。图像集合的大小,即,图像的数量,被假设为N=|D|。假设图像数据库中的图像类(或概念)的数量为K。通过聚类(例如,K均值聚类),生成视觉关键词(V)的集合或码本,被表示为V1,V2,...VM,其中,M是码本的大小。
在常规的tf-idf框架中,第j个图像中的词频被表示为给定视觉关键词Vi出现在该图像中的次数。此频率通常被归一化,以防止从每一图像中提取的特征或视觉关键词(例如,SIFT特征)的数量不平衡。如此,按如下方式来计算归一化的词频:
tf i j = n i j Σ i n i j - - - ( 1 )
其中,分母是所有视觉关键词在第j个图像中出现次数的总和。
为反映每一词或视觉关键词的一般重要性,通过对所有数据库图像的总数N和包括视觉关键词的图像的数量之间的商求对数,获得视觉关键词的逆文档频率,其被定义为:
idf i = log N | { I : V i ∈ I } | - - - ( 2 )
其中,|{I:Vi∈I}|是视觉关键词Vi出现在其中的图像的数量。因此,逆文档频率趋向于过滤掉由所有图像共享的那些信息含量不多的视觉关键词。
为度量两个图像之间的非相似度,可以使用通过逆文档频率加权的LP范数,并将其表示为:
d ( I 1 , l 1 ) = Σ i | tf i 1 - tf i 2 | L P × idf i - - - ( 3 )
在实践中,p通常被设置为1或2。作为示例,此处p被设置为1。
从概率观点来看,逆文档频率权重ωD可以被视为视觉关键词的先验分布,取决于数据库图像,并可以重新写为:
ωD~p(V|D)
=∏ip(Vi|D)(4)
p(Vi|D)~idfi(5)
此处假设每一视觉关键词的分布相对于数据库图像都是独立的。
此先验信息只基于内在的图像数据分布。然而,假定用户的查询日志数据214可用,则每一视觉关键词的先验分布将不仅取决于图像数据库216中的数据库图像的集合,而且还取决于查询日志数据214。这两个资源构成了有关视觉关键词的分布的先验信息的两个重要的并且互补的方面,即,分别是数据域和用户域。因此,可以就数据库图像的集合和查询日志数据214而言来定义视觉关键词的先验分布,即,p(Vi|DiQ),其中,Q表示查询日志数据214的查询日志集。假设查询日志数据214和图像集合信息是独立的,先验分布还可以进一步被分成两个项:
p(V|D,Q)~p(V|D)×p(V|Q)
=∏ip(Vi|D)×∏ip(Vi|Q)(6)
其中,此处假设了每一视觉关键词Vi的独立性。
p(Vi|Q)表示给定用户的查询日志信息的情况下视觉关键词Vi的先验概率。此先验概率度量就用户的偏爱和偏好信息而言的视觉关键词的重要性,并可以充当新用户同心重要性权重,表示为ωQ,因为:
ωQ~p(V|Q)
=∏ip(Vi|Q)(7)
其中,如前假设每一视觉关键词Vi的独立性。
项p(Vi|Q)可以进一步地分解成:
p ( V i | Q ) = Σ j = 1 N Σ k = 1 K p ( V i | Q , I j , k ) p ( k | I j , Q ) p ( I j | Q )
= Σ j = 1 N Σ k = 1 K p ( V i | k ) p ( k | I j ) p ( I j | Q ) - - - ( 8 )
给定用户的查询日志信息,p(Ij|Q)度量数据库图像的先验概率,并被定义为:
p ( I j | Q ) = qf j Σ i qf j - - - ( 9 )
这是度量图像Ij隔多久被用作查询图像的归一化频率值。较高的p(Ij|Q)值表示,图像Ij对用户来说更有兴趣,因此,图像Ij的对应的视觉关键词应该得到更大的权重。应该注意,
Σ j N p ( I j | Q ) = 1 - - - ( 10 )
p(k|Ij)表示图像Ij属于第k个图像类(或概念)的概率。如果假设每一数据库图像都具有单一标记,则p(k|Ij)可以进一步地被定义为:
这里,Sk表示属于第k个图像类的图像的子集。类似地,和为1约束适用:
Σ k = 1 K p ( k | I j ) = 1 - - - ( 12 )
p(Vi|k)表示视觉关键词Vi出现在属于第k个图像类的图像中的似然率,并被定义为:
p ( V i | k ) = c k i Σ i = 1 M c k i - - - ( 13 )
C k i = | { I : V i ∈ I , I ∈ S k } | - - - ( 14 )
如上所述,p(Vi|k)度量视觉关键词Vi对于类k的重要性,并且被来自第k个图像类的更多的图像共享的那些视觉关键词将获得较高的p(Vi|k)值。还应该注意:
Σ i = 1 M p ( V i | k ) = 1 - - - ( 15 )
值得注意的是,上面的三个项p(IJ|Q)、p(k|Ij)和p(Vi|k)以协作的方式将每一图像的重要性(来自查询频率)传播到属于某些图像类的指定的视觉关键词。以此方式,不仅感兴趣的图像而且同一个图像类内的其他图像都对在同一个图像类内频繁地出现的视觉关键词的权重有贡献。换言之,将感兴趣的图像的重要性传播到属于同一个图像类的其他图像。此通用性属性对于系统106处理未看见的图像特别重要。相反,在同一个图像类内随机地出现或者只从不感兴趣的图像得到小的重要性的那些视觉关键词最后将得到较小的权重。这些特征(视觉关键词)可以被视为伪特征。
这里使用了p(Vi|Q)来定义所提出的基于查询频率的权重,即,qfi=p(Vi|Q)。结合上文所定义的逆文档频率权重,两个图像之间的新的图像非相似度度量可以被定义为:
d ( I 1 , I 1 ) = Σ i | tf i 1 - tf i 2 | L P × idf i × qf i - - - ( 16 )
图3示出了qf-tf-idf视觉关键词加权方案的图示。图3的上面一行包括频繁地查询的图像302和较不频繁地查询的图像304。图3的中间一行包括,例如,对于视觉关键词1-4的视觉词汇表306、基于查询频率的权重308和基于逆文档频率的权重310。最后一行示出了在组合了两种类型的权重之后图像非相似度度量的组合权重312。
上面的qf-tf-idf加权方案提供了若干个优点。例如,此方案是以用户为中心的,直接以改进用户的满意度为目标。此外,由于其相对简洁性,所提出的qf-tf-idf加权方案是高效的,并可以无缝地采用用户的偏爱信息的统计信息作为CBIR系统的构件。此外,由于是在概率性框架中定义的,所提出的qf-tf-idf加权方案是稳健而有效的。
特征码本的示例更新或重构
将图像查询日志数据214包括到图像搜索/检索算法中的另一种方法是更新或重构系统106中所使用的现有的特征码本。例如,可以通过聚类来生成特征/视觉关键词的码本。在此情况下,可以通过在聚类成本函数中使用图像查询日志数据214的信息(例如,查询频率),重新加权图像或图像的所提取的特征来更新或重构码本,以便新形成的簇(或视觉关键词)将偏向那些频繁地查询的图像或图像特征。在聚类之后,可以检查新簇,可以删除具有非常低的查询频率累积(即,簇中的图像或图像特征的所有查询频率的总和)的任何簇。可另选地,在更新期间,不是码本的每一个簇(或视觉关键词)都需要涉及或更改。为了降低计算工作负荷,可以只更新图像查询日志数据214中的查询图像的至少一个所提取的特征所属的簇,而让其他簇保持不变。然后,可以在更新中,或响应于被更新预定次数,归一化新码本或码本内的权重。如果图像或图像特征的数量巨大,这样的推迟的权重归一化可能是首选的。可以通过对码本的特征的权重重定一个缩放因子的比例,来进行码本的归一化。可以将此缩放因子确定为使码本的特征的所有权重的总和将等于某一值,例如,1。
替换实施例
虽然上面的算法将多个图像的的查询频率并入图像查询日志数据214中以更新图像非相似度度量和/或特征码本,但是,本发明不仅限于此。在一个实施例中,可以将多个图像的相应的查询时间包括到搜索/检索算法中。在此算法之下,系统106将相对于具有早于第一查询时间的第二查询时间的第二查询的图像的特征,增大检索到具有第一查询时间的第一查询的图像的特征的似然率。
另选地或另外地,所描述的图像检索系统可以允许不同的用户查询的图像相对于更新或重构码本带有不同的权重或重要性级别。例如,网站或搜索引擎可能需要会员资格才能使用其图像搜索服务。会员资格可以包括,例如,游客会员资格、普通会员资格,以及金牌会员资格。网站或搜索引擎还可以要求不同类型的会员每月支付会费,例如,对游客会员是免费的,普通会员十美元,金牌会员五十美元。由于从不同类型的会员资格产生的不同级别的收入,网站或搜索引擎可以,例如比游客会员优先地服务金牌会员。通过允许使由金牌会员查询的图像具有更高的权重或重要性级别,例如,图像检索系统106可以增大检索到金牌会员所希望的数据库图像的似然率。在此情况下,图像查询日志数据214还可以包括网站或搜索引擎的用户的信息(例如,所使用的设备的cookie)。
在另一实施例中,自适应图像检索系统106还可以进一步包括采用所描述的算法的基于文本的图像搜索。例如,用户可以提供查询图像和描述该查询图像的关键字。然后,自适应图像检索系统106可以检索与查询图像和关键字相关的一个或多个数据库图像。自适应图像检索系统106还可以在比没有关键字标记的另一个数据库图像更高的排序位置,将被发现与查询图像相关并带有关键字等等的标记的数据库图像返回给用户。
示例性方法
将参考图1-3来描述用于更新特征码本的示例性方法。可以在计算机可执行的指令的一般上下文中描述这些示例性方法。一般而言,计算机可执行指令可以包括执行特定功能或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、过程、模块、功能等等。这些方法还能在其中功能由通过通信网络链接的远程处理设备完成的分布式计算环境中实现。在分布式计算环境中,计算机可执行指令可以位于包括存储器存储设备的本地和远程计算机存储介质中。
这些示例性方法被示为逻辑流程图中一组框的集合,这表示可用硬件、软件、固件或其组合实现的一系列操作。描述方法的次序并不旨在被解释为限制,并且任意数量的所描述的框可以按任何次序组合以实现这些方法或替换方法。另外,在不偏离此处所描述的主题的精神和范围的情况下,可以从这些方法中删除各单独的框。在软件的上下文中,各个框表示在由一个或多个处理器执行时执行既定操作的计算机指令。
图4示出了更新特征码本的第一示例性方法400。
在框402,从一个或多个客户机接收图像查询日志数据。图像查询日志数据至少包括在预定时间段内由一个或多个客户机查询的多个图像。
在框404,基于接收到的查询日志数据,更新特征码本。
图5示出了更新特征码本的第二示例性方法500。
在框502,从客户机接收包括查询图像的图像查询。
在框504,从查询图像中提取多个特征。
在框506,将多个所提取的特征与特征码本进行比较,以从码本获取一个或多个特征。
在框508,至少基于一个或多个获取的特征,将一个或多个数据库图像提供给客户机。
在框510,至少基于从查询图像提取的多个特征,更新特征码本。
图6示出了更新特征码本的第三示例性方法600。
在框602,从一个或多个客户机接收图像查询日志数据。图像查询日志数据至少包括在预定时间段内由一个或多个客户机查询的多个图像。
在框604,基于接收到的查询日志数据,更新特征码本。
在框606,从客户机接收包括查询图像的图像查询。
在框608,使用前面的部分所描述的一个或多个特征提取方法,从查询图像中提取多个特征。
在框610,将多个所提取的特征与特征码本进行比较,以从码本获取一个或多个特征。
在框612,至少基于一个或多个获取的特征,将一个或多个数据库图像提供给客户机。
此处所描述的方法中的任何一种方法的任何一个动作都可以至少部分地通过处理器或其他电子器件并基于存储在一个或多个计算机可读介质上的指令来实现。计算机可读介质可以是在更新特征的码本期间可以访问的任何可用介质。作为示例而非限制,计算机存储介质可以包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据之类的信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机可读介质包括,但不限于,RAM、ROM、EEPROM、闪存或该它存储器技术、CD-ROM、数字多功能盘(DVD)或该它光盘存储、磁带盒、磁带、磁盘存储或其它磁性存储设备、或能用于存储所希望的信息的任何其它介质。上面各项中的任何项的组合也应该包括在计算机可读介质的范围内。
结论
尽管已经用对结构特征和/或方法动作专用的语言描述了本发明,但可以理解,本发明不必受所描述的这些具体特征或动作的限制。相反,这些具体特征和动作是作为实现本发明的示例性形式而公开的。

Claims (10)

1.一种计算机实现的检索方法,包括:
从一个或多个客户机接收图像查询日志数据,所述图像查询日志数据包括在预定时间段内已由一个或多个客户机提交供查询的多个图像和对应于所查询的多个图像的多个查询频率;以及
至少基于所接收到的图像查询日志数据来更新特征的码本,其中更新所述特征的码本包括相对于具有低于第一查询频率的第二查询频率的所查询的第二图像的特征,增加检索到具有所述第一查询频率的所查询的第一图像的特征的似然率。
2.如权利要求1所述的计算机实现的方法,其特征在于,所述方法还包括:
从请求客户机接收包括示例图像的图像查询;以及
从所述示例图像提取多个特征;
将所提取的多个特征与所述更新后的特征的码本中的特征进行比较;以及
至少基于所述比较从数据库检索一个或多个数据库图像。
3.如前述权利要求1-2中任一项所述的计算机实现的方法,其特征在于,所述图像查询日志数据还包括对应于所查询的多个图像的多个查询时间,且其中更新所述特征的码本包括相对于具有在第一查询时间之前的第二查询时间的所查询的第二图像的特征,增加检索到具有所述第一查询时间的所查询的第一图像的特征的似然率。
4.如前述权利要求1所述的计算机实现的方法,其特征在于,所述图像查询日志数据还包括对应于所查询的多个图像的多个查询时间,且其中更新所述特征的码本包括相对于具有在第一查询时间之前的第二查询时间的所查询的第二图像的特征,增加检索到具有所述第一查询时间的所查询的第一图像的特征的似然率。
5.一种计算机实现的检索方法,包括:
从客户机接收包括示例图像的图像查询;
从所述示例图像提取多个特征;
将多个所提取的特征与特征的码本进行比较,以从所述特征的码本获取一个或多个特征;
至少基于一个或多个所获取的特征,将一个或多个数据库图像提供给所述客户机;以及
至少基于从所述示例图像提取的多个特征,更新所述特征的码本。
6.如权利要求5所述的计算机实现的方法,其特征在于:
接收所述客户机选择所述一个或多个数据库图像中的数据库图像的指示;
进一步基于所选的数据库图像的特征来更新所述特征的码本。
7.如前述权利要求2,5或6中任一项所述的计算机实现的方法,其特征在于,所述方法还包括:
对所述一个或多个数据库图像中的每一个提供分数,所述分数表示所述一个或多个数据库图像中的每一个基于所提取的所述示例图像的多个特征与所述示例图像的相对相似性。
8.如前述权利要求1,2,5或6中任一项所述的计算机实现的方法,其特征在于,更新所述特征的码本包括:
从所查询的多个图像中提取多个特征;以及
至少基于从所查询的多个图像提取的所述多个特征,更新所述码本的各特征的权重。
9.如前述权利要求1,2,5或6中任一项所述的计算机实现的方法,其特征在于,所述方法还包括:
响应于更新所述码本预定的次数,归一化所述更新后的特征的码本,所述归一化包括按照缩放因子重定所述码本的各特征的权重。
10.如前述权利要求1,2中任一项所述的计算机实现的方法,其特征在于,所述查询日志数据还包括在预定的时间段内由所述一个或多个客户机选择的多个数据库图像。
CN201110352692.2A 2010-11-02 2011-11-01 自适应图像检索数据库 Active CN102521233B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/938,310 US9317533B2 (en) 2010-11-02 2010-11-02 Adaptive image retrieval database
US12/938,310 2010-11-02

Publications (2)

Publication Number Publication Date
CN102521233A CN102521233A (zh) 2012-06-27
CN102521233B true CN102521233B (zh) 2015-11-25

Family

ID=45997810

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110352692.2A Active CN102521233B (zh) 2010-11-02 2011-11-01 自适应图像检索数据库

Country Status (2)

Country Link
US (1) US9317533B2 (zh)
CN (1) CN102521233B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8438163B1 (en) * 2010-12-07 2013-05-07 Google Inc. Automatic learning of logos for visual recognition
US8533204B2 (en) * 2011-09-02 2013-09-10 Xerox Corporation Text-based searching of image data
CN104156362B (zh) * 2013-05-14 2017-04-19 视辰信息科技(上海)有限公司 一种大规模图像特征点匹配方法
WO2015017868A1 (en) * 2013-08-02 2015-02-05 Emotient Filter and shutter based on image emotion content
US8819006B1 (en) 2013-12-31 2014-08-26 Google Inc. Rich content for query answers
US10459964B2 (en) 2014-07-04 2019-10-29 Microsoft Technology Licensing, Llc Personalized trending image search suggestion
USD904824S1 (en) 2015-03-16 2020-12-15 Selfeco LLC Food service article with utensil combination feature
CN104794189B (zh) * 2015-04-16 2018-05-08 惠州Tcl移动通信有限公司 一种图像筛选方法及筛选系统
US10664515B2 (en) 2015-05-29 2020-05-26 Microsoft Technology Licensing, Llc Task-focused search by image
JP2017041022A (ja) * 2015-08-18 2017-02-23 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US9864930B2 (en) * 2016-02-05 2018-01-09 International Business Machines Corporation Clustering technique for optimized search over high-dimensional space
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US11055345B2 (en) 2017-12-28 2021-07-06 International Business Machines Corporation Constructing, evaluating, and improving a search string for retrieving images indicating item use
US11061943B2 (en) 2017-12-28 2021-07-13 International Business Machines Corporation Constructing, evaluating, and improving a search string for retrieving images indicating item use
US11645329B2 (en) 2017-12-28 2023-05-09 International Business Machines Corporation Constructing, evaluating, and improving a search string for retrieving images indicating item use
US10664517B2 (en) 2017-12-28 2020-05-26 International Business Machines Corporation Constructing, evaluating, and improving a search string for retrieving images indicating item use
US10904346B2 (en) 2018-12-03 2021-01-26 International Business Machines Corporation Weighted digital image object tagging
CN110096609A (zh) * 2019-03-15 2019-08-06 平安城市建设科技(深圳)有限公司 房源搜索方法、装置、设备及计算机可读存储介质
CN112084366B (zh) * 2020-09-11 2024-04-09 北京百度网讯科技有限公司 用于检索图像的方法、装置、设备以及存储介质
US11836141B2 (en) * 2021-10-04 2023-12-05 Red Hat, Inc. Ranking database queries

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101198040A (zh) * 2006-12-04 2008-06-11 联詠科技股份有限公司 图像压缩的编码方法
US7801893B2 (en) * 2005-09-30 2010-09-21 Iac Search & Media, Inc. Similarity detection and clustering of images

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5574573A (en) 1993-10-29 1996-11-12 Eastman Kodak Company Compression method for a standardized image library
CA2199588A1 (en) 1997-03-10 1998-09-10 Efrem Hoffman Hierarchical data matrix pattern recognition and identification system
KR20010041607A (ko) 1998-03-04 2001-05-25 더 트러스티스 오브 콜롬비아 유니버시티 인 더 시티 오브 뉴욕 화상 및 비디오 검색을 위한 의미 비주얼 템플릿 생성방법 및 시스템
US6285995B1 (en) 1998-06-22 2001-09-04 U.S. Philips Corporation Image retrieval system using a query image
US6345274B1 (en) 1998-06-29 2002-02-05 Eastman Kodak Company Method and computer program product for subjective image content similarity-based retrieval
US6408293B1 (en) 1999-06-09 2002-06-18 International Business Machines Corporation Interactive framework for understanding user's perception of multimedia data
US6594383B1 (en) 1999-11-16 2003-07-15 International Business Machines Corporation Method and apparatus for indexing and retrieving images from an images database based on a color query
AU2001283004A1 (en) 2000-07-24 2002-02-05 Vivcom, Inc. System and method for indexing, searching, identifying, and editing portions of electronic multimedia files
US7099860B1 (en) 2000-10-30 2006-08-29 Microsoft Corporation Image retrieval systems and methods with semantic and feature based relevance feedback
KR100516289B1 (ko) 2000-11-02 2005-09-21 주식회사 케이티 퍼지 적분을 이용하여 사용자 의견을 반영한 내용기반영상 검색 장치 및 그 방법
TW501035B (en) 2001-03-20 2002-09-01 Ulead Systems Inc Interactive image searching method based on local object
US6748398B2 (en) 2001-03-30 2004-06-08 Microsoft Corporation Relevance maximizing, iteration minimizing, relevance-feedback, content-based image retrieval (CBIR)
US6847733B2 (en) 2001-05-23 2005-01-25 Eastman Kodak Company Retrieval and browsing of database images based on image emphasis and appeal
US6961736B1 (en) 2002-05-31 2005-11-01 Adobe Systems Incorporated Compact color feature vector representation
CA2397424A1 (en) 2002-08-09 2004-02-09 Mohammed Lamine Kherfi Content-based image retrieval using positive and negative examples
US7240075B1 (en) 2002-09-24 2007-07-03 Exphand, Inc. Interactive generating query related to telestrator data designating at least a portion of the still image frame and data identifying a user is generated from the user designating a selected region on the display screen, transmitting the query to the remote information system
US7386527B2 (en) 2002-12-06 2008-06-10 Kofax, Inc. Effective multi-class support vector machine classification
US7254271B2 (en) 2003-03-05 2007-08-07 Seadragon Software, Inc. Method for encoding and serving geospatial or other vector data as images
EP1599829A1 (en) 2003-03-06 2005-11-30 Animetrics, Inc. Viewpoint-invariant detection and identification of a three-dimensional object from two-dimensional imagery
US7065521B2 (en) 2003-03-07 2006-06-20 Motorola, Inc. Method for fuzzy logic rule based multimedia information retrival with text and perceptual features
CN100485603C (zh) * 2003-04-04 2009-05-06 雅虎公司 用于从搜索查询中产生概念单元的系统和方法
US7990384B2 (en) 2003-09-15 2011-08-02 At&T Intellectual Property Ii, L.P. Audio-visual selection process for the synthesis of photo-realistic talking-head animations
US7496500B2 (en) 2004-03-01 2009-02-24 Microsoft Corporation Systems and methods that determine intent of data and respond to the data based on the intent
WO2006005187A1 (en) 2004-07-09 2006-01-19 Parham Aarabi Interactive three-dimensional scene-searching, image retrieval and object localization
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US7725484B2 (en) 2005-11-18 2010-05-25 University Of Kentucky Research Foundation (Ukrf) Scalable object recognition using hierarchical quantization with a vocabulary tree
US20070259318A1 (en) 2006-05-02 2007-11-08 Harrison Elizabeth V System for interacting with developmentally challenged individuals
US20070288453A1 (en) 2006-06-12 2007-12-13 D&S Consultants, Inc. System and Method for Searching Multimedia using Exemplar Images
KR100785928B1 (ko) 2006-07-04 2007-12-17 삼성전자주식회사 멀티모달 정보를 이용한 사진 검색 방법 및 사진 검색시스템
US20090171929A1 (en) 2007-12-26 2009-07-02 Microsoft Corporation Toward optimized query suggeston: user interfaces and algorithms
US8447120B2 (en) 2008-10-04 2013-05-21 Microsoft Corporation Incremental feature indexing for scalable location recognition
CN101751439A (zh) 2008-12-17 2010-06-23 中国科学院自动化研究所 基于层次聚类的图像检索方法
US8254697B2 (en) * 2009-02-02 2012-08-28 Microsoft Corporation Scalable near duplicate image search with geometric constraints
CN101751447A (zh) 2009-07-22 2010-06-23 中国科学院自动化研究所 基于语义分析的网络图像检索方法
CN101859320B (zh) 2010-05-13 2012-05-30 复旦大学 一种基于多特征签名的海量图像检索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7801893B2 (en) * 2005-09-30 2010-09-21 Iac Search & Media, Inc. Similarity detection and clustering of images
CN101198040A (zh) * 2006-12-04 2008-06-11 联詠科技股份有限公司 图像压缩的编码方法

Also Published As

Publication number Publication date
US9317533B2 (en) 2016-04-19
US20120109943A1 (en) 2012-05-03
CN102521233A (zh) 2012-06-27

Similar Documents

Publication Publication Date Title
CN102521233B (zh) 自适应图像检索数据库
US6260036B1 (en) Scalable parallel algorithm for self-organizing maps with applications to sparse data mining problems
CN102576372B (zh) 基于内容的图像搜索
CN102687138B (zh) 搜索建议聚类和呈现
US20120047123A1 (en) System and method for document analysis, processing and information extraction
CN109918563B (zh) 一种基于公开数据的图书推荐的方法
KR102249466B1 (ko) 인공지능 추천 모델을 사용하여 추천 정보를 제공하는 데이터 카탈로그 제공 방법 및 시스템
KR20090077073A (ko) 퍼스널 음악 추천 매핑
US20160283564A1 (en) Predictive visual search enginge
CN105159971B (zh) 一种云平台数据检索方法
CN114238573B (zh) 基于文本对抗样例的信息推送方法及装置
CN110264277B (zh) 由计算设备执行的数据处理方法及装置、介质和计算设备
US9305051B2 (en) Mining broad hidden query aspects from user search sessions
Lalmas et al. Evaluating XML retrieval effectiveness at INEX
US9552415B2 (en) Category classification processing device and method
Xu et al. Co-clustering analysis of weblogs using bipartite spectral projection approach
De Vries et al. Parallel streaming signature em-tree: A clustering algorithm for web scale applications
Arora et al. A synonym based approach of data mining in search engine optimization
Usman et al. A data mining approach to knowledge discovery from multidimensional cube structures
US8666898B2 (en) Visual information retrieval system for applying self organizing maps/SOM using five distinct modules that merge the best maps
EP3771992A1 (en) Methods and systems for data ingestion in large-scale databases
Xu Web mining techniques for recommendation and personalization
Alamdar et al. Effective browsing of image search results via diversified visual summarization by clustering and refining clusters
Nikolopoulos et al. Combining multi-modal features for social media analysis
Kushwaha et al. Inclusion of semantic and time-variant information using matrix factorization approach for implicit rating of last. fm dataset

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150731

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150731

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

C14 Grant of patent or utility model
GR01 Patent grant