CN102640146B - 数据库搜索方法、系统和控制器 - Google Patents
数据库搜索方法、系统和控制器 Download PDFInfo
- Publication number
- CN102640146B CN102640146B CN201080050275.6A CN201080050275A CN102640146B CN 102640146 B CN102640146 B CN 102640146B CN 201080050275 A CN201080050275 A CN 201080050275A CN 102640146 B CN102640146 B CN 102640146B
- Authority
- CN
- China
- Prior art keywords
- subset
- representative
- search
- refinement
- initial ranging
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
- G06F16/3326—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
- G06F16/3328—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages using graphical result space presentation or visualisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/54—Browsing; Visualisation therefor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Information Transfer Between Computers (AREA)
Abstract
提供了一种用户通过用户接口搜索包含数据项目的数据库的方法、系统和控制器,所述方法包括以下步骤:指定数据库中的一些数据项目或所有数据项目的初始搜索子集(1201);识别搜索子集中的多个数据类别中的每一个类别的代表(1203);将代表显示在用户接口上(1204);选择代表中的一个或多个(1205);指定在搜索子集中的在对应于所选择的代表的数据类别内的数据项目的细化搜索子集(1207);以及重复识别和显示细化搜索子集的代表的步骤。
Description
技术领域
本发明涉及用于搜索数据项目的数据库的计算机化方法、系统和控制器,数据项目特别是但不局限于诸如图像、音乐、电影、游戏或书籍的媒体项目。
背景技术
搜寻媒体项目例如现有的照片的数据库是一项经常在媒体业中以及消费者通常进行的任务。诸如gettyimages.com、images.google.com等的网站通常提供涉及图像内容的基于描述符的编索引的搜索方法。内容描述符通常涉及诸如观念、情感、位置的方面或涉及图像中的人的特点。用户通常使用下拉列表中的复选框指定一个或多个内容描述符的值,且图像搜索引擎然后搜索与用户指定的值匹配的图像的图像数据库索引。匹配的图像然后通常伴随着诸如分辨率或来源的技术信息被显示在滚动窗口中。通常第一页示出最接近的匹配,其可能涉及诸如色彩平衡的额外的本机特性的某个评估,以及多个其他页包含较少的接近的匹配。用户检查许多图像,并可以通过指定另外的内容描述符值或通过选择一个参考图像作为示例来细化搜索。
尽管使用描述符的初始搜索产生了许多可能相关的图像,但选择出更感兴趣的图像的搜索的细化常常是令人沮丧的。
另外,对滚动以及单独地检查大量图像和文本的混合的需要是令人疲倦和乏味的。
因此存在提供改进的数据库搜索技术的需要,改进的数据库搜索技术实现有用的数据项目的更高效和用户友好的识别。
发明内容
本发明的发明人通过在具代表性的数据项目的选择和显示的使用方面取得进展,找到了帮助用户定位感兴趣的数据项目的更加改进的方法。
根据本发明的第一方面,提供了一种用户通过用户接口搜索包含数据项目的数据库的方法,其包括以下步骤:
指定数据库中的一些数据项目或所有数据项目的初始搜索子集;
识别搜索子集中的多个数据类别中的每一个类别的代表;
将这些代表显示在用户接口上;
选择代表中的一个或多个;
指定在搜索子集中的在对应于所选择的代表的数据类别内的数据项目的细化搜索子集;以及
重复识别和显示细化搜索子集的代表的步骤。
在一个实施方式中,指定初始搜索子集的步骤包括从用户接收限制标准并将初始子集定义为满足限制标准的数据项目。限制标准可以是搜索词的值。
在一个实施方式中,数据项目与多维描述符空间中的描述符值相关联,并且搜索子集中的数据类别是描述符空间中的区段。考虑获得适合于所指定的搜索子集的类别,例如通过识别具有对搜索子集的减小的维度的一组适当的描述符的算法从更大维度的描述符空间中的存储的值的描述符表,可以定义所述多维描述符空间。考虑类别的数量来选择减小的维度。
在一个实施方式中,描述符空间的原点在搜索子集的中心附近,以便搜索子集的描述符坐标具有正值和负值;以及
类别中的至少一个是多维描述符空间中的区段,相比于其他维度,所述区段在一个维度中的正方向或负方向上较大。
在一个实施方式中,类别的数量被选择成使得所有的代表可以一起被显示给用户。显示细化搜索集的代表的步骤可以包括显示靠近初始搜索子集的代表的细化搜索子集的代表。
在一个实施方式中,指定、识别、显示和选择的过程适合于重复,直到所有的类别具有不多于一个的成员。
在一个实施方式中,数据项目包括数字媒体。
根据本发明的第二方面,提供了一种供用户交互地搜索包含数据项目的数据库的数据库搜索系统,其包括:
具有显示器的用户接口;
初始搜索子集指定器,其用于指定数据库中的一些数据项目或所有数据项目的初始搜索子集;
代表识别器,其用于识别搜索子集中的多个数据类别中的每一个类别的代表;
代表显示控制器,其用于将代表显示在显示器上;
代表选择器,其用于选择代表中的一个或多个;
细化搜索子集指定器,其用于指定在搜索子集中的在对应于所选择的代表的数据类别内的数据项目的细化搜索子集;
重复器,其用于重复识别以及显示细化搜索子集的代表的步骤。
根据本发明的第三方面,提供了一种供用户通过具有显示器的用户接口交互地搜索包含数据项目的数据库的数据库搜索控制器,其包括:
初始搜索子集指定器,其用于指定数据库中的一些数据项目或所有数据项目的初始搜索子集;
代表识别器,其用于识别搜索子集中的多个数据类别中的每一个类别的代表;
代表显示控制器,其用于将代表显示在显示器上;
代表选择器,其用于选择代表中的一个或多个;
细化搜索子集指定器,其用于指定在搜索子集中的在对应于所选择的代表的数据类别内的数据项目的细化搜索子集;
重复器,其用于重复识别以及显示细化搜索子集的代表的步骤。
根据本发明的第五方面,提供了计算机可读介质,其包括本发明的第四方面的程序代码。
根据本发明的第六方面,提供了数据信号,其包括本发明的第四方面的计算机程序代码。
附图说明
图1是本发明的示例性数据库搜索系统的框图;
图2示出本发明的一个实施方式的数据库搜索的方法的流程图。
图3-6示出根据本发明的一个实施方式的在图像的数据库中的搜索会话中的显示。
具体实施方式
参考附图,示出了根据本发明的一个实施方式的数据库搜索系统、控制器和方法的不同方面。
所述系统可以采用若干不同的形式。在第一种形式中,提供了独立的系统,其中所需要的所有组件或大部分组件存在于本地用户可操作的计算机和接口中。
在第二种形式中,提供了分布式结构,其中实现系统所需要的一些组件存在于本地用户可操作的计算机和接口中,以及一些组件相对用户被远程定位。例如,可以使用“胖客户端”结构,其中搜索和/或显示控制的一部分在本地用户可操作的计算机和接口上执行,而一部分被远程地例如通过服务器执行;或者可以使用“瘦客户端”结构,其中搜索和显示控制的大部分被远程地例如通过服务器执行,而本地机器只用于用户接口。
典型的基于网络的实现涉及具有显示器、键盘和鼠标或触敏屏的传统的个人计算机,其将数据库搜索控制器实现为可以从网站下载的JavaScript或XML程序。数据库将通常远离用户被存储并由数据库搜索控制器询问。
现在参考图1,最广泛地来说,核心组件是数据库搜索系统10,其包括用户接口20和数据库搜索控制器30,数据库搜索系统10与数据存储器40通信,数据存储器40可以本地以及远程地被定位。在一个实施方式中,数据存储器40包括数据项目数据库420、描述符表422和限制标签表421。
用户接口20的组件包括诸如LCD监视器的显示器200以及诸如鼠标的位置选择器210,用于使用户使用诸如左鼠标按钮或右鼠标按钮的至少一个选择器按钮来指示显示器200上的位置,以使用户能够选择位置并执行其他的输入功能。
数据库搜索控制器30与用户接口20和数据存储器40进行数据通信,并且通常包含处理器或在处理器上被实现,处理器根据在显示器200上的用户输入和输出来处理搜索。在此,术语“处理器”用于一般指可执行这一功能的任何设备并且可以包括:微处理器、微控制器、可编程逻辑器件或其他计算设备、通用计算机(例如,PC)或服务器。
对于媒体应用,数据项目数据库420是媒体数据项的大数据库,如在本领域中的普通的,媒体数据项伴随有通常包含与每个媒体项目相关的基于文本或二进制内容的信息的限制标签表421,而且还可以包含一些本机媒体信息例如媒体类型(例如彩色/黑白)。数据存储器40还包含如在此所描述的每个媒体项目的衍生描述符的描述符表422,描述符表422通常起源于本机视听描述符,而且也可以起源于基于内容的信息。表421和422在数据库建立期间被计算,并可以从媒体项目数据库420远程地定位,尤其是在本发明由除了数据项目数据库420的所有者之外的一方运用的情况下。表421和422可以例如使用二叉树全部或部分地被排序或编索引,以加速在数据库420中满足描述符或限制标签中的值或值的范围的项目的识别,如本领域中所熟知的。
数据库搜索控制器30具有初始搜索子集指定器310,初始搜索子集指定器310用于通常通过经由用户接口从用户接收限制标准来指定初始搜索子集。在简单的实现中,初始搜索子集指定器310可以平凡地仅适合于指定数据库420中的全部数据项目或其固定子集。数据库搜索控制器30还具有代表识别器320、代表显示控制器321和代表选择器330,代表识别器320用于识别搜索子集420中的一组代表性数据项目,每个代表性数据项目代表搜索子集中的若干类别中的一个,代表显示控制器321用于将代表显示在显示器200上,以及代表选择器330用于选择通常由用户通过位置选择器210选择的代表中的一个或多个。在数据库搜索控制器30中还提供了细化搜索子集指定器331和重复器332,细化搜索子集指定器331用于指定在搜索子集中的在对应于所选择的代表的数据类别内的数据项目的细化搜索子集,以及重复器332用于将细化搜素子集转移到代表识别器320并用于通过代表显示控制器321显示新识别的代表。
现在参考图2到图6,在图2的流程图中描绘了本发明的方法方面的一个实施方式,以及在图3到图6中在本发明的方法的步骤中示出了示例性显示布局。在步骤1201中,用户通过在限制标准窗口62中键入诸如搜索词“fruit(水果)”的限制标准并点击“search(搜索)”按钮64b来指定初始搜索子集。初始搜索子集指定器310访问限制标签表421以识别满足限制标准的数据项目,在这种情况下为包含水果的图像。这是初始搜索子集。在步骤1202中,使用从在描述符表422中表示的35维空间到10维描述符空间的单值分解来找到20个适合于搜索子集的数据类别。在下面的示例中提供了这些过程的细节。在步骤1203和1204中,每个数据类别的代表被识别和显示,也在下面被更详细地描述。图3示出所显示的20个代表是在显示器60的左侧上的5乘4网格64。在每个图像的左上方处是通知用户搜索子集中的多少数据项目在每个对应的数据类别中的数字。在步骤1205中,用户通过使用位置选择器210点击并在步骤1206中确认所选择的项目将是通过点击“search”按钮64b而选择的代表来选择值得进一步搜索的代表中的一个或多个。在图3中示出的会话中,选择了右上代表64a。在步骤1207中,细化搜索子集被定义为当前搜索子集的包含在对应于所选择的代表的数据类别内的那些成员。系统然后重复通过SVD从细化搜索子集的描述符表值到适合于细化搜索子集的新的10维描述符空间来找到适当的类别的步骤。
20个类别中的每一个类别的代表然后被再次识别并显示在显示器的右侧65上。左上代表与之前选择的代表相同,但可以不一定是这种情况。在屏幕的底部是搜索细化的“面包屑”小径(breadcrumb trail)。点击小径中的最后一个框会将搜索子集返回到之前的搜索子集。进一步细化的子集从图5中的代表65a(石榴)选择以产生二维描述符空间的四个代表,以及如在图6中所示,作为具有3个成员的类别的代表的石榴66a被再次选择,以及仅具有3个成员的最后的细化搜索子集67被显示。
随着分级搜索的继续,面包屑小径63扩展,且在搜索子集的代表处的系列被添加到在左边消失的带中。用户可以通过点击面包屑小径中的相关的框来跳回到序列中的任何搜索子集,并可以通过编辑限制标准窗62对搜索子集添加进一步的限制。
基于图像的描述符表的示例
设想在本发明的典型的实施方式中,从更大维度的描述符空间中的存储值的描述符表422定义适合于数据类别的多维描述符空间。
对于图像的应用,存在很多可用的图像描述符,其在本发明中可以用来生成描述符表422。例子包括彩色直方图、SIFT边缘检测、SURF边缘检测、Canny边缘检测、Tamura纹理特征以及Gabor纹理特征。
发明人当前实现的对于图像例如照片或静止的电影的实施方式对描述符表使用一组35个描述符,其在数据库建立期间使用未压缩的CEDD[参考文献1]和FTCH[参考文献2]描述符集的组合中的336个描述符的单值分解(SVD)来获取。
找到搜索子集的数据类别的示例
在图3到图6中所示的实施方式中,在所有数据项目的初始搜索子集中具有“fruit”标签的20个数据类别的代表以5乘4网格64显示在显示器60的左边部分上。在预备步骤中,使用单值分解(SVD)从被限制到搜索子集的描述符表计算适合于搜索子集的新的35维描述符空间。通过选择前10维将35维减少到10,这10维是对搜索子集的35个描述符的差异的最大的贡献者,并因此是识别适合于搜索子集的类别的好的开始。这20个类别然后被定义为已减小的10维描述符空间中的区段。SVD算法的输出被按比例缩放,以便描述符空间的原点在搜索子集的中心附近,使得搜索子集的描述符坐标具有正值和负值。实现这一目的的简单方法是通过减去搜索子集中的每个坐标维的最大值和最小值的平均值来相对于粗略计算的中心定义该维。这允许区段定义为区域,其中一个坐标在正方向或负方向上比每维产生两个区段的其他坐标大。
就数学符号而言,n维描述符空间(例如新的已减小的10维空间)的第k维的点x≡(x1,x2..xn)的正区段由下式定义:
S+ k=(所有的点x,使得对于所有的i≠k,xk>xi且|xk|≥|xi|)
以及负区段由下式定义:
S- k=(所有的点x,使得对于所有的i≠k,xk≤xi且|xk|≥|xi|)
这种定义区段的方法通过B+树的使用在标准数据库上高效地运行。
识别数据类别的代表的示例
对于在以上示例中找到的类别,可以通过多种方法对每一类别识别代表性的数据项目。对标准数据库快速执行的方法的示例是识别最大值和最小值。换句话说,对于第k维的正区段的代表由具有最大的(最正的)xk的区段S+ k中的数据项目定义,以及对于第k维的负区段的代表由具有最小的(最负的)xk的区段S- k中的数据项目定义。
显示代表的示例
对于在本说明书中详细说明的图像示例,代表的显示可以方便地通过将S+ k和S- k的代表放在显示器网格上的相对位置处来排序,例如,S+ 1和S- 1被放在左上(行1,列1)和右下(5,4)位置上,以及S+ 2和S- 2被放在相邻的相对的位置(2,1)和(4,4)上,等等。
如在图5和图6中所看到的,当搜索集被细化到包括逐步减少的数据项目时,由于一些区段变空,代表的数量减少。可以通过如图5所示的增大每个代表的图像尺寸并如图6所示的为不能整齐地放在网格中的素数数量的代表提供不规则分区,来实现减少数量的图像的显示。
音频描述符空间的示例
附图示出了图像数据库的示例,但本发明同样适用于诸如音乐的音频数据。
可以在本发明中使用的音频描述符的例子包括梅尔频率倒谱、零交叉、光谱分析、光谱矩心、光谱滚降、线性预测编码系数和节拍直方图。
发明人当前实现的对于音乐和音频数据项目的实施方式对多维描述符空间使用例如在jAudio描述符计算软件[参考文献3]上实现的、在互联网上在http:// jmir.sourceforge.net/jAudio.html找到的各种各样的已知音频描述符的组合。大量的可用描述符(在这种情况下为330个)在数据集上被首次测试以移除倾向于在对某些数据类型的SVD算法中引起错误的任何(通常大约为30个)描述符。鲁棒剩余集(大约300个)然后经受如在图像示例中的SVD算法,以提供要存储在描述符表422中的一组35个描述符。10维及更低的描述符空间的计算在搜索过程中如以上所描述的进行。
音频显示的示例
在照片的情况下,项目的性质在项目的显示中对于用户是明显的。在音频的情况下很清楚,在代表显示控制器321中在音频项目的显示中适应是合乎需要的,以传达通常关于除了视觉方面例如所提供的音乐曲目插图或专辑封面外的音频的性质的一些信息。一种方法是使用SVD将描述符坐标进一步从35缩简到3,并将这3个缩简的坐标表示为颜色空间中的RGB值。用户将会明白哪些颜色对应于哪些类型的声音。
基于标签的描述符应用
尽管在以上的示例中数据库建于从本地视听数据计算的描述符,例如图像的色彩平衡或边缘信息以及在音乐的情况下的时间序列描述符,但在原始的描述符集中包括搜索词是可能的,原始的描述符集也可以与本地描述符一起用SVD算法简缩。
根据数据库和应用,也存在描述符表422中的描述符集完全从简缩的描述符来计算的情况。例如,当搜索一部电影或尤其是一本书时,可能发现诸如演员、导演、作者、情节、暴力程度等的信息在向用户提供建议方面比本机描述符更有用。也可能存在各式各样的二进制描述符,例如,在视频游戏的情况下,游戏是否具有动作或战略元素、谜题、精灵或枪。这些内容标签都可以用与本机描述符相同的方式来处理,并使用诸如SVD的算法减少到可控数量的连续坐标的多维集。
将认识到,虽然从大量描述符的单值分解被描述为计算描述符表422的可控描述符空间以及初始搜索子集和细化搜索子集的减少的维度的多维描述符空间的一种方法,然而本发明包括分类和识别所产生的代表的任何方式。特别是,可以使用诸如NIPALS的另一聚类算法来代替SVD。而且,描述符空间不限于笛卡尔空间,且例如可以是节点树,坐标是代表在树中的位置的任何方式或任何其他结构。另外,尽管例证了适合于搜索子集的内容的自动分类,但本发明以其最广泛的形式还包括严格的非适应性分类。
在权利要求和说明书中,术语“初始搜索子集”扩展到领先并被细化成“细化搜索子集”的任何搜索子集,并且不需要是由用户在搜索会话中指定的绝对的第一搜索子集。
本领域中的技术人员还将认识到,可以对本发明进行许多其他变化而不偏离本发明的范围。
在接下来的权利要求中以及在本发明的前面的描述中,除了在上下文由于明确的语言或必要的暗示而另外需要的场合外,词“包括(comprise)”或诸如“包括(comprises)”或“包括(comprising)”的变化形式在包含的意义上使用,即,以指定所陈述的特征的存在但不排除在本发明的多种实施方式中的另外的特征的存在或添加。
应理解,如果在此提到任何已有技术公布,这样的参考文献并不构成所述公布在澳大利亚或任何其他国家形成本领域中的常见的一般知识的一部分的承认。
参考文献
1.S.A.Chatzichristofis和Y.S.Boutalis的“CEDD:COLOR AND EDGEDIRECTIVITY DESCRIPTOR-A COMPACT DESCRIPTOR FOR IMAGE INDEXING AND RETRIEVAL(CEDD:颜色和边缘的方向性描述符——用于图像索引和检索的简洁描述符)”,《6thInternational Conference in advanced research on Computer Vision Systems ICVS2008(2008第6届关于计算机视觉系统的高级研究国际会议ICVS)》,Proceedings(学报):Lecture Notes in Computer Science(计算机科学讲义)(LNCS)pp.312-322,2008年5月12-15日,Santorini,Greece。
2.S.A.Chatzichristofis和Y.S.Boutalis的“FCTH:FUZZY COLOR AND TEXTUREHISTOGRAM-A LOW LEVEL FEATURE FOR ACCURATE IMAGE RETRIEVAL(FCTH:模糊颜色和纹理直方图——用于精确的图像检索的低水平特征)”,《9th International Workshop onImage Analysis for Multimedia Interactive Services(关于用于多媒体交互服务的图像分析的第9届国际研讨会)》,Proceedings(学报):IEEE Computer Society(IEEE计算机学会)pp.191-196,2008年5月7-9日,Klagenfurt,Austria。
3.McEnnis,D.、C.McKay、I.Fujinaga和P.Depalle的2005,jAudio:A featureextraction library Proceedings of the International Conference on MusicInformation Retrieval(关于音乐信息检索的国际会议的特征提取库学报),600-3。
Claims (16)
1.一种搜索方法,供用户通过用户接口搜索包含数据项目的数据库,所述方法包括以下步骤:
指定所述数据库中的一些所述数据项目或所有所述数据项目的初始搜索子集;
识别所述初始搜索子集中的多个数据类别中的每一个类别的代表,所述初始搜索子集的数据类别的数量被选择成使得所有的初始搜索子集的代表能够一起被显示给用户;
将所述初始搜索子集的代表显示在所述用户接口上;
选择所显示的初始搜索子集的代表中的一个或多个;
指定在所述初始搜索子集中的在对应于所选择的代表的所述数据类别内的数据项目的细化搜索子集;
识别所述细化搜索子集中的多个数据类别中的每一个类别的代表,所述细化搜索子集的数据类别的数量被选择成使得所有的细化搜索子集的代表能够一起被显示给用户,所述细化搜索子集的代表比所述初始搜索子集的代表具有更少的项目;
将所述细化搜索子集的代表显示在所述用户接口上,
其中复数个所述细化搜索子集的代表(i)被靠近所述初始搜索子集的代表显示,以及(ii)被以相对于所述初始搜索子集的代表增加的图像尺寸显示;
选择所显示的细化搜索子集的代表中的一个或多个;
指定在所述细化搜索子集中的在对应于所选择的细化搜索子集的代表的所述数据类别内的数据项目的进一步细化的搜索子集;
识别所述进一步细化的搜索子集中的多个数据类别中的每一个类别的代表,所述进一步细化的搜索子集的数据类别的数量被选择成使得所有的进一步细化的搜索子集的代表能够一起被显示给用户,所述进一步细化的搜索子集的代表比所述细化搜索子集的代表具有更少的项目;
将所述进一步细化的搜索子集的代表与所述细化搜索子集的代表和所述初始搜索子集的代表一起显示在所述用户接口上,其中复数个进一步细化的搜索子集的代表(i)被靠近所述细化搜索子集的代表显示,以及(ii)被以相对于所述细化搜索子集的代表增加的图像尺寸显示。
2.如权利要求1所述的方法,其中指定初始搜索子集的步骤包括从用户接收限制标准并将所述初始搜索子集定义为满足所述限制标准的数据项目。
3.如权利要求1所述的方法,其中识别所述初始搜索子集中的多个数据类别中的每一个类别的代表的步骤包括定义所述初始搜索子集为满足限制标准的数据库中的数据项目的步骤。
4.如权利要求1所述的方法,其中所述数据项目与多维描述符空间中的描述符值相关联,并且搜索子集中的所述数据类别是所述多维描述符空间中的区段。
5.如权利要求4所述的方法,其中考虑获得适合于所指定的搜索子集的类别来定义所述多维描述符空间。
6.如权利要求5所述的方法,其中通过识别具有对所述搜索子集的减小的维度的一组适当的描述符的算法从更大维度的描述符空间中的存储的值的描述符表来定义所述多维描述符空间。
7.如权利要求6所述的方法,其中考虑数据类别的数量来选择所述减小的维度。
8.如权利要求7所述的方法,其中
所述多维描述符空间的原点在所述搜索子集的中心附近,以便所述搜索子集的所述描述符的坐标具有正值和负值;以及
所述数据类别中的至少一个是所述多维描述符空间中的区段,相比于其他维度,所述区段在一个维度中的正方向或负方向上较大。
9.如权利要求8所述的方法,其中
所述区段在一个维度中的正方向上较大,并由所述一个维度中的坐标值的带符号值以及绝对值比所有其他维度中的坐标值的带符号值以及绝对值大的点来定义;或者
所述区段在所述一个维度中的负方向上较大,并由所述一个维度中的坐标值的带符号值比在其他维度中的坐标值的带符号值小且绝对值比在其他维度中的坐标值的绝对值大的点来定义。
10.如权利要求8所述的方法,其中
对应于在所述一个维度中的所述正方向上的较大值的所述区段的所述代表是在所述搜索子集中具有所述一个维度中的最大带符号坐标值的数据项目;以及
对应于在所述一个维度中的所述负方向上的较大值的所述区段的所述代表是在所述搜索子集中具有所述一个维度中的最小带符号坐标值的数据项目。
11.如权利要求1所述的方法,其中所述细化搜索子集的代表的图像尺寸被以与所述初始搜索子集的代表的图像尺寸相比增大的图像尺寸来显示。
12.如权利要求11所述的方法,其中所述细化搜索子集的代表被以与所述初始搜索子集的代表相比不规则的分区来显示。
13.如权利要求1所述的方法,其中指定细化搜索子集、识别、显示和选择的过程适合于重复,直到所有的所述数据类别具有不多于一个的成员。
14.如权利要求1所述的方法,其中所述数据项目包括数字媒体。
15.一种供用户通过用户接口搜索包含数据项目的数据库的搜索系统,包括
子集指定器,其用于指定所述数据库中的一些所述数据项目或所有所述数据项目的初始搜索子集;
代表识别器,其用于识别所述初始搜索子集中的多个数据类别中的每一个类别的代表,所述初始搜索子集的数据类别的数量被选择成使得所有的初始搜索子集的代表能够一起被显示给用户;
代表显示控制器,其用于将所述初始搜索子集的代表显示在所述用户接口上;
代表选择器,其用于选择所述初始搜索子集的代表中的一个或多个;
搜索子集指定器,其指定在对应于所选择的代表的所述数据类别内的数据项目的细化搜索子集,其中所述代表显示控制器使所述用户接口将所述初始搜索子集的复数个代表靠近所述细化搜索子集的复数个代表显示,其中所显示的复数个细化搜索子集的代表以相对于所显示的初始搜索子集的代表增加的图像尺寸显示,所述细化搜索子集的代表比所述初始搜索子集的代表具有更少的项目;
所述代表选择器用于进一步选择所述细化搜索子集的代表中的一个或多个;
所述搜索子集指定器指定在对应于进一步选择的代表的所述数据类别内的数据项目的进一步细化的搜索子集,其中所述代表显示控制器使所述用户接口将所述进一步细化的搜索子集的复数个代表靠近所述细化搜索子集的复数个代表显示,其中所显示的复数个进一步细化的搜索子集的代表以相对于所显示的细化搜索子集的代表增加的图像尺寸显示,所述进一步细化的搜索子集的代表比所述细化搜索子集的代表具有更少的项目;以及
重复器,其用于重复所述指定、识别、显示以及选择直到细化搜索子集具有不多于一个的成员。
16.一种供用户通过具有显示器的用户接口交互地搜索包含数据项目的数据库的数据库搜索控制器,包括
处理器,所述处理器包括:
初始搜索子集指定器,其用于指定所述数据库中的一些所述数据项目或所有所述数据项目的初始搜索子集;
代表识别器,其用于识别搜索子集中的多个数据类别中的每一个类别的代表,所述数据类别的数量被选择成使得所有的代表能够一起被显示给用户;
代表显示控制器,其用于将所述代表显示在所述显示器上;
代表选择器,其用于选择所述代表中的一个或多个;
细化搜索子集指定器,其用于指定在所述初始搜索子集中的在对应于所选择的代表的所述数据类别内的数据项目的细化搜索子集,所述细化搜索子集的代表比所述初始搜索子集的代表具有更少的项目;
重复器,其用于重复识别以及显示所述细化搜索子集的代表的步骤,
其中所述代表显示控制器使所述处理器在所述显示器上显示:(i)靠近所显示的细化搜索子集的代表而显示的初始搜索子集的代表,和(ii)靠近所显示的细化搜索子集的代表而显示的进一步细化的搜索子集的代表,所述进一步细化的搜索子集具有比所述细化搜索子集的代表更少的所显示的代表,所述细化搜索子集的代表少于所述初始搜索子集的代表,所显示的进一步细化的搜索子集的代表相对于所显示的细化搜索子集的代表具有图像间的不规则的分区。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AU2009904400 | 2009-09-11 | ||
AU2009904400A AU2009904400A0 (en) | 2009-09-11 | Database searching system, method and controller | |
PCT/AU2010/001176 WO2011029150A1 (en) | 2009-09-11 | 2010-09-10 | Database searching method, system and controller |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102640146A CN102640146A (zh) | 2012-08-15 |
CN102640146B true CN102640146B (zh) | 2017-07-14 |
Family
ID=43731864
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080050275.6A Active CN102640146B (zh) | 2009-09-11 | 2010-09-10 | 数据库搜索方法、系统和控制器 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8832134B2 (zh) |
EP (1) | EP2476069A4 (zh) |
JP (2) | JP5770732B2 (zh) |
CN (1) | CN102640146B (zh) |
AU (1) | AU2010292988B2 (zh) |
WO (1) | WO2011029150A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8774526B2 (en) * | 2010-02-08 | 2014-07-08 | Microsoft Corporation | Intelligent image search results summarization and browsing |
US10102277B2 (en) | 2014-05-15 | 2018-10-16 | Sentient Technologies (Barbados) Limited | Bayesian visual interactive search |
US20150331908A1 (en) | 2014-05-15 | 2015-11-19 | Genetic Finance (Barbados) Limited | Visual interactive search |
US10606883B2 (en) | 2014-05-15 | 2020-03-31 | Evolv Technology Solutions, Inc. | Selection of initial document collection for visual interactive search |
CN104461494B (zh) * | 2014-10-29 | 2018-10-26 | 中国建设银行股份有限公司 | 一种生成数据处理工具的数据包的方法及装置 |
JP6289519B2 (ja) * | 2016-01-27 | 2018-03-07 | ヤフー株式会社 | 生成装置、生成方法および生成プログラム |
JP6324433B2 (ja) * | 2016-04-26 | 2018-05-16 | ヤフー株式会社 | 配信装置、配信方法および配信プログラム |
US10909459B2 (en) | 2016-06-09 | 2021-02-02 | Cognizant Technology Solutions U.S. Corporation | Content embedding using deep metric learning algorithms |
US10755142B2 (en) | 2017-09-05 | 2020-08-25 | Cognizant Technology Solutions U.S. Corporation | Automated and unsupervised generation of real-world training data |
US10755144B2 (en) | 2017-09-05 | 2020-08-25 | Cognizant Technology Solutions U.S. Corporation | Automated and unsupervised generation of real-world training data |
US11574201B2 (en) | 2018-02-06 | 2023-02-07 | Cognizant Technology Solutions U.S. Corporation | Enhancing evolutionary optimization in uncertain environments by allocating evaluations via multi-armed bandit algorithms |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6339767B1 (en) * | 1997-06-02 | 2002-01-15 | Aurigin Systems, Inc. | Using hyperbolic trees to visualize data generated by patent-centric and group-oriented data processing |
JPH07160728A (ja) * | 1993-12-06 | 1995-06-23 | Sanyo Electric Co Ltd | マルチ画面形成装置 |
US5995978A (en) * | 1997-09-24 | 1999-11-30 | Ricoh Company, Ltd. | Navigation system for document image database |
US6507841B2 (en) * | 1998-02-20 | 2003-01-14 | Hewlett-Packard Company | Methods of and apparatus for refining descriptors |
US7559039B2 (en) * | 1998-07-14 | 2009-07-07 | Brad Ridgley | Method and device for finding, collecting and acting upon units of information |
US7272593B1 (en) * | 1999-01-26 | 2007-09-18 | International Business Machines Corporation | Method and apparatus for similarity retrieval from iterative refinement |
US7325198B2 (en) * | 2002-12-31 | 2008-01-29 | Fuji Xerox Co., Ltd. | Calendar-based interfaces for browsing and manipulation of digital images |
JP4653557B2 (ja) * | 2004-05-24 | 2011-03-16 | 株式会社東芝 | 医用画像表示装置及び医用画像表示方法 |
JP2006268295A (ja) * | 2005-03-23 | 2006-10-05 | Sharp Corp | ユーザインターフェース表示装置及びその操作方法 |
US8694494B2 (en) * | 2005-03-25 | 2014-04-08 | Vistaprint Schweiz Gmbh | Selecting images using associated keywords |
WO2007009238A1 (en) | 2005-07-19 | 2007-01-25 | March Networks Corporation | Temporal data previewing system |
US8161044B2 (en) * | 2005-10-26 | 2012-04-17 | International Business Machines Corporation | Faceted web searches of user preferred categories throughout one or more taxonomies |
JP2008217117A (ja) * | 2007-02-28 | 2008-09-18 | Fujifilm Corp | 画像検索方法及び画像検索システム |
US8200618B2 (en) * | 2007-11-02 | 2012-06-12 | International Business Machines Corporation | System and method for analyzing data in a report |
US8352465B1 (en) * | 2009-09-03 | 2013-01-08 | Google Inc. | Grouping of image search results |
-
2010
- 2010-09-10 AU AU2010292988A patent/AU2010292988B2/en active Active
- 2010-09-10 US US13/394,918 patent/US8832134B2/en active Active
- 2010-09-10 EP EP10814814.9A patent/EP2476069A4/en not_active Withdrawn
- 2010-09-10 WO PCT/AU2010/001176 patent/WO2011029150A1/en active Application Filing
- 2010-09-10 CN CN201080050275.6A patent/CN102640146B/zh active Active
- 2010-09-10 JP JP2012528196A patent/JP5770732B2/ja active Active
-
2014
- 2014-07-30 US US14/447,276 patent/US20140344303A1/en not_active Abandoned
-
2015
- 2015-06-25 JP JP2015127191A patent/JP6069419B2/ja active Active
Non-Patent Citations (1)
Title |
---|
Category-Based Image Retrieval;S. Newsam 等;《Proceeding of the IEEE International Conference on Image Processing》;20011231;第5卷;596-599 * |
Also Published As
Publication number | Publication date |
---|---|
JP2013504795A (ja) | 2013-02-07 |
JP6069419B2 (ja) | 2017-02-01 |
EP2476069A1 (en) | 2012-07-18 |
WO2011029150A1 (en) | 2011-03-17 |
AU2010292988B2 (en) | 2016-09-29 |
EP2476069A4 (en) | 2017-04-05 |
CN102640146A (zh) | 2012-08-15 |
AU2010292988A1 (en) | 2012-04-19 |
US20140344303A1 (en) | 2014-11-20 |
JP5770732B2 (ja) | 2015-08-26 |
JP2015215912A (ja) | 2015-12-03 |
US20120173559A1 (en) | 2012-07-05 |
US8832134B2 (en) | 2014-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102640146B (zh) | 数据库搜索方法、系统和控制器 | |
US11151145B2 (en) | Tag selection and recommendation to a user of a content hosting service | |
EP2321787B1 (en) | Annotating images | |
US8081198B1 (en) | Compact clustered 2-D layout | |
US20080075360A1 (en) | Extracting dominant colors from images using classification techniques | |
JP5212610B2 (ja) | 代表画像又は代表画像群の表示システム、その方法、およびそのプログラム並びに、代表画像又は代表画像群の選択システム、その方法およびそのプログラム | |
US20080205795A1 (en) | System and methods of image retrieval | |
CN108460114B (zh) | 一种基于层次注意力模型的图像检索方法 | |
WO2004031991A1 (en) | Reduction of search ambiguity with multiple media references | |
CN114419391A (zh) | 目标图像识别方法及装置、电子设备及可读存储介质 | |
CN111125327A (zh) | 一种基于短会话的新词发现方法、存储介质和电子装置 | |
Xiao et al. | Complementary relevance feedback-based content-based image retrieval | |
CN111159370A (zh) | 一种短会话新问题生成方法、存储介质和人机交互装置 | |
Berretti et al. | Spatial arrangement of color in retrieval by visual similarity | |
US8775417B2 (en) | Method, system and controller for searching a database | |
EP1973046A1 (en) | Indexing presentation slides | |
CN108132953A (zh) | 一种基于用户点击进行搜索结果排序的方法和装置 | |
US6671402B1 (en) | Representing an image with weighted joint histogram | |
Ali | Content-based image classification and retrieval: A rule-based system using rough sets framework | |
CN110689079B (zh) | 一种处理方法、处理装置及电子设备 | |
Shinde et al. | Retrieval of efficiently classified, re-ranked images using histogram based score computation algorithm extended with the elimination of duplicate images | |
CN118570339A (zh) | 一种基于aigc技术的图书ip设计方法及系统 | |
CN114491091A (zh) | 课件生成方法、设备及可读存储介质 | |
Abdolhoseini et al. | An Automatic Image Annotation Technique Based on Coverage Ratio of Tags |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1174712 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1174712 Country of ref document: HK |