CN105164671B - 在信息检索系统中使用层级评分以进行消歧 - Google Patents
在信息检索系统中使用层级评分以进行消歧 Download PDFInfo
- Publication number
- CN105164671B CN105164671B CN201380070581.XA CN201380070581A CN105164671B CN 105164671 B CN105164671 B CN 105164671B CN 201380070581 A CN201380070581 A CN 201380070581A CN 105164671 B CN105164671 B CN 105164671B
- Authority
- CN
- China
- Prior art keywords
- music
- score
- album
- search
- popularity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims abstract description 41
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 235000013399 edible fruits Nutrition 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/687—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
Abstract
用于检索信息的方法可以包括在非万维网库即非WWW库中接收针对媒体作者的搜索查询。可以在非WWW库内识别针对搜索查询的搜索结果。可以生成针对在搜索结果中所识别出的多个媒体作者各自的得分。针对多个媒体作者中的相应媒体作者的得分可以基于针对多个媒体作者中的相应媒体作者所创作的多个媒体项目的综合媒体流行度得分。可以基于所生成的针对多个媒体作者各自的得分来对搜索结果进行排名。
Description
技术领域
本申请的方面通常涉及数据搜索领域。更具体地,本发明的特定实现涉及在信息检索系统中使用层级评分以进行消歧。
背景技术
信息检索系统使用术语和短语来对文档进行编索引、检索、组织和描述。在用户输入搜索查询的情况下,识别并使用该查询中的术语以从信息检索系统中检索文档,然后对这些文档进行排名。然而,在诸如音乐搜索引擎等的稀疏信息检索系统中,针对各文档经常不存在足够的数据以将这些文档彼此区分开。结果,在这种稀疏信息检索系统中的搜索可能会导致对与搜索术语和短语相关联的文档的模糊评分,这导致对搜索结果的排名变差。
通过如参考附图在本发明的其余部分中所述、将这些方法与本方法和系统的一些方面进行比较,常规和传统方法的其它限制和缺点对于本领域技术人员而言将变得明白。
发明内容
如在权利要求书中更全面地所述,大致如与附图中的至少一个附图有关地所示和/或所述,提供一种用于在信息检索系统中使用层级评分以进行消歧的系统和/或方法。
通过以下的说明和附图,将更加充分地理解本发明的这些和其它优点、方面和特征及其例示实施例的详细内容。
根据本发明的示例实施例,用于检索信息的方法可以包括在非万维网(WWW)库中接收针对媒体作者的搜索查询。媒体例如可以是印刷媒体(例如,书)、音乐、电影和其它媒体项目。可以在所述非WWW库内识别针对所述搜索查询的搜索结果。可以针对在所述搜索结果中所识别出的多个媒体作者各自生成得分。针对所述多个媒体作者中的相应媒体作者的得分可以是基于针对所述多个媒体作者中的相应媒体作者所创作的多个媒体项目的综合媒体流行度得分。可以基于所生成的针对所述多个媒体作者各自的得分来对所述搜索结果进行排名。
根据本发明的示例实施例,用于检索信息的方法可以包括接收针对音乐艺术家的搜索查询并且识别针对所述搜索查询的搜索结果。可以生成针对在所述搜索结果中所识别出的多个音乐艺术家各自的得分。针对所述多个音乐艺术家中的相应音乐艺术家的得分可以是基于针对所述多个音乐艺术家中的相应音乐艺术家的多个音乐专辑的综合音乐专辑流行度得分。可以基于所生成的针对所述多个音乐艺术家各自的得分来对所述搜索结果进行排名。可以接收针对所述多个音乐专辑的识别信息和针对所述多个音乐专辑各自内的多个音乐曲目的识别信息。可以确定针对所述多个音乐曲目各自的流行度得分。针对给定音乐曲目的流行度得分可以基于针对该音乐曲目的搜索查询的总数和来自所述搜索查询的网络结果的点进率(CTR)中的一个或这两者。可以在基于万维网(WWW)的搜索库内进行针对该音乐曲目的搜索查询的总数中的至少一部分。
可以确定针对所述多个音乐专辑各自的流行度得分。音乐专辑的流行度得分可以基于针对音乐专辑内的所述多个音乐曲目各自的流行度得分的加权平均。可以生成所述综合音乐专辑流行度得分作为针对所述多个音乐专辑各自的流行度得分的加权平均。针对所述多个音乐艺术家中的相应音乐艺术家的得分还可以基于独立于所述搜索查询的至少一个得分。独立于所述搜索查询的至少一个得分可以基于以下内容中的一个或多个:接收到的所述搜索查询所来自的地理位置;所述多个音乐专辑中的至少一个音乐专辑的发行日期;所述多个音乐专辑中的至少一个音乐专辑的播放计数;以及所述多个音乐专辑中的至少一个音乐专辑的销售计数。
根据本发明的另一示例实施例,用于检索信息的系统可以包括网络装置。所述网络装置可用于接收针对音乐艺术家的搜索查询并且识别针对所述搜索查询的搜索结果。可以生成针对在所述搜索结果中所识别出的多个音乐艺术家各自的得分。针对所述多个音乐艺术家中的相应音乐艺术家的得分可以基于针对所述多个音乐艺术家中的相应音乐艺术家的多个音乐专辑的综合音乐专辑流行度得分。可以基于所生成的针对所述多个音乐艺术家各自的得分来对所述搜索结果进行排名。
所述网络装置可用于接收针对所述多个音乐专辑的识别信息和针对所述多个音乐专辑各自内的多个音乐曲目的识别信息。所述网络装置可用于确定针对所述多个音乐曲目各自的流行度得分。针对音乐曲目的流行度得分可以基于针对该音乐曲目的搜索查询的总数和来自所述搜索查询的网络结果的点进率(CTR)中的一个或这两者。可以在基于万维网(WWW)的搜索库内进行针对该音乐曲目的搜索查询的总数中的至少一部分。所述网络装置可用于确定针对所述多个音乐专辑各自的流行度得分。针对音乐专辑的流行度得分可以基于针对该音乐专辑内的多个音乐曲目各自的流行度得分的加权平均。
所述网络装置可用于生成所述综合音乐专辑流行度得分作为针对所述多个音乐专辑各自的流行度得分的加权平均。针对所述多个音乐艺术家中的相应音乐艺术家的得分还可以基于独立于所述搜索查询的至少一个得分。独立于所述搜索查询的至少一个得分可以基于以下内容中的一个或多个:接收到的所述搜索查询来自的地理位置;所述多个音乐专辑中的至少一个音乐专辑的发行日期;所述多个音乐专辑中的至少一个音乐专辑的播放计数;以及所述多个音乐专辑中的至少一个音乐专辑的销售计数。
根据本发明的又一示例实施例,用于检索信息的方法可以包括接收针对音乐专辑的搜索查询并且识别针对所述搜索查询的搜索结果。可以生成针对在所述搜索结果中所识别出的多个音乐专辑各自的得分。针对所述多个音乐专辑中的相应音乐专辑的得分可以基于以下内容中的一个或这两者:针对来自所述多个音乐专辑中的相应音乐专辑的至少一个音乐曲目的音乐曲目流行度得分、以及针对与所述多个音乐专辑中的相应音乐专辑相关联的音乐艺术家的音乐艺术家流行度得分。可以基于所生成的针对所述多个音乐专辑各自的得分来对所述搜索结果进行排名。
根据本发明的还一示例实施例,用于检索信息的方法可以包括接收针对音乐曲目的搜索查询并且识别针对所述搜索查询的搜索结果。可以生成针对在所述搜索结果中所识别出的多个音乐曲目各自的得分。针对所述多个音乐曲目中的相应音乐曲目的得分可以基于以下内容中的一个或这两者:针对与所述多个音乐曲目中的相应音乐曲目相关联的至少一个音乐专辑的音乐专辑流行度得分、以及针对与所述多个音乐曲目中的相应音乐曲目相关联的音乐艺术家的音乐艺术家流行度得分。可以基于所生成的针对所述多个音乐曲目各自的得分来对所述搜索结果进行排名。
附图说明
图1A是示出根据本发明的实施例的示例信息检索系统的框图。
图1B是根据本发明的示例实施例的查询独立得分模块的示例实现的框图。
图2是示出根据本发明的示例实施例的、用于响应于针对音乐艺术家的搜索查询来检索信息的方法的示例步骤的流程图。
图3是示出根据本发明的示例实施例的、用于响应于针对音乐专辑的搜索查询来检索信息的方法的示例步骤的流程图。
图4是示出根据本发明的示例实施例的、用于响应于针对音乐曲目的搜索查询来检索信息的方法的示例步骤的流程图。
具体实施方式
如这里所使用的,术语“电路”和“电路系统”是指物理电子组件(即,硬件)以及可构成该硬件、可由硬件执行和/或与该硬件相关联的任何软件和/或固件(“代码”)。作为示例,“x和/或y”表示三要素集合{(x),(y),(x,y)}中的任何元素。作为另一示例,“x、y和/或z”表示七要素集合{(x),(y),(z),(x,y),(x,z),(y,z),(x,y,z)}中的任何元素。如这里所使用的,术语“例如”引出一个或多个非限制性示例、实例或插图的列表。如这里所使用的,术语“库”表示给定类型的文档(或数据项)的集合。术语“万维网(WWW)库”表示在万维网上可得到库文件(或数据项)的库。术语“非WWW库”表示在WWW上不可得到库文件(或数据项)的库。
本发明涉及用于在信息检索系统中使用层级评分以进行消歧的方法和系统。在各种实现中,可以在诸如音乐搜索引擎或任何其它信息检索系统等的稀疏信息检索系统中接收用户搜索查询。由于在特定搜索类别(例如,艺术家、专辑和曲目)中可得到的数据可能有限,因此可以通过使用相关文件(例如,相关类别中的文件)的排名信号来将来自一个类别的表面上相似的文件进一步彼此区分开(并且排名)。例如,为了对与姓名相同的音乐艺术家有关的两个文件进行消歧,可以使用与这些音乐艺术家各自的音乐专辑有关的信号以及与这些专辑内的曲目有关的信号,从而将这两个艺术家区分开。
可以使用的一个这种信号是音乐项目的流行度(例如,在信息搜索系统内先前接收到与该音乐项目有关的多少个搜索查询、以及针对这些搜索查询的网络结果的点进率)。例如,在查询时可以使用给定专辑中的曲目流行度的加权汇总来计算针对该专辑的得分、以及针对录制了该给定曲目的艺术家的得分。同样,可以使用专辑流行度的加权汇总来计算针对录制了该专辑的艺术家的得分。在这方面,可以使用相关文件的流行度得分的层级汇总来按相对流行度对相似文件进行排名。
例如,用于检索信息的方法可以包括接收针对音乐艺术家的搜索查询并且识别针对该搜索查询的搜索结果。可以生成针对在搜索结果中所识别出的多个音乐艺术家各自的得分。针对多个音乐艺术家中的相应音乐艺术家的得分可以基于针对多个音乐艺术家中的相应音乐艺术家的多个音乐专辑的综合音乐专辑流行度得分。可以基于所生成的针对多个音乐艺术家各自的得分来对搜索结果进行排名。可以接收针对多个音乐专辑的识别信息和针对多个音乐专辑各自内的多个音乐曲目的识别信息。可以确定针对多个音乐曲目各自的流行度得分。针对给定音乐曲目的流行度得分可以基于针对该音乐曲目的搜索查询的总数。可以在基于万维网(WWW)的搜索库内进行针对音乐曲目的搜索查询的总数中的至少一部分。如这里所使用的,术语“基于WWW的搜索库”意图包括在因特网上可得到的所有文件(即,包括但不限于音乐相关文件)。
图1A是示出根据本发明的实施例的示例信息检索系统的框图。参考图1A,示例信息检索系统100可以包括搜索引擎102和原始音乐数据库104。
原始音乐数据库104可以包括适当的电路、逻辑和/或代码,并且可用于将原始音乐相关数据提供至搜索引擎102。原始音乐数据库104可以包括艺术家数据模块112、专辑数据模块114和曲目数据模块116。艺术家数据模块112可以包括适当的电路、逻辑和/或代码,并且可用于提供与音乐艺术家有关的原始数据(例如,识别数据和传记数据)。专辑数据模块114可以包括适当的电路、逻辑和/或代码,并且可用于提供与音乐专辑有关的原始数据(例如,专辑识别信息、发行日期等)。曲目数据模块116可以包括适当的电路、逻辑和/或代码,并且可用于提供与给定专辑内的音乐曲目有关的原始数据(例如,专辑中的曲目的数量、曲目名称和曲目时长等)。
搜索引擎102可以包括适当的电路、逻辑和/或代码,并且可用于响应于用户查询124来接收原始音乐相关数据(例如,文档130即D1、…、Dn),并且基于文档最终得分126、…、128对所接收到的文档130进行排名。搜索引擎102可以包括流行度引擎106、搜索引擎排名器108、CPU 109和存储器111。如这里所论述的,CPU 109可用于进行与信息的检索相关联的处理功能中的一个或多个。
流行度引擎106可以包括适当的电路、逻辑和/或代码,并且可用于针对从原始音乐数据库104所接收到的一个或多个类别的文档计算流行度得分。更具体地,流行度引擎106可以包括艺术家流行度模块118、专辑流行度模块120和曲目流行度模块122。
曲目流行度模块122可以包括适当的电路、逻辑和/或代码,并且可用于经由通信链路136从曲目数据模块116接收音乐曲目相关数据。然后,曲目流行度模块122可以计算针对给定曲目的流行度得分。例如,曲目流行度得分可以基于在信息检索系统100内(或在基于万维网的信息库内)先前所接收到的与特定音乐曲目有关的搜索查询的数量、以及来自这些搜索查询的网页结果的点进率(CTR)。
专辑流行度模块120可以包括适当的电路、逻辑和/或代码,并且可用于经由通信链路134从专辑数据模块114接收专辑相关数据。然后,专辑流行度模块120可以计算针对给定专辑的流行度得分。专辑流行度得分可以基于给定专辑的流行度得分和/或该专辑内的各个曲目的流行度得分的加权平均(可以从曲目流行度模块122获得各个曲目的流行度得分)。针对专辑的流行度得分可以基于在信息检索系统100内(或在基于万维网的信息库内)先前所接收到的与特定音乐专辑有关的搜索查询的数量。
艺术家流行度模块118可以包括适当的电路、逻辑和/或代码,并且可用于经由通信链路132从艺术家数据模块112接收艺术家相关数据。然后,艺术家流行度模块118可以计算针对给定艺术家的流行度得分。艺术家流行度得分可以基于给定艺术家的流行度得分和/或专辑的流行度得分的加权平均(可以从专辑流行度模块120获得针对各个专辑的流行度得分)。针对艺术家的流行度得分可以基于在信息检索系统100内(或在基于万维网的信息库内)先前所接收到的与特定音乐艺术家有关的搜索查询的数量。
尽管将流行度引擎106例示为在搜索引擎102内实现,但本发明在这方面可以不受限制。更具体地,流行度引擎106可以与搜索引擎102分开实现。
搜索引擎排名器108可以包括适当的电路、逻辑和/或代码,并且可用于响应于用户查询124来接收一个或多个文档130(例如,文档D1、…、Dn)。然后,搜索引擎排名器108可以基于最终排名得分126、…、128来对所接收到的文档130进行排名,其中该最终排名得分是针对各文档使用从流行度引擎106所接收到的一个或多个流行度得分与其它的查询独立特征和信号的组合所计算出的。
根据本发明的示例实施例,信息检索系统100还可以包括查询独立得分模块110。查询独立得分模块110可以包括适当的电路、逻辑和/或代码,并且可用于通信针对给定文档的一个或多个查询独立得分,其中该一个或多个查询独立得分可以由搜索引擎排名器108使用以生成文档D1、…、Dn的最终排名得分126、…、128。
在操作时,用户101可以将用户查询124发送至搜索引擎102。用户查询124例如可以是与音乐曲目、音乐专辑或音乐艺术家有关的查询。在搜索引擎102接收到用户查询124之后,搜索引擎102可以获得满足用户查询124的一个或多个文档130(D1、…、Dn)。
例如,如果用户查询124是与音乐曲目有关的查询,则原始音乐数据库104可以使用曲目数据模块116并且通信满足用户查询124的曲目相关文档130(例如,如果查询与特定歌曲标题有关,则所返回的文档130可以是与标题相同但来自于各种专辑和/或音乐艺术家的歌曲有关的信息)。在搜索引擎102接收到文档130之后,可以针对各个文档计算流行度得分,并且可以使用该流行度得分来计算针对文档的最终排名得分126、…、128并将排名搜索结果列表输出至用户101。这里,以下参考图2~4来提供针对艺术家相关搜索、专辑相关搜索或曲目相关搜索计算流行度得分(作为一种查询独立得分)的更详细说明。
尽管将搜索引擎102、原始音乐数据库104和查询独立得分模块110例示为单独块,但本发明在这方面可以不受限制。更具体地,原始音乐数据库104和查询独立得分模块110可以是搜索引擎102的一部分并且在搜索引擎102内实现。
另外,尽管将稀疏信息检索系统100实现为音乐相关信息检索系统(例如,搜索引擎102是音乐搜索引擎),但还可以以相同方式实现其它类型的信息检索系统。根据本发明的示例实施例,数据库104可以是书(或印刷媒体)相关数据库(或任何其它类型的媒体相关数据库)。然后,搜索引擎102可以响应于用户搜索查询124,使用流行度引擎106来计算流行度得分并且对从原始数据库104可得到的各种类别的文档进行排名。此外,可以在一个或多个网络装置中实现信息检索系统100(包括搜索引擎102)。
图1B是根据本发明的示例实施例的查询独立得分模块的示例实现的框图。参考图1B,查询独立得分模块110可以包括适当的电路、逻辑和/或代码,并且可用于通信针对给定文档的一个或多个查询独立得分,其中该一个或多个查询独立得分可以由搜索引擎排名器108使用以生成文档D1、…、Dn的最终排名得分126、…、128。更具体地,查询独立得分模块110可以包括用户查询位置模块202、专辑发行日期模块204、销售计数模块206和播放计数模块208。
各个模块202~208可以包括适当的电路、逻辑和/或代码,并且可用于将用户查询位置信息、专辑发行日期信息、销售计数信息或播放计数信息分别提供至搜索引擎排名器108,以提高给定文档的总排名得分。例如,如果用户查询124与给定艺术家的特定音乐曲目有关,则原始音乐数据库可以定位并向搜索引擎102返回期望艺术家的具有期望标题的两首曲目(例如,针对两个不同的地理市场,该艺术家可能以两种不同语言发行了同一首歌曲)。流行度引擎106所返回的流行度得分针对这两个曲目可以相同(在针对各曲目混合了专辑流行度得分和艺术家流行度得分之后,同一专辑和同一艺术家可以得到相同的总流行度得分)。在该实例中,可以使用用户查询位置模块202来通信用户查询124的地理位置(例如,该位置可以是基于发送搜索查询124的用户101的IP地址所获得的)。如果地理位置与两个版本的歌曲所针对的两个地理市场其中之一相同,则采用与接收到用户查询124的地理位置的语言相同的语言所录制的曲目可被赋予附加得分,因此在最终排名得分列表126、…、128中的排名更高。
尽管关于查询独立得分模块110仅列出四个查询独立得分202~208,但本发明在这方面并非限制性的,并且还可以利用搜索引擎102使用其它的查询独立得分来生成最终排名得分126、…、128。
图2是示出根据本发明的示例实施例的、用于响应于针对音乐艺术家的搜索查询来检索信息的方法的示例步骤的流程图。参考图1A~2,在搜索引擎102可能接收到针对音乐艺术家的搜索查询124的情况下,示例方法200可以从210开始。在212中,搜索引擎102可以使用原始音乐数据库104来识别针对搜索查询的搜索结果。更具体地,可以(使用艺术家数据模块112)将艺术家相关数据(例如,文档D1、…、Dn)识别为搜索结果并且通信至搜索引擎排名器108。
在214中,搜索引擎102可以基于针对相应艺术家的多个音乐专辑的综合音乐专辑流行度得分,来针对在搜索结果(例如,文档130)中所识别出的多个音乐艺术家各自计算排名得分(例如,126、…、128)。更具体地,搜索查询124可以针对特定艺术家姓名。所返回的搜索结果(例如,文档130)可以表示姓名与搜索查询124中的姓名相同或相似的多个不同艺术家。
针对搜索结果中的各个艺术家,流行度引擎106可以从专辑数据模块114获得专辑信息并且从曲目数据模块116获得各专辑的曲目信息。随后,针对给定艺术家,可以利用专辑流行度模块120基于针对专辑的流行度得分和/或基于针对专辑内的所有曲目的曲目流行度得分的加权平均来计算专辑流行度得分(针对给定专辑内的所有曲目的曲目流行度得分可以是从曲目流行度模块122所接收到的)。可以利用专辑流行度模块120针对给定音乐艺术家的各音乐专辑计算专辑流行度得分。然后,可以利用专辑流行度模块120,基于被识别为由给定艺术家所创建的专辑的所计算出的专辑流行度得分来计算综合音乐专辑流行度得分。可以利用艺术家流行度模块118基于从专辑流行度模块120所接收到的综合音乐专辑流行度得分来计算艺术家流行度得分。
在216中,可以基于搜索引擎102所生成的搜索结果(例如,文档D1、…、Dn)的最终排名得分126、…、128来对搜索结果130进行排名。在218中,可以向用户101显示排名后的搜索结果。
图3是示出根据本发明的示例实施例的、用于响应于针对音乐专辑的搜索查询来检索信息的方法的示例步骤的流程图。参考图1A~1B和3,在搜索引擎102可以接收针对音乐专辑的搜索查询124的情况下,示例方法300可以从302开始。在304中,搜索引擎102可以使用原始音乐数据库104来识别针对搜索查询的搜索结果。更具体地,可以(使用专辑数据模块114)将专辑相关数据(例如,文档D1、…、Dn)识别为搜索结果并且通信至搜索引擎排名器108。
在306中,搜索引擎102可以基于音乐曲目流行度得分和音乐艺术家流行度得分中的一个或这两者(以及任何其它的查询独立得分),来针对在搜索结果(例如,文档130)中所识别出的多个音乐专辑各自生成排名得分(例如,126、…、128)。
更具体地,搜索查询124可以针对特定专辑名称。所返回的搜索结果(例如,文档130)可以识别名称与搜索查询124中的名称相同或相似的多个不同专辑。针对搜索结果中的各个专辑,流行度引擎106可以从艺术家数据模块112获得艺术家信息,并且从曲目数据模块116获得针对各专辑的曲目信息。随后,针对给定专辑,可以利用专辑流行度模块120基于针对专辑的流行度得分和/或基于针对该专辑内的所有曲目的曲目流行度得分的加权平均来计算专辑流行度得分(针对给定专辑内的所有曲目的曲目流行度得分可以是从曲目流行度模块122所接收到的)。还可以使针对搜索结果130中的各专辑的专辑流行度得分通过针对录制该特定专辑的相应音乐艺术家的流行度得分(这里以上参考图2说明了艺术家流行度得分的计算)、以及其它的查询独立得分而增大。
在308中,可以基于搜索引擎102所生成的搜索结果(例如,文档D1、…、Dn)的最终排名得分126、…、128来对搜索结果130进行排名。在310中,可以向用户101显示排名后的搜索结果。
图4是示出根据本发明的示例实施例的、用于响应于针对音乐曲目的搜索查询来检索信息的方法的示例步骤的流程图。参考图1A~1B和4,在搜索引擎102可以接收针对音乐曲目的搜索查询124的情况下,示例方法400可以从402开始。在404中,搜索引擎102可以使用原始音乐数据库104来识别针对搜索查询的搜索结果。更具体地,可以(使用曲目数据模块116)将曲目相关数据(例如,文档D1、…、Dn)识别为搜索结果并且通信至搜索引擎排名器108。
在406中,搜索引擎102可以基于(作为查询独立得分的)音乐专辑流行度得分和音乐曲目流行度得分中的一个或这两者以及其它的查询独立得分,针对在搜索结果(例如,文档130)中所识别出的多个音乐曲目各自生成排名得分(例如,126、…、128)。
更具体地,搜索查询124可以是针对特定音乐曲目名称。所返回的搜索结果(例如,文档130)可以识别名称与搜索查询124中的名称相同或相似的多个不同曲目。针对搜索结果中的各个曲目,流行度引擎106可以从艺术家数据模块112获得艺术家信息,并且从专辑数据模块114获得针对该曲目的专辑的专辑信息。随后,针对给定音乐曲目,可以利用曲目流行度模块122来计算曲目流行度得分。还可以使针对搜索结果130中的各曲目的曲目流行度得分通过相应音乐专辑的流行度得分(如以上参考图3所述)、以及/或者针对录制该特定专辑的相应音乐艺术家的流行度得分(这里,以上参考图2说明了艺术家流行度得分的计算)而增大。
在408中,可以基于搜索引擎102所生成的搜索结果(例如,文档D1、…、Dn)的最终排名得分126、…、128来对搜索结果130进行排名。在410中,可以向用户101显示排名后的搜索结果。
其它实现可以提供其上存储有机器代码和/或计算机程序的非瞬态计算机可读介质和/或存储介质以及/或者非瞬态机器可读介质和/或存储介质,其中该机器代码和/或计算机程序具有机器和/或计算机可执行的至少一个代码部分,由此使该机器和/或计算机进行如这里所述的用于检索信息的步骤。
因此,本方法和/或系统可以以硬件、软件或者硬件和软件的组合来实现。本方法和/或系统可以以集中方式在至少一个计算机系统中实现、或者以不同元件分散开的分布方式在数个互连的计算机系统内实现。被配置成为执行这里所述的方法的任何种类的计算机系统或其它系统均适合。硬件和软件的典型组合可以是具有如下计算机程序的通用计算机系统,其中该计算机程序在载入并执行的情况下,控制计算机系统以使得该计算机系统执行这里所述的方法。
本方法和/或系统还可以嵌入在计算机程序产品中,其中该计算机程序产品包括使得能够实现这里所述的方法的所有特征,并且该计算机程序产品在载入计算机系统的情况下,能够执行这些方法。本上下文中的计算机程序表示采用任何语言、代码或注释的如下指令组的任何表达,其中该指令组意图使具有信息处理能力的系统直接地进行特定功能、或者在进行了a)转换成其它语言、代码或注释和b)以不同材料形式再现这两者或者任一者之后进行特定功能。
尽管已经参考特定实现说明了本方法和/或设备,但本领域技术人员应当理解,可以在没有背离本方法和/或系统的范围的情况下进行各种改变并且可以替换等同物。另外,在没有背离本发明的范围的情况下,可以进行多种修改以使特定情形或材料适合于本发明的教导。因此,意图是本方法和/或设备不限于所公开的特定实施例,而且本方法和/或设备将包括落入所附权利要求书的范围内的所有实施例。
Claims (18)
1.一种用于检索信息的方法,包括以下步骤:
接收在非WWW库中针对媒体作者的搜索查询;
在所述非WWW库内识别针对所述搜索查询的搜索结果;
生成针对在所述搜索结果中识别出的多个媒体作者各自的得分,其中:
针对所述多个媒体作者中的相应媒体作者的得分是基于针对该媒体作者所创作的多个媒体项目的综合媒体流行度得分的并且还基于独立于所述搜索查询的至少另一得分,所述至少另一得分至少部分基于所述搜索查询从其被接收的地理位置以及所述地理位置中使用的语言,其中,对于所述多个媒体项目中具有同一标题的任意两个媒体项目,更紧密地与所述地理位置和所述语言相关联的媒体项目比所述两个媒体项目中的另一个媒体项目的所述至少另一得分更高;以及基于所述针对所述多个媒体作者各自的得分来对所述搜索结果进行排名;以及
向用户显示经排名的搜索结果。
2.一种用于检索信息的方法,包括以下步骤:
接收在非WWW库中针对音乐艺术家的搜索查询;
在所述非WWW库内识别针对所述搜索查询的搜索结果;
生成针对在所述搜索结果中识别出的多个音乐艺术家各自的得分,其中:
针对所述多个音乐艺术家中的相应音乐艺术家的得分是基于针对该音乐艺术家的多个音乐专辑的综合音乐专辑流行度得分的并且还基于独立于所述搜索查询的至少另一得分,所述至少另一得分至少部分基于所述搜索查询从其被接收的地理位置以及所述地理位置中使用的语言,其中,所述多个音乐专辑中的每个音乐专辑具有一个或多个音乐曲目,并且对于具有同一标题的任意两个音乐曲目,更紧密地与所述地理位置和所述语言相关联的音乐曲目比所述两个音乐曲目中的另一个音乐曲目的所述至少另一得分更高;
基于针对所述多个音乐艺术家各自的得分来对所述搜索结果进行排名;以及
向用户显示经排名的搜索结果。
3.根据权利要求2所述的方法,其中,还包括以下步骤:
接收针对所述多个音乐专辑的识别信息。
4.根据权利要求3所述的方法,其中,还包括以下步骤:
接收针对所述多个音乐专辑中的各个音乐专辑内的多个音乐曲目的识别信息。
5.根据权利要求4所述的方法,其中,还包括以下步骤:
确定针对所述多个音乐曲目各自的流行度得分,其中针对相应音乐曲目的所述流行度得分是基于针对音乐曲目的搜索查询的总数和针对所述相应音乐曲目的搜索查询的网络结果的点进率即CTR中的一个或这两者的。
6.根据权利要求5所述的方法,其中,针对音乐曲目的搜索查询的总数中的至少一部分是在基于WWW的搜索库中所进行的。
7.根据权利要求5所述的方法,其中,还包括以下步骤:
确定针对所述多个音乐专辑各自的流行度得分,其中针对相应音乐专辑的所述流行度得分是基于针对所述相应音乐专辑内的所述多个音乐曲目各自的流行度得分的加权平均的。
8.根据权利要求7所述的方法,其中,还包括以下步骤:
将所述综合音乐专辑流行度得分生成为针对所述多个音乐专辑各自的流行度得分的加权平均。
9.根据权利要求2所述的方法,其中,独立于所述搜索查询的所述至少另一得分是进一步基于以下内容中的一个或多个的:
所述多个音乐专辑中的至少一个音乐专辑的发行日期;
所述多个音乐专辑中的至少一个音乐专辑的播放计数;以及
所述多个音乐专辑中的至少一个音乐专辑的销售计数。
10.一种用于检索信息的系统,包括:
网络装置,其包括连接至存储器的至少一个处理器,其中所述至少一个处理器执行以下操作:
接收针对音乐艺术家的搜索查询;
识别针对所述搜索查询的搜索结果;
生成针对在所述搜索结果中识别出的多个音乐艺术家各自的得分,其中:
针对所述多个音乐艺术家中的相应音乐艺术家的得分是基于针对该音乐艺术家的多个音乐专辑的综合音乐专辑流行度得分的并且还基于独立于所述搜索查询的至少另一得分,所述至少另一得分至少部分基于所述搜索查询从其被接收的地理位置以及所述地理位置中使用的语言,其中,所述多个音乐专辑中的每个音乐专辑具有一个或多个音乐曲目,并且对于具有同一标题的任意两个音乐曲目,更紧密地与所述地理位置和所述语言相关联的音乐曲目比所述两个音乐曲目中的另一个音乐曲目的所述至少另一得分更高;以及
基于针对所述多个音乐艺术家各自的得分来对所述搜索结果进行排名;以及
向用户显示经排名的搜索结果。
11.根据权利要求10所述的系统,其中,所述至少一个处理器执行以下操作:
接收针对所述多个音乐专辑的识别信息。
12.根据权利要求11所述的系统,其中,所述至少一个处理器执行以下操作:
接收针对所述多个音乐专辑中的各个音乐专辑内的多个音乐曲目的识别信息。
13.根据权利要求12所述的系统,其中,所述至少一个处理器执行以下操作:
确定针对所述多个音乐曲目各自的流行度得分,其中针对相应音乐曲目的所述流行度得分是基于针对音乐曲目的搜索查询的总数和针对所述相应音乐曲目的搜索查询的网络结果的点进率即CTR中的一个或这两者的。
14.根据权利要求13所述的系统,其中,针对音乐曲目的搜索查询的总数中的至少一部分是在基于WWW的搜索库中所进行的。
15.根据权利要求13所述的系统,其中,所述至少一个处理器执行以下操作:
确定针对所述多个音乐专辑各自的流行度得分,其中针对相应音乐专辑的流行度得分是基于针对所述相应音乐专辑内的所述多个音乐曲目各自的流行度得分的加权平均的。
16.根据权利要求15所述的系统,其中,所述至少一个处理器执行以下操作:
将所述综合音乐专辑流行度得分生成为针对所述多个音乐专辑各自的流行度得分的加权平均。
17.根据权利要求10所述的系统,其中,独立于所述搜索查询的所述至少另一得分是进一步基于以下内容中的一个或多个的:
所述多个音乐专辑中的至少一个音乐专辑的发行日期;
所述多个音乐专辑中的至少一个音乐专辑的播放计数;以及
所述多个音乐专辑中的至少一个音乐专辑的销售计数。
18.一种用于检索信息的方法,包括以下步骤:
接收针对音乐专辑的搜索查询;
识别针对所述搜索查询的搜索结果;
生成针对在所述搜索结果中识别出的多个音乐专辑各自的得分,其中针对所述多个音乐专辑中的相应音乐专辑的得分是基于以下内容中的一个或这两者的:
针对来自所述多个音乐专辑中的相应音乐专辑的至少一个音乐曲目的音乐曲目流行度得分,以及
针对与所述多个音乐专辑中的相应音乐专辑相关联的音乐艺术家的音乐艺术家流行度得分;
并且还基于独立于所述搜索查询的至少另一得分,所述至少另一得分至少部分基于所述搜索查询从其被接收的地理位置以及所述地理位置中使用的语言,其中,所述多个音乐专辑中的每个音乐专辑具有一个或多个音乐曲目,并且对于具有同一标题的任意两个音乐曲目,更紧密地与所述地理位置和所述语言相关联的音乐曲目比所述两个音乐曲目中的另一个音乐曲目的所述至少另一得分更高;
基于所生成的针对所述多个音乐专辑各自的得分来对所述搜索结果进行排名;以及
向用户显示经排名的搜索结果。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/679,033 US9626435B2 (en) | 2012-11-16 | 2012-11-16 | Using hierarchical scoring for disambiguation in an information retrieval system |
US13/679,033 | 2012-11-16 | ||
PCT/US2013/069100 WO2014078183A2 (en) | 2012-11-16 | 2013-11-08 | Using hierarchical scoring for disambiguation in an information retrieval system |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105164671A CN105164671A (zh) | 2015-12-16 |
CN105164671B true CN105164671B (zh) | 2019-07-09 |
Family
ID=50728938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380070581.XA Active CN105164671B (zh) | 2012-11-16 | 2013-11-08 | 在信息检索系统中使用层级评分以进行消歧 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9626435B2 (zh) |
EP (1) | EP2920716A2 (zh) |
CN (1) | CN105164671B (zh) |
WO (1) | WO2014078183A2 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9690847B2 (en) | 2014-08-07 | 2017-06-27 | Google, Inc. | Selecting content using query-independent scores of query segments |
CN105653590B (zh) * | 2015-12-21 | 2019-03-26 | 青岛智能产业技术研究院 | 一种中文文献作者重名消歧的方法 |
JPWO2018173740A1 (ja) * | 2017-03-23 | 2020-05-14 | パイオニア株式会社 | 表示制御装置、表示制御方法及び表示制御用プログラム |
US10691734B2 (en) * | 2017-11-21 | 2020-06-23 | International Business Machines Corporation | Searching multilingual documents based on document structure extraction |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101828393A (zh) * | 2007-08-24 | 2010-09-08 | 谷歌公司 | 基于媒体的推荐 |
EP2228739A2 (en) * | 2009-03-12 | 2010-09-15 | Comcast Interactive Media, LLC | Ranking search results |
WO2011035409A1 (en) * | 2009-09-23 | 2011-03-31 | Jvl Corporation | Music selection system |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8122013B1 (en) | 2006-01-27 | 2012-02-21 | Google Inc. | Title based local search ranking |
US8364669B1 (en) * | 2006-07-21 | 2013-01-29 | Aol Inc. | Popularity of content items |
US7860886B2 (en) | 2006-09-29 | 2010-12-28 | A9.Com, Inc. | Strategy for providing query results based on analysis of user intent |
US9323836B2 (en) | 2008-02-11 | 2016-04-26 | Popular Metrics, Inc. | Internet based method and system for ranking artists using a popularity profile |
EP2332137A2 (en) * | 2008-08-14 | 2011-06-15 | TuneWiki Limited | A method and a system for real time music playback syncronization, dedicated players, locating audio content, following most listened-to lists and phrase searching for sing-along |
US9514476B2 (en) | 2010-04-14 | 2016-12-06 | Viacom International Inc. | Systems and methods for discovering artists |
US8843500B2 (en) * | 2012-06-19 | 2014-09-23 | Microsoft Corporation | Automatically generating music marketplace editorial content |
-
2012
- 2012-11-16 US US13/679,033 patent/US9626435B2/en not_active Expired - Fee Related
-
2013
- 2013-11-08 CN CN201380070581.XA patent/CN105164671B/zh active Active
- 2013-11-08 WO PCT/US2013/069100 patent/WO2014078183A2/en active Application Filing
- 2013-11-08 EP EP13854230.3A patent/EP2920716A2/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101828393A (zh) * | 2007-08-24 | 2010-09-08 | 谷歌公司 | 基于媒体的推荐 |
EP2228739A2 (en) * | 2009-03-12 | 2010-09-15 | Comcast Interactive Media, LLC | Ranking search results |
WO2011035409A1 (en) * | 2009-09-23 | 2011-03-31 | Jvl Corporation | Music selection system |
Also Published As
Publication number | Publication date |
---|---|
US20140143238A1 (en) | 2014-05-22 |
WO2014078183A3 (en) | 2014-10-16 |
CN105164671A (zh) | 2015-12-16 |
US9626435B2 (en) | 2017-04-18 |
WO2014078183A2 (en) | 2014-05-22 |
EP2920716A2 (en) | 2015-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9830390B2 (en) | Related entities | |
US9652539B2 (en) | Popularity of content items | |
He et al. | Crawling deep web entity pages | |
US9928296B2 (en) | Search lexicon expansion | |
CN105247517B (zh) | 混合语料库环境中的排名信号 | |
US8825657B2 (en) | Systems and methods for creating, navigating, and searching informational web neighborhoods | |
US20080208847A1 (en) | Relevance ranking for document retrieval | |
CN108090111B (zh) | 用于搜索结果的动画摘录 | |
TW201214166A (en) | Processing of categorized product information cross reference to other applications | |
US20140317105A1 (en) | Live recommendation generation | |
US20090076927A1 (en) | Distinguishing accessories from products for ranking search results | |
TWI398786B (zh) | 產生以專業知識為基礎的搜尋結果之系統、方法及其電腦可讀取媒體 | |
CN106415537A (zh) | 本地应用的触发和排名 | |
CN105164671B (zh) | 在信息检索系统中使用层级评分以进行消歧 | |
CN104094262A (zh) | 搜索结果分类 | |
CN105765573A (zh) | 网站通信量优化方面的改进 | |
Schedl et al. | A music information system automatically generated via web content mining techniques | |
CN101114287A (zh) | 为数据生成浏览路径的方法和装置及浏览数据的方法 | |
CN108460162A (zh) | 推荐信息处理方法、装置、设备及介质 | |
CN106919588A (zh) | 一种应用程序搜索系统及方法 | |
Bischoff et al. | Bridging the gap between tagging and querying vocabularies: Analyses and applications for enhancing multimedia IR | |
Schedl et al. | Assigning and Visualizing Music Genres by Web-based Co-Occurrence Analysis. | |
US20150127657A1 (en) | Method and Computer for Indexing and Searching Structures | |
CN103186650B (zh) | 一种搜索方法和装置 | |
US9779140B2 (en) | Ranking signals for sparse corpora |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: American California Applicant after: Google limited liability company Address before: American California Applicant before: Google Inc. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |