CN101882149A - 重排序和提高搜索结果的相关性 - Google Patents

重排序和提高搜索结果的相关性 Download PDF

Info

Publication number
CN101882149A
CN101882149A CN2010101904753A CN201010190475A CN101882149A CN 101882149 A CN101882149 A CN 101882149A CN 2010101904753 A CN2010101904753 A CN 2010101904753A CN 201010190475 A CN201010190475 A CN 201010190475A CN 101882149 A CN101882149 A CN 101882149A
Authority
CN
China
Prior art keywords
search
search results
conceptual network
unit
inquiry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010101904753A
Other languages
English (en)
Other versions
CN101882149B (zh
Inventor
希亚姆·卡普尔
吉格纳舒·帕里克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fly upward Management Co., Ltd
Original Assignee
Yahoo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Inc filed Critical Yahoo Inc
Publication of CN101882149A publication Critical patent/CN101882149A/zh
Application granted granted Critical
Publication of CN101882149B publication Critical patent/CN101882149B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Abstract

本发明提出了一种用于重排序和提高互联网搜索的结果的相关性的方法。首先将搜索查询分解为多个独立的单元。每个单元对应于一个或多个表示自然概念的词。对概念网络进行分析,以定位与搜索查询中的单元相关的概念。从概念网络选出特定概念。对每个选出的概念执行独立的互联网搜索。将从这些搜索得出的搜索结果与原始搜索查询中的单元进行比较,并根据它们与原始搜索查询的相关性对搜索结果进行分级。

Description

重排序和提高搜索结果的相关性
本申请是国际申请日为2006年3月10日、申请号为200680007639.6(国际申请号PCT/US2006/008961)、题为“重排序和提高搜索结果的相关性”的发明专利申请的分案申请。
技术领域
本发明涉及重排序和提高互联网搜索结果的相关性的技术,更具体地涉及使用概念网络(concept network)提高互联网搜索结果的相关性并对结果进行重排序的技术。
背景技术
随着互联网的出现和用户可以通过万维网(网络)访问的网页和媒体内容的增多,需要为用户提供一种从网络过滤和获取所需信息的改进方法。已开发出了多种搜索系统和程序来满足用户获取所需信息的需求。通过Yahoo!、Google等网站可以接触到这类技术的实例。通常,用户输入查询,搜索程序返回一个或多个与查询相关的搜索结果(链接)。返回的搜索结果可能与用户实际上所要查找的内容非常相关或完全无关。搜索结果与查询的相关性部分地取决于实际输入的查询和所使用的搜索系统(基础收集系统)的稳健性。
人类并不能自然地按照查询的方式来思考。它们部分地是由查询搜索引擎和查找图书馆目录的需求强加给我们的。人类也不能自然地按照单个词的方式来思考。人类是按照自然概念的方式来进行思考的。
搜索查询通常包括定义一个或多个概念的几个词。通常,搜索查询中的一些词比其它词与定义概念更为相关。搜索引擎无法获知搜索查询中的哪些词与用户的意图最为相关。结果,搜索引擎常常会找到许多与用户的意图无关的搜索结果。
搜索引擎通常根据搜索结果与搜索查询的相关性来对搜索结果进行排序。搜索查询经常包括多个会导致搜索引擎返回无关的搜索结果的冗余项。搜索引擎经常会将这些无关的搜索结果排列在搜索结果列表靠前的位置。
因此,需要提出一种提高搜索结果与用户的最初意图的相关性的互联网搜索方法。
发明内容
本发明提供了一种提高互联网搜索结果与用户意图的相关性的方法。本发明还提供了一种通过确定搜索结果与搜索查询中的单元、单元联合、及单元扩展的关联来对搜索查询的搜索结果进行重排序的方法。
首先,将搜索查询分解为多个独立的单元。每个单元对应于一个或多个表示自然概念的词。联合单元是同时出现在搜索查询中、但不足够相关以形成新单元的两个或多个单元。扩展单元是同时出现在搜索查询中、并足够相关以形成新单元的两个或多个单元。
本发明对概念网络进行分析,以定位与搜索查询中的单元相关的概念。概念网络将彼此相关的概念链接起来。根据特定概念与查询中的单元的关系,从概念网络中选出特定概念。
根据一个实施例,基于概念在之前提交的搜索查询中出现的频繁程度从概念网络选出概念。从选自概念网络的概念中选择在之前的搜索查询中出现频率较高的概念。对从概念网络中选出的一个或多个相关概念执行单独的互联网搜索。
将每次单独搜索得到的搜索结果与搜索查询进行比较,并根据它们与查询的相关性进行分类。可以基于搜索结果与最初的搜索查询中的单元、联合单元、及扩展单元的相关性对搜索结果进行分类。
通过下面的详细描述和附图,本发明的其它目的、特征、和优点将变得显而易见,其中,贯穿所有的附图,相同的参考标号表示相似的特征。
附图说明
图1A是能够实现本发明实施例的互联网通信系统的示意图;
图1B是能够实现本发明实施例的互联网搜索系统的示意图;
图2是示出根据本发明实施例的提高互联网搜索结果的相关性的方法的流程图;以及
图3A至3D示出了根据本发明的能够用于处理搜索查询的概念网络的实例。
具体实施方式
图1A示出了根据本发明实施例的包括客户系统120的信息检索和通信网络100的总体视图。在计算机网络100中,客户系统120可以通过互联网140或其它通信网络(例如,通过任意的LAN或WAN连接)与多个服务器系统1501至150N通信。例如,客户系统120可以与搜索结果服务器160通信。如本文所述,根据本发明的客户系统120用于与服务器系统1501至150N和160中的任意一个通信,以访问、接收、检索、以及显示媒体内容和诸如网页和网站的其他信息。
图1A所示系统中的多个元件包括不必在这里详细说明的传统公知元件。例如,客户系统120可以包括桌上型个人计算机、工作站、膝上型电脑、PDA、行动电话、或任何WAP使能(WAP-enabled)装置、或任何其它的能够直接或间接地连接互联网的计算装置。客户系统120通常运行允许客户系统120的用户访问、处理、及浏览其能够通过互联网140从服务器系统1501至150N获取的信息和页面的HTTP客户程序,例如,微软的Internet ExplorerTM浏览器、Netscape NavigatorTM浏览器、Mozilla TM浏览器、Opera浏览器,或移动电话、PDA、或其它无线装置中的WAP使能浏览器等浏览程序。
客户系统120通常还包括一个或多个诸如键盘、鼠标、触摸屏、笔等的用户接口装置122,用于与由显示器(例如,监视屏、LCD显示器等)上的浏览器提供的图形用户界面(GUI)、以及由服务器系统1501至150N及其它服务器提供的页面、表格、及其它信息进行交互。本发明适用于互联网(称为特定全球互联网)。但是,应该理解,可以使用其它网络来代替互联网或将其他网络和互联网一起使用,例如,内联网、外联网、虚拟专用网络(VPN)、非基于TCP/IP的网络、以及任何LAN或WAN等。
根据一个实施例,客户系统120及其所有的组成部分都是能够使用包括计算机代码的应用程序进行配置的运算符。其中,可以使用诸如Intel PentiumTM处理器、AMD AthlonTM处理器等、或多个处理器的中央处理单元来运行计算机代码。优选地,将用于操作和配置本文中描述的用于通讯、处理、及显示数据和媒体内容的客户系统120的计算机代码下载并存储在硬盘上,但是也可以将整个程序代码或其多个部分存储在任何公知的其它易失性、或非易失性存储介质或装置(例如,ROM或RAM)中,或设置在其它任何可以存储程序代码的介质(例如,压缩磁盘(CD)介质、数字多功能磁盘(DVD)介质、软盘等)上。
另外,可以使用任何公知的通信介质和协议(例如,TCP/IP、HTTP、HTTPS、以太网等),通过公知的互联网或其他传统的网络连接(例如,外联网、VPN、LAN等)将整个程序代码或其多个部分从软件源(例如,服务器系统1501至150N)传送并下载至客户系统120。还应理解,用于实现本发明的多个方面的计算机代码可以通过任何能够在客户系统上执行的程序语言实现,例如,通过C、C+、HTML、XML、Java、JavaScript、任何scripting语言(例如VBScript)实现。在一些实施例中,不向客户系统120下载任何代码,而是通过服务器来执行所需的代码,或执行客户系统120已经存在的代码。
根据一个实施例,在客户系统120上执行的客户应用程序(由模块125表示)包括用于控制客户系统120及其组件与服务器系统1501至150N和160进行通信以及处理和显示从服务器系统接收到的数据内容的指令。另外,客户应用程序模块125包括用于处理数据和媒体内容的各种软件模块。例如,应用程序模块125可以包括:一个或多个搜索模块126,用于处理搜索请求和搜索结果数据;用户界面模块127,用于以文本、数据帧、以及活动窗口(例如,浏览器窗口和对话框)的形式呈现数据和媒体内容;以及应用程序接口模块128,用于与客户系统120上执行的各种应用程序连接和通信。另外,界面模块127可以包括浏览器,例如,客户系统120上设置的默认浏览器或其他浏览器。
根据一个实施例,搜索结果服务器160用于向客户系统120提供搜索结果数据和媒体内容,服务器系统150用于(例如)响应于从服务器系统160提供的搜索结果页面中选出的链接而向客户系统120提供诸如网页的数据和媒体内容。一个实施例中的服务器系统160涉及用于从万维网收集信息和用于将一个或多个索引与(例如)一个或多个页面以及页面的链接等连接起来的收集方法。该收集方法包括自动网页爬虫(web crawler)、蜘蛛(spider)等,也包括手动或半自动的用于在分级结构中对网页进行分类和排序的分类算法和界面。在某些方面,服务器160还配置有用于对网页进行处理和排序的搜索相关算法,例如,Google的PageRank算法。服务器160还优选地用于以查询日志文件的形式记录搜索查询。
一方面,服务器160用于响应于从客户系统(特别是搜索模块126)接收的各种搜索请求而提供数据。服务器系统150和160可以是单个组织的一部分,例如,Yahoo!Inc.提供给用户的分布式服务器系统(distributed server system),或者它们可以是完全不同的组织的部分。服务器系统150和服务器系统160分别包括至少一个服务器和相关的数据库系统,并且可以包括多个服务器和相关的数据库系统,并且虽然以单个框示出,但是在地理上可以是分开的。例如,服务器系统160的所有服务器可以彼此紧邻(例如,位于一个单独的建筑物或校园内的服务器区中),或者可以彼此分布得很远(例如,位于城市A中的一个或多个服务器以及位于城市B中的一个或多个服务器)。本文中使用的术语“服务器系统”通常包括本地分布的或越过一个或多个地理位置的一个或多个逻辑上和/或物理上连接的服务器。另外,术语“服务器”通常包括本领域公知的计算机系统、相关的存储系统、以及数据库应用程序。本文中的术语“服务器”和“服务器系统”可以交换使用。
根据一个实施例,服务器160包括响应于从容户系统120接收的搜索查询向用户提供搜索结果的算法。根据本发明的实施例,服务器系统160用于提高从客户系统120接收的搜索查询的相关性(以下将详细讨论)。
图1B示出了实现本发明实施例的互联网搜索系统的视图。将搜索查询170传送至搜索引擎175以启动互联网搜索(例如,网络搜索)。搜索引擎175从搜索语料库(web corpus)190定位匹配搜索查询170的网络内容。搜索语料库190表示可以通过万维网、互联网、内联网、本地网、及广域网访问的内容。
搜索引擎175从搜索语料库190检索匹配搜索查询170的内容,并将匹配的内容(即,搜索结果)传送至页面汇编程序180。页面汇编程序180根据搜索结果与搜索查询的相关性对搜索结果进行分类,并以便于向用户显示的顺序对结果进行汇编。在搜索结果显示屏幕185中向用户显示最相关的搜索结果。
本发明提供了提高互联网搜索结果与用户意图的相关性的方法。图2示出了根据本发明实施例的方法的实例。应该理解,图2所示的具体步骤并不用于限制本发明的范围。对图2所示方法的各种修改都处于本发明的范围之内。
用户可以通过输入搜索查询启动互联网搜索(例如,网络搜索)。如图2所示,本发明的系统在步骤221接收来自用户的搜索查询。在步骤222,将搜索查询分解成多个单元。
可以将搜索查询分解为多个组成部分(称作单元)。查询处理引擎使用统计学方法将搜索查询分解为多个单元。单元是一个或多个词的序列,通常对应于自然概念,如“纽约市”或“捕食的鸟”。从搜索查询生成概念单元的方法的进一步细节在未决的、共同转让给(co-pending and commonly-assigned)Shyam Kapur的、于2003年11月12日提交的美国专利申请10/713,576中讨论,其内容结合于此作为参考。
概念网络是用于说明相关概念之间的关系的结构。搜索查询中的每个单元都位于概念网络中。概念网络用于识别与搜索查询单元相关的概念。当搜索查询单元已经位于概念网络中之后,在步骤223,选出与该单元相关的概念网络中的概念。
概念网络可以使用许多方法来连接相关概念。根据本发明的一个实施例,概念网络对作为同义词的概念、具有更具体意义的概念、具有更一般意义的概念、概念的具体实际生活实例、以及发音类似于概念或使用一些相同词的公知术语或名字进行连接。
使用图3A所示的实例,如果搜索查询中的单元是摩天楼,则系统在概念网络中定位概念“摩天楼”并识别相关概念。图3A示出了用于“摩天楼”的概念网络的实例。在这个概念网络中,将概念“摩天楼”连接至诸如“建筑”和“大厦”的更一般的术语。还将“摩天楼”连接至相似的术语“高层建筑”和摩天楼的著名实例“帝国大厦”。
根据另一个实施例,分析先前提交的搜索查询以确定概念网络中的相关概念在先前提交的搜索查询中同时出现的频繁程度。可以通过连接在先前提交的搜索查询中同时出现的概念来构建概念网络。在步骤223,从概念网络中选出在之前提交的搜索查询中同时出现最频繁的相关概念。将所有之前提交的搜索查询都存储在存储器中,用作分析。
概念网络可以基于同时出现在所有用户提交的查询中的概念。作为另一个实例,概念网络或其任何部分可以是连接一个特定用户(或一组用户)提交的搜索查询中同时出现的概念的基于会话(session)的概念网络。在步骤223,选出在之前提交的搜索查询中同时出现最频繁的相关概念。
图3B示出了基于会话的概念网络的实例。在图3B中,由于特定用户在过去已经提交了将“美洲虎”连接至汽车相关概念的查询,所以将主概念“美洲虎”连接至相关概念“豪华汽车”、“XYZ汽车公司”、及“车赛”。不同的用户(例如)可能提交了表示他对美洲虎动物感兴趣的在先查询。对于该用户,本发明创建将“美洲虎”连接至诸如猫、动物园、或狩猎旅行的动物相关概念的不同概念网络。
根据本发明的另一个实施例,概念网络可以将一个或多个用户在特定时间内递交的先前查询中同时出现最频繁的概念连接起来。图3C示出了时间限制概念网络的实例。在该实例中,将概念“JaneDoe”连接至相关概念“Jane Doe现场演出”、“Jane Doe音乐CD”、及“乐器音乐”。这些相关概念是在特定时间间隔内在先前的搜索查询中与“Jone Doe”同时出现最频繁的概念。特定时间间隔可以是(例如)过去的24小时、过去的一周、或过去的一个月。
在图3C的实例中,概念网络是以基于在过去24小时中最流行的搜索查询的与名为Joe Doe的歌手相关的概念为基础的。在接下来的24小时内,可以将包括“Jane Doe”的最流行的搜索查询与具有相同名字的政治家相关联。图3D示出了如何将用于“Jane Doe”的概念网络变为包括到相关概念“Jane Doe美国参议员”和“Doe立法提案权”的连接的概念网络。更新概念网络,以使其包括在最近的具有单元“Jane Doe”的查询中出现最频繁的概念。
根据本发明的实施例,从概念网络中选出最紧密相关的概念。最紧密相关的概念可以是(例如)直接连接至概念网络中的主概念的所有概念。其它概念可以通过直接连接的概念之一间接连接至主概念。图3C示出了通过“乐器音乐”连接的概念“Jane Doe”和“小提琴”之间的间接连接的实例。
图3A至图3D仅示出了连接概念网络中的概念的关系的几个实例。提供的这些实例仅用于阐述的目的,而不用于限制本发明的范围。概念网络中的多个概念之间也可能存在许多其它的关系。
在步骤223执行的选择处理可以基于任意标准。例如,可以在步骤223从概念网络中选出出现最频繁的前5个相关概念。在另一个实例中,在步骤223选出出现最频繁的前50%或前25%的相关概念。根据本发明,可以使用许多其它的选择方法。本文中讨论的实例用于阐述本发明的原理,而不用于限制本发明的范围。
在步骤224,对在步骤223选出的相关概念中的一个或多个执行独立的互联网搜索(例如,网络搜索)。例如,如果搜索查询中存在4个单元,并且在步骤223为每个单元选出了一个相关概念,则在步骤224执行4个独立的互联网搜索。根据一个实施例,如果在步骤223选出了大量的相关概念,则只对这些概念的子集执行互联网搜索。例如,如果在步骤223选出了20个概念,则只对与搜索查询中的所有单元相关的前5个概念执行互联网搜索。
搜索引擎175可以对在步骤223选出的概念执行独立的互联网搜索。可以使用任何公知的互联网搜索方法(例如,使用Google或Yahoo!搜索方法)执行互联网搜索。
对搜索引擎175在步骤224执行的单独互联网搜索中的每一个检索单独的搜索结果组。搜索引擎175通常根据搜索结果与每个相关概念的相关性来对每个互联网搜索的搜索结果进行分类。
在步骤225,本发明对在步骤224执行的互联网搜索中检索到的搜索结果进行重排序。可以将互联网搜索中检索到的搜索结果与对整个原始搜索查询执行的互联网搜索中检索到的搜索结果组合在一起。
将每个搜索结果与原始搜索查询中的单元、单元联合、及单元扩展进行比较。基于搜索结果与原始搜索查询的相关性,为每个搜索结果分配层级或分数。
通过对搜索结果和搜索查询中的单元、联合单元、及扩展单元进行比较,可以确定搜索结果与原始搜索查询的相关性。联合单元是同时出现在搜索查询中、但不足够相关而形成新单元的两个或多个单元。扩展单元是同时出现在搜索查询中、且足够相关而形成新单元的两个或多个单元。
分析搜索结果,以确定来自搜索查询的单元、单元联合、及单元扩展在搜索结果中出现的频率。基于单元、联合单元、和/或扩展单元的实例在搜索结果中出现的频率(或相对频率),为搜索结果分配新的分数。给包括较多的单元、联合单元、和/或扩展单元的实例的搜索结果分配较高的分数。
根据本发明的实施例,对在互联网搜索中检索到的搜索结果进行重排序。根据重排序处理,将重排序分数分配给每个搜索结果。例如,可以通过将搜索引擎175分配的原始层级分数与基于搜索结果中的查询单元、联合单元、及扩展单元的频率而计算出的新分数相乘,来计算重排列分数。然后基于重排序分数对搜索结果进行分类。
在步骤225中,给从某些类型的搜索查询中接收的搜索结果分配较高的分数。例如,可以对在导航查询(navigational query)中检索到的搜索结果分配高于在其它类型的查询中检索到的搜索结果的层级。给导航查询更高的分数是基于导航查询通常能够检索到更为相关的搜索结果的公识。
一旦基于搜索结果与原始搜索查询的相关性而为每个搜索结果分配了重排序分数,则在步骤225根据从最高的重排序分数到最低的重排序分数的顺序对搜索结果进行分类。最高的重排序分数表示该内容与原始搜索查询最为相关,最低的重排序分数表示该内容与原始搜索查询最不相关。
本发明通过对与搜索查询中的单元相关的概念匹配的内容进行定位,提高了在互联网搜索中检索到的搜索结果的相关性。如上所述,从概念网络中选出多个概念。然后,将搜索结果与来自基于整个搜索查询的标准互联网搜索的搜索结果相结合,并根据搜索结果与搜索查询的相关性对搜索结果进行分类。
通过使用概念网络提高搜索结果的数量,使得至少一部分搜索结果很可能与搜索查询以及用户意图高度相关,而不论用户意图是什么。因为基于搜索结果与查询的相关性来对搜索结果进行分类,所以最先显示最相关的结果。使用这些方法,本发明能够识别出大量的相关搜索结果。
尽管此处参考本发明的具体实施例来描述本发明,但是可以对本发明进行大量的改变、变化、及替换。在一些实例中,在不偏离上述的本发明的范围的条件下,可以不使用相应特征而实现本发明的一些特征。因此,在不偏离本发明的实质范围和精神的条件下,可以对本文中公开的具体配置和方法进行多种改变。本发明不限于所公开的具体实施例,而可以包括所有落入权利要求范围内的实施例和等价物。

Claims (11)

1.一种提高在搜索中检索到的搜索结果的相关性的方法,所述方法包括:
识别搜索查询中的一个或多个单元;
选出概念网络中的与所述搜索查询中的所述一个或多个单元相关的一个或多个特定概念,其中所述概念网络包括多个概念;
其中,所述一个或多个特定概念少于所述概念网络中的全部概念;
基于所述一个或多个特定概念中的至少一个执行搜索,以检索出多个搜索结果,其中,所述多个搜索结果中的每一个搜索结果都与排序有关;以及
基于所述多个搜索结果与所述搜索查询的相关性,对所述多个搜索结果进行分类。
2.根据权利要求1所述的方法,其中,选出所述概念网络中的所述一个或多个特定概念包括:
从所述概念网络中选出相对于所述概念网络中的其他概念而言,在在先提交的搜索查询中出现更为频繁的一个或多个概念。
3.根据权利要求1所述的方法,其中,选出所述概念网络中的所述一个或多个特定概念包括:
从所述概念网络中选出与所述一个或多个单元最为相关的预订数目的概念。
4.根据权利要求1所述的方法,其中,选出所述概念网络中的所述一个或多个特定概念包括:
从所述概念网络中选出直接链接至所述一个或多个单元的所有概念。
5.根据权利要求1所述的方法,其中,选出所述概念网络中的所述一个或多个特定概念包括:
从所述概念网络中选出与所述一个或多个单元是同义词的一个或多个特定概念。
6.根据权利要求1所述的方法,其中,选出所述概念网络中的所述一个或多个特定概念包括从所述概念网络中选出直接链接至所述一个或多个单元的至少一个概念。
7.根据权利要求1所述的方法,其中,对在所述搜索中检索到的所述多个搜索结果进行重排序还包括:
基于所述搜索查询中的所述一个或多个单元在所述多个搜索结果的各个搜索结果中出现的频繁程度,为所述多个搜索结果中的各个搜索结果分配重排序分数。
8.根据权利要求7所述的方法,其中,每个所述重排序分数包括对所述一个或多个概念中的每个概念执行搜索的搜索引擎所分配的层级分数的贡献。
9.根据权利要求1所述的方法,其中,对在所述搜索中检索到的所述多个搜索结果进行重排序还包括:
基于所述搜索查询中的一个或多个扩展单元在所述多个搜索结果的各个搜索结果中出现的频繁程度,为所述多个搜索结果中的各个搜索结果分配重排序分数。
10.根据权利要求9所述的方法,其中,对在所述搜索中检索到的所述多个搜索结果进行重排序还包括:
基于所述重排序分数的值,对所述搜索结果进行分类。
11.根据权利要求1所述的方法,其中,对在所述搜索中检索到的所述多个搜索结果进行重排序还包括:
为从导航查询检索到的搜索结果分配高于在其它类型的查询中检索到的搜索结果的层级。
CN201010190475.3A 2005-03-10 2006-03-10 重排序和提高搜索结果的相关性 Active CN101882149B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/078,685 US7574436B2 (en) 2005-03-10 2005-03-10 Reranking and increasing the relevance of the results of Internet searches
US11/078,685 2005-03-10
CNA2006800076396A CN101137985A (zh) 2005-03-10 2006-03-10 重排序和提高搜索结果的相关性

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800076396A Division CN101137985A (zh) 2005-03-10 2006-03-10 重排序和提高搜索结果的相关性

Publications (2)

Publication Number Publication Date
CN101882149A true CN101882149A (zh) 2010-11-10
CN101882149B CN101882149B (zh) 2016-06-01

Family

ID=36603582

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA2006800076396A Pending CN101137985A (zh) 2005-03-10 2006-03-10 重排序和提高搜索结果的相关性
CN201010190475.3A Active CN101882149B (zh) 2005-03-10 2006-03-10 重排序和提高搜索结果的相关性

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNA2006800076396A Pending CN101137985A (zh) 2005-03-10 2006-03-10 重排序和提高搜索结果的相关性

Country Status (6)

Country Link
US (1) US7574436B2 (zh)
EP (1) EP1856641A1 (zh)
JP (1) JP5114380B2 (zh)
KR (2) KR20120065423A (zh)
CN (2) CN101137985A (zh)
WO (1) WO2006099331A1 (zh)

Families Citing this family (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7606793B2 (en) 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
US7761448B2 (en) 2004-09-30 2010-07-20 Microsoft Corporation System and method for ranking search results using click distance
US7827181B2 (en) 2004-09-30 2010-11-02 Microsoft Corporation Click distance determination
US7739277B2 (en) 2004-09-30 2010-06-15 Microsoft Corporation System and method for incorporating anchor text into ranking search results
US7716198B2 (en) 2004-12-21 2010-05-11 Microsoft Corporation Ranking search results using feature extraction
US7792833B2 (en) 2005-03-03 2010-09-07 Microsoft Corporation Ranking search results using language types
US7590796B2 (en) * 2006-07-31 2009-09-15 Metaram, Inc. System and method for power management in memory systems
US10592930B2 (en) 2005-09-14 2020-03-17 Millenial Media, LLC Syndication of a behavioral profile using a monetization platform
US7676394B2 (en) 2005-09-14 2010-03-09 Jumptap, Inc. Dynamic bidding and expected value
US7577665B2 (en) * 2005-09-14 2009-08-18 Jumptap, Inc. User characteristic influenced search results
US10911894B2 (en) 2005-09-14 2021-02-02 Verizon Media Inc. Use of dynamic content generation parameters based on previous performance of those parameters
US9703892B2 (en) 2005-09-14 2017-07-11 Millennial Media Llc Predictive text completion for a mobile communication facility
US8688671B2 (en) 2005-09-14 2014-04-01 Millennial Media Managing sponsored content based on geographic region
US20110313853A1 (en) 2005-09-14 2011-12-22 Jorey Ramer System for targeting advertising content to a plurality of mobile communication facilities
US10038756B2 (en) 2005-09-14 2018-07-31 Millenial Media LLC Managing sponsored content based on device characteristics
US8515401B2 (en) 2005-09-14 2013-08-20 Jumptap, Inc. System for targeting advertising content to a plurality of mobile communication facilities
US10360253B2 (en) 2005-10-26 2019-07-23 Cortica, Ltd. Systems and methods for generation of searchable structures respective of multimedia data content
US8312031B2 (en) 2005-10-26 2012-11-13 Cortica Ltd. System and method for generation of complex signatures for multimedia data content
US11216498B2 (en) 2005-10-26 2022-01-04 Cortica, Ltd. System and method for generating signatures to three-dimensional multimedia data elements
US11620327B2 (en) 2005-10-26 2023-04-04 Cortica Ltd System and method for determining a contextual insight and generating an interface with recommendations based thereon
US10698939B2 (en) 2005-10-26 2020-06-30 Cortica Ltd System and method for customizing images
US9256668B2 (en) 2005-10-26 2016-02-09 Cortica, Ltd. System and method of detecting common patterns within unstructured data elements retrieved from big data sources
US10180942B2 (en) 2005-10-26 2019-01-15 Cortica Ltd. System and method for generation of concept structures based on sub-concepts
US9396435B2 (en) 2005-10-26 2016-07-19 Cortica, Ltd. System and method for identification of deviations from periodic behavior patterns in multimedia content
US8326775B2 (en) 2005-10-26 2012-12-04 Cortica Ltd. Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof
US9466068B2 (en) 2005-10-26 2016-10-11 Cortica, Ltd. System and method for determining a pupillary response to a multimedia data element
US9477658B2 (en) 2005-10-26 2016-10-25 Cortica, Ltd. Systems and method for speech to speech translation using cores of a natural liquid architecture system
US10535192B2 (en) 2005-10-26 2020-01-14 Cortica Ltd. System and method for generating a customized augmented reality environment to a user
US10585934B2 (en) 2005-10-26 2020-03-10 Cortica Ltd. Method and system for populating a concept database with respect to user identifiers
US9558449B2 (en) 2005-10-26 2017-01-31 Cortica, Ltd. System and method for identifying a target area in a multimedia content element
US10635640B2 (en) 2005-10-26 2020-04-28 Cortica, Ltd. System and method for enriching a concept database
US10621988B2 (en) 2005-10-26 2020-04-14 Cortica Ltd System and method for speech to text translation using cores of a natural liquid architecture system
US9372940B2 (en) 2005-10-26 2016-06-21 Cortica, Ltd. Apparatus and method for determining user attention using a deep-content-classification (DCC) system
US11032017B2 (en) 2005-10-26 2021-06-08 Cortica, Ltd. System and method for identifying the context of multimedia content elements
US8266185B2 (en) * 2005-10-26 2012-09-11 Cortica Ltd. System and methods thereof for generation of searchable structures respective of multimedia data content
US10193990B2 (en) 2005-10-26 2019-01-29 Cortica Ltd. System and method for creating user profiles based on multimedia content
US11003706B2 (en) 2005-10-26 2021-05-11 Cortica Ltd System and methods for determining access permissions on personalized clusters of multimedia content elements
US8818916B2 (en) 2005-10-26 2014-08-26 Cortica, Ltd. System and method for linking multimedia data elements to web pages
US9953032B2 (en) 2005-10-26 2018-04-24 Cortica, Ltd. System and method for characterization of multimedia content signals using cores of a natural liquid architecture system
US9747420B2 (en) 2005-10-26 2017-08-29 Cortica, Ltd. System and method for diagnosing a patient based on an analysis of multimedia content
US9529984B2 (en) 2005-10-26 2016-12-27 Cortica, Ltd. System and method for verification of user identification based on multimedia content elements
US7917519B2 (en) * 2005-10-26 2011-03-29 Sizatola, Llc Categorized document bases
US10380267B2 (en) 2005-10-26 2019-08-13 Cortica, Ltd. System and method for tagging multimedia content elements
US10380623B2 (en) 2005-10-26 2019-08-13 Cortica, Ltd. System and method for generating an advertisement effectiveness performance score
US11361014B2 (en) 2005-10-26 2022-06-14 Cortica Ltd. System and method for completing a user profile
US11403336B2 (en) 2005-10-26 2022-08-02 Cortica Ltd. System and method for removing contextually identical multimedia content elements
US10191976B2 (en) 2005-10-26 2019-01-29 Cortica, Ltd. System and method of detecting common patterns within unstructured data elements retrieved from big data sources
US9767143B2 (en) 2005-10-26 2017-09-19 Cortica, Ltd. System and method for caching of concept structures
US10614626B2 (en) 2005-10-26 2020-04-07 Cortica Ltd. System and method for providing augmented reality challenges
US10848590B2 (en) 2005-10-26 2020-11-24 Cortica Ltd System and method for determining a contextual insight and providing recommendations based thereon
US10691642B2 (en) 2005-10-26 2020-06-23 Cortica Ltd System and method for enriching a concept database with homogenous concepts
US11604847B2 (en) 2005-10-26 2023-03-14 Cortica Ltd. System and method for overlaying content on a multimedia content element based on user interest
US9031999B2 (en) 2005-10-26 2015-05-12 Cortica, Ltd. System and methods for generation of a concept based database
US20070192313A1 (en) * 2006-01-27 2007-08-16 William Derek Finley Data search method with statistical analysis performed on user provided ratings of the initial search results
US7689554B2 (en) * 2006-02-28 2010-03-30 Yahoo! Inc. System and method for identifying related queries for languages with multiple writing systems
US7818315B2 (en) * 2006-03-13 2010-10-19 Microsoft Corporation Re-ranking search results based on query log
US8856145B2 (en) * 2006-08-04 2014-10-07 Yahoo! Inc. System and method for determining concepts in a content item using context
US7856350B2 (en) * 2006-08-11 2010-12-21 Microsoft Corporation Reranking QA answers using language modeling
US9037581B1 (en) 2006-09-29 2015-05-19 Google Inc. Personalized search result ranking
US8108410B2 (en) 2006-10-09 2012-01-31 International Business Machines Corporation Determining veracity of data in a repository using a semantic network
US20080086465A1 (en) * 2006-10-09 2008-04-10 Fontenot Nathan D Establishing document relevance by semantic network density
US10733326B2 (en) 2006-10-26 2020-08-04 Cortica Ltd. System and method for identification of inappropriate multimedia content
US7693833B2 (en) * 2007-02-01 2010-04-06 John Nagle System and method for improving integrity of internet search
US7672937B2 (en) * 2007-04-11 2010-03-02 Yahoo, Inc. Temporal targeting of advertisements
US7818320B2 (en) * 2007-05-31 2010-10-19 Yahoo! Inc. Enhanced search results based on user feedback relating to search result abstracts
US20090006311A1 (en) * 2007-06-28 2009-01-01 Yahoo! Inc. Automated system to improve search engine optimization on web pages
US8042053B2 (en) * 2007-09-24 2011-10-18 Microsoft Corporation Method for making digital documents browseable
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US7840569B2 (en) 2007-10-18 2010-11-23 Microsoft Corporation Enterprise relevancy ranking using a neural network
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US8832098B2 (en) * 2008-07-29 2014-09-09 Yahoo! Inc. Research tool access based on research session detection
US20100042610A1 (en) * 2008-08-15 2010-02-18 Microsoft Corporation Rank documents based on popularity of key metadata
US9836538B2 (en) * 2009-03-03 2017-12-05 Microsoft Technology Licensing, Llc Domain-based ranking in document search
US8577875B2 (en) * 2009-03-20 2013-11-05 Microsoft Corporation Presenting search results ordered using user preferences
US8661030B2 (en) * 2009-04-09 2014-02-25 Microsoft Corporation Re-ranking top search results
CN101996203A (zh) * 2009-08-13 2011-03-30 阿里巴巴集团控股有限公司 一种过滤网页信息的方法和系统
CN101650746B (zh) * 2009-09-27 2011-06-29 中国电信股份有限公司 一种对排序结果进行验证的方法和系统
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US9177057B2 (en) 2010-06-08 2015-11-03 Microsoft Technology Licensing, Llc Re-ranking search results based on lexical and ontological concepts
US20120030164A1 (en) * 2010-07-27 2012-02-02 Oracle International Corporation Method and system for gathering and usage of live search trends
CN102486781A (zh) * 2010-12-03 2012-06-06 阿里巴巴集团控股有限公司 一种搜索排序方法和装置
US8266141B2 (en) 2010-12-09 2012-09-11 Microsoft Corporation Efficient use of computational resources for interleaving
US9323833B2 (en) * 2011-02-07 2016-04-26 Microsoft Technology Licensing, Llc Relevant online search for long queries
CN102890683B (zh) * 2011-07-21 2016-01-20 阿里巴巴集团控股有限公司 信息提供方法及装置
US8930340B1 (en) 2011-09-20 2015-01-06 Google Inc. Blending content in an output
US20140250115A1 (en) * 2011-11-21 2014-09-04 Microsoft Corporation Prototype-Based Re-Ranking of Search Results
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
CN103279498A (zh) * 2013-05-08 2013-09-04 嘉兴电力局 基于组合条件的红外图谱快速查询方法
US9886507B2 (en) 2014-04-30 2018-02-06 International Business Machines Corporation Reranking search results using download time tolerance
US10318565B2 (en) * 2014-08-14 2019-06-11 Opisoftcare Ltd. Method and system for searching phrase concepts in documents
US10691760B2 (en) * 2014-11-06 2020-06-23 Microsoft Technology Licensing, Llc Guided search
US9697286B2 (en) 2015-03-16 2017-07-04 International Business Machines Corporation Shared URL content update to improve search engine optimization
US10108722B2 (en) 2015-04-29 2018-10-23 International Business Machines Corporation Stability score based re-ranking of search results
US10496691B1 (en) 2015-09-08 2019-12-03 Google Llc Clustering search results
US11275900B2 (en) * 2018-05-09 2022-03-15 Arizona Board Of Regents On Behalf Of Arizona State University Systems and methods for automatically assigning one or more labels to discussion topics shown in online forums on the dark web
US10956507B2 (en) * 2018-08-16 2021-03-23 Rovi Guides, Inc. Reaction compensated result selection

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08137898A (ja) * 1994-11-08 1996-05-31 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置
EP0856175A4 (en) * 1995-08-16 2000-05-24 Univ Syracuse SYSTEM AND METHOD FOR RETURNING MULTI-LANGUAGE DOCUMENTS USING A SEMANTIC VECTOR COMPARISON
US6076088A (en) * 1996-02-09 2000-06-13 Paik; Woojin Information extraction system and method using concept relation concept (CRC) triples
EP1032893B1 (en) * 1997-09-29 2004-07-28 WEBPLUS Ltd A multi-element confidence matching system and the method therefor
US6006225A (en) * 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
US6480843B2 (en) * 1998-11-03 2002-11-12 Nec Usa, Inc. Supporting web-query expansion efficiently using multi-granularity indexing and query processing
US6766320B1 (en) * 2000-08-24 2004-07-20 Microsoft Corporation Search engine with natural language-based robust parsing for user query and relevance feedback learning
AUPR208000A0 (en) * 2000-12-15 2001-01-11 80-20 Software Pty Limited Method of document searching
US7136845B2 (en) * 2001-07-12 2006-11-14 Microsoft Corporation System and method for query refinement to enable improved searching based on identifying and utilizing popular concepts related to users' queries
TW518483B (en) * 2001-08-14 2003-01-21 Ind Tech Res Inst Phrase verification method using probability-oriented confidence tag
US7343372B2 (en) * 2002-02-22 2008-03-11 International Business Machines Corporation Direct navigation for information retrieval
JP2004240769A (ja) 2003-02-06 2004-08-26 Canon Inc 情報検索装置
US7051023B2 (en) 2003-04-04 2006-05-23 Yahoo! Inc. Systems and methods for generating concept units from search queries
US20050131872A1 (en) * 2003-12-16 2005-06-16 Microsoft Corporation Query recognizer
US20060106769A1 (en) * 2004-11-12 2006-05-18 Gibbs Kevin A Method and system for autocompletion for languages having ideographs and phonetic characters
US7620628B2 (en) 2004-12-06 2009-11-17 Yahoo! Inc. Search processing with automatic categorization of queries
US7428533B2 (en) 2004-12-06 2008-09-23 Yahoo! Inc. Automatic generation of taxonomies for categorizing queries and search query processing using taxonomies

Also Published As

Publication number Publication date
US20060206476A1 (en) 2006-09-14
EP1856641A1 (en) 2007-11-21
JP2008533596A (ja) 2008-08-21
KR20070110868A (ko) 2007-11-20
CN101882149B (zh) 2016-06-01
KR101157349B1 (ko) 2012-07-03
CN101137985A (zh) 2008-03-05
JP5114380B2 (ja) 2013-01-09
WO2006099331A1 (en) 2006-09-21
KR20120065423A (ko) 2012-06-20
US7574436B2 (en) 2009-08-11

Similar Documents

Publication Publication Date Title
CN101882149A (zh) 重排序和提高搜索结果的相关性
US11669493B2 (en) Generating file usage information
US11036814B2 (en) Search engine that applies feedback from users to improve search results
CN1858733B (zh) 信息检索系统和检索方法
CN100507920C (zh) 一种基于用户行为信息的搜索引擎检索结果重排序方法
KR101171405B1 (ko) 검색 결과에서 배치 내용 정렬의 맞춤화
US8856163B2 (en) System and method for providing a user interface with search query broadening
KR100478019B1 (ko) 지역 정보 검색 결과 제공 방법 및 시스템
KR100645608B1 (ko) 사용자 방문 유알엘 로그를 이용한 정보 검색 서비스 제공 서버 및 그 방법
US20080005102A1 (en) Techniques for Targeting Information to Users
CN101111837A (zh) 查询自动分类的搜索处理
CN1677403A (zh) 用于自动优化搜索结果相关性的系统和方法
CN1930566A (zh) 用于使用倾向分析进行搜索查询处理的系统和方法
CN102687138A (zh) 搜索建议聚类和呈现
US8838643B2 (en) Context-aware parameterized action links for search results
US20090063959A1 (en) Document creation support system
KR20000063422A (ko) 인터넷 정보 검색 시 개인의 북마크 파일 데이터를기반으로 필터링하여 개인 맞춤 검색 결과를 도출하는 방법
WO2001055909A1 (en) System and method for bookmark management and analysis
Zubi et al. Using web logs dataset via web mining for user behavior understanding
KR100909561B1 (ko) 지역 정보 검색 결과 제공 시스템
JP5307781B2 (ja) 情報処理装置、方法及びプログラム
KR20110023308A (ko) 폭소노미와 링크 기반 랭킹 기법을 이용한 집단지성 기반 웹 페이지 검색 방법 및 이를 수행하기 위한 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1150208

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: FEIYANG MANAGEMENT CO., LTD.

Free format text: FORMER OWNER: YAHOO CORP.

Effective date: 20150126

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150126

Address after: The British Virgin Islands of Tortola

Applicant after: Fly upward Management Co., Ltd

Address before: American California

Applicant before: Yahoo Corp.

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1150208

Country of ref document: HK