CN102037464A - 具有最多点击的下一个对象的搜索结果 - Google Patents

具有最多点击的下一个对象的搜索结果 Download PDF

Info

Publication number
CN102037464A
CN102037464A CN2009801148253A CN200980114825A CN102037464A CN 102037464 A CN102037464 A CN 102037464A CN 2009801148253 A CN2009801148253 A CN 2009801148253A CN 200980114825 A CN200980114825 A CN 200980114825A CN 102037464 A CN102037464 A CN 102037464A
Authority
CN
China
Prior art keywords
search results
search
click
click information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009801148253A
Other languages
English (en)
Inventor
A·达斯丹
S·科雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Inc
Original Assignee
Yahoo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Inc filed Critical Yahoo Inc
Publication of CN102037464A publication Critical patent/CN102037464A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

在此披露了用于提供与搜索结果有关的下次点击信息的装置和方法。在某些实施方案中,在搜索和点击对象(如网页、图像、视频、音频文件)时,保留了点击信息。然后对于具体对象可以确定下次点击信息。这个下次点击信息然后可以提供给一个对象搜索启动者,以便该下次点击信息与搜索结果对象一起展现(例如,在搜索查询过程中)。

Description

具有最多点击的下一个对象的搜索结果
相关申请的交叉引用
本申请要求于2008年5月15日提交的美国申请序号12/120,993的优先权和权益,为了所有目将该申请通过引用全文结合在此。
技术领域
本发明的领域包括在计算机网络上提供的搜索服务。该领域尤其涉及响应于一个搜索词查询或者在另一种类型的对象浏览或搜索应用程序中提供搜索结果以及相关联的信息。
背景技术
近年来,互联网对于千百万用户已经成为一个主要信息来源。这些用户依靠互联网为他们搜索所感兴趣的信息。对于用户们而言,一种传统的搜索信息的方法是通过搜索服务的网页启动一个搜索查询。典型地,一个用户可以在该搜索网页上将一个或多个搜索词输入一个输入框中,并且然后基于该输入的搜索词启动一次搜索。响应于一个查询,一个网络搜索引擎一般返回多个搜索结果文档的一个有序列表。
图1是一个屏幕截图,示出了一个搜索网页100的一部分,其中已经对搜索词“orange”102启动了搜索查询并且基于这个搜索词“orange”102已经展示了一个搜索结果列表104。如图所示,搜索结果列表104中的每个条目典型地包括一个标题(例如,标题106a和106b)、一个统一资源定位符(URL)链接(例如,110a和110b)、以及一个摘要(例如,108a和108b)。摘要对用户给出了简明的概述,它表明为什么这个相关联的搜索结果文档与这个具体的查询有关的某种因素,并且标题可以提供该搜索结果文档的甚至更为简洁的说明。尽管标题和摘要一起提供了与一个具体搜索结果链接有关的信息,对于展现搜索结果提供改进的机制将会是有益的。
发明内容
因此,在此提供了用于提供与搜索结果有关的下次点击信息的装置和方法。在某些实施方案中,在搜索并且点击对象(如网页、图像、视频、音频文件)时,将点击信息保留起来。然后对于特定的对象可以确定下次点击信息。然后可以将这种下次点击信息提供给一个对象搜索启动者,这样将该下次点击信息与搜索结果对象(例如,在搜索查询的过程中)一起展现。
在一个实施方案中,在此披露了对搜索服务的用户提供搜索结果的一种方法。获得了下次点击信息,并且这种下次点击信息与多个下一个被点击的对象有关,这些下一个被点击的对象与多个搜索结果对象的至少一个子集中的每一个相关,这些搜索结果对象是响应于来自一位启动者的一个搜索请求而由搜索服务在一个计算机网络上已经获得的。这些下一个被点击的对象中的每一个都是由一个用户在访问了该相关的搜索结果对象之后下一次所选择的。将该下次点击信息与这些分级的搜索结果对象一起提供给启动者,这样该下次点击信息被展示为与该分级的搜索结果对象的至少一个子集中的每一个相关对象相邻。
在一个具体实现方式中,这些下一个被点击的对象以及这些搜索结果对象是网页。在另一个实施方案中,将所提供的下次点击信息相对于该搜索结果对象的至少一个子集划分为对象间信息和对象内信息。在另一个方面中,对于该搜索结果对象的至少一个子集,将所提供的下次点击信息区分为域间和域内信息。在又另一个方面中,所提供的下次点击信息是从一个单一用户获得的,该单一用户与该搜索请求的启动者是相同的。在另一个特征中,所提供的下次点击信息是从多个用户获得的,这些用户属于该搜索请求的启动者的一个社群网络。在另一个实施方案中,所提供的下次点击信息包括多个点击频率值。在另一个方面中,这些点击频率值被展现为一种可视映射图。在又另一个实施方案中,所提供的下次点击信息对于该分级的搜索结果对象的至少一个子集中的每一个是以对应于由增到减的点击次数的顺序展现的。在另一个特征中,这些下一个被点击的对象是多个广告链接。在又一个实施方案中,该下次点击信息包括可以与点击动作一起搜集的其他数据。一种该数据是在包含感兴趣的对象的页面上所花费的时间。在又一个方面中,搜索结果以及下次点击信息可以来自不同的来源,例如由同一家公司或不同公司拥有并运行的多个数据库。
在另一个实施方案中,本发明涉及具有至少一个处理器和一个存储器的装置。该处理器和/或存储器被配置为执行上述操作中的一个或多个。在另一个实施方案中,本发明涉及至少一种计算机可读存储介质,其上具有多条计算机程序指令,这些计算机程序指令被安排为执行上述操作中的一个或多个。
本发明的这些以及其他特征将在本发明的以下说明书和通过举例展示了本发明原理的附图中更为详细地展现。
附图说明
图1是一个屏幕截图,示出了一个搜索网页的一部分,其中已经启动了一个搜索查询并且基于这个搜索查询展现了一个搜索结果列表。
图2展示了一个示例性网络段,在该网络段中可以根据本发明的一个实施方案来实现本发明。
图3A展示了根据本发明的一个实现方式的一个示例用户搜索数据库。
图3B展示了根据本发明的一个实施方案的用于跟踪用户对象访问的一个示例用户网络数据库。
图4是一个流程图,展示了根据本发明的一个实施方案的一个下次点击管理程序。
图5是一个流程图,展示了根据本发明的一个具体实现方式的用于下次点击收集的程序。
图6A展示了根据本发明的具体实施方案的两个示例性下次点击数据库。
图6B是一个屏幕截图,展示了根据本发明的一个具体实现方式的多个搜索结果和下次点击信息的展现方式。
图7展示了一个示例性计算机系统,其中可以实现本发明的多个具体实施方案。
具体实施方式
现在将详细参见本发明的一个具体实施方案。在附图中展示了这个实施方案的一个实例。尽管将结合这个具体实施方案来说明本发明,但应理解这并非旨在将本发明限制在一个实施方案上。相反,这是旨在覆盖可能包括在由所附权利要求定义的本发明的精神和范围之内的多种等同替代、修改、以及等效物。在以下说明中,列出了很多具体细节以提供对本发明的透彻理解。可以在没有这些具体细节中的一些或全部的情况下实施本发明。在其他情况中,并未详细说明众所周知的处理操作,目的是为了避免不必要地模糊本发明。
总体上讲,在此提供了对于多个搜索结果对象提供下次点击信息的多种机制。这些搜索结果对象可以采用任何适当的形式,如网页、图像、视频、音频文件,或者是可以被选择、浏览、或以其他方式访问的任何对象。对于一个具体搜索结果对象的一个下次点击对象可以对应于任何类型的对象(例如,网页、图像、视频、音频文件、广告链接,等等),该对象是在选择、点击、观看或以其他方式访问该具体搜索结果对象后由用户来选择、点击、观看、或访问的。一个搜索结果对象还可以是来自插件库的一个软件插件。在这种情况下,这个下次点击对象可以显示与该具体搜索结果相关联的最常用的或最常访问的插件。可能已经通过任何适当的应用程序(如搜索或网络服务)初始地访问了该搜索结果对象。当用户访问了具体的搜索结果对象以及随后的下次点击对象时,可以将下次点击信息保存起来供以后使用。在一个实施方案中,当用户进行了一次搜索查询时,对于每个搜索结果对象(或多个搜索结果对象的一个子集)的下次点击信息是与以下将进一步说明的所展现的搜索结果一起提供给该用户。
本发明的多个示例性实施方案可以用于显著地增强搜索介面和搜索体验。下次点击信息可以帮助用户在大量的搜索结果中导航并发现相关的页面。
尽管是在搜索服务应用的背景下对于搜索结果对象以及它们的相关的下次点击对象说明了某些实施方案,应当清楚的是还可以在其他应用中提供下次点击信息,如用于在多个视听对象中进行浏览/搜索的音乐或视频服务。还应当指出,可以设想在本发明的实施方案中底层搜索引擎的操作在很大程度上并不受到上层决定和下次点击信息的展现方式的影响。这就是说,响应于一个搜索查询,搜索引擎可以像其常规地会做到的那样获取与该搜索查询相关的信息,即无需得益于或参照由本发明能够产生的用户点击信息。用户点击信息可以应用到传统检索的结果上。然而,还可以设想在多个实施方案中以某种方式改变底层搜索引擎的操作以使之能够进行以下进一步说明的至少某些进一步的搜索增强功能。例如,搜索结果的分级可以按照所检索的用户点击信息来进行,并且基于如以下进一步解释的所检索的用户点击信息可以对搜索引擎进行修改。
在说明用于提供下次点击信息的机制之前,将首先简洁地说明一种搜索和网络体系结构,以提供用于实施本发明的技术的一个示例性环境。图2展示了一个示例性网段,在该示例性网段中可以根据本发明的一个实施方案来实现本发明。如图所示,多个客户端202可以通过网络204访问位于(例如)搜索服务器206上的一个搜索应用和/或访问(例如)在网络服务器214上的一个网络服务。该网络可以采用任何适当的形式,如广域网或互联网和/或一个或多个局域网(LAN)。网络204可以包括任何适当数目和类型的装置(例如,路由器和交换机)以用于将来自每个客户端的搜索或网络对象请求转发给搜索或网络应用程序并将搜索或网络结果返回给这些请求客户端。
本发明还可以实施在各种各样网络环境(由网络204表示)中,这些网络环境包括(例如)基于TCP/IP的网络、电信网络、无线网络,等等。另外,用于实现本发明的实施方案的计算机程序指令可以存储在任何类型的计算机可读介质中,并且根据各种计算模型(包括客户端/服务器模型、对等模型)可以在一个独立计算装置上执行,或者根据一种分布式计算模型来执行,在分布式计算模型中,可在不同的位置实施或使用在此说明的各种功能性。
一个搜索应用程序通常允许用户(人或自动化实体)对通过网络204可访问的并且与一个或多个搜索词相关的信息进行搜索。这些搜索词可以由用户以任何方式输入。例如,该搜索应用程序可以向该客户端(例如在该客户端的装置上)展现具有任何输入特征的一个网页,这样该客户端可以输入一个或多个搜索词。在一个具体实现方式中,该搜索应用程序展现了一个输入框,用户可以向该输入框中输入任何数目的搜索词。对于任何搜索应用程序可以使用本发明的多个实施方案,并且示例性搜索应用程序包括Yahoo!Search、Google、Altavista、Ask Jeeves,等等。尽管为了清晰仅展示了一个单一搜索服务器206,但可以在任何数目的服务器上实现该搜索应用程序。
搜索服务器206(或多个服务器)可以访问一个或多个用户搜索数据库210,其中保存了搜索信息。用户每次对一个或多个搜索词进行搜索时,与该搜索有关的信息可以保存在一个或多个用户搜索数据库210中。例如,用户的搜索请求可以包含任何数目的参数,如用户或浏览器身份以及这些搜索词,这些参数可以保存在一个或多个用户搜索数据库210中。与该搜索相关的附加信息(如时间戳)也可以与这些搜索请求参数一同保存。当基于所输入的多个搜索词将多个结果展现给用户时,还可以保存来自该搜索结果的参数。例如,这些具体的搜索结果(如网站)展现、这些搜索结果的顺序、是否每个搜索结果是一条赞助的或算法的搜索结果、每个搜索结果的拥有者、是否每个搜索结果是由该用户选择的(如果存在的话)、以及时间戳也可以保存在一个或多个用户搜索数据库210中。
该一个或多个用户搜索数据库可以采用任何适当的形式来保存有用的搜索信息用于后续的或并行的下次点击分析,这在以下说明。图3A展示了根据本发明的一个实现方式的示例性用户搜索数据库300。如图所示,用户搜索数据库300包括由一个第一用户ID_1用于第一搜索的多个条目302a至302c、由一个第二用户ID_2用于第二搜索的多个条目304a至304c、由一个第三用户ID_3用于第三搜索的多个条目306a至306c;以及由同一个用户ID_1用于第四搜索的条目308。当然,每个搜索可能更为典型地包括比图3A中示出的条目数目更多的条目。在图3A中,出于简化的目的,为每个搜索展示了搜索结果的一个简略列表。另外,所展示的数据库300仅是一个实例,并且这样的一个数据库可以包括任何数目和任何类型的字段以用于跟踪来自多个搜索通话期的多个单独搜索和搜索结果。
对于一个具体搜索词以及响应于该搜索和搜索词而发现的搜索结果的不同特征,每个条目都涉及了一个特定用户搜索通话期的不同参数。在所展示的实例中,每个条目可以包括用户标识符(ID)、通话期时间戳、搜索词、搜索结果识别、是否由用户点击了该搜索结果、以及该点击动作的时间戳。尽管没有示出,但每个条目还可以包括一个字段,该字段表明是否该搜索结果是一个赞助搜索结果(例如,该搜索结果是为特定的搜索词而购买的)和/或该搜索结果的拥有者的识别。可替代地,每个条目可以包括一个用户ID和多个搜索,这些搜索各自包括一个时间戳、一个或多个搜索词以及它们相应的搜索结果和相关的信息。对于这种搜索信息,存在可以利用的大量的不同安排方式。所保存的搜索信息可以包括其他类型的数据,如在所有搜索结果中所选结果的级别、搜索词的类别,等等。
用户ID可以对应于与搜索者相关联的任何特征,并且搜索者可以是一个人或一个自动化实体。这个ID可以是直接与用户身份的某种形式相关联、与浏览器(用户正在通过该浏览器请求一个搜索)、或者在用户的装置上运行的搜索客户端相关联。作为举例,用户ID可以是从浏览器或用户cookie获得的,例如当用户登录到该具体的搜索服务提供器上时,该浏览器或用户cookie可以是与该搜索相关联的。可替代地,用户ID可以采用与装置相关联的标识的形式,而该用户正在使用该装置进行他们的搜索。装置标识的实例包括IP(互联网协议)地址或MAC(媒体访问控制)地址。
通话期和点击时间戳字段可以对应于任何适当的时间格式,并且可以规定日、月、年、时间和时区的任何组合。搜索词对应于在一次具体搜索中使用的搜索词。一个具体搜索可以包括多于一个的搜索词,这些搜索词可以包括在用户搜索数据库的同一个或不同的条目中。搜索结果可以包括属于同一个拥有者的一个或多个URL(统一资源定位符)站点。所选字段中的“否”表示这些搜索结果不是由用户选择的,而所选字段中的“是”表示该搜索结果是由用户选择的。
可以在条目中包括一个赞助的字段以指明该搜索结果是否已接受赞助(例如,已接受的一个报价)以便出现在已购买的或受赞助的搜索结果列表中。拥有者字段可以指明该搜索结果的拥有者。一个拥有者一般是控制或管理该对应的搜索结果的一个实体。例如,该拥有者可以是一个公司,并且该搜索结果可以指明该公司的主网站。
在本实例中,可以为每个搜索词和搜索结果对形成一个分离的条目。例如,条目302a至302c各自包括等于“ID_1”的一个用户ID以及一个第一搜索的通话期时间戳“Jan.2,2006,3:03pm”。条目302a至302c还对应于搜索词“loan”的搜索,该搜索产生搜索结果x,y,和z。
除用户搜索数据库外,本发明的多个实施方案可以利用当用户访问一个或多个网络服务时所收集的信息。在一个具体实现方式中,可以用一个信息收集代理(例如图2的216)对一个或多个客户端进行配置。该信息收集代理可以被配置为在将该请求转发给它的服务提供者之前截取来自该客户端的对任何对象的请求,如到一个特定服务提供方的一个网页。例如,客户端浏览器可以包括一个插件,该插件接收用户对于具体网页而发出的URL(统一资源定位符)请求。然后,响应于该对象请求,信息收集代理从服务提供方处接收该对象(例如网页)。信息收集代理还可以被配置为保存与该搜索请求和所产生的对象有关的数据,如用户的识别、结果对象(例如,URL)以及访问和退出该结果对象的时间戳。然后这个信息可以被转发到一个中央服务器(如下次点击管理服务器208)并保存在一个中央数据库(如下次点击数据库212)中。
图3B展示了根据本发明的一个实施方案的用于跟踪用户对象访问的示例性用户网络数据库350。如图所示,用户网络数据库350可以包括多个条目(例如,352a至352d),这些条目各自可以包括一个用户识别、一个点击时间戳、一个网页标识符、以及一个退出时间戳。尽管没有示出,用户网络数据库可以包括对于多个用户和网页的条目,连同与该用户和网页相关的其他字段。点击时间戳可以表明用户初始接收具体对象或网页的时间,并且退出时间戳可以表明用户退出对象或网页的时间。因此,可以保存该用户访问每个对象所花费的时间并且随后用于下次点击分析的目的。
返回参见图2的体系结构,下次点击管理模块208可以被配置为针对多个搜索结果对象、已访问的网络对象、或类似的对象确定下次点击信息。对于访问的一个具体的对象,可以基于与接下来访问的多个对象有关的任何适当的信息来确定这种下次点击信息。例如,当多个用户搜索并访问搜索结果对象并请求和访问对象(如网页)时,下次点击管理模块208可以分析对他们保存的信息。尽管下次点击管理模块208被示出为一个分离的服务器,该下次点击管理模块208和/或一个或多个下次点击数据库212可以与用户搜索服务器206以及一个或多个数据库210和/或信息收集代理216和/或网络数据库350合并。
图4是一个流程图,展示了根据本发明的一个实施方案的下次点击管理程序400。在这个实例中,下次点击信息被应用于一个搜索环境中。因此,可以在操作402中初始地确定是否已经从一个用户接收到一个搜索查询。如果还未接收到一个搜索查询,程序400继续等待。当接收到一个搜索查询时,那么在操作404中可以基于该搜索查询提供分级的搜索结果。例如,该下次点击管理模块可以与搜索服务应用程序整合在一起,或者搜索应用程序可以将每个搜索请求和所产生的搜索结果通知给一个下次点击服务器。
当在对于搜索服务器的一个查询中启动了基于一个或多个搜索词的对于多个对象的搜索时,然后搜索服务器将与这些搜索词相关的多个对象定位。可以在任何数目的网络服务器上发现这些对象,并且它们经常是通过可能由不同的一组计算机(未示出)执行的一个爬行和索引链路(crawling and indexing pipeline)而进入该搜索服务器。然后可以通过基于规则的或决策树的系统来分析这些已定位的对象,以确定“优质”或关联性的分级。例如,基于这些对象的多个特征值、以一个搜索请求启动该搜索的用户、等等,将这些对象按照从最相关到最不相关的顺序进行分级。
返回参见图4,然后在操作406中可以获得与每个搜索结果相关的下次点击信息。可替代地,下次点击信息可能在收集用户搜索或网络访问数据时先前已经确定了。下次点击信息一般可以对应于由当前搜索启动者、用户的社群网络、或多个公共用户以前做出的多个下次点击。这种下次点击信息可以包括对于每个下一个被点击的对象的点击频率的度量标准,这将在以下进一步说明。
在操作408中,可任选地基于相关的下次点击信息还可以对这些搜索结果再次进行分级。这就是说,可以通过一种再分级算法对下次点击信息加以考虑。例如,可以重新评估具有高频率的下次点击级别的对象(例如,网页)并对它们给予高于较低频率的下次点击对象的级别,或者可以基于下次点击信息将具体的搜索结果集群在一起。然后在操作410中,可以将搜索结果的一个分级列表(包括相关的下次点击信息)提供给该搜索的启动者(例如,该用户可访问的一个装置)。例如,在对应的搜索结果附近提供这种下次点击信息,如以下进一步的说明。
图5是一个流程图,展示了根据本发明的一个具体实现方式的用于下次点击收集的程序500。这个流程图是对于一个单一页面对象而展现的,但实际上它可以应用在多个网页上,包括通过搜索服务访问的多个搜索页面和通过网络服务器访问的多个网页。当然,除了网页,还可以为其他类型的对象收集并提供下次点击信息。例如,这种下次点击信息可以对应于图像、视频、音频文件、广告链接、软件插件,等等。
另外,可以在任何适当的时间中收集并确定下次点击信息(包括度量标准)。例如,可以在每次进行一个搜索时或者在一个周期基础上基于用户搜索和用户网络数据库信息来确定并更新下次点击度量标准。可替代地,例如,当为下次点击管理服务器提供搜索和网络信息时可以确定下次点击度量标准。可以由一个或多个搜索服务器、一个或多个信息收集代理、一个或多个网络服务器、等等来提供搜索和网络信息。下次点击管理服务器可以通过被动地接收该信息或主动地从重要的信息源请求该信息而获得此类搜索和网络信息。
返回参见图5,在操作504中可以确定并且可任选地保存观看一个具体页面的预定周期中所点击的每个下一个页面的度量标准。下次点击度量标准的长期储存是任选的。例如,如果无论何时发生此类搜索都为每个搜索确定并提供度量标准,则只需要临时存储下次点击度量标准用于展现给搜索启动者。
下次点击度量标准可以采用任何适当的形式用于展现下次点击的特征,如点击频率、点击计数、观看对象所耗费的时间(停留时间)、标签计数、页面内点击计数,等等。一个度量标准可以包括用户如何观看对象(如网页)的任何定量化和特征化。这些具体的度量标准仅仅是实例并且不意味着要限制本发明的范围。下次点击频率可以指明一个百分率,即对于一个具体搜索结果对象,从所有的下次点击对象中选择该下次点击对象的百分率。例如,如果存在1,000个下次点击对象(它们是在访问一个具体搜索结果对象之后由不同用户选择的)并且这些下次点击对象中特定的一个被选择了500次,那么该特定的下次点击对象的点击频率是50%。
这些下次点击度量标准还可以各自被划分为任何数目和类型的类别。例如在操作506中,可以基于每个用户和/或每个用户的社群网络来确定并可任选地保存对于每个度量标准的多个子度量标准。在一个具体实现方式中,一个具体用户可以选择基于他或她自己的下次点击、由该具体用户的所选定社群网络(例如指定的朋友或伙伴)所做出下次点击、或任何人的点击来展现下次点击信息。用户可以在任何时间选择这些选项(例如)以便应用于一个具体的搜索,或者通过用户特征网页来选择更广义地可适用的用户偏好。
在操作508中,还可以基于这些点击是否是页面内或页面间的来确定和保存对于每个度量标准的多个子度量标准。这就是说,选自特定的相关搜索结果对象之内的链接的下次点击对象可以被定义为是页面内或对象内的,而不是选自相关搜索结果对象之内的链接的下次点击对象可以被定义为是对象间或页面间的。在操作510中,还可以基于这些点击是否为域内或域间来确定并保存对于每个度量标准的多个子度量标准。例如,在与该相关搜索结果对象在同一个域内的对象上选择的下次点击可以被定义为是域内的,而其他下次点击可以被定义为是域间的。其他子度量标准的确定可以是基于任何适当的下次点击因素,如在这些下次点击对象自身之中内容(例如,字或搜索词)的重叠程度、链接锚文本相似性、用户标签相似性、此类下次点击对象(例如,汽车、金融)的预定义的类别的重叠、这些下次点击对象是否属于同一个广告类别,等等。
图6A展示了根据本发明的具体实施方案的两个示例性下次点击数据库600和650。这些实例涉及多个网页,但还可以应用于其他类型的对象。下次点击数据库600包括多个条目,这些条目各自使一个网页与下次点击页面以及下次点击的度量标准相关。例如,条目602a至602c对应地使网页“a”与下次点击网页b、c、和e相关。这些下次点击网页b、c、和e对应地具有45%、40%、和5%的点击频率。条目604a以35%的点击频率使另一个网页“b”与下次点击网页“a”相关。
可替代的下次点击数据库650包括多个条目,这些条目各自包括用户标识符(ID)、网页、下次点击网页、以及下次点击度量标准。用户ID可以对应于一个单一用户的身份或一个具体用户的社群网络用户组。在这个实施方案中,这些下次点击度量标准被有效地由用户或社群网络区分开。还可以通过具体网页的身份或下次点击页面的身份内在地提供域内或域间。例如,一个具体网页和下次点击页面可以共享同一个域。通过分析该具体网页以确定该具体网页是否包括到下次点击网页的链接可以确定域内或域间。
每次向一个搜索启动者提供多个搜索结果时,还可以向该用户提供对应于搜索结果中的每个(或一个子集)的下次点击信息。例如,可以从一个下次点击数据库(例如600或650)获得与每个具体搜索结果的网页相关的对于每个下次点击网页的下次点击度量标准。还可以为每个度量标准确定页面间和页面内和/或域的子度量标准。例如,通过对网页的和下次点击页面的已标识的域进行比较来确定域间或域内状态,或者通过评估是否在相关网页中将每个下次点击页面提供为一个链接来确定页面间或页面内状态,首先将这些下次点击度量标准分为多个子度量标准类别。然后可以基于每个类别的下次点击计数和相应的度量标准值来确定这些子度量标准。
在获得了下次点击度量标准和子度量标准后,然后可以向搜索启动者提供用于一个或多个搜索结果的下次点击信息。图6B是一个屏幕截图,展示了根据本发明一个具体实现方式的多个搜索结果和下次点击信息的展现方式。如图所示,搜索结果窗口650包括多条搜索结果,这些搜索结果各自包括一个可选的“下一个被点击的链接”对象,例如654a至654d。在另一个实现方式中,还可以将预定义数目的下一个被点击的链接(例如,前10名)作为链接或搜索结果与该搜索查询的搜索结果一起展现。在这种情况中,可以使用缩格将这些下次点击链接与常规搜索查询的结果区分开。当用户对于一个具体搜索结果选择了这些“下一个被点击的链接”对象之一时,于是可以将相应的下次点击信息展现给用户。如图所示,当选择“下一个被点击的链接”对象654d时,下次点击信息文档656即被展现。
可以用很多种格式来提供用于一组搜索结果的下次点击信息。在所展示的实例中,首先将一个动态的“下一个被点击的链接”对象展现给用户。然而,可以向用户静态地提供这种下次点击信息。在本实例中,当用户选择了动态的“下一个被点击的链接”对象时,就在一个网页或窗口中向用户展现额外的下次点击信息。在一个可替代的实现方式中,可以采用不同类型的命名(例如,“下次点击信息”)来展现这些搜索结果,用户可以在该命名上滑动他/她的鼠标或指针来致使一个弹出窗口展现出下次点击信息。
参见图6B的可选链接的实例,下次点击信息文档656可以包括对于所选搜索结果的下次点击对象(例如658a和658b)的列表,这些对象按照由最高到最低的受欢迎程度的顺序来展现。对于一个具体搜索结果的这些下次点击对象可以按任何顺序来展现,并且这种顺序可以是由用户或由某种其他实体可选择的。在所展示的实例中,这些下次点击对象是以对应于点击频率的下降等级的有序列表来展现的。可替代地或另外地,可以采用某种方式来视觉地展现多个下次点击对象,该方式用于表明它们的相对点击频率或任何其他的度量标准值。例如,可以用最大字体(如图所示)展现最高点击频率对象,而以次最大字体展现次最高点击频率对象,等等。在这后一个实例中,这些下次点击对象不必在一个列表中展现,但可以在下次点击页面上随机地安排为一种可视映射图,例如一个标签或数据云。这些下次点击对象还可以用其他的视觉方式来展现,这些视觉方式对应于一个具体的度量标准或子度量标准的等级。可视展现方式可以对应于一种度量标准等级,这可以包括不同的颜色、不同的字体、不同大小的形状,等等。
还可以在已展现的下次点击信息中提供度量标准值(和/或子度量标准值)。如图所示,每个下次点击对象在括号中包括相应的下次点击频率,对于第一下次点击对象658a是45%,对于第二下次点击对象658b是20%。可替代地,该下次点击信息可以用数字或任何其他视觉尺度的形式来简单地展现不同的下次点击值。不论形式如何,任何下次点击信息部分可以是到相应的下次点击对象(例如,下次点击网页)的一个可选择链接的形式。
还可以提供允许用户选择下次点击选项的多种机制。在图6B的实例中,为用户展现了多个可选择的选项660,它允许用户选择所展现的下次点击信息的类型,例如由用户、用户的社群网络、或由公众选择的最受欢迎的下次点击对象。其他可选择的下次点击选项可以包括根据页面内或页面间、域内或域间、已展现的下次点击对象的数目等等来展现下次点击信息。可选择的下次点击选项可以由用户在搜索之前进行访问并选择,例如这些选项可以展现在搜索输入框附近、或在对于一个特定的服务提供商账户的用户偏好选项内访问它们。
本发明能够以硬件和/或软件的任何适当的组合形式来实现。图7展示了一个典型的计算机系统,当经过适当地配置或设计时,该计算机系统可以用作本发明的下次点击管理器。计算机系统700包括任何数目的处理器702(也称之为中央处理单元,或CPU),这些处理器被联接到包括主存储器706(典型地是随机存取存储器,或RAM)、主存储器704(典型地是只读存储器,或ROM)的存储装置上。CPU 702可以是不同的类型,包括多个微控制器和多个微处理器,如多个可编程装置(例如,多个CPLD和FPGA)以及多个不可编程装置,如多个门阵列ASIC或多个通用微处理器。如本领域中众所周知的,主存储器704用于单向地将数据和指令传输至CPU,而典型地主存储器706用于以一种双向方式传输数据和指令。这两个主存储装置均可以包括如上述那些任何适当的计算机可读介质。大容量存储装置708还双向地联接到CPU 702上并提供额外的数据存储能力,并且可以包括上述计算机可读介质中的任何一种。大容量存储装置708可以用于存储程序、数据以及类似物,并且典型地是一种辅助存储介质,如硬盘。应当认识到在适合的情况下,保存在大容量存储装置708中的信息是以标准方式结合作为主存储器706的一部分以作为虚拟存储器。专用的大容量存储装置(如CD-ROM 714)还可以将数据单向地传送到CPU。
CPU 702还联接到接口710上,接口710连接到一个或多个输入/输出装置上,如视频监视器、轨迹球、鼠标、键盘、麦克风、触敏显示器、传感式读卡器、磁或纸带阅读器、图形输入板、触控笔、声音或笔迹识别器、或其他众所周知的输入装置(当然,诸如其他计算机)。最后,可任选地CPU 702可以被联接到一个外部装置上,如,使用总体上在712处示出的外部连接的数据库或计算机或电信网络。对于这样一种连接,可以设想的是,在执行在此所述的方法步骤的过程中CPU可以从网络上接收信息或者可以向网络输出信息。
无论该系统的配置如何,它都可以使用一个或多个存储器或存储器模块,它们被配置为存储数据、用于一般目的的处理操作的程序指令和/或在此说明的这些创造性技术。例如,这些程序指令可以控制一个操作系统的运行和/或一个或多个应用程序。这个存储器或这些存储器还可以被配置为存储一个或多个用户搜索数据库、一个或多个用户网络信息数据库、一个或多个下次点击数据库,等等。
由于该信息和程序指令可以用于实现在此说明的系统/方法,因此本发明涉及包括多个程序指令、状态信息等等用于执行在此说明的各种操作的机器可读介质。机器可读介质的实例包括但不限于:磁介质,如硬盘、软盘、以及磁带;光学介质,如CD-ROM盘;磁光介质,如光磁软盘;以及专门配置为存储和执行程序指令的硬件装置,如只读存储装置(ROM)和随机存取存储器(RAM)。本发明还可以在适当的媒介(如空气、光学线路、电力线,等等)上传播的载波中实施。程序指令的实例既包括如由编译器产生的机器代码,还包括含有更高级别代码的文件,这些文件由计算机利用解释器来执行。
尽管出于清楚理解的目的,已经详细地说明了以上发明,但清楚的是可以在所附权利要求的范围内实现某些变化和修改。因此,本发明的这些实施方案应当考虑为是解说性的而非限定性的,并且本发明不限于在此给出的细节,但可以在所附权利要求的范围和等效物之内进行修改。

Claims (27)

1.一种用于对搜索服务的用户提供搜索结果的方法,该方法包括:
获取与多个下一个被点击的对象有关的下次点击信息,这些下一个被点击的对象与多个搜索结果对象的至少一个子集中的每一个相关,这些搜索结果对象是响应于来自一个启动者的一个搜索请求而由一个搜索服务在一个计算机网络上已经获得的,其中这些下一个被点击的对象中的每一个都是由一个用户在访问了该相关的搜索结果对象之后下一次所选择的;并且
将该下次点击信息与这些分级的搜索结果对象一同提供给该启动者,这样该下次点击信息被展示为与该分级的搜索结果对象的至少一个子集中的每一个相关对象相邻。
2.如权利要求1所述的方法,其中这些下一个被点击的对象以及这些搜索结果对象是多个网页。
3.如权利要求1或2所述的方法,其中将所提供的下次点击信息相对于该搜索结果对象的至少一个子集划分为对象间信息和对象内信息。
4.如权利要求1至3中任何一项所述的方法,其中所提供的下次点击信息是从一个单一用户获得的,该单一用户与该搜索请求的启动者是相同的。
5.如权利要求1至3中任何一项所述的方法,其中所提供的下次点击信息是从多个用户获得的,这些用户属于该搜索请求的启动者的一个社群网络。
6.如权利要求1至3中任何一项所述的方法,其中所提供的下次点击信息包括多个点击频率值。
7.如权利要求6所述的方法,其中这些点击频率值被展现为一种可视映射图。
8.如权利要求1至5中任何一项所述的方法,其中将所提供的下次点击信息以对应于由增到减的点击次数的顺序对该分级的搜索结果对象的至少一个子集中的每一个进行展现。
9.如权利要求1至5中任何一项所述的方法,其中这些下一个被点击的对象是多个广告链接。
10.一种装置,该装置包括至少一个处理器和一个存储器,其中该处理器和/或存储器被配置为执行以下操作:
获取与多个下一个被点击的对象有关的下次点击信息,这些下一个被点击的对象与多个搜索结果对象的至少一个子集中的每一个相关,这些搜索结果对象是响应于来自一个启动者的一个搜索请求而由一个搜索服务在一个计算机网络上已经获得的,其中这些下一个被点击的对象中的每一个都是由一个用户在访问了该相关的搜索结果对象之后下一次所选择的;并且
将该下次点击信息与这些分级的搜索结果对象一起提供给该启动者,这样该下次点击信息被展示为与该分级的搜索结果对象的至少一个子集中的每一个相关对象相邻。
11.如权利要求10所述的装置,其中这些下一个被点击的对象以及这些搜索结果对象是多个网页。
12.如权利要求10或11所述的装置,其中将所提供的下次点击信息相对于该搜索结果对象的至少一个子集划分为对象间信息和对象内信息。
13.如权利要求10至12中任何一项所述的装置,其中所提供的下次点击信息是从一个单一用户获得的,该单一用户与该搜索请求的启动者是相同的。
14.如权利要求10至12中任何一项所述的装置,其中所提供的下次点击信息是从多个用户获得的,这些用户属于该搜索请求的启动者的一个社群网络。
15.如权利要求10至12中任何一项所述的装置,其中所提供的下次点击信息包括多个点击频率值。
16.如权利要求15所述的装置,其中这些点击频率值被展现为一种可视映射图。
17.如权利要求10至14中任何一项所述的装置,其中将所提供的下次点击信息以对应于由增到减的点击次数的顺序展现给该分级的搜索结果对象的至少一个子集中的每一个。
18.如权利要求10至14中任何一项所述的装置,其中这些下一个被点击的对象是多个广告链接。
19.至少一种计算机可读存储介质,其上存储有多个计算机程序指令,这些计算程序指令被安排用于执行以下操作:
获取与多个下一个被点击的对象有关的下次点击信息,这些下一个被点击的对象与多个搜索结果对象的至少一个子集中的每一个相关,这些搜索结果对象是响应于来自一个启动者的一个搜索请求而由一个搜索服务在一个计算机网络上已经获得的,其中这些下一个被点击的对象中的每一个都是由一个用户在访问了该相关的搜索结果对象之后下一次所选择的;并且
将该下次点击信息与这些分级的搜索结果对象一起提供给该启动者,这样该下次点击信息被展示为与该分级的搜索结果对象的至少一个子集中的每一个相关对象相邻。
20.如权利要求19所述的至少一种计算机可读存储介质,其中这些下一个被点击的对象以及这些搜索结果对象是多个网页。
21.如权利要求19或20中任何一项所述的至少一种计算机可读存储介质,其中将所提供的下次点击信息相对于该搜索结果对象的至少一个子集划分为对象间信息和对象内信息。
22.如权利要求19至21中任何一项所述的至少一种计算机可读存储介质,其中所提供的下次点击信息是从一个单一用户获得的,该单一用户与该搜索请求的启动者是相同的。
23.如权利要求19至21中任何一项所述的至少一种计算机可读存储介质,其中所提供的下次点击信息是从多个用户获得的,这些用户属于该搜索请求的启动者的一个社群网络。
24.如权利要求19至21中任何一项所述的至少一种计算机可读存储介质,其中所提供的下次点击信息包括多个点击频率值。
25.如权利要求24所述的至少一种计算机可读存储介质,其中这些点击频率值被展现为一种可视映射图。
26.如权利要求19至23中任何一项所述的至少一种计算机可读存储介质,其中将所提供的下次点击信息以对应于由增到减的点击次数的顺序展现给该分级的搜索结果对象的至少一个子集中的每一个。
27.如权利要求19至23中任何一项所述的至少一种计算机可读存储介质,其中这些下一个被点击的对象是多个广告链接。
CN2009801148253A 2008-05-15 2009-05-12 具有最多点击的下一个对象的搜索结果 Pending CN102037464A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/120,993 2008-05-15
US12/120,993 US20090287645A1 (en) 2008-05-15 2008-05-15 Search results with most clicked next objects
PCT/US2009/043617 WO2009140272A2 (en) 2008-05-15 2009-05-12 Search results with most clicked next objects

Publications (1)

Publication Number Publication Date
CN102037464A true CN102037464A (zh) 2011-04-27

Family

ID=41317096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801148253A Pending CN102037464A (zh) 2008-05-15 2009-05-12 具有最多点击的下一个对象的搜索结果

Country Status (8)

Country Link
US (1) US20090287645A1 (zh)
EP (1) EP2291777A4 (zh)
JP (1) JP2011520193A (zh)
KR (1) KR20110009198A (zh)
CN (1) CN102037464A (zh)
AU (1) AU2009246546A1 (zh)
TW (1) TW201001205A (zh)
WO (1) WO2009140272A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391900A (zh) * 2014-11-11 2015-03-04 百度在线网络技术(北京)有限公司 插件搜索方法和装置

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645367B1 (en) * 2009-04-14 2014-02-04 Google Inc. Predicting data for document attributes based on aggregated data for repeated URL patterns
US20100287152A1 (en) * 2009-05-05 2010-11-11 Paul A. Lipari System, method and computer readable medium for web crawling
US10303722B2 (en) 2009-05-05 2019-05-28 Oracle America, Inc. System and method for content selection for web page indexing
US9495460B2 (en) * 2009-05-27 2016-11-15 Microsoft Technology Licensing, Llc Merging search results
US20110270849A1 (en) * 2010-04-30 2011-11-03 Microsoft Corporation Providing search results in response to a search query
KR101431114B1 (ko) * 2010-07-01 2014-08-18 에스케이플래닛 주식회사 컨텐츠 검색 서비스 시스템 및 컨텐츠 검색 서비스 방법
US8700708B2 (en) 2011-05-26 2014-04-15 Facebook, Inc. Social data recording
US9710765B2 (en) 2011-05-26 2017-07-18 Facebook, Inc. Browser with integrated privacy controls and dashboard for social network data
US9747646B2 (en) 2011-05-26 2017-08-29 Facebook, Inc. Social data inputs
US8843554B2 (en) 2011-05-26 2014-09-23 Facebook, Inc. Social data overlay
US8909637B2 (en) 2011-06-03 2014-12-09 Facebook, Inc. Context-based ranking of search results
US9110992B2 (en) * 2011-06-03 2015-08-18 Facebook, Inc. Context-based selection of calls-to-action associated with search results
US9268857B2 (en) * 2011-06-03 2016-02-23 Facebook, Inc. Suggesting search results to users before receiving any search query from the users
US9342605B2 (en) 2011-06-13 2016-05-17 Facebook, Inc. Client-side modification of search results based on social network data
US9652810B2 (en) 2011-06-24 2017-05-16 Facebook, Inc. Dynamic chat box
US20130110864A1 (en) * 2011-10-27 2013-05-02 Cbs Interactive, Inc. Generating an electronic message during a browsing session
US20140136332A1 (en) * 2012-11-14 2014-05-15 Facebook, Inc. Providing social context for products in advertisements
WO2014168717A2 (en) * 2013-03-15 2014-10-16 Advanced Search Laboratories, Inc. System and apparatus for information retrieval
CN103810241B (zh) * 2013-11-22 2017-04-05 北京奇虎科技有限公司 一种低频点击的过滤方法和装置
CN106874423B (zh) * 2017-01-25 2020-07-31 广东神马搜索科技有限公司 搜索控制方法和系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3598755B2 (ja) * 1997-08-15 2004-12-08 富士ゼロックス株式会社 情報検索装置及び情報検索方法
US6665655B1 (en) * 2000-04-14 2003-12-16 Rightnow Technologies, Inc. Implicit rating of retrieved information in an information search system
US6832218B1 (en) * 2000-09-22 2004-12-14 International Business Machines Corporation System and method for associating search results
JP3552665B2 (ja) * 2000-11-15 2004-08-11 日本電信電話株式会社 関連指向検索サービス方法およびそのプログラムを記録した記録媒体
US6910037B2 (en) * 2002-03-07 2005-06-21 Koninklijke Philips Electronics N.V. Method and apparatus for providing search results in response to an information search request
US7447688B2 (en) * 2003-10-09 2008-11-04 International Business Machines Corporation System for conducting searches on the world wide web enabling the search requester to modify the domain context of a search responsive to an excessive number of hits on combinations of keywords
US7392278B2 (en) * 2004-01-23 2008-06-24 Microsoft Corporation Building and using subwebs for focused search
US7788260B2 (en) * 2004-06-14 2010-08-31 Facebook, Inc. Ranking search results based on the frequency of clicks on the search results by members of a social network who are within a predetermined degree of separation
US9026534B2 (en) * 2004-07-21 2015-05-05 Cisco Technology, Inc. Method and system to collect and search user-selected content
US9740794B2 (en) * 2005-12-23 2017-08-22 Yahoo Holdings, Inc. Methods and systems for enhancing internet experiences
US8041709B2 (en) * 2007-05-25 2011-10-18 Microsoft Corporation Domain collapsing of search results

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391900A (zh) * 2014-11-11 2015-03-04 百度在线网络技术(北京)有限公司 插件搜索方法和装置

Also Published As

Publication number Publication date
AU2009246546A1 (en) 2009-11-19
WO2009140272A3 (en) 2010-02-18
KR20110009198A (ko) 2011-01-27
WO2009140272A2 (en) 2009-11-19
US20090287645A1 (en) 2009-11-19
EP2291777A2 (en) 2011-03-09
JP2011520193A (ja) 2011-07-14
TW201001205A (en) 2010-01-01
EP2291777A4 (en) 2011-07-13

Similar Documents

Publication Publication Date Title
CN102037464A (zh) 具有最多点击的下一个对象的搜索结果
Vargiu et al. Exploiting web scraping in a collaborative filtering-based approach to web advertising.
JP5572596B2 (ja) 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
KR100478019B1 (ko) 지역 정보 검색 결과 제공 방법 및 시스템
CN100401292C (zh) 用于使用倾向分析进行搜索查询处理的系统和方法
US8768772B2 (en) System and method for selecting advertising in a social bookmarking system
JP5238074B2 (ja) オンラインリファレンスの収集および採点
US8682881B1 (en) System and method for extracting structured data from classified websites
US20060064411A1 (en) Search engine using user intent
US20050234895A1 (en) System and method for a modular user controlled search engine
CN104850546B (zh) 移动媒介信息的展示方法和系统
US20030217056A1 (en) Method and computer program for collecting, rating, and making available electronic information
US20150220641A1 (en) Search engine optimization at scale
JP2011002972A (ja) クエリ分析装置、クエリ分析方法及びプログラム、並びに情報検索装置
JP5511782B2 (ja) 新規広告可能なurl提供システムおよび新規広告可能なurl提供方法を実行するためのプログラム
US20200081930A1 (en) Entity-based search system using user engagement
CN104090923A (zh) 一种浏览器中的富媒体信息的展示方法和装置
US20090292998A1 (en) Aggregating and sharing keys of web pages over page viewers
US20060149606A1 (en) System and method for agent assisted information retrieval
JP6329015B2 (ja) 広告配信サーバ
US20180039643A1 (en) Analysis and management of resources in a network
Maheswari et al. Algorithm for Tracing Visitors' On-Line Behaviors for Effective Web Usage Mining
Olawale Search engine optimization: concepts, techniques and challenges
Rajan et al. Features and Challenges of web mining systems in emerging technology
US20130275234A1 (en) Method for a job seeker landing page

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110427