CN102906744A - 无限浏览 - Google Patents

无限浏览 Download PDF

Info

Publication number
CN102906744A
CN102906744A CN2011800252933A CN201180025293A CN102906744A CN 102906744 A CN102906744 A CN 102906744A CN 2011800252933 A CN2011800252933 A CN 2011800252933A CN 201180025293 A CN201180025293 A CN 201180025293A CN 102906744 A CN102906744 A CN 102906744A
Authority
CN
China
Prior art keywords
entity
group
article
search
entities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800252933A
Other languages
English (en)
Other versions
CN102906744B (zh
Inventor
金有庆
赵宏建
李欣
亚历山德拉·莱维奇
汤姆·齐
隋明
赵义弘
马克·戴维斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Assets LLC
Yahoo AD Tech LLC
Original Assignee
Yahoo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Inc filed Critical Yahoo Inc
Publication of CN102906744A publication Critical patent/CN102906744A/zh
Application granted granted Critical
Publication of CN102906744B publication Critical patent/CN102906744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

通过与在线文章相关联地显示包括从该文章提取的实体和/或与从该文章中提取的实体有关的实体的补充内容,来增强该文章。补充内容还包括有关每个实体的信息。有关实体的信息可以通过在一个或多个可搜索的数据库中搜索实体来获取。例如,补充内容可以包括针对每个实体的视频、图像、网络、和/或新闻搜索结果。补充内容还包括诸如股票报价、摘录、地图、评分等的信息。基于诸如用户特定的信息、时间敏感的流行性趋势、语法特征、搜索结果质量之类的上下文因素,使用各种分析和排名技术来选择实体。实体还可以被选择用于诸如生成基于广告的收入的目的。

Description

无限浏览
技术领域
实施例总地涉及内容呈现,更具体地涉及用于向内容补充上下文相关搜索结果的技术。
背景技术
本节描述的方法是可以追求的方法,而不必是以前已经想到或者追求的方法。所以,除非明确指示,否则不应该假设本节描述的任意一种方法仅仅由于它们被包括在本节中而被认为是现有技术。
通常,对于查看诸如新闻文章、博客条目(blog entry)、以及电子邮件之类的在线文章内容的人(以下称为“用户”)来说有用的是,获取有关文章的各种主题(包括人物、地点、组织、话题、产品等(以下称为“实体”))的进一步的信息。大量的可搜索资源可以被用来提供该信息,但是由于各种原因,用户通常并不尝试访问这些资源中可用的信息。例如,用户可能发现在文章中明确地搜索实体的过程是非常乏味的。或者,用户可能并不知道对于文章中的特定实体的搜索会产生用户感兴趣的信息。或者,用户可能并不知道对于文章中的相关实体的搜索会产生用户感兴趣的信息。或者,用户可能不知道各种可搜索资源的存在。
对于内容提供者来说克服这些及其他问题的一种方法是,手动搜索有关文章中的实体的感兴趣的信息,并将该信息包括在文章中。不幸的是,这种方法是劳动密集型的,并且依赖于内容提供者变得可以获知对于文章中的每个实体来说的可用信息的类型。
另一种方法是在将内容发送给用户之前预先对内容进行分析,并且突出显示潜在感兴趣的实体。使用感兴趣的项的词典来定位实体。实体可以由例如指示超链接的文本标记来突出显示。在用户点击超链接或者停留在超链接上时,向用户呈现诸如编辑信息或者搜索结果之类的有关突出显示的实体的信息。
当前用于标识感兴趣的实体的方法的局限在于,它们要求编辑者于动向词典中添加感兴趣的实体。一般水平的编辑者很难预见特定文章中的哪些实体可能是该文章的上下文中的实际感兴趣的实体。另外,当所查看的文章所在的上下文不断改变时,更难做出有关哪些实体将是用户感兴趣的实体的基于词典的预测。此外,现有技术仍然要求用户采取潜在地不方便的步骤来获取有关实体的信息(例如,点击链接并且等待装载新的网页)。由于有关可能获取的关于实体的信息的质量的确定性的缺乏,用户可能对采取这些步骤并不感兴趣。另外,很多现有方法并没有考虑用户还对有关文章中没有出现的相关实体的信息感兴趣的可能性。
附图说明
本发明通过示例而不是限制被示出,并且在附图中相同的参考标号指代相似的元件,其中:
图1A是描绘文章内容以及附随的补充内容的显示的示例性截屏图;
图1B和1C是可以与文章内容一起呈现的补充(supplement)的替代示例;
图2示出了实施这里描述的技术的示例系统;
图3是示出用于向用户提供补充文章内容的示例技术的流程图;
图4是示出用于向用户提供补充文章内容的另一示例方法的流程图;
图5是示出用于生成文章的补充内容的示例技术的流程图;
图6是示出用于选择主要实体的示例技术的流程图;
图7是示出用于选择相关实体的示例技术的流程图;
图8是示出用于从包括主要实体以及针对主要实体标识的相关实体二者的一组候选实体中选择最终的一组实体的示例技术的流程图;以及
图9是可以实现本发明的实施例的计算机系统的框图。
具体实施方式
在下面的描述中,出于说明的目的,阐述了很多具体细节以提供对本发明的透彻理解。但是,显而易见的是,本发明可以在没有这些具体细节的条件下实施。在其他实例中,公知的结构和设备被以框图形式示出,以避免不必要地混淆本发明。
这里,根据以下大纲描述实施例:
1.0总地概述
2.0补充内容的示例显示
3.0结构概述
4.0功能概述
4.1服务器发起的补充
4.2客户端发起的补充
4.3生成补充
5.0实施示例
5.1选择主要实体
5.2选择相关实体
5.3从候选实体中选择最终的一组实体
5.4根据基于质量的准则对实体进行过滤
5.5对补充内容进行格式化
5.6用户个性化
5.7货币化
5.8服务器优化
5.9时间敏感性
5.10补充服务器API
5.11杂项
6.0实施机构-硬件概述
7.0扩展和替代
1.0总地概述
公开了通过用动态确定的诸如视频、图像、定义、地图、搜索结果、相关链接之类的上下文相关或者关联的内容片段对用户访问的内容进行补充,来提高用户的浏览体验的方法、技术和机构。这些“片段”在下面被称为“补充内容”或者“补充”,它们不仅标识感兴趣的内容,而且包括基于实体从搜索结果获取的关于实体的感兴趣的信息。在一个实施例中,补充可以使用户进行以下的搜索体验,其中用户不必进行诸如向搜索引擎发送查询之类的潜在的不方便的步骤,并且不需要代表内容提供者的编辑程序。
补充内容是至少部分地基于对用户访问的内容的分析生成的。根据一个实施例,每个补充都包括有关至少部分地基于分析而选择的一个或多个实体的信息。每个实体是出现在所分析的内容中或者与所分析的内容有关的单词、项、或者短语。有关一个或多个实体的信息是通过在一个或多个搜索引擎和/或数据库中执行对于一个或多个实体的搜索而生成的。补充可以额外地包括与所分析的内容不相关的其他信息,诸如针对用户的广告。
根据一个实施例,每个补充都包括至少一个联合搜索报告,该联合搜索报告包括通过在一个或多个搜索引擎和/或数据库中搜索一个或多个实体而生成的搜索结果。在一个实施例中,每个联合搜索报告都包括多个子区段(subsection),每个子区段都包括从针对不同类别的数据的搜索结果收集的信息。例如,联合搜索报告可以包括针对一个或多个视频库的一个或多个搜索结果的子区段、针对一个或多个图像数据库的一个或多个搜索结果的另一子区段、针对一个或多个新闻文章库的一个或多个搜索结果的另一子区段、以及针对一个或多个社会媒体数据库的一个或多个搜索结果的另一子区段。但是,在其他实施例中,来自不同库的不同结果可以被合并在单个子区段中。
根据一个实施例,每个补充包括多个区段,每个区段是针对从文章选择的不同实体生成的。每个区段可以包括例如,其相应实体的联合搜索报告。例如,假设对于报道世界杯足球比赛的文章标识出了四个实体:足球、世界杯、南非、以及USA。针对该文章生成的补充可以包含四个不同的区段,每个区段又包含针对该四个所标识的实体中的一个不同实体的不同的联合搜索报告。
在一个实施例中,补充被与得出该补充的文章内容相关联地显示。例如,每个补充被与生成该补充所针对的文章显示在同一个网页中(其中,补充被显示在侧边栏中、被显示在文章上方、或者被显示在文章下方)。在一个实施例中,每个补充包括促使显示补充的客户端在任意的给定时间仅显示对应于一个实体的一个区段的脚本、代码、或者其他指令。这些指令还促使客户端显示用于使对应于不同实体的其他部分可见的标签(tab)或者其他控件。但是,补充中的信息可以被以各种其他方式显示。
在一个实施例中,基于多个分析和排名处理来针对文章选择实体。例如,可以从文章中提取主要实体,然后可以根据用于量化主要实体反映文章主题的程度的多种算法中的任意一种算法对主要实体进行排名。作为另一个示例,可以在相关项库中基于对主要实体的搜索来选择相关实体。然后,可以基于用于度量相关实体与主要实体的相关性的多种算法中的任意一种算法对相关主体进行排名。主要实体和相关实体二者随后可以被聚集在一起,并且被相对于彼此进一步排名。在一些或者所有排名阶段,可以基于各种因素替代地或者进一步地对实体进行排名,这些因素包括:每个实体与文章的相关性的度量、每个实体与用户的相关性的度量、最近的搜索、新闻、或者社会媒体趋势指示出的每个实体的流行度的度量、以及针对每个实体获取的搜索结果的有用性的度量等。在一些或者所有排名阶段,可以基于排名处理从考虑包括在补充中的实体中剔除某些实体。例如,在一些或者所有排名阶段之后,只有预定数目的实体可以被选择。作为另一个示例,只有具有高于预定阈值的相关性评分的实体可以被选择。
在一个实施例中,响应于用户请求文章内容而动态地针对特定的文章内容生成补充,作为响应于用户请求而执行服务器侧或者客户端侧指令的结果。在一个实施例中,搜索提供者提供补充生成服务,其中内容开发者、内容寄存者(content hoster)、内容显示应用、和/或背景应用可以提交文章内容并且反过来接收针对该内容生成的补充。例如,网络寄存提供者可以在将网页返回给浏览器之前,在浏览器请求网页时自动地通过补充生成服务提供其寄存的网页。网页寄存提供者从而被准许自动地将上下文敏感的补充内容捅入其寄存的任何页面,而不必于动标识补充内容的相关信息。作为另一个示例,可以向用户提供浏览器工具条,在用户选择该工具条中的控件时,用户将用户当前正在查看的网页(或者网页地址)发送给补充生成服务。反过来,工具条接收补充内容以供显示给用户。
在其他方面,本发明包括被配置为执行前述步骤的计算机装置和计算机可读介质。
2.0补充内容的示例显示
图1A是描绘文章内容110和附随的补充120的显示100的示例截屏图。显示100可以是例如嵌入了文章110和补充120的网页。文章内容110是新闻文章,并且包括文本112和图像114二者。补充120被显示在文章110的末端。其中,文本112包括主要实体131(“Jay Leno”)、132(“David Letterman”)、以及135(“Conan O’Brien”)。主要实体131和132以及相关实体133(“Ben McKenzie”)和134(“Late Nightwith Jimmy Fallon”)被选择,以生成补充120。实体131至134从而被显示在补充120顶部的标头栏(header bar)中。补充120的其余可见部分是有关相关实体133的信息的区段(section)143。但是,在选择实体131、133或者134中的任意一个实体时,区段143可能会被对应于所选择的实体131、133或者134的补充120的隐藏区段所代替。
区段143包括四个子区段151-154,每个子区段都反映了来自不同信息库的搜索结果。子区段151显示通过在新闻数据库中搜索主要实体133取回的新闻文章的标题和摘要。子区段152基于与通过在视频数据库中搜索主要实体133取回的视频有关的信息,显示视频预告片和标题。子区段153显示通过在图像数据库中搜索主要实体133取回的图像和图像元数据。子区段154显示通过在幻灯片数据库中搜索主要实体133取回的幻灯预告片和标题。
每个子区段151-154的多个部分是可选择的,其中当通过例如点击而选择子区段151至154中的特定子区段的突出显示部分时,向用户呈现诸如完整视频、新闻文章或者幻灯片之类的更详细的数据。尽管子区段151-154中的每个子区段包括仅从一个搜索结果得到的信息,但是在其他实施例中,每个子区段可以包括从任意数目的搜索结果得到的信息。
补充120还包括导航条129,该导航条允许用户滚动通过区段143以呈现额外的子区段的信息。
图1B和1C是可以代替文章110的补充120被呈现的补充160和180的替代示例。图1B描绘出了包括不同的一组实体(主要实体131、相关实体133和134、以及主要实体135)的补充160。主要实体135可以由于各种原因(包括用户个性化、用于计算相关性的数据的时间敏感性、以及货币化因素)而代替主要实体132被选择用于补充160。
图1B的区段163包括不同于图1的区段143的一组子区段171-174。子区段171-174对应于分别针对图像库、照片库、新闻文章库、以及流行搜索查询库的搜索结果。子区段171包括多个图像,而子区段172包括在线视频。子区段173和174包括分别对应于不同搜索结果的多个链接。子区段171-173均包括用于从它们各自的库获取更多搜索结果的链接165。
图1C描绘了包括与图1B的补充120相同的实体的补充180,但是补充180的区段183包括类似于图1A的区段143的子区段151-154的子区段191-194。子区段191-194与子区段151-154的不同主要在于,它们均包括指示它们各自的项目被创建或修改的时间的时间戳195。子区段191-194根据它们的最高排名结果是在多近的时间被创建的而被分类。
图1A-C描绘了补充120可以被呈现给用户的一种方式。在其他实施例中,补充120可以显现在网页中的相对于文章110的不同位置处,或者可以显现在弹出窗口、外部窗口、或者单独显示器中。例如,补充120可以由工具条或者桌面捅件(desktop widget)显示。补充120中的信息可以被以任意数目的可能布局进行组织。例如,补充120中的额外甚至所有的实体部分在不需要点击或者滚动的条件下在补充中可以是可见的。另外,补充120中的信息可以根据诸如针对该补充选择的实体、对于每个实体可用的信息的特性、以及查看文章110的用户之类的因素改变。在一个实施例中,区段143不必被分割成多个子区段,但是可以包括其中最高排名的搜索结果被呈现而不管它们的来源如何的单个子区段。
3.0结构概述
图2示出了可以实施这里描述的技术的示例系统200。系统200包括客户端210、内容服务器220、补充服务器250、实体提取组件240、一个或多个相关实体标识组件250、一个或多个实体排名组件260、一个或多个搜索组件270、以及一个或多个用户历史组件280。其中可以实施这里描述的技术的其他系统可以包括替代配置的类似元件和/或附加或者省去的元件。
用户操作客户端210访问由内容服务器220提供的内容222。例如,客户端210可以是以网页形式向用户呈现内容222的网络浏览器,而内容服务器220可以是负责将这些网页发送给客户端210的网络服务器。客户端210发送请求221,以从内容服务器220下载内容222的不同文章224。文章224是用户生成的内容的具体项目,包括文本、图像和视频。一些或者所有文章224可以是诸如博客条目、新闻文章、参考文章、评论、指示文档、电子邮件之类的完整的用户书写的创作。
内容服务器220通过传送文章224来对请求221进行响应。在一个实施例中,每篇文章224都在诸如超文本标记语言HTML  文件或者扩展标记语言XML流的元素之类的结构化对象中被传送给客户端210。每个结构化对象除了可以包括文章224外还可以包括其他元素。这些元素包括但不限于:诸如图片或者视频之类的对文章进行说明或者与文章有关的媒体项目、影响客户端210对文章224的呈现的格式化指令、诸如标头、页脚、以及侧边栏之类的导航组件、广告、文章元数据、以及用于使客户端210执行各种动作的经编码的指令。
内容服务器220可以负责或者不负责将每篇文章224捅入到结构化对象中。例如,内容服务器220可以将文章224的库保持在数据库或者文件系统中。当特定文章224被请求时,内容服务器220取回所请求的文章224,生成适当的结构化对象(包括,例如标记指令和导航组件),将所请求的文章224插入到结构化对象中,并且用该结构化对象来答复该请求。相反,当文章224已经被以适当的结构化对象(例如,网页)的形式存储在内容服务器220处时,内容服务器220可以在不进行任何处理的条件下将文章224中继到客户端210。
客户端210和内容服务器220中的一者或者二者向补充服务器230发送对于补充232的请求231。作为响应,补充服务器返回补充232,用于与内容222一起显示。每个补充232是有关内容222的特定文章224中的一个或多个实体或者有关与内容222的特定文章224相关的一个或多个实体的信息的集合。该信息可以采用例如通过使用该一个或多个实体针对一个或多个库执行任何其他类型的查找操作或者查询而获取的搜索结果的形式。在一个实施例中,每个补充232都包括针对多个实体的联合搜索结果。联合搜索结果可以包括例如,图像、视频、到相关内容的链接、参考数据、联系信息、地图等。每个补充232在单个数据结构(例如,单个数据流或者单个HTML或者XML元素)中被返回。
补充服务器230动态地基于来自客户端210或者内容服务器220的被动态指示给补充服务器230的文章224,生成全少一些补充232。一旦被生成,补充服务器230还可以缓存补充232,用于对将来的对于特定文章224的补充的请求进行响应(其中,补充232是针对特定文章224生成的)。
为了生成补充232,补充服务器230可以采用各种后端组件(backendcomponent)。补充服务器230可以依赖于一个或多个实体提取组件240来从文章提取实体。实体提取组件240可以采用各种形式,只要它们能够输入文章并且输出从该文章提取的多个实体即可。适当的实体提取组件的一个实例是雅虎公司的上下文分析平台(Contextual Analysis Platform,下面称为“CAP”)。另一个示例是斯坦福命名实体识别器(Stanford NamedEntity Recognizer)。
补充服务器230可以进一步依赖于一个或多个相关实体标识组件250。另外,一个或多个相关实体标识组件250可以采用各种形式,只要它们能够基于诸如所提取的实体、媒体项目、或者文章的至少一部分之类的输入输出一个或多个相关实体即可。在一个实施例中,一个或多个相关实体标识组件250包括通过分别分析搜索查询日志、人输入关系数据、以及文章全集的内容来确定相关性的至少三个系统。这些系统的示例包括:雅虎公司的海景(Seaview)系统、包括定义各种标题的参考条目之间的关系的人类居住的类别数据的Wikipedia数据库、以及定义文章全集中的各种实体对的时间衰退类别同时出现频率的社会兴趣发现系统(如美国专利公开No.2009/0083278中描述的,该公开的全部内容通过引用被结合于此,用于各种目的)。
补充服务器230可以进一步依赖于一个或多个实体排名组件260来提供实体相关性评分或者次序。补充服务器230可以使用这些评分或者次序来优先处理并过滤实体,从而使得补充232包括仅关于它们的相应文章224中的最上下文相关的实体或者与它们的相应文章224相关的最上下文相关的实体的信息。补充服务器230可以出于各种目的依赖于一个或多个实体排名组件260,其中这些目的包括以下的一些或所有目的:限制用于标识相关实体的被提取实体的数目、限制针对特定的被提取实体标识的相关实体的数目、以及限制补充232中提供了其信息的被提取实体和相关实体的数目。一个或多个实体排名组件260中的一些或者所有组件可以在逻辑上被结合到实体提取组件240或者一个或多个相关实体标识组件250中。例如,补充服务器230可以利用由CAP提供的排名功能。或者,一个或多个实体排名组件260中的一些或者全部组件在逻辑上可以是独立的。例如,补充服务器230可以利用其自身的定制排名功能,或者查询诸如前面提到的“用于确定内容相关性的基于活动的用户兴趣成形(ActivityBased Users’Interests Modeling for Determining Content Relevance)”之类的走向系统。
一个或多个排名组件260可以依赖于来自各种来源的数据,并且可以被优化为确定任意数目的目标的相关性。例如,一个或多个排名组件260可以被优化为基于实体将产生客户端210的特定用户在查看补充232时将“点击”的搜索结果的可能性来对特定补充232的实体进行排名。作为另一个示例,一个或多个排名组件260可以被优化为基于实体在最近的新闻或者走向数据中的流行度来对实体进行排名。
补充服务器230还可以进一步依赖于用于生成补充232中描述的实体的搜索结果的一个或多个搜索组件270。一个或多个搜索组件可以包括任意数目的搜索引擎、数据库、以及其他库(下文中统称为搜索库)。一些或者所有的不同搜索库可以包括不同类型的可搜索数据。例如,每个库都可以对应于“搜索垂直线”-例如,网络搜索、图像、视频、新闻等。在一个实施例中,每个搜索库是单独的搜索引擎或者数据库。在一个实施例中,一些或者所有搜索库是相同引擎或者数据库中的简单的不同类别的数据集合。
在一个实施例中,一个或多个搜索组件270还可以包括诸如雅虎公司的查询计划器(query planner)之类的搜索结果定制组件。该定制组件可以负责各种任务,这些任务包括:计划在哪些搜索引擎或者数据库中查询有关实体的信息、组织联合搜索结果的布局、以及指示哪些实体没有产生满足指定的质量或者数量阈值的搜索结果。
补充服务器230还可以依赖于一个或多个用户历史组件280,以为特定用户212适应修改补充232。例如,补充服务器240可以利用用户历史组件280提供的数据,作为用于由一个或多个排名组件260执行的排名功能的特征。一个或多个用户历史组件280可以包括例如,用户搜索和搜索会话历史、以及总的用户浏览历史。
在一个实施例中,内容服务器220和补充服务器230在不同设备上运行。内容服务器220在由提供内容222的内容提供者(或者代表内容提供者的网络寄存提供者)操作的一个或多个设备上运行。补充服务器230在由不同于内容提供者的补充提供者操作的一个或多个设备上运行。在一个实施例中,补充提供者也是提供各种组件240-280中的一些或者所有组件的搜索提供者。所以,组件240-280中的一些或所有组件可以在由搜索提供者操作的其他设备上运行,可以与补充服务器230在相同的一个或多个设备上运行,或者可以在逻辑上被合并到补充服务器230中。这些组件均可以经由搜索提供者的后端网络290连接至服务器。在一个实施例中,补充服务器230所依赖的一些或所有组件可以由搜索提供者以外的实体提供,并且因此可以在补充服务器230运行在的一个或多个设备以外的设备上运行,并且经由网络290以外的网络被连接至补充服务器290。
这里使用的项“服务器”不限于在单个计算设备上运行的单个服务器组件,而是还可以指代在多个计算设备上运行以统一提供由服务器提供的所描述的功能的多个服务器组件。类似地,项“组件”可以指代例如,在单个计算设备处运行的指令的单个实例,或者在多个计算设备上运行的指令的多个实例。
4.0功能概述
4.1服务器发起的补充
图3是示出用于向用户提供补充文章内容的示例技术的流程图300。流程图300示出了用于提供补充内容的处理的一个示例。其他处理可以包括以相同或者不同次序配置的更多、更少、或者不同的步骤。
在步骤310,诸如客户端210之类的用于显示内容的客户端向诸如内容服务器220之类的内容服务器发送对于文章内容的请求。例如,用户可以操作网络浏览器从网络服务器请求包括文章的网页。
在步骤320,响应于请求,内容服务器取回文章。例如,内容服务器可以从一个或多个数据库或者存储设备取回文章。
在步骤330,内容服务器从诸如补充服务器230之类的补充服务器请求文章的补充。例如,补充服务器可以具有用于接收这些请求的应用程序接口(API)。根据API,内容服务器可以包括指示针对哪篇文章请求补充的请求数据,其中该补充包括文章本身和/或对文章的引用(诸如,文件路径、数据库记录标识符、或者指定取回文章的位置的统一资源定位符)。
在步骤340,响应于步骤330的请求,补充服务器基于文章生成补充。补充服务器部分地通过从任意数目的搜索库查询信息来这样做。补充服务器使其查询是以作为文章内容的任意数目的分析、排名处理、和/或过滤处理的结果选择的实体为基础的。贯穿本公开,更详细地讨论用于生成补充的技术。
在步骤350,补充服务器将补充返回给内容服务器。例如,补充服务器可以将补充以HTML代码片段的形式返回,其中该HTML代码将对针对所选择的实体从搜索库中取回的信息进行嵌入和格式化。
在步骤360,在接收到补充时,内容服务器生成至少包括文章和补充的结构化文档。其中返回了文章和补充的结构化文档可以另外包括供客户端显示的其他项目、以及有关如何格式化和显示结构化文档中的项目的指令。例如,内容服务器可以生成这样的HTML文档,其中该HTML文档包括文章的内容、包含补充的侧边栏、用于动态地改变所显示的页面的各个方面的JavaScript指令、以及各种导航或者装饰组件。内容服务器可以通过例如,将文章、侧边栏、模板、以及其他信息输入到页面渲染(pagerendering)组件来生成结构化文档。
在步骤370,在生成结构化文档时,内容服务器通过向客户端发送包括文章的结构化文档来响应步骤330的请求。
在步骤380,基于在步骤370接收的结构化文档,客户端显示文章的内容和补充。例如,在结构化文档为网页的情况下,客户端可以对网页进行分析,并且基于标记和其他指令,至少对用于显示给操作客户端的用户的文章和补充进行渲染。
4.2客户端发起的补充
图4是示出用于向用户提供补偿文章内容的示例方法的流程图400。流程图400示出了用于提供补充内容的处理的第二示例。其他处理可以包括以相同或者不同次序配置的更多、更少、或者不同的步骤。
在步骤410,诸如客户端210之类的用于显示内容的客户端向诸如内容服务器220之类的内容服务器发送对于文章内容的请求。例如,用户可以操作网络浏览器从网络服务器请求网页。
在步骤420,响应于请求,内容服务器取回文章。例如,内容服务器可以从一个或多个数据库或者存储设备取回文章。
在步骤430,在取回文章时,内容服务器生成至少包括该文章的结构化文档。例如,内容服务器可以将文章的内容与标头、页脚、侧边栏、和/或其他导航或者装饰项目一起嵌入到页面中。替代地,文章可能已经被存储在适当的结构化文档中,从而使得该步骤是不必要的。
在步骤440,内容服务器通过向客户端发送包括文章的结构化文档来响应步骤420的请求。
在步骤450,基于在步骤370中接收的结构化文档,客户端显示文章的内容。例如,在结构化文档为网页的情况下,客户端可以对网页进行分析,并且基于标记和其他指令,至少对用于显示给操作客户端的用户的文章进行渲染。
在步骤460,补充应用-客户端或者与客户端相关联地操作的其他应用向诸如补充服务器230之类的补充服务器发送对于文章的补充的请求。例如,补充服务器可以具有用于接收这些请求的应用程序接口(API)。根据API,补充应用可以包括指示针对哪篇文章请求补充的请求数据,其中该补充包括文章的内容和/或对文章的引用(诸如,文件路径、数据库记录标识符、或者指定取回文章的位置的统一资源定位符)。
在步骤470,补充服务器基于文章生成补充,如参考340贯穿本公开所描述的。
在步骤480,补充服务器将补充返回给补充应用。在一个实施例中,补充被格式化为HTML和/或脚本指令返回。
在步骤490,补充应用将补充与文章相关联地显示。在随后的任意时间,步骤490可以与步骤450一起进行。
在一个实施例中,客户端或者客户端插入组件充当步骤460-490的补充应用。例如,客户端可以响应于结构化文档中的指令而充当这个角色。结构化文档可以包括指示客户端标识结构化文档中的文章,向补充服务器发送对于补充的请求,然后在弹出窗口或者页面的动态装载的区段中显示补充的脚本。这些指令可以在客户端渲染结构化文档时,或者响应于网页或者客户端的界面中的诸如按钮或者链接之类的控件的用户选择,而被自动执行。替代地,客户端或者客户端捅入组件可以被硬编码,以执行类似的指令。
在一个实施例中,与客户端在相同计算设备上运行的另一个应用充当补充应用。该另一个应用可以是例如,在移动设备上运行的背景应用、在桌面计算机上运行的插件、或者任何其他合适的应用。该另一个应用被配置为与客户端通信,以标识当前正被客户端显示的文章内容。该另一个应用然后将对于补充的请求发送给补充服务器。在反过来接收到补充时,该另一个应用在计算设备处的另一个窗口中显示该补充。该窗口可以与客户端的文章显示并排显示,或者其可以完全取代客户端的文章显示。该另一个应用可以标识文章,请求补充,和/或响应于用户输入而显示补充。或者,该另一个应用可以被配置为针对客户端显示的任意文章内容执行这些步骤中的一些或全部步骤。
4.3生成补充
图5是示出用于针对文章内容生成补充内容的示例技术的流程图500。流程图500的步骤可以由例如补充服务器执行,以根据图3的步骤340或者图4的步骤470生成补充。流程图500示出了用于生成补充内容的处理的一个示例。其他处理可以包括被以相同或者不同次序配置的更多、更少、或者不同的步骤。
在步骤510,诸如补充服务器230之类的服务器从文章的元数据或者内容提取多个构成实体。多个构成实体中的每个构成实体是显现在内容或者元数据中的不同实体。各种技术可以被用来从内容提取实体。在一个实施例中,文章中的每个独特的单词都被看做为构成实体。在一个实施例中,构成实体可以使用内容的句法和/或语义分析来标识,以标识统计上的重要单词或者短语。在一个实施例中,文章中的所有独特的专有名词都被标识为构成实体。在一个实施例中,构成实体是通过在预先定义的感兴趣的实体的词典中查找单词或者单词组合来标识的。其他变形可以依赖于额外的分析以及上述实施例的组合。
在步骤520,服务器从多个构成实体中选择一组主要实体。为了这样做,服务器可以针对每个实体遍历一个或多个排名处理。这些处理产生了每个构成实体的评分和/或构成实体的排名列表。排名可以基于多个因素,这些因素包括但不限于:每个实体在文章中的位置、实体在内容中显现的频率、实体显现在其中的句子的语言结构、以及实体被分类成的所属的实体类型(例如,人名、组织名称、地名)。在一个实施例中,排名至少部分地指示实体的“有关性”的度量(也就是说,实体与作为整体的文章的相关程度的度量,即从文章内容中移除实体导致内容的主要话题、或者主题的缺失的度量)。排名还可以或者替代用于对每个实体的其他方面(例如,实体与用户或者用户群组的相关性、或者实体与最近的新闻话题的相关性)进行量化。在一个实施例中,只有预先定义的数目的最高排名的主要实体被选择。在一个实施例中,只有具有高于阈值评分的评分的主要实体被选择。
在步骤530,服务器基于文章对一组相关实体进行标识。例如,服务器可以在相关实体的一个或多个数据库中查找该组主要实体中的每个实体的相关实体。作为另一个示例,服务器可以将整篇文章、该组构成实体、或者该组主要实体馈送到诸如相关实体标识组件250之类的一个或多个相关实体标识组件。
在一个实施例中,该组相关实体是通过首先标识一组候选相关实体,然后基于一个或多个排名处理对该组候选相关实体进行过滤来标识的。这些处理产生了每个相关实体的评分和/或相关实体的一个或多个排名列表。相关实体的排名可以基于贯穿本申请讨论的多个因素。在一个实施例中,每个相关实体至少部分地基于该相关实体与发现该相关实体所针对的主要实体的相关性来排名。这些度量中的因素可以包括但不限于:主要实体和相关实体的类别、这两个项在相同的搜索会话的记录数据中显现的频率、以及这两个项在一组文档中的相同文档中显现的频率。在一个实施例中,针对每个主要实体,只有预定数目的最高排名的相关实体被选择。在一个实施例中,只有具有比阈值评分高的评分的相关实体被选择。
在步骤540,服务器将该组一个或多个主要实体以及该组一个或多个相关实体聚集在一起,以形成一组候选实体,这些候选实体是将包括在文章的补充内容中的候选。
在步骤550,服务器对该组候选实体中的每个实体进行排名,以产生每个候选实体的评分和/或候选实体的排名列表。另外,服务器可以依赖于各种排名处理。在一个实施例中,服务器可以采用针对不同目标采用不同的排名处理,这些排名处理包括:优化点击率的排名、优化跨越更大的一组文章的实体范围的排名、或者优化来自广告或者搜索结果的收入的排名。排名处理可以基于各种因素,这些因素包括但不限于:与实体相关联的搜索收入、主要实体“有关性”评分、相关实体与它们的相应主要实体的相关性排名、与特定用户或者用户群组的相关性、服务器以前提供的补充中的每个实体的搜索结果被呈现和/或点击的频率、以及每个实体的流行程度的时间敏感的度量(如每个实体在搜索记录、浏览历史、以及最近的新闻或者社会媒体文章中出现的频率所指示的)。注意,这些因素中的一些因素还可以用在对构成实体或者候选相关实体进行排名的处理中。
在步骤560,服务器至少部分地基于步骤550的排名对该组候选实体进行过滤,以产生最终的一组实体。在一个实施例中,针对该最终的一组实体,只有预定数目的最高排名的候选实体被选择。在一个实施例中,只有具有比阈值评分更高的评分的候选实体被选择。
在一个实施例中,额外的过滤器被用于标识该最终的一组实体。例如,服务器可以从最高排名的候选实体开始进行处理一直进行到预定数目的实体被选择为止,对每个实体进行处理以确保其满足特定准则。如果实体满足预定准则,则该实体被选入该最终的一组实体中。预定准则可以包括例如,针对实体获取的搜索结果的质量(例如,搜索结果与结果的相关性的度量)、针对实体获取的搜索结果的数目、针对一组预定类别的搜索结果中的每个搜索结果获取的搜索结果的数目(例如,服务器可以要求每个最终实体具有至少一个视频、两个图片、以及三个新闻搜索结果)、搜索结果是否至少包括针对特定目标域的预定数目的点击(例如,新闻组织、高收入域、或者用户支持的域)、以及搜索是否避免了针对目标域的过多搜索结果(例如,最近的搜索结果中的已经被过于频繁地返回的域、或者被标识为低质量和/或恶意的域)。
在一个实施例中,以上提到的过滤步骤也可以在选择主要和/或相关实体时被执行或者被替代执行。
在步骤570,对于该最终的一组实体中的每个特定实体,服务器使用该特定实体作为搜索项针对一个或多个搜索库执行一个或多个查询。例如,服务器可以在视频库、网页库、以及Wikipedia数据库中对该最终的一组实体中的每个实体进行搜索。其中服务器可以根据该步骤执行搜索的其他可能的库包括但不限于:视频库、图像库、网页库、音频文件库、新闻文章库、社会媒体库、博客条目库、电影元数据库、事件日历库、股票报价库、地图库、体育评分库、装运追踪数据库、词典条目库、引用条目库等。
在一个实施例中,预先定义被搜索的库。在一个实施例中,搜索库可以由从服务器请求补充的实体指定。在一个实施例中,库可以根据生成补充所针对的文章的类型或者题目类别而改变。在一个实施例中,库可以根据实体本身而改变。例如,服务器可以将实体发送给查询计划组件,其中查询计划组件基于诸如相关性、用户偏好、以及收入之类的因素确定多个预定库中的哪个库可产生最佳搜索结果。例如,查询计划单元可以确定视频、音乐、和社会媒体库中的每个库中的搜索对于“黑眼豆豆合唱团(Black Eyed Peas)”实体是最佳的,但是确定针对Wikipedia数据库和新闻文章全集的搜索对于“加纳(Ghana)”实体是最佳的。
在步骤580,服务器通过对作为服务器执行针对最终的一组实体中的每个实体的一个或多个查询的结果取回的一些或所有信息进行组织和格式化,来生成补充。服务器针对每个实体生成区段,其中每个区段都包括针对该实体获取的至少一些搜索结果。这些区段例如根据步骤550的排名被组织,从而使得最相关的区段被首先列出和/或使得最相关的区段首先可见。或者,这些区段可以基于一些其他排名(例如,用户偏好和/或广告收入)被组织。服务器根据各种模板或者布局规则执行格式化,从而生成文章的补充。用于对作为补充的信息进行格式化的示例技术在本公开的其他章节中讨论。该格式化可以被卸载到例如联合搜索组件上。
5.0实施示例
5.1选择主要实体
图6是示出用于选择主要实体的示例技术的流程图600。流程图600的步骤可以由例如补充服务器与一个或多个实体提取组件协作执行,以根据图5的步骤510和520来标识并选择主要实体。流程图600示出了用于标识主要实体的处理的一个示例。其他处理可以包括以相同或者不同次序配置的更多、更少、或者不同的步骤。
在步骤610,补充服务器利用基于词典的实体提取组件来从文章中提取第一组实体。这种组件的示例是前面提到的CAP,但是可以使用任意一种基于词典的提取组件。基于词典的提取组件可以对文章的内容进行分析,并且查找存储在预先定义的实体的数据库中的实体。提取组件可以有选择地对实体进行排名和/或过滤。
在步骤620,补充服务器有选择地从第一组实体中移除已经被归类为概念或者地名的实体。
在步骤630,补充服务器利用名称实体识别组件来从文章中提取额外的第二组实体。这种组件的示例是基于语法的斯坦福命名实体识别器系统,但是可以使用任意一种命名实体识别组件。命名实体识别组件依赖于各种自然语言处理技术来识别文章的内容中的诸如人物、组织、或者地点之类的“命名实体”。命名实体识别组件对基于词典的实体提取组件形成补充,原因在于它们二者都可以捕捉另一个组件漏掉的实体。
在步骤640,补充服务器合并第一组实体和第二组实体,以产生一组独特的候选主要实体。
在步骤650,根据候选主要实体在文章中的出现频率对候选主要实体进行分类,然后根据候选主要实体在文章中的位置对候选主要实体进行分类。
在步骤660,所有具有低于预定阈值的频率的实体被从该组候选主要实体中移除,从而生成了一组主要实体。例如,该组主要实体仅可以包括在文章中出现一次以上的实体。
在步骤670,该组主要实体可以被基于任意数目的其他过滤准则进一步过滤。例如,该组主要实体可以被过滤为仅包括通过图7中所示的步骤其相关实体被标识出来的主要实体。
5.2选择相关实体
图7是示出用于选择相关实体的示例技术的流程图700。流程图700的步骤可以由例如补充服务器协同一个或多个相关实体标识组件执行,以根据图5的步骤530标识并选择相关实体。流程图700示出了用于标识相关实体的处理的一个示例。其他处理可以包括被以相同或者不同次序配置的更多、更少、或者不同的步骤。
在步骤710,补充服务器对从定位相关实体的处理所针对的文章中提取的一组探测实体进行标识。例如,补充服务器可以利用根据流程图600的步骤标识出的一组主要实体作为探测实体。
在步骤720,补充服务器利用一个或多个相关实体标识组件来标识一组探测实体中的每个实体的一组候选相关项。在一个实施例中,至少三个相关实体标识组件被用于每个探测实体,这三个组件被分别集中在搜索查询记录、人输入关系数据、以及在给定时间段(例如,后六个月)中收集的文章全集的内容上。
在步骤730,非实体产生的项被从每个候选相关项组中移除,从而产生了每个探测实体的一组候选相关实体。非实体产生的项可以例如经由词典查找或者网络搜索来标识。
在步骤740,对于一组探测实体中的每个探测实体,对于探测实体的相应候选相关实体组中的每个相关实体,补充服务器计算在给定时间段中收集的文章全集中的探测相关实体对的同时出现频率评分。也就是说,每个候选相关实体被基于该候选相关实体作为定位相关实体的探测实体在同一文档中出现的次数来评分。
在一个实施例中,可以针对文章全集中的多个类别的文档中的每个类别的文档,计算单独的类别同时出现频率评分。然后基于最高的类别同时出现频率评分(例如,最高的三个类别同时出现频率评分)来计算候选相关实体的总的同时出现频率评分。
在一个实施例中,时间衰减函数可以被用来计算同时出现频率评分,原因在于探测相关实体对在最近的文档中的同时出现相对于探测相关实体对在较远的文档中的同时出现被更重地加权。
可选地,在步骤750,补充服务器过滤出具有低于文章所属类别的预定阈值的类别同时出现频率评分的任意一个候选相关实体。在一个实施例中,在文章所属类别的类别同时出现频率评分上,步骤740中的总的同时出现频率评分被严重或者完全加权。
在步骤760,基于在步骤740中标识出的同时出现频率评分来过滤每组候选相关实体,从而生成每个探测实体的一组相关实体。这些组的扩展组(superset)可以被用作一组相关实体,用于例如图5的步骤530的目的。例如,具有低于阈值评分的同时出现频率评分的候选相关实体可以被排除。或者,针对给定的探测实体,只有最高的两个相关实体被选择。
在步骤770,可以基于任意数目的其他过滤准则对该组相关实体进行进一步过滤。
5.3从候选实体中选择最终的一组实体
图8是示出用于从包括主要实体和针对主要实体标识的相关实体二者的一组候选实体中选择最终的一组实体的示例技术的流程图800。流程图800的步骤可以由例如补充服务器与一个或多个实体排名组件协同执行,以根据图5的步骤550对实体进行排名。在一个实施例中,流程图800的一些或所有步骤也可以在对候选主要或相关实体进行排名时被执行或者被替代执行。流程图800示出了用于选择最终的一组实体的处理的一个示例。其他处理可以包括被以相同或不同次序配置的更多、更少、或者不同的步骤。
在步骤810,所有主要实体(即,出现在文章中的所有实体)被根据其他部分所讨论的“有关性”评分或者类似的排名评分进行排名。
在步骤820,补充服务器对在步骤810中排名最高的候选主要实体进行标识。或者,在步骤820在步骤820-880的第一次迭代之后被执行的情况下,补充服务器选择还未被考虑的最高排名的候选主要实体。
在步骤830,补充服务器获取主要实体的搜索结果。
在步骤835,如果在步骤830中获取的搜索结果满足某些预定的质量约束,则如在其他章节中所讨论的,主要实体被添加到该最终实体组中。
在步骤840,补充服务器在该组候选实体中标识基于步骤820的主要实体被定位的一组相关实体。
在步骤850,基于例如先前章节中讨论的同时出现评分算法对主要实体的该组相关实体进行排名。
在步骤860,补充服务器获取以前还没考虑的最高排名的相关实体的搜索结果。
在步骤865,如果在步骤860中获取的搜索结果满足某些预定的质量约束,则如其他章节中所讨论的,相关实体被添加到最终实体组中。
在步骤870,补充服务器确定相关实体组中的预定数目的实体是否已经被添加到最终实体组中,或者相关实体组中的所有实体是否已经被考虑。如果这两个条件中没有一个满足,则流程返回到步骤860。否则,流程进行到步骤880。在一个实施例中,补充服务器将其对任意给定的特定实体的相关实体的考虑限制于第一相关实体,以产生满足预定质量约束的搜索结果。在一个实施例中,没有限定预定数目的相关实体,并且针对于特定实体相关联的所有相关实体重复步骤860和865。
在步骤880,补充服务器确定预定数目的候选实体是否已经被添加到最终实体组,或者所有候选实体是否已经被考虑。如果这两个条件没有一个满足,则流程返回到步骤820。否则,流程进行到步骤890。例如,补充服务器可以将最终实体组的大小限制为4。
在步骤890,认为已经限定了最终实体组。
5.4根据基于质量的准则过滤实体
根据一个实施例,在步骤865和835中以及贯穿本公开讨论的搜索质量约束可以基于任意数目的因素,这些因素包括:总共返回的搜索结果的数目、在某个搜索垂直线或者类别中返回的搜索结果的数目、以及搜索结果与查询的相关性的度量。
在一个实施例中,补充服务器向查询计划组件和一个或多个搜索组件咨询,以过滤出搜索结果或者至少最高的搜索结果不满足相关性阈值的实体。可以使用任意一种适当的相关性排名算法来产生相关性的度量。在一个实施例中,每个搜索结果类型可以具有用于确定相关性的不同算法和/或不同的相关性阈值。例如,对于新闻全集中的实体的搜索可以包括基于每篇新闻文章与实体的相关性的定制度量对搜索结果中的新闻文章进行排名,而对于标准网络库中的实体的搜索可以包括根据与实体的相关性的更一般的度量来对搜索结果中的网络文档进行排名。在任何情况中,查询计划组件和/或搜索组件将相关性的度量传递回补充服务器,从而使得补充服务器确保实体的相关性的度量分别或者总体满足最小相关性评分。
在一个实施例中,补充服务器对实体进行过滤,从而使得在从各种搜索末端拿到搜索结果之后每个被选择的实体都具有特定类别的预定数目的搜索结果。例如,补充服务器可以被配置为确保每个实体产生至少两个质量图像结果、一个质量视频结果、三个质量新闻文章结果、以及相关网络搜索查询的六个质量结果。补充服务器忽略实体的重复搜索结果。
在一个实施例中,补充服务器确保实体的搜索结果产生了足以占据至少一个预先定义的联合结果模板的搜索结果。每个模板可以针对不同搜索垂直线要求不同数目的结果。例如,前一段中描述的准则可以反映标准新闻模板的需求。但是,即使实体不能产生符合标准新闻模板的需求的质量视频搜索结果,该实体也可以根据不同的联合结果模板的要求而产生引用数据库中的高质量搜索结果。
5.5对补充内容进行格式化
在一个实施例中,每个补充都包括最终实体组中的每个实体、以及最终实体组中的每个实体的联合搜索结果。可以针对每个实体及其联合搜索结果定义单独的区段。所有区段可以是一次可见的,或者某些区段最初被部分隐藏,然后可以通过在他们各自实体的标题条上点击而变得可见。至此,补充可以进一步包括指示客户端应该如何显示补充的指令和/或标记语言。在一个实施例中,对应于最高排名实体的区段最初是完全可见的,而其余区段在被用户选择之前保持被部分隐藏。在一个实施例中,作为被补充引用的代码或者补充所包括的代码的结果,可见区段在没有用户干涉的情况下被周期性地轮换。
在一个实施例中,搜索结果根据一个或多个模板被组织在补充中。模板可以基于补充相对于文章的定位和/或期望的显示设备而改变。例如,可以针对出现在标准网页中的侧边栏中的补充定义一个模板,可以针对出现在标准网页中的紧挨着文章下方的区段中的侧边栏定义另一个模板,可以针对移动网络浏览器中的补充的显示定义另一个模板,并且可以针对弹出补充定义另一模板,等等。
在一个实施例中,根据取回的信息,不同的布局可能是适当的。例如,如果对于特定实体的搜索产生了高质量的视频、图像和博客结果,则服务器可以生成包括处于补充左侧的最高排名的视频、处于补充中间的三个最高排名的图像、以及处于补充右侧的到博客文章的链接的补充。同时,如果对于特定实体的搜索产生了股票报价、Wikipedia摘录、以及高质量的新闻结果,则补充可以被组织为包括补充左侧的Wikipedia摘录、补充右上侧的股票报价、以及补充右下侧的到新闻文章和附随描述的链接。在一个实施例中,查询计划和/或联合搜索组件被用来确定每个实体的适当布局。
5.6用户个性化
在一个实施例中,补充服务器利用用户特定的数据来对主要实体、相关实体、以及候选实体进行排名或者重排名。排名可以至少部分地基于的用户特定的数据的类型可以包括但不限于:搜索查询历史、内容浏览历史、用户标识的偏好、以及其他用户行为数据。可以通过使用任何适当的部件监控用户动作来收集这种数据,然后可以将这种数据存储在库中(诸如由用户历史组件280执行)。在一个实施例中,除了或者代替用户特定的数据,补充服务器可以使排名至少部分地基于特定于用户是其成员的用户群组的类似数据。
所以,同时被不同用户请求的文章可以产生针对单独用户或者单独用户所属的群组进行适应修改的不同补充。例如,可以针对由于不同用户的浏览历史的不同产生的补充,选择不同实体。
在一个实施例中,可以基于诸如用户看起来所位于的大概地理坐标或者区域之类的基于位置的数据来对补充所基于的一些或者全部搜索结果进行个性化处理。例如,对于在机场旅行的用户正在观看的文章的显示在蜂窝电话上的补充可以不同于对于用户在她的家庭计算机上查看的文章的补充。各种机制可以被用来确定这种信息,这些机制包括GPS系统、将网络地址映射到一般坐标的数据库、用户偏好、以及用户输入等。
在一个实施例中,一些或者所有搜索结果可以利用社会分享控件来呈现。例如,补充中的每个项目可以包括“与朋友共享”按钮,其中该按钮在被点击时可促使该项目或者得出该项目的文章将被与用户群组共享。在一个实施例中,当用户通过例如点击项目而选择补充中的项目时,用户被提供以具有关于该项目的更多细节的页面。同时,用户的选择被记录,并且可以将用户对于该项目的选择通知给与用户相关联的用户群组。
5.7货币化
在一个实施例中,实体和/或搜索结果可以至少部分地基于货币化因素被排名。例如,一个实体可以被选择处于另一个实体之上,因为该实体将为搜索提供者带来更多收入。或者,一个实体可以被选择处于另一个实体之上,因为广告者已经安排向补充提供者支付了一定数量的货币,作为将基于该实体的搜索结果包括在补充中的交换。在一个实施例中,可以向各种广告者担保,某个数目的补充将包括某些实体。因而,排名处理可以尝试对实体选择进行平衡,从而使得对于每个广告者的承诺被实现。
在一个实施例中,针对有关实体的信息而搜索的至少一个库是广告库。广告的选择除了考虑来自文章或者与文章相关的实体外,还要考虑用户的线上购物或者浏览历史。另外,可以基于候选实体是否从广告库产生了高质量或者高收入的结果来对候选实体进行过滤。
5.8服务器优化
在一个实施例中,可以通过对在上述处理的各种阶段生成的数据进行缓存来优化补充服务器。例如,生成文章补充的步骤(例如,图3的步骤340或者图4的步骤430)不必响应于每个对于文章补充的请求而被执行。相反,可以针对对于文章补充的初始请求执行步骤340,并且可以缓存结果用于响应随后的请求。作为另一个示例,代替缓存整个补充,可以针对已经分析的文章缓存主要、相关和/或最终实体。在一个实施例中,数据可以基于每个用户或者每个群组被缓存。在一个实施例中,所缓存的数据版本周期性地过期,以允许反映更新后的时间敏感的排名特征的更新后的实体排名。
在一个实施例中,针对文章全集中的每篇文章,对主要实体和相关实体进行周期性地标识和排名。实体被存储在数据库中,供随后生成补充时使用。实体和排名随着时间被周期性地更新(例如,每周或者每个月),以补偿对实体进行标识和补偿所依赖的各种特征的变化。当新文章被添加到全集中时,可以自动从新文章捕捉实体。或者,补充服务器可以等待分析新文章直到下一个安排的周期性更新时间,或者直到补充服务器被要求响应于对文章的明确请求为止。
在一个实施例中,补充服务器执行并行运行时间系统,以同时从不同的搜索末端系统获取查询结果,从而实现对于补充请求的亚秒响应时间。
5.9时间敏感性
在一个实施例中,用于对实体进行排名的一个或多个因素可以是时间敏感的。例如,各种排名特征可以是以随着时间被更新的数据为基础的。或者,实体出现频率可以被加权,从而使得实体的更多的最近出现被给予更大的重要性。
因此,在一个实施例中,可以在不同时间为相同文章生成不同补充,即时该文章的内容没有改变。为文章生成的补充可以以多种方式随着时间而改变,该多种方式不仅包括这里呈现的搜索结果,而且包括所呈现的主要和/或相关实体、以及信息的整体组织。
5.10补充服务器API
在一个实施例中,代替将整个补充返回给请求者,补充服务器将实体和联合搜索结果返回给某些请求者,从而使得请求者可以根据他们自己的偏好对补充内容进行组织和格式化。对于这些请求者,补充服务器提供了两个主要API:“实体结果组”API和“实体搜索结果”API。第一个API将文章作为输入,并且返回包括补充的最终实体组的结果组(如以上描述所述)。第一个API可以有选择地返回最终实体组中的第一实体的单个联合搜索结果。第二个API将实体作为输入,并且返回实体的联合搜索结果。请求者可以例如将第一实体的联合搜索结果与允许用户选择针对文章标识的其他实体的菜单一起显示。响应于选择另一个实体,请求者可以请求所选择的实体的附加的联合搜索结果。
5.11杂项
根据一个实施例,可以从用户所请求的文章内容以外的输入提取主要实体。例如,可以从任意的文本文件、用户偏好组、用户的搜索历史、以及用户的浏览历史等选择主要实体。然后,可以将补充与任意内容一起显示给用户,或者将补充单独显示给用户。
6.0实施机构-硬件概述
根据一个实施例,这里描述的技术是由一个或多个专用计算设备执行的。专用计算设备可以被硬连接以执行这些技术,或者可以包括诸如被一直编程为执行这些技术的一个或多个专用集成电路(ASIC)或者现场可编程门阵列(FPGA)之类的数字电子设备,或者可以包括被编程为根据硬件、存储器、其他存储装置或者它们的组合中的程序指令执行这些技术的一个或多个通用硬件处理器。这种专用计算设备还可以将定制的硬连接逻辑、ASIC、或者FPGA与定制的程序结合在一起,来实现这些技术。专用计算设备可以是桌面计算机系统、便携式计算机系统、手持设备、联网设备、或者结合有硬连接和/或程序逻辑以实现这些技术的任何其他设备。
例如,图9是示出实现本发明的实施例的计算机系统900的框图。计算机系统900包括总线902或者用于传递信息的其他通信机构、以及与总线902耦合的用于处理信息的硬件处理器904。硬件处理器904可以是例如通用微处理器。
计算机系统900还包括耦合到总线902的用于存储将由处理器904执行的指令和信息的主存储器906(诸如,随即存取存储器(RAM)或者其他动态存储设备)。主存储器906还被用来在处理器904执行指令期间存储临时变量或者其他中间信息。这些指令在被存储在处理器904可访问的非临时存储媒介中时,使计算机系统900成为被定制为执行这些指令中所规定的操作的专用机器。
计算机系统900还包括耦合到总线902的用于存储静态信息和用于处理器904的指令的只读存储器(ROM)908或者其他静态存储设备。诸如磁盘或者光盘之类的存储设备910被提供并耦合到总线902,用于存储信息和指令。
计算机系统900还经由总线902被耦合到诸如阴极射线管(CRT)之类的显示器912,用于向计算机用户显示信息。包括数字字母和其他键的输入设备914被耦合到总线902,用于将信息和命令选择传递给处理器904。其他类型的用户输入设备是诸如鼠标、跟踪球、或者光标方向键之类的光标控件916,用于将方向信息和命令选择传递到处理器904并且用于控制光标在显示器912上的移动。该输入设备通常具有允许设备指定平面中的位置的第一轴(例如,x轴)和第二轴(例如,y轴)两个轴中的两个自由度。
计算机系统900可以使用定制的硬连接逻辑、一个或多个ASIC或者FPGA、硬件和/或程序逻辑来实现这里描述的技术,其中该定制的硬连接逻辑、一个或多个ASIC或FPGA、硬件和/或程序逻辑与计算机系统一起使计算机系统900成为专用机器或者将计算机系统900编程为专用机器。根据一个实施例,这里描述的技术是计算机系统900响应于处理器904执行主存储器906中包含的一个或多个指令的一个或多个序列被执行的。这些指令可以被从诸如存储设备910之类的其他存储介质读入主存储器906。包含在主存储器906中的指令序列的执行使得处理器904执行这里描述的处理步骤。在替代实施例中,硬连接电路可以代替软件指令被使用或者与软件指令结合在一起被使用。
这里使用的项“存储媒介”是指存储促使机器以特定方式进行操作的数据和/或指令的任何非临时媒介。这种存储媒介可以包括非易失性媒介和/或易失性媒介。非易失性媒介包括诸如存储设备910之类的光或者磁盘。易失性媒介包括诸如主存储器906之类的动态存储器。存储媒介的一般形式包括例如,柔性盘、软盘、硬盘、固态驱动器、磁带、或者任何其他磁数据存储介质、CD-ROM、任何其他光数据存储介质、任何具有孔洞图案的其他物理介质、RAM、PROM、以及EPROM、FLASH-EPROM、NVRAM、任何其他存储器芯片或者盒。
存储媒介不同于传输媒介,但是可以与传输媒介一起使用。传输媒介参与在存储媒介之间传输信息。例如,传输媒介包括同轴电缆、铜线、以及光纤(包括包含总线902的电线)。传输媒介还可以采用声波或者广播的形式(诸如,在无线电波或者红外数据通信器件生成的波)。
在将一个或多个指令的一个或多个序列承载到处理器904上以供执行的过程中可以涉及各种形式的媒介。例如,指令最初可以被承载在远程计算机的磁盘或者固态驱动器上。远程计算机可以将指令装载到其动态存储器中,并且使用调制解调器通过电话线发送指令。计算机系统900本地的调制解调器可以在电话线上接收数据,并使用红外发射机将数据转换为红外信号。红外探测器可以接收承载在红外信号中的数据,并且适当的电路可以将数据放在总线902上。总线902将数据承载到主存储器906,处理器904从主存储器906取回指令并且执行指令。由主存储器906接收的指令可选地在被处理器904执行之前或者之后被存储在存储设备910上。
计算机系统900还包括耦合到总线902的通信接口918。通信接口918向连接至本地网络922的网络链路920提供两路数据通信耦合。例如,通信接口918可以是综合业务数字网(ISDN)卡、电缆调制解调器、卫星调制解调器、或者提供到相应类型的电话线路的数据通信连接的调制解调器。作为另一个示例,通信接口918可以是局域网(LAN)卡,以提供到兼容的LAN的数据通信连接。无线链路也可以实现。在任何这种实施方式中,通信接口918都发送并接收承载代表各种类型的信息的数字数据流的电、电磁或者光信号。
网络链路920通常通过一个或多个网络向其他数据设备提供数据通信。例如,网络链路920可以通过本地网络922向主机计算机924或者由互联网服务提供商(ISP)926操作的数据装备提供连接。ISP 926又可以通过现在通常被称为“互联网”928的世界范围的分组数据通信网络提供数据通信服务。本地网络922和互联网928二者都使用承载数字数据流的电、电磁或者光信号。通过各种网络的信号、网络链路920上的信号、以及通过通信接口918的信号(它们将数字数据承载到计算机系统900并且承载来自计算机系统900的数字信号)是传输媒介的示例形式。
计算机系统900可以通过网络、网络链路920以及通信接口918发送消息以及接收包括程序代码在内的数据。在互联网示例中,服务器930可以通过互联网928、ISP 926、本地网络922、以及通信接口918传送应用程序的请求代码。
所接收的代码在其被接收时由处理器904执行,和/或被存储在存储设备910或者其他非易失性存储装置中供以后执行。
7.0扩展和替代
在前面的说明书中,已经参考随实施方式的不同而不同的各种具体细节描述了本发明的实施例。所以,有关本发明是什么、以及申请人希望的本发明是什么的唯一且排他的指示符是本申请公开的权利要求组(这些权利要求包括任何随后的修正)。针对这些权利要求中包含的项明确阐述的任何定义都应该支配这些权利要求中所使用的项的含义。所以,在权利要求中没有特别陈述的限制、元件、性质、特征、优点或属性不应该以任何方式限制该权利要求的范围。因此,本说明书和附图被认为具有说明性的而非限制性的意义。

Claims (14)

1.一种方法,包括:
从文章中提取一组构成实体;
从所述一组构成实体中选择最好地反映所述文章的一组主要实体;
基于所述一组主要实体,选择一组相关实体;
基于所述一组主要实体和所述一组相关实体,形成一组候选实体;
对所述一组候选实体进行排名;
基于所述一组候选实体的排名从所述一组候选实体中选择最终一组实体,其中所述最终一组实体的组小于所述一组候选实体的组;
生成所述文章的补充,所述补充包括所述最终一组实体中的每个实体的搜索结果;
其中,所述方法是由一个或多个计算设备执行的。
2.根据权利要求1所述的方法,其中,所述补充还包括所述最终一组实体中的每个实体。
3.根据权利要求1至2中任一项所述的方法,
其中,所述补充是在第一时间生成的第一补充;
其中,对所述一组候选实体进行排名、选择所述一组相关实体、或者选择所述一组主要实体的步骤中的一个或多个步骤至少部分地基于一组特征;
其中,所述方法还包括在第二时间执行权利要求1的步骤,以生成第二补充;并且
其中,所述第二补充由于所述一组特征中的至少一个特征的时间敏感的改变而不同于所述第一补充。
4.根据权利要求1至3中任一项所述的方法,其中,对所述一组候选实体进行排名、选择所述一组相关实体、或者选择所述一组主要实体的步骤中的一个或多个步骤至少部分地基于用户特定的数据,其中所述用户特定的数据包括所述用户的搜索历史或者所述用户的浏览历史中的至少一者。
5.根据权利要求1至4中任一项所述的方法,还包括:使客户端将所述补充与所述文章相关联地显示给用户。
6.根据权利要求1至5中任一项所述的方法,还包括:使客户端在包括所述文章和所述补充的结构化文档中将所述补充内联地显示给用户。
7.根据权利要求1至6中任一项所述的方法,
其中,提取所述一组构成实体包括:使用基于词典的查找和基于语法的识别算法二者来提取实体;
其中,选择所述一组主要实体包括:至少基于所述构成实体在所述文章中出现的频率来对所述一组构成实体进行排名;
其中,选择所述一组相关实体包括:
对于所述一组主要实体中的每个实体,在以下的一项或多项中的实体中搜索同时出现的相关实体:搜索查询日志的库、人输入的关系数据的库、以及文章全集;
对于所述一组主要实体中的每个实体,至少基于以同时出现频率为基础的搜索和排名处理来选择一个或多个相关实体;
其中,至少基于以下各项来选择所述最终一组实体:应用于所述一组候选实体中的每个实体的排名函数、以及确定所述最终一组实体中的每个实体的搜索结果满足预定准则,其中所述预定准则包括以下各项中的至少一项:所述搜索结果的质量度量、以及所述搜索结果的子集中的命中计数,其中所述子集与特定搜索垂直线有关。
8.根据权利要求1至7中任一项所述的方法,其中,对于所述最终一组实体中的每个实体,所述补充包括一组联合搜索结果,其中所述一组联合搜索结果中的每个联合搜索结果包括至少两组搜索结果,所述至少两组与至少两个不同的搜索库有关。
9.根据权利要求1至8中任一项所述的方法,其中,响应于对于所述补充的请求,至少动态地执行生成所述文章的补充的步骤,其中所述请求指示所述文章。
10.存储指令的一个或多个非瞬失计算机可读媒介,其中所述指令在被一个或多个计算设备执行时使得执行权利要求1-9中所述的方法中的任意一种方法。
11.一种计算机程序产品,被配置为使得执行权利要求1-9中所述的方法中的任意一个。
12.一种装置,包括被配置为实现权利要求1-9中所述的方法中的任意一个的一个或多个处理器。
13.一种计算机系统,包括:
在第一组一个或多个计算设备上运行的web服务器;
在第二组一个或多个计算设备上运行的补充服务器;
其中,所述web服务器向多个客户端提供网页;
其中,所述web服务器至少将文章内容和补充内容嵌入在至少第一网页中;
其中,所述web服务器部分地通过向所述补充服务器发送至少第一请求来生成所述补充内容,其中所述第一请求指示所述文章;
其中,所述补充服务器至少基于以下各项来对所述至少第一请求进行响应:从所述文章提取主要实体、基于所述主要实体标识相关实体、基于所述主要实体和所述相关实体选择最终一组实体、以及对于所述最终一组实体中的一个或多个实体生成联合搜索结果;并且
其中,所述补充内容包括所述最终一组实体和所述联合搜索结果。
14.一种系统,包括运行搜索服务器的一个或多个计算机设备,其中所述搜索服务器:
接收指示文章内容的请求;
基于所述文章内容,标识处于所述文章内容中或者与所述文章内容中的实体相关的多个实体;
对于所述多个实体中的每个实体,通过在多个搜索库中搜索所述实体来获取联合搜索结果;
基于所述搜索结果,生成所述文章的补充,其中所述补充包括所述多个实体和所述多个实体中的每个实体的联合搜索结果;以及
以所述补充来响应所述请求。
CN201180025293.3A 2010-06-28 2011-04-25 无限浏览 Active CN102906744B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/825,304 US8600979B2 (en) 2010-06-28 2010-06-28 Infinite browse
US12/825,304 2010-06-28
PCT/US2011/033797 WO2012003034A1 (en) 2010-06-28 2011-04-25 Infinite browse

Publications (2)

Publication Number Publication Date
CN102906744A true CN102906744A (zh) 2013-01-30
CN102906744B CN102906744B (zh) 2016-08-24

Family

ID=45353495

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180025293.3A Active CN102906744B (zh) 2010-06-28 2011-04-25 无限浏览

Country Status (7)

Country Link
US (2) US8600979B2 (zh)
EP (1) EP2586008A4 (zh)
JP (1) JP5608286B2 (zh)
KR (1) KR101506380B1 (zh)
CN (1) CN102906744B (zh)
TW (2) TWI461939B (zh)
WO (1) WO2012003034A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199885A (zh) * 2014-08-22 2014-12-10 广州三星通信技术研究有限公司 用于获取视频文件的关联内容的设备和方法
CN105339933A (zh) * 2013-06-10 2016-02-17 微软技术许可有限责任公司 通过查询扩展的新闻结果
CN106844322A (zh) * 2017-01-22 2017-06-13 百度在线网络技术(北京)有限公司 智能文章生成方法和装置
CN106897346A (zh) * 2016-08-04 2017-06-27 阿里巴巴集团控股有限公司 数据处理的方法及装置
CN115048904A (zh) * 2022-08-11 2022-09-13 北京金堤科技有限公司 一种实体展示方法、装置、存储介质及电子设备

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930438B (zh) 2009-06-19 2016-08-31 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
US9875306B2 (en) * 2010-08-30 2018-01-23 Google Inc. Navigation through a collection of electronic documents
US8615510B2 (en) * 2010-09-01 2013-12-24 Yahoo! Inc. Quick applications for search
WO2012034069A1 (en) * 2010-09-10 2012-03-15 Veveo, Inc. Method of and system for conducting personalized federated search and presentation of results therefrom
US20130145276A1 (en) * 2011-12-01 2013-06-06 Nokia Corporation Methods and apparatus for enabling context-aware and personalized web content browsing experience
US9589303B2 (en) * 2012-01-09 2017-03-07 Google Inc. Selective presentation of content types and sources in search
US9424353B2 (en) 2012-02-22 2016-08-23 Google Inc. Related entities
CN104428767B (zh) * 2012-02-22 2018-02-06 谷歌公司 用于识别相关实体的方法、系统和装置
US20130254176A1 (en) * 2012-03-21 2013-09-26 Apple Inc. Systems and Methods for Generating Search Queries
CN103365839B (zh) * 2012-03-26 2017-12-12 深圳市世纪光速信息技术有限公司 一种搜索引擎的推荐搜索方法和装置
WO2013153489A2 (en) * 2012-04-09 2013-10-17 Thekkethala Pyloth Vincent Query based search engine for objects with binary characteristics
US20130298000A1 (en) * 2012-05-02 2013-11-07 Scott ZUCCARINO Socially relevant content in a news domain
US20140019126A1 (en) * 2012-07-13 2014-01-16 International Business Machines Corporation Speech-to-text recognition of non-dictionary words using location data
US20140071157A1 (en) * 2012-09-07 2014-03-13 Htc Corporation Content delivery systems with prioritized content and related methods
WO2014110048A1 (en) * 2013-01-09 2014-07-17 Amazon Technologies, Inc. Browser interface for accessing supple-mental content associated with content pages
US20140195890A1 (en) * 2013-01-09 2014-07-10 Amazon Technologies, Inc. Browser interface for accessing supplemental content associated with content pages
US9405775B1 (en) * 2013-03-15 2016-08-02 Google Inc. Ranking videos based on experimental data
US9262510B2 (en) 2013-05-10 2016-02-16 International Business Machines Corporation Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
US9715548B2 (en) 2013-08-02 2017-07-25 Google Inc. Surfacing user-specific data records in search
US9117280B2 (en) * 2013-08-29 2015-08-25 Microsoft Technology Licensing, Llc Determining images of article for extraction
US9251136B2 (en) * 2013-10-16 2016-02-02 International Business Machines Corporation Document tagging and retrieval using entity specifiers
US9646032B2 (en) 2013-10-24 2017-05-09 Microsoft Technology Licensing, Llc Temporal user engagement features
US9235638B2 (en) 2013-11-12 2016-01-12 International Business Machines Corporation Document retrieval using internal dictionary-hierarchies to adjust per-subject match results
US9727545B1 (en) * 2013-12-04 2017-08-08 Google Inc. Selecting textual representations for entity attribute values
US20150178266A1 (en) 2013-12-20 2015-06-25 Google Inc. Entity-based summarization for electronic books
CN103927354A (zh) 2014-04-11 2014-07-16 百度在线网络技术(北京)有限公司 交互式搜索及推荐方法和装置
US9444797B2 (en) * 2014-07-10 2016-09-13 Empire Technology Development Llc Protection of private data
US11763173B2 (en) 2014-07-28 2023-09-19 Iris.Tv, Inc. Ensemble-based multimedia asset recommendation system
US9965459B2 (en) 2014-08-07 2018-05-08 Accenture Global Services Limited Providing contextual information associated with a source document using information from external reference documents
US9965474B2 (en) 2014-10-02 2018-05-08 Google Llc Dynamic summary generator
CN104268297A (zh) * 2014-10-28 2015-01-07 江苏惠居乐信息科技有限公司 一种基于新闻的大数据分析系统
JP6324326B2 (ja) * 2015-01-23 2018-05-16 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
US10509834B2 (en) 2015-06-05 2019-12-17 Apple Inc. Federated search results scoring
US10755032B2 (en) 2015-06-05 2020-08-25 Apple Inc. Indexing web pages with deep links
US10621189B2 (en) 2015-06-05 2020-04-14 Apple Inc. In-application history search
US10592572B2 (en) 2015-06-05 2020-03-17 Apple Inc. Application view index and search
US10509833B2 (en) 2015-06-05 2019-12-17 Apple Inc. Proximity search scoring
US10162864B2 (en) * 2015-06-07 2018-12-25 Apple Inc. Reader application system utilizing article scoring and clustering
US10152478B2 (en) * 2015-06-07 2018-12-11 Apple Inc. Apparatus, system and method for string disambiguation and entity ranking
US10152521B2 (en) * 2016-06-22 2018-12-11 Google Llc Resource recommendations for a displayed resource
US10051108B2 (en) 2016-07-21 2018-08-14 Google Llc Contextual information for a notification
WO2018064294A1 (en) * 2016-09-28 2018-04-05 Michael John Wakerly Mobile web browser providing contextual actions based on web page content
JP6780548B2 (ja) * 2017-03-03 2020-11-04 富士通株式会社 特徴語分類プログラム、特徴語分類方法および情報処理装置
JP6839360B2 (ja) * 2017-05-15 2021-03-10 富士通株式会社 表示プログラム、表示方法および表示装置
CN107193997A (zh) * 2017-06-13 2017-09-22 刘建钦 一种户外广告点位展示及广告方案制定方法
US11327984B2 (en) * 2017-10-31 2022-05-10 Yahoo Assets Llc Computerized systems and methods for query expansion using displayed objects
CN108376147B (zh) * 2018-01-24 2021-09-28 北京一览科技有限公司 一种用于获得视频的评价结果信息的方法和装置
US11055742B2 (en) 2018-01-30 2021-07-06 Walmart Apollo, Llc Automated mechanisms to resolve explore-exploit dilemma with adaptive revival opportunities
US11042895B2 (en) 2018-01-30 2021-06-22 Walmart Apollo, Llc Automatic resolution of the explore-exploit decision in omnichannel settings
US11030634B2 (en) 2018-01-30 2021-06-08 Walmart Apollo, Llc Personalized mechanisms to resolve explore-exploit dilemma with dynamically shared learnings
US11232145B2 (en) * 2018-03-20 2022-01-25 Microsoft Technology Licensing, Llc Content corpora for electronic documents
US20190340199A1 (en) * 2018-05-07 2019-11-07 Google Llc Methods and Systems for Identifying, Selecting, and Presenting Media-Content Items Related to a Common Story
JP6490863B1 (ja) * 2018-09-07 2019-03-27 一般社団法人ウェブ新聞社 サーバ装置、Webサーバ装置、サーバシステム、サーバ装置用プログラム、Webサーバ装置用プログラムおよびWebサーバ装置の連携方法
RU2739554C1 (ru) * 2018-12-13 2020-12-25 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для формирования карточки объекта
CN109902149B (zh) 2019-02-21 2021-08-13 北京百度网讯科技有限公司 查询处理方法和装置、计算机可读介质
GB201904167D0 (en) * 2019-03-26 2019-05-08 Benevolentai Tech Limited Name entity recognition with deep learning
US11640504B2 (en) 2019-05-17 2023-05-02 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof
US11194819B2 (en) 2019-06-27 2021-12-07 Microsoft Technology Licensing, Llc Multistage feed ranking system with methodology providing scoring model optimization for scaling
US11704600B2 (en) * 2019-06-27 2023-07-18 Microsoft Technology Licensing, Llc Multistage feed ranking system with methodology providing scalable multi-objective model approximation
US11743353B1 (en) * 2019-12-18 2023-08-29 Baby List, Inc. System, method, and computer program for providing a content feed to a user related to a registry and a registry event having an event timeline
JP7354019B2 (ja) * 2020-03-02 2023-10-02 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
JP7323484B2 (ja) * 2020-03-19 2023-08-08 ヤフー株式会社 情報処理装置、情報処理方法、及びプログラム
CN114077713A (zh) * 2020-08-11 2022-02-22 华为技术有限公司 内容推荐方法、电子设备和服务器
US20220309055A1 (en) * 2021-03-23 2022-09-29 Microsoft Technology Licensing, Llc Intelligent assistant for a browser using content and structured data
US12045243B2 (en) * 2021-12-04 2024-07-23 International Business Machines Corporation Ranking entity search results based on information density
CN114328765B (zh) * 2022-03-04 2022-05-31 四川大学 新闻传播预测方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5937422A (en) * 1997-04-15 1999-08-10 The United States Of America As Represented By The National Security Agency Automatically generating a topic description for text and searching and sorting text by topic using the same
US20050154746A1 (en) * 2004-01-09 2005-07-14 Yahoo!, Inc. Content presentation and management system associating base content and relevant additional content
US20060106847A1 (en) * 2004-05-04 2006-05-18 Boston Consulting Group, Inc. Method and apparatus for selecting, analyzing, and visualizing related database records as a network
CN101004762A (zh) * 2007-01-10 2007-07-25 张百川 一种动态多维互联网网页系统
CN101359332A (zh) * 2008-09-02 2009-02-04 浙江大学 具有语义分类功能的可视化搜索界面的设计方法
CN101477557A (zh) * 2009-01-13 2009-07-08 苏州智讯科技有限公司 一种理解用户互联网浏览行为的媒体展现平台
CN101583948A (zh) * 2006-12-11 2009-11-18 姜旻秀 为正在显示的面向内容的运动画面提供广告的方法和系统
CN101641694A (zh) * 2007-02-16 2010-02-03 雅虎公司 通过若干搜索引擎实现的联合搜索

Family Cites Families (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5446891A (en) 1992-02-26 1995-08-29 International Business Machines Corporation System for adjusting hypertext links with weighed user goals and activities
US6202058B1 (en) 1994-04-25 2001-03-13 Apple Computer, Inc. System for ranking the relevance of information objects accessed by computer users
US5758257A (en) 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US6029195A (en) 1994-11-29 2000-02-22 Herz; Frederick S. M. System for customized electronic identification of desirable objects
DE69531599T2 (de) 1994-12-20 2004-06-24 Sun Microsystems, Inc., Mountain View Verfahren und Gerät zum Auffinden und Beschaffen personalisierter Informationen
US6092049A (en) 1995-06-30 2000-07-18 Microsoft Corporation Method and apparatus for efficiently recommending items using automated collaborative filtering and feature-guided automated collaborative filtering
US5734887A (en) 1995-09-29 1998-03-31 International Business Machines Corporation Method and apparatus for logical data access to a physical relational database
AU1566597A (en) 1995-12-27 1997-08-11 Gary B. Robinson Automated collaborative filtering in world wide web advertising
US5727129A (en) 1996-06-04 1998-03-10 International Business Machines Corporation Network system for profiling and actively facilitating user activities
US5890152A (en) 1996-09-09 1999-03-30 Seymour Alvin Rapaport Personal feedback browser for obtaining media files
US6128663A (en) 1997-02-11 2000-10-03 Invention Depot, Inc. Method and apparatus for customization of information content provided to a requestor over a network using demographic information yet the user remains anonymous to the server
US5895470A (en) 1997-04-09 1999-04-20 Xerox Corporation System for categorizing documents in a linked collection of documents
US5937397A (en) 1997-04-10 1999-08-10 International Business Machines Corporation Social learning inferencing engine for intelligent agent environment
US6049776A (en) 1997-09-06 2000-04-11 Unisys Corporation Human resource management system for staffing projects
US6134532A (en) * 1997-11-14 2000-10-17 Aptex Software, Inc. System and method for optimal adaptive matching of users to most relevant entity and information in real-time
US6249740B1 (en) 1998-01-21 2001-06-19 Kabushikikaisha Equos Research Communications navigation system, and navigation base apparatus and vehicle navigation apparatus both used in the navigation system
US6018738A (en) 1998-01-22 2000-01-25 Microsft Corporation Methods and apparatus for matching entities and for predicting an attribute of an entity based on an attribute frequency value
US7050992B1 (en) 1998-03-03 2006-05-23 Amazon.Com, Inc. Identifying items relevant to a current query based on items accessed in connection with similar queries
AU757550B2 (en) 1998-03-03 2003-02-27 Amazon.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
JP3547074B2 (ja) * 1998-05-14 2004-07-28 日本電信電話株式会社 データ検索方法、その装置および記録媒体
US6349299B1 (en) 1998-12-24 2002-02-19 International Business Machines Corporation System and method for storing electronic contact information into an electronic address book
US6941321B2 (en) 1999-01-26 2005-09-06 Xerox Corporation System and method for identifying similarities among objects in a collection
US6598054B2 (en) 1999-01-26 2003-07-22 Xerox Corporation System and method for clustering data objects in a collection
AU5934900A (en) 1999-07-16 2001-02-05 Agentarts, Inc. Methods and system for generating automated alternative content recommendations
NZ518635A (en) 1999-11-02 2004-02-27 Clarity Inc E Verbal classification system for the efficient sending and receiving of information
US6931397B1 (en) 2000-02-11 2005-08-16 International Business Machines Corporation System and method for automatic generation of dynamic search abstracts contain metadata by crawler
US6564209B1 (en) 2000-03-08 2003-05-13 Accenture Llp Knowledge management tool for providing abstracts of information
US20020062247A1 (en) 2000-08-29 2002-05-23 Allen Bradley P. Selecting web site content to be displayed to a web site visitor based upon a probability distribution
US20020103798A1 (en) 2001-02-01 2002-08-01 Abrol Mani S. Adaptive document ranking method based on user behavior
US6728706B2 (en) 2001-03-23 2004-04-27 International Business Machines Corporation Searching products catalogs
US20050193335A1 (en) 2001-06-22 2005-09-01 International Business Machines Corporation Method and system for personalized content conditioning
US20030040850A1 (en) 2001-08-07 2003-02-27 Amir Najmi Intelligent adaptive optimization of display navigation and data sharing
US7398201B2 (en) 2001-08-14 2008-07-08 Evri Inc. Method and system for enhanced data searching
KR100438857B1 (ko) 2001-09-26 2004-07-05 엘지전자 주식회사 사용자 선호도 기반 멀티미디어 검색 시스템
US7162522B2 (en) 2001-11-02 2007-01-09 Xerox Corporation User profile classification by web usage analysis
US7203909B1 (en) 2002-04-04 2007-04-10 Microsoft Corporation System and methods for constructing personalized context-sensitive portal pages or views by analyzing patterns of users' information access activities
EP1860579A1 (en) 2002-08-30 2007-11-28 Sony Deutschland Gmbh Method to split a multiuser profile
US6947930B2 (en) 2003-03-21 2005-09-20 Overture Services, Inc. Systems and methods for interactive search query refinement
US7685296B2 (en) * 2003-09-25 2010-03-23 Microsoft Corporation Systems and methods for client-based web crawling
US7200638B2 (en) 2003-10-14 2007-04-03 International Business Machines Corporation System and method for automatic population of instant messenger lists
US20050108024A1 (en) 2003-11-13 2005-05-19 Fawcett John Jr. Systems and methods for retrieving data
US20050160107A1 (en) * 2003-12-29 2005-07-21 Ping Liang Advanced search, file system, and intelligent assistant agent
US20050216823A1 (en) * 2003-12-30 2005-09-29 Microsoft Corporation Assigning textual ads based on article history
US8065383B2 (en) 2004-05-17 2011-11-22 Simplefeed, Inc. Customizable and measurable information feeds for personalized communication
US8972856B2 (en) 2004-07-29 2015-03-03 Yahoo! Inc. Document modification by a client-side application
US7958115B2 (en) 2004-07-29 2011-06-07 Yahoo! Inc. Search systems and methods using in-line contextual queries
US7603349B1 (en) 2004-07-29 2009-10-13 Yahoo! Inc. User interfaces for search systems using in-line contextual queries
US7856441B1 (en) 2005-01-10 2010-12-21 Yahoo! Inc. Search systems and methods using enhanced contextual queries
US7962465B2 (en) 2006-10-19 2011-06-14 Yahoo! Inc. Contextual syndication platform
JP2006079454A (ja) * 2004-09-10 2006-03-23 Fujitsu Ltd 検索キーワード分析方法、検索キーワード分析プログラムおよび検索キーワード分析装置
JP2008521315A (ja) 2004-11-18 2008-06-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザープロファイルを更新するための装置および方法
US20060149710A1 (en) 2004-12-30 2006-07-06 Ross Koningstein Associating features with entities, such as categories of web page documents, and/or weighting such features
US7421426B2 (en) 2005-01-11 2008-09-02 International Business Machines Corporation Systems, methods, and media for utilizing electronic document usage information with search engines
US7584177B2 (en) * 2005-06-29 2009-09-01 Google Inc. Determination of a desired repository
US20070073651A1 (en) * 2005-09-23 2007-03-29 Tomasz Imielinski System and method for responding to a user query
JP2007122513A (ja) * 2005-10-28 2007-05-17 Dainippon Printing Co Ltd コンテンツ検索方法、及び、コンテンツ検索サーバ
US7739280B2 (en) 2006-03-06 2010-06-15 Veveo, Inc. Methods and systems for selecting and presenting content based on user preference information extracted from an aggregate preference signature
US7904448B2 (en) 2006-03-29 2011-03-08 Yahoo! Inc. Incremental update of long-term and short-term user profile scores in a behavioral targeting system
US20070260597A1 (en) 2006-05-02 2007-11-08 Mark Cramer Dynamic search engine results employing user behavior
US20070266025A1 (en) 2006-05-12 2007-11-15 Microsoft Corporation Implicit tokenized result ranking
CN100530183C (zh) 2006-05-19 2009-08-19 华为技术有限公司 一种收集用户数据的系统及方法
JP5220297B2 (ja) * 2006-10-17 2013-06-26 ヤフー株式会社 キーワードと条件に基づく広告配信方法
TWI337712B (en) 2006-10-30 2011-02-21 Inst Information Industry Systems and methods for measuring behavior characteristics, and machine readable medium thereof
WO2008053516A1 (fr) * 2006-10-30 2008-05-08 Cirius Technologies, Inc. Procédé, système et programme de fourniture d'informations publicitaires et base de données
US7555477B2 (en) * 2006-12-05 2009-06-30 Yahoo! Inc. Paid content based on visually illustrative concepts
US8423565B2 (en) * 2006-12-21 2013-04-16 Digital Doors, Inc. Information life cycle search engine and method
KR100757951B1 (ko) 2007-01-02 2007-09-11 김수현 웹페이지의 형태소 분석을 통한 검색 방법
US20080201643A1 (en) 2007-02-01 2008-08-21 7 Billion People, Inc. System for creating customized web content based on user behavioral portraits
CA2679094A1 (en) 2007-02-23 2008-08-28 1698413 Ontario Inc. System and method for delivering content and advertisements
US20080270151A1 (en) 2007-04-26 2008-10-30 Bd Metrics Method and system for developing an audience of buyers and obtaining their behavioral preferences to promote commerce on a communication network
US8301623B2 (en) 2007-05-22 2012-10-30 Amazon Technologies, Inc. Probabilistic recommendation system
KR20090003510A (ko) * 2007-06-14 2009-01-12 텔코웨어 주식회사 웹 페이지 링크정보 첨부 장치 및 그 방법
JP2009031931A (ja) * 2007-07-25 2009-02-12 Univ Waseda 検索語クラスタリング装置、検索語クラスタリング方法、検索語クラスタリングプログラム及び記録媒体
US20090037402A1 (en) 2007-07-31 2009-02-05 Rosie Jones System and method for predicting clickthrough rates and relevance
US20090083278A1 (en) 2007-09-26 2009-03-26 Yihong Zhao System and method for discovering and presenting social relationships between internet users and content
US7853558B2 (en) 2007-11-09 2010-12-14 Vibrant Media, Inc. Intelligent augmentation of media content
US20090171763A1 (en) 2007-12-31 2009-07-02 Yahoo! Inc. System and method for online advertising driven by predicting user interest
US7984004B2 (en) 2008-01-17 2011-07-19 Microsoft Corporation Query suggestion generation
US20090248514A1 (en) 2008-04-01 2009-10-01 Yahoo! Inc. System and method for detecting the sensitivity of web page content for serving advertisements in online advertising
US8051080B2 (en) 2008-04-16 2011-11-01 Yahoo! Inc. Contextual ranking of keywords using click data
US20090299945A1 (en) 2008-06-03 2009-12-03 Strands, Inc. Profile modeling for sharing individual user preferences
US8504558B2 (en) 2008-07-31 2013-08-06 Yahoo! Inc. Framework to evaluate content display policies
JP5238418B2 (ja) 2008-09-09 2013-07-17 株式会社東芝 情報推薦装置および情報推薦方法
US8635528B2 (en) * 2008-11-06 2014-01-21 Nexplore Technologies, Inc. System and method for dynamic search result formatting
US8244517B2 (en) 2008-11-07 2012-08-14 Yahoo! Inc. Enhanced matching through explore/exploit schemes
US8037067B1 (en) 2008-11-14 2011-10-11 United Services Automobile Association (Usaa) Systems and methods for tracking user activity at website
US8316020B1 (en) 2008-12-09 2012-11-20 Amdocs Software Systems Limited System, method, and computer program for creating a group profile based on user profile attributes and a rule
US8135739B2 (en) * 2008-12-29 2012-03-13 Microsoft Corporation Online relevance engine
US8301624B2 (en) 2009-03-31 2012-10-30 Yahoo! Inc. Determining user preference of items based on user ratings and user features
US8612435B2 (en) 2009-07-16 2013-12-17 Yahoo! Inc. Activity based users' interests modeling for determining content relevance

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5937422A (en) * 1997-04-15 1999-08-10 The United States Of America As Represented By The National Security Agency Automatically generating a topic description for text and searching and sorting text by topic using the same
US20050154746A1 (en) * 2004-01-09 2005-07-14 Yahoo!, Inc. Content presentation and management system associating base content and relevant additional content
US20060106847A1 (en) * 2004-05-04 2006-05-18 Boston Consulting Group, Inc. Method and apparatus for selecting, analyzing, and visualizing related database records as a network
CN101583948A (zh) * 2006-12-11 2009-11-18 姜旻秀 为正在显示的面向内容的运动画面提供广告的方法和系统
CN101004762A (zh) * 2007-01-10 2007-07-25 张百川 一种动态多维互联网网页系统
CN101641694A (zh) * 2007-02-16 2010-02-03 雅虎公司 通过若干搜索引擎实现的联合搜索
CN101359332A (zh) * 2008-09-02 2009-02-04 浙江大学 具有语义分类功能的可视化搜索界面的设计方法
CN101477557A (zh) * 2009-01-13 2009-07-08 苏州智讯科技有限公司 一种理解用户互联网浏览行为的媒体展现平台

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105339933A (zh) * 2013-06-10 2016-02-17 微软技术许可有限责任公司 通过查询扩展的新闻结果
CN105339933B (zh) * 2013-06-10 2019-08-06 微软技术许可有限责任公司 通过查询扩展的新闻结果
CN104199885A (zh) * 2014-08-22 2014-12-10 广州三星通信技术研究有限公司 用于获取视频文件的关联内容的设备和方法
CN106897346A (zh) * 2016-08-04 2017-06-27 阿里巴巴集团控股有限公司 数据处理的方法及装置
US10878054B2 (en) 2016-08-04 2020-12-29 Advanced New Technologies Co., Ltd. Data processing method and apparatus
CN106844322A (zh) * 2017-01-22 2017-06-13 百度在线网络技术(北京)有限公司 智能文章生成方法和装置
CN115048904A (zh) * 2022-08-11 2022-09-13 北京金堤科技有限公司 一种实体展示方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
WO2012003034A1 (en) 2012-01-05
CN102906744B (zh) 2016-08-24
US20110320437A1 (en) 2011-12-29
US9355185B2 (en) 2016-05-31
KR101506380B1 (ko) 2015-03-26
TWI529549B (zh) 2016-04-11
JP2013534673A (ja) 2013-09-05
JP5608286B2 (ja) 2014-10-15
US8600979B2 (en) 2013-12-03
EP2586008A1 (en) 2013-05-01
TW201502824A (zh) 2015-01-16
KR20130016339A (ko) 2013-02-14
EP2586008A4 (en) 2016-04-27
TWI461939B (zh) 2014-11-21
TW201202980A (en) 2012-01-16
US20140143243A1 (en) 2014-05-22

Similar Documents

Publication Publication Date Title
CN102906744A (zh) 无限浏览
US20220020056A1 (en) Systems and methods for targeted advertising
US10366080B2 (en) Methods and systems for using community defined facets or facet values in computer networks
US11023513B2 (en) Method and apparatus for searching using an active ontology
US10528637B2 (en) Systems and methods for recommended content platform
CN101351798B (zh) 带有隐含用户意图挖掘的动态搜索
KR101475552B1 (ko) 사용자에게 컨텐츠를 제공하기 위한 방법 및 서버
CN101495955B (zh) 移动设备检索与导航
CN106415537B (zh) 将本地应用搜索结果插入到web搜索结果中
CN1934569B (zh) 集成有用户注释的搜索系统和方法
CN100401292C (zh) 用于使用倾向分析进行搜索查询处理的系统和方法
TWI471737B (zh) 具搜尋結果之蹤跡識別系統與方法
CN108885624B (zh) 信息推荐系统及方法
Cleger-Tamayo et al. Top-N news recommendations in digital newspapers
US20110321003A1 (en) Systems and Methods For Providing Modular Configurable Creative Units For Delivery Via Intext Advertising
CN101329674A (zh) 一种提供个性化搜索的系统和方法
CN101273348A (zh) 结构化数据的导航
Santesteban et al. How big data confers market power to big tech: Leveraging the perspective of data science
US11379473B1 (en) Site rank codex search patterns
CN105706081A (zh) 结构化信息链接注释
US20130211912A1 (en) System, apparatus and method for providing advertisement based on user interest information
Dong et al. Improving sequential recommendation with attribute-augmented graph neural networks
KR101347220B1 (ko) 광고 컨텐츠 제공 시스템
WO2004084059A1 (en) Method and system for arranging a search result list using internet

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1179709

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20170817

Address after: California, USA

Patentee after: YAHOO Holdings

Address before: California, USA

Patentee before: YAHOO! Inc.

TR01 Transfer of patent right
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180402

Address after: American New York

Patentee after: Aoshi Co.

Address before: California, USA

Patentee before: YAHOO Holdings

REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1179709

Country of ref document: HK

TR01 Transfer of patent right

Effective date of registration: 20210325

Address after: New York State, USA

Patentee after: Verizon media

Address before: New York State, USA

Patentee before: Aoshi Co.

TR01 Transfer of patent right
CP01 Change in the name or title of a patent holder

Address after: New York, United States

Patentee after: Yahoo Advertising Technology Co.,Ltd.

Address before: New York, United States

Patentee before: Verizon media

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20221011

Address after: California, USA

Patentee after: Yahoo Assets Co.,Ltd.

Address before: New York, United States

Patentee before: Yahoo Advertising Technology Co.,Ltd.

TR01 Transfer of patent right