CN102521308B - 实体追随 - Google Patents

实体追随 Download PDF

Info

Publication number
CN102521308B
CN102521308B CN201110392689.3A CN201110392689A CN102521308B CN 102521308 B CN102521308 B CN 102521308B CN 201110392689 A CN201110392689 A CN 201110392689A CN 102521308 B CN102521308 B CN 102521308B
Authority
CN
China
Prior art keywords
entity
data
content
engine
followed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110392689.3A
Other languages
English (en)
Other versions
CN102521308A (zh
Inventor
蒋昭玮
X.勒格罗斯
R.H.小琼斯
R.潘查萨拉姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN102521308A publication Critical patent/CN102521308A/zh
Application granted granted Critical
Publication of CN102521308B publication Critical patent/CN102521308B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明概述了也解决数据源限制的真正的实体追随系统。当考察万维网内容中与实体有关的对象时,万维网用户指定一个或多个实体来实时追随。更具体地,本发明被通过在万维网浏览器中的对象上选择“追随”指针后动态爬行器的战略部署来引导,使得万维网用户可以自动指定要被追随的实体,以及当关于这样指定的实体的新信息变为可用时,以预定的时间间隔接收警报。本发明的万维网实体引擎被设计来在任何给定的时间发现趋向的实体,而同时生成对于这个实体的输出活动(即,信号)流。

Description

实体追随
发明领域
本发明针对用于万维网用户将一个或多个指定的实体(entity)与基于警报的追随(following)直接关联的系统和方法。更具体地,本发明针对通过向万维网用户提供给发动针对这样的被追随实体的万维网爬行(crawling)能力的选项,而正好在实体所在的地方追随它们。通过在用户接口处将所述追随与实体相关联,本发明在有关这样的被追随实体的信息被更新时,既直接地以浏览体验也间接地以警报体验,向万维网用户提供对这样的信息的访问。
背景技术
搜索引擎包括用于以受控的方式访问信息的各种盛行的(prevailing)实现。受欢迎的搜索引擎,诸如由BING®(BING是微软公司的商标)提供的搜索引擎,提供了支持按每天计的上百万次查询的基础结构。众所周知,搜索引擎典型地利用一个或多个自动收集万维网资源的程序(被称为“爬行器”或“蜘蛛”),所述万维网资源包括但不限于,网页、图像、视频、音频文件、Word文档、PDF等等。动态爬行器可常常被利用来追随实体,并提供关于这样的实体的更新数据。所有被检索的页的拷贝由搜索引擎创建,其将对下载的页加索引,以便提供快速搜索。由于大多数网页包含到其它网页的对象(诸如,链接),所以爬行器几乎可以在任何地方开始,且可以重复地追随从中心页找到的链接以索引新的资源。
常规的搜索引擎设计的问题在于,搜索的焦点被放在作为目标的信息的位置。访问关于这样的实体的信息是个并不总是直观的过程。如图1所示,不同的目标当前是围绕话题或“实体”10而被组织的,所述话题或“实体”10可以出现在网站14上组织的一个或多个页12上或是在任何其它的支持万维网的介质中。当前,万维网用户必须主动寻求涉及感兴趣的实体的相关馈送(feed)或动态内容,并且依赖于搜索引擎的最高匹配网页的排名来检索相关的数据。在通过搜索识别实体后,万维网用户为了追随这样的实体和接收想要的更新,必须指定该实体为感兴趣的实体。万维网用户可以选择通过预订RSS(Really Simple Syndication,简易信息聚合)馈送(或接收更新的动态内容的递送)而接收更新的实体内容。万维网用户可以采取创建警报(经由电子邮件、SMS、视频馈送、音频信号等等)的额外步骤,这些警报在特定的时间的基础上(每月、每周、每日或在更新发生时立即)被递送。
常规的实体追随没有针对其中大多数人使用搜索引擎的方式。随着互联网技术快速重构内容分发的方法,以及随着基于万维网的知识流变得日益数字化,所希望的是将万维网内容资源转变(translate)成更接近地复制实际的用户逻辑和直观的功能。虽然常规的RSS和警报系统提供某些类似的特征,但它们没有完全满足万维网用户实时追随指定的实体的需要。RSS将万维网用户限制为追随有关实体的单个数据源,而不是多个源(例如,是追随来自纽约时报的关于布鲁克林的报道 ,而不是针对关于布鲁克林的信息的大量的万维网内容)。允许万维网用户接收对于想要的实体的警报的任何相关联警报系统是基于数据来源(data-sourced)而不是实体本身的预订。
所以,所希望的是通过以下方式来利用用户体验(user experience,UX)设计去克服这样的限制,即:使得万维网用户体验成为该设计过程的一部分。具体地,随着信息空间变得更加利基(niche),希望提供延及全部的(over-arching)体系结构,其使得万维网用户能够使万维网上下文中的实体浮出水面(surface),而不管该上下文驻留在什么地方,并且同期地把警报功能与实体内容的更新相关联。
发明内容
本发明概述了也解决数据源限制和账户创建限制的真正的实体追随系统。当考察在万维网内容中的与实体有关的对象时,万维网用户指定要实时追随的一个或多个实体。更具体地,本发明被通过在选择万维网浏览器中的对象上的 “追随”指针后动态爬行器的战略部署来引导,以使得万维网用户可以自动指定要被追随的实体且选择性地浏览来自被追随的实体的更新馈送。另外,当关于这样的被指定实体的新信息变为可用时,用户可以以预定的时间间隔选择性地接收警报。
本发明的万维网实体引擎被设计成在任何给定时间发现趋向的(trending)实体,而同时生成输出活动(例如,信号)流用于这个活动。万维网内容,无论是来自馈送还是动态地生成的,都可以由所公开的实体注解(entity annotation)引擎用这些趋向的实体来注解。当被显示给万维网用户时,特别的视觉效果被施加到万维网内容中的被注解的实体(例如,通过诸如经由触摸屏、鼠标或等同设备来拖动交互指针)。万维网用户由此可以选择追随加亮的实体,在该选择后,当关于该实体的新信号在互联网上显现时,该引擎生成更新的数据馈送和/或要被发送到万维网用户的通知。
从以下的详细说明中,本发明的各种其它优点和特征将变得很容易明白。
附图说明
虽然本申请书以具体地指出本发明和清楚地要求保护本发明的权利要求来结束,但相信从结合附图进行的以下的说明中将更好地了解实施例,其中:
图1是被嵌入在至少一个网站页面中的实体内容的网络的示意图。
图2是通过其实践本发明的实体追随的、联网的计算机设备的框图。
图3是按照本发明的示范性实体追随体系结构。
图4是按照本发明的万维网用户接口的屏幕快照,经由其万维网用户指定要追随的实体。
具体实施方式
现在参照附图,其中同样的数字标识同样的单元。图2显示了用于计算设备100的示范性硬件和软件环境,所述计算设备100具有可被使用来实施上述实施例中的一个或多个的部件。为了本发明的目的,计算设备100可包括任何类型的计算机、计算机系统或其它可编程电子设备,包括客户计算机、服务器计算机、便携式计算机、手持计算机、移动电话、游戏设备、嵌入式控制器和它们的任何组合和/或等同物。而且,计算设备100可以通过使用例如在群集或其它分布式计算系统中的一个或多个联网的计算机而被实施。应当了解,图2所例示的示范性环境并不打算限制本发明,而是可以使用其它的替换硬件和/或软件环境,而不背离本发明的范围。而且,术语“计算设备”、“计算机设备”、“计算机”和“机器”应当可互换地使用,并且应当被理解为包括一个个地或联合地执行一组(或多组)指令来履行这里所讨论的方法中的任何一个或多个的计算设备的任何集合。
计算设备100典型地包括中央处理单元(CPU)102,其具有被耦合到存储器104的一个或多个微处理器。存储器104可以表示随机存取存储器(RAM)设备,包括计算设备100的主存储装置,以及任何辅助级别的存储器(包括,但不限于,高速缓冲存储器、非易失性或备份存储器,诸如可编程或闪速存储器、只读存储器及它们的任何组合和/或等同物)。另外,存储器104可被看作为包括在CPU 102中的处理器中的任何高速缓冲存储器,以及被用作为虚拟存储器(即,被存储在大容量存储设备106或被耦合到计算设备100的另一个计算机上)的任何存储容量。
计算设备100还包括用于外部地交流信息的输入和输出的每一个的至少一个。例如,对于与万维网用户或操作者的接口,计算设备100可包括用户接口108,诸如合并有一个或多个I/O设备110(包括,但不限于,显示器、键盘/小键盘、鼠标和/或其它指向设备、跟踪球、游戏杆、触觉反馈设备、话筒、扬声器、触摸屏、触摸板、webcam(网络摄影)和使得能对在计算设备处接收的用户命令进行操作性响应的类似设备)的图形用户接口(GUI)。否则,用户输入可以经由通过网络114被耦合到计算设备100的另一个计算设备112被接收。这后一种配置在计算设备100被实施为服务器或其它形式的多用户计算机的场合下可能是令人想要的,虽然计算设备100在某些实施例中也可以被实施为独立的工作站、台式机、或其它单用户计算机。在这样的配置中,计算设备100所希望的是包括与至少一个网络114进行操作性通信的网络接口116。网络114可以是LAN、WAN、无线网和/或互联网,虽然网络114不限于这些网络选择。
计算设备100在操作系统118的控制下操作,且执行或否则依赖于各种计算机软件应用119。例如,数据库管理系统(DBMS)可以驻留在存储器104中,以访问驻留在大容量存储设备106中的数据库120。数据库120可被存储在直接或通过通信链路被连接到计算设备100的其余部分的单独结构中,诸如数据库服务器。而且,在分布式或客户机-服务器计算机环境下,各种应用也可以在经由网络被耦合到计算设备100的另一个计算机中的一个或多个处理器上执行。
通常,被执行来实施本发明的实施例的例行程序,无论是被实施为操作系统的一部分还是特定的应用、组件、程序、对象、模块或指令序列,在这里都可被称为“计算机程序代码”或简单地说“程序代码”。程序代码典型地包括一个或多个指令,它们在各种时间驻留在计算机中的各种存储器和存储设备中,以及当被计算机中的一个或多个处理器读取和执行时,使得该计算机履行对于执行体现本发明的各种方面的步骤或单元所必须的步骤。而且,虽然本发明是在完全机能的(functioning)计算机和计算机系统的上下文中被公开的,但本领域技术人员应意识到,本发明的各种实施例能够以各种形式作为程序产品被分发。本发明可以在各种各样的计算机可读媒体上被成功地实践,计算机可读媒体的例子包括,但不限于,有形的可记录类型的媒体,比如,尤其是易失性和非易失性存储器设备、软盘和其它可拆卸的盘、硬盘驱动、磁带、光盘(例如,CD-ROM、DVD等);以及传输型媒体,诸如数字和模拟通信链路。
现在参照图3,图上显示在本发明的优选实施例中功能单元之间的关系和数据流。所描绘的系统200具有客户机-服务器体系结构,其允许万维网用户指定在万维网内容中的被选择的实体和把这样的实体与追随相关联达想要的时间段。这样的用户可以同期把更新的数据馈送和警报生成中的一个或多个与这样的被追随实体相关联,其中的后者自动地在与这样的实体相关联的万维网内容被更新时生成警报。系统200用作为网站,它显示互联网内容,其中实体被万维网用户选择性地加亮以便追随(如在下文中进一步描述的)。当在这里使用时,术语“万维网用户”和“用户”可互换地使用来指经由搜索引擎而与所公开的实体追随系统进行交互的任何操作者。系统200包括万维网实体引擎220,它连续地接收经由跨越网络(例如,互联网)的动态爬行器而提取的实体内容。万维网实体引擎220是连续运行的软件程序,它在一个或多个计算机上运行,并连接到来自许多源的一个或多个数据馈送222,所述源包括,但不限于,文本、图形、视频、音频、超文本、统一资源定位器(URL)数据、RSS/原子馈送以及它们的组合、等同物和补充物。内容由可以连续地或按预定的时间间隔(即,每分钟、每5分钟、每30分钟等等)运行的爬行器进行搜索和检索。
万维网实体引擎220从数据馈送222收集数据,并将最终得到的实体组以所提供的可搜索索引存储在实体数据库224中。关于所发现的实体的信号(表示活动和/或更新)被聚集为馈送(被称为“所提取的趋向的实体”),其连同时间的趋向参数(例如,被嵌入在网页中显示最近的内容更新的时间戳)一起被馈送到实体数据库224中,并与其一起整体地被存储在存储介质中。当在这里使用时,术语“趋向的”和“趋向的实体”是指实体随时间过去的演变(例如,趋势),其可以揭示实体相关性、到某些实体的链接的大众性和其中集成有关于这样的实体的万维网内容的着陆页(landing page)的业务量的改变。虽然本发明在这里是相对于趋向的实体描述的,但应当了解,本发明能针对相对于静态实体(即,可以在持续很久的时期内保持不变的那些实体)的实体提取进行修正。实体内容可以从动态改变的实体和预定实体(例如,本地咖啡店)的静态列表中提取,其包括特定的名称和类别(例如,个人、地点、位置、事情、组织、名人、运动员、团队、书或歌曲名称、话题等等)。应当指出,可以使用用于检测新鲜的趋势的各种方法,其能进行修正以用于利用它们而进行的实践,虽然这是在本发明的范围之外的。
被赋予某个类别的内容被使用来训练分类器,以便为不具有相关联的类别的实体内容预测类别。这样,没有被赋予类别的实体内容可以具有为它预测的类别。这是特别有用的UX利益,因为类别可以是预先定义的或是用户定义的,以及类别种类可以是静态的或可以动态地演变。当发现新的趋势时,新的项被添加,而当较老的趋势失去重要性时,老的项被丢弃。贝叶斯(Bayesian)分类器、支持向量机(SVM)分类器和它们的等同物与补充物可被用作为进化式(evolving)分类器,正如本领域中已知的。
实体注解引擎228被提供,其处理所有进入的内容馈送230,以便检测在内容中当前趋向的实体的存在。如果这样的趋向的实体内容存在于内容馈送中,则头n个实体将被注解,其中n表示由万维网用户指定来追随的实体。n的选择是一个UX判决(在注解的内容UX 226处输入),它随着时间过去直接影响被递送内容的相关性(由此,实体的任何排名依赖于实体的趋向参数和与内容的相关性)。具有实体注解(包括从实体数据库224的自动实体提取和从注解的内容UX 226得到的编辑的标识)的内容被存储在注解的内容232中。对于动态内容,或不适合于馈送的非馈送内容233,这个注解可以以准时制的(just-in-time)方式被执行。实体注解也可以由编辑者通过使用公布系统235而人地工完成,正如本领域中已知的。
万维网用户可以经由注解的内容UX 226访问系统200,该注解的内容UX 226使能经由用户接口——诸如在用户接口显示器上提供的搜索引擎窗口300——在万维网用户与计算设备之间进行交互(如图4所示和在下文进一步描述的)。源内容或万维网用户在用户接口上当前正在访问的内容被分析,以便自动定位关于一个或多个实体的内容,所述实体不需要由万维网用户在万维网搜索查询开始处便被特别地识别。注解的实体经由用户接口,诸如搜索引擎窗口300(正如可以在显示器屏幕或等同设备上被提供的,或者其内容可以被口头地、经由触觉手段或用于提供对搜索引擎和由其得到的结果的访问的其它手段而传送),以具有在注解的内容UX 226处的悬停(hover)选项的特殊视觉效果被显示。在该接口处,万维网用户可以拖放为了任何相关的目的而由实体注解引擎228生成的注解的文本,例如,为了创建具有相关的主题的被追随实体的目录,或者创建依照万维网用户的战略性智能聚集的实体更新的时间线。作为例子,参照图4,检索对于搜索项“西雅图”的搜索结果的万维网用户可以观看在多个不相关类别中的多个搜索返回结果,包括西雅图体育运动队、西雅图天气、西雅图夜生活和关于西雅图市的多个其它话题。点击实体“西雅图水手”的万维网用户可以选择把这样的实体连同实体“西雅图音乐场景”一起放置在目录302(标题为“我的西雅图”)中,如由箭头A和B指明的。这样,万维网用户可以定期地更新和修改目录302,以反映万维网用户当前的兴趣选择和在实时的基础上跟踪被追随的实体。
还参照图3和4,阅读在搜索引擎窗口300 中的注解的内容的万维网用户可以通过选择在悬停指南中的“追随它”选项304,而指定要追随的实体,以便追随感兴趣的流行话题(trending topic)。对要追随的实体的指定,由预订万维网服务引擎234解译为被存储在实体预订数据库236中的预订的等同物。获得了来自实体预订数据库236的预订数据和来自实体更新数据库244的更新的更新通知器248协调实体预订与对应的被追随实体上的更新,以便把被请求的警报递送到万维网用户(正如在下文进一步描述的)。统一的(unified)UX 240维持万维网用户正在追随或已追随的实体的列表,以及提供允许修改被追随的实体的列表的编辑功能性。用于被追随的实体的更新和活动也是通过统一的UX 240、一个个地或以聚集的形式可用的,且它们本身常遭到修改。例如,的UX 240可包括兴趣类别过滤选择,其中兴趣类别连同用于列出的每个类别的复选框一起被列出。万维网用户选择用于每个这样的兴趣类别的复选框,即:对于所述兴趣类别,万维网用户意欲将当前感兴趣的实体内容包括在万维网用户的被追随的实体中。通过使用UX设计的原理,现有的实体可以具有多种形式(包括,但不限于,目录、搜索、流行话题等等),并且仍旧是对于追随能修正的。
一旦万维网用户将追随与一个或多个指定的实体相关联,万维网用户就可以同期地将警报与对于这样的被追随实体的更新相关联,以使得万维网用户接收对于新更新的通知(诸如,通过选择 “设置警报”选项306,如图4所示)。在由万维网实体引擎220检测到新的更新后,用于被追随实体的更新的内容(被显示为“实体的活动”)被存储在实体更新数据库244。当万维网用户选择接收关于被追随实体的自动警报时,更新通知器248将被追随实体的预订请求与来自实体更新数据库244的更新的实体内容相对应。更新通知器248在接收与被追随的实体相协调的实体更新后,生成警报,指示:根据经由统一的UX 240被递送到万维网用户的被追随的实体,数据源是当前感兴趣的。替换地,万维网用户,在更新UX 250处,可以经由万维网服务和RSS馈送246,人工地访问关于被追随实体的内容的更新的馈送。
在警报中,万维网用户可以接收例如在 URL列表中的更新的实体内容的指示,URL提供在该警报的时间万维网用户可能感兴趣的动态内容(诸如在万维网上的万维网内容)的位置。当这样的内容确实被更新时,警报被递送到万维网用户,以告知在被追随的实体上的这样的更新。该警报可被万维网用户接受或拒绝,以及可以显示对于在用户可选择的某个时间段内公布的内容的出现次数、出现日期和到其它实体的超链接。用于根据内容(其可以作为基于事件或基于时间的馈送被接收)而提供警报消息的体系结构并不形成本发明的一部分,能对于本发明的实践进行修正的任何已知的体系结构(例如,由转让给雅虎的美国专利No.7,143,118公开的警报递送体系结构,该专利的全部公开内容被通过引用的方式合并于此)被预见到。在某些情形下,万维网用户可以选择对于某些已登记的兴趣的警报是要通过所有可用的方法来提供的,而对于其它已登记的兴趣的其它警报则通过仅仅一个方法来提供。另外,可以给某些警报提供以相对快速的通知,在这种情形下,本发明将利用所存储的联系信息来通过所有选择的递送方法把警报递送到万维网用户。相对比,其它警报可以这样提供,即:响应于关于其它登记的兴趣的、来自万维网用户的主动请求而提供警报。所述请求也可以按预定义的时间被调度,以便以周期的时间间隔提供摘要来准备好供用户访问。同样地,对于递送的希望的时间可以在万维网用户简档中被规定。在万维网用户简档中也可以提供消息限制,以便限制被发送到万维网用户的警报和/或其它消息的数目。根据内容的类型、计算设备上的当前负荷和/或其它属性,查询可被分布在计算设备中间。警报可以以任何指定的格式被递送,包括,但不限于,即时消息(IM)、电子邮件、短消息服务(SMS)、多媒体消息服务(MMS)、话音消息等等。
实际上,万维网用户发动搜索引擎请求,以及网站上的着陆页具有用作为到搜索引擎的入口的搜索框(且由此提供对与万维网用户相关的内容的访问)。着陆页可以显示文本、图像、相关链接的动态汇编和/或这些和其它单元的组合、连同嵌入的JavaScript一起,该JavaScript把被输入到搜索框中的搜索查询连同识别搜索引擎的元数据一起自动转发到服务器。当万维网实体引擎220从数据馈送222提取实体内容时,实体更新被存储在实体更新数据库244,并且经由更新万维网服务和RSS馈送246被传送。实体更新数据库244被查询,以便确定对于被追随的实体是否存在记录。确定所执行的查询是否识别出用于如在警报中指示的被追随实体的现有数据库条目(即,现有的警报是否指示相同的被追随的实体)。如果确定对于被追随的实体确实存在数据库条目,则在统一的UX 240中相对于警报的被追随实体创建记录。并发地,实体注解引擎228处理所有进入的内容馈送,以便检测在内容中当前的趋向的实体的存在,该内容馈送被存储在注解的内容数据库232。在UX 226处发起的查询可以访问具有供万维网用户考察和选择的实体注解的内容,以便指定要被追随的实体和将指定的被追随实体与一个或多个警报关联。
一旦万维网用户把追随与指定的实体相关联,动态爬行器就使用从实体注解引擎228发现的新的趋势,来更快速地将更新的实体内容与被追随的实体相关联。例如,新的源可以散布包括受制于快速改变的条件(例如,天气紧急事件、地震、经济事件、恐怖分子活动等等)的未曾预料到的事件的快速报告。万维网用户通过以下方式来指定这个事件为要追随的实体,即:悬停在该实体上并点击“追随它”(如在图4上的示范性形式显示的)。动态爬行器然后可以聚焦于涉及被指定的实体的那些被收集的万维网对象。不管在话题中的普遍兴趣是否减少,动态爬行器维持内部索引,以便反映万维网用户对于追随实体的偏好(例如,保持得到恶劣天气事件的后果的通知)。万维网用户可以类似地从这样的实体解除该追随的关联。
预期的事件也可以被指定为要被追随的实体(例如,选举、音乐会、体育运动事件等等),并且也可以被使用于聚焦的爬行。万维网用户通过使用搜索引擎而输入搜索查询,搜索引擎在统一的UX 240处搜索提取的实体来查找注解的内容。与动态爬行器有关的搜索引擎存储搜索查询,并分析搜索项中的实体。搜索项通过实体注解引擎228而与实体内容相关联,以便预测可能的相关的搜索项。预测的搜索项在图形用户接口(GUI)显示器中作为可选的搜索项被提供给万维网用户。可以向万维网用户呈现各种选项,用于显示与被追随的实体相关联的内容。例如,图形或视频实体显示可包括用于实体的标题(其也是超链接)、实体的概要、完整内容的持续时间、源、类别、日期和时间、以及用户可选择的视频和/或图形。搜索引擎可以返回个性化的网页,其中共享相同话题的内容被一起追随,由此使得万维网用户能够随时间过去而监视实体追随的演变。所以,实体被指定为要在具有协同的动态关系的基础上被追随的。用于这样的相关性的算法在本领域中是已知的,因此不形成本发明的一部分。
系统200可以根据关于某些实体的万维网用户历史,建议要被追随的另外的实体(例如对本地天气进行每天查询的万维网用户可以提示系统建议“家乡天气”作为要被追随的实体)。对于特定的搜索查询所提供的数据相关性也可以经由实体特定的调谐的搜索系统来被调谐,诸如由共同拥有的美国专利No.7,739,270公开的那些,该专利的全部公开内容被通过引用的方式合并于此。
本发明有利地利用了万维网用户的能力以随着时间过去而添加内容。当万维网页开始变旧(age)且展示用于关于实体的话题信息的特有的资源时,与对于实体本身的依赖性相比,本发明的实体追随更少地依赖于页的相关性、链接的大众性和业务量。本发明有利地允许万维网用户直接地识别自然语言文本,非常像他们在报纸、图书或其它印刷媒介中的那样。结果是实体追随系统,其使得能按万维网用户指示的进度表来递送被特别作为目标的内容的可缩放的索引。本发明利用万维网的功能作为内容网络,以向万维网用户提供内容的页,非常像图书馆给它的用户提供大量通过类别和话题来索引的硬拷贝参考书的情形。虽然万维网用户可能不是搜寻某些特定的东西,但万维网用户可以找到内容中与万维网用户的特定兴趣和需要相关的对象。所以,本发明在互联网演变为具有互相联系的人、地点、事物和主题的网络的实体万维网中得到成功。
对于以上描述的和显示的结构的各种改变,现在对于本领域技术人员而言是显然的。在以上的说明和附图中阐述的内容因此仅仅作为举例说明而不是限制被提供。相应地,本发明的具体地公开的范围在以下的权利要求中被阐述。

Claims (11)

1.一种用于将至少一个实体是当前感兴趣的指示散布给万维网用户的系统,包括:
i. 用于发动提供对于与当前感兴趣的至少一个实体有关的实体内容数据的访问的搜索引擎请求的装置;
ii. 用于提供万维网实体引擎(220)的装置,其经由来自至少一个数据源的至少一个数据馈送(222)从网络(114)接收和收集该实体内容数据;
iii. 用于将该实体内容数据以所提供的可搜索的索引存储在与万维网实体引擎(220)通信的实体数据库(224)的装置;
iv. 用于将该实体内容数据作为馈送聚集到与万维网实体引擎(220)通信的实体更新数据库(244)中的装置;
v. 用于将对于该实体内容数据的更新存储在与万维网实体引擎(220)通信的实体更新数据库(244)的装置,其中所述更新作为更新的实体内容数据被存储;
vi. 用于提供实体注解引擎以便用该至少一个实体注解该实体内容数据的装置;
vii. 用于当向万维网用户显示时将视觉效果施加到该实体内容数据中的至少一个注解的实体的装置,使得万维网用户能通过选择要追随的实体而指定该实体;以及
viii. 用于在用户接口(108)处,把追随与所指定的实体相关联的装置,其中所述追随的关联与用户接口(108)处的被追随实体相关。
2.权利要求1所述的系统,其中感兴趣的至少一个当前趋向的实体是与该实体内容数据相关联的。
3.权利要求2所述的系统,其中该实体注解引擎把来自搜索引擎请求的搜索项与该实体内容数据相关联,以得到注解的实体内容数据来存储在与实体注解引擎通信的注解数据库中。
4.权利要求3所述的系统,还包括:用于在用户接口处显示在注解的实体内容数据与所述追随和所指定的实体的关联之间的表示的装置。
5.权利要求1所述的系统,还包括:用于提供预订万维网服务引擎,用以把所述追随与所指定的实体的关联存储在与预订万维网服务引擎通信的实体预订数据库中的装置。
6.权利要求5所述的系统,还包括:用于在用户接口处将警报与被追随的实体相关联的装置,其中所述警报向万维网用户散布指示:对于该实体内容数据的更新是与被追随的实体相关的。
7.权利要求6所述的系统,还包括:用于在用户接口处显示在被追随的实体和警报与被追随的实体的关联之间的表示的装置。
8.权利要求7所述的系统,还包括:用于提供更新通知器以便递送与被追随的实体相关联的警报的装置,所述更新通知器协调所述追随与所指定的实体的关联与对于该实体内容数据的更新。
9.权利要求6所述的系统,还包括:用于查询实体更新数据库,以确定是否存在用于被追随实体的针对更新的实体内容数据的记录的装置。
10.权利要求9所述的系统,还包括:用于确定是否存在用于与警报相关联的被追随实体的现有的数据库条目,以及生成警报,用于在用户接口处指示数据源包括针对被追随实体的更新的实体内容数据的装置。
11.一种用于将至少一个实体是当前感兴趣的指示散布给万维网用户的方法,包括以下步骤:
i. 发动提供对于与当前感兴趣的至少一个实体有关的实体内容数据的访问的搜索引擎请求;
ii. 提供万维网实体引擎,其经由来自至少一个数据源的至少一个数据馈送从网络接收和收集该实体内容数据;
iii. 将该实体内容数据以所提供的可搜索的索引存储在与万维网实体引擎通信的实体数据库;
iv. 将该实体内容数据作为馈送聚集到与万维网实体引擎通信的实体更新数据库中;
v. 将对于该实体内容数据的更新存储在与万维网实体引擎通信的实体更新数据库,其中所述更新作为更新的实体内容数据被存储;
vi. 提供实体注解引擎以便用该至少一个实体注解该实体内容数据;
vii. 当向万维网用户显示时将视觉效果施加到该实体内容数据中的至少一个注解的实体,使得万维网用户能通过选择要追随的实体而指定该实体;以及
viii. 在用户接口处,把追随与所指定的实体相关联,其中所述追随的关联与用户接口处的被追随实体相关。
CN201110392689.3A 2010-12-01 2011-12-01 实体追随 Active CN102521308B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/957,668 US8782033B2 (en) 2010-12-01 2010-12-01 Entity following
US12/957668 2010-12-01

Publications (2)

Publication Number Publication Date
CN102521308A CN102521308A (zh) 2012-06-27
CN102521308B true CN102521308B (zh) 2014-11-26

Family

ID=46163207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110392689.3A Active CN102521308B (zh) 2010-12-01 2011-12-01 实体追随

Country Status (3)

Country Link
US (1) US8782033B2 (zh)
CN (1) CN102521308B (zh)
WO (1) WO2012074835A2 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8756488B2 (en) 2010-06-18 2014-06-17 Sweetlabs, Inc. Systems and methods for integration of an application runtime environment into a user computing environment
US8782033B2 (en) 2010-12-01 2014-07-15 Microsoft Corporation Entity following
JP2012244463A (ja) * 2011-05-20 2012-12-10 Sony Corp 受信端末、情報処理方法、プログラム、サーバ、送信端末及び情報処理システム
US20130218885A1 (en) * 2012-02-22 2013-08-22 Salesforce.Com, Inc. Systems and methods for context-aware message tagging
US8775917B2 (en) * 2012-08-09 2014-07-08 Sweetlabs, Inc. Systems and methods for alert management
US8775925B2 (en) 2012-08-28 2014-07-08 Sweetlabs, Inc. Systems and methods for hosted applications
US9952742B2 (en) * 2013-03-14 2018-04-24 Google Llc Providing trending information to users
US9292831B2 (en) * 2013-10-09 2016-03-22 Christopher Burns Monitoring data elements across multiple networks and processes
US9749440B2 (en) 2013-12-31 2017-08-29 Sweetlabs, Inc. Systems and methods for hosted application marketplaces
US20150248216A1 (en) * 2014-02-28 2015-09-03 Microsoft Corporation Information interface generation and/or population
US10168881B2 (en) * 2014-02-28 2019-01-01 Microsoft Technology Licensing, Llc Information interface generation
US20150278355A1 (en) * 2014-03-28 2015-10-01 Microsoft Corporation Temporal context aware query entity intent
US10089098B2 (en) 2014-05-15 2018-10-02 Sweetlabs, Inc. Systems and methods for application installation platforms
US10019247B2 (en) 2014-05-15 2018-07-10 Sweetlabs, Inc. Systems and methods for application installation platforms
US10592539B1 (en) 2014-07-11 2020-03-17 Twitter, Inc. Trends in a messaging platform
US10601749B1 (en) * 2014-07-11 2020-03-24 Twitter, Inc. Trends in a messaging platform
US10397163B2 (en) * 2016-11-07 2019-08-27 Google Llc Third party application configuration for issuing notifications
US10554591B2 (en) * 2017-08-30 2020-02-04 Facebook, Inc. Techniques for efficient messaging client communication
CN111459592B (zh) * 2020-03-31 2021-10-22 华为技术有限公司 分布式处理ux元素的方法及装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020010760A1 (en) * 2000-04-13 2002-01-24 Anthony Armenta Apparatus for and method of providing user notification and connectivity
US7716199B2 (en) 2005-08-10 2010-05-11 Google Inc. Aggregating context data for programmable search engines
US20040139077A1 (en) * 2002-12-20 2004-07-15 Banker Shailen V. Linked information system
US7143118B2 (en) 2003-06-13 2006-11-28 Yahoo! Inc. Method and system for alert delivery architecture
US20070143300A1 (en) 2005-12-20 2007-06-21 Ask Jeeves, Inc. System and method for monitoring evolution over time of temporal content
EP1843256A1 (en) 2006-04-03 2007-10-10 British Telecmmunications public limited campany Ranking of entities associated with stored content
US20080005069A1 (en) 2006-06-28 2008-01-03 Microsoft Corporation Entity-specific search model
US9141704B2 (en) 2006-06-28 2015-09-22 Microsoft Technology Licensing, Llc Data management in social networks
US20090240564A1 (en) 2006-12-12 2009-09-24 Marco Boerries Open framework for integrating, associating, and interacting with content objects including advertisement and content personalization
US20080243607A1 (en) 2007-03-30 2008-10-02 Google Inc. Related entity content identification
WO2009061399A1 (en) * 2007-11-05 2009-05-14 Nagaraju Bandaru Method for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
US8402031B2 (en) 2008-01-11 2013-03-19 Microsoft Corporation Determining entity popularity using search queries
US20090210391A1 (en) * 2008-02-14 2009-08-20 Hall Stephen G Method and system for automated search for, and retrieval and distribution of, information
US20090248516A1 (en) 2008-03-26 2009-10-01 Gross Evan N Method for annotating web content in real-time
US8126908B2 (en) 2008-05-07 2012-02-28 Yahoo! Inc. Creation and enrichment of search based taxonomy for finding information from semistructured data
US20090309742A1 (en) * 2008-06-11 2009-12-17 Jillian Alexander Disaster alert display (dad) emergency and natural disaster warning system that automatically detects if people are caught in an emergency or disaster, determines if they are ok, and notifies their emergency contacts
US20100082611A1 (en) 2008-09-23 2010-04-01 Yahoo! Inc. Trajectory Data Surfacing System: Surfacing Useful and Relevant Entity Annotations
WO2010048430A2 (en) 2008-10-22 2010-04-29 Fwix, Inc. System and method for identifying trends in web feeds collected from various content servers
US8244224B2 (en) 2008-11-20 2012-08-14 Research In Motion Limited Providing customized information to a user based on identifying a trend
US20100131529A1 (en) 2008-11-26 2010-05-27 Vishal Kasera Open entity extraction system
US8494942B2 (en) 2009-01-15 2013-07-23 First Data Corporation Identifying and sharing common trends
WO2010138728A2 (en) * 2009-05-27 2010-12-02 Graffectivity Llc Systems and methods for assisting persons in storing and retrieving information in an information storage system
US8782033B2 (en) 2010-12-01 2014-07-15 Microsoft Corporation Entity following

Also Published As

Publication number Publication date
WO2012074835A2 (en) 2012-06-07
US8782033B2 (en) 2014-07-15
CN102521308A (zh) 2012-06-27
US20120143845A1 (en) 2012-06-07
WO2012074835A3 (en) 2012-07-26

Similar Documents

Publication Publication Date Title
CN102521308B (zh) 实体追随
US20230385356A1 (en) Browser-based navigation suggestions for task completion
US9361385B2 (en) Generating content for topics based on user demand
US20200159763A1 (en) Apparatus and method for clipping and sharing content at a portable terminal
CN1813233B (zh) 用于控制对计算机对象的访问的用户界面系统
US7953687B2 (en) Knowledge discovery system with user interactive analysis view for analyzing and generating relationships
US8020106B2 (en) Integration of personalized portals with web content syndication
US9805124B2 (en) Automatic generation of a collection of content
CN102906750B (zh) 提供基于上下文选择的内容条目
KR101580344B1 (ko) 최근 이력에 검색 결과를 제공하는 방법에 관한 프로그램을 기록한 컴퓨터 판독 가능 저장 매체
US9600484B2 (en) System and method for reporting and analysis of media consumption data
EP3529714B1 (en) Animated snippets for search results
CN107209905A (zh) 针对个性化和任务完成服务而对应用去主题归类
US20060271520A1 (en) Content-based implicit search query
JP2014078259A (ja) ユーザ注釈を一体化したサーチシステム及び方法
CN104813256A (zh) 收集和组织经由社交媒体分发的内容
US20130110803A1 (en) Search driven user interface for navigating content and usage analytics
CN105009103A (zh) 网页的显示时间
JP4375626B2 (ja) カテゴリ別のキーワードの入力順位を提供するための検索サービスシステムおよびその方法
JP2017501501A (ja) ニュースタイムラインおよび薦められるニュースエディションの生成
RU2683482C2 (ru) Метод отображения релевантной контекстно-зависимой информации
EP3039573A1 (en) Contextual searches for documents
KR20150019668A (ko) 검색 연관 정보 제공 방법 및 이를 지원하는 전자 장치
JP2006235875A (ja) 情報ナビゲーション方法及び装置及びプログラム
Francese et al. Lifebook: a mobile personal information management system on the cloud

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150429

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150429

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.