CN101176052B - 将信息与电子文档关联的方法和系统 - Google Patents

将信息与电子文档关联的方法和系统 Download PDF

Info

Publication number
CN101176052B
CN101176052B CN2006800135089A CN200680013508A CN101176052B CN 101176052 B CN101176052 B CN 101176052B CN 2006800135089 A CN2006800135089 A CN 2006800135089A CN 200680013508 A CN200680013508 A CN 200680013508A CN 101176052 B CN101176052 B CN 101176052B
Authority
CN
China
Prior art keywords
information
segment information
user
content
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800135089A
Other languages
English (en)
Other versions
CN101176052A (zh
Inventor
M·R·理查德森
E·D·布瑞尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/227,937 external-priority patent/US7734631B2/en
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101176052A publication Critical patent/CN101176052A/zh
Application granted granted Critical
Publication of CN101176052B publication Critical patent/CN101176052B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种关联信息的系统,包括使用锚定信息将第一段信息与第二段信息关联的关联模块,其中第二段信息不是第一段信息的一部分。该系统还包括向用户示出第二段信息的呈现模块。还描述了使用这种系统的方法。

Description

将信息与电子文档关联的方法和系统
背景技术
因特网已发展成在其上可提供各种基于信息的服务的通信平台。最常见的这些服务之一是提供使用超文本标记语言(HTML)构建的电子文档。这些文档通常称为网页并可从通常称为万维网或简单地称为Web的因特网逻辑片段上的计算位置或站点获得。通常使用在远程计算机上执行的Web浏览器来访问这些Web站点和服务器上的可用信息。例如,用户可启动Web浏览器,并通过将Web站点的统一资源定位符(URL)键入到Web浏览器的地址栏中并按压键盘上的回车键或用鼠标点击按钮来访问Web站点。URL通常包括方便访问的三段信息:指定计算机通信中交换信息的规则或标准集的协议指示符、通常基于维护该Web站点的组织名称的域名、以及到该域内所需文档的路径。标准Web浏览器可使用URL中包含的信息来与Web服务器建立连接并从该Web服务器获取信息。
除了Web站点和Web页面之外,还存在其它类型的服务。在这些服务是电子邮件、即时消息、聊天服务、音频或视频服务和其它信息服务。通常,因特网上可用的各个服务与其它服务分开存在。例如,用户可使用Web浏览器访问Web站点但是必需打开音频应用程序来访问音频信息作为另一项服务。此外,用户不得不打开第三应用程序来访问聊天服务以及打开第四应用程序来访问消息服务。
通常,虽然来自各类服务的信息内容与其它服务分开存在,但是能以各种不同方式使这种信息逻辑上相关。例如,就各个服务的可用信息可涉及另一服务上可用信息的意义而言,可使信息逻辑上相关。而且,来自一个以上可用服务的信息可主题上相关、来源于同一源或以某种其它方式相关。当前系统不能提供任何以逻辑和有意义的方式集成来自各种服务的信息的能力。
发明内容
以下示出简化的发明内容以便于提供基本理解和上层纵览。本发明内容不是广泛的概述。它不旨在标识关键或重要元素也不旨在描绘范围。本发明内容的唯一目的是以简化形式示出一些概念作为下文所述的更详细描述的前序。此外,本文使用的节标题仅为方便而提供,无论如何不应作为限制。
呈现模块使用网络从信息源获得诸如Web页面的信息。关联模块对所获得信息进行分析并使用其分析结果来标识和定位关键或重要信息段。该信息可用作锚点,使用该锚点可将其它信息关联到原始信息。可向用户示出附加信息。
基于对由用户获得的诸如Web页面内容的信息内容的分析,向用户提供各种附加类型的信息或信息服务。来自关于或涉及由用户正在观看的Web页面的Web日志的内容可与当前观看Web页面一起示出。可被示出的可能内容类型是基于广告的内容和由其它访问者向Web站点创建的内容,如便笺、评论、排名和评论。而且,可以示出来自Web网页的引用当前Web网页的一个或多个超链接。此外,可以提供诸如到相关聊天室讨论和相近网页搜索的自动连接的服务。
所公开和所描述的组件和方法包括以下描述、特别是在权利要求书中指出的一个或多个特征。以下描述和附图详细阐述了确定的具体说明性组件和方法。然而,这些组件和方法表明其中可使用所公开的组件和方法的仅有的几种不同方式。所公开和所描述的组件和方法的具体实现可包括这种组件和方法及其等效方案的某个、多个或全部。通过结合附图参照以下详细描述,本文示出的具体实现和示例的变体将变得显而易见。
附图说明
图1是关联信息系统的系统框图。
图2是便笺的框图。
图3是关联信息系统的系统框图。
图4是关联信息系统的系统框图。
图5是关联信息系统的系统框图。
图6是关联信息系统的系统框图。
图7是补充内容供应系统(provision system)的系统框图。
图8是示例性用户界面的视图。
图9是示出可根据本文所公开和描述的组件使用的方法的一般流程的流程图。
图10是示出可根据本文所公开和描述的组件使用的方法的一般流程的流程图。
图11是可根据本文所公开和描述的组件使用的方法的一般流程的流程图。
图12是示出可根据本文所公开和描述的组件使用的方法的一般流程的流程图。
图13示出示例性网络环境。
图14示出示例性计算环境。
具体实施方式
如本申请所用,术语“组件”、“系统”、“模块”等旨在指代计算机相关实体,诸如硬件、软件(例如执行中)和/或固件。例如,组件可以是在处理器上运行的进程、处理器、对象、可执行指令、程序、和/或计算机。而且,服务器上运行的应用程序和服务器都可以是组件。一个或多个组件可驻留在进程中,并且组件可位于一个计算机上和/或在两个或多个计算机之间分布。
参照附图对所公开的部件和方法进行描述,在附图中类似的附图标记用于指代类似的元件。在以下描述中,为说明目的,对许多具体细节进行阐述以便于提供对所公开主题的透彻理解。然而,在具体实现中,这些具体细节中的某些显然可被省略或与其它组合。在其它情况下,特定结构和器件以框图形式示出以便于描述。此外,虽然所阐述的具体示例可使用与客户机/服务器架构一致的术语或者甚至可以是客户机/服务器实现的示例,但是技术人员应该理解客户机和服务器的角色可互换、所公开和描述的组件和方法不限于客户机/服务器架构且很容易适用于其它架构(具体包括对等(P2P)架构)而不背离所公开和描述组件和方法的精神和范围。此外,应该注意虽然本文示出的具体示例包括或引用具体组件,但是本文公开和描述的组件和方法的实现不必局限于这些具体组件,而是也可用于其它环境中。
也应该理解,虽然示出的具体示例可描述或示出基于个人计算机组件的系统或方法,但是对本文公开和描述的组件的使用不限于该领域。例如,所公开和描述的组件和方法可用于分布式或网络计算环境中。此外或作为其他选择,所公开和描述的组件和方法可在由多个客户机访问的单个服务器上。本领域技术人员很容易意识到,所公开和描述的组件和方法可用于其它组件并在许多种计算设备上执行其它方法。
图1是交互信息系统100的系统框图。交互信息系统100包括可从主信息数据存储120获得信息的呈现组件110。呈现组件110可以是Web浏览器或能够获得和示出信息的其它组件。具体地,呈现组件110可以是可由用户启动并操作的独立应用程序,或者可以是设计成与诸如电子邮件应用程序的HTML呈现引擎或另一这种组件的其它组件结合使用的模块。除了其他界面之外,呈现组件110可在视觉显示器或诸如基于语音的界面或点字界面(Braille interface)的某种其它人机界面上向用户示出所获得的信息。
主信息数据存储120可以是数据库、内联网、万维网、因特网、文件共享、或某种其它信息源,具体包括可远程访问的信息源。主信息数据存储120中包含的信息可取决于主信息数据存储120的具体实现,但是通常可包括电子形式或机读形式的信息。具体地,主信息数据存储中存储的信息可包括来自因特网或内联网的Web页面、各种格式的文本文档、图形图像信息、音频信息、视频信息、多媒体信息和其它适当形式的信息。
关联插件130可与呈现组件110和主信息数据存储120通信以获取呈现组件110向用户示出的信息。此外或作为其他选择,交互插件130可从诸如辅信息数据存储140的另一信息源获取附加信息。辅信息数据存储140可通过与主信息数据存储120相同的方式实现并可包括同一类型的信息。具体地,辅信息数据存储140可包括便笺、诸如Web页面的文档、内联网页面、各种格式的文本文档、图像或音频信息、包括搜索特征词或结果以及搜索引擎通道的搜索相关信息、维基(wiki)、Web日志(博客)、RSS或其它新闻馈送、包括基于通知的聊天内容的聊天内容、包括消息或用户名的即时消息、标签、连入链接(inlink)、连出链接(outlink)、和能以电子或机读格式存储或示出的任何其它信息。
辅信息数据存储140中包含的信息可由辅内容创建模块150创建。本领域普通技术人员通过阅读本发明会意识到,辅内容创建模块150的实现细节可根据为与辅信息数据存储140一起使用而创建的具体信息类型而改变。具体地,取决于这种内容,辅内容创建模块150可以是文本编辑器、文字处理器、电子数据表程序、幻灯片放映或演示程序、Web页面编辑器、图形程序、音频程序、Web日志(博客)工具、聊天程序、即时消息程序、或某种其它适当组件,具体包括以上示例中某些或全部的组合。
关联插件130可将来自辅信息数据存储140的信息与最初从主信息数据存储120获取的、用于由呈现组件110显示的信息相关或关联。具体地,来自辅信息数据存储140的附加信息可被锚定到来自主信息数据存储120的信息。这种锚定或关联可通过各种方式实现。例如,与Web页面关联的诸如示例域名.tld的域名可用作来自辅信息数据存储140的信息段的锚点。类似地,当前或先前访问的Web页面或其它源的包括相对URL的全部或部分限定的统一资源定位符(URL)可用作锚点。其它可能的锚点包括但不局限于,文件共享或其它远程位置上的文件位置、来自主信息数据存储120的内容中包含的关键词或表格数据等等。
在一示例中,来自辅信息数据存储140的信息可以是包括一些文本的便笺。该便笺可通过将该便笺与Web页面的URL关联而被锚定到该Web页面。该便笺也可被锚定到表格数据段。例如,如果表格数据是邮政编码,则便笺在用户将该编码输入到表格中时出现。作为另一示例,便笺可被锚定到具体关键词。当用户查看来自主信息数据存储120的包括这种关键词的信息时,该便笺由呈现组件110向用户显示。该便笺可由来自辅信息数据存储140的任何内容代替。通常,可使用任何适当的锚点将来自辅信息数据存储140的任何内容以任何适当组合锚定到来自主信息数据存储120的任何内容。
应该注意,虽然附加信息可被锚定到最初获取的信息或者与其关联,但是附加信息的内容不必与最初获取的信息中包含的内容相关。例如,最初获取的信息可以是关于计算机编程语言的Web页面,而附加信息可以是到搜索引擎的链接。在本示例中,到搜索引擎的链接与Web页面的内容没有联系。任何其它类型的附加内容或附加信息可由关联插件130使用或提供。
以下是基于Web页面的示例。呈现组件110可从主信息数据存储120检索Web页面。该Web页面可由呈现组件110向用户示出。关联插件130可分析该Web页面以确定Web页面的哪些内容是重要的。可使用各种方法来分析Web页面。这些方法中的一种是创建Web页面中包含的特征词列表并使用特征词频率-逆文档频率(TF-IDF)算法来创建Web页面内容的概率总结。关联插件130可使用Web页面内容来区分其它待向用户示出的内容。其它内容包括来自围绕与Web页面相关主题组织的交互聊天室的内容、来自与Web页面相关或具体涉及该Web页面的Web日志(博客)条目或RSS或其它新闻馈送的内容、来自其它页面的具体指向该Web页面的链接、对搜索引擎的访问、与该Web页面相关的广告、或由其他访问者向该Web网页做出的评论形式的内容等等。
关联插件130可通过各种方式实现,除了阅读本发明后对本领域普通技术人员来说是显而易见的其它因素外,这些方式主要取决于呈现组件110的具体实现。在一种示例性实现中,关联插件130是在窗口或Web浏览器的工具条中运行的可执行代码。关联插件还可以是独立应用程序或其它适当可执行代码。关联插件可以是向用户提供发布与具体URL关联的通知的能力的标记组件。
通知在本质上可以是信息性的,包括诸如到相关主题的链接、与Web页面中涉及的产品或服务相似的产品或服务的信息、或其它信息。该通知可用于通过URL来组织个人便笺,如关于具体主页上研究文章的便笺;就这一点而言,该通知还是组织性的。通过使用该通知来向访问与该通知关联的URL的另一用户发布消息,该通知的社会用途同样成为可能。消息可针对参加事件的另一个人、具有与消息创建者的兴趣相似的兴趣的另一个人、关于Web页面主题的讨论的一部分、或任何其它类型的消息。该通知还可具有诸如提供幽默或作为在线游戏一部分的娱乐目的。
图2是便笺200的框图。便笺200可由诸如图1的关联插件130的关联插件用来传递与某些在线内容关联的信息。具体地,待传递的信息包括以上结合图1公开并描述任何类型的信息。
便笺200可包括多个字段。锚点字段210可包括可用于将便笺200的内容锚定到信息位置的信息。除了其它位置标识符之外,锚点字段210中的信息可包括URL、域名或根域。锚点字段210可用于描述任何适当的锚点,具体包括以上结合图1公开并描述的多种类型的锚点。锚点字段210可用于将可由关联插件使用的内容与某个信息位置关联。
基于锚点类型和其它因素,便笺200可包括各种字段。关键词字段220可包括与内容相关并可用于索引或搜索目的的关键词。内容关键词字段230可包括可用于定位诸如Web页面的内容的某些关键词或短语,其中该内容包括或匹配内容关键词字段230中的信息。表格数据字段240可包括可用于搜索表格中类似信息的信息。表格数据字段还包括诸如一个或多个表格字段名的表格信息,以将表格字段与该字段的值匹配。
范围字段250可包括关于诸如便笺200的便笺分布水平的信息。例如,范围字段250可指示便笺200是私人的并只应由其创建者查看。范围字段250还可指示对于特定组的成员允许组访问。除了其它定义成员资格的方法之外,这些组可根据某种标准定义或者可包括预选成员。此外,可通过访问字段250中的信息指示公开访问,以使得便笺200可由任何人查看。
便笺200还可包括类型字段260。类型字段260中的信息可用于定义便笺的不同类型。例如,这些不同类型可包括简单文本框、图片、讨论线程或用户定义类型等。不同类型的便笺可以以不同方式向用户显示,以提供关于未示出的具体类型的视觉提示。应该注意,这些字段的出现可向用户提供基于个人偏好过滤便笺的能力。此外,诸如便笺200的便笺就其内容可为固定而言是静态的,或者可以是动态的。例如,动态便笺可在每次该动态便笺被激活时向服务器请求更新信息。
在另一示例性实现中,用户可指定期望从其获得内容的诸如便笺200的内容提供者。用户还可指定显示该内容的区域。指定区域的一种可能方法是通过提供用户可置于Web浏览器窗口工具条中的图形工具。用户还可从其它选项之外选择,诸如关闭便笺、使便笺自动刷新内容、使便笺提供对信息进行分类的标签化子条、将便笺与一个或多个锚点关联、设置过期日期、限制便笺的散布、以及匿名创建便笺等。
便笺的预期用途可涉及网络效应,其中便笺系统的值随用户数量增加。为了提供某种初始值,当初始化便笺系统时,可使用各种技术。例如,可通过URL共享便笺。便笺也可提供Web网站、博客、新闻组和论坛等的自动注解。动态便笺和其它内容框可以很容易地提供内容。也可创建演示便笺使用的说明站点。此外,可提供便笺的应用编程接口(API)以鼓励开发者创建自己的便笺。便笺的搜索功能也可添加到其用途中。还可对便笺用户进行奖励以鼓励其它用途。而且,受欢迎的Web站点可用于促进用户安装和进一步使用便笺。这些受欢迎Web站点中至少一些可正式作为便笺的推广者。而且,特定的内容只通过使用便笺来提供,以使得安装便笺组件是访问该内容所必需的。
便笺还可涉及过滤和排名功能。便笺的次序可根据各种社会网络或信任网络概念来实现。锚定到具体URL的便笺可比简单地锚定到域名的便笺排名更高(或更低)。排名功能还可至少部分基于诸如便笺范围、便笺作者、便笺创建日期、用户偏好档案、过滤功能、链接分析、诸如分数或便笺是否被用户关闭的便笺反馈和便笺排名阈值等来使用。
便笺使用的隐私问题可通过各种方法解决。例如,组件可从不同URL请求多个便笺以隐藏实际需要的便笺的标识信息。该技术可与预取方案结合使用。可创建便笺的URL单向散列信号(one-way hash)并代替清晰文本请求发送到服务器。此外或作为其他选择,中间服务器可用于隐藏对请求特定便笺的用户的标识。
与便笺一起,交互组件可以是可允许用户之间动态聊天通话的Web聊天组件。这种聊天通话也可被锚定到URL或域名等。聊天会话也可以被锚定到超过一个的站点以供更多不同讨论之用。此类聊天通话也可是基于通知的,从而在另一用户到达指定站点并希望加入与其它用户的聊天通话时通知用户。也可使用其它Web提醒应用程序,诸如提供链接到正在查看的Web页面的Web页面列表的列表组件、总结当前查看Web页面上内容的页面总结组件和提供到Web页面中经常出现的特征词的搜索引擎搜索的链接的搜索组件等。
图3是关联信息系统300的系统框图。关联信息系统300包括呈现组件310和关联插件320。正如以上示例中的那样,关联插件组件320可以是独立应用程序、另一应用程序的可插入部分、或某种其它适当可执行代码。呈现组件310可从网络330访问信息内容。网络330可以是因特网、万维网、内联网或另一适当网络或信息源。
关联插件320可访问和分析呈现组件310已从网络330检索到的信息内容。为了分析该信息内容,关联插件320可使用任何适当方法,包括关于其它附图讨论的诸方法的其中之一。关联插件320可连接到聊天服务器340,以在围绕与信息内容相关的主题组织的聊天室中建立通话。
例如,工作时,呈现组件310可从万维网获取Web页面。然后,关联插件320可对Web页面的内容进行分析以确定Web页面的主题。之后,关联插件320连接到聊天服务器340以定位与Web页面主题相关的聊天室。用户可在继续查看该Web页面的同时加入到聊天室的讨论。
图4是关联信息系统400的系统框图。关联信息系统400包括呈现组件410和关联组件420。呈现组件410可以是Web浏览器或能够获取和呈现信息的其它适当组件。呈现组件410可访问网络430上的可用信息并将该信息传递到关联组件420。
关联组件420可对其从呈现组件410收到的信息进行分析,并使用该信息来从Web日志(博客)数据存储440获取附加内容。Web日志(博客)数据存储440可包括关于Web日志(博客)条目的信息和从Web日志(博客)到Web站点的交叉引用。可为处理与Web站点主题相同或相似的Web日志(博客)条目创建交叉引用。还可为具体引用Web站点的Web日志(博客)条目创建交叉引用。也可创建其它交叉引用。
使用中,呈现组件410从网络430访问信息段并呈现该信息以向用户示出。关联组件420对呈现的信息段进行分析,以辨别该信息的一般主题或其它内容相关主旨。关联组件420访问Web日志(博客)数据存储440,以定位与由呈现组件410获取的信息交叉引用的Web日志(博客)条目。然后,关联组件420可在用户仍在查看该信息时向该用户呈现这些Web日志条目。
除了Web日志(博客)条目之外或取而代之,可示出关于Web页面主题相关的产品或服务的信息。这种信息可为用户评论的形式或可为来自产品或服务自身提供者的广告。这种广告可通过使用来自已经由呈现组件410检索到的信息的关键词而触发。因此,广告可针对最可能响应这种广告的用户。此外或作为其他选择,用户可订制内容更新以使得各种事件诸如附加内容,充当使内容更新操作自动发生的触发器。
一种可能的实现包括可提供上下文智能搜索应用程序的工具条组件。该搜索应用程序可访问正由用户查看的Web页面内容,并通过诸如特征词频率-逆文档频率(TF-IDF)算法来计算该Web页面上各种特征词的重要性。在通过搜索应用程序提交查询时,用户可获得偏向于其内容与正在查看内容相似的结果的查询结果。
图5是关联信息系统500的系统框图。关联信息系统500包括呈现模块510和关联模块520。呈现模块510可从万维网530检索信息并呈现该信息。关联模块520能以上述方式中任一种访问并分析由呈现模块510检索到的信息。然后,关联模块520可使用这种分析结果来访问搜索服务器540。搜索服务器540可提供响应于搜索查询并偏向来自万维网的信息中出现的概念的结果。
例如,出现模块510可为用户获取Web页面。然后,关联模块520分析该Web页面的内容以确定关键词或重要概念。用户可对附加信息进行搜索。关联模块520可使用从Web页面获取的关键词或概念描述符来扩充由用户输入的搜索查询。搜索服务器使用已扩充的搜索来获得响应信息。搜索结果可偏向与由呈现模块510最初获取的Web页面相似或包含相似概念的那些Web页面。
图6是关联信息系统600的系统框图。关联信息系统600包括可从网络630访问Web页面的呈现组件610。关联组件620可访问来自呈现组件610的Web页面并分析其内容。这种分析可根据上述过程中的任一个。然后,关联组件620可使用其分析结果来联系上下文服务器640以获取附加内容。
上下文服务器640可访问访问者内容数据存储650,访问者内容数据存储可包括与由呈现组件610获取的Web页面相关的内容,诸如用户评论、等级、排名、反馈或其它内容。然后,上下文服务器640可将该内容发送到关联组件620以向用户示出。通过这种方式,用户可访问来自该Web页面其他访问者的信息并从这些用户获得关于该Web页面的意见。
可创建与由Web页面其它用户或浏览者创建的Web页面相关的许多种类型的信息。该内容可包括如上所述或结合其它附图描述的便笺和聊天通话。这种内容还可包括返回链接、上下文专用或上下文感知搜索功能、Web日志(博客)发布和排名功能等。应该注意,这些类型内容中任一种可被锚定到如上公开或描述的URL或域名的位置。这种锚定可实现内容与由与主控与该内容关联或锚定的Web站点的一方所不同的另一方所主控的Web站点关联。
可由Web站点用户创建的一种内容类型是标签。标签可以是由用户创建的与创建用户感兴趣的Web站点或某些其它信息相关的注解。例如,用户可创建包括与Web站点关连的描述性短语的标签。此外或作为其他选择,可提供站点评级,诸如多星评级或简单的赞成(thumbs-up)、反对(thumbs-down)评级。这种评级可用于Web网站自身或在Web网站上提供的产品或服务等。可提供到相关或相似Web站点的链接,包括广告链接。也可添加其它类型的内容。此外,标签可根据各种属性排序,并可用于对与这些标签关联的Web域名排序。
图7是补充内容供应系统700的系统框图。补充内容供应系统700可用于支持各种类型的补充内容组件,具体包括以上结合其它附图公开或描述的多种类型的组件,诸如便笺、聊天组件和标签等。具体地,可向来自Web站点的补充内容提供许多种第三方内容。本领域普通技术人员通过阅读本公开可以意识到,在每种实现中并非所有结合图7公开或描述的组件都是必要的。例如,隐私和广告相关组件是可任选的。
补充内容供应系统700包括客户机用户接口710。客户机用户接口710可以是能够获取信息并向用户示出该信息的Web浏览器或另一类型的用户接口。具体地,客户机用户接口710可以是可结合主要内容向用户显示的一个可插入工具条,其中该主要内容由诸如某些实施方式中Web浏览器的另一组件示出。客户机用户接口710的可插入性可以提供这样的能力:使开发者能够增加对各种类型内容的支持,其中该各种类型的内容能够以结合其它附图公开或描述的任何方式与主要内容关联。
客户机用户接口710可与第三方内容提供者715通信。第三方内容提供者715可通过使用由客户机用户接口710支持的适当通信装置向用户提供信息内容,诸如便笺、诸如Web页面的文档、内联网页面、各种格式的文本文档、图形或音频信息、包括搜索特征词或结果和搜索引擎通道的搜索相关的信息、Web日志(博客)、RSS或其它新闻馈送、包括基于通知的聊天内容的聊天内容、包括消息或用户名称的即时消息、标签、连入链接、连出链接和能以电子或机读格式存储或示出的任何其它信息,或者另一类型的信息。分立广告接口720可为广告商提供平台来创建或提供向用户示出的广告。广告接口720可以是Web浏览器窗口或某种其它适当接口。广告接口的具体细节很大程度上取决于特定实现的细节以及向广告商提供的期望访问级别。
客户机用户接口710可通过隐私保护服务725发送对各种类型信息的请求。这些请求可以是对锚定到由第三方内容提供者715提供的内容或与其关联的内容的请求。隐私保护服务725可用于保护提交信息请求的用户的身份或其它隐私相关信息。该保护可通过利用将该请求包含在一组“伪(dummy)”请求中来隐藏真实用户请求而得以实现。此外或另外可使用其它技术,具体包括使用散列信号(hash)或其它加密函数来编码信息请求或者使用各种匿名化函数。
隐私保护服务725可向信息供应系统730发送信息请求或从其接收信息。信息供应系统730可包括帮助补充信息创建和访问的各种组件。该补充信息可由用户手动创建、由诸如Web爬寻器(Web crawler)的脚本或幼虫(bot)自动创建、或者可配置成为用户创建内容。
信息供应系统730包括取出器(fetcher)735。取出器735可从客户机用户接口710接收包括URL、域名或其它适当标识符的信息请求。取出器735可使用来自客户机用户接口710的请求来从其它组件获取信息。具体地,取出器735可为用户偏好集740中获取请求用户的偏好集。取出器735可使用任何所获得的用户偏好来剪裁信息以便于根据请求用户的个别要求向客户机用户接口710提供。
取出器735可从内容数据存储745获取内容。内容数据存储745可以是数据库、Web服务或某些其它适当数据存储。可包含在内容数据存储745中的内容可包括来自用户内容编写器750的用户创建内容。用户内容编写器750可提供把用户所创建的内容添加到内容数据存储745所使用的装置。该装置可以是Web表格或其它Web服务等。内容数据存储745还可包括来自非用户内容模块755的内容。非用户内容模块755可包括诸如脚本、Web爬寻器和标签等。
取出器735还可从广告数据存储760获取广告信息。广告数据存储760可包括来自广告购买模块765的广告内容,包括图形、音频和视频内容。使用广告用户接口720的广告商可购买或获取通过使用广告购买模块765将广告置于信息供应系统730中的能力。广告购买模块765可访问用户模块770,以允许广告商选择用于针对用户做广告的一个或多个用户模型。
排名和过滤模块775可从取出器735接收内容并根据用户偏好740和用户反馈780更改该内容。用户反馈780可由客户机用户接口710的用户创建,并可用于在向客户机用户接口710提供内容之前定制内容。经更改的内容可由排名和过滤模块775向客户机用户接口710提供。
内容数据存储745也可创建可向客户机用户接口710发送的通知785。客户机用户接口710的用户可订制这种可用于触发来自客户机用户接口710的信息请求的通知。内容数据存储745可在更改所包含内容时产生事件。该事件可导致通知785的产生。通知785可被发送到客户机用户接口710,客户机用户接口710使用该通知作为触发事件来请求来自信息供应系统730的较新或更新的内容。
信息供应系统730的各种组件可使用基于人工智能的组件来向该系统提供功能。例如,排名和过滤模块775可使用分类器来向被提供给客户机用户接口710的内容分配排名。而且,例如,广告购买模块765可使用基于人工智能的组件将用户模块770与期望目标人群中的用户进行匹配。
例如结合上述匹配或推理任务所公开和描述的组件可使用各种基于人工智能的方案来完成各种任务。例如,基于用户反馈或偏好的人口匹配或内容排名可通过神经网络、专家系统、基于规则的处理组件或支持矢量机。
分类器是将输入属性矢量X=(x1,x2,x3,x4,...xn)映射到输入属于一个类的置信度的函数,即f(X)=置信度(类)。这种分类可使用概率和/或基于统计的分析(例如,计入分析用途和成本)来预测或推理用户期望自动进行的动作。例如,在内容供应系统情形中,用于比较的诸如用户偏好的应用信息集属性可用于确定内容段属性是否可被视为匹配用户的偏好。
支持矢量机(SVM)是可以使用的分类器的示例。SVM通过在可能输入的空间中寻找超曲面来操作,该超曲面尝试将触发标准从非触发事件分离。直观上,这使分类对于接近但不等同于训练数据的测试数据来说是正确的。其它直接或间接模型分类方法包括(例如)自然Bayes、Bayesian网络、决策树,且可以使用提供不同的独立模式的概率分类模型。本文所用的分类也包括用于开发优先权模型的统计回归。
从主题描述可以容易地看出,本文公开和描述的组件可使用显式训练(例如通过一般训练数据)以及隐式训练(例如通过观察用户行为、接收外来信息)的分类器。例如,可通过分类器构建器和特征选择模块内的学习或训练阶段来配置SVM。因此,分类器可用于自动进行包括但不局限于匹配和排名功能的许多功能。
操作中,补充内容供应系统700可如下所述工作。用户可操作客户机用户接口710来获取Web页面。该Web页面可通过诸如LAN、WAN、内联网或因特网等的网络连接提供。客户机用户接口710可使用诸如本文公开和描述的任何锚定方案的锚定方案来标识从第三方内容提供者715获得的附加内容。基于锚点,客户机用户接口710可从信息供应系统730请求附加内容。该附加内容可以是便笺、聊天室连接、标签、广告或它们的任何组合等。
客户机用户接口将其请求发送到隐私保护服务725。该请求可由通知785触发。隐私保护服务725通过从该请求剥除任何个人标识信息而将该请求匿名化,并将该请求发送到取出器735。此外或作为其他选择,隐私保护服务625可将该请求与一组伪请求包含在一起,以向监视该请求的任何人隐藏真实请求。
取出器735从用户偏好740获取用户偏好(同样可以匿名化),并使用这些偏好来从内容数据存储745获取内容以及从广告数据存储760获取广告。取出器将内容和广告发送到根据用户偏好740、用户模型770和用户反馈780对内容和广告进行排名和过滤的排名和过滤模块775。排名和过滤模块775将该内容和广告发送到隐私保护服务725,该服务将内容和广告传递到客户机用户接口710。
用户可使用客户机用户接口710通过隐私保护服务725来通过访问用户内容编写器750创建用户内容。用户内容编写器750将用户创建内容置于内容数据存储745中。此外或作为其他选择,非用户内容755可置于内容数据存储745中,并被包括在最终发送到客户机用户接口710的内容中。
用户还能访问用户反馈模块780,以对被提供给客户机用户接口710的内容提供明确反馈。该反馈可包括诸如相关性的质量测量以及对所提供类型的更多信息的请求或阻挡某些内容的请求。用户反馈可用于排名和过滤任务中,并可具体用于帮助训练排名和过滤模块775的任何基于人工智能的组件。
广告商可使用广告用户接口720访问广告购买模块765。这些广告商可购买广告空间并访问用户模型770来定义广告的目标接收者。广告商还使用广告用户接口720和广告购买模块765来上传或提供向用户提供的广告。这些广告可存储在广告数据存储760中。
图8是示例性用户界面800的视图。用户界面800可提供元件的逻辑排列,信息可在这些元件内向用户示出。具体地,用户界面800可提供一个平台,用户可用该平台来从诸如Web站点的信息提供者获取内容以及辅助或用户创建内容,其中该辅助或用户创建内容可被锚定到来自信息提供者的内容。这种辅助或用户创建内容可在来自信息提供者的内容的旁边示出。
用户界面800可包括主信息窗格810。在基于Web浏览平台以及可更改成适于以上结合其它附图公开或描述的变体的本示例中,主信息窗格810可用于呈现或显示用户导航到的Web页面。诸如文本、图形、多媒体内容和嵌入代码等的标准Web页面元素可在主信息窗格810中呈现。在主信息窗格810中呈现的Web页面可通过在导航条中输入URL、使用搜索引擎进行搜索或点击另一Web页面上的超链接等方法访问。
辅信息窗格或工具条820可靠近主信息窗格810显示。虽然被称为工具条,但是辅信息窗格或工具条820可以是同样包括主信息窗格810的单个窗口的一部分,正如所示出的那样,或者可以在分立窗口中示出。此外或作为其他选择,辅信息窗格或工具条820可定位在窗口顶部或底部以及左侧或右侧。这种定位可依照用户界面800的用户可选偏好。
辅信息窗格或工具条820可提供其中显示各种元素的区域,如结合其它附图公开和描述的便笺、聊天框和广告。便笺830包括来自用户的消息,该消息指示该用户拥有关于一个事件的待售票,其中该事件在与主信息窗格810中呈现的Web页面所描述的与一个设施相同的近似地理位置处发生。其它消息可包括在便笺840、850、860中。
添加便笺组件870提供文本框和条目控件,该文本框和条目控件允许用户创建和添加可锚定到当前在主信息窗格810中查看的Web站点域名的便笺。聊天框880为用户提供加入与当前查看Web站点的一般主题相关的聊天通话的接口。广告区域890提供向用户传递目标广告的空间。
参照图9-12,示出根据各种方法或过程的流程图。虽然为了说明简单起见,本文所示的流程图形式的一个或多个方法被示为一系列动作,但是应该理解,所示和所述的方法和过程以及这种方法和过程所使用的任何组件都不必受动作次序的限制,而某些动作能够以与本文所示和所述的不同次序发生和/或与其它动作同时发生。例如,本领域技术人员应该理解,方法也可表示成一系列相互联系的状态或事件,例如在状态图中。此外,不是所有示出动作都是实现方法或过程所需要的。
图9是示出与在此结合其它附图公开和描述组件结合使用的方法900的一般流程的流程图。方法900可用于获取与用户感兴趣内容相关的附加内容。具体地,附加内容可通过分析当前查看Web域名的内容并定位与该Web页面内容相关的附加内容而获得。
方法900的进程在开始框910开始并进行到进程框920。在进程框920,从网络上的某个位置取Web页面。该网络可以是局域网(LAN)、广域网(WAN)、内联网或因特网等。在进程框930对所取Web页面的内容进行分析。可使用各种分析算法来找出Web页面中的重要或相关特征词。这些算法的其中之一是以上结合其它附图描述的TF-IDF算法。
在进程框940,标识并获取与所取Web页面内容相关的附加内容。该内容可从与提供正在查看的Web页面或被分析的Web页面的网络位置不同的位置获取。该内容能够以各种方式相关,包括但不局限于相关于或锚定到Web页面的URL。具体地,所获取的内容可由当前用户或使该内容可用于公共或组查看的其它用户创建。在进程框950,向用户示出所获取的附加内容。可在诸如图形用户界面的人机界面的标识区域中进行演示。方法900的进程在结束框960结束。
图10是示出可与在此结合其它附图公开或描述的组件结合使用的一般流程1000的流程图。方法1000可用于获取与用户感兴趣内容相关的交互服务。具体地,该交互服务可通过分析当前查看Web页面内容并定位与该当前查看Web页面内容相关的交互服务而获得。
方法1000的进程在开始框1010开始并进行到进程框1020。在进程框1020,从网络上一位置获取Web页面。该网络可以是LAN、WAN、内联网、或因特网等。在进程框1030,对Web页面的内容进行分析。正如在其它示例中的那样,TF-IDF算法可用于分析Web页面。也可使用其它算法。
在进程框1040对与Web页面内容相关的交互服务(在本示例中为聊天通话)进行标识。标识可基于聊天室主题的关键词搜索,或其它方法。在进程框1050,连接到至少一个标识出的聊天通话,且向用户示出该聊天室内容。方法1000的进程在结束框1060结束。
图11是示出与在此结合其它附图公开或描述的组件结合使用的一般流程的流程图。方法1100可用于获取与用户感兴趣内容相关的附加内容。具体地,该附加内容可通过分析当前查看Web页面内容并定位可引用该当前查看Web页面内容的附加内容来获得。
方法1100的进程在开始框1110开始。处理进行到在其中取出Web页面的进程框1120。该Web页面可从某个本地或远程Web服务器取出。可使用诸如LAN、WAN、内联网或因特网等的网络访问远程Web服务器。在进程框1130,对所取出Web页面的内容进行分析。对Web页面内容进行的分析可根据各种算法,特别地,包括TF-IDF算法。其它适当算法可代替TF-IDF算法。
在进程框1140,对与所取出Web页面内容相关的来自Web日志的内容进行标识和获取。Web日志内容能够以各种方式相关。例如,Web日志可具体讨论被分析Web页面上的内容。Web日志条目也可提供到被分析Web页面的超链接。而且,Web日志条目可简单地讨论与被分析Web页面相同或相似的主题。这种Web日志内容在进程框1150向用户示出。方法1100的进程在结束框1160结束。
图12是示出可与在此结合其它附图公开或描述的组件结合使用的一般流程的流程图。方法1200可用于获取与用户感兴趣内容相关的附加内容。具体地,附加内容可通过分析当前查看Web页面内容并进行搜索以创建偏向包括与所分析Web页面内容相似内容的结果的一组结果来获得。
方法1200的进程在开始框1210开始。在进程框1220,从诸如Web服务器的某个信息服务器取Web页面。该信息服务器可以是本地或远程的。在其中该信息服务器为远程的情形中,Web页面可在诸如LAN、WAN、内联网或因特网等的网络上获取。
在进程框1230对所取Web页面进行分析。在进程框1240标识来自Web页面的重要特征词或概念。分析和标识任务可使用各种算法完成,包括结合其它附图描述的TF-IDF算法。方法1200的处理进行到进程框1250,其中来自用户的搜索查询被接受。
在进程框1260,来自用户的所接受的搜索查询被可任选地通过将从所分析Web页面标识的重要特征词或概念添加到该查询来扩充。使用经扩充的查询的搜索在进程框1270进行。这种方式的查询扩充可用于以有利于包括与所分析Web页面内容相似内容的结果的形式偏置搜索结果。搜索也可任选地以各种方式提炼,诸如通过将查询限制于当前域或限制于链接到当前查看页面的页面。也可能有其它更改。搜索的结果可在进程框1280获得,并可通过某种接口向用户示出。在进程框1285,所获得的结果被可任选地重新排序。方法1200的进程在框1290结束。
为了为实现提供附加上下文,图13-14和以下讨论旨在提供其中可实现所公开和描述的组件和方法的适当计算环境的简要一般描述。虽然以上在本地计算机和/或远程计算机上运行的计算机程序的计算机可执行指令的一般上下文中描述了各种具体实现,但是本领域技术人员应该意识到其它实现单独或与其它程序模块组合也是可能的。通常,程序模块包括执行特定任务和/或实现特定抽象数据类型的例程、程序、组件数据结构等。
此外,本领域技术人员应该理解,上述组件和方法可用其它计算机系统配置实践,这些计算机系统包括单处理器或多处理器计算机系统、小型计算机、大型计算机以及个人计算机、手持计算设备、基于微处理器和/或可编程消费电子设备等,其中的每个都能与一个或多个关联设备有效地通信。所公开和描述的组件和方法的某些例示方面也可在分布式计算环境中实施,其中特定任务由通过通信网络或其它数据连接来链接的远程处理设备执行。然而,一些方面,如果不是所有方面,可在独立计算机上实施。在分布式计算环境中,程序模块可位于本地和/或远程存储器存储设备上。
图13是可与本发明交互的示例计算环境1300的示意框图。系统1300包括一个或多个客户机1310。客户机1310可以是硬件和/或软件(例如线程、进程、计算设备)。系统1300还可包括一个或多个服务器1320。(诸)服务器1320可以是硬件和/或软件(例如线程、进程、计算设备)。诸服务器1320可容纳通过例如使用本发明进行转换的线程或进程。
客户机1310和服务器1320之间的一个可能通信装置可以是适于在两个或以上的计算机进程之间传递的数据包形式。系统1300包括可用于方便(诸)客户机1310与(诸)服务器1320之间通信的通信框架1340。(诸)客户机1310可操作地连接到可用于存到(诸)客户机1310的本地信息的一个或多个客户机数据存储1350。类似地,(诸)服务器1320可操作地连接到可用于存储诸服务器1340的本地信息的一个或多个服务器数据存储1330。
参照图14,用于实现本发明各个方面的示例性环境1400包括计算机1412。计算机1412包括处理单元1414、系统存储器1416和系统总线1418。系统总线1418将包括但不局限于系统存储器1416的诸系统组件耦合到处理单元1414。处理单元1414可以是各种可用处理器中任一种。双微处理器或其它多处理器架构也可用作处理单元1414。
系统总线1418可以是多种类型的总线结构中的任意结构,包括存储器总线或存储器控制器、外围总线或外部总线和/或局部总线,它们可使用各种可用总线架构中的任意架构,这些架构包括但不局限于工业标准架构(ISA)、微通道架构(MSA)、扩展ISA(EISA)、智能电子驱动器(IDE)、VESA局域总线(VLB)、外围组件互连(PCI)、卡总线、通用串行总线(USB)、加速图形端口(AGP)、个人计算机存储卡国际协会(PCMCIA)总线、火线(IEEE 1394)和小型计算机系统接口(SCSI)。
系统存储器1416包括易失性存储器1420和非易失性存储器1422。包含在诸如启动时在计算机1412内元件之间转移信息的基本例程的基本输入/输出系统(BIOS)存储在非易失性存储器1422中。作为例示而非限制,非易失性存储器1422可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦ROM(EEPROM)或闪存。易失性存储器1420包括作为外部高速缓冲存储器的随机存取存储器(RAM)。作为例示而非限制,RAM可使用许多形式,诸如同步RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍数据率SDRAM(DDR SDRAM)、增强SDRAM(ESDRAM)、同步链接DRAM(SLDRAM)和直接型Rambus RAM(DRRAM)。
计算机1412还可包括可移动/不可移动、易失性/非易失性计算机存储介质。例如,图14示出盘存储1424。盘存储1424包括但不局限于,类似磁盘驱动器的设备、软盘驱动器、磁带驱动器、Jaz驱动器、Zip驱动器、LS-100驱动器、闪存卡或存储棒。此外,盘存储1424可包括从其它存储介质分立或与其组合的存储介质,包括但不局限于诸如压缩盘ROM设备(CD-ROM)的光盘驱动器、CD可记录驱动器(CD-R驱动器)、CD可写入驱动器(CD-RW驱动器)或数字多功能盘ROM驱动器(DVD-ROM)。为了帮助盘存储设备1424连接到系统总线1418,通常使用可移动或不可移动接口,如接口1426。
应该理解,图14描述用作用户与适当操作环境1400中描述的基本计算机资源之间媒介的软件。这种软件包括操作系统1428。可存储在盘存储1424上的操作系统用于控制和分配计算机系统1412的资源。系统应用程序1430通过存储在系统存储器1416或盘存储1424上的程序模块1432和程序数据1434来利用操作系统1428对资源的管理。应该理解,本发明可用各种操作系统或操作系统的组合来实现。
用户通过输入设备1436将命令或信息输入到计算机1412中。输入设备1436包括但不局限于诸如鼠标的指点设备、轨迹球、跟踪球、输入笔、触摸板、键盘、话筒、操纵杆、游戏垫、卫星盘、扫描仪、TV调谐卡、数码相机、数码摄像机、Web相机等。这些和其它输入设备通过系统总线1418经由接口端口1438连接到处理单元1414。接口端口1438包括(例如)串行端口、并行端口、游戏端口和通用串行总线(USB)。输出设备1440使用与输入设备1436相同类型端口中的某些。因此,例如,USB端口可用于向计算机1412提供输入,而且可从计算机1412向输出设备1440输出信息。提供输出适配器1442以例示除了其它输出设备1440之外存在类似监视器、扬声器和打印机等需要特定适配器的某些输出设备1440。作为例示而非限制,输出适配器1442包括在输出设备1440与系统总线1418之间提供连接装置的视频和语音卡。应该注意,其它设备和/或设备系统提供输入和输出两方面能力,如远程计算机1444。
计算机1412可在使用到一个或多个诸如远程计算机1444的远程计算机的逻辑连接的网络化环境中操作。远程计算机1444可以是个人计算机、服务器、路由器、网络PC、工作站、基于微处理器的设备、对等设备或其它共用网络节点等,并通常包括与计算机1412相关描述的元件中多个或全部。简明起见,只有存储器存储设备1446与远程计算机1444一起示出。远程计算机1444通过网络接口1448逻辑连接到计算机1412,并经由通信连接1450物理连接。网络接口1448包括诸如局域网(LAN)和广域网(WAN)的有线和/或无线通信网络。LAN技术包括光纤分布式数据接口(FDDI)、铜缆分布式数据接口(CDDI)、以太网、令牌网等。WAN技术包括但不局限于点对点链接、类似综合服务数字网(ISDN)及其变体的电路交换网络、分组交换网络和数字用户线路(DSL)。
通信连接1450是指用于将网络接口1448连接到总线1418的硬件/软件。虽然为清楚起见在计算机1412内示出通信连接1450,但是它可以在计算机1412外部。到网络接口1248所必需的硬件/软件包括,仅为示例性目的,内置或外置技术,诸如包括常规电话等级调制解调器(telephone grade modem)、线缆调制解调器和DSL调制解调器的调制解调器、ISDN适配器和以太网卡。
以上所述包括本发明的诸示例。当然,不可能为描述本发明而描述每个组件或方法的可能组合,但是本领域普通技术人员应该意识到,本发明的许多进一步组合和改变是可能的。因此,本发明旨在涵盖落在所附权利要求书的精神和范围内的所有这种更改、改变和变化。
特别地以及关于由上述组件、设备、电路系统等实现的各种功能,除非另行指出,否则用于描述这种组件的术语(包括对“装置”的引用)旨在对应于实现所述组件的指定功能(例如功能等效)的任何组件,即使在结构上不等同于实现本文中所示本发明示例性方面中的功能的公开结果。在这点上,还应该意识到本发明包括一种系统以及具有用于实现本发明各种方法的动作和/或事件的计算机可执行指令的计算机可读介质。
此外,虽然本发明的特定特征仅针对若干实现之一公开,但是这种特征可由于对任何给定或特定应用所需或有益而与其它实现的一个或多个特征组合。此外,在细节描述或权利要求书中所使用的术语“包括”及其变体的范围内,这些术语旨在以与术语“包含”类似的方式表示包括在内。

Claims (14)

1.一种用于关联信息的系统,包括:
使用来自第一段信息的锚定信息来获取第二段信息并关联所述第一段信息和所述第二段信息的关联模块,其中所述锚定信息是通过分析所述第一段信息以识别并定位所述第一段信息的关键段或重要段所获得的,并且所述第一段信息的关键段或重要段被用作所述锚定信息,其中所述第二段信息与所述第一段信息不同;以及
将所述第二段信息与所述第一段信息一起在一用户界面中向用户示出以供使用的呈现模块,其中所述第一段信息被显示在所述用户界面的主信息窗格中,所述第二段信息被显示在所述用户界面的辅信息窗格中,并且所述辅信息窗格包括以下至少之一:添加便笺组件,所述添加便笺组件允许用户创建并添加能被锚定到当前正在所述主信息窗格中被查看的所述第一段信息的便笺,和,一接口,所述接口允许用户在查看所述主信息窗格中显示的所述第一段信息的同时加入到与所述第一段信息的主题相关的聊天通话中。
2.如权利要求1所述的系统,其特征在于,所述第一段信息是Web网页、文本文档、博客条目、wiki、图像文件、音频文件和多媒体文件中之一。
3.如权利要求2所述的系统,其特征在于,所述锚定信息是域名、统一资源定位符、关键词、表格数据和文件位置中之一。
4.如权利要求3所述的系统,其特征在于,所述第二段信息是便笺、Web页面、内联网页面、文本文档、图像文件、音频文件、搜索特征词、搜索结果、搜索引擎接口、wiki、博客、RSS馈送、新闻馈送、聊天通话接口、基于通知的聊天通话接口、即时消息、标签、评级、连入链接、连出链接和广告中之一。
5.如权利要求4所述的系统,其特征在于,还包括创建所述第二段信息的创建模块。
6.如权利要求5所述的系统,其特征在于,所述创建模块是文本编辑器、图像应用程序、音频应用程序、多媒体应用程序、博客应用程序、辛迪加应用程序、Web发布应用程序、聊天应用程序、即时消息应用程序、标签应用程序和评级应用程序中之一。
7.如权利要求6所述的系统,其特征在于,还包括保护所述关联模块用户个人信息的隐私模块。
8.如权利要求7所述的系统,其特征在于,所述呈现模块是可插入的。
9.一种用于关联信息的计算机实现方法,包括:
使用来自第一段信息的锚定信息来获取第二段信息并关联所述第一段信息和所述第二段信息,其中所述锚定信息是通过分析所述第一段信息以识别并定位所述第一段信息的关键段或重要段所获得的,并且所述第一段信息的关键段或重要段被用作所述锚定信息,其中所述第二段信息与所述第一段信息不同;以及
将所述第二段信息与所述第一段信息一起在一用户界面中向用户示出以供使用,其中所述第一段信息被显示在所述用户界面的主信息窗格中,所述第二段信息被显示在所述用户界面的辅信息窗格中,并且所述辅信息窗格包括以下至少之一:添加便笺组件,所述添加便笺组件允许用户创建并添加能被锚定到当前正在所述主信息窗格中被查看的所述第一段信息的便笺,和,一接口,所述接口允许用户在查看所述主信息窗格中显示的所述第一段信息的同时加入到与所述第一段信息的主题相关的聊天通话中。
10.如权利要求9所述的方法,其特征在于,使用锚定信息包括使用域名、使用统一资源定位符、使用关键词、使用表格数据、和使用文件位置中之一。
11.如权利要求10所述的方法,其特征在于,使用锚定信息来获取第二段信息包括获取便笺、Web页面、内联网页面、文本文档、图像文件、音频文件、搜索特征词、搜索结果、搜索引擎接口、wiki、博客、RSS馈送、新闻馈送、聊天通话接口、基于通知的聊天通话接口、即时消息、标签、评级、连入链接、连出链接和广告中的至少一个。
12.如权利要求11所述的方法,其特征在于,还包括创建所述第二段信息。
13.如权利要求12所述的方法,其特征在于,创建所述第二段信息包括使用文本编辑器、使用图像应用程序、使用音频应用程序、使用多媒体应用程序、使用博客应用程序、使用辛迪加应用程序、使用Web发布应用程序、使用聊天应用程序、使用即时消息应用程序、使用标签应用程序、和使用评级应用程序中的至少一个。
14.如权利要求13所述的方法,其特征在于,还包括保护所述用户的个人信息。
CN2006800135089A 2005-04-25 2006-03-30 将信息与电子文档关联的方法和系统 Expired - Fee Related CN101176052B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US67462005P 2005-04-25 2005-04-25
US60/674,620 2005-04-25
US11/227,937 US7734631B2 (en) 2005-04-25 2005-09-15 Associating information with an electronic document
US11/227,937 2005-09-15
PCT/US2006/012649 WO2006115718A2 (en) 2005-04-25 2006-03-30 Associating information with an electronic document

Publications (2)

Publication Number Publication Date
CN101176052A CN101176052A (zh) 2008-05-07
CN101176052B true CN101176052B (zh) 2010-09-08

Family

ID=37215197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800135089A Expired - Fee Related CN101176052B (zh) 2005-04-25 2006-03-30 将信息与电子文档关联的方法和系统

Country Status (8)

Country Link
EP (1) EP1875371A4 (zh)
JP (1) JP2008539508A (zh)
KR (1) KR101242380B1 (zh)
CN (1) CN101176052B (zh)
BR (1) BRPI0608126A2 (zh)
MX (1) MX2007013091A (zh)
RU (1) RU2406129C2 (zh)
WO (1) WO2006115718A2 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010532506A (ja) * 2007-03-30 2010-10-07 ニューコ インコーポレイテッド ナレッジナビゲーション及びディスカバリのデータ構造、システム、及び方法
US10867123B2 (en) * 2009-11-09 2020-12-15 Microsoft Technology Licensing, Llc Social browsing
US20100070339A1 (en) * 2008-09-15 2010-03-18 Google Inc. Associating an Entity with a Category
US8312385B2 (en) * 2009-09-30 2012-11-13 Palo Alto Research Center Incorporated System and method for providing context-sensitive sidebar window display on an electronic desktop
JP5325077B2 (ja) * 2009-11-20 2013-10-23 富士通株式会社 情報配信装置
US20110231296A1 (en) * 2010-03-16 2011-09-22 UberMedia, Inc. Systems and methods for interacting with messages, authors, and followers
CN101916293B (zh) * 2010-08-27 2016-03-02 中国电信股份有限公司 在文档中引入媒体信息的方法和装置
CN102387126A (zh) * 2010-09-01 2012-03-21 腾讯科技(深圳)有限公司 聚合微博单条消息的方法,服务器,客户端和系统
WO2013044329A1 (ru) * 2011-09-27 2013-04-04 Magerramov Tarlan Tofik Ogly Способ формирования и отображения базы данных интернет-сайта
RU2465638C1 (ru) * 2011-10-04 2012-10-27 Общество с ограниченной ответственностью "Сетевизор" Способ распространения мультимедийной информации посредством развертывания децентрализованной сети типа peer-to-peer и децентрализованная сеть для осуществления способа
US8812527B2 (en) * 2011-11-29 2014-08-19 International Business Machines Corporation Automatically recommending asynchronous discussion forum posts during a real-time collaboration
CN103177383A (zh) * 2013-03-21 2013-06-26 北京亿部文化有限公司 一种在电子书中植入广告的方法
RU2609078C2 (ru) * 2013-08-29 2017-01-30 Общество С Ограниченной Ответственностью "Яндекс" Система управления индексацией партнерских объявлений
WO2015106425A1 (zh) 2014-01-16 2015-07-23 何劲 在社交网络系统中进行信息处理的方法和系统
US11120210B2 (en) * 2014-07-18 2021-09-14 Microsoft Technology Licensing, Llc Entity recognition for enhanced document productivity
US20160055134A1 (en) * 2014-08-21 2016-02-25 Samsung Electronics Co., Ltd. Method and apparatus for providing summarized content to users
CN105138670B (zh) * 2015-09-06 2018-12-14 天翼爱音乐文化科技有限公司 音频文件标签生成方法和系统
US10120948B2 (en) * 2015-10-13 2018-11-06 Google Llc Providing notifications based on geofencing search results
FI20165327A (fi) 2016-04-15 2017-10-16 Copla Oy Dokumenttiautomaatio
KR101901965B1 (ko) * 2017-01-12 2018-09-28 엘에스산전 주식회사 프로젝트 화면 작성장치
KR102275930B1 (ko) * 2018-03-14 2021-07-12 (주)알테오젠 Folr1에 특이적으로 결합하는 항체 및 그의 용도
WO2024096921A1 (en) * 2022-11-02 2024-05-10 Google Llc Distributing digital components while securing user data

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004079522A2 (en) * 2003-02-28 2004-09-16 Google, Inc. Identifying related information given content and/or presenting related information in association with content-related advertisements

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB189818056A (en) * 1898-08-22 1899-05-27 James Mcquitty A New or Improved Method of Stitching or Binding Magazines, Periodicals, and Books.
US6347398B1 (en) * 1996-12-12 2002-02-12 Microsoft Corporation Automatic software downloading from a computer network
JP2001022788A (ja) * 1999-07-13 2001-01-26 Nec Corp 情報検索装置および情報検索プログラムを記録した記録媒体
US7089278B1 (en) * 1999-09-07 2006-08-08 Fuji Xerox Co., Ltd. Anchored conversations: adhesive, in-context, virtual discussion forums
DE19959142A1 (de) * 1999-12-08 2001-08-30 Cyberprofit Ag Verfahren und Vorrichtung zum Übermitteln von Inhalten, insbesondere von Werbung
JP2001282092A (ja) * 2000-03-31 2001-10-12 Iq 3:Kk ワイド・アクセス情報伝送システムを介してオンライン及びオフラインの教育機会並びに関連情報を供給するシステム及び方法
NO313399B1 (no) * 2000-09-14 2002-09-23 Fast Search & Transfer Asa Fremgangsmate til soking og analyse av informasjon i datanettverk
GB2378775A (en) * 2001-05-03 2003-02-19 Connextra Ltd Provision of Secondary Information based on Context of Primary Information
JP4088950B2 (ja) * 2001-12-13 2008-05-21 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
KR20030082110A (ko) * 2002-04-16 2003-10-22 (주)메타웨이브 앤드 연산자 및 문서 내 연관성을 이용한 색인어 검색 및정보 제공 시스템 및 방법
JP2004348241A (ja) * 2003-05-20 2004-12-09 Hitachi Ltd 情報提供方法、サーバ及びプログラム
JP2005031780A (ja) * 2003-07-08 2005-02-03 Dainippon Printing Co Ltd 情報クリッピングシステム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004079522A2 (en) * 2003-02-28 2004-09-16 Google, Inc. Identifying related information given content and/or presenting related information in association with content-related advertisements

Also Published As

Publication number Publication date
RU2007139524A (ru) 2009-04-27
WO2006115718A2 (en) 2006-11-02
BRPI0608126A2 (pt) 2009-11-10
WO2006115718A3 (en) 2007-12-27
JP2008539508A (ja) 2008-11-13
MX2007013091A (es) 2008-01-11
EP1875371A2 (en) 2008-01-09
CN101176052A (zh) 2008-05-07
KR20080002879A (ko) 2008-01-04
EP1875371A4 (en) 2010-03-24
RU2406129C2 (ru) 2010-12-10
KR101242380B1 (ko) 2013-03-14

Similar Documents

Publication Publication Date Title
CN101176052B (zh) 将信息与电子文档关联的方法和系统
US9374396B2 (en) Recommended content for an endorsement user interface
US20190121850A1 (en) Computerized system and method for automatically transforming and providing domain specific chatbot responses
CN101779180B (zh) 基于背景的内容推荐的方法和设备
CN100545843C (zh) 用于搜索网站的方法和意见跟踪服务器
US20060242574A1 (en) Associating information with an electronic document
US9396271B2 (en) Global reverse lookup public opinion directory
US20080215581A1 (en) Content/metadata selection and propagation service to propagate content/metadata to client devices
US20110275047A1 (en) Seeking Answers to Questions
US20130035996A1 (en) Social advertising technology (so-ad-tec) system and method for advertising for and in documents, and other systems and methods for accessing, structuring, and evaluating documents
US20160283585A1 (en) Method and system for providing a personalized snippet
KR20160058896A (ko) 소셜 커뮤니케이션 데이터를 분석하고 송신하는 시스템 및 방법
JP2015528953A (ja) 取得された構造化データに対応する入力フィールドを有するコンポーザ・インターフェースを使用する構造化ユーザ・データの取得
US20220382814A1 (en) Systems and Methods for Generating Real-Time Recommendations
CN102549572A (zh) 用于提供高级搜索结果页面内容的系统和方法
CN107710204A (zh) 客户端设备应用交互监视
Roth-Cohen et al. Going undercover: Online domestic tourism marketing communication in closed and open Facebook groups
JP6679250B2 (ja) 決定装置、決定方法および決定プログラム
CN110597962A (zh) 搜索结果展示方法、装置、介质及电子设备
Kong et al. Multi-objective personalization in multi-stakeholder organizational bulk e-mail: A field experiment
US20190087394A1 (en) System and method for modifying web content
Ali et al. Interaction-based collaborative recommendation: a personalized learning environment (PLE) perspective
US20090112847A1 (en) Apparatus and method for enhancing a composition with relevant content pointers
KR101124213B1 (ko) 온톨로지를 이용한 맞춤형 뉴스레터 제공 시스템
Supraba et al. Analyzing the use of SEO and Google Analytic on the Website of Vocational High School of Information Technology Annajiyah

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150430

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150430

Address after: Washington State

Patentee after: MICROSOFT TECHNOLOGY LICENSING, LLC

Address before: Washington State

Patentee before: Microsoft Corp.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100908