CN101331474A - 浏览与电子邮件有关的项目 - Google Patents

浏览与电子邮件有关的项目 Download PDF

Info

Publication number
CN101331474A
CN101331474A CNA200680046841XA CN200680046841A CN101331474A CN 101331474 A CN101331474 A CN 101331474A CN A200680046841X A CNA200680046841X A CN A200680046841XA CN 200680046841 A CN200680046841 A CN 200680046841A CN 101331474 A CN101331474 A CN 101331474A
Authority
CN
China
Prior art keywords
project
sets
email
label
related items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200680046841XA
Other languages
English (en)
Inventor
A·C·萨瑞德兰
J·C·普拉特
B·T·斯塔巴克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101331474A publication Critical patent/CN101331474A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/60Business processes related to postal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种用于浏览与电子邮件相关的项目的系统包括将项目分组成多个相关项目集的分组组件。标记组件将一个或多个标签与每一相关项目集相关联,并且电子邮件显示组件显示电子邮件以及与所显示的电子邮件相关联的一个或多个标签。相关项目显示组件接收用户对一个或多个标签中的至少一个的选择,并至少部分地基于用户选择来显示与所显示的电子邮件相关的一个或多个项目。

Description

浏览与电子邮件有关的项目
背景
计算设备上的存储容量在相对较短的一段时间内有了惊人的增长,由此使得用户和企业能够创建并储存大量数据。例如,当今的消费计算机上的硬盘驱动器空间是数百吉字节的数量级。服务器和其它更高级设备可以与更大量的存储空间相关联。存储容量的这一增长不仅仅限于个人计算机和服务器,而是已涉及到了诸如便携式电话、个人数字助理、便携式媒体播放器和其它合适的手持式设备等便携式设备空间。
对一般消费者可用的大量存储空间使得消费者能够保留即使没有数百万也有数千个文件。例如,可以通过使用数码相机来拍摄照片,并且然后将这些照片传送并保留在计算设备上。由此,计算设备实际上可被用作一相册。类似地,可以从诸如紧致盘等媒体抓取音乐文件,并将其置于计算设备上,由此使得计算设备能够用作自动唱机。可以创建并保留文字处理文档,其中这些文档可以与个人的帐单、报表、学校论文、工作、投资组合等有关。与用户所期望的任何话题有关的电子表格文件、幻灯片演示以及其它项目类型也可被创建和/或保留在计算设备的硬盘或存储器中。假设在计算设备上可存在大量数据文件,其中这些文件可以在不同的时刻创建并且与不同的话题有关,可以认识到这些文件的组织和/或索引可能是极成问题的。
为了进行数据文件组织,传统上创建文件夹和子文件夹,其中根据话题以及要保留在其中的内容来确定文件夹分层结构内的名称和位置。这可以手动和/或自动完成;例如,用户可手动创建文件夹、为文件夹命名、并将该文件夹放置在期望位置中。之后,用户可以向这一文件夹移动数据/文件,和/或使得新创建的数据/文件被保存在该文件夹中。文件夹也可通过一个或多个程序来自动创建。例如,数码相机通常将文件储存在按照日期命名的文件夹中-由此,数码照片可以被储存在叙述其中的照片的拍摄日期的文件夹中。该方法对于在相对较短的时间帧内创建的少量文件能起较好的作用,因为用户能够记住文件夹的位置以及其中储存的内容。然而,当文件和文件夹的数量增加时且随着时间的推移,用户很难记住其想要检索的项目位于何处、这些项目的名称是什么等等。因此可以采用对文件内容或名称的搜索,但是通常这一搜索在定位所需数据方面是不足的,因为用户可能没有记住文件的名称、该文件何时创建、和/或可被搜索的其它参数。引起更进一步的困难的是,文件可能与一特定话题有关,但是由于缺少内容或缺少特定用语,不能采用搜索功能。在一具体示例中,用户可能希望定位包括一特定家庭成员的每一数码照片,但是搜索照片的唯一方式可能是通过文件名和创建日期。
为了弥补这些缺陷中的某一些,数据或文件可以与此处被称为标签的附加元数据相关联。例如,用户可用在照片中的个人的名字来标记照片。由此,在执行对一家庭成员的名字的搜索时,用该名字标记的每一文件可被迅速提供给用户。在电子邮件的示例中,电子邮件可包含与一教授有关的内容,而不包括与雇用该教授的大学有关的数据。用户可以通过用该大学的名称标记该电子邮件来将该电子邮件与该大学相关联-由此,对该大学的后续电子邮件搜索将导致向搜索者返回上述电子邮件。然而,以此常规方式标记是极其低效的,因为每一项目必须由用户来手动标记。更详细而言,用户必须选择一个或多个项目(通过多次选择),然后手动创建所需标签。如果存在数千个项目,则用户将对手动标记项目的痛苦的、低效的过程变得非常恼怒。也可采取对项目的自动标记,但是这需要使用大量的训练数据,这些数据的获得可能是昂贵的(在时间方面)。
概述
以下提出了简化概述以便提供对所要求保护的主题的某些方面的基本理解。本概述并不是广泛综述,并且其并不旨在确定所要求保护的主题的关键/重要要素或勾画其范围。其唯一的目的是以简化的形式提出某些概念,作为以后提出的更详细描述的序言。
此处描述了可以用于为一相关项目集自动选择并提供基本相似的标签的系统、方法、制品、装置等,其中这些标签可以用于基于电子邮件选择的项目浏览。可对项目进行分析,以将具有某种关系的项目分组到一个或多个相关项目集中,其中这些项目可包括与计算机相关联的所有项目、在某一特定存储位置中的所有项目、与一个或多个应用程序相关联的所有项目等等。项目也可以是任何适当的类型,包括电子邮件、文字处理文档、网页、电子表格、幻灯片演示等等。在一个示例中,可生成与每一项目相关联的项目描述,其中该项目描述可包括与每一项目相关联的文本和/或元数据。此外,项目描述可以至少部分地基于先前分配给该项目的标签(例如,由用户分配给项目的标签)。
项目然后可以被分组,以使相关的项目在基本相似的集合内。在一个示例中,这一分组可以通过利用一个或多个群集算法来实现,其中群集算法可以考虑上述项目描述。然而,构想了任何适当的群集方式,并且这些方式旨在落入所附权利要求书的范围之内。在另一示例中,每一项目可以与一“团集”(clique)或“邻域”相关联,其中团集或邻域包括一项目以及该项目的k个最近的邻居。这些邻域然后可用作集合,或被提供给群集算法以便与其它邻域分组。此外,一集合内的项目之间的关系可以是任何适当的关系。例如,关系可以基于创建时间、项目被储存在硬盘驱动器内的位置、内容的相似性、用于创建项目的应用程序等。
一旦定义了相关项目集,一个或多个标签可以与该集合相关联(例如,该相关项目集内的每一项目可以与一个或多个标签相关联)。标签可以通过从项目内提取文本、分析与项目相关联的元数据等来标识。在一具体示例中,在该相关项目集内的各项目上有某种程度的共同性的文本可被用作标签。此外,可以对项目的完全不同的部分加权,由此使得与这些部分相关联的文本更有可能被用作标签。例如,电子邮件的主题行中的文本可以按使得它与电子邮件正文中的文本相比更有可能被用作标签的方式来加权。在完成了标记项目之后,对包括先前作为标签来分配的单词或短语的项目的搜索可返回该相关项目集内的项目。然而,可以理解,该相关项目集内的项目还包括由用户提供的标签和/或与一完全不同的组相关联的标签。
此外,标签可用于帮助用户定位与电子邮件相关联的项目。例如,电子邮件应用程序内的电子邮件可被认为是项目(连同其它类型的项目),并且可以在一个或多个相关项目集内。在选择或显示一电子邮件时,与该电子邮件相关联的标签可被提供给用户(例如,作为显示域中的超链接)。换言之,与包括所显示/选择的电子邮件的每一集合相关联的标签和/或与关联于对电子邮件的阈值相似性等级的每一集合相关联的标签可被提供给用户。在选择一个或多个这样的标签之后,包括该标签的项目可被提供给用户。由此,此处描述了基于电子邮件来组织项目的有效且直观的方式。
为了实现上述和相关目的,此处结合以下描述和附图描述了某些说明性方面。然而,这些方面仅是可以采用所要求保护的主题的原理的各种方式中的几种,并且所要求保护的主题旨在包括所有这样的方面及其等效方面。当结合附图考虑时,从以下详细描述中可以清楚其它优点和新颖特征。
附图简述
图1是自动组标记和项目浏览系统的高级框图。
图2是有助于至少部分地基于分配给项目的标签来显示广告的系统的框图。
图3是有助于在接收到用户输入时自动标记组的系统。
图4是利用群集来定义相关项目集的自动标记系统。
图5示出了将文本提取用于向多个项目提供基本相似的标签。
图6是可在没有训练数据的帮助下使用的自动组标记系统。
图7是示出用于至少部分地基于自动与项目相关联的标签来浏览项目的方法的代表性流程图。
图8是示出用于自动将基本相似的标签分配给多个相关项目的方法的代表性流程图。
图9是示出用于步进通过多个项目并为每一项目定义一集合的方法的代表性流程图。
图10是示出用于结合生成组标签来创建并采用项目描述的方法的代表性流程图。
图11是示出用于通过分析标签及其相关联的关键词来对项目分组的方法的代表性流程图。
图12是可包括基本相似的项目的多个组的表示。
图13示出了一组相关的项目,其中该组项目内的每一项目包括组标签和个体标签。
图14是可用于通过使用标签来搜索项目的示例性用户界面。
图15是可用于在显示电子邮件时浏览项目的示例性用户界面。
图16是示出一合适的操作环境的示意性框图。
图17是一示例计算环境的示意性框图。
详细描述
现在参考附图来描述本发明,在全部附图中,相同的参考标号用于指代相同的元素。在以下描述中,出于解释的目的,阐明了众多具体细节以提供对所要求保护的主题的全面理解。然而,很明显,该主题可以在没有这些具体细节的情况下实施。在其它情况下,以框图形式示出了公知的结构和设备以便于描述本发明。
如本申请中所使用的,术语“组件”和“系统”指的是计算机相关的实体,无论是硬件、硬件和软件的组合、软件还是执行中的软件。例如,组件可以是,但不限于,运行在处理器上的进程、处理器、对象、可执行码、执行的线程、程序和/或计算机。作为说明,运行在服务器上的应用程序和服务器都可以是组件。一个或多个组件可驻留在进程和/或执行的线程中,并且组件可位于一个计算机上和/或分布在两个或多个计算机之间。词语“示例性”此处用于指用作示例、实例或说明,此处被描述为“示例性”的任何方面或设计并不一定要被解释为相对于其它方面或设计是优选或有利的。
此外,所要求保护的主题的各方面可被实现为方法、装置或制品,它们使用标准编程和/或工程技术来产生控制计算机实现本发明的各方面的软件、固件、硬件或其任意组合。如此处所使用的术语“制品”旨在包含可从任何计算机可读设备、载体或介质访问的计算机程序。例如,计算机可读介质可包括但不限于,磁存储设备(例如,硬盘、软盘、磁带……)、光盘(例如,紧致盘(CD)、数字多功能盘(DVD)……)、智能卡以及闪存设备(例如,卡、棒、密钥驱动器……)。另外,应当理解,可采用载波来承载诸如在发送和接收电子邮件或访问如因特网或局域网(LAN)等网络时使用的计算机可读电子数据。当然,本领域的技术人员将认识到,可对该配置作出许多修改而不背离此处所描述的范围或精神。
现在将参考附图来描述所要求保护的主题,在全部附图中,相同的标号表示相同的元素。现在参考图1,示出了有助于至少部分地基于与电子邮件的关系来浏览项目的系统100。系统100包括分析多个项目104以定义一相关项目集106的分组组件102,其中项目可以是诸如照片、文字处理文件、电子表格等文件,以及网页、电子邮件和任何其它适当类型的数据项目。项目104可以包括基本相似类型的项目或完全不同类型的项目,并且可以基于所需实现来限制。例如,项目104可以包括驻留在计算机内的每一项目、硬盘驱动器内的每一项目、可移动存储介质内的每一项目、与一个或一组特定应用程序相关联的每一项目、其任意组合等等。项目104中的至少某一些也可以与因特网或内联网相关。例如,网站可以与一特定标签相关联。
分组组件102可以通过例如分析第一项目,然后定位以某种方式与该第一项目有关的项目来定义相关项目集106。该第一项目可以由用户手动选择,和/或由分组组件102(或其它计算组件)自动选择。在选择了第一项目之后,分组组件102可以通过各种手段来确定该第一项目与多个项目104中的其它项目之间的关系。例如,分组组件102可以分析与第一项目相关联的预先存在的标签,并且之后定位与相似标签相关联的项目(例如,具有相似标签、具有对应于标签的内容……的项目)。在另一实例中,可分析该第一项目的内容,并且可从该第一项目中创建和/或提取关键词。这些关键词然后可用于定位与该关键词具有某种关系、且因此与第一项目有关系的项目。在又一实例中,关系可以基于计算机内的位置、项目类型、项目的创建日期等来确定。因此,构想了创建相关项目集106的任何适当方式,且这些方式旨在落入所附权利要求书的范围内。
通信地耦合到分组组件102的标记组件108可接收相关项目集106的等同性(例如,相关项目集106内的项目)。基于相关项目集106内的项目,标记组件108可以自动向相关项目集106内的每一项目提供基本相似的标签。例如,可对相关项目集106内的每一项目采取关键提取技术,并且可将在相关项目集106内的各项目上至少有某种程度的共同性的阈值数量的关键词用作用于该集合106内的每一项目的标签。由此,在一具体示例中,可定义十个项目的集合,其中已经从这些项目中的四个中提取了关键词“足球”。标记组件108然后可用关键词“足球”来标记这十个项目中的每一项目。利用搜索词“足球”的搜索因此将导致返回这十个项目中的每一项目。尽管该相关项目集106内的项目各自可以由标记组件108用基本相似的标签来标记,但是这些项目还可包括由用户提供的个体标签。
系统100还包括显示多个电子邮件(其中这些电子邮件的至少一个子集是在项目104中)的电子邮件显示组件110。电子邮件显示组件110还可显示与包括所显示的电子邮件的一个或多个项目集相关联的一个或多个标签。除此之外或作为替代,电子邮件显示组件110可显示与类似于所显示的电子邮件的一个或多个项目集相关联的一个或多个标签。例如,一项目可以与对一相关项目集的相似性得分相关联(但是不包括在该项目集中)。如果所显示的电子邮件和项目集之间的相似性得分在一定义阈值内,则与该集合相关联的标签可以由电子邮件显示组件110来显示。标签可以被显示为例如可选择超链接。
电子邮件显示组件110可以与一相关项目显示组件112相关联。更具体地,用户可选择由电子邮件显示组件110显示的标签中的至少一个,并且相关项目显示组件112可向用户显示一般与所显示的电子邮件相关的项目,以及特别地与所选标签相关联的项目。例如,项目集内与由用户选择的标签相关联的项目可被提供给该用户。这些项目可包括文字处理文档、网页、电子表格、数码照片、以及任何其它合适的项目。由此,通过使用系统100,用户可快速且容易地定位与电子邮件相关的项目,而不会被迫手动采取项目和电子邮件之间的关连。
现在参考图2,示出了有助于基于项目与电子邮件的关系来提供项目的系统200。系统200包括分析项目104并至少部分地基于该分析来定义项目集106的分组组件102。分组组件还可定义项目集202和204,其中项目可被包括在多个集合内。此外,可向项目提供相对于项目集的相似性得分-由此,即使一集合不包括一特定项目,该项目也可与该集合相关。标记组件108然后可向项目集106、202和204的每一个提供至少一个标签。
电子邮件显示组件110可显示电子邮件以及与该电子邮件相关联的标签(例如,与包括该电子邮件和/或与该电子邮件有足够相似性的集合相关联的标签)。广告显示组件206然后可至少部分地基于由电子邮件显示组件显示的标签来自动的向用户提供一个或多个广告。例如,至少一个标签可以与汽车相关,且因此广告显示组件206可以向用户提供汽车广告。如上所述,在用户选择了至少一个标签之后,相关项目显示组件112可提供在与该标签相关联的集合内(或与集合基本相似)的项目。在另一示例中,广告显示组件206可在用户选择标签时提供广告,由此使得大多数相关广告能被提供给用户。
系统200还可包括使得多个项目104内的每一项目能基于与其相关联的标签来搜索的搜索组件208。例如,搜索组件208可接收查询,查询可以是单词、词组和/或多个单词/词组。搜索组件208可以分析与项目104相关联的标签,并且向查询生成者提供基于该查询和标签的结果。搜索组件208可能需要查询与一个或多个标签的精确匹配、部分匹配或用于基于相关联标签来搜索项目的任何其它合适的方式。
现在参考图3,示出了有助于对项目进行自动分组并将标签与一组或多组项目相关联的系统300。系统300包括用于选择多个项目104中的一个或多个项目、同时将项目分组到多个相关项目集中的选择组件302。例如,选择组件302可以自动循环通过多个项目104内的每一项目,同时对这些项目进行分组。在另一示例中,选择组件302可以在给定用户命令时选择多个项目104中的一个或多个项目。在这一情况下,这一个或多个项目可通过定点和点击机制、一次或多次击键、话筒和相关联的软件(用于接收和实现语音命令)、压敏屏幕、有助于选择的任何其它适当的机制或其任意组合来选择。选择组件302可以与帮助将项目分组或群集成项目集106的分析组件304相关联。例如,分析组件304可以分析与每一所选项目相关联的特征,并且可至少部分地基于所选项目的内容来提取或创建关键词、短语或其它数据。例如,如果一所选项目是文档,则分析组件304可以从所选项目中提取关键词或短语。根据一个示例,所选项目可以是电子邮件,并且分析组件304可以从该电子邮件中提取关键词或短语。此外,分析组件304可以在提取关键词或短语的同时对电子邮件的特定部分加权。例如,可以向出现在“主题”行中的单词或词组提供比出现在消息正文中的单词或词组更大的权重。
在又一示例中,所选项目可以是数字图像,并且分析组件304可以分析该数字图像以从其中提取特征。例如,分析组件304可以从图像内提取与个人的面部特征相关的数据、对该图像创建比色图表、或任何其它适当的数据分析。此外,作为对采取更复杂的数据分析的替换或补充,分析组件304可以采取对与所选项目相关联的其它参数的分析,诸如所选项目的名称、所选项目的创建日期和时间、所选项目304在电子存储介质内的位置、项目的类型、创建文件的个人的名字、分配给所选项目的标签、电子邮件发送者的身份、电子邮件的“收件人”域中的其它个人的身份、“抄送”域中的个人的身份、全部或部分IP地址、域名、以及可以与项目相关联的任何其它合适的数据。
分析组件304所采取的分析的结果或特征可以例如被传送给分组组件102,后者可以利用该特征来生成相关项目集106(例如,将项目分组到项目集106中)。例如,分组组件102可以定位多个项目104中其名称在与一所选项目相比时具有相似单词的、当与所选项目相比时在相似的时间创建等的所有项目。类似地,在与数字图像相关的示例中,包括一特定个人的每一图像可由分组组件102放置在项目集106中。由此,分组组件102可采取任何适当的操作以便至少部分地基于分析组件304所采取的对所选项目的分析来创建项目集106。
此处提供了各示例以便更好地示出可以创建项目集106的方式。如上所述,选择组件302可循环通过多个项目104内的各项目-换言之,每一项目可由分析组件304分析,并且该分析的结果可被提供给分组组件102以便将项目分组到一个或多个相关项目集中。选择组件302可以以预定义的、随机的和/或伪随机的次序来自动的选择项目。此外,选择组件302可以基于创建时间、项目的位置、名称、或用于选择项目的任何其它适当的方式来选择项目。循环通过多个项目104内的每一项目确保每一项目与至少一个项目组相关联。在另一示例中,每次当用户选择一项目时,该项目可被提供给分析组件304。由此,所选项目将被放置在一个或多个项目组内。
与分组组件102相关联的标记组件108然后可以审阅项目集106,并将一个或多个标签与相关项目集106相关联。例如,标记组件108可利用关键词提取技术来检索可用作对于项目集106内的每一项目的标签的一组关键词。在另一示例中,标记组件108可通过图形用户界面(未示出)向用户提供建议,而非自动标记项目。用户然后可通过例如选择复选框来确认特定标记应当与项目集106内的每一项目相关联,或阻止某些标签与项目集106相关联。因此,可以认识到,项目集106内的每一项目可以在无需采用训练数据(例如,先前分配给多个项目的大型的用户标签集合无需存在)的情况下标记。
现在转向图4,示出了自动标记系统400,其中若干项目可以同时用基本相似的标签来标记而无需使用训练数据(例如,一个或多个相关项目集可以与至少一个标签相关联)。系统400包括可用于创建多个项目104内的每一项目的描述的描述生成器组件402。每一项目的描述可以至少部分地基于项目的内容和/或项目与多个项目104内的其它项目之间的关系。例如,诸如标签等元数据可由描述生成器组件402用于为每一项目104生成描述。
系统400还包括选择要提供给分组组件102的一个或多个项目的选择组件302。分组组件102可至少部分地基于一个或多个所选项目的等同性以及由描述生成器组件402创建的项目描述来定义相关项目集106。例如,分组组件102可以包括群集组件404,该组件可以利用所选项目的等同性以及项目描述来将多个项目104内的项目群集成相关项目集,包括项目集106。可以理解,群集组件404可以创建“硬”群集。由此,一个项目集内的项目不会位于另一项目集中。在一不同示例中,群集组件404可以执行“软”群集,其中单个项目可存在于多个集合中。因此,可以确定,构想了用于群集项目以定义一个或多个相关项目组的任何适当的方式,并且这些方式旨在落入所附权利要求书的范围之内。群集组件404可采用一个或多个群集算法来实现项目分组,其中这些算法可以利用与项目描述的特定部分相关联的权重来群集项目。例如,可向电子邮件消息的主题行中的关键词或短语提供比电子邮件消息正文中的关键词或短语更大的权重。
在对群集组件404的另一种使用中,可以为多个项目104内的每一项目定义一邻域或团集。与一个特定项目相关联的每一项目邻域可包括作为该特定项目的k个最近的邻居的项目。一旦选择组件302向分组组件102提供了一个或多个所选项目(在循环期间自动选择、由用户选择、或通过任何其它合适的方式选择),相关项目集106就可包括包含所选项目的每一团集。如果存在其中所有团集都基本相似的项目集合,则群集组件404可以将这一集合处理或创建为一集群。由此,可将k个最近的邻居方法和一个或多个群集算法的组合用于所要求保护的主题。
标记组件108可分析相关项目集106,并向该项目集106中的每一项目提供基本相似的标签。如上所述,可将文本提取技术用于确定要提供给项目集106内的各项目的标签。由此,基于项目集106中所包括的项目的等同性,可向该集合106中的每一项目提供基本相似的标签。此外,集合内各项目之间的标签可能并不是完全相同的,因为至少某些项目可包括由用户提供的和/或与一完全不同的项目组相关联的标签。
现在参考图5,示出了允许用基本相似的标签来标记多个相关的项目的系统500。系统500包括从多个项目104中选择一个或多个项目的选择组件302。例如,选择可基于用户对项目的选择。在另一示例中,选择组件302可循环通过多个项目104内的每一项目,其中系统500的其它组件(和/或此处所描述的系统100、200、300、400以及其它系统/装置)可以独立于每一所选的项目来操作。循环通过多个项目可以允许在不需要用户动作的情况下自动标记大量项目。接口组件502可以与选择组件302相关联,其中接口组件502确定与一个或多个所选项目相关的一个或多个上下文。这些上下文可以被提供给分组组件102,后者可以为由接口组件502确定的每一上下文定义一相关项目集。更具体而言,一特定项目可以取决于上下文与完全不同的项目分组在一起。在另一示例中,接口组件502可以允许用户选择与一所选项目相关联的特定上下文。由此,接口组件502可以确定与所选项目相关联的可用上下文,并以列表形式提供这一上下文(例如,根据该上下文为用户所需的可能性来区分优先级,其中与需要的最高概率相关联的上下文被最突出地显示)。
接口组件502可以确定这些上下文,并将其提供给分组组件102,以使分组组件102能够基于所选项目以及一个或多个所确定/所选的上下文来定义相关项目集106。在一个具体示例中,所选项目可包括完全不同的部分。因此,第一上下文可以与第一部分相关,而第二上下文可以与第二部分相关,并且取决于部分(由用户和/或根据概率来选择),分组组件102可定义完全不同的组。在又一示例中,所选项目可以是包括朋友和家人的图像的数字图像。第一上下文可以是“朋友”,而第二上下文可以是“家人”。这些上下文可以由接口组件502来确定,并且分组组件102可以至少部分地基于所选上下文来定义项目集106。相关项目集的创建在上文中更详细描述。
一旦分组组件102生成了相关项目集106,提取组件504就可从项目集106内的项目中提取特征。例如,提取组件504可以从文档、电子邮件或包括文本的其它文件中提取文本。在另一示例中,提取组件504可以从项目中提取元数据,诸如项目的创建时间、项目的创建者、发送者、和/或接收者、项目被最后一次编辑的时间、最后一个创建项目的个人的身份、与该项目相关联的一个或多个软件应用程序的身份、以及可以与项目相关联的其它文本。此外,提取组件504可以从项目集106内的项目中提取非文本数据。例如,数字图像可包括这类图像中的大量的特定颜色,诸如红色。提取组件504因此例如可以将这一颜色与词语“红”相关联,并将这一数据输出到标记组件108。这些关联可以被包括在一表格(未示出)内,或者可以通过推断来形成。
如此处所使用的,术语“推断”一般指从一组通过事件和/或数据捕捉的观察中推出或推断系统、环境和/或用户的状态的过程。例如,推断可用于标识特定的上下文或动作,或可生成状态的概率分布。推断可以是概率性的-即,基于数据和事件的考虑计算感兴趣的状态的概率分布。推断也可以指用于从一组事件和/或数据组成更高级事件的技术。这类推断导致从一组观察的事件和/或储存的事件数据构造新的事件或动作,无论事件是否在相邻的时间上相关,也无论事件和数据是来自一个还是若干个事件和数据源。各种分类方案和/或系统(例如,支持矢量机、神经网络、专家系统、贝叶斯信任网络、模糊逻辑、数据融合引擎……)可用于执行关于本发明的自动化和/或推断的动作。由此,在一个示例中,至少部分地基于用户上下文(例如,用户的地理位置、计算机上运行的应用程序……),可以形成所提取的数据和关联的文本之间的关联。
标记组件108可从提取组件504接收所提取的和/或所创建的文本,并将这一文本用于选择要提供给项目集106内的每一项目的标签(例如,哪些标签要与项目集106相关联)。例如,在项目集106内的至少某些项目上共同的所提取的和/或所创建的文本可以由标记组件108选择,并且之后作为标签与项目集106内的每一项目相关联。依照一个具体示例,由提取组件504提取/创建的出现了阈值次数的文本可以与项目集106内的每一项目相关联。类似地,由提取组件404提取/创建的、相对于项目集106内的阈值百分比的项目出现的文本可被用作标签,并且由标记组件108与项目集106内的每一项目相关联。
现在参考图6,示出了有助于选择性地标记多个项目的系统600。系统600包括向与项目104相关联的特征提供预定义权重的加权组件602。例如,当对项目分组时,可以为一项目的名称提供比该项目创建的日期时间更大的权重。类似地,可以为电子邮件的主题行内的文本提供比电子邮件正文(或文字处理文档正文)内的文本更大的权重。此外,加权组件602可以相对于不同类型项目之间的关系提供完全不同的权重。例如,通过对关系加权,加权组件602可以指示电子邮件和文字处理文档相比电子邮件和数字图像更有可能相关。可以理解,这些示例可以被外推到其它项目类型以及与项目相关联的其它部分和/或数据。
由加权组件602提供的权重可以由分组组件102用于定义相关项目集106。根据一个示例,在选择了一个或多个项目(未示出)时,加权组件602可以向这些项目的各部分以及项目类型之间的关系分配权重。分组组件102在定义项目集106的边界时可以分析这些权重。标记组件108之后可以向项目集106内的每一项目分配基本相似的标签(例如,可以向集合106内的项目提供并分配“组标签”)。为确保项目不会与过多标签相关联,标记组件108可包括阈值组件604,该组件可用于限制分配给一特定项目和/或项目组的标签的数量。例如,阈值组件604可以制定一“硬”限制,使得一项目不会与大于阈值数量的标签相关联。这可以用各种方式来实现,包括第一及时(first in time)方法,其中可使用分配给项目和/或组的第一阈值数量的标签,而之后提供的标签不与该项目或组相关联。在另一示例中,可采用概率性方法,其中标签可被分配与项目或项目组的相关度的概率,并且可将与最高概率相关联的阈值数量的标签分配给项目或项目组。之后,如果以后创建的标签被认为与该项目或组更相关,则与该项目或组相关联的标签可被移除。然而,用户分配的标签可能不会计数达到阈值标签数,因为用户认为这些标签是与项目或项目组高度相关的。
在又一示例中,可采用阈值组件604来禁止用不与对项目或项目组的相关度的阈值概率相关联的标签标记项目或项目集。例如,阈值组件604可以对标记组件108施加阈值概率或相关度,从而要求在将标签与项目集106相关联之前将标签与至少这些阈值概率相关联。还构想了类似于此处所描述的这些方式的其它方式,为简明起见未描述这些其它方式,但是其旨在落入所附权利要求书的范围之内。标记组件108可以标记项目组106内的项目,只要这一标记符合阈值组件604所施加的限制。
现在参考图7-11,将通过一系列动作来描述根据所要求保护的主题的方法。可以理解和明白,所要求保护的主题不受动作次序的限制,因为某些动作可以按与此处所所示并描述的不同的次序和/或与其它动作并发地发生。例如,本领域的技术人员将理解和明白,方法可替换地被表示为诸如状态图中的一系列相互关连的状态或事件。此外,并非所有示出的动作都是实现根据所要求保护的主题的方法所必需的。另外,还应当理解,以下且在整个说明书中公开的方法能够被储存在制品上,以便于将这些方法传送并转移到计算机。如此处所使用的术语制品旨在包含可从任何计算机可读设备、载体或介质访问的计算机程序。
具体地参考图7,示出了用于通过电子邮件应用程序来浏览项目的方法。方法700在702处开始,并且在704处,将项目分组成多个相关项目集。例如,可将群集用于将项目分组成多个相关项目集。此外,如上所述,项目可被分配给一个或多个项目集。然而,可以理解,构想了将项目分组到相关项目集的任意合适的方式,并且这些方式旨在落入所附权利要求书的范围之内。在706处,将一个或多个标签与多个项目集中的每一个相关联。这些标签可以通过分析为每一项目生成的项目描述来确定。除此之外或作为替代,可将文字图用于确定要与一特定相关项目集相关联的标签。
在708处,通过电子邮件应用程序来显示电子邮件消息(包括在内和/或与对至少一个集合的阈值相似度相关联)。例如,电子邮件可在打开一电子邮件应用程序时和/或在用户选择该电子邮件时被自动显示。在710处,定位包括该电子邮件和/或具有与该电子邮件的阈值相似等级的一个或多个相关项目集。该定位可以通过比较标签来进行。换言之,可以将与电子邮件相关联的标签与同集合相关联的标签进行比较,由此使得能定位相关项目集。在712处,显示与所定位的集合相关联的标签。例如,可利用用于显示电子邮件的图形用户界面内的域来显示可选择标签(与所定位的集合相关联)。根据一个示例,标签可以与超链接相关联。在714处,接收对于所显示的标签中的至少一个的用户选择。该选择可以通过使用定点和点击机制、压敏屏幕、语音命令等来作出。在716处,在接收到用户选择之后将与所选标签相关联的一个或多个所定位的(相关)项目集提供给用户。例如,这些项目可以用超链接形式来提供,使得在选择一超链接之后,可以向用户提供与该超链接相关联的项目。这可包括启动应用程序、在显示电子邮件的图形用户界面中显示项目等等。方法700在718处完成。尽管未示出,但是还可认识到可以在定位了集合之后至少部分地基于与该集合相关联的标签来自动提供广告。在另一示例中,广告可在选择一特定标签时被自动显示,由此便于显示与用户高度相关的广告。
具体参考图8,示出了用于在不需要训练数据的情况下向相关项目集自动分配基本相似的标签的方法800。方法800在802处开始,并且在804处接收第一项目。例如,该项目可以是文字处理项目、电子表格项目、幻灯片项目、数字图像、诸如音频和音/视频项目等多媒体项目、或任何其它合适的计算机可执行或可读项目。第一项目可以通过用户对项目的选择和/或通过计算组件在步进通过多个项目时的自动选择来接收。在806处,分析第一项目。例如,对第一项目的分析可以包括分析项目的标题、项目的创建日期、与项目相关联的应用程序、项目在电子存储内的位置、已经分配给项目的标签、项目的内容、与项目相关联的元数据、以及与项目有关的各种其它参数。然而,可以理解,该分析无需在时间上晚于项目的选择而发生。相反,可分析每一项目,并且可在选择一项目之前生成其描述。由此,可以确定方法800中的各动作的次序并不是严格的,并且是可以更改的。
在808处,至少部分地基于在806处所进行的分析来定义一项目集,其中该项目集内的项目以某种方式相关。例如,可采用一群集算法来将项目群集成相关项目集。此外,可定义团集或邻域,其中团集或邻域包括一特定项目以及在其k个最近的邻居之中的项目。因此,可以认识到,可以将任何适当的分组机制、算法和/或方法用于定义项目集合。在810处,向项目集中的每一个分配基本相似的标签(例如,一相关项目集中的每一项目将与相似标签相关联,而一不同的相关项目集中的项目也将与相似标签(但是不同于关联于第一集合的标签)相关联)。这些标签可以通过从项目集内的项目中提取文本、分析元数据或用于确定标签的任何其它合适的方式来确定。在将标签分配给项目之后,包括这些标签的搜索将导致返回该项目集内的项目。方法810然后在812处完成。
现在转向图9,示出了用于向相关项目集内的项目分配基本相似的标签的方法900。方法900在902处开始,并在904处为多个项目中的每一项目创建一项目描述。例如,该项目描述可以通过文字图或其它类似的实体来创建。在906处,接收项目,其中该项目的接收可以基于对一系列项目中的项目的自动选择来发生。换言之,可自动选择集合内的项目的子集(每次一个)。在908处,定义一项目集,其中该组包括所接收的项目以及以某种方式与所接收的项目相关的项目。如上所述,群集是用于定义集合的一个示例性方式,但是也构想了其它用于定义项目集合的方法。在910处,向所定义的项目集中的每一项目分配基本相似的标签;因此,对项目的搜索变得更方便,并且不要求用户手动将标签附加到若干项目。
在912处,确定是否有剩余的项目(例如,是否已经选择了集合中的每一项目)。如果有剩余的项目,则方法900返回到动作906,在那里接收另一项目。这确保多个项目内的每一项目都将与至少一个项目集相关联,且因此将自动与标签相关联。如果没有剩余的项目,则方法在914处结束。
现在转向图10,示出了用于在无需训练数据的情况下自动向项目集应用基本相似的标签的方法1000。该方法在1002处开始,并且在1004处或者通过用户选择或者通过自动选择来接收项目。在1006处,创建项目描述,其中该描述可以基于与该项目相关联的元数据、该项目的内容、和/或与该项目相关的任何其它合适的数据。在1008处,基于项目描述定义一项目集。例如,该集合可以是和/或包括“团集”或“邻域”,这可以包括所接收到的项目以及该项目的k个最近的邻居。在另一示例中,可将其它项目描述与关联于所接收到的项目的项目描述进行比较,并可通过使用群集来定义集合。
在1010处,为该集合选择标签。依照一个示例,标签可以通过分析与所定义的项目集内的项目相关联的文本和/或数据、且之后选择在该组中的项目上具有阈值共同性等级的文本和/或来选择。在1012处,将所选标签应用于该项目集中的每一项目,同时保持个体标签不变。例如,用户可能向某一项目提供了一特定标签,并且用自动创建的标签来覆盖这一标签可能是不合需要的。方法1012然后在1014处完成。
现在参考图11,示出了用于在不需要使用训练数据的情况下自动标记多个项目的方法1100。方法1100在1102处开始,并在1104处接收项目。在1106处,审阅与接收到的项目相关联的标签。例如,这些标签可以是用户分配的标签和/或先前被自动分配给项目的标签。在1108处,至少部分地基于标签来定位相关的关键词。例如,可提供一表格,其中单词彼此相关联。由此,给定一特定单词,可查明其它相关单词(诸如同义词)。在1110处,至少部分地基于标签以及从这些标签中查明的关键词来定义项目集。例如,包括阈值数量的标签和/或关键词的每一项目可被包括在该集合内。类似地,将来自所接收的项目的关键词或标签中的至少某一些作为标签的项目可被包括在该集合内。在1112处,可向项目集内的每一项目提供基本相似的标签。例如,标签可以是与在1104处接收到的项目相关联的标签、与其相关联的关键词、与包括这些标签或关键词中的一个或多个的项目相关联的标签等等。方法1100然后在1114处完成。
现在参考图12,示出了相关项目集的表示1200。表示1200描绘了第一项目集1202、第二项目集1204、以及第三项目集1206,其中每一项目集包括彼此相关的项目。表示1200旨在示出项目可以与完全不同的项目集相关联。由此,例如,当群集多个项目时,项目可以位于多个集群或集合中。更详细而言,一个或多个项目可以与项目集1202-1206中的每一个相关联、与两个集合的任意组合相关联、或可驻留在单个集合中。因此,可以认识到,单个项目可以与多个相关项目集相关联。然而,如有需要,项目可以被限制到单个集合。
现在转向图13,示出了一个示例性相关项目集1300。项目集1300包括N个项目,其中N大于0。在此具体示例中,项目集1300包括第一项目1302、第二项目1304、第三项目1306以及第N个项目1308。这些项目1302-1308已被确定为以某种形式(例如,通过群集)彼此相关联。项目1302-1308中的每一个包括组标签1310,使得通过使用组标签1310内的标签来搜索项目将导致返回项目1302-1308中的每一个。项目还可包括个体标签,使得对个体标签的搜索将不会导致返回项目组1300内的每一项目。例如,第一项目1302可包括与关联于第二项目1304的个体标签1314不相似的个体标签1312。此外,第三项目1306可包括个体标签1316,而第N个项目可包括个体标签1318。由此,项目组1300内的每一项目可包括组标签以及个体标签。
现在转向图14,示出了可用于通过利用标签来搜索项目的示例性用户界面1400。用户界面1400可包括搜索域1402,其中用户可提供与该用户期望定位的一个或多个项目相关的文本。在输入这一文本之后,可按下搜索按钮1404,并且可在搜索结果域1406中显示搜索的结果。如果用户希望取消搜索,则可按下(例如,通过使用鼠标)取消按钮1408。在一具体示例中,用户可能希望搜索与钓鱼有关的项目,并且因此可在搜索域1402中包括搜索词“钓鱼”。在按下搜索按钮1404之后,结果域1406可向用户显示包括名为“钓鱼”的标签的每一项目。用户然后可选择并检索感兴趣的项目。
现在参考图15,示出了可用于此处所描述的一个或多个特征的示例性用户界面1500。用户界面1500包括第一域1502,它可包括按照接收日期、发件人、收件人、主题或任何其它合适的组织方式来组织的电子邮件列表。在选择该电子邮件列表中的至少一个邮件之后,第二域1504可显示该电子邮件的内容,包括文本和/或与其相关联的任何附件。在显示电子邮件时,域1506可显示与所显示的电子邮件相关联的标签。例如,如上所述,可分析该电子邮件以定位与该电子邮件足够相关的项目集,并且与该集合相关的标签可被显示在域1506中。在一个示例中,标签可以是超链接,其中对这一超链接的选择使得与这些标签相关的项目被显示在域1508中。项目可以是列表形式的,并且对至少一个项目的选择可以使得项目被显示在域1504和/或一单独的图形用户界面中。此外,可以提供域1510来显示与所列出的标签相关联和/或与所选标签或项目相关联的广告。
为了提供用于本发明的各方面的附加上下文,图16及以下讨论旨在提供其中可实现本发明的各方面的合适的操作环境1610的简要、概括描述。尽管本发明是在诸如程序模块等由一个或多个计算机或其它设备执行的计算机可执行指令的一般上下文中描述的,但是本领域的技术人员将认识到,本发明也可以结合其它程序模块和/或作为硬件和软件的组合来实现。
然而,一般而言,程序模块包括执行特定人物或实现特定数据类型的例程、程序、对象、组件、数据结构等。例如,这些例程可以涉及标识项目以及在标识该项目之后定义项目组,以及向项目组内的每一项目提供基本相似的标签。此外,可以理解,操作环境1610仅是合适的操作环境的一个示例,且并不旨在对所要求保护的主题的使用范围或功能提出任何局限。适用于此处所描述的特征的其它众所周知的计算机系统、环境和/或配置包括但不限于,个人计算机、手持式或膝上型设备、多处理器系统、基于微处理器的系统、可编程消费电子产品、网络PC、小型机、大型计算机、包括任一上述系统或设备的分布式计算环境等等。
参考图16,用于实现此处所描述的各方面的示例性环境1610包括计算机1612。计算机1612包括处理单元1614、系统存储器1616和系统总线1618。系统总线1618将包括但不限于系统存储器1616的系统组件耦合至处理单元1614。处理单元1614可以是各种可用处理器的任一种。双微处理器和其它多处理器体系结构也可用作处理单元1614。
系统总线1618可以是若干种总线结构类型的任一种,包括存储器总线或存储器控制器、外围总线或外部总线、和/或使用各类总线体系结构的局部总线,这些体系结构包括但不限于,8位总线、工业标准体系结构(ISA)、微通道体系结构(MCA)、扩展ISA(EISA)、智能驱动电子设备(IDE)、VESA局部总线、外围部件互连(PCI),通用串行总线(USB)、高级图形端口(AGP)、个人计算机存储卡国际协会总线(PCMCIA)以及小型计算机系统接口(SCSI)。系统存储器1616包括易失性存储器1620和非易失性存储器1622。基本输入/输出系统(BIOS)包括如在启动时帮助在计算机1612内的元件之间传输信息的基本例程,通常储存在非易失性存储器1622中。作为说明而非局限,非易失性存储器1622可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除ROM(EEPROM)或闪存。易失性存储器1617包括担当外部高速缓存的随机存取存储器(RAM)。作为说明而非局限,RAM以许多形式可用,如同步RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)和直接存储器总线(Rambus)RAM(DRRAM)。
计算机1612也包括可移动/不可移动、易失性/非易失性计算机存储介质。例如,图16示出了可用于储存和检索与各种应用程序相关联的项目的盘存储1624。盘存储1624包括但不限于,诸如磁盘驱动器、软盘驱动器、磁带驱动器、Jaz驱动器、Zip驱动器、LS-100驱动器、闪存卡或记忆棒等设备。另外,盘存储1624可单独包括存储介质或与其它存储介质组合,其它存储介质包括但不限于,诸如紧致盘ROM设备(CD-ROM)、CD可记录驱动器(CD-R驱动器)、CD可重写驱动器(CD-RW驱动器)或数字多功能盘ROM驱动器(DVD-ROM)等光盘驱动器。为便于盘存储设备1624连接到系统总线1618,通常使用可移动或不可移动接口,如接口1626。
可以理解,图16描述了担当用户和合适的操作环境1610中描述的基本计算机资源之间的中介的软件。这类软件包括操作系统1628。操作系统1628可储存在盘存储1624中,它用于控制并分配计算机系统1612的资源。系统应用程序1630利用操作系统1628通过储存在系统存储器1616或盘存储1624上的程序模块1632和程序数据1634对资源的管理。可以理解,本发明可用各种操作系统或操作系统的组合来实现。
用户通过输入设备1636向计算机1612输入命令和信息。输入设备1636包括但不限于,诸如鼠标、跟踪球、指示笔、触摸垫等定点设备、键盘、话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪、TV调谐卡、数码相机、数码摄像机、web摄像头等等。这些和其它输入设备通过系统总线1618经由接口端口1638连接到处理单元1614。接口端口1638包括,例如,串行端口、并行端口、游戏端口、通用串行总线(USB)。输出设备1640使用与输入设备1636相同类型端口中的某一些。由此,例如,USB端口可用于向计算机1612提供输入,并从计算机1612输出信息到输出设备1640。提供了输出适配器1642以说明存在一些输出设备1640,如监视器、扬声器和打印机,以及需要特殊适配器的其它输出设备1640。输出适配器1642包括,作为说明而非局限,提供输出设备1640和系统总线1618之间的连接装置的显卡和声卡。应当注意,其它设备和/或设备的系统提供了输入和输出能力,如远程计算机1644。
计算机1612可以使用到一个或多个远程计算机,如远程计算机1644的逻辑连接在网络化环境中操作。远程计算机1644可以是个人计算机、服务器、路由器、网络PC、工作站、基于微处理器的电器、对等设备或其它常见的网络节点等等,并通常包括相对于计算机1612所描述的许多或所有元件。为简明起见,仅对远程计算机1644示出了存储器存储设备1646。远程计算机1644通过网络接口1648逻辑上连接至计算机1612,然后通过通信连接1650物理地连接。网络接口1648包含诸如局域网(LAN)和广域网(WAN)等通信网络。LAN技术包括光纤分布式数据接口(FDDI)、铜缆分布式数据接口(CDDI)、以太网/IEEE 802.3、令牌环/IEEE 802.5等等。WAN技术包括但不限于,点对点链路、诸如综合业务数字网(ISDN)及其变体等电路交换网络、分组交换网络以及数字用户线(DSL)。
通信连接1650指用于将网络接口1648连接到总线1618的硬件/软件。尽管为说明的清晰性,示出通信连接1650在计算机1612内,然而它也可以对计算机1612是外部的。仅出于示例性目的,连接到网络接口1648所必需的硬件/软件包括内部和外部技术,如包括常规电话级调制解调器、线缆调制解调器和DSL调制解调器的调制解调器、ISDN适配器和以太网卡。
图17示出了本发明可与其交互的示例计算环境1700的示意框图。系统1700包括一个或多个客户机1710。客户机1710可以是硬件和/或软件(如,线程、进程、计算设备)。系统1700还包括一个或多个服务器1730。服务器1730也可以是硬件和/或软件(如,线程、进程、计算设备)。例如,服务器1730可容纳线程,以通过使用此处所描述的各个特征执行变换。客户机1710和服务器1730之间的一个可能的通信可以是适用于在两个或多个计算机进程之间传输的数据分组的形式。系统1700包括可用于便于在客户机1710和服务器1730之间通信的通信框架1750。客户机1710操作上连接至可用于储存对客户机1710本地的信息的一个或多个客户机数据存储1760。类似地,服务器1730操作上连接至可用于储存对服务器1730本地的信息的一个或多个服务器数据存储1740。在一个示例中,客户机1710可以包括项目集,而服务器1730可以包括被设计成向这些项目的子集提供组标签的组件。
上文所描述的包括所要求保护的主题的示例。当然,不可能为了描述本发明而描述组件或方法的每一可想象的组合,但是本领域的普通技术人员可以认识到,本发明的许多另外的组合和置换是可能的。因此,本发明旨在包含落入所附权利要求书的精神和范围中的所有这样的改变、修改和变化。此外,就在说明书和权利要求书中使用术语“包括”而言,这类术语旨在以与术语“包含”用作权利要求书中的过渡词语所解释的类似的方式为包含性的。

Claims (20)

1.一种用于浏览与电子邮件相关的项目的系统,包括以下计算机可执行组件:
将项目分组成多个相关项目集的分组组件(102);
将一个或多个标签与所述相关项目集的每一个相关联的标记组件(108);
显示电子邮件以及与所显示的电子邮件相关联的一个或多个标签的电子邮件显示组件;以及
接收用户对所述一个或多个标签中的至少一个的选择,并至少部分地基于所述用户选择显示与所显示的电子邮件相关的一个或多个项目的相关项目显示组件(112)。
2.如权利要求1所述的系统,其特征在于,至少一个项目位于多个相关项目集中。
3.如权利要求1所述的系统,其特征在于,还包括至少部分地基于所述一个或多个所显示的标签来显示广告的广告显示组件。
4.如权利要求3所述的系统,其特征在于,所述分组组件包括分析一所选项目的特征的分析组件,所述特征被提供给所述分组组件并用于定义所述相关项目集。
5.如权利要求4所述的系统,其特征在于,所选项目的特征包括与所选项目相关联的标签。
6.如权利要求4所述的系统,其特征在于,所述分组组件包括群集项目以定义所述相关项目集的群集组件。
7.如权利要求4所述的系统,其特征在于,还包括创建至少所选项目的描述的描述生成器组件,所述描述至少部分地基于所选项目的一个或多个内容以及与其它项目的关系。
8.如权利要求4所述的系统,其特征在于,还包括从一相关项目集内的项目中提取关键短语的提取组件,所提取的关键短语由所述标记组件用于将所述一个或多个标签与所述相关项目集相关联。
9.如权利要求4所述的系统,其特征在于,还包括接收与所选项目的上下文相关的输入的接口组件,所述上下文由所述分组组件用于将项目分组成所述多个相关项目集。
10.如权利要求9所述的系统,其特征在于,所述分组组件在给定不同上下文与所选项目相关联时定义完全不同的项目集。
11.如权利要求1所述的系统,其特征在于,所述分组组件采用k个最近的邻居算法来将所述项目分组成多个相关项目集。
12.如权利要求1所述的系统,其特征在于,所述标记组件向一相关项目集中完全不同类型的项目提供基本相似的标签。
13.如权利要求1所述的系统,其特征在于,所述分组组件分析与所述项目相关联的元数据以便将所述项目分组成多个相关项目集。
14.如权利要求1所述的系统,其特征在于,还包括对所述项目之间的关系加权的加权组件,所述分组组件至少部分地基于所述加权的关系来将所述项目分组成多个相关项目集。
15.一种用于浏览与电子邮件相关的项目的方法,包括以下计算机可执行动作:
将项目分组成多个相关项目集(704);
将一个或多个标签与所述相关项目集的每一个相关联(706);
显示电子邮件(708);
定位满足以下条件的至少一个的一个或多个相关项目集(710):包括所述电子邮件,以及具有与所述电子邮件的阈值相似度级别;
显示与所定位的集合相关联的标签(712);
接收用户对所显示的标签中的一个或多个的选择(714);以及
显示与所述一个或多个所选标签相关联的一个或多个相关项目集(716)。
16.如权利要求15所述的方法,其特征在于,还包括至少部分地基于所述一个或多个所定位的集合来显示广告。
17.如权利要求15所述的方法,其特征在于,所述至少一个项目驻留在多个项目集中。
18.如权利要求15所述的方法,其特征在于,不同的相关项目集与非等同标签相关联。
19.如权利要求15所述的方法,其特征在于,还包括通过群集来分组所述项目。
20.一种浏览系统,包括:
用于创建相关项目集的计算机实现的装置(102)
用于将一个或多个标签分配给所述相关项目集的计算机实现的装置(108);
用于显示电子邮件的计算机实现的装置(110),所述电子邮件满足以下条件之一:被包括在所述相关项目集内,以及与所述相关项目集相关联;
用于至少部分地基于所显示的电子邮件来显示所述一个或多个所分配的标签的计算机实现的装置(112);以及
用于在接收到对所述一个或多个所分配的标签中的至少一个的选择时向用户提供所述相关项目集中的项目的计算机实现的装置(112)。
CNA200680046841XA 2005-12-16 2006-11-17 浏览与电子邮件有关的项目 Pending CN101331474A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/305,399 2005-12-16
US11/305,399 US20070143298A1 (en) 2005-12-16 2005-12-16 Browsing items related to email

Publications (1)

Publication Number Publication Date
CN101331474A true CN101331474A (zh) 2008-12-24

Family

ID=38174964

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200680046841XA Pending CN101331474A (zh) 2005-12-16 2006-11-17 浏览与电子邮件有关的项目

Country Status (5)

Country Link
US (1) US20070143298A1 (zh)
EP (1) EP1969481A1 (zh)
KR (1) KR20080076958A (zh)
CN (1) CN101331474A (zh)
WO (1) WO2007075237A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101937466A (zh) * 2010-09-15 2011-01-05 深圳市任子行网络技术股份有限公司 网页邮箱识别分类方法及系统
CN102893278A (zh) * 2010-02-03 2013-01-23 阿科德有限公司 电子消息系统和方法
CN103903124A (zh) * 2012-12-27 2014-07-02 中国移动通信集团公司 一种电子邮件处理方法及装置
CN106682189A (zh) * 2016-12-29 2017-05-17 广州华多网络科技有限公司 文件名显示方法及装置
CN107093056A (zh) * 2010-05-17 2017-08-25 微软技术许可有限责任公司 电子邮件标签
CN111125566A (zh) * 2019-12-11 2020-05-08 贝壳技术有限公司 信息获取方法和装置、电子设备和存储介质
CN113544660A (zh) * 2015-08-18 2021-10-22 脸谱公司 用于对相关的内容标记进行识别和分组的系统和方法

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080320029A1 (en) * 2007-02-16 2008-12-25 Stivoric John M Lifeotype interfaces
KR20080078255A (ko) * 2007-02-22 2008-08-27 삼성전자주식회사 파일 관리 방법 및 장치와 그 파일을 저장한 정보저장매체
US8239460B2 (en) * 2007-06-29 2012-08-07 Microsoft Corporation Content-based tagging of RSS feeds and E-mail
US8046237B1 (en) * 2007-08-23 2011-10-25 Amazon Technologies, Inc. Method, medium, and system for tag forum interaction in response to a tag score reaching a threshold value
US9330071B1 (en) * 2007-09-06 2016-05-03 Amazon Technologies, Inc. Tag merging
US7761420B2 (en) * 2007-10-16 2010-07-20 International Business Machines Corporation Method and system for replicating objects
US8909632B2 (en) * 2007-10-17 2014-12-09 International Business Machines Corporation System and method for maintaining persistent links to information on the Internet
US8516058B2 (en) * 2007-11-02 2013-08-20 International Business Machines Corporation System and method for dynamic tagging in email
US9195753B1 (en) 2007-12-28 2015-11-24 Amazon Technologies Inc. Displaying interest information
US20090172783A1 (en) * 2008-01-02 2009-07-02 George Eberstadt Acquiring And Using Social Network Information
US20110131106A1 (en) * 2009-12-02 2011-06-02 George Eberstadt Using social network and transaction information
US20090171686A1 (en) * 2008-01-02 2009-07-02 George Eberstadt Using social network information and transaction information
US8682819B2 (en) * 2008-06-19 2014-03-25 Microsoft Corporation Machine-based learning for automatically categorizing data on per-user basis
US20100010982A1 (en) * 2008-07-09 2010-01-14 Broder Andrei Z Web content characterization based on semantic folksonomies associated with user generated content
US20100036856A1 (en) * 2008-08-05 2010-02-11 International Business Machines Corporation Method and system of tagging email and providing tag clouds
TWI496009B (zh) * 2008-12-31 2015-08-11 Ibm 有效顯示電子郵件之方法及裝置
US8589497B2 (en) * 2009-12-08 2013-11-19 International Business Machines Corporation Applying tags from communication files to users
US8266228B2 (en) * 2009-12-08 2012-09-11 International Business Machines Corporation Tagging communication files based on historical association of tags
US20130054354A1 (en) * 2011-08-29 2013-02-28 Microsoft Corporation Generating advertisements from electronic communications
US20130086485A1 (en) * 2011-09-30 2013-04-04 Michael James Ahiakpor Bulk Categorization
US20130085845A1 (en) * 2011-10-04 2013-04-04 Yahoo! Inc. Facilitating deal comparison and advertising in association with emails
US9467409B2 (en) 2013-06-04 2016-10-11 Yahoo! Inc. System and method for contextual mail recommendations
CN104281626B (zh) * 2013-07-12 2018-01-19 阿里巴巴集团控股有限公司 基于图片化处理的网页展示方法及网页展示装置
JP6295539B2 (ja) * 2013-08-08 2018-03-20 富士通株式会社 プログラム、及びツール選択方法
IN2014MU00919A (zh) 2014-03-20 2015-09-25 Tata Consultancy Services Ltd
US9942186B2 (en) 2015-08-27 2018-04-10 International Business Machines Corporation Email chain navigation
KR20180024345A (ko) 2016-08-29 2018-03-08 삼성전자주식회사 전자 장치에서 컨텐츠 관리를 위한 방법 및 장치
US10897447B2 (en) * 2017-11-07 2021-01-19 Verizon Media Inc. Computerized system and method for automatically performing an implicit message search
US11288299B2 (en) 2018-04-24 2022-03-29 International Business Machines Corporation Enhanced action fulfillment using classification valency
EP3788509A1 (en) * 2018-06-28 2021-03-10 Google LLC Annotation and retrieval of contextual deep bookmarks
US11372905B2 (en) * 2019-02-04 2022-06-28 International Business Machines Corporation Encoding-assisted annotation of narrative text

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3168756B2 (ja) * 1993-02-24 2001-05-21 ミノルタ株式会社 電子メールシステムのメール管理方法
US6137911A (en) * 1997-06-16 2000-10-24 The Dialog Corporation Plc Test classification system and method
US6216122B1 (en) * 1997-11-19 2001-04-10 Netscape Communications Corporation Electronic mail indexing folder having a search scope and interval
US6629079B1 (en) * 1998-06-25 2003-09-30 Amazon.Com, Inc. Method and system for electronic commerce using multiple roles
US6345274B1 (en) * 1998-06-29 2002-02-05 Eastman Kodak Company Method and computer program product for subjective image content similarity-based retrieval
US6266682B1 (en) * 1998-08-31 2001-07-24 Xerox Corporation Tagging related files in a document management system
US6282565B1 (en) * 1998-11-17 2001-08-28 Kana Communications, Inc. Method and apparatus for performing enterprise email management
US6592627B1 (en) * 1999-06-10 2003-07-15 International Business Machines Corporation System and method for organizing repositories of semi-structured documents such as email
US6961897B1 (en) * 1999-06-14 2005-11-01 Lockheed Martin Corporation System and method for interactive electronic media extraction for web page generation
US6859909B1 (en) * 2000-03-07 2005-02-22 Microsoft Corporation System and method for annotating web-based documents
US7599852B2 (en) * 2002-04-05 2009-10-06 Sponster Llc Method and apparatus for adding advertising tag lines to electronic messages
US7340674B2 (en) * 2002-12-16 2008-03-04 Xerox Corporation Method and apparatus for normalizing quoting styles in electronic mail messages

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102893278A (zh) * 2010-02-03 2013-01-23 阿科德有限公司 电子消息系统和方法
CN107093056A (zh) * 2010-05-17 2017-08-25 微软技术许可有限责任公司 电子邮件标签
CN101937466A (zh) * 2010-09-15 2011-01-05 深圳市任子行网络技术股份有限公司 网页邮箱识别分类方法及系统
CN103903124A (zh) * 2012-12-27 2014-07-02 中国移动通信集团公司 一种电子邮件处理方法及装置
CN103903124B (zh) * 2012-12-27 2017-11-21 中国移动通信集团公司 一种电子邮件处理方法及装置
CN113544660A (zh) * 2015-08-18 2021-10-22 脸谱公司 用于对相关的内容标记进行识别和分组的系统和方法
CN106682189A (zh) * 2016-12-29 2017-05-17 广州华多网络科技有限公司 文件名显示方法及装置
CN111125566A (zh) * 2019-12-11 2020-05-08 贝壳技术有限公司 信息获取方法和装置、电子设备和存储介质
CN111125566B (zh) * 2019-12-11 2021-08-31 贝壳找房(北京)科技有限公司 信息获取方法和装置、电子设备和存储介质

Also Published As

Publication number Publication date
WO2007075237A1 (en) 2007-07-05
EP1969481A1 (en) 2008-09-17
KR20080076958A (ko) 2008-08-20
US20070143298A1 (en) 2007-06-21

Similar Documents

Publication Publication Date Title
CN101331474A (zh) 浏览与电子邮件有关的项目
US7672909B2 (en) Machine learning system and method comprising segregator convergence and recognition components to determine the existence of possible tagging data trends and identify that predetermined convergence criteria have been met or establish criteria for taxonomy purpose then recognize items based on an aggregate of user tagging behavior
CN101120308B (zh) 关系视图
US20080082463A1 (en) Employing tags for machine learning
US10180979B2 (en) System and method for generating suggestions by a search engine in response to search queries
US8180767B2 (en) Inferred relationships from user tagged content
US20140122991A1 (en) Fast annotation of electronic content and mapping of same
US20090327230A1 (en) Structured and unstructured data models
CN1804838A (zh) 采用基于时间线的数据表示的文件管理系统
KR20050004703A (ko) 이상적인 정보 추상화, 숨기기, 및 순서화를 통해, 시각적복잡성 및 탐색 노력을 경감시키기 위한 모델 및 방법
CN102132270A (zh) 用于设备和web服务的多主控方离线和协作所需要的最小扩展
Lynam Exploring social representations of adapting to climate change using topic modeling and Bayesian networks
CN108133058B (zh) 一种视频检索方法
Crestani et al. Mobile information retrieval
Kim et al. Leveraging ideas from user innovation communities: using text‐mining and case‐based reasoning
Schuff et al. Managing e-mail overload: Solutions and future challenges
Westman Image users' needs and searching behaviour
Al Nasar et al. Personal information management systems and interfaces: An overview
CN107391613B (zh) 一种工业安全主题多文档自动消歧方法及装置
Perea-Ortega et al. Semantic tagging of video ASR transcripts using the web as a source of knowledge
Guldogan et al. Instance based personalized multi-form image browsing and retrieval
Seifert et al. Classifier hypothesis generation using visual analysis methods
Minkov et al. Activity-centric search in email
Hoeppner Beyond Bibliographic Discovery: Bringing Concepts and Findings into the Mix
Codex Advancements in Transfer Learning Techniques for Logo Detection: A Literature Review

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20081224