CN101124576B - 集成有来自信任网络的用户注释的搜索系统和方法 - Google Patents

集成有来自信任网络的用户注释的搜索系统和方法 Download PDF

Info

Publication number
CN101124576B
CN101124576B CN2005800083906A CN200580008390A CN101124576B CN 101124576 B CN101124576 B CN 101124576B CN 2005800083906 A CN2005800083906 A CN 2005800083906A CN 200580008390 A CN200580008390 A CN 200580008390A CN 101124576 B CN101124576 B CN 101124576B
Authority
CN
China
Prior art keywords
user
note
trust network
inquiring
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2005800083906A
Other languages
English (en)
Other versions
CN101124576A (zh
Inventor
卢齐
埃卡特·沃瑟尔
大卫·库
仲-满·谭
凯文·李
徐志辰
帕沃·伯克欣
阿姆·A·阿瓦达拉
阿利·迪比
肯尼思·诺顿
建常·毛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fly upward Management Co., Ltd
Original Assignee
Yahoo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Inc filed Critical Yahoo Inc
Publication of CN101124576A publication Critical patent/CN101124576A/zh
Application granted granted Critical
Publication of CN101124576B publication Critical patent/CN101124576B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

计算机系统和方法在搜索和浏览诸如万维网之类的语料库中结合了关于各种页面或站点的用户注释(元数据),包括由查询用户作出的注释和由为查询用户定义的信任网络的成员作出的注释。为每个用户定义信任网络,并且在搜索和/或浏览语料库期间由第一用户的信任网络的任何成员作出的注释对于第一用户都是可见的。用户还可以将搜索限制为由其信任网络成员或由用户选定的团体的成员注释的内容。

Description

集成有来自信任网络的用户注释的搜索系统和方法
相关申请的交叉引用
本申请要求下面的两个美国临时专利申请的优先权:
2004年3月15日提交的申请No.60/553,577,题为“Search Systemsand Methods with Integration of User Judgments including Trust Networks”;以及
2004年10月28日提交的申请No.60/623,282,题为“Search Systemsand Methods with Integration of User Judgments including Trust Networks”。
这两个申请各自的内容通过引用结合于此以用于一切目的。
本公开文件与____提交的题为“Search Systems and Methods withIntegration of User Annotations”的共同拥有的未决美国专利申请No.____(律师案卷号No.017887-013720US)有关,这里通过引用并入其公开内容以用于一切目的。
技术领域
本发明一般地涉及搜索文档语料库(corpus),更具体地,本发明涉及综合考虑了文档的用户注释(annotation)(包括由查询用户提供的注释以及由与查询用户具有信任关系的其他用户提供的注释)的搜索系统和方法。
背景技术
万维网(Web)提供了大量的与几乎每个可想象的主题有关的相互链接信息源(具有各种格式,包括文本、图像和媒体内容)。随着Web的发展,用户搜索该集合并且识别与特定主题相关的内容的能力变得越来越重要,并且目前出现了多个搜索服务提供者以满足该需求。通常,搜索服务提供者公布一个网页(Web page),用户可以经由该网页提交指示用户对什么感兴趣的查询。响应于查询,搜索服务提供者一般以“搜索结果”页面的形式生成到被认为与该查询相关的网页或站点的链接列表并将该列表发送给用户。
查询响应通常包括以下步骤。首先,利用从查询中提取出的一个或多个搜索项(search term)搜索网页或站点的预先创建的索引或数据库,以生成命中(hit)(通常是目标页面或站点,或者是到目标页面或站点的引用,其包含搜索项或者以其他方式被标识为与查询相关)的列表。随后,根据预定义的标准对命中分级(rank),并且最佳结果(根据这些标准)被给予最显著的放置,例如在列表顶部。将分级后的命中列表发送给用户,通常以“结果”页面(或一组互连页面)的形式,该页面包含到命中页面或站点的链接列表。在结果页面上也可以包括其他特征,如受赞助链接或广告。
命中分级通常是用户的搜索是成功结束还是失败的一个重要因素。查询常常会返回如此大量的命中以致于用户不可能在合理时间内浏览所有命中。如果用户遵循的前几个链接未能引向相关内容,则用户常常会放弃搜索,甚至可能放弃搜索服务提供者,即使相关内容可能在列表下方就可得到也是如此。
为了使相关内容被显著放置的似然性最大,搜索服务提供者已经开发了越来越复杂的页面分级标准和算法。在Web搜索的早期,分级通常是基于给定页面上搜索项的出现次数和/或邻近度的。这已经被证明是不适当的,今天使用的算法一般除了搜索项在命中页面自身的存在情况以外还结合了其他信息,如Web上链接到给定命中页面的其他站点的数目(其反映了其他内容提供者认为命中页面有多大用处)。一种算法允许查询用户通过评价(rate)返回的命中来提供反馈。该评价(rating)与查询关联存储,并且先前的肯定评价被用作下次由任何用户输入相同查询时对命中分级的一个因素。
然而,现有的算法通常不考虑个体用户的偏好。例如,输入相同查询的两个用户实际上可能对不同的东西感兴趣;对于一个用户相关的页面或站点可能对于另一个用户不相关。另外,不同用户在不同领域中可能具有不同的偏好,如内容是如何组织并显示的,其信任哪些内容提供者等等,这会影响其如何评估或评价给定站点。从而,满足一个用户(或许多用户)需求的站点可能不满足输入相同查询的下一用户的需求,并且该用户仍然可能以失败告终。
另一种用于帮助个体用户找到其感兴趣的内容的工具是“书签(bookmarking)”。传统上,书签已实现在Web浏览器程序中,并且在查看任何页面的同时,用户可以选择保存该页面的书签。书签通常包括页面的URL(统一资源定位符)、标题和(可能)其他信息,如用户何时访问该页面或者用户何时创建书签。Web浏览器程序维护书签的列表,并且用户可以通过在其书签列表中找到书签标记的页面来导航到该页面。为了简化导航书签列表的任务,大多数书签工具允许用户将其书签组织到文件夹中。更近一些,某些基于因特网的信息服务具有实现的书签工具,其允许注册用户从连接到因特网的任何计算机创建并访问个人的书签列表。
尽管书签可能是有用的,但是该工具也有其限制。例如,即使利用文件夹,用户也很难记住哪一个被书签标记的页面有用户在给定时刻可能正在查找的特定信息项。另外,现有的书签工具通常不帮助用户识别其是否已经对给定页面加上了书签,也不提供任何用于搜索加上书签的信息的工具。另外,现有的书签技术不提供用于使用户与其他用户共享其书签的容易的方式。
从而,希望提供用于帮助个体用户收集并搜索其感兴趣的内容的改进的工具。
发明内容
本发明的实施例提供了结合了与各种页面或站点有关的用户判断信息的搜索系统和方法。该信息可以包括来自查询用户的判断,以及来自由查询用户选择作为其“信任网络”成员的其他用户的判断,或者来自由查询用户识别出的某个其他用户组的判断。例如,在某些实施例中,参与内容注释系统的每个用户可以定义朋友列表,其中每个朋友是第一用户想要与其共享注释的系统的另一用户;基于由各种参与用户定义的朋友列表,对于每个用户定义信任网络。在其他实施例中,用户的信任网络被定义为包括用户所属的明确定义的团体的成员。无论信任网络如何定义,由查询用户的信任网络的任何成员作出的注释都可被集成到由查询用户作出的对语料库的后续搜索的结果中,并且也可以以各种方式用于增强查询用户浏览语料库的体验。在其他实施例中,查询用户可以指定预定义团体的成员(用户可能是该团体的成员,也可能不是),并且由该团体的任何成员作出的注释都可被集成到查询用户的搜索结果中,并且也可用于增强查询用户的浏览体验。
根据本发明的一个方面,一种用于对用户查询作出响应的方法包括接收由多个用户中的查询用户提交的查询,并且搜索包括多个文档的语料库以识别一个或多个命中,其中每个命中是语料库中被确定与查询相关的文档。为查询用户构建信任网络,信任网络以多个用户中包括除了查询用户以外的至少一个用户的子集作为成员。访问由多个用户创建的注释的存储,其中每个注释与语料库的文档中的主题文档相关联,并且与多个用户中的创建用户相关联,并且每个注释包括与主题文档有关的用户特定的元数据。识别至少一个“已注释命中”,其中已注释命中是还作为至少一个匹配注释的主题文档的命中,并且每个匹配注释的创建用户是信任网络的成员之一。生成包括命中列表的搜索报告。对于每个已注释命中,搜索报告还包括关于匹配注释的信息。语料库可包括例如多个万维网页面,并且用户可以是人或计算机(或操作计算机的人)。
在某些实施例中,信任网络成员包括由查询用户明确识别为朋友的至少一个其他用户。例如,可以提供信任网络界面,其中信任网络界面可由用户操作以将其他用户识别为朋友。经由信任网络界面,从多个输入用户(包括查询用户)接收到朋友的标识。存储每个输入用户的已识别朋友的列表。某些实施例还允许给已识别朋友列表中的每个朋友分配信任权重。信任权重可以例如基于经由信任网络界面接收到的用户输入来分配。
在其他实施例中,为查询用户构建信任网络包括从查询用户与之通信的用户列表自动填充查询用户的已识别朋友的列表。该用户列表可包括例如由查询用户维护的即时消息联系人的列表、由查询用户维护的电子邮件地址簿、查询用户所属的团体的成员列表等等。也可以提供可由查询用户操作以编辑自动填充的朋友列表的信任网络界面。
在使用已识别朋友的列表时,为查询用户构建信任网络有利地包括检索查询用户的已识别朋友的列表,并且将查询用户的已识别朋友中的至少一个添加作为信任网络的成员。也可以检索信任网络成员中的第一个的已识别朋友的列表,并且信任网络成员中的第一个的已识别朋友中的至少一个也可以被添加作为信任网络的成员。在某些实施例中,以不超过最大值的分离度连接到查询用户的信任网络成员的已识别朋友被添加作为信任网络的成员。在其他实施例中,选择用户以添加到信任网络作为成员是至少部分基于信任权重的。查询用户也可被添加到信任网络作为成员。
不需要将个体用户明确识别为朋友。例如,在某些实施例中,信任网络成员是用户的选定团体的成员,该选定团体由查询用户选择。查询用户可能是选定团体的成员,也可能不是,另外查询用户可能是信任网络的成员,也可能不是。在用户选择团体以定义信任网络的情况下,用户可能能访问标识团体的个体成员的信息,也可能不能访问。
注释可以以各种方式用于生成搜索报告。在某些实施例中,响应于查询用户的查询而生成的搜索报告包括应用于作为已注释命中的每个命中的可视突出显示元素。在包括在注释中的用户特定的元数据包括评价的情况下,对于每个已注释命中,从每个匹配注释中提取出评价,并且计算平均评价;应用于每个已注释命中的可视突出显示元素依赖于平均评价。在某些实施例中,至少部分基于已注释命中的平均评价确定命中列表的顺序。在其他实施例中,生成搜索报告还包括对于每个已注释命中,在搜索报告中提供控制元素,该控制元素可由用户操作以请求显示至少一个匹配注释的用户特定的元数据。在其他实施例中,生成搜索报告还包括生成只包括已注释命中的单独列表。
在某些实施例中,该方法还包括搜索注释存储以识别一个或多个附加的已注释命中,其中每个附加的已注释命中对应于语料库中的一个文档,对于该文档注释存储包括创建用户是信任网络成员之一的关联注释,并且关联注释包括被确定为与查询相关的用户特定的元数据。附加的已注释命中可以被结合到搜索结果页面的命中列表中。例如,在搜索语料库包括从用户查询中提取出搜索项并将语料库中包含搜索项的每个文档识别为命中的情况下,搜索注释存储可以包括将语料库中用户特定的元数据针对其包括搜索项的每个文档识别为附加的已注释命中。
在某些实施例中,注释存储可能包括与语料库中的文档组相关联的至少一个注释,并且作为文档组之一的任何命中都可被识别为已注释命中。
用户特定的元数据有利地包括由用户明确输入的信息项,如关联文档的评价、描述关联文档的关键字、从预定义的词表中选出的标签、关联文档的描述等等。
根据本发明的另一个方面,一种用于对用户查询作出响应的方法包括接收由多个用户中的查询用户提交的查询。为查询用户构建信任网络,信任网络以多个用户中包括除了所述查询用户以外的至少一个用户的子集作为成员。访问由多个用户创建的注释的存储,存储中的每个注释与属于一个语料库的多个文档中的主题文档相关联,并且与多个用户中的创建用户相关联,并且每个注释还包括与主题文档有关的用户特定的元数据。识别一个或多个命中,每个命中是语料库中被确定与查询相关的文档,并且每个命中还是至少一个匹配注释的主题文档,其中每个匹配注释的创建用户是信任网络成员之一。生成包括命中列表的搜索报告,并将其发送给查询用户。语料库可以是例如万维网,用户可以是人或计算机(或操作计算机的人)。
信任网络可以用各种方式构建。例如,信任网络成员包括由查询用户明确识别为朋友的至少一个其他用户,并且可以从各种用户的明确识别的朋友列表构建信任网络,例如如上所述。信任网络成员也可以是用户的选定团体的成员,该团体由用户选择;用户可能是选定团体的成员,也可能不是,并且用户可能知道个体团体成员的身份,也可能不知道。
在某些实施例中,识别这一个或多个命中包括将查询与语料库中的文档的内容相比较。
在另一个实施例中,识别一个或多个命中包括将查询与注释的搜索池中创建用户是信任网络成员之一的注释的用户特定的元数据相比较。例如,可以从查询中提取出搜索项,并且可以对搜索池中的每个注释检测搜索项是否存在于用户特定的元数据中;在搜索项存在于用户特定的元数据中的情况下关联文档被识别为命中。在某些实施例中,用户特定的元数据包括多个字段,并且查询可以指定在检测动作期间要考虑哪些字段。另外,对于作为搜索池中的至少一个注释的主题文档的每个文档,可以检测搜索项是否存在于文档中,并且在搜索项存在于文档中的情况下该文档也可被识别为命中。
在某些实施例中,对于每个命中,搜索报告包括控制元素,该控制元素可由用户操作以请求显示至少一个匹配注释的用户特定的元数据。在其他实施例中,对于每个命中,搜索报告包括来自至少一个匹配注释的至少某些用户特定的元数据。在其他实施例中,在包括在每个匹配注释中的用户特定的元数据包括主题文档的评价的情况下,列表中的命中是按照至少部分基于命中的评价确定的顺序放置的。
在某些实施例中,注释存储可能包括与语料库中的文档组相关联的至少一个注释,并且作为文档组之一的任何文档都可被识别为命中。
根据本发明的又一方面,一种用于对来自多个用户的用户查询作出响应的计算机系统包括索引数据存储、个人化数据存储以及通信耦合到索引数据存储和个人化数据存储的搜索服务器。索引数据存储被配置为存储属于一个语料库的多个文档的可搜索表示。个人化数据存储被配置为存储注释,每个注释与语料库中的主题文档相关联,并且与多个用户中的创建用户相关联,每个注释包括与主题文档有关的用户特定的元数据。搜索服务器包括输入控制逻辑、搜索控制逻辑、信任网络控制逻辑、个人化控制逻辑和报告控制逻辑。输入控制逻辑被配置为接收来自多个用户中的查询用户的查询。搜索控制逻辑被配置为搜索索引数据存储以识别一个或多个命中,其中每个命中是语料库中被确定为与接收的查询相关的文档。信任网络控制逻辑被配置为为查询用户构建信任网络,信任网络以多个用户中包括除了查询用户以外的至少一个用户的子集作为成员。个人化控制逻辑被配置为将作为至少一个匹配注释的主题文档的每个命中识别为已注释命中,其中每个匹配注释的创建用户是信任网络成员之一。报告控制逻辑被配置为生成包括命中列表的搜索报告,对于每个已注释命中,搜索报告还包括关于至少一个匹配注释的信息,报告控制逻辑还被配置为将搜索报告发送给查询用户。
根据本发明的又一方面,一种用于对来自多个用户的用户查询作出响应的计算机系统包括索引数据存储、个人化数据存储以及通信耦合到索引数据存储和个人化数据存储的搜索服务器。索引数据存储被配置为存储属于一个语料库的多个文档的可搜索表示。个人化数据存储被配置为存储注释,每个注释与语料库中的主题文档相关联,并且与多个用户中的创建用户相关联,每个注释包括与主题文档有关的用户特定的元数据。搜索服务器包括输入控制逻辑、信任网络控制逻辑、搜索控制逻辑和报告控制逻辑。输入控制逻辑被配置为接收来自多个用户中的查询用户的查询。信任网络控制逻辑被配置为为查询用户构建信任网络,其中信任网络以多个用户中包括除了查询用户以外的至少一个用户的子集作为成员。搜索控制逻辑被配置为将来自语料库的一个或多个文档识别为命中,其中每个命中被确定为与查询相关,并且每个命中还是至少一个匹配注释的主题文档,其中每个匹配注释的创建用户是信任网络成员之一。报告控制逻辑被配置为生成包括命中列表的搜索报告,报告控制逻辑还被配置为将搜索报告发送给用户。
下面的具体实施方式以及附图将提供对于本发明本质和优点的更好的理解。
附图说明
图1是根据本发明实施例的信息检索和通信网络的框图。
图2是根据本发明另一个实施例的信息检索和通信网络的框图。
图3是根据本发明实施例的注释的内容字段的示例。
图4是根据本发明实施例的用于组织注释的文件夹条目的示例。
图5是根据本发明实施例的信任网络的网络图。
图6是根据本发明一个实施例的信任网络界面页面的示例。
图7是根据本发明实施例用于注释和/或查看用户恰好正在查看的任何页面的现有注释的基于工具栏的界面的示例。
图8是根据本发明实施例用于显示注释的覆盖图的示例。
图9A和9B是根据本发明实施例的利用注释信息增强的搜索结果页面的示例。
图10是根据本发明实施例用于将信任网络成员的注释结合到来自查询用户的当前查询的响应中的过程的流程图。
图11是根据本发明实施例的个人Web搜索界面页面的示例。
图12是根据本发明实施例用于在个人Web搜索期间响应于查询的过程的流程图。
图13是根据本发明实施例的文件夹私密性设置的示例。
图14是根据本发明实施例用于与用户自己的注释交互的库界面页面的示例。
图15是根据本发明实施例的导入界面页面的示例。
图16A和16B是根据本发明实施例用于搜索团体Web的界面页面的示例。
具体实施方式
本发明的实施例提供了允许用户共享其与在诸如万维网之类的语料库中找到的各种文档(或其他内容项)有关的注释的系统和方法。这里所用的术语“注释”通常指与来自语料库的文档有关的任何描述性和/或评估性的元数据,其中元数据是从用户收集的,并随后与该用户的标识符和主题文档(即,元数据与之相关的文档)的标识符关联存储。注释可以包括元数据的各种字段,如页面或站点的评价(其可以是正面的(favorable)或负面的(unfavorable))、标识页面或站点的(一个或多个)主题的一个或多个关键字或标签、页面或站点的自由文本描述和/或其他字段。注释有利地被从语料库的用户收集,并与创建注释的用户的标识符和与之有关的文档(或其他内容项)的标识符关联存储。注释的示例和用于从用户收集注释的过程在上面引用的申请No.____(律师案卷号No.017887-013720US)中有所描述。应当理解,本发明并不限于特定的元数据或用于收集元数据的特定技术。
在本发明的实施例中,参与内容注释系统的每个用户可以定义朋友列表,其中每个朋友是第一用户想要与之共享注释的系统的另一个用户。基于由各个参与用户定义的朋友列表,对于每个用户定义信任网络,并且由第一用户的信任网络成员作出的注释可被集成到由第一用户作出的语料库的后续搜索的结果中,并且也可以以各种方式使用以增强第一用户浏览语料库的体验。
例如,当第一用户搜索语料库时,对应于第一用户或第一用户的信任网络的任何其他成员已注释的的文档的任何命中(这里称为“已注释命中”)可被突出显示,并提供链接以允许用户查看这些注释。在注释包括诸如数字评价之类的判断数据的情况下,可以对第一用户的信任网络聚合判断数据,并且可以以指示判断是正面的还是负面的方式来突出显示已注释命中。另外,对第一用户的信任网络聚合的数字评价可用于对响应于第一用户的查询的搜索结果分级,其中正面的聚合评价倾向于增大给定页面或站点的等级,而负面的聚合评价倾向于减小等级。
在另一个实施例中,在注释包括用户提供的文本描述和/或描述性的关键字或标签的情况下,第一用户具有搜索由其信任网络成员创建的注释的内容(除了页面内容外或替代页面内容)的选项。在其他实施例中,每当用户初次访问已由其信任网络的任何成员注释的页面时,都提供了允许用户查看这些注释的控件。
为了说明目的,本发明的描述和附图可能利用特定查询、搜索结果页面、URL和/或网页。这种使用并不是要暗示对任何实际的网页或站点的任何意见、认可或者蔑视。另外,应当理解,本发明并不限于这里说明的具体示例。
I.概述
A.网络实现方式概述
图1图示了根据本发明实施例包括客户端系统20的信息检索和通信网络10的概况。在计算机网络10中,客户端系统20通过因特网40或其他通信网络(例如经由任何局域网(LAN)或广域网(WAN)连接)耦合到任何数目的服务器系统501至50N。如这里所描述的,根据本发明,客户端系统20被配置为与服务器系统501至50N中的任何一个通信,以例如访问、接收、检索和显示媒体内容和其他信息(如网页)。
图1所示的系统中的若干元件包括这里不需要详细说明的传统的公知元件。例如,客户端系统20可包括桌面个人计算机、工作站、膝上型电脑、个人数字助理(PDA)、手机或任何能够使用WAP的设备或任何其他能够直接或间接接口到因特网的计算设备。客户端系统20一般运行浏览程序,如微软的Internet ExplorerTM浏览器、Netscape NavigatorTM浏览器、MozillaTM浏览器、OperaTM浏览器、或在手机、PDA或其他无线设备的情况下的能够使用WAP的浏览器等等,从而允许客户端系统20的用户访问、处理和查看可经由因特网40从服务器系统501至50N获得的信息和页面。客户端系统20一般还包括一个或多个用户接口设备22,如键盘、鼠标、触摸屏、笔等等,其用于结合由服务器系统501至50N或其他服务器提供的页面、表格和其他信息,与由显示器(例如,监视器屏幕、LCD显示器等)上的浏览器提供的图形用户界面(GUI)交互。本发明适合于用于因特网,因特网指网络的特定全局互连网络。然而,应当理解,也可以使用其他网络来替代因特网或与因特网一起使用,如内联网、外联网、虚拟专用网络(VPN)、基于非TCP/IP的网络、任何LAN或WAN等。
根据一个实施例,客户端系统20和其所有组件都可由操作者利用包括计算机代码的应用来配置,所述计算机代码是用中央处理单元(如IntelPentiumTM处理器、AMD AthlonTM处理器等或多处理器)来运行的。如这里所述的用于操作和配置客户端系统20传输、处理和显示数据和媒体内容的计算机代码优选地被下载并存储在硬盘上,但是全部程序代码或其一部分也可以存储在任何其他公知的易失性或非易失性存储器介质或设备(如ROM或RAM)中,或者提供在能够存储程序代码的任何介质上,如致密盘(CD)介质、数字通用盘(DVD)介质、软盘等。另外,全部程序代码或其一部分可以从软件源发送和下载,例如从服务器系统501至50N之一经由因特网发送到客户端系统20,或者利用任何通信介质和协议(例如TCP/IP、HTTP、HTTPS、以太网或其他传统介质和协议)经由任何其他网络连接(例如外联网、VPN、LAN或其他传统网络)发送。
应当意识到,用于实现本发明某些方面的计算机代码可以是C、C++、HTML、XML、Java、JavaScript等代码,或任何其他合适的脚本语言(例如VBScript)、或任何其他合适的编程语言,这些语言可以在客户端系统20上执行或可以被编译以在客户端系统20上执行。在某些实施例中,不向客户端系统20下载任何代码,并且所需的代码由服务器执行,或者已经存在于客户端系统20上的代码被执行。
B.搜索和注释系统概述
图2图示了根据本发明实施例用于传输媒体内容的另一个信息检索和通信网络110。如图所示,网络110包括客户端系统120、一个或多个内容服务器系统150和搜索服务器系统160。在网络110中,客户端系统120通过因特网140或其他通信网络通信耦合到服务器系统150和160。如上所述,客户端系统120和其组件被配置为经由因特网140或其他通信网络与服务器系统150和160以及其他服务器系统通信。
根据一个实施例,在客户端系统120上执行的客户端应用(表示为模块125)包括用于控制客户端系统120和其组件与服务器系统150和160通信并处理和显示从其接收的数据内容的指令。客户端应用125优选地从诸如远程服务器系统(例如,服务器系统150、服务器系统160或其他远程服务器系统)的软件源发送并下载到客户端系统120,但客户端应用模块125也可以提供在如上所述的任何软件存储介质上,如软盘、CD、DVD等。例如,在一个方面,客户端应用模块125可以经由因特网140以HTML包装(wrapper)的形式被提供到客户端系统120,该HTML包装包括各种控件,例如嵌入式JavaScript或Active X控件,其用于操作数据并在各种对象、框架和窗口内表现数据。
另外,客户端应用模块125包括各种用于处理数据和媒体内容的软件模块,如用于处理搜索请求和搜索结果数据的专用搜索模块126,用于在文本和数据框架和活动窗口(例如浏览器窗口和对话框)内表现数据和媒体内容的用户接口模块127以及用于接口到在客户端120上执行的各种应用并与之通信的应用接口模块128。根据本发明的某些方面,应用接口模块128优选地被配置为与之接口的在客户端系统120上执行的应用的示例包括各种电子邮件应用、即时消息(IM)应用、浏览器应用、文档管理应用等等。另外,用户接口模块127可包括浏览器,如配置在客户端系统120上的默认浏览器或不同的浏览器。
根据一个实施例,搜索服务器系统160被配置为向客户端系统120提供搜索结果数据集和媒体内容,内容服务器系统150被配置为例如响应于在由搜索服务器系统160提供的搜索结果页面中选定的链接而向客户端系统120提供诸如网页的数据和媒体内容。在某些变体中,搜索服务器系统160返回内容以及/或者链接和/或其他对内容的引用。搜索服务器系统包括被配置为接收来自用户的查询并为其生成搜索结果数据的查询响应模块162,被配置为管理用户与用户提供的注释信息的交互的用户注释模块164以及被配置为管理用户的信任网络的信任网络模块165。搜索服务器系统160通信耦合到个人化数据库166,个人化数据库166存储与搜索服务器系统160的特定用户以及页面索引170有关的数据,页面索引170向要搜索的语料库(在某些情况下是万维网)提供索引。个人化数据库166和页面索引170可以利用传统数据库技术实现。
在一个实施例中,信任网络模块165为搜索服务器160的每个注册用户建立“朋友”列表,并且将列表存储在个人化数据库166中。朋友列表可由信任网络模块165自动初始化,并且由用户编辑(如下所述),或者其可以手工创建。基于为各种用户建立的朋友列表,信任网络模块165为每个用户定义信任网络,信任网络包括该用户的朋友,并且在某些情况下包括该用户的朋友的朋友等等,直到某些限制(如下所述)。
在某些实施例中,信任网络模块165动态地为每个用户构建信任网络;这包括生成信任网络成员的列表以及每个成员的关联参数(例如,信任权重或置信系数,如下所述)。给定用户的信任网络的构建可以在需要信任网络信息时(例如在用户提交查询时)实时发生。或者,给定用户的信任网络可以在预定条件下构建并被存储用于后续的应用。可以触发信任网络信息的构建(或重建)的条件的示例包括:每次用户发起与搜索服务器160的新的会话时;每次用户更新他/她的朋友列表时,如下所述;或者定期安排的间隔(例如每日)。
在一个实施例中,注释模块164与个人化数据库166交互以存储和管理搜索服务器系统160的各种用户的用户注释数据。例如,接收自用户的注释数据可被提供到注释模块164以存储在个人化数据库166中,并且注释模块164也可以响应于对注释数据的任何请求,包括来自于查询响应模块162、搜索服务器160的其他组件和/或客户端120的请求。
可以为用户输入注释数据提供各种界面。在上面引用的申请No.017887-013720US中描述了某些示例;也可以使用这些界面或其他界面中的任何一种。当用户选择注释页面或站点时,用户注释模块164接收来自用户(例如经由客户端系统120)的新的注释数据并更新个人化数据库166。
在一个实施例中,查询响应模块162参考各种页面索引170,这些页面索引170被填充以例如页面、到页面的链接、代表索引页面的内容的数据等等。页面索引可通过各种收集技术生成,包括自动web挖掘器(crawler)172和/或各种网蜘蛛(spider)等,以及用于对分级体系结构内的网页分类并分级的手工或半自动分类算法和界面。这些技术可以实现在搜索服务器系统160中或单独的系统(例如web挖掘器172)内,这种单独的系统生成页面索引170并使其可用于搜索服务器系统160。各种页面索引实现方式和格式是本领域中已知的,并且可用于页面索引170。
查询响应模块162被配置为提供响应于接收自客户端系统120(尤其接收自搜索模块126)的各种搜索请求(查询)的数据。这里所用的术语“查询”包含从用户到搜索服务器160(例如经由客户端120)的任何请求,其可通过搜索由页面索引170索引的Web(或其他语料库)来满足。在一个实施例中,经由搜索模块126向用户呈现搜索界面。界面可包括文本框(用户可以向文本框中输入查询(例如通过打字))、复选框和/或单选按钮,单选按钮用于从预定义的查询中选择使用户能够将搜索限制在完全搜索语料库的预定义子集中(例如,限制在页面索引170内的某些网站或分类部门中)的目录或其他结构等。可以使用任何搜索界面。
查询响应模块162有利地被配置具有与搜索相关的算法,其用于处理与给定查询相关的网页并对网页分级(例如,基于以下各项的组合:由从查询中提取的搜索项的出现模式测量的逻辑相关度;与搜索项和/或具体页面或站点相关联的上下文标识符;页面赞助者;从多个页面收集的连通性数据等)。例如,查询响应模块162可以分析接收到的查询以提取出一个或多个搜索项,然后利用这些搜索项访问页面索引170,从而生成“命中”列表,即被确定与查询至少具有某些相关性的页面或站点(或对页面或站点的引用)。查询响应模块162随后可利用一种或多种分级算法对命中分级。用于识别命中并对命中分级的具体算法对本发明而言是不重要的,并且可以使用传统算法。
在本发明的某些实施例中,查询响应模块162还被配置为从个人化数据库166中检索与属于查询用户的信任网络的任何用户(包括查询用户)相关联的任何注释数据,并将这种注释数据结合到搜索结果中。注释数据的检索可包括查询响应模块162和信任网络模块165之间的交互(例如为了获得信任网络成员的列表)和/或查询响应模块162和注释模块164之间的交互(例如为了在识别出信任网络成员时检索注释数据)。
注释数据的结合可以用多种方式进行。例如,在至少某些注释包括评价的情况下,可以至少部分基于评价信息来识别命中和/或对命中分级。可以直接使用由个体信任网络成员给予命中页面或站点的评价,或者可以使用评价具体页面的所有信任网络成员的聚合(例如平均)评价。在一个实施例中,查询响应模块162可以基于具体页面或站点的正面评价生成单独的“正面”结果的列表;或者查询响应模块162可以在搜索结果的等级中结合具体页面或站点的评价;或者查询响应模块162可以使用具体页面或站点的信任网络成员的负面评价来确定是否从包括在搜索结果页面中的命中列表中丢弃命中。在注释包括文本描述、关键字或标签的情况下,在识别搜索命中和/或对搜索命中分级期间可以考虑搜索项在这些元素的任何一个中的出现情况。
为了启用诸如信任网络注释之类的搜索个人化特征,搜索服务器160有利地提供用户登录特征,其中“登录”通常指用于识别和/或验证计算机系统的用户的任何方案。大量示例在本领域中是已知的,并且可以与本发明的实施例结合使用。例如,在一个实施例中,每个用户有唯一的用户标识符(ID)和密码,并且搜索服务器160通过向客户端120传递登录页面(用户可经由登录页面输入该信息)来提示用户登录。在其他实施例中,除了用户ID和密码外(或者替代这些技术),还可以使用生物度量、语音或其他识别和验证技术。一旦用户已例如通过登录识别其自身,则用户就可以通过与用户注释模块164交互来创建和/或更新注释,如下所述。另外,登录用户输入的每个查询可以与该用户的唯一用户ID相关联;基于用户ID,查询响应模块162可以访问个人化数据库166以将来自查询用户的信任网络的成员的注释结合到对该用户的查询的响应中。用户登录有利地是持久的,其意义是一旦用户已登录(例如经由客户端应用125),就可以在用户操作客户端应用125的同时,在任何适当的时刻将用户的身份传输到搜索服务器160。从而,这里描述的个人化特征对用户来说可以是可连续访问的。
除了使用信任网络成员的响应于查询的注释外,查询响应模块162还可以使用从其他用户的注释收集的聚合信息。例如,在一个实施例中,从每一用户的评价计算页面或站点的全局聚合评价(例如,平均评价),这每一用户都提供了具有该页面或站点的评价的注释(无论是否信任网络成员)。该全局聚合评价可用于选择搜索命中和/或对搜索命中分级。在另一个实施例中,可以例如通过识别由已对页面或站点作出注释的用户(无论是否信任网络成员)最常应用于该页面或站点的关键字或标签,来确定描述页面或站点的全局聚合关键字或标签。这种用于给定页面的聚合注释可例如存储在页面索引170中,并且被查询响应模块162用来响应于查询而对命中分级(无论用户对于搜索服务器160来说是否是已知的)。
在一个实施例中,用户注释模块164在接收到新的注释数据时将其转发到聚合器模块(未在图2中示出),聚合器模块更新存储在页面索引170中的聚合注释数据。聚合注释数据可以以定期间隔(例如每日或每小时)更新,或者近似实时更新。全局聚合注释数据的收集和使用在上面引用的申请No.____(律师案卷号No.017887-013720US)中有所描述。
在其他实施例中,查询响应模块162可被配置为通过对完全语料库的子集搜索或报告命中来对查询作出响应。例如,用户可能能够提交这样的查询和请求,即只有那些已由其信任网络成员注释的文档被报告为命中。作为另一个示例,用户可能能够请求只有那些已由特定团体成员注释的文档被报告为搜索命中。这些操作的示例在下面描述。
应当意识到,这里描述的搜索系统是示例性的,也可以有变化和修改。内容服务器和搜索服务器系统可以是单个组织的一部分,例如由Yahoo!公司提供给用户的分布式服务器系统,或者它们可以是不同组织的一部分。每个服务器系统通常包括至少一个服务器和关联的数据库系统,并且可以包括多个服务器和关联的数据库系统,并且尽管被示为单个块,但是也可以是地理上分布的。例如,搜索服务器系统的所有服务器可以彼此相邻(例如在位于单个建筑物或校园内的服务器群中),也可以分布在彼此远离的位置处(例如,一个或多个服务器位于A城市中,一个或多个服务器位于B城市中)。从而,这里所用的“服务器系统”一般包括分布在本地或分布在一个或多个地理位置处的一个或多个逻辑和/或物理上相连的服务器;术语“服务器”和“服务器系统”可互换使用。另外,这里描述的查询响应模块和用户注释模块可以实现在同一服务器上,也可以实现在不同服务器上。
搜索服务器系统可被配置具有一个或多个页面索引和算法,该算法用于响应于接收自客户端系统的搜索查询而访问(这一个或多个)页面索引并向用户提供搜索结果。搜索服务器系统可自己生成页面索引,从另一个源(例如单独的服务器系统)接收页面索引,或者从另一个源接收页面索引并对其执行进一步的处理(例如各种页面信息的添加或更新)。另外,尽管搜索服务器系统被描述为包括组分模块的特定组合,但是应当理解,对模块的划分仅仅是为了描述方便;可以定义更多的、更少的或不同的模块。
另外,在某些实施例中,这里描述的由搜索服务器160维护的某些模块和/或元数据可以整体或部分驻留在客户端系统上。例如,用户注释的某些或全部可以存储在客户端系统120本地,并且由客户端应用125的组分模块管理。其他数据(包括页面索引170的某些部分或全部)可以周期性地从搜索服务器160下载并由客户端系统120存储以供后续使用。另外,客户端应用125可以创建并管理存储在客户端120本地的内容索引,并且还可以提供搜索本地存储的内容的能力,将包括本地存储的内容的搜索结果结合到Web搜索结果中等等。从而,搜索操作可包括由搜索服务器系统和/或客户端系统进行的操作的任何组合。
在本发明的实施例中,可以用多种方式从用户收集注释,包括从搜索结果页面输入的注释、利用工具栏界面输入的注释等等。收集注释数据的示例如下所述。
C.注释概述
可以经由多种合适的接口从搜索服务器160的注册用户收集存储在个人化数据库166中的注释数据。用于收集注释的注释格式和接口的某些示例在上面引用的申请No.____(律师案卷号No.017887-013720US)中有所描述,并且在下面简要加以总结。然而,应当理解,本发明并不限于具体的注释格式或注释收集技术。
I.注释内容
如上所述,这里所用的术语“注释”通常指与从用户收集的页面或站点(或语料库中的其他内容项)有关的并且其后与该用户的标识符和页面或站点的标识符关联存储的任何描述性和/或评估性的元数据。注释可包括各种元数据字段,如页面或站点的评价(其可以是指示正面或负面意见的任何数据)、标识页面或站点的(一个或多个)主题的一个或多个关键字、页面或站点的文本描述和/或其他字段。为了说明目的,现在描述特定的注释结构;应当理解,具体注释结构对于本发明来说是不重要的。
这里所用的“页面”指可由唯一定位符(例如URL)标识并且可由适当配置的浏览器程序显示的内容单元。“站点”指与共同主题有关并且位于同一服务器上的一个或多个页面的群组。在本发明的某些实施例中,创建注释的用户可以指示注释是应当应用于单个页面还是应用于一组相关页面(一个站点)。在后者的情况下,用户可以有利地定义站点的范围。在某些实施例中,除了注释可能应用于的页面的数目不同以外,页面注释和站点注释之间没有其他区别。
在一个实施例中,每个注释在个人化数据库166中是结构化的条目。图3图示了注释300的内容字段。左列302中的字段可以由用户注释模块164自动生成和更新;右列304中的字段优选地是用户提供的。
自动生成的字段包括存储创建(或保存)注释的用户的用户ID的“作者ID”(Author ID)字段306和标识作为注释对象的页面(或页面组)的“URL”字段308。在该实施例中,注释与其ID表现在作者ID字段306中的用户相关联,并且与其URL与存储在URL字段308中的URL匹配的任何文档相关联。“主机标志”(Host flag)字段310指示注释是应用于单个页面还是应用于页面组。如果主机标志被设为“页面”(page),则注释只应用于其URL与字段308中的串精确匹配的页面,而如果主机标志被设为“站点”(site),则注释应用于其URL以字段308中所示的串开始的任何页面。从而,主机标志被设为“站点”的注释可以应用于任何数目的页面(包括只应用于一个页面)。主机标志字段310可自动设为默认值(例如“页面”),并且用户可被给予改变值的选项。
“标题”(Title)字段312存储主题页面的标题。该字段有利地被填充以从注释页面的源代码提取的页面标题作为默认值;在某些实施例中,允许用户改变标题。“摘要”(Abstract)字段314存储主题页面或站点的文本摘要;该摘要可以自动生成或由用户提供。
列302中的剩余字段提供关于注释的历史信息。例如,“介绍”(referral)字段316提供关于用户如何到达主题页面的上下文信息。介绍字段316可包括例如查询(响应于该查询用户被带到主题页面,如图3所示),关于用户在导航到注释页面之前所查看的内容的历史信息,或者作者从其导入注释的另一用户的标识符(导入在下面描述)。
在用户已注释页面并随后修改该注释的情况下,介绍字段316有利地被更新以标识引导致修改后的注释的介绍源。“老的介绍”(Oldreferral)字段318可用于存储与注释的前一版本有关的上下文信息;该信息类似于存储在介绍字段316中的信息。可以维护任何数目的老的介绍(包括没有老的介绍)。
“最后更新”(Last updated)字段320提供指示用户何时最后更新注释的时间戳。“最后访问”(Last Visited)字段322提供指示用户何时最后访问注释页面的时间戳。尽管图3以年-月-日时:分:秒格式示出了这些时间戳,但是应当理解,可以替换使用其他格式和任何期望的精度。该信息可用来例如识别可能可靠性更低的更老的注释(尤其在注释页面的更新比用户最后访问该页面的时间更近的情况下)。
列304中的字段由作者提供,并且有利地保持为空,直到并且除非用户提供数据为止。在优选实施例中,并不要求用户提供所有这些字段的数据,并且在注释被用于搜索处理时可以忽略任何空字段。
“关键字”(keywords)字段324存储描述主题页面的一个或多个用户提供的关键字或用户选择的标签。这里所用的“关键字”(在现有技术中有时也被称为tag)指由可自由选择任何词或短语的用户提供的词或短语,而“标签”(label)指由用户从系统定义的词表(如类别标识符的分级列表)中选择的词或短语。
“描述”(Description)字段326存储由用户提供的对主题页面的文本描述。在填充该字段时,用户不被限制于词或短语,也不被限制于任何特定长度,并且文本可以是格式化的,也可以是非格式化的。在某些实施例中,描述字段326可以存储相当长的文本串(例如,长达500或1000个词)。用户还可被允许将到其他内容的链接包括为描述的一部分。链接可被包括,以例如用来标识提供关于由注释页面提及的主题的更详细信息的其他站点。
“评价”(Rating)字段328存储反映用户对主题页面的意见或判断的数字值或其他指示符。评价可以利用各种刻度提供,刻度优选地允许至少“正面”(favorable)、“负面”(unfavorable)和“中立”(neutral)评价。例如,在一个实施例中,在注释创建期间用户被提示对主题页面给予正面(例如拇指向上)或负面(例如拇指向下)评价。正面和负面评价各自被分配以数字值(例如分别是+2和-2);未被评价的页面被给予代表“中立”判断的默认评价(例如0)。也可以使用其他评价系统(例如0-4星、1-10级等)。存储在字段328中的评价指示符不需要与用户使用的评价刻度匹配(例如,如果用户按1-10的刻度评价页面,则这可被转换为范围从-4到5的评价指示符)。用户加以注释但是不评价的任何页面都有利地被视为具有中立评价。
应当理解,注释条目300是示例性的,也可以使用具有不同字段的其他注释结构。例如,在某些实施例中,注释可包括压缩或未压缩形式的主题页面的内容的一部分或全部的表示。在其他实施例中,用户可以将描述连接到主题页面的内容的特定部分,并且描述所连接到的部分可被存储在注释中。在另一实施例中,搜索服务器160还可以根据某种分类法对页面或站点分类,并且这种分类数据可被保存为注释的一部分。
与主题页面(或站点)有关的其他元数据也可以被收集在注释记录中,并且在用户继续浏览时被自动更新。例如,可以提供计数器来对用户访问其已注释的页面或站点的次数计数。计数器和/或最后访问的时间戳可以在每次用户访问页面或站点时自动更新。在某些实施例中,只有那些在用户登录到搜索服务器160中的同时发生的访问才导致自动更新。
注释条目可以采取适合于存储在个人化数据库166中的任何格式(例如关系数据库方案、XML记录等),并且可通过引用各种字段来访问。在一个实施例中,注释记录可通过至少作者ID、URL、标题和关键字来访问。
2.收集注释数据
可以用多种方式从用户收集注释,这些方式的示例在上面引用的申请No.____(律师案卷号No.017887-013720US)中有所描述。如这里所描述的,用户可以选择注释在配备有合适的工具栏的Web浏览器客户端中显示的任何页面,或者用户可以选择注释出现在搜索命中列表中的页面。
在本发明的实施例中,任何合适的技术都可用于从用户收集关于单个页面(或页面组)的描述性和/或评估性的元数据并将该元数据与提供元数据的用户和主题页面(或页面组)相关联。在每个用户访问并注释各种页面或站点时,每个用户构建该用户感兴趣的个人内容“库”(library),并且每个用户可以查看并编辑其自己的库,例如在上面引用的申请No.____(律师案卷号No.017887-013720US)中描述的。
3.注释的组织
在某些实施例中,用户可以利用文件夹来组织其注释。例如,每个用户可以具有“主”(Main)文件夹,用户的新注释默认放置到主文件夹中。用户可以按需要创建附加文件夹。在某些实施例中,用户还可以定义文件夹内的子文件夹。用于创建并管理文件夹的用户界面可以是传统的设计。
在一个实施例中,每个文件夹在个人化数据库166中利用文件夹条目定义。图4图示了根据本发明实施例的文件夹条目400。文件夹条目400包括提供对注释和/或属于文件夹400的子文件夹的引用(例如持久指针)的引用字段404;链接列表或其他合适的数据结构可用于实现引用404。
文件夹条目400还有利地包括可用于文件夹管理的其他字段。在一个实施例中,这些字段包括存储文件夹所属的用户的用户ID的“作者ID”字段406和存储用户提供的文件夹名(例如,上限为80个字符)的“名称”(Name)字段408。“名称”字段408可以默认是“新建文件夹”(New Folder)或某些其他合适的串。“描述”(Description)字段410存储用户可编辑的对文件夹目的或内容的自由文本描述;该字段可默认为空状态。“活动”(Active)字段412存储指示该文件夹中的注释是否应当用于对查询作出响应的标志(例如布尔值)。
“公布标志”(Publication flag,字段414)、“私密性级别”(Privacy level)字段416和“访问列表”(Access List)字段418都与注释的共享有关,在某些实施例中其可以以每文件夹为基础加以控制。字段414中的公布标志指示文件夹400中的注释是否应当经由公布机制自动分发给其他用户;公布将在下面描述。字段416中的私密性级别和字段418中的访问列表被用于控制文件夹中的注释应当可由其他用户查看的程度。私密性级别的示例和其重要性将在下面描述。
应当意识到,文件夹格式可以变化,并且可以包括其他字段。除了“主”文件夹外,用户可以自由地创建、重命名和删除文件夹。在某些实施例中,多个文件夹可以存储对相同注释的引用;在其他实施例中,每个注释一次只分配给一个文件夹,并且用户可以将注释从一个文件夹移动到另一个,或者在不同文件夹中创建注释的拷贝。在某些实施例中,每个注释条目还可以包括存储返回到对注释被分配给的(一个或多个)文件夹的引用的“文件夹ID”(folder ID)字段。
尽管文件夹是可选的,但是提供文件夹允许用户对搜索体验的控制度更大。例如,用户可以在多个文件夹中安排其注释,并且对于文件夹中的一个或多个将活动标志(字段412)设为真(true),而对于其他文件夹设为假(false)。当用户输入查询时,只有(一个或多个)活动文件夹中的判断会影响结果。用户还可以使用文件夹来以与各种Web浏览器程序或因特网入口服务所支持的书签或其他个人站点列表在某种程度上类似的方式收集并组织注释页面。在优选实施例中,这里描述的文件夹和注释数据是由搜索服务器160为用户维护的,并且对于用户可用,而无论用户访问搜索服务器160的位置如何。
在另一个实施例中,不使用文件夹,而是基于注释记录中的用户提供的关键字或标签来管理注释的使用。例如,活动标志、公布标志和/或私密性设置可以按关键字而不是按文件夹来定义。
II.经由信任网络共享注释
如在上面引用的申请No.____(律师案卷号No.017887-013720US)中描述的,每个用户收集的注释可以在该用户浏览Web时对于该用户可用。例如,在用户查看其已注释的站点的同时,其可能也能够同时查看和/或编辑其注释。作为另一个示例,搜索结果页面可以包括可视或其他突出显示的元素以标识用户已注释的命中页面,或者可以报告从用户对各种命中页面的注释中提取出的元数据。作为另一个示例,除了页面内容和其他传统因素外(或替代页面内容和其他传统因素),还可以使用用户注释来识别搜索命中和/或对搜索命中分级。
在本发明的实施例中,除了其自己的注释外,用户还可以查看由其他用户创建的注释。其注释要被第一用户查看的用户的集合在这里被称为第一用户的“信任网络”,并且在优选实施例中,每个用户可以对其信任网络的成员资格进行至少某种程度的控制。下面将描述用于定义用户的信任网络的技术示例。
A.信任网络的创建
1.交际网络模型
在某些实施例中,用户的信任网络是基于由各个用户对之间的信任关系构建的交际网络定义的。每个用户可以明确地定义与一个或多个其他用户(在这里被称为第一用户的“朋友”)的信任关系。基于各个用户的信任关系,可以定义经由信任关系将用户与其他用户相连的交际网络,并且可以将发源于给定用户的交际网络的一部分定义为该用户的信任网络。在这种实施例中,给定用户的信任网络通常包括(除了其自身外)用户的朋友,并且还可以包括用户朋友的朋友等等。在某些实施例中,所有信任关系都是相互的(即,用户A和B只有在彼此都同意信任对方时才是朋友);在其他实施例中,也可以定义单向信任关系(即,用户A可以将用户B看作朋友,而无论用户B是否将用户A看作朋友)。任何用户都可将第一用户相信其注释对于他来说有价值的任何其他用户定义为朋友。
从由各个用户定义的信任关系,可以构建“交际网络”,并且可以将交际网络的全部或一部分选择为给定用户的信任网络。通常,交际网络可由网络图500代表,例如如图5所示。网络图500包括节点501-509,每个节点代表不同的用户(在该示例中,用户由字母A-H标识)。连接节点对的边(箭头)代表用户之间的信任关系;从而,用户A信任用户B、C、D和I;用户B信任用户C和E,等等。在该示例中,信任关系是单向的;双向信任关系(例如,用户A和C之间)利用两条边代表。应当理解,网络图500是示例性的。交际网络可以包括任何数目的用户和任何数目的信任关系,并且一个用户可以定义与任何数目的其他用户的信任关系;信任关系可以是单向或双向的。
在本发明的一个实施例中,用户A能够查看其自己的注释以及由其任何朋友创建的注释。在另一个实施例中,用户A还能够查看由其朋友的朋友创建的注释。例如,在用户A和用户E之间没有直接的信任关系。但是,用户A信任用户B,用户B又信任用户E。从而,可以说用户A对用户E有“间接的”信任关系,并且来自用户B和E的注释都可被用户A看见。
更一般地,当前的描述涉及具有N分离度的信任关系,其中N是等于连接交际网络中的用户的边的最小数目的整数。N=1对应于直接信任关系(例如,用户A和B之间的关系);N>1对应于间接信任关系。为了描述目的,用户A可被当作其自己的交际网络的成员,其N=0。在本发明的某些实施例中,浏览Web的用户(例如用户A)可以查看并编辑其自己的注释,并且还可以查看(但不编辑)由其交际网络中的其他用户创建的注释(最高可达某个最大分离度,例如N=1、2、3或更大)。
在某些实施例中,用户A可以为其每个信任关系分配不同的“信任权重”。信任权重可以按不同的刻度定义,例如从1到10的整数等等。信任权重有利地反映了用户A对于其每个朋友的注释的置信量;通常,较高的信任权重反映较高的置信度。
在定义信任权重时,该信息也可以用于定义信任网络。例如,信任传播算法可用于向交际网络中的用户分配“置信系数”p;用户X相对于用户A的置信系数pXA通常是基于用户A已分配给其朋友的信任权重、用户A的朋友已分配给他们的朋友的信任权重等等的。信任传播算法的示例是本领域中已知的,并且可用于生成置信系数。其他用户相对于用户A的置信系数还可以基于分离度确定,例如通过假定用户A的每个朋友的信任权重相等,然后利用信任传播算法来确定每个信任网络成员的置信系数,或者通过给距离用户A给定分离度的每个用户分配相等的置信系数。在一个实施例中,用户A的信任网络中的成员限于其置信系数pXA超过某一阈值的用户X,而无论其与用户A的分离度是多少。信任权重和置信系数的其他应用将在下面描述。
2.朋友的明确识别
在一个实施例中,信任网络模块165(图2)提供一个用户(例如用户A)可以用来明确识别其他用户为其朋友以便定义其信任网络的界面。该界面可包括在请求时提供给用户的网页,并且用户有利地被要求在接收到界面页面之前登录到搜索服务器160。
图6是根据本发明实施例的信任网络界面页面600的示例。页面600提供用户查看并修改其朋友列表以便利用交际网络模型定义信任网络的各种机制。用户A的朋友的当前列表显示在部分602中。对于每个朋友,列表条目604包括用户ID、描述和信任权重。描述字段可由用户A以任何期望的信息填充,例如朋友的真名、与用户A的关系等等。部分602可被实现来支持通过其任何一个字段分类,并且可以包括关于每个朋友的其他信息,如每个朋友拥有的朋友成员数目或者指示该朋友何时被添加到列表的时间戳(未示出)。用于填充列表602的信息可以例如存储在个人化数据库166内的适当记录中,并且可以响应于用户请求而被信任网络模块165检索。
也可以提供其他信息。例如,在某些实施例中,部分602中的每个条目604包括指示该朋友是要包括在用户A的信任网络中(笑脸图标)还是被忽略的(“not”图标)的“活动”标志605。这允许用户A忽略朋友的注释,而不从列表中移去该朋友。例如,用户A的相同的朋友列表也可以用在另一种交际网络环境中,并且用户A可能希望另一用户(例如用户D)在该其他上下文中处于他的朋友列表上,但是不是为了查看注释的目的。在某些实施例中,用户A可能还能够选择是包括(使用)还是忽略(不使用)来自每个朋友的朋友的注释,并且条目604可以显示该信息。
每个条目伴有“编辑”(Edit)按钮606和“删除”(Delete)按钮608。激活按钮606打开了对话框(或表格页面),用户A可以经由该对话框更新关于朋友的任何信息,随后保存或取消变化。激活按钮608从用户A的列表中移去该朋友。
还提供了“查看网络”(View Network)按钮609。激活按钮609启动了用户A的信任网络的交互显示,包括其朋友以及达到最大分离度的朋友的朋友、最小置信系数或其他用于限定信任网络的限制参数。显示有利地包括将在用户A的信任网络中的所有用户(即,其注释可被用户A看见的所有用户),并且还可以显示用户A从其信任网络中阻隔的用户(例如用户D)。
在一个实施例中,显示包括类似于图5的网络图,该图或其他显示是可编辑的。例如,用户A可被允许删除节点,从而表明由该节点代表的用户应当被从其信任网络中排除。在一个实施例中,在节点代表用户A的一个朋友的情况下(例如,如果作为编辑用户的用户A要删除节点504),删除节点则从用户A的朋友列表中移去了该朋友(例如用户D);在另一个实施例中,删除节点仅仅将该朋友的“活动”标志605设置为不活动状态。在节点是朋友的朋友的情况下(与用户A分离度大于1的任何节点),删除节点具有使该用户的注释对于用户A不可见的效果,但是不改变任何信任关系。相反地,将特定用户标识为“阻隔的”(blocked)的特殊条目有利地被添加到个人化数据库166中针对用户A维护的朋友列表中。例如,如果作为编辑用户的用户A要删除节点507,则用户G将停止作为用户A的信任网络的成员,但是用户C和用户G之间的信任关系将不受影响,并且用户G仍然在用户C的信任网络中。从而,用户A可以通过选择性地阻隔用户A发现其注释无用的个体成员,来调节其信任网络。在某些实施例中,阻隔一个成员还具有阻隔只经由该被阻隔成员连接到信任网络的其他成员的效果。
再参考图6,页面600还包括部分610,用户A可经由部分610添加新的朋友。用户A在文本框612中输入新朋友的用户ID,在文本框614中输入描述,并且在框616中输入信任权重。在某些实施例中,信任权重可以具有默认值(例如,按1-5的刻度是3)。用户A还可以经由复选框618选择是否在其信任网络中包括新朋友的朋友。激活“添加”(Add)按钮620完成了该操作,并且部分602中的列表被有利地刷新以包括新的朋友。
一旦被定义,用户A的朋友列表就与用户A的其他用户特定的信息相关联地被存储在例如个人化数据库166中。该信息随后可被访问,并被用于个人化或定制对该用户查询的响应。
应当意识到,这里描述的界面是示例性的,也可以有变化和修改。例如,在某些实施例中,只有在一个新的朋友同意被添加时才可添加该朋友。从而,用户A激活添加按钮620可能不会立即将任何朋友添加到用户的列表中。相反地,可以经由电子邮件、即时消息或其他合适的通信介质向A所指定的用户(例如用户K)发送邀请,并且用户K可以用关于其是否接受邀请的指示作出响应。如果用户K接受,则将建立用户A和K之间的双向朋友关系,例如通过将每个用户添加到另一用户的朋友列表中;如果不接受,则不会建立新的朋友关系。
3.朋友的自动识别
在某些实施例中,信任网络模块165还可以通过挖掘各种信息源以识别用户A自愿与之联系的其他用户,来自动生成用户A的朋友列表。
例如,在一个实施例中,搜索服务器160的提供者还提供诸如电子邮件、IM(即时消息)等的通信服务。如本领域中所知的,这些服务可以允许用户A维护A期望与之联系的用户列表。例如,如果用户A注册了提供者的IM服务,则用户A可以定义“朋友”列表(有时也称为“密友”列表),其是用户A希望与之交换即时消息的其他注册用户的用户标识符列表。在用户A的IM朋友列表上包括用户B(或任何其他用户)指示从用户A到用户B的连接,并且表明用户B可能是用户A的朋友。类似地,如果用户A注册了提供者的电子邮件服务,则用户A可能维护个人电子邮件地址簿,其标识用户A与之交换电子邮件的用户。在用户A的地址簿中包括用户C(或在搜索服务器160上注册的任何其他用户)也将指示从用户A到用户C的连接,并且表明用户C可能是用户A的朋友。
在另一个实施例中,搜索服务器160的提供者还允许注册用户加入在线团体,在线团体的成员可以利用公告板、聊天室、电子邮件分发列表等彼此通信。如果两个用户(例如A和B)都是同一在线团体的成员,则可以推断出在用户之间有某种关联,并且双向的朋友关系可能是适当的。
这些技术中的任何一种或全部都可用于自动填充用户的朋友列表。在某些实施例中,可以利用上述中的任何一个或其他关系信息源预先填充用户的朋友列表,然后用户可以例如经由页面600编辑列表(如上所述)。在关系被自动定义的情况下,页面600有利地指示(例如在描述字段中)从其推断出关系的源,并且还可以指示关系是自动定义的。在要求相互同意以建立朋友关系的实施例中,任何关系数据源都可被挖掘,并且被用作向各种用户对发出邀请以变为朋友的基础,其中一旦两方用户都接受则建立关系。
在其他实施例中,用户的朋友列表不是默认预先填充的,并且用户可以选择哪些关系信息源(如果有的话)(例如,IM朋友列表和/或电子邮件地址簿和/或团体成员资格信息)应当被用于自动填充列表。其后,用户可以编辑列表。
4.朋友的收集的选择
在其他实施例中,信任网络是基于明确定义的用户组或用户团体之间的暗示信任关系定义的。这里所用的“团体”指搜索服务器160可以针对其获得成员的用户ID的列表并将这些ID与注释作者相关联的任何进行中的论坛。一般来说(但是并不一定),团体使用由搜索服务器160的提供者管理的至少一种基于网络的通信介质,如基于下标的电子邮件分发列表、仅限成员的聊天室、公告板等等。在一个实施例中,团体对应于Yahoo!群组,但是也可以使用其成员身份可由搜索服务器160确定的任何其他在线团体;更一般地,任何提供明确定义的成员资格列表的组织或论坛都可用作团体,只要搜索服务器160可以将成员资格列表中的用户标识符映射到注释系统中的参与者的用户标识符即可。
在某些实施例中,用户A的信任网络被定义为包括当前是用户A所属的团体的成员的所有用户。在某些实施例中,用户A可能能够经由合适的界面(未在图6中示出)选择用户A是其成员的一个或多个团体用作其信任网络。某些实施例可以允许用户A查看并编辑从选定的(一个或多个)团体的团体成员列表中导出的个人朋友列表(例如如上所述),但是并不要求用户A能够编辑甚至查看团体成员列表。从而,用户A可以选择其所属的任何团体作为其信任网络,即使没有关于该团体的其他成员的信息也可以,并且在成员加入并离开选定团体时,用户A的信任网络的成员资格可以自动改变(无论用户A是否知晓)。
在用户A的信任网络是通过参考团体定义的情况下,用户A可能能够阻隔来自个体成员的注释,从而有效地从其信任网络中移去这些注释。例如,当显示信任网络成员的注释时,显示界面可包括控件,用户A可以经由控件指示搜索服务器160在未来阻隔作者的注释。在这种实施例中,个人化数据库166可包括(对于每个用户)用于定义用户的信任网络的(一个或多个)团体的列表以及其注释应当被阻隔的用户的“黑名单”。
在用户A的信任网络通过参考团体定义的情况下,所有团体成员都可被当作距离用户A具有相同的分离度(例如N=1)。在某些实施例中,所有成员最初还被分配以相等的信任权重,并且用户A可能能够(也可能不能)经由合适的界面手工调整个体成员的信任权重(例如,类似于上述的页面600)。
在其他实施例中,每个团体成员可被分配以团体内的“名誉分数”(reputation score),并且给定成员的名誉分数可被用作该成员的置信系数。名誉分数可以用各种方式确定。在一个实施例中,团体成员的名誉分数是基于其在团体中的参与级别的(例如,在公告板或电子邮件分发列表中发贴的频率或者在聊天室中参与的频率,等等)。在另一个实施例中,团体成员可能能够明确地评价其他成员的可靠性,并且每个成员的名誉分数可以是基于这种评价的(例如见下面的第IV.C部分)。在另一个实施例中,团体成员可能能够评价其他成员的注释(但是不编辑),并且成员的名誉分数可以是基于由团体的其他成员给予其注释的评价的。
5.用户对信任网络的偏好
在某些实施例中,信任网络模块165允许每个用户指定与应当如何定义其信任网络并且应当如何使用其信任网络有关的各种参数。例如,在图6的页面600中,部分624允许用户控制信任网络的设置。例如,利用单选按钮626,用户可以指示信任网络成员资格是否应当基于分离度或置信系数确定。在某些实施例中,用户可能还能够指定在某范围内的最大分离度(例如,Nmax=1、2或3)或最小置信系数(例如,pmin=0.2、0.4或0.8)。复选框628、630和632允许用户指定从其信任网络获得的信息应当被显示的情形。例如,用户可以基于从其信任网络获得的信息选择是否使搜索结果被突出显示和/或排序(框628、630),以及浏览器工具栏是否应当指示被显示页面是否已由其信任网络中的某人加以注释(框632)。这些操作的示例将在下面描述。
应当意识到,可以支持其他用户偏好和偏好的组合。例如,用户可能能够指定其信任网络是应当利用明确的朋友列表从交际网络模型构建,还是应当从其所属的团体暗示地构建。
B.到信任网络注释的工具栏界面
图7是根据本发明实施例用于针对用户正好在查看的任何页面由信任网络成员注释和/或查看现有注释的基于工具栏的界面的示例。Web浏览器窗口700包括传统的元素,如用于显示Web内容的查看区域702、提供导航按钮(后退、前进等)的默认工具栏704和显示当前显示的页面的URL并且还允许用户输入不同页面的URL以显示在查看区域702中的导航区域704。浏览器窗口700还包括搜索工具栏706,搜索工具栏706可被提供作为传统的浏览器程序中的附加项或者作为浏览器程序的标准特征。
搜索工具栏706有利地包括文本框708和“搜索Web”(SearchWeb)按钮709以及“已保存列表”(List Saved)按钮710和“保存”(Save This)按钮712,用户可以经由“搜索Web”按钮709向搜索服务器160(图2)提交查询,“已保存列表”按钮710允许用户查看其自己保存的注释并且导航到其已注释的页面,“保存”按钮712打开允许用户注释当前显示的页面的页面或对话框。搜索工具栏706的这些方面通常可以类似于在上面引用的申请No.____(律师案卷号No.017887-013720US)中描述的特征。这里所用的“保存”页面指创建并存储页面的注释,并且可能包括(也可能不包括)保存页面内容的拷贝。
在某些实施例中,搜索工具栏706还包括“显示我的Web”(ShowMy Web)按钮714,每当浏览器正在显示浏览用户或其信任网络的另一个成员先前已经注释的页面时,该按钮就以活动状态出现;浏览用户可以操作按钮714以查看由其信任网络的任何成员输入的先前的注释。在注释包括评价的情况下,按钮714的外观可以部分依赖于由信任网络成员给予当前显示的页面的评价。例如,所有信任网络成员的平均评价可能由包括在按钮714中的图标反映。在优选实施例中,按钮714只有在当前显示的页面已由用户的信任网络的至少一个成员注释时才是可操作的。
图8图示了在激活按钮714时可能启动的对话框或覆盖图800。覆盖图800基于来自浏览用户(例如用户A)的信任网络的成员的注释,提供了关于当前显示的页面的注释信息。在部分802中,显示了来自由用户A的信任网络的“最近的”(closest)成员保存的注释的元数据。
“最近的”成员可以用各种方式定义。在一个实施例中,邻近度主要基于分离度(N)从而相对于用户A具有最小的N的信任网络成员被定义为最近的。(注意,由于根据定义用户A是A的信任网络中唯一N=0的成员,因此如果用户A已注释了页面,则用户A自己的注释将被显示在部分802中。)在通过参考N结果定义最近用户出现平局时,其他参数(例如信任权重、置信系数、或者关系已存在了多久)可用于确定哪一成员是最近的。在另一个实施例中,置信系数可用于定义邻近度,而其他参数(例如分离度)被用于打破平局。应当意识到,“最近成员”的具体定义对于本发明来说是不重要的。
在部分802下面是已注释了显示页面的其他信任网络成员的列表。有利地提供了用于显示每个这种成员的注释的可点击链接。在优选实施例中,不允许浏览用户编辑由其他用户输入的注释,但是可允许其编辑其自己的注释(例如,通过在覆盖图800中包括启动编辑界面的“编辑”按钮,“编辑”按钮只有在浏览用户自己的注释被显示在部分802中时才是可操作的)。
部分806提供了针对浏览用户的信任网络聚合的元数据。在一个实施例中,聚合的元数据包括页面或站点的平均评价和描述页面或站点的关键字列表。平均评价例如可通过计算评价的加权平均来计算,其中每个信任网络成员的评价由该成员相对于浏览用户的置信系数加权。(为了计算平均评价,有利地忽略了不注释页面的任何信任网络成员。)关键字的列表可通过识别在所有信任网络成员的注释中最频繁出现的关键字来生成;每个关键字的出现频率可通过将使用该关键字的信任网络成员的置信系数相加来计算。在其他实施例中,聚合算法也可以考虑其他因素,如给定注释的新近程度(注释越久远,权重越低)等等。
“关闭”(Close)按钮808关闭覆盖图800,覆盖图800可以在任何时刻通过激活按钮714重新打开。
应当意识到,这里描述的工具栏界面是示例性的,也可以有变化和修改。除了(或替代)以上示出的那些,搜索工具栏706还可以包括其他组件。另外,可以换用任何其他的持久界面(即,在用户查看任何网页的同时可以访问的界面);不需要搜索工具栏。在替换实施例中,通知浏览用户关于注释的存在情况的界面元素可以传递其他信息。例如,界面元素可以标识已注释页面的最近的信任网络成员和/或指示已注释页面的信任网络成员的数目。这些信息也可以包括在覆盖图800中。元素还可以指示最近的成员是浏览用户还是另一个用户。注释数据不需要显示在覆盖图中;也可以使用对话框、新的浏览器窗口、现有浏览器窗口中的新附签等等,或者注释数据可以以内嵌方式添加到页面中。或者,当前的浏览器窗口可被重定向到包含注释数据的页面。
在某些实施例中,搜索工具栏706可被配置使得其可在“通用”状态中由未登录到搜索服务器160的用户使用,并且可在“个人化”状态中由已登录的用户使用。在通用状态中,工具栏提供了对基本搜索服务的访问(例如,经由文本框708和“搜索”(Search)按钮709),并且还提供了允许用户登录以访问个人化服务的按钮。在个人化状态中,通过工具栏可以支持个人化特征。例如,“保存”按钮712可以只在工具栏706的个人化状态中提供;或者,按钮712也可以在通用状态中提供,并且如果在工具栏处于通用状态的同时按钮712被激活则浏览器被重定向到登录页面。
C.到信任网络注释的搜索报告界面
在某些实施例中,用户的信任网络成员进行的注释的存在情况可以被包括在报告由该用户输入的查询的搜索结果的页面中。图9A是根据本发明实施例利用注释信息增强的搜索结果页面900的示例。结果页面900可以由查询响应模块162响应于用户的查询而生成。在该实施例中,结果页面900包括横幅部分902。除了页面标识信息外,横幅部分902还包括以可编辑形式示出了当前查询(例如“Chinese food sunnyvale”)的搜索框904以及使得用户能够改变查询并执行新的搜索的搜索按钮906。这些特征可以采用传统的设计。
部分908是个人化(“我的Web”(My Web))结果区域,其中显示了查询用户的信任网络成员先前已注释的任何命中。在某些实施例中,部分908可以只显示信任网络的聚合评价(例如,如上参考图8所述)是正面的那些命中;在其他实施例中,在部分908中可以列出所有注释的命中。每个注释的命中有利地伴随有“显示我的Web”按钮910,用户可以激活该按钮以查看成员的注释。在一个实施例中,激活按钮910启动了类似于上述图8的覆盖图800的覆盖图。
“所有结果”(All Results)部分916显示了具有由查询响应模块162确定的等级的某些或全部命中(包括注释和未注释的命中)。传统的分级算法可用于生成该等级。部分916中的每个条目918对应于其中一个命中,并且包括命中页面(或站点)的标题和该页面内容的简要摘录(或摘要)。摘录或摘要可以利用传统技术生成。还显示了命中的URL(统一资源定位符)。对于信任网络成员都未注释的命中来说,可以显示“保存”按钮919,并且在查看页面900的同时,用户可以通过激活按钮919选择对未注释命中进行注释。“保存”按钮919在操作上有利地类似于上述图7中的按钮712。
部分916中的任何已注释命中可被可视地突出显示以指示注释的存在情况,并且还可以包括“显示我的Web”按钮910。另外,对于查询用户的信任网络的其他成员都已注释了命中但是查询用户还未注释的每个命中来说,还可以提供“保存”按钮919。
可以使用用于突出显示已注释命中的各种设计,例如包括边界、阴影、特殊字体、颜色等等。在注释包括评价的某些实施例中,突出显示的类型依赖于信任网络的聚合评价,并且聚合评价也可以被显示在页面900上。例如,命中920具有正面评价,而命中922具有负面评价。在其他实施例中,其他的聚合元数据和/或来自信任网络的个体成员的元数据也可被包括在页面900上。
在其他实施例中,比仅仅突出显示更多的信息可以出现在搜索结果页面上。图9B是在“我的Web”部分948中提供了信任网络成员作出的意见的摘录的另一个搜索结果页面940的示例。每个命中950伴随有从信任网络成员作出的注释中提取出的意见952。在该实施例中,示出了两个意见;附加意见或关于注释的更多信息可以通过点击“更多”(More)按钮954来查看。在查询用户还未注释命中的情况下,可以提供“保存”按钮956。搜索结果页面940还可以包括“所有结果”部分(未示出)和其他信息。
应当意识到,这里描述的搜索结果页面是示例性的,也可以有变化和修改。以适合于发送给用户的任何格式作出的任何报告都可以替换搜索结果页面900,并且从这里示出的内容可以变化出用于与搜索报告交互的各种界面控制元素。注释元数据的任何一部分(包括全部)可以以内嵌方式包括在页面中和/或可以经由合适的界面控件访问。在某些实施例中,用户可能能够在发送给其的搜索报告中设置与注释相关信息的外观有关的个人偏好。
D.增强的Web搜索
在一个实施例中,搜索服务器160(图2)当响应于来自用户的查询时,访问用户的信任网络成员的注释库以提供额外信息。例如,如上所示,已注释命中的单独列表(即,在至少一个信任网络成员的库中对应于已注释页面的命中)可以被包括在搜索结果中,或者已注释命中可被突出显示,无论其恰好出现在结果列表中的何处。在注释包括评价的情况下,可以提供正面评价的命中的单独列表,被评价的命中可以以反映查询用户的评价的方式被突出显示,或者评价数据可用作对命中分级的一个因素。
图10是可以实现在查询处理模块162(图2)中的过程1000的流程图,其用于将信任网络成员的注释结合到对来自查询用户的当前查询的响应中。在步骤1002,接收到查询。在步骤1004,例如从页面索引170(图2)获得对应于查询的命中列表。在步骤1006,查询处理模块162例如利用传统算法对命中分级。
在步骤1008,查询处理模块162确定查询用户是否已登录。如果没有,则查询处理模块162可以在步骤1010将结果页面发送到查询用户而不进行个人化,从而使用户能够执行搜索并获得结果而无需登录到(或者甚至无需注册到)搜索服务器160。如果用户已登录,则基于个人化数据库166中的信息针对该用户定制结果页面。
更具体而言,在步骤1012,查询处理模块162向个人化数据库166提供查询用户的ID,并且检索用户的信任网络成员的列表。在一个实施例中,步骤1012包括利用信任网络模块165动态地构建信任网络成员的列表。例如,在信任网络要从朋友列表构建并且扩展到距离查询用户最大分离度(Nmax)的情况下,步骤1012可能包括通过首先从个人化数据库166获得查询用户的朋友列表并针对每个朋友定义网络节点来创建网络图的表示。在Nmax=1时,信任网络成员的识别可停止于此;对于Nmax>1,获得每个朋友的朋友的列表,并定义额外节点等等,直到到达最大分离度。应当注意,对于足够大的Nmax,信任网络成员的数目可能扩展到搜索系统的所有用户,并且可能希望限制Nmax或信任网络成员的总数从而避免注释过度地淹没查询用户。
在其他实施例中,在信任网络是通过参考团体定义的情况下,步骤1012可能包括从个人化数据库166或者搜索系统160可访问的另一个数据存储中检索该团体的当前成员资格列表。在其他实施例中,步骤1012包括从个人化数据库166中检索预先构建的查询用户的信任网络成员的列表。
在信任权重和/或置信系数被用于识别信任网络成员或使用信任网络信息的情况下,步骤1012还可以包括确定信任权重和/或置信系数。
在步骤1013,从个人化数据库166中检索由信任网络成员创建的注释,并且在步骤1014,将检索到的注释的URL与命中的URL相比较以检测与至少一个信任网络成员先前已针对其创建了注释的URL相匹配的任何命中。这些命中在这里被称为已注释命中。对于主机标志被设为“站点”(site)的注释,如果命中URL的开头部分与存储在注释中(例如,在图3的URL字段308)的URL(或部分URL)相匹配,则检测到匹配(这里也称为“部分匹配”)。如果主机标志被设为“页面”(page),则要求注释的URL和命中URL之间有“精确”匹配。除非特别指出,否则这里所用的“匹配”既包括部分匹配,也包括精确匹配。
在注释包括评价的实施例中,对于每个已注释命中,在步骤1015计算平均评价或聚合评价。如上所述,聚合评价可以是已注释命中的所有信任网络成员的加权平均(由置信系数加权)。评价也可以基于新近程度或其他标准加权。在步骤1016确定聚合评价是否是正面的。如果是,则该命中被添加到正面结果(“我的Web”)列表。在其他实施例中,所有已注释命中(无论其评价如何)都可被添加到“我的Web”列表。
在步骤1020,利用聚合评价可选地对结果列表重新分级。例如,在分级期间,可以利用传统分级算法为每个命中生成(无论是否已注释)生成基本分数。对于具有正面或负面聚合评价的命中,可以从评价中确定“奖励”(bonus)。奖励有利地被定义为使得正面评价的站点趋向于在等级中向上移动,而负面评价的站点趋向于向下移动。例如,如果低分数对应于高等级,则正面评价的奖励可被定义为负数,而负面评价的奖励可被定义为正数。在某些实施例中,部分URL匹配可能被给予比精确URL匹配少的奖励。未评价的(或中立评价的)命中不接收奖励。该奖励可被添加到(以代数方式)基本分数以确定每个命中的最终分数,并且新的分级可以是基于最终分数的。
在某些实施例中,在步骤1020重新分级还可以包括从要显示的命中列表中丢弃具有负面聚合评价的任何已注释命中。在这些实施例中,传递给用户的搜索结果页面可包括由于负面聚合评价而丢弃的命中数目的指示和/或“显示所有命中”(Show all hits)按钮(或其他控件),其允许用户查看包括负面评价的命中的被显示的搜索结果。在另一种变化中,用户可以点击链接以仅查看负面评价的命中。
在步骤1022,“我的Web”列表被分级并被添加到搜索结果页面。在某些实施例中,该分级可以是基于上述基本分数或最终分数的。在其他实施例中,“我的Web”列表中的命中由聚合评价分类;具有相同评价的命中可进一步根据上述基本分数分类。在其他实施例中,“我的Web”列表中的命中主要基于注释该命中的信任网络成员的数目、哪一个命中具有来自最近成员的注释等等来分类。
在步骤1024,基于注释的存在情况修改搜索结果页面;例如,上述的突出显示和/或“显示我的Web”按钮可被添加到已注释命中。该修改后的搜索结果页面(在这种情况下包括个人化的“我的Web”部分)在步骤1010被发送到用户。
应当意识到,这里描述的过程是示例性的,也可以有变化和修改。可以并行执行顺序描述的步骤,可以变化步骤的顺序,并且可以修改或组合步骤。在某些实施例中,在来自查询用户的明确请求之前,命中的某些或全部注释内容、或者命中的聚合元数据可以以内嵌方式显示在搜索结果页面中。例如,可以显示指示正面或负面聚合评价的可视突出显示元素,或者聚合关键字可以出现在自动生成的摘要下方,等等。另外或者可替换地,可以显示来自个体信任网络成员的注释的元数据(无论是否归于其各自的作者)。在其他实施例中,搜索结果页面可以指示哪些信任网络成员已注释了每个已注释命中。
在其他实施例中,信任网络成员的注释可用于在搜索操作期间识别命中。例如,除了搜索页面索引170外,查询响应模块162还可以利用与用来搜索页面索引170相同的搜索项中的某些或全部来搜索信任网络成员的注释的选定字段。在一个这样的实施例中,搜索注释的关键字和/或描述字段,并且如果搜索项出现在这些字段之一中,则将已注释页面识别为命中,无论在页面索引170的搜索中是否已将该已注释页面识别为命中。在另一个实施例中,也可以搜索聚合元数据(例如,如上所述在信任网络上聚合的关键字)。
E.在个人Web中搜索
在某些实施例中,查询用户可以搜索已由其信任网络的成员注释的内容,而不是整个Web。例如,图7的搜索工具栏706包括文本框706和可用于提交用于搜索整个Web的查询的“搜索Web”按钮704。搜索工具栏706还包括可用于搜索由用户的信任网络成员注释的内容的“我的Web”按钮720。这种内容在这里被称为“个人Web”(Personal Web),并且通常,在不同用户具有不同信任网络的情况下,不同用户也会具有不同的个人Web。在一个实施例中,登录到搜索服务器160的用户可以在文本框706中输入查询,然后激活按钮709以搜索整个Web或激活按钮720以搜索其个人Web。在后者的情形中,搜索可能一般类似于传统的Web搜索,除了只显示具有来自查询用户的信任网络的至少一个成员的关联注释的命中以外。个人Web搜索选项也可以通过其他界面提供,例如从传统的搜索界面页面或从搜索结果页面提供。
在另一个实施例中,除了或替代页面内容,查询用户还能够搜索其个人Web的注释。例如,搜索工具栏706可能包括启动个人Web搜索界面的按钮(没有明示),查询用户可以经由该按钮定义搜索的期望范围。
图11是根据本发明实施例的个人Web搜索界面页面1100的示例。页面1100提供了用户的个人Web内的字段特定的搜索的用户界面。范围部分1102允许用户指示搜索是应当包括来自其他信任网络成员的已注释内容,还是只是用户自己的已注释内容,或者包括整个Web,其中包括来自所有用户的已注释内容。“显示我的信任网络”(Show My TrustNetwork)按钮1104有利地允许用户导航到“我的信任网络”(My TrustNetwork)页面600(图6)或类似的页面,然后返回到页面1100,用户可以经由页面600或类似页面查看和修改其当前的信任网络定义。在某些实施例中,用户可能还能够查看其信任网络成员的列表并选择一个或多个个体成员,从而将搜索限制到那些成员的注释。
页面1100的查询部分1112提供了各种文本框,用户可以向文本框中输入搜索项以搜索页面内容和/或搜索注释中的特定字段。在该示例中,用户可以单独指定用于页面内容(文本框1114)、注释标题(文本框1116)、关键字字段(文本框1118)、描述(文本框1120)和/或介绍(文本框1121)的搜索项。单选按钮1122可用于约束命中的评价(例如,上述的聚合评价或平均评价)。在默认时,选择“任何评价”(Anyrating),从而评价不限制搜索;用户可以选择将搜索限制为例如具有正面评价的命中或具有负面评价的命中。“搜索”按钮1126提交查询以供处理,“重置”(Reset)按钮1128清除查询部分1112中的所有字段。
应当理解,用户可以使部分1112中的某些或全部文本框为空;在文本框为空的情况下,相应字段不被用于约束搜索。例如,用户可以通过在文本框1114中输入搜索项并使其他文本框为空来搜索其个人Web的页面内容;实际的搜索可以利用页面索引170执行,并且在将结果发送给用户之前丢弃不对应于已注释页面或站点的任何命中。搜索结果有利地利用类似于上述页面900(图9A)或940(图9B)的搜索结果页面被传递,除了在搜索被限制为用户的个人Web时,每一个命中都有至少一个注释。
图12是根据本发明实施例用于响应于经由页面1100或用于搜索个人Web的另一个界面提交的查询的过程1200的流程图。在步骤1202,从用户接收查询。在步骤1204,确定查询用户是否登录。如果没有,则在步骤1206可提示用户登录,或者可以中止操作。在步骤1208,识别用户的信任网络成员;该步骤通常可以类似于上述过程1000(图10)的步骤1012。在步骤1210,从个人化数据库166中检索由信任网络成员(包括查询用户)作出的注释。
在步骤1212,依赖于查询,基于页面内容和/或注释内容识别搜索命中。在要搜索页面内容的情况下,关于页面内容的信息可以从页面索引170获得,或者从个人化数据库166中的注释获得(如果页面内容的表示存储在其中的话)。利用从个人化数据库166中获得的信任网络成员的注释搜索其他字段。无论具体的搜索算法是什么,都只有在查询用户的信任网络的至少一个成员已注释了页面的情况下,页面才被有利地识别为命中。例如,在要搜索页面内容的情况下,搜索可以对表示在页面索引170中的整个语料库执行,其中所得到的命中的全局列表被基于注释的存在与否进行过滤,或者在步骤1210检索到的注释可用于生成表示在要搜索的页面索引170中的文档池。
在某些实施例中,命中被基于平均评价重新分级或突出显示。因此,在步骤1214,类似于上述过程1000(图10)的步骤1015,计算每个命中的平均评价。在步骤1216,类似于过程1000的步骤1020,利用平均评价对命中重新分级。在步骤1218,任何期望的突出显示或元数据可被添加到命中列表。例如,如上所述,可视的突出显示可被应用到每个命中以反映该命中的平均评价;“显示我的Web”按钮可以与每个命中相关联以允许用户查看个体信任网络成员的注释;或者从个体注释提取出的元数据和/或聚合元数据(例如,平均评价或聚合关键字集)可被添加到列表。在步骤1218,搜索结果页面(包括命中列表)被返回到查询用户。
应当意识到,这里描述的搜索界面和搜索过程是示例性的,也可以有变化和修改。可以并行执行顺序描述的过程步骤,可以变化步骤的顺序,并且可以修改或组合步骤。
查询界面可以变化。例如,在另一种界面中,提供了单个文本框,并且用户被提示选择文本框中的搜索项是否应当在页面内容中搜索和/或应当在注释记录的各种字段(例如,标题、关键字、描述和/或其他字段)中搜索。在另一个实施例中,默认提供了具有单个文本框的“基本”搜索界面,并且对页面内容和一个或多个预先选定的注释字段执行搜索。用户可以接受该基本搜索配置,或者选择查看查询部分1112(或另一个查询界面)以输入更复杂的查询。其他查询界面和界面的组合也是可能的。
在某些实施例中,搜索页面1100也可以经由工具栏上的按钮(例如,图7中工具栏706的按钮720)或持久用户界面的其他合适的元素访问,或者从搜索提供者的主页面访问。如果未登录到搜索服务器160的用户试图访问页面1100,则在页面1100被显示之前用户可被提示登录。
另外,尽管上面使用了术语“个人Web”,但是应当认识到,以与上述类似的方式,也可以定义并搜索由多个用户访问的任何文档语料库的“个人”版本。
F.浏览个人Web
在某些实施例中,用户可以浏览其个人Web而不输入查询。例如,用户能够利用适当配置的界面通过文件夹浏览其自己的注释,或者通过文件夹浏览由其信任网络成员作出的注释。
在其他实施例中,用户能够搜索与已由其信任网络成员注释的页面或站点类似或者有关的其他文档(例如,页面或站点)。“类似”文档是包含相对于已注释页面满足某种类似性标准的内容的文档。类似性标准的示例包括:具有某数目的公共的词、短语、或其他多词单元;具有词、短语、或其他多词单元的类似的出现模式;在系统定义的分类法中属于同一类别或紧密相关的类别;等等。用于确定两个页面之间的类似性算法是本领域中已知的,并且可用于本发明。“有关”文档与被评价的页面共享URL的一部分(例如,至少域名);同样,可以使用用于确定相关度的已知算法。
在另一个实施例中,用户可能能够浏览注释的相关性。例如,用户可能能够选择“开始”(start)页面或站点,并获得由那些已经注释了开始页面或站点的用户最频繁注释的其他页面或站点的列表。
无论何时在显示已注释文档时,用户都可能能够从搜索结果页面或工具栏界面中发起对类似、有关或相关文档的搜索。例如,图8的覆盖图800或图7的工具栏706可包括可通过其发起这些搜索的控制元素。
在其他实施例中,用户可能能够查看关于其个人Web中的行为的信息。例如,页面1100(图11)或另一个个人Web界面可包括允许用户查看信息列表的各种控件(未在图11中示出)。在一个实施例中,用户可以查看最近添加到其个人Web的页面或注释的列表。在另一个实施例中,用户可以查看已由最大数目的信任网络成员注释的页面列表,或者在其信任网络内具有最高平均评价或聚合评价的页面列表。在另一个实施例中,用户可以查看在某段时间内被其信任网络成员最频繁访问的页面列表。这些列表中的任何一个或其他列表还可以包括来自注释的元数据、来自注释的元数据的总结或聚合等等。
在又一个实施例中,这些信息可用于对查询作出响应。例如,可以提供用户的查询(或者来自用户查询的关键字)与至少一个信任网络成员的注释中的介绍字段相匹配的已注释页面或站点的列表。其他变化、添加和修改也是可能的。
G.个人Web统计信息
在某些实施例中,用户可能能够查看关于其信任网络成员的行为的统计信息。
例如,用户可能能够查看关于在某段时间内由其信任网络成员向搜索服务器160提交的查询的统计信息,如其信任网络内的最流行的查询、流行度改变最剧烈的查询等等。这样的列表可能类似于由Yahoo!公司(本申请的受让人)提供的现有的“Buzz”特征,但是只包括由用户的信任网络成员提交的查询。
在其他实施例中,可以获得其他统计信息。例如,用户可能能够查看其信任网络成员间最流行页面(或站点)的列表,这种最流行页面(或站点)例如是通过已注释了相同页面或站点的成员数或者通过已注释了页面的成员给予的平均评价来测量的。另一个列表可包括最近由成员注释的页面或站点;这种列表中的条目可以指示谁已经注释了该页面,并且还可以提供查看页面和/或新的注释的链接。用户可能还能够过滤这些列表,例如通过指定注释应当包括一个特定的关键字(或多个关键字)。
H.限制对注释的访问
如上所述,在本发明的实施例中,一个用户的注释的某些或全部可能对于通过信任关系连接到第一用户的其他用户可见。尽管每个用户通常具有识别其朋友的能力,但是在某些实施例中,用户可能不具有防止其他用户将其识别为朋友的能力。从而,可能希望允许用户建立私密性设置,从而控制其他用户是否可以查看其注释中的任何一个或全部。在某些实施例中,文件夹记录(例如见图4)或注释记录包括与管理访问有关的两个附加字段:私密性级别(字段416)和访问列表(字段418)。在对于文件夹建立私密性级别的情况下,该私密性级别应用于该文件夹内的所有注释。在某些实施例中,用户可以为文件夹建立默认私密性级别,然后对于文件夹内的个体注释重写该默认值。
在一个实施例中,私密性级别可被设为“公共”(Public)、“共享”(Shared)或“私密”(Private)。如果注释(或其文件夹)被标记为“公共”,则该注释可被系统的其他注册用户看见,并且如果注释用户处于任何其他用户的信任网络中则也对该其他用户可见(至少可能地)。在该上下文中“对用户可见”意味着注释可以以诸如覆盖图800之类的显示形式呈现给用户,或者其可用于确定用户的信任网络的聚合元数据。例如,参考图5中所示的信任关系,如果用户A的信任网络被定义为包括达两个分离度的所有用户,则用户G将在用户A的信任网络内,并且用户A将能够看见用户G的注释中已被用户G标记为“公共”的任何一个。
如果注释(或其文件夹)被标记为“共享”,则注释只有在以下情况下才能被另一个用户看见:(1)注释用户在另一用户的信任网络中;并且(2)另一用户在注释用户的信任网络中。例如,再次参考图5,即使用户G在用户A的信任网络中,用户A也不能看见用户G已标记为“共享”的用户G的注释中的任何一个,因为用户A不在用户G的信任网络中。另一方面,用户A和C将能够看见对方的“共享”注释。
如果注释(或其文件夹)被标记为“私密”,则注释只有在以下情况下才能被另一个用户看见:(1)注释用户在另一用户的信任网络中;并且(2)另一用户在注释的(或文件夹的)访问列表上。与其他私密性设置类似,私密注释的访问列表有利地由注释的作者维护。例如,再次参考图5,只有在用户C已经将用户A放到用户C的已被用户C标记为“私密”的注释的访问列表上,用户A才能够看见该注释。从而,用户可以使某些注释相对于其某些或全部朋友隐藏。
在优选实施例中,任何注释总是对其作者可见的,无论其私密性级别如何。
为了进一步说明文件夹私密性设置的使用,参考图13,其中列表1302示出了可由用户B定义的各种文件夹(主(Main)和F1-F4)的私密性级别以及由用户B创建的可包含在每个文件夹中的注释(J1-J10),列表1304示出了用户B的信任网络成员,列表1306示出了用户A的信任网络成员。假定用户A输入根据上述过程1000(图10)加以处理的查询。在步骤1012,将确定用户B是用户A的信任网络成员。在步骤1013,用户B的文件夹树(见列表1302)将被遍历以检索用户B的注释。文件夹“Main”被标记为“公共”;因此,注释J1-J3对用户A可见,并且将被检索到以用作对用户A的查询的响应。文件夹“F1”被标记为“私密”,并且不准许用户A访问;因此,注释J4和J5对用户A不可见,并且将不会被检索到。文件夹“F2”也被标记为“私密”,并且准许用户A访问;因此,注释J6对用户A是可见的,并且将被检索到。文件夹“F3”被标记为“公共”;注释J7和J8将被检索到。文件夹“F4”被标记为“共享”,但是其对用户A不可见,因为用户A不在用户B的信任网络中;因此,注释J9和J10对用户A不可见,并且将不会被检索到。从而,在过程1000中,可见的注释J1-J3和J6-J8将被检索到,并且被用作对用户A的查询的响应,而不可见的注释J4、J5、J9和J10将不会。从用户A的角度来看,就好像不可见的注释不存在一样,并且在过程1000的步骤1015将计算B可利用不可见注释对其进行评价的任何命中的聚合信任网络评价,就好像用户B还未注释命中一样。
应当意识到,除了或替代这里所述,还可以提供其他私密性机制。可以定义更多或更少的私密性级别。在某些实施例中,对作者的注释的“共享”文件夹的访问可以参考除了作者的信任网络以外的数据确定,例如,作者的IM朋友列表、电子邮件地址簿、Yahoo!群组的成员或由作者选择的其他主动关联等等。
在另一个实施例中,信息共享可以基于在具体注释中使用的关键字控制。例如,注释用户可能能够指定包含关键字“cycling”的所有注释应当被视作公共的,而包含关键字“football”的所有注释应当被视作共享的等等。在注释包括被分配了不同私密性级别的关键字的情况下,可以应用系统范围的规则以确定是应当用限制性更高的私密性级别来管理注释的共享还是应当用限制性更低的私密性级别来管理。
在某些实施例中,元数据可以在全局范围内聚合(例如,涉及搜索服务器160的所有注册用户的注释)。例如,页面的全局评价可以通过对该页面的所有用户提供的评价取平均来确定。在某些实施例中,由作者建立的私密性设置在全局聚合期间被考虑;例如,可以只使用被标记为“公共”的注释。在其他实施例中,忽略私密性设置,并且使用所有的注释。
III.注释的静态共享
在本发明的某些实施例中,用户还可以通过向其他用户分发其注释的拷贝来共享其注释。与上述动态共享不同的是,静态共享有利地导致接收用户获得其自己的注释的拷贝,接收用户可对其编辑、删除或以其他方式修改,而不会影响共享用户的注释。
A.导出和导入注释
在某些实施例中,用户可以导出和导入注释。例如,“导出”用户可以向另一个用户发送其库中的所有注释(或这些注释的选定子集),另一个用户随后可以选择将这些注释“导入”到其自己的库中。下面将描述支持注释导出和导入的实施例。
在一个实施例中,提供了一种界面页面,用户可以经由该界面页面查看和编辑其自己的注释。图14是库界面页面1400的示例;在上面引用的申请No.____(律师案卷号No.017887-013720US)中描述了类似的界面。通过操作控制部分1402中的查看选项,用户可以在列表部分1404中创建其自己的注释的定制列表。
显示在列表部分1404中的每个注释具有复选框1406,复选框1406可用于选择导出的注释。一旦进行了选择(通过选中或不选中各种框1406),用户就可以操作按钮1408来导出选中的注释。或者,用户可以操作按钮1410来导出在部分1404中列出的所有注释,而不考虑复选框1406。
当用户激活按钮1408或1410时,选定注释的可导出版本被创建。例如,可以从个人化数据库166中检索出被导出的每个注释的某些或全部元数据,对其进行必要的重新格式化(例如,插入到一个或多个网页中),并将其放到临时存储区域中(可以利用适当的资源标识符(例如URL)从该临时存储区域中检索出元数据)。
导出用户被提示识别传递方法(例如IM、电子邮件)并且提供一个或多个受者的适当的标识符(例如,IM屏幕名、电子邮件地址)。在优选实施例中,不需要导出用户和受者之间有信任关系;导出用户可以将其注释导出给其选择的任何人。所导出的注释或者标识导出注释的可用性的其他数据被传递到所识别的受者。通知机制依赖于传递方法;例如,可以使用适当配置的电子邮件消息或即时消息。
每个受者具有将注释导入到其自己的库中的选项。在一个实施例中,电子邮件或IM客户端可被配置为识别传入消息包含一个或多个注释并且询问用户是否导入注释。在另一个实施例中,导出的注释被封装到可显示的网页中,并且该页面的URL被传递给受者,例如经由电子邮件或IM。受者可以查看导出的注释,并且选择导入哪些注释(如果有的话)。图15是可通过发送给受者的URL引用的导入界面页面1500。如果受者在其导航到页面1500时还未登录,则其在查看页面或导入任何注释之前可被提示登录。
标题(Heading)1502标识注释的源(例如,通过显示导出用户的用户ID)。列表1504包括从每个注释中选出的字段。在该示例中,示出了标题(Title)、URL、关键字(Keywords)、描述(Description)和评价(Rating)字段。在其他实施例中,除了或替代图15中所示的字段,还可以显示其他字段,并且导入用户或导出用户可以选择要显示的字段。每个条目可包括活动链接,受者可经由该活动链接从页面1500导航到主题页面。
每个列表1504包括受者可以选中或清除的复选框1506。提供了控制按钮,其使得受者能够导入选中的项(按钮1508)或者导入所有项(按钮1510)。也可以提供其他控制。
当受者导入注释时,新的注释记录(例如,如上述图3所示)被有利地创建,并且被添加到个人化数据库166中。新注释的作者是导入用户(不是导出用户),并且每个导入的注释的“介绍”字段有利地将导出用户标识为注释源。“老的介绍”字段可以包括来自导出用户的注释的介绍信息,或者可被重置为默认(例如空)值。“最后更新”字段可以被更新以反映注释是何时导入的,并且对于导入用户可以重置与注释相关联的任何计数器或其他统计信息(例如,最后访问、访问次数)。其后,导入的注释被视作好像他是由导入用户创建的一样。例如,其对于导入用户可见,而与任何私密性设置无关,并且导入用户可以对其编辑或删除。
B.公布注释
除了向其他用户导出注释外,用户还可以公布其注释。这里所用的注释“公布”指经由任何合适的渠道自动分发用户注释,并且可以包括周期性的重新公布以反映公布用户作出的变化。注释的重新公布或者更新的公布可以以定期间隔发生,响应于信息中的变化发生,或者按某种另外的安排发生。对于某些公布渠道,公布用户可以对谁接收数据进行某种控制;对于其他渠道,接收用户判断要查看哪些公布的信息。
在一个实施例中,用户可以利用上述的公布标志(见图4)指定其某些或全部文件夹以用于公布;在其他实施例中,用户可以指定个体注释以用于公布,或者可以基于注释中关键字的存在与否控制公布。由图2的搜索服务器160或另一个适当配置的服务器执行的自动分发过程识别出要公布(或重新公布)的任何注释,并且生成对于公布渠道来说适当的公布消息。
各种技术和渠道可用于支持公布。在一个实施例中,选择用于公布的注释可用于周期性地更新RSS(真正简单整合,也称为丰富站点总结或RDF(资源描述框架)站点总结)馈送。RSS馈送的预订者将接收到更新后的注释的通知,并且将能够例如利用类似于上述导入页面1500的界面来选择是否导入这些注释。在另一个实施例中,指向更新后的公布用户的注释列表(例如指向诸如页面1500之类的导入网页)的URL可被周期性地分发到由用户识别的电子邮件列表中,被周期性地发布到团体的公告板上或聊天室中,等等。电子邮件列表上的每个用户随后可以链接到URL并导入所列出的注释中的任何一个或全部。在另一个实施例中,列表(或对列表的更新)可被自动发布到为公布用户维护的blog(Web log,网志)上。在另一个实施例中,用户可以维护结合了注释的公共可访问的网页,并且该网页可不时自动更新。
IV.用户团体中的注释
A.内容的专家过滤
在本发明的某些实施例中,用户可以在已由某些团体成员注释的页面或站点库内进行搜索;这种库在这里被称为“团体Web”。用户可以从属于该团体,也可以不从属于该团体,并且团体成员可以具有在其之间明确定义的信任关系,也可以不具有这种信任关系。
例如,在一个实施例中,搜索服务器160(图2)的注册用户可以主动加入在线团体(例如Yahoo!群组),其成员可以经由由搜索服务器160的提供者维护或容宿的专用消息板、电子邮件列表、聊天室等进行通信。个人化数据库166(或另一个数据库)有利地包括每个这种团体的成员的用户标识符的列表。另一个用户(无论其是否是该团体的成员)可以对该团体的内容执行搜索。例如那些正在浏览其不熟悉的流行主题的用户可能对该特征感兴趣。从而,例如,不熟悉“Harry Potter”书籍的用户可能有兴趣搜索关于其的信息。利用查询“Harry Potter”搜索Web将返回数百万的命中(对于用户来说太多,而不能在合理时间内访问),但是用户并不知道这数百万页面或站点中的哪些是值得访问的。通过将搜索限制为已由Harry Potter爱好者的团体的成员评估的页面或站点,用户可以综合考虑这些爱好者的知识和意见,从而快速找到可能可靠并且有用的内容。
图16A图示了根据本发明实施例用于搜索团体Web的界面页面1600。用户可以例如通过操作搜索工具栏上的或来自搜索界面页面的适当的按钮来访问页面1600。
部分1602使得用户能够指定哪一团体或哪些团体要用于定义要搜索的团体Web。在1604,当前选择的(一个或多个)活动团体被列出,并且按钮1606可用于改变选择。
更具体而言,图16B图示了根据本发明实施例的团体选择页面1610。页面1610可以在用户操作按钮1606时被显示。在左侧,呈现出了查询用户是其成员的团体(“ABC”和“QRS”)的列表1612。在每个团体名旁边是复选框1614,用户可以选中复选框1614以选择该团体,或者不选中复选框1614从而不选择该团体。在该实施例中,用户可以选择多个团体;在其他实施例中,用户可被局限于一次只选择一个团体。
在右侧是搜索界面1616,搜索界面1616使得用户能够找到并选择用户不是其成员的团体。用户可以利用文本框1618通过名称搜索团体,和/或利用文本框1620通过关键字搜索团体。搜索在用户按下“提交”(Submit)按钮1622时执行。对团体的搜索有利地在由搜索服务器160的提供者维护的团体的可搜索目录(例如,Yahoo!群组目录)上执行。该目录有利地包括每个团体的名称和该团体的简要描述。在一个实施例中,输入到文本框1618中的搜索项被与团体名相匹配,并且输入到文本框1620中的搜索项被与描述以及名称相匹配。
搜索结果(在这种情况下是与查询匹配的任何团体的名称和(可选的)简要描述)被显示在区域1624中。列出的团体数目可被限制为例如10(或者某个其他数),并且可以基于各种标准选择团体以用于在列表内列出或者分级。在某些实施例中,标准与团体将提供有用的已注释内容的库的似然性有关。例如,团体可以基于成员数、已被成员评价的页面或站点的总数、在团体的消息板、电子邮件列表或聊天室中的行为量等等来选择。这些或者类似种类的统计信息可以显示在区域1624中。
用户可以利用复选框1626选择列出团体中的一个或多个。在优选实施例中,选中框1626并不导致用户加入该团体,并且不向用户提供关于个体团体成员的任何信息。“完成”(Finished)按钮1628允许用户返回到页面1600(图16A)同时新选择一个或多个团体;在页面1600被重新显示时新的选择将会在1602处示出。页面1610上的“取消”(Cancel)按钮1630允许用户返回到页面1600而不改变选择。
再次参考图16A,在页面1600,用户在查询部分1630中输入查询。查询部分1630提供了各种框,用户可在这些框中输入特定于注释中的元数据的具体字段的搜索项。在该示例中,用户可以指定用于页面内容(文本框1632)和/或注释字段的搜索项,注释字段例如是标题(文本框1634)、关键字(文本框1636)、描述(文本框1638)和/或介绍(文本框1640)。应当理解,用户并不需要在部分1630的所有文本框中都输入搜索项;对应于没有搜索项的框的字段不被用于约束搜索。用户还可以利用单选按钮1642指定期望的评价。“搜索”按钮1644提交查询以供处理,“重置”按钮1646清除查询部分1630中的所有字段。从而,用于搜索团体Web的查询部分1630通常可能类似于个人Web查询界面(例如图11)。
用于搜索团体Web的过程通常可能类似于用于搜索个人Web的过程(例如图12)。然而,接收自用户的查询将标识要搜索其团体Web的一个选定团体(或多个团体),并且步骤1208将包括识别指定团体的所有成员而不是查询用户的信任网络的成员。团体成员的识别可以与信任关系无关。搜索被限制为已由选定团体的至少一个成员注释的文档。
在优选实施例中,在团体Web搜索期间可以应用团体成员的私密性设置,并且团体成员被视作好像其是查询用户的信任网络成员一样。对于上述私密性设置,在所有情况下将使用每个团体成员的“公共”注释;如果查询用户恰好在团体成员的信任网络中,则将使用“共享”注释;并且只有在查询用户恰好在该注释的访问列表上时,才会使用“私密”注释。
另外,注释元数据在识别并报告命中的使用可能有所不同。例如,关键字的搜索可能基于团体成员的关键字的聚合。在一个实施例中,只有在注释了页面的团体成员中的某个最少部分使用了该关键字时,才会检测到关键字匹配。在另一个实施例中,如果至少一个团体成员使用了该关键字,则检测到关键字匹配。类似地,页面是否满足评价要求可以基于注释了页面的团体成员的平均评价确定,或者基于是否有最少部分的团体成员对页面给予了指定评价来确定,或者基于是否有至少一个团体成员对页面给予了指定评价来确定。
在某些实施例中,每个团体成员的注释可被给予相等的权重。在其他实施例中,给予每个评价者的注释的权重可以由由该组的其他成员分配给该评价者的总信任权重来确定,由其朋友列表包括评价者的组成员数来确定,由团体中评价者的名誉分数或全局名誉分数(例如,如下所述)来确定,或者由其他因素确定。
当搜索结果被报告给用户时,有利地限制了用户对来自个体团体成员的元数据的访问。例如,在一个实施例中,搜索结果只提供每个命中的平均评价和/或关键字的聚合列表,并且还可以指示诸如已注释了该命中的团体成员数目或比例之类的信息。这些信息可以允许查询用户评估其正在取得的信息的质量,而不会暴露关于个体团体成员的身份或注释的任何信息。
在另一个实施例中,搜索结果可以提供来自个体注释的匿名摘录。例如,可以包括不归于特定作者的来自描述字段的摘录,或者可以报告所有关键字的列表(按字母或按频率)而不将关键字归于个人,或者可以包括无归属的评价的列表(按年代顺序)。
在其他实施例中,用户可能能够查看关于团体Web中的行为的信息。例如,页面1600(图16A)或另一界面页面可能包括允许用户查看信息列表的各种控件(未示出)。在一个实施例中,用户可以查看最近添加到团体Web的页面或注释的列表。在另一个实施例中,用户可以查看已由最大数目的团体成员注释的页面列表或在团体内具有最高平均评价的页面列表。在另一个实施例中,用户可以查看被团体成员最频繁访问的页面列表。与上述团体Web搜索结果页面相类似,这些列表中的任何一个或其他列表还包括聚合或匿名注释信息。在该上下文中同样有利地考虑到由团体成员建立的私密性设置。
应当意识到,团体Web在许多方面类似于个人Web,尤其在用户的个人Web的信任网络参考团体而非个体朋友定义的情况下。从而,针对个人Web描述的上述搜索和浏览操作中的任何一个也可以扩展到团体Web。然而,在访问团体Web的用户不是团体成员的情况下,标识个体团体成员的信息对于访问用户来说有利地是不可用的。
B.建议团体
在某些实施例中,搜索提供者可以分析用户A的注释中的模式,并且基于这些模式识别用户A可能有兴趣加入的各种团体。例如,搜索提供者可以选择基于兴趣的团体G(例如Yahoo!群组),并且识别包括该团体的团体Web的页面;提供者还可以确定团体G的成员已对某些数目的已注释页面给予的平均评价。
假定用户A已经不是团体G的成员,则用户A的注释库随后可被与团体G的团体Web相比较以检测两者之间的亲合力(affinity)。这里所用的“亲合力”通常指共同兴趣和/或品味的模式,并且可以用各种方式测量。例如,在团体G的团体Web中用户A也进行了注释的页面数可用于测量亲合力。作为另一个示例,可以测量由用户A和团体G对同一页面给予的评价之间的相关性。也可以使用对于具体页面用户A的关键字和团体G的聚合关键字之间的相关性。在另一个实施例中,如果维护每个用户的查询日志,则用户A的查询中的模式也可能被与由团体G的成员输入的查询中的模式相比较以确定用户A和团体G的成员是否具有类似的兴趣和品味。如果亲合力表现的足够高,则提供者(例如经由电子邮件)发出用户A应当考虑加入团体G的建议。或者,提供者可能向团体G的代表发出考虑邀请用户A加入的建议。
在一个实施例中,用户A具有是否接收这些建议的选项。例如,用户可能能够经由用户简档页面选择是否接收关于要加入的团体的建议。如果用户选择不接收,则不对该用户生成建议。
尽管系统可以自动将用户A添加到建议的团体,但是在优选实施例中,用户A控制关于是否加入建议的团体的最终判决。例如,建议可能以电子邮件消息发送,该消息可包括链接,用户A循着该链接可以获得关于该团体的更多信息或者加入团体、团体的当前成员的联系信息(例如电子邮件地址或IM屏幕名)等等。从而,用户A可以对接收的任何建议判断如何遵循以及是否遵循。
在某些实施例中,用户A可以接收建议加入可以主动加入的任何团体(例如Yahoo!群组)。在其他实施例中,团体的现有成员可以决定是否参与基于亲合力的介绍程序以获得新的成员。例如,在线团体一般具有“所有者”,其是已被指定作为在线团体服务的提供者的联系点的团体的成员,并且具有设置各种操作规则或对团体的偏好的权力(例如,与团体相关联的电子邮件列表是否是适度的,新的成员是否应当被批准,等等)。在服务提供者提供了基于亲合力的介绍程序的情况下,每个团体的所有者可以指示该团体是否想要参与,并且服务提供者遵守所表达的偏好。
C.元评价(meta-rating)
在某些实施例中,当查询或浏览用户查看注释时,其可被提示评估注释,例如关于其是否觉得注释有帮助。例如,图8的覆盖图800可包括一组反馈按钮,用户可以经由这组反馈按钮提交注释的评价(在这里被称为“元评价”)。由用户提交的元评价有利地存储在与被评价的注释、注释的作者和注释进行评价的用户相关联的个人化数据库166(图2)中。元评价可以用多种方式使用。
在某些实施例中,元评价可用于确定首先显示哪些注释。例如,在用户A的信任网络的大量成员已经注释了页面的情况下,一次显示所有注释可能是不实际的;即使要同时显示所有注释,也仍然需要选择显示的顺序。该顺序有利地是以这样的方式确定的,该方式使得被给予显著放置的注释对于向其显示的用户来说有帮助的似然性最大。在用户A已经注释了页面的情况下,可以假定用户A将发现其自己的注释是有帮助的,并且其注释可被首先显示。在用户A还未注释页面的情况下,或者在除了用户A自己的注释以外还要显示其他用户的注释的情况下,元评价可用于确定如何对其他用户的注释排序。
从而,在某些实施例中,可以计算具体页面或搜索命中的每个注释的聚合元评价,并且具有最正面的聚合元评价的注释可以被首先显示给用户A(在A自己的注释之后(在可用的情况下))。聚合元评价可以是例如由用户A的信任网络成员给予的元评价的加权平均;权重可以从每个成员相对于A的置信系数、与用户A的分离度等确定。或者,聚合元评价例如可以是来自已经评价注释的所有用户(无论其是否在用户A的信任网络中)的元评价的平均值。
在其他实施例中,可以计算注释了页面的每个用户X的聚合元评价,并且并将其用于确定用户X的名誉分数。聚合元评价可以例如通过对对用户X的注释所给予的评价取平均来计算。用户X的名誉分数可以例如通过以下方式来全局地确定:对由注释系统的所有用户对用户X的注释所给予的所有元评价取平均,或者按团体,例如对由用户X所属的每个团体的成员对用户X的注释所给予的元评价单独取平均。从而,每个用户可能具有一个或多个名誉分数。
名誉分数通常可以按与上述置信系数或信任权重相同的方式来使用。例如,用于显示页面或站点的注释的顺序可以基于其作者的可用名誉分数来确定。名誉分数也可被用作权重以在对聚合评价感兴趣的任何环境下确定页面或站点的聚合评价。名誉分数也可以在团体Web搜索期间(包括在查询用户不是已注释内容正被搜索的团体的成员的情况下)被用于替代信任权重或置信系数。在团体Web搜索期间使用团体特定的名誉分数可以提供关于该团体整体上觉得什么内容感兴趣或有价值的可靠的指标。
V.另外的实施例
尽管已经结合特定实施例描述了本发明,但是本领域技术人员将认识到可以有大量的修改。例如,各种搜索报告和用户界面的外观可以不同于这里所示的示例。界面元素并不限于按钮、页面的可点击区域、文本框或这里描述的其他的特定元素;可以使用任何界面实现方式。
应当理解,在与评价相关时,本发明也不限于任何具体的评价方案,并且某些实施例可能给用户提供选择替换评价方案的选项(例如,拇指向上/向下或者按刻度评价)。在某些实施例中,可能只支持正面或中立的评价。在其他实施例中,可能根本不收集评价。在不收集评价的情况下,仍然可以收集用户注释,并且可以提供可以在反向搜索报告中报告的其他类型的元数据,包括但不限于上述各种类型的元数据。
另外,在某些实施例中,不仅仅使用单个整体评价,用户还能够对页面或站点的特定维度进行评价,包括与技术性能、内容和美学有关的维度。例如,技术性能评价可能包括反映访问页面的速度、服务器的可靠性、从页面传出的链接是否工作等的评价。内容评价可能包括反映内容是否是当前的、准确的、可理解的、组织良好的等的评价。美学评价可能包括反映用户对布局、可读性、图形元素的使用等的意见的评价。用户可被请求在任何数目的这些和其他维度中对站点进行评价。在某些实施例中,用户还能够给予整体评价,或者整体评价可以根据对每一方面给予的评价来计算。
注释可以包括任何组合的任何数目的字段,并且可以包括与上述相比更多的字段、更少的字段或不同的字段。例如,用户可能还能够指示被注释的页面或站点是否属于某种一般内容类别,例如“adult”(成人)或“foreign”(外国)或“spam”(垃圾广告)。用户随后可以选择在搜索期间包括或者排除被(用户和/或其信任网络成员)识别为属于该类别的内容。另外,关于在这些类别的一个或另一个中不同用户已经归类了哪些页面或站点的信息可被用于推断出正被讨论的页面或站点应当在全局基础上考虑。从而,例如,如果大量用户将特定页面识别为垃圾广告,则在所有未来的搜索结果中该页面可能被排除或被给予较低的分级。
在某些实施例中,注释还可以包括非用户特定的元数据。例如,元数据还可能包括与主题页面或站点有关的真实位置(例如,纬度和经度坐标、街道地址等)或电话号码、与主题页面或站点有关的UPC(通用产品码)或ISBN(国际标准书号)或ISSN(国际标准序列号)、关于页面或站点是否启动弹出式窗口的指示符等等。另外,与主题页面或站点的各种属性有关的元数据(如其是否包括成人内容或是否是外语的等等)也可以与用户输入相独立地被结合到注释中。
也可以提供其他用于查看注释和与注释交互的其他界面。例如,在一个实施例中,在每次已注释页面被显示在用户的浏览器内容中时,注释数据被自动显示(例如,内嵌在页面内容中或者在覆盖图中)。注释数据的自动显示可以被限制为浏览用户自己的注释,或者被扩展到包括来自用户的信任网络的其他成员中的某些或全部的注释数据的自动显示。在某些实施例中,每个用户可能能够指示其他用户的注释应当被自动显示的偏好。
如上所述,某些实施例允许用户控制注释是应当应用于单个页面还是应当应用于页面(或站点)组。另外,在某些实施例中,用户还能够将注释应用于注册到与已注释页面相同的域名注册者的所有页面。公共域名注册者的存在情况可以利用WHOIS或另一种类似服务确定。
在其他实施例中,搜索服务器160的提供者还可以提供受赞助链接,其中内容提供者付费以使得到其站点的链接在搜索结果中提供。受赞助链接通常显示在结果页面的指定部分中,与常规搜索结果相隔离。在本发明的一个实施例中,用户、信任网络或团体(如果可用的话)已注释的任何受赞助链接也可以被标记。例如,受赞助链接可能具有突出显示以指示用户的信任网络的至少一个成员具有该页面的注释,并且受赞助链接的信任网络的平均评价或聚合评价(如果有的话)可用于确定突出显示,就好像对上述常规搜索结果一样。受赞助链接也可以伴随有“保存”按钮、“显示我的Web”按钮或类似的按钮或界面控件。
在某些实施例中,用户可能能够定义多个朋友列表,例如对于对不同(但是可能重叠的)语料库进行的搜索。例如,Web搜索提供者可能允许用户在不同的“属性”内搜索,如购物(Shopping)属性(主要包括提供待售货物和服务的站点)、新闻(News)属性(主要包括报告当前事件并发表意见的站点)等等。在一个这样的实施例中,用户可以为一般Web搜索定义一个朋友列表,为购物属性内的搜索定义另一个朋友列表,并为新闻属性内的搜索定义另一个朋友列表,等等。在列表不同时,用户对于每个搜索类别将会具有不同的信任网络。如果用户在其还未定义属性特定的朋友列表的属性中进行搜索,则可以使用其一般列表。
在其他实施例中,用户可能能够将不同朋友与特定关键字相关联,其中只有在用户的查询包括将关键字包括为搜索项时,特定的朋友才被包括在信任网络中。
在某些实施例中,用户可能还能够为除了搜索以外的应用定义朋友列表。例如,许多电子邮件帐户提供者包括各种垃圾广告过滤器,并且给予用户报告传入的消息是垃圾广告还是非垃圾广告的选项(例如,从而可以复查并改进垃圾广告过滤器的工作)。假定用户A已经定义了电子邮件的朋友列表,并且利用A的朋友列表定义的信任网络包括用户B。进一步假定B将特定消息报告为垃圾广告,用户A随后接收到相同(或非常类似)的消息。用户A可能接收到某些指示,即用户A的电子邮件信任网络中的某人(其可能被识别为用户B,也可能不被识别为用户B)认为该消息是垃圾广告,或者该消息可能被重定向到用户A的“垃圾”电子邮件文件夹,或者采取某种其他动作以警告用户A该消息是垃圾广告的似然性很大。
上述实施例可能涉及网站、URL、链接和对于万维网(或其子集)用作搜索语料库的情形来说特定的其他术语。然而,应当理解,上述系统和方法也可以适用于不同的搜索语料库(如电子数据库或文档仓库),并且搜索报告或注释可以包括内容以及链接或者对可以找到内容的位置的引用。
结合了本发明各种特征的计算机程序可被编码在各种计算机可读介质上以供存储和/或发送;合适的介质包括磁盘或磁带、光存储介质(如CD或DVD)、闪存和适于经由遵从多种协议的有线、光学和/或无线网络(包括因特网)发送的载波信号。编码有程序代码的计算机可读介质可以封装在兼容设备内,或者与其他设备分离提供(例如经由因特网下载)。
尽管已经结合特定的硬件和软件组件描述了本发明,但是本领域技术人员将会意识到,也可以使用硬件和/或软件组件的不同组合,并且被描述为实现在硬件中的特定操作也可以实现在软件中,反之亦然。
从而,尽管已经结合特定实施例描述了本发明,但是应当意识到,本发明试图覆盖在权利要求范围内的所有修改和等同物。

Claims (55)

1.一种用于对用户查询作出响应的方法,所述方法包括:
接收由多个用户中的查询用户提交的查询;
搜索包括多个文档的语料库以识别一个或多个命中,其中每个命中是所述语料库中被确定与所述查询相关的文档;
为所述查询用户构建信任网络,所述信任网络以所述多个用户中包括除了所述查询用户以外的至少一个用户的子集作为成员;
访问存储由所述多个用户创建的注释的存储装置,每个注释与所述语料库的文档中的主题文档相关联,并且与所述多个用户中的创建用户相关联,每个注释包括与所述主题文档有关的用户特定的元数据;
将作为至少一个匹配注释的主题文档的每个命中识别为已注释命中,其中每个匹配注释的创建用户是所述信任网络的成员之一;
生成包括命中列表的搜索报告,其中对于每个已注释命中,所述搜索报告包括关于所述匹配注释中的至少一个的信息;以及
将所述搜索报告发送给所述查询用户。
2.如权利要求1所述的方法,其中所述信任网络的成员包括由所述查询用户明确识别为朋友的至少一个其他用户。
3.如权利要求2所述的方法,还包括:
提供信任网络界面,所述信任网络界面可由所述多个用户操作以将所述多个用户中的其他用户识别为朋友;
经由所述信任网络界面接收来自包括所述查询用户在内的多个输入用户的朋友的标识;以及
对于每个输入用户存储已识别的朋友的列表。
4.如权利要求3所述的方法,其中为所述查询用户构建所述信任网络包括:
检索所述查询用户的已识别朋友的列表;以及
添加所述查询用户的已识别朋友中的至少一个作为所述信任网络的成员。
5.如权利要求4所述的方法,其中为所述查询用户构建所述信任网络还包括:
检索所述信任网络成员中的第一个的已识别朋友的列表;以及
添加所述信任网络成员中的第一个的已识别朋友中的至少一个作为所述信任网络的成员。
6.如权利要求5所述的方法,其中为所述查询用户构建所述信任网络还包括:
添加所述信任网络成员的已识别朋友作为所述信任网络的成员,这些已识别朋友以不超过最大值的分离度连接到所述查询用户。
7.如权利要求4所述的方法,其中为所述查询用户构建所述信任网络还包括:
将所述查询用户添加到所述信任网络作为成员。
8.如权利要求3所述的方法,还包括:
给所述已识别朋友的列表中的每个朋友分配信任权重。
9.如权利要求8所述的方法,其中所述信任权重是基于经由所述信任网络界面接收到的用户输入分配的。
10.如权利要求9所述的方法,其中为所述查询用户构建所述信任网络包括:
至少部分基于所述信任权重选择用户以添加到所述信任网络作为成员。
11.如权利要求2所述的方法,其中为所述查询用户构建所述信任网络包括:
从所述查询用户与之通信的用户的列表自动填充所述查询用户的已识别朋友的列表。
12.如权利要求11所述的方法,其中所述查询用户与之通信的用户的列表包括由所述查询用户维护的即时消息联系人的列表。
13.如权利要求11所述的方法,其中所述查询用户与之通信的用户的列表包括由所述查询用户维护的电子邮件地址簿。
14.如权利要求11所述的方法,其中所述查询用户与之通信的用户的列表包括所述查询用户所属的团体成员的列表。
15.如权利要求11所述的方法,还包括:
提供信任网络界面,所述信任网络界面可由所述查询用户操作以编辑自动填充的朋友列表。
16.如权利要求1所述的方法,其中所述信任网络成员是用户的选定团体的成员,所述选定团体由所述查询用户选择。
17.如权利要求16所述的方法,其中所述查询用户也是所述选定团体的成员。
18.如权利要求16所述的方法,其中所述查询用户不是所述选定团体的成员。
19.如权利要求16所述的方法,还包括:
从所述查询用户接收所述选定团体的标识符。
20.如权利要求1所述的方法,其中所述查询用户是所述信任网络的成员之一。
21.如权利要求1所述的方法,其中所述搜索报告包括应用于作为已注释命中的每个命中的可视突出显示元素。
22.如权利要求21所述的方法,其中包括在所述注释中的用户特定的元数据包括评价,所述方法还包括:
对于每个已注释命中,从每个匹配注释中提取出评价并且计算平均评价,
其中应用于每个已注释命中的可视突出显示元素依赖于所述平均评价。
23.如权利要求1所述的方法,其中包括在所述注释中的用户特定的元数据包括评价,所述方法还包括:
对于每个已注释命中,从每个匹配注释中提取出评价并且计算平均评价,
其中生成所述搜索报告包括至少部分基于所述已注释命中的平均评价确定所述命中列表的顺序。
24.如权利要求1所述的方法,其中生成所述搜索报告还包括:
对于每个已注释命中,在所述搜索报告中提供控制元素,所述控制元素可由所述用户操作以请求显示至少一个匹配注释的用户特定的元数据。
25.如权利要求1所述的方法,其中生成所述搜索报告还包括:
对于每个已注释命中,在所述搜索报告中提供从至少一个匹配注释中提取出的信息。
26.如权利要求1所述的方法,其中生成所述搜索报告还包括:
生成只包括已注释命中的单独列表。
27.如权利要求1所述的方法,还包括:
搜索所述存储装置以识别一个或多个附加的已注释命中,其中每个附加的已注释命中对应于所述语料库中的一个文档,对于该文档所述存储装置包括所述创建用户是所述信任网络成员之一的关联注释,并且所述关联注释包括被确定为与所述查询相关的用户特定的元数据;以及
将所述附加的已注释命中结合到所述搜索结果页面的命中列表中。
28.如权利要求27所述的方法,其中搜索所述语料库包括:
从所述用户查询中提取出搜索项;以及
将所述语料库中包含所述搜索项的每个文档识别为命中。
29.如权利要求28所述的方法,其中搜索所述存储装置包括将所述语料库中所述用户特定的元数据针对其包括所述搜索项的每个文档识别为附加的已注释命中。
30.如权利要求1所述的方法,其中所述存储装置还包括与所述语料库中的文档组相关联的至少一个注释,并且作为所述文档组之一的任何命中被识别为已注释命中。
31.如权利要求1所述的方法,其中所述用户特定的元数据包括由所述用户明确输入的信息项。
32.如权利要求31所述的方法,其中所述信息项是主题文档的评价。
33.如权利要求31所述的方法,其中所述信息项是描述主题文档的关键字。
34.如权利要求31所述的方法,其中所述信息项是从预定义的词表中选出的标签。
35.如权利要求31所述的方法,其中所述信息项是主题文档的描述。
36.如权利要求1所述的方法,其中所述语料库包括多个万维网页面。
37.如权利要求1所述的方法,其中所述用户是人。
38.如权利要求1所述的方法,其中所述用户是计算机。
39.一种用于对用户查询作出响应的方法,所述方法包括:
接收由多个用户中的查询用户提交的查询;
为所述查询用户构建信任网络,所述信任网络以所述多个用户中包括除了所述查询用户以外的至少一个用户的子集作为成员;
访问存储由所述多个用户创建的注释的存储装置,每个注释与属于一个语料库的多个文档中的主题文档相关联,并且与所述多个用户中的创建用户相关联,每个注释还包括与所述主题文档有关的用户特定的元数据;
识别一个或多个命中,其中每个命中是所述语料库中被确定与所述查询相关的文档,并且每个命中还是至少一个匹配注释的主题文档,其中每个匹配注释的创建用户是所述信任网络成员之一;
生成包括命中列表的搜索报告;以及
将所述搜索报告发送给所述查询用户。
40.如权利要求39所述的方法,其中所述信任网络成员包括由所述查询用户明确识别为朋友的至少一个其他用户。
41.如权利要求39所述的方法,其中所述信任网络成员是用户的选定团体的成员,所述团体由所述查询用户选择。
42.如权利要求39所述的方法,其中识别所述一个或多个命中包括将所述查询与所述语料库中的文档内容相比较。
43.如权利要求39所述的方法,其中识别一个或多个命中包括将所述查询与注释的搜索池中所述创建用户是所述信任网络成员之一的注释的用户特定的元数据相比较。
44.如权利要求43所述的方法,其中识别一个或多个命中还包括:
从所述查询中提取出搜索项;以及
对于所述搜索池中的每个注释,检测所述搜索项是否存在于所述用户特定的元数据中,
其中在所述搜索项存在于所述用户特定的元数据中的情况下,主题文档被识别为命中。
45.如权利要求44所述的方法,还包括:
对于作为所述搜索池中的至少一个注释的主题文档的每个文档,检测所述搜索项是否存在于所述文档中,
其中在所述搜索项存在于所述文档中的情况下,所述文档被识别为命中。
46.如权利要求44所述的方法,其中所述用户特定的元数据包括多个字段,并且所述查询指定了在检测动作期间要考虑哪些字段。
47.如权利要求39所述的方法,其中对于每个命中,所述搜索报告还包括控制元素,所述控制元素可由所述用户操作以请求显示至少一个匹配注释的用户特定的元数据。
48.如权利要求39所述的方法,其中对于每个命中,所述搜索报告还包括来自至少一个匹配注释的至少某些用户特定的元数据。
49.如权利要求39所述的方法,其中包括在每个匹配注释中的用户特定的元数据包括所述主题文档的评价,并且所述列表中的命中是以至少部分基于所述命中的评价确定的顺序放置的。
50.如权利要求39所述的方法,其中所述存储装置还包括与所述语料库中的文档组相关联的至少一个注释,并且作为所述文档组之一的任何文档都被识别为命中。
51.如权利要求39所述的方法,其中所述语料库是万维网。
52.如权利要求39所述的方法,其中所述用户是人。
53.如权利要求39所述的方法,其中所述用户是计算机。
54.一种用于对用户查询作出响应的系统,所述系统包括:
用于接收由多个用户中的查询用户提交的查询的装置;
用于搜索包括多个文档的语料库以识别一个或多个命中的装置,其中每个命中是所述语料库中被确定为与所述查询相关的文档;
用于为所述查询用户构建信任网络的装置,所述信任网络以所述多个用户中包括除了所述查询用户以外的至少一个用户的子集作为成员;
用于访问存储由所述多个用户创建的注释的存储装置的装置,每个注释与所述语料库的文档中的主题文档相关联,并且与所述多个用户中的创建用户相关联,每个注释包括与所述主题文档有关的用户特定的元数据;
用于将作为至少一个匹配注释的主题文档的每个命中识别为已注释命中的装置,其中每个匹配注释的创建用户是所述信任网络的成员之一;
用于生成包括命中列表的搜索报告的装置,其中对于每个已注释命中,所述搜索报告包括关于所述匹配注释中的至少一个的信息;以及
用于将所述搜索报告发送给所述查询用户的装置。
55.一种用于对用户查询作出响应的系统,所述系统包括:
用于接收由多个用户中的查询用户提交的查询的装置;
用于为所述查询用户构建信任网络的装置,所述信任网络以所述多个用户中包括除了所述查询用户以外的至少一个用户的子集作为成员;
用于访问存储由所述多个用户创建的注释的存储装置的装置,每个注释与属于一个语料库的多个文档中的主题文档相关联,并且与所述多个用户中的创建用户相关联,每个注释还包括与所述主题文档有关的用户特定的元数据;
用于识别一个或多个命中的装置,其中每个命中是所述语料库中被确定为与所述查询相关的文档,并且每个命中还是至少一个匹配注释的主题文档,其中每个匹配注释的创建用户是所述信任网络成员之一;
用于生成包括命中列表的搜索报告的装置;以及
用于将所述搜索报告发送给所述查询用户的装置。
CN2005800083906A 2004-03-15 2005-03-15 集成有来自信任网络的用户注释的搜索系统和方法 Active CN101124576B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US55357704P 2004-03-15 2004-03-15
US60/553,577 2004-03-15
US62328204P 2004-10-28 2004-10-28
US60/623,282 2004-10-28
PCT/US2005/008487 WO2005089291A2 (en) 2004-03-15 2005-03-15 Search system and methods with integration of user annotations from a trust network

Publications (2)

Publication Number Publication Date
CN101124576A CN101124576A (zh) 2008-02-13
CN101124576B true CN101124576B (zh) 2010-06-16

Family

ID=34994245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800083906A Active CN101124576B (zh) 2004-03-15 2005-03-15 集成有来自信任网络的用户注释的搜索系统和方法

Country Status (6)

Country Link
EP (2) EP1784747A4 (zh)
JP (2) JP2007529822A (zh)
KR (1) KR100824091B1 (zh)
CN (1) CN101124576B (zh)
HK (1) HK1116557A1 (zh)
WO (1) WO2005089291A2 (zh)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7793233B1 (en) 2003-03-12 2010-09-07 Microsoft Corporation System and method for customizing note flags
US20070038607A1 (en) * 2005-04-05 2007-02-15 Herman Mark Ii Method for rating of web sites and retrieval of rated web sites
US7734631B2 (en) * 2005-04-25 2010-06-08 Microsoft Corporation Associating information with an electronic document
US7827208B2 (en) * 2006-08-11 2010-11-02 Facebook, Inc. Generating a feed of stories personalized for members of a social network
US8171128B2 (en) 2006-08-11 2012-05-01 Facebook, Inc. Communicating a newsfeed of media content based on a member's interactions in a social network environment
US7797638B2 (en) * 2006-01-05 2010-09-14 Microsoft Corporation Application of metadata to documents and document objects via a software application user interface
JP2007233697A (ja) * 2006-03-01 2007-09-13 Just Syst Corp 注釈管理装置および注釈管理方法
JP5225587B2 (ja) * 2006-03-20 2013-07-03 楽天株式会社 ソーシャルネットワーキングサービスシステム
JP2010503081A (ja) * 2006-08-31 2010-01-28 クゥアルコム・インコーポレイテッド 利用者ベースのバイアスを使用した検索結果の取得又は提供方法および装置
CN106959992A (zh) * 2006-08-31 2017-07-18 高通股份有限公司 使用基于用户的偏向获得或提供搜索结果的方法及设备
US7559017B2 (en) 2006-12-22 2009-07-07 Google Inc. Annotation framework for video
US20080201632A1 (en) * 2007-02-16 2008-08-21 Palo Alto Research Center Incorporated System and method for annotating documents
US8181197B2 (en) 2008-02-06 2012-05-15 Google Inc. System and method for voting on popular video intervals
US8112702B2 (en) 2008-02-19 2012-02-07 Google Inc. Annotating video intervals
JP5266841B2 (ja) * 2008-03-31 2013-08-21 富士通株式会社 仮想共同体管理システム、仮想共同体管理方法、およびコンピュータプログラム
US20090271374A1 (en) * 2008-04-29 2009-10-29 Microsoft Corporation Social network powered query refinement and recommendations
EP2291978B1 (en) * 2008-06-20 2016-10-05 Koninklijke Philips N.V. Improved biometric authentication and identification
US10275530B2 (en) 2009-02-02 2019-04-30 Excalibur Ip, Llc System and method for communal search
US9195739B2 (en) 2009-02-20 2015-11-24 Microsoft Technology Licensing, Llc Identifying a discussion topic based on user interest information
US8132200B1 (en) 2009-03-30 2012-03-06 Google Inc. Intra-video ratings
US20110078188A1 (en) * 2009-09-28 2011-03-31 Microsoft Corporation Mining and Conveying Social Relationships
KR101284788B1 (ko) 2009-10-13 2013-07-10 한국전자통신연구원 신뢰도에 기반한 질의응답 장치 및 그 방법
US8880520B2 (en) * 2010-04-21 2014-11-04 Yahoo! Inc. Selectively adding social dimension to web searches
KR101208814B1 (ko) * 2010-07-09 2012-12-06 엔에이치엔(주) 검색 서비스 시스템 및 방법
US9047613B2 (en) 2010-09-01 2015-06-02 Google Inc. Joining multiple user lists
CN107526776A (zh) * 2010-09-08 2017-12-29 印象笔记公司 呈现搜索结果的计算机化方法及系统
KR101174213B1 (ko) * 2010-09-30 2012-08-14 엔에이치엔(주) 인맥에 기초한 검색 결과 제공 시스템 및 방법
US9110992B2 (en) 2011-06-03 2015-08-18 Facebook, Inc. Context-based selection of calls-to-action associated with search results
US8909637B2 (en) 2011-06-03 2014-12-09 Facebook, Inc. Context-based ranking of search results
US9268857B2 (en) 2011-06-03 2016-02-23 Facebook, Inc. Suggesting search results to users before receiving any search query from the users
US8495058B2 (en) * 2011-08-05 2013-07-23 Google Inc. Filtering social search results
CN102375952B (zh) * 2011-10-31 2014-12-24 北龙中网(北京)科技有限责任公司 在搜索引擎结果中显示网站是否为可信验证的方法
CN102594585B (zh) * 2011-12-15 2014-06-25 江苏亿通高科技股份有限公司 终端注册表自动清除方法
US9047643B2 (en) * 2012-03-19 2015-06-02 Alcatel Lucent Method of extending web service application programming interfaces using query languages
FR2989189B1 (fr) * 2012-04-04 2017-10-13 Qwant Procede et dispositif de fourniture rapide d'information
EP4224324A3 (en) 2013-02-27 2023-09-27 Hitachi Vantara LLC Rain-based archival system with self-describing objects
EP3014567A4 (en) * 2013-06-23 2016-12-14 Intel Corp SELECTIVE SHARING OF USER INFORMATION BASED ON INFORMATION OF CONTEXT RELATIONS, SUCH AS COLLABORATIVE GIFTS INTERESTING WITH A RECIPIENT
CN104346388B (zh) * 2013-07-31 2018-03-09 株式会社理光 云端服务器以及图像存储检索系统
US10229206B2 (en) * 2013-08-02 2019-03-12 Microsoft Technology Licensing, Llc Social snippet augmenting
KR102573033B1 (ko) * 2018-06-27 2023-09-01 주식회사 빅스터 블록체인용 정보 판단 서버 및 프로그램이 기록된 기록매체
KR102131292B1 (ko) * 2018-10-19 2020-07-07 빅픽처랩 주식회사 블록체인 기반 신뢰도 정보 관리방법
CN110619077B (zh) * 2018-12-28 2023-04-14 腾讯科技(深圳)有限公司 搜索方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1360267A (zh) * 2002-01-30 2002-07-24 北京大学 文件分类查找方法
US6601075B1 (en) * 2000-07-27 2003-07-29 International Business Machines Corporation System and method of ranking and retrieving documents based on authority scores of schemas and documents
US6665666B1 (en) * 1999-10-26 2003-12-16 International Business Machines Corporation System, method and program product for answering questions using a search engine

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1083386A (ja) * 1996-02-29 1998-03-31 Toshiba Corp 情報共有支援システム
JP3877081B2 (ja) * 1996-07-24 2007-02-07 富士通株式会社 コンテンツと付加的情報の管理システム及びそのシステムで管理されるコンテンツ及び付加的情報の表示システム
JPH10254886A (ja) * 1997-03-07 1998-09-25 Fujitsu Ltd 検索システムにおける検索結果コンテンツへの付加的情報の付加及び検索システム
JP3702086B2 (ja) * 1998-02-27 2005-10-05 株式会社東芝 情報共有支援方法および情報共有システムおよび記録媒体
JP2001052003A (ja) * 1999-08-04 2001-02-23 Matsushita Electric Ind Co Ltd インターネット情報閲覧装置
US7080064B2 (en) * 2000-01-20 2006-07-18 International Business Machines Corporation System and method for integrating on-line user ratings of businesses with search engines
US7203753B2 (en) * 2001-07-31 2007-04-10 Sun Microsystems, Inc. Propagating and updating trust relationships in distributed peer-to-peer networks
EP1288795A1 (en) * 2001-08-24 2003-03-05 BRITISH TELECOMMUNICATIONS public limited company Query systems
JP2003132158A (ja) * 2001-10-22 2003-05-09 Tryark Kk 人脈情報管理システム及び人脈情報管理プログラム
JP2003141381A (ja) * 2001-11-02 2003-05-16 Tryark Kk 人脈情報検索システム及び人脈経路探索システム
AU2003207856A1 (en) * 2002-02-04 2003-09-02 Cataphora, Inc A method and apparatus to visually present discussions for data mining purposes

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6665666B1 (en) * 1999-10-26 2003-12-16 International Business Machines Corporation System, method and program product for answering questions using a search engine
US6601075B1 (en) * 2000-07-27 2003-07-29 International Business Machines Corporation System and method of ranking and retrieving documents based on authority scores of schemas and documents
CN1360267A (zh) * 2002-01-30 2002-07-24 北京大学 文件分类查找方法

Also Published As

Publication number Publication date
KR20060135820A (ko) 2006-12-29
EP1784747A4 (en) 2008-04-23
WO2005089291A2 (en) 2005-09-29
HK1116557A1 (en) 2008-12-24
JP2007529822A (ja) 2007-10-25
JP2010272141A (ja) 2010-12-02
WO2005089291A3 (en) 2007-03-29
EP3355213A1 (en) 2018-08-01
JP5395014B2 (ja) 2014-01-22
CN101124576A (zh) 2008-02-13
KR100824091B1 (ko) 2008-04-21
EP1784747A2 (en) 2007-05-16

Similar Documents

Publication Publication Date Title
CN101124576B (zh) 集成有来自信任网络的用户注释的搜索系统和方法
US11556544B2 (en) Search system and methods with integration of user annotations from a trust network
CN101438279B (zh) 包括信任网络的集成有用户判断的搜索系统和方法
CN1934569B (zh) 集成有用户注释的搜索系统和方法
US10223465B2 (en) Customizable, real time intelligence channel
KR101168705B1 (ko) 이동통신 단말기와 아이피 기반 정보 단말기를 이용한 맞춤, 지능형 심볼, 아이콘 인터넷 정보 검색시스템
US8762302B1 (en) System and method for revealing correlations between data streams
CA2824627C (en) System and method for analyzing messages in a network or across networks
US9191456B2 (en) Systems and methods for establishing or maintaining a personalized trusted social network
US10198776B2 (en) System and method for delivering an open profile personalization system through social media based on profile data structures that contain interest nodes or channels
US20080005064A1 (en) Apparatus and method for content annotation and conditional annotation retrieval in a search context
US20110082848A1 (en) Systems, methods and computer program products for search results management
US20080059454A1 (en) Search document generation and use to provide recommendations
CN104903886A (zh) 基于社交图谱信息的结构化搜索查询
KR101363497B1 (ko) Foaf 데이터 관리 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1116557

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1116557

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: FEIYANG MANAGEMENT CO., LTD.

Free format text: FORMER OWNER: YAHOO CORP.

Effective date: 20150331

TR01 Transfer of patent right

Effective date of registration: 20150331

Address after: The British Virgin Islands of Tortola

Patentee after: Fly upward Management Co., Ltd

Address before: American California

Patentee before: Yahoo Corp.