CN102792300A - 基于用户角色的可定制的语义搜索 - Google Patents

基于用户角色的可定制的语义搜索 Download PDF

Info

Publication number
CN102792300A
CN102792300A CN2011800132185A CN201180013218A CN102792300A CN 102792300 A CN102792300 A CN 102792300A CN 2011800132185 A CN2011800132185 A CN 2011800132185A CN 201180013218 A CN201180013218 A CN 201180013218A CN 102792300 A CN102792300 A CN 102792300A
Authority
CN
China
Prior art keywords
user
document
search
user role
role
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011800132185A
Other languages
English (en)
Inventor
王鲁明
杨霄鸿
A·阿米罗夫
M·侯赛因
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN102792300A publication Critical patent/CN102792300A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

提供了基于用户角色的可定制的搜索,其中在爬行时间期间可以针对用户角色或属性来评估经爬行的文档。也可以针对用户角色和/或属性对从经搜索的文档所检索到的元数据进行评估,以便可以提供基于超越文本内容之外的文档内容来排名文档的经定制的搜索结果。

Description

基于用户角色的可定制的语义搜索
背景
搜索引擎发现并存储与诸如网页之类的文档有关的信息,搜索引擎一般从文档的文本内容中检索这些信息。有时由爬行器或自动化浏览器来检索文档,它们可追踪文档中或网站上的链接。传统爬行器一般将文档作为平面文本文件来分析,检查词语以及它们的位置(例如,标题、头部或特殊字段)。关于经分析的文档的数据可被存储在索引数据库中以供在稍后查询时使用。查询可包括单个词语或词语的组合。
搜索引擎的有效性取决于其返回的结果集的相关性。尽管可能有包括特定词或短语的大量文档,但一些网页可能比其他网页更相关、更流行或更具权威性。这样,许多搜索引擎使用各种各样的方法来排名结果。一些搜索引擎使用预定的和/或层次化排列的关键字,这些关键字已经被预先编程。其他搜索引擎可以通过自动分析被定位的文本来生成索引。
一些通常没有被传统的搜索引擎考虑到的搜索方面是相同的字对于不同的用户可能具有不同的含义。而且,根据包含的信息,同一文档对于一组人员来说可能更加重要,但对于另一组人员来说可能不那么重要。而且,诸如图像、图形或文本之类的文档的不同内容可能影响该文档对于不同用户的重要性。这样,当排名文档时,基于平面文本(flattext)的搜索无法考虑到关于可用的文档的很大一部分信息。
概述
提供本概述以便以简化的形式介绍将在以下的详细描述中进一步描述的一些概念。本概述并不旨在专门标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
实施例涉及基于用户角色的可定制搜索,其中,可以针对用户角色或属性对经爬行的文档进行评估。根据一些实施例,也可以针对用户角色和/或属性对从经搜索的文档所检索到的元数据进行评估,以便可以提供基于超越文本内容之外的文档内容排名文档的经定制搜索结果。
通过阅读下面的详细描述并参考相关联的附图,这些及其他特点和优点将变得显而易见。可以理解,前述一般描述和以下的详细描述都是说明性的,并且不限制所要求保护的各方面。
附图简述
图1是说明在执行跨多个源的搜索中使用不同的用户角色的图;
图2是说明在桌面搜索环境中的基于用户角色的搜索操作的概念图;
图3是示出在联网搜索环境中的基于用户角色的搜索操作的概念图;
图4说明了根据实施例基于用户角色的搜索可如何聚焦系统中的文档的不同内容的示例;
图5是可实现根据各实施例的系统的联网环境;
图6是可实现各实施例的示例计算操作环境的框图;以及
图7示出根据各实施例的执行基于用户角色的可定制的搜索的过程的逻辑流程图。
详细描述
如上简要描述地,诸如组织分层结构、组织中的成员资格、属性等的用户角色可以被确定,并且可用于执行针对用户角色或属性评估经爬行的文档的可定制的搜索中。而且,还可以针对用户角色和/或属性评估从经搜索的文档中检索到的元数据,以便相应地排名经定制的搜索结果。这样,根据实施例的搜索引擎/应用执行从经搜索的内容、元数据、用户角色、预定规定等中得到含义的语义搜索。在以下详细描述中,参考了构成了详细描述的一部分并作为说明示出了各具体实施方式或示例的附图。可组合这些方面,可利用其他方面,并且可以做出结构上的改变而不背离本发明的精神或范围。因此,以下详细描述并不旨在限制,并且本发明的范围由所附权利要求及其等效方案来限定。
尽管在结合在个人计算机上的操作系统上运行的应用程序执行的程序模块的一般上下文中描述了各实施方式,但是本领域的技术人员会认识到各方面也可以结合其它程序模块实现。
一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。此外,本领域的技术人员可以明白,各实施例可以用其他计算机系统配置来实施,包括手持式设备、多处理器系统、基于微处理器或可编程消费电子产品、小型计算机、大型计算机以及类似计算设备。各实施例还能在任务由通过通信网络链接的远程处理设备来执行的分布式计算环境中实现。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备两者中。
各实施例可被实现为计算机实现的过程(方法)、计算系统、或者诸如计算机程序产品或计算机可读介质等制品。计算机程序产品可以是计算机系统可读并且编码包括用于使计算机或计算系统执行示例过程的指令的计算机程序的计算机存储介质。例如,计算机可读存储介质可经由易失性计算机存储器、非易失性存储器、硬盘驱动器、闪存驱动器、软盘或紧致盘和类似介质中的一个或多个来实现。
贯穿本说明书,术语“平台”可以是用于管理计算机和网络操作(其可包括搜索)的软件和硬件组件的组合。平台的示例包括但不限于,在多个服务器上执行的托管服务、在单个服务器上执行的应用以及类似系统。术语“服务器”一般指通常在联网环境中执行一个或多个软件程序的计算设备。然而,服务器还可以被实现为在被视作网络上的服务器的一个或多个计算设备上执行的虚拟服务器(软件程序)。在下面将提供关于这些技术和示例操作的详细细节。
图1是说明在执行跨多个源的搜索中使用不同的用户角色的图。一种搜索引擎的质量的度量是其返回的结果集的相关性。如前所述,搜索引擎使用各种方法来基于所述结果与其他结果相比的文档的相关性、流行度或权威性以对所述结果进行排名或对所述结果进行索引。索引还允许用户迅速找到所寻求的信息。
当用户向搜索引擎提交查询(例如通过使用关键词)时,搜索引擎可检查其索引并根据预定准则提供匹配结果的列表。该索引可根据与经爬行的文档一起存储的信息和/或用户数据以及对该信息进行索引的方法来构建。查询可包括诸如布尔运算符(例如AND(与)、OR(或)、NOT(非)等)之类的参数,这些参数允许用户细化并扩展搜索的项。
根据实施例的搜索引擎允许通过考虑用户角色/属性的增强的搜索结果的索引。如图100所示,不同的用户在一组织中可以具有不同的角色或属性,例如用户角色102、104和106。例如,文档可以包括不同用户所感兴趣的数据部分。一名教师可能对特定年份的他/她的班级的评分感兴趣,而校长则对整体评分点平均值感兴趣,而咨询者则对进度报告感兴趣。这样,对学校的同一份评分报告文档对于不同的人群可能承载可不同的权重。遵循同一示例,可以在全部都命名为评分报告的不同的文档中存储评分。向校长报告个体的评分文档可能不必要地使得校长的搜索结果变得混乱,反之亦然。而且,即使在一个文档中存储所有数据,根据实施例的搜索引擎可以基于用户的兴趣(规则)向不同的用户呈现不同的文档描述。
这样,根据一些实施例的搜索引擎108可以考虑用户的角色,并使用可定制的规则来相应地排名所述文档,所述可定制的规则被定义用来评估对于特定用户角色的文档的重要性,如下将详细描述的。用户角色可以基于在企业中的组织分层结构和/或基于用户的职业、年龄、社会地位、在一个组织(例如社交网络)中的成员资格或等级、性别等的用户属性。角色并不局限于这些示例,并且可以包括任意属性,例如爱好、对特定出版物的订阅和类似物。
用户属性可以为被用作搜索项的字定义不同的含义。例如,与针对学生的搜索相比当针对试验搜索时,医生(doctor)可以意味着不同的事物。类似地,诸如用户许可等级之类的用户凭证也可以由搜索引擎使用。在一个组织中的经理与销售代表相比可以具有不同的许可等级。这样,具有销售代表不可访问的内容的文档在一个搜索中可以被降低优先级,但是具有受限访问的文档可以被确定为对经理更加相关。
可定制的商业规则还可以定义不同的元数据组。例如,与经搜索的文档相关联的数据源、数据类型、内容分布以及类似属性可以被用于进一步增强搜索结果的排名。而且,规则可以为特定用户角色定义元数据组的重要性。例如,文档可以被标记为销售概要报告或预测报告。除了文档的内容之外,这些文档元数据可以帮助针对销售经理或市场经理以不同优先级区分文档。
为了使用基于用户角色和元数据的可定制的评估规则之外,可定制的呈现规则也可以被用于基于文档的内容和元数据的重要性来呈现搜索结果。这样,搜索引擎108可以在数据源110上执行使用可定制规则将它们在爬行时间作为查询参数来传递的搜索,所述数据源可以包括数据库服务器112、分析服务118、门户114(例如web共享服务)、桌面116以及其他数据源120。
图2是示出在桌面搜索环境中的基于用户角色的搜索操作的概念图。可以在不同的环境中执行搜索操作。一个示例的环境,在图表200中示出为用户桌面。
用户222可在他们的计算设备224中执行多个应用228。这些应用中的一些可在本地执行,而其他可以是在其他计算设备上执行并通过计算设备224来访问的分布式应用。数据230可以是由应用228所生成和/或消费或另外地存储在计算设备224中的任意数据。
搜索引擎208可以接收诸如用户角色、属性、许可和类似凭证的用户信息232,并确定用于评估文档的可定制的规则。可以通过查找(例如查找用户凭证和对应角色的表等)、推断(例如基于用户电子邮件地址推断用户角色的自动推断算法等)、定义了用户角色的预定规则或类似的方法来确定角色。可以由搜索引擎208通过用户界面输入(例如登录)或通过操作系统和/或另一应用来接收用户凭证或身份。如上所述,可以基于用户角色和搜索项由搜索应用来预先定义(例如通过管理员)或动态确定规则。例如,对“音乐”的搜索可能不考虑用户的组织地位,但他/她的年龄、在社交网络中的成员资格、语言偏好以及类似的属性要被考虑。基于评估文档内容和元数据所索引的搜索结果可以被提供给呈现应用226,该应用可以基于用户角色使用附加的可定制的规则来在将搜索结果呈现给用户222之前排名文档和相关联的元数据的呈现。
图3是示出在联网搜索环境中的基于用户角色的搜索操作的概念图。图300中示出的联网搜索环境是为了描述的目的。可在诸如基于企业的网络、基于云的网络及其组合等各种联网环境中实现各实施例。
用户322可以通过它们的客户机324与各种各样的联网服务进行交互。客户机324可指代执行一个或多个应用的计算设备、在一个或多个计算设备上执行的应用、或以分布式方式执行的且由用户322通过计算设备访问的服务。在典型的系统中,客户机324可与一个或多个服务器(例如服务器332)通信。服务器332可为用户322执行搜索操作以在服务器332本身、其他客户机334、数据存储336、网络的其他服务器338、或网络330外部的资源上搜索文档。
在示例场景中,网络330可以表示企业网络,在该网络中,用户322可以提供他们的凭证以登录(例如用户名、密码、电子邮件地址等)。基于所提供的凭证,服务器332上的搜索应用可以基于用户角色(例如企业角色)来确定可定制的规则,并评估文档和相关联的元数据。搜索还可包括网络330外部的资源,诸如服务器342或服务器346以及数据存储344,它们可通过至少一个其他网络340来访问。
如上所述,用户322可以提供用于访问网络330的凭证(例如登录、用户名/密码、证书、个人身份号和类似物),所述网络包括执行搜索应用的服务器332。用户322可以具有与不同的服务相关联的多个身份。通过从用户凭证(例如用户电子邮件地址)中推导或通过执行诸如从加密的用户凭证中通过解密得到多个用户身份的算法,这些子身份可以从通过查找操作所提供的凭证中确定。一旦确定了子身份,可以基于企业规则、关联、个人信息以及类似的数据来确定用户(322)的角色。
根据其他实施例,用户322可以通过凭证输入用户界面(例如用户名入口)提供直接提供至少一些子身份。可以按需(用户指示)、随机地或周期性地执行用户角色的确定。所确定的用户角色可以被高速缓存或持久保存以用于后续使用。无论所确定的角色是否被高速缓存,确定调度以及相关联的确定机制都可基于各个子身份来建立。
如上所述的用户角色的提供和确定方法是出于说明性目的提供的示例方法,并且并不构成对实施例的限制。可以以诸如查找操作、自动推断等使用在此所述的原理的各种方式来确定用于增强搜索操作的用户角色。
这样,在根据实施例的系统中,可以评估文档以根据各种基于用户角色的规则来确定每个文档的重要性。可以对来自文档的元数据进行分组,并且基于用户角色评估每个元数据分组。可以将对于特定用户来说被认为是更加重要的内容和/或元数据的文档可排名排得更高。还可以出于呈现目的,为每个用户角色定制每个元数据分组。
已经用具体的服务器、客户机设备、软件模块和交互描述了图1、2和3的示例系统。各实施例不限于根据这些示例配置的系统。基于用户角色的可定制的搜索系统可以在采用更少或更多组件并执行其他任务的配置中实现。此外,可以使用此处描述的原理以相似的方式来实现特定的协议和/或接口。
图4说明了根据实施例基于用户角色的搜索可如何聚焦系统中的文档的不同内容的示例。可以在任意文档类型上执行实施例,在图4中示出了两个示例文档。
文档450是示例的电子表格文档。文档450包括一个公司的销售相关的信息。文档450中的数据的各部分可能与不同的人员有关,或甚至根据不同的用户许可等级限制了其显示。例如,北美销售数据450可以与销售代表有关,但预测454可以与市场人员有关。类似地,利润报告456可以与董事有关。这样,根据一些实施例的搜索可以根据用户角色或属性检索整个文档或文档的部分。
文档460可以是具有文本和图形元素的字处理文档。根据示例场景,搜索动物故事的孩子可能对文档460的图形466和468更感兴趣。搜索故事的成人可以发现文本部分465更加相关。类似地,青少年可能对故事中的人物(character)更感兴趣,并且人物的名字462和464可以与该特定用户相关。除了示出的根据实施例可由搜索引擎相对于用户角色和属性进行评估的内容类型之外,与文档460相关联的元数据(诸如分配给文档指示文档类型的标记、所分配的关键字等或创建的日期)还可以针对用户角色被评估。
图5是可实现各实施例的示例联网环境。提供基于用户角色的可定制的搜索的平台可经由诸如托管服务等在一个或多个服务器514上执行的软件来实现。该平台可以通过网络510来与诸如智能电话513、膝上型计算机512、或台式计算机511(“客户机设备”)等各个计算设备上的客户机应用进行通信。
如上所述,在客户机设备511-513的任何一个上执行的客户机应用可向客户机设备511-513上的、服务器514上的或个体服务器516上的搜索引擎提交搜索请求。该搜索引擎可以为提交了请求的用户确定诸如企业属性、社交网络属性、许可等级和类似物的任意相关的用户角色。搜索引擎随后可以执行考虑了用户角色排名文档的搜索,如前所述。该服务可直接从数据存储519中或通过数据库服务器518检索相关数据,并且通过客户机设备511-513将经排名的搜索结果提供给用户。
网络510可包括服务器、客户机、因特网服务供应商以及通信介质的任何拓扑结构。根据各实施例的系统可以具有静态或动态拓扑结构。网络510可包括诸如企业网络等安全网络、诸如无线开放网络等非安全网络、或因特网。网络510还通过诸如公共交换电话网络(PSTN)或蜂窝网络等其他网络来协调通信。此外,网络510可包括诸如蓝牙或类似网络等短程无线网络。网络510提供此处描述的节点之间的通信。作为示例而非限制,网络510可以包括例诸如声学、RF、红外线和其它无线介质等无线介质。
可以采用计算设备、应用、数据源和数据分发系统的许多其它配置来实现基于客户机会话的调试的框架。此外,图5中所讨论的联网环境仅用于说明目的。各实施例不限于示例应用、模块、或过程。
图6及相关联讨论旨在提供对其中可实现各实施例的合适计算环境的简要概括描述。参考图6,示出了根据各实施例的用于应用的示例计算操作环境(诸如计算设备600)的框图。在基本配置中,计算设备600可以是根据各实施例的执行具有执行搜索能力的客户机应用的客户机设备、或执行具有执行搜索能力的服务的服务器,并且包括至少一个处理单元602和系统存储器604。计算设备600还可包括协作执行程序的多个处理单元。取决于计算设备的确切配置和类型,系统存储器604可以是易失性的(诸如RAM)、非易失性的(诸如ROM、闪存等)或是两者的某种组合。系统存储器604通常包括适于控制平台操作的操作系统605,诸如来自华盛顿州雷德蒙市的微软公司的
Figure BDA00002119266300071
操作系统。系统存储器604还可包括一个或多个软件应用,诸如程序模块606、有搜索能力的应用622、搜索引擎624和可任选地其他应用/数据626。
应用622可以是能够通过搜索引擎624对计算设备600中的其它应用/数据626和/或基于企业或基于云的联网环境中可用的各种数据执行搜索的任何应用。搜索引擎624可以确定用户角色和属性并定制搜索以及考虑了这些角色和属性来排名结果,如前所述。应用622以及搜索引擎624可以是独立的应用或者是所主存的服务的集成组件。该基本配置在图6中由虚线608内的那些组件示出。
计算设备600可以具有附加特征或功能。例如,计算设备600还可包括附加数据存储设备(可移动和/或不可移动),诸如,例如磁盘、光盘或磁带。在图6中通过可移动存储609和不可移动存储610示出这样的附加存储。计算机可读存储介质可以包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。系统存储器604、可移动存储609和不可移动存储610都是计算机可读存储介质的示例。计算机可读存储介质包括,但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光存储、磁带、磁盘存储或其它磁存储设备、或能用于存储所需信息且可以由计算设备600访问的任何其它介质。任何这样的计算机可读存储介质都可以是计算设备600的一部分。计算设备600也可具有输入设备612,诸如键盘、鼠标、笔、语音输入设备、触摸输入设备和类似输入设备。还可以包括输出设备614,诸如显示器、扬声器、打印机和其它类型的输出设备。这些设备在本领域中公知且无需在此处详细讨论。
计算设备600还可包含通信连接616,该通信连接允许该设备诸如通过分布式计算环境中的有线或无线网络、卫星链接、蜂窝链接、短程网络和类似机制来与其他设备618进行通信。其他设备618可包括执行通信应用的计算机设备、其他web服务器和类似设备。一个或多个通信连接616是通信介质的一个示例。通信介质可在其中包括计算机可读指令、数据结构、程序模块或其它数据。作为示例而非限制,通信介质包括诸如有线网络或直接线连接之类的有线介质,以及诸如声学、RF、红外及其他无线介质之类的无线介质。
各示例实施例还包括各种方法。这些方法可以用任何数量的方式,包括本文中所描述的结构来实现。一种此类方式是通过本文中描述的类型的设备的机器操作。
另一可任选方式是结合一个或多个人类操作者执行该方法的各个操作中的某一些来执行该方法的一个或多个操作。这些人类操作者无需彼此同在一处,而是其每一个可以仅与执行程序的一部分的机器同在一处。
图7示出根据各实施例的执行基于用户角色的可定制的搜索的过程700的逻辑流程图。过程700可实现为在服务器或客户机设备上执行的应用的一部分。
过程700始于操作710,在此对经搜索的文档进行爬行。在爬行时间期间,执行特别的处理,例如,为每个用户使用安全凭证或添加元数据。在操作720,(例如基于用户凭证)检索用户分组信息。操作730可跟随其后,其中,对搜索结果进行索引(以用于信息的快速检索)。在操作740,从用户接收搜索请求。在后续的操作750,可以基于所检索到的用户分组特定信息来确定一个或多个用户角色。用户角色可以包括与提交搜索请求的用户相关联的任意属性、许可、凭证。可以通过查找(例如查找用户凭证和对应角色的表等)、推断(例如基于用户电子邮件地址推断用户角色的自动推断算法等)、定义了用户角色的预定规则或类似的方法来确定角色。根据一些实施例,在接收搜索请求之前可能已经确定了用户角色。
在操作760,可以确定可应用的规则。可以通过用户或管理员预先定义,基于系统参数和/或在操作750处确定的用户角色来自动定义/调整所述规则。定义可应用的规则来为特定用户角色评估文档的内容以及与文档相关联的元数据的重要性。在操作770,可以使用规则来执行搜索,并在查询时间评估文档的排名。经搜索的文档内容可以包括文本数据、图形数据、视频数据、嵌入内容、字符和类似内容。根据其他实施例,可以将用户角色作为查询参数来传递。在操作780,与所发现的文档相关联的不同的元数据分组可以基于它们相对于用户角色的重要性被排序,并且被包括在经排名的结果中,在操作790,所述经排名的结果被返回给请求的应用。
包括在过程700内的各操作是用于说明目的。基于用户角色的可定制的搜索可以使用此处所述的各原理通过具有更少或更多步骤的相似过程、以及不同的操作次序来实现。
以上说明书、示例和数据提供了对各实施例的组成的制造和使用的全面描述。尽管用结构特征和/或方法动作专用的语言描述了本主题,但可以理解,所附权利要求书中定义的主题不必限于上述具体特征或动作。相反,上述具体特征和动作是作为实现权利要求和各实施方式的示例形式而公开的。

Claims (15)

1.一种至少部分地在计算设备中执行的用于执行基于用户角色的可定制的搜索的方法,所述方法包括:
爬行经搜索的内容;
检索用户分组特定信息;
基于所述用户分组特定信息索引搜索结果;
从用户接收搜索请求;
确定所述用户的用户角色;
基于所述用户角色确定用于评估文档内容的相关性的至少一个可应用的规则;
考虑所述用户角色排名所述搜索结果;以及
呈现所述搜索结果。
2.如权利要求1所述的方法,其特征在于,还包括:
基于所述用户角色确定用于评估文档元数据的相关性的至少一个其他可应用的规则;以及
基于所述至少一个其他规则评估所述文档。
3.如权利要求1所述的方法,其特征在于,还包括:
基于与所述用户角色的元数据的相关性确定用于呈现所述文档的至少一个另外的可应用的规则;以及
基于所述至少一个另外的规则呈现所述搜索结果。
4.如权利要求1所述的方法,其特征在于,所述用户角色是基于下述组中的至少一项来确定的:所述用户的组织分层结构、职业、年龄、社会地位、在一个组织中的成员资格以及性别。
5.如权利要求1所述的方法,其特征在于,所述搜索在桌面环境或联网环境之一中执行。
6.如权利要求1所述的方法,其特征在于,所述用户角色响应于下述一项来确定:预定时间段的到期、随机时间段的到期以及用户指示。
7.如权利要求1所述的方法,其特征在于,所述文档内容包括以下的组中的至少一个:文本数据、图形数据、视频数据、嵌入内容以及字符。
8.一种用于便利于联网系统中基于用户角色的可定制的搜索的服务器,所述服务器包括:
存储器;
耦合至所述存储器的处理器,所述处理器结合所述存储器中存储的指令来执行一搜索应用,其中所述搜索应用被配置成:
接收与用户相关联的用户凭证以及搜索请求;
爬行经搜索的内容;
基于所述用户凭证检索用户分组特定信息;
基于所述用户分组特定信息索引搜索结果;
基于所述用户分组特定信息为所述用户确定至少一个用户角色;
基于所述用户角色确定用于评估文档内容的相关性并评估文档元数据的相关性的可应用的规则;
基于所述可应用的规则评估文档;
呈现所述搜索结果;
基于与所述用户角色的元数据的相关性确定用于呈现所述文档的可应用的规则;以及
根据所述用于呈现所述文档的规则将经排名的搜索结果提供给客户机应用。
9.如权利要求8所述的服务器,其特征在于,基于所述文档内容和文档元数据中的至少一个被认为是与所述用户相关的文档在经呈现的搜索结果中排名较高。
10.如权利要求8所述的服务器,其特征在于,以随机、周期性和按需方式中的一个方式来确定所述用户角色,并且,存储所确定的用户角色以供后续使用。
11.如权利要求8所述的服务器,其特征在于,所述用户角色是基于下述组中的至少一项来确定的:系统规则、用户关联以及用户个人信息。
12.如权利要求8所述的服务器,其特征在于,所述搜索是对以下组中的至少一个来执行的:数据库源、分析服务、门户、另一服务器以及桌面。
13.一种其上存储有用于执行基于用户角色的可定制的搜索的指令的计算机可读存储介质,所述指令包括:
爬行经搜索的内容;
检索用户分组特定信息;
基于所述用户分组特定信息索引搜索结果;
从用户接收搜索请求;
基于下述组中的至少一项来确定多个用户角色:系统规则、用户关联、用户分组特定信息以及用户个人信息;
基于它们的内容和所述用户角色评估文档;
基于所述用户角色分组与文档相关联的元数据并评估每个元数据分组;
基于所述评估排名文档;以及
呈现包括所述经排名的文档和相关联的元数据的搜索结果。
14.如权利要求13所述的计算机可读介质,其特征在于,所述指令还包括:
基于用户角色来定制每个元数据分组以呈现所述搜索结果。
15.如权利要求13所述的计算机可读介质,其特征在于,执行所述搜索包括基于用于评估所述文档和元数据分组的用户角色来执行查询并将可定制的规则作为查询参数传递。
CN2011800132185A 2010-03-11 2011-03-09 基于用户角色的可定制的语义搜索 Pending CN102792300A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/721,704 US20110225139A1 (en) 2010-03-11 2010-03-11 User role based customizable semantic search
US12/721,704 2010-03-11
PCT/US2011/027785 WO2011112744A2 (en) 2010-03-11 2011-03-09 User role based customizable semantic search

Publications (1)

Publication Number Publication Date
CN102792300A true CN102792300A (zh) 2012-11-21

Family

ID=44560895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011800132185A Pending CN102792300A (zh) 2010-03-11 2011-03-09 基于用户角色的可定制的语义搜索

Country Status (9)

Country Link
US (1) US20110225139A1 (zh)
EP (1) EP2545469A4 (zh)
JP (1) JP2013522731A (zh)
CN (1) CN102792300A (zh)
AU (1) AU2011224385A1 (zh)
BR (1) BR112012022869A2 (zh)
CA (1) CA2789899A1 (zh)
RU (1) RU2012138707A (zh)
WO (1) WO2011112744A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103794216A (zh) * 2014-02-12 2014-05-14 能力天空科技(北京)有限公司 一种语音混音处理方法及装置
CN105512232A (zh) * 2015-11-30 2016-04-20 北京金山安全软件有限公司 数据存储方法及装置
CN105512230A (zh) * 2015-11-30 2016-04-20 北京金山安全软件有限公司 数据存储方法及装置
CN107466403A (zh) * 2015-05-28 2017-12-12 谷歌公司 对于数据资源的访问控制

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012003779A1 (en) * 2010-07-03 2012-01-12 Vitacount Limited Resource hubs for heterogeneous groups
US20120239381A1 (en) 2011-03-17 2012-09-20 Sap Ag Semantic phrase suggestion engine
US8527451B2 (en) 2011-03-17 2013-09-03 Sap Ag Business semantic network build
WO2012145931A1 (en) * 2011-04-29 2012-11-01 Nokia Corporation Method and apparatus for context-aware role modeling and recommendation
US8326862B2 (en) 2011-05-01 2012-12-04 Alan Mark Reznik Systems and methods for facilitating enhancements to search engine results
US11841912B2 (en) 2011-05-01 2023-12-12 Twittle Search Limited Liability Company System for applying natural language processing and inputs of a group of users to infer commonly desired search results
US8725760B2 (en) 2011-05-31 2014-05-13 Sap Ag Semantic terminology importer
US20120324538A1 (en) * 2011-06-15 2012-12-20 Cisco Technology, Inc. System and method for discovering videos
US10013493B1 (en) * 2011-07-13 2018-07-03 Google Llc Customized search engines
US8935230B2 (en) 2011-08-25 2015-01-13 Sap Se Self-learning semantic search engine
US8812496B2 (en) * 2011-10-24 2014-08-19 Xerox Corporation Relevant persons identification leveraging both textual data and social context
US9558294B2 (en) * 2012-02-08 2017-01-31 Microsoft Technology Licnesing, Llc Asynchronous caching to improve user experience
US9460303B2 (en) * 2012-03-06 2016-10-04 Microsoft Technology Licensing, Llc Operating large scale systems and cloud services with zero-standing elevated permissions
US9195759B2 (en) * 2012-03-27 2015-11-24 Varonis Systems, Ltd. Method and apparatus for enterprise-level filtered search
US11593326B2 (en) * 2012-10-08 2023-02-28 GiantChair, Inc. Method and system for managing metadata
US9645914B1 (en) * 2013-05-10 2017-05-09 Google Inc. Apps store with integrated test support
US20140344952A1 (en) * 2013-05-14 2014-11-20 Google Inc. Indexing and searching documents with restricted portions
US10607232B2 (en) 2014-08-26 2020-03-31 Accenture Global Services Limited Automatic assistance for resource reuse based on context extracted from a user workspace
WO2016133538A1 (en) * 2015-02-20 2016-08-25 Hewlett Packard Enterprise Development Lp Search query modification using personalized profile
US9762585B2 (en) 2015-03-19 2017-09-12 Microsoft Technology Licensing, Llc Tenant lockbox
US11062016B2 (en) * 2015-04-24 2021-07-13 Splunk Inc. Systems and methods for verifying user credentials for search
US10931682B2 (en) 2015-06-30 2021-02-23 Microsoft Technology Licensing, Llc Privileged identity management
JP6600203B2 (ja) * 2015-09-15 2019-10-30 キヤノン株式会社 情報処理装置、情報処理方法、コンテンツ管理システム、およびプログラム
US10171472B2 (en) * 2016-03-02 2019-01-01 Microsoft Technology Licensing, Llc Role-specific service customization
US10606821B1 (en) 2016-08-23 2020-03-31 Microsoft Technology Licensing, Llc Applicant tracking system integration
WO2019226837A1 (en) * 2018-05-23 2019-11-28 Liteswap, Inc. Systems supporting luminaire selection and architectural design
US11223626B2 (en) * 2018-06-28 2022-01-11 Elasticsearch B.V. Service-to-service role mapping systems and methods

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6327590B1 (en) * 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
CN1858733A (zh) * 2005-11-01 2006-11-08 华为技术有限公司 信息检索系统和检索方法
US20070208755A1 (en) * 2006-03-01 2007-09-06 Oracle International Corporation Suggested Content with Attribute Parameterization
CN101052181A (zh) * 2007-05-22 2007-10-10 中国移动通信集团浙江有限公司 一种无线搜索系统及其无线搜索方法
CN101320373A (zh) * 2008-06-13 2008-12-10 华中科技大学 网站支撑数据库安全搜索引擎系统
WO2009047674A2 (en) * 2007-10-08 2009-04-16 Koninklijke Philips Electronics N.V. Generating metadata for association with a collection of content items

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6598046B1 (en) * 1998-09-29 2003-07-22 Qwest Communications International Inc. System and method for retrieving documents responsive to a given user's role and scenario
JP3601675B2 (ja) * 1999-06-04 2004-12-15 富士通株式会社 情報検索装置、情報検索方法、及び記録媒体
US7181438B1 (en) * 1999-07-21 2007-02-20 Alberti Anemometer, Llc Database access system
US9235849B2 (en) * 2003-12-31 2016-01-12 Google Inc. Generating user information for use in targeted advertising
US20070136251A1 (en) * 2003-08-21 2007-06-14 Idilia Inc. System and Method for Processing a Query
US7693827B2 (en) * 2003-09-30 2010-04-06 Google Inc. Personalization of placed content ordering in search results
US20050071328A1 (en) * 2003-09-30 2005-03-31 Lawrence Stephen R. Personalization of web search
JP2005352687A (ja) * 2004-06-09 2005-12-22 Fuji Xerox Co Ltd 文書検索用プログラム、文書検索システムおよび文書検索方法
US8335753B2 (en) * 2004-11-03 2012-12-18 Microsoft Corporation Domain knowledge-assisted information processing
US9135304B2 (en) * 2005-12-02 2015-09-15 Salesforce.Com, Inc. Methods and systems for optimizing text searches over structured data in a multi-tenant environment
US8875249B2 (en) * 2006-03-01 2014-10-28 Oracle International Corporation Minimum lifespan credentials for crawling data repositories
US20080104042A1 (en) * 2006-10-25 2008-05-01 Microsoft Corporation Personalized Search Using Macros
US20090006364A1 (en) * 2007-06-28 2009-01-01 International Business Machines Corporation Extending a seed list to support metadata mapping
JP5156326B2 (ja) * 2007-10-12 2013-03-06 株式会社日立システムズ 検索システム
KR101008877B1 (ko) * 2007-12-06 2011-01-17 한국전자통신연구원 디지털 포렌식에서의 검색 및 검색 결과를 제시하는 방법, 그리고 그 장치
US8260772B2 (en) * 2008-01-31 2012-09-04 SAP France S.A. Apparatus and method for displaying documents relevant to the content of a website
US20090204590A1 (en) * 2008-02-11 2009-08-13 Queplix Corp. System and method for an integrated enterprise search
JP5102650B2 (ja) * 2008-02-26 2012-12-19 株式会社リコー 情報検索システム、情報検索方法、情報検索プログラム及び記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6327590B1 (en) * 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
CN1858733A (zh) * 2005-11-01 2006-11-08 华为技术有限公司 信息检索系统和检索方法
US20070208755A1 (en) * 2006-03-01 2007-09-06 Oracle International Corporation Suggested Content with Attribute Parameterization
CN101052181A (zh) * 2007-05-22 2007-10-10 中国移动通信集团浙江有限公司 一种无线搜索系统及其无线搜索方法
WO2009047674A2 (en) * 2007-10-08 2009-04-16 Koninklijke Philips Electronics N.V. Generating metadata for association with a collection of content items
CN101320373A (zh) * 2008-06-13 2008-12-10 华中科技大学 网站支撑数据库安全搜索引擎系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103794216A (zh) * 2014-02-12 2014-05-14 能力天空科技(北京)有限公司 一种语音混音处理方法及装置
CN103794216B (zh) * 2014-02-12 2016-08-24 能力天空科技(北京)有限公司 一种语音混音处理方法及装置
CN107466403A (zh) * 2015-05-28 2017-12-12 谷歌公司 对于数据资源的访问控制
CN105512232A (zh) * 2015-11-30 2016-04-20 北京金山安全软件有限公司 数据存储方法及装置
CN105512230A (zh) * 2015-11-30 2016-04-20 北京金山安全软件有限公司 数据存储方法及装置
CN105512232B (zh) * 2015-11-30 2020-02-28 北京金山安全软件有限公司 数据存储方法及装置
CN105512230B (zh) * 2015-11-30 2020-05-22 北京金山安全软件有限公司 数据存储方法及装置

Also Published As

Publication number Publication date
RU2012138707A (ru) 2014-03-20
EP2545469A4 (en) 2015-11-18
WO2011112744A2 (en) 2011-09-15
BR112012022869A2 (pt) 2018-05-08
EP2545469A2 (en) 2013-01-16
JP2013522731A (ja) 2013-06-13
CA2789899A1 (en) 2011-09-15
US20110225139A1 (en) 2011-09-15
AU2011224385A1 (en) 2012-09-20
WO2011112744A3 (en) 2011-11-24

Similar Documents

Publication Publication Date Title
CN102792300A (zh) 基于用户角色的可定制的语义搜索
CN103177052B (zh) 基于相关度的聚合社交馈送
JP6408662B2 (ja) 自然言語処理に基づく、種々のオブジェクトに対する係数付与
US10354083B2 (en) Social network site including trust-based wiki functionality
JP5230751B2 (ja) 社会的行動分析及び語彙分類を用いた推奨システム
CN102890696B (zh) 基于社交网络的上下文排序
JP5592505B2 (ja) トピックに基づいて調整可能なデーター・フィードの総計
US8352396B2 (en) Systems and methods for improving web site user experience
US10216851B1 (en) Selecting content using entity properties
US20130085745A1 (en) Semantic-based approach for identifying topics in a corpus of text-based items
US20110060717A1 (en) Systems and methods for improving web site user experience
US20170262653A1 (en) Abstracted Graphs from Social Relationship Graph
TW201104617A (en) Activity based users' interests modeling for determining content relevance
Melucci Contextual search: A computational framework
CN101583945A (zh) 提供虚拟的真正简单聚合(rss)订阅源
JP2008539508A (ja) 電子文書を使った情報の関連付け
US20110246520A1 (en) Method and system for performing an authority analysis
KR20160026907A (ko) 개체 확장을 이용한 인물 탐색 기법
Issa et al. Understanding the spatio-temporal characteristics of Twitter data with geotagged and non-geotagged content: two case studies with the topic of flu and Ted (movie)
Upadhyaya et al. Quality of experience: What end-users say about web services?
US9400789B2 (en) Associating resources with entities
US20140280038A1 (en) Delivering a filtered search result
US8527494B2 (en) Tools discovery in cloud computing
US9104777B2 (en) Method for improving accessibility to rich internet applications through collaborative crawling and computer program for the same
US11250079B2 (en) Linked network presence documents associated with a unique member of a membership-based organization

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150724

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150724

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

C05 Deemed withdrawal (patent law before 1993)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121121