CN103049531A - 用于意图分析、排序和关联性的对本地和远程数据源的基于客户端的搜索 - Google Patents

用于意图分析、排序和关联性的对本地和远程数据源的基于客户端的搜索 Download PDF

Info

Publication number
CN103049531A
CN103049531A CN2012105639614A CN201210563961A CN103049531A CN 103049531 A CN103049531 A CN 103049531A CN 2012105639614 A CN2012105639614 A CN 2012105639614A CN 201210563961 A CN201210563961 A CN 201210563961A CN 103049531 A CN103049531 A CN 103049531A
Authority
CN
China
Prior art keywords
information
search
local
data
assembly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012105639614A
Other languages
English (en)
Inventor
B.麦克唐纳
M.莱恩
B.萨里恩
A.D.潘迪
G.普拉贾帕蒂
K.戈帕尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN103049531A publication Critical patent/CN103049531A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Abstract

一种搜索引擎,其驻留在本地计算机上以能够进行查询意图分析、结果排序和对本地数据源及远程数据源两者的数据进行关联性处理。该架构还采用全局访问组件,该组件是对不同的数据发现范例的统一接口。全局访问组件提供对对应的不同的范例数据集的访问以创建信息聚合。本地搜索引擎经由全局访问组件从不同的数据集创建信息聚合,并且处理针对该信息聚合的查询以返回搜索结果。

Description

用于意图分析、排序和关联性的对本地和远程数据源的基于客户端的搜索
背景技术
随着技术的不断发展,内容创建和发布已经变得大众化,因此通过在因特网和社交网络上发布内容以用于消费,在任何地点和任何设备上的任何人都可以是内容发布者(和可能的创建者)。类似地,在相连的企业环境中,用户能通过共享服务等发布内容以用于企业内部消费。然而,个人用户创建和/或发布的这种能力已经显现为独立的(分开的)内容可视化,并且提供对于给定主题通用的整个内容的片段视图。此外,数据隐含的社会因素是无法知晓的。缺乏通过它来对接和搜索对应范例的数据的单个总体的搜索框架。因此,内容消费者需要知道在其下存储不同的数据类型的单独的内容存储和发现范例,例如,用于网页内容的搜索引擎和用于本地/企业内容的操作系统搜索能力。
发明内容
以下给出经简化的内容提要,以便提供对本文所述一些新颖实施例的基本认识。该内容提要并不是详尽综述,并且也不旨在标识关键/必要要素或界定其范围。其唯一目的是以简化的形式提出某些概念,作为之后提出的更详细描述的序言。
所公开的架构包括驻留在本地客户端设备(例如计算机、手机等)上的搜索引擎,其使得能够对本地数据源和远程数据源两者的数据进行查询意图分析、结果排序和关联性处理。数据源包括但不限于:本地数据,例如,硬盘驱动器、闪速驱动器、文档、用户配置文件信息、诸如家庭网络的本地网络、诸如台式机、膝上型计算机、手机、平板电脑等的其它本地用户机器和设备;网络数据源,例如,企业数据储存库和企业用户机器/设备;以及基于网络的数据源,例如,社交网络和网站。本地结果可以用网络结果来扩充,但本地结果和网络结果也可以分开。
该架构还采用全局访问组件,该组件是对不同的数据发现范例的统一接口。全局访问组件提供对对应的不同的范例数据集的访问以创建信息聚合。本地搜索组件经由全局访问组件从不同的数据集创建信息聚合,并且处理针对该信息聚合的查询以返回搜索结果。本地搜索组件进行用于推断查询意图的查询意图分析、搜索结果排序、以及基于查询意图的搜索结果关联性处理。
为了完成前述和相关的目标,本文结合下面的描述和附图描述了某些示例性的方面。这些方面表明的只是本文所公开的原理可被实践的各种方式,并且本发明的所有方面和等同物都旨在包括在要求保护的主题的范围内。根据结合附图时考虑的以下详细描述,其它优点和新颖特征将变得显而易见。
附图说明
图1示出根据所公开的架构的系统。
图2示出具有用于查询处理和因特网分析、排序及关联性处理的本地搜索组件的更详细系统。
图3示出可选提取技术的搜索系统。
图4示出根据所公开的架构的搜索系统。
图5示出用于生成网站建议的系统。
图6示出根据所公开的架构的方法。
图7示出图6的方法的另外的方面。
图8示出根据所公开的架构的备选方法。
图9示出图8的方法的另外的方面。
图10示出根据所公开的架构的计算系统的框图,该系统执行用于查询意图分析、排序和关联性的本地搜索引擎以及对不同数据集的全局访问。
具体实施方式
所公开的架构为驻留在本地设备(例如计算机、手机、平板电脑等)上的基于客户端的搜索引擎,其使得能够对本地数据源和远程数据源两者的数据进行查询意图分析、结果排序和关联性处理。数据源包括例如客户端设备数据、基于企业的数据和基于网络的数据、以及能从这些源中的一个或多个或在它们中导出的任何社会方面,并且社会方面为做出诸如用户意图的关于用户搜索的推断提供基础。例如,当用户登入社交网络时,数据能与朋友和家人有关。当用户使用公司凭证登入到公司网络时,数据能与雇员和专业交往有关。
另外,当用户访问公司网络时,可以访问诸如电子邮件、文本消息、公司搜索历史、电话、公司数据、工作组成员等的数据。实质上,可以在至少所有这些网络上搜索网络图、社交图、以及从人员角度和数据角度与企业有关的图。因此,所有这些范畴的数据类型(例如,办公套件应用、通信应用、文档等)具有多种不同的类型。
此外,该架构包括这样的应用,其能够智能地调用相关联的不同数据集的每个实现范例并为内容消费者提供对跨越数据竖井(silo)的内容的整体观。
一般地,可搜索的信息索引被创建和发布。服务为用户聚合信息。提取主项和主题以便对信息聚合进行归类、分组和浏览。因此,在不同的数据范例中提供单个搜索源。
基于信息的关联性在组合索引上对搜索结果分类。用于计算关联性的变量基于使用环境而变化。例如,如果用户正在寻找该用户最近修改的文件,那么上次修改的日期可能与该用户可能已提供的任何搜索查询一起是最高相关因素之一。
该架构在客户端系统、企业和网络的信息源以及企业连接和社交连接中查找所有内容,并且具体而言例如与特定主题有关的内容,从所聚合的信息中识别“热点”和/或流行主题,识别用户兴趣,并且分居数据网站建议网站。
可以在浏览器、网络和本地搜索引擎上创建整理过的搜索历史列表,这使得用户能够快速地再次查找信息。
可以创建(例如通过选择加入)用户的可移植搜索配置文件(例如,在社会关系方面),使得用户能随后使用任何所选设备。用户也可以选择与具有诸如针对在线零售商和购物网站的推荐服务的网站共享搜索配置文件。搜索配置文件是这样的网站可以选择使用以改进为其用户提供的推荐服务的附加信息。另外,搜索配置文件的共享可通过例如商定的购物折扣来激励。
该架构可以扩展至在诸如平台搜索、浏览器应用和/或网络搜索引擎的其它应用中使用聚合的信息以用于自动搜索查询建议。智能分组和搜索能力可用来集成结果。即时消息传送应用、电子邮件应用、社交应用、图像、视频、语音应用(例如VOIP)或依赖于联系人信息的任何应用都可以与合并的联系人集成。
此外,通过创建网络版本而使跨设备场景成为可能,该网络版本与所有云应用集成以创建用户信息的统一索引。
现在参考附图,其中贯穿附图相同的附图标记用来表示相同的要素。在以下描述中,为了说明起见,提出许多具体细节,以便提供对它们的透彻理解。然而,可能显而易见的是,新颖实施例可以在没有这些具体细节的情况下实施。在其它情况中,以框图形式示出了熟知的结构和设备,以便有利于对它们进行描述。其目的在于涵盖落在要求保护的主题的精神和范围内的所有修改、等同物和替换形式。
图1示出根据所公开的架构的搜索系统100。系统100包括作为不同数据发现范例104的统一接口的全局访问组件102。全局访问组件102提供对发现范例104的对应不同数据集106的访问。本地搜索组件108经由全局访问组件102而创建来自不同数据集106的信息的聚合110,并且针对信息的聚合110处理查询112以返回搜索结果114。本地搜索组件108进行用于推断查询意图的查询112的意图分析、搜索结果排序、以及基于查询意图的搜索结果关联性处理。
本地搜索组件108从信息的聚合110创建数据的统一索引,其包括与用户有关的社会方面和从不同数据集导出的用户数据。不同数据发现范例104包括基于客户端的(本地)范例和基于网络的范例(例如,企业、因特网、社交网络等)。搜索结果114包括与用户有关的基于客户端的(本地)结果(例如,本地应用、本地存储设备等的结果)以及与用户有关的客户端数据及网络结果(例如,来自基于网络的数据源、企业数据源等)和用户的基于网络的数据。搜索结果114可分成本地结果和网络结果,以用于呈现给用户。不同的数据发现范例104涉及与例如联系人、消息、文档或网站中的至少一个相关联的数据集。本地搜索组件108(从聚合110)提取主项和主题以便对数据集进行归类、分组和浏览。本地搜索组件108从信息聚合的统一索引识别流行(和热点)主题。本地搜索组件108经由信息的聚合110识别用户兴趣并基于用户兴趣建议网站。
图2示出具有用于查询处理和因特网分析、排序及关联性处理的本地搜索组件的更详细系统200。系统200包括用于聚合来自不同的源的人员信息的人员聚合组件202。
人员信息组件202可包括联系人枚举和合并服务204,该服务访问来自各种本地和远程源的联系人信息。服务204聚合来自不同源的所有用户联系人。服务204调用不同源服务的API(应用接口)以获得联系人列表,然后基于诸如电子邮件识别符、名+姓等的共同因素进行联系人的合并。
系统200可包括但不限于与下列对象的集成:在本地设备边界内用于联系人的客户端通信应用206(例如,LyncTM);用于来自本地设备边界内的电子邮件程序(例如,OutlookTM)的联系人的套件应用208;在企业边界内来自企业网络210的联系人信息;以及来自因特网的诸如SkypeTM、FacebookTM、TwitterTM等的社交网络212(例如,社交1、社交2和社交3)的联系人信息。
系统200可扩展至包括其它企业级社交网络、诸如Google+TM的公用网络、诸如ThunderbirdTM的电子邮件客户端、诸如GmailTM的网络电子邮件、诸如Yahoo MessengerTM的即时消息传送客户端,等等。服务204可以按预定间隔轮询API以获得对联系人的任何添加或更新。因此,服务204创建来自不同的源的合并的联系人的单个数据库214。
系统200还可包括作为人员聚合组件202一部分的消息枚举服务216,以用于聚合来自不同源的消息信息。这里,系统200示出了对来自例如在本地设备边界内的电子邮件程序(例如OutlookTM)的套件应用208的消息以及来自社交网络212的消息信息的提取和处理。服务216聚合来自不同源的所有消息。服务216调用不同源的API以提供消息的列表。在服务216下载和创建来自社交网络的所有消息的本地副本的同时,出于性能原因,可以实时链接到来自电子邮件程序的电子邮件。
系统200可扩展至包括其它企业级社交网络、诸如Google+TM的公用网络、诸如ThunderbirdTM的电子邮件客户端、诸如GmailTM的网络电子邮件、诸如Yahoo MessengerTM的即时消息传送客户端,等等。服务204可以按预定间隔轮询API以获得对消息的任何添加或更新。服务216创建从不同的源获得的消息的单个数据库218。
系统200还可包括聚合来自不同源的文档的列表的文档聚合组件220。文档聚合组件220包括文档枚举服务222,该服务调用不同源的API以提供文档的列表。出于性能原因,服务222仅保持到文档位置的指针的列表以及文档元数据;然而,这可以扩展至缓存或索引文档。这里,文档枚举服务222与本地设备边界内的套件应用208和本地/网络驱动器224、企业边界内的企业文档储存库226、以及因特网上的文档228接合。服务222创建从不同的源获得的文档的单个数据库230。服务222按预定间隔轮询API,以获得对文档和文档元数据的任何更新或添加。
系统200还包括经由网站聚合组件232的网站信息聚合。网站聚合组件232包括链接枚举服务234,该服务聚合来自不同源的所有链接和站点。这里,服务234接合到本地设备边界内的浏览器历史和收藏夹信息236、企业边界内的企业文档储存库226、以及因特网的社交网络中的一些。服务234调用不同源的API以提取和创建站点及链接的列表。服务234创建来自不同的源的链接的单个数据库238。
出于性能原因,服务234仅保持到站点的链接的列表以及相关联的元数据;然而,这可以包括链接的缓存或索引。服务234按一定时间间隔轮询API,以获得对链接和相关联的元数据的任何更新或添加。
该系统可包括其它服务,例如聚合跨越源的媒体文件的媒体文件聚合组件(未示出)。该组件包括聚合跨越大量使用的源的所有媒体文件(例如,照片、文本、音乐和电影)的服务。服务调用不同源的API以提取和创建媒体文件的分组且可浏览的列表。
出于性能原因,服务可配置成仅保持到媒体文件的链接的列表以及源所提供的任何元数据。元数据属性用来允许索引以及过滤以用于浏览文件。系统200可与媒体播放器、照片应用、绘画程序、照片增强程序和通常用来存储照片和视频的文件夹集成。作为扩展,可从诸如在线音乐服务等的其它大量使用的工具提取文件元数据。服务以预定间隔轮询源API,以获得对于文件及相关联的元数据的任何更新或添加。
基于上下文的主导主题而对所有上述内容进行归类和分组,以辅助用户浏览信息并找到所需内容。主题可以是贯穿消息和文档的主导主题,发送者可以是消息中的主导主题,站点类别可以是链接中的主导主题,并且新近性可以是贯穿联系人、消息、文档和站点的主导主题。
图3示出可选的提取技术的搜索系统300。在第一提取实施方式(用虚线表示)中,本地搜索组件108包括可用来提取主项和识别主题以对信息分组的关键词提取服务302和关键词频率。分组的信息存储在数据存储304中。在备选方法中,新创建的实体提取服务306或现有的实体提取服务(本地或基于云的)可用来识别要依据其分组的主题。
图4示出根据所公开的架构的搜索系统400。系统400提供用于在信息聚合中搜索的备选选项:使用互连虚线的第一系统选项和使用互连点划线的第二系统选项。第一系统选项采用用于本地设备边界内的人员(联系人和消息)、文档和站点的关键词提取的本地搜索组件108来输出搜索结果114。第二系统选项采用搜索聚合服务402来创建搜索聚合404,搜索聚合404仅从本地设备边界内的内容获得,但也经由企业边界内的企业文档储存库搜索服务406和因特网边界内的网络搜索引擎408而获得。
相对于在聚合信息中的搜索,本地设备搜索引擎可以被使用或扩展至搜索联系人和信息的统一的组。搜索文档和链接元数据被使能但可以扩展至搜索文档的内容或站点内容。这可以通过多种方式实现,其中一些描述如下。
可以创建文档和站点内容的临时副本,并且使用操作系统的搜索能力(或任何本地设备搜索引擎)来在内容中进行索引和搜索。这涉及第一系统选项。
备选地或与其结合,操作系统搜索能力(或任何本地设备搜索引擎)可用来在本地内容中搜索,与任何现有的企业搜索引擎集成以在来自企业储存库的内容中搜索,并且使用(多个)网络搜索引擎408来在网站的内容中搜索。可以使用OpenSearch协议来实现这一目的。这涉及第二系统选项。
对于网络版本的解决方案来说,可以利用网络搜索引擎的索引能力,其中本地搜索组件108可以是网络搜索引擎。这涉及第一系统选项。
相对于从消息、文档或站点提取实体以查找相关内容,这类似于以上归类和分类的描述。当用户选择项目(例如,电子邮件)时,可使用与图3相同的系统300来从该项目(例如,电子邮件)中提取主导的关键词。然后可采用图4的系统400来查找所有相关内容。
为方便浏览而用来对内容归类、分类或分组的系统300可用来识别由用户接收的消息中的首要项和该首要项在消息中的频率。这有助于识别由用户接收的消息中讨论最多的“热点”主题。
图5示出用于生成网站建议的系统500。聚合的链接数据库238和搜索引擎建议网络服务502可用来建议与用户的兴趣有关的新站点。
相对于可移植搜索配置文件,本地搜索组件108可基于从用户的文档、联系人和用户经常访问的网站提取的实体而生成基于分类法的用户属性的集合。具有针对用户的具体值的属性集合可形成搜索配置文件。每个属性可具有具体值。例如,诸如性别、年龄、第一地理位置、第二/第三地理位置、常去的旅行目的地、与个人网络共同/共享且来自本地媒体文件的音乐兴趣、与个人网络共同/共享的且来自本地媒体文件的电影兴趣、个人音乐兴趣、个人电影兴趣等的基本要素。
当用户决定选择与购物站点(或将在未来任何搜索配置文件有用的任何其它类别的站点)共享该搜索配置文件时,可以有趣的方式使用个人兴趣与共享兴趣之间的区别。利用个人兴趣,购物站点可以进行针对用户的推荐。利用共享的兴趣,购物站点可以作出针对用户与之共享兴趣的人群的推荐。在用户可能想要为例如在家中晚宴宴请的一群朋友购买外卖食物的场景下,这可能是有用的。其它场景包括用户为晚上的约会购票或用户想要为晚上的家庭影院体验租部电影。
搜索配置文件能力还包括使用户能够选择暴露例如用户兴趣、历史、收藏和热点主题。这可以通过用于授权和安全管理用户信息的安全组件来提供便利。安全组件允许订户选择加入和选择退出跟踪信息以及可能在签名时获得且随后被利用的个人信息。
本文包括一组流程图,其表示用于执行所公开的架构的新颖方面的示例性方法。虽然为了简化说明的目的,此处所示一种或多种方法例如以流程图或流程图表形式示出和描述为一系列动作,但应当理解和知道,这些方法不受动作的顺序限制,因为某些动作可以根据其以不同的顺序发生和/或与本文示出和描述的其它动作同时发生。例如,本领域的技术人员将理解和知道,方法可以备选地表示为一系列相互联系的状态或事件,例如在状态图中。此外,并非方法中示出的所有动作都是新颖实施所需的。
图6示出根据所公开的架构的方法。在600中,从对应数据发现范例的不同数据集在本地创建信息的聚合。在602中,针对信息的聚合在本地处理查询以返回搜索结果。在604中,从搜索结果导出查询意图。在606中,基于结果的来源对结果排序。在608中,针对具体主题的关联性处理排序的搜索结果。在610中,输出相关的搜索结果。
图7示出图6的方法的另外的方面。注意流程显示,每个框可表示可以单独或与其它框组合而包括在内的步骤,以作为由图6的流程图表示的方法的附加方面。在700中,在本地索引来自对应的不同数据范例的不同数据集。在702中,从信息的聚合中识别流行主题。在704中,识别用户兴趣并基于用户兴趣而建议网站。在706中,存储从浏览器、本地搜索和网络搜索收集的整理过的搜索历史以便随后用于再次查找搜索信息。在708中,创建给定用户的可移植搜索配置文件以便在相关联的用户设备上使用。在710中,针对其它本地应用的搜索建议而访问信息的聚合。
图8示出根据所公开的架构的备选方法。在800中,在本地从本地数据集和基于网络的数据集创建信息的聚合。在802中,在本地从信息的聚合提取主导的项和主题,以便对信息的聚合进行归类、分组和浏览。在804中,针对信息的聚合在本地处理查询,以返回来自本地数据集和基于网络的数据集的搜索结果。在806中,从搜索结果导出查询意图。在808中,基于结果的来源对结果排序。在810中,基于源对排序的搜索结果进行针对关联性的处理。在812中,输出相关的搜索结果。
图9示出图8的方法的另外的方面。注意流程显示,每个框可表示可以单独或与其它框组合而包括在内的步骤,以作为由图8的流程图表示的方法的附加方面。在900中,根据本地结果和网络结果将搜索结果分开。在902中,创建本地数据集和基于网络的数据集的数据发现范例的单个不同的数据集接口,以生成从本地数据集和基于网络的数据集导出的信息的聚合。在904中,查找与感兴趣的具体主题相关的信息的聚合中的所有内容。
如本申请中所用,术语“组件”和“系统”旨在指与计算机有关的实体,其是硬件、软件与有形硬件的组合、软件、或执行中的软件。例如,组件可以是但不限于:有形组件,例如,处理器、芯片存储器、大容量存储设备(例如,光学驱动器、固态驱动器、和/或磁性存储介质驱动器)和计算机;以及软件组件,例如,在处理器上运行的进程、对象、可执行文件、数据结构(存储在易失性或非易失性存储介质中)、模块、执行的线程、和/或程序。举例而言,在服务器上运行的应用和服务器均可以是组件。一个或多个组件可以驻留在进程和/或执行的线程内,并且组件可以位于一个计算机上和/或分布在两个或更多个计算机之间。词语“示例性”可以在本文中用来表示充当示例、实例或例示。本文描述为“示例性”的任何方面或设计未必理解为相比其它方面或设计优选或有利。
现在参看图10,示出了根据所公开的架构的计算系统1000的框图,该系统执行用于查询意图分析、排序和关联性的本地搜索引擎以及对不同数据集的全局访问。然而,应当理解,所公开的方法和/或系统的某些或所有方面可以实现为片上系统,其中模拟、数字、混合信号和其它功能被制造在单个芯片基板上。为了提供针对其各个方面的附加的上下文,图10和下面的描述旨在提供对可以在其中实现各个方面的合适计算系统1000的简要的一般性描述。虽然以上描述是在可以在一个或多个计算机上运行的计算机可执行指令的一般背景中,但本领域的技术人员将认识到,也可以结合其它程序模块和/或作为硬件和软件的组合而实现新颖实施例。
用于实现各个方面的计算系统1000包括计算机1002,其具有(多个)处理单元1004、诸如系统存储器的计算机可读存储装置1006、以及系统总线1008。(多个)处理单元1004可以是各种市售处理器中的任一种,例如,单处理器、多处理器、单芯单元和多芯单元。此外,本领域的技术人员将会知道,可以用其它计算机系统配置实施新颖方法,包括微型计算机、大型计算机、以及个人计算机(例如,台式计算机、膝上型计算机等)、手持计算设备、基于微处理器或可编程的消费性电子产品等,其中每一个都能操作性地耦接到一个或多个相关联的设备。
系统存储器1006可包括计算机可读存储装置(物理存储介质),例如,易失性(VOL)存储器1010(例如,随机存取存储器(RAM))和非易失性存储器(NON-VOL) 1012(例如,ROM、EPROM、EEPROM等)。基本输入/输出系统(BIOS)可以存储在非易失性存储器1012中,并且包括基本例程,其有利于例如在启动期间在计算机1002内的组件之间的数据和信号的传送。易失性存储器1010还可包括用于高速缓存数据的高速RAM,例如静态RAM。
系统总线1008为包括但不限于系统存储器1006的系统组件提供到(多个)处理单元1004的接口。系统总线1008可以是若干类型的总线结构中的任一种,其可以使用多种市售总线架构中的任一种进一步互连到存储器总线(带有或不带有存储器控制器)和外围总线(例如,PCI、PCIe、AGP、LPC等)。
计算机1002还包括(多个)机器可读存储子系统1014和(多个)存储接口1016,存储接口1016用于将(多个)存储子系统1014接合到系统总线1008和其它所需的计算机组件。(多个)存储子系统1014(物理存储介质)可包括例如硬盘驱动器(HDD)、磁性软盘驱动器(FDD)和/或光盘存储驱动器(例如,CD-ROM驱动器、DVD驱动器)中的一个或多个。(多个)存储接口1016例如可包括诸如EIDE、ATA、SATA和IEEE 1394的接口技术。
一个或多个程序和数据可存储在存储器子系统1006、机器可读且可移动的存储器子系统1018(例如,闪速驱动器形式因素技术)、和/或(多个)存储子系统1014(例如,光学、磁性、固态),包括操作系统1020、一个或多个应用1022、其它程序模块1024和程序数据1026。
操作系统1020、一个或多个应用1022、其它程序模块1024和/或程序数据1026可包括例如图1的系统100的实体和组件、图2的系统200的实体和组件、图3的系统300的实体和组件、图4的系统400的实体和组件、图5的系统500的实体和组件、以及图6-9的流程图表示的方法。
通常,程序包括执行特定任务或实现特定抽象数据类型的例程、方法、数据结构、其它软件组件等。操作系统1020、应用1022、模块1024和/或数据1026的全部或部分例如也可在诸如易失性存储器1010的存储器中高速缓存。应当知道,所公开的架构可以用各种市售操作系统或操作系统的组合(例如作为虚拟机)来实现。
(多个)存储子系统1014和存储器子系统(1006和1018)充当计算机可读介质以用于数据、数据结构、计算机可执行指令等的易失性和非易失性存储。当被计算机或其它机器执行时,这样的指令可促使计算机或其它机器执行方法的一个或多个动作。执行动作的指令可存储在一个介质上,或者可存储在多个介质上,从而使得指令可共同出现在一个或多个计算机可读存储介质上,而不管所有指令是否都在同一介质上。
计算机可读介质可以是任何可用介质,其能由计算机1002访问且包括可移动或不可移动的易失性和非易失性的内部和/或外部介质。对于计算机1002来说,介质适合任何合适数字格式的数据的存储。本领域的技术人员应知道,可采用其它类型的计算机可读介质,例如,压缩驱动器、磁带、闪速存储卡、闪速驱动器、磁带盒等,其用于存储计算机可执行指令以执行所公开的架构的新颖方法。
用户可以使用诸如键盘和鼠标的外部用户输入设备1028与计算机1002、程序和数据交互。其它外部用户输入设备1028可包括麦克风、IR(红外)远程控制、操纵杆、游戏垫、摄像机识别系统、手写笔、触摸屏、姿势系统(例如,眼睛移动、头部移动等)和/或之类。用户可以使用诸如触摸垫、麦克风、键盘等的板载用户输入设备1030与计算机1002、程序和数据进行交互,其中计算机1002例如为便携式计算机。这些和其它输入设备经由系统总线1008通过(多个)输入/输出(I/O)设备接口1032连接到(多个)处理单元1004,但可通过诸如并行端口、IEEE 1394串行端口、游戏端口、USB端口、IR接口、短距离无线(例如蓝牙)和其它个人局域网(PAN)技术等的其它接口连接。(多个)I/O设备接口1032还有利于使用诸如打印机、音频设备、摄像设备等的输出外设1034,例如声卡和/或板载音频处理能力。
一个或多个图形接口1036(通常也称为图形处理单元(GPU))在计算机1002和(多个)外部显示器1038(例如,LCD、等离子显示器)和/或板载显示器1040(例如用于便携式计算机)之间提供图形和视频信号。(多个)图形接口1036也可制造为计算机系统板的一部分。
计算机1002可以经由到一个或多个网络和/或其它计算机的有线/无线通信子系统1042使用逻辑连接在联网环境(例如,基于IP)中操作。其它计算机可包括工作站、服务器、路由器、个人计算机、基于微处理器的娱乐电器、对等设备或其它通用网络节点,并且典型地包括关于计算机1002描述的许多或所有的要素。逻辑连接可包括到局域网(LAN)、广域网(WAN)、热点等的有线/无线连接。LAN和WAN联网环境在办公室和公司中是常见的,并且有利于企业范围的计算机网络,例如内联网,所有这些都可以连接到诸如因特网的全球通信网络。
当用在联网环境中时,计算机1002经由有线/无线通信子系统1042(例如,网络接口适配器、板载收发机子系统等)连接到网络,以与有线/无线网络、有线/无线打印机、有线/无线输入设备1044等通信。计算机1002可包括调制解调器或用于在网络上建立通信的其它装置。在联网环境中,与计算机1002有关的程序和数据可存储在与分布式系统相关联的远程存储器/存储设备中。应当理解,所示网络连接为示例性的,并且可以使用在计算机之间建立通信链路的其它装置。
计算机1002可操作以使用诸如IEEE 802.xx系列标准的无线电技术与有线/无线设备或实体通信,例如,可操作地设置成与诸如下列的设备无线通信(例如,IEEE 802.11空中调制技术)的无线设备:打印机、扫描仪、台式计算机和/或便携式计算机、个人数字助理(PDA)、通信卫星、与以无线方式可检测的标签相关联的任何一台设备或地点(例如,信息站、报摊、休息室)、以及电话。这至少包括用于热点的Wi-FiTM(用来认证无线计算机网络设备的互操作性)、WiMax和Bluetooth™无线技术。因此,通信可以是与常规网络相同的预定结构或者仅仅是在至少两个设备之间的自组织通信。Wi-Fi网络使用称为IEEE 802.11x (a、b、g等)的无线电技术来提供安全、可靠、快速的无线连接。Wi-Fi网络可用来将计算机连接到彼此、连接到因特网并连接到有线网络(其使用与IEEE 802.3有关的媒体和功能)。
以上所描述的包括所公开的架构的示例。当然,不可能描述组件和/或方法的每个可想到的组合,但本领域的普通技术人员可以认识到,许多进一步的组合和排列是可能的。因此,新颖架构旨在涵盖落在所附权利要求的精神和范围内的所有这样的改变、修改和变型。此外,就术语“包含”在详细描述或权利要求中使用的意义上,这样的术语旨在以类似于术语“包括”的方式为包括性的,因为“包括”当采用时在权利要求中解释为过渡词。

Claims (11)

1. 一种系统(100),包括:
全局访问组件(102),其是到不同数据发现范例的统一接口,所述全局访问组件提供到对应的不同数据集的访问;
本地搜索组件(108),其经由所述全局访问组件从所述不同数据集创建信息的聚合,并且处理针对所述信息聚合的查询以返回搜索结果,所述本地搜索组件对所述查询进行用于导出查询意图的意图分析、所述搜索结果的排序、以及基于所述查询意图的所述搜索结果的关联性处理;以及
处理器,其执行与所述全局访问组件或所述本地搜索组件中的至少一个相关联的计算机可执行指令。
2. 根据权利要求1所述的系统,其中,所述本地搜索组件从所述信息的聚合创建数据的统一索引,所述信息的聚合包括与用户有关的社会方面和从所述不同数据集导出的用户数据。
3. 根据权利要求1所述的系统,其中,所述不同数据发现范例包括基于客户端的范例和基于网络的范例,并且所述搜索结果包括与用户有关的基于客户端的结果和与用户有关的基于客户端的数据及网络结果以及所述用户的基于网络的数据。
4. 根据权利要求1所述的系统,其中,所述不同数据发现范例涉及与联系人、消息、文档或网站中的至少一个相关联的数据集,并且所述本地搜索组件提取主导的项和主题以对所述数据集进行归类、分组和浏览。
5. 根据权利要求1所述的系统,其中,所述本地搜索组件从所述信息的聚合的统一索引中识别流行主题,并且从所述信息的聚合中识别用户兴趣并基于所述用户兴趣建议网站。
6. 一种方法,包括以下动作:
从对应的数据发现范例的不同数据集在本地创建信息的聚合(600);
针对所述信息的聚合在本地处理查询以返回搜索结果(602);
从所述搜索结果导出查询意图(604);
基于所述结果的源对所述结果排序(606);
针对与具体主题的关联性处理所述排序的搜索结果(608);
输出所述关联的所述结果(610);以及
利用执行存储在存储器中的指令的处理器来进行所述创建、处理、导出、排序、处理或输出动作中的至少一个。
7. 根据权利要求6所述的方法,进一步包括在本地索引来自对应的不同数据范例的所述不同数据集。
8. 根据权利要求6所述的方法,进一步包括存储从浏览器、本地搜索和网络搜索收集的整理过的搜索历史以便随后用于再次查找搜索信息。
9. 根据权利要求6所述的方法,进一步包括创建给定用户的可移植搜索配置文件以便在相关联的用户设备上使用。
10. 根据权利要求6所述的方法,进一步包括针对其它本地应用的搜索建议而访问所述信息的聚合。
11. 一种或多种其上存储计算机可执行指令的计算机可读存储介质,所述指令当由计算设备执行时,使得所述计算设备实现如权利要求6-10中的任一个所述的方法。
CN2012105639614A 2011-12-22 2012-12-24 用于意图分析、排序和关联性的对本地和远程数据源的基于客户端的搜索 Pending CN103049531A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/334,062 US20130166543A1 (en) 2011-12-22 2011-12-22 Client-based search over local and remote data sources for intent analysis, ranking, and relevance
US13/334,062 2011-12-22

Publications (1)

Publication Number Publication Date
CN103049531A true CN103049531A (zh) 2013-04-17

Family

ID=48062172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012105639614A Pending CN103049531A (zh) 2011-12-22 2012-12-24 用于意图分析、排序和关联性的对本地和远程数据源的基于客户端的搜索

Country Status (4)

Country Link
US (1) US20130166543A1 (zh)
EP (1) EP2795486A4 (zh)
CN (1) CN103049531A (zh)
WO (1) WO2013096141A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103995898A (zh) * 2014-06-06 2014-08-20 北京易谱耐特科技有限公司 获取产品规格信息的方法和装置
CN104462510A (zh) * 2014-12-22 2015-03-25 北京奇虎科技有限公司 基于用户搜索意图的搜索方法及装置
CN104636410A (zh) * 2013-11-12 2015-05-20 国际商业机器公司 用于管理一个或多个电子消息的方法和装置
WO2015143639A1 (en) * 2014-03-26 2015-10-01 Microsoft Technology Licensing, Llc Client intent in integrated search environment
CN105279231A (zh) * 2015-09-22 2016-01-27 中国传媒大学 一种音乐资源聚合搜索的方法
CN112667663A (zh) * 2020-12-28 2021-04-16 北京明略软件系统有限公司 一种数据查询方法及系统
CN112860978A (zh) * 2021-03-31 2021-05-28 中国工商银行股份有限公司 全局搜索方法和装置

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9747372B2 (en) 2012-04-17 2017-08-29 Proofpoint, Inc. Systems and methods for discovering social accounts
US10026394B1 (en) * 2012-08-31 2018-07-17 Amazon Technologies, Inc. Managing dialogs on a speech recognition platform
US9454548B1 (en) * 2013-02-25 2016-09-27 Emc Corporation Pluggable storage system for distributed file systems
US9984083B1 (en) 2013-02-25 2018-05-29 EMC IP Holding Company LLC Pluggable storage system for parallel query engines across non-native file systems
US10025804B2 (en) * 2014-05-04 2018-07-17 Veritas Technologies Llc Systems and methods for aggregating information-asset metadata from multiple disparate data-management systems
US10635645B1 (en) 2014-05-04 2020-04-28 Veritas Technologies Llc Systems and methods for maintaining aggregate tables in databases
US9946771B2 (en) * 2014-05-30 2018-04-17 Apple Inc. User interface for searching
US10642845B2 (en) * 2014-05-30 2020-05-05 Apple Inc. Multi-domain search on a computing device
US9703859B2 (en) 2014-08-27 2017-07-11 Facebook, Inc. Keyword search queries on online social networks
US9754037B2 (en) * 2014-08-27 2017-09-05 Facebook, Inc. Blending by query classification on online social networks
US10740412B2 (en) * 2014-09-05 2020-08-11 Facebook, Inc. Pivoting search results on online social networks
US10055433B2 (en) 2014-09-18 2018-08-21 Microsoft Technology Licensing, Llc Referenced content indexing
US10242088B2 (en) * 2014-09-18 2019-03-26 Microsoft Technology Licensing, Llc Multi-source search
CN104536961A (zh) * 2014-11-04 2015-04-22 深圳创维数字技术有限公司 一种本地媒体文件的扫描方法及系统
US10650068B2 (en) * 2017-01-09 2020-05-12 Google Llc Search engine
US11017037B2 (en) * 2017-07-03 2021-05-25 Google Llc Obtaining responsive information from multiple corpora
US10600419B1 (en) 2017-09-22 2020-03-24 Amazon Technologies, Inc. System command processing
US10957313B1 (en) * 2017-09-22 2021-03-23 Amazon Technologies, Inc. System command processing
US11604838B2 (en) * 2020-06-09 2023-03-14 Dell Products L.P. System and method for humanizing metadata for existing customer facing resources

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005066842A1 (en) * 2003-12-31 2005-07-21 Google, Inc Systems and methods for unification of search results
US20070192327A1 (en) * 2006-02-13 2007-08-16 Bodin William K Aggregating content of disparate data types from disparate data sources for single point access
US20080154877A1 (en) * 2006-12-20 2008-06-26 Joshi Deepa B Discovering query intent from search queries and concept networks
CN101331475A (zh) * 2005-12-14 2008-12-24 微软公司 在线商业意图的自动检测

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1567928A4 (en) 2002-09-03 2008-04-30 X1 Technologies Llc DEVICES AND METHOD FOR FINDING DATA
US20050097089A1 (en) * 2003-11-05 2005-05-05 Tom Nielsen Persistent user interface for providing navigational functionality
US20050114306A1 (en) * 2003-11-20 2005-05-26 International Business Machines Corporation Integrated searching of multiple search sources
US7734606B2 (en) * 2004-09-15 2010-06-08 Graematter, Inc. System and method for regulatory intelligence
US7529739B2 (en) * 2005-08-19 2009-05-05 Google Inc. Temporal ranking scheme for desktop searching
US7895193B2 (en) * 2005-09-30 2011-02-22 Microsoft Corporation Arbitration of specialized content using search results
US20080005079A1 (en) * 2006-06-29 2008-01-03 Microsoft Corporation Scenario-based search
US20080147641A1 (en) * 2006-12-14 2008-06-19 Dean Leffingwell Method for prioritizing search results retrieved in response to a computerized search query
US7805450B2 (en) * 2007-03-28 2010-09-28 Yahoo, Inc. System for determining the geographic range of local intent in a search query
US20120330812A1 (en) * 2011-06-23 2012-12-27 Justin Bouchard Event-driven financial trading method and system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005066842A1 (en) * 2003-12-31 2005-07-21 Google, Inc Systems and methods for unification of search results
CN101331475A (zh) * 2005-12-14 2008-12-24 微软公司 在线商业意图的自动检测
US20070192327A1 (en) * 2006-02-13 2007-08-16 Bodin William K Aggregating content of disparate data types from disparate data sources for single point access
US20080154877A1 (en) * 2006-12-20 2008-06-26 Joshi Deepa B Discovering query intent from search queries and concept networks

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636410A (zh) * 2013-11-12 2015-05-20 国际商业机器公司 用于管理一个或多个电子消息的方法和装置
WO2015143639A1 (en) * 2014-03-26 2015-10-01 Microsoft Technology Licensing, Llc Client intent in integrated search environment
CN105264528A (zh) * 2014-03-26 2016-01-20 微软技术许可有限责任公司 集成搜索环境中的客户端意图
CN103995898A (zh) * 2014-06-06 2014-08-20 北京易谱耐特科技有限公司 获取产品规格信息的方法和装置
CN103995898B (zh) * 2014-06-06 2017-05-24 北京易谱精灵电子商务有限公司 获取产品规格信息的方法和装置
CN104462510A (zh) * 2014-12-22 2015-03-25 北京奇虎科技有限公司 基于用户搜索意图的搜索方法及装置
CN104462510B (zh) * 2014-12-22 2018-09-11 北京奇虎科技有限公司 基于用户搜索意图的搜索方法及装置
CN105279231A (zh) * 2015-09-22 2016-01-27 中国传媒大学 一种音乐资源聚合搜索的方法
CN112667663A (zh) * 2020-12-28 2021-04-16 北京明略软件系统有限公司 一种数据查询方法及系统
CN112860978A (zh) * 2021-03-31 2021-05-28 中国工商银行股份有限公司 全局搜索方法和装置

Also Published As

Publication number Publication date
WO2013096141A1 (en) 2013-06-27
EP2795486A1 (en) 2014-10-29
EP2795486A4 (en) 2015-10-28
US20130166543A1 (en) 2013-06-27

Similar Documents

Publication Publication Date Title
CN103049531A (zh) 用于意图分析、排序和关联性的对本地和远程数据源的基于客户端的搜索
Dann et al. E-marketing: theory and application
US11645321B2 (en) Calculating relationship strength using an activity-based distributed graph
JP7187545B2 (ja) 名前付きエンティティの構文解析および識別に基づくクロスドキュメントの修辞的つながりの判断
O'Murchu et al. Online Social and Business Networking Communities.
US9230257B2 (en) Systems and methods for customer relationship management
KR102091900B1 (ko) 컨텐츠의 스트림의 디스플레이
CN102622397B (zh) 微博基础结构中的散列标签管理
CN107533561A (zh) 使用企业搜索和公共搜索的上下文敏感内容推荐
US20160132800A1 (en) Business Relationship Accessing
US10540666B2 (en) Method and system for updating an intent space and estimating intent based on an intent space
US20130132468A1 (en) Discovering, organizing, accessing and sharing information in a cloud environment
CN102929950A (zh) 用于个性化搜索结果的社交网络推荐的内容和推荐成员
US20130185106A1 (en) Using social media objects for content curation, management, and engagement facilitation
US9043413B2 (en) System and method for extracting, collecting, enriching and ranking of email objects
US9612996B1 (en) Providing suggestions to a user based on social activity patterns
US9342603B2 (en) Experience graph
US9767204B1 (en) Category predictions identifying a search frequency
AU2014259978A1 (en) Tagged search result maintenance
US20150112995A1 (en) Information retrieval for group users
US10127322B2 (en) Efficient retrieval of fresh internet content
US20160239533A1 (en) Identity workflow that utilizes multiple storage engines to support various lifecycles
US20190295106A1 (en) Ranking Vendor Data Objects
CN103902564A (zh) 一种文件展示方法及装置
US10474670B1 (en) Category predictions with browse node probabilities

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150703

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150703

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130417