CN115023719A - 在协作通信应用中的上下文搜索 - Google Patents
在协作通信应用中的上下文搜索 Download PDFInfo
- Publication number
- CN115023719A CN115023719A CN202080094951.3A CN202080094951A CN115023719A CN 115023719 A CN115023719 A CN 115023719A CN 202080094951 A CN202080094951 A CN 202080094951A CN 115023719 A CN115023719 A CN 115023719A
- Authority
- CN
- China
- Prior art keywords
- user
- data
- search
- contextual
- search query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 claims abstract description 59
- 238000003058 natural language processing Methods 0.000 claims description 13
- 230000008520 organization Effects 0.000 claims description 13
- 230000003993 interaction Effects 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 5
- 230000002123 temporal effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 230000003190 augmentative effect Effects 0.000 description 5
- 230000001149 cognitive effect Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000037406 food intake Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000007177 brain activity Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Transfer Between Computers (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一个示例提供了在计算设备上的一种方法,包括:从一个或多个协作通信应用迭代地接收包括用户的通信的用户数据,分析接收到的用户数据以提取关于所述用户的上下文信息;以及将所述上下文信息发送到针对所述用户的上下文信息数据存储。所述方法还包括:接收源自所述协作通信应用内的搜索查询,解析所述搜索查询以识别参考搜索项,利用所述参考搜索项来查询针对所述用户的所述上下文信息数据存储以识别与所述参考搜索项相关联的、先前存储的关于所述用户的上下文信息,并且将识别出的先前存储的上下文信息发送到从其接收所述搜索查询的所述协作通信应用。
Description
背景技术
协作通信应用,诸如电子邮件应用,可以提供搜索能力以允许用户执行搜索查询来定位过去的感兴趣的通信。这样的搜索能力可以基于模糊关键字匹配、基于字符串模式的匹配或者启发式匹配技术。
发明内容
提供本发明内容以简化形式介绍对概念的选择,这些概念将在下文的详细描述中进一步描述。本发明内容并非旨在识别所要求保护的主题的关键特征或基本特征,也并不旨在用于限制所要求保护的主题的范围。此外,所要求保护的主题并不限于解决在本公开的任何部分中所指出的任何或所有缺点的实现方式。
一个示例提供了在计算设备上的一种方法,包括:从一个或多个协作通信应用迭代地接收包括用户的通信的用户数据,分析接收到的用户数据以提取关于所述用户的上下文信息,以及将所述上下文信息发送到针对所述用户的上下文信息数据存储。所述方法还包括:接收源自协作通信应用内的搜索查询,解析所述搜索查询以识别参考搜索项,利用所述参考搜索项来查询针对所述用户的所述上下文信息数据存储以识别与所述参考搜索项相关联的、先前存储的关于所述用户的上下文信息,以及将识别出的先前存储的上下文信息发送到从其接收所述搜索查询的所述协作通信应用。
另一示例提供了一种计算设备,包括:处理器;以及存储设备,其包括能由所述处理器运行以用于以下操作的指令:将用户数据从在所述计算设备上运行的一个或多个协作通信应用迭代地传输到上下文搜索服务。所述指令还可运行用于:单独地,在协作通信应用中接收对搜索查询的用户输入,所述搜索查询包括参考搜索项;将关于所述搜索查询的信息发送到上下文搜索服务,所述上下文搜索服务包括关于所述用户的上下文信息,关于所述用户的所述上下文信息中的至少一些已经从由一个或多个协作通信应用被提供到上下文搜索服务的用户数据获得;从所述上下文搜索服务接收先前存储的关于所述用户的上下文信息以扩充所述搜索查询中的所述参考搜索项;以及利用扩充所述参考搜索项的先前存储的关于所述用户的上下文信息来执行所述搜索查询。
附图说明
图1示出了电子邮件应用形式的示例性协作通信应用的用户界面100。
图2示出了用于为用户构建上下文信息存储的系统的示例性架构。
图3示出了用于识别上下文信息存储中的上下文信息以扩充上下文搜索查询中的参考项的系统的示例性架构。
图4示出了用于为用户构建上下文信息存储的示例性方法。
图5示出了用于使用上下文信息存储在协作通信应用中执行上下文搜索查询的示例性方法。
图6示出了示例性计算系统的框图。
具体实施方式
如上文所提到的,协作通信应用,诸如电子邮件、聊天和共享工作空间应用,可以提供搜索能力以允许用户搜索过去的感兴趣的通信(例如,收件箱或者其他文件夹中的电子邮件)。然而,许多现有协作通信应用的搜索模块可能使用诸如模糊关键字匹配、字符串模式匹配或者基于启发式的方法等技术来执行搜索。当用户输入参考搜索项时,这样的技术可能无法准确地找到相关通信。如在本文中所使用的短语“参考搜索项”等指代使用上下文描述性语言而不是通过明确的标识符来指代对象、地点、时间或者其他明确项的搜索项。例如,搜索查询“示出来自我的上次会议的电子邮件”包括参考项“来自我的上次会议”,而不包括针对所述会议的特定时间窗口。作为另一示例,搜索查询“示出来自我的经理的最近电子邮件”包括参考项“我的经理”,而没有所述经理的明确的标识。作为又一示例,搜索查询“示出我发送给Joe的关于我的上一个项目的电子邮件”包括参考搜索项“上一个项目”,以及在用户与多于一位名为“Joe”的人通信的情况下的可能的项“Joe”。所有这些参考搜索项都具有关于用户的特定上下文含义,但是指代描述性的含义,而不是明确的含义。当用于使用上文所提到的技术执行搜索时,这样的参考搜索项可能不会导致准确的、或者甚至相关的搜索结果。此外,被配置为处理搜索查询中的参考搜索项的应用可能需要用户在用户简档中明确地输入个人信息以辅助进行这样的搜索,和/或可能被限制在特定的查询命令列表中。
因此,公开了与上下文搜索服务相关的示例,所述上下文搜索服务被配置为:为用户自动地构建上下文信息数据存储,并且使用所述上下文信息数据存储来促进执行包括参考搜索项的搜索。在用户对应用的正常使用期间,通过从协作通信应用以及可能从其他应用(例如,来自网络浏览器的网络搜索)收集用户数据来构建针对用户的所述上下文信息数据存储。处理所收集到的所述用户数据以提取关于所述用户的上下文信息。然后,将所提取出的上下文信息存储在针对所述用户的安全存储中,以用于为由所述用户输入的具有参考搜索项的搜索查询提供上下文。当用户在协作通信应用中执行包括参考搜索项的搜索时,所述应用能够将关于所述搜索查询的信息发送到上下文搜索服务来识别上下文信息以在运行所述搜索查询时扩充所述参考搜索项(例如,通过替换参考搜索项或者以其他方式包含在所述搜索查询中)。如下文更详细描述的,所公开的示例可以提供对所存储的用户的上下文信息的近实时更新,并且由此辅助用户基于最新的上下文信息来执行搜索,而无需用户直接输入个人信息。结果可用的搜索查询输入也不限于特定的查询命令列表。相反,所公开的示例可以对任何搜索查询执行自然语言处理,并且从搜索查询中智能地提取相关信息。
图1示出了在示例性协作通信应用(其采用客户端电子邮件应用的形式)中的示例性用户界面100。所述电子邮件应用可以在用户的设备上运行,或者至少部分地作为基于网络的服务(例如,网络可访问的分布式计算环境中的“云”服务)能由浏览器或用户设备上的其他应用访问。示例性搜索查询在102处被示出,请求在用户的电子邮件收件箱中搜索“来自我的经理的电子邮件”。如上文所提到的,现有的搜索方法可能不理解“我的经理”是指特定个人的术语,而是可能返回基于搜索字面词“我的”和“经理”而不是基于用户经理的实际身份识别出的搜索结果。相反,根据本公开,可以将搜索查询中的术语与针对所述用户的上下文信息数据存储进行比较,以定位上下文信息来扩充搜索查询中的任意参考项。在一些示例中,可以使用自然语言处理模块来解析由用户输入的搜索查询,以从搜索查询中提取关键字并且识别参考搜索项。在图1的示例中,所述电子邮件客户端可以将关于所述搜索查询的信息(例如,整个搜索查询或者经处理的形式的搜索查询,诸如从查询中提取的关键字)发送到上下文搜索服务,所述上下文搜索服务基于先前提取的用户信息将实体RobertClooney识别为用户的经理。然后,使用关于“Robert Clooney”的信息来扩充参考搜索项“我的经理”以执行搜索查询,例如通过替换查询中的术语“我的经理”,由此返回包括从用户的经理Robert Clooney发送的电子邮件的结果,如在104处所示的。
搜索查询也可以包括参考时间项。包括时间信息的搜索查询的示例是“来自我的上次会议的电子邮件”。在该示例中,所述上下文搜索服务可以被配置为识别用户的上次会议何时发生,并且所述搜索查询可以被扩充以搜索在识别出的时间窗口期间发送和接收的电子邮件。作为另一示例,当用户输入查询“我发送的关于上一项目的电子邮件”时,所述上下文搜索服务可以用于识别用户的项目,并且所述上下文搜索服务能够使用时间语言“最近的”来确定用户最近参与的项目。然后,可以使用被确定为最近的项目的身份来扩充所述搜索查询。
图2示出了用于为用户构建上下文信息存储的系统的示例性架构200。在该示例中,可以为一个或多个客户端应用203(其可以是(一个或多个)协作通信应用)中的每一个提供客户端认知搜索模块202。客户端认知搜索模块202通过利用客户端搜索查询来查询上下文搜索服务以向用户提供增强的搜索结果来向客户端提供认知上下文搜索能力,并且也帮助为客户端构建和维护上下文信息数据存储,如下文所描述的。在一些示例中,客户端认知搜索模块202可以采用被安装在电子邮件客户端或者其他通信客户端上的插件的形式。在其他示例中,可以经由数字助理或者以任何其他合适的方式来制定搜索能力。
客户端认知搜索模块202提供包括人工项204的用户数据205的输出,人工项204是被包含在经由(一个或多个)协作通信应用进行的用户的通信内的上下文信息项。包含人工项204的用户数据205可以包括用户的浏览历史、来自电子邮件客户端或在线电子邮件服务的电子邮件、来自共享工作空间客户端应用或基于网络的平台的共享文件(例如,文档、演示文稿、图像、笔记)、在聊天应用中的聊天(包括其他程序中的聊天功能,诸如视频会议程序)、来自会议应用的会议记录、和/或组织搜索历史等。
包括人工项204的用户数据205被发送到结构化数据生成器206,结构化数据生成器206将用户数据205转换成通用结构化格式。对通用结构化格式的使用可以允许AUE分析所述数据,而无需理解来自不同数据源的数据格式。所述结构化数据被提供给人工项理解引擎(AUE)208。在其他示例中,用户数据可以被提供给AUE 208而不转换成通用结构。在一些示例中,所述数据可以在客户端应用处被转换为结构化格式,而在其他示例中,所述数据可以在上下文搜索服务处被转换。
AUE 208被配置为从用户数据205中提取上下文信息(例如,人工项204),并且将所述上下文信息存储在针对所述用户的数据存储中。AUE 208包括被配置为从所述用户数据中提取不同类型的人工项以用于存储为上下文信息的各种模块。例如,AUE 208包括实体提取模块210,其中,术语“实体”表示现实世界的对象、人、地点、组织、概念、数字表达(例如,日期、时间、货币量、电话号码)以及时间表达(例如,日期、时间、持续时间、频率)。作为说明性示例,实体可以包括用户的组织、团队、经理、当前项目、过去项目、项目时间表、导师/学员、会议、专业领域、同行、现场站点、优选语言、位置、兴趣以及通信的语言。
AUE 208也包括关键短语提取模块212。关键短语提取可以涉及将来自所述用户数据的文本标记为词性(例如,名词、代词、动词、形容词、副词、连词、介词),并且基于相关性和/或使用频率来识别关键短语。
AUE 208另外包括意图提取模块214。意图表示从用户数据205识别的感兴趣的高级主题,诸如技术、汽车、旅行、金融、编程语言等。AUE 208可以使用例如使用来自搜索引擎的训练数据而构建的基于机器学习的模型(例如,实现为神经网络、决策树等的分类器)。可以使用列入白名单的查询和通过手动标记生成的对应类别标签来训练所述模型。为了执行意图提取,来自用户数据的文本被解析并且被输入到经训练的基于机器学习的模型中,以将所述文本分类到标记的类别之一,由此提供对文本可能是什么意图的预测。
所描绘的AUE 208还包括开放目录项目(ODP)分类模块216。ODP为现实世界实体定义了各种类别的本体。例如,在基于网络的搜索引擎的上下文中,网页可以被标记为ODP类别,所述ODP类别表示网页所属于的类别,诸如“计算机/互联网”、“汽车/服务”、“运动/足球”等。AUE 208可以利用与用户浏览的网页相关联的ODP类别来识别与用户的内容相关联的类别。ODP分类可以为标记用户数据提供额外的置信度,并且被用作除了意图提取之外的进一步分类步骤。在其他示例中,AUE可以包括所描绘模块的子集,和/或任何其他期望的上下文信息提取模块。可以使用来自意图提取模块214的意图和来自ODP分类模块216的类别来映射在关键短语与识别出的实体之间的关系。
除了用户数据205之外,AUE 208还可以接收知识图数据218。知识图包括以图格式表示实体和实体之间的关系的数据组织。知识图数据218可以包括实体图数据220(例如,搜索引擎图数据)和组织图数据222(例如,公司组织图数据)。实体图数据220可以来自开源知识库、专有的基于图的存储库和/或任何其他合适的实体数据库。知识图数据可以提供与用户相关联的实体的高置信度标识,诸如工作空间关系。
组织图数据222可以包括关于组织的内部层级/组织结构的图数据。组织图数据222也可以包括从社交网络服务(例如,由Redmond,WA的Microsoft Corporation提供的Linkedln)接收的图数据,其可以包括关于用户的专业联系、经验、用户所使用的语言(包括计算机编程语言)、用户所工作的公司等的信息。例如,AUE 208可以使用组织图数据216为用户提取工作实体。
AUE 208中的每个模块处理所接收到的、包括人工项204的用户数据205,并且执行对应的提取和/或分类。针对每个识别出的实体类型/实体名称对(其可以被表示为键-值对),AUE可以输出关于在识别出的类型和实体之间的关系的正确性的置信度的置信度分数。在一些示例中,可以随着时间累积从用户数据识别出的每个实体类型/实体名称对的置信度分数(例如,通过平均、加权平均或者其他合适的技术)。然后,可以将所得到的累积置信度分数用作阈值度量来触发将键-值对存储在上下文信息数据存储中,从而在满足阈值累积置信度时将键-值对存储在针对用户的上下文信息数据存储中。如果针对所提取出的上下文信息的置信度分数满足阈值,则将所识别出的实体输出到丰富的人工项流224中,以供存储在针对用户的上下文信息数据存储228中。基于满足阈值置信度而存储上下文信息可以帮助增加用于扩充搜索查询的信息正确的可能性,并且由此帮助提供更准确的搜索结果。
在所描绘的示例中,使用数据存储摄取管线226摄取所创建的丰富的人工项流224。所描绘的摄取管线226表示用于基于云的分布式数据存储服务的实时数据摄取系统。在其他示例中,可以使用任何其他机制来将丰富的人工项流224写入安全存储设备。所摄取的数据被存储在针对用户的安全上下文信息数据存储228中。在一些示例中,上下文信息数据存储228可以位于针对实体的场所,而不是位于基于云的网络可访问分布式存储系统中。
AUE 208可以在每当接收到包括人工项204的经更新的用户数据205时运行图2的流程,由此迭代地和自动地更新上下文信息数据存储228,并且因此接近实时地为用户提供对上下文信息数据存储的构建和持续更新,而无需任何用户输入来显式地添加上下文信息。
图3示出了用于执行上下文搜索查询的示例性系统架构300,图示了从客户端侧到服务器侧的流程。在所描绘的示例中,在客户端侧,协作通信应用302接收对搜索查询304的输入,并且将搜索查询提供给客户端认知搜索模块202(例如,应用插件或个人助理),客户端认知搜索模块202利用查询来调用308上下文搜索服务311的应用编程接口(API)310。上下文搜索服务311可以包括允许客户端查询上下文信息数据存储228以获得存储的上下文数据的后端表示状态转移(REST)服务。
所描绘的上下文搜索服务310包括自然语言处理单元314和人工项查询引擎316。自然语言处理单元314例如通过将输入字符串运行到词性(POS)标记器318中来从搜索查询304中提取关键字。POS标记器218可以是经训练的分类器。作为自然语言处理的示例,给定示例性搜索查询“示出来自我的上次会议的发送给我的经理的电子邮件”,POS标记器可以识别查询中的词性,并且自然语言处理单元314可以至少部分地基于由POS标记器应用于查询的这些部分的标记,来提取“电子邮件”作为对象,提取“经理”作为参考搜索项,以及提取“上次会议”作为另一参考搜索项。用户简档320可以被用于例如基于用户明确提供的信息来识别与搜索查询304相关的任何上下文。
来自自然语言处理单元314的关键字和参考搜索项被发送到人工项查询引擎316,例如,在一些示例中作为令牌集合。此外,如上文所提到的,自然语言处理单元314也可以添加时间信息,其可以帮助按时间对搜索结果进行排序。将理解,尽管在此被示为在服务器侧,但是在其他示例中,自然语言处理单元314可以驻留在客户端侧。
接下来,人工项查询引擎316向上下文信息数据存储228查询先前存储的实体信息。例如,人工项查询引擎316可以将输入令牌(包括来自自然语言处理的令牌以及当前用户作为令牌)传递给上下文信息数据存储228,上下文信息数据存储228返回与所述令牌相匹配的实体。作为更具体的示例,上下文信息数据存储228可以将“Robert Clooney”存储为“经理”,并且将“记录评论”存储为具有针对当前用户的最新时间戳的“会议”。然后,将从存储装置中取回的实体信息发送到协作通信应用,并且执行搜索查询304,其中,实体信息扩充了参考搜索项。
将理解,在图2和图3中所描述的流程可以单独地但是同时地运行,从而上下文信息存储构建/更新过程可以在用户使用应用的上下文搜索过程和应用的其他普通功能时在后台执行。
图4示出了为用户构建上下文信息存储的示例性方法400。方法400由包括一个或多个计算设备的计算系统执行。方法400包括:在402处,从一个或多个协作通信应用迭代地接收包括用户的用户通信的用户数据。在一些示例中,在404处,所述用户数据可以被转换成与用户数据的原始格式不同的结构化格式。方法400还包括:在406处,接收关于在包括用户的组织内的关系的知识图数据。如上文所提到的,知识图数据可以包括从开源数据库或专有数据库获得的实体图数据、关于组织内部层级/组织结构的组织图数据和/或任何其他合适的信息。
方法400还包括:在408处,分析接收到的数据(包括用户数据和知识图数据),以提取关于用户的上下文信息。在410处,提取上下文信息可以包括提取实体关键短语、意图和类别。类别可以包括意图,例如,感兴趣的高级主题或者使用开放目录项目(ODP)分类识别的类别。在一些示例中,在416处,可以经由机器学习分类器来提取所述类别。
方法400还包括:在418处,将所提取的上下文信息发送到针对用户的上下文信息数据存储。所述上下文信息数据存储可以是任意适当的安全数据存储,并且可以位于基于云的分布式存储系统中、在本地服务器中(例如本地)或者在任何其他合适的网络位置处。在一些示例中,在420处,在上下文信息包括识别出的实体类型/实体名称对的情况下,可以确定关于识别出的实体类型/实体名称对的正确性的置信度的置信度分数,并且可以在置信度分数满足阈值时将上下文信息提供给针对用户的上下文信息数据存储。这样的置信度分数对于上下文信息可以是累积的,使得当累积置信度分数满足阈值分数时,上下文信息被提供给上下文数据存储。
方法400还包括:在422处,接收源自协作通信应用内的搜索查询。从其接收搜索查询的协作通信应用可以是与在402处从其接收用户数据的一个或多个协作通信应用不同的应用,或者可以在从其接收用户数据的一个或多个协作通信应用内。方法400还包括:在424处,解析所述搜索查询以识别参考搜索项,并且查询针对所述用户的上下文信息数据存储以识别与参考搜索项相关联的、先前存储的上下文信息。然后,在426处,将识别出的先前存储的上下文信息发送到从其接收搜索查询的协作通信应用,以用于扩充所述参考搜索项。
图5示出了执行上下文搜索查询的示例性方法500。方法500由包括一个或多个计算设备的计算系统来执行。方法500包括:在502处,从一个或多个协作通信应用迭代地传输到上下文搜索服务。方法500还包括:单独地,在504处,在协作通信应用中接收对搜索查询的用户输入。所述协作通信应用可以是与从其传输用户数据的一个或多个协作通信应用不同的应用,或者可以在从其传输用户数据的一个或多个协作通信应用内。所述搜索查询可以包括如上文所定义的参考搜索项。所述参考搜索项可以包括对人、地点、对象、时间和/或任何其他合适的对应明确项的描述性参考。方法500包括:在506处,向上下文搜索服务发送关于搜索查询的信息,所述上下文搜索服务包括从由一个或多个协作通信应用提供的用户数据中获得的、与用户相关联的上下文信息。在一些示例中,所述搜索查询被完整地发送到上下文搜索服务。在其他示例中,在508处,被发送到上下文搜索服务的信息可以包括经由自然语言处理模块解析搜索查询而获得的信息。
方法500还包括:在512处,从上下文搜索服务接收实体信息以扩充所述参考搜索项,例如通过替换参考搜索项或者以其他方式通过被包含在所述搜索查询中。方法500还包括:在514处,执行搜索查询,其中实体信息扩充了所述参考搜索项。
在一些实施例中,在本文中所描述的方法和过程可以被绑定到一个或多个计算设备的计算系统。具体地,这样的方法和过程可以被实现为计算机应用程序或服务、应用编程接口(API)、库、和/或其他计算机程序产品。
图6示意性示出了能够实施上文所描述的方法和过程中的一种或多种方法和过程的计算系统600的非限制性实施例。计算系统600以简化形式被示出。计算系统600可以采用一台或多台个人计算机、服务器计算机、平板计算机、家庭娱乐计算机、网络计算设备、游戏设备、移动计算设备、移动通信设备(例如,智能电话)和/或其他计算设备的形式。
计算系统600包括逻辑子系统602和存储子系统604。计算系统600可选地可以包括显示子系统606、输入子系统608、通信子系统610和/或在图6中未示出的其他组件。
逻辑子系统602包括被配置为运行指令的一个或多个物理设备。例如,逻辑子系统602可以被配置为运行作为一个或多个应用、服务、程序、例程、库、对象、组件、数据结构或者其他逻辑构造的一部分的指令。这样的指令可以被实施以执行任务、实施数据类型、转换一个或多个组件的状态、实现技术效果、或者以其他方式达到期望的结果。
逻辑子系统602可以包括被配置为运行软件指令的一个或多个处理器。另外地或替代地,逻辑子系统602可以包括一个或多个硬件或固件逻辑机器,其被配置为运行硬件或固件指令。逻辑子系统602的处理器可以是单核或多核的,并且在其上运行的指令可以被配置用于顺序、并行和/或分布式处理。逻辑子系统602的个体组件可选地可以分布在两个或更多个单独的设备之间,所述设备可以远程定位和/或被配置用于协作的处理。逻辑子系统602的各方面可以由在云计算配置中配置的远程可访问的联网计算设备进行虚拟化和运行。
存储子系统604包括一个或多个物理设备,所述一个或多个物理设备被配置为保存能由逻辑子系统602运行以实施在本文中所描述的方法和过程的指令。当实施这样的方法和过程时,存储子系统604的状态可以被转换——例如,以保存不同的数据。
存储子系统604可以包括可移除和/或内置设备。存储子系统604可以包括光学存储器(例如,CD、DVD、HD-DVD、蓝光光盘等)、半导体存储器(例如,RAM、EPROM、EEPROM等)和/或磁存储器(例如,硬盘驱动器、软盘驱动器、磁带驱动器、MRAM等),等等。存储子系统604可以包括易失性、非易失性、动态、静态、读/写、只读、随机存取、顺序存取、位置可寻址、文件可寻址和/或内容可寻址设备。
将意识到,存储子系统604包括一个或多个物理设备。然而,在本文中所描述的指令的各方面可替代地由不被物理设备保持有限持续时间的通信介质(例如,电磁信号、光信号等)来传播。
逻辑子系统602和存储子系统604的各方面可以一起集成到一个或多个硬件逻辑组件中。这样的硬件逻辑组件可以包括现场可编程门阵列(FPGA)、程序和应用专用集成电路(PASIC/ASIC)、程序和应用专用标准产品(PSSP/ASSP)、片上系统(SOC)和复杂可编程逻辑器件(CPLD)。
术语“模块”、“程序”和“引擎”可用于描述被实现为执行特定功能的计算系统600的一方面。在一些情况下,模块、程序或引擎可以经由逻辑子系统602运行由存储子系统604保存的指令来实例化。应当理解,不同的模块、程序和/或引擎可以从相同的应用、服务、代码块、对象、库、例程、API、函数等实例化。类似地,相同的模块、程序和/或引擎可以由不同的应用、服务、代码块、对象、例程、API、函数等实例化。术语“模块”、“程序”和“引擎”可以涵盖个体的或者成组的可执行文件、数据文件、库、驱动程序、脚本、数据库记录等。
将意识到,如在本文中所使用的,“服务”是跨多个用户会话可运行的应用程序。服务可用于一个或多个系统组件、程序和/或其他服务。在一些实现方式中,服务可以在一个或多个服务器计算设备上运行。
当被包含时,显示子系统606可以被用于呈现由存储子系统604保存的数据的视觉表示。该视觉表示可以采用图形用户界面(GUI)的形式。由于在本文中所描述的方法和过程改变了由存储机器所保存的数据,并且因此转换了存储机器的状态,所以显示子系统606的状态同样可以被转换以在视觉上表示底层数据的变化。显示子系统606可以包括利用几乎任何类型的技术的一个或多个显示设备。这样的显示设备可以与共享外壳中的逻辑子系统602和/或存储子系统604相组合,或者这样的显示设备可以是外围显示设备。
当被包含时,输入子系统608可以包括一个或多个用户输入设备或者与其接口,诸如键盘、鼠标、触摸屏或游戏控制器。在一些实施例中,所述输入子系统可以包括所选择的自然用户输入(NUI)组件或者与其接口。这样的组件可以是集成的或外围的,并且对输入动作的转换和/或处理可以在板上或板外处理。示例性NUI组件可以包括用于话语和/或语音识别的麦克风;用于机器视觉和/或手势识别的红外、彩色、立体和/或深度相机;用于运动检测和/或意图识别的头部跟踪器、眼球跟踪器、加速度计和/或陀螺仪;以及用于评估大脑活动的电场感测组件。
当被包含时,通信子系统610可以被配置为将计算系统600与一个或多个其他计算设备通信地耦合。通信子系统610可以包括与一种或多种不同通信协议兼容的有线和/或无线通信设备。作为非限制性示例,所述通信子系统可以被配置用于经由无线电话网络或者有线或无线局域网或广域网进行通信。在一些实施例中,所述通信子系统可以允许计算系统600经由网络(诸如互联网)向其他设备发送和/或从其他设备接收消息。
另一示例提供了在计算设备上的一种方法,包括,迭代地:从一个或多个协作通信应用接收包括用户的通信的用户数据,分析接收到的用户数据以提取关于所述用户的上下文信息;以及将所述上下文信息发送到针对所述用户的上下文信息数据存储。在该示例中,所述方法还包括:接收源自协作通信应用内的搜索查询,解析所述搜索查询以识别参考搜索项,利用所述参考搜索项来查询针对所述用户的所述上下文信息数据存储以识别与所述参考搜索项相关联的、先前存储的关于所述用户的上下文信息,并且将识别出的先前存储的上下文信息发送到从其接收所述搜索查询的协作通信应用。来自所述一个或多个协作通信应用的所述用户数据可以另外地或替代地包括以下中的一项或多项:电子邮件数据、消息传递数据、共享工作空间数据、文件交互数据和组织搜索历史数据。所述方法可以另外地或替代地包括:接收关于在包括所述用户的组织内的关系的知识图数据,分析所述知识图数据以从所述知识图中提取上下文信息;以及将所述上下文信息从所述知识图发送到所述上下文信息数据存储。所述方法可以另外地或替代地包括:将所述用户数据转换成与所述用户数据的原始格式不同的结构化格式。所述上下文信息可以另外地或替代地包括从所述用户数据中提取的实体、关键短语、类别和意图中的一项或多项。所述方法可以另外地或替代地包括:利用机器学习分类器来分析所述用户数据以提取所述类别。从其接收所述搜索查询的所述协作通信应用可以另外地或替代地不同于从其接收包括用户的通信的用户数据的一个或多个协作通信应用。所述上下文信息可以另外地或替代地包括识别出的实体类型/实体名称对;以及提取所述上下文信息可以另外地或替代地包括:确定关于识别出的实体类型/实体名称对的正确性的置信度的置信度分数;以及当针对上下文信息的置信度分数满足阈值时,将上下文信息提供给上下文信息数据存储以用于存储。所述置信度分数可以另外地或替代地是基于识别出的实体类型/实体名称对的多个标识的累积置信度分数。一种计算机程序,当在计算设备的处理器上运行时,可以另外地或替代地被配置为执行所述方法。
另一示例提供了一种计算设备,包括:处理器;以及存储设备,其包括能由所述处理器运行用于以下操作的指令:将用户数据从在所述计算设备上运行的一个或多个协作通信应用迭代地传输到上下文搜索服务;单独地,在协作通信应用中接收搜索查询的用户输入,所述搜索查询包括参考搜索项,将关于所述搜索查询的信息发送到所述上下文搜索服务,所述上下文搜索服务包括关于所述用户的上下文信息,关于所述用户的所述上下文信息中的至少一些已经从由所述一个或多个协作通信应用提供到所述上下文搜索服务的所述用户数据获得,从所述上下文搜索服务接收先前存储的关于所述用户的上下文信息以扩充所述搜索查询中的所述参考搜索项,以及利用扩充所述搜索查询项的先前存储的关于所述用户的上下文信息来执行所述搜索查询。来自所述协作通信应用的所述用户数据可以另外地或替代地包括以下中的一项或多项:电子邮件数据、消息传递数据、文件交互数据和组织搜索历史数据。所述指令可以另外地或替代地能运行以通过自然语言处理模块来解析所述搜索查询。所述上下文信息可以另外地或替代地包括从所述用户数据中提取的实体、关键短语、意图和类别中的一项或多项。被发送到所述上下文搜索服务的关于所述搜索查询的所述信息可以另外地或替代地包括时间参考搜索项。
另一示例提供了一种计算设备,包括:处理器;以及存储设备,其包括能由所述处理器运行以用于以下操作的指令,迭代地:从一个或多个协作通信应用接收包括用户的通信的用户数据,分析接收到的用户数据以提取关于所述用户的上下文信息;以及将所述上下文信息发送到针对所述用户的上下文信息数据存储。在该示例中,所述指令还能运行以:接收源自协作通信应用内的搜索查询,解析所述搜索查询以识别参考搜索项,利用所述参考搜索项来查询所述上下文信息数据存储以识别与所述参考搜索项相关联的、先前存储的关于所述用户的上下文信息,以及将识别出的先前存储的上下文信息发送到从其接收所述搜索查询的所述协作通信应用。来自所述一个或多个协作通信应用的所述用户数据可以另外地或替代地包括以下中的一项或多项:电子邮件数据、消息传递数据、共享工作空间数据、文件交互数据和组织搜索历史数据。所述指令可以另外地或替代地能运行以:接收关于在包括所述用户的组织内的关系的知识图数据,分析所述知识图数据以从所述知识图中提取上下文信息;以及将所述上下文信息从所述知识图发送到针对所述用户的所述上下文信息数据存储。所述上下文信息可以另外地或替代地包括识别出的实体类型/实体名称对;以及所述指令可以另外地或替代地能运行以通过确定关于识别出的实体类型/实体名称对的正确性的置信度的置信度分数来提取所述上下文信息;以及当针对所述上下文信息的所述置信度分数满足阈值时,将所述上下文信息提供给所述上下文信息数据存储以用于存储。从其接收所述搜索查询的所述协作通信应用可以另外地或替代地与从其接收所述用户数据的所述一个或多个协作通信应用不同。
将理解,在本文中所描述的配置和/或方法本质上是示例性的,并且这些特定实施例或示例不应当被认为具有限制意义,因为许多变化是可能的。在本文中所描述的特定例程或方法可以表示任意数量的处理策略中的一个或多个。这样,所图示和/或所描述的各种动作可以以所图示和/或所描述的序列、以其他序列、并行来执行或省略。类似地,可以改变上文所描述的处理的次序。
本公开的主题包括各种过程、系统和配置以及在本文中所公开的其他特征、功能、动作和/或特性的所有新颖和非显而易见的组合和子组合,以及其任何和所有等同物。
Claims (16)
1.一种在计算设备上的方法,包括:
从一个或多个协作通信应用迭代地接收包括用户的通信的用户数据,并且分析接收到的用户数据以提取关于所述用户的上下文信息;
接收关于在包括所述用户的组织内的关系的知识图数据,分析所述知识图数据以从所述知识图中提取上下文信息;以及
接收源自协作通信应用内的搜索查询,解析所述搜索查询以识别参考搜索项,利用所述参考搜索项来查询针对所述用户的所述上下文信息数据存储以识别与所述参考搜索项相关联的、先前存储的关于所述用户的上下文信息,并且将识别出的先前存储的关于所述用户的上下文信息发送到第一协作通信应用;
其中,上下文信息包括识别出的实体类型/实体名称对;以及
其中,提取所述上下文信息还包括:
确定关于所述识别出的实体类型/实体名称对的正确性的置信度的置信度分数;以及
当针对所述上下文信息的所述置信度分数满足阈值时,将所述上下文信息提供给所述上下文信息数据存储以用于存储。
2.根据权利要求1所述的方法,其中,来自所述一个或多个协作通信应用的所述用户数据包括以下中的一项或多项:电子邮件数据、消息传递数据、共享工作空间数据、文件交互数据和组织搜索历史数据。
3.根据任一前述权利要求所述的方法,还包括:将所述用户数据转换成与所述用户数据的原始格式不同的结构化格式。
4.根据任一前述权利要求所述的方法,其中,所述上下文信息包括以下中的一项或多项:从所述用户数据中提取的实体、关键短语类别和意图。
5.根据权利要求4所述的方法,还包括:利用机器学习分类器来分析所述用户数据以提取一个或多个类别。
6.根据任一前述权利要求所述的方法,其中,起源的协作通信应用是与从其接收包括所述用户的所述通信的所述用户数据的所述一个或多个协作通信应用不同的。
7.根据权利要求1所述的方法,其中,所述置信度分数包括基于所述识别出的实体类型/实体名称对的多个标识的累积置信度分数。
8.一种计算机程序,所述计算机程序当在计算设备的处理器上运行时被配置为执行根据权利要求1至7中的任一项所述的方法。
9.一种计算设备,包括:
处理器;以及
存储设备,其包括能由所述处理器运行用于以下操作的指令:
将用户数据从在所述计算设备上运行的一个或多个协作通信应用迭代地传输到根据任一前述权利要求所述的接收计算设备上的上下文搜索服务;
单独地:
在协作通信应用中接收对搜索查询的用户输入,所述搜索查询包括参考搜索项,
将关于所述搜索查询的信息发送到所述上下文搜索服务,所述上下文搜索服务包括关于所述用户的上下文信息,关于所述用户的所述上下文信息中的至少一些已经从由所述一个或多个协作通信应用提供给所述上下文搜索服务的所述用户数据获得,
从所述上下文搜索服务接收先前存储的关于所述用户的上下文信息以扩充所述搜索查询中的所述参考搜索项,以及
利用扩充所述参考搜索项的、先前存储的关于所述用户的上下文信息来执行所述搜索查询。
10.根据权利要求9所述的计算设备,其中,来自所述一个或多个协作通信应用的所述用户数据包括以下中的一项或多项:电子邮件数据、消息传递数据、文件交互数据和组织搜索历史数据。
11.根据权利要求9或10所述的计算设备,其中,所述指令还能运行以通过自然语言处理模块来解析所述搜索查询。
12.根据权利要求9至11中的任一项所述的计算设备,其中,所述上下文信息包括以下中的一项或多项:从所述用户数据中提取的实体、关键短语、意图和类别。
13.根据权利要求9至12中的任一项所述的计算设备,其中,被发送到所述上下文搜索服务的关于所述搜索查询的所述信息包括时间参考搜索项。
14.一种计算设备,包括:
处理器;以及
存储设备,其包括能由所述处理器运行以用于以下操作的指令:
从一个或多个协作通信应用迭代地接收包括用户的通信的用户数据,并且分析接收到的用户数据以提取关于所述用户的上下文信息;
接收关于在包括所述用户的组织内的关系的知识图数据,分析所述知识图数据以从所述知识图中提取上下文信息;以及
接收源自协作通信应用内的搜索查询;
解析所述搜索查询以识别参考搜索项;
利用所述参考搜索项来查询所述上下文信息数据存储以识别与所述参考搜索项相关联的、先前存储的关于所述用户的上下文信息;以及
将识别出的先前存储的上下文信息发送到所述协作通信应用;
其中,上下文信息包括识别出的实体类型/实体名称对;以及
其中,所述指令能运行以通过以下操作来提取所述上下文信息:
确定关于所述识别出的实体类型/实体名称对的正确性的置信度的置信度分数;以及
当针对所述上下文信息的所述置信度分数满足阈值时,将所述上下文信息提供给所述上下文信息数据存储以用于存储。
15.根据权利要求14所述的计算设备,其中,来自所述一个或多个协作通信应用的所述用户数据包括以下中的一项或多项:电子邮件数据、消息传递数据、共享工作空间数据、文件交互数据和组织搜索历史数据。
16.根据权利要求14或15所述的计算设备,其中,从其接收所述搜索查询的所述协作通信应用是与从其接收所述用户数据的所述一个或多个协作通信应用不同的。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NL2024793 | 2020-01-30 | ||
NL2024793A NL2024793B1 (en) | 2020-01-30 | 2020-01-30 | Contextual search in collaborative communications applications |
PCT/US2020/063721 WO2021154395A1 (en) | 2020-01-30 | 2020-12-08 | Contextual search in collaborative communications applications |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115023719A true CN115023719A (zh) | 2022-09-06 |
Family
ID=70155267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080094951.3A Pending CN115023719A (zh) | 2020-01-30 | 2020-12-08 | 在协作通信应用中的上下文搜索 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220414129A1 (zh) |
EP (1) | EP4097663A1 (zh) |
CN (1) | CN115023719A (zh) |
NL (1) | NL2024793B1 (zh) |
WO (1) | WO2021154395A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9501530B1 (en) * | 2014-04-01 | 2016-11-22 | Google Inc. | Systems and methods for selecting content |
US20170286133A1 (en) * | 2016-03-29 | 2017-10-05 | Microsoft Technology Licensing, Llc | One Step Task Completion |
US10878192B2 (en) * | 2017-01-06 | 2020-12-29 | Microsoft Technology Licensing, Llc | Contextual document recall |
US10614086B2 (en) * | 2018-07-06 | 2020-04-07 | Accenture Global Solutions Limited | Orchestrated hydration of a knowledge graph |
-
2020
- 2020-01-30 NL NL2024793A patent/NL2024793B1/en active
- 2020-12-08 CN CN202080094951.3A patent/CN115023719A/zh active Pending
- 2020-12-08 EP EP20828924.9A patent/EP4097663A1/en active Pending
- 2020-12-08 WO PCT/US2020/063721 patent/WO2021154395A1/en unknown
- 2020-12-08 US US17/759,169 patent/US20220414129A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4097663A1 (en) | 2022-12-07 |
WO2021154395A1 (en) | 2021-08-05 |
NL2024793B1 (en) | 2021-09-10 |
US20220414129A1 (en) | 2022-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10832008B2 (en) | Computerized system and method for automatically transforming and providing domain specific chatbot responses | |
US11514235B2 (en) | Information extraction from open-ended schema-less tables | |
CN110569377B (zh) | 一种媒体文件的处理方法和装置 | |
US10474962B2 (en) | Semantic entity relation detection classifier training | |
US9373086B1 (en) | Crowdsource reasoning process to facilitate question answering | |
US9626622B2 (en) | Training a question/answer system using answer keys based on forum content | |
US20160196336A1 (en) | Cognitive Interactive Search Based on Personalized User Model and Context | |
CN112106056A (zh) | 构造虚构的话语树来提高回答聚敛性问题的能力 | |
US20200117938A1 (en) | Graphical user interface generation based on image analysis | |
EP3837618A1 (en) | User-centric contextual information for browser | |
CN110297890B (zh) | 使用交互式自然语言对话的图像获取 | |
US11436446B2 (en) | Image analysis enhanced related item decision | |
CN114238573A (zh) | 基于文本对抗样例的信息推送方法及装置 | |
US11126682B1 (en) | Hyperlink based multimedia processing | |
CN110597963A (zh) | 表情问答库的构建方法、表情搜索方法、装置及存储介质 | |
US10770072B2 (en) | Cognitive triggering of human interaction strategies to facilitate collaboration, productivity, and learning | |
WO2023278052A1 (en) | Automated troubleshooter | |
Kebe et al. | A spoken language dataset of descriptions for speech-based grounded language learning | |
CN115803734A (zh) | 使用动作解释的自然语言丰富 | |
US20220358293A1 (en) | Alignment of values and opinions between two distinct entities | |
CN115023719A (zh) | 在协作通信应用中的上下文搜索 | |
US12041099B2 (en) | Data modeling for virtual collaboration environment | |
US20240362062A1 (en) | Task clustering model | |
CN118467816A (zh) | 基于生成模型的推荐方法、装置、设备及介质 | |
EP4404130A1 (fr) | Systeme et procede de generation automatique de contenus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |