CN111226276B

CN111226276B - 具有音频接口的智能通信助手

Info

Publication number: CN111226276B
Application number: CN201880068007.3A
Authority: CN
Inventors: N·戈特比; A·尼豪斯; S·温勒哥帕兰; A·安东尼耶维奇; T·塔迪奇; V·阿格拉瓦尔; L·施蒂费尔曼
Original assignee: Microsoft Technology Licensing LLC
Current assignee: Microsoft Technology Licensing LLC
Priority date: 2017-10-17
Filing date: 2018-10-10
Publication date: 2024-01-16
Anticipated expiration: 2038-10-10
Also published as: CN111226276A; US20190116144A1; US11178082B2; WO2019079079A1; EP3698356A1; US10516637B2; US20200084166A1

Abstract

呈现了用于具有音频接口的智能通信助手的方法、系统、和计算机程序。一种方法包括用于得到寻址到用户的消息的操作。所述消息来自于一个或多个消息源并且每个消息包括包含文本的消息数据。该方法还包括用于进行以下动作的操作：分析该消息数据以确定每个消息的含义，基于每个消息的相应消息数据和含义来为每个消息生成得分，并且基于所述消息的消息得分和含义来为所述消息生成文本概要。话音概要是基于该文本概要来创建的，并且该话音概要接着被发送至与该用户相关联的扬声器。该音频接口还允许该用户针对所述消息口头请求动作。

Description

具有音频接口的智能通信助手

技术领域

本文所公开的主题总体上设计用于改进用户与电子设备的交互的方法、系统、和程序。

背景技术

环境(ambient)设备在人们的生活中正变得日益普及，例如车上的免提设备、智能头戴式耳机、没有显示器的数字助手、蓝牙耳机等。因此，基于话音的接口正变得日益普及。口头交互对于询问简单问题(例如，几点了，现在什么温度，谁写了唐璜，在5点提醒我打开烤箱)而言是容易的，但是却难以消化诸如电子邮件之类的长消息。

在许多情况下用户不容易访问到具有显示器的电子设备并且用户想要查看通信状态，例如新的电子邮件、新的文本消息、新的社交网络帖子等。常常，通信包括文本组件，并且在有显示器可用时要消费这种类型的通信是非常容易的，但是要经由音频通信来访问该内容则要困难得多。处理向某人“读出”的消息明显比简单地读消息更难，这是因为与读消息相比，这要求大脑更加集中于聆听它们。

例如，如果用户正在慢跑则不便于读显示器，然而该用户能够收听消息。不幸的是，一些消息(例如，电子邮件消息)可能很长，并且简单地让电子设备读出这些长消息可能耗时很长并且要大量注意力。另外，在慢跑的同时尝试读显示器可能造成危险性后果，例如发生事故或者跌落并损坏电话。

附图说明

各附图仅图示出本公开的示例实施例而并不应当被认为对其范围有所限制。

图1图示了根据一些示例实施例的具有音频接口的智能通信助手的使用。

图2是根据一些示例实施例的用于实现智能通信助手的系统的架构。

图3图示了根据一些示例实施例的智能通信助手的模块。

图4是根据一些示例实施例的用于消息收集和排序的方法的流程图。

图5是根据一些示例实施例的用于实现音频接口的方法的if流程图。

图6是根据一些示例实施例的用于消息评分和排序的方法的if流程图。

图7图示了根据一些示例实施例的机器学习程序的训练和使用。

图8是根据一些示例实施例的用于实现具有音频接口的智能通信助手的方法的流程图。

图9是图示了可以在其上实现一个或多个示例实施例的机器的示例的框图。

具体实施方式

示例方法、系统和计算机程序针对一种具有音频接口的通信助手。示例仅代表可能的变化形式。除非另外明确指出，否则组件和功能是可选的并且可以被组合或细分，并且操作的顺序可以有所变化或者被组合或细分。在以下描述中，出于解释的目的而阐述了许多具体细节以提供对示例实施例的全面理解。然而，对于本领域技术人员而言，当前主题显然可以在没有这些具体细节的情况下被实践。

随着诸如智能扬声器、具有免提计算机的连接的汽车、以及连接的耳机设备之类的更多环境设备的出现，用户希望经由话音接口来监视基于文本的通信，例如电子邮件、文本消息、社交网络消息等。然而，利用话音接口可能难以消费文本通信，这是因为所述通信可能很长或者可能存在太多需要为了呈现而被优先化的消息。另外，与将文本转换为话音相比，利用显示器来消费文本通信则明显更加容易。

本文所呈现的实施例提供了一种具有音频接口的智能通信助手，其能够经由口头命令和口头响应来与用户进行交互。该智能通信助手能够从多个源收集消息，分析所述消息以识别含义和优先级，并且接着提供与所选择的消息相关的消息概要或详细信息。

本文所呈现的系统提供了针对消息的多种来源的访问，随后是对通信的分析和优先化，这包括创建与消息内容相关的洞察(insight)以更好地口头通知用户。例如，该智能通信助手能够报告新消息的概要，识别来自重要人员的消息，识别消息正文中所请求的动作项，识别来自航空公司的值机请求，等等。

基于话音的接口允许用户使用自然语言进行通信以请求与文本消息相关的操作，例如提供概要、读消息、得到消息的概要、口述并发送消息，等等。

在一个实施例中，提供了一种方法。该方法包括用于从一个或多个消息源得到消息的操作。所述消息寻址到用户，并且每个消息包括包含文本的消息数据。该方法还包括用于进行以下动作的操作：分析所述消息数据以确定每个消息的含义，基于每个消息的相应消息数据和含义来为每个消息生成得分，并且基于所述消息的消息得分和含义来为所述消息生成文本概要。所述话音概要是基于所述文本概要创建的，并且所述话音概要接着被发送至与该用户相关联的扬声器。该音频接口还允许用户针对该消息口头地请求动作。

在另一个实施例中，一种系统包括存储器以及一个或多个计算机处理器，所述存储器包含指令。所述指令在被所述一个或多个计算机处理器执行时使得所述一个或多个计算机处理器实行以下操作，包括：从一个或多个消息源得到一个或多个消息，所述一个或多个消息寻址到用户，每个消息包括包含文本的消息数据；分析所述消息数据以确定每个消息的含义；基于每个消息的相应消息数据和含义来为每个消息生成得分；基于所述消息的消息得分和含义来为所述消息生成文本概要；基于所述文本概要来创建话音概要；并且将该话音概要发送至与该用户相关联的扬声器。

在又另一个实施例中，一种包括指令的非暂时性机器可读存储介质，所述指令当由机器执行时使得该机器实行以下操作，包括：从一个或多个消息源得到一个或多个消息的，所述一个或多个消息寻址到用户，每个消息包括包含文本的消息数据；分析所述消息数据以确定每个消息的含义；基于每个消息的相应消息数据和含义来为每个消息生成得分；基于所述消息的消息得分和含义来为所述消息生成文本概要；基于所述文本概要来创建话音概要；并且将该话音概要发送至与该用户相关联的扬声器。

图1图示了根据一些示例实施例的具有音频接口的智能通信助手的使用。用户102正在听着耳机108慢跑，所述耳机108无线地连接至电话106。电话106提供了用户界面104，其示出了多个不同的消息应用，例如电子邮件、电话、/>团队协作应用、消息、和/>还可以包括其他类型的消息app以用于智能通信助手144，例如社交网络消息。

所述应用提供了文本通信，但是也可以利用其他类型的通信，例如语音通信(例如，语音邮件)。例如，智能通信助手114可以收听语音邮件并且将该语音邮件转换为文本。在一些示例实施例中，每个应用包括数字指示符，其示出已经有多少新的通信到达。

用户102已经请求了新到来通信的概要，并且智能通信助手114分析不同类型的消息以便为该用户生成口头概要110，例如“您有一封来自您上司的电子邮件，以及为您的航班办理值机的电子邮件，请求您的简历的文本，来自您父亲的语音邮件，以及27个其他消息”。

在图1的示例中，用户接着口头上请求112“我的上司想要什么？”，并且智能通信助手114以来自该用户上司的电子邮件的概要作为回应。如果用户要求“为我读出来自我上司的消息”，则智能通信助手114将读出该消息而不是提供概要。所述交互可以在智能通信助手114与用户102之间继续进行。

注意到，本文呈现的实施例是参考文本通信来描述的，但是相同的原理可以被应用于其他形式的通信。在一些示例实施例中，智能通信助手114可以将其他类型的通信转换为文本并且接着利用其他基于文本的通信来处理它们。例如，智能通信助手114可以将语音邮件、传真、电子邮件附件、扫描等转换为文本以供处理。

在现有解决方案中，一些数字助手仅能够通过将文本转换为话音来读出消息。然而，这些解决方案不能够理解消息的内容，对消息进行优先排序，并且为用户生成概要。因此，这些现有解决方案不是非常有用。例如，如果现有技术的助手向用户102读出所有的新消息，比如说7封新的电子邮件，则读出所有消息可能花费很长时间，并且重要的消息被嵌入在可能并不重要且冗长的消息之内。

智能通信助手114在许多其他类型的场景中可能是有用的。例如，用户可能准备进入汽车并驾车前去工作，并且该用户可以在他动身之前询问智能通信助手114以得到通信概要。如果智能通信助手114告诉该用户有来自她上司的要求关于某个项目的更新的紧急通信，则该用户可以替代地在驾车前去工作之前访问电子邮件应用以进行回复。另外，话音接口在用户驾车且无法访问显示器时可以非常有用。

智能通信助手114的目标是提供一种用于访问通信数据的易于使用的话音接口。研究已经显示，与经由图形用户界面(GUI)通信的内容相比，用户可能需要明显更大的认知负荷来理解仅通过话音所通信的内容。例如，理解电子邮件需要找出谁是发件人，该信中抄送的其他人，消息发送的时间，消息的主题，消息是否被标记为高重要性，以及消息自身的文本。在该消息被书写在显示器上时，这些动作可以非常快地被执行，但是在所有这样的信息都要向用户读出时则要耗费明显更长的时间和努力来吸收该消息。实际上，在阅读的同时，用户能够跳过一些部分并且关注于感兴趣的部分(例如，跳过发送日期和时间)，但是这在消息被转换为话音时是不可能的。

提供该类型的智能助手是一项复杂的任务，因为其要求理解来自用户的口头命令，理解消息的内容，以及有确定这些消息对于用户的重要性的能力。

注意到，智能通信助手114可以被用户所调用(例如，用户询问问题并且智能通信助手114对那些问题作出响应)，并且智能通信助手114在一些情况下也可以在没有提示的情况下生成通信，所述提示例如在接收到显示出紧急并且要求来自用户的快速动作的电子邮件时。

图2是根据一些示例实施例的用于实现智能通信助手的系统的架构。智能通信助手服务器218从多个通信源214收集通信信息，所述通信源至少包括电子邮件服务器202、应用服务器204、用户设备206和移动电话106、电信服务器208、团队合作服务器210、数字助手服务器212，等等。

可以访问电信服务器208以收集各种语音邮件或到来的文本消息，可以访问电子邮件服务器202以查看新的电子邮件，可以访问应用服务器204以得到应用消息(例如，WhatsApp)，也可以访问移动电话106以得到下载到该移动电话106的通信数据，可以访问团队合作服务器210以得到针对协作工具(例如，Microsoft Teams)的通信，可以访问数字助手服务器212以得到数字助手数据(例如，Cortana、Alexa、Google Home)，等等。

在一些示例实施例中，智能通信助手经由话音设备与用户接合，所述话音设备至少包括一个或多个扬声器和一个或多个麦克风。在一些情况下，话音设备202可以不包括麦克风，并且对接口的输入可以经由触摸或其他外设来执行。话音设备202的示例包括智能电话、汽车中的免提接口、移动电话106、环境设备、头戴式耳机、耳机，等等。

智能通信助手从这些不同的源收集消息数据，并且接着分析所述消息数据以压缩信息并且使得其经由话音接口可获得。在一些示例实施例中，该智能通信助手还包括其他类型的接口。例如，智能通信助手可以在显示器上向用户呈现概要以便在用户能够访问显示器时快速访问到来的通信的概要。

该智能通信助手收集需要传达给用户的重要信息，从而该用户不会被大量到来的消息所淹没。重要消息被单独列出以便优先呈现，并且该智能通信助手能够提供概览，由此用户能够决定是要得到更详细的信息、生成响应、还是采取一些其他动作。

在一些示例实施例中，智能通信助手114包括以下特征：

-为了由诸如智能扬声器之类的设备进行语音输出而定制的通信的优先化和概括。

-对于经由话音命令对高优先级消息作出快速动作的支持(例如，进行呼叫，批准费用报告，回复消息，将消息标记为重要，添加任务)。

-基于丰富洞察对通信进行优先排序，例如用户与发送者的关系，在消息内是否有任务、或者可操作链接(例如，航班值机)。

-基于消息内容和其他通信元数据(例如，发送者和主题)来概括高优先级通信以便进行语音输出。

-将通信从仅音频设备指派至具有屏幕的设备(例如，概要非常长，用户请求通信的全文，需要屏幕来浏览并批准费用报告)。

-跨一个或多个源对通信进行聚合以便进行优先化和概括。

-提供覆盖多种通信方式的概要。

-与其他应用的交互(例如，处理口头请求以向用户的日历添加预约)。

图3图示了根据一些示例实施例的智能通信助手的模块。在一些示例实施例中，智能通信助手114包括可以以硬件、软件(例如，程序)或者它们的组合所实现的若干模块。所述模块包括话音生成模块303、话音分析模块304、对话管理器305、消息收集模块306、消息分析模块307、消息排序模块308、信息搜索模块309、通信模块310，以及一个或多个数据库。所述数据库可以包括用于存储用户相关数据(例如，用户简档数据、组织图、好友、队友、地址等)的用户数据数据库，包括有关过往用户活动(例如，之前的消息以及之前对消息的响应)的信息的历史数据数据库312，以及包括针对智能通信助手114的使用的配置参数的配置数据313。配置参数可以由系统管理器或用户所输入，或者可以由智能通信助手114基于用户偏好随时间调节。

话音生成模块303将文本转换为话音以便呈现给用户。话音分析模块304接收音频(例如，用户话音)并且将该音频转换为文本，例如执行话音识别。对话管理器304基于平面语言(plane-language)通信而为用户提供交互性接口。对话管理器304能够分析用户语言以将该语言转换为针对智能通信助手114的命令。

另外，消息收集模块306访问消息信息的不同源以便收集用户的到来的通信。例如，消息收集模块306可以访问图2中所图示的通信信息源214中的一个或多个。

消息分析模块307分析消息的内容以确定消息中嵌入的含义，以便能够概括并提供有关消息内容的洞察。消息排序模块308分析分析消息特征以为消息确定得分，以便对消息排序和优先化从而为用户创建概要或呈现。消息排序处理的更多细节在下文参考图4和6-7被提供。

信息搜索模块309为用户执行搜索，并且所述搜索可以是针对可以由通用搜索引擎执行的通用搜索的，或者是针对用户相关信息的搜索(例如，搜索用户日历、搜索用户的到来的消息、搜索用户的旧消息)。

通信模块310为智能通信助手114提供通信能力以便经由网络216连接至用户或者信息源。

在一些示例实施例中，应用可以被安装在用户设备上(例如，移动电话106中的话音app上)，从而与智能通信助手114以及用户进行交互。在一些示例实施例中，话音app 314可以与设备的操作系统相集成。另一个操作实施例中，可以经由浏览器或者安装在设备上的一些其他app来访问智能通信助手114。在一些示例实施例中，上文所描述的用于智能通信助手114的一些功能可以全部或部分由话音app 314所执行。

注意到，图3中所示的实施例是示例而并未对每种可能的实施例都加以描述。其他实施例可以采用不同的模块、另外的模块，将模块的功能组合为单个模块、较少的模块，跨多个服务器分布功能，等等。图3中所示的实施例因此并不应当被解释为是穷举的或限制性的，而相反地是说明性的。

图4是根据一些示例实施例的用于消息收集和排序的方法的流程图。尽管该流程图中的各个操作被顺序呈现和描述，但是本领域技术人员将会意识到，一些或全部操作可以以不同顺序来执行，被组合或省略，或者被并行执行。

在操作402处，从诸如图2所示的数据源之类的一个或多个源收集消息数据。在一些实施例中，所述消息数据包括文本，并且在其他实施例中，该消息数据可以被转换为文本，例如通过执行语音邮件的话音识别。

从操作402处，该方法流向操作404，其中每个消息被分析以确定其内容。此外，消息内容可以按照需要被概括(例如，在被用户请求时或者当接收到重要消息以及生成警告语音消息时)。

例如，智能通信助手可能发现在过去的一个小时用户有10封新的电子邮件，即时消息应用(例如，Skype)中的5条新消息，以及经由团队合作应用接收的一条消息。该用户可以询问“我有什么新的通信？”挑战在于理解到来的消息，对它们进行优先化，并且为用户生成概要报告。

从操作404处，该方法流向操作406，其中每个消息被分析以确定每个消息的排序属性。操作408处，消息基于它们的排序属性而被排序。有关排序处理的更多细节在下文参考图6提供。

例如，排序过程可以包括查看发送者的身份，并且基于该发送者的身份，智能通信助手114可以决定将消息标记为高优先级。例如，从用户的上司或配偶接收的消息可以被排序为是重要的。此外，可能检测到发送者是用户团队中的成员，并且基于该同事关系，该消息可以被标记为重要的，但可能不像来自上司的消息那样重要。

在操作410处，为用户创建话音通信以向用户通知到来的消息。例如，智能通信助手114可以回应以“您有两封来自您经理的电子邮件，一条来自您儿子的消息，以及来自重要客户的文本消息”或者“您的经理请您立刻发送财政报告并且您有来自被标记为高重要性的客户的电子邮件”。

被认为不重要(例如，具有低于预确定的阈值的得分)的消息可以被忽略或者以概要形式呈现，例如“您有8封电子邮件，3条即时消息，以及一条低优先级的文本消息”。此时，用户可以输入语音命令，例如“读出来自我上司的电子邮件”或者“给Jack发文本消息并且告诉他我会在15分钟内到达餐厅”。在一些示例实施例中，消息得分是处于一个范围内的数值，例如0到1或者0到100。用于确定优先级的阈值可以被设置为100分中的75分，并且具有低于75的得分的消息可以被认为不重要。在其他示例实施例中，可以针对优先级定义不同的阈值。

图5是根据一些示例实施例的用于实现音频接口的方法的if流程图。虽然该流程图中的各个操作被顺序呈现和描述，但是本领域技术人员将会意识到，一些或全部操作可以以不同顺序来执行，被组合或省略，或者被并行执行。

在操作504处，经由话音接收来自用户102的用户请求。从操作504处，该方法流向操作506，其中所接收的话音被分析以确定该请求的性质。智能通信助手114通过使用自然语言来简化所输入的命令。

在操作508进行检查以确定已经从用户接收到声明类型的请求。基于该请求类型，该方法流向与不同请求类型相关联的操作。图5图示了几种请求类型，但是本领域技术人员将会容易领会与口头通信相关的其他类型的请求。

操作510处，用于对针对概要的请求进行响应，包括分析到来的消息，优先化到来的消息，并且向用户返回语音概要。

操作512处，用于对阅读出消息的请求进行响应，包括将消息的文本转换为话音并且随后将该话音传达给用户。

操作514处，用于对分析消息内容的请求进行响应，包括分析消息的内容并且发送响应。例如，用户可以询问“我的上司想要什么？”并且智能通信助手114可以回应“他想要在明天9AM开会”。在一些示例实施例中，如果消息简短(例如，25个或更少的单词)，则可以读出完整的消息而不是尝试概括该简短消息。

操作516处，用于应答针对通信作出响应的请求，包括将话音转换为消息并且经由对应的媒体发送消息518。例如，用户可以请求“应答并且告诉他好的，我有空，并且将该会议添加至我的日历”。

操作520处，用于对搜索请求进行响应，包括执行搜索，概括结果，并且经由语音消息将结果522传达给用户。

操作524处，用于对向电话发送信息的请求进行响应，包括将概要发送至电话从而用户可以随后对该概要采取动作。该信息可以作为语音录制、文本消息、电子邮件、电话通知等被转发至电话。

注意到，图5中所示的实施例是示例而并未对每种可能的实施例都加以描述。其他实施例可以包括不同请求或者将请求组合为单个话音输入。图5所示的实施例因此并不应当被解释为是穷举的或限制性的，而相反地是说明性的。

图6是根据一些示例实施例的用于消息评分和排序的方法的if流程图。虽然该流程图中的各个操作被顺序呈现和描述，但是本领域技术人员将会意识到，一些或全部操作可以以不同顺序来执行，被组合或省略，或者被并行执行。

对消息进行排序可以包括检查消息以识别优先级。优先级可以是基于消息的发送者或者其他特性的，例如被标记为紧急的消息、请求来自用户的动作的消息，等等。可以使用多种属性来对消息进行排序，例如该消息是否被标记为具有高度重要性，用户之前是否标记过这种类型的消息，消息中是否有针对动作的请求，用户的姓名是否被包括在针对另一个用户的消息中，等等。

在一些情况下，并非所有新的消息都被选择进行排序，而是仅选择其子集。例如，如果用户询问“有来自我的经理的新消息吗？”，则智能通信助手114可以首先访问不同的消息源并且提取来自经理的消息，例如经由电子邮件、Skype的到来的消息，来自团队合作应用的消息，等等。一旦来自经理的所有消息都被收集，则所述消息可以基于它们的属性而被排序。显然，在这种情况下，所有消息都来自该经理，从而排序的差异将是基于在消息中发现的其他属性的，例如消息具有指明紧急性的词，消息包括截止日期，等等。

在一些示例实施例中，检查多个属性以确定排序，并且每个属性生成属性得分。一旦所有属性得分都能够获得，则基于该属性得分创建复合消息得分。在其他示例实施例中，利用机器学习程序来基于该机器学习程序所评估的属性的价值以及基于优先化消息的过往历史来确定消息得分。

可以存在用来计算属性得分的启发式方法和机器学习方法的混合。例如，可以识别启发式规则以确定发送者是否是用户的经理，这简单地隐含了检查消息发送者的身份。在其他情况下，可以利用机器学习程序来确定得分，例如分析用户与另一个发送者之间的通信历史，以便在特定发送者具有与用户的频繁通信模式时提供高的得分，并且在发送者不频繁与用户通信时提供低的得分。因此，可以使用任何启发式方法或机器学习程序来确定属性得分。例如，可以使用机器学习程序来确定发送者是否是用户的上司，这在用户具有多名上司时或者在并未清晰定义管理机制的情况下会是有用的，例如在处理独立承包方时。

图6图示了用于对消息排序的多种属性，但是其他实施例可以利用另外的属性、较少的属性或者属性的不同组合。图6所示的实施例因此不应当被解释为是穷举的或限制性的，而相反地是说明性的。

一旦接收到消息602，就基于发送者来计算得分S₁。得分S₁可以基于发送者而变化。例如，可以向经理、配偶、同事、家庭成员、律师、医生、好友、运动队友等指定以不同的得分。例如，对来自上司的消息所指定的得分将会高于指定给用户表亲的得分。

在一些示例实施例中，对用户与其他发送者的通信模式进行分析(例如，利用机器学习程序基于先前的通信)，并且该通信模式会导致得分增加或降低。例如，用户可能正在进行与外部供应商的项目，其中该项目会持续三个月。在这三个月期间，在用户与该外部供应商频繁通信的情况下，来自该外部供应商的消息可以得到高的得分。然而，在这三个月后，通信如果有也可能明显不太频繁，则该外部供应商消息的消息得分将会下降。另外地，通信模式对于对来自队友、家庭成员等的消息进行排序也会是有用的。

通信模式之所以有用还因为在系统识别出用户对某些发送者回应非常快的情况下，该系统将假设那些发送者是重要的并且将给予高优先级。

在一些示例实施例中，可以检查公司或者公司一部分的组织图以确定用户与发送者的关系。以该方式，可以找到发送者的团队队友或者层级中两个级别或更高的经理。例如，如果上司的上司向用户发送了直达消息而没有任何其他接收方，则该消息将被标记以高优先级，因为其对于该用户而言将可能是重要的。然而，如果上司的上司向她所有下属发送通信，则该消息可以不被标记为是重要的，原因在于其可能是例行通信。

来自客户的消息也将被给予高的得分，这是因为大约20％来自客户的电子邮件包括针对用户所实施动作的请求。

在操作606处，进行检查以确定消息正文中是否存在动作请求。利用测试数据来训练机器学习程序，所述测试数据包括样本通信以及那些通信是否包括动作项的指示。该机器学习程序利用多种特征来进行预测，例如消息中包括的词语、发送者的身份、用户的简档，等等。将基于消息包括一个或多个动作请求的概率来指定得分S₂，该概率越高，得分S₂就越高。

在操作608处，基于该消息针对来自航空公司的值机请求的概率而确定得分S₃。例如，如果航空公司已经发送了指示到时间对下一天的航班进行值机的消息，则该消息将被优先化。

在一些示例实施例中，针对诸如来自航空公司的通信之类的某些通信定义标准方案。智能通信助手114检查匹配某种方案的消息的存在(例如，通过检查发送者和主题)并且接着应用该方案来获得具体数据，例如航班号、起飞时间、到达时间、起飞机场等。该方案的使用简化了对消息的解析，因为该方案定义了获得方案中所定义属性的数值的简单方式，而不是必须对需要更多时间进行分析的自由形式的消息进行解析。

除了来自航空公司的消息之外，可以采用其他常见方案，例如针对银行结单、支付结单、预约、账单、酒店预订、汽车预订等的方案。

在操作610处，确定消息是否与工作搜索相关，并且基于该确定来计算得分S₄。得分S₄可以基于用户的当前活动而变化。如果用户没有工作或者在主动搜寻新的工作，则该消息可以被给予高优先级，而如果该消息是针对来自招聘人员的主动请求，则该消息可以被给予较低优先级。

在操作612处，基于该消息是否涉及学校而确定得分S₅。如果用户是学生，则该消息可以被给予高的得分，除非行为模式表示该用户并不对涉及学校的消息进行快速响应。

在操作614处，基于该消息由用户的银行所发送的概率来计算得分S₆。

在一些示例实施例中，用户可以利用对智能通信助手114配置以一些用户定义的警告。例如，用户可以创建警告以对来自该用户刚刚遇到的人的消息或者来自大学管理部门的消息给予高优先级，等等。在操作616处，基于与用户所定义的警告相关联的消息的存在来计算得分S₇。

在操作618处，基于该消息是从供应方发送的账单的概率来计算得分S₈。

在操作620处，基于该消息包括针对紧急响应的请求的确定来计算得分S₉。例如，机器学习程序可以分析消息中的词并且基于经常表示该消息为紧急的一些词来确定能量感觉，例如“赶快”、“现在就做”，等等。在一些示例实施例中，也可以在消息被标记为“高度重要”的情况下指定以紧急感觉。

一旦计算出得分S_i，则在操作622处，就基于多个属性得分S_i来计算消息得分。在一些示例实施例中，利用属性得分的加权总和或者一些其他数学函数来汇总所述消息。在其他示例实施例中，利用机器学习程序来基于多个属性得分计算消息得分。

从操作622处，该方法流向操作624以基于每个消息的消息得分来计算相应消息的消息优先级。在一些示例实施例中，消息根据它们的消息得分而被排序。在一些示例实施例中，消息在它们的得分高于预确定的阈值得分时被认为是重要的。

从操作624处，该方法流向操作626，其中概要被生成。在操作628处，该概要被转换为话音并且接着被传送至用户的设备。

图7图示了根据一些示例实施例的机器学习程序的训练和使用。在一些示例实施例中，也被称作机器学习算法或工具的机器学习程序(MLP)被用来执行与搜索相关联的操作，所述搜索例如职位搜索。

机器学习是给予计算机在没有明确编程的情况下进行学习的能力的研究领域。机器学习开拓了算法的研究和构造，所述算法在这里也被称为工具，其可以从现有数据进行学习并且关于新数据进行预测。这样的机器学习工具通过从示例训练数据712构建模型而进行操作，以便进行数据驱动的预测或决策，所述预测或决策被表达为输出或评估。尽管关于几种机器学习工具给出了示例实施例，但是本文所给出的原理可以被应用于其他的机器学习工具。

在一些示例实施例中，可以使用不同的机器学习工具。例如，逻辑回归(LR)、朴素贝叶斯、随机森林(RF)、神经网络(NN)、矩阵因子分解、和支持向量机(SVM)工具可以被用于对工作发布进行分类或评分。

机器学习的两种常见类型的问题是分类问题和回归问题。也被称作归类问题的分类问题的目标在于将事项分类为若干类别数值之一(例如，这个物体是苹果还是橙子？)。回归算法的目标在于对一些事项进行量化(例如，通过提供作为实数的数值)。在一些实施例中，示例机器学习算法提供了职位吸引力得分(例如，从1到100的数字)以将每个工作量化为针对用户的匹配(例如，计算职位吸引力得分)。该机器学习算法利用训练数据712找出影响结果的所识别特征702之间的关联。

机器学习算法利用特征分析数据以生成评估720。特征702是所观察现象的个体可测量属性。特征的概念与在例如线性回归的统计技术中使用的解释变量的概念相关。选取含有信息、有差别且独立的特征对于MLP在模式识别、分类和回归中的有效操作是重要的。特征可以是不同类型，例如数字、字符串、和图形。

在一个示例实施例中，特征702可以是不同类型并且可以包括消息的一个或多个词语703、消息概念704、通信历史705、过往用户行为706、消息的主题707、其他消息属性708、发送者709、和用户数据710。

机器学习算法利用训练数据712找出影响结果或评估720的所识别的特征702之间的关联。在一些示例实施例中，训练数据712包括一个或多个所识别特征702的已知数据以及一个或多个结果，例如检测通信模式、检测消息的含义、生成消息的概要、检测消息中的动作项、检测消息中的紧急性、检测用户与发送者的关系、计算得分属性、计算消息得分，等等。

利用训练数据712和所识别的特征702，机器学习工具在操作714处被训练。该机器学习工具因为特征702与训练数据712相关联而评价它们的价值。训练的结果是经训练的机器学习程序716。

当机器学习程序716被用来执行评估时，新数据718作为输入被提供给经训练的机器学习程序716，并且机器学习程序716生成评估720作为输出。例如，当针对动作项检查消息时，该机器学习程序利用消息内容和消息元数据来确定消息中是否存在针对动作的请求。

图8是根据一些示例实施例的用于实现具有音频接口的智能通信助手的方法的流程图。尽管该流程图中的各个操作被顺序呈现和描述，但是本领域技术人员将会理解，一些或全部操作可以以不同顺序来执行，被组合或省略，或者被并行执行。

在一些示例实施例中，该方法的操作由一个或多个处理器所执行。操作800用于从一个或多个消息源得到一个或多个消息。所述一个或多个消息寻址到用户并且每个消息包括包含文本的消息数据。

从操作802处，该方法流向操作804，其中该消息数据被分析以确定每个消息的含义。从操作804处，该方法流向操作806，其中基于每个消息的消息数据和含义来为每个消息生成得分。

从操作806处，该方法流向操作808，以便基于一个或多个消息的消息得分和含义来为一个或多个消息生成文本概要。在操作810处，基于该文本概要创建话音概要，并且在操作812处，该话音概要被发送至与用户相关联的扬声器。

在一个示例中，生成该得分还包括：针对每个消息，基于该消息数据来识别多个属性中的每个属性的属性值；针对每个属性，基于该属性值生成属性得分；并且基于该消息的属性得分来为每个消息生成得分。

在一个示例中，第一属性是消息是否来自用户的上司。在一个示例中，第二属性是消息发送者和用户之间的工作关系，该工作关系是基于组织图的。在一个示例中，第三属性是检测消息的文本中针对要由用户所执行的动作的请求。在一个示例中，第四属性是检测消息中的紧急性，该紧急性是基于消息文本中的词语被检测的。

在一个示例中，方法800还包括为用户提供话音接口以便接收来自用户的命令，所述命令包括针对话音概要的请求、读出消息的请求、转发消息的请求、创建提醒的请求、以及针对消息概要的请求中的一个或多个。

在一个示例中，生成文本概要还包括确定哪些消息具有高于预确定的阈值的得分，并且针对具有高于预确定的阈值的得分的消息生成文本概要。

在一个示例中，生成一个或多个消息还包括以下中的一个或多个：得到电子邮件消息、得到文本消息、得到聊天消息、和得到来自基于团队的应用的消息。

在一个示例中，生成文本概要还包括创建针对文本概要所选择的消息文本的含义的概要。

图9是图示了可以在其上实现一个或多个示例实施例的机器的示例的框图。在可替换实施例中，机器900可以作为独立设备进行操作或者可以连接(例如，联网)至其他计算设备。在联网部署形式中，机器900可以以服务器-客户端网络环境中的服务器通信设备、客户端通信设备或者其二者的能力进行操作。在一个示例中，机器900可以充当端对端(P2P)(或其他分布式)网络环境中的对等计算设备。机器900可以是个人计算(PC)、平板PC、机顶盒(STB)、个人数字助理(PDA)、移动电话、智能电话、web电器、网络路由器、交换机或网桥，或者能够(顺序地或以其他方式)执行规定该计算设备所要采取的动作的指令的任何计算设备。另外，虽然仅图示了单个计算设备，但是术语“计算设备”还应当被理解为包括单独或联合执行指令集合(或多个集合)以实施本文所讨论的任何一种或多种方法的计算设备的任意组合，例如云计算、软件即服务(SaaS)、其他计算机集群配置。

如本文所描述的，示例可以包括逻辑或者多种组件或机制，或者可以通过它们进行操作。电路是以有形实体所实现的电路的集合，所述有形实体包括硬件(例如，简单电路、门、逻辑单元等)。电路成员资格可以随时间以及基本硬件可变形的不同而是灵活的。电路包括在进行操作时可以独立或组合执行指定操作的成员。在一个示例中，电路的硬件可以以不变的方式被设计为执行具体操作(例如，硬线连接)。在一个示例中，电路的硬件可以包括以可变方式连接的物理组件(例如，执行单元、晶体管、简单电路等)，所述物理组件包括被物理修改(例如，以磁的方式、电气方式，或者通过质量不变的粒子的可移动布置等)以编码具体操作的指令的计算机可读介质。在连接该物理组件时，硬件成分的基础电气特性发生变化，例如从绝缘体变为导体或反之亦然。所述指令使得嵌入式硬件(例如，执行单元或加载机制)能够经由可变连接以硬件创建电路成员从而在操作时实施具体操作的多个部分。相应地，该计算机可读介质在设备操作时通信耦合至电路的其他组件。在一个示例中，任何物理组件都可以在多于一种电路的多于一个成员中被使用。例如，在操作下，执行单元在一个时间点可以在第一电路的第一回路中使用并且在该第一电路的第二回路中被重复使用，或者在不同时间由第二电路中的第三回路所使用。

机器(例如，计算机系统)900可以包括中央处理器(CPU)902、主存储器904和静态存储器906，它们中的一些或全部可以经由链路(例如，总线)908互相通信。机器900可以还包括显示设备910、一个或多个输入设备912(例如，键盘、麦克风、触摸屏、游戏机、遥控器、相机、专用按钮)，以及一个或多个用户界面导航设备914(例如，鼠标、触摸板、触摸屏、操纵杆、视线跟踪器)。在一个示例中，显示设备910、输入设备912和用户界面导航设备914可以是触摸屏显示器。机器900还可以包括大型存储设备(例如，驱动单元)916、信号生成设备918(例如，扬声器)、网络接口设备920，以及一个或多个传感器921，例如全球定位系统(GPS)传感器、罗盘、加速计、磁力计，或者其他传感器。机器900可以包括输出控制器928，例如串行的(例如，通用串行总线(USB))、并行的，或者通信或控制一个或多个外围设备(例如，打印机、读卡器等)的其他有线或无线(例如，红外(IR)、近场通信(NFC)等)连接。

大型存储设备916可以包括机器可读存储介质922，其上存储体现本文所描述的一种或多种技术或功能或者被其所利用的数据结构或指令924(例如，软件)的一个或多个集合。指令924还可以在其被机器900执行的期间完全或至少部分低处于主存储器904内、静态存储器906内，或者处于CPU 902内。在一个示例中，CPU 902、主存储器904、静态存储器906或大型存储设备916之一或者它们的任意组合可以构成机器可读介质。

尽管机器可读存储介质922被图示为单个介质，但是“机器可读存储介质”可以包括被配置为存储一个或多个指令924的单个介质或多个介质(例如，集中或分布式数据库，和/或相关联的缓存和服务器)。

术语“机器可读存储介质”可以包括能够存储、编码、或承载指令924以便由机器900执行并且使得机器900实行本公开的任意一种或多种技术，或者能够存储、编码或承载由这样的指令924所使用或与之相关联的数据结构的任何介质。非限制性的机器可读存储介质的示例可以包括固态存储器以及光学和磁性介质。机器可读存储介质的具体示例可以包括：非易失性存储器，诸如半导体存储器设备(例如，电可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM))和闪速存储器设备；磁盘，例如内置硬盘和可移除盘；磁-光盘；以及CD-ROM和DVD-ROM盘。

利用多种传输协议(例如，帧中继、互联网协议(IP)、传输控制协议(TCP)、用户数据报协议(UDP)、超文本传输协议(HTTP)等)中的任一种，指令924可以经由网络接口设备920使用传输介质而通过通信网络926被发送或接收。示例的通信网络可以包括局域网(LAN)、广域网(WAN)、分组数据网络(例如，互联网)、移动电话网络(例如，蜂窝网络)、老式电话(POTS)网络，以及无线数据网络(例如，被称作的电气电子工程师协会(IEEE)902.3标准族，被称作/>的IEEE 902.16标准族)、IEEE 902.15.4标准族、长期演进(LTE)标准族、通用移动电信系统(UMTS)标准族、端对端(P2P)网络，等等。在一个示例中，网络接口设备920可以包括一个或多个物理插口(例如，以太网、同轴线缆或电话插口)或者一个或多个天线以连接至通信网络926。在一个示例中，网络接口设备920可以包括一个或多个无线调制解调器，例如，蓝牙调制解调器、Wi-Fi调制解调器，或者在本文所提到的任意通信标准下操作的一种或多种调制解调器或收发器。在一个示例中，网络接口设备920可以包括多个天线以使用单输入多输出(SIMO)、多输入多输出(MIMO)、或多输入单输出(MISO)中的至少一种来进行无线通信。在一些示例中，网络接口设备920可以使用多用户MIMO技术来进行无线通信。在一个示例中，传输介质可以包括能够存储、编码、或承载指令以便由机器900来执行的任何有形介质，并且包括数字或模拟通信信号等通信介质从而促成这样的软件的通信。

在该说明书通篇中，多个实例可以实现作为单个实例所描述的组件、操作或结构。尽管一种或多种方法的个体操作被图示和描述为单独操作，但是一个或多个个体操作可以同时执行，而且不要求操作以所图示的顺序来执行。在示例配置中作为单独组件所给出的结构和功能可以被实施为组合结构或组件。类似地，作为单个组件所给出的结构和功能可以实施为单独组件。这些和其他的变化、修改、添加、和改进落入本文主题的范围之内。

本文所图示的实施例被足够详细地描述以使得本领域技术人员能够实践所公开的教导。其他实施例可以被使用或者从中被得出，从而可以进行结构和逻辑的替换和改变而并不会脱离本公开的范围。因此，具体实施方式并非以限制的含义被理解，并且各个实施例的范围仅由所附权利要求连同这样的实施例所享有其权利的等同形式的完整范围一起所限定。

如本文所使用的，术语“或”可以以包含或排他的含义来理解。此外，多个实例可以针对基本文所描述的资源、操作或结构而作为单个实例被提供。此外，各种资源、操作、模块、引擎和数据存储之间的边界是稍显任意的，并且特定的操作在具体的说明性配置的上下文中有所阐述。其他功能分配被预见到并且可以落入本公开各个实施例的范围之内。通常，在示例配置中作为单独资源给出的结构和功能可以被实施为组合的结构或资源。类似地，作为单个资源被给出的结构和功能可以被实施为分立的资源。这些以及其他的变化、修改、添加和改进落入如所附权利要求所表示的本公开的实施例的范围之内。因此，说明书和附图要以说明性而非限制性的含义来看待。

Claims

1.一种用于改进用户与电子设备的交互的系统，包括：

包括指令的存储器；以及

一个或多个计算机处理器，其中，所述指令当由所述一个或多个计算机处理器运行时，使得所述一个或多个计算机处理器执行以下操作，包括：

从一个或多个消息源得到一个或多个消息，所述一个或多个消息被寻址到用户，每个消息包括包含消息文本的消息数据；

分析所述消息数据以确定每个消息中的所述消息文本的含义；

基于每个消息的相应的消息数据和所述消息文本的所述含义来为每个消息生成得分；

基于每个消息的得分来选择消息；

基于所述消息文本的所述含义来为所选择的消息生成文本概要；

基于所述文本概要来为每个所选择的消息创建话音概要；以及

将所选择的消息的所述话音概要发送至与所述用户相关联的扬声器。

2.根据权利要求1所述的系统，其中，生成所述得分还包括：

针对每个消息，基于所述消息数据来识别多个属性中的每个属性的属性值；

针对每个属性，基于所述属性值来生成属性得分；以及

基于每个消息的所述属性得分来为每个消息生成所述得分。

3.根据权利要求2所述的系统，其中，第一属性是所述消息是否来自所述用户的上司，其中，第二属性是所述消息的发送者和所述用户之间的工作关系，所述工作关系是基于组织图的。

4.根据权利要求2所述的系统，其中，第三属性是在所述消息的消息文本中检测针对要由所述用户执行的动作的请求，其中，第四属性是检测所述消息中的紧急性，所述紧急性是基于所述消息的所述消息文本中的词语被检测的。

5.根据权利要求1所述的系统，其中，所述指令还使得所述一个或多个计算机处理器执行以下操作，包括：

为所述用户提供话音接口以用于从所述用户接收命令，所述命令包括以下中的一个或多个：针对所述话音概要的请求、用于读出消息的请求、用于转发消息的请求、用于创建提醒的请求、以及针对消息的概要的请求。

6.一种用于改进用户与电子设备的交互的方法，包括：

由一个或多个处理器从一个或多个消息源得到一个或多个消息，所述一个或多个消息被寻址到用户，每个消息包括包含消息文本的消息数据；

由所述一个或多个处理器分析所述消息数据以确定每个消息中的所述消息文本的含义；

由所述一个或多个处理器基于每个消息的相应的消息数据和所述消息文本的所述含义来为每个消息生成得分；

由所述一个或多个处理器基于每个消息的得分来选择消息；

由所述一个或多个处理器基于所述消息文本的所述含义来为所选择的消息生成文本概要；

由所述一个或多个处理器基于所述文本概要来为每个所选择的消息创建话音概要；以及

由所述一个或多个处理器将所选择的消息的所述话音概要发送至与所述用户相关联的扬声器。

7.根据权利要求6所述的方法，其中，生成所述得分还包括：

针对每个属性，基于所述属性值来生成属性得分；以及

基于每个消息的所述属性得分来为每个消息生成所述得分。

8.根据权利要求7所述的方法，其中，第一属性是所述消息是否来自所述用户的上司。

9.根据权利要求7所述的方法，其中，第二属性是所述消息的发送者和所述用户之间的工作关系，所述工作关系是基于组织图的。

10.根据权利要求7所述的方法，其中，第三属性是在所述消息的消息文本中检测针对要由所述用户执行的动作的请求。

11.根据权利要求7所述的方法，其中，第四属性是检测所述消息中的紧急性，所述紧急性是基于所述消息的所述消息文本中的词语被检测的。

12.根据权利要求6所述的方法，还包括：

13.根据权利要求6所述的方法，其中，生成所述文本概要还包括：

确定哪些消息具有高于预确定的阈值的得分；以及

为具有高于所述预确定的阈值的所述得分的所述消息生成所述文本概要。

14.一种用于改进用户与电子设备的交互的系统，其包括用于执行根据权利要求6-13所述的任一方法的模块。

15.包括指令的至少一种机器可读介质，所述指令当由机器运行时使得所述机器执行根据权利要求6-13所述的任一方法。