CN107533683B

CN107533683B - 相关组建议

Info

Publication number: CN107533683B
Application number: CN201680024513.3A
Authority: CN
Inventors: 谌叶龙; 宋鑫莹; 高剑峰; 过晨雷; 卞秉冀; 王野翊; B·D·雷米克; E·泰勒; M·A·阿里; M·戈斯; 邹阳; M·斯特普; D·杰特利; S·弗里森
Original assignee: Microsoft Technology Licensing LLC
Current assignee: Microsoft Technology Licensing LLC
Priority date: 2015-04-28
Filing date: 2016-04-27
Publication date: 2020-09-22
Anticipated expiration: 2036-04-27
Also published as: EP3289536A1; US20160321283A1; CN107533683A; WO2016176233A1; US10042961B2

Abstract

用于提供用于预测和推荐相关人员(或其他实体)以包括在对话中的人员推荐系统的技术。在示例性实施例中，与用户与目标接收者之间、或者其他用户与接收者之间的通信相关联的多个对话框被收集并且存储作为用户历史。在训练阶段期间，使用用户历史在去噪自动编码器模型中训练编码器块和解码器块。在预测阶段期间，使用经训练的编码器和解码器基于从当前对话框提取的上下文和其他信号来预测由用户组成的当前对话框的一个或多个接收者。使用评分函数对预测的接收者进行排名，并且可以向用户推荐排名最高的个人或实体。

Description

相关组建议

背景技术

如电子邮件、文档共享和社交网络的广泛的通信应用允许越来越多的人被连接。随着用户的联系人列表变得更大，确定用于接收消息或加入对话的最相关人员变得更加困难。现有的软件应用可以做出针对用于包括在用户创建的对话中的接收者的人员推荐。然而，这样的应用可能仅考虑基本信号，诸如用户输入的姓名、或者最频繁地传送消息的联系人的首字母等。

期望提供一种系统，其基于在先用户通信的内容和上下文来学习针对用于包括在消息或对话中的人员的用户偏好。例如，当编写与特定业务项目相关的电子邮件时，可以向用户提供之前已经与用户关于业务项目进行过通信的人员的推荐。类似地，当浏览社交网络上的帖子或更新时，可以向用户提供用于添加作为联系人的人员的推荐。

因此，期望用于利用在先用户通信来标识与其中包含的某些上下文信号最相关的人员并且利用这样的信号来生成人员推荐的技术。

发明内容

提供本发明内容以便以简化的形式介绍概念的选择，这些概念在下面的具体实施方式中被进一步描述。本发明内容并非旨在标识所要求保护的主题的关键特征或必要特征，也不旨在被用于限制所要求保护的主题的范围。

简而言之，本文中描述的主题的各个方面涉及用于基于用户创建的项目的上下文特征来生成人员推荐的技术。在某些方面，在先用户通信的记录被结构化成包含相关联的上下文特征的多个对话框。在训练阶段期间，使用对话框训练诸如去噪自动编码器模型的预测算法，以得到用于向一组上下文特征指派一组推荐参与者的最佳权重。在预测阶段期间，预测算法作用为针对当前对话框推荐一组参与者。可以使用评分函数标识排名最高的参与者。在另一方面，提供了用于基于系统生成的推荐的用户接受或拒绝而对预测算法反馈调整的技术。

从以下详细描述和附图中，其他优点可以变得显而易见。

附图说明

图1示出了说明本公开的某些方面的用于电子邮件客户端软件的示例性用户界面。

图2示出了根据本公开的电子邮件接收者推荐系统的示例性实施例。

图3示出了在上述的对话框结构化期间执行的操作。

图4示出了采用使用用户历史的机器学习算法的训练以及使用经训练的算法的推荐人员组的预测的方法的示例性实施例。

图5示出了用于图4的方法的训练阶段的示例性实施例。

图6示出了根据本公开的候选接收者预测方法的示例性实施例。

图7示出了用于排名和向用户建议接收者的块的示例性实施例。

图8示出了根据本公开的用于执行系统更新和反馈的方法的示例性实施例。

图9示出了根据本公开的方法的示例性实施例。

图10示出了根据本公开的装置的示例性实施例。

图11示出了根据本公开的装置的备选示例性实施例。

具体实施方式

本文中描述的技术的各个方面总体上涉及用于分析在先用户通信以得到用于推荐与当前通信项相关的参与者的算法的技术。

以下结合附图阐述的详细描述旨在作为“用作示例、实例或说明”的示例性手段的描述，并且不一定被解释为比其他示例性方面优选或有利。为了提供对本发明的示例性方面的透彻理解的目的，详细描述包括具体细节。对于本领域技术人员而言将显而易见的是，可以在没有这些具体细节的情况下实践本发明的示例性方面。在一些情况下，以框图形式示出了众所周知的结构和设备，以避免模糊本文中呈现的示例性方面的新颖性。注意，术语“对话框”在本文中也可以与术语“通信项”可互换地使用。

期望提供具有基于上下文来智能地预测要向用户推荐的合适人员的能力的电子邮件、文档共享、社交网络和其他通信软件。例如，当用户编写与特定任务或项目相关的电子邮件时，电子邮件软件可以智能地预测与这样的任务或项目最相关的人员，并且向用户推荐这些人员作为电子邮件接收者。备选地，当用户在与某内容相关的社交网络平台上发帖时，软件可以智能地预测与这样的内容相关的人员，并且向用户推荐这些人员以作为接收者来包括。本公开的技术有利地提供了一种用于基于用户通信历史和当前上下文来预测和推荐相关人员的人员推荐系统。

注意，本文中使用的术语“人员”并不意味着仅表示一个或多个个人，而是还可以被理解为是指系统可以推荐以包括在对话中的任何实体。因此，邮件列表、社交网络组织等也将被理解为落在可以由系统推荐的“人员”的范围内。

图1示出了说明本公开的某些方面的用于电子邮件客户端软件的示例性用户界面。在图1中，电子邮件消息100包括发送者字段110、接收者字段112、主题字段114、日期和时间字段116以及主体120。当用户编写电子邮件100时，电子邮件客户端软件(本文中也表示为“内容创建应用”的示例)可以使用如下文中进一步描述的某些上下文信号，以向用户推荐一个或多个接收者或“人员推荐”，例如用于包括在接收者字段112中。

注意，图1仅为了说明的目的而被示出，并不意味着将本公开的范围限制于电子邮件应用、或者任何特定类型的用户界面、电子邮件客户端。其他示例性实施例可以将本技术应用于例如用于会议邀请、文本消息、即时消息应用、用于共享帖子或推文的社交网络平台、其他共享应用等的人员推荐。

在示例性实施例中，用户编写可以与其他用户共享的文档。在这种情况下，本技术可以用于基于文档的上下文信号来标识和推荐这样的其他用户。在备选示例性实施例中，用户可以创建会议邀请以发送给其他用户。在这种情况下，可以使用本技术来标识和推荐用于接收邀请的其他用户。在又一备选示例性实施例中，用户可以在社交网络平台上共享帖子或推文，并且由此基于帖子的内容而被提供用于添加的附加人员的推荐。其他示例性实施例可以将本技术应用于例如用于文本消息、即时消息应用、视频共享应用、其他共享应用等的人员推荐。这样的备选示例性实施例被认为在本公开的范围内。

图2示出了根据本公开的用于电子邮件客户端软件的人员推荐系统200的示例性实施例。注意，图2仅为了说明的目的而被示出，并不意味着将本公开的范围限于任何特定类型的用户界面、电子邮件客户端、或者本技术到电子邮件上下文的应用。

在图2中，用户201通过内容创建应用210提供文本或其他输入201a(例如，“用户输入”)。在示例性实施例中，应用210可以对应于例如用于接收、编写、编辑、发送电子邮件等的在线或离线(本地存储的)电子邮件客户端软件应用。在备选示例性实施例中，应用210可以对应于用于接收用户输入201a以创建通信项的任何应用，例如用于创建本地或共享文档的文字处理软件、社交网络网站用户界面、在线会议设置界面、文本消息或其他即时消息传送软件、或者其他共享应用，例如，如上文中说明性地描述的。

在框220，到应用210的用户输入201a、以及先前通过应用210处理的任何通信项(例如，从其他人员接收的消息)被消息/文档历史块220累积地存储作为用户历史220a(本文中通常也表示为“多个通信项”)。在示例性实施例中，历史220a可以包括一个或多个数据文件，其包括由应用210或其他应用211(即，不同于应用210)累积地创建或处理的所有项目。

历史220a可以包括例如在用户与其他人员之间发送和接收的消息(诸如在社交网络上的电子邮件或消息)、文档(例如，具有或不具有发送者和/或接收者)、简档条目、聊天对话(例如，聊天历史)、日历项、会议请求、议程、社交消息传送应用上的帖子或更新、和/或与这样的项目相关联的元数据(例如，包括时间/日期指示符、位置指示符(如果可用)等)。历史220a可以本地存储在例如本地硬盘驱动器上、或者远程服务器上。

在图2中，应用210还将来自用户输入201a的当前项目参数230a提供给推荐引擎230。当前项目参数230a可以包括例如由用户201当前编写的通信项(例如，电子邮件项目、会议邀请、社交网络更新等)的内容。在示例性实施例中，参数230a还可以包括其他上下文信号和正在编写的项目的元数据，包括一天中的时间、当前用户位置等。在示例性实施例中，如下面参考图3进一步描述的，诸如填充“s”(源用户)字段、“c”(上下文)字段和“T”(接收者)字段所需要的信息可以从当前通信项的参数230a中提取。

推荐引擎230分析参数230a和用户历史220a以生成用于当前项目的人员推荐230b。特别地，人员推荐230b可以对应于用户可能希望作为当前项目的接收者来包括的一个或多个附加人员或其他实体。在所示的示例性实施例中，推荐引擎230包括历史分析引擎234，历史分析引擎234包括对话框构造块234.1和算法训练块234.2。块234.1将用户历史220a结构化成多个对话框，如下面参考图3进一步描述的。数据样本234.1a从结构化的对话框中被提取，以在块234.2处执行算法训练。块234.2生成一组经训练的算法参数234a，其被提供给块232，以基于参数230a来生成用于当前对话的人员推荐。

图3示出了在上文所描述的对话框结构化234.1期间执行的操作。注意，尽管本文中的一些讨论可以参考其中电子邮件构成通信项的示例性实施例来进行，但是应当理解，本技术可以容易地被应用于其他类型的通信项，例如会议邀请、即时消息、在社交网络上交换的消息、共享文档、社交网络上的帖子或更新等。这样的备选示例性实施例被认为在本公开的范围内。

在图3中，在相关人员预测/推荐算法的训练阶段期间可以使用较早在上文中所描述的用户历史220a。特别地，历史220a可以被组织为多个对话框310.1、310.i、...、310.N，其中N表示对话框的总数，并且i是从1到N的索引。每个对话框310.i可以对应于例如用于训练本文中的算法以执行人员预测的通信项。

应当理解，对话框通常可以包括可以从中提取用于算法训练的字段的任何项目，例如电子邮件、用户简档条目(例如，用户名、出生日期、年龄等)、非共享的本地或在线文档等。对话框还可以对应于除了电子邮件之外的其他类型的消息，例如文本消息、诸如社交网站上的在线帖子或馈送的条目等。

在示例性实施例中，一组对话框可以包含不同类型的通信项。例如，在图3中，对话框310.1可以对应于电子邮件消息，对话框310.2可以对应于简档条目，对话框310.i可以对应于会议邀请或社交网络(未示出)上的发帖等。这样的示例性实施例被认为在本公开的范围内。

对于每个对话框，提取一组相关参数。特别地，可以使用变量xi来象征性地表示每个对话框310.i的相关参数，其中针对任意i的xi在本文中也被表示为“向量”或“数据样本”。例如，x1对应于对话框1，xN对应于对话框N等。每个数据样本xi还可以由从对话框310.i提取的三个不同分量组成：si(或“源用户”)、ci(或“至少一个上下文信号”)和Ti(或“接收者组”或“接收者向量”)。

特别地，si或“源用户”集合表示要向其提供人员推荐的至少一个源用户。例如，图1中的对话框1对应于来自“John Smith”的电子邮件。在这种情况下，s1可以对应于也恰好是电子邮件消息的发送者的“John Smith”的表示。

ci表示对话框的上下文特征。例如，在对话框1中，c1可以对应于主题字段的表示、电子邮件的主体的内容、日期、时间、对话框1作为电子邮件的形式等。可以理解，ci的具体内容在本文中仅为了说明的目的而被描述，并不意味着将本公开的范围限制于可以从对话框中提取的任何特定字段或存在于对话框中的信息的任何特定表示。

在示例性实施例中，ci可以被表示为多维“N元(N-gram)”表示，其中ci对应于多维向量，并且ci的单个维度分别对应于N个字母的具体组合(例如，“N元”)。例如，在c1的“3元”表示(即，N＝3)中，对应于三个字母“mar”的向量c1的维度可以具有为2的值，其对应于“mar”在电子邮件100中的两次出现(即，一次在主题字段114中，一次在主体120中)。在备选示例性实施例中，ci的单个维度可以对应于单个单词或词根等。

在备选示例性实施例中，可以在ci中提供N元维度的附加或备选维度。例如，ci中的某些单个维度可以对应于对话框内的某些字段或位置的单独内容，例如主题字段114、主体120的第一句等。备选地或相结合地，单个维度可以对应于例如指定提取的话题的话题模型、或与从深层语义相似性模型(DSSM)得到的语义向量相对应的语义符号。在备选示例性实施例中，ci的某些维度可以对应于例如来自对话框的信息的显式文本表示。这样的备选示例性实施例被认为在本公开的范围内。

Ti或“目标参与者”或“训练接收者向量”可以指示对话框中的一个或多个参与者的组，排除已经存在于si中的那些。例如，在对话框1中，T1可以对应于由接收者“BobJones”和“Dave Lee”组成的组的表示。

在示例性实施例中，Ti的“接收者维度编码”表示可以被使用，其中Ti被编码为稀疏二进制向量，例如Ti＝[0,0,0,1,0,0,1...0,0]，并且其中Ti的每个维度对应于可能的接收者。例如，Ti中的非零(例如，“1”)条目将对应于第i对话框中涉及的那些接收者。根据接收者维度编码表示，Ti的维度的总数T因此可以对应于源用户的联系人列表中的联系人的总数。

因此，每个数据样本xi可以由相应的字段si、ci、Ti的级联组成，并且这样的级联在本文中可以表达为[si,ci,Ti]。例如，x1＝[s1,c1,T1]可以表达与对话框1或310.1相对应的数据样本包括字段s1、c1、T1的级联。

作为对话框的另一示例，对话框310.2对应于源用户“JohnSmith”的联系人列表中的“Bob Jones”的简档条目。因此，s2可以对应于“John Smith”，T2可以对应于“BobJones”，并且c2可以对应于简档中的参数的表示，如说明性地示出的。

在所有可用的对话框1至N、或310.1至310.N上聚合产生可以统一表示为x的一系列数据样本{x1,...,xi,...,xN}，其在本文中也表示为“聚合数据样本”，如框320所示。

在示例性实施例中，与用户历史220a相关联的聚合数据样本x可以被用于训练用于预测相关人员或实体的基于神经网络的算法。在示例性实施例中，算法可以采用排名去噪自动编码器技术。注意，本文中描述的技术仅用于说明性目的，并不意味着将本公开的范围限制为用于预测对话的相关人员的任何特定技术。在本公开的备选示例性实施例中，基于非神经网络的方法也可以用于本文中描述的目的。

图4示出了采用使用用户历史220a的机器学习算法的训练以及使用经训练的算法的推荐人员组的预测的方法的示例性实施例400。注意，图4仅为了说明的目的而示出，并不意味着将本公开的范围限制于所示的任何特定示例性实施例。注意，图4也可以被理解为示出包括执行所示功能的模块的装置。

在图4中，在框410(本文中也表示为“训练块”或“训练阶段”)，使用聚合数据样本x＝{x1,...,xi,...,...,xN}从历史220a训练机器学习算法，其中每个数据样本xi包括字段si、ci、Ti，如之前在以上所描述的。算法训练产生随后由预测算法使用的一组最佳算法参数410a。

在框420(本文中也表示为“预测块”或“预测阶段”)，给定当前对话参数230a，使用最佳参数410a生成人员推荐230b。当前对话参数230a可以包括与当前通信项x'相对应的字段s'、c'、T'。

图5示出了方法400的训练阶段的示例性实施例410.1。注意，方法410.1仅用于说明目的，并不意味着将本公开的范围限制于所示的任何特定类型的训练算法。

在图5中，在框510，选择聚合数据样本x中的初始数据样本xi，例如对应于用户历史220a中的单个对话框。注意，如以上所描述的，xi可以包括例如级联的字段[si,ci,Ti]。

在框520，破坏函数被应用于数据样本xi以生成相应的破坏向量i。破坏函数用于例如以随机或确定性的伪随机方式破坏存在于xi中的某些元素。例如，破坏函数可以随机地选择xi中的二进制元素，并且翻转所选择的二进制元素(例如，1到0或0到1)。

在示例性实施例中，破坏函数可以仅被应用于xi的Ti字段(例如，接收者向量)。例如10％-35％的破坏率可以与破坏函数相关联，其中破坏率可以被定义为被破坏的比特的百分比。注意，破坏率可以是取决于所使用的不同类型的数据样本而可调整的。

鉴于上文中的描述，破坏函数可以被理解为采取“典型”数据样本xi，诸如可以对应于用户历史220a中的对话框，并且以某种方式“破坏”接收者字段Ti，以便模拟“典型”接收者组中不完整条目或偏差的存在。这样的不完整条目或偏差可以例如在统计学上类似于在新的通信项的组成期间从用户201接收的当前对话参数230a，例如，由用户201针对新对话项目输入的接收者可以是不完整的或包括不正确的接收者(例如，对应于“破坏的”Ti字段)。应当理解，训练对象500然后配置预测算法(例如，下面参考图6进一步描述的)以基于当前通信项的参数(例如，230a)来最佳地建议正确的接收者。

在框530，在生成破坏的数据样本i之后，将编码器f(·)应用于

以生成编码向量

在示例性实施例中，编码器f(·)可以被实现为，例如跟随有激活函数的加权求和矩阵。求和函数可以包括例如仿射变换或者任何其他非线性或线性函数，并且激活函数可以包括例如双曲正切、反曲等。

在框540，可以使用解码器g(·)来解码向量hi，以生成输出实值向量yi＝g(hi)，其中yi在本文中也被表示为“估计相关组”。在示例性实施例中，解码器g(·)可以被实现为，例如跟随有激活函数的加权求和矩阵。

应当理解，向量yi通常可以被设计为仅包含表示xi中的目标参与者Ti的估计的元素。例如，在示例性实施例中，yi不需要包含si和ci字段的估计，因为这些字段不需要在框520处被破坏函数破坏。

在框550，在本文中也表示为“损失函数计算块”，使用也被表示为重构误差函数l(yi,Ti)的损失函数将yi和(预先破坏的)字段Ti彼此相比较。特别地，l(yi,Ti)可以量化输出向量yi与原始未破坏目标参与者Ti之间的差异。应当理解，更新和/或调整编码器f(·)和解码器g(·)的权重的目的可以是要在适当广泛的范围的数据样本xi上最小化或以其他方式减小损失函数l(yi,Ti)的幅度。

在示例性实施例中，l(yi,Ti)可以对应于平方重构误差函数(下文中为“平方损失函数”)(等式1)：l(yi，Ti)＝∑(yi-Ti)²其中应当理解，要在yi、Ti的所有维度上执行求和。

在备选示例性实施例中，l(yi,Ti)可以对应于利用负对数似然softmax函数的基于排名的重构损失函数(下文中为“基于排名的函数”)(等式2)：

其中λ是softmax函数的平滑度项，

对于每个样本Ti中的参与者的数目归一化，yi_t指示yi的第t维度，t∈Ti指示Ti中的非零元素(例如，根据Ti的接收者维度编码表示)，

指示Ti中的零元素。

应当理解，平方误差函数可以有效地捕获逐点损失，而softmax似然函数可以有效地捕获成对损失。特别地，逐点函数可以被用于估计每个单个人员的绝对得分，而成对损失可以有效地捕获人员列表的相关得分。例如，在其中在给定对话框的情况下要推荐前N个相关人员的场景下，成对函数可以优选地以较高的灵敏度来区分首选候选者。

注意，基于排名的函数通常可以对应于softmax函数的对数似然度的求和的负值，例如在Ti中存在的所有个体(例如，非零条目)上求和。应当理解，使用基于对数似然的函数可以有利地简化计算等式2所需要的计算资源，因为对数被求和，否则项目将需要被取幂并且相乘。

在示例性实施例中，为了进一步简化基于排名的函数的计算，分母中的求和可以在Ti的零元素的随机子集Zi上而不是在所有零元素上被执行(等式3)：

在示例性实施例中，可以假设零元素对softmax分母的贡献可忽略。

在备选示例性实施例中，l(yi,Ti)通常可以利用强化学习领域中已知的任何函数，并且这样的备选示例性实施例被认为在本公开的范围内。应当理解，在每次迭代期间更新编码器/解码器f(·)和g(·)的方式将取决于所选择的重构误差函数。

在示例性实施例中，为了根据上文中在等式1中所示的平方损失函数来更新权重，可以使用以下等式(等式4)：

α_i＝(yi-Ti)·(1-yi)·(1+yi)； (等式4d)

β_i＝(W_Hα_i)·(1-h_i)·(1+h_i)； (等式4e)

其中

表示Ti的破坏(转置)版本，并且其中变量

α_i，β_i在示例性实施例中如下相关(等式5)：

在备选示例性实施例中，为了根据基于排名的函数(例如，等式2)来更新权重，可以使用以下等式(等式6)：

α_i＝δ·(1-yi)·(1+yi)； (等式6d)

δ_i＝(δ_ik)_k∈T； (等式6e)

其中可以再次使用等式5的示例性实施例。

一旦权重和偏置项被更新，在框560，检查是否已经使用x中的所有数据样本xi执行了训练。如果不是，则方法500进行到框565，于是使用下一可用数据样本xi再次执行框520-550处的训练，例如，在历史中的所有多个通信项上重复破坏和更新。如果是，则方法500进行到框570。

以参考框520-550描述的方式，基于使用x中的连续数据样本累积训练存在于f(·)和g(·)中的权重和其他偏差项，生成最佳编码函数f*(·)和最佳解码函数g*(·)。使用这些最佳函数，随后可以执行预测以在给定任意输入向量x'的情况下生成预测人员组y'，如下文中进一步描述的。

图6示出了根据本公开的候选接收者预测方法600的示例性实施例。方法600在本文中也可以表示为“预测阶段”。

在图6中，在框610，接收用于当前对话框的系统提取的信号x'。特别地，x'可以包括s'、c'和T'字段的级联，如上文中参考图3所述，但是针对当前通信项被提取。注意，T'(在本文中也表示为“预先指定的接收者组”)可以对应于已经在x'中指定的人员组，例如已经由用户指定的组成当前对话框的接收者的部分列表。基于T'的知识，方法600的目的将是预测尚未存在于T'中的当前对话框的任何其他可能的接收者。

在框620，使用编码函数f*(·)来编码x'，以生成经编码的向量h'。注意，编码通常可以类似于参考上文中参考用户历史的数据样本xi描述的框530描述地来进行。

在框630，将h'传递给解码函数g*(·)以生成y'＝g*(h')。注意，y'包含与当前对话框的预测接收者相对应的T'pred字段，其在本文中也表示为“相关组”。

在框640，将T'(已经在x'中指定的人员组)与y'、特别是y'的T'pred分量相比较，以向用户建议接收者。基于该比较，可以存在尚未存在于T'中的一组附加人员T'new，其中T'new也被描述为T'pred-(T'pred∩T')。为了确定要将T'new中的哪些附加人员推荐为一个或多个首选推荐，可以进一步执行下文中参考图7描述的排名。

图7示出了用于排名和向用户建议接收者的框640的示例性实施例640.1。注意，实施例640.1仅为了说明的目的而被示出，并不意味着限制本公开的范围。

在图7中，在框710，T'new被示出为包括单个人员或实体tnew(1)、tnew(2)等。这样的单个人员或实体可以对应于相关组的成员，而不是在预先指定的接收者组中的成员。注意，在T'new只包括一个人员的情况下，不需要执行排名。

在框720，将评分函数F[x’,tnew(j)]应用于每个人员tnew(j)，其中j对T'new中的单个人员或实体编索引。在示例性实施例中，评分函数F[·]可以对应于以下(等式7)：

在框730，根据它们的得分F[·]来对个体进行排名。

在框740，可以向用户推荐与排在最高的得分相关联的单个人员或实体。

在框750，确定用户是否接受在框740处提供的推荐。注意，用户对推荐的接受自动生成新的x'，由此新的x'包括合并有接受的tnew的经更新的T'字段。如果是(用户接受推荐)，则方法640.1进行到框760。如果否，则方法640.1进行到框755。

在框755，可以向用户推荐下一最高排名的tnew。在框755之后，在框750，然后可以再次确定用户是否接受推荐。

在框760，可以将新的x'输入到预测阶段300的另一迭代以生成新的人员推荐。

在示例性实施例中，取决于用户接受还是拒绝接收者推荐，这样的信息可以被用于重新训练上文中例如参考图4-5描述的去噪自动编码算法。特别地，接受或拒绝的(或以其他方式由用户指定的)接收者推荐可以被用于为新数据样本x生成新的接收者字段T，并且如上文中参考图4的框410和图5的训练500所述的训练可以被重复以得到用于编码函数和解码函数的新权重。这样的备选示例性实施例被认为在本公开的范围内。

图8示出了根据本公开的用于执行系统更新和反馈的方法的示例性实施例800。

在图8中，在框810，系统200向用户201呈现人员推荐230b。

在框820，确定用户201是否接受推荐230b。如果是，则方法800进行到框830。如果否，则方法800进行到框840。

在框830，由于推荐230b被用户201接受，所以用户历史220a被更新，并且用于下一人员推荐的新参数230a可以被接受。

备选地，在框840，由于推荐230b不被用户201接受，所以方法800将从应用210接收关于正确人员(P*)的信息以包括用于当前内容参数230a，例如，如用户直接指示的。例如，在某些情况下，系统200可以推荐用于正由用户201编写的电子邮件(230a)的候选接收者(230b)，并且用户201可以拒绝该候选接收者。用户201可以替代地选择备选接收者(P*)作为正确接收者。

在框860，基于由用户201指示的正确接收者(P*)的指示，系统200可以使用由P*和当前参数230a定义的数据集来执行系统参数的实时更新或训练。在示例性实施例中，这样的更新或训练可以对应于通过定义新的数据样本x*来训练编码f*(·)和解码函数g*(·)，其中x*的T分量表示在框850处由用户201指示的正确接收者P*的指示。

图9示出了根据本公开的方法的示例性实施例900。注意，图9仅为了说明的目的而被示出，并不意味着限制本公开的范围。

在框910中，在框910，使用编码函数来编码向量，该向量包括预先指定的接收者组、源用户、和从当前通信项得到的至少一个上下文信号。

在框920，使用解码函数来解码经编码的向量以生成相关组。

在框930，生成推荐，该推荐包括不在预先指定的接收者组中的相关组的成员。

图10示出了根据本公开的装置的示例性实施例1000。注意，图9仅为了说明的目的而被示出，并不意味着限制本公开的范围。

在图10中，装置1000包括训练块1010，其被配置为使用多个通信项来训练编码函数和解码函数。装置1000还包括预测块1020，其被配置为使用编码函数来编码包含预先指定的接收者组、源用户、和从当前通信项得到的至少一个上下文信号的向量以生成接收者推荐。预测块1020还被配置为使用解码函数解码经编码的向量以生成相关组，来生成接收者，其中接收者推荐包括不在预先指定的接收者组中的相关组的成员。

图11示出了根据本公开的装置的备选示例性实施例1100。注意，图11仅为了说明的目的而被示出，并不意味着限制本公开的范围。

在图11中，装置1100包括用于编码包括预先指定的接收者组、源用户、和从通信项得到的至少一个上下文信号的向量的装置1110、用于解码经编码的向量以生成相关组的装置1120、以及用于生成包括不在预先指定的接收者组中的相关组的成员的推荐的装置1130。

在本说明书和权利要求书中，应当理解，当元素被称为“连接到”或“耦合到”另一元素时，其可以直接连接或耦合到另一元素，或者可以存在中介元素。相反，当元素被称为“直接连接到”或“直接耦合到”另一元素时，不存在中介元素。此外，当元素被称为“电耦合”到另一元素时，其表示在这样的元素之间存在低电阻路径，而当元素被简单地称为“耦合”到另一元素时，这样的元素之间可以存在或者不存在低电阻路径。

本文中描述的功能可以至少部分地由一个或多个硬件和/或软件逻辑部件来执行。例如而非限制，可以使用的说明性类型的硬件逻辑部件包括现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑器件(CPLD)等。

虽然本发明易于进行各种修改和备选构造，但是其某些说明的实施例在附图中被示出，并且已经在上面被详细描述。然而，应当理解，不意图将本发明限制于所公开的具体形式，而是相反，本发明将覆盖落入本发明的精神和范围内的所有修改、备选构造和等同方案。

Claims

1.一种用于由计算机处理器执行的方法，所述计算机处理器耦合至存储器，所述方法包括：

使用编码函数来编码向量，所述向量包括预先指定的接收者组、源用户、和从当前通信项得到的至少一个上下文信号；

使用解码函数来解码经编码的所述向量以生成相关组；

生成推荐，所述推荐包括不在所述预先指定的接收者组中的、所述相关组的成员；以及

使用向多个历史通信项应用的去噪自动编码器神经网络模型来训练所述编码函数和所述解码函数，所述多个历史通信项中的每一个与数据样本相关联，所述数据样本包括接收者组、源用户、以及来自所述当前通信项的至少一个上下文信号；

所述训练包括针对每个数据样本：

向所述数据样本的所述接收者组应用破坏函数，以破坏所述数据样本的所述接收者组并生成破坏向量；

编码所述破坏向量以生成经编码的训练向量，以提取所述破坏向量的特征；

解码所述经编码的训练向量，以生成与所述接收者组的估计相对应的目标接收者组；

基于所述目标接收者组和所述接收者组之间的差异来计算用于所述数据样本的损失函数；以及

使用所计算的用于所述数据样本的所述损失函数来更新所述编码函数和所述解码函数的参数。

2.根据权利要求1所述的方法，所述训练包括：

更新所述编码函数中的一个或多个权重以使包括对数似然计算的基于排名的重构损失函数最小化。

3.根据权利要求1所述的方法，所述训练还包括：

更新所述解码函数中的一个或多个权重以使包括对数似然计算的基于排名的重构损失函数最小化。

4.根据权利要求1所述的方法，所述训练包括：

提取与所述多个通信项中的每个通信项相对应的接收者向量和上下文向量；以及

破坏所述接收者向量的至少一个元素。

5.根据权利要求1所述的方法，其中所述预先指定的接收者组使用稀疏二进制向量来表示，并且其中所述至少一个上下文信号使用多维向量来表示，所述多维向量包括对应于N元组的出现的多个维度。

6.根据权利要求1所述的方法，其中所述至少一个上下文信号使用多维向量来表示，所述多维向量包括对应于语义符号或提取的话题的多个维度。

7.根据权利要求1所述的方法，进一步包括使用评分函数向所述相关组的成员分配得分，生成所述推荐包括选择具有最高得分的所述相关组的成员。

8.根据权利要求1所述的方法，所述推荐包括将接收者添加到电子邮件的推荐。

9.一种包括处理器和存储器的装置，所述存储器耦合至所述处理器，所述装置包括：

训练块，所述训练块被配置为使用多个历史通信项来训练编码函数和解码函数；以及

预测块，所述预测块被配置为使用所述编码函数编码包括预先指定的接收者组、源用户、和从当前通信项得到的至少一个上下文信号的向量，并且还使用所述解码函数解码经编码的所述向量以生成相关组，来生成接收者推荐，其中所述接收者推荐包括不在所述预先指定的接收者组中的、所述相关组的成员；

所述训练块被配置为使用向所述多个历史通信项应用的去噪自动编码器神经网络模型来训练所述编码函数和所述解码函数，所述多个历史通信项中的每一个与数据样本相关联，所述数据样本包括接收者组、源用户、以及来自所述当前通信项的至少一个上下文信号，所述训练块被配置为针对每个数据样本：

使用所述编码函数来编码所述破坏向量以生成经编码的训练向量，以提取所述破坏向量的特征；

使用所述解码函数来解码所述经编码的训练向量，以生成与所述接收者组的估计相对应的目标接收者组；

10.根据权利要求9所述的装置，其中所述向量包括作为稀疏二进制向量的所述预先指定的接收者组的表示以及作为多维N元向量的所述至少一个上下文信号的表示。

11.根据权利要求9所述的装置，其中所述向量包括所述至少一个上下文信号作为多维语义符号向量的表示。

12.根据权利要求9所述的装置，还包括推荐块，所述推荐块被配置为：

应用评分函数来为不在所述预先指定的接收者组中的所述相关组的每个成员生成分数；

将所述接收者推荐生成为具有最高得分的经评分的成员。

13.根据权利要求12所述的装置，所述推荐块还被配置为接收用户对所述接收者推荐的接受或拒绝，所述预测块还被配置为基于所述接受或拒绝、所述源用户和所述至少一个上下文信号，使用所述编码函数以编码包括第二预先指定的接收者组的第二向量来生成所述接收者推荐。

14.根据权利要求9所述的装置，所述损失函数包括平方损失函数。

15.根据权利要求9所述的装置，所述损失函数包括基于排名的函数。

16.一种包括计算机硬件的装置，所述计算机硬件可配置以执行：

用于使用编码函数来编码向量的部件，所述向量包括预先指定的接收者组、源用户、和从通信项得到的至少一个上下文信号；

用于使用解码函数来解码经编码的所述向量以生成相关组的部件；

用于生成推荐的部件，所述推荐包括不在所述预先指定的接收者组中的、所述相关组的成员；以及

用于使用向多个历史通信项应用的去噪自动编码器神经网络模型来训练所述编码函数和所述解码函数的部件，所述多个历史通信项中的每一个与数据样本相关联，所述数据样本包括接收者组、源用户、以及来自所述当前通信项的至少一个上下文信号；

用于训练的所述部件包括：

用于针对每个数据样本向所述数据样本的所述接收者组应用破坏函数以破坏所述数据样本的所述接收者组并生成破坏向量的部件；

用于编码所述破坏向量以生成经编码的训练向量来提取所述破坏向量的特征的部件；

用于解码所述经编码的训练向量以生成与所述接收者组的估计相对应的目标接收者组的部件；

用于基于所述目标接收者组和所述接收者组之间的差异来计算用于所述数据样本的损失函数的部件；以及

用于使用所计算的用于所述数据样本的所述损失函数来更新所述编码函数和所述解码函数的参数的部件。