CN110659678A

CN110659678A - 一种用户行为分类方法、系统及存储介质

Info

Publication number: CN110659678A
Application number: CN201910857638.XA
Authority: CN
Inventors: 许可; 赵沛霖; 黄俊洲
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-09-09
Filing date: 2019-09-09
Publication date: 2020-01-07
Anticipated expiration: 2039-09-09
Also published as: CN110659678B

Abstract

本申请公开了一种用户行为分类方法、系统及存储介质，所述方法包括：服务器训练用于进行用户行为分类的行为分类模型；服务器向第二终端发送行为分类模型；第二终端将目标对象的行为数据输入行为分类模型，对目标对象的行为进行预测；其中，服务器训练用于进行用户行为分类的行为分类模型包括：服务器构建预设机器学习模型，并将预设机器学习模型确定为当前机器学习模型；服务器基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度，并对当前机器学习模型进行更新；通过迭代训练得到符合预设条件的行为分类模型。采用本申请的技术方案，实现了对用户的行为进行快速预测。

Description

一种用户行为分类方法、系统及存储介质

技术领域

本申请涉及互联网通信技术领域，尤其涉及一种用户行为分类方法、系统及存储介质。

背景技术

利用分布式数据并行化计算加速模型训练，是近些年包括互联网企业，国内外高校在内的多家机构的研究重点。在大数据场景下，将整个数据集分成小块，分别存储到集群中的计算节点上进行计算，再通过一个参数服务器将各节点的计算结果进行同步，可以在一定程度上解决训练时长过长的问题。上述训练方式的时间消耗主要分为：各计算节点的并行计算消耗和节点与参数服务器之间的通信消耗。增加计算节点可以减少整体的计算时间消耗，但在网络延迟较高的集群中，计算节点与参数服务器之间的通信时间消耗则会造成用户行为分类的延迟。

因此，有必要提供一种用户行为分类方法、系统及存储介质，对用户的行为进行快速预测。

发明内容

本申请提供了一种用户行为分类方法、系统及存储介质，可以对用户的行为进行快速预测。

一方面，本申请提供了一种用户行为分类方法，所述方法包括：

服务器训练用于进行用户行为分类的行为分类模型；

所述服务器向第二终端发送所述行为分类模型；

所述第二终端将目标对象的行为数据输入所述行为分类模型，对所述目标对象的行为进行分类；

其中，所述服务器训练用于进行用户行为分类的行为分类模型包括：

所述服务器构建预设机器学习模型，并将所述预设机器学习模型确定为当前机器学习模型；

所述服务器基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；

当所述至少两个第一终端的损失平均值大于预设阈值时，所述服务器基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：所述服务器向至少两个第一终端发送所述当前机器学习模型；

当所述至少两个第一终端的损失平均值小于或等于所述预设阈值时，所述服务器将所述当前机器学习模型确定为所述行为分类模型。

另一方面提供了一种用户行为分类方法，所述方法包括：

训练用于进行用户行为分类的行为分类模型；

向第二终端发送所述行为分类模型，以使所述第二终端将目标对象的行为数据输入所述行为分类模型，对所述目标对象的行为进行分类；

其中，所述训练用于进行用户行为分类的行为分类模型包括：

构建预设机器学习模型，并将所述预设机器学习模型确定为当前机器学习模型；

基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；

当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：所述向至少两个第一终端发送所述当前机器学习模型；

当所述至少两个第一终端的损失平均值小于或等于所述预设阈值时，将所述当前机器学习模型确定为所述行为分类模型。

另一方面提供了一种用户行为分类方法，所述方法包括：

接收服务器发送的当前机器学习模型；所述当前机器学习模型为所述服务器构建的预设机器学习模型；

将本地终端中标注有行为类别标签的样本对象的训练数据输入所述当前机器学习模型，确定所述训练数据的损失值和损失函数；

基于所述训练数据的损失函数，确定量化梯度；

向所述服务器发送所述本地终端的量化梯度和所述训练数据的损失值；以使所述服务器基于每个第一终端中训练数据的损失值，确定至少两个第一终端的损失平均值；以及当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；以及当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；以及当所述至少两个第一终端的损失平均值小于或等于所述预设阈值时，将所述当前机器学习模型确定为所述行为分类模型。

另一方面提供了一种用户行为分类装置，所述装置包括：

训练模块，用于训练用于进行用户行为分类的行为分类模型；

行为分类模型发送模块，用于向第二终端发送所述行为分类模型，以使所述第二终端将目标对象的行为数据输入所述行为分类模型，对所述目标对象的行为进行分类；

其中，所述训练模块包括：

预设机器学习模型构建子模块，用于构建预设机器学习模型，并将所述预设机器学习模型确定为当前机器学习模型；

损失平均值与量化梯度确定模块，用于基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；

模型更新子模块，用于当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；

行为分类模型确定子模块，用于当所述至少两个第一终端的损失平均值小于或等于所述预设阈值时，将所述当前机器学习模型确定为所述行为分类模型。

另一方面提供了一种用户行为分类系统，所述系统包括服务器、第一终端和第二终端，

所述服务器，用于训练用于进行用户行为分类的行为分类模型，以及向所述第二终端发送所述行为分类模型；

其中，所述用于训练用于进行用户行为分类的行为分类模型包括：

用于构建预设机器学习模型，并将所述预设机器学习模型确定为当前机器学习模型；以及基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；以及当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；以及当所述至少两个第一终端的损失平均值小于或等于所述预设阈值时，将所述当前机器学习模型确定为所述行为分类模型；

所述第二终端，用于将目标对象的行为数据输入所述行为分类模型，对所述目标对象的行为进行分类。

另一方面提供了一种用户行为分类服务器，所述服务器包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上所述的用户行为分类方法。

另一方面提供了一种用户行为分类终端，所述终端包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上所述的用户行为分类方法。

另一方面提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的用户行为分类方法。

本申请提供的一种用户行为分类方法、系统及存储介质，具有如下技术效果：

本申请在进行分布式训练过程中，每个第一终端基于服务器发送的当前机器学习模型，确定本地终端训练数据的损失函数；然后进一步确定量化梯度后发送至所述服务器；通过迭代训练确定满足预设条件的行为分类模型；在模型的训练过程中，通过对梯度进行量化处理，减少了第一终端与服务器之间的通信时间，从而提高了行为分类模型的训练速度；并采用快速训练得到的行为分类模型实现了对用户的行为进行快速预测。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1是本申请实施例提供的一种人工智能系统的示意图；

图2是本申请实施例提供的一种用户行为分类方法的流程示意图；

图3是本申请实施例提供的一种服务器确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度的方法的流程示意图；

图4是本申请实施例提供的每个第一终端基于所述训练数据的损失函数，确定量化梯度的方法的流程示意图；

图5是本申请实施例提供的一种第二终端基于所述目标对象的行为分类结果，判断是否向所述目标对象发送推荐信息方法的流程示意图；

图6是本申请实施例提供的另一种用户行为分类方法的流程示意图；

图7是本申请实施例提供的一种服务器确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度的方法的流程示意图；

图8是本申请实施例提供的另一种用户行为分类方法的流程示意图；

图9是本申请实施例提供的一种用户行为分类装置的结构示意图；

图10是本申请实施例提供的一种损失平均值及量化梯度确定子模块的结构示意图；

图11是本申请实施例提供的另一种用户行为分类装置的结构示意图；

图12是本申请实施例提供的一种区块链系统的结构示意图；

图13是本申请实施例提供的一种区块结构的示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

其中，机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。本申请涉及一种用户行为分类方法，通过构建行为分类模型对用户的行为进行预测。

请参阅图1，图1是本申请实施例提供的一种人工智能系统的示意图，如图1所示，该系统可以至少包括第一终端01、第二终端02和服务器03。

具体的，所述第一终端01可以包括智能手机、平板电脑、笔记本电脑、数字助理、智能可穿戴设备、车载终端等类型的实体设备，也可以包括运行于实体设备中的软体，所述第一终端01可以用于训练行为分类模型。

具体的，所述第二终端02可以包括智能手机、平板电脑、笔记本电脑、数字助理、智能可穿戴设备、车载终端等类型的实体设备，也可以包括运行于实体设备中的软体，例如所述第二终端02可以用于向所述服务器03发送用户行为数据以及用户行为分类请求，在线查询用户行为分类结果。

具体的，所述服务器03可以包括一个独立运行的服务器，或者分布式服务器，或者由多个服务器组成的服务器集群。所述服务器03可以包括有网络通信单元、处理器和存储器等等。所述服务器03可以为所述第一终端01和所述第二终端02提供后台服务，并用于训练行为分类模型。所述服务器03与所述第一终端01可以用于进行分布式数据并行化计算。

以下介绍本申请基于上述人工智能系统的用户行为分类方法，图2是本申请实施例提供的一种用户行为分类方法的流程示意图，本说明书提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的系统或服务器产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图2所示，所述方法可以包括：

S201：服务器训练用于进行用户行为分类的行为分类模型。

在本说明书实施例中，可以采用分布式数据并行化计算方法训练所述行为分类模型。

在本说明书实施例中，所述服务器训练用于进行用户行为分类的行为分类模型可以包括：

S2011：所述服务器构建预设机器学习模型，并将所述预设机器学习模型确定为当前机器学习模型。

S2013：所述服务器基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；

在本说明书实施例中，如图3所示，所述服务器基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度可以包括：

S20131：所述服务器向所述至少两个第一终端发送所述当前机器学习模型；

S20133：每个第一终端将所述每个第一终端中标注有行为类别标签的样本对象的训练数据输入所述当前机器学习模型，确定所述训练数据的损失值和损失函数；

S20135：所述每个第一终端基于所述训练数据的损失函数，确定量化梯度；

S20137：所述每个第一终端向所述服务器发送所述每个第一终端的量化梯度和所述训练数据的损失值；

S20139：所述服务器基于所述每个第一终端中训练数据的损失值，确定所述至少两个第一终端的损失平均值。

相应的，所述当所述至少两个第一终端的损失平均值大于预设阈值时，所述服务器基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度包括：

当所述至少两个第一终端的损失平均值大于预设阈值时，所述服务器基于所述每个第一终端对应的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：向至少两个第一终端发送所述当前机器学习模型。

在本说明书实施例中，所述服务器向至少两个第一终端发送预设机器学习模型的步骤之前，所述方法还可以包括：

所述服务器将用户行为数据集分成至少两个子数据集，所述子数据集的数量与所述第一终端的数量相同；

所述服务器向每个第一终端发送一个子数据集。

在本说明书实施例中，所述服务器基于区块链系统存储所述用户行为数据集，所述区块链系统包括多个节点，多个节点之间形成点对点网络。

参见图12，图12是本申请实施例提供的区块链系统的一个可选的结构示意图，多个节点之间形成组成的点对点(P2P，Peer To Peer)网络，P2P协议是一个运行在传输控制协议(TCP，Transmission Control Protocol)协议之上的应用层协议。在区块链系统中，任何机器如服务器、终端都可以加入而成为节点，节点包括硬件层、中间层、操作系统层和应用层。

参见图12示出的区块链系统中各节点的功能，涉及的功能包括：

1)路由，节点具有的基本功能，用于支持节点之间的通信。

节点除具有路由功能外，还可以具有以下功能：

2)应用，用于部署在区块链中，根据实际业务需求而实现特定业务，记录实现功能相关的数据形成记录数据，在记录数据中携带数字签名以表示任务数据的来源，将记录数据发送到区块链系统中的其他节点，供其他节点在验证记录数据来源以及完整性成功时，将记录数据添加到临时区块中。

3)区块链，包括一系列按照产生的先后时间顺序相互接续的区块(Block)，新区块一旦加入到区块链中就不会再被移除，区块中记录了区块链系统中节点提交的记录数据。

参见图13，图13是本申请实施例提供的区块结构(Block Structure)一个可选的示意图，每个区块中包括本区块存储交易记录的哈希值(本区块的哈希值)、以及前一区块的哈希值，各区块通过哈希值连接形成区块链。另外，区块中还可以包括有区块生成时的时间戳等信息。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了相关的信息，用于验证其信息的有效性(防伪)和生成下一个区块。

在一个具体实施例中，所述服务器将用户行为数据集分成至少两个子数据集可以包括：

所述服务器将所述用户行为数据集平均分成至少两个子数据集，所述每个子数据集中的样本对象的数量相同。

在本说明书实施例中，所述每个第一终端将所述每个第一终端中标注有行为类别标签的样本对象的训练数据输入所述预设机器学习模型，确定所述训练数据的损失值和损失函数的步骤之前，所述方法还可以包括：

所述每个第一终端对一个子数据集中样本对象的训练数据进行行为类别标注。

所述每个第一终端对一个子数据集中预设数量个样本对象的训练数据进行行为类别标注。

在一个具体的实施例中，所述每个第一终端可以在子数据集中随机抽取预设数量个样本对象的训练数据进行行为类别标注，所述预设数量可以根据实际情况进行设置。

在本说明书实施例中，所述行为类别包括有触发行为和无触发行为，所述行为类别标签包括有触发行为标签和无触发行为标签。

在一个具体的实施例中，例如在一个广告推荐的应用场景中，向用户所在终端的显示界面发送了一个广告链接；如果用户点击了广告链接，则确定用户的行为类别为有触发行为；如果用户没有点击广告链接，则确定用户的行为类别为无触发行为。

在本说明书实施例中，所述每个第一终端将所述每个第一终端中标注有行为类别标签的样本对象的训练数据输入所述当前机器学习模型，确定所述训练数据的损失值和损失函数可以包括：

所述每个第一终端将所述每个第一终端中标注有行为类别标签的样本对象的训练数据输入所述当前机器学习模型，得到输出结果；

所述每个第一终端基于所述样本对象的训练数据的输出结果与标注的行为类别标签，确定所述训练数据的损失值；

所述每个第一终端基于所述训练数据的损失值，确定所述训练数据的损失函数。

在本说明书实施例中，如图4所示，所述每个第一终端基于所述训练数据的损失函数，确定量化梯度可以包括：

S201351：所述每个第一终端对所述训练数据的损失函数求导，得到所述损失函数的梯度；

S201353：所述每个第一终端基于梯度量化函数对所述损失函数的梯度进行量化处理，得到量化梯度。

在本说明书实施例中，所述梯度量化函数为量化随机梯度递减函数或三值量化函数。

在本说明书实施例中，所述每个第一终端基于梯度量化函数对所述损失函数的梯度进行量化处理，得到量化梯度的步骤之前，所述方法还可以包括：

所述每个第一终端基于放缩标量与门限值，构建门限量化函数；

所述每个第一终端将所述门限量化函数作为所述梯度量化函数。

在本说明书实施例中，所述每个第一终端基于放缩标量与门限值，构建门限量化函数的步骤之前，所述方法还可以包括：

所述每个第一终端基于预设目标函数，确定目标放缩标量和目标门限值；

相应的，所述每个第一终端基于放缩标量与门限值，构建门限量化函数可以包括：

所述每个第一终端基于所述目标放缩标量与所述目标门限值，构建门限量化函数。

在一些实施例中，所述目标放缩标量可以为优选的放缩标量，所述目标门限值可以为优选的门限值，通过优选的放缩标量和优选的门限值构建的梯度量化函数，量化误差小。

在本说明书实施例中，所述服务器基于所述每个第一终端中训练数据的损失值，确定所述至少两个第一终端的损失平均值可以包括：

所述服务器基于所述每个第一终端中训练数据的损失值，计算所述至少两个第一终端的损失值之和；

所述服务器将所述损失值之和与所述第一终端的比值确定为所述损失平均值。

S2015：当所述至少两个第一终端的损失平均值大于预设阈值时，所述服务器基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：所述服务器向至少两个第一终端发送所述当前机器学习模型；

在本说明书实施例中，所述服务器基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型可以包括：

所述服务器基于所述每个第一终端的量化梯度，计算所述至少两个第一终端的同步量化梯度；

所述服务器基于所述至少两个第一终端的同步量化梯度，构建自适应学习率矩阵；

所述服务器基于所述自适应学习率矩阵，对所述当前机器学习模型进行更新以得到更新后机器学习模型。

在本说明书实施例中，所述服务器基于所述自适应学习率矩阵，对所述当前机器学习模型进行更新以得到更新后机器学习模型可以包括：

所述服务器基于所述自适应学习率矩阵，构建量化自适应复合镜像下降函数；

所述服务器基于所述量化自适应复合镜像下降函数，对所述当前机器学习模型进行更新以得到更新后机器学习模型。

所述服务器基于所述自适应学习率矩阵，构建量化正则对偶平均函数；

所述服务器基于所述量化正则对偶平均函数，对所述当前机器学习模型进行更新以得到更新后机器学习模型。

S2017：当所述至少两个第一终端的损失平均值小于或等于所述预设阈值时，所述服务器将所述当前机器学习模型确定为所述行为分类模型。

在本说明书实施例中，所述第一终端与所述第二终端可以为同一终端，也可以为不同的终端。

在本说明书实施例中，训练得到的行为分类模型是稀疏的模型，所以在使用时计算量变小，可以实现使用模型时的加速。训练模型加速的意义在于，比如基于用户的喜好进行推送，在用户量和商品量都很大的情况下，训练的数据量是非常大的，也是非常耗时的。用户选择商品偏好却是有时限的，所以需要在很短的时间内，不断训练新的模型来适应需求。如果训练模型需要1个月，但是模型使用的有效期只有1周，那么训练得到的模型已经失去了它的时效性。

S203：所述服务器向第二终端发送所述行为分类模型。

在本说明书实施例中，所述服务器向第二终端发送所述行为分类模型的步骤之前，所述方法还可以包括：

所述第二终端向所述服务器发送所述行为分类模型获取请求。

相应的，所述服务器向第二终端发送所述行为分类模型包括：

所述服务器基于所述行为分类模型获取请求，向第二终端发送所述行为分类模型。

S205：所述第二终端将目标对象的行为数据输入所述行为分类模型，对所述目标对象的行为进行分类。

在本说明书实施例中，所述第二终端将目标对象的行为数据输入所述行为分类模型，对所述目标对象的行为进行分类可以包括：

所述第二终端将目标对象的行为数据输入所述行为分类模型，得到所述目标对象的行为分类结果；

所述第二终端基于所述目标对象的行为分类结果，对所述目标对象的行为进行分类。

在一些实施例中，所述行为分类结果包括有触发行为结果和无触发行为结果。

在一些实施例中，所述方法还可以包括：

S207：所述第二终端基于所述目标对象的行为分类结果，判断是否向所述目标对象发送推荐信息。

在一些实施例中，如图5所示，所述第二终端基于所述目标对象的行为分类结果，判断是否向所述目标对象发送推荐信息可以包括：

S2071：所述第二终端基于所述目标对象的有触发行为分类结果，向所述目标对象发送推荐信息。

S2073：所述第二终端基于所述目标对象的无触发行为分类结果，不向所述目标对象发送推荐信息。

在一些具体的实施例中，所述有触发行为可以包括用户在显示界面的操作行为，所述操作行为可以为点击或滑动行为。

在本说明书实施例中，通过对用户行为的快速、准确预测，实现了及时向用户推荐信息，且保证了推荐信息的点击率，从而避免造成无效推荐。

在本说明书实施例中，所述第二终端将目标对象的行为数据输入所述行为分类模型，对所述目标对象的行为进行分类的步骤之后，所述方法还可以包括：

所述第二终端基于所述目标对象的行为分类结果，判断是否向所述目标对象发送所述目标场景中推荐信息。

以下介绍本申请的用户行为分类方法的一个具体的应用实施例。参数服务器将数据集分割成M份，并分配到集群中的M个计算节点上，每个节点包含N个训练样本；所述计算节点可以为第一终端。用f_m,n表示第m个计算节点上第n个训练样本对应的损失函数，则总体损失函数f(x)由所有训练样本的损失函数的均值表示：

在一些实施例中，每次迭代时，为节省计算力，每个计算节点从本地数据中随机抽取批量数据

并基于随机样本计算近似梯度f′_t(x_t)^(m)，作为真实梯度的无偏估计。

为了减少分布式训练中计算节点与参数服务器之间的通信时间消耗，本申请采用梯度量化函数Q对f′_t(x_t)^(m)进行处理。参数服务器在收集完各计算节点的量化梯度后，计算各节点量化梯度的均值实现梯度的同步：

为了保证模型的稀疏性以及准确性，在参数服务器上，构建基于同步量化梯度信息的对角矩阵H_t：

H_t＝δI+diag(c_t)

其中，δ≥0，δ为一个较小的固定值，Q_1:t＝[Q_1:t-1,Q_t]表示将同步量化梯度按照时间序列衔接起来得到的矩阵。第d维度的同步量化梯度序列表示为Q_1:t,d。向量c_t的第d维则表示为c_t,d＝||Q_1:t,d||₁。

在一个具体实施例中，分布式量化自适应复合镜像梯度下降的优化目标函数可以为：

其中η为固定的学习率，φ(x)＝λ||x||₁，λ≥0，

Ht依据(1)计算，模型可以求得以下闭式解：

在一个具体实施例中，分布式量化自适应正则对偶平均的优化目标函数可以为:

其中η为固定的学习率，φ(x)＝λ||x||₁，λ≥0，

H_t依据上述公式H_t＝δI+diag(c_t)进行计算，模型可以求得以下闭式解：

梯度量化函数Q可以选择多种不同的方法，例如可以为量化随机梯度递减(QSGD)、三值量化(Tern Grad)等。

由于梯度量化会引进量化误差，过大的量化误差会导致模型收敛速度、稀疏程度下降，为了保证模型的收敛速度和稀疏程度，本申请可以采用量化误差小的梯度量化函数，例如可以使用具有编码代价小、量化误差低特性的门限量化函数。门限量化法原本被用于模型参数的量化，它和三值量化法一样仅用{-1，0，1}以及额外的一个放缩标量来表示一个梯度向量。不同的是，门限量化，将量化梯度与高精度梯度之间的距离作为优化目标，通过最小化量化误差，获得最优的门限值及梯度相应的三值表示。

具体来说，首先定义门限量化函数：

Q_Δ(v^t)＝sv

其中，v^t表示t时刻的高精度(一般为32位浮点数)梯度向量，s>0表示一个放缩标量，Δ>0为门限值，向量v的第i维度则表示为：

为了让量化误差尽可能的小，定义目标函数：

经过简单的数学变换，目标函数变为：

|I_Δ|则表示集合I_Δ中元素的个数。于是可以求得最优的放缩标量：

以及最优的门限值：

当梯度向量v^t∈R^d时，求解上述最优放缩标量和最优门限值的计算复杂度是O(dlogd)。为了减少计算量，实际过程中可以假设

并用经验值

作为Δ^*的近似值。

然后通过最优放缩标量和最优门限值确定梯度量化函数，由此得到量化梯度的量化误差小，从而保证了模型的收敛速度和稀疏程度。

由以上本说明书实施例提供的技术方案可知，本说明书实施例在进行分布式训练过程中，每个第一终端基于服务器发送的当前机器学习模型，确定本地终端训练数据的损失函数；然后进一步确定量化梯度后发送至所述服务器；通过迭代训练确定满足预设条件的行为分类模型；在模型的训练过程中，通过对梯度进行量化处理，减少了第一终端与服务器之间的通信时间，从而提高了行为分类模型的训练速度；并采用快速训练得到的行为分类模型实现了对用户的行为进行快速预测。

以下以服务器为执行主体介绍本说明书一种用户行为分类方法的具体实施例，图6是本申请实施例提供的一种用户行为分类方法的流程示意图，具体的，结合图6所示，所述方法可以包括：

S601：训练用于进行用户行为分类的行为分类模型；

S603：向第二终端发送所述行为分类模型，以使所述第二终端将目标对象的行为数据输入所述行为分类模型，对所述目标对象的行为进行分类；

其中，所述训练用于进行用户行为分类的行为分类模型可以包括：

S6011：构建预设机器学习模型，并将所述预设机器学习模型确定为当前机器学习模型；

S6013：基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；

S6015：当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；

在本说明书实施例中，如图7所示，所述基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度包括：

S60131：向所述至少两个第一终端发送所述当前机器学习模型；以使每个第一终端将所述每个第一终端中标注有行为类别标签的样本对象的训练数据输入所述当前机器学习模型，确定所述训练数据的损失值和损失函数；以及基于所述训练数据的损失函数，确定量化梯度；

S60133：接收所述每个第一终端发送的所述每个第一终端的量化梯度和所述训练数据的损失值；

S60135：基于所述每个第一终端中训练数据的损失值，确定所述至少两个第一终端的损失平均值。

相应的，当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度可以包括：

当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端对应的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：向至少两个第一终端发送所述当前机器学习模型。

在本说明书实施例中，所述基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型可以包括：

基于所述每个第一终端的量化梯度，计算所述至少两个第一终端的同步量化梯度；

基于所述至少两个第一终端的同步量化梯度，构建自适应学习率矩阵；

基于所述自适应学习率矩阵，对所述当前机器学习模型进行更新以得到更新后机器学习模型。

在本说明书实施例中，所述基于所述自适应学习率矩阵，对所述当前机器学习模型进行更新以得到更新后机器学习模型可以包括：

基于所述自适应学习率矩阵，构建量化自适应复合镜像下降函数；

基于所述量化自适应复合镜像下降函数，对所述当前机器学习模型进行更新以得到更新后机器学习模型。

基于所述自适应学习率矩阵，构建量化正则对偶平均函数；

基于所述量化正则对偶平均函数，对所述当前机器学习模型进行更新以得到更新后机器学习模型。

S6017：当所述至少两个第一终端的损失平均值小于或等于所述预设阈值时，将所述当前机器学习模型确定为所述行为分类模型。

本说明书实施例提供了一种用户行为分类服务器，所述服务器包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上所述的用户行为分类方法。

以下以第一终端为执行主体介绍本说明书一种用户行为分类方法的具体实施例，图8是本申请实施例提供的一种用户行为分类方法的流程示意图，具体的，结合图8所示，所述方法可以包括：

S801：接收服务器发送的当前机器学习模型；所述当前机器学习模型为所述服务器构建的预设机器学习模型；

S803：将本地终端中标注有行为类别标签的样本对象的训练数据输入所述当前机器学习模型，确定所述训练数据的损失值和损失函数；

在本说明书实施例中，所述将本地终端中标注有行为类别标签的样本对象的训练数据输入所述当前机器学习模型，确定所述训练数据的损失值和损失函数的步骤之前，所述方法还可以包括：

接收所述服务器基于用户行为数据集确定并发送的子数据集；

对所述子数据集中样本对象的训练数据进行行为类别标注。

在一些实施例中，所述对所述子数据集中样本对象的训练数据进行行为类别标注可以包括：

对所述子数据集中预设数量个样本对象的训练数据进行行为类别标注。

S805：基于所述训练数据的损失函数，确定量化梯度；

在本说明书实施例中，所述基于所述训练数据的损失函数，确定量化梯度可以包括：

对所述训练数据的损失函数求导，得到所述损失函数的梯度；

基于梯度量化函数对所述损失函数的梯度进行量化处理，得到量化梯度。

在一些实施例中，所述基于梯度量化函数对所述损失函数的梯度进行量化处理，得到量化梯度的步骤之前，所述方法还可以包括：

基于放缩标量与门限值，构建门限量化函数；

将所述门限量化函数作为所述梯度量化函数。

在一些实施例中，所述基于放缩标量与门限值，构建门限量化函数的步骤之前，所述方法还可以包括：

基于预设目标函数，确定目标放缩标量和目标门限值；

相应的，所述基于放缩标量与门限值，构建门限量化函数包括：

基于所述目标放缩标量与所述目标门限值，构建门限量化函数。

S807：向所述服务器发送所述本地终端的量化梯度和所述训练数据的损失值；以使所述服务器基于每个第一终端中训练数据的损失值，确定至少两个第一终端的损失平均值；以及当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；以及当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；以及当所述至少两个第一终端的损失平均值小于或等于所述预设阈值时，将所述当前机器学习模型确定为所述行为分类模型。

本说明书实施例提供了一种用户行为分类终端，所述终端包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上所述的用户行为分类方法。

本说明书实施例中，所述存储器可用于存储软件程序以及模块，处理器通过运行存储在存储器的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、功能所需的应用程序等；存储数据区可存储根据所述设备的使用所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器还可以包括存储器控制器，以提供处理器对存储器的访问。

本说明书实施例提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的用户行为分类方法。

本申请实施例还提供了一种用户行为分类装置，如图9所示，所述装置可以包括：

训练模块910，用于训练用于进行用户行为分类的行为分类模型；

行为分类模型发送模块920，用于向第二终端发送所述行为分类模型，以使所述第二终端将目标对象的行为数据输入所述行为分类模型，对所述目标对象的行为进行分类；

其中，所述训练模块910可以包括：

预设机器学习模型构建子模块9110，用于构建预设机器学习模型，并将所述预设机器学习模型确定为当前机器学习模型；

损失平均值及量化梯度确定子模块9120，用于基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；

模型更新子模块9130，用于当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；

行为分类模型确定子模块9140，用于当所述至少两个第一终端的损失平均值小于或等于所述预设阈值时，将所述当前机器学习模型确定为所述行为分类模型。

在一些实施例中，如图10所示，所述损失平均值及量化梯度确定子模块9120可以包括：

当前机器学习模型发送单元91210，用于向至少两个第一终端发送所述当前机器学习模型；以使每个第一终端将所述每个第一终端中标注有行为类别标签的样本对象的训练数据输入所述当前机器学习模型，确定所述训练数据的损失值和损失函数；以及基于所述训练数据的损失函数，确定量化梯度；

信息接收子模块91220，用于接收所述每个第一终端发送的所述每个第一终端的量化梯度和所述训练数据的损失值；

损失平均值确定子模块91230，用于基于所述每个第一终端中训练数据的损失值，确定所述至少两个第一终端的损失平均值。

在一些实施例中，所述模型更新子模块可以包括：

同步量化梯度计算单元，用于基于所述每个第一终端的量化梯度，计算所述至少两个第一终端的同步量化梯度；

自适应学习率矩阵构建单元，用于基于所述至少两个第一终端的同步量化梯度，构建自适应学习率矩阵；

模型更新单元，用于基于所述自适应学习率矩阵，对所述当前机器学习模型进行更新以得到更新后机器学习模型。

在一些实施例中，所述模型更新单元可以包括：

第一函数构建子单元，用于基于所述自适应学习率矩阵，构建量化自适应复合镜像下降函数；

第一模型更新子单元，用于基于所述量化自适应复合镜像下降函数，对所述当前机器学习模型进行更新以得到更新后机器学习模型。

在一些实施例中，所述模型更新单元可以包括：

第二函数构建子单元，用于基于所述自适应学习率矩阵，构建量化正则对偶平均函数；

第二模型更新子单元，用于基于所述量化正则对偶平均函数，对所述当前机器学习模型进行更新以得到更新后机器学习模型。

所述的装置实施例中的装置与方法实施例基于同样的发明构思。

本申请实施例还提供了一种用户行为分类装置，如图11所示，所述装置可以包括：

当前机器学习模型接收模块1110，用于接收服务器发送的当前机器学习模型；所述当前机器学习模型为所述服务器构建的预设机器学习模型；

损失值和损失函数确定模块1120，用于将本地终端中标注有行为类别标签的样本对象的训练数据输入所述当前机器学习模型，确定所述训练数据的损失值和损失函数；

量化梯度确定模块1130，用于基于所述训练数据的损失函数，确定量化梯度；

损失值发送模块1140，用于向所述服务器发送所述本地终端的量化梯度和所述训练数据的损失值；以使所述服务器基于每个第一终端中训练数据的损失值，确定至少两个第一终端的损失平均值；以及当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；以及当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；以及当所述至少两个第一终端的损失平均值小于或等于所述预设阈值时，将所述当前机器学习模型确定为所述行为分类模型。

在一些实施例中，所述量化梯度确定模块可以包括：

梯度确定子模块，用于对所述训练数据的损失函数求导，得到所述损失函数的梯度；

量化梯度确定子模块，用于基于梯度量化函数对所述损失函数的梯度进行量化处理，得到量化梯度。

在一些实施例中，所述装置还可以包括：

门限量化函数构建模块，用于基于放缩标量与门限值，构建门限量化函数；

梯度量化函数确定模块，用于将所述门限量化函数作为所述梯度量化函数。

在一些实施例中，所述装置还可以包括：

目标值确定模块，用于基于预设目标函数，确定目标放缩标量和目标门限值；

在一些实施例中，所述门限量化函数构建模块可以包括：

门限量化函数构建子模块，用于基于所述目标放缩标量与所述目标门限值，构建门限量化函数。

在一些实施例中，所述装置还可以包括：

子数据集接收模块，用于接收所述服务器基于用户行为数据集确定并发送的子数据集；

行为类别标注模块，用于对所述子数据集中样本对象的训练数据进行行为类别标注。

在一些实施例中，所述行为类别标注模块可以包括：

行为类别标注子模块，用于对所述子数据集中预设数量个样本对象的训练数据进行行为类别标注。

本申请另一方面还提供一种用户行为分类系统，所述系统包括服务器、第一终端和第二终端，

由上述本申请提供的用户行为分类方法、装置、服务器、终端、存储介质或系统的实施例可见，本说明书实施例在进行分布式训练过程中，每个第一终端基于服务器发送的当前机器学习模型，确定本地终端训练数据的损失函数；然后进一步确定量化梯度后发送至所述服务器；通过迭代训练确定满足预设条件的行为分类模型；在模型的训练过程中，通过对梯度进行量化处理，减少了第一终端与服务器之间的通信时间，从而提高了行为分类模型的训练速度；并采用快速训练得到的行为分类模型实现了对用户的行为进行快速预测。

需要说明的是：上述本申请实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、服务器、终端、系统、存储介质的实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种用户行为分类方法，其特征在于，所述方法包括：

服务器训练用于进行用户行为分类的行为分类模型；

所述服务器向第二终端发送所述行为分类模型；

当所述至少两个第一终端的损失平均值大于预设阈值时，所述服务器基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：所述服务器基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；

2.根据权利要求1所述的方法，其特征在于，所述服务器基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度包括：

所述服务器向所述至少两个第一终端发送所述当前机器学习模型；

每个第一终端将所述每个第一终端中标注有行为类别标签的样本对象的训练数据输入所述当前机器学习模型，确定所述训练数据的损失值和损失函数；

所述每个第一终端基于所述训练数据的损失函数，确定量化梯度；

所述每个第一终端向所述服务器发送所述每个第一终端的量化梯度和所述训练数据的损失值；

所述服务器基于所述每个第一终端中训练数据的损失值，确定所述至少两个第一终端的损失平均值。

3.根据权利要求2所述的方法，其特征在于，所述每个第一终端基于所述训练数据的损失函数，确定量化梯度包括：

所述每个第一终端对所述训练数据的损失函数求导，得到所述损失函数的梯度；

所述每个第一终端基于梯度量化函数对所述损失函数的梯度进行量化处理，得到量化梯度。

4.根据权利要求3所述的方法，其特征在于，所述每个第一终端基于梯度量化函数对所述损失函数的梯度进行量化处理，得到量化梯度的步骤之前，所述方法还包括：

5.一种用户行为分类方法，其特征在于，所述方法包括：

训练用于进行用户行为分类的行为分类模型；

当所述至少两个第一终端的损失平均值大于预设阈值时，基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型，将所述更新后机器学习模型重新确定为所述当前机器学习模型；重复步骤：基于所述当前机器学习模型，确定至少两个第一终端的损失平均值以及每个第一终端的量化梯度；

6.根据权利要求5所述的方法，其特征在于，所述基于所述每个第一终端的量化梯度，对所述当前机器学习模型进行更新以得到更新后机器学习模型包括：

7.根据权利要求6所述的方法，其特征在于，所述基于所述自适应学习率矩阵，对所述当前机器学习模型进行更新以得到更新后机器学习模型包括：

8.根据权利要求6所述的方法，其特征在于，所述基于所述自适应学习率矩阵，对所述当前机器学习模型进行更新以得到更新后机器学习模型包括：

基于所述自适应学习率矩阵，构建量化正则对偶平均函数；

9.一种用户行为分类系统，其特征在于，所述系统包括服务器、第一终端和第二终端，

10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1-4或5-8任一所述的用户行为分类方法。