CN114021017A

CN114021017A - 信息推送方法、装置及存储介质

Info

Publication number: CN114021017A
Application number: CN202111309031.1A
Authority: CN
Inventors: 樊昕晔; 王鹏; 贾雪丽; 王义文; 李钰; 田江; 向小佳; 丁永建; 李璠
Original assignee: Everbright Technology Co ltd
Current assignee: Everbright Technology Co ltd
Priority date: 2021-11-05
Filing date: 2021-11-05
Publication date: 2022-02-08

Abstract

本发明实施例提供了一种信息推送方法、装置及存储介质，该方法包括：获取正样本和负样本，并基于所述正样本和所述负样本进行模型训练得到信息推送模型，其中，所述正样本包括推送成功用户的数据，所述负样本包括从待推送集合中获取的待推送用户的数据，所述待推送集合包括所有待推送用户的数据；根据所述信息推送模型执行信息推送。通过本发明，解决了相关技术中因数据量和数据范围不足导致的信息推送模型的构建不准确的问题，提高了信息推送模型的准确性，增大了信息推送的成功率。

Description

信息推送方法、装置及存储介质

技术领域

本发明实施例涉及计算机领域，具体而言，涉及一种信息推送方法、装置及存储介质。

背景技术

近几年结合高新技术描绘用户画像的智能信息推送方式(例如，智能营销)广受推崇，简单来说，就是通过大数据分析、机器学习等方法更深入地挖掘用户的喜好、分析用户的潜在需求、进而转化信息推送的效果。

按照相关技术的智能信息推送模式，各机构只能基于自身系统中的用户画像挖掘用户需求，因为机构间的用户画像信息(例如，用户资产、消费行为等相关的画像信息)是相互割裂的，该数据不仅涉及用户个人隐私，具有一定敏感性，也是机构的核心数据之一，具有较高价值，难以以明文形式公开共享使用。

可见，信息推送模型的构建过程中，往往会涉及因数据量和数据范围不足导致的信息推送模型的构建不准确的问题。

发明内容

本发明实施例提供了一种信息推送方法、装置及存储介质，以至少解决相关技术中因数据量和数据范围不足导致的信息推送模型的构建不准确的问题。

根据本发明的一个实施例，提供了一种信息推送方法，包括：

获取正样本和负样本，并基于所述正样本和所述负样本进行模型训练得到信息推送模型，其中，所述正样本包括推送成功用户的数据，所述负样本包括从待推送集合中获取的待推送用户的数据，所述待推送集合包括所有待推送用户的数据；

根据所述信息推送模型执行信息推送。

在至少一个示例性实施例中，获取正样本和负样本，并基于所述正样本和所述负样本进行模型训练得到信息推送模型包括：

样本获取步骤：获取所述正样本，并从所述待推送集合中获取所述负样本；

训练步骤：基于所述正样本和所述负样本进行模型训练得到所述信息推送模型；

调整步骤：根据所述信息推送模型预测所述待推送集合中的所有待推送用户的推送成功率，根据所述推送成功率从所述待推送集合中确定潜在推送用户，将所述潜在推送用户的数据加入正样本，并从所述待推送集合中删除所述潜在推送用户的数据；

控制步骤：控制循环迭代执行所述样本获取步骤、所述训练步骤和所述调整步骤，直到所述信息推送模型满足预定条件。

在至少一个示例性实施例中，根据所述推送成功率从所述待推送集合中确定潜在推送用户包括以下之一：

将所述待推送集合中所述推送成功率高于潜在推送阈值的用户确定为所述潜在推送用户；

将所述待推送集合中所述推送成功率最高的预定数量的用户确定为所述潜在推送用户。

在至少一个示例性实施例中，所述预定条件包括以下之一：

所述信息推送模型满足业务要求；

所述信息推送模型达到收敛条件。

在至少一个示例性实施例中，所述正样本的数量为第一值，所述负样本的数量为第二值，其中，所述第二值相对于所述第一值的差值小于预设偏差数值。

在至少一个示例性实施例中，所述负样本包括从待推送集合中随机抽取的待推送用户的数据。

在至少一个示例性实施例中，基于所述正样本和所述负样本进行模型训练得到信息推送模型包括：

根据联邦算法，基于所述正样本和所述负样本进行模型训练得到所述信息推送模型，所述联邦算法包括以下之一：联邦逻辑回归算法、联邦树算法。

在至少一个示例性实施例中，根据联邦算法，基于所述正样本和所述负样本进行模型训练得到所述信息推送模型包括：

多个参与方分别从不同维度提供所述正样本和所述负样本中包括的用户的特征数据，协调方进行模型梯度的聚合以及模型参数的更新，通过模型训练得到所述信息推送模型。

根据本发明的另一个实施例，提供了一种信息推送装置，包括：

模型训练模块，用于获取正样本和负样本，并基于所述正样本和所述负样本进行模型训练得到信息推送模型，其中，所述正样本包括推送成功用户的数据，所述负样本包括从待推送集合中获取的待推送用户的数据，所述待推送集合包括所有待推送用户的数据；

信息推送模块，用于根据所述信息推送模型执行信息推送。

根据本发明的再一个实施例，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本发明的又一个实施例，还提供了一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本发明，由于引入了待推送集合中的尚未推送成功的用户的数据作为样本，极大地丰富了样本数据的数量以及类型，因此，可以解决相关技术中因数据量和数据范围不足导致的信息推送模型的构建不准确的问题，提高了信息推送模型的准确性，增大了信息推送的成功率。

附图说明

图1是本发明实施例的一种信息推送方法的计算机终端的硬件结构框图；

图2是根据本发明实施例的信息推送方法的流程图；

图3是根据本发明实施例的信息推送装置的结构框图；

图4是根据本发明实施例的该智能营销模型的训练过程示意图；

图5是根据本发明实施例的联邦逻辑回归的模型训练子协议的流程图；

图6是根据本发明实施例的联邦树的模型训练子协议一的流程图；

图7是根据本发明实施例的联邦树的模型训练子协议二的流程图。

具体实施方式

目前，往往使用逻辑回归构建智能信息推送模型，首先将历史信息推送数据(例如，历史营销数据)打标签，信息推送成功(例如，可以是用户选择接收并显示推送的信息；或者可以是营销成功，即用户选择接收并显示推送的信息，并据此生成订单完成订购，具体信息推送成功对应着何种条件可以根据当前所涉及的业务的情况来设定)的用户标为正样本，信息推送失败(例如，用户选择拒绝接收并显示推送的信息，或者用户未选择接收并显示推送的信息，或者营销失败，即用户未根据推送信息完成订购，具体信息推送失败对应着何种条件可以根据当前所涉及的业务的情况来设定)的用户标为负样本；接着利用用户已有特征构建逻辑回归模型，进而预测目标用户的信息推送成功率。然而，以上的智能信息推送模型是建立在数据集中化的前提下，该结构假设用户的所有特征数据均来自于同一机构，这与当前数据孤岛现状不契合，因此缺乏实际应用价值。

如上所述，理想状态下，通过整合多机构间多维度的数据才能构建更立体的用户画像，实现资源的优势互补、开拓市场广度和挖掘市场深度的营销目的。然而目前的现状是机构间的用户画像信息(例如，用户资产、消费行为等相关的画像信息)是相互割裂的，这导致数据量和数据范围都存在较大的不足，这会导致信息推送模型的构建不准确。另一方面，以往的信息推送模型的建立，面临着有标签的数据收集起来异常困难，标注也耗时和耗力的问题，这会导致有标签数据的样本数量不足，同样会导致信息推送模型的构建不准确。

为此，在本发明实施例中，通过联邦学习方式使得各参与方(例如，需要进行信息推送的机构)能够以密态的方式共享各自的用户数据进行信息推送模型的计算，根据建模结果制订信息推送策略，实现双赢甚至多赢的联合信息推送的目的。另外，本发明实施例通过半监督学习，能够仅仅基于少量有标签的样本和大量无标签的样本，即可完成智能信息推送模型的训练。

下文中将参考附图并结合实施例来详细说明本发明的实施例。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

本申请实施例中所提供的方法实施例可以在计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例，图1是本发明实施例的一种信息推送方法的计算机终端的硬件结构框图。如图1所示，计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104，其中，上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述计算机终端的结构造成限定。例如，计算机终端还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的信息推送方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的信息推送方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网进行通讯。

在本实施例中提供了一种运行于计算机终端或者类似的运算装置的信息推送方法，图2是根据本发明实施例的信息推送方法的流程图，如图2所示，该流程包括如下步骤：

步骤S202，获取正样本和负样本，并基于所述正样本和所述负样本进行模型训练得到信息推送模型，其中，所述正样本包括推送成功用户的数据，所述负样本包括从待推送集合中获取的待推送用户的数据，所述待推送集合包括所有待推送用户的数据。

在至少一个示例性实施例中，为了循环迭代逐步得到更加准确的信息推送模型，步骤S202中获取正样本和负样本，并基于所述正样本和所述负样本进行模型训练得到信息推送模型可以通过以下方式实现：

步骤S202-1，样本获取步骤：获取所述正样本，并从所述待推送集合中获取所述负样本。

在至少一个示例性实施例中，所述正样本的数量为第一值，所述负样本的数量为第二值，其中，负样本的数量建议与正样本的数量近似，也就是说，所述第二值相对于所述第一值的差值小于预设偏差数值。

步骤S202-2，训练步骤：基于所述正样本和所述负样本进行模型训练得到所述信息推送模型。

步骤S202-3，调整步骤：根据所述信息推送模型预测所述待推送集合中的所有待推送用户的推送成功率，根据所述推送成功率从所述待推送集合中确定潜在推送用户，将所述潜在推送用户的数据加入正样本，并从所述待推送集合中删除所述潜在推送用户的数据。

在至少一个示例性实施例中，步骤S202-3中，根据所述推送成功率从所述待推送集合中确定潜在推送用户包括以下之一：

步骤S202-4，控制步骤：控制循环迭代执行所述样本获取步骤S202-1、所述训练步骤S202-2和所述调整步骤S202-3，直到所述信息推送模型满足预定条件。

在至少一个示例性实施例中，所述预定条件可以包括以下之一：

所述信息推送模型满足业务要求；

所述信息推送模型达到收敛条件。

步骤S204，根据所述信息推送模型执行信息推送。

其中，上述步骤的执行主体可以为计算机终端或者类似的运算装置等，但不限于此。

通过上述步骤S202和步骤S204，由于引入了待推送集合中的尚未推送成功的用户的数据作为样本，极大地丰富了样本数据的数量以及类型，因此，可以解决相关技术中因数据量和数据范围不足导致的信息推送模型的构建不准确的问题，提高了信息推送模型的准确性，增大了信息推送的成功率。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

在本实施例中还提供了一种信息推送装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图3是根据本发明实施例的信息推送装置的结构框图，如图3所示，该装置包括：

模型训练模块32，用于获取正样本和负样本，并基于所述正样本和所述负样本进行模型训练得到信息推送模型，其中，所述正样本包括推送成功用户的数据，所述负样本包括从待推送集合中获取的待推送用户的数据，所述待推送集合包括所有待推送用户的数据；

信息推送模块34，耦合至模型训练模块32，用于根据所述信息推送模型执行信息推送。

需要说明的是，上述各个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。

本发明的实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

在本实施例中，上述计算机可读存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S1，获取正样本和负样本，并基于所述正样本和所述负样本进行模型训练得到信息推送模型，其中，所述正样本包括推送成功用户的数据，所述负样本包括从待推送集合中获取的待推送用户的数据，所述待推送集合包括所有待推送用户的数据。

S2，根据所述信息推送模型执行信息推送。

在一个示例性实施例中，上述计算机可读存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本发明的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

在一个示例性实施例中，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

在一个示例性实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S2，根据所述信息推送模型执行信息推送。

本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例，本实施例在此不再赘述。

以下以智能营销模型为例，详细描述本发明实施例的信息推送方案。

联邦学习是一个机器学习框架，能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下，进行数据使用和机器学习建模。

半监督学习是在无标签样本的帮助下训练有标签样本，获得比只用有标签样本训练得到的模型性能更优的模型，弥补有标签样本数量不足的缺陷。

本发明实施例首次提出联邦学习下的智能营销模型，并将半监督学习的优势融入其中。图4是根据本发明实施例的该智能营销模型的训练过程示意图，如图4所示，包括以下步骤：

步骤1，将已营销用户作为正样本加入训练集。在待营销用户中随机抽取与已营销用户数量近似相等的用户群体，作为负样本加入训练集；

步骤2，选择合适的联邦算法，基于正负样本进行模型训练；

步骤3，对全部待营销用户进行预测，并选取潜在营销成功率最高的用户群体(潜在营销用户)，作为新的正样本加入已营销用户，实现了扩充有标签数据集的目标；

步骤4，从待营销用户中减去这部分潜在营销用户；

将上述1-4步骤循环迭代多轮，直至模型效果达到业务要求。

该营销模型结构中的联邦算法部分有两种方案可以选择，一种是联邦逻辑回归，另一种是联邦树。实际采用哪种方案应根据具体的业务需求而定。这里依次介绍两种算法在模型训练上的流程。

(一)联邦逻辑回归

图5是根据本发明实施例的联邦逻辑回归的模型训练子协议的流程图，如图5所示，该流程包括以下步骤：

步骤1，联邦协调方调用同态加密算法生成同态公私钥，并发送公钥给各参与方；

步骤2，参与方Host(即数据提供方)计算并使用公钥加密自有模型参数与特征点积wx，发送给Guest(即数据应用方)；

步骤3，Guest对Host发送加密点积与自有wx求和，结合标签计算加密残差[d]，并将其发送给参与方Host；

步骤4，各参与方利用加密残差与点积计算加密梯度[g]，并将加密梯度发送给协调方；

步骤5，协调方解密各加密梯度，并发送给所有参与方，所有参与方依此更新模型参数。

(二)联邦树

联邦树的模型训练包括两个子协议：

子协议一是在算法开始之前，联邦协调方将同态加密公钥分发给参与方Guest(即数据应用方)，Guest对样本一阶导数和二阶导数进行加密，并将密文传输给参与方Host(即数据提供方)。图6是根据本发明实施例的联邦树的模型训练子协议一的流程图，如图6所示，该流程包括以下步骤：

步骤1，联邦协调方生成同态公私钥，发送到参与方Guest；

步骤2，参与方Guest使用本地标签计算一阶导数与二阶导数，并使用同态加密公钥对一阶二阶导数进行加密；

步骤3，参与方Guest将本方梯度密文发送至参与方Host。

子协议二在树的每个节点处执行，联邦协调方获取参与方Guest，Host的候选切分点信息并解密，输出该节点是否切分和最优切分点信息，根据该信息决定每个参与方可以生成的左右子树或叶子节点，参与方根据协调方结果更新树模型。图7是根据本发明实施例的联邦树的模型训练子协议二的流程图，如图7所示，该流程包括以下步骤：

步骤1，各个参与方使用本地标签、一阶导数与二阶导数密文计算特征切分点，并将所有切分点顺序打乱并编号，之后将切分点密文信息发送至联邦协调方；

步骤2，联邦协调方对切分点密文进行解密，比较切分点收益，得到最优切分点；

步骤3，联邦协调方将最优切分点编号告知所属参与方，该参与方使用该切分点更新本地模型，并与其他参与方同步树结构与样本划分。

综上，本发明实施例提出联邦学习下的智能营销模型，并且使用半监督学习解决了有标签样本不足的问题。相比于相关技术，本发明实施例实现了智能营销模型的联邦化，即参与合作的各机构分别从不同维度提供用户的特征数据，由协调方负责模型梯度的聚合，以及模型参数的更新。另一方面，本发明实施例还基于半监督学习，解决了实际场景中有标签样本不足，无法完成模型训练的问题。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种信息推送方法，其特征在于，包括：

根据所述信息推送模型执行信息推送。

2.根据权利要求1所述的方法，其特征在于，获取正样本和负样本，并基于所述正样本和所述负样本进行模型训练得到信息推送模型包括：

3.根据权利要求2所述的方法，其特征在于，根据所述推送成功率从所述待推送集合中确定潜在推送用户包括以下之一：

4.根据权利要求2所述的方法，其特征在于，所述预定条件包括以下之一：

所述信息推送模型满足业务要求；

所述信息推送模型达到收敛条件。

5.根据权利要求1所述的方法，其特征在于，所述正样本的数量为第一值，所述负样本的数量为第二值，其中，所述第二值相对于所述第一值的差值小于预设偏差数值。

6.根据权利要求1所述的方法，其特征在于，所述负样本包括从待推送集合中随机抽取的待推送用户的数据。

7.根据权利要求1-6中任一项所述的方法，其特征在于，基于所述正样本和所述负样本进行模型训练得到信息推送模型包括：

8.根据权利要求7所述的方法，其特征在于，根据联邦算法，基于所述正样本和所述负样本进行模型训练得到所述信息推送模型包括：

9.一种信息推送装置，其特征在于，包括：

信息推送模块，用于根据所述信息推送模型执行信息推送。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行所述权利要求1至8任一项中所述的方法。