CN113297481A

CN113297481A - 基于流数据处理的信息推送方法、信息推送装置及服务器

Info

Publication number: CN113297481A
Application number: CN202110501761.5A
Authority: CN
Inventors: 陈程; 王贺; 向舜
Original assignee: Wuhan Zhuoer Digital Media Technology Co ltd
Current assignee: Wuhan Zhuoer Digital Media Technology Co ltd
Priority date: 2021-05-08
Filing date: 2021-05-08
Publication date: 2021-08-24

Abstract

本申请是关于一种基于流数据处理的信息推送方法包括在用户行为产生的第一流数据中实时提取第一特征数据，并通过第一特征数据在线训练机器学习模型，以及通过训练后的机器学习模型进行信息推送。本申请中利用流数据快速连续的动态特性，通过流数据进行实时处理的方式进行机器学习模型在线训练，能够保证进行机器学习模型训练的数据为最新产生的有效数据，相对于传统的对数据进行存储，在通过存储的数据进行机器学习模型训练，可大大提高机器学习模型训练的实时性和有效性。

Description

基于流数据处理的信息推送方法、信息推送装置及服务器

技术领域

本发明涉及信息技术领域，尤其涉及一种基于流数据处理的信息推送方法、基于流数据处理的信息推送装置、服务器及存储介质。

背景技术

流数据是一组顺序、大量、快速、连续到达的数据序列。一般情况下，数据流可被视为一个随时间延续而无限增长的动态数据集合。应用于网络监控、传感器网络、航空航天、气象测控和金融服务等领域。同时在互联网时代，信息推送服务在各领域应用变得越来越多。但随着时代发展，信息变化更新频率越来越快，如何更好的进行信息推送是当前信息推送服务领域需要解决的问题。然而流数据的动态特性可应用于信息推送服务领域，来提高信息推送服务的推送质量。

发明内容

有鉴于此，本申请实施例期望提供一种基于流数据处理的信息推送方法、基于流数据处理的信息推送装置、服务器及存储介质。

本申请的技术方案是这样实现的：

一方面，本申请提供一种基于流数据处理的信息推送方法。

本申请实施例提供的基于流数据处理的信息推送方法，所述方法包括：

从基于用户行为产生的第一流数据实时提取出第一特征数据，其中，所述第一特征数据包括：用户标签和与用户标签对应的行为标签；

基于所述第一特征数据，在线训练机器学习模型；

基于训练后的所述机器学习模型，进行信息推送。

在一些实施例中，所述基于所述第一特征数据，在线训练机器学习模型，包括：

基于所述第一特征数据，更新所述机器学习模型的匹配参数；

所述基于训练后的所述机器学习模型，进行信息推送，包括：

从第二流数据中提取出第二特征数据；其中，所述第二流数据是在所述第一流数据之后基于用户行为产生的；

将所述第二特征数据与更新后的所述匹配参数进行匹配，得到匹配结果；

基于所述匹配结果，进行所述信息推送。

在一些实施例中，所述基于所述匹配结果，进行所述信息推送，包括：

基于所述匹配结果，确定出待进行信息推送的用户的行为潜力，其中，所述行为潜力，用于表征用户执行一种确定行为的意愿程度；

根据所述行为潜力，进行用户分类的信息推送。

在一些实施例中，所述行为潜力包括多个等级；不同等级的行为潜力表征用户执行所述确定行为的意愿程度不同；

所述根据所述行为潜力，进行用户分类的信息推送，包括：

根据用户的所述行为潜力，向所述用户推送与所述行为潜力的等级对应的信息；其中，不同等级的行为潜力所对应的信息中包含的信息量不同。

在一些实施例中，所述用户行为包括：浏览内容的第一行为和执行与浏览内容相关联的第二行为，其中，所述第二行为不同于所述第一行为；

所述进行信息推送，包括：

向执行过所述第一行为的用户，推送触发所述用户执行第二行为的信息。

在一些实施例中，所述第二行为至少包括以下行为中的一种：

购买所述浏览内容所涉及产品的购买行为；

订阅所述浏览内容所关联主题或专栏的订阅行为；

转发所述浏览内容的转发行为；

评价所述浏览内容的评价行为。

在一些实施例中，所述机器学习模型中包括多个判断条件；所述匹配参数至少包括各所述判断条件中的阈值以及各所述判断条件对应的权重。

在一些实施例中，所述用户标签包括：

用户的年龄和用户的性别中的至少一种。

在一些实施例中，所述用户标签对应的行为标签包括：

日平均浏览时长、日平均点击次数、注册时长、历史购买记录以及浏览的信息类型中的至少一种。

另一方面，本申请还提供一种基于流数据处理的信息推送装置，所述装置包括：

数据提取模块，用于从基于用户行为产生的第一流数据实时提取出第一特征数据，其中，所述第一特征数据包括：用户标签和与用户标签对应的行为标签；

在线学习模块，用于基于所述第一特征数据，在线训练机器学习模型；

信息推送模块，用于基于训练后的所述机器学习模型，进行信息推送。

在一些实施例中，所述在线学习模块具有用于基于所述第一特征数据，更新所述机器学习模型的匹配参数；

所述信息推送模块，具体用于从第二流数据中提取出第二特征数据；其中，所述第二流数据是在所述第一流数据之后基于用户行为产生的；

基于所述匹配结果，进行所述信息推送。

在一些实施例中，所述信息推送模块，具体还用于基于所述匹配结果，确定出待进行信息推送的用户的行为潜力，其中，所述行为潜力，用于表征用户执行一种确定行为的意愿程度；

根据所述行为潜力，进行用户分类的信息推送。

所述信息推送模块，具体还用于根据用户的所述行为潜力，向所述用户推送与所述行为潜力的等级对应的信息；其中，不同等级的行为潜力所对应的信息中包含的信息量不同。

所述信息推送模块，具体用于向执行过所述第一行为的用户，推送触发所述用户执行第二行为的信息。

购买所述浏览内容所涉及产品的购买行为；

订阅所述浏览内容所关联主题或专栏的订阅行为；

转发所述浏览内容的转发行为；

评价所述浏览内容的评价行为。

在一些实施例中，所述用户标签包括：

用户的年龄和用户的性别中的至少一种。

在一些实施例中，所述用户标签对应的行为标签包括：

又一方面，本申请还提供一种服务器。

本申请实施例提供的服务器，包括：处理器和用于存储能够在处理器上运行的计算机程序的存储器，其中，所述处理器用于运行所述计算机程序时，执行一方面本申请实施例提供的信息推送方法的步骤。

再一方面，本申请还提供一种计算机可读存储介质。

本申请实施例提供的计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现一方面本申请实施例提供的信息推送方法的步骤。

本申请实施例的基于流数据处理的信息推送方法包括在用户行为产生的第一流数据中实时提取第一特征数据，并通过第一特征数据在线训练机器学习模型，以及通过训练后的机器学习模型进行信息推送。本申请中利用流数据快速连续的动态特性，通过流数据进行实时处理的方式进行机器学习模型在线训练，能够保证进行机器学习模型训练的数据为最新产生的有效数据，相对于传统的对数据进行存储，在通过存储的数据进行机器学习模型训练，可大大提高机器学习模型训练的实时性和有效性。因为存储的数据在时限上存在滞后的可能。尤其是信息推送服务领域，信息推送的时效性很强，如果采用存储的数据进行训练，训练的结果可能会滞后，会影响信息推送服务的服务质量。然而，采用本申请中通过流数据进行实时处理的方式进行机器学习模型在线训练，再通过训练后的机器学习模型，进行信息推送，可大大提高模型训练的实时性和信息推送服务的有效性，进而提高信息推送服务的服务质量。同时，由于流数据的数据量较大，完整存储数据会消耗大量的内存。显然完整存储后再通过存储的数据进行机器学习模型训练，不利于内存的有效利用，甚至影响内存的数据处理效率。相对而言，流数据的实时处理，可有效节约内存资源、减少内存消耗，提高数据处理效率。

附图说明

图1是根据一示例性实施例示出的基于流数据处理的信息推送方法的方法流程图一；

图2是根据一示例性实施例示出的基于流数据处理的信息推送方法的方法流程图二；

图3是根据一示例性实施例示出的基于流数据处理的信息推送装置结构示意图；

图4是根据一示例性实施例示出的服务器结构示意图。

具体实施方式

以下结合说明书附图及具体实施例对本发明的技术方案做进一步的详细阐述。这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

但随着时代发展，信息变化更新频率越来越快，如何更好的进行信息推送是当前信息推送服务领域需要解决的问题。然而流数据的动态特性可应用于信息推送服务领域，来提高信息推送服务的推送质量。

本申请提供一种基于流数据处理的信息推送方法。图1是根据一示例性实施例示出的基于流数据处理的信息推送方法的方法流程图一。如图1所示，该基于流数据处理的信息推送方法，包括：

步骤10、从基于用户行为产生的第一流数据实时提取出第一特征数据，其中，所述第一特征数据包括：用户标签和与用户标签对应的行为标签；

步骤11、基于所述第一特征数据，在线训练机器学习模型；

步骤12、基于训练后的所述机器学习模型，进行信息推送。

在本示例性实施例中，信息推送方法可应用于互联网信息推送平台。用户行为可以为：网页或者应用程序页面的操作行为，包括打开网页、点击网页中的信息标签、播放广告信息、观看网站视频，以及登录应用程序、点击应用程序中的信息标签、观看应用程序中的视频等。

在本示例性实施例中，流数据可以是用户对网页进行操作时产生的与用户以及用户行为相关的数据。用户标签可以是与用户本身相关的信息，包括用户的年龄和用户的性别中的至少一种。用户标签对应的行为标签可以是用户在互联网平台上与网页操作相关的行为信息，包括日平均浏览时长、日平均点击次数、注册时长、历史购买记录以及浏览的信息类型中的至少一种。

在本示例性实施例中，从基于用户行为产生的第一流数据实时提取出第一特征数据，包括：

通过流数据实时处理平台实时处理所述第一流数据，从所述第一流数据中实时提取出所述第一特征数据，以及将实时提取出的第一特征数据输出给机器学习模块，以对机器学习模型进行训练。其中，流数据处理平台可以包括StreamBase平台、Storm平台等。Storm是Twitter开源的分布式实时计算系统，Storm通过简单的API使开发者可以可靠地处理无界持续的流数据，进行实时处理。StreamBase是一个关于复杂事件处理(CEP)、事件流实时处理的平台。

在本示例性实施例中，第一行为可以是对内容的浏览行为，第二行为可以包括以下行为中的至少一种：

购买所述浏览内容所涉及产品的购买行为；

订阅所述浏览内容所关联主题或专栏的订阅行为；

转发所述浏览内容的转发行为；

评价所述浏览内容的评价行为。

在本示例性实施例中，机器学习模型可以是快速决策树，决策树(Decision Tree)是一种基本的分类与回归方法，当被用于分类时叫做分类树，被用于回归时叫做回归树。决策树在逻辑上表现为树的形式，包含有节点和向边。一般情况下，一棵决策树包含一个根节点、若干个内部节点和若干个叶结点。

根节点：包含样本全集，从根节点到每个叶结点的路径对应了一个判定测试序列。

内部节点：表示一个特征和属性。每个内部节点都是一个判断条件，并且包含数据集中，满足从根节点到该节点所有条件的数据的集合。根据内部节点的属性测试结果，内部节点对应的数据的集合别分到两个或多个子节点中。

叶节点：表示一个类，对应于决策结果。叶节点为最终的类别，如果该数据被包含在该叶节点，则属于该类别。

决策树是一个利用树的模型进行决策的预测模型，表现出的是对象属性与对象值之间的一种映射关系。

在本申请中，可基于第一特征数据，在线训练快速决策树，更新决策树模型中各个内部节点和叶节点，形成一个训练后的机器学习模型。最后，通过训练后的机器学习模型进行信息推送。在具体训练时，可将用户标签对应的特征数据和行为标签对应的特征数据作为输入数据，输入决策树中进行训练以更新决策树模型中各个内部节点和叶节点。即更新各个内部节点的判断条件。

在本示例性实施例中，基于训练后的机器学习模型，进行信息推送，指通过训练后的机器学习模型，预测出用户行为背后所反映出的对某种产品或服务的需求，从而对用户推送相关的信息。

本申请实施例的基于流数据处理的信息推送方法包括在用户行为产生的第一流数据中实时提取第一特征数据，并通过第一特征数据在线训练机器学习模型，以及通过训练后的机器学习模型进行信息推送。本申请中利用流数据快速连续的动态特性，通过流数据进行实时处理的方式进行机器学习模型在线训练，能够保证进行机器学习模型训练的数据为最新产生的有效数据，相对于传统的对数据进行存储，在通过存储的数据进行机器学习模型训练，可大大提高机器学习模型训练的实时性和有效性。因为存储的数据在时限上存在滞后的可能。尤其是信息推送服务领域，信息推送的时效性很强，如果采用存储的数据进行训练，训练的结果可能会滞后，会影响信息推送服务的服务质量。然而，采用本申请中通过流数据进行实时处理的方式进行机器学习模型在线训练，再通过训练后的机器学习模型，进行信息推送，可大大提高模型训练的实时性和信息推送服务的有效性，进而提高信息推送服务的服务质量。

基于所述匹配结果，进行所述信息推送。

在本示例性实施例中，通过对第一特征数据训练机器学习模型，更新模型中的匹配参数。再将第二特征数据匹配更新后的匹配参数，得到匹配结果。最后根据匹配结果，进行信息推送。其中，机器学习模型的在线训练具有实时性，匹配参数也可实时更新。匹配参数的实时更新将影响到匹配结果的准确性。尤其是对时效性要求较高的信息推送领域，如果匹配参数不能够实时更新，匹配参数更新上的滞后会造成匹配结果不准确。当匹配结果对应于用户对某种产品或服务的购买意愿或需求时，最后预测的用户对产品的购买意愿程度或对服务的需求度会是不准确的，这对信息推送是不利的，会降低信息推送的服务质量。

在本示例性实施例中，匹配参数用于通过第二特征数据与匹配参数中阈值的比较，对产生所述第二特征数据的用户进行行为潜力等级分级。匹配参数包括与多个判断条件相关的阈值和权重。第二特征数据与匹配参数中的阈值比较得到比较结果；多个比较结果与对应的权重结合，得到最后的匹配结果。匹配结果与用户的行为潜力等级对应。

当机器学习模型采用决策树时，匹配参数可以为决策树模型中与各个内部节点的判断条件相关的参数，包括各个判断条件的阈值，或当各个判断条件具有关联性时，各个判断条件对应的权重等。即通过模型训练，更新各个内部节点的判断条件具体为更新与各个判断条件相关的匹配参数。

在本示例性实施例中，第二流数据可以是执行第一行为未执行第二行为的用户产生的第一行为对应的流数据；第二特征数据可以为基于第二流数据提取的特征数据，包括执行第一行为未执行第二行为的用户对应的用户标签和与用户标签对应的行为标签。第一特征数据和第二特征数据相比，数据提取的对象不同。第一特征数据从第一流数据中提取，第一流数据的产生用户包括执行第一行为未执行第二行为的用户以及执行第一行为和第二行为的用户；第二特征数据从第二流数据中提取，第二流数据的产生用户包括执行第一行为未执行第二行为的用户，且第二流数据是在第一流数据之后基于用户行为产生的，即第二流数据是在第一流数据之后执行第一行为未执行第二行为的用户产生的。

在本示例性实施例中，所述将所述第二特征数据与更新后的所述匹配参数进行匹配，包括将所述第二特征数据与更新后的多个不同的所述匹配参数进行匹配。即基于用于行为产生的流数据提取出的第二特征数据需要在机器学习模型的判断条件中与各匹配参数均进行匹配，以得到多个不同的匹配结果。各匹配结果均可由条件判断后的具体数值表示。

例如，判断条件包括第一判断条件、第二判断条件、第三判断条件；第一判断条件对应第一阈值、第二判断条件对应第二阈值、第三判断条件对应第三阈值；同时，第一判断条件对应的权重为第一权重、第二判断条件对应的权重为第二权重、第三判断条件对应的权重为第三权重。

第一判断条件、第二判断条件和第三判断条件分别对应第二特征数据中不同的特征数据内容，用于对不同的特征数据内容进行阈值判断。例如，第一判断条件对应用户的年龄，对第二特征数据中有关用户年龄的数据内容进行阈值判断。第二判断条件对应日平均浏览时长，对第二特征数据中有关日平均浏览时长的数据内容进行阈值判断。第三判断条件对应日平均点击次数，对第二特征数据中有关日平均点击次数的数据内容进行阈值判断。其中，第一权重、第二权重、第三权重的比例分配可根据第一判断条件、第二判断条件和第三判断条件对用户行为潜力等级判断的影响程度进行调整。例如，当第一判断条件对用户行为潜力等级判断的影响程度较大时，可将第一权重设置较大。当第一判断条件对用户行为潜力等级判断的影响程度较小时，可将第一权重设置较小。通过对各个判断条件设置权重，通过权重来调整各判断条件在预测用户行为潜力等级时所占的比重，可在整体上更加准确的预测出用户行为潜力对应的等级。

当用户的第二特征数据满足第一判断条件对应第一阈值时，则标记为第一判断数值A，如果用户的第二特征数据不满足第一判断条件对应第一阈值，则标记为第一判断数值B；当用户的第二特征数据满足第二判断条件对应第二阈值时，则标记为第二判断数值C，如果用户的第二特征数据不满足第二判断条件对应第二阈值，则标记为第二判断数值D；当用户的第二特征数据满足第三判断条件对应第三阈值时，则标记为第三判断数值E，如果用户的第二特征数据不满足第三判断条件对应第三阈值，则标记为第三判断数值F；同时，第一判断条件对应的第一权重的权重值为a、第二判断条件对应的第二权重的权重值为b、第三判断条件对应的对应的第三权重的权重值为c。

那么，当用户的第二特征数据均满足上述三个判断条件的三个阈值时，则其最后的匹配结果可为：a*A+b*C+c*E。如此类推，可匹配得到各个用户对应的匹配结果。

在本示例性实施例中，所述用户行为至少包括浏览内容的第一行为和执行与浏览内容相关联的第二行为，执行所述用户行为的用户至少包括执行所述第一行为未执行所述第二行为的用户以及执行所述第一行为和所述第二行为的用户，所述第二行为不同于所述第一行为。

在对机器学习模型的训练时，采集的第一流数据来自执行第一行为未执行第二行为的用户产生的用户行为和同时执行了第一行为和第二行为的用户产生的用户行为。通过不同用户的行为数据的对比训练，将大大提高机器学习模型的训练质量和效果，有助于提高训练后的机器学习模型对后续用户行为的预测准确率。因为在对执行第一行为未执行第二行为的用户进行发生第二行为的概率预测时，仅采集同时发生第一行为和第二行为的用户产生的用户行为数据，无法确定出第一行为和第二行为之间的关联关系，即在第一行为在何种状态时能够触发用户产生第二行为。但通过对比训练，能够确定出第一行为在何种状态时能够触发用户产生第二行为，从而训练出能够通过第一行为预测用户第二行为的发生概率的机器学习模型，提高训练后的机器学习模型对后续用户行为的预测准确率，提高机器学习模型的训练质量。

在一些实施例中，所述匹配参数还包括与对机器学习模型进行训练时的时间段相关的权重；

在对机器学习模型进行训练来更新匹配参数时，用户行为流数据提取的第一特征数据可以包括多个时间段提取的数据，用于更新多个时间段分别对应的匹配参数；

所述将所述第二特征数据与更新后的所述匹配参数进行匹配，得到匹配结果，包括：

将所述第二特征数据与多个时间段内更新后的所述匹配参数进行匹配，得到多个时间段内的匹配结果；

基于所述多个时间段内的匹配结果以及各时间段对应的权重，获得当下时刻的匹配结果。

例如，多个时间段包括当下时刻之前的第一时间段、第二时间段、第三时间段。第一时间段比第二时间段更靠近当下时刻，第二时间段比第三时间段更靠近当下时刻。同时第一时间段对应的权重为第四权重d，第二时间段对应的权重为第五权重e，第三时间段对应的权重为第六权重f。第一时间段内第二特征数据与更新后的所述匹配参数的匹配结果为X1；第二时间段内第二特征数据与更新后的所述匹配参数的匹配结果为X2；第三时间段内第二特征数据与更新后的所述匹配参数的匹配结果为X3；则当下时刻匹配结果为：d*X1+e*X2+f*X3。

同时，越接近当下时刻的时间段，对最终用户行为潜力等级的预测越重要，该时间段对用户行为潜力等级的预测影响越大。因此，越接近当下时刻的时间段对应的权重越大。例如，第一时间段对应的第四权重大于第二时间段对应的第五权重；第二时间段对应的第五权重大于第三时间段对应的第六权重。

在本示例性实施例中，匹配参数的更新可实时进行，对信息的推送也可实时进行。第一特征数据为实时提取，并输入机器学习模型中来实时更新匹配参数，以保证第二特征参数与匹配参数的匹配结果在当前环境下的准确性，从而有利于提高信息推送的服务质量。

根据所述行为潜力，进行用户分类的信息推送。

在本示例性实施例中，基于上述匹配参数匹配后，得到匹配结果。由上述实施例可知，可将第二特征数据是否满足判断条件中的阈值的判断结果数值化。例如满足时，结果为2；不满足结果为1等。如此，可得到用数值大小表示的匹配结果。

然后，根据匹配结果的数值大小，确定出待进行信息推送的用户的行为潜力的等级。例如，不同匹配结果的数值对应不同的行为潜力等级。例如，匹配结果为80％，则对应一级行为潜力等级；匹配结果为50％，对应二级行为潜力等级等。匹配结果的数值较大表示该用户的行为潜力较大，即执行一种确定行为的意愿程度较高(例如，购买某一个产品或服务的意愿较高)。匹配结果的数值较小表示该用户的行为潜力较小，即执行一种确定行为的意愿程度较低(例如，购买某一个产品或服务的意愿较低)。根据用户的行为潜力，进行用户分类的信息推送。即根据用户对一种确定行为的意愿程度(例如，购买某一个产品或服务的意愿程度)，进行用户分类的信息推送。通过用户行为潜力的判断，并根据行为潜力的不同程度，进行用户分类信息推送，相对于不对用户的行为潜力做区分，进行盲目的信息推送，有利于实现针对性的更精确的信息推送，有效提高信息推送的服务质量。

所述根据所述行为潜力，进行用户分类的信息推送，包括：

在本示例性实施例中，用户的行为潜力包括多个等级。不同等级的行为潜力表征用户执行所述确定行为的意愿程度不同。例如，用户的行为潜力的等级可包括一级、二级和三级。一级行为潜力表征的用户执行确定行为的意愿程度大于二级行为潜力表征的用户执行确定行为的意愿程度；二级行为潜力表征的用户执行确定行为的意愿程度大于三级行为潜力表征的用户执行确定行为的意愿程度。

根据用户的所述行为潜力，向所述用户推送与所述行为潜力的等级对应的信息。即如果用户的行为潜力等级为一级，则向用户推送与一级行为潜力对应的第一类信息。如果用户的行为潜力等级为二级，则向用户推送与二级行为潜力对应的第二类信息。第一类信息中包含的信息量大于第二类信息中包含的信息量。对行为潜力等级高的用户推送信息量较高的信息，对行为潜力等级低的用于推送信息量较低的信息，有利于节约资源的情况下，实现有限资源的价值最大化。例如，用户的行为潜力表征为购买某一产品的意愿。显然，将有限的资源向购买意愿强的用户倾斜，更有利于产品的推广和销售。

所述进行信息推送，包括：

在本示例性实施例中，第一行为可以包括对广告信息的浏览、对视频的观看、对产品信息的阅读等行为。

第二行为可以包括以下行为中的一种：

购买所述浏览内容所涉及产品的购买行为；

订阅所述浏览内容所关联主题或专栏的订阅行为；

转发所述浏览内容的转发行为；

评价所述浏览内容的评价行为。

在本示例性实施例中，用于提取第一特征数据的流数据可以包括用户第一行为产生的流数据和第二行为产生的流数据。第一行为对应的第一特征数据可以包括用户的年龄、用户的性别、日平均浏览时长、日平均点击次数、注册时长、浏览的信息类型等。第二行为对应的第一特征数据可以包括历史购买记录、历史订阅记录、历史转发记录、历史评价记录等。

在本示例性实施例中，所述浏览内容所涉及产品包括商品和/或，服务。在一些实施例中，所述基于所述第一特征数据，在线训练机器学习模型，包括：

通过用户第一行为和第二行为产生的流数据中提取的第一特征数据来在线训练机器学习模型。

在本申请中，通过信息推送触发用户触发第二行为是信息推送的最终目的。即触发用户对产品进行购买、对专栏进行订阅、转发或评价是信息推送的最终目的。

基于训练后的机器学习模型，进行信息推送，是为了在众多的浏览用户里通过训练后的机器学习模型，有效的预测出愿意去执行第二行为的行为潜力较大的用户。然后向这些用户推送信息，触发用户产生第二行为。

同时，为了得到能够更好的预测出上述行为潜力较大的用户的机器学习模型，在对机器学习模型进行训练更新模型中的匹配参数时，选用的流数据需包括用户第一行为产生的流数据和用户第二行为产生的流数据。

在一些实施例中，所述通过用户第一行为和第二行为产生的流数据包括：

完成过第一行为和第二行为的用户产生的流数据，以及仅完成过第一行为未完成第二行为的用户产生的流数据。

如此，通过上述第一流数据提取出的第一特征数据训练的机器学习模型才能更好的预测出行为潜力较大的用户。因为在进行机器学习模型训练时，需要以结果为导向逆向训练判断条件相关的匹配参数。只有对完成过第二行为的用户产生的流数据中提取的第一特征数据和未完成第二行为的用户产生的流数据中提取的第一特征数据进行对比综合训练，才能更好的训练机器学习模型。

在本示例性实施例中，机器学习模型中的判断条件可以包括上述实施例中的第一判断条件、第二判断条件、第三判断条件等。

第一判断条件可以为用户年龄判断，对应的阈值可以是年龄阈值。例如，判断用户的年龄是否在18～60岁之间，或者是否在20～40岁之间等等。通过年龄判断可大概判断该用户的支付潜力等等。

第二判断条件可以为用户平均浏览时间，对应的阈值可以是2～3个小时，或者4～5个小时等等。用户日平均浏览时间越长，表示该用户对该产品或服务的兴趣越大，则其购买的可能性相对越大。

第三判断条件可以是日平均点击次数，阈值可以是20～30次，或30～40次等。用户日平均点击次数越大，也可表示该用户对该产品或服务的兴趣越大，则其购买的可能性相对越大。此处判断条件仅仅是示例性的。除此以外，还可以包括很多，此处不再一一列举。

在本示例性实施例中，由于不同的判断条件对预测用户行为潜力的重要程度不同，因此各判断条件可对应增加权重，以更准确的预测用户的行为潜力。

在一些实施例中，所述用户标签包括：

用户的年龄和用户的性别中的至少一种。

在本示例性实施例中，用户标签可以是与用户本身相关的信息。用户的年龄和用户的性别仅是与用户本身相关的部分信息。除此以外，还可以包括很多。此处仅仅是示例性的，不再一一列举。上述用户标签对应的第一特征数据可用于有效训练机器学习模型，更新匹配参数。

在一些实施例中，所述用户标签对应的行为标签包括：

在本示例性实施例中，用户标签对应的行为标签可以是用户在互联网平台上与网页操作相关的行为信息。日平均浏览时长、日平均点击次数、注册时长、历史购买记录以及浏览的信息类型仅表示用户标签中的部分信息。除此以外，还可以包括很多。此处仅仅是示例性的，不再一一列举。上述行为标签对应的第一特征数据可用于有效训练机器学习模型，更新匹配参数。

图2是根据一示例性实施例示出的基于流数据处理的信息推送方法的方法流程图二。所述方法包括：

步骤20、用户行为处理，具体包括：从基于用户行为产生的第一流数据实时提取出第一特征数据，其中，所述第一特征数据包括：用户标签和与用户标签对应的行为标签；

步骤21、流数据在线学习，具体包括：基于所述第一特征数据，在线训练机器学习模型；

步骤22、根据训练结果预测匹配，具体包括：基于训练后的所述机器学习模型(即训练结果)，进行信息推送。

另一方面，本申请还提供一种基于流数据处理的信息推送装置。图3是根据一示例性实施例示出的基于流数据处理的信息推送装置结构示意图。如图3所示，所述装置包括：

在本示例性实施例中，信息推送方法可应用于互联网信息推送平台。用户行为可以为互联网页面的操作行为，包括打开网页、点击网页中的信息标签、播放广告信息、观看网站视频等。

在本示例性实施例中，机器学习模型可以是快速决策树，决策树(Decision Tree)是机器学习中一种常见的算法。决策树是一种基本的分类与回归方法，当被用于分类时叫做分类树，被用于回归时叫做回归树。决策树在逻辑上表现为树的形式，包含有节点和向边。一般情况下，一棵决策树包含一个根节点、若干个内部节点和若干个叶结点。

本申请实施例的基于流数据处理的信息推送装置包括数据提取模块、在线学习模块和信息推送模块。数据提取模块用于在用户行为产生的第一流数据中实时提取第一特征数据，并在线学习模块用于通过第一特征数据在线训练机器学习模型，以及信息推送模块用于通过训练后的机器学习模型进行信息推送。本申请中利用流数据快速连续的动态特性，通过流数据进行实时处理的方式进行机器学习模型在线训练，能够保证进行机器学习模型训练的数据为最新产生的有效数据，相对于传统的对数据进行存储，在通过存储的数据进行机器学习模型训练，可大大提高机器学习模型训练的实时性和有效性。因为存储的数据在时限上存在滞后的可能。尤其是信息推送服务领域，信息推送的时效性很强，如果采用存储的数据进行训练，训练的结果可能会滞后，会影响信息推送服务的服务质量。然而，采用本申请中通过流数据进行实时处理的方式进行机器学习模型在线训练，再通过训练后的机器学习模型，进行信息推送，可大大提高模型训练的实时性和信息推送服务的有效性，进而提高信息推送服务的服务质量。

基于所述匹配结果，进行所述信息推送。

在本示例性实施例中，匹配参数为用于匹配第二特征数据，得到匹配结果的相关数据。当机器学习模型采用决策树时，匹配参数可以为决策树模型中与各个内部节点的判断条件相关的参数，包括各个判断条件的阈值，或当各个判断条件具有关联性时，各个判断条件对应的权重等。即通过模型训练，更新各个内部节点的判断条件具体为更新与各个判断条件相关的匹配参数。

在本示例性实施例中，匹配参数包括与多个判断条件相关的参数(阈值及权重)。所述将所述第二特征数据与更新后的所述匹配参数进行匹配，包括将所述第二特征数据与更新后的多个不同的所述匹配参数进行匹配。即基于用于行为产生的流数据提取出的第二特征数据需要在机器学习模型的判断条件中与各匹配参数均进行匹配，以得到多个不同的匹配结果。各匹配结果均可由条件判断后的具体数值表示。

那么，当用户的第二特征数据均满足上述三个判断条件的三个阈值时，则其最后的匹配结果可为：a*A+b*C+c*E。如此类推，可匹配得到各个用户对应的匹配结果。在一些实施例中，所述匹配参数还包括与对机器学习模型进行训练时的时间段相关的权重；

根据所述行为潜力，进行用户分类的信息推送。

在本示例性实施例中，基于上述匹配参数匹配后，得到匹配结果。根据匹配结果的数值大小，确定出待进行信息推送的用户的行为潜力。匹配结果的数值较大表示该用户的行为潜力较大，即执行一种确定行为的意愿程度较高(例如，购买某一个产品或服务的意愿较高)。匹配结果的数值较小表示该用户的行为潜力较小，即执行一种确定行为的意愿程度较低(例如，购买某一个产品或服务的意愿较低)。根据用户的行为潜力，进行用户分类的信息推送。即根据用户对一种确定行为的意愿程度(例如，购买某一个产品或服务的意愿程度)，进行用户分类的信息推送。通过用户行为潜力的判断，并根据行为潜力的不同程度，进行用户分类信息推送，相对于不对用户的行为潜力做区分，进行盲目的信息推送，有利于实现针对性的更精确的信息推送，有效提高信息推送的服务质量。

在本示例性实施例中，

所述第二行为至少包括以下行为中的一种：

购买所述浏览内容所涉及产品的购买行为；

订阅所述浏览内容所关联主题或专栏的订阅行为；

转发所述浏览内容的转发行为；

评价所述浏览内容的评价行为。

在一些实施例中，所述用户标签包括：

用户的年龄和用户的性别中的至少一种。

在一些实施例中，所述用户标签对应的行为标签包括：

本申请还提供一种服务器。图4是根据一示例性实施例示出的服务器结构示意图。如图4所示，本申请实施例提供的服务器，包括：处理器430和用于存储能够在处理器上运行的计算机程序的存储器420，其中，所述处理器430用于运行所述计算机程序时，执行上述各实施例提供所述方法的步骤。

本申请还提供一种计算机可读存储介质。本申请实施例提供的计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述各实施例提供所述方法的步骤。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理模块中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

在一些情况下，上述任一两个技术特征不冲突的情况下，可以组合成新的方法技术方案。

在一些情况下，上述任一两个技术特征不冲突的情况下，可以组合成新的设备技术方案。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种基于流数据处理的信息推送方法，其特征在于，包括：

基于所述第一特征数据，在线训练机器学习模型；

基于训练后的所述机器学习模型，进行信息推送。

2.根据权利要求1所述的信息推送方法，其特征在于，所述基于所述第一特征数据，在线训练机器学习模型，包括：

基于所述匹配结果，进行所述信息推送。

3.根据权利要求2所述的信息推送方法，其特征在于，

所述基于所述匹配结果，进行所述信息推送，包括：

根据所述行为潜力，进行用户分类的信息推送。

4.根据权利要求3所述的信息推送方法，其特征在于，所述行为潜力包括多个等级；不同等级的行为潜力表征用户执行所述确定行为的意愿程度不同；

所述根据所述行为潜力，进行用户分类的信息推送，包括：

5.根据权利要求1所述的信息推送方法，其特征在于，所述用户行为包括：浏览内容的第一行为和执行与浏览内容相关联的第二行为，其中，所述第二行为不同于所述第一行为；

所述进行信息推送，包括：

6.根据权利要求5所述的信息推送方法，其特征在于，所述第二行为至少包括以下行为中的一种：

购买所述浏览内容所涉及产品的购买行为；

订阅所述浏览内容所关联主题或专栏的订阅行为；

转发所述浏览内容的转发行为；

评价所述浏览内容的评价行为。

7.根据权利要求2-4任一项所述的信息推送方法，其特征在于，所述机器学习模型中包括多个判断条件；所述匹配参数至少包括各所述判断条件中的阈值以及各所述判断条件对应的权重。

8.一种基于流数据处理的信息推送装置，其特征在于，包括：

9.一种服务器，其特征在于，包括：处理器和用于存储能够在处理器上运行的计算机程序的存储器，其中，所述处理器用于运行所述计算机程序时，执行权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。