CN113810460A

CN113810460A - 无源光网络的应用程序推送方法及其系统和电子设备

Info

Publication number: CN113810460A
Application number: CN202110869076.8A
Authority: CN
Inventors: 杜香枝
Original assignee: Baizhen Shanghai Network Technology Co ltd
Current assignee: Baizhen Shanghai Network Technology Co ltd
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2021-12-17

Abstract

公开了一种无源光网络的应用程序推送方法及其系统和电子设备，其以基于深度神经网络的人工智能技术仅从无源光网络的用户流量数据中挖掘出用户在使用应用程序的过程中的一些固有模式，以此来进行应用程序的推荐。这样，以基于深度神经网络的人工智能技术依据无源光网络中的流量数据进行用户分类，从而向用户推送适当的应用程序。

Description

无源光网络的应用程序推送方法及其系统和电子设备

技术领域

本申请涉及通信领域，且更为具体地，涉及一种无源光网络的应用程序推送方法、无源光网络的应用程序推送系统和电子设备。

背景技术

无源光网络(Passive Optical Network：PON)指的是在光线路终端(OpticalLine Terminal：OLT)和光网络单元(Optical Network Unit：ONU)之间的光分配网络(Optical Distribution Network：ODN)，其没有任何有源电子设备。

目前，应用程序推送主要依靠用户画像进行，也就是，基于用户对应用程序的各种使用数据以及用户的个人身份数据来对用户进行分类，从而进行应用程序的推荐，其本质上是一个推荐问题。

但是，如上所述，由于在无源光网络中没有任何有源电子设备，因此基于无源光网络仅能够得到用户的流量数据，因此，现有的推荐算法就不能应用于无源光网络的应用程序推送方案中。

因此，期望提供一种无源光网络的应用程序推送方案。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种无源光网络的应用程序推送方法、无源光网络的应用程序推送系统和电子设备，其以基于深度神经网络的人工智能技术仅从无源光网络的用户流量数据中挖掘出用户在使用应用程序的过程中的一些固有模式，以此来进行应用程序的推荐。这样，以基于深度神经网络的人工智能技术依据无源光网络中的流量数据进行用户分类，从而向用户推送适当的应用程序。

根据本申请的一个方面，提供了一种无源光网络的应用程序推送方法，其包括：

训练阶段，包括：

获取训练数据，所述训练数据为用户的数据流量；

将所述用户的数据流量按照时间维度构造为数值矩阵；

使用卷积神经网络从所述数值矩阵获得特征图；

将所述特征图通过具有用户分类标签的分类器以获得分类损失函数值；

基于先验知识，确定所述数值矩阵中对应于所述先验知识的预定区域；

将所述预定区域传导到所述卷积神经网络的各层中的相应区域，以确定所述卷积神经网络中对应的块结构；

将所述预定区域传导到所述特征图中以确定对应于所述预定区域的感兴趣区域；

计算所述感兴趣区域和与所述卷积神经网络的块结构对应的应用类型的标签值之间的交叉熵损失函数值；以及

基于所述交叉熵损失函数值和所述分类损失函数值对所述卷积神经网络进行基于块结构的训练；以及

预测阶段，包括：

获取待预测的用户的流量数据；

将所述用户的流量数据构造为输入数值矩阵并通过经训练阶段训练而得的所述卷积神经网络以获得分类特征图；以及

将所述分类特征图通过分类器以获得分类结果，其中，所述分类结果用于表示适于向用户推荐什么类型的应用程序。

在上述无源光网络的应用程序推送方法中，将所述用户的数据流量按照时间维度构造为数值矩阵，包括：以天为周期从所述用户的流量数据中获取一系列预定时间点的流量数据并构成为矩阵的一行；以及，将各天的所述流量数据按行排列，以构成所述数值矩阵。

在上述无源光网络的应用程序推送方法中，将所述特征图通过具有用户分类标签的分类器以获得分类损失函数值，包括：将所述特征图通过分类器以获得分类结果，所述分类结果用于表示所述特征图归属于用户分类标签的概率；以及，计算所述分类结果和真实值之间的交叉熵损失函数值作为所述分类损失函数值。

在上述无源光网络的应用程序推送方法中，将所述特征图通过分类器以获得分类结果，包括：将所述特征图通过一个或多个全连接层以通过所述一个或多个全连接层对所述特征图进行全位置编码，以获得分类特征向量；以及，将所述分类特征向量输入Softmax分类函数以获得所述分类结果。

在上述无源光网络的应用程序推送方法中，基于先验知识，确定所述数值矩阵中对应于所述先验知识的预定区域，包括：基于知识图谱，确定所述数值矩阵中的所述预定区域。

在上述无源光网络的应用程序推送方法中，基于所述交叉熵损失函数值和所述分类损失函数值对所述卷积神经网络进行训练，包括：在每一轮迭代中：

以所述交叉熵损失函数值通过梯度下降的反向传播的方式更新所述卷积神经网络中对应的块结构的参数；以及

以所述分类损失函数值通过梯度下降的反向传播的方式更新所述卷积神经网络的整体参数。

在上述无源光网络的应用程序推送方法中，所述卷积神经网络为深度残差网络。

根据本申请的另一方面，还提供了一种无源光网络的应用程序推送系统，其包括：

训练模块，包括：

训练数据单元，用于获取训练数据，所述训练数据为用户的数据流量；

矩阵构造单元，用于将所述用户的数据流量按照时间维度构造为数值矩阵；

空间卷积单元，用于使用卷积神经网络从所述数值矩阵获得特征图；

分类损失函数值计算单元，用于将所述特征图通过具有用户分类标签的分类器以获得分类损失函数值；

预定区域确定单元，用于基于先验知识，确定所述数值矩阵中对应于所述先验知识的预定区域；

块结构确定单元，用于将所述预定区域传导到所述卷积神经网络的各层中的相应区域，以确定所述卷积神经网络中对应的块结构；

感兴趣区域确定单元，用于将所述预定区域传导到所述特征图中以确定对应于所述预定区域的感兴趣区域；

交叉熵损失函数值计算单元，用于计算所述感兴趣区域和与所述卷积神经网络的块结构对应的应用类型的标签值之间的交叉熵损失函数值；及

训练单元，用于基于所述交叉熵损失函数值和所述分类损失函数值对所述卷积神经网络进行基于块结构的训练；以及

预测模块，包括：

待预测数据获取单元，用于获取待预测的用户的流量数据；

分类特征图生成单元，用于将所述用户的流量数据构造为输入数值矩阵并通过经训练阶段训练而得的所述卷积神经网络以获得分类特征图；及

推荐单元，用于将所述分类特征图通过分类器以获得分类结果，其中，所述分类结果用于表示适于向用户推荐什么类型的应用程序。

在上述无源光网络的应用程序推送系统中，所述矩阵构造单元，进一步用于：以天为周期从所述用户的流量数据中获取一系列预定时间点的流量数据并构成为矩阵的一行；以及，将各天的所述流量数据按行排列，以构成所述数值矩阵。

根据本申请的再一方面，提供了一种电子设备，包括：处理器；以及，存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的无源光网络的应用程序推送方法。

根据本申请的又一方面，提供了一种计算机可读介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的无源光网络的应用程序推送方法。

根据本申请提供的无源光网络的应用程序推送方法、无源光网络的应用程序推送系统和电子设备，其以基于深度神经网络的人工智能技术仅从无源光网络的用户流量数据中挖掘出用户在使用应用程序的过程中的一些固有模式，以此来进行应用程序的推荐。这样，以基于深度神经网络的人工智能技术依据无源光网络中的流量数据进行用户分类，从而向用户推送适当的应用程序。

附图说明

通过结合附图对本申请实施例进行更详细的描述，本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解，并且构成说明书的一部分，与本申请实施例一起用于解释本申请，并不构成对本申请的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1图示了根据本申请实施例的无源光网络的应用程序推送方法的场景示意图。

图2A图示了根据本申请实施例的无源光网络的应用程序推送方法中训练阶段的流程图。

图2B图示了根据本申请实施例的无源光网络的应用程序推送方法中预测阶段的流程图。

图3A图示了根据本申请实施例的无源光网络的应用程序推送方法中训练阶段的架构示意图。

图3B图示了根据本申请实施例的无源光网络的应用程序推送方法中预测阶段的架构示意图。

图4图示了根据本申请实施例的无源光网络的应用程序推送方法中，基于所述交叉熵损失函数值和所述分类损失函数值对所述卷积神经网络进行基于块结构的训练的流程图。

图5图示了根据本申请实施例的无源光网络的应用程序推送系统的框图。

图6图示了根据本申请实施例的无源光网络的应用程序推送系统中训练单元的框图。

图7图示了根据本申请实施例的电子设备的框图。

具体实施方式

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

场景概述

如前所述，目前，应用程序推送主要依靠用户画像进行，也就是，基于用户对应用程序的各种使用数据以及用户的个人身份数据来对用户进行分类，从而进行应用程序的推荐，其本质上是一个推荐问题。

但是，如上所述，由于在无源光网络中没有任何有源电子设备，因此基于无源光网络仅能够得到用户的流量数据，如何从这些流量数据来进行应用程序的推荐就成为需要考虑的问题。

本申请的申请人考虑到在用户使用应用程序的过程中，其数据流量也会存在一些固有模式，例如在工作时间主要运行的是工作应用，而下班时间会依据用户的个人身份运行特定引用，比如有子女的用户运行教育应用，而无子女的用户运行娱乐应用，比如游戏应用或者视频应用等，而这些数据流量的固有模式显然是与时间相关的。

因此，在使用流量数据时，本申请的申请人按照时间维度来构造流量数据的数值矩阵，具体地，以天为周期获取一系列预定时间点的流量数据构成为矩阵的一行，并将各天的数据按行排列构成为输入数值矩阵，然后将该输入数值矩阵输入卷积神经网络以获得特征图。

进一步地，为了能够充分发掘出数据中的隐藏模式，本申请中的卷积神经网络必须具有预定宽度和深度，而根据近来对于深度神经网络的研究，随着深度神经网络的宽度或者深度的增加，会出现深度神经网络中的块结构，即具有超过阈值的预定相似表示形式的多个连续层及其中的预定区块。这通过考察本申请中的数据属性也可以看出，也就是，流量数据会在一天中的某个时间表现出相似形式，且会在各天之中重复，例如，教育应用会在每天的19点到21点之间以及周一到周五的各天之中重复预定流量模式。

因此，在本申请的卷积神经网络的训练过程中，除了将特征图通过具有用户分类标签的分类器获得分类损失函数值，并基于分类损失函数值进行训练之外，还考虑卷积神经网络中的块结构。也就是，通过诸如知识图谱之类的方式确定输入数值矩阵中的预定区域，例如如上所述对应于周一到周五的19点到21点之间的区域，然后传导到卷积神经网络的各层中的相应区域，以确定卷积神经网络中对应的块结构，并传导到特征图以确定感兴趣区域。并且，由于基于本申请的数据性质，这种卷积神经网络中的块结构通常是与应用类型关联的，因此设置对应于不同应用类型的标签值，并以该标签值计算特征图中的感兴趣区域的交叉熵损失函数值，再通过反向传播的方式更新卷积神经网络中的对应的块结构。例如，基于分类损失函数值的卷积神经网络的整体参数更新和基于交叉熵损失函数值的局部参数更新可以交替进行。

这样，在完成卷积神经网络的训练之后，就可以依据无源光网络中的流量数据进行用户分类，从而向用户推送适当的应用程序。

基于此，本申请提出了一种无源光网络的应用程序推送方法，其包括训练阶段和预测阶段。相应地，训练阶段，包括步骤：获取训练数据，所述训练数据为用户的数据流量；将所述用户的数据流量按照时间维度构造为数值矩阵；使用卷积神经网络从所述数值矩阵获得特征图；将所述特征图通过具有用户分类标签的分类器以获得分类损失函数值；基于先验知识，确定所述数值矩阵中对应于所述先验知识的预定区域；将所述预定区域传导到所述卷积神经网络的各层中的相应区域，以确定所述卷积神经网络中对应的块结构；将所述预定区域传导到所述特征图中以确定对应于所述预定区域的感兴趣区域；计算所述感兴趣区域和与所述卷积神经网络的块结构对应的应用类型的标签值之间的交叉熵损失函数值；以及，基于所述交叉熵损失函数值和所述分类损失函数值对所述卷积神经网络进行基于块结构的训练。

相应地，预测阶段，包括步骤：获取待预测的用户的流量数据；将所述用户的流量数据构造为输入数值矩阵并通过经训练阶段训练而得的所述卷积神经网络以获得分类特征图；以及，将所述分类特征图通过分类器以获得分类结果，其中，所述分类结果用于表示适于向用户推荐什么类型的应用程序。

图1图示了根据本申请实施例的无源光网络的应用程序推送方法的场景示意图。如图1所示，在该应用场景中，在训练阶段中，首先获取训练数据，所述训练数据为用户在无源光网络(例如，如图1中所示意的C)中上行的数据流量；然后，将所述训练数据输入至部署有无源光网络的应用程序推送算法的服务器(例如，如图1中所示意的S)中，其中，所述服务器能够基于无源光网络的应用程序推送算法以所述训练数据对用于无源光网络的应用程序推送的卷积神经网络进行训练。

在训练完成后，在预测阶段中，获取待预测的用户在无源光网络(例如，如图1中所示意的C)中上行的流量数据；然后，将所述待预测用户的流量数据输入部署有无源光网络的应用程序推送算法的服务器(例如，如图1中所示意的S)，其中，所述服务器能够基于无源光网络的应用程序推送算法对所述待预测的用户的流量数据进行处理，以生成表示适于向用户推荐什么类型的应用程序的分类结果。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性方法

图2A图示了根据本申请实施例的无源光网络的应用程序推送方法中训练阶段的流程图。图2B图示了根据本申请实施例的无源光网络的应用程序推送方法中预测阶段的流程图。如图2A所示，根据本申请实施例的无源光网络的应用程序推送方法的训练阶段，包括步骤：S110，获取训练数据，所述训练数据为用户的数据流量；S120，将所述用户的数据流量按照时间维度构造为数值矩阵；S130，使用卷积神经网络从所述数值矩阵获得特征图；S140，将所述特征图通过具有用户分类标签的分类器以获得分类损失函数值；S150，基于先验知识，确定所述数值矩阵中对应于所述先验知识的预定区域；S160，将所述预定区域传导到所述卷积神经网络的各层中的相应区域，以确定所述卷积神经网络中对应的块结构；S170，将所述预定区域传导到所述特征图中以确定对应于所述预定区域的感兴趣区域；S180，计算所述感兴趣区域和与所述卷积神经网络的块结构对应的应用类型的标签值之间的交叉熵损失函数值；以及，S190，基于所述交叉熵损失函数值和所述分类损失函数值对所述卷积神经网络进行基于块结构的训练。

图3A图示了根据本申请实施例的无源光网络的应用程序推送方法中训练阶段的架构示意图。如图3A所示，在训练阶段的网络架构中，首先将获取的用户的数据流量(例如，如图3A中所示意的IN0)按照时间维度构造为数值矩阵(例如，如图3A中所示意的M)，具体地，可以天为周期从所述用户的流量数据中获取一系列预定时间点的流量数据并构成为矩阵的一行，接着，将各天的所述流量数据按行排列，通过这样的方式，将获取的用户的数据流量转化为所述数值矩阵。接着，使用卷积神经网络(例如，如图3A中所示意的CNN)从所述数值矩阵获得特征图(例如，如图3A中所示意的F)。然后，将所述特征图通过具有用户分类标签的分类器(例如，如图3A中所示意的分类器)以获得分类损失函数值。进而，基于先验知识(例如，知识图谱)，确定所述数值矩阵中对应于所述先验知识的预定区域(例如，如图3A中所示意的R1)，并将所述预定区域传导到所述卷积神经网络的各层中的相应区域，以确定所述卷积神经网络中对应的块结构(例如，如图3A中所示意的R2)，同时，将所述预定区域传导到所述特征图中以确定对应于所述预定区域的感兴趣区域(例如，如图3A中所示意的R3)。接着，计算所述感兴趣区域和与所述卷积神经网络的块结构对应的应用类型的标签值(例如，如图3A中所示意的L)之间的交叉熵损失函数值。最终，基于所述交叉熵损失函数值和所述分类损失函数值对所述卷积神经网络进行基于块结构的训练。

如图2B所示，根据本申请实施例的无源光网络的应用程序推送方法的预测阶段，包括步骤：S210，获取待预测的用户的流量数据；S220，将所述用户的流量数据构造为输入数值矩阵并通过经训练阶段训练而得的所述卷积神经网络以获得分类特征图；以及，S230，将所述分类特征图通过分类器以获得分类结果，其中，所述分类结果用于表示适于向用户推荐什么类型的应用程序。

图3B图示了根据本申请实施例的无源光网络的应用程序推送方法中预测阶段的架构示意图。如图3B所示，在预测阶段的网络架构中，首先将获取的待预测的用户的流量数据(例如，如图3B中所示意的IN1)构造为输入数值矩阵(例如，如图3B中所示意的M1)；接着，将所述输入数值矩阵通过经训练阶段训练而得的所述卷积神经网络(例如，如图3B中所示意的CNN)以获得分类特征图(例如，如图3B中所示意的Fc)。接着，将所述分类特征图通过分类器(例如，如图3B中所示意的分类器)以获得分类结果，其中，所述分类结果用于表示适于向用户推荐什么类型的应用程序。

更具体地，在训练阶段中，在步骤S110中，获取训练数据，所述训练数据为用户的数据流量。如前所述，无源光网络中没有任何有源电子设备。而目前，应用程序推送主要依靠用户画像进行，也就是，基于用户对应用程序的各种使用数据以及用户的个人身份数据来对用户进行分类，从而进行应用程序的推荐，其本质上是一个推荐问题。但是，由于在无源光网络中没有任何有源电子设备，因此基于无源光网络仅能够得到用户的流量数据。相应地，如何从这些流量数据来进行应用程序的推荐就成为需要考虑的问题。

相应地，针对上述技术问题，本申请发明人尝试基于深度神经网络的人工智能技术仅从无源光网络的用户流量数据中挖掘出用户在使用应用程序的过程中的一些固有模式，以此来进行应用程序的推荐。应可以理解，深度神经网络是端对端技术，其关键在于对深度神经网络进行训练，因此，需首先获取训练数据。

更具体地，在训练阶段中，在步骤S120中，将所述用户的数据流量按照时间维度构造为数值矩阵。在获得训练数据后，在本申请一个具体的示例中，按照时间维度来构造流量数据的数值矩阵，具体地，以天为周期获取一系列预定时间点的流量数据构成为矩阵的一行，并将各天的数据按行排列构成为输入数值矩阵。也就是，在本申请实施例中，将所述用户的数据流量按照时间维度构造为数值矩阵的过程，包括：首先以天为周期从所述用户的流量数据中获取一系列预定时间点的流量数据并构成为矩阵的一行；接着，将各天的所述流量数据按行排列，以构成所述数值矩阵。

更具体地，在训练阶段中，在步骤S130中，使用卷积神经网络从所述数值矩阵获得特征图。也就是，以卷积神经网络来对所述数值矩阵进行空间机制编码以挖掘出所述数值矩阵中的隐藏模式。在本申请一些具体的示例中，所述卷积神经网络可被实施为深度残差网络。

更具体地，在训练阶段中，在步骤S140中，将所述特征图通过具有用户分类标签的分类器以获得分类损失函数值。在本申请实施例中，将所述特征图通过具有用户分类标签的分类器以获得分类损失函数值的过程，包括：首先将所述特征图通过分类器以获得分类结果，所述分类结果用于表示所述特征图归属于用户分类标签的概率。接着，计算所述分类结果和真实值之间的交叉熵损失函数值作为所述分类损失函数值。

这里，将所述特征图通过分类器以获得分类结果的详细过程，包括：首先将所述特征图通过一个或多个全连接层以通过所述一个或多个全连接层对所述特征图进行全位置编码，以获得分类特征向量；然后，将所述分类特征向量输入Softmax分类函数以获得所述分类结果。

应可以理解，为了能够充分发掘出数据中的隐藏模式，本申请中的卷积神经网络必须具有预定宽度和深度，而根据近来对于深度神经网络的研究，随着深度神经网络的宽度或者深度的增加，会出现深度神经网络中的块结构，即具有超过阈值的预定相似表示形式的多个连续层及其中的预定区块。这通过考察本申请中的数据属性也可以看出，也就是，流量数据会在一天中的某个时间表现出相似形式，且会在各天之中重复，例如，教育应用会在每天的19点到21点之间以及周一到周五的各天之中重复预定流量模式。

因此，在本申请的卷积神经网络的训练过程中，除了将特征图通过具有用户分类标签的分类器获得分类损失函数值，并基于分类损失函数值进行训练之外，还考虑卷积神经网络中的块结构。

更具体地，在训练阶段中，在步骤S150中，基于先验知识，确定所述数值矩阵中对应于所述先验知识的预定区域。在本申请一个具体的示例中，通过诸如知识图谱之类的方式确定输入数值矩阵中的预定区域，例如如上所述对应于周一到周五的19点到21点之间的区域。

更具体地，在训练阶段中，在步骤S160中，将所述预定区域传导到所述卷积神经网络的各层中的相应区域，以确定所述卷积神经网络中对应的块结构。也就是，在基于先验知识确定所述数值矩阵中对应于所述先验知识的预定区域后，将所述预定区域传导到卷积神经网络的各层中的相应区域，以确定卷积神经网络中对应的块结构。

更具体地，在训练阶段中，在步骤S170中，将所述预定区域传导到所述特征图中以确定对应于所述预定区域的感兴趣区域。也就是，在基于先验知识确定所述数值矩阵中对应于所述先验知识的预定区域后，同时将所述预定区域传导到特征图以确定感兴趣区域。

更具体地，在训练阶段中，在步骤S180中，计算所述感兴趣区域和与所述卷积神经网络的块结构对应的应用类型的标签值之间的交叉熵损失函数值。应可以理解，在本申请实施例中，基于本申请的数据性质，这种卷积神经网络中的块结构通常是与应用类型关联的，因此设置对应于不同应用类型的标签值，并以该标签值计算特征图中的感兴趣区域的交叉熵损失函数值，再通过反向传播的方式更新卷积神经网络中的对应的块结构。

更具体地，在训练阶段中，在步骤S190中，基于所述交叉熵损失函数值和所述分类损失函数值对所述卷积神经网络进行基于块结构的训练。在本申请一个具体的示例中，可基于分类损失函数值的卷积神经网络的整体参数更新和基于交叉熵损失函数值的局部参数更新可以交替进行。具体地，在每一轮迭代中：首先以所述交叉熵损失函数值通过梯度下降的反向传播的方式更新所述卷积神经网络中对应的块结构的参数；然后，以所述分类损失函数值通过梯度下降的反向传播的方式更新所述卷积神经网络的整体参数。

图4图示了根据本申请实施例的无源光网络的应用程序推送方法中，基于所述交叉熵损失函数值和所述分类损失函数值对所述卷积神经网络进行基于块结构的训练的流程图。如图4所示，在本申请实施例中，基于所述交叉熵损失函数值和所述分类损失函数值对所述卷积神经网络进行基于块结构的训练，包括：在每一轮迭代中：S310，以所述交叉熵损失函数值通过梯度下降的反向传播的方式更新所述卷积神经网络中对应的块结构的参数；以及，S320，以所述分类损失函数值通过梯度下降的反向传播的方式更新所述卷积神经网络的整体参数。

在训练完成后，进入预测阶段。也就是，在完成卷积神经网络的训练之后，就可以依据无源光网络中的流量数据进行用户分类，从而向用户推送适当的应用程序。

更具体地，在预测阶段中，首先获取待预测的用户的流量数据。接着，将所述用户的流量数据构造为输入数值矩阵并通过经训练阶段训练而得的所述卷积神经网络以获得分类特征图。接着，将所述分类特征图通过分类器以获得分类结果，其中，所述分类结果用于表示适于向用户推荐什么类型的应用程序。

综上，基于本申请实施例的无源光网络的应用程序推送方法被阐明，其以基于深度神经网络的人工智能技术仅从无源光网络的用户流量数据中挖掘出用户在使用应用程序的过程中的一些固有模式，以此来进行应用程序的推荐。这样，以基于深度神经网络的人工智能技术依据无源光网络中的流量数据进行用户分类，从而向用户推送适当的应用程序。

示例性系统

图5图示了根据本申请实施例的无源光网络的应用程序推送系统的框图如图5所示，根据本申请实施例的无源光网络的应用程序推送系统500，包括：训练模块600和预测模块700。

相应地，如图5所示，所述训练模块600，包括：训练数据单元610，用于获取训练数据，所述训练数据为用户的数据流量；矩阵构造单元620，用于将所述用户的数据流量按照时间维度构造为数值矩阵；空间卷积单元630，用于使用卷积神经网络从所述数值矩阵获得特征图；分类损失函数值计算单元640，用于将所述特征图通过具有用户分类标签的分类器以获得分类损失函数值；预定区域确定单元650，用于基于先验知识，确定所述数值矩阵中对应于所述先验知识的预定区域；块结构确定单元660，用于将所述预定区域传导到所述卷积神经网络的各层中的相应区域，以确定所述卷积神经网络中对应的块结构；感兴趣区域确定单元670，用于将所述预定区域传导到所述特征图中以确定对应于所述预定区域的感兴趣区域；交叉熵损失函数值计算单元680，用于计算所述感兴趣区域和与所述卷积神经网络的块结构对应的应用类型的标签值之间的交叉熵损失函数值；以及，训练单元690，用于基于所述交叉熵损失函数值和所述分类损失函数值对所述卷积神经网络进行基于块结构的训练。

相应地，如图5所示，所述预测模块700，包括：待预测数据获取单元710，用于获取待预测的用户的流量数据；分类特征图生成单元720，用于将所述用户的流量数据构造为输入数值矩阵并通过经训练阶段训练而得的所述卷积神经网络以获得分类特征图；以及，推荐单元730，用于将所述分类特征图通过分类器以获得分类结果，其中，所述分类结果用于表示适于向用户推荐什么类型的应用程序。

在一个示例中，在上述应用程序推送系统500中，所述矩阵构造单元620，进一步用于：以天为周期从所述用户的流量数据中获取一系列预定时间点的流量数据并构成为矩阵的一行；以及，将各天的所述流量数据按行排列，以构成所述数值矩阵

在一个示例中，在上述应用程序推送系统500中，所述分类损失函数值计算单元640，进一步用于：将所述特征图通过分类器以获得分类结果，所述分类结果用于表示所述特征图归属于用户分类标签的概率；以及，计算所述分类结果和真实值之间的交叉熵损失函数值作为所述分类损失函数值。

在一个示例中，在上述应用程序推送系统500中，所述分类损失函数值计算单元640，进一步用于：将所述特征图通过一个或多个全连接层以通过所述一个或多个全连接层对所述特征图进行全位置编码，以获得分类特征向量；以及，将所述分类特征向量输入Softmax分类函数以获得所述分类结果。

在一个示例中，在上述应用程序推送系统500中，所述预定区域确定单元650，进一步用于：基于知识图谱，确定所述数值矩阵中的所述预定区域。

在一个示例中，在上述应用程序推送系统500中，如图6所示，所述训练单元690，包括：块结构训练子单元691，用于在每一轮迭代中，以所述交叉熵损失函数值通过梯度下降的反向传播的方式更新所述卷积神经网络中对应的块结构的参数；以及，整体训练子单元692，用于以所述分类损失函数值通过梯度下降的反向传播的方式更新所述卷积神经网络的整体参数。

在一个示例中，在上述应用程序推送系统500中，所述卷积神经网络为深度残差网络。

这里，本领域技术人员可以理解，上述应用程序推送系统500中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的无源光网络的应用程序推送方法的描述中得到了详细介绍，并因此，将省略其重复描述。

如上所述，根据本申请实施例的应用程序推送系统500可以实现在各种终端设备中，例如无源光网络的应用程序推送的服务器等。在一个示例中，根据本申请实施例的应用程序推送系统500可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如，该应用程序推送系统500可以是该终端设备的操作系统中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该应用程序推送系统500同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该应用程序推送系统500与该终端设备也可以是分立的设备，并且该应用程序推送系统500可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

示例性电子设备

下面，参考图7来描述根据本申请实施例的电子设备。

图7图示了根据本申请实施例的电子设备的框图。如图7所示，电子设备10包括一个或多个处理器11和存储器12。

处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器11可以运行所述程序指令，以实现上文所述的本申请的各个实施例的无源光网络的应用程序推送方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如训练数据、分类结果等各种内容。

在一个示例中，电子设备10还可以包括：输入装置13和输出装置14，这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

该输入装置13可以包括例如键盘、鼠标等等。

该输出装置14可以向外部输出各种信息，包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图7中仅示出了该电子设备10中与本申请有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备10还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外，本申请的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的无源光网络的应用程序推送方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本申请的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的无源光网络的应用程序推送方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种无源光网络的应用程序推送方法，其特征在于，包括：

训练阶段，包括：

获取训练数据，所述训练数据为用户的数据流量；

将所述用户的数据流量按照时间维度构造为数值矩阵；

使用卷积神经网络从所述数值矩阵获得特征图；

预测阶段，包括：

获取待预测的用户的流量数据；

2.根据权利要求1所述的无源光网络的应用程序推送方法，其中，将所述用户的数据流量按照时间维度构造为数值矩阵，包括：

以天为周期从所述用户的流量数据中获取一系列预定时间点的流量数据并构成为矩阵的一行；以及

将各天的所述流量数据按行排列，以构成所述数值矩阵。

3.根据权利要求1所述的无源光网络的应用程序推送方法，其中，将所述特征图通过具有用户分类标签的分类器以获得分类损失函数值，包括：

将所述特征图通过分类器以获得分类结果，所述分类结果用于表示所述特征图归属于用户分类标签的概率；以及

计算所述分类结果和真实值之间的交叉熵损失函数值作为所述分类损失函数值。

4.根据权利要求3所述的无源光网络的应用程序推送方法，其中，将所述特征图通过分类器以获得分类结果，包括：

将所述特征图通过一个或多个全连接层以通过所述一个或多个全连接层对所述特征图进行全位置编码，以获得分类特征向量；以及

将所述分类特征向量输入Softmax分类函数以获得所述分类结果。

5.根据权利要求1所述的无源光网络的应用程序推送方法，其中，基于先验知识，确定所述数值矩阵中对应于所述先验知识的预定区域，包括：

基于知识图谱，确定所述数值矩阵中的所述预定区域。

6.根据权利要求1所述的无源光网络的应用程序推送方法，其中，基于所述交叉熵损失函数值和所述分类损失函数值对所述卷积神经网络进行基于块结构的训练，包括：在每一轮迭代中：

7.根据权利要求1所述的无源光网络的应用程序推送方法，其中，所述卷积神经网络为深度残差网络。

8.一种无源光网络的应用程序推送系统，其特征在于，包括：

训练模块，包括：

预测模块，包括：

待预测数据获取单元，用于获取待预测的用户的流量数据；

9.根据权利要求8所述的无源光网络的应用程序推送系统，其中，所述矩阵构造单元，进一步用于：以天为周期从所述用户的流量数据中获取一系列预定时间点的流量数据并构成为矩阵的一行；以及，将各天的所述流量数据按行排列，以构成所述数值矩阵。

10.一种电子设备，包括：

处理器；以及

存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1-7中任一项所述的无源光网络的应用程序推送方法。