WO2022001480A1

WO2022001480A1 - 热门应用识别方法、网络系统、网络设备及存储介质

Info

Publication number: WO2022001480A1
Application number: PCT/CN2021/095422
Authority: WO
Inventors: 江舟; 连超
Original assignee: 中兴通讯股份有限公司
Priority date: 2020-06-28
Filing date: 2021-05-24
Publication date: 2022-01-06
Also published as: CN113852565A

Abstract

一种热门应用识别方法、网络系统、网络设备及存储介质。其中，热门应用识别方法包括：获取来自IPDR的合并流数据，从合并流数据中筛选出对应同一个应用的目标流数据，根据目标流数据确定目标应用；获取目标应用的流量变化趋势，根据流量变化趋势对目标应用进行热门应用识别，获取由IPDR采集的合并流数据，并从合并流数据中筛选出对应同一个应用的目标流数据进而确定目标应用，再获取该目标应用的流量变化趋势，根据流量变化趋势对目标应用进行热门应用识别。

Description

热门应用识别方法、网络系统、网络设备及存储介质

相关申请的交叉引用

本申请基于申请号为202010599481.8、申请日为2020年06月28日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请涉及通信技术领域，特别是涉及一种热门应用识别方法、网络系统、网络设备及存储介质。

背景技术

随着移动互联网的发展，流量经营逐渐演变成一个重要经营方向。流量经营是以智能管道(物理网络)和聚合平台(商业网络)为基础，以扩大流量规模、提升流量层次、丰富流量内涵为经营方向，以释放流量价值为目的的一系列理念、策略和行动的集合。流量经营分析一个重要的基础数据就是要获得应用的热度，并用以对不同热度的应用制定对应的营销策略，有助于提升营收和竞争能力。

目前，热门应用识别需要基于对应用热度进行统计，而对应用热度进行统计主要靠DPI(Deep Packet Inspection，深度报文检测)完成，利用DPI进行应用热度统计需要先基于DPI的应用类型识别结果，而利用DPI识别应用类型需要依赖特征库，目前特征库的更新主要方式是由系统维护人员人工发现并添加新的应用数据,由于应用的数量每天都在大量增长，特征库的更新速度无法完全与应用数量的增长速度相匹配，因此在应用数量增长较快的情形下，仅由维护人员人工发现并添加新的应用数据无法及时获得对应的应用类型，也就无法进行应用热度的统计，使得应用热度统计变得滞后，不利于及时发现新的热门应用。

发明内容

以下是对本文详细描述的主题的概述，本概述并非是为了限制权利要求的保护范围。

本申请实施例提供了一种热门应用识别方法、网络系统、网络设备及存储介质。

第一方面，本申请实施例提供了一种热门应用识别方法，所述方法包括：获取来自网际协议信息记录IPDR的合并流数据，其中，所述合并流数据包括用户签约数据和用户会话数据；从所述合并流数据中筛选出对应同一个应用的目标流数据，根据所述目标流数据确定目标应用；获取所述目标应用的流量变化趋势，根据所述流量变化趋势为增长趋势，将所述目标应用识别为热门应用。

第二方面，本申请实施例还提供了一种热门应用识别方法，所述方法包括：获取用户签约数据和用户会话数据；将所述用户签约数据和所述用户会话数据合并得到合并流数据；将所述合并流数据发送至NWDAF，以供所述NWDAF从所述合并流数据中筛选出对应同一个应用的目标流数据后根据所述目标流数据确定目标应用，以及获取所述目标应用的流量变化趋势并根据所述流量变化趋势为增长趋势，将所述目标应用识别为热门应用。

第三方面，本申请实施例还提供了一种网络系统，包括NWDAF和IPDR，其中：所述IPDR被设置为获取用户签约数据和用户会话数据并将所述用户签约数据和所述用户会话数据合并得到合并流数据；所述NWDAF连接所述IPDR，以从所述IPDR获取所述合并流数据，并从所述合并流数据中筛选出对应同一个应用的目标流数据后根据所述目标流数据确定目标应用，以及获取所述目标应用的流量变化趋势并根据所述流量变化趋势为增长趋势，将所述目标应用识别为热门应用。

第四方面，本申请实施例还提供了一种网络设备，包括第三方面所述的网络系统；或者，包括至少一个处理器和被设置为与所述至少一个处理器通信连接的存储器；所述存储器存储有能够被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如第一方面或者第二方面所述的热门应用识别方法。

第五方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令被设置为使计算机执行第一方面或者第二方面所述的热门应用识别方法。

本申请的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请而了解。本申请的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本申请技术方案的进一步理解，并且构成说明书的一部分，与本申请的实施例一起用于解释本申请的技术方案，并不构成对本申请技术方案的限制。

图1是本申请实施例提供的在一些情形下5G网络架构示意图；

图2是本申请实施例提供的5G网络架构示意图；

图3是本申请实施例提供的IPDR侧的热门应用识别方法的流程图；

图4是本申请实施例提供的将用户签约数据和用户会话数据合并得到合并流数据的具体步骤流程图；

图5是本申请实施例提供的NWDAF侧的热门应用识别方法的流程图；

图6是本申请实施例提供的从合并流数据中筛选出对应同一个应用的目标流数据的具体步骤流程图；

图7是本申请实施例提供的筛选出被相同用户群体访问同一个应用所产生的流数据的具体步骤流程图；

图8是本申请实施例提供的获取目标应用的流量变化趋势，根据流量变化趋势为增长趋势，将目标应用识别为热门应用的具体步骤流程图；

图9是本申请实施例提供的热门应用识别方法的具体例子的流程图；

图10是本申请实施例提供的一种网络设备的结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

应了解，在本申请实施例的描述中，多个(或多项)的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。如果有描述到“第一”、“第二”等只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。

在3GPP R16的eNA(Study of Enablers for Network Automation for 5G)课题中，提出了NWDAF(Network Data Analytics Function，网络数据分析功能)的概念，具体来说，NWDAF可以从特定的NF(Network Function，网络功能)、OAM(Operation Administration and Maintenance，网管系统)或AF(Application Function，应用功能)收集特定的数据，经过一定的大数据分析网元得出一定的分析结果，并把该结果按需发送给特定的NF、OAM或AF，NWDAF是实现网络智能化非常关键的网络功能。IPDR(Internet Protocol Detail Record，IP信息记录)是IP溯源系统，被设置为进行IP溯源。

参照图1，为现有的5G网络架构示意图，参照图2，为应用本申请实施例提供的网络系统应用在5G网络的架构示意图，其中，本申请实施例提供的网络系统包括NWDAF和IPDR，基于本申请提供的热门应用识别方法，本申请实施例在原有的5G网络架构的基础上，在IPDR增加接收UDM用户数据签约信息的能力，在NWDAF增加接收外部网元汇聚数据的能力，即接收来自IPDR的数据流，其中，NWDAF和IPDR可以分别设置于不同的网络设备上，或者，NWDAF和IPDR也可以同时设置在同一台网络设备中。

基于图2所示的网络架构，本申请实施例提供一种热门应用识别方法、网络系统、网络设备及存储介质，能够提高热门应用识别的时效性。

参照图3，本申请实施例提供了一种热门应用识别方法，应用于IPDR，包括但不限于以下步骤301至步骤303：

步骤301：获取用户签约数据和用户会话数据；

在一实施例中，基于图2所示的网络架构，用户签约数据可以从UDM(Unified Data Manager，统一数据管理)获取，其中，UDM为用户签约数据的永久存放地点，位于用户签约的归属网。

在一实施例中，用户签约数据可以包括但不限于IMSI、年龄、性别、地域、职业等。

在一实施例中，基于图2所示的网络架构，用户会话数据可以从SMF(Session Management Function，会话管理功能)获取，其中，SMF是5G基于服务架构的一个功能单元。SMF主要负责与分离的数据面交互，创建、更新和删除PDU(Protocol Data Unit，协议数据单元)会话，并管理与UPF(User Plane Function，用户面功能)的会话环境，UPF主要负责协PDU的路由、转发，以及对分组数据的策略执行。

在一实施例中，用户会话数据可以包括但不限于SEID(Session Endpoint Identifier，会话端点标识)、N4IP地址、私网地址、私网端口、协议类型、目的IP地址、目的端口、包数、时长、已知的应用类型、URL、IMSI等。

步骤302：将用户签约数据和用户会话数据合并得到合并流数据；

在一实施例中，将用户签约数据和用户会话数据合并得到合并流数据，可以便于NWDAF进行数据获取，将用户签约数据和用户会话数据合并成合并流数据，可以使得NWDAF获取到的数据流更加清晰，便于NWDAF进行后续的数据分析。

步骤303：将合并流数据发送至NWDAF，以供NWDAF从合并流数据中筛选出对应同一个应用的目标流数据后根据目标流数据确定目标应用，以及获取目标应用的流量变化趋势并根据流量变化趋势为增长趋势，将目标应用识别为热门应用。

通过向NWDAF发送合并流数据，以供NWDAF从合并流数据中筛选出对应同一个应用的目标流数据进而确定目标应用，再获取该目标应用的流量变化趋势，根据流量变化趋势对目标应用进行热门应用识别，使得热门应用的识别无须依赖特征库，避免由人工维护带来的滞后问题，从而提高热门应用识别的时效性，及时发现新的热门应用。

参照图4，在一实施例中，上述步骤302中，将用户签约数据和用户会话数据合并得到合并流数据，具体可以包括以下步骤401至步骤402：

步骤401：将从SMF和UPF获取的用户会话数据通过会话端点标识SEID或者N4IP地址合并；

在一实施例中，由于SMF和UPF提供的用户会话数据均包括有SEID和N4IP，因此可以通过SEID和N4IP进行数据流的合并，示例性地，可以使用合并键进行数据流的合并。

步骤402：将合并后的用户会话数据通过国际移动用户识别码IMSI与用户签约数据合并得到合并数据流。

在一实施例中，由于SMF和UPF合并后的用户会话数据和UDM的用户签约数据均包括有IMSI，因此可以通过IMSI将合并后的用户会话数据和用户签约数据进行进一步的合并，得到合并流数据，最终得到的合并流数据可以包括IMSI、年龄、性别、地域、职业、SEID、N4IP地址、私网地址、私网端口、协议类型、目的IP地址、目的端口、包数、时长、已知的应用类型、URL等。

参照图5，本申请实施例还提供了一种热门应用识别方法，应用于NWDAF，包括但不限于以下步骤501至步骤503：

步骤501：获取来自IPDR的合并流数据，其中，合并流数据包括用户签约数据和用户会话数据；

其中，在步骤501中，用户签约数据和用户会话数据在前面的实施例中已经做出相应的解释，在此不再赘述，用户签约数据和用户会话数据如何合并成合并流数据也在前面的实施例中做出相应的解释，在此也不再赘述。

步骤502：从合并流数据中筛选出对应同一个应用的目标流数据，根据目标流数据确定目标应用；

在一实施例中，从合并流数据中筛选出对应同一个应用的目标流数据，可以根据目的IP地址进行筛选，例如目的IP地址相同的数据流可以认为是对应同一个应用的目标流数据，那么这个目的IP地址所对应的应用就可以作为目标应用。

合并流数据中可以包括多个应用的流数据，每个应用的流数据均包括有对应的用户签约数据和用户会话数据，其中，不同的应用的流数据所对应的目的IP地址一般不同，举例来说，合并流数据的具体结构可以为：

第一流数据：第一用户签约数据和第一用户会话数据，其中，第一用户会话数据中目的IP地址为IP1；

第二流数据：第二用户签约数据和第二用户会话数据，其中，第二用户会话数据中目的IP地址为IP1；

第三流数据：第三用户签约数据和第三用户会话数据，其中，第三用户会话数据中目的IP地址为IP2；

第四流数据：第四用户签约数据和第四用户会话数据，其中，第四用户会话数据中目的IP地址为IP2；

第五流数据：第五用户签约数据和第五用户会话数据，其中，第五用户会话数据中目的IP地址为IP3；

基于此，从合并流数据中筛选出对应同一个应用的目标流数据，可以根据目的IP地址进行筛选，即上述第一流数据和第二流数据为对应第一应用的目标流数据，因此该第一应用可以作为目标应用；上述第三流数据和第四流数据为对应第二应用的目标流数据，因此该第二应用可以作为另一个目标应用。

当然，采用目的IP地址进行筛选只是其中一种方式，实际上还可以利用其它维度进行筛选，只要该维度能够唯一标识某一个应用即可。

可以理解的是，上述仅为示意性说明，用于解释如何从合并流数据中筛选出对应同一个应用的目标流数据，实际的合并流数据的总数据量可能很多，对应同一个应用的目标流数据的数量也可能很多。

步骤503：获取目标应用的流量变化趋势，根据流量变化趋势为增长趋势，将目标应用识别为热门应用。

在一实施例中，根据流量变化趋势对目标应用进行热门应用识别，使得热门应用的识别无须依赖特征库，避免由人工维护带来的滞后问题，从而提高热门应用识别的时效性，及时发现新的热门应用。

在一实施例中，当目标应用的流量变化趋势为增长趋势，即该目标应用的访问量变得越来越多，代表该目标应用为新的热门应用。

在一实施例中，目标应用的流量变化趋势可以基于访问该目标应用的总流量、总链接数或者该目标应用的总用户数得到。

在一实施例中，获取流量变化趋势，可以使用趋势预测算法实现，本申请实施例并不限制具体的算法实现，例如使用自回归差分移动平均模型ARIMA等。

参照图6，在一实施例中，上述步骤502中，从合并流数据中筛选出对应同一个应用的目标流数据，具体可以包括以下步骤601至步骤602：

步骤601：对合并流数据进行用户群体划分；

在一实施例中，合并流数据包含有多种多样的流数据，涵盖了多个用户群体，示例性地，对合并流数据进行用户群体划分，可以以单个维度进行划分，例如，以年龄作为维度，可以把用户群体划分成年轻人、中年人、老年人等；又如，以职业作为维度，可以把用户群体划分成医生、学生、白领等，当然，上述仅示例性地展示本申请实施例的用户群体划分方式，实际上还可以根据其他维度进行用户群体划分。

另外，除了上述的用户群体划分方式以外，在一实施例中，对合并流数据进行用户群体划分，还可以利用聚类算法，直接计算用户群体的特征行为距离，其中，用户群体的特征可以分为有序型指标和无序型指标。

示例性地，对于有序型指标，例如年龄等可以进行排序的数据，可以使用闵可夫斯基距离 (Minkowski distance)进行特征行为距离的计算，具体地：

给定样本x _i＝(x _i1；x _i2；...；x _in)与x _j＝(x _j1；x _j2；...；x _jn)，则特征行为距离为：

其中，p代表次方数，可以取1、2、3等，代表一阶距离、二阶距离、三阶距离等。

而对于无序型指标，例如职业等无法进行排序的数据，可以使用混合距离计算公式，例如VDM(Value Difference Metric)，将闵可夫斯基距离和VDM结合即可处理混合属性，假定有n ^c个有序属性，n-n _c个无序属性，不失一般性，令有序属性在无序属性之前，则

令m _u,a表示在属性u上取值为a的样本数，m _u,a,i表示在第i个样本簇中在属性u上取值为a的样本数，k为样本簇数，p为次方数，则属性u上两个离散值a与b之间的VDM距离(即需要计算的特征行为距离)为：

其中，特征行为距离最接近的数据属于相同的用户群体，不断的通过上述方式进行迭代计算，最终可以完成合并流数据的用户群体划分。

步骤602：筛选出被相同用户群体访问同一个应用所产生的流数据，得到目标流数据。

举例来说，进行用户群体划分后，合并流数据的具体结构可以为：

第一流数据：第一用户签约数据和第一用户会话数据，其中，第一用户会话数据中目的IP地址为IP1，对应第一用户群体；

第二流数据：第二用户签约数据和第二用户会话数据，其中，第二用户会话数据中目的IP地址为IP1，对应第一用户群体；

第三流数据：第三用户签约数据和第三用户会话数据，其中，第三用户会话数据中目的IP地址为IP2，对应第一用户群体；

第四流数据：第四用户签约数据和第四用户会话数据，其中，第四用户会话数据中目的IP地址为IP2，对应第二用户群体；

第五流数据：第五用户签约数据和第五用户会话数据，其中，第五用户会话数据中目的IP地址为IP3，对应第二用户群体；

基于此，上述第一流数据和第二流数据为被相同用户群体访问同一个应用所产生的流数据。

同样地，上述仅为示意性说明，实际的合并流数据的总数据量可能很多，对应同一个应用的目标流数据的数量也可能很多。

通过对合并流数据进行用户群体划分，可以提高在筛选出对应同一个应用的目标流数据时的准确性，从而提高后续的热门应用识别的准确性和可靠性。

参照图7，在一实施例中，对合并流数据进行用户群体划分后，还可以进行进一步的补充筛选，以进一步提高准确性，基于此，上述步骤602中，筛选出被相同用户群体访问同一个应用所产生的流数据，具体可以包括以下步骤701至步骤702：

步骤701：根据相同用户群体对同一个应用的访问行为数据识别出应用的应用类型；

在一实施例中，相同用户群体对同一个应用访问行为数据如果是类似的，则可以对这个应用的应用类型进行估计。其中，访问行为数据可以包括但不限于访问时间、访问时长、访问流量分布、访问流量大小、源端口等。示例性地，当访问时间都是晚上说明用户群体可能是学生，则可能是游戏类应用或者视频类应用；当访问时长很长说明应用可能是游戏类应用；当访问流量分布很均匀，但是访问流量很大，可能是视频类应用；当访问流量分布很均匀，但是访问流量很小，可能是聊天类应用或者游戏类应用；另外，若访问的源端口是固定的，也可以通过源端口对应用类型进行估计。综上，如果相同用户群体对同一个应用的访问行为数据存在潜在的固有规律，可以认为该应用为热门应用识别的目标应用。

在一实施例中，访问行为数据包含了多个维度的数据，当以单个维度方面的分析可以使用简单的方差或者单个维度的统计分布来判断单个维度的数据特征是否分布固定，对于多个维度之间的关系，可以通过协方差矩阵或者散度矩阵或者PCA等特征识别的方式判断多个维度是否有相关性，如果多个特征维度是相关的，则可以通过多个特征维度识别出应用的应用类型。举例来说，游戏类应用类的访问时长较长，访问流量较小，访问链接数较多；短视频类的访问时间分布呈现间隔性，访问流量大小也呈现间隔的峰值，访问链接数不多。

步骤702：根据应用类型筛选出应用对应的流数据。

根据应用类型筛选出该应用对应的流数据，作为目标流数据，可以根据应用类型判断对应的应用是否有必要作为目标应用，从而进一步地提高后续的热门应用识别的准确性和可靠性。

在一实施例中，在从合并流数据中筛选出对应同一个应用的目标流数据之前，可以先对合并流数据进行量化，示例性地，可以利用数字编号填充职业字段，利用经纬度填充地域字段，便于后续对合并流数据进行分析，需要补充说明的是，上述量化方式仅为示例性的，实际应用中可以根据情况选择合适的量化方式。

在一实施例中，在从合并流数据中筛选出对应同一个应用的目标流数据之前，还可以对合并流数据进行特征分析，得到合并流数据中各个维度的权重，剔除权重小于第一预设阈值的维度所对应的数据。示例性地，可以使用PCA(Principal Component Analysis，主成分分析)等算法识别出主要的维度对合并流数据进行降维，把不重要的维度所对应的数据剔除。例如在合并流数据中，年龄、职业的权重最大，地域的权重较小，则可以将地域维度的数据忽略。示例性地，上述第一预设阈值可以为2％、5％、10％等，可以根据实际情况自由设置，例如，当第一预设阈值为5％时，在合并流数据中地域的权重仅为3％，则将地域这个维度的数据剔除。通过对合并流数据进行降维，可以降低一些不重要的维度对合并流数据的分析的准确性的影响，并且能够提高对合并流数据的分析的效率，提高分析的准确性。

可以理解的是，上述对合并流数据进行量化和对对合并流数据进行降维的步骤可以择一执行，也可以全部执行，本申请实施例中并不作限定。

在一实施例中，筛选出被相同用户群体访问同一个应用所产生的流数据之前，可以先从预设的特征库中获取已知数据，其中，已知数据根据统一资源定位符URL、目的端口、协议类型和应用类型中的至少一种得到，得到已知数据后，从合并流数据中剔除与已知数据对应的流数据。下面列举几个常见的已知数据判断方式：

URL字段是具体知名网址的记录，这些记录是WEB服务，可以通过URL判断出对应的流数据是否是访问已知的应用产生的；

目的端口是80、443等知名HTTP WEB服务端口的记录，可以通过目的端口判断出对应的流数据是否是访问已知的应用产生的；

具体协议是DNS、SSH、FTP等知名协议的记录，可以通过具体协议判断出对应的流数据是否是访问已知的应用产生的；

应用类型已经被识别的记录，在UPF的会话数据中，已知的应用类型会有相应的标识字段，可以根据该标识字段判断出对应的流数据是否是访问已知的应用产生的；

由于已知的应用类型并没有热门应用识别的必要，因而通过对从合并流数据中剔除与已知数据对应的流数据，能够降低后续筛选出被相同用户群体访问同一个应用所产生的流数据时的样本数量，从而提高分析的效率和准确性。

参照图8，在一实施例中，上述步骤503中，获取目标应用的流量变化趋势，根据流量变化趋势为增长趋势，将所述目标应用识别为热门应用，具体包括以下步骤801至步骤802：

步骤801：获取目标应用在第一预设时长的流量，根据目标应用在第一预设时长的流量预测目标应用的流量变化趋势；

在一实施例中，获取目标应用在第一预设时长的流量，则可以根据一定的频率对目标应用的流量进行监控，例如第一预设时长可以是3天，则可以得到该目标应用每天的流量。然后再通过趋势预测算法得到该目标应用在第二预设时长内的流量变化趋势，例如第二预设时长可以是7天。具体的预测算法可以采用自回归差分移动平均模型ARIMA等。通过对目标应用的流量变化趋势进行预测，能够缩短对热门应用识别所需要的时长，提高热门应用识别的效率。可以理解的是，第一预设时长和第二预设时长可以根据实际情况自由设置，例如第一预设时长也可以以小时为单位，第一预设时长可以是3小时，第二预设时长可以是24小时。

步骤802：当流量变化趋势在第二预设时长内为增长趋势且增长率超过第二预设阈值，将目标应用识别为热门应用。

在一实施例中，通过设置第二预设阈值来判断目标应用的流量变化趋势，可以提高准确性。示例性地，第二预设阈值可以是30％、40％、50％等。可以理解的是，第二预设阈值也可以根据实际情况自由设置。

在一实施例中，当目标应用被识别为热门应用，将目标流数据发送至用户面功能UPF，UPF接收到NWDAF热门应用的目标流数据后，可以根据目的IP地址、目的端口、协议等自动抓取流数据，并自动导出到推送到OAM(Operation Administration and Maintenance，操作维护管理)，OAM可以根据UPF发送的流数据进行详细的应用分析，导入应用特征库，并下发到UPF，后续IPRD再次收到该应用的流数据时即为已知的应用，无须再进行热门应用识别，从而形成闭环。

下面以一实际例子对本申请实施例进行说明，参照图9，具体包括以下步骤901至步骤914：

步骤901：NWDAF从IPDR订阅未知应用的流数据；

步骤902：UPF从NWDAF订阅热门未知应用的流数据；

步骤903：IPDR从UDM订阅用户签约数据；

步骤904：用户设备UE上线，SMF创建PDU会话；

步骤905：IPDR从SMF采集控制面创建数据；

步骤906：UE使用网络服务，服务会话结束后，流数据释放；

步骤907：IPDR从UPF采集到此段流数据的用户会话数据；

步骤908：IPDR根据SEID、N4IP、IMSI等字段合并SMF、UPF、UDM的数据，得出对应的合并流数据；

步骤909：IPDR将合并流数据中未知应用的流数据推送到NWDAF；

步骤910：NWDAF持续接收IPDR的数据，分析出对应同一未知应用的合并流数据，得出该未知应用的流量变化趋势，当流量变化趋势超过第二预设阈值时，将该未知应用识别为热门未知应用；

步骤911：NWDAF把对应的合并流数据发送给UPF；

步骤912：UPF接收到该热门未知应用对应的合并流数据，开始自动抓取该热门未知应用后续产生的流数据；

步骤913：UPF把该热门未知应用后续产生的流数据推送至OAM；

步骤914：OAM通过该热门未知应用的流数据分析该未知应用，导入应用特征库，并下发到UPF。

其中，在步骤901中，NWDAF也可以从IPDR订阅所有应用的流数据，再通过前面实施例中的已知数据剔除方式对数据进行处理，得到未知应用的流数据。

IPDR通过向NWDAF发送未知应用的合并流数据，NWDAF再从合并流数据中筛选出对应同一个未知应用的目标流数据，再获取该未知应用的流量变化趋势，根据流量变化趋势对该未知应用进行热门应用识别，使得热门应用的识别无须依赖特征库，避免由人工维护带来的滞后问题，从而提高热门应用识别的时效性，及时发现热门未知应用；然后再将该热门未知应用对应的合并流数据发送至UPF，UPF开始自动抓取该热门未知应用的流数据并推送至OAM，OAM分析该热门未知应用，导入应用特征库，并下发到UPF，使得该热门未知应用成为已知应用，形成闭环。

还应了解，本申请实施例提供的各种实施方式可以任意进行组合，以实现不同的技术效果。

另外，本申请实施例还提供了一种网络系统，包括NWDAF和IPDR，其中IPDR被设置为获取用户签约数据和用户会话数据并将用户签约数据和用户会话数据合并得到合并流数据；NWDAF连接IPDR，以从IPDR获取合并流数据，并从合并流数据中筛选出对应同一个应用的目标流数据后根据目标流数据确定目标应用，以及获取目标应用的流量变化趋势并根据流量变化趋势对目标应用进行热门应用识别。上述网络系统与上述热门应用识别方法基于相同的发明构思，因此可以及时发现新的热门应用。

另外，本申请实施例还提供了一种网络设备，包括上述网络系统，上述网络设备与上述热门应用识别方法基于相同的发明构思，因此可以及时发现新的热门应用。其中，该网络设备可以仅设置NWDAF和IPDR的其中之一，或者同时设置NWDAF和IPDR。

图10示出了本申请实施例提供的网络设备1000。网络设备1000包括：存储器1001、处理器1002及存储在存储器1001上并可在处理器1002上运行的计算机程序，计算机程序运行时被设置为执行上述的热门应用识别方法。

处理器1002和存储器1001可以通过总线或者其他方式连接。

存储器1001作为一种非暂态计算机可读存储介质，可被设置为存储非暂态软件程序以及非暂态性计算机可执行程序，如本申请实施例描述的热门应用识别方法。处理器1002通过运行存储在存储器1001中的非暂态软件程序以及指令，从而实现上述的热门应用识别方法。

存储器1001可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储执行上述的热门应用识别方法。此外，存储器1001可以包括高速随机存取存储器1001，还可以包括非暂态存储器1001，例如至少一个磁盘存储器1001件、闪存器件或其他非暂态固态存储器1001件。在一些实施方式中，存储器1001可能包括相对于处理器1002远程设置的存储器1001，这些远程存储器1001可以通过网络连接至该网络设备1000。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

实现上述的热门应用识别方法所需的非暂态软件程序以及指令存储在存储器1001中，当被一个或者多个处理器1002执行时，执行上述的热门应用识别方法，例如，执行图3中的方法步骤301至303、图4中方法步骤401至402、图5中方法步骤501至503、图6中方法步骤601至602、图7中方法步骤701至702、图8中方法步骤801至802、图9中方法步骤901至914。

本申请实施例还提供了计算机可读存储介质，存储有计算机可执行指令，计算机可执行指令被设置为执行上述的热门应用识别方法。

在一实施例中，该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个或多个控制处理器1002执行，例如，被上述网络设备1000中的一个处理器1002执行，可使得上述一个或多个处理器1002执行上述的热门应用识别方法，例如，执行图3中的方法步骤301至303、图4中方法步骤401至402、图5中方法步骤501至503、图6中方法步骤601至602、图7中方法步骤701至702、图8中方法步骤801至802、图9中方法步骤901至914。

本申请实施例包括：获取来自网际互连协议信息记录IPDR的合并流数据，其中，所述合并流数据包括用户签约数据和用户会话数据；从所述合并流数据中筛选出对应同一个应用的目标流数据，根据所述目标流数据确定目标应用；获取所述目标应用的流量变化趋势，根据所述流量变化趋势为增长趋势，将所述目标应用识别为热门应用，通过获取由IPDR采集的合并流数据，并从合并流数据中筛选出对应同一个应用的目标流数据进而确定目标应用，再获取该目标应用的流量变化趋势，根据所述流量变化趋势对目标应用进行热门应用识别，使得热门应用的识别无须依赖特征库，避免由人工维护带来的滞后问题，从而提高热门应用识别的时效性，及时发现新的热门应用。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在被设置为存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器1001技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以被设置为存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包括计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

以上是对本申请的一些实施进行了具体说明，但本申请并不局限于上述实施方式，熟悉本领域的技术人员在不违背本申请范围的共享条件下还可作出种种等同的变形或替换，这些等同的变形或替换均包括在本申请权利要求所限定的范围内。

Claims

一种热门应用识别方法，包括：

获取来自网际协议信息记录IPDR的合并流数据，其中，所述合并流数据包括用户签约数据和用户会话数据；

从所述合并流数据中筛选出对应同一个应用的目标流数据，根据所述目标流数据确定目标应用；

获取所述目标应用的流量变化趋势，根据所述流量变化趋势为增长趋势，将所述目标应用识别为热门应用。
根据权利要求1所述的热门应用识别方法，其中，所述的从所述合并流数据中筛选出对应同一个应用的目标流数据，包括：

对所述合并流数据进行用户群体划分；

筛选出被相同用户群体访问同一个应用所产生的流数据，得到目标流数据。
根据权利要求1所述的热门应用识别方法，其中，所述的从所述合并流数据中筛选出对应同一个应用的目标流数据之前，还包括以下至少之一：

对所述合并流数据进行量化；

对所述合并流数据进行特征分析，得到所述合并流数据中各个维度的权重，剔除所述权重小于第一预设阈值的维度所对应的数据。
根据权利要求2所述的热门应用识别方法，其中，所述的筛选出被相同用户群体访问同一个应用所产生的流数据之前，还包括：

从预设的特征库中获取已知数据，其中，所述已知数据根据统一资源定位符URL、目的端口、协议类型和应用类型中的至少一种得到；

从所述合并流数据中剔除与所述已知数据对应的流数据。
根据权利要求2所述的热门应用识别方法，其中，所述的筛选出被相同用户群体访问同一个应用所产生的流数据，包括：

根据相同用户群体对同一个应用的访问行为数据识别出所述应用的应用类型；

根据所述应用类型筛选出所述应用对应的流数据。
根据权利要求1所述的热门应用识别方法，其中，所述的获取所述目标应用的流量变化趋势，根据所述流量变化趋势为增长趋势，将所述目标应用识别为热门应用包括：

获取所述目标应用在第一预设时长的流量，根据所述目标应用在第一预设时长的流量预测所述目标应用的流量变化趋势；

当所述流量变化趋势在第二预设时长内为增长趋势且增长率超过第二预设阈值，将所述目标应用识别为热门应用。
根据权利要求1所述的热门应用识别方法，还包括：

当所述目标应用被识别为热门应用，将所述目标流数据发送至用户面功能UPF。
一种热门应用识别方法，包括：

获取用户签约数据和用户会话数据；

将所述用户签约数据和所述用户会话数据合并得到合并流数据；

将所述合并流数据发送至NWDAF，以供所述NWDAF从所述合并流数据中筛选出对应同一个应用的目标流数据后根据所述目标流数据确定目标应用，以及获取所述目标应用的流量变化趋势并根据所述流量变化趋势为增长趋势，将所述目标应用识别为热门应用。
根据权利要求8所述的热门应用识别方法，其中，所述的IPDR获取用户签约数据和用户会话数据，包括：

从统一数据管理UDM获取用户签约数据；

从会话管理功能SMF和UPF获取用户会话数据。
根据权利要求9所述的热门应用识别方法，其中，所述的将所述用户签约数据和所述用户会话数据合并得到合并流数据，包括：

将从所述SMF和所述UPF获取的用户会话数据通过会话端点标识SEID或者N4网际协议N4IP地址合并；

将合并后的所述用户会话数据通过国际移动用户识别码IMSI与所述用户签约数据合并得到合并数据流。
一种网络系统，包括NWDAF和IPDR，其中：

所述IPDR被设置为获取用户签约数据和用户会话数据并将所述用户签约数据和所述用户会话数据合并得到合并流数据；

所述NWDAF连接所述IPDR，以从所述IPDR获取所述合并流数据，并从所述合并流数据中筛选出对应同一个应用的目标流数据后根据所述目标流数据确定目标应用，以及获取所述目标应用的流量变化趋势并根据所述流量变化趋势为增长趋势，将所述目标应用识别为热门应用。
一种网络设备：

包括如权利要求11所述的网络系统；

或者，

包括至少一个处理器和被设置为与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有能够被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1至10中任意一项所述的热门应用识别方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，其中，所述计算机可执行指令被设置为使计算机执行如权利要求1至10中任意一项所述的热门应用识别方法。