CN114205459A - 基于网络切片的异常话单检测方法及装置 - Google Patents
基于网络切片的异常话单检测方法及装置 Download PDFInfo
- Publication number
- CN114205459A CN114205459A CN202010897505.8A CN202010897505A CN114205459A CN 114205459 A CN114205459 A CN 114205459A CN 202010897505 A CN202010897505 A CN 202010897505A CN 114205459 A CN114205459 A CN 114205459A
- Authority
- CN
- China
- Prior art keywords
- slice
- ticket
- network
- characteristic
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2218—Call detail recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于网络切片的异常话单检测方法及装置,包括:根据网络切片的切片话单信息、切片用户信息、以及切片应用类型信息构建图网络;获取切片话单信息的话单特征序列、切片用户信息的切片用户特征序列、切片应用类型信息的切片应用类型特征序列;根据话单特征序列、切片用户特征序列以及图网络,确定融合切片用户特征后的第一话单融合特征;根据话单特征序列、切片应用类型特征序列以及图网络,确定融合切片应用类型特征后的第二话单融合特征;根据图网络,获取由第一话单融合特征以及第二话单融合特征确定的话单输入特征;根据话单分类模型判断切片话单是否异常,能够灵活根据各个网络切片的实际业务情况识别话单是否异常。
Description
技术领域
本发明涉及电子信息领域,具体涉及一种基于网络切片的异常话单检测方法及装置。
背景技术
目前,在5G网络切片中,由于切片实例数量众多,切片应用类型多样,且各个切片用户的需求也不尽相同,因此,如何从网络切片的众多计费话单中快速发现存在异常的话单成为亟待解决的技术难题。
在现有技术中,通常是通过人工制定检测规则的方式来实现针对异常话单的检测。但是,由于人工制定的规则过于单一,无法灵活根据各个网络切片的实际业务情况进行调整,从而导致异常话单的筛查准确率较低,且效率低下。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于网络切片的异常话单检测方法及装置。
根据本发明的一个方面,提供了一种基于网络切片的异常话单检测方法,包括:
根据与待检测的网络切片相对应的切片话单信息、切片用户信息、以及切片应用类型信息构建图网络;
分别获取与所述切片话单信息相对应的话单特征序列、与所述切片用户信息相对应的切片用户特征序列、与所述切片应用类型信息相对应的切片应用类型特征序列;
根据所述话单特征序列、所述切片用户特征序列以及所述图网络,确定融合切片用户特征后的第一话单融合特征;以及,根据所述话单特征序列、所述切片应用类型特征序列以及所述图网络,确定融合切片应用类型特征后的第二话单融合特征;
根据所述图网络,获取由所述第一话单融合特征以及所述第二话单融合特征确定的话单输入特征;将所述话单输入特征输入预设的话单分类模型,根据所述话单分类模型的输出结果判断所述待检测的网络切片的切片话单是否异常。
依据本发明的再一方面,提供了一种基于网络切片的异常话单检测装置,包括:
图构建模块,适于根据与待检测的网络切片相对应的切片话单信息、切片用户信息、以及切片应用类型信息构建图网络;
序列获取模块,适于分别获取与所述切片话单信息相对应的话单特征序列、与所述切片用户信息相对应的切片用户特征序列、与所述切片应用类型信息相对应的切片应用类型特征序列;
特征融合模块,适于根据所述话单特征序列、所述切片用户特征序列以及所述图网络,确定融合切片用户特征后的第一话单融合特征;以及,根据所述话单特征序列、所述切片应用类型特征序列以及所述图网络,确定融合切片应用类型特征后的第二话单融合特征;
判断模块,适于根据所述图网络,获取由所述第一话单融合特征以及所述第二话单融合特征确定的话单输入特征;将所述话单输入特征输入预设的话单分类模型,根据所述话单分类模型的输出结果判断所述待检测的网络切片的切片话单是否异常。
依据本发明的再一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上述的基于网络切片的异常话单检测方法对应的操作。
依据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述的基于网络切片的异常话单检测方法对应的操作。
在本发明提供的基于网络切片的异常话单检测方法及装置中,能够根据与待检测的网络切片相对应的切片话单信息、切片用户信息、以及切片应用类型信息构建图网络,并分别获取与切片话单信息相对应的话单特征序列、与切片用户信息相对应的切片用户特征序列、与切片应用类型信息相对应的切片应用类型特征序列;从而获取分别融合切片用户特征以及切片应用类型特征的话单融合特征,进而基于话单融合特征确定话单是否异常。由此可见,该方式能够通过图网络挖掘切片用户特征以及切片应用类型对于切片话单的影响,从而能够灵活根据各个网络切片的实际业务情况识别话单是否异常,提升了异常话单的筛查准确率以及筛查效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例一提供的一种基于网络切片的异常话单检测方法的流程图;
图2示出了本发明实施例二提供的一种基于网络切片的异常话单检测方法的流程图;
图3示出了本发明实施例三提供的一种基于网络切片的异常话单检测装置的结构图;
图4示出了本发明实施例五提供的一种电子设备的结构示意图;
图5示出了三种节点之间的关系示意图;
图6示出了本示例中搭建的话单分类模型的具体示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
图1示出了本发明实施例一提供的一种基于网络切片的异常话单检测方法的流程图。如图1所示,该方法包括:
步骤S110:根据与待检测的网络切片相对应的切片话单信息、切片用户信息、以及切片应用类型信息构建图网络。
其中,与待检测的网络切片相对应的切片话单信息是指:该网络切片的切片实例所产生的相关话单内容。切片用户信息是指:与网络切片相对应的切片用户的相关信息,包括用户需求、用户数据等。切片应用类型信息用于描述该网络切片的种类。
根据上述三种信息即可构建图网络。图网络(Graph Network,GN)是在拓扑空间内按图结构组织以进行关系推理的函数集合。在深度学习理论中是图神经网络(graphneural network,GNN)和概率图模型(Probabilistic Graphical Model,PGM)的推广。图网络由图网络块构成,具有灵活的拓扑结构,可以特化为各类连接主义模型,包括前馈神经网络、递归神经网络等。
步骤S120:分别获取与切片话单信息相对应的话单特征序列、与切片用户信息相对应的切片用户特征序列、与切片应用类型信息相对应的切片应用类型特征序列。
其中,话单特征序列用于描述切片话单信息,具体可以将切片话单信息进行编码处理以及序列化表示,从而得到话单特征序列。同理,切片用户特征序列用于描述切片用户的特征,同样可以将切片用户信息进行编码处理以及序列化表示,从而得到切片用户特征序列。切片应用类型特征序列的处理方式类似,此处不再赘述。
通过特征序列能够实现信息内容的数字化表示,从而便于后续处理。
步骤S130:根据话单特征序列、切片用户特征序列以及图网络,确定融合切片用户特征后的第一话单融合特征;以及,根据话单特征序列、切片应用类型特征序列以及图网络,确定融合切片应用类型特征后的第二话单融合特征。
其中,融合切片用户特征后的第一话单融合特征是通过图网络,将话单特征序列与切片用户特征序列相互融合后得到的。融合切片应用类型特征后的第二话单融合特征是通过图网络,将话单特征序列与切片应用类型特征序列相互融合后得到的。
步骤S140:根据图网络,获取由第一话单融合特征以及第二话单融合特征确定的话单输入特征;将话单输入特征输入预设的话单分类模型,根据话单分类模型的输出结果判断待检测的网络切片的切片话单是否异常。
其中,话单输入特征是指:通过图网络,将第一话单融合特征以及第二话单融合特征相互结合后得到的特征,该特征能够全面反映话单信息。相应地,将话单输入特征输入预设的话单分类模型,即可根据话单分类模型的输出结果判断待检测的网络切片的切片话单是否异常。其中,话单分类模型可通过预先训练的方式得到。
由此可见,该方式能够通过图网络挖掘切片用户特征以及切片应用类型对于切片话单的影响,从而能够灵活根据各个网络切片的实际业务情况识别话单是否异常,提升了异常话单的筛查准确率以及筛查效率。
实施例二
图2示出了本发明实施例二提供的一种基于网络切片的异常话单检测方法的流程图。如图2所示,该方法包括:
步骤S200:针对获取到的网络切片样本所对应的样本数据进行预处理,根据预处理后的样本数据训练话单分类模型。
具体地,收集历史网络切片的切片数据集,从而构建网络切片样本所对应的样本数据。针对样本数据进行预处理后进行训练,根据训练结果得到话单分类模型。
步骤S210:根据与待检测的网络切片相对应的切片话单信息、切片用户信息、以及切片应用类型信息构建图网络。
其中,与待检测的网络切片相对应的切片话单信息是指:该网络切片的切片实例所产生的相关话单内容。切片用户信息是指:与网络切片相对应的切片用户的相关信息,包括用户需求、用户数据等。切片应用类型信息用于描述该网络切片的种类。根据上述三种信息即可构建图网络。图网络(Graph Network,GN)是在拓扑空间内按图结构组织以进行关系推理的函数集合。在深度学习理论中是图神经网络(graph neural network,GNN)和概率图模型(Probabilistic Graphical Model,PGM)的推广。图网络由图网络块构成,具有灵活的拓扑结构,可以特化为各类连接主义模型,包括前馈神经网络、递归神经网络等。
具体地,在本实施例中,与待检测的网络切片相对应的切片话单信息包括:切片实例话单内容、切片实例的使用时长、数据流量和/或数据费用;切片用户信息包括:切片用户的订购信息、用户需求信息、和/或使用地点信息;切片应用类型信息包括:移动宽带类型信息、物联网类型信息、和/或通信类型信息。
具体实施时,将切片话单信息确定为中心节点,将切片用户信息确定为第一邻居节点,将切片应用类型信息确定为第二邻居节点;构建由中心节点、第一邻居节点以及第二邻居节点构成的图网络。由此可见,该图网络包括一个中心节点以及两个邻居节点,各个节点的数据结构不同,属于由三种异构节点构成的图网络。
步骤S220:分别获取与切片话单信息相对应的话单特征序列、与切片用户信息相对应的切片用户特征序列、与切片应用类型信息相对应的切片应用类型特征序列。
其中,话单特征序列用于描述切片话单信息,具体可以将切片话单信息进行编码处理以及序列化表示,从而得到话单特征序列。同理,切片用户特征序列用于描述切片用户的特征,同样可以将切片用户信息进行编码处理以及序列化表示,从而得到切片用户特征序列。切片应用类型特征序列的处理方式类似,此处不再赘述。通过特征序列能够实现信息内容的数字化表示,从而便于后续处理。
步骤S230:根据话单特征序列、切片用户特征序列以及图网络,确定融合切片用户特征后的第一话单融合特征;以及,根据话单特征序列、切片应用类型特征序列以及图网络,确定融合切片应用类型特征后的第二话单融合特征。
其中,融合切片用户特征后的第一话单融合特征是通过图网络,将话单特征序列与切片用户特征序列相互融合后得到的。融合切片应用类型特征后的第二话单融合特征是通过图网络,将话单特征序列与切片应用类型特征序列相互融合后得到的。
具体地,本实施例中的图网络包括:邻居节点级图注意力层以及中心节点级图注意力层;相应地,在根据话单特征序列、切片用户特征序列以及图网络,确定融合切片用户特征后的第一话单融合特征;以及,根据话单特征序列、切片应用类型特征序列以及图网络,确定融合切片应用类型特征后的第二话单融合特征时,通过以下方式实现:将话单特征序列以及切片用户特征序列输入邻居节点级图注意力层,得到融合切片用户特征后的第一话单融合特征;以及,将话单特征序列以及切片应用类型特征序列输入邻居节点级图注意力层,得到融合切片应用类型特征后的第二话单融合特征。
步骤S240:根据图网络,获取由第一话单融合特征以及第二话单融合特征确定的话单输入特征;将话单输入特征输入预设的话单分类模型,根据话单分类模型的输出结果判断待检测的网络切片的切片话单是否异常。
其中,话单输入特征是指:通过图网络,将第一话单融合特征以及第二话单融合特征相互结合后得到的特征,该特征能够全面反映话单信息。相应地,将话单输入特征输入预设的话单分类模型,即可根据话单分类模型的输出结果判断待检测的网络切片的切片话单是否异常。其中,话单分类模型可通过预先训练的方式得到。
具体实施时,在根据图网络,获取由第一话单融合特征以及第二话单融合特征确定的话单输入特征时,通过以下方式实现:将第一话单融合特征以及第二话单融合特征输入中心节点级图注意力层,得到话单输入特征。
在本实施例中,网络切片为5G网络切片,且图网络为多级异构图注意力网络。
通过上述方式,能够结合切片用户信息、以及切片应用类型信息对切片话单信息进行分析,从而提升异常话单识别的准确性。其中,通过图网络能够确定切片用户信息、以及切片应用类型信息对切片话单信息的影响权重,从而使最终的分析结果更加可靠。
为了便于理解,下面以一个具体示例为例,详细描述本发明实施例二的具体实现细节:
目前5G网络切片中,切片实例数量众多,切片应用类型多样,切片用户的需求也不尽相同,使得计费话单的异常很难发现,这对异常话单的精准检测提出了很高的要求,现有技术中网络切片的异常话单检测主要通过人为制定检测规则来实现,精准度不够高,从而导致用户体验受影响。为了解决上述问题,本示例提供了一种基于多级异构图注意力网络的5G切片计费话单异常检测方法。利用图注意力网络能够根据图网络中邻居节点影响力的差异分别分配不同权重的特点,构建由切片中的切片用户(即上述的切片用户信息)、切片实例话单(即上述的切片话单信息)、切片应用类型(即上述的切片应用类型信息)三种异构节点组成的异构图网络。所搭建的多级异构图注意力网络包含邻居节点级图注意力和中心节点级图注意力两部分,首先以切片实例话单为中心节点,分别与相邻的两类邻居节点进行邻居节点级注意力聚合,学习切片实例话单的邻居节点即切片用户和切片应用类型对于判断其是否异常的不同重要性,根据重要性的差异为节点间的关系分配不同的权值。然后将输出融合了切片用户特征信息后的切片实例话单新特征(即第一话单融合特征)和融合了切片应用类型特征信息后的切片实例话单新特征(即第二话单融合特征)进行中心节点级注意力聚合。最终通过全连接层输出所检测的切片实例计费话单是否存在异常。从而提高网络切片中话单异常发现的主动性和及时性,提升切片用户的业务体验。
为了便于理解,下面首先针对本示例中涉及到的业务术语进行介绍:
网络切片(Network Slice)是端到端的逻辑功能和其所需的物理或虚拟资源集合,包括接入网、传输网、核心网等,网络切片可认为是5G网络中的虚拟化“专网”;网络切片基于NFV的统一基础设施构建,实现低成本高效运营。网络切片技术可以实现通信网络的逻辑隔离,允许在每个网络切片中配置和重用网络元件及功能以满足特定的行业应用需求。切片管理架构主要由CSMF、NSMF、NSSMF组成。
其中CSMF(Communication Service Management Function):通信业务管理功能,完成用户业务通信服务的需求订购和处理,负责将运营商/第三方客户的通信服务需求转化为对网络切片的需求,并通过和NSMF之间的接口向NSMF发送对网络切片的需求(如创建、终结、修改网络切片实例请求等),从NSMF获取网络切片的管理数据(如性能、故障数据等)。
其中NSMF(Network Slice Management Function):网络切片管理功能,负责接收CSMF(Communication Service Management Function,通信业务管理功能)发送的网络切片需求,对网络切片实例的生命周期、性能、故障等进行管理,编排网络切片实例的组成,分解网络切片实例的需求为各网络切片子网实例或网络功能的需求,向各NSSMF发送网络切片子网实例管理请求。
其中NSSMF(Network Slice Subnet Management Function):网络切片子网管理功能,接收从NSMF下发的网络切片子网部署需求,对网络切片子网实例进行管理,编排网络切片子网实例的组成,将网络切片子网的SLA需求映射为网络服务的QoS需求,向ETSI NFV域的NFVO系统下发网络服务的部署请求。
目前5G网络切片中,切片实例数量众多,切片应用类型多样,切片用户的需求也不尽相同,使得计费话单的异常很难发现,这对异常话单的精准检测提出了很高的要求,现有技术中网络切片的异常话单检测主要通过人为制定检测规则来实现,精准度不够高,从而导致用户体验受影响。而切片计费话单异常检测的难度在于不仅仅需要对切片用户产生的话单进行分析,还需要对与该话单相关联的切片用户SLA需求、该切片实例所属的切片应用类型进行分析。因此本示例利用图注意力网络能够根据图网络中邻居节点影响力的差异分别分配不同权重的特点,提出多级异构图注意力网络,以切片实例话单节点为中心,构造切片异构的节点种类来分析网络切片异常话单。
图注意力网络是将注意力机制引入图网络,在传播层引入attention机制,使中心节点特征的聚合过程中,对不同的相邻节点分配不同的权重,对邻居节点的注意力产生差异,关注那些关联比较大的切片节点,而忽视一些关联较小的切片节点。原始的GCN和其他图神经网络使用的是静态,无法自适应的传播法则。无法捕捉中心节点的哪个邻居节点对于中心节点的分类贡献更大。真实数据并非所有的边都是代表着相同的关联强度。
本示例中的图是指由切片网络中的三类异构数据组成的关系图,可表示为G=(V,E),图中的节点代表三类异构数据即三类异构节点,E为边的集合,图中的边代表三类异构数据的两种关系,节点特征集合用h表示,每个顶点的特征hi为一个高维向量。将本场景视为切片实例话单节点的分类问题,最终输出所检测的切片实例话单是否异常(1代表异常,0代表正常)。
所述的“异构”指的是本场景的图网络中节点种类异构,具体包含如下三种节点:
(1)切片用户(slice user):该类节点的特征为切片用户的相关信息,表示为U={u1、u2、u3、…、un},包含用户订购信息、用户SLA需求、用户使用地点等,该节点即为上文提到的第一邻居节点;
(2)切片实例话单(slice bill):该类节点的特征为切片实例话单内容,表示为B={b1、b2、b3、…、bm},包含该切片实例使用的时长、流量、费用等信息,该节点即为上文提到的中心节点,也叫切片话单信息节点;
(3)切片应用类型(slice application type):该类节点的特征为切片应用类型的描述,表示为A={a1、a2、a3、…、ak},例如增强移动宽带、大规模物联网、高可靠低时延通信等类型,该节点即为上文提到的第二邻居节点。
几种节点之间的关系包括如下两种:
(1)切片用户与切片实例话单之间:为切片用户所使用的每个切片实例会产生对应的切片实例话单的关系;
(2)切片实例话单与切片应用类型之间:为切片实例话单属于一种或多种切片应用类型的关系。
图5示出了三种节点之间的关系示意图。如图5所示,第一邻居节点包括:切片用户1、切片用户2、切片用户3;中心节点包括:切片实例话单1、切片实例话单2、切片实例话单3、切片实例话单4;第二邻居节点包括:切片应用类型1、切片应用类型1、切片应用类型1。其中,第一邻居节点和第二邻居节点都与中心节点建立关联。
具体实施时,图注意力的计算过程分为两步:计算注意力系数(attentioncoefficient)和加权求和(aggregate)。GAT模型通过堆叠图注意力层(graph attentionlayer)实现,每一个图注意力层的输入为节点所产生的告警文本特征集合:
输出为新的告警文本特征集合:
为了计算每个邻居节点的权重,通过一个F×F'的共享权重矩阵W应用于每个节点,然后即可计算出attention系数,该系数可以表示节点j相对于节点i的重要性:
为使得注意力系数更容易计算和便于比较,引入了softmax对所有的i的相邻节点j进行正则化:
因此得到经过图注意力层后的节点i的特征表示为:即GAT输出的对于每个顶点i的新特征(融合了邻域信息),σ是激活函数。
其中Ni表示节点i的邻居节点集合,系数α即每次卷积时,用来进行加权求和的系数。
具体地,本示例提出的网络切片异常话单在线检测流程具体包括以下操作:
(1)NSMF实时获取所检测的切片实例计费话单内容、及其所属的切片用户相关信息和所属的切片应用类型描述;
(2)以切片实例话单为中心节点,构建由切片中的切片用户、切片实例话单、切片应用类型三种异构节点组成的图网络;
(3)分别将切片实例计费话单内容、及其所属的切片用户相关信息和所属的切片应用类型描述特征编码为序列表示后,分别得到与切片话单信息相对应的话单特征序列、与切片用户信息相对应的切片用户特征序列、与切片应用类型信息相对应的切片应用类型特征序列,从而输入至切片计费话单异常检测模型;
(4)将三类节点的特征内容分别经过词嵌入层转化为固定向量后,输入至邻居节点级图注意力层,输出融合了切片用户特征信息后的切片实例话单新特征hbi 1(即融合切片用户特征后的第一话单融合特征)和融合了切片应用类型特征信息后的切片实例话单新特征hbi 2(即融合切片应用类型特征后的第二话单融合特征)。
(5)将以上两个分别融合了单类邻居节点特征的切片实例话单新特征输入至中心节点级图注意力层,输出同时融合两类邻居节点特征的切片实例话单新特征hbi’(即根据图网络获取的由第一话单融合特征以及第二话单融合特征确定的话单输入特征)。
(6)将切片实例话单新特征hbi’输入至由全连接层构成的分类器,模型最终输出所检测的切片实例计费话单是否存在异常,并将结果返回给NSMF。其中,由全连接层构成的分类器即为上文提到的话单分类模型。
由此可见,在本示例的实现过程中,主要分为以下两个核心步骤:
步骤一:切片特征预处理。从NSMF中收集历史网络切片数据集,构建由切片中的切片用户、切片实例话单、切片应用类型三种异构节点组成的图网络,数据集为三类异构节点的特征,包含切片用户的相关信息集、切片实例话单内容集、切片应用类型的描述集,将其编码为序列表示。
步骤二:搭建并训练模型。本模型搭建的多级异构图注意力网络包含邻居节点级图注意力和中心节点级图注意力两部分,以切片实例话单为中心节点,分别与相邻的两类邻居节点进行邻居节点级注意力聚合,学习切片实例话单的邻居节点(即切片用户和切片应用类型)对于判断其是否异常的不同重要性,根据重要性的差异为节点间的关系分配不同的权值。然后将输出融合了切片用户特征信息后的切片实例话单新特征和融合了切片应用类型特征信息后的切片实例话单新特征进行中心节点级注意力聚合。最终通过全连接层输出所检测的切片实例计费话单是否存在异常。
其中,步骤一描述的数据预处理的主要过程如下:
首先,从NSMF中收集历史网络切片数据集,构建由切片中的切片用户、切片实例话单、切片应用类型三种异构节点组成的图网络,数据集为三类异构节点的特征,包含切片用户的相关信息集、切片实例话单内容集、切片应用类型的描述集,分别将其编码为序列表示。
然后,将切片用户的相关信息集、切片实例话单内容集、切片应用类型的描述集分别编码为序列表示。定义每个节点特征的编码序列长度为F,取数据集中最长长度F作为其编码序列长度,将每条数据的长度均填充为F,取其词典大小为z。
接下来,标签矩阵Y为人工标记的每个切片实例话单是否属于异常话单,形状为N*1。
最后,将总数据集划分为训练数据和测试数据,取整个数据集的80%为训练数据,剩余20%为测试数据。用训练集进行训练,使得重建数据与原始数据越接近越好,用测试集来评价验证模型。
其中,步骤二描述的搭建并训练模型的主要过程如下:
本模型搭建的多级异构图注意力网络包含邻居节点级图注意力和中心节点级图注意力两部分,以切片实例话单为中心节点,分别与相邻的两类邻居节点进行邻居节点级注意力聚合,通过节点级别的注意力机制来学习切片实例话单的邻居节点即切片用户和切片应用类型对于判断其是否异常的不同重要性,根据重要性的差异为节点间的关系分配不同的权值。然后将输出融合了切片用户特征信息后的切片实例话单新特征和融合了切片应用类型特征信息后的切片实例话单新特征进行中心节点级注意力聚合。
图6示出了本示例中搭建的话单分类模型的具体示意图。其中,模型的输入为历史网络切片中切片用户、切片实例话单、切片应用类型三种异构数据的特征属性。该模型主要包括以下分支:
分支1:学习切片实例话单i的第一类邻居节点“切片用户”对其重要性的权重。输入切片实例话单i的话单文本特征hbi,及其切片用户邻居的属性特征hui。分别经过词嵌入层转化为向量后输入至邻居节点级图注意力层,输出融合了邻居节点“切片用户”特征信息后的切片实例话单新特征hbi 1;
分支2:学习切片实例话单i的第二类邻居节点“切片应用类型”对其重要性的权重。输入切片实例话单i的话单文本特征hbi,及其切片应用类型邻居的描述特征hai。分别经过词嵌入层转化为向量后输入至邻居节点级图注意力层,输出融合了邻居节点“切片应用类型”特征信息后的切片实例话单新特征hbi 2;
其中嵌入层(embedding):利用词嵌入(word embedding)将每个词转化为向量,输入数据维度为z,输出设置为需要将词转换为64维度的空间向量,输入序列长度为F,因此该层输出数据的形状为(None,F,64)。该层的作用是对输入的词进行向量映射,将每个词的索引转换为64维的固定形状向量;
其中邻居节点级图注意力层:卷积核个数为256,激活函数设置为“relu”;
然后将以上两个分支输出的融合了切片用户特征信息后的切片实例话单新特征hbi 1和融合了切片应用类型特征信息后的切片实例话单新特征hbi 2输入至中心节点级图注意力层进行中心节点级注意力聚合,输出同时融合两类邻居节点特征的切片实例话单新特征hbi’。最后将切片实例话单新特征hbi’输入至由全连接层构成的分类器。
其中,中心节点级图注意力层:卷积核个数为128,激活函数设置为“relu”;
其中,分类器由全连接层(Dense)构成:神经元个数设置为1,激活函数设置为“sigmoid”,输出所检测的切片实例计费话单是否存在异常(1为异常,0为正常)。
然后计算预测的切片实例话单检测结果和真实的切片实例话单检测结果之间的误差,训练目标是最小化该误差。目标函数选择'binary_crossentropy'二值对数损失函数:
将训练回合数设置为1000(epochs=1000),梯度下降优化算法选择adam优化器用于改善传统梯度下降的学习速度(optimizer='adam')。神经网络通过梯度下降,可以找到使目标函数最小的最优权重值,神经网络通过训练会自主学习到权重值。用训练集进行训练,使得目标函数越小越好,并在每轮训练后用测试集来评价验证模型。模型收敛后导出该模型的权重。
综上可知,本示例提出的网络切片计费话单在线检测流程如下:(1)NSMF实时获取所检测的切片实例计费话单内容、及其所属的切片用户相关信息和所属的切片应用类型描述;(2)以切片实例话单为中心节点,构建由切片中的切片用户、切片实例话单、切片应用类型三种异构节点组成的图网络;(3)分别将切片实例计费话单内容、及其所属的切片用户相关信息和所属的切片应用类型描述特征编码为序列表示后,输入至切片计费话单异常检测模型;(4)将三类节点的特征内容分别经过词嵌入层转化为固定向量后,输入至邻居节点级图注意力层,输出融合了切片用户特征信息后的切片实例话单新特征hbi 1和融合了切片应用类型特征信息后的切片实例话单新特征hbi 2。(5)将以上两个分别融合了单类邻居节点特征的切片实例话单新特征输入至中心节点级图注意力层,输出同时融合两类邻居节点特征的切片实例话单新特征hbi’。(6)将切片实例话单新特征hbi’输入至由全连接层构成的分类器,模型最终输出所检测的切片实例计费话单是否存在异常,并将结果返回给NSMF。
由此可见,本发明实施例公开了一种基于多级异构图注意力网络的5G切片计费话单异常检测方法。利用图注意力网络能够根据图网络中邻居节点影响力的差异分别分配不同权重的特点,构建由切片中的切片用户、切片实例话单、切片应用类型三种异构节点组成的异构图网络。所搭建的多级异构图注意力网络包含邻居节点级图注意力和中心节点级图注意力两部分,首先以切片实例话单为中心节点,分别与相邻的两类邻居节点进行邻居节点级注意力聚合,学习切片实例话单的邻居节点即切片用户和切片应用类型对于判断其是否异常的不同重要性,根据重要性的差异为节点间的关系分配不同的权值。然后将输出融合了切片用户特征信息后的切片实例话单新特征和融合了切片应用类型特征信息后的切片实例话单新特征进行中心节点级注意力聚合。最终通过全连接层输出所检测的切片实例计费话单是否存在异常。从而提高网络切片中话单异常发现的主动性和及时性,提升切片用户的业务体验。
实施例三
图3示出了本发明实施例三提供的一种基于网络切片的异常话单检测装置的结构示意图,具体包括:
图构建模块31,适于根据与待检测的网络切片相对应的切片话单信息、切片用户信息、以及切片应用类型信息构建图网络;
序列获取模块32,适于分别获取与所述切片话单信息相对应的话单特征序列、与所述切片用户信息相对应的切片用户特征序列、与所述切片应用类型信息相对应的切片应用类型特征序列;
特征融合模块33,适于根据所述话单特征序列、所述切片用户特征序列以及所述图网络,确定融合切片用户特征后的第一话单融合特征;以及,根据所述话单特征序列、所述切片应用类型特征序列以及所述图网络,确定融合切片应用类型特征后的第二话单融合特征;
判断模块34,适于根据所述图网络,获取由所述第一话单融合特征以及所述第二话单融合特征确定的话单输入特征;将所述话单输入特征输入预设的话单分类模型,根据所述话单分类模型的输出结果判断所述待检测的网络切片的切片话单是否异常。
可选的,所述图构建模块具体适于:
将所述切片话单信息确定为中心节点,将所述切片用户信息确定为第一邻居节点,将所述切片应用类型信息确定为第二邻居节点;
构建由所述中心节点、第一邻居节点以及第二邻居节点构成的图网络。
可选的,所述图网络包括:邻居节点级图注意力层以及中心节点级图注意力层;
则所述特征融合模块具体适于:
将所述话单特征序列以及所述切片用户特征序列输入所述邻居节点级图注意力层,得到融合切片用户特征后的第一话单融合特征;以及,
将所述话单特征序列以及所述切片应用类型特征序列输入所述邻居节点级图注意力层,得到融合切片应用类型特征后的第二话单融合特征。
可选的,所述判断模块具体适于:
将所述第一话单融合特征以及所述第二话单融合特征输入所述中心节点级图注意力层,得到所述话单输入特征。
可选的,所述装置执行之前,进一步包括:
训练模块,适于针对获取到的网络切片样本所对应的样本数据进行预处理,根据预处理后的样本数据训练所述话单分类模型。
可选的,所述与待检测的网络切片相对应的切片话单信息包括:切片实例话单内容、切片实例的使用时长、数据流量和/或数据费用;
所述切片用户信息包括:切片用户的订购信息、用户需求信息、和/或使用地点信息;
所述切片应用类型信息包括:移动宽带类型信息、物联网类型信息、和/或通信类型信息。
可选的,所述网络切片为5G网络切片,且所述图网络为多级异构图注意力网络。
实施例四
本申请实施例四提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于网络切片的异常话单检测方法。可执行指令具体可以用于使得处理器执行上述方法实施例中对应的各个操作。
实施例五
图4示出了根据本发明实施例五的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图4所示,该电子设备可以包括:处理器(processor)402、通信接口(Communications Interface)406、存储器(memory)404、以及通信总线408。
其中:
处理器402、通信接口406、以及存储器404通过通信总线408完成相互间的通信。
通信接口406,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器402,用于执行程序410,具体可以执行上述基于网络切片的异常话单检测方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器404,用于存放程序410。存储器404可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行上述方法实施例中对应的各个操作。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (10)
1.一种基于网络切片的异常话单检测方法,包括:
根据与待检测的网络切片相对应的切片话单信息、切片用户信息、以及切片应用类型信息构建图网络;
分别获取与所述切片话单信息相对应的话单特征序列、与所述切片用户信息相对应的切片用户特征序列、与所述切片应用类型信息相对应的切片应用类型特征序列;
根据所述话单特征序列、所述切片用户特征序列以及所述图网络,确定融合切片用户特征后的第一话单融合特征;以及,根据所述话单特征序列、所述切片应用类型特征序列以及所述图网络,确定融合切片应用类型特征后的第二话单融合特征;
根据所述图网络,获取由所述第一话单融合特征以及所述第二话单融合特征确定的话单输入特征;将所述话单输入特征输入预设的话单分类模型,根据所述话单分类模型的输出结果判断所述待检测的网络切片的切片话单是否异常。
2.根据权利要求1所述的方法,其中,所述根据与待检测的网络切片相对应的切片话单信息、切片用户信息、以及切片应用类型信息构建图网络包括:
将所述切片话单信息确定为中心节点,将所述切片用户信息确定为第一邻居节点,将所述切片应用类型信息确定为第二邻居节点;
构建由所述中心节点、第一邻居节点以及第二邻居节点构成的图网络。
3.根据权利要求2所述的方法,其中,所述图网络包括:邻居节点级图注意力层以及中心节点级图注意力层;
则所述根据所述话单特征序列、所述切片用户特征序列以及所述图网络,确定融合切片用户特征后的第一话单融合特征;以及,根据所述话单特征序列、所述切片应用类型特征序列以及所述图网络,确定融合切片应用类型特征后的第二话单融合特征包括:
将所述话单特征序列以及所述切片用户特征序列输入所述邻居节点级图注意力层,得到融合切片用户特征后的第一话单融合特征;以及,
将所述话单特征序列以及所述切片应用类型特征序列输入所述邻居节点级图注意力层,得到融合切片应用类型特征后的第二话单融合特征。
4.根据权利要求3所述的方法,其中,所述根据所述图网络,获取由所述第一话单融合特征以及所述第二话单融合特征确定的话单输入特征包括:
将所述第一话单融合特征以及所述第二话单融合特征输入所述中心节点级图注意力层,得到所述话单输入特征。
5.根据权利要求1所述的方法,其中,所述方法执行之前,进一步包括:
针对获取到的网络切片样本所对应的样本数据进行预处理,根据预处理后的样本数据训练所述话单分类模型。
6.根据权利要求1所述的方法,其中,所述与待检测的网络切片相对应的切片话单信息包括:切片实例话单内容、切片实例的使用时长、数据流量和/或数据费用;
所述切片用户信息包括:切片用户的订购信息、用户需求信息、和/或使用地点信息;
所述切片应用类型信息包括:移动宽带类型信息、物联网类型信息、和/或通信类型信息。
7.根据权利要求1-6任一所述的方法,其中,所述网络切片为5G网络切片,且所述图网络为多级异构图注意力网络。
8.一种基于网络切片的异常话单检测装置,包括:
图构建模块,适于根据与待检测的网络切片相对应的切片话单信息、切片用户信息、以及切片应用类型信息构建图网络;
序列获取模块,适于分别获取与所述切片话单信息相对应的话单特征序列、与所述切片用户信息相对应的切片用户特征序列、与所述切片应用类型信息相对应的切片应用类型特征序列;
特征融合模块,适于根据所述话单特征序列、所述切片用户特征序列以及所述图网络,确定融合切片用户特征后的第一话单融合特征;以及,根据所述话单特征序列、所述切片应用类型特征序列以及所述图网络,确定融合切片应用类型特征后的第二话单融合特征;
判断模块,适于根据所述图网络,获取由所述第一话单融合特征以及所述第二话单融合特征确定的话单输入特征;将所述话单输入特征输入预设的话单分类模型,根据所述话单分类模型的输出结果判断所述待检测的网络切片的切片话单是否异常。
9.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的基于网络切片的异常话单检测方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的基于网络切片的异常话单检测方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010897505.8A CN114205459A (zh) | 2020-08-31 | 2020-08-31 | 基于网络切片的异常话单检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010897505.8A CN114205459A (zh) | 2020-08-31 | 2020-08-31 | 基于网络切片的异常话单检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114205459A true CN114205459A (zh) | 2022-03-18 |
Family
ID=80644301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010897505.8A Pending CN114205459A (zh) | 2020-08-31 | 2020-08-31 | 基于网络切片的异常话单检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114205459A (zh) |
-
2020
- 2020-08-31 CN CN202010897505.8A patent/CN114205459A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110473083B (zh) | 树状风险账户识别方法、装置、服务器及存储介质 | |
CN113326377A (zh) | 一种基于企业关联关系的人名消歧方法及系统 | |
CN114048468A (zh) | 入侵检测的方法、入侵检测模型训练的方法、装置及介质 | |
CN114528896A (zh) | 模型训练、数据增强方法、装置、电子设备及存储介质 | |
CN111797320A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN111210072B (zh) | 预测模型训练和用户资源额度确定方法及装置 | |
CN109255389B (zh) | 一种装备评价方法、装置、设备及可读存储介质 | |
CN115062779A (zh) | 基于动态知识图谱的事件预测方法及装置 | |
CN113765683B (zh) | 网络切片的割接告警屏蔽方法及装置 | |
CN113541986B (zh) | 5g切片的故障预测方法、装置及计算设备 | |
CN113825165B (zh) | 基于时间图网络的5g切片网络拥塞预警方法及装置 | |
CN116757262B (zh) | 图神经网络的训练方法、分类方法、装置、设备及介质 | |
CN111553401B (zh) | 一种应用在云服务推荐中基于图模型的QoS预测方法 | |
CN117150416A (zh) | 一种工业互联网异常节点的检测方法、系统、介质及设备 | |
CN111935005A (zh) | 数据传输方法、装置、处理设备及介质 | |
CN116522131A (zh) | 对象表示方法、装置、电子设备及计算机可读存储介质 | |
CN114205459A (zh) | 基于网络切片的异常话单检测方法及装置 | |
CN114265954B (zh) | 基于位置与结构信息的图表示学习方法 | |
CN109996133A (zh) | 一种光网络规划方法、装置、电子设备及存储介质 | |
CN109728958A (zh) | 一种网络节点信任预测方法、装置、设备及介质 | |
CN114143163B (zh) | 基于图注意力网络的切片误告警识别方法及装置 | |
Zhou et al. | Linguistic multi-criteria group decision-making method combining cloud model and evidence theory | |
CN115687034A (zh) | 一种业务系统平面可用性判定方法和装置 | |
CN112990425A (zh) | 5g网络切片的自动分类方法、其装置、电子设备及计算机存储介质 | |
CN113810212B (zh) | 5g切片用户投诉的根因定位方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |