CN114205245A - 异常链路检测方法、装置及存储介质 - Google Patents

异常链路检测方法、装置及存储介质 Download PDF

Info

Publication number
CN114205245A
CN114205245A CN202010981945.1A CN202010981945A CN114205245A CN 114205245 A CN114205245 A CN 114205245A CN 202010981945 A CN202010981945 A CN 202010981945A CN 114205245 A CN114205245 A CN 114205245A
Authority
CN
China
Prior art keywords
samples
model
unlabeled
sample set
unmarked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010981945.1A
Other languages
English (en)
Inventor
苏婵菲
文勇
刘宝华
潘璐伽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technical Service Co Ltd
Original Assignee
Huawei Technical Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technical Service Co Ltd filed Critical Huawei Technical Service Co Ltd
Priority to CN202010981945.1A priority Critical patent/CN114205245A/zh
Priority to PCT/CN2021/098011 priority patent/WO2022057321A1/zh
Publication of CN114205245A publication Critical patent/CN114205245A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请实施例提供一种异常链路检测方法,包括:接收通信链路中至少一个网络节点的网络数据;获取网络数据对应的网络特征;将网络特征输入至第一模型,得到通信链路是否为异常链路的检测结果,第一模型是根据第一样本集中的已标记样本、K个已标记样本和M个未标记样本,对上一次训练得到的第二模型进行训练,在训练满足预设条件时得到的模型,K个已标记样本是对第一样本集中的K个未标记样本分别进行标记得到的,M个未标记样本是从第一样本集中选出来的作为负样本的未标记样本,第一样本集包括选取K个未标记样本和M个未标记样本之前,预先存储的已标记样本和未标记样本。采用本申请实施例,提高了检测异常链路的准确率。

Description

异常链路检测方法、装置及存储介质
技术领域
本申请涉及人工智能技术领域,特别涉及一种异常链路检测方法、装置及存储介质。
背景技术
随着电信网络的快速发展和用户日益增长的多样化需求,网络通信企业需要处理大规模的通信数据和更加复杂的网络运维工作。如果不能及时发现和处理网络设备上发生的异常,则会造成用户无法正常通信,从而影响用户体验感。
在实际应用中,可采用异常链路检测模型检测通信链路,得到该通信链路是否为异常链路的检测结果。然而,异常链路检测模型通常是通过大量的标记样本进行训练得到的分类器,且每一标记样本是通过人工标记得到的,需要耗费大量人力,且人工标记存在一些误差。如何通过现有的标记样本提高异常链路的检测准确率是本领域技术人员待解决的技术问题。
发明内容
本申请实施例公开了一种异常链路检测方法、装置及存储介质,能够通过从未标记样本中选取的样本和现有的已标记样本训练得到的异常链路检测模型,对通信链路进行检测,提高了检测异常链路的准确率。
第一方面,本申请实施例公开了一种异常链路检测方法,包括:接收通信链路中至少一个网络节点的网络数据;获取网络数据对应的网络特征;将网络特征输入至第一模型得到通信链路的检测结果,检测结果用于指示通信链路是否为异常链路,第一模型是根据第一样本集中的已标记样本、K个已标记样本和M个未标记样本,对上一次训练得到的第二模型进行训练,在训练满足预设条件时得到的模型,K个已标记样本是对第一样本集中的K个未标记样本分别进行标记得到的,M个未标记样本是从第一样本集中选出来的作为负样本的未标记样本,第一样本集包括选取K个未标记样本和M个未标记样本之前,预先存储的已标记样本和未标记样本。如此,在接收到的通信链路中网络节点的网络数据之后,获取网络数据的网络特征,再将网络特征输入至,通过从未标记样本中选取的样本和现有的标记样本训练得到的异常链路检测模型,从而对该通信链路进行检测,提高了检测异常链路的准确率。
在一种可能的示例中,在将网络特征输入至第一模型之前,该方法还包括:获取第一样本集中每一未标记样本的异常评分值;根据第一样本集中每一未标记样本的异常评分值进行降序排列得到第一排序;将第一排序中前K个序号对应的未标记样本作为K个未标记样本。也就是说,选取的待标记样本是第一样本集中最为异常的K个未标记样本,则异常链路检测模型进行训练的样本集中包括可能为异常的样本,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,该方法还包括:将第一排序中后L个序号对应的未标记样本作为L个未标记样本;从L个未标记样本中选取M个未标记样本。也就是说,选取的未标记样本是第一样本集中最为正常的L个未标记样本中随机选取的M个未标记样本,且该未标记样本作为负样本,则异常链路检测模型进行训练的样本集中新增的样本为正常链路的样本,可避免引入噪声,提高了模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,在将网络特征输入至第一模型之前,该方法还包括:获取通信链路的网络拓扑信息;将预先存储的与网络拓扑信息对应的未标记样本和已标记样本组成的集合作为第一样本集。也就是说,选取与通信链路的网络拓扑信息对应的未标记样本和已标记样本作为待选取的用于训练的样本,可提高模型训练的效果,便于提高检测通信链路是否为异常链路的准确率。
第二方面,本申请实施例公开了一种模型训练方法,包括:从第一样本集中选取K个未标记样本;从第一样本集中选取M个作为负样本的未标记样本第一样本集包括选取K个未标记样本和M个未标记样本之前,预先存储的已标记样本和未标记样本;根据第一样本集中的已标记样本、K个已标记样本和M个未标记样本,对上一次训练得到的第二模型进行训练,在训练满足预设条件时得到第一模型,K个已标记样本是K个未标记样本分别进行标记得到的。如此,通过从未标记样本中选取的样本,可以使得模型在训练的过程中学习到未标记样本中正负样本的分布情况。且根据选取得到的样本和现有的标记样本,对上一次训练得到的模型重新进行训练,可进一步提高检测的准确率。
在一种可能的示例中,从第一样本集中选取K个未标记样本包括:获取第一样本集中每一未标记样本的异常评分值;根据第一样本集中每一未标记样本的异常评分值进行降序排列得到第一排序;将第一排序中前K个序号对应的未标记样本作为K个未标记样本。也就是说,选取的待标记样本是第一样本集中最为异常的K个未标记样本,则异常链路检测模型进行训练的样本集中包括可能为异常的样本,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,从第一样本集中选取M个作为负样本的未标记样本包括:将第一排序中后L个序号对应的未标记样本作为L个未标记样本;从L个未标记样本中选取M个未标记样本。也就是说,选取的未标记样本是第一样本集中最为正常的L个未标记样本中随机选取的M个未标记样本,且该未标记样本作为负样本,则异常链路检测模型进行训练的样本集中新增的样本是正常链路的样本,可避免引入噪声,提高了模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,从第一样本集中选取M个作为负样本的未标记样本包括:统计第一样本集中的已标记样本和K个已标记样本中正样本的数量;根据正样本的数量,从第一样本集中选取M个作为负样本的未标记样本,M等于正样本的数量。也就是说,异常链路检测模型进行训练的样本集中新增的负样本的数量与样本集中的正样本的数量相等,相对可达到正负样本平衡,减少了标签噪声,可提高模型训练的效果,便于提高检测异常链路的准确率。在一种可能的示例中,在从第一样本集中选取K个未标记样本之前,该方法还包括:获取待检测的通信链路的网络拓扑信息;将预先存储的与网络拓扑信息对应的未标记样本和已标记样本组成的集合作为第一样本集。也就是说,选取与通信链路的网络拓扑信息对应的未标记样本和已标记样本作为待选取的用于训练的样本,可提高模型训练的效果,便于提高检测通信链路是否为异常链路的准确率。
结合第一方面、第二方面或者任意一种可能的示例,在一种可能的示例中,在获取第一样本集中每一未标记样本的异常评分值之前,该方法还包括:获取第二样本集中每一未标记样本的异常评分值,第二样本集包括选取P个未标记样本之前,预先存储的已标记样本和未标记样本;根据第二样本集中每一未标记样本的异常评分值进行降序排列得到第二排序;将第二排序中前P个序号对应的未标记样本作为P个未标记样本;根据第二样本集中的已标记样本和P个已标记样本构建第三模型,P个已标记样本是对P个未标记样本分别进行标记得到的,第三模型为第一模型和第二模型对应的初始化模型。如此,基于最为异常的P个未标记样本对应的P个已标记样本和现有的已标记样本构建异常链路检测模型的初始化模型,可提高模型训练的效果,便于提高检测异常链路的准确率。
第三方面,本申请实施例公开了一种异常链路检测装置,包括:通信单元用于接收通信链路中至少一个网络节点的网络数据;处理单元用于获取网络数据对应的网络特征;将网络特征输入至第一模型得到通信链路的检测结果,检测结果用于指示通信链路是否为异常链路,第一模型是根据第一样本集中的已标记样本、K个已标记样本和M个未标记样本,对上一次训练得到的第二模型进行训练,在训练满足预设条件时得到的模型,K个已标记样本是对第一样本集中的K个未标记样本分别进行标记得到的,M个未标记样本是从第一样本集中选出来的作为负样本的未标记样本,第一样本集包括选取K个未标记样本和M个未标记样本之前,预先存储的已标记样本和未标记样本。如此,在接收到的通信链路中网络节点的网络数据之后,获取网络数据的网络特征,再将网络特征输入至,通过从未标记样本中选取的样本和现有的标记样本训练得到的异常链路检测模型,从而对该通信链路进行检测,提高了检测异常链路的准确率。
在一种可能的示例中,处理单元还用于获取第一样本集中每一未标记样本的异常评分值;根据第一样本集中每一未标记样本的异常评分值进行降序排列得到第一排序;将第一排序中前K个序号对应的未标记样本作为K个未标记样本。也就是说,选取的待标记样本是第一样本集中最为异常的K个未标记样本,则异常链路检测模型进行训练的样本集中包括可能为异常的样本,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,处理单元还用于将第一排序中后L个序号对应的未标记样本作为L个未标记样本;从L个未标记样本中选取M个未标记样本。也就是说,选取的未标记样本是第一样本集中最为正常的L个未标记样本中随机选取的M个未标记样本,且该未标记样本作为负样本,则异常链路检测模型进行训练的样本集中新增的样本为正常链路的样本,可避免引入噪声,提高了模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,处理单元还用于获取第二样本集中每一未标记样本的异常评分值,第二样本集包括选取P个未标记样本之前,预先存储的已标记样本和未标记样本;根据第二样本集中每一未标记样本的异常评分值进行降序排列得到第二排序;将第二排序中前P个序号对应的未标记样本作为P个未标记样本;根据第二样本集中的已标记样本和P个已标记样本构建第三模型,P个已标记样本是对P个未标记样本分别进行标记得到的,第三模型为第一模型和第二模型对应的初始化模型。如此,基于最为异常的P个未标记样本对应的P个已标记样本和现有的已标记样本构建异常链路检测模型的初始化模型,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,处理单元还用于获取通信链路的网络拓扑信息;将预先存储的与网络拓扑信息和设备信息对应的未标记样本和已标记样本组成的集合作为第一样本集。也就是说,选取与通信链路的网络拓扑信息对应的未标记样本和已标记样本作为待选取的用于训练的样本,可提高模型训练的效果,便于提高检测通信链路是否为异常链路的准确率。
第四方面,本申请实施例公开了一种模型训练装置,包括:选取模块,用于从第一样本集中选取K个未标记样本;以及从第一样本集中选取M个作为负样本的未标记样本,第一样本集包括选取K个未标记样本和M个未标记样本之前,预先存储的已标记样本和未标记样本;训练模块,用于根据第一样本集中的已标记样本、K个已标记样本和M个未标记样本,对上一次训练得到的第二模型进行训练,在训练满足预设条件时得到第一模型,K个已标记样本是对第一样本集中的K个未标记样本分别进行标记得到的。如此,通过从未标记样本中选取的样本,可以使得模型在训练的过程中学习到未标记样本中正负样本的分布情况。且根据选取得到的样本和现有的标记样本,对上一次训练得到的模型重新进行训练,可进一步提高检测的准确率。
在一种可能的示例中,选取模块具体用于获取第一样本集中每一未标记样本的异常评分值;根据第一样本集中每一未标记样本的异常评分值进行降序排列得到第一排序;将第一排序中前K个序号对应的未标记样本作为K个未标记样本。也就是说,选取的待标记样本是第一样本集中最为异常的K个未标记样本,则异常链路检测模型进行训练的样本集中包括可能为异常的样本,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,选取模块具体用于将第一排序中后L个序号对应的未标记样本作为L个未标记样本;从L个未标记样本中选取M个未标记样本。也就是说,选取的未标记样本是第一样本集中最为正常的L个未标记样本中随机选取的M个未标记样本,且该未标记样本作为负样本,则异常链路检测模型进行训练的样本集中新增的样本是正常链路的样本,可避免引入噪声,提高了模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,选取模块具体用于统计第一样本集中的已标记样本和K个已标记样本中正样本的数量;根据正样本的数量,从第一样本集中选取M个未标记样本作为负样本,M等于第一样本集中的已标记样本和K个已标记样本中正样本的数量。也就是说,异常链路检测模型进行训练的样本集中新增的负样本的数量与样本集中的正样本的数量相等,相对可达到正负样本平衡,减少了标签噪声,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,选取模块还用于获取第二样本集中每一未标记样本的异常评分值,第二样本集包括选取P个未标记样本之前,预先存储的已标记样本和未标记样本;根据第二样本集中每一未标记样本的异常评分值进行降序排列得到第二排序;将第二排序中前P个序号对应的未标记样本作为P个未标记样本;根据第二样本集中的已标记样本和P个已标记样本构建第三模型,P个已标记样本是对P个未标记样本分别进行标记得到的,第三模型为第一模型和第二模型对应的初始化模型。如此,基于最为异常的P个未标记样本对应的P个已标记样本和现有的已标记样本构建异常链路检测模型的初始化模型,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,选取模块还用于获取待检测的通信链路的网络拓扑信息;将预先存储的与网络拓扑信息对应的未标记样本和已标记样本组成的集合作为第一样本集。也就是说,选取与通信链路的网络拓扑信息对应的未标记样本和已标记样本作为待选取的用于训练的样本,可提高模型训练的效果,便于提高检测通信链路是否为异常链路的准确率。
结合第一方面、第三方面或者任意一种可能的示例,在一种可能的示例中,M等于第一样本集中的已标记样本和K个已标记样本中正样本的数量。如此,异常链路检测模型进行训练的样本集中新增的负样本的数量与样本集中的正样本的数量相等,相对可达到正负样本平衡,减少了标签噪声,可提高模型训练的效果,便于提高检测异常链路的准确率。
结合第一方面、第二方面、第三方面、第四方面或者任意一种可能的示例,在一种可能的示例中,网络数据包括以下至少一项:信噪比、输入信号的电平、误码秒、严重误码秒、不可用时间、网络拓扑信息。如此,通过不同的网络数据进行异常链路检测,可提高检测的多样性。
第五方面,本申请实施例提供了另一种设备,包括处理器和与处理器连接的存储器和通信接口,存储器用于存储一个或多个程序,并且被配置由处理器执行上述任一方面的步骤,设备包括异常链路检测装置和模型训练装置。
第六方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一方面的方法。
第七方面,本申请提供了一种计算机程序产品,计算机程序产品用于存储计算机程序,当计算机程序在计算机上运行时,使得计算机执行上述任一方面的方法。
第八方面,本申请提供了一种芯片,包括处理器和存储器,处理器用于从存储器中调用并运行存储器中存储的指令,使得安装有芯片的设备执行上述任一方面的方法。
第九方面,本申请提供了另一种芯片,包括:输入接口、输出接口和处理电路,输入接口、输出接口与处理电路之间通过内部连接通路相连,处理电路用于执行上述任一方面的方法。
第十方面,本申请提供了另一种芯片,包括:输入接口、输出接口、处理器,可选的,还包括存储器,输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连,处理器用于执行存储器中的代码,当代码被执行时,处理器用于执行上述任一方面中的方法。
第十一方面,本申请实施例提供一种芯片系统,包括至少一个处理器,存储器和接口电路,存储器、收发器和至少一个处理器通过线路互联,至少一个存储器中存储有计算机程序;计算机程序被处理器执行上述任一方面中的方法。
附图说明
以下对本申请实施例用到的附图进行介绍。
图1是本申请实施例提供的一种模型训练方法的流程示意图;
图2是本申请实施例提供的一种通信系统的结构示意图;
图3是本申请实施例提供的一种检测节点的流程示意图;
图4是本申请实施例提供的一种异常链路检测方法的流程示意图;
图5是本申请实施例提供的一种模型训练装置的结构示意图;
图6是本申请实施例提供的一种异常链路检测装置的结构示意图;
图7是本申请实施例提供的一种设备的结构示意图。
具体实施方式
在进行本申请实施例的说明时,首先对下面描述中所用到的一些概念进行解释说明。
(1)正常链路和异常链路。
正常链路的通信过程中无异常情况发生。异常链路与正常链路相反,异常链路的通信过程中发生了异常情况。异常情况包括通信链路中的一个网络节点与其他的网络节点断开连接,或者可以是网络节点未接收到预接收的信号(或信息),或者可以是网络节点未将待传输的信号发送给待接收的网络节点,或者可以是网络节点将待传输的信号发送给不该接收的网络节点等情况中的至少一项,在此不做限定。
(2)二分类、正样本和负样本。
二分类表示分类任务中有两个类别,例如,对一张图片进行分类,以确定该图片是不是汽车。正样本包括二分类任务中需要识别出来的类别。负样本与正样本相反,负样本包括二分类任务中不需要识别出来的类别。例如,对一张图片进行分类,以确定该图片中的图像是否属于汽车,则汽车为需要识别出来的类型,汽车的图片可作为正样本,任何不是汽车的图片可作为负样本。在异常链路检测场景中,需要识别出的类别为异常链路的样本。因此,在本申请实施例中,正样本对应异常链路的样本,负样本对应正常链路的样本。
(3)离群点和非离群点。
离群点是指样本中显著不同于其他数据的样本。非离群点与离群点相反,非离群点是样本中与其他数据相同类型的样本。由于正常数据的数量远大于异常数据的数量,因此,离群点可以理解为异常数据,非离群点可以理解为正常数据。也就是说,在本申请实施例中,离群点可以理解为正样本,非离群点可以理解为负样本。
(4)真正类(true positive,TP)样本、假负类(false negative,FN)样本、假正类(false positive,FP)样本和真负类(true negative,TN)样本。
真正类样本,实际上为正样本,且二分类模型预测为正样本。假负类样本,实际上为正样本,但二分类模型预测为负样本。假正类样本,实际上为负样本,但二分类模型预测为正样本。真负类样本,实际上为负样本,且二分类模型预测为负样本。
(5)异常链路检测模型、第一模型和第二模型。
在本申请实施例中,异常链路检测模型用于检测通信链路是否为异常链路。需要说明的是,本申请将异常链路检测模型的初始化模型称为第三模型,将上一次训练得到的异常链路检测模型称为第二模型,将对第二模型进行训练,在训练完成时得到的异常链路检测模型称为第一模型。在第二模型不是第三模型时,第一模型和第二模型的训练方法相同。其中,初始化模型是指构建异常链路检测模型时得到的模型,可以理解为第一次训练得到的模型,第三模型也可以理解为第一模型和第二模型的初始化模型。第三模型的参数可以理解为异常链路检测模型的初始化参数,构建初始化模型可以理解为获取异常链路检测模型的初始化参数。第二模型的参数可以理解为第一模型的初始化参数,训练第二模型可以理解为更新第二模型的参数,也可以理解为获取第一模型的初始化参数。
异常链路检测模型可以是一种神经网络,神经网络可以是由神经单元组成的,神经单元可以是指以xs和截距1为输入的运算单元,该运算单元的输出可以为:
Figure BDA0002687852060000061
其中,s=1、2、……n,n为大于1的自然数,Ws为xs的权重,b为神经单元的偏置。f为神经单元的激活函数(activation functions),用于将非线性特性引入神经网络中,来将神经单元中的输入信号转换为输出信号。该激活函数的输出信号可以作为下一层卷积层的输入。激活函数可以是sigmoid函数。神经网络是将许多个上述单一的神经单元联结在一起形成的网络,即一个神经单元的输出可以是另一个神经单元的输入。每个神经单元的输入可以与前一层的局部接受域相连,来提取局部接受域的特征,局部接受域可以是由若干个神经单元组成的区域。若异常链路检测模型为一种神经网络,则异常链路检测模型的参数可以理解为公式(1)中的Ws和b。
(6)网络数据。
在本申请实施例中,网络数据包括网络节点的设备信息、性能数据以及网络节点对应的通信链路的网络拓扑信息等,在此不做限定。其中,通信链路的网络拓扑信息用于描述通信链路中各个网络节点之间的连接关系,以及各个网络节点的设备信息。该设备信息用于描述网络节点的硬件参数,例如,设备型号、电压限制大小、电流限制大小、存储容量、传输速率等。网络节点的性能数据可以包括但不限于以下信息中的至少一项:信噪比(signal-to-noise ratio,SNR或S/N)、输入信号的电平(signal level at receiverinput,RSL)、误码秒(the number of errored seconds,ES)、严重误码秒(the number ofseverely errored seconds,SES)、不可用时间(the period of unavailability,UAS)、偏度(skewness)等。
信噪比又称为讯噪比,是指一个网络节点或者一个通信链路中信号与噪声的比例。此处的噪声是指经过网络节点产生的原信号中并不存在的无规则的额外信号(或信息),并且该信号并不随原信号的变化而变化。在本申请实施例中,SNRmax表示观测期间的最大信噪比,SNRmin表示观测期间的最小信噪比。观测期间也可称为观察时间或观察时长等,观测期间可以是预设的一个固定的时长,对于所有的通信链路和所有的网络节点均相同;也可以是每个通信链路和每个网络节点设置的一个不同的时间;也可以是通信链路中用于管理网络节点的网关节点确定的一个动态的时间,也就是说该时间不是某一定值,该时间的确定方式可以是网关节点根据信道质量情况、网络负载情况等确定的,在此不做限定。
输入信号的电平是指网络节点向另一个网络节点发送信号时,两个网络节点之间的功率或电压或电流之比的对数。在本申请实施例中,RSLmax表示观测期间内的最大输入信号的电平。
误码秒用于描述一秒内出现的误码次数。严重误码秒对应的情况包括在任意一秒的观察期间内的误码率大于一个阈值,或者检测出信号丢失等。在本申请实施例中,ESmax表示观测期间的最大误码秒,SESmax表示观测期间的最大严重误码秒。
不可用时间是在网络节点产生10个连续的严重误码秒时开始计时,并进行上报,直到连续10秒内每秒的误码秒均不是严重误码秒时结束计时。在本申请实施例中,UASmax表示观测期间的最大不可用时间。
偏度也称为偏态、偏态系数,是统计数据分布偏斜方向和程度的度量,用于度量随机变量概率分布的不对称性。0说明是最完美的对称性,正态分布的偏态就是0。偏度的计算请参照公式(2)。
Figure BDA0002687852060000071
其中,S表示偏度,i表示第i个数值,n为采样数量,μ为均值,σ为标准差。
(7)网络特征。
在本申请实施例中,网络特征用于描述网络数据对应的性能特征。本申请对于获取网络特征的方法不做限定,可以基于不同维度的网络数据进行统计学分析。在接收到一个网络节点的网络数据时,可根据该网络数据确定该网络节点的网络特征。以网络节点1进行举例说明,可以获取网络节点1在观测期间内的SNR的方差、SNRmax、SNRmin、RSL的偏度、ESmax、SESmax、UASmax等。
在接收到一个通信链路上多个网络节点的网络数据时,可分别获取各个网络节点的网络特征,也可综合各个网络节点的网络数据获取通信链路的网络特征。以网络节点1和网络节点2进行举例说明,网络节点1和网络节点2均为一个通信链路L1上面的网络节点,可分别获取网络节点1和网络节点2在观测期间内的SNR的方差、SNRmax、SNRmin、RSL的偏度、ESmax、SESmax、UASmax等;可获取网络节点1和网络节点2之间的SNRmax,或SNRmax的方差,或SNRmax平方差的和;可获取网络节点1和网络节点2之间的SNRmin,或SNRmin的方差,或SNRmin平方差的和;可获取网络节点1和网络节点2之间的RSLmax,或RSLmax的偏度;获取网络节点1和网络节点2之间的ESmax;可获取网络节点1和网络节点2之间的SESmax;可获取网络节点1和网络节点2之间的UASmax等。且通信链路的网络特征可以以一条数据进行描述,通信链路L1的网络特征x={网络节点1的SNR的方差,网络节点1的RSL的偏度,网络节点2的SNR的方差,网络节点2的RSL的偏度,网络节点1和网络节点2之间的SNRmax的平方差的和,网络节点1和节点2之间的SNRmin的平方差的和,网络节点1和网络节点2之间的ESmax,网络节点1和网络节点2之间的SESmax,网络节点1和网络节点2之间的UASmax}。
网络特征还可通过网络嵌入方法(Network Embedding)进行获取。网络嵌入方法,旨在学习网络中节点的低维度潜在表示,所学习到的特征表示可以用作基于图的各种任务的特征,例如分类,聚类,链路预测和可视化。其中心思想是找到一种映射函数,该函数将网络中的每个节点转换为低维度的潜在表示。通过网络嵌入方法获取网络节点的网络特征,可提高获取特征的准确率和效率。
(8)已标记样本、未标记样本、第一样本集和第二样本集。
在本申请实施例中,已标记样本的数据包括标签,且该标签用于指示已标记样本为正样本还是负样本。未标记样本的数据不包括标签。已标记样本也可称为标记样本,或打标数据或打标签数据等,未标记样本也可称为未打标数据或未打标签数据等。在本申请实施例中,以已标记样本和未标记样本进行举例说明,已标记样本中的正样本对应异常链路的样本,已标记样本中的负样本对应正常链路的样本。且已标记样本和未标记样本中均可包括网络节点的网络数据,网络数据可参照前文的定义(6),在此不再赘述。
在本申请实施例中,第一样本集包括选取用于训练第一模型的样本之前的已标记样本和未标记样本。第二样本集包括选取用于构建第三模型的样本之前的已标记样本和未标记样本。当第一样本集中选取的样本为K个未标记样本和M个未标记样本时,第一样本集可以理解为选取K个未标记样本和M个未标记样本之前,已标记样本和未标记样本组成的集合。当第二样本集中选取的样本为P个未标记样本时,第二样本集可以理解为选取P个未标记样本之前,已标记样本和未标记样本组成的集合。
本申请对于第一样本集和第二样本集的选取方法不做限定,可选取全部或部分的样本,部分的样本可以是近段时间获取的样本,或者可以是待检测的通信链路的历史样本,或者可以是与该通信链路同类型的通信链路的历史样本等,在此也不做限定。以第一样本集进行举例说明,第一样本集中的已标记样本和未标记样本的网络拓扑信息与待检测的通信链路的网络拓扑信息一致。其中,待检测的通信链路可以为异常链路检测模型所部署的通信链路。第一样本集中的样本可以是该通信链路的历史样本,也可以是与该通信链路同类型的通信链路的历史样本。可以理解,当选取同样的网络拓扑信息对应的未标记样本和已标记样本作为第一样本集,可提高模型训练的效果,便于提高通信链路的检测的准确率。
(9)异常链路检测模型的评价指标。
在本申请实施例中,异常链路检测模型的评价指标用于评价该异常链路检测模型的检测效果。检测效果(或称效果)越好,可以理解为异常链路检测模型识别出异常链路的评价指标对应的值越大。评价指标可包括精确度(precision,P)、召回率(recall,R)、灵敏度(true positive rate,TPR)、特异度(false positive rate,FPR)、准确率(accuracy)、F1值(F1-score)等,在此不做限定。
其中,精确度又称为精度,是指被正确分为正样本的数量占所有被分为正样本的比例。召回率是指被正确分为正样本的数量占所有正样本的比例。灵敏度是指被正确识别为正样本的数量占所有正样本的比例。特异度是指被错误识别为正样本的数量占所有负样本的比例。准确率是指被正确分类的数量占所有样本的比例。F1值又称调和平均数,当召回率越大时,预测的覆盖率越高,精确度就会越小,因此可以通过F1值来调和精确度和召回率。精确度P、召回率R、灵敏度TPR、特异度FPR、准确率、F1值的计算,请分别参照公式(3)、公式(4)、公式(5)、公式(6)、公式(7)和公式(8)。
P=TP/(TP+FP) (3)
R=TP/(TP+FN) (4)
TPR=TP/(TP+FN) (5)
FPR=FP/(FP+TN) (6)
acc=(TP+FN)/(TP+FN+FP+TN) (7)
F1=(2*P*R)/(P+R) (8)
在以上公式中,acc表示准确率,TP表示真正类样本的数量,FP表示假正类样本的数量,FN表示假负类样本的数量,TN为真负类样本的数量。当所有正样本的数量等于真正类样本和假负类样本的数量时,召回率和灵敏度相等。
异常链路检测模型的检测效果还可通过评价指标中的精确度和召回率对应的(precision recall,PR)曲线、特异度和灵敏度对应的受试者工作特征曲线(receiveroperating characteristic,ROC)、ROC曲线下面积(ROC area under curve,ROC-AUC)以及PR曲线下面积(PR area under curve,PR-AUC)等确定。其中,PR曲线的横坐标(x)为召回率,纵坐标(y)为精确度。ROC曲线的横坐标(x)为特异度,纵坐标(y)为灵敏度。ROC-AUC的值为ROC曲线与横坐标和纵坐标围成的面积。PR-AUC的值为PR曲线与横坐标和纵坐标围成的面积。ROC曲线越靠左上角,AUC的值越大。AUC的值越大,精确度和召回率就越接近1。精确度和召回率越接近1,模型的检测效果就越理想。
(10)预设条件。
在本申请实施例中,预设条件用于确定异常链路检测模型是否训练完成,具体用于确定在异常链路检测模型的评价指标达到或超过阈值,或者异常链路检测模型的评价指标难以提升,或者训练次数达到或超过阈值等情况下,确定异常链路检测模型训练完成。若上一次训练得到的异常链路检测模型为第二模型,对第二模型进行训练,则第二模型训练完成时满足的预设条件可以包括但不限于以下信息中的至少一项:第二模型的精确度大于或等于第一阈值;第二模型的召回率大于或等于第二阈值;第二模型的精确度的提升幅度小于或等于第三阈值;第二模型的召回率的提升幅度小于或等于第四阈值;第二模型的训练次数大于或等于第五阈值;第二模型的准确率大于或等于第六阈值;第二模型的准确率的提升幅度小于或等于第七阈值;第二模型的精确度和召回率对应的调和平均数F1值大于或等于第八阈值等。以上阈值均不作限定,第三阈值可以等于第四阈值,为了提高训练效果,本次训练的阈值可等于或大于上一次训练的阈值。
(11)无监督学习(unsupervised learning)和监督学习(supervised learning)。
无监督学习根据未标记样本解决模式识别中的问题。常用的无监督学习的算法有矩阵分解算法、独孤森林算法(isolation forest)、主成分分析方法(principalcomponents analysis,PCA)、等距映射方法、局部线性嵌入方法、拉普拉斯特征映射方法、黑塞局部线性嵌入方法和局部切空间排列方法等。无监督学习里典型例子是聚类,聚类的目的在于把相似的东西聚在一起,而不关心这一类是什么。
监督学习利用已标记样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。常见的有监督学习算法:回归分析和统计分类。最典型的算法是k最邻近分类算法(k-Nearest Neighbor,KNN)和支持向量机(support vector machine,SVM)。
下面从模型训练侧和模型应用侧对本申请提供的方法进行描述。
本申请实施例提供的异常链路检测模型的训练方法,涉及人工智能技术,具体可以应用于数据训练、机器学习、深度学习等数据处理方法,对训练数据(如本申请实施例中已标记样本的网络节点的网络数据)进行符号化和形式化的智能信息建模、抽取、预处理、训练等,最终得到训练好的异常链路检测模型(如本申请实施例中的第一模型、第二模型);并且,本申请实施例提供的异常链路检测方法可以运用上述训练好的异常链路检测模型(如本申请实施例中的第一模型),将输入数据(如本申请实施例中的网络特征)输入到该异常链路检测模型中,得到输出数据(如本申请实施例中的通信链路的检测结果)。需要说明的是,本申请实施例提供的异常链路检测模型的训练方法和异常链路检测方法是基于同一个构思产生的发明,也可以理解为一个系统中的两个部分,或一个整体流程的两个阶段:如模型训练阶段和模型应用阶段。
模型训练阶段包括模型初始化阶段和模型训练阶段。其中,模型训练阶段用于对之前得到的模型进行训练(如本申请实施例中的第一模型)。模型初始化阶段用于构建模型(如本申请实施例中的第三模型),本申请对于异常链路检测模型的初始化方法不做限定,可采用监督学习方法基于已标记样本(如本申请实施例中的第二样本集中的已标记样本)构建异常链路检测模型的初始化模型;或者可先采用无监督学习方法,对未标记样本(如本申请实施例中的第二样本集中的未标记样本)进行分类得到异常链路的未标记样本和正常链路的未标记样本,再对异常链路的未标记样本进行人工标记,与已标记样本(如本申请实施例中的第二样本集中的已标记样本)一起构建异常链路检测模型的初始化模型等。
在一种可能的示例中,异常链路检测模型的初始化方法包括以下步骤A1~A3,其中:
A1:获取第二样本集中每一未标记样本的异常评分值。
在本申请实施例中,第三模型为异常链路检测模型的初始化模型。第二样本集包括选取用于构建第三模型的样本之前,预先存储的已标记样本和未标记样本,当第二样本集中选取的样本为P个未标记样本时,第二样本集可以理解为选取P个未标记样本之前,已标记样本和未标记样本组成的集合。
本申请对于第二样本集的选取方法不做限定,可选取全部或部分的样本,部分的样本可以是近段时间获取的样本,或者可以是待检测的通信链路的历史样本,或者可以是与该通信链路同类型的通信链路的历史样本等,在此也不做限定。在一种可能的示例中,第二样本集中的已标记样本和未标记样本的网络拓扑信息与待检测的通信链路的网络拓扑信息一致。其中,待检测的通信链路可以为异常链路检测模型所部署的通信链路。第二样本集中的样本可以是该通信链路的历史样本,也可以是与该通信链路同类型的通信链路的历史样本。可以理解,当选取同样的网络拓扑信息对应的未标记样本和已标记样本作为第二样本集,可提高检测通信链路是否为异常链路的准确率。
异常评分值用于描述未标记样本对应的通信链路的异常可能性,可通过概率进行描述。本申请对于获取异常评分值的方法不做限定,可以基于无监督学习方法获取;也可选取一个最为异常的已标记样本作为参考样本,将第二样本集中每一未标记样本与该参考样本进行对比,得到各个样本之间的相似值,将该相似值作为异常评分值等。
本申请对于步骤A1的执行条件不做限定,可以是异常链路检测模型部署于检测节点之后执行的,或者可以是在存储的未标记样本的数量超过一个阈值之后执行的,或者可以是在距离接收的第一个未标记样本的时间超过一个阈值之后执行的等,以上阈值不做限定。
A2:根据第二样本集中每一未标记样本的异常评分值,从第二样本集中选取P个未标记样本。
本申请对于P不做限定,P为正整数,可以根据未标记样本的数量和/或已标记样本中正样本的数量和/已标记样本中负样本的数量等进行设置,或者可以根据异常链路检测模型预先设置的评价指标等进行设置。
在本申请实施例中,P个未标记样本中任一未标记样本的异常评分值大于或等于第二样本集中除了P个未标记样本之外的任一未标记样本的异常评分值。本申请对于选取P个未标记样本的方法不做限定,可以对第二样本集中的各个未标记样本的异常评分值进行降序排列或升序排列。在降序排列作为第二排序时,可获取第二排序中前P个序号对应的未标记样本。在升序排列时,可获取后P个序号对应的未标记样本。选取P个未标记样本的方法还可先随机选取P个参考未标记样本,再从剩下的未标记样本中逐一与P个参考未标记样本的异常评分值进行对比,从而将该P个参考未标记样本中较小的未标记样本进行替换。需要说明的是,P个未标记样本中可能包括异常评分值相等的未标记样本,第二样本集中除了P个未标记样本之外的未标记样本,也可能与P个未标记样本中的未标记样本的异常评分值相等。P个未标记样本可以理解为第二样本集中最为异常的部分未标记样本。
A3:根据第二样本集中的已标记样本和P个已标记样本构建第三模型。
其中,P个已标记样本是对P个未标记样本分别进行标记得到的。本申请对于P个未标记样本的标记方法不做限定,P个未标记样本可以由人工标记,也可直接作为正样本等。
本申请对于构建第三模型的方法也不做限定,可采用逻辑回归或者决策树算法对第二样本集中的已标记样本和P个已标记样本中的网络数据和已标记样本的标签进行分类,从而得到异常链路检测模型(即第三模型)的参数。简单来说,异常链路检测模型相当于一个函数,每一个已标记样本的网络数据(或网络数据对应的特征数据)为一个常数,该常数与异常链路检测模型的参数相乘可得到该已标记样本的标签,则可根据第二样本集中的已标记样本和P个已标记样本中每一已标记样本的网络数据和标签进行获取异常链路检测模型的参数。进一步的,可根据梯度下降法(Gradient descent)、牛顿算法(Newton'smethod)、共轭梯度法(Conjugate gradient)、准牛顿法(Quasi-Newton method)、启发式方法(例如,模拟退火方法、遗传算法、蚁群算法以及粒子群算法等)等方法,对分类得到的参数进行调整,再依据以上方法对上一次得到的参数进行调整,直至确定第二样本集中的已标记样本和P个已标记样本,对异常链路检测模型的初始化训练完成时,将训练完成时的异常链路检测模型的参数作为异常链路检测模型的初始化参数(即第三模型的参数)。
可以理解,在步骤A1~A3中,从第二样本集中选取P个未标记样本作为新的训练数据,且P个未标记样本不是随机选取的,而是根据第二样本集中各个未标记样本的异常评分值选取的最为异常的数据,可减少无效标注的工作量。通过该最为异常的P个未标记样本对应的P个已标记样本和现有的已标记样本构建异常链路检测模型的初始化模型(即第三模型),可提高模型检测异常链路的准确率。
在获取异常链路检测模型的初始化模型之后,可进入模型训练阶段,每次的训练过程采用的方法相同。本申请对于模型训练的执行条件不做限定,可以是接收到通信链路中网络节点的网络数据之后触发的,或者可以是已接收到或预先存储的未标记样本的数量超过一个阈值,或者可以是与上一次模型训练的时间超过一个阈值,或者可以是长时间未接收到通信链路中网络节点发送的网络数据等,以上阈值和时间长度均不做限定。
本申请对于异常链路检测模型的训练方法不做限定,可基于新增的已标记样本,对上一次训练得到的异常链路检测模型进行训练;或者可先采用无监督学习方法,确定样本集中的未标记样本中异常链路的未标记样本和正常链路的未标记样本,再对异常链路的未标记样本进行标记,与已标记样本(如本申请实施例中的第一样本集中的已标记样本)一起训练;或者可采用上一次训练得到的异常链路检测模型,选取最为异常的未标记样本,对该未标记样本进行标记之后,与已标记样本一起训练等。
请参照图1,图1是本申请实施例提出的一种模型训练方法的流程示意图。如图1所示,该方法可由异常链路检测模型或异常链路检测装置或检测节点或终端等设备执行,该方法包括:
S102:从第一样本集中选取K个未标记样本。
本申请对于K不做限定,K为正整数,可参照P的描述,在此不再赘述。可选的,K和P相等。也就是说,异常链路检测模型在模型初始化阶段和模型训练阶段时,所选取的最为异常的未标记样本的数量相等。可以理解,无论K取何值,都选取了新的未标记样本,基于新的未标记样本训练异常链路检测模型,可实现增量学习,提高了模型训练的效果,便于提高检测异常链路的准确率。
本申请对于选取K个未标记样本的方法不做限定,可以随机选取,也可以选取其中最为异常的K个未标记样本。可以理解,在样本集中随机选取K个未标记样本进行训练,可以让异常链路检测模型在训练的过程中,学习到未标记样本中正负样本的分布情况。由于异常数据较正常数据相比数据较少,随机选取可能造成没有或者很少正样本的情况产生。
在一种可能的示例中,步骤S102包括以下步骤B1和步骤B2,其中:
B1:获取第一样本集中每一未标记样本的异常评分值。
其中,异常评分值的获取方法可参照A1的描述,还可基于上一次训练得到的异常检测模型(即第二模型)进行获取等,在此也不做限定。通过上一次训练得到的异常检测模型获取未标记样本的异常评分值,可提高异常评分值的获取效率和准确率。
B2:根据第一样本集中每一未标记样本的异常评分值,从第一样本集中K个未标记样本。
在本申请实施例中,K个未标记样本中任一未标记样本的异常评分值大于或等于第一样本集中除了K个未标记样本之外的任一未标记样本的异常评分值。K个未标记样本的获取方法可参照A2的描述,在此不进行赘述。
可以理解,在步骤B1和步骤B2中,从未标记样本中选取的待标记样本是第一样本集中最为异常的K个未标记样本。也就是说,异常链路检测模型的样本集中包括可能为异常的样本,可提高模型训练的效果,便于提高模型检测异常链路的准确率。
S104:从第一样本集中选取M个未标记样本作为负样本。
本申请对于M不做限定,M为正整数,可参照P的描述,在此不再赘述。在本申请实施例中,M个未标记样本是从第一样本集中选出来的作为负样本的未标记样本,也就是说,M个未标记样本当作正常链路的数据。
本申请对于选取M个未标记样本的方法不做限定,可以随机选取最为正常的M个未标记样本。可以理解,在样本集中随机选取M个未标记样本作为负样本,可以让异常链路检测模型在训练的过程中,学习到未标记样本中正负样本的分布情况。需要说明的是,M个未标记样本应与K个未标记样本不同。
在一种可能的示例中,步骤S104包括以下两种方式,其中:
第一种方式,统计第一样本集中的已标记样本和K个已标记样本中正样本的数量;根据正样本的数量,从第一样本集中选取M个未标记样本作为负样本,M等于正样本的数量。
其中,第一样本集中的已标记样本和K个已标记样本中正样本的数量,可以理解为第二模型的样本集中异常链路的样本的数量。也就是说,先统计异常链路检测模型进行训练的样本集中异常链路的样本的数量,再从第一样本集中选取最为正常的未标记样本,且选取的未标记样本的数量等于统计的异常链路的样本的数量。如此,异常链路检测模型进行训练的样本集中新增的负样本的数量与样本集中的正样本的数量相等,相对可达到正负样本平衡,减少了标签噪声,可提高模型训练的效果,便于提高模型检测异常链路的准确率。
第二种方式,步骤S104包括以下步骤C1~C3,其中:
C1:获取第一样本集中每一未标记样本的异常评分值。
其中,步骤C1可参照步骤B1的描述,在此不再赘述。
C2:根据第一样本集中每一未标记样本的异常评分值,从第一样本集中选取L个未标记样本。
本申请对于L不做限定,L为正整数,可参照P的描述,在此不再赘述。在本申请实施例中,L个未标记样本中任一未标记样本的异常评分值小于或等于第一样本集中除了L个未标记样本之外的任一样本的异常评分值。本申请对于选取L个未标记样本的方法不做限定,可以对第一样本集中的各个未标记样本的异常评分值进行降序排列或升序排列。在降序排列作为第一排序时,可获取第一排序中后L个序号对应的未标记样本。在升序排列时,可获取前L个序号对应的未标记样本。选取L个未标记样本的方法还可先从第一样本集中随机选取L个参考未标记样本,再从剩下的未标记样本中逐一与该L个参考未标记样本的异常评分值进行对比,从而将该L个参考未标记样本中较大的未标记样本进行替换。需要说明的是,L个未标记样本中可能包括异常评分值相等的未标记样本,第一样本集中除了L个未标记样本和K个未标记样本之外的未标记样本,也可能与L个未标记样本中的未标记样本的异常评分值相等。L个未标记样本可以理解为第一样本集中最为正常的部分未标记样本,也可以理解为第一样本集中的非离群点。
C3:从L个未标记样本中选取M个未标记样本。
其中,M个未标记样本可以是从L个未标记样本中随机选取的,也可以是近段时间得到的样本,或者可以是该通信链路的历史样本,或者可以是与该通信链路同类型的通信链路的历史样本等,在此不做限定。
可以理解,在步骤C1~C3中,根据未标记样本的异常评分值选取的未标记样本是第一样本集中最为正常的L个未标记样本中随机选取的M个未标记样本,且该未标记样本作为负样本。也就是说,异常链路检测模型进行训练的样本集中新增的样本为正常链路的样本,可避免引入噪声,提高了模型训练的效果,便于提高模型检测异常链路的准确率。
需要说明的是,上述的两种方式并不构成对本申请实施例的限定,实际应用中,可结合第一种方式和第二种方式选取M个未标记样本等。
S106:根据第一样本集中的已标记样本、K个已标记样本和M个未标记样本,对上一次训练得到的第二模型进行训练,在训练满足预设条件时得到第一模型。
其中,预设条件可参照前文中的定义,在此不再赘述。在一种可能的示例中,预设条件包括以下至少一项:第二模型的精确度大于或等于第一阈值;第二模型的召回率大于或等于第二阈值;精确度的提升幅度小于或等于第三阈值;召回率的提升幅度小于或等于第四阈值;第二模型的训练次数大于或等于第五阈值;第二模型的准确率大于或等于第六阈值;准确率的提升幅度小于或等于第七阈值;精确度和召回率对应的调和平均数大于或等于第八阈值。如此,通过不同的预设条件确定第二模型是否训练完成,可提高训练完成之后的第一模型检测异常链路的准确率。
本申请对于对第二模型的训练方法不做限定,可根据梯度下降法、牛顿算法、共轭梯度法、准牛顿法、启发式方法(例如,模拟退火方法、遗传算法、蚁群算法以及粒子群算法等)等方法,对第二模型的参数进行调整。再基于以上方法对上一次得到的第二模型的参数进行调整,直至确定第二模型的训练满足预设条件时,确定训练完成,将训练完成得到的第二模型作为第一模型。
在图1所描述的方法中,先从第一样本集中选取K个未标记样本,再从第一样本集中选取M个未标记样本作为负样本。在K个未标记样本进行标记之后,将标记得到的K个已标记样本与M个未标记样本以及第一样本集中的已标记样本一起,对上一次训练得到的第二模型进行训练,从而得到训练完成的第一模型。如此,通过从未标记样本中选取的样本,可以使得模型在训练的过程中学习到未标记样本中正负样本的分布情况。且根据选取得到的样本和现有的标记样本,对上一次训练得到的模型重新进行训练,可进一步提高检测的准确率。
请参见图2,图2是本申请实施例提供的一种通信系统的架构图。如图2所示,该通信系统可包括终端(例如,终端211)、网络节点(例如,网络节点221、网络节点222)、检测节点(例如,检测节点231)和目标设备(例如,网络设备241、应用服务器251)。本申请实施例对于以上设备的数量均不作限定。
本申请实施例中的通信系统可以是支持第四代(fourth generation,4G)接入技术的通信系统,例如,长期演进(long term evolution,LTE)接入技术;或者,该通信系统可以是支持第五代(fifth generation,5G)接入技术通信系统,例如,新无线(new radio,NR)接入技术;或者,该通信系统可以是支持多种无线技术的通信系统,例如,支持LTE技术和NR技术的通信系统;或者该通信系统可以是支持微波通信技术、波分通信技术、光传送网(optical transport network,OTN)技术、无线通信技术、宽窄带技术等。另外,该通信系统可以适用于面向未来的通信技术。
该通信系统也可以应用于其他的通信系统中,例如,C-V2X系统,公共陆地移动网络(public land mobile network,PLMN)、设备到设备(device-to-device,D2D)网络、机器到机器(machine to machine,M2M)网络、物联网(internet of things,IoT)、无线局域网(wireless local area networks,WLAN)或者其他网络等,在此不做限定。
在本申请实施例中,终端可通过无线或有线的方式与网络节点连接,再通过网络节点以无线或有线的方式与目标设备连接。终端可以是一种向用户提供语音或者数据连通性的设备,终端可以称为用户设备(user equipment,UE)、移动台(mobile station)、用户单元(subscriber unit)、站台(station)、终端设备(terminal equipment,TE)等。终端可以为蜂窝电话(cellular phone)、个人数字助理(personal digital assistant,PDA)、无线调制解调器(modem)、手持设备(handheld)、膝上型电脑(laptop computer)、无绳电话(cordless phone)、无线本地环路(wireless local loop,WLL)台、手机(mobile phone)、平板电脑(pad)等。随着无线通信技术的发展,可以接入无线通信网络、可以与无线网络侧进行通信,或者通过无线网络与其它物体进行通信的设备都可以是本申请实施例中的终端。譬如,智能交通中的终端和汽车、智能家居中的家用设备、智能电网中的电力抄表仪器、电压监测仪器、环境监测仪器、智能安全网络中的视频监控仪器、收款机等等。终端可以是静态固定的,或者是移动的。示例性的,如图2所示,终端为手机。
本申请实施例中的网络节点用于为终端提供传输服务。网络节点可以作为中继节点(relay node,RN)为终端提供无线回传服务的节点,无线回传服务是指通过无线回传链路提供的数据和/或信令回传服务。一方面,中继节点可以通过接入链路(access link,AL)为终端提供无线接入服务;另一方面,中继节点可以通过一跳或者多跳回传链路(backhaullink,BL)连接到目标设备,从而,中继节点可以实现终端和目标设备之间的数据和/或信令的转发,扩大通信系统的覆盖范围。示例性的,如图2所示,网络节点为中继节点。
本申请实施例中的目标设备部署在通信链路中,用于为终端提供无线通信功能的装置。目标设备可以为基站、接入点、节点、演进型节点(environment Bureau,eNB)或5G基站(next generation base station,gNB),指在空中接口上通过一个或多个扇区与无线终端进行通信的接入网络中的设备。通过将已接收的空中接口帧转换为网际互连协议(Internet Protocol,IP)分组,基站可以作为无线终端和接入网络的其余部分之间的路由器,接入网络可以包括因特网协议网络。基站还可以对空中接口的属性的管理进行协调。
目标设备还可以是应用服务器,例如,智能交通系统(intelligent trafficsystems,ITS)的服务器,导航应用的服务器,缴费应用的服务器,医疗信息系统的服务器,电子信息档案管理的服务器等,在此不做限定。示例性的,如图2所示,目标设备包括接入网设备和应用服务器。
本申请实施例中的检测节点部署在通信链路中,用于监测该通信链路是否为异常链路。该检测节点上可部署异常检测模型,该检测节点可以是通信系统中单独部署的节点,也可以是每一网络节点部署的节点,在此不做限定,可根据通信链路的实际情况进行部署。可以理解,当检测节点是每一网络节点上部署的节点时,只检测一个网络节点,可提高检测的效率。当检测节点是通信系统中单独部署的节点时,检测节点可获取通信链路中任一网络节点的网络数据,从而综合分析整个通信链路,可提高检测的准确率。
检测节点具体可用于获取通信链路中至少一个网络节点的网络数据;获取该网络数据的网络特征;以及将网络特征输入至异常链路检测模型,得到该通信链路是否为异常链路的检测结果。请参照图3,图3为本申请实施例提供的一种检测节点的结构示意图。如图3所示,检测节点300可包括输入模块301、特征获取模块302、检测训练模块303和输出模块304等。
其中,输入模块301可用于获取通信链路中至少一个网络节点的网络数据。特征获取模块302可用于获取该网络数据的网络特征。检测训练模块303可用于对网络特征进行检测,得到该通信链路是否为异常链路的检测结果。检测训练模块303还可用于训练异常链路检测模型。输出模块304可用于输出检测结果。在检测结果为异常链路时,还可由输出模块304进行上报(可上报给预先分配的业务人员,也可上报给系统,由系统分配业务人员等,在此不做限定)。
需要说明的是,本申请提供的异常链路检测模型可应用于任一通信链路中,其他的异常检测的应用场景中,异常检测模型进行训练的样本集中的训练数据可与本申请实施例中的网络数据不同,且训练数据的数据特征也可与本申请实施例中的网络特征不同,选取样本集的方法可采用图1实施例所描述的方法进行选取,并采用图1实施例所描述的训练方法进行训练。
请参见图4,图4是本申请实施例提供的一种异常链路检测方法的流程示意图。该方法可应用于如图2所描述的任意一种通信网络中,该方法可由异常链路检测模型或异常链路检测装置或检测节点或终端等设备执行,该方法包括但不限于如下步骤:
S402:接收通信链路中至少一个网络节点的网络数据。
其中,网络数据可包括但不限于网络节点的性能数据以及网络节点对应的通信链路的网络拓扑信息等,在此不做限定。其中,网络拓扑信息用于描述通信链路中各个网络节点之间的连接关系。性能数据可以包括但不限于以下信息中的至少一项:信噪比、输入信号的电平、误码秒、严重误码秒、不可用时间、偏度等,具体可参照前面的定义,在此不再赘述。
本申请对于步骤S402的执行条件不做限定,可以是网络节点每隔一段时间由网络节点发送的,该时间可以是一个固定的时间,对于所有的网络节点均相同,也可以是每个网络节点对应的一个不同的时间;也可以是异常链路检测模型或异常链路检测装置或检测节点或终端等执行主体确定的一个动态的时间,该时间可以根据信道质量情况、网络负载情况等确定,在此不做限定。该网络节点的网络数据或者可以是在满足一个约束条件时发送的,该约束条件可包括传输新的业务、业务结束或者被停止传输或者无法传输、传输的业务的数量超过一个阈值等。该网络节点的网络数据或者可以是在接收到执行主体所发送的用于获取该网络节点的网络数据的请求之后发送的等。
S404:获取网络数据对应的网络特征。
其中,网络特征用于描述通信链路的性能特征,可以基于不同维度的网络数据进行统计学分析得到,或者通过网络嵌入方法进行获取等,具体可参照前面的定义,在此不再赘述。
S406:将网络特征输入至第一模型,得到通信链路的检测结果。
在本申请实施例中,通信链路的检测结果用于指示该通信链路是否为异常链路。第一模型是根据第一样本集中的已标记样本、K个已标记样本和M个未标记样本,对上一次训练得到的第二模型进行训练,在训练满足预设条件时得到的模型,K个已标记样本是对第一样本集中的K个未标记样本分别进行标记得到的,M个未标记样本是从第一样本集中选出来的作为负样本的未标记样本,第一样本集包括选取K个未标记样本和M个未标记样本之前,预先存储的已标记样本和未标记样本。K个未标记样本和M个未标记样本的选取方法,以及第一模型的训练方法可参照图1所描述的方法,在此不再赘述。
在一种可能的示例中,在步骤S406之前,该方法还包括:获取通信链路的网络拓扑信息;将预先存储的与网络拓扑信息对应的未标记样本和已标记样本组成的集合作为第一样本集。也就是说,选取与通信链路的网络拓扑信息对应的未标记样本和已标记样本作为待选取的用于训练的样本,可提高模型训练的效果,便于提高检测通信链路是否为异常链路的准确率。
其中,网络拓扑信息可以从步骤S402中接收到的网络节点的网络数据中获取,或者可以从之前获取的通信链路中的网络节点的网络数据中获取,或者可以从预先存储的通信链路的网络拓扑信息中获取等,在此不做限定。
在一种可能的示例中,预设条件包括以下至少一项:第二模型的精确度大于或等于第一阈值;第二模型的召回率大于或等于第二阈值;精确度的提升幅度小于或等于第三阈值;召回率的提升幅度小于或等于第四阈值;第二模型的训练次数大于或等于第五阈值;第二模型的准确率大于或等于第六阈值;准确率的提升幅度小于或等于第七阈值;精确度和召回率对应的调和平均数大于或等于第八阈值。如此,通过不同的预设条件确定第二模型是否训练完成,可提高训练完成之后的第一模型检测异常链路的准确率。
在一种可能的示例中,在步骤S406之前,该方法还包括:获取第一样本集中每一未标记样本的异常评分值;根据第一样本集中每一未标记样本的异常评分值进行降序排列得到第一排序;将第一排序中前K个序号对应的未标记样本作为K个未标记样本。也就是说,选取的待标记样本是第一样本集中最为异常的K个未标记样本,则异常链路检测模型进行训练的样本集中包括可能为异常的样本,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,在步骤S406之前,该方法还包括:将第一排序中后L个序号对应的未标记样本作为L个未标记样本;从L个未标记样本中选取M个未标记样本。也就是说,选取的未标记样本是第一样本集中最为正常的L个未标记样本中随机选取的M个未标记样本,且该未标记样本作为负样本,则异常链路检测模型进行训练的样本集中新增的样本为正常链路的样本,可避免引入噪声,提高了模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,在获取第一样本集中每一未标记样本的异常评分值之前,该方法还包括:获取第二样本集中每一未标记样本的异常评分值,第二样本集包括选取P个未标记样本之前,预先存储的已标记样本和未标记样本;根据第二样本集中每一未标记样本的异常评分值进行降序排列得到第二排序;将第二排序中前P个序号对应的未标记样本作为P个未标记样本;根据第二样本集中的已标记样本和P个已标记样本构建第三模型,P个已标记样本是对P个未标记样本分别进行标记得到的,第三模型为第一模型和第二模型对应的初始化模型。如此,基于最为异常的P个未标记样本对应的P个已标记样本和现有的已标记样本构建异常链路检测模型的初始化模型,可提高模型训练的效果,便于提高检测异常链路的准确率。在一种可能的示例中,M等于第一样本集中的已标记样本和K个已标记样本中正样本的数量。如此,异常链路检测模型进行训练样本集中新增的负样本的数量与样本集中的正样本的数量相等,相对可达到正负样本平衡,减少了标签噪声,可提高检测异常链路的准确率。
在图4所描述的方法中,在接收到的通信链路中网络节点的网络数据之后,获取网络数据的网络特征,再将网络特征输入至,通过从未标记样本中选取的样本和现有的标记样本训练得到的异常链路检测模型,从而对该通信链路进行检测,提高了检测异常链路的准确率。
上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的装置。
与图1所示的实施例一致的,请参见图5,图5是本申请实施例提供的一种模型训练装置的结构示意图,该模型训练装置500可以包括选取模块501和训练模型502,其中:
选取模块501用于从第一样本集中选取K个未标记样本;以及从第一样本集中选取M个未标记样本作为负样本,第一样本集包括选取K个未标记样本和M个未标记样本之前,预先存储的已标记样本和未标记样本;
训练模块502用于根据第一样本集中的已标记样本、K个已标记样本和M个未标记样本,对上一次训练得到的第二模型进行训练,在训练满足预设条件时得到第一模型,K个已标记样本是对第一样本集中的K个未标记样本分别进行标记得到的。
在一种可能的示例中,选取模块501具体用于获取第一样本集中每一未标记样本的异常评分值;根据第一样本集中每一未标记样本的异常评分值进行降序排列得到第一排序;将第一排序中前K个序号对应的未标记样本作为K个未标记样本。也就是说,选取的待标记样本是第一样本集中最为异常的K个未标记样本,则异常链路检测模型进行训练的样本集中包括可能为异常的样本,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,选取模块501具体用于将第一排序中后L个序号对应的未标记样本作为L个未标记样本;从L个未标记样本中选取M个未标记样本。也就是说,选取的未标记样本是第一样本集中最为正常的L个未标记样本中随机选取的M个未标记样本,且该未标记样本作为负样本,则异常链路检测模型进行训练的样本集中新增的样本是正常链路的样本,可避免引入噪声,提高了模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,选取模块501具体用于统计第一样本集中的已标记样本和K个已标记样本中正样本的数量;根据正样本的数量,从第一样本集中选取M个未标记样本作为负样本,M等于第一样本集中的已标记样本和K个已标记样本中正样本的数量。也就是说,异常链路检测模型进行训练的样本集中新增的负样本的数量与样本集中的正样本的数量相等,相对可达到正负样本平衡,减少了标签噪声,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,选取模块501还用于获取第二样本集中每一未标记样本的异常评分值,第二样本集包括选取P个未标记样本之前,预先存储的已标记样本和未标记样本;根据第二样本集中每一未标记样本的异常评分值进行降序排列得到第二排序;将第二排序中前P个序号对应的未标记样本作为P个未标记样本;根据第二样本集中的已标记样本和P个已标记样本构建第三模型,P个已标记样本是对P个未标记样本分别进行标记得到的,第三模型为第一模型和第二模型对应的初始化模型。如此,基于最为异常的P个未标记样本对应的P个已标记样本和现有的已标记样本构建异常链路检测模型的初始化模型,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,网络数据包括以下至少一项:信噪比、输入信号的电平、误码秒、严重误码秒、不可用时间、网络拓扑信息。如此,通过不同的网络数据进行异常链路检测,可提高检测的多样性。
在图5所示的装置中,先从第一样本集中选取K个未标记样本,再从第一样本集中选取M个未标记样本作为负样本。在K个未标记样本进行标记之后,将标记得到的K个已标记样本与M个未标记样本以及第一样本集中的已标记样本一起,对上一次训练得到的第二模型进行训练,从而得到训练完成的第一模型。如此,通过从未标记样本中选取的样本,可以使得模型在训练的过程中学习到未标记样本中正负样本的分布情况。且根据选取得到的样本和现有的标记样本,对上一次训练得到的模型重新进行训练,可进一步提高检测的准确率。
与图4所示的实施例一致的,请参见图6,图6是本申请实施例提供的一种异常链路检测装置的结构示意图,该异常链路检测装置600装置可以包括通信单元601和处理单元602,其中:
通信单元601用于接收通信链路中至少一个网络节点的网络数据;
处理单元602用于获取网络数据对应的网络特征;将网络特征输入至第一模型得到通信链路的检测结果,检测结果用于指示通信链路是否为异常链路,第一模型是根据第一样本集中的已标记样本、K个已标记样本和M个未标记样本,对上一次训练得到的第二模型进行训练,在训练满足预设条件时得到的模型,K个已标记样本是对第一样本集中的K个未标记样本分别进行标记得到的,第一样本集包括选取K个未标记样本和M个未标记样本之前,预先存储的未标记样本和已标记样本。
在一种可能的示例中,处理单元602还用于获取第一样本集中每一未标记样本的异常评分值;根据第一样本集中每一未标记样本的异常评分值进行降序排列得到第一排序;将第一排序中前K个序号对应的未标记样本作为K个未标记样本。也就是说,选取的待标记样本是第一样本集中最为异常的K个未标记样本,则异常链路检测模型进行训练的样本集中包括可能为异常的样本,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,处理单元602还用于将第一排序中后L个序号对应的未标记样本作为L个未标记样本;从L个未标记样本中选取M个未标记样本。也就是说,选取的未标记样本是第一样本集中最为正常的L个未标记样本中随机选取的M个未标记样本,且该未标记样本作为负样本,则异常链路检测模型进行训练的样本集中新增的样本为正常链路的样本,可避免引入噪声,提高了模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,处理单元602还用于获取第二样本集中每一未标记样本的异常评分值,第二样本集包括选取P个未标记样本之前,预先存储的已标记样本和未标记样本;根据第二样本集中每一未标记样本的异常评分值进行降序排列得到第二排序;将第二排序中前P个序号对应的未标记样本作为P个未标记样本;根据第二样本集中的已标记样本和P个已标记样本构建第三模型,P个已标记样本是对P个未标记样本分别进行标记得到的,第三模型为第一模型和第二模型对应的初始化模型。如此,基于最为异常的P个未标记样本对应的P个已标记样本和现有的已标记样本构建异常链路检测模型的初始化模型,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,M等于第一样本集中的已标记样本和K个已标记样本中正样本的数量。如此,异常链路检测模型进行训练的样本集中新增的负样本的数量与样本集中的正样本的数量相等,相对可达到正负样本平衡,减少了标签噪声,可提高模型训练的效果,便于提高检测异常链路的准确率。
在一种可能的示例中,处理单元602还用于获取通信链路的网络拓扑信息;将预先存储的与网络拓扑信息和设备信息对应的未标记样本和已标记样本组成的集合作为第一样本集。也就是说,选取与通信链路的网络拓扑信息对应的未标记样本和已标记样本作为待选取的用于训练的样本,可提高模型训练的效果,便于提高检测通信链路是否为异常链路的准确率。
在一种可能的示例中,网络数据包括以下至少一项:信噪比、输入信号的电平、误码秒、严重误码秒、不可用时间、网络拓扑信息。如此,通过不同的网络数据进行异常链路检测,可提高检测的多样性。
在图6所描述的装置中,在接收到的通信链路中网络节点的网络数据之后,获取网络数据的网络特征,再通过从未标记样本中选取的样本和现有的标记样本训练得到的异常链路检测模型,对该通信链路进行检测,提高了检测的准确率。
请参见图7,图7是本申请实施例提供的一种设备700,该设备700包括处理器701、存储器702和通信接口703,处理器701、存储器702和通信接口703通过总线704相互连接。
存储器702包括但不限于是随机存储记忆体(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmableread only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器702用于相关计算机程序及数据。通信接口703用于接收和发送数据。
处理器701可以是具有处理功能的装置,可以包括一个或者多个处理器。处理器可以是通用处理器或者专用处理器等。处理器可以是基带处理器、或中央处理器。基带处理器可以用于对通信协议以及通信数据进行处理,中央处理器可以用于对通信装置进行控制,执行软件程序,处理软件程序的数据。
该设备700中的处理器701用于读取所述存储器702中存储的计算机程序代码,在本申请实施例中,该设备700可以包括异常链路检测装置,或者为模型训练装置,或者为检测节点或其它的任意一种可能的装置。
当设备700为模型训练装置或检测节点时,处理器701用于执行以下操作:
从第一样本集中选取K个未标记样本;
从第一样本集中选取M个未标记样本作为负样本;
根据第一样本集中的已标记样本、K个已标记样本和M个未标记样本,对上一次训练得到的第二模型进行训练,在训练满足预设条件时得到第一模型,K个已标记样本是对第一样本集中的K个未标记样本分别进行标记得到的,第一样本集包括选取K个未标记样本和M个未标记样本之前,预先存储的已标记样本和未标记样本。
在一种可能的示例中,处理器701具体用于执行以下操作:
获取第一样本集中每一未标记样本的异常评分值;
根据第一样本集中每一未标记样本的异常评分值进行降序排列得到第一排序;
将第一排序中前K个序号对应的未标记样本作为K个未标记样本。
在一种可能的示例中,处理器701具体用于执行以下操作:
将第一排序中后L个序号对应的未标记样本作为L个未标记样本;
从L个未标记样本中选取M个未标记样本。
在一种可能的示例中,处理器701具体用于执行以下操作:
统计第一样本集中的已标记样本和K个已标记样本中正样本的数量;
根据正样本的数量,从第一样本集中选取M个未标记样本作为负样本,M等于正样本的数量。
在一种可能的示例中,从第一样本集中选取K个未标记样本之前,处理器701还用于执行以下操作:
获取待检测的通信链路的网络拓扑信息;
将预先存储的与网络拓扑信息对应的未标记样本和已标记样本组成的集合作为第一样本集。当设备700为异常链路检测装置时,处理器701用于执行以下操作:
接收通信链路中至少一个网络节点的网络数据;
获取网络数据对应的网络特征;
将网络特征输入至第一模型得到通信链路的检测结果,检测结果用于指示通信链路是否为异常链路,第一模型是根据第一样本集中的已标记样本、K个已标记样本和M个未标记样本,对上一次训练得到的第二模型进行训练,在训练满足预设条件时得到的模型,K个已标记样本是对第一样本集中的K个未标记样本分别进行标记得到的,M个未标记样本是从第一样本集中选出来的作为负样本的未标记样本,第一样本集包括选取K个未标记样本和M个未标记样本之前,预先存储的已标记样本和未标记样本。
在一种可能的示例中,在将网络特征输入至第一模型之前,处理器701还用于执行以下操作:
获取第一样本集中每一未标记样本的异常评分值;
根据第一样本集中每一未标记样本的异常评分值进行降序排列得到第一排序;
将第一排序中前K个序号对应的未标记样本作为K个未标记样本。
在一种可能的示例中,处理器701还用于执行以下操作:
将第一排序中后L个序号对应的未标记样本作为L个未标记样本;
从L个未标记样本中选取M个未标记样本。
在一种可能的示例中,M等于第一样本集中的已标记样本和K个已标记样本中正样本的数量。
在一种可能的示例中,在将网络特征输入至第一模型之前,处理器701还用于执行以下操作:
获取通信链路的网络拓扑信息;
将预先存储的与网络拓扑信息对应的未标记样本和已标记样本组成的集合作为第一样本集。
当该设备700可以包括异常链路检测装置,或者为模型训练装置,或者为检测节点或其它的任意一种可能的装置时,在一种可能的示例中,在获取第一样本集中每一未标记样本的异常评分值之前,处理器701还用于执行以下操作:
获取第二样本集中每一未标记样本的异常评分值,第二样本集包括选取P个未标记样本之前,预先存储的已标记样本和未标记样本;
根据第二样本集中每一未标记样本的异常评分值进行降序排列得到第二排序;
将第二排序中前P个序号对应的未标记样本作为P个未标记样本;
根据第二样本集中的已标记样本和P个已标记样本构建第三模型,P个已标记样本是对P个未标记样本分别进行标记得到的,第三模型为第一模型和第二模型对应的初始化模型。
在一种可能的示例中,网络数据包括以下至少一项:信噪比、输入信号的电平、误码秒、严重误码秒、不可用时间、网络拓扑信息。
需要说明的是,各个操作的实现还可以对应参照图1和图4所示的方法实施例的相应描述。
本申请实施例还提供了一种芯片,包括处理器和存储器,处理器用于从存储器中调用并运行存储器中存储的指令,使得安装有芯片的设备执行图1和图4所示的任一方法。
本申请实施例还提供了另一种芯片,包括:输入接口、输出接口和处理电路,输入接口、输出接口与处理电路之间通过内部连接通路相连,处理电路用于执行图1和图4所示的任一方法。
本申请实施例还提供了另一种芯片,包括:输入接口、输出接口、处理器,可选的,还包括存储器,输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连,处理器用于执行存储器中的代码,当代码被执行时,处理器用于执行图1和图4所示的任一方法。
本申请实施例还提供一种芯片系统,包括至少一个处理器,存储器和接口电路,存储器、收发器和至少一个处理器通过线路互联,至少一个存储器中存储有计算机程序;计算机程序被处理器执行时,图1和图4所示的方法流程得以实现。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,图1和图4所示的方法流程得以实现。
本申请实施例还提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,图1和图4所示的方法流程得以实现。
综上所述,通过实施本申请实施例,先根据从未标记样本中选取的样本和现有的标记样本,对上一次训练得到的第二模型进行训练得到第一模型。在接收到的通信链路中网络节点的网络数据之后,获取网络数据的网络特征,再将该网络特征输入至第一模型,得到该通信链路是否为异常链路的检测结果,提高了检测的准确率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来计算机程序相关的硬件完成,该计算机程序可存储于计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储计算机程序代码的介质。

Claims (10)

1.一种异常链路检测方法,其特征在于,包括:
接收通信链路中至少一个网络节点的网络数据;
获取所述网络数据对应的网络特征;
将所述网络特征输入至第一模型,得到所述通信链路的检测结果,所述检测结果用于指示所述通信链路是否为异常链路,所述第一模型是根据第一样本集中的已标记样本、K个已标记样本和M个未标记样本,对上一次训练得到的第二模型进行训练,在训练满足预设条件时得到的模型,所述K个已标记样本是对所述第一样本集中的K个未标记样本分别进行标记得到的,所述M个未标记样本是从所述第一样本集中选出来的作为负样本的未标记样本,所述第一样本集包括选取所述K个未标记样本和所述M个未标记样本之前,预先存储的已标记样本和未标记样本。
2.根据权利要求1所述的方法,其特征在于,在所述将所述网络特征输入至第一模型之前,所述方法还包括:
获取所述第一样本集中每一未标记样本的异常评分值;
根据所述第一样本集中每一未标记样本的异常评分值进行降序排列,得到第一排序;
将所述第一排序中前K个序号对应的未标记样本作为所述K个未标记样本。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
将所述第一排序中后L个序号对应的未标记样本作为L个未标记样本;
从所述L个未标记样本中选取所述M个未标记样本。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述M等于所述第一样本集中的已标记样本和所述K个已标记样本中正样本的数量。
5.根据权利要求2-4中任一项所述的方法,其特征在于,在所述获取所述第一样本集中每一未标记样本的异常评分值之前,所述方法还包括:
获取第二样本集中每一未标记样本的异常评分值,所述第二样本集包括选取P个未标记样本之前,预先存储的已标记样本和未标记样本;
根据所述第二样本集中每一未标记样本的异常评分值进行降序排列,得到第二排序;
将所述第二排序中前P个序号对应的未标记样本作为所述P个未标记样本;
根据所述第二样本集中的已标记样本和P个已标记样本构建第三模型,所述P个已标记样本是对所述P个未标记样本分别进行标记得到的,所述第三模型为所述第一模型和所述第二模型对应的初始化模型。
6.根据权利要求1-5中任一项所述的方法,其特征在于,在所述将所述网络特征输入至第一模型之前,所述方法还包括:
获取所述通信链路的网络拓扑信息;
将预先存储的与所述网络拓扑信息对应的未标记样本和已标记样本组成的集合作为所述第一样本集。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述网络数据包括以下至少一项:信噪比、输入信号的电平、误码秒、严重误码秒、不可用时间、偏度、网络拓扑信息。
8.一种异常链路检测装置,其特征在于,包括:
通信单元,用于接收通信链路中至少一个网络节点的网络数据;
处理单元,用于获取所述网络数据对应的网络特征;将所述网络特征输入至第一模型,得到所述通信链路的检测结果,所述检测结果用于指示所述通信链路是否为异常链路,所述第一模型是根据第一样本集中的已标记样本、K个已标记样本和M个未标记样本,对上一次训练得到的第二模型进行训练,在训练满足预设条件时得到的模型,所述K个已标记样本是对所述第一样本集中的K个未标记样本分别进行标记得到的,所述M个未标记样本是从所述第一样本集中选出来的作为负样本的未标记样本,所述第一样本集包括选取所述K个未标记样本和所述M个未标记样本之前,预先存储的已标记样本和未标记样本。
9.一种设备,其特征在于,包括处理器和与所述处理器连接的存储器和通信接口,其中,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7中任一项所述的方法中的步骤的指令。
10.一种计算机存储介质,其特征在于,包括计算机指令,当所述计算机指令在终端上运行时,使得所述终端执行如权利要求1-7任一项所述的执行命令的方法。
CN202010981945.1A 2020-09-17 2020-09-17 异常链路检测方法、装置及存储介质 Pending CN114205245A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010981945.1A CN114205245A (zh) 2020-09-17 2020-09-17 异常链路检测方法、装置及存储介质
PCT/CN2021/098011 WO2022057321A1 (zh) 2020-09-17 2021-06-02 异常链路检测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010981945.1A CN114205245A (zh) 2020-09-17 2020-09-17 异常链路检测方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN114205245A true CN114205245A (zh) 2022-03-18

Family

ID=80644877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010981945.1A Pending CN114205245A (zh) 2020-09-17 2020-09-17 异常链路检测方法、装置及存储介质

Country Status (2)

Country Link
CN (1) CN114205245A (zh)
WO (1) WO2022057321A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116132330A (zh) * 2022-07-12 2023-05-16 马上消费金融股份有限公司 网络检测方法、网络检测模型训练方法及装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114793205A (zh) * 2022-04-25 2022-07-26 咪咕文化科技有限公司 异常链路检测方法、装置、设备及存储介质
CN115102736B (zh) * 2022-06-15 2024-04-26 天津市国瑞数码安全系统股份有限公司 一种基于模式识别的网络安全评估的方法和系统
CN115296984B (zh) * 2022-08-08 2023-12-19 中国电信股份有限公司 异常网络节点的检测方法及装置、设备、存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9038172B2 (en) * 2011-05-06 2015-05-19 The Penn State Research Foundation Robust anomaly detection and regularized domain adaptation of classifiers with application to internet packet-flows
CN114039794A (zh) * 2019-12-11 2022-02-11 支付宝(杭州)信息技术有限公司 基于半监督学习的异常流量检测模型训练方法及装置
CN111585997B (zh) * 2020-04-27 2022-01-14 国家计算机网络与信息安全管理中心 一种基于少量标注数据的网络流量异常检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116132330A (zh) * 2022-07-12 2023-05-16 马上消费金融股份有限公司 网络检测方法、网络检测模型训练方法及装置

Also Published As

Publication number Publication date
WO2022057321A1 (zh) 2022-03-24

Similar Documents

Publication Publication Date Title
CN114205245A (zh) 异常链路检测方法、装置及存储介质
US11569933B2 (en) Method and apparatus for detecting physical downlink control channel based on predicted information
KR102091126B1 (ko) IoT 데이터 분석을 위한 에지-클라우드 협업 시스템 및 이의 운용방법
CN112913274B (zh) 用于自组织网络的优化的过程
WO2022000365A1 (en) Machine learning based downlink channel estimation and prediction
CN110324170B (zh) 数据分析设备、多模型共决策系统及方法
EP3742669B1 (en) Machine learning in radio access networks
CN103716123A (zh) 一种传感器网络中分组丢失和错误的原因识别方法和系统
JP5674890B2 (ja) 多重無線技術による干渉及び輻輳検出のための方法
US11863495B2 (en) Signaling for a channel state information reference signal (CSI-RS)
CN111466130A (zh) 基于性能信息、配置信息和环境信息来执行移动通信网络的分析和管理
Aguilar-Garcia et al. Location-aware self-organizing methods in femtocell networks
KR20230091093A (ko) 조건부 변이형 오토-인코더들을 사용한 무선 채널들의 데이터-기반 확률론적 모델링
US20230093673A1 (en) Reinforcement learning (rl) and graph neural network (gnn)-based resource management for wireless access networks
Ouattara et al. Spectrum sensing improvement in cognitive radio networks for real-time patients monitoring
Ruah et al. Digital twin-based multiple access optimization and monitoring via model-driven Bayesian learning
US11888543B2 (en) Method and device for analyzing performance degradation of cell in wireless communication system
US20230262489A1 (en) Apparatuses and methods for collaborative learning
WO2023041992A1 (en) Systems and methods for performing root cause analysis
KR20180072318A (ko) 데이터 왜곡을 방지할 수 있는 사물 인터넷 네트워크 시스템
CN117044375A (zh) 通信网络中的方法和节点
Reddy et al. Experimental Testing of Primary User Detection Using Decision Tree Algorithm With Software Defined Radio Testbed
WO2023245620A1 (en) Handover failure cause classification
EP3783925B1 (en) Determination of indoor/outdoor in mobile networks using deep learning
WO2022236807A1 (en) Model status monitoring, reporting, and fallback in machine learning applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination