CN111800289A - 通信网络故障分析方法和装置 - Google Patents

通信网络故障分析方法和装置 Download PDF

Info

Publication number
CN111800289A
CN111800289A CN202010426254.5A CN202010426254A CN111800289A CN 111800289 A CN111800289 A CN 111800289A CN 202010426254 A CN202010426254 A CN 202010426254A CN 111800289 A CN111800289 A CN 111800289A
Authority
CN
China
Prior art keywords
signaling
cell
abnormal
abnormal problem
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010426254.5A
Other languages
English (en)
Other versions
CN111800289B (zh
Inventor
秦臻
吕佳
饶思维
叶强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202010426254.5A priority Critical patent/CN111800289B/zh
Publication of CN111800289A publication Critical patent/CN111800289A/zh
Application granted granted Critical
Publication of CN111800289B publication Critical patent/CN111800289B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

本申请提供一种通信网络故障分析方法和装置。本申请提供的通信网络故障分析方法,包括:从待测的信令数据中提取多个信令流程;判断多个信令流程是否全部为异常信令流程;若非全部为异常信令流程,则获取差异信元,差异信元是异常信令流程和正常信令流程之间存在最大差异的信元;若全部为异常信令流程,则获取第一关联信元,第一关联信元是与异常问题关联的信元;根据差异信元或关联信元获取故障分析结果。本申请提供的通信网络故障分析方法应用到通信网络故障分析领域,可以很好的适应网络情况变化所带来的规则更新与判断逻辑的及时调整,降低对专家知识的依赖,有效提高了异常信元判断的准确率,使得通信网络演变为智能网络、自动驾驶网络。

Description

通信网络故障分析方法和装置
技术领域
本申请涉及人工智能技术领域,尤其涉及一种通信网络故障分析方法和装置。
背景技术
为了使通信网络中的各种设备能协调运转,信令作为设备间的一种控制指令,不仅可以说明设备自身的运行情况,还可以对相关设备提出接续要求。而作为记载业务流程最细粒度的数据,运维中的很多故障问题都需要分析信令数据才能完成异常识别、根因分析与故障问题定界等工作。
相关技术中,基于规则总结出异常业务的业务特征库和信令特征库,将待测数据中的业务数据和信令数据分别在业务特征库和信令特征库中进行匹配查找,完成业务的质量分析。其中,涉及信令数据与信令特征库的匹配过程中,通过信令数据中信元的具体取值是否满足特定规则,完成信元级的异常分析,进而判断待测数据的异常原因。或者,将待测流程与所有预设的标准流程进行比对,获取不完整的信令和信令缺失的节点,进而完成待测流程的信元级异常检测,获取错误码。比对预设的信令变化规则,得到错误的信令和信令错误的节点,确定故障原因。
但是上述方法过于依赖人工总结的特征库或标准流程库,大大降低了应用的便利性,不能很好的适应网络情况变化所带来的规则更新与判断逻辑的及时调整,而且不适用于异常判断标准不明确的场景,人工无法预先地定义合理的规则或枚举所有标准流程。
发明内容
本申请提供一种通信网络故障分析方法和装置,可以很好的适应网络情况变化所带来的规则更新与判断逻辑的及时调整,降低对专家知识的依赖,有效提高了异常信元判断的准确率,使得通信网络演变为智能网络、自动驾驶网络。
第一方面,本申请提供一种通信网络故障分析方法,包括:从待测的信令数据中提取多个信令流程,每条所述信令流程包括一个或多个信元;判断所述多个信令流程是否全部为异常信令流程;若所述多个信令流程非全部为异常信令流程,则获取差异信元,所述差异信元是所述多个信令流程中的异常信令流程和所述多个信令流程中的正常信令流程之间存在最大差异的信元,所述多个信令流程包括所述至少一个异常信令流程和所述至少一个正常信令流程;若所述多个信令流程全部为异常信令流程,则获取第一关联信元,所述第一关联信元是所述多个信令流程中与所述异常信令流程中的异常问题关联的信元;根据所述差异信元或所述第一关联信元获取故障分析结果。
本申请智能化地完成信元级信令数据的故障辅助分析,得到正常信令流程中与异常信令流程差异最大的信元和/或与异常信令流程相关联的信元,一方面,可以很好的适应网络情况变化所带来的规则更新与判断逻辑的及时调整,无需依赖专家总结的各种标准流程及信元判断规则,有效提高了异常信元判断的准确率,另一方面,以数据驱动的方式得到异常信令流程的关联信元,降低对专家知识的依赖。
在一种可能的实现方式中,还包括:若所述多个信令流程非全部为异常信令流程,则获取第二关联信元,根据所述差异信元和所述第二关联信元获取故障分析结果,所述第二关联信元是所述多个信令流程中与所述多个信令流程中的异常信令流程中的异常问题关联的信元。
在一种可能的实现方式中,所述获取差异信元,包括:获取第一特征向量集合和第二特征向量集合,所述第一特征向量集合包括至少一个所述异常信令流程的特征向量,所述第二特征向量集合包括至少一个所述正常信令流程的特征向量;根据所述第一特征向量集合和所述第二特征向量集合得到所述差异信元。
在一种可能的实现方式中,所述根据所述第一特征向量集合和所述第二特征向量集合得到所述差异信元,包括:获取所述第一特征向量集合和所述第二特征向量集合中的每一维特征与类别向量之间的相关性;根据所述相关性通过基于特征选择的机器学习方法获取所述差异信元。
在一种可能的实现方式中,所述获取所述第一特征向量集合和所述第二特征向量集合中的每一维特征与类别向量之间的相关性,包括:计算所述第一特征向量集合和所述第二特征向量集合中的每一维特征与所述类别向量的互信息;根据所述互信息得到所述相关性。
针对通信网络中控制面信令的诸多不同协议,以数据驱动的方式通过提取各协议都支持的信令信息、利用各协议都支持的信元分析方法,有效消除了各信令协议间的格式差异,提供了一种通用的信元级信令分析辅助方案。针对网络环境未知情况下的大规模正常信令跟踪数据和异常跟踪数据,通过参考流程异常检测识别到的正常信令流程,推荐出异常信令流程中与正常信令流程间差异最大的信元,无需依赖专家总结的各种标准流程及信元判断规则,有效提高了异常信元分析的准确率、降低各协议的后期维护成本。
在一种可能的实现方式中,所述获取第一关联信元,包括:对第一异常问题通过语义相似度模型进行语义相似度处理得到与所述第一异常问题关联的第一信元,所述第一异常问题为第一信令流程中存在的至少一个异常问题中的任意一个,所述第一信令流程为一个或多个所述异常信令流程中的任意一个;对所述第一异常问题进行文本相似度处理得到与所述第一异常问题关联的第二信元;所述第一关联信元包括所述第一信元和/或所述第二信元。
在一种可能的实现方式中,还包括:维护专家知识库,所述专家知识库包括异常问题描述信息、异常问题协议信息和异常问题接口信息中的一个或多个信息。
在一种可能的实现方式中,所述根据所述差异信元和/或所述关联信元获取故障分析结果之后,还包括:获取用户反馈,所述用户反馈包括与所述第一异常问题关联的第三信元;将所述第三信元加入所述专家知识库,并建立所述第一异常问题和所述第三信元之间的关联关系。
在一种可能的实现方式中,所述若所述多个信令流程全部为异常信令流程,则获取第一关联信元之前,还包括:根据所述专家知识库获取所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元;所述对第一异常问题进行语义相似度处理得到与所述第一异常问题关联的第一信元,包括:根据所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元对所述第一异常问题进行语义相似度处理得到所述第一信元;所述对所述第一异常问题进行文本相似度处理得到与所述第一异常问题关联的第二信元,包括:根据所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元对所述第一异常问题进行文本相似度处理得到所述第二信元。
在一种可能的实现方式中,还包括:基于信令数据构建语料库,所述信令数据中的信令流程对应所述语料库中的文档,所述信令流程中的信令消息对应所述语料库中的段落,所述信令消息中的业务结构对应所述语料库中的句子,所述业务结构中的信元对应所述语料库中的词;根据所述语料库创建所述语义相似度模型。
针对通信网络中控制面信令的诸多不同协议,以数据驱动的方式通过提取各协议都支持的信令信息、利用各协议都支持的信元分析方法,有效消除了各信令协议间的格式差异,提供了一种通用的信元级信令分析辅助方案。针对信元分析标准不明确时的异常跟踪数据,以少量专家知识为基础、基于语义相似度的处理可快速推荐出与异常问题相关联的信元,避免了组网配置对信元判断标准的影响,保证了模块初期对工程师的辅助效果。随后,以数据驱动的方式完成对专家知识的扩充,降低对专家知识的依赖。最终,随着用户反馈的不断积累,可以逐渐学习到用户的业务分析经验,推荐的关联信元也会更符合用户的业务期望。
在一种可能的实现方式中,所述从待测的信令数据中提取多个信令流程,包括:对所述信令数据中的多条信令消息进行解析得到至少三种信息,所述至少三种信息包括信令消息的协议类型、信令消息的生成接口和信令消息的流程标识;根据所述信令消息的协议类型、所述信令消息的生成接口和所述信令消息的流程标识中的一个或多个信息对所述信令数据中的各条信令消息进行分组,每组中的一条或多条信令消息组成一个信令流程。
第二方面,本申请提供一种通信网络故障分析装置,包括:解析模块,用于从待测的信令数据中提取多个信令流程,每条所述信令流程包括一个或多个信元;流程检测模块,用于判断所述多个信令流程是否全部为异常信令流程;差异信元模块,用于若所述多个信令流程非全部为异常信令流程,则获取差异信元,所述差异信元是所述多个信令流程中的异常信令流程和所述多个信令流程中的正常信令流程之间存在最大差异的信元,所述多个信令流程包括所述至少一个异常信令流程和所述至少一个正常信令流程;关联信元模块,用于若所述多个信令流程全部为异常信令流程,则获取第一关联信元,所述第一关联信元是所述多个信令流程中与所述异常信令流程中的异常问题关联的信元;分析模块,用于根据所述差异信元或所述第一关联信元获取故障分析结果。
在一种可能的实现方式中,所述关联信元模块,还用于若所述多个信令流程非全部为异常信令流程,则获取第二关联信元,根据所述差异信元和所述第二关联信元获取故障分析结果,所述第二关联信元是所述多个信令流程中与所述多个信令流程中的异常信令流程中的异常问题关联的信元。
在一种可能的实现方式中,所述差异信元模块,具体用于获取第一特征向量集合和第二特征向量集合,所述第一特征向量集合包括至少一个所述异常信令流程的特征向量,所述第二特征向量集合包括至少一个所述正常信令流程的特征向量;根据所述第一特征向量集合和所述第二特征向量集合得到所述差异信元。
在一种可能的实现方式中,所述差异信元模块,具体用于获取所述第一特征向量集合和所述第二特征向量集合中的每一维特征与类别向量之间的相关性;根据所述相关性通过基于特征选择的机器学习方法获取所述差异信元。
在一种可能的实现方式中,所述差异信元模块,具体用于计算所述第一特征向量集合和所述第二特征向量集合中的每一维特征与所述类别向量的互信息;根据所述互信息得到所述相关性。
在一种可能的实现方式中,所述关联信元模块,具体用于对第一异常问题通过语义相似度模型进行语义相似度处理得到与所述第一异常问题关联的第一信元,所述第一异常问题为第一信令流程中存在的至少一个异常问题中的任意一个,所述第一信令流程为一个或多个所述异常信令流程中的任意一个;对所述第一异常问题进行文本相似度处理得到与所述第一异常问题关联的第二信元;所述第一关联信元包括所述第一信元和/或所述第二信元。
在一种可能的实现方式中,所述关联信元模块,还用于维护专家知识库,所述专家知识库包括异常问题描述信息、异常问题协议信息和异常问题接口信息中的一个或多个信息。
在一种可能的实现方式中,所述关联信元模块,还用于获取用户反馈,所述用户反馈包括与所述第一异常问题关联的第三信元;将所述第三信元加入所述专家知识库,并建立所述第一异常问题和所述第三信元之间的关联关系。
在一种可能的实现方式中,所述关联信元模块,还用于根据所述专家知识库获取所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元;根据所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元对所述第一异常问题进行语义相似度处理得到所述第一信元;根据所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元对所述第一异常问题进行文本相似度处理得到所述第二信元。
在一种可能的实现方式中,所述关联信元模块,还用于基于信令数据构建语料库,所述信令数据中的信令流程对应所述语料库中的文档,所述信令流程中的信令消息对应所述语料库中的段落,所述信令消息中的业务结构对应所述语料库中的句子,所述业务结构中的信元对应所述语料库中的词;根据所述语料库创建所述语义相似度模型。
在一种可能的实现方式中,所述解析模块,具体用于对所述信令数据中的多条信令消息进行解析得到至少三种信息,所述至少三种信息包括信令消息的协议类型、信令消息的生成接口和信令消息的流程标识;根据所述信令消息的协议类型、所述信令消息的生成接口和所述信令消息的流程标识中的一个或多个信息对所述信令数据中的各条信令消息进行分组,每组中的一条或多条信令消息组成一个信令流程。
第三方面,本申请提供一种终端设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述第一方面中任一项所述的方法。
第四方面,本申请提供一种计算机可读存储介质,包括计算机程序,所述计算机程序在计算机上被执行时,使得所述计算机执行上述第一方面中任一项所述的方法。
第五方面,本申请提供一种计算机程序,当所述计算机程序被计算机执行时,用于执行上述第一方面中任一项所述的方法。包括:
附图说明
图1为本申请提供的通信网络故障分析方法所适用的系统的一个示例性的框架图;
图2示出了终端设备200的一个示例性的结构示意图;
图3为本申请通信网络故障分析方法实施例一的流程图;
图4为信令流程检测的一个示例性的示意图;
图5为本申请获取差异信元的一个示例性的流程图;
图6为基于封装的特征选择的一个示例性的模型框架图;
图7为本申请获取关联信元的一个示例性的流程图;
图8为AHP-UMDA算法的一个示例性的流程图;
图9为本申请通信网络故障分析方法实施例二的流程图;
图10为本申请通信网络故障分析方法实施例三的流程图;
图11为本申请通信网络故障分析装置实施例的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书实施例和权利要求书及附图中的术语“第一”、“第二”等仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
本申请涉及到的相关技术说明:
信令流程:是指通信网络中的各个设备之间传递的、用于呼叫、承载或连接等业务功能的信令消息所组成的控制流程。
信元:用于描述业务类型指示、承载建立参数、用户标识等信息,由具体信令所遵从的协议定义其含义,按照协议定义的方式将其封装成信令消息。信元是交换和多路复用的基本单位,由信头和信息段组成,信头中封装有控制信息,信息段作为负载封装了被分解成数据块的用户信息或其他管理信息。每个信元可以由5字节的信头和48字节的有效负载组成。
域:通常是指互联网技术的基础资源的一个逻辑划分,用于对基础资源进行规划和管理,不同域的业务不同,使用的通信协议也不同。
接口:是指通信网络中的两个设备或系统之间的边界,由特定的协议或规范进行定义,用于确保边界处的格式、功能、信号和互连的兼容性。
网元:通常是指通信网络中的一个系统设备、实体或节点,包括所有位于同一个位置的相关硬件或软件、并执行所属产品类别主要功能的所有组件。
组网:通常是指通信网络的建设、设计和使用,包括物理组网(布线,集线器,桥接器,交换机和路由器等),选择和使用电信协议及计算机软件来管理网络,以及建立与网络相关的运营政策和程序。
控制面信令:通常指通信网络中为用户建立业务的控制型信令数据。
接口跟踪:是指跟踪指定网元对内的所有业务,涉及两个网元间发生业务的所有用户,所有消息遵循相同的协议。
用户跟踪:是指跟踪一个完整的端到端业务流程,只涉及指定用户涉及的所有消息,跟踪的数据可以来自不同协议或接口。
为了使通信网络中的各种设备能协调运转,信令作为设备间的一种控制指令,不仅可以说明设备自身的运行情况,还可以对相关设备提出接续要求。而作为记载业务流程最细粒度的数据,运维中的很多故障问题都需要分析信令数据才能完成异常识别、根因分析与故障问题定界等工作。
信令是以信令消息为单位进行指令传递的,一个业务流程对应一个信令消息的序列,一条信令消息由若干个必选和可选的信元组成。作为信令消息的最小信息承载单元,信元由具体信令所遵从的协议定义其含义,再按照协议定义的方式封装成信令消息,以描述业务类型指示、承载建立参数、用户标识等信息。一般情况下,信元的取值常由数字和该数字对应的描述性字符串组成。
由于信令数据的数据量大,信令数据的收集功能需要工程师得到授权后手动开启,工程师分析的信令数据可分为接口跟踪和用户跟踪两种模式。其中,接口跟踪聚焦网元对,涉及开启跟踪期间两网元间发生业务的所有用户,短时间内即可获得大规模的信令数据。用户跟踪聚焦指定用户涉及的所有消息,涉及多个网元和接口,反映了一个完整的端到端业务流程。
出现通信网络故障后,在确认信令流程异常或信令消息异常后仍需进一步地分析信元,从而完成对故障问题的分析。但是,实际的信元级信令分析具有三大特点:
首先,批量信令数据中的信元规模庞大且逻辑复杂,例如,接口跟踪单次待测的信令数据常达数万条,每条信令消息包含至少几十个具有不同业务含义的信元信息。
其次,由于信元的取值一般由协议逻辑和组网配置共同决定,信元的分析不仅需要依赖信令消息的上下文内容,还需要依赖组网环境的配置。
第三,不同协议背后互不相同的业务逻辑让信元分析变得更加复杂,往往需要有丰富的业务知识和经验作为支撑,整体的分析效率低、成本高。
基于此,信元级信令分析技术主要分为两类:一类是规则匹配,通过工程师分析历史信令问题,总结得到各协议的信元分析规则库,基于待测信令数据与规则库的匹配结果进行信元级信令分析。然而,这些规则完全依赖于专家总结,为每个协议总结规则的工作量大,成本高。另一类是流程比对,基于工程师预先总结的各种可能的标准信令流程,通过比对待测信令数据和标准流程来判断信元是否缺失或异常。但是由于标准流程很难穷尽,完全依靠专家总结的标准流程常会导致信元分析的假阳性高。此外,因为上述规则库和标准流程都是预设的,面对变化多样的组网环境,当仅有异常信令数据可供分析时,信元分析的异常判断标准是不明确的,难以总结全面。
本申请提供了一种通信网络故障分析方法,无需依赖专家总结的规则库或标准流程,能很好的适应于网络情况变化所带来的逻辑调整,且针对信元分析的异常判断标准不明确的场景,以数据驱动的方式快速完成专家知识的扩充,保证该场景下的信元级分析准确灵活。
图1为本申请提供的通信网络故障分析方法所适用的系统的一个示例性的框架图,如图1所示,该系统包括信令数据输入模块101、流程异常检测模块102、差异信元选择模块103、关联信元获取模块104和分析结果输出模块105。
待测信令数据可以是来自但不仅限于无线领域,例如,长期演进(long termevolution,LTE)通信系统、通用移动通信系统(universal mobile telecommunicationssystem,UMTS)通信系统、新无线(new radio,NR)通信系统等,电路交换域(CircuitSwitched),分组交换域(Packet Switched)等的交互控制类型的数据。
信令数据输入模块101收集待测信令数据,并将待测信令数据转换成流程异常检测模块102、差异信元选择模块103和关联信元获取模块104需要的数据格式。
流程异常检测模块102对经信令数据输入模块101处理得到的待测信令流程进行检测,识别待测信令流程中的异常信令流程和/或正常信令流程。
差异信元选择模块103根据待测信令流程中的异常信令流程和正常信令流程,推荐出异常信令流程中与正常信令流程差异最大的信元。
关联信元获取模块104对于待测信令流程中的异常信令流程,推荐出流程中与异常信令流程中的异常问题相关联的信元。
分析结果输出模块105输出最终的信令分析结果,以供工程师作进一步的分析或故障定位。
图1所示的系统可以部署于终端设备上,该终端设备可以具备无线或有线的通信能力,也可以具备输入/输出功能,以获取待测的信令数据,并将分析得到的结果输出给其他设备或显示于屏幕上。该终端设备具备处理能力,以实现上述流程异常检测模块102、差异信元选择模块103和关联信元获取模块104的功能。
终端设备可以部署在陆地上,包括室内或室外、手持或车载;也可以部署在水面上(如轮船等);还可以部署在空中(例如飞机、气球和卫星上等)。终端设备可以是手机(mobile phone)、平板电脑(pad)、带无线收发功能的电脑、工业控制(industrialcontrol)中的无线设备等,本申请对此不作限定。
图2示出了终端设备200的一个示例性的结构示意图。如图2所示,终端设备200包括:应用处理器201、微控制器单元(microcontroller unit,MCU)202、存储器203、调制解调器(modem)204、射频(radio frequency,RF)模块205、无线保真(Wireless-Fidelity,简称Wi-Fi)模块206、蓝牙模块207、传感器208、输入/输出(input/output,I/O)设备209、定位模块210等部件。这些部件可通过一根或多根通信总线或信号线进行通信。前述通信总线或信号线可以是本申请提供的CAN总线。本领域技术人员可以理解,终端设备200可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图2对终端设备200的各个部件进行具体的介绍:
应用处理器201是终端设备200的控制中心,利用各种接口和总线连接终端设备200的各个部件。在一些实施例中,处理器201可包括一个或多个处理单元。
存储器203中存储有计算机程序,诸如图2所示的操作系统211和应用程序212。应用处理器201被配置用于执行存储器203中的计算机程序,从而实现该计算机程序定义的功能,例如应用处理器201执行操作系统211从而在终端设备200上实现操作系统的各种功能。存储器203还存储有除计算机程序之外的其他数据,诸如操作系统211和应用程序212运行过程中产生的数据。存储器203为非易失性存储介质,一般包括内存和外存。内存包括但不限于随机存取存储器(random access memory,RAM),只读存储器(read-only memory,ROM),或高速缓存(cache)等。外存包括但不限于闪存(flash memory)、硬盘、光盘、通用串行总线(universal serial bus,USB)盘等。计算机程序通常被存储在外存上,处理器在执行计算机程序前会将该程序从外存加载到内存。
存储器203可以是独立的,通过总线与应用处理器201相连接;存储器203也可以和应用处理器201集成到一个芯片子系统。
MCU 202是用于获取并处理来自传感器208的数据的协处理器,MCU 202的处理能力和功耗小于应用处理器201,但具有“永久开启(always on)”的特点,可以在应用处理器201处于休眠模式时持续收集以及处理传感器数据,以极低的功耗保障传感器的正常运行。在一个实施例中,MCU 202可以为sensor hub芯片。传感器208可以包括光传感器、运动传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示器2091的亮度,接近传感器可在终端设备200移动到耳边时,关闭显示屏的电源。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向;传感器208还可以包括陀螺仪、气压计、湿度计、温度计、红外线传感器等其它传感器,在此不再赘述。MCU 202和传感器208可以集成到同一块芯片上,也可以是分离的元件,通过总线连接。
modem 204以及射频模块205构成了终端设备200通信子系统,用于实现无线通信标准协议的主要功能。其中,modem 204用于编解码、信号的调制解调、均衡等。射频模块205用于无线信号的接收和发送,射频模块205包括但不限于天线、至少一个放大器、耦合器、双工器等。射频模块205配合modem 204实现无线通信功能。modem 204可以作为单独的芯片,也可以与其他芯片或电路在一起形成系统级芯片或集成电路。这些芯片或集成电路可应用于所有实现无线通信功能的终端设备,包括:手机、电脑、笔记本、平板、路由器、可穿戴设备、汽车、家电设备等。
终端设备200还可以使用Wi-Fi模块206,蓝牙模块207等来进行无线通信。Wi-Fi模块206用于为终端设备200提供遵循Wi-Fi相关标准协议的网络接入,终端设备200可以通过Wi-Fi模块206接入到Wi-Fi接入点,进而访问互联网。在其他一些实施例中,Wi-Fi模块206也可以作为Wi-Fi无线接入点,可以为其他终端设备提供Wi-Fi网络接入。蓝牙模块207用于实现终端设备200与其他终端设备(例如手机、智能手表等)之间的短距离通信。本申请实施例中的Wi-Fi模块206可以是集成电路或Wi-Fi芯片等,蓝牙模块207可以是集成电路或者蓝牙芯片等。
定位模块210用于确定终端设备200的地理位置。可以理解的是,定位模块210具体可以是全球定位系统(global position system,GPS)或北斗卫星导航系统、俄罗斯GLONASS等定位系统的接收器。
Wi-Fi模块206,蓝牙模块207和定位模块210分别可以是单独的芯片或集成电路,也可以集成到一起。例如,在一个实施例中,Wi-Fi模块206,蓝牙模块207和定位模块210可以集成到同一芯片上。在另一个实施例中,Wi-Fi模块206,蓝牙模块207、定位模块210以及MCU 202也可以集成到同一芯片中。
输入/输出设备209包括但不限于:显示器2091、触摸屏2092,以及音频电路2093等等。
其中,触摸屏2092可采集终端设备200的用户在其上或附近的触摸事件(比如用户使用手指、触控笔等任何适合的物体在触摸屏2092上或在触控屏触摸屏2092附近的操作),并将采集到的触摸事件发送给其他器件(例如应用处理器201)。其中,用户在触摸屏2092附近的操作可以称之为悬浮触控;通过悬浮触控,用户可以在不直接接触触摸屏2092的情况下选择、移动或拖动目的(例如图标等)。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型来实现触摸屏2092。
显示器(也称为显示屏)2091用于显示用户输入的信息或展示给用户的信息。可以采用液晶显示屏、有机发光二极管等形式来配置显示器。触摸屏2092可以覆盖在显示器2091之上,当触摸屏2092检测到触摸事件后,传送给应用处理器201以确定触摸事件的类型,随后应用处理器201可以根据触摸事件的类型在显示器2091上提供相应的视觉输出。虽然在图2中,触摸屏2092与显示器2091是作为两个独立的部件来实现终端设备200的输入和输出功能,但是在某些实施例中,可以将触摸屏2092与显示器2091集成而实现终端设备200的输入和输出功能。另外,触摸屏2092和显示器2091可以以全面板的形式配置在终端设备200的正面,以实现无边框的结构。
音频电路2093、扬声器2094、麦克风2095可提供用户与终端设备200之间的音频接口。音频电路2093可将接收到的音频数据转换后的电信号,传输到扬声器2094,由扬声器2094转换为声音信号输出;另一方面,麦克风2095将收集的声音信号转换为电信号,由音频电路2093接收后转换为音频数据,再通过modem 204和射频模块205将音频数据发送给比如另一终端设备,或者将音频数据输出至存储器203以便进一步处理。
另外,终端设备200还可以具有指纹识别功能。例如,可以在终端设备200的背面(例如后置摄像头的下方)配置指纹采集器件,或者在终端设备200的正面(例如触摸屏2092的下方)配置指纹采集器件。又例如,可以在触摸屏2092中配置指纹采集器件来实现指纹识别功能,即指纹采集器件可以与触摸屏2092集成在一起来实现终端设备200的指纹识别功能。在这种情况下,该指纹采集器件配置在触摸屏2092中,可以是触摸屏2092的一部分,也可以以其他方式配置在触摸屏2092中。本申请实施例中的指纹采集器件的主要部件是指纹传感器,该指纹传感器可以采用任何类型的感测技术,包括但不限于光学式、电容式、压电式或超声波传感技术等。
进一步地,终端设备200搭载的操作系统211可以为
Figure BDA0002498824740000101
或者其它操作系统,本申请实施例对此不作任何限制。
以搭载
Figure BDA0002498824740000102
操作系统的终端设备200为例,终端设备200从逻辑上可划分为硬件层、操作系统211,以及应用层。硬件层包括如上所述的应用处理器201、MCU 202、存储器203、modem 204、Wi-Fi模块206、传感器208、定位模块210等硬件资源。应用层包括一个或多个应用程序,比如应用程序212,应用程序212可以为社交类应用、电子商务类应用、浏览器等任意类型的应用程序。操作系统211作为硬件层和应用层之间的软件中间件,是管理和控制硬件与软件资源的计算机程序。
在一个实施例中,操作系统211包括内核,硬件抽象层(hardware abstractionlayer,HAL)、库和运行时(libraries and runtime)以及框架(framework)。其中,内核用于提供底层系统组件和服务,例如:电源管理、内存管理、线程管理、硬件驱动程序等;硬件驱动程序包括Wi-Fi驱动、传感器驱动、定位模块驱动等。硬件抽象层是对内核驱动程序的封装,向框架提供接口,屏蔽低层的实现细节。硬件抽象层运行在用户空间,而内核驱动程序运行在内核空间。
库和运行时也叫做运行时库,它为可执行程序在运行时提供所需要的库文件和执行环境。在一个实施例中,库与运行时包括安卓运行时(android runtime,ART),库,以及场景包运行时。ART是能够把应用程序的字节码转换为机器码的虚拟机或虚拟机实例。库是为可执行程序在运行时提供支持的程序库,包括浏览器引擎(比如webkit)、脚本执行引擎(比如JavaScript引擎)、图形处理引擎等。场景包运行时是场景包的运行环境,主要包括页面执行环境(page context)和脚本执行环境(script context),其中,页面执行环境通过调用相应的库解析html、css等格式的页面代码,脚本执行环境通过调用相应的功能库解析执行JavaScript等脚本语言实现的代码或可执行文件。
框架用于为应用层中的应用程序提供各种基础的公共组件和服务,比如窗口管理、位置管理等等。在一个实施例中,框架包括地理围栏服务,策略服务,通知管理器等。
以上描述的操作系统211的各个组件的功能均可以由应用处理器201执行存储器203中存储的程序来实现。
所属领域的技术人员可以理解终端设备200可包括比图2所示的更少或更多的部件,图2所示的该终端设备仅包括与本申请所公开的多个实现方式更加相关的部件。
图3为本申请通信网络故障分析方法实施例一的流程图,如图3所示,该过程300可以应用于图1所示的系统,其执行主体可以是图2所示的终端设备。该过程300描述为一系列的步骤或操作,应当理解的是,过程300可以以各种顺序执行和/或同时发生,不限于图3所示的执行顺序。通信网络故障分析方法可以包括:
步骤301、从待测的信令数据中提取多个信令流程。
待测信令数据可以是来自但不仅限于无线领域,例如,LTE通信系统、UMTS通信系统、NR通信系统等,电路交换域(Circuit Switched),分组交换域(Packet Switched)等的交互控制类型的数据。
本申请中,终端设备会对每条信令消息的数据进行解析,得到表1中示出的六种与信令分析相关的信息。
表1
名称 描述
协议类型 信令消息属于具体哪种信令通信协议
生成接口 信令消息产生于哪种接口之中
时间戳 信令消息发生的具体时间(精确到微秒)
流程标识 确定信令消息属于哪个流程的唯一标识符
消息类型 信令消息的类型
消息内容 信令消息的具体内容
如表1所示,该六种信息包括:协议类型、生成接口、时间戳、流程标识、消息类型和消息内容,其中,协议类型用于指示对应的信令消息所属的通信协议,例如,会话发起协议(session initiation protocol,SIP),S1应用协议(S1 application protocol,S1AP)等。生成接口用于指示对应的信令消息是由哪个接口生成,例如,S11接口、S5接口等。时间戳用于指示对应的信令消息发生的时间,例如,2018-07-10 15:38:10.031。流程标识用于指示对应的信令消息属于哪个信令流程,该流程标识是其唯一的标识符,可以是信令消息中的某个单独字段,也可以是由若干个信令消息中的字段拼接而成。消息类型用于指示对应的信令消息的类型,可以看做是对信令消息的简要描述,例如,RRC_CONN_REQ、SessionRequest等。消息内容用于指示对应的信令消息的具体内容,详细地描述了信令消息内的一个或多个信元的具体取值情况,每个信元以键值对(信元名称-信元值)的形式表示。
需要说明的是,本申请对于信令数据的解析可以得到比表1所示的六种信息更多种类或更少种类的信息,其取决于信令消息的数据中所携带的信息量,本申请对此不作具体限定。
终端设备根据信令消息的上述信息,可以对信令数据中的各条信令消息进行分组,每组中的一条或多条信令消息组成一个信令流程。在一种可能的实现方式中,可以根据协议类型、生成接口和流程标识中的一种或多种信息对信令消息进行分组,例如,属于同一协议,且由相同接口生成的信令消息归入同一组内;或者,属于同一协议,且流程标识相同的信令消息归入同一组内;或者,属于同一协议,由相同接口生成,且流程标识相同的信令消息归入同一组内。
对于同一组内的多个信令消息,可以根据信令消息的时间戳按时间先后顺序对组内的多个信令消息进行排序,得到信令流程。可以认为一个分组对应一个信令流程,如果待测的信令数据中的信令消息可以被分成多个组,则可以得到多个信令流程。
步骤302、判断多个信令流程是否全部为异常信令流程。
针对多个信令流程中的任意一个信令流程,终端设备可以根据该信令流程中的各条信令消息的消息类型获取该信令流程的消息类型特征序列,然后通过机器学习对该信令流程的消息类型特征序列进行预测确定该信令流程是否为异常信令流程。
在一种可能的实现方式中,将信令流程中的每条信令消息的消息类型看作自然语言处理(natural language processing,NLP)中的一个单词。
图4为信令流程检测的一个示例性的示意图,如图4所示,针对任意一个信令流程,列出该信令流程内的每条信令消息的消息类型,为了预测信令流程的第一条信令,本申请中在该信令流程的第一条信令消息的消息类型之前填补占位符。
对占位符和所有消息类型进行独热(One-hot)编码,得到该信令流程的消息类型的特征序列X,X(t)表示特征序列X中的第t条信令消息的消息类型的特征向量。需要说明的是,本申请还可以采用除One-hot编码以外的其他方法实现特征编码,对此不做具体限定。
利用训练好的N元语言(N-Gram)模型对该信令流程的消息类型的特征序列X以滑窗(窗长例如为w)的形式逐条预测。例如,当前预测的特征向量包括X(t-w)、X(t-w+1)、…、X(t-1)、X(t)。Y(t)={Y1,Y2,…,Ym}表示N-Gram模型针对特征序列X中的第t条信令消息预测得到的所有(m个)候选特征向量集合。
只要X(t)不在Y(t)中,就认为该信令流程异常。即采用滑窗的方式对该信令流程中的每条信令消息的消息类型的特征向量进行预测的过程中,若该信令流程中任意一条信令消息的消息类型的特征向量不在其对应的候选特征向量集合中,则确定该信令流程异常,若该信令流程中所有信令消息的消息类型的特征向量均在各自对应的候选特征向量集合中,则确定该信令流程正常。
上述N-Gram模型的训练过程可以包括:(1)收集通信网络在正常情况下产生的信令流程作为训练N-Gram模型的数据集;(2)针对数据集中的各个信令流程,对其中的每条信令消息的消息类型进行特征构造,并以滑窗的方式得到对应的信令流程的消息类型的特征序列;(3)利用预测模型对上一步构造的消息类型的特征序列进行建模,得到所有正常情况下产生的信令流程的消息类型的特征序列内的w元条件概率,即正常信令流程的N-Gram模型。
步骤302对待测的多个信令流程进行预测后可以得到三种结果,即该多个信令流程全部为正常信令流程,该多个信令流程全部为异常信令流程,或者该多个信令流程中部分为正常信令流程,另一部分为异常信令流程。需要说明的是,当信令数据解析到的信令流程全部为异常信令流程时,可以对应于一个或多个信令流程的情况,即此时如果解析得到一个信令流程,可以针对该信令流程获取其关联信元,如果解析得到多个信令流程,也可以针对各个信令流程获取其关联信元。
步骤303、若多个信令流程非全部为异常信令流程,则获取差异信元。
多个信令流程非全部为异常信令流程,表示该多个信令流程中部分为正常信令流程,另一部分为异常信令流程。此时可以寻求差异信元,该差异信元是多个信令流程中的至少一个异常信令流程和至少一个正常信令流程之间存在最大差异的信元。
终端设备可以获取第一特征向量集合和第二特征向量集合,该第一特征向量集合包括上述至少一个异常信令流程的特征向量,该第二特征向量集合包括上述至少一个正常信令流程的特征向量。对于每一条信令流程,利用词袋模型(bag-of-word)构建信令流程的特征向量,该词袋模型的特征空间为步骤301解析得到的所有信令流程的消息内容和消息类型的并集。将所有信令流程的特征向量按行合并得到特征向量集合的特征向量矩阵,该矩阵的每一行对应一个信令流程,每一列对应一个信元,上述至少一个异常信令流程的特征向量组成的矩阵是第一特征向量集合的特征向量矩阵,上述至少一个正常信令流程的特征向量组成的矩阵是第二特征向量集合的特征向量矩阵。最后将这两个集合各自的特征向量矩阵按行合并得到最终的特征向量矩阵,该矩阵的每一个行向量对应待测的多个信令流程(包括异常信令流程和正常信令流程)中一条信令流程,该矩阵的每一个列向量对应例如表1中的一个信息对应的特征。
根据最终的特征向量矩阵,获取该矩阵中的每一个列向量(对应信令消息的一个特征)分别与类标向量之间的相关性,根据该相关性通过基于特征选择的机器学习方法获取差异信元。类标向量是一个二值向量(由0和1组成),每一维对应一条信令流程,1表示对应的信令流程是正常的,0表示对应的信令流程是异常的。
在一种可能的实现方式中,相关性可以通过计算互信息来获取。
示例性的,图5为本申请获取差异信元的一个示例性的流程图,如图5所示,对基于正常信令流程和异常信令流程得到最终的特征向量矩阵后,为了提升差异信元的准确度和效率,采用了一种分层特征选择方案:先基于过滤的特征选择算法进行初选,剔除掉明显无关和冗余的特征向量,再基于封装的特征选择算法进行精选,选择出最终的差异信元集合。本申请中,信令流程中的一个特征对应一个信元,多个信令流程的同一个特征组成的特征向量(即上述最终的特征向量矩阵的一个列向量)对应一种信元。
一、基于过滤的特征选择
由于上述最终的特征向量矩阵的维度较大,为了提高差异信元选择的准确性和效率,暂不考虑特征向量之间的关联关系,采用基于过滤的特征选择算法进行初选,剔除掉明显无关和冗余的特征向量,得到初选过滤后的特征向量子集。该基于过滤的特征选择算法包括但不仅限于最大相关最小冗余(minimum redundance maximum relevance,mRMR)算法。
作为一种简单有效的计算互信息的特征过滤算法,mRMR算法通过计算两个变量间的互信息,来衡量两个变量间相关性的大小,即两个变量间的互信息值越大,表示二者之间的相关性越大,两个变量间的互信息值越小,表示二者之间的相关性越小。
mRMR算法从原始特征向量集合中的所有包含有m个特征向量的子集内寻找到一个能够同时满足最大相关准则和最小冗余准则的特征向量子集Fm
Figure BDA0002498824740000131
其中,|Fm|表示特征向量子集Fm中包含的特征向量个数;I表示类标向量;fi表示特征向量子集Fm中的第i维特征向量;互信息
Figure BDA0002498824740000132
p(x)是变量x的边缘概率分布函数,p(y)是变量y的边缘概率分布函数,p(x,y)是x和y的联合概率分布函数。
在上述算法中,根据最大相关准则从原始特征向量集合中的所有包含有m个特征向量的子集内寻找到一个特征向量子集Fm,该特征向量子集中的各个特征向量与类标向量I之间的相关性最大,即满足下式:
Figure BDA0002498824740000133
在上述算法中,根据最小冗余准则从原始特征向量集合中的所有包含有m个特征向量的子集内寻找到一个特征向量子集Fm,该特征向量子集中的各个特征向量之间相关性最小,即满足下式:
Figure BDA0002498824740000141
二、基于封装的特征选择
针对上一步骤得到的特征向量子集Fm,可以从该特征向量子集中寻找到一个最优特征向量子集,该最优特征向量子集不但能够精确地区分出属于不同类别的样本,而且具有尽可能少的特征向量个数。图6为基于封装的特征选择的一个示例性的模型框架图,如图6所示,基于封装的特征选择的模型框架可以由方案层、准则层及目标层组成,其中,方案层中的任意一个方案(P1、P2、P3、…、Pn)表示一组候选特征向量子集。准则层包括两个准则,分类精确度的准则是希望候选特征向量子集的分类精确度越高越好,包含特征向量数目的准则是希望候选特征向量子集中包含的特征向量的个数越少越好。分类精确度的目标优先于包含特征向量数目的目标。目标层是最终选出的最优特征向量子集。
为了创建上述模型,可以采用基于分层估计的单变量边缘分布算法(analytichierarchy process-univariate marginal distribution algorithm,AHP-UMDA),该算法以单变量边缘分布算法(univariate marginal distribution algorithm,UMDA)为基础,在使用UMDA算法进行特征向量子集进化时,分别以“最大分类准确率(ACCuracy,ACC)最小选择特征的数目(the number of selected features,NSF)”规则和“强制降维”规则对算法内的可行解选取和概率模型采样进行约束。其中,最大ACC为分类器对异常信令流程的分类准确率,最小NSF为特征向量子集内包含的特征向量个数,可行解为候选特征向量子集,分类器包括但不仅限于支持向量机(support vector machine,SVM)、随机森林(randomforest,RF)等。上述规则的具体实现算法如下:
最大ACC最小NSF规则
该规则用于选取优势群体
Figure BDA0002498824740000142
即最优的候选特征向量子集集合,在保证第一目标最大ACC的前提下,使具有更小NSF的可行解能够优先地进入
Figure BDA0002498824740000143
具体实现步骤如下:
S1、将种群中所有可行解按照其ACC从大到小进行排序;
S2、将ACC相同的可行解再按照它们的NSF从小到大进行排序;
S3、按照算法中的精英保留率,从上述排序中选取排名最靠前的N个可行解组成新的优势种群
Figure BDA0002498824740000144
强制降维规则
该规则用于限制每一代内各个可行解所包含的特征数目上限,产生“大ACC小NSF”的可行解。在算法迭代过程中,针对概率模型采样得到的可行解集合
Figure BDA0002498824740000145
通过每隔一定代数便强制降低当前代的特征数目上限Ul,限制了集合内各个可行解包含的特征数目。其中,Ul表示第l次迭代的特征数目上限。具体实现步骤如下:
S1、计算当前代的优势种群的概率模型Pl
S2、对Pl按照其概率从大到小进行排序得到
Figure BDA0002498824740000146
并按照下述公式计算当前代的特征数目上限Ul
Figure BDA0002498824740000147
其中,m为候选特征向量集合的特征总数,l为当前迭代次数,w为用户设置的两次强制降维间的隔代次数,即Ul每隔w代会被强制减半降维,||表示取整计算;
S3、基于
Figure BDA0002498824740000151
中的排序对各个变量依次进行采样,直到其NSF达到Ul
S4、重复上述S1~S3步(K-k)次得到Rs,其中,K为当前代原始群体的可行解个数,k为当前代选择的优势群体的可行解个数,k<K。
基于上述规则,通过“强制降维规则”得到的
Figure BDA0002498824740000152
可能包含以下三类可行解:
1)NSF减少ACC升高,两目标都有所改善,它们在下一代中一定会进入
Figure BDA0002498824740000153
2)NSF减少ACC不变,该类可行解虽不如第一类,但依照“最大ACC最小NSF规则”,它们在下一代中也会进入
Figure BDA0002498824740000154
3)NSF减少ACC下降,这类可行解在下一代中不会进入
Figure BDA0002498824740000155
并不会对后续优化方向产生影响。
综上所述,通过结合“最大ACC最小NSF规则”和“强制降维规则”,AHP-UMDA算法在进化过程中,可保证每一代可行解在ACC不下降的情况下,逐渐降低NSF,从而最终找到最优特征向量子集。
需要说明的是,本申请在获取差异信元后,还可以采用下述步骤304的方法获取异常信令流程的关联信元,将差异信元和关联信元均作为最终的故障分析依据。
步骤304、若多个信令流程全部为异常信令流程,则获取关联信元。
关联信元是多个信令流程中与异常信令流程中的异常问题关联的信元。当多个信令流程全部为异常信令流程时,可以从异常信令流程中推荐出与异常问题相关的关联信元,以缩减待分析的信元范围。针对一个或多个异常信令流程中的任意一个信令流程中存在的至少一个异常问题中的任意一个(例如第一异常问题),本申请可以通过语义相似度模型进行语义相似度处理得到与该第一异常问题关联的第一信元,再对该第一异常问题进行文本相似度处理得到与第一异常问题关联的第二信元。关联信元包括前述第一信元和/或第二信元。
在一种可能的实现方式中,还可以在分析信令数据之外,维护专家知识库,该专家知识库包括异常问题描述信息、异常问题协议信息和异常问题接口信息中的一个或多个信息。本申请可以根据专家知识库获取第一异常问题的异常问题描述信息、异常问题协议信息、异常问题接口信息和第三信元,第三信元是由用户反馈的与第一异常问题关联的第三信元,根据第一异常问题的异常问题描述信息、异常问题协议信息、异常问题接口信息和第三信元对第一异常问题进行语义相似度处理得到第一信元,再根据第一异常问题的异常问题描述信息、异常问题协议信息、异常问题接口信息和第三信元对第一异常问题进行文本相似度处理得到第二信元。
示例性的,图7为本申请获取关联信元的一个示例性的流程图,如图7所示,对于异常信令流程,以包含少量信息的专家知识库为基础,分别基于语义相似度处理和文本相似度处理对异常信令流程中的异常问题描述信息进行关联信元推荐。若异常信令流程中包括多个异常问题描述信息,将分别针对各个异常问题描述信息获取其关联信元。输出关联信元集合后,用户可以进行在线反馈,针对某一个或多个异常问题添加用户关注的信元。这些用户通过在线反馈的添加的信元会被当作新的专家知识添加至专家知识库中,用于后续的在线推荐或离线模型训练。若异常信令流程中包括多个异常问题描述信息,将分别针对各个异常问题描述信息进行关联信元集合输出及在线反馈。
专家知识库可以包括异常问题描述信息、异常问题协议信息和异常问题接口信息中的一个或多个信息。其中,异常问题描述信息可以是信令消息中对异常问题的描述信息,具体为异常信令流程内的信令消息中指示异常原因的信元的值,例如计费认证协议(diameter protocol)协议中的信元result-code的值、S1AP协议中的信元cause的值。异常问题描述信息也可以是异常信令流程内的信令消息中指示该信令流程的状态的信元的值,例如SIP协议中的信元status-code的值。异常问题协议信息和接口信息可以是信令消息的所属信令协议名称与接口名称。不同协议或接口实现不同的业务逻辑,因此同一异常问题在不同协议或接口上与其相关的信元也会是不同的。可以通过指定协议信息和接口信息,避免不同协议和接口间的业务逻辑混淆。
在一种可能的实现方式中,专家知识库还可以包括关注种子信息,该信息是用户针对上述异常问题的描述信息添加的关注点,可以是信元的名称,也可以是信元的取值。本申请可以基于用户的反馈,该反馈中用户添加了关注种子信息(上述第三信元),将第三信元加入专家知识库,并建立第一异常问题和第三信元之间的关联关系,这样在关联信元的获取过程中可以增加上对用户关注的信元的分析。通过推荐和这些种子信息相关联的其他信元,快速完成用户专家知识的扩展,提高了关联信元的推荐效果。
在一种可能的实现方式中,专家知识库还可以包括异常范围信息,该异常范围信息是用户基于经验为上述异常问题限制的问题分析范围,可以为当前出现异常的信令消息、当前出现异常的信令消息的所有上文消息、指定的消息类型等。若用户的反馈中指定了异常范围,如指定的消息类型范围,则新增专家知识库内的异常范围信息为用户指定的消息类型范围;否则,新增专家知识内的异常范围信息默认为当前流程。通过限制范围,可以过滤掉部分与异常问题相关但用户不关注的信元,不仅进一步缩小了推荐信元的规模,还提高了推荐信元的辅助效果。
本申请中,通过语义相似度模型进行语义相似度处理得到与该第一异常问题关联的第一信元,具体的过程可以包括:利用训练好的语义相似度模型计算该异常信令流程内所有信元与异常问题描述信息(包括关注种子信息)的相似度,得到各信元与异常问题描述信息(包括关注种子信息)的语义相似度。信元可以是信元的具体名称,也可以是信元内具体带有语义的描述性取值。信元与异常问题描述信息(包括关注种子信息)的语义相似度是在信元名称与异常问题描述信息(包括关注种子信息)的语义相似度和信元取值与异常问题描述信息(包括关注种子信息)的语义相似度中取最大值。通过对所有语义相似度大于语义阈值的信元进行基于语义相似度的降序排序,即可得到异常信令流程内与异常问题关联度最高的N个信元,语义阈值为用户可接受的最低语义相似度,N为用户设置的语义挖掘信元个数。
上述语义相似度模型的训练过程可以包括:基于信令数据构建语料库,信令数据中的信令流程对应语料库中的文档,信令流程中的信令消息对应语料库中的段落,信令消息中的业务结构对应语料库中的句子,业务结构中的信元对应语料库中的词。根据该语料库创建语义相似度模型,一种可选的训练方式是将专家知识库看作部分单词的先验知识,利用可参考先验知识的词嵌入算法对语料库涉及到的所有单词进行编码,得到所有单词在映射空间内的语义相似度模型。其中,可参考先验知识的词嵌入算法包括但不仅限于联合关系约束模型(Joint→relation constrained model,JointRCM)、关系编码模型(relation encoding model,REM)、上下文和实体的约束模型(context and entityconstrained model,CECM)等。另一种可选的训练方式则无需专家知识,直接利用词嵌入算法对语料库涉及到的所有单词进行编码,得到所有单词在映射空间内的语义相似度模型。其中,词嵌入算法包括但不仅限于Skip-Gram模型、连续词袋模型(continuous bag ofwords,CBOW)模型等。
本申请中,对第一异常问题进行文本相似度处理得到与第一异常问题关联的第二信元,具体的过程可以包括:计算异常信令流程内所有信元与异常问题描述信息(包括关注种子信息)的文本相似度,得到各信元与异常问题描述信息(包括关注种子信息)的文本相似度。其中,衡量信元间文本相似度的方法包括但不仅限于编辑距离、余弦相似度、海明距离等,上述一个信元与异常问题描述信息(包括关注种子信息)的文本相似度为在信元名称与异常问题描述信息(包括关注种子信息)的文本相似度和信元取值与异常问题描述信息(包括关注种子信息)的文本相似度中取最大值。通过对所有文本相似度大于文本阈值的信元进行基于文本相似度的降序排序,得到异常信令流程内与异常问题关联度最高的M个信元,文本阈值为用户可接受的最低文本相似度,M为用户设置的字面挖掘信元个数。
步骤305、根据差异信元或关联信元获取故障分析结果。
经过步骤303后,可以得到与异常信令流程相关的差异信元,可选的还可以得到与异常信令流程相关的关联信元。经过步骤304后,可以得到与异常信令流程相关的关联信元。基于这些信元,可以实现故障定界、根因定位等,并输出分析结果,或者可以由用户做进一步的故障分析得到最终的分析结果。
本申请,智能化地完成信元级信令数据的故障辅助分析,得到正常信令流程中与异常信令流程差异最大的信元和/或与异常信令流程相关联的信元,一方面,可以很好的适应网络情况变化所带来的规则更新与判断逻辑的及时调整,无需依赖专家总结的各种标准流程及信元判断规则,有效提高了异常信元判断的准确率,另一方面,以数据驱动的方式得到异常信令流程的关联信元,降低对专家知识的依赖。
下面采用几个具体的实施例,对图3所示方法实施例的技术方案进行详细说明。
以DIAMETER协议的Gx接口的信令数据为示例,针对前述信令数据,为了减少不同协议下信令数据间的差异性,可以先对信令数据进行解析得到表1所示的至少六种信息。基于该六种信息,采用上述步骤302的方法对信令数据中包括的多个信令流程进行分析,判断多个信令流程是否全部为异常信令流程。
若多个信令流程非全部为异常信令流程,则进入获取差异信元的流程。采用上述步骤303的方法,利用mRMR算法对由多个信令流程的多个特征组成的特征向量矩阵进行特征选择,剔除掉明显无关和冗余的特征,得到特征向量子集Fm。然后利用AHP-UMDA算法在该特征向量子集Fm内寻找最优特征向量子集。
示例性的,图8为AHP-UMDA算法的一个示例性的流程图,如图8所示,选用SVM作为分类器计算各个可行解的ACC,待解空间中的每个可行解均为m维的二进制向量,其中,m是候选特征向量子集中的特征向量数目,向量中的‘1’表示对应的该维特征被选中。AHP-UMDA算法具体步骤如下:
S1、随机产生K个可行解作为第l代的初始群体Xl,其中,l=0,K>50,Xl的第i行Xl(i)是一个可行解,Xl(i)是一个m维的二进制向量,1表示对应的特征被选中,0表示对应的特征没有被选中;
S2、计算群体中各个可行解的ACC和NSF,其中,ACC为SVM分类器对异常信令流程的分类准确率,NSF是可行解内被选中的特征个数。其中,针对一个可行解,SVM的输入数据为基于该可行解进行特征过滤后的特征矩阵。
S3、按照“最大ACC最小NSF”规则对上述K个可行解进行排序,选取前k个可行解作为第l代的优势群体
Figure BDA0002498824740000181
S4、基于S3中选取的优势群体
Figure BDA0002498824740000182
计算各维特征的概率
Figure BDA0002498824740000183
构建概率模型
Figure BDA0002498824740000184
其中,
Figure BDA0002498824740000185
S5、计算第l代的特征数目上限
Figure BDA0002498824740000186
其中,w为用户设置的两次强制降维间的隔代次数,||表示取整计算;
S6、对概率模型
Figure BDA0002498824740000187
中的各维特征先按照其概率大小降序排列,再根据该排序对各个变量依次进行采样,直到NSF达到Ul
S7、重复(K-k)次步骤S4至S6,将得到的(K-k)个新可行解组成
Figure BDA0002498824740000188
通过与
Figure BDA0002498824740000189
合并,组成新一代群体Xl+1
S8、如果迭代次数达到用户预设的阈值,算法结束,输出当前群体中具有最大ACC最小NSF的可行解,否则返回S2。
若多个信令流程全部为异常信令流程,则进行获取关联信元的流程。假设第一异常问题的异常问题描述信息为result-code=‘diameter-unable-to-deliver(3002)’,基于该异常问题的异常问题描述信息、协议信息(DIAMETER协议)以及接口信息(Gx接口)在专家知识库中进行查询,获得表2中的专家知识。
表2
异常问题描述信息 result-code=‘diameter-unable-to-deliver(3002)’
协议信息 DIAMETER
接口信息 Gx
关注种子信息 destination-host
异常范围信息 Credit Control Request
针对异常问题描述信息‘diameter-unable-to-deliver’和关注种子信息‘destination-host’,采用基于CBOW语义相似度模型,依次计算该异常信令流程中、‘Credit Control Request’类型消息内的所有单词与上述两个字段的相似度,得到该异常信令流程中、‘Credit Control Request’类型消息内的所有信元与上述两字段的语义相似度。例如,某个信元的名称与‘destination-host’字段的相似度为0.89,其取值与‘destination-host’字段的相似度为0.7,则该信元与‘destination-host’字段的语义相似度为0.89。随后,通过对所有与字段‘diameter-unable-to-deliver’语义相似度大于语义阈值0.6的信元进行基于语义相似度的降序排序,即可得到该异常信令流程内与异常问题描述信息关联度最高的N=5个信元B。通过对所有与字段‘destination-host’语义相似度大于语义阈值0.6的信元进行基于语义相似度的降序排序,即可得到该异常信令流程内与关注种子信息关联度最高的N=5个信元C。
针对异常问题描述信息‘diameter-unable-to-deliver’和关注种子信息‘destination-host’,分别计算该异常信令流程中、‘Credit Control Request’类型消息内的所有单词与字段‘diameter-unable-to-deliver’和字段‘destination-host’的编辑距离,得到该异常信令流程中、‘Credit Control Request’类型消息内的所有信元与上述两字段的文本相似度。例如,某个信元的名称与‘destination-host’字段的相似度为0.5,其取值与‘destination-host’字段的相似度为0.125,则该信元与‘destination-host’字段的文本相似度为0.5。通过对所有与字段‘diameter-unable-to-deliver’文本相似度大于文本阈值0.5的信元进行基于文本相似度的降序排序,即可得到该异常信令流程内与异常问题描述信息关联度最高的M=3个信元D。通过对所有与字段‘destination-host’文本相似度大于文本阈值0.6的信元进行基于文本相似度的降序排序,即可得到该异常信令流程内与关注种子信息关联度最高的M=3个信元E。
针对差异信元A、语义相关的关联信元B和C、字面相关的关联信元D和E,可以按照表3和表4的方式分别输出。
表3
Figure BDA0002498824740000191
表4
Figure BDA0002498824740000192
其中,差异信元A用于辅助用户从宏观角度进行信元级的信令分析,关联信元B~E用于辅助用户对特定异常信令流程进行信元级的信令分析。表3和表4中每个信元显示的内容包括该信元所属信令消息的时间戳、消息类型、信元名称以及信元值,A中的信元将按相似度由高到低依次显示,B和C中的信元将以“拉链”合并的方式依次显示,D和E中的信元也将以“拉链”合并的方式依次显示,字面相关信元优先于语义相关信元,关注种子相关信元优先于异常描述相关信元。例如,B中的信元为[b1,b2,b3,b4,b5],C中的信元为[c1,c2,c3,c4,c5],则“拉链”合并后的信元结果为[c1,b1,c2,b2,…,c5,b5]。此外,本实施例中的显示结果E+D、C+B将在最终输出前以从上到下的形式移除重复信元。
输出上述分析结果后,若用户针对异常问题result-code=‘diameter-unable-to-deliver(3002)’,在‘Credit Control Answer’类型消息内反馈了其他应关注的信元‘proxiable’,则需要将将用户反馈的‘proxiable’信元以表5的形式添加至专家知识库中:
表5
异常问题描述信息 result-code=‘diameter-unable-to-deliver(3002)’
协议信息 DIAMETER
接口信息 Gx
关注种子信息 proxiable
异常范围信息 Credit Control Answer
由此可见,本实施例针对通信网络中控制面信令的诸多不同协议,以数据驱动的方式、通过提取各协议都支持的信令信息、利用各协议都支持的信元分析方法,有效消除了各信令协议间的格式差异,提供了一种通用的信元级信令分析辅助方案。针对网络环境未知情况下的大规模正常信令跟踪数据和异常跟踪数据,通过参考流程异常检测识别到的正常信令流程,选出异常信令流程中与正常信令流程间差异最大的信元,无需依赖专家总结的各种标准流程及信元判断规则,有效提高了异常信元分析的准确率、降低各协议的后期维护成本。针对异常跟踪数据,以少量专家知识为基础、基于语义相似度处理可快速推荐出与异常问题相关联的信元,避免了组网配置对信元判断标准的影响,保证了模块初期对工程师的辅助效果。还以数据驱动的方式完成对专家知识库的扩充,降低对专家知识的依赖。最终,随着用户反馈的不断积累,可以逐渐学习到用户的业务分析经验,推荐的关联信元也会更符合用户的业务期望。
在一种可能的实现方式中,图9为本申请通信网络故障分析方法实施例二的流程图,如图9所示,该过程900可以应用于图1所示的系统,其执行主体可以是图2所示的终端设备。该过程900描述为一系列的步骤或操作,应当理解的是,过程900可以以各种顺序执行和/或同时发生,不限于图9所示的执行顺序。通信网络故障分析方法可以包括:
901、信令数据输入。
收集并解析待分析的信令数据,提取信令流程。
902、信令流程异常检测。
针对解析后的多个信令流程,识别该信令流程是否全部为异常信令流程。
903、基于过滤的特征选择。
基于mRMR算法对信令消息中的特征向量进行第一层初选,过滤掉明显冗余的特征向量。
904、基于封装的特征选择。
基于AHP-UMDA算法对信令消息中的特征向量进行第二层精选,选择出最终的差异信元集合。
905、分析结果输出。
输出异常信令流程的差异信元和/或关联信元。
本实施例不同于上述实施例一,当流程异常检测的结果中既包含正常信令流程也包含异常信令流程时,针对异常信令流程,可以仅参考正常信令流程,利用步骤903和904为用户推荐出异常信令流程中与正常信令流程差异最大的信元集合。
针对通信网络中控制面信令的诸多不同协议,以数据驱动的方式通过提取各协议都支持的信令信息、利用各协议都支持的信元分析方法,有效消除了各信令协议间的格式差异,提供了一种通用的信元级信令分析辅助方案。针对网络环境未知情况下的大规模正常信令跟踪数据和异常跟踪数据,通过参考流程异常检测识别到的正常信令流程,推荐出异常信令流程中与正常信令流程间差异最大的信元,无需依赖专家总结的各种标准流程及信元判断规则,有效提高了异常信元分析的准确率、降低各协议的后期维护成本。
在一种可能的实现方式中,图10为本申请通信网络故障分析方法实施例三的流程图,如图10所示,该过程1000可以应用于图1所示的系统,其执行主体可以是图2所示的终端设备。该过程1000描述为一系列的步骤或操作,应当理解的是,过程1000可以以各种顺序执行和/或同时发生,不限于图10所示的执行顺序。通信网络故障分析方法可以包括:
1001、信令数据输入。
收集并解析待分析的信令数据,提取信令流程。
1002、信令流程异常检测。
针对解析后的多个信令流程,识别该信令流程是否全部为异常信令流程。
1003、基于语义相似度的语义挖掘。
利用训练好的语义相似度模型,推荐每个异常流程内与异常问题描述信息及其对应专家知识间语义相似度最高、且语义相似度大于语义阈值的N个信元。
例如,异常问题描述信息为result-code=‘diameter-credit-limit-reached(4012)’,流程标识为179,先基于该异常问题描述信息及协议(DIAMETER)与接口(Gy)信息在专家知识库中进行查询。由于未查询到该异常问题字段对应的专家知识,将基于CBOW词向量模型,仅针对异常提示信息‘diameter-credit-limit-reached’计算该异常信令流程中的所有信元与该字段的相似度,得到该异常信令流程中的所有信元与上述字段的语义相似度。随后,通过对所有与字段‘diameter-credit-limit-reached’语义相似度大于语义阈值0.6的信元进行基于语义相似度的降序排序,即可得到该异常信令流程内与异常提示信息关联度最高的N=5个信元F。
1004、基于文本相似度的字面挖掘。
推荐每个异常流程内与异常问题描述信息及其对应专家知识间文本相似度最高、且文本相似度大于文本阈值的M个信元。
例如,异常问题描述信息为result-code=‘diameter-credit-limit-reached(4012)’,流程标识为179,由于未查询到该异常问题描述信息对应的专家知识,将计算该异常信令流程中所有信元与字段‘diameter-credit-limit-reached’的编辑距离,得到该异常信令流程中所有信元与上述字段的文本相似度。通过对所有与字段‘diameter-credit-limit-reached’文本相似度大于文本阈值0.5的信元进行基于文本相似度的降序排序,即可得到该异常信令流程内与异常提示信息关联度最高的M=3个信元G。
1005、分析结果输出。
输出异常信令流程的差异信元和/或关联信元。
例如,上述语义相关信元F和字面相关信元G,可以按照表6所示分别输出。
表6
Figure BDA0002498824740000221
表6中每个信元显示的内容包括该信元所属信令消息的时间戳、消息类型、信元名称以及信元值,F和G中的信元均按相似度由高到低依次显示,但字面相关信元G优先于语义相关信元F。本实施例中的显示结果F、G将在最终输出前以从上到下的形式移除重复信元。
1006、用户在线反馈。
用户为某异常问题描述字段添加其关注的信元。
1007、专家知识维护。
将用户添加的关注的信元作为新的专家知识。
本实施例不同于上述实施例一,当流程异常检测的结果中只包含异常信令流程时,针对异常信令流程,利用步骤1003和1004为用户推荐出与异常信令流程相关联的信元集合。
针对通信网络中控制面信令的诸多不同协议,以数据驱动的方式通过提取各协议都支持的信令信息、利用各协议都支持的信元分析方法,有效消除了各信令协议间的格式差异,提供了一种通用的信元级信令分析辅助方案。针对信元分析标准不明确时的异常跟踪数据,以少量专家知识为基础、基于语义相似度的处理可快速推荐出与异常问题相关联的信元,避免了组网配置对信元判断标准的影响,保证了模块初期对工程师的辅助效果。随后,以数据驱动的方式完成对专家知识的扩充,降低对专家知识的依赖。最终,随着用户反馈的不断积累,可以逐渐学习到用户的业务分析经验,推荐的关联信元也会更符合用户的业务期望。
图11为本申请通信网络故障分析装置实施例的结构示意图,如图11所示,本实施例的装置可以是上述实施例中的终端设备,也可以是终端设备中的芯片。该装置包括:解析模块1101、流程检测模块1102、差异信元模块1103、关联信元模块1104和分析模块1105.其中,解析模块1101,用于从待测的信令数据中提取多个信令流程;流程检测模块1102,用于判断所述多个信令流程是否全部为异常信令流程;差异信元模块1103,用于若所述多个信令流程非全部为异常信令流程,则获取差异信元,所述差异信元是所述多个信令流程中的异常信令流程和所述多个信令流程中的正常信令流程之间存在最大差异的信元;关联信元模块1104,用于若所述多个信令流程全部为异常信令流程,则获取第一关联信元,所述第一关联信元是所述多个信令流程中与所述异常信令流程中的异常问题关联的信元;分析模块1105,用于根据所述差异信元或所述第一关联信元获取故障分析结果。
在一种可能的实现方式中,所述关联信元模块1104,还用于若所述多个信令流程非全部为异常信令流程,则获取第二关联信元,所述第二关联信元是所述多个信令流程中与所述多个信令流程中的异常信令流程中的异常问题关联的信元;所述分析模块,还用于根据所述差异信元和所述第二关联信元获取故障分析结果。
在一种可能的实现方式中,所述差异信元模块1103,具体用于获取第一特征向量集合和第二特征向量集合,所述第一特征向量集合包括至少一个所述异常信令流程的特征向量,所述第二特征向量集合包括至少一个所述正常信令流程的特征向量;根据所述第一特征向量集合和所述第二特征向量集合得到所述差异信元。
在一种可能的实现方式中,所述差异信元模块1103,具体用于获取所述第一特征向量集合和所述第二特征向量集合中的每一维特征与类别向量之间的相关性;根据所述相关性通过基于特征选择的机器学习方法获取所述差异信元。
在一种可能的实现方式中,所述差异信元模块1103,具体用于计算所述第一特征向量集合和所述第二特征向量集合中的每一维特征与所述类别向量的互信息;根据所述互信息得到所述相关性。
在一种可能的实现方式中,所述关联信元模块1104,具体用于对第一异常问题通过语义相似度模型进行语义相似度处理得到与所述第一异常问题关联的第一信元,所述第一异常问题为第一信令流程中存在的至少一个异常问题中的任意一个,所述第一信令流程为一个或多个所述异常信令流程中的任意一个;对所述第一异常问题进行文本相似度处理得到与所述第一异常问题关联的第二信元;所述第一关联信元包括所述第一信元和/或所述第二信元。
在一种可能的实现方式中,所述关联信元模块1104,还用于维护专家知识库,所述专家知识库包括异常问题描述信息、异常问题协议信息和异常问题接口信息中的一个或多个信息。
在一种可能的实现方式中,所述关联信元模块1104,还用于获取用户反馈,所述用户反馈包括与所述第一异常问题关联的第三信元;将所述第三信元加入所述专家知识库,并建立所述第一异常问题和所述第三信元之间的关联关系。
在一种可能的实现方式中,所述关联信元模块1104,还用于根据所述专家知识库获取所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元;根据所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元对所述第一异常问题进行语义相似度处理得到所述第一信元;根据所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元对所述第一异常问题进行文本相似度处理得到所述第二信元。
在一种可能的实现方式中,所述关联信元模块1104,还用于基于信令数据构建语料库,所述信令数据中的信令流程对应所述语料库中的文档,所述信令流程中的信令消息对应所述语料库中的段落,所述信令消息中的业务结构对应所述语料库中的句子,所述业务结构中的信元对应所述语料库中的词;根据所述语料库创建所述语义相似度模型。
在一种可能的实现方式中,所述解析模块1101,具体用于对所述信令数据中的多条信令消息进行解析得到至少三种信息,所述至少三种信息包括信令消息的协议类型、信令消息的生成接口和信令消息的流程标识;根据所述信令消息的协议类型、所述信令消息的生成接口和所述信令消息的流程标识中的一个或多个信息对所述信令数据中的各条信令消息进行分组,每组中的一条或多条信令消息组成一个信令流程。
本实施例的装置,可以用于执行图3-10任一所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。处理器可以是通用处理器、数字信号处理器(digital signalprocessor,DSP)、特定应用集成电路(application-specific integrated circuit,ASIC)、现场可编程门阵列(field programmable gate array,FPGA)或其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。本申请实施例公开的方法的步骤可以直接体现为硬件编码处理器执行完成,或者用编码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
上述各实施例中提及的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-onlymemory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(directrambus RAM,DR RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (25)

1.一种通信网络故障分析方法,其特征在于,包括:
从待测的信令数据中提取多个信令流程,每条所述信令流程包括一个或多个信元;
判断所述多个信令流程是否全部为异常信令流程;
若所述多个信令流程非全部为异常信令流程,则获取差异信元,所述差异信元是所述多个信令流程中的异常信令流程和所述多个信令流程中的正常信令流程之间存在最大差异的信元;
若所述多个信令流程全部为异常信令流程,则获取第一关联信元,所述第一关联信元是所述多个信令流程中与所述异常信令流程中的异常问题关联的信元;
根据所述差异信元或所述第一关联信元获取故障分析结果。
2.根据权利要求1所述的方法,其特征在于,还包括:
若所述多个信令流程非全部为异常信令流程,则获取第二关联信元,根据所述差异信元和所述第二关联信元获取故障分析结果,所述第二关联信元是所述多个信令流程中与所述多个信令流程中的异常信令流程中的异常问题关联的信元。
3.根据权利要求1或2所述的方法,其特征在于,所述获取差异信元,包括:
获取第一特征向量集合和第二特征向量集合,所述第一特征向量集合包括所述多个信令流程中的异常信令流程的特征向量,所述第二特征向量集合包括所述多个信令流程中的正常信令流程的特征向量;
根据所述第一特征向量集合和所述第二特征向量集合得到所述差异信元。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一特征向量集合和所述第二特征向量集合得到所述差异信元,包括:
获取所述第一特征向量集合和所述第二特征向量集合中的每一维特征与类别向量之间的相关性;
根据所述相关性通过基于特征选择的机器学习方法获取所述差异信元。
5.根据权利要求4所述的方法,其特征在于,所述获取所述第一特征向量集合和所述第二特征向量集合中的每一维特征与类别向量之间的相关性,包括:
计算所述第一特征向量集合和所述第二特征向量集合中的每一维特征与所述类别向量的互信息;
根据所述互信息得到所述相关性。
6.根据权利要求1或2所述的方法,其特征在于,所述获取第一关联信元,包括:
对第一异常问题通过语义相似度模型进行语义相似度处理得到与所述第一异常问题关联的第一信元,所述第一异常问题为第一信令流程中存在的至少一个异常问题中的任意一个,所述第一信令流程为一个或多个所述异常信令流程中的任意一个;
对所述第一异常问题进行文本相似度处理得到与所述第一异常问题关联的第二信元;
所述第一关联信元包括所述第一信元和/或所述第二信元。
7.根据权利要求6所述的方法,其特征在于,还包括:
维护专家知识库,所述专家知识库包括异常问题描述信息、异常问题协议信息和异常问题接口信息中的一个或多个信息。
8.根据权利要求7所述的方法,其特征在于,所述根据所述差异信元和/或所述关联信元获取故障分析结果之后,还包括:
获取用户反馈,所述用户反馈包括与所述第一异常问题关联的第三信元;
将所述第三信元加入所述专家知识库,并建立所述第一异常问题和所述第三信元之间的关联关系。
9.根据权利要求8所述的方法,其特征在于,所述若所述多个信令流程全部为异常信令流程,则获取第一关联信元之前,还包括:
根据所述专家知识库获取所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元;
所述对第一异常问题进行语义相似度处理得到与所述第一异常问题关联的第一信元,包括:
根据所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元对所述第一异常问题进行语义相似度处理得到所述第一信元;
所述对所述第一异常问题进行文本相似度处理得到与所述第一异常问题关联的第二信元,包括:
根据所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元对所述第一异常问题进行文本相似度处理得到所述第二信元。
10.根据权利要求6-9中任一项所述的方法,其特征在于,还包括:
基于信令数据构建语料库,所述信令数据中的信令流程对应所述语料库中的文档,所述信令流程中的信令消息对应所述语料库中的段落,所述信令消息中的业务结构对应所述语料库中的句子,所述业务结构中的信元对应所述语料库中的词;
根据所述语料库创建所述语义相似度模型。
11.根据权利要求1-10中任一项所述的方法,其特征在于,所述从待测的信令数据中提取多个信令流程,包括:
对所述信令数据中的多条信令消息进行解析得到至少三种信息,所述至少三种信息包括信令消息的协议类型、信令消息的生成接口和信令消息的流程标识;
根据所述信令消息的协议类型、所述信令消息的生成接口和所述信令消息的流程标识中的一个或多个信息对所述信令数据中的各条信令消息进行分组,每组中的一条或多条信令消息组成一个信令流程。
12.一种通信网络故障分析装置,其特征在于,包括:
解析模块,用于从待测的信令数据中提取多个信令流程,每条所述信令流程包括一个或多个信元;
流程检测模块,用于判断所述多个信令流程是否全部为异常信令流程;
差异信元模块,用于若所述多个信令流程非全部为异常信令流程,则获取差异信元,所述差异信元是所述多个信令流程中的异常信令流程和所述多个信令流程中的正常信令流程之间存在最大差异的信元;
关联信元模块,用于若所述多个信令流程全部为异常信令流程,则获取第一关联信元,所述第一关联信元是所述多个信令流程中与所述异常信令流程中的异常问题关联的信元;
分析模块,用于根据所述差异信元或所述第一关联信元获取故障分析结果。
13.根据权利要求12所述的装置,其特征在于,所述关联信元模块,还用于若所述多个信令流程非全部为异常信令流程,则获取第二关联信元,所述第二关联信元是所述多个信令流程中与所述多个信令流程中的异常信令流程中的异常问题关联的信元;
所述分析模块,还用于根据所述差异信元和所述第二关联信元获取故障分析结果。
14.根据权利要求12或13所述的装置,其特征在于,所述差异信元模块,具体用于获取第一特征向量集合和第二特征向量集合,所述第一特征向量集合包括至少一个所述异常信令流程的特征向量,所述第二特征向量集合包括至少一个所述正常信令流程的特征向量;根据所述第一特征向量集合和所述第二特征向量集合得到所述差异信元。
15.根据权利要求14所述的装置,其特征在于,所述差异信元模块,具体用于获取所述第一特征向量集合和所述第二特征向量集合中的每一维特征与类别向量之间的相关性;根据所述相关性通过基于特征选择的机器学习方法获取所述差异信元。
16.根据权利要求15所述的装置,其特征在于,所述差异信元模块,具体用于计算所述第一特征向量集合和所述第二特征向量集合中的每一维特征与所述类别向量的互信息;根据所述互信息得到所述相关性。
17.根据权利要求12或13所述的装置,其特征在于,所述关联信元模块,具体用于对第一异常问题通过语义相似度模型进行语义相似度处理得到与所述第一异常问题关联的第一信元,所述第一异常问题为第一信令流程中存在的至少一个异常问题中的任意一个,所述第一信令流程为一个或多个所述异常信令流程中的任意一个;对所述第一异常问题进行文本相似度处理得到与所述第一异常问题关联的第二信元;所述第一关联信元包括所述第一信元和/或所述第二信元。
18.根据权利要求17所述的装置,其特征在于,所述关联信元模块,还用于维护专家知识库,所述专家知识库包括异常问题描述信息、异常问题协议信息和异常问题接口信息中的一个或多个信息。
19.根据权利要求18所述的装置,其特征在于,所述关联信元模块,还用于获取用户反馈,所述用户反馈包括与所述第一异常问题关联的第三信元;将所述第三信元加入所述专家知识库,并建立所述第一异常问题和所述第三信元之间的关联关系。
20.根据权利要求19所述的装置,其特征在于,所述关联信元模块,还用于根据所述专家知识库获取所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元;根据所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元对所述第一异常问题进行语义相似度处理得到所述第一信元;根据所述第一异常问题的异常问题描述信息、所述异常问题协议信息、所述异常问题接口信息和所述第三信元对所述第一异常问题进行文本相似度处理得到所述第二信元。
21.根据权利要求17-20中任一项所述的装置,其特征在于,所述关联信元模块,还用于基于信令数据构建语料库,所述信令数据中的信令流程对应所述语料库中的文档,所述信令流程中的信令消息对应所述语料库中的段落,所述信令消息中的业务结构对应所述语料库中的句子,所述业务结构中的信元对应所述语料库中的词;根据所述语料库创建所述语义相似度模型。
22.根据权利要求12-21中任一项所述的装置,其特征在于,所述解析模块,具体用于对所述信令数据中的多条信令消息进行解析得到至少三种信息,所述至少三种信息包括信令消息的协议类型、信令消息的生成接口和信令消息的流程标识;根据所述信令消息的协议类型、所述信令消息的生成接口和所述信令消息的流程标识中的一个或多个信息对所述信令数据中的各条信令消息进行分组,每组中的一条或多条信令消息组成一个信令流程。
23.一种终端设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-11中任一项所述的方法。
24.一种计算机可读存储介质,其特征在于,包括计算机程序,所述计算机程序在计算机上被执行时,使得所述计算机执行权利要求1-11中任一项所述的方法。
25.一种计算机程序,其特征在于,当所述计算机程序被计算机执行时,用于执行权利要求1-11中任一项所述的方法。
CN202010426254.5A 2020-05-19 2020-05-19 通信网络故障分析方法和装置 Active CN111800289B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010426254.5A CN111800289B (zh) 2020-05-19 2020-05-19 通信网络故障分析方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010426254.5A CN111800289B (zh) 2020-05-19 2020-05-19 通信网络故障分析方法和装置

Publications (2)

Publication Number Publication Date
CN111800289A true CN111800289A (zh) 2020-10-20
CN111800289B CN111800289B (zh) 2021-12-10

Family

ID=72805875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010426254.5A Active CN111800289B (zh) 2020-05-19 2020-05-19 通信网络故障分析方法和装置

Country Status (1)

Country Link
CN (1) CN111800289B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113591212A (zh) * 2021-07-14 2021-11-02 中国舰船研究设计中心 一种基于封装单元及信息关联的船舶设备布置方法
CN113747443A (zh) * 2021-02-26 2021-12-03 上海观安信息技术股份有限公司 基于机器学习算法的安全检测方法及装置
CN114179946A (zh) * 2022-01-12 2022-03-15 金华市路骑电动科技有限公司 一种电动车数据链路的智能化监测方法及系统
CN114363198A (zh) * 2022-01-14 2022-04-15 深圳市优网科技有限公司 数据采集方法及装置、存储介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3468146A1 (en) * 2017-10-06 2019-04-10 Netscout Systems, Inc. Intelligent call tracking to detect drops using s1-ap and sip signaling
CN109905269A (zh) * 2018-01-17 2019-06-18 华为技术有限公司 确定网络故障的方法和装置
CN110545195A (zh) * 2018-05-29 2019-12-06 华为技术有限公司 网络故障分析方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3468146A1 (en) * 2017-10-06 2019-04-10 Netscout Systems, Inc. Intelligent call tracking to detect drops using s1-ap and sip signaling
CN109905269A (zh) * 2018-01-17 2019-06-18 华为技术有限公司 确定网络故障的方法和装置
CN110545195A (zh) * 2018-05-29 2019-12-06 华为技术有限公司 网络故障分析方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113747443A (zh) * 2021-02-26 2021-12-03 上海观安信息技术股份有限公司 基于机器学习算法的安全检测方法及装置
CN113591212A (zh) * 2021-07-14 2021-11-02 中国舰船研究设计中心 一种基于封装单元及信息关联的船舶设备布置方法
CN113591212B (zh) * 2021-07-14 2024-04-09 中国舰船研究设计中心 一种基于封装单元及信息关联的船舶设备布置方法
CN114179946A (zh) * 2022-01-12 2022-03-15 金华市路骑电动科技有限公司 一种电动车数据链路的智能化监测方法及系统
CN114363198A (zh) * 2022-01-14 2022-04-15 深圳市优网科技有限公司 数据采集方法及装置、存储介质及电子设备
CN114363198B (zh) * 2022-01-14 2023-07-21 深圳市优网科技有限公司 数据采集方法及装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN111800289B (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
CN111800289B (zh) 通信网络故障分析方法和装置
US11314806B2 (en) Method for making music recommendations and related computing device, and medium thereof
EP3985578A1 (en) Method and system for automatically training machine learning model
CN107992596B (zh) 一种文本聚类方法、装置、服务器和存储介质
US20230102337A1 (en) Method and apparatus for training recommendation model, computer device, and storage medium
CN101990670B (zh) 使用编辑距离和文档信息进行搜索结果排名
Xie et al. A survey on machine learning-based mobile big data analysis: Challenges and applications
US11907675B2 (en) Generating training datasets for training neural networks
EP2260458A2 (en) Learning transportation modes from raw gps data
CN105531701A (zh) 个性化趋势图像搜索建议
US20170109638A1 (en) Ensemble-Based Identification of Executions of a Business Process
CA3135466A1 (en) User loan willingness prediction method and device and computer system
CN115455171A (zh) 文本视频的互检索以及模型训练方法、装置、设备及介质
US20170109640A1 (en) Generation of Candidate Sequences Using Crowd-Based Seeds of Commonly-Performed Steps of a Business Process
CN105940435A (zh) 测量并诊断城市环境中的噪音
CN114138977A (zh) 日志处理方法、装置、计算机设备和存储介质
CN108345620B (zh) 品牌信息处理方法、装置、存储介质及电子设备
CN112784157A (zh) 行为预测模型的训练方法、行为预测方法及装置、设备
CN115269786B (zh) 可解释的虚假文本检测方法、装置、存储介质以及终端
CN113672807B (zh) 推荐方法、装置、介质、装置和计算设备
Mansoor et al. Scientometric analysis and critical review on the application of deep learning in the construction industry
CN112801156B (zh) 用于人工智能机器学习的业务大数据采集方法及服务器
KR102309006B1 (ko) 인공지능을 이용한 자전거 부품 분류 및 견적 기반 추천 방법 및 시스템
CN111738290B (zh) 图像检测方法、模型构建和训练方法、装置、设备和介质
CN116362359A (zh) 基于ai大数据的用户满意度预测方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant