CN107888397A - 确定故障类型的方法和装置 - Google Patents

确定故障类型的方法和装置 Download PDF

Info

Publication number
CN107888397A
CN107888397A CN201610867164.3A CN201610867164A CN107888397A CN 107888397 A CN107888397 A CN 107888397A CN 201610867164 A CN201610867164 A CN 201610867164A CN 107888397 A CN107888397 A CN 107888397A
Authority
CN
China
Prior art keywords
training data
sequence
user
service data
fault type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610867164.3A
Other languages
English (en)
Other versions
CN107888397B (zh
Inventor
潘璐伽
赫彩凤
张建锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201610867164.3A priority Critical patent/CN107888397B/zh
Priority to PCT/CN2017/103506 priority patent/WO2018059402A1/zh
Publication of CN107888397A publication Critical patent/CN107888397A/zh
Priority to US16/351,033 priority patent/US11140021B2/en
Application granted granted Critical
Publication of CN107888397B publication Critical patent/CN107888397B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/0636Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis based on a decision tree analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5019Ensuring fulfilment of SLA
    • H04L41/5025Ensuring fulfilment of SLA by proactively reacting to service quality change, e.g. by reconfiguration after service quality degradation or upgrade
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5061Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
    • H04L41/5067Customer-centric QoS measurements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • H04L43/0864Round trip delays

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Environmental & Geological Engineering (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种确定故障类型的方法和装置,该方法包括:对多个用户中每个用户在预设周期内产生的运行数据进行在线实时计算,获得每个用户在预设周期内产生的运行数据对应的运行特征值;接收故障分类请求,故障分类请求用于请求确定目标用户在目标时刻之前所产生的故障的故障类型;根据故障分类请求,基于故障分类模型和目标用户在至少一个预设周期内的运行特征值,确定目标用户在目标时刻之前所产生的故障的故障类型。本发明的确定故障类型的方法,通过在线实时计算用户产生的运行数据的运行特征值,在接收到用户投诉时,将运行特征值与故障分类模型进行匹配,确定用户产生故障的故障类型,该流程为在线的流程,处理速度快,人工成本低。

Description

确定故障类型的方法和装置
技术领域
本申请涉及数据处理领域,并且更具体地,涉及一种确定故障类型的方法和装置。
背景技术
随着电信网络服务在管理方面的不断成熟,在技术方面的不断发展,电信网络业务种类越来越丰富,市场竞争越来越激烈。运营商意识到要提高终端用户的满意度,必须从用户使用的角度来衡量网络服务的好坏。为此,运营商以及电信设备制造商专门制定了一系列的指标,例如,关键性能指标(Key Performance Indicator,KPI)和关键质量指标(KeyQuality Indicator,KQI)等,用于评估用户的网络服务的质量和网络设备的运行健康状态。
KPI的出发点是从网络的角度来揣度用户的感受,其并不能全面反映网络服务的质量。在用KPI体系来衡量网络服务的质量时,经常出现的情况是,整个网络设备的KPI均处于良好的状态,但是用户投诉却逐渐增多。为了进一步提高网络服务的质量,KQI被引入到网络服务的质量的评价体系中来。KQI是主要针对不同业务提出贴近用户感受的业务质量参数。KQI的本质是一些关键业务的端到端的服务质量,例如视频业务的流畅程度、清晰度、语音和视频的同步程度等。KQI在一定程度上提高了关键业务的服务质量,但是它仍然有一些局限性。其指标粒度较粗,并且在设置上具有固定模式,使得其在应对用户复杂多变的使用环境上对用户业务质量的刻画显得力不从心。
另一方面,运营商为了提高用户的网络体验,允许用户在网络体验不好时进行投诉。如何在用户投诉时快速准确的判断用户的网络体验不好的问题所在并及时进行处理便成为运营商一直致力解决的问题。投诉—处理方式可以带给用户更好的网络体验,使得运营商处理客服问题的解决效率和质量均有较大的提升,能够节约人力成本。当投诉的问题为网络问题时,投诉—处理方式可以帮助工程师快速定位问题并解决问题。
现有的一种方案是,运营商的客服人员在处理客户的投诉时,根据现网查询网络故障公告、用户的终端使用信息以及KPI、KQI等,凭借自己的经验判断用户的故障类型。这种方法的处理效率主要取决于客服人员的专业程度,处理结果的准确性得不到稳定保障,而且客服人员的经验也存在局限性,对于问题的判断可能存在盲区。
通常情况下,当网络中出现异常时,会在用户数据中的报错日志中体现,或者在信令数据中的某些字段会标识出信令信息是成功的还是失败的。因此,现有的另外一种方案是,运营商的客服人员在处理客户的投诉时,分析报错日志或信令数据中所携带的错误码进行故障类型的判断。运用该方案进行故障类型判断时,一般是单独分析信令数据或错误日志所携带的错误码,以此来判断投诉用户的故障类型。该方案依然需要较多的人工干预,确定故障类型的效率不高。
发明内容
本申请提供一种确定故障类型的方法和装置,能够快速且低成本地确定用户产生故障的故障类型。
第一方面,提供了一种确定故障类型的方法,该方法包括:对多个用户中每个用户在预设周期内产生的运行数据进行在线实时计算,获得所述每个用户在所述预设周期内产生的所述运行数据对应的运行特征值;接收故障分类请求,所述故障分类请求用于请求确定目标用户在目标时刻之前所产生的故障的故障类型,所述目标用户为所述多个用户中的任意一个用户;根据所述故障分类请求,基于故障分类模型和所述目标用户在至少一个所述预设周期内的运行特征值,确定所述目标用户在所述目标时刻之前所产生的故障的故障类型,其中,所述故障分类模型是根据已知故障类型的训练数据进行训练得到的。
第一方面的确定故障类型的方法,通过在线实时计算用户产生的运行数据的运行特征值,在接收到用户投诉时,将运行特征值与故障分类模型进行匹配,确定用户产生故障的故障类型,该流程为在线的流程,处理速度快,人工成本低。
结合第一方面,在第一方面第一种可能的实现方式中,所述对多个用户中每个用户在预设周期内产生的运行数据进行在线实时计算,获得所述每个用户在所述预设周期内产生的所述运行数据对应的运行特征值,包括:获取所述每个用户在所述预设周期内产生的所述运行数据,所述运行数据包括信令面运行数据和用户面运行数据中的至少一种;根据所述运行数据,确定运行数据序列,所述运行数据序列包括所述信令面运行数据对应的信令运行数据序列和所述用户面运行数据对应的用户运行数据序列中的至少一种;根据所述运行数据序列和序列特征集,确定所述运行数据对应的所述运行特征值。第一种可能的实现方式中,捕获用户在网络中所产生的信令面运行数据和用户面运行数据,可以将这两类数据在时序上的模式所包含的异常信息,使用在对故障类型的确定上,能够提升确定故障类型的准确性。
结合第一方面,在第一方面第二种可能的实现方式中,所述方法还包括:获取所述训练数据,所述训练数据包括信令面训练数据和用户面训练数据中的至少一种;根据所述训练数据,确定训练数据序列,所述训练数据序列包括所述信令面训练数据对应的信令训练数据序列和所述用户面训练数据对应的用户训练数据序列中的至少一种;根据所述训练数据序列和序列特征集,确定所述训练数据对应的训练特征值;根据所述训练特征值和所述训练数据对应的故障类型,确定所述故障分类模型。
结合第一方面的第一种可能的实现方式,在第一方面第三种可能的实现方式中,所述方法还包括:获取所述训练数据,所述训练数据包括信令面训练数据和用户面训练数据中的至少一种;根据所述训练数据,确定训练数据序列,所述训练数据序列包括所述信令面训练数据对应的信令训练数据序列和所述用户面训练数据对应的用户训练数据序列中的至少一种;根据所述训练数据序列和所述序列特征集,确定所述训练数据对应的训练特征值;根据所述训练特征值和所述训练数据对应的故障类型,确定所述故障分类模型。
结合第一方面的第一种至第三种可能的实现方式,在第一方面第四种可能的实现方式中,所述序列特征集包括挖掘序列特征集和预定义序列特征集中的至少一种。
结合第一方面的第四种可能的实现方式,在第一方面第五种可能的实现方式中,当所述序列特征集包括所述挖掘序列特征集时,所述方法还包括:对所述训练数据序列进行序列挖掘计算,获得所述挖掘序列特征集。
结合第一方面的第五种可能的实现方式,在第一方面第六种可能的实现方式中,所述对所述训练数据序列进行序列挖掘计算,获得所述挖掘序列特征集,包括:根据所述训练数据序列确定多个训练数据子序列;采用序列挖掘算法对所述多个训练数据子序列进行序列挖掘计算,将挖掘出的训练数据子序列确定为所述挖掘序列特征集中的元素。
结合第一方面的第六种可能的实现方式,在第一方面第七种可能的实现方式中,所述序列挖掘算法包括决策树算法和模式搜索树MBT算法中的至少一种。
结合第一方面及第一方面的第一种至第七种可能的实现方式,在第一方面第八种可能的实现方式中,所述根据所述故障分类请求,基于故障分类模型和所述目标用户在至少一个所述预设周期内的运行特征值,确定所述目标用户在所述目标时刻之前所产生的故障的故障类型,包括:根据所述目标时刻,获取所述目标时刻之前所述目标用户的在多个所述预设周期分别对应的所述运行特征值;对多个所述运行特征值进行重构,获得重构后的重构特征值;将所述重构特征值与所述故障分类模型进行特征匹配,确定所述目标用户在所述目标时刻之前所产生的故障的故障类型。
第二方面,提供了一种确定故障类型的装置,包括实时特征计算模块、接收模块和故障分类模块,用于实现第一方面及第一方面的各种可能的实现方式的相应功能。各模块可以通过硬件实现,也可以通过硬件执行相应的软件实现。确定故障类型的装置还可以包括离线建模模块,以实现相应的实现方式。
应理解,第二方面的确定故障类型的装置的各个模块可以用于实现第一方面及第一方面的各种可能的实现方式的方法,此处不再赘述。
第三方面,提供了一种确定故障类型的装置,包括处理器、网络接口和存储器。其中,存储器可以用于存储处理器执行的代码。确定故障类型的装置还可以包括输出设备或与输出设备连接的输出接口,以用于输出故障分类的结果。
应理解,序列特征集为能够表征故障类型的多个特征的集合。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的确定故障类型的方法的示意性流程图。
图2是本发明另一个实施例的确定故障类型的方法的示意性流程图。
图3是本发明一个实施例的字段AVG_UL_RTT的取值的分布与其可能对应的故障类型的对应关系的示意图。
图4是本发明一个实施例的获得信令面的序列特征集的示意性流程图。
图5是本发明一个实施例的获得用户面的序列特征集的示意性流程图。
图6是本发明一个实施例的确定故障类型的装置的示意性框图。
图7是本发明另一个实施例的确定故障类型的装置的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的确定故障类型的方法多是依赖于人工的,因此本发明实施例提供一种方便快捷的基于在线的确定故障类型的方法。本发明实施例的确定故障类型的方法可以精确地对使用网络服务[例如,使用移动宽带(Mobile Broadband,MBB)网络]的用户的网络质量进行评估,能够结合用户本身的特点和使用习惯,刻画用户网络质量。本发明实施例的确定故障类型的方法还可以快速确定引发投诉用户的网络质量问题的故障类型,协助客服人员快速处理问题。
本发明实施例的确定故障类型的方法100可以包括如图1所示的以下步骤。
S110,对多个用户中每个用户在预设周期内产生的运行数据进行在线实时计算,获得所述每个用户在所述预设周期内产生的所述运行数据对应的运行特征值。
S120,接收故障分类请求,所述故障分类请求用于请求确定目标用户在目标时刻之前所产生的故障的故障类型,所述目标用户为所述多个用户中的任意一个用户。
S130,根据所述故障分类请求,基于故障分类模型和所述目标用户在至少一个所述预设周期内的运行特征值,确定所述目标用户在所述目标时刻之前所产生的故障的故障类型,其中,所述故障分类模型是根据已知故障类型的训练数据进行训练得到的。
具体而言,本发明实施例的确定故障类型的方法可以如图2所示。其中,图1中所示的S110可以认为是图2所示的实时特征计算过程。实时特征计算无需存储原始数据,仅需要存储少量特征值数据,可以节约存储空间,同时实时处理的过程能够节省端到端的查询时间。
S110具体可以包括:获取所述每个用户在所述预设周期内产生的所述运行数据,所述运行数据包括信令面运行数据和用户面运行数据中的至少一种;根据所述运行数据,确定运行数据序列,所述运行数据序列包括所述信令面运行数据对应的信令运行数据序列和所述用户面运行数据对应的用户运行数据序列中的至少一种;根据所述运行数据序列和序列特征集,确定所述运行数据对应的所述运行特征值。
在本发明实施例中,序列特征集为能够表征故障类型的多个特征的集合。具体而言,序列特征集可以是根据经验人工选择出来的或预设的,或者可以是根据本发明实施例中下文中的方法挖掘得到的,能够在故障分类中起到区分作用的多个特征的集合。
在网络的实际运行过程中,每个用户均会产生大量的运行数据。例如,在Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)中,这些运行数据会被存入详单数据库中。从运行数据中可以分析出用户的网络质量。其中,运行数据可以包括信令面运行数据和用户面运行数据中的至少一种。由此,S110捕获用户在网络中所产生的信令面运行数据和用户面运行数据,可以将这两类数据在时序上的模式所包含的异常信息,使用在对故障类型的确定上,能够提升确定故障类型的准确性。
本发明实施例的确定故障类型的方法,可以通过确定故障类型的装置中的实时特征计算模块,按照预设周期从详单数据库中获取每个用户在最近的预设周期内产生的运行数据。换而言之,确定故障类型的装置获取每个用户在预设周期内产生的运行数据。
应理解,预设周期可以是网络系统根据系统的计算能力或系统产生的运行数据确定的,也可以是网络管理人员设定的;预设周期可以是不变的固定值,也可以随着网络环境灵活变化,本发明实施例对此不作限定。在一个具体的例子中,预设周期可以是5分钟或10分钟。
实时特征计算模块在获取运行数据后,根据所述运行数据,确定运行数据序列。由于前文中提到,运行数据可以包括信令面运行数据和用户面运行数据中的至少一种。因此,相应地,所确定的运行数据序列也可以包括信令面运行数据对应的信令运行数据序列和用户面运行数据对应的用户运行数据序列中的至少一种。由信令面运行数据确定信令运行数据序列的具体过程,以及由用户面运行数据确定用户运行数据序列的具体过程,会在下文中详细描述。
在得到运行数据序列后,实时特征计算模块可以根据运行数据序列和序列特征集,确定运行数据对应的运行特征值。其中,序列特征集用于描述特征的格式和计算特征的规则。序列特征集可以包括挖掘序列特征集和预定义序列特征集中的至少一种。预定义序列特征集可以是人工预定义的序列特征集,挖掘序列特征集可以是通过挖掘算法由机器学习出来的序列特征集,挖掘序列特征集的生成以及具体内容将会在下文中进行详细描述。具体而言。当序列特征集包括挖掘序列特征集时,本发明实施例的确定故障类型的方法还可以包括:对训练数据序列进行挖掘计算,获得挖掘序列特征集。
下面通过表1举例说明实时特征计算过程中得到的一个用户的运行特征值的示例。
表1运行特征值的示例
编号 序列特征集的元素 特征值
1 {26100} 1
2 {11000,11000,32017} 0
3 {A1,A2} 1
4 {B1,C2,E2} 1
5 丢包数 23
6 平均时延 12
表1示出的用户的运行特征值包括两部分,预定义特征值和挖掘序列特征值。其中,编号1-4为挖掘序列特征值,其中,编号1和2是信令运行数据序列对应的序列特征值,编号3和4是用户运行数据序列对应的序列特征值;编号5和6为预定义序列特征值。应理解,对于不同的用户以及计算周期,序列特征值是随运行数据的不同而变化的。
实时特征计算模块将计算得到的每个用户在多个预设周期对应的运行特征值存储在运行特征值数据库中,以供故障分类过程使用。
图1中所示的S120可以认为是图2所示的输入的过程。本发明实施例的确定故障类型的装置可以接收投诉用户通过页面等输入的故障分类请求,也可以有客服人员参与,由客服人员通过业务页面向确定故障类型的装置中输入故障分类请求。故障分类请求中可以包括投诉用户的用户标识、以及投诉用户反映的故障时间。确定故障类型的装置将该用户标识对应的用户确定为目标用户,根据故障时间确定目标时刻,以进行后续的处理。当然该过程也可以有客服人员参与,客服人员通过业务页面向确定故障类型的装置中输入目标时刻和目标用户的用户标识。
图1中所示的S130可以认为是图2所示的故障分类过程。具体而言,当网络质量不佳时,用户可以通过客服网页界面、客服应用(APP)界面或客服电话反馈网络质量不佳的问题。S130具体可以包括:根据所述目标时刻,获取所述目标时刻之前所述目标用户的在多个所述预设周期分别对应的所述运行特征值;对多个所述运行特征值进行重构,获得重构后的重构特征值;将所述重构特征值与所述故障分类模型进行特征匹配,确定所述目标用户在所述目标时刻之前所产生的故障的故障类型。
根据目标时刻,获取目标时刻之前目标用户的在多个预设周期分别对应的运行特征值。具体地,目标时刻可以是根据前文中提到的故障时间以及前后一段时间确定的。获取运行数据的时间段的长度可以通过以下方法。例如,根据目标用户投诉的故障时间是2016年5月26日14:00点,将该故障时间确定为目标时刻,则在获取运行数据的时候,可以获取用户在2016年5月25日14:00点~2016年5月26日14:00点的运行数据,时间段的长度为24小时。根据应用的不同,可以对时间段的长度的选择进行调整。
目标用户在多个预设周期对应多个运行特征值,对多个运行特征值进行重构,获得重构后的重构特征值。该重构过程可以是对多个运行特征值进行简单的累加、合并或组合,例如将多个预设周期所产生的丢包数进行累加;也可以是对多个运行特征值进行更复杂的运算,例如取最大值、以预设规则过滤等等,本发明实施例对此不作限定。
在一个具体的例子中,由于每个预设周期对应的运行特征值是在线实时计算得到的,假设在线计算运行特征值的预设周期设定为5分钟,该用户在24小时内产生的运行特征值有288条记录。获取到这288条记录后,需要把它们重构成一条重构特征值。
应理解,本发明实施可以对重构特征值(由多个运行特征值获得)或一个运行特征值与故障分类模型进行特征匹配,确定目标用户所产生的故障的故障类型。其中,故障分类模型可以是装置预先配置好的,也可以是根据已知故障类型的训练数据进行训练得到的,下面对得到故障分类模型的具体过程进行详细描述,该过程可以称为图2中的离线建模过程,可以由确定故障类型的系统中的离线建模模块执行。
一般而言,离线建模过程可以发生在本发明实施例的确定故障类型的方法100的步骤S110至S130之前。即方法100还可以包括:获取所述训练数据,所述训练数据包括信令面训练数据和用户面训练数据中的至少一种;根据所述训练数据,确定训练数据序列,所述训练数据序列所述信令面运行训练对应的信令训练数据序列和所述用户面训练数据对应的用户训练数据序列中的至少一种;根据所述训练数据序列和序列特征集,确定所述训练数据对应的训练特征值;根据所述训练特征值和所述训练数据对应的故障类型,确定所述故障分类模型。
其中,获取训练数据的过程可以如下:从外部获取一批历史的投诉用户的用户标识,这些投诉用户产生的故障的时间和故障类型是已知的,并且这些故障类型是被证实判断正确的。根据历史的投诉用户的用户标识和故障时间,从详单数据库中提取历史的投诉用户在故障时间之前一段时间的运行数据作为训练数据。
接下来,根据训练数据得到训练特征值。该过程与前文中描述的根据运行数据得到运行特征值的过程是一致的。这里,以根据训练数据得到训练特征值为例进行说明。
一方面,如果序列特征集中包括预定义序列特征集,则可以根据训练数据得到预定义特征值。预定义序列特征集的元素可以包括丢包率、传输速率、平均时延以及其它指标,等等。具体地,预定义特征值可以直接从训练数据中得到,也可以对训练数据进行预处理生成训练数据序列之后,由训练数据序列提取出预定义特征值,本发明实施例对此不作限定。
另一方面,如果序列特征集中包括挖掘序列特征集,则可以对训练数据进行预处理,获得训练数据序列。根据训练数据中所包括的内容,训练数据序列可以包括信令面训练数据对应的信令训练数据序列和用户面训练数据对应的用户训练数据序列中的至少一种。
下面具体介绍信令训练数据序列和用户训练数据序列的具体生成过程。
对于信令面训练数据,从信令面训练数据中选择信令类型、信令状态、网络制式等字段,并按时间顺序进行罗列。表2示出了提取上述字段后的信令面训练数据的格式。
表2提取字段后的信令面训练数据的格式
用户标识 时间 信令类型 信令状态 网络制式
user1 12:01 000 1 1
user1 12:02 000 1 1
user1 12:03 017 3 2
user1 12:04 100 2 6
根据表2的提取字段后的信令训练数据的格式,按时间先后顺序进行编码重组,即进行数据序列化处理,得到信令训练数据序列11000,11000,32017,26100。
对于用户面训练数据,从用户面训练数据中选取部分字段,得到表3示出的提取字段后的用户面训练数据的格式。
表3提取字段后的用户面训练数据的格式
如表3所示,表3中一些字段(例如,字段1、字段2和字段3)的取值是数值型的,不适于进行序列,需要进行离散化处理,将其取值变为事物型的。例如,字段3(AVG_UL_RTT)的取值是数值型的。图3示出了字段AVG_UL_RTT的取值的分布与其可能对应的故障类型的对应关系的示意图。根据上述对应关系,可以把AVG_UL_RTT的取值分为2类:AVG_UL_RTT_High和AVG_UL_RTT_Low。据此,将AVG_UL_RTT的数值型的取值转换成事物型。类似地,字段1(GET_NUM)的取值转换成事物型可以为GET_NUM_High或GET_NUM_Low;字段2(GET_FST_FAILED_CODE)的取值转换成事物型可以为GET_FST_FAILED_CODE_Range1,GET_FST_FAILED_CODE_Range2,……或GET_FST_FAILED_CODE_Range6,……。
将表3进行转换以后,得到如表4所示的提取字段后的用户面训练数据的格式。
表4提取字段后的用户面训练数据的格式
转换得到表4所示的内容以后,同样将上述内容按时间先后顺序进行排序得到用户训练数据序列({GET_NUM_High,GET_FST_FAILED_CODE_Range6,AVG_UL_RTT_High,0},{GET_NUM_High,GET_FST_FAILED_CODE_Range6,AVG_UL_RTT_Low,0},…)。
由此,得到了每个用户的训练数据序列(包括信令训练数据序列和用户训练数据序列中的至少一种)。将每个用户的训练数据序列和序列特征集中的元素进行匹配,如果训练数据序列中存在该元素标识1,如果训练数据序列中不存在该元素标识0。这些标识(0或1)的集合形成训练数据对应的训练特征值。该集合也可以称为训练特征值集。下文中,会对如何获得序列特征集进行详细说明。
训练数据的故障类型均是已知的。表5以上文中举出的信令训练数据序列为例,示例性的示出了多个用户的训练特征值和其故障类型的对应关系。例如,序列特征集的元素可能包括以下元素:
{26100}和{11000,11000,32017}。
表5多个用户的训练特征值和其故障类型的对应关系
具体而言,对信令面训练数据进行处理和挖掘,最终可以得到信令面的序列特征集。图4示出了获得信令面的序列特征集的示意性流程图。该流程具体可以包括:
S410,将信令面训练数据作为获得信令面的序列特征集的流程的输入。
S420,如前文所述的方法对信令面训练数据进行字段选取。
S430,如前文所述的方法进行数据序列化处理,得到信令训练数据序列。
S440,对信令训练数据序列进行序列挖掘计算,得到信令面的序列特征集。其中,这里的序列挖掘计算可以是单一维度的序列挖掘。
S450,输出上述信令面的序列特征集。
对用户面训练数据进行处理和挖掘,最终可以得到用户面的序列特征集。图5示出了获得用户面的序列特征集的示意性流程图。该流程具体可以包括:
S510,将用户面训练数据作为获得用户面的序列特征集的流程的输入。
S520,如前文所述的方法对用户面训练数据进行字段选取。
S530,如前文所述的方法进行数据离散化处理。
S540,如前文所述的方法进行数据序列化处理,得到用户训练数据序列。
S550,对用户训练数据序列进行序列挖掘计算,得到用户面的序列特征集。其中,这里的序列挖掘计算可以是多维度的序列挖掘。
S560,输出上述用户面的序列特征集。
上述序列特征集可以包括预定义序列特征集和挖掘序列特征集中的至少一种。根据该对应关系,或者对该对应关系进行进一步挖掘,即进行故障分类模型建模,生成故障分类模型。可以将生成的故障分类模型,上传到故障分类模块,以供故障分类过程使用。故障分类模型可以表示训练特征值以及运行特征值对故障类型的对应关系,从而可以帮助客服人员快速地定位投诉用户的故障类型,有利于工程师对故障进行恢复。
下面详细介绍本发明实施例获得序列特征集的过程。
对于信令面训练数据,前文得到信令训练数据序列11000,11000,32017,26100。对该序列而言,其包括多个子序列:
{11000},{32017},{26100}
{11000,11000},{11000,32017},{32017,26100}
{11000,11000,32017},{11000,32017,26100}
{11000,11000,32017,26100}
而后,本发明实施例的方法可以采用序列模式挖掘(Sequence Pattern Mining)算法,挖掘出序列特征集的元素。这里的序列特征集是指挖掘序列特征集。相应地,当所述序列特征集包括挖掘序列特征集时,本发明实施例的方法还可以包括:对训练数据序列进行序列挖掘计算,获得挖掘序列特征集。
其中,序列模式定义为一个由不同序列作为元素组成的集合。其中,任意两个元素不相同,每个作为元素的序列中的子元素按顺序有序排列。常规的序列挖掘算法是挖掘相对时间内或其他序列中出现频率高的子序列的集合(也称为序列模式),应用一般限于离散型的序列。常规的序列挖掘算法通常根据用户指定的一个最小支持度阈值,挖掘时找出被挖掘的数据序列中所有的频繁子序列,即该子序列在被挖掘的数据序列中的出现的频率不低于上述最小支持度阈值。将频繁子序列作为序列模式的元素。
但是,常规的序列挖掘算法并不适用于本发明实施例中确定挖掘序列特征集。这是因为常规的序列挖掘算法对子序列的筛选是基于子序列出现的频率的,即出现频率越多的子序列会被算法选出来。而本发明实施例在识别故障类型时,能够对故障类型进行区分的往往是那些出现频率较低,但是区分性强的子序列。因此,本发明实施例可以根据需求选择合适的序列挖掘算法,例如决策树算法和模式搜索树(Model-based search Tree,MBT)算法中的至少一种。
例如,采用决策树算法构造决策树时,可以根据信息熵、GINI系数等参数来构造。通过决策树算法选择出来的子序列,可以认为是具有辨识度的子序列,将这些子序列作为挖掘信令序列特征集的元素,当然也是挖掘序列特征集的元素。在上面的示例中,我们可以从中挖到的子序列为{26100}和{11000,11000,32017}。
其中26100表示的网络制式、信令类型、信令状态分别为4G、附着、拒绝。11000,11000,32017表示的网络制式、信令类型、信令状态分别为3G、附着、成功;3G、附着、成功和2G、Gb接口寻呼、超时。{26100}和{11000,11000,32017}均为辨识度较强的特征。
类似地,对于每个用户的用户面训练数据,获得用户训练数据序列。例如,一个用户的用户训练数据序列为{(A1,B1),(A2,C2),(D1,E2)}。
它对应的子序列可以为:
(A1),(A2),(B1),(C2),(D1),(E2)
(A1,A2),(A1,C2),(B1,A2),(B1,C2),(A2,D1),(A2,E2),(C2,D1),(C2,E2)
(A1,A2,D1),(A1,A2,E2),(A1,C2,D1),(A1,C2,E2),(B1,A2,D1),(B1,A2,E2),(B1,C2,D1)
(B1,C2,E2)……
采用序列挖掘算法,在所有可能出现的子序列组合中,挖掘出用户训练数据序列中辨识度较强的特征,作为挖掘用户序列特征集的元素,当然也是挖掘序列特征集的元素。
综上,所述对所述训练数据序列进行序列挖掘计算,获得所述挖掘序列特征集,可以包括:根据所述训练数据序列确定多个训练数据子序列;采用序列挖掘算法对所述多个训练数据子序列进行序列挖掘计算,将挖掘出的训练数据子序列确定为所述挖掘序列特征集中的元素。
挖掘信令序列特征集和挖掘用户序列特征集组成挖掘序列特征集。本发明实施例的方法可以将挖掘序列特征集上传到在线特征计算模块,供其在实时计算用户的运行特征值时使用。
在本发明实施例的方法中,可以对序列特征集和故障分类模型进行周期性刷新。周期性输入一批投诉用户的用户标识,故障时间,确保正确可靠的故障类型到离线建模模块,离线建模模块从详单数据库中提取这部分投诉用户在故障时间对应的多个预设周期内产生的数据,计算特征值,增量地对故障分类模型和序列特征集进行刷新,刷新后的序列特征集和故障分类模型分别刷新到在线特征计算模块和故障类型确定模块。获得刷新的序列特征集和故障分类模型的过程可以与前文中的描述一致,此处不再进行赘述。
本发明实施例的确定故障类型的方法,通过在线实时计算用户产生的运行数据的运行特征值,在接收到用户投诉时,将运行特征值与故障分类模型进行匹配,确定用户产生故障的故障类型,该流程为在线的流程,处理速度快,人工成本低。
图6示出了本发明实施例的确定故障类型的装置600的示意性框图。该确定故障类型的装置600可以包括:
实时特征计算模块610,用于对多个用户中每个用户在预设周期内产生的运行数据进行在线实时计算,获得所述每个用户在所述预设周期内产生的所述运行数据对应的运行特征值;
接收模块620,用于接收故障分类请求,所述故障分类请求用于请求确定目标用户在目标时刻之前所产生的故障的故障类型,所述目标用户为所述多个用户中的任意一个用户;
故障分类模块630,用于根据所述接收模块620接收的所述故障分类请求,基于故障分类模型和所述目标用户在至少一个所述预设周期内的运行特征值,确定所述目标用户在所述目标时刻之前所产生的故障的故障类型,其中,所述故障分类模型是根据已知故障类型的训练数据进行训练得到的。
本发明实施例的确定故障类型的装置,通过在线实时计算用户产生的运行数据的运行特征值,在接收到用户投诉时,将运行特征值与故障分类模型进行匹配,确定用户产生故障的故障类型,该流程为在线的流程,处理速度快,人工成本低。
可选地,作为一个实施例,所述实时特征计算模块610具体可以用于:获取所述每个用户在所述预设周期内产生的所述运行数据,所述运行数据包括信令面运行数据和用户面运行数据中的至少一种;根据所述运行数据,确定运行数据序列,所述运行数据序列包括所述信令面运行数据对应的信令运行数据序列和所述用户面运行数据对应的用户运行数据序列中的至少一种;根据所述运行数据序列和序列特征集,确定所述运行数据对应的所述运行特征值。
可选地,作为一个实施例,所述装置600还可以包括离线建模模块640,用于:获取所述训练数据,所述训练数据包括信令面训练数据和用户面训练数据中的至少一种;根据所述训练数据,确定训练数据序列,所述训练数据序列包括所述信令面训练数据对应的信令训练数据序列和所述用户面训练数据对应的用户训练数据序列中的至少一种;根据所述训练数据序列和所述序列特征集,确定所述训练数据对应的训练特征值;根据所述训练特征值和所述训练数据对应的故障类型,确定所述故障分类模型。
可选地,作为一个实施例,所述序列特征集包括挖掘序列特征集和预定义序列特征集中的至少一种。
可选地,作为一个实施例,当所述序列特征集包括所述挖掘序列特征集时,离线建模模块640可以用于:对所述训练数据序列进行序列挖掘计算,获得所述挖掘序列特征集。
可选地,作为一个实施例,所述离线建模模块640具体可以用于:根据所述训练数据序列确定多个训练数据子序列;采用序列挖掘算法对所述多个训练数据子序列进行序列挖掘计算,将挖掘出的训练数据子序列确定为所述挖掘序列特征集中的元素。
可选地,作为一个实施例,所述序列挖掘算法包括决策树算法和模式搜索树MBT算法中的至少一种。
可选地,作为一个实施例,所述故障分类模块630具体可以用于:根据所述目标时刻,获取所述目标时刻之前所述目标用户的在多个所述预设周期分别对应的所述运行特征值;对多个所述运行特征值进行重构,获得重构后的重构特征值;将所述重构特征值与所述故障分类模型进行特征匹配,确定所述目标用户在所述目标时刻之前所产生的故障的故障类型。
应理解,本发明实施例中,实时特征计算模块610、故障分类模块630和离线建模模块640可以由处理器实现,接收模块620可以由网络接口实现。如图7所示,装置700可以包括处理器710、网络接口720和存储器730。其中,存储器730可以用于存储处理器710执行的代码等。装置700还可以包括输出设备或与输出设备连接的输出接口740,以用于输出故障分类的结果。输出设备包括显示器,打印机等等。
装置700中的各个组件通过总线系统750耦合在一起,其中总线系统750除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。
图6所示的装置600或图7所示的装置700能够实现前述图1至图5的实施例中所实现的各个过程,为避免重复,这里不再赘述。
应注意,本发明上述方法实施例可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
可以理解,本发明实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DR RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
所述网络接口用于接收来自于企业网络中的沙箱服务器发送的至少一个程序文件的行为序列。具体地,网络接口可以接收沙箱服务器发送的程序文件对应的MD5值以及程序文件的行为序列。网络接口1220可以是一个网络接口,也可以是多个网络接口。网络接口1220可以接收一个沙箱服务器发送的行为序列,也可以接收多个沙箱服务器分别发送的行为序列。网络接口可以是有线接口,例如光纤分布式数据接口(Fiber Distributed DataInterface,FDDI)、千兆以太网(Gigabit Ethernet,GE)接口;网络接口也可以是无线接口。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (16)

1.一种确定故障类型的方法,其特征在于,包括:
对多个用户中每个用户在预设周期内产生的运行数据进行在线实时计算,获得所述每个用户在所述预设周期内产生的所述运行数据对应的运行特征值;
接收故障分类请求,所述故障分类请求用于请求确定目标用户在目标时刻之前所产生的故障的故障类型,所述目标用户为所述多个用户中的任意一个用户;
根据所述故障分类请求,基于故障分类模型和所述目标用户在至少一个所述预设周期内的运行特征值,确定所述目标用户在所述目标时刻之前所产生的故障的故障类型,其中,所述故障分类模型是根据已知故障类型的训练数据进行训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述对多个用户中每个用户在预设周期内产生的运行数据进行在线实时计算,获得所述每个用户在所述预设周期内产生的所述运行数据对应的运行特征值,包括:
获取所述每个用户在所述预设周期内产生的所述运行数据,所述运行数据包括信令面运行数据和用户面运行数据中的至少一种;
根据所述运行数据,确定运行数据序列,所述运行数据序列包括所述信令面运行数据对应的信令运行数据序列和所述用户面运行数据对应的用户运行数据序列中的至少一种;
根据所述运行数据序列和序列特征集,确定所述运行数据对应的所述运行特征值。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取所述训练数据,所述训练数据包括信令面训练数据和用户面训练数据中的至少一种;
根据所述训练数据,确定训练数据序列,所述训练数据序列包括所述信令面训练数据对应的信令训练数据序列和所述用户面训练数据对应的用户训练数据序列中的至少一种;
根据所述训练数据序列和所述序列特征集,确定所述训练数据对应的训练特征值;
根据所述训练特征值和所述训练数据对应的故障类型,确定所述故障分类模型。
4.根据权利要求2或3所述的方法,其特征在于,所述序列特征集包括挖掘序列特征集和预定义序列特征集中的至少一种。
5.根据权利要求4所述的方法,其特征在于,当所述序列特征集包括所述挖掘序列特征集时,所述方法还包括:
对所述训练数据序列进行序列挖掘计算,获得所述挖掘序列特征集。
6.根据权利要求5所述的方法,其特征在于,所述对所述训练数据序列进行序列挖掘计算,获得所述挖掘序列特征集,包括:
根据所述训练数据序列确定多个训练数据子序列;
采用序列挖掘算法对所述多个训练数据子序列进行序列挖掘计算,将挖掘出的训练数据子序列确定为所述挖掘序列特征集中的元素。
7.根据权利要求6所述的方法,其特征在于,所述序列挖掘算法包括决策树算法和模式搜索树MBT算法中的至少一种。
8.根据权利要求1至7中任一项所述的方法,其特征在于,所述根据所述故障分类请求,基于故障分类模型和所述目标用户在至少一个所述预设周期内的运行特征值,确定所述目标用户在所述目标时刻之前所产生的故障的故障类型,包括:
根据所述目标时刻,获取所述目标时刻之前所述目标用户的在多个所述预设周期分别对应的所述运行特征值;
对多个所述运行特征值进行重构,获得重构后的重构特征值;
将所述重构特征值与所述故障分类模型进行特征匹配,确定所述目标用户在所述目标时刻之前所产生的故障的故障类型。
9.一种确定故障类型的装置,其特征在于,包括:
实时特征计算模块,用于对多个用户中每个用户在预设周期内产生的运行数据进行在线实时计算,获得所述每个用户在所述预设周期内产生的所述运行数据对应的运行特征值;
接收模块,用于接收故障分类请求,所述故障分类请求用于请求确定目标用户在目标时刻之前所产生的故障的故障类型,所述目标用户为所述多个用户中的任意一个用户;
故障分类模块,用于根据所述获取模块获取的所述故障分类请求,基于故障分类模型和所述目标用户在至少一个所述预设周期内的运行特征值,确定所述目标用户在所述目标时刻之前所产生的故障的故障类型,其中,所述故障分类模型是根据已知故障类型的训练数据进行训练得到的。
10.根据权利要求9所述的装置,其特征在于,所述实时特征计算模块具体用于:
获取所述每个用户在所述预设周期内产生的所述运行数据,所述运行数据包括信令面运行数据和用户面运行数据中的至少一种;
根据所述运行数据,确定运行数据序列,所述运行数据序列包括所述信令面运行数据对应的信令运行数据序列和所述用户面运行数据对应的用户运行数据序列中的至少一种;
根据所述运行数据序列和序列特征集,确定所述运行数据对应的所述运行特征值。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括离线建模模块,用于:
获取所述训练数据,所述训练数据包括信令面训练数据和用户面训练数据中的至少一种;
根据所述训练数据,确定训练数据序列,所述训练数据序列包括所述信令面训练数据对应的信令训练数据序列和所述用户面训练数据对应的用户训练数据序列中的至少一种;
根据所述训练数据序列和所述序列特征集,确定所述训练数据对应的训练特征值;
根据所述训练特征值和所述训练数据对应的故障类型,确定所述故障分类模型。
12.根据权利要求10或11所述的装置,其特征在于,所述序列特征集包括挖掘序列特征集和预定义序列特征集中的至少一种。
13.根据权利要求12所述的装置,其特征在于,当所述序列特征集包括所述挖掘序列特征集时,所述装置还包括离线建模模块,用于:
对所述训练数据序列进行序列挖掘计算,获得所述挖掘序列特征集。
14.根据权利要求13所述的装置,其特征在于,所述离线建模模块具体用于:
根据所述训练数据序列确定多个训练数据子序列;
采用序列挖掘算法对所述多个训练数据子序列进行序列挖掘计算,将挖掘出的训练数据子序列确定为所述挖掘序列特征集中的元素。
15.根据权利要求14所述的装置,其特征在于,所述序列挖掘算法包括决策树算法和模式搜索树MBT算法中的至少一种。
16.根据权利要求9至15中任一项所述的装置,其特征在于,所述故障分类模块具体用于:
根据所述目标时刻,获取所述目标时刻之前所述目标用户的在多个所述预设周期分别对应的所述运行特征值;
对多个所述运行特征值进行重构,获得重构后的重构特征值;
将所述重构特征值与所述故障分类模型进行特征匹配,确定所述目标用户在所述目标时刻之前所产生的故障的故障类型。
CN201610867164.3A 2016-09-30 2016-09-30 确定故障类型的方法和装置 Active CN107888397B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201610867164.3A CN107888397B (zh) 2016-09-30 2016-09-30 确定故障类型的方法和装置
PCT/CN2017/103506 WO2018059402A1 (zh) 2016-09-30 2017-09-26 确定故障类型的方法和装置
US16/351,033 US11140021B2 (en) 2016-09-30 2019-03-12 Method and apparatus for determining fault type

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610867164.3A CN107888397B (zh) 2016-09-30 2016-09-30 确定故障类型的方法和装置

Publications (2)

Publication Number Publication Date
CN107888397A true CN107888397A (zh) 2018-04-06
CN107888397B CN107888397B (zh) 2020-12-25

Family

ID=61763651

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610867164.3A Active CN107888397B (zh) 2016-09-30 2016-09-30 确定故障类型的方法和装置

Country Status (3)

Country Link
US (1) US11140021B2 (zh)
CN (1) CN107888397B (zh)
WO (1) WO2018059402A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108833172A (zh) * 2018-06-21 2018-11-16 中国联合网络通信集团有限公司 一种网络故障报警的处理方法、装置和网络系统
CN109780812A (zh) * 2019-01-04 2019-05-21 青岛海尔股份有限公司 冰箱的运行状态数据的处理方法和装置
CN110337118A (zh) * 2019-04-24 2019-10-15 中国联合网络通信集团有限公司 用户投诉快速处理方法及装置
CN110365528A (zh) * 2019-07-10 2019-10-22 广州瀚信通信科技股份有限公司 一种基于家庭宽带大数据的处理投诉分析方法
CN110856203A (zh) * 2019-11-19 2020-02-28 中国联合网络通信集团有限公司 终端网络诊断方法及系统
CN110943874A (zh) * 2018-09-21 2020-03-31 中国移动通信有限公司研究院 一种家庭宽带网络的故障检测方法、装置和可读介质
CN110990395A (zh) * 2018-09-29 2020-04-10 北京国双科技有限公司 一种数据处理方法及装置
CN111859047A (zh) * 2019-04-23 2020-10-30 华为技术有限公司 一种故障解决方法及装置
CN113691405A (zh) * 2021-08-25 2021-11-23 北京知道创宇信息技术股份有限公司 一种访问异常诊断方法、装置、存储介质及电子设备
CN116097189A (zh) * 2020-09-27 2023-05-09 西门子股份公司 生产过程中的质量问题的分类方法和装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110941554B (zh) * 2019-11-25 2023-10-27 腾讯科技(深圳)有限公司 一种复现故障的方法及装置
CN111130855B (zh) * 2019-12-05 2022-08-12 中国联合网络通信集团有限公司 一种问题定位方法和装置
CN111178423B (zh) * 2019-12-25 2023-05-23 国网数字科技控股有限公司 一种故障预警方法及装置
CN111651601B (zh) * 2020-06-02 2023-04-18 全球能源互联网研究院有限公司 用于电力信息系统的故障分类模型的训练方法及分类方法
CN113515434B (zh) * 2021-01-04 2024-09-10 腾讯科技(深圳)有限公司 异常分类方法、装置、异常分类设备及存储介质
CN112860968A (zh) * 2021-02-02 2021-05-28 北京三快在线科技有限公司 一种异常检测的方法以及装置
CN115442832B (zh) * 2021-06-03 2024-04-09 中国移动通信集团四川有限公司 投诉问题定位方法、装置及电子设备
CN113778837B (zh) * 2021-08-06 2023-09-26 北京奇艺世纪科技有限公司 页面故障确定方法、装置、电子设备及存储介质
CN115396882B (zh) * 2022-08-24 2024-06-21 烽火通信科技股份有限公司 一种实现网络告警分类模型计算的方法和装置
CN115793560A (zh) * 2022-11-30 2023-03-14 中铁一局集团有限公司 一种基于序列分析模型的盾构机plc故障报警预测方法
CN116163943B (zh) * 2023-03-27 2023-09-08 蚌埠市联合压缩机制造有限公司 一种运行状态实时监测的压缩机

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1848602A (zh) * 2006-03-22 2006-10-18 珠海市伊特高科技有限公司 远程通讯配电监控系统及方法
US7533070B2 (en) * 2006-05-30 2009-05-12 Honeywell International Inc. Automatic fault classification for model-based process monitoring
CN101917297A (zh) * 2010-08-30 2010-12-15 烽火通信科技股份有限公司 基于贝叶斯网络的核心网故障诊断方法及系统
CN102411106A (zh) * 2011-11-18 2012-04-11 广东电网公司广州供电局 电力变压器故障监测方法及装置
CN103036649A (zh) * 2012-12-17 2013-04-10 上海应用技术学院 基于高速列车的故障预警信息异构复用无线传输方法
CN103760901A (zh) * 2013-12-31 2014-04-30 北京泰乐德信息技术有限公司 一种基于关联规则分类器的轨道交通故障识别方法
CN104731083A (zh) * 2015-02-03 2015-06-24 浙江大学 一种基于自适应特征提取的工业故障诊断方法及应用
CN105045256A (zh) * 2015-07-08 2015-11-11 北京泰乐德信息技术有限公司 基于数据对比分析的轨道交通实时故障诊断方法和系统
CN105116872A (zh) * 2015-07-13 2015-12-02 哈尔滨工业大学 一种工业过程中基于度量学习与时间序列的故障诊断方法
US20160266952A1 (en) * 2015-03-10 2016-09-15 Kai Höfig Automated Qualification of a Safety Critical System

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1190342A2 (en) * 1999-05-24 2002-03-27 Aprisma Management Technologies, Inc. Service level management
US6970804B2 (en) * 2002-12-17 2005-11-29 Xerox Corporation Automated self-learning diagnostic system
US8359378B2 (en) * 2005-11-24 2013-01-22 Hewlett-Packard Development Company, L.P. Network system and method of administrating networks
CN101459925B (zh) 2007-12-11 2010-10-20 中国移动通信集团公司 电信网络投诉管理系统及方法
CN101217693A (zh) 2007-12-26 2008-07-09 中国移动通信集团湖北有限公司 Gprs用户投诉处理方法及集中处理系统
JP5051252B2 (ja) * 2010-02-18 2012-10-17 沖電気工業株式会社 ネットワーク障害検出システム
CN101867486A (zh) * 2010-06-08 2010-10-20 江苏大学 一种无线传感器网络故障诊断方法
CN101951630A (zh) 2010-10-12 2011-01-19 武汉虹旭信息技术有限责任公司 一种提高cdma网络客服支撑能力的方法
CN102487343B (zh) * 2010-12-06 2014-11-05 中国人民解放军理工大学 卫星通信系统隐故障诊断预测方法
US8898092B2 (en) * 2012-01-31 2014-11-25 International Business Machines Corporation Leveraging user-to-tool interactions to automatically analyze defects in it services delivery
CN103906112B (zh) 2012-12-28 2018-04-03 中国电信股份有限公司 通信网络性能的分析方法与系统
CN104021264B (zh) * 2013-02-28 2017-06-20 华为技术有限公司 一种缺陷预测方法及装置
CN104794136A (zh) * 2014-01-22 2015-07-22 华为技术有限公司 故障分析方法和装置
US9628340B2 (en) * 2014-05-05 2017-04-18 Ciena Corporation Proactive operations, administration, and maintenance systems and methods in networks using data analytics
CN105306246B (zh) 2014-07-31 2018-08-21 中国移动通信集团浙江有限公司 一种自动应答网络类投诉的方法、装置和服务器
CN104301156B (zh) 2014-11-03 2018-04-24 杭州东方通信软件技术有限公司 一种客户投诉前移的预处理方法及其网络设备
CN104349366B (zh) 2014-11-03 2017-09-01 四川公用信息产业有限责任公司 一种基于gis的无线网络问题关联分析方法
CN106162710B (zh) * 2015-04-10 2019-11-05 富士通株式会社 故障检测装置、方法和系统
CN105099791B (zh) 2015-09-02 2018-05-18 越亮传奇科技股份有限公司 一种基于网络信令监测数据的终端故障定位方法和系统
US10708795B2 (en) * 2016-06-07 2020-07-07 TUPL, Inc. Artificial intelligence-based network advisor

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1848602A (zh) * 2006-03-22 2006-10-18 珠海市伊特高科技有限公司 远程通讯配电监控系统及方法
US7533070B2 (en) * 2006-05-30 2009-05-12 Honeywell International Inc. Automatic fault classification for model-based process monitoring
CN101917297A (zh) * 2010-08-30 2010-12-15 烽火通信科技股份有限公司 基于贝叶斯网络的核心网故障诊断方法及系统
CN102411106A (zh) * 2011-11-18 2012-04-11 广东电网公司广州供电局 电力变压器故障监测方法及装置
CN103036649A (zh) * 2012-12-17 2013-04-10 上海应用技术学院 基于高速列车的故障预警信息异构复用无线传输方法
CN103760901A (zh) * 2013-12-31 2014-04-30 北京泰乐德信息技术有限公司 一种基于关联规则分类器的轨道交通故障识别方法
CN104731083A (zh) * 2015-02-03 2015-06-24 浙江大学 一种基于自适应特征提取的工业故障诊断方法及应用
US20160266952A1 (en) * 2015-03-10 2016-09-15 Kai Höfig Automated Qualification of a Safety Critical System
CN105045256A (zh) * 2015-07-08 2015-11-11 北京泰乐德信息技术有限公司 基于数据对比分析的轨道交通实时故障诊断方法和系统
CN105116872A (zh) * 2015-07-13 2015-12-02 哈尔滨工业大学 一种工业过程中基于度量学习与时间序列的故障诊断方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108833172A (zh) * 2018-06-21 2018-11-16 中国联合网络通信集团有限公司 一种网络故障报警的处理方法、装置和网络系统
CN108833172B (zh) * 2018-06-21 2021-05-25 中国联合网络通信集团有限公司 一种网络故障报警的处理方法、装置和网络系统
CN110943874A (zh) * 2018-09-21 2020-03-31 中国移动通信有限公司研究院 一种家庭宽带网络的故障检测方法、装置和可读介质
CN110990395B (zh) * 2018-09-29 2023-04-07 北京国双科技有限公司 一种数据处理方法及装置
CN110990395A (zh) * 2018-09-29 2020-04-10 北京国双科技有限公司 一种数据处理方法及装置
CN109780812B (zh) * 2019-01-04 2022-10-28 海尔智家股份有限公司 冰箱的运行状态数据的处理方法和装置
CN109780812A (zh) * 2019-01-04 2019-05-21 青岛海尔股份有限公司 冰箱的运行状态数据的处理方法和装置
CN111859047A (zh) * 2019-04-23 2020-10-30 华为技术有限公司 一种故障解决方法及装置
CN110337118A (zh) * 2019-04-24 2019-10-15 中国联合网络通信集团有限公司 用户投诉快速处理方法及装置
CN110365528A (zh) * 2019-07-10 2019-10-22 广州瀚信通信科技股份有限公司 一种基于家庭宽带大数据的处理投诉分析方法
CN110856203A (zh) * 2019-11-19 2020-02-28 中国联合网络通信集团有限公司 终端网络诊断方法及系统
CN110856203B (zh) * 2019-11-19 2023-04-28 中国联合网络通信集团有限公司 终端网络诊断方法及系统
CN116097189A (zh) * 2020-09-27 2023-05-09 西门子股份公司 生产过程中的质量问题的分类方法和装置
CN113691405A (zh) * 2021-08-25 2021-11-23 北京知道创宇信息技术股份有限公司 一种访问异常诊断方法、装置、存储介质及电子设备
CN113691405B (zh) * 2021-08-25 2023-12-01 北京知道创宇信息技术股份有限公司 一种访问异常诊断方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
WO2018059402A1 (zh) 2018-04-05
CN107888397B (zh) 2020-12-25
US11140021B2 (en) 2021-10-05
US20190215232A1 (en) 2019-07-11

Similar Documents

Publication Publication Date Title
CN107888397A (zh) 确定故障类型的方法和装置
CN110222880B (zh) 业务风险的确定方法、模型训练方法和数据处理方法
CN111722043B (zh) 一种电力设备故障检测方法、装置及系统
CN104753985A (zh) 会话列表显示方法和装置
SG115362A1 (en) Asset management and scheduling graphical user interface for media streamer
CN111798244B (zh) 交易欺诈行为监测方法及装置
CN105528264B (zh) 防误操作的数据恢复方法及其系统
CN105630957A (zh) 一种基于用户管理应用行为的应用质量判别方法及系统
CN109783459A (zh) 从日志中提取数据的方法、装置及计算机可读存储介质
CN110991871A (zh) 风险监测方法、装置、设备与计算机可读存储介质
CN107832291A (zh) 人机协作的客服方法、电子装置及存储介质
CN109376167A (zh) 专家选取方法、装置和服务器
CN113094284A (zh) 应用故障检测方法及装置
CN117875801A (zh) 一种基于平行区块链的企业运营管理智能控制平台
CN109284331A (zh) 基于业务数据资源的制证信息获取方法、终端设备及介质
US20190340540A1 (en) Adaptive continuous log model learning
CN117238455B (zh) 一种基于物联网的医院就诊监管优化系统
CN106411563A (zh) 日志记录方法、装置和路由器
CN112783865A (zh) 一种半监督人机结合的运维故障库生成方法及系统
CN106161490A (zh) 一种用户在线行为状态更新方法、装置及系统
CN116797345A (zh) 任务处理方法、装置、计算机设备及存储介质
CN116610690A (zh) 一种模型自动化更新方法、装置、设备及存储介质
CN111708748B (zh) 一种网络日志分析算法的管理系统及方法
CN103473312A (zh) 一种独立的依据信息获取方法
CN113313615A (zh) 一种对企业司法风险进行量化评分定级的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant