CN113328898A - 一种具有自主学习能力的故障诊断方法和系统 - Google Patents

一种具有自主学习能力的故障诊断方法和系统 Download PDF

Info

Publication number
CN113328898A
CN113328898A CN202110878267.0A CN202110878267A CN113328898A CN 113328898 A CN113328898 A CN 113328898A CN 202110878267 A CN202110878267 A CN 202110878267A CN 113328898 A CN113328898 A CN 113328898A
Authority
CN
China
Prior art keywords
fault
case
equipment
isolation
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110878267.0A
Other languages
English (en)
Other versions
CN113328898B (zh
Inventor
李井源
周蓉
黄新明
王飞雪
刘增军
孙广富
欧钢
张可
倪少杰
龚航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202110878267.0A priority Critical patent/CN113328898B/zh
Publication of CN113328898A publication Critical patent/CN113328898A/zh
Application granted granted Critical
Publication of CN113328898B publication Critical patent/CN113328898B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/40Monitoring; Testing of relay systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/14Relay systems
    • H04B7/15Active relay systems
    • H04B7/155Ground-based stations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities

Abstract

本发明公开一种具有自主学习能力的故障诊断方法和系统,方法包括,采集卫星地面站收发系统的故障信息,基于案例库进行故障特征检索,获得故障信息对应的相关案例;基于相关案例的解决方案,对故障信息进行故障清除处理,根据故障处理结果,更新案例库;如果没有检索到相关案例,则采集卫星地面站收发系统中具有故障信息的设备,对设备进行故障层次标定后进行故障隔离;基于故障隔离结果,确定故障位置,生成故障案例,将故障案例发送给系统管理员并更新案例库;系统包括故障信息采集模块、故障处理模块,故障隔离模块、故障案例生成与更新模块;本发明实现了自主快速进行隔离故障、恢复系统性能,同时也减轻后续专家问题排查的工作量。

Description

一种具有自主学习能力的故障诊断方法和系统
技术领域
本发明涉及通信故障诊断领域,具体涉及一种具有自主学习能力的故障诊断方法和系统。
背景技术
随着卫星应用技术的持续发展,卫星地面站的规模日益庞大,功能复杂性大幅提升,同时对卫星地面站可靠性也提出了更高的要求。以卫星地面站收发系统为例,其主要业务是完成信号的生成、扩频调制和功率放大,以及信号接收,变频,解调等任务,必须实现7*24小时稳定运行。依靠人工进行维护和故障分析等传统的运维方法已不能适应复杂通信系统的运维要求,一方面是卫星地面站收发系统设备类型和数量繁多,设备之间紧密耦合,导致故障之间存在传递效应,使故障来源难以分离;另一方面是由于系统的时变性和复杂性,难以预先知晓并获取完备的故障模式,当有未知故障发生时,需要人工干预,导致存在故障处置不及时。
目前故障诊断方法主要有基于数据驱动的推理,基于模型的推理和基于知识的推理。基于数据驱动的诊断推理指根据系统状态数据与故障间对应关系,基于系统状态数据进行处理分析,以获取故障发生位置以及程度等信息,该方法需要每个故障模式下的大量数据,若缺乏训练数据则难以完成故障诊断。基于模型的诊断推理通过利用系统结构和行为等模型,建立模型和系统观测参数之间的解析关系进行诊断推理的方法,该方法要求事先获取较为全面的故障模式,而故障模式的缺乏将导致不能识别未知故障,同时其还存在候选诊断解空间较大的问题。基于知识的诊断推理是指根据对象系统的多种信息,包括专家经验以及大量的故障信息知识等,对系统进行故障诊断和推理,其主要包括基于规则的专家系统,基于故障树的诊断推理,以及基于案例的诊断推理等方法,该方法也要求获取较为全面的故障模式,对于经验之外的未知问题可能出现诊断失败。
因此在保证故障诊断正确性的同时,需要提高诊断系统的自主学习能力,使故障诊断系统对于未知故障具备排查,诊断和处理的能力。
发明内容
本发明的主要目的是克服现有技术的不足,为复杂通信系统提供一种具备自主学习能力的故障诊断系统。
为实现上述目的,本发明提供一种具有自主学习能力的故障诊断方法,包括以下步骤,
采集卫星地面站收发系统的故障信息,基于案例库进行故障特征检索,获得所述故障信息对应的相关案例;
基于所述相关案例的解决方案,对所述故障信息进行故障清除处理,根据故障处理结果,更新所述案例库;
在基于所述案例库进行故障特征检索的过程中,如果没有检索到所述相关案例,则采集所述卫星地面站收发系统中具有所述故障信息的设备,对所述设备进行故障层次标定后进行故障隔离,其中,所述故障隔离用于表示对所述设备进行主备切换或复位;
基于故障隔离结果,遍历所述卫星地面站收发系统,确定故障位置,生成故障案例,将所述故障案例发送给系统管理员并更新所述案例库;
其中,还包括:对所述相关案例进行去冗余处理,并根据案例相似度进行排序;
通过使用复用成功率最高的解决方案来解决当前问题,如果能解决问题,则诊断结束,同时更新所述案例库,修改权重或者故障特征;
如果不能解决问题,则继续采用下一个所述解决方案;
如果所有解决方案都不能解决当前问题,则采集所述卫星地面站收发系统中具有所述故障信息的所述设备,对所述设备进行故障层次标定后进行故障隔离;
基于所述故障隔离结果,确定所述故障位置,生成所述故障案例,将所述故障案例发送给所述系统管理员并更新所述案例库。
优选地,在采集所述卫星地面站收发系统的所述故障信息的过程前,采集所述卫星地面站收发系统的状态信息,基于所述案例库的失效模式阈值,获得所述故障信息,其中,所述失效模式阈值用于表示故障发生时的状态参数。
优选地,在对所述设备进行故障层次标定后进行故障隔离的过程中,如果故障是设备级故障,则对故障设备进行故障隔离;
如果所述故障是链路级故障,则标记故障链路所有相关的所述故障设备,并按设备可靠性优先级排序,从可靠性最低的所述故障设备开始,执行故障隔离;
如果故障是系统级故障,则标记出所有相关的所述故障设备,按所述设备可靠性优先级进行排序,从可靠性最低的所述故障设备开始执行故障隔离。
优选地,在生成所述故障案例的过程中,对于有硬件冗余的所述故障设备,优先下发主备切换指令;
对于无备份的所述故障设备,则下发复位指令。
优选地,在对设备进行故障层次标定的过程中,若所述设备不响应指令,则标定失败;
若所述设备执行了所述指令且系统恢复正常,则诊断结束,确认所述故障位置,同时将该案例添加到所述案例库中;
若所述设备执行了所述指令但故障告警未解除,则该设备不是所述故障设备,继续对下一个所述设备进行故障隔离;若遍历完所有设备后,将诊断过程和结果以报告形式发送给所述系统管理员。
一种具有自主学习能力的故障诊断系统,包括,
故障信息采集模块,用于采集卫星地面站收发系统的故障信息,基于案例库进行故障特征检索,获得所述故障信息对应的相关案例;
故障处理模块,用于基于所述相关案例的解决方案,对所述故障信息进行故障清除处理,根据故障处理结果,更新所述案例库;
故障隔离模块,用于采集所述卫星地面站收发系统中具有所述故障信息的设备,对所述设备进行故障层次标定后进行故障隔离,其中,所述故障隔离用于表示对所述设备进行主备切换或复位;
故障案例生成与更新模块,用于基于故障隔离结果,遍历所述卫星地面站收发系统,确定故障位置,生成故障案例,将所述故障案例发送给系统管理员并更新所述案例库;
其中,所述故障处理模块还用于对所述相关案例进行去冗余处理,并根据案例相似度进行排序;通过使用复用成功率最高的解决方案来解决当前问题,如果能解决问题,则诊断结束,同时更新所述案例库,修改权重或者故障特征;如果不能解决问题,则继续采用下一个所述解决方案;如果所有解决方案都不能解决当前问题,则采集所述卫星地面站收发系统中具有所述故障信息的所述设备,对所述设备进行故障层次标定后进行故障隔离;基于所述故障隔离结果,遍历所述卫星地面站收发系统,确定所述故障位置,生成所述故障案例,将所述故障案例发送给所述系统管理员并更新所述案例库。
优选地,所述故障隔离模块用于对设备进行故障标定和故障隔离:
如果故障是设备级故障,则对故障设备进行故障隔离;
如果所述故障是链路级故障,则标记故障链路所有相关的所述故障设备,并按设备可靠性优先级排序,从可靠性最低的所述故障设备开始,执行故障隔离;
如果故障是系统级故障,则标记出所有相关的所述故障设备,按所述设备可靠性优先级进行排序,从可靠性最低的所述故障设备开始执行故障隔离。
本发明公开了以下技术效果:
本发明与现有技术相比,其显著优点是系统能自主快速进行隔离故障、恢复系统性能,同时也减轻后续专家问题排查的工作量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还根据这些附图获得其他的附图。
图1是发明实施例公开的一种故障诊断流程示意图;
图2是发明实施例公开的一种通信系统接收链路组成示意图;
图3是发明实施例公开的一种接收链路发生未知故障时的故障诊断流程。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1-3所示,本发明提供了一种具有自主学习能力的故障诊断方法,包括以下步骤,
采集卫星地面站收发系统的故障信息,基于案例库进行故障特征检索,获得故障信息对应的相关案例;
基于相关案例的解决方案,对故障信息进行故障清除处理,根据故障处理结果,更新案例库;
采集卫星地面站收发系统中具有故障信息的设备,对设备进行故障层次标定后进行故障隔离,其中,故障隔离用于表示对设备进行主备切换或复位;
基于故障隔离结果,遍历卫星地面站收发系统,确定故障位置,生成故障案例,将故障案例发送给系统管理员并更新案例库。
进一步地,在采集卫星地面站收发系统的故障信息的过程前,采集卫星地面站收发系统的状态信息,基于案例库的失效模式阈值,获得故障信息,其中,失效模式阈值用于表示故障发生时的状态参数。
进一步地,在基于案例库进行故障特征检索的过程中,如果没有检索到相关案例,则采集卫星地面站收发系统中具有故障信息的设备,对设备进行故障层次标定后进行故障隔离;
基于故障隔离结果,遍历卫星地面站收发系统,确定故障位置,生成故障案例,将故障案例发送给系统管理员并更新案例库。
进一步地,对相关案例进行去冗余处理,并根据案例相似度进行排序;
通过使用复用成功率最高的上述解决方案来解决当前问题,如果能解决问题,则诊断结束,同时更新案例库,修改权重或者故障特征;
如果不能解决问题,则继续采用下一个解决方案;
如果所有解决方案都不能解决当前问题,则采集卫星地面站收发系统中具有故障信息的设备,对设备进行故障层次标定后进行故障隔离;
基于故障隔离结果,遍历卫星地面站收发系统,确定故障位置,生成故障案例,将故障案例发送给系统管理员并更新案例库。
进一步地,在对设备进行故障层次标定后进行故障隔离的过程中,如果故障是设备级故障,则对故障设备进行故障隔离;
如果故障是链路级故障,则标记故障链路所有相关的故障设备,并按设备可靠性优先级排序,从可靠性最低的故障设备开始,执行故障隔离;
如果故障是系统级故障,则标记出所有相关的故障设备,按设备可靠性优先级进行排序,从可靠性最低的故障设备开始执行故障隔离。
进一步地,在生成故障案例的过程中,对于有硬件冗余的故障设备,优先下发主备切换指令;
对于无备份的故障设备,则下发复位指令。
进一步地,在对设备进行故障层次标定的过程中,若设备不响应指令,则标定失败;
若设备执行了指令且系统恢复正常,则诊断结束,确认故障位置,同时将该案例添加到案例库中;
若设备执行了指令但故障告警未解除,则该设备不是故障设备,继续对下一个设备进行故障隔离;若遍历完所有设备后,将诊断过程和结果以报告形式发送给系统管理员。
一种具有自主学习能力的故障诊断系统,包括,
故障信息采集模块,用于采集卫星地面站收发系统的故障信息,基于案例库进行故障特征检索,获得故障信息对应的相关案例;
故障处理模块,用于基于相关案例的解决方案,对故障信息进行故障清除处理,根据故障处理结果,更新案例库;
故障隔离模块,用于采集卫星地面站收发系统中具有故障信息的设备,对设备进行故障层次标定后进行故障隔离,其中,故障隔离用于表示对设备进行主备切换或复位;
故障案例生成与更新模块,用于基于故障隔离结果,遍历卫星地面站收发系统,确定故障位置,生成故障案例,将故障案例发送给系统管理员并更新案例库。
进一步地,故障处理模块用于对相关案例进行去冗余处理,并根据案例相似度进行排序;通过使用复用成功率最高的上述解决方案来解决当前问题,如果能解决问题,则诊断结束,同时更新案例库,修改权重或者故障特征;如果不能解决问题,则继续采用下一个解决方案;如果所有解决方案都不能解决当前问题,则采集卫星地面站收发系统中具有故障信息的设备,对设备进行故障层次标定后进行故障隔离;基于故障隔离结果,遍历卫星地面站收发系统,确定故障位置,生成故障案例,将故障案例发送给系统管理员并更新案例库。
进一步地,故障隔离模块用于对设备进行故障标定和故障隔离:
如果故障是设备级故障,则对故障设备进行故障隔离;
如果故障是链路级故障,则标记故障链路所有相关的故障设备,并按设备可靠性优先级排序,从可靠性最低的故障设备开始,执行故障隔离;
如果故障是系统级故障,则标记出所有相关的故障设备,按设备可靠性优先级进行排序,从可靠性最低的故障设备开始执行故障隔离。
实施例1:为更好理解本发明技术方案,下面先对本发明实施例提供的故障诊断方法所适用的设备进行简要描述。卫星地面站收发系统由信道设备(上下变频器,功率放大器,天线等),数字类设备(数字信号处理终端等),射频类设备(射频采样终端,射频发射终端)等组成,共同完成对卫星的信号的接收和发送。故障诊断系统的主要功能是对卫星地面站各个设备和全系统的运行状态进行监测,及时发现异常情况并进行故障诊断和修复,其所述功能由卫星地面站收发设备和部署在计算机上的系统管理软件共同完成。故障诊断系统的功能结构可划分为4个模块,包括状态采集模块,知识库,推理诊断模块和人机交互界面。
所述状态采集模块由部署在各个设备内的传感器和检测模块构成,实现对设备运行时的关键参数进行周期性读取,并将状态信息发送给推理诊断模块。所有状态监视信息被分为2大类:工况信息和业务信息。工况信息定义为设备的基本参数、状态;业务信息定义为设备,链路或全系统的业务运行状态。以卫星地面站收发系统为例,监视状态信息分类如表1所示。
表1
Figure 748272DEST_PATH_IMAGE001
所述推理诊断模块接收来自状态采集模块的状态信息,与知识库的案例进行匹配,如果符合知识库中的失效模式阈值,则产生告警信息,包括是否存在故障,故障类型,并采取相应的故障处置方案。若不匹配知识库中的案例或故障处置方案不能解除故障,则根据故障特征,标记出与故障相关的各个设备,然后通过系统重构或自主复位的方式来尝试性定位和解决问题。
所述知识库负责存储各类诊断案例,知识库可以通过推理诊断模块的输出结果或人机交互界面进行自动或手动编辑,包括增加、删除和修改。诊断案例的表示方法有多种,本文根据实际情况采用面向对象的故障案例表示方式:
诊断案例:<故障特征;故障点1,故障控制措施1,权重1;故障点2,故障控制措施2,权重2;…故障点n,故障控制措施n,权重n;>。
所述诊断案例中的故障点指故障发生的位置,一般到设备级。权重表示该故障控制措施实施后的成功概率,每一次成功解决问题,该故障控制措施的权重就增大一点,权值更新方法如下:
权值i=故障控制措施成功解决问题次数ni/Σni
所述诊断案例表明当系统发生某一故障时,可能定位到相关的故障点。举例说明,信号处理单元发生“授时状态异常”告警,其诊断案例表示为:
诊断案例:<“授时状态异常”;信号处理单元,设备切换,1;时间服务器,设备重启,0.5>。
所述人机交互界面实现故障诊断系统与用户之间的信息交换,通过人机交互界面,用户可以实时查看系统工作状态,进行下发指令,更新知识库等操作。
如图1所示,图1是本发明实施例提供的一种故障诊断系统处理流程示意图。步骤如下:
步骤1:从案例库中根据故障特征检索出所有相关的案例,检索算法可以采用当前常用的算法,包括权值最邻近法,基于知识的神经索引法,或者基于知识的引导法。如果能搜索到,就计算当前故障和候选案例故障特征的相关度,从中筛选出相似度高于阈值的案例并根据相似度从高到低进行排序,然后进入步骤2;如果不能搜索到相关案例,则进入步骤3;
步骤2:将所有筛选出来的相似案例的解决方案进行去冗余处理,并根据案例相似度的顺序进行排序,复用成功率最高的解决方案来解决当前问题,如果能解决问题,则诊断结束,同时更新案例库,修改权重或者故障特征;如果不能解决问题,则继续采用下一个解决方案;如果所有的解决方案都不能解决当前问题,则进入步骤3;
步骤3:根据故障特征,在全系统内搜索当前具有相同故障特征的数据,用于标定故障发生的层次(设备级,链路级还是系统级)。
如果是设备级故障,则对故障设备进行故障隔离;
如果是出/入链路级故障,则标记出/入故障链路所有相关的设备(剔除与正常链路共用的设备),并按设备可靠性优先级排序,从可靠性最低的设备开始,执行故障隔离;
如果是出/入站系统级故障,则标记出所有相关的设备,按设备可靠性优先级排序,从可靠性最低的设备开始执行故障隔离;
故障隔离是指由系统管理软件下发切换或复位指令给设备,对于有硬件冗余的设备,优先下发切换指令;对于无备份的设备,则下发复位指令。
步骤4:评价故障隔离操作结果:若设备不响应系统管理软件的指令,则标记该设备故障隔离失败;若设备执行了系统管理软件下发的指令且系统能恢复正常,则诊断结束,确认故障位置,同时将该案例添加到案例库中;若设备执行了系统管理软件下发的指令但系统未能恢复正常,则说明该设备不是故障设备,继续进行下一个设备的故障隔离;若遍历完所有设备后,仍不能解决问题,则将诊断过程和结果以报告形式发送给管理员。
举例说明当接收链路1的数字信号处理终端1发生“无入站信号”的异常状况时的故障诊断流程。如图2所示,卫星地面站有1条接收链路,单条接收链路由天线,分路器,主备2台射频采样终端,主备2台交换机,1台主份数字信号处理终端和1台备份数字信号处理终端组成。天线接收到入站信号后,通过分路器将信号分配到各个接收链路,主份射频采样终端对射频信号进行变频、滤波、采样等处理,把得到的基带数字信号发送给主交换机,备份射频采样终端也做相同处理,将基带数字信号发送给备份交换机,主备交换机将数据都发送给该接收链路下所有数字信号处理终端。
如图3所示,图3是本发明实施例提供的针对接收链路1的数字信号处理终端1发生“无入站信号”的异常状况时的处理流程示意图。
首先搜索该故障类型是否在规则库中有匹配的故障规则,若没有则进入基于案例的智能化诊断流程:先搜索案例库中是否有相似案例,若没有相似案例,则从数据库提取发生故障这一段时间内全系统所有数字信号处理终端的状态数据,确定发生“无入站信号”的异常状态是发生在设备级,链路级还是系统级。
若故障发生在设备级,则系统管理软件下发主备切换指令,选取当前正常工作的备份状态的数据信号处理终端替代发生故障的数字信号处理终端1,然后查看问题是否得到解决,若没有得到解决,则等待人工处理;若得到解决,则将该案例添加到案例库中。
若故障发生在链路级,先标记出与故障相关的所有设备,即,接收链路1上所有的设备,由于其它接收链路没有发生类似故障,因此剔除与其它接收链路共用的天线和交换机。然后对设备可靠性由低到高进行排序,由于2台数字信号处理终端作为一个整体并行工作,其可靠性高于冗余度较小的射频采集终端,因此可靠性排序为:射频采集终端<数字信号处理终端<一分二分路器,从射频采集终端开始进行故障排查。
首先对射频采集终端进行故障隔离:系统管理软件下发指令,重配接收链路1的所有数字信号处理终端的接收参数,使其可接收其它正常链路上的射频采集终端发送的数据,然后查看所有数字信号处理终端是否仍处于“无入站信号”的异常状态,若为否,说明故障在射频采集终端,诊断结束,并将该案例添加到案例库中;若为是,说明故障不在射频采集终端,则对数字信号处理终端进行故障排查。
接着对数字信号处理终端进行故障隔离:系统管理软件下发指令,将冗余链路上的正常工作的数字信号处理终端的接收参数配置为故障数字信号处理终端的接收参数,使其可接收链路1的射频采集终端发送的数据,然后查看重配后的数字信号处理终端是否发生“无入站信号”的故障,若否,说明故障在数字信号处理终端,诊断结束,将该案例添加到案例库中;若是,说明故障不在数字信号处理终端,则对一分二分路器进行故障排查。
最后对于一分二分路器作为单点无源设备,无法实施故障隔离操作,因此直接跳过。
如此即完成了链路级的基于案例的智能化故障诊断过程。
若故障发生在系统级,先标记出与故障相关的所有设备,即,所有接收链路上的设备。然后对设备可靠性由低到高进行排序,由于N台数字信号处理终端作为一个整体并行工作,其可靠性高于冗余度较小的射频采集终端,因此可靠性排序为:天线<交换机<射频采集终端<数字信号处理终端<分路器,从天线开始进行故障排查。
首先对天线进行故障排查,无法实施故障隔离操作,因此直接跳过。
接着对交换机进行故障排查,先重启备份交换机,待备份交换机完全启动后,然后再重启主份交换机,然后查看故障是否解除,若是,说明故障发生在交换机,诊断结束,将该案例添加到案例库中;若否,说明故障不在交换机,则对射频采集终端进行排查。
然后对射频采集终端进行故障排查,系统管理软件下发指令,将所有备份射频采集终端复位,待备份射频采集终端完成复位后,系统管理软件再下发指令,将所有主份射频采集终端复位。然后查看故障是否解除,若是,说明故障发生在射频采集终端,若否,说明故障不在射频采集终端,则对数字信号处理终端进行排查。
然后对数字处理终端进行故障排查,系统管理软件下发指令,将所有备份数字处理终端复位,待备份数字处理终端完成复位后,系统管理软件再下发指令,将所有主份数字处理终端复位。然后查看故障是否解除,若是,说明故障发生在数字处理终端,若否,说明故障不在数字处理终端,则对分路器进行排查。
最后对于一分二分路器作为单点无源设备,无法实施故障隔离操作,因此直接跳过。
如此即完成了系统级的基于案例的智能化故障诊断过程。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的相合或直接相合或通信连接可以是通过一些接口,装置或单元的间接相合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件未完成,该程序可以存储于计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上上述,本说明书内容不应理解为对本发明的限制。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (7)

1.一种具有自主学习能力的故障诊断方法,其特征在于,包括以下步骤,
采集卫星地面站收发系统的故障信息,基于案例库进行故障特征检索,获得所述故障信息对应的相关案例;
基于所述相关案例的解决方案,对所述故障信息进行故障清除处理,根据故障处理结果,更新所述案例库;
在基于所述案例库进行故障特征检索的过程中,如果没有检索到所述相关案例,则采集所述卫星地面站收发系统中具有所述故障信息的设备,对所述设备进行故障层次标定后进行故障隔离,其中,所述故障隔离用于表示对所述设备进行主备切换或复位;
基于故障隔离结果,遍历所述卫星地面站收发系统,确定故障位置,生成故障案例,将所述故障案例发送给系统管理员并更新所述案例库;
其中,还包括:对所述相关案例进行去冗余处理,并根据案例相似度进行排序;
通过使用复用成功率最高的解决方案来解决当前问题,如果能解决问题,则诊断结束,同时更新所述案例库,修改权重或者故障特征;
如果不能解决问题,则继续采用下一个所述解决方案;
如果所有解决方案都不能解决当前问题,则采集所述卫星地面站收发系统中具有所述故障信息的所述设备,对所述设备进行故障层次标定后进行故障隔离;
基于所述故障隔离结果,确定所述故障位置,生成所述故障案例,将所述故障案例发送给所述系统管理员并更新所述案例库。
2.根据权利要求1所述的一种具有自主学习能力的故障诊断方法,其特征在于,
在采集所述卫星地面站收发系统的所述故障信息的过程前,采集所述卫星地面站收发系统的状态信息,基于所述案例库的失效模式阈值,获得所述故障信息,其中,所述失效模式阈值用于表示故障发生时的状态参数。
3.根据权利要求1所述的一种具有自主学习能力的故障诊断方法,其特征在于,
在对所述设备进行故障层次标定后进行故障隔离的过程中,如果故障是设备级故障,则对故障设备进行故障隔离;
如果所述故障是链路级故障,则标记故障链路所有相关的所述故障设备,并按设备可靠性优先级排序,从可靠性最低的所述故障设备开始,执行故障隔离;
如果故障是系统级故障,则标记出所有相关的所述故障设备,按所述设备可靠性优先级进行排序,从可靠性最低的所述故障设备开始执行故障隔离。
4.根据权利要求3所述的一种具有自主学习能力的故障诊断方法,其特征在于,
在生成所述故障案例的过程中,对于有硬件冗余的所述故障设备,优先下发主备切换指令;
对于无备份的所述故障设备,则下发复位指令。
5.根据权利要求4所述的一种具有自主学习能力的故障诊断方法,其特征在于,
在对设备进行故障层次标定的过程中,若所述设备不响应指令,则标定失败;
若所述设备执行了所述指令且系统恢复正常,则诊断结束,确认所述故障位置,同时将该案例添加到所述案例库中;
若所述设备执行了所述指令但故障告警未解除,则该设备不是所述故障设备,继续对下一个所述设备进行故障隔离;若遍历完所有设备后,将诊断过程和结果以报告形式发送给所述系统管理员。
6.一种具有自主学习能力的故障诊断系统,其特征在于,包括,
故障信息采集模块,用于采集卫星地面站收发系统的故障信息,基于案例库进行故障特征检索,获得所述故障信息对应的相关案例;
故障处理模块,用于基于所述相关案例的解决方案,对所述故障信息进行故障清除处理,根据故障处理结果,更新所述案例库;
故障隔离模块,用于采集所述卫星地面站收发系统中具有所述故障信息的设备,对所述设备进行故障层次标定后进行故障隔离,其中,所述故障隔离用于表示对所述设备进行主备切换或复位;
故障案例生成与更新模块,用于基于故障隔离结果,遍历所述卫星地面站收发系统,确定故障位置,生成故障案例,将所述故障案例发送给系统管理员并更新所述案例库;
其中,所述故障处理模块还用于对所述相关案例进行去冗余处理,并根据案例相似度进行排序;通过使用复用成功率最高的解决方案来解决当前问题,如果能解决问题,则诊断结束,同时更新所述案例库,修改权重或者故障特征;如果不能解决问题,则继续采用下一个所述解决方案;如果所有解决方案都不能解决当前问题,则采集所述卫星地面站收发系统中具有所述故障信息的所述设备,对所述设备进行故障层次标定后进行故障隔离;基于所述故障隔离结果,遍历所述卫星地面站收发系统,确定所述故障位置,生成所述故障案例,将所述故障案例发送给所述系统管理员并更新所述案例库。
7.根据权利要求6所述的一种具有自主学习能力的故障诊断系统,其特征在于,
所述故障隔离模块用于对设备进行故障标定和故障隔离:
如果故障是设备级故障,则对故障设备进行故障隔离;
如果所述故障是链路级故障,则标记故障链路所有相关的所述故障设备,并按设备可靠性优先级排序,从可靠性最低的所述故障设备开始,执行故障隔离;
如果故障是系统级故障,则标记出所有相关的所述故障设备,按所述设备可靠性优先级进行排序,从可靠性最低的所述故障设备开始执行故障隔离。
CN202110878267.0A 2021-08-02 2021-08-02 一种具有自主学习能力的故障诊断方法和系统 Active CN113328898B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110878267.0A CN113328898B (zh) 2021-08-02 2021-08-02 一种具有自主学习能力的故障诊断方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110878267.0A CN113328898B (zh) 2021-08-02 2021-08-02 一种具有自主学习能力的故障诊断方法和系统

Publications (2)

Publication Number Publication Date
CN113328898A true CN113328898A (zh) 2021-08-31
CN113328898B CN113328898B (zh) 2021-11-09

Family

ID=77426616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110878267.0A Active CN113328898B (zh) 2021-08-02 2021-08-02 一种具有自主学习能力的故障诊断方法和系统

Country Status (1)

Country Link
CN (1) CN113328898B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113759876A (zh) * 2021-09-14 2021-12-07 西安交通大学 基于案例推理的风电机组故障诊断方法及系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005269238A (ja) * 2004-03-18 2005-09-29 Fujitsu Ltd ネットワーク障害推定方法及びネットワーク障害推定装置
CN101590918A (zh) * 2009-06-19 2009-12-02 上海微小卫星工程中心 卫星自主故障诊断方法及其诊断系统
CN101853291A (zh) * 2010-05-24 2010-10-06 合肥工业大学 基于数据流的车辆故障诊断方法
US20110046842A1 (en) * 2009-08-21 2011-02-24 Honeywell International Inc. Satellite enabled vehicle prognostic and diagnostic system
US20110119231A1 (en) * 2009-11-16 2011-05-19 Toyota Motor Engineering And Manufacturing North America Adaptive Information Processing Systems, Methods, and Media for Updating Product Documentation and Knowledge Base
US20140052841A1 (en) * 2012-08-16 2014-02-20 The Georgia Tech Research Corporation Computer program, method, and information processing apparatus for analyzing performance of computer system
CN106844194A (zh) * 2016-12-21 2017-06-13 北京航空航天大学 一种多层次软件故障诊断专家系统的构建方法
US20190056510A1 (en) * 2017-08-18 2019-02-21 Novatel Inc. System and method to provide an asil qualifier for gnss position and related values
CN109936479A (zh) * 2019-03-18 2019-06-25 浙江大学 基于差分检测的控制平面故障诊断系统及其实现方法
US20200067762A1 (en) * 2017-05-04 2020-02-27 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Report sending method, report receiving method, device and system
CN111541474A (zh) * 2020-04-21 2020-08-14 中国电子科技集团公司第五十四研究所 一种基于卫星移动通信系统地面信关站的健康管理系统
CN112215254A (zh) * 2020-09-03 2021-01-12 许继集团有限公司 一种基于改进案例推理的变电站故障诊断方法以及诊断装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005269238A (ja) * 2004-03-18 2005-09-29 Fujitsu Ltd ネットワーク障害推定方法及びネットワーク障害推定装置
CN101590918A (zh) * 2009-06-19 2009-12-02 上海微小卫星工程中心 卫星自主故障诊断方法及其诊断系统
US20110046842A1 (en) * 2009-08-21 2011-02-24 Honeywell International Inc. Satellite enabled vehicle prognostic and diagnostic system
US20110119231A1 (en) * 2009-11-16 2011-05-19 Toyota Motor Engineering And Manufacturing North America Adaptive Information Processing Systems, Methods, and Media for Updating Product Documentation and Knowledge Base
CN101853291A (zh) * 2010-05-24 2010-10-06 合肥工业大学 基于数据流的车辆故障诊断方法
US20140052841A1 (en) * 2012-08-16 2014-02-20 The Georgia Tech Research Corporation Computer program, method, and information processing apparatus for analyzing performance of computer system
CN106844194A (zh) * 2016-12-21 2017-06-13 北京航空航天大学 一种多层次软件故障诊断专家系统的构建方法
US20200067762A1 (en) * 2017-05-04 2020-02-27 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Report sending method, report receiving method, device and system
US20190056510A1 (en) * 2017-08-18 2019-02-21 Novatel Inc. System and method to provide an asil qualifier for gnss position and related values
CN109936479A (zh) * 2019-03-18 2019-06-25 浙江大学 基于差分检测的控制平面故障诊断系统及其实现方法
CN111541474A (zh) * 2020-04-21 2020-08-14 中国电子科技集团公司第五十四研究所 一种基于卫星移动通信系统地面信关站的健康管理系统
CN112215254A (zh) * 2020-09-03 2021-01-12 许继集团有限公司 一种基于改进案例推理的变电站故障诊断方法以及诊断装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LEI CHEN: "High Orbital Spacecraft Fast Positioning Algorithm Assisted by Inter-Satellite Links", 《IEEE》 *
刘文祥: "基于定位误差估计减少RAIM误警的方法", 《全球定位系统》 *
张可: "基于动态故障树的卫星电源系统可靠性分析", 《计算机与数字工程》 *
陈丹等: "基于CBR和FTA的地面站接收系统故障诊断方法", 《太赫兹科学与电子信息学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113759876A (zh) * 2021-09-14 2021-12-07 西安交通大学 基于案例推理的风电机组故障诊断方法及系统

Also Published As

Publication number Publication date
CN113328898B (zh) 2021-11-09

Similar Documents

Publication Publication Date Title
CN109787817B (zh) 网络故障诊断方法、装置和计算机可读存储介质
CN101945009B (zh) 基于案例和模式匹配的电力通信网故障定位方法及装置
CN110955550B (zh) 一种云平台故障定位方法、装置、设备及存储介质
CN101047738B (zh) 通信设备故障定位的方法和系统
CN112650200B (zh) 一种厂站设备故障的诊断方法及诊断装置
CN109669844A (zh) 设备故障处理方法、装置、设备和存储介质
CN111814999A (zh) 一种故障工单生成方法、装置、设备
CN111722952A (zh) 业务系统的故障分析方法、系统、设备和存储介质
CN108880706A (zh) 一种卫星信道链路故障的快速诊断方法
CN113328898B (zh) 一种具有自主学习能力的故障诊断方法和系统
CN111756560A (zh) 一种数据处理方法、装置及存储介质
CN112000502B (zh) 海量错误日志的处理方法、装置、电子装置及存储介质
CN112559237A (zh) 运维系统排障方法、装置、服务器和存储介质
CN113676343B (zh) 电力通信网故障源定位方法及装置
CN110609761B (zh) 确定故障源的方法、装置、存储介质和电子设备
CN109889258B (zh) 一种光网络故障校验方法和设备
CN109885978B (zh) 一种遥感地面站故障诊断系统及方法
CN116593883A (zh) 一种智能化高压开关的断路器本体故障诊断方法、装置、设备及存储介质
CN114297453B (zh) 告警预测方法、装置、电子设备及存储介质
CN107544392B (zh) 卫星在轨监测系统平台状态的图形化监控系统及方法
CN111324513B (zh) 一种人工智能开发平台的监控管理方法及系统
CN113065001A (zh) 一种故障止损方法及装置
CN117061332B (zh) 一种基于概率有向图深度学习的故障诊断方法与系统
Wang et al. LSTM-based alarm prediction in the mobile communication network
CN117971396A (zh) 一种风险确认方法和相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant