CN117294573A - 故障处理方法、装置和计算机可读存储介质 - Google Patents

故障处理方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN117294573A
CN117294573A CN202210717343.4A CN202210717343A CN117294573A CN 117294573 A CN117294573 A CN 117294573A CN 202210717343 A CN202210717343 A CN 202210717343A CN 117294573 A CN117294573 A CN 117294573A
Authority
CN
China
Prior art keywords
chip
fault
alarm
type
self
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210717343.4A
Other languages
English (en)
Inventor
司马雷雷
王珊
李春晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN202210717343.4A priority Critical patent/CN117294573A/zh
Priority to PCT/CN2023/100795 priority patent/WO2023241703A1/zh
Publication of CN117294573A publication Critical patent/CN117294573A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了故障处理方法、装置和计算机可读存储介质,获取芯片的告警类型,告警类型包括芯片的故障属于可自修复类型和芯片的故障属于不可自修复类型;当确定告警类型为芯片的故障属于不可自修复类型,检测芯片的历史的告警标志;在确定N次检测到芯片的历史的告警标志的情况下,执行预设的自修复流程,其中,N为大于等于1的整数;在执行自修复流程M次,确定芯片仍然处于异常状态的情况下,检测收发信机系统的整机复位条件,其中,M为大于等于1的整数;在收发信机系统达到整机复位条件的情况下,启动整机复位以修复芯片的故障。基于此,本申请能够提高收发信机芯片的运维效率。

Description

故障处理方法、装置和计算机可读存储介质
技术领域
本申请实施例涉及但不限于通信技术领域,特别是涉及一种故障处理方法、装置和计算机可读存储介质。
背景技术
现有通信设备的故障检测及自动处理方法,大多面向网管、基站这类系统设备,未针对AAU/RRU中的收发信机芯片的故障检测及故障修复提供解决方案,导致收发信机芯片的运维效率低下,其故障影响耗时长,维护人力成本高。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本申请实施例提供了一种故障处理方法、装置和计算机可读存储介质,能够提高收发信机芯片的运维效率,缩短故障影响耗时,节省维护人力成本。
第一方面,本申请实施例提供了一种故障处理方法,包括:
获取所述芯片的告警类型,所述告警类型包括所述芯片的故障属于可自修复类型和所述芯片的故障属于不可自修复类型;
当确定所述告警类型为所述芯片的故障属于不可自修复类型,检测所述芯片的历史的告警标志,在确定N次检测到所述芯片的历史的所述告警标志的情况下,执行预设的自修复流程,其中,所述N为大于等于1的整数;
在执行所述自修复流程M次,确定所述芯片仍然处于异常状态的情况下,检测所述收发信机系统的整机复位条件,其中,所述M为大于等于1的整数;
在所述收发信机系统达到所述整机复位条件的情况下,启动整机复位以修复所述芯片的故障。
第二方面,本申请实施例提供了一种基站,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面所述的故障处理方法。
第三方面,本申请实施例提供了一种故障处理装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面所述的故障处理方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序用于使计算机执行如上第一方面所述的故障处理方法。
本申请实施例包括:获取芯片的告警类型,告警类型包括芯片的故障属于可自修复类型和芯片的故障属于不可自修复类型;当确定告警类型为芯片的故障属于不可自修复类型,检测芯片的历史的告警标志;在确定N次检测到芯片的历史的告警标志的情况下,执行预设的自修复流程,其中,N为大于等于1的整数;在执行自修复流程M次,确定芯片仍然处于异常状态的情况下,检测收发信机系统的整机复位条件,其中,M为大于等于1的整数;在收发信机系统达到整机复位条件的情况下,启动整机复位以修复芯片的故障。基于此,本申请能够在尽量减小影响收发信机系统正常业务的条件下,智能化完成故障信息检测和故障恢复,为工程师分析故障提供有效信息。本申请具有兼顾故障信息准确性与故障恢复耗时短等优势,提高产品故障修复的及时性。本申请可帮助在收发信机系统使用中完成智能化运维,提高生产及维护效率,缩短故障影响耗时,节省维护人力成本。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本申请技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1是本申请一个实施例提供的一种故障处理方法的主流程图;
图2是本申请一个实施例提供的一种故障处理方法的一子流程图;
图3是本申请一个实施例提供的一种故障处理方法的另一子流程图;
图4是本申请一个实施例提供的一种故障处理方法的另一子流程图;
图5是本申请一个实施例提供的一种故障处理方法的另一子流程图;
图6是本申请一个实施例提供的一种故障处理方法的另一子流程图;
图7是本申请一个实施例提供的故障诊断及输出流程图;
图8是本申请一个实施例提供的基站结构示意图;
图9是本申请一个实施例提供的故障处理装置结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
应了解,在本申请实施例的描述中,多个(或多项)的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到“第一”、“第二”等只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
现有通信设备的故障检测及自动处理方法,大多面向网管、基站这类系统设备,未针对AAU/RRU中的收发信机芯片的故障检测及故障修复提供解决方案,导致收发信机芯片的运维效率低下,其故障影响耗时长,维护人力成本高。
针对上述技术问题,本申请实施例提供了一种故障处理方法、装置和计算机可读存储介质,通过获取芯片的告警类型,告警类型包括芯片的故障属于可自修复类型和芯片的故障属于不可自修复类型;当确定告警类型为芯片的故障属于不可自修复类型,检测芯片的历史的告警标志;在确定N次检测到芯片的历史的告警标志的情况下,执行预设的自修复流程,其中,N为大于等于1的整数;在执行自修复流程M次,确定芯片仍然处于异常状态的情况下,检测收发信机系统的整机复位条件,其中,M为大于等于1的整数;在收发信机系统达到整机复位条件的情况下,启动整机复位以修复芯片的故障。基于此,本申请能够在尽量减小影响收发信机系统正常业务的条件下,智能化完成故障信息检测和故障恢复,为工程师分析故障提供有效信息。本申请具有兼顾故障信息准确性与故障恢复耗时短等优势,提高产品故障修复的及时性。本申请可帮助在收发信机系统使用中完成智能化运维,提高生产及维护效率,缩短故障影响耗时,节省维护人力成本。
如图1所示,图1是本申请一个实施例提供的一种故障处理方法的流程图。故障处理方法包括但不限于如下步骤:
步骤S101,获取芯片的告警类型,告警类型包括芯片的故障属于可自修复类型和芯片的故障属于不可自修复类型;
步骤S102,当确定告警类型为芯片的故障属于不可自修复类型,检测芯片的历史的告警标志,在确定N次检测到芯片的历史的告警标志的情况下,执行预设的自修复流程,其中,N为大于等于1的整数;
步骤S103,在执行自修复流程M次,确定芯片仍然处于异常状态的情况下,检测收发信机系统的整机复位条件,其中,M为大于等于1的整数;
步骤S104,在收发信机系统达到整机复位条件的情况下,启动整机复位以修复芯片的故障。
在一示例性的实施例中,本方法可以适用于AAU(Active Antenna Unit,有源天线单元)或RRU(Remote Radio Unit,射频拉远单元)中收发信机芯片的故障处理。
在一示例性的实施例中,在芯片内部故障检测之前可以先进行故障预分析,具体地,首先分析收发信机系统中收发信机芯片及芯片内各模块的功能及其故障对系统各项指标及功能造成的影响。然后确定各芯片模块的工作状态信息获取方法及故障状态判断条件。再确定系统各项指标及功能的优先级,按照优先级由高到低的顺序处理后续各芯片模块的故障状态。
在一示例性的实施例中,收发信机芯片内部可以集成故障检测模块,故障检测模块按照故障分析中确定的优先级获取芯片各模块的告警状态并判断告警类型。其中,芯片的告警类型分为两类,一类为芯片可自修复类型告警,另一类为芯片不可自修复类型告警。
在一示例性的实施例中,当确定告警类型为芯片的故障属于可自修复类型,可以直接自修复芯片的故障。
在一示例性的实施例中,收发信机芯片内部还可以集成故障恢复模块,用于自动处理芯片可自修复类型的故障。若故障检测模块的告警属于芯片可自修复类型,则故障恢复模块自修复芯片故障。例如发射通道数字功率异常超过设定值触发告警,则故障自修复模块将发射功率衰减到异常设定值1,保护发射射频器件,并通过寄存器锁存告警指示标志,但不通过硬件IO向外部系统指示告警标志。当故障恢复模块从故障检测模块获取到此告警消失,则故障自修复模块将将发射功率恢复到正常设定值2,恢复发射功率。
在一示例性的实施例中,收发信机芯片内部的故障恢复模块从故障检测模块获取告警类型,若告警属于芯片不可自修复类型,例如时钟类、电源类、接口类告警,则芯片保存关键工作状态信息到黑盒子模块,包括芯片软硬件版本号、时钟、电源状态、SERDES及JESD204接口状态、校准算法及初始化校准状态。并通过硬件IO接口向系统指示告警标志。
在一示例性的实施例中,故障检测模块通过硬件IO接口检测收发机系统中所有芯片的告警标志。当检测到某个芯片存在历史告警标志,首先通过指令读取此芯片的黑盒子模块信息并保存到整机ROM内;此流程防止芯片的故障关键信息被告警清除及异常恢复操作改写,为工程师分析故障提供较准确的信息。然后系统清除芯片历史告警标志,告警检测模块再次获取各芯片模块是否存在历史告警标志,重复N次(N为整数且大于等于1),此步骤是为了确认芯片告警是否已恢复正常。若N次获取到器件存在历史告警,则判断器件当前保持在异常状态,进入异常故障恢复流程。需要说明的是,检测到芯片的历史的告警标志次数大于1,目的是为了应对概率性系统没有真正清除芯片的历史的告警标志而导致误检测,设计多次连续检测可以排除误检测的风险。
在一示例性的实施例中,判断故障恢复流程的执行次数,若小于M次(M为整数且大于等于1),则执行预先设计的系统自动恢复流程,并保存完整的操作及日志log信息到整机ROM中。需要说明的是,故障恢复流程执行次数大于等于1,目的是应对概率性恢复的芯片故障,设计多次恢复流程可增加芯片恢复正常的成功率。
在一示例性的实施例中,故障恢复流程的设计原则,首先以不影响整机其他正常芯片模块的工作状态或尽量减少受影响的正常芯片模块的数量为第一优先级,第二优先级为减少故障恢复流程的耗时及系统资源消耗。例,某片收发信机芯片的JESD204接口通信异常,则再次发起针对此芯片所使用的JESD204链路的建链流程;例,某片收发信机芯片的锁相环锁定状态异常,则再次发起针对此芯片的复位及初始化流程,重新配置参考时钟及锁相环模块。
在一示例性的实施例中,若故障恢复流程的执行次数等于M次,则判定此故障模块无法通过预先设计的故障自动恢复流程恢复到正常工作状态。然后判断收发信机是否满足整机复位条件,整机复位条件可设定为根据统计数据业务量少的时间段或由网管下发的收发信机休眠操作。若满足整机复位条件,则进入整机复位状态,尝试重启整机恢复故障,需要指出的是,在满足整机复位条件之后,还可以进入系统故障诊断及上报流程。若没有达到整机复位条件,则整机保持故障状态,等待整机复位条件满足,基于此,能够在尽量减小影响收发信机系统正常业务的条件下,智能化完成故障信息检测和故障恢复。
在一示例性的实施例中,可以将收发信机系统故障分为下行链路故障、上行链路故障、校准链路故障、电源故障、时钟故障等多个分支。获取故障检测流程中各模块的故障信息,判断当前故障属于收发信机系统的具体功能分支,再进入对应的故障诊断流程。故障检测流程中获取的各模块故障信息是各芯片模块独立上报的故障,不能直接输出系统故障原因,还需要进一步综合分析。并且按照分支独立设计诊断流程可简化诊断流程分析复杂系统故障原因的复杂度,并可以在不增加诊断耗时的前提下将各分支的诊断流程设计的更详尽完备,提升诊断模块的效率及准确性。任一故障分支的故障诊断流程均保存完整的操作及日志log信息到整机ROM中,为工程师分析故障提供全面准确的故障信息。故障诊断流程完成后根据判断的收发信机系统功能分支输出故障诊断报告,包含故障分支、故障芯片ID、故障初步诊断原因,再上报收发信机系统故障诊断结果到网管。最终进入整机复位状态,尝试重启整机恢复故障。
综上所述,通过获取芯片的告警类型,告警类型包括芯片的故障属于可自修复类型和芯片的故障属于不可自修复类型;当确定告警类型为芯片的故障属于可自修复类型,自修复芯片的故障;当确定告警类型为芯片的故障属于不可自修复类型,检测芯片的历史的告警标志;在确定N次检测到芯片的历史的告警标志的情况下,执行预设的自修复流程,其中,N为大于等于1的整数;在执行自修复流程M次,确定芯片仍然处于异常状态的情况下,检测收发信机系统的整机复位条件,其中,M为大于等于1的整数;在收发信机系统达到整机复位条件的情况下,启动整机复位以修复芯片的故障。基于此,本申请能够在尽量减小影响收发信机系统正常业务的条件下,智能化完成故障信息检测和故障恢复,为工程师分析故障提供有效信息。本申请具有兼顾故障信息准确性与故障恢复耗时短等优势,提高产品故障修复的及时性。本申请可帮助在收发信机系统使用中完成智能化运维,提高生产及维护效率,缩短故障影响耗时,节省维护人力成本。
如图2所示,步骤S101可以包括但不限于如下子步骤:
步骤S201,获取芯片的告警状态;
步骤S202,根据告警状态判断芯片的告警类型。
在一示例性的实施例中,通过获取芯片的告警状态来判断告警类型。其中,芯片的告警类型分为两类,一类为芯片可自修复类型告警,另一类为芯片不可自修复类型告警。
如图3所示,在子步骤S202之后还可以包括但不限于如下子步骤:
步骤S301,根据芯片的告警类型确定告警标志,告警标志包括第一告警标志和第二告警标志,第一告警标志用于指示芯片的故障属于可自修复类型,第二告警标志用于指示芯片的故障属于不可自修复类型;
步骤S302,当确定告警标志为第一告警标志,芯片自修复芯片的故障;
步骤S303,当确定告警标志为第二告警标志,保存芯片的工作状态信息,芯片向收发信机系统发送第二告警标志。
在一示例性的实施例中,对于芯片的告警类型可以采用告警标志进行标识。例如,告警标志可以包括第一告警标志和第二告警标志,第一告警标志用于指示芯片的故障属于可自修复类型,第二告警标志用于指示芯片的故障属于不可自修复类型。当确定告警标志为第一告警标志,即表示该告警属于芯片可自修复类型,芯片内部集成的故障恢复模块可以自动恢复芯片的故障。当确定告警标志为第二告警标志,即表示该告警属于芯片不可自修复类型,例如时钟类、电源类、接口类告警,则芯片保存关键工作状态信息到黑盒子模块,包括芯片软硬件版本号、时钟、电源状态、SERDES及JESD204接口状态、校准算法及初始化校准状态。并通过硬件IO接口向系统指示告警标志。
如图4所示,步骤S302可以包括但不限于如下子步骤:
步骤S401,当确定芯片的发射功率超过预设阈值,将发射功率衰减到第一设定值,锁存第一告警标志;
步骤S402,当确定第一告警标志消失,将发射功率恢复到第二设定值,以恢复发射功率。
在一示例性的实施例中,以发射芯片为例,发射功率异常超过设定值触发告警,则故障自修复模块将发射功率衰减到异常设定值1,保护发射射频器件,并通过寄存器锁存告警指示标志,但不通过硬件IO向外部系统指示告警标志。当故障恢复模块从故障检测模块获取到此告警消失,则故障自修复模块将发射功率恢复到正常设定值2,恢复发射功率。
如图5所示,在收发信机系统达到整机复位条件的情况下之后还可以包括但不限于如下子步骤:
步骤S501,保存芯片的黑匣子信息;
步骤S502,清除芯片的历史的告警标志,重新检测芯片是否存在历史的告警标志。
在一示例性的实施例中,当检测到某个芯片存在历史告警标志,首先通过指令读取此芯片的黑盒子模块信息并保存到整机ROM内;此流程防止芯片的故障关键信息被告警清除及异常恢复操作改写,为工程师分析故障提供较准确的信息。然后系统清除芯片历史告警标志,告警检测模块再次获取各芯片模块是否存在历史告警标志,重复N次(N为整数且大于等于1),此步骤是为了确认芯片告警是否已恢复正常。若N次获取到器件存在历史告警,则判断器件当前保持在异常状态,进入异故障恢复流程。
如图6所示,在步骤S105之后还可以包括但不限于如下步骤:
步骤S601,获取收发信机系统的故障信息;
步骤S602,根据故障信息判断故障类型;
步骤S603,根据故障类型执行对应的故障诊断流程;
步骤S604,在执行故障诊断流程过程中保存故障诊断日志;
步骤S605,根据故障诊断流程输出故障诊断报告。
在一示例性的实施例中,如图7所示,对故障芯片模块进行故障自动诊断,可以将收发信机系统故障分为下行链路故障、上行链路故障、校准链路故障、电源故障、时钟故障等多个分支。获取故障检测流程中各模块的故障信息,判断当前故障属于收发信机系统的具体功能分支,再进入对应的故障诊断流程。故障检测流程中获取的各模块故障信息是各芯片模块独立上报的故障,不能直接输出系统故障原因,还需要进一步综合分析。并且按照分支独立设计诊断流程可简化诊断流程分析复杂系统故障原因的复杂度,并可以在不增加诊断耗时的前提下将各分支的诊断流程设计的更详尽完备,提升诊断模块的效率及准确性。任一故障分支的故障诊断流程均保存完整的操作及日志log信息到整机ROM中,为工程师分析故障提供全面准确的故障信息。故障诊断流程完成后根据判断的收发信机系统功能分支输出故障诊断报告,包含故障分支、故障芯片ID、故障初步诊断原因,再上报收发信机系统故障诊断结果到网管。最终进入整机复位状态,尝试重启整机恢复故障。
综上所述,本申请可以应用在AAU/RRU系统正常启动运行时的收发信芯片及收发信链路故障的自动检测、处理与诊断。并且,本申请可在尽量减小影响收发信机系统正常业务的条件下,智能化完成故障信息检测、故障恢复及故障诊断及上报,同时保证各芯片模块的关键故障信息不改写、不丢失,为工程师分析故障提供有效信息。兼顾故障信息准确性与故障恢复耗时短等优势,提高产品故障诊断上报的及时性。可帮助在收发信机系统使用中完成智能化运维,提高生产及维护效率,缩短故障影响耗时,节省维护人力成本。
如图8所示,本申请实施例还提供了一种基站。
具体地,该故障处理装置包括:一个或多个处理器和存储器,图8中以一个处理器及存储器为例。处理器和存储器可以通过总线或者其他方式连接,图8中以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序,如上述本申请实施例中的故障处理方法。处理器通过运行存储在存储器中的非暂态软件程序以及程序,从而实现上述本申请实施例中的故障处理方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储执行上述本申请实施例中的故障处理方法所需的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该故障处理装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实现上述本申请实施例中的故障处理方法所需的非暂态软件程序以及程序存储在存储器中,当被一个或者多个处理器执行时,执行上述本申请实施例中的故障处理方法,例如,执行以上描述的图1中的方法步骤S101至步骤S104,图2中的方法步骤S201至步骤S202,图3中的方法步骤S301至步骤S303,图4中的方法步骤S401至步骤S402,图5中的方法步骤S501至步骤S502,图6中的方法步骤S601至步骤S605,通过获取芯片的告警类型,告警类型包括芯片的故障属于可自修复类型和芯片的故障属于不可自修复类型;当确定告警类型为芯片的故障属于不可自修复类型,检测芯片的历史的告警标志;在确定N次检测到芯片的历史的告警标志的情况下,执行预设的自修复流程,其中,N为大于等于1的整数;在执行自修复流程M次,确定芯片仍然处于异常状态的情况下,检测收发信机系统的整机复位条件,其中,M为大于等于1的整数;在收发信机系统达到整机复位条件的情况下,启动整机复位以修复芯片的故障。基于此,本申请能够在尽量减小影响收发信机系统正常业务的条件下,智能化完成故障信息检测和故障恢复,为工程师分析故障提供有效信息。本申请具有兼顾故障信息准确性与故障恢复耗时短等优势,提高产品故障修复的及时性。本申请可帮助在收发信机系统使用中完成智能化运维,提高生产及维护效率,缩短故障影响耗时,节省维护人力成本。
如图9所示,本申请实施例还提供了一种故障处理装置。
具体地,该故障处理装置包括:一个或多个处理器和存储器,图9中以一个处理器及存储器为例。处理器和存储器可以通过总线或者其他方式连接,图9中以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序,如上述本申请实施例中的故障处理方法。处理器通过运行存储在存储器中的非暂态软件程序以及程序,从而实现上述本申请实施例中的故障处理方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储执行上述本申请实施例中的故障处理方法所需的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该故障处理装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实现上述本申请实施例中的故障处理方法所需的非暂态软件程序以及程序存储在存储器中,当被一个或者多个处理器执行时,执行上述本申请实施例中的故障处理方法,例如,执行以上描述的图1中的方法步骤S101至步骤S104,图2中的方法步骤S201至步骤S202,图3中的方法步骤S301至步骤S303,图4中的方法步骤S401至步骤S402,图5中的方法步骤S501至步骤S502,图6中的方法步骤S601至步骤S605,通过获取芯片的告警类型,告警类型包括芯片的故障属于可自修复类型和芯片的故障属于不可自修复类型;当确定告警类型为芯片的故障属于不可自修复类型,检测芯片的历史的告警标志;在确定N次检测到芯片的历史的告警标志的情况下,执行预设的自修复流程,其中,N为大于等于1的整数;在执行自修复流程M次,确定芯片仍然处于异常状态的情况下,检测收发信机系统的整机复位条件,其中,M为大于等于1的整数;在收发信机系统达到整机复位条件的情况下,启动整机复位以修复芯片的故障。基于此,本申请能够在尽量减小影响收发信机系统正常业务的条件下,智能化完成故障信息检测和故障恢复,为工程师分析故障提供有效信息。本申请具有兼顾故障信息准确性与故障恢复耗时短等优势,提高产品故障修复的及时性。本申请可帮助在收发信机系统使用中完成智能化运维,提高生产及维护效率,缩短故障影响耗时,节省维护人力成本。
此外,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行程序,该计算机可执行程序被一个或多个控制处理器执行,例如,被图9中的一个处理器执行,可使得上述一个或多个处理器执行上述本申请实施例中的故障处理方法,例如,执行以上描述的图1中的方法步骤S101至步骤S104,图2中的方法步骤S201至步骤S202,图3中的方法步骤S301至步骤S303,图4中的方法步骤S401至步骤S402,图5中的方法步骤S501至步骤S502,图6中的方法步骤S601至步骤S605,通过获取芯片的告警类型,告警类型包括芯片的故障属于可自修复类型和芯片的故障属于不可自修复类型;当确定告警类型为芯片的故障属于不可自修复类型,检测芯片的历史的告警标志;在确定N次检测到芯片的历史的告警标志的情况下,执行预设的自修复流程,其中,N为大于等于1的整数;在执行自修复流程M次,确定芯片仍然处于异常状态的情况下,检测收发信机系统的整机复位条件,其中,M为大于等于1的整数;在收发信机系统达到整机复位条件的情况下,启动整机复位以修复芯片的故障。基于此,本申请能够在尽量减小影响收发信机系统正常业务的条件下,智能化完成故障信息检测和故障恢复,为工程师分析故障提供有效信息。本申请具有兼顾故障信息准确性与故障恢复耗时短等优势,提高产品故障修复的及时性。本申请可帮助在收发信机系统使用中完成智能化运维,提高生产及维护效率,缩短故障影响耗时,节省维护人力成本。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读程序、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读程序、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本申请的较佳实施进行了具体说明,但本申请并不局限于上述实施方式,熟悉本领域的技术人员在不违背本申请精神的共享条件下还可作出种种等同的变形或替换,这些等同的变形或替换均包括在本申请权利要求所限定的范围内。

Claims (11)

1.一种故障处理方法,应用于收发信机系统,所述收发信机系统包括有芯片,所述方法包括:
获取所述芯片的告警类型,所述告警类型包括所述芯片的故障属于可自修复类型和所述芯片的故障属于不可自修复类型;
当确定所述告警类型为所述芯片的故障属于不可自修复类型,检测所述芯片的历史的告警标志,在确定N次检测到所述芯片的历史的所述告警标志的情况下,执行预设的自修复流程,其中,所述N为大于等于1的整数;
在执行所述自修复流程M次,确定所述芯片仍然处于异常状态的情况下,检测所述收发信机系统的整机复位条件,其中,所述M为大于等于1的整数;
在所述收发信机系统达到所述整机复位条件的情况下,启动整机复位以修复所述芯片的故障。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当确定所述告警类型为所述芯片的故障属于可自修复类型,自修复所述芯片的故障。
3.根据权利要求1所述的方法,其特征在于,所述获取所述芯片的告警类型,包括:
获取所述芯片的告警状态;
根据所述告警状态判断所述芯片的告警类型。
4.根据权利要求3所述的方法,其特征在于,在所述根据所述告警状态判断所述芯片的告警类型之后,还包括:
根据所述芯片的告警类型确定所述告警标志,所述告警标志包括第一告警标志和第二告警标志,所述第一告警标志用于指示所述芯片的故障属于可自修复类型,所述第二告警标志用于指示所述芯片的故障属于不可自修复类型;
当确定所述告警标志为所述第一告警标志,所述芯片自修复所述芯片的故障;
当确定所述告警标志为所述第二告警标志,保存所述芯片的工作状态信息,所述芯片向所述收发信机系统发送所述第二告警标志。
5.根据权利要求4所述的方法,其特征在于,所述芯片自修复所述芯片的故障,包括:
当确定所述芯片的发射功率超过预设阈值,将所述发射功率衰减到第一设定值,锁存所述第一告警标志;
当确定所述第一告警标志消失,将所述发射功率恢复到第二设定值,以恢复所述发射功率。
6.根据权利要求1所述的方法,其特征在于,在所述检测芯片的历史的告警标志之后,还包括:
保存所述芯片的黑匣子信息;
清除所述芯片的历史的所述告警标志,重新检测所述芯片是否存在历史的所述告警标志。
7.根据权利要求1所述的方法,其特征在于,所述收发信机系统达到所述整机复位条件的情况包括:
所述收发信机系统处于低业务量的工作状态下;或者,
所述收发信机系统接收到休眠操作指令。
8.根据权利要求1所述的方法,其特征在于,在所述收发信机系统达到所述整机复位条件的情况下之后,还包括:
获取所述收发信机系统的故障信息;
根据所述故障信息判断故障类型;
根据所述故障类型执行对应的故障诊断流程;
在执行所述故障诊断流程过程中保存故障诊断日志;
根据所述故障诊断流程输出故障诊断报告。
9.一种基站,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8中任意一项所述的故障处理方法。
10.一种故障处理装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8中任意一项所述的故障处理方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序用于使计算机执行如权利要求1至8任意一项所述的故障处理方法。
CN202210717343.4A 2022-06-17 2022-06-17 故障处理方法、装置和计算机可读存储介质 Pending CN117294573A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210717343.4A CN117294573A (zh) 2022-06-17 2022-06-17 故障处理方法、装置和计算机可读存储介质
PCT/CN2023/100795 WO2023241703A1 (zh) 2022-06-17 2023-06-16 故障处理方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210717343.4A CN117294573A (zh) 2022-06-17 2022-06-17 故障处理方法、装置和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN117294573A true CN117294573A (zh) 2023-12-26

Family

ID=89192352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210717343.4A Pending CN117294573A (zh) 2022-06-17 2022-06-17 故障处理方法、装置和计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN117294573A (zh)
WO (1) WO2023241703A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117472639B (zh) * 2023-12-27 2024-03-12 中诚华隆计算机技术有限公司 一种多芯片互连系统及方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5319387B2 (ja) * 2009-05-13 2013-10-16 ルネサスエレクトロニクス株式会社 半導体チップの救済設計方法
CN106375111A (zh) * 2016-08-25 2017-02-01 珠海迈科智能科技股份有限公司 一种智能网关的网络故障自动修复方法和系统
CN106571881A (zh) * 2016-11-10 2017-04-19 上海华为技术有限公司 一种射频发射通道故障管理方法及射频模块
CN112256507B (zh) * 2020-10-22 2023-10-27 地平线(上海)人工智能技术有限公司 芯片故障诊断方法、装置、可读存储介质及电子设备
CN113608908B (zh) * 2021-07-28 2023-12-22 烽火超微信息科技有限公司 服务器故障处理方法、系统、设备及可读存储介质
CN113724437B (zh) * 2021-08-30 2022-08-19 四川虹美智能科技有限公司 面向无人售卖柜的无人值守告警方法及系统

Also Published As

Publication number Publication date
WO2023241703A1 (zh) 2023-12-21

Similar Documents

Publication Publication Date Title
CN110380907B (zh) 一种网络故障诊断方法、装置、网络设备及存储介质
RU2535630C2 (ru) Способ и устройство для сбора данных мобильной связи
CN113115351B (zh) 一种网络异常的处理方法、处理装置、终端设备及介质
US7933211B2 (en) Method and system for providing prioritized failure announcements
WO2023241703A1 (zh) 故障处理方法、装置和计算机可读存储介质
US20230281071A1 (en) Using User Equipment Data Clusters and Spatial Temporal Graphs of Abnormalities for Root Cause Analysis
CN111436067A (zh) 小区连接失败的处理方法、终端设备和网络侧设备
CN104104542B (zh) 一种基于rs485的实时智能排障方法
CN101951622A (zh) 一种射频拉远单元断电告警处理方法和系统
US10862738B2 (en) System and method for alarm correlation and root cause determination
EP4206839A1 (en) Method for managing ecu on vehicle, and ecu and readable storage medium
CN101924661B (zh) 告警的处理方法及装置
US20230087446A1 (en) Network monitoring method, electronic device and storage medium
CN112134728B (zh) 定位失联原因的方法、装置、电子设备及存储介质
CN101854263A (zh) 网络拓扑的分析处理方法、系统和管理服务器
CN112367395A (zh) 一种报警阈值的修改方法、设备及计算机可读存储介质
CN101166334A (zh) 无线通信系统远端射频单元的信息记录的实现方法
CN111800810A (zh) 智能设备及其wcn模块异常恢复的系统和方法
CN115150007B (zh) 一种数字钥匙系统监测方法、装置、设备及存储介质
US20210226853A1 (en) Automated network monitoring and control
CN112684476B (zh) 导航接收机信号通道虚警率降低方法及星载导航接收机
CN112689280B (zh) 监测终端切换基站的方法以及接入和移动性管理功能
WO2016188500A1 (zh) 一种业务割接的方法、装置及设备
CN118283648A (zh) 一种故障小区自治愈策略优化方法及装置
CN112751688A (zh) 一种otn设备的流控处理方法、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication