CN105450469A - 一种工业设备中快速通信总线故障检测方法 - Google Patents
一种工业设备中快速通信总线故障检测方法 Download PDFInfo
- Publication number
- CN105450469A CN105450469A CN201510865965.1A CN201510865965A CN105450469A CN 105450469 A CN105450469 A CN 105450469A CN 201510865965 A CN201510865965 A CN 201510865965A CN 105450469 A CN105450469 A CN 105450469A
- Authority
- CN
- China
- Prior art keywords
- message
- subdomain
- industrial equipment
- link
- crc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
Landscapes
- Engineering & Computer Science (AREA)
- Environmental & Geological Engineering (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Maintenance And Management Of Digital Transmission (AREA)
Abstract
本发明涉及一种工业设备中快速通信总线故障检测方法,该方法为:在通信报文中增加用户故障检测协议域,所述用户故障检测协议域包括用于实现链路初始状态分析和链路状态实时检测功能的活动报文子域;发送方每个发送周期自动更新活动报文子域,接收方接收报文,并检测活动报文子域,判断报文活动子域是否满足更新要求,若不满足,则认为通信链路故障。本发明的方法即使在发送方状态机跑死或者发送任务中断而通信物理链路未断开的情况下也能及时发现故障,解决了目前快速通信总线均依靠数据链路层的故障检测机制实现故障的诊断和处理,不够灵活,且依赖于硬件本身的缺陷,提高了通信数据的可靠性。
Description
技术领域
本发明涉及一种工业设备中快速通信总线故障检测方法。
背景技术
在高压直流输电控制保护系统及其他对通信数据有高可靠性要求的工业领域中,在要求数据尽可能快速传输的情况下,更对数据的正确性和可靠性有苛刻的要求,需要完善的故障检测与处理机制。已有的常规快速通信总线只有数据链路层的故障检测机制,基于硬件本身的故障检测功能,这种方法在断开通信介质情况下能准确的检测到通信链路的故障,但在发送方状态机跑死或者发送任务中断而通信物理链路未断开的情况下就不能及时发现故障了;其次,在特殊状态下,链路通信会出现短时间内频繁的故障与恢复,常规快速通信故障检测机制会在此期间频繁的指示链路状态正确与故障,而这显然会增加系统的不稳定性;再次,常规通信检测机制仅考虑了通信过程中的CRC校验,未考虑数据在CPU和通信子板之间传输时这一环节的CRC校验;还有就是在要求数据高可能性传输环境下,系统要求接收方必须接收到发送方发送的每一包数据并对此进行确认,必要时甚至需要重传。而常规的快速通信总线是不满足此要求的。
发明内容
本发明提供了一种工业设备中快速通信总线故障检测方法,以解决现有的数据链路层的故障检测机制在发送方状态机跑死或者发送任务中断而通信物理链路未断开的情况下就不能及时发现故障的问题。
为解决上述技术问题,本发明的工业设备中快速通信总线故障检测方法包括:在通信报文中增加用户故障检测协议域,所述用户故障检测协议域包括用于实现链路初始状态分析和链路状态实时检测功能的活动报文子域;发送方每个发送周期自动更新活动报文子域,接收方接收报文,并检测活动报文子域,判断报文活动子域是否满足更新要求,若不满足,则认为通信链路故障。
配置故障恢复防抖时间参数,当判断报文未更新,而物理链路状态指示正确时,启动故障恢复防抖计时器,当故障恢复防抖时间到时,接收到的报文仍未更新,认为通信链路故障。
所述用户故障检测协议域还包括报文CRC自校验子域,根据报文CRC自校验子域确认用户是否使用报文CRC自校验机制。
所述报文CRC自校验机制为:发送发计算发送数据的CRC值,同报文一起发送给接收方,接收方对接收到的报文数据进行CRC计算,与接收到的CRC值进行比较,统计CRC值不一致的次数,当次数超过设定阈值,判断链路故障。
所述发送发能够进行数据接收,所述接收方能够进行数据发送。
所述用户故障检测协议域还包括报文握手子域和报文确认子域,根据报文握手子域确认用户是否使用报文握手与确认机制。
所述报文握手与确认机制为:发送发只有接收到接收方的确认接收标记后才发送新的报文,否则,发送方进行报文重发。
所述用户故障检测协议域还包括报文信息子域,所述报文信息子域包括报文发送周期、报文长度及报文状态信息。
所述故障防抖时间默认为1个接受任务执行周期。
本发明的有益效果是:本发明在用户故障检测协议域(以下简称XHUEC域),该XHUEC域包括报文活动子域,在每个发送周期更新报文活动子域,接收方通过检测报文活动子域是否更新判断链路是否故障,该检测方法即使在发送方状态机跑死或者发送任务中断而通信物理链路未断开的情况下也能及时发现故障,解决了目前快速通信总线均依靠数据链路层的故障检测机制实现故障的诊断和处理,不够灵活,且依赖于硬件本身的缺陷,提高了通信数据的可靠性。
本发明配置故障告警和故障恢复防抖时间参数,在报文未更新且物理通信链路正常情况下,启动故障恢复防抖计时器,判断在故障恢复防抖时间是否有接收到更新报文,若一致未接收,则判断链路故障,否则认为故障恢复,避免链路通信会出现短时间内频繁的故障与恢复,提高了系统的稳定性。
本发明在XHUEC域中增加报文握手子域和报文确认子域,能够使用户配置使用报文握手与确认机制,由于该机制要求发送发只有接收到接收方的确认接收标记后才发送新的报文,否则,发送方进行报文重发,从而使本发明方法能够工作在要求数据高可能性传输环境。
本发明在XHUEC域中增加报文CRC自校验子域,能够使用户配置使用报文CRC自校验机制,通过使用CRC故障计数器的方法判断链路CRC单次故障和频繁故障,提高了系统的稳定性。
本发明的方法低成本,易实现、灵活、故障检测和处理功能完善,既能满足快速通信总线故障检测快速的要求,又具备稳定和抗干扰能力强的特点。目前已在国内高压直流输电国产化新平台HCM3000中得到很好的应用。
附图说明
图1为本实施例增加XHUEC域的快速总线用户报文结构图;
图2为本实施例接收报文故障检测与防抖功能流程图;
图3为本实施例报文握手与报文确认机制流程图;
图4为本实施例CRC故障处理机制流程图。
具体实施方式
下面结合附图,对本发明的技术方案作进一步详细说明。
本实施例的工业设备中快速通信总线故障检测方法为在通信报文中增加用户故障检测协议域,所述用户故障检测协议域包括用于实现链路初始状态分析和链路状态实时检测功能的活动报文子域;发送方每个发送周期自动更新活动报文子域,接收方接收报文,并检测活动报文子域,判断报文活动子域是否满足更新要求,若不满足,则认为通信链路故障。
进一步,用户可通过编程接口配置故障告警和故障恢复防抖时间参数。在故障告警防抖时间到后,如果仍未接收到活动报文,则进行链路故障告警,置位链路故障指示位;如果链路故障告警存在,同时在故障恢复防抖时间内持续接收到活动报文,即链路故障恢复,则在故障恢复防抖时间后解除链路故障告警并清零故障指示位。
不配置任何防抖时间参数则默认防抖周期为1个接收任务执行周期。
将上述报文活动子域与故障恢复防抖机制结合的具体检测过程为:接收方对接收到的XHUEC域中的活动报文子域进行检测,如果活动报文子域数值不在规定的范围内,则认为发送方未与接收方建立有效连接或发送方从未发送过有效数据,此时属于链路初始化状态故障。如果活动报文子域数值正常则转入图2所示流程进行处理,方法如下:
1)如果活动报文更新,且链路状态指示正确,则转入报文送出流程。
2)如果活动报文不更新,而此时链路指示正确,则启动故障告警防抖计数器,时间到时则认为链路真正故障,置位链路故障指示位。在计时期间如果出现1次活动报文更新的情况,则复位计数器初始值进行重新计时。为保证链路故障告警的快速性,此故障告警信息一般与硬件本身提供的告警信息进行相或,此功能由用户编程设置。
3)如果活动报文不更新,而链路状态指示错误,则直接置位链路故障指示位。
4)如果活动报文更新,而链路状态指示错误,则启动故障恢复防抖计数器,时间到则认为链路故障真正恢复,清零链路故障指示。在计时期间如果出现1次活动报文不更新的情况,则复位计数器初始值进行重新计时。
进一步,本实施例的XHUEC域中可以增加报文握手子域和报文确认子域,报文握手子域和报文确认子域配合使用,用于实现报文接收确认和重发功能。该功能要求通信双方都配置了发送和接收功能,即使在发送有效数据为空的情况下,通信是点对点的,通信双方既可以是发送方也可以是接收方。
发送方和接收方同时维护报文握手和确认子域,并据此实现报文接收确认和重发功能。用户可以通过编程接口配置是否使用该机制。如图3所示,在使用该机制的情况下,发送方只有在接收到对方的确认标记之后才组织发送新的报文,新的报文内容包括:新报文的标记、对接收到对方的报文的确认回复标记和有效数据。如果接收不到对方的确认回复报文,则重发上次的报文。
进一步,本实施例的XHUEC域中可以增加报文CRC自校验子域,用户CRC自校验子域位于整个报文的最后,户可以通过编程接口配置是否使用用户CRC校验机制。如图4所示,在使用该机制的情况下,在发送前计算发送数据的CRC值,并将该值添加在报文的最后一起发放,接收端在也使能了接收校验的情况下对接收到的数据进行CRC计算并将结果与接收到的数据的最后一个数据(即发送端计算的CRC值)进行比较,若一致则报CRC计算正确,反之则报CRC错误。当出现CRC错误时,单次CRC故障指示位置1,内部计数器自加2,当CRC正确时,单次CRC故障指示位清零,内部计数器自减1。内部计数器最小值为0,最大值用户可配置(默认为200),若计数器值大于阈值(默认为5),则认为CRC频繁出错,链路故障指示位置1,故障状态下,当计数器值小于阈值时,则清除CRC频繁出错标志,并清零链路故障指示位。
如图1所示,XHUEC域中还可包含报文信息子域,报文信息子域含有报文基本信息,包括发送周期、报文长度、报文状态等信息。
Claims (9)
1.一种工业设备中快速通信总线故障检测方法,其特征在于,在通信报文中增加用户故障检测协议域,所述用户故障检测协议域包括用于实现链路初始状态分析和链路状态实时检测功能的活动报文子域;发送方每个发送周期自动更新活动报文子域,接收方接收报文,并检测活动报文子域,判断报文活动子域是否满足更新要求,若不满足,则认为通信链路故障。
2.根据权利要求1所述工业设备中快速通信总线故障检测方法,其特征在于,配置故障恢复防抖时间参数,当判断报文未更新,而物理链路状态指示正确时,启动故障恢复防抖计时器,当故障恢复防抖时间到时,接收到的报文仍未更新,认为通信链路故障。
3.根据权利要求1所述工业设备中快速通信总线故障检测方法,其特征在于,所述用户故障检测协议域还包括报文CRC自校验子域,根据报文CRC自校验子域确认用户是否使用报文CRC自校验机制。
4.根据权利要求3所述工业设备中快速通信总线故障检测方法,其特征在于,所述报文CRC自校验机制为:发送发计算发送数据的CRC值,同报文一起发送给接收方,接收方对接收到的报文数据进行CRC计算,与接收到的CRC值进行比较,统计CRC值不一致的次数,当次数超过设定阈值,认为链路故障。
5.根据权利要求1所述工业设备中快速通信总线故障检测方法,其特征在于,所述发送发能够进行数据接收,所述接收方能够进行数据发送。
6.根据权利要求5所述工业设备中快速通信总线故障检测方法,其特征在于,所述用户故障检测协议域还包括报文握手子域和报文确认子域,根据报文握手子域确认用户是否使用报文握手与确认机制。
7.根据权利要求6所述工业设备中快速通信总线故障检测方法,其特征在于,所述报文握手与确认机制为:发送发只有接收到接收方的确认接收标记后才发送新的报文,否则,发送方进行报文重发。
8.根据权利要求1所述工业设备中快速通信总线故障检测方法,其特征在于,所述用户故障检测协议域还包括报文信息子域,所述报文信息子域包括报文发送周期、报文长度及报文状态信息。
9.根据权利要求2所述工业设备中快速通信总线故障检测方法,其特征在于,所述故障防抖时间默认为1个接受任务执行周期。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510865965.1A CN105450469A (zh) | 2015-12-01 | 2015-12-01 | 一种工业设备中快速通信总线故障检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510865965.1A CN105450469A (zh) | 2015-12-01 | 2015-12-01 | 一种工业设备中快速通信总线故障检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105450469A true CN105450469A (zh) | 2016-03-30 |
Family
ID=55560273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510865965.1A Pending CN105450469A (zh) | 2015-12-01 | 2015-12-01 | 一种工业设备中快速通信总线故障检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105450469A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018137147A1 (zh) * | 2017-01-24 | 2018-08-02 | 北京广利核系统工程有限公司 | 一种核电站安全级仪控系统通信协议的自诊断方法 |
CN109245955A (zh) * | 2017-07-10 | 2019-01-18 | 阿里巴巴集团控股有限公司 | 一种数据处理方法、装置及服务器 |
CN109840235A (zh) * | 2017-11-27 | 2019-06-04 | 中国航空工业集团公司西安航空计算技术研究所 | 一种机载计算机rs422总线数据接收方法 |
CN112804077A (zh) * | 2020-06-05 | 2021-05-14 | 中兴通讯股份有限公司 | 数据保护方法、控制器、控制面设备和存储介质 |
CN112866057A (zh) * | 2021-01-11 | 2021-05-28 | 北京科技大学设计研究院有限公司 | 判断Profinet网络中传动装置与自动化控制器通讯断开的方法 |
CN114666252A (zh) * | 2022-05-25 | 2022-06-24 | 苏州英特模汽车科技有限公司 | 台架测试系统及方法 |
CN114760222A (zh) * | 2022-06-13 | 2022-07-15 | 北京国科天迅科技有限公司 | 一种用于100base-T1 PHY芯片的链路断开检测方法及其装置 |
WO2022237217A1 (zh) * | 2021-05-08 | 2022-11-17 | 华为技术有限公司 | 链路检测的方法、装置和设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101227263A (zh) * | 2008-02-01 | 2008-07-23 | 上海华为技术有限公司 | 一种在线故障检测系统、装置及方法 |
WO2012079405A2 (zh) * | 2010-12-16 | 2012-06-21 | 中兴通讯股份有限公司 | 链路的跟踪处理方法及系统 |
CN104518911A (zh) * | 2014-11-20 | 2015-04-15 | 毕节供电局 | 一种基于mpls-tp的ptn故障检测方法 |
CN104734884A (zh) * | 2015-02-09 | 2015-06-24 | 南京南瑞继保电气有限公司 | 一种goose通信方法及装置 |
-
2015
- 2015-12-01 CN CN201510865965.1A patent/CN105450469A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101227263A (zh) * | 2008-02-01 | 2008-07-23 | 上海华为技术有限公司 | 一种在线故障检测系统、装置及方法 |
WO2012079405A2 (zh) * | 2010-12-16 | 2012-06-21 | 中兴通讯股份有限公司 | 链路的跟踪处理方法及系统 |
CN104518911A (zh) * | 2014-11-20 | 2015-04-15 | 毕节供电局 | 一种基于mpls-tp的ptn故障检测方法 |
CN104734884A (zh) * | 2015-02-09 | 2015-06-24 | 南京南瑞继保电气有限公司 | 一种goose通信方法及装置 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018137147A1 (zh) * | 2017-01-24 | 2018-08-02 | 北京广利核系统工程有限公司 | 一种核电站安全级仪控系统通信协议的自诊断方法 |
CN109245955A (zh) * | 2017-07-10 | 2019-01-18 | 阿里巴巴集团控股有限公司 | 一种数据处理方法、装置及服务器 |
CN109245955B (zh) * | 2017-07-10 | 2022-12-09 | 阿里巴巴集团控股有限公司 | 一种数据处理方法、装置及服务器 |
CN109840235A (zh) * | 2017-11-27 | 2019-06-04 | 中国航空工业集团公司西安航空计算技术研究所 | 一种机载计算机rs422总线数据接收方法 |
CN112804077A (zh) * | 2020-06-05 | 2021-05-14 | 中兴通讯股份有限公司 | 数据保护方法、控制器、控制面设备和存储介质 |
CN112804077B (zh) * | 2020-06-05 | 2022-07-15 | 中兴通讯股份有限公司 | 数据保护方法、控制器、控制面设备和存储介质 |
CN112866057A (zh) * | 2021-01-11 | 2021-05-28 | 北京科技大学设计研究院有限公司 | 判断Profinet网络中传动装置与自动化控制器通讯断开的方法 |
CN112866057B (zh) * | 2021-01-11 | 2023-03-10 | 北京科技大学设计研究院有限公司 | 判断Profinet网络中传动装置与自动化控制器通讯断开的方法 |
WO2022237217A1 (zh) * | 2021-05-08 | 2022-11-17 | 华为技术有限公司 | 链路检测的方法、装置和设备 |
CN115396344A (zh) * | 2021-05-08 | 2022-11-25 | 华为技术有限公司 | 链路检测的方法、装置和设备 |
CN114666252A (zh) * | 2022-05-25 | 2022-06-24 | 苏州英特模汽车科技有限公司 | 台架测试系统及方法 |
CN114760222A (zh) * | 2022-06-13 | 2022-07-15 | 北京国科天迅科技有限公司 | 一种用于100base-T1 PHY芯片的链路断开检测方法及其装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105450469A (zh) | 一种工业设备中快速通信总线故障检测方法 | |
JP5727194B2 (ja) | 無線通信システム及び無線通信方法 | |
CN106817264B (zh) | 一种链路故障检测的方法、装置和系统 | |
CN106603261B (zh) | 热备份方法、第一主用设备、备用设备和通信系统 | |
CN103259699B (zh) | 测试方法、系统及客户端和服务端 | |
CN104065508A (zh) | 应用服务健康检查方法、装置和系统 | |
CN109889411B (zh) | 一种数据传输的方法及装置 | |
US9621455B2 (en) | Cross-device linear multiplex section protection method, gateway and controller | |
WO2016095344A1 (zh) | 链路切换方法、装置及线卡 | |
CN109962827B (zh) | 设备链路检测方法、装置、设备及可读存储介质 | |
CN102594643A (zh) | 一种控制器局域网总线通讯控制方法、装置及系统 | |
CN105207802A (zh) | 节点的版本升级方法、装置和系统 | |
CN104125590A (zh) | 链路故障诊断装置以及方法 | |
US8948020B2 (en) | Detecting and isolating dropped or out-of-order packets in communication networks | |
US10055322B2 (en) | Interpreting signals received from redundant buses | |
CN110809262A (zh) | 一种基于coap协议的物联网设备运维管理方法 | |
CN112671575B (zh) | 工作链路的切换方法及装置、存储介质、电子装置 | |
JP2014147066A (ja) | データネットワーク通信において冗長性を提供する方法およびシステム | |
CN104506358A (zh) | 基于snmp的网络管理系统及网络管理方法 | |
CN115733729B (zh) | 通信故障处理方法、系统及设备 | |
KR101566640B1 (ko) | 임의의 통신망 오류에 대처 가능한 이중화 can 통신 장치 및 방법, 그 방법을 수행하기 위한 기록 매체 | |
CN108650101B (zh) | 一种数据传输的方法及设备 | |
CN112751720B (zh) | 列车骨干网系统、故障检测方法及存储介质 | |
CN104038955A (zh) | 一种移动通信系统中的故障检测及处理的方法及基站 | |
JP4710719B2 (ja) | 通信異常時の再送装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160330 |
|
RJ01 | Rejection of invention patent application after publication |