CN112286707A - 一种mcu运行异常的故障定位系统及方法 - Google Patents

一种mcu运行异常的故障定位系统及方法 Download PDF

Info

Publication number
CN112286707A
CN112286707A CN202011158250.XA CN202011158250A CN112286707A CN 112286707 A CN112286707 A CN 112286707A CN 202011158250 A CN202011158250 A CN 202011158250A CN 112286707 A CN112286707 A CN 112286707A
Authority
CN
China
Prior art keywords
mcu
data
fault
upper computer
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011158250.XA
Other languages
English (en)
Other versions
CN112286707B (zh
Inventor
唐保寿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Intelligence Water Co ltd
Original Assignee
Chongqing Intelligence Water Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Intelligence Water Co ltd filed Critical Chongqing Intelligence Water Co ltd
Priority to CN202011158250.XA priority Critical patent/CN112286707B/zh
Publication of CN112286707A publication Critical patent/CN112286707A/zh
Application granted granted Critical
Publication of CN112286707B publication Critical patent/CN112286707B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种mcu运行异常的故障定位系统及方法,包括以下步骤:上位机向正常工作的mcu发送读取某地址范围内数据的指令,mcu接收到指令后将相应地址的数据发送给上位机;上位机向故障mcu发送读取某地址范围内数据的指令,mcu接收到指令后将相应地址的数据发送给上位机;上位机将两组数据进行比对,找出差异;上位机向故障mcu的差异处地址发送写入正常mcu对应地址的数据的指令,故障mcu接收到指令后将数据写入相应地址;根据故障mcu的运行状态变化来定位和排除故障。本发明能够达到快速定位及排除mcu的故障。

Description

一种mcu运行异常的故障定位系统及方法
技术领域
本发明属于mcu故障定位技术领域,具体涉及一种mcu运行异常的故障定位方法及系统。
背景技术
在能源计量技术领域中,嵌入式小系统应用相当普遍,而且系统的硬件常常经过灌封处理,一旦出现故障现象持续但容易被破坏且破坏后故障重现困难的故障,通过常规手段(比如:撬开灌封材料、带电测试等)可能会破坏系统的运行状态,使故障消失不再重现,从而使得查找故障原因失败,产品潜在的隐患得不到有效的排除。传统设计方法中,也较少考虑对重现困难的故障原因分析需求,使遇到此类故障时,故障定位困难甚至无法定位。
因此,有必要开发一种mcu运行异常的故障定位方法及系统。
发明内容
本发明的目的是提出一种mcu运行异常的故障定位方法及系统,能达到快速定位及排除mcu的故障。
第一方面,本发明所述的mcu运行异常的故障定位方法,包括以下步骤:
上位机向正常工作的mcu发送读取某地址范围内数据的指令,mcu接收到指令后将相应地址的数据发送给上位机;
上位机向故障mcu发送读取某地址范围内数据的指令,mcu接收到指令后将相应地址的数据发送给上位机;
上位机将两组数据进行比对,找出差异;
上位机向故障mcu的差异处地址发送写入正常mcu对应地址的数据的指令,故障mcu接收到指令后将数据写入相应地址;
根据故障mcu的运行状态变化来定位和排除故障。
进一步,所述地址的数据包括控制寄存器中的数据、状态寄存器中的数据和RAM中的数据。
第二方面,本发明所述的一种mcu运行异常的故障定位系统,包括终端和外部通信设备;
所述终端包括mcu和第一通信模块;所述mcu内存储有第一程序和第二程序,所述第一程序用于读取mcu的指定地址内的数据,所述第二程序用于向mcu的指定地址写入数据;
所述外部通信设备包括上位机和第二通信模块,所述上位机内存储有第三程序和第四程序,所述第三程序用于外部通信设备与终端进行通信,所述第四程序用于对比数据,并找出差异;
所述上位机用于向正常工作的mcu发送读取某地址范围内数据的指令,正常工作的mcu接收到指令后通过将相应地址的数据发送给上位机;
所述上位机用于向故障mcu发送读取某地址范围内数据的指令,故障mcu接收到指令后将相应地址的数据发送给上位机;
所述上位机用于将两组数据进行比对,并找出差异;
所述上位机用于向故障mcu的差异处地址发送写入正常mcu对应地址的数据的指令,故障mcu接收到指令后将数据写入相应地址。
进一步,所述第一通信模块和第二通信模块均为短距离无线通信模块。
进一步,所述短距离无线通信模块采用红外模块,或采用NFC模块。
进一步,所述地址的数据包括控制寄存器中的数据、状态寄存器中的数据和RAM中的数据。
本发明具有以下优点:当系统出现mcu运行异常、故障现象持续但容易被破坏且破坏后故障重现困难的故障时,在不影响系统原本运行状态的情况下,上位机通过红外或NFC模块向终端发送读取指定地址范围内数据的指令,准确获取mcu内相应地址---包括控制寄存器、状态寄存器、RAM中的数据,用以分析故障原因或与正常工作的mcu相同地址内的数据比对,就能够快速发现疑似故障点;通过对每个疑似故障点逐一分析、写入正确的数据,并观察或测试故障mcu原有的故障现象是否变化或消失,实现对各疑似故障点的检测判断,从而达到快速定位及排除故障的目的。
附图说明
图1为本实施例中终端与外部通信设备组成通信系统框图。
图2为本实施例中上位机读取到的正常工作的mcu部分寄存器数据。
图3为本实施例中上位机读取到的异常工作的mcu部分寄存器数据。
图4为本实施例中的正常、异常工作的mcu部分寄存器数据比较结果,左半部分为异常mcu的数据,右半部分为正常mcu的数据。
具体实施方式
下面结合附图对本发明作详细说明。
如图1所示,本实施例中,一种mcu运行异常的故障定位系统,包括终端4和外部通信设备6。
所述终端4包括mcu1和第一通信模块2,mcu1内含一个用于读取指定地址区域内数据的第一程序和一个用于向指定地址写入数据的第二程序。第一程序和第二程序平时是不被执行的,除占用少量存储空间外,基本不会影响mcu的正常运行。
本实施例中,以终端为NB_IoT物联网水表为例,NB_IoT物联网水表除了包含mcu1、第一通信模块2外,还包括计量模块8、NB_loT模块9(即窄带物联网)和电源10,各模块均为现有技术,此处不再赘述。
如图1所示,外部通信设备6由一个上位机3和第二通信模块5组成。
本实施例中,所述第一通信模块2和第二通信模块5均为短距离无线通信模块。所述短距离无线通信模块采用红外模块,或采用NFC模块。当第一通信模块采用红外模块时,第二通信模块采用红外模块;当第一通信模块采用NFC模块时,第二通信模块采用NFC模块。
本实施例中,上位机3内含一个用于与终端(本实施例中,终端为NB_IoT物联网水表)通信的第三程序,以及一个用于对比数据并找出差异的第四程序。
如图1所示,终端4与外部通信设备6之间可通过红外或NFC实现无线通信功能。
本实施例中,一种mcu运行异常的故障定位方法,具体为:
当上位机向mcu发送读取某地址范围(以内部寄存器为例)数据的指令,mcu获取此指令后,执行内部读取指定地址区域内数据的第一程序,该第一程序读取内部寄存器中的数据,按易于解读的格式发送给上位机,上位机接收到内部寄存器数据,参见图2和图3。其中图2为一个运行正常的终端(NB_IoT物联网水表)上传的内部寄存器数据,图3为一个运行异常的终端(NB_IoT物联网水表)上传的内部寄存器数据。将这两组数据分别存储为2个文件,利用第四程序(即文件比较工具)比较这两个文件,其比较结果如图4所示。这样就可以得出两个mcu内各寄存器值的差异,按各寄存器的功能定义确定哪些差异为正常的,哪些差异为疑似故障点。对疑似故障点,通过上位机向其所在mcu发送写入正确数据的指令,根据mcu的运行状态变化,确定故障是否已排除,从而实现故障的快速查找与定位。
本方法可用于水表内mcu运行异常、故障现象持续但容易被破坏且破坏后故障重现困难的故障原因分析和定位。
以下结合实例对本发明进行详细的说明:
在图4中,ADC0_0的第10、12、14个数据出现差异,它们的功能定义分别是“单端转换结果寄存器”、“单端转换结果读取寄存器”、“标定寄存器”,不同mcu这3个数据不同是正常的,所以这3个差异点可以忽略,不作为疑似故障点;DAC0_0的第12个数据出现差异,它的功能定义是“标定寄存器”,不同mcu这个数据不同是正常的,所以这个差异点可以忽略,不作为疑似故障点;DAC0_1的第2个数据出现差异,它的功能定义是“运算放大器偏置寄存器”,不能确认这两个mcu中这个数据不同是否正常的,将其作为疑似故障点1;TIMER1_0的第10个数据出现差异,它的功能定义是“计数器值寄存器”,不同mcu这个数据不同是正常的,所以这个差异点可疑忽略,不作为疑似故障点;RTC_0的第2、3个数据出现差异,它的功能定义分别是“计数器值寄存器”、“比较值寄存器0”,不同mcu的“计数器值寄存器”是正常的,但“比较值寄存器0”应该一致,因为程序设计的RTC的定时周期是固定不变的,故将其作为疑似故障点2;LETIMER0_0的第9个数据出现差异,它的功能定义是“定时器中断标志寄存器”,不同mcu的该标志不同是正常的,所以这个差异点可疑忽略,不作为疑似故障点;LEUART0_0的第7、8、9个数据出现差异,它的功能定义分别是“接收数据扩展寄存器”、“接收数据寄存器”、“接收数据扩展读取寄存器”,不同mcu这三个数据不同是正常的,所以这个差异点可疑忽略,不作为疑似故障点。
经过上述比对分析,已经找到疑似故障点1和疑似故障点2,针对疑似故障点1,用正常工作mcu的DAC0_1第二个数据0x02写入异常工作mcu的相同地址后(即:DAC0_1第二个数据的地址),观察异常工作mcu的工作状态没有变化,故该疑似故障点可排除;针对疑似故障点2,用正常工作mcu的RTC_0第三个数据0x4000写入异常工作mcu的相同地址(即:RTC_0第三个数据的地址)后,观察异常工作mcu的工作状态发生了变化,其工作电流降低到了正常值。这样就可确定:mcu工作电流异常是由于RTC_0的第三个数“比较值寄存器0”被修改造成的,集中精力排查可能修改该寄存器值的程序即可从根本上排除此故障。

Claims (6)

1.一种mcu运行异常的故障定位方法,其特征在于,包括以下步骤:
上位机向正常工作的mcu发送读取某地址范围内数据的指令,mcu接收到指令后将相应地址的数据发送给上位机;
上位机向故障mcu发送读取某地址范围内数据的指令,mcu接收到指令后将相应地址的数据发送给上位机;
上位机将两组数据进行比对,找出差异;
上位机向故障mcu的差异处地址发送写入正常mcu对应地址的数据的指令,故障mcu接收到指令后将数据写入相应地址;
根据故障mcu的运行状态变化来定位和排除故障。
2.根据权利要求1所述的mcu运行异常的故障定位方法,其特征在于:所述地址的数据包括控制寄存器中的数据、状态寄存器中的数据和RAM中的数据。
3.一种mcu运行异常的故障定位系统,其特征在于:包括终端(4)和外部通信设备(6);所述终端(4)包括mcu(1)和第一通信模块(2);所述mcu(1)内存储有第一程序和第二程序,所述第一程序用于读取mcu的指定地址内的数据,所述第二程序用于向mcu的指定地址写入数据;
所述外部通信设备包括上位机(3)和第二通信模块(5),所述上位机内存储有第三程序和第四程序,所述第三程序用于外部通信设备(6)与终端(4)进行通信,所述第四程序用于对比数据,并找出差异;
所述上位机用于向正常工作的mcu发送读取某地址范围内数据的指令,正常工作的mcu接收到指令后通过将相应地址的数据发送给上位机;
所述上位机用于向故障mcu发送读取某地址范围内数据的指令,故障mcu接收到指令后将相应地址的数据发送给上位机;
所述上位机用于将两组数据进行比对,并找出差异;
所述上位机用于向故障mcu的差异处地址发送写入正常mcu对应地址的数据的指令,故障mcu接收到指令后将数据写入相应地址。
4.根据权利要求3所述的mcu运行异常的故障定位系统,其特征在于:所述第一通信模块和第二通信模块均为短距离无线通信模块。
5.根据权利要求4所述的mcu运行异常的故障定位系统,其特征在于:所述短距离无线通信模块采用红外模块,或采用NFC模块。
6.根据权利要求3至5任一所述的mcu运行异常的故障定位系统,其特征在于:所述地址的数据包括控制寄存器中的数据、状态寄存器中的数据和RAM中的数据。
CN202011158250.XA 2020-10-26 2020-10-26 一种mcu运行异常的故障定位系统及方法 Active CN112286707B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011158250.XA CN112286707B (zh) 2020-10-26 2020-10-26 一种mcu运行异常的故障定位系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011158250.XA CN112286707B (zh) 2020-10-26 2020-10-26 一种mcu运行异常的故障定位系统及方法

Publications (2)

Publication Number Publication Date
CN112286707A true CN112286707A (zh) 2021-01-29
CN112286707B CN112286707B (zh) 2024-04-05

Family

ID=74373329

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011158250.XA Active CN112286707B (zh) 2020-10-26 2020-10-26 一种mcu运行异常的故障定位系统及方法

Country Status (1)

Country Link
CN (1) CN112286707B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114239767A (zh) * 2021-11-05 2022-03-25 深圳市敏泰智能科技有限公司 一种水表地址无接触写入方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080010868A (ko) * 2006-07-28 2008-01-31 (주)토마토엘에스아이 램 테스트 및 고장처리 시스템
CN101916306A (zh) * 2010-07-16 2010-12-15 北京航空航天大学 一种用于fpga芯片敏感区域定位的系统及其方法
CN101997718A (zh) * 2010-10-21 2011-03-30 中兴通讯股份有限公司 故障定位方法及装置
CN102592680A (zh) * 2011-01-12 2012-07-18 北京兆易创新科技有限公司 一种存储芯片的修复装置和方法
CN103019873A (zh) * 2012-12-03 2013-04-03 华为技术有限公司 一种存储器故障单元的替换方法及装置、数据存储系统
CN108519924A (zh) * 2018-03-06 2018-09-11 许继集团有限公司 一种嵌入式测控装置的在线故障定位方法、系统及装置
CN109726057A (zh) * 2018-11-19 2019-05-07 浙江众合科技股份有限公司 一种cpu安全系统并行总线故障实时动态检测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080010868A (ko) * 2006-07-28 2008-01-31 (주)토마토엘에스아이 램 테스트 및 고장처리 시스템
CN101916306A (zh) * 2010-07-16 2010-12-15 北京航空航天大学 一种用于fpga芯片敏感区域定位的系统及其方法
CN101997718A (zh) * 2010-10-21 2011-03-30 中兴通讯股份有限公司 故障定位方法及装置
CN102592680A (zh) * 2011-01-12 2012-07-18 北京兆易创新科技有限公司 一种存储芯片的修复装置和方法
CN103019873A (zh) * 2012-12-03 2013-04-03 华为技术有限公司 一种存储器故障单元的替换方法及装置、数据存储系统
CN108519924A (zh) * 2018-03-06 2018-09-11 许继集团有限公司 一种嵌入式测控装置的在线故障定位方法、系统及装置
CN109726057A (zh) * 2018-11-19 2019-05-07 浙江众合科技股份有限公司 一种cpu安全系统并行总线故障实时动态检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114239767A (zh) * 2021-11-05 2022-03-25 深圳市敏泰智能科技有限公司 一种水表地址无接触写入方法

Also Published As

Publication number Publication date
CN112286707B (zh) 2024-04-05

Similar Documents

Publication Publication Date Title
CN101902349A (zh) 一种检测端口扫描行为的方法和系统
CN111325159A (zh) 故障诊断方法、装置、计算机设备和存储介质
CN113449703B (zh) 环境在线监测数据的质控方法、装置、存储介质及设备
CN112286707A (zh) 一种mcu运行异常的故障定位系统及方法
CN107516546B (zh) 一种随机存储器的在线检测装置及方法
CN114238980B (zh) 一种工控设备漏洞挖掘方法、系统、设备及存储介质
CN105159834A (zh) 一种软件动态测试运行数据提取方法
CN116244699A (zh) 基于交互式应用安全检测的漏洞危险度评估系统
CN105786668A (zh) 一种基于Redhat系统下内存错误检测方法
CN112346552B (zh) 电源监测方法、装置、计算机设备和存储介质
CN111008117B (zh) 一种XDP_log分析方法及系统
US20170184488A1 (en) Facility state analysis device, analysis method for facility state, storage medium, and facility management system
CN113515507B (zh) 应用于大坝渗水检测的方法及系统
CN117409846A (zh) 一种Flash芯片的不稳定页块剔除方法、系统、设备及介质
CN116304776B (zh) 基于k-Means算法的电网数据值异常检测方法及系统
CN116773746B (zh) 烟气成分分析仪的数据记录系统及记录方法
Sun et al. Multiblock regression model for fault diagnosis
CN116736340A (zh) 一种欺骗信号检测方法、装置、计算机设备及存储介质
Xing et al. Pressure Transient Detection and Pattern Discovery in Water Distribution Systems
CN117114651A (zh) 基于机理与数据分析融合的设备管理系统及方法
CN117170948A (zh) 主板内存故障的定位方法、装置、电子设备及存储介质
CN112947320A (zh) 企业排污监测方法、装置、系统和存储介质
CN116523846A (zh) 一种试纸整洁度检测方法及系统
CN116793688A (zh) 可变气门正时系统位置分析方法、装置、设备和介质
CN116127470A (zh) 一种适用于多环境下的Web应用的Sql注入漏洞扫描分析系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant