CN113923615A - 物联网内的5g dtu故障自动恢复方法 - Google Patents

物联网内的5g dtu故障自动恢复方法 Download PDF

Info

Publication number
CN113923615A
CN113923615A CN202111188269.3A CN202111188269A CN113923615A CN 113923615 A CN113923615 A CN 113923615A CN 202111188269 A CN202111188269 A CN 202111188269A CN 113923615 A CN113923615 A CN 113923615A
Authority
CN
China
Prior art keywords
fault
executing
detection
internet
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111188269.3A
Other languages
English (en)
Other versions
CN113923615B (zh
Inventor
鄢波
赵聪慧
陆树民
任军
王志恒
谢万东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Jiuzhou Electronic Technology Co Ltd
Original Assignee
Sichuan Jiuzhou Electronic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Jiuzhou Electronic Technology Co Ltd filed Critical Sichuan Jiuzhou Electronic Technology Co Ltd
Priority to CN202111188269.3A priority Critical patent/CN113923615B/zh
Publication of CN113923615A publication Critical patent/CN113923615A/zh
Application granted granted Critical
Publication of CN113923615B publication Critical patent/CN113923615B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16YINFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
    • G16Y40/00IoT characterised by the purpose of the information processing
    • G16Y40/10Detection; Monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种物联网内的5G DTU故障自动恢复方法,包括:设备侧的系统快照、故障检测、故障恢复、故障信息保存和上传,服务器侧的故障信息管理以及对物联网内设备进行远程调试;本发明本发明通过故障的检测和修复,达到使设备故障自动恢复的效果,使设备网络通畅。

Description

物联网内的5G DTU故障自动恢复方法
技术领域
本发明涉及通信技术领域,特别是一种物联网内的5G DTU故障自动恢复方法。
背景技术
5G DTU(Data Transfer Unit)是一种可用于物联网内的网关设备。对上通过5G物联网SIM卡获取到物联网接入能力,对下可组建一个局域网,下挂设备通过有线连接到DTU获取物联网接入能力。5G DTU因为上行是5G的缘故,可以为在5G信号覆盖范围内的户外网络设备提供网络接入能力,多用于为户外的监控摄像头和数据采集器提供网络接入能力。
5G DTU可以解决原有4G DTU上行速率低的痛点,可以实时上传大量数据。但由于设备经常是放置于户外的电线杆上,并且使用的5G卡是物联网卡不能连接互联网,设备出了故障以后处理起来很不方便,经常需要爬电线杆去处理故障设备。如果故障处理不积极,一方面对设备厂家处理问题能力及效率产生负面影响,一方面对使用厂家的正常业务开展造成困扰。
5G DTU工作在物联网内,物联网有着安全、快速的优点。但是互联网是无法访问物联网内的设备的,当在户外电线杆的设备发生故障时,一般有两种处理方法,方法一是让当地运维人员直接更换设备。方法二是派遣技术人员到达故障发生地,爬上电线杆把USB数据线连接到5G DTU设备,然后用笔记本电脑连接USB数据线另一端进行调试。方法一只是暂时解决用户的问题,但无法获取到故障信息,也就无法针对故障对软件进行升级和优化。方法二有安全隐患,爬电线杆是风险很大的一件事情;然后成本也高,需要技术人员到达现场进行调试分析。
另外,一般物联网内会有设备管理系统对所有设备进行管理,可以对设备状态进行查看和管理。不过一旦设备网络中断就会导致脱管,无法对设备进行管理。
发明内容
为解决现有技术中存在的问题,本发明的目的是提供一种物联网内的5G DTU故障自动恢复方法,本发明通过故障的检测和修复,达到使设备故障自动恢复的效果,使设备网络通畅。
为实现上述目的,本发明采用的技术方案是:一种物联网内的5G DTU故障自动恢复方法,包括:
设备侧的系统快照、故障检测、故障恢复、故障信息保存和上传,服务器侧的故障信息管理以及对物联网内设备进行远程调试;其中:
系统快照包括设备在部署后系统第一次检测到设备运行正常,把系统当前状态的所有数据都记录到一个文件里,后续如果系统出现故障无法恢复,使用系统快照功能把系统还原为某个时间点的状态;
故障检测包括通过周期性检测设备的网络连通性、拨号状态、SIM卡状态、gps信息发现异常,通过检测程序确认为故障发生;
故障恢复包括通过重新拨号、重启5G模组协议栈、重启5G模组、重置SIM卡、系统快照恢复,实现设备故障恢复;
故障信息保存和上传包括在程序确认故障发生后,保存设备当前所有参数、状态、程序运行信息到硬盘,当故障恢复系统生效后,设备网络恢复正常,自动把故障信息上传到物联网中的设备管理服务器;
故障信息管理包括接收DTU的故障上报信息并进行整理归纳;
对物联网内设备进行远程调试包括让技术人员在互联网侧远程接入到物联网内的设备,进行远程调试。
作为本发明的进一步改进,所述系统快照包括系统快照生效流程和系统快照恢复流程;
系统快照生效具体包括以下步骤:
步骤1、新设备部署预置了检测标记,或者通过WEB页面设置检测标记,触发检测流程;
步骤2、检测设备5G注网是否正常,是则执行步骤3,否则继续执行步骤2;
步骤3、检测设备访问服务器是否正常,是则执行步骤4,否则执行步骤2;
步骤4、检测设备两个LAN侧下挂设备网络是否正常,是则执行步骤5,否则执行步骤2;
步骤5、获取系统当前各种参数,保存到文件/data/system_snapshot_data中;
步骤6、退出检测流程,删除标记让检测流程不再触发;
系统快照恢复具体包括以下步骤:
步骤1、由其他检测程序触发系统快照恢复功能;
步骤2、系统重启;
步骤3、启动过程中读取/data/system_snapshot_data文件中的参数配置系统参数;
步骤4、系统恢复为快照时的状态。
作为本发明的进一步改进,网络连通性故障检测和恢复具体包括以下步骤:
步骤1、循环60秒一次进行网络连通性故障检测;
步骤2、ping主服务器地址3次,成功继续步骤1检测循环,失败执行步骤3;
步骤3、ping备用服务器地址3次,成功继续步骤1检测循环,失败执行步骤4;
步骤4、保存设备故障信息;
步骤5、检测是否重启了5G协议栈3次,否则执行步骤6,是则执行步骤7;
步骤6、发送“at+cfun=0”和“at+cfun=1”命令到5G模组重启5G协议栈,重启后继续步骤1检测循环;
步骤7、检测是否重启了5G模组3次,否的话执行步骤8,是的话执行步骤9;
步骤8、发送“reboot”命令重启5G模组,重启后继续步骤1检测循环;
步骤9、发送“reset”命令执行系统快照恢复,恢复后继续步骤1检测循环。
作为本发明的进一步改进,拨号故障检测和恢复具体包括以下步骤:
步骤1、循环60秒一次进行拨号故障检测;
步骤2、发送“at+gtrndis?”命令到5G模组检测设备是否获取到IP,是继续步骤1检测循环,否执行步骤3;
步骤3、检测是否手动拨号了3次,否执行步骤4,是执行步骤5;
步骤4、发送“at+gtrndis=1,1”到5G模组执行手动拨号,然后继续步骤1检测循环;
步骤5、保存设备故障信息;
步骤6、检测是否重启了5G协议栈3次,否的话执行步骤7,是的话执行步骤8;
步骤7、发送“at+cfun=0”和“at+cfun=1”命令到5G模组重启5G协议栈,重启后继续步骤1检测循环;
步骤8、检测是否重启了5G模组3次,否则执行步骤9,是则执行步骤10;
步骤9、发送“reboot”命令重启5G模组,重启后继续步骤1检测循环;
步骤10、发送“reset”命令执行系统快照恢复,恢复后继续步骤1检测循环。
作为本发明的进一步改进,SIM卡故障检测和恢复具体包括以下步骤:
步骤1、循环60秒一次进行SIM卡故障检测;
步骤2、发送“at+cpin?”命令检测SIM卡是否正常,返回READY是正常,否则为异常,正常继续步骤1检测循环,异常执行步骤3;
步骤3、检测SIM异常次数是否达到10次,没有达到再次执行步骤2,达到了执行步骤4;
步骤4、保存故障数据,用于优化软件提供依据;
步骤5、检测是否重置SIM卡3次,否执行步骤6,是执行步骤7;
步骤6、发送命令“at+gtdualsim=1”和“at+gtdualsim=0”重置SIM卡,然后执行步骤2继续检测;
步骤7、检测是否重启了5G模组3次,否则执行步骤8,是则执行步骤9;
步骤8、发送“reboot”命令重启5G模组,重启后继续步骤1检测循环;
步骤9、发送“reset”命令执行系统快照恢复,恢复后继续步骤1检测循环。
作为本发明的进一步改进,gps故障检测和恢复具体包括以下步骤:
步骤1、200秒一次进行gps故障检测;
步骤2、发送命令“at+gtgps?”到5G模组,获取gps定位信息,能够获取继续检测循环,不能获取执行步骤3;
步骤3、检查是否获取gps定位信息失败了3次,没有3次继续步骤1检测循环,到达3次执行步骤4;
步骤4、保存故障数据,用于优化软件提供依据;
步骤5、检查是否重启5G模组3次,否执行步骤6,是执行步骤7;
步骤6、发送“reboot”命令重启5G模组,重启后继续步骤1检测循环;
步骤7、发送“reset”命令执行系统快照恢复,恢复后继续步骤1检测循环。
作为本发明的进一步改进,故障信息管理具体包括以下步骤:
步骤1、DTU开机;
步骤2、检测网络是否正常,正常执行步骤3;
步骤3、检查是否有故障信息,是执行步骤4;
步骤4、上传故障信息;
步骤5、检测上传是否成功,成功执行步骤6;
步骤6、删除故障信息;
步骤7、服务器接收上传的故障信息并保存;
步骤8、技术人员访问服务器获取保存的故障信息。
作为本发明的进一步改进,对物联网内设备进行远程调试包括运维人员携带中转5G DTU、5G物联网SIM卡、网线、中转笔记本电脑、运维手机、TYPC-C电源线在故障机的物联网5G信号范围内搭建远程调试环境,通过中转笔记本电脑进行跨网络通讯,具体包括以下步骤:
步骤1:通过TYPE-C电源线,以笔记本电脑为电源,给5G DTU供电,把5G物联网SIM卡插入5G DTU,实现5G DTU连接对应物联网;
步骤2、运维手机通过4G/5G蜂窝网络连接到互联网,开启手机热点共享;
步骤3、笔记本电脑网线连接5G DTU,获取到一个有线IP A,为物联网内的地址;
步骤4、笔记本电脑使用WIFI连接手机热点,获取到一个无线IP B,为互联网内的地址;
步骤5、笔记本电脑配置路由规则;
步骤6、运维人员使用远程桌面程序访问中转笔记本电脑;
步骤7、运维人员在中转笔记本电脑上的网络浏览器使用故障DTU IP地址A登录故障机的web管理界面;
步骤8、使用故障机预置的账号密码登录web,进入管理界面,在管理界面打开telnet开关;
步骤9、在中转笔记本电脑打开telnet工具,连接故障机IP;
步骤10、telnet连接上故障机后,通过命令获取到设备的历史故障信息,或进行实时调试,用于软件的优化改进。
本发明的有益效果是:
本发明通过故障的检测和修复,达到使设备故障自动恢复的效果,使设备网络通畅;然后再通过服务器保存的故障信息以及远程调试物联网5G DTU的方法,对故障进行分析和调试,用于软件的改进和优化。相对于原来的故障处理方式,一是去除了爬电线杆调试设备的安全风险;二是可以节约技术人员大量的出差时间和费用;三是可以大大减少设备故障断网时长;四是可以高效的获取到设备的故障信息用于软件的升级改进。本发明方案具备极高的先进性和应用推广价值。
附图说明
图1为本发明实施例中系统快照功能框架图;
图2为本发明实施例中网络连通性故障检测和恢复流程图;
图3为本发明实施例中拨号故障检测和恢复流程图;
图4为本发明实施例中SIM卡故障检测和恢复流程图;
图5为本发明实施例中gps故障检测和恢复流程图;
图6为本发明实施例中故障信息管理框架图;
图7为本发明实施例中远程调试物联网内5G DTU设备框架图。
具体实施方式
下面结合附图对本发明的实施例进行详细说明。
实施例
如图1-图7所示,一种物联网内的5G DTU故障自动恢复方法,包括:
设备侧的系统快照、故障检测、故障恢复、故障信息保存和上传,服务器侧的故障信息管理以及对物联网内设备进行远程调试。
系统快照是设备在部署后系统第一次检测到设备运行正常,就把系统当前状态的所有数据都记录到一个文件里,类似相片一样记录系统某一个时间点的状态。后续如果系统出现故障无法恢复,可以使用系统快照功能把系统还原为某个时间点的状态,以此达到消除故障的目的。
故障检测是通过周期性检测设备的网络连通性、拨号状态、SIM卡状态、gps信息等方式发现异常,通过检测程序确认为故障发生。
故障恢复是通过重新拨号、重启5G模组协议栈、重启5G模组、重置SIM卡、系统快照恢复等方式,实现设备故障恢复。
故障信息保存和上传是指在程序确认故障发生后,会保存设备当前所有参数、状态、程序运行等信息到硬盘,当故障恢复系统生效后,设备网络恢复正常,会自动把故障信息上传到物联网中的设备管理服务器。技术人员通过访问设备管理服务器中的相关记录,可以查看所有设备的故障历史信息,这些信息可以供技术人员分析故障原因,优化设备软件。
服务器侧的故障信息管理,可接收DTU的故障上报信息,进行整理归纳。技术人员可以很方便的从服务器获取到指定设备的故障历史记录。
远程调试物联网内设备可以让技术人员在互联网侧远程接入到物联网内的设备,进行远程调试。很多故障光凭借故障信息是无法诊断出故障具体原因的,可能和故障机的硬件、网络环境、软件、温度湿度等都有关,很多故障只会在特定设备或特定环境下的设备才会出现。因此远程调试故障机的功能是必须的,是对故障自动恢复系统的补充和完善。
下面分别详细介绍系统快照功能、不同故障的检测和恢复机制、以及故障信息上传和远程调试方法。
系统快照功能,在设备第一次部署或者设备的WEB页面打开相关开关后进入检测阶段。检测到设备上行5G注网正常、服务器访问正常、下行两个LAN侧设备网络通讯正常后认为当前设备处于正常运行状态,触发参数保存机制。参数保存机制把所有系统运行中的各种参数保存到/data/system_snapshot_data文件中,并且配置参数让自动检测机制不再执行。后续如果系统发生故障并且常用的故障处理方式无法恢复时,会触发系统快照恢复功能。触发恢复后系统在启动时会读取/data/system_snapshot_data文件中的参数,配置各种系统参数,让系统恢复到系统拍照时的状态,可以解决大部分软件故障。设备在部署时,部署人员需要保证设备成功触发了系统快照功能,保存了设备正常运行的参数。
网络连通性故障,检测的原理是配置两个检测用服务器IP,通过ping检测IP来检测当前设备网络是否正常。系统默认预置了两个检测IP,也可以在设备的WEB界面修改。系统60秒一个检测周期,每个周期有3个检测循环。检测循环一次的动作包含尝试ping主服务器3次,每次ping超时为3秒,尝试ping备用服务器3次,每次ping超时为3秒。每个循环之间间隔3秒,连续尝试3个循环总时间为60秒。如果有一次成功,则退出轮循,如果3个循环都尝试失败,则认为发生网络连通性故障,此时触发故障信息保存机制,开始采集设备当前所有参数、状态、进程等信息保存到硬盘。故障信息保存后,会发送“at+cfun=0”和“at+cfun=1”重启5G模组协议栈,然后重新进入检测周期。如果连续3次重启5G协议栈也没有恢复,则重启5G模组。如果连续3次重启5G模组也没有恢复,则触发系统快照恢复。
拨号故障,检测的原理是60秒一次周期性检测5G模组的拨号状态,发送at+gtrndis?命令到5G模组看是否正确获取到了IP。如果发现没有获取到IP,发送命令at+gtrndis=1,1导5G模组执行手动拨号。手动拨号成功继续执行检测大循环,手动拨号失败间隔3秒再次手动拨号。手动拨号失败3次认为发生拨号故障,此时触发故障信息保存机制,开始采集设备当前所有参数、状态、进程等信息保存到硬盘。故障信息保存后,会发送CFUN=0/CFUN=1重启5G模组协议栈,然后重新进入检测周期。如果连续3次重启5G协议栈也不能拨号成功,则重启5G模组。如果连续3次重启5G模组也不能拨号成功,则触发系统快照恢复。
SIM卡故障,这里指的是SIM卡本身正常的情况下访问异常,不包括SIM卡损坏或者接触不良等硬件故障。SIM卡检测也是60秒一次周期性检测,通过at+cpin?命令获取SIM卡状态,返回READY为正常,其他情况为异常。发现异常时进入检查小循环,连续10次每次间隔10秒读取SIM卡,如果读取还是异常则发送at+gtdualsim=1/at+gtdualsim=0执行SIM卡重置操作,然后重新进入检测周期。连续3次SIM卡重置也不能恢复正常访问的,则重启5G模组。如果连续3次重启5G模组也不能恢复正常访问的,则触发系统快照恢复。
gps定位故障,指设备无法获取gps定位信息,这个信息对设备的管理是很重要的。系统200秒获取一次gps信息,通过发送at+gtgps?到5G模块,解析返回结果是否有经纬度来检测是否获取到了gps定位信息。如果连续3次获取gps信息失败,则触发重启5G模组。如果连续3次重启5G模组也不能获取gps定位信息,则触发系统快照恢复。
故障信息上传,指设备网络恢复后需要把之前保存的故障信息上传到管理服务器。系统开机后会检查网络是否正常,网络正常的话会检查是否有历史故障信息,有故障信息的话触发故障信息上传机制。设备通过HTTP POST的方式把故障信息发送到服务器,服务器收到故障信息后对故障信息进行保存。技术人员访问服务器可通过mac地址查询和下载对应设备的历史故障信息。
远程调试物联网内设备的主要目的是如果故障信息不能够确定问题所在,需要对曾经发生故障的设备进行连接和调试。调试方法需要的硬件软件主要包括技术人员办公室调试电脑、普通4G或5G手机、中转笔记本电脑、中转5G DTU设备、远程桌面共享软件、telnet工具、type-c连接线。实施过程如下:技术人员办公室调试电脑和手机可以正常接入到互联网。外场支持人员携带手机及中转笔记本电脑到故障区域,手机共享一个手机热点,中转笔记本电脑通过WIFI连接到手机热点实现接入互联网。中转5G DTU使用type-c线通过中转笔记本电脑给5G DTU供电,使用和故障机同一批的5G物联网卡接入到对应的物联网内。中转笔记本电脑通过有线连接5G DTU实现接入物联网。中转笔记本电脑通过路由配置,让访问物联网的操作路由到物联网,让远程桌面共享的操作路由到互联网。至此远程调试环境搭建完成,技术人员通过远程桌面操作中转笔记本电脑,根据故障设备的IP通过网络浏览器访问到故障设备的web配置界面,使用设备预置的账号密码登录web界面后配置故障设备的telnet功能打开。然后使用telnet工具就可以访问到故障设备,对设备进行专业的调试分析,从而达到分析故障发生原因优化软件的目的。
下面对本实施例作进一步的说明:
系统快照功能框架见图1,如图1所示,左边为系统快照生效流程,右边为系统快照恢复流程,生效流程具体说明如下:
步骤1:新设备部署预置了检测标记,或者通过WEB页面设置检测标记,触发检测流程;
步骤2:检测设备5G注网是否正常,是执行步骤3,否继续执行步骤2;
步骤3:检测设备访问服务器是否正常,是执行步骤4,否执行步骤2;
步骤4:检测设备两个LAN侧下挂设备网络是否正常,是执行步骤5,否执行步骤2;
步骤5:获取系统当前各种参数,保存到文件/data/system_snapshot_data中;
步骤6:退出检测流程,删除标记让检测流程不再触发;
系统快照恢复流程如下:
步骤1:由其他检测程序触发系统快照恢复功能;
步骤2:系统重启;
步骤3:启动过程中读取/data/system_snapshot_data文件中的参数配置系统参数;
步骤4:系统恢复为快照时的状态。
网络连通性故障检测和恢复逻辑见图2所示;具体的步骤说明如下:
步骤1:循环60秒一次进行网络连通性故障检测;
步骤2:ping主服务器地址3次,成功继续步骤1检测循环,失败执行步骤3;
步骤3:ping备用服务器地址3次,成功继续步骤1检测循环,失败执行步骤4;
步骤4:保存设备故障信息;
步骤5:检测是否重启了5G协议栈3次,否的话执行步骤6,是的话执行步骤7;
步骤6:发送“at+cfun=0”和“at+cfun=1”命令到5G模组重启5G协议栈,重启后继续步骤1检测循环;
步骤7:检测是否重启了5G模组3次,否的话执行步骤8,是的话执行步骤9;
步骤8:发送“reboot”命令重启5G模组,重启后继续步骤1检测循环;
步骤9:发送“reset”命令执行系统快照恢复,恢复后继续步骤1检测循环。
拨号故障检测和恢复逻辑见图3所示;具体的步骤说明如下:
步骤1:循环60秒一次进行拨号故障检测;
步骤2:发送“at+gtrndis?”命令到5G模组检测设备是否获取到IP,是继续步骤1检测循环,否执行步骤3;
步骤3:检测是否手动拨号了3次,否执行步骤4,是执行步骤5;
步骤4:发送“at+gtrndis=1,1”到5G模组执行手动拨号,然后继续步骤1检测循环;
步骤5:保存设备故障信息;
步骤6:检测是否重启了5G协议栈3次,否的话执行步骤7,是的话执行步骤8;
步骤7:发送“at+cfun=0”和“at+cfun=1”命令到5G模组重启5G协议栈,重启后继续步骤1检测循环;
步骤8:检测是否重启了5G模组3次,否的话执行步骤9,是的话执行步骤10;
步骤9:发送“reboot”命令重启5G模组,重启后继续步骤1检测循环;
步骤10:发送“reset”命令执行系统快照恢复,恢复后继续步骤1检测循环。
SIM卡故障检测和恢复逻辑见图4所示;具体的步骤说明如下:
步骤1:循环60秒一次进行SIM卡故障检测;
步骤2:发送“at+cpin?”命令检测SIM卡是否正常,返回READY是正常,否则为异常。正常继续步骤1检测循环,异常执行步骤3;
步骤3:检测SIM异常次数是否达到10次,没有达到再次执行步骤2,达到了执行步骤4;
步骤4:保存故障数据,用于优化软件提供依据;
步骤5:检测是否重置SIM卡3次,否执行步骤6,是执行步骤7;
步骤6:发送命令“at+gtdualsim=1”和“at+gtdualsim=0”重置SIM卡,然后执行步骤2继续检测;
步骤7:检测是否重启了5G模组3次,否的话执行步骤8,是的话执行步骤9;
步骤8:发送“reboot”命令重启5G模组,重启后继续步骤1检测循环;
步骤9:发送“reset”命令执行系统快照恢复,恢复后继续步骤1检测循环。
gps故障检测和恢复逻辑见图5所示;具体的步骤说明如下:
步骤1:200秒一次进行gps故障检测;
步骤2:发送命令“at+gtgps?”到5G模组,获取gps定位信息。能够获取继续检测循环,不能获取执行步骤3;
步骤3:检查是否获取gps定位信息失败了3次,没有3次继续步骤1检测循环,到达3次执行步骤4;
步骤4:保存故障数据,用于优化软件提供依据;
步骤5:检查是否重启5G模组3次,否执行步骤6,是执行步骤7;
步骤6:发送“reboot”命令重启5G模组,重启后继续步骤1检测循环;
步骤7:发送“reset”命令执行系统快照恢复,恢复后继续步骤1检测循环。
故障信息管理框架见图6所示,具体的步骤说明如下:
步骤1:DTU开机;
步骤2:检测网络是否正常,正常执行步骤3;
步骤3:检查是否有故障信息,是执行步骤4;
步骤4:上传故障信息;
步骤5:检测上传是否成功,成功执行步骤6;
步骤6:删除故障信息;
步骤7:服务器接收上传的故障信息并保存;
步骤8:技术人员访问服务器获取保存的故障信息。
远程调试物联网内5G DTU设备框架见图7所示,框架图左边部分为物联网部分,右边部分为互联网部分,通过中间的中转笔记本电脑进行跨网络通讯。运维人员需要携带中转5G DTU、5G物联网SIM卡、网线、中转笔记本电脑、运维手机、TYPC-C电源线在故障机的物联网5G信号范围内搭建远程调试环境。具体的实现方法流程如下:
步骤1:通过TYPE-C电源线,以笔记本电脑为电源,给5G DTU供电,把5G物联网SIM卡插入5G DTU,实现5G DTU连接对应物联网;
步骤2:运维手机通过4G/5G蜂窝网络连接到互联网,开启手机热点共享;
步骤3:笔记本电脑网线连接5G DTU,获取到一个有线IP A,为物联网内的地址;
步骤4:笔记本电脑使用WIFI连接手机热点,获取到一个无线IP B,为互联网内的地址;
步骤5:笔记本电脑配置路由规则:
命令:route delete 0.0.0.0mask 0.0.0.0 192.168.8.1
作用:禁止网络数据走192.168.8.1网卡,也就是禁止网络数据走有线的物联网;
命令:route add 172.30.0.0 mask 255.255.255.0 192.168.8.1
作用:配置所有访问172.30.0.0网段,也就是物联网的访问,走192.168.8.1这个网卡,也就是有线网卡;
这两条命令配置完成后,默认会使用WIFI互联网,访问172.30.0.0网段的网络数据会走有线物联网,而5G DTU的IP就是172.30网段的,因此实现了访问物联网的数据使用有线网卡,其他数据使用无线网卡。
步骤6:技术人员使用远程桌面程序访问中转笔记本电脑;
步骤7:技术人员在中转笔记本电脑上的网络浏览器使用故障DTU IP地址A登录故障机的web管理界面,例如故障IP为172.30.4.5,那么使用地址172.30.4.5:8899在网络浏览器就可以访问故障机的web界面;
步骤8:使用故障机预置的账号密码登录web,进入管理界面,在管理界面打开telnet开关;
步骤9:在中转笔记本电脑打开telnet工具,连接故障机IP。例如故障IP为172.30.4.5,那么telnet连接故障机的命令为telnet 172.30.4.5;
步骤10:telnet连接上故障机后,可以通过命令获取到设备的历史故障信息,也可以进行实时调试,用于软件的优化改进。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (8)

1.一种物联网内的5G DTU故障自动恢复方法,其特征在于,包括:
设备侧的系统快照、故障检测、故障恢复、故障信息保存和上传,服务器侧的故障信息管理以及对物联网内设备进行远程调试;其中:
系统快照包括设备在部署后系统第一次检测到设备运行正常,把系统当前状态的所有数据都记录到一个文件里,后续如果系统出现故障无法恢复,使用系统快照功能把系统还原为某个时间点的状态;
故障检测包括通过周期性检测设备的网络连通性、拨号状态、SIM卡状态、gps信息发现异常,通过检测程序确认为故障发生;
故障恢复包括通过重新拨号、重启5G模组协议栈、重启5G模组、重置SIM卡、系统快照恢复,实现设备故障恢复;
故障信息保存和上传包括在程序确认故障发生后,保存设备当前所有参数、状态、程序运行信息到硬盘,当故障恢复系统生效后,设备网络恢复正常,自动把故障信息上传到物联网中的设备管理服务器;
故障信息管理包括接收DTU的故障上报信息并进行整理归纳;
对物联网内设备进行远程调试包括让技术人员在互联网侧远程接入到物联网内的设备,进行远程调试。
2.根据权利要求1所述的物联网内的5G DTU故障自动恢复方法,其特征在于,所述系统快照包括系统快照生效流程和系统快照恢复流程;
系统快照生效具体包括以下步骤:
步骤1、新设备部署预置了检测标记,或者通过WEB页面设置检测标记,触发检测流程;
步骤2、检测设备5G注网是否正常,是则执行步骤3,否则继续执行步骤2;
步骤3、检测设备访问服务器是否正常,是则执行步骤4,否则执行步骤2;
步骤4、检测设备两个LAN侧下挂设备网络是否正常,是则执行步骤5,否则执行步骤2;
步骤5、获取系统当前各种参数,保存到文件/data/system_snapshot_data中;
步骤6、退出检测流程,删除标记让检测流程不再触发;
系统快照恢复具体包括以下步骤:
步骤1、由其他检测程序触发系统快照恢复功能;
步骤2、系统重启;
步骤3、启动过程中读取/data/system_snapshot_data文件中的参数配置系统参数;
步骤4、系统恢复为快照时的状态。
3.根据权利要求1所述的物联网内的5G DTU故障自动恢复方法,其特征在于,网络连通性故障检测和恢复具体包括以下步骤:
步骤1、循环60秒一次进行网络连通性故障检测;
步骤2、ping主服务器地址3次,成功继续步骤1检测循环,失败执行步骤3;
步骤3、ping备用服务器地址3次,成功继续步骤1检测循环,失败执行步骤4;
步骤4、保存设备故障信息;
步骤5、检测是否重启了5G协议栈3次,否则执行步骤6,是则执行步骤7;
步骤6、发送“at+cfun=0”和“at+cfun=1”命令到5G模组重启5G协议栈,重启后继续步骤1检测循环;
步骤7、检测是否重启了5G模组3次,否的话执行步骤8,是的话执行步骤9;
步骤8、发送“reboot”命令重启5G模组,重启后继续步骤1检测循环;
步骤9、发送“reset”命令执行系统快照恢复,恢复后继续步骤1检测循环。
4.根据权利要求1所述的物联网内的5G DTU故障自动恢复方法,其特征在于,拨号故障检测和恢复具体包括以下步骤:
步骤1、循环60秒一次进行拨号故障检测;
步骤2、发送“at+gtrndis?”命令到5G模组检测设备是否获取到IP,是继续步骤1检测循环,否执行步骤3;
步骤3、检测是否手动拨号了3次,否执行步骤4,是执行步骤5;
步骤4、发送“at+gtrndis=1,1”到5G模组执行手动拨号,然后继续步骤1检测循环;
步骤5、保存设备故障信息;
步骤6、检测是否重启了5G协议栈3次,否的话执行步骤7,是的话执行步骤8;
步骤7、发送“at+cfun=0”和“at+cfun=1”命令到5G模组重启5G协议栈,重启后继续步骤1检测循环;
步骤8、检测是否重启了5G模组3次,否则执行步骤9,是则执行步骤10;
步骤9、发送“reboot”命令重启5G模组,重启后继续步骤1检测循环;
步骤10、发送“reset”命令执行系统快照恢复,恢复后继续步骤1检测循环。
5.根据权利要求1所述的物联网内的5G DTU故障自动恢复方法,其特征在于,SIM卡故障检测和恢复具体包括以下步骤:
步骤1、循环60秒一次进行SIM卡故障检测;
步骤2、发送“at+cpin?”命令检测SIM卡是否正常,返回READY是正常,否则为异常,正常继续步骤1检测循环,异常执行步骤3;
步骤3、检测SIM异常次数是否达到10次,没有达到再次执行步骤2,达到了执行步骤4;
步骤4、保存故障数据,用于优化软件提供依据;
步骤5、检测是否重置SIM卡3次,否执行步骤6,是执行步骤7;
步骤6、发送命令“at+gtdualsim=1”和“at+gtdualsim=0”重置SIM卡,然后执行步骤2继续检测;
步骤7、检测是否重启了5G模组3次,否则执行步骤8,是则执行步骤9;
步骤8、发送“reboot”命令重启5G模组,重启后继续步骤1检测循环;
步骤9、发送“reset”命令执行系统快照恢复,恢复后继续步骤1检测循环。
6.根据权利要求1所述的物联网内的5G DTU故障自动恢复方法,其特征在于,gps故障检测和恢复具体包括以下步骤:
步骤1、200秒一次进行gps故障检测;
步骤2、发送命令“at+gtgps?”到5G模组,获取gps定位信息,能够获取继续检测循环,不能获取执行步骤3;
步骤3、检查是否获取gps定位信息失败了3次,没有3次继续步骤1检测循环,到达3次执行步骤4;
步骤4、保存故障数据,用于优化软件提供依据;
步骤5、检查是否重启5G模组3次,否执行步骤6,是执行步骤7;
步骤6、发送“reboot”命令重启5G模组,重启后继续步骤1检测循环;
步骤7、发送“reset”命令执行系统快照恢复,恢复后继续步骤1检测循环。
7.根据权利要求1所述的物联网内的5G DTU故障自动恢复方法,其特征在于,故障信息管理具体包括以下步骤:
步骤1、DTU开机;
步骤2、检测网络是否正常,正常执行步骤3;
步骤3、检查是否有故障信息,是执行步骤4;
步骤4、上传故障信息;
步骤5、检测上传是否成功,成功执行步骤6;
步骤6、删除故障信息;
步骤7、服务器接收上传的故障信息并保存;
步骤8、技术人员访问服务器获取保存的故障信息。
8.根据权利要求1所述的物联网内的5G DTU故障自动恢复方法,其特征在于,对物联网内设备进行远程调试包括运维人员携带中转5G DTU、5G物联网SIM卡、网线、中转笔记本电脑、运维手机、TYPC-C电源线在故障机的物联网5G信号范围内搭建远程调试环境,通过中转笔记本电脑进行跨网络通讯,具体包括以下步骤:
步骤1:通过TYPE-C电源线,以笔记本电脑为电源,给5G DTU供电,把5G物联网SIM卡插入5G DTU,实现5G DTU连接对应物联网;
步骤2、运维手机通过4G/5G蜂窝网络连接到互联网,开启手机热点共享;
步骤3、笔记本电脑网线连接5G DTU,获取到一个有线IP A,为物联网内的地址;
步骤4、笔记本电脑使用WIFI连接手机热点,获取到一个无线IP B,为互联网内的地址;
步骤5、笔记本电脑配置路由规则;
步骤6、运维人员使用远程桌面程序访问中转笔记本电脑;
步骤7、运维人员在中转笔记本电脑上的网络浏览器使用故障DTU IP地址A登录故障机的web管理界面;
步骤8、使用故障机预置的账号密码登录web,进入管理界面,在管理界面打开telnet开关;
步骤9、在中转笔记本电脑打开telnet工具,连接故障机IP;
步骤10、telnet连接上故障机后,通过命令获取到设备的历史故障信息,或进行实时调试,用于软件的优化改进。
CN202111188269.3A 2021-10-12 2021-10-12 物联网内的5g dtu故障自动恢复方法 Active CN113923615B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111188269.3A CN113923615B (zh) 2021-10-12 2021-10-12 物联网内的5g dtu故障自动恢复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111188269.3A CN113923615B (zh) 2021-10-12 2021-10-12 物联网内的5g dtu故障自动恢复方法

Publications (2)

Publication Number Publication Date
CN113923615A true CN113923615A (zh) 2022-01-11
CN113923615B CN113923615B (zh) 2023-06-02

Family

ID=79239457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111188269.3A Active CN113923615B (zh) 2021-10-12 2021-10-12 物联网内的5g dtu故障自动恢复方法

Country Status (1)

Country Link
CN (1) CN113923615B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140108344A1 (en) * 2011-09-23 2014-04-17 Hybrid Logic Ltd System for live-migration and automated recovery of applications in a distributed system
WO2014059843A1 (zh) * 2012-10-17 2014-04-24 中兴通讯股份有限公司 用于物联网网关的故障排除方法及系统
US20150149814A1 (en) * 2013-11-27 2015-05-28 Futurewei Technologies, Inc. Failure recovery resolution in transplanting high performance data intensive algorithms from cluster to cloud
US20170063605A1 (en) * 2015-08-26 2017-03-02 Tatung Company Fail recovery method and internet of things system and charging system using the same
KR102047848B1 (ko) * 2019-09-09 2019-11-22 주식회사 씨엔와이더스 IoT 제어 네트워크의 장애 복구 방법 및 그 시스템
CN211019257U (zh) * 2020-01-13 2020-07-14 深圳市创兴物联科技有限公司 一种物联网网关系统
CN111431057A (zh) * 2020-04-26 2020-07-17 江苏恒新源电气有限公司 一体化智能环网柜系统、智能配电网及故障定位方法
WO2020156559A1 (zh) * 2019-02-03 2020-08-06 华为技术有限公司 一种数据传输方法、网络设备和终端设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140108344A1 (en) * 2011-09-23 2014-04-17 Hybrid Logic Ltd System for live-migration and automated recovery of applications in a distributed system
WO2014059843A1 (zh) * 2012-10-17 2014-04-24 中兴通讯股份有限公司 用于物联网网关的故障排除方法及系统
US20150149814A1 (en) * 2013-11-27 2015-05-28 Futurewei Technologies, Inc. Failure recovery resolution in transplanting high performance data intensive algorithms from cluster to cloud
US20170063605A1 (en) * 2015-08-26 2017-03-02 Tatung Company Fail recovery method and internet of things system and charging system using the same
WO2020156559A1 (zh) * 2019-02-03 2020-08-06 华为技术有限公司 一种数据传输方法、网络设备和终端设备
KR102047848B1 (ko) * 2019-09-09 2019-11-22 주식회사 씨엔와이더스 IoT 제어 네트워크의 장애 복구 방법 및 그 시스템
CN211019257U (zh) * 2020-01-13 2020-07-14 深圳市创兴物联科技有限公司 一种物联网网关系统
CN111431057A (zh) * 2020-04-26 2020-07-17 江苏恒新源电气有限公司 一体化智能环网柜系统、智能配电网及故障定位方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李?;: "5G时代配电网自动化的建设与运行管理", 中国高新科技 *
赵炳弟;: "物联网M2M网关剖析", 电信技术 *

Also Published As

Publication number Publication date
CN113923615B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
US11770314B2 (en) Methods and apparatus for capturing and/or using packets to facilitate fault detection
US10609575B2 (en) Method and apparatus for monitoring and adjusting multiple communication services at a venue
US20230362051A1 (en) Control Plane Device Switching Method and Apparatus, and Forwarding-Control Separation System
US8997092B2 (en) Method, system, and computer readable medium for provisioning and remote distribution
CN100553213C (zh) 一种wlan异常快速恢复的方法及设备
CN101184309A (zh) 直放站设备嵌入式系统远程升级方法
CN108429629A (zh) 设备故障恢复方法和装置
CN111953542B (zh) 一种保障网关稳定运行的系统
CN110460462A (zh) 双网络路由器控制系统及双网络路由器
CN108174400B (zh) 一种终端设备的数据处理方法及系统、设备
CN105630647A (zh) 一种设备检测方法及检测设备
CN113923615B (zh) 物联网内的5g dtu故障自动恢复方法
CN108174398B (zh) 一种终端设备的数据处理方法及系统、设备
CN101958925A (zh) 一种控制远程设备的方法以及装置
US10405223B1 (en) System and methods for intelligent reset delay for cell sites in a network
CN116133021A (zh) 基于linux板卡的无线网卡自管理流程
FI129590B (en) Method and equipment for detecting and remedying a fault in a fixed data transmission connection
CN107920347B (zh) 一种终端设备的数据处理方法及系统、设备
KR100830831B1 (ko) 인터넷서비스 품질의 측정방법 및 그 장치
CN108289309B (zh) 一种终端设备的数据处理方法及系统、设备
JP4854650B2 (ja) 監視方法、情報処理装置及びプログラム
CN115038106A (zh) 无线网关断网逃生方法、系统、电子设备及存储介质
CN117641327A (zh) 网络连接方法、电子设备及计算机可读存储介质
CN116844087A (zh) 操作系统的监控方法、装置以及bmc
CN113873456A (zh) 远程监控方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant