CN102088470A - 通信系统中文件传输协议死锁检测及自恢复的方法与装置 - Google Patents
通信系统中文件传输协议死锁检测及自恢复的方法与装置 Download PDFInfo
- Publication number
- CN102088470A CN102088470A CN2009102543054A CN200910254305A CN102088470A CN 102088470 A CN102088470 A CN 102088470A CN 2009102543054 A CN2009102543054 A CN 2009102543054A CN 200910254305 A CN200910254305 A CN 200910254305A CN 102088470 A CN102088470 A CN 102088470A
- Authority
- CN
- China
- Prior art keywords
- ftp
- socket
- deadlock
- formation
- heartbeat detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/40—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Environmental & Geological Engineering (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computer Security & Cryptography (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Multimedia (AREA)
- Computer And Data Communications (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种文件传输协议(FTP)死锁检测及自恢复的方法及装置,以应对FTP上传操作中突发性死锁问题。该方法为:守护进程通过心跳检测机制确定FTP上传任务发生死锁,则在套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中。
Description
技术领域
本发明涉及通信技术领域中文件传输协议(FTP)技术,特别是指一种通信系统中FTP死锁检测及自恢复的方法与装置。
背景技术
在移动通信设备中,从基站设备采集的数据包括基站性能数据、每路呼叫详细信息数据、告警数据及基带抓帧数据等,具有量大、实时、持续等特性。基站通过以太网与操作维护中心(OMC)相连,采用数据吞吐量大的FTP协议上传数据成为首选。由于复杂的以太网网络环境及风河vxWorks实时操作系统中FTP底层协议处理不稳定,FTP上传操作突发性出现关闭(close)、写(write)、读(read)、选择(select)异常死锁或假死现象,其表现Socket资源(控制连接、数据连接套节字)无法在操作系统允许的操作时间内释放退出本次系统调度,导致实时操作系统进程调度失控,单板复位,严重影响了基站设备的健壮性,因此对FTP操作死锁检测及其死锁恢复处理变得十分重要。
在进程死锁检测方面,专利《一种信号量死锁的检测方法》[CN200510053781]描述了通过建立进程和信号量关系对列表,再根据是否存在资源等待环路判断条件检测出是否发生信号量死锁,从而得到发送死锁的信号量与之对应的进程。其存在的缺点是:需要出现资源等待环路才能判断出死锁,对于FTP上传操作而言,受网络环境因素影响进程突发性表现为假死状态的情形无法检测。
发明内容
本发明提供一种通信系统中FTP死锁检测及自恢复的方法与装置,用以应对FTP上传操作中突发性死锁问题。
本发明实施例提供的一种通信系统中FTP死锁检测及自恢复的方法包括以下步骤:
守护进程通过心跳检测机制确定FTP上传任务发生死锁,则在套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;
判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中。
守护进程通过心跳检测机制确定FTP上传任务发生死锁,可以包括:
A1.在初始化完成后,守护进程周期发送心跳检测消息给FTP上传任务,在一定时间内判断是否收到心跳检测消息的响应消息,如果是,将心跳检测定时器清零,返回步骤A1;否则,执行步骤A2;
A2.将心跳检测计数器加1,判断心跳检测计数器是否大于预设值,如果是,确定FTP上传任务发生死锁,否则,执行步骤A1。
在确定FTP上传任务发生死锁之后,该方法可以进一步包括:
守护进程清空心跳计数器,返回步骤A1,在下一周期发起心跳检测。
守护进程所属的任务优先级高于FTP上传任务优先级。
所述套接字资源包括数据连接套节字,和/或控制连接套节字。
本发明实施例提供的一种通信系统中FTP死锁检测及自恢复的装置包括:
心跳发起检测模块,用于通过心跳检测机制确定FTP上传任务是否发生死锁;
缓冲队列管理模块,用于在分配的套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中。
所述心跳发起检测模块可以包括:
发送模块,用于周期发送心跳检测消息给FTP上传任务;
判断模块,用于在一定时间内判断是否收到心跳检测消息的响应消息,如果是,将心跳检测定时器清零,通知发送模块周期发送心跳检测消息给FTP上传任务;否则,将心跳检测计数器加1,判断心跳检测计数器是否大于预设值,如果是,确定FTP上传任务发生死锁,否则,周期发送心跳检测消息给FTP上传任务。
所述缓冲队列管理模块,可以进一步用于确定FTP上传任务发生死锁之后,通知判断模块清空心跳计数器。
守护进程所属的任务优先级高于FTP上传任务优先级。
所述套接字资源包括数据连接,和/或控制连接套节字。
本发明实施例提供的一种FTP死锁检测及其自恢复的系统,包括:
守护进程单元,用于通过心跳检测机制确定FTP上传任务发生死锁,则在分配的套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中;
FTP上传任务单元,用于守护进程单元的心跳检测返回心跳响应,并从守护进程获取数据,与FTP建立连接,将获取的数据上传给FTP服务器;
套接字资源循环队列模块,用于存储每次死锁时FTP操作使用的套接字资源;
FTP服务器,用于接收FTP上传任务上传的数据。
本发明实施例通过引入心跳检测机制以检测死锁、发生死锁时的套接字资源循队列延迟释放套接字资源及自恢复等方法。本实施例的方案应对FTP上传操作中突发性死锁采取心跳机制检测并自恢复,以减少基站单板异常复位,增强基站设备运行的稳定性及减少突发状况时对系统CPU冲击的影响。
附图说明
图1为本发明实施例的FTP死锁检测及自恢复的方法的流程示意图;
图2为本发明实施例的FTP上传死锁检测自恢复系统的结构示意图;
图3是本发明实施例的心跳检测与自恢复流程示意图;
图4是本发明实施例的FTP上传任务初始化及数据上传流程示意图;
具体实施方式
参见图1所示,本发明实施例的FTP死锁检测及自恢复的方法包括以下步骤:
步骤101:守护进程通过心跳检测机制确定FTP上传任务发生死锁,则在分配的套接字(Socket)资源循环队列中的存储位置,记录FTP操作使用的Socket资源,并启动FTP上传任务杀死流程。
这里,在初始化完成后,守护进程通过心跳检测机制确定FTP上传任务发生死锁可以这样实现:
A1.守护进程周期发送心跳检测消息给FTP上传任务,在一定时间内判断是否收到心跳检测消息的响应消息(ACK),如果是,将心跳检测定时器清零,返回步骤A1;否则,执行步骤A2;
A2.将心跳检测计数器加1,判断心跳检测计数器是否大于预设值,如果是,确定FTP上传任务发生死锁,否则,执行步骤A1。
在确定FTP上传任务发生死锁之后,守护进程可以清空心跳计数器,返回步骤A1,在下一周期发起心跳检测。
所述Socket资源可以包括数据连接套节字,和/或控制连接套节字。
步骤102:判断Socket资源循环队列是否已满,如果未满,则执行步骤103,,否则,执行步骤104。
步骤103:将本次死锁占用的Socket信息压入Socket资源循环队列中,结束。
步骤104:释放Socket资源循环队列中最早的Socket资源,并将本次死锁占用的Socket信息压入Socket资源循环队列中。
在确定FTP上传任务发生死锁之后,守护进程可以清空心跳计数器,以便在下一周期发起心跳检测。守护进程所属的任务优先级高于FTP上传任务优先级。
参见图2所示,本发明实施例中FTP上传自检测与自恢复装置包括:守护进程单元21、FTP上传任务单元22、Socket资源循环队列模块23以及FTP服务器24。
守护进程单元21包含收集数据消息接口,心跳发起检测功能,死锁判决恢复功能,FTP Socket资源管理功能。FTP上传任务单元22,其中包含与FTP服务器建立控制连接与数据连接并上传数据FTP基本操作,心跳响应功能。Socket资源循环队列模块23,用于存储每次突发性死锁时使用的FTP控制连接、数据连接套节字资源。FTP服务器24,用于接收FTP上传数据。
FTP上传任务单元,包括心跳ACK模块、Socket资源恢复时读取操作时保存模块、FTP上传;心跳ACK根据心跳发起及检测发起的心跳检测消息直接反馈,如果此时FTP上传正在执行过程中,则心跳ACK无法得到调度而无法反馈心跳检测消息;Socket资源读写每次初始化时根据Socket资源循环缓存管理模块读取的历史最早的FTP死锁Socket资源相关套节字信息采取延迟释放,FTP上传模块读取数据接收消息接口保存的数据,并与FTP服务器建立连接,同时保存Socket资源相关套节字信息写入到Socket资源循环缓存管理模块指派的队列节点中。
详细的说,守护进程单元21,用于通过心跳检测机制确定FTP上传任务发生死锁,则在分配的Socket资源循环队列中的存储位置记录FTP操作使用的Socket资源,并启动FTP上传任务杀死流程;判断Socket资源循环队列是否已满,如果未满,则将本次死锁占用的Socket信息压入Socket资源循环队列中,否则,释放Socket资源循环队列中最早的Socket资源,并将本次死锁占用的Socket信息压入Socket资源循环队列中。
FTP上传任务单元22,用于守护进程单元的心跳检测返回心跳响应,并从守护进程获取数据,与FTP建立连接,将获取的数据上传给FTP服务器。
Socket资源循环队列模块23,用于存储每次死锁时FTP操作使用的Socket资源。
FTP服务器24,用于接收FTP上传任务上传的数据。
守护进程单元21,对应与本发明实施例的FTP死锁检测及其自恢复的装置,包括:心跳发起检测模块和缓冲队列管理模块。
心跳发起检测模块,用于通过心跳检测机制确定FTP上传任务是否发生死锁;
缓冲队列管理模块,用于在分配的Socket资源循环队列中的存储位置记录FTP操作使用的Socket资源,并启动FTP上传任务杀死流程;判断Socket资源循环队列是否已满,如果未满,则将本次死锁占用的Socket信息压入Socket资源循环队列中,否则,释放Socket资源循环队列中最早的Socket资源,并将本次死锁占用的Socket信息压入Socket资源循环队列中。
所述心跳发起检测模块包括:发送模块和判断模块。发送模块,用于周期发送心跳检测消息给FTP上传任务;判断模块,用于在一定时间内判断是否收到心跳检测消息的ACK,如果是,将心跳检测定时器清零,通知发送模块周期发送心跳检测消息给FTP上传任务;否则,将心跳检测计数器加1,判断心跳检测计数器是否大于预设值,如果是,确定FTP上传任务发生死锁,否则,周期发送心跳检测消息给FTP上传任务。
所述缓冲队列管理模块212,可以进一步用于确定FTP上传任务发生死锁之后,通知判断模块清空心跳计数器。
守护进程所属的任务优先级高于FTP上传任务优先级。
参见图3所示,本发明实施例的心跳检测与自恢复的具体过程如下:
步骤301:守护进程单元初始化时启动心跳检测定时器。
步骤302:守护进程单元周期发起心跳检测消息到FTP上传任务。
步骤303:守护进程单元判断是否收到上次心跳检测消息的ACK,如果收到,则执行步骤308,如果没有收到上次ACK消息,则执行步骤304:
步骤304:将心跳失败计数器加1。
步骤305:守护进程单元对心跳计数器的累加值进行判断,判断是否超过预设值N,如果不大于,则返回301,以等待下一个周期发起心跳检测;如果大于预设值N,则执行步骤306。
步骤306:启动FTP上传任务杀死流程。
步骤307:守护进程单元从Socket资源循环队列中分配新的存取位置,重新初始化FTP上传任务,并清空心跳失败计数器,返回到301,以等待下一个周期发起心跳检测,结束。
步骤308:心跳计时器清零,再返回到301等待下一个周期发起心跳检测。
如图4所示,本发明的FTP上传任务初始化及数据上传流程如下:
步骤401:守护进程在初始化或死锁发生恢复时触发FTP上传任务初始化流程401。
步骤402:FTP上传任务判断Socket资源循环队列是否已满402,如果否,执行步骤404,否则,执行步骤403。
步骤403:释放历史最早Socket套节字资源,用于保存本次生命周期的套节字信息。
步骤404:从Socket资源循环队列中获取空闲Socket资源节点的位置用于保存本次生命周期的套节字信息,FTP上传任务初始化工作完成。
步骤405:检测是否有数据需要上传405,如果没有等待上传数据收集完成,如果有,执行步骤406,否则,执行步骤407。
步骤406:与FTP服务器建立连接,同时将本次FTP操作的Socket套节字信息压入Socket资源循环队列。
步骤407:启动数据上报操作,上传完成后进入步骤405,完成本次数据FTP上传。其中整个FTP上传任务生命周期中一直受到守护进程的心跳消息检测监控。
本实施例的方案与现有技术相比较,引入了心跳机制检测死锁、死锁Socket资源循队列延迟释放Socket资源及自恢复等方法。并且心跳守护机制检测死锁可据不同的判别死锁策略(如:修改N值)对其进行监控,而非出现信号量等待环路作为唯一判别,提高了基站设备应对突发性FTP死锁处理的灵活性,减少异常时单板复位,提高系统稳定性;延后释放死锁时的控制连接、数据连接socket资源,减少了突发异常的可能性,基站系统中socket资源总体占用数得到保证,避免socket资源使用溢出;同时不会因为FTP操作异常时而导致守护进程数据接收调度异常,减少守护进程所在任务的所有进程消息积压风险,对单板CPU利用率冲高有缓解作用。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种文件传输协议FTP死锁检测及自恢复的方法,其特征在于,该方法包括以下步骤:
守护进程通过心跳检测机制确定FTP上传任务发生死锁,则在套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;
判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中。
2.根据权利要求1所述的方法,其特征在于,守护进程通过心跳检测机制确定FTP上传任务发生死锁,包括:
A1.守护进程周期发送心跳检测消息给FTP上传任务,在一定时间内判断是否收到心跳检测消息的响应消息,如果是,将心跳检测定时器清零,返回步骤A1;否则,执行步骤A2;
A2.将心跳检测计数器加1,判断心跳检测计数器是否大于预设值,如果是,确定FTP上传任务发生死锁,否则,执行步骤A1。
3.根据权利要求2所述的方法,其特征在于,在确定FTP上传任务发生死锁之后,该方法进一步包括:
守护进程清空心跳计数器,返回步骤A1,在下一周期发起心跳检测。
4.根据权利要求1所述的方法,其特征在于,守护进程所属的任务优先级高于FTP上传任务优先级。
5.根据权利要求1所述的方法,其特征在于,所述套接字资源包括数据连接套节字,和/或控制连接套节字。
6.一种文件传输协议FTP死锁检测及自恢复的装置,其特征在于,包括:
心跳发起检测模块,用于通过心跳检测机制确定FTP上传任务是否发生死锁;
缓冲队列管理模块,用于在分配的套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中。
7.根据权利要求6所述的装置,其特征在于,所述心跳发起检测模块包括:
发送模块,用于周期发送心跳检测消息给FTP上传任务;
判断模块,用于在一定时间内判断是否收到心跳检测消息的响应消息,如果是,将心跳检测定时器清零,通知发送模块周期发送心跳检测消息给FTP上传任务;否则,将心跳检测计数器加1,判断心跳检测计数器是否大于预设值,如果是,确定FTP上传任务发生死锁,否则,周期发送心跳检测消息给FTP上传任务。
8.根据权利要求7所述的装置,其特征在于,所述缓冲队列管理模块,进一步用于确定FTP上传任务发生死锁之后,通知判断模块清空心跳计数器。
9.根据权利要求6所述的装置,其特征在于,所述套接字资源包括数据连接套节字,和/或控制连接套节字。
10.一种FTP死锁检测及自恢复的系统,其特征在于,包括:
守护进程单元,用于通过心跳检测机制确定FTP上传任务发生死锁,则在分配的套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中;
FTP上传任务单元,用于守护进程单元的心跳检测返回心跳响应,并从守护进程获取数据,与FTP建立连接,将获取的数据上传给FTP服务器;
套接字资源循环队列模块,用于存储每次死锁时FTP操作使用的套接字资源;
FTP服务器,用于接收FTP上传任务上传的数据。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910254305.4A CN102088470B (zh) | 2009-12-07 | 2009-12-07 | 通信系统中文件传输协议死锁检测及自恢复的方法与装置 |
PCT/CN2010/073194 WO2010148882A1 (zh) | 2009-12-07 | 2010-05-25 | 文件传输协议死锁检测及自恢复的方法与装置 |
US13/258,312 US9009710B2 (en) | 2009-12-07 | 2010-05-25 | Detecting deadlocked file transfer protocol upload connections and performing session self-recovery using information stored in a FIFO resource array |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910254305.4A CN102088470B (zh) | 2009-12-07 | 2009-12-07 | 通信系统中文件传输协议死锁检测及自恢复的方法与装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102088470A true CN102088470A (zh) | 2011-06-08 |
CN102088470B CN102088470B (zh) | 2014-03-05 |
Family
ID=43385964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910254305.4A Expired - Fee Related CN102088470B (zh) | 2009-12-07 | 2009-12-07 | 通信系统中文件传输协议死锁检测及自恢复的方法与装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9009710B2 (zh) |
CN (1) | CN102088470B (zh) |
WO (1) | WO2010148882A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609324A (zh) * | 2012-01-09 | 2012-07-25 | 华为技术有限公司 | 一种虚拟机死锁后的恢复方法、装置及系统 |
CN110673942A (zh) * | 2019-09-29 | 2020-01-10 | 北京浪潮数据技术有限公司 | 一种云平台的异步进程结束方法、装置及云平台服务器 |
CN111158920A (zh) * | 2019-12-06 | 2020-05-15 | 中山市奥珀金属制品有限公司 | 一种移动系统的进程数据读写优化方法及系统 |
CN111538599A (zh) * | 2020-04-23 | 2020-08-14 | 杭州涂鸦信息技术有限公司 | 一种基于linux的多线程死锁问题定位方法及系统 |
CN112905372A (zh) * | 2021-02-02 | 2021-06-04 | 浙江大华技术股份有限公司 | 线程的异常诊断方法及装置 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5687173B2 (ja) * | 2011-11-15 | 2015-03-18 | 株式会社日立製作所 | 通信システム及び方法、ハートビート代行サーバ |
US9705686B2 (en) * | 2013-08-22 | 2017-07-11 | Red Hat, Inc. | Measuring resource consumption in a multi-tenant platform-as-a-service (PaaS) system |
US9720810B2 (en) | 2014-12-09 | 2017-08-01 | Google Inc. | Device cloud monitoring and stability |
US10069785B2 (en) | 2015-06-05 | 2018-09-04 | Apple Inc. | Network messaging for paired devices |
US9760494B2 (en) | 2015-06-24 | 2017-09-12 | International Business Machines Corporation | Hybrid tracking of transaction read and write sets |
US9858189B2 (en) * | 2015-06-24 | 2018-01-02 | International Business Machines Corporation | Hybrid tracking of transaction read and write sets |
US10547559B2 (en) * | 2015-12-26 | 2020-01-28 | Intel Corporation | Application-level network queueing |
US10084678B2 (en) | 2016-04-19 | 2018-09-25 | International Business Machines Corporation | Managing connections for data communications using heartbeat messaging |
CN105955779B (zh) * | 2016-05-03 | 2020-06-09 | 深圳Tcl数字技术有限公司 | 进程关闭方法及装置 |
US10827001B2 (en) | 2016-07-27 | 2020-11-03 | International Business Machines Corporation | Managing connections for data communications |
CN106254179B (zh) * | 2016-08-05 | 2020-07-24 | 深圳先进技术研究院 | 一种心跳包异步控制方法及装置 |
US10528400B2 (en) * | 2017-06-05 | 2020-01-07 | International Business Machines Corporation | Detecting deadlock in a cluster environment using big data analytics |
US10742747B2 (en) | 2017-07-06 | 2020-08-11 | International Business Machines Corporation | Managing connections for data communications following socket failure |
US10778506B1 (en) | 2017-11-30 | 2020-09-15 | Open Invention Network Llc | Coordinated switch of activity in virtual network function components |
CN112351069A (zh) * | 2020-09-30 | 2021-02-09 | 银盛通信有限公司 | 一种自动化数据上传和维护传输稳定性的系统及方法 |
CN112887173B (zh) * | 2021-02-19 | 2023-05-23 | 山东英信计算机技术有限公司 | 一种存储网络检测方法、装置、设备及可读存储介质 |
CN113965561B (zh) * | 2021-10-20 | 2023-08-25 | 中电科航空电子有限公司 | 一种基于异步事件驱动的机载文件传输系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030204641A1 (en) * | 2002-04-30 | 2003-10-30 | Microsoft Corporation | Programming model for concurrent programs |
US20050021915A1 (en) * | 2003-07-21 | 2005-01-27 | Darryn Lowe | Managing storage of items across a network of heterogeneous storage devices |
CN1904852A (zh) * | 2006-08-01 | 2007-01-31 | 西安西电捷通无线网络通信有限公司 | 一种计算机应用程序的监控及异常处理方法 |
CN101272402A (zh) * | 2008-05-14 | 2008-09-24 | 深圳市同洲电子股份有限公司 | 一种数据传输的方法、装置及系统 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6763479B1 (en) * | 2000-06-02 | 2004-07-13 | Sun Microsystems, Inc. | High availability networking with alternate pathing failover |
US6609213B1 (en) * | 2000-08-10 | 2003-08-19 | Dell Products, L.P. | Cluster-based system and method of recovery from server failures |
US6871296B2 (en) * | 2000-12-29 | 2005-03-22 | International Business Machines Corporation | Highly available TCP systems with fail over connections |
US7433943B1 (en) * | 2001-12-20 | 2008-10-07 | Packeteer, Inc. | Volume-based network management scheme |
US7076555B1 (en) * | 2002-01-23 | 2006-07-11 | Novell, Inc. | System and method for transparent takeover of TCP connections between servers |
US7152111B2 (en) * | 2002-08-15 | 2006-12-19 | Digi International Inc. | Method and apparatus for a client connection manager |
US7224692B2 (en) * | 2002-09-04 | 2007-05-29 | Broadcom Corporation | System and method for fault tolerant TCP offload |
US7260066B2 (en) * | 2002-10-31 | 2007-08-21 | Conexant Systems, Inc. | Apparatus for link failure detection on high availability Ethernet backplane |
WO2004070568A2 (en) * | 2003-01-31 | 2004-08-19 | Viair, Inc. | Asynchronous real-time retrieval of data |
US7159234B1 (en) * | 2003-06-27 | 2007-01-02 | Craig Murphy | System and method for streaming media server single frame failover |
US8244880B2 (en) * | 2003-10-22 | 2012-08-14 | International Business Machines Corporation | Connection management method, system, and program product |
US8572249B2 (en) * | 2003-12-10 | 2013-10-29 | Aventail Llc | Network appliance for balancing load and platform services |
EP1758316B1 (en) * | 2004-06-14 | 2014-12-24 | Huawei Technologies Co., Ltd. | Method for ensuring reliability in a network including a separate bearer control layer |
US7962623B2 (en) * | 2004-06-30 | 2011-06-14 | Microsoft Corporation | Sustaining session connections |
US7903546B2 (en) * | 2005-01-14 | 2011-03-08 | Cisco Technology, Inc. | Detecting unavailable network connections |
US7886295B2 (en) * | 2005-02-17 | 2011-02-08 | International Business Machines Corporation | Connection manager, method, system and program product for centrally managing computer applications |
CN100337207C (zh) | 2005-03-11 | 2007-09-12 | 华为技术有限公司 | 一种信号量死锁的检测方法 |
US7594020B2 (en) * | 2005-05-31 | 2009-09-22 | Microsoft Corporation | Re-establishing a connection for an application layer via a service layer |
US20070005773A1 (en) * | 2005-05-31 | 2007-01-04 | Microsoft Corporation | Re-establishing a connection for an application layer via a service layer using delay |
US7831686B1 (en) * | 2006-03-31 | 2010-11-09 | Symantec Operating Corporation | System and method for rapidly ending communication protocol connections in response to node failure |
US20070288645A1 (en) * | 2006-06-08 | 2007-12-13 | International Business Machines Corporation | Method and System for Persistent and Reliable Data Transmission |
US8031617B2 (en) * | 2006-07-28 | 2011-10-04 | Hewlett-Packard Development Company, L.P. | Fast detection of path failure for TCP |
US7533178B2 (en) * | 2006-10-31 | 2009-05-12 | Cisco Technology, Inc. | Resuming a computing session when rebooting a computing device |
US8166156B2 (en) * | 2006-11-30 | 2012-04-24 | Nokia Corporation | Failure differentiation and recovery in distributed systems |
US8365018B2 (en) * | 2007-06-19 | 2013-01-29 | Sand Holdings, Llc | Systems, devices, agents and methods for monitoring and automatic reboot and restoration of computers, local area networks, wireless access points, modems and other hardware |
US8132247B2 (en) * | 2007-08-03 | 2012-03-06 | Citrix Systems, Inc. | Systems and methods for authorizing a client in an SSL VPN session failover environment |
US7778191B2 (en) * | 2008-12-12 | 2010-08-17 | Mitel Networks Corporation | System and method for fast detection of communication path failures |
-
2009
- 2009-12-07 CN CN200910254305.4A patent/CN102088470B/zh not_active Expired - Fee Related
-
2010
- 2010-05-25 US US13/258,312 patent/US9009710B2/en not_active Expired - Fee Related
- 2010-05-25 WO PCT/CN2010/073194 patent/WO2010148882A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030204641A1 (en) * | 2002-04-30 | 2003-10-30 | Microsoft Corporation | Programming model for concurrent programs |
US20050021915A1 (en) * | 2003-07-21 | 2005-01-27 | Darryn Lowe | Managing storage of items across a network of heterogeneous storage devices |
CN1904852A (zh) * | 2006-08-01 | 2007-01-31 | 西安西电捷通无线网络通信有限公司 | 一种计算机应用程序的监控及异常处理方法 |
CN101272402A (zh) * | 2008-05-14 | 2008-09-24 | 深圳市同洲电子股份有限公司 | 一种数据传输的方法、装置及系统 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609324A (zh) * | 2012-01-09 | 2012-07-25 | 华为技术有限公司 | 一种虚拟机死锁后的恢复方法、装置及系统 |
CN102609324B (zh) * | 2012-01-09 | 2015-11-25 | 华为技术有限公司 | 一种虚拟机死锁后的恢复方法、装置及系统 |
CN110673942A (zh) * | 2019-09-29 | 2020-01-10 | 北京浪潮数据技术有限公司 | 一种云平台的异步进程结束方法、装置及云平台服务器 |
CN110673942B (zh) * | 2019-09-29 | 2022-06-17 | 北京浪潮数据技术有限公司 | 一种云平台的异步进程结束方法、装置及云平台服务器 |
CN111158920A (zh) * | 2019-12-06 | 2020-05-15 | 中山市奥珀金属制品有限公司 | 一种移动系统的进程数据读写优化方法及系统 |
CN111158920B (zh) * | 2019-12-06 | 2023-10-27 | 张杰辉 | 一种移动系统的进程数据读写优化方法及系统 |
CN111538599A (zh) * | 2020-04-23 | 2020-08-14 | 杭州涂鸦信息技术有限公司 | 一种基于linux的多线程死锁问题定位方法及系统 |
CN112905372A (zh) * | 2021-02-02 | 2021-06-04 | 浙江大华技术股份有限公司 | 线程的异常诊断方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2010148882A1 (zh) | 2010-12-29 |
CN102088470B (zh) | 2014-03-05 |
US20120240119A1 (en) | 2012-09-20 |
US9009710B2 (en) | 2015-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102088470B (zh) | 通信系统中文件传输协议死锁检测及自恢复的方法与装置 | |
CN101800675B (zh) | 故障监控方法、监控设备及通信系统 | |
CN100362466C (zh) | 用于管理计算机设备中的存储器容量低的方法和系统 | |
CN102263674A (zh) | 告警上报方法、系统和设备 | |
CN103229535A (zh) | 电信网络中用于单元恢复的方法和系统 | |
CN101494572A (zh) | 设备告警信息远程管理方法及系统 | |
CN101296135A (zh) | 故障信息的处理方法和装置 | |
CN101741635B (zh) | 一种同步告警信息的方法、系统及设备 | |
CN101753451A (zh) | 网络负载均衡的轨道交通信号设备状态采集方法及装置 | |
CN100464600C (zh) | 告警处理方法和后台管理装置 | |
CN102075246A (zh) | 获取光网络单元故障信息的方法、系统和光线路终端 | |
CN106331190A (zh) | Ip地址回收方法、装置及动态主机配置协议服务器 | |
CN101557602B (zh) | 一种多级网元告警同步方法及系统 | |
CN101500249B (zh) | 一种单板状态检测的实现方法 | |
CN101511098B (zh) | 一种分布式网元任务管理系统及方法 | |
CN102195824B (zh) | 数据业务系统退服告警的方法、装置及系统 | |
CN103746839B (zh) | PaaS系统和PaaS应用池中的VM节点调度方法 | |
EP2988476B1 (en) | Method and apparatus for processing operation on endpoint peripheral | |
CN1992751B (zh) | 计费短信全程监控告警系统及运行方法 | |
JP2006285453A (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
CN102958198B (zh) | Rab释放请求的异常情况处理方法及rnc | |
CN101765204A (zh) | 告警上报方法和装置 | |
CN103281209B (zh) | 一种告警信息的处理方法及设备 | |
CN101917699A (zh) | 基于用户的随机上报信令跟踪方法和装置 | |
CN101446844B (zh) | 频率转换器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140305 Termination date: 20191207 |
|
CF01 | Termination of patent right due to non-payment of annual fee |