CN102088470A - 通信系统中文件传输协议死锁检测及自恢复的方法与装置 - Google Patents

通信系统中文件传输协议死锁检测及自恢复的方法与装置 Download PDF

Info

Publication number
CN102088470A
CN102088470A CN2009102543054A CN200910254305A CN102088470A CN 102088470 A CN102088470 A CN 102088470A CN 2009102543054 A CN2009102543054 A CN 2009102543054A CN 200910254305 A CN200910254305 A CN 200910254305A CN 102088470 A CN102088470 A CN 102088470A
Authority
CN
China
Prior art keywords
ftp
socket
deadlock
formation
heartbeat detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009102543054A
Other languages
English (en)
Other versions
CN102088470B (zh
Inventor
谢星峰
刘苏建
陈华
朱平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN200910254305.4A priority Critical patent/CN102088470B/zh
Priority to PCT/CN2010/073194 priority patent/WO2010148882A1/zh
Priority to US13/258,312 priority patent/US9009710B2/en
Publication of CN102088470A publication Critical patent/CN102088470A/zh
Application granted granted Critical
Publication of CN102088470B publication Critical patent/CN102088470B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Environmental & Geological Engineering (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Security & Cryptography (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种文件传输协议(FTP)死锁检测及自恢复的方法及装置,以应对FTP上传操作中突发性死锁问题。该方法为:守护进程通过心跳检测机制确定FTP上传任务发生死锁,则在套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中。

Description

通信系统中文件传输协议死锁检测及自恢复的方法与装置
技术领域
本发明涉及通信技术领域中文件传输协议(FTP)技术,特别是指一种通信系统中FTP死锁检测及自恢复的方法与装置。
背景技术
在移动通信设备中,从基站设备采集的数据包括基站性能数据、每路呼叫详细信息数据、告警数据及基带抓帧数据等,具有量大、实时、持续等特性。基站通过以太网与操作维护中心(OMC)相连,采用数据吞吐量大的FTP协议上传数据成为首选。由于复杂的以太网网络环境及风河vxWorks实时操作系统中FTP底层协议处理不稳定,FTP上传操作突发性出现关闭(close)、写(write)、读(read)、选择(select)异常死锁或假死现象,其表现Socket资源(控制连接、数据连接套节字)无法在操作系统允许的操作时间内释放退出本次系统调度,导致实时操作系统进程调度失控,单板复位,严重影响了基站设备的健壮性,因此对FTP操作死锁检测及其死锁恢复处理变得十分重要。
在进程死锁检测方面,专利《一种信号量死锁的检测方法》[CN200510053781]描述了通过建立进程和信号量关系对列表,再根据是否存在资源等待环路判断条件检测出是否发生信号量死锁,从而得到发送死锁的信号量与之对应的进程。其存在的缺点是:需要出现资源等待环路才能判断出死锁,对于FTP上传操作而言,受网络环境因素影响进程突发性表现为假死状态的情形无法检测。
发明内容
本发明提供一种通信系统中FTP死锁检测及自恢复的方法与装置,用以应对FTP上传操作中突发性死锁问题。
本发明实施例提供的一种通信系统中FTP死锁检测及自恢复的方法包括以下步骤:
守护进程通过心跳检测机制确定FTP上传任务发生死锁,则在套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;
判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中。
守护进程通过心跳检测机制确定FTP上传任务发生死锁,可以包括:
A1.在初始化完成后,守护进程周期发送心跳检测消息给FTP上传任务,在一定时间内判断是否收到心跳检测消息的响应消息,如果是,将心跳检测定时器清零,返回步骤A1;否则,执行步骤A2;
A2.将心跳检测计数器加1,判断心跳检测计数器是否大于预设值,如果是,确定FTP上传任务发生死锁,否则,执行步骤A1。
在确定FTP上传任务发生死锁之后,该方法可以进一步包括:
守护进程清空心跳计数器,返回步骤A1,在下一周期发起心跳检测。
守护进程所属的任务优先级高于FTP上传任务优先级。
所述套接字资源包括数据连接套节字,和/或控制连接套节字。
本发明实施例提供的一种通信系统中FTP死锁检测及自恢复的装置包括:
心跳发起检测模块,用于通过心跳检测机制确定FTP上传任务是否发生死锁;
缓冲队列管理模块,用于在分配的套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中。
所述心跳发起检测模块可以包括:
发送模块,用于周期发送心跳检测消息给FTP上传任务;
判断模块,用于在一定时间内判断是否收到心跳检测消息的响应消息,如果是,将心跳检测定时器清零,通知发送模块周期发送心跳检测消息给FTP上传任务;否则,将心跳检测计数器加1,判断心跳检测计数器是否大于预设值,如果是,确定FTP上传任务发生死锁,否则,周期发送心跳检测消息给FTP上传任务。
所述缓冲队列管理模块,可以进一步用于确定FTP上传任务发生死锁之后,通知判断模块清空心跳计数器。
守护进程所属的任务优先级高于FTP上传任务优先级。
所述套接字资源包括数据连接,和/或控制连接套节字。
本发明实施例提供的一种FTP死锁检测及其自恢复的系统,包括:
守护进程单元,用于通过心跳检测机制确定FTP上传任务发生死锁,则在分配的套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中;
FTP上传任务单元,用于守护进程单元的心跳检测返回心跳响应,并从守护进程获取数据,与FTP建立连接,将获取的数据上传给FTP服务器;
套接字资源循环队列模块,用于存储每次死锁时FTP操作使用的套接字资源;
FTP服务器,用于接收FTP上传任务上传的数据。
本发明实施例通过引入心跳检测机制以检测死锁、发生死锁时的套接字资源循队列延迟释放套接字资源及自恢复等方法。本实施例的方案应对FTP上传操作中突发性死锁采取心跳机制检测并自恢复,以减少基站单板异常复位,增强基站设备运行的稳定性及减少突发状况时对系统CPU冲击的影响。
附图说明
图1为本发明实施例的FTP死锁检测及自恢复的方法的流程示意图;
图2为本发明实施例的FTP上传死锁检测自恢复系统的结构示意图;
图3是本发明实施例的心跳检测与自恢复流程示意图;
图4是本发明实施例的FTP上传任务初始化及数据上传流程示意图;
具体实施方式
参见图1所示,本发明实施例的FTP死锁检测及自恢复的方法包括以下步骤:
步骤101:守护进程通过心跳检测机制确定FTP上传任务发生死锁,则在分配的套接字(Socket)资源循环队列中的存储位置,记录FTP操作使用的Socket资源,并启动FTP上传任务杀死流程。
这里,在初始化完成后,守护进程通过心跳检测机制确定FTP上传任务发生死锁可以这样实现:
A1.守护进程周期发送心跳检测消息给FTP上传任务,在一定时间内判断是否收到心跳检测消息的响应消息(ACK),如果是,将心跳检测定时器清零,返回步骤A1;否则,执行步骤A2;
A2.将心跳检测计数器加1,判断心跳检测计数器是否大于预设值,如果是,确定FTP上传任务发生死锁,否则,执行步骤A1。
在确定FTP上传任务发生死锁之后,守护进程可以清空心跳计数器,返回步骤A1,在下一周期发起心跳检测。
所述Socket资源可以包括数据连接套节字,和/或控制连接套节字。
步骤102:判断Socket资源循环队列是否已满,如果未满,则执行步骤103,,否则,执行步骤104。
步骤103:将本次死锁占用的Socket信息压入Socket资源循环队列中,结束。
步骤104:释放Socket资源循环队列中最早的Socket资源,并将本次死锁占用的Socket信息压入Socket资源循环队列中。
在确定FTP上传任务发生死锁之后,守护进程可以清空心跳计数器,以便在下一周期发起心跳检测。守护进程所属的任务优先级高于FTP上传任务优先级。
参见图2所示,本发明实施例中FTP上传自检测与自恢复装置包括:守护进程单元21、FTP上传任务单元22、Socket资源循环队列模块23以及FTP服务器24。
守护进程单元21包含收集数据消息接口,心跳发起检测功能,死锁判决恢复功能,FTP Socket资源管理功能。FTP上传任务单元22,其中包含与FTP服务器建立控制连接与数据连接并上传数据FTP基本操作,心跳响应功能。Socket资源循环队列模块23,用于存储每次突发性死锁时使用的FTP控制连接、数据连接套节字资源。FTP服务器24,用于接收FTP上传数据。
FTP上传任务单元,包括心跳ACK模块、Socket资源恢复时读取操作时保存模块、FTP上传;心跳ACK根据心跳发起及检测发起的心跳检测消息直接反馈,如果此时FTP上传正在执行过程中,则心跳ACK无法得到调度而无法反馈心跳检测消息;Socket资源读写每次初始化时根据Socket资源循环缓存管理模块读取的历史最早的FTP死锁Socket资源相关套节字信息采取延迟释放,FTP上传模块读取数据接收消息接口保存的数据,并与FTP服务器建立连接,同时保存Socket资源相关套节字信息写入到Socket资源循环缓存管理模块指派的队列节点中。
详细的说,守护进程单元21,用于通过心跳检测机制确定FTP上传任务发生死锁,则在分配的Socket资源循环队列中的存储位置记录FTP操作使用的Socket资源,并启动FTP上传任务杀死流程;判断Socket资源循环队列是否已满,如果未满,则将本次死锁占用的Socket信息压入Socket资源循环队列中,否则,释放Socket资源循环队列中最早的Socket资源,并将本次死锁占用的Socket信息压入Socket资源循环队列中。
FTP上传任务单元22,用于守护进程单元的心跳检测返回心跳响应,并从守护进程获取数据,与FTP建立连接,将获取的数据上传给FTP服务器。
Socket资源循环队列模块23,用于存储每次死锁时FTP操作使用的Socket资源。
FTP服务器24,用于接收FTP上传任务上传的数据。
守护进程单元21,对应与本发明实施例的FTP死锁检测及其自恢复的装置,包括:心跳发起检测模块和缓冲队列管理模块。
心跳发起检测模块,用于通过心跳检测机制确定FTP上传任务是否发生死锁;
缓冲队列管理模块,用于在分配的Socket资源循环队列中的存储位置记录FTP操作使用的Socket资源,并启动FTP上传任务杀死流程;判断Socket资源循环队列是否已满,如果未满,则将本次死锁占用的Socket信息压入Socket资源循环队列中,否则,释放Socket资源循环队列中最早的Socket资源,并将本次死锁占用的Socket信息压入Socket资源循环队列中。
所述心跳发起检测模块包括:发送模块和判断模块。发送模块,用于周期发送心跳检测消息给FTP上传任务;判断模块,用于在一定时间内判断是否收到心跳检测消息的ACK,如果是,将心跳检测定时器清零,通知发送模块周期发送心跳检测消息给FTP上传任务;否则,将心跳检测计数器加1,判断心跳检测计数器是否大于预设值,如果是,确定FTP上传任务发生死锁,否则,周期发送心跳检测消息给FTP上传任务。
所述缓冲队列管理模块212,可以进一步用于确定FTP上传任务发生死锁之后,通知判断模块清空心跳计数器。
守护进程所属的任务优先级高于FTP上传任务优先级。
参见图3所示,本发明实施例的心跳检测与自恢复的具体过程如下:
步骤301:守护进程单元初始化时启动心跳检测定时器。
步骤302:守护进程单元周期发起心跳检测消息到FTP上传任务。
步骤303:守护进程单元判断是否收到上次心跳检测消息的ACK,如果收到,则执行步骤308,如果没有收到上次ACK消息,则执行步骤304:
步骤304:将心跳失败计数器加1。
步骤305:守护进程单元对心跳计数器的累加值进行判断,判断是否超过预设值N,如果不大于,则返回301,以等待下一个周期发起心跳检测;如果大于预设值N,则执行步骤306。
步骤306:启动FTP上传任务杀死流程。
步骤307:守护进程单元从Socket资源循环队列中分配新的存取位置,重新初始化FTP上传任务,并清空心跳失败计数器,返回到301,以等待下一个周期发起心跳检测,结束。
步骤308:心跳计时器清零,再返回到301等待下一个周期发起心跳检测。
如图4所示,本发明的FTP上传任务初始化及数据上传流程如下:
步骤401:守护进程在初始化或死锁发生恢复时触发FTP上传任务初始化流程401。
步骤402:FTP上传任务判断Socket资源循环队列是否已满402,如果否,执行步骤404,否则,执行步骤403。
步骤403:释放历史最早Socket套节字资源,用于保存本次生命周期的套节字信息。
步骤404:从Socket资源循环队列中获取空闲Socket资源节点的位置用于保存本次生命周期的套节字信息,FTP上传任务初始化工作完成。
步骤405:检测是否有数据需要上传405,如果没有等待上传数据收集完成,如果有,执行步骤406,否则,执行步骤407。
步骤406:与FTP服务器建立连接,同时将本次FTP操作的Socket套节字信息压入Socket资源循环队列。
步骤407:启动数据上报操作,上传完成后进入步骤405,完成本次数据FTP上传。其中整个FTP上传任务生命周期中一直受到守护进程的心跳消息检测监控。
本实施例的方案与现有技术相比较,引入了心跳机制检测死锁、死锁Socket资源循队列延迟释放Socket资源及自恢复等方法。并且心跳守护机制检测死锁可据不同的判别死锁策略(如:修改N值)对其进行监控,而非出现信号量等待环路作为唯一判别,提高了基站设备应对突发性FTP死锁处理的灵活性,减少异常时单板复位,提高系统稳定性;延后释放死锁时的控制连接、数据连接socket资源,减少了突发异常的可能性,基站系统中socket资源总体占用数得到保证,避免socket资源使用溢出;同时不会因为FTP操作异常时而导致守护进程数据接收调度异常,减少守护进程所在任务的所有进程消息积压风险,对单板CPU利用率冲高有缓解作用。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种文件传输协议FTP死锁检测及自恢复的方法,其特征在于,该方法包括以下步骤:
守护进程通过心跳检测机制确定FTP上传任务发生死锁,则在套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;
判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中。
2.根据权利要求1所述的方法,其特征在于,守护进程通过心跳检测机制确定FTP上传任务发生死锁,包括:
A1.守护进程周期发送心跳检测消息给FTP上传任务,在一定时间内判断是否收到心跳检测消息的响应消息,如果是,将心跳检测定时器清零,返回步骤A1;否则,执行步骤A2;
A2.将心跳检测计数器加1,判断心跳检测计数器是否大于预设值,如果是,确定FTP上传任务发生死锁,否则,执行步骤A1。
3.根据权利要求2所述的方法,其特征在于,在确定FTP上传任务发生死锁之后,该方法进一步包括:
守护进程清空心跳计数器,返回步骤A1,在下一周期发起心跳检测。
4.根据权利要求1所述的方法,其特征在于,守护进程所属的任务优先级高于FTP上传任务优先级。
5.根据权利要求1所述的方法,其特征在于,所述套接字资源包括数据连接套节字,和/或控制连接套节字。
6.一种文件传输协议FTP死锁检测及自恢复的装置,其特征在于,包括:
心跳发起检测模块,用于通过心跳检测机制确定FTP上传任务是否发生死锁;
缓冲队列管理模块,用于在分配的套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中。
7.根据权利要求6所述的装置,其特征在于,所述心跳发起检测模块包括:
发送模块,用于周期发送心跳检测消息给FTP上传任务;
判断模块,用于在一定时间内判断是否收到心跳检测消息的响应消息,如果是,将心跳检测定时器清零,通知发送模块周期发送心跳检测消息给FTP上传任务;否则,将心跳检测计数器加1,判断心跳检测计数器是否大于预设值,如果是,确定FTP上传任务发生死锁,否则,周期发送心跳检测消息给FTP上传任务。
8.根据权利要求7所述的装置,其特征在于,所述缓冲队列管理模块,进一步用于确定FTP上传任务发生死锁之后,通知判断模块清空心跳计数器。
9.根据权利要求6所述的装置,其特征在于,所述套接字资源包括数据连接套节字,和/或控制连接套节字。
10.一种FTP死锁检测及自恢复的系统,其特征在于,包括:
守护进程单元,用于通过心跳检测机制确定FTP上传任务发生死锁,则在分配的套接字资源循环队列中的存储位置记录FTP操作使用的套接字资源,并启动FTP上传任务杀死流程;判断套接字资源循环队列是否已满,如果未满,则将本次死锁占用的套接字信息压入套接字资源循环队列中,否则,释放套接字资源循环队列中最早的套接字资源,并将本次死锁占用的套接字信息压入套接字资源循环队列中;
FTP上传任务单元,用于守护进程单元的心跳检测返回心跳响应,并从守护进程获取数据,与FTP建立连接,将获取的数据上传给FTP服务器;
套接字资源循环队列模块,用于存储每次死锁时FTP操作使用的套接字资源;
FTP服务器,用于接收FTP上传任务上传的数据。
CN200910254305.4A 2009-12-07 2009-12-07 通信系统中文件传输协议死锁检测及自恢复的方法与装置 Expired - Fee Related CN102088470B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN200910254305.4A CN102088470B (zh) 2009-12-07 2009-12-07 通信系统中文件传输协议死锁检测及自恢复的方法与装置
PCT/CN2010/073194 WO2010148882A1 (zh) 2009-12-07 2010-05-25 文件传输协议死锁检测及自恢复的方法与装置
US13/258,312 US9009710B2 (en) 2009-12-07 2010-05-25 Detecting deadlocked file transfer protocol upload connections and performing session self-recovery using information stored in a FIFO resource array

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910254305.4A CN102088470B (zh) 2009-12-07 2009-12-07 通信系统中文件传输协议死锁检测及自恢复的方法与装置

Publications (2)

Publication Number Publication Date
CN102088470A true CN102088470A (zh) 2011-06-08
CN102088470B CN102088470B (zh) 2014-03-05

Family

ID=43385964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910254305.4A Expired - Fee Related CN102088470B (zh) 2009-12-07 2009-12-07 通信系统中文件传输协议死锁检测及自恢复的方法与装置

Country Status (3)

Country Link
US (1) US9009710B2 (zh)
CN (1) CN102088470B (zh)
WO (1) WO2010148882A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609324A (zh) * 2012-01-09 2012-07-25 华为技术有限公司 一种虚拟机死锁后的恢复方法、装置及系统
CN110673942A (zh) * 2019-09-29 2020-01-10 北京浪潮数据技术有限公司 一种云平台的异步进程结束方法、装置及云平台服务器
CN111158920A (zh) * 2019-12-06 2020-05-15 中山市奥珀金属制品有限公司 一种移动系统的进程数据读写优化方法及系统
CN111538599A (zh) * 2020-04-23 2020-08-14 杭州涂鸦信息技术有限公司 一种基于linux的多线程死锁问题定位方法及系统
CN112905372A (zh) * 2021-02-02 2021-06-04 浙江大华技术股份有限公司 线程的异常诊断方法及装置

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5687173B2 (ja) * 2011-11-15 2015-03-18 株式会社日立製作所 通信システム及び方法、ハートビート代行サーバ
US9705686B2 (en) * 2013-08-22 2017-07-11 Red Hat, Inc. Measuring resource consumption in a multi-tenant platform-as-a-service (PaaS) system
US9720810B2 (en) 2014-12-09 2017-08-01 Google Inc. Device cloud monitoring and stability
US10069785B2 (en) 2015-06-05 2018-09-04 Apple Inc. Network messaging for paired devices
US9760494B2 (en) 2015-06-24 2017-09-12 International Business Machines Corporation Hybrid tracking of transaction read and write sets
US9858189B2 (en) * 2015-06-24 2018-01-02 International Business Machines Corporation Hybrid tracking of transaction read and write sets
US10547559B2 (en) * 2015-12-26 2020-01-28 Intel Corporation Application-level network queueing
US10084678B2 (en) 2016-04-19 2018-09-25 International Business Machines Corporation Managing connections for data communications using heartbeat messaging
CN105955779B (zh) * 2016-05-03 2020-06-09 深圳Tcl数字技术有限公司 进程关闭方法及装置
US10827001B2 (en) 2016-07-27 2020-11-03 International Business Machines Corporation Managing connections for data communications
CN106254179B (zh) * 2016-08-05 2020-07-24 深圳先进技术研究院 一种心跳包异步控制方法及装置
US10528400B2 (en) * 2017-06-05 2020-01-07 International Business Machines Corporation Detecting deadlock in a cluster environment using big data analytics
US10742747B2 (en) 2017-07-06 2020-08-11 International Business Machines Corporation Managing connections for data communications following socket failure
US10778506B1 (en) 2017-11-30 2020-09-15 Open Invention Network Llc Coordinated switch of activity in virtual network function components
CN112351069A (zh) * 2020-09-30 2021-02-09 银盛通信有限公司 一种自动化数据上传和维护传输稳定性的系统及方法
CN112887173B (zh) * 2021-02-19 2023-05-23 山东英信计算机技术有限公司 一种存储网络检测方法、装置、设备及可读存储介质
CN113965561B (zh) * 2021-10-20 2023-08-25 中电科航空电子有限公司 一种基于异步事件驱动的机载文件传输系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030204641A1 (en) * 2002-04-30 2003-10-30 Microsoft Corporation Programming model for concurrent programs
US20050021915A1 (en) * 2003-07-21 2005-01-27 Darryn Lowe Managing storage of items across a network of heterogeneous storage devices
CN1904852A (zh) * 2006-08-01 2007-01-31 西安西电捷通无线网络通信有限公司 一种计算机应用程序的监控及异常处理方法
CN101272402A (zh) * 2008-05-14 2008-09-24 深圳市同洲电子股份有限公司 一种数据传输的方法、装置及系统

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6763479B1 (en) * 2000-06-02 2004-07-13 Sun Microsystems, Inc. High availability networking with alternate pathing failover
US6609213B1 (en) * 2000-08-10 2003-08-19 Dell Products, L.P. Cluster-based system and method of recovery from server failures
US6871296B2 (en) * 2000-12-29 2005-03-22 International Business Machines Corporation Highly available TCP systems with fail over connections
US7433943B1 (en) * 2001-12-20 2008-10-07 Packeteer, Inc. Volume-based network management scheme
US7076555B1 (en) * 2002-01-23 2006-07-11 Novell, Inc. System and method for transparent takeover of TCP connections between servers
US7152111B2 (en) * 2002-08-15 2006-12-19 Digi International Inc. Method and apparatus for a client connection manager
US7224692B2 (en) * 2002-09-04 2007-05-29 Broadcom Corporation System and method for fault tolerant TCP offload
US7260066B2 (en) * 2002-10-31 2007-08-21 Conexant Systems, Inc. Apparatus for link failure detection on high availability Ethernet backplane
WO2004070568A2 (en) * 2003-01-31 2004-08-19 Viair, Inc. Asynchronous real-time retrieval of data
US7159234B1 (en) * 2003-06-27 2007-01-02 Craig Murphy System and method for streaming media server single frame failover
US8244880B2 (en) * 2003-10-22 2012-08-14 International Business Machines Corporation Connection management method, system, and program product
US8572249B2 (en) * 2003-12-10 2013-10-29 Aventail Llc Network appliance for balancing load and platform services
EP1758316B1 (en) * 2004-06-14 2014-12-24 Huawei Technologies Co., Ltd. Method for ensuring reliability in a network including a separate bearer control layer
US7962623B2 (en) * 2004-06-30 2011-06-14 Microsoft Corporation Sustaining session connections
US7903546B2 (en) * 2005-01-14 2011-03-08 Cisco Technology, Inc. Detecting unavailable network connections
US7886295B2 (en) * 2005-02-17 2011-02-08 International Business Machines Corporation Connection manager, method, system and program product for centrally managing computer applications
CN100337207C (zh) 2005-03-11 2007-09-12 华为技术有限公司 一种信号量死锁的检测方法
US7594020B2 (en) * 2005-05-31 2009-09-22 Microsoft Corporation Re-establishing a connection for an application layer via a service layer
US20070005773A1 (en) * 2005-05-31 2007-01-04 Microsoft Corporation Re-establishing a connection for an application layer via a service layer using delay
US7831686B1 (en) * 2006-03-31 2010-11-09 Symantec Operating Corporation System and method for rapidly ending communication protocol connections in response to node failure
US20070288645A1 (en) * 2006-06-08 2007-12-13 International Business Machines Corporation Method and System for Persistent and Reliable Data Transmission
US8031617B2 (en) * 2006-07-28 2011-10-04 Hewlett-Packard Development Company, L.P. Fast detection of path failure for TCP
US7533178B2 (en) * 2006-10-31 2009-05-12 Cisco Technology, Inc. Resuming a computing session when rebooting a computing device
US8166156B2 (en) * 2006-11-30 2012-04-24 Nokia Corporation Failure differentiation and recovery in distributed systems
US8365018B2 (en) * 2007-06-19 2013-01-29 Sand Holdings, Llc Systems, devices, agents and methods for monitoring and automatic reboot and restoration of computers, local area networks, wireless access points, modems and other hardware
US8132247B2 (en) * 2007-08-03 2012-03-06 Citrix Systems, Inc. Systems and methods for authorizing a client in an SSL VPN session failover environment
US7778191B2 (en) * 2008-12-12 2010-08-17 Mitel Networks Corporation System and method for fast detection of communication path failures

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030204641A1 (en) * 2002-04-30 2003-10-30 Microsoft Corporation Programming model for concurrent programs
US20050021915A1 (en) * 2003-07-21 2005-01-27 Darryn Lowe Managing storage of items across a network of heterogeneous storage devices
CN1904852A (zh) * 2006-08-01 2007-01-31 西安西电捷通无线网络通信有限公司 一种计算机应用程序的监控及异常处理方法
CN101272402A (zh) * 2008-05-14 2008-09-24 深圳市同洲电子股份有限公司 一种数据传输的方法、装置及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609324A (zh) * 2012-01-09 2012-07-25 华为技术有限公司 一种虚拟机死锁后的恢复方法、装置及系统
CN102609324B (zh) * 2012-01-09 2015-11-25 华为技术有限公司 一种虚拟机死锁后的恢复方法、装置及系统
CN110673942A (zh) * 2019-09-29 2020-01-10 北京浪潮数据技术有限公司 一种云平台的异步进程结束方法、装置及云平台服务器
CN110673942B (zh) * 2019-09-29 2022-06-17 北京浪潮数据技术有限公司 一种云平台的异步进程结束方法、装置及云平台服务器
CN111158920A (zh) * 2019-12-06 2020-05-15 中山市奥珀金属制品有限公司 一种移动系统的进程数据读写优化方法及系统
CN111158920B (zh) * 2019-12-06 2023-10-27 张杰辉 一种移动系统的进程数据读写优化方法及系统
CN111538599A (zh) * 2020-04-23 2020-08-14 杭州涂鸦信息技术有限公司 一种基于linux的多线程死锁问题定位方法及系统
CN112905372A (zh) * 2021-02-02 2021-06-04 浙江大华技术股份有限公司 线程的异常诊断方法及装置

Also Published As

Publication number Publication date
WO2010148882A1 (zh) 2010-12-29
CN102088470B (zh) 2014-03-05
US20120240119A1 (en) 2012-09-20
US9009710B2 (en) 2015-04-14

Similar Documents

Publication Publication Date Title
CN102088470B (zh) 通信系统中文件传输协议死锁检测及自恢复的方法与装置
CN101800675B (zh) 故障监控方法、监控设备及通信系统
CN100362466C (zh) 用于管理计算机设备中的存储器容量低的方法和系统
CN102263674A (zh) 告警上报方法、系统和设备
CN103229535A (zh) 电信网络中用于单元恢复的方法和系统
CN101494572A (zh) 设备告警信息远程管理方法及系统
CN101296135A (zh) 故障信息的处理方法和装置
CN101741635B (zh) 一种同步告警信息的方法、系统及设备
CN101753451A (zh) 网络负载均衡的轨道交通信号设备状态采集方法及装置
CN100464600C (zh) 告警处理方法和后台管理装置
CN102075246A (zh) 获取光网络单元故障信息的方法、系统和光线路终端
CN106331190A (zh) Ip地址回收方法、装置及动态主机配置协议服务器
CN101557602B (zh) 一种多级网元告警同步方法及系统
CN101500249B (zh) 一种单板状态检测的实现方法
CN101511098B (zh) 一种分布式网元任务管理系统及方法
CN102195824B (zh) 数据业务系统退服告警的方法、装置及系统
CN103746839B (zh) PaaS系统和PaaS应用池中的VM节点调度方法
EP2988476B1 (en) Method and apparatus for processing operation on endpoint peripheral
CN1992751B (zh) 计费短信全程监控告警系统及运行方法
JP2006285453A (ja) 情報処理装置、情報処理方法、および情報処理プログラム
CN102958198B (zh) Rab释放请求的异常情况处理方法及rnc
CN101765204A (zh) 告警上报方法和装置
CN103281209B (zh) 一种告警信息的处理方法及设备
CN101917699A (zh) 基于用户的随机上报信令跟踪方法和装置
CN101446844B (zh) 频率转换器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140305

Termination date: 20191207

CF01 Termination of patent right due to non-payment of annual fee