CN1354575A - 一种应用于双网容错系统的通讯方法 - Google Patents

一种应用于双网容错系统的通讯方法 Download PDF

Info

Publication number
CN1354575A
CN1354575A CN 00127568 CN00127568A CN1354575A CN 1354575 A CN1354575 A CN 1354575A CN 00127568 CN00127568 CN 00127568 CN 00127568 A CN00127568 A CN 00127568A CN 1354575 A CN1354575 A CN 1354575A
Authority
CN
China
Prior art keywords
data
frame
communication
fault
send
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 00127568
Other languages
English (en)
Other versions
CN1134135C (zh
Inventor
胡德波
涂晓平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHINA TECHNOLOGY EXCHANGE CO., LTD.
State Grid Beijing Electric Power Co Ltd
State Grid Economic and Technological Research Institute
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CNB001275682A priority Critical patent/CN1134135C/zh
Publication of CN1354575A publication Critical patent/CN1354575A/zh
Application granted granted Critical
Publication of CN1134135C publication Critical patent/CN1134135C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种应用于双网容错系统的通讯方法。在本方法中,发送数据采取的是“发送→等待应答→超时重发”机制,接收数据采取的是“校验→过滤重发数据→应答”机制。如果在通讯过程中,触发故障检测点,则进行故障切换,将发送队列中从本连接发送但未收到回应的数据帧的发送时间和发送次数重新初始化,使其从另一个正常的连接上重新发送。本方法不但提高了系统的可靠性,并且保证了网络故障切换时不会引起数据的丢失。

Description

一种应用于双网容错系统的通讯方法
本发明涉及通讯领域,尤其涉及局域网上双网容错系统的通讯方法。
目前,建立在局域网上的应用系统正在日益增长,功能和规模都在不断扩大,应用的行业包括金融、电信、电力、厂矿、学校、政府等,几乎遍及国民生产的各个部门。在这些局域网上的应用系统中,网络系统的通讯可靠性对应用系统的正常运行至关重要,因为网络系统的通讯故障将导致系统不能正常运行。而在以往的系统中,网络系统的通讯可靠性并没有受到足够的重视,因为普遍认为它的可靠性是足够高的。随着这些应用系统的功能不断增强和规模不断扩大,对可靠性的要求也不断提高。
提高网络系统的通讯可靠性有两种解决途径,即排错与容错。排错是指避免故障,通过对组成系统的组件进行严格筛选、对系统进行严格的检测、减少外界环境的干扰等方法来提高系统的可靠性。通过排错技术,可以一定程度提高系统的可靠性,但这种技术有一定的限度,适应不了可靠性要求特别高的场合,这就出现了另一种技术——容错技术。容错是指容忍错误,指在系统发生硬件故障或存在软件错误的情况下,系统仍能正确完成任务。现在常用的容错技术是双网络容错,通过网卡、网线、集线器的备份来提高网络通讯的可靠性。在这个双网络的容错系统中,数据通讯的机制是很重要的,只有合适的通讯机制才能保证通讯的高可靠性和高效率,并在双网络故障切换时不会丢失数据,否则,双网络容错的作用就不能发挥出来。传统的双网系统中的通讯机制并没有很好地解决通讯的高可靠性和故障切换不丢失数据的问题,因此双网容错的作用就没有充分发挥出来。
本发明的目的是克服上述数据通讯可靠性低以及数据易丢失的问题,提出一种应用于双网容错系统中的通讯方法,不仅使系统具有很高的可靠性,并且在网络故障切换时不会引起数据丢失。
为了实现发明目的,所述的双网容错系统的通讯方法主要包括:
1、双网容错系统将从应用模块传送的具有帧结构F1的数据转换为具有帧结构
F2的数据,并存放到发送队列中;
2、根据应用系统的要求,发送数据或接收数据,或两者同时进行;
3、如果在通讯处理过程中故障检测点被触发,则进行故障切换和故障恢复处
   理。
所述的帧结构F1包括主机ID、数据的类型、数据帧的长度和数据帧。
所述的帧结构F2包括主机ID、数据的类型、数据帧的长度、数据帧、流水号、发送时间和发送次数。
在所述的通讯方法中,步骤2中的发送数据采取的是“发送→等待应答→超时重发”机制,接收数据采取的是“校验→过滤重发数据→应答”机制。
下面结合附图和实施例对本发明作进一步的详细描述:
图1.1和图1.2分别是本发明采用的数据帧F1和F2的结构。
图2是本发明的数据发送处理流程。
图3是本发明的数据接收处理流程。
如图1.1所示,帧结构F1是双网容错系统与上层应用系统交互所使用的数据结构,当应用系统要发送数据时或双网容错系统将接收到的数据传递给应用系统时使用该帧结构。
帧结构F1包括主机ID、数据的类型、数据帧的长度和数据帧。在该帧数据为发送帧时主机ID表示发送目的主机的ID号,当该帧数据为接收帧时表示数据的来源主机的ID号。它是与IP地址相关联的,因为每个主机有两个IP地址,因此它与主机的两个IP地址对应,它们的对应关系在配置文件中保存或存放在数据库中集中管理。在发送帧内“数据类型”表示数据的重要性,用于数据帧在发送队列中排队,0为最高,在发送链表中排队最靠前,1次之,依此类推。在接收帧内“数据类型”表示数据的类别,用于区分普通数据和通道状态,通道状态包括:链路初始化成功、链路初始化失败、链路中断、链路恢复、发送队列满、发送队列由满变为有空间等,通道状态的返回使上层的应用程序可以进行流量控制的工作。数据幀的长度表示应用系统发送或接收的数据帧长度。数据帧是应用系统发送或接收的具体数据。
帧结构F2是双网容错系统内部使用的通讯帧结构。如图1.2所示,帧结构F2包括主机ID、数据的类型、数据帧的长度、数据帧、流水号、发送时间和发送次数。
流水号是每帧数据的唯一ID号,主机接收到数据并校验正确后将流水号发回到发送端,即接收方返回的应答信号。发送时间是表示该帧数据上次发送的时间,用于判断是否超时,如果超时则需要重发。发送次数是表示该帧数据已发送的次数,用于判断该帧数据的发送次数是否超过限制,如果超过则认为该通讯连接已发生故障。其余参数与帧结构F1中的含义是相同的。
如图2所示,本发明的发送数据包括如下步骤:
首先判断发送队列是否为空,如果为空,则定时发送探测数据帧,以检测网络连接是否正常。如果不为空,则取出第一帧数据,判断该帧数据距上次发送的时间是否已超时,如果未超时则直接返回,如果已超时则进入下一步。如果存在正常的通讯连接,则判断该帧数据的发送次数是否超过限制,如果没有超过,则将该帧数据重新发送,并将该帧数据的已发送次数加1,发送时间置为当前时间。如果发送次数超过限制,则认为该通讯连接已发生了故障,将该连接标记为已中断,启动切换过程。在故障切换时,要将发送队列中从本连接发送但未收到回应的数据帧的发送时间和发送次数重新初始化,因为两个网络连接使用的是同一个发送队列,因此所有未收到应答的数据帧都将从另一个正常的连接上重新发送,这样就可以保证不会丢失数据。
如图3所示,本发明的接收数据包括如下步骤:
当接收到数据时,首先判断校验是否正确,如果不正确就直接返回,如果正确,就进行下一步。如果数据是对方主机返回的应答确认帧,则从数据帧中取出流水号,然后到发送队列中删除对应的数据帧。如果是发送队列空闲时发送的探测数据帧,则直接发送应答确认帧。如果是普通数据,在接收方保存了一个最近接收的数据帧流水号链表,如果在这个链表中存在这个数据帧的流水号,则说明是重收的数据,因此就不作处理,直接发送应答确认帧,否则组帧后上送给应用系统进行处理,然后发送应答确认帧。这样就可以将重收的数据丢弃掉,避免重复处理同样的数据。
下面具体说明本方法在系统中的应用:
在正常情况下,双网容错系统配备两个集线器,每台主机安装有两块网卡,配有两个IP地址(IP1和IP2)。在需要通讯的两台主机之间通过IP1和IP2同时建立两个连接,每个连接均可进行正常的数据通讯,两个连接使用同一个发送数据队列。
首先由应用系统把具有帧结构F1的数据发送给双网容错系统,双网容错系统将收到的数据进行转换,使其具有帧结构F2。当某帧数据发送时首先判断该帧数据距上次发送的时间是否已超时,如果未超时则处理下一帧,如果已超时则进入下一步。如果存在正常的通讯连接,则判断该帧数据的发送次数是否超过限制,如果没有超过,则将该帧数据发送,并将该帧数据的已发送次数加1,发送时间置为当前时间。数据帧发送后并不立即删除,而是要等到接收方发来应答后才将它删除。如果发送次数超过限制,则认为该通讯连接已发生了故障,将该连接标记为已中断,触发故障检测点,启动切换过程。
因为在通讯的两台主机间同时保持着两个连接,因此在某一个连接故障时可以将另一个正常的连接设置为主连接,从而实现快速的故障切换。在启动切换时,要将发送队列中的从故障连接发送但还没有收到应答的数据帧重新初始化,即将数据帧的发送时间和已发送次数重新初始化,因为两个网络连接使用的是同一个发送队列,并且使用了“发送→应答→超时重发”的机制,因此所有未收到应答的数据帧都将从另一个正常的连接上重新发送,这样就可以保证不会丢失数据,并且简化了处理。故障恢复的动作在切换动作完成后开始进行。容错系统会不断检测故障连接是否恢复,如果恢复则将该连接设置为备用状态(主备用运行方式)或加入到正常的通讯中(负荷分担运行方式)。
当接收到数据以后,如果判断校验正确就进行处理。如果接收的数据是对方主机返回的应答确认帧,则从数据帧中取出流水号,然后到发送队列中删除对应的数据帧。如果接收的数据是发送队列空闲时发送的探测数据帧,则直接发送应答确认帧。如果接收的数据是普通数据,因为通讯系统采用了“超时重发”的机制,同一帧数据有可能被发送多次,因此在接收方保存了一个最近接收的数据帧流水号链表,通过这个流水号链表判断是否是重收的数据,如果是重收的数据,就不作处理,否则组帧后上送给应用系统进行处理,然后发送应答确认帧。
采用本发明所述的通讯方法,将“发送→应答→超时重发”的通讯机制应用到双网容错系统中,实现了通讯的可靠性,并且在接收处理中加入了重发数据过滤,避免数据帧重复处理。在这个机制的基础上,由于两个网络连接使用的是同一个发送队列,因此在故障切换时,只要将发送队列中的从故障连接发送但还没有收到应答的数据帧重新初始化,这些数据帧就将从另一个正常的连接上重新发送,保证了不会丢失数据,同时简化了处理。

Claims (5)

1、一种应用于双网容错系统的通讯方法,其特征在于,主要包括以下步骤:步骤1,双网容错系统将从应用系统传送的具有帧结构F1的数据转换为具有帧
  结构F2的数据,并存放到发送队列中;步骤2,根据应用系统的要求,发送数据或接收数据,或两者同时进行;步骤3,如果在通讯处理过程中故障检测点被触发,则进行故障切换和故障恢复
 处理;所述的帧结构F1包括主机ID、数据的类型、数据帧的长度和数据帧;所述的帧结构F2包括主机ID、数据的类型、数据帧的长度、数据帧、流水号、发送时间和发送次数。
2、如权利要求1所述的通讯方法,其特征在于,所述的步骤2中的发送数据采取的是“发送→等待应答→超时重发”机制,接收数据采取的是“校验→过滤重发数据→应答”机制。
3、如权利要求2所述的通讯方法,其特征在于,所述步骤2的发送数据具体包括:
首先判断发送队列是否为空,如果为空,则定时发送探测数据帧,如果不为空,则进入下一步;
取出第一帧数据,判断该帧数据距上次发送的时间是否已超时,如果未超时则直接返回,如果已超时则判断是否存在正常的通讯连接;
如果不存在正常的通讯连接则直接返回,否则判断该帧数据的发送次数是否超过限制;
如果发送次数没有超过限制,则将该帧数据重新发送,并将该帧数据的已发送次数加1,发送时间置为当前时间;
如果发送次数超过限制,则认为该通讯连接已发生了故障,将该连接标记为已中断,触发故障检测点,启动故障切换过程。
4、如权利要求2所述的通讯方法,其特征在于,所述步骤2的接收数据具体
包括:
首先判断校验是否正确,如果不正确就直接返回,如果正确,就进行下一步;
如果接收数据是对方主机返回的应答确认帧,则从数据帧中取出流水号,然后到发送队列中删除对应的数据帧;
如果接收数据是发送队列空闲时发送的探测数据帧,则直接发送应答确认帧;
如果接收数据是普通数据,则根据接收方的数据帧流水号链表判断是否存在该数据帧的流水号,如果存在就直接发送应答确认帧,否则组帧后上送给应用系统进行处理,然后发送应答确认帧。
5、如权利要求3所述的通讯方法,其特征在于,所述的故障切换过程包括:将发送队列中从本连接发送但未收到回应的数据帧的发送时间和发送次数重新初始化,然后从另一个正常的连接上重新发送所有未收到应答的数据帧。
CNB001275682A 2000-11-22 2000-11-22 一种应用于双网容错系统的通讯方法 Expired - Fee Related CN1134135C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB001275682A CN1134135C (zh) 2000-11-22 2000-11-22 一种应用于双网容错系统的通讯方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB001275682A CN1134135C (zh) 2000-11-22 2000-11-22 一种应用于双网容错系统的通讯方法

Publications (2)

Publication Number Publication Date
CN1354575A true CN1354575A (zh) 2002-06-19
CN1134135C CN1134135C (zh) 2004-01-07

Family

ID=4592581

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB001275682A Expired - Fee Related CN1134135C (zh) 2000-11-22 2000-11-22 一种应用于双网容错系统的通讯方法

Country Status (1)

Country Link
CN (1) CN1134135C (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100431300C (zh) * 2005-07-18 2008-11-05 迈普(四川)通信技术有限公司 一种自动启用备份线路的方法
CN1671094B (zh) * 2004-03-15 2010-08-18 微软公司 对假超时的响应
CN101127668B (zh) * 2007-09-12 2010-12-29 中兴通讯股份有限公司 在接入网络过程中完善事务处理的方法
CN101523828B (zh) * 2006-10-05 2012-10-03 株式会社Ntt都科摩 通信系统、通信装置以及通信方法
CN101432629B (zh) * 2005-12-22 2013-04-03 直观外科手术操作公司 同步数据通信
WO2013060277A1 (en) * 2011-10-25 2013-05-02 Mediatek Inc. Transmitter assisted quality of service measurement
CN105245442A (zh) * 2015-10-27 2016-01-13 广州市百果园网络科技有限公司 一种即时通讯im消息的传输方法及装置、系统
CN103326897B (zh) * 2013-06-08 2016-12-28 烽火通信科技股份有限公司 一种分布式计算环境通用监测装置与失效检测方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1671094B (zh) * 2004-03-15 2010-08-18 微软公司 对假超时的响应
CN100431300C (zh) * 2005-07-18 2008-11-05 迈普(四川)通信技术有限公司 一种自动启用备份线路的方法
CN101432629B (zh) * 2005-12-22 2013-04-03 直观外科手术操作公司 同步数据通信
CN101523828B (zh) * 2006-10-05 2012-10-03 株式会社Ntt都科摩 通信系统、通信装置以及通信方法
CN101127668B (zh) * 2007-09-12 2010-12-29 中兴通讯股份有限公司 在接入网络过程中完善事务处理的方法
WO2013060277A1 (en) * 2011-10-25 2013-05-02 Mediatek Inc. Transmitter assisted quality of service measurement
US9516524B2 (en) 2011-10-25 2016-12-06 Mediatek, Inc. Transmitter assisted quality of service measurement
CN103326897B (zh) * 2013-06-08 2016-12-28 烽火通信科技股份有限公司 一种分布式计算环境通用监测装置与失效检测方法
CN105245442A (zh) * 2015-10-27 2016-01-13 广州市百果园网络科技有限公司 一种即时通讯im消息的传输方法及装置、系统
CN105245442B (zh) * 2015-10-27 2018-11-23 广州市百果园网络科技有限公司 一种即时通讯im消息的传输方法及装置、系统

Also Published As

Publication number Publication date
CN1134135C (zh) 2004-01-07

Similar Documents

Publication Publication Date Title
EP1909468B1 (en) Method and apparatus for backing up TCP connection
US6760766B1 (en) Data transmission method and device
EP1108343B1 (en) Method and apparatus for input/output link retry, failure and recovery in a computer network
US6343067B1 (en) Method and apparatus for failure and recovery in a computer network
US6853617B2 (en) System and method for TCP connection protection switching
Watson Timer-based mechanisms in reliable transport protocol connection management
EP2148473A1 (en) Switching nodes for high availability networks
JPS5866448A (ja) パケット交換における誤り検出方式
JPH10326261A (ja) 分散コンピュータ・システムのハードウェア要素によりエラーを報告するシステム
EP1708445A1 (en) Communication device and logical link abnormality detection method
CN112787960B (zh) 一种堆叠分裂的处理方法、装置、设备及存储介质
CN1758622A (zh) 信息处理装置之间的异构多总线数据传输方法
CN1134135C (zh) 一种应用于双网容错系统的通讯方法
JP2001509657A (ja) 能動的故障検出
CN101160794A (zh) 一种智能网业务控制设备容灾系统和方法
CN100394717C (zh) 基于arq信息的基站tcp代理确认方法及其系统
JP3101604B2 (ja) 分散コンピュータ・システムのエラーを報告する方法
CN1533100A (zh) 对基于流控制传送协议的偶联进行保护的方法
US9294342B2 (en) Network node apparatus system, apparatus, and method
CN113645312A (zh) 一种基于erps协议的子环网链路保护方法与装置
US7161900B2 (en) Redundant ethernet transmission line system
CN110677283B (zh) 一种网络双冗余快速切换的方法
CN102014033B (zh) 环网故障节点实现业务恢复的方法和系统
JP3784199B2 (ja) 伝送路の冗長化方法及びその方法を用いたシステム
CN1741405A (zh) 实现备份和倒换功能的通信系统及方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: ZTE CO., LTD.

Free format text: FORMER NAME OR ADDRESS: SHENZHENG CITY ZTE CO., LTD.

CP03 Change of name, title or address

Address after: 518057 Zhongxing building, science and technology south road, Nanshan District hi tech Industrial Park, Guangdong, Shenzhen

Patentee after: ZTE Corporation

Address before: 518057, Shenzhen Nanshan District hi tech Industrial Park, science and technology south road, ZTE building, 6 floor of the Ministry of law

Patentee before: Zhongxing Communication Co., Ltd., Shenzhen City

ASS Succession or assignment of patent right

Owner name: STATE GRID BEIJING ELECTRIC POWER COMPANY CHINA TE

Effective date: 20140129

Owner name: BEIJING POWER ECONOMIC RESEARCH INSTITUTE

Free format text: FORMER OWNER: ZTE CORPORATION

Effective date: 20140129

COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 518057 SHENZHEN, GUANGDONG PROVINCE TO: 100055 XICHENG, BEIJING

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20140129

Address after: 100055 No. 15 West Street, Guanganmen station, Beijing, Xicheng District

Patentee after: State Power Economic Research Institute

Patentee after: State Grid Beijing Electric Power Company

Patentee after: CHINA TECHNOLOGY EXCHANGE CO., LTD.

Address before: 518057 Nanshan District science and Technology Industrial Park, Guangdong high tech Industrial Park, ZTE building

Patentee before: ZTE Corporation

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040107

Termination date: 20131122