CN101938401A - 一种分流集群流量的方法及相关装置 - Google Patents

一种分流集群流量的方法及相关装置 Download PDF

Info

Publication number
CN101938401A
CN101938401A CN2009101085542A CN200910108554A CN101938401A CN 101938401 A CN101938401 A CN 101938401A CN 2009101085542 A CN2009101085542 A CN 2009101085542A CN 200910108554 A CN200910108554 A CN 200910108554A CN 101938401 A CN101938401 A CN 101938401A
Authority
CN
China
Prior art keywords
processing unit
information
abnormity
indication information
links
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009101085542A
Other languages
English (en)
Inventor
肖白沙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2009101085542A priority Critical patent/CN101938401A/zh
Priority to PCT/CN2010/072755 priority patent/WO2011000241A1/zh
Publication of CN101938401A publication Critical patent/CN101938401A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/02Traffic management, e.g. flow control or congestion control

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种分流集群流量的方法及相关装置,该分流集群流量的方法包括:获取各个处理装置的运行信息;根据所述运行信息判断所述各个处理装置是否发生异常;若判断其中有发生异常的处理装置,则向与所述异常的处理装置相连的装置发送指示信息,所述指示信息包括减少对所述异常的处理装置发送流量的信息。通过本发明提供的方法及相关装置,可以充分发挥集群中各个处理装置的能力,提高集群的可用性。

Description

一种分流集群流量的方法及相关装置
技术领域
本发明涉及计算机及通讯领域,特别涉及一种分流集群流量的方法及相关装置。
背景技术
计算机集群简称集群是一种计算机系统,它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,本专利申请中以处理装置命名,其通常通过局域网连接,但也有其它的可能连接方式。集群计算机通常用来改进单个计算机的计算速度和/或可靠性。一般情况下集群计算机比单个计算机,比如工作站或超级计算机性能价格比要高得多。
目前,分流集群流量的技术已成为集群高可用性的重要指标,其标志着集群内部负荷分担的能力、容错处理的能力,能有效保证集群内部将相关应用和资源从繁忙的处理装置转移到不繁忙的处理装置,或从有故障的处理装置转移到无故障的处理装置或备份的处理装置。
现有的一种分流集群流量的技术一般为负荷分担模式,即集群中流量的负荷分担采用比例分流或区域分流的方式。其中比例分流是对于传送过来的流量采用百分比或计数的方式向集群中的各个处理装置进行分流;区域分流是将该集群面向的用户划分为不同的区域,集群中各个处理装置按照不同区域来处理来自各区域的流量。
发明内容
本发明旨在提供一种分流集群流量的方法及相关装置,能够依据各个处理装置的运行信息,调节集群中各处理装置的流量分配,从而提高该集群的高可用性。
为了实现发明目的,本发明提供了一种分流集群流量的方法,其包括:
获取各个处理装置的运行信息;
根据所述运行信息判断所述各个处理装置是否发生异常;
若判断其中有发生异常的处理装置,则向与所述异常的处理装置相连的装置发送指示信息,所述指示信息包括减少对所述异常的处理装置发送流量的信息。
本发明还提供了一种分流集群流量的装置,包括:
获取模块,用于获取各个处理装置的运行信息;
判断模块,用于根据所述运行信息判断所述各个处理装置是否发生异常;
发送模块,用于若判断其中有发生异常的处理装置,则向与所述异常的处理装置相连的装置发送指示信息,所述指示信息包括减少对所述异常的处理装置发送流量的信息。
本发明还提供了一种分流服务器,包括:
接收模块,用于接收分流集群流量的装置发送的指示信息,上述述指示信息包括减少对异常的处理装置发送流量的信息,
处理模块,用于根据上述指示信息,减少对异常的处理装置发送流量。
本发明提供的方法及相关装置通过根据各个处理装置的运行信息判断各个处理装置是否发生异常,若判断其中有发生异常的处理装置时,指示与该异常的处理装置相连的装置减少对该异常的处理装置发送的流量,从而可以充分发挥集群中各个处理装置的能力,提高集群的可用性。
附图说明
图1为本发明一个实施例提供的一种分流集群流量的方法的流程图;
图2为本发明另一个实施例提供的一种分流集群流量的方法的流程图;
图3为本发明又一个实施例提供的一种分流集群流量的方法的流程图;
图4为本发明一个实施例提供的一种分流集群流量的装置的示意图;
图5为本发明一个实施例提供的一种分流服务器的示意图。
具体实施方式
为更好地理解本发明,现结合附图及实施例对本发明作进一步描述:
本发明一个实施例提供一种分流集群流量的方法,请参图1所示,该方法包括以下步骤:
101、获取各个处理装置的运行信息;
分流集群流量的装置如集中控制装置接收各个处理装置的运行信息。该运行信息可以为当前流量、系统负荷、剩余负荷、硬件状态、连接状态等运行信息数据。这里的运行信息可以是集中控制装置通过向各个处理装置发送查询信息,各个处理装置将各自的运行信息返回给集中控制装置。同样的,各个处理装置也可以定时或需要时将运行信息主动上报给集中控制装置。
102、根据上述运行信息判断所述各个处理装置是否发生异常;
集中控制装置根据上述运行信息判断所述各个处理装置是否发生异常。这里的异常可以是处理装置目前处于过载状态,或发生故障的状态等,也可以是示忙的状态等。例如某个处理装置本身能处理的最大处理能力为1000mps(条/秒),当该处理装置的当前流量达到800mps时即为示忙状态,而当该处理装置的当前流量超过1000mps时,即为过载状态,当某个处理装置没有返回查询响应时,集中控制装置即判断该处理装置发生了故障。当然,集中控制装置也可以根据处理装置返回的查询响应或上报的运行信息中的数据来判断处理装置是否故障。
103、若判断其中有发生异常的处理装置,则向与所述异常的处理装置相连的装置发送指示信息,所述指示信息包括减少对所述异常的处理装置发送流量的信息。
上述与异常的处理装置相连的装置可以是连接装置。本实施例中的处理装置可以是消息业务中心,如短消息业务中心SMSC,若其中有发生异常的SMSC,则与该发生异常的SMSC相连的连接装置可以是短消息网关GIW;本实施例中的处理装置也可以是多媒体业务中心MMSC,则与该发生异常的MMSC相连的连接装置可以是多媒体消息网关MMSG;上述与异常的处理装置相连的装置还可以是处理装置,例如短消息业务中心SMSC或多媒体业务中心MMSC。上述与异常的处理装置相连的处理装置或连接装置可以根据上述指示减少对该异常的处理装置发送的流量。该减少可以是所有与该异常的处理装置相连的装置发送给该异常的处理装置的流量之和的减少,也可以是其中某些与该异常的处理装置相连的装置发送给该异常的处理装置的流量的减少,且上述减少可以按照一定比例减少,如30%等,也可以减少为0,如当该异常的处理装置具体为发生故障时。另外,上述指示信息还包括:与所述异常的处理装置相连的装置向与其相连的装置发送流量的信息,如具体可以发送的流量。
通过以上提供的分流集群流量的方法,可以充分发挥集群中各个处理装置的能力,提高集群的可用性。
本发明另一个实施例提供了一种分流集群流量的方法,该实施例请参图2所示,该方法包括如下步骤:
201、集中控制装置向各个处理装置发送查询运行信息的查询消息;
202、各个处理装置根据上述查询消息各自判断其自身的运行状态,并向上述集中控制装置发送其自身的运行信息;
各个处理装置亦可以不根据查询消息来进行判断,而是主动判断其自身的运行状态,并主动将运行信息上报给集中控制装置。
203、集中控制装置根据各个处理装置发送过来的运行状态判断各个处理装置是否发生异常,本实施例以判断处理装置1发生异常,处理装置2和处理装置3与处理装置1两两相连为例进行说明。
204、集中控制装置向处理装置2和处理装置3发送指示信息,所述指示信息包括减少对所述异常的处理装置1发送流量的信息。
205、处理装置2和处理装置3则分别按照上述指示减少对处理装置1发送流量,并将减少发给处理装置1的流量各自发送给处理装置3和处理装置2。
通过以上提供的分流集群流量的方法,可以充分发挥集群中各个处理装置的能力,提高集群的可用性。
本发明又一个实施例提供了一种分流集群流量的方法,该实施例请参图3所示,本实施例中以处理装置为SMSC,连接装置为GIW为例进行说明,终端用户发送过来的短消息均经过GIW而发送到SMSC进行处理。其中SMSC,GIW均为3个,GIW1、GIW2与GIW3均两两相连,且均与SMSC1、SMSC2、SMSC3相连接,本实施例中假设SMSC的最大处理能力为1000mps,在正常情况下GIW1、GIW2、GIW3均是分别首先将短消息发送给SMSC1、SMSC2及SMSC3进行处理的。本实施例包括以下步骤:
301、在某一时刻SMSC1、SMSC2及SMSC3分别判断自身的运行状态,并将运行信息主动上报给集中控制装置,假如此刻GIW1发送给SMSC1的流量为1000mps,即处于异常状态;GIW2发送给SMSC2的流量为800mps,处于正常状态;GIW3发送给SMSC的流量为600mps,处于正常状态,且GIW1发送给SMSC2和SMSC3的流量为0,GIW2发送给SMSC1和SMSC3的流量为0,GIW3发送给SMSC1和SMSC2的流量为0。
这里也可以是集中控制装置通过发送查询消息给SMSC来获取SMSC的运行信息。
302、集中控制装置根据上述SMSC发送的运行状态判断SMSC1处于异常状态,SMSC2和SMSC3处于正常状态,则指示和SMSC1相连的GIW1、GIW2及GIW3减少向SMSC1发送短消息的流量,如减少一定的比例,这里以减少30%为例,且减少的30%以SMSC2及SMSC3的空闲比例进行分配,即SMSC2和SMSC3按照(1000-800)∶(1000-600)=1∶2进行分配,即此时GIW1需发送给SMSC1的流量为:1000×(1-30%)=700mps;GIW1需发送给SMSC2的流量为:(1000-700)×1/(1+2)=100mps;GIW1需发送给SMSC3的流量为:(1000-700)×2/(1+2)=200mps,且GIW2和GIW3发送给SMSC1、SMSC2、SMSC3的流量均不变,则上述发给GIW1、GIW2及GIW3的指示信息中可以包括减少向SMSC1发送短消息的流量的信息外,还可以包括具体的GIW1、GIW2及GIW3分别向SMSC1、SMSC2、SMSC3发送的流量。
303、GIW1、GIW2及GIW3在下一个时刻按照集中控制装置的指示减少对SMSC1发送的流量,并按照指示信息中包括的流量向SMSC1、SMSC2、SMSC3发送。
若上述GIW2及GIW3在步骤301中的时刻发送给SMSC1的流量不为0,则亦需按照30%的比例减少发送给SMSC1,同样亦需要将此部分减少的流量按照比例分配给SMSC2及SMSC3,这里不在累述。
304、当集中控制装置根据获取的GIW1上的运行信息判断SMSC1已由异常状态转变为正常状态时,如某一时刻GIW1处需转发的处理流量从1000mps变为500mps,而GIW2和GIW3需转发的流量均不变时,则集中控制装置向GIW1、GIW2及GIW3发送转变指令,该转变指令可以为指令GIW1、GIW2及GIW3向SMSC1、SMSC2及SMSC3发送短消息的流量按照最初的缺省值处理,即此时,GIW1仅需要向SMSC1发送短消息,而无需向SMSC2及SMSC3发送短消息,GIW2和GIW3亦分别只需向SMSC2和SMSC3发送短消息,而无需向其他SMSC发送短消息,即GIW1向SMSC传送的流量为500mps,向其他SMSC传送的流量为0。该转变指令也可以是按照其他策略进行流量的重新分配。
305、GIW1、GIW2及GIW3根据上述转变指令向各SMSC发送短消息。
通过以上提供的分流集群流量的方法,通过对各个处理装置进行运行状态的监控,并在各个处理装置发生异常的时候指示集群中其他与该异常的处理装置减少发送流量给该异常的处理装置,故能充分利用各个处理装置的能力,调整各个处理装置的流量的流程简单,且该集中控制装置无需直接承载多余的流量,对其硬件要求不高,可以有效降低集群的成本和维护的难度。
对应于上述图1至图3所示的方法实施例,本发明实施例还提供一种分流集群流量的装置,如集中控制装置,请参图4所示,该装置包括:
获取模块41,用于获取各个处理装置的运行信息;
判断模块42,用于根据所述运行信息判断上述各个处理装置是否发生异常;
发送模块43,用于若判断其中有发生异常的处理装置,则向与所述异常的处理装置相连的装置发送指示信息,所述指示信息包括减少对所述异常的处理装置发送流量的信息。
进一步地,所述发送模块43具体用于:若判断其中有发生异常的处理装置时,向与所述异常的处理装置相连的处理装置或连接装置发送指示信息。
更进一步地,所述获取模块41具体用于:向各个处理装置发送查询运行信息的查询消息,获取各个处理装置根据所述查询消息发送的运行信息;或具体用于获取各个处理装置主动上报的运行信息。
更进一步地,发送模块43还用于:当判断上述异常的处理装置已转变为正常状态,则向与上述与已转变为正常状态的处理装置相连的装置发送转变指令。
通过以上提供的分流集群流量的装置,可以充分发挥集群中各个处理装置的能力,提高集群的可用性。
对应于上述图1至图3所示的方法实施例,本发明实施例还提供一种分流服务器,如前述实施例中提到的处理装置或连接装置,请参图5所示,该装置包括:
接收模块51,用于接收分流集群流量的装置发送的指示信息,所述指示信息包括减少对异常的处理装置发送流量的信息,
处理模块52,用于根据所述指示信息,减少对异常的处理装置发送流量。进一步地,所述指示信息还包括:
与所述异常的处理装置相连的装置向与其相连的装置发送流量的信息,所述处理模块还用于根据所述指示信息,向与所述分流服务器相连的装置发送相应的流量。
通过以上提供的分流服务器,可以充分发挥集群中各个处理装置的能力,提高集群的可用性。
另外,实现本发明实施例的软件可以存储于一计算机可读存储介质中,该软件在执行时,包括以下步骤:获取各个处理装置的运行信息;根据所述运行信息判断所述各个处理装置是否发生异常;若判断其中有发生异常的处理装置,则向与所述异常的处理装置相连的装置发送指示信息,所述指示信息包括减少对所述异常的处理装置发送流量的信息。所述的存储介质可以为Rom/Ram,磁盘,光盘等。
以上所述仅为本发明的常见实施方案,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种分流集群流量的方法,其特征在于,包括:
获取各个处理装置的运行信息;
根据所述运行信息判断所述各个处理装置是否发生异常;
若判断其中有发生异常的处理装置,则向与所述异常的处理装置相连的装置发送指示信息,所述指示信息包括减少对所述异常的处理装置发送流量的信息。
2.如权利要求1所述的方法,其特征在于,
所述向与所述异常的处理装置相连的装置发送指示信息具体为:向与所述异常的处理装置相连的处理装置或连接装置发送指示信息。
3.如权利要求2所述的方法,其特征在于,所述处理装置为消息中心,所述连接装置为消息网关。
4.如权利要求1所述的方法,其特征在于,所述获取各个处理装置的运行信息具体包括:
向各个处理装置发送查询运行信息的查询消息,以获取各个处理装置根据所述查询消息发送的运行信息;
获取各个处理装置主动上报的运行信息。
5.如权利要求1所述的方法,其特征在于,还包括:
若判断所述异常的处理装置已转变为正常状态,则向与所述与已转变为正常状态的处理装置相连的装置发送转变指令。
6.如权利要求1所述的方法,其特征在于,所述指示信息还包括:
与所述异常的处理装置相连的装置向与其相连的装置发送流量的信息。
7.一种分流集群流量的装置,其特征在于,包括:
获取模块,用于获取各个处理装置的运行信息;
判断模块,用于根据所述运行信息判断所述各个处理装置是否发生异常;
发送模块,用于若判断其中有发生异常的处理装置,则向与所述异常的处理装置相连的装置发送指示信息,所述指示信息包括减少对所述异常的处理装置发送流量的信息。
8.如权利要求8所述的装置,其特征在于,
所述发送模块具体用于:若判断其中有发生异常的处理装置时,向与所述异常的处理装置相连的处理装置或连接装置发送指示信息。
9.如权利要求8或9所述的装置,其特征在于,所述获取模块具体用于:向各个处理装置发送查询运行信息的查询消息,以获取各个处理装置根据所述查询消息发送的运行信息;或用于获取各个处理装置主动上报的运行信息。
10.如权利要求10所述的装置,其特征在于,发送模块还用于:当判断所述异常的处理装置已转变为正常状态,则向与所述与已转变为正常状态的处理装置相连的装置发送转变指令。
11.一种分流服务器,其特征在于,包括:
接收模块,用于接收分流集群流量的装置发送的指示信息,所述指示信息包括减少对异常的处理装置发送流量的信息,
处理模块,用于根据所述指示信息,减少对异常的处理装置发送流量。
12.如权利要求12所述的分流服务器,其特征在于,所述指示信息还包括:
与所述异常的处理装置相连的装置向与其相连的装置发送流量的信息,所述处理模块还用于根据所述指示信息,向与所述分流服务器相连的装置发送相应的流量。
CN2009101085542A 2009-06-30 2009-06-30 一种分流集群流量的方法及相关装置 Pending CN101938401A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2009101085542A CN101938401A (zh) 2009-06-30 2009-06-30 一种分流集群流量的方法及相关装置
PCT/CN2010/072755 WO2011000241A1 (zh) 2009-06-30 2010-05-13 一种分流集群流量的方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101085542A CN101938401A (zh) 2009-06-30 2009-06-30 一种分流集群流量的方法及相关装置

Publications (1)

Publication Number Publication Date
CN101938401A true CN101938401A (zh) 2011-01-05

Family

ID=43391544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101085542A Pending CN101938401A (zh) 2009-06-30 2009-06-30 一种分流集群流量的方法及相关装置

Country Status (2)

Country Link
CN (1) CN101938401A (zh)
WO (1) WO2011000241A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104753805A (zh) * 2013-12-31 2015-07-01 腾讯科技(深圳)有限公司 分布式流量控制方法、服务器和系统
US9179391B2 (en) 2010-12-24 2015-11-03 Huawei Technologies Co., Ltd. Method for offloading processing service, communication apparatus and network system
CN107872397A (zh) * 2016-09-27 2018-04-03 阿里巴巴集团控股有限公司 压测过程中的流量调度方法、调度平台和调度系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101043385A (zh) * 2006-06-15 2007-09-26 华为技术有限公司 服务健康度检测系统及方法
CN101340388A (zh) * 2008-08-13 2009-01-07 华为技术有限公司 网络流量控制的方法、装置和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100388674C (zh) * 2003-11-14 2008-05-14 中兴通讯股份有限公司 处理网关消息拥塞的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101043385A (zh) * 2006-06-15 2007-09-26 华为技术有限公司 服务健康度检测系统及方法
CN101340388A (zh) * 2008-08-13 2009-01-07 华为技术有限公司 网络流量控制的方法、装置和系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9179391B2 (en) 2010-12-24 2015-11-03 Huawei Technologies Co., Ltd. Method for offloading processing service, communication apparatus and network system
CN104753805A (zh) * 2013-12-31 2015-07-01 腾讯科技(深圳)有限公司 分布式流量控制方法、服务器和系统
WO2015101309A1 (en) * 2013-12-31 2015-07-09 Tencent Technology (Shenzhen) Company Limited Distributed flow control
US20160316029A1 (en) * 2013-12-31 2016-10-27 Tencent Technology (Shenzhen) Company Limited Distributed flow control
CN104753805B (zh) * 2013-12-31 2018-07-24 腾讯科技(深圳)有限公司 分布式流量控制方法、服务器和系统
US10447789B2 (en) 2013-12-31 2019-10-15 Tencent Technology (Shenzhen) Company Limited Distributed flow control
CN107872397A (zh) * 2016-09-27 2018-04-03 阿里巴巴集团控股有限公司 压测过程中的流量调度方法、调度平台和调度系统

Also Published As

Publication number Publication date
WO2011000241A1 (zh) 2011-01-06

Similar Documents

Publication Publication Date Title
CN101227402B (zh) 聚合链路流量分担方法及装置
CN1309225C (zh) 用户带宽监控器及控制管理系统和方法
CA2423317C (en) Method and system for exchanging information between communication networks
US8346082B2 (en) Method of saving power in optical access network
CN101164352B (zh) 一种分流短消息的方法及其系统
JP2006217296A5 (zh)
US9237077B2 (en) Monitoring persistent client connection status in a distributed server environment
WO2003047167A2 (en) Method, system and agent for connecting event consumers to event producers in a distributed event management system
CN101262366B (zh) 目标单板调试方法、系统及分布式设备
CN101984573A (zh) 分布式实现lacp标准状态机的方法及系统
CN101409828A (zh) 视频监控数据传输方法和系统、及视频监控中心服务器
CN101888610A (zh) 一种实现短消息业务的方法、系统和装置
CN101796774A (zh) 在ip网络上自动检查ip链接的连接状态的方法和系统
CN102045451A (zh) 一种统一消息调度系统、业务消息通知方法及系统
CN101938401A (zh) 一种分流集群流量的方法及相关装置
CN101442439B (zh) 一种上报中断的方法和pci总线系统
CN101977396B (zh) 多媒体消息业务中实现网元业务切换的系统及方法
CN104322021A (zh) 终端、路径生成方法以及路径生成程序
CN105721553A (zh) 一种自适应集群消息分发器
CN101695049A (zh) 一种监控系统中的业务处理方法及装置
CN103067205B (zh) 同一主机管理下共用同一地址的rt与备份rt切换方法
US7467199B2 (en) Integrated management system utilizing e-mail for remotely monitoring/controlling over the internet
CN112260893A (zh) 一种基于网络心跳的VxWorks操作系统的以太网冗余装置
CN103209213A (zh) 用于数据订阅的数据传输方法和系统
CN100502431C (zh) 语音信息系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110105