CN100452767C - 用于在数据处理网络中管理信息包通信量的方法及其网络 - Google Patents

用于在数据处理网络中管理信息包通信量的方法及其网络 Download PDF

Info

Publication number
CN100452767C
CN100452767C CNB2005100829097A CN200510082909A CN100452767C CN 100452767 C CN100452767 C CN 100452767C CN B2005100829097 A CNB2005100829097 A CN B2005100829097A CN 200510082909 A CN200510082909 A CN 200510082909A CN 100452767 C CN100452767 C CN 100452767C
Authority
CN
China
Prior art keywords
link
data
information
switch
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2005100829097A
Other languages
English (en)
Other versions
CN1753388A (zh
Inventor
韦斯利·迈克尔·费尔特
奥兰·约科·克里格尔
拉曼克里斯南·拉杰莫尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1753388A publication Critical patent/CN1753388A/zh
Application granted granted Critical
Publication of CN100452767C publication Critical patent/CN100452767C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • H04L43/026Capturing of monitoring data using flow identification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0882Utilisation of link capacity

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种用于在数据处理网络中管理信息包通信量的方法,包括收集表示经过网络互连内每个链路的信息包通信量的数据。收集的数据包括源和目标信息,其表示相应信息包的识别源和目标。于是从所收集的数据中识别一个使用频繁的链路。然后分析与该使用频繁的链路相关的信息包数据来识别一个信息包源和信息包目标组合,该组合在该使用频繁的链路上的信息包通信量中起重要作用。相应地,把与识别的信息包源和信息包目标组合相关的进程例如转移到该网络的另一个节点,以减少使用频繁的链路上的通信量。在一个实施例中,安装在每个互连交换机上的代理为连接到此交换机的互连链路收集信息包数据。

Description

用于在数据处理网络中管理信息包通信量的方法及其网络
技术领域
本发明涉及数据处理网络,尤其涉及在多处理器网络中管理网络信息包的路由。
背景技术
在其中通过一个互连将多个节点相互连接的多处理器系统中,可以使用该互连来传送各种各样的数据,包括与计算机操作相关的数据和与输入/输出(I/O)要求相关的数据。在传统的网络中,并未特别注意到在进程或线程与它们相应节点之间的映射,系统互连的利用可能并不理想。在该互连中的某条物理链路可能被频繁的使用,而其他链路几乎不被使用。如果经过更频繁使用的链路的信息包数量接近链路的带宽极限时,网络性能降低或响应时间变长,而此时在其它链路上仍然存在足够带宽的带宽。当互连使用变得失衡时,希望利用可以转移进程的方法、系统和网络,来更平均地在物理链路上分配信息包。
如果该网络包含数量相对较少的节点和互连链路时,确定哪一个进程可以被有益地转移的任务(如果存在这样的任务的话)是很容易管理的。然而,当节点和互连链路数量增加时,识别和校正不合需要的互连使用模式的难度也显著增加。因此,任何试图解决不平衡的网络使用问题的任何系统或技术都应该是可扩展的,以致节点数量和互连内的交换机数量对该解决方案都没有什么影响。
发明内容
通过根据本发明的一种用于在数据处理网络中管理信息包通信量的方法来实现所确定的目的。该方法包括收集表示经过网络互连内每个链路的信息包通信量的数据。收集的数据包括表示源和目标信息,它们表示相应信息包的来源和目标。于是根据收集的数据识别一组使用频繁的链路。然后分析与该使用频繁的链路相关的信息包数据来识别一个信息包源和信息包目标组合,该组合是使用频繁的链路上的信息包通信量的重要来源。相应地,转移一个与识别的信息包源和信息包目标组合相关的进程以减少使用频繁的链路上的通信量,例如转移到该网络的另一个节点。在一个实施例中,安装在每个互连交换机上的代理为连接到此交换机的互连链路收集信息包数据。该代理为每个正被监控的链路产生一个数据表。该数据表包括对每个在一段监控的周期内经过链路的信息包的条目。每个条目包括与相应的信息包相关的源和目标信息。源信息可以确定网络的源节点而目标信息可以确定目标节点。转移一个与特定的源和目标组合相关的进程可以包括将此进程转移到一个不同的源节点,其中连接此不同的源节点与目标节点的路径不包括使用频繁的链路。
附图说明
根据以下的详细描述并参考附图,本发明的其他目的和优势将会变得清晰可见,其中:
图1是根据本发明一个实施例的数据处理网络中所选择组成部分的示意图;
图2是举例说明图1中数据处理网络的实现方式的补充细节的示意图;
图3是举例说明适于向网络节点分配进程以最小化网络和互连瓶颈的方法及软件代码的实现方式的流程图;
图4是图1中网络节点的实现方式中所选择组成部分的示意图;
图5是适于以本发明一个实施例方式使用的数据表的示意表示;
图6是举例说明根据本发明一个实施例的适于向网络节点分配进程以最小化网络和互连瓶颈的方法及软件代码的实现方式的流程图;
图7是适于本发明一个实施例使用的数据表的示意表示。
在本发明易受多种修改和代替方式时,通过附图中的实例显示本发明具体的实施例并在此对其进行详细描述。然而,应理解到在此所示的附图和详细描述并非想把本发明限制到公开的特定实施例,相反地,其意图在于覆盖如同附加的权利要求所定义的所有落入本发明精神和范围内的修改、等效替换和备选方案。
具体实施方式
一般来说,本发明致力于一种多处理器的数据处理网络以及用于优化网络互连的使用来防止或减少发生由于过度使用相对少量的物理互连链路而引起的性能降低的方法。本发明管理网络内的信息包通信量来分配信息包通信量负荷以致无链路会传送极大于其同等链路的通信量。为了实现此目的,监控互连通信量并将其分类为各个组,其中用源标识符和目标标识符来标记每个组。周期性地向系统软件报告该信息。系统软件将每个互连交换机所提供的“本地”统计数值组合为一个在瓶颈链路上的源-目标通信的全局视图。对于所有经过这些链路的源-目标对,系统软件修改从进程到节点的映射以致该通信量路由经过另一个链路。
现在参见附图,图1举例说明根据本发明一个实施例的数据处理网络100中所选择的组成部分。网络100可以表现为一个多处理网络,其中两个或多个处理器合作以提供一个特定功能性或执行一个特定任务。例如,在一个网络中央应用程序中,包含网络100的系统可以选择性地提供给用户一个网址或其它网络可访问服务。网络100还可以提供一种数据库服务或一种特殊的应用程序。在上下文中,网络100本身可以充当在诸如互联网那样更大的网络内的一个节点。
如图1所示,网络100包括经由互连110相互连接的多个数据处理系统101-108,且在此称为节点101-108。如图1所示,每个节点101-108都以一对逻辑连接与互连110相连。在一个节点与互连110之间的第一连接121(相对于节点101示出)传递来自其它节点的消息,与此同时,在此节点与互连之间的第二连接122经由互连110向其它节点传送消息。在图1中将第一和第二连接121和122区别地示出,以强调它们在该应用程序的范围中的不同功能,但是还应注意到可以通过使用一个通用的物理链路或连接来实现连接121和122。
在一个实施例中,节点101-108都包含基本上相同的硬件和系统软件。如图4所示,每个节点101-108都包括一个或多个通用的微处理器402,其经由一个共享的系统总线405访问在微处理器402中共享的系统存储器404。每个节点101-108还进一步包括网桥406,其提供一个在系统总线405与外围总线410之间的接口,将一个或多个诸如适配器412和414那样的外围设备适配器连接到该接口。作为通用的实例,节点101-108的外围设备适配器可以包括提供对系统内固定存储器的访问的一个网络接口适配器和一个硬盘控制器。
在一个实施例中,网络100表现为包括一个高速缓存相干的、不均匀的存储器体系结构(NUMA)。在一个NUMA系统中,特定节点的处理器具有对节点的系统存储器的“本地”访问。处理器具有对网络100上其它节点的系统存储器的“远程”访问。称此存储器体系结构为不均匀的是由于与本地访问相关的等待时间少于与远程访问相关的等待时间。在网络100的NUMA实现方式中,图1的互连110可以通过一个插入的控制器直接连接到每个节点101的系统总线405(这与常规LAN相反,在常规LAN中,LAN节点经由与外围或I/O总线相连的适配器进行通信)。
现在参见图2,用强调互连110结构的补充细节举例说明了图1的网络100。在图2所示实现方式中,互连110包括一组交换机201-212,这些交换机与节点101-108互连以致存在从一个节点到另一个节点的唯一路径。每个交换机201-212接收来自两个装置的输入并提供输出到另外的两个装置。因此,每个交换机可以把消息从两个装置中的任何一个路由到两个输出装置中的任何一个。可与一个交换机相连的装置包括一个节点或另一个交换机。在此把通往每个交换机和从每个交换机引出的连接称为互连链路或简单链路。因此,每个链路把一个互连装置连接到另一个互连装置。
尽管所示实现方式显示了特定数量的节点和交换机,并且每个交换机被示出为提供在两个输入装置(在交换机左边的装置)和两个输出装置(在交换机右边的装置)之间的连接,由本发明完成其它实现方式,包括带有更多节点和交换机以及具有更复杂的交换机(即把三个或更多的输入装置与三个或更多的输出装置互连的交换机)的实现方式。提出所示实现方式来表达在相对可控制网络情况下的发明构思。
为了举例说明本发明,在图2中示出当一些网络信息包已经通过或正在通过互连110时的时间点上的网络100。称信息包起源的节点为源节点,同时称信息包将要发送到的节点为目标节点。为了清楚起见,用实线表示示例信息包经过的互连链路,同时用虚线表示剩余的链路。用加在所研究的每个链路之上的椭圆内的数字来表示经过每个链路的信息包的数量。
所举实例描述了节点104发送30个信息包到节点105,节点106发送50个信息包到节点105,以及节点108发送20个信息包到节点106且发送10个信息包到节点107。例如,由节点104发送的30个信息包经过从节点104到交换机204的链路215。交换机204根据每个信息包中包含的目标信息,经由链路216将这30个信息包(连同30个来自节点108的其他信息包)路由至交换机208。接着,交换机208将来自交换机204的50个信息包(连同从交换机202接收的50个信息包,总共100个信息包)经由链路220路由至交换机211。最后,交换机211在链路217上将80个信息包(包括来自节点104的30个信息包)路由至节点105(并经由链路218将20个信息包路由至节点106)。经过互连110发送的每个信息包至少包括一个源标识符和一个目标标识符。例如,在简化图中可以看到已经在链路220上从交换机208发送了100个信息包到交换机211,同时剩余的链路都未传送超过80个的信息包,而且很多链路根本就还没有传送任何信息包。
本发明涉及产生使系统能够识别诸如链路220那样的使用频繁的链路的数据,然后转移可能导致对使用频繁的链路的使用的一个或多个进程,以减小对该链路的负担(例如,通过把该进程转移到通向指定目的地但是不经过该使用频繁的链路的路径上)。本发明的优势在于它的可扩展性。特别是,执行本发明以致识别使用频繁的链路的复杂性仅仅随着节点和交换机数量的增加而线性地增加。通过集中每个交换机上的信息包数据来实现此优势。相反地,一种试图通过仅仅根据其源节点和目标节点估计信息包来确定使用频繁的链路的方法的复杂度将会随着节点和交换机数量的增加而指数地增加。
本发明的一部分可以作为一序列或一组存储在计算机可读存储媒体上的计算机可执行指令(计算机软件)而实现。该计算机可读存储媒体可以是诸如硬盘、只读存储器(ROM)装置、CD或DVD光盘、磁带等那样的持续性存储媒体。在执行中,部分软件可以存在于诸如DRAM系统存储器或SRAM高速缓冲存储器那样的易失性存储媒体中。在这样一个实施例中,计算机软件提供这样的功能性,使诸如图1的网络100那样的数据处理网络能够优化其网络链路的使用。
参见图3,描述了根据本发明一个实施例的把正在执行的进程或线程映射到数据处理节点的方法300的流程图。在所示实施例中,方法300包括收集在诸如图2中互连110那样的网络互连内的每个交换机上的信息包统计数值(块302)。暂时参见图5,其中示出根据一个实现方式为每个互连链路收集的统计数值的示意表示。在此示意表示中,为互连110(图2)的每个链路(例如链路220)创建并保存一个数据库或数据表501。
每个交换机201到212包括充分的资源和功能性来为每个与此交换机相连的链路保存诸如表501那样的一个表。为了保留资源使用,大多数交换机都仅仅需要跟踪与其输出端相连的链路或与其输入端相连的链路。例如,参见图2,如果每个交换机为与其输入端相连的链路保存统计数值,显然,仅仅连接到交换机209至212的输出端的链路是不被跟踪的链路。类似地,如果每个交换机都对其输出链路保存统计数值,则仅仅对交换机201至204的输入链路是不被跟踪的链路。为了完全覆盖互连使用模式,交换机的一些子集必须为它们的输入和输出链路保存数据。由考虑到网络100和互连110的结构的系统软件优选地确定由每个交换机跟踪哪一个链路。
因此,根据一个实施例,每个交换机都包括一个代理(一般在软件或固件中实现),该代理能够跟踪被相应的交换机处理或通过相应的交换机的信息包。这些信息包跟踪软件代理在图2中表现为由附图标记230表示的可执行软件代码(为了清楚起见而从一些交换机中省略代理230)。参见图5,由这些交换机代理保存的表501包括一个链路标识符502和一组条目503。每个条目503包括一个源标识符504和目标标识符506。
每个经过互连110的信息包至少包括该信息包的源标记及其目标标记。可以由一个正在执行的进程或线程和/或一个处理中的节点来识别源和目标。每个条目进一步包括一个计数508,顾名思义,该计数表示在具有与条目503相关的源和目标标识符的相应链路上信息包的出现次数。还可以在所述实施例的每个表501中保存所有计数值508的总计数509。
因此,表501提供表示经过一个特定链路的信息包数量的信息以及关于那些信息包的来源和目标的信息。参见图3,在一段特定的持续时间内或时间周期内收集并保存信息包统计数值。然后系统软件判断当前时间周期是否已经过去(块340),如果该时间周期还没有过去,由每个交换机上的代理继续收集信息包统计数值。如果特定时间周期已经过去,就由系统软件将每个表501中的信息包统计数值收集或累积到一个累积数据库中。该系统软件参考存在于一个或多个网络节点上的应用程序或操作系统代码。在图2中,在节点101上安装在此公开内容中所引用的系统软件并用附图标记240来表示。应该理解,可以在任何其他的网络节点上安装系统软件240,而且该软件还可以是安装在多节点上的分布式应用程序。
然后系统软件240识别或选择互连110内的那些被认为是使用频繁的链路(块308)。判断哪些链路被频繁地使用是特殊的实现方式,但是通常根据发送经过一个链路的信息包的总量来判断。可以根据一些特定的阈值(例如超出K的信息包数量)、相对比例(例如信息包数量至少比任何链路上的信息包的数量大10%)或两者的组合为基础执行该判断。
在识别使用频繁的链路之后,系统软件分析经过该链路的信息包来识别频繁出现的源和目标标识符的组合(块310)。频繁出现的源/目标组合表示作为转移候选者的进程或线程。转移侯选者表示如果转移进程到一个不同的源和/或目标也许会导致使用频繁的链路上信息包通信量的减少。例如,如果关于一个频繁出现的源/目标组合的源标识符表示一个被映射到一个特定节点的特定进程,则所指进程可以是向另一个节点转移的候选者。在这种情况中,转移意味着这样一个进程,其中系统软件重新把该进程映射到一个可选择的节点。为了实现所需的对使用频繁的互连链路上的信息包通信量的减少,重新映射该进程到一个节点,可以通过使用不包括使用频繁的链路的一个互连路径从该节点发送信息包到目标。
参见图2,例如,对每一链路信息包数据的分析将识别链路220作为一个使用频繁的链路或瓶颈链路。对相应于链路220的信息包数据的进一步分析表明作为源的节点106和作为目标的节点105的组合占据了对链路220上观察到的100个信息包中50个信息包。相应地,然后系统软件将识别在作为转移候选者的节点106上执行的进程。系统软件知道互连110的结构并因此知道可以将侯选进程转移到该互连。特别是,该系统软件试图将侯选进程转移到一个源节点来减少使用频繁的链路上的信息包通信量而无需在此进程内创建一个不同的使用频繁的链路。在图2中,可以通过将一个正在节点106上执行的进程转移到节点101来实现这些目的。来源于节点101并发往节点105的信息包必须经过交换机201、206和211以到达节点105。与此交换机路径相关的链路不包括链路220也不包括其他任何在其上观察到极大通信量的链路。既然这样,从节点106转移一个进程到节点101会减少链路220上的通信量而不使任何剩余的链路超载。通过消除瓶颈链路并分配负载,这些都对超载作出了贡献,本发明实现了对信息包通信量的有效管理。
上述实现方式依赖于每个具有源/目标信息的信息包(即表示每个信息包的源节点和目标节点的信息)。尽管此实现方式在不是很复杂的网络配置中具有很大实用性时,它可能具有扩展性上的限制。具体来说,当节点数量增加时,保存通过源和目标节点索引的信息包信息的任务的复杂度指数地增加。对于具有成千上万个节点的庞大网络而言,可以理解以上参照图5描述的信息包信息保存会变得效率低下或无法运行(即交换机也许不具有足够的存储或处理能力来保存上述信息包信息)。
针对该潜在的扩展性问题,本发明的一个实施例保存一组减少的或简化的信息包信息,并利用已知网络配置的系统软件来识别最有可能对任何瓶颈链接作出贡献的可能的源/目标组合。通过极大地简化为每个链路保存信息包信息,该实施例充分接受了可扩展性的概念。即使当网络中的节点、交换机和链路数量增加时,由任何单个链路所保存的信息包信息也保存了基本上相同的信息。
现在参见图7,描述了研究中的根据本发明由交换机代理保存的上述表701的实现方式,其与表501类似。在所述实现方式中,每个表701表示与交换机201-212中的一个交换机相应的一个文件并包括识别此交换机的信息704。可选地,省略信息704并用文件位置的文件名表示与每个表701相关的交换机。
在所研究的实现方式中,在上次清除信息708之后,每个条目703对应一个“链路对”且每个条目703包括信息702,该信息702表示链路对和表示已经经过相应链路对(即由信息702标识的链路对)的信息包数量的计数信息708。一个链路对是一个输入链路和一个输出链路的唯一组合。例如,如果一个交换机连接两个输入链路和两个输出链路,就存在与此交换机相关的四个唯一的链路对。
例如,参见图2中表示的实施例,与交换机208相应的表701已经被分配负责跟踪在链路对222/220、222/221、216/220和216/221上的信息包,其中包括一个对于链路对222/220的第一条目703、对于链路对222/221的第二条目703等。此外,对于链路对222/220的第一条目703将包括反映从链路222到链路220所通过的信息包数量的计数值708,该计数值为50,而第二条目将包括反映从链路222到链路221无信息包通过的计数值708,计数值为0。类似地,对于链路对216/220和链路对216/221的条目分别会是50和10。很明显,表701不包括源节点/目标节点信息。每一个交换机仅仅需要确定一个信息包已经经过其链路对中的一对,根据讨论中的链路对来索引表701并为该条目增加计数信息708,而不是确定每一个信息包的源节点和目标节点然后判断要增加哪一个表格条目,这可能需要不希望出现的一段长时间以及交换机内的大量存储空间。还应该理解到参照图7所示和描述的在表701中记录适当的信息所需的处理量大大地小于根据图5中所述实施例执行的处理每个经过一个交换机的信息包所需的时间。在包括多个节点的庞大网络中尤其如此。
根据图7执行的信息包监控和跟踪,需要处于系统水平上的附加处理来识别作为转移侯选者的进程。在该实施例中,了解并访问该网络配置的软件使用表701中所存储的关于每个网络交换机的信息包信息,来为经过一个瓶颈链路或其他任何显示较大通信量的链路的信息包确定最有可能的从源到目标的路径。通过添加适当的链路对计数以获得独立链路信息包计数来识别瓶颈链路(例如,在用于交换机208的表中添加对于链路对222/220和链路对216/220的条目来获得对链路220的信息包计数)。因此识别了可能的从源到目标的路径,然后该软件选择并转移与该源和目标节点相关的一个或多个进程。转移可以包括重新映射在一个进程与执行该进程的节点之间的关联。最好转移到这样一个节点,其中来自该节点的进程在对目标节点产生通信量时,通过一个网络交换机和不包括瓶颈链路的链路路径。该实现方式的优势是极大减少了交换机201-212所需要的进程和/或数据库管理。根据该实现方式的每个交换机只是跟踪经过每个链路对的信息包数量,交换机对链路对负责而无需考虑每个信息包的起始源或最终目标。有利于该解决方法的辅助方式是交换机代理对网络配置的改变是屏蔽的。如果添加或删除节点和/或交换机和链路,本地跟踪每个交换机201-212上的链路对计数信息保持不变。只有系统软件240(图2)需要了解网络变化。
参见图6,其中示出一个流程图,说明根据本发明一个实施例的用于管理网络的方法600的实施例。在所示实施例中,在每个交换机上收集本地信息包统计数值(块602)。在此实现方式中收集的信息包信息优选地只包括经过每个链路的信息包数量而并不包括每个监控的信息包的源节点和/或目标节点。可以根据与以上参照图7所述的交换机相关的链路对来收集和本地存储信息包信息。在所示实施例中,如在块604中所示在一段特定执行时间或时间周期内收集信息包统计数值。
在每段监控持续时间的最后,收集关于每个交换机201-212的链路统计数值(块606),优选地是在节点的中央数据库中,其中存储或执行系统软件240,该持续时间可以是周期性或是非周期性的,这取决于该实现方式。然后以中央数据库中的数据为基础识别一个或多个使用频繁的链路(块608)。
该实施例中对使用频繁的链路的选择可以包括根据在先前的监控周期内经过每个链路的信息包的数量来简单排序或分类该链路。如果根据以上参照图7所述链路对来本地监控和存储链路统计数值,块606中对链路统计数值的累计就可以包括通过添加适当的链路对的值的计数来从链路对数据中导出单个链路统计数值。因此,识别一个或多个最繁重跟踪的链路(块608)。在每个时间周期内识别为最使用频繁的链路数量可以根据实现方式而改变。一些实现方式可以包括信息包的阈值数量,其定义了获得使用频繁的链路资格所需要的信息包最小量。在这种情况中,可能存在无链路被确定为使用频繁(即不需要进程转移)的监控时间段。
然而,如果根据经过这些链路的信息包数量来识别一个或多个链路作为使用频繁的链路,则调用系统软件240,通过分析系统软件240访问的网络配置信息,并结合图7所示改进的链路对数据组,而识别进程转移的潜在候选者。系统软件240可以通过一种因缺少复杂性而合乎需要的方法来识别一个转移侯选者,该方法通过为一个特定的使用频繁的链路确定最有可能紧接着在前的交换机或节点以及最有可能紧接着在后的交换机或节点而识别转移候选者。参见图2,例如,系统软件240在收集关于一个或多个交换机(最好为全体交换机)的链路统计数值之后,识别链路220作为一个使用频繁的链路,这是因为该链路承载了比网络中任何其他链路更多的信息包。
确定了链路220作为一个使用频繁的链路,系统软件240可以确定最有可能紧接着在前的链路作为已经承载了最多通信量的输入链路,该信息还可以在所收集的链路统计数值信息中获得。在所示的实施例中,在链路220上发送信息包通信量的交换机208接收来自两个输入链路(即链路216和链路222)的信息包,已经访问了网络配置信息的系统软件240可以确定。然后系统软件240通过简单比较每个输入链路上信息包数量来识别一个最有可能紧接着在前的交换机。因此,系统软件240可以识别链路216在先前的监控周期内已经承载了比链路222更多的通信量。然后系统软件240可以确定交换机204是到达交换机208的信息包经过的最有可能紧接着在前的交换机。照这样,通过连续地判断最有可能紧接着在前的交换机或节点和在后的交换机或节点,系统软件240可以从交换机208向后和向前推算,直至软件最终确定对识别的使用频繁的链路220上的信息包通信量作出贡献的最有可能的源节点和目标节点组合是作为源的节点104和作为目标的节点105。
通过为交换机204(其本身就是讨论中的最有可能紧接着在交换机208之前的交换机)确定最有可能的紧接着在前的节点或交换机而在该示例中出现一种有趣的情况。具体来说,对交换机204的信息包统计数值表示其30个信息包来自节点104且30个信息包来自节点108。在此情况下,系统软件240可以识别这两个节点,不识别这两个节点或识别其中一个节点(任意地选择或根据至少是最近的选择或其他算法来选择的)作为紧接着在前的节点。判断包括这些替换物中的哪一个取决于系统管理员在标识转移候选者中的主动性。
判断了最有可能导致瓶颈链路的源/节点组合,系统软件240于是可以识别一个或多个与识别的源/目标组合相关或映射的进程。然后系统软件240可以将任何的这种进程转移到不同的一组节点,其中在最近识别的这组源/目标节点之间的路径并不包括任何以上文所述参照图5描述的系统软件相同的方式识别的使用频繁的链路。在图2的实例中,系统软件可以根据它对网络配置的了解来识别从节点104到节点105的路径是对链路220上通信量有贡献的最有可能的源/目标路径。然后系统软件会识别映射到节点104和/或105的进程,如果可能,将它们转移到另一组节点并在块602中重新开始监控信息包。
本领域技术人员通过上述公开内容显然可以看出本发明提出一种在网络环境中管理信息包通信量的机制。应当知道将本发明用详细描述和附图中描述和示出的形式仅仅作为优选实施例。所附权利要求应当被广义地解释为包含所公开的所有优选实施例的变型。

Claims (15)

1.一种在数据处理网络中管理信息包通信量的方法,该网络包括经由互连而相互连接的多个节点,该互连包括多个交换机和互连链路,该方法包括:
收集表示经过所选择链路的信息包通信量的数据;
根据所收集的数据识别使用频繁的链路;
对该使用频繁的链路分析所收集的数据,以识别对该使用频繁的链路上的通信量有贡献的源节点和目标节点组合;以及
转移与所识别的源和目标组合相关的进程,其中由被转移的进程产生的信息包经过除了该使用频繁的链路以外的其他链路所构成的从源到目标的路径。
2.按照权利要求1所述的方法,其中收集表示信息包通信量的数据包括为互连中的每个交换机收集信息包数据。
3.按照权利要求2所述的方法,其中为互连中的每个交换机收集数据包括执行在每个交换机上的代理,其中每个交换机代理配置成监控与交换机相连的所选择链路上的信息包通信量。
4.按照权利要求3所述的方法,其中为每个交换机收集数据包括为每个交换机产生一个数据表,其中每个数据表包括用于与该交换机相关的每个链路对的条目,其中每个条目表示在一段被监控的周期内经过相应链路对的信息包的数目。
5.按照权利要求4所述的方法,其中每个链路对条目对应与该交换机相关的输入链路和输出链路的唯一组合。
6.按照权利要求5所述的方法,其中转移与源和目标组合相关的进程包括将进程转移到一个不同的源节点,其中连接该不同的源节点与目标节点的路径不包括所述使用频繁的链路。
7.按照权利要求1所述的方法,其中分析收集的数据包括识别相关的源和目标信息最普通的组合。
8.一种多处理器网络,包括:
一组节点;
与每个节点相连并使节点相互通信的一组交换机和互连链路;
用于收集表示经过所选链路的信息包数目的链路数据的装置;
用于根据链路数据识别使用频繁的链路的装置;
用于分析链路数据以识别一个候选进程的装置,其中候选进程产生经过该使用频繁的链路的信息包;
用于改变候选进程从第一节点到第二节点之间的映射的装置,其中在把候选进程所产生的信息包映射到第二节点时,该信息包经过一个绕过该使用频繁的链路的路径。
9.按照权利要求8所述的网络,其中每个互连链路把一个源设备连接到一个目标设备,其中从节点组和交换机组中选择源设备和目标设备。
10.按照权利要求9所述的网络,其中用于收集链路数据的装置包括安装在交换机组中每个交换机上的一个代理,其中每个代理配置成为与相应的交换机相连的链路的至少一个子集收集信息包数据。
11.按照权利要求10所述的网络,其中由该代理为每个经过相应链路的信息包收集的信息包数据包括源和目标数据,其表示信息包的来源和目标。
12.按照权利要求11所述的网络,其中每个代理被配置成为链路的每个子集产生一个数据表,每个数据表具有用于每个经过相应链路的信息包的条目,其中数据表中条目的数目表示经过相应链路的信息包的总数。
13.按照权利要求12所述的网络,其中用于识别使用频繁的链路的装置包括用于识别具有超出一个特定阈值的信息包总数的链路的装置。
14.按照权利要求13所述的网络,其中用于分析链路数据的装置包括用于根据源数据和目标数据的组合估计信息包数据来标识频繁出现的源目标组合的装置。
15.按照权利要求10所述的网络,其中链路数据不包括表示信息包的来源和目标的信息,其中用于分析链路数据的装置包括用于连续确定最有可能的紧接着在前和在后的网络装置直至识别一个源节点和目标节点组合为止的装置。
CNB2005100829097A 2004-09-23 2005-07-05 用于在数据处理网络中管理信息包通信量的方法及其网络 Expired - Fee Related CN100452767C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/948,414 2004-09-23
US10/948,414 US7400585B2 (en) 2004-09-23 2004-09-23 Optimal interconnect utilization in a data processing network

Publications (2)

Publication Number Publication Date
CN1753388A CN1753388A (zh) 2006-03-29
CN100452767C true CN100452767C (zh) 2009-01-14

Family

ID=36073838

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100829097A Expired - Fee Related CN100452767C (zh) 2004-09-23 2005-07-05 用于在数据处理网络中管理信息包通信量的方法及其网络

Country Status (3)

Country Link
US (2) US7400585B2 (zh)
JP (1) JP4620525B2 (zh)
CN (1) CN100452767C (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050120752A1 (en) * 2001-04-11 2005-06-09 Brown John T. Substantially dry, silica-containing soot, fused silica and optical fiber soot preforms, apparatus, methods and burners for manufacturing same
US7400585B2 (en) * 2004-09-23 2008-07-15 International Business Machines Corporation Optimal interconnect utilization in a data processing network
US7697459B2 (en) * 2005-01-05 2010-04-13 Intel Corporation Methods and apparatus for identifying a distance-vector route associated with a wireless mesh network
EP1894371A1 (en) * 2005-05-18 2008-03-05 Ninety9.com PTY Ltd. Dynamic address mapping
US7743140B2 (en) * 2006-12-08 2010-06-22 International Business Machines Corporation Binding processes in a non-uniform memory access system
CN101330451B (zh) * 2007-06-20 2013-01-30 华为技术有限公司 数据包的转发处理方法、节点与分组核心装置
JP5074327B2 (ja) * 2008-08-21 2012-11-14 株式会社日立製作所 経路制御システム
US8479215B2 (en) 2009-08-18 2013-07-02 International Business Machines Corporation Decentralized load distribution to reduce power and/or cooling costs in an event-driven system
US8885657B2 (en) * 2009-11-06 2014-11-11 Brocade Communications Systems, Inc. Automatic switch port selection
US9391849B2 (en) * 2009-11-06 2016-07-12 Brocade Communications Systems, Inc. Back pressure remediation
US8593964B1 (en) * 2009-11-06 2013-11-26 Brocade Communications Systems, Inc. Method and system for traffic management
US8891368B2 (en) * 2009-11-06 2014-11-18 Brocade Communications Systems, Inc. Presentation of a selected port
KR101320109B1 (ko) 2010-10-26 2013-10-18 엘지디스플레이 주식회사 평판 표시장치용 인-셀 터치 패널
US8730806B2 (en) * 2012-04-03 2014-05-20 Telefonaktiebolaget L M Ericsson (Publ) Congestion control and resource allocation in split architecture networks
WO2013150691A1 (ja) * 2012-04-06 2013-10-10 株式会社日立製作所 管理サーバ、および、フロー処理方法
CN109039830A (zh) * 2018-09-20 2018-12-18 武汉指针科技有限公司 一种交换机的数据采集方法
CN114936199B (zh) * 2022-07-21 2022-11-11 平安银行股份有限公司 系统重构的数据处理方法、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1304088A (zh) * 2000-01-12 2001-07-18 因芬尼昂技术股份公司 数据处理装置
CN1306644A (zh) * 1999-03-31 2001-08-01 皇家菲利浦电子有限公司 调度无用单元回收的方法
US6275223B1 (en) * 1998-07-08 2001-08-14 Nortel Networks Limited Interactive on line code inspection process and tool

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL99923A0 (en) * 1991-10-31 1992-08-18 Ibm Israel Method of operating a computer in a network
JPH07141303A (ja) * 1993-11-16 1995-06-02 Fujitsu Ltd 並列計算機
US6061331A (en) * 1998-07-28 2000-05-09 Gte Laboratories Incorporated Method and apparatus for estimating source-destination traffic in a packet-switched communications network
JP3546764B2 (ja) * 1999-07-02 2004-07-28 日本電気株式会社 ネットワークに備えられた負荷分散サーバ及び負荷分散サーバを備えるノード
US7027448B2 (en) * 2000-04-21 2006-04-11 At&T Corp. System and method for deriving traffic demands for a packet-switched network
JP3563328B2 (ja) * 2000-06-27 2004-09-08 日本電信電話株式会社 ルート制御システム
US6941252B2 (en) * 2001-03-14 2005-09-06 Mcdata Corporation Striping data frames across parallel fibre channel links
US20040008697A1 (en) * 2002-05-15 2004-01-15 Xyratex Technology Limited Method and apparatus for enabling filtering of data packets
JP3925423B2 (ja) * 2003-02-17 2007-06-06 日本電信電話株式会社 最適迂回ルート制御システムと方法、およびそのプログラムと記録媒体、ならびに通信装置
US7606929B2 (en) * 2003-06-30 2009-10-20 Microsoft Corporation Network load balancing with connection manipulation
US7324553B1 (en) * 2003-09-30 2008-01-29 Packeteer, Inc. Dynamic bandwidth management responsive to access link state in redundant network topologies
US7363386B1 (en) * 2003-11-06 2008-04-22 Sprint Communications Company L.P. Method for estimating a traffic matrix in a communication network using non-stationary data
US7447153B2 (en) * 2004-02-19 2008-11-04 Internap Network Services Corporation System and method for end to end route control
US7729269B1 (en) * 2004-06-09 2010-06-01 Sprint Communications Company L.P. Method for identifying and estimating mean traffic for high traffic origin-destination node pairs in a network
US7400585B2 (en) * 2004-09-23 2008-07-15 International Business Machines Corporation Optimal interconnect utilization in a data processing network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6275223B1 (en) * 1998-07-08 2001-08-14 Nortel Networks Limited Interactive on line code inspection process and tool
CN1306644A (zh) * 1999-03-31 2001-08-01 皇家菲利浦电子有限公司 调度无用单元回收的方法
CN1304088A (zh) * 2000-01-12 2001-07-18 因芬尼昂技术股份公司 数据处理装置

Also Published As

Publication number Publication date
CN1753388A (zh) 2006-03-29
US20080181111A1 (en) 2008-07-31
US7400585B2 (en) 2008-07-15
JP2006094464A (ja) 2006-04-06
US20060062150A1 (en) 2006-03-23
US7821944B2 (en) 2010-10-26
JP4620525B2 (ja) 2011-01-26

Similar Documents

Publication Publication Date Title
CN100452767C (zh) 用于在数据处理网络中管理信息包通信量的方法及其网络
CN102473129B (zh) 输出表示与故障的根本原因对应的恢复方法的信息的管理系统
EP0348328B1 (en) Method of selecting least weight routes in a communications network
US7146417B1 (en) System for distributing load over multiple servers at an internet site
CN102204188B (zh) 虚拟网络单元中的路由计算方法和主节点设备
CA2371121C (en) Database management system with a multiple-level cache arrangement
CN1795446B (zh) 计算机集群及其中的计算机节点和传送状态信息的方法
CN108323232A (zh) 一种多层级区块链系统之间索引与链拓扑结构的维护方法
US8291066B2 (en) Method and system for transaction monitoring in a communication network
JPH05501041A (ja) 高速パケットスイッチング装置および方法
CN102546742B (zh) 管理分布式开关构造系统中的下一跳标识符的方法和装置
CN103870435B (zh) 服务器及数据访问方法
CN102932204B (zh) 内容分发网络的监控方法和监控系统
CN1240004C (zh) 具有可转换路径选择标准的路径计算装置
CN106095589A (zh) 一种分配分区的方法、装置及系统
CN103795575B (zh) 一种面向多数据中心的系统监控方法
US6480881B1 (en) Information access apparatus and method for cooperatively sharing knowledge about information source
CN109660458A (zh) 一种路由方法及设备
CN107908713B (zh) 一种基于Redis集群的分布式动态杜鹃过滤系统及其过滤方法
JPH07273785A (ja) リングシステムにおけるノード間情報収集方式
CN106909322A (zh) 一种虚拟化系统中支持存储灾备的路由方法及装置
CN113965492A (zh) 一种数据流统计方法及装置
CN112988739B (zh) 数据管理和处理方法、装置、计算机系统及可读存储介质
JP5962375B2 (ja) ネットワーク管理システム及び影響判定方法
CN102148847B (zh) 基于reload的客户端接入对等网络的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090114

Termination date: 20120705