CN1608257A - 包括相关矩阵和基于量度分析的聚集系统资源分析 - Google Patents

包括相关矩阵和基于量度分析的聚集系统资源分析 Download PDF

Info

Publication number
CN1608257A
CN1608257A CN02826093.7A CN02826093A CN1608257A CN 1608257 A CN1608257 A CN 1608257A CN 02826093 A CN02826093 A CN 02826093A CN 1608257 A CN1608257 A CN 1608257A
Authority
CN
China
Prior art keywords
network
sec
page
value
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN02826093.7A
Other languages
English (en)
Inventor
C·M·克拉佐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MetiLinx
Original Assignee
MetiLinx
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MetiLinx filed Critical MetiLinx
Publication of CN1608257A publication Critical patent/CN1608257A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0233Object-oriented techniques, for representation of network management data, e.g. common object request broker architecture [CORBA]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/042Network management architectures or arrangements comprising distributed management centres cooperatively managing the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0853Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5009Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

一种用于为了分析网络而收集数据的系统(10)。根据在网络中处理装置内从节点传递到节点的值来收集数据,这些处理装置诸如服务器(20,26,32)。从通过测量装置性能和资源使用获得的特征中产生值。值被对等地传递并在每个接收系统处连续组合,最终获得一值,该值反映一组装置的操作。保持相关矩阵以指示不同装置的值意义的差异。相关矩阵被用来更精确地组合值以实现有意义的合成值(22)。

Description

包括相关矩阵和基于量度分析的聚集系统资源分析
优先权要求
本申请要求2000年10月26日提交的美国临时专利申请No.60/243783的优先权。
相关申请对照
本申请涉及以下共同待批的申请,它们中的每一个都结合在此作为参考,如本申请中完整阐述的。
2001年10月12日提交的标题为“System-Wide Optimization IntegrationModel(全系统优化集成模型)”的美国专利申请(020897-000110US),序号No.09/976368;2001年10月12日提交的标题为“Multi-Platform OptimizationModel(多平台优化模型)”(020897-000120US),序号No.09/976518;以及2001年10月26日提交的标题为“Application Program Interface for OptimizationIntegration Model(用于优化模型的应用程序接口)”(020897-000140US)的美国专利申请,序号No.10/055404。
发明背景
现在在商业、教育、研究和娱乐的许多方面广泛地采用诸如因特网的数字计算机网络。由于处理大量通信量的需要,许多因特网站点都用几组服务器计算机进行设计。图1A中示出了站点网络系统的一个实例。
图1A中,网络系统10包括4个主分层。它们是通信层12、网络层14、应用层16和数据库层18。每个层都表示一组服务器计算机或者其它处理、存储或通信系统之间的接口。每个接口都处理两组服务器计算机之间的通信。应注意,层是很重要的,因为它们表示通信协议、路由选择、通信量控制和与服务器计算机组之间的信息传输有关的其它特点。如现有技术所示,软件和硬件可以用于执行由每个层表示的通信功能。
服务器计算机由诸如20的框示出。数据库22和因特网24由符号表示并可以包含任意数量的服务器、处理系统或其它装置。组中的服务器通常与邻近组中的一个或多个计算机通信,如这些组之间的层限定和控制的。例如,从因特网接收到对信息(例如,数据库的记录)的请求并将该请求引导到Web-Com(网络通信)服务器组中的服务器计算机26。从而,在通信层12中产生通信。
服务器计算机26可以要求由应用服务器组中的多个计算机(诸如计算机20、28和30)进行处理。那样的处理请求在网络层14上转移。接着,应用服务器组中被请求的计算机可以经由应用层16调用数据库服务器组中的计算机32、34、36和38。最后,被调用的计算机经由数据库层18作出数据库22的请求。所返回的记录通过这些层和服务器被传送回因特网24以完成对信息的请求。
现今的大而复杂的网络系统中所关心的是监控系统的性能和优化系统。现有技术方法监控系统性能的一种方式是在网络中的特定点处使用一进程以便将数据报告回诸如控制台40的中央位置。在图1A中,可以通过在服务器26处用一进程记录该请求的时间和性质来监控对数据库记录的请求。随后服务器20处的进程记录从服务器26接收到请求的时间。同样,服务器32(或者从服务器20接收到数据库请求的任一服务器)记录它参与入该事务(transaction)中。被记录的事务的这个“链”由图1A中的粗体箭头示出。
在这种方式中,监控系统的现有技术可以确定花费多长时间使得对记录的请求通过网络。还可以在其它方向上跟踪该事务,以确定花费多长时间来完成所述请求。这种数据记录的性质是很复杂的,因为一个层或组中的服务器会要求多个其它服务器的帮助或处理。而且,会在不同的时间点处要求不同的服务器。请求、处理和事务的速度能引起大量数据快速地记录。在某些较晚的时候,数据被传送到控制台40。控制台40解析该数据并产生关于系统性能的有意义的结果,该结果可以由管理员进行分析。
现有技术方法的问题在于记录进程是分离的且即使有也只进行很少的相互通信。这意味着未能精确地分析进程、服务器等之间的复杂的相关性。记录进程趋向于在执行该进程的主机服务器中产生高开销。一种方法使用控制台来轮询进程。大量进程的频繁轮询也会产生过度开销。由于使用不同的平台且缺乏更多的全面分析,妨碍了基于现有技术方法的优化和性能改善。必须每隔一段时间将数据堆到控制台,随后解析该数据,最终意味着不能实时进行监控。
因此,需要提供一种系统,它改善了现有技术中的一个或多个缺点。
发明概述
本发明提供了一种用于为了分析网络而收集数据的系统。该数据是根据网络中诸如服务器等的处理装置内从节点到节点传递的值而收集的。用通过测量装置性能和资源使用情况所获得的特性来产生所述的值。该值被对等传递并在接收系统处接连地与值组合,从而最终获得一反映一组装置的操作情况的值。维持一个相关矩阵以指示来自不同装置的值含义的差异。相关矩阵被用来更精确地把值组合起来以实现有意义的合成值。
在一个实施例中,本发明提供了一种用于收集关于网络操作信息的方法,其中所述网络包括多个装置,所述方法包括在网络中的多个装置间使用对等通信以获得网络性能的测量。
附图概述
图1A示出现有技术系统中测量的网络性能;
图1B示出根据本发明测量的网络性能;
图2A示出本发明中传递的智能对象和性能值;
图2B示出本发明的架构组件;以及
图2C示出具有多平台的网络系统。
具体实施方式
本发明的一优选实施例加入到在MetiLinx,Inc.制造和供销的产品、文件和其它系统及材料中,作为一套称作“Metilinx iSystem Enterprise”系统的产品。Metilinx系统被设计成监控和优化数字网络,尤其是大因特网应用中许多计算机服务器的网络,诸如技术支持中心、网页服务器、数据访问等等。
本发明的系统使用称为“智能对象(intelligence objects)”(IOs)的软件机制,该智能对象在网络中的各种服务器、计算机或其它处理平台上执行。智能对象用于获得关于一个过程或多个过程、硬件操作、资源使用或影响网络性能特点的其它因素的性能的信息。智能对象间传递值,从而可以导出表示大部分网络的性能的合成值。
图2A示出智能对象和值的传递。图2A中,诸如102和104的智能对象驻留在计算机服务器中。任意数量的智能对象都可以驻留在一个服务器计算机中且n层系统中的任意数量的服务器计算机都可以配置一个或多个智能对象。第一类型的智能对象是称为系统等级对象(SLO)的软件进程,它可以监控和报告在其主机计算机服务器中操作的其它进程或硬件的一个或多个方面。被称为事务等级对象(TLO)的第二类型的智能对象被设计成监控关于其主机计算机或该主机计算机内执行的进程的事务负荷。
在一个实施例中,IO 102测量其主机计算机的性能特性并将该特性表示成二进制值。由于仅仅是主机计算机的测量或关于该主机计算机的事务信息的测量,该值被称作“局部”使用值。该局部使用值被传递到IO 104。IO 104可以修改该传递的值,以便包括它自己的主机计算机的测量。修改后的值称作“合成”使用值。该合成使用值可以转而传递到连续加建或添加测量的其它智能对象,从而实现经过多个计算机、多个层、多个操作系统、多个应用程序等的性能。
最后,该使用值或多个使用值被传递到其它过程,它可以将组合测量的结果显示给用户,使用该结果导出其它结果,使用该结果来自动优化n分层的系统,或者使用该结果于其它目的。本发明的一个方面用于根据计算机或节点的估计使用值重定向过程和网络上的互连,以便改善或优化网络性能。执行该重定向的过程称作“过程重定向对象”、
应注意,虽然有时候相对于多层服务器结构讨论本发明,但服务器、计算机、数字处理器等的任意结构都是可以的。术语“处理装置”用于表示能对数据执行功能的任何硬件。处理装置包括服务器、计算机、数字处理器、存储装置、网络装置、输入/输出装置等等。网络无需在多层的处理装置结构中,而是可以使用任何的结构、拓扑、互连等等。网络的任何类型的物理或逻辑组织结构的适合与本发明一起使用。
图2B示出本发明更具体组件的一种可能结构。应注意,用于本说明书中的术语“部件”包括任何类型的处理装置、硬件或软件,它们可以存在于数字处理器或系统内或者可以由数字处理器或系统执行。
诸如图1、2A和2B所示的系统与任何类型的网络系统一起可以具有IOs。在优选实施例中,IOs可以安装在分布式对等架构中网络内的每个服务器上。该IOs测量服务器组件、资源等的实时工作情况,以便实现网络工作情况和性能的整体测量。
在上述共同待批的申请中提供了一种软件系统,它用于用节点扩充(populate)网络,并用于监控、分析、管理和优化网络。
一优选实施例收集低等级系统上的数据和网络参数,诸如CPU使用、网络使用、延迟等等。使用了约400个不同的测量参数。以下的表I列出了较佳实施例中监控的某些特性。
表I开始
系统                                        文件控制操作/sec
文件读取操作/sec                            文件控制操作/sec
文件写入操作/sec                     35     文件写入字节/sec
文件控制字节/sec                        APC旁路/sec
环境切换(context switches)/sec
系统调用/sec                      35    存储器
%总处理器时间                          可用字节
%总用户时间                            确认字节(committed bytes)
%总特许时间                            确认限制(commit limit)
总中断/sec                              写入备份/sec
系统允许时间(system up time)      40    转换故障/sec
排列整理(alignment fixups)/sec          超高速缓存故障/sec
例外发送(exception dispatches)          请求零故障/sec
/sec                                    页面/sec
浮动模拟(floating emulation)            页面输入/sec
/sec                              45    页面读取/sec
%总DPC时间                             页面输出/sec
%总中断时间                            页面写入/sec
总DPC队列/sec                           池(pool)页面字节
总DPC速率                               池非页面字节
总DPC旁路/sec                     50    池页面分配
总APC旁路/sec                           池非页面分配
%使用中的登记份额(registry             自由系统页面表输入
quota in use)                           超高速缓存字节
                                        超高速缓存字节峰值
处理器                            55    池页面驻留字节
%处理器时间                            系统代码总字节
%用户时间                              系统代码驻留字节
%特许时间                              系统驱动器总字节
%DPC时间                               系统驱动器驻留字节
%中断时间                        60    系统超高速缓存驻留字节
中断/sec                                %使用中的确认字节
DPC队列/sec                             %使用中的确认字节
DPC速率
DPC旁路/sec                             物理盘
当前盘队列长度                  当前盘队列长度
%盘时间                   25   %盘时间
平均盘队列长度                  平均盘队列长度
%盘读取时间                    %盘读取时间
平均盘读取队列长度              平均盘读取队列长度
%盘写入时间                    %盘写入时间
平均盘写入队列长度         30   平均盘写入队列长度
平均盘sec/转换                  平均盘sec/转换
平均盘sec/读取                  平均盘sec/读取
平均盘sec/写入                  平均盘sec/写入
盘转换/sec                      盘转换/sec
盘读取/sec                 35   盘读取/sec
盘写入/sec                      盘写入/sec
盘字节/sec                      盘字节/sec
盘读取字节/sec                  盘读取字节/sec
盘写入字节/sec                  盘写入字节/sec
平均盘sec/转换             40   平均盘字节/转换
平均盘sec/读取
平均盘sec/写入                  线程
                                %处理器时间
逻辑盘                          %用户时间
%自由空间                 45   %特许时间
自由兆字节                      环境切换/sec
消逝时间                        对象
当前优先级(priority switches)   进程
优先级基础(priority base)       线程
起始地址                        事件
线程状态                   60   信号量(semaphores)
线程等待原因                    互斥(mutexes)
ID进程                          节(section)
ID线程
                                服务器
总字节/sec                         借用的工作项
接收的字节/sec                     工作项不足
发送的字节/sec               35    当前客户
会话时间超时(time out)             接收的字节/sec
会话错误Out                        发送的字节/sec
会话记录Off                        转换的字节/sec
会话作用(forced)Off                读取操作/sec
错误登录                     40    读取字节/sec
错误访问允许                       写入操作/sec
错误准许访问                       写入字节/sec
错误系统                           总字节/sec
阻断拒绝的请求                     总操作/sec
工作项不足                   45    环境阻断队列/sec
打开文件总数
文件打开                           CPU性能
服务器会话                         处理器ID
文件目录查找                       次要故障
池非页面字节                 50    主要故障
池非页面故障                       内处理器交分支调用
池非页面峰值                       中断
池页面字节                         中断作为线程
池页面故障                         环境切换
池页面峰值                   55    非故意环境切换
环境块队列/sec                     线程移动
登录/sec                           互斥旋转
登录总数                           读取器/写入器旋转锁定
                                   系统调用
服务器工作队列              60    用户时间百分比
队列长度                           系统时间百分比
有效线程                           等待时间百分比
可用线程                           空闲时间百分比
可用工作项                         CPU的处理器组成员
read()+readv()系统调用                 rw写入器故障
write()+witev()系统调用                加载的时间可加载模块
分支                             35    不加载的时间可加载模块
vforks                                 物理块写入(async)
execs                                  尝试获得rw锁定
由rdwr()读取的字节                     reg窗口用户溢出
由rdwr()写入的字节                     reg窗口用户下溢
终端输入字符                     40    reg窗口系统溢出
规范模式中处理的字符                   reg窗口系统下溢
终端输出字符                           reg窗口系统用户溢出
报文计数(msgrcv()+msgsnd()             procs等待块I/O
calls)                                 页面回收(包括出页面)
                                 45    来自自由列表的页面回收
CPU性能                               进页面
信号量ops计数(semop()调用)             进页面的页面
路径名查找                             出页面
ufs_iget()调用                         出页面的页面
目录块读取                       50    换入
采用贴附页面的索引节点(inode)          换入的页面
不采用贴附页面的索引节点               换出
索引节点表溢出                         换出的页面
文件表溢出                             请求上填充的页面零
proc表溢出                       55    代理进程或自动释放的页面
中断作为线程(时钟以下)                 由出页面代理进程检查的页面
intrs blkd(swtch)                      页面代理进程支配的循环
时间空闲线程时间表                     (revolution of the pagedaemon hand)
非故意内容切换                         经由hat_fault()的次要页面错误
thread_create()s                 60    经由as_fault()的次要页面错误
通过线程的cpu移动                      主要页面错误
对其它cpu的xcall                       copy-on-write错误
故障的互斥输入(适应的)                 保护故障
rw读取器故障                           由于软件锁定req引起的故障
核心地址空间中的as_fault()s            中断统计
排定的时间页面调度程序                 时间定时器统计
进页面的可执行页面               35    I/O统计
出页面的可执行页面
释放的可执行页面                       网络
进页面的即时(anon)页面                 分组记录和描述
出页面的即时页面                       RPC响应时间
释放的即时页面                   40
进页面的fs页面                         虚拟存储器
出页面的fs页面                         运行队列中的进程
释放的fs页面                           可运行但交换的进程
                                       虚拟和实际存储器
文件系统                        45    当前可得的交换空间
文件访问系统程序                       空闲表的大小
缓存活动                               页面故障和页面活动
每秒的数据转移                         页面回收
系统缓存的访问                         次要错误
超高速缓存器命中率               50    进页面的千字节
原始转移                               出页面的千字节
系统调用                               释放的千字节
特殊系统调用                           预期的短期存储器不足
字符转移                               通过时钟算法扫描的页面
块装置活动                       55    每秒的盘操作
装置负荷率                             俘获/中断率(每秒)
平均等待时间                           装置中断
平均服务时间                           系统调用
物理块读取                             CPU环境切换
物理块写入(同步+异步)            60    CPU时间的百分比使用
逻辑块读取                             用户时间
逻辑块写入                             系统时间
                                       空闲时间
核心统计(KSTATS)                      交换入
交换出
交换入的页面                              虚拟存储器
交换出的页面                        35    交换入的页面
                                          交换出的页面
进程                                     存储器总量
分支                                      使用中的存储器量
vforks                                    当前未使用的实际存储器
Iexecs                              40    共享存储器的总量
cpu环境切换                               用于缓存的存储器
装置中断                                  总交换空间
俘获                                      使用的盘交换
系统调用                                  空闲交换空间
总名称查找                          45    超高速缓存存储器
用户cpu
系统cpu                                   网络
空闲cpu                                   对于每个接口:
等待cpu                                   从系统引导接收的分组数量
进程开始时间                       50     从系统引导接收的损坏分组的数量
用于该进程的usr+sys cpu时间               接收但掉落的分组数量
用于所获儿子的usr+sys cpu时间             具有帧错误的接收分组数量
优先级                                    发送分组的数量
最近cpu时间的百分比                       发送期间的错误数量,即后来检测
进程使用的系统存储器的百分比       55     的冲突
                                          掉落分组的数量
CPU性能                                  发送期间冲突的数量
用户时间                                  发送期间载体丢失的数量
系统时间                                  分配的缓存器
空闲时间                           60     每协议的插槽使用
优良(nice)时间                            每协议的资源使用
平均负荷                                  核心ARP表
进程数量
运行队列长度                              网络
具有统计的网络装置                            库的页面数量
列出装置正在收听的Layer2多播组                脏页面数量
(接口索引,标签,参考数量,界地址35
数量)                                         物理盘
是‘代码’的页面数量                          I/O统计
数据/堆栈的页面数量                           对整个盘而非仅仅分区的读取请求
网络装置状态                                  数
防火墙链连接                            40    对整个盘的写入请求数
防火墙链                                      来自整个盘的读取块数
网络统计                                      来自整个盘的写入块数
原始装置统计
路由超高速缓存                                逻辑盘
插槽统计                                45    忙时
                                              平均队列长度
进程                                         读取/写入的扇面
分支                                          读取/写入的块
cpu环境切换                                   平均等待时间
装置中断                                50
状态(R,S,D,Z,T)                           普通设置
次要故障                                      局部响应进程等待时间
主要故障                                      局部资源访问等待时间(物理和虚
时间片                                        拟存储器,hdd,插槽等等)
用户模式瞬间(jiffies)                   55    跨越的资源访问等等时间(物理和
核心模式瞬间                                  虚拟存储器,hdd,插槽等等)。组织通
优良值                                        过功能组的系统进程流
超时瞬间                                      节点间的单个弧等待时间
可用时间瞬间                                  跨越子网络的组合弧
虚拟存储器大小                          60    处理器时间片分配
页面的驻留数量                                特定分层中功能资源弧分析
总程序大小                                    标准和本地常数评估(关于网络服
存储器内部分的大小                            务器,数据库服务器和不同的应用程序
共享的页面数量                                服务器)
协调的功能资源弧分析                 5    事务优先级
协调的本地传感器数据和协调的多            表I结束
平台数据的功能资源弧分析
应用程序优先级
在每个节点处产生数据,作为反映用于该节点的主机处理系统特性的四字节值。这些值称作局部节点值(LNVs)。来自不同节点的多个LNVs被组合成称作合成节点值(CNV)的合成值。CNVs还可以包括由其它节点传递的CNVs。
CNVs的尺寸保持4个字节。CNV沿网络层次传递并用于通过与连续节点处的LNV组合来获得进一步的合成值,从而合成值中最终提供整体系统性能。通常将节点值传播组织成组织的和功能的块,如相关申请中描述的。通常节点值传播在相关性的方向中,或者与请求流相反。但是,由于请求流和相关性松散地衣服于任何特定网络(并可以随时间变化),本发明的系统可以适合于改变条件。通常,节点值的传递可以动态地变化,可以一对多或者多对一,并且是双向的。因此,与图1A中示出的现有技术系统的限制方向“链”不同,本发明的系统可以提供柔性的对等的值传递。来自许多节点的性能和使用信息可以以各种方式组合,以便实现更通用的分析结构,诸如图1B所示(通过粗体箭头)。
当然,在其它实施例中,局部和组合值可以是任意大小,变化的大小等等。与“值”相对,该值可以是更复杂的数据结构。可以测量网络特性的任何组合。
LNVs和CNVs由四个子值组成。每个子值是具有较高值(例如,255)的数据字节,它表示子值的有关网络属性中的最佳功能。第一子值是系统平衡值(SBV)。SBV测量功能组内服务器节点的平衡操作。功能组由用户/管理员指定并由本发明的系统使用以便限定组,在该组中CNVs累积值。较高的SBV值表示服务器节点的功能分组以良好的平衡进行操作。
第二子值是系统使用值(SUV)。根据单个或聚集的资源节点的分析,SUV表示系统资源使用。较高的值表示更有效地使用资源。
第三子值是性能优化值(POV)。该POV表示对系统资源的响应或速度的量度。较高的值表示响应时间较短,或者响应速度较高。
第四和最末子值被称为MetiLinx优化值(MOV)。该MOV表示整个系统优化的程度。较高的值表示更好地平衡功能组。MOV反映平衡、资源使用和响应速度的其它子值。
为了有目的地合成从其它节点接收到的LNV和CNV值,每个节点保持“相关矩阵”。该相关矩阵包括数量权重因数,它们是根据在网络中的不同节点环境的特征的不同。例如,可以为系统中的每个节点保持最佳性能值。可以在90%的使用和3秒响应的最佳性能组合处记录节点A。节点B可以具有2秒响应的90%的使用。当节点C接收到表示用于每个节点的3秒响应的90%使用的LNV或CNV值时,节点C现在意识到节点A的主机环境正以较高的性能工作同时节点B的环境以低于理想使用的使用状况工作,这是因为响应时间比以前实现的要慢。在从节点A和B值中产生CNV时,节点C的过程根据相关矩阵通过权重组合使用和响应时间。在该简化实例中,如果“A”是节点C与节点A的使用的相关性(用于节点C的有效操作和使用),同时“B”是节点C与节点B的使用的相关性,则节点C处的CNV可以计算为A+(B*2)/3。
根据该节点从其它节点接收到的信息来更新每个节点的关联矩阵。例如,如果节点C被通知节点B现在以1秒响应时间的90%的使用进行操作,则更新相对于节点B的节点C的关联矩阵因数。应注意,关联矩阵是多维的。采用简化的实例,可以是用于每个节点的使用比响应时间的二维阵列。
在较佳实施例中,相关矩阵局部地存储到节点过程。通常,相关矩阵驻留在节点的主机处理系统中的快速RAM中。但是,其它实施例可以使用相关矩阵的变化并可以以不同的方式保持和存取该相关矩阵。例如,相关矩阵可以存储在中央控制台计算机上并从其访问。
例如,当管理员停用节点、关闭(bring down)节点的主机处理器等时,可以将节点从网络移除。当关闭(bring down)节点时,本发明的优化系统通信被路由到不同的节点。将关闭的节点的相关矩阵转移到一个或多个节点是有利的,其中通信被重新路由到这一个或多个节点,从而不必重新创建相关矩阵中的信息。
本发明的优选实施例使用变化的等待周期以允许节点收集特性数据从而以变化的频率产生局部值。例如,等待周期可以从0变到100。较大的数字表示较少频繁地获得特征。等待周期的值0表示尽可能频繁地获得特性值。当然,较低的等待周期表示主机CPU花费更多的时间获得特性数据和产生值。
虽然以相对于特殊实施例讨论了本发明,但这些实施例仅仅是说明性的,并非限制性的。
因此,本发明的范围仅由所附权利要求书限定。

Claims (3)

1.一种收集关于网络操作的信息的方法,其中所述网络包括多个装置,其特征在于,所述方法包括:
在网络内的多个装置之间使用对等通信以获得对网络性能的测量。
2.如权利要求1所述的方法,其特征在于,还包括:
用数值表示网络中第一装置的特性;
用第二值表示网络中第二装置的特性;
用相关矩阵组合第一和第二值以获得对网络性能的测量。
3.如权利要求1所述的方法,其特征在于,还包括:
获取对网络中第一装置的多个特性的测量;
使用所测量的多个特性生成一值,其中所述值包括以下内容中的一个或多个:与第一装置关联的装置运行情况的测量,第一装置的一个或多个资源利用情况的测量,第一装置的响应速度的测量,网络优化的测量。
CN02826093.7A 2001-10-26 2002-05-01 包括相关矩阵和基于量度分析的聚集系统资源分析 Pending CN1608257A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/040,012 2001-10-26
US10/040,012 US7379994B2 (en) 2000-10-26 2001-10-26 Aggregate system resource analysis including correlation matrix and metric-based analysis

Publications (1)

Publication Number Publication Date
CN1608257A true CN1608257A (zh) 2005-04-20

Family

ID=21908588

Family Applications (1)

Application Number Title Priority Date Filing Date
CN02826093.7A Pending CN1608257A (zh) 2001-10-26 2002-05-01 包括相关矩阵和基于量度分析的聚集系统资源分析

Country Status (5)

Country Link
US (1) US7379994B2 (zh)
EP (1) EP1444595A4 (zh)
CN (1) CN1608257A (zh)
MX (1) MXPA04003956A (zh)
WO (1) WO2003038642A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908572A (zh) * 2017-11-21 2018-04-13 四川巧夺天工信息安全智能设备有限公司 一种重组NAND‑Flash芯片数据的方法
CN111865781A (zh) * 2019-04-25 2020-10-30 伊姆西Ip控股有限责任公司 用于路径优化的方法、设备和计算机程序产品

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020078184A1 (en) * 2000-12-18 2002-06-20 Eiji Ujyo Record medium, multicast delivery method and multicast receiving method
JP4254071B2 (ja) * 2001-03-22 2009-04-15 コニカミノルタビジネステクノロジーズ株式会社 プリンタ,サーバ,監視装置,プリントシステムおよび監視プログラム
US6643613B2 (en) * 2001-07-03 2003-11-04 Altaworks Corporation System and method for monitoring performance metrics
US7076695B2 (en) * 2001-07-20 2006-07-11 Opnet Technologies, Inc. System and methods for adaptive threshold determination for performance metrics
US7020659B2 (en) * 2001-08-15 2006-03-28 Oic Acquistion I Corporation System and method for managing bi-directional relationships between objects
US7240213B1 (en) 2002-03-15 2007-07-03 Waters Edge Consulting, Llc. System trustworthiness tool and methodology
US7457864B2 (en) * 2002-11-27 2008-11-25 International Business Machines Corporation System and method for managing the performance of a computer system based on operational characteristics of the system components
US7397766B2 (en) * 2004-03-31 2008-07-08 Lucent Technologies Inc. High-speed traffic measurement and analysis methodologies and protocols
US20060020634A1 (en) * 2004-07-20 2006-01-26 International Business Machines Corporation Method, system and program for recording changes made to a database
US20070133520A1 (en) * 2005-12-12 2007-06-14 Microsoft Corporation Dynamically adapting peer groups
US7613703B2 (en) 2004-09-30 2009-11-03 Microsoft Corporation Organizing resources into collections to facilitate more efficient and reliable resource access
US7640299B2 (en) * 2004-09-30 2009-12-29 Microsoft Corporation Optimizing communication using scaleable peer groups
US8090880B2 (en) 2006-11-09 2012-01-03 Microsoft Corporation Data consistency within a federation infrastructure
US20110082928A1 (en) 2004-10-22 2011-04-07 Microsoft Corporation Maintaining consistency within a federation infrastructure
US8095600B2 (en) * 2004-10-22 2012-01-10 Microsoft Corporation Inter-proximity communication within a rendezvous federation
US20060090003A1 (en) * 2004-10-22 2006-04-27 Microsoft Corporation Rendezvousing resource requests with corresponding resources
US8095601B2 (en) * 2004-10-22 2012-01-10 Microsoft Corporation Inter-proximity communication within a rendezvous federation
US8014321B2 (en) * 2004-10-22 2011-09-06 Microsoft Corporation Rendezvousing resource requests with corresponding resources
US8549180B2 (en) 2004-10-22 2013-10-01 Microsoft Corporation Optimizing access to federation infrastructure-based resources
US8392515B2 (en) * 2004-10-22 2013-03-05 Microsoft Corporation Subfederation creation and maintenance in a federation infrastructure
US8806490B1 (en) 2004-12-08 2014-08-12 Cadence Design Systems, Inc. Method and apparatus for managing workflow failures by retrying child and parent elements
US8244854B1 (en) * 2004-12-08 2012-08-14 Cadence Design Systems, Inc. Method and system for gathering and propagating statistical information in a distributed computing environment
US8108878B1 (en) 2004-12-08 2012-01-31 Cadence Design Systems, Inc. Method and apparatus for detecting indeterminate dependencies in a distributed computing environment
US7979870B1 (en) 2004-12-08 2011-07-12 Cadence Design Systems, Inc. Method and system for locating objects in a distributed computing environment
JP4722944B2 (ja) * 2005-01-07 2011-07-13 トムソン ルーターズ グローバル リソーシーズ データベースの分散ロードのためのシステム、方法およびソフトウェア
US7529185B2 (en) * 2005-01-26 2009-05-05 International Business Machines Corporation Method, system and program product for determining bandwidth consumption across a multi-tiered computer environment
US7610293B2 (en) * 2006-10-11 2009-10-27 Oracle International Corporation Correlation of resource usage in a database tier to software instructions executing in other tiers of a multi tier application
US7958142B2 (en) * 2007-09-20 2011-06-07 Microsoft Corporation User profile aggregation
US8135824B2 (en) * 2007-10-01 2012-03-13 Ebay Inc. Method and system to detect a network deficiency
US7840653B1 (en) 2007-10-25 2010-11-23 United Services Automobile Association (Usaa) Enhanced throttle management system
US8418174B2 (en) * 2008-02-14 2013-04-09 International Business Machines Corporation Enhancing the scalability of network caching capability in virtualized environment
WO2009158280A1 (en) * 2008-06-25 2009-12-30 Veloxum Llc Systems and methods for tuning an operating system, application, or network component
JP5217886B2 (ja) * 2008-10-14 2013-06-19 富士通株式会社 ループバック装置及びミラーリング方法
US20100153780A1 (en) * 2008-12-12 2010-06-17 Sergej Kirtkow Techniques for generating a reusable test script for a multiple user performance test
US20100153087A1 (en) * 2008-12-12 2010-06-17 Sergej Kirtkow Techniques for generating a reusable test script for a single user performance test
US8131842B1 (en) * 2009-02-11 2012-03-06 Charles Schwab & Co., Inc. System and method for collecting and displaying information about many computer systems
US8489565B2 (en) * 2009-03-24 2013-07-16 Microsoft Corporation Dynamic integrated database index management
US8516449B2 (en) * 2009-07-14 2013-08-20 International Business Machines Corporation Detecting and localizing security vulnerabilities in client-server application
US8265974B2 (en) * 2009-11-13 2012-09-11 Bank Of America Corporation Technological infrastructure consumption index
US9021046B2 (en) * 2010-01-15 2015-04-28 Joyent, Inc Provisioning server resources in a cloud resource
US8495217B2 (en) * 2010-09-30 2013-07-23 International Business Machines Corporation Mechanism for preventing client partition crashes by removing processing resources from the client logical partition when an NPIV server goes down
US8555276B2 (en) 2011-03-11 2013-10-08 Joyent, Inc. Systems and methods for transparently optimizing workloads
US9576252B2 (en) * 2011-04-29 2017-02-21 Accenture Global Services Limited Test operation and reporting system
JP2013125355A (ja) * 2011-12-13 2013-06-24 Fujitsu Ltd 演算処理装置および演算処理装置の制御方法
US8468251B1 (en) * 2011-12-29 2013-06-18 Joyent, Inc. Dynamic throttling of access to computing resources in multi-tenant systems
US8547379B2 (en) 2011-12-29 2013-10-01 Joyent, Inc. Systems, methods, and media for generating multidimensional heat maps
US8782224B2 (en) 2011-12-29 2014-07-15 Joyent, Inc. Systems and methods for time-based dynamic allocation of resource management
US9665630B1 (en) * 2012-06-18 2017-05-30 EMC IP Holding Company LLC Techniques for providing storage hints for use in connection with data movement optimizations
JP6079065B2 (ja) * 2012-08-31 2017-02-15 富士通株式会社 情報処理装置,処理方法及びプログラム
TW201414241A (zh) * 2012-09-28 2014-04-01 Ibm 同步化一叢集中之多個資訊設備之slm狀態的方法、裝置與電腦程式產品
US8881279B2 (en) 2013-03-14 2014-11-04 Joyent, Inc. Systems and methods for zone-based intrusion detection
US9104456B2 (en) 2013-03-14 2015-08-11 Joyent, Inc. Zone management of compute-centric object stores
US8677359B1 (en) 2013-03-14 2014-03-18 Joyent, Inc. Compute-centric object stores and methods of use
US8943284B2 (en) 2013-03-14 2015-01-27 Joyent, Inc. Systems and methods for integrating compute resources in a storage area network
US8826279B1 (en) 2013-03-14 2014-09-02 Joyent, Inc. Instruction set architecture for compute-based object stores
US8793688B1 (en) 2013-03-15 2014-07-29 Joyent, Inc. Systems and methods for double hulled virtualization operations
US8775485B1 (en) 2013-03-15 2014-07-08 Joyent, Inc. Object store management operations within compute-centric object stores
US9092238B2 (en) 2013-03-15 2015-07-28 Joyent, Inc. Versioning schemes for compute-centric object stores
CN103259682A (zh) * 2013-05-16 2013-08-21 浪潮通信信息系统有限公司 一种基于多维数据聚合的通信网网元安全评估方法
US20150035823A1 (en) * 2013-07-31 2015-02-05 Splunk Inc. Systems and Methods for Using a Three-Dimensional, First Person Display to Convey Data to a User
US10380799B2 (en) 2013-07-31 2019-08-13 Splunk Inc. Dockable billboards for labeling objects in a display having a three-dimensional perspective of a virtual or real environment
US9712455B1 (en) * 2014-11-13 2017-07-18 Cisco Technology, Inc. Determining availability of networking resources prior to migration of a server or domain
US11687490B2 (en) * 2015-05-26 2023-06-27 Red Hat, Inc. Management of contextual information for data
US9858228B2 (en) * 2015-08-10 2018-01-02 Futurewei Technologies, Inc. Dynamic assignment of groups of resources in a peripheral component interconnect express network
CN109005143B (zh) * 2017-06-07 2022-03-04 上海中兴软件有限责任公司 一种调整网站负载的方法及装置
CN109218369B (zh) * 2017-07-05 2021-08-03 阿里巴巴集团控股有限公司 远程过程调用请求控制方法及装置
DE102018221349A1 (de) * 2018-12-10 2020-06-10 Robert Bosch Gmbh Verfahren zur Verwaltung eines Speichers
US11341025B2 (en) 2020-05-27 2022-05-24 Red Hat Inc. Dynamic tuning of computing devices using application log data

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5819028A (en) * 1992-06-10 1998-10-06 Bay Networks, Inc. Method and apparatus for determining the health of a network
US5459837A (en) * 1993-04-21 1995-10-17 Digital Equipment Corporation System to facilitate efficient utilization of network resources in a computer network
US6185619B1 (en) * 1996-12-09 2001-02-06 Genuity Inc. Method and apparatus for balancing the process load on network servers according to network and serve based policies
US5768501A (en) * 1996-05-28 1998-06-16 Cabletron Systems Method and apparatus for inter-domain alarm correlation
US6108782A (en) * 1996-12-13 2000-08-22 3Com Corporation Distributed remote monitoring (dRMON) for networks
EP0849912A3 (en) 1996-12-18 1999-02-10 Nortel Networks Corporation Communications network monitoring
US6088330A (en) * 1997-09-09 2000-07-11 Bruck; Joshua Reliable array of distributed computing nodes
US6215772B1 (en) * 1997-11-26 2001-04-10 International Business Machines Corporation Dynamic parameter estimation for efficient transport of HPR data on IP
US6138122A (en) 1998-03-02 2000-10-24 Agilent Technologies Modeling of internet services
US6269401B1 (en) * 1998-08-28 2001-07-31 3Com Corporation Integrated computer system and network performance monitoring
US6622157B1 (en) * 1998-09-28 2003-09-16 Certeon, Inc. Extending network services using mobile agents
US6205477B1 (en) * 1998-10-20 2001-03-20 Cisco Technology, Inc. Apparatus and method for performing traffic redirection in a distributed system using a portion metric
US6748416B2 (en) * 1999-01-20 2004-06-08 International Business Machines Corporation Client-side method and apparatus for improving the availability and performance of network mediated services
US6513065B1 (en) * 1999-03-04 2003-01-28 Bmc Software, Inc. Enterprise management system and method which includes summarization having a plurality of levels of varying granularity
US6691067B1 (en) * 1999-04-07 2004-02-10 Bmc Software, Inc. Enterprise management system and method which includes statistical recreation of system resource usage for more accurate monitoring, prediction, and performance workload characterization
US6611867B1 (en) * 1999-08-31 2003-08-26 Accenture Llp System, method and article of manufacture for implementing a hybrid network
US6314447B1 (en) 1999-10-04 2001-11-06 Sony Corporation System uses local registry and load balancing procedure for identifying processing capabilities of a remote device to perform a processing task
US6377907B1 (en) * 1999-11-17 2002-04-23 Mci Worldcom, Inc. System and method for collating UNIX performance metrics
US20020133593A1 (en) * 2000-03-03 2002-09-19 Johnson Scott C. Systems and methods for the deterministic management of information
US20030046396A1 (en) * 2000-03-03 2003-03-06 Richter Roger K. Systems and methods for managing resource utilization in information management environments
US20040103139A1 (en) * 2000-03-30 2004-05-27 United Devices, Inc. Distributed processing system having sensor based data collection and associated method
US6785713B1 (en) * 2000-05-08 2004-08-31 Citrix Systems, Inc. Method and apparatus for communicating among a network of servers utilizing a transport mechanism
US20030154284A1 (en) * 2000-05-31 2003-08-14 James Bernardin Distributed data propagator
US7167821B2 (en) * 2000-06-06 2007-01-23 Microsoft Corporation Evaluating hardware models having resource contention
US6647412B1 (en) * 2000-06-23 2003-11-11 Nokia Internet Communications Inc. Method and network for propagating status information
AU2000270865A1 (en) * 2000-06-30 2002-01-14 Internap Network Services Distributed network management system and method
US6738813B1 (en) * 2000-09-11 2004-05-18 Mercury Interactive Corporation System and method for monitoring performance of a server system using otherwise unused processing capacity of user computing devices
US7149795B2 (en) * 2000-09-18 2006-12-12 Converged Access, Inc. Distributed quality-of-service system
US7194002B2 (en) * 2002-02-01 2007-03-20 Microsoft Corporation Peer-to-peer based network performance measurement and analysis system and method for large scale networks

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908572A (zh) * 2017-11-21 2018-04-13 四川巧夺天工信息安全智能设备有限公司 一种重组NAND‑Flash芯片数据的方法
CN111865781A (zh) * 2019-04-25 2020-10-30 伊姆西Ip控股有限责任公司 用于路径优化的方法、设备和计算机程序产品

Also Published As

Publication number Publication date
MXPA04003956A (es) 2005-01-25
WO2003038642A1 (en) 2003-05-08
EP1444595A1 (en) 2004-08-11
US20020152304A1 (en) 2002-10-17
US7379994B2 (en) 2008-05-27
EP1444595A4 (en) 2007-12-05

Similar Documents

Publication Publication Date Title
CN1608257A (zh) 包括相关矩阵和基于量度分析的聚集系统资源分析
CN1269056C (zh) 多台网络存储器的虚拟一元化方法及装置
CN1299207C (zh) San环境中基于网络的海量存储资源管理方法
CN1115884C (zh) 可编程的呼叫处理系统和方法
CN100347696C (zh) 企业业务过程管理的方法和系统
CN1200378C (zh) 预取信息的方法,系统和服务器
CN1248139C (zh) 用于表达频道化数据的系统和方法
CN1284095C (zh) 多处理器系统中的任务分配方法和多处理器系统
CN1794645A (zh) 基于程序行为的入侵检测方法与系统
CN1679018A (zh) 多平台优化模式
CN1435043A (zh) 呼叫中心运用方法及装置
CN1174319C (zh) 数据结构管理装置、数据结构管理系统和方法
CN1276575A (zh) 数据库存取系统
CN1677277A (zh) 服务提供方法、服务提供商设备、信息处理方法和设备
CN1777107A (zh) 高性能计算(hpc)系统中的按需式例示
CN1928840A (zh) 存储装置虚拟化装置的设备控制交接方法
CN1752977A (zh) 文件访问服务系统、交换机装置、配额管理方法及程序
CN1208482A (zh) 分布式处理
CN1992728A (zh) 用于便利分组合作的系统和方法
CN1776622A (zh) 高性能计算(hpc)系统中的调度式
CN1650274A (zh) 操作管理方法和操作管理服务器
CN1678997A (zh) 网络服务装置和方法
CN1869914A (zh) 存储系统及存储系统的运用方法
CN1667609A (zh) 文档信息管理系统和文档信息管理方法
CN1783086A (zh) 用于在数据库管理系统中的查询管理的系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication