CN101960784A - 通过使用相关系数预测数据中心内部的系统位置 - Google Patents

通过使用相关系数预测数据中心内部的系统位置 Download PDF

Info

Publication number
CN101960784A
CN101960784A CN2008801278515A CN200880127851A CN101960784A CN 101960784 A CN101960784 A CN 101960784A CN 2008801278515 A CN2008801278515 A CN 2008801278515A CN 200880127851 A CN200880127851 A CN 200880127851A CN 101960784 A CN101960784 A CN 101960784A
Authority
CN
China
Prior art keywords
measurement point
value
resource
data center
monitor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2008801278515A
Other languages
English (en)
Other versions
CN101960784B (zh
Inventor
W·E·卢戈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Enterprise Development LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of CN101960784A publication Critical patent/CN101960784A/zh
Application granted granted Critical
Publication of CN101960784B publication Critical patent/CN101960784B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3096Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents wherein the means or processing minimize the use of computing system or of computing system component resources, e.g. non-intrusive monitoring which minimizes the probe effect: sniffing, intercepting, indirectly deriving the monitored data from other directly available data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/046Network management architectures or arrangements comprising network management agents or mobile agents therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Debugging And Monitoring (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)

Abstract

本发明使得能够对数据中心中的系统进行位置预测。具体而言,本发明监视来自数据中心中的系统的资源和数据中心中的测量点。系统资源监视系统的内部条件。数据中心测量点是提供数据中心的环境或数据中心资源信息的任何设备。使从系统资源和测量点获得的条件相关,并然后将其用来预测系统在数据中心中的位置。例如,通过使热传感器值与带宽测量相关,该预测机制可以能够预测在网络使用方面具有尖峰并处于满负载的系统在这样的测量点附近,所述测量点在机器在网络使用方面具有其尖峰的同时检测到增加的热传感器值且检测到增加的带宽使用。

Description

通过使用相关系数预测数据中心内部的系统位置
背景技术
在过去几年中,数据中心密度已在增加。整合数据涉及在潜在地降低数据中心内部的系统的总拥有成本的同时使数据中心资源最优化。这些趋势正在引起非常大的数据中心(例如,具有80,000至110,000平方英尺的面积的数据中心)的部署,其中有几千个或几万个系统位于数据中心内部。
数据中心中的大量系统也是由于那些系统的变化的存储解决方案而引起的。目前,一个机架可以保持几百个系统。这与几年前一个机架将保持一个系统及其存储设备的情形形成对比。随着这些保持空前数目系统的非常大的数据中心的到来,发生特定的问题。定位数据中心中的系统是随着当前数据中心的变化模型而出现的问题。
定位数据中心内的系统的一种现有技术解决方案利用详细描述系统在数据中心中的位置的外部数据库。在这种情况下,由数据中心操作员周期性地更新外部工具或数据库。如果系统主机名改变,或者如果系统具有另一个具有另一IP地址的LAN卡,则需要手动地更新数据库。此解决方案的维护成本是高的,并且此外,不能保证数据库始终是最新的,因为其依赖于人类维护。
另一现有技术解决方案涉及在数据中心中的每个系统上放置人类可读标记。然而,在具有几百个、几千个、乃至几万个机器的数据中心中,利用机器上的标记来定位特定机器或机器组是极其低效的。这将涉及数据中心操作员在数据中心的机架通道中走动,阅读标记以定位该机器。此外,如果机器被移动,则需要由数据中心操作员制作新的标记并将其放置在机器上。这种方法不可扩展至当前的大数据中心。在具有几千个机架和几千个或几万个系统的数据中心中走动以定位特定系统是不切实际且低效的。
另外的现有技术解决方案将数据中心中的机器的主机名修改为包括该机器在数据中心中的位置。此类主机名的示例是机架31-刀片3.hp.com。因此,数据中心操作员只需查看主机名以定位上面放置了该系统的机架。然而,如果系统被移动到另一机架,或者在同一位置上安装了新系统,则以这种方式利用主机名可能变得繁重。然而,如果机器的位置改变,则需要外力来更新机器的主机名以反映该位置变化。此外,那些系统上的常驻软件可能是主机名敏感的,并且其可能在主机名变化方面遇到问题。例如服务器许可机制常常在主机名变化方面遇到问题。
目前,确定系统在数据中心中的位置是静态过程。此外,这些现有技术解决方案中的每一种要求人类干预以进行维护。这些现有技术解决方案在维护数据中心中的系统的准确位置方面造成问题。支持特定应用的系统的位置的知识常常仅被在那些应用上工作的那些人所知道。如果那些人不再参与数据中心的操作,或者发生紧急情况,则该知识可能不一定被传达给每个人。
另一种现有技术解决方案利用设置在数据中心中的每个系统上的RFID标签。然而,这种解决方案实现起来非常昂贵且需要大量的投资。必须对每个系统进行改造以使该解决方案起作用。因此,其在时间和成本方面可能不是最有用的解决方案。
因此,在本领域中需要一种位置预测系统,其自动地预测并更新系统在数据中心中的位置而不需要数据中心中的大规模的基础设施变化或大的初始实现成本。
发明内容
本发明的一个实施例涉及用于预测数据中心中的系统的位置的装置,包括用于从数据中心中的资源获得值的资源监视器、用于从该系统的资源获得值的系统监视器、用于使来自所述资源监视器的值与来自所述系统监视器的值相关的相关组件;以及用于基于该相关来预测该系统在数据中心中的位置的预测组件。
本发明的另一实施例涉及一种预测数据中心中的系统的位置的方法,包括监视数据中心中的至少一个测量点、监视系统的至少一个资源、使所述测量点的值与系统资源相关、以及基于该相关来预测该系统在数据中心中的位置。
本发明的第三实施例涉及一种计算机可读介质,其上安装有计算机可读代码,该计算机可读代码在被执行时实现预测数据中心中的系统的位置的方法,该方法包括监视数据中心中的至少一个测量点、监视数据中心中的至少一个资源、监视系统的至少一个资源、使所述测量点的值与系统资源相关、以及基于该相关来预测该系统在数据中心中的位置。
本发明的另一实施例涉及一种用于预测数据中心中的系统的位置的装置,包括用于从数据中心中的资源获得值的部件、用于从该系统的资源获得值的部件、用于使来自所述资源监视器的值与来自所述系统监视器的值相关的部件;以及用于基于该相关来预测该系统在数据中心中的位置的部件。
附图说明
图1是示例性数据中心的示意图。
图2是用于本发明的一个实施例的流程图。
图3是本发明的另一实施例的示意图。
图4是数据中心中的机架的示意图。
图5是用于示例性位置预测的相关的结果的图形描绘。
图6是描绘相关结果的图表。
图7是描绘相关结果的图表。
具体实施方式
现在将在下文参照附图来解释本发明的实施例。
图1是示例性数据中心的描绘。如图1所述,存在包含一个或多个服务器(1a、1b...1n)(2a、2b、...、2n)的一个或多个服务器机架(1、2等)。这些服务器中的每一个包含监视其周围的条件的一个或多个传感器(10a、10b、...、10n)(20a、20b、...、20n)。在一个实施例中,传感器位于机架的正面和背面两者上。未描绘位于机架背面的传感器。虽然以与服务器的数目一对一的关系示出传感器的数目,但在数据中心中或对于本发明而言这不是必须的。
这些传感器被包含在服务器机架上的服务器上或被定位在服务器机架上的服务器或服务器组附近。例如,传感器10a可以监视仅服务器1a的条件,或者可以监视诸如服务器1a、1b和1c的一组服务器的条件。可以在服务器机架上(在服务器上或其附近)定位多个传感器。在潜在地定位于服务器机架上的那些服务器中,可以在机架的每个面板上或在每个机架上设置传感器。这些传感器可以监视多个条件。例如,其可以潜在地监视的条件的非限制性列表将包括热量、功率、带宽使用、湿度,仅列举几个示例。
这些传感器是数据中心测量点的示例。在图1中通过示例性数据中心测量点3描绘了数据中心测量点的另一示例。数据中心测量点是提供数据中心的环境或数据中心资源信息的任何设备。数据中心测量点的示例包括空调器、热传感器、功率计、网络带宽使用测量器、湿度传感器等等。这些测量点可以位于系统上、服务器机架上、数据中心资源中、数据中心资源附近、或数据中心中的任何其它位置。数据中心中的每个测量点的位置是已知的。示例性测量点的列表不是穷尽的;相反,数据中心测量点可以包括包含在数据中心中的提供环境或数据中心资源信息的任何设备。
数据中心需要某些输入以便适当地工作。用于任何数据中心的基本输入是功率、适当环境、以及网络带宽。示例性输入的此列表绝不是限制性的,而是组成在数据中心的操作中利用的某些输入。如上所述,数据中心包含向数据中心中提供输入的资源。监视并测量这些资源以保证数据中心中的条件对于操作而言是最佳的。测量点提供有关数据中心的条件(关于数据中心的资源和环境)的信息。
数据中心中的每个系统使用对操作系统所必需的类似输入。这些输入类似于用于数据中心的那些。例如,到系统的输入包括但不限于功率、适当环境、以及网络带宽。每个系统监视其内部系统条件。例如,系统包含诸如传感器或其它监视器之类的监视内部系统温度、利用率、风扇速度、及其它系统条件的资源。对于一个实施例而言,系统的内部利用率与系统中的散热和功率消耗具有强相关。这在进行大量工作的系统中很明显,因为系统的温度上升更快,功率消耗增加,并且风扇速度增加以防止系统的过热。测量并监视系统资源以保证系统的最佳操作和理解。
数据中心中的系统可以是具有连接到网络的能力并能够提供关于其资源消耗和/或其环境的信息(即关于功率、网络、温度等的信息)的任何类型的设备。系统的示例包括数据中心中的服务器或计算机系统、存储设备、媒体库、以及网络基础设施,仅列举几个示例。在位置预测中利用的系统的类型不限制本发明。
由于我们可以使系统的利用率(utilization)和工作负荷与其系统资源的条件相关,所以我们利用该相关来通过系统资源的条件潜在地识别特定系统。因此,我们可以进行来自系统资源的对应测量条件与来自数据中心中的测量点的测量条件的进一步相关以预测系统在数据中心中的位置。
本发明还可以利用滞后相关来使系统资源的测量条件与来自数据中心中的测量点的测量条件相关。在数据中心中和系统内都存在并不立即受到其它资源的变化的影响的某些资源。此影响上的滞后可以是该资源需要一定的时间来响应于它们所检测的变化而改变的结果。例如,增加提供给发出较冷空气的空调器的功率可能对在数据中心中接近其定位的计算机系统没有即刻影响。相反,空气将花费一定的时间来冷却以对系统有影响。此滞后时间对于数据中心中的离空调器更远的系统甚至可能更高。因此,使用滞后相关可以提供关于数据中心中和数据中心的系统内的资源如何相互影响的更准确结果。本发明能够利用即刻相关、滞后相关、或这两种类型相关的组合。在系统中利用的相关的类型不限制本发明。
图2是利用测量点与系统资源之间的相关来预测系统在数据中心中的位置的本发明的一个实施例的描绘。具体而言,本发明的该实施例涉及预测系统在数据中心中的位置的方法。
首先,如在步骤201中所描绘的,确定IP范围以寻找在该IP范围上可用的所有系统。数据中心中的每个系统具有与之相关的IP地址。在位置预测中将仅利用具有落在所选IP范围内的IP地址的那些系统。该范围可以是窄的,或者可以涵盖大量系统、乃至数据中心中的所有系统。选择IP范围使得能够定位特定机器。例如,在某一组系统的过热或功率危机的情况下,可以将IP范围确定为仅涵盖那些受影响的系统。
一旦已经确定IP范围,则在步骤202处,将获得来自数据中心中的测量点的测量。所利用的测量点取决于数据中心的基础设施。优选地利用在数据中心中已存在的那些测量点来获得测量,不过出于本发明的目的有可能将附加测量点放置到数据中心中。同时,在步骤203处,将获得来自系统中的资源的测量。例如,此类测量可以包括温度测量、功率消耗测量、以及网络带宽测量,仅列举几个示例。
步骤204详细描述使从步骤202和203获得的值相关。使这些值相关并获得来自每个系统条件的值与从测量点获得的值的相关系数。然后,在一个实施例中,针对每个系统条件创建简档表。向此简档表填充测量点与系统资源之间的所有相关系数。优选地,该表可以保持关于系统的特定系统条件(诸如功率、温度等)和对应测量点的信息。因此,可以根据需要创建多个表以使系统条件与从测量点获得的测量相关。这使得能够更快地处理相关,而不要求在系统中存储不必要的信息。在另一实施例中,还可以将该表配置为保持系统的每个系统条件和对应测量点的信息。这将使得能够快速地查找系统的系统条件和对应测量点的相关。
步骤205详细描述预测系统的位置。从相关步骤204获得的相关值已被存储在一个或多个简档表中,并且可得到系统与一个或多个测量点之间的关联。相关值是从-1至1的数字。两个变量之间为1的相关意味着随着一个变量的值的变化,另一个的值以精确的比例改变。两个值之间为-1的相关指示随着一个变量的值的变化,第二变量的值以相反的方式按精确的比例变化。两个变量之间为0的相关指示随着第一变量的改变,在第二变化中不能找到相对应的变化。因此,第一变量的行为对第二变量的行为没有影响或与之没有关系。该方法基于一个或多个测量点来维持系统位置的计数器,并基于存储在(一个或多个)简档表中的关联来提供位置的精确度百分比(accuracy percent)。此计数器可以采取寄存器的形式。在另一实施例中,可以利用位置表来基于一个或多个测量点维持系统位置。
在一个实施例中,该方法连续地运行,并且连续地监视系统资源和测量点。这使得能够持续更新系统与一个或多个测量点之间的相关,并且使得能够增加系统与该一个或多个测量点之间的关联的精确度。下面详细描述关于系统与测量点之间的关联的精确度的更多信息。特定的系统可能从未与单个测量点相关联;相反,其可能在其相关方面在两个或更多测量点之间振荡。但是,基于系统与该一个或多个测量点之间的关联,可以基于系统与该一个或多个测量点的关联使该系统与参考位置相关。
从本发明的位置预测获得的参考位置的精确度取决于在测量点与系统资源的相关中使用的数据量、以及监视系统和测量点的时间量。所述位置预测方法可以能够准确地确定系统在数据中心中的位置,或者可以能够预测系统在特定的机架上或者在数据中心中的特定数目的机架之一上等等。在位置预测中利用的更多的测量点和数据资源将可能产生关于系统在数据中心中的位置的更精确结果。类似地,监视测量点和系统达更长时间段将可能产生关于系统位置的更精确结果。
通过反复地监视数据中心中的系统和测量点,可以迭代地执行位置预测,使得能够维持并更新系统在数据中心中的位置。利用位置预测系统来迭代地定位系统还使得能够使测量点与特定的系统或系统组相关联。数据中心中的测量点的位置是已知且恒定的。如果系统维持其位置,通过每次位置预测,将出现模式,使得该系统被一致地发现处于特定测量点附近。因此,可以进行测量点的位置相对于数据中心中的系统的关联。此外,基于位置预测的每次迭代表现来重新计算相关增加了测量点与系统的关联的精确度。该关联可以是一对一关联,或者可以使多个系统与一个或多个测量点相关联、或多个测量点与一个或多个系统相关联。
图3是利用测量点与系统资源之间的相关来预测系统在数据中心中的位置的本发明的另一实施例的描绘。具体而言,本发明的该实施例包括被用来预测系统在数据中心中的位置的装置。该装置包含测量点监视器301、资源监视器302、相关组件303和预测组件304。
测量点监视器301监视数据中心中的测量点。所利用的测量点取决于数据中心的基础设施。优选地利用在数据中心中已存在的那些测量点来获得测量,不过出于本发明的目的有可能将附加测量点放置到数据中心中。
系统监视器302监视数据中心中的系统资源。可以确定IP范围以潜在地限制监视的数据中心中的系统的数目。数据中心中的每个系统具有与之相关的IP地址。在位置预测中将仅利用具有落在所选IP范围内的IP地址的那些系统。如上文所解释的,IP范围可以是窄的,或者可以涵盖大量系统、乃至数据中心中的所有系统。选择IP范围使得能够定位特定机器。例如,在针对某一组系统的重工作负荷或功率危机的情况下,可以将IP范围确定为仅涵盖那些受影响的系统。
相关组件303使从测量点监视器301和系统监视器302获得的值相关。使这些值相关并获得来自每个系统条件的值与从测量点获得的值的相关系数。在一个实施例中,针对每个系统条件创建简档表。向此简档表填充测量点与系统资源之间的所有相关系数。在一个实施例中,该表可以保持关于系统的特定系统条件(诸如功率、温度等)和对应测量点的信息。因此,可以根据需要创建多个表以使系统条件与从测量点获得的测量相关。这使得能够更快地处理相关,而不要求在系统中存储不必要的信息。在另一实施例中,还可以将该表配置为保持系统的每个系统条件和对应测量点的信息。这将使得能够快速地查找系统的系统条件和对应测量点的相关。
预测组件304然后预测系统的位置。从相关组件303获得的相关值已被存储,并且可得到系统与一个或多个测量点之间的关联。在一个实施例中,所述装置基于一个或多个测量点来维持系统位置的计数器,并基于存储在(一个或多个)简档表中的关联来提供位置的精确度百分比。在另一实施例中,利用位置表来基于一个或多个测量点保持关于每个系统及其位置的信息。优选地,所述装置连续地运行系统监视器和测量点监视器,并且连续地监视系统资源和测量点。这使得够持续更新系统与该一个或多个测量点之间的相关,并且使得能够增加系统与一个或多个测量点之间的关联的精确度。在数据中心中监视的特定系统可能从未与单个测量点相关联;相反,其可能在其相关性方面在两个或更多测量点之间振荡。但是,基于系统与该一个或多个测量点之间的关联,可以基于系统与一个或多个测量点的关联使该系统与参考位置相关。
在一个实施例中,计算机可读介质可以在其上编码有计算机可读代码,该计算机可读代码在被执行时实现图2所描绘的预测系统在数据中心中的位置的方法。
在一个实施例中,利用以下相关系数等式来确定从系统资源X和测量点Y测量的条件之间的相关:
Corr ( X , Y ) = Σ ( x - x ‾ ) Σ ( y - y ‾ ) Σ ( x - x ‾ ) 2 Σ ( y - y ‾ ) 2
此相关系数等式是标准相关系数等式。还可以利用其它等式来使从系统资源和测量点获得的测量相关。
在一个实施例中,根据系统条件进行相关。因此,仅对与相同类型的测量对应的测量点值和系统资源值进行相关。例如,将来自系统中的内部温度传感器和数据中心中的机架上的热传感器的值相关。
在另一实施例中,位置预测将获得每个测量的时间考虑在内。在相关中还利用定时,以便使同时从不同的源获得的测量相关在一起。这使得能够更准确地表示系统的变化对从测量点获得的测量的影响。
在一个实施例中,在缩短的时间段内强制进行系统位置的预测。可以利用此强制预测,因为可能需要快速地定位受到电源管理问题或硬件故障影响的系统。存在用于强制进行特定系统的位置预测的各种其它原因。在强制位置预测的一种实现中,系统被扰动而触发由两个内部系统资源测量并对数据中心测量点有影响的某种影响。扰动的示例将是使系统以全利用率运行特定的时间段。这将增加系统的热量和系统的潜在带宽使用,这将被系统中的热传感器和带宽测量器注意到。
当系统被扰动时,测量点和系统资源的监视将被激活。测量包括被扰动系统的一组系统的带宽的数据中心中的测量点可以注意到增加的带宽使用。此外,诸如温度传感器或空调器的测量点还可以注意到由于来自包括被扰动系统的特定系统组的较大散热而引起的增加的活动。可以利用从数据中心的测量点获得的测量值与从内部系统资源获得的测量值的相关来预测系统相对于特定测量点的位置。
在利用强制位置预测的另一实施例中,系统如上所述地被扰动有限的时间段。基于通过在正常条件下运行系统获得的先前的相关数据,监视已与系统相关联的特定测量点。然后利用从那些测量点获得的与系统的扰动有关的数据来计算所选测量点和系统的新相关系数。因此,可以潜在地获得系统和对应测量点的更准确的关联。
在一个实施例中,位置预测利用提供关于测量点的环境和热信息的历史信息以用于位置预测的动态智能冷却能量管理器解决方案来从测量点获得值。
在一个实施例中,位置预测通过使用在每个系统中配置的标准SNMP代理来从系统资源获得值。因此,每个系统在没有外部提示的情况下通过这些代理来提供其信息以用于位置预测。这使得能够在没有外部干预的情况下连续地监视系统的资源。
在另一实施例中,对系统进行轮询以获得关于其资源的状态的信息。在该实施例中,对系统进行轮询并收集来自资源的数据。此数据然后被存储在诸如MSQL数据库的数据库中以供稍后使用。其中存储已收集数据的数据库的类型不是限制性的;相反,可以利用任何类型的数据库。
在另一实施例中,不是连续地监视系统。通过连续地监视系统,即使不存在系统资源的状态变化,也进行关于系统位置的相关和预测。这些相关使得能够更准确地预测系统的位置。然而,当系统的资源状态不变时连续地监视系统可能潜在地是低效的且可以引起网络拥塞问题,因为系统监视器连续地从数据中心中的系统获得信息。
因此,本发明的该实施例利用基于订户的系统,其中,在系统上运行脚本以进行预订来获得关于系统的诸如功率利用率的特定条件的信息。当条件改变(例如,系统的至少一个资源的值改变)时,诸如功率利用率增加,系统通知位置预测系统并进行更新相关以预测系统的位置。在一个实施例中,可以利用基于web的企业管理(WBEM)作为用于系统的预订方法。因此,只有当接收到系统中的一个或多个系统条件正在改变的通知时才执行位置预测。
在另一实施例中,数据中心填充有多个机架,一个特定机架包括位于机架背面处的五个温度传感器。例如,数据中心可以包含具有异构配置的7个机架(机架#1~7)。每个机架包含分布在机架的背面与正面之间的10个温度传感器。图4描绘数据中心中的示例性机架401,具有进口和出口传感器#1~5。在图4中仅描绘了进口传感器。数据中心设备常常从正面接收冷空气并从背面释放热空气。因此,优选地,通过分析设置在数据中心设备的背面上的传感器来进行相关。在此示例性数据中心中执行位置预测,具有以下结果。
连续地执行位置预测,并然后从机架中选择系统以进行分析。具体而言,在进口和出口传感器#4附近、在机架#1上选择系统。此所选系统可以是例如运行Windows的BL20P刀片系统。系统的类型不是限制性的,并且可以是任何系统。通过利用Proliant软件从系统收集SNMP信息和内部CPU信息来获得所选系统的资源的条件。然而,所利用的软件不限制本发明。
在该实施例中,监视该系统达15个小时。在第9小时,发生影响系统的外部扰动。图5描绘来自数据中心中的测量点的热响应,其中到关联系统资源的最佳相关指示内部CPU温度。图5仅示出具有大于可接受阈值的相关的传感器。例如,该阈值可以是0.75。此阈值是变量,并且可以被预置、或由外部源设置、或即时地设置。
计算所有测量点(机架上的十个传感器)与系统内部温度之间的相关系数。图6示出包含仅利用在正常情况下获得的数据而不考虑系统扰动的相关系数的表格。图7示出包含考虑系统扰动的相关系数的表格。两个相关均产生系统的正确位置(即,进口和出口传感器#4附近),其中图7产生更准确的结果。
关于将位置预测用于BL20P系统,如上所述,重要的是注意到此系统具有两个CPU、和三个内部传感器。每个CPU核具有传感器,并且存在位于系统中的在核模块外面的一个传感器。优选地利用在核模块外面的传感器进行监视,因为内部传感器通常对系统利用率非常敏感且趋向于是热的。此外,一个核传感器可能是热的,而另一个较凉,提供本身可能并不有助于相关的混合数据。此外,利用不取决于CPU数目的来自每个系统的内部传感器可能更容易缩放并提供更准确的结果,因为将从更类似的系统环境获得来自每个系统的被比较的值。
用于实现本发明的整个系统或方法或部分的示例性系统可以包括采取传统计算机形式的通用计算设备,包括处理单元、系统存储器、以及将包括系统存储器的各种系统组件耦合到处理单元的系统总线。所述系统存储器可以包括只读存储器(ROM)和随机存取存储器(RAM)。该计算机还可以包括从磁性硬盘读取并向其写入的磁性硬盘驱动器、用于从可移动磁盘读取或向其写入的磁盘驱动器、以及从诸如CD-ROM或其它光学介质的可移动光盘读取或向其写入的光盘驱动器。所述驱动器及其相关计算机可读介质提供计算机可执行指令、数据结构、程序模块及用于计算机的其他数据的非易失存储。
可以用标准编程技术来实现本发明的软件和web实施方式,其中基于规则的逻辑及其它逻辑实现各种数据库搜索步骤、相关步骤、比较步骤和判定步骤。还应注意的是本文和权利要求中所使用的词语“组件”意图涵盖使用一行或多行软件代码的实施方式、和/或硬件实施方式、和/或用于接收手动输入的设备。
已出于说明和描述的目的给出了本发明的实施例的前述说明。其并不意图是穷尽的或使本发明限于所公开的精确形式,并且鉴于以上教导可以进行修改和变更,或者可以从本发明的实施中获得该修改和变更。选择并描述了实施例以便解释本发明的原理及其实际应用以使得本领域的技术人员能够在各种实施例中并以适合于预期的特定用途的各种修改利用本发明。

Claims (20)

1.一种用于预测数据中心中的系统的位置的装置,包括:
测量点监视器,其用于从数据中心中的一个或多个测量点获得值;
系统监视器,其用于从该系统的一个或多个资源获得值;
相关组件,其用于使来自所述测量点监视器的值与来自所述系统监视器的值相关;
预测组件,其用于基于所述相关来预测该系统在数据中心中的位置。
2.权利要求1的装置,其中,所述测量点监视器自动地获得测量点值且所述系统监视器自动地获得资源值,以及
其中,基于这些连续获得的值来周期性地更新该系统的位置。
3.权利要求1的装置,还包括扰动组件,该扰动组件包括:
触发器,其用于触发数据中心中的系统,使得该系统的资源受到影响;
系统激活器,其用于激活所述系统监视器来测量对该系统的资源的影响;
测量点激活器,其用于激活所述测量点监视器来监视数据中心的测量点;
扰动值提交器,其用于向所述相关组件提交从所述系统监视器和测量点监视器获得的值;
其中,所述预测组件基于来自所述相关组件的相关来预测该系统的位置。
4.权利要求1的装置,还包括跟踪已预订通知服务的系统的预订组件,
其中,所述通知服务在来自被预订系统中的资源的至少一个值已改变时获得通知,
其中,当接收到通知时,所述测量点监视器从数据中心中的测量点获得值且所述系统监视器从被预订系统的资源获得值,以用于预测被预订系统的位置。
5.权利要求1的装置,还包括用于设置系统的IP范围的IP范围设置组件,
其中,所述系统监视器仅从落在所述IP范围内的系统获得资源值。
6.权利要求1的装置,其中,所述相关组件利用从系统资源和测量点获得值的时间来使来自所述测量点监视器和所述系统监视器的值相关。
7.权利要求1的装置,其中,所述相关组件使从所述测量点监视器获得的每个值与对应于相同类型的测量的从所述系统监视器获得的值相关。
8.一种预测数据中心中的系统的位置的方法,包括:
(a)监视所述数据中心中的至少一个测量点;
(b)监视该系统的至少一个资源;
(c)使所述至少一个测量点的值与所述至少一个系统资源的值相关;以及
(d)基于所述相关来预测该系统在所述数据中心中的位置。
9.权利要求8的方法,还包括:
(e)迭代地重复步骤(a)至(d)。
10.权利要求8的方法,还包括:
(e)触发数据中心中的系统,使得该系统的资源受到影响;
(f)激活所述系统监视器来测量对该系统的资源的影响;
(g)激活所述测量点监视器来监视数据中心的测量点;
(h)向相关步骤(c)提交从所述系统监视器和测量点监视器获得的值;
(i)基于来自在步骤(h)中获得的相关的相关来预测该系统的位置。
11.权利要求8的方法,还包括:
(e)跟踪已预订通知服务的系统;
(f)在来自被预订系统中的资源的至少一个值已改变时获得通知,
其中,接收到通知提示所述方法执行步骤(a)至(d)以预测被预订系统的位置。
12.权利要求8的方法,还包括:
(e)设置系统的IP范围,
其中,只有具有在所设置的IP范围内的IP地址的系统使其资源值被监视。
13.权利要求8的方法,其中,使值相关还包括利用从系统资源和测量点获得值的时间来使来自所述测量点和所述系统资源的值相关。
14.权利要求8的方法,其中,使值相关还包括使从所述至少一个测量点获得的每个值与对应于相同类型的测量的从所述至少一个系统资源获得的值相关。
15.一种计算机可读介质,其上安装有计算机可读代码,该计算机可读代码在被执行时,实现预测数据中心中的系统的位置的方法,该方法包括:
(a)监视所述数据中心中的至少一个测量点;
(b)监视该系统的至少一个资源;
(c)使所述至少一个测量点的值与所述至少一个系统资源的值相关;以及
(d)基于所述相关来预测该系统在所述数据中心中的位置。
16.权利要求15的计算机可读介质,还包括:
(e)迭代地重复步骤(a)至(d)。
17.权利要求15的计算机可读介质,还包括:
(e)触发数据中心中的系统,使得该系统的资源受到影响;
(f)激活所述系统监视器来测量对该系统的资源的影响;
(g)激活所述测量点监视器来监视数据中心的测量点;
(h)向相关步骤(c)提交从所述系统监视器和测量点监视器获得的值;
(i)基于来自在步骤(h)中获得的相关的相关来预测该系统的位置。
18.权利要求15的计算机可读介质,还包括:
(e)跟踪已预订通知服务的系统;
(f)在来自被预订系统中的资源的至少一个值已改变时获得通知,
其中,接收到通知提示所述方法执行步骤(a)至(d)以预测被预订系统的位置。
19.权利要求15的计算机可读介质,其中,使值相关还包括利用从系统资源和测量点获得值的时间来使来自所述测量点和所述系统资源的值相关。
20.一种用于预测数据中心中的系统的位置的装置,包括:
用于从数据中心中的一个或多个测量点获得值的部件;
用于从该系统的一个或多个资源获得值的部件;
用于使来自所述测量点监视器的值与来自所述系统监视器的值相关的部件;
用于基于所述相关来预测该系统在所述数据中心中的位置的部件。
CN200880127851.5A 2008-03-06 2008-03-06 通过使用相关系数预测数据中心内部的系统位置 Expired - Fee Related CN101960784B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2008/002982 WO2009110866A1 (en) 2008-03-06 2008-03-06 Prediction of systems location inside a data center by using correlations coefficients

Publications (2)

Publication Number Publication Date
CN101960784A true CN101960784A (zh) 2011-01-26
CN101960784B CN101960784B (zh) 2015-01-28

Family

ID=41056272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880127851.5A Expired - Fee Related CN101960784B (zh) 2008-03-06 2008-03-06 通过使用相关系数预测数据中心内部的系统位置

Country Status (4)

Country Link
US (1) US20110004684A1 (zh)
EP (1) EP2255495A4 (zh)
CN (1) CN101960784B (zh)
WO (1) WO2009110866A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112073544A (zh) * 2020-11-16 2020-12-11 震坤行网络技术(南京)有限公司 用于处理传感器数据的方法、计算设备和计算机存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9176560B2 (en) 2012-02-27 2015-11-03 Hewlett-Packard Development Company, L.P. Use and state based power management

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030046339A1 (en) * 2001-09-05 2003-03-06 Ip Johnny Chong Ching System and method for determining location and status of computer system server
US6697962B1 (en) * 2000-10-20 2004-02-24 Unisys Corporation Remote computer system monitoring and diagnostic board
CN1682196A (zh) * 2002-09-11 2005-10-12 国际商业器公司 分布式系统中的识别根原因和确定问题的方法和设备
US20060259621A1 (en) * 2005-05-16 2006-11-16 Parthasarathy Ranganathan Historical data based workload allocation

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6529164B1 (en) * 2000-03-31 2003-03-04 Ge Medical Systems Information Technologies, Inc. Object location monitoring within buildings
US20020158900A1 (en) * 2001-04-30 2002-10-31 Hsieh Vivian G. Graphical user interfaces for network management automated provisioning environment
KR100621596B1 (ko) * 2003-04-22 2006-09-18 학교법인 영남학원 네트워크 시스템의 모니터링 방법
WO2005006190A1 (ja) * 2003-07-11 2005-01-20 Fujitsu Limited ラック管理システム,管理端末,構成記録装置およびラック装置
US7197433B2 (en) * 2004-04-09 2007-03-27 Hewlett-Packard Development Company, L.P. Workload placement among data centers based on thermal efficiency
US7447920B2 (en) * 2004-08-31 2008-11-04 Hewlett-Packard Development Company, L.P. Workload placement based on thermal considerations
US8212817B2 (en) * 2008-10-31 2012-07-03 Hewlett-Packard Development Company, L.P. Spatial temporal visual analysis of thermal data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6697962B1 (en) * 2000-10-20 2004-02-24 Unisys Corporation Remote computer system monitoring and diagnostic board
US20030046339A1 (en) * 2001-09-05 2003-03-06 Ip Johnny Chong Ching System and method for determining location and status of computer system server
CN1682196A (zh) * 2002-09-11 2005-10-12 国际商业器公司 分布式系统中的识别根原因和确定问题的方法和设备
US20060259621A1 (en) * 2005-05-16 2006-11-16 Parthasarathy Ranganathan Historical data based workload allocation

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112073544A (zh) * 2020-11-16 2020-12-11 震坤行网络技术(南京)有限公司 用于处理传感器数据的方法、计算设备和计算机存储介质
CN112073544B (zh) * 2020-11-16 2021-02-09 震坤行网络技术(南京)有限公司 用于处理传感器数据的方法、计算设备和计算机存储介质

Also Published As

Publication number Publication date
EP2255495A4 (en) 2013-05-29
EP2255495A1 (en) 2010-12-01
WO2009110866A1 (en) 2009-09-11
US20110004684A1 (en) 2011-01-06
CN101960784B (zh) 2015-01-28

Similar Documents

Publication Publication Date Title
CN108052528B (zh) 一种存储设备时序分类预警方法
US10552761B2 (en) Non-intrusive fine-grained power monitoring of datacenters
US7693982B2 (en) Automated diagnosis and forecasting of service level objective states
CN101088072B (zh) 用于监视基于交易的系统的方法和系统
Teng et al. A new methodology for predicting software reliability in the random field environments
CN100533399C (zh) 用于检测异常的自学习方法和系统
KR20180108446A (ko) Ict 인프라 관리 시스템 및 이를 이용한 ict 인프라 관리 방법
US7861593B2 (en) Rotational vibration measurements in computer systems
CN104137078A (zh) 操作管理设备、操作管理方法和程序
US20050049901A1 (en) Methods and systems for model-based management using abstract models
CN109254865A (zh) 一种基于统计分析的云数据中心服务异常根因定位方法
US10430268B2 (en) Operations management system, operations management method and program thereof
Cremonesi et al. Indirect estimation of service demands in the presence of structural changes
US20220245010A1 (en) Time-series anomaly detection using an inverted index
BR102013000145A2 (pt) sistema que compreende um dispositivo de monitoração, meio legível por computador e método de atualização de um algoritmo de decisão
Schiöler et al. Multivariate outbreak detection
Ye et al. Strategic allocation of test units in an accelerated degradation test plan
Mahdavi et al. Structured building data management: Ontologies, queries, and platforms
CN101960784B (zh) 通过使用相关系数预测数据中心内部的系统位置
US7725285B2 (en) Method and apparatus for determining whether components are not present in a computer system
Ghadami et al. Data-driven identification of reliable sensor species to predict regime shifts in ecological networks
Schachinger et al. An advanced data analytics framework for energy efficiency in buildings
Calzarossa et al. Construction and use of multiclass workload models
CN116164945A (zh) 一种设备状态监测系统可靠性评估方法及装置
CN109993576A (zh) 一种服务质量感知、数据采集处理与分析的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20170207

Address after: American Texas

Patentee after: HEWLETT PACKARD ENTERPRISE DEVELOPMENT LP

Address before: American Texas

Patentee before: HP Development Co., Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150128

Termination date: 20170306

CF01 Termination of patent right due to non-payment of annual fee