CN108089923A - 基于加权Voronoi图的用户接入区域划分方法和装置 - Google Patents
基于加权Voronoi图的用户接入区域划分方法和装置 Download PDFInfo
- Publication number
- CN108089923A CN108089923A CN201711349331.6A CN201711349331A CN108089923A CN 108089923 A CN108089923 A CN 108089923A CN 201711349331 A CN201711349331 A CN 201711349331A CN 108089923 A CN108089923 A CN 108089923A
- Authority
- CN
- China
- Prior art keywords
- value
- server
- data center
- weighted
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1008—Server selection for load balancing based on parameters of servers, e.g. available memory or workload
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于加权Voronoi图的用户接入区域划分方法和装置。方法包括:采集各数据中心中各服务器的性能参数指标和负载消耗指标;根据性能参数指标和负载消耗指标,计算各服务器的处理能力得分值;将各服务器的处理能力得分值变换到预定数值范围内,得到各服务器的权重值;根据各服务器的权重值,计算各数据中心的权重值;将各数据中心的权重值作为加权Voronoi图的种子点,划分出各数据中心对应的用户接入区域。通过本发明,解决了相关技术中数据中心的系统访问压力不均衡的问题,能够使用户的接入划分更加合理,均衡了数据中心的系统访问压力,避免了资源的浪费,为大数据时代数据中心建设和灾备系统建设提供技术支持。
Description
技术领域
本发明属于数据中心负载分担技术领域,特别是涉及一种基于加权Voronoi图的用户接入区域划分方法和装置。
背景技术
异地多活数据中心的建设模式是如今的发展趋势,诸多企业机构已经建设了多数据中心。Amadeus全球旅游分销公司已经在艾尔丁建立了两个数据中心,并规划在美国迈阿密、澳大利亚悉尼建立数据中心;阿里巴巴目前在全球建立了9个数据中心,其中上海、杭州、青岛已经达到异地多活模式;铁路12306售票系统日前建设成功同城双数据中心;国家税务总局于北京建立主数据中心,并在广东南海成功建立异地数据中心。异地多活数据中心的迅速发展,对平衡系统访问压力、在线交易快速响应有着更高的要求。如何合理有效地将用户接入最佳的数据中心,从而使资源得以充分利用、平衡系统的访问压力、使用户具有更为良好的用户体验成为待为解决的问题。
传统的用户接入的方法主要是基于DNS域名解析服务,该方法考虑了用户与数据中心的距离,但没有考虑数据中心的最大负载情况。因此,提出一种基于常规Voronoi图(简称V图)的服务区域划分方法,该方法在考虑距离的基础上考虑了数据中心的最大负载。但该方法并没有考虑数据中心自身的性能条件和当前负载情况,即数据中心的处理能力。
发明内容
本发明提供了一种基于加权Voronoi图的用户接入区域划分方法、系统以及设备,以至少解决相关技术中数据中心的系统访问压力不均衡的问题。
本发明提供的基于加权Voronoi图的用户接入区域划分方法包括按顺序进行的下列步骤:
采集各数据中心中各服务器的性能参数指标和负载消耗指标;
根据所述性能参数指标和所述负载消耗指标,计算所述各服务器的处理能力得分值;
当服务器的处理能力得分值大于0时,将其处理能力得分值直接作为权重值,而当某些服务器的处理能力得分值小于0时,则将这些服务器的处理能力得分值进行数据变换到预定数值范围内,得到相应的权重值;
根据所述各服务器的权重值,计算所述各数据中心的权重值;
将所述各数据中心的权重值作为加权Voronoi图的种子点,划分出所述各数据中心对应的用户接入区域。
本发明提供的基于加权Voronoi图的用户接入区域划分装置包括:
采集模块,用于采集各数据中心中各服务器的性能参数指标和负载消耗指标;
第一计算模块,用于根据所述性能参数指标和所述负载消耗指标,计算所述各服务器的处理能力得分值;
变换模块,用于将所述各服务器的处理能力得分值变换到预定数值范围内,得到所述各服务器的权重值;
第二计算模块,用于根据所述各服务器的权重值,计算所述各数据中心的权重值;
划分模块,用于将所述各数据中心的权重值作为加权Voronoi图的种子点,划分出所述各数据中心对应的用户接入区域。
本发明提供的基于加权Voronoi图的用户接入区域划分设备包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现所述的方法。
本发明提供的计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现所述的方法。
通过本发明的上述方法、系统、设备和计算机可读存储介质,采用采集各数据中心中各服务器的性能参数指标和负载消耗指标;根据性能参数指标和负载消耗指标,计算各服务器的处理能力得分值;将各服务器的处理能力得分值变换到预定数值范围内,得到各服务器的权重值;根据各服务器的权重值,计算各数据中心的权重值;将各数据中心的权重值作为加权Voronoi图的种子点,划分出各数据中心对应的用户接入区域的方式,解决了相关技术中数据中心的访问压力不均衡的问题,能够使用户的接入划分更加合理,均衡了数据中心的访问压力,避免了资源的浪费,可为大数据时代数据中心建设和灾备系统建设提供技术支持。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的基于加权Voronoi图的用户接入区域划分方法的流程图;
图2是根据本发明实施例的基于加权Voronoi图的用户接入区域划分装置的结构框图;
图3是根据本发明实施例的基于加权Voronoi图的用户接入区域划分装置的优选结构框图;
图4是根据本发明实施例的基于加权Voronoi图的用户接入区域划分设备的示意图;
图5是根据本发明优选实施例的基于加权Voronoi图的用户接入区域划分方法的流程图;
图6是根据本发明优选实施例的场景1的用户接入区域划分示意图;
图7是根据本发明优选实施例的场景2的用户接入区域划分示意图;
图8是根据本发明优选实施例的场景3的用户接入区域划分示意图;
图9是根据本发明优选实施例的场景4的用户接入区域划分示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
在本实施例中提供了一种基于加权Voronoi图的用户接入区域划分方法,图1是根据本发明实施例的基于加权Voronoi图的用户接入区域划分方法的流程图,如图1所示,该方法包括按顺序进行的下列步骤:
步骤S101,采集各数据中心中各服务器的性能参数指标和负载消耗指标;
步骤S102,根据上述性能参数指标和负载消耗指标,计算各服务器的处理能力得分值;
步骤S103,将各服务器的处理能力得分值变换到预定数值范围内,得到各服务器的权重值;
步骤S104,根据各服务器的权重值,计算各数据中心的权重值;
步骤S105,将各数据中心的权重值作为加权Voronoi图的种子点,划分出各数据中心对应的用户接入区域。
通过上述的步骤,根据数据中心各服务器的性能参数指标和负载消耗指标,计算出各数据中心的权重值;将各数据中心的权重值作为加权Voronoi图的种子点,划分出各数据中心对应的用户接入区域。相对于相关技术中只考虑数据中心的性能参数指标划分得到的用户接入区域而言,采用上述步骤划分出来的各数据中心对应的用户接入区域同时考虑了数据中心的性能参数指标以及当前的负载消耗指标,解决了相关技术中数据中心的访问压力不均衡的问题,能够使用户的接入划分更加合理,均衡了数据中心的访问压力,避免了资源的浪费,可为大数据时代数据中心建设和灾备系统建设提供技术支持。
上述步骤优选采用计算机来执行;或者采用计算机辅助执行。
体现数据中心的服务器的性能参数指标以及负载消耗指标有多种,在本实施例中,选取其中比较典型的指标来示例性说明。在本实施例中,性能参数指标包括但不限于以下至少之一:CPU核心数、CPU主频、磁盘容量、RAM大小、内存速度、L1缓存大小、L2缓存大小;负载消耗指标包括但不限于以下至少之一:CPU利用率、磁盘I/O占用率、内存利用率、文件系统空间的占用比、磁盘平均响应时间、磁盘读取速度、磁盘写入速度。
可选地,在根据性能参数指标和负载消耗指标,计算各服务器的处理能力得分值时,可以采用下列的方式:采用主成分分析法确定性能参数指标和负载消耗指标中的主成分因子和主成分因子得分系数;根据主成分因子和主成分因子得分系数,计算各服务器的处理能力得分值。由于在计算服务器的处理能力得分值时采用的各种指标之间可能相互存在关联,并且在指标数量较多的情况下将会使得服务器的处理能力得分值的计算趋于复杂,为了简化计算并且降低各指标之间的耦合关系,可以采用主成分分析法筛选出所有指标中的主成分因子,并根据各个指标的贡献率计算主成分因子得分系数;通过筛选出来的主成分因子和对应的得分系数计算服务器的处理能力得分值能够突出主成分因子对服务器的处理能力的影响,并且由于减少了指标数量,还能够简化计算过程。
可选地,在本实施例中采用特征值大于1的方法来选取主成分因子。例如,选取性能参数指标和负载消耗指标中特征值大于1和累积贡献率大于预设值的指标作为主成分因子;根据主成分因子的贡献率,确定主成分因子得分系数。上述的预设值可以根据需要选取的指标数量来设置,一般选取80%~90%;优选值为80%。另外,除了使用特征值大于1的方法来选取主成分因子之外,还可以采用碎石坡法来选取主成分因子。或者将碎石坡法和特征值大于1法相结合来选取主成分因子。
上述的贡献率是指指标对服务器性能或者负载量的贡献程度,数值越大,表示该指标对数据中心的服务器性能或者负载量影响越大。
由于加权Voronoi图的种子点的数值必须为正值。在计算得到的数据中心的权重值为正值的情况下,可以直接将数据中心的权重值作为种子点的数值。但是,在一些情况下,可能存在计算的数据中心的权重值为负值的情况。为了避免数据中心的权重值出现负值,可以通过数值变换的方式,将服务器的权重值变换到预定数值范围内,同时保留各服务器权重值之间的数据关系,以确保计算得到的数据中心的权重值不为负值。在本实施例中,采用最小-最大规范化方法将各服务器的处理能力得分值变换到预定数值范围内,得到各服务器的权重值。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种基于加权Voronoi图的用户接入区域划分装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图2是根据本发明实施例的基于加权Voronoi图的用户接入区域划分装置的结构框图,如图2所示,该装置包括:
采集模块21,用于采集各数据中心中各服务器的性能参数指标和负载消耗指标;
第一计算模块22,用于根据性能参数指标和负载消耗指标,计算各服务器的处理能力得分值;
变换模块23,用于将各服务器的处理能力得分值变换到预定数值范围内,得到各服务器的权重值;
第二计算模块24,用于根据各服务器的权重值,计算各数据中心的权重值;
划分模块25,用于将各数据中心的权重值作为加权Voronoi图的种子点,划分出各数据中心对应的用户接入区域。
可选地,性能参数指标包括但不限于以下至少之一:CPU核心数、CPU主频、磁盘容量、RAM大小、内存速度、L1缓存大小、L2缓存大小;负载消耗指标包括但不限于以下至少之一:CPU利用率、磁盘I/O占用率、内存利用率、文件系统空间的占用比、磁盘平均响应时间、磁盘读取速度、磁盘写入速度。
图3是根据本发明实施例的基于加权Voronoi图的用户接入区域划分装置的优选结构框图,如图3所示,可选地,第一计算模块22包括:确定单元221,用于采用主成分分析法确定性能参数指标和负载消耗指标中的主成分因子和主成分因子得分系数;计算单元222,用于根据主成分因子和主成分因子得分系数,计算各服务器的处理能力得分值。
可选地,确定单元221包括:选取子单元2211,用于选取性能参数指标和负载消耗指标中特征值大于1和累积贡献率大于预设值的指标作为主成分因子;确定子单元2212,用于根据主成分因子的贡献率,确定主成分因子得分系数。
可选地,变换模块23,用于采用最小-最大规范化装置将各服务器的处理能力得分值变换到预定数值范围内,得到各服务器的权重值。
另外,结合图1描述的本发明实施例的基于加权Voronoi图的用户接入区域划分方法可以由基于加权Voronoi图的用户接入区域划分设备来实现。图4是根据本发明实施例的基于加权Voronoi图的用户接入区域划分设备的硬件结构示意图。
基于加权Voronoi图的用户接入区域划分设备可以包括处理器41以及存储有计算机程序指令的存储器42。
具体地,上述处理器41可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器42可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器42可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器42可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器42可在数据处理装置的内部或外部。在特定实施例中,存储器42是非易失性固态存储器。在特定实施例中,存储器42包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器41通过读取并执行存储器42中存储的计算机程序指令,以实现上述实施例中的任意一种数据同步方法。
在一个示例中,基于加权Voronoi图的用户接入区域划分设备还可包括通信接口43和总线44。其中,如图4所示,处理器41、存储器42、通信接口43通过总线44连接并完成相互间的通信。
通信接口43,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线44包括硬件、软件或两者,将数据同步设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线44可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
另外,结合上述实施例中的基于加权Voronoi图的用户接入区域划分方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种数据同步方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
为了使本发明实施例的描述更加清楚,下面结合优选实施例进行描述和说明。
为了平衡异地多活系统访问压力、充分利用系统资源、合理有效地为各数据中心分配用户,在本优选实施例中提出了一种基于加权V图的异地多活数据中心用户接入区域划分方法。该方法考虑各数据中心自身的性能条件和负载情况,通过选取相应指标,运用统计分析和数据变化的方法,确定各数据中心的权重值,在此基础上,运用加权Voronoi图的方法对用户接入区域进行划分。实验结果表明,此方法能够使用户的接入划分更加合理,均衡了数据中心的访问压力,避免了资源的浪费,可为大数据时代数据中心建设和灾备系统建设提供技术支持。
图5是根据本发明优选实施例的基于加权Voronoi图的用户接入区域划分方法的流程图,如图5所示,该方法包括如下步骤:
步骤1,收集各数据中心中各服务器的性能参数指标:
选用W(si)这个参量表示服务器si的性能参数指标。性能参数指标W(si)由CPU核心数n(si)、CPU主频c(si)、磁盘容量d(si)、RAM大小r(si)、内存速度e(si)、L1缓存m(si)、L2缓存o(si)这几个因素决定。
W(si)=α1·n(si)+α2·c(si)+α3·d(si)+α4·r(si)
+α5·e(si)+α6·m(si)+α7·o(si)
式中,αi表示各因素对数据中心性能条件的贡献度,贡献度αi的值越大,表示对数据中心的处理能力影响程度越大。
步骤2,收集各服务器的负载消耗指标:
选用F(si)这个参量表示服务器si当前的负载消耗指标。负载消耗指标F(si)由CPU利用率a(si)、磁盘I/O占用率b(si)、内存利用率g(si)、文件系统空间的占用比h(si)、磁盘平均响应时间k(si)、磁盘读取速度l(si)、磁盘写入速度q(si)这几个因素决定。
F(si)=β1·a(si)+β2·b(si)+β3·g(si)+β4·h(si)
+β5·k(si)+β6·l(si)+β7·q(si)
式中,βi表示各因素对负载量的贡献度,贡献度βi的值越大,表示该因素对数据中心的负载量影响越大。
步骤3,根据上述指标计算各服务器的处理能力得分值:选取上述步骤1、步骤2获得的影响服务器处理能力的14个指标作为确定权重值的指标体系,即将这些指标作为主成分分析法中的原变量x1,x2,…,xp,并将各个指标的具体统计记录值作为统计数据。运用主成分分析法,根据特征值、累计贡献率从上述14个指标中选取主成分因子,得到数据中心中每个服务器的处理能力得分值。在本优选实施例中,按照累计贡献率大于80%,特征值大于1从上述14个指标中选取出主成分因子。
具体方法如下:
1.根据原变量计算相关系数矩阵:
其中,rij(i,j=1,2,…p)为原变量xi与xj之间的相关系数,其计算公式为:
m为某一原变量的m个具体统计记录值。
2.计算上述相关系数矩阵的特征值与特征向量:
解特征方程|χE-R|=0,求出特征值χi(i=1,2,…,p),其中E是单位矩阵。对于每个特征值χi(i=1,2,…,p),解方程组Rb=χib得到单位特征向量bi,单位特征向量即||bi||=1,即bij表示单位特征向量bi的第j个分量。
3.根据上述特征值计算主成分因子的贡献率及累计贡献率:
计算主成分因子Zi的贡献率ωZi,计算公式为:
然后计算前k个主成分因子的累计贡献率ω,计算公式为:
4.根据上述累计贡献率和特征值计算服务器综合得分模型系数:
按照累计贡献率大于80%,特征值大于1从上述14个指标中选取出s个主成分因子。
以每个主成分因子所对应的特征值占所有提取出的主成分因子特征值之和的比例作为计算服务器综合得分模型系数lij,即:
5.根据上述服务器综合得分模型系数计算各服务器的处理能力得分值:
将服务器综合得分模型系数lj代入下面的综合得分模型:
其中xij表示第i台服务器的第j个指标的数据。然后将步骤1、2获得的统计数据代入式(8),得到某一数据中心中n个服务器的处理能力得分值Fi(1≤i≤n)。
步骤4,当服务器的处理能力得分值大于0时,将其处理能力得分值直接作为权重值,而当某些服务器的处理能力得分值小于0时,则将这些服务器的处理能力得分值进行数据变换而得到相应的权重值:
在上述计算各服务器的处理能力得分值的过程中,有些服务器的处理能力得分值可能为负值,这显然不满足加权Voronoi图的定义。为此,必须对这些服务器的处理能力得分值进行数据变换。常用的数据变换的方法有多种,最小-最大规范化方法是数据变换的一种重要方法,它可以对原始数据进行线性变换而得到一个新数列,使之落入一个特定的区间[new_minM,new_maxM],同时保持了原始数据之间的关系。本文选取在[1,10]闭区间上对这些服务器的处理能力得分值进行数据变换,使服务器的处理能力得分值在保持原始关系的同时落入[1,10]这一特定区间。其公式为:
其中,v′表示数据变换后服务器的权重值;v表示原始服务器的处理能力得分值Fi(1≤i≤n);若Fi(1≤i≤n)<0,则将其作为v代入式(9)进行数据变换,计算得到数据变换后服务器的权重值v′;maxM和minM分别表示原始服务器的处理能力得分值的最大值和最小值;new_maxM和new_minM分别表示新数列的最大值和最小值。
因此服务器的权重值为:
步骤5,根据上述服务器的权重值计算数据中心的权重值:
数据中心的权重值λj的计算公式为:
式中λj为各个数据中心的权重值,λsi为该数据中心中各服务器的权重值。
步骤6,根据数据中心的权重值得到各数据中心的用户接入区域划分结果:
将上述得到的数据中心的权重值作为加权Voronoi图的种子点而代入加权Voronoi图中,即可得到基于加权Voronoi图的各数据中心的用户接入区域划分结果。
为更好地比较各个情况下的用户接入区域划分结果,本优选实施例中设计四个场景。
场景1:
不考虑作为数据中心的不同旅客订票系统的性能条件和负载情况,仅考虑用户到旅客订票系统距离的基于常规Voronoi图的用户接入划分。
场景2:
在考虑用户到不同旅客订票系统距离的基础上,又考虑到不同旅客订票系统的性能条件的情况下,做出的基于加权Voronoi图的用户接入划分,此种场景是考虑到资源的利用情况,尽量将用户接入到性能条件较好的旅客订票系统来处理。
场景3:
在考虑用户到不同旅客订票系统距离的基础上,又考虑到不同旅客订票系统的负载情况的条件下,做出的基于加权Voronoi图的用户接入划分,此种场景旨在平衡系统的访问压力,尽量将用户接入到负载较低的旅客订票系统来处理。
场景4:
在综合考虑用户到旅客订票系统的距离、不同旅客订票系统的性能条件、负载情况,做出的基于加权Voronoi图的用户接入划分,此种场景旨在让资源得以充分利用的同时,又能平衡系统的访问压力。
权重计算实验由统计产品与服务解决方案(Statistical Product and ServiceSolutions,简称为SPSS)统计分析工具计算,根据数据计算得到各个场景中下面规定的三个数据中心的权重值。计算结果如表1所示:
表1不同场景下三个数据中心的权重值
接入划分实验由ArcGIS开发工具编程绘制,编写代码生成常规Voronoi图以及加权Voronoi图。实验结果如下:
场景1:
基于国内某民航旅客服务信息提供商的分别作为数据中心1(116.46,39.92)、数据中心2(120.76,30.77)和数据中心3(103.16,31.23)的三个旅客订票系统,编写代码生成常规Voronoi图的用户接入区域划分,如图6所示。
如果不考虑旅客订票系统的处理能力,即系统的性能条件和负载情况,此种划分方法能够方便简洁地给出用户接入区域的划分,确定用户应该接入哪个旅客订票系统。但是由于不同旅客订票系统具有不同的处理能力,仅按用户与旅客订票系统的距离来确定用户的接入显得不够合理。
场景2:
考虑旅客订票系统的性能条件,由公式(1)可知影响旅客订票系统性能条件的指标有CPU核心数n(si)、CPU主频c(si)、磁盘容量d(si)、RAM大小r(si)、内存速度e(si)、L1缓存m(si)、L2缓存o(si),结合表1中的数据,运用权重值确定算法,得到考虑性能条件下的三个旅客订票系统的权重值,分别为λ1=6.9326,λ2=6.2543,λ3=2.5961。由此,得到考虑性能条件时的基于加权Voronoi图的用户接入区域划分,如图7所示。
由表1可见,此场景中数据中心1的权重值最大,即数据中心1的性能条件最好,而数据中心3的权重值最小,即说明数据中心3的性能条件较差。因此,如图7所示,数据中心1的用户接入划分范围明显较图6有所扩大,而数据中心3的用户接入划分范围较图6有所缩小。这是由于考虑了不同旅客订票系统的性能,性能越好,用户接入范围越大,这样使资源得以充分利用,发挥其更大的作用。
场景3:
考虑旅客订票系统的负载情况,影响旅客订票系统负载情况的指标有CPU利用率a(si)、磁盘I/O占用率b(si)、内存利用率g(si)、文件系统空间的占用比h(si)、磁盘平均响应时间k(si)、磁盘读取速度l(si)、磁盘写入速度q(si),同样结合表1给出的数据,运用权重值确定算法,得到考虑负载情况下的三个旅客订票系统的权重值,分别为λ1=3.2689,λ2=4.1292,λ3=6.2189。由此,得到考虑负载情况时的基于加权Voronoi图的用户接入区域划分,如图8所示。
由表1可见,此场景中数据中心3的权重值最大,即数据中心3的旅客订票系统负载最小,而数据中心2的权重值最小,即说明数据中心2的旅客订票系统负载最大。因此,如图8所示,数据中心3的用户接入划分范围较图6与图7明显有所扩大,而数据中心2的用户接入划分范围较图6和图7有所缩小。这是由于考虑了不同数据中心的旅客订票系统的负载情况,负载越小,用户接入范围越大,负载越大,用户接入范围越小,这样能更好的平衡系统的访问压力,将用户接入到负载较小的数据中心的系统,使其有更为良好的用户体验。
场景4:
综合考虑用户与旅客订票系统的距离以及各旅客订票系统的处理能力和负载情况,即系统的处理能力,结合表1所给的旅客订票系统的服务器状态数据,运用权重值确定算法,得到三个旅客订票系统的权重值,分别为λ1=7.1685,λ2=4.1536,λ3=5.5985。由此,得到综合考虑多种条件下的基于加权Voronoi图的旅客订票系统的用户接入区域划分,如图9所示。
由表1可见,对比三种场景下各个数据中心的权重,可见在场景1仅考虑数据中心性能条件时,数据中心1、2的权重值最大,即性能条件最好。但场景2中考虑数据中心负载情况时,数据中心1、2的权重值较小,说明此时数据中心1、2的负载较大。若仅考虑数据中心性能条件将更多用户接入到性能条件较好的数据中心1、2,则会造成数据中心1、2的负载越来越大,导致较差的用户体验。同理,若仅考虑数据中心负载将更多用户接入到负载较小的数据中心3,则不能充分利用性能条件较好的数据中心1、2,造成资源的浪费。因此,综合考虑用户到数据中心的距离以及数据中心性能条件和负载情况,则会使划分充分考虑各个因素,全面而合理。
由图9可见,订票用户的接入划分更为精确。仅考虑某一因素时被分配到某个数据中心的用户,在综合考虑到用户到数据中心的距离以及数据中心的处理能力后,可能被分配到处理能力更好的数据中心。由此可以看到,在考虑了不同旅客订票系统的处理能力之后,用户接入的划分显得更为合理,在如今大并发在线交易形式下,能够保证更好的用户体验,同时对条件更好的资源予以了充分利用,避免了闲置资源的浪费。
综上所述,通过本发明的上述实施例或者优选实施例提出的一种基于加权Voronoi图的异地多活数据中心用户接入区域划分方法,考虑了各数据中心自身的性能条件和负载情况,通过选取相应指标,运用统计分析和数据变化的方法,确定各数据中心的权重值,在此基础上,运用加权Voronoi图的方法对用户接入区域进行划分。实验结果表明,本发明实施例能够使用户的接入划分更加合理,均衡了数据中心的访问压力,避免了资源的浪费,可为大数据时代数据中心建设和灾备系统建设提供技术支持。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于加权Voronoi图的用户接入区域划分方法,其特征在于,所述的方法包括按顺序进行的下列步骤:
采集各数据中心中各服务器的性能参数指标和负载消耗指标;
根据所述性能参数指标和所述负载消耗指标,计算所述各服务器的处理能力得分值;
当服务器的处理能力得分值大于0时,将其处理能力得分值直接作为权重值,而当某些服务器的处理能力得分值小于0时,则将这些服务器的处理能力得分值进行数据变换到预定数值范围内,得到相应的权重值;
根据所述各服务器的权重值,计算所述各数据中心的权重值;
将所述各数据中心的权重值作为加权Voronoi图的种子点,划分出所述各数据中心对应的用户接入区域。
2.根据权利要求1所述的方法,其特征在于,
所述性能参数指标包括以下至少之一:CPU核心数、CPU主频、磁盘容量、RAM大小、内存速度、L1缓存大小、L2缓存大小;
所述负载消耗指标包括以下至少之一:CPU利用率、磁盘I/O占用率、内存利用率、文件系统空间的占用比、磁盘平均响应时间、磁盘读取速度、磁盘写入速度。
3.根据权利要求1所述的方法,其特征在于,根据所述性能参数指标和所述负载消耗指标,计算所述各服务器的处理能力得分值的方法是:首先,利用所述性能参数和所述负载消耗指标计算相关系数矩阵,然后计算相关系数矩阵特征值与特征向量,之后根据特征值计算主成分因子的贡献率及累计贡献率,再根据累计贡献率和特征值选取主成分因子,然后,以每个主成分因子所对应的特征值占所提取的主成分因子特征值之和的比例作为计算服务器综合得分模型的系数,得到服务器综合得分模型;最后,将采集到的所述性能参数指标和所述负载消耗指标代入服务器综合得分模型,得到所述各服务器的处理能力得分值。
4.根据权利要求1所述的方法,其特征在于,所述的当某些服务器的处理能力得分值小于0时,将这些服务器的处理能力得分值进行数据变换到预定数值范围内,得到相应的权重值的方法是:
采用最小-最大规范化方法对原始数据进行变换,使之落入所述预定数值范围内,得到所述各服务器的权重值。
5.一种基于加权Voronoi图的用户接入区域划分装置,其特征在于,所述的装置包括:
采集模块,用于采集各数据中心中各服务器的性能参数指标和负载消耗指标;
第一计算模块,用于根据所述性能参数指标和所述负载消耗指标,计算所述各服务器的处理能力得分值;
变换模块,用于将所述各服务器的处理能力得分值变换到预定数值范围内,得到所述各服务器的权重值;
第二计算模块,用于根据所述各服务器的权重值,计算所述各数据中心的权重值;
划分模块,用于将所述各数据中心的权重值作为加权Voronoi图的种子点,划分出所述各数据中心对应的用户接入区域。
6.根据权利要求5所述的装置,其特征在于,所述第一计算模块包括:
确定单元,用于采用主成分分析法确定所述性能参数指标和所述负载消耗指标中的主成分因子和主成分因子得分系数;所述确定单元包括:
选取子单元,用于选取所述性能参数指标和所述负载消耗指标中特征值大于1和累积贡献率大于预设值的指标作为所述主成分因子;
确定子单元,用于根据所述主成分因子的贡献率,确定所述主成分因子得分系数;
计算单元,用于根据所述主成分因子和所述主成分因子得分系数,计算所述各服务器的处理能力得分值。
7.根据权利要求5所述的装置,其特征在于,
所述变换模块,用于采用最小-最大规范化装置将所述各服务器的所述处理能力得分值变换到所述预定数值范围内,得到所述各服务器的权重值。
8.一种基于加权Voronoi图的用户接入区域划分设备,其特征在于,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1至4中任一项所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1至4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711349331.6A CN108089923A (zh) | 2017-12-15 | 2017-12-15 | 基于加权Voronoi图的用户接入区域划分方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711349331.6A CN108089923A (zh) | 2017-12-15 | 2017-12-15 | 基于加权Voronoi图的用户接入区域划分方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108089923A true CN108089923A (zh) | 2018-05-29 |
Family
ID=62176479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711349331.6A Pending CN108089923A (zh) | 2017-12-15 | 2017-12-15 | 基于加权Voronoi图的用户接入区域划分方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108089923A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108628231A (zh) * | 2018-07-05 | 2018-10-09 | 郑州云海信息技术有限公司 | 云数据中心中设备监控方法和装置 |
CN109614738A (zh) * | 2018-12-24 | 2019-04-12 | 中铁第四勘察设计院集团有限公司 | 一种基于非均质性空间的加权Vorono的物流园区腹地界定模型 |
CN111610994A (zh) * | 2020-05-20 | 2020-09-01 | 山东汇贸电子口岸有限公司 | 一种云数据中心的部署方法、装置、设备及存储介质 |
CN112565345A (zh) * | 2020-11-16 | 2021-03-26 | 天津大学 | 一种异构边缘环境中的负载平衡感知数据共享系统 |
WO2021103499A1 (zh) * | 2019-11-26 | 2021-06-03 | 苏宁易购集团股份有限公司 | 一种基于多活数据中心的流量切换方法及装置 |
CN112947843A (zh) * | 2019-12-10 | 2021-06-11 | 北京金山云网络技术有限公司 | 存储系统的配置、调度方法、装置及电子设备 |
CN113111893A (zh) * | 2020-01-09 | 2021-07-13 | 中国移动通信集团四川有限公司 | 一种数据的处理方法、系统以及电子设备 |
CN113242283A (zh) * | 2021-04-29 | 2021-08-10 | 西安点告网络科技有限公司 | 一种服务器动态负载均衡方法、系统、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110238608A1 (en) * | 2010-03-25 | 2011-09-29 | Nokia Corporation | Method and apparatus for providing personalized information resource recommendation based on group behaviors |
CN103037381A (zh) * | 2011-09-29 | 2013-04-10 | 中国移动通信集团河南有限公司 | 一种确定Voronoi图的方法、装置和话务均衡的方法、装置 |
CN105787600A (zh) * | 2016-03-03 | 2016-07-20 | 国家电网公司 | 基于自适应量子遗传算法的电动出租车充电站规划方法 |
CN107194541A (zh) * | 2017-04-24 | 2017-09-22 | 国网江西省电力公司赣州供电分公司 | 一种基于自适应权重Voronoi图的配电网供电分区方法 |
-
2017
- 2017-12-15 CN CN201711349331.6A patent/CN108089923A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110238608A1 (en) * | 2010-03-25 | 2011-09-29 | Nokia Corporation | Method and apparatus for providing personalized information resource recommendation based on group behaviors |
CN103037381A (zh) * | 2011-09-29 | 2013-04-10 | 中国移动通信集团河南有限公司 | 一种确定Voronoi图的方法、装置和话务均衡的方法、装置 |
CN105787600A (zh) * | 2016-03-03 | 2016-07-20 | 国家电网公司 | 基于自适应量子遗传算法的电动出租车充电站规划方法 |
CN107194541A (zh) * | 2017-04-24 | 2017-09-22 | 国网江西省电力公司赣州供电分公司 | 一种基于自适应权重Voronoi图的配电网供电分区方法 |
Non-Patent Citations (2)
Title |
---|
唐小波等: "基于自适应权重Voronoi图的配电网供电分区方法", 《电力系统保护与控制》 * |
董健卫等: "基于主成分分析的PM2.5的影响因素权重确定方法", 《广东技术师范学院学报(自然科学)》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108628231A (zh) * | 2018-07-05 | 2018-10-09 | 郑州云海信息技术有限公司 | 云数据中心中设备监控方法和装置 |
CN109614738A (zh) * | 2018-12-24 | 2019-04-12 | 中铁第四勘察设计院集团有限公司 | 一种基于非均质性空间的加权Vorono的物流园区腹地界定模型 |
WO2021103499A1 (zh) * | 2019-11-26 | 2021-06-03 | 苏宁易购集团股份有限公司 | 一种基于多活数据中心的流量切换方法及装置 |
CN112947843A (zh) * | 2019-12-10 | 2021-06-11 | 北京金山云网络技术有限公司 | 存储系统的配置、调度方法、装置及电子设备 |
CN113111893A (zh) * | 2020-01-09 | 2021-07-13 | 中国移动通信集团四川有限公司 | 一种数据的处理方法、系统以及电子设备 |
CN111610994A (zh) * | 2020-05-20 | 2020-09-01 | 山东汇贸电子口岸有限公司 | 一种云数据中心的部署方法、装置、设备及存储介质 |
CN111610994B (zh) * | 2020-05-20 | 2023-10-20 | 山东汇贸电子口岸有限公司 | 一种云数据中心的部署方法、装置、设备及存储介质 |
CN112565345A (zh) * | 2020-11-16 | 2021-03-26 | 天津大学 | 一种异构边缘环境中的负载平衡感知数据共享系统 |
CN113242283A (zh) * | 2021-04-29 | 2021-08-10 | 西安点告网络科技有限公司 | 一种服务器动态负载均衡方法、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108089923A (zh) | 基于加权Voronoi图的用户接入区域划分方法和装置 | |
CN109784636A (zh) | 欺诈用户识别方法、装置、计算机设备及存储介质 | |
CN109359682B (zh) | 一种基于f-dbscan迭代聚类的机场巴士候选站点筛选方法 | |
CN108156236A (zh) | 业务请求处理方法、装置、计算机设备和存储介质 | |
CN106469376B (zh) | 一种风险控制方法和设备 | |
CN108388924A (zh) | 一种数据分类方法、装置、设备及计算机可读存储介质 | |
CN109859054A (zh) | 网络社团挖掘方法、装置、计算机设备及存储介质 | |
CN107423613A (zh) | 依据相似度确定设备指纹的方法、装置及服务器 | |
CN111325619A (zh) | 一种基于联合学习的信用卡欺诈检测模型更新方法及装置 | |
CN110706096A (zh) | 基于捞回用户管理授信额度的方法、装置和电子设备 | |
CN108960912A (zh) | 用于确定目标位置的方法和装置 | |
CN112200471B (zh) | 充电桩的数量配置方法、装置和充电桩的分布系统 | |
CN105894028A (zh) | 用户识别方法和装置 | |
CN108876076A (zh) | 基于指令数据的个人信用评分方法及装置 | |
CN113807046A (zh) | 一种测试激励优化回归验证方法、系统及介质 | |
CN109345373A (zh) | 核销风险预警方法、装置、电子设备及计算机可读介质 | |
CN110610415B (zh) | 一种模型更新的方法和装置 | |
CN110297959A (zh) | 数据存储方法、装置、存储介质及边缘服务器 | |
CN113850669A (zh) | 用户分群方法、装置、计算机设备及计算机可读存储介质 | |
CN103634470A (zh) | 一种基于终端移动数据接入网Qos的人机交互预测方法 | |
CN112241820B (zh) | 资金流动中关键节点的风险识别方法、装置及计算设备 | |
CN105897931B (zh) | 网络免流控制方法和装置 | |
CN111966835A (zh) | 基于知识图谱的场景所需功能服务的解析装置及方法 | |
CN107784586A (zh) | 流量转移方法、装置、计算机设备及存储介质 | |
CN109636437A (zh) | 小区均价预估方法、电子装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180529 |