CN113489776A - 热点检测方法、装置、监测服务器及存储介质 - Google Patents

热点检测方法、装置、监测服务器及存储介质 Download PDF

Info

Publication number
CN113489776A
CN113489776A CN202110744375.9A CN202110744375A CN113489776A CN 113489776 A CN113489776 A CN 113489776A CN 202110744375 A CN202110744375 A CN 202110744375A CN 113489776 A CN113489776 A CN 113489776A
Authority
CN
China
Prior art keywords
data
rate per
hot spot
query rate
hotspot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110744375.9A
Other languages
English (en)
Other versions
CN113489776B (zh
Inventor
唐彦昭
何昱晨
贾硕
赵立伟
张一帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Beijing Xiaomi Pinecone Electronic Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Beijing Xiaomi Pinecone Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd, Beijing Xiaomi Pinecone Electronic Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN202110744375.9A priority Critical patent/CN113489776B/zh
Publication of CN113489776A publication Critical patent/CN113489776A/zh
Application granted granted Critical
Publication of CN113489776B publication Critical patent/CN113489776B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提出一种分布式存储系统的热点检测方法、装置、监测服务器及存储介质,属于分布式存储技术领域。其中热点检测方法包括:获取存储节点中数据分片的每秒查询率,每秒查询率包括当前每秒查询率和历史每秒查询率;基于历史每秒查询率确定当前每秒查询率所处的状态;响应于当前每秒查询率所处的状态为目标状态,确定数据分片对应的存储节点为热点。由此,能够自动、快速且准确地发现热点,有效解决了通过人工观察方式推测热点的位置导致的繁琐耗时以及正确率低的问题。

Description

热点检测方法、装置、监测服务器及存储介质
技术领域
本公开涉及分布式存储技术领域,尤其涉及一种分布式存储系统的热点检测方法、装置、监测服务器及存储介质。
背景技术
近年来,随着互联网用户的飞速增长以及AI(Artificial Intelligence,人工智能)领域对于大数据的依赖,数据分析和后台开发人员需要获得与处理相关的越来越多的数据,在这样的背景下,分布式存储相对于传统的单机存储越来越流行。但是,在采用较低成本获取大量算力的同时,分布式存储系统在运维与使用中也会遇到各种各样的挑战,数据热点问题就是最常见的问题之一。
热点解决方案对于任何分布式存储系统都是一个值得思考的问题,实际运维中,由单个热点数据导致分布式存储系统整体不稳定是很常见的现象,例如某商品降价引发的瞬时热卖、微博热点话题的突然出现、或是开发人员写入数据库的数据大小分配不均,这些都可能引发热点问题。在解决这些问题时,首先需要能够快速且准确地发现这些热点。
相关技术中,一般是通过集群监控系统,人工观察到数据的读写延迟变化后,再根据存储服务器的CPU占用率、网卡占用率去推测热点的位置,这样不仅繁琐耗时,而且无法保证正确率。
发明内容
本公开实施例提供一种分布式存储系统的热点检测方法、装置、监测服务器及存储介质。
本公开第一方面实施例提出了一种分布式存储系统的热点检测方法,分布式存储系统包括多个存储节点,方法包括:获取存储节点中数据分片的每秒查询率,每秒查询率包括当前每秒查询率和历史每秒查询率;基于历史每秒查询率确定当前每秒查询率所处的状态;响应于当前每秒查询率所处的状态为目标状态,确定数据分片对应的存储节点为热点。
在本公开的一个实施例中,基于历史每秒查询率确定当前每秒查询率所处的状态,包括:获取数据分片的历史每秒查询率和当前每秒查询率的平均值和标准差;针对数据分片,获取当前每秒查询率与平均值之间的差值,并根据差值和标准差,确定当前每秒查询率所处的状态。
在本公开的一个实施例中,分布式存储系统的热点检测方法还包括:若差值与标准差的比值超过预设值,则确定当前每秒查询率所处的状态为目标状态。
在本公开的一个实施例中,每秒查询率为读出每秒查询率或写入每秒查询率。
在本公开的一个实施例中,采用循环队列存储方式存储历史每秒查询率。
在本公开的一个实施例中,在确定数据分片对应的存储节点为热点之后,方法还包括:采用可视化方式或日志方式展示热点的数据分片。
在本公开的一个实施例中,在确定数据分片对应的存储节点为热点之后,方法还包括:发送热点流量检测指令至热点,以便热点在接收到热点流量检测指令后进行热点流量检测。
本公开第二方面实施例提出了一种分布式存储系统的热点检测装置,分布式存储系统包括多个存储节点,装置包括:获取模块,用于获取存储节点中数据分片的每秒查询率,每秒查询率包括当前每秒查询率和历史每秒查询率;状态确定模块,用于基于历史每秒查询率确定当前每秒查询率所处的状态;热点确定模块,用于响应于当前每秒查询率所处的状态为目标状态,确定数据分片对应的存储节点为热点。
本公开第三方面实施例提出了一种监测服务器,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现本公开第一方面实施例提出的分布式存储系统的热点检测方法。
本公开第四方面实施例提出了一种非临时性计算机可读存储介质,其特征在于,当存储介质中的指令由监测服务器的处理器执行时,使得监测服务器能够执行本公开第一方面实施例提出的分布式存储系统的热点检测方法。
本公开实施例提供的分布式存储系统的热点检测方法、装置、监测服务器及存储介质,获取存储节点中数据分片的每秒查询率,包括当前每秒查询率和历史每秒查询率,并基于历史每秒查询率确定当前每秒查询率所处的状态,以及响应于当前每秒查询率所处的状态为目标状态,确定数据分片对应的存储节点为热点,由此,能够自动、快速且准确地发现热点,即能够自动、快速且准确地发现系统可能存在的故障(单机压力过大导致宕机),有效解决了通过人工观察方式推测热点的位置导致的繁琐耗时以及正确率低的问题。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据一示例性实施例示出的一种分布式存储系统的结构示意图;
图2是根据一示例性实施例示出的一种分布式存储系统的热点检测方法的流程图;
图3是根据一示例性实施例示出的一种分布式存储系统的热点检测方法中确定当前每秒查询率所处的状态的流程图;
图4是根据一示例性实施例示出的一种热点测试结果图;
图5是根据一示例性实施例示出的一种历史每秒查询率的存储示意图;
图6是根据一示例性实施例示出的一种分布式存储系统的热点检测装置框图;
图7是根据一示例性实施例示出的一种监测服务器框图;
图8是根据一示例性实施例示出的另一种分布式存储系统的热点检测方法的流程图;
图9是根据一示例性实施例示出的一种粗粒度筛查的流程图;
图10是根据一示例性实施例示出的一种细粒度筛查的流程图;
图11是根据一示例性实施例示出的一种双层筛查结构示意图;
图12是根据一示例性实施例示出的性能测试结果图;
图13是根据一示例性实施例示出的一种分布式存储系统的热点检测装置框图;
图14是根据一示例性实施例示出的一种存储服务器框图;
图15是根据一示例性实施例示出的一种分布式存储系统的热点削峰方法的流程图;
图16是根据一示例性实施例示出的使用热点削峰方案前后的CPU占用率;
图17是根据一示例性实施例示出的一种分布式存储系统的热点削峰装置框图;
图18是根据一示例性实施例示出的一种存储服务器框图;
图19是根据一示例性实施例示出的另一种分布式存储系统的热点削峰方法的流程图;
图20是根据一示例性实施例示出的一种客户端框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开实施例的一些方面相一致的装置和方法的例子。
在本公开实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开实施例。在本公开实施例和所附权利要求书中所使用的单数形式的“一种”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”及“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的要素。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
分布式存储系统一般使用键值对(Key-Value)进行数据的存储,大方向上具有基于哈希(Hash)分片和基于范围(Range)分片两种方式,其中,基于哈希分片是按照数据哈希过后的哈希值进行数据分配;基于范围分片是按照数据的ASCII码(American StandardCode for Information Interchange,美国信息交换标准代码)排序后进行数据分配。不同的数据分片分配在不同的存储服务器(即存储节点)上,在数据随机输入的情况下数据分配是均匀的,以将单机系统中单机的压力分散到集群中多台存储服务器中。但是当大量客户端访问集群中的一个或者少数几个存储服务器时,使得少数数据分片的读写请求过多,载荷过大,而其它数据分片的负载却很小,从而造成了系统的“热点”现象,使系统负载失衡,降低系统的效率,影响了分布式存储系统的整体可用性。
其中,热点的产生原因可能有很多种:一方面,可能是现实生活中出现了热点问题,比如网上商城出现了大降价商品,大家蜂拥而至来购买,或是微博出现了热点新闻,引发了公众的广泛讨论,这些前端的行为传递到后端的存储系统就成为了一个热点,使得相应的存储服务器压力增大;另一方面,可能是开发人员对存储系统使用不当,将可以存储在内存的数据或是可以被打散的数据存储在存储系统中,频繁的读写造成了单机压力过大,或者由于存储的键值对大小过大,单次读写的数据过多、耗时长,此时的表现形式与热点类似。
单机出现热点导致负载增加看似只影响了热点数据的读写效率,其实不然,因为在实际情况下,一台存储服务器上往往不止存在一个数据分片,如果单个数据分片的读写就将单机负载打满,其它存储在该存储服务器上的数据分片也会受到影响,如主数据分片会直接受到读写效率的影响,从数据分片则会写入延迟成为慢节点,影响整个系统的效率,当情况异常严重时,还会导致系统负载过高从而宕机,因此早发现早处理热点是运维过程中的重中之重。
相关技术中,一般是通过集群监控系统,人工观察到数据的读写延迟变化后,再根据存储服务器的CPU占用率、网卡占用率去推测热点的位置,这样不仅繁琐耗时,而且无法保证正确率。基于此,本公开提供了一种分布式存储系统的热点检测方法,该方法能够自动、快速且准确地发现热点。
需要说明的是,本公开提供的分布式存储系统的热点检测方法,可以应用于如图1所示的分布式存储系统中。其中,分布式存储系统可包括管理服务器(Zookeeper)、元数据服务器(MetaServer)、存储服务器(ReplicaServer)和监测服务器(Collector)。
管理服务器主要用于为分布式应用提供一致性服务,如配置服务、域名服务、分布式同步以及主服务等。
元数据服务器主要用于负责管理集群的全局状态,可包括主(Master)元数据服务器和两个备份(Backup)元数据服务器。
存储服务器主要用于负责数据读写、存储等,在数据存储时,每个数据均有三个副本,分散到不同的存储服务器上,相应的存储服务器为主(Primary)存储服务器和两个备份(Secondary)存储服务器。例如,在客户端(ClientLib)具有写请求时,先向元数据服务器查询数据的键的位置,之后根据键的位置向对应的主存储服务器发起写请求,而后主存储服务器将数据同步至两个备份服务器,两者均写入成功后,返回结果至客户端。
监测服务器主要用于搜集各存储服务器的性能指标,如CPU使用率、数据访问延迟等,在本公开中,还用于搜集用于判断热点的关键指标:每秒查询率,以进行热点发现,如针对每个存储节点(即存储服务器),获取数据分片的每秒查询率,包括当前每秒查询率和历史每秒查询率,而后基于历史每秒查询率确定当前每秒查询率所处的状态,并响应于当前每秒查询率所处的状态为目标状态,确定数据分片对应的存储节点为热点。需要说明的是,每秒查询率是指针对一个特定的存储服务器,在规定时间内所处理流量多少的衡量标准。
图2是根据一示例性实施例示出的一种分布式存储系统的热点检测方法的流程图,以该方法应用于图1中的监测服务器为例进行说明,包括以下步骤:
在步骤S101中,获取存储节点中数据分片的每秒查询率,每秒查询率包括当前每秒查询率和历史每秒查询率。
可选地,在步骤S101中,可获取每个存储节点中各个数据分片的每秒查询率,包括当前每秒查询率和历史每秒查询率。在具体实施时,可由监测服务器实时搜集和记录存储节点中数据分片的每秒查询率,包括当前每秒查询率和历史每秒查询率,用于热点发现。
在步骤S102中,基于历史每秒查询率确定当前每秒查询率所处的状态。
具体地,在获得存储节点中数据分片的当前每秒查询率和历史每秒查询率后,可基于记录的历史每秒查询率来确定当前每秒查询率所处的状态。可选地,可基于记录的所有历史每秒查询率依次确定记录的每个当前每秒查询率所处的状态,如当前每秒查询率是否严重偏离历史每秒查询率。
在步骤S103中,响应于当前每秒查询率所处的状态为目标状态,确定数据分片对应的存储节点为热点。
具体地,若基于历史每秒查询率确定某一当前每秒查询率所处的状态为目标状态,如严重偏离历史每秒查询率,则确定该当前每秒查询率对应的数据分片所对应的存储节点为热点。
举例来说,以图1为例,在确定存储服务器是否为热点时,可由监测服务器获取存储服务器中数据分片的当前每秒查询率和历史每秒查询率,并基于历史每秒查询率判断当前每秒查询率所处的状态是否为目标状态,若某一当前每秒查询率所处的状态为目标状态,如该当前每秒查询率严重偏离历史每秒查询率,则确定相应的存储服务器存储有热点数据,该存储服务器为热点,否则该存储服务器不具有热点数据。
由此,基于当前每秒查询率和历史每秒查询率,能够自动、快速且准确地确定出存储节点是否为热点,也即确定出存储节点是否存在故障(单机压力过大导致宕机)的风险,有效解决了通过人工观察方式推测热点的位置导致的繁琐耗时以及正确率低的问题。
需要说明的是,在公开的一些实施例中,可基于当前每秒查询率和历史每秒查询率,通过一维的异常值检测算法分析出热点,即进行热点发现。可以理解的是,在统计学中,如果一个数据分布近似高斯分布,那么大约68%的数据会在总体数据平均值的一个标准差范围内,大约95%的数据会在总体数据平均值的两个标准差范围内,大约97%的数据会在总体数据平均值的三个标准差范围内,因此可以在数据分片的当前每秒查询率在历史每秒查询率的三个标准差范围外时,确定数据分片对应的存储节点为热点。
具体地,在本公开的一个实施例中,参考图3所示,基于历史每秒查询率确定当前每秒查询率所处的状态,包括:
在步骤S201中,获取数据分片的历史每秒查询率和当前每秒查询率的平均值和标准差。
具体地,在进行热点发现时,可先获取存储节点中数据分片的当前每秒查询率和历史每秒查询率,而后获取历史每秒查询率和当前每秒查询率的平均值和标准差,即计算历史每秒查询率和当前每秒查询率的平均值,以及计算历史每秒查询率和当前每秒查询率的标准差。可选地,在步骤S201中,可获取记录的所有数据分片的历史每秒查询率和当前每秒查询率的平均值和标准差。
在步骤S202中,针对数据分片,获取当前每秒查询率与平均值之间的差值,并根据差值和标准差,确定当前每秒查询率所处的状态。
可选地,可针对记录的每个数据分片,计算各个数据分片的当前每秒查询率与平均值之间的差值,根据差值和标准差,确定当前每秒查询率所处的状态。
进一步地,在本公开的一个实施例中,分布式存储系统的热点检测方法还包括:若差值与标准差的比值超过预设值,则确定当前每秒查询率所处的状态为目标状态,其中预设值可根据实际情况进行标定,如预设值为3,即若某一当前每秒查询率的差值与标准差的比值超过预设值(如3),则确定该当前每秒查询率所处的状态为目标状态,此时确定相应的数据分片对应的存储节点为热点。也就是说,在该示例中,利用统计学中的3σ原理,将存储节点的数据分片的当前每秒查询率与历史每秒查询率进行比对,以判断当前每秒查询率是否为离群值,即计算Z分数,如果是离群值,即Z分数大于预设值3,则确定相应的存储节点为热点。
作为一个具体示例,可通过以下方式计算Z分数:
avg=calculate average in historyData and currentData//计算平均值avg
std=calculate standard deviation in historyData and currentData//计算标准差std
ForqpsValuei in currentData
deviationi=Max((qpsValuei–avg)/std,0)//计算每个当前每秒查询率qpsValuei与平均值之间的差值与标准差的比值,并输出相应的结果
Output(deviationi)
其中,输入为当前周期统计到的各数据分片的每秒查询率,包括当前每秒查询率和历史每秒查询率,输出为各数据分片的当前每秒查询率相对于数据分片的历史每秒查询率的标准差偏离,即Z分数。在获得Z分数后,将其与预设值如3进行比较,如果Z分数大于预设值3,说明数据分片对应的存储节点为热点。
由此,基于3σ原理进行热点检测,不仅检测原理简单、实现简单,而且具有较高的快速性、准确性以及有效性。当然,还可以采用其它一维异常值检测算法来确定数据分片对应的存储节点是否为热点,如DBSCAN聚类方法、孤立森林等一维异常值检测算法,本公开对此不作限定。
为了验证本公开所具有的效果,可基于图1所示分布式存储系统,分别以四种数据配置由客户端向存储服务器发送数据,同时检测采用本公开进行热点发现的结果。测试方法如下:首先按照配置文件构造对分布式存储系统的访问字符串组,包括随机字符串部分和热点字符串部分,随机字符串部分随机生成并分散在操作队列中,热点字符串部分按照配置文件重复生成并分散在操作队列中,然后按照配置文件中的读写比例同时向分布式存储系统使用操作队列进行读写操作,并无线循环,直至数据观察结束,具体此时数据如表1所示:
表1
Figure BDA0003142324480000111
Figure BDA0003142324480000121
测试结果如图4所示,从图4可以看出,本公开的热点检测方法是准确有效的。其中,在数据一中,设置的数据全部为随机数据,即没有热点数据的正常读取,结果显示所有数据分片的偏差值均小于等于1,即数据分片P1至P8的偏差值均小于等于1;而数据二、三和四,分别对应的是出现1个、2个和3个热点数据的情况,本公开的热点检测方法均能够精准发现,如数据二,数据分片P4的偏差值为8,超过预设值如3,表示具有1个热点;数据三,数据分片P1和P6的偏差值均为6,超过预设值如3,表示具有2个热点;数据四,数据分片P4、P5和P6的偏差值均为5,超过预设值如3,表示具有3个热点。
由此,本公开的热点检测方法,能够自动、快速且准确地发现热点,并且相较于传统的通过各项流量吞吐监控判断热点的方法,一是可以更加轻易明了地找出正在发生的热点,二是可以更加方便地介入自动报警监控。
在本公开的一个实施例中,每秒查询率为读出每秒查询率或写入每秒查询率。需要说明的是,在进行热点发现时,可分别基于读出每秒查询率和写入每秒查询率进行热点发现,以利用读热点和写热点的分别发现。
具体来说,可获取存储节点中数据分片的当前读出每秒查询率和历史读出每秒查询率,并基于数据分片的历史读出每秒查询率确定数据分片的当前读出每秒查询率所处的状态,以及响应于当前读出每秒查询率所处的状态为目标状态,确定数据分片对应的存储节点为读热点;同时,可获取存储节点中数据分片的当前写入每秒查询率和历史写入每秒查询率,并基于数据分片的历史写入每秒查询率确定数据分片的当前写入每秒查询率所处的状态,以及响应于当前写入每秒查询率所处的状态为目标状态,确定数据分片对应的存储节点为写热点。具体实现过程,可参考前述,这里不再赘述。
在本公开的一个实施例中,采用循环队列存储方式存储历史每秒查询率。
具体地,在进行热点发现时,需要记录历史每秒查询率,因此需要考虑将一个分布式存储系统中各个表、各个数据分片的历史数据保存下来,但是又考虑到要控制内存的使用,防止无限制地缓存,造成内存泄露,在一些实施例中,采用循环队列存储方式存储历史每秒查询率。
举例来说,可由监测服务器记录整个分布式存储系统的所有表的信息,并由监测服务器中的热点计算模块记录单个表的信息,其中每个表的信息以循环队列方式存储,如图5所示,当队列容量超过指定大小时,队列会淘汰旧数据再存入新数据,这样可以有效保证系统内存的使用。
在本公开的一个实施例中,在确定数据分片对应的存储节点为热点之后,方法还包括:采用可视化方式或日志方式展示热点的数据分片,当然,也可以进行热点预警,以对用户进行提醒。
在本公开的一个实施例中,在确定数据分片对应的存储节点为热点之后,方法还包括:发送热点流量检测指令至热点,以便热点在接收到热点流量检测指令后进行热点流量检测。
具体地,监测服务器在发现某一存储节点为热点后,可向该存储节点发送热点流量检测指令,以便该存储节点在接收到热点流量检测指令后,进行热点流量(即热点数据)检测,对于热点流量的检测,后续再进行详述。
图6是根据一示例性实施例示出的一种分布式存储系统的热点检测装置框图,参考图6所示,该分布式存储系统的热点检测装置10包括:获取模块11、状态确定模块12和热点确定模块13。
其中,获取模块11被配置为用于获取存储节点中数据分片的每秒查询率,每秒查询率包括当前每秒查询率和历史每秒查询率;状态确定模块12被配置为用于基于历史每秒查询率确定当前每秒查询率所处的状态;热点确定模块13被配置为用于响应于当前每秒查询率所处的状态为目标状态,确定数据分片对应的存储节点为热点。
在本公开的一个实施例中,状态确定模块12用于:获取数据分片的历史每秒查询率和当前每秒查询率的平均值和标准差,并针对数据分片,获取当前每秒查询率与平均值之间的差值,并根据差值和标准差,确定当前每秒查询率所处的状态。
在本公开的一个实施例中,热点确定模块13用于:若差值与标准差的比值超过预设值,则确定当前每秒查询率所处的状态为目标状态。
在本公开的一个实施例中,每秒查询率为读出每秒查询率或写入每秒查询率。
在本公开的一个实施例中,分布式存储系统的热点检测装置还包括存储模块(图中未示出),用于采用循环队列存储方式存储历史每秒查询率。
在本公开的一个实施例中,分布式存储系统的热点检测装置还包括展示模块(图中未示出),用于在确定数据分片对应的存储节点为热点之后,采用可视化方式或日志方式展示热点的数据分片。
在本公开的一个实施例中,热点确定模块13还用于:在确定数据分片对应的存储节点为热点之后,发送热点流量检测指令至热点,以便热点在接收到热点流量检测指令后进行热点流量检测。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7是根据一示例性实施例示出的一种监测服务器框图。图7示出的监测服务器仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。如图7所示,监测服务器20包括处理器21,其可以根据存储在只读存储器(ROM,Read Only Memory)23中的程序或者从存储器22加载到随机访问存储器(RAM,RandomAccess Memory)24中的程序而执行各种适当的动作和处理。在RAM 24中,还存储有监测服务器20操作所需的各种程序和数据。处理器21、ROM 23以及RAM 24通过总线25彼此相连。输入/输出(I/O,Input/Output)接口26也连接至总线25。
以下部件连接至I/O接口26:包括硬盘等的存储器22;以及包括诸如LAN(局域网,LocalAreaNetwork)卡、调制解调器等的网络接口卡的通信部分27,通信部分27经由诸如因特网的网络执行通信处理。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分27从网络上被下载和安装。在该计算机程序被处理器21执行时,执行本公开的方法中限定的上述功能。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器,上述指令可由监测服务器20的处理器21执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
本公开实施例提供的分布式存储系统的热点检测方法、装置、监测服务器及存储介质,通过基于历史每秒查询率和当前每秒查询率,采用异常值检测方法,能够能够自动、快速且准确地发现热点,且写热点和读热点可以分别发现,有效解决了通过人工观察方式推测热点的位置导致的繁琐耗时以及正确率低的问题。
图8是根据一示例性实施例示出的另一种分布式存储系统的热点检测方法的流程图,需要说明的是,该方法具体是用于热点数据(即热点流量)的检测,其基本原理是将分布式存储系统中已经落盘的数据进行抓包分析,以根据数据出现的频率进行热点数据分析,找出对应的热点数据。以该方法应用于图1中的存储服务器为例进行说明,包括以下步骤:
在步骤S301中,将数据的键哈希分配至多个数据槽,并记录每个数据槽的数据流量。
具体地,当需要进行热点数据检测时,可由监测服务器发送热点检测指令至存储服务器,存储服务器在接收到热点检测指令后,在内部对已经存储的数据进行周期性采样分析,确定热点数据。具体可以是,先将数据的键(Key)经哈希(Hash)计算得到哈希值,并将该哈希值存储至多个数据槽中,同时记录每个数据槽的数据流量。可选的,在本公开的一些实施例中,记录每个数据槽的数据流量,包括:通过原子变量记录每个数据槽的数据流量。也就是说,将整个存储服务器的数据经哈希分为多个数据槽,并且每个数据槽通过原子变量保存相应的数据流量,从而可以保证多线程环境下流量统计的安全与效率。
在本公开的一个实施例中,分布式存储系统的热点检测方法还可包括:接收热点检测指令,其中,热点检测指令包括用户输入的热点检测指令或者监测服务器在监测到存储服务器为热点时生成的;在接收到热点检测指令后,将数据的键哈希分配至多个数据槽。
也就是说,热点数据的检测可包括手动启动以及经热点发现后的自动启动两种方式。具体地,可由监测服务器接收用户输入的热点检测指令,并将该指令发送至需要热点数据检测的某一个或多个存储服务器,以使这些存储服务器启动热点数据检测;或者,在监测服务器通过前述方式发现某一个存储服务器为热点时,自动向该存储服务器发送热点检测指令,以使该存储服务器启动热点数据检测,进而确定出热点数据。其中,监测服务器可通过RPC(Remote Procedure Call,远程过程调用)方式发送热点检测指令至存储服务器。
在步骤S302中,根据每个数据槽的数据流量对多个数据槽进行粗粒度筛查,得到热点槽。
具体地,在获得每个数据槽的数据流量后,可基于数据流量对多个数据槽进行粗粒度筛查,以确定存在热点数据的数据槽,简称热点槽。
在本公开的一个实施例中,参考图9所示,根据每个数据槽的数据流量对多个数据槽进行粗粒度筛查,得到热点槽,包括:
在步骤S401中,根据每个数据槽的数据流量,获取多个数据槽的数据流量平均值和数据流量标准差。
具体地,在获得每个数据槽的数据流量后,可计算所有数据槽的数据流量平均值以及数据流量标准差,其中数据流量平均值agv1=(Q1+Q2+...+Qm)/m,在该式中,Q1、Q2、...、Qm为各个数据槽记录的数据流量,m为大于1的整数;数据流量标准差std1=sqrt((Q1-agv1)^2+(Q2-agv1)^2+...+(Qm-agv1)^2)/m。
在步骤S402中,获取每个数据槽的数据流量与数据流量平均值之间的差值。
具体地,每个数据槽的数据流量与数据流量平均值之间的差值为Q1-agv1、Q2-agv1、Qm-agv1。
在步骤S403中,将差值与数据流量标准差的比值超过第一预设值的数据槽确定为热点槽。
可选地,当步骤S402中计算得到的某一差值与数据流量标准差的比值超过第一预设值,则确定相应的数据槽为热点槽。
由此,通过对每个数据槽记录的数据流量,基于均方差进行异常值分析,可确定出存在热点数据的数据槽,并将其确定为热点槽。需要说明的是,也可以采用其它异常值检测算法确定出存在异常的数据流量,例如DBSCAN聚类方法、孤立森林等一维异常值检测算法,本公开对此不作限定。
在步骤S303中,对热点槽进行细粒度筛查,得到热点数据。
也就是说,本公开采用双层筛查方式对已存储数据进行筛查,得到热点数据,具体是先基于每个数据槽记录的数据流量进行粗粒度筛查,得到热点槽,而后针对该热点槽进行细粒度筛查,得到热点数据,这样可以有效提高筛查的效率,使其不影响主任务的执行,从而尽可能在不降低系统可用性以及性能的前提下,完成热点数据的分析。
在本公开的一个实施例中,参考图10所示,对热点槽进行细粒度筛查,得到热点数据,包括:
在步骤S501中,对热点槽对应的数据的值进行读写操作,并记录每一类数据被读写的次数。
具体地,在对热点槽进行细粒度筛查时,可对热点槽对应的数据的值(Value)进行读写操作,并记录每一类数据被读写的次数,以根据每一类数据被读写的次数,确定热点数据,也即根据数据出现的频率确定热点数据。
在本公开的一个实施例中,对热点槽对应的数据的值进行读写操作,并记录每一类数据被读写的次数,包括:利用多个线程将热点槽对应的数据的值写入多个消息队列,其中,多个线程与多个消息队列一一对应;将热点槽对应的数据的值从多个消息队列中读出,并记录每一类数据被读写的次数。
具体地,细粒度筛查可以使用多个生产者-消费者队列(即消息队列)来保证抓取数据的效率以及多线程时的线程安全性,多线程包括读线程和写线程。在具体实施时,可先获取读线程和写线程的标识信息,并构造相应的生产者-消费者队列,以及通过标识信息将读线程和写线程与相应的生产者-消费者队列进行映射,在读写时,读线程和写线程向相应的生产者-消费者队列中生产数据,即向相应的生产者-消费者队列中写入热点槽对应的数据的值,这样不同的线程就不会相互抢锁,保证线程的安全与程序效率。在利用多个线程将热点槽对应的数据的值写入多个生产者-消费者队列后,还将热点槽对应的数据的值从多个消息队列中读出,并记录每一类数据被读写的次数(实质是读出的次数),以根据每一类数据被读写的次数,确定热点数据。
在步骤S502中,根据每一类数据被读写的次数,确定热点数据。
具体地,在获得每一类数据被读写的次数后,可根据每一类数据被读写的次数确定热点数据。
在本公开的一个实施例中,根据每一类数据被读写的次数,确定热点数据,包括:根据每一类数据被读写的次数,获取所有类数据被读写的次数平均值和次数标准差;获取每一类数据被读写的次数与次数平均值之间的差值;将差值与次数标准差的比值超过第二预设值的数据确定为热点数据。
具体地,在获得每一类数据被读写的次数后,可先计算所有类数据被读写的次数平均值和次数标准差,其中次数平均值agv2=(K1+K2+...+Kx)/x,在该式中,K1、K2、...、Kx为每一类数据被读写的次数,x为正整数;次数标准差std2=sqrt((K1-agv2)^2+(K2-agv2)^2+...+(Kx-agv2)^2)/x。而后,计算每一类数据被读写的次数与次数平均值之间的差值,分别为K1-agv2、K2-agv2、Kx-agv2,最后计算各个差值与次数标准差的比值,并与第二预设值进行比较,如果比值超过第二预设值,则确定相应的数据为热点数据。
由此,通过对热点槽中每一类数据出现的次数(即频率),基于均方差进行异常值分析,可确定出热点数据。需要说明的是,也可以采用其它异常值检测算法确定出热点数据,例如DBSCAN聚类方法、孤立森林等一维异常值检测算法,本公开对此不作限定。
在本公开的一个实施例中,存储服务器包括读数据线程池、写数据线程池和分析线程池,其中,通过读数据线程池和写数据线程池分别利用多个线程将数据的键哈希分配至多个数据槽,并将热点槽对应的数据的值写入多个消息队列,通过分析池利用多个线程进行粗粒度筛查和细粒度筛查。
也就是说,在存储服务器内部,可包括读数据线程池、写数据线程池和分析线程池,抓取读数据、抓取写数据以及对数据进行热点检测得到热点数据分别在这三个线程池中进行,并且每个线程池均具有可同时作业的多个线程。
具体地,参考图11所示,在存储服务器执行主任务的过程中,还可通过上述读数据线程池和写数据线程池抓取已经落盘的数据,并通过分析线程池进行热点数据检测。在进行热点数据检测时,首先进行粗粒度筛查,在筛查时,先通过读数据线程池和写数据线程池将读数据和写数据从存储服务器内部读出,并经哈希分配至多个数据槽中,同时记录每个数据槽的数据流量。考虑到在无锁情况下多线程的安全性,粗粒度筛查可采用一个原子单元的定长数组实现,并通过原子变量记录数据流量,这样可以保证多线程环境下流量统计的线程安全与效率。而后,通过分析线程池周期性地对各个数据槽的数据流量进行分析,以筛选出具有热点数据的数据槽,记为热点槽,这样可以尽可能地保证正常读写时间片分配,即通过将从存储服务器抓取读数据、抓取写数据以及对数据进行粗粒度筛查运行于不同的线程池中,可以保证正常读写的时间片分配,尽可能减少对主任务的影响。
在粗粒度筛查得到热点槽后,开始对热点槽进行细粒度筛查。在细粒度筛查时,可为读数据线程池和写数据线程池中的每个线程对应一个生产者-消费者队列即消息队列,读数据线程池和写数据线程池中的各个线程作为生产者将热点槽对应的数据的值写入相应的队列中,分析线程池从各个队列中读出热点槽对应的数据,并记录每一类数据被读写的次数(这里实质是被读出的次数),进而基于每一类数据被读写的次数确定出热点数据。其中,通过将从存储服务器抓取读数据、抓取写数据以及对热点槽对应的数据进行细粒度筛查运行于不同的线程池中,可以保证正常读写的时间片分片,尽可能减少对主任务的影响,同时针对每个线程对应一个消息队列,可在无锁的情况下保证线程的安全性与程序效率。
由此,通过将数据的抓取和分析运行于不同的线程池中,可减少对主任务的影响,同时基于原子变量进行数据流量记录,可保证线程的安全性,以及针对每个线程对应一个消息队列,可以保证线程的安全性与程序效率。
在本公开的一个实施例中,在得到热点数据之后,分布式存储系统的热点检测方法还包括:进行热点数据预警,和/或,以日志形式展示热点数据。
为了验证本公开的热点数据检测方法所具有的效果,可基于图1所示分布式存储系统,对本公开进行准确度测试、性能测试以及性能分析。
具体地,在进行准确度测试时,可构造类似真实情况下分布式存储系统的数据,测试方法类似于前述热点分片检测方法的测试,这里不再赘述,测试结果如表2所示:
表2
Figure BDA0003142324480000221
在进行性能测试时,测试环境为:测试集群使用Intel(R)Xeon(R)CPU E5-2620v4@2.10GHz处理器、128G内存、480G SATA接口固态硬盘*8,万兆网卡,操作系统采用CentOSLinux release 7.3.1611 with linux version 3.18.6版本。负载为:使用性能测试工具YCSB进行压力测试,利用一台单独的主机对测试集群进行请求发送,其中,YCSB的测试字符串长度为320bytes,累计发送300000000条数据,且每条数据随机生成,然后再启动一个热点生成客户端进行测试。测试选取了最常见的两种使用情形:一种(即test1)为读写较为均衡的使用情景,常用于内部集群元信息的写入;另一种(即test2)是互联网产品使用的典型情况,读多写少,可以反映如应用商店评论区、交流论坛的应用表现情况。两种数据集分别在关闭热点数据抓取与开启全局范围的热点数据抓取时进行实验,最终得到如表3所示测试结果:
表3
Figure BDA0003142324480000231
从表3可以看出,在开启热点数据检测的情况下,热点数据检测在两种数据集下表现的都比较优秀,与开启热点数据检测之前的性能无较大差别,可以在单机热点压力较大时正常使用。
为了能够更加直观的看到本公开的各个部分对于性能的影响,可以使用单元测试代码用系统时间统计对于相同的数据流量,热点数据检测全部捕获的时间。同时,为了展现各环节的效率,设置两组对照组:第一组对照组去掉了双层筛查结构,直接将数据分线程导入消息队列;第二组去掉了线程分组,将所有线程的数据放入允许多生产者的消息队列中进行测试,测试结果如图12所示。从图12可以看出,两个对照组的实验结果在不同程度上劣于实验组,其中,第二对照组的差距较大,其原因可能是在多线程使用同一个消息队列时,即使采用无锁化的原子操作,也会占用较多的CPU时间,因此在设计上要尽可能地避免多线程同时抢占一个资源的情况。
图13是根据一示例性实施例示出的一种分布式存储系统的热点检测装置框图,参考图13所示,该分布式存储系统的热点检测装置30包括:粗粒度筛选模块31和细粒度筛选模块32。
其中,粗粒度筛选模块31被配置为用于将数据的键哈希分配至多个数据槽,并记录每个数据槽的数据流量,以及根据每个数据槽的数据流量对多个数据槽进行粗粒度筛查,得到热点槽;细粒度筛选模块32被配置为用于对热点槽进行细粒度筛查,得到热点数据。
在本公开的一个实施例中,粗粒度筛选模块31用于:通过原子变量记录每个数据槽的数据流量。
在本公开的一个实施例中,粗粒度筛选模块31用于:根据每个数据槽的数据流量,获取多个数据槽的数据流量平均值和数据流量标准差,并获取每个数据槽的数据流量与数据流量平均值之间的差值,以及将差值与数据流量标准差的比值超过第一预设值的数据槽确定为热点槽。
在本公开的一个实施例中,细粒度筛选模块32用于:对热点槽对应的数据的值进行读写操作,并记录每一类数据被读写的次数,以及根据每一类数据被读写的次数,确定热点数据。
在本公开的一个实施例中,细粒度筛选模块32用于:利用多个线程将热点槽对应的数据的值写入多个消息队列,其中,多个线程与多个消息队列一一对应,以及将热点槽对应的数据的值从多个消息队列中读出,并记录每一类数据被读写的次数。
在本公开的一个实施例中,细粒度筛选模块32用于:根据每一类数据被读写的次数,获取所有类数据被读写的次数平均值和次数标准差,并获取每一类数据被读写的次数与次数平均值之间的差值,以及将差值与次数标准差的比值超过第二预设值的数据确定为热点数据。
在本公开的一个实施例中,存储服务器包括读数据线程池、写数据线程池和分析线程池,其中,粗粒度筛选模块31还用于:通过读数据线程池和写数据线程池分别利用多个线程将数据的键哈希分配至多个数据槽,并通过分析池利用多个线程进行粗粒度筛查;细粒度筛选模块32还用于:通过读数据线程池和写数据线程池分别利用多个线程将热点槽对应的数据的值写入多个消息队列,并通过分析池利用多个线程进行细粒度筛查。
在本公开的一个实施例中,分布式存储系统的热点检测装置还包括:提醒模块(图中未示出),用于在细粒度筛选模块32得到热点数据之后,进行热点数据预警,和/或,以日志形式展示热点数据。
在本公开的一个实施例中,分布式存储系统的热点检测装置还包括:指令接收模块(图中未示出),用于接收热点检测指令,其中热点检测指令包括用户输入的热点检测指令或者监测服务器在监测到存储服务器为热点时生成的。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图14是根据一示例性实施例示出的一种存储服务器框图。图14示出的存储服务器仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。如图14所示,存储服务器40包括处理器41,其可以根据存储在只读存储器(ROM,Read Only Memory)43中的程序或者从存储器42加载到随机访问存储器(RAM,RandomAccess Memory)44中的程序而执行各种适当的动作和处理。在RAM 44中,还存储有存储服务器40操作所需的各种程序和数据。处理器41、ROM 43以及RAM 44通过总线45彼此相连。输入/输出(I/O,Input/Output)接口46也连接至总线45。
以下部件连接至I/O接口46:包括硬盘等的存储器42;以及包括诸如LAN(局域网,LocalAreaNetwork)卡、调制解调器等的网络接口卡的通信部分47,通信部分47经由诸如因特网的网络执行通信处理。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分47从网络上被下载和安装。在该计算机程序被处理器41执行时,执行本公开的方法中限定的上述功能。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器,上述指令可由存储服务器40的处理器41执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
本公开实施例提供的分布式存储系统的热点检测方法、装置、存储服务器及存储介质,通过双层无锁筛查结构对存储服务器内的数据进行抓包分析,在高并发大流量的环境下,能够在基本不降低系统可用性以及性能的前提下,完成热点数据的定位分析,确定出热点数据,以便于对该热点数据及时处理,防止系统故障,即因热点数据导致单机压力过大导致宕机,与传统的通过在存储服务器的前端增设一层代理过滤流量即流式计算系统相比,能够减少对主任务的影响,提高系统可用性。同时,利用原子变量以及多个消息队列,可以保证多线程的安全性及程序效率。
图15是根据一示例性实施例示出的一种分布式存储系统的热点削峰方法的流程图,以该方法应用于图1所示存储服务器中的主数据服务器为例进行说明,包括以下步骤:
在步骤S601中,获取热点数据。
在步骤S602中,将热点数据的键发送至客户端,以便客户端从与主数据服务器对应的从数据服务器中读出热点数据的值。
具体来说,在无热点数据时,仅由主数据服务器对外提供数据服务,此时客户端对主数据服务器进行读写操作,同时从数据服务器时刻同步主数据服务器的数据,以在主数据服务器出现宕机时,及时恢复数据,保证服务的可用性。
而在获得热点数据后,可开启热点削峰功能,此时将热点数据的键发送至客户端,以便客户端从与主数据服务器对应的从数据服务器中读出热点数据的值,以进行热点削峰,也就是说,在本公开中,从数据服务器不仅能够时刻同步主数据服务器的数据,而且在出现热点数据时,能够提供数据服务,此时主数据服务器可将数据的键发送至客户端,由客户端从对应的从数据服务器中读取热点数据的值,以进行热点数据的分流,减轻主数据服务器的压力。
由此,通过将热点数据的键发送至客户端,以便客户端从与主数据服务器对应的从数据服务器中读出热点数据的值,以进行热点数据的分流,减轻主数据服务器的压力,从而能够在无扩容条件下,有效减轻在大流量、高并发情景下由热点问题带来的单机负载过高,导致系统整体可用性降低,甚至导致单点宕机的问题,同时能够解决因开发人员对分布式存储系统使用不当导致的单机负载压力过大的问题,以及因存储的键值对大小过大导致的类似热点的问题。
需要说明的是,在将热点数据的键发送至客户端,以便客户端从与主数据服务器对应的从数据服务器中读出热点数据的值的过程中,还通过一致性协议保持数据的一致性。
具体来说,在图1所示分布式存储系统中,数据的多副本备份可采用PacificA一致性算法来实现。在PacificA中,如果所有集群均是以顺序处理相同的请求集,假设更新是确定性的,则可以实现强一致性。主数据服务器分配了连续递增的序列号进行更新,所有从数据服务器跟随这一序列号处理请求。
具体地,当主数据服务器收到一个查询请求后,其立刻返回一个本地当前版本的数据。当主数据服务器收到一个更新请求后,该主数据服务器将分配一个可用的序列号给该请求,并写入准备信息(Prepare message)中,发送给所有的从数据服务器,当从数据服务器收到该请求后,从数据服务器将该请求入序列化的准备信息中,并返回一个确认信息给主数据服务器,由主数据服务器将确认时刻(Commitpoint)向前移动到顶,顶下请求被提交,并反馈给客户端已成功提交的信息。在发送准备信息时,主数据服务器将此时已经提交的请求的确认时刻附带,从数据服务器以此来移动自身的确认时刻,在这个主从复制过程中,主数据服务器与从数据服务器数据始终保持线性一致性。
开启热点削峰后,在处理查询请求时,访问从数据服务器时,数据保持线性一致性;访问主数据服务器时,因为主数据服务器的每次更新数据都会在得到从数据服务器的准备信息确认后再将答复传给客户端,所以从数据服务器依旧保持线性一致性。
但在有异常发生时,比如当从数据服务器突然与主数据服务器发生网络分区,此时主数据服务器无法与从数据服务器同步数据,而从数据服务器若依然处于心跳包的租约范围内,从数据服务器不会主动拒绝请求,客户端由于默认向从数据服务器发送数据,有可能拿到过期数据,直到从数据服务器的租约到期拒绝提供服务,所以在该情况下,数据的一致性将会退化成顺序一致性。虽然该情况下会牺牲一定的数据一致性,但是在出现热点数据时,本公开的热点削峰方法能够有效缓解热点数据对单机的压力,保证整个系统的可用性,并在一定程度上保持了系统的强一致性。
为了验证本公开的热点削峰方法所具有的效果,可基于图1所示分布式存储系统,分两个方向对热点削峰性能进行测试:其一(test1)是测试当使用了热点削峰方案后,热点数据的延迟是否存在显著变化;其二(test2)是测试当使用了热点削峰方案后,热点数据的负载是否得到有效降低,测试环境如前述热点数据检测的测试环境相同,这里不再赘述,测试结果如表4和图16所示:
表4
Figure BDA0003142324480000301
表4给出了由YCSB给出的系统整体性能,图16给出了主数据服务器和从数据服务器的CPU使用率,从表4和图16可以看出,热点削峰方案在由数据倾斜造成的热点问题下,主数据服务器的压力能够被有效缓解,集群整体的响应速度与吞吐有所提高,从数据服务器由于分担了大部分热点数据,资源占用率略有提高,但依然处在不影响系统稳定性的水平上。
在本公开的一个实施例中,获取热点数据,包括:将数据的键哈希分配至多个数据槽,并记录每个数据槽的数据流量;根据每个数据槽的数据流量对多个数据槽进行粗粒度筛查,得到热点槽;对热点槽进行细粒度筛查,得到热点数据。
在本公开的一个实施例中,通过原子变量记录每个数据槽的数据流量。
在本公开的一个实施例中,根据每个数据槽的数据流量对多个数据槽进行粗粒度筛查,得到热点槽,包括:根据每个数据槽的数据流量,获取多个数据槽的数据流量平均值和数据流量标准差;获取每个数据槽的数据流量与数据流量平均值之间的差值;将差值与数据流量标准差的比值超过第一预设值的数据槽确定为热点槽。
在本公开的一个实施例中,对热点槽进行细粒度筛查,得到热点数据,包括:对热点槽对应的数据的值进行读写操作,并记录每一类数据被读写的次数;根据每一类数据被读写的次数,确定热点数据。
在本公开的一个实施例中,对热点槽对应的数据的值进行读写操作,并记录每一类数据被读写的次数,包括:利用多个线程将热点槽对应的数据的值写入多个消息队列,其中,多个线程与多个消息队列一一对应;将热点槽对应的数据的值从多个消息队列中读出,并记录每一类数据被读写的次数。
在本公开的一个实施例中,根据每一类数据被读写的次数,确定热点数据,包括:根据每一类数据被读写的次数,获取所有类数据被读写的次数平均值和次数标准差;获取每一类数据被读写的次数与次数平均值之间的差值;将差值与次数标准差的比值超过第二预设值的数据确定为热点数据。
在本公开的一个实施例中,主数据服务器包括读数据线程池、写数据线程池和分析线程池,其中,通过读数据线程池和写数据线程池分别利用多个线程将数据的键哈希分配至多个数据槽,并将热点槽对应的数据的值写入多个消息队列,通过分析池利用多个线程进行粗粒度筛查和细粒度筛查。
在本公开的一个实施例中,方法还包括:接收热点检测指令,其中,热点检测指令包括用户输入的热点检测指令或者监测服务器在监测到主数据服务器为热点时生成的;在接收到热点检测指令后,获取热点数据。
需要说明的是,关于本公开的热点削峰方法中获取热点数据的过程,请参考前述图8至图11所对应的热点数据检测的过程,这里就不再赘述。
图17是根据一示例性实施例示出的一种分布式存储系统的热点削峰装置框图,其应用于主数据服务器,参考图17所示,该分布式存储系统的热点削峰装置50包括:获取模块51和发送模块52。
其中,获取模块51被配置为用于获取热点数据;发送模块52被配置为用于将热点数据的键发送至客户端,以便客户端从与主数据服务器对应的从数据服务器中读出热点数据的值。
在本公开的一个实施例中,获取模块51用于:将数据的键哈希分配至多个数据槽,并记录每个数据槽的数据流量,以及根据每个数据槽的数据流量对多个数据槽进行粗粒度筛查,得到热点槽,并对热点槽进行细粒度筛查,得到热点数据。
在本公开的一个实施例中,获取模块51用于:通过原子变量记录每个数据槽的数据流量。
在本公开的一个实施例中,获取模块51用于:根据每个数据槽的数据流量,获取多个数据槽的数据流量平均值和数据流量标准差,并获取每个数据槽的数据流量与数据流量平均值之间的差值,以及将差值与数据流量标准差的比值超过第一预设值的数据槽确定为热点槽。
在本公开的一个实施例中,获取模块51用于:对热点槽对应的数据的值进行读写操作,并记录每一类数据被读写的次数,以及根据每一类数据被读写的次数,确定热点数据。
在本公开的一个实施例中,获取模块51用于:利用多个线程将热点槽对应的数据的值写入多个消息队列,其中,多个线程与多个消息队列一一对应,以及将热点槽对应的数据的值从多个消息队列中读出,并记录每一类数据被读写的次数。
在本公开的一个实施例中,获取模块51用于:根据每一类数据被读写的次数,获取所有类数据被读写的次数平均值和次数标准差,并获取每一类数据被读写的次数与次数平均值之间的差值,以及将差值与次数标准差的比值超过第二预设值的数据确定为热点数据。
在本公开的一个实施例中,主数据服务器包括读数据线程池、写数据线程池和分析线程池,其中,获取模块51还用于通过读数据线程池和写数据线程池分别利用多个线程将数据的键哈希分配至多个数据槽,并将热点槽对应的数据的值写入多个消息队列,以及通过分析池利用多个线程进行粗粒度筛查和细粒度筛查。
在本公开的一个实施例中,分布式存储系统的热点削峰装置还包括:指令接收模块(图中未示出),用于接收热点检测指令,其中,热点检测指令包括用户输入的热点检测指令或者监测服务器在监测到主数据服务器为热点时生成的。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图18是根据一示例性实施例示出的一种存储服务器框图。图18示出的存储服务器仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。如图18所示,存储服务器60包括处理器61,其可以根据存储在只读存储器(ROM,Read Only Memory)63中的程序或者从存储器62加载到随机访问存储器(RAM,RandomAccess Memory)64中的程序而执行各种适当的动作和处理。在RAM 64中,还存储有存储服务器60操作所需的各种程序和数据。处理器61、ROM 63以及RAM 64通过总线65彼此相连。输入/输出(I/O,Input/Output)接口66也连接至总线65。
以下部件连接至I/O接口66:包括硬盘等的存储器62;以及包括诸如LAN(局域网,LocalAreaNetwork)卡、调制解调器等的网络接口卡的通信部分67,通信部分67经由诸如因特网的网络执行通信处理。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分67从网络上被下载和安装。在该计算机程序被处理器61执行时,执行本公开的方法中限定的上述功能。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器,上述指令可由存储服务器60的处理器61执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
图19是根据一示例性实施例示出的另一种分布式存储系统的热点削峰方法的流程图,其应用于如图1所示的客户端,包括以下步骤:
在步骤S701中,在接收到分布式存储系统中的主数据服务器发送的热点数据的键后,从与主数据服务器对应的从数据服务器中读出热点数据的值。
具体来说,在无热点数据时,仅由主数据服务器对外提供数据服务,此时客户端对主数据服务器进行读写操作,同时从数据服务器时刻同步主数据服务器的数据,以在主数据服务器出现宕机时,及时恢复数据,保证服务的可用性。
而在获得热点数据后,可开启热点削峰功能,此时主数据服务器将热点数据的键发送至客户端,以便客户端从与主数据服务器对应的从数据服务器中读出热点数据的值,以进行热点削峰,也就是说,在本公开中,从数据服务器不仅能够时刻同步主数据服务器的数据,而且在出现热点数据时,能够提供数据服务,此时主数据服务器可将数据的键发送至客户端,由客户端从对应的从数据服务器中读取热点数据的值,以进行热点数据的分流,减轻主数据服务器的压力。
由此,通过将热点数据的键发送至客户端,并且客户端从与主数据服务器对应的从数据服务器中读出热点数据的值,以进行热点数据的分流,减轻主数据服务器的压力,从而能够在无扩容条件下,有效减轻在大流量、高并发情景下由热点问题带来的单机负载过高,导致系统整体可用性降低,甚至导致单点宕机的问题,同时能够解决因开发人员对分布式存储系统使用不当导致的单机负载压力过大的问题,以及因存储的键值对大小过大导致的类似热点的问题。
图20是根据一示例性实施例示出的一种客户端框图。图20示出的客户端仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。如图20所示,客户端70包括处理器71,其可以根据存储在只读存储器(ROM,Read Only Memory)73中的程序或者从存储器72加载到随机访问存储器(RAM,RandomAccess Memory)74中的程序而执行各种适当的动作和处理。在RAM 74中,还存储有客户端70操作所需的各种程序和数据。处理器71、ROM 73以及RAM 74通过总线75彼此相连。输入/输出(I/O,Input/Output)接口76也连接至总线75。
以下部件连接至I/O接口76:包括硬盘等的存储器72;以及包括诸如LAN(局域网,LocalAreaNetwork)卡、调制解调器等的网络接口卡的通信部分77,通信部分77经由诸如因特网的网络执行通信处理。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分77从网络上被下载和安装。在该计算机程序被处理器71执行时,执行本公开的方法中限定的上述功能。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器,上述指令可由客户端70的处理器71执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
本公开实施例提供的分布式存储系统的热点削峰方法、装置、存储服务器、客户端及存储介质,获取热点数据,并将热点数据的键发送至客户端,以便客户端从与主数据服务器对应的从数据服务器中读出热点数据的值,由此,针对热点数据,通过客户端读取从数据服务器中的热点数据的值,进行热点数据分流,以减轻主数据服务器的压力,以便快速缓解系统故障的风险,即因单机压力过大导致宕机的风险。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本公开旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种分布式存储系统的热点检测方法,其特征在于,所述分布式存储系统包括多个存储节点,所述方法包括:
获取所述存储节点中数据分片的每秒查询率,所述每秒查询率包括当前每秒查询率和历史每秒查询率;
基于所述历史每秒查询率确定所述当前每秒查询率所处的状态;
响应于所述当前每秒查询率所处的状态为目标状态,确定所述数据分片对应的存储节点为热点。
2.根据权利要求1所述的分布式存储系统的热点检测方法,其特征在于,所述基于所述历史每秒查询率确定所述当前每秒查询率所处的状态,包括:
获取所述数据分片的所述历史每秒查询率和所述当前每秒查询率的平均值和标准差;
针对所述数据分片,获取所述当前每秒查询率与所述平均值之间的差值,并根据所述差值和所述标准差,确定所述当前每秒查询率所处的状态。
3.根据权利要求2所述的分布式存储系统的热点检测方法,其特征在于,还包括:
若所述差值与所述标准差的比值超过预设值,则确定所述当前每秒查询率所处的状态为所述目标状态。
4.根据权利要求1-3中任一项所述的分布式存储系统的热点检测方法,其特征在于,所述每秒查询率为读出每秒查询率或写入每秒查询率。
5.根据权利要求1所述的分布式存储系统的热点检测方法,其特征在于,采用循环队列存储方式存储所述历史每秒查询率。
6.根据权利要求1所述的分布式存储系统的热点检测方法,其特征在于,在确定所述数据分片对应的存储节点为热点之后,所述方法还包括:
采用可视化方式或日志方式展示所述热点的数据分片。
7.根据权利要求1所述的分布式存储系统的热点检测方法,其特征在于,在确定所述数据分片对应的存储节点为热点之后,所述方法还包括:
发送热点流量检测指令至所述热点,以便所述热点在接收到所述热点流量检测指令后进行热点流量检测。
8.一种分布式存储系统的热点检测装置,其特征在于,所述分布式存储系统包括多个存储节点,所述装置包括:
获取模块,用于获取所述存储节点中数据分片的每秒查询率,所述每秒查询率包括当前每秒查询率和历史每秒查询率;
状态确定模块,用于基于所述历史每秒查询率确定所述当前每秒查询率所处的状态;
热点确定模块,用于响应于所述当前每秒查询率所处的状态为目标状态,确定所述数据分片对应的存储节点为热点。
9.一种监测服务器,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的分布式存储系统的热点检测方法。
10.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由监测服务器的处理器执行时,使得监测服务器能够执行如权利要求1至7中任一项所述的分布式存储系统的热点检测方法。
CN202110744375.9A 2021-06-30 2021-06-30 热点检测方法、装置、监测服务器及存储介质 Active CN113489776B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110744375.9A CN113489776B (zh) 2021-06-30 2021-06-30 热点检测方法、装置、监测服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110744375.9A CN113489776B (zh) 2021-06-30 2021-06-30 热点检测方法、装置、监测服务器及存储介质

Publications (2)

Publication Number Publication Date
CN113489776A true CN113489776A (zh) 2021-10-08
CN113489776B CN113489776B (zh) 2024-08-13

Family

ID=77937523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110744375.9A Active CN113489776B (zh) 2021-06-30 2021-06-30 热点检测方法、装置、监测服务器及存储介质

Country Status (1)

Country Link
CN (1) CN113489776B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7885951B1 (en) * 2008-02-15 2011-02-08 Lmr Inventions, Llc Method for embedding a media hotspot within a digital media file
CN107169009A (zh) * 2017-03-31 2017-09-15 北京奇艺世纪科技有限公司 一种分布式存储系统的数据分裂方法及装置
CN110784835A (zh) * 2018-07-31 2020-02-11 中兴通讯股份有限公司 数据流量的处理方法、装置、终端及计算机存储介质
CN111885184A (zh) * 2020-07-29 2020-11-03 深圳壹账通智能科技有限公司 高并发场景下热点访问关键字处理方法和装置
CN111970339A (zh) * 2020-07-30 2020-11-20 北京金山云网络技术有限公司 请求控制方法、装置及电子设备
CN112312458A (zh) * 2020-11-04 2021-02-02 中国联合网络通信集团有限公司 一种基站评分方法及装置
CN112307069A (zh) * 2020-11-12 2021-02-02 京东数字科技控股股份有限公司 数据查询方法、系统、设备及存储介质
CN112597280A (zh) * 2020-12-28 2021-04-02 上海朝阳永续信息技术股份有限公司 一种自动发现热点关键词和热点新闻的方法
CN112765478A (zh) * 2021-03-12 2021-05-07 北京百度网讯科技有限公司 用于推荐内容的方法、装置、设备、介质和程序产品
CN113055759A (zh) * 2019-12-26 2021-06-29 中国电信股份有限公司 带宽分配方法、装置及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7885951B1 (en) * 2008-02-15 2011-02-08 Lmr Inventions, Llc Method for embedding a media hotspot within a digital media file
CN107169009A (zh) * 2017-03-31 2017-09-15 北京奇艺世纪科技有限公司 一种分布式存储系统的数据分裂方法及装置
CN110784835A (zh) * 2018-07-31 2020-02-11 中兴通讯股份有限公司 数据流量的处理方法、装置、终端及计算机存储介质
CN113055759A (zh) * 2019-12-26 2021-06-29 中国电信股份有限公司 带宽分配方法、装置及系统
CN111885184A (zh) * 2020-07-29 2020-11-03 深圳壹账通智能科技有限公司 高并发场景下热点访问关键字处理方法和装置
CN111970339A (zh) * 2020-07-30 2020-11-20 北京金山云网络技术有限公司 请求控制方法、装置及电子设备
CN112312458A (zh) * 2020-11-04 2021-02-02 中国联合网络通信集团有限公司 一种基站评分方法及装置
CN112307069A (zh) * 2020-11-12 2021-02-02 京东数字科技控股股份有限公司 数据查询方法、系统、设备及存储介质
CN112597280A (zh) * 2020-12-28 2021-04-02 上海朝阳永续信息技术股份有限公司 一种自动发现热点关键词和热点新闻的方法
CN112765478A (zh) * 2021-03-12 2021-05-07 北京百度网讯科技有限公司 用于推荐内容的方法、装置、设备、介质和程序产品

Also Published As

Publication number Publication date
CN113489776B (zh) 2024-08-13

Similar Documents

Publication Publication Date Title
CN111049705B (zh) 一种监控分布式存储系统的方法及装置
CN112654978B (zh) 分布式异构存储系统中数据一致性实时检查的方法、设备和系统
CN107544832B (zh) 一种虚拟机进程的监控方法、装置和系统
US20120084788A1 (en) Complex event distributing apparatus, complex event distributing method, and complex event distributing program
CN102694868A (zh) 一种集群系统实现及任务动态分配方法
CN112286903B (zh) 一种基于容器化的关系型数据库优化方法及装置
CN110581887B (zh) 数据处理方法、装置、区块链节点及存储介质
EP2907085A2 (en) Autonomic network sentinels
US10282245B1 (en) Root cause detection and monitoring for storage systems
CN111858677A (zh) 本地缓存数据访问方法、装置、设备及存储介质
CN110837423A (zh) 一种自动导引运输车数据采集的方法和装置
CN113312371A (zh) 执行计划的处理方法、设备及系统
WO2019205788A1 (zh) 数据存储方法、存储服务器及云存储系统
CN114265753A (zh) 消息队列的管理方法、管理系统和电子设备
CN113568813A (zh) 一种海量网络性能数据采集方法、装置及系统
CN110545197B (zh) 节点状态监控方法及装置
US10223189B1 (en) Root cause detection and monitoring for storage systems
CN114020819A (zh) 一种多系统参数同步方法及装置
CN113420093B (zh) 热点检测方法、装置、存储服务器及存储介质
CN113489776B (zh) 热点检测方法、装置、监测服务器及存储介质
CN113434297B (zh) 热点削峰方法、装置、存储服务器、客户端及存储介质
CN113434297A (zh) 热点削峰方法、装置、存储服务器、客户端及存储介质
Gabel et al. Communication-efficient Outlier Detection for Scale-out Systems.
CN116126621A (zh) 大数据集群的任务监控方法及相关设备
CN114726756A (zh) 一种配置监测方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant