CN106453665A - 基于分布式缓存系统的数据缓存方法、服务器和系统 - Google Patents

基于分布式缓存系统的数据缓存方法、服务器和系统 Download PDF

Info

Publication number
CN106453665A
CN106453665A CN201611170401.7A CN201611170401A CN106453665A CN 106453665 A CN106453665 A CN 106453665A CN 201611170401 A CN201611170401 A CN 201611170401A CN 106453665 A CN106453665 A CN 106453665A
Authority
CN
China
Prior art keywords
data
cache
proxy server
cached
cache node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611170401.7A
Other languages
English (en)
Other versions
CN106453665B (zh
Inventor
金铸
何光宇
孟健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201611170401.7A priority Critical patent/CN106453665B/zh
Publication of CN106453665A publication Critical patent/CN106453665A/zh
Application granted granted Critical
Publication of CN106453665B publication Critical patent/CN106453665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/568Storing data temporarily at an intermediate stage, e.g. caching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了基于分布式缓存系统的数据缓存方法、服务器和系统,其中,数据缓存方法包括:代理服务器接收租户发送的、待缓存的数据的缓存请求;代理服务器依据集群管理器下发的数据拆分规则生成数据分布列表;所述数据分布列表包括:待缓存的数据的各分片大小和各分片在缓存节点中的存储位置;所述代理服务器依据所述数据分布列表将待缓存的数据缓存至缓存节点中。采用本申请实施例,可以实现多租户共用一个分布式缓存系统,实现多租户的统一管理。

Description

基于分布式缓存系统的数据缓存方法、服务器和系统
技术领域
本申请涉及分布式缓存技术领域,特别涉及基于分布式缓存系统的数据缓存方法,代理服务器,集群服务器和缓存系统。
背景技术
在大型的业务系统,特别是大型互联网应用和大型企业的业务中,经常面临着海量、高并发用户的访问。一般情况下,数据主要存储在关系型数据库中,但是这样的方式在面临海量、高并发的业务访问时,由于关系型数据库自身的特点无法实现业务系统的快速扩展。同时,由于访问量过大可能导致业务系统无法承担过大的压力而运行缓慢甚至出现拒绝服务的问题。
在现有技术中,大多数业务系统基本都通过的引入分布式缓存来提高访问效率。但是,现有技术存在如下问题:现有的缓存系统都缺少多租户方式,即每个租户都是独占一个缓存系统,而各缓存系统之间彼此独立,无法共享缓存资源,导致缓存利用率极低,同时,还存在一个缓存系统无法对各租户统一管理的问题。
发明内容
发明人在研究过程中发现,如果在分布式缓存系统中引入代理服务器和集群管理器,通过代理服务器来响应各租户发送的缓存请求,由集群管理器为各租户生成数据拆分规则,并将该数据拆分规则下发给代理服务器,由代理服务器统一分配待缓存的数据的存储位置,并统一向各缓存节点中缓存数据。这样就能通过代理服务器和集群管理器的部署,而实现多租户共用一个分布式缓存系统,可以共享该分布式缓存系统中的各缓存节点,提高缓存节点的缓存利用率。并且,通过集群管理器还能对各个租户实现统一管理,例如,为各租户配置缓存容量阈值等。
基于此,本申请提供了一种代理服务器、集群管理器和分布式缓存系统,用以保证上述方法在实际中的实现及应用。
本申请公开的一种数据缓存方法,该方法应用于分布式缓存系统中的代理服务器上,所述分布式缓存系统还包括:集群管理器和缓存节点,该方法包括:
所述代理服务器接收租户发送的、待缓存的数据的缓存请求;
所述代理服务器依据所述集群管理器下发的数据拆分规则生成数据分布列表;所述数据分布列表包括:待缓存的数据的各分片大小和各分片在缓存节点中的存储位置;
所述代理服务器依据所述数据分布列表将待缓存的数据缓存至缓存节点中。
其中,所述方法还包括:
所述代理服务器将所述数据分布列表和缓存请求发送至集群管理器,以便所述集群管理器依据所述缓存请求中的租户标识、业务标识和业务键值生成数据标识,并将所述数据标识和数据分布列表对应存储;所述数据标识用于在所述分布式缓存系统中唯一标识待缓存的数据;
所述代理服务器接收集群管理器返回的数据标识;
所述代理服务器将所述数据标识发送给所述租户。
其中,所述方法还包括:
响应于接收到租户发送的数据标识,所述代理服务器将所述数据标识发送给集群管理器,以便所述集群管理器查询所述数据标识唯一标识的数据对应的数据分布列表;
所述代理服务器依据所述集群管理器返回的数据分布列表,从缓存节点中获取数据;
所述代理服务器将获取到的数据发送给所述租户。
其中,所述代理服务器依据所述数据分布列表将待缓存的数据缓存至缓存节点中,包括:
所述代理服务器获取所述租户发送所述待缓存的数据使用的请求协议;
所述代理服务器将请求协议转换为缓存节点可以兼容的缓存协议;
所述代理服务器参考所述缓存协议,将待缓存的数据的各个分片存储至各分片在缓存节点中的存储位置。
其中,所述缓存节点包括主缓存节点和备份缓存节点,所述代理服务器依据所述集群管理器下发的数据拆分规则生成数据分布列表,包括:
所述代理服务器判断所述待缓存的数据是否需要存储为主备数据;
如果是,则将待缓存的数据复制为主数据和备份数据;按照所述数据拆分规则对主数据进行分片,并确定各主分片在主缓存节点中的存储位置;以及,按照所述数据拆分规则对备份数据进行分片,并确定各备份分片在备份缓存节点中的存储位置;
如果否,则按照数据拆分规则将待缓存的数据作为主数据进行分片,并确定各主分片在主缓存节点中的存储位置。
其中,所述代理服务器依据所述数据分布列表将待缓存的数据缓存至缓存节点中,包括:
在待缓存的数据需要存储为主备数据的情况下,所述代理服务器将主数据的各主分片存储至各主分片在主缓存节点中的存储位置,以及,将备份数据的各备份分片存储至各备份分片在备份缓存节点中的存储位置;
在待缓存的数据不需要存储为主备数据的情况下,所述代理服务器将待缓存的数据的各主分片,存储至各主分片在主缓存节点中的存储位置。
本申请还公开了另一种数据缓存方法,该方法应用于分布式缓存系统中的集群管理器上,所述分布式缓存系统还包括:代理服务器和缓存节点,该方法包括:
所述集群管理器生成数据拆分规则,所述数据拆分规则用于描述待缓存的数据的拆分方式;
所述集群管理器将所述数据拆分规则发送至所述代理服务器,以便所述代理服务器接收到缓存请求时,依据所述数据拆分规则生成数据分布列表,并依据所述数据分布列表将待缓存的数据缓存至缓存节点中;所述数据分布列表包括:待缓存的数据的各分片大小和各分片在缓存节点中的存储位置。
其中,该方法还包括:
所述集群管理器接收所述代理服务器发送的数据分布列表和缓存请求;
所述集群管理器依据所述缓存请求中的租户标识、业务标识和业务键值生成数据标识,所述数据标识用于在所述分布式缓存系统中唯一标识待缓存的数据;
所述集群管理器将所述数据标识和所述数据分布列表对应存储,并将所述数据标识发送给所述代理服务器。
其中,该方法还包括:
响应于接收到所述代理服务器转发的数据标识,所述集群管理器判断所述数据标识是否存在;
如果是,则查询所述数据标识唯一标识的数据的数据分布列表,并将数据分布列表发送给所述代理服务器,以便所述代理服务器从缓存节点中获取数据;
如果否,则向所述代理服务器返回标识提示信息,所述标识提示信息用于提示所述数据标识不存在。
其中,所述集群管理器保存有各租户的缓存容量阈值;所述缓存容量阈值用于表示各租户在分布式缓存中能缓存的数据的总大小;则所述方法还包括:
所述集群管理器判断所述租户已经缓存的数据总和是否超过所述缓存容量阈值,如果是,则所述集群管理器向所述代理服务器发送容量提示信息,所述容量提示信息用于提示所述租户缓存的数据已经达到缓存容量阈值。
其中,该方法还包括:
所述集群管理器通过所述代理服务器收集各缓存节点的数据缓存情况,所述数据缓存情况包括:各缓存节点的缓存使用率或健康状态;
所述集群管理器判断各缓存节点的缓存使用率是否与预设缓存阈值匹配,或者,各缓存节点的健康状态是否正常,或者,所述分布式缓存系统中是否添加有新缓存节点;
如果缓存节点的缓存使用率与预设缓存阈值不匹配,则将数据按照预设比例转存至相匹配且健康状态正常的缓存节点中;
如果缓存节点的健康状态不正常,则将数据转存至相匹配且健康状态正常的缓存节点中;
如果添加有新缓存节点,则将缓存使用率与预设缓存阈值不匹配的缓存节点的数据按照预设比例转存至所述新缓存节点中,或者,将健康状态不正常的缓存节点中的数据转存至所述新缓存节点中。
本申请公开了一种代理服务器,所述代理服务器位于分布式缓存系统中,所述分布式缓存系统还包括:集群管理器和缓存节点,该代理服务器包括:
接收缓存请求单元,用于接收租户发送的、待缓存的数据的缓存请求;
生成列表单元,用于依据所述集群管理器下发的数据拆分规则生成数据分布列表;所述数据分布列表包括:待缓存的数据的各分片大小和各分片在缓存节点中的存储位置;
缓存单元,用于依据所述数据分布列表将待缓存的数据缓存至缓存节点中。
其中,所述代理服务器还包括:
发送单元,用于将所述数据分布列表和缓存请求发送至集群管理器,以便所述集群管理器依据所述缓存请求中的租户标识、业务标识和业务键值生成数据标识,并将所述数据标识和数据分布列表对应存储;所述数据标识用于在所述分布式缓存系统中唯一标识待缓存的数据;
接收数据标识单元,用于接收集群管理器返回的数据标识;
发送数据标识单元,用于将所述数据标识发送给所述租户。
其中,所述代理服务器还包括:
发送查询标识单元,用于响应于接收到租户发送待查询的数据标识,将所述待查询的数据标识发送给集群管理器,以便所述集群管理器查询所述待查询的数据标识对应的缓存数据的数据分布列表;
获取数据单元,用于依据所述集群管理器返回的数据分布列表,从缓存节点中获取缓存数据;
发送数据单元,用于将获取到的缓存数据发送给所述租户。
其中,所述缓存单元,包括:
获取子单元,用于获取所述租户发送所述待缓存的数据使用的请求协议;
转换子单元,用于将请求协议转换为缓存节点可以兼容的缓存协议;
缓存子单元,用于参考所述缓存协议,将待缓存的数据的各个分片存储至各分片在缓存节点中的存储位置。
其中,所述缓存节点包括主缓存节点和备份缓存节点,所述生成列表单元包括:判断子单元,用于判断所述待缓存的数据是否需要存储为主备数据;
第一处理子单元,用于在所述判断子单元为是的情况下,将待缓存的数据复制为主数据和备份数据;按照所述数据拆分规则对主数据进行分片,并确定各主分片在主缓存节点中的存储位置;以及,按照所述数据拆分规则对备份数据进行分片,并确定各备份分片在备份缓存节点中的存储位置;
第二处理子单元,用于在所述判断子单元为否的情况下,按照数据拆分规则将待缓存的数据作为主数据进行分片,并确定各主分片在主缓存节点中的存储位置。
其中,所述缓存单元包括:
第一存储子单元,用于在待缓存的数据需要存储为主备数据的情况下,所述代理服务器将主数据的各主分片存储至各主分片在主缓存节点中的存储位置,以及,将备份数据的各备份分片存储至各备份分片在备份缓存节点中的存储位置;
第二存储子单元,用于在待缓存的数据不需要存储为主备数据的情况下,所述代理服务器将待缓存的数据的各主分片,存储至各主分片在主缓存节点中的存储位置。
本申请还公开了一种集群服务器,所述集群服务器位于分布式缓存系统中,所述分布式缓存系统还包括:代理服务器和缓存节点,该集群服务器包括:
生成规则单元,用于生成数据拆分规则,所述数据拆分规则用于描述待缓存的数据的拆分方式;
发送规则单元,用于将所述数据拆分规则发送至所述代理服务器,以便所述代理服务器接收到缓存请求时,依据所述数据拆分规则生成数据分布列表,并依据所述数据分布列表将待缓存的数据缓存至缓存节点中;所述数据分布列表包括:待缓存的数据的各分片大小和各分片在缓存节点中的存储位置。
其中,所述集群服务器还包括:
接收单元,用于接收所述代理服务器发送的数据分布列表和缓存请求;
生成标识单元,用于依据所述缓存请求中的租户标识、业务标识和业务键值生成数据标识,所述数据标识用于在所述分布式缓存系统中唯一标识待缓存的数据;
存储单元,用于将所述数据标识和所述数据分布列表对应存储;
发送标识单元,用于将所述数据标识发送给所述代理服务器。
其中,该集群管理器还包括:
判断标识单元,用于响应于接收到所述代理服务器转发的数据标识,所述集群管理器判断所述数据标识是否存在;
查询单元,用于在所述判断标识单元的结果为是的情况下,查询所述数据标识唯一标识的数据对应的数据分布列表;
发送查询列表单元,用于将所述查询单元查询到的数据分布列表发送给所述代理服务器,以便所述代理服务器从缓存节点中获取数据;
返回标识提示单元,用于在所述判断标识单元的结果为否的情况下,向所述代理服务器返回标识提示信息,所述标识提示信息用于提示所述数据标识不存在。
其中,所述集群管理器保存有各租户的缓存容量阈值;所述缓存容量阈值用于表示各租户在分布式缓存中能缓存的数据的总大小;所述集群管理器还包括:
判断单元,用于判断所述租户已经缓存的数据总和是否超过所述缓存容量阈值;
发送容量信息单元,用于在所述判断单元的结果为是的情况下,向所述代理服务器发送容量提示信息,所述容量提示信息用于提示所述租户缓存的数据已经达到缓存容量阈值。
其中,所述集群管理器还包括:
收集存储情况单元,用于通过代理服务器收集各缓存节点的数据缓存情况,所述数据缓存情况包括:各缓存节点的缓存使用率和健康状态;
判断情况单元,用于判断各缓存节点的缓存使用率是否与预设缓存阈值匹配,或者,各缓存节点的健康状态是否正常,或者,所述分布式缓存系统中是否添加有新缓存节点;
转存单元,用于如果缓存节点的缓存使用率与预设缓存阈值不匹配,则将数据按照预设比例转存至相匹配且健康状态正常的缓存节点中;如果缓存节点的健康状态不正常,则将数据转存至相匹配且健康状态正常的缓存节点中;以及,如果添加有新缓存节点,则将缓存使用率与预设缓存阈值不匹配的缓存节点的数据按照预设比例转存至所述新缓存节点中,或者,将健康状态不正常的缓存节点中的数据转存至所述新缓存节点中。
本申请还公开了一种分布式缓存系统,所述分布式缓存系统包括:
前述的代理服务器,集群管理器,和,用于缓存数据的缓存节点。
与现有技术相比,本申请包括以下优点:
在本申请实施例中,代理服务器在接收到租户的缓存请求时,代理服务器根据由集群管理器下发的数据拆分规则来生成数据分布列表,从而为各个租户的待缓存的数据进行分片并指定存储位置,再由代理服务器根据数据分布列表将待缓存的数据缓存至缓存节点中,因此,通过在分布式缓存系统中部署代理服务器和集群管理器,就能使该分布式缓存系统为各个租户统一提供缓存服务,而且对于不同的租户来讲,也能使用该分布式缓存系统中的缓存节点进行数据的缓存。
当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请在实际应用中的场景架构示意图;
图2是本申请的基于分布式缓存系统的数据缓存方法实施例的流程图;
图3是本申请的基于分布式缓存系统的数据缓存方法实施例的另一流程图;
图4是本申请的代理服务器实施例的结构框图;
图5是本申请的集群管理器实施例的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参考图1所示,为本申请的数据缓存方法在实际应用中的场景架构图。在图1中,示意了一种分布式缓存系统的结构示意图。该分布式缓存系统可以包括:集群管理器101、代理服务器102和缓存节点103。其中,集群管理器101可以至少部署两个,这样,就能在当前正在提供服务的集群管理器101坏掉的情况下,可以使用其他的任意一个备份的集群管理器。当然,本领域技术人员也可以部署更多的集群管理器,集群管理器的具体个数可以由本领域技术人员自主设置。
其中,集群管理器101是分布式缓存系统的核心,统一管理整个分布式缓存系统。例如,接收代理服务器102发送的缓存请求,根据缓存请求为待缓存的数据分配缓存节点,以及根据代理服务器102同步的各缓存节点的数据缓存情况,来在各缓存节点之间平衡缓存的数据等。代理服务器102可以接收各租户(即企业或者单位等)向分布式缓存系统发出的缓存请求,并将该缓存请求转发给集群管理器101,并接收集群管理器101返回的数据分布列表进行数据的缓存等。
其中,代理服务器102可以部署n个,n为大于1的整数,每一个租户的一个缓存请求按照预设方式发送至一个代理服务器102上,由该代理服务器响应该缓存请求。预设方式可以例如,各代理服务器可以按照轮训的方式来依次接收缓存请求。具体的,代理服务器1接收了当前的一个缓存请求,则下一个缓存请求由代理服务器2接收,以此类推,直至代理服务器n也接收了缓存请求,再从代理服务器1开始分配缓存请求。当然,也可以采取其他方式,各代理服务器102的功能相同。
其中,缓存节点也可以部署多个,图1中的m也为大于1的整数。缓存节点用于接收代理服务器的指令来缓存用户请求缓存的数据。
在实际应用中,分布式缓存系统可以预先部署,例如管理员可以通过管理控制台(图1未示出)触发一个分布式缓存系统的部署。管理控制台可以是面对租户的前端服务器,在实际中一个具体的部署流程可以包括步骤A1~步骤A4:
步骤A1:管理员可以通过管理控制台触发分布式缓存系统进入发现状态[Detecting状态],即通过在各节点或服务器上部署代理agent的方式来检测各节点或服务器设备的硬件环境和设备信息,并确定角色信息。
其中,管理控制台是整个分布式缓存系统的一个管理和监控接口,管理员可以通过管理控制台来向分布式缓存系统发出指令。角色信息,即确定哪个服务器是集群管理器,哪些服务器是代理服务器,哪些节点是缓存节点,用来缓存数据。
步骤A2:根据角色信息生成集群管理器。
在步骤A2中,再根据步骤A1确定的角色信息来生成集群管理器(ClusterMng)。集群管理器再根据确定的角色信息生成代理服务器和缓存节点的部署计划,发送到对应的节点或服务器上。
步骤A3:分布式缓存系统处于部署状态[Deploying状态],部署各代理服务器和缓存节点。
具体的,各个节点或服务器上部署的agent可以按照部署计划来执行相应的部署工作,生成代理服务器和缓存节点。集群管理器可以一直等待所有节点和服务器的状态一致后,再触发下一步活动。
在本步骤中,部署计划分为代理服务器部署计划和缓存节点部署计划。其中,代理服务器的部署计划,主要包括创建代理服务器,创建代理服务器的服务端口,根据代理服务器的机器配置确定代理服务器的个数。而缓存节点的部署计划,主要包括创建缓存节点,创建缓存节点的端口,每个缓存节点部署缓存实例的个数,一个缓存实例用于接收代理服务器发送的一个缓存指令来存储待缓存的数据。分布式缓存系统中的所有缓存节点构成了一个缓存池或者缓存集群,还可以再配置缓存节点之间的主从关系,例如,将部分缓存节点设置为主缓存节点,剩下的另一部分的缓存节点则设置为备份缓存节点。具体的,可以按照实际需求自主设置主缓存节点或备份缓存节点的个数,并通过为各缓存节点设置主从标识符来实现,例如主从标识符为1的说明该缓存节点为主缓存节点,主从标识符为0的说明该缓存节点为备份缓存节点。其中,主缓存节点上缓存的数据可以接收读操作和写操作,而备份缓存节点可以接收读操作。
步骤A4:部署计划执行完毕,分布式缓存系统进入服务状态[Serving状态]正式对租户提供服务。
待代理服务器和缓存节点都生成完毕后,分布式缓存系统就部署好了,在这种情况下,各租户就可以向该分布式缓存系统发送缓存请求来缓存数据。
可以理解的是,在分布式缓存系统处于服务状态[Serving状态]中时,管理员可随时添加新租户。即,使用该分布式缓存系统缓存数据的对象。
其中,各个缓存节点或代理服务器上部署的agent,可以定时或不定时的收集代理服务器和缓存节点的运行状态,并把运行状态以异步的方式发送给集群管理器,运行状态可以包括:缓存使用率,各个缓存节点是否存活,缓存的数据在各缓存节点之间是否均衡等。
在管理员手动添加新的租户,或,集群管理器判断出缓存的数据在各缓存节点之间不均衡等情况下,集群管理器通知各个缓存节点和代理服务器进入迁移状态[Migrating状态],通知各个缓存节点和代理服务器上部署的agent执行迁移Migrating操作,集群管理器等待各个缓存节点和代理服务器的[Migrating状态]完成后恢复到服务状态[Serving状态],在Migrating状态中分布式缓存系统可以正常对各租户提供数据缓存的服务。
可以理解的是,各租户的数据在缓存节点中进行缓存时,即便缓存至同一个缓存节点上,也是互相独立的,因为集群管理器可以为租户生成包括不同的存储位置的数据分布列表,实现各租户之间的数据的逻辑隔离。另外,各租户的缓存容量配额管理也可以由集群管理器来完成。例如,可以根据租户的实际情况预先为各租户设定可以缓存的数据的总大小(即缓存容量配额),2G或者1G等等,然后集群管理器接收到代理服务器转发的缓存请求时,可以对各租户已经缓存的数据的总大小进行管理。
参考图2,示出了本申请一种数据缓存方法实施例的流程图,该方法应用于分布式缓存系统中,本实施例可以包括以下步骤:
步骤201:集群管理器生成数据拆分规则,所述数据拆分规则用于描述待缓存的数据的拆分方式。
在实际应用中,缓存节点在缓存数据的时候,因为待缓存的数据的大小不同,占用的物理存储空间可能也不同,所以一般情况下连续的缓存数据可能并不在连续的物理存储位置上。在本申请缓存数据的时候,对于不同的待缓存的数据,如果大于一定大小可以将其进行拆分,拆分成多个大小相同或不同的数据分片,使得往缓存节点缓存数据的时候可以加快缓存速度。例如,在待缓存的数据大于100M的时候,将其拆分为5个20M的数据分片分别进行存储,具体的集群管理器可以依据缓存节点和代理服务器的性能,来指定具体的数据拆分规则。再例如,对于待缓存的数据大于200M的时候,将其拆分为大小相同的五个数据分片,等等。数据拆分规则即是用于表示待缓存的数据应用按照何种拆分方式来进行分片的规则。
步骤202:集群管理器将数据拆分规则发送至代理服务器。
在生成数据拆分规则之后,集群管理器一次性地将数据拆分规则下发至分布式缓存系统中的各代理服务器上,以保证各代理服务器上的数据拆分规则都保持一致性。集群管理器还可以对生成的数据拆分规则进行修改,在修改之后,集群管理器还可以将修改后的数据拆分规则再同步至各代理服务器。
当然,可以理解的是,步骤201~步骤202相当于预处理过程,在实际应用中可以由集群管理器在生成数据拆分规则时执行一次即可,代理服务器可以将数据拆分规进行保存,以便在响应各缓存请求时无需每次都向集群管理器请求数据拆分规则。待后续数据拆分规则发生变动时,可以再一次性向代理服务器发送修改的数据拆分规则。
步骤203:代理服务器接收租户发送的、待缓存的数据的缓存请求。
在本实施例中,假设分布式缓存系统已经部署成功,且各缓存节点、代理服务器和集群管理器等的状态都是服务状态,则在这种情况下,租户可以向代理服务器发起待缓存的数据的缓存请求。
具体的,各租户在访问分布式缓存系统之前,可以预先向分布式缓存系统申请租户标识和业务标识,并定义数据缓存类型。其中,租户标识用于在该分布式缓存系统中唯一标识一个租户。业务标识用于表示租户所需访问的业务表述,在一个租户内具有唯一性,例如,业务标识表示租户当前访问的业务为“缓存”,或者“读取”等。数据缓存类型表示该业务所涉及的数据在分布式缓存系统中的存储类型,例如,memcache协议,redis协议,ehcache协议等。
基于分布式缓存系统分配的租户标识和业务标识,租户在第一次向分布式缓存系统中缓存数据时,需要提交租户标识、业务标识和业务健值,可以将这些内容携带于缓存请求中发送给代理服务器。
具体的可以参考表1所示,为一个缓存请求的示例性内容。
表1
租户ID: 8bit
业务ID: 8bit
业务键值: 16bit
数据缓存类型: 4bit
缓存数据:
在表1中,租户ID可以采用8位二进制的方式来实现,业务ID可以采用8位二进制的方式来实现,业务健值可以采用16位二进制的方式来实现,数据缓存类型可以采用4位二进制的方式来实现。而缓存数据则是租户需要往分布式缓存系统中存储的数据内容。
步骤204:代理服务器依据所述集群管理器下发的数据拆分规则生成数据分布列表。
在本步骤中代理服务器在接收到该缓存请求之后,可以根据集群管理器下发过的数据拆分规则来生成数据分布列表,其中数据拆分规则用于表示一个待缓存的数据应该按照什么方式进行拆分,数据分布列表则包括拆分后的、数据的各分片,以及各分片在缓存节点中的存储位置。具体的,代理服务器可以根据数据拆分规则对待缓存的数据进行分片,并指定各分配在缓存节点中的存储位置,从而得到数据分布列表。例如,假设待缓存的数据的大小为100M,则代理服务器可以将该100M数据平均分为5份,则每一个分片的大小就是20M,接着代理服务器可以为这5个分配的数据随机指定缓存节点中的存储位置。当然,代理服务器在为待缓存的数据进行分片时,还可以分成大小不均匀的分片,或者,在指定存储位置时,优先指定缓存使用率最小或者剩余缓存空间最大的缓存节点作为待存储的缓存节点。其中缓存使用率指的是各缓存节点中缓存空间的利用率。
在实际应用中,在部署缓存节点的时候可以将各缓存节点部署为主缓存节点,或部署为备份缓存节点。其中主缓存节点可以执行读写操作,而备份缓存节点可以执行读操作,备份缓存节点缓存的数据是主缓存节点的子集。这样,如果数据同时在主缓存节点和备份缓存节点进行了缓存,且主缓存节点发生了故障,则可以从备份缓存节点恢复缓存的数据。在缓存请求中可以包括主备存储指示,以便指示一个待缓存的数据是否需要同时存储为备份数据,如果需要,则同时在主缓存节点和备份节点中进行存储,如果不需要,则仅在主缓存节点中存储。在这种情况下,步骤204具体可以包括:
步骤A1:判断所述待缓存的数据是否需要存储为主备数据,如果是,则进入步骤A2,如果否,则进入步骤A3。
具体的,在本步骤中可以依据缓存请求中是否包括了主备存储指示实现,例如,如果缓存请求中包括主备存储指示则认为待缓存的数据需要存储为主备数据,反之则认为待缓存的数据不需要存储为主备数据。
步骤A2:将待缓存的数据复制为主数据和备份数据;按照所述数据拆分规则对主数据进行分片,并确定各主分片在主缓存节点中的存储位置;以及,按照所述数据拆分规则对备份数据进行分片,并确定各备份分片在备份缓存节点中的存储位置。
将待缓存的数据复制为两份,其中一份是主数据,按照数据拆分规则对主数据进行分片,并确定各主分片在主缓存节点中的存储位置,以及,另外一份是备份数据,并按照所述数据拆分规则对备份数据进行分片,并确定各备份分片在备份缓存节点中的存储位置。
步骤A3:将待缓存的数据按照所述数据拆分规则进行分片,并确定各分片在主缓存节点中的存储位置。
在本步骤中则不需要复制数据,仅将待缓存的数据作为主数据进行分片得到各主分片,并确定各主分片在主缓存节点中的存储位置。
步骤205:代理服务器依据数据分布列表将待缓存的数据缓存至缓存节点中。
代理服务器在生成数据分布列表之后,从中获取到待缓存的数据的分片的大小,将各分片存储至数据分布列表中指示的缓存节点中的存储位置。例如,接着前述的例子,5个20M的待缓存的数据的分片,分别存储至缓存节点1的硬盘1的数据分区1和2中,其中,第1、2和3个分片存储至数据分区1中,第4和5个分配存储至数据分区2中。当然,这是具体示例,不应将其理解为本发明的限定。
具体的,在待缓存的数据同时进行主备数据的缓存时,步骤205具体可以包括:
步骤B1:在待缓存的数据需要存储为主备数据的情况下,所述代理服务器将主数据的各主分片存储至各主分片在主缓存节点中的存储位置,以及,将备份数据的各备份分片存储至各备份分片在备份缓存节点中的存储位置。
如果待缓存的数据需要存储为主备数据,则将主数据分别按照各主分片在主缓存节点中的存储位置进行缓存,以及,将备份数据分别按照各备份分片在备份缓存节点中的存储位置进行缓存。
步骤B2:在待缓存的数据不需要存储为主备数据的情况下,所述代理服务器将待缓存的数据的各分片,存储至各分片在主缓存节点中的存储位置。
如果待缓存的数据不需要存储为主备数据,则直接将待缓存的数据分片后的各主分片直接存储至主缓存节点中的存储位置。可以理解的是,虽然待缓存的数据不需要存储为主备数据,但是需要将其存储至可以执行读写操作的主缓存节点中。
具体的,因为各租户在发送缓存请求时的请求协议有可能是不同的,而且各缓存节点缓存数据时的缓存协议也有可能是不同的,因此,为了保证各租户发送的待缓存的数据都能在缓存节点中缓存,该步骤205可以包括步骤C1~步骤C3:
步骤C1:代理服务器获取租户发送所述待缓存的数据使用的请求协议。
在实际应用中,各个缓存节点使用的缓存协议可能是不同的,或者,各个租户发送待缓存的数据和缓存请求时的请求协议也可能是不同的,因此,代理服务器在缓存数据的时候,需要先获取租户使用的请求协议。
步骤C2:代理服务器将请求协议转换为缓存节点可以兼容的缓存协议。
接着代理服务器可以将请求协议转换成缓存节点可以兼容的缓存协议。
步骤C3:代理服务器参考缓存协议,将待缓存的数据的各个分片存储至各分片在缓存节点中的存储位置。
然后代理服务器参考转换后的缓存协议,来将待缓存的数据的各分配存储至集群服务器指定的缓存节点中的存储位置。可见通过代理服务器可以向各租户屏蔽缓存节点之间的差异,实现租户和缓存节点的真正分离,保证各租户都可以透明的访问缓存节点而无需关注缓存协议。
综上,在本申请实施例中,代理服务器在接收到租户的缓存请求时,统一依据集群管理器下发的数据拆分规则来生成数据分布列表,由代理服务器统一为各个租户的待缓存的数据进行分片并指定存储位置,再由代理服务器按照数据分布列表将待缓存的数据缓存至缓存节点中,因此,通过在分布式缓存系统中部署代理服务器和集群管理器,就能使该分布式缓存系统为各个租户统一提供缓存服务,而且对于不同的租户来讲,也能使用该分布式缓存系统中的缓存节点进行数据的缓存。
参考图3,示出了本申请一种数据缓存方法实施例的流程图,本实施例可以应用于分布式缓存系统中,本实施例可以包括以下步骤:
步骤301:代理服务器接收租户发送的、待缓存的数据的缓存请求。
在本实施例中,集群管理器已经预先将最新的数据拆分规则发送给各代理服务器。后续租户在向代理服务器发送缓存请求时,还可以在缓存请求中携带了主备存储指示,该主备存储指示用于表示待缓存的数据需要分别存储为主数据和备份数据。该主备存储指示可以采用状态位实现,例如状态位为1时表示需要进行主备存储,为0时表示不需要进行主备存储。
步骤302:所述代理服务器依据所述集群管理器下发的数据拆分规则生成数据分布列表,并依据所述数据分布列表将待缓存的数据缓存至缓存节点中。
步骤303:所述代理服务器将所述数据分布列表和缓存请求发送至集群管理器。
在执行步骤302缓存数据时,一种方式是,代理服务器可以同时执行步骤303将生成的数据列表和缓存请求发送给集群管理器。还有一种方式是,代理服务器还可以在步骤301之后实时将缓存请求发送给集群管理器。其中,可以理解的是,代理服务器可以仅将缓存请求中的租户标识、业务标识和业务健值发送给集群管理器,而无需将数据缓存类型和缓存数据发送至集群管理器。
步骤304:集群管理器依据所述缓存请求中的租户标识、业务标识和业务键值生成数据标识。
集群管理器在接收到租户标识、业务标识和业务键值,可以依据这三个参数生成一个唯一标识待缓存的数据的数据标识。具体的,集群管理器可以采用Hash算法计算Hash值的方式,当然,集群管理器还可以采用其他方式来确定数据标识。
步骤305:集群管理器将所述数据标识和数据分布列表对应存储,将数据标识通过代理服务器转发至租户。
在得到数据标识之后,集群管理器可以将数据标识和该数据标识对应的数据的数据分布列表对应存储,同时将数据标识发送给代理服务器,代理服务器再将该数据标识发送给存储该数据标识唯一标识的数据的租户。其中,集群管理器可以在存储器或硬盘等存储空间而非内存中将数据标识和数据分布列表对应存储,以保证即便断电等情况下,也能在恢复之后不丢失数据标识和数据分布列表。
集群管理器在接收到租户标识、业务标识和业务健值时,会生成数据标识。具体的,可以依据缓存请求中的租户标识、业务标识和业务健值,生成一个在分布式缓存系统中唯一标识待缓存的数据的数据标识。集群管理器可以将各数据的数据标识与代理服务器发送的、该数据的数据分布列表对应进行存储,例如采用key-value的方式存储数据标识和数据分布列表等。集群管理器再将该数据标识通过代理服务器发送给对应的租户。
在执行步骤301~步骤305之后,已经将待缓存的数据缓存至对应的缓存节点中,后续租户还可以访问已经在缓存节点中成功缓存的数据,则步骤305之后还可以包括步骤306~步骤309:
步骤306:响应于接收到租户发送的数据标识,代理服务器将所述数据标识发送给集群管理器。
在租户将待缓存的数据的数据标识存储之后,如果下一次需要访问之前缓存的数据,则可以将该数据的数据标识发送至代理服务器,由代理服务器将该数据标识再转发给集群管理器。
步骤307:集群管理器判断数据标识是否存在;如果是,则进入步骤308;如果否,则进入步骤310。
因为数据标识是集群管理器生成的,集群管理器则可以判断是否已经存储该数据标识。具体的,集群管理器可以从专门用于对应存储数据标识和数据分布列表的存储器或者硬盘中,看是否能查询到该数据标识。
步骤308:集群管理器查询数据标识唯一标识的数据对应的数据分布列表,并将数据分布列表发送给代理服务器。
集群管理器将查询到的数据标识所对应的数据分布列表发送给代理服务器。
步骤309:代理服务器依据数据分布列表,从缓存节点中获取数据并返回给租户。
因为数据分布列表中已经包括了该数据的各分片以及各分配在缓存节点中的存储位置,所以代理服务器可以依据各分片的信息和存储位置来从对应的缓存节点中获取到用户需要访问的数据。
可以理解的是,代理服务器在生成数据分布列表后,可以仅在内存中保存数据分布列表以便依据该数据分布列表在缓存节点中缓存数据,无需将数据标识或数据分布列表存储在硬盘或存储器中。后续在需要数据分布列表时如果内存中查询不到代理服务器可以向集群管理器请求数据分布列表。
步骤310:集群管理器返回标识提示信息,用于提示该数据标识不存在。
集群管理器如果查询不到该数据标识,则可以向代理服务器返回提示信息,提示该数据标识并不存在,接着代理服务器可以将该标识提示信息转发给租户,以提醒租户该数据标识不正确等。
在本实施例中,集群管理器可以将代理服务器发送的数据分布列表进行保存,并为各待缓存的数据生成唯一的数据标识,待后续租户访问缓存的数据时可以直接发送数据标识,集群管理器可以查询到该数据标识对应的数据分布列表,通过将数据分布列表下发给代理服务器,由代理服务器从相应的缓存节点中查询到租户希望访问的数据并发送给对应的租户。
在实际应用中,集群管理器还可以对各租户的缓存容量阈值进行管理,具体的,集群管理器可以预先配置好各租户的缓存容量阈值,其中,缓存容量阈值可以用于表示各租户在分布式缓存系统中能缓存数据的总大小。例如租户A的缓存容量阈值为2G,则说明租户A在该分布式缓存系统中一共能缓存2G的数据。基于此,集群管理器对各租户的缓存容量阈值进行监控的流程可以包括步骤D1~步骤D2:
步骤D1:集群管理器判断所述租户已经缓存的数据总和是否超过所述缓存容量阈值,如果是,则进入步骤D2;如果否,则可以不执行任何动作。
集群管理器在通过代理服务器获得一个租户发送的缓存请求后,可以通过租户标识等,判断该租户在该分布式缓存系统中已经缓存的数据总大小是否已经超过缓存容量阈值。如果租户已经缓存的数据综合未超过缓存容量阈值,则集群管理器可以不执行任何操作。
步骤D2:集群管理器向代理服务器发送容量提示信息,容量提示信息用于提示租户缓存的数据已经达到缓存容量阈值。
如果集群管理器判断得到该租户在各缓存节点中存储的数据的总和已经超过了缓存容量阈值,则集群管理器可以向代理服务器返回一个提示信息,用于提示该租户所缓存的数据已经达到了缓存容量阈值,代理服务器还可以将该提示信息返回给租户。
可以理解的是,步骤D1~步骤D2的执行可以在步骤301之后的任意一个步骤执行。可见,通过对租户的缓存容量阈值的设置,可以预先对各租户的已缓存的数据进行监控,在租户所缓存的数据到达缓存容量阈值的情况下,则提示租户,可以更方便的对各租户已缓存的数据进行管理。此外,集群管理器还可以生成一个数据唯一的数据标识,后续如果租户希望访问自己已经缓存在缓存节点中的数据,则只需要向代理服务器发送数据标识即可实现。
在实际应用中,集群管理器还可以通过代理服务器收集各缓存节点的数据缓存情况,从而对各缓存节点的缓存空间进行统一管理,通过各缓存节点之间的数据的迁移,可以实现各缓存节点之间缓存数据的均衡,具体的,迁移过程可以包括步骤E1~步骤E4:
步骤E1:集群管理器通过代理服务器从各缓存节点获取数据缓存情况,所述数据缓存情况包括:各缓存节点的缓存使用率和健康状态。
在本步骤中,代理服务器可以收集各缓存节点的数据缓存情况,并上报给集群管理器,其中,数据缓存情况可以包括:各缓存节点的缓存使用率和健康状态,缓存使用率用于表示各缓存节点的缓存空间的利用率,健康状态可以用于表示各缓存节点是否正常工作或是否存活。
步骤E2:所述集群管理器判断各缓存节点的缓存使用率是否超过预设缓存阈值,或者,各缓存节点的健康状态是否正常,或者,所述分布式缓存系统中是否添加有新缓存节点。
集群管理器可以预先设置好各缓存节点的缓存使用率,例如各缓存节点的缓存使用率不能超过80%,或者缓存使用率不能低于50%等,还可以判断各缓存节点是否出现宕机的情况,出现宕机的情况下就无法正常工作了,或者还可以判断该分布式缓存系统中是否添加有新的缓存节点。
步骤E3:如果缓存节点的缓存使用率超过预设缓存阈值,或者,缓存节点的健康状态不正常,则将数据按照预设比例转存至未超过预设缓存阈值且健康状态正常的缓存节点中。
在实际应用中,如果缓存节点的缓存使用率与预设缓存阈值不匹配,例如,某个或某些缓存节点的缓存使用率高于预先设置的80%,或者,某个或某些缓存节点的缓存使用率低于预先设置的50%等,都属于缓存使用率与预设缓存阈值不匹配的情况,即各个缓存节点中缓存的数据不太均衡,有的缓存节点缓存的数据过多而有的缓存节点缓存的数据过少,出现了数据倾斜的现象。而如果缓存节点出现了宕机的情况下,或者断电等缓存节点无法正常工作的情况下,则可以认为缓存节点的健康状态不正常。在上述数据倾斜或者缓存节点不健康等任意一种情况下,则可以将各缓存节点之间的数据进行互相转移,以使得各缓存节点之间缓存的数据尽量保持大小一致,避免出现数据倾斜的现象,同时,也避免不健康的缓存节点中的数据丢失的现象。
具体的,集群管理器可以设置一个预设比例,在出现数据倾斜或者缓存节点不健康等的情况下,将缓存数据过多的缓存节点或不健康的缓存节点中的缓存数据按照预设比例的设置,转移至缓存数据过少或者健康的缓存节点中。假设预设比例为10%,则本步骤从缓存使用率高于80%缓存节点中将数据转移出10%至缓存使用率低于50%的缓存节点中,或者,将健康状态不正常的缓存节点中的数据全部转移至缓存使用率低于50%的缓存节点中,如果缓存使用率低于50%的缓存节点有多个,则将待转移的数据平均转移至这多个缓存使用率低于50%的缓存节点,等等。
步骤E4:如果添加有新缓存节点,则将缓存使用率超过预设缓存阈值或健康状态不正常的缓存节点中的数据,按照预设比例转存至所述新缓存节点中。
而如果集群管理器判断得到当前的分布式缓存系统中出现了新添加的缓存节点,则可以将缓存使用率高于80%缓存节点中的数据转移10%至新添加的缓存节点中,或者,将健康状态不正常的缓存节点中的数据全部转移至新缓存节点中。当然,本申请实施例中的转移方式都是举例示意,在实际应用中本领域技术人员可以自主设置预设比例,或者预设缓存阈值的具体大小等。
在实际应用中,通过由集群管理器来统一对各缓存节点统一管理,可以使得各缓存节点之间不会出现数据倾斜的现象,即有的缓存节点的缓存利用率特别高而有的缓存节点的缓存利用率又特别低,从而使得各缓存节点能够较为均衡的缓存数据,并且实时监控缓存节点是否能够正常工作,保证缓存的数据的可用性和安全性。
与上述本申请一种数据缓存方法实施例所提供的方法相对应,参见图4,本申请还提供了一种代理服务器实施例,在本实施例中,该代理服务器部署于图1所示的分布式缓存系统中,该代理服务器可以包括:
接收缓存请求单元401,用于接收租户发送的、待缓存的数据的缓存请求。
生成列表单元402,用于依据所述集群管理器下发的数据拆分规则生成数据分布列表;所述数据分布列表包括:待缓存的数据的各分片大小和各分片在缓存节点中的存储位置。
其中,缓存节点可以包括主缓存节点和备份缓存节点,所述生成列表单元可以包括:判断子单元,用于判断所述待缓存的数据是否需要存储为主备数据;第一处理子单元,用于在所述判断子单元为是的情况下,将待缓存的数据复制为主数据和备份数据;按照所述数据拆分规则对主数据进行分片,并确定各主分片在主缓存节点中的存储位置;以及,按照所述数据拆分规则对备份数据进行分片,并确定各备份分片在备份缓存节点中的存储位置;和,第二处理子单元,用于在所述判断子单元为否的情况下,按照数据拆分规则将待缓存的数据作为主数据进行分片,并确定各主分片在主缓存节点中的存储位置。
缓存单元403,用于依据所述数据分布列表将待缓存的数据缓存至缓存节点中。
相应的,所述缓存单元403具体可以包括:
第一存储子单元,用于在待缓存的数据需要存储为主备数据的情况下,所述代理服务器将主数据的各主分片存储至各主分片在主缓存节点中的存储位置,以及,将备份数据的各备份分片存储至各备份分片在备份缓存节点中的存储位置;和,第二存储子单元,用于在待缓存的数据不需要存储为主备数据的情况下,所述代理服务器将待缓存的数据的各主分片,存储至各主分片在主缓存节点中的存储位置。
其中,所述缓存单元404,具体可以包括:
获取子单元,用于获取所述租户发送所述待缓存的数据使用的请求协议;转换子单元,用于将请求协议转换为缓存节点可以兼容的缓存协议;缓存子单元,用于参考所述缓存协议,将待缓存的数据的各个分片存储至各分片在缓存节点中的存储位置。
其中,所述代理服务器还可以包括:
发送单元404,用于将所述数据分布列表和缓存请求发送至集群管理器,以便所述集群管理器依据所述缓存请求中的租户标识、业务标识和业务键值生成数据标识,并将所述数据标识和数据分布列表对应存储;所述数据标识用于在所述分布式缓存系统中唯一标识待缓存的数据;
接收数据标识单元405,用于接收集群管理器返回的数据标识;
发送数据标识单元406,用于将所述数据标识发送给所述租户。
其中,所述代理服务器还可以包括:
发送查询标识单元407,用于响应于接收到租户发送待查询的数据标识,将所述待查询的数据标识发送给集群管理器,以便所述集群管理器查询所述待查询的数据标识对应的缓存数据的数据分布列表。
获取数据单元408,用于依据所述集群管理器返回的数据分布列表,从缓存节点中获取缓存数据。
发送数据单元409,用于将获取到的缓存数据发送给所述租户。
在本申请实施例中,代理服务器在接收到租户的缓存请求时,代理服务器根据由集群管理器下发的数据拆分规则来生成数据分布列表,从而为各个租户的待缓存的数据进行分片并指定存储位置,再由代理服务器根据数据分布列表将待缓存的数据缓存至缓存节点中,因此,通过在分布式缓存系统中部署代理服务器和集群管理器,就能使该分布式缓存系统为各个租户统一提供缓存服务,而且对于不同的租户来讲,也能使用该分布式缓存系统中的缓存节点进行数据的缓存。
参考图5所示,本申请还提供了一种集群管理器实施例,该集群管理器可以部署于图1所示的分布式缓存系统中,在本实施例中,该集群管理器可以包括:
生成规则单元501,用于生成数据拆分规则,所述数据拆分规则用于描述待缓存的数据的拆分方式。
其中,数据请求中还包括主备存储指示,所述主备存储指示用于表示待缓存的数据需要分别存储为主数据和备份数据;所述生成列表单元501,可以包括:确定主分片单元,用于依据所述主备存储指示为所述待缓存的数据进行主数据的分片,并为各分片确定缓存节点中的主存储位置;确定备份分片单元,用于依据所述主备存储指示为所述待缓存的数据进行备份数据的分片,并为各备份分片确定缓存节点中的备份存储位置。
发送规则单元502,用于将所述数据拆分规则发送至所述代理服务器,以便所述代理服务器接收到缓存请求时,依据所述数据拆分规则生成数据分布列表,并依据所述数据分布列表将待缓存的数据缓存至缓存节点中;所述数据分布列表包括:待缓存的数据的各分片大小和各分片在缓存节点中的存储位置。
其中,所述集群服务器还可以包括:
接收单元503,用于接收所述代理服务器发送的数据分布列表和缓存请求。
生成标识单元504,用于依据所述缓存请求中的租户标识、业务标识和业务键值生成数据标识,所述数据标识用于在所述分布式缓存系统中唯一标识待缓存的数据。
存储单元505,用于将所述数据标识和所述数据分布列表对应存储。
发送标识单元506,用于将所述数据标识发送给所述代理服务器。
其中,所述集群管理器还可以包括:
判断标识单元507,用于响应于接收到所述代理服务器转发的数据标识,所述集群管理器判断所述数据标识是否存在。
查询单元508,用于在所述判断标识单元的结果为是的情况下,查询所述数据标识唯一标识的数据的数据分布列表。
发送查询列表单元509,用于将所述查询单元查询到的数据分布列表发送给所述代理服务器,以便所述代理服务器从缓存节点中获取数据。
返回标识提示单元510,用于在所述判断标识单元的结果为否的情况下,向所述代理服务器返回标识提示信息,所述标识提示信息用于提示所述数据标识不存在。
其中,所述集群管理器保存有各租户的缓存容量阈值;所述缓存容量阈值用于表示各租户在分布式缓存中能缓存的数据的总大小;所述集群管理器还可以包括:
判断单元,用于判断所述租户已经缓存的数据总和是否超过所述缓存容量阈值;和,发送容量信息单元,用于在所述判断单元的结果为是的情况下,向所述代理服务器发送容量提示信息,所述容量提示信息用于提示所述租户缓存的数据已经达到缓存容量阈值。
其中,集群管理器还可以包括:
收集存储情况单元,用于从各缓存节点获取数据缓存情况,所述数据缓存情况包括:各缓存节点的缓存使用率和健康状态;判断情况单元,用于判断各缓存节点的缓存使用率是否超过预设缓存阈值,各缓存节点的健康状态是否正常,或者,所述分布式缓存系统中是否添加有新缓存节点;和,转存单元,用于如果缓存节点的缓存使用率与预设缓存阈值不匹配,则将数据按照预设比例转存至相匹配且健康状态正常的缓存节点中;如果缓存节点的健康状态不正常,则将数据转存至相匹配且健康状态正常的缓存节点中;以及,如果添加有新缓存节点,则将缓存使用率与预设缓存阈值不匹配的缓存节点的数据按照预设比例转存至所述新缓存节点中,或者,将健康状态不正常的缓存节点中的数据转存至所述新缓存节点中。
其中,该集群管理器还可以包括:
保存容量单元,用于保存有各租户的缓存容量阈值;所述缓存容量阈值用于表示各租户能缓存的数据的最大值。判断容量单元,用于判断所述租户已经缓存的数据总和是否超过所述缓存容量阈值。和,发送提示单元,用于在所述判断容量单元的结果为是的情况下,向所述代理服务器发送容量提示信息,所述容量提示信息用于提示所述租户缓存的数据已经达到缓存容量阈值。
在实际应用中,通过由集群管理器来统一对各缓存节点统一管理,可以使得各缓存节点之间不会出现数据倾斜的现象,即有的缓存节点的缓存利用率特别高而有的缓存节点的缓存利用率又特别低,从而使得各缓存节点能够较为均衡的缓存数据,并且实时监控缓存节点是否能够正常工作,保证缓存的数据的可用性和安全性。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的基于分布式缓存系统的数据缓存方法、服务器及系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种数据缓存方法,其特征在于,该方法应用于分布式缓存系统中的代理服务器上,所述分布式缓存系统还包括:集群管理器和缓存节点,该方法包括:
所述代理服务器接收租户发送的、待缓存的数据的缓存请求;
所述代理服务器依据所述集群管理器下发的数据拆分规则生成数据分布列表;所述数据分布列表包括:待缓存的数据的各分片大小和各分片在缓存节点中的存储位置;
所述代理服务器依据所述数据分布列表将待缓存的数据缓存至缓存节点中。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述代理服务器将所述数据分布列表和缓存请求发送至集群管理器,以便所述集群管理器依据所述缓存请求中的租户标识、业务标识和业务键值生成数据标识,并将所述数据标识和数据分布列表对应存储;所述数据标识用于在所述分布式缓存系统中唯一标识待缓存的数据;
所述代理服务器接收集群管理器返回的数据标识;
所述代理服务器将所述数据标识发送给所述租户。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
响应于接收到租户发送的数据标识,所述代理服务器将所述数据标识发送给集群管理器,以便所述集群管理器查询所述数据标识唯一标识的数据对应的数据分布列表;
所述代理服务器依据所述集群管理器返回的数据分布列表,从缓存节点中获取数据;
所述代理服务器将获取到的数据发送给所述租户。
4.根据权利要求1所述的方法,其特征在于,所述代理服务器依据所述数据分布列表将待缓存的数据缓存至缓存节点中,包括:
所述代理服务器获取所述租户发送所述待缓存的数据使用的请求协议;
所述代理服务器将请求协议转换为缓存节点可以兼容的缓存协议;
所述代理服务器参考所述缓存协议,将待缓存的数据的各个分片存储至各分片在缓存节点中的存储位置。
5.根据权利要求1所述的方法,其特征在于,所述缓存节点包括主缓存节点和备份缓存节点,所述代理服务器依据所述集群管理器下发的数据拆分规则生成数据分布列表,包括:
所述代理服务器判断所述待缓存的数据是否需要存储为主备数据;
如果是,则将待缓存的数据复制为主数据和备份数据;按照所述数据拆分规则对主数据进行分片,并确定各主分片在主缓存节点中的存储位置;以及,按照所述数据拆分规则对备份数据进行分片,并确定各备份分片在备份缓存节点中的存储位置;
如果否,则按照数据拆分规则将待缓存的数据作为主数据进行分片,并确定各主分片在主缓存节点中的存储位置。
6.一种数据缓存方法,其特征在于,该方法应用于分布式缓存系统中的集群管理器上,所述分布式缓存系统还包括:代理服务器和缓存节点,该方法包括:
所述集群管理器生成数据拆分规则,所述数据拆分规则用于描述待缓存的数据的拆分方式;
所述集群管理器将所述数据拆分规则发送至所述代理服务器,以便所述代理服务器接收到缓存请求时,依据所述数据拆分规则生成数据分布列表,并依据所述数据分布列表将待缓存的数据缓存至缓存节点中;所述数据分布列表包括:待缓存的数据的各分片大小和各分片在缓存节点中的存储位置。
7.根据权利要求6所述的方法,其特征在于,还包括:
所述集群管理器接收所述代理服务器发送的数据分布列表和缓存请求;
所述集群管理器依据所述缓存请求中的租户标识、业务标识和业务键值生成数据标识,所述数据标识用于在所述分布式缓存系统中唯一标识待缓存的数据;
所述集群管理器将所述数据标识和所述数据分布列表对应存储,并将所述数据标识发送给所述代理服务器。
8.一种代理服务器,其特征在于,所述代理服务器位于分布式缓存系统中,所述分布式缓存系统还包括:集群管理器和缓存节点,该代理服务器包括:
接收缓存请求单元,用于接收租户发送的、待缓存的数据的缓存请求;
生成列表单元,用于依据所述集群管理器下发的数据拆分规则生成数据分布列表;所述数据分布列表包括:待缓存的数据的各分片大小和各分片在缓存节点中的存储位置;
缓存单元,用于依据所述数据分布列表将待缓存的数据缓存至缓存节点中。
9.一种集群服务器,其特征在于,所述集群服务器位于分布式缓存系统中,所述分布式缓存系统还包括:代理服务器和缓存节点,该集群服务器包括:
生成规则单元,用于生成数据拆分规则,所述数据拆分规则用于描述待缓存的数据的拆分方式;
发送规则单元,用于将所述数据拆分规则发送至所述代理服务器,以便所述代理服务器接收到缓存请求时,依据所述数据拆分规则生成数据分布列表,并依据所述数据分布列表将待缓存的数据缓存至缓存节点中;所述数据分布列表包括:待缓存的数据的各分片大小和各分片在缓存节点中的存储位置。
10.一种分布式缓存系统,其特征在于,所述分布式缓存系统包括:
如权利要求8所述的代理服务器,如权利要求9所述的集群管理器,和,用于缓存数据的缓存节点。
CN201611170401.7A 2016-12-16 2016-12-16 基于分布式缓存系统的数据缓存方法、服务器和系统 Active CN106453665B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611170401.7A CN106453665B (zh) 2016-12-16 2016-12-16 基于分布式缓存系统的数据缓存方法、服务器和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611170401.7A CN106453665B (zh) 2016-12-16 2016-12-16 基于分布式缓存系统的数据缓存方法、服务器和系统

Publications (2)

Publication Number Publication Date
CN106453665A true CN106453665A (zh) 2017-02-22
CN106453665B CN106453665B (zh) 2019-06-07

Family

ID=58217450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611170401.7A Active CN106453665B (zh) 2016-12-16 2016-12-16 基于分布式缓存系统的数据缓存方法、服务器和系统

Country Status (1)

Country Link
CN (1) CN106453665B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107181757A (zh) * 2017-06-27 2017-09-19 新浪网技术(中国)有限公司 支持认证和协议转换的Memcache代理方法、装置及系统
CN107548092A (zh) * 2017-08-04 2018-01-05 深圳市盛路物联通讯技术有限公司 一种分布式网络延迟的数据处理方法及系统
CN108183947A (zh) * 2017-12-27 2018-06-19 深圳天源迪科信息技术股份有限公司 分布式缓存方法及系统
CN108304504A (zh) * 2018-01-18 2018-07-20 吉浦斯信息咨询(深圳)有限公司 一种用户在线状态快速查询方法及系统
WO2018166297A1 (zh) * 2017-03-17 2018-09-20 华为技术有限公司 一种缓存分配方法,及设备
CN108763315A (zh) * 2018-04-26 2018-11-06 北京易代储科技有限公司 数据统计管理方法及装置
CN109189813A (zh) * 2018-08-22 2019-01-11 中国建设银行股份有限公司 一种数据共享方法及装置
CN109284073A (zh) * 2018-09-30 2019-01-29 北京金山云网络技术有限公司 数据存储方法、装置、系统、服务器、控制节点及介质
CN109309603A (zh) * 2018-11-02 2019-02-05 华青融天(北京)软件股份有限公司 一种动态的负载均衡分配方法及装置
CN109446271A (zh) * 2018-10-31 2019-03-08 阿里巴巴集团控股有限公司 一种数据同步方法、装置、设备及介质
CN110557413A (zh) * 2018-05-30 2019-12-10 中国人民财产保险股份有限公司 一种业务服务系统及提供业务服务的方法
CN110826055A (zh) * 2019-11-06 2020-02-21 中国移动通信集团广东有限公司 基于业务负载的租户安全自动化智能检测方法及系统
CN111224967A (zh) * 2019-12-30 2020-06-02 视联动力信息技术股份有限公司 数据处理方法及装置、电子设备、存储介质
CN111639902A (zh) * 2020-04-29 2020-09-08 深圳壹账通智能科技有限公司 基于kafka的数据审核方法、控制装置及计算机设备、存储介质
CN113641711A (zh) * 2021-08-17 2021-11-12 天津卓盛云科技有限公司 一种针对saas租户的数据缓存处理方法、装置及介质
CN114615073A (zh) * 2022-03-22 2022-06-10 广州方硅信息技术有限公司 访问流量控制方法及其装置、设备、介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673271A (zh) * 2008-09-09 2010-03-17 青岛海信传媒网络技术有限公司 分布式文件系统及其文件分片方法
CN102006330A (zh) * 2010-12-01 2011-04-06 北京瑞信在线系统技术有限公司 分布式缓存系统、数据的缓存方法及缓存数据的查询方法
CN102088491A (zh) * 2011-02-01 2011-06-08 西安建筑科技大学 一种面向分散式的云存储安全架构及其数据存取方法
CN103577503A (zh) * 2012-08-10 2014-02-12 鸿富锦精密工业(深圳)有限公司 云端文件存储系统及方法
CN104731516A (zh) * 2013-12-18 2015-06-24 腾讯科技(深圳)有限公司 一种存取文件的方法、装置及分布式存储系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673271A (zh) * 2008-09-09 2010-03-17 青岛海信传媒网络技术有限公司 分布式文件系统及其文件分片方法
CN102006330A (zh) * 2010-12-01 2011-04-06 北京瑞信在线系统技术有限公司 分布式缓存系统、数据的缓存方法及缓存数据的查询方法
CN102088491A (zh) * 2011-02-01 2011-06-08 西安建筑科技大学 一种面向分散式的云存储安全架构及其数据存取方法
CN103577503A (zh) * 2012-08-10 2014-02-12 鸿富锦精密工业(深圳)有限公司 云端文件存储系统及方法
CN104731516A (zh) * 2013-12-18 2015-06-24 腾讯科技(深圳)有限公司 一种存取文件的方法、装置及分布式存储系统

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018166297A1 (zh) * 2017-03-17 2018-09-20 华为技术有限公司 一种缓存分配方法,及设备
CN107181757A (zh) * 2017-06-27 2017-09-19 新浪网技术(中国)有限公司 支持认证和协议转换的Memcache代理方法、装置及系统
CN107548092B (zh) * 2017-08-04 2021-01-26 深圳市盛路物联通讯技术有限公司 一种分布式网络延迟的数据处理方法及系统
CN107548092A (zh) * 2017-08-04 2018-01-05 深圳市盛路物联通讯技术有限公司 一种分布式网络延迟的数据处理方法及系统
CN108183947A (zh) * 2017-12-27 2018-06-19 深圳天源迪科信息技术股份有限公司 分布式缓存方法及系统
CN108304504A (zh) * 2018-01-18 2018-07-20 吉浦斯信息咨询(深圳)有限公司 一种用户在线状态快速查询方法及系统
CN108763315A (zh) * 2018-04-26 2018-11-06 北京易代储科技有限公司 数据统计管理方法及装置
CN108763315B (zh) * 2018-04-26 2021-07-30 北京易代储科技有限公司 数据统计管理方法及装置
CN110557413A (zh) * 2018-05-30 2019-12-10 中国人民财产保险股份有限公司 一种业务服务系统及提供业务服务的方法
CN109189813A (zh) * 2018-08-22 2019-01-11 中国建设银行股份有限公司 一种数据共享方法及装置
CN109189813B (zh) * 2018-08-22 2021-08-13 中国建设银行股份有限公司 一种数据共享方法及装置
CN109284073A (zh) * 2018-09-30 2019-01-29 北京金山云网络技术有限公司 数据存储方法、装置、系统、服务器、控制节点及介质
US11385830B2 (en) 2018-09-30 2022-07-12 Beijing Kingsoft Cloud Network Technology Co., Ltd. Data storage method, apparatus and system, and server, control node and medium
CN109446271B (zh) * 2018-10-31 2023-02-14 创新先进技术有限公司 一种数据同步方法、装置、设备及介质
CN109446271A (zh) * 2018-10-31 2019-03-08 阿里巴巴集团控股有限公司 一种数据同步方法、装置、设备及介质
CN109309603A (zh) * 2018-11-02 2019-02-05 华青融天(北京)软件股份有限公司 一种动态的负载均衡分配方法及装置
CN110826055A (zh) * 2019-11-06 2020-02-21 中国移动通信集团广东有限公司 基于业务负载的租户安全自动化智能检测方法及系统
CN110826055B (zh) * 2019-11-06 2021-07-30 中国移动通信集团广东有限公司 基于业务负载的租户安全自动化智能检测方法及系统
CN111224967A (zh) * 2019-12-30 2020-06-02 视联动力信息技术股份有限公司 数据处理方法及装置、电子设备、存储介质
CN111224967B (zh) * 2019-12-30 2023-09-26 视联动力信息技术股份有限公司 数据处理方法及装置、电子设备、存储介质
CN111639902A (zh) * 2020-04-29 2020-09-08 深圳壹账通智能科技有限公司 基于kafka的数据审核方法、控制装置及计算机设备、存储介质
CN113641711A (zh) * 2021-08-17 2021-11-12 天津卓盛云科技有限公司 一种针对saas租户的数据缓存处理方法、装置及介质
CN113641711B (zh) * 2021-08-17 2024-05-31 天津卓盛云科技有限公司 一种针对saas租户的数据缓存处理方法、装置及介质
CN114615073A (zh) * 2022-03-22 2022-06-10 广州方硅信息技术有限公司 访问流量控制方法及其装置、设备、介质

Also Published As

Publication number Publication date
CN106453665B (zh) 2019-06-07

Similar Documents

Publication Publication Date Title
CN106453665A (zh) 基于分布式缓存系统的数据缓存方法、服务器和系统
CN102831120B (zh) 一种数据处理方法及系统
CN109729129A (zh) 存储集群的配置修改方法、存储集群及计算机系统
CN106899518A (zh) 一种基于互联网数据中心的资源处理方法以及装置
KR101670343B1 (ko) 피어투피어 데이터 복제를 위한 방법, 장치, 및 시스템 및 마스터 노드 전환을 위한 방법, 장치, 및 시스템
CA2938768A1 (en) Geographically-distributed file system using coordinated namespace replication
WO2016070375A1 (zh) 一种分布式存储复制系统和方法
CN102938705B (zh) 一种高可用多机备份路由表管理与切换方法
CN105025053A (zh) 基于云存储技术的分布式文件的上传方法及其系统
CN105242872B (zh) 一种面向虚拟集群的共享存储系统
CN102917025A (zh) 一种云计算平台的业务迁移方法
CN104601680B (zh) 一种资源管理方法及装置
CN104317669A (zh) 一种云端异构存储系统及其数据副本管理方法
CN104852965B (zh) 一种用户账号项目管理方法及系统
CN104809510A (zh) 一种提供票务支持的票池中间件的构建、购票及锁票方法
CN103186554A (zh) 分布式数据镜像方法及存储数据节点
CN103905530A (zh) 一种高性能全局负载均衡的分布式数据库数据路由方法
CN110213309A (zh) 一种绑定关系管理的方法、设备及存储介质
CN103795801A (zh) 一种基于实时应用集群的元数据集群设计方法
CN105260485A (zh) 一种数据加载的方法和装置
CN101344882B (zh) 数据查询方法、插入方法及删除方法
CN108140035A (zh) 分布式系统的数据库复制方法及装置
CN106227465B (zh) 一种环结构的数据放置方法
CN101207518B (zh) 一种面向分布式资源节点的异步维护系统
CN103888510B (zh) 一种云计算数据中心的业务高可用方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant