CN113553306A - 数据处理方法及数据存储管理系统 - Google Patents

数据处理方法及数据存储管理系统 Download PDF

Info

Publication number
CN113553306A
CN113553306A CN202110850825.2A CN202110850825A CN113553306A CN 113553306 A CN113553306 A CN 113553306A CN 202110850825 A CN202110850825 A CN 202110850825A CN 113553306 A CN113553306 A CN 113553306A
Authority
CN
China
Prior art keywords
data
storage
relation
target
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110850825.2A
Other languages
English (en)
Other versions
CN113553306B (zh
Inventor
林杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Unisinsight Technology Co Ltd
Original Assignee
Chongqing Unisinsight Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Unisinsight Technology Co Ltd filed Critical Chongqing Unisinsight Technology Co Ltd
Priority to CN202110850825.2A priority Critical patent/CN113553306B/zh
Publication of CN113553306A publication Critical patent/CN113553306A/zh
Application granted granted Critical
Publication of CN113553306B publication Critical patent/CN113553306B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9017Indexing; Data structures therefor; Storage structures using directory or table look-up

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种数据处理方法及数据存储管理系统,涉及数据存储管理技术领域。本申请在客户端获取到待读取数据标识后,由客户端在自身的临时缓存数据中查找存在待读取数据标识所属的数据关联关系的关联匹配数据,并在未查找到关联匹配数据的情况下,对应地从多个数据存储设备中确定出目标存储设备,而后向该目标存储设备发送针对该待读取数据标识所属的数据关联关系的数据获取请求,使该目标存储设备得以根据数据存储索引列表从自身的存储数据中查找出具有该数据获取请求所对应的数据关联关系的目标数据,并将查找到的所有目标数据发送给该客户端,从而实现对存在相同关联关系的多项数据的快速访问操作,改善关联数据访问高延时问题。

Description

数据处理方法及数据存储管理系统
技术领域
本申请涉及数据存储管理技术领域,具体而言,涉及一种数据处理方法及数据存储管理系统。
背景技术
随着计算机技术及网络技术的不断发展,现有分布式数据存储方式已不再适用于各大行业,各大行业对于数据存储方式都提出了自身特色的需求,其中现有分布式数据存储方式通常采用目录树层级结构直接将数据(例如,图片、视频及音乐等)按照时间与空间上的分布状况进行排列存储。
发明内容
有鉴于此,本申请的目的在于提供一种数据处理方法及数据存储管理系统,能够实现对存在相同关联关系的多项数据进行快速访问,改善对具有相同关联关系的数据进行访问时存在的高延时问题。
为了实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请提供一种数据处理方法,所述方法包括:
客户端按照获取到的待读取数据标识在自身的临时缓存数据中查找关联匹配数据进行读取,并在未查找到关联匹配数据的情况下,根据所述待读取数据标识从多个数据存储设备中确定对应的目标存储设备,其中所述目标存储设备用于对具有该待读取数据标识所属的数据关联关系的多项数据进行存储;
所述客户端向所述目标存储设备发送针对该待读取数据标识所属的数据关联关系的数据获取请求;
所述目标存储设备根据数据存储索引列表从自身的存储数据中查找与所述数据获取请求对应的目标数据,并将查找到的所有目标数据发送给所述客户端。
在可选的实施方式中,所述根据所述待读取数据标识从多个数据存储设备中确定对应的目标存储设备的步骤,包括:
在自身缓存的数据关联信息中查找该待读取数据标识所属的数据关联关系的目标关系编号;
在查找到所述目标关系编号的情况下,根据所述目标关系编号以及数据存储设备总数确定与该目标关系编号对应的所述目标存储设备;
在未查找到所述目标关系编号的情况下,对该待读取数据标识进行解码,得到所述目标存储设备的设备标识。
在可选的实施方式中,所述数据存储索引列表包括文件空间存储信息表及交换空间存储信息表,所述数据存储设备的文件空间用于实现数据持续存储,所述数据存储设备的交换空间用于对文件空间中的至少一种数据关联关系所对应的数据进行中心缓存,所述根据数据存储索引列表从自身的存储数据中查找与所述数据获取请求对应的目标数据的步骤包括:
确定所述数据获取请求所对应的与该待读取数据标识匹配的数据关联关系的目标关系编号;
在所述交换空间存储信息表中查找所述目标关系编号;
在查找到所述目标关系编号的情况下,按照所述交换空间存储信息表中记录的与该目标关系编号对应的所有数据缓存位置信息,从所述目标存储设备的交换空间中获取位置匹配的数据作为所述目标数据;
在未查找到所述目标关系编号的情况下,从所述文件空间存储信息表中获取与该目标关系编号对应的所有数据存储位置信息,并按照所述所有数据存储位置信息从所述目标存储设备的文件空间中提取位置匹配的数据作为所述目标数据。
在可选的实施方式中,所述方法还包括:
所述客户端在获取到待存储数据的情况下,根据数据存储负载均衡策略在多个所述数据存储设备中确定匹配的期望存储设备;
所述客户端向所述期望存储设备发送包括所述待存储数据的数据写入请求;
所述期望存储设备将所述数据写入请求包括的所述待存储数据写入到自身的文件空间中进行存储,并根据自身的设备标识针对所述待存储数据编码生成对应的数据标识;
所述期望存储设备采用所述待存储数据的数据标识对自身的数据存储索引列表进行更新,并将所述待存储数据的数据标识反馈给所述客户端。
在可选的实施方式中,所述方法还包括:
所述客户端向关系管理设备发送包括待查询数据标识的关联关系查询请求;
所述关系管理设备根据所述待查询数据标识确定对应的待查询存储设备,并向所述待查询存储设备发送包括所述待查询数据标识的关系编号查询请求,其中所述待查询存储设备用于对所述待查询数据标识所对应的数据进行存储;
所述待查询存储设备按照所述待查询数据标识在自身的数据存储索引列表查找匹配的关系编号,并将对应的关系编号查找结果反馈给所述关系管理设备;
所述关系管理设备在所述关系编号查找结果表明查找成功的情况下,将所述待查询存储设备查找到的关系编号发送给所述客户端;
所述关系管理设备在所述关系编号查找结果表明查找失败的情况下,从所述待查询存储设备所匹配的至少一种数据关联关系中为所述待查询数据标识分配一个数据关联关系的关系编号,并向所述待查询存储设备发送包括所述待查询数据标识及分配到的关系编号的数据关联请求;
所述待查询存储设备按照所述数据关联请求对自身的数据存储索引列表进行更新,并向所述关系管理设备反馈对应的列表更新结果;
所述关系管理设备在所述列表更新结果表明更新成功的情况下,将分配的关系编号发送给所述客户端;
所述客户端采用所述待查询数据标识及接收到的关系编号,对自身缓存的数据关联信息进行更新。
在可选的实施方式中,所述方法还包括:
所述客户端根据待缓存关系编号从多个数据存储设备中确定匹配的缓存存储设备,并向所述缓存存储设备发送包括所述待缓存关系编号的数据缓存请求;
所述缓存存储设备根据数据存储索引列表从自身的存储数据中查找与所述数据缓存请求对应的具有与所述待缓存关系编号所对应的数据关联关系的待缓存数据,并将查找到的待缓存数据发送给所述客户端;
所述客户端采用接收到的与所述待缓存关系编号相关的待缓存数据,对自身的临时缓存数据进行更新。
在可选的实施方式中,所述根据数据存储索引列表从自身的存储数据中查找与所述数据缓存请求对应的具有与所述待缓存关系编号所对应的数据关联关系的待缓存数据的步骤,包括:
在所述数据存储索引列表包括的交换空间存储信息表中查找所述待缓存关系编号;
在查找到所述待缓存关系编号的情况下,按照所述交换空间存储信息表中记录的与该待缓存关系编号对应的所有数据缓存位置信息,从所述缓存存储设备的交换空间中获取位置匹配的数据作为所述待缓存数据;
在未查找到所述待缓存关系编号的情况下,从所述数据存储索引列表包括的文件空间存储信息表中获取与该待缓存关系编号对应的所有数据存储位置信息,并按照所述所有数据存储位置信息从所述缓存存储设备的文件空间中提取位置匹配的数据作为所述待缓存数据。
在可选的实施方式中,所述方法还包括:
每个数据存储设备根据自身所匹配的至少一种数据关联关系的访问热度分布状况,确定访问热度排名靠前的至少一种目标关联关系;
每个数据存储设备从自身的文件空间中将所述至少一种目标关联关系所对应的存储数据备份到自身的交换空间中进行覆盖式中心缓存,并对自身的数据存储索引列表中的交换空间存储信息表进行更新。
第二方面,本申请提供一种数据处理方法,应用于与客户端及关系管理设备分别通信连接的每个数据存储设备,其中每个数据存储设备用于对至少一种数据关联关系各自相关的多项数据进行存储,所述方法包括:
接收来自所述客户端的针对待读取数据标识所属的数据关联关系的数据获取请求;
根据自身的数据存储索引列表从自身的存储数据中查找具有该数据获取请求所对应的数据关联关系的所有目标数据;
将查找到的所有目标数据发送给所述客户端。
在可选的实施方式中,所述数据存储索引列表包括文件空间存储信息表及交换空间存储信息表,所述数据存储设备的文件空间用于实现数据持续存储,所述数据存储设备的交换空间用于对文件空间中的至少一种数据关联关系所对应的数据进行中心缓存,所述根据自身的数据存储索引列表从自身的存储数据中查找具有该数据获取请求所对应的数据关联关系的所有目标数据的步骤,包括:
确定所述数据获取请求所对应的与该待读取数据标识匹配的数据关联关系的目标关系编号;
在所述交换空间存储信息表中查找所述目标关系编号;
在查找到所述目标关系编号的情况下,按照所述交换空间存储信息表中记录的与该目标关系编号对应的所有数据缓存位置信息,从自身的交换空间中获取位置匹配的数据作为所述目标数据;
在未查找到所述目标关系编号的情况下,从所述文件空间存储信息表中获取与该目标关系编号对应的所有数据存储位置信息,并按照所述所有数据存储位置信息从自身的文件空间中提取位置匹配的数据作为所述目标数据。
在可选的实施方式中,所述方法还包括:
接收来自所述客户端的包括待存储数据的数据写入请求;
将所述数据写入请求包括的所述待存储数据写入到自身的文件空间中进行存储,并根据自身的设备标识针对所述待存储数据编码生成对应的数据标识;
采用所述待存储数据的数据标识对自身的数据存储索引列表进行更新,并将所述待存储数据的数据标识反馈给所述客户端。
在可选的实施方式中,所述方法还包括:
接收来自所述关系管理设备的包括待查询数据标识的关系编号查询请求,其中所述关系编号查询请求基于所述客户端向所述关系管理设备发送的关联关系查询请求生成;
按照所述待查询数据标识在自身的数据存储索引列表查找匹配的关系编号,并将对应的关系编号查找结果反馈给所述关系管理设备,其中所述关系编号查找结果在表明查找成功时包括查找到的需要由所述关系管理设备转发给所述客户端进行存储的关系编号;
接收所述关系管理设备在所述关系编号查找结果表明查找失败时发送的数据关联请求,其中所述数据关联请求包括所述待查询数据标识以及从该数据存储设备所匹配的至少一种数据关联关系中为所述待查询数据标识分配的数据关联关系的关系编号;
按照所述数据关联请求对自身的数据存储索引列表进行更新,并向所述关系管理设备反馈对应的列表更新结果,其中所述列表更新结果在表明更新成功时用于指示所述关系管理设备将分配的关系编号发送给所述客户端进行存储。
在可选的实施方式中,所述方法还包括:
接收来自所述客户端的包括待缓存关系编号的数据缓存请求;
根据数据存储索引列表从自身的存储数据中查找与所述数据缓存请求对应的具有与所述待缓存关系编号所对应的数据关联关系的待缓存数据;
将查找到的待缓存数据发送给所述客户端进行临时缓存。
在可选的实施方式中,所述根据数据存储索引列表从自身的存储数据中查找与所述数据缓存请求对应的具有与所述待缓存关系编号所对应的数据关联关系的待缓存数据的步骤,包括:
在所述数据存储索引列表包括的交换空间存储信息表中查找所述待缓存关系编号;
在查找到所述待缓存关系编号的情况下,按照所述交换空间存储信息表中记录的与该待缓存关系编号对应的所有数据缓存位置信息,从自身的交换空间中获取位置匹配的数据作为所述待缓存数据;
在未查找到所述待缓存关系编号的情况下,从所述数据存储索引列表包括的文件空间存储信息表中获取与该待缓存关系编号对应的所有数据存储位置信息,并按照所述所有数据存储位置信息从自身的文件空间中提取位置匹配的数据作为所述待缓存数据。
在可选的实施方式中,所述方法还包括:
根据自身所匹配的至少一种数据关联关系的访问热度分布状况,确定访问热度排名靠前的至少一种目标关联关系;
从自身的文件空间中将所述至少一种目标关联关系所对应的存储数据备份到自身的交换空间中进行覆盖式中心缓存,并对自身的数据存储索引列表中的交换空间存储信息表进行更新。
第三方面,本申请提供一种数据存储管理系统,所述系统包括相互通信连接的客户端、关系管理设备及多个数据存储设备,其中所述关系管理设备用于对每个数据存储设备所匹配的数据关联关系进行配置,所述数据存储设备用于对自身匹配的至少一种数据关联关系各自相关的多项数据进行存储;
所述客户端、所述关系管理设备及多个所述数据存储设备相互配合,实现前述实施方式中任意一项所述的数据处理方法;或者
每个所述数据存储设备在与所述客户端及所述关系管理设备的配合下实现前述实施方式中任意一项所述的数据处理方法。
在此情况下,本申请实施例的有益效果包括以下内容:
本申请在客户端获取到待读取数据标识后,由客户端在自身的临时缓存数据中查找存在待读取数据标识所属的数据关联关系的关联匹配数据,并在未查找到关联匹配数据的情况下,对应地从多个数据存储设备中确定出用于对具有该待读取数据标识所属的数据关联关系的多项数据进行存储的目标存储设备,而后向该目标存储设备发送针对该待读取数据标识所属的数据关联关系的数据获取请求,使该目标存储设备得以根据数据存储索引列表从自身的存储数据中查找出具有该数据获取请求所对应的数据关联关系的目标数据,并将查找到的所有目标数据发送给该客户端,从而实现对存在相同关联关系的多项数据的快速访问操作,改善关联数据访问高延时问题。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的数据存储管理系统的系统组成示意图;
图2为本申请实施例提供的第一种数据处理方法的流程示意图之一;
图3为本申请实施例提供的第一种数据处理方法的流程示意图之二;
图4为本申请实施例提供的第一种数据处理方法的流程示意图之三;
图5为本申请实施例提供的第一种数据处理方法的流程示意图之四;
图6为本申请实施例提供的第一种数据处理方法的流程示意图之五;
图7为本申请实施例提供的第二种数据处理方法的流程示意图之一;
图8为本申请实施例提供的第二种数据处理方法的流程示意图之二;
图9为本申请实施例提供的第二种数据处理方法的流程示意图之三;
图10为本申请实施例提供的第二种数据处理方法的流程示意图之四;
图11为本申请实施例提供的第二种数据处理方法的流程示意图之五。
图标:10-数据存储管理系统;11-客户端;12-关系管理设备;13-数据存储设备。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要理解的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
申请人通过辛苦调研发现,现有分布式数据存储方式在具体实现时并未考虑被存储数据之间的数据关联关系,使具有相同数据关联关系的多项数据在被存储时表现出随机分布特性,而现有分布式数据存储方式所对应的存储系统也是无法感知到被存储数据间的关联属性内容,从而导致对具有相同数据关联关系的多项数据进行访问时存在高延时问题。其中,所述数据关联关系用于描述对应的多项数据具有相同或相似特性,即所述数据关联关系可以表征对应多项数据之间的数据本源联系,例如AI(Artificial Intelligence,人工智能)应用场景中的人脸识别操作需要针对具有数据关联关系“人脸特征”的多项图片数据进行处理。
在此情况下,为实现对存在相同关联关系的多项数据的快速访问操作,改善关联数据(即具有相同关联关系的多项数据)访问高延时问题,本申请实施例通过提供一种数据处理方法及数据存储管理系统实现前述功能。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互结合。
请参照图1,图1是本申请实施例提供的数据存储管理系统10的系统组成示意图。在本申请实施例中,所述数据存储管理系统10能够对不同数据关联关系各自对应的多项数据的存储状况进行有效管理,以便于实现对存在相同关联关系的多项数据的快速访问操作,改善关联数据访问高延时问题。其中,所述数据存储管理系统10可以包括客户端11、关系管理设备12及多个数据存储设备13,所述关系管理设备12可以与每个所述数据存储设备13通信连接,所述客户端11与所述关系管理设备12通信连接,所述客户端11可以与每个所述数据存储设备13通信连接。
在本实施例中,每个所述数据存储设备13用于对自身负责的至少一种数据关联关系各自相关的多项数据进行存储,每个所述数据存储设备13所负责的数据关联关系可由所述关系管理设备12进行分配。其中,每个所述数据存储设备13可以包括数据存储单元及关系存储单元,所述数据存储单元用于对该数据存储设备13获取到的需要存储的数据进行存储,所述关系存储单元用于存储该数据存储设备13所存储的所有数据各自的存储位置信息、数据关联关系及数据大小信息等,所述数据存储设备13可通过构建数据存储索引列表对所述关系存储单元存储的各项信息进行有效记录。
在本实施例的一种实施方式中,所述数据存储设备13中数据存储单元可采用HDD(Hard Disk Drive,机械硬盘)/SSD(Solid State Drives,固态硬盘)进行构建,以提供统一的虚拟化存储空间,使该虚拟化存储空间被划分为文件空间及交换空间。其中,所述文件空间用于实现数据持续存储,可将该文件空间顺序划分为多个固定大小的文件空间块,并通过每个文件空间块对应存储至少一种数据关联关系所对应的数据;所述交换空间用于对所述文件空间中的至少一种数据关联关系所对应的数据进行中心缓存。其中所述交换空间的数据有效缓存时长远远小于所述文件空间的数据有效存储时长,所述交换空间所针对的数据关联关系可以是从对应数据存储设备13所负责的所有数据关联关系中进行周期性随机选取,也可以是周期性分组选取,还可以是根据实时访问热度排名选取。
此时,所述数据存储索引列表可以包括针对所述文件空间的文件空间存储信息表,以及针对所述交换空间的交换空间存储信息表。所述文件空间存储信息表对应记录有所述文件空间中各项存储数据的数据标识、每项存储数据所属的数据关联关系的关系编号以及每项存储数据在该文件空间中的数据存储位置信息,该文件空间存储信息表可拆分为多个信息表进行分类存储。所述交换空间存储信息表对应记录有所述交换空间中缓存的各项数据所属的数据关联关系的关系编号以及每项数据在该交换空间中的数据缓存位置信息。其中,所述数据标识用于表示对应数据的身份信息,其可基于该数据所在数据存储设备13的设备标识编码得到;所述关系编号用于表示对应数据关联关系在所述关系管理设备12分配到的身份标识,其数值从0开始计数。
在本实施例中,每个所述数据存储设备13还可以包括状态监测单元,所述状态监测单元用于对所属数据存储设备13的存储资源信息及运行状态信息进行监测,并将监测到的设备信息(包括存储资源信息及运行状态信息)实时或周期地上传给所述关系管理设备12,由所述关系管理设备12根据所有数据存储设备13各自的设备信息对这些数据存储设备13进行数据存储负载均衡调度操作。所述关系管理设备12还可在针对不同数据关联关系分配对应的关系编号后,针对每个数据关联关系,将该数据关联关系的关系编号与所述数据存储设备13的总数进行求余运算,并将该数据关联关系分配给计算出的余数所对应的数据存储设备13,以便于对应数据存储设备13对自身分配到的数据关联关系相关的多项数据进行存储。其中,所述关系管理设备12的具体功能可由多个电子设备通过集群方式配合实现,也可单独由一个电子设备进行功能实现。
在本实施例中,所述关系管理设备12可向所述客户端11实时或周期地反馈存储设备信息列表,其中所述存储设备信息列表用于记录所述关系管理设备12能够调度的多个数据存储设备13各自的设备标识,以及各数据存储设备13的设备信息。所述客户端11可基于获取到的存储设备信息列表为需要存储的数据选取一个合适的数据存储设备13进行数据存储,以尽量实现数据存储负载均衡效果。
在本实施例中,所述客户端11可相应地从各数据存储设备13获取某些已存储数据的数据标识与所属数据关联关系的关系编号,并在自身缓存的数据关联信息中将相互对应的数据标识及关系编号进行添加操作,实现对该数据关联信息的更新操作。所述客户端11也可相应地从各数据存储设备13获取至少一种数据关联关系各自对应的多项数据进行临时缓存,得到对应的临时缓存数据,以便于实现客户端11直接基于自身临时缓存数据对具有特定数据关联关系的多项数据进行快速访问。其中,所述客户端11处的临时缓存数据的数据有效缓存时长小于各数据存储设备13的交换空间的数据有效缓存时长。
由此,本申请可通过所述客户端11、所述关系管理设备12及多个所述数据存储设备13相互配合,将大量数据按照数据关联关系进行分布式存储,并相应地依据数据关联关系实现临时缓存、中心缓存及持续存储三级分层存储模式,以便于实现对存在相同关联关系的多项数据的快速访问操作,改善关联数据访问高延时问题。
可以理解的是,图1所示的框图仅为所述数据存储管理系统10的一种组成示意图,所述数据存储管理系统10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
在本申请中,为确保所述数据存储管理系统10能够实现对存在相同关联关系的多项数据的快速访问操作,改善关联数据访问高延时问题,本申请实施例通过提供一种应用于该数据存储管理系统10的数据处理方法实现前述功能,下面对提供的该数据处理方法进行详细阐述。
请参照图2,图2是本申请实施例提供的第一种数据处理方法的流程示意图之一。在本申请实施例中,所述第一种数据处理方法可以包括步骤S210~步骤S230。
步骤S210,客户端按照获取到的待读取数据标识在自身的临时缓存数据中查找关联匹配数据进行读取,并在未查找到关联匹配数据的情况下,根据待读取数据标识从多个数据存储设备中确定对应的目标存储设备。
在本实施例中,当客户端11接收到来自用户的针对某个待读取数据的关联数据访问指令后,会对该关联数据访问指令进行解析,得到对应的待读取数据标识(即待读取数据的数据标识),而后该客户端11会相应地在自身的临时缓存数据中查找具有该待读取数据标识的数据。
若查找到具有该待读取数据标识的数据,则表明所述临时缓存数据中包括有存在该待读取数据标识所属的数据关联关系的多项数据(即与该待读取数据标识对应的关联匹配数据),此时该客户端11即可基于所述关联匹配数据完成对存在相同关联关系的多项数据的快速访问操作。
若未查找到具有该待读取数据标识的数据,则表明所述临时缓存数据中并未存在对应的关联匹配数据,此时该客户端11需要通过基于该待读取数据标识从多个所述数据存储设备13中确定出对应的目标存储设备,以向该目标存储设备获取具有该待读取数据标识所属的数据关联关系的数据进行访问。其中,所述目标存储设备用于对具有该待读取数据标识所属的数据关联关系的多项数据进行存储。
可选地,在本实施例的一种实施方式中,为精准确定负责该读取数据标识所属的数据关联关系的数据存储设备13,所述根据待读取数据标识从多个数据存储设备中确定对应的目标存储设备的步骤,可以包括:
在自身缓存的数据关联信息中查找该待读取数据标识所属的数据关联关系的目标关系编号;
在查找到所述目标关系编号的情况下,根据目标关系编号以及数据存储设备总数确定与该目标关系编号对应的目标存储设备;
在未查找到所述目标关系编号的情况下,对该待读取数据标识进行解码,得到目标存储设备的设备标识。
其中,所述客户端11可通过将目标关系编号与数据存储设备总数进行求余运算,以根据计算出的余数确定出与该目标关系编号对应的目标存储设备。
步骤S220,客户端向目标存储设备发送针对该待读取数据标识所属的数据关联关系的数据获取请求。
在本实施例中,所述数据获取请求用于请求获取具有对应待读取数据标识所属的数据关联关系的多项数据,所述数据获取请求可包括该待读取数据标识和/或该待读取数据标识所属的数据关联关系的目标关系编号。在本实施例的一种实施方式中,若所述客户端11未在自身缓存的数据关联信息中查找到待读取数据标识所属的数据关联关系的目标关系编号,则所述数据获取请求将仅包括该待读取数据标识,否则所述数据获取请求将至少包括该待读取数据标识所属的数据关联关系的目标关系编号。
步骤S230,目标存储设备根据数据存储索引列表从自身的存储数据中查找与数据获取请求对应的目标数据,并将查找到的所有目标数据发送给客户端。
在本实施例中,当某个数据存储设备13在作为目标存储设备的情况下接收到所述数据获取请求后,会相应地在自身的数据存储索引列表中查询存在该数据获取请求所对应的数据关联关系的目标数据的存储位置信息,而后基于查询到的存储位置信息读取对应的目标数据转发给所述客户端11,从而实现对存在相同关联关系的多项数据的快速访问操作,改善关联数据访问高延时问题。
可选地,在本实施例的一种实施方式中,所述根据数据存储索引列表从自身的存储数据中查找与数据获取请求对应的目标数据的步骤,可以包括:
确定数据获取请求所对应的与该待读取数据标识匹配的数据关联关系的目标关系编号;
在数据存储索引列表包括的交换空间存储信息表中查找目标关系编号;
在查找到目标关系编号的情况下,按照交换空间存储信息表中记录的与该目标关系编号对应的所有数据缓存位置信息,从目标存储设备的交换空间中获取位置匹配的数据作为目标数据;
在未查找到目标关系编号的情况下,从数据存储索引列表包括的文件空间存储信息表中获取与该目标关系编号对应的所有数据存储位置信息,并按照所有数据存储位置信息从目标存储设备的文件空间中提取位置匹配的数据作为目标数据。
其中,若所述数据获取请求仅包括待读取数据标识,可通过在所述文件空间存储信息表中进行关系编号查询操作,得到与该待读取数据标识匹配的数据关联关系的目标关系编号。本申请可通过优先在集中缓存有相同关联关系的多项数据的交换空间中进行数据查找的方式,在一定程度上提升关联数据访问速率,改善关联数据访问高延时问题。
由此,本申请可通过执行上述步骤S210~步骤S230,实现对存在相同关联关系的多项数据的快速访问操作,改善关联数据访问高延时问题。
可选地,请参照图3,图3是本申请实施例提供的第一种数据处理方法的流程示意图之二。在本申请实施例中,为确保所述数据存储管理系统10能够实现数据分布式存储功能,所述第一种数据处理方法还可以包括步骤S240~步骤S270。
步骤S240,客户端在获取到待存储数据的情况下,根据数据存储负载均衡策略在多个数据存储设备中确定匹配的期望存储设备。
在本实施例中,当客户端11获取到待存储数据后,会根据从所述关系管理设备12获取到的存储设备信息列表所记录的各数据存储设备13的设备信息,按照数据存储负载均衡策略从多个数据存储设备13中选取一个合适的数据存储设备13作为期望存储设备,以通过该期望存储设备对该待存储数据进行数据存储,从而尽量实现数据存储负载均衡效果。
步骤S250,客户端向期望存储设备发送包括待存储数据的数据写入请求。
步骤S260,期望存储设备将数据写入请求包括的待存储数据写入到自身的文件空间中进行存储,并根据自身的设备标识针对待存储数据编码生成对应的数据标识。
步骤S270,期望存储设备采用待存储数据的数据标识对自身的数据存储索引列表进行更新,并将待存储数据的数据标识反馈给客户端。
在本实施例中,当数据存储设备13作为期望存储设备完成对待存储数据的写入存储操作(即将数据写入到文件空间中进行存储的操作),且针对该待存储数据生成匹配的数据标识后,可在该期望存储设备的数据存储索引列表所包括的文件空间存储信息表中对该待存储数据的数据标识及在文件空间中的数据存储位置信息进行记录。
由此,本申请可通过执行上述步骤S240~步骤S270,确保所述数据存储管理系统10能够实现数据分布式存储功能。
可选地,请参照图4,图4是本申请实施例提供的第一种数据处理方法的流程示意图之三。在本申请实施例中,为确保客户端11能够有效地缓存在每个已存储数据在所述数据存储管理系统10处所属的数据关联关系,所述第一种数据处理方法还可以包括步骤S280~步骤S350。
步骤S280,客户端向关系管理设备发送包括待查询数据标识的关联关系查询请求。
在本实施例中,所述待查询数据标识用于表示需要查询所属数据关联关系的已存储数据的数据标识。
步骤S290,关系管理设备根据待查询数据标识确定对应的待查询存储设备,并向待查询存储设备发送包括待查询数据标识的关系编号查询请求。
在本实施例中,所述关系管理设备12可通过对接收到的关联关系查询请求中的待查询数据标识进行解码,得到对应的待查询存储设备(即具有该待查询数据标识的已存储数据所在的数据存储设备13)的设备标识,而后向该待查询存储设备发送包括待查询数据标识的关系编号查询请求,其中所述关系编号查询请求用于查询该待查询数据标识所属的数据关联关系的关系编号。
步骤S300,待查询存储设备按照待查询数据标识在自身的数据存储索引列表查找匹配的关系编号,并将对应的关系编号查找结果反馈给关系管理设备。
在本实施例中,当每个数据存储设备13作为待查询存储设备接收到所述关系编号查询请求时,可通过在自身的数据存储索引列表包括的文件空间存储信息表中查找与该待查询数据标识对应的数据关联关系的关系编号,而后向该关系管理设备12反馈具体的关系编号查找结果。
步骤S310,关系管理设备在关系编号查找结果表明查找成功的情况下,将待查询存储设备查找到的关系编号发送给客户端。
在本实施例中,若所述待查询存储设备查找到与待查询数据标识对应的数据关联关系的关系编号,则发送给所述关系管理设备12的关系编号查找结果将对应包括查找到的关系编号,否则发送给所述关系管理设备12的关系编号查找结果将不包括有关系编号。所述关系管理设备12可通过对接收到的关系编号查找结果进行解析,并根据该关系编号查找结果中是否存在关系编号,确定所述待查询存储设备是否查找成功。
若所述关系编号查找结果表明查找成功,则所述关系管理设备12会直接将该关系编号查找结果包括的关系编号发送给所述客户端11,以便于该客户端11在自身缓存的数据关联信息中对待查询数据标识及匹配的数据关联关系的关系编号进行记录。
步骤S320,关系管理设备在关系编号查找结果表明查找失败的情况下,从待查询存储设备所匹配的至少一种数据关联关系中为待查询数据标识分配一个数据关联关系的关系编号,并向待查询存储设备发送包括待查询数据标识及分配到的关系编号的数据关联请求。
在本实施例中,若所述关系编号查找结果表明查找失败,即可表明所述待查询存储设备中仅记录有待查询数据标识,尚未确定出该待查询数据标识所属的数据关联关系,此时所述关系管理设备12可根据该待查询存储设备所匹配的至少一种数据关联关系,为该待查询数据标识分配一个数据关联关系的关系编号。其中,所述数据关联请求用于请求对应数据存储设备13将自身已存储数据与自身负责的某一种数据关联关系进行绑定。
步骤S330,待查询存储设备按照数据关联请求对自身的数据存储索引列表进行更新,并向关系管理设备反馈对应的列表更新结果。
在本实施例中,当某个数据存储设备13获得数据关联请求后,会在自身的数据存储索引列表包括的文件空间存储信息表中,为待查询数据标识绑定该数据关联请求包括的关系编号,而后向该关系管理设备12反馈对应的列表更新结果。其中,若该数据存储设备13的交换空间当前能够缓存具有该数据关联请求包括的关系编号的数据关联关系的数据,则该数据存储设备13会在自身的交换空间中对该待查询数据标识所对应的已存储数据进行缓存,并同步地采用所述待查询数据标识对所述交换空间存储信息表进行更新。由此,本申请可通过执行所述步骤S320及步骤S330,确保每个数据存储设备13所存储的数据均能归属在某个数据关联关系下。
步骤S340,关系管理设备在列表更新结果表明更新成功的情况下,将分配的关系编号发送给客户端。
步骤S350,客户端采用待查询数据标识及接收到的关系编号,对自身缓存的数据关联信息进行更新。
在本实施例中,所述客户端11在通过所述关系管理设备12获取到待查询数据标识所属的数据关联关系的关系编号后,会相应地在自身缓存的数据关联信息中对待查询数据标识及匹配的数据关联关系的关系编号进行记录,以便于上述步骤S210的有效执行,提升关联数据访问效率。
由此,本申请可通过执行上述步骤S280~步骤S350,确保客户端11能够有效地缓存在每个已存储数据在所述数据存储管理系统10处所属的数据关联关系,以提升关联数据访问效率。
可选地,请参照图5,图5是本申请实施例提供的第一种数据处理方法的流程示意图之四。在本申请实施例中,为确保所述客户端11能够对部分数据关联关系各自相关的多项数据进行临时缓存,便于实现关联数据快速访问操作,所述第一种数据处理方法还可以包括步骤S360~步骤S380。
步骤S360,客户端根据待缓存关系编号从多个数据存储设备中确定匹配的缓存存储设备,并向缓存存储设备发送包括待缓存关系编号的数据缓存请求。
在本实施例中,所述待缓存关系编号用于表示需要进行临时缓存的多项数据共同具有的数据关联关系的关系编号,所述缓存存储设备用于表示负责所述待缓存关系编号所对应的数据关联关系的数据存储设备13,所述数据缓存请求用于向对应数据存储设备13请求对具有某种数据关联关系的已存储数据进行临时缓存。
步骤S370,缓存存储设备根据数据存储索引列表从自身的存储数据中查找与数据缓存请求对应的具有与待缓存关系编号所对应的数据关联关系的待缓存数据,并将查找到的待缓存数据发送给客户端。
在本实施例中,所述待缓存数据用于表示所述客户端11需要临时缓存的数据。当某个数据存储设备13作为缓存存储设备执行步骤S370,可参照上述步骤S230的具体执行过程执行所述步骤S370,此时所述根据数据存储索引列表从自身的存储数据中查找与数据缓存请求对应的具有与待缓存关系编号所对应的数据关联关系的待缓存数据的步骤,可以包括:
在数据存储索引列表包括的交换空间存储信息表中查找待缓存关系编号;
在查找到待缓存关系编号的情况下,按照交换空间存储信息表中记录的与该待缓存关系编号对应的所有数据缓存位置信息,从缓存存储设备的交换空间中获取位置匹配的数据作为所述待缓存数据;
在未查找到待缓存关系编号的情况下,从数据存储索引列表包括的文件空间存储信息表中获取与该待缓存关系编号对应的所有数据存储位置信息,并按照所有数据存储位置信息从缓存存储设备的文件空间中提取位置匹配的数据作为待缓存数据。
步骤S380,客户端采用接收到的与待缓存关系编号相关的待缓存数据,对自身的临时缓存数据进行更新。
由此,本申请可通过执行上述步骤S360~步骤S380,确保所述客户端11能够对部分数据关联关系各自相关的多项数据进行临时缓存,便于实现关联数据快速访问操作,改善关联数据访问高延时问题。
可选地,请参照图6,图6是本申请实施例提供的第一种数据处理方法的流程示意图之五。在本申请实施例中,为实现所述数据存储管理系统10的热点关联数据快速访问效果,所述第一种数据处理方法还可以包括步骤S390及步骤S400。
步骤S390,每个数据存储设备根据自身所匹配的至少一种数据关联关系的访问热度分布状况,确定访问热度排名靠前的至少一种目标关联关系。
在本实施例中,每个数据存储设备13均可构建一个用于表征自身负责的所有数据关联关系各自的访问热度分布状况的关联关系访问次数表,并根据该关联关系访问次数表确定该数据存储设备13所负责的数据关联关系的访问热度排名结果,而后从该访问热度排名结果中选取排名靠前的至少一种数据关联关系,作为该数据存储设备13当前的用于表征热点的目标关联关系。
步骤S400,每个数据存储设备从自身的文件空间中将至少一种目标关联关系所对应的存储数据备份到自身的交换空间中进行覆盖式中心缓存,并对自身的数据存储索引列表中的交换空间存储信息表进行更新。
在本实施例中,当所述数据存储设备13确定出自身当前对应的目标关联关系后,会相应地从文件空间中将该目标关联关系所对应的存储数据备份到交换空间中进行覆盖式中心缓存,使交换空间中缓存的数据即为热点关联数据,同时也会清空当前交换空间存储信息表,接着在该交换空间存储信息表中添加目标关联关系所对应的已存储数据的数据标识,以及这些已存储数据在交换空间中的数据缓存位置信息,从而使数据存储管理系统10在面对热度数据访问场景下能够实现热点关联数据快速访问效果。
由此,本申请可通过执行上述步骤S390及步骤S400,使数据存储管理系统10在面对热度数据访问场景下能够实现热点关联数据快速访问效果。
在本申请中,为确保所述数据存储管理系统10中的每个数据存储设备13能够在所述关系管理设备12及所述客户端11的配合下,实现对存在相同关联关系的多项数据的快速访问操作,达到改善关联数据访问高延时问题的效果,本申请实施例通过提供一种应用于所述数据存储设备13的数据处理方法实现前述功能,下面对提供的该数据处理方法进行详细阐述。
请参照图7,图7是本申请实施例提供的第二种数据处理方法的流程示意图之一。在本申请实施例中,所述第二种数据处理方法可以包括步骤S410~步骤S430。
步骤S410,接收来自客户端的针对待读取数据标识所属的数据关联关系的数据获取请求。
步骤S420,根据自身的数据存储索引列表从自身的存储数据中查找具有该数据获取请求所对应的数据关联关系的所有目标数据。
其中,所述根据自身的数据存储索引列表从自身的存储数据中查找具有该数据获取请求所对应的数据关联关系的所有目标数据的步骤,可以包括:
确定数据获取请求所对应的与该待读取数据标识匹配的数据关联关系的目标关系编号;
在数据存储索引列表包括的交换空间存储信息表中查找目标关系编号;
在查找到目标关系编号的情况下,按照交换空间存储信息表中记录的与该目标关系编号对应的所有数据缓存位置信息,从自身的交换空间中获取位置匹配的数据作为目标数据;
在未查找到目标关系编号的情况下,从数据存储索引列表包括的文件空间存储信息表中获取与该目标关系编号对应的所有数据存储位置信息,并按照所有数据存储位置信息从自身的文件空间中提取位置匹配的数据作为目标数据。
步骤S430,将查找到的所有目标数据发送给客户端。
其中,所述步骤S410~步骤S430的具体执行过程可参照上文中对步骤S220及步骤S230的详细描述,在此就不再一一赘述了。
由此,本申请可通过执行上述步骤S410~步骤S430,确保所述数据存储设备13能够配合所述客户端11实现对存在相同关联关系的多项数据的快速访问操作,改善关联数据访问高延时问题。
可选地,请参照图8,图8是本申请实施例提供的第二种数据处理方法的流程示意图之二。在本申请实施例中,为确保单个所述数据存储设备13能够实现数据存储功能,所述第二种数据处理方法还可以包括步骤S440~步骤S460。
步骤S440,接收来自客户端的包括待存储数据的数据写入请求。
步骤S450,将,数据写入请求包括的待存储数据写入到自身的文件空间中进行存储,并根据自身的设备标识针对待存储数据编码生成对应的数据标识。
步骤S450采用待存储数据的数据标识对自身的数据存储索引列表进行更新,并将待存储数据的数据标识反馈给客户端。其中,可通过在数据存储索引列表所包括的文件空间存储信息表中对该待存储数据的数据标识及在文件空间中的数据存储位置信息进行记录,完成对所述数据存储索引列表的更新操作。
由此,本申请可通过执行上述步骤S440~步骤S460,确保单个所述数据存储设备13能够实现数据存储功能。
可选地,请参照图9,图9是本申请实施例提供的第二种数据处理方法的流程示意图之三。在本申请实施例中,为确保每个所述数据存储设备13能够向客户端11告知已存储数据在所述数据存储管理系统10处所属的数据关联关系,以便于客户端11对已存储数据所属的数据关联关系进行有效缓存,所述第二种数据处理方法还可以包括步骤S470~步骤S500。
步骤S470,接收来自关系管理设备的包括待查询数据标识的关系编号查询请求。
其中,所述关系编号查询请求由所述关系管理设备12基于所述客户端11向该关系管理设备12发送的关联关系查询请求生成,所述关联关系查询请求包括有所述待查询数据标识。
步骤S480,按照待查询数据标识在自身的数据存储索引列表查找匹配的关系编号,并将对应的关系编号查找结果反馈给关系管理设备。
其中,若所述数据存储设备13查找到与待查询数据标识对应的数据关联关系的关系编号,则发送给所述关系管理设备12的关系编号查找结果将对应包括查找到的关系编号,否则发送给所述关系管理设备12的关系编号查找结果将不包括有关系编号。其中,所述关系编号查找结果在表明查找成功时包括的关系编号需要由所述关系管理设备12转发给所述客户端11进行存储。
步骤S490,接收关系管理设备在关系编号查找结果表明查找失败时发送的数据关联请求。
其中,所述数据关联请求包括所述待查询数据标识以及从该数据存储设备13所匹配的至少一种数据关联关系中为所述待查询数据标识分配的数据关联关系的关系编号。
步骤S500,按照数据关联请求对自身的数据存储索引列表进行更新,并向关系管理设备反馈对应的列表更新结果。
其中,当数据存储设备13获得数据关联请求后,会在自身的数据存储索引列表包括的文件空间存储信息表中,为待查询数据标识绑定该数据关联请求包括的关系编号,而后向该关系管理设备12反馈对应的列表更新结果。若该数据存储设备13的交换空间当前能够缓存具有该数据关联请求包括的关系编号的数据关联关系的数据,则该数据存储设备13会在自身的交换空间中对该待查询数据标识所对应的已存储数据进行缓存,并同步地采用所述待查询数据标识对所述交换空间存储信息表进行更新。由此,本申请可通过执行所述步骤S490及步骤S500,确保每个数据存储设备13所存储的数据均能归属在某个数据关联关系下。
若所述列表更新结果表明更新成功,则所述列表更新结果用于指示所述关系管理设备12将分配的关系编号发送给所述客户端11进行存储。所述客户端11在通过所述关系管理设备12获取到待查询数据标识所属的数据关联关系的关系编号后,会相应地在自身缓存的数据关联信息中对待查询数据标识及匹配的数据关联关系的关系编号进行记录,以便于上述步骤S210的有效执行,提升关联数据访问效率。
由此,本申请可通过执行上述步骤S470~步骤S500,确保每个所述数据存储设备13能够向客户端11告知已存储数据在所述数据存储管理系统10处所属的数据关联关系,便于客户端11对已存储数据所属的数据关联关系进行有效缓存,以提升关联数据访问效率。
可选地,请参照图10,图10是本申请实施例提供的第二种数据处理方法的流程示意图之四。在本申请实施例中,为实现所述客户端11对部分数据关联关系各自相关的多项数据的临时缓存作业,便于实现关联数据快速访问操作,所述第二种数据处理方法还可以包括步骤S510~步骤S530。
步骤S510,接收来自客户端的包括待缓存关系编号的数据缓存请求。
步骤S520,根据数据存储索引列表从自身的存储数据中查找与数据缓存请求对应的具有与待缓存关系编号所对应的数据关联关系的待缓存数据。
其中,所述根据数据存储索引列表从自身的存储数据中查找与数据缓存请求对应的具有与待缓存关系编号所对应的数据关联关系的待缓存数据的步骤,可以包括:
在数据存储索引列表包括的交换空间存储信息表中查找待缓存关系编号;
在查找到待缓存关系编号的情况下,按照交换空间存储信息表中记录的与该待缓存关系编号对应的所有数据缓存位置信息,从自身的交换空间中获取位置匹配的数据作为待缓存数据;
在未查找到待缓存关系编号的情况下,从数据存储索引列表包括的文件空间存储信息表中获取与该待缓存关系编号对应的所有数据存储位置信息,并按照所有数据存储位置信息从自身的文件空间中提取位置匹配的数据作为待缓存数据。
步骤S530,将查找到的待缓存数据发送给客户端进行临时缓存。
由此,本申请可通过执行上述步骤S510~步骤S530,实现所述客户端11对部分数据关联关系各自相关的多项数据的临时缓存作业,便于实现关联数据快速访问操作。
可选地,请参照图11,图11是本申请实施例提供的第二种数据处理方法的流程示意图之五。在本申请实施例中,为实现热点关联数据快速访问效果,所述第二种数据处理方法还可以包括步骤S540及步骤S550。
步骤S540,根据自身所匹配的至少一种数据关联关系的访问热度分布状况,确定访问热度排名靠前的至少一种目标关联关系。
步骤S550,从自身的文件空间中将所述至少一种目标关联关系所对应的存储数据备份到自身的交换空间中进行覆盖式中心缓存,并对自身的数据存储索引列表中的交换空间存储信息表进行更新。
其中,所述步骤S540~步骤S550的具体执行过程可参照上文中对步骤S390及步骤S400的详细描述,在此就不再一一赘述了。
由此,本申请可通过执行上述步骤S540及步骤S550,在数据存储管理系统10面对热度数据访问场景的情况下,实现热点关联数据快速访问效果。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,在本申请提供的数据处理方法及数据存储管理系统中,本申请在客户端获取到待读取数据标识后,由客户端在自身的临时缓存数据中查找存在待读取数据标识所属的数据关联关系的关联匹配数据,并在未查找到关联匹配数据的情况下,对应地从多个数据存储设备中确定出用于对具有该待读取数据标识所属的数据关联关系的多项数据进行存储的目标存储设备,而后向该目标存储设备发送针对该待读取数据标识所属的数据关联关系的数据获取请求,使该目标存储设备得以根据数据存储索引列表从自身的存储数据中查找出具有该数据获取请求所对应的数据关联关系的目标数据,并将查找到的所有目标数据发送给该客户端,从而实现对存在相同关联关系的多项数据的快速访问操作,改善关联数据访问高延时问题。
以上所述,仅为本申请的各种实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应当以权利要求的保护范围为准。

Claims (16)

1.一种数据处理方法,其特征在于,所述方法包括:
客户端按照获取到的待读取数据标识在自身的临时缓存数据中查找关联匹配数据进行读取,并在未查找到关联匹配数据的情况下,根据所述待读取数据标识从多个数据存储设备中确定对应的目标存储设备,其中所述目标存储设备用于对具有该待读取数据标识所属的数据关联关系的多项数据进行存储;
所述客户端向所述目标存储设备发送针对该待读取数据标识所属的数据关联关系的数据获取请求;
所述目标存储设备根据数据存储索引列表从自身的存储数据中查找与所述数据获取请求对应的目标数据,并将查找到的所有目标数据发送给所述客户端。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待读取数据标识从多个数据存储设备中确定对应的目标存储设备的步骤,包括:
在自身缓存的数据关联信息中查找该待读取数据标识所属的数据关联关系的目标关系编号;
在查找到所述目标关系编号的情况下,根据所述目标关系编号以及数据存储设备总数确定与该目标关系编号对应的所述目标存储设备;
在未查找到所述目标关系编号的情况下,对该待读取数据标识进行解码,得到所述目标存储设备的设备标识。
3.根据权利要求1所述的方法,其特征在于,所述数据存储索引列表包括文件空间存储信息表及交换空间存储信息表,所述数据存储设备的文件空间用于实现数据持续存储,所述数据存储设备的交换空间用于对文件空间中的至少一种数据关联关系所对应的数据进行中心缓存,所述根据数据存储索引列表从自身的存储数据中查找与所述数据获取请求对应的目标数据的步骤包括:
确定所述数据获取请求所对应的与该待读取数据标识匹配的数据关联关系的目标关系编号;
在所述交换空间存储信息表中查找所述目标关系编号;
在查找到所述目标关系编号的情况下,按照所述交换空间存储信息表中记录的与该目标关系编号对应的所有数据缓存位置信息,从所述目标存储设备的交换空间中获取位置匹配的数据作为所述目标数据;
在未查找到所述目标关系编号的情况下,从所述文件空间存储信息表中获取与该目标关系编号对应的所有数据存储位置信息,并按照所述所有数据存储位置信息从所述目标存储设备的文件空间中提取位置匹配的数据作为所述目标数据。
4.根据权利要求1-3中任意一项所述的方法,其特征在于,所述方法还包括:
所述客户端在获取到待存储数据的情况下,根据数据存储负载均衡策略在多个所述数据存储设备中确定匹配的期望存储设备;
所述客户端向所述期望存储设备发送包括所述待存储数据的数据写入请求;
所述期望存储设备将所述数据写入请求包括的所述待存储数据写入到自身的文件空间中进行存储,并根据自身的设备标识针对所述待存储数据编码生成对应的数据标识;
所述期望存储设备采用所述待存储数据的数据标识对自身的数据存储索引列表进行更新,并将所述待存储数据的数据标识反馈给所述客户端。
5.根据权利要求1-3中任意一项所述的方法,其特征在于,所述方法还包括:
所述客户端向关系管理设备发送包括待查询数据标识的关联关系查询请求;
所述关系管理设备根据所述待查询数据标识确定对应的待查询存储设备,并向所述待查询存储设备发送包括所述待查询数据标识的关系编号查询请求,其中所述待查询存储设备用于对所述待查询数据标识所对应的数据进行存储;
所述待查询存储设备按照所述待查询数据标识在自身的数据存储索引列表查找匹配的关系编号,并将对应的关系编号查找结果反馈给所述关系管理设备;
所述关系管理设备在所述关系编号查找结果表明查找成功的情况下,将所述待查询存储设备查找到的关系编号发送给所述客户端;
所述关系管理设备在所述关系编号查找结果表明查找失败的情况下,从所述待查询存储设备所匹配的至少一种数据关联关系中为所述待查询数据标识分配一个数据关联关系的关系编号,并向所述待查询存储设备发送包括所述待查询数据标识及分配到的关系编号的数据关联请求;
所述待查询存储设备按照所述数据关联请求对自身的数据存储索引列表进行更新,并向所述关系管理设备反馈对应的列表更新结果;
所述关系管理设备在所述列表更新结果表明更新成功的情况下,将分配的关系编号发送给所述客户端;
所述客户端采用所述待查询数据标识及接收到的关系编号,对自身缓存的数据关联信息进行更新。
6.根据权利要求1-3中任意一项所述的方法,其特征在于,所述方法还包括:
所述客户端根据待缓存关系编号从多个数据存储设备中确定匹配的缓存存储设备,并向所述缓存存储设备发送包括所述待缓存关系编号的数据缓存请求;
所述缓存存储设备根据数据存储索引列表从自身的存储数据中查找与所述数据缓存请求对应的具有与所述待缓存关系编号所对应的数据关联关系的待缓存数据,并将查找到的待缓存数据发送给所述客户端;
所述客户端采用接收到的与所述待缓存关系编号相关的待缓存数据,对自身的临时缓存数据进行更新。
7.根据权利要求6所述的方法,其特征在于,所述根据数据存储索引列表从自身的存储数据中查找与所述数据缓存请求对应的具有与所述待缓存关系编号所对应的数据关联关系的待缓存数据的步骤,包括:
在所述数据存储索引列表包括的交换空间存储信息表中查找所述待缓存关系编号;
在查找到所述待缓存关系编号的情况下,按照所述交换空间存储信息表中记录的与该待缓存关系编号对应的所有数据缓存位置信息,从所述缓存存储设备的交换空间中获取位置匹配的数据作为所述待缓存数据;
在未查找到所述待缓存关系编号的情况下,从所述数据存储索引列表包括的文件空间存储信息表中获取与该待缓存关系编号对应的所有数据存储位置信息,并按照所述所有数据存储位置信息从所述缓存存储设备的文件空间中提取位置匹配的数据作为所述待缓存数据。
8.根据权利要求1-3中任意一项所述的方法,其特征在于,所述方法还包括:
每个数据存储设备根据自身所匹配的至少一种数据关联关系的访问热度分布状况,确定访问热度排名靠前的至少一种目标关联关系;
每个数据存储设备从自身的文件空间中将所述至少一种目标关联关系所对应的存储数据备份到自身的交换空间中进行覆盖式中心缓存,并对自身的数据存储索引列表中的交换空间存储信息表进行更新。
9.一种数据处理方法,其特征在于,应用于与客户端及关系管理设备分别通信连接的每个数据存储设备,其中每个数据存储设备用于对至少一种数据关联关系各自相关的多项数据进行存储,所述方法包括:
接收来自所述客户端的针对待读取数据标识所属的数据关联关系的数据获取请求;
根据自身的数据存储索引列表从自身的存储数据中查找具有该数据获取请求所对应的数据关联关系的所有目标数据;
将查找到的所有目标数据发送给所述客户端。
10.根据权利要求9所述的方法,其特征在于,所述数据存储索引列表包括文件空间存储信息表及交换空间存储信息表,所述数据存储设备的文件空间用于实现数据持续存储,所述数据存储设备的交换空间用于对文件空间中的至少一种数据关联关系所对应的数据进行中心缓存,所述根据自身的数据存储索引列表从自身的存储数据中查找具有该数据获取请求所对应的数据关联关系的所有目标数据的步骤,包括:
确定所述数据获取请求所对应的与该待读取数据标识匹配的数据关联关系的目标关系编号;
在所述交换空间存储信息表中查找所述目标关系编号;
在查找到所述目标关系编号的情况下,按照所述交换空间存储信息表中记录的与该目标关系编号对应的所有数据缓存位置信息,从自身的交换空间中获取位置匹配的数据作为所述目标数据;
在未查找到所述目标关系编号的情况下,从所述文件空间存储信息表中获取与该目标关系编号对应的所有数据存储位置信息,并按照所述所有数据存储位置信息从自身的文件空间中提取位置匹配的数据作为所述目标数据。
11.根据权利要求9或10所述的方法,其特征在于,所述方法还包括:
接收来自所述客户端的包括待存储数据的数据写入请求;
将所述数据写入请求包括的所述待存储数据写入到自身的文件空间中进行存储,并根据自身的设备标识针对所述待存储数据编码生成对应的数据标识;
采用所述待存储数据的数据标识对自身的数据存储索引列表进行更新,并将所述待存储数据的数据标识反馈给所述客户端。
12.根据权利要求9或10所述的方法,其特征在于,所述方法还包括:
接收来自所述关系管理设备的包括待查询数据标识的关系编号查询请求,其中所述关系编号查询请求基于所述客户端向所述关系管理设备发送的关联关系查询请求生成;
按照所述待查询数据标识在自身的数据存储索引列表查找匹配的关系编号,并将对应的关系编号查找结果反馈给所述关系管理设备,其中所述关系编号查找结果在表明查找成功时包括查找到的需要由所述关系管理设备转发给所述客户端进行存储的关系编号;
接收所述关系管理设备在所述关系编号查找结果表明查找失败时发送的数据关联请求,其中所述数据关联请求包括所述待查询数据标识以及从该数据存储设备所匹配的至少一种数据关联关系中为所述待查询数据标识分配的数据关联关系的关系编号;
按照所述数据关联请求对自身的数据存储索引列表进行更新,并向所述关系管理设备反馈对应的列表更新结果,其中所述列表更新结果在表明更新成功时用于指示所述关系管理设备将分配的关系编号发送给所述客户端进行存储。
13.根据权利要求9或10所述的方法,其特征在于,所述方法还包括:
接收来自所述客户端的包括待缓存关系编号的数据缓存请求;
根据数据存储索引列表从自身的存储数据中查找与所述数据缓存请求对应的具有与所述待缓存关系编号所对应的数据关联关系的待缓存数据;
将查找到的待缓存数据发送给所述客户端进行临时缓存。
14.根据权利要求13所述的方法,其特征在于,所述根据数据存储索引列表从自身的存储数据中查找与所述数据缓存请求对应的具有与所述待缓存关系编号所对应的数据关联关系的待缓存数据的步骤,包括:
在所述数据存储索引列表包括的交换空间存储信息表中查找所述待缓存关系编号;
在查找到所述待缓存关系编号的情况下,按照所述交换空间存储信息表中记录的与该待缓存关系编号对应的所有数据缓存位置信息,从自身的交换空间中获取位置匹配的数据作为所述待缓存数据;
在未查找到所述待缓存关系编号的情况下,从所述数据存储索引列表包括的文件空间存储信息表中获取与该待缓存关系编号对应的所有数据存储位置信息,并按照所述所有数据存储位置信息从自身的文件空间中提取位置匹配的数据作为所述待缓存数据。
15.根据权利要求9或10所述的方法,其特征在于,所述方法还包括:
根据自身所匹配的至少一种数据关联关系的访问热度分布状况,确定访问热度排名靠前的至少一种目标关联关系;
从自身的文件空间中将所述至少一种目标关联关系所对应的存储数据备份到自身的交换空间中进行覆盖式中心缓存,并对自身的数据存储索引列表中的交换空间存储信息表进行更新。
16.一种数据存储管理系统,其特征在于,所述系统包括相互通信连接的客户端、关系管理设备及多个数据存储设备,其中所述关系管理设备用于对每个数据存储设备所匹配的数据关联关系进行配置,所述数据存储设备用于对自身匹配的至少一种数据关联关系各自相关的多项数据进行存储;
所述客户端、所述关系管理设备及多个所述数据存储设备相互配合,实现权利要求1-8中任意一项所述的数据处理方法;或者
每个所述数据存储设备在与所述客户端及所述关系管理设备的配合下实现权利要求9-15中任意一项所述的数据处理方法。
CN202110850825.2A 2021-07-27 2021-07-27 数据处理方法及数据存储管理系统 Active CN113553306B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110850825.2A CN113553306B (zh) 2021-07-27 2021-07-27 数据处理方法及数据存储管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110850825.2A CN113553306B (zh) 2021-07-27 2021-07-27 数据处理方法及数据存储管理系统

Publications (2)

Publication Number Publication Date
CN113553306A true CN113553306A (zh) 2021-10-26
CN113553306B CN113553306B (zh) 2023-07-21

Family

ID=78104606

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110850825.2A Active CN113553306B (zh) 2021-07-27 2021-07-27 数据处理方法及数据存储管理系统

Country Status (1)

Country Link
CN (1) CN113553306B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114489510A (zh) * 2022-01-28 2022-05-13 维沃移动通信有限公司 数据读取方法及装置
CN115407942A (zh) * 2022-08-29 2022-11-29 深圳市锦锐科技股份有限公司 一种适用于单片机芯片的数据处理方法

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050120082A1 (en) * 1999-12-02 2005-06-02 Lambertus Hesselink Managed peer-to-peer applications, systems and methods for distributed data access and storage
US20120047331A1 (en) * 2010-08-19 2012-02-23 Meza Joseph R Systems and methods for managing an upload of files in a shared cache storage system
CN102902763A (zh) * 2012-09-21 2013-01-30 东软集团股份有限公司 关联、检索信息处理数据和处理信息任务的方法及装置
CN103455435A (zh) * 2013-08-29 2013-12-18 华为技术有限公司 数据写入方法及装置
CN106161056A (zh) * 2015-04-01 2016-11-23 阿里巴巴集团控股有限公司 周期型数据的分布式缓存运维方法及装置
CN106210015A (zh) * 2016-07-05 2016-12-07 福州大学 一种混合云结构中热度数据缓存的云存储方法
CN107395587A (zh) * 2017-07-18 2017-11-24 北京初识科技有限公司 一种基于多点协作机制的数据管理方法及系统
CN108280227A (zh) * 2018-01-26 2018-07-13 北京奇虎科技有限公司 基于缓存的数据信息处理方法及装置
CN108431796A (zh) * 2016-04-29 2018-08-21 华为技术有限公司 分布式资源管理系统和方法
CN109324998A (zh) * 2018-09-18 2019-02-12 郑州云海信息技术有限公司 一种文件处理方法、装置及系统
CN109344164A (zh) * 2018-10-31 2019-02-15 迈普通信技术股份有限公司 数据存储方法及装置
CN109379418A (zh) * 2018-10-09 2019-02-22 上海点融信息科技有限责任公司 基于区块链处理业务系统的文件的方法、设备及存储介质
CN109766318A (zh) * 2018-12-17 2019-05-17 新华三大数据技术有限公司 文件读取方法及装置
CN110765094A (zh) * 2019-10-24 2020-02-07 重庆紫光华山智安科技有限公司 文件创建方法、装置、系统及存储介质
CN110837660A (zh) * 2019-11-05 2020-02-25 广东紫晶信息存储技术股份有限公司 一种数据存储方法及系统、数据校验方法及系统
CN111124299A (zh) * 2019-12-17 2020-05-08 网易传媒科技(北京)有限公司 数据存储管理方法、装置、设备、系统及存储介质
CN111178069A (zh) * 2019-12-25 2020-05-19 平安健康保险股份有限公司 数据处理方法、装置、计算机设备及存储介质
CN111338571A (zh) * 2020-02-18 2020-06-26 腾讯科技(深圳)有限公司 任务处理方法、装置、设备及存储介质
CN112035530A (zh) * 2020-09-17 2020-12-04 中国银行股份有限公司 一种分布式实时支付系统中的交易报文匹配方法及系统
CN112347076A (zh) * 2020-11-05 2021-02-09 中国平安人寿保险股份有限公司 分布式数据库的数据存储方法、装置和计算机设备

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050120082A1 (en) * 1999-12-02 2005-06-02 Lambertus Hesselink Managed peer-to-peer applications, systems and methods for distributed data access and storage
US20120047331A1 (en) * 2010-08-19 2012-02-23 Meza Joseph R Systems and methods for managing an upload of files in a shared cache storage system
CN102902763A (zh) * 2012-09-21 2013-01-30 东软集团股份有限公司 关联、检索信息处理数据和处理信息任务的方法及装置
CN103455435A (zh) * 2013-08-29 2013-12-18 华为技术有限公司 数据写入方法及装置
CN106161056A (zh) * 2015-04-01 2016-11-23 阿里巴巴集团控股有限公司 周期型数据的分布式缓存运维方法及装置
CN108431796A (zh) * 2016-04-29 2018-08-21 华为技术有限公司 分布式资源管理系统和方法
CN106210015A (zh) * 2016-07-05 2016-12-07 福州大学 一种混合云结构中热度数据缓存的云存储方法
CN107395587A (zh) * 2017-07-18 2017-11-24 北京初识科技有限公司 一种基于多点协作机制的数据管理方法及系统
CN108280227A (zh) * 2018-01-26 2018-07-13 北京奇虎科技有限公司 基于缓存的数据信息处理方法及装置
CN109324998A (zh) * 2018-09-18 2019-02-12 郑州云海信息技术有限公司 一种文件处理方法、装置及系统
CN109379418A (zh) * 2018-10-09 2019-02-22 上海点融信息科技有限责任公司 基于区块链处理业务系统的文件的方法、设备及存储介质
CN109344164A (zh) * 2018-10-31 2019-02-15 迈普通信技术股份有限公司 数据存储方法及装置
CN109766318A (zh) * 2018-12-17 2019-05-17 新华三大数据技术有限公司 文件读取方法及装置
CN110765094A (zh) * 2019-10-24 2020-02-07 重庆紫光华山智安科技有限公司 文件创建方法、装置、系统及存储介质
CN110837660A (zh) * 2019-11-05 2020-02-25 广东紫晶信息存储技术股份有限公司 一种数据存储方法及系统、数据校验方法及系统
CN111124299A (zh) * 2019-12-17 2020-05-08 网易传媒科技(北京)有限公司 数据存储管理方法、装置、设备、系统及存储介质
CN111178069A (zh) * 2019-12-25 2020-05-19 平安健康保险股份有限公司 数据处理方法、装置、计算机设备及存储介质
CN111338571A (zh) * 2020-02-18 2020-06-26 腾讯科技(深圳)有限公司 任务处理方法、装置、设备及存储介质
CN112035530A (zh) * 2020-09-17 2020-12-04 中国银行股份有限公司 一种分布式实时支付系统中的交易报文匹配方法及系统
CN112347076A (zh) * 2020-11-05 2021-02-09 中国平安人寿保险股份有限公司 分布式数据库的数据存储方法、装置和计算机设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LIANG HUANG等: "A Review of Various Optimization Schemes of Small Files Storage on Hadoop", 《2018 37TH CHINESE CONTROL CONFERENCE (CCC)》 *
张程: "基于HDFS的文件存储与读取的优化策略研究与应用", 《中国优秀博硕士学位论文全文数据库(硕士)基础科学辑》 *
陈友旭: "分布式文件系统中元数据管理优化", 《中国优秀博硕士学位论文全文数据库(博士)基础科学辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114489510A (zh) * 2022-01-28 2022-05-13 维沃移动通信有限公司 数据读取方法及装置
CN115407942A (zh) * 2022-08-29 2022-11-29 深圳市锦锐科技股份有限公司 一种适用于单片机芯片的数据处理方法

Also Published As

Publication number Publication date
CN113553306B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
CN103019953B (zh) 一种元数据的构建系统及其方法
CN109947363B (zh) 一种分布式存储系统的数据缓存方法
JP2019508765A (ja) 記憶システムおよびソリッドステートディスク
CN110209490B (zh) 一种内存管理方法及相关设备
US20160364407A1 (en) Method and Device for Responding to Request, and Distributed File System
CN113672175A (zh) 分布式对象存储方法、装置和设备及计算机存储介质
CN103647797A (zh) 一种分布式文件系统及其数据访问方法
CN113553306B (zh) 数据处理方法及数据存储管理系统
CN105721883B (zh) 一种云存储系统中基于溯源信息的视频共享方法与系统
CN104850358A (zh) 一种磁光电混合存储系统及其数据获取和存储方法
CN109542861B (zh) 一种文件管理方法、装置和系统
CN109240607B (zh) 一种文件读取方法和装置
CN103324533A (zh) 分布式数据处理方法、装置及系统
CN103516774A (zh) 一种基于云存储的消除多次重复存储的方法及系统
CN110555001A (zh) 数据处理方法、装置、终端及介质
CA2987731A1 (en) Database memory monitoring and defragmentation of database indexes
CN104158863A (zh) 基于事务级别全程高速缓冲的云存储机制
CN108399175B (zh) 一种数据存储、查询方法及其装置
JP2012168781A (ja) 分散型データストアシステム及び分散型データストアシステムにおけるレコード管理方法
CN105426125B (zh) 一种数据存储方法及装置
CN116541553A (zh) 一种视频调度方法、装置、设备及可读存储介质
CN103490923A (zh) 日志文件的读写方法、装置及系统
CN108153874B (zh) 一种大数据高耗时查询结果集的快速分页方法
CN113905252B (zh) 直播间的数据存储方法、装置、电子设备及存储介质
CN110334073A (zh) 一种元数据预取方法、装置、终端、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant