CN114448969B - 数据上传存储方法、装置、计算机设备及存储介质 - Google Patents

数据上传存储方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114448969B
CN114448969B CN202111615462.0A CN202111615462A CN114448969B CN 114448969 B CN114448969 B CN 114448969B CN 202111615462 A CN202111615462 A CN 202111615462A CN 114448969 B CN114448969 B CN 114448969B
Authority
CN
China
Prior art keywords
data
blocks
content
uploaded
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111615462.0A
Other languages
English (en)
Other versions
CN114448969A (zh
Inventor
黄锐冰
万文聪
陈俊
刘宽
夏勇
段江南
黄景平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Cloud Technology Co Ltd
Original Assignee
Tianyi Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyi Cloud Technology Co Ltd filed Critical Tianyi Cloud Technology Co Ltd
Priority to CN202111615462.0A priority Critical patent/CN114448969B/zh
Publication of CN114448969A publication Critical patent/CN114448969A/zh
Application granted granted Critical
Publication of CN114448969B publication Critical patent/CN114448969B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了数据上传存储方法、装置、计算机设备及存储介质,该数据上传存储方法可包括:获取待上传存储数据的数据量大小以及读取设置的组块大小,根据数据量大小和组块大小确定待上传的组块;遍历各个待上传的组块中的分块,并根据分块中的内容利用分块组成大块,组块包括多个分块;根据大块中的内容执行相对应的数据上传存储策略,以对待上传存储数据进行上传和存储。基于分块中的具体内容形成不同种类的大块和对应执行不同的数据上传存储策略,本发明极大地减少了需要压缩处理的数据量,可见本发明能够有效降低备份数据量、减少计算量以及降低耗时,以解决现有技术所存在的诸多问题,用户体验较好,用户满意度较高。

Description

数据上传存储方法、装置、计算机设备及存储介质
技术领域
本发明涉及云计算技术领域,更为具体来说,本发明能够提供一种数据上传存储方法、装置、计算机设备及存储介质。
背景技术
目前,云计算的应用越来越广泛,为了节约本地设备的内存以及存储消耗,越来越多的用户选择将其数据上传至云端进行存储,可见提供一种有效的数据上传存储方案至关重要。传统的方式往往为将卷数据进行简单压缩后上传,虽然这种传统方式能够在一定程度上降低上传的数据所占用的空间,但是该方式存在计算量过大、卷备份数据量过大以及耗时较长等问题,亟待需要改进或优化。
发明内容
为解决现有技术存在计算量过大、卷备份数据量过大以及耗时较长等问题,本发明能够提供数据上传存储方法、装置、计算机设备及存储介质,以达到减少计算量、降低备份数据量以及降低耗时等至少一个技术目的。
为实现上述技术目的,本发明公开了一种数据上传存储方法,该方法包括但不限于如下的一个或多个步骤。
获取待上传存储数据的数据量大小以及读取设置的组块大小。
根据所述数据量大小和所述组块大小确定待上传的组块。
遍历各个所述待上传的组块中的分块,并根据分块中的内容利用所述分块组成大块;所述组块包括多个分块。
根据大块中的内容执行相对应的数据上传存储策略,以对所述待上传存储数据进行上传和存储。
进一步地,所述根据分块中的内容利用所述分块组成大块包括:
根据分块中的内容连续全为0,将分块组成大块。
和/或,根据分块中的内容连续全为非0,将分块组成大块。
进一步地,所述根据大块中的内容执行相对应的数据上传存储策略可包括:
根据大块中的内容全为0,则执行记录大块的偏移量和大小的数据上传存储策略。
根据大块中的内容全为非0,则执行对大块进行压缩和上传的数据上传存储策略。
进一步地,该数据上传存储方法还包括:
根据大块中的内容全为0,记录标志位为0。
根据大块中的内容全为非0,记录标志位为1。
进一步地,该数据上传存储方法还包括:
确定已上传的多个分块是否存在相同的哈希值。;
根据存在相同的哈希值,则记录相同的哈希值的索引。
根据不存在相同的哈希值,则对哈希值执行添加操作。
进一步地,所述根据所述数据量大小和所述组块大小确定待上传的组块包括:
利用所述数据量大小和所述组块大小计算组块的数量。
为实现上述的技术目的,本发明还能够提供一种数据上传存储装置,该数据上传存储装置包括但不限于参数获取模块、组块确定模块、大块形成模块以及数据上传模块。
参数获取模块,用于获取待上传存储数据的数据量大小以及读取设置的组块大小。
组块确定模块,用于根据所述数据量大小和所述组块大小确定待上传的组块。
大块形成模块,用于遍历各个所述待上传的组块中的分块,并根据分块中的内容利用所述分块组成大块;所述组块包括多个分块。
数据上传模块,用于根据大块中的内容执行相对应的数据上传存储策略,以对所述待上传存储数据进行上传和存储。
为实现上述的技术目的,本发明还能够提供一种计算机设备,计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行本发明任一实施例所述数据上传存储方法的步骤。
为实现上述的技术目的,本发明还可提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行本发明任一实施例所述数据上传存储方法的步骤。
为实现上述的技术目的,本发明还能够提供一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行本发明任一实施例中所述数据上传存储方法的步骤。
本发明的有益效果为:基于分块中的具体内容形成不同种类的大块和对应执行不同的数据上传存储策略,本发明极大地减少了需要压缩处理的数据量,可见本发明能够有效降低备份数据量、减少计算量以及降低耗时,以解决现有技术存在的诸多问题,用户体验较好,用户满意度较高。特别对于基于Cinder进行数据上传至对象存储的场景,本发明可使得Cinder进行数据上传至对象存储过程中,极大地节省存储空间以及缩短备份时间,为用户提供极佳的使用体验,极大地提升了用户满意度和信赖度。
附图说明
图1示出了本发明一个或多个实施例中的数据上传存储方法的流程示意图。
图2示出了本发明一个或多个实施例中优化后的数据上传存储方法流程示意图。
图3示出了本发明一个或多个实施例中数据上传存储方法中对哈希值进行处理的流程示意图。
图4示出了本发明一个或多个实施例中的数据上传存储装置组成的示意图。
图5示出了本发明一个或多个实施例中计算机设备内部结构的组成示意图。
具体实施方式
下面结合说明书附图对本发明提供的一种数据上传存储方法、装置、计算机设备及存储介质进行详细的解释和说明。
如图1所示,并可结合图2和图3,本发明一个或多个实施例可提供一种数据上传存储方法,该数据上传存储方法可包括但不限于如下的一个或多个步骤。
本发明能够用于Openstack(云计算管理平台)场景下,Openstack是一个开源的云计算管理平台项目,是一系列软件开源项目的组合。其中,Cinder(块存储技术)是Openstack的卷管理项目,并负责实现对虚拟化场景中所有卷的管理功能。在Cinder中,对卷进行上传到对象存储是通过cinder-backup(块备份)服务来实现,原生逻辑将卷的所有数据进行压缩算法压缩后上传至后端对象存储中,可见本发明实施例具体能够提供一种提升Openstack数据上传至对象存储的优化方案。
首先,数据上传时,本发明获取待上传存储数据的数据量大小以及读取设置的组块大小。其中,本实施例的待上传存储数据例如可包括但不限于Cinder原生的对象数据(元数据)。结合图2所示,本实施例具体采用对象上传存储方案,启动对象上传后,获取对象卷的容量(即待上传存储数据的数据量大小)。
其次,根据数据量大小和组块大小确定待上传的组块;基于预设组块大小,根据对象卷容量确定各个组块及其数量。具体地,根据数据量大小和组块大小确定待上传的组块包括:利用数据量大小和组块大小计算组块的数量,本发明实施例根据chunk(组块)大小计算上传的chunk(组块)数量。
再次,本实施例遍历所有的组块(chunk),以及遍历各个待上传的组块(chunk)中的分块(block),再根据分块中的内容利用分块组成大块(bigblock);其中,本发明实施例中的组块包括多个分块。
对于raw(未经加工的)格式卷在数据没有全部写满情况下存在大量为0的情况,该情况导致很多存储块中实际上并没有实际有用的数据,本发明实施例中根据分块中的内容利用分块组成大块包括:根据分块中的内容连续全为0,将分块组成大块;和/或,根据分块中的内容连续全为非0,将分块组成大块。可见本发明利用内容连续全为0的分块形成一种大块,即将连续全0的分块组成大块;或利用分块中的内容连续全为非0的内容形成另一种大块,即将连续非0的分块组成大块;该方式可用于区分包含有用数据的存储块和无用数据的存储块,当然并不限于此。
最后,本实施例根据大块中的内容执行相对应的数据上传存储策略,以基于不同的数据上传存储策略实现对待上传存储数据进行上传和存储。
可选地,本发明实施例根据大块中的内容执行相对应的数据上传存储策略可包括:判断大块(bigblock)是否全0,根据大块中的内容全为0,则执行记录大块的偏移量和大小的数据上传存储策略,这种数据上传存储策略包括在元数据中记录大块偏移量和大小,而无需进行计算压缩,从而极大地减少了本发明的计算量和压缩量;根据大块中的内容全为非0,则执行对大块进行压缩和上传的数据上传存储策略,该数据上传存储策略可包括将数据进行压缩,然后上传至对象存储中,并在元数据中的大块记录偏移量和大小。更为具体地,本发明实施例中的数据上传存储方法还可以包括:根据大块中的内容全为0,记录标志位为0;根据大块中的内容全为非0,记录标志位为1。然后,本发明实施例可上传所有分块的sha256h(表示256位的哈希值,表示大量数据的固定大小)和元数据到对象存储。可见相比于传统的方案raw格式的磁盘有大量0的情况,以及Cinder对所有数据进行计算和压缩的流程中存在的缺点,本发明提供的技术方案对其进行优化改造,使其减少不必要的计算以及节省后端对象存储空间,以较好地解决现有技术所存在的问题。
如图3所示,本发明实施例对于待上传的所有分块的sha256h,数据上传存储方法还可包括:确定已上传的多个分块是否存在相同的哈希值,即计算前面block是否存在相同hash(哈希)值;根据存在相同的哈希值,则本发明实施例在map(用于哈希值相关数据的存储表)中记录相同的哈希值的索引,而无需记录相同的hash,从而进一步减少计算量和数据量;根据不存在相同的哈希值,则对哈希值执行添加操作;然后本发明在上传元数据的同时,可将记录有哈希值的索引的存储表(map)和记录哈希值的存储表(map)均上传至对象存储。
相比于传统方案中的Cinder进行压缩上传对象存储流程所涉及压缩算法进行数据压缩的量比较多的问题,基于本发明所提供的技术方案,本发明能够优化Cinder原生的对象上传至对象存储的流程,以使得在进行数据压缩和上传过程中能够节省后端对象存储空间以及缩短计算和上传的时间,用户体验好,用户满意度较高。
如图4所示,与本发明数据上传存储方法基于同一发明技术构思,本发明实施例还能够提供一种数据上传存储装置。该装置包括但不限于参数获取模块、组块确定模块、大块形成模块及数据上传模块,具体说明如下。
参数获取模块,用于获取待上传存储数据的数据量大小以及读取设置的组块大小。
组块确定模块,用于根据数据量大小和组块大小确定待上传的组块。
可选地,组块确定模块可用于利用数据量大小和组块大小计算组块的数量。
大块形成模块,用于遍历各个待上传的组块中的分块,并根据分块中的内容利用分块组成大块;组块包括多个分块。
可选地,大块形成模块用于根据分块中的内容连续全为0,将分块组成大块。和/或,大块形成模块用于根据分块中的内容连续全为非0,将分块组成大块。
数据上传模块,用于根据大块中的内容执行相对应的数据上传存储策略,以对待上传存储数据进行上传和存储。
可选地,数据上传模块用于根据大块中的内容全为0,则执行记录大块的偏移量和大小的数据上传存储策略;数据上传模块用于根据大块中的内容全为非0,则执行对大块进行压缩和上传的数据上传存储策略。
可选地,数据上传模块用于根据大块中的内容全为0,记录标志位为0;数据上传模块用于根据大块中的内容全为非0,记录标志位为1。
可选地,数据上传存储装置还可包括存储记录模块,存储记录模块可用于确定已上传的多个分块是否存在相同的哈希值。
具体地,本实施例的存储记录模块用于根据存在相同的哈希值,记录相同的哈希值的索引;存储记录模块用于根据不存在相同的哈希值,对哈希值执行添加操作。
如图5所示,与本发明数据上传存储方法基于同一发明技术构思,本发明实施例还能够提供一种计算机设备,计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行本发明任一实施例中数据上传存储方法的步骤。其中,本发明数据上传存储方法包括但不限于如下的步骤。首先,获取待上传存储数据的数据量大小以及读取设置的组块大小。其次,根据数据量大小和组块大小确定待上传的组块。具体地,根据数据量大小和组块大小确定待上传的组块包括:利用数据量大小和组块大小计算组块的数量。再次,遍历各个待上传的组块中的分块,并根据分块中的内容利用分块组成大块;组块包括多个分块。本发明实施例中根据分块中的内容利用分块组成大块包括:根据分块中的内容连续全为0,将分块组成大块;和/或,根据分块中的内容连续全为非0,将分块组成大块。最后,根据大块中的内容执行相对应的数据上传存储策略,以对待上传存储数据进行上传和存储。可选地,本发明实施例根据大块中的内容执行相对应的数据上传存储策略可包括:根据大块中的内容全为0,则执行记录大块的偏移量和大小的数据上传存储策略;根据大块中的内容全为非0,则执行对大块进行压缩和上传的数据上传存储策略。具体地,数据上传存储方法,还包括:根据大块中的内容全为0,记录标志位为0;根据大块中的内容全为非0,记录标志位为1。可选地,本发明实施例的数据上传存储方法,还包括:确定已上传的多个分块是否存在相同的哈希值;根据存在相同的哈希值,则记录相同的哈希值的索引;根据不存在相同的哈希值,则对哈希值执行添加操作。
如图5所示,与本发明数据上传存储方法基于同一发明技术构思,本发明实施例还可提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本发明任一实施例中的数据上传存储方法的步骤。其中,本发明数据上传存储方法包括但不限于如下的步骤。首先,获取待上传存储数据的数据量大小以及读取设置的组块大小。其次,根据数据量大小和组块大小确定待上传的组块。具体地,根据数据量大小和组块大小确定待上传的组块包括:利用数据量大小和组块大小计算组块的数量。再次,遍历各个待上传的组块中的分块,并根据分块中的内容利用分块组成大块;组块包括多个分块。本发明实施例中根据分块中的内容利用分块组成大块包括:根据分块中的内容连续全为0,将分块组成大块;和/或,根据分块中的内容连续全为非0,将分块组成大块。最后,根据大块中的内容执行相对应的数据上传存储策略,以对待上传存储数据进行上传和存储。可选地,本发明实施例根据大块中的内容执行相对应的数据上传存储策略可包括:根据大块中的内容全为0,则执行记录大块的偏移量和大小的数据上传存储策略;根据大块中的内容全为非0,则执行对大块进行压缩和上传的数据上传存储策略。具体地,数据上传存储方法,还包括:根据大块中的内容全为0,记录标志位为0;根据大块中的内容全为非0,记录标志位为1。可选地,本发明实施例的数据上传存储方法,还包括:确定已上传的多个分块是否存在相同的哈希值;根据存在相同的哈希值,则记录相同的哈希值的索引;根据不存在相同的哈希值,则对哈希值执行添加操作。
与本发明数据上传存储方法基于同一发明技术构思,本发明实施例还可提供一种计算机程序产品,当计算机程序产品中的指令由处理器执行时,执行本发明任一实施例中数据上传存储方法的步骤。其中,本发明数据上传存储方法包括但不限于如下的步骤。首先,获取待上传存储数据的数据量大小以及读取设置的组块大小。其次,根据数据量大小和组块大小确定待上传的组块。具体地,根据数据量大小和组块大小确定待上传的组块包括:利用数据量大小和组块大小计算组块的数量。再次,遍历各个待上传的组块中的分块,并根据分块中的内容利用分块组成大块;组块包括多个分块。本发明实施例中根据分块中的内容利用分块组成大块包括:根据分块中的内容连续全为0,将分块组成大块;和/或,根据分块中的内容连续全为非0,将分块组成大块。最后,根据大块中的内容执行相对应的数据上传存储策略,以对待上传存储数据进行上传和存储。可选地,本发明实施例根据大块中的内容执行相对应的数据上传存储策略可包括:根据大块中的内容全为0,则执行记录大块的偏移量和大小的数据上传存储策略;根据大块中的内容全为非0,则执行对大块进行压缩和上传的数据上传存储策略。具体地,数据上传存储方法,还包括:根据大块中的内容全为0,记录标志位为0;根据大块中的内容全为非0,记录标志位为1。可选地,本发明实施例的数据上传存储方法,还包括:确定已上传的多个分块是否存在相同的哈希值;根据存在相同的哈希值,则记录相同的哈希值的索引;根据不存在相同的哈希值,则对哈希值执行添加操作。
由此可见,本发明可基于数据量大小和组块大小确定具体的组块及其数量,并通过遍历组块和遍历组块中的分块的方式通过分块中的具体内容形成不同种类的大块和对应执行不同的数据上传存储策略,基于不同数据上传存储策略本发明极大减少了需要压缩处理的数据量,可见本发明能够有效降低备份数据量、减少计算量以及降低耗时,以解决现有技术存在的一个或多个问题,用户体验非常好,用户满意度较高。特别对于基于Cinder进行数据上传至对象存储的场景,本发明可使得Cinder进行数据上传至对象存储过程中,极大地节省存储空间以及缩短备份时间,从而可为用户提供极佳的使用体验,极大地提升了用户满意度和信赖度。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读存储介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读存储介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读存储介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM,Random Access Memory),只读存储器(ROM,Read-Only Memory),可擦除可编辑只读存储器(EPROM,Erasable Programmable Read-Only Memory,或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM,Compact Disc Read-Only Memory)。另外,计算机可读存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA,Programmable Gate Array),现场可编程门阵列(FPGA,Field Programmable Gate Array)等。
在本说明书的描述中,参考术语“本实施例”、“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明实质内容上所作的任何修改、等同替换和简单改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种数据上传存储方法,其特征在于,包括:
获取待上传存储数据的数据量大小以及读取设置的组块大小;
根据所述数据量大小和所述组块大小确定待上传的组块;
遍历各个所述待上传的组块中的分块,并根据分块中的内容利用所述分块组成大块;所述组块包括多个分块;
所述根据分块中的内容利用所述分块组成大块包括:
根据分块中的内容连续全为0,将分块组成大块;
和/或,根据分块中的内容连续全为非0,将分块组成大块;
根据大块中的内容执行相对应的数据上传存储策略,以对所述待上传存储数据进行上传和存储;
所述根据大块中的内容执行相对应的数据上传存储策略包括:
根据大块中的内容全为0,则执行记录大块的偏移量和大小的数据上传存储策略;
根据大块中的内容全为非0,则执行对大块进行压缩和上传的数据上传存储策略。
2.根据权利要求1所述的数据上传存储方法,其特征在于,还包括:
根据大块中的内容全为0,记录标志位为0;
根据大块中的内容全为非0,记录标志位为1。
3.根据权利要求1所述的数据上传存储方法,其特征在于,还包括:
确定已上传的多个分块是否存在相同的哈希值;
根据存在相同的哈希值,则记录相同的哈希值的索引;
根据不存在相同的哈希值,则对哈希值执行添加操作。
4.根据权利要求1所述的数据上传存储方法,其特征在于,所述根据所述数据量大小和所述组块大小确定待上传的组块包括:
利用所述数据量大小和所述组块大小计算组块的数量。
5.一种数据上传存储装置,其特征在于,包括:
参数获取模块,用于获取待上传存储数据的数据量大小以及读取设置的组块大小;
组块确定模块,用于根据所述数据量大小和所述组块大小确定待上传的组块;
大块形成模块,用于遍历各个所述待上传的组块中的分块,并根据分块中的内容利用所述分块组成大块;所述组块包括多个分块;
大块形成模块用于根据分块中的内容连续全为0,将分块组成大块;和/或,大块形成模块用于根据分块中的内容连续全为非0,将分块组成大块;
数据上传模块,用于根据大块中的内容执行相对应的数据上传存储策略,以对所述待上传存储数据进行上传和存储;
数据上传模块用于根据大块中的内容全为0,则执行记录大块的偏移量和大小的数据上传存储策略;数据上传模块用于根据大块中的内容全为非0,则执行对大块进行压缩和上传的数据上传存储策略。
6.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1~4中任一项权利要求所述数据上传存储方法的步骤。
7.一种存储有计算机可读指令的存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1~4中任一项权利要求所述数据上传存储方法的步骤。
CN202111615462.0A 2021-12-27 2021-12-27 数据上传存储方法、装置、计算机设备及存储介质 Active CN114448969B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111615462.0A CN114448969B (zh) 2021-12-27 2021-12-27 数据上传存储方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111615462.0A CN114448969B (zh) 2021-12-27 2021-12-27 数据上传存储方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN114448969A CN114448969A (zh) 2022-05-06
CN114448969B true CN114448969B (zh) 2023-06-23

Family

ID=81365022

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111615462.0A Active CN114448969B (zh) 2021-12-27 2021-12-27 数据上传存储方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114448969B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101132396A (zh) * 2006-06-12 2008-02-27 三菱电机株式会社 Tcp片段流的切入式内容分析
US8639669B1 (en) * 2011-12-22 2014-01-28 Emc Corporation Method and apparatus for determining optimal chunk sizes of a deduplicated storage system
CN103914555A (zh) * 2014-04-14 2014-07-09 百度在线网络技术(北京)有限公司 网页重新布局的方法和装置
CN104426942A (zh) * 2013-08-27 2015-03-18 鸿富锦精密工业(深圳)有限公司 文件上传方法及系统
CN105611400A (zh) * 2014-11-18 2016-05-25 三星电子株式会社 内容处理设备和用于发送可变大小的片段的方法
JP2017111692A (ja) * 2015-12-18 2017-06-22 株式会社日立製作所 系列データ管理システムおよび装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101132396A (zh) * 2006-06-12 2008-02-27 三菱电机株式会社 Tcp片段流的切入式内容分析
US8639669B1 (en) * 2011-12-22 2014-01-28 Emc Corporation Method and apparatus for determining optimal chunk sizes of a deduplicated storage system
CN104426942A (zh) * 2013-08-27 2015-03-18 鸿富锦精密工业(深圳)有限公司 文件上传方法及系统
CN103914555A (zh) * 2014-04-14 2014-07-09 百度在线网络技术(北京)有限公司 网页重新布局的方法和装置
CN105611400A (zh) * 2014-11-18 2016-05-25 三星电子株式会社 内容处理设备和用于发送可变大小的片段的方法
JP2017111692A (ja) * 2015-12-18 2017-06-22 株式会社日立製作所 系列データ管理システムおよび装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
混合型时移网络电视系统设计与实现;杨灿;陈新新;梁尚韬;胡劲松;;华中科技大学学报(自然科学版)(06);全文 *

Also Published As

Publication number Publication date
CN114448969A (zh) 2022-05-06

Similar Documents

Publication Publication Date Title
CN110149803B (zh) 数据存储方法、系统及终端设备
KR101468336B1 (ko) 데이터 압축률 예측 기법에 기반한 데이터 분산 저장 방법, 이를 이용한 저장 장치 및 시스템
US8943032B1 (en) System and method for data migration using hybrid modes
CN111949621B (zh) 一种基于场景切换的文件压缩存储方法及终端
CN110764706A (zh) 存储系统、数据管理方法及存储介质
CN109802684B (zh) 进行数据压缩的方法和装置
WO2010070410A1 (en) System and method for classifying and storing related forms of data
WO2018121430A1 (zh) 文件存储和索引方法、装置、介质、设备及读取文件的方法
CN109994131B (zh) 一种基于索引的工频录波文件压缩存储方法及系统
CN107430602A (zh) 重复数据删除方法及存储设备
US20190332577A1 (en) Data access method based on feature analysis, storage device and storage system
CN113901279B (zh) 一种图数据库的检索方法和装置
CN104427341A (zh) 一种图像处理方法、装置及终端
CN106569750A (zh) 一种数据压缩方法及装置
CN107766067B (zh) 一种提升压缩镜像烧录速度的方法、存储介质及计算机
CN115617878A (zh) 一种数据查询方法、系统、装置、设备及计算机存储介质
CN105095515A (zh) 支持快速查询Map-Reduce输出结果的分桶方法、装置及设备
CN106681659A (zh) 数据压缩的方法及装置
CN114448969B (zh) 数据上传存储方法、装置、计算机设备及存储介质
CN107423425A (zh) 一种对k/v格式的数据快速存储和查询方法
CN109634528A (zh) 一种目标数据的落盘方法、装置、设备及存储介质
WO2021082926A1 (zh) 一种数据压缩的方法及装置
CN110781166B (zh) 存储系统中数据管理方法和装置
CN112269530A (zh) 一种数据存储管理方法及相关装置
CN107436848A (zh) 一种实现用户数据和压缩数据间转换的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant