CN112000627A - 一种数据存储方法、系统、电子设备及存储介质 - Google Patents

一种数据存储方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN112000627A
CN112000627A CN202010820144.7A CN202010820144A CN112000627A CN 112000627 A CN112000627 A CN 112000627A CN 202010820144 A CN202010820144 A CN 202010820144A CN 112000627 A CN112000627 A CN 112000627A
Authority
CN
China
Prior art keywords
data
request
written
erasure
writing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010820144.7A
Other languages
English (en)
Other versions
CN112000627B (zh
Inventor
孔帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010820144.7A priority Critical patent/CN112000627B/zh
Publication of CN112000627A publication Critical patent/CN112000627A/zh
Application granted granted Critical
Publication of CN112000627B publication Critical patent/CN112000627B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • G06F11/1012Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices using codes or arrangements adapted for a specific type of error

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据存储方法,所述数据存储方法包括设置存储端中纠删单元的字节长度;当接收到包括小文件标识的创建写请求时,根据所述创建写请求判断待写入长度是否大于所述纠删单元的字节长度;若是,则计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘;若否,则根据待写入数据封装M+1个写副本数据子请求,并封装K‑1个创建空对象子请求;将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据。本申请能够优化数据存储方式,提高数据读取效率。本申请还公开了一种数据写入系统、一种电子设备及一种存储介质,具有以上有益效果。

Description

一种数据存储方法、系统、电子设备及存储介质
技术领域
本申请涉及数据存储技术领域,特别涉及一种数据存储方法、系统、一种电子设备及一种存储介质。
背景技术
在分布式存储系统中,可以使用纠删码实现数据冗余。纠删码能够提高存储的空间使用率(对K+M冗余,实际可用空间为K/(K+M)),但是读时延较高,一般用于大文件场景,利用客户端的预读功能来抵消后端的读时延。在大文件和小文件混合存储的场景中,若存储节点数不变的情况,使用纠删码时又会严重降低小文件的读取速度,而单个请求的阻塞又会拖累整个分布式存储集群的性能,导致对大文件的正常访问也会变得卡顿。
因此,如何优化数据存储方式,提高数据读取效率是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种数据存储方法、系统、一种电子设备及一种存储街绘制,能够优化数据存储方式,提高数据读取效率。
为解决上述技术问题,本申请提供一种数据存储方法,该数据存储方法包括:
设置存储端中纠删单元的字节长度;其中,所述纠删单元的字节长度等于预设小文件的字节长度;
当接收到包括小文件标识的创建写请求时,根据所述创建写请求判断待写入长度是否大于所述纠删单元的字节长度;其中,所述待写入长度等于待写入数据字节长度与偏移量之和;
若是,则计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘;
若否,则根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求;其中,每个所述写副本数据子请求对应的写入的数据相同,K为预设纠删码冗余规则的源数据块数量,M为所述预设纠删码冗余规则的校验数据块数量;
将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据。
可选的,还包括:
当接收到包括小文件标识的覆盖写请求时,判断所述覆盖写请求的写入对象是否包括小文件标识;
若所述覆盖写请求不包括小文件标识,则执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作;
若所述覆盖写请求包括小文件标识,则确定所述覆盖写请求的写入对象的原数据,并判断所述覆盖写请求对应的待写入数据的字节长度是否与所述原数据的字节长度相同;
若相同,则执行根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求的操作;
若不相同,则根据所述原数据和所述覆盖写请求对应的待写入数据确定新数据,并判断所述新数据的写入长度是否大于所述纠删单元的字节长度;其中,所述新数据的写入长度等于新数据字节长度与偏移量之和;
若大于所述纠删单元的字节长度,则执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作,并删除所述覆盖写请求的写入对象的小文件标识;
若不大于所述纠删单元的字节长度,则执行根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求的操作。
可选的,还包括:
当接收到包括小文件标识的预设请求时,判断所述预设请求的写入对象是否包括小文件标识;其中,所述预设请求包括修改写请求和追加写请求;
若所述预设请求不包括小文件标识,则执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作;
若所述预设请求包括小文件标识,则判断执行所述预设请求后新数据的写入长度是否大于所述纠删单元的字节长度;其中,所述新数据的写入长度等于新数据字节长度与偏移量之和;
若大于所述纠删单元的字节长度,则执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作,并删除所述预设请求的写入对象的小文件标识;
若不大于所述纠删单元的字节长度,则执行根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求的操作。
可选的,所述计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘包括:
对待写入数据的末位补零直至所述待写入数据的字节长度等于纠删条带的字节长度的整数倍;
将所述待写入数据平均划分为多个字节长度等于所述纠删条带的目标数据块,并将每一所述目标数据块平均划分为K个字节长度等于所述纠删单元的数据子块;
将每一所述目标数据块中第i个数据子块进行拼接得到K个源数据块;其中,1≤i≤K;
对每一所述源数据块中的数据子块进行纠删计算得到M个校验数据块;
将所述源数据块和所述校验数据块依次写入所述存储端的K+M个磁盘。
可选的,将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据,包括:
将所述M+1个写副本数据子请求分别发送至所述存储端的前M+1个磁盘,并将所述K-1个创建空对象子请求分别发送至所述存储端的第M+2至第M+K个磁盘,以便在前M+1个磁盘中均写入相同的待写入数据。
可选的,在将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据之后,还包括:
为所述创建写请求对应的文件添加小文件标识。
可选的,还包括:
若接收到包括小文件标识的读请求时,确定所述读请求对应的读取对象;
判断所述读取对象是否包括小文件标识;
若是,则从磁盘中读取所述读请求对应的数据;
若否,则通过执行纠删码逆运算得到所述读请求对应的数据。
本申请还提供了一种数据存储系统,该系统包括:
字节长度设置模块,用于设置存储端中纠删单元的字节长度;其中,所述纠删单元的字节长度等于预设小文件的字节长度;
创建写判断模块用于当接收到包括小文件标识的创建写请求时,根据所述创建写请求判断待写入长度是否大于所述纠删单元的字节长度;其中,所述待写入长度等于待写入数据字节长度与偏移量之和;
纠删码计算模块,用于若待写入长度大于所述纠删单元的字节长度,则计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘;
请求创建模块,用于若待写入长度小于或等于所述纠删单元的字节长度,则根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求;其中,每个所述写副本数据子请求对应的写入的数据相同,K为预设纠删码冗余规则的源数据块数量,M为所述预设纠删码冗余规则的校验数据块数量;
数据写入模块,用于将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据。
本申请还提供了一种存储介质,其上存储有计算机程序,所述计算机程序执行时实现上述数据存储方法执行的步骤。
本申请还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现上述数据存储方法执行的步骤。
本申请提供了一种数据存储方法,包括:设置存储端中纠删单元的字节长度;其中,所述纠删单元的字节长度等于预设小文件的字节长度;当接收到包括小文件标识的创建写请求时,根据所述创建写请求判断待写入长度是否大于所述纠删单元的字节长度;其中,所述待写入长度等于待写入数据字节长度与偏移量之和;若是,则计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘;若否,则根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求;其中,每个所述写副本数据子请求对应的写入的数据相同,K为预设纠删码冗余规则的源数据块数量,M为所述预设纠删码冗余规则的校验数据块数量;将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据。
本申请首先设置纠删单元的字节长度,在接收到包括小文件标识的创建写请求时,判断待写入长度是否大于纠删单元的字节长度。由于纠删单元的字节长度根据预设小文件的字节长度,因此可以基于纠删单元判断要写入的数据是否超过小文件的存储范围。若待写入长度大于纠删单元的字节长度,则判定需要创建写的文件不为小文件,可以计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘。若写入长度小于或等于纠删单元的字节长度,则判定需要创建写的文件为小文件,可以根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求,以便直接将待写入数据存储至副本中。若接收到读取小文件的请求时,可以读取任一副本得到对应的小文件,使小文件免于纠删计算过程。可见,本申请能够优化数据存储方式,提高数据读取效率。本申请同时还提供了一种数据存储系统、一种电子设备和一种存储介质,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种数据存储方法的流程图;
图2为本申请实施例所提供的一种纠删码计算过程的原理示意图;
图3为本申请实施例所提供的一种分布式存储系统中基于纠删的小文件优化方法的流程图;
图4为本申请实施例所提供的一种数据写入系统的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面请参见图1,图1为本申请实施例所提供的一种数据存储方法的流程图。
具体步骤可以包括:
S101:设置存储端中纠删单元的字节长度;
其中,本实施例可以应用于使用纠删码实现数据冗余的分布式存储系统,纠删码可以按照预设纠删规则进行存储,本实施例的预设纠删规则可以为K+M纠删规则,即写数据时首先将数据切分成K份源数据块,然后再计算出M份校验数据块,最后将这K+M份数据分别保存到不同的磁盘中,在读取数据时从K+M份数据中的任意K份数据即可以计算还原出原始数据。存储端底层进行纠删计算和数据读写的最小单元为纠删条带,如果纠删条带的纠删规则为K+M,则纠删条带的大小为纠删单元*K。在本步骤之前可以存在确定的预设小文件的字节长度的操作,以便将纠删单元的字节长度设置为预设小文件的字节长度。通常可以将大小在1MB以内的文件称为小文件。
S102:当接收到包括小文件标识的创建写请求时,根据所述创建写请求判断待写入长度是否大于所述纠删单元的字节长度;若是,则进入S103;若否,则进入S104;
其中,在接收到写数据请求后,可以确定写数据请求的类型,写数据请求的类型包括创建写请求、覆盖写请求、修改写请求和追加写请求。本实施例可以根据写数据请求的特定字段的值判断写数据请求是否包括小文件标识。在接收到包括小文件小时的创建写请求时,本步骤可以确定该创建写请求对应的待写入长度,待写入长度等于待写入数据的字节长度与偏移量之和。若待写入长度大于纠删单元的字节长度,则说明本次创建写的文件大小大于预设小文件的字节长度,可以执行纠删码计算操作。若待写入长度小于或等于纠删单元的字节长度,则说明本次创建写请求所创建的文件为小文件,可以采用S104中类似副本的方式存储到磁盘中。
S103:计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘;
其中,本实施例建立在已经判定创建写的文件不为小文件的基础上,可以生成待写入数据的纠删码并将所述纠删码存储至对应的磁盘。在需要读取改文件时,可以利用纠删码的逆运算得到原始数据。
S104:根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求;
其中,本步骤中K为预设纠删码冗余规则的源数据块数量,M为所述预设纠删码冗余规则的校验数据块数量,每个所述写副本数据子请求对应的写入的数据相同(即均为待写入数据)。空对象子请求为创建对象为空的请求。
S105:将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据。
其中,本步骤可以将写副本数据子请求和空对象子请求分别发送至不同的磁盘,在将M+1个写副本数据子请求发送至M+1个磁盘后,M+1个磁盘中的每一磁盘均存储有一份相同的待写入数据,当需要读取数据时,可以从任一接收过写副本数据子请求的磁盘中读取原始数据,无需执行纠删计算的逆操作。
进一步的,本实施例可以将所述M+1个写副本数据子请求分别发送至所述存储端的前M+1个磁盘,并将所述K-1个创建空对象子请求分别发送至所述存储端的第M+2至第M+K个磁盘,以便在前M+1个磁盘中均写入相同的待写入数据。在将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据之后,还可以为所述创建写请求对应的文件添加小文件标识。
进一步的,若接收到包括小文件标识的读请求时,确定所述读请求对应的读取对象;可以判断所述读取对象是否包括小文件标识;若是,则从磁盘中读取所述读请求对应的数据;若否,则通过执行纠删码逆运算得到所述读请求对应的数据。
本实施例首先设置纠删单元的字节长度,在接收到包括小文件标识的创建写请求时,判断待写入长度是否大于纠删单元的字节长度。由于纠删单元的字节长度根据预设小文件的字节长度,因此可以基于纠删单元判断要写入的数据是否超过小文件的存储范围。若待写入长度大于纠删单元的字节长度,则判定需要创建写的文件不为小文件,可以计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘。若写入长度小于或等于纠删单元的字节长度,则判定需要创建写的文件为小文件,可以根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求,以便直接将待写入数据存储至副本中。若接收到读取小文件的请求时,可以读取任一副本得到对应的小文件,使小文件免于纠删计算过程。可见,本实施例能够优化数据存储方式,提高数据读取效率。
作为对于图1对应实施例的进一步介绍,在接收到写数据请求之后,还可以判断该写数据请求是否为包括小文件标识的覆盖写请求,当接收到包括小文件标识的覆盖写请求时,还可以执行以下步骤:
步骤11:判断所述覆盖写请求的写入对象是否包括小文件标识;若是,则进入步骤12;若否,则执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作;
其中,覆盖写请求的写入对象为需要写入数据的文件,若写入对象不包括小文件标识则说明写入对象不为小文件,可以直接执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作,若写入对象包括小文件标识,还需要判断写入对象在执行覆盖写操作后的字节长度仍符合小文件的字节长度要求。
步骤12:确定所述覆盖写请求的写入对象的原数据,并判断所述覆盖写请求对应的待写入数据的字节长度是否与所述原数据的字节长度相同;若是,则进入步骤13;若否,则进入步骤14;
其中,本步骤用于判断本次覆盖写请求对应的操作是否为完全覆盖写,若覆盖写请求对应的待写入数据的字节长度与原数据的字节长度相同则说明本次写操作为完全覆盖写,若覆盖写请求对应的待写入数据的字节长度与原数据的字节长度不相同则说明本次写操作不为完全覆盖写。
步骤13:根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求;
其中,本步骤建立在确定本次写操作为完全覆盖写的基础上,可以判定完全覆盖写后的写入对象仍为小文件,因此可以根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求。
步骤14:根据所述原数据和所述覆盖写请求对应的待写入数据确定新数据,并判断所述新数据的写入长度是否大于所述纠删单元的字节长度;若是,则进入步骤15;若否,则进入步骤16;
其中,本步骤建立在确定本次写操作不为完全覆盖写的基础上,需要根据覆盖写操作后的新数据的写入长度是否大于纠删单元的字节长度,若是则说明覆盖写操作后的写入对象不为小文件,若否则说明覆盖写操作后的写入对象仍为小文件。新数据的写入长度等于新数据字节长度与偏移量之和;
步骤15:计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作,并删除所述覆盖写请求的写入对象的小文件标识;
步骤16:根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求。
作为对于图1对应实施例的进一步介绍,在接收到写数据请求之后,还可以判断该写数据请求是否为包括小文件标识的预设请求,其中,所述预设请求包括修改写请求和追加写请求。当接收到包括小文件标识的覆盖写请求时,还可以执行以下步骤:
步骤21:判断所述预设请求的写入对象是否包括小文件标识;若是,则进入步骤22;若否,则计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘;
步骤22:判断执行所述预设请求后新数据的写入长度是否大于所述纠删单元的字节长度;若是,则进入步骤23;若否,则进入步骤24;
其中,所述新数据的写入长度等于新数据字节长度与偏移量之和;
步骤23:执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作,并删除所述预设请求的写入对象的小文件标识;
步骤24:执行根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求的操作。
作为对于图1对应实施例的进一步介绍,计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的过程可以包括以下步骤:
步骤31:对待写入数据的末位补零直至所述待写入数据的字节长度等于纠删条带的字节长度的整数倍;
步骤32:将所述待写入数据平均划分为多个字节长度等于所述纠删条带的目标数据块,并将每一所述目标数据块平均划分为K个字节长度等于所述纠删单元的数据子块;
步骤33:将每一所述目标数据块中第i个数据子块进行拼接得到K个源数据块;其中,1≤i≤K;
步骤34:对每一所述源数据块中的数据子块进行纠删计算得到M个校验数据块;
步骤35:将所述源数据块和所述校验数据块依次写入所述存储端的K+M个磁盘。
下面通过实际应用中的例子说明步骤31~步骤35的实现过程,请参见图2,图2为本申请实施例所提供的一种纠删码计算过程的原理示意图,本实施例中纠删单元的字节长度为4KB,纠删条带的字节长度为1MB,本实施例可以包括以下步骤:
步骤41:将写入的数据按照纠删条带对齐,最后不足一个纠删条带的部分补0。纠删条带是纠删码机制下读写数据的最小单元;
步骤42:将每个纠删条带根据纠删单元进行切分,得到一系列4KB的数据块;
步骤43:将每个纠删条带中的第一个数据块进行拼接,得到一个1MB的数据块;后续的依次类推,最终生成4个1MB的数据块;
步骤44:将每个纠删条带中的4个数据块进行计算,分别得到2个4KB的校验块,最后将所有的校验块进行拼接,得到2个1MB的校验块;
步骤45:经过纠删计算后,一个4MB的写入数据最终生成了4个1MB的数据块和2个1MB的校验块,然后将这6份数据分别保存到不同的磁盘上。在读取数据时,只需要读取其中的4份数据并进行纠删码的逆运算,即可还原出原始数据。
当写入的是小文件时,例如4KB的文件,若按照步骤41~45的流程,首先会按照纠删条带对齐,将其填充成16KB,其中的12KB都是0;然后切分成4个4KB的数据块,并计算出两个4KB的校验块;最后将这6份数据分别存储到不同的磁盘上。由于文件较小,除了一个数据块有数据外,其余5个数据块的数据全是0。当读取数据时,仍需要读取4份数据,然后经过纠删逆运算,得到一个16KB的数据段,最后截取前4KB的数据返回给客户端。然而这种方式,将会严重降低小文件的读取速度,而单个请求的阻塞又会拖累整个分布式存储集群的性能,导致对大文件的正常访问也会变得卡顿。因此,可以将S101~S105、步骤21~步骤24、步骤31~步骤35的实施例相结合得到进一步的实施方式,请参见图3,图3为本申请实施例所提供的一种分布式存储系统中基于纠删的小文件优化方法的流程图,图3中的“执行原来的纠删计算流程”为上文中步骤31~步骤35的实现过程,图3中offset+length为数据的写入长度(即数据字节长度与偏移量之和)。
图3提供了一种在分布式存储中基于纠删码的小文件优化方法,即通过调大纠删单元的方式,使小文件免于纠删计算过程,且最终以一种类似于副本的方式存储到磁盘中;当读取数据时,只需要从一份副本中获取数据即可。这种方式可以在纠删码冗余技术下提高对小文件的读写性能。本实施例可以包括以下过程:
在存储中新加一个配置项,配置小文件的后缀。在大小文件混合场景下,小文件一般有固定的文件后缀,例如视频和图片混合存储场景下的*.jpg图片文件、一个大文件对应一系列索引文件场景下的*.xml文件等。当客户端访问到指定后缀名的文件时即可确认当前文件为小文件,后续向存储发送的读写请求中都需要携带小文件标识。
存储端根据不同场景下小文件的大小,预先设置合适的纠删单元大小,且纠删单元大小大于小文件大小。纠删单元需要在创建存储池之前指定,且后续无法修改,因此需要提前根据业务场景进行规划。例如视频和图片混合场景下,图片大小一般为400~500KB,因此可以设置纠删单元大小为512KB;大文件和索引文件混合存储场景下,xml文件一般小于10KB,因此可以设置纠删单元大小为16KB。
当存储端收到带有小文件标识的写请求时,首先判断是否为创建写,即对象不存在,如果是则继续判断写入数据的offset+length是否小于等于配置的纠删单元大小,是则执行以下步骤:
(1)将写入的数据封装成M+1个子请求,每个子请求写入的数据均相同(K+M纠删最多允许M个节点同时宕机,因此为了数据的安全性,至少需要写入M+1个副本);然后继续封装K-1个创建空对象的子请求;
(2)主OSD将写副本数据的子请求发送给当前PG对应的OSD向量中的前M+1个OSD,将创建空对象的子请求发送给OSD向量中剩下的K-1个OSD;
其中,PG(Place Group,放置组)是处理读写请求的最小单元,一个PG对应一个OSD(Object Storage Device,对象存储设备)向量,例如在4+2纠删中,一个PG对应6个OSD,且OSD向量中的第一个OSD为主OSD,其余为从OSD。OSD即上文中提到的磁盘。
(3)将小文件标识设置到对象的属性中;
如果offset+length大于纠删单元大小,则执行原来的纠删计算流程。
如果是覆盖写、修改写或者追加写,即对象已经存在,则首先获取对象的小文件标识,如果获取失败或者小文件标识为false,说明之前走的是原有流程,则继续按照原来的纠删计算流程执行;小文件标识为true时说明之前的数据是以副本的形式存在。完全覆盖写时可以直接按照优化后的流程执行;修改写或追加写由于可能涉及到文件大小的改变,且改变后的文件大小可能超出纠删单元的大小,因此需要先读取原数据并在内存中合并,然后判断新的文件大小是否小于等于纠删单元的大小,是则执行优化后的流程,将数据回写到磁盘上;否则执行原来的纠删计算流程,同时清理之前写入的数据和小文件标识属性。
当存储端收到带有小文件标识的读请求时,首先去获取对象的小文件标识,如果获取失败或者小文件标识为false,则执行原来的纠删流程;否则直接从当前OSD保存的副本中返回数据。
本实施例通过预先调整纠删单元大小,并将小文件以一种类似于副本的方式进行读写处理,可以极大的提高在纠删码冗余下的小文件的读写性能,并有效降低整个存储集群的访问时延,拓展了存储产品的使用场景。
请参见图4,图4为本申请实施例所提供的一种数据写入系统的结构示意图;
该系统可以包括:
字节长度设置模块100,用于设置存储端中纠删单元的字节长度;其中,所述纠删单元的字节长度等于预设小文件的字节长度;
创建写判断模块200,用于当接收到包括小文件标识的创建写请求时,根据所述创建写请求判断待写入长度是否大于所述纠删单元的字节长度;其中,所述待写入长度等于待写入数据字节长度与偏移量之和;
纠删码计算模块300,用于若待写入长度大于所述纠删单元的字节长度,则计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘;
请求创建模块400,用于若待写入长度小于或等于所述纠删单元的字节长度,则根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求;其中,每个所述写副本数据子请求对应的写入的数据相同,K为预设纠删码冗余规则的源数据块数量,M为所述预设纠删码冗余规则的校验数据块数量;
数据写入模块500,用于将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据。
本实施例首先设置纠删单元的字节长度,在接收到包括小文件标识的创建写请求时,判断待写入长度是否大于纠删单元的字节长度。由于纠删单元的字节长度根据预设小文件的字节长度,因此可以基于纠删单元判断要写入的数据是否超过小文件的存储范围。若待写入长度大于纠删单元的字节长度,则判定需要创建写的文件不为小文件,可以计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘。若写入长度小于或等于纠删单元的字节长度,则判定需要创建写的文件为小文件,可以根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求,以便直接将待写入数据存储至副本中。若接收到读取小文件的请求时,可以读取任一副本得到对应的小文件,使小文件免于纠删计算过程。可见,本实施例能够优化数据存储方式,提高数据读取效率。
进一步的,还包括:
第一标识判断模块,用于当接收到包括小文件标识的覆盖写请求时,判断所述覆盖写请求的写入对象是否包括小文件标识;
第一纠删计算模块,用于若所述覆盖写请求不包括小文件标识,则执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作;
完全覆盖判断模块,用于若所述覆盖写请求包括小文件标识,则确定所述覆盖写请求的写入对象的原数据,并判断所述覆盖写请求对应的待写入数据的字节长度是否与所述原数据的字节长度相同;若相同,则执行根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求的操作;若不相同,则根据所述原数据和所述覆盖写请求对应的待写入数据确定新数据,并判断所述新数据的写入长度是否大于所述纠删单元的字节长度;其中,所述新数据的写入长度等于新数据字节长度与偏移量之和;若大于所述纠删单元的字节长度,则执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作,并删除所述覆盖写请求的写入对象的小文件标识;若不大于所述纠删单元的字节长度,则执行根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求的操作。
进一步的,还包括:
第二标识判断模块,用于当接收到包括小文件标识的预设请求时,判断所述预设请求的写入对象是否包括小文件标识;其中,所述预设请求包括修改写请求和追加写请求;
第二纠删计算模块,用于若所述预设请求不包括小文件标识,则执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作;
新数据长度判断模块,用于若所述预设请求包括小文件标识,则判断执行所述预设请求后新数据的写入长度是否大于所述纠删单元的字节长度;其中,所述新数据的写入长度等于新数据字节长度与偏移量之和;若大于所述纠删单元的字节长度,则执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作,并删除所述预设请求的写入对象的小文件标识;若不大于所述纠删单元的字节长度,则执行根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求的操作。
进一步的,纠删码计算模块300包括:
补位单元,用于对待写入数据的末位补零直至所述待写入数据的字节长度等于纠删条带的字节长度的整数倍;
条带划分单元,用于将所述待写入数据平均划分为多个字节长度等于所述纠删条带的目标数据块,并将每一所述目标数据块平均划分为K个字节长度等于所述纠删单元的数据子块;
拼接单元,用于将每一所述目标数据块中第i个数据子块进行拼接得到K个源数据块;其中,1≤i≤K;
校验数据计算单元,用于对每一所述源数据块中的数据子块进行纠删计算得到M个校验数据块;
存储单元,用于将所述源数据块和所述校验数据块依次写入所述存储端的K+M个磁盘。
进一步的,数据写入模块500具体用于将所述M+1个写副本数据子请求分别发送至所述存储端的前M+1个磁盘,并将所述K-1个创建空对象子请求分别发送至所述存储端的第M+2至第M+K个磁盘,以便在前M+1个磁盘中均写入相同的待写入数据。
进一步的,还包括:
标识添加模块,用于在将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据之后,为所述创建写请求对应的文件添加小文件标识。
进一步的,还包括:
数据读取单元,用于若接收到包括小文件标识的读请求时,确定所述读请求对应的读取对象;还用于判断所述读取对象是否包括小文件标识;若是,则从磁盘中读取所述读请求对应的数据;若否,则通过执行纠删码逆运算得到所述读请求对应的数据。
由于系统部分的实施例与方法部分的实施例相互对应,因此系统部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本申请还提供了一种存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请还提供了一种电子设备,可以包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然所述电子设备还可以包括各种网络接口,电源等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种数据存储方法,其特征在于,包括:
设置存储端中纠删单元的字节长度;其中,所述纠删单元的字节长度等于预设小文件的字节长度;
当接收到包括小文件标识的创建写请求时,根据所述创建写请求判断待写入长度是否大于所述纠删单元的字节长度;其中,所述待写入长度等于待写入数据字节长度与偏移量之和;
若是,则计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘;
若否,则根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求;其中,每个所述写副本数据子请求对应的写入的数据相同,K为预设纠删码冗余规则的源数据块数量,M为所述预设纠删码冗余规则的校验数据块数量;
将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据。
2.根据权利要求1所述数据存储方法,其特征在于,还包括:
当接收到包括小文件标识的覆盖写请求时,判断所述覆盖写请求的写入对象是否包括小文件标识;
若所述覆盖写请求不包括小文件标识,则执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作;
若所述覆盖写请求包括小文件标识,则确定所述覆盖写请求的写入对象的原数据,并判断所述覆盖写请求对应的待写入数据的字节长度是否与所述原数据的字节长度相同;
若相同,则执行根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求的操作;
若不相同,则根据所述原数据和所述覆盖写请求对应的待写入数据确定新数据,并判断所述新数据的写入长度是否大于所述纠删单元的字节长度;其中,所述新数据的写入长度等于新数据字节长度与偏移量之和;
若大于所述纠删单元的字节长度,则执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作,并删除所述覆盖写请求的写入对象的小文件标识;
若不大于所述纠删单元的字节长度,则执行根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求的操作。
3.根据权利要求1所述数据存储方法,其特征在于,还包括:
当接收到包括小文件标识的预设请求时,判断所述预设请求的写入对象是否包括小文件标识;其中,所述预设请求包括修改写请求和追加写请求;
若所述预设请求不包括小文件标识,则执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作;
若所述预设请求包括小文件标识,则判断执行所述预设请求后新数据的写入长度是否大于所述纠删单元的字节长度;其中,所述新数据的写入长度等于新数据字节长度与偏移量之和;
若大于所述纠删单元的字节长度,则执行计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘的操作,并删除所述预设请求的写入对象的小文件标识;
若不大于所述纠删单元的字节长度,则执行根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求的操作。
4.根据权利要求1所述数据存储方法,其特征在于,所述计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘包括:
对待写入数据的末位补零直至所述待写入数据的字节长度等于纠删条带的字节长度的整数倍;
将所述待写入数据平均划分为多个字节长度等于所述纠删条带的目标数据块,并将每一所述目标数据块平均划分为K个字节长度等于所述纠删单元的数据子块;
将每一所述目标数据块中第i个数据子块进行拼接得到K个源数据块;其中,1≤i≤K;
对每一所述源数据块中的数据子块进行纠删计算得到M个校验数据块;
将所述源数据块和所述校验数据块依次写入所述存储端的K+M个磁盘。
5.根据权利要求1所述数据存储方法,其特征在于,将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据,包括:
将所述M+1个写副本数据子请求分别发送至所述存储端的前M+1个磁盘,并将所述K-1个创建空对象子请求分别发送至所述存储端的第M+2至第M+K个磁盘,以便在前M+1个磁盘中均写入相同的待写入数据。
6.根据权利要求1所述数据存储方法,其特征在于,在将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据之后,还包括:
为所述创建写请求对应的文件添加小文件标识。
7.根据权利要求1至6任一项所述数据存储方法,其特征在于,还包括:
若接收到包括小文件标识的读请求时,确定所述读请求对应的读取对象;
判断所述读取对象是否包括小文件标识;
若是,则从磁盘中读取所述读请求对应的数据;
若否,则通过执行纠删码逆运算得到所述读请求对应的数据。
8.一种数据存储系统,其特征在于,包括:
字节长度设置模块,用于设置存储端中纠删单元的字节长度;其中,所述纠删单元的字节长度等于预设小文件的字节长度;
创建写判断模块,用于当接收到包括小文件标识的创建写请求时,根据所述创建写请求判断待写入长度是否大于所述纠删单元的字节长度;其中,所述待写入长度等于待写入数据字节长度与偏移量之和;
纠删码计算模块,用于若待写入长度大于所述纠删单元的字节长度,则计算待写入数据的纠删码并将所述纠删码存储至对应的磁盘;
请求创建模块,用于若待写入长度小于或等于所述纠删单元的字节长度,则根据待写入数据封装M+1个写副本数据子请求,并封装K-1个创建空对象子请求;其中,每个所述写副本数据子请求对应的写入的数据相同,K为预设纠删码冗余规则的源数据块数量,M为所述预设纠删码冗余规则的校验数据块数量;
数据写入模块,用于将所述写副本数据子请求和所述空对象子请求发送至对应的磁盘以便写入数据。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如权利要求1至7任一项所述数据存储方法的步骤。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上权利要求1至7任一项所述数据存储方法的步骤。
CN202010820144.7A 2020-08-14 2020-08-14 一种数据存储方法、系统、电子设备及存储介质 Active CN112000627B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010820144.7A CN112000627B (zh) 2020-08-14 2020-08-14 一种数据存储方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010820144.7A CN112000627B (zh) 2020-08-14 2020-08-14 一种数据存储方法、系统、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112000627A true CN112000627A (zh) 2020-11-27
CN112000627B CN112000627B (zh) 2022-08-05

Family

ID=73473763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010820144.7A Active CN112000627B (zh) 2020-08-14 2020-08-14 一种数据存储方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112000627B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860488A (zh) * 2021-02-19 2021-05-28 北京金山云网络技术有限公司 对象的恢复方法和装置、电子设备和存储介质
CN113311993A (zh) * 2021-03-26 2021-08-27 阿里巴巴新加坡控股有限公司 数据存储方法及数据读取方法
CN113608695A (zh) * 2021-07-29 2021-11-05 济南浪潮数据技术有限公司 一种数据处理方法、系统、设备以及介质
CN114415976A (zh) * 2022-03-28 2022-04-29 深圳市杉岩数据技术有限公司 一种分布式数据存储系统与方法
CN114489508A (zh) * 2022-01-26 2022-05-13 重庆紫光华山智安科技有限公司 数据管理方法、装置、设备及介质
CN114936188A (zh) * 2022-05-30 2022-08-23 重庆紫光华山智安科技有限公司 数据处理方法、装置、电子设备及存储介质
CN115437581A (zh) * 2022-11-08 2022-12-06 浪潮电子信息产业股份有限公司 一种数据处理方法、装置、设备及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107608820A (zh) * 2017-09-26 2018-01-19 郑州云海信息技术有限公司 一种基于纠删码的文件写入方法及相关装置
CN107608821A (zh) * 2017-09-29 2018-01-19 郑州云海信息技术有限公司 一种基于纠删码的数据读取方法、装置、设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107608820A (zh) * 2017-09-26 2018-01-19 郑州云海信息技术有限公司 一种基于纠删码的文件写入方法及相关装置
CN107608821A (zh) * 2017-09-29 2018-01-19 郑州云海信息技术有限公司 一种基于纠删码的数据读取方法、装置、设备

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860488A (zh) * 2021-02-19 2021-05-28 北京金山云网络技术有限公司 对象的恢复方法和装置、电子设备和存储介质
CN113311993A (zh) * 2021-03-26 2021-08-27 阿里巴巴新加坡控股有限公司 数据存储方法及数据读取方法
CN113311993B (zh) * 2021-03-26 2024-04-26 阿里巴巴创新公司 数据存储方法及数据读取方法
CN113608695A (zh) * 2021-07-29 2021-11-05 济南浪潮数据技术有限公司 一种数据处理方法、系统、设备以及介质
CN114489508A (zh) * 2022-01-26 2022-05-13 重庆紫光华山智安科技有限公司 数据管理方法、装置、设备及介质
CN114489508B (zh) * 2022-01-26 2023-09-01 重庆紫光华山智安科技有限公司 数据管理方法、装置、设备及介质
CN114415976A (zh) * 2022-03-28 2022-04-29 深圳市杉岩数据技术有限公司 一种分布式数据存储系统与方法
CN114936188A (zh) * 2022-05-30 2022-08-23 重庆紫光华山智安科技有限公司 数据处理方法、装置、电子设备及存储介质
CN115437581A (zh) * 2022-11-08 2022-12-06 浪潮电子信息产业股份有限公司 一种数据处理方法、装置、设备及可读存储介质
CN115437581B (zh) * 2022-11-08 2023-03-24 浪潮电子信息产业股份有限公司 一种数据处理方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN112000627B (zh) 2022-08-05

Similar Documents

Publication Publication Date Title
CN112000627B (zh) 一种数据存储方法、系统、电子设备及存储介质
JP6778795B2 (ja) データを記憶するための方法、装置及びシステム
WO2019001521A1 (zh) 数据存储方法、存储设备、客户端及系统
CN104765693A (zh) 一种用于存储数据的方法、装置和系统
US7882420B2 (en) Method and system for data replication
WO2016115920A1 (zh) 存储管理方法、装置及流媒体系统
US10572335B2 (en) Metadata recovery method and apparatus
CN110413454B (zh) 基于存储阵列的数据重建方法、装置及存储介质
CN103631539A (zh) 基于擦除编码机制的分布式存储系统及其存储方法
WO2024040857A1 (zh) 磁盘阵列初始化方法、系统、电子设备及存储介质
US8903804B2 (en) Data existence judging device and data existence judging method
CN112749039A (zh) 用于数据写入和数据恢复的方法、设备和程序产品
CN112612576A (zh) 虚拟机备份方法、装置、电子设备及存储介质
US8683121B2 (en) Storage system
EP3449372B1 (en) Fault-tolerant enterprise object storage system for small objects
CN107193693A (zh) 一种基于存储系统的在线数据存储优化方法
US20200372001A1 (en) Deduplication storage method, deduplication storage control device, and deduplication storage system
US7873799B2 (en) Method and system supporting per-file and per-block replication
CN109426590A (zh) 用于数据节点存储数据的方法和用于恢复数据的方法
US20140258654A1 (en) Storage system
CN115562595B (zh) 一种卷创建方法及装置、卷读写方法及装置、电子设备
CN108052294B (zh) 一种分布式存储系统的修改写方法和修改写系统
CN112148220B (zh) 一种实现数据处理的方法、装置、计算机存储介质及终端
CN114968671B (zh) 克隆卷的实现方法及装置
JP2010191903A (ja) 分散ファイルシステムのストライピング種別選択方法及びその分散ファイルシステム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant