CN111143232A - 用于存储元数据的方法、设备和计算机程序产品 - Google Patents

用于存储元数据的方法、设备和计算机程序产品 Download PDF

Info

Publication number
CN111143232A
CN111143232A CN201811302936.4A CN201811302936A CN111143232A CN 111143232 A CN111143232 A CN 111143232A CN 201811302936 A CN201811302936 A CN 201811302936A CN 111143232 A CN111143232 A CN 111143232A
Authority
CN
China
Prior art keywords
key
sequence
coroutine
value pairs
value pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811302936.4A
Other languages
English (en)
Other versions
CN111143232B (zh
Inventor
吴雨润
吴佳磊
孙骜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMC Corp
Original Assignee
EMC IP Holding Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EMC IP Holding Co LLC filed Critical EMC IP Holding Co LLC
Priority to CN201811302936.4A priority Critical patent/CN111143232B/zh
Priority to US16/442,318 priority patent/US11106628B2/en
Publication of CN111143232A publication Critical patent/CN111143232A/zh
Application granted granted Critical
Publication of CN111143232B publication Critical patent/CN111143232B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/144Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0674Disk device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load

Abstract

本公开的实施例涉及用于存储元数据的方法、设备和计算机程序产品。该方法包括基于要存储的元数据项的集合,确定第一序列和第二序列,第一序列和第二序列分别包括多个键值对,每个键值对包括集合中一个元数据项以及与元数据项相对应的关键字。该方法还包括使得第一协程利用可用计算资源处理第一序列。该方法还包括响应于可用于第一协程处理第一序列的计算资源低于第一阈值,使得与第一协程不同的第二协程处理第二序列。通过使用该方法,可以提高处理器的利用率,并且使得元数据被更快地存储到外部存储装置。

Description

用于存储元数据的方法、设备和计算机程序产品
技术领域
本公开的实施例涉及数据的管理领域,具体地涉及用于存储元数据的方法、设备和计算机程序产品。
背景技术
随着计算机应用的增加,用户通过计算机来处理不同的任务。因此,导致用户的数据在计算机应用中变得越来越多。而对于用户数据的存储,采用大容量的存储设备来进行合理的存储变得越来越得重要。因此,存储设备提供商提供了各种不同类型的存储设备来存储海量的数据。通过利用这些存储设备,用户可以很方便的对数据进行存储、读取。
随着用户数据的增加,针对用户数据的元数据的量也在增加。对元数据的存储也开始变得重要。因此,为了存储元数据,存储设备提供商设计了针对元数据的各种存储结构。由于元数据比较重要,如何合理存储元数据变成了需要解决的问题。
发明内容
本公开的实施例提供了一种用于存储元数据的方法、设备和计算机程序产品。
根据本公开的第一方面,提供了一种用于存储元数据的方法。该方法包括基于要存储的元数据项的集合,确定第一序列和第二序列,第一序列和第二序列分别包括多个键值对,每个键值对包括集合中一个元数据项以及与元数据项相对应的关键字。该方法还包括使得第一协程利用可用计算资源处理第一序列。该方法还包括响应于可用于第一协程处理第一序列的计算资源低于第一阈值,使得与第一协程不同的第二协程处理第二序列。
根据本公开的第二方面,提供了一种用于存储元数据的电子设备。该电子设备包括处理器;以及存储器,存储有计算机程序指令,处理器运行存储器中的计算机程序指令控制电子设备执行动作,动作包括:基于要存储的元数据项的集合,确定第一序列和第二序列,第一序列和第二序列分别包括多个键值对,每个键值对包括集合中一个元数据项以及与元数据项相对应的关键字;使得第一协程利用可用计算资源处理第一序列;以及响应于可用于第一协程处理第一序列的计算资源低于第一阈值,使得与第一协程不同的第二协程处理第二序列。
根据本公开的第三方面,提供了一种计算机程序产品,该计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括机器可执行指令,该机器可执行指令在被执行时使机器执行本公开的第一方面中的方法的步骤。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
图1图示了根据本公开的实施例的设备和/或方法可以在其中被实施的示例环境100的示意图;
图2图示了根据本公开的实施例的用于示出元数据存储位置的示意图200;
图3图示了根据本公开的实施例的用于存储元数据的方法300的示意图;
图4图示了根据本公开的实施例的用于描述协程工作的示例400的示意图;
图5图示了根据本公开的实施例的用于存储元数据的一个过程500的示意图;
图6图示了根据本公开的实施例的用于存储元数据的另一个过程500的示意图;
图7图示了根据本公开的实施例的用于描述元数据存储位置的示例700的示意图;
图8图示了适于用来实施本公开内容的实施例的示例设备800的示意性框图。
在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
下面将参考附图中示出的若干示例实施例来描述本公开的原理。虽然附图中显示了本公开的优选实施例,但应当理解,描述这些实施例仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。
针对用户数据的元数据的存储,一般会将元数据从存储器中存储到外部存储装置中。在外部存储装置中采用特定的数据结构来存储元数据以便于元数据的读取和获得。在存储元数据时,一般会采用单个线程来进行数据存储。然而,由于在存储元数据的过程会先将外部存储装置中的数据页中的数据块读取到存储引擎中,然后将要存储的元数据更新到该数据块,然后再将数据块冲刷到外部存储装置。
在该过程中涉及与外部存储装置的交互。然而,在从外部存储装置读取数据和向存储装置写入数据时,由于输入输出过程比较慢,处理器在进行输入输出的过程中不能被充分利用。因此,降低了元数据存储到外部存储装置的速度,也降低了计算资源的利用率。
为了提高将元数据存储到外部存储装置的速度,一般会采用多线程并行处理元数据的存储。然而,由于并行线程在处理数据的过程中是竞争资源的。因此,为了保证数据的一致性,对两个线程都要处理的数据页需要进行锁定处理等。这种竞争使得计算资源过多的处理这些事务,从而降低了并行带来的好处。因此,多线程并行也存在处理器利用率且存储速度慢的问题。
为了解决上述问题,本公开提出了一种用于存储元数据的方法。在该方法中采用协程来处理待存储的元数据。在处理过程中,通过将要存储的多个元数据及元数据的关键字划分为多个序列,然后将多个序列分配给多个协程进行处理。在协程处理这些序列的过程中,将与序列中的第一个元数据的关键字相关联的数据块标识为关键数据块。协程会用元数据及元数据的关键字更新其所在的数据块并将非关键数据块存储到外部存储装置。在协程完成非关键数据块的存储后,再统一对关键数据块进行存储。通过使用该方法,在一个协程输入输出数据时调用另一个协程,使得协程可以充分的利用计算资源,提高了将元数据存储到外部存储装置的效率,进而改进了整个存储系统处理数据的速度。
图1图示了根据本公开的实施例的设备和/或方法可以在其中被实施的示例环境100的示意图。
该示例环境100包括设备102,该设备102用于获得针对用户数据的元数据,并将用户数据的元数据存储在存储器104上。
该设备102可以实现为任何类型的设备,包括但不限于移动电话(例如,智能手机)、膝上型计算机、便携式数字助理(PDA)、电子书(电子书)阅读器、便携式游戏机、便携式媒体播放器、游戏机、机顶盒(STB)、智能电视(TV)、个人计算机、膝上型计算机、车载计算机(例如,导航单元)等。
设备102内具有存储器104。该存储器104用于保存元数据据。当该存储器104内保存的元数据超过预定量时,存储器104中的元数据会被转移到存储装置108。在一个示例中,在存储器104内以键值对的形式存储元数据。该键值对中的值对应于元数据,而键为从元数据获得的关键字。备选地,附加地,在存储器104中存储的键值对是以键的大小进行排序而进行存储的。上述示例仅是用于说明本公开,而非对本公开的具体限定。在存储器104内可以任意合适的方式存储元数据。
设备102还包括存储引擎106。该存储引擎106用于将存储器104内的数据存储到存储装置108中。在存储引擎106内可以执行包括多个协程的进程,以通过多个协程以非抢占资源的方式相互协作完成元数据的存储。
存储引擎106将元数据以各种数据结构存储到存储装置中。在一个示例中,该数据结构为树结构。备选地或附加地,该树结构可为B+树结构或B-树结构。上述示例仅是用于说明本公开,而非对本公开的限定。可以采用任意合适的数据结构存储元数据。
以B+树结构作为示例描述存储过程,其包括三个阶段:路径搜索,数据块更新和数据块刷新。路径搜索是查找从根页面到包含搜索关键字的非常页面的路径。
如图2所示,树结构包括叶子页面202,索引页面204和206,叶子页面208、210、212、214、216。键218包括0x10,其指向叶子页面208,键220包括0x30,其指向叶子页面210,键222包括0x06,其指向叶子页面216。数据块更新是在页面的数据块中插入、更新或删除键值。在数据块大小超过或低于阈值时拆分或合并页面。插入后的数据块被标记为脏,如图2中的页面208,210和214。数据块刷新是将脏数据块写入磁盘中的页面并更新其父页面中的地址引用。
在图2中,在将数据块存储到页面208和210之后,将两个页面的新地址插入它们的公共父页面中。第一和第三阶段需要耗时的磁盘输入/输出(I/O)操作。第二阶段是存储器104内操作,比磁盘I/O快得多。如果两个或多个密钥指向同一个叶子页面,则磁盘I/O操作可以在很大程度上保存为一个数据块写入和多个数据块读取(路径搜索)。
存储引擎106可以包括处理器,其包括但不限于硬件中央处理单元(CPU)、现场可编程门阵列(FPGA)、复合可编程逻辑器件(CPLD)、专用集成电路(ASIC)、片上系统(SoC)或其组合。
存储装置108用于存储从设备102输出的元数据,并且还可以在接收到从设备102发出的读请求后,向设备102提供元数据。
上面结合图1和图2描述了本公开的实施例的设备和/或方法可以在其中被实施的示例环境的示意图,下面结合图3和图4详细描述本公开的用于存储元数据的方法。
设备102将获得的元数据项及与该元数据项相对应的关键字形成为一个键值对进行存储。在存储器104内存储的键值对满足预定条件时将被存储到存储装置108。在一个示例中,存储的键值对的数目达到阈值数目时,将存储器104内的键值对存储到存储装置108。在另一个示例中,存储器104中没有足够的存储空间用于存储新的键值对时,将存储器104内的键值对存储到存储装置108。上述示例仅是用于描述本公开,而非对本公开的具体限定。因此,可以基于任意合适的条件将存储器104内的键值对存储到存储装置108。
在框302处,基于要存储的元数据项的集合,确定第一序列和第二序列。其中术语“第一”、“第二”等等可以指代不同的或相同的对象。在本公开的示例中,还可以存在其他序列。第一序列和第二序列是多个序列中的两个。每个序列分别包括多个键值对,每个键值对包括集合中一个元数据项以及与元数据项相对应的关键字。在一个示例中,将与元数据项的集合对应的多个键值对被分为多个序列。该多个键值对是基于其中的键进行排序的。上述示例仅是用于说明本公开,而非对本公开的具体限定。可以基于需要以任意合适的方式存储键值对。
在一个示例中,对与元数据项的集合相对应的多个键值对进行平均,以使得每个序列中的键值对是相同的。在另一个示例中,可以基于任何合适的规则对多个键值对进行划分。
在框304处,使得第一协程利用可用计算资源处理第一序列。在将第一序列分配给第一协程后,第一协程将对第一序列的键值对进行处理以将第一序列中的键值对存储到存储装置108中。该第一协程可以为多个协程中的任意一个,其只是用于描述本公开,而非对公开的具体限定。
在框306处,确定可用于第一协程处理第一序列的计算资源低于第一阈值。在一个示例中,如果第一协程处理与第一序列相关联的、针对存储装置的输入/输出操作,则表明第一协程所使用的计算资源低于第一预定阈值。此时可以调用其他协程来处理另一序列。在另一个示例中,响应于第一协程处理的、与第一序列相关联的输入/输出操作的数目超过阈值数目,确定第一协程所使用的计算资源低于第一阈值。上述示例仅是用于描述本公开,而非对本公开的具体限定。可以基于需要采用任意合适的方式确定第一协程的计算资源的是否低于第一阈值。
如果可用于第一协程处理第一序列的计算资源低于第一阈值,在框308处,使得与第一协程不同的第二协程处理第二序列。备选地或附加地,使得第一协程停止处理第一序列。下面通过图4说明两个协程处理数据的过程。应当注意,其仅是用于说明本公开,而非对本公开的限定。任意数目的协程可以用于本公开。
图4示出了根据本公开的实施例的用于描述协程工作的示例400的示意图。如图4所示,第一协程执行框402、406、410,第二协程执行框404、408、412。如果第一协程在框402处从存储装置108(查询页面)或在框406处从存储装置108读取页面中的数据块,则表明第一协程使用的计算资源低于第一预定阈值,此时第二协程被调用以进行其他键值对序列的处理。如果第一协程在框410处向存储装置108的页面中写入数据时,则表明第一协程使用的计算资源低于第一预定阈值,此时第二协程被调用以进行其他键值对序列的处理。同样,第二协程在执行框404、408和412时,会调用第一协程进行处理。上述示例仅是用于描述本公开,而非对本公开的具体限定。在存在多个序列和多个协程时,可以基于需要或预设的准则将其他任意一个合适的协程确定为第二协程。
在一个示例中,在调用第二协程进行键值对序列的处理时,需要确认第二协程是否已经完成针对存储装置108的输入/输出操作。只有第二协程已经完成该输入/输出操作,该第二协程才能利用计算资源进行数据处理。上述示例仅是用于描述本公开,而非对本公开的具体限定。可以基于需要设置执行第二协程的条件。
备选地或附加地,在可用于第一协程处理第一序列的计算资源高于第一阈值的情况下,第一协程可以继续处理第一序列。因此,通过协程间的相互调度来实现对计算资源的合理利用。
通过执行用于存储元数据的过程300,可以在一个协程进行输入/输出数据时调用第二协程来利用计算资源处理数据。述种操作提高了计算资源的利用率,并且加快了将元数据存储到外部装置的速度,从而提高了整个存储系统的数据处理能力。
上面图3和图4描述了用于存储元数据的过程。下面将结合图5、图6和图7详细描述在通过协程存储元数据的过程。
图5图示了根据本公开的实施例的用于存储元数据的一个过程500的示意图。在图5所示的实施例中,协程接收分配的待处理的序列。将对序列中的键值对对进行处理以将序列中的键值对存储到存储装置中。
在框502处,确定存储装置中包括的与第一序列中的第一键值对相匹配的关联键值对。第一键值对中的第一关键字与关联键值对中的第二关键字匹配。
在一个示例中,该关联键值对为存储装置中存储的具有第一键值对中的关键字的键值对,即第一关键字与第二关键字相同。在另一个示例中,该关联键值对为存储装置中存储的具有与第一键值对中的关键字相近的键值对,即第一关键字与第二关键字相近。上述示例仅用于说明,而非对本公开的限定。可以基于需要以任意合适的方式确定与第一关键字匹配的第二关键字。
备选地或附加地,如果针对元数据项的键值对是以树结构存储的。例如,该树结构可以为B+树或B-树。该关联键值对包括用于存储元数据的叶子页中的与第一键值对中的键相匹配的键值对,还包括查找叶子页的过程中经过的所有索引页中与第一键值对中的键相匹配的键值对。
如图7所示,以B+树作为示例描述针对元数据项的键值对的存储结构。在图7中,存在根页702、索引页704、706、708、710、712、714和716,还存在底层的叶子页,包括叶子页718、720和722。叶子页中用于存储包括元数据的键值对。根页702和索引页704、706、708、710、712、714和716存储到叶子页的索引映射。
在计算设备102中要存储的针对元数据的键值对可以被划分为多个序列。在图7中要存储的针对元数据项的键值对被划分为三个序列712、726和728。上述示例只是用于说明本公开,而非对本公开的限定。可以基于需要设置任意合适数目的序列。
与序列724的第一键值对相匹配的关联键值存在于叶子页718、索引页708、704、和根页702上。与序列726的第一键值对相匹配的关联键值对存在于叶子页720、索引页710、704和根页702上。与序列728的第一键值对相匹配的关联键值对存在于叶子页722、索引页714、706和根页702上。
在框504处,获得所述关联键值对所在的存储装置中的关键存储页面中的键值对集合。在一个示例中,将所述关联键值对所在的页面标记为关键页面。从上述关键页面获得存储的键值对集合。备选地或附加地,由于第一序列的第一键值对的关联键值对所在的页面不被其他协程使用,因此,处理该第一序列的协程可以不将关联键值对所在的页面标记为关键页面。
如图7所示,与第二序列726和第三序列728相关联的页面720、722、710、714、704、706和702被标记为关键页面。从页面720、722、710、714、704、706和702获得键值对集合。而与第一序列724相关联的页718和708未被标记为关键页。
在框506处,利用第一键值对更新键值对集合。在确定了与第一键值对相关联的键值对集合后,用第一键值对更新该键值对集合。该更新操作包括插入、修改或删除操作。
由于一个协程中的针对第一键值对的关键页面中的键值对集合可能会被另一协程使用,因此,在协程处理元数据的过程中并不对关键存储页面中的键值对集合的大小进行调整,即不会将关键页面的键值对集合进分划分或组合。同时,协程也不将关键存储页面中的键值对集合存储到存储装置108中。
在框508处,确定第一协程和第二协程完成针对第一序列和第二序列的处理。备选地或附加地,如果采用多个协程处理多个序列,需要确定多个协程中的每个协程均完成处理分配给它的序列。
如果第一协程和第二协程完成针对第一序列和第二序列的处理,在框510处,则将更新后的键值对集合存储到关键存储页面。
在将针对关键存储页面的键值对集合进行存储时,先确定是否调整键值对集合的大小。一个示例中,判断更新后的针对关键存储页面的键值对集合的数据量是否在第一页面数据量和第二页数据量之间。如果超过了第一页面数据量,则需要对键值对集合进行划分。如果低于第二页面数据量,则需要对键值对集合进行合并。上述示例仅是用于说明本公开,而非对本公开的具体限定。可以基于需要设置键值对集合大小调整的条件以及进行调整的阈值量。
在一个示例中,如果针对所有序列的协程均完成了相应的操作,则将在每个协程中更新过的针对关键存储页面的键值对集合存储到存储装置中。在一个示例中,在存储键值对集合的过程中,先存储用于存储元数据的键值对集合到叶子关键存储页面。备选地或附加地,该叶子关键存储页面的位置不同于读取键值对集合时的叶子关键存储页面的位置。然后将叶子关键页面的地址返回给存储引擎106以更新与叶子页面相关联的第一级索引页面。更新完与叶子关键页面相关联的第一级索引页面,存储第一级索引页面,然后用第一级索引页面的地址更新第二级索引页面,直至存储完所有的页面。
在上述过程中,将两个协程可能会用到的共享键值对集合存储在存储器104中,而不是分别从外部存储装置读取。这种操作保证了数据处理的一致性。不会产生一个协程处理了该键值对集合而另一个协程不知道的情况,避免了信息处理的不一致性问题。
上面结合图5和图7描述了对于序列中的第一个键值对的处理。下面结合图6和图7描述对于序列中的其他键值对的处理。
在处理序列中的键值对时,在框602处,确定存储装置中包括的与第一序列中的第一键值对以外的剩余键值对相匹配的一组关联键值对。剩余键值对中的关键字分别与一组关联键值对中的关键字匹配。备选地或附加地,对于序列中的某个键值对,如果存储器104中保存有与其相对应的键值对集合,则从存储器104中存储的键值对集合确定其关联键值对。
在框604处,获得一组关联键值对所在的存储装置中的一组待更新存储页面,其中一组待更新存储页面中不包括关键存储页面。如果一组关联键值对中的键值对在关键存储页面上,则不需要获得新的存储页面。如果一组关联键值对中的键值对不在关键存储页面上,则需要确定一组待更新存储页面。
在框606处,利用剩余键值对,更新从一组待更新存储页面中所获取的键值对集合。在一个示例中,利用剩余键值对中不在关键页面上的键值对更新从一组待更新存储页面中所获取的键值对集合。对于剩余键值对中在关键页面上的键值对,直接用该键值对更新关键页面。
在框608处,将更新后的键值对集合分别存储到一组目标存储页面。一个示例中,由于该更新的键值对集合并不是关键页面的键值对集合,在更新完成后,可以判断更新后的键值对集合的数据量是否在第一页面数据量和第二页面数据量之间。如果超过了第一页面数据量,则需要对键值对集合进行划分。如果低于第二页面数据量,则需要对键值对集合进行合并。上述示例仅是用于说明本公开,而非对本公开的具体限定。可以基于需要设置键值对集合大小调整的条件以及进行调整的阈值量。
在一个示例中,将更新的键值对集合存储到队列中,如果存储的更新的键值对集合的数量超过阈值量,则将更新的键值对集合冲刷到外部存储装置。
在框610处,使得存储装置利用一组目标存储页面的地址来更新一组待更新存储页面的地址。在将更新的键值对集合存储到一组目标页面后,与其相对应的元数据项就存在了这些目标数据页中。为了保持数据的一致性,将存储装置中的待更新的存储页面的地址更新为目标存储页面的地址。在一个示例中,如果页面是以树结构进行存储的,则在存储更新的键值对集合的过程中,会先冲刷与叶子页相关联的更新的键值对集合到目标数据页。然后将该目标数据页的地址返给存储引擎106。存储引擎106用该地址更新第一层索引页,然后存储第一层索引页。然后用第一层索引页的地址更新第二层索引页。然后依次存储各层存储页。最终完成存储过程。
通过采用上述存储过程,可以将非关键页面中的数据直接存储到存储装置中,而不需要在协程间协调,加快了数据的存储过程,提高了存储效率。
图8示出了可以用来实施本公开内容的实施例的示例设备800的示意性框图。例如,如图1所示的102、104、106的任一项可以由设备800来实施。如图所示,设备800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的计算机程序指令或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序指令,来执行各种适当的动作和处理。在RAM803中,还可存储设备800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
上文所描述的各个过程和处理,例如方法300、500和600可由处理单元801执行。例如,在一些实施例中,方法300、500和600可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序被加载到RAM 803并由CPU 801执行时,可以执行上文描述的方法300、500和600的一个或多个动作。
本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (13)

1.一种用于存储元数据的方法,该方法包括:
基于要存储的元数据项的集合,确定第一序列和第二序列,所述第一序列和所述第二序列分别包括多个键值对,每个键值对包括所述集合中一个元数据项以及与所述元数据项相对应的关键字;
使得所述第一协程利用可用计算资源处理所述第一序列;以及
响应于可用于所述第一协程处理所述第一序列的计算资源低于第一阈值,使得与所述第一协程不同的第二协程处理所述第二序列。
2.根据权利要求1所述的方法,还包括:
响应于所述第一协程处理的、与所述第一序列相关联的输入/输出操作的数目超过阈值数目,确定所述第一协程所使用的所述计算资源低于所述第一阈值。
3.根据权利要求1所述的方法,还包括:
使得所述第一协程停止处理所述第一序列。
4.根据权利要求3所述的方法,还包括:
响应于可用于所述第一协程处理所述第一序列的计算资源高于所述第一阈值,使得所述第一协程继续处理所述第一序列。
5.根据权利要求1所述的方法,其中使得所述第一协程处理所述第一序列包括使得所述第一协程:
确定存储装置中包括的与所述第一序列中的第一键值对相匹配的关联键值对,所述第一键值对中的第一关键字与所述关联键值对中的第二关键字匹配;
获得所述关联键值对所在的所述存储装置中的关键存储页面中的键值对集合;
利用所述第一键值对更新所述键值对集合;
响应于所述第一协程和所述第二协程完成针对所述第一序列和所述第二序列的处理,将更新后的所述键值对集合存储到所述关键存储页面。
6.根据权利要求5所述的方法,其中使得所述第一协程处理所述第一序列包括使得所述第一协程:
确定存储装置中包括的与所述第一序列中的所述第一键值对以外的剩余键值对相匹配的一组关联键值对,所述剩余键值对中的关键字分别与所述一组关联键值对中的关键字匹配;
获得所述一组关联键值对所在的所述存储装置中的一组待更新存储页面,其中所述一组待更新存储页面中不包括所述关键存储页面;
利用所述剩余键值对,更新从所述一组待更新存储页面中所获取的键值对集合;
将更新后的所述键值对集合分别存储到一组目标存储页面;以及使得所述存储装置利用所述一组目标存储页面的地址来更新所述一组待更新存储页面的地址。
7.一种用于存储元数据的电子设备,所述电子设备包括:
处理器;以及
存储器,存储有计算机程序指令,处理器运行存储器中的所述计算机程序指令控制所述电子设备执行动作,所述动作包括:
基于要存储的元数据项的集合,确定第一序列和第二序列,所述第一序列和所述第二序列分别包括多个键值对,每个键值对包括所述集合中一个元数据项以及与所述元数据项相对应的关键字;
使得所述第一协程利用可用计算资源处理所述第一序列;以及
响应于可用于所述第一协程处理所述第一序列的计算资源低于第一阈值,使得与所述第一协程不同的第二协程处理所述第二序列。
8.根据权利要求7所述的电子设备,该动作还包括:
响应于所述第一协程处理的、与所述第一序列相关联的输入/输出操作的数目超过阈值数目,确定所述第一协程所使用的所述计算资源低于所述第一阈值。
9.根据权利要求7所述的电子设备,该动作还包括:
使得所述第一协程停止处理所述第一序列。
10.根据权利要求9所述的电子设备,该动作还包括:
响应于可用于所述第一协程处理所述第一序列的计算资源高于所述第一阈值,使得所述第一协程继续处理所述第一序列。
11.根据权利要求7所述的电子设备,其中使得所述第一协程处理所述第一序列包括使得所述第一协程:
确定存储装置中包括的与所述第一序列中的第一键值对相匹配的关联键值对,所述第一键值对中的第一关键字与所述关联键值对中的第二关键字匹配;
获得所述关联键值对所在的所述存储装置中的关键存储页面中的键值对集合;
利用所述第一键值对更新所述键值对集合;
响应于所述第一协程和所述第二协程完成针对所述第一序列和所述第二序列的处理,将更新后的所述键值对集合存储到所述关键存储页面。
12.根据权利要求7所述的电子设备,其中使得所述第一协程处理所述第一序列包括使得所述第一协程:
确定存储装置中包括的与所述第一序列中的所述第一键值对以外的剩余键值对相匹配的一组关联键值对,所述剩余键值对中的关键字分别与所述一组关联键值对中的关键字匹配;
获得所述一组关联键值对所在的所述存储装置中的一组待更新存储页面,其中所述一组待更新存储页面中不包括所述关键存储页面;
利用所述剩余键值对,更新从所述一组待更新存储页面中所获取的键值对集合;
将更新后的所述键值对集合分别存储到一组目标存储页面;以及使得所述存储装置利用所述一组目标存储页面的地址来更新所述一组待更新存储页面的地址。
13.一种计算机程序产品,所述计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括机器可执行指令,所述机器可执行指令在被执行时使机器执行根据权利要求1至6中任一项所述的方法的步骤。
CN201811302936.4A 2018-11-02 2018-11-02 用于存储元数据的方法、设备和计算机可读介质 Active CN111143232B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811302936.4A CN111143232B (zh) 2018-11-02 2018-11-02 用于存储元数据的方法、设备和计算机可读介质
US16/442,318 US11106628B2 (en) 2018-11-02 2019-06-14 Method, device and computer program product for storing metadata

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811302936.4A CN111143232B (zh) 2018-11-02 2018-11-02 用于存储元数据的方法、设备和计算机可读介质

Publications (2)

Publication Number Publication Date
CN111143232A true CN111143232A (zh) 2020-05-12
CN111143232B CN111143232B (zh) 2023-08-18

Family

ID=70459584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811302936.4A Active CN111143232B (zh) 2018-11-02 2018-11-02 用于存储元数据的方法、设备和计算机可读介质

Country Status (2)

Country Link
US (1) US11106628B2 (zh)
CN (1) CN111143232B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11392547B2 (en) * 2020-04-09 2022-07-19 Micron Technology, Inc. Using prefix-delete operations for data containers

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902702A (zh) * 2014-03-31 2014-07-02 北京车商汇软件有限公司 一种数据存储系统和存储方法
CN104731569A (zh) * 2013-12-23 2015-06-24 华为技术有限公司 一种数据处理方法及相关设备
US20150324406A1 (en) * 2012-11-21 2015-11-12 International Business Machines Corporation Managing replicated data
CN106462416A (zh) * 2014-06-11 2017-02-22 家居控制新加坡私人有限责任公司 用于在小存储器设备上安装软件的系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9063790B2 (en) * 2011-06-13 2015-06-23 Accenture Global Services Limited System and method for performing distributed parallel processing tasks in a spot market
US9497136B1 (en) * 2011-09-28 2016-11-15 Emc Corporation Method and system for providing usage metrics to manage utilzation of cloud computing resources
US8938416B1 (en) * 2012-01-13 2015-01-20 Amazon Technologies, Inc. Distributed storage of aggregated data
US9621435B2 (en) * 2012-09-07 2017-04-11 Oracle International Corporation Declarative and extensible model for provisioning of cloud based services
US9047321B2 (en) * 2013-03-21 2015-06-02 Nexbit Systems Inc. Prioritizing downloading of image files
US10346381B2 (en) * 2013-11-14 2019-07-09 Facebook, Inc. Atomic update operations in a data storage system
CA3128629A1 (en) * 2015-06-05 2016-07-28 C3.Ai, Inc. Systems and methods for data processing and enterprise ai applications
US10503443B2 (en) * 2016-09-13 2019-12-10 Netapp, Inc. Systems and methods for allocating data compression activities in a storage system
CN107885595B (zh) * 2016-09-30 2021-12-14 华为技术有限公司 一种资源分配方法、相关设备及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150324406A1 (en) * 2012-11-21 2015-11-12 International Business Machines Corporation Managing replicated data
CN104731569A (zh) * 2013-12-23 2015-06-24 华为技术有限公司 一种数据处理方法及相关设备
CN103902702A (zh) * 2014-03-31 2014-07-02 北京车商汇软件有限公司 一种数据存储系统和存储方法
CN106462416A (zh) * 2014-06-11 2017-02-22 家居控制新加坡私人有限责任公司 用于在小存储器设备上安装软件的系统

Also Published As

Publication number Publication date
US20200142861A1 (en) 2020-05-07
CN111143232B (zh) 2023-08-18
US11106628B2 (en) 2021-08-31

Similar Documents

Publication Publication Date Title
US11163828B2 (en) Building and querying hash tables on processors
CN107870728B (zh) 用于移动数据的方法和设备
US10108653B2 (en) Concurrent reads and inserts into a data structure without latching or waiting by readers
US10698831B2 (en) Method and apparatus for data access
US11075991B2 (en) Partitioning data according to relative differences indicated by a cover tree
CN109344348B (zh) 一种资源更新方法及装置
CN108536745B (zh) 基于Shell的数据表提取方法、终端、设备及存储介质
CN109690522B (zh) 一种基于b+树索引的数据更新方法、装置及存储装置
US9323798B2 (en) Storing a key value to a deleted row based on key range density
CN110765036B (zh) 在控制设备处管理元数据的方法和设备
US11068536B2 (en) Method and apparatus for managing a document index
CN109815240B (zh) 用于管理索引的方法、装置、设备和存储介质
CN111857539A (zh) 用于管理存储系统的方法、设备和计算机程序产品
CN109213691B (zh) 用于缓存管理的方法和设备
US10083065B2 (en) Creating multiple rules for a device to allow concurrent access to the device by different virtual machines
US11509662B2 (en) Method, device and computer program product for processing access management rights
US10860472B2 (en) Dynamically deallocating memory pool subinstances
US9535713B2 (en) Manipulating rules for adding new devices
CN111143232B (zh) 用于存储元数据的方法、设备和计算机可读介质
CN113590543A (zh) 信息处理的方法、设备和计算机程序产品
CN111694992A (zh) 一种数据处理方法和装置
US11435926B2 (en) Method, device, and computer program product for managing storage system
US10776344B2 (en) Index management in a multi-process environment
US11429648B2 (en) Method and device for creating an index
CN110427391B (zh) 确定重复数据的方法、设备和计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant