CN111209444B - 一种基于时间序列多版本图拓扑数据的存储方法 - Google Patents

一种基于时间序列多版本图拓扑数据的存储方法 Download PDF

Info

Publication number
CN111209444B
CN111209444B CN202010009246.0A CN202010009246A CN111209444B CN 111209444 B CN111209444 B CN 111209444B CN 202010009246 A CN202010009246 A CN 202010009246A CN 111209444 B CN111209444 B CN 111209444B
Authority
CN
China
Prior art keywords
version
graph
topology
data
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010009246.0A
Other languages
English (en)
Other versions
CN111209444A (zh
Inventor
段翰聪
刘长红
张翔宇
闵革勇
李陈扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010009246.0A priority Critical patent/CN111209444B/zh
Publication of CN111209444A publication Critical patent/CN111209444A/zh
Application granted granted Critical
Publication of CN111209444B publication Critical patent/CN111209444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing

Abstract

本发明公开了一种基于时间序列多版本图拓扑数据的存储方法,包括:图拓扑、增量数据块、时序索引树和图拓扑索引表;图拓扑用于存储指定版本的数据;增量数据块用于保存修改操作中产生的新的增量数据并写到存储介质中;时序索引树用于管理经过修改操作所产生的所有的版本的信息,树中每个结点都包含图拓扑索引表,图拓扑索引表用于记录图拓扑具体存在存储介质的具体位置;存储介质包括:索引树文件用于持久化储存内存中的时序索引树,索引树结点文件用于存储基于前一个版本基础上对图拓扑数据的增量数据的索引,图拓扑数据文件通过基线加增量的方式存储图拓扑数据;本方法能快速将指定版本的图拓扑关系装载到内存中并明显减少磁盘I/O。

Description

一种基于时间序列多版本图拓扑数据的存储方法
技术领域
本发明涉及计算机软件领域,具体地,涉及一种基于时间序列多版本图拓扑数据的存储方法。
背景技术
在图数据库中,如果以某个时刻的图拓扑数据当作基线数据,在此前提下,对图拓扑数据的修改会随着时间顺序而迭代出多个时间上连续的版本。但这些修改操作同时也包括基于同一个基线版本上的数据修改而产生的不同的新版本,从而出现一种逻辑上平行,时间上连续的情况。
以知识图谱中的知识推理为例子,不同的推理规则对同一个图拓扑会产生多种不同的推理结果,同时会在这些结果之上又会进行新的推理。这将导致从某个真实时间开始,整个推理过程会以最初的图拓扑版本为根结点,随着时间的推移会根据不同的推理规则按照树的方式形成多条平行的推理线,从而产生如图1所示的多个树形版本。这些平行的推理线每条线内部从根结点开始时间上有序,但是每条推理线中的不同版本在真实时间上是交叉的,如图2所示。
在现有的图拓扑存储引擎中,并没有专门根据这些逻辑上平行,时间上连续的树形结构进行存储。目前主流的图数据库中的存储引擎中,对于图1中多版本的图拓扑结构的存储,只是简单地按照时间顺序,通过基线加增量的方式存储到磁盘或装载到内存。当需要读取某个特定版本的时候,只能按照时间顺序进行读取和筛选,整个过程会产生大量无效地磁盘I/O。
以图2为例子,在传统的图拓扑存储引擎中,如果要恢复图1中版本5的图拓扑数据,需要先将基线到版本5之间的图拓扑数据全部依次通过磁盘I/O读入到内存,然后再根据每次读到的增量数据控制信息来判断读取的数据是否是基于这条分支的数据,因此在读取过程中,即使版本4和3不属于这条分支,他们的增量数据依然会被读入到内存,从而造成大量不必要的磁盘I/O。
发明内容
针对上述问题,本发明的目的在于为这些逻辑上平行,时间上连续的多版本时间序列图拓扑数据提供了一种能快速将指定版本的图拓扑关系装载到内存中并明显减少磁盘I/O的方法。
为实现上述发明目的,本发明提供了一种基于时间序列多版本图拓扑数据的存储方法,所述方法包括:
对存储引擎框架进行设计,存储引擎在内存中包括:图拓扑、增量数据块、时序索引树和图拓扑索引表;图拓扑用于存储指定版本的数据;增量数据块用于保存修改操作中产生的新的增量数据并写到存储介质中;时序索引树用于管理经过修改操作所产生的所有的版本的信息,树中每个结点都包含图拓扑索引表,图拓扑索引表用于记录图拓扑具体存在存储介质的具体位置;存储介质包括:索引树文件、索引树结点文件和图拓扑数据文件,索引树文件用于持久化储存内存中的时序索引树,索引树结点文件用于存储基于前一个版本基础上对图拓扑数据的增量数据的索引,图拓扑数据文件通过基线加增量的方式存储图拓扑数据。
其中,本方法通过时序索引树的方式来对这些基于时间序列多版本的树形结构构建索引,每一个索引树结点中都存储了对应版本的图拓扑数据的增量或全量的索引。当指定装载某一个版本时,只需要通过对时序索引树的查询,找到对应的索引文件,进而能快速准确的恢复出该版本的全量拓扑。
其中,本方法为了解决在传统的图拓扑存储引擎在对图进行存储时,由于没有考虑过时间序列上多版本产生的树形结构的特点,而简单地采用了基线加增量的方式进行存储。其导致了在读取特定版本的图拓扑数据时候,产生了大量的不必要的磁盘I/O问题,通过时序索引树的方式来对这些逻辑上平行,时间上连续的图拓扑版本构建索引,从而减少了大量不必要的磁盘I/O。
本方法中的图拓扑索引表主要分为增量索引表和全量索引表,增量索引表的作用主要是存储整个修改过程产生的增量数据的索引,对其版本恢复的时候,需要通过对时序索引树的递归遍历的方式恢复指定版本。全量索引表则是为了解决在修改过程中时序索引树的深度增加而导致图拓扑数据装载效率变低的问题。通过结点索引表合并的方式重新构建出当前版本下所有图拓扑数据的索引表来提高效率。
优选的,图拓扑结构以时序索引树中特定版本的全局图为单位,或图拓扑结构为分布式时以全局图的一个分区为单位,每个版本通过版本号的方式来标识经过修改后的一个特定版本。
优选的,在图内部图拓扑数据包括结点、边和拓扑关系三种数据结构,其中,结点和边是由固定长度数据结构组织成的线性结构,用来表示结点和边的信息;拓扑关系按照结点为单位的不定长数据结构组成,记录了结点的出入边,并在内部存储一个结点的拓扑的大小。
优选的,时序索引树通过树的方式以各个分支共同的起始版本作为根结点,每一次修改完成均会导致树的生长。
优选的,当需要导入某一个指定的版本时,包括以下2个步骤:
a.从指定的版本开始向根结点进行回溯并压栈;
b.当到达根结点以后,从根结点开始,依次出栈并按照基线加增量的方式恢复该版本的数据。
优选的,在时序索引树中,每个结点存有一个图拓扑索引表,用于存储该结点版本的增量或全量数据在存储介质上的索引,以及相应的控制信息。
优选的,控制信息包括整个图拓扑中结点个数和边的个数。
优选的,图拓扑索引表结构包括4种类型的数据结构:
版本信息:用于标识该版本的版本号和整个图拓扑的全局信息,其中版本包括其自身的版本号以及父结点的版本号;
结点索引:用于在图拓扑中通过结点Id、结点所在的文件名和在文件中的偏移量定位到结点位置及读写;
边索引:用于在图拓扑中对边进行定位和读取;
拓扑索引:用于在图拓扑中用于对拓扑关系进行定位。
优选的,当需要恢复某个具体的版本时,通过内存中的图拓扑索引表,在I/O过程中,通过把相同文件名中偏移量相近的数据结构按照块的方式进行I/O操作。
优选的,当时序索引树中某一条分支生长的一定层次时,图拓扑索引表会存储该版本下全量的索引数据。
其中,本发明的关键设计为时序索引树:将由同一个初始版本的图拓扑经过多次修改产生的时间上连续,逻辑上的平行分支,通过索引树的方式来构建每条分支上的迭代版本。索引树从根结点到每个叶子结点的路径就是一条分支线,路径中的每个结点从上倒下按照时间顺序连续递增。
本发明提供的一个或多个技术方案,至少具有如下技术效果或优点:
本发明提出了一种基于知识图谱的网状数据多维存储的方式,避免了现有存储引擎对特定版本的图拓扑关系恢复时产生的大量的不必要的文件I/O,提高了存储引擎对图拓扑数据读取的整体效率。
本发明提出了一种能够根据在图拓扑数据结构修改过程中产生的逻辑上平行,时间上连续多版本图拓扑数据进行快速区分和定位的索引树,弥补有关方面的空缺。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定;
图1是知识推理产生的多版本图拓扑树形结构示意图;
图2是推理线中各个版本数据的在真实时间中的交叉存在示意图;
图3是存储引擎框架示意图;
图4是内存拓扑结构布局示意图;
图5是指定版本通过时序索引树恢复流程示意图;
图6是索引表结构示意图;
图7是构建全量索引过程示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在相互不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述范围内的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
整个存储引擎框架设计如图3所示,在内存中主要有四个部分:图拓扑、增量数据块(MemoryTable)、时序索引树、图拓扑索引表。图拓扑主要负责存储了指定版本的数据;增量数据块的作用则是用来保存修改操作中产生的新的增量数据并写到存储介质中;时序索引树则负责管理经过修改操作所产生的所有的版本的信息,树中每个结点都包含着索引表,用来记录图拓扑具体存在存储介质的具体位置。存储介质则有索引树文件、索引树结点文件、图拓扑数据文件三种,索引树文件主要是负责持久化储存内存中的时序索引树,索引树结点文件主要是存储基于前一个版本基础上对图拓扑数据的增量数据的索引,图拓扑数据文件通过基线加增量的方式存储图拓扑数据。下面对关键部分进行详细的说明。
内存部分:
1.图拓扑结构:以时序索引树中特定版本的全局图为单位(分布式则是全局图的一个分区为单位),每个版本通过版本号的方式来标识经过修改后的一个特定版本。在图内部图拓扑数据包括结点、边、拓扑关系三种数据结构,其中结点和边是由固定长度数据结构组织成的线性结构,用来表示结点和边的信息,具体如图4所示。拓扑关系按照结点为单位的不定长数据结构组成,主要记录了结点的出入边,并在内部存储了一个结点的拓扑的大小。
2.时序索引树:通过树的方式以各个分支共同的起始版本作为根结点,每一次修改完成都会导致树的生长,当需要导入某一个指定的版本时,主要分为以下2个步骤:
a.从指定的版本开始向根结点进行回溯并压栈;
b.当到达根结点以后,从根结点开始,依次出栈并按照基线加增量的方式恢复该版本的数据,流程如图5所示。
图拓扑索引表。在时序索引树中,每个结点都会存有一个图拓扑索引表,主要存储该结点版本的增量或全量数据在存储介质上的索引,以及一些全局的控制信息,比如整个图拓扑中结点个数和边的个数等,如图6所示。
图6中索引表结构主要有4种类型的数据结构,对其中的结构的详细解释如下:
a.版本信息:主要用来标识该版本的版本号和整个图拓扑的全局信息,其中版本包括其自身的版本号以及父结点的版本号。
b.结点索引:在图拓扑中,由于结点是定长的数据结构,所以在对其构建索引的过程中,只需要通过结点Id、结点所在的文件名和在文件中的偏移量,就能够快速定位到其位置及读写。
c.边索引:在图拓扑中,边同样也是定长的数据结构,因此,可以和结点一样按照同样的方式进行定位和读取。
d.拓扑索引:在图拓扑中,由于拓扑关系是按照结点为单位存储的结点的出边和入边数据的边长数据结构,因此在对其进行索引构建的时候,除了Id号、数据所在的文件名、偏移量以外,还需要存储每个拓扑关系的具体大小,才能够实现对其的定位。
当需要恢复某个具体的版本时,通过内存中的索引表,在I/O过程中,可以通过把相同文件名中偏移量相近的数据结构按照块的方式进行I/O操作,而不仅仅是针对一条索引记录的小文件I/O。
随着数据操作修改的反复迭代,时序索引树的层数会加深,采用回溯加递归的方式恢复指定版本的额外开销也会随着增大,因此,当树中某一条分支生长的一定层次时,索引表会存储该版本下全量的索引数据从而提高I/O效率。
1.装载指定版本
装载某个指定版本的图拓扑数据过程如图5所示,下面以图5中对版本4的数据装载为例子,对其具体过程进行详细描述:
a.通过时序索引树找到版本4结点;
b.通过该版本结点内部的索引表的版本信息初始化图拓扑数据所需内存空间;
c.入栈,同时通过索引表的版本信息找到父结点(版本信息如图6所示);
d.重复步骤b,c直到根结点(版本1)入栈;
e.结点出栈,根据出栈结点索引表中的结点、边和拓扑索引信息按照基线加增量的方式恢复数据,如果遇到ID相同的数据时,按照出栈顺序覆盖写。在整个读取过程中,可以通过对索引信息中的文件名和偏移量对其进行块语义上的读操作,提高I/O效率。
2.全量索引的构建过程
当随着修改的层层递进,时序索引树的深度也会随着增长,因此恢复特定版本时候所造成的开销也会增大,同时恢复过程也会产生较多的无效I/O,其主要源自在恢复过程中基线和增量中有ID相同的数据。
因此,当增量达到某一个特定的阈值的时候,会将时序索引树中结点中的索引表中的增量替换成当前版本的全量数据来提高整体效率。其具体过程如图7所示,下面以对结点版本4对针对图7进行详细描述:
a.通过时序索引树找到结点版本4;
b.通过其索引表中的信息找到其父结点并入栈;
c.重复步骤b,直到根结点(版本1)入栈;
d.构建一张新的空索引表;
e.出栈,并将出栈结点的索引表中的信息依次写入到新的索引表中,如果在写入过程中出现了ID相同的索引数据,则按照出栈顺序依次覆盖写。
释放结点4的索引表并指向新的全量的索引表。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种基于时间序列多版本图拓扑数据的存储方法,其特征在于,所述方法包括:
对存储引擎框架进行设计,存储引擎在内存中包括:图拓扑、增量数据块、时序索引树和图拓扑索引表;图拓扑用于存储指定版本的数据;增量数据块用于保存修改操作中产生的新的增量数据并写到存储介质中;时序索引树用于管理经过修改操作所产生的所有的版本的信息,树中每个结点都包含图拓扑索引表,图拓扑索引表用于记录图拓扑具体存在存储介质的具体位置;存储介质包括:索引树文件、索引树结点文件和图拓扑数据文件,索引树文件用于持久化储存内存中的时序索引树,索引树结点文件用于存储基于前一个版本基础上对图拓扑数据的增量数据的索引,图拓扑数据文件通过基线加增量的方式存储图拓扑数据。
2.根据权利要求1所述的基于时间序列多版本图拓扑数据的存储方法,其特征在于,图拓扑结构以时序索引树中特定版本的全局图为单位,或图拓扑结构为分布式时以全局图的一个分区为单位,每个版本通过版本号的方式来标识经过修改后的一个特定版本。
3.根据权利要求2所述的基于时间序列多版本图拓扑数据的存储方法,其特征在于,在图内部图拓扑数据包括结点、边和拓扑关系三种数据结构,其中,结点和边是由固定长度数据结构组织成的线性结构,用来表示结点和边的信息;拓扑关系按照结点为单位的不定长数据结构组成,记录了结点的出入边,并在内部存储一个结点的拓扑的大小。
4.根据权利要求1所述的基于时间序列多版本图拓扑数据的存储方法,其特征在于,时序索引树通过树的方式以各个分支共同的起始版本作为根结点,每一次修改完成均会导致树的生长。
5.根据权利要求4所述的基于时间序列多版本图拓扑数据的存储方法,其特征在于,当需要导入某一个指定的版本时,包括以下2个步骤:
a.从指定的版本开始向根结点进行回溯并压栈;
b.当到达根结点以后,从根结点开始,依次出栈并按照基线加增量的方式恢复该版本的数据。
6.根据权利要求1所述的基于时间序列多版本图拓扑数据的存储方法,其特征在于,在时序索引树中,每个结点存有一个图拓扑索引表,用于存储该结点版本的增量或全量数据在存储介质上的索引,以及相应的控制信息。
7.根据权利要求6所述的基于时间序列多版本图拓扑数据的存储方法,其特征在于,控制信息包括整个图拓扑中结点个数和边的个数。
8.根据权利要求6所述的基于时间序列多版本图拓扑数据的存储方法,其特征在于,图拓扑索引表包括4种类型的数据结构:
版本信息:用于标识该版本的版本号和整个图拓扑的全局信息,其中版本包括其自身的版本号以及其在时序索引树中父结点的版本号;
结点索引:用于在图拓扑中通过结点Id、结点所在的文件名和在文件中的偏移量定位到结点位置及读写;
边索引:用于在图拓扑中对边进行定位和读取;
拓扑索引:用于在图拓扑中用于对拓扑关系进行定位。
9.根据权利要求1所述的基于时间序列多版本图拓扑数据的存储方法,其特征在于,当需要恢复某个具体的版本时,通过内存中的图拓扑索引表,在I/O过程中,通过把相同文件名中偏移量相近的数据结构按照块的方式进行I/O操作。
10.根据权利要求1所述的基于时间序列多版本图拓扑数据的存储方法,其特征在于,当时序索引树中某一条分支生长到一定层次时,图拓扑索引表会存储该版本下全量的索引数据。
CN202010009246.0A 2020-01-06 2020-01-06 一种基于时间序列多版本图拓扑数据的存储方法 Active CN111209444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010009246.0A CN111209444B (zh) 2020-01-06 2020-01-06 一种基于时间序列多版本图拓扑数据的存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010009246.0A CN111209444B (zh) 2020-01-06 2020-01-06 一种基于时间序列多版本图拓扑数据的存储方法

Publications (2)

Publication Number Publication Date
CN111209444A CN111209444A (zh) 2020-05-29
CN111209444B true CN111209444B (zh) 2023-03-31

Family

ID=70788404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010009246.0A Active CN111209444B (zh) 2020-01-06 2020-01-06 一种基于时间序列多版本图拓扑数据的存储方法

Country Status (1)

Country Link
CN (1) CN111209444B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111475602B (zh) * 2020-06-23 2020-10-16 成都数联铭品科技有限公司 多版本知识图谱的存储方法、装置、存储介质及电子设备
WO2022088184A1 (zh) * 2020-11-02 2022-05-05 中国科学院深圳先进技术研究院 数据的存储方法、电子设备以及计算机可读存储介质
CN112988920A (zh) * 2021-05-20 2021-06-18 中国人民解放军国防科技大学 面向ai应用的数据版本管理方法、装置和计算机设备
CN114579888B (zh) * 2022-04-26 2022-08-30 支付宝(杭州)信息技术有限公司 知识图谱数据构建的方法、系统和非瞬态计算机可读介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701467A (en) * 1993-07-07 1997-12-23 European Computer-Industry Research Centre Gmbh Computer data storage management system and methods of indexing a dataspace and searching a computer memory
AU3516301A (en) * 2000-04-18 2001-10-25 Canon Kabushiki Kaisha Rendering graphic object based images
EP1898348A1 (en) * 2006-08-22 2008-03-12 Ricoh Company, Ltd. Task search apparatus, task search method, and storage medium
WO2011020360A1 (zh) * 2009-08-19 2011-02-24 北京书生国际信息技术有限公司 一种文档的存储方法
CN106095907A (zh) * 2016-06-08 2016-11-09 江西理工大学 基于八叉树与三维r星树集成的激光点云数据管理方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9411555B2 (en) * 2012-10-04 2016-08-09 Sap Se Systems and methods for creating context sensitive graph topologies based on multidimensional context information

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701467A (en) * 1993-07-07 1997-12-23 European Computer-Industry Research Centre Gmbh Computer data storage management system and methods of indexing a dataspace and searching a computer memory
AU3516301A (en) * 2000-04-18 2001-10-25 Canon Kabushiki Kaisha Rendering graphic object based images
EP1898348A1 (en) * 2006-08-22 2008-03-12 Ricoh Company, Ltd. Task search apparatus, task search method, and storage medium
WO2011020360A1 (zh) * 2009-08-19 2011-02-24 北京书生国际信息技术有限公司 一种文档的存储方法
CN106095907A (zh) * 2016-06-08 2016-11-09 江西理工大学 基于八叉树与三维r星树集成的激光点云数据管理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢露蓉.地图图形数据拓扑关系的建立.测绘科学.1999,(02),全文. *

Also Published As

Publication number Publication date
CN111209444A (zh) 2020-05-29

Similar Documents

Publication Publication Date Title
CN111209444B (zh) 一种基于时间序列多版本图拓扑数据的存储方法
CN111399777B (zh) 一种基于数据值分类的差异化键值数据存储方法
EP2069979B1 (en) Dynamic fragment mapping
WO2017071509A1 (zh) 文件系统目录树修复方法和装置
CN107153707A (zh) 一种针对非易失内存的哈希表构建方法及系统
CN105912687A (zh) 海量分布式数据库存储单元
US7769781B1 (en) Method for labeling data stored in sequential data structures with parameters which describe position in a hierarchy
US20060015538A1 (en) File location naming hierarchy
CN111078634B (zh) 一种基于r树的分布式时空数据索引方法
US20070094313A1 (en) Architecture and method for efficient bulk loading of a PATRICIA trie
CN116069267B (zh) 一种raid卡的写缓存方法、系统、设备及存储介质
CN102591958B (zh) 基于tcam的确定性有穷状态自动机的匹配方法和装置
CN114416646A (zh) 一种层级存储系统的数据处理方法及装置
CN110515897B (zh) Lsm存储系统读性能的优化方法及系统
CN116382588A (zh) 一种基于学习索引的LSM-Tree存储引擎读放大问题优化方法
JPS6051731B2 (ja) 二段構造ファイル方式
Otoo Linearizing the Directory Grovvth in Order Preserving Extendible Hashing
CN114461635A (zh) 一种MySQL数据库数据存储方法、装置和电子设备
Fietzke et al. Labelled splitting
US20140214899A1 (en) Leaf names and relative level indications for file system objects
CN110083603B (zh) 一种基于邻接表实现节点路径的查询方法及系统
JP2001331353A (ja) データベースへのデータ入力システム及びそのプログラムを記憶した記録媒体
JP5354606B2 (ja) データ蓄積装置及び方法及びプログラム及びデータ検索装置及び方法及びプログラム
Ko et al. Obtaining provably good performance from suffix trees in secondary storage
CN112148691B (zh) 数据存储方法和数据存储引擎

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant