CN102915324A - 数据存储与检索装置和数据存储与检索方法 - Google Patents
数据存储与检索装置和数据存储与检索方法 Download PDFInfo
- Publication number
- CN102915324A CN102915324A CN2012102825211A CN201210282521A CN102915324A CN 102915324 A CN102915324 A CN 102915324A CN 2012102825211 A CN2012102825211 A CN 2012102825211A CN 201210282521 A CN201210282521 A CN 201210282521A CN 102915324 A CN102915324 A CN 102915324A
- Authority
- CN
- China
- Prior art keywords
- file
- data
- index
- retrieval
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000013500 data storage Methods 0.000 claims description 86
- 238000007726 management method Methods 0.000 claims description 24
- 238000004513 sizing Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 description 22
- 230000008878 coupling Effects 0.000 description 11
- 238000010168 coupling process Methods 0.000 description 11
- 238000005859 coupling reaction Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000013011 mating Effects 0.000 description 5
- 230000033228 biological regulation Effects 0.000 description 4
- 230000000116 mitigating effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种数据存储与检索装置,包括:索引文件管理模块,为数据制定索引信息,并将所述数据的索引信息记录在索引文件中;定位文件管理模块,为所述数据制定存储位置信息,并将所述数据的存储位置信息记录在定位文件中;数据文件管理模块,按所述存储文件信息,将所述数据存储为数据文件以供检索。相应地,本发明还提供了一种数据存储与检索方法。通过本发明的技术方案,可以在数据应用,尤其是在使用海量数据的场合下,避免一次性加载过量数据,减轻系统压力,同时,提高数据存储、检索和恢复的效率。
Description
技术领域
本发明涉及数据存储与检索技术领域,具体而言,涉及一种数据存储与检索装置和一种数据存储与检索方法。
背景技术
在信息快速发展的今天,大量的数据信息给我们日常的生活带来很多方便,可以表达更多的内含或获取到更多丰富多彩的内容,如多媒体信息、地理信息等。
目前,对信息数据的存储,传统的做法是倾向于使用大型数据库。数据库在连接与快速访问中存在一定的效率问题,特别是在大型数据应用中,访问效率会呈现阶段性下降,无法满足即输即现的响应请求。因此,信息膨胀的同时带来数据存储及检索效率的降低,导致需求的信息不能被立刻呈现,特别是在一些要求高的行业应用中,比如,在地理信息系统中,位置的移动或地图的放大缩小,都需要快速查找所在区域的地理信息,如果不能做到即输即显,在本来就可能需要反复进行的地理信息查询的过程中增加大量无谓的等待数据检索、加载、呈现的时间,将会使得用户的体验大打折扣。
同时,目前对于数据丢失的处理方式往往是对整个数据重新下载更新。而在海量数据应用中,这种情况涉及到的数据容量小则几百MB,大则几十GB甚至上百GB或者更多的数据,如果将这些数据都重新下载,将是令人难以想象的。
在海量数据面前,任何硬件配置都不可能通过对所有数据全部加载来提高效率,特别是在硬件资源宝贵的应用场合,如嵌入式系统;而在需要即时即现的场合,如地图信息系统中,相对于大块数据完整下载呈现而言,在需要使用的时候适时加载,并快速呈现在用户面前则显得更加实用和有效。
因此,需要一种新的数据存储与检索技术,可以在数据应用,尤其是在使用海量数据的场合下,避免一次性加载过量数据,减轻系统压力,同时,提高数据存储、检索和恢复的效率。
发明内容
本发明所要解决的技术问题在于,提供一种新的数据存储与检索技术,可以在数据应用,尤其是在使用海量数据的场合下,避免一次性加载过量数据,减轻系统压力,同时,提高数据存储、检索和恢复的效率。
有鉴于此,本发明提供了一种数据存储与检索装置,包括:索引文件管理模块,为需存储的数据制定索引信息,并将所述数据的索引信息记录在索引文件中;定位文件管理模块,为所述数据制定存储位置信息,并将所述数据的存储位置信息记录在定位文件中;数据文件管理模块,按所述存储位置信息,将所述数据存储为数据文件以供检索。
在本技术方案中,所述索引文件管理模块为所述数据制定的索引信息可以包括所述数据的名称、所述数据的类别、所述数据对应的索引信息所处的索引级别信息,等等。除了索引信息外,索引文件中还可以进一步包括数据的描述信息,例如大小以及其他属性。
在数据存储请求到来时,所述索引文件管理模块根据输入数据的内容进行分析,对其进行筛选归类:如果现有索引不能满足需求,则为其建立新的索引;如找到其所属索引,则在现有索引中找到下一级索引,再对其进行分配,直到分配到级别最小的索引为止。处理完毕后,所述索引文件管理模块将处理结果发至所述定位文件管理模块。
所述定位文件管理模块根据所述索引文件管理模块的处理结果为所述数据制定存储位置信息,并记录于所述定位文件中,所述存储位置信息主要包括数据的存储位置,进一步地,也可以包括数据的名称、大小以及其他信息。处理完毕后,所述定位文件管理模块将处理结果发至所述数据文件管理模块。
所述数据文件管理模块,根据所述定位文件管理模块的处理结果,在所述定位文件管理模块分配的文件地址空间存储所述数据以供检索。具体地,所述数据可以以二进制文件的形式进行存储,进而提高数据的存储效率。
通过所述索引文件管理模块、定位文件管理模块和数据文件管理模块的配合,即可将数据按照索引文件、定位文件、数据文件的层次,条理清楚地存储起来,进而为快速检索、读取和恢复数据提供了保障。
在上述技术方案中,优选地,所述索引文件管理模块还根据所述索引文件,判断所述数据文件中的数据是否满足检索需求;所述定位文件管理模块还在判断结果为是时,根据所述定位文件,确定所述数据文件的存储位置信息;所述数据文件管理模块还按所述数据文件的存储位置信息,获取所述数据文件,以将所述数据文件中的数据作为检索结果。
在本技术方案中,当检索请求到来时,所述索引文件管理模块根据所述索引文件,判断所述数据文件中的数据是否满足检索需求,即通过所述索引文件寻找与所述检索请求要求匹配的数据。找到与所述检索请求要求匹配的数据的索引文件后,所述索引文件管理模块将该处理结果发至所述定位文件管理模块。
所述定位文件管理模块根据所述索引文件管理模块发来的处理结果确定与所述检索请求要求匹配的数据的定位文件,并将该处理结果发至所述数据文件管理模块。
所述数据文件管理模块根据所述定位文件管理模块发来的处理结果,分析所述定位文件,确定所述数据文件的存储位置,进而获取到所述数据文件,并将其中的数据作为检索结果。
由于所述数据存储与检索装置已经将所述数据按照层次清晰的结构,并以二进制文件形式存储,所以进行检索时,通过索引文件到定位文件,定位文件到数据文件的过程,能够准确、快速地获取到相应的检索结果。
在上述技术方案中,优选地,还包括:数据分块模块,获取需存储的原始数据,并在所述原始数据超过预定大小时,按所述预定大小将所述原始数据分块为多个新的数据,以分别进行存储。
在本技术方案中,所述数据分块模块将所述原始数据进行分块时,每一个因分块而生成的新的数据的大小可以是2M,也可以是其他能更快读写一个文件的临界值。通过引入所述数据分块模块,将所述原始数据处理为能够更快进行读写的多个占用存储空间较小的文件,这样,需要加载通过所述数据存储与检索装置存储的数据时,就可以避免一次加载过多数据,从而减轻整个数据系统的压力。
具体实现过程中,数据分块模块的功能可以集成到索引文件管理模块、定位文件管理模块和数据文件管理模块中的任一模块之中,可以在发现需存储的数据时,就判断数据是否超过所述规定的文件大小或其他策略,如果超出则确定需建立新文件存储,并进行后续的存储过程。
在上述技术方案中,优选地,所述索引文件管理模块还在接收到检索请求的当前服务器中未存储所述索引文件时,则从其他服务器中获取所述索引文件到所述当前服务器中;所述定位文件管理模块在所述当前服务器中未存储所述定位文件时,则从所述其他服务器中获取所述定位文件到所述当前服务器中;所述数据文件管理模块在所述当前服务器中未存储所述数据文件时,则从所述其他服务器中获取所述数据文件到所述当前服务器中。
在本技术方案中,所述数据存储与检索装置,包括其中的各个模块,可以配置灵活的执行策略。在收到所述检索请求的服务器是分布式布置,或者是设置有备份服务器的集中式布置的情况下,所述数据存储与检索装置,包括其中的各个模块,在无法在当前的服务器中获取到需要的文件时,可以自动转向所述其他服务器查询并获取相关文件。这样,就增加了所述数据存储与检索装置的灵活性和适应性。
在上述技术方案中,优选地,所述定位文件管理模块为具有相同索引信息的不同数据,分配位于同一范围的存储位置信息;所述索引文件包含与其相关的定位文件的标识,用于根据该标识检索出与所述索引文件相关的所述定位文件。
在本技术方案中,通过将所述具有相同索引信息的不同数据分配于同一范围的存储位置之中,以及在所述索引文件中包含与其相关的定位文件的标识,进而使得所述数据的存储层次更加清晰,在有助于提高数据检索的同时,也便于对整个系统进行维护,提高所述数据存储与检索装置的可靠性。
本发明还提供了一种数据存储与检索方法,包括:步骤202,为需存储的数据制定索引信息,并将所述数据的索引信息记录在索引文件中;步骤204,为所述数据制定存储位置信息,并将所述数据的存储位置信息记录在定位文件中;步骤206,按所述存储文件信息,将所述数据存储为数据文件以供检索。
在本技术方案中,为所述数据制定的索引信息可以包括所述数据的名称、所述数据的类别、所述数据对应的索引信息所处的索引级别信息,等等。除了索引信息外,索引文件中还可以进一步包括数据的描述信息,例如大小以及其他属性。
在数据存储请求到来时,首先根据输入数据的内容进行分析,对其进行筛选归类:如果现有索引不能满足需求,则为其建立新的索引;如找到其所属索引,则在现有索引中找到下一级索引,再对其进行分配,直到分配到级别最小的索引为止。处理完毕后,形成第一处理结果。
其次,根据所述第一处理结果为所述数据文件制定存储位置信息,并记录于所述定位文件中,所述存储位置信息主要包括数据的存储位置,进一步地,也可以包括数据的名称、大小以及其他信息。处理完毕后,形成第二处理结果。
最后,根据所述第二处理结果,在所分配的文件地址空间存储所述数据以供检索。具体地,所述数据可以以二进制文件的形式进行存储,进而提高数据的存储效率。
通过上述步骤,即可将数据按照索引文件、定位文件、数据文件的层次,条理清楚地存储起来,进而为快速检索、读取和恢复数据提供了保障。
在上述技术方案中,优选地,还包括:步骤208,根据所述索引文件,判断所述数据文件中的数据是否满足检索的需求;步骤210,在判断结果为是时,根据所述定位文件,确定所述数据文件的存储位置信息;步骤212,按所述数据文件的存储位置信息,获取所述数据文件,以将所述数据文件中的数据作为检索结果。
在本技术方案中,当检索请求到来时,首先根据所述索引文件,判断所述数据文件中的数据是否满足检索需求,即通过所述索引文件寻找与所述检索请求要求匹配的数据。找到与所述检索请求要求匹配的数据的索引文件后,形成第三处理结果。
其次,根据所述第三处理结果确定与所述检索请求要求匹配的数据文件的定位文件,并形成第四处理结果。
最后,根据所述第四处理结果,分析所述定位文件,确定所述数据的存储位置,进而获取到所述数据文件,并将其中的数据作为检索结果。检索具体方式不是固定的,比如字典可以通过拼音查,也可以通过部首查,可以根据索引信息灵活设置。
由于应用所述数据存储与检索方法已经将所述数据按照层次清晰的结构,并以二进制文件形式存储,所以进行检索时,通过索引文件到定位文件,定位文件到数据文件的过程,能够准确、快速地获取到相应的检索结果。
在上述技术方案中,优选地,还包括:获取需存储的原始数据,并在所述原始数据超过预定大小时,按所述预定大小将所述原始数据分块为多个新的数据,以分别进行存储。
在本技术方案中,将所述原始数据进行分块时,每一个因分块而生成的新的数据的大小可以是2M,也可以是其他能更快读写一个文件的临界值。通过将所述原始数据处理为能够更快进行读写的多个占用存储空间较小的文件,这样,需要加载通过所述数据存储与检索方法存储的数据时,就可以避免一次加载过多数据,从而减轻整个数据系统的压力。
具体实现过程中,可以在发现需存储的数据时,就判断数据是否超过所述规定的文件大小或其他策略,如果超出则确定需建立新文件存储,并进行后续的存储过程。
在上述技术方案中,优选地,所述步骤208还包括:在接收到检索请求的当前服务器中未存储所述索引文件时,则从其他服务器中获取所述索引文件到所述当前服务器中;所述步骤210还包括:在所述当前服务器中未存储所述定位文件时,则从所述其他服务器中获取所述定位文件到所述当前服务器中;所述步骤212还包括:在所述当前服务器中未存储所述数据文件时,则从所述其他服务器中获取所述数据文件到所述当前服务器中。
在本技术方案中,所述数据存储与检索方法,包括其中的各个步骤,可以配置灵活的执行策略。在收到所述检索请求的服务器是分布式布置,或者是设置有备份服务器的集中式布置的情况下,所述数据存储与检索方法,包括其中的各个步骤,在无法在当前的服务器中获取到需要的文件时,可以自动转向所述其他服务器查询并获取相关文件。这样,就增加了所述数据存储与检索方法的灵活性和适应性。
在上述技术方案中,优选地,所述步骤204还包括:为具有相同索引信息的不同数据,分配位于同一范围的存储位置信息;所述索引文件包含与其相关的定位文件的标识,用于根据该标识检索出与所述索引文件相关的所述定位文件。
在本技术方案中,通过将所述具有相同索引信息的不同数据分配于同一范围的存储位置之中,以及在所述索引文件中包含与其相关的定位文件的标识,进而使得所述数据的存储层次更加清晰,在有助于提高数据检索的同时,也便于对整个系统进行维护,提高所述数据存储与检索方法的可靠性。
通过以上技术方案,可以在数据应用,尤其是在使用海量数据的场合下,避免一次性加载过量数据,减轻系统压力,同时,提高数据存储、检索和恢复的效率。
附图说明
图1示出了根据本发明的实施例的数据存储与检索装置的框图;
图2示出了根据本发明的实施例的数据存储与检索方法的流程图;
图3示出了根据本发明的实施例的数据存储与检索装置的信息存储过程示意图;
图4示出了根据本发明的实施例的数据存储与检索装置的信息检索过程示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的实施例的数据存储与检索装置的框图。
如图1所示,根据本发明的实施例的数据存储与检索装置100,包括:索引文件管理模块102,为需存储的数据制定索引信息,并将所述数据的索引信息记录在索引文件中;定位文件管理模块104,为所述数据制定存储位置信息,并将所述数据的存储位置信息记录在定位文件中;数据文件管理模块106,按所述存储位置信息,将所述数据存储为数据文件以供检索。
在本技术方案中,所述索引文件管理模块102为所述数据制定的索引信息可以包括所述数据的名称、所述数据的类别、所述数据对应的索引信息所处的索引级别信息,等等。除了索引信息外,索引文件中还可以进一步包括数据的描述信息,例如大小以及其他属性。
在数据存储请求到来时,所述索引文件管理模块102根据输入数据的内容进行分析,对其进行筛选归类:如果现有索引不能满足需求,则为其建立新的索引;如找到其所属索引,则在现有索引中找到下一级索引,再对其进行分配,直到分配到级别最小的索引为止。处理完毕后,所述索引文件管理模块102将处理结果发至所述定位文件管理模块104。
所述定位文件管理模块104根据所述索引文件管理模块102的处理结果为所述数据文件制定存储位置信息,并记录于所述定位文件中,所述存储位置信息主要包括数据的存储位置,进一步地,也可以包括数据的名称、大小以及其他信息。处理完毕后,所述定位文件管理模块104将处理结果发至所述数据文件管理模块106。
所述数据文件管理模块106,根据所述定位文件管理模块104的处理结果,在所述定位文件管理模块104分配的文件地址空间存储所述数据以供检索。具体地,所述数据可以以二进制文件的形式进行存储,进而提高数据的存储效率。
通过所述索引文件管理模块102、定位文件管理模块104和数据文件管理模块106的配合,即可将数据按照索引文件、定位文件、数据文件的层次,条理清楚地存储起来,进而为快速检索、读取和恢复数据提供了保障。
在上述技术方案中,优选地,所述索引文件管理模块102还根据所述索引文件,判断所述数据文件中的数据是否满足检索需求;所述定位文件管理模块104还在判断结果为是时,根据所述定位文件,确定所述数据文件的存储位置信息;所述数据文件管理模块106还按所述数据文件的存储位置信息,获取所述数据文件,以将所述数据文件中的数据作为检索结果。
在本技术方案中,当检索请求到来时,所述索引文件管理模块102根据所述索引文件,判断所述数据文件中的数据是否满足检索需求,即通过所述索引文件寻找与所述检索请求要求匹配的数据。找到与所述检索请求要求匹配的数据的索引文件后,所述索引文件管理模块102将该处理结果发至所述定位文件管理模块104。
所述定位文件管理模块104根据所述索引文件管理模块102发来的处理结果确定与所述检索请求要求匹配的数据的定位文件,并将该处理结果发至所述数据文件管理模块106。
所述数据文件管理模块106根据所述定位文件管理模块104发来的处理结果,分析所述定位文件,确定所述数据文件的存储位置,进而获取到所述数据文件,并将其中的数据作为检索结果。
由于所述数据存储与检索装置100已经将所述数据按照层次清晰的结构,并以二进制文件形式存储,所以进行检索时,通过索引文件到定位文件,定位文件到数据文件的过程,能够准确、快速地获取到相应的检索结果。
在上述技术方案中,优选地,还包括:数据分块模块108,获取需存储的原始数据,并在所述原始数据超过预定大小时,按所述预定大小将所述原始数据分块为多个新的数据文件,以分别进行存储。
在本技术方案中,所述数据分块模块将所述原始数据进行分块时,每一个因分块而生成的新的数据的大小可以是2M,也可以是其他能更快读写一个文件的临界值。通过引入所述数据分块模块108,将所述原始数据处理为能够更快进行读写的多个占用存储空间较小的文件,这样,需要加载通过所述数据存储与检索装置100存储的数据时,就可以避免一次加载过多数据,从而减轻整个数据系统的压力。
具体实现过程中,数据分块模块的功能可以集成到索引文件管理模块、定位文件管理模块和数据文件管理模块中的任一模块之中,可以在发现需存储的数据时,就判断数据是否超过所述规定的文件大小或其他策略,如果超出则确定需建立新文件存储,并进行后续的存储过程。
在上述技术方案中,优选地,所述索引文件管理模块102还在接收到检索请求的当前服务器中未存储所述索引文件时,则从其他服务器中获取所述索引文件到所述当前服务器中;所述定位文件管理模块104在所述当前服务器中未存储所述定位文件时,则从所述其他服务器中获取所述定位文件到所述当前服务器中;所述数据文件管理模块106在所述当前服务器中未存储所述数据文件时,则从所述其他服务器中获取所述数据文件到所述当前服务器中。
在本技术方案中,所述数据存储与检索装置100,包括其中的各个模块,可以配置灵活的执行策略。在收到所述检索请求的服务器是分布式布置,或者是设置有备份服务器的集中式布置的情况下,所述数据存储与检索装置100,包括其中的各个模块,在无法在当前的服务器中获取到需要的文件时,可以自动转向所述其他服务器查询并获取相关文件。这样,就增加了所述数据存储与检索装置100的灵活性和适应性。
在上述技术方案中,优选地,所述定位文件管理模块104为具有相同索引信息的不同数据,分配位于同一范围的存储位置信息;所述索引文件包含与其相关的定位文件的标识,用于根据该标识检索出与所述索引文件相关的所述定位文件。
在本技术方案中,通过将所述具有相同索引信息的不同数据文件分配于同一范围的存储位置之中,以及在所述索引文件中包含与其相关的定位文件的标识,进而使得所述数据的存储层次更加清晰,在有助于提高数据检索的同时,也便于对整个系统进行维护,提高所述数据存储与检索装置100的可靠性。
图2示出了根据本发明的实施例的数据存储与检索方法的流程图。
如图2所示,根据本发明的实施例的数据存储与检索方法,包括:步骤202,为需存储的数据制定索引信息,并将所述数据文件的索引信息记录在索引文件中;步骤204,为所述数据制定存储位置信息,并将所述数据的存储位置信息记录在定位文件中;步骤206,按所述存储文件信息,将所述数据存储为数据文件以供检索。
在本技术方案中,为所述数据制定的索引信息可以包括所述数据的名称、所述数据的类别、所述数据对应的索引信息所处的索引级别信息,等等。除了索引信息外,索引文件中还可以进一步包括数据的描述信息,例如大小以及其他属性。
在数据存储请求到来时,首先根据输入数据的内容进行分析,对其进行筛选归类:如果现有索引不能满足需求,则为其建立新的索引;如找到其所属索引,则在现有索引中找到下一级索引,再对其进行分配,直到分配到级别最小的索引为止。处理完毕后,形成第一处理结果。
其次,根据所述第一处理结果为所述数据文件制定存储位置信息,并记录于所述定位文件中,所述存储位置信息主要包括数据的存储位置,进一步地,也可以包括数据的名称、大小以及其他信息。处理完毕后,形成第二处理结果。
最后,根据所述第二处理结果,在所分配的文件地址空间存储所述数据以供检索。具体地,所述数据可以以二进制文件的形式进行存储,进而提高数据的存储效率。
通过上述步骤,即可将数据按照索引文件、定位文件、数据文件的层次,条理清楚地存储起来,进而为快速检索、读取和恢复数据提供了保障。
在上述技术方案中,优选地,还包括:步骤208,根据所述索引文件,判断所述数据文件中的数据是否满足检索的需求;步骤210,在判断结果为是时,根据所述定位文件,确定所述数据文件的存储位置信息;步骤212,按所述数据文件的存储位置信息,获取所述数据文件,以将所述数据文件中的数据作为检索结果。
在本技术方案中,当检索请求到来时,首先根据所述索引文件,判断所述数据文件中的数据是否满足检索需求,即通过所述索引文件寻找与所述检索请求要求匹配的数据。找到与所述检索请求要求匹配的数据的索引文件后,形成第三处理结果。
其次,根据所述第三处理结果确定与所述检索请求要求匹配的数据文件的定位文件,并形成第四处理结果。
最后,根据所述第四处理结果,分析所述定位文件,确定所述数据文件的存储位置,进而获取到所述数据文件,并将其中的数据作为检索结果。检索具体方式不是固定的,比如字典可以通过拼音查,也可以通过部首查,可以根据索引信息灵活设置。
由于应用所述数据存储与检索方法已经将所述数据按照层次清晰的结构,并以二进制文件形式存储,所以进行检索时,通过索引文件到定位文件,定位文件到数据文件的过程,能够准确、快速地获取到相应的检索结果。
在上述技术方案中,优选地,还包括:获取需存储的原始数据,并在所述原始数据超过预定大小时,按所述预定大小将所述原始数据分块为多个新的数据,以分别进行存储。
在本技术方案中,将所述原始数据进行分块时,每一个因分块而生成的新的数据的大小可以是2M,也可以是其他能更快读写一个文件的临界值。通过将所述原始数据处理为能够更快进行读写的多个占用存储空间较小的文件,这样,需要加载通过所述数据存储与检索方法存储的数据时,就可以避免一次加载过多数据,从而减轻整个数据系统的压力。
具体实现过程中,可以在发现需存储的数据时,就判断数据是否超过所述规定的文件大小或其他策略,如果超出则确定需建立新文件存储,并进行后续的存储过程。
在上述技术方案中,优选地,所述步骤208还包括:在接收到检索请求的当前服务器中未存储所述索引文件时,则从其他服务器中获取所述索引文件到所述当前服务器中;所述步骤210还包括:在所述当前服务器中未存储所述定位文件时,则从所述其他服务器中获取所述定位文件到所述当前服务器中;所述步骤212还包括:在所述当前服务器中未存储所述数据文件时,则从所述其他服务器中获取所述数据文件到所述当前服务器中。
在本技术方案中,所述数据存储与检索方法,包括其中的各个步骤,可以配置灵活的执行策略。在收到所述检索请求的服务器是分布式布置,或者是设置有备份服务器的集中式布置的情况下,所述数据存储与检索方法,包括其中的各个步骤,在无法在当前的服务器中获取到需要的文件时,可以自动转向所述其他服务器查询并获取相关文件。这样,就增加了所述数据存储与检索方法的灵活性和适应性。
在上述技术方案中,优选地,所述步骤204还包括:为具有相同索引信息的不同数据,分配位于同一范围的存储位置信息;所述索引文件包含与其相关的定位文件的标识,用于根据该标识检索出与所述索引文件相关的所述定位文件。
在本技术方案中,通过将所述具有相同索引信息的不同数据文件分配于同一范围的存储位置之中,以及在所述索引文件中包含与其相关的定位文件的标识,进而使得所述数据的存储层次更加清晰,在有助于提高数据检索的同时,也便于对整个系统进行维护,提高所述数据存储与检索方法的可靠性。
图3示出了根据本发明的实施例的数据存储与检索装置的信息存储过程流程示意图。
如图3所示,根据本发明的实施例的数据存储与检索装置的信息存储过程流程如下:
向所述数据存储与检索装置输入数据,具体而言,由索引文件管理器302(即所述索引文件管理模块)首先对输入数据进行处理:所述索引文件管理器302分析所述数据,判断该数据是否超出预定大小,以及可以判断本次存储的数据与之前存储的数据是否非同一区域(即归类到同一索引下),若是,则所述数据建立新的索引,并建立相应的新索引文件,若否,则在现有索引文件中找到与所述数据索引对应的索引文件,并将所述数据的相关索引信息写入该索引文件。
定位文件管理器(即所述定位文件管理模块)304分析所述数据,判断该数据是否超出预定大小,以及可以判断本次存储的数据与之前存储的数据是否非同一区域(即归类到同一索引下),若是,则所述数据分配新的位置,并建立相应的新定位文件,若否,则在现有定位文件中找到与所述数据位置对应的定位文件,并将所述数据的位置信息写入该定位文件。
数据文件管理器(即所述数据文件管理模块)306分析所述数据,判断该数据是否超出预定大小,若是,则为所述数据建立新的数据文件进行存储,若否,则在现有数据文件中找到与所述数据对应的数据文件,并将所述数据的具体内容写入该索引文件。
图4示出了根据本发明的实施例的数据存储与检索装置的信息检索过程示意图。
如图4所示,根据本发明的实施例的数据存储与检索装置的信息检索过程如下:
步骤402,向所述数据存储与检索装置发出检索请求。
步骤404,根据所述检索请求,判断索引文件管理器(即所述索引文件管理模块)中是否存在与所述检索请求匹配的数据的索引文件:若否,则进入步骤406;若是,则进入步骤408。
步骤406,向其他服务器中请求下载所述索引文件,并通过下载文件管理器将所述索引文件发至文件定位管理器(即所述定位文件管理模块),并进入步骤408
步骤408,根据与所述检索请求匹配的索引文件,判断所述文件定位管理器中是否存在与所述索引文件匹配的定位文件:若否,则进入步骤410;若是,则进入步骤412。
步骤410,向其他服务器中请求下载所述定位文件,并通过下载文件管理器将所述定位文件发至文件读写器(即所述数据文件管理模块),并进入步骤412。
步骤412,根据所述定位文件,判断所述文件读写器中是否存在与所述定位文件匹配的数据文件:若否,则进入步骤414;若是,则进入步骤416。
步骤414,向其他服务器中请求下载所述数据文件,并通过下载文件管理器下载所述数据文件,并进入步骤416。
步骤416,将所述数据文件作为检索结果返回给所述数据存储与检索装置。
以上结合附图详细说明了本发明的技术方案。通过本技术方案的应用,可以在数据应用,尤其是在使用海量数据的场合下,避免一次性加载过量数据,减轻系统压力,同时,提高数据存储、检索和恢复的效率。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种数据存储与检索装置,其特征在于,包括:
索引文件管理模块,为需存储的数据制定索引信息,并将所述数据的索引信息记录在索引文件中;
定位文件管理模块,为所述数据制定存储位置信息,并将所述数据的存储位置信息记录在定位文件中;
数据文件管理模块,按所述存储位置信息,将所述数据存储为数据文件以供检索。
2.根据权利要求1所述的数据存储与检索装置,其特征在于,所述索引文件管理模块还根据所述索引文件,判断所述数据文件中的数据是否满足检索需求;
所述定位文件管理模块还在判断结果为是时,根据所述定位文件,确定所述数据文件的存储位置信息;
所述数据文件管理模块还按所述数据文件的存储位置信息,获取所述数据文件,以将所述数据文件中的数据作为检索结果。
3.根据权利要求1所述的数据存储与检索装置,其特征在于,还包括:
数据分块模块,获取需存储的原始数据,并在所述原始数据超过预定大小时,按所述预定大小将所述原始数据分块为多个新的数据,以分别进行存储。
4.根据权利要求1所述的数据存储与检索装置,其特征在于,所述索引文件管理模块还在接收到检索请求的当前服务器中未存储所述索引文件时,则从其他服务器中获取所述索引文件到所述当前服务器中;
所述定位文件管理模块在所述当前服务器中未存储所述定位文件时,则从所述其他服务器中获取所述定位文件到所述当前服务器中;
所述数据文件管理模块在所述当前服务器中未存储所述数据文件时,则从所述其他服务器中获取所述数据文件到所述当前服务器中。
5.根据权利要求1至4中任一项所述的数据存储与检索装置,其特征在于,所述定位文件管理模块为具有相同索引信息的不同数据,分配位于同一范围的存储位置信息;所述索引文件包含与其相关的定位文件的标识,用于根据该标识检索出与所述索引文件相关的所述定位文件。
6.一种数据存储与检索方法,其特征在于,包括:
步骤202,为需存储的数据制定索引信息,并将所述数据的索引信息记录在索引文件中;
步骤204,为所述数据制定存储位置信息,并将所述数据的存储位置信息记录在定位文件中;
步骤206,按所述存储文件信息,将所述数据存储为数据文件以供检索。
7.根据权利要求6所述的数据存储与检索方法,其特征在于,还包括:
步骤208,根据所述索引文件,判断所述数据文件中的数据是否满足检索的需求;
步骤210,在判断结果为是时,根据所述定位文件,确定所述数据文件的存储位置信息;
步骤212,按所述数据文件的存储位置信息,获取所述数据文件,以将所述数据文件中的数据作为检索结果。
8.根据权利要求6所述的数据存储与检索方法,其特征在于,还包括:
获取需存储的原始数据,并在所述原始数据文件超过预定大小时,按所述预定大小将所述原始数据分块为多个新的数据文件,以分别进行存储。
9.根据权利要求6所述的数据存储与检索方法,其特征在于,所述步骤208还包括:在接收到检索请求的当前服务器中未存储所述索引文件时,则从其他服务器中获取所述索引文件到所述当前服务器中;
所述步骤210还包括:在所述当前服务器中未存储所述定位文件时,则从所述其他服务器中获取所述定位文件到所述当前服务器中;
所述步骤212还包括:在所述当前服务器中未存储所述数据文件时,则从所述其他服务器中获取所述数据文件到所述当前服务器中。
10.根据权利要求6至9中任一项所述的数据存储与检索方法,其特征在于,所述步骤204还包括:
为具有相同索引信息的不同数据,分配位于同一范围的存储位置信息;所述索引文件包含与其相关的定位文件的标识,用于根据该标识检索出与所述索引文件相关的所述定位文件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210282521.1A CN102915324B (zh) | 2012-08-09 | 2012-08-09 | 数据存储与检索装置和数据存储与检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210282521.1A CN102915324B (zh) | 2012-08-09 | 2012-08-09 | 数据存储与检索装置和数据存储与检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102915324A true CN102915324A (zh) | 2013-02-06 |
CN102915324B CN102915324B (zh) | 2016-08-03 |
Family
ID=47613691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210282521.1A Expired - Fee Related CN102915324B (zh) | 2012-08-09 | 2012-08-09 | 数据存储与检索装置和数据存储与检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102915324B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239525A (zh) * | 2014-09-18 | 2014-12-24 | 浪潮软件集团有限公司 | 一种基于互联网的分布式存储方法 |
CN110908998A (zh) * | 2019-11-13 | 2020-03-24 | 广联达科技股份有限公司 | 数据存储和搜索方法、系统和计算机可读存储介质 |
CN111149362A (zh) * | 2017-09-22 | 2020-05-12 | 高通股份有限公司 | 存储和检索高位深度图像数据 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1235313A (zh) * | 1998-05-12 | 1999-11-17 | 龙卷风科技股份有限公司 | 电脑文件名称搜寻系统 |
CN101145120A (zh) * | 2006-09-14 | 2008-03-19 | 国际商业机器公司 | 恢复多卷数据集的装置、系统和方法 |
CN102375853A (zh) * | 2010-08-24 | 2012-03-14 | 中国移动通信集团公司 | 分布式数据库系统、在其中建立索引的方法和查询方法 |
-
2012
- 2012-08-09 CN CN201210282521.1A patent/CN102915324B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1235313A (zh) * | 1998-05-12 | 1999-11-17 | 龙卷风科技股份有限公司 | 电脑文件名称搜寻系统 |
CN101145120A (zh) * | 2006-09-14 | 2008-03-19 | 国际商业机器公司 | 恢复多卷数据集的装置、系统和方法 |
CN102375853A (zh) * | 2010-08-24 | 2012-03-14 | 中国移动通信集团公司 | 分布式数据库系统、在其中建立索引的方法和查询方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239525A (zh) * | 2014-09-18 | 2014-12-24 | 浪潮软件集团有限公司 | 一种基于互联网的分布式存储方法 |
CN111149362A (zh) * | 2017-09-22 | 2020-05-12 | 高通股份有限公司 | 存储和检索高位深度图像数据 |
CN111149362B (zh) * | 2017-09-22 | 2021-07-06 | 高通股份有限公司 | 存储和检索高位深度图像数据 |
CN110908998A (zh) * | 2019-11-13 | 2020-03-24 | 广联达科技股份有限公司 | 数据存储和搜索方法、系统和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102915324B (zh) | 2016-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9619512B2 (en) | Memory searching system and method, real-time searching system and method, and computer storage medium | |
US8843454B2 (en) | Elimination of duplicate objects in storage clusters | |
CN101067822B (zh) | 用于元数据的分级存储管理的方法和系统 | |
CN101263462B (zh) | 具有区块管理的非易失性存储器 | |
CN106682110B (zh) | 一种基于哈希格网索引的影像文件存储和管理系统及方法 | |
CN108021717B (zh) | 一种轻量级嵌入式文件系统的实现方法 | |
CN109284273B (zh) | 一种采用后缀数组索引的海量小文件查询方法及系统 | |
CN101916290B (zh) | 内存数据库的管理方法和装置 | |
CN109726177A (zh) | 一种基于HBase的海量文件分区索引方法 | |
CN103186622A (zh) | 一种全文检索系统中索引信息的更新方法以及装置 | |
EP3570182B1 (en) | Sparse infrastructure for tracking ad-hoc operation timestamps | |
EP3788505B1 (en) | Storing data items and identifying stored data items | |
CN104239377A (zh) | 跨平台的数据检索方法及装置 | |
US8296270B2 (en) | Adaptive logging apparatus and method | |
CN109726175A (zh) | 一种基于HBase的海量文件离线分区管理方法 | |
CN107026876A (zh) | 一种文件数据访问系统及方法 | |
CN100449545C (zh) | 访问扇区数据的方法和系统 | |
CN103383690A (zh) | 分布式数据存储方法及系统 | |
CN102253985B (zh) | 一种文件系统数据的管理方法及系统 | |
CN114356878A (zh) | 一种非结构化数据分布式存储方法及装置 | |
CN102915324A (zh) | 数据存储与检索装置和数据存储与检索方法 | |
CN104133970A (zh) | 一种数据空间管理方法及装置 | |
CN116795803A (zh) | 一种文件数据存储方法、装置、设备及存储介质 | |
CN103177026A (zh) | 数据管理方法和数据管理系统 | |
CN112269758A (zh) | 一种基于文件分级的文件迁移方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160803 |