CN103390015B - 基于统一索引的海量数据联合存储方法及检索方法 - Google Patents

基于统一索引的海量数据联合存储方法及检索方法 Download PDF

Info

Publication number
CN103390015B
CN103390015B CN201310015426.XA CN201310015426A CN103390015B CN 103390015 B CN103390015 B CN 103390015B CN 201310015426 A CN201310015426 A CN 201310015426A CN 103390015 B CN103390015 B CN 103390015B
Authority
CN
China
Prior art keywords
data
relational
index
node
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310015426.XA
Other languages
English (en)
Other versions
CN103390015A (zh
Inventor
安思成
吴克河
崔文超
张彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN201310015426.XA priority Critical patent/CN103390015B/zh
Publication of CN103390015A publication Critical patent/CN103390015A/zh
Application granted granted Critical
Publication of CN103390015B publication Critical patent/CN103390015B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于统一索引的海量数据联合存储方法及检索方法,存储方法,包括以下步骤:读取待存储数据,并判断所述待存储数据的数据类型;其中,所述数据类型包括非关系型数据和关系型数据;如果所述待存储数据为非关系型数据,则将所述非关系型数据存储到存储设备,然后将所述非关系型数据的数据信息增加到预先建立的数据统一索引中;如果所述待存储数据为关系型数据,则将所述关系型数据存储到所述存储设备,然后将所述关系型数据的数据信息增加到预先建立的所述数据统一索引中。保证各种数据逻辑存储结构的统一和物理存储结构的透明性,提高应用系统的通用扩展性、运行效率和稳定性。

Description

基于统一索引的海量数据联合存储方法及检索方法
技术领域
本发明属于数据存储技术领域,具体涉及一种基于统一索引的海量数据联合存储方法及检索方法。
背景技术
随着信息时代的不断发展,不同部门、不同地区间的信息交互逐步增加,通过数据交换和共享,可以使更多的人更充分地使用已有数据资源,减少资料收集、数据采集等重复劳动和相应费用。
然而在企业全面信息化和应用系统功能逐渐细化的趋势下,应用系统产生的数据往往是大规模、多类型且无序的,现有的各种业务定义不同类型数据的依据基本是通过“业务驱动”定义的,在产生相应数据的应用系统内部进行处理,由于数据类型和数据结构的差异,从而难以在不同应用系统间实现数据交换和数据共享,有时甚至会遇到数据格式不能转换或数据转换格式后丢失信息的棘手问题,严重地阻碍了数据在各应用系统中的交换与共享。又由于数据存储结构和逻辑结构的不一致性,导致处理和组织各种不同类型数据的过程十分复杂、困难。
传统的应用系统间进行数据交互是建立在双方系统协商的公共接口的基础上的,该类方法主要存在以下问题:(1)为共享某种数据格式的数据,各个应用系统需要配置专用的数据共享接口,从而导致各个应用系统的可扩展性低;尤其在多应用系统之间共享数据和共享的数据量很大的情况下,大大增加了各个应用系统的复杂度和耦合度;(2)各个应用系统之间进行频繁的数据交换,会降低应用系统运行效率;(3)由于数据的异构性,应用系统间交换的数据往往不能直接利用,需要缓存在中间数据库中,从而浪费了存储空间。因此,现有应用系统间进行数据交互时,会直接影响应用系统的通用扩展性、运行效率和稳定性。
发明内容
针对现有技术存在的缺陷,本发明提供一种海量数据联合存储方法及检索方法,在存储设备驱动层上构建各不同类型数据的联合存储模式,从而消除异构的应用系统之间进行数据交换或共享时存在的壁垒,保证各种数据逻辑存储结构的统一和物理存储结构的透明性,提高应用系统的通用扩展性、运行效率和稳定性。
本发明采用的技术方案如下:
本发明提供一种基于统一索引的海量数据联合存储方法,包括以下步骤:
读取待存储数据,并判断所述待存储数据的数据类型;其中,所述数据类型包括非关系型数据和关系型数据;
如果所述待存储数据为非关系型数据,则将所述非关系型数据存储到存储设备,然后将所述非关系型数据的数据信息增加到预先建立的数据统一索引中;
如果所述待存储数据为关系型数据,则将所述关系型数据存储到所述存储设备,然后将所述关系型数据的数据信息增加到预先建立的所述数据统一索引中。
优选的,所述非关系型数据包括文件型数据和文本型数据。
优选的,所述数据统一索引包括三层节点,自上而下分别为第一层节点、第二层节点和第三层节点;
其中,所述第一层节点代表索引开始点;所述第二层节点用于存储数据类型,具体包括两个节点,即:非关系型数据节点和关系型数据节点;所述第三层节点包括两个节点,即平衡查找树形式的子索引和数据表形式的子索引;其中,所述平衡查找树形式的子索引为所述非关系型数据节点的子节点,所述数据表形式的子索引为所述关系型数据节点的子节点。
优选的,所述将所述非关系型数据的数据信息增加到预先建立的数据统一索引中,具体为:将所述非关系型数据的数据信息增加到所述平衡查找树形式的子索引中;
所述将所述关系型数据的数据信息增加到预先建立的所述数据统一索引中,具体为:将所述关系型数据的数据信息增加到所述数据表形式的子索引。
优选的,所述非关系型数据的数据信息包括主键值、索引键值和具体数据内容;其中,所述具体数据内容包括文件名、文件存储时间、文件操作权限、文件存储起始地址和文件长度;所述平衡查找树形式的子索引包括:根节点、一级以上中间节点和叶子节点;其中,所述根节点用于存储所述主键值的一级分类数组;各级所述中间节点用于存储其子节点主键值范围的二级分类数组;所述叶子节点用于存储所述非关系型数据的数据信息;
将所述非关系型数据的数据信息增加到所述平衡查找树形式的子索引中具体为:
当需要存储所述非关系型数据时,获取所述存储设备的当前可用的文件存储起始地址;然后以所述存储起始地址为存储起点将所述非关系型数据存入所述存储设备;还获取所述非关系型数据的索引键值、主键值;其中,所述主键值用于全局唯一标识所述非关系型数据;
将所述非关系型数据插入到所述平衡查找树形式的子索引中。
优选的,将所述非关系型数据插入到所述平衡查找树形式的子索引中具体为:
以所述非关系型数据的主键值为查找依据,查找所述根节点,获得包含所述主键值的指定一级分类数组;继续向下查找所述指定一级分类数组的子节点,获得包含所述主键值的指定二级分类数组;继续向下查找所述指定二级分类数组的子节点,获得指定叶子节点;所述指定叶子节点包含多条非关系型数据的数据信息,各条非关系型数据的数据信息按主键值从小到大顺序排列;
按主键值从小到大顺序,将所述非关系型数据插入到所述指定叶子节点;然后判断得到的所述指定叶子节点的数据个数是否达到分裂阀值m,如果未达到,则直接结束插入过程;如果达到,则分裂得到的所述指定叶子节点。
优选的,所述主键值为“文件名+全局唯一的键值”形式。
优选的,所述数据表形式的子索引为三级索引结构,具体包括第一级索引、第二级索引和第三级索引;
其中,所述第一级索引为数据表级索引,用于存储数据表名、数据存储所在的数据库名、数据存储的连接方法和属性数的对应关系;
所述第二级索引为属性级索引,用于存储与每个数据表名对应的属性名、数据类型和数据检索方式的对应关系;
所述第三级索引为属性值级索引,用于存储各个属性对应的属性值表,每一个所述属性值表用于存储属性的检索方法。
本发明还提供一种基于统一索引的海量数据联合存储方法得到的存储内容进行检索的方法,包括:
当需要检索与特定数据相关的存储信息时,以所述特定数据为关键词查找所述数据统一索引,获得与所述特定数据相关的存储信息。
优选的,以所述特定数据为关键词查找所述数据统一索引具体为:
判断所述特定数据的数据类型,如果所述特定数据的数据类型为非关系型数据,则查找所述平衡查找树形式的子索引,获得与所述特定数据相关的存储信息;如果所述特定数据的数据类型为关系型数据,则查找所述数据表形式的子索引,获得与所述特定数据相关的存储信息。
本发明的有益效果如下:
本发明提供的基于统一索引的海量数据联合存储方法及检索方法,实现了应用系统的不同类型数据的联合存储、统一索引和快速检索,提高了应用系统的扩展性,降低了异构的应用系统之间数据交互共享的复杂性和特殊性。
附图说明
图1为本发明提供的数据统一索引的结构示意图;
图2为本发明提供的将非关系型数据的数据信息增加到平衡查找树形式的子索引的整体流程示意图;
图3为本发明提供的将非关系型数据插入到平衡查找树形式的子索引的插入过程示意图;
图4为平衡查找树形式的子索引的一个具体实施例;
图5为本发明提供的数据表形式的子索引的结构示意图;
图6为本发明提供的海量数据联合检索方法的流程示意图。
具体实施方式
以下结合附图对本发明进行详细说明:
本发明提供一种基于统一索引的海量数据联合存储方法,包括以下步骤:
读取待存储数据,并判断所述待存储数据的数据类型;其中,所述数据类型包括非关系型数据和关系型数据;
如果所述待存储数据为非关系型数据,则将所述非关系型数据存储到存储设备,然后将所述非关系型数据的数据信息增加到预先建立的数据统一索引中;
如果所述待存储数据为关系型数据,则将所述关系型数据存储到所述存储设备,然后将所述关系型数据的数据信息增加到预先建立的所述数据统一索引中。
本发明中,如图1所示,数据统一索引包括三层节点,自上而下分别为第一层节点、第二层节点和第三层节点;
其中,所述第一层节点为根节点,代表索引开始点;所述第二层节点用于存储数据类型,具体包括两个节点,即:非关系型数据节点和关系型数据节点;所述第三层节点包括两个节点,即平衡查找树形式的子索引和数据表形式的子索引;其中,所述平衡查找树形式的子索引为所述非关系型数据节点的子节点,所述数据表形式的子索引为所述关系型数据节点的子节点。将所述非关系型数据的数据信息增加到预先建立的数据统一索引中,具体为:将所述非关系型数据的数据信息增加到所述平衡查找树形式的子索引中;将所述关系型数据的数据信息增加到预先建立的所述数据统一索引中,具体为:将所述关系型数据的数据信息增加到所述数据表形式的子索引。
以下对平衡查找树形式的子索引和数据表形式的子索引分别介绍:
(一)平衡查找树形式的子索引
本发明中,非关系型数据包括文件型数据和文本型数据,平衡查找树形式的子索引用于存储非关系型数据的数据信息,其中,非关系型数据的数据信息包括主键值、索引键值和具体数据内容;其中,所述具体数据内容包括文件名、文件存储时间、文件操作权限、文件存储起始地址和文件长度。在存储非关系型数据时,需要首先获取全局共享的可用文件存储起始地址,然后对文件存储起始地址进行互斥处理,根据文件长度设置下一非关系型数据的存储起始地址。
所述平衡查找树形式的子索引包括:根节点、一级以上中间节点和叶子节点;其中,所述根节点用于存储所述主键值的一级分类数组;各级所述中间节点用于存储其子节点主键值范围的二级分类数组;所述叶子节点用于存储所述非关系型数据的数据信息;
如图2所示,将所述非关系型数据的数据信息增加到所述平衡查找树形式的子索引中具体包括:
S1,当需要存储所述非关系型数据时,获取所述存储设备的当前可用的文件存储起始地址;然后以所述存储起始地址为存储起点将所述非关系型数据存入所述存储设备;还获取所述非关系型数据的索引键值、主键值;其中,所述主键值用于全局唯一标识所述非关系型数据;
S2,将所述非关系型数据插入到所述平衡查找树形式的子索引中。本步骤具体如图3所示,包括:
S2-1,以所述非关系型数据的主键值为查找依据,查找所述根节点,获得包含所述主键值的指定一级分类数组;继续向下查找所述指定一级分类数组的子节点,获得包含所述主键值的指定二级分类数组;继续向下查找所述指定二级分类数组的子节点,获得指定叶子节点;所述指定叶子节点包含多条非关系型数据的数据信息,各条非关系型数据的数据信息按主键值从小到大顺序排列;
S2-2,按主键值从小到大顺序,将所述非关系型数据插入到所述指定叶子节点;然后判断得到的所述指定叶子节点的数据个数是否达到分裂阀值m,如果未达到,则直接结束插入过程;如果达到,则分裂得到的所述指定叶子节点。
为方便理解,如图4所示,为平衡查找树形式的子索引的一个具体例子:在图2中,数据1-6的主键值分别为3、7、15、17、21、29。以非关系型数据1为例,其插入到平衡查找树形式的子索引的过程为:
查找根节点,其中,根节点共包括三个一级分类数组,获得包含主键值的指定一级分类数组,即一级分类数组(1,10);继续向下查找一级分类数组(1,10)的子节点,获得包含主键值的指定二级分类数组,即二级分类数组(0,5),继续向下查找指定二级分类数组(0,5)的子节点,获得指定叶子节点;然后按主键值从小到大顺序,将非关系型数据1插入到指定叶子节点。
需要说明的是,本发明中,主键值为用于全局唯一标识非关系型数据,为支持根据文件名检索,可以以“文件名+全局唯一的键值”作为索引主键。
(二)数据表形式的子索引
关系型数据主要存储在各业务系统的关系型数据库中,以各业务系统数据需求的格式进行组织。根据关系型数据的存储特点和逻辑结构,本发明提出采用基于表、属性、属性值的三级索引结构的存储模型。
具体的,数据表形式的子索引为三级索引结构,具体包括第一级索引、第二级索引和第三级索引;
其中,所述第一级索引为数据表级索引,用于存储数据表名、数据存储所在的数据库名、数据存储的连接方法和属性数的对应关系;
所述第二级索引为属性级索引,用于存储与每个数据表名对应的属性名、数据类型和数据检索方式的对应关系;第二级索引与第一级索引是一对多的关系;
所述第三级索引为属性值级索引,用于存储各个属性对应的属性值表,每一个所述属性值表用于存储属性的检索方法。
通过三级索引结构的存储模型,可以快速、有效的建立具有统一索引的关系型数据联合存储机制,一致规范关系型数据的存取接口方法,具体的三级索引结构如图5所示。
当检索关系型数据时,通常已知某表名、某属性名,因此,以某表名、某属性名为检索条件检索数据表形式的子索引。具体的,包括:
(1)在数据表级索引中查找该表名所属的数据库和连接数据的方法;
因为在实际应用中,大量数据分布在各个系统的多个不同数据库中,通过数据表级索引可定位存储该表的数据库和连接到该数据库的方法,其中,连接到该数据库的方法一般为数据库类型和连接字符串等;从而定位到属性级索引的某个属性索引表;
(2)在属性级索引中查找已知的属性名对应的属性特征,例如:类型、检索方式,从而定位到属性值级索引;其中,类型包括字符类型;检索方式包括字符串匹配的方法;
(3)属性值级就是一个属性在表中的可能取值都列出来建立索引,每个值对应一种检索方法,即SQL语句,然后根据索引指示的数据库连接和SQL语句在实际的数据库中检索数据。
比如,当需要查找“学生表”的“姓名”字段等于“张华”数据时,其中,“学生表”为表名,“姓名”为属性,“张华”为需要检索的数据内容;则检索方式为:
(1)首先根据数据表级索引查找到“学生表”在教务系统数据库中,然后根据数据表级索引中指示的连接方法(IP地址、用户名、密码)连接到教务系统数据库;
(2)然后在属性级索引中查找到学生表对应的属性级索引,在属性级索引中查找到“姓名”属性,发现其是字符类型,确定用字符串匹配的方法进行检索;
(3)然后到属性值级索引中,查找到“姓名”属性所对应的属性值表;在属性值表中查找到“张华”项,发现检索方法是“select*fromstudentwherename=‘张华’”,然后用此SQL语句在实际的业务数据库中进行检索,查找到张华对应的数据并返回。
本发明还提供一种基于统一索引的海量数据联合存储方法得到的存储内容进行检索的方法,包括:
当需要检索与特定数据相关的存储信息时,以所述特定数据为关键词查找所述数据统一索引,获得与所述特定数据相关的存储信息。
其中,以所述特定数据为关键词查找所述数据统一索引具体为:
判断所述特定数据的数据类型,如果所述特定数据的数据类型为非关系型数据,则查找所述平衡查找树形式的子索引,获得与所述特定数据相关的存储信息;如果所述特定数据的数据类型为关系型数据,则查找所述数据表形式的子索引,获得与所述特定数据相关的存储信息。
具体的,相对应于数据联合存储模型,本发明对各类型数据提供对应的检索方法。例如,对于非关系型数据,可以根据索引键值、文件名、文件及文本内容进行检索;对于关系型数据,提供规定表、属性和属性值限定的检索方法。当检索非关系型数据时,对于根据索引键值和文件名的检索,基于建立的平衡查找树,从根节点开始遍历查找到存储相应键值或文件名加键值的字串索引的叶子节点,然后从叶子节点找到索引值(文件地址和长度),从而取出数据。检索关系型数据时,对表、属性、属性值三级索引依次检索,从而定位出数据的检索位置和方法,然后到关系型数据库中检索数据。具体的检索过程见图6所示。。
本发明提供的基于统一索引的海量数据联合存储方法及检索方法,具有以下优点:
(1)通过非关系型数据索引的建立方法,实现了非关系型数据一致格式索引的迅速建立,统一的存取数据接口和快速的查找模型,具备很高的运行效率和稳定性;
(2)通过有效、新型的关系型数据建立索引的方法,将关系型数据简单巧妙的进行统一的组织、处理,从而提高了应用系统的通用性和兼容性;
(3)通过多元的各类型数据检索方法,提高了数据检索效率,另外,令基于统一索引方法联合存储的数据的检索多样化,并为业务应用系统调用建立通用的接口。另外,数据的检索具有很高的效率。
综上所述,本发明提供的基于统一索引的海量数据联合存储方法及检索方法,实现了应用系统的不同类型数据的联合存储、统一索引和快速检索,提高了应用系统的扩展性,降低了异构的应用系统之间数据交互共享的复杂性和特殊性。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (8)

1.一种基于统一索引的海量数据联合存储方法,其特征在于,包括以下步骤:
读取待存储数据,并判断所述待存储数据的数据类型;其中,所述数据类型包括非关系型数据和关系型数据;
如果所述待存储数据为非关系型数据,则将所述非关系型数据存储到存储设备,然后将所述非关系型数据的数据信息增加到预先建立的数据统一索引中;
如果所述待存储数据为关系型数据,则将所述关系型数据存储到所述存储设备,然后将所述关系型数据的数据信息增加到预先建立的所述数据统一索引中;
所述数据统一索引包括三层节点,自上而下分别为第一层节点、第二层节点和第三层节点;
其中,所述第一层节点代表索引开始点;所述第二层节点用于存储数据类型,具体包括两个节点,即:非关系型数据节点和关系型数据节点;所述第三层节点包括两个节点,即平衡查找树形式的子索引和数据表形式的子索引;其中,所述平衡查找树形式的子索引为所述非关系型数据节点的子节点,所述数据表形式的子索引为所述关系型数据节点的子节点。
2.根据权利要求1所述的基于统一索引的海量数据联合存储方法,其特征在于,所述非关系型数据包括文件型数据和文本型数据。
3.根据权利要求1所述的基于统一索引的海量数据联合存储方法,其特征在于,所述将所述非关系型数据的数据信息增加到预先建立的数据统一索引中,具体为:将所述非关系型数据的数据信息增加到所述平衡查找树形式的子索引中;
所述将所述关系型数据的数据信息增加到预先建立的所述数据统一索引中,具体为:将所述关系型数据的数据信息增加到所述数据表形式的子索引。
4.根据权利要求3所述的基于统一索引的海量数据联合存储方法,其特征在于,所述非关系型数据的数据信息包括主键值、索引键值和具体数据内容;其中,所述具体数据内容包括文件名、文件存储时间、文件操作权限、文件存储起始地址和文件长度;所述平衡查找树形式的子索引包括:根节点、一级以上中间节点和叶子节点;其中,所述根节点用于存储所述主键值的一级分类数组;各级所述中间节点用于存储其子节点主键值范围的二级分类数组;所述叶子节点用于存储所述非关系型数据的数据信息;
将所述非关系型数据的数据信息增加到所述平衡查找树形式的子索引中具体为:
当需要存储所述非关系型数据时,获取所述存储设备的当前可用的文件存储起始地址;然后以所述存储起始地址为存储起点将所述非关系型数据存入所述存储设备;还获取所述非关系型数据的索引键值、主键值;其中,所述主键值用于全局唯一标识所述非关系型数据;
将所述非关系型数据插入到所述平衡查找树形式的子索引中。
5.根据权利要求4所述的基于统一索引的海量数据联合存储方法,其特征在于,将所述非关系型数据插入到所述平衡查找树形式的子索引中具体为:
以所述非关系型数据的主键值为查找依据,查找所述根节点,获得包含所述主键值的指定一级分类数组;继续向下查找所述指定一级分类数组的子节点,获得包含所述主键值的指定二级分类数组;继续向下查找所述指定二级分类数组的子节点,获得指定叶子节点;所述指定叶子节点包含多条非关系型数据的数据信息,各条非关系型数据的数据信息按主键值从小到大顺序排列;
按主键值从小到大顺序,将所述非关系型数据插入到所述指定叶子节点;然后判断得到的所述指定叶子节点的数据个数是否达到分裂阀值m,如果未达到,则直接结束插入过程;如果达到,则分裂得到的所述指定叶子节点。
6.根据权利要求4所述的基于统一索引的海量数据联合存储方法,其特征在于,所述主键值为“文件名+全局唯一的键值”形式。
7.根据权利要求3所述的基于统一索引的海量数据联合存储方法,其特征在于,所述数据表形式的子索引为三级索引结构,具体包括第一级索引、第二级索引和第三级索引;
其中,所述第一级索引为数据表级索引,用于存储数据表名、数据存储所在的数据库名、数据存储的连接方法和属性数的对应关系;
所述第二级索引为属性级索引,用于存储与每个数据表名对应的属性名、数据类型和数据检索方式的对应关系;
所述第三级索引为属性值级索引,用于存储各个属性对应的属性值表,每一个所述属性值表用于存储属性的检索方法。
8.一种对权利要求1-7任一项所述基于统一索引的海量数据联合存储方法得到的存储内容进行检索的方法,其特征在于,包括:
当需要检索与特定数据相关的存储信息时,以所述特定数据为关键词查找所述数据统一索引,获得与所述特定数据相关的存储信息;
其中,以所述特定数据为关键词查找所述数据统一索引具体为:
判断所述特定数据的数据类型,如果所述特定数据的数据类型为非关系型数据,则查找所述平衡查找树形式的子索引,获得与所述特定数据相关的存储信息;如果所述特定数据的数据类型为关系型数据,则查找所述数据表形式的子索引,获得与所述特定数据相关的存储信息。
CN201310015426.XA 2013-01-16 2013-01-16 基于统一索引的海量数据联合存储方法及检索方法 Expired - Fee Related CN103390015B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310015426.XA CN103390015B (zh) 2013-01-16 2013-01-16 基于统一索引的海量数据联合存储方法及检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310015426.XA CN103390015B (zh) 2013-01-16 2013-01-16 基于统一索引的海量数据联合存储方法及检索方法

Publications (2)

Publication Number Publication Date
CN103390015A CN103390015A (zh) 2013-11-13
CN103390015B true CN103390015B (zh) 2016-03-30

Family

ID=49534291

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310015426.XA Expired - Fee Related CN103390015B (zh) 2013-01-16 2013-01-16 基于统一索引的海量数据联合存储方法及检索方法

Country Status (1)

Country Link
CN (1) CN103390015B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744794B (zh) * 2014-02-10 2017-03-01 武汉英泰斯特电子技术有限公司 数据存储的方法及装置
CN104063487B (zh) * 2014-07-03 2017-02-15 浙江大学 基于关系型数据库及k‑d树索引的文件数据管理方法
CN104331518B (zh) * 2014-11-27 2017-12-29 浪潮(北京)电子信息产业有限公司 一种海量文件的存储方法和装置
CN104750853A (zh) * 2015-04-14 2015-07-01 浪潮集团有限公司 一种异构数据搜索方法及装置
CN104765840B (zh) * 2015-04-16 2017-11-24 成都睿峰科技有限公司 一种大数据分布式存储的方法和装置
CN106156174A (zh) * 2015-04-16 2016-11-23 中国移动通信集团山西有限公司 一种数据库事务处理的系统和方法
CN104750855B (zh) * 2015-04-16 2017-11-24 成都睿峰科技有限公司 一种大数据存储优化方法和装置
CN104965850B (zh) * 2015-04-29 2018-01-30 云南电网有限责任公司 一种基于开源技术的数据库高可用实现方法
CN105808745B (zh) * 2016-03-11 2019-06-28 中国联合网络通信集团有限公司 一种数据检索方法及服务器
CN105681477B (zh) * 2016-04-08 2018-11-16 四川师范大学 一种数据访问方法和一种服务器
CN107704475B (zh) * 2016-08-10 2021-12-14 泰康保险集团股份有限公司 多层分布式非结构化数据存储方法、查询方法及装置
CN107748773A (zh) * 2017-10-12 2018-03-02 深圳盈诺德信息技术有限公司 基于企业资源计划的数据搜索方法、装置和存储介质
CN109522323B (zh) * 2018-08-28 2020-04-24 湖南大唐先一科技有限公司 一种从海量数据中快速检索变化数据段的方法及系统
CN109408599B (zh) * 2018-09-20 2021-09-28 佛山科学技术学院 一种大数据的分布式存储方法
CN111190893B (zh) * 2018-11-15 2023-05-16 华为技术有限公司 建立特征索引的方法和装置
CN111475502A (zh) * 2019-01-24 2020-07-31 中国电力科学研究院有限公司 一种分布式可再生能源的数据管理方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102495853A (zh) * 2011-11-17 2012-06-13 成都康赛电子科大信息技术有限责任公司 一种面向切面的云存储引擎构造方法
CN102651020A (zh) * 2012-03-31 2012-08-29 中国科学院软件研究所 一种海量传感器数据存储与查询方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9460189B2 (en) * 2010-09-23 2016-10-04 Microsoft Technology Licensing, Llc Data model dualization

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102495853A (zh) * 2011-11-17 2012-06-13 成都康赛电子科大信息技术有限责任公司 一种面向切面的云存储引擎构造方法
CN102651020A (zh) * 2012-03-31 2012-08-29 中国科学院软件研究所 一种海量传感器数据存储与查询方法

Also Published As

Publication number Publication date
CN103390015A (zh) 2013-11-13

Similar Documents

Publication Publication Date Title
CN103390015B (zh) 基于统一索引的海量数据联合存储方法及检索方法
Sharma et al. Sql and nosql databases
CN103631907B (zh) 一种将关系型数据迁移至HBase的方法及系统
CN104750681B (zh) 一种海量数据的处理方法及装置
CN101436192B (zh) 用于优化针对垂直存储式数据库的查询的方法和设备
CN106933833B (zh) 一种基于空间索引技术的位置信息快速查询方法
US20140081934A1 (en) Dynamic updates to a semantic database using fine-grain locking
CN103729447A (zh) 一种数据库快速检索的方法
CN105243162A (zh) 基于关系型数据库存储的对象化数据模型查询方法及装置
CN102955843B (zh) 一种键值数据库的多键查找实现方法
CN103440245A (zh) 数据库系统的行列混合存储方法
US10762068B2 (en) Virtual columns to expose row specific details for query execution in column store databases
CN102609490B (zh) 一种面向列存储dwms的b+树索引方法
CN111639075B (zh) 一种基于扁平化r树的非关系数据库矢量数据管理方法
CN104391908B (zh) 一种图上基于局部敏感哈希的多关键字索引方法
CN103646051A (zh) 一种基于列存储的大数据并行处理系统及方法
CN105164673A (zh) 跨数据库和文件系统的查询一体化
CN106326387A (zh) 一种分布式数据存储架构及数据存储方法和数据查询方法
CN103177094A (zh) 一种物联网数据清洗方法
CN103455335A (zh) 一种多级分类的Web实现方法
CN102654878B (zh) 嵌入式系统中分布式数据库的数据操作方法及板卡
CN112000851B (zh) 一种键值模型、文档模型和图模型数据的统一存储方法
CN110147376A (zh) 一种基于领域本体的油气大数据查询和存储方法
CN102819600A (zh) 面向电力生产管理系统关系数据库的关键词搜索方法
CN105354266A (zh) 一种基于富图模型RichGraph的图数据管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160330

Termination date: 20180116