CN103559323B - 数据库实现方法 - Google Patents

数据库实现方法 Download PDF

Info

Publication number
CN103559323B
CN103559323B CN201310597381.1A CN201310597381A CN103559323B CN 103559323 B CN103559323 B CN 103559323B CN 201310597381 A CN201310597381 A CN 201310597381A CN 103559323 B CN103559323 B CN 103559323B
Authority
CN
China
Prior art keywords
coding
field
data
newly
data relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310597381.1A
Other languages
English (en)
Other versions
CN103559323A (zh
Inventor
盛杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201310597381.1A priority Critical patent/CN103559323B/zh
Priority to US14/385,872 priority patent/US9665600B2/en
Priority to PCT/CN2013/088207 priority patent/WO2015074290A1/zh
Priority to EP13897923.2A priority patent/EP3073392A4/en
Priority to JP2016554770A priority patent/JP6262874B2/ja
Publication of CN103559323A publication Critical patent/CN103559323A/zh
Application granted granted Critical
Publication of CN103559323B publication Critical patent/CN103559323B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures

Abstract

本发明公开了一种数据库实现方法,包括:对提供的表、字段,以及表与表之间的数据关系按预设规则分别唯一编码;将得到的表的编码、字段的编码及数据关系的编码均存储在创建的节点簇编码结构表中,形成编码节点;根据上述表、字段及数据关系之间的从属关系,在节点簇编码结构表中建立表的编码、字段的编码及数据关系的编码之间的从属映射;且在创建的节点簇值对照表中映射各编码所对应的名称;其中,在字段所对应的编码节点下建立具有唯一编码的编码子节点,并在编码子节点对应的存储空间中存储数据元。因此,寻址任何一个表、字段及数据元时,可以通过欲寻址的表、字段及数据元的唯一编码一次寻址获取,能够提高数据库的寻址效率。

Description

数据库实现方法
技术领域
本发明涉及数据库技术领域,具体而言,涉及数据库实现方法。
背景技术
数据库是一种用来组织、存储及管理数据的仓库。相关技术中的数据库主要以“表”为核心,“字段”为单位编码设计实现。
相关技术中数据库编码实现时,首先分析得到表名,对表名编码,并根据表名及编码,创建表;获取字段名,对字段名编码,并在创建的对应的表结构中创建字段名。
相关技术中的数据库实现方法,数据需要存储时,每个数据元通过路径:“表名”.“字段名”编码转换,通过两次编码“寻址”到存储空间,然后将“数据元”存储在指定的记录空间中,在存储时对数据元存储的“记录”进行第三次编码。
相关技术中的数据库实现方法,对表的编码、字段的编码及记录的编码分别独立进行,各类编码之间可重复,在寻址指定数据元时,均需多次编码转换并分散寻址,寻址速度较慢。
发明内容
本发明的目的在于提供数据库实现方法,以解决上述的问题。
在本发明的实施例中提供了数据库实现方法,包括:
对提供的表、字段,以及表与表之间的数据关系按预设规则分别唯一编码;
将得到的所述表的编码、所述字段的编码及所述数据关系的编码均存储在创建的节点簇编码结构表中,形成编码节点;
根据所述表、字段及所述数据关系之间的从属关系,在所述节点簇编码结构表中建立表的编码、字段的编码及数据关系的编码之间的从属映射;
且在创建的节点簇值对照表中映射各编码所对应的名称,所述名称包括所述表的名称、字段的名称或所述数据关系的名称;
其中,在所述字段所对应的编码节点下建立具有唯一编码的编码子节点,并在所述编码子节点对应的存储空间中存储数据元;
其中,对用户提供的HTML格式的表进行数据库编码操作;
所述对用户提供的HTML格式的表进行数据库编码操作,包括:
抓取HTML格式的所述表的表元素,其中所述表元素包括:表名称元素、数据段元素、数据元元素及数据关系元素;
根据抓取到的所述表元素创建数据待转换池;
扫描所述数据待转换池中的所有元素,并在节点簇编码结构表中分别对所有元素创建唯一编码,并建立创建的编码之间的映射关系,同时在所述节点簇值对照表中映射各编码所对应的名称。
本发明实施例提供的数据库实现方法,对表、字段、数据关系及数据元分别进行唯一编码,并统一存储在一个地址空间即创建的节点簇编码结构表及节点簇值对照表;如此寻址任何一个表、字段及数据元时,可以通过欲寻址的表、字段及数据元的唯一编码一次寻址获取,由此能够提高数据库的寻址效率。
附图说明
图1示出了本发明实施例中数据库实现方法的流程图。
具体实施方式
下面通过具体的实施例子并结合附图对本发明做进一步的详细描述。
本发明实施例中提供一种数据库实现方法,如图1所示,主要处理步骤包括:
步骤S11:对提供的表、字段,以及表与表之间的数据关系按预设规则分别唯一编码;
步骤S12:将得到的表的编码、字段的编码及数据关系的编码均存储在创建的节点簇编码结构表中,形成编码节点;
步骤S13:根据表、字段及数据关系之间的从属关系,在节点簇编码结构表中建立表的编码、字段的编码及数据关系的编码之间的从属映射;
步骤S14:且在创建的节点簇值对照表中映射各编码所对应的名称,名称包括表的名称、字段的名称或数据关系的名称;
步骤S15:其中,在字段所对应的编码节点下建立具有唯一编码的编码子节点,并在编码子节点对应的存储空间中存储数据元。
本发明实施例提供的数据库实现方法,对表、字段、数据关系及数据元分别进行唯一编码,并统一存储在一个地址空间即创建的节点簇编码结构表及节点簇值对照表;如此寻址任何一个表、字段及数据元时,可以通过欲寻址的表、字段及数据元的唯一编码一次寻址获取,由此能够提高数据库的寻址效率。
本发明实施例的数据库实现方法还包括:添加新的表、新的字段及新的数据关系中的一种或多种;还包括:根据创建的编码节点,直接寻址欲删除的表、字段或数据关系,并对寻址到的欲删除的表、字段及数据关系所占用的数据空间进行清除;还包括:根据创建的编码节点,直接寻址欲更改的表、字段或数据关系,并对寻址到的欲更改的表、字段及数据关系所占用的数据空间中的信息进行对应修改。
具体地,添加新的表、新的字段及新的数据关系中的一种或多种,包括:
对欲添加的表、字段及数据关系按预设规则进行唯一编码,得到新增编码;
将新增编码添加到节点簇值对照表中,并在节点簇编码结构表中建立添加的表的新增编码、字段的新增编码及数据关系的新增编码之间的从属映射;且在创建的节点簇值对照表中映射各新增编码所对应的名称。
本发明实施例中对提供的表、字段,以及表与表之间的数据关系按预设规则分别唯一编码,包括:对提供的表、字段,以及表与表之间的数据关系编码时,按照同一编码规则由小到大进行顺序整数编码。
进一步地,对欲添加的表、字段及数据关系按预设规则进行唯一编码,得到新增编码,包括:获取数据库中当前整数编码的最大值,将获取到的当前整数编码的最大值增加预设步长后作为新增编码的起始值,利用起始值对欲添加的表、字段及数据关系由小到大进行顺序整数编码,得到新增编码。
本发明实施例中将新增编码添加到节点簇值对照表中的实现方式有多种,本发明给出多种示例,其具体包括:
利用得到的新增编码在节点簇值对照表中创建新的编码节点,以将新增编码添加到节点簇值对照表中;
或,
利用得到的新增编码在已建立的编码节点下创建新的编码子节点,以将新增编码添加到节点簇值对照表中;
或,
利用得到的新增编码在已创建的编码子节点下创建新的从属子节点,以将新增编码添加到节点簇值对照表中。
进一步地,本发明实施例的数据库实现方法还包括:对用户提供的HTML格式的表进行数据库编码操作。
其中,对用户提供的HTML格式的表进行数据库编码操作,包括:抓取HTML格式的表的表元素,其中表元素包括:表名称元素、数据段元素、数据元元素及数据关系元素;根据抓取到的表元素创建数据待转换池;扫描数据待转换池中的所有元素,并在节点簇编码结构表中分别对所有元素创建唯一编码,并建立创建的编码之间的映射关系,同时在节点簇值对照表中映射各编码所对应的名称。
本发明实施例中对用户提供的HTML格式的表进行数据库编码操作,还包括:检测到用户增加、删除、或更改数据段或数据元时,对应在节点簇编码结构表及节点簇值对照表中增加新的编码、删除指定编码及该指定编码对应的空间中的数据,或在指定的编码存储空间中修改数据。
本发明实施例的数据库实现方法还包括:根据创建的编码节点,直接寻址获取相应的表、字段、数据关系或数据元,并利用寻址到的表、字段、数据关系及数据元按预设规则进行运算。
以下通过与相关技术中的数据库实现方法对比,对本发明实施例的数据库实现方法进行进一步说明。
利用相关技术中的数据库实现方法创建数据库,数据库中的表或字段发生变化主要包括以下情形:
情形一:“表”的“增加”、“删除”与“更名”
(1)在“增加”表时,创建一个独立的新的“表空间”,同时对应一个“表编码”,并对增加的表定义一个与已存在的表不重复的“表名”,并将“表名”作为未来数据存储、计算的路径。
(2)“表”需要“删除”时:现有数据库实现方法是,通过“表名”映射到“表编码”寻址到相应表空间,将其从“表集合”的定义中逐一比较“表编码”,清除符合“该表编码”的记录,同时将其已经占用的空间记录予标记清空,以供新的“表”、“字段”、“数据元”重新占用。
(3)“表”需要“更名”时:现有数据库方法是,通过“表名”映射到“表编码”,寻址到相应表空间,将其从“表集合”的定义中修改该条编码记录中对“表名”的定义。
情形二:“字段”需要“增加”、“删除”、“变更名称”、“变更类型”
(1)“字段”需要增加时,通过“表名”映射到“表编码”寻址到“表空间”,再检索到字段尾部,创建一个新的“字段空间”,然后“命名”并分配一个“表编码”。
(2)“字段”需要删除时,通过“表名”映射到“表编码”寻址到“表空间”,再通过“字段名”映射到“字段编码”寻址到“字段空间”,在“字段集合”的定义中消除该编码字段名的记录,并将该字段名下的所有记录标记删除,以供新的字段、数据元重新占用。
(3)字段需要“变更名称”或“变更类型”,通过“表名”映射到“表编码”寻址到“表空间”,再通过“表字段”映射到“字段编码”进行寻址到“字段空间”,再对“字段集合”中该字段名的记录予以名称修改、类型修改,类型修改时,需要将该字段下的所有数据元,都逐一寻址并转换类型。
现有数据库编码方式,在需要计算时,通过对计算范围的分析,先得出计算需要涉及到的多个“计算表名称”,通过“表名称编码集”映射并获取到,然后再分析出每个表中,需要涉及计算的多个“计算字段名称”,通过“字段编码集”映射并获取到。首先这些“计算表名称”+“计算字段名称”所对应的数据记录是分散存储的,称为“分散计算记录集”。然后,在“分散计算记录集”中,分析出表与表之间的连接关系,分析出记录中的条件范围,然后通过“关系连接”与“记录筛选”,将这些“分解计算记录集”读取出来合并成一个“合并计算记录集”,最后通过相应的运算得到新的“计算结果记录集”。
(1)现有数据库编码方式客观缺点一:对表的编码、字段的编码、记录的编码是分别独立进行的,存储也是分离的,而且彼此编码是可重复的,所以在寻址一个数据元,均需要多次编码转换并分散寻址,寻址速度慢;同时,寻址的“表名”与“字段名”都是“字符串”型,寻址时需要多次“比较”运算,导致寻址速度慢。
(2)现有数据库编码方式客观缺点二:对表的增加、删除、变更,对字段的增加、删除、变更,均需要对数据库后台进行人工配置并获取一个新的表编码、字段编码,也就是数据库在表、字段的设计上,没有弹性。
(3)现有数据库编码方式客观缺点三:对表的增加、删除、变更,对字段的增加、删除、变更,由于总是需要人工配置并获取新的表编码、字段编码,这种编码通常情况下,不能通过程序自动创建并获取,导致在表与字段变更后,通常对计算程序需要进行二次编码与开发,导致计算机程序没有弹性;
(4)现有数据库编码方式客观缺点四:对表、字段确定后,对数据元的存储是按矩阵方式存储的,但不是所有字段在所有记录行上都需要存储数据元,这导致存储空间的浪费,这也是现有数据库编码方式必须以矩阵方式存储带来的。
(5)现有数据库编码方式客观缺点五:在计算效率上,每次确定计算范围,都涉及到多个表编码的转换、字段编码的转换,并在分解的存储空间时寻址需要计算的数据记录集合,在计算涉及到的表的个数越多时,计算记录集合的寻址效率就会越来越低,计算机的I/O次数随着计算范围涉及到的表的个数增多而呈现线性甚至指数增长,I/O次数是计算效率的重要指标,I/O次数越多,寻址效率越低,I/O次数越少,寻址效率越高。最终导致随着数据规模与计算范围的扩大,传统的数据编码方式计算效率会随之降低。
(6)现有数据库编码方式客观缺点六:在存储数据上,没有编码复用结构将可复用的表、字段、数据记录与数据结构进行复用定义。导致数据在结构上的复用率低,由于没有统一编码,导致维护复用结构的难度大。
本发明实施例中的数据库实现方法与现有数据库的实现方法主要差别如下:
(1)本发明实施例的数据库实现方法中,对于任何一个有意义的元素(包括表、或字段、或数据元时),会首先创建一个唯一的不重复的整数编码,然后在创建的编码基础上,自由定义创建的编码的使用意义。定义创建的编码的使用意义的过程,是一个由完全无指向意义的空节点开始,然后再不断在此编码上赋予表或字段或数据元或关系的过程。
而现有数据库实现方法中,必须先确定定义的目标:如果是定义表,则在表集合中予以编码;如果是定义字段,则在具体表空间下的字段中予以编码;如果是定义关系,则在具体的关系容器中予以编码;定义现有数据编码过程,是一个由事先确定的有意义的实际空间中创建一个有实际指向意义的节点开始,然后在所在容器的规则下按需要使用的过程。
由此看出,现有数据库实现方法中的任一数据节点,都只能做一次创建,在一个方向上创建固定的增长关系及记录。而本发明实施例的数据库实现方法中的任一编码节点,都可以自由创建、二次定义,并在任一方向上创建新的增长关系及相关记录。
同时,现有数据库实现方法中,对表、字段及数据元的使用,是以表名、字段名、记录值特征为路径的比较寻址、读取记录、计算过程。而本发明实施例中,对表、字段及数据元的使用,是以整数编码为核心的直接寻址、直接读取记录、直接计算的过程。
在程序引用方面,现有数据库编码对表、字段、数据元的引用,必须指定具体的表名称、字段名称、记录值特征,在多个分散的存储空间中逐一定位。而本发明实施例的数据库实现方法中对表、字段、数据元的引用,都只需根据创建的编码,就可以直接在同一个存储空间中一次性定位。
本发明实施例中对每一个表、字段、数据元、关系进行统一唯一整数编码(UniversalOnlyinteger-CodeInDataBase,简称UOCID),彼此UOCID编码不重复,并统一存储在一个地址空间;并在存在的同一地址空间中按UOIC顺序进行存储,这样,寻址任何一个表、字段、数据元、数据集,都只需要通过唯一的UOCID一次寻址到,同时UOCID编码的逻辑编码顺序与物理上存储顺序保持一致,不需要通过索引二次定位,就可一次提取目标数据,寻址效率高,速度快。
本发明实施例的数据库实现方法中,对表的增加、删除、变更,对字段的增加、删除、变更,不需要通过数据库后台进行人工配置,而是直接按:“UOCID当前最大编码数+1”方式自动增长新编码。或者按:“UOCID当前空闲编码”方式激活新编码。因此,UOCID编码系统允许在表、字段的设计上的弹性增长。
本发明实施例的数据库实现方法,对表的增加、删除、变更,对字段的增加、删除、变更,可以通过程序自动创建并获取UOCID编码,因此允许计算机程序对表、字段在增加、删除、变更进行动态定义,可以将对表、字段的动态定义映射成UOCID编码,交给用户去定义,提高了程序编码的弹性,降低了二次开发对IT技术人员的依赖性。
本发明实施例的数据库实现方法,允许数据在表、字段的任何维度进行按需要存储,对数据元的存储是按:“UOCID编码+紧凑队列方式”存储的,而不是矩阵式存储,减少存储空间的浪费。
本发明实施例的数据库实现方法,在计算效率上,UOCID编码每次确定计算范围,只涉及一个表的编码转换,同时在同一个存储空间时寻址需要计算的数据记录集合,同时寻址通过与物理存储顺序一致的整数进行数据抽取,因此无论计算范围多大,都只涉及到一个编码表的寻址,大大降低了计算机在计算时的I/O次数,I/O次数是计算效率的重要指标,I/O次数越多,寻址效率越低,I/O次数越少,寻址效率越高。采用本发明实施例的数据库实现方法,实现了数据规模与计算范围的扩大,对计算效率的影响极低,尤其是在海量计算方面,有明显的计算优势。
本发明实施例的数据库实现方法,在存储数据上,UOCID编码可以对可复用的表、字段、数据记录与数据结构进行无限的复用定义。实现了数据在结构上的高复用率,同时UOCID是统一的唯一的编码,导致维护复用结构的变得容易。
本发明实施例数据库实现方法,在创建数据库的过程中会自动形成UOCID数据引用替换池,供程序自动调用,自动切换。
本发明实施例中进一步给出数据引用替换池的程序实现,例如:
UOCID转换前:SELECT*FROM采购表,直接指向采购表。
UOCID转换后:
采购表会自动更名为:PRE采购表
自动将UOCID编码结构表与UOCID值表通过映射或自动生成临时新表,新表名称与实际使用名称保持一致为:采购表
SELECT*FROM采购表会建立在UOCID编码后的映射表或临时表上
UOCID转换前:INERTINTOVALUE到采购表.采购员,直接去添加一行。
UOCID转换后:
采购表会自动更名为:PRE采购表
自动将UOCID编码结构表与UOCID值表通过映射或自动生成临时新表,新表名称与实际使用名称保持一致为:采购表
INERTINTOVALUE到采购表.采购员,会执行两个操作:
直接去采购表,自动增加一行例如:采购员=张三的记录
同时去UOCID编码表中自动增加一行例如:78880xxBEOF7888002记录,以及去UOCID簇值表中自动增加一行例如:78880xx张三
如下两个操作为原子操作,两个操作均成功才视为INERTINTOVALUE成功,否则任一操作失败,则整个INERTINTOVALUE操作返回失败。
本发明实施例的数据库实现方法还能够自动侦测,是否有新表、或字段、或数据关系的建立,若侦测到有新表、新字段或新的数据关系建立时,对新增加的表、字段及数据关系进行唯一编码。
本发明实施例的数据库实现方法还能对用户提供的HTML格式的表进行数据库编码操作,具体地,包括抓取HTML格式的所述表的表元素,其中所述表元素包括:表名称元素、数据段元素、数据元元素及数据关系元素;根据抓取到的所述表元素创建数据待转换池;扫描所述数据待转换池中的所有元素,并在节点簇编码结构表中分别对所有元素创建唯一编码,并建立创建的编码之间的映射关系,同时在所述节点簇值对照表中映射各编码所对应的名称。
进一步地,在对HTML格式的表进行数据库编码操作还包括:将HTML页面所有元素进行UOCID编码标记(setAttribute),且将UOCID编码全部自动嵌入到TD\TR标签中,UOCID通过创建新的attribute而生成。
在对HTML格式的表进行数据库编码操作时还包括将HTML格式的表进行自动扩充,创建增加或变更字段的按钮;当用户输入新的字段后,自动创建新的UOCID编码,并存入UOCID编码结构表与簇值表中。
本发明实施例的数据库实现方法,能够自动侦听所有表与字段,自动转换为UOCID编码库并自动生成新的映射关系,不影响现有软件对数据库的开发引用。同时,自动扫描界面中HTML元素,与UOCID编码库进行对比,对新的元素进行编码新建,并传回数据库形成新的映射,实现UOCID与现有数据库在开发引用上的完全一致映射关系,从而扩充在表、字段上的设计弹性。
本发明实施例中在任意一个现有编码节点(即UOCID节点,例如381769)直接申请一个新的UOCID编码子节点,这个节点仅有一个整数编码(例如381776),不需要任何意义,该编码特征就是在整个UOCID编码库中是唯一的、不重复的。
本发明实施例中可以在新增的节点上定义一个有实际意义的名称,可以是表名、字段名、也可以是数据元。
对于新增的UOCID编码,可以对每个UOCID编码定义实际的意义,例如一批表名、字段名。
在具体节点下申请新的UOCID子节点,进行具体的数据元定义,例如以采购订单表实际数据记录、供应商清单实际数据记录为例进行定义。
对实际的数据元节点,可以对其所属的节点关系进行自由定义,以形成UOCID+紧凑队列的存储形式,本例中:一批UOCID节点对应了数据元,同时还可以将该批UOCID节点同时归属另一个或一批UOCID节点。
对于每个UOCID节点编码,其下都可以创建一个任意意义的节点簇,每一个节点簇的定义,无论是何种结构的表、字段、关系、数据元,都可以无穷地在每个UOCID节点下延伸。形成一个完整意义上的有意义UOCID节点集合,例如,一个UOCID节点下,可以装载一个流程集、一个数据集、一段代码指令集、甚至一个图形、一个界面、一个文件,也可以装载一个最原始的数据元素、一个值。
根据UOCID节点编码的自由扩展性,可以将计算机程序的逻辑、代码行、与UOCID节点编码所形成的逻辑结构进行配合,并对计算机程序的每一行指令分配UOCID编码值,形成自由的UOCID代码容器。
通过对UOCID节点的自由定义,形成一个UOCID节点簇,这个节点簇,可以包含实际意义中的:表集合、字段集合、关系集合、计算集合,以及计算机程序的指令结构、界面元素、功能元素、行为元素。其在存储上全是UOCID的整数编码顺序存储,将关系与描述进行了对应。形成一个完整的UOCID系统编码。
UOCID每个节点编码在分配时是不需要实际意义的,在存储时按顺序存储,通过对每个节点的结构关系以及值进行对应,即可形成一个完整的系统定义,这个完整的系统定义从结构到元素,都可以自由扩展与存储、二次定义,只要能反映实际的意图或逻辑即可。包括数据表、数据字段、代码、流程等元素,均可以通过UOCID节点编码进行定义与扩充。同时其存储是紧凑的,在逻辑上与物理上均不需要空白的空间区域进行区别表与表之间,字段与字段之间的关系,而是通过UOCID结构关系中予以关联,而UOCID结构关系中,全是整数予以关联,在存储上仅占用很少的字节,大大节约了数据表、字段在存储时需要开销的空间。
根据形成的UOCID节点簇定义,即可让计算机程序在新的编码系统上进行动态的表、动态的字段设计、存储、读取与计算。同时将数据层、逻辑层、表示层都通过UOCID编码形式进行集成,在本质上,去掉了现有数据库编码技术中,对表、字段的预编码需要,而采取了动态编码需要。在新的UOCID编码系统中,对数据的引用不再需要表名与字段名,而是直接用编码进行引用,实现了动态定义表、字段的无限弹性,实现了计算的快速定位效率,还实现了复用数据的最大复用效率。
利用本发明实施例的数据库实现方法形成的数据库,实现计算时,直接引用UOCID编码地址进行运算,不需要引用表名+字段名进行运算。
而现有数据库编码技术可能需要从几百~几千个表中,并从每个表的几个~几十个字段中寻址,并将数据特征进行比较,找到源数据需要多次I/O读取才能结算。而通过UOCID编码直接引用计算的优势在于,当需要在海量数据中提取数据进行运算时,UOCID编码能直接定位数据源地址,读取源数据的效率大大提高。
同时,整个编码大系统,都可以对UOCID编码进行引用计算,而不需要去寻址表名与字段名。
利用本发明实施例的数据库实现方法形成的数据库进行运算时,可基于一个复杂的云系统进行数据运算集成,例如一个集团公司,由于历史原因,其下属企业的同一类数据格式不同、规则不同,传统数据库必须进行复杂的接口设计、每个接口都需要进行表、字段的反复寻址,整合到一个统一的接口规范再进行统一计算。但通过UOCID编码的系统,由于对每一个表、字段、数据元都在整个云系统拥有唯一的UOCID编码地址,因此可以统一接口设计,一次性寻址到需要计算的源数据,实现不规则数据的云集成。
利用本发明实施例的数据库实现方法形成的数据库进行的运算也解决了同一个企业在不同系统间的数据引用问题,例如在财务系统、ERP系统、CRM系统、HR系统间数据的接口引用,不需要现有数据库的复杂接口开发,而仅需要统一的UOCID接口地址,就可以直接引用并参与跨不同种类系统的运算。
现有数据库与UOCID存储性能比较,在特定模型数据的海量增长方面,数据规模越大,UOCID编码带来的存储空间节省越明显,本例中在数据增长的最后一个阶段,数据存储空间节省50%以上。
综述:采用本发明实施例的数据库实现方法,对所有计算机表达的元素(表、字段、数据元、代码、标记等)都进行UOCID编码分配,分配的编码与物理存储顺序保持一致,将所有计算机表达的元素(表、字段、数据元、代码、标记等)存在同一个连续的存储空间,同时允许每个UOCID节点编码下可以创建一个无限弹性的UOCID编码节点簇,同时对所有计算机元素的引用都可能直接通过UOCID编码进行一次寻址获取,在寻址与计算方面都大大提高了效率。由于UOCID编码与值的存储是采用先申请先存储的方式,实现了按需要创建节点并紧凑存储,对数据在海量增长时对存储空间的大量节省。同时,UOCID编码以节点编码为核心,没有表名、字段名的引用限制,提高了计算机程序在对表创建、增加、删除、变更,对字段创建、增加、删除、变更时的灵活性。UOCID编码系统,综合改进了计算机的存储、设计与计算性能。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种数据库实现方法,其特征在于,包括:
对提供的表、字段,以及表与表之间的数据关系按预设规则分别唯一编码;
将得到的所述表的编码、所述字段的编码及所述数据关系的编码均存储在创建的节点簇编码结构表中,形成编码节点;
根据所述表、字段及所述数据关系之间的从属关系,在所述节点簇编码结构表中建立表的编码、字段的编码及数据关系的编码之间的从属映射;
且在创建的节点簇值对照表中映射各编码所对应的名称,所述名称包括所述表的名称、字段的名称或所述数据关系的名称;
其中,在所述字段所对应的编码节点下建立具有唯一编码的编码子节点,并在所述编码子节点对应的存储空间中存储数据元;
其中,对用户提供的HTML格式的表进行数据库编码操作;
所述对用户提供的HTML格式的表进行数据库编码操作,包括:
抓取HTML格式的所述表的表元素,其中所述表元素包括:表名称元素、数据段元素、数据元元素及数据关系元素;
根据抓取到的所述表元素创建数据待转换池;
扫描所述数据待转换池中的所有元素,并在节点簇编码结构表中分别对所有元素创建唯一编码,并建立创建的编码之间的映射关系,同时在所述节点簇值对照表中映射各编码所对应的名称。
2.根据权利要求1所述的方法,其特征在于,还包括:添加新的表、新的字段及新的数据关系中的一种或多种;
还包括:根据创建的编码节点,直接寻址欲删除的表、字段或数据关系,并对寻址到的欲删除的表、字段及数据关系所占用的数据空间进行清除;
还包括:根据创建的编码节点,直接寻址欲更改的表、字段或数据关系,并对寻址到的欲更改的表、字段及数据关系所占用的数据空间中的信息进行对应修改。
3.根据权利要求2所述的方法,其特征在于,所述添加新的表、新的字段及新的数据关系中的一种或多种,包括:
对欲添加的表、字段及数据关系按所述预设规则进行唯一编码,得到新增编码;
将所述新增编码添加到所述节点簇值对照表中,并在所述节点簇编码结构表中建立添加的表的新增编码、字段的新增编码及数据关系的新增编码之间的从属映射;且在创建的节点簇值对照表中映射各新增编码所对应的名称。
4.根据权利要求3所述的方法,其特征在于,所述对提供的表、字段,以及表与表之间的数据关系按预设规则分别唯一编码,包括:对提供的表、字段,以及表与表之间的数据关系编码时,按照同一编码规则由小到大进行顺序整数编码。
5.根据权利要求4所述的方法,其特征在于,所述对欲添加的表、字段及数据关系按所述预设规则进行唯一编码,得到新增编码,包括:
获取数据库中当前整数编码的最大值,将获取到的当前整数编码的最大值增加预设步长后作为新增编码的起始值,利用所述起始值对欲添加的表、字段及数据关系由小到大进行顺序整数编码,得到新增编码。
6.根据权利要求3所述的方法,其特征在于,所述将所述新增编码添加到所述节点簇值对照表中,包括:
利用得到的所述新增编码在所述节点簇值对照表中创建新的编码节点,以将所述新增编码添加到所述节点簇值对照表中;
或,
利用得到的所述新增编码在已建立的编码节点下创建新的编码子节点,以将所述新增编码添加到所述节点簇值对照表中;
或,
利用得到的所述新增编码在已创建的编码子节点下创建新的从属子节点,以将所述新增编码添加到所述节点簇值对照表中。
7.根据权利要求1所述的方法,其特征在于,所述对用户提供的HTML格式的表进行数据库编码操作,还包括:检测到用户增加、删除、或更改数据段或数据元时,对应在所述节点簇编码结构表及所述节点簇值对照表中增加新的编码、删除指定编码及该指定编码对应的空间中的数据,或在指定的编码存储空间中修改数据。
8.根据权利要求1所述的方法,其特征在于,还包括:根据创建的所述编码节点,直接寻址获取相应的表、字段、数据关系或数据元,并利用寻址到的表、字段、数据关系及数据元按预设规则进行运算。
CN201310597381.1A 2013-11-22 2013-11-22 数据库实现方法 Active CN103559323B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201310597381.1A CN103559323B (zh) 2013-11-22 2013-11-22 数据库实现方法
US14/385,872 US9665600B2 (en) 2013-11-22 2013-11-29 Method for implementing database
PCT/CN2013/088207 WO2015074290A1 (zh) 2013-11-22 2013-11-29 数据库实现方法
EP13897923.2A EP3073392A4 (en) 2013-11-22 2013-11-29 Database implementation method
JP2016554770A JP6262874B2 (ja) 2013-11-22 2013-11-29 データベース実現方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310597381.1A CN103559323B (zh) 2013-11-22 2013-11-22 数据库实现方法

Publications (2)

Publication Number Publication Date
CN103559323A CN103559323A (zh) 2014-02-05
CN103559323B true CN103559323B (zh) 2016-02-10

Family

ID=50013569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310597381.1A Active CN103559323B (zh) 2013-11-22 2013-11-22 数据库实现方法

Country Status (5)

Country Link
US (1) US9665600B2 (zh)
EP (1) EP3073392A4 (zh)
JP (1) JP6262874B2 (zh)
CN (1) CN103559323B (zh)
WO (1) WO2015074290A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599149A (zh) * 2016-12-07 2017-04-26 爱普(福建)科技有限公司 一种工程文本的编码方法
CN106933631B (zh) * 2017-03-13 2021-03-05 王小安 一种用户信息库
CN106991190A (zh) * 2017-04-11 2017-07-28 广东浪潮大数据研究有限公司 一种数据库自动创建子数据库系统
CN108509503A (zh) * 2018-03-01 2018-09-07 华子昂 基于中医机器人数据库编码的方法及系统
CN109086406B (zh) * 2018-08-01 2021-08-10 山东省国土测绘院 一种非同构数据转换方法
CN109597763B (zh) * 2018-12-04 2022-02-25 北京广利核系统工程有限公司 一种对多项数据进行归一化的一致性验证方法及装置
CN109710542B (zh) * 2018-12-28 2021-03-16 北京像素软件科技股份有限公司 一种满n叉树构建方法及装置
CN110008236B (zh) * 2019-04-15 2020-08-04 重庆天蓬网络有限公司 一种数据分布式自增编码方法、系统、设备及介质
CN110263043A (zh) * 2019-06-24 2019-09-20 苏州睿威博科技有限公司 数据存储方法、数据查询方法、装置及存储介质
CN111147546B (zh) * 2019-11-29 2021-05-14 中科院计算技术研究所大数据研究院 一种边缘集群资源的处理方法及系统
CN111968022B (zh) * 2020-08-12 2021-10-26 武汉易瑞信息技术股份有限公司 一种基于json配置方式的业务编号生成系统及方法
CN112256698B (zh) * 2020-10-16 2023-09-05 美林数据技术股份有限公司 一种基于多哈希函数的表关系自动关联方法
CN113033151A (zh) * 2021-03-26 2021-06-25 西安热工研究院有限公司 一种火电数据采集测点编码方法和系统
US11899693B2 (en) * 2022-02-22 2024-02-13 Adobe Inc. Trait expansion techniques in binary matrix datasets

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5991765A (en) 1997-05-06 1999-11-23 Birdstep Technology As System and method for storing and manipulating data in an information handling system
JP2005056085A (ja) * 2003-08-01 2005-03-03 Fujitsu Ltd データ構造変換プログラム
JP2006053724A (ja) * 2004-08-11 2006-02-23 Hitachi Ltd Xmlデータ管理方法
CN1652112A (zh) * 2005-03-02 2005-08-10 北京北方烽火科技有限公司 一种嵌入式环境下数据字典的实现方法
JP4945196B2 (ja) * 2005-08-24 2012-06-06 Soop株式会社 データ管理システム
CN100397397C (zh) 2005-10-31 2008-06-25 北京神舟航天软件技术有限公司 基于关系数据库的xml数据存储与访问方法
US7831629B2 (en) * 2006-01-06 2010-11-09 Microsoft Corporation Method for building data encapsulation layers for highly variable schema
US8327186B2 (en) * 2009-03-10 2012-12-04 Netapp, Inc. Takeover of a failed node of a cluster storage system on a per aggregate basis
CN103106198A (zh) * 2011-11-09 2013-05-15 金蝶软件(中国)有限公司 树型结构实现方法和装置
CN102750328B (zh) * 2012-05-29 2018-08-10 北京城市网邻信息技术有限公司 一种数据结构的构造和存储方法
CN102867059A (zh) * 2012-09-19 2013-01-09 浪潮(北京)电子信息产业有限公司 一种树形结构中数据的处理方法和系统

Also Published As

Publication number Publication date
JP2016539449A (ja) 2016-12-15
JP6262874B2 (ja) 2018-01-17
US9665600B2 (en) 2017-05-30
EP3073392A1 (en) 2016-09-28
EP3073392A4 (en) 2017-02-22
WO2015074290A1 (zh) 2015-05-28
US20150261793A1 (en) 2015-09-17
CN103559323A (zh) 2014-02-05

Similar Documents

Publication Publication Date Title
CN103559323B (zh) 数据库实现方法
US20230334030A1 (en) System and method for slowly changing dimension and metadata versioning in a multidimensional database environment
JP4785833B2 (ja) 永続的でユーザアクセス可能なビットマップ値を有するデータベース管理システム
CN105144080B (zh) 用于元数据管理的系统
CN105630865B (zh) 用于内存列式存储的n比特压缩版本化列数据阵列
Karnitis et al. Migration of relational database to document-oriented database: Structure denormalization and data transformation
US9646030B2 (en) Computer-readable medium storing program and version control method
JP6118515B2 (ja) 連想メモリ更新のためのシステム
CN105868228A (zh) 为olap和oltp事务提供无锁读取和写入操作的内存数据库系统
CN101233505A (zh) 从关系数据库中检索对象并将其保存到关系数据库
CN104866497A (zh) 分布式文件系统列式存储的元数据更新方法、装置、主机
CN102426582B (zh) 数据操作管理装置和数据操作管理方法
CN103744936A (zh) 一种数据库中的多版本并发控制方法及数据库系统
CN106104591A (zh) 映射带键实体的属性
CN104021145A (zh) 一种混合业务并发访问的方法和装置
US6941309B2 (en) Object integrated management system
CN104216961A (zh) 一种数据处理方法和装置
CN102375827A (zh) 一种对版本化的电网模型数据库进行快速加载的方法
WO2014145230A1 (en) Object-oriented data infrastructure
CN100445991C (zh) 用于数据库系统中大对象基础结构的系统和方法
CA2593187A1 (en) Format description for a navigation database
US7984072B2 (en) Three-dimensional data structure for storing data of multiple domains and the management thereof
CN115344270A (zh) 数据处理方法及装置、存储介质及电子设备
JP3169596B2 (ja) データベース管理装置
Chen et al. iblob: Complex object management in databases through intelligent binary large objects

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant