CN102081644A

CN102081644A - 一种数义分离的数据存储方法

Info

Publication number: CN102081644A
Application number: CN 201010564214
Authority: CN
Inventors: 黄浩斌; 黄青峰; 胡彦云; 楼向亮
Original assignee: Zhejiang Hongcheng Computer Systems Co Ltd
Current assignee: Zhejiang Hongcheng Computer Systems Co Ltd
Priority date: 2010-11-25
Filing date: 2010-11-25
Publication date: 2011-06-01

Abstract

本发明涉及一种数据存储方法，尤其涉及一种数义分离的数据存储方法，该方法利用存储时数据和数据含义分开存储，使用时再把含义和数据进行组合的方式，使不同类别、不同属性的数据可以在同表共同存储，从而对于业务的变化、数据源的变化、以及数据要求的变化，不用不断的修改数据表结构来适应这种变化，从而提高数据库的可扩展性、减少数据库的维护性。本发明的有益效果：该方法大大降低开发和维护成本，同时也降低了应用变更的工作量和风险，成功地解决了现有技术中存在的问题。

Description

一种数义分离的数据存储方法

技术领域

本发明涉及一种数据存储方法，尤其涉及一种数义分离的数据存储方法。

背景技术

在实际的数据库应用中，经常需要创建不同的表来存储不同类别、不同属性、不同列数、不同顺序的数据记录，而在当时满足的情况下，随着新的数据记录的产生，原来所创建的表可能根本不能存储新来的数据记录。由此需要再去创建新表或扩展原表以存储该数据，同时对于该类数据的应用也需要重新开发，甚至原有应用也都需要修改。常规的表结构在这种情况下有以下几个问题会出现：1、存储数据的字段不够，可能需要扩展原有表的字段；2、存储数据的字段的含义完全不同，可能需要创建新表来存储新的数据；3、由于原有表的变动或新表的创建，导致应用功能也势必需要进行修改或新建。由此，一种可适应于数据变化的、数据扩展的、可把不同数据整合的存储方法，就显得尤为需要。

发明内容

本发明为克服现有技术中存在的不足之处，目的在于提供数义分离的数据存储方法，该方法利用存储时数据和数据含义分开存储，使用时再把含义和数据进行组合的方式，使不同类别、不同属性的数据可以在同表共同存储，从而对于业务的变化、数据源的变化、以及数据要求的变化，不用不断的修改数据表结构来适应这种变化，从而提高数据库的可扩展性、减少数据库的维护性，并大大降低开发和维护成本，同时也降低了应用变更的工作量和风险，成功地解决了现有技术中存在的问题。

本发明是通过以下技术方案达到上述目的：

1、一种数义分离的数据存储方法，包括如下步骤：

1)建立数据内容表，统计具体应用系统每种类别数据最多的属性个数，根据这个数量来定制数据内容表的字段数量，其字段结构至少包括：序号、字段含义标识id、上述数量的各个属性代码、值；

2)建立属性字典码表，其字段结构至少包括：序号、属性代码、属性名称、属性类别代码、属性类别名称；

3)建立数据字段含义表，其字段结构至少包括：序号、字段含义标识id、步骤1)所述数量的各个属性类别代码、组合属性名称；

4)穷举可能出现的属性名称，并将他们预先插入到属性字典码表中，同时定义该属性的属性代码、属性类别代码、属性类别名称；

5)数据进入数据内容表，定义好该数据的序号、步骤1)所述数量的各个属性代码、值以及根据各个属性代码自动产生的字段含义标识id；

6)数据字段含义表根据数据内容表的所有属性信息，通过关联属性字典码表后进行自动抓取，必须包含该数据的字段含义标识id、各个属性的各个属性类别代码，并自动生成相应的组合属性名称；

7)在进行数据应用时，首先关联属性字典码表后根据字段含义表中各个属性对应的属性类别代码，找到符合需求的数据的字段含义标识id，然后再根据找出的字段含义标识id对数据内容表进行过滤，找出所需要的数据记录。

8)数据的各属性对应的信息，根据各属性代码及对应的各属性类别代码通过属性字典表进行关联获得。

作为优选，在数据内容表和数据字段含义表中，所有可能涉及到的属性，必须都选自标准的属性字典码表；

作为优选，属性字典码表随着需求的变化，可以进行手工添加新的属性信息；

作为优选，数据内容表的属性数量为5个。

作为优选，字段含义标识id由属性代码拼接或转换而成。

本发明的有益效果：本发明利用存储时数据和数据含义分开存储，使用时再把含义和数据进行组合的方式，使不同类别、不同属性的数据可以在同表共同存储，从而对于业务的变化、数据源的变化、以及数据要求的变化，不用不断的修改数据表结构来适应这种变化，从而提高数据库的可扩展性、减少数据库的维护性，并大大降低开发和维护成本，同时也降低了应用变更的工作量和风险，成功地解决了现有技术中存在的问题。

附图说明

图1是数据内容表的结构示意图；

图2是数据字段含义表的结构示意图；

图3是属性字典码表的结构示意图。

具体实施方式

下面结合具体实施例对本发明进行进一步描述：

统计局的日常工作中，所有统计结果，均是由众多的数据微粒汇聚而成。其中一个数值的含义，可以拆分到具体某个指标下的某个或某几个分组成员的值。由于他们需要涉及的统计指标、分组十分广泛，每个指标分析的方式各不相同，并且随时可能由于业务需求的变化而变动，所以数据的分析模式往往无法固定。

例如：社会消费品零售额指标，在统计中可以按照行业进行分析，也可以按照区县市进行分析，甚至经常按照行业和企业性质两种分组组合的方式进行分析。按照以往的数据结构设计模式，如果将这个指标——社会消费品零售额放在一张事实表中来存储，我们就要将表结构按如下方式来设计：

Time_id	number	时间
			Indicator_id	Varchar2(30)	指标id
qx_id	number	区县id
			hy_id	number	行业id

qy_id	number	企业id
			kz_id	number	扩展id
kz_id2	number	扩展id2
			Value1	number	数值

在这种结构中每个字段的含义是固定的，也就是与本专利相对的数义结合的方式存储。但是当这个指标的分析角度增加时，自能通过预留的扩展字段，或者增加新字段来满足需求，这样此表结构就变得十分不稳定。

这就给应用开发者造成了很大的困扰，当分析的类别增加时，他们需要建立或修改的表结构，并开发新的程序来适应这种变化。

根据本专利的实施方案，如图1所示，首先建立数据内容表，统计具体应用系统每种类别数据最多的属性个数，根据这个数量来定制数据内容表的字段数量，其字段结构包括：序号、字段含义标识id、上述数量的各个属性代码、值。在这个表中，各个属性代码的含义不是固定的。如对于“社会消费品零售额”这个指标来说，如果仅仅是以区县作为分析角度的时候，仅需要使用property1字段，以行业作为分析角度的数据，也只要使用property1字段，而以行业+企业性质的组合分析角度时，使用property1和property1两个字段。可以看出，各个属性代码字段没有固定的含义，根据字段含义标识id来决定每个属性代码究竟是代表什么含义。

然后，如图3所示，建立属性字典码表，其字段结构包括：序号、属性代码、属性名称、属性类别代码、属性类别名称；穷举可能出现的属性名称，并将他们预先插入到属性字典码表中，同时定义该属性的属性代码、属性类别代码、属性类别名称。

最后，如图2所示，建立数据字段含义表，其字段结构包括：序号、字段含义标识id、步骤1)所述数量的各个属性类别代码、组合属性名称。

数据字段含义表与数据内容表对应，当数据内容表生成时，自动根据属性代码，通过关联属性字典码表找到对应的属性类别，例如：通过property1，其对应的属性名称为“杭州市”，找到Property_class1，其对应的属性类别名称为“区县分组”，各个属性类别自动合并组成组合属性名称。

数据进入数据内容表，定义好该数据的序号、步骤1)所述数量的各个属性代码、值以及根据各个属性代码自动产生的字段含义标识id。

在进行数据应用时，首先关联属性字典码表后根据字段含义表中各个属性对应的属性类别代码，找到符合需求的数据的字段含义标识id，然后再根据找出的字段含义标识id对数据内容表进行过滤，找出所需要的数据记录。

数据的各属性对应的信息，根据各属性代码及对应的各属性类别代码通过属性字典表进行关联获得。

以上的所述乃是本发明的具体实施例及所运用的技术原理，若依本发明的构想所作的改变，其所产生的功能作用仍未超出说明书及附图所涵盖的精神时，仍应属本发明的保护范围。

Claims

1.一种数义分离的数据存储方法，其特征在于包括如下步骤：

3)建立数据字段含义表，其字段结构至少包括：序号、字段含义标识id、步骤

1)所述数量的各个属性类别代码、组合属性名称；

7)在进行数据应用时，首先关联属性字典码表后根据字段含义表中各个属性对应的属性类别代码，找到符合需求的数据的字段含义标识id，然后再根据找出的字段含义标识id对数据内容表进行过滤，找出所需要的数据记录；

2.根据权利要求书1所述的一种数义分离的数据存储方法，其特征在于，在数据内容表和数据字段含义表中，所有可能涉及到的属性，必须都选自标准的属性字典码表。

3.根据权利要求书1或2所述的一种数义分离的数据存储方法，其特征在于，属性字典码表随着需求的变化，可以进行手工添加新的属性信息。

4.根据权利要求书1所述的一种数义分离的数据存储方法，其特征在于，数据内容表的属性数量为5个。

5.根据权利要求书1所述的一种数义分离的数据存储方法，其特征在于，字段含义标识id由属性代码拼接或转换而成。