CN1117335C - 数据库的管理方法 - Google Patents
数据库的管理方法 Download PDFInfo
- Publication number
- CN1117335C CN1117335C CN 99104968 CN99104968A CN1117335C CN 1117335 C CN1117335 C CN 1117335C CN 99104968 CN99104968 CN 99104968 CN 99104968 A CN99104968 A CN 99104968A CN 1117335 C CN1117335 C CN 1117335C
- Authority
- CN
- China
- Prior art keywords
- database
- attribute
- classification
- concordance list
- eigenwert
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种数据库的管理方法,特别是指一种管理数据库中数据结构不同的类别的方法,从同一类别所包含的多个物件提取其属性,且以提出的属性建立与原有类别对应的索引表,因此在进行类别的存取时,通过此索引表可在数据库中找到对应类别所属的物件所在的存储位置,可适时地简化在存取类别时的管理程序,而且在数据库中各类别的物件是以一个接着一个,且向一侧方向依序填满的方式存储于数据结构中相应的位置内,可提高存储空间的利用率。
Description
本发明涉及一种数据库的管理方法,应用于对结构不同的数据资料管理,用以节省存储空间。
在传统技术对工程中同一数据资源的不同数据结构类型进行数据库管理时,其管理的方法大致可分为下列两种:
1.如图1所示,当数据库11中存有多个类别12,而且其各自所拥有的特征121,如:共同特征1、特征A1、特征B1…等的结构不同时,是分别编写其所属的管理程序13,来对其所属的类别进行管理;这样不但在管理的方法上会重复开发,而且管理和维护都必需要分开进行,所以当管理方法和数据结构有所变化时,便要对所有的管理程序进行修改,如此以分别管理类别的方式对在同一种型态的资源进行管理,将不利于日后方法的维护与数据的更新。
2.参照图2,根据数据库11中所有类别12的数据结构,于数据库11构建一统一的数据结构其中该数据结构涵盖了所有类别12各自所拥有的特征121的栏位,而各类别12则是逐次将其所拥有的特征121,存入数据库11内相应的位置中,也就是对号入座的意思;这种方法虽然能以单一的管理程序13进行资源的管理,而且也简化了开发的复杂度,但是当某种数据的结构中没有其他数据的某个特征121时就存在存储空间及操作步骤上的浪费,也就是在当不同类别的数据结构间存在有差异时,就会造成储存空间及执行步骤上的浪费,尤其是数据结构差别愈大,此种浪费就更加显著。
传统以类别的数据结构的不同,分别编写其所属的管理程序,这样不但重复开发,而且管理和维护都需要分别进行,一旦管理方法和数据结构有所变化时,便要对所有的管理程序进行修改,如此对同一种型态的资源的管理方式,将不利于方法的维护与数据的更新。而且,若是采取统一数据结构的方式,虽然能以单一的管理程序进行资源的管理,也简化了开发的复杂度,但是当不同数据结构间存在有差异时,就会造成存储空间及执行步骤上的浪费,尤其是数据结构差别愈大,此种浪费就更加显著。
本发明的主要目的是提供一种数据库统一管理的方法,用该一管理程序通过已建立的索引表,例如,特征值表,在一数据库中提取当前类别所属的物件,其中数据库中各类别的物件的存储是一个接着一个,也就是说在数据库中各类别均有其所属的数据结构。
本发明是在对数据库进行统一管理时,先对数据库内的各类别,依其构成的物件,找出所有可能存在的属性,使得每一类别均具备其中的某些属性,而且每个属性在各类别中所呈现的表征都是一样的,若有区别也仅在于数量上的不同。然后再根据上面的划分建立一索引表,以统一各类别的基本结构,并分别对各类别的物件结构产生出相应的实际数据库。在建立索引表时是根据属性在各类别的存在的有无以1/0的二进制码相区分,而每个属性在类别中对应的数值的大小,则用有限大小的数字直接填入;这样使得填表的结果能确保任意两种类别不会出现内容相同的现象,最后再逐一总合用以表示各类别的属性的二进制码,编写成一十六进制格式的特征值。在提取数据库中的类别时,是先取得要提取类别的特征值,然后根据特征值于索引表找到相应的类别,再以类别为基准在索引表中逐一进行相应的属性的判读,于是,藉由判读的结果至数据库内属于该类别的结构中,进行类别的物件的提取,如此便可依据此类别的属性的有无,作相应的决定,例如:是否跳过此一执行步骤,或是在物件提取后直接执行其属性所表示的状态,如:发出声音。
有关本发明的详细内容及技术,现就结合附图说明如下:
图1为传统数据库的管理方法第一实施例的示意图。
图2为传统数据库的管理方法第二实施例的示意图。
图3为本发明数据库管理方法的示意图。
图4为本发明建立索引表的流程图。
图5为本发明数据库管理方法实施例的示意图。
图6为本发明经处理后的数据库的结构示意图。
图7为本发明读取数据库的流程图。
为能对本发明所揭露的技术作详细的阐述,首先定义一些下文中提及的名词,包括有:
“物件”:具有相同特征的数据的集合,例如:声音档案,文字档案,如图5中的每一纵行(Row)有打勾的方块均属所说的物件。
“类别”:许多物件的集合,但是在同一类别中所包括的所有物件,彼此之间一定存在有关联。例如:考试题库中的文法、作文…等题型均属之,也就是如图5中的每一横列(Column)。
“数据结构”:是指每个类别的物件在数据库中存储的格式。
“属性”:每个物件所拥有的特值(可为单一性或多重性),用以解释物件的本质。例如:如图5中“问题发声”的属性,就包括了发声的次数,或是发声句数..等。
“特征值”:为十六进制格式或十进制格式,用以表示每个类别其所含的物件在以二进制表示时,所对应的权值(Weight)。
“X(x1 x2)”:为一加权值,用以表示类别中不存在的物件,其中x1、x2为一二进制的数值,用以防止类别之间出现相同的特征值。
图3所示,是以本发明所揭露的技术所构建出的数据库的管理结构,主要是由一管理程序21、一索引表22、以及一存储有不同结构的类别24的数据库23,其中管理程序21是由一逻辑处理单元来进行,数据库23则存储于一记录媒体中,同时每个类别24具有多个不同属性的物件241,而且各类别24之间也可能存在有相同属性的物件;管理程序21是通过索引表22对数据库23进行类别24的存取,此时若要对数据库23内的类别结构进行改变或新增时,只要在索引表22中构建出此类别24的属性及特征值,并在数据库23中增加此类别的结构,便可于数据库中取得相应的数据,而不须重新去编写管理的程序,以及对数据库23做结构上的调整。
根据前述,当要实行本发明的统一管理数据库前,首先就是要找出数据库中各类别拥有的物件的特征,以建立一索引表22,参照图4,有关索引表22的建立其步骤如下所列:
步骤101.根据数据库23中类别24的组成物件,规划出所有可能存在的属性(参照表一,即一可涵盖所有类别的属性的结构);
步骤102.根据类别24与属性构建一索引表22;
步骤103.根据组成类别24的物件应具有的属性的有无,以一二进制的数值型式的标记填入索引表22(参照表二)中与各类别24相应的位置,用以表示各类具有的特征;其中“1”用以表示属性存在,“0”为属性不存在,并以二进制的格式来表示属性实际上的数字(如:002=010、012=110、…、112=310);
步骤104.总结索引表22中,各类别24所属的用以表示其存在的属性的数值,以一十六进制或十进制的特征值表示;
步骤105.判断是否出现特征值相同的类别24,若为是,则执行下一步骤,若为否,则跳至步骤107;
步骤106.将特征值相同的类别24,以X(x1 x2)格式的加权值来表示其所拥有的属性,跳至步骤104;
步骤107.结束索引表22的建立。
在上述中,当归类出所有类别的共通的属性后,会随即定义出各属性存储的结构(如:该属性为一字串或为一整数值),并根据各类型所含的物件的特征,分别构建出各类别在数据库中的结构,以记录各类所具有的物件,此时物件在数据库内的存储方式是以一笔接着一笔的串列方式存入数据库内的(如图3所示)。因此,进行数据库的类别提取时,其执行的顺序上,是先取得要提取类别的特征值,以及此类别在数据库中的起始位址,然后根据特征值于索引表找到对应的类别,再以类别为基准在索引表中逐一进行相应的属性的判读,由判读的结果决定是否跳过或提属性所对应的物件内容。
参照图5,为一国家英文考试的题库结构图,如图所示,包含有对话听力选择、短文听力选择、短文听写填空、复合听力填空、单句听力选择、单句听写、文法、阅读、字型填空、作文等共十种题型,并依照每个题目的性质在题库的相应位置作一标记(黑色打勾的部分),用以表示该题型具有的物件,而空白之处则表示此题型未具有该项物件,例如:“文法题”就具有题目正文、选择题、答案、题目详解的物件。
结合参照图4的处理流程,当创建数据库时,首先是对图5中的各题型进行分析,将所有题型依其物件的属性再细分成如表一所示的基本结构。
表一、题目数据库基本结构
名称 | 数据类型 | 作用 |
声音文件号 | Integer | 听力题声音所在文件序号 |
题目段落行数 | Integer | 题目段落与声音相对应的划分 |
问题数 | Integer | 此题中的小题数 |
声音位置数组 | Long | 各段声音的定位信息 |
题目段落数组 | String | 按行数存放的题目正文 |
问题段落数组 | String | 与每小题相对应的问题正文 |
选择答案段落数组 | String | 每小题四个备选答案 |
正确答案数组 | String | 与每小题相对应的答案段落 |
题目详解 | String | 文法点详解 |
其中题目段落、正确答案为各题型共同的拥有的属性,其他如问题段落等则依各题型而不相同,听力题型为有声音的属性,而其他题型则没有;文法题型每道题为单一小题,而阅读则为多道小题。今以短文听写填空题型为例,这种题型属于听写填空题,听写的内容要念三遍,有多道问题,并有问题答案,所以其具有的属性为:有声音文件(听写)、填空类型、多句声音、声音念三遍、多道小题、标准答案,于是便可整理填入表二的题型索引表中,参照表二的第5列,其中“11”是用以表示听写的内容要念三遍(因为112=310),“X”是因本题型无问题部分,故“X”为无关值,填以“(0)”为特征值考虑,然后将表中用以表示短文听写的各属性的二进制数字转换成十六进制的格式,即0001000111112=11F16,得到一11F的特征值;于是便可依图4的处理流程,将文法、阅读、短文听力选择逐之依其属性填入表二的题型索引表中。
表二、题型结构索引表
文法 | 阅读 | 短文听力选择 | 短文听写填空 | … | ||
声音文件(1/0:有/无) | 0 | 0 | 1 | 1 | … | |
小题数(1/0:多题/单题) | 0 | 1 | 0 | 1 | … | |
声音遍数 | X(00) | X(00) | 01(3) | 11(3) | … | |
声音句数(1/0:多/单) | X(1) | X(1) | 1 | 1 | … | |
问题(1/0:选择/填空) | 1 | 1 | 1 | 0 | … | |
问题段落(1/0:有/无) | 0 | 1 | 0 | 0 | … | |
题目详解(1/0:有/无) | 1 | 0 | 0 | 0 | … | |
填空(1/0:标准/大意) | X(0) | X(0) | X(0) | 1 | … | |
问题(1/0:朗读/显示) | X(0) | 0 | X(0) | X(0) | … | |
特征值 | 16进制 | 0B0 | 072 | 035 | 11F | … |
10进制 | 176 | 114 | 53 | 287 | … |
于是在表二的题型索引表建立完成后,就可将图5的题库,重新整理成如图6所示的结构,如图所示,在记录媒体中依各题型的不同结构(即所拥有的物件数),建立其对应的存储结构,而各题型的物件此时就可以逐一地以一个接着一个的方式填入其所属存储结构的相应位置中。
当题库经由上述的程序建立完成后,在进行数据库的读取时,参照图7所揭示的流程图,其步骤依序如下:
步骤201.读取相应于要提取的题型的特征值及题目在题库中的起始位置;
步骤202.根据特征值在题型结构索引表中,取出与当前所提取的题型的属性,以及该题型相关的数字;
步骤203.判断是否存在有与声音相关的属性,若为是,则执行下一步骤,若为否,则执行步骤205;
步骤204.根据题目数据库基本结构的格式,于题库中读出与声音信息相关的资料;
步骤205.根据题目数据库基本结构的格式,于题库中读出属于题目正文(如:题目段落数组)的资料;
步骤206.判断是否存在有问题内容的属性,若为是,则执行下一步骤,若为否,则执行步骤208;
步骤207.根据题目数据库基本结构的格式,于题库中读出有关问题内容的段落的资料;
步骤208.判断是否存在有可供使用者选择答案的答案内容的属性,若为是,则执行下一步骤,若为否,则执行步骤211;
步骤209.根据题目数据库基本结构的格式,于题库中读出与选择题答案内容相关的资料;
步骤210.根据题目数据库基本结构的格式,于题库中读出与正确答案相关的资料;
步骤211.判断是否存在有题目详解内容的属性,若为是,则执行下一步骤,若为否,则执行步骤213;
步骤212.根据题目数据库基本结构的格式,于题库中读出有关题目详解内容的段落的资料;
步骤213.完成题目的读出。
所以,根据上述的处理流程,在读取题目时,就可通过题型结构索引表内所记录的各题型的属性,从题目数据库中提取相应的物件资料。
本发明所揭露的方法具有以下的优点:
1.通过对资源中不同的类别的数据结构建立索引表,并由此生成各数据的特征值,可以用统一的工具对各种类型的数据结构进行统一管理;对不同类别的数据进行存取只需根据特征值做步骤上的取舍。
2.特征值可用于表示出该数据类型的结构,所以在用统一的管理方法时,无须建立包含各类型的全部特征的实际存储结构,节省了存储空间;同时根据特征值做步骤的取舍又避免了操作步骤的浪费。
3.设计数据库管理方法时,只需要按照数据库基本类型进行,不需要关心任何具体的类型结构,提高了方法的开发速度和可维护性。
4.对工程资源中新增加的结构类型,只需要按照已有的数据库基本结构建立符合其结构的数据库,并用特征表总结出其特征值,即可用统一的管理方法进行管理,不需要做任何方法上的修改或增加,提高了数据库的可扩充性,并避免了因数据库变化迫使数据库管理方法变化,和由此引起的可能的错误,更便于数据库的维护。
虽然本发明以前述的较佳实施例揭露如上,但其并非用以限定本发明,任何本领域的技术人员,在不脱离本发明的精神和范围内,当可作些许更动与润饰,因此本发明的保护范围应当以权利要求所界定的范围为准。
Claims (5)
1.一种数据库的管理方法,用于管理存储在一记录媒体内的包含有多个物件的类别,使该记录媒体节省存储空间,该方法包括:
提取该物件的属性;
构建一以该属性为构成元素的索引表;以及
利用一逻辑处理单元,根据该索引表以一个接着一个,且向一侧方向依序填满的方式,将该物件存储于该数据库中;
其中建立该索引表的步骤包括:
步骤1:根据数据库中类别的组成物件,规划出所有可能存在的属性;
步骤2:根据类别与属性构建一索引表;
步骤3:根据组成类别的物件应具有的属性的有无,以一二进制的数值型式的标记填入索引表22中与各类别24相应的位置,用以表示各类具有的特征;
步骤4:总结索引表中,各类别所属的用以表示其存在的属性的数值,
步骤5:判断是否出现特征值相同的类别,若为是,则执行下一步骤,若为否,则结束索引表的建立;
步骤6:将特征值相同的类别,以X(x1 x2)格式的加权值来表示其所拥有的属性,并返回步骤4;
步骤7:结束。
2.如权利要求1所述数据库的管理方法,其中该索引表是以一二进制数值的“1”表示该类别存在有该属性,而以“0”来表示该类别不存在有该属性。
3.如权利要求2所述数据库的管理方法,其中该索引表中包含有一特征值,该特征值为在该索引表中记录该类别的属性的该二进制数值的组合。
4.如权利要求3所述数据库的管理方法,其中该特征值是十六进制的格式。
5.如权利要求1所述数据库的管理方法,其中该数据库包含有多个该类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 99104968 CN1117335C (zh) | 1999-04-09 | 1999-04-09 | 数据库的管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 99104968 CN1117335C (zh) | 1999-04-09 | 1999-04-09 | 数据库的管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1270363A CN1270363A (zh) | 2000-10-18 |
CN1117335C true CN1117335C (zh) | 2003-08-06 |
Family
ID=5271863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 99104968 Expired - Fee Related CN1117335C (zh) | 1999-04-09 | 1999-04-09 | 数据库的管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1117335C (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7269612B2 (en) * | 2002-05-31 | 2007-09-11 | International Business Machines Corporation | Method, system, and program for a policy based storage manager |
CN101645085B (zh) * | 2009-09-03 | 2012-09-12 | 北京伟库电子商务科技有限公司 | 不规则字段存储方法和系统 |
CN102063434B (zh) * | 2009-11-18 | 2013-03-27 | 财团法人资讯工业策进会 | 候选键撷取装置及其候选键撷取方法 |
CN102567434B (zh) * | 2010-12-31 | 2013-04-10 | 百度在线网络技术(北京)有限公司 | 一种数据块处理方法 |
CN103544228A (zh) * | 2013-10-07 | 2014-01-29 | 宁波芝立软件有限公司 | 一种收养关系信息库存储组织方法、系统及设备 |
CN103543957A (zh) * | 2013-10-07 | 2014-01-29 | 宁波芝立软件有限公司 | 一种抚养关系信息库存储组织方法、系统及设备 |
CN105677776A (zh) * | 2015-12-30 | 2016-06-15 | 厦门欣欣信息有限公司 | 一种数据处理方法及装置 |
CN105825196B (zh) * | 2016-03-28 | 2020-01-31 | 联想(北京)有限公司 | 一种信息处理方法和电子设备 |
CN109937413B (zh) * | 2016-07-20 | 2023-04-21 | 深圳市东信时代信息技术有限公司 | 海量人群特征数据的处理方法及系统 |
CN106484790B (zh) * | 2016-09-20 | 2021-03-26 | 上海万格生物科技有限公司 | 一种信息系统的样本库信息管理方法及装置 |
CN107633027A (zh) * | 2017-08-29 | 2018-01-26 | 深圳市诚壹科技有限公司 | 数据处理方法及装置 |
-
1999
- 1999-04-09 CN CN 99104968 patent/CN1117335C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1270363A (zh) | 2000-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1117335C (zh) | 数据库的管理方法 | |
Hayes | The growing inaccessibility of science | |
CN1871597B (zh) | 利用一套消歧技术处理文本的系统和方法 | |
KR101394723B1 (ko) | 문서 내의 목록들의 재구성 | |
CN100351849C (zh) | 字符识别装置和字符识别方法 | |
JPH11250041A (ja) | 文書処理装置および文書処理方法 | |
CN1720517A (zh) | 数字声音数据的摘要制作 | |
CN115186654B (zh) | 一种公文文本摘要生成方法 | |
US9524341B2 (en) | Retrieval system and method of searching of information in the internet | |
CN112001183A (zh) | 一种基于段落语义的中小学试题分割提取方法及系统 | |
CN105354192A (zh) | 一种对结构不同的数据资料的管理方法 | |
CN114757172A (zh) | 一种基于段落区间划分的篇章级合同抽取方法 | |
CN1575467A (zh) | 不受语言和方法限制的计算机化编码器-解码器 | |
KR102028487B1 (ko) | 문서의 토픽 모델링 장치 및 방법, 이를 기록한 기록매체 | |
CN112733513A (zh) | 自动整理航司退改规则的方法、系统、终端和存储介质 | |
Svenonius et al. | Title page sanctity? The distribution of access points in a sample of English language monographs | |
CN100389418C (zh) | 电子词典中多个专业词典的数据结构的合并方法及装置 | |
CN111563123A (zh) | 一种hive仓库元数据实时同步方法 | |
CN117033561B (zh) | 基于esg指标优化的企业评估模型生成方法及系统 | |
CN115859931B (zh) | 一种电子问卷的生成方法 | |
CN115858634B (zh) | 一种问卷信息处理方法 | |
Perdana et al. | Proposal to encode Kawi | |
DE60105081T2 (de) | Datenspeichermeidum mit unterschiedlichen Formaten mit einem gemeinsamen Teil | |
Marcus et al. | Topic Segmentation: algorithms and applications | |
CN115935251A (zh) | 随机组卷方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20030806 Termination date: 20110409 |