CN1270363A - 数据库的管理方法 - Google Patents

数据库的管理方法 Download PDF

Info

Publication number
CN1270363A
CN1270363A CN 99104968 CN99104968A CN1270363A CN 1270363 A CN1270363 A CN 1270363A CN 99104968 CN99104968 CN 99104968 CN 99104968 A CN99104968 A CN 99104968A CN 1270363 A CN1270363 A CN 1270363A
Authority
CN
China
Prior art keywords
database
management method
attribute
concordance list
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 99104968
Other languages
English (en)
Other versions
CN1117335C (zh
Inventor
陈蕴弘
宋建福
林光信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Corp
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CN 99104968 priority Critical patent/CN1117335C/zh
Publication of CN1270363A publication Critical patent/CN1270363A/zh
Application granted granted Critical
Publication of CN1117335C publication Critical patent/CN1117335C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种数据库的管理方法,特别是指一种管理数据库中数据结构不同的类别的方法,从同一类别所包含的多个物件提取其属性,且以提出的属性建立与原有类别对应的索引表,因此在进行类别的存取时,通过此索引表可在数据库中找到对应类别所属的物件所在的存储位置,可适时地简化在存取类别时的管理程序,而且在数据库中各类别的物件是以一个接着一个,且向一侧方向依序填满的方式存储于数据结构中相应的位置内,可提高存储空间的利用率。

Description

数据库的管理方法
本发明涉及一种数据库的管理方法,应用于对结构不同的数据资料管理,用以节省存储空间。
在传统技术对工程中同一数据资源的不同数据结构类型进行数据库管理时,其管理的方法大致可分为下列两种:
1.如图1所示,当数据库11中存有多个类别12,而且其各自所拥有的特征121,如:共同特征1、特征A1、特征B1…等的结构不同时,是分别编写其所属的管理程序13,来对其所属的类别进行管理;这样不但在管理的方法上会重复开发,而且管理和维护都必需要分开进行,所以当管理方法和数据结构有所变化时,便要对所有的管理程序进行修改,如此以分别管理类别的方式对在同一种型态的资源进行管理,将不利于日后方法的维护与数据的更新。
2.参照图2,根据数据库11中所有类别12的数据结构,于数据库11构建一统一的数据结构其中该数据结构涵盖了所有类别12各自所拥有的特征121的栏位,而各类别12则是逐次将其所拥有的特征121,存入数据库11内相应的位置中,也就是对号入座的意思;这种方法虽然能以单一的管理程序13进行资源的管理,而且也简化了开发的复杂度,但是当某种数据的结构中没有其他数据的某个特征121时就存在存储空间及操作步骤上的浪费,也就是在当不同类别的数据结构间存在有差异时,就会造成储存空间及执行步骤上的浪费,尤其是数据结构差别愈大,此种浪费就更加显著。
传统以类别的数据结构的不同,分别编写其所属的管理程序,这样不但重复开发,而且管理和维护都需要分别进行,一旦管理方法和数据结构有所变化时,便要对所有的管理程序进行修改,如此对同一种型态的资源的管理方式,将不利于方法的维护与数据的更新。而且,若是采取统一数据结构的方式,虽然能以单一的管理程序进行资源的管理,也简化了开发的复杂度,但是当不同数据结构间存在有差异时,就会造成存储空间及执行步骤上的浪费,尤其是数据结构差别愈大,此种浪费就更加显著。
本发明的主要目的是提供一种数据库统一管理的方法,用该一管理程序通过已建立的索引表,例如,特征值表,在一数据库中提取当前类别所属的物件,其中数据库中各类别的物件的存储是一个接着一个,也就是说在数据库中各类别均有其所属的数据结构。
本发明是在对数据库进行统一管理时,先对数据库内的各类别,依其构成的物件,找出所有可能存在的属性,使得每一类别均具备其中的某些属性,而且每个属性在各类别中所呈现的表征都是一样的,若有区别也仅在于数量上的不同。然后再根据上面的划分建立一索引表,以统一各类别的基本结构,并分别对各类别的物件结构产生出相应的实际数据库。在建立索引表时是根据属性在各类别的存在的有无以1/0的二进制码相区分,而每个属性在类别中对应的数值的大小,则用有限大小的数字直接填入;这样使得填表的结果能确保任意两种类别不会出现内容相同的现象,最后再逐一总合用以表示各类别的属性的二进制码,编写成一十六进制格式的特征值。在提取数据库中的类别时,是先取得要提取类别的特征值,然后根据特征值于索引表找到相应的类别,再以类别为基准在索引表中逐一进行相应的属性的判读,于是,藉由判读的结果至数据库内属于该类别的结构中,进行类别的物件的提取,如此便可依据此类别的属性的有无,作相应的决定,例如:是否跳过此一执行步骤,或是在物件提取后直接执行其属性所表示的状态,如:发出声音。
有关本发明的详细内容及技术,现就结合附图说明如下:
图1为传统数据库的管理方法第一实施例的示意图。
图2为传统数据库的管理方法第二实施例的示意图。
图3为本发明数据库管理方法的示意图。
图4为本发明建立索引表的流程图。
图5为本发明数据库管理方法实施例的示意图。
图6为本发明经处理后的数据库的结构示意图。
图7为本发明读取数据库的流程图。
为能对本发明所揭露的技术作详细的阐述,首先定义一些下文中提及的名词,包括有:
“物件”:具有相同特征的数据的集合,例如:声音档案,文字档案,如图5中的每一纵行(Row)有打勾的方块均属所说的物件。
“类别”:许多物件的集合,但是在同一类别中所包括的所有物件,彼此之间一定存在有关联。例如:考试题库中的文法、作文…等题型均属之,也就是如图5中的每一横列(Column)。
“数据结构”:是指每个类别的物件在数据库中存储的格式。
“属性”:每个物件所拥有的特值(可为单一性或多重性),用以解释物件的本质。例如:如图5中“问题发声”的属性,就包括了发声的次数,或是发声句数··等。
“特征值”:为十六进制格式或十进制格式,用以表示每个类别其所含的物件在以二进制表示时,所对应的权值(Weight)。
“X(x1 x2)”:为一加权值,用以表示类别中不存在的物件,其中x1、x2为一二进制的数值,用以防止类别之间出现相同的特征值。
图3所示,是以本发明所揭露的技术所构建出的数据库的管理结构,主要是由一管理程序21、一索引表22、以及一存储有不同结构的类别24的数据库23,其中管理程序21是由一逻辑处理单元来进行,数据库23则存储于一记录媒体中,同时每个类别24具有多个不同属性的物件241,而且各类别24之间也可能存在有相同属性的物件;管理程序21是通过索引表22对数据库23进行类别24的存取,此时若要对数据库23内的类别结构进行改变或新增时,只要在索引表22中构建出此类别24的属性及特征值,并在数据库23中增加此类别的结构,便可于数据库中取得相应的数据,而不须重新去编写管理的程序,以及对数据库23做结构上的调整。
根据前述,当要实行本发明的统一管理数据库前,首先就是要找出数据库中各类别拥有的物件的特征,以建立一索引表22,参照图4,有关索引表22的建立其步骤如下所列:
步骤101·根据数据库23中类别24的组成物件,规划出所有可能存在的属性(参照表一,即一可涵盖所有类别的属性的结构);
步骤102·根据类别24与属性构建一索引表22;
步骤103·根据组成类别24的物件应具有的属性的有无,以一二进制的数值型式的标记填入索引表22(参照表二)中与各类别24相应的位置,用以表示各类具有的特征;其中“1”用以表示属性存在,“0”为属性不存在,并以二进制的格式来表示属性实际上的数字(如:002=010、012=110、…、112=310);
步骤104·总结索引表22中,各类别24所属的用以表示其存在的属性的数值,以一十六进制或十进制的特征值表示;
步骤105·判断是否出现特征值相同的类别24,若为是,则执行下一步骤,若为否,则跳至步骤107;
步骤106·将特征值相同的类别24,以X(x1 x2)格式的加权值来表示其所拥有的属性,跳至步骤104;
步骤107·结束索引表22的建立。
在上述中,当归类出所有类别的共通的属性后,会随即定义出各属性存储的结构(如:该属性为一字串或为一整数值),并根据各类型所含的物件的特征,分别构建出各类别在数据库中的结构,以记录各类所具有的物件,此时物件在数据库内的存储方式是以一笔接着一笔的串列方式存入数据库内的(如图3所示)。因此,进行数据库的类别提取时,其执行的顺序上,是先取得要提取类别的特征值,以及此类别在数据库中的起始位址,然后根据特征值于索引表找到对应的类别,再以类别为基准在索引表中逐一进行相应的属性的判读,由判读的结果决定是否跳过或提属性所对应的物件内容。
参照图5,为一国家英文考试的题库结构图,如图所示,包含有对话听力选择、短文听力选择、短文听写填空、复合听力填空、单句听力选择、单句听写、文法、阅读、字型填空、作文等共十种题型,并依照每个题目的性质在题库的相应位置作一标记(黑色打勾的部分),用以表示该题型具有的物件,而空白之处则表示此题型未具有该项物件,例如:“文法题”就具有题目正文、选择题、答案、题目详解的物件。
结合参照图4的处理流程,当创建数据库时,首先是对图5中的各题型进行分析,将所有题型依其物件的属性再细分成如表一所示的基本结构。
               表一、题目数据库基本结构
    名称     数据类型     作用
声音文件号     Integer 听力题声音所在文件序号
题目段落行数     Integer 题目段落与声音相对应的划分
问题数     Integer 此题中的小题数
声音位置数组     Long 各段声音的定位信息
题目段落数组     String 按行数存放的题目正文
问题段落数组     String 与每小题相对应的问题正文
选择答案段落数组     String 每小题四个备选答案
正确答案数组     String 与每小题相对应的答案段落
题目详解     String 文法点详解
其中题目段落、正确答案为各题型共同的拥有的属性,其他如问题段落等则依各题型而不相同,听力题型为有声音的属性,而其他题型则没有;文法题型每道题为单一小题,而阅读则为多道小题。今以短文听写填空题型为例,这种题型属于听写填空题,听写的内容要念三遍,有多道问题,并有问题答案,所以其具有的属性为:有声音文件(听写)、填空类型、多句声音、声音念三遍、多道小题、标准答案,于是便可整理填入表二的题型索引表中,参照表二的第5列,其中“11”是用以表示听写的内容要念三遍(因为112=310),“X”是因本题型无问题部分,故“X”为无关值,填以“(0)”为特征值考虑,然后将表中用以表示短文听写的各属性的二进制数字转换成十六进制的格式,即0001000111112=11F16,得到一11F的特征值;于是便可依图4的处理流程,将文法、阅读、短文听力选择逐之依其属性填入表二的题型索引表中。
                            表二、题型结构索引表
  文法   阅读  短文听力选择  短文听写填空   …
声音文件(1/0:有/无)   0   0   1   1   …
小题数(1/0:多题/单题)   0   1   0   1   …
    声音遍数   X(00)   X(00)   01(3)   11(3)   …
声音句数(1/0:多/单)   X(1)   X(1)   1   1   …
问题(1/0:选择/填空)   1   1   1   0   …
问题段落(1/0:有/无)   0   1   0   0   …
题目详解(1/0:有/无)   1   0   0   0   …
填空(1/0:标准/大意)   X(0)   X(0)   X(0)   1   …
问题(1/0:朗读/显示)   X(0)   0   X(0)   X(0)   …
特征值   16进制   0B0   072   035   11F   …
  10进制   176   114   53   287   …
于是在表二的题型索引表建立完成后,就可将图5的题库,重新整理成如图6所示的结构,如图所示,在记录媒体中依各题型的不同结构(即所拥有的物件数),建立其对应的存储结构,而各题型的物件此时就可以逐一地以一个接着一个的方式填入其所属存储结构的相应位置中。
当题库经由上述的程序建立完成后,在进行数据库的读取时,参照图7所揭示的流程图,其步骤依序如下:
步骤201·读取相应于要提取的题型的特征值及题目在题库中的起始位置;
步骤202·根据特征值在题型结构索引表中,取出与当前所提取的题型的属性,以及该题型相关的数字;
步骤203·判断是否存在有与声音相关的属性,若为是,则执行下一步骤,若为否,则执行步骤205;
步骤204·根据题目数据库基本结构的格式,于题库中读出与声音信息相关的资料;
步骤205·根据题目数据库基本结构的格式,于题库中读出属于题目正文(如:题目段落数组)的资料;
步骤206·判断是否存在有问题内容的属性,若为是,则执行下一步骤,若为否,则执行步骤208;
步骤207·根据题目数据库基本结构的格式,于题库中读出有关问题内容的段落的资料;
步骤208·判断是否存在有可供使用者选择答案的答案内容的属性,若为是,则执行下一步骤,若为否,则执行步骤211;
步骤209·根据题目数据库基本结构的格式,于题库中读出与选择题答案内容相关的资料;
步骤210·根据题目数据库基本结构的格式,于题库中读出与正确答案相关的资料;
步骤211·判断是否存在有题目详解内容的属性,若为是,则执行下一步骤,若为否,则执行步骤213;
步骤212·根据题目数据库基本结构的格式,于题库中读出有关题目详解内容的段落的资料;
步骤213·完成题目的读出。
所以,根据上述的处理流程,在读取题目时,就可通过题型结构索引表内所记录的各题型的属性,从题目数据库中提取相应的物件资料。
本发明所揭露的方法具有以下的优点:
1.通过对资源中不同的类别的数据结构建立索引表,并由此生成各数据的特征值,可以用统一的工具对各种类型的数据结构进行统一管理;对不同类别的数据进行存取只需根据特征值做步骤上的取舍。
2.特征值可用于表示出该数据类型的结构,所以在用统一的管理方法时,无须建立包含各类型的全部特征的实际存储结构,节省了存储空间;同时根据特征值做步骤的取舍又避免了操作步骤的浪费。
3.设计数据库管理方法时,只需要按照数据库基本类型进行,不需要关心任何具体的类型结构,提高了方法的开发速度和可维护性。
4.对工程资源中新增加的结构类型,只需要按照已有的数据库基本结构建立符合其结构的数据库,并用特征表总结出其特征值,即可用统一的管理方法进行管理,不需要做任何方法上的修改或增加,提高了数据库的可扩充性,并避免了因数据库变化迫使数据库管理方法变化,和由此引起的可能的错误,更便于数据库的维护。
虽然本发明以前述的较佳实施例揭露如上,但其并非用以限定本发明,任何本领域的技术人员,在不脱离本发明的精神和范围内,当可作些许更动与润饰,因此本发明的保护范围应当以权利要求所界定的范围为准。

Claims (14)

1.一种数据库的管理方法,是管理存储在一记录媒体内的包含有多个物件的类别,用该记录媒体节省存储空间,其包括有:
提取该物件的属性;
构建一以该属性为构成元素的索引表;以及
利用一逻辑处理单元,根据该索引表以一个接着一个,且向一侧方向依序填满的方式,将该物件存储于该数据库中。
2.如权利要求1所述数据库的管理方法,其中该索引表是以一二进制数值的“1”表示该类别存在有该属性,而以“0”来表示该类别不存在有该属性。
3.如权利要求2所述数据库的管理方法,其中该索引表中包含有一特征值,该特征值为在该索引表中记录该类别的属性的该二进制数值的组合。
4.如权利要求3所述数据库的管理方法,其中该特征值是十六进制的格式。
5.如权利要求1所述数据库的管理方法,其中该数据库包含有多个该类别。
6.一种数据库的管理方法,用以管理包含有多种类别的数据资料的数据库,可节省存储空间,其包括有:
于该数据库中建立一存储结构,储存有至少一个以上的该类别的物件,且该物件以一个接着一个,向一侧方向依序填满的方式,存储于该数据库中与该类别相应的位置内;
提取与该类别的物件相应的一属性;
根据各类别的属性建立一索引表,用以与存储结构产生关联;以及
以一逻辑运算单元,通过该索引表,对该数据库进行该类别的管理。
7.如权利要求6所述数据库的管理方法,其中该索引表的建立包括:
根据该类别的物件应具有的该属性的有无,以在该索引表中的相应位置作一标记;以及
根据该标记分别计算出该类别的一特征值。
8.如权利要求7所述数据库的管理方法,其中在该索引表中还加入一加权值,用以区分该特征值相同的该类别。
9.如权利要求6所述数据库的管理方法,其中该数据库的该类别的管理包括有:
以该逻辑运算单元于该索引表中读取该类别的特征值,和该类别的物件在该数据库中的一起始位置;以及
根据该特征值与该起始位置,以该逻辑运算单元自该数据库中读取相应的物件。
10.如权利要求7所述数据库的管理方法,其中该标记为一二进制数值。
11.如权利要求10所述数据库的管理方法,其中该二进制数值是以“1”表示该类别存在有该属性,以“0”来表示该类别不存在有该属性。
12.如权利要求7所述数据库的管理方法,其中该特征值为十六进制的格式。
13.如权利要求8所述数据库的管理方法,其中该加权值为一X(x1 x2)的格式。
14.如权利要求13所述数据库的管理方法,其中X(x1 x2)格式的该加权值是用以表示在该类别中没有该物件存在。
CN 99104968 1999-04-09 1999-04-09 数据库的管理方法 Expired - Fee Related CN1117335C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 99104968 CN1117335C (zh) 1999-04-09 1999-04-09 数据库的管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 99104968 CN1117335C (zh) 1999-04-09 1999-04-09 数据库的管理方法

Publications (2)

Publication Number Publication Date
CN1270363A true CN1270363A (zh) 2000-10-18
CN1117335C CN1117335C (zh) 2003-08-06

Family

ID=5271863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 99104968 Expired - Fee Related CN1117335C (zh) 1999-04-09 1999-04-09 数据库的管理方法

Country Status (1)

Country Link
CN (1) CN1117335C (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1653422B (zh) * 2002-05-31 2010-11-03 国际商业机器公司 基于策略的存储管理的方法和系统
CN102063434A (zh) * 2009-11-18 2011-05-18 财团法人资讯工业策进会 候选键撷取装置及其候选键撷取方法
CN102567434A (zh) * 2010-12-31 2012-07-11 百度在线网络技术(北京)有限公司 一种数据块处理方法
CN101645085B (zh) * 2009-09-03 2012-09-12 北京伟库电子商务科技有限公司 不规则字段存储方法和系统
CN103543957A (zh) * 2013-10-07 2014-01-29 宁波芝立软件有限公司 一种抚养关系信息库存储组织方法、系统及设备
CN103544228A (zh) * 2013-10-07 2014-01-29 宁波芝立软件有限公司 一种收养关系信息库存储组织方法、系统及设备
CN105677776A (zh) * 2015-12-30 2016-06-15 厦门欣欣信息有限公司 一种数据处理方法及装置
CN105825196A (zh) * 2016-03-28 2016-08-03 联想(北京)有限公司 一种信息处理方法和电子设备
CN106484790A (zh) * 2016-09-20 2017-03-08 上海万格生物科技有限公司 一种信息系统的样本库信息管理方法及控件
CN107633027A (zh) * 2017-08-29 2018-01-26 深圳市诚壹科技有限公司 数据处理方法及装置
CN109937413A (zh) * 2016-07-20 2019-06-25 深圳市东信时代信息技术有限公司 海量人群特征数据的处理方法及系统

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1653422B (zh) * 2002-05-31 2010-11-03 国际商业机器公司 基于策略的存储管理的方法和系统
CN101645085B (zh) * 2009-09-03 2012-09-12 北京伟库电子商务科技有限公司 不规则字段存储方法和系统
CN102063434A (zh) * 2009-11-18 2011-05-18 财团法人资讯工业策进会 候选键撷取装置及其候选键撷取方法
CN102063434B (zh) * 2009-11-18 2013-03-27 财团法人资讯工业策进会 候选键撷取装置及其候选键撷取方法
CN102567434A (zh) * 2010-12-31 2012-07-11 百度在线网络技术(北京)有限公司 一种数据块处理方法
CN102567434B (zh) * 2010-12-31 2013-04-10 百度在线网络技术(北京)有限公司 一种数据块处理方法
CN103543957A (zh) * 2013-10-07 2014-01-29 宁波芝立软件有限公司 一种抚养关系信息库存储组织方法、系统及设备
CN103544228A (zh) * 2013-10-07 2014-01-29 宁波芝立软件有限公司 一种收养关系信息库存储组织方法、系统及设备
CN105677776A (zh) * 2015-12-30 2016-06-15 厦门欣欣信息有限公司 一种数据处理方法及装置
CN105825196A (zh) * 2016-03-28 2016-08-03 联想(北京)有限公司 一种信息处理方法和电子设备
CN105825196B (zh) * 2016-03-28 2020-01-31 联想(北京)有限公司 一种信息处理方法和电子设备
CN109937413A (zh) * 2016-07-20 2019-06-25 深圳市东信时代信息技术有限公司 海量人群特征数据的处理方法及系统
CN106484790A (zh) * 2016-09-20 2017-03-08 上海万格生物科技有限公司 一种信息系统的样本库信息管理方法及控件
CN106484790B (zh) * 2016-09-20 2021-03-26 上海万格生物科技有限公司 一种信息系统的样本库信息管理方法及装置
CN107633027A (zh) * 2017-08-29 2018-01-26 深圳市诚壹科技有限公司 数据处理方法及装置

Also Published As

Publication number Publication date
CN1117335C (zh) 2003-08-06

Similar Documents

Publication Publication Date Title
Hayes The growing inaccessibility of science
CN1117335C (zh) 数据库的管理方法
CN1871597B (zh) 利用一套消歧技术处理文本的系统和方法
Kretzschmar et al. Introduction to quantitative analysis of linguistic survey data
KR101394723B1 (ko) 문서 내의 목록들의 재구성
CN100351849C (zh) 字符识别装置和字符识别方法
JPH11250041A (ja) 文書処理装置および文書処理方法
CN1720517A (zh) 数字声音数据的摘要制作
CN115186654B (zh) 一种公文文本摘要生成方法
US9524341B2 (en) Retrieval system and method of searching of information in the internet
CN112307737A (zh) 一种基于动态规划技术的复杂文档比较方法
CN112001183A (zh) 一种基于段落语义的中小学试题分割提取方法及系统
CN1945692A (zh) 一种在语音合成系统中提升提示音匹配效果的智能方法
CN105354192A (zh) 一种对结构不同的数据资料的管理方法
CN114757172A (zh) 一种基于段落区间划分的篇章级合同抽取方法
CN1575467A (zh) 不受语言和方法限制的计算机化编码器-解码器
CN112733513A (zh) 自动整理航司退改规则的方法、系统、终端和存储介质
KR102028487B1 (ko) 문서의 토픽 모델링 장치 및 방법, 이를 기록한 기록매체
Akman et al. Strawson on intended meaning and context
CN100389418C (zh) 电子词典中多个专业词典的数据结构的合并方法及装置
Perdana et al. Proposal to encode Kawi
CN115859931B (zh) 一种电子问卷的生成方法
CN117033561B (zh) 基于esg指标优化的企业评估模型生成方法及系统
CN115858634B (zh) 一种问卷信息处理方法
CN118153559B (zh) 一种用于文本纠错模型的训练数据集的构造方法及设备

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20030806

Termination date: 20110409