CN110110067A - 一种数据库注释方法、装置及终端设备 - Google Patents
一种数据库注释方法、装置及终端设备 Download PDFInfo
- Publication number
- CN110110067A CN110110067A CN201810014933.4A CN201810014933A CN110110067A CN 110110067 A CN110110067 A CN 110110067A CN 201810014933 A CN201810014933 A CN 201810014933A CN 110110067 A CN110110067 A CN 110110067A
- Authority
- CN
- China
- Prior art keywords
- annotation
- attribute entry
- entry
- database
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 239000004615 ingredient Substances 0.000 claims abstract description 20
- 239000000284 extract Substances 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 9
- 239000013589 supplement Substances 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 230000008901 benefit Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 6
- 238000013507 mapping Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 17
- 238000011160 research Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 8
- 238000012827 research and development Methods 0.000 description 7
- 241000209094 Oryza Species 0.000 description 6
- 235000007164 Oryza sativa Nutrition 0.000 description 6
- 235000009566 rice Nutrition 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- TVZRAEYQIKYCPH-UHFFFAOYSA-N 3-(trimethylsilyl)propane-1-sulfonic acid Chemical compound C[Si](C)(C)CCCS(O)(=O)=O TVZRAEYQIKYCPH-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 201000006549 dyspepsia Diseases 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明适用于数据处理技术领域,提供了一种数据库注释方法、装置及终端设备,包括:提取出数据库各成分的属性词条;对属性词条进行注释识别,查找出其中的注释不完整的属性词条;对注释不完整的属性词条进行关键词匹配,确定出注释不完整的属性词条的属性特征,并从存储的基本注释中将与属性特征关联的基本注释添加至注释不完整的属性词条对应的注释。通过自动分析确定出注释不完整的属性词条,提升了对所需注释的属性词条的查找识别效率,同时利用预设的关键词与属性特征的映射关系确定出属性词条的属性特征,并将已存储好的属性特征关联的基本注释添加至属性词条的注释,从而实现了对属性词条的自动注释,提高了对属性词条的注释效率。
Description
技术领域
本发明属于数据处理技术领域,尤其涉及一种数据库注释方法、装置及终端设备。
背景技术
数据库是按照数据结构来组织、存储和管理数据的仓库,由数据库、数据表、记录、字段以及索引等成分共同构建而成,是管理信息系统、办公自动化系统、决策支持系统等各类信息系统的核心部分。对于数据库的每个成分而言,其都具有一个或多个不同的属性特征,如数据库名、数据表名、数据表创建时间以及字段的数据类型等,现有技术中,会对这些属性特征进行命名得到对应的属性词条,并以属性词条+对应具体数据的形式存储在数据库中,以供用户查看调用,如数据表创建时间属性可以以createtime+具体时间数据的形式进行存储,其中createtime就是数据表创建时间的属性词条,研发人员在需要查看数据表创建时间时,只需查找属性词条createtime即可调取出对应的具体时间数据,以获知数据表的创建时间。
由于数据库的种类数量庞大,同时数据库包含的数据表以及字段等成分的数量无法预测,而数据库的每个成分又具有一个或多个属性,因此数据库所包含的属性特征数量极其庞大,从而使得现有技术中难以对数据库的每个成分的属性词条的命名方式进行统一规范,如实际研发过程中,即使对于数据库的同一个属性特征,两个不同的研发人员也可能会设置两个不同的属性词条来进行命名。同时由于属性词条的命名不规范,常常使得除研发人员本人以外的人员,难以理解研发人员编写的属性词条的实际含义,难以充分了解数据库的实际功能,因此为了方便后续数据库使用人员的理解、管理以及维护等工作,需要研发人员在实际研发过程中对数据库中的各种属性词条进行注释说明。然而实际情况中由于研发人员的素质不一,在对属性词条注释的过程中,有些研发人员可能只是应付式的随便写一点东西,或者根本就没有注释的习惯,因此实际情况中得到的数据库基本都存在属性词条缺乏注释,或注释不规范的情况,从而使得使用人员难以理解数据库的各属性特征的实际含义,难以充分了解数据库各成分实际功能。
现有技术中,在遇到属性词条缺乏注释或注释不规范的数据库,即属性词条注释不完整时,为了帮助使用人员理解数据库各个属性特征,充分了解数据库各成分实际功能,均是由研发人员手动从数据库中查找属性词条,并逐一进行手动注释,但由于属性词条数量庞大且命名不规范,同时负责注释的研发人员的素质也不一,使得在研发人员查找和注释均不方便同时,注释的有效性也无法得到保证,从而使得现有技术中对属性词条的注释效率十分低下。因此,现有技术中只能由研发人员手动来对数据库进行属性词条的注释效率低下,使得使用人员难以充分了解数据库的实际功能。
发明内容
有鉴于此,本发明实施例提供了一种数据库注释方法、装置及终端设备,以解决现有技术中对属性词条的注释效率低下,使得使用人员难以充分了解数据库的实际功能的问题。
本发明实施例的第一方面提供了一种数据库注释方法,包括:
提取出所述数据库各成分的属性词条;
对所述属性词条进行注释识别,查找出其中的注释不完整的属性词条;
对所述注释不完整的属性词条进行关键词匹配,确定出所述注释不完整的属性词条的属性特征,并从存储的基本注释中将与所述属性特征关联的所述基本注释添加至所述注释不完整的属性词条对应的注释。
本发明实施例的第二方面提供了一种数据库注释装置,包括:
词条提取模块,用于提取出所述数据库各成分的属性词条;
注释识别模块,用于对所述属性词条进行注释识别,查找出其中的注释不完整的属性词条;
注释添加模块,用于对所述注释不完整的属性词条进行关键词匹配,确定出所述注释不完整的属性词条的属性特征,并从存储的基本注释中将与所述属性特征关联的所述基本注释添加至所述注释不完整的属性词条对应的注释。
本发明实施例的第三方面提供了一种数据库注释终端设备,包括:
包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上所述的数据库注释方法的步骤。
本发明实施例的第四方面提供了一种计算机可读存储介质,包括:存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的数据库注释方法的步骤。
本发明实施例与现有技术相比存在的有益效果是:通过对属性词条进行自动分析确定出注释不完整的属性词条,提升了对所需注释的属性词条的查找识别效率,同时利用预设的关键词与属性特征的映射关系确定出属性词条的属性特征,并将已存储好的属性特征关联的基本注释添加至属性词条的注释,从而实现了对属性词条的自动注释,提高了对属性词条的注释效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的数据库注释方法的实现流程示意图;
图2是本发明实施例二提供的数据库注释方法的实现流程示意图;
图3是本发明实施例三提供的数据库注释方法的实现流程示意图;
图4是本发明实施例四提供的数据库注释方法的实现流程示意图;
图5是本发明实施例五提供的数据库注释装置的示意图;
图6是本发明实施例六提供的数据库注释终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本发明实施例一提供的数据库注释方法的实现流程图,详述如下:
S101,提取出数据库各成分的属性词条。
Schema是数据库中的一组相关的数据库对象的集合,Schema为该组对象定义了一个命名空间,因此通过对Schema中的信息进行抽取解析,即可很容易的得到数据库各成分的属性词条。因此,在本发明实施例中为了实现对数据库中数据库、数据表、记录、字段以及索引等成分的属性词条的提取,可以从Schema信息中对数据库每个成分进行数据抽取,以得到每个成分的中包含的属性词条。
S102,对属性词条进行注释识别,查找出其中的注释不完整的属性词条。
由于实际研发过程中并非是所有研发人员都存在不注释或不规范注释的问题,而对于已规范注释的属性词条而言,理论上其已经无需进行注释补充,因此在本发明实施例中会首先识别属性词条的注释是否完整,以确定是否需要对属性词条进行注释。
本发明实施例中,注释不完整包括完全无注释以及不规范注释两种情况,其中不规范注释可能的情况较为复杂,如可能是注释字数过少或者注释内容与属性词条本身无关,考虑到实际情况中不规范注释的情况出现的概率较小,但对属性词条不规范注释的识别较为复杂成本较高,如当需要识别注释内容与属性词条本身是否相关时,需要使用到较为复杂的识别技术,因此若将不规范注释所有可能的情况均进行考虑识别,可能会带来较大的成本负担。因此,本发明实施例中的不规范注释具体包含的内容,需由技术人员根据实际需求进行衡量后设定,其既可以是仅包含一种可能的情况,如仅包含注释字数过少的情况,也可以是同时包含多种不同可能的情况。
作为本发明的一个实施例,不规范注释可以设置为仅包含注释字数过少的情况,此时技术人员会预先设定一个注释字数阈值,如两个字符,当属性词条的注释次数小于注释字数阈值时,直接判定该属性词条的注释为不规范注释,即该属性词条注释不完整。
作为本发明的另一个实施例,不规范注释可以设置为空,即在本发明实施例中不进行任何不规范注释的识别,仅识别属性词条是否存在注释即可。
S103,对注释不完整的属性词条进行关键词匹配,确定出注释不完整的属性词条的属性特征,并从存储的基本注释中将与属性特征关联的基本注释添加至注释不完整的属性词条对应的注释。
在本发明实施例中,为了实现对注释不完整的属性词条补充注释,会预先由技术人员对实际研发过程中,数据库各成分的属性特征的常见命名方式进行整理,以得到各个属性特征对应的常见命名的相关关键词,同时还对各个属性特征设置相应的基本注释,以使得本发明实施例中仅根据对属性词条的关键词匹配即可实现对其相关的基本注释的查找与添加。例如对于数据表创建时间而言,常见的命名方式包括但不限于直接英文命名createtime或者直接拼音命名chuangjianshijian,此时可以将createtime和chuangjianshijian设置为数据表创建时间对应的关键词,同时将数据表创建时间的基本注释设置为:数据表创建的时间,此时,在对注释不完整的属性词条进行关键词匹配时,若确定出注释不完整的属性词条中包含createtime或chuangjianshijian,都可以认定其对应的属性特征就是数据表创建时间,因此,可以直接将基本注释:数据表创建的时间添加至该注释不完整的属性词条对应的注释之中,以实现对属性词条的注释。
作为本发明的一个实施例,对于注释完整的属性词条而言,可以直接不对其进行任何新增注释处理,直接保留其原本的注释即可。
作为本发明的另一个实施例,对于注释完整的属性词条而言,在保留其原本的注释的基础上,还可以接收用户手动为其输入或选取的注释来作为新增注释,以丰富属性词条的注释。
在本发明实施例中,通过对属性词条进行自动分析确定出注释不完整的属性词条,提升了对所需注释的属性词条的查找识别效率,同时利用预设的关键词与属性特征的映射关系确定出属性词条的属性特征,并将已存储好的属性特征关联的基本注释添加至属性词条的注释,从而实现了对属性词条的自动注释,提高了对属性词条的注释效率。
作为本发明实施例二,如图2所示,在本发明实施例一匹配出注释不完整的属性词条中不包含预设的关键词时,包括:
S201,若关键词匹配结果为注释不完整的属性词条中不包含预设的关键词,接收用户输入的注释不完整的属性词条对应的用户注释。
由于实际情况中研发人员的习惯不一,在对属性词条进行命名时可能不会仅仅采用常见的英文命名或者拼音命名,如将数据表创建时间的命名为chuangjiantime,此时属性词条中不会包含技术人员预先设定的关键词,利用关键词会无法识别出属性词条对应的属性特征,无法进行基本注释的增添。为了实现对数据库属性词条的全面注释,本发明实施例中,会由用户来对无法添加基本注释的属性词条进行手动添加用户注释,从而实现自动注释+手动注释的双重属性词条注释机制,保证对属性词条注释的有效性,提升对属性词条注释的效率。由于本发明实施例中未对用户注释的具体注释形式进行限定,用户可以根据自己的习惯来进行注释,因此在本发明实施例中,用户注释的格式和内容更加丰富多样,能记录更加丰富的属性词条的信息。
S202,判断当前时间是否属于注释添加时间段,并在当前时间属于注释添加时间段时,将用户注释添加至属性词条对应的注释,注释添加时间段内用户对数据库的访问量小于预设访问量阈值。
由于将用户注释添加至数据库需要对数据库本身进行操作,这可能会对用户正常工作使用数据库造成影响,因此,为了尽可能地减少对用户正常工作的影响,本发明实施例在接收到用户输入的用户注释之后,不会直接将用户注释添加到数据库属性词条对应的注释之中,而是对当前时间进行实时监控,并在用户对数据库访问量较小的时间段来进行操作,以充分利用闲时网络完成对属性词条的注释,保证用户对数据库的正常使用。其中设访问量阈值以及注释添加时间段的具体值,均可由技术人员根据实际用户数据库使用情况进行设定,优选地,可以设置注释添加时间段为凌晨时段。
作为本发明的一个优选实施例,由于用户注释是由用户自定义输入的注释,气包含的字符数多少无法预知,但实际情况中数据库可占用的容量资源有限,且过长的注释对用户而言反而查看有所困难,因此,在本发明实施例中,在S201之后会对用户注释进行字符数量识别,并在字符数量过大时直接拒绝添加至属性词条的注释,以保证添加的注释的有效性。
本发明实施例中,通过先自动注释+手动补充注释的方式,保证了对属性词条注释的有效性,提升对属性词条注释的效率,同时利用闲时网络来完成对用户注释的添加,保证了在用户对数据库的正常使用的前提下,实现对属性词条的注释。
作为本发明的一个优选实施例三,如图3所示,在本发明实施例一或二基础上,还会识别属性词条是否为数据表名,并在识别出属性词条为数据表名时,包括:
S301,当属性词条为数据表名时,对属性词条对应的数据表进行分析,确定出数据表的表结构信息以及表容量信息。
S301,将表结构信息以及表容量信息添加至属性词条对应的注释。
考虑到实际情况中,用户和一般数据库的使用者更多的是直接接触或操作数据表,因此对数据表的注释说明具有较为重要的实际意义,因此本发明实施例中会对属性词条进行属性特征识别,判断其是不是数据表名,以决定是否需要对该属性特征进行进一步的分析注释。其中对属性词条进行属性特征识别方式包括但不限于如本发明实施例一中的关键词匹配的方法,具体可由技术人员根据实际情况进行设定。
在确定出属性词条是数据表名时,本发明实施例会对其对应的数据表进行进一步地分析,确定出数据表的表结构信息以及表容量信息,其中表结构信息包括但不限于如:数据表包含哪些字段、字段类型、字段属性以及主键等,表容量信息包括但不限于如:数据的总行数、数据表大小、索引大小以及总大小等。当得到所需的表结构信息以及表容量信息后,将其添加至属性词条对应的注释,以完成对数据表名注释的进一步丰富,帮助用户对数据库数据表全貌有更为清晰的了解。
作为本发明的一个优选实施例四,如图4所示,在本发明实施例一或二基础上,还会识别属性词条对应的属性特征,包括:
S401,确定出属性词条对应的属性特征,并基于属性特征查找出属性词条对应的所属团队信息。
S402,将所属团队信息添加至属性词条对应的注释。
实际应用中,一个完整的数据库可能是由多个不同的团队共同完成的,其中每个团队负责其中不同的部分研发,但由于实际情况中研发人员注释的习惯问题,基本不会对属性词条团队进行任何注释说明,使得现有技术中每次需要知道属性词条所属团队询问属性词条时,都只能到研发人员中去逐个询问,效率十分低下。
本发明实施例中,为了帮助用户能方便快捷地获知属性词条对应的所属团队,会由技术人员预先设置好每个属性词条与团队的对应关系,如假设数据库包含A、B两个数据表,其中由A团队负责A表,B团队负责B表,此时会将A表包含的所有属性词条的所属团队均设置为A团队,将B表包含的所有属性词条的所属团队均设置为B团队。在确定出属性词条的属性特征时,即可快速确定出其对应的所属团队,并将对应的团队的息添加至注释之中,以帮助用户能快速确定出每一个属性词条的所属团队。
应当说明地,由于实际情况中可能出现多团队共同负责同一部分研发的情况,因此在本发明实施例中,同一个属性词条可以同时归属于多个不同的团队。
作为本发明的一个实施例,包括:
当属性词条为数据表名时,将接收到的用户输入的标签信息添加至属性词条对应的注释,标签信息用于标识属性词条对应的数据表的功能。
由于在实际数据库功能中,表与表之间可能存在功能关联,如权限控制中包括权限-用户与角色关系绑定、权限-用户与功能点关系绑定以及权限-功能点与角色关系绑定三个数据表,用户在理解各个数据表的功能时,若能获知这些表与表之间的功能关联,可以更好地理解数据表的实际意义。因此,本发明实施例中,会由用户对数据表名进行标签标记,并会将对于的标签信息增添至对数据表名的注释之中。
作为本发明的一个实施例,在对属性词条进行注释时,还包括:
接收用户输入的对属性词条的用户评论信息,判断当前时间是否属于注释添加时间段,并在当前时间属于注释添加时间段时,将用户评论信息添加至属性词条对应的注释,注释添加时间段内用户对数据库的访问量小于预设访问量阈值。
由于属性词条的实际情况各异,不同用户对属性词条的理解可能会有所不同,因此,为了方便用户理解使用属性词条,本发明实施例中为用户提供对属性词条的评论功能,用户可以自由对属性词条进行评论,并会在用户对数据库使用量较小的时候对评论信息进行存储,以保证用户对数据库的正常使用。
作为本发明的一个实施例,在对属性词条进行注释时,包括:接收用户输入的对属性词条的关联词条信息,并添加至属性词条对应的注释。在本发明实施例中,为用户提供了对属性词条的词条关联功能,使得用户能手动将相关的几个属性词条关联起来,从而使得后续用户查看时对属性词条的理解。
作为本发明的一个实施例,在对属性词条进行注释时,包括:
对属性词条进行注释完整度分析,并基于注释完整度低于完整度阈值的属性词条生成属性词条注释报告,以提示用户进行注释补充。
其中注释完整度是指要求添加的属性词条的注释是否全部添加完成,当未全部添加完成时,则认为完整度低于完整度阈值,如对于本发明实施例二而言,属性词条是否拥有了相对应的基本注释或用户注释,本发明实施例三对于数据表名而言,是否同时拥有了相应的表结构信息以及表容量信息,以及对于本发明实施例四而言,属性词条是否同时拥有了相应的所属团队信息。
由于本发明实施例对属性词条的注释补充方式仅能对关键词匹配成功的属性词条进行自动注释,其余的需要用户的手动参与的形式进行补充注释,因此本发明实施例中可能无法一次完成对所有属性词条的注释。为了保证对数据库属性词条的有效注释,本发明实施例中会对注释后的属性词条进行分析,确定出哪些属性词条还没有注释完成,并将这些属性词条以及其确少的注释信息进行记录,得到属性词条注释报告,以告知用户数据库中还有哪些属性词条的注释没有补充,需要用户进行手动补充的。
作为本发明的一个优选实施例,包括:以属性词条所属团队为单位对属性词条的注释进行完整度分析,并生成相应的团队注释完整率报告。由于实际研发过程中,需要对数据库研发人员以及研发团队进行追责,以保证实际对属性词条的有效注释,因此本发明实施例中,会以属性词条所属团队为单位来进行属性词条的注释完整率分析,如A团队总共负责100条属性词条的注释,其中有90条已经注释完整,因此对A团队而言,其注释完整率为90%。同时,本发明实施例中还可以利用注释完整率来对不同团队进行排序,以提示和激励团队来对属性词条注释进行完善。
考虑到实际可能存在的一种特殊情况,属性词条可能未被关联对应的所属团队信息,即属性词条的注释中没有包含相应的所属团队信息。此时本发明实施例中无法对这部分属性词条进行注释完整率分析,因此为了保证后续对这些属性词条的正常注释处理,本发明实施例中会将这些没有所属团队信息的属性词条进行单独列出,以提示用户为这些属性词条补充所属团队信息。
本发明实施例中,通过对属性词条注释完整情况进行分析,以及对属性词条所属团队的注释完整率情况进行分析,使得数据库属性词条的注释缺失具体情况得以透明化,用户可以一目了然的或者数据库属性词条注释情况如何,还有哪些属性词条需要进行补充注释等,从而提升了对属性词条注释的有效性,使得用户能更加快速便捷地对属性词条进行注释,提升了对属性词条注释的效率。
一方面来说,在本发明实施例中,通过对属性词条进行自动分析确定出注释不完整的属性词条,提升了对所需注释的属性词条的查找识别效率,同时利用预设的关键词与属性特征的映射关系确定出属性词条的属性特征,并将已存储好的属性特征关联的基本注释添加至属性词条的注释,从而实现了对属性词条的自动注释,提高了对属性词条的注释效率。同时在对属性词条进行自动注释的基础上,增添用户的手动补充注释,从而实现了自动注释+手动补充注释的结合,既保证了注释的有效性又极大地提升了注释的效率。
另一方面来说,本发明实施例中可以为属性词条添加基本注释、用户注释、表结构信息、表容量信息、所属团队信息、评论信息、标签信息以及关联词条信息中的一种或多种注释信息,实现了对属性词条的多维度注释,使得用户能获得属性数据多维度的注释,更加容易理解数据库各成分的实际功能,极大地提升了对属性词条的注释有效性,提升了注释的效率。
作为本发明的一个实施例,在利用上述实施例得到数据库属性词条的注释之后,还包括:根据表容量信息判断数据表容量是否超出数据库发布系统的安全阈值,并在超出安全阈值时生成发布风险警告。
在本发明实施例中,将对上述实施例中数据库属性词条的注释方法与数据库发布系统进行结合,由于当数据库中的数据表体积过大时,直接对数据库进行发布可能会导致机器出现宕机等故障,从而使得数据库的发布可靠性得不到保障。因此本发明实施例中会在数据库发布系统对数据库进行发布之前,对所需发布的数据库利用属性词条的注释信息进行分析,判断其中每一个数据表的体积大小,并在出现数据表体积过大,如数据表总行数大于10万行时,生成发布风险警告,告知用户本次发布可能会存在风险。同时,本发明实施例中还会在对数据库发布的同时,将发布的数据库中数据表的基本注释、用户注视、表结构信息、表容量信息以及所属团队信息等注释信息进行显示,以帮助用户快速理解数据库实际功能。
作为本发明的另一个实施例,在利用上述实施例得到数据库属性词条的注释之后,还包括:在慢数据库治理平台统计输出的慢数据库时,对输出的慢数据库添加对应的所属团队信息进行显示。当接收到用户输入的慢数据库查阅指令时,在将慢数据库详情进行显示的同时,将其中数据表的基本注释、用户注视、表结构信息以及表容量信息等注释信息进行显示,以帮助快速理解慢数据库实际功能,同时实现对所属团队的责任追踪,极大地减少了传统的需由技术人员手工统计查找所属团队的工作量,提高了对团队查找的工作效率。
本发明实施例中,将对数据库属性词条的注释方法与其他系统进行结合,充分利用了得到的属性词条的各种注释信息,来丰富和提升相关系统的性能。
对应于上文实施例所述的方法,图5示出了本发明实施例提供的数据库注释的结构框图,为了便于说明,仅示出了与本发明实施例相关的部分。图5示例的数据库注释装置可以是前述实施例一提供的数据库注释方法的执行主体。
参照图5,该数据库注释装置包括:
词条提取模块51,用于提取出所述数据库各成分的属性词条。
注释识别模块52,用于对所述属性词条进行注释识别,查找出其中的注释不完整的属性词条。
注释添加模块53,用于对所述注释不完整的属性词条进行关键词匹配,确定出所述注释不完整的属性词条的属性特征,并从存储的基本注释中将与所述属性特征关联的所述基本注释添加至所述注释不完整的属性词条对应的注释。
进一步地,所述数据库注释装置,还包括:
用户注释接收模块,用于若所述关键词匹配结果为所述注释不完整的属性词条中不包含预设的关键词,接收用户输入的所述注释不完整的属性词条对应的用户注释。
注释添加子模块,用于判断当前时间是否属于注释添加时间段,并在当前时间属于所述注释添加时间段时,将所述用户注释添加至所述属性词条对应的注释,所述注释添加时间段内用户对所述数据库的访问量小于预设访问量阈值。
进一步地,该数据库注释装置,还包括:
表信息分析,用于当所述属性词条为数据表名时,对所述属性词条对应的数据表进行分析,确定出所述数据表的表结构信息以及表容量信息。
表信息添加模块,用于将所述表结构信息以及所述表容量信息添加至所述属性词条对应的注释。
进一步地,该数据库注释装置,还包括:
团队信息确定模块,用于确定出所述属性词条对应的所述属性特征,并基于所述属性特征查找出所述属性词条对应的所属团队信息。
团队信息添加模块,用于将所述所属团队信息添加至所述属性词条对应的注释。
进一步地,该数据库注释装置,还包括:
标签信息添加模块,用于当所述属性词条为数据表名时,将接收到的所述用户输入的标签信息添加至所述属性词条对应的注释,所述标签信息用于标识所述属性词条对应的数据表的功能。
进一步地,该数据库注释装置还包括:
评论信息添加模块,用于接收所述用户输入的对所述属性词条的用户评论信息,判断当前时间是否属于注释添加时间段,并在当前时间属于所述注释添加时间段时,将所述用户评论信息添加至所述属性词条对应的注释,所述注释添加时间段内用户对所述数据库的访问量小于预设访问量阈值。
进一步地,该数据库注释装置,还包括:
报告生成模块,用于对所述属性词条进行注释完整度分析,并基于所述注释完整度低于完整度阈值的属性词条生成属性词条注释报告,以提示用户进行注释补充。
本发明实施例提供的数据库注释装置中各模块实现各自功能的过程,具体可参考前述图1-5所示实施例的描述,此处不再赘述。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图6是本发明一实施例提供的数据库注释终端设备的示意图。如图6所示,该实施例的数据库注释终端设备6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62。所述处理器60执行所述计算机程序62时实现上述各个数据库注释方法实施例中的步骤,例如图1所示的步骤101至103。或者,所述处理器60执行所述计算机程序62时实现上述各装置实施例中各模块/单元的功能,例如图5所示模块51至53的功能。
所述数据库注释终端设备6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述数据库注释装置/终端设备可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是数据库注释终端设备6的示例,并不构成对数据库注释终端设备6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述数据库注释终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述数据库注释终端设备6的内部存储单元,例如数据库注释终端设备6的硬盘或内存。所述存储器61也可以是所述数据库注释终端设备6的外部存储设备,例如所述数据库注释终端设备6上配备的插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述数据库注释终端设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机程序以及所述数据库注释终端设备所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的终端设备和方法,可以通过其它的方式实现。例如,以上所描述的终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种数据库注释方法,其特征在于,包括:
提取出所述数据库各成分的属性词条;
对所述属性词条进行注释识别,查找出其中的注释不完整的属性词条;
对所述注释不完整的属性词条进行关键词匹配,确定出所述注释不完整的属性词条的属性特征,并从存储的基本注释中将与所述属性特征关联的所述基本注释添加至所述注释不完整的属性词条对应的注释。
2.如权利要求1所述的数据库注释方法,其特征在于,所述对所述注释不完整的属性词条进行关键词匹配之后,还包括:
若所述关键词匹配结果为所述注释不完整的属性词条中不包含预设的关键词,接收用户输入的所述注释不完整的属性词条对应的用户注释;
判断当前时间是否属于注释添加时间段,并在当前时间属于所述注释添加时间段时,将所述用户注释添加至所述属性词条对应的注释,所述注释添加时间段内用户对所述数据库的访问量小于预设访问量阈值。
3.如权利要求1所述的数据库注释方法,其特征在于,还包括:
当所述属性词条为数据表名时,对所述属性词条对应的数据表进行分析,确定出所述数据表的表结构信息以及表容量信息;
将所述表结构信息以及所述表容量信息添加至所述属性词条对应的注释。
4.如权利要求1所述的数据库注释方法,其特征在于,还包括:
确定出所述属性词条对应的所述属性特征,并基于所述属性特征查找出所述属性词条对应的所属团队信息;
将所述所属团队信息添加至所述属性词条对应的注释。
5.如权利要求1所述的数据库注释方法,其特征在于,还包括:
当所述属性词条为数据表名时,将接收到的所述用户输入的标签信息添加至所述属性词条对应的注释,所述标签信息用于标识所述属性词条对应的数据表的功能。
6.如权利要求1所述的数据库注释方法,其特征在于,还包括:
接收所述用户输入的对所述属性词条的用户评论信息,判断当前时间是否属于注释添加时间段,并在当前时间属于所述注释添加时间段时,将所述用户评论信息添加至所述属性词条对应的注释,所述注释添加时间段内用户对所述数据库的访问量小于预设访问量阈值。
7.如权利要求2至6任意一项所述的数据库注释方法,其特征在于,还包括:
对所述属性词条进行注释完整度分析,并基于所述注释完整度低于完整度阈值的属性词条生成属性词条注释报告,以提示用户进行注释补充。
8.一种数据库注释装置,其特征在于,包括:
词条提取模块,用于提取出所述数据库各成分的属性词条;
注释识别模块,用于对所述属性词条进行注释识别,查找出其中的注释不完整的属性词条;
注释添加模块,用于对所述注释不完整的属性词条进行关键词匹配,确定出所述注释不完整的属性词条的属性特征,并从存储的基本注释中将与所述属性特征关联的所述基本注释添加至所述注释不完整的属性词条对应的注释。
9.一种数据库注释终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810014933.4A CN110110067A (zh) | 2018-01-08 | 2018-01-08 | 一种数据库注释方法、装置及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810014933.4A CN110110067A (zh) | 2018-01-08 | 2018-01-08 | 一种数据库注释方法、装置及终端设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110110067A true CN110110067A (zh) | 2019-08-09 |
Family
ID=67482990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810014933.4A Pending CN110110067A (zh) | 2018-01-08 | 2018-01-08 | 一种数据库注释方法、装置及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110110067A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111078671A (zh) * | 2019-12-19 | 2020-04-28 | 北京启迪区块链科技发展有限公司 | 数据表字段的修改方法、装置、设备和介质 |
CN111125116A (zh) * | 2019-12-27 | 2020-05-08 | 上海德拓信息技术股份有限公司 | 定位业务表中代码字段及对应代码表的方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1934569A (zh) * | 2004-03-15 | 2007-03-21 | 雅虎公司 | 集成有用户注释的搜索系统和方法 |
US20150067460A1 (en) * | 2013-08-30 | 2015-03-05 | Perry H. Beaumont | Annotation processing method, and non-transitory computer-readable medium |
CN104881480A (zh) * | 2015-06-03 | 2015-09-02 | 北京科技大学 | 基于数据库的批注方法和装置 |
CN105072130A (zh) * | 2015-08-26 | 2015-11-18 | 广州慧睿思通信息科技有限公司 | 一种asn.1解码器代码自动生成方法 |
-
2018
- 2018-01-08 CN CN201810014933.4A patent/CN110110067A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1934569A (zh) * | 2004-03-15 | 2007-03-21 | 雅虎公司 | 集成有用户注释的搜索系统和方法 |
US20150067460A1 (en) * | 2013-08-30 | 2015-03-05 | Perry H. Beaumont | Annotation processing method, and non-transitory computer-readable medium |
CN104881480A (zh) * | 2015-06-03 | 2015-09-02 | 北京科技大学 | 基于数据库的批注方法和装置 |
CN105072130A (zh) * | 2015-08-26 | 2015-11-18 | 广州慧睿思通信息科技有限公司 | 一种asn.1解码器代码自动生成方法 |
Non-Patent Citations (4)
Title |
---|
于倩倩 等: "注释服务研究述评", 《现代图书情报技术》 * |
周文琼: "《数据库应用与开发教程》", 31 October 2009, 中国铁道出版社 * |
张剑主编: "《医疗服务信息安全》", 31 May 2017, 电子科技大学出版社 * |
高晓伟: "源代码分析注释的质量评价框架", 《计算机系统应用》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111078671A (zh) * | 2019-12-19 | 2020-04-28 | 北京启迪区块链科技发展有限公司 | 数据表字段的修改方法、装置、设备和介质 |
CN111125116A (zh) * | 2019-12-27 | 2020-05-08 | 上海德拓信息技术股份有限公司 | 定位业务表中代码字段及对应代码表的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9158773B2 (en) | Partial and parallel pipeline processing in a deep question answering system | |
Shen et al. | Web service discovery based on behavior signatures | |
US9754215B2 (en) | Question classification and feature mapping in a deep question answering system | |
US9141662B2 (en) | Intelligent evidence classification and notification in a deep question answering system | |
CN108536761A (zh) | 报表数据查询方法及服务器 | |
CN110675238A (zh) | 客户标签配置方法、系统、可读存储介质及电子设备 | |
CN113010542B (zh) | 业务数据处理方法、装置、计算机设备及存储介质 | |
CN109241068A (zh) | 前后台数据比对的方法、装置及终端设备 | |
CN110795697A (zh) | 逻辑表达式的获取方法、装置、存储介质以及电子装置 | |
CN109615172A (zh) | 一种处理考核数据的方法及终端 | |
CN109255000A (zh) | 一种标签数据的维度管理方法及装置 | |
CN113360517A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN110110067A (zh) | 一种数据库注释方法、装置及终端设备 | |
CN111652757A (zh) | 一种电力营业厅客户行为分析方法及装置 | |
CN106886484A (zh) | 基于云海系统的报表生成方法和装置 | |
CN114722789B (zh) | 数据报表集成方法、装置、电子设备及存储介质 | |
CN111488386A (zh) | 数据查询方法和装置 | |
CN111553133B (zh) | 报表生成方法、装置、电子设备及存储介质 | |
CN109377391A (zh) | 一种信息追踪方法、存储介质和服务器 | |
CN113344674A (zh) | 基于用户购买力的产品推荐方法、装置、设备及存储介质 | |
CN109934740B (zh) | 一种专利监控方法及装置 | |
CN113687881A (zh) | 元数据调用方法、装置、电子设备及存储介质 | |
CN111143328A (zh) | 一种敏捷商业智能数据构建方法、系统、设备、存储介质 | |
CN113987206A (zh) | 异常用户的识别方法、装置、设备及存储介质 | |
CN112328752A (zh) | 基于搜索内容的课程推荐方法、装置、计算机设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 518000 501-509, east block, Skyworth semiconductor design building, No.18, Gaoxin South 4th Road, high tech Zone community, Yuehai street, Nanshan District, Shenzhen City, Guangdong Province Applicant after: Shenzhen Mingyuan Cloud Technology Co.,Ltd. Address before: 24 / F, Zhongke building, Gaoxin Yidao, Nanshan District, Shenzhen, Guangdong 518000 Applicant before: SHENZHEN MINGYUAN SOFTWARE Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190809 |