CN111291024B - 数据处理方法、装置、电子设备及存储介质 - Google Patents
数据处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111291024B CN111291024B CN202010102108.7A CN202010102108A CN111291024B CN 111291024 B CN111291024 B CN 111291024B CN 202010102108 A CN202010102108 A CN 202010102108A CN 111291024 B CN111291024 B CN 111291024B
- Authority
- CN
- China
- Prior art keywords
- attribute
- description information
- identifiers
- target
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 33
- 238000013507 mapping Methods 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000004590 computer program Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
- G06F16/212—Schema design and management with details for data modelling support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提出一种数据处理方法、装置、电子设备及存储介质,其中,方法包括:获取命名规则,命名规则用于指示候选属性标识与关键字之间的映射关系,对待生成的第一属性获取属性描述信息,根据与属性描述信息匹配的关键字,查询命名规则,以从候选属性标识中,确定匹配的关键字所对应的目标属性标识,根据目标属性标识,标记第一属性,基于属性标识与关键字之间的映射关系指示的命名规则,确定待生成的第一属性的目标属性标识,以实现自动化且快速的生成数据库表的属性的标识,提高了数据库表的数据处理效率,解决了现有技术中建立数据库表时,需要人工对数据库表中的属性进行命名录入,工作量大,效率低的技术问题。
Description
技术领域
本申请涉及软件开发技术领域,尤其涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
任何软件系统的开发,都离不开数据建模,将经数据建模后的信息模型及实例数据存储到数据库中,以便应用访问,而数据库通过构建数据库表存储建模的相应数据。然而,有的软件系统非常庞大,后台数据库的设计也尤为复杂,在建立数据库表时,需要进行大量的数据录入。
相关技术中,数据录入是由工作人员在建立数据表时逐个字段的手工录入,一张表可能有多达数十个甚至上百个字段,人工录入一方面重复工作量大,另一方面容易出错,每出一次错,就要花费大量的人力去查找原因。尤其遇到大型数据库的建模时,工作人员更是苦不堪言,效率也极为低下。
发明内容
本申请一些实施例提出了一种数据处理方法,包括:
获取命名规则,所述命名规则用于指示候选属性标识与关键字之间的映射关系;
对待生成的第一属性获取属性描述信息;
根据与所述属性描述信息匹配的关键字,查询所述命名规则,以从所述候选属性标识中,确定匹配的关键字所对应的目标属性标识;
根据所述目标属性标识,标记所述第一属性。
可选地,所述根据所述目标属性标识,标记所述第一属性,包括:
查询所述第一属性所在的目标数据库表,确定是否已存在标记为所述目标属性标识的属性;
若已存在标记为所述目标属性标识的属性,则采用增加前缀或后缀的目标属性标识,标记所述第一属性;
若不存在标记为所述目标属性标识的属性,则采用所述目标属性标识,标记所述第一属性。
可选地,所述采用增加前缀或后缀的目标属性标识,标记所述第一属性之前,还包括:
采用随机方式生成所述前缀或后缀;
或者,按设定取值顺序生成所述前缀或后缀。
可选地,所述根据所述目标属性标识,标记所述第一属性之后,还包括:
查询所述目标属性标识对应的取值规则;
根据所述取值规则,设置所述第一属性的属性值。
可选地,所述取值规则包括属性值的数据类型、数据长度和默认值中的一个或多个组合。
可选地,所述候选属性标识,是根据已生成的多个第二属性的属性标识确定的;所述获取命名规则,包括:
对采用所述候选属性标识进行标记的第二属性,从属性描述信息中提取关键字;
根据提取的关键字和相应的候选属性标识,建立所述命名规则。
可选地,所述对采用所述候选属性标识进行标记的第二属性,从属性描述信息中提取关键字之前,还包括:
从至少两个已生成数据库表中,获取多个所述第二属性;
比较多个所述第二属性的属性标识,以确定出现在至少两个已生成数据库表中的属性标识;
将所述出现在至少两个已生成数据库表中的属性标识作为所述候选属性标识。
可选地,所述对采用所述候选属性标识进行标记的第二属性,从属性描述信息中提取关键字之前,还包括:
从同一个已生成数据库表中,获取多个所述第二属性;
比较多个所述第二属性的属性标识,以确定出现在至少两个属性标识中的字符;
将所述出现在至少两个属性标识中的字符作为所述候选属性标识。
可选地,所述对待生成的第一属性获取属性描述信息之后,还包括:
若所述命名规则中不包含与所述第一属性的属性描述信息匹配的关键字,则提示输入所述第一属性的属性标识;
对所述第一属性的属性描述信息提取关键字;
根据输入的属性标识和提取的关键字,新增所述命名规则。
本申请一些实施例提出了一种数据处理装置,所述装置包括:
第一获取模块,用于获取命名规则,所述命名规则用于指示候选属性标识与关键字之间的映射关系;
第二获取模块,用于对待生成的第一属性获取属性描述信息;
查询模块,用于根据与所述属性描述信息匹配的关键字,查询所述命名规则,以从所述候选属性标识中,确定匹配的关键字所对应的目标属性标识;
标记模块,用于根据所述目标属性标识,标记所述第一属性。
可选地,所述标记模块,包括:
查询单元,用于查询所述第一属性所在的目标数据库表,确定是否已存在标记为所述目标属性标识的属性;
标记单元,用于若已存在标记为所述目标属性标识的属性,则采用增加前缀或后缀的目标属性标识,标记所述第一属性;若不存在标记为所述目标属性标识的属性,则采用所述目标属性标识,标记所述第一属性。
可选地,所述标记模块,还包括:还包括:
生成单元,用于采用随机方式生成所述前缀或后缀;或者,按设定取值顺序生成所述前缀或后缀。
可选地,所述装置,还包括:
设置模块,用于查询所述目标属性标识对应的取值规则;根据所述取值规则,设置所述第一属性的属性值。
可选地,所述取值规则包括属性值的数据类型、数据长度和默认值中的一个或多个组合。
可选地,所述候选属性标识,是根据已生成的多个第二属性的属性标识确定的;所述第一获取模块,包括:
提取单元,用于对采用所述候选属性标识进行标记的第二属性,从属性描述信息中提取关键字;
建立单元,用于根据提取的关键字和相应的候选属性标识,建立所述命名规则。
可选地,所述第一获取模块,还包括:
确定单元,用于从至少两个已生成数据库表中,获取多个所述第二属性;比较多个所述第二属性的属性标识,以确定出现在至少两个已生成数据库表中的属性标识;将所述出现在至少两个已生成数据库表中的属性标识作为所述候选属性标识。
可选地,所述确定单元,还用于:
从同一个已生成数据库表中,获取多个所述第二属性;
比较多个所述第二属性的属性标识,以确定出现在至少两个属性标识中的字符;
将所述出现在至少两个属性标识中的字符作为所述候选属性标识。
可选地,所述装置,还包括:
新增模块,用于若所述命名规则中不包含与所述第一属性的属性描述信息匹配的关键字,则提示输入所述第一属性的属性标识;对所述第一属性的属性描述信息提取关键字;根据输入的属性标识和提取的关键字,新增所述命名规则。
本申请一些实施例提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本申请一些实施例提供的数据处理方法。
本申请一些实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请一些实施例提供的数据处理方法。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例所提供的一种数据处理方法的流程示意图;
图2为本申请实施例所提供的另一种数据处理方法的流程示意图;
图3为本申请实施例所提供的又一种数据处理方法的流程示意图;
图4为本申请实施例所提供的再一种数据处理方法的流程示意图;以及
图5为本申请实施例提供的一种数据处理装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的数据处理方法、装置、电子设备及存储介质。
图1为本申请实施例所提供的一种数据处理方法的流程示意图。
如图1所示,该方法包括以下步骤:
步骤101,获取命名规则,命名规则用于指示候选属性标识与关键字之间的映射关系。
其中,数据库建立时,需要建立多个数据库表用于存储属性标识和属性的限制条件等相关数据,数据库表中包含多个属性,每一个属性具有对应的属性标识。例如,属性A,对应的属性标识为“Mark”,属性标识也可以称为属性名称,属性B对应的属性标识为“NAME1”,属性C对应的属性标识为“NAME2”。而属性,有已经建立的数据库表中的属性,还有待生成的属性,为了便于区分,将数据库表中待生成的属性称为第一属性,将已建立数据库表中已生成的属性称为第二属性,第一属性和第二属性可以相同,也可以不同。
作为一种可能的实现方式,候选属性标识,是根据已生成的多个第二属性的属性标识确定的,对于具体的确定方法,后续实施例中会详细介绍。
具体地,对采用候选属性标识进行标记的第二属性,从属性描述信息中提取关键字,根据提取的关键字和相应的候选属性标识之间的映射关系,建立命名规则。其中,候选属性标识与关键字之间的映射关系,例如为,候选属性标识“CLASS”和关键字“类别”之间具有映射关系,候选属性标识“MARK”和关键字“描述”之间具有映射关系,也就是说“类别”和“CLASS”是相对应的,而“描述”和“MARK”是相对应的。其中,基于关键字和相应的候选属性标识之间的映射关系,建立的命名规则,下述实施例中会详细介绍。
步骤102,对待生成的第一属性获取属性描述信息。
在建立数据库表之前,会根据软件开发的需求生成需求文档,需求文档中存储了多个需求,例如,用户针对知识产权企业开发一个软件,生成的需求文档中包含用户的多个需求,例如包含:申请案件的案号,发明人的姓名,第一发明人的姓名,交底书名称等等,其中的每一个需求对应要建立的数据库表中待生成的一个第一属性的描述信息。其中,第一属性是指数据库表中待生成的属性。
具体地,从需求文档中获取多个属性描述信息,获取的多个属性描述信息即为待生成的第一属性的描述信息,例如,获取的一个属性描述信息为:员工小郑的名字、另一个属性描述信息为:主管张三的名字姓名,又一个属性描述信息为:这是一个负责任的保洁阿姨等等。
步骤103,根据与属性描述信息匹配的关键字,查询命名规则,以从候选属性标识中,确定匹配的关键字所对应的目标属性标识。
具体地,根据获取的待生成的第一属性的属性描述信息,确定匹配的关键字,作为一种可能的实现方式,针对每一个待生成的第一属性的属性描述信息进行语义识别,识别得到相应的关键字,将识别到的相应关键字作为与对应的待生成的第一属性的描述信息匹配的关键字,例如,针对待生成的第一属性的属性描述信息:员工小郑的名字,匹配得到的关键字为“姓名”;针对待生成的第一属性的属性描述信息:一个美丽、善良的姑娘,匹配得到的关键字为“描述”;针对待生成的第一属性的属性描述信息:购买商品的时间,匹配到的关键字为“时间”。进而,根据与待生成的第一属性的属性描述信息匹配的关键字,查询命名规则,根据命名规则中指示的关键字与候选属性标识的映射关系,以确定匹配的关键字所对应的目标属性标识。
例如,针对待生成的第一属性1,第一属性1的属性描述信息为:员工小郑的名字,匹配得到的关键字为“姓名”,根据关键字“姓名”对获取的命名规则进行查询,而命名规则中包含关键字“姓名”与候选属性标识“NAME”之间的映射关系,因此,确定关键字“姓名”对应的目标属性标识则为“NAME”。
步骤104,根据目标属性标识,标记第一属性。
具体地,根据命名规则查找确定的目标属性标识,利用查找到的目标属性标识标记第一属性,例如,将上一步骤中根据命名规则确定的目标属性标识“NAME”,对待生成的第一属性1进行标记,也就是说确定了第一属性1的属性标识为“NAME”,并将目标属性标识填入数据库表中第一属性1对应的表格中,实现了基于已经生成的命名规则对待生成的第一属性的自动命名,不需要耗费人工来命名,提高了标记命名的效率,并降低了出错率。
本实施例的数据库表的数据处理方法中,获取命名规则,命名规则用于指示候选属性标识与关键字之间的映射关系,对待生成的第一属性获取属性描述信息,根据与属性描述信息匹配的关键字,查询命名规则,以从候选属性标识中,确定匹配的关键字所对应的目标属性标识,根据目标属性标识,标记第一属性,基于属性标识与关键字之间的映射关系指示的命名规则,确定待生成的第一属性的目标属性标识,以实现自动化且快速的生成数据库表的属性的标识,并利用该标识进行命名,提高了数据库表的数据处理效率,解决了现有技术中建立数据库表时,需要人工对数据库表中的属性进行命名录入,工作量大,效率低的技术问题。
基于上一实施例,本实施例提供了另一种数据库表的数据处理方法,具体说明了如何根据已生成数据库表中的第二属性,建立命名规则。图2为本申请实施例所提供的另一种数据库表的数据处理方法的流程示意图。
如图2所示,上述步骤101还可以包括以下子步骤:
步骤1011,确定候选属性标识。
其中,候选属性标识,是根据已生成的多个第二属性的属性标识确定的,其中,第二属性是存储在已生成的数据库表中,已生成的数据库表中存储有多个第二属性对应的属性标识。
作为一种可能的实现方式,从至少两个已生成数据库表中,获取多个第二属性,比较多个第二属性的属性标识,以确定出现在至少两个已生成数据库表中的属性标识,将出现在至少两个已生成数据库表中的属性标识作为候选属性标识。例如,表A、表B和表C均为已生成数据库表,从表A、表B和表C中获取多个第二属性,其中,表A中的第二属性1,表B中的第二属性2,以及表C中的第二属性3的属性标识均为Name,则属性标识Name出现在三个已生成数据库表中,因此,Name则为候选属性标识。其中,其它候选属性标识还可以是根据出现在更多个已生成数据库表中的多个第二属性的属性标识确定的,本实施例中不进行限定。
例如:表A中有员工姓名字段,表B中也有医生姓名字段,那么就把“姓名”抽取为候选属性标识。或者在建立数据表前,发现姓名、性别、年龄、出生日期、家庭地址、户籍地址等对应的属性标识在多个表中用到,则将上述属性标识通过人工来设置为候选属性标识。
作为另一种可能的实现方式,从同一个已生成数据库表中,获取多个第二属性,比较多个第二属性的属性标识,以确定出现在至少两个属性标识中的字符,将出现在至少两个属性标识中的字符作为候选属性标识。
步骤1012,对采用候选属性标识进行标记的第二属性,从属性描述信息中提取关键字。
具体地,对确定的候选属性标识,确定采用候选属性标识标记的第二属性,获取对应的第二属性的属性描述信息,作为一种可能的实现方式,第二属性的属性描述信息也可以是从需求文档中获取得到的。从第二属性的属性描述信息中提取得到关键字,该关键字,可以是从属性描述信息中直接识别得到的,例如,第二属性的属性描述信息为:购买商品的日期,识别的关键字为“日期”;也可以是根据属性描述信息的语义识别得到的。例如,第二属性的属性描述信息为:一个美丽、善良的姑娘,通过语义识别匹配得到的关键字为“描述”。
步骤1013,根据提取的关键字和相应的候选属性标识,建立命名规则。
进而,根据提取的关键字和相应的候选属性标识,建立关键字和相应的候选属性标识之间的映射关系,该映射关系即为命名规则。例如,下表中即为一种命名规则,表中仅示意性列举部分命名规则,并不对本实施例的命名规则构成限定。
关键字 | 候选属性标识 |
自增长编号 | ID |
业务序列码 | NO |
编码类 | CODE |
类别 | CLASS |
结果 | RESULT |
描述 | MARK |
标志 | FLAG |
日期 | DATE |
姓名 | NAME |
命名规则
进一步,在建立好命名规则后,将命名规则进行发布,就是使得发布后的命名规则对在建的数据库表可见,即使得数据库表生成第一属性的过程中可以利用该命名规则,确定第一属性的属性标识,避免了人工建立数据库表时,命名规则不统一,即使相同数据类型的属性也可能采用不同的规则进行命名,导致命名的杂乱无章,同时效率低下的技术问题。
本实施例的数据库表的数据处理方法中,根据多个数据库表中包含的公共属性标识和对应的属性描述信息,生成属性描述信息的关键字与属性标识之间的映射关系,将该映射关系作为命名规则,从而在数据库表的待生成的第一属性命名时,将命名规则中的关键字与待生成的第一属性的属性描述信息匹配,若该属性描述信息中包含匹配的关键字,则依据命名规则,将匹配到的关键字对应的属性标识,作为对应的属性标识,以实现自动化且快速的生成数据库表的属性的标识,提高了数据表中属性命名的效率。
基于上述实施例,本实施例还提供了又一种数据库表的数据处理方法的可能的实现方式,具体说明了当同一个数据库表中存在属性标识相同的属性时,如何解决标识冲突的问题。图3为本申请实施例所提供的又一种数据库表的数据处理方法的流程示意图。
如图3所示,上述步骤104还可以包括以下子步骤:
步骤1041,查询待生成的第一属性所在的目标数据库表,确定是否已存在标记为目标属性标识的属性。
其中,目标数据库即为当前正建立的数据库表,该数据库表中的属性即为待生成的第一属性。
具体地,在确定待生成的第一属性的目标属性标识后,在利用该目标属性标识对待生成的第一属性进行标识前,查询待生成的第一属性所属的目标数据库表,确定是否已存在标记为目标属性标识的属性,以避免同一个数据库表中存在相同的属性标识,造成标识冲突。
步骤1042,若已存在标记为目标属性标识的属性,则生成前缀或后缀,并采用增加前缀或后缀的目标属性标识,标记第一属性。
具体地,若同一个数据库表中已存在标记为目标属性标识的属性,则通过生成前缀或后缀对目标属性标识进行更改,其中,可采用随机方式生成前缀或后缀;或者,按设定取值顺序生成前缀或后缀。具体可采用在目标属性标识中增加前缀或后缀的方式对目标属性标识进行更改,并利用更改的目标属性标识,标记第一属性。
例如:新建数据库表有20个依次命名的属性,分别命名为第一属性、第二属性···和第二十项属性,分别对应20项数值型检验项目结果字段,第一项属性确定目标属性标识为RESULT后,字段直接命名为RESULT,从第二项属性开始,后续属性利用RESULT进行属性标识,都会出现命名冲突,那么根据之前设置好的冲突解决规则,利用增加后缀的方式对后续属性的目标属性标识进行更改,第二项属性至第二十项属性的属性标识依次命名为RESULT_ITEM1,RESULT_ITEM2,……,RESULT_ITEM19。若对应具体实例,则例如,若建立的数据库表为统计学生的各科成绩,由于科目通常包含多个,例如,英语、数学、语文等等,若用SCORE标记各科成绩,则存在命名冲突,导致无法识别的问题,从而,通过增加前缀或后缀的方式对SCORE进行更改,例如,在标识后增加后缀,使得数学成绩为SCORE1,英语成绩为SCORE2,语文成绩为SCORE3等,不再一一列举。另外,对于增加前缀解决标识冲突的原理相同,此处不再赘述。
步骤1043,若不存在标记为目标属性标识的属性,则采用目标属性标识,标记第一属性。
具体地,若不存在标记为目标属性标识的属性,则采用目标属性标识,标记第一属性,实现了自动、快速生成第一属性的标识,而不需要人工一一进行标注,节省了人力成本,同时,也具有较高的可靠性。
本实施例的数据库表的数据处理方法,在确定第一属性的目标属性标识后,在利用该目标属性标识对第一属性进行标识前,查询第一属性所在的目标数据库表,确定是否已存在标记为目标属性标识的属性,若同一张数据库表中存在命名相同的属性标识,则利用上述的冲突解决规则,在命名规则指定的目标属性标识的基础上,增加前缀或后缀,以避免同一个数据库表中的属性存在相同的属性标识,造成标识冲突。
基于上述实施例,本实施例还提供了再一种数据库表的数据处理方法的可能的实现方式,图4为本申请实施例所提供的再一种数据库表的数据处理方法的流程示意图。
如图4所示,该方法可以包含如下的步骤:
步骤401,获取命名规则,命名规则用于指示候选属性标识与关键字之间的映射关系。
步骤402,对待生成的第一属性获取属性描述信息。
其中,步骤401-步骤402具体可以参照图1对应实施例中的步骤101-步骤102,原理相同,此处不再赘述。
步骤403,判断命名规则中是否包含与第一属性的属性描述信息匹配的关键字,若是,执行步骤404,若否,执行步骤405。
具体地,根据获取的待生成的第一属性的属性描述信息,判断命名规则中是否包含与第一属性的属性描述信息匹配的关键字,若包含,则查询命名规则,以从候选属性标识中,确定匹配的关键字所对应的目标属性标识;若不包含,则无法通过直接查询现有的命名规则,从候选属性标识中,确定匹配的关键字对应的目标属性标识,则需要执行步骤405。
需要说明的是,判断命名规则中是否包含与第一属性的属性描述信息匹配的关键字,作为一种可能的实现方式,可通过将第一属性描述信息进行切词处理,提取关键字,确定是否包含命名规则中的关键字,若包含,确定命名规则中包含与第一属性的属性描述信息匹配的关键字,否则,认为不包含与第一属性的属性描述信息匹配的关键字,进一步,在确定不包含与第一属性的属性描述信息匹配的关键字时,进一步为了提高匹配的准确性,还可以对第一属性的属性描述信息进行语义识别,根据语义识别的结果,确定第一属性的属性描述信息对应的关键字,确定该关键字是否为命名规则中的关键字,以提高识别的准确性。
步骤404,根据与属性描述信息匹配的关键字,查询命名规则,以从候选属性标识中,确定匹配的关键字所对应的目标属性标识。
具体地,可参照图1对应实施例中的步骤103,原理相同,此处不再赘述。
步骤405,提示输入第一属性的属性标识。
具体地,若命名规则中不否包含与第一属性的属性描述信息对应的关键字,则无法利用现有的命名规则确定第一属性的属性描述信息,则需要提示用户输入第一属性的属性标识。
步骤406,对第一属性的属性描述信息提取关键字,根据输入的属性标识和提取的关键字,新增命名规则。
进而,建立输入的属性标识和提取的关键字之间的映射关系,将该映射关系,作为新增的命名规则,或者将该映射关系增加到原有的命名规则中,以实现命名规则的补充,提高命名规则的完成性,实现了人工进行一次命名,后续该命名规则既可直接利用,不需要再单独人工输入标识,提高了数据库表中属性标识生成的效率。
步骤407,根据目标属性标识,标记第一属性。
具体地,步骤407可参照上述实施例中的步骤104,原理相同,此处不再赘述。
步骤408,查询目标属性标识对应的取值规则,根据取值规则,设置第一属性的属性值。
其中,取值规则包括属性值的数据类型、数据长度和默认值中的一个或多个组合。
具体地,对完成标识后的第一属性,查询目标属性标识对应的取值规则,以根据取值规则对第一属性的属性值进行设置,以使得数据库表中生成的第一属性的属性值符合该取值规则。
例如,数据类型规则中,例如:姓名Name、描述Mark、地址Dress为字符串类型,自增长ID为整型、数值型检验结果Result为浮点类型、出生日期Date为日期类型、创建时间Time为时间类型等。数据长度规则中,例如,身份证号为18位、手机号为11位、性别为1位等。默认值规则中,例如,包含非空、是或否、系统当前时间等。
本实施例的数据库表的数据处理方法中,获取命名规则,命名规则用于指示候选属性标识与关键字之间的映射关系,对待生成的第一属性获取属性描述信息,根据与属性描述信息匹配的关键字,查询命名规则,以从候选属性标识中,确定匹配的关键字所对应的目标属性标识,根据目标属性标识,标记第一属性,基于属性标识与关键字之间的映射关系指示的命名规则,确定待生成的第一属性的目标属性标识,以实现自动化且快速的生成数据库表的属性的标识,并利用该标识进行命名,提高了数据库表的数据处理效率。
为了实现上述实施例,本申请还提出一种数据库表的数据处理装置。
图5为本申请实施例提供的一种数据库表的数据处理装置的结构示意图。
如图5所示,该装置包括:第一获取模块51、第二获取模块52、查询模块53和标记模块54。
第一获取模块51,用于获取命名规则,命名规则用于指示候选属性标识与关键字之间的映射关系。
第二获取模块52,用于对待生成的第一属性获取属性描述信息。
查询模块53,用于根据与属性描述信息匹配的关键字,查询命名规则,以从候选属性标识中,确定匹配的关键字所对应的目标属性标识。
标记模块54,用于根据目标属性标识,标记第一属性。
进一步地,在本申请实施例的一种可能的实现方式中,作为一种可能的实现方式,该装置还包括:设置模块和新增模块。
设置模块,用于查询目标属性标识对应的取值规则,根据取值规则,设置第一属性的属性值。
新增模块,用于若命名规则中不包含与第一属性的属性描述信息匹配的关键字,则提示输入所述第一属性的属性标识,对第一属性的属性描述信息提取关键字,根据输入的属性标识和提取的关键字,新增命名规则。
作为一种可能的实现方式,上述标记模块54,包括:
查询单元,用于查询第一属性所在的目标数据库表,确定是否已存在标记为目标属性标识的属性。
标记单元,用于若已存在标记为目标属性标识的属性,则采用增加前缀或后缀的目标属性标识,标记第一属性;若不存在标记为目标属性标识的属性,则采用目标属性标识,标记第一属性。
作为一种可能的实现方式,上述标记模块54,还包括:
生成单元,用于采用随机方式生成所述前缀或后缀;或者,按设定取值顺序生成所述前缀或后缀。
作为一种可能的实现方式,取值规则包括属性值的数据类型、数据长度和默认值中的一个或多个组合。
作为一种可能的实现方式,候选属性标识,是根据已生成的多个第二属性的属性标识确定的,上述第一获取模块51,包括:
提取单元,用于对采用候选属性标识进行标记的第二属性,从属性描述信息中提取关键字。
建立单元,用于根据提取的关键字和相应的候选属性标识,建立命名规则。
作为一种可能的实现方式,上述第一获取模块51,还包括:
确定单元,用于从至少两个已生成数据库表中,获取多个第二属性,比较多个第二属性的属性标识,以确定出现在至少两个已生成数据库表中的属性标识,将出现在至少两个已生成数据库表中的属性标识作为候选属性标识。
上述确定单元,具体还用于:
从同一个已生成数据库表中,获取多个第二属性,比较多个第二属性的属性标识,以确定出现在至少两个属性标识中的字符,将出现在至少两个属性标识中的字符作为候选属性标识。
需要说明的是,前述对数据库表的数据处理方法实施例的解释说明也适用于该实施例的数据库表的数据处理装置,此处不再赘述。
本实施例的数据库表的数据处理装置中,获取命名规则,命名规则用于指示候选属性标识与关键字之间的映射关系,对待生成的第一属性获取属性描述信息,根据与属性描述信息匹配的关键字,查询命名规则,以从候选属性标识中,确定匹配的关键字所对应的目标属性标识,根据目标属性标识,标记第一属性,基于属性标识与关键字之间的映射关系指示的命名规则,确定待生成的第一属性的目标属性标识,以实现自动化且快速的生成数据库表的属性的标识,并利用该标识进行命名,提高了数据库表的数据处理效率。
为了实现上述实施例,本申请实施例还提出一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如前述方法实施例所述的数据库表的数据处理方法。
为了实现上述实施例,本申请还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如前述方法实施例所述的数据库表的数据处理方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (11)
1.一种数据处理方法,其特征在于,所述方法包括以下步骤:
根据已生成的多个第二属性的第二属性属性标识确定候选属性标识,所述第二属性是存储在已生成的数据库表中,已生成的数据库表中存储有多个第二属性对应的属性标识;所述候选属性标识是出现在至少两个已生成数据库表中的属性标识;
对采用候选属性标识进行标记的第二属性,从第二属性的第二属性属性描述信息中提取关键字;
根据从第二属性属性描述信息中提取的所述关键字和相应的候选属性标识,建立命名规则,所述命名规则用于指示所述候选属性标识与所述关键字之间的映射关系;对待生成的第一属性获取第一属性属性描述信息;
从第一属性的第一属性属性描述信息中提取关键字;
根据从所述第一属性属性描述信息提取的关键字,查询所述命名规则,以从所述候选属性标识中,确定与所述第一属性属性描述信息提取的关键字所匹配的目标属性标识;
根据所述目标属性标识,标记所述第一属性。
2.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述目标属性标识,标记所述第一属性,包括:
查询所述第一属性所在的目标数据库表,确定是否已存在标记为所述目标属性标识的属性;
若已存在标记为所述目标属性标识的属性,则采用增加前缀或后缀的目标属性标识,标记所述第一属性;
若不存在标记为所述目标属性标识的属性,则采用所述目标属性标识,标记所述第一属性。
3.根据权利要求2所述的数据处理方法,其特征在于,所述采用增加前缀或后缀的目标属性标识,标记所述第一属性之前,还包括:
采用随机方式生成所述前缀或后缀;
或者,按设定取值顺序生成所述前缀或后缀。
4.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述目标属性标识,标记所述第一属性之后,还包括:
查询所述目标属性标识对应的取值规则;
根据所述取值规则,设置所述第一属性的属性值。
5.根据权利要求4所述的数据处理方法,其特征在于,所述取值规则包括属性值的数据类型、数据长度和默认值中的一个或多个组合。
6.根据权利要求1所述的数据处理方法,其特征在于,所述对采用所述候选属性标识进行标记的第二属性,从属性描述信息中提取关键字之前,还包括:
从至少两个已生成数据库表中,获取多个所述第二属性;
比较多个所述第二属性的属性标识,以确定出现在至少两个已生成数据库表中的属性标识;
将所述出现在至少两个已生成数据库表中的属性标识作为所述候选属性标识。
7.根据权利要求1所述的数据处理方法,其特征在于,所述对采用所述候选属性标识进行标记的第二属性,从属性描述信息中提取关键字之前,还包括:
从同一个已生成数据库表中,获取多个所述第二属性;
比较多个所述第二属性的属性标识,以确定出现在至少两个属性标识中的字符;
将所述出现在至少两个属性标识中的字符作为所述候选属性标识。
8.根据权利要求1-5任一项所述的数据处理方法,其特征在于,所述对待生成的第一属性获取属性描述信息之后,还包括:
若所述命名规则中不包含与所述第一属性的属性描述信息匹配的关键字,则提示输入所述第一属性的属性标识;
对所述第一属性的属性描述信息提取关键字;
根据输入的属性标识和提取的关键字,新增所述命名规则。
9.一种数据处理装置,其特征在于,数据处理装置用于实现如权利要求1-8中任一所述的数据处理方法,所述装置包括:
第一获取模块,用于获取命名规则,所述命名规则用于指示候选属性标识与关键字之间的映射关系;
第二获取模块,用于对待生成的第一属性获取属性描述信息;
查询模块,用于根据与所述属性描述信息匹配的关键字,查询所述命名规则,以从所述候选属性标识中,确定匹配的关键字所对应的目标属性标识;
标记模块,用于根据所述目标属性标识,标记所述第一属性。
10.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-8中任一所述的数据处理方法。
11.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的数据处理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010102108.7A CN111291024B (zh) | 2020-02-19 | 2020-02-19 | 数据处理方法、装置、电子设备及存储介质 |
PCT/CN2020/140333 WO2021164425A1 (zh) | 2020-02-19 | 2020-12-28 | 数据处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010102108.7A CN111291024B (zh) | 2020-02-19 | 2020-02-19 | 数据处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111291024A CN111291024A (zh) | 2020-06-16 |
CN111291024B true CN111291024B (zh) | 2023-11-24 |
Family
ID=71026842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010102108.7A Active CN111291024B (zh) | 2020-02-19 | 2020-02-19 | 数据处理方法、装置、电子设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111291024B (zh) |
WO (1) | WO2021164425A1 (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291024B (zh) * | 2020-02-19 | 2023-11-24 | 京东方科技集团股份有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN111966868B (zh) * | 2020-09-07 | 2021-04-06 | 航天云网数据研究院(广东)有限公司 | 基于标识解析的数据治理方法及相关设备 |
CN112214477B (zh) * | 2020-09-25 | 2024-04-19 | 国网江苏省电力有限公司 | 一种个人信息库的数据核查和更新方法 |
CN112667248B (zh) * | 2020-12-08 | 2024-09-24 | 深圳前海微众银行股份有限公司 | 一种生成服务器部署参数的方法、装置、设备及存储介质 |
CN112732993B (zh) * | 2020-12-31 | 2024-03-08 | 京东科技控股股份有限公司 | 数据处理方法、装置、计算机设备和存储介质 |
CN112818012A (zh) * | 2021-01-26 | 2021-05-18 | 深圳力维智联技术有限公司 | 设备数据匹配方法、装置、设备及存储介质 |
CN112989383B (zh) * | 2021-03-26 | 2023-01-17 | 北京市商汤科技开发有限公司 | 数据分发方法、装置、计算机设备及存储介质 |
CN113127490B (zh) * | 2021-04-23 | 2023-02-24 | 山东英信计算机技术有限公司 | 一种键名称生成方法、装置和计算机可读存储介质 |
CN114064638B (zh) * | 2021-10-27 | 2024-07-02 | 深圳萨摩耶数字科技有限公司 | 一种信息处理的方法、装置、设备及存储介质 |
CN114328681A (zh) * | 2021-12-20 | 2022-04-12 | 绿盟科技集团股份有限公司 | 一种数据转换方法、装置、电子设备及存储介质 |
CN114610723B (zh) * | 2022-03-29 | 2022-10-14 | 中软数智信息技术(武汉)有限公司 | 一种基于人工智能的数据处理方法、系统及云平台 |
CN116070175B (zh) * | 2023-04-06 | 2024-03-01 | 花瓣云科技有限公司 | 一种文案生成方法及电子设备 |
CN116384939B (zh) * | 2023-04-13 | 2023-12-01 | 华腾建信科技有限公司 | 工程项目安全管理方法、装置、设备及存储介质 |
CN116471344B (zh) * | 2023-04-27 | 2023-11-21 | 无锡沐创集成电路设计有限公司 | 一种数据报文的关键字提取方法、装置及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109542899A (zh) * | 2018-10-31 | 2019-03-29 | 桂林金发明科技开发有限公司 | 一种基于靶符号的数据自动录入方法及系统 |
CN110210017A (zh) * | 2019-04-29 | 2019-09-06 | 厦门一品威客网络科技股份有限公司 | 一种自动命名方法、装置、计算机设备及存储介质 |
CN110222110A (zh) * | 2019-06-13 | 2019-09-10 | 中国农业科学院农业信息研究所 | 一种基于etl工具的资源描述框架数据转换存储一体化方法 |
CN110704476A (zh) * | 2019-10-08 | 2020-01-17 | 北京锐安科技有限公司 | 数据处理方法、装置、设备及存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100501413B1 (ko) * | 2003-10-23 | 2005-07-18 | 한국전자통신연구원 | 유엠엘에스를 기반으로 생물학 문헌으로부터 생물학적개체명을 인식하는 장치 및 그 방법 |
WO2014041699A1 (ja) * | 2012-09-14 | 2014-03-20 | 株式会社日立製作所 | データ分析方法、データ分析装置及びその処理プログラムを格納した記憶媒体 |
CN107463695A (zh) * | 2017-08-14 | 2017-12-12 | 浪潮软件股份有限公司 | 一种数据存储的方法及装置 |
CN108038113A (zh) * | 2017-10-16 | 2018-05-15 | 武汉楚鼎信息技术有限公司 | 基于互联网金融智能问答的检索方法及系统 |
CN107992293A (zh) * | 2017-12-11 | 2018-05-04 | 国云科技股份有限公司 | 一种企业属性划分系统及其实现方法 |
CN109558404B (zh) * | 2018-10-19 | 2023-12-01 | 中国平安人寿保险股份有限公司 | 数据存储方法、装置、计算机设备和存储介质 |
CN111291024B (zh) * | 2020-02-19 | 2023-11-24 | 京东方科技集团股份有限公司 | 数据处理方法、装置、电子设备及存储介质 |
-
2020
- 2020-02-19 CN CN202010102108.7A patent/CN111291024B/zh active Active
- 2020-12-28 WO PCT/CN2020/140333 patent/WO2021164425A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109542899A (zh) * | 2018-10-31 | 2019-03-29 | 桂林金发明科技开发有限公司 | 一种基于靶符号的数据自动录入方法及系统 |
CN110210017A (zh) * | 2019-04-29 | 2019-09-06 | 厦门一品威客网络科技股份有限公司 | 一种自动命名方法、装置、计算机设备及存储介质 |
CN110222110A (zh) * | 2019-06-13 | 2019-09-10 | 中国农业科学院农业信息研究所 | 一种基于etl工具的资源描述框架数据转换存储一体化方法 |
CN110704476A (zh) * | 2019-10-08 | 2020-01-17 | 北京锐安科技有限公司 | 数据处理方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2021164425A1 (zh) | 2021-08-26 |
CN111291024A (zh) | 2020-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111291024B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN107590123B (zh) | 车载中地点上下文指代消解方法及装置 | |
CN111831911A (zh) | 查询信息的处理方法、装置、存储介质和电子装置 | |
CN109977366B (zh) | 一种目录生成方法及装置 | |
CN113760891B (zh) | 一种数据表的生成方法、装置、设备和存储介质 | |
CN103810212A (zh) | 一种数据库索引的自动创建方法及系统 | |
CN107291949B (zh) | 信息搜索方法及装置 | |
CN109933803B (zh) | 一种成语信息展示方法、展示装置、电子设备及存储介质 | |
JP2002099561A (ja) | データ変換方法およびデータ変換システム並びに記憶媒体 | |
CN108182287A (zh) | 一种自动问答方法、装置及服务器 | |
CN110908980B (zh) | 用户标识映射关系建立方法、系统、设备及存储介质 | |
CN111079428B (zh) | 一种分词和行业词典构建方法、装置以及可读存储介质 | |
CN110175219A (zh) | 一种k12阶段重复学校识别方法、装置、设备及存储介质 | |
CN111190937B (zh) | 籍贯信息的查询方法、装置、电子设备及存储介质 | |
CN105808735B (zh) | 一种数据处理的方法及装置 | |
CN113157978A (zh) | 数据的标签建立方法和装置 | |
CN111078671A (zh) | 数据表字段的修改方法、装置、设备和介质 | |
CN111611793A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN111104467A (zh) | 轨道交通地理线路配置数据的生成方法、装置和设备 | |
CN110414006B (zh) | 文本的主题标注方法、装置、电子设备及存储介质 | |
CN113535895A (zh) | 搜索文本处理方法、装置、电子设备及介质 | |
CN110580243A (zh) | 一种文件比对方法、装置、电子设备及存储介质 | |
CN112287005A (zh) | 一种数据处理方法、装置、服务器及介质 | |
CN113268600B (zh) | 检索名称的错别字纠正方法、装置、电子设备和存储介质 | |
CN116719839B (zh) | 会计档案的数据查询方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |