CN110990412A - 数据结构设计方法和装置 - Google Patents

数据结构设计方法和装置 Download PDF

Info

Publication number
CN110990412A
CN110990412A CN201911352551.3A CN201911352551A CN110990412A CN 110990412 A CN110990412 A CN 110990412A CN 201911352551 A CN201911352551 A CN 201911352551A CN 110990412 A CN110990412 A CN 110990412A
Authority
CN
China
Prior art keywords
data
dictionary
name
user
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911352551.3A
Other languages
English (en)
Other versions
CN110990412B (zh
Inventor
张国柱
柯星宇
马祥峰
王学文
庄滨滨
肖俊斌
万经勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN201911352551.3A priority Critical patent/CN110990412B/zh
Publication of CN110990412A publication Critical patent/CN110990412A/zh
Application granted granted Critical
Publication of CN110990412B publication Critical patent/CN110990412B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种数据结构设计方法和装置,该方法包括:获取用户的数据表结构设计请求,该数据表结构设计请求包括:数据表所属产品的名称、用户自定义的表名以及执行数据标准等级;根据该用户自定义的表名在预获取的词汇表中获取推荐表名并反馈给用户,以供用户确定最终表名;根据该数据表所属产品的名称以及产品执行数据标准等级,在预加工的数据字典中获取可引用的字典条目并反馈给用户,以供用户选择;获取并根据用户确定的最终表名、用户选择的字典条目以及所选择的字典条目的顺序生成该数据表的数据结构。词汇表以及所述数据字典由存量产品和模块的数据结构中得到,词汇表及所述数据字典能够自动更新,能在兼顾企业旧系统存量数据的特殊情况。

Description

数据结构设计方法和装置
技术领域
本发明涉及数据结构设计技术领域,尤其涉及一种数据结构设计方法和装置。
背景技术
随着技术的发展,数据已经成为一种核心竞争力,数据价值越来越受到企业重视。但是,在企业早期系统开发中,没有对数据进行严格定义,导致数据杂乱,增加开发难度,也给后续数据分析添加难度。数据杂乱的典型情况为:相同的业务属性的数据分散在各个数据表中,其数据格式和数据值域范围都可能不同;相同的字段命名,却代表着不同的业务属性。其中,缺乏数据结构标准是数据杂乱的主要原因,表现为数据命名不规范、数据类型不统一,需要建立企业级数据标准来解决。
统一标准的数据定义和企业级数据模型是数据治理的基础工作,但是,一步到位全部执行企业统一的数据标准阻力重重。一方面,标准更新往往滞后于系统开发,导致数据设计无标准可依;另一方面,建立企业级的数据标准定义虽然能在企业范围消除数据歧义,避免数据不恰当使用,但是大量存在的旧系统,其存量数据杂乱、分散,强行按照统一的企业数据标准实施,改造成本巨大。如果在标准贯彻中,不考虑旧系统存在大量和标准有冲突存量数据的事实,容易导致标准化的失败。
发明内容
针对现有技术中的问题,本发明提供一种数据结构设计方法和装置、电子设备以及计算机可读存储介质,能够至少部分地解决现有技术中存在的问题。
为了实现上述目的,本发明采用如下技术方案:
第一方面,提供一种数据结构设计方法,包括:
获取用户的数据表结构设计请求,该数据表结构设计请求包括:数据表所属产品的名称、用户自定义的表名以及执行数据标准等级;
根据该用户自定义的表名在预获取的词汇表中获取推荐表名并反馈给用户,以供用户确定最终表名;
根据该数据表所属产品的名称以及产品执行数据标准等级,在预加工的数据字典中获取可引用的字典条目并反馈给用户,以供用户选择;
获取并根据用户确定的最终表名、用户选择的字典条目以及所选择的字典条目的顺序生成该数据表的数据结构;
其中,所述词汇表以及所述数据字典由存量产品和模块的数据结构中得到。
进一步地,数据结构设计方法还包括:
根据存量产品和模块的数据结构获取数据字典;
其中,该数据字典包括多个字典条目,该字典条目包括:数据项名称、编码、类型、长度、业务含义、所属产品、所属模块以及所属数据标准等级。
进一步地,该根据存量产品和模块的数据结构获取数据字典,包括:
将该存量产品和模块的数据结构按照字段中文名称归类获取字典条目清单,该字典条目清单包括多个字典条目;
判断该字典条目清单中的字典条目是否存在模块内冲突;
若否,判断该字典条目清单中的字典条目是否存在跨模块复用;
若字典条目清单中的字典条目不存在跨模块复用,则将该字典条目的所属数据标准等级设置为模块级;
若字典条目清单中的字典条目存在跨模块复用,则进一步判断该字典条目是否存在跨产品复用;
若字典条目不存在跨产品复用,则将该字典条目的所属数据标准等级设置为产品级;
若字典条目存在跨产品复用,则进一步判断该字典条目是否符合预获取的企业级数据模型标准;
若字典条目符合预获取的企业级数据模型标准,则将该字典条目的所属数据标准等级设置为企业级;
若字典条目不符合预获取的企业级数据模型标准,则将该字典条目的所属数据标准等级设置为产品级。
进一步地,该根据存量产品和模块的数据结构获取数据字典,还包括:
若字典条目清单中的字典条目存在模块内冲突,则将冲突的字典条目返馈给技术人员,以使技术人员对冲突的字典条目进行模块内字段治理。
进一步地,数据结构设计方法还包括:
根据存量产品和模块的数据结构获取词汇表。
进一步地,该词汇表包括:多条原子词汇;
该根据存量产品和模块的数据结构获取词汇表,包括:
判断该存量产品和模块的数据结构中各字段的英文名称是否存在分割符,该字段包括英文名称以及中文名称;
若否,将该英文名称与对应的中文名称对应存储为一条原子词汇;
若是,根据该分割符对该英文名称递归截取单词,并获取单词的中文意思,将该单词与对应的中文意思存储为一条原子词汇。
进一步地,数据结构设计方法还包括:
获取用户的字典条目创建请求,该字典条目创建请求包括:数据项名称;
根据该词汇表判断该数据项名称是否满足创建要求;
若是,根据该字典条目创建请求新建字典条目并存入该数据字典。
进一步地,数据结构设计方法还包括:
若该数据项名称不满足创建要求,向该用户反馈重新命名信息,以使用户根据该重新命名信息重新输入数据项名称。
进一步地,数据结构设计方法还包括:
若该数据项名称不满足创建要求,基于该词汇表,根据该数据项名称获取推荐名称并反馈给用户,供用户选择。
第二方面,提供一种数据结构设计装置,包括:
设计请求获取模块,获取用户的数据表结构设计请求,该数据表结构设计请求包括:数据表所属产品的名称、用户自定义的表名以及执行数据标准等级;
表名推荐模块,根据该用户自定义的表名在预获取的词汇表中获取推荐表名并反馈给用户,以供用户确定最终表名;
字典条目推荐模块,根据该数据表所属产品的名称以及产品执行数据标准等级,在预加工的数据字典中获取可引用的字典条目并反馈给用户,以供用户选择;
数据结构设计模块,获取并根据用户确定的最终表名、用户选择的字典条目以及所选择的字典条目的顺序生成该数据表的数据结构;
其中,所述词汇表以及所述数据字典由存量产品和模块的数据结构中得到。
进一步地,数据结构设计装置还包括:
数据字典获取模块,根据存量产品和模块的数据结构获取数据字典;
其中,该数据字典包括多个字典条目,该字典条目包括:数据项名称、编码、类型、长度、业务含义、所属产品、所属模块以及所属数据标准等级。
进一步地,该数据字典获取模块包括:
条目清单获取单元,将该存量产品和模块的数据结构按照字段中文名称归类获取字典条目清单,该字典条目清单包括多个字典条目;
冲突判断单元,判断该字典条目清单中的字典条目是否存在模块内冲突;
跨模块复用判断单元,若字典条目清单中的字典条目不存在模块内冲突,判断该字典条目清单中的字典条目是否存在跨模块复用;
第一等级设置单元,若字典条目清单中的字典条目不存在跨模块复用,则将该字典条目的所属数据标准等级设置为模块级;
跨产品复用判断单元,若字典条目清单中的字典条目存在跨模块复用,则进一步判断该字典条目是否存在跨产品复用;
第二等级设置单元,若字典条目不存在跨产品复用,则将该字典条目的所属数据标准等级设置为产品级;
对标单元,若字典条目存在跨产品复用,则进一步判断该字典条目是否符合预获取的企业级数据模型标准;
第三等级设置单元,若字典条目符合预获取的企业级数据模型标准,则将该字典条目的所属数据标准等级设置为企业级;
第四等级设置单元,若字典条目不符合预获取的企业级数据模型标准,则将该字典条目的所属数据标准等级设置为产品级。
进一步地,该数据字典获取模块还包括:
治理单元,若字典条目清单中的字典条目存在模块内冲突,则将冲突的字典条目返馈给技术人员,以使技术人员对冲突的字典条目进行模块内字段治理。
进一步地,数据结构设计装置还包括:
词汇表获取模块,根据存量产品和模块的数据结构获取词汇表。
进一步地,该词汇表包括:多条原子词汇;
该词汇表获取模块包括:
分割符判断单元,判断该存量产品和模块的数据结构中各字段的英文名称是否存在分割符,该字段包括英文名称以及中文名称;
原子词汇存储单元,若字段的英文名称不存在分割符,将该英文名称与对应的中文名称对应存储为一条原子词汇;
截词存储单元,若字段的英文名称存在分割符,根据该分割符对该英文名称递归截取单词,并获取单词的中文意思,将该单词与对应的中文意思存储为一条原子词汇。
进一步地,数据结构设计装置还包括:
创建请求获取模块,获取用户的字典条目创建请求,该字典条目创建请求包括:数据项名称;
创建判断模块,根据该词汇表判断该数据项名称是否满足创建要求;
字典条目创建模块,若数据项名称满足创建要求,根据该字典条目创建请求新建字典条目并存入该数据字典。
进一步地,数据结构设计装置还包括:
重命名模块,若该数据项名称不满足创建要求,向该用户反馈重新命名信息,以使用户根据该重新命名信息重新输入数据项名称。
进一步地,数据结构设计装置还包括:
数据项名称推荐模块,若该数据项名称不满足创建要求,基于该词汇表,根据该数据项名称获取推荐名称并反馈给用户,供用户选择。
第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现上述的数据结构设计方法的步骤。
第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的数据结构设计方法的步骤。
本发明提供的数据结构设计方法和装置、电子设备以及计算机可读存储介质,该方法包括:获取用户的数据表结构设计请求,该数据表结构设计请求包括:数据表所属产品的名称、用户自定义的表名以及执行数据标准等级;根据该用户自定义的表名在预获取的词汇表中获取推荐表名并反馈给用户,以供用户确定最终表名;根据该数据表所属产品的名称以及产品执行数据标准等级,在预加工的数据字典中获取可引用的字典条目并反馈给用户,以供用户选择;获取并根据用户确定的最终表名、用户选择的字典条目以及所选择的字典条目的顺序生成该数据表的数据结构,其中,词汇表以及所述数据字典由存量产品和模块的数据结构中得到,词汇表以及所述数据字典能够自动更新,解决现有数据标准更新滞后于系统发展的问题;另一方面,充分考虑了存量产品和模块,能在兼顾企业旧系统存量数据的特殊情况,循序渐进提高企业数据标准化程度,不必强行按照统一的企业数据标准实施,利于标准化实施。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中的服务器S1与客户端设备B1之间的架构示意图;
图2为本发明实施例中的服务器S1、客户端设备B1及数据库服务器S2之间的架构示意图;
图3示出了本发明实施例的架构原理图;
图4是本发明实施例中的数据结构设计方法的流程示意图一;
图5是本发明实施例中的数据结构设计方法的流程示意图二;
图6示出了图5中步骤S10的具体步骤;
图7是本发明实施例中的数据结构设计方法的流程示意图三;
图8示出了图7中步骤S20的具体步骤;
图9示出了本发明实施例中创建字典条目的一种具体步骤;
图10示出了本发明实施例中创建字典条目的另一种具体步骤;
图11实施本发明实施例提供的数据结构设计方法的数据标准化设计平台;
图12是本发明实施例中的数据结构设计装置的结构框图;
图13为本发明实施例电子设备的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
统一标准的数据定义和企业级数据模型是数据治理的基础工作。但是,一方面,标准更新往往滞后于系统开发,导致数据设计无标准可依;另一方面,建立企业级的数据标准定义虽然能在企业范围消除数据歧义,避免数据不恰当使用,但是大量存在的旧系统,其存量数据杂乱、分散,强行按照统一的企业数据标准实施,改造成本巨大,标准贯彻中,旧系统存在大量和标准有冲突存量数据,容易导致标准化的失败。
为至少部分解决现有技术中的上述技术问题,本发明实施例提供了一种数据结构设计方法,词汇表以及所述数据字典能够自动更新,解决现有数据标准更新滞后于系统发展的问题;另一方面,充分考虑了存量产品和模块,能在兼顾企业旧系统存量数据的特殊情况,循序渐进提高企业数据标准化程度,不必强行按照统一的企业数据标准实施,利于标准化实施。
有鉴于此,本申请提供了一种数据结构设计装置,该装置可以为一种服务器S1,参见图1,该服务器S1可以与至少一个客户端设备B1通信连接,所述客户端设备B1可以将数据表结构设计请求发送至所述服务器S1,所述服务器S1可以在线接收所述数据表结构设计请求。所述服务器S1可以在线或者离线对获取的数据表结构设计请求进行预处理,数据表结构设计请求包括:数据表所属产品的名称、用户自定义的表名以及执行数据标准等级,根据所述用户自定义的表名在预获取的词汇表中获取推荐表名并反馈给用户,以供用户确定最终表名;根据所述数据表所属产品的名称以及产品执行数据标准等级,在预加工的数据字典中获取可引用的字典条目并反馈给用户,以供用户选择;获取并根据用户确定的最终表名、用户选择的字典条目以及所选择的字典条目的顺序生成所述数据表的数据结构。而后,所述服务器S1可以将数据表的数据结构在线发送至所述客户端设备B1。所述客户端设备B1可以在线接收所述数据表的数据结构。
另外,参见图2,所述服务器S1还可以与至少一个数据库服务器S2通信连接,所述数据库服务器S2用于存储词汇表以及数据字典。所述数据库服务器S2在线将所述词汇表以及数据字典发送至所述服务器S1,所述服务器S1可以在线接收所述词汇表以及数据字典。
可以理解的是,所述客户端设备B1可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
在实际应用中,进行数据结构设计的部分可以在如上述内容所述的服务器S1侧执行,即,如图1所示的架构,也可以所有的操作都在所述客户端设备B1中完成,且该所述客户端设备B1可以直接与数据库服务器S2进行通信连接。具体可以根据所述客户端设备B1的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备B1中完成,所述客户端设备B1还可以包括处理器,用于进行数据结构设计的具体处理。
所述服务器与所述客户端设备之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
图3示出了本发明实施例的架构原理图。如图3所示,通过企业级数据模型以及存量系统数据结果分析处理后,得到数据字典,用于规范数据对象以及数据结构,规范后的数据结构通过联机接口与联机外围系统进行数据交换,并将规范后的数据结构通过批量接口与后线系统进行共享,以此,实现数据结构标准化。
其中,数据字典收纳字典条目,起到统一数据标准定义和存储的作用,并统领数据结构设计流程。在数据定义和数据结构设计过程中,字典条目的命名需要参照词汇表,数据结构的字典需要引用字典条目。
图4是本发明实施例中的数据结构设计方法的流程示意图一。如图4所示,该数据结构设计方法可以包括以下内容:
步骤S100:获取用户的数据表结构设计请求,所述数据表结构设计请求包括:数据表所属产品的名称、用户自定义的表名以及执行数据标准等级。
其中,执行数据标准等级包括:模块、产品和企业三个等级,限定产品定义数据设计阶段执行标准的等级。产品数据结构设计引用的字典条目的等级,不能低于产品设定的数据设计阶段的标准等级,标准等级由高到低的顺序为:企业级、产品级和模块级。新建系统和旧系统的新增数据项,要求引用企业级字典条目,保证企业数据标准的贯彻。
步骤S200:根据所述用户自定义的表名在预获取的词汇表中获取推荐表名并反馈给用户,以供用户确定最终表名;
具体地,可采用模糊搜索技术在词汇表搜索该自定义的表名,如果词汇表中存在该自定义表名,则将该自定义表名作为最终表名,如果不存在该表名,则将模糊搜索到的相关、相近或者同义词等反馈给用户,供用户选择,帮助用户找到比较规范的表名。
步骤S300:根据所述数据表所属产品的名称以及产品执行数据标准等级,在预加工的数据字典中获取可引用的字典条目并反馈给用户,以供用户选择;
具体地,数据字典包括多个字典条目,所述字典条目包括:数据项名称、编码、类型、长度、业务含义、所属产品、所属模块以及所属数据标准等级。
其中,数据项名称比如可为account_no,即账号的意思,编码为该数据项的可选值,比如,对于性别数据项,编码为男或女;对于account_no的数据项,编码为数字;对于职业的数据项,编码可为老师、公务员、学生、职员等。类型用于表征数据类型,比如数字类型、文字类型、字符类型等。业务含义表征数据项的含义,比如account_no的业务含义是账号,所属产品表征其应用于何种产品中、所属模块表征其应用于何种模块中。
值得说明的是,可引用的字典条目所属产品与数据表所属产品的名称对应,另外,可引用的字典条目的所属数据标准等级不低于执行数据标准等级。
步骤S400:获取并根据用户确定的最终表名、用户选择的字典条目以及所选择的字典条目的顺序生成所述数据表的数据结构;
具体地,根据表名、字典条目以及顺序生成数据结构为本领域常用技术手段,在此不再赘述。
另外,设计出来的数据结构,在数据标准化设计平台存储。
值得说明的是,所述词汇表以及所述数据字典由存量产品和模块的数据结构中得到。即,在设计数据结构时,充分考虑了存量产品和模块的数据结构,另外,通过向用户展示字典条目供用户选择,使得字段都要求引用自数据字典的条目,保证数据结构设计是符合数据标准的。
综上所述,本发明实施例提供的数据结构设计方法,词汇表以及所述数据字典能够自动更新,解决现有数据标准更新滞后于系统发展的问题;另一方面,充分考虑了存量产品和模块,能在兼顾企业旧系统存量数据的特殊情况,循序渐进提高企业数据标准化程度,不必强行按照统一的企业数据标准实施,利于标准化实施。
在一个可选的实施例中,参见图5,该数据结构设计方法还可以包括:
步骤S10:根据存量产品和模块的数据结构获取数据字典。
存量系统已经设计好的数据结构是词汇表和数据字典的重要来源,连接存量产品的数据库环境,读入存量产品和模块的数据结构。
具体地,通过对存量系统现有数据结构的加工分析,得到模块、产品和企业三个级别的字典条目,形成数据字典。
通过引用字典条目进行数据结构设计,本发明同时支持多级别的字典条目,在系统数据设计时遵循相应级别的数据标准,以建立企业级数据标准为最高目标,且能在兼顾企业旧系统存量数据的特殊情况,循序渐进提高企业数据标准化程度。
在一个可选的实施例中,参见图6,该步骤S10可以包括以下内容:
步骤S10a:将所述存量产品和模块的数据结构按照字段中文名称归类获取字典条目清单,所述字典条目清单包括多个字典条目;
具体地,如果存量数据结构存在字段A(英文名称account_no,中文名称“帐号”,数据类型CHAR(16)),经按字段中文名称归类后,得到字典条目account_no,其业务含义是“帐号”,数据类型是CHAR(16)。
步骤S10b:判断所述字典条目清单中的字典条目是否存在模块内冲突;
若否,执行步骤S10c;若是,执行步骤S10i;
具体地,比如存在字段A(英文名称account_no,中文名称“帐号”,数据类型CHAR(16)以及字段B(英文名称account_number,中文名称“帐号”,数据类型CHAR(18),二者都是限定的账号,此时,存在冲突。
步骤S10c:判断所述字典条目清单中的字典条目是否存在跨模块复用;
若否,执行步骤S10d;若是,执行步骤S10e;
具体地,如果模块A有字典条目account_no,同时模块B也有字典条目account_no,它们的中文名称和数据类型都一样,则account_no是跨模块复用。
步骤S10d:将所述字典条目的所属数据标准等级设置为模块级;
步骤S10e:判断所述字典条目是否存在跨产品复用;
若否,执行步骤S10f;若是,执行步骤S10g;
如果产品E有字典条目account_no,同时产品F也有字典条目account_no,它们的中文名称和数据类型都一样,则account_no是跨产品复用。
步骤S10f:将所述字典条目的所属数据标准等级设置为产品级;
步骤S10g:判断所述字典条目是否符合预获取的企业级数据模型标准;
若否,执行步骤S10f;若是,执行步骤S10h;
具体地,也可以称为和企业数据模型对标,具体地,将字典条目的数据类型和企业级数据模型对比,如果和企业级数据模型定义的数据类型一样,则和企业标准相符,纳入更高级的企业字典条目清单;如果不符合,则和企业标准不符合,只能纳入的产品级字典条目清单。
步骤S10h:将所述字典条目的所属数据标准等级设置为企业级;
步骤S10i:将冲突的字典条目返馈给技术人员,以使技术人员对冲突的字典条目进行模块内字段治理。
具体地,如果在模块A的存量数据结构,存在字段A(英文名称account_no,中文名称“帐号”,数据类型CHAR(16)),经按字段中文名称归类后,得到字典条目account_no,其业务含义是“帐号”,数据类型是CHAR(16)。同时,存在字段B(英文名称account_number,中文名称“帐号”,数据类型CHAR(17),经按字段中文名称归类后,得到字典条目account_number,其业务含义是“帐号”,数据类型是CHAR(17)。那该模块就加工出两个字典条目(account_no和account_number),其业务含义都是“帐号”,而且数据类型也不一样。那样,account_no和account_number两个字典条目就冲突,就需要模块修改现有的数据结构,避免上述情况。
值得说明的是,加工出字典条目有三个级别,跨产品复用的字典条目是企业级别的字典条目,需要符合企业数据模型,为最高级别的字典条目;跨模块复用的字典条目是产品级字典条目;模块内使用的字典条目是模块及字典条目。
在字典条目加工过程中,如果模块内相同字段中文名称,对应的字段英文名称不一致,则列出清单,进入模块内字段治理流程;如果判定跨产品复用的字段,数据定义不符合企业数据模型,则列出清单,进入企业级字段治理。具体参见模块内字段治理,在此不再赘述。
通过采用上述技术方案,能够建立相对简洁、完善的数据字典,用于规范数据结构设计,能兼顾企业旧系统存量数据的特殊情况,建立起数据标准体系,并在数据设计中贯彻数据标准,循序渐进提高企业数据标准化程度。
另外,数据字典集中存储,便于企业各产品共享。
在一个可选的实施例中,该数据结构设计方法还可以包括:新增词汇步骤。
具体地,接收用户的新建词汇请求,该新建词汇请求中包括:词汇以及相关词、近义词或上位词或下位词等,将该词汇以及相关词汇存储词汇表中,以完善词汇表。
在一个可选的实施例中,参见图7,该数据结构设计方法还可以包括:
步骤S20:根据存量产品和模块的数据结构获取词汇表。
其中,词汇表包括:多条原子词汇,每个原子词汇包括英文词以及其对应的中文含义。
具体地,参见图8,该步骤S20可以包括以下内容:
步骤S20a:判断所述存量产品和模块的数据结构中各字段的英文名称是否存在分割符,所述字段包括英文名称以及中文名称;
若否,执行步骤S20b;若是,执行步骤S20c;
步骤S20b:将所述英文名称与对应的中文名称对应存储为一条原子词汇;
具体地,比如account、name等单词,不存在分割符,则直接将英文名称与对应的中文名称以key-value的形式存储。
步骤S20c:根据所述分割符对所述英文名称递归截取单词。
例如:account_no,则第一次递归取到account,第二次递归取得no。
步骤S20d:获取单词的中文意思;
为了保证数据的一致性,优先去已经存储的原子词汇中搜索是否存在该英文词,该英文词的中文意思,若不存在,则利用其它手段搜索其中文意思,比如调用英语词典、在线翻译软件等。
步骤S20e:将所述单词与对应的中文意思存储为一条原子词汇。
其中,加工出的词汇表,用于规范新建字典条目的命名,在新建数据字典条目时,需要经过步骤“条目命名符合词汇表”的判断,如果命名不符合词汇表,则需进入步骤“从新命名”。
通过采用上述技术方案,能够对数据字典进行规范化,利于统一数据标准,提高数据一致性。
在一个可选的实施例中,参见图9,该数据结构设计方法还可以包括以下步骤:
步骤S30:获取用户的字典条目创建请求,所述字典条目创建请求包括:数据项名称;
值得说明的是,根据存量系统数据结构创建的数据字典可能会存在数据不全面等问题,因此,设置有新建字典条目的功能,增加了数据结构设计的灵活性。
步骤S40:根据所述词汇表判断所述数据项名称是否满足创建要求;
若是,执行步骤S50;若否,执行步骤S60。
具体地,判断词汇表中是否存在该数据项名称,以利于数据规范化。
步骤S50:根据所述字典条目创建请求新建字典条目并存入所述数据字典。
步骤S60:向所述用户反馈重新命名信息,以使用户根据所述重新命名信息重新输入数据项名称。
在另外一个可选的实施例中,参见图10,与图9中的步骤S30、步骤S40、步骤S50的内容相同,区别在于:
步骤S60’:基于所述词汇表,根据所述数据项名称获取推荐名称并反馈给用户,供用户选择。
具体地,为了增加智能化水平,在数据项名称不满足要求的情况话,可根据词汇表,搜索相关词、近义词、上位词、下位词等,供用户选择,提高用户体验。
在一个可选的实施例中,该数据结构设计方法还可以包括:
定期统计存量系统的数据结构,统计其引用企业级字典条目、产品级字典条目和模块的占比情况,根据各级字典条目引用占比,可以展示企业各产品数据标准化情况。
例如,企业级字典条目的引用比率高的话,说明数据标准化程度高。
图11实施本发明实施例提供的数据结构设计方法的数据标准化设计平台。如图11所述,多级别字典条目进行数据设计的数据标准设计平台有四大模块:系统管理模块、字典维护模块、数据设计模块以及标准分析模块。
具体地,系统管理模块用于维护模块信息,维护产品信息,定义产品进行数据设计时执行的数据标准。
字典维护模块用于加工词汇表、加工数据字典、维护词汇表、维护字典条目。加工词汇表和加工数据字典,是根据数据库中已经存在的旧系统的数据结构,逆向工程得到数据表和字段,并对字段加工得到存量的词汇表和字典条目。字典条目会根据复用情况进行分级。
数据设计模块用于建立数据表,表名由词汇管理模块自动推荐,并将数据字典条目拖拽到数据表容器中,完成数据表的结构设计。然后在平台定义数据表的存储属性,包括分区设计、存储参数设计和索引。
标准分析模块用于统计产品所引用各个级别字典条目的占比。
综上所述,本发明实施例提供的数据结构设计方案,通过对存量系统现有数据结构的加工分析,得到词汇表,用于规范数据命名。通过对存量系统现有数据结构的加工分析,得到模块、产品和企业三个级别的字典条目,形成数据字典。通过引用字典条目进行数据结构设计。同时支持多级别的字典条目,在系统数据设计时遵循相应级别的数据标准,以建立企业级数据标准为最高目标,且能在兼顾企业存量旧系统,循序渐进提高企业数据标准化程度。
其中,在数据结构设计时,产品需要定义其“产品执行数据标准级别”的目标,数据结构设计时,需要参照同级或更高级的字典条目进行数据结构设计。各级别数据标准需要相应范围内传达和贯彻,能较快建立起低级别的标准,将数据标准指导数据设计的流程运作起来,能在相应范围内消除数据歧义,统一数据设计流程;新建系统的设计,严格要求引用企业级字典条目,在旧系统的新需求实施,数据设计也引用企业的字典条目引用,能做到逐步提高整体的数据标准程度;通过建立低级别数据标准和企业级数据标准的映射,可以掌握数据差异,容易并通过额外的数据转换获取到符合标准的数据(例如:如果旧系统的身份证定义为CHAR(20),而企业数据标准定义身份证号是CHAR(18)。经评估旧系统按照企业级数据标准改造工作量大,采取如下措施:建立产品级的字典条目身份证号CHAR(20),同时在该条目的备注栏位注明对应的企业级字典条目的名称)。
其中,通过引用字典条目,产品进行数据设计时,只能引用高于其执行等级的字典条目,保证数据结构的字段符合设定的数据标准目标,既减轻数据设计的工作难度,也保证数据标准在设计阶段的贯彻。另外,通过对存量系统现有数据结构的加工分析,得到词汇表,用于规范数据命名。再者,对每个产品统计其引用的模块、产品和企业的字典条目的占比,对产品数据标准水平进行量化展示,鞭策旧线系统逐步提高数据标准。
基于同一发明构思,本申请实施例还提供了一种数据结构设计装置,可以用于实现上述实施例所描述的方法,如下面的实施例所述。由于数据结构设计装置解决问题的原理与上述方法相似,因此数据结构设计装置的实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图12是本发明实施例中的数据结构设计装置的结构框图。如图12所示,该数据结构设计装置具体包括:设计请求获取模块10、表名推荐模块20、字典条目推荐模块30以及数据结构设计模块40。
设计请求获取模块10获取用户的数据表结构设计请求,所述数据表结构设计请求包括:数据表所属产品的名称、用户自定义的表名以及执行数据标准等级;
表名推荐模块20根据所述用户自定义的表名在预获取的词汇表中获取推荐表名并反馈给用户,以供用户确定最终表名;
字典条目推荐模块30根据所述数据表所属产品的名称以及产品执行数据标准等级,在预加工的数据字典中获取可引用的字典条目并反馈给用户,以供用户选择;
数据结构设计模块40获取并根据用户确定的最终表名、用户选择的字典条目以及所选择的字典条目的顺序生成所述数据表的数据结构;
其中,所述词汇表以及所述数据字典由存量产品和模块的数据结构中得到。
综上所述,本发明实施例提供的数据结构设计装置,词汇表以及所述数据字典能够自动更新,解决现有数据标准更新滞后于系统发展的问题;另一方面,充分考虑了存量产品和模块,能在兼顾企业旧系统存量数据的特殊情况,循序渐进提高企业数据标准化程度,不必强行按照统一的企业数据标准实施,利于标准化实施。
在一个可选的实施例中,数据结构设计装置还包括:数据字典获取模块,根据存量产品和模块的数据结构获取数据字典;
其中,所述数据字典包括多个字典条目,所述字典条目包括:数据项名称、编码、类型、长度、业务含义、所属产品、所属模块以及所属数据标准等级。
在一个可选的实施例中,数据字典获取模块包括:条目清单获取单元、冲突判断单元、跨模块复用判断单元、第一等级设置单元、跨产品复用判断单元、第二等级设置单元、对标单元、第三等级设置单元以及第四等级设置单元。
条目清单获取单元,将所述存量产品和模块的数据结构按照字段中文名称归类获取字典条目清单,所述字典条目清单包括多个字典条目;
冲突判断单元,判断所述字典条目清单中的字典条目是否存在模块内冲突;
跨模块复用判断单元,若字典条目清单中的字典条目不存在模块内冲突,判断所述字典条目清单中的字典条目是否存在跨模块复用;
第一等级设置单元,若字典条目清单中的字典条目不存在跨模块复用,则将所述字典条目的所属数据标准等级设置为模块级;
跨产品复用判断单元,若字典条目清单中的字典条目存在跨模块复用,则进一步判断所述字典条目是否存在跨产品复用;
第二等级设置单元,若字典条目不存在跨产品复用,则将所述字典条目的所属数据标准等级设置为产品级;
对标单元,若字典条目存在跨产品复用,则进一步判断所述字典条目是否符合预获取的企业级数据模型标准;
第三等级设置单元,若字典条目符合预获取的企业级数据模型标准,则将所述字典条目的所属数据标准等级设置为企业级;
第四等级设置单元,若字典条目不符合预获取的企业级数据模型标准,则将所述字典条目的所属数据标准等级设置为产品级。
在一个可选的实施例中,所述数据字典获取模块还包括:治理单元,若字典条目清单中的字典条目存在模块内冲突,则将冲突的字典条目返馈给技术人员,以使技术人员对冲突的字典条目进行模块内字段治理。
在一个可选的实施例中,数据结构设计装置还包括:词汇表获取模块,根据存量产品和模块的数据结构获取词汇表。
在一个可选的实施例汇总,所述词汇表包括:多条原子词汇;所述词汇表获取模块包括:分割符判断单元、原子词汇存储单元以及截词存储单元。
分割符判断单元,判断所述存量产品和模块的数据结构中各字段的英文名称是否存在分割符,所述字段包括英文名称以及中文名称;
原子词汇存储单元,若字段的英文名称不存在分割符,将所述英文名称与对应的中文名称对应存储为一条原子词汇;
截词存储单元,若字段的英文名称存在分割符,根据所述分割符对所述英文名称递归截取单词,并获取单词的中文意思,将所述单词与对应的中文意思存储为一条原子词汇。
在一个可选的实施例中,数据结构设计装置还包括:创建请求获取模块、创建判断模块以及字典条目创建模块。
创建请求获取模块,获取用户的字典条目创建请求,所述字典条目创建请求包括:数据项名称;
创建判断模块,根据所述词汇表判断所述数据项名称是否满足创建要求;
字典条目创建模块,若数据项名称满足创建要求,根据所述字典条目创建请求新建字典条目并存入所述数据字典。
在一个可选的实施例中,数据结构设计装置还包括:重命名模块,若所述数据项名称不满足创建要求,向所述用户反馈重新命名信息,以使用户根据所述重新命名信息重新输入数据项名称。
在一个可选的实施例中,数据结构设计装置还包括:
数据项名称推荐模块,若所述数据项名称不满足创建要求,基于所述词汇表,根据所述数据项名称获取推荐名称并反馈给用户,供用户选择。
上述实施例阐明的装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为电子设备,具体的,电子设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
在一个典型的实例中电子设备具体包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现下述步骤:
获取用户的数据表结构设计请求,所述数据表结构设计请求包括:数据表所属产品的名称、用户自定义的表名以及执行数据标准等级;
根据所述用户自定义的表名在预获取的词汇表中获取推荐表名并反馈给用户,以供用户确定最终表名;
根据所述数据表所属产品的名称以及产品执行数据标准等级,在预加工的数据字典中获取可引用的字典条目并反馈给用户,以供用户选择;
获取并根据用户确定的最终表名、用户选择的字典条目以及所选择的字典条目的顺序生成所述数据表的数据结构;
其中,所述词汇表以及所述数据字典由存量产品和模块的数据结构中得到。
从上述描述可知,本发明实施例提供的电子设备,可用于数据结构设计,词汇表以及所述数据字典能够自动更新,解决现有数据标准更新滞后于系统发展的问题;另一方面,充分考虑了存量产品和模块,能在兼顾企业旧系统存量数据的特殊情况,循序渐进提高企业数据标准化程度,不必强行按照统一的企业数据标准实施,利于标准化实施。
下面参考图13,其示出了适于用来实现本申请实施例的电子设备600的结构示意图。
如图13所示,电子设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM))603中的程序而执行各种适当的工作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602、以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡,调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装如存储部分608。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现下述步骤:
获取用户的数据表结构设计请求,所述数据表结构设计请求包括:数据表所属产品的名称、用户自定义的表名以及执行数据标准等级;
根据所述用户自定义的表名在预获取的词汇表中获取推荐表名并反馈给用户,以供用户确定最终表名;
根据所述数据表所属产品的名称以及产品执行数据标准等级,在预加工的数据字典中获取可引用的字典条目并反馈给用户,以供用户选择;
获取并根据用户确定的最终表名、用户选择的字典条目以及所选择的字典条目的顺序生成所述数据表的数据结构;
其中,所述词汇表以及所述数据字典由存量产品和模块的数据结构中得到。
从上述描述可知,本发明实施例提供的计算机可读存储介质,可用于数据结构设计,词汇表以及所述数据字典能够自动更新,解决现有数据标准更新滞后于系统发展的问题;另一方面,充分考虑了存量产品和模块,能在兼顾企业旧系统存量数据的特殊情况,循序渐进提高企业数据标准化程度,不必强行按照统一的企业数据标准实施,利于标准化实施。
在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (20)

1.一种数据结构设计方法,其特征在于,包括:
获取用户的数据表结构设计请求,所述数据表结构设计请求包括:数据表所属产品的名称、用户自定义的表名以及产品执行数据标准等级;
根据所述用户自定义的表名在预获取的词汇表中获取推荐表名并反馈给用户,以供用户确定最终表名;
根据所述数据表所属产品的名称以及所述执行数据标准等级在预加工的数据字典中获取可引用的字典条目并反馈给用户,以供用户选择;
获取并根据用户确定的最终表名、用户选择的字典条目以及所选择的字典条目的顺序生成所述数据表的数据结构;
其中,所述词汇表以及所述数据字典由存量产品和模块的数据结构中得到。
2.根据权利要求1所述的数据结构设计方法,其特征在于,还包括:
根据存量产品和模块的数据结构获取数据字典;
其中,所述数据字典包括多个字典条目,所述字典条目包括:数据项名称、编码、类型、长度、业务含义、所属产品、所属模块以及所属数据标准等级。
3.根据权利要求2所述的数据结构设计方法,其特征在于,所述根据存量产品和模块的数据结构获取数据字典,包括:
将所述存量产品和模块的数据结构按照字段中文名称归类,获取字典条目清单,所述字典条目清单包括多个字典条目;
判断所述字典条目清单中的字典条目是否存在模块内冲突;
若否,判断所述字典条目清单中的字典条目是否存在跨模块复用;
若字典条目清单中的字典条目不存在跨模块复用,则将所述字典条目的所属数据标准等级设置为模块级;
若字典条目清单中的字典条目存在跨模块复用,则进一步判断所述字典条目是否存在跨产品复用;
若字典条目不存在跨产品复用,则将所述字典条目的所属数据标准等级设置为产品级;
若字典条目存在跨产品复用,则进一步判断所述字典条目是否符合预获取的企业级数据模型标准;
若字典条目符合预获取的企业级数据模型标准,则将所述字典条目的所属数据标准等级设置为企业级;
若字典条目不符合预获取的企业级数据模型标准,则将所述字典条目的所属数据标准等级设置为产品级。
4.根据权利要求3所述的数据结构设计方法,其特征在于,所述根据存量产品和模块的数据结构获取数据字典,还包括:
若字典条目清单中的字典条目存在模块内冲突,则将冲突的字典条目返馈给技术人员,以使技术人员对冲突的字典条目进行模块内字段治理。
5.根据权利要求1所述的数据结构设计方法,其特征在于,还包括:
根据存量产品和模块的数据结构获取词汇表。
6.根据权利要求5所述的数据结构设计方法,其特征在于,所述词汇表包括:多条原子词汇;
所述根据存量产品和模块的数据结构获取词汇表,包括:
判断所述存量产品和模块的数据结构中各字段的英文名称是否存在分割符,所述字段包括英文名称以及中文名称;
若否,将所述英文名称与对应的中文名称对应存储为一条原子词汇;
若是,根据所述分割符对所述英文名称递归截取单词,并获取单词的中文意思,将所述单词与对应的中文意思存储为一条原子词汇。
7.根据权利要求1所述的数据结构设计方法,其特征在于,还包括:
获取用户的字典条目创建请求,所述字典条目创建请求包括:数据项名称;
根据所述词汇表判断所述数据项名称是否满足创建要求;
若是,根据所述字典条目创建请求新建字典条目并存入所述数据字典。
8.根据权利要求7所述的数据结构设计方法,其特征在于,还包括:
若所述数据项名称不满足创建要求,向所述用户反馈重新命名信息,以使用户根据所述重新命名信息重新输入数据项名称。
9.根据权利要求7所述的数据结构设计方法,其特征在于,还包括:
若所述数据项名称不满足创建要求,基于所述词汇表,根据所述数据项名称获取推荐名称并反馈给用户,供用户选择。
10.一种数据结构设计装置,其特征在于,包括:
设计请求获取模块,获取用户的数据表结构设计请求,所述数据表结构设计请求包括:数据表所属产品的名称、用户自定义的表名以及执行数据标准等级;
表名推荐模块,根据所述用户自定义的表名在预获取的词汇表中获取推荐表名并反馈给用户,以供用户确定最终表名;
字典条目推荐模块,根据所述数据表所属产品的名称以及产品执行数据标准等级,在预加工的数据字典中获取可引用的字典条目并反馈给用户,以供用户选择;
数据结构设计模块,获取并根据用户确定的最终表名、用户选择的字典条目以及所选择的字典条目的顺序生成所述数据表的数据结构;
其中,所述词汇表以及所述数据字典由存量产品和模块的数据结构中得到。
11.根据权利要求10所述的数据结构设计装置,其特征在于,还包括:
数据字典获取模块,根据存量产品和模块的数据结构获取数据字典;
其中,所述数据字典包括多个字典条目,所述字典条目包括:数据项名称、编码、类型、长度、业务含义、所属产品、所属模块以及所属数据标准等级。
12.根据权利要求11所述的数据结构设计装置,其特征在于,所述数据字典获取模块包括:
条目清单获取单元,将所述存量产品和模块的数据结构按照字段中文名称归类获取字典条目清单,所述字典条目清单包括多个字典条目;
冲突判断单元,判断所述字典条目清单中的字典条目是否存在模块内冲突;
跨模块复用判断单元,若字典条目清单中的字典条目不存在模块内冲突,判断所述字典条目清单中的字典条目是否存在跨模块复用;
第一等级设置单元,若字典条目清单中的字典条目不存在跨模块复用,则将所述字典条目的所属数据标准等级设置为模块级;
跨产品复用判断单元,若字典条目清单中的字典条目存在跨模块复用,则进一步判断所述字典条目是否存在跨产品复用;
第二等级设置单元,若字典条目不存在跨产品复用,则将所述字典条目的所属数据标准等级设置为产品级;
对标单元,若字典条目存在跨产品复用,则进一步判断所述字典条目是否符合预获取的企业级数据模型标准;
第三等级设置单元,若字典条目符合预获取的企业级数据模型标准,则将所述字典条目的所属数据标准等级设置为企业级;
第四等级设置单元,若字典条目不符合预获取的企业级数据模型标准,则将所述字典条目的所属数据标准等级设置为产品级。
13.根据权利要求12所述的数据结构设计装置,其特征在于,所述数据字典获取模块还包括:
治理单元,若字典条目清单中的字典条目存在模块内冲突,则将冲突的字典条目返馈给技术人员,以使技术人员对冲突的字典条目进行模块内字段治理。
14.根据权利要求10所述的数据结构设计装置,其特征在于,还包括:
词汇表获取模块,根据存量产品和模块的数据结构获取词汇表。
15.根据权利要求14所述的数据结构设计装置,其特征在于,所述词汇表包括:多条原子词汇;
所述词汇表获取模块包括:
分割符判断单元,判断所述存量产品和模块的数据结构中各字段的英文名称是否存在分割符,所述字段包括英文名称以及中文名称;
原子词汇存储单元,若字段的英文名称不存在分割符,将所述英文名称与对应的中文名称对应存储为一条原子词汇;
截词存储单元,若字段的英文名称存在分割符,根据所述分割符对所述英文名称递归截取单词,并获取单词的中文意思,将所述单词与对应的中文意思存储为一条原子词汇。
16.根据权利要求10所述的数据结构设计装置,其特征在于,还包括:
创建请求获取模块,获取用户的字典条目创建请求,所述字典条目创建请求包括:数据项名称;
创建判断模块,根据所述词汇表判断所述数据项名称是否满足创建要求;
字典条目创建模块,若数据项名称满足创建要求,根据所述字典条目创建请求新建字典条目并存入所述数据字典。
17.根据权利要求16所述的数据结构设计装置,其特征在于,还包括:
重命名模块,若所述数据项名称不满足创建要求,向所述用户反馈重新命名信息,以使用户根据所述重新命名信息重新输入数据项名称。
18.根据权利要求16所述的数据结构设计装置,其特征在于,还包括:
数据项名称推荐模块,若所述数据项名称不满足创建要求,基于所述词汇表,根据所述数据项名称获取推荐名称并反馈给用户,供用户选择。
19.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至9任一项所述的数据结构设计方法的步骤。
20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至9任一项所述的数据结构设计方法的步骤。
CN201911352551.3A 2019-12-25 2019-12-25 数据结构设计方法和装置 Active CN110990412B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911352551.3A CN110990412B (zh) 2019-12-25 2019-12-25 数据结构设计方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911352551.3A CN110990412B (zh) 2019-12-25 2019-12-25 数据结构设计方法和装置

Publications (2)

Publication Number Publication Date
CN110990412A true CN110990412A (zh) 2020-04-10
CN110990412B CN110990412B (zh) 2023-09-19

Family

ID=70076488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911352551.3A Active CN110990412B (zh) 2019-12-25 2019-12-25 数据结构设计方法和装置

Country Status (1)

Country Link
CN (1) CN110990412B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930769A (zh) * 2020-09-18 2020-11-13 四川鱼鳞图信息技术股份有限公司 一种土地信息管理系统的数据配置方法及系统
CN113204558A (zh) * 2021-05-25 2021-08-03 城云科技(中国)有限公司 数据表结构自动更新方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090241102A1 (en) * 2008-03-20 2009-09-24 Inventec Corporation Method for updating electronic dictionary
CN101930443A (zh) * 2009-06-22 2010-12-29 金蝶软件(中国)有限公司 数据业务系统及数据业务实现方法
CN102541867A (zh) * 2010-12-15 2012-07-04 金蝶软件(中国)有限公司 数据字典生成方法及系统
CN104915383A (zh) * 2015-05-19 2015-09-16 中国电子科技集团公司第二十八研究所 一种通用数据库访问中自动适配对象的方法
CN109299288A (zh) * 2018-11-09 2019-02-01 北京锐安科技有限公司 字典数据的读取方法、装置、服务器和存储介质
CN110287193A (zh) * 2019-06-27 2019-09-27 深圳前海微众银行股份有限公司 一种文件生成方法、装置、设备及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090241102A1 (en) * 2008-03-20 2009-09-24 Inventec Corporation Method for updating electronic dictionary
CN101930443A (zh) * 2009-06-22 2010-12-29 金蝶软件(中国)有限公司 数据业务系统及数据业务实现方法
CN102541867A (zh) * 2010-12-15 2012-07-04 金蝶软件(中国)有限公司 数据字典生成方法及系统
CN104915383A (zh) * 2015-05-19 2015-09-16 中国电子科技集团公司第二十八研究所 一种通用数据库访问中自动适配对象的方法
CN109299288A (zh) * 2018-11-09 2019-02-01 北京锐安科技有限公司 字典数据的读取方法、装置、服务器和存储介质
CN110287193A (zh) * 2019-06-27 2019-09-27 深圳前海微众银行股份有限公司 一种文件生成方法、装置、设备及计算机可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930769A (zh) * 2020-09-18 2020-11-13 四川鱼鳞图信息技术股份有限公司 一种土地信息管理系统的数据配置方法及系统
CN113204558A (zh) * 2021-05-25 2021-08-03 城云科技(中国)有限公司 数据表结构自动更新方法和装置
CN113204558B (zh) * 2021-05-25 2023-05-26 城云科技(中国)有限公司 数据表结构自动更新方法和装置

Also Published As

Publication number Publication date
CN110990412B (zh) 2023-09-19

Similar Documents

Publication Publication Date Title
US11132501B2 (en) Smart column selection for table operations in data preparation
CN109344170B (zh) 流数据处理方法、系统、电子设备及可读存储介质
CN110990412A (zh) 数据结构设计方法和装置
CN111290813B (zh) 一种软件界面字段数据标准化的方法、装置、设备和介质
US11475064B2 (en) System and method in a database system for creating a field service work order
US9654522B2 (en) Methods and apparatus for an integrated incubation environment
CN112417004A (zh) 一种实体关系图谱构建的方法和装置
CN111651488A (zh) 数据库的业务处理方法、装置、介质及电子设备
CN112905677A (zh) 数据处理方法及装置、业务处理系统和计算机设备
CN111209281A (zh) 年金数据处理方法、装置、介质及电子设备
CN115543428A (zh) 一种基于策略模板的模拟数据生成方法和装置
CN114064775A (zh) 资源池预选方法和装置
CN114428913A (zh) 数据管理方法、装置、设备及存储介质
CN113487224A (zh) 内容处理方法、装置、设备、介质以及程序产品
US10795694B1 (en) System and method for automating workflow applications utilizing routes
CN113077352B (zh) 基于用户信息和保险相关信息的保险服务物品推荐方法
CN114579572A (zh) 数据表定级方法、装置、设备、介质和程序产品
CN115292564A (zh) 一种动态展示数据的方法、装置、设备及存储介质
CN114356884A (zh) 数据迁移方法和装置
CN114020803A (zh) 一种报表生成方法、装置、计算机设备和存储介质
CN115080606A (zh) 业务数据查询方法、装置、设备及介质
CN116450977A (zh) H5端与原生应用解耦方法、装置、设备及存储介质
CN114218240A (zh) 数据变更方法、装置、设备、介质和程序产品
CN118093515A (zh) 数据处理方法、装置、设备、介质和程序产品
CN118093941A (zh) 映射文件生成方法、装置、设备、存储介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant