CN116257636A - 枚举数据字典统一管理方法、装置、电子设备及存储介质 - Google Patents

枚举数据字典统一管理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116257636A
CN116257636A CN202310121603.6A CN202310121603A CN116257636A CN 116257636 A CN116257636 A CN 116257636A CN 202310121603 A CN202310121603 A CN 202310121603A CN 116257636 A CN116257636 A CN 116257636A
Authority
CN
China
Prior art keywords
enumeration
data
sets
dictionary
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310121603.6A
Other languages
English (en)
Inventor
邹广宇
霍福望
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinao Shuneng Technology Co Ltd
Original Assignee
Xinao Shuneng Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinao Shuneng Technology Co Ltd filed Critical Xinao Shuneng Technology Co Ltd
Priority to CN202310121603.6A priority Critical patent/CN116257636A/zh
Publication of CN116257636A publication Critical patent/CN116257636A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及枚举字典管理技术领域,特别涉及一种枚举数据字典统一管理方法、装置、电子设备及存储介质,其中,方法包括:获取各业务领域主数据的数据标准;根据数据标准创建各业务领域的枚举集和枚举集内的枚举成员,根据枚举集之间的业务依赖关系构建枚举集层面的横向树,根据枚举成员之间的层级关系构建枚举集内枚举成员层级关系的纵向树;根据纵向树和纵向树生成多元关系结构,通过多元关系结构提供一个或多个数据接口,利用一个或多个数据接口管理枚举数据字典。由此,解决了相关技术中平台内多业务域之间数据映射混乱,标准不一致、维护难度大等问题。

Description

枚举数据字典统一管理方法、装置、电子设备及存储介质
技术领域
本申请涉及枚举字典管理技术领域,特别涉及一种枚举数据字典统一管理方法、装置、电子设备及存储介质。
背景技术
在数学和计算机科学理论中,一个集的枚举是列出某些有穷序列集的所有成员的程序,或者是一种特定类型对象的计数。枚举在C/C++/C#中是一个被命名的整型常数的集合。在主数据模型中,主数据的基础属性及标签均是枚举,当主数据的基础属性或标签在其他数据中有应用或逻辑需求时,枚举一般以数据字典的方式进行存储和管理。在大型企业和产业互联网场景中,随着越来越多的业务域信息产生在交集及汇总,传统的数据建模方式,造成主数据及实体对象之间的复杂关系和数据统计时访问链路变长、枚举数据映射频繁不易管理,因此造成产业互联网下的多领域数据交互复杂、冗余、易错。
目前云平台、数据中心以及大型企业集成信息化,在数字化转型或业务变迁等场景下,相关技术一般是采用统一信息模型的方案进行数据一致性技改和约束,然而相关技术对原有系统架构的影响大渗透性强,改造周期长,不符合快速变革的周期需求,且技术与业务路线矛盾较大。
发明内容
本申请提供一种枚举数据字典统一管理方法、装置、电子设备及存储介质,以解决相关技术中平台内多业务域之间数据映射混乱,标准不一致、维护难度大等问题。
本申请第一方面实施例提供一种枚举数据字典统一管理方法,包括以下步骤:获取各业务领域主数据的数据标准;根据所述数据标准创建各业务领域的枚举集和所述枚举集内的枚举成员,根据枚举集之间的业务依赖关系构建枚举集层面的横向树,根据枚举成员之间的层级关系构建枚举集内枚举成员层级关系的纵向树;根据所述纵向树和所述纵向树生成多元关系结构,通过多元关系结构提供一个或多个数据接口,利用所述一个或多个数据接口管理枚举数据字典。
可选地,在本申请的一个实施例中,所述根据所述数据标准创建各业务领域的枚举集和所述枚举集内的枚举成员,包括:根据枚举集名称和唯一编码创建各业务领域的枚举集;根据值编码、编码类型和枚举成员名称在枚举集内创建枚举成员。
可选地,在本申请的一个实施例中,在存储枚举数据时,存储所述枚举集和枚举值编码。
可选地,在本申请的一个实施例中,在根据所述数据标准创建各业务领域的枚举集和所述枚举集内的枚举成员之后,还包括:根据校验映射值编号和映射值名称创建枚举集的枚举变种,其中,所述枚举变种与所述枚举集存在1:N关系。
可选地,在本申请的一个实施例中,所述根据枚举集之间的业务依赖关系构建枚举集层面的横向树,包括;获取枚举成员的标签数据;根据所述标签数据建立枚举集之间的业务依赖关系;基于所述业务依赖关系构建跨枚举集之间的枚举成员父子关系,根据所述枚举成员父子关系生成所述枚举集层面的横向树。
可选地,在本申请的一个实施例中,所述利用所述一个或多个数据接口管理枚举数据字典,包括:获取所述枚举数据字典的管理请求;根据所述管理请求调用所述一个或多个数据接口,以调用或引用枚举集和/或枚举变种。
可选地,在本申请的一个实施例中,还包括;建立联想搜索工具,利用所述联想搜索工具检索和关联性查看枚举字典;支撑多维数据汇聚工具和主数据属性治理工具,利用所述多维数据汇聚工具和所述主数据属性治理工具进行数据治理和多维数据分析业务。
本申请第二方面实施例提供一种枚举数据字典统一管理装置,包括:获取模块,用于获取各业务领域主数据的数据标准;第一创建模块,用于根据所述数据标准创建各业务领域的枚举集和所述枚举集内的枚举成员,根据枚举集之间的业务依赖关系构建枚举集层面的横向树,根据枚举成员之间的层级关系构建枚举集内枚举成员层级关系的纵向树;管理模块,用于根据所述纵向树和所述纵向树生成多元关系结构,通过多元关系结构提供一个或多个数据接口,利用所述一个或多个数据接口管理枚举数据字典。
可选地,在本申请的一个实施例中,所述第一创建模块进一步用于根据枚举集名称和唯一编码创建各业务领域的枚举集;根据值编码、编码类型和枚举成员名称在枚举集内创建枚举成员。
可选地,在本申请的一个实施例中,还包括:存储模块,用于在存储枚举数据时,存储所述枚举集和枚举值编码。
可选地,在本申请的一个实施例中,还包括:第二创建模块,用于在根据所述数据标准创建各业务领域的枚举集和所述枚举集内的枚举成员之后,根据校验映射值编号和映射值名称创建枚举集的枚举变种,其中,所述枚举变种与所述枚举集存在1:N关系。
可选地,在本申请的一个实施例中,所述第一创建模块进一步用于获取枚举成员的标签数据;根据所述标签数据建立枚举集之间的业务依赖关系;基于所述业务依赖关系构建跨枚举集之间的枚举成员父子关系,根据所述枚举成员父子关系生成所述枚举集层面的横向树。
可选地,在本申请的一个实施例中,所述管理模块进一步用于获取所述枚举数据字典的管理请求;根据所述管理请求调用所述一个或多个数据接口,以调用或引用枚举集和/或枚举变种。
可选地,在本申请的一个实施例中,还包括:建立模块,用于建立联想搜索工具,利用所述联想搜索工具检索和关联性查看枚举字典;支撑模块,用于支撑多维数据汇聚工具和主数据属性治理工具,利用所述多维数据汇聚工具和所述主数据属性治理工具进行数据治理和多维数据分析业务。
本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的枚举数据字典统一管理方法。
本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如上述实施例所述的枚举数据字典统一管理方法。
由此,本申请至少具有如下有益效果:
本申请实施例可以依据各业务领域主数据的数据标准创建需用的枚举集及其所含的枚举成员,并由枚举成员业务关系构建横向树,由枚举集内的枚举成员层级关系构建纵向树,实现枚举集遵循多业务域需求进行引用关系嵌套的能力,实现统一的业务统计关系,进而支持多层的加工和逻辑判断,降低主数据爆炸式增长的数字化转型难度,减少应用层的逻辑复杂程度和维护难度;通过多元关系结构提供多种数据接口管理枚举数据字典,满足多种场景的枚举数据及枚举关系数据应用,提高数据交互效率,支撑新业务、新主数据拓展的平台快速跃迁,降低数据治理难度,降低过渡期间的影响。由此,解决了相关技术中平台内多业务域之间数据映射混乱,标准不一致、维护难度大等问题。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请实施例提供的主数据属性映射示意图;
图2为根据本申请实施例提供的统一信息模型管理方案示意图;
图3为根据本申请实施例提供的一种枚举数据字典统一管理方法的流程图;
图4为根据本申请实施例提供的能源使用类型分类示例图;
图5为根据本申请实施例提供的枚举集间的依赖关系示意图;
图6为根据本申请实施例提供的枚举数据统一管理示意图;
图7为根据本申请实施例提供的枚举字典管理流程图;
图8为根据本申请实施例提供的枚举数据清洗流程图;
图9为根据本申请实施例提供的枚举数据字典统一管理装置的方框示意图;
图10为根据本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
为支撑多系统、多主数据的属性数据不一致的映射关系,以及平台或数据中心的枚举类数据清洗问题,常见的技术方案有两种,详细介绍如下:
1)主数据属性映射
各主数据之间进行主数据属性的映射,保证两个主数据系统之间的数据互通,如图1所示,主要包括:一、利用数据库能力,写sql使用where语句的“=”、“like”或特定函数来去重数据,人工比较后写sql直接进行映射关系的更新;二、利用excel等工具进行人工去重比对并与标准主数据建立映射关系,然后直接导入到系统。三、利用模糊算法,通过文字模糊匹配,将两个主数据的属性进行匹配之后再纠错。
2)统一信息模型管理方案
建立元数据管理及统一信息模型管理,各主数据的建设必须强制依据统一的信息模型,不能出现个性化的信息模型。在SAAS层、数据中心等数据访问方,也都依据统一信息模型去各主数据获取数据。代表性的技术方案是城市信息模型管理系统,如图2所示。
然而相关技术在当前业务越来越庞大的产业互联网平台来说,在枚举数据字典的设计上,存在以下几点问题:
(1)平台内各系统甚至是各数据模型单元,各自建立独自的数据字典,造成同一个枚举集需要在平台各系统多处维护,并且数据交互时必须做数据映射,既增加了大量冗余逻辑,又难以管理和排查问题。
(2)一般的数据结构,统计关系依赖于数据对象之间的关系,枚举集和枚举集之间不存在业务关系。因此,进行跨业务域统计时,常用的两种处理方法是,一是要建设大量的主数据对象及其关系;二是在统计逻辑中内置复杂且有可能变化的统计关系。无论那种方法,均造成软件系统结构的复杂以及开发、配置工作量大,并且统一规范难度大。
(3)当枚举集变化(例如国民经济行业分类、产业的更新),需要维护多处数据和映射逻辑,规模越大的系统,复杂度越高,出错率越高,维护难度越大。
(4)主数据映射方案,系统耦合性低,扩展性强,优势是在于与其他系统、或其他数据标准对接相对简单,缺点在于随着平台纳入到系统或主数据越来越多,映射关系的管理难度成几何增长,逻辑代码量冗余难维护。
(5)统一信息模型方案,系统耦合性非常高,扩展性差,优势在于管理相对简单,数据治理和数据分析逻辑较清晰不冗余,但缺点在于新对接系统或新增标准的周期较长,在业务快速增长和变革跃迁时难度大,且无法轻量级部署。
下面参考附图描述本申请实施例的枚举数据字典统一管理方法、装置、电子设备及存储介质。针对上述背景技术中提到问题,本申请提供了一种枚举数据字典统一管理方法,在该方法中,依据各业务领域主数据的数据标准创建需用的枚举集及其所含的枚举成员,并由枚举成员业务关系构建横向树,由枚举集内的枚举成员层级关系构建纵向树,实现枚举集遵循多业务域需求进行引用关系嵌套的能力,实现统一的业务统计关系,进而支持多层的加工和逻辑判断,降低主数据爆炸式增长的数字化转型难度,减少应用层的逻辑复杂程度和维护难度。通过多元关系结构提供多种数据接口管理枚举数据字典,满足多种场景的枚举数据及枚举关系数据应用,提高数据交互效率,支撑新业务、新主数据拓展的平台快速跃迁,降低数据治理难度,降低过渡期间的影响。由此,解决了相关技术平台内多业务域之间数据映射混乱,标准不一致、维护难度大等问题。
具体而言,图3为本申请实施例所提供的一种枚举数据字典统一管理方法的流程示意图。
如图3所示,该枚举数据字典统一管理方法包括以下步骤:
在步骤S101中,获取各业务领域主数据的数据标准。
在本申请实施例中,主数据是企业内跨业务、能共享的高价值核心业务实体,是企业的关键数据,例如:人员、产品、供应商、物料等。本申请实施例的枚举数据字典统一管理方法主要用于元数据管理层,衔接各主数据属性之间的映射变种、业务关系,首先通过获取各业务领域主数据的数据标准,以创建需用的枚举集及其所含的枚举成员,以便后续进行枚举数据及其之间的业务天然关系的统一管理。
在步骤S102中,根据数据标准创建各业务领域的枚举集和枚举集内的枚举成员,根据枚举集之间的业务依赖关系构建枚举集层面的横向树,根据枚举成员之间的层级关系构建枚举集内枚举成员层级关系的纵向树。
可以理解的是,本申请实施例可以枚举集之间的枚举成员,通过枚举成员标签的方式建立单向业务关系,并因此在枚举集层面构建横向树关系,与枚举集内部的枚举成员纵向树结构,形成复杂有序的有限知识关联结构。尤其适合能源、安全、低碳等业务维度和对象分类方式较多的知识领域。当业务领域下的枚举集数量足够之后,本申请实施例可以为枚举成员添加标签,标签来自其他枚举集的枚举成员,形成枚举成员之间的业务依赖关系,以及枚举成员的跨集包含关系。枚举成员业务关系存在1:N的关系,便于主数据属性之间的业务有效性校验及多维度数据统计。
在本申请的一个实施例中,根据数据标准创建各业务领域的枚举集和枚举集内的枚举成员,包括:根据枚举集名称和唯一编码创建各业务领域的枚举集;根据值编码、编码类型和枚举成员名称在枚举集内创建枚举成员。
在本申请实施例中,枚举集的编码具有唯一性,不能重复,本申请实施例可以根据枚举集名称和唯一编码创建各业务领域的枚举集,实现枚举集的统一管理,而且在同一个枚举集中,枚举成员的值编码、枚举成员名称是具有唯一性且不能为空,既是该成员已经失效,也不允许值编码重复。因此,本申请实施例可以根据值编码、编码类型和枚举成员名称在枚举集内创建枚举成员。其中,枚举集中包含N个枚举成员(N为有穷数量)。枚举成员的标签是非必填项,可填标签必须是其他枚举集的有效枚举成员,仅可通过选择的方式,不允许自由填写,增加/删除标签。枚举成员的标签的数量无限制,但不允许出现两个标签均来自同一个枚举集。标签存储信息必须包含枚举集信息,且在存储枚举数据时,可以存储枚举集和枚举值编码。举例而言,如表1和表2所示的样例表,其中,表1为枚举集主要数据样例表,表2为枚举成员主要数据样例表。
表1
Figure BDA0004080129470000061
表2
Figure BDA0004080129470000062
需要说明的是,本申请实施例枚举集及其成员的管理,也可以通过数据字典的方案进行实现,此处不进行赘述。
在本申请的一个实施例中,根据枚举集之间的业务依赖关系构建枚举集层面的横向树,包括;获取枚举成员的标签数据;根据标签数据建立枚举集之间的业务依赖关系;基于业务依赖关系构建跨枚举集之间的枚举成员父子关系,根据枚举成员父子关系生成枚举集层面的横向树。
针对能源、安全、低碳等业务领域场景中,对能源类型、安全等级、行业分类等复杂多维属性之间的复杂的业务关系,本申请实施例设计了枚举成员业务关系模块,并采用枚举成员单向嵌套的方法实现。例如,能源按产生分类有一次能源和二次能源,一次能源有分可再生能源(水能、风能及生物质能)和非再生能源(煤炭、石油、天然气等);按污染分类,可分为污染性能源、清洁能源。按使用类型,有分常规能源和新能源,如图4所示。部分分类之间有单向业务关系。因此,先设定基础分类,能源品种,是按物质的构成进行分类,煤、石油、天然气等。再对能源品类这个枚举集进行能源生产分类、污染性质分类、可再生性分类等等。
具体而言,本申请实施例可以通过枚举成员的标签数据,建立了枚举集之间的依赖关系,如图5所示的样例,并根据枚举集间的依赖关系,可以构建出跨枚举集的枚举成员树形结构,用于实现业务逻辑的统计,以满足业务应用层的多维度数据分析统计需求,进而支持多层的加工和逻辑判断,降低主数据爆炸式增长的数字化转型难度,减少应用层的逻辑复杂程度和维护难度。例如,输入跨集结构指令访问指令:
输入:上级枚举集、下级枚举集,如图5所示的样例,其中上级枚举集=能源技术程度,下级枚举集=能源品种。
条件校验:下级枚举集依赖上级枚举集。
输出:上级枚举集枚举成员作为父级,下级枚举集枚举成员作为子级的属性结构。
在步骤S103中,根据纵向树和纵向树生成多元关系结构,通过多元关系结构提供一个或多个数据接口,利用一个或多个数据接口管理枚举数据字典。
本申请实施例可以根据枚举集+枚举成员、枚举集变种+成员变种、枚举成员业务关系,构建出横向树和纵向树的多元关系结构,通过多元关系结构提供多种数据接口,用于应用层、主数据及三方系统调用或引用枚举集、枚举变种,以满足多种场景的枚举数据及枚举关系数据应用。
在本申请的一个实施例中,利用一个或多个数据接口管理枚举数据字典,包括:获取枚举数据字典的管理请求;根据管理请求调用一个或多个数据接口,以调用或引用枚举集和/或枚举变种。
可以理解的是,本申请实施例的枚举数据字典管理模块由枚举集管理、枚举集变种和枚举成员业务关系三个方面构成,如图6所示,其中字典管理的步骤如图7所示,本申请实施例可以通过枚举数据字典的管理请求调用个数据接口,实现枚举集、枚举变种的调用或引用,其中,枚举集的数据接口调用场景分为5种,枚举变种的数据接口调用场景分为2种,详细介绍如下:
枚举集的数据接口调用场景:
A、通过枚举集编码,获取全部枚举值属性结构,含枚举集编码、枚举集的编码和名称,一般用于无父子关系的,下拉选择及填表。
B、通过枚举集编码,获取全部枚举值属性结构,做树形梯级数据处理。一般用于树性结构的下拉选择。
C、通过枚举集编码、枚举值名称,获取其父级枚举值。
D、通过枚举集编码和枚举值名称,获取其子级的全部枚举值。
E、依据枚举成员业务关系模块构成的多元关系结构,通过上级枚举集编码、下级枚举集编码,获取跨枚举集的枚举成员树形结构用于数据多维统计的场景。
枚举变种的数据接口调用场景:
A、通过枚举变种编码,获取全部枚举值的编码名称及值映射编码名称。分两种,全部获取或只获取映射标识部分,用于配置基本信息和查看映射。
B、通过枚举变种编码和值映射编码,返回基础枚举集编码、名称和枚举值名称,用于字典映射转换。
需要说明的是,本申请实施例接口调用不返回已删除的值,也可以在数据更新后,进行全系统广播或通过kafka发布,其他模块或系统采用订阅同步的方式实现统一的快速更新。
在本申请的一个实施例中,在根据数据标准创建各业务领域的枚举集和枚举集内的枚举成员之后,还包括:根据校验映射值编号和映射值名称创建枚举集的枚举变种,其中,枚举变种与枚举集存在1:N关系。
为满足不同系统或主数据的数据字典映射,本申请实施例可以依据枚举值创建枚举变种,设定枚举成员的编码、名称等的映射关系,用于数据治理和数据映射。其中,主数据映射的目的是把重复的、疑似重复的两条或多条数据找出来,进行筛选与修改,然后与标准主数据建立对照关系,由此提高主数据共享的数据质量。枚举变种与枚举集存在1:N关系,便于随着业务扩张或对接外部系统的增加而扩展。在单个枚举变种中,校验映射值编号、映射值名称应具有唯一性,且不能为空,可以与枚举成员名称、值编码一致。在枚举变种中,不可修改枚举成员名称、值编码。因此,本申请实施例可以根据校验映射值编号和映射值名称创建枚举集的枚举变种,满足统一的数据映射,以保证枚举变种内变种成员数据的唯一性。
为了方便理解,本申请可以通过一个具体的样例对本申请实施例的枚举变种数据进行详细说明,如表3和表4所示,其中,表3为枚举变种主要数据样例表,表4为枚举变种内的变种成员主要数据样例表。
表3
变种编码 变种名称 创建人 是否发布 场景描述
NYPZ-001 能源品种-变种001 张三 与政府系统映射
NYPZ-002 能源品种-变种002 李四 与下级系统映射
表4
Figure BDA0004080129470000091
/>
在本申请的一个实施例中,本申请实施例的方法还包括;建立联想搜索工具,利用联想搜索工具检索和关联性查看枚举字典;支撑多维数据汇聚工具和主数据属性治理工具,利用多维数据汇聚工具和主数据属性治理工具进行数据治理和多维数据分析业务。
可以理解的是,本申请实施例可以建立联想搜索工具,便于海量枚举字典的检索和关联性查看;并且支撑多维数据汇聚工具、主数据属性治理工具,便于数据治理和多维数据分析业务。
在一些情况下,本申请实施例还可以利用枚举成员业务关系中的枚举成员关系,检查与枚举集对应的主数据属性中,写入或存储的枚举数据,是否存在业务关系冲突,如果冲突,利用枚举字典管理的枚举数据清洗工具进行清洗或数据同步修改,如图8所示,在实际执行过程中,本申请实施例可以通过Java、pyton或sql语句实现上述逻辑,均可成功成果进行枚举数据的清洗或属性联动修改,也可以通过数据调度工具实现,不作具体限定。
根据本申请实施例提出的枚举数据字典统一管理方法,依据各业务领域主数据的数据标准创建需用的枚举集及其所含的枚举成员,并由枚举成员业务关系构建横向树,由枚举集内的枚举成员层级关系构建纵向树,实现枚举集遵循多业务域需求进行引用关系嵌套的能力,实现统一的业务统计关系,进而支持多层的加工和逻辑判断,降低主数据爆炸式增长的数字化转型难度,减少应用层的逻辑复杂程度和维护难度;通过多元关系结构提供多种数据接口管理枚举数据字典,满足多种场景的枚举数据及枚举关系数据应用,提高数据交互效率,支撑新业务、新主数据拓展的平台快速跃迁,降低数据治理难度,降低过渡期间的影响。由此,解决了相关技术中平台内多业务域之间数据映射混乱,标准不一致、维护难度大等问题。
其次参照附图描述根据本申请实施例提出的一种枚举数据字典统一管理装置。
图9是本申请实施例的枚举数据字典统一管理装置的方框示意图。
如图9所示,该枚举数据字典统一管理装置10包括:获取模块100、第一创建模块200和管理模块300。
其中,获取模块100用于获取各业务领域主数据的数据标准;第一创建模块200用于根据数据标准创建各业务领域的枚举集和枚举集内的枚举成员,根据枚举集之间的业务依赖关系构建枚举集层面的横向树,根据枚举成员之间的层级关系构建枚举集内枚举成员层级关系的纵向树;管理模块300用于根据纵向树和纵向树生成多元关系结构,通过多元关系结构提供一个或多个数据接口,利用一个或多个数据接口管理枚举数据字典。
在本申请的一个实施例中,第一创建模块200进一步用于根据枚举集名称和唯一编码创建各业务领域的枚举集;根据值编码、编码类型和枚举成员名称在枚举集内创建枚举成员。
在本申请的一个实施例中,本申请实施例的装置10还包括:存储模块。
其中,存储模块用于在存储枚举数据时,存储枚举集和枚举值编码。
可选地,在本申请的一个实施例中,本申请实施例的装置10还包括:第二创建模块。
其中,第二创建模块用于在根据数据标准创建各业务领域的枚举集和枚举集内的枚举成员之后,根据校验映射值编号和映射值名称创建枚举集的枚举变种,其中,枚举变种与枚举集存在1:N关系。
在本申请的一个实施例中,第一创建模块200进一步用于获取枚举成员的标签数据;根据标签数据建立枚举集之间的业务依赖关系;基于业务依赖关系构建跨枚举集之间的枚举成员父子关系,根据枚举成员父子关系生成枚举集层面的横向树。
在本申请的一个实施例中,管理模块300进一步用于获取枚举数据字典的管理请求;根据管理请求调用一个或多个数据接口,以调用或引用枚举集和/或枚举变种。
在本申请的一个实施例中,本申请实施例的装置10还包括:建立模块和支撑模块。
其中,建立模块用于建立联想搜索工具,利用联想搜索工具检索和关联性查看枚举字典;支撑模块用于支撑多维数据汇聚工具和主数据属性治理工具,利用多维数据汇聚工具和主数据属性治理工具进行数据治理和多维数据分析业务。
需要说明的是,前述对枚举数据字典统一管理方法实施例的解释说明也适用于该实施例的枚举数据字典统一管理装置,此处不再赘述。
根据本申请实施例提出的枚举数据字典统一管理装置,依据各业务领域主数据的数据标准创建需用的枚举集及其所含的枚举成员,并由枚举成员业务关系构建横向树,由枚举集内的枚举成员层级关系构建纵向树,实现枚举集遵循多业务域需求进行引用关系嵌套的能力,实现统一的业务统计关系,进而支持多层的加工和逻辑判断,降低主数据爆炸式增长的数字化转型难度,减少应用层的逻辑复杂程度和维护难度。通过多元关系结构提供多种数据接口管理枚举数据字典,满足多种场景的枚举数据及枚举关系数据应用,提高数据交互效率,支撑新业务、新主数据拓展的平台快速跃迁,降低数据治理难度,降低过渡期间的影响。由此,解决了相关技术中平台内多业务域之间数据映射混乱,标准不一致、维护难度大等问题。
图10为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:
存储器1001、处理器1002及存储在存储器1001上并可在处理器1002上运行的计算机程序。
处理器1002执行程序时实现上述实施例中提供的枚举数据字典统一管理方法。
进一步地,电子设备还包括:
通信接口1003,用于存储器1001和处理器1002之间的通信。
存储器1001,用于存放可在处理器1002上运行的计算机程序。
存储器1001可能包含高速RAM(Random Access Memory,随机存取存储器)存储器,也可能还包括非易失性存储器,例如至少一个磁盘存储器。
如果存储器1001、处理器1002和通信接口1003独立实现,则通信接口1003、存储器1001和处理器1002可以通过总线相互连接并完成相互间的通信。总线可以是ISA(IndustryStandard Architecture,工业标准体系结构)总线、PCI(Peripheral Component,外部设备互连)总线或EISA(Extended Industry Standard Architecture,扩展工业标准体系结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器1001、处理器1002及通信接口1003,集成在一块芯片上实现,则存储器1001、处理器1002及通信接口1003可以通过内部接口完成相互间的通信。
处理器1002可能是一个CPU(Central Processing Unit,中央处理器),或者是ASIC(Application Specific Integrated Circuit,特定集成电路),或者是被配置成实施本申请实施例的一个或多个集成电路。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的枚举数据字典统一管理方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不是必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列,现场可编程门阵列等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

Claims (10)

1.一种枚举数据字典统一管理方法,其特征在于,包括以下步骤:
获取各业务领域主数据的数据标准;
根据所述数据标准创建各业务领域的枚举集和所述枚举集内的枚举成员,根据枚举集之间的业务依赖关系构建枚举集层面的横向树,根据枚举成员之间的层级关系构建枚举集内枚举成员层级关系的纵向树;
根据所述纵向树和所述纵向树生成多元关系结构,通过多元关系结构提供一个或多个数据接口,利用所述一个或多个数据接口管理枚举数据字典。
2.根据权利要求1所述的方法,其特征在于,所述根据所述数据标准创建各业务领域的枚举集和所述枚举集内的枚举成员,包括:
根据枚举集名称和唯一编码创建各业务领域的枚举集;
根据值编码、编码类型和枚举成员名称在枚举集内创建枚举成员。
3.根据权利要求2所述的方法,其特征在于,在存储枚举数据时,存储所述枚举集和枚举值编码。
4.根据权利要求1-3任意一项所述的方法,其特征在于,在根据所述数据标准创建各业务领域的枚举集和所述枚举集内的枚举成员之后,还包括:
根据校验映射值编号和映射值名称创建枚举集的枚举变种,其中,所述枚举变种与所述枚举集存在1:N关系。
5.根据权利要求1所述的方法,其特征在于,所述根据枚举集之间的业务依赖关系构建枚举集层面的横向树,包括;
获取枚举成员的标签数据;
根据所述标签数据建立枚举集之间的业务依赖关系;
基于所述业务依赖关系构建跨枚举集之间的枚举成员父子关系,根据所述枚举成员父子关系生成所述枚举集层面的横向树。
6.根据权利要求1所述的方法,其特征在于,所述利用所述一个或多个数据接口管理枚举数据字典,包括:
获取所述枚举数据字典的管理请求;
根据所述管理请求调用所述一个或多个数据接口,以调用或引用枚举集和/或枚举变种。
7.根据权利要求1所述的方法,其特征在于,还包括;
建立联想搜索工具,利用所述联想搜索工具检索和关联性查看枚举字典;
支撑多维数据汇聚工具和主数据属性治理工具,利用所述多维数据汇聚工具和所述主数据属性治理工具进行数据治理和多维数据分析业务。
8.一种枚举数据字典统一管理装置,其特征在于,包括:
获取模块,用于获取各业务领域主数据的数据标准;
第一创建模块,用于根据所述数据标准创建各业务领域的枚举集和所述枚举集内的枚举成员,根据枚举集之间的业务依赖关系构建枚举集层面的横向树,根据枚举成员之间的层级关系构建枚举集内枚举成员层级关系的纵向树;
管理模块,用于根据所述纵向树和所述纵向树生成多元关系结构,通过多元关系结构提供一个或多个数据接口,利用所述一个或多个数据接口管理枚举数据字典。
9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-8任一项所述的枚举数据字典统一管理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-8任一项所述的枚举数据字典统一管理方法。
CN202310121603.6A 2023-02-02 2023-02-02 枚举数据字典统一管理方法、装置、电子设备及存储介质 Pending CN116257636A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310121603.6A CN116257636A (zh) 2023-02-02 2023-02-02 枚举数据字典统一管理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310121603.6A CN116257636A (zh) 2023-02-02 2023-02-02 枚举数据字典统一管理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116257636A true CN116257636A (zh) 2023-06-13

Family

ID=86680424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310121603.6A Pending CN116257636A (zh) 2023-02-02 2023-02-02 枚举数据字典统一管理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116257636A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116501375A (zh) * 2023-06-21 2023-07-28 深圳复临科技有限公司 数据字典版本管理方法、装置、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116501375A (zh) * 2023-06-21 2023-07-28 深圳复临科技有限公司 数据字典版本管理方法、装置、计算机设备及存储介质
CN116501375B (zh) * 2023-06-21 2024-02-23 深圳复临科技有限公司 数据字典版本管理方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
Karnitis et al. Migration of relational database to document-oriented database: Structure denormalization and data transformation
CN102341781B (zh) 软件测试台生成
CN110837492B (zh) 一种多源数据统一sql提供数据服务的方法
US7606817B2 (en) Primenet data management system
CN111506621B (zh) 一种数据统计方法及装置
US20140089273A1 (en) Large scale file storage in cloud computing
CN104346377A (zh) 一种基于唯一标识的数据集成和交换方法
CN108595664B (zh) 一种hadoop环境下的农业数据监控方法
US20210073196A1 (en) Semantic, single-column identifiers for data entries
WO2007136959A2 (en) Apparatus and method for recursively rationalizing data source queries
CN111435347A (zh) 数据库中关系表的高效扩展方法和系统
CN114461603A (zh) 多源异构数据融合方法及装置
Hashem et al. An Integrative Modeling of BigData Processing.
CN116257636A (zh) 枚举数据字典统一管理方法、装置、电子设备及存储介质
AGGOUNE et al. A method for transforming object-relational to document-oriented databases
CN109933589B (zh) 用于数据汇总的基于ElasticSearch聚合运算结果的数据结构转换方法
Pokorný Integration of relational and NoSQL databases
Álvarez-García et al. Compact and efficient representation of general graph databases
Chellappan et al. MongoDB Recipes: With Data Modeling and Query Building Strategies
Mustafa et al. Modeling traceability for heterogeneous systems
US20070220033A1 (en) System and method for providing simple and compound indexes for XML files
CN113157934A (zh) 知识图谱起源处理方法和系统、电子设备和存储介质
Asaad et al. NoSQL databases: yearning for disambiguation
Ouaret et al. An Approach for Generating an XML Data Warehouse Schema using Model Transformation Language.
Feng et al. Research on parallel association rules mining algorithm based on hadoop

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination