CN114238263A - 一种基于数据字典的数据库建模系统 - Google Patents

一种基于数据字典的数据库建模系统 Download PDF

Info

Publication number
CN114238263A
CN114238263A CN202111221060.2A CN202111221060A CN114238263A CN 114238263 A CN114238263 A CN 114238263A CN 202111221060 A CN202111221060 A CN 202111221060A CN 114238263 A CN114238263 A CN 114238263A
Authority
CN
China
Prior art keywords
standard
data
dictionary
database
data dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111221060.2A
Other languages
English (en)
Inventor
刘小成
马康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beiyin Financial Technology Co ltd
Original Assignee
Beiyin Financial Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beiyin Financial Technology Co ltd filed Critical Beiyin Financial Technology Co ltd
Priority to CN202111221060.2A priority Critical patent/CN114238263A/zh
Publication of CN114238263A publication Critical patent/CN114238263A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供的一种基于数据字典的数据库建模系统,所述建模系统包括:对数据字典的元数据内容和信息维度进行定义,获得定义信息;根据所述定义信息构建基于数据字典的数据库模型。通过建立企业数据字典,建立数据库建模系统,对字典和数据库建模工具进行强关联,解决在业务系统中模型创建字段信息的二义性,字段规范,数据传输和数据血缘难以追踪的问题。

Description

一种基于数据字典的数据库建模系统
技术领域
本发明涉及信息系统建设领域,尤其涉及一种基于数据字典的数据库建模系统。
背景技术
在企业信息系统建设过程中,数据库建模普遍缺乏统一的字段设计标准,本系统通过收集并建立符合企业需求的数据字典,建设基于数据字典的数据库模型设计工具,使数据字典和数据库建模形成关联和联动,从而充分发挥数据字典价值,提高数据字典落标率,进而提升数据库建模质量和标准化。
目前,各业务系统的数据模型建立一般由开发人员或数据库管理员进行设计或创建,主流的ER图工具如power designer,dbdesigner, pdman等在工作流程上是一个孤岛操作,暨各个系统建立自己的模型,达到满足业务的需求即可,未考虑企业级标准化以及系统之间的统一问题。部分标准规范较好的企业,提出模型创建的技术规范,并且提出了部分业务规范的定义,也需要通过人工审核来确认了技术规范的实现和应用。但是由于业务规范的主观性和复杂性,企业在确认业务规范使用的需求方面,具有极大的滞后性和不可控性。
项目推进过程中对同一数据存在理解不一致的情况,存在数据二义性,缺少统一的沟通“语言”。建立基于数据字典的数据库建模工具,帮助理清数据需求。
项目推进过程中对于数据格式定义不准确,落地数据类型欠标准化,字段编码不规范,使用基于数据字典的数据库建模工具,有助于减少数据消费端的理解难度,提升数据的可得性。
项目推进过程中各系统均存在自己的业务规范,导致跨系统数据互联互通复杂度高。亟需对于基础数据提出一套遵循统一的业务规则、技术标准,建立企业层面的基础数据规范,并嵌入系统开发流程中,通过建立基于数据字典的建模工具提供上述各项要求落地的载体,最终实现数据血缘追踪,方便数据流转,减少开发成本。
发明内容
鉴于上述问题,提出了本发明以便提供克服上述问题或者至少部分地解决上述问题的一种基于数据字典的数据库建模系统。
根据本发明的一个方面,提供了一种基于数据字典的数据库建模系统,所述建模系统包括:
对数据字典的元数据内容和信息维度进行定义,获得定义信息;
根据所述定义信息构建基于数据字典的数据库模型。
可选的,所述对数据字典的元数据内容和信息维度进行定义具体包括:
所述元数据包括的主题为参与人-客户,参与人-机构,参与人- 员工,产品,协议,账户,资源项,事件,渠道,公共代码;
每个主题包含标准属性、业务属性、技术属性、管理属性;
所述标准属性用于标识数据字典的体系信息;
所述业务属性用于描述字典项业务定义和名称;
所述技术属性用于描述字典实际数据存储的格式;
所述管理属性用于后期维护进行标注的。
可选的,所述标准属性具体包括:标准编号、标准主题、标准一级分类、标准二级分类、标准三级分类、标准四级分类;
所述业务属性具体包括:标准中文名称,标准英文名称,标准英文简称,标准别名,业务定义,业务规则,相关标准,与相关标准的关系,标准依据;
所述技术属性具体包括:数据类别,数据格式,代码编码规则,值阈信息;
所述管理属性具体包括:标准定义部门和主数据系统。
可选的,所述根据所述定义信息构建基于数据字典的数据库模型具体包括:
数据模型仓库,用于存放和管理所有的数据字典;
工作面板,用于对数据库模型的各个对象按照逻辑和属性进行划分操作;
搜索引擎模块,用于字段的实时搜索和动态匹配;
DDL解析模块,用于数据库模型导出。
本发明提供的一种基于数据字典的数据库建模系统,所述建模系统包括:对数据字典的元数据内容和信息维度进行定义,获得定义信息;根据所述定义信息构建基于数据字典的数据库模型。通过建立企业数据字典,建立数据库建模系统,对字典和数据库建模工具进行强关联,解决在业务系统中模型创建字段信息的二义性,字段规范,数据传输和数据血缘难以追踪的问题。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种基于数据字典的数据库建模系统示意图;
图2为本发明实施例提供的关联字典示意图;
图3为本发明实施例提供的数据库建模系统架构示意图;
图4为本发明实施例提供的具体模型创建和模型操作的交互模块示意图;
图5为本发明实施例提供的搜索引擎模块示意图;
图6为本发明实施例提供的DDL解析模块示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。
下面结合附图和实施例,对本发明的技术方案做进一步的详细描述。
第一方面,本发明首先要对数据字典的元数据内容以及信息维度进行定义,以金融业务举例:
如图2所示,关联字典的建模,核心技术原理是基于主题,属性,含义的字段检索,字典信息如图2所示。元数据包含十大主题:参与人-客户,参与人-机构,参与人-员工,产品,协议,账户,资源项,事件,渠道,公共代码。
针对每个主题,包含四个属性
属性一:标准属性
标准属性用于标识数据字典的体系信息,包含标准编号,标准主题,标准一级分类,标准二级分类,标准三级分类,标准四级分类。例如标准编号,根据主题设定为CD000001,CD000002等,标准主题设定为公共代码。
属性二:业务属性
业务属性分类用于描述该字典项业务定义以及名称,包含标准中文名称,标准英文名称,标准英文简称,标准别名,业务定义,业务规则,相关标准,与相关标准的关系,标准依据。例如,针对度量单位这个字典项,标准中文名称度量单位,业务定义为指可用来量化数据并赋予业务含义的单位,标准英文名称设定为Measure Unit,标准英文简称设定为mea_unit,标准别名设定为空,业务规则设定为例如时间的度量单位包括秒、分、时、日、月、年等。所有数值类的数据标准必须明确对应的度量单位,相关标准为度量范围,与相关标准的关系为组合,标准依据是《国际单位制及其应用》(GB_3100-93)。
属性三:技术属性
技术属性用于描述字典实际数据存储的格式,包含数据类别,数据格式,代码编码规则,值阈等信息,例如上文说的度量单位,在数据类别中属于代码类,对于数据格式的定义,设定为4!n,值阈没有定义,因此设定为空,设定字典值的技术属性。
属性四:管理属性
在管理属性中,一般包含标准定义部门和主数据系统两个子项,这里的属性,是针对数据标准或者数据字典进行后期维护是进行标注的,比如,标准定义部门提供或者补充了某个数据字典项,做记录和定义规范。主数据系统,标明第一次引用该字典项目的系统名称。
结合金融场景,把所有业务信息归类,定义为十大主题,每个主题设置四个属性,任何具有业务含义的字段都归为十大主题中的某一个,且对四个属性信息进行补充,确定某个业务含义数据的唯一字段解释。
如图3所示,第二方面,构建基于数据字典的数据库建模系统。
数据库建模系统架构如图3所示。该系统的核心功能是基于数据字典的模型创建,因此在技术架构层面,要求系统中构建存放字典信息的数据模型仓库,用于模型创建的工作面板,用于实时检索和匹配的搜索引擎,用于元数据管理和语句生成的DDL解析引擎四个核心模块。
数据模型仓库用于存放和管理所有的数据字典,对每一个字典项按照上文中提到的十大主题,四个属性进行统一存储和管理。
如图4所示,工作面板是进行具体模型创建和模型操作的交互模块,在这个模块中,对数据库模型的各个对象按照逻辑和属性进行划分操作。
如图5所示,搜索引擎模块主要用于字段的实时搜索和动态匹配,在搜索引擎中,依据字典中文和字典英文创建对应字段索引,提供中文和英文两种匹配逻辑,操作者在界面中进行字段对象创建操作,在提示框中,输入预期的中文含义或英文含义,由搜索引擎对字典中的数据项进行管理搜索。引擎反回字段名称、字段类型、字段长度、业务含义信息,并填充在表对象中,在模型创建或修改过程中,强制关联数据字典,保证字段是完全符合数据字典标准规范的,进而保证模型创建过程中的业务规范要求。
如图1所示,针对字典项user_name的全量信息在搜索引擎中创建了对应的全量数据条目,并使用english_name,chinese_name对该条信息创建了索引。在创建字段过程中,触发索引中关于user_name 或者用户名称全称模糊匹配查询,比如搜索表达式中的“*name*”或“名称”关键词,搜索引擎将返回user_name的全量字典项信息,包含该字段的字段名称,字段类型,长度,字典编号等。通过这个流程,连接字典库,搜索引擎,数据建模操作,最终实现基于数据字典的数据库建模系统。
如图6所示,DDL解析模块,用于数据库模型导出或语句执行。创建的模型要在数据库中生成对应的数据库对象,因此,需要该模块实现ER图向数据库定义语句的转换操作,使对象信息在数据库中生效。DDL模块底层由ANTLR实现,基于latex和yacc的词法解析和语法解析,根据预定义的规则,将图形对象和数据库语句对象进行双向转换。
有益效果:通过使用基于数据字典的数据库建模工具,进而构建符合技术规范和业务规范的数据库模型,保证数据标准在上下游系统使用的一致性和准确性,确保数据库模型字段信息的规范性。
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于数据字典的数据库建模系统,其特征在于,所述建模系统包括:
对数据字典的元数据内容和信息维度进行定义,获得定义信息;
根据所述定义信息构建基于数据字典的数据库模型。
2.根据权利要求1所述的一种基于数据字典的数据库建模系统,其特征在于,所述对数据字典的元数据内容和信息维度进行定义具体包括:
所述元数据包括的主题为参与人-客户,参与人-机构,参与人-员工,产品,协议,账户,资源项,事件,渠道,公共代码;
每个主题包含标准属性、业务属性、技术属性、管理属性;
所述标准属性用于标识数据字典的体系信息;
所述业务属性用于描述字典项业务定义和名称;
所述技术属性用于描述字典实际数据存储的格式;
所述管理属性用于后期维护进行标注的。
3.根据权利要求2所述的一种基于数据字典的数据库建模系统,其特征在于,所述标准属性具体包括:标准编号、标准主题、标准一级分类、标准二级分类、标准三级分类、标准四级分类;
所述业务属性具体包括:标准中文名称,标准英文名称,标准英文简称,标准别名,业务定义,业务规则,相关标准,与相关标准的关系,标准依据;
所述技术属性具体包括:数据类别,数据格式,代码编码规则,值阈信息;
所述管理属性具体包括:标准定义部门和主数据系统。
4.根据权利要求1所述的一种基于数据字典的数据库建模系统,其特征在于,所述根据所述定义信息构建基于数据字典的数据库模型具体包括:
数据模型仓库,用于存放和管理所有的数据字典;
工作面板,用于对数据库模型的各个对象按照逻辑和属性进行划分操作;
搜索引擎模块,用于字段的实时搜索和动态匹配;
DDL解析模块,用于数据库模型导出。
CN202111221060.2A 2021-10-20 2021-10-20 一种基于数据字典的数据库建模系统 Pending CN114238263A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111221060.2A CN114238263A (zh) 2021-10-20 2021-10-20 一种基于数据字典的数据库建模系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111221060.2A CN114238263A (zh) 2021-10-20 2021-10-20 一种基于数据字典的数据库建模系统

Publications (1)

Publication Number Publication Date
CN114238263A true CN114238263A (zh) 2022-03-25

Family

ID=80743147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111221060.2A Pending CN114238263A (zh) 2021-10-20 2021-10-20 一种基于数据字典的数据库建模系统

Country Status (1)

Country Link
CN (1) CN114238263A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644151A (zh) * 2023-05-15 2023-08-25 绵阳市商业银行股份有限公司 一种应用nlp和ml于数据标准对标的智能化系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090037164A (ko) * 2007-10-11 2009-04-15 중소기업은행 데이터 포털 서비스 시스템 및 방법
CN101504645A (zh) * 2008-02-04 2009-08-12 上海坦瑞信息技术有限公司 一种基于自定义元数据的领域概念和知识建模方法
US20100131568A1 (en) * 2008-11-21 2010-05-27 Sap Ag System, method and structures for a reusable custom-defined nestable compound data type for construction of database objects
CN102541867A (zh) * 2010-12-15 2012-07-04 金蝶软件(中国)有限公司 数据字典生成方法及系统
CN105808772A (zh) * 2016-03-28 2016-07-27 中国建设银行股份有限公司 一种数据定义文件生成方法及装置
CN107506462A (zh) * 2017-08-30 2017-12-22 中国建设银行股份有限公司 企业级数据的数据处理方法、系统、电子设备、存储介质
KR20190127066A (ko) * 2018-05-03 2019-11-13 주식회사 데이터스트림즈 표준사전 기반 메타데이터 변경 관리를 위한 실시간 ddl 생성방법
CN110471995A (zh) * 2019-08-14 2019-11-19 中电科新型智慧城市研究院有限公司 一种跨领域信息共享交换数据模型建模方法
CN110490761A (zh) * 2019-07-26 2019-11-22 广西电网有限责任公司 一种电网配网设备台账数据模型建模方法
CN110955736A (zh) * 2019-11-06 2020-04-03 科大国创软件股份有限公司 一种基础数据的管理模型建模方法
CN111897573A (zh) * 2020-05-28 2020-11-06 广州市玄武无线科技股份有限公司 数据库字典文档的生成方法、装置、设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090037164A (ko) * 2007-10-11 2009-04-15 중소기업은행 데이터 포털 서비스 시스템 및 방법
CN101504645A (zh) * 2008-02-04 2009-08-12 上海坦瑞信息技术有限公司 一种基于自定义元数据的领域概念和知识建模方法
US20100131568A1 (en) * 2008-11-21 2010-05-27 Sap Ag System, method and structures for a reusable custom-defined nestable compound data type for construction of database objects
CN102541867A (zh) * 2010-12-15 2012-07-04 金蝶软件(中国)有限公司 数据字典生成方法及系统
CN105808772A (zh) * 2016-03-28 2016-07-27 中国建设银行股份有限公司 一种数据定义文件生成方法及装置
CN107506462A (zh) * 2017-08-30 2017-12-22 中国建设银行股份有限公司 企业级数据的数据处理方法、系统、电子设备、存储介质
KR20190127066A (ko) * 2018-05-03 2019-11-13 주식회사 데이터스트림즈 표준사전 기반 메타데이터 변경 관리를 위한 실시간 ddl 생성방법
CN110490761A (zh) * 2019-07-26 2019-11-22 广西电网有限责任公司 一种电网配网设备台账数据模型建模方法
CN110471995A (zh) * 2019-08-14 2019-11-19 中电科新型智慧城市研究院有限公司 一种跨领域信息共享交换数据模型建模方法
CN110955736A (zh) * 2019-11-06 2020-04-03 科大国创软件股份有限公司 一种基础数据的管理模型建模方法
CN111897573A (zh) * 2020-05-28 2020-11-06 广州市玄武无线科技股份有限公司 数据库字典文档的生成方法、装置、设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BITHACHI: "《数据库系统概论》之数据库设计六步骤(需求、概念、逻辑、物理、实施、运行维护)", Retrieved from the Internet <URL:https://blog.csdn.net/weixin_43914604/article/details/106663341> *
DATABLAU: "Datablau Data Modeler 新一代数据库建模工具", Retrieved from the Internet <URL:https://zhuanlan.zhihu.com/p/129807273> *
ONLINE: "ER模型设计工具:设计ER模型及MySQL DDL文件导入及生成", Retrieved from the Internet <URL:https://zhuanlan.zhihu.com/p/69444975> *
张龙等: "基于数据字典的空间数据库通用建库技术", 《国土资源遥感》, vol. 26, no. 1, 31 March 2014 (2014-03-31) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644151A (zh) * 2023-05-15 2023-08-25 绵阳市商业银行股份有限公司 一种应用nlp和ml于数据标准对标的智能化系统

Similar Documents

Publication Publication Date Title
CN110825882B (zh) 一种基于知识图谱的信息系统管理方法
CN106919689B (zh) 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN104361127B (zh) 基于领域本体和模板逻辑的多语种问答接口快速构成方法
CN107679221B (zh) 面向减灾任务的时空数据获取与服务组合方案生成方法
CN109697050B (zh) 一种基于知识图谱面向电商领域的需求描述模型设计方法
CN111680029B (zh) 基于数据标准系统落标的优化管理方法
CN108492028A (zh) 数据需求标准化方法及标准化系统
CN112559766B (zh) 一种法律知识图谱构建系统
CN107562919B (zh) 一种基于信息检索的多索引集成软件构件检索方法及系统
CN106407216A (zh) 基于语义网构建路径开发的线索追溯稽核系统及其构建方法
Eckert Complex event processing with XchangeEQ: language design, formal semantics, and incremental evaluation for querying events.
CN112651218A (zh) 一种标书自动生成方法、管理方法、介质以及计算机
CN103425740A (zh) 一种面向物联网的基于语义聚类的物资信息检索方法
CN114218218A (zh) 基于数据仓库的数据处理方法、装置、设备及存储介质
Ji et al. A multitask context-aware approach for design lesson-learned knowledge recommendation in collaborative product design
CN114238263A (zh) 一种基于数据字典的数据库建模系统
CN109344306B (zh) 一种领域多标准元数据定制化在线汇交与服务方法及系统
CN114722159B (zh) 针对数控机床制造资源的多源异构数据处理方法及系统
Moreno Object-oriented analysis from textual specifications
CN107203935B (zh) 基于xbrl技术的代理记账系统与方法
CN106649219B (zh) 一种通信卫星设计文件自动生成方法
CN111581815B (zh) 一种基于xml的工艺模型本体构建方法
KR20190052980A (ko) 인재 정보 처리 방법 및 장치
Liu et al. Construction of intelligent query system for metro electromechanical equipment faults based on the knowledge graph
Ma et al. A Legacy ERP System Integration Framework based on Ontology Learning.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination