CN113946634A - 一种业务数据的领域模型的处理方法、装置及设备 - Google Patents
一种业务数据的领域模型的处理方法、装置及设备 Download PDFInfo
- Publication number
- CN113946634A CN113946634A CN202111559738.8A CN202111559738A CN113946634A CN 113946634 A CN113946634 A CN 113946634A CN 202111559738 A CN202111559738 A CN 202111559738A CN 113946634 A CN113946634 A CN 113946634A
- Authority
- CN
- China
- Prior art keywords
- data
- information
- domain model
- entity
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 187
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000004458 analytical method Methods 0.000 claims abstract description 49
- 230000003068 static effect Effects 0.000 claims abstract description 41
- 230000007246 mechanism Effects 0.000 claims description 46
- 238000003860 storage Methods 0.000 claims description 15
- 238000007726 management method Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000013500 data storage Methods 0.000 description 5
- 101150086656 dim1 gene Proteins 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明的实施例提供一种领域模型的处理方法、装置及设备,所述方法包括:对目标系统的业务数据的领域模型进行静态分析,得到所述领域模型中实体的实体依赖关系和领域模型中属性的属性等价类簇;所述领域模型是对业务数据的元信息的描述;基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息;根据所述动态关系信息和所述属性等价类簇,对所述实体依赖关系进行精简处理,得到精简处理结果。本发明的实施例实现了对不使用或少使用的领域模型中的元素或数据做提示,帮助用户精简领域模型,同时还可归档或销毁相关无用数据。
Description
技术领域
本发明涉及领域模型技术领域,特别是指一种业务数据的领域模型的处理方法、装置及设备。
背景技术
在企业数字化转型过程所建设的企业数据系统中,领域模型是系统的元数据中枢,领域模型刻化了数据系统所面向业务领域的结构,是数据的“骨骼”,是数据存储和处理的基础;常见的领域模型如,在银行业的BDWM(Banking data warehouse model)和FS-LDM领域模型等、在电信业的TDWM(Telecom Data warehouse model)以及在工业生产制造中ISA 95描述的生产对象领域模型等;
随着数据系统的运行,领域模型不断进行数据内容的扩充,开发者和用户会根据业务需求在系统中建立和生成越来越多的实体、属性和关联等模型元素,企业中达到数以千计以及更大的元素规模是普遍现象;
臃肿的领域模型增加了数据系统的资源开销,对系统长久的稳定性运行带来隐患,甚至增加了无谓的扩容需求,同时,越来越多的模型元素给有效管理带来困难。
发明内容
本发明提供了一种业务数据的领域模型的处理方法、装置及设备。实现了对不使用或少使用的领域模型中的元素或数据做提示,帮助用户精简领域模型,同时还可归档或销毁相关无用数据。
为解决上述技术问题,本发明的实施例提供以下方案:
一种业务数据的领域模型的处理方法,包括:
对目标系统的业务数据的领域模型进行静态分析,得到所述领域模型中实体的实体依赖关系和领域模型中属性的属性等价类簇;所述领域模型是对业务数据的元信息的描述;
基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息;
根据所述动态关系信息和所述属性等价类簇,对所述实体依赖关系进行精简处理,得到精简处理结果。
可选的,对目标系统的业务数据的领域模型进行静态分析,得到所述领域模型中实体的实体依赖关系和领域模型中属性的属性等价类簇,包括:
对目标系统的业务数据的领域模型进行静态分析,得到实体集、实体依赖关系集、属性集以及属性关联关系集;
根据所述实体集和实体依赖关系集,得到所述领域模型中实体的实体依赖关系;
根据所述属性集和属性关联关系集,得到领域模型中属性的属性等价类簇。
可选的,所述数据信息包括以下至少一种:
数据加工任务信息;数据加工任务运行日志;数据读写运行日志;数据统计信息;业务语义与机理信息中至少一种。
可选的,当所述至少一种数据信息为数据加工任务信息和数据加工任务运行日志时,基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息,包括:
按照第一预设周期获取数据加工任务信息;
以所述实体依赖关系对应的实体的集合为顶点集合,所述数据加工任务信息对应的加工任务的集合为关联边集合,得到数据加工任务关系;
按照第二预设周期获取数据加工任务运行日志;
基于所述数据加工任务关系,添加数据加工任务运行日志,得到与所述数据加工任务信息和数据加工任务运行日志对应的动态运行信息。
可选的,当所述至少一种数据信息为数据读写运行日志和数据统计信息时,基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息,包括:
按照第三预设周期获取数据读写运行日志,并按照第四预设周期获取数据统计信息;
根据所述实体依赖关系、所述数据读写运行日志和数据统计信息,得到数据量信息和访问信息。
可选的,当所述至少一种数据信息为业务语义与机理信息时,基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息,包括:
获取业务语义与机理信息;
以所述实体依赖关系对应的实体的集合为顶点集合,所述实体依赖关系对应的每个实体或每个属性之间业务语义与机理信息的关系为关联边集合,得到业务机理关系信息。
可选的,根据所述动态关系信息和所述属性等价类簇,对所述实体依赖关系进行精简处理,得到精简处理结果,包括:
根据所述动态关系信息,得到领域模型中每个元素的初始使用度;
基于所述实体依赖关系和动态关系信息对所述初始使用度进行迭代计算,得到使用度终值;
根据所述使用度终值,得到所述领域模型中每个元素的建议强度值;
根据所述建议强度值得到精简建议,并结合所述属性等价类簇,对领域模型进行精简处理,得到精简处理结果。
本发明还提供一种业务数据的领域模型的处理装置,所述装置包括:
分析模块,用于对目标系统的业务数据的领域模型进行静态分析,得到所述领域模型中实体的实体依赖关系和领域模型中属性的属性等价类簇;所述领域模型是对业务数据的元信息的描述;基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息;
处理模块,用于根据所述动态关系信息和所述属性等价类簇,对所述实体依赖关系进行精简处理,得到精简处理结果。
本发明提供一种电子设备,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如上述的业务数据的领域模型的处理方法的步骤。
本发明还提供一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如上述的业务数据的领域模型的处理方法的步骤。
本发明的上述方案至少包括以下有益效果:
本发明的上述方案,通过对目标系统的业务数据的领域模型进行静态分析,得到所述领域模型中实体的实体依赖关系和领域模型中属性的属性等价类簇;所述领域模型是对业务数据的元信息的描述;基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息;根据所述动态关系信息和所述属性等价类簇,对所述实体依赖关系进行精简处理,得到精简处理结果。实现了对不使用或少使用的领域模型中的元素(或数据)做提示,帮助用户精简领域模型,同时还可归档或销毁相关无用数据。
附图说明
图1为本发明实施例的业务数据的领域模型的处理方法的流程示意图;
图2为本发明提供的具体的实施例1的实体依赖关系的示意图;
图3为本发明提供的具体的实施例3中基于实体依赖关系的动态关系信息示意图;
图4为本发明提供的具体的实施例8的流程示意图;
图5为本发明实施例的业务数据的领域模型的处理系统中结构示意图;
图6为本发明实施例的业务数据的领域模型的处理装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
如图1所示,本发明提供一种业务数据的领域模型的处理方法,包括:
步骤11,对目标系统的业务数据的领域模型进行静态分析,得到所述领域模型中实体的实体依赖关系和领域模型中属性的属性等价类簇;所述领域模型是对业务数据的元信息的描述;
步骤12,基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息;
步骤13,根据所述动态关系信息和所述属性等价类簇,对所述实体依赖关系进行精简处理,得到精简处理结果。
该实施例中,通过对目标系统的业务数据的领域模型进行静态分析,分析领域模型中实体和实体对应的属性的关系,通过静态分析可以得到领域模型中各实体之间的实体依赖关系,也可以得到各实体的属性之间的属性等价类簇;基于实体依赖关系,对领域模型的数据信息进行动态分析,这里的动态分析用于将与领域模型中的实体或实体对应的属性通过数据信息进行动态分析,得到动态关系信息,在实体依赖关系的基础上,根据动态关系信息和属性等价类簇,进行精简处理,得到精简处理结果;实现了对不使用或少使用的领域模型中的元素(或数据)做提示,帮助用户精简领域模型,同时还可归档或销毁相关无用数据;
其中,需要说明的是,领域模型是对业务数据的元信息的描述;在企业数字化转型过程所建设的企业数据系统中,领域模型是系统的元数据中枢,领域模型刻化业务数据的数据系统所面向业务领域的结构,是数据存储和处理的基础。
本发明一可选的实施例中,步骤11包括:
步骤111,对目标系统的业务数据的领域模型进行静态分析,得到实体集、实体依赖关系集、属性集以及属性关联关系集;
步骤112,根据所述实体集和实体依赖关系集,得到所述领域模型中实体的实体依赖关系;
步骤113,根据所述属性集和属性关联关系集,得到领域模型中属性的属性等价类簇。
本实施例中,获取目标系统的业务数据的领域模型包括:
步骤a1,读取目标系统(物理实现库)中的模型模式;
步骤a2,将所述模型模式通过映射,得到业务数据的领域模型;
其中,目标系统可以是工业多模态数据系统、关系数据库系统、数据仓库系统、数据湖系统、典型关系数据库、数据仓库Teradata、大数据生态Hive、Iceberg、Hudi以及开源计算引擎Spark中的至少一种;
目标系统的模型模式包括数据表、字段、主键、外键以及分布键中的至少一种;
根据模型模式得到的领域模型的元素包括实体、属性、关联、约束、索引、主键、外键、分区键、排序键以及分布键中的至少一种,其中,外键不区分ON DELETE和ON UPDATE类型。
通过上述步骤a1和步骤a2可得到领域模型,对领域模型进行静态分析,得到实体集、实体依赖关系集、属性集以及属性关联关系集;
进一步地,可根据实体集和实体依赖关系集构成领域模型中实体的实体依赖关系,该实体依赖关系优选通过实体依赖关系图表示,当然还可以以其他形式表示,本申请不以此为限制;
而根据属性集和属性关联关系集构成领域模型中属性的属性等价类簇,该属性等价类簇中的每一个元素(属性)中,只要有任意一个元素(属性)需要进行精简或保留时,则在该属性等价类簇内的其他元素(属性)也需要进行精简或保留。
如图2所示,一个具体的实施例1中,实体依赖关系图中data_testing_result(数据测试结果)、material_lot(物料批次)、material_definition(物料定义)、material_specification(物料说明)、process_segment(加工环节)、product_segment(生产环节)、segment_response(区段响应)以及data_testing_result_summary(数据测试结果总结)为实体,即实体依赖关系图中的顶点;实体data_testing_result中的material_lot(物料批次)、dim1、dim2、result1(结果1)、result2(结果2)、result3(结果3)以及effective_data(有效数据)等为实体data_testing_result的属性,实体data_testing_result_summary中的dim1和dim2为属性等价类簇,由实体data_testing_result_summary上的唯一键得到,当dim1或dim2需要精简,则属性等价类簇中的另一属性也需要精简,同样,当dim1或dim2需要保留,则属性等价类簇中的另一属性也需要保留;实体依赖关系图中的边表示实体依赖关系,边在源和目标实体上的位置标示对应的属性。
一个具体的实施例2中,对于实体依赖关系集,当存在实体E2有外键(属性为B1和B2),实体E1有主键(属性为A1和A2),实体E2引用实体E1,则对应实体E2和实体E1存在依赖关系,该依赖关系即为实体E2和实体E1之间的边,该依赖关系(边)用于表示实体E2依赖实体E1,进一步地,当实体E2保留在领域模型时,实体E1必须保留,进而实体E1的主键也必须保留;
对于属性关联关系集,当实体E3中存在属性U1、U2、U3上的唯一约束,则该属性U1、U2、U3具有一个关联关系,进一步的,当该属性U1、U2、U3中的任意一个属性需要进行精简处理时,需要将属性U1、U2、U3全部进行精简处理,当该属性U1、U2、U3中的任意一个属性需要进行保留处理时,需要将属性U1、U2、U3全部进行保留处理,需要说明的是,这一规则对于多属性的主键、外键、索引、约束、分区/分布/排序键等均适用。
本发明一可选的实施例中,所述数据信息包括以下至少一种:
数据加工任务信息;数据加工任务运行日志;数据读写运行日志;数据统计信息;业务语义与机理信息中至少一种。
本实施例中,数据信息用于基于静态分析得到的实体依赖关系,进一步进行动态分析,得到与数据信息对应的动态关系信息,通过静态分析得到的属性等价类簇和动态关系信息,实现对领域模型的精简。
进一步的,本发明一可选的实施例中,当所述至少一种数据信息为数据加工任务信息和数据加工任务运行日志时,步骤12包括:
步骤12a1,按照第一预设周期获取数据加工任务信息;
步骤12a2,以所述实体依赖关系对应的实体的集合为顶点集合,所述数据加工任务信息对应的加工任务的集合为关联边集合,得到数据加工任务关系;
步骤12a3,按照第二预设周期获取数据加工任务运行日志;
步骤12a4,基于所述数据加工任务关系,添加数据加工任务运行日志,得到与所述数据加工任务信息和数据加工任务运行日志对应的动态运行信息。
本实施例中,当数据信息为数据加工任务信息和数据加工任务运行日志时,适配并定期读取领域模型全部的数据加工任务信息,该定期是以第一预设周期,以静态分析得到的实体依赖关系为基础,将实体依赖关系中的实体的集合作为顶点集合,数据加工任务信息对应的加工任务的集合为关联边集合,得到数据加工任务关系,与步骤112中的实体依赖关系相似,这里的数据加工任务关系优选可以数据加工任务关系图表示,当然还可以以其他形式表示,本申请不以此为限制;
另外,数据加工任务关系可通过设置在边上的标签表示任务的运行时间信息(如定时运行周期等时间信息),对于每个加工任务,其输入实体的集合与输出实体的集合之间可建立完全二分图;
适配并定期读取领域模型全部的数据加工任务运行日志,该定期是以第二预设周期,在定期读取数据加工任务运行日志的同时还可以读取数据加工任务作业系统,进一步的,对读取的数据加工任务运行日志和读取数据加工任务作业系统进行解析,其中,数据加工任务运行日志包括数据加工量、加工时长以及加工速率(吞吐量)的至少一种;以步骤12a2中得到的数据加工任务关系为基础,在数据加工任务关系的边附着对应的数据加工任务运行日志,得到动态运行信息,该动态运行信息相较于数据加工任务关系增加了数据加工任务运行日志;基于数据加工任务信息和数据加工任务运行日志得到的动态运行信息是领域模型的各实体在数据加工链路上的关系;
需要说明的是,这里的数据加工任务信息优选的可通过数据处理与加工任务管理系统(服务集成接口)、数据分析任务管理系统、大数据平台元数据系统、数据血缘分析子系统以及数据影响分析子系统等进行获取;该数据加工任务信息优选包括数据输入信息(即数据源)、输出信息(即数据目的地)以及数据加工任务的定时运行周期等,而数据加工任务信息中对应的数据加工任务优选包括数据接入与ETL(Extract-Transform-Load,数据仓库技术)任务、分层数据加工、数据处理与分析等;
这里的数据加工任务运行日志优选的可通过数据处理与加工任务执行系统(服务集成接口)、数据分析任务执行系统以及系统运行日志集中管理系统等进行获取。
本发明一可选的实施例中,当所述至少一种数据信息为数据读写运行日志和数据统计信息时,步骤12包括:
步骤12b1,按照第三预设周期获取数据读写运行日志,并按照第四预设周期获取数据统计信息;
步骤12b2,根据所述实体依赖关系、所述数据读写运行日志和数据统计信息,得到数据量信息和访问信息。
本实施例中,适配并定期读取数据读写运行日志,该定期是以第三预设周期,该数据读写运行日志包括实体的读写信息,数据读写运行日志优选可通过数据读写处理执行系统(服务集成接口)、数据查询执行系统以及系统运行日志集中管理系统等进行获取;适配并定期读取数据统计信息,数据统计信息对应的定期是以第四预设周期,数据统计信息包括实体内的数据量等,数据统计信息优选可通过数据存储管理系统或数据存储引擎等进行获取;以静态分析得到的实体依赖关系为基础,将数据读写运行日志和数据统计信息作为输入,可计算得到领域模型中各实体的数据量信息和访问信息;
其中,数据量信息包括数据量和数据增量等,访问信息包括访问频次、实体的访问关联以及属性间的访问关联等。
本发明一可选的实施例中,当所述至少一种数据信息为业务语义与机理信息时,步骤12包括:
步骤12c1,获取业务语义与机理信息;
步骤12c2,以所述实体依赖关系对应的实体的集合为顶点集合,所述实体依赖关系对应的每个实体或每个属性之间业务语义与机理信息的关系为关联边集合,得到业务机理关系信息。
本实施例中,适配和获取业务语义与机理关系,并将其转换为实体与属性之间的关系,即业务语义与机理信息,常见的业务语义与机理信息如属性之间的控制规律影响关系、属性之间的动力学驱动影响关系等;以静态分析得到的实体依赖关系为基础,将实体依赖关系的实体的集合作为顶点集合,将实体依赖关系的每个实体或每个属性之间业务语义与机理信息的关系作为关联边集合,得到业务机理关系信息;该业务机理关系信息优选可以业务机理关系信息图表示,当然还可以以其他形式表示,本申请不以此为限制;
需要说明的是,实体的业务语义与机理信息是指与该实体之间存在控制规律的相关信息,这里的控制规律是指实体控制器的输出信号与输入信号之间的关系,对应于领域模型中的属性与属性之间的关系,由于工业设备或生产过程中的控制规律,由长期经验的总结,具有一定的稳定性,因此,业务语义与机理信息可通过领域机理模型系统、工业业务语义管理系统、工业机理信息管理系统等输入,也可以由用户输入,本申请中不以此为限制。
步骤12中的动态关系信息包括上述的数据加工任务信息和数据加工任务运行日志对应的动态运行信息、数据读写运行日志和数据统计信息对应的数据量信息和访问信息以及业务语义与机理信息对应的业务机理关系信息。
如图3所示,一个具体的实施例3中,基于具体的实施例2的实体依赖关系,得到的数据加工任务信息和数据加工任务运行日志对应的动态运行信息以实线箭头表示,而实线箭头两侧的φ(dtr,dtrs)和τ(dtrs,dtr)分别是实体dara_testing_result的以及实体dara_testing_result_summary的数据量信息和访问信息;业务机理关系信息以两端球状的虚线表示;通过实线箭头表示的动态运行信息、实线箭头两侧的φ(dtr,dtrs)和τ(dtrs,dtr)以及两端球状的虚线表示的业务机理关系信息将数据信息为据加工任务信息、数据加工任务运行日志、数据读写运行日志、数据统计信息以及业务语义与机理信息时,在静态分析得到的实体依赖关系图的基础上体现;需要说明的是,上述的动态运行信息、数据量信息和访问信息以及业务机理关系信息并不一定需要同时在实体依赖关系图中体现。
本发明一可选的实施例中,步骤13包括:
步骤131,根据所述动态关系信息,得到领域模型中每个元素的初始使用度;
步骤132,基于所述实体依赖关系和动态关系信息对所述初始使用度进行迭代计算,得到使用度终值;
步骤133,根据所述使用度终值,得到所述领域模型中每个元素的建议强度值;
步骤134,根据所述建议强度值得到精简建议,并结合所述属性等价类簇,对领域模型进行精简处理,得到精简处理结果。
本实施例中,用于评估领域模型是否进行精简处理的元素包括实体、属性以及关联,实体可记作符号e,属性可记作符号a,关联可记作符号r,通过上述步骤12得到动态关系信息中的数据量信息和访问信息,得到领域模型中每个元素i的初始使用度,可记作udinit(i),使用度用于表示元素被动态使用的程度的一个度量,基于实体依赖关系和动态关系信息,将每个元素i的初始使用度udinit(i)作为输入,进行迭代计算,使得每个元素i的初始使用度udinit(i)在实体依赖关系和动态关系信息中得到充分传递计算,直至收敛或达到迭代上限,得到每个元素i的使用度ud(i),该迭代上限为领域模型的预设的系统参数,根据每个元素i的使用度ud(i),计算每个元素i的建议强度值,建议强度值是使用度的单调递减函数,根据建议强度值得到精简建议,可优选通过“(建议精简元素建议强度)”等格式的精简建议构成有序列表,但本申请不以此为限制;基于精简建议进行精简处理时,应结合属性等价类簇的任意一个元素(属性)需要进行精简或保留时,则在该属性等价类簇内的其他元素(属性)也需要进行精简或保留的性质,进行精简处理,得到精简处理结果;
具体的,对于每个实体e,当每个实体e需要进行精简时,对应的需要精简实体的集合Ep(e)、属性的集合Ap(e)以及关联的集合Rp(e),其中,Ap(e)是所有实体所对应的属性的集合,Rp(e)是所有实体的关联构成的集合,Ep(e)中包括实体依赖关系中所有依赖于实体e的实体集合,即Un∈static-in-edge(e)n,以及动态运行信息中与实体e邻接且边所对应的加工任务的定时运行周期在未来有执行规划的实体的集合,即U(𝑛∈(𝑐ℎ𝑎𝑖𝑛−𝑖𝑛−𝑒d𝑔𝑒(𝑒)U𝑐ℎ𝑎𝑖𝑛−𝑜𝑢𝑡−𝑒d𝑔𝑒(𝑒)),且𝑛与𝑒所对应的数据加工任务存在未来执行规划n,Ep(e)中还包括动态运行信息中与实体e邻接且边所对应的加工任务在过去时间段内有s次作业运行的实体的集合,其中,过去时间段和s次可以是领域模型预设的参数;
对于每个属性a,当每个属性a需要进行精简时,对应的需要精简属性集合A’p(a)、实体集合E’p(a)以及关联集合R’p(a),其中,属性集合A’p(a)是根据属性等价类簇,找出与属性a相关的所有其他等价属性构成的集合,实体集合E’p(a)是去掉属性集合A’p(a)以后的无属性实体或约束减少的实体所构成的集合,关联集合R’p(a)是指实体集合E’p(a)和属性集合A’p(a)的关联构成的集合;
需要说明的是,领域模型元素的精简方法和对应的系统不局限在底层物理系统为单一的物理系统,底层物理系统也可以是多个物理系统,多个物理系统都映射到本发明上述实施例的领域模型中。
另外,精简建议的输出格式优选为(建议精简元素建议强度)构成的有序列表,对于精简建议中提出的建议精简的实体,其关联依赖实体集、依赖属性集以及依赖关联集,当建议精简的实体进行精简处理时,所依赖的这些元素将同时被精简;对于精简建议中提出的建议精简的属性,其关联的依赖实体集、等价属性集以及依赖关联集,当建议精简的属性进行精简处理时,所依赖的这些元素将同时被精简,精简建议中的每个元素都会关联一个精简执行计划,其中涵盖了当要实际执行对该元素精简时,连带会精简的其他元素集合,如,一个执行计划可以由一个模型元素的集合来表示,其内部可按元素类型分组。
一个具体的实施例4中,精简建议可以是,实体e:
(e_exp10_features_10min_test1,0.99)
(e_exp10_features_10min_test2,0.99)
(e_exp10_features_10min_test3,0.99)
(e_exp10_working_conditions,0.98)
(e_exp10_measurements_raw_7s,0.96)
(e_exp10_turbine_subparts,0.94)
(e_exp10_turbine_parts,0.91)
…
属性a:
(a01,0.991)
(a02,0.991)
(a03,0.989)
(a11,0.976)
(a12,0.963)
(a21, 0.940)
…
关联r:
(r11,0.990)
(r12,0.990)
(r21,0.983)
(r31,0.970)
(r32,0.963)
(r33,0.930)
…
基于上述实体et_exp10_turbine_parts,得到精简执行计划为:
{
“e”:[“et_exp10_turbine_subparts”],
“a”:[“a11”,“a12”],
“r”:[“r21”]
}
表示在执行对实体et_exp10_turbine_parts的精简时,会同时精简“et_exp10_turbine_subparts”、“a11”、“a12”以及“r21”。
一个具体的实施例5中,每个元素i的初始使用度udinit(i)可通过公式:
udinit(i)=𝜇d×dday(i)+𝜇w×dweek(i)+𝜇m×dmonth(i)+𝜇hy×dhalf_year(i)+𝜇y×dyear(i)+𝜇ty×dtwo_years(i);
其中,d{time_unit}(i)是在当前最近的time_unit的时间段内的元素i的一个复合量;𝜇{time_unit}是系数,time_unit越大,系数值𝜇{time_unit}越小;
复合量d{time_unit}(i)可通过公式:
d{time_unit}(i)=ρrr×req_reads{time_unit}(i)+ρrw×req_writes{time_unit}(i)+ρd×data{time_unit}(i)+ρdi×data_inc{time_unit}(i)计算得到;
其中,req_reads()表示实体e、属性a或关联r的数据读取量,例如req_reads(e1)表示对实体e1的数据读取量;req_writes()表示实体e、属性a或关联r增加或修改时的数据写入量;data()表示领域模型的元素实体e或属性a所承载的数据量,具体的,该数据量为在time_unit时间段内最近测量的量;data_inc()表示领域模型的元素实体e或属性a的数据增量,具体的,该数据增量是在time_unit时间段内最近测量或平均量。
一个具体的实施例6中,基于具体的实施例5中得到的初始使用度udinit(i),通过公式:
ud(i)=max{maxn∈static-in-edge(i)ud(n),ud(i)};
ud(i)=max{maxn∈chain-in-edge(i)𝜑(i,n)×ud(n),maxm∈chain-out-edge(i)τ(i,m)×ud(m),ud(i)};
ud(i)=max{maxn∈domain-in-edge(i)δ(i,n)×ud(n),maxm∈domain-out-edge(i)γ(i,m)×ud(m),ud(i)};
其中,
𝜑(𝑖,𝑛)=αd×wday(i,n)+αw×wweek(i,n)+αm×wmonth(i,n)+αhy×whalf_year(i,n)+αy×wyear(i,n)+αty×wtwo_year(i,n),
τ(𝑖,n)=βd×rday(i,n)+βw×rweek(i,n)+βm×rmonth(i,n)+βhy×rhalf_year(i,n)+βy×ryear(i,n)+βty×rtwo_years(i,n);
𝜑(𝑖,𝑛)是从n到i的动态运行信息向元素i中所写入的数据量的复合值,即在时间维度上加权和,其取值范围为[0,1];
τ(𝑖,𝑚)是从元素i到元素m的动态运行信息从元素i中所读取的数据量的复合值,即在时间维度上加权和,其取值范围为[0,1];
δ(𝑖,𝑛)是从元素n到元素i的业务机理关系信息对元素i影响的权重系数,其取值范围为[0,1];
γ(𝑖,𝑚)是从元素i到元素m的业务机理关系信息受元素i影响的权重系数,其取值范围为[0,1];
𝑤{𝑡𝑖𝑚𝑒−𝑢𝑛𝑖𝑡}(𝑖,𝑛)是在当前最近time_unit时间段内的从元素n到元素i的动态运行信息向元素i中写入的数据量;
𝑟{𝑡𝑖𝑚𝑒−𝑢𝑛𝑖𝑡}(𝑖,𝑚)是在当前最近time_unit时间段内的从元素i到元素m的动态运行信息从元素i中读取的数据量;
𝛼{𝑡𝑖𝑚𝑒_𝑢𝑛𝑖𝑡}和𝛽{𝑡𝑖𝑚𝑒_𝑢𝑛𝑖𝑡}是系数,time_unit越大,系数值越小;
static_in_edge()表示实体e和属性a在实体依赖关系上的入边集合;
static_out_edge()表示实体和属性a在实体依赖关系上的出边集合;
chain_in_edge()表示实体e和属性a在动态运行信息上的入边集合;
chain_out_edge()表示实体e和属性a在动态运行信息上的出边集集合;
domain_in_edge()表示实体e和属性a在业务机理关系信息上的入边集合;
domain_out_edge()表示实体e和属性a在业务机理关系信息上的出边集合。
一个具体的实施例7中,基于具体的实施例6和7,通过公式:
如图4所示,一个具体的实施例8中,对领域模型进行精简的过程包括:
1.1与领域模型的物理模型库(数据表、数据表的关键字段以及数据表间关系)所在的数据系统连接并适配,该领域模型的元素包括实体、属性、约束、索引、关联等;
1.2通过静态分析得到领域模型的元素间的依赖、关联等关系,静态分析后得到的领域模型包括实体集、实体关联集、属性集、属性组集等;
2.1通过数据处理与分析任务集合,该分析任务集合包括任务集合和任务的输入输出,读取并收集数据加工任务信息,得到数据加工任务集合;
2.2基于步骤1.2的静态分析得到的领域模型的元素间的依赖、关联等关系,对数据加工链路与领域模型元素的依赖关联关系进行分析,得到基于领域模型的数据加工链路关系图;
2.3获取数据处理与分析运行日志,读取得到数据加工任务作业的动态运行情况;
2.4获取数据读写请求运行日志,读取得到数据读写相关的运行信息;
2.5从数据存储系统中收集数据系统信息;
2.6根据工业业务语义和机理,收集工业业务语义与机理关系;
2.7根据静态分析得到的领域模型的元素间的依赖、关联等关系和领域模型的数据加工链路关系图,对步骤2.3的数据加工任务作业的动态运行情况进行分析,得到蕴含运行情况的数据加工链路关系图,该数据加工链路关系图包括加工链路上的数据加工量、加工时长以及速率等;
2.8根据静态分析得到的领域模型的元素间的依赖、关联等关系、步骤2.4中得到的数据读写相关的运行信息以及步骤2.5中收集的数据系统信息,得到领域模型的元素的运行信息,该元素的运行信息包括数据量信息和访问信息等;
2.9根据静态分析得到的领域模型的元素间的依赖、关联等关系和步骤2.6中得到的工业业务语义与机理关系,得到附着工业业务语义的领域模型,常见的工业业务语义包括加入的属性间的动力学驱动影响关系、属性间的控制规律影响关系等;
3.1根据静态分析得到的领域模型的元素间的依赖、关联等关系和步骤2.7至2.9,对领域模型所在的数据系统连接并适配,经计算与分析,得到领域模型的精简建议。
如图5所示,本发明还提供一种业务数据的领域模型的处理系统,该系统包括:领域模型、多模态数据系统、领域模型元素精简建议和计划生成器、静态分析器、至少一个动态分析器等;
其中,多模态数据系统包括机器时间序列数据子系统、质量数据关系型数据子系统以及对象数据子系统等,多模态数据系统用于为静态分析器和至少一个动态分析器提供数据获取的支撑;
静态分析器通过领域模型连接器获取领域模型的元素,静态分析器面向领域模型的元素之间依赖、关联等关系,将领域模型中的元素通过静态分析器进行静态分析得到实体依赖关系和属性等价类簇;
至少一个动态分析器包括数据加工链路与领域模型元素的依赖关系的第一分析器和数据加工链路动态运行分析、数据读写与数据统计的第二分析器,第一分析器通过数据加工链路静态信息收集器从多模态数据系统中获取数据加工任务信息,第二分析器通过数据加工作业的动态运行情况收集器获取数据加工任务运行日志,第二分析器通过数据读写与数据统计信息收集器获取数据读写运行日志和数据统计信息,第二分析器通过工业机理关系收集器从多模态数据系统中获取业务语义与机理信息,通过第一分析器和第二分析器进行动态分析,得到对应的动态关系信息;
通过领域模型元素精简建议和计划生成器,结合静态分析器得到的实体依赖关系和属性等价类簇以及至少一个动态分析器得到的动态关系信息,对领域模型的元素生成精简建议和精简计划。
本发明的实施例中通过对目标系统的业务数据的领域模型进行静态分析,得到所述领域模型中实体的实体依赖关系和领域模型中属性的属性等价类簇;所述领域模型是对业务数据的元信息的描述;基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息;根据所述动态关系信息和所述属性等价类簇,对所述实体依赖关系进行精简处理,得到精简处理结果;实现了对不使用或少使用的领域模型中的元素或数据做提示,帮助用户精简领域模型,同时还可归档或销毁相关无用数据。
如图6所示,本发明还提供一种业务数据的领域模型的处理装置,所述装置60包括:
分析模块61,用于对目标系统的业务数据的领域模型进行静态分析,得到所述领域模型中实体的实体依赖关系和领域模型中属性的属性等价类簇;所述领域模型是对业务数据的元信息的描述;基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息;
处理模块62,用于根据所述动态关系信息和所述属性等价类簇,对所述实体依赖关系进行精简处理,得到精简处理结果。
可选的,对目标系统的业务数据的领域模型进行静态分析,得到所述领域模型中实体的实体依赖关系和领域模型中属性的属性等价类簇,包括:
对目标系统的业务数据的领域模型进行静态分析,得到实体集、实体依赖关系集、属性集以及属性关联关系集;
根据所述实体集和实体依赖关系集,得到所述领域模型中实体的实体依赖关系;
根据所述属性集和属性关联关系集,得到领域模型中属性的属性等价类簇。
可选的,所述数据信息包括以下至少一种:
数据加工任务信息;数据加工任务运行日志;数据读写运行日志;数据统计信息;业务语义与机理信息中至少一种。
可选的,当所述至少一种数据信息为数据加工任务信息和数据加工任务运行日志时,基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息,包括:
按照第一预设周期获取数据加工任务信息;
以所述实体依赖关系对应的实体的集合为顶点集合,所述数据加工任务信息对应的加工任务的集合为关联边集合,得到数据加工任务关系;
按照第二预设周期获取数据加工任务运行日志;
基于所述数据加工任务关系,添加数据加工任务运行日志,得到与所述数据加工任务信息和数据加工任务运行日志对应的动态运行信息。
可选的,当所述至少一种数据信息为数据读写运行日志和数据统计信息时,基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息,包括:
按照第三预设周期获取数据读写运行日志,并按照第四预设周期获取数据统计信息;
根据所述实体依赖关系、所述数据读写运行日志和数据统计信息,得到数据量信息和访问信息。
可选的,当所述至少一种数据信息为业务语义与机理信息时,基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息,包括:
获取业务语义与机理信息;
以所述实体依赖关系对应的实体的集合为顶点集合,所述实体依赖关系对应的每个实体或每个属性之间业务语义与机理信息的关系为关联边集合,得到业务机理关系信息。
可选的,所述处理模块62包括:
第一处理子模块,用于根据所述动态关系信息,得到领域模型中每个元素的初始使用度;
第二处理子模块,用于基于所述实体依赖关系和动态关系信息对所述初始使用度进行迭代计算,得到使用度终值;
第三处理子模块,用于根据所述使用度终值,得到所述领域模型中每个元素的建议强度值;
第四处理子模块,用于根据所述建议强度值得到精简建议,并结合所述属性等价类簇,对领域模型进行精简处理,得到精简处理结果。
需要说明的是,该装置60是与上述方法对应的装置,上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
本发明的实施例提供一种电子设备,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如上述的业务数据的领域模型的处理方法的步骤。
需要说明的是,该电子设备是与上述方法对应的电子设备,上述方法实施例中的所有实现方式均适用于该电子设备的实施例中,也能达到相同的技术效果。
本发明的实施例还提供一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如上述的业务数据的领域模型的处理方法的步骤。
需要说明的是,该可读存储介质是与上述方法对应的可读存储介质,上述方法实施例中的所有实现方式均适用于该可读存储介质的实施例中,也能达到相同的技术效果。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
此外,需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种业务数据的领域模型的处理方法,其特征在于,包括:
对目标系统的业务数据的领域模型进行静态分析,得到所述领域模型中实体的实体依赖关系和领域模型中属性的属性等价类簇;所述领域模型是对业务数据的元信息的描述;
基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息;
根据所述动态关系信息和所述属性等价类簇,对所述实体依赖关系进行精简处理,得到精简处理结果。
2.根据权利要求1所述的业务数据的领域模型的处理方法,其特征在于,对目标系统的业务数据的领域模型进行静态分析,得到所述领域模型中实体的实体依赖关系和领域模型中属性的属性等价类簇,包括:
对目标系统的业务数据的领域模型进行静态分析,得到实体集、实体依赖关系集、属性集以及属性关联关系集;
根据所述实体集和实体依赖关系集,得到所述领域模型中实体的实体依赖关系;
根据所述属性集和属性关联关系集,得到领域模型中属性的属性等价类簇。
3.根据权利要求1所述的业务数据的领域模型的处理方法,其特征在于,所述数据信息包括以下至少一种:
数据加工任务信息;数据加工任务运行日志;数据读写运行日志;数据统计信息;业务语义与机理信息中至少一种。
4.根据权利要求3所述的业务数据的领域模型的处理方法,其特征在于,当所述至少一种数据信息为数据加工任务信息和数据加工任务运行日志时,基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息,包括:
按照第一预设周期获取数据加工任务信息;
以所述实体依赖关系对应的实体的集合为顶点集合,所述数据加工任务信息对应的加工任务的集合为关联边集合,得到数据加工任务关系;
按照第二预设周期获取数据加工任务运行日志;
基于所述数据加工任务关系,添加数据加工任务运行日志,得到与所述数据加工任务信息和数据加工任务运行日志对应的动态运行信息。
5.根据权利要求3所述的业务数据的领域模型的处理方法,其特征在于,当所述至少一种数据信息为数据读写运行日志和数据统计信息时,基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息,包括:
按照第三预设周期获取数据读写运行日志,并按照第四预设周期获取数据统计信息;
根据所述实体依赖关系、所述数据读写运行日志和数据统计信息,得到数据量信息和访问信息。
6.根据权利要求3所述的业务数据的领域模型的处理方法,其特征在于,当所述至少一种数据信息为业务语义与机理信息时,基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息,包括:
获取业务语义与机理信息;
以所述实体依赖关系对应的实体的集合为顶点集合,所述实体依赖关系对应的每个实体或每个属性之间业务语义与机理信息的关系为关联边集合,得到业务机理关系信息。
7.根据权利要求1所述的业务数据的领域模型的处理方法,其特征在于,根据所述动态关系信息和所述属性等价类簇,对所述实体依赖关系进行精简处理,得到精简处理结果,包括:
根据所述动态关系信息,得到领域模型中每个元素的初始使用度;
基于所述实体依赖关系和动态关系信息对所述初始使用度进行迭代计算,得到使用度终值;
根据所述使用度终值,得到所述领域模型中每个元素的建议强度值;
根据所述建议强度值得到精简建议,并结合所述属性等价类簇,对领域模型进行精简处理,得到精简处理结果。
8.一种业务数据的领域模型的处理装置,其特征在于,所述装置包括:
分析模块,用于对目标系统的业务数据的领域模型进行静态分析,得到所述领域模型中实体的实体依赖关系和领域模型中属性的属性等价类簇;所述领域模型是对业务数据的元信息的描述;基于所述实体依赖关系,对所述领域模型的至少一种数据信息进行动态分析,得到与所述至少一种数据信息对应的动态关系信息;
处理模块,用于根据所述动态关系信息和所述属性等价类簇,对所述实体依赖关系进行精简处理,得到精简处理结果。
9.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-7任一项所述的业务数据的领域模型的处理方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-7任一项所述的业务数据的领域模型的处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111559738.8A CN113946634B (zh) | 2021-12-20 | 2021-12-20 | 一种业务数据的领域模型的处理方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111559738.8A CN113946634B (zh) | 2021-12-20 | 2021-12-20 | 一种业务数据的领域模型的处理方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113946634A true CN113946634A (zh) | 2022-01-18 |
CN113946634B CN113946634B (zh) | 2022-03-11 |
Family
ID=79339343
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111559738.8A Active CN113946634B (zh) | 2021-12-20 | 2021-12-20 | 一种业务数据的领域模型的处理方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113946634B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116450768A (zh) * | 2023-06-08 | 2023-07-18 | 昆山工业大数据创新中心有限公司 | 面向低代码开发平台的工业数据处理方法、装置及设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140129269A1 (en) * | 2012-11-02 | 2014-05-08 | Sap Ag | Forecasting Business Entity Characteristics Based on Planning Infrastructure |
CN111475158A (zh) * | 2020-03-16 | 2020-07-31 | 咪咕文化科技有限公司 | 子领域划分方法、装置、电子设备和计算机可读存储介质 |
CN111985232A (zh) * | 2020-08-10 | 2020-11-24 | 南京航空航天大学 | 基于nlp的机载显控系统需求的领域模型提取方法 |
CN112015403A (zh) * | 2020-09-04 | 2020-12-01 | 刘婷婷 | 软件设计方法和系统 |
CN113722936A (zh) * | 2021-10-20 | 2021-11-30 | 山东大学 | 一种面向智能制造的领域建模方法及系统 |
-
2021
- 2021-12-20 CN CN202111559738.8A patent/CN113946634B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140129269A1 (en) * | 2012-11-02 | 2014-05-08 | Sap Ag | Forecasting Business Entity Characteristics Based on Planning Infrastructure |
CN111475158A (zh) * | 2020-03-16 | 2020-07-31 | 咪咕文化科技有限公司 | 子领域划分方法、装置、电子设备和计算机可读存储介质 |
CN111985232A (zh) * | 2020-08-10 | 2020-11-24 | 南京航空航天大学 | 基于nlp的机载显控系统需求的领域模型提取方法 |
CN112015403A (zh) * | 2020-09-04 | 2020-12-01 | 刘婷婷 | 软件设计方法和系统 |
CN113722936A (zh) * | 2021-10-20 | 2021-11-30 | 山东大学 | 一种面向智能制造的领域建模方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116450768A (zh) * | 2023-06-08 | 2023-07-18 | 昆山工业大数据创新中心有限公司 | 面向低代码开发平台的工业数据处理方法、装置及设备 |
CN116450768B (zh) * | 2023-06-08 | 2023-11-24 | 昆山工业大数据创新中心有限公司 | 面向低代码开发平台的工业数据处理方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113946634B (zh) | 2022-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | UniBench: a benchmark for multi-model database management systems | |
Deng et al. | The Data Civilizer System. | |
Silva et al. | SQL: From traditional databases to big data | |
AU2010258731B2 (en) | Generating test data | |
US20090144319A1 (en) | External system integration into automated attribute discovery | |
US20110060769A1 (en) | Destructuring And Restructuring Relational Data | |
Mondal et al. | A new approach for association rule mining and bi-clustering using formal concept analysis | |
Rozsnyai et al. | Discovering event correlation rules for semi-structured business processes | |
Grzesik et al. | Comparative analysis of time series databases in the context of edge computing for low power sensor networks | |
Yu et al. | Scalable and parallel sequential pattern mining using spark | |
Stadler et al. | Sparklify: A scalable software component for efficient evaluation of sparql queries over distributed rdf datasets | |
Bennett et al. | treeman: an R package for efficient and intuitive manipulation of phylogenetic trees | |
CN113946634B (zh) | 一种业务数据的领域模型的处理方法、装置及设备 | |
Pang et al. | PUMA: Parallel subspace clustering of categorical data using multi-attribute weights | |
Rauber et al. | Precisely and persistently identifying and citing arbitrary subsets of dynamic data | |
Hartung et al. | Rule-based generation of diff evolution mappings between ontology versions | |
Davis et al. | The supertree tool kit | |
Sarkar et al. | MapReduce: A comprehensive study on applications, scope and challenges | |
Grossman | What is analytic infrastructure and why should you care? | |
Grasmann et al. | Integration of skyline queries into spark sql | |
Mukherjee et al. | Data mining-based hierarchical transaction model for multi-level consistency management in large-scale replicated databases | |
Wasey et al. | icd: Efficient Computation of Comorbidities from ICD Codes Using Sparse Matrix Multiplication in R | |
Ju et al. | Data Cleaning Optimization for Grain Big Data Processing using Task Merging | |
Yang | Improving the Relevance, Speed, and Computational Efficiency of Semantic Search Through Database Indexing: A Review | |
Gupta et al. | Demystifying Databases: Exploring their Use Cases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |