CN111930357B - 一种可视化建模作业流调度引擎的构建方法 - Google Patents

一种可视化建模作业流调度引擎的构建方法 Download PDF

Info

Publication number
CN111930357B
CN111930357B CN202010981433.5A CN202010981433A CN111930357B CN 111930357 B CN111930357 B CN 111930357B CN 202010981433 A CN202010981433 A CN 202010981433A CN 111930357 B CN111930357 B CN 111930357B
Authority
CN
China
Prior art keywords
model
values
vertexes
execution
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010981433.5A
Other languages
English (en)
Other versions
CN111930357A (zh
Inventor
张宏达
杜蜀薇
马亮
陈仕军
胡若云
王正国
裘炜浩
林森
叶方斌
欧阳柳
杨世旺
金王英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Zhejiang Electric Power Co Ltd
Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
State Grid Zhejiang Electric Power Co Ltd
Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Zhejiang Electric Power Co Ltd, Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd filed Critical State Grid Zhejiang Electric Power Co Ltd
Priority to CN202010981433.5A priority Critical patent/CN111930357B/zh
Publication of CN111930357A publication Critical patent/CN111930357A/zh
Application granted granted Critical
Publication of CN111930357B publication Critical patent/CN111930357B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/20Software design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • G06F16/86Mapping to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明公开了一种可视化建模作业流调度引擎的构建方法,其包括:步骤一,系统依据大数据建模分析流程建立通用定义数据模型,定义作业流执行入参格式;步骤二,系统接收作业流执行入参,系统遵循通用定义数据模型的约束将作业流执行入参的半结构化数据模型解析成图对象模型;步骤三,系统将图对象模型作为作业流执行模块的入参,通过作业流执行模块对图对象模型进行解析,从而构建完成可视化建模作业流调度引擎。本发明可视化建模作业流调度引擎的构建方法为电力行业可视化建模方向、数据ETL方向的作业编排与调度,提供了技术依据,有较好的借鉴意义。

Description

一种可视化建模作业流调度引擎的构建方法
技术领域
本发明涉及电网信息化技术领域,尤其是指一种可视化建模作业流调度引擎的构建方法。
背景技术
随着电网行业信息化建设的发展,系统已积累了大量的营销业务、用电信息、客户服务、统计报表等各类海量数据,但如何挖掘海量数据的价值是面临的最大的挑战,数据价值应用存在很大的提升空间。
可视化建模工具需求,以组件化、可视化的方式,按照大数据建模分析流程,提供从数据读取、数据清洗、数据处理、模型构建、模型固化、模型评估、模型部署等数据建模分析全流程、一体式可闭环组件,提供包括分类、聚类、回归、推荐等支撑大数据分布式并行计算的数据分析算法。因此可视化建模工具建设需要建设一种通用的、普适的作业流调度引擎,用来支撑大数据建模分析流程的定义与构建、执行与调度、以及运维监控。
中国专利公开号CN108492006A,公开日2018年9月4日,名称为《一种层次控制模式的运维作业调度引擎》的发明专利中公开了一种层次控制模式的运维作业调度引擎,包括展示层、处理层和数据层,所述的展示层用于系统统一入口、用户操作、数据展示,用于给用户提供可视化界面,用户通过展示层制定作业引擎模板;所述的处理层用于给用户在展示层编排的任务在后台进行处理;所述的数据层用于实现运维对象终端功能的具体执行,完成展示层用户配置的作业任务,将作业任务执行的结果数据有序获取出来存储在数据库,给展示层提供基础数据。不足之处在于,该专利的作业调度引擎主要用于对运维作业的层次控制,不能满足对可视化建模的提供较好的作业流调度,使用上较为局限。
发明内容
本发明的目的是克服现有技术中的缺点,提供一种可视化建模作业流调度引擎的构建方法。
本发明的目的是通过下述技术方案予以实现:
一种可视化建模作业流调度引擎的构建方法,包括以下步骤:
步骤一,系统依据大数据建模分析流程建立通用定义数据模型,定义作业流执行入参格式;
步骤二,系统接收作业流执行入参,系统遵循通用定义数据模型的约束将作业流执行入参的半结构化数据模型解析成图对象模型;
步骤三,系统将图对象模型作为作业流执行模块的入参,通过作业流执行模块对图对象模型进行解析,从而构建完成可视化建模作业流调度引擎;
所述的步骤二中作业流执行入参的半结构化数据模型解析成图对象模型具体为将半结构化模型中的节点对象抽象为图对象模型中的顶点,半结构化模型中的节点对象依赖关系抽象为图对象模型中的边,顶点和连接顶点的边构成有向无环图,有向无环图即为图对象模型。
顶点对应到业务作业就是算法组件,本方案对大数据建模分析流程的作业流进行了抽象,包含了算法组件属性,使用数组对象存储定义可配置N个算法组件节点,及提供弹性的节点配置普适不同的建模的作业流。由于一般建模的作业流往往需要多个步骤才能完成作业,例如需要经历数据清洗、数据贯彻、模型训练、模型评估等很多节点才能完成作业,本方案的设计正好满足了需求。
作为一种优选方案,所述的通用定义数据模型包括算法组件属性、算法组件输入输出属性和连接对象属性,其中算法组件属性包括数组的若干个节点对象,单个节点对象使用算法组件json定义,单个节点对象包括基础信息和算法参数;算法组件输入输出属性包含在节点对象中,单个节点对象含有算法组件唯一表示、输入输出类型和输入输出值;连接对象属性包括开始节点对象标识、开始节点输出位置、目标节点对象标识和目标节点输入位置。在节点对象之间的连接时,需要考虑不同节点对象之间的个性化差异,即不同算法组件,需要定义的属性是不同的,如类型转换和归一化两个组件,算法配置的参数不同。应用到步骤二中,提取作业流中节点对象、节点对象的输入和输出,节点对象的上下依赖关系(下一个节点对象的执行需要依赖上一个节点对象执行的结果),将json半结构化转换成结构化对象即图对象模型。
作为一种优选方案,所述的顶点包括虚拟顶点、分支顶点、循环顶点和执行顶点,虚拟顶点包括开始虚拟顶点和结束虚拟顶点,开始虚拟顶点为图对象模型数据处理的开始位置,结束虚拟顶点为图对象模型数据处理的结束位置,结束虚拟顶点输出可视化图表或根据可视化图表得出的分析评估结果。
作为一种优选方案,所述的可视化图表包括混淆矩阵、分析评估结果包括根据混淆矩阵的二分类评估结果。
作为一种优选方案,系统检测混淆矩阵的预测结果的准确率A:
A=(a1+b2+c3+……+n)/N,
其中,a1表示混淆矩阵第一行第一个数,b2表示混淆矩阵第二行第二个数,c3表示混淆矩阵第三行第三个数,n表示混淆矩阵第n行第n个数,a1+b2+c3+……+n 为预测和结果一致的数量,N表示样本总量;
若A与预设的准确率值结果一致或两者的差值在设定的阈值内,则说明半结构化数据模型解析成图对象模型的过程正常;若A与预设的准确率值两者的差值不在设定的阈值内,则说明半结构化数据模型解析成图对象模型的过程不正常,系统发出报警并检测执行入参和解析过程是否正确。
混淆矩阵是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示。主要用于比较分类结果和实际测得值,可以把分类结果的精度显示在一个混淆矩阵里面,其中横向行表示实际的测量结果,纵向列表示预测的结果。本设计通过对于混淆矩阵的检测,来判断半结构化数据模型解析成图对象模型的过程是否正常,进而判断可视化建模作业流调度引擎的构建是否正确。事先预设的准确率可由大数据得出,而由于数据会有一定的误差,因此实际准确率A与预设的准确率允许有一定的差值,但是差值过大时,说明半结构化数据模型解析成图对象模型的过程不正常。此外,由于执行入参可能也会出现错误导致准确率A的结果的偏差,因此需要人工或自动判断执行入参的数据是否正确。
作为一种优选方案,选取a1、b2、c3……n中的一个数值,此数值大于剩余其他数值之和,则准确率A=ns/nsall,其中ns为大于剩余其他数值之和的数字,nsall为ns对应的列所有数值之和。
当某一个数值大于剩余其他数值之和,则表示该值为混淆矩阵中最为常见的结果,即在混淆矩阵对应的执行入参中最为常见的结果,因此需要判断此数值对应的准确率。例如,在电力行业中,判断某一个企业的正常用电天数和非正常用电天数,对于一般的企业正常的生产情况下,正常用电天数远大于非正常用电天数,因此只需要判断正常用电天数的准确率A是否正常即可判断半结构化数据模型解析成图对象模型的过程正常。又例如,在判断某一个区域用电负荷的情况,分为正常负荷、超负荷和低于负荷三种情况,正常负荷的时间远大于超负荷和低于负荷的时间,而超负荷和低于负荷的时间由于样本数量较小准确率的误差会较大,因此只需要判断正常负荷的准确率的情况。
作为一种优选方案,选取a1、b2、c3……n中的某一个或几个数值,此类数值均小于剩余其他数值,则准确率A=nt/ntall,其中nt为均小于剩余其他数值的一个或几个数值,ntall为此类数值对应的列所有数值之和。此设计根据实际情况灵活设计,例如,在电力行业中,需要估算电网发生故障停电的时间,而电网发生故障停电的时间占总时间的量较小,而根据实际需要要求分析电网故障的时间时,需要判断预测故障的准确率。
作为一种优选方案,所述的步骤三中,解析的具体过程为:基于JGraphT图算法库,使用广度优先遍历算法进行顶点调度,对于同一层的顶点并行调用,对于存在依赖上下关系的顶点使用串行调用并把上一顶点执行结果根据依赖关系传递给下一顶点执行。
作为一种优选方案,在顶点对象调度前、调度过程中以及调度后使用钩子接口松耦合方式不侵入作业流执行模块实现的情况下满足个性化需求定义。
作为一种优选方案,在执行监控方面,执行状态包含等待执行、执行中、执行成功、执行失败、取消执行以及详细非结构化过程执行日志。
本发明的有益效果是:可视化建模作业流调度引擎的构建方法为可视化建模的作业流构建提供了数据模型依据;同时可视化建模作业流调度引擎还能进行自我检查,判断构建的过程是否正确;可视化建模作业流调度引擎的构建方法为电力行业可视化建模方向、数据ETL方向的作业编排与调度,提供了技术依据,有较好的借鉴意义。
附图说明
图1是本发明的一种流程图;
图2是本发明的一种有向无环图。
具体实施方式
下面结合附图和实施例对本发明进一步描述。
实施例1:
一种可视化建模作业流调度引擎的构建方法,如图1所示,包括以下步骤:
步骤一,系统依据大数据建模分析流程建立通用定义数据模型,定义作业流执行入参格式;
步骤二,系统接收作业流执行入参,系统遵循通用定义数据模型的约束将作业流执行入参的半结构化数据模型解析成图对象模型;
步骤三,系统将图对象模型作为作业流执行模块的入参,通过作业流执行模块对图对象模型进行解析,从而构建完成可视化建模作业流调度引擎;
所述的步骤二中作业流执行入参的半结构化数据模型解析成图对象模型具体为将半结构化模型中的节点对象抽象为图对象模型中的顶点,半结构化模型中的节点对象依赖关系抽象为图对象模型中的边,顶点和连接顶点的边构成有向无环图,有向无环图即为图对象模型。
顶点对应到业务作业就是算法组件,本方案对大数据建模分析流程的作业流进行了抽象,包含了算法组件属性,使用数组对象存储定义可配置N个算法组件节点,及提供弹性的节点配置普适不同的建模的作业流。由于一般建模的作业流往往需要多个步骤才能完成作业,例如需要经历数据清洗、数据贯彻、模型训练、模型评估等很多节点才能完成作业,本方案的设计正好满足了需求。
所述的通用定义数据模型包括算法组件属性、算法组件输入输出属性和连接对象属性,其中算法组件属性包括数组的若干个节点对象,单个节点对象使用算法组件json定义,单个节点对象包括基础信息和算法参数;算法组件输入输出属性包含在节点对象中,单个节点对象含有算法组件唯一表示、输入输出类型和输入输出值;连接对象属性包括开始节点对象标识、开始节点输出位置、目标节点对象标识和目标节点输入位置。在节点对象之间的连接时,需要考虑不同节点对象之间的个性化差异,即不同算法组件,需要定义的属性是不同的,如类型转换和归一化两个组件,算法配置的参数不同。应用到步骤二中,提取作业流中节点对象、节点对象的输入和输出,节点对象的上下依赖关系(下一个节点对象的执行需要依赖上一个节点对象执行的结果),将json半结构化转换成结构化对象即图对象模型。
Json是一种轻量级的数据交换格式。它基于 ECMAScript (欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。 同时json易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。
所述的顶点包括虚拟顶点、分支顶点、循环顶点和执行顶点,虚拟顶点包括开始虚拟顶点和结束虚拟顶点,开始虚拟顶点为图对象模型数据处理的开始位置,结束虚拟顶点为图对象模型数据处理的结束位置,结束虚拟顶点输出可视化图表或根据可视化图表得出的分析评估结果。
所述的可视化图表包括混淆矩阵、分析评估结果包括根据混淆矩阵的二分类评估结果。
如图2所示,是一种有向无环图的具体表达形式,包括13个顶点,即13个算法组件,根据有向无环图,定义了数据模型和分析流程,数据通过数据表进行读取,部分数据需要进行归一化处理后输出折线或柱状图,部分数据直接输出散点图和柱状图,部分数据输入后进行预测,得出混淆矩阵和二分类评估,其中,读数据表算法组件属性规范可定义如下:
“dom”: [{
“id”: “READ_TABLE_fjcexjiemuabrmy1”,
“label”: “读数据表”,
“dt_id”: “AI0001”,
“style”: {
“left”: “481px”,
“top”: “16px”
},
“desc”: “读取特征表”,
“status”:”SUCCESS”,
“viewdata”: [],
“prop”: {
“tableName”: “”
“columnDesc”: [],
“stepEngine”: “restapi”
}
}]
其他算法组件与读数据表算法组件属性规范定义类似,根据每个算法组件不同的需求灵活调整。
系统检测混淆矩阵的预测结果的准确率A:
A=(a1+b2+c3+……+n)/N,
其中,a1表示混淆矩阵第一行第一个数,b2表示混淆矩阵第二行第二个数,c3表示混淆矩阵第三行第三个数,n表示混淆矩阵第n行第n个数,a1+b2+c3+……+n 为预测和结果一致的数量,N表示样本总量;
若A与预设的准确率值结果一致或两者的差值在设定的阈值内,则说明半结构化数据模型解析成图对象模型的过程正常;若A与预设的准确率值两者的差值不在设定的阈值内,则说明半结构化数据模型解析成图对象模型的过程不正常,系统发出报警并检测执行入参和解析过程是否正确。
混淆矩阵是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示。主要用于比较分类结果和实际测得值,可以把分类结果的精度显示在一个混淆矩阵里面,其中横向行表示实际的测量结果,纵向列表示预测的结果。本设计通过对于混淆矩阵的检测,来判断半结构化数据模型解析成图对象模型的过程是否正常,进而判断可视化建模作业流调度引擎的构建是否正确。事先预设的准确率可由大数据得出,而由于数据会有一定的误差,因此实际准确率A与预设的准确率允许有一定的差值,但是差值过大时,说明半结构化数据模型解析成图对象模型的过程不正常。此外,由于执行入参可能也会出现错误导致准确率A的结果的偏差,因此需要人工或自动判断执行入参的数据是否正确。
所述的步骤三中,解析的具体过程为:基于JGraphT图算法库,使用广度优先遍历算法进行顶点调度,对于同一层的顶点并行调用,对于存在依赖上下关系的顶点使用串行调用并把上一顶点执行结果根据依赖关系传递给下一顶点执行。Jgrapht图算法库是用java语言编写的算法库,适用于处理图数据结构的大多数算法,求最短路径等算法。
在顶点对象调度前、调度过程中以及调度后使用钩子接口松耦合方式不侵入作业流执行模块实现的情况下满足个性化需求定义。
在执行监控方面,执行状态包含等待执行、执行中、执行成功、执行失败、取消执行以及详细非结构化过程执行日志。 本发明中,执行引擎默认支持For循环执行引擎、Restful API执行引擎、Spark执行引擎、Shell执行引擎、Python执行引擎,其中Spark执行引擎作为客户端角色使用Akka通信调用分布式机器学习算法服务。
实施例2:一种可视化建模作业流调度引擎的构建方法,其原理和实施方法与实施例1基本相同,不同之处在于,在混淆矩阵的预测结果的准确率的计算中,选取a1、b2、c3……n中的一个数值,此数值大于剩余其他数值之和,则准确率A=ns/nsall,其中ns为大于剩余其他数值之和的数字,nsall为ns对应的列所有数值之和。
当某一个数值大于剩余其他数值之和,则表示该值为混淆矩阵中最为常见的结果,即在混淆矩阵对应的执行入参中最为常见的结果,因此需要判断此数值对应的准确率。例如,在电力行业中,判断某一个企业的正常用电天数和非正常用电天数,对于一般的企业正常的生产情况下,正常用电天数远大于非正常用电天数,因此只需要判断正常用电天数的准确率A是否正常即可判断半结构化数据模型解析成图对象模型的过程正常,又例如,在判断某一个区域用电负荷的情况,分为正常负荷、超负荷和低于负荷三种情况,正常负荷的时间远大于超负荷和低于负荷的时间,而超负荷和低于负荷的时间由于样本数量较小准确率的误差会较大,因此只需要判断正常负荷的准确率的情况。
实施例3:一种可视化建模作业流调度引擎的构建方法,其原理和实施方法与实施例1基本相同,不同之处在于,在混淆矩阵的预测结果的准确率的计算中,选取a1、b2、c3……n中的某一个或几个数值,此类数值均小于剩余其他数值,则准确率A=nt/ntall,其中nt为均小于剩余其他数值的一个或几个数值,ntall为此类数值对应的列所有数值之和。此设计根据实际情况灵活设计,例如,在电力行业中,需要估算电网发生故障停电的时间,而电网发生故障停电的时间占总时间的量较小,而根据实际需要要求分析电网故障的时间时,需要判断预测故障的准确率。
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。

Claims (6)

1.一种可视化建模作业流调度引擎的构建方法,其特征是,包括以下步骤:
步骤一,系统依据大数据建模分析流程建立通用定义数据模型,定义作业流执行入参格式;
步骤二,系统接收作业流执行入参,系统遵循通用定义数据模型的约束将作业流执行入参的半结构化数据模型解析成图对象模型;
步骤三,系统将图对象模型作为作业流执行模块的入参,通过作业流执行模块对图对象模型进行解析,从而构建完成可视化建模作业流调度引擎;
所述的步骤二中作业流执行入参的半结构化数据模型解析成图对象模型具体为将半结构化模型中的节点对象抽象为图对象模型中的顶点,半结构化模型中的节点对象依赖关系抽象为图对象模型中的边,顶点和连接顶点的边构成有向无环图,有向无环图即为图对象模型;
所述的顶点包括虚拟顶点、分支顶点、循环顶点和执行顶点,虚拟顶点包括开始虚拟顶点和结束虚拟顶点,开始虚拟顶点为图对象模型数据处理的开始位置,结束虚拟顶点为图对象模型数据处理的结束位置,结束虚拟顶点输出可视化图表或根据可视化图表得出的分析评估结果;所述的可视化图表包括混淆矩阵,分析评估结果包括根据混淆矩阵的二分类评估结果;
系统检测混淆矩阵的预测结果的准确率A:
A=(a1+b2+c3+……+n)/N,
其中,a1表示混淆矩阵第一行第一个数,b2表示混淆矩阵第二行第二个数,c3表示混淆矩阵第三行第三个数,n表示混淆矩阵第n行第n个数,a1+b2+c3+……+n 为预测和结果一致的数量,N表示样本总量;
若A与预设的准确率值结果一致或两者的差值在设定的阈值内,则说明半结构化数据模型解析成图对象模型的过程正常;若A与预设的准确率值两者的差值不在设定的阈值内,则说明半结构化数据模型解析成图对象模型的过程不正常,系统发出报警并检测执行入参和解析过程是否正确。
2.根据权利要求1所述的一种可视化建模作业流调度引擎的构建方法,其特征是,所述的通用定义数据模型包括算法组件属性、算法组件输入输出属性和连接对象属性,其中算法组件属性包括数组的若干个节点对象,单个节点对象使用算法组件json定义,单个节点对象包括基础信息和算法参数;算法组件输入输出属性包含在节点对象中,单个节点对象含有算法组件唯一表示、输入输出类型和输入输出值;连接对象属性包括开始节点对象标识、开始节点输出位置、目标节点对象标识和目标节点输入位置。
3.根据权利要求1所述的一种可视化建模作业流调度引擎的构建方法,其特征是,选取a1、b2、c3……n中的一个数值,此数值大于剩余其他数值之和,则准确率A=ns/nsall,其中ns为大于剩余其他数值之和的数字,nsall为ns对应的列所有数值之和。
4.根据权利要求1所述的一种可视化建模作业流调度引擎的构建方法,其特征是,选取a1、b2、c3……n中的某一个或几个数值,此类数值均小于剩余其他数值,则准确率A=nt/ntall,其中nt为均小于剩余其他数值的一个或几个数值,ntall为此类数值对应的列所有数值之和。
5.根据权利要求1所述的一种可视化建模作业流调度引擎的构建方法,其特征是,所述的步骤三中,解析的具体过程为:基于JGraphT图算法库,使用广度优先遍历算法进行顶点调度,对于同一层的顶点并行调用,对于存在依赖上下关系的顶点使用串行调用并把上一顶点执行结果根据依赖关系传递给下一顶点执行。
6.根据权利要求5所述的一种可视化建模作业流调度引擎的构建方法,其特征是,在顶点对象调度前、调度过程中以及调度后使用钩子接口松耦合方式不侵入作业流执行模块实现的情况下满足个性化需求定义。
CN202010981433.5A 2020-09-17 2020-09-17 一种可视化建模作业流调度引擎的构建方法 Active CN111930357B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010981433.5A CN111930357B (zh) 2020-09-17 2020-09-17 一种可视化建模作业流调度引擎的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010981433.5A CN111930357B (zh) 2020-09-17 2020-09-17 一种可视化建模作业流调度引擎的构建方法

Publications (2)

Publication Number Publication Date
CN111930357A CN111930357A (zh) 2020-11-13
CN111930357B true CN111930357B (zh) 2021-01-15

Family

ID=73334590

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010981433.5A Active CN111930357B (zh) 2020-09-17 2020-09-17 一种可视化建模作业流调度引擎的构建方法

Country Status (1)

Country Link
CN (1) CN111930357B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159599B (zh) * 2021-04-29 2022-06-28 长江勘测规划设计研究有限责任公司 一种水库洪水调度方案的结构化解析驱动方法
CN114880385B (zh) * 2021-07-27 2022-11-22 云南省地质环境监测院(云南省环境地质研究院) 一种通过自动组合流程接入地质灾害数据的方法及装置
CN114626206B (zh) * 2022-02-22 2023-02-10 南京理工大学 一种面向交直流配电网的电动汽车时空调度建模方法
CN114936026B (zh) * 2022-07-22 2022-11-11 北京寄云鼎城科技有限公司 一种半结构化数据的解析方法、系统、存储介质和设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8510751B2 (en) * 2010-03-18 2013-08-13 International Business Machines Corporation Optimizing workflow engines
CN103106188B (zh) * 2013-02-21 2016-01-13 用友网络科技股份有限公司 数据模型的图形化分析系统和图形化分析方法
CN107450972B (zh) * 2017-07-04 2020-10-16 创新先进技术有限公司 一种调度方法、装置以及电子设备
CN110377769B (zh) * 2019-06-14 2023-07-25 创新先进技术有限公司 基于图数据结构的建模平台系统、方法、服务器及介质

Also Published As

Publication number Publication date
CN111930357A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
CN111930357B (zh) 一种可视化建模作业流调度引擎的构建方法
Castellanos et al. ibom: A platform for intelligent business operation management
CN107016480B (zh) 任务调度方法、装置及系统
US20210133622A1 (en) Ml-based event handling
US8612805B2 (en) Processor system optimization supporting apparatus and supporting method
US8175852B2 (en) Method of, and system for, process-driven analysis of operations
CN107015901B (zh) 一种日志分析方法及装置
CN113946499A (zh) 一种微服务链路跟踪及性能分析方法、系统、设备及应用
US7765436B2 (en) Process for software support resource allocation based on analysis of categorized field problems
CN112379884A (zh) 基于Spark和并行内存计算的流程引擎实现方法及系统
CN113010598A (zh) 面向遥感大数据处理的动态自适应分布式协同工作流系统
Le et al. DirectDebug: Automated testing and debugging of feature models
Bielefeld Online performance anomaly detection for large-scale software systems
CN113806429A (zh) 基于大数据流处理框架的画布式日志分析方法
CN110489093A (zh) 一种面向ai应用的持续构造方法、装置、终端及存储介质
Diao et al. Generic on-line discovery of quantitative models for service level management
Cunha et al. Context-aware execution migration tool for data science Jupyter Notebooks on hybrid clouds
CN106779404B (zh) 一种流程预告警方法和装置
CN110516000B (zh) 一种支持复杂工作流结构的工作流管理系统
CN115829297B (zh) 装配式建筑的工作包生成方法、装置、终端及存储介质
Kano et al. Analysis and simulation of business solutions in a service-oriented architecture
US11494713B2 (en) Robotic process automation analytics platform
CN114546425A (zh) 模型部署方法、装置、电子设备及存储介质
CN110399296B (zh) 测试客户端与服务端之间交互接口的方法、系统和介质
CN112364071A (zh) 货值数据分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Zhang Hongda

Inventor after: OuYang Liu

Inventor after: Yang Shiwang

Inventor after: Jin Wangying

Inventor after: Du Shuwei

Inventor after: Ma Liang

Inventor after: Chen Shijun

Inventor after: Hu Ruoyun

Inventor after: Wang Zhengguo

Inventor after: Qiu Weihao

Inventor after: Lin Sen

Inventor after: Ye Fangbin

Inventor before: Zhang Hongda

Inventor before: OuYang Liu

Inventor before: Yang Shiwang

Inventor before: Jin Wangying

Inventor before: Du Shuwei

Inventor before: Ma Liang

Inventor before: Chen Shijun

Inventor before: Hu Ruoyun

Inventor before: Wang Zhengguo

Inventor before: Qiu Weihao

Inventor before: Lin Sen

Inventor before: Ye Fangbin