CN116595760A - 大数据模型的构建方法、装置、电子设备和可读存储介质 - Google Patents
大数据模型的构建方法、装置、电子设备和可读存储介质 Download PDFInfo
- Publication number
- CN116595760A CN116595760A CN202310558720.9A CN202310558720A CN116595760A CN 116595760 A CN116595760 A CN 116595760A CN 202310558720 A CN202310558720 A CN 202310558720A CN 116595760 A CN116595760 A CN 116595760A
- Authority
- CN
- China
- Prior art keywords
- node
- nodes
- big data
- data model
- task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013499 data model Methods 0.000 title claims abstract description 118
- 238000010276 construction Methods 0.000 title description 4
- 238000000034 method Methods 0.000 claims abstract description 69
- 238000012546 transfer Methods 0.000 claims abstract description 20
- 230000005540 biological transmission Effects 0.000 claims abstract description 9
- 238000004364 calculation method Methods 0.000 claims description 55
- 238000004422 calculation algorithm Methods 0.000 claims description 34
- 238000012545 processing Methods 0.000 claims description 27
- 238000004458 analytical method Methods 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000007726 management method Methods 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 10
- 238000007405 data analysis Methods 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- 238000013439 planning Methods 0.000 description 2
- 238000012732 spatial analysis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Geometry (AREA)
- Educational Administration (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Computer Hardware Design (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种大数据模型的构建方法、装置、电子设备和可读存储介质,包括:获得选择信息,所述选择信息是基于工作流选择至少三个节点的操作生成;分析所述选择信息得到所述至少三个节点的排序;将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型。本实施例中,操作者基于工作流选择多个节点,获得基于选择操作生成的选择信息,分析该选择信息得到选择的多个节点的排序,将该多个节点按照排序进行参数传递,实现了自动对于参数传递,得到工作流对应的大数据模型,无需人工手动控制提交顺序维护每个任务的输出参数输入参数,实现了统一管理。
Description
技术领域
本申请涉及数据处理领域,更具体的说,是涉及一种大数据模型的构建方法、装置、电子设备和可读存储介质。
背景技术
大数据计算任务作为一种能够进行大规模数据处理的任务处理方式,广泛应用于各种大数据分析场景中。
比如,在空间大数据分析应用场景中,分析任务常常有多个大数据任务串/并联完成。
在多数空间分析应用场景中,一个分析模型常常由多个大数据任务组成,这些大数据任务通常需要单独配置、单独提交、单独维护。只是在业务体系下形成一个逻辑模型,并没有完成形成一个整体。
因此,现有的分析模型配置繁琐,还需要手动控制提交顺序、手动维护每一个任务的输入参数和输出参数,无法统一管理,比较繁琐,维护成本高。
发明内容
有鉴于此,本申请提供了一种大数据模型的构建方法、装置、电子设备和可读存储介质,如下:
一种大数据模型的构建方法,包括:
获得选择信息,所述选择信息是基于依据工作流选择至少三个节点的操作生成;
分析所述选择信息得到所述至少三个节点的排序;
将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型。
可选的,上述的方法,所述获得选择信息,包括:
接收操作信息,所述操作信息基于对于显示界面中显示内容进行的操作生成;
分析所述操作信息,得到所述操作选中的区域对应的至少三个节点。
可选的,上述的方法,所述分析所述操作信息,得到所述操作选中的区域对应的至少三个节点,包括:
分析所述操作信息,得到所述操作信息在所述显示界面对应的目标区域;
基于所述目标区域对应数据源节点所在的第一区域,确定选择的节点为数据源节点,所述数据源节点用于提供数据源;
基于所述目标区域对应任务节点所在的第二区域,确定选择的节点为任务节点,所述任务节点用于至少基于数据源节点提供的数据源进行数据计算;
基于所述目标区域对应插件节点所在的第三区域,确定选择的节点为插件节点,所述插件节点用于按照预设转换规则,将所述任务节点的计算结果进行转换得到输出结果。
可选的,上述的方法,所述分析所述选择信息得到所述至少三个节点的排序,包括:
基于所述选择信息依次确定所述至少三个节点中任意两个节点的排序;
获得所述至少三个节点的类型,所述节点的类型包括数据源节点、任务节点和插件节点;
基于至少三个节点中任意两个节点的排序以及所述至少三个节点的类型确定与工作流对应的所述至少三个节点的排序。
可选的,上述的方法,还包括:
确定预设结果库;
在所述任务节点后连接所述预设结果库,以将所述任务节点的计算结果写入到所述预设结果库,所述插件节点从所述预设结果库读取所述计算结果。
可选的,上述的方法,所述将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型,包括:
获得第一节点的算法标识;
基于所述算法标识获得第一节点的输出参数;
基于所述第一节点的输出参数更新第二节点的输入参数,所述第二节点与第一节点相邻且所述第二节点基于第一节点的计算结果进行数据处理。
可选的,上述的方法,所述将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型之后,还包括:
将所述大数据模型上传至平台服务器,以基于所述平台服务器生成的运行指令控制所述大数据模型进行数据处理输出处理结果。
一种大数据模型的构建装置,包括:
获得模块,用于获得选择信息,所述选择信息是基于依据工作流选择至少三个节点的操作生成;
分析模块,用于分析所述选择信息得到所述至少三个节点的排序;
传递模块,用于将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型。
一种电子设备,包括:存储器、处理器;
其中,存储器存储有处理程序;
所述处理器用于加载并执行所述存储器存储的所述处理程序,以实现如上述任一项所述的大数据模型的构建方法的各步骤。
一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器调用并执行,实现如上述任一项所述的大数据模型的构建方法的各步骤。
综上,本申请提供的一种大数据模型的构建方法,包括:获得选择信息,所述选择信息是基于工作流选择至少三个节点的操作生成;分析所述选择信息得到所述至少三个节点的排序;将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型。本实施例中,操作者基于工作流选择多个节点,获得基于选择操作生成的选择信息,分析该选择信息得到选择的多个节点的排序,将该多个节点按照排序进行参数传递,实现了自动对于参数传递,得到工作流对应的大数据模型,无需人工手动控制提交顺序维护每个任务的输出参数输入参数,实现了统一管理。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本申请提供的一种大数据模型的构建方法实施例1的流程图;
图2是本申请提供的一种大数据模型的构建方法实施例2的流程图;
图3是本申请提供的一种大数据模型的构建方法实施例3的流程图;
图4是本申请提供的一种大数据模型的构建方法实施例3中大数据模型示意图;
图5是本申请提供的一种大数据模型的构建方法实施例4的流程图;
图6是本申请提供的一种大数据模型的构建方法实施例5的流程图;
图7是本申请提供的一种大数据模型的构建方法实施例5中大数据模型示意图;
图8是本申请提供的一种大数据模型的构建方法实施例5中任务节点的参数配置界面示意图;
图9是本申请提供的一种大数据模型的构建方法实施例6的流程图;
图10是本申请提供的一种大数据模型的构建装置实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1所示的,为本申请提供的一种大数据模型的构建方法实施例1的流程图,该方法应用于一电子设备,该方法包括以下步骤:
步骤S101:获得选择信息;
其中,所述选择信息是基于依据工作流选择至少三个节点的操作生成。
其中,在构建大数据模型时,操作者可以依据处理数据的工作流选择涉及的多个节点。
具体的,基于该操作者的操作生成选择信息,执行本实施例中方法的电子设备获得该选择信息。
其中,该操作者执行的操作可以是多个操作动作组成,本申请中不对于选择信息对应的操作动作个数做限制。
后续实施例中会针对该获得选择信息的过程进行详细说明,本实施例中不做详述。
步骤S102:分析所述选择信息得到所述至少三个节点的排序;
其中,对于获得的该选择信息进行分析,得到该选择信息选择的多个节点的排序。
其中,该多个节点的排序是基于工作流进行的排序。
具体的,由于多个节点的功能不同,其在工作流中的位置不同,相应的,操作者在基于工作流进行选择节点时,具体是根据数据处理的先后顺序进行的选择,因此,基于该选择信息中选择节点的先后顺序,可以确定该多个节点的排序。
需要说明的是,后续实施例中会针对该多个节点的排序过程进行详细说明,本实施例中不做详述。
步骤S103:将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型。
其中,在确定了各个节点的排序后,按照该排序,对于节点进行参数传递,以使得前后节点间的参数统一。
其中,对于各个节点进行参数传递,得到该工作流对应的大数据模型。
需要说明的是,该多个节点排序以及参数传递,实现节点的连接,而该多个节点的连接,整体上可以采用串并联的方式形成一个完整的模型,对于该模型中各个节点进行参数传递,得到大数据模型。
具体实施中,本申请中的大数据模型采用的spark大数据框架。通过该spark大数据框架,应用于空间大数据分析场景中,该分析任务采用任务串并联方式完成,在本实施例中,不同的任务采用不同的节点执行,节点之间通过串并联的方式形成完整的模型。
具体实施中,该大数据模型能够对于空间大数据分析,具体是用于空间分析场景中。该空间分析是一种基于地理对象位置特征的空间数据分析技术,该分析方法常应用于城市规划、资源管理、交通规划、资源管理等。
综上,本实施例提供的一种大数据模型的构建方法,包括:获得选择信息,所述选择信息是基于工作流选择至少三个节点的操作生成;分析所述选择信息得到所述至少三个节点的排序;将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型。本实施例中,操作者基于工作流选择多个节点,获得基于选择操作生成的选择信息,分析该选择信息得到选择的多个节点的排序,将该多个节点按照排序进行参数传递,实现了自动对于参数传递,得到工作流对应的大数据模型,无需人工手动控制提交顺序维护每个任务的输出参数输入参数,实现了统一管理。
如图2所示的,为本申请提供的一种大数据模型的构建方法实施例2的流程图,该方法包括以下步骤:
步骤S201:接收操作信息,所述操作信息基于对于显示界面中显示内容进行的操作生成;
其中,在执行本实施例的电子设备设置有显示界面,该显示界面中显示若干节点图标等信息。
具体的,该显示界面中显示的节点包括能够形成工作流所需的各种类型的节点,如数据源节点、任务节点以及插件节点等。
其中,操作者可以通过输入设备对于该显示界面中显示内容进行操作,以实现选择其中的某些节点。
其中,该操作信息包括:点击操作信息和/或滑动轨迹信息等。
具体的,操作者可以通过点选显示界面中的节点图标的方式,实现对于节点的选择,也可以是以滑动轨迹经过的节点图标的方式,实现对于节点的选择。当然,对于节点的选择方式不限制于此,具体实施中可以根据实际情况设置对于显示界面中显示内容的操作方式。
步骤S202:分析所述操作信息,得到所述操作选中的区域对应的至少三个节点;
其中,对于该操作信息进行分析,可以确定该操作信息在显示界面中对应的选中区域,进一步确定该选中区域中所显示的节点信息,进而可以确定该操作信息选中的节点。
其中,在显示界面中不同显示区域显示的节点图标对应的节点功能不同,如第一区域显示数据源节点图标,第二区域显示任务节点图标,第三区域显示插件节点图标。
具体的,该步骤S202包括:
步骤S2021:分析所述操作信息,得到所述操作信息在所述显示界面对应的目标区域;
步骤S2022:基于所述目标区域对应数据源节点所在的第一区域,确定选择的节点为数据源节点,所述数据源节点用于提供数据源;
步骤S2023:基于所述目标区域对应任务节点所在的第二区域,确定选择的节点为任务节点,所述任务节点用于至少基于数据源节点提供的数据源进行数据计算;
步骤S2024:基于所述目标区域对应插件节点所在的第三区域,确定选择的节点为插件节点,所述插件节点用于按照预设转换规则,将所述任务节点的计算结果进行转换得到输出结果。
其中,该插件节点可以将任务节点中特定数据格式的计算结果进行转换为约定的格式。
其中,该约定的格式可以基于大数据模型应用场景配置,以满足不同应用场景下的数据格式要求,本申请中不对于该约定的格式的具体形式做限制。
其中,在确定了操作信息在显示界面中对应的目标区域后,确定该目标区域中显示的节点。
具体的,基于该目标区域显示的节点,确定选中的节点。
步骤S203:分析所述选择信息得到所述至少三个节点的排序;
步骤S204:将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型。
其中,步骤S203-204与实施例1中的相应步骤一致,本实施例中不做赘述。
综上,本实施例提供的一种大数据模型的构建方法,包括:接收操作信息,所述操作信息基于对于显示界面中显示内容进行的操作生成;分析所述操作信息,得到所述操作选中的区域对应的至少三个节点。本实施例中,接收基于操作者对于显示界面中显示内容进行操作生成的操作信息,分析该操作信息得到选中的多个节点,通过操作者对于显示界面中的显示内容进行选择节点,实现了对于大数据模型中包含的节点进行可视化操作。
如图3所示的,为本申请提供的一种大数据模型的构建方法实施例3的流程图,该方法包括以下步骤:
步骤S301:接收操作信息;
步骤S302:分析所述操作信息,得到所述操作选中的区域对应的至少三个节点;
其中,步骤S301-302与实施例2中的相应步骤一致,本实施例中不做赘述。
步骤S303:基于所述选择信息依次确定所述至少三个节点中任意两个节点的排序;
其中,对于该选择信息进行分析,得到选择多个节点的顺序。
例如,该选择信息是依次选择了节点A至B,节点A至C、节点B至C,则可以得到节点ABC的排序分别是A至B、A至C和B至C。
步骤S304:获得所述至少三个节点的类型;
其中,所述节点的类型包括数据源节点、任务节点和插件节点;
其中,所述数据源节点用于提供数据源,所述任务节点用于至少基于数据源节点提供的数据源进行数据计算,所述插件节点用于按照预设转换规则,将所述任务节点的计算结果进行转换得到输出结果。
具体实施中,该任务节点是直接或者间接基于数据源节点提高的数据源进行的数据计算。
若该任务节点与数据源节点直接相连,该任务节点基于该数据节点提供的数据源进行数据计算;若该任务节点与数据源节点通过其他任务节点相连,该任务节点基于其他任务节点的计算结果进行数据计算。
其中,任务节点可以与任何节点相连,如任务节点、数据源节点和插件节点,而且,某一任务节点与一节点相连得到一工作流,该工作流可以与大数据模型中的其他工作流并联或者串联。
其中,执行本实施例的电子设备中预设有各个节点的类型,基于选中的多个节点,确定该多个节点对应的类型。
需要说明的是,该多个节点中包括一个或者多个数据源节点、一个或者多个任务节点和一个插件节点。
需要说明的是,一个任务节点执行一项计算任务,其上可以设置某一特定算法,该任务节点可以被重复利用,无需针对同一算法设置多个任务节点。
步骤S305:基于至少三个节点中任意两个节点的排序以及所述至少三个节点的类型确定与工作流对应的所述至少三个节点的排序;
需要说明的是,大数据模型中各个节点的连接有规则,数据源节点作为起始节点、插接节点作为结束节点,该大数据模型中不能出现环,如数据源节点不能与数据源节点相连,插件节点不能与插件节点相连。
相应的,基于选择的多个节点中任意两个节点的排序,结合该多个节点的类型,确定该多个节点的排序。
其中,由于数据源节点作为提供数据源的节点,其作为构建大数据模型的起始节点,其之前不能连接节点,若该数据源节点之前连接有节点,报错,构建大数据模型结束。
其中,由于插件节点作为输出结果的节点,其作为构建大数据模型的结束节点,其之后不能连接节点,若该插件节点之后连接有节点,报错,构建大数据模型结束。
其中,若工作流有串并联的情况,相应的,该多个节点的排序中有任务节点属于两个工作流的情况。
其中,任务节点之间使用相同的数据格式以保证数据传递。
具体的,在任务节点中的算法编写时采用相同的规范,该规范中规定数据的数据格式,以保证各个任务节点间采用相同的数据格式来实现数据的流程。
例如,某一业务场景中,需要将两个图层进行叠加分析,分析后需要存储分析结果,然后对此分析结果进行属性汇总,且还需要与用户上传的范围进行二次叠加分析。该场景中涉及到三个大数据任务:1.图层叠加2.属性汇总3.范围叠加分析,其中,任务1有任务节点1执行,任务2由任务节点2执行,任务3由任务节点3执行,三个分析节点需要串/并联执行。此时需要将任务节点1的输出作为任务节点2、3的输入。
如图4所示的是大数据模型示意图,包括:数据源节点401、任务节点402和插件节点403。其中,数据源节点负责存储数据的元数据信息,本示意图中,该数据节点401提供的数据源名称为KGraph_DG.gbd;任务节点402负责计算,按照其内设置的算法对于数据源数据进行计算,得到计算结果;插件节点403负责将计算结果的数据进行转换为excel表格,进行导出或者下载。图中箭头表示数据传输方向。
步骤S306:将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型。
其中,步骤S306与实施例2中的相应步骤一致,本实施例中不做赘述。
综上,本实施例提供的一种大数据模型的构建方法,包括:基于所述选择信息依次确定所述至少三个节点中任意两个节点的排序;获得所述至少三个节点的类型;基于至少三个节点中任意两个节点的排序以及所述至少三个节点的类型确定与工作流对应的所述至少三个节点的排序,所述节点的类型包括数据源节点、任务节点和插件节点。本实施例中,基于该确定的多个节点中任意两个节点的排序以及其中每个节点的类型,确定与工作流对应的多个节点的排序,以实现确定大数据模型中各个节点的排序,保证了构建的大数据模型的准确度。
如图5所示的,为本申请提供的一种大数据模型的构建方法实施例4的流程图,该方法包括以下步骤:
步骤S501:接收操作信息;
步骤S502:分析所述操作信息,得到所述操作选中的区域对应的至少三个节点;
步骤S503:基于所述选择信息依次确定所述至少三个节点中任意两个节点的排序;
步骤S504:获得所述至少三个节点的类型;
步骤S505:基于至少三个节点中任意两个节点的排序以及所述至少三个节点的类型确定与工作流对应的所述至少三个节点的排序;
其中,步骤S501-505与实施例3中的相应步骤一致,本实施例中不做赘述。
步骤S506:确定预设结果库;
步骤S507:在任务节点后连接所述预设结果库,以将所述任务节点的计算结果写入到所述预设结果库,插件节点从所述预设结果库读取所述计算结果;
其中,执行本实施例的电子设备中设置有预设结果库,该预设结果库分别与各个任务节点相连。
其中,各个任务节点对于输入数据进行计算得到的计算结果写入该预设结果库中。
其中,对于选中的多个节点排序后,确定该预设结果库,以将各个任务节点与预设结果库相连,以使得后续任务节点将计算结果写入到结果库中。
其中,若该确定的多个节点中包含多个任务节点,每个任务节点均与该预设结果库相连,以分别将其计算结果写入预设结果库中。
需要说明的时,由于各个任务节点执行计算任务得到计算结果的时间不同,因此,将各个任务节点的计算结果写入预设结果库中,保证了不同时执行计算任务的任务节点的计算结果均能够被插件节点读取并处理,而任务节点在得到计算结果后可以继续执行后续的计算任务,无需等待,提高了大数据模型的处理效率。
具体实施中,该大数据模型是对于空间大数据进行处理时,插件节点读取预设结果库,可以使用GDAL(Geospatial Data Abstraction Library,是一种开源栅格空间数据转换库)等工具来进行时间空间/传统数据的转化。
步骤S508:将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型。
其中,步骤S508与实施例3中的相应步骤一致,本实施例中不做赘述。
综上,本实施例提供的一种大数据模型的构建方法,包括:确定预设结果库;在所述任务节点后连接所述预设结果库,以将所述任务节点的计算结果写入到所述预设结果库,所述插件节点从所述预设结果库读取所述计算结果。本实施例中,基于预设的结果库,在确定的多个节点中的任务节点分别于该预设结果库相连,以使得该任务节点在执行计算任务时将计算结果写入预设结果库中,而插件节点从该预设结果库中读取计算结果进行处理,得到输出结果,保证了不同时执行计算任务的任务节点的计算结果均能够被插件节点读取并处理,提高了大数据模型的处理效率。
如图6所示的,为本申请提供的一种大数据模型的构建方法实施例5的流程图,该方法包括以下步骤:
步骤S601:获得选择信息;
步骤S602:分析所述选择信息得到所述至少三个节点的排序;
其中,步骤S601-602与实施例1中的相应步骤一致,本实施例中不做赘述。
步骤S603:获得第一节点的算法标识;
其中,所述第一节点是能够进行数据计算的任务节点。
其中,该第一节点是任务节点时,其上设置有第一算法,对于第一节点中采用第一算法采用第一标识标注。
具体实施中,在执行本实施例的电子设备中对于每个节点上设置的算法进行注册记录,并通过不同的标识标注其设置的算法,以实现对于各个相连的任务节点进行快速的参数传递。
其中,该第一节点是数据源节点时,其上不设置算法,则不采用标识标注。
其中,该第一节点可以是多个节点中除了待构建大数据模型中末尾节点的任意节点,该第一节点可以是数据源节点或者是任务节点。
其中,若获得第一节点的算法标识,表征该第一节点是任务节点,若未获得该第一节点的算法标识,表征该第一节点的数据源节点。
步骤S604:基于所述算法标识获得第一节点的输出参数;
其中,基于获得该第一节点的算法标识,确定该第一节点是一任务节点,基于该算法标识也能够确定该第一节点中采用的算法,相应的,可以确定该算法对应的输出参数。
具体实施中,可以在预设数据库中获得该第一节点采用的算法对应的输出参数。
为了实现形成工作流的两个节点间的参数流转,将该第一节点的输出参数传递给下一节点,以使得作为下一节点的第二节点的输入参数采用该第一节点的输出参数。
步骤S605:基于所述第一节点的输出参数更新第二节点的输入参数,得到所述工作流对应的大数据模型。
其中,所述第二节点也是能够进行数据计算的任务节点,而且,所述第二节点与第一节点相邻且所述第二节点基于第一节点的计算结果进行数据处理。
其中,该第二节点是任务节点时,其上设置有第二算法。
其中,该第二节点是任务节点时,其上设置有第二算法,该第二算法需要输入参数以进行数据计算,该第二节点的输入参数采用第一节点的输出参数,以实现第一节点和第二节点的数据传递。
其中,该第二节点可以是多个节点中除了待构建大数据模型中首位节点的任意节点,该第二节点可以是任务节点和插件节点。
其中,在获得第一节点的输出参数后,基于该第一节点的输出参数对于第二节点的输入参数进行更新,以使得二者统一。
具体实施中,对于待构建的大数据模型中的各个相邻的两个节点均执行上述的基于第一节点的输出参数更新第二节点的输入参数过程。
具体实施中,可以对于大数据模型的参数进行运行时参数涉及,以保证整个模型有统一的输入参数,具体是在各个任务节点的算法参数构建时,将参数设置为运行时参数,所有的运行时参数会在构建的大数据模型下进行暴露,在启动模型时,对于运行时参数进行统一填写和管理。
如图7所示的是大数据模型示意图,包括数据源节点701、任务节点702-704和插件节点705;其中,数据源节点701向任务节点702提供数据源,任务节点702-703、任务节点703-704分别是串联关系,该任务节点704需要任务节点702和703的输出,任务节点703需要任务节点702的输出,因此,任务节点703的需要等待任务节点702执行完才执行,任务节点704需要等待任务节点702-703执行完才执行。其中,任务节点702的输出参数a作为任务节点703的输入参数,任务节点702的输出参数a和任务节点703的输出参数b作为任务节点704的输入参数a、b,任务节点704的计算结果发送给插件节点705,插件节点705基于该计算结果x进行转换,得到输出结果。
如图8所示的是任务节点的参数配置界面示意图,其中,该参数配置界面中包括节点ID、节点名称、节点说明、算法名称、算法说明以及参数配置信息。本示意图中,该节点的名称是叠加分析V2,其主要执行叠加分析算法。
具体的,参数配置信息包括:参数代码、参数名称、参数类型、运行时参数以及参数值等。其中,该参数配置界面中的参数配置信息有一项参数是output算法输出标识,如图8中框中所示,该参数output即为每个算法节点的输输出参数数。该参数无需自行填写。由节点连接后自动生成后生成。当该节点后有其它节点时,该output参数会作为下一节点的input自动传入。
综上,本实施例提供的一种大数据模型的构建方法,包括:获得第一节点的算法标识,所述第一节点包括数据源节点和任务节点;基于所述算法标识获得第一节点的输出参数;基于所述第一节点的输出参数更新第二节点的输入参数,所述第二节点包括任务节点和插件节点,所述第二节点与第一节点相邻且所述第二节点基于第一节点的计算结果进行数据处理。本实施例中,选择两个相邻任务节点作为第一节点和第二节点,该第二节点基于第一节点的计算结果进行数据处理,基于第一节点的算法标识获得该第一节点的输出参数,基于该第一节点的输出参数更新第二节点的输入参数,实现了参数自动识别流转的方式进行参数传递,无需人工进行参数维护,提高维护效率。
如图9所示的,为本申请提供的一种大数据模型的构建方法实施例6的流程图,该方法包括以下步骤:
步骤S901:获得选择信息;
步骤S902:分析所述选择信息得到所述至少三个节点的排序;
步骤S903:将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型;
其中,步骤S901-903与实施例1中的相应步骤一致,本实施例中不做赘述。
步骤S904:将所述大数据模型上传至平台服务器,以基于所述平台服务器生成的运行指令控制所述大数据模型进行数据处理输出处理结果。
其中,在构建完成大数据模型后,将其上传给平台服务器。
其中,该平台服务器是应用该大数据模型进行数据处理的服务器。
其中,该构建完成的大数据模型是作为一个统一的工作流实例提交给大数据平台服务器,以基于该平台对于各个大数据模型进行统一调度和运行。
具体的,本方案中,由于大数据模型是作为一个统一的工作流实例,相应的,对于该大数据模型从构建、配置、运行、部署及调用都为一个整体,实现统一做调度和管理。
综上,本实施例提供的一种大数据模型的构建方法,还包括:将所述大数据模型上传至平台服务器,以基于所述平台服务器生成的运行指令控制所述大数据模型进行数据处理输出处理结果。本实施例中,公开了将构建的大数据模型上传至平台服务器,以使得平台服务器控制该大数据模型的调用运行,实现了对于大数据模型的统一调度管理。
与上述本申请提供的一种大数据模型的构建方法实施例相对应的,本申请还提供了应用该大数据模型的构建方法的装置实施例。
如图10所示的为本申请提供的一种大数据模型的构建装置实施例的结构示意图,该装置包括以下结构:获得模块1001、分析模块1002和传递模块1003;
其中,该获得模块1001,用于获得选择信息,所述选择信息是基于依据工作流选择至少三个节点的操作生成;
其中,该分析模块1002,用于分析所述选择信息得到所述至少三个节点的排序;
其中,该传递模块1003,用于将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型。
可选的,获得模块,包括:
接收单元,用于接收操作信息,所述操作信息基于对于显示界面中显示内容进行的操作生成;
分析单元,用于分析所述操作信息,得到所述操作选中的区域对应的至少三个节点。
可选的,分析单元,具体用于:
分析所述操作信息,得到所述操作信息在所述显示界面对应的目标区域;
基于所述目标区域对应数据源节点所在的第一区域,确定选择的节点为数据源节点,所述数据源节点用于提供数据源;
基于所述目标区域对应任务节点所在的第二区域,确定选择的节点为任务节点,所述任务节点用于至少基于数据源节点提供的数据源进行数据计算;
基于所述目标区域对应插件节点所在的第三区域,确定选择的节点为插件节点,所述插件节点用于按照预设转换规则,将所述任务节点的计算结果进行转换得到输出结果。
可选的,分析模块,包括:
确定单元,用于基于所述选择信息依次确定所述至少三个节点中任意两个节点的排序;
第一获得单元,用于获得所述至少三个节点的类型,所述节点的类型包括数据源节点、任务节点和插件节点;
排序单元,用于基于至少三个节点中任意两个节点的排序以及所述至少三个节点的类型确定与工作流对应的所述至少三个节点的排序。
可选的,还包括:
确定模块,用于确定预设结果库;
连接模块,用于在所述任务节点后连接所述预设结果库,以将所述任务节点的计算结果写入到所述预设结果库,所述插件节点从所述预设结果库读取所述计算结果。
可选的,传递模块,包括:
第二获得单元,用于获得第一节点的算法标识;
第三获得单元,用于基于所述算法标识获得第一节点的输出参数;
更新单元,用于基于所述第一节点的输出参数更新第二节点的输入参数,所述第二节点与第一节点相邻且所述第二节点基于第一节点的计算结果进行数据处理。
可选的,还包括:
上传模块,用于将所述大数据模型上传至平台服务器,以基于所述平台服务器生成的运行指令控制所述大数据模型进行数据处理输出处理结果。
需要说明的是,本实施例中提供的一种大数据模型的构建装置中的各个结构的功能解释,请参考前述方法实施例中的解释,本实施例中不做赘述。
综上,本实施例提供的一种大数据模型的构建装置,操作者基于工作流选择多个节点,获得基于选择操作生成的选择信息,分析该选择信息得到选择的多个节点的排序,将该多个节点按照排序进行参数传递,实现了自动对于参数传递,得到工作流对应的大数据模型,无需人工手动控制提交顺序维护每个任务的输出参数输入参数,实现了统一管理。
与上述本申请提供的一种大数据模型的构建方法实施例相对应的,本申请还提供了与该大数据模型的构建方法相应的电子设备以及可读存储介质。
其中,该电子设备,包括:存储器、处理器;
其中,存储器存储有处理程序;
所述处理器用于加载并执行所述存储器存储的所述处理程序,以实现如上述任一项所述的大数据模型的构建方法的各步骤。
具体该电子设备的实现大数据模型的构建方法,参考前述大数据模型的构建方法实施例即可。
其中,该可读存储介质,其上存储有计算机程序,所述计算机程序被处理器调用并执行,实现如上述任一项所述的大数据模型的构建方法的各步骤。
具体该可读存储介质存储的计算机程序执行实现大数据模型的构建方法,参考前述大数据模型的构建方法实施例即可。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的装置而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所提供的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所提供的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种大数据模型的构建方法,其特征在于,包括:
获得选择信息,所述选择信息是基于依据工作流选择至少三个节点的操作生成;
分析所述选择信息得到所述至少三个节点的排序;
将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型。
2.根据权利要求1所述的方法,其特征在于,所述获得选择信息,包括:
接收操作信息,所述操作信息基于对于显示界面中显示内容进行的操作生成;
分析所述操作信息,得到所述操作选中的区域对应的至少三个节点。
3.根据权利要求2所述的方法,其特征在于,所述分析所述操作信息,得到所述操作选中的区域对应的至少三个节点,包括:
分析所述操作信息,得到所述操作信息在所述显示界面对应的目标区域;
基于所述目标区域对应数据源节点所在的第一区域,确定选择的节点为数据源节点,所述数据源节点用于提供数据源;
基于所述目标区域对应任务节点所在的第二区域,确定选择的节点为任务节点,所述任务节点用于至少基于数据源节点提供的数据源进行数据计算;
基于所述目标区域对应插件节点所在的第三区域,确定选择的节点为插件节点,所述插件节点用于按照预设转换规则,将所述任务节点的计算结果进行转换得到输出结果。
4.根据权利要求2所述的方法,其特征在于,所述分析所述选择信息得到所述至少三个节点的排序,包括:
基于所述选择信息依次确定所述至少三个节点中任意两个节点的排序;
获得所述至少三个节点的类型,所述节点的类型包括数据源节点、任务节点和插件节点;
基于至少三个节点中任意两个节点的排序以及所述至少三个节点的类型确定与工作流对应的所述至少三个节点的排序。
5.根据权利要求4所述的方法,其特征在于,还包括:
确定预设结果库;
在所述任务节点后连接所述预设结果库,以将所述任务节点的计算结果写入到所述预设结果库,所述插件节点从所述预设结果库读取所述计算结果。
6.根据权利要求1所述的方法,其特征在于,所述将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型,包括:
获得第一节点的算法标识;
基于所述算法标识获得第一节点的输出参数;
基于所述第一节点的输出参数更新第二节点的输入参数,所述第二节点与第一节点相邻且所述第二节点基于第一节点的计算结果进行数据处理。
7.根据权利要求1所述的方法,其特征在于,所述将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型之后,还包括:
将所述大数据模型上传至平台服务器,以基于所述平台服务器生成的运行指令控制所述大数据模型进行数据处理输出处理结果。
8.一种大数据模型的构建装置,其特征在于,包括:
获得模块,用于获得选择信息,所述选择信息是基于依据工作流选择至少三个节点的操作生成;
分析模块,用于分析所述选择信息得到所述至少三个节点的排序;
传递模块,用于将所述三个节点按照排序进行参数传递,得到所述工作流对应的大数据模型。
9.一种电子设备,其特征在于,包括:存储器、处理器;
其中,存储器存储有处理程序;
所述处理器用于加载并执行所述存储器存储的所述处理程序,以实现如上述权利要求1-7任一项所述的大数据模型的构建方法的各步骤。
10.一种可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器调用并执行,实现如上述权利要求1-7任一项所述的大数据模型的构建方法的各步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310558720.9A CN116595760A (zh) | 2023-05-17 | 2023-05-17 | 大数据模型的构建方法、装置、电子设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310558720.9A CN116595760A (zh) | 2023-05-17 | 2023-05-17 | 大数据模型的构建方法、装置、电子设备和可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116595760A true CN116595760A (zh) | 2023-08-15 |
Family
ID=87605763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310558720.9A Pending CN116595760A (zh) | 2023-05-17 | 2023-05-17 | 大数据模型的构建方法、装置、电子设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116595760A (zh) |
-
2023
- 2023-05-17 CN CN202310558720.9A patent/CN116595760A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2937017C (en) | Integrated design application | |
CN109739855B (zh) | 实现数据表拼接及自动训练机器学习模型的方法和系统 | |
CN112036736A (zh) | 一种工作流创建方法及装置 | |
CN109727298A (zh) | 海报生成方法、装置、设备和计算机存储介质 | |
EP2778929A1 (en) | Test script generation system | |
CN103984818A (zh) | 基于Flex技术的AUV设计流程可视化建模方法 | |
TW201405452A (zh) | 工作流程管理裝置及工作流程管理方法 | |
CN109448100A (zh) | 三维模型格式转换方法、系统、计算机设备及存储介质 | |
Amaxilatis et al. | Advancing experimentation-as-a-service through urban IoT experiments | |
US20230394330A1 (en) | A method and system for designing ai modeling processes based on graph algorithms | |
Martin | Problem Framing: Identifying the right models for the job | |
CN116069300A (zh) | 工作流控制代码生成方法、装置、电子设备及存储介质 | |
CA2919421A1 (en) | Method and system for communicating product development information | |
CN114564904A (zh) | Fpga全路径快速时序分析方法、装置、计算机和存储介质 | |
JP2010015458A (ja) | プログラム修正支援システム、プログラム修正支援方法、およびプログラム修正支援プログラム | |
CN113094125B (zh) | 业务流程处理方法、装置、服务器及存储介质 | |
CN117290236A (zh) | 软件测试方法、装置、计算机设备及计算机可读存储介质 | |
Efendioglu et al. | Modelling method design: a model-driven approach | |
CN116595760A (zh) | 大数据模型的构建方法、装置、电子设备和可读存储介质 | |
CN114757157B (zh) | 用于生成航空器工包的方法、装置、设备和介质 | |
CN105930483A (zh) | 对象格式生成方法、装置及系统 | |
CN115794641A (zh) | 基于业务流程的造数方法、装置、设备及存储介质 | |
CN114066398A (zh) | 业务模型的管理方法、装置、存储介质和终端设备 | |
JP2019205080A (ja) | 変換装置、および、変換プログラム | |
CN116610319B (zh) | 一种基于低代码平台构建地图应用的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |