CN111400337A - 一种面向大数据分析的交互式建模算子组件及执行方法 - Google Patents
一种面向大数据分析的交互式建模算子组件及执行方法 Download PDFInfo
- Publication number
- CN111400337A CN111400337A CN202010126034.0A CN202010126034A CN111400337A CN 111400337 A CN111400337 A CN 111400337A CN 202010126034 A CN202010126034 A CN 202010126034A CN 111400337 A CN111400337 A CN 111400337A
- Authority
- CN
- China
- Prior art keywords
- operator
- component
- calculation
- data
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2423—Interactive query statement specification based on a database schema
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/547—Remote procedure calls [RPC]; Web services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Stored Programmes (AREA)
Abstract
本发明公开了一种面向大数据分析的交互式建模算子组件及执行方法,由传统的程序包或独立算法类库组件模式改为前后端分离式结构,算子组件的前端部分提供面向用户的交互式分析建模、流程编排和计算参数配置,算子组件的后端部分部署于集中的计算服务平台,充分利用云计算或分布式计算节点构建的强大计算能力,提供高性能的算子计算服务;通用的算子组件结构模型能够将各类科学计算算法按照该算子组件结构模型封装成算子组件,实现与交互式建模分析平台有效集成,满足交互式建模分析平台开展大数据分析计算的功能要求;能够实现算子组件前端数据分析交互式建模、计算参数配置与算子组件后端计算服务的执行交互,完成整个大数据分析模型的计算过程。
Description
技术领域
本发明属于大数据分析技术领域,具体涉及一种面向大数据分析的交互式建模算子组件及执行方法。
背景技术
随着大数据、机器学习技术的研究和工程应用,构建交互式建模分析平台已经成为支撑大数据分析应用的有效途径。在实际工程应用中,大数据分析计算对交互式建模分析平台提出了两大需求,一是提供各类单元化的算子组件实现交互式、可视化的数据分析建模,通过拖拽算子组件、配置计算参数实现大数据分析流程的快速编排配置;二是基于云计算或分布式计算构建后台强大的计算能力,完成复杂数据分析流程中每个算子组件对应的数据计算。交互式建模算子组件是支撑交互式建模分析平台开展建模分析的基本组件单元,传统的计算程序包、独立算法类库组件难以实现与交互式建模分析平台的集成,需要构建一种新的交互式建模算子组件及执行方法。
发明内容
有鉴于此,本发明的目的是提供一种面向大数据分析的交互式建模算子组件及执行方法,可提高算子计算性能。
一种交互式建模算子组件,每个算子配置一个交互式建模算子组件,每个交互式建模算子组件包括部署在前端的算子交互组件和部署在后端的算子服务组件;
所述算子交互组件用于提供人机交互界面,接收并存储计算配置参数、输入数据和输出数据;并调用算子服务组件,将计算配置参数和输入数据输出给算子服务组件;
所述算子服务组件用于接收算子交互组件传递的输入数据和计算配置参数,执行大数据计算过程后生成输出结果数据,返回给算子交互组件,算子交互组件将输出结果数据作为输出数据进行存储或者传递给其它算子。
较佳的,所有算子的算子交互组件均建立统一的模型,包括:Id属性、Title属性、InputData属性、PluginData属性、OutputData属性、Execute()方法、GetUI()方法以及NotifyEvent事件,其中:
所述Id属性为算子交互组件的唯一标识;Title属性为算子主题名称;InputData属性为存储算子输入数据的变量,用于存储1个或多个输入数据;PluginData属性为存储算子计算参数数据的变量,用于存储人机交互界面输入的计算参数;OutputData属性为存储算子组件最终计算结果的变量;Execute()方法为本算子组件执行数据计算命令的方法,该方法将调用算子服务组件提供的数据计算服务;GetUI()方法为打开和显示人机交互界面的方法;NotifyEvent事件为算子组件执行计算过程中产生的事件。
较佳的,所有算子的算子服务组件均建立统一的模型,包括:Name属性、ServiceName属性、InputData属性、PluginData属性、OutputData属性和Execute()方法,其中:
所述Name属性为算子服务组件的名称信息;ServiceName属性为算子服务组件服务接口名称描述;InputData属性为用于存储算子交互组件的输入数据;PluginData属性为用于算子交互组件的计算参数数据;OutputData属性为存储算子服务组件计算结果的变量;Execute()方法为算子服务组件利用输入数据、计算参数数据按照预设的逻辑执行完成本算子的计算。
一种交互式建模算子组件的数据计算方法,包括:
所述算子交互组件部署于交互式建模分析平台前端的算子容器中;
交互式建模分析平台前端算子容器扫描全部算子交互组件,解析算子交互组件的模型,得到用于交互式建模的算子字典;
算子服务组件部署于交互式建模分析平台后端的网络服务容器中;
交互式建模分析平台扫描全部算子服务组件,并对每个算子服务组件按照ServiceName发布为对应的Webservice网络服务,并注册至服务总线;
前端算子交互组件与后台算子服务组件通过WebService请求响应方式实现服务调用和数据交互;
算子交互组件被用于构建数据分析流程时,将算子字典生成一个实例对象;通过执行算子实例的GetUI()方法打开算子交互组件的交互界面;算子交互界面配置的计算参数存储至PluginData属性;算子交互组件执行数据计算时,首先从数据分析流程中与之关联的前序算子中获得其OutputData数据作为本算子交互组件的InputData数据,利用InputData、PluginData作为计算参数执行Execute()方法完成算子的数据计算过程;
在执行算子实例的Execute()方法时,算子交互组件将调用与同属于一个算子的算子服务组件的服务接口,由算子服务组件完成大数据计算;
算子交互组件调用算子服务组件的服务接口时,将输入数据InputData、计算参数PluginData作为服务参数传递给算子服务组件,算子服务组件接收到算子交互组件发送的InputData、PluginData数据后,将数据对应存储至算子服务组件的InputData和PluginData变量中;算子服务组件调用Execute()方法执行数据计算,计算完成后将输出数据存储至OutputData变量,并以服务调用结果形式返回给算子交互组件。
本发明具有如下有益效果:
本发明的交互式建模算子组件由传统的程序包或独立算法类库组件模式改为前后端分离式组件结构,算子组件的前端部分提供面向用户的交互式分析建模、流程编排和计算参数配置,算子组件的后端部分部署于集中的计算服务平台,充分利用云计算或分布式计算节点构建的强大计算能力,提供高性能的算子计算服务;
提出了一种通用的算子组件结构模型,能够将各类科学计算算法按照该算子组件结构模型封装成算子组件,实现与交互式建模分析平台有效集成,满足交互式建模分析平台开展大数据分析计算的功能要求。
本发明的方法,能够实现算子组件前端数据分析交互式建模、计算参数配置与算子组件后端计算服务的执行交互,完成整个大数据分析模型的计算过程。
附图说明
图1为本发明的算子组件整体结构图;
图2为基于算子组件交互式建模分析过程图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
如图1所示,一种面向大数据分析的交互式建模算子组件,主要包括算子交互组件模型、算子服务组件模型和算子组件执行方法三部分组成。
一种面向大数据分析的交互式建模算子组件,其整体结构将前端界面交互与后端计算服务分离为两部分,分别构建为算子交互组件和算子服务组件。算子交互组件提供人机交互界面,接收并存储计算配置参数、输入数据和输出数据,并实现数据在不同算子间的传递功能;算子服务组件接收算子交互组件传递的输入数据和计算参数,执行大数据计算过程并生成输出结果数据,返回给算子交互组件。
[算子交互组件模型]:
算子交互组件遵循统一的算子交互组件模型定义,具有接收输入数据、运行显示算子交互界面、接收计算参数配置、执行算子计算、输出结果数据功能。算子交互组件模型包含的要素如表1所示。
表1算子交互组件模型要素
算子交互组件模型中的Id属性、Title属性为对算子交互组件的功能作用描述,其中Id属性为组件的唯一标识;InputData属性为存储算子输入数据的变量,能够存储1个或多个输入数据项;PluginData属性为存储算子计算参数数据的变量,主要存储算子交互配置界面输入的计算参数;OutputData属性为存储算子组件最终计算结果的变量;Execute()方法为本算子组件执行数据计算的方法;GetUI()方法为算子组件为打开和显示交互界面的方法;NotifyEvent事件为算子组件执行计算过程中产生的事件。
[算子服务组件模型]:
算子服务组件遵循统一的算子服务组件模型定义,具有接收输入数据和计算参数数据、执行数据计算、输出结果数据功能。算子服务组件模型包含的要素如表2所示。
表2算法服务组件接口协议
算子服务组件模型的Name属性为算子服务组件的名称信息,ServiceName属性为算子服务组件服务接口名称描述,也是算子服务组件服务接口的唯一标识;InputData属性为存储算子输入数据的变量,能够存储1个或多个输入数据项;PluginData属性为存储算子计算参数数据的变量,主要存储算子交互配置界面输入的计算参数。OutputData属性为存储算子服务组件计算结果的变量;Execute()方法为算子服务组件执行数据计算的方法,算子服务组件通过执行Execute()实现利用数据数据、计算参数数据按照对应的逻辑执行完成计算过程。
如图2所示,一种面向大数据分析的交互式建模算子组件的应用模式,基于算子组件交互式建模分析,算子组件执行方法包括算子交互组件的执行方法和算子服务组件的执行方法。在执行建模计算时,算子交互组件和算子服务组件分别部署在交互式建模分析平台的前端和后端。
如图2所示,一种面向大数据分析的交互式建模算子组件,其算子交互组件部署于交互式建模分析平台前端的算子容器中。交互式建模分析平台前端算子容器初次建立时,扫描全部算子交互组件,得到用于交互式建模的算子字典;算子交互组件被用于构建数据分析流程时,将自动生成一个Id唯一的算子交互组件实例对象;通过执行算子实例的GetUI()方法打开算子交互组件的交互界面;算子交互界面配置的计算参数将存储至PluginData属性;算子交互组件执行数据计算时,将首先从与之关联的前序组件中获得其OutputData数据作为本算子交互组件InputData数据,利用InputData、PluginData作为计算参数执行Execute()方法完成算子的数据计算过程。在执行算子实例的Execute()方法时,算子交互组件将调用与之唯一相关的算子服务组件的服务接口,在交互式建模分析平台的后端完成大数据计算;算子交互组件将接收到的算子服务组件计算返回的结果数据存储至OutputData变量中。
如图2所示,算子服务组件部署于交互式建模分析平台后端的网络服务容器中。交互式建模分析平台后端网络服务容器初次建立时,扫描全部算子服务组件,并对每个算子服务组件按照ServiceName发布为对应的Webservice网络服务,并注册至服务总线;前端算子交互组件与后台算子服务组件通过WebService请求响应方式实现服务调用和数据交互。算子交互组件调用算子服务组件的服务接口时,将算子输入数据InputData、算子计算配置参数PluginData作为服务参数传递给算子服务组件,算子服务组件接收到算子交互组件发送的InputData、PluginData数据后,将数据存储至算子服务组件的InputData和PluginData变量中;算子服务组件调用Execute()方法执行数据计算,计算完成后将输出数据存储至OutputData变量,并以服务调用结果形式返回给算子交互组件。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种交互式建模算子组件,其特征在于,每个算子配置一个交互式建模算子组件,每个交互式建模算子组件包括部署在前端的算子交互组件和部署在后端的算子服务组件;
所述算子交互组件用于提供人机交互界面,接收并存储计算配置参数、输入数据和输出数据;并调用算子服务组件,将计算配置参数和输入数据输出给算子服务组件;
所述算子服务组件用于接收算子交互组件传递的输入数据和计算配置参数,执行大数据计算过程后生成输出结果数据,返回给算子交互组件,算子交互组件将输出结果数据作为输出数据进行存储或者传递给其它算子。
2.如权利要求1所述的一种交互式建模算子组件,其特征在于,所有算子的算子交互组件均建立统一的模型,包括:Id属性、Title属性、InputData属性、PluginData属性、OutputData属性、Execute()方法、GetUI()方法以及NotifyEvent事件,其中:
所述Id属性为算子交互组件的唯一标识;Title属性为算子主题名称;InputData属性为存储算子输入数据的变量,用于存储1个或多个输入数据;PluginData属性为存储算子计算参数数据的变量,用于存储人机交互界面输入的计算参数;OutputData属性为存储算子组件最终计算结果的变量;Execute()方法为本算子组件执行数据计算命令的方法,该方法将调用算子服务组件提供的数据计算服务;GetUI()方法为打开和显示人机交互界面的方法;NotifyEvent事件为算子组件执行计算过程中产生的事件。
3.如权利要求2所述的一种交互式建模算子组件,其特征在于,所有算子的算子服务组件均建立统一的模型,包括:Name属性、ServiceName属性、InputData属性、PluginData属性、OutputData属性和Execute()方法,其中:
所述Name属性为算子服务组件的名称信息;ServiceName属性为算子服务组件服务接口名称描述;InputData属性为用于存储算子交互组件的输入数据;PluginData属性为用于算子交互组件的计算参数数据;OutputData属性为存储算子服务组件计算结果的变量;Execute()方法为算子服务组件利用输入数据、计算参数数据按照预设的逻辑执行完成本算子的计算。
4.一种如权利要求3所述的交互式建模算子组件的数据计算方法,其特征在于,包括:
所述算子交互组件部署于交互式建模分析平台前端的算子容器中;
交互式建模分析平台前端算子容器扫描全部算子交互组件,解析算子交互组件的模型,得到用于交互式建模的算子字典;
算子服务组件部署于交互式建模分析平台后端的网络服务容器中;
交互式建模分析平台扫描全部算子服务组件,并对每个算子服务组件按照ServiceName发布为对应的Webservice网络服务,并注册至服务总线;
前端算子交互组件与后台算子服务组件通过WebService请求响应方式实现服务调用和数据交互;
算子交互组件被用于构建数据分析流程时,将算子字典生成一个实例对象;通过执行算子实例的GetUI()方法打开算子交互组件的交互界面;算子交互界面配置的计算参数存储至PluginData属性;算子交互组件执行数据计算时,首先从数据分析流程中与之关联的前序算子中获得其OutputData数据作为本算子交互组件的InputData数据,利用InputData、PluginData作为计算参数执行Execute()方法完成算子的数据计算过程;
在执行算子实例的Execute()方法时,算子交互组件将调用与同属于一个算子的算子服务组件的服务接口,由算子服务组件完成大数据计算;
算子交互组件调用算子服务组件的服务接口时,将输入数据InputData、计算参数PluginData作为服务参数传递给算子服务组件,算子服务组件接收到算子交互组件发送的InputData、PluginData数据后,将数据对应存储至算子服务组件的InputData和PluginData变量中;算子服务组件调用Execute()方法执行数据计算,计算完成后将输出数据存储至OutputData变量,并以服务调用结果形式返回给算子交互组件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010126034.0A CN111400337B (zh) | 2020-02-28 | 2020-02-28 | 一种面向大数据分析的交互式建模算子组件及执行方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010126034.0A CN111400337B (zh) | 2020-02-28 | 2020-02-28 | 一种面向大数据分析的交互式建模算子组件及执行方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111400337A true CN111400337A (zh) | 2020-07-10 |
CN111400337B CN111400337B (zh) | 2023-06-23 |
Family
ID=71428539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010126034.0A Active CN111400337B (zh) | 2020-02-28 | 2020-02-28 | 一种面向大数据分析的交互式建模算子组件及执行方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111400337B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163017A (zh) * | 2020-09-27 | 2021-01-01 | 广州汇智通信技术有限公司 | 一种知识挖掘系统及方法 |
CN112202899A (zh) * | 2020-09-30 | 2021-01-08 | 北京百度网讯科技有限公司 | 用于工作流的处理方法、装置、智能工作站和电子设备 |
CN112307396A (zh) * | 2020-10-21 | 2021-02-02 | 五凌电力有限公司 | 基于多引擎数据建模计算分析的平台架构及其处理方法 |
CN112949061A (zh) * | 2021-03-01 | 2021-06-11 | 北京清华同衡规划设计研究院有限公司 | 基于可复用算子的村镇发展模型构建方法和系统 |
CN114610294A (zh) * | 2022-05-09 | 2022-06-10 | 湖南星河云程信息科技有限公司 | 仿真实验效能指标并发计算控制方法、装置和计算机设备 |
CN117521424A (zh) * | 2024-01-05 | 2024-02-06 | 中国电子科技集团公司第十五研究所 | 一种仿真训练场景生成方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070244650A1 (en) * | 2006-04-03 | 2007-10-18 | Francois Gauthier | Service-oriented architecture for deploying, sharing, and using analytics |
CN107508884A (zh) * | 2017-08-24 | 2017-12-22 | 北京仿真中心 | 一种基于soa的仿真模型的共享方法 |
-
2020
- 2020-02-28 CN CN202010126034.0A patent/CN111400337B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070244650A1 (en) * | 2006-04-03 | 2007-10-18 | Francois Gauthier | Service-oriented architecture for deploying, sharing, and using analytics |
CN107508884A (zh) * | 2017-08-24 | 2017-12-22 | 北京仿真中心 | 一种基于soa的仿真模型的共享方法 |
Non-Patent Citations (1)
Title |
---|
郑宗生等: "面向SOA的城市风暴潮灾害评估GIS系统", 《计算机工程与设计》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163017A (zh) * | 2020-09-27 | 2021-01-01 | 广州汇智通信技术有限公司 | 一种知识挖掘系统及方法 |
CN112163017B (zh) * | 2020-09-27 | 2024-02-13 | 广州汇智通信技术有限公司 | 一种知识挖掘系统及方法 |
CN112202899A (zh) * | 2020-09-30 | 2021-01-08 | 北京百度网讯科技有限公司 | 用于工作流的处理方法、装置、智能工作站和电子设备 |
CN112307396A (zh) * | 2020-10-21 | 2021-02-02 | 五凌电力有限公司 | 基于多引擎数据建模计算分析的平台架构及其处理方法 |
CN112949061A (zh) * | 2021-03-01 | 2021-06-11 | 北京清华同衡规划设计研究院有限公司 | 基于可复用算子的村镇发展模型构建方法和系统 |
CN112949061B (zh) * | 2021-03-01 | 2023-11-10 | 北京清华同衡规划设计研究院有限公司 | 基于可复用算子的村镇发展模型构建方法和系统 |
CN114610294A (zh) * | 2022-05-09 | 2022-06-10 | 湖南星河云程信息科技有限公司 | 仿真实验效能指标并发计算控制方法、装置和计算机设备 |
CN117521424A (zh) * | 2024-01-05 | 2024-02-06 | 中国电子科技集团公司第十五研究所 | 一种仿真训练场景生成方法和装置 |
CN117521424B (zh) * | 2024-01-05 | 2024-04-09 | 中国电子科技集团公司第十五研究所 | 一种仿真训练场景生成方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111400337B (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111400337A (zh) | 一种面向大数据分析的交互式建模算子组件及执行方法 | |
CN111209309B (zh) | 数据流图处理结果确定方法、装置、设备及存储介质 | |
CN111736821B (zh) | 可视化建模分析方法、系统、计算机设备和可读存储介质 | |
CN107632845B (zh) | 一种转轮叶片多轴铣削加工的集成知识云服务方法和系统 | |
CN113656021B (zh) | 一种面向业务场景的油气大数据分析系统及方法 | |
CN109815283A (zh) | 一种异构数据源可视化查询方法 | |
CN113010598B (zh) | 面向遥感大数据处理的动态自适应分布式协同工作流系统 | |
CN109063017A (zh) | 一种云计算平台的数据持久化分布方法 | |
CN109885584A (zh) | 分布式数据分析平台的实现方法及终端设备 | |
CN111754073A (zh) | 空间数据业务的集中式处理与分布式作业框架构建方法 | |
CN112115611A (zh) | 一种协同仿真管理系统 | |
CN108459900B (zh) | 基于云的抗辐射加固协同设计-仿真系统及方法 | |
CN111897971A (zh) | 一种适用于电网调度控制领域的知识图谱管理方法及系统 | |
CN112148926A (zh) | 一种图数据流的处理方法、处理装置和存储介质 | |
CN116775041B (zh) | 基于流计算和rete算法的实时决策引擎实现方法 | |
CN106372359B (zh) | 一种设备虚拟样机系统 | |
CN107908459A (zh) | 一种云计算调度系统 | |
CN110891083A (zh) | 一种Gaia中支持多作业并行执行的代理方法 | |
CN110321596A (zh) | 一种基于有限元分析的机车车辆结构仿真方法 | |
CN113407810B (zh) | 一种基于大数据的城市信息和服务集成系统及方法 | |
CN115630122A (zh) | 一种数据同步方法、装置、存储介质和计算机设备 | |
Sormaz et al. | IMPlanner-MAS: a multiagent system for distributed manufacturing process planning | |
Pettit et al. | Modeling state-dependent objects using colored Petri nets | |
CN112699155A (zh) | 数据筛选方法和装置 | |
Chen et al. | A novel agent-based parallel ETL system for massive data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |