CN111221507A - 一种算法应用管理平台 - Google Patents

一种算法应用管理平台 Download PDF

Info

Publication number
CN111221507A
CN111221507A CN201811428112.1A CN201811428112A CN111221507A CN 111221507 A CN111221507 A CN 111221507A CN 201811428112 A CN201811428112 A CN 201811428112A CN 111221507 A CN111221507 A CN 111221507A
Authority
CN
China
Prior art keywords
algorithm
application management
management platform
algorithms
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811428112.1A
Other languages
English (en)
Inventor
陈刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sinocbd Inc
Original Assignee
Sinocbd Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sinocbd Inc filed Critical Sinocbd Inc
Priority to CN201811428112.1A priority Critical patent/CN111221507A/zh
Publication of CN111221507A publication Critical patent/CN111221507A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/20Software design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/31Programming languages or programming paradigms
    • G06F8/315Object-oriented languages

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种算法应用管理平台,其集成了若干算法的算法实现层、算法支持层和算法存储层;所述的算法支持层与算法实现层之间通过标准接口进行交互,所述的算法支持层用于对算法进行组合形成新业务所需的算法;所述的算法存储层用于各类挂载于算法应用管理平台的算法进行服务器端的存储。用户可以使用该平台提供的成熟算法应用,节省成本,提高效率,满足企业对平台的不同需求,丰富平台对算法的支持,提高处理速度。

Description

一种算法应用管理平台
技术领域
本发明涉及算法开发集成与软件应用管理领域,特别涉及一种算法应用管理平台。
背景技术
数据库技术是现代计算机信息系统和计算机应用系统的基础和核心,是信息系统的重要组成部分。在进行数据库应用系统开发时,通常需要将数据库数据导出以用于本系统备份或与其它系统进行数据共享和交换。
数据湖或hub的概念最初是由大数据厂商提出的,表面上看,数据都是承载在基于可向外扩展的HDFS(Hadoop分布式文件系统)廉价存储硬件之上的。但数据量越大,越需要各种不同种类的存储。最终,所有的企业数据都可以被认为是大数据,但并不是所有的企业数据都是适合存放在廉价的HDFS集群之上的。数据湖的一部分价值是把不同种类的数据汇聚到一起,另一部分价值是不需要预定义的模型就能进行数据分析。现在的大数据架构是可扩展的,并且可以为用户提供越来越多的实时分析。数据湖架构面向多数据源的信息存储,包括物联网在内。大数据分析或归档可通过访问数据湖处理或交付数据子集给请求用户。
基于上述数据需要开发多样的算法,现有的算法应用管理平台复杂且不友好,开发成本高,效率低下。
发明内容
本发明的目的是提供一种算法应用管理平台,用户可以使用该平台提供的成熟算法应用,节省成本,提高效率,满足企业对平台的不同需求,丰富平台对算法的支持,提高处理速度。
为了实现以上目的,本发明是通过以下技术方案实现的:
一种算法应用管理平台,其特点是,其集成了若干算法的算法实现层、算法支持层和算法存储层;
所述的算法支持层与算法实现层之间通过标准接口进行交互,所述的算法支持层用于对算法进行组合形成新业务所需的算法;
所述的算法存储层用于各类挂载于算法应用管理平台的算法进行服务器端的存储。
所述的算法实现层用于原始算法设计,通过满足所述算法应用管理平台定义的接口完成算法的设计及实现。
所述的算法实现层和算法支持层之间采用的标准接口为Python定义的接口类型,用户通过实现该接口所定义的抽象方法完成算法从本地的实现到算法应用管理平台的挂载。
所述的算法支持层包括:
算法挂载模块,用于通过提供标准接口将若干算法挂载在算法应用管理平台,所述算法挂载模块支持用于用户上传算法,在算法上传页面填写基本信息,挂载成功的算法将存储到配置中心,以供用户构建其算法;
算法运行模块,其由用户控制,请求服务器端运行算法;
算法维护模块,用于用户对已挂载的算法进行逻辑调整、删除不必要代码操作,实现对算法的维护;
算法评测模块,用于对多个组合的算法在运行结果、运行时间多方面进行评测;
算法组合模块,用于用户对在算法应用管理平台已挂载的多个算法进行组合;
算法详情展示模块,用于展示算法所采用的数据结构和所编写的函数。
所述的算法应用管理平台支持算法应用开发时的算法训练,包括数据源来源设置与参数设置。
所述的算法组合模块支持算法的系列流程的组合,组合多种现成的或者再开发的算法应用和过程,成为一个复杂算法,并包装为一个算法应用。
所述的算法运行模块是基于微服务理念的算法部署实施的方法,即:把算法编译成一个微服务,微服务具备独立的运行进程,每个微服务可以独立部署,所述的微服务使用Docker容器部署,每个Docker容器中可以运行多个微服务,Docker容器以集群的方式部署,使用Docker Swarm对所述Docker容器进行管理。
所述的算法存储层使用Git存储机制,对算法进行版本控制。
所述的算法应用管理平台集成了深度学习框架和分布式计算框架。
所述的算法应用管理平台根据用户身份决定其在登录后的具体显示界面、拥有的操作权限以及进行中的进程,并自动载入上一次登录退出时的操作管理流程。
所述的操作权限为用户可以发布分享自己拥有的算法,与多个算法应用管理平台的其他用户共用,也可以查看所有分享给自己的算法;进一步,可以查询其他用户公开或共享给自己的算法。
支持对数据湖服务器的访问,所述数据湖服务器是包含关系型数据库、文档型数据库、分布式文件系统和图数据库这四类数据库的数据存储和管理服务平台,该平台采用分布式运算和存储架构,集成了具有数据存储和运算功能的各类计算机单机、服务器和计算机集群/服务器集群,并提供包括数据管理、算法开发在内的各类功能组件。
本发明与现有技术相比,具有以下优点:
1、用户可以使用该平台提供的成熟算法应用,节省成本,提高效率,满足企业对平台的不同需求,丰富平台对算法的支持,提高处理速度。
2、算法运行简单,便于用户开发算法,将软件与算法融合在一个平台上,节省成本,提升效率。
3、利用已有的应用组合为一个复杂的算法流程,提升开发效率,简化执行过程。
4、解决了用户身份管理的复杂性问题,使得用户操作友好简便。
附图说明
图1为本发明一种算法应用管理平台的结构示意图。
图2为算法支持层的结构示意图。
具体实施方式
以下结合附图,通过详细说明一个较佳的具体实施例,对本发明做进一步阐述。
如图1所示,一种算法应用管理平台100,包括通用的算法应用,其集成了若干算法的算法实现层101、算法支持层102和算法存储层103;所述的算法支持层102与算法实现层101之间通过标准接口进行交互,所述的算法支持层102用于对算法进行组合形成新业务所需的算法;所述的算法存储层103用于各类挂载于算法应用管理平台的算法进行服务器端的存储。
所述的算法实现层用于原始算法设计,通过满足所述算法应用管理平台定义的接口完成算法的设计及实现。所述的算法实现层和算法支持层之间采用的标准接口为Python定义的接口类型,用户通过实现该接口所定义的抽象方法完成算法从本地的实现到算法应用管理平台的挂载。
如图2所示,所述的算法支持层200包括:算法挂载模块201,用于通过提供标准接口将若干算法挂载在算法应用管理平台;算法运行模块202,其由用户控制,请求服务器端运行算法;算法维护模块203,用于用户对已挂载的算法进行逻辑调整、删除不必要代码操作,实现对算法的维护;算法评测模块204,用于对多个组合的算法在运行结果、运行时间多方面进行评测;算法组合模块205,用于用户对在算法应用管理平台已挂载的多个算法进行组合;算法详情展示模块206,用于展示算法所采用的数据结构和所编写的函数。
所述的算法挂载模块为:算法应用管理平台支持用户上传算法,用户在算法上传页面填写基本信息,挂载成功的算法将存储到配置中心,以供用户构建自己的算法;进一步,算法应用管理平台也支持用户基于软件开发管理平台自行开发新的算法应用,支持算法应用开发时的算法训练,包括数据源来源设置与参数设置。
上述的算法维护模块用于支持算法的在线编辑。
所述的算法组合模块支持算法的系列流程的组合,组合多种现成的或者再开发的算法应用和过程,成为一个复杂算法,并包装为一个算法应用,使得算法应用管理平台支持工作区方式开发应用。
所述的算法运行模块基于微服务理念的算法部署实施的方法,把算法编译成一个微服务,微服务具备独立的运行进程,每个微服务可以独立部署,所述的微服务使用Docker容器部署,每个Docker容器中可以运行多个微服务,Docker容器以集群的方式部署,使用Docker Swarm对所述的Docker容器进行管理,算法以容器方式运行,可直接拷贝或者覆盖,不依赖于硬件的升级和部署运行方式,当算法更新时,更新应用文件以及配置。配置记录在数据库中。
所述的算法存储层使用Git存储机制,对算法进行版本控制。
所述的算法应用管理平台集成了深度学习框架和分布式计算框架,大量的应用都可以基于这两个框架上进行开发。算法应用管理平台集成了这两种框架,使得基于此框架开发的应用能够直接在其上运行。常见的分布式计算框架包括:Storm,Hadoop和Spark等,常见的深度学习框架包括TensorFlow,Caffe、Keras等。
所述的算法应用管理平台根据用户身份决定其在登录后的具体显示界面、拥有的操作权限以及进行中的进程,并自动载入之前的操作管理流程,进一步,平台提供一种用户注册流程,确保未来实施过程可靠。
所述的操作权限为用户可以发布分享自己拥有的算法,与多个算法应用管理平台的其他用户共用,也可以查看所有分享给自己的算法;进一步,可以查询其他用户公开或共享给自己的算法。
上述的算法应用管理平台还支持对数据湖服务器的访问,所述数据湖服务器是包含关系型数据库、文档型数据库、分布式文件系统和图数据库这四类数据库的数据存储和管理服务平台,该平台采用分布式运算和存储架构,集成了具有数据存储和运算功能的各类计算机单机、服务器和计算机集群/服务器集群,并提供包括数据管理、算法开发在内的各类功能组件。
基于上述的算法应用管理平台,本发明还提供算法应用管理方法,该方法包括以下步骤:
步骤1,算法设计用户登录算法应用管理平台,浏览已挂载在平台的算法列表,每个算法有包括ID、名称、版本号、代码、数据源、计算结果、参数、框架、状态等属性字段,状态包括未部署、正在运行、运行结束。用户可以进入每个算法浏览算法的所有信息。
步骤2,用户可以上传已实现的算法到算法应用管理平台,并设置算法的相关参数,包括运行环境的选择、计算结果的存储路径等。算法应用管理平台支持Spark和Tensorflow框架。
步骤3,算法上传至算法应用管理平台后存储在数据湖服务器的分布式文件系统中,通过GIT进行版本控制。
步骤4,用户可以在应用管理平台维护已挂载的算法,平台提供了算法的在线编辑器。
步骤5,用户可以通过应用管理平台提供的算法组合模块,对已经挂载在平台的多个算法进行组成,形成一个新的算法。算法组合包括两种模式,一种是非即时组合,一种是即时组合。非即时组合是指一种算法使用其他算法运算后存储在平台上的运行结果,即时组合是多种算法组合后以一种新的算法重新运行。
步骤6,用户可以对算法或组合后的算法进行部署和运行,算法应用管理平台将待运行的算法编译成一个微服务,微服务使用Docker容器部署,Docker容器以集群的方式部署,算法以容器方式运行,docker容器启动后执行完算法脚本后自动退出,进程结束。
步骤7,算法运算结束后,计算结果将被存储在数据湖服务器的分布式文件系统中,算法运行在GIT版本控制下进行。
步骤8,用户可以对多个算法在运行结果,运行时间多方面进行评测,算法测评通过GIT进行版本控制。
步骤9,用户可以向多个数据湖服务器节点用户分享挂载在平台上的算法,访问权限包括浏览、拷贝。本地节点用户通过账号登录算法应用管理平台浏览或拷贝分享给自己的算法,外地节点通过token访问分享给自己的算法。
综上所述,本发明一种算法应用管理平台,用户可以使用该平台提供的成熟算法应用,节省成本,提高效率,满足企业对平台的不同需求,丰富平台对算法的支持,提高处理速度。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

Claims (10)

1.一种算法应用管理平台,其特征在于,其集成了若干算法的算法实现层、算法支持层和算法存储层;
所述的算法支持层与算法实现层之间通过标准接口进行交互,所述的算法支持层用于对算法进行组合形成新业务所需的算法;
所述的算法存储层用于各类挂载于算法应用管理平台的算法进行服务器端的存储。
2.如权利要求1所述的算法应用管理平台,其特征在于,所述的算法实现层用于原始算法设计,通过满足所述算法应用管理平台定义的接口完成算法的设计及实现。
3.如权利要求2所述的算法应用管理平台,其特征在于,所述的算法实现层和算法支持层之间采用的标准接口为Python定义的接口类型,用户通过实现该接口所定义的抽象方法完成算法从本地的实现到算法应用管理平台的挂载。
4.如权利要求1所述的算法应用管理平台,其特征在于,所述的算法支持层包括:
算法挂载模块,用于通过提供标准接口将若干算法挂载在算法应用管理平台,所述算法挂载模块支持用户上传算法,在算法上传页面填写基本信息,挂载成功的算法将存储到配置中心,以供用户构建其算法;
算法运行模块,其由用户控制,请求服务器端运行算法;
算法维护模块,用于用户对已挂载的算法进行逻辑调整、删除不必要代码操作,实现对算法的维护;
算法评测模块,用于对多个组合的算法在运行结果、运行时间多方面进行评测;
算法组合模块,用于用户对在算法应用管理平台已挂载的多个算法进行组合;
算法详情展示模块,用于展示算法所采用的数据结构和所编写的函数。
5.如权利要求4所述的算法应用管理平台,其特征在于,所述的算法应用管理平台支持算法应用开发时的算法训练,包括数据源来源设置与参数设置。
6.如权利要求4所述的算法应用管理平台,其特征在于,所述的算法组合模块支持算法的系列流程的组合,组合多种现成的或者再开发的算法应用和过程,成为一个复杂算法,并包装为一个算法应用。
7.如权利要求4所述的算法应用管理平台,其特征在于,所述的算法运行模块是基于微服务理念的算法部署实施的方法,即:把算法编译成一个微服务,微服务具备独立的运行进程,每个微服务可以独立部署,所述的微服务使用Docker容器部署,每个Docker容器中可以运行多个微服务,Docker容器以集群的方式部署,使用Docker Swarm对所述Docker容器进行管理。
8.如权利要求1所述的算法应用管理平台,其特征在于,所述的算法存储层使用Git存储机制,对算法进行版本控制;
所述的算法应用管理平台集成了深度学习框架和分布式计算框架。
9.如权利要求1所述的算法应用管理平台,其特征在于,所述的算法应用管理平台根据用户身份决定其在登录后的具体显示界面、拥有的操作权限以及进行中的进程,并自动载入上一次登录退出时的操作管理流程;
所述的操作权限为用户可以发布分享自己拥有的算法,与多个算法应用管理平台的其他用户共用,也可以查看所有分享给自己的算法;进一步,可以查询其他用户公开或共享给自己的算法。
10.如权利要求1所述的算法应用管理平台,其特征在于,支持对数据湖服务器的访问,所述数据湖服务器是包含关系型数据库、文档型数据库、分布式文件系统和图数据库这四类数据库的数据存储和管理服务平台,该平台采用分布式运算和存储架构,集成了具有数据存储和运算功能的各类计算机单机、服务器和计算机集群/服务器集群,并提供包括数据管理、算法开发在内的各类功能组件。
CN201811428112.1A 2018-11-27 2018-11-27 一种算法应用管理平台 Pending CN111221507A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811428112.1A CN111221507A (zh) 2018-11-27 2018-11-27 一种算法应用管理平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811428112.1A CN111221507A (zh) 2018-11-27 2018-11-27 一种算法应用管理平台

Publications (1)

Publication Number Publication Date
CN111221507A true CN111221507A (zh) 2020-06-02

Family

ID=70808759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811428112.1A Pending CN111221507A (zh) 2018-11-27 2018-11-27 一种算法应用管理平台

Country Status (1)

Country Link
CN (1) CN111221507A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112162734A (zh) * 2020-10-23 2021-01-01 福州大学 集成化的机器学习算法库与统一编程框架(面向深度学习)
CN114416111A (zh) * 2021-12-29 2022-04-29 北京航天测控技术有限公司 一种基于非侵入式的装备健康管理算法库构建方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112162734A (zh) * 2020-10-23 2021-01-01 福州大学 集成化的机器学习算法库与统一编程框架(面向深度学习)
CN112162734B (zh) * 2020-10-23 2022-03-08 福州大学 一种面向深度学习的模型生成方法
CN114416111A (zh) * 2021-12-29 2022-04-29 北京航天测控技术有限公司 一种基于非侵入式的装备健康管理算法库构建方法

Similar Documents

Publication Publication Date Title
US11243981B2 (en) Database replication based on data access scores
US10402424B1 (en) Dynamic tree determination for data processing
US10089488B2 (en) Systems, methods, and apparatuses for implementing cross-organizational data sharing
US10664331B2 (en) Generating an application programming interface
US8555018B1 (en) Techniques for storing data
US9996593B1 (en) Parallel processing framework
CN111901294A (zh) 一种构建在线机器学习项目的方法及机器学习系统
US10983873B1 (en) Prioritizing electronic backup
JP2015072688A (ja) Hadoopにおける強化されたSQLライクなクエリのためのバックグラウンドフォーマット最適化
CN104050042A (zh) Etl作业的资源分配方法及装置
CN110297869B (zh) 一种ai数据仓库平台及操作方法
US10545941B1 (en) Hash based data processing
US11657069B1 (en) Dynamic compilation of machine learning models based on hardware configurations
US20160301768A1 (en) Provisioning data to distributed computing systems
US20170371641A1 (en) Multi-tenant upgrading
CN115202729A (zh) 基于容器服务的镜像生成方法、装置、设备及介质
US11455574B2 (en) Dynamically predict optimal parallel apply algorithms
CN111221507A (zh) 一种算法应用管理平台
US11797518B2 (en) Registering additional type systems using a hub data model for data processing
DE112021000408T5 (de) Prädiktives bereitstellen von fern gespeicherten dateien
US10019244B1 (en) Interpreting program code using a symbol table
Dierauer et al. FutureWater Indiana: A science gateway for spatio-temporal modeling of water in Wabash basin with a focus on climate change
US10558637B2 (en) Modularized data distribution plan generation
US12099525B2 (en) State rebalancing in structured streaming
Aven Hadoop in 24 Hours, Sams Teach Yourself

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination