CN112463301B - 基于容器的模型训练测试调优和部署方法和装置 - Google Patents
基于容器的模型训练测试调优和部署方法和装置 Download PDFInfo
- Publication number
- CN112463301B CN112463301B CN202011371610.4A CN202011371610A CN112463301B CN 112463301 B CN112463301 B CN 112463301B CN 202011371610 A CN202011371610 A CN 202011371610A CN 112463301 B CN112463301 B CN 112463301B
- Authority
- CN
- China
- Prior art keywords
- training
- testing
- model
- model training
- container
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供一种基于容器的模型训练测试调优和部署方法和装置,所述方法包括以下步骤:对模型训练所在的容器环境部署service网格服务;通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代;在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示。本发明的方法,通过使用容器服务网格转换的方式,提高了安全性,并且算法的请求为请求接口服务,不会出现无法嵌入原有系统的问题,同时将模型训练的参数和训练过程中训练目标函数对应关系进行解析并存储,便于根据模型的性能指标对模型参数逆向调优,此外,对模型训练中间过程进行可视化展示,便于调试和训练优化。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种基于容器的模型训练测试调优和部署方法和一种基于容器的模型训练测试调优和部署装置。
背景技术
目前通过容器网络匹配转换的方式,为在容器外通过接口服务驱动算法训练和测试程序提供了一种便捷,灵活的调用方式,目前的容器算法调试主要以jupyter notebook远端调用的方式来执行,安全性和原有系统的兼容性上都差强人意。另外,目前的算法训练参数和模型评估能力的对应关系主要依赖于开发者自行记录,且不容易追溯模型训练的调参和优化过程。
发明内容
本发明为解决上述技术问题,提供了一种基于容器的模型训练测试调优和部署方法,能够通过使用容器服务网格转换的方式,提高了安全性,并且算法的请求为请求接口服务,不会出现无法嵌入原有系统的问题,同时将模型训练的参数和训练过程中训练目标函数对应关系进行解析并存储,便于根据模型的性能指标对模型参数逆向调优,此外,对模型训练中间过程进行可视化展示,便于调试和训练优化。
本发明采用的技术方案如下:
一种基于容器的模型训练测试调优和部署方法,包括以下步骤:对模型训练所在的容器环境部署service网格服务;通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代;在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示。
根据本发明的一个实施例,对模型训练所在的容器环境部署service网格服务,包括:将容器的targetPort端口和路由服务的启动端口设置为一致;配置容器内部的gateway端口为集群内路由转发端口;配置资源选择器;将所述容器的targetPort端口和所述集群内路由转发端口进行绑定;通过容器接口服务传递模型训练和测试参数。
根据本发明的一个实施例,上述的基于容器的模型训练测试调优和部署方法,还包括:将所述模型接口服务集成到所述容器配置文件Dockerfile中;在所述容器配置文件Dockerfile中将启动方式设置为后台守护进程启动,以使所述容器进行初始化。
根据本发明的一个实施例,通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代,包括:对所述模型训练和测试算法驱动程序进行入参的解析和类型规范,并将解析后的参数给模型训练程序;控制所述模型训练和测试算法驱动程序以异步线程提交的方式启动模型训练和测试主程序;控制所述模型训练和测试主程序根据模型训练和测试所需数据训练集和测试集进行算法训练和迭代。
根据本发明的一个实施例,所述模型训练和测试算法驱动程序以异步线程提交的方式启动模型训练和测试主程序之后,还包括:记录模型训练和测试主程序的启动状态信息;将调用状态返回到训练测试请求端。
根据本发明的一个实施例,上述的基于容器的模型训练测试调优和部署方法,还包括:判断入参中的数据集参数信息是否成功挂载数据集中对应的bucket到训练环境容器的存储卷路径;如果是,控制所述模型训练和测试主程序根据模型训练和测试所需数据训练集和测试集进行算法训练和迭代。
根据本发明的一个实施例,在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示,包括:在模型程序训练和测试过程中,对中间每轮迭代所对应的评价结果进行记录;将模型迭代过程中的迭代参数和训练目标函数映射关系解析存储到数据库;将评价结果绘制成曲线,放置到所述容器外部,以便进行参数调优和网络优化。
根据本发明的一个实施例,所述评价结果包括:ROC曲线下的面积、精准率、预测、召回率中的一个或多个。
根据本发明的一个实施例,上述的基于容器的模型训练测试调优和部署方法,还包括:将模型预测结果输入数据集泛化测试流程,以便于模型筛选和模型部署。
本发明还提出了一种基于容器的模型训练测试调优和部署装置,包括:部署模块,用于对模型训练所在的容器环境部署service网格服务;接收模块,用于通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代;记录模块,用于在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示。
本发明的有益效果:
本发明首先对模型训练所在的容器环境部署service网格服务,并通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代,在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示。从而能够通过使用容器服务网格转换的方式,提高了安全性,并且算法的请求为请求接口服务,不会出现无法嵌入原有系统的问题,同时将模型训练的参数和训练过程中训练目标函数对应关系进行解析并存储,便于根据模型的性能指标对模型参数逆向调优,此外,对模型训练中间过程进行可视化展示,便于调试和训练优化。
附图说明
图1为本发明实施例的基于容器的模型训练测试调优和部署方法的流程图;
图2为本发明实施例的基于容器的模型训练测试调优和部署装置的方框示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例的基于容器的模型训练测试调优和部署方法的流程图。
如图1所示,本发明实施例的基于容器的模型训练测试调优和部署方法可包括以下步骤:
S1,对模型训练所在的容器环境部署service网格服务。
根据本发明的一个实施例,对模型训练所在的容器环境部署service网格服务,包括:将容器的targetPort端口和路由服务的启动端口设置为一致;配置容器内部的gateway端口为集群内路由转发端口;配置资源选择器;将容器的targetPort端口和集群内路由转发端口进行绑定;通过容器接口服务传递模型训练和测试参数。
具体而言,为模型的训练和测试环境在k8s集群内部署一套路由服务,模型训练和测试通过服务调用驱动程序的方式启动。路由服务的路由规则:容器的targetPort端口和路由服务的启动端口设为一致;配置容器内部的gateway端口为集群内路由转发端口;配置资源选择器,声明该服务指向的容器资源,同时将容器的targetPort端口和集群内路由转发端口进行绑定;准备模型程序启动需要的参数列表(分为固定部分和可变部分),包含驱动模型文件需声明的基础信息,驱动模型文件的请求发起时间,发起人员ID,发起版本和发起描述信息三个维度的参数信息,该参数列表通过接口服务传递参数,接口请求入参样例参见参考信息。
根据本发明的一个实施例,上述的基于容器的模型训练测试调优和部署方法,还包括:将模型接口服务集成到容器配置文件Dockerfile中;在容器配置文件Dockerfile中将启动方式设置为后台守护进程启动,以使容器进行初始化。
也就是说,考虑到对模型开发用户透明和整体服务操作的流畅度,需要在模型训练测试环境首次初始化时模型接口服务就可以对外提供服务,本方法将模型接口服务集成到容器配置文件Dockerfile中,且在Dockerfile中将启动方式设置为后台守护进程启动,容器一经初始化,接口服务就可稳定对外提供服务。
由此,本发明通过使用了容器服务网格转化的方式,使得安全性大大提高,而算法的驱动请求为请求接口服务,也不会存在使用jupyter notebook等页面端idea的方式无法嵌入原有系统的问题。
S2,通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代。
根据本发明的一个实施例,通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代,包括:对模型训练和测试算法驱动程序进行入参的解析和类型规范,并将解析后的参数给模型训练程序;控制模型训练和测试算法驱动程序以异步线程提交的方式启动模型训练和测试主程序;控制模型训练和测试主程序根据模型训练和测试所需数据训练集和测试集进行算法训练和迭代。
进一步地,根据本发明的一个实施例,模型训练和测试算法驱动程序以异步线程提交的方式启动模型训练和测试主程序之后,还包括:记录模型训练和测试主程序的启动状态信息;将调用状态返回到训练测试请求端。
根据本发明的一个实施例,上述的基于容器的模型训练测试调优和部署方法,还包括:判断入参中的数据集参数信息是否成功挂载数据集中对应的bucket到训练环境容器的存储卷路径;如果是,控制模型训练和测试主程序根据模型训练和测试所需数据训练集和测试集进行算法训练和迭代。
具体而言,模型训练测试驱动程序进行入参的解析和类型规范,入参由模型接口服务透传,参数正常解析后传递给模型训练程序,并对发起模型训练测试请求的基础信息进行类规范和转换落入数据库记录。模型训练测试驱动程序以异步线程提交的方式启动模型训练测试主程序,并对该次启动状态信息进行记录,调用状态最终返回到训练测试请求端。驱动程序调用成功后,模型开始进行训练或测试,所需要的数据集存储在分布式对象文件系统上,而模型训练程序根据入参中的数据集参数信息挂载数据集中对应的bucket到训练环境容器的存储卷路径,挂载成功后,模型训练和测试主程序读取模型训练测试所需数据训练集和测试集进行算法训练和迭代。
作为一个具体示例,接口的请求入参样如下所示:
S3,在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示。
根据本发明的一个实施例,在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示,包括:在模型程序训练和测试过程中,对中间每轮迭代所对应的评价结果进行记录;将模型迭代过程中的迭代参数和训练目标函数映射关系解析存储到数据库;将评价结果绘制成曲线,放置到容器外部,以便进行参数调优和网络优化。其中,评价结果可以包括:ROC曲线下的面积、精准率、预测、召回率中的一个或多个。
具体而言,在模型程序训练和测试过程中,对中间每轮迭代所对应的例如损失函数和预测精准度进行记录,例如epoch_accuracy,epoch_loss,dense/kernel_0,dense_1/bias_0等中间输出信息,并基于这些信息绘制模型程序迭代的loss曲线、acc曲线,除此之外对网络传输层进行可视化,对诸如input->dropout->dense->flatten此类的网络结构进行DAG流图绘制。将模型迭代过程中的详细迭代参数和metrics info映射关系解析存储到数据库,模型的详细迭代参数不同于模型接口服务入参,但模型的详细迭代参数依赖于模型接口入参,两者关联关系类比FM算法rank维度因子,模型接口入参中basic_rank:4,end_rank:20,duraton_rank:2,模型迭代详细参数中current_rank(end_rank>=current_rank>=basic_rank,每次迭代current_rank增加2),current_rank为一个特定值,current_rank=10。记录该映射关系方便后续对模型训练和测试效果进行评估和筛选,最终选取用于生产环境的优秀模型,模型迭代过程中所抽取的metrics info的数据参看参考信息。根据上述的日志和信息输出提供可视化服务,并将所形成的acc曲线、loss曲线图和网络结构以及DAG流图、推移图以服务的方式暴露到k8s集群外部,以帮助模型开发成员进行参数调优和网络优化。
作为一个具体示例,模型迭代过程中抽取metrics info的数据样如下所示:
由此,本发明将模型训练的详细参数和训练过程中模型的metrics info对应关系解析后持久化存储,对后期根据模型性能信息对模型进行条件筛选并对模型参数逆向调优提供了可能,此外,在模型的训练和测试过程中,对模型训练的中间过程进行可视化展示方便开发者进行中间调试和训练优化。
根据本发明的一个实施例,上述的基于容器的模型训练测试调优和部署方法,还包括:将模型预测结果输入数据集泛化测试流程,以便于模型筛选和模型部署。
具体而言,模型训练和测试完成后最终生成模型结果,模型结果和模型详细迭代参数的关联关系被维护进入数据存储,筛选符合初步预期的模型结果进入泛化测试流程,数据集泛化流程同测试训练过程,最终筛选合格的模型构建模型召回服务或上传对象存储文件系统提供下载部署,模型召回服务和下载的模型文件通过测试和性能验证部署到生产环境。由此,该方法对模型训练最终生成的模型文件提供了模型上传和部署能力,避免了开发者手动部署模型的不便,提供了模型部署的效率,并对模型部署过程进行记录,在后续的生产环境发布可进行模型发布流程追踪和异常回滚,并提供了两种发布方式,即可以通过构建api服务的方式进行pipelin调用,还可以上传至对象存储文件系统进行存储下载,使得模型文件的发布和传输流程大大简化编译操作维护。
综上,本方法基于容器网格服务对容器内模型测试和训练程序进行远程训练调优,模型的参数调试通过服务入参传入同时记录到数据存储,模型的调试过程通过图形化展示并记录关键的性能信息,模型调试历史中的迭代训练参数和模型训练相关结果映射关系在训练过程中同时被记录,模型的所有调试历史数据和性能、精准度等维度数据将对后期的模型筛选和模型部署过程提供数据支持,模型调试过程的实时显示为算法工程师即时调整优化模型参数和网络调整提供了可能,此外,本方式基于容器安全性原生上提供了保证,模型相关服务的调用链路仅需在前端模型接口发起请求时提供安全验签,后续的网络服务由容器自身和模型路由服务自身保证。
综上所述,本发明首先对模型训练所在的容器环境部署service网格服务,并通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代,在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示。从而能够通过使用容器服务网格转换的方式,提高了安全性,并且算法的请求为请求接口服务,不会出现无法嵌入原有系统的问题,同时将模型训练的参数和训练过程中训练目标函数对应关系进行解析并存储,便于根据模型的性能指标对模型参数逆向调优,此外,对模型训练中间过程进行可视化展示,便于调试和训练优化。
对应上述实施例的基于容器的模型训练测试调优和部署方法,本发明还提出一种基于容器的模型训练测试调优和部署装置。
图2为本发明实施例的基于容器的模型训练测试调优和部署装置的方框示意图。
如图2所示,本发明实施例的基于容器的模型训练测试调优和部署装置可包括:部署模块10、接收模块20和记录模块30。
其中,部署模块10用于对模型训练所在的容器环境部署service网格服务。接收模块20用于通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代。记录模块30用于在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示。
根据本发明的一个实施例,部署模块10对模型训练所在的容器环境部署service网格服务,具体用于,将容器的targetPort端口和路由服务的启动端口设置为一致;配置容器内部的gateway端口为集群内路由转发端口;配置资源选择器;将容器的targetPort端口和集群内路由转发端口进行绑定;通过容器接口服务传递模型训练和测试参数。
根据本发明的一个实施例,部署模块10还用于将模型接口服务集成到容器配置文件Dockerfile中;在容器配置文件Dockerfile中将启动方式设置为后台守护进程启动,以使容器进行初始化。
根据本发明的一个实施例,接收模块20通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代,具体用于,对模型训练和测试算法驱动程序进行入参的解析和类型规范,并将解析后的参数给模型训练程序;控制模型训练和测试算法驱动程序以异步线程提交的方式启动模型训练和测试主程序;控制模型训练和测试主程序根据模型训练和测试所需数据训练集和测试集进行算法训练和迭代。
根据本发明的一个实施例,接收模块20在模型训练和测试算法驱动程序以异步线程提交的方式启动模型训练和测试主程序之后,还用于,记录模型训练和测试主程序的启动状态信息;将调用状态返回到训练测试请求端。
根据本发明的一个实施例,接收模块20还用于判断入参中的数据集参数信息是否成功挂载数据集中对应的bucket到训练环境容器的存储卷路径;如果是,控制模型训练和测试主程序根据模型训练和测试所需数据训练集和测试集进行算法训练和迭代。
根据本发明的一个实施例,记录模块30在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示,具体用于,在模型程序训练和测试过程中,对中间每轮迭代所对应的评价结果进行记录;将模型迭代过程中的迭代参数和训练目标函数映射关系解析存储到数据库;将评价结果绘制成曲线,放置到容器外部,以便进行参数调优和网络优化。
根据本发明的一个实施例,评价结果包括:ROC曲线下的面积、精准率、预测、召回率中的一个或多个。
根据本发明的一个实施例,上述的基于容器的模型训练测试调优和部署装置,还包括:输入模块,用于将模型预测结果输入数据集泛化测试流程,以便于模型筛选和模型部署。
需要说明的是,本发明实施例的基于容器的模型训练测试调优和部署装置中未披露的细节,请参照本发明实施例的基于容器的模型训练测试调优和部署方法中所披露的细节,具体这里不再赘述。
根据本发明的基于容器的模型训练测试调优和部署装置,部署模块对模型训练所在的容器环境部署service网格服务,接收模块通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代,在模型训练和测试算法迭代过程中,记录模块记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示。从而能够通过使用容器服务网格转换的方式,提高了安全性,并且算法的请求为请求接口服务,不会出现无法嵌入原有系统的问题,同时将模型训练的参数和训练过程中训练目标函数对应关系进行解析并存储,便于根据模型的性能指标对模型参数逆向调优,此外,对模型训练中间过程进行可视化展示,便于调试和训练优化。
对应上述实施例,本发明还提出一种计算机设备。
本发明实施例的计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行该计算机程序时,可实现根据本发明上述实施例所述的基于容器的模型训练测试调优和部署方法。
根据本发明实施例的计算机设备,处理器执行存储在存储器上的计算机程序时,首先对模型训练所在的容器环境部署service网格服务,并通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代,在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示。从而能够通过使用容器服务网格转换的方式,提高了安全性,并且算法的请求为请求接口服务,不会出现无法嵌入原有系统的问题,同时将模型训练的参数和训练过程中训练目标函数对应关系进行解析并存储,便于根据模型的性能指标对模型参数逆向调优,此外,对模型训练中间过程进行可视化展示,便于调试和训练优化。
对应上述实施例,本发明还提出一种非临时性计算机可读存储介质。
本发明实施例的非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可实现根据本发明上述实施例所述的基于容器的模型训练测试调优和部署方法。
根据本发明实施例的非临时性计算机可读存储介质,处理器执行存储在其上的计算机程序时,首先对模型训练所在的容器环境部署service网格服务,并通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代,在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示。从而能够通过使用容器服务网格转换的方式,提高了安全性,并且算法的请求为请求接口服务,不会出现无法嵌入原有系统的问题,同时将模型训练的参数和训练过程中训练目标函数对应关系进行解析并存储,便于根据模型的性能指标对模型参数逆向调优,此外,对模型训练中间过程进行可视化展示,便于调试和训练优化。
在本发明的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (7)
1.一种基于容器的模型训练测试调优和部署方法,其特征在于,包括以下步骤:
对模型训练所在的容器环境部署service网格服务;
通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代;
在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示,
通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代,包括:对所述模型训练和测试算法驱动程序进行入参的解析和类型规范,并将解析后的参数给模型训练程序;控制所述模型训练和测试算法驱动程序以异步线程提交的方式启动模型训练和测试主程序;控制所述模型训练和测试主程序根据模型训练和测试所需数据训练集和测试集进行算法训练和迭代,
所述模型训练和测试算法驱动程序以异步线程提交的方式启动模型训练和测试主程序之后,还包括:记录模型训练和测试主程序的启动状态信息;将调用状态返回到训练测试请求端,
其中,还判断入参中的数据集参数信息是否成功挂载数据集中对应的bucket到训练环境容器的存储卷路径;如果是,控制所述模型训练和测试主程序根据模型训练和测试所需数据训练集和测试集进行算法训练和迭代。
2.根据权利要求1所述的基于容器的模型训练测试调优和部署方法,其特征在于,对模型训练所在的容器环境部署service网格服务,包括:
将容器的targetPort端口和路由服务的启动端口设置为一致;
配置容器内部的gateway端口为集群内路由转发端口;
配置资源选择器;
将所述容器的targetPort端口和所述集群内路由转发端口进行绑定;
通过容器接口服务传递模型训练和测试参数。
3.根据权利要求2所述的基于容器的模型训练测试调优和部署方法,其特征在于,还包括:
将所述模型接口服务集成到所述容器配置文件Dockerfile中;
在所述容器配置文件Dockerfile中将启动方式设置为后台守护进程启动,以使所述容器进行初始化。
4.根据权利要求1所述的基于容器的模型训练测试调优和部署方法,其特征在于,在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示,包括:
在模型程序训练和测试过程中,对中间每轮迭代所对应的评价结果进行记录;
将模型迭代过程中的迭代参数和训练目标函数映射关系解析存储到数据库;
将评价结果绘制成曲线,放置到所述容器外部,以便进行参数调优和网络优化。
5.根据权利要求4所述的基于容器的模型训练测试调优和部署方法,其特征在于,所述评价结果包括:ROC曲线下的面积、精准率、预测、召回率中的一个或多个。
6.根据权利要求1所述的基于容器的模型训练测试调优和部署方法,其特征在于,还包括:
将模型预测结果输入数据集泛化测试流程,以便于模型筛选和模型部署。
7.一种基于容器的模型训练测试调优和部署装置,其特征在于,包括:
部署模块,用于对模型训练所在的容器环境部署service网格服务;
接收模块,用于通过模型训练和测试算法驱动程序接收接口服务请求入参进行算法迭代;
记录模块,用于在模型训练和测试算法迭代过程中,记录算法迭代参数和训练目标函数之间的关联关系,并对训练过程中的中间结果进行记录和可视化显示,
所述接收模块具体用于:对模型训练和测试算法驱动程序进行入参的解析和类型规范,并将解析后的参数给模型训练程序;控制模型训练和测试算法驱动程序以异步线程提交的方式启动模型训练和测试主程序;控制模型训练和测试主程序根据模型训练和测试所需数据训练集和测试集进行算法训练和迭代,
接收模块在模型训练和测试算法驱动程序以异步线程提交的方式启动模型训练和测试主程序之后,还用于:记录模型训练和测试主程序的启动状态信息;将调用状态返回到训练测试请求端,
其中,接收模块还用于判断入参中的数据集参数信息是否成功挂载数据集中对应的bucket到训练环境容器的存储卷路径;如果是,控制模型训练和测试主程序根据模型训练和测试所需数据训练集和测试集进行算法训练和迭代。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011371610.4A CN112463301B (zh) | 2020-11-30 | 2020-11-30 | 基于容器的模型训练测试调优和部署方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011371610.4A CN112463301B (zh) | 2020-11-30 | 2020-11-30 | 基于容器的模型训练测试调优和部署方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112463301A CN112463301A (zh) | 2021-03-09 |
CN112463301B true CN112463301B (zh) | 2022-02-11 |
Family
ID=74806326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011371610.4A Active CN112463301B (zh) | 2020-11-30 | 2020-11-30 | 基于容器的模型训练测试调优和部署方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112463301B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11989541B2 (en) * | 2021-10-04 | 2024-05-21 | Target Brands, Inc. | Deployment migration tool with decoding capabilities |
CN114116520B (zh) * | 2021-12-08 | 2023-05-26 | 抖音视界有限公司 | 一种算法评测方法、装置、网关及存储介质 |
CN114237635B (zh) * | 2022-02-24 | 2022-07-15 | 视睿(杭州)信息科技有限公司 | 一种半导体视觉检测快速部署和运维的方法、系统及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109408062A (zh) * | 2018-11-01 | 2019-03-01 | 郑州云海信息技术有限公司 | 一种自动部署模型训练环境的方法和装置 |
CN111158745A (zh) * | 2019-12-30 | 2020-05-15 | 山东浪潮商用系统有限公司 | 一种基于Docker的数据处理平台 |
CN111935321A (zh) * | 2020-10-12 | 2020-11-13 | 中国传媒大学 | 基于容器云的融合媒体微服务平台 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200125394A1 (en) * | 2018-10-17 | 2020-04-23 | The Boston Consulting Group, Inc. | Data analytics platform |
CN109714400B (zh) * | 2018-12-12 | 2020-09-22 | 华南理工大学 | 一种面向容器集群的能耗优化资源调度系统及其方法 |
CN110120940B (zh) * | 2019-04-12 | 2020-07-07 | 华中科技大学 | 一种面向Docker容器的文件系统资源隔离方法 |
CN111178517B (zh) * | 2020-01-20 | 2023-12-05 | 上海依图网络科技有限公司 | 模型部署方法、系统、芯片、电子设备及介质 |
CN111290778B (zh) * | 2020-02-06 | 2024-03-01 | 网易(杭州)网络有限公司 | Ai模型的包装方法、平台及电子设备 |
-
2020
- 2020-11-30 CN CN202011371610.4A patent/CN112463301B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109408062A (zh) * | 2018-11-01 | 2019-03-01 | 郑州云海信息技术有限公司 | 一种自动部署模型训练环境的方法和装置 |
CN111158745A (zh) * | 2019-12-30 | 2020-05-15 | 山东浪潮商用系统有限公司 | 一种基于Docker的数据处理平台 |
CN111935321A (zh) * | 2020-10-12 | 2020-11-13 | 中国传媒大学 | 基于容器云的融合媒体微服务平台 |
Non-Patent Citations (1)
Title |
---|
基于Docker和Kubernetes的深度学习容器平台的设计与实现;罗晟皓;《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》;20200115;第二-四章 * |
Also Published As
Publication number | Publication date |
---|---|
CN112463301A (zh) | 2021-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112463301B (zh) | 基于容器的模型训练测试调优和部署方法和装置 | |
US10031841B2 (en) | Method and system for incrementally updating a test suite utilizing run-time application executions | |
CN108021505B (zh) | 数据上线方法、装置和计算机设备 | |
US7984139B2 (en) | Apparatus and method for automating server optimization | |
US10585789B2 (en) | Intelligent generation of log messages by a SaaS offering in a continuous pipeline | |
US20200226057A1 (en) | Method, Apparatus, and System for Blaming a Test Case/Class for a Survived Mutation | |
US20120166874A1 (en) | Wireless Device Expert System | |
CN110554958A (zh) | 图数据库测试方法、系统、设备和存储介质 | |
CN102568522A (zh) | 硬盘性能的测试方法和装置 | |
KR20210055560A (ko) | 인공지능 서비스에 대한 성능 관리 장치 및 방법 | |
JP2023544493A (ja) | 遠隔展開されたアプリケーションにおける性能劣化の検出 | |
CN110046081A (zh) | 性能测试方法、性能测试装置、电子设备及存储介质 | |
US11422917B2 (en) | Deriving software application dependency trees for white-box testing | |
CN115237804A (zh) | 性能瓶颈的评估方法、装置、电子设备、介质和程序产品 | |
CN113934758A (zh) | 车辆故障修复方法、装置、车载终端、服务器及存储介质 | |
CN115546218B (zh) | 置信度阈值确定方法和装置、电子设备和存储介质 | |
CN116257437A (zh) | 基于实车数据回注的adas系统缺陷验证方法及装置 | |
CN112416700A (zh) | 分析启动的预测性故障和smart日志 | |
CN113535538A (zh) | 应用全链路自动化测试方法、装置、电子设备和存储介质 | |
US20220147437A1 (en) | Automated testing of mobile devices using visual analysis | |
CN114356769A (zh) | 软件的学习方法、装置、设备及存储介质 | |
CN114064510A (zh) | 功能测试方法、装置、电子设备和存储介质 | |
CN114116357A (zh) | 一种硬盘的自动测试方法、装置和工具 | |
CN116204272A (zh) | 一种模型训练的复现方法、系统、装置以及相关设备 | |
CN112527584A (zh) | 基于脚本编写及数据采集的软件效能提升方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |