CN109271602B - 深度学习模型发布方法及装置 - Google Patents

深度学习模型发布方法及装置 Download PDF

Info

Publication number
CN109271602B
CN109271602B CN201811042879.0A CN201811042879A CN109271602B CN 109271602 B CN109271602 B CN 109271602B CN 201811042879 A CN201811042879 A CN 201811042879A CN 109271602 B CN109271602 B CN 109271602B
Authority
CN
China
Prior art keywords
model
user
generated
event information
generated model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811042879.0A
Other languages
English (en)
Other versions
CN109271602A (zh
Inventor
马国俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201811042879.0A priority Critical patent/CN109271602B/zh
Publication of CN109271602A publication Critical patent/CN109271602A/zh
Application granted granted Critical
Publication of CN109271602B publication Critical patent/CN109271602B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了深度学习模型发布方法及装置。所述深度学习模型发布方法包括:接收第一用户的模型生成事件信息,将所述模型生成事件信息存储至数据库;将所述模型生成事件信息发送至第二用户;当接收到所述第二用户的预发布指令时,基于测试机和所述预发布指令中携带的所述已生成模型的模型生成事件信息,对所述目标网盘中已存储的所述已生成模型进行预发布,当所述已生成模型的运行情况符合第一预设条件时,将所述已生成模型发布至目标平台。通过在网络平台上完全自动化的发布深度学习训练模型,从而不仅可以大幅缩短发布时间,提升深度学习系统模型发布效率;同时,由于零人工参与发布,极大地节省了人工成本和运维成本。

Description

深度学习模型发布方法及装置
技术领域
本发明涉及模型发布领域,特别涉及一种深度学习模型发布方法及装置。
背景技术
随着人工智能和大数据的兴起,深度学习技术在很多领域得到了广泛应用,比如计算机视觉、图像处理、自然语言处理、信息分类、搜索、推荐以及大数据等领域,都发挥了巨大的推动作用。
很多网络平台都推出了基于深度神经网络算法(Deep Neural Network,DNN)的推荐和搜索服务,这种推荐和搜索服务通常是通过在网络平台中内置深度学习模型来实现,这些模型需要由技术人员进行训练,并发布到平台上,供用户使用。
目前在网络平台上进行模型发布时,一类是采用全人工方式,即模型和样本均采用离线文件进行管理,训练得到的模型采用全人工手动方式进行模型发布;另一类采用半自动方式,即将模型传给运维工程师,运维工程师再通过脚本方式进行模型发布。以上两种模型发布方式,其发布过程均严重依赖人工,且无法做到及时、自动化模型发布,因此人工成本高、实时性差,费时低效,不利于大规模商用。
发明内容
本发明实施例提供了一种深度学习模型发布方法及装置,能够解决模型发布流程严重依赖人工、费时低效的问题,能够提高模型发布效率。
一方面,提供了一种深度学习模型发布方法,包括:
接收第一用户的模型生成事件信息,将所述模型生成事件信息存储至数据库;
将所述模型生成事件信息发送至第二用户;
当接收到所述第二用户的预发布指令时,基于测试机和所述预发布指令中携带的所述已生成模型的模型生成事件信息,对所述目标网盘中已存储的所述已生成模型进行预发布,当所述已生成模型的运行情况符合第一预设条件时,将所述已生成模型发布至目标平台。
一方面,提供了一种深度学习模型发布装置,包括:
接收模块,用于接收第一用户的模型生成事件信息,将所述模型生成事件信息存储至数据库;
发送模块,用于将所述模型生成事件信息发送至第二用户;
预发布模块,用于当接收到所述第二用户的预发布指令时,基于测试机和所述预发布指令中携带的所述已生成模型的模型生成事件信息,对所述目标网盘中已存储的所述已生成模型进行预发布;
发布模块,用于当所述已生成模型的运行情况符合第一预设条件时,将所述已生成模型发布至目标平台。
一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如上述深度学习模型发布所执行的操作。
一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如上述深度学习模型发布所执行的操作。
本公开提供的深度学习模型发布方法及装置,通过在网络平台上完全自动化的发布深度学习训练模型,从而不仅可以大幅缩短发布时间,提升深度学习系统模型发布效率;同时,由于零人工参与发布,极大地节省了人工成本和运维成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例提供的网络平台的用户交互界面的示意图;
图2示出了本发明实施例提供的服务器的技术框架图;
图3示出了本发明实施例提供的样本录入示例示意图;
图4和图5分别示出了本发明实施例提供的模型录入以及模型列表示意图;
图6示出了本发明实施例提供的深度学习模型发布方法流程图;
图7示出了本发明实施例提供的预发布流程图;
图8和图9示出了本发明实施例提供的基于AUC对模型效果进行评估的流程图;
图10示出了本发明实施例提供的发布过程流程图;
图11示出了本发明实施例提供的模型监控流程图;
图12示出了本发明实施例提供的回滚机制流程图;
图13示出了本发明提供的技术方案和目前已有模型发布的对比图;
图14是本发明实施例提供的一种深度学习模型发布装置的结构示意图;
图15是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
为使本发明的技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本公开主要应用于网络平台下模型的发布自动化工作,支持样本管理、模型管理、模型发布以及模型监控等核心能力。支持网络平台中的模型日常例行管理、模型训练、模型评估、模型发布、模型更新、人工回滚等一系列复杂的操作。网络平台的用户交互界面如图1所示;网络平台的技术框架图如图2所示,主要包括:前端、webserver、数据存储、调度引擎、功能模块、数据引擎等部分。
其中,前端可以为采用bootstrap框架结合highcarts.js和datatable.js等相关图类JS框架,其提供有WEB工程化入口,方便操作与管理,具体可以包括样本管理、模型管理、发布任务查看、人工回滚等。通过在MDB(Meta Data Base,关系型数据库系统)上建立样本表,并通过API方式提供POST接口给前端,即可将样本信息存储至表中,此时提及的样本主要用于后续对模型进行评估,其不同于模型训练所需的样本,在下文中称为目标样本集,该样本集可以采用如下所示的形式表达:
|sample|CREATE TABLE‘sample’(‘id’bigint(20)NOT NULL
AUTO_INCREMENT COMMENT‘ID’
‘lz_id’varchar(32)DEFAULT NULL COMMENT‘lz注册的样本生成任务ID‘
‘type’varchar(32)DEFAULT NULL COMMENT‘type:daily,hourly,none周期’
‘model_name’varchar(128)DEFAULT NULL COMMENT‘样本名称’
‘model_hdfs’varchar(128)DEFAULT NULL COMMENT‘样本hdfs地址’
‘create_user’varchar(64)DEFAULT NULL COMMENT‘创建者’
‘modified_user’varchar(64)DEFAULT NULL COMMENT‘最近一次修改人’
‘create_time’bigint(20)DEFAULT NULL COMMENT‘创建时间’
‘modified_time’timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATECURRENT_TIMESTAMP COMMENT‘修改时间,表列更改时候自动更新’
‘model_status’tinyint(4)DEFAULT‘-1’COMMENT‘样本状态:-1刚创建带激活:0已激活可用;1已下线不可用’
‘extra_info’varchar(64)DEFAULT NULL COMMENT‘预留字段’
PRIMARY KEY(‘id’)
)ENGINE=InnoDB AUTO_INCREMENT=10039 DEFAULT CHARSET-utf8 COMMENT=’自增ID’
样本录入使用示例分别如图3所示。类似地,通过在MDB上建立模型表,并通过API方式提供POST接口给前端,即可将模型信息存储至模型表中,模型表可以采用如下所示的形式表达:
|sample|CREATE TABLE‘model’(
‘id’bigint(20)NOT NULL AUTO_INCREMENT COMMENT‘ID’
‘lp_model_id’bigint(32)DEFAULT NULL COMMENT‘lp平台注册的模型ID’
‘model_name’varchar(128)DEFAULT NULL COMMENT‘模型名称’
‘create_user’varchar(64)DEFAULT NULL COMMENT‘创建者’
‘modified_user’varchar(64)DEFAULT NULL COMMENT‘最近一次修改人’
‘sample_id’varchar(128)DEFAULT NULL COMMENT‘样本,这里存下模型对应的样本的ID’
‘model_status’tinyint(4)DEFAULT‘-1’COMMENT‘模型状态:-1刚创建;0已激活发布;1已下线冻结—>简化为2个状态,0可用,-1不可用’
‘update_task_id’int(11)DEFAULT‘-1’COMMENT‘最后一次更新的任务ID,-1表示还没更新,关联到model_train_status表’
‘create_time’bigint(20)DEFAULT NULL COMMENT‘创建时间’
‘modified_time’timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATECURRENT_TIMESTAMP COMMENT‘修改时间,表列更改时候自动更新’
‘model_deph’varchar(128)DEFAULT NULL COMMENT‘模型产出地址’
‘monitor_status’tinyint(4)DEFAULT‘0’COMMENT’‘默认为0,表示状态为正常状态,其他为告警状态。2.26新增字段,主要用于表示当前这个模型更新是否有异常’
‘extra_info’varchar(64)DEFAULT NULL COMMENT‘预留字段’
PRIMARY KEY(‘id’)
)ENGINE=InnoDB AUTO_INCREMENT=6022 DEFAULT CHARSET=utf8 COMMENT=’自增ID’|
模型录入以及模型列表的示意图可以分别如图4、5所示。
Webserver主要依托Django进行后台接口开发,同时集成了RestFramework API插件加速研发流程,并采用Nginx做代理。本平台相关数据存储于Ceph、HDFS(Hadoop分布式文件系统)、DW(Distribute Data Warehouse,分布式数据仓库)以及MDB,其中,DW和MDB是一种内部存储介质。
功能模块包括样本管理、模型管理、AUC(Area Under curve,曲线下面积)评估、发布管理等核心模块。
数据引擎主要分为两大类,包括数据工厂类,主要用于spark等大数据处理任务以及训练工厂类任务,主要用于网络平台,能够支持TensorFlow等。
调度引擎可以通过消息队列和调度服务,对上述数据存储、功能模块、以及数据引擎进行调度,从而实现平台调度能力。
本发明实施例提供的一种深度学习模型发布方法包括以下部分:模型训练、预发布、AUC评估、现网上线以及回滚等闭环解决方案,其中,样本管理可以是通过WEB平台化方式,管理深度学习的样本基础信息,包括样本ID、更新频率、样本HDFS路径以及样本是否生效可用等。模型管理也可以是通过WEB平台化方式,管理深度学习的模型基础信息,包括模型ID、模型名称、模型根目录地址、模型所对应的样本ID以及模型是否生效可用等。模型发布可以是针对深度学习模型训练与发布的特点,制定并实现一套模型预发布、线下AUC评估、现网上线、现网紧急更新、现网回滚与下线等闭环发布流程。大大提升了模型的发布效率。模型评估是指利用样本和训练的结果,进行模型离线AUC评估,针对阈值来自动化判别是否允许模型发布,从而线下过滤了低质的模型。下面,针对上述过程,提供如图6的实施例来进行详细说明,参见图6,该实施例具体包括:
601、第一用户进行模型训练,并将训练所得到的模型上传至目标网盘,并向服务器发送模型生成事件信息。
该第一用户可以是指模型训练工程师所使用的账号。该服务器可以为不同分工的用户提供不同的账号,并为账号本身提供相关的运行逻辑,以便实现相关职能,例如,该服务器还可以提供第二用户,该第二用户可以是指进行模型预发布或发布工程师所使用的账号,该第一用户和第二用户之间有联动的运行逻辑,使得在第一用户进行完一项任务时,可以触发服务器对第二用户进行通知。
该目标网盘可以为Ceph分布式存储系统,Ceph分布式存储系统为共享云存储。具体地,当第一用户(例如,模型训练工程师)将模型训练完毕后,会将pd序列化后的模型存储至Ceph分布式存储系统。通过在Ceph分布式存储系统中共享已生成的模型,可以实在多个终端共享现网机器,避免了需要线上搬运模型以及权限问题。
服务器还可以提供已生成模型的查看功能,也即是,服务器可以提供该目标网盘中已生成模型的模型信息查看界面,如图5所示,可以采用列表的形式,将目标网盘中已经存储的模型进行界面显示,以便技术人员能够获知当前已生成模型的情况。
第一用户可以通过如图4的界面,向服务器发送模型生成事件信息,具体地,第一用户可以在该界面上输入模型的名称、ID、存储位置以及所使用样本信息等,以生成模型生成事件信息,并触发当前登录终端将模型生成事件信息发送至服务器。
需要说明的是,模型生成事件信息可以携带多种发布参数,发布参数是指模型发布所需要的具体参数,比如模型ID、模型使用的算法ID、模型地址、模型版本号、预发布状态码、评估状态码、发布状态码等。其中,模型ID、模型使用的算法ID、模型地址、模型版本号均可根据实际情况进行设置;预发布状态码、评估状态码、发布状态码的默认值均可以为零,分别表示未预发布、未评估、未发布等发布状态。示例性地,该模型生成事件信息至少包括模型名称、路径信息和版本号
602、该服务器接收第一用户的模型生成事件信息,将该模型生成事件信息存储至数据库。
该数据库可以为该服务器所配置的任一种数据库,例如上文所述的MDB。
603、该服务器将该模型生成事件信息发送至第二用户。
对于服务器来说,为了实现全自动的模型发布,则可以由第一用户的模型生成事件信息作为触发条件,触发服务器与第二用户的交互,该过程可以包括服务器通过训练工厂事件组件,向与第一用户匹配的第二用户发送该模型生成事件信息,以使得第二用户获知有模型生成。
当然,该第二用户和第一用户可以具有一定的对应关系,也即是,第一用户可以对应于任一个第二用户,还可以对应于一组第二用户,本发明实施例对此不做具体限定。
示例性地,该训练工厂事件组件可以是应用程序编程接口(API)组件,其可以被服务器所调用,用于通知用户。
604、第二用户在该服务器上触发预发布指令。
对于第二用户来说,在接收到模型生成事件信息后,可以在第二用户所登录的终端上弹出通知窗口,以显示该模型生成事件,并为第二用户提供预发布的触发入口,而在一些实施例中,该第二用户还可以默认在接收到模型生成事件信息后直接触发预发布指令,本发明实施例对此不做限定。
605、当该服务器接收到该第二用户的预发布指令时,将该模型生成事件信息发送至该至测试机。
测试机上可以设有Linux TensorFlow serving服务,需要进行预发布时,由服务器向测试机发送待发布模型的模型生成事件信息,以便将该模型的发布参数等通知给测试集。
606、该测试机根据该模型生成事件信息,在该目标网盘中查找该已生成模型,运行该已生成模型。
该预发布流程图可以如图7所示,该测试机根据模型生成事件信息中所携带的发布参数,在Ceph分布式存储系统中查找到模型,例如,pd格式的文件,然后执行该pd格式的文件,以实现已生成模型的运行。
如果在执行过程中,运行情况不符合第一预设条件,即发生了上述多种异常错误中的一种或多种,则认为该模型并未通过测试,预发布不成功,此时,可以使用训练工厂事件组件,通知第一用户“模型预发布不成功”,并将该模型的预发布状态码保持为0,此模型的训练产物不会在服务器进行发布。如果在执行过程中,运行情况符合第一预设条件,即并未发生上述多种异常错误,则认为该模型通过测试,预发布成功,则可以使用训练工厂事件组件,通知第一用户“模型预发布成功”,同时更新该模型的预发布状态码为1,说明该已生成模型可以在目标平台上进行发布。
上述步骤605和606是服务器控制该测试机将查找到的该已生成模型进行预发布的过程,该过程可以使得该已生成模型的运行性能等能够得以保证。通过在测试机上进行预发布的过程,能够拦截模型发布中的多种异常错误,例如:1)pb格式(TensorFlow的数据格式)在序列化的过程中是否已损坏;2)TensorFlow版本校验,即训练集群版本和线上集群版本校验是否有误;3)模型的特征值(如MD5值)校验,以确保一致性;4)工程框架加载模型是否正常等等。通过预发布过程的检验,
需要说明的是,上述预发布过程还可以是基于网络平台的轮询机制触发,例如,网络平台可以通过轮询机制获取最新生成模型的模型ID,并基于模型ID从数据库中获取对应的模型生成事件信息,以进行预发布的步骤605和606。
607、当该已生成模型的运行情况符合第一预设条件时,该服务器基于目标样本集对该已生成模型进行评估。
具体地,当模型预发布成功之后,还可以采用AUC评价方法对模型效果进行评估。AUC可以被用来评价一个二值分类器的优劣。在评估时所使用的样本可以不同于模型训练过程中所使用的样本,该目标样本集的来源可以是通过SPARK从业务行为日志中所记录的行为信息中提取,提取到的目标样本集可以存储于分布式文件系统(HDFS)中。其中,该目标样本集可以按照不同比率获取,例如,正样本和负样本的数量比为3:7,或者正样本和负样本的数量比为5:5,本公开对此不作限定。
基于AUC对模型效果进行评估的流程图如图8所示。当接收到服务器发送的评估指令时,计算该已生成模型的AUC值,并与第二预设条件进行比较,当该AUC值符合第二预设条件时,例如AUC值大于预设阈值时,说明模型分类效果良好,可以进行发布。此时,将该模型的评估状态码更新为1,并使用训练工厂事件组件,通知第一用户“模型评估成功”。当该AUC值不符合第二预设条件时,例如AUC值小于或等于预设阈值时,说明模型分类效果较差,不可以进行发布。此时,将该模型的评估状态码保持为0,并使用训练工厂事件组件,通知第一用户“模型评估不成功”,退出评估流程。评估成功的模型,即可进入待发布模型队列,准备进行模型发布流程。
AUC评估可以评估出模型的实际效果,其原理如下:AUC=1,是完美分类器,采用这个模型时,存在至少一个阈值能得出完美预测。然而绝大多数预测的场合,不存在完美分类器。0.5<AUC<1,优于随机猜测。这个分类器(模型)妥善设定阈值的话,能有预测价值。AUC=0.5,跟随机猜测一样(例:丢铜板),模型没有预测价值。AUC<0.5,比随机猜测还差;但只要总是反预测而行,就优于随机猜测。
也即是说,AUC值越大的模型,正确率越高,因此,本发明实施例中通过使用AUC值对通过预发布的模型进行评估,可以过滤掉一部分低质模型,这部分被过滤掉的低质模型将不再继续发布流程,避免低质模型占用发布资源,从而提高发布效率。
例如,以整个评估流程为例,参见图9,基于用户行为日志来提取行为信息,该行为信息可以包括曝光行为的曝光集以及包括下载行为的下载集,基于该曝光集和下载集,提取出正样本和负样本,调用predict预测接口进行打分,并记录相应打分结果(score),组成打分结果数组,基于打分结果数组计算可得AUC值,并将计算得到的AUC值存储至数据库(MDB)。
608、当评估结果符合第二预设条件时,该服务器将该已生成模型发布至目标平台。
其中,该服务器将该已生成模型发布至目标平台是指向所述目标平台发送发布指令,所述发布指令中至少包括所述已生成模型的模型名称、路径信息和版本号,由所述目标平台将所述已生成模型添加至目标代码位置。
需要说明的是,目标平台的运行环境与测试机环境相同,发布过程与预发布过程类似,具体可以参见图10所示。当预发布结果满足第二预设条件后,服务器向第一终端发送发布指令,该发布指令包括模型的发布参数。第一终端根据发布参数,在Ceph分布式存储系统中查找到模型的训练产物,即pd格式的文件,然后执行该pd格式的文件,并同时更新模型的发布状态为1,即可发布该模型。
在本发明实施例中,在执行了步骤609的发布过程之后,还可以监控所述已生成模型在预设时间内是否发布成功,如果发布未成功,向所述第一用户发送发布失败通知,所述发布失败通知用于告知发布失败。参见图11,该监控机制可以如该流程所示,该监控机制可以通过查询所有线上可用模型,来实现模型监控,如果确定某个模型发布成功,则可以调用社交应用进行提示,或者利用短信进行提示,而如果发布不成功,则可以通过调用社交应用通知版本,采用社交应用告警或是平台短消息的形式来告警。
该方法还提供了回滚机制,用以在需要恢复到任一历史版本的模型时使用,相应地,回滚机制流程图如图12所示,该方法还包括:当接收到回滚指令时,从所述目标网盘中确定目标版本的模型,将所述已生成模型回滚至所述目标版本。回滚机制主要适用于紧急止损,事故修复等。其选取可用回滚模型历史版本,直接进行回滚操作,本质同发布流程类似,但略过预发布和AUC评估环节。
本发明实施例提供的方法,能够帮助大幅度提升深度学习模型的发布效率,同时线下AUC评估可以过滤掉低质的模型,另外管理功能(模型管理、样本管理)极大规范了研发流程。该方案可以管控9大类场景,20+类模型的例行化训练模型的发布任务。通过提升发布效率,使得工程师可以在更短的时间内训练更多轮模型,从而达到提升线上效果的目的。应用本方案依赖,应用宝推荐相关场景分发系数提升2%~5%不等。
为了更加明确本发明提供的技术方案和目前已有模型发布的区别,请参见图13,图13的上半部分提供了目前模型发布的一般流程,该流程包括模型训练——人工搬运——现网服务。下半部分简略的介绍了本发明提供的技术方案的执行过程,模型训练所得到的模型会经历存储至ceph网络存储,并通过增加的工厂组件来将发布参数同步到数据库(MDB)中,然后进入预发布阶段,预发布阶段主要应用了ceph网络存储以及同步至数据库的发布参数,来通过测试机进行测试,在预发布过程中,还通过AUC评估的方式,来过滤掉不合格的模型,并为过滤掉的模型提供了人工审核机制,以避免由于评估不准确等造成的错误过滤,将评估通过的模型进行现网发布,一旦出现运行错误,还提供了回滚机制,以保证网络平台的正常运行。在上述过程中,还在例如预发布阶段以及现网发布阶段提供了服务化API,以便用户进行干预。通过上述过程的对比,可以明显看出,本发明实施例提供的技术方案实现了自动化的模型发布,提高了发布效率和人力资源,并且,在发布的各个流程中,不仅实现了自动还实现了对模型的测试、评估等等,使得模型发布的成功率更高,所发布模型的质量也有所保证。
图14是本发明实施例提供的一种深度学习模型发布装置的结构示意图,参见图14,包括:
接收模块1401,用于接收第一用户的模型生成事件信息,将所述模型生成事件信息存储至数据库;
发送模块1402,用于将所述模型生成事件信息发送至第二用户;
预发布模块1403,用于当接收到所述第二用户的预发布指令时,基于测试机和所述预发布指令中携带的所述已生成模型的模型生成事件信息,对所述目标网盘中已存储的所述已生成模型进行预发布;
发布模块1404,用于当所述已生成模型的运行情况符合第一预设条件时,将所述已生成模型发布至目标平台。
在一种可能实施方式中,所述装置还包括:
评估模块,用于当所述已生成模型的运行情况符合第一预设条件时,基于目标样本集对所述已生成模型进行评估,当评估结果符合第二预设条件时,将所述已生成模型发布至目标平台。
在一种可能实施方式中,所述预发布模块用于将所述模型生成事件信息发送至所述至测试机,由所述测试机根据所述模型生成事件信息,在所述目标网盘中查找所述已生成模型;
控制所述测试机将查找到的所述已生成模型进行预发布。
在一种可能实施方式中,所述预发布是指运行所述已生成模型的代码。
在一种可能实施方式中,所述发布模块用于向所述目标平台发送发布指令,所述发布指令中至少包括所述已生成模型的模型名称、路径信息和版本号,由所述目标平台将所述已生成模型添加至目标代码位置。
在一种可能实施方式中,所述模型生成事件信息至少包括已生成模型的模型名称、模型在目标网盘中的路径信息和版本号。
在一种可能实施方式中,所述装置还包括:
监控模块,用于监控所述已生成模型在预设时间内是否发布成功,如果发布未成功,向所述第一用户发送发布失败通知,所述发布失败通知用于告知发布失败。
在一种可能实施方式中,所述装置还包括:回滚模块,用于当接收到回滚指令时,从所述目标网盘中确定目标版本的模型,将所述已生成模型回滚至所述目标版本。
需要说明的是:上述实施例提供的深度学习模型发布装置在深度学习模型发布时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的深度学习模型发布装置与深度学习模型发布实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图15是本发明实施例提供的一种计算机设备的结构示意图,该计算机设备1500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)1501和一个或一个以上的存储器1502,其中,所述存储器1502中存储有至少一条指令,所述至少一条指令由所述处理器1501加载并执行以实现上述各个方法实施例提供的方法。当然,该计算机设备还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该计算机设备还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成下述实施例中的深度学习模型发布方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
以上所述仅是为了便于本领域的技术人员理解本发明的技术方案,并不用以限制本发明。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种深度学习模型发布方法,其特征在于,包括:
在第一用户训练得到模型后,接收所述第一用户发送的所述模型的模型生成事件信息;
基于所述第一用户和第二用户之间联动的运行逻辑,在接收到所述第一用户发送的所述模型生成事件信息后,直接触发将所述模型生成事件信息发送至所述第二用户;
当接收到所述第二用户的预发布指令时,基于测试机和所述预发布指令中携带的已生成模型的模型生成事件信息,对目标网盘中已存储的所述已生成模型进行预发布,所述目标网盘中的已生成模型为所述第一用户上传的;
当所述已生成模型的运行情况符合第一预设条件时,将所述已生成模型发布至目标平台。
2.根据权利要求1所述的方法,其特征在于,所述当所述已生成模型的运行情况符合第一预设条件时,将所述已生成模型发布至目标平台,包括:
当所述已生成模型的运行情况符合第一预设条件时,基于目标样本集对所述已生成模型进行评估,当评估结果符合第二预设条件时,将所述已生成模型发布至目标平台。
3.根据权利要求1所述的方法,其特征在于,所述基于测试机和所述预发布指令中携带的所述已生成模型的模型生成事件信息,对所述目标网盘中已存储的所述已生成模型进行预发布包括:
将所述模型生成事件信息发送至所述测试机,由所述测试机根据所述模型生成事件信息,在所述目标网盘中查找所述已生成模型;
控制所述测试机将查找到的所述已生成模型进行预发布。
4.根据权利要求1所述的方法,其特征在于,所述将所述已生成模型发布至所述目标平台包括:
向所述目标平台发送发布指令,所述发布指令中至少包括所述已生成模型的模型名称、路径信息和版本号,由所述目标平台将所述已生成模型添加至目标代码位置。
5.根据权利要求1所述的方法,其特征在于,所述将所述已生成模型发布至目标平台之后,所述方法还包括:
监控所述已生成模型在预设时间内是否发布成功,如果发布未成功,向所述第一用户发送发布失败通知。
6.根据权利要求1所述的方法,其特征在于,所述将所述已生成模型发布至目标平台之后,所述方法还包括:
当接收到回滚指令时,从所述目标网盘中确定目标版本的模型,将所述已生成模型回滚至所述目标版本。
7.根据权利要求1至权利要求6中任一项所述的方法,其特征在于,所述模型生成事件信息至少包括已生成模型的模型名称、模型在目标网盘中的路径信息和版本号。
8.一种深度学习模型发布装置,其特征在于,包括:
接收模块,用于在第一用户训练得到模型后,接收所述第一用户发送的所述模型的模型生成事件信息;
发送模块,用于基于所述第一用户和第二用户之间联动的运行逻辑,在接收到所述第一用户发送的所述模型生成事件信息后,直接触发将所述模型生成事件信息发送至所述第二用户;
预发布模块,用于当接收到所述第二用户的预发布指令时,基于测试机和所述预发布指令中携带的已生成模型的模型生成事件信息,对目标网盘中已存储的所述已生成模型进行预发布,所述目标网盘中的已生成模型为所述第一用户上传的;
发布模块,用于当所述已生成模型的运行情况符合第一预设条件时,将所述已生成模型发布至目标平台。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如权利要求1至权利要求7任一项所述的深度学习模型发布方法所执行的操作。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如权利要求1至权利要求7任一项所述的深度学习模型发布方法所执行的操作。
CN201811042879.0A 2018-09-05 2018-09-05 深度学习模型发布方法及装置 Active CN109271602B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811042879.0A CN109271602B (zh) 2018-09-05 2018-09-05 深度学习模型发布方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811042879.0A CN109271602B (zh) 2018-09-05 2018-09-05 深度学习模型发布方法及装置

Publications (2)

Publication Number Publication Date
CN109271602A CN109271602A (zh) 2019-01-25
CN109271602B true CN109271602B (zh) 2020-09-15

Family

ID=65188697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811042879.0A Active CN109271602B (zh) 2018-09-05 2018-09-05 深度学习模型发布方法及装置

Country Status (1)

Country Link
CN (1) CN109271602B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175636A (zh) * 2019-05-08 2019-08-27 深圳欧翼思特科技有限公司 一种物联网深度神经网络分布式判别推论系统及方法
CN110516090A (zh) * 2019-08-09 2019-11-29 广东浪潮大数据研究有限公司 一种物体检测方法、装置、设备及计算机可读存储介质
CN112446404A (zh) * 2019-09-04 2021-03-05 天津职业技术师范大学(中国职业培训指导教师进修中心) 一种基于主动学习的在线图像样本标注系统、标注方法及其应用
CN110659261A (zh) * 2019-09-19 2020-01-07 成都数之联科技有限公司 一种数据挖掘模型发布方法及模型和模型服务管理方法
CN111078984B (zh) * 2019-11-05 2024-02-06 深圳奇迹智慧网络有限公司 网络模型发布方法、装置、计算机设备和存储介质
CN111967613B (zh) * 2020-08-24 2023-06-16 浙江百应科技有限公司 Nlp模型训练发布识别系统
CN112104706B (zh) * 2020-08-24 2022-12-20 中国银联股份有限公司 分布式系统中模型发布方法、装置、设备、存储介质
CN112799710B (zh) * 2021-01-29 2023-11-03 上海明略人工智能(集团)有限公司 一种模型发布系统及模型发布方法
CN114153540A (zh) * 2021-11-30 2022-03-08 上海商汤科技开发有限公司 预训练模型发布方法及装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776326A (zh) * 2016-12-20 2017-05-31 中国农业银行股份有限公司 一种数据分析模型的建模方法及系统
CN107451663A (zh) * 2017-07-06 2017-12-08 阿里巴巴集团控股有限公司 算法组件化、基于算法组件建模方法、装置以及电子设备
CN108416363A (zh) * 2018-01-30 2018-08-17 平安科技(深圳)有限公司 机器学习模型的生成方法、装置、计算机设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776326A (zh) * 2016-12-20 2017-05-31 中国农业银行股份有限公司 一种数据分析模型的建模方法及系统
CN107451663A (zh) * 2017-07-06 2017-12-08 阿里巴巴集团控股有限公司 算法组件化、基于算法组件建模方法、装置以及电子设备
CN108416363A (zh) * 2018-01-30 2018-08-17 平安科技(深圳)有限公司 机器学习模型的生成方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN109271602A (zh) 2019-01-25

Similar Documents

Publication Publication Date Title
CN109271602B (zh) 深度学习模型发布方法及装置
CN113569987A (zh) 模型训练方法和装置
CN112799782B (zh) 模型生成系统、方法、电子设备及存储介质
CN110275992B (zh) 应急处理方法、装置、服务器及计算机可读存储介质
CN112749221A (zh) 数据任务调度方法、装置、存储介质及调度工具
CN112446511A (zh) 一种故障处置方法、装置、介质及设备
WO2023231704A1 (zh) 算法运行方法、装置、设备、存储介质
CN114035925A (zh) 一种工作流调度方法、装置、设备及可读存储介质
CN112925648B (zh) 业务策略的发布方法和装置
CN112214517A (zh) 流数据处理方法及装置、电子设备、存储介质
CN112181695A (zh) 异常应用处理方法、装置、服务器及存储介质
CN115643158A (zh) 设备集群修复方法、装置、设备和存储介质
CN115114275A (zh) 一种数据采集方法、设备及介质
CN112181443B (zh) 服务的自动化部署方法、装置及电子设备
CN116185787B (zh) 自学习型的监控告警方法、装置、设备及存储介质
CN110362464B (zh) 软件分析方法及设备
CN115959004B (zh) 车辆安全监测系统、方法、车载通信终端、车辆及服务器
CN113285855B (zh) 服务器监控方法及系统
CN114546764A (zh) 一种远程控制t-box系统日志的方法及系统
CN108184141B (zh) 一种监控视频任务的处理方法及服务器
CN117896232A (zh) 一种设备运维的方法和装置
CN114153645A (zh) 故障设备确定方法及装置、存储介质及电子设备
CN115934252A (zh) 一种基于Kafka实现全自动负载均衡消费消息的方法及系统
CN117955807A (zh) 系统检测方法、装置、电子设备及计算机可读存储介质
CN117670033A (zh) 一种安全检查方法、系统、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant