CN116627434B - 一种模型部署服务方法、电子设备及介质 - Google Patents
一种模型部署服务方法、电子设备及介质 Download PDFInfo
- Publication number
- CN116627434B CN116627434B CN202310910875.4A CN202310910875A CN116627434B CN 116627434 B CN116627434 B CN 116627434B CN 202310910875 A CN202310910875 A CN 202310910875A CN 116627434 B CN116627434 B CN 116627434B
- Authority
- CN
- China
- Prior art keywords
- model
- file
- request
- deployment
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000004044 response Effects 0.000 claims description 87
- 238000012545 processing Methods 0.000 claims description 45
- 238000012805 post-processing Methods 0.000 claims description 42
- 238000007781 pre-processing Methods 0.000 claims description 42
- 230000015654 memory Effects 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 8
- 238000004806 packaging method and process Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000005477 standard model Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Stored Programmes (AREA)
Abstract
本发明涉及计算机领域,具体提供一种模型部署服务方法、电子设备及介质,旨在解决用户因不熟悉服务部署流程而导致服务部署的效率和成功率较低的问题。为此目的,本发明的一种模型部署服务方法包括:响应于模型注册请求,呈现部署配置界面,其中所述部署配置界面至少包括模型注册单元和模型部署单元,其中所述模型注册单元和所述模型部署单元分别以待处理形式和非待处理形式呈现;响应于用户在所述模型注册单元中的操作,实现模型注册;响应于对已注册模型的部署请求,呈现所述部署配置界面,其中所述模型部署单元和所述模型注册单元分别以待处理形式和非待处理形式呈现;以及响应于用户在所述模型部署单元中的操作,实现模型部署。
Description
技术领域
本发明涉及人工智能技术领域,特别地,提供一种模型部署服务方法、电子设备及介质。
背景技术
现有技术中,在部署模型的人工智能服务时,需要提前准备复杂的软硬件环境及相关的计算资源,这对于模型提供者来说技术上存在一定程度的难度,使得部署需要花费较大的时间和精力,降低人工智能服务部署的效率。同时,由于开发人员在部署模型的人工智能服务时存在大量的人工操作,在这过程中容易出现错误使得模型无法正常运行,并且用户在使用部署模型的人工智能服务时,因为不熟悉部署流程容易导致服务部署的效率和成功率较低。因此,如何提高人工智能服务部署的效率以及成功率,成为了亟待解决的问题。
相应地,本领域需要一种模型部署服务方法、电子设备及介质来解决上述问题。
发明内容
为了克服上述缺陷,提出了本发明,以提供解决或至少部分地解决用户因不熟悉服务部署流程而导致服务部署的效率和成功率较低的问题的一种模型部署服务方法、电子设备及介质。
在第一方面,本发明提供一种模型部署服务方法,包括如下步骤:
响应于模型注册请求,呈现部署配置界面,其中所述部署配置界面至少包括模型注册单元和模型部署单元,其中所述模型注册单元和所述模型部署单元分别以待处理形式和非待处理形式呈现;
响应于用户在所述模型注册单元中的操作,实现模型注册;
响应于对已注册模型的部署请求,呈现所述部署配置界面,其中所述模型部署单元和所述模型注册单元分别以待处理形式和非待处理形式呈现;以及
响应于用户在所述模型部署单元中的操作,实现模型部署。
在一个具体实施例中,所述以待处理形式和非待处理形式呈现分别为:
以高亮形式呈现和以非高亮形式呈现;或
以与所述部署配置界面背景色不同的颜色呈现和以与所述部署配置界面背景色相同的颜色呈现;或
以可编辑形式呈现和以不可编辑形式呈现。
在一个具体实施例中,所述方法还包括:
接收模型部署指令,生成所述部署请求,其中所述部署指令至少包括服务名称、模型名称、版本以及资源参数。
在一个具体实施例中,
所述模型注册单元包括模型文件获取模块、模型输入参数获取模块以及模型输出参数获取模块,
所述响应于用户在所述模型注册单元中的操作,实现模型注册,包括:
接收用户对所述模型文件获取模块的操作,在所述部署配置界面上呈现模型文件获取界面;
响应于用户在所述模型文件获取界面中对模型路径以及计算引擎的输入,完成所述模型文件的获取;
接收用户对所述模型输入参数获取模块的操作或对所述模型输出参数获取模块的操作,在所述部署配置界面上呈现模型参数获取界面;
响应于用户在所述模型参数获取界面中上传模型参数文件,完成所述模型输入参数和/或模型输出参数的获取。
在一个具体实施例中,所述模型注册单元还包括模型前处理模块和/或模型后处理模块,
所述响应于用户在所述模型注册单元中的操作,实现模型注册,还包括:
接收用户对模型前处理模块的操作和/或对模型后处理模块的操作,在所述部署配置界面上呈现相应的数据处理文件获取界面;
响应于用户在数据处理文件获取界面中上传数据处理文件,完成所述模型前处理文件和/或模型后处理文件的获取,其中在模型部署后使用阶段,对输入到模型中的数据根据所述模型前处理文件进行处理和/或对模型输出的数据根据所述模型后处理文件进行处理。
在一个具体实施例中,
所述模型部署单元包括请求输入参数获取模块以及请求输出参数获取模块,
所述响应于用户在所述模型部署单元中的操作,实现模型部署,包括:
接收用户对请求输入参数获取模块的操作或对请求输出参数获取模块的操作,在所述部署配置界面上呈现请求参数获取界面;
响应于用户在请求参数获取界面中上传请求输入参数文件或请求输出参数文件,完成所述请求输入参数和/或请求输出参数的获取,其中所述请求输入参数文件包括待模型计算的数据的属性信息,所述请求输出参数文件包括待模型输出的数据的属性信息。
在一个具体实施例中,所述模型部署单元包括请求输入参数获取模块和请求输出参数获取模块,以及请求响应前处理模块和/或请求响应后处理模块,
所述响应于用户在所述模型部署单元中的操作,实现模型部署,包括:
接收用户对请求输入参数获取模块的操作或对请求输出参数获取模块的操作,在所述部署配置界面上呈现请求参数获取界面;
响应于用户在请求参数获取界面中上传请求输入参数文件或请求输出参数文件,完成所述请求输入参数和/或请求输出参数的获取,其中所述请求输入参数文件包括待模型计算的数据的属性信息,所述请求输出参数文件包括待模型输出的数据的属性信息;
接收用户对请求响应前处理模块和/或请求响应后处理模块的操作,在所述部署配置界面上呈现相应的请求响应处理文件获取界面;
响应于用户在请求响应处理文件获取界面中上传请求响应处理文件,完成请求响应前处理文件和/或请求响应后处理文件的获取,其中在模型部署后使用阶段,对输入到所述注册单元的数据根据所述请求响应前处理文件进行处理和/或对所述注册单元输出的数据根据所述请求响应后处理文件进行处理。
在一个具体实施例中,所述方法还包括:
响应于用户对请求响应前处理模块和/或请求响应后处理模块的操作,获取所述模型输入参数和/或模型输出参数;
根据所述模型输入参数和/或模型输出参数,分别检索相应的请求响应处理文件库中是否有匹配的目标请求响应处理文件;
若存在匹配的目标请求响应处理文件,将所述目标请求响应处理文件提供给用户以供上传,否则,提供接近的标准请求响应处理文件以供用户进行修改以得到目标请求响应处理文件。
在第二方面,本发明提供一种电子设备,包括处理器和存储装置,所述存储装置适于存储多条程序代码,其特征在于,所述程序代码适于由所述处理器加载并运行以执行第一方面中任一项所述的方法。
在第三方面,本发明提供一种计算机可读的存储介质,其上存储有计算机可读指令,所述指令当被计算机执行时,可操作来执行第一方面中任一项所述的方法。
本发明上述一个或多个技术方案,至少具有如下一种或多种有益效果:
通过实施本发明的技术方案中,基于设定好的开发路径进行模型部署,降低了工作难度和出错概率,操作简单且高效。
附图说明
参照附图,本发明的公开内容将变得更易理解。本领域技术人员容易理解的是:这些附图仅仅用于说明的目的,而并非意在对本发明的保护范围组成限制。此外,图中类似的数字用以表示类似的部件,其中:
图1是根据本发明的一个实施例的模型部署服务方法的主要步骤流程示意图;
图2是根据本发明的一个实施例的接收模型创建指令并生成注册请求的示意图;
图3是根据本发明的一个实施例的在部署配置界面中提交序列化模型文件的示意图;
图4是根据本发明的一个实施例的在部署配置界面中的上传模型输入/输出参数的示意图;
图5是根据本发明的一个实施例的基于已注册的模型创建在线服务的示意图;
图6是根据本发明的一个实施例的在线服务部署完成的示意图;
图7是根据本发明的一个实施例的通过在线服务得到模型预测数据的示意图;
图8是根据本发明的一个实施例的进行批量部署在线服务的示意图。
具体实施方式
下面参照附图来描述本发明的一些实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
在本发明的描述中,“模块”、“处理器”可以包括硬件、软件或者两者的组合。一个模块可以包括硬件电路,各种合适的感应器,通信端口,存储器,也可以包括软件部分,比如程序代码,也可以是软件和硬件的组合。处理器可以是中央处理器、微处理器、图像处理器、数字信号处理器或者其他任何合适的处理器。处理器具有数据和/或信号处理功能。处理器可以以软件方式实现、硬件方式实现或者二者结合方式实现。非暂时性的计算机可读存储介质包括任何合适的可存储程序代码的介质,比如磁碟、硬盘、光碟、闪存、只读存储器、随机存取存储器等等。术语“A和/或B”表示所有可能的A与B的组合,比如只是A、只是B或者A和B。术语“至少一个A或B”或者“A和B中的至少一个”含义与“A和/或B”类似,可以包括只是A、只是B或者A和B。单数形式的术语“一个”、“这个”也可以包含复数形式。
在本文中用到的方位术语如“前”、“前侧”、“前部”、“后”、“后侧”和“后部”等均以部件安装至车辆后车辆的前后方向为基准。在本文中提到的“纵”、“纵向”、“纵截面”均以部件安装至车辆后的前后方向为基准,而“横”、“横向”、“横截面”则表示垂直于纵向方向。
为了解决上述技术问题,尤其是为了解决用户因不熟悉服务部署流程而导致服务部署的效率和成功率较低的问题,为此,提出了本发明的一种模型部署服务方法、电子设备及介质。
在本发明实施例中,参阅附图1,图1是根据本发明的一个实施例的模型部署服务方法的主要步骤流程示意图,如图所示本实施例中的模型部署服务方法包括下列步骤S1-步骤S4:
S1、响应于模型注册请求,呈现部署配置界面,其中所述部署配置界面至少包括模型注册单元和模型部署单元,其中所述模型注册单元和所述模型部署单元分别以待处理形式和非待处理形式呈现。
在一个优选实施例中,所述以待处理形式和非待处理形式呈现分别为:
以高亮形式呈现和以非高亮形式呈现;或
以与所述部署配置界面背景色不同的颜色呈现和以与所述部署配置界面背景色相同的颜色呈现;或
以可编辑形式呈现和以不可编辑形式呈现。
例如,部署配置界面中待处理选项以高亮形式呈现,提醒用户该选项仍待完善,而非待处理选项意味着已经处理完毕,则以非高亮形式呈现。
例如,部署配置界面整体为灰色,其中待处理选项以亮黄色呈现,用来提醒用户该选项仍待完善,而非待处理选项意味着已经处理完毕,则以与部署配置界面相同的灰色呈现。
又例如,部署配置界面中待处理选项以可编辑形式呈现,提醒用户该选项仍待编辑完善,而非待处理选项意味着已经处理完毕,则以不可编辑形式呈现。
在一个示例中,所述方法还包括:
接收模型创建指令,生成所述注册请求,其中所述创建指令至少包括模型名称和版本参数。
例如,如图2所示,用户通过定义模型名称为“abc”,版本参数为“version-abc-20230428t160856”,以此来生成用于预测鸢尾花类型的分类模型。
S2、响应于用户在所述模型注册单元中的操作,实现模型注册。
在一个示例中,所述模型注册单元包括模型文件获取模块、模型输入参数获取模块以及模型输出参数获取模块,
所述响应于用户在所述模型注册单元中的操作,实现模型注册,包括:
接收用户对所述模型文件获取模块的操作,在所述部署配置界面上呈现模型文件获取界面;
响应于用户在所述模型文件获取界面中对模型路径以及计算引擎的输入,完成所述模型文件的获取;
接收用户对所述模型输入参数获取模块的操作或对所述模型输出参数获取模块的操作,在所述部署配置界面上呈现模型参数获取界面;
响应于用户在所述模型参数获取界面中上传模型参数文件,完成所述模型输入参数和/或模型输出参数的获取。
例如,如图3所示,用户点击模型文件获取模块,在呈现的模型文件获取界面中输入对应的序列化模型文件以及模型所依赖的计算引擎,如通过输入序列化模型文件的文件路径“test/model/model.joblib”,完成所述模型文件的获取。如图4所示,用户点击模型输入/输出参数获取模块进行相应的参数配置,例如上传一段json格式的文件,完成所述模型输入参数和/或模型输出参数的获取。
在一个示例中,所述方法还包括:
根据获取的模型文件得到模型类型;
根据所述模型类型,检索模型参数文件库中是否有匹配的目标模型参数文件;
若存在匹配的目标模型参数文件,将所述目标模型参数文件提供给用户以供上传,否则,提供接近的标准模型参数文件以供用户进行修改以得到目标模型参数文件。
本领域技术人员可以理解的是,基于获取到的模型文件的类型自动检索匹配参数文件以供上传,节省了由用户重新完整输入目标模型参数文件的时间,提高模型部署的效率,同时避免了用户输入目标模型参数文件的错误导致模型部署失败的发生。
在另一个示例中,所述模型注册单元还包括模型前处理模块和/或模型后处理模块,
所述响应于用户在所述模型注册单元中的操作,实现模型注册,还包括:
接收用户对模型前处理模块的操作和/或对模型后处理模块的操作,在所述部署配置界面上呈现相应的数据处理文件获取界面;
响应于用户在数据处理文件获取界面中上传数据处理文件,完成所述模型前处理文件和/或模型后处理文件的获取,其中在模型部署后使用阶段,对输入到模型中的数据根据所述模型前处理文件进行处理和/或对模型输出的数据根据所述模型后处理文件进行处理。
例如,用户通过点击模型前处理模块和/或模型后处理模块,提交模型文件所需要的前、后处理代码,完成对数据的降维处理、图像文件的剪裁、转为灰度图、二值化处理等等。
在一个示例中,所述响应于用户在所述模型注册单元中的操作,实现模型注册,还包括:
将所述模型文件和模型参数文件封装为模型镜像文件。
例如,用户点击部署配置界面中的模型注册选项,向后台提交上述模型文件、模型输入和/或输出参数文件,后台自动将其封装成模型镜像文件,并配置相应的容器。
在另一个示例中,所述响应于用户在所述模型注册单元中的操作,实现模型注册,还包括:
将所述模型文件和模型参数文件封装为模型镜像文件;
将所述模型前处理文件和/或模型后处理文件封装进变换镜像文件。
例如,将模型文件、模型输入和/或输出参数文件封装成模型镜像文件以外,还要将模型前处理和/或模型后处理代码封装成变换镜像文件,并分别配置对应模型镜像文件和变换镜像文件的容器。
S3、响应于对已注册模型的部署请求,呈现所述部署配置界面,其中所述模型部署单元和所述模型注册单元分别以待处理形式和非待处理形式呈现。
在一个优选实施例中,同样的,所述以待处理形式和非待处理形式呈现分别为:
以高亮形式呈现和以非高亮形式呈现;或
以与所述部署配置界面背景色不同的颜色呈现和以与所述部署配置界面背景色相同的颜色呈现;或
以可编辑形式呈现和以不可编辑形式呈现。
在一个示例中,所述方法还包括:
接收模型部署指令,生成所述部署请求,其中所述部署指令至少包括服务名称、模型名称、版本以及资源参数。
进一步地,在一个示例中,所述接收模型部署指令,生成所述部署请求,包括:
监听对已注册模型库中的已注册模型的选择,确定所选择的模型的大小和/或执行优先级属性;
根据所选择模型的大小和/或执行优先级属性以及当前可用资源情况,确定所选择模型对应的资源参数。
例如,如图5所示,用户从已注册的模型列表中选择目标模型“moxing”,确定模型“moxing”的大小和/或执行优先级属性,并根据模型“moxing”的大小和/或执行优先级属性以及当前可用资源情况,确定对应的请求CPUs(核)、请求内存(G)和GPUs数量(个)等资源参数。
S4、响应于用户在所述模型部署单元中的操作,实现模型部署。
在一个示例中,所述模型部署单元包括请求输入参数获取模块以及请求输出参数获取模块,
所述响应于用户在所述模型部署单元中的操作,实现模型部署,包括:
接收用户对请求输入参数获取模块的操作或对请求输出参数获取模块的操作,在所述部署配置界面上呈现请求参数获取界面;
响应于用户在请求参数获取界面中上传请求输入参数文件或请求输出参数文件,完成所述请求输入参数和/或请求输出参数的获取,其中所述请求输入参数文件包括待模型计算的数据的属性信息,所述请求输出参数文件包括待模型输出的数据的属性信息。
在另一个示例中,所述模型部署单元包括请求输入参数获取模块和请求输出参数获取模块,以及请求响应前处理模块和/或请求响应后处理模块,
所述响应于用户在所述模型部署单元中的操作,实现模型部署,包括:
接收用户对请求输入参数获取模块的操作或对请求输出参数获取模块的操作,在所述部署配置界面上呈现请求参数获取界面;
响应于用户在请求参数获取界面中上传请求输入参数文件或请求输出参数文件,完成所述请求输入参数和/或请求输出参数的获取,其中所述请求输入参数文件包括待模型计算的数据的属性信息,所述请求输出参数文件包括待模型输出的数据的属性信息;
接收用户对请求响应前处理模块和/或请求响应后处理模块的操作,在所述部署配置界面上呈现相应的请求响应处理文件获取界面;
响应于用户在请求响应处理文件获取界面中上传请求响应处理文件,完成请求响应前处理文件和/或请求响应后处理文件的获取,其中在模型部署后使用阶段,对输入到所述注册单元的数据根据所述请求响应前处理文件进行处理和/或对所述注册单元输出的数据根据所述请求响应后处理文件进行处理。
例如,用户点击部署配置界面中的请求输入参数和/或请求输出参数选项,上传请求参数的格式文件,如一段json格式文件,以此来定义如何将待计算的数据提交给目标模型。
进一步地,所述方法还包括:
响应于用户对请求响应前处理模块和/或请求响应后处理模块的操作,获取所述模型输入参数和/或模型输出参数;
根据所述模型输入参数和/或模型输出参数,分别检索相应的请求响应处理文件库中是否有匹配的目标请求响应处理文件;
若存在匹配的目标请求响应处理文件,将所述目标请求响应处理文件提供给用户以供上传,否则,提供接近的标准请求响应处理文件以供用户进行修改以得到目标请求响应处理文件。
本领域技术人员可以理解的是,基于获取到的模型输入参数和/或模型输出参数自动检索匹配的目标请求响应处理文件以供上传,节省了由用户重新完整输入目标请求响应处理文件的时间,提高了模型部署的效率,同时避免了用户输入目标请求响应处理文件错误导致的模型部署失败问题。
在一个示例中,所述响应于用户在所述模型部署单元中的操作,实现模型部署,还包括:
将所述请求输入参数文件和/或请求输出参数文件和/或请求响应前处理文件和/或请求响应后处理文件封装进变换镜像文件。
例如,将请求输入参数文件和/或请求输出参数文件和/或请求响应前处理文件和/或请求响应后处理文件封装进变换镜像文件,并配置相应的容器。
在一个示例中,所述响应于用户在所述模型部署单元中的操作,实现模型部署,还包括:
将所述模型镜像文件和所述变换镜像文件加载进内存,生成模型服务。
例如,如图6所示,在完成模型镜像文件和变换镜像文件的封装以后,将这两个镜像加载进入运行环境的内存,后台自动生成推理模型服务的工作流,形成请求和响应数据的流向,产生该模型服务的web服务、API。
进一步地,所述方法还包括:
根据所述变换镜像文件和模型镜像文件,调整对应的模块在所述部署配置界面上的布局。
在设置前所述的模型文件、模型参数文件、模型前/后处理文件、请求输入参数文件、请求输出参数文件、请求响应前处理文件和/或请求响应后处理文件时在部署配置界面上的布局(各自在配置界面上的相对位置关系)是随意的、仅靠模块中示出的文字加以区分来帮助用户在对应的模块处配置对应的文件,但这对于新手来说,仅凭文字仍然存在理解困难,不利于提高工作效率。
为此,在一个优选实施例中,若监测到所述模型镜像文件中同时存在模型输入参数文件和模型输出参数文件,则在部署配置界面中对模型注册单元中的模型文件获取模块、模型输入参数获取模块和模型输出参数获取模块进行重新布局显示,即:以模型文件获取模块为中心对称显示模型输入参数获取模块和模型输出参数获取模块,并以在服务部署后运行阶段的执行顺序以箭头连接这三个模块,如图3所示。
进一步,若监测到所述模型镜像文件中还同时存在模型前处理文件和模型后处理文件,则在部署配置界面中对模型注册单元中的模型文件获取模块、模型输入参数获取模块、模型输出参数获取模块、模型前处理模块和模型后处理模块进行重新布局显示,即:以模型文件获取模块为中心对称显示模型输入参数获取模块和模型输出参数获取模块、模型前处理模块和模型后处理模块,并以在服务部署后运行阶段的执行顺序以箭头连接这五个模块,如图3所示。
类似地,在一个优选实施例中,若监测到所述变换镜像文件中同时存在请求输入参数文件和请求输出参数文件、请求响应前处理文件和请求响应后处理文件,则在部署配置界面中对模型部署单元中的模型文件获取模块、请求输入参数获取模块、请求输出参数获取模块、请求响应前处理模块和请求响应后处理模块进行重新布局显示,即:以模型文件获取模块为中心对称显示请求输入参数获取模块和请求输出参数获取模块、请求响应前处理模块和请求响应后处理模块,并以在服务部署后运行阶段的执行顺序以箭头连接这五个模块。
在上述方案中,在两个单元之间仍可以以箭头表示跨单元的逻辑执行顺序,如图3所示,在两个单元中的各模块均经过重新布局后,还以箭头连接两个单元。
通过上述方案,无论是对模型注册单元中的各模块之间的逻辑关系的重新布局还是对模型部署单元中各模块之间的逻辑关系的重新布局,以模型文件获取模块为对称轴布局,在上面的模块(例如模型输入参数获取模块、请求输入参数获取模块)分别与下面的模块(模型输出参数获取模块、请求输出参数获取模块)在各自所在的单元中对称设置,并且以箭头指示各模块的逻辑执行顺序,这就能够让用户尤其是新手在配置各模块后仅通过视图呈现形式就可以判断各模块应该做什么,应该上传什么样的文件。
在一个优选实施例中,所述部署配置界面还包括客户端单元,包括服务请求模块和服务响应模块。
在一个示例中,如图7所示,所述方法还包括:
呈现模型监测界面;
响应于用户在所述模型监测界面中的预测数据输入,呈现预测结果,用于判断所述模型是否正常服务。
在一个示例中,如图8所示,所述方法还包括:
呈现批量服务调度界面;
响应于用户在所述批量服务调度界面中输入,得到调度计划;
响应于调度计划的触发,自动将所述服务启动。
通过上述步骤 S1-S4,用户可以基于设定好的开发路径进行模型部署,降低了工作难度和出错概率,操作简单且高效。
需要指出的是,尽管上述实施例中将各个步骤按照特定的先后顺序进行了描述,但是本领域技术人员可以理解,为了实现本发明的效果,不同的步骤之间并非必须按照这样的顺序执行,其可以同时(并行)执行或以其他顺序执行,这些变化都在本发明的保护范围之内。
本领域技术人员能够理解的是,本发明实现上述一实施例的方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括电载波信号和电信信号。
进一步,本发明还提供了一种电子设备。在根据本发明的一个电子设备实施例中,电子设备包括处理器和存储装置,存储装置可以被配置成存储执行上述方法实施例的模型部署服务方法的程序,处理器可以被配置成用于执行存储装置中的程序,该程序包括但不限于执行上述方法实施例的插件安装优化方法的程序。为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。
进一步,本发明还提供了一种计算机可读存储介质。在根据本发明的一个计算机可读存储介质实施例中,计算机可读存储介质可以被配置成存储执行上述方法实施例的模型部署服务方法的程序,该程序可以由处理器加载并运行以实现上述模型部署服务方法。为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该计算机可读存储介质可以是包括各种电子设备形成的存储装置设备,可选的,本发明实施例中计算机可读存储介质是非暂时性的计算机可读存储介质。
进一步,应该理解的是,由于各个模块的设定仅仅是为了说明本发明的装置的功能单元,这些模块对应的物理器件可以是处理器本身,或者处理器中软件的一部分,硬件的一部分,或者软件和硬件结合的一部分。因此,图中的各个模块的数量仅仅是示意性的。
本领域技术人员能够理解的是,可以对装置中的各个模块进行适应性地拆分或合并。对具体模块的这种拆分或合并并不会导致技术方案偏离本发明的原理,因此,拆分或合并之后的技术方案都将落入本发明的保护范围内。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (8)
1.一种模型部署服务方法,其特征在于,所述方法包括:
响应于模型注册请求,呈现部署配置界面,其中所述部署配置界面至少包括模型注册单元和模型部署单元,其中所述模型注册单元和所述模型部署单元分别以待处理形式和非待处理形式呈现;
响应于用户在所述模型注册单元中的操作,实现模型注册;
响应于对已注册模型的部署请求,呈现所述部署配置界面,其中所述模型部署单元和所述模型注册单元分别以待处理形式和非待处理形式呈现;以及
响应于用户在所述模型部署单元中的操作,实现模型部署;
所述模型注册单元包括模型文件获取模块、模型输入参数获取模块以及模型输出参数获取模块,
所述响应于用户在所述模型注册单元中的操作,实现模型注册,包括:
接收用户对所述模型文件获取模块的操作,在所述部署配置界面上呈现模型文件获取界面;
响应于用户在所述模型文件获取界面中对模型路径以及计算引擎的输入,完成所述模型文件的获取;
接收用户对所述模型输入参数获取模块的操作或对所述模型输出参数获取模块的操作,在所述部署配置界面上呈现模型参数获取界面;
响应于用户在所述模型参数获取界面中上传模型参数文件,完成所述模型输入参数和/或模型输出参数的获取;
所述模型注册单元还包括模型前处理模块和/或模型后处理模块,
所述响应于用户在所述模型注册单元中的操作,实现模型注册,还包括:
接收用户对模型前处理模块的操作和/或对模型后处理模块的操作,在所述部署配置界面上呈现相应的数据处理文件获取界面;
响应于用户在数据处理文件获取界面中上传数据处理文件,完成所述模型前处理文件和/或模型后处理文件的获取,其中在模型部署后使用阶段,对输入到模型中的数据根据所述模型前处理文件进行处理和/或对模型输出的数据根据所述模型后处理文件进行处理;
所述响应于用户在所述模型注册单元中的操作,实现模型注册,
还包括:
将所述模型文件和模型参数文件封装为模型镜像文件;
将所述模型前处理文件和/或模型后处理文件封装进变换镜像文件;
所述响应于用户在所述模型部署单元中的操作,实现模型部署,还包括:
将所述模型镜像文件和所述变换镜像文件加载进内存,生成模型服务。
2.根据权利要求1所述的方法,其特征在于,所述以待处理形式和非待处理形式呈现分别为:
以高亮形式呈现和以非高亮形式呈现;或
以与所述部署配置界面背景色不同的颜色呈现和以与所述部署配置界面背景色相同的颜色呈现;或
以可编辑形式呈现和以不可编辑形式呈现。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
接收模型部署指令,生成所述部署请求,其中所述部署指令至少包括服务名称、模型名称、版本以及资源参数。
4.根据权利要求1或2所述的方法,其特征在于,
所述模型部署单元包括请求输入参数获取模块以及请求输出参数获取模块,
所述响应于用户在所述模型部署单元中的操作,实现模型部署,包括:
接收用户对请求输入参数获取模块的操作或对请求输出参数获取模块的操作,在所述部署配置界面上呈现请求参数获取界面;
响应于用户在请求参数获取界面中上传请求输入参数文件或请求输出参数文件,完成所述请求输入参数和/或请求输出参数的获取,其中所述请求输入参数文件包括待模型计算的数据的属性信息,所述请求输出参数文件包括待模型输出的数据的属性信息。
5.根据权利要求1所述的方法,其特征在于,所述模型部署单元包括请求输入参数获取模块和请求输出参数获取模块,以及请求响应前处理模块和/或请求响应后处理模块,
所述响应于用户在所述模型部署单元中的操作,实现模型部署,包括:
接收用户对请求输入参数获取模块的操作或对请求输出参数获取模块的操作,在所述部署配置界面上呈现请求参数获取界面;
响应于用户在请求参数获取界面中上传请求输入参数文件或请求输出参数文件,完成所述请求输入参数和/或请求输出参数的获取,其中所述请求输入参数文件包括待模型计算的数据的属性信息,所述请求输出参数文件包括待模型输出的数据的属性信息;
接收用户对请求响应前处理模块和/或请求响应后处理模块的操作,在所述部署配置界面上呈现相应的请求响应处理文件获取界面;
响应于用户在请求响应处理文件获取界面中上传请求响应处理文件,完成请求响应前处理文件和/或请求响应后处理文件的获取,其中在模型部署后使用阶段,对输入到所述注册单元的数据根据所述请求响应前处理文件进行处理和/或对所述注册单元输出的数据根据所述请求响应后处理文件进行处理。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
响应于用户对请求响应前处理模块和/或请求响应后处理模块的操作,获取所述模型输入参数和/或模型输出参数;
根据所述模型输入参数和/或模型输出参数,分别检索相应的请求响应处理文件库中是否有匹配的目标请求响应处理文件;
若存在匹配的目标请求响应处理文件,将所述目标请求响应处理文件提供给用户以供上传,否则,提供接近的标准请求响应处理文件以供用户进行修改以得到目标请求响应处理文件。
7.一种电子设备,包括处理器和存储装置,所述存储装置适于存储多条程序代码,其特征在于,所述程序代码适于由所述处理器加载并运行以执行权利要求1至6中任一项所述的方法。
8.一种计算机可读的存储介质,其上存储有计算机可读指令,所述指令当被计算机执行时,可操作来执行权利要求1至6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310910875.4A CN116627434B (zh) | 2023-07-24 | 2023-07-24 | 一种模型部署服务方法、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310910875.4A CN116627434B (zh) | 2023-07-24 | 2023-07-24 | 一种模型部署服务方法、电子设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116627434A CN116627434A (zh) | 2023-08-22 |
CN116627434B true CN116627434B (zh) | 2023-11-28 |
Family
ID=87603030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310910875.4A Active CN116627434B (zh) | 2023-07-24 | 2023-07-24 | 一种模型部署服务方法、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116627434B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112667251A (zh) * | 2020-12-29 | 2021-04-16 | 数字广东网络建设有限公司 | 一种服务部署方法、装置、计算机设备及存储介质 |
CN114048024A (zh) * | 2021-10-26 | 2022-02-15 | 腾讯科技(深圳)有限公司 | 任务部署方法、装置、设备、存储介质及产品 |
WO2023044631A1 (en) * | 2021-09-22 | 2023-03-30 | Siemens Aktiengesellschaft | A device, system, method and storage medium for ai application deployment |
CN115934110A (zh) * | 2022-12-30 | 2023-04-07 | 杭州海康威视数字技术股份有限公司 | 一种模型部署方法、装置及电子设备 |
CN115964035A (zh) * | 2022-12-05 | 2023-04-14 | 广州市海捷计算机科技有限公司 | 数据挖掘模型管理方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112015470B (zh) * | 2020-09-09 | 2022-02-01 | 平安科技(深圳)有限公司 | 模型部署方法、装置、设备及存储介质 |
-
2023
- 2023-07-24 CN CN202310910875.4A patent/CN116627434B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112667251A (zh) * | 2020-12-29 | 2021-04-16 | 数字广东网络建设有限公司 | 一种服务部署方法、装置、计算机设备及存储介质 |
WO2023044631A1 (en) * | 2021-09-22 | 2023-03-30 | Siemens Aktiengesellschaft | A device, system, method and storage medium for ai application deployment |
CN114048024A (zh) * | 2021-10-26 | 2022-02-15 | 腾讯科技(深圳)有限公司 | 任务部署方法、装置、设备、存储介质及产品 |
CN115964035A (zh) * | 2022-12-05 | 2023-04-14 | 广州市海捷计算机科技有限公司 | 数据挖掘模型管理方法、装置、电子设备及存储介质 |
CN115934110A (zh) * | 2022-12-30 | 2023-04-07 | 杭州海康威视数字技术股份有限公司 | 一种模型部署方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN116627434A (zh) | 2023-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6944548B2 (ja) | 自動コード生成 | |
US10866788B2 (en) | System and method for automated generation of integration elements modeling process flow for an integration process with a swagger API | |
WO2020006910A1 (zh) | 业务组件式开发方法、装置、计算机设备及存储介质 | |
US20160283353A1 (en) | Automated software testing | |
CN110598868B (zh) | 一种机器学习模型搭建方法、装置及相关设备 | |
US10884912B2 (en) | Method, system, and framework for testing a human machine interface (HMI) application on a target device | |
US20170177466A1 (en) | Volume testing | |
CN111813686B (zh) | 一种游戏测试方法、装置、测试终端及存储介质 | |
CN110309269A (zh) | 应答处理方法及其系统、计算机系统及计算机可读介质 | |
CN108536579A (zh) | 资源受限设备测试系统和方法 | |
CN111358430B (zh) | 一种磁共振成像模型的训练方法及装置 | |
CN111311480A (zh) | 图像融合方法和装置 | |
CN113407254B (zh) | 表单生成方法、装置、电子设备及存储介质 | |
US11789711B2 (en) | Using artificial intelligence to optimize software to run on heterogeneous computing resource | |
CN116627434B (zh) | 一种模型部署服务方法、电子设备及介质 | |
CN110717992B (zh) | 调度模型的方法、装置、计算机系统和可读存储介质 | |
CN117235527A (zh) | 端到端容器化的大数据模型构建方法、装置、设备及介质 | |
CN110312990A (zh) | 配置方法及系统 | |
CN116594733A (zh) | 流程可视化建模方法、计算机设备及计算机可读存储介质 | |
CN114416305A (zh) | 一种机器人引擎实现方法、系统及电子设备 | |
CN114266233A (zh) | 表单生成方法、装置、设备及介质 | |
CN112286785B (zh) | 用户界面的异常检测方法及装置 | |
CN114564925A (zh) | 报表生成方法、装置、电子设备及可读存储介质 | |
CN110119721B (zh) | 用于处理信息的方法和装置 | |
CN113098961A (zh) | 组件上传方法、装置、系统、计算机设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |