CN115049057B - 一种模型部署方法、装置、电子设备和存储介质 - Google Patents

一种模型部署方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN115049057B
CN115049057B CN202210960935.9A CN202210960935A CN115049057B CN 115049057 B CN115049057 B CN 115049057B CN 202210960935 A CN202210960935 A CN 202210960935A CN 115049057 B CN115049057 B CN 115049057B
Authority
CN
China
Prior art keywords
model
target
network
training
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210960935.9A
Other languages
English (en)
Other versions
CN115049057A (zh
Inventor
蔡丹平
周祥明
张朋
吴立
黄鹏
陈波扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN202210960935.9A priority Critical patent/CN115049057B/zh
Publication of CN115049057A publication Critical patent/CN115049057A/zh
Application granted granted Critical
Publication of CN115049057B publication Critical patent/CN115049057B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Stored Programmes (AREA)

Abstract

本申请涉及人工智能技术领域,尤其涉及一种模型部署方法、装置、电子设备和存储介质,用以解决针对目前的人工智能开发过程复杂,耗时较长的问题。本申请方法包括:获取模型部署指令指示的模型属性信息,模型属性信息表征待生成的目标网络模型的运行需求;基于预配置的基础网络结构集合,获得至少一个候选网络模型;候选网络模型是基于基础网络结构集合中与模型属性信息相匹配的目标基础网络结构确定的;基于至少一个候选网络模型,确定目标网络模型,并将目标网络模型部署于目标设备,以在目标设备,基于目标网络模型对待处理资源进行相应的资源处理。本申请根据训练需求自动推荐网络并将网络部署于目标设备,大大简化开发过程,节省开发时间。

Description

一种模型部署方法、装置、电子设备和存储介质
技术领域
本申请涉及人工智能技术领域,尤其涉及一种模型部署方法、装置、电子设备和存储介质。
背景技术
随着科技进步,人工智能逐渐走进大众视野,并被广泛应用到各种领域,这给人们的生活带来了极大的便利,而随着时代发展,各个领域对人工智能的需求也越来越多。
相关技术中,人工智能的开发过程,从模型的建立、训练到实际应用都十分复杂,且需要相关技术人员具备大量的专业知识。其中,在模型的训练测试过程中,相关技术人员需要根据自身知识经验选取合适的算法与网络,之后通过训练样本与对应的测试样本查验模型性能,并在此基础上做大量的修改,使模型逐渐完善,整个过程需要耗费大量时间与精力。
综上,相关的模型部署与开发需要人工完成,且过程复杂,花费时间长。
发明内容
本申请提供一种模型部署方法、装置、电子设备和存储介质,以至少解决相关技术中,模型部署与开发过程复杂且耗时长的问题。
本申请实施例提供的一种模型部署方法,包括:
获取模型部署指令指示的模型属性信息,所述模型属性信息用于表征待生成的目标网络模型的运行需求;
基于预配置的基础网络结构集合,获得至少一个候选网络模型,所述候选网络模型是基于所述基础网络结构集合中与所述模型属性信息相匹配的目标基础网络结构确定的;所述基础网络结构集合中每个基础网络结构是根据预设的模型功能配置的;
基于至少一个所述候选网络模型,确定目标网络模型,并将所述目标网络模型部署于目标设备,以在所述目标设备,基于所述目标网络模型对待处理资源进行相应的资源处理。
本申请实施例提供一种模型部署装置,包括:
第一获取单元,用于获取模型部署指令指示的模型属性信息,所述模型属性信息用于表征待生成的目标网络模型的运行需求;
第二获取单元,用于基于预配置的基础网络结构集合,获得至少一个候选网络模型,所述候选网络模型是基于所述基础网络结构集合中与所述模型属性信息相匹配的目标基础网络结构确定的;所述基础网络结构集合中每个基础网络结构是根据预设的模型功能配置的;
确定单元,用于基于至少一个所述候选网络模型,确定目标网络模型,并将所述目标网络模型部署于目标设备,以在所述目标设备,基于所述目标网络模型对待处理资源进行相应的资源处理。
在一些可选的实施例中,所述第二获取单元具体用于:
在所述基础网络结构集合中,筛选符合所述模型属性信息的至少一个目标基础网络结构,并将每个所述目标基础网络结构,分别作为一个所述候选网络模型;和/或
在所述基础网络结构集合中,筛选符合所述模型属性信息的至少一个目标基础网络结构,并对至少一个所述目标基础网络结构进行网络结构调整,生成至少一个所述候选网络模型。
在一些可选的实施例中,所述基础网络结构包括主干网络与预训练模型中的至少一种;所述第二获取单元具体用于:
通过以下至少一种方式对至少一个所述目标基础网络结构进行网络结构调整:
从至少一个待进行网络结构调整的目标基础网络结构中,选取至少一个目标基础网络结构进行裁剪;
从至少一个待进行网络结构调整的目标基础网络结构中,选至少两个目标基础网络结构进行拼接。
在一些可选的实施例中,所述基础网络结构包括网络基本单元和网络拓扑结构;所述第二获取单元具体用于:
通过如下方式对至少一个所述目标基础网络结构进行网络结构调整:
在所述基础网络结构集合中,筛选符合所述模型属性信息的多个目标网络基本单元,和至少一个目标网络拓扑结构;
基于至少一个所述目标网络拓扑结构,对所述多个目标网络基本单元进行组合,得到至少一个新的主干网络;
分别将每个所述新的主干网络,作为一个所述候选网络模型。
在一些可选的实施例中,所述模型属性信息包括用于进行模型训练的训练规则;所述确定单元具体用于:
若所述候选网络模型只有一个,则将所述候选网络模型作为所述目标网络模型;
若所述候选网络模型有多个,则基于所述目标设备对应的芯片类型,将至少一个所述候选网络模型进行转换与测试;基于获得的测试结果与所述训练规则,对至少一个所述候选网络模型进行训练;基于获得的训练结果,从至少一个所述候选网络模型中,确定目标网络模型。
在一些可选的实施例中,所述模型属性信息包括用于进行模型训练的训练规则;所述确定单元具体用于:
基于所述训练规则,对所述目标网络模型进行训练,获得训练后的目标网络模型;
基于所述目标设备对应的芯片类型,对所述训练后的目标网络模型进行转换,获得转换后的目标网络模型;
将所述转换后的目标网络模型部署于所述目标设备。
在一些可选的实施例中,所述装置还包括:
第一响应单元,用于响应于对操作界面中任务提交控件的触发操作,输出并展示相应的转换结果,所述转换结果用于表征所述目标网络模型在所述目标设备的精度损失,以根据转换结果报告修正所述目标网络模型;
其中,所述精度损失是将所述目标网络模型,分别在自身和所述目标设备,基于相同的输入数据获得的各个网络层的输出数据进行对比得到的。
在一些可选的实施例中,在所述将所述转换后的目标网络模型部署于所述目标设备之后,所述装置还包括:
第二响应单元,用于响应于对操作界面中的任务提交控件的触发操作,对所述转换后的目标网络模型进行测试,输出并展示相应的测试结果,所述测试结果用于描述所述转换后的目标网络模型,在所述目标设备对应的性能。
在一些可选的实施例中,所述测试结果包括在不同维度评估所述目标网络模型对应的性能参数;所述第二响应单元具体用于:
响应于对所述操作界面中的任务提交控件的触发操作,对所述转换后的目标网络模型进行测试;
通过对比所述目标网络模型在所述目标设备与参考平台的运行信息,输出并展示相应的测试结果,所述参考平台为对应的精度损失满足第一预设数值条件的平台。
在一些可选的实施例中,所述第二获取单元具体用于:
响应于针对操作界面中的网络推荐控件的触发操作,获得并展示至少一个所述候选网络模型,所述候选网络模型是:基于从所述基础网络结构集合中筛选的,与所述模型属性信息相匹配的目标基础网络结构确定的。
在一些可选的实施例中,所述确定单元具体用于:
响应于对操作界面中的任务提交控件的触发操作,输出并展示针对所述目标网络模型的训练日志,所述训练日志的展示界面包括:用于展示所述训练过程中详细信息的基本信息区域,与用于展示训练结果的评估报告区域。
在一些可选的实施例中,所述训练结果包含所述训练过程中每次训练迭代的迭代次序、相应的损失值和性能参数,与突出显示的目标轮次对应的损失值和性能参数;其中,所述目标轮次为满足第二预设数值条件的训练迭代对应的迭代次序。
在一些可选的实施例中,所述确定单元具体用于:
响应于对操作界面中量化选择控件的触发操作,基于所述训练规则对所述目标网络模型进行量化训练,获得训练后的目标网络模型。
在一些可选的实施例中,所述确定单元具体用于:
响应于对知识蒸馏选择控件的触发操作,对所述目标网络模型进行知识蒸馏训练,获得训练后的目标网络模型。
在一些可选的实施例中,所述装置还包括:
第一入库单元,用于在所述确定单元基于至少一个候选网络模型,确定目标网络模型之后,响应于对操作界面中网络入库控件的触发操作,将所述目标网络模型作为新的主干网络,添加至所述基础网络结构集合。
在一些可选的实施例中,所述装置还包括:
第二入库单元,用于在所述确定单元基于所述训练规则,对所述目标网络模型进行训练,获得训练后的目标网络模型之后,响应于对操作界面中网络入库控件的触发操作,将所述训练后的目标网络模型作为新的预训练模型,添加至所述基础网络结构集合。
在一些可选的实施例中,所述装置还包括:
自选单元,用于响应于对操作界面中网络选择控件的触发操作,展示所述基础网络结构集合中的主干网络与预训练模型,将选择的主干网络或预训练模型,作为所述候选网络模型;或
响应于对操作界面中网络上传控件的触发操作,展示网络文件选择界面,基于选择的网络文件,获取并上传所述候选网络模型。
本申请实施例提供的一种电子设备,包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行上述任意一种模型部署方法的步骤。
本申请实施例提供一种计算机可读存储介质,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行上述任意一种模型部署方法的步骤。
本申请有益效果如下:
本申请实施例提供了一种模型部署方法、装置、电子设备和存储介质。由于相关技术中的训练开发策略都是基于人工完成,其中涉及基于技术人员自身知识经验选取合适的算法与网络,再通过训练样本与对应的测试样本查验模型性能,并在此基础上不断修改,整个过程复杂且耗时,而本申请能够自动根据操作者输入的表征开发需求的模型属性信息推荐网络,并对网络进行训练,还自动将网络部署于目标设备,以此在保证模型训练效果的同时,将开发过程简单化、自动化,降低技术门槛,减少模型部署、算法开发周期,提高模型部署及测试的开发生产效率,节约成本,助力人工智能加速落地。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种模型部署方法的应用场景示意图;
图2为本申请实施例提供的一种模型部署方法的整体流程图;
图3为本申请实施例提供的一种网络图;
图4为本申请实施例提供的一种网络拓扑结构示例图;
图5为本申请实施例提供的一种网络推荐操作界面图;
图6为本申请实施例提供的一种训练部署一体化任务提交界面图;
图7为本申请实施例提供的一种训练日志界面展示图;
图8A为本申请实施例提供的一种模型部署开发的简要流程图;
图8B为本申请实施例提供的一种模型部署的逻辑示意图;
图9为本申请实施例提供的一种具体场景下,模型部署方法整体过程的交互时序图;
图10为本申请实施例提供的一种模型部署装置的组成结构示意图;
图11为本申请实施例提供的一种电子设备的一个硬件组成结构示意图;
图12为本申请实施例提供的另一种电子设备的一个硬件组成结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请技术方案保护的范围。
下面对本申请实施例中涉及的部分概念进行介绍。
模型属性信息:表征待生成的目标网络模型的运行需求,包括但不限于下列的部分或全部:用于进行模型训练的训练规则(例如梯度下降法、momentum动量方法等),目标设备的性能约束(例如算力、内存、带宽等),目标网络模型需求参数(例如期望的网络推理耗时、模型大小等)。
模型功能:也即模型的训练方向,同时对应模型实际应用的某个方向,主要有检测、分类、分割等;例如模型应用于对图片中的安全帽进行检测,则该模型的训练方向为检测,模型应用于对图片中的植物进行分类,则该模型的训练方向为分类等。
基础网络结构集合:包含一个或多个基础网络结构,每个基础网络结构是根据预设的模型功能配置的。如,基础网络结构包括但不限于下列的部分或全部:主干网络、预训练模型、网络基本单元、网络拓扑结构。其中,主干网络与预训练模型可以直接作为网络模型使用,预训练模型是由主干网络经过一定的模型训练得到的;网络基本单元主要为网络block(网络块),网络拓扑结构为一种或多种block的组合方式,可以为环形结构、树形结构等。
候选网络模型:基于基础网络结构得到的网络模型,可以通过对基础网络结构集合中的主干网络、预训练模型等进行筛选,对基础网络结构中的主干网络、预训练模型进行网络结构调整、对基础网络结构中的网络基本单元组合,直接获取操作者选择或上传的主干网络、预训练模型等方式得到。
目标网络模型:从候选网络模型中筛选出的,若候选网络模型只有一个,则可将候选网络模型直接作为目标网络模型,若候选网络模型有多个,则可对候选网络模型进行转换、测试和训练等,从中确定一个或多个目标网络模型。
目标设备:又称部署端、部署平台、需求平台,是目标网络模型最后实际运行的环境,每个目标设备都对应一个芯片类型,不同的目标设备有不同的芯片类型;部署是指将网络模型投入使用,让训练好的网络模型在指定环境中运行的过程,本申请中,目标设备可以有一个或多个。
预设数值条件:本申请中包含第一预设数值条件与第二预设数值条件,其中,第一预设数值条件是基于精度损失大小设置的,如可以为精度损失在指定次序、精度损失最小等;第二预设数值条件是基于损失值与性能参数大小设置的,如可以为损失值与性能参数在指定次序、损失值最小与性能参数最佳等。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示,其为本申请实施例的应用场景示意图。该应用场景图中包括终端设备110,服务器120。
在本申请实施例中,终端设备110包括但不限于下列的部分或全部:手机、平板电脑、笔记本电脑、台式电脑、相机、摄像机、智能家电、车载终端等设备;终端设备上可以安装有相关的客户端,该客户端可以是软件(例如识别软件、检测软件等),也可以是网页、小程序等,服务器120则是与软件或是网页、小程序等相对应的后台服务器,或者是专门用于进行模型部署的服务器,本申请不做具体限定。服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
需要说明的是,本申请各实施例中的模型部署的方法可以由电子设备执行,如图1所示,该电子设备可以为终端设备110或者服务器120,即,该方法可以由终端设备110或者服务器120单独执行,也可以由终端设备110和服务器120共同执行。
以终端设备110和服务器120共同执行为例,例如,在人工智能场景下,现需要训练与部署测试一个能够识别图像中人物情绪的模型,具体过程为:
操作者在操作界面输入需要的模型属性信息,终端设备110将相应的模型属性信息发送至服务器120,服务器120获取到预配置的基础网络结构集合及终端设备110发送的模型属性信息后,可以获取操作者自主选取的网络,或者在基础网络结构集合中直接对主干网络、预训练模型进行筛选,或者对基础网络结构集合中的主干网络、预训练模型进行网络结构调整,或通过基础网络结构集合中的至少一个目标网络拓扑结构,对多个目标网络基本单元进行组合四种方式,获得满足模型属性信息的至少一个候选网络模型。之后,服务器120确定候选网络模型的个数,若候选网络模型只有一个,则服务器120将候选网络模型直接作为目标网络模型;若候选网络模型有多个,则服务器120基于目标设备对应的芯片类型,通过转换与测试对所有候选网络模型进行一次筛选,再根据训练规则,对剩余的候选网络模型进行二次筛选,从中确定目标网络模型。确定目标网络模型后,服务器120可以根据基于训练规则,对目标网络模型进行训练,并将训练后的目标网络模型与训练日志发送至终端设备110,操作者可以在终端设备110的操作界面查看训练日志。训练完成后,服务器120自动将训练后的目标网络模型基于操作者选择的至少一个目标设备进行转换,并将转换后的目标网络模型与转换结果发送至终端设备110,操作者可以在终端设备110的操作界面查看转换结果。最后,服务器120将转换后的目标网络模型推到目标设备进行部署测试,并将测试后的目标网络模型与测试结果发送至终端设备110,操作者可以在终端设备110的操作界面查看测试结果。
需要说明的是,上述所列举的终端设备110与服务器120共同执行的模型部署的方法只是举例说明,在本申请实施例中,任意一种基于电子设备执行各模型部署的方法都适用于本申请实施例,在此不做具体限定。
在一种可选的实施方式中,终端设备110与服务器120之间可以通过通信网络进行通信。
在一种可选的实施方式中,通信网络是有线网络或无线网络。
需要说明的是,图1所示只是举例说明,实际上终端设备和服务器的数量不受限制,在本申请实施例中不做具体限定。
此外,本申请实施例可应用于各种场景,包括但不限于下列的部分或全部:云技术、人工智能、智慧交通等场景。
下面结合上述描述的应用场景,参考附图来描述本申请示例性实施方式提供的模型部署方法,需要注意的是,上述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。
参阅图2,其为本申请实施例提供的一种模型部署方法的实施流程图,以终端设备为执行主体,该方法的具体实施流程如下S201-S203:
S201:获取模型部署指令指示的模型属性信息。
上述中,模型部署指令是由操作者在终端设备上触发的;模型属性信息用于表征待生成的目标网络模型的运行需求,包括但不限于下列的部分或全部:用于进行模型训练的训练规则(例如梯度下降法、momentum动量方法等),不同训练规则的适用性不同,需要基于目标网络模型的运行需求(例如具体应用场景)做初步选择;以及用于运行目标网络模型的目标设备的性能约束(例如算力、内存、带宽等),目标网络模型在实际运行应用中需要部署于目标设备;还包括目标网络模型需求参数(例如期望的网络推理耗时、模型大小等);其中,训练规则是根据目标网络模型的运行需求及训练方向预配置的,训练方向包括检测、分类、分割等,其中对应检测方向的训练规则包括YOLO(全称You only look once,包含YOLOv3、YOLO v5等),SSD(全称Single Shot MultiBox Detector,单激发多框探测器)等,对应分类方向的训练规则包括多类别分类算法、多标签分类算法等,对应分割方向的训练规则包括Mask RCNN(全称Mask Region-based Convolutional Neural Network,掩膜区域卷积神经网络)、SOLO(全称Segmenting Objects by Locations,按位置分割对象,包含SOLOv2)等。
以具体场景为例,假设对现需要训练一个模型,用于对图片中的车牌进行识别,最后部署于P平台,则服务器根据操作者的输入信息,获取模型属性信息。
S202:基于预配置的基础网络结构集合,获得至少一个候选网络模型。
其中,候选网络模型是基于基础网络结构集合中与模型属性信息相匹配的目标基础网络结构确定的;基础网络结构集合中每个基础网络结构是根据预设的模型功能配置的;基础网络结构集合包含至少一个基础网络结构,每个基础网络结构是根据预设的模型功能预配置的,其中,模型功能也即模型训练方向,对应模型实际应用的某个方向,主要有检测、分类、分割等;例如模型应用于对图片中的安全帽进行检测,则该模型的训练方向为检测,模型应用于对图片中的植物进行分类,则该模型的训练方向为分类等;基础网络结构包括主干网络、预训练模型、网络基本单元和网络拓扑结构,其中,网络基本单元主要为内置的网络block(网络块),block指用于构建网络的基本单元,每个block可以包含卷积层、BN(全称Batch Normalized,批量归一化)层、全连接层、池化层等网络层,例如,一个block中可以只包含一个卷积层,也可以包含一个卷积层和一个BN层,还可以包含多个卷积层和一个其他网络层等等。resnet(深度残差网络)中的残差模块即为一种block。
如图3所示,图3是本申请实施例提供的一种网络图,S31中的结构可以看成是一个block,S32、S33、S34、S35中的结构也分别可以为一个复杂的block,一个网络可以由一种或多种block组合而成,而相应的组合方式即可通过网络拓扑结构表征,网络拓扑结构可以为链形结构、环形结构、树形结构,也可以是混合型结构等等,如图4所示,为本申请实施例提供的一种网络拓扑结构示例图。
需要说明的是,图3所列举的几种block与图4所列举的几种网络拓扑结构只是简单说明,包含各种网络层的block与各种网络拓扑结构都适用于本申请实施例,在此不做具体限定。
候选网络模型的获取方式有多种,一种可选的实施方式为,终端设备可以在基础网络结构集合中,直接对主干网络、预训练模型进行筛选,筛选出符合模型属性信息的至少一个目标基础网络结构,并将每个目标基础网络结构,分别作为一个候选网络模型。
其中,基础网络结构集合中的预训练模型可对应一个控件,操作者可以通过触发该控件,选择服务器能否在预配置的预训练模型中筛选目标基础网络结构,并将此目标基础网络结构,作为候选网络模型。模型属性信息由操作者在终端设备上预先输入,用于表征待生成的目标网络模型的运行需求。
也即,终端设备会根据操作者输入的,包括目标设备的性能约束(例如算力、内存、带宽等),目标网络模型需求参数(例如期望的网络推理耗时、模型大小等)等的模型属性信息,自动筛选满足上述所有需求的主干网络、预训练模型。
预置的每一个主干网络都有其属性信息,该属性信息反映了该网络适用的训练规则,该网络在不同芯片平台上的推理耗时(帧率),该网络的参数量(模型大小)、计算量、占用内存等中的一个或多个,及该网络在公开数据集上的指标,常用的指标有:准确率、召回率、平均准确率等。
若满足上述所有需求的主干网络、预训练模型存在多个,则可以通过内置的训练任务,初步选出指标较高的网络,即指标高的模型会被优先选出。
终端设备还可以对在基础网络结构集合中筛选的,符合模型属性信息的至少一个目标基础网络结构,也即主干网络、预训练模型,进行网络结构调整,以此生成一个候选网络模型,在资源充足的情况下,可以生成多个候选网络模型。
具体地,可以通过以下方式对至少一个目标基础网络结构进行网络结构调整:
方式一:从至少一个待进行网络结构调整的目标基础网络结构中,选取至少一个目标基础网络结构,对其网络层进行裁剪,得到新的满足模型属性信息的网络,并将此新网络作为至少一个候选网络模型。
方式二:从至少一个待进行网络结构调整的目标基础网络结构中,选取至少两个目标基础网络结构进行拼接,得到新的满足模型属性信息的网络,并将此新网络作为候选网络模型。
方式三:将方式一与方式二结合,对选取的目标基础网络结构的网络层进行裁剪和拼接,得到新的满足模型属性信息的网络,并将此新网络作为候选网络模型。
此外,终端设备还可以在基础网络结构集合中,筛选符合模型属性信息的多个目标网络基本单元,和至少一个目标网络拓扑结构;其中,多个目标网络基本单元可以为相同网络基本单元,也可以不尽相同;网络基本单元主要为内置的网络block,每个block可以包含卷积层、BN(全称Batch Normalized,批量归一化)层、全连接层、池化层等网络层,而一个网络可以由一种或多种block组合而成,组合的方式即为网络拓扑结构,网络拓扑结构可以为环形结构、树形结构,也可以是混合型结构等等。
之后,终端设备基于至少一个目标网络拓扑结构,对多个目标网络基本单元进行组合,得到一个新的满足模型属性信息的主干网络,并分别将此新的主干网络,作为一个候选网络模型。同样,在资源充足的情况下,可以生成多个候选网络模型。
上述获取候选网络模型的方法也可以由服务器和终端设备共同执行完。如图5所示,为本申请实施例提供的一种网络推荐操作界面。在终端设备的网络推荐操作界面中,操作者可以输入在预配置的训练规则库中选择的训练规则、芯片平台(目标设备),前向推理耗时,网络的参数量(模型大小)、计算量、占用内存等模型属性信息,终端设备响应于针对操作界面中的网络推荐控件的触发操作,将操作者输入的模型属性信息发送至服务器,服务器经上述中所描述的筛选方式,得到至少一个符合条件的候选网络模型,将模型发送至终端设备,终端设备可以向操作者展示获取到的候选网络模型,以及每个候选网络模型对应的属性信息。该属性信息反映了该网络适用的训练规则,该网络在不同芯片平台上的推理耗时(帧率),该网络的参数量(模型大小)、计算量、占用内存等中的一个或多个,及该网络在公开数据集上的指标,常用的指标有:准确率、召回率、平均准确率等。
可选的,上述方法还可以基于一个包含网络推荐模块的系统来实施,即网络推荐模块能够通过获取到的模型属性信息向操作者推荐满足要求的主干网络和预训练模型。
除了由终端设备筛选网络模型的方法外,操作者还可以自主选择主干网络、预训练模型,如图5所示,网络推荐操作界面包含一个网络上传控件,终端设备响应于对操作界面中网络上传控件的触发操作,展示网络文件选择界面,操作者可以选择自主上传网络文件,终端设备基于操作者选择的网络文件,获取并上传候选网络模型。
可选的,操作者还可以在基础网络结构集合中,从预配置的主干网络和预训练模型中直接选择需要的网络模型。终端设备响应于对操作界面中网络选择控件的触发操作,展示基础网络结构集合中的主干网络和预训练模型,并将操作者选择的主干网络或预训练模型,作为候选网络模型。此外,网络选择控件可以是一个跳转到基础网络结构集合页面的按钮,也可以是一个下拉菜单的触发按钮等等,在此不做具体限定。
依旧以S201中的具体场景为例,假设由服务器与终端设备共同执行,操作者根据训练方向与需求,在操作界面选择训练规则R、目标设备P,前向推理耗时,网络的参数量(模型大小)、计算量、占用内存等模型属性信息,同时还可以自主选择候选网络模型或由服务器推荐至少一个候选网络模型,具体地,终端设备响应于针对操作界面中的网络推荐控件的触发操作,将操作者输入的模型属性信息发送至服务器;服务器根据模型属性信息,在基础网络结构集合中直接选取主干网络、预训练模型作为候选网络模型,或者基于基础网络结构集合中的基础网络结构生成至少一个新的主干网络,作为候选网络模型,并将候选网络模型发送至终端设备。
在得到多个候选网络模型后,可以进一步在多个候选网络模型中筛选出一个目标网络模型,并对目标网络模型进行部署。具体执行以下步骤:
S203:基于至少一个候选网络模型,确定目标网络模型,并将目标网络模型部署于目标设备。
若候选网络模型只有一个,则将候选网络模型直接作为目标网络模型。
若候选网络模型有多个,则终端设备基于目标设备对应的芯片类型,将至少一个候选网络模型进行转换与测试;基于获得的测试结果与训练规则,对至少一个候选网络模型进行训练;基于获得的训练结果,从至少一个候选网络模型中,确定目标网络模型。
具体地,终端设备将所有候选网络模型进行模型转换,并将转换后的候选网络模型推到目标设备进行耗时测试,并得到测试结果,根据测试结果筛选出符合前向推理耗时条件的候选网络模型,之后通过预先内置的训练任务对剩余的候选网络模型再次进行快速筛选,得到准确率、召回率、平均准确率等指标较好的候选网络模型,作为目标网络模型。
在终端设备筛选出目标网络模型之后,还会输出目标网络模型的参数量、计算量、占用内存及在目标设备上的耗时(帧率)、在公开数据集上训练后能达到的指标,以使终端设备可以向操作者展示获得的目标网络模型,以及目标网络模型对应的属性信息。
此外,若该目标网络模型是基于基础网络结构生成的新的网络模型,则操作者可以选择通过网络推荐操作界面中的网络入库控件,将该目标网络模型保存至基础网络结构集合。具体地,终端设备响应于对操作界面中网络入库控件的触发操作,将目标网络模型作为新的主干网络,添加至基础网络结构集合中。
上述获取并输出目标网络模型的方法也可以由服务器和终端设备共同执行完。
可选的,上述方法同样可以基于一个包含网络推荐模块的系统来实施,即网络推荐模块能够在至少一个候选网络模型中筛选出目标网络模型。
在获得目标网络模型后,终端设备可以基于训练规则,对目标网络模型进行训练,获得训练后的目标网络模型。
如图6所示,为本申请提供的一种训练部署一体化任务提交界面图,操作者可以自主选择具有参考意义的公开数据集与训练类型对目标网络模型进行训练,例如训练方向为检测时,可以使用COCO(全称Common Objects in Context)数据集训练目标网络模型。
在训练部署一体化任务提交界面中,还可以选择是否对目标网络模型进行量化训练和知识蒸馏训练(蒸馏学习)。其中,量化训练可以使目标网络模型在部署到目标设备时的精度损失最小化,针对不同的芯片平台可以使用不同的量化方式;知识蒸馏训练通过利用大模型的知识指导小模型,可以有效提高小模型的鲁棒性和泛化能力。具体地,终端设备响应于对操作界面中量化选择控件的触发操作,基于训练规则对目标网络模型进行量化训练,获得训练后的目标网络模型;以及,终端设备响应于对知识蒸馏选择控件的触发操作,对目标网络模型进行知识蒸馏训练,获得训练后的目标网络模型。
选择结束后,操作者触发任务提交控件,终端设备响应于对操作界面中的任务提交控件的触发操作,完成对目标网络模型的训练及输出训练日志。
训练结束后,终端设备输出训练结果,生成训练日志,以使终端设备可以展示针对目标网络模型的训练日志,训练日志的展示界面包括:用于展示训练过程中详细信息的基本信息区域,与用于展示训练结果的评估报告区域。
其中,训练结果包含训练过程中每次训练迭代的迭代次序、相应的损失值和性能参数,与突出显示的目标轮次对应的损失值和性能参数;目标轮次为满足第二预设数值条件的训练迭代对应的迭代次序,第二预设数值条件指损失值最小、性能参数最佳,即损失值最小、性能参数最佳的训练迭代对应的损失值和性能参数会被突出显示。
具体地,日志内容可以包含每个epoch(所有数据送入网络中完成一次前向计算及反向传播的过程,即一次训练迭代)的loss(损失),和在验证集上的mAP(全称Mean AveragePrecision,均值平均精度)、召回率、准确率等信息,以及满足第二预设数值条件的训练迭代对应的epoch、mAP、召回率、准确率等信息。
如图7所示,为本申请实施例提供的一种训练日志界面展示图,基本信息区域中包含有模型名称、任务名称、创建者、任务状态、配置包、算法网络、标注条件、训练耗时、高级设置等,可以根据具体需求展示上述信息。此外,操作者可以通过点击“算法网络”将网络内容可视化,供操作者查看,还可通过点击配置包查看训练规则,通过点击标注条件查看训练数据的标注或预览标注示例,通过点击高级设置,更改训练的迭代次数、学习率等。操作者可以根据模型性能评估报告来决定是否使用该目标网络模型,或者继续进行网络推荐。
同时,训练日志展示界面中还包含评估报告区域,图7中,评估报告区域中有服务器输出的网络模型的相关信息,包括模型大小、计算量和在目标平台上部署的耗时等。并以折线图的形式展示每次训练迭代的迭代次序、相应的损失值和性能参数,与满足第二预设数值条件的训练迭代对应的损失值和性能参数。其中,第二预设数值条件指损失值最小、性能参数最佳,即损失值最小、性能参数最佳的训练迭代对应的损失值和性能参数会重点突出显示,重点突出的方式可以为对相应信息加粗、更换颜色等,在此不做具体限定。性能参数主要有准确率、召回率等。
具体地,图7中,空心圆连接的折线图表示训练损失(损失值),实心圆连接的折线图表示性能参数中的准确率,并重点显示了损失值最小、性能参数最佳的训练迭代对应的信息,即第四次训练迭代对应的损失值为0.452,准确率为83%。此外,折线图的具体展示形式还可以为不同颜色、不同形状的连接点、不同粗细的连接线、实线虚线等中的一种或多种组合,在此不做具体限定。
需要说明的是,任何能够区分损失值、准确率等不同评估对象的折线展示形式都适用于本申请,在此不做具体限定。
训练结束后得到的,损失值最小、性能参数最佳的训练迭代对应的目标网络模型,可以作为预训练模型。操作者可以通过触发网络入库控件,将该预训练模型存入内置的基础网络结构集合,具体地,终端设备响应于对操作界面中网络入库控件的触发操作,将训练后的目标网络模型作为新的预训练模型,添加至基础网络结构集合。
可选的,操作者可以选择不对目标网络模型进行训练及评估,直接将目标网络模型存入内置的基础网络结构集合。
上述对目标网络模型进行训练的方法也可以由服务器和终端设备共同执行完。
可选的,上述方法同样可以通过一个包含网络推荐模块的系统来实施。综上,网络推荐模块的输入是训练规则、目标设备,前向推理耗时,目标网络模型的参数量(模型大小)、计算量、占用内存等,输出的是推荐的目标网络模型、目标网络模型的参数量、计算量、占用内存、在目标设备上的耗时(帧率)及在公开数据集上训练后能达到的指标等。
目标网络模型的训练结束后,因为不同的目标设备对应的芯片类型不同,框架不同,终端设备需要通过对训练后的目标网络模型进行转换,实现目标网络模型在不同框架中流转。即,终端设备可以基于目标设备对应的芯片类型,对训练后的目标网络模型进行转换,获得转换后的目标网络模型;转换后的目标网络模型可以直接部署在目标设备的设备端上使用。
其中,目标设备可以选择多个;精度损失是将目标网络模型,分别在自身和目标设备,基于相同的输入数据获得的各个网络层的输出数据进行对比得到的。
具体地,操作者选择目标网络模型需要部署的至少一个目标设备,终端设备可根据各个目标设备对应的芯片类型,将训练后的目标网络模型进行自动转换,同时,并输出相应的转换结果。转换结果用于表征目标网络模型在各个目标设备的精度损失;对于一个目标设备,精度损失是服务器将目标网络模型,分别在自身和该目标设备,基于相同的输入数据获得的各个网络层的输出数据进行对比得到的,也即,终端设备分别在自身和目标设备对训练后的目标网络模型进行推理,使用相同的随机数据作为输入,保存各个网络层的输出数据,并对每个自身和目标设备的相同网络层的输出数据进行比对,计算余弦距离,得到精度损失,生成转换结果。
相应的,上述对目标网络模型进行转换的方法也可以由服务器和终端设备共同执行完。在终端设备,操作者点击任务提交控件后,终端设备响应于对操作界面中任务提交控件的触发操作,将相应信息发送至服务器,服务器完成对目标网络模型的训练及输出训练日志后,自动将训练后的目标网络模型进行转换及输出相应的转换结果,并将转换后的目标网络模型与转换结果发送至终端设备,终端设备可以将转换结果展示在操作界面。
此外,若在计算余弦距离时,余弦距离超出正常范围,则可以对操作者给予提醒,以此便于操作者分析目标网络模型运行在目标设备上是否有精度损失,并对目标网络模型进行修正。
可选的,上述针对目标网络模型的转换方法可以基于一个包含模型转换模块的系统来实施,即模型转换模块能够基于不同的目标设备对应的芯片类型,对训练后的目标网络模型进行转换。
在目标网络模型转换完成后,终端设备可自动将目标网络模型部署于目标设备,以在目标设备,基于目标网络模型对待处理资源进行相应的资源处理。具体地,终端设备将转换后的目标网络模型及内置的部署demo(全称demonstration)推到目标设备进行部署,并测试模型效果,同时根据测试结果,进行多维度自动评估模型质量,多维度可以为不同场景(如公园中、大楼内等)、目标的不同类型(车辆、动物等)、目标在图片中所占的不同比例等,也即,终端设备可以统计目标网络模型在测试集上的总召回率和总准确率,或者按照类别维度、场景维度、目标大小维度分别统计召回率和准确率;此外,服务器还可以统计运行时长、帧率、内存占用情况等,本申请不做具体限定。
其中,demo为可执行文件,用于仿真效果推到目标设备进行部署,与训练规则一一对应。
在上述统计中,终端设备可以将在精度损失最小的平台上运行的结果作为参照,即将目标网络模型在自身运行的结果作为参照,再将目标网络模型在各个目标设备运行的结果与其比较,输出差异项,差异项包括与ground truth(数据的正确标注,参考标准,例如检测图片中的动物种类,则图片中动物种类的真实结果即为ground truth)比较IoU(全称Intersection over Union,一种表征检测准确度的标准,用于测量真实情况和模型预测结果之间的相关度)得到的误检漏检框,和参照平台结果比较得到的误检漏检框、置信度差异等。
相应的,上述对目标网络模型进行部署测试的方法也可以由服务器和终端设备共同执行完。在终端设备,操作者点击任务提交控件后,终端设备响应于对操作界面中任务提交控件的触发操作,将相应信息发送至服务器,服务器完成对目标网络模型的训练及转换后,自动将转换后的目标网络模型进行部署测试,以及通过对比目标网络模型在目标设备与参考平台的运行信息,输出相应的测试结果,并将测试后的目标网络模型与测试结果发送至终端设备,终端设备可以将测试结果展示在操作界面。
其中,参考平台为对应的精度损失满足第一预设数值条件的平台,第一预设数值条件为精度损失最小。测试结果用于描述转换后的目标网络模型,在目标设备对应的性能,包括在不同维度评估目标网络模型对应的性能参数,性能参数包括召回率、准确率等等。
依旧以S201中具体场景为例,由服务器和终端设备共同执行以下步骤,在服务器得到多个候选网络模型后,可以基于至少一个候选网络模型,确定目标网络模型,若候选网络模型只有一个,则将候选网络模型直接作为目标网络模型;若候选网络模型有多个,则服务器基于目标设备P,将至少一个候选网络模型进行相应的转换与测试,筛选出符合前向推理耗时条件的候选网络模型,再基于训练规则R对筛选出的候选网络模型进行训练,选择指标较好的候选网络模型,作为目标网络模型。
之后服务器将目标网络模型与目标网络模型的参数量、计算量、占用内存及在目标设备上的耗时(帧率)、在公开数据集上训练后能达到的指标等信息发送给终端设备,由终端设备向操作者展示网络模型的最终获取结果。
除了训练规则R、目标设备P等信息外,操作者还可以在操作界面输入训练数据、量化训练、蒸馏学习等,通过触发任务提交控件,使终端设备将相应的信息发送至服务器,服务器基于这些信息对目标网络模型进行训练,并将训练后的目标网络模型与训练日志发送至终端设备;此后,服务器还可以自动基于目标设备P对训练后的目标网络模型进行转换,并将转换后的目标网络模型与转换结果发送至终端设备;最后,服务器自动基于目标设备P对转换后的目标网络模型进行部署测试,并将测试后的目标网络模型与测试结果发送至终端设备,终端设备可以向操作者展示上述训练日志、转换结果和测试结果。
可选的,上述方法可以基于一个包含部署测试模块的系统来实施,即部署测试模块能够将转换后的目标网络模型推到各个目标设备进行部署测试,并得到测试结果。
综上,本申请描述的方法可以由一个包含网络推荐模块、模型转换模块、部署测试模块的系统实现,其中,网络推荐模块中有预配置的基础网络结构集合,同时具备自动生成新的网络模型的功能,生成的新的网络模型满足部署时的耗时要求。该模块还能够自动触发基于目标网络模型的训练并生成训练日志,训练日志可以反映训练后的目标网络模型的效果,例如损失值、准确率、在目标设备上部署的耗时等;此外,该模块还包含了量化训练机制,能够针对不同的目标设备对应的不同的芯片类型,采用不同的量化方式,使部署时精度损失达到最小。
模型转换模块可以自动将训练后的目标网络模型,基于不同的目标设备对应的芯片类型进行转换,同时输出转换结果,转换结果表征目标网络模型在自身和目标设备的精度比较,如果精度出现较大差异,不能对齐,则可以通过输出的转换结果快速定位到出现问题的具体的网络层。
部署测试模块,可以自动对转换后的目标网络模型进行部署测试,一键触发多芯片平台部署测试,输出测试结果。还可以对测试结果进行分析。
上述三个模块对应了本申请中提供的模型部署开发的三个主要步骤,如图8A所示,为本申请实施例提供的一种模型部署开发的简要流程图,其中包括模型训练、自动化模型转换、自动化部署测试;进一步的,图8B为本申请实施例提供的一种模型部署的逻辑示意图,由网络推荐模块负责在候选网络模型中确定目标网络模型,由模型转换模块完成对目标网络模型的转换,由部署测试模块完成对目标网络模型的部署测试。
基于上述具体场景的举例,如图9所示,为该应用场景下,本申请实施例提供的一种模型部署的交互时序图。
操作者在终端设备输入相应的模型属性信息、目标设备P并触发网络推荐控件,终端设备响应于对网络推荐控件的触发操作,将模型属性信息、目标设备P发送至服务器;服务器获取模型属性信息及基础网络结构集合,并基于模型属性信息直接选取主干网络、预训练模型,或生成新的主干网络,作为候选网络模型;再将候选网络模型反馈至终端设备,由终端设备呈现候选网络模型;
之后服务器获取候选网络模型个数,若候选网络模型个数为1个,则将候选模型直接作为目标网络模型,若候选网络模型个数为两个及两个以上,则对候选网络模型进行转换、测试与训练,获取目标网络模型,并将目标网络模型反馈至终端设备,由终端设备呈现目标网络模型。
操作者还可以在终端设备输入训练数据、测试数据、训练类型,例如,当模型的训练目的为对城市物体进行分类时,可以选择某城市物体数据集作为训练数据和测试数据,训练数据和测试数据中包含了城市场景中常见的物体,如路灯、汽车、建筑等,还标注有各类物体对应的标签;当模型的训练目的为对大象进行检测时,可以选择COCO作为训练数据和测试数据,训练数据和测试数据中包含带有大象的图片以及对大象的标注;当模型的训练目的为对室内场景进行语义分割时,可以选择SUN RGB-D数据集作为训练数据和测试数据,训练数据和测试数据为各种室内图像及图像中不同物体被标注的不同颜色;此外,操作者还可以选择是否使用量化训练、蒸馏学习,并触发任务提交控件,终端设备响应于对任务提交控件的触发操作,将相关信息发送至服务器;服务器基于训练规则R对目标网络模型进行训练并生成训练日志,并将训练后的目标网络模型与训练日志反馈至终端设备,由终端设备呈现训练后的目标网络模型与训练日志;之后服务器基于目标设备P对训练后的目标网络模型进行模型转换并生成转换结果,并将转换后的目标网络模型与转换结果反馈至终端设备,由终端设备呈现转换后的目标网络模型与转换结果;最后,服务器基于目标设备P对转换后的目标网络模型进行部署测试并生成测试结果,并将测试后的目标网络模型与测试结果反馈至终端设备,由终端设备呈现测试后的目标网络模型与测试结果。
基于相同的发明构思,本申请实施例还提供一种模型部署装置。如图10所示,其为模型部署装置1000的结构示意图,可以包括:
第一获取单元1001,用于获取模型部署指令指示的模型属性信息,模型属性信息用于表征待生成的目标网络模型的运行需求;
第二获取单元1002,用于基于预配置的基础网络结构集合,获得至少一个候选网络模型,候选网络模型是基于基础网络结构集合中与模型属性信息相匹配的目标基础网络结构确定的;基础网络结构集合中每个基础网络结构是根据预设的模型功能配置的;
确定单元1003,用于基于至少一个候选网络模型,确定目标网络模型,并将目标网络模型部署于目标设备,以在目标设备,基于目标网络模型对待处理资源进行相应的资源处理。
在一些可选的实施例中,第二获取单元1002具体用于:
在基础网络结构集合中,筛选符合模型属性信息的至少一个目标基础网络结构,并将每个目标基础网络结构,分别作为一个候选网络模型;和/或
在基础网络结构集合中,筛选符合模型属性信息的至少一个目标基础网络结构,并对至少一个目标基础网络结构进行网络结构调整,生成至少一个候选网络模型。
在一些可选的实施例中,基础网络结构包括主干网络与预训练模型中的至少一种;第二获取单元1002具体用于:
通过以下至少一种方式对至少一个目标基础网络结构进行网络结构调整:
从至少一个待进行网络结构调整的目标基础网络结构中,选取至少一个目标基础网络结构进行裁剪;
从至少一个待进行网络结构调整的目标基础网络结构中,选至少两个目标基础网络结构进行拼接。
在一些可选的实施例中,基础网络结构包括网络基本单元和网络拓扑结构;第二获取单元1002具体用于:
通过如下方式对至少一个目标基础网络结构进行网络结构调整:
在基础网络结构集合中,筛选符合模型属性信息的多个目标网络基本单元,和至少一个目标网络拓扑结构;
基于至少一个目标网络拓扑结构,对多个目标网络基本单元进行组合,得到至少一个新的主干网络;
分别将每个新的主干网络,作为一个候选网络模型。
在一些可选的实施例中,模型属性信息包括用于进行模型训练的训练规则;确定单元1003具体用于:
若候选网络模型只有一个,则将候选网络模型作为目标网络模型;
若候选网络模型有多个,则基于目标设备对应的芯片类型,将至少一个候选网络模型进行转换与测试;基于获得的测试结果与训练规则,对至少一个候选网络模型进行训练;基于获得的训练结果,从至少一个候选网络模型中,确定目标网络模型。
在一些可选的实施例中,模型属性信息包括用于进行模型训练的训练规则;确定单元1003具体用于:
基于训练规则,对目标网络模型进行训练,获得训练后的目标网络模型;
基于目标设备对应的芯片类型,对训练后的目标网络模型进行转换,获得转换后的目标网络模型;
将转换后的目标网络模型部署于目标设备。
在一些可选的实施例中,装置还包括:
第一响应单元1004,用于响应于对操作界面中任务提交控件的触发操作,输出并展示相应的转换结果,转换结果用于表征目标网络模型在目标设备的精度损失,以根据转换结果报告修正目标网络模型;
其中,精度损失是将目标网络模型,分别在自身和目标设备,基于相同的输入数据获得的各个网络层的输出数据进行对比得到的。
在一些可选的实施例中,在将转换后的目标网络模型部署于目标设备之后,装置还包括:
第二响应单元1005,用于响应于对操作界面中的任务提交控件的触发操作,对转换后的目标网络模型进行测试,输出并展示相应的测试结果,测试结果用于描述转换后的目标网络模型,在目标设备对应的性能。
在一些可选的实施例中,测试结果包括在不同维度评估目标网络模型对应的性能参数;第二响应单元1005具体用于:
响应于对操作界面中的任务提交控件的触发操作,对转换后的目标网络模型进行测试;
通过对比目标网络模型在目标设备与参考平台的运行信息,输出并展示相应的测试结果,参考平台为对应的精度损失满足第一预设数值条件的平台。
在一些可选的实施例中,第二获取单元1002具体用于:
响应于针对操作界面中的网络推荐控件的触发操作,获得并展示至少一个候选网络模型,候选网络模型是:基于从基础网络结构集合中筛选的,与模型属性信息相匹配的目标基础网络结构确定的。
在一些可选的实施例中,确定单元1003具体用于:
响应于对操作界面中的任务提交控件的触发操作,输出并展示针对目标网络模型的训练日志,训练日志的展示界面包括:用于展示训练过程中详细信息的基本信息区域,与用于展示训练结果的评估报告区域。
在一些可选的实施例中,训练结果包含训练过程中每次训练迭代的迭代次序、相应的损失值和性能参数,与突出显示的目标轮次对应的损失值和性能参数;其中,目标轮次为满足第二预设数值条件的训练迭代对应的迭代次序。
在一些可选的实施例中,确定单元1003具体用于:
响应于对操作界面中量化选择控件的触发操作,基于训练规则对目标网络模型进行量化训练,获得训练后的目标网络模型。
在一些可选的实施例中,确定单元1003具体用于:
响应于对知识蒸馏选择控件的触发操作,对目标网络模型进行知识蒸馏训练,获得训练后的目标网络模型。
在一些可选的实施例中,装置还包括:
第一入库单元1006,用于在确定单元基于至少一个候选网络模型,确定目标网络模型之后,响应于对操作界面中网络入库控件的触发操作,将目标网络模型作为新的主干网络,添加至基础网络结构集合。
在一些可选的实施例中,装置还包括:
第二入库单元1007,用于在确定单元基于训练规则,对目标网络模型进行训练,获得训练后的目标网络模型之后,响应于对操作界面中网络入库控件的触发操作,将训练后的目标网络模型作为新的预训练模型,添加至基础网络结构集合。
在一些可选的实施例中,装置还包括:
自选单元1008,用于响应于对操作界面中网络选择控件的触发操作,展示基础网络结构集合中的主干网络与预训练模型,将选择的主干网络或预训练模型,作为候选网络模型;或
响应于对操作界面中网络上传控件的触发操作,展示网络文件选择界面,基于选择的网络文件,获取并上传候选网络模型。
在介绍了本申请示例性实施方式的模型部署方法和装置之后,接下来,介绍根据本申请的另一示例性实施方式的电子设备。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
与上述方法实施例基于同一发明构思,本申请实施例中还提供了一种电子设备。在一种实施例中,该电子设备可以是服务器,如图1所示的服务器120。在该实施例中,电子设备的结构可以如图11所示,包括存储器1101,通讯模块1103以及一个或多个处理器1102。
存储器1101,用于存储处理器1102执行的计算机程序。存储器1101可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。
存储器1101可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器1101也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);或者存储器1101是能够用于携带或存储具有指令或数据结构形式的期望的计算机程序并能够由计算机存取的任何其他介质,但不限于此。存储器1101可以是上述存储器的组合。
处理器1102,可以包括一个或多个中央处理单元(central processing unit,CPU)或者为数字处理单元等等。处理器1102,用于调用存储器1101中存储的计算机程序时实现上述模型部署方法。
通讯模块1103用于与终端设备和其他服务器进行通信。
本申请实施例中不限定上述存储器1101、通讯模块1103和处理器1102之间的具体连接介质。本申请实施例在图11中以存储器1101和处理器1102之间通过总线1104连接,总线1104在图11中以粗线描述,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线1104可以分为地址总线、数据总线、控制总线等。为便于描述,图11中仅用一条粗线描述,但并不描述仅有一根总线或一种类型的总线。
存储器1101中存储有计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于实现本申请实施例的模型部署方法。处理器1102用于执行上述的模型部署方法,如图2所示。
在另一种实施例中,电子设备也可以是其他电子设备,如图1所示的终端设备110。在该实施例中,电子设备的结构可以如图12所示,包括:通信组件1210、存储器1220、显示单元1230、摄像头1240、传感器1250、音频电路1260、蓝牙模块1270、处理器1280等部件。
通信组件1210用于与服务器进行通信。在一些实施例中,可以包括电路无线保真(Wireless Fidelity,WiFi)模块,WiFi模块属于短距离无线传输技术,电子设备通过WiFi模块可以帮助用户收发信息。
存储器1220可用于存储软件程序及数据。处理器1280通过运行存储在存储器1220的软件程序或数据,从而执行终端设备110的各种功能以及数据处理。存储器1220可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器1220存储有使得终端设备110能运行的操作系统。本申请中存储器1220可以存储操作系统及各种应用程序,还可以存储执行本申请实施例模型部署方法的计算机程序。
显示单元1230还可用于显示由用户输入的信息或提供给用户的信息以及终端设备110的各种菜单的图形用户界面(graphical user interface,GUI)。具体地,显示单元1230可以包括设置在终端设备110正面的显示屏1232。其中,显示屏1232可以采用液晶显示器、发光二极管等形式来配置。
显示单元1230还可用于接收输入的数字或字符信息,产生与终端设备110的用户设置以及功能控制有关的信号输入,具体地,显示单元1230可以包括设置在终端设备110正面的触控屏1231,可收集用户在其上或附近的触摸操作,例如点击按钮,拖动滚动框等。
其中,触控屏1231可以覆盖在显示屏1232之上,也可以将触控屏1231与显示屏1232集成而实现终端设备110的输入和输出功能,集成后可以简称触摸显示屏。本申请中显示单元1230可以显示应用程序以及对应的操作步骤。
摄像头1240可用于捕获静态图像,用户可以将摄像头1240拍摄的图像通过应用发布。摄像头1240可以是一个,也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给处理器1280转换成数字图像信号。
终端设备还可以包括至少一种传感器1250,比如加速度传感器1251、距离传感器1252、指纹传感器1253、温度传感器1254。终端设备还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。
音频电路1260、扬声器1261、传声器1262可提供用户与终端设备110之间的音频接口。音频电路1260可将接收到的音频数据转换后的电信号,传输到扬声器1261,由扬声器1261转换为声音信号输出。终端设备110还可配置音量按钮,用于调节声音信号的音量。另一方面,传声器1262将收集的声音信号转换为电信号,由音频电路1260接收后转换为音频数据,再将音频数据输出至通信组件1210以发送给比如另一终端设备110,或者将音频数据输出至存储器1220以便进一步处理。
蓝牙模块1270用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如,终端设备可以通过蓝牙模块1270与同样具备蓝牙模块的可穿戴电子设备(例如智能手表)建立蓝牙连接,从而进行数据交互。
处理器1280是终端设备的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器1220内的软件程序,以及调用存储在存储器1220内的数据,执行终端设备的各种功能和处理数据。在一些实施例中,处理器1280可包括一个或多个处理单元;处理器1280还可以集成应用处理器和基带处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,基带处理器主要处理无线通信。可以理解的是,上述基带处理器也可以不集成到处理器1280中。本申请中处理器1280可以运行操作系统、应用程序、用户界面显示及触控响应,以及本申请实施例的模型部署方法。另外,处理器1280与显示单元1230耦接。
在一些可能的实施方式中,本申请提供的模型部署方法的各个方面还可以实现为一种程序产品的形式,其包括计算机程序,当程序产品在电子设备上运行时,计算机程序用于使电子设备执行本说明书上述描述的根据本申请各种示例性实施方式的模型部署方法中的步骤,例如,电子设备可以执行如图2中所示的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于下列的部分或全部:磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (18)

1.一种模型部署方法,其特征在于,该方法包括:
获取模型部署指令指示的模型属性信息,所述模型属性信息用于表征待生成的目标网络模型的运行需求;
基于预配置的基础网络结构集合,获得至少一个候选网络模型,所述候选网络模型是基于所述基础网络结构集合中与所述模型属性信息相匹配的目标基础网络结构确定的;所述基础网络结构集合中每个基础网络结构是根据预设的模型功能配置的;
基于至少一个所述候选网络模型,确定目标网络模型;
基于所述模型属性信息中用于进行模型训练的训练规则,对所述目标网络模型进行训练,获得训练后的目标网络模型;
基于目标设备对应的芯片类型,对所述训练后的目标网络模型进行转换,获得转换后的目标网络模型;并在响应于对操作界面中任务提交控件的触发操作后,输出并展示相应的转换结果,所述转换结果用于表征所述目标网络模型在所述目标设备的精度损失,以根据转换结果修正所述目标网络模型;其中,所述精度损失是将所述目标网络模型,分别在自身和所述目标设备,基于相同的输入数据获得的各个网络层的输出数据进行对比得到的;
将所述转换后的目标网络模型部署于所述目标设备,以在所述目标设备,基于所述目标网络模型对待处理资源进行相应的资源处理。
2.如权利要求1所述的方法,其特征在于,所述基于预配置的基础网络结构集合,获得至少一个候选网络模型,包括:
在所述基础网络结构集合中,筛选符合所述模型属性信息的至少一个目标基础网络结构,并将每个所述目标基础网络结构,分别作为一个所述候选网络模型;和/或
在所述基础网络结构集合中,筛选符合所述模型属性信息的至少一个目标基础网络结构,并对至少一个所述目标基础网络结构进行网络结构调整,生成至少一个所述候选网络模型。
3.如权利要求2所述的方法,其特征在于,所述基础网络结构包括主干网络与预训练模型中的至少一种;
通过以下至少一种方式对至少一个所述目标基础网络结构进行网络结构调整:
从至少一个待进行网络结构调整的目标基础网络结构中,选取至少一个目标基础网络结构进行裁剪;
从至少一个待进行网络结构调整的目标基础网络结构中,选至少两个目标基础网络结构进行拼接。
4.如权利要求2所述的方法,其特征在于,所述基础网络结构包括网络基本单元和网络拓扑结构;
通过如下方式对至少一个所述目标基础网络结构进行网络结构调整:
在所述基础网络结构集合中,筛选符合所述模型属性信息的多个目标网络基本单元,和至少一个目标网络拓扑结构;
基于至少一个所述目标网络拓扑结构,对所述多个目标网络基本单元进行组合,得到至少一个新的主干网络;
分别将每个所述新的主干网络,作为一个所述候选网络模型。
5.如权利要求1所述的方法,其特征在于,所述模型属性信息包括用于进行模型训练的训练规则;所述基于至少一个所述候选网络模型,确定目标网络模型,包括:
若所述候选网络模型只有一个,则将所述候选网络模型作为所述目标网络模型;
若所述候选网络模型有多个,则基于所述目标设备对应的芯片类型,将至少一个所述候选网络模型进行转换与测试;基于获得的测试结果与所述训练规则,对至少一个所述候选网络模型进行训练;基于获得的训练结果,从至少一个所述候选网络模型中,确定目标网络模型。
6.如权利要求1所述的方法,其特征在于,在所述将所述转换后的目标网络模型部署于所述目标设备之后,还包括:
响应于对操作界面中的任务提交控件的触发操作,对所述转换后的目标网络模型进行测试,输出并展示相应的测试结果,所述测试结果用于描述所述转换后的目标网络模型,在所述目标设备对应的性能。
7.如权利要求6所述的方法,其特征在于,所述测试结果包括在不同维度评估所述目标网络模型对应的性能参数;
所述响应于对操作界面中的任务提交控件的触发操作,对所述转换后的目标网络模型进行测试,输出并展示相应的测试结果,包括:
响应于对所述操作界面中的任务提交控件的触发操作,对所述转换后的目标网络模型进行测试;
通过对比所述目标网络模型在所述目标设备与参考平台的运行信息,输出并展示相应的测试结果,所述参考平台为对应的精度损失满足第一预设数值条件的平台。
8.如权利要求1~7任一项所述的方法,其特征在于,所述基于预配置的基础网络结构集合,获得至少一个候选网络模型,包括:
响应于针对操作界面中的网络推荐控件的触发操作,获得并展示至少一个所述候选网络模型,所述候选网络模型是:基于从所述基础网络结构集合中筛选的,与所述模型属性信息相匹配的目标基础网络结构确定的。
9.如权利要求1所述的方法,其特征在于,所述基于所述模型属性信息中用于进行模型训练的训练规则,对所述目标网络模型进行训练,包括:
响应于对操作界面中的任务提交控件的触发操作,输出并展示针对所述目标网络模型的训练日志,所述训练日志的展示界面包括:用于展示所述训练过程中详细信息的基本信息区域,与用于展示训练结果的评估报告区域。
10.如权利要求9所述的方法,其特征在于,所述训练结果包含所述训练过程中每次训练迭代的迭代次序、相应的损失值和性能参数,与突出显示的目标轮次对应的损失值和性能参数;其中,所述目标轮次为满足第二预设数值条件的训练迭代对应的迭代次序。
11.如权利要求1所述的方法,其特征在于,所述基于所述模型属性信息中用于进行模型训练的训练规则,对所述目标网络模型进行训练,获得训练后的目标网络模型,包括:
响应于对操作界面中量化选择控件的触发操作,基于所述训练规则对所述目标网络模型进行量化训练,获得训练后的目标网络模型。
12.如权利要求1所述的方法,其特征在于,所述基于所述模型属性信息中用于进行模型训练的训练规则,对所述目标网络模型进行训练,获得训练后的目标网络模型,包括:
响应于对知识蒸馏选择控件的触发操作,对所述目标网络模型进行知识蒸馏训练,获得训练后的目标网络模型。
13.如权利要求1~7任一项所述的方法,其特征在于,所述基于至少一个所述候选网络模型,确定目标网络模型之后,还包括:
响应于对操作界面中网络入库控件的触发操作,将所述目标网络模型作为新的主干网络,添加至所述基础网络结构集合。
14.如权利要求1所述的方法,其特征在于,所述基于所述模型属性信息中用于进行模型训练的训练规则,对所述目标网络模型进行训练,获得训练后的目标网络模型之后,还包括:
响应于对操作界面中网络入库控件的触发操作,将所述训练后的目标网络模型作为新的预训练模型,添加至所述基础网络结构集合。
15.如权利要求1~7任一项所述的方法,其特征在于,所述方法还包括:
响应于对操作界面中网络选择控件的触发操作,展示所述基础网络结构集合中的主干网络与预训练模型,将选择的主干网络或预训练模型,作为所述候选网络模型;或
响应于对操作界面中网络上传控件的触发操作,展示网络文件选择界面,基于选择的网络文件,获取并上传所述候选网络模型。
16.一种模型部署装置,其特征在于,包括:
第一获取单元,用于获取模型部署指令指示的模型属性信息,所述模型属性信息用于表征待生成的目标网络模型的运行需求;
第二获取单元,用于基于预配置的基础网络结构集合,获得至少一个候选网络模型,所述候选网络模型是基于所述基础网络结构集合中与所述模型属性信息相匹配的目标基础网络结构确定的;所述基础网络结构集合中每个基础网络结构是根据预设的模型功能配置的;
确定单元,用于基于至少一个所述候选网络模型,确定目标网络模型;基于所述模型属性信息中用于进行模型训练的训练规则,对所述目标网络模型进行训练,获得训练后的目标网络模型;基于目标设备对应的芯片类型,对所述训练后的目标网络模型进行转换,获得转换后的目标网络模型;并在响应于对操作界面中任务提交控件的触发操作后,输出并展示相应的转换结果,所述转换结果用于表征所述目标网络模型在所述目标设备的精度损失,以根据转换结果修正所述目标网络模型;其中,所述精度损失是将所述目标网络模型,分别在自身和所述目标设备,基于相同的输入数据获得的各个网络层的输出数据进行对比得到的;将所述转换后的目标网络模型部署于所述目标设备,以在所述目标设备,基于所述目标网络模型对待处理资源进行相应的资源处理。
17.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~15中任一所述方法的步骤。
18.一种计算机可读存储介质,其特征在于,包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行权利要求1~15中任一所述方法的步骤。
CN202210960935.9A 2022-08-11 2022-08-11 一种模型部署方法、装置、电子设备和存储介质 Active CN115049057B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210960935.9A CN115049057B (zh) 2022-08-11 2022-08-11 一种模型部署方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210960935.9A CN115049057B (zh) 2022-08-11 2022-08-11 一种模型部署方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN115049057A CN115049057A (zh) 2022-09-13
CN115049057B true CN115049057B (zh) 2022-11-18

Family

ID=83166327

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210960935.9A Active CN115049057B (zh) 2022-08-11 2022-08-11 一种模型部署方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN115049057B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115632939B (zh) * 2022-12-23 2023-03-31 浩鲸云计算科技股份有限公司 一种实现算力网络多目标达成的自动选网选路的方法
CN118632263A (zh) * 2023-03-07 2024-09-10 华为技术有限公司 通信方法及相关装置
CN117035065A (zh) * 2023-10-10 2023-11-10 浙江大华技术股份有限公司 模型评估的方法及相关装置
CN117521737B (zh) * 2024-01-04 2024-04-19 浙江大华技术股份有限公司 网络模型的转换方法、装置、终端及计算机可读存储介质
CN118135377B (zh) * 2024-05-08 2024-07-16 海信集团控股股份有限公司 一种模型部署方法、端侧设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114861910A (zh) * 2022-05-19 2022-08-05 北京百度网讯科技有限公司 神经网络模型的压缩方法及装置、设备和介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9116767B1 (en) * 2014-06-06 2015-08-25 International Business Machines Corporation Deployment pattern monitoring
CN111797969A (zh) * 2020-06-23 2020-10-20 浙江大华技术股份有限公司 神经网络模型的转换方法及相关装置
CN114610272A (zh) * 2020-11-25 2022-06-10 共达地创新技术(深圳)有限公司 Ai模型生成方法、电子设备及存储介质
CN112733810A (zh) * 2021-02-23 2021-04-30 成都市威虎科技有限公司 一种特征码转换网络模型的构建方法
CN114612774A (zh) * 2022-02-25 2022-06-10 共达地创新技术(深圳)有限公司 目标检测及其模型构建方法、电子设备和存储介质
CN114781635B (zh) * 2022-06-22 2022-09-27 国汽智控(北京)科技有限公司 模型部署方法、装置、设备和介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114861910A (zh) * 2022-05-19 2022-08-05 北京百度网讯科技有限公司 神经网络模型的压缩方法及装置、设备和介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CNN Accelerator with Minimal On-Chip Memory Based on Hierarchical Array;HyunWook Son,and etc;《2021 18th International SoC Design Conference (ISOCC)》;20211125;第1-2页 *
面向目标检测的SSD网络轻量化设计研究;冯烨等;《信号处理》;20200525(第05期);第756-762页 *

Also Published As

Publication number Publication date
CN115049057A (zh) 2022-09-13

Similar Documents

Publication Publication Date Title
CN115049057B (zh) 一种模型部署方法、装置、电子设备和存储介质
CN112232293B (zh) 图像处理模型训练、图像处理方法及相关设备
US20190370685A1 (en) Method and apparatus for generating model, method and apparatus for recognizing information
CN109145828B (zh) 用于生成视频类别检测模型的方法和装置
KR20200145827A (ko) 얼굴 특징 추출 모델 학습 방법, 얼굴 특징 추출 방법, 장치, 디바이스 및 저장 매체
CN112183166B (zh) 确定训练样本的方法、装置和电子设备
US20210027081A1 (en) Method and device for liveness detection, and storage medium
US10958828B2 (en) Advising image acquisition based on existing training sets
CN110046706B (zh) 模型生成方法、装置及服务器
US11392855B1 (en) GUI for configuring machine-learning services
CN112069414A (zh) 推荐模型训练方法、装置、计算机设备及存储介质
US11182697B1 (en) GUI for interacting with analytics provided by machine-learning services
CN113868497A (zh) 一种数据分类方法、装置和存储介质
US20230048386A1 (en) Method for detecting defect and method for training model
CN110210457A (zh) 人脸检测方法、装置、设备及计算机可读存储介质
CN114065340B (zh) 基于机器学习的施工场地安全监测方法及系统、存储介质
CN112306829B (zh) 性能信息的确定方法及装置、存储介质、终端
CN110427998A (zh) 模型训练、目标检测方法及装置、电子设备、存储介质
CN113379045B (zh) 数据增强方法和装置
CN116363538A (zh) 一种基于无人机的桥梁检测方法及系统
CN117011616A (zh) 一种图像内容审核方法、装置、存储介质和电子设备
CN114282587A (zh) 数据处理方法、装置、计算机设备及存储介质
CN115100689B (zh) 一种对象检测方法、装置、电子设备和存储介质
CN115112661A (zh) 一种缺陷检测方法、装置、计算机设备和存储介质
CN112101387A (zh) 显著性元素识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant