WO2022246705A1

WO2022246705A1 - 一种深度学习模型测试的方法、设备及计算机存储介质

Info

Publication number: WO2022246705A1
Application number: PCT/CN2021/096132
Authority: WO
Inventors: 胡鹏
Original assignee: 京东方科技集团股份有限公司
Priority date: 2021-05-26
Filing date: 2021-05-26
Publication date: 2022-12-01
Also published as: CN115701302A

Abstract

本公开公开了一种深度学习模型测试的方法、设备及计算机存储介质，用于提供一种自动化的对深度学习模型进行加速、测试的流程。该方法包括：获取待部署的深度学习模型；响应于用户指定的加速指令，根据与所述加速指令对应的加速方法，对所述深度学习模型进行加速，以提高所述深度学习模型的推理速度；确定所述加速完成后，获取与所述深度学习模型对应的测试样本；利用所述测试样本对所述深度学习模型进行测试。

Description

一种深度学习模型测试的方法、设备及计算机存储介质

技术领域

本公开涉及自动化测试技术领域，特别涉及一种深度学习模型测试的方法、设备及计算机存储介质。

背景技术

目前深度学习算法在各个领域应用广泛，对于目前面临的在不同硬件平台上有效地部署深度学习模型而言，由于深度学习模型的大小和计算成本的爆炸性增长，给实际部署过程带来了不同程度的难点，目前在将深度学习模型部署在边缘设备之前，需要人工进行推理加速和编译测试，人力成本较高，效率低下。

因此，在不同的硬件资源(如片上存储器大小和算术单元的数量等)，如何对不同的深度学习模型进行自动化加速和测试，以能够高效地将深度学习模型部署在边缘设备上，是目前亟需解决的技术问题。

发明内容

第一方面，本公开实施例提供的一种深度学习模型测试的方法，应用于边缘设备，包括：

获取待部署的深度学习模型；

获取用户指定的加速指令，根据与所述加速指令对应的加速方法，对所述深度学习模型进行加速，以提高所述深度学习模型的推理速度；

完成所述加速后，获取与所述深度学习模型对应的测试样本；

利用所述测试样本对所述深度学习模型进行测试。

在一些实施例中，所述对所述深度学习模型进行加速之前，还包括：

若与所述加速指令对应的加速方法包括多种，则根据当前测试所述深度学习模型所使用的所述边缘设备的系统类型和所述边缘设备的硬件性能，从所述多种加速方法中选择一种满足预设性能指标的加速方法。

在一些实施例中，所述利用所述测试样本对所述深度学习模型进行测试之前，还包括：

根据当前测试所述深度学习模型所使用的所述边缘设备的系统类型，确定编译器；

利用所述编译器对所述深度学习模型对应的算法代码进行编译，打包成库。

在一些实施例中，通过如下方式确定打包的所述库的类型：

若所述编译器为gcc、g++以及交叉编译器中的一种，则确定打包的所述库的类型为so库；

若所述编译器为Windows编译器，则确定打包的所述库的类型为dll库。

在一些实施例中，通过如下一种或多种方式确定编译器：

若当前测试使用Linux系统，则确定所述编译器为gcc、g++以及交叉编译器中的一种；

若当前测试使用ARM-Linux系统，则确定所述编译器为gcc、g++以及交叉编译器中的一种；

若当前测试使用Android系统，则确定所述编译器为gcc、g++以及交叉编译器中的一种；

若当前测试使用Windows系统，则确定编译器为Windows编译器。

在一些实施例中，所述利用所述编译器对所述深度学习模型对应的算法代码进行编译，打包成库之后，还包括：

将至少一个预设功能库封装到所述库中，所述预设功能库用于实现鉴权功能、加密功能以及网络功能中的一种或多种。

在一些实施例中，所述利用所述测试样本对所述深度学习模型进行测试之后，还包括：

根据测试得到的测试数据生成测试报告。

在一些实施例中，所述加速方法包括如下一种或多种：

移动神经网络MNN；

推理框架TNN；

神经网络推理引擎Tengine-Lite。

第二方面，本公开实施例提供的一种深度学习模型测试的设备，包括处理器和存储器，所述存储器用于存储所述处理器可执行的程序，所述处理器用于读取所述存储器中的程序并执行如下步骤：

获取待部署的深度学习模型；

利用所述测试样本对所述深度学习模型进行测试。

在一些实施例中，所述对所述深度学习模型进行加速之前，所述处理器还被配置为执行：

在一些实施例中，所述利用所述测试样本对所述深度学习模型进行测试之前，所述处理器还被配置为执行：

在一些实施例中，所述处理器具体被配置为通过如下方式确定打包的所述库的类型：

在一些实施例中，所述处理器具体被配置为执行通过如下一种或多种方式确定编译器：

若当前测试使用Windows系统，则确定编译器为Windows编译器。

在一些实施例中，所述利用所述编译器对所述深度学习模型对应的算法代码进行编译，打包成库之后，所述处理器还被配置为执行：

在一些实施例中，所述利用所述测试样本对所述深度学习模型进行测试之后，所述处理器还被配置为执行：

根据测试得到的测试数据生成测试报告。

在一些实施例中，所述加速方法包括如下一种或多种：

移动神经网络MNN；

推理框架TNN；

神经网络推理引擎Tengine-Lite。

第三方面，本公开实施例还提供一种深度学习模型测试的装置，包括：

获取模型单元，用于获取待部署的深度学习模型；

加速模型单元，用于获取用户指定的加速指令，根据与所述加速指令对应的加速方法，对所述深度学习模型进行加速，以提高所述深度学习模型的推理速度；

获取样本单元，用于完成所述加速后，获取与所述深度学习模型对应的测试样本；

测试模型单元，用于利用所述测试样本对所述深度学习模型进行测试。

在一些实施例中，所述对所述深度学习模型进行加速之前，所述加速模型单元具体还用于：

在一些实施例中，所述利用所述测试样本对所述深度学习模型进行测试之前，还包括编译单元具体用于：

在一些实施例中，所述编译单元用于通过如下方式确定打包的所述库的类型：

在一些实施例中，所述编译单元用于通过如下一种或多种方式确定编译器：

若当前测试使用Windows系统，则确定编译器为Windows编译器。

在一些实施例中，所述利用所述编译器对所述深度学习模型对应的算法代码进行编译，打包成库之后，所述编译单元还用于：

在一些实施例中，所述利用所述测试样本对所述深度学习模型进行测试之后，所述测试模型单元还用于：

根据测试得到的测试数据生成测试报告。

在一些实施例中，所述加速方法包括如下一种或多种：

移动神经网络MNN；

推理框架TNN；

神经网络推理引擎Tengine-Lite。

第四方面，本公开实施例还提供计算机存储介质，其上存储有计算机程序，该程序被处理器执行时用于实现上述第一方面所述方法的步骤。

本公开的这些方面或其他方面在以下的实施例的描述中会更加简明易懂。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的一种深度学习模型测试的方法实施流程图；

图2为本公开实施例提供的一种自动化测试的实施流程图；

图3A为本公开实施例提供的一种开启鉴权功能的配置示意图；

图3B为本公开实施例提供的一种开启鉴权功能的配置示意图；

图3C为本公开实施例提供的一种开启鉴权功能的配置示意图；

图4为本公开实施例提供的一种自动化测试的实施流程图；

图5为本公开实施例提供的一种完整的自动化测试实施流程图；

图6为本公开实施例提供的一种深度学习模型测试的设备示意图；

图7为本公开实施例提供的一种深度学习模型测试的装置示意图。

具体实施方式

为了使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开作进一步地详细描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本公开保护的范围。

本公开实施例描述的应用场景是为了更加清楚的说明本公开实施例的技术方案，并不构成对于本公开实施例提供的技术方案的限定，本领域普通技术人员可知，随着新应用场景的出现，本公开实施例提供的技术方案对于类似的技术问题，同样适用。其中，在本公开的描述中，除非另有说明，“多个”的含义是两个或两个以上。

随着深度学习模型的广泛应用，在将深度学习模型部署在边缘设备之前，需要人工对深度学习模型进行加速、测试，耗费大量的人力，成本较高。本实施例提供了一种自动化测试深度学习模型的方法，提供一种应用于线上或线下的测试方法，提高测试效率，节省了人力成本。需要说明的是，由于深度学习模型计算复杂，无法直接部署在边缘设备上，因此需要对深度学习模型进行加速，降低参数冗余，减少存储占用，降低计算复杂度。

在一些实施例中，本实施例提供的一种深度学习模型测试的方法，本实施例中的方法应用于线下设备如边缘设备，其中所述边缘设备包括但不限于计算工作站、PC终端、芯片板卡等，边缘设备的操作系统包括但不限于windows、linux、android等。

本公开实施例提供的深度学习模型测试的方法，核心思想是在边缘设备建立一个自动化的流程，从获取深度学习模型，对深度学习模型进行加速，直至加速之后获取测试样本进行测试的整个流程中，实现一键加速测试的方法，提高了深度学习模型的部署效率。由于深度学习模型的算法复杂，在对深度学习模型进行测试的时候需要在配置较大数据处理能力的处理器的设备上进行测试，一般可以是云端服务器进行深度学习模型的测试，并且目前对深度学习模型进行测试时都只是针对深度学习算法本身的测试流程，而即使该测试流程完成之后，由于深度学习模型运行过程复杂，若直接将测试完成的深度学习模型部署在边缘设备，由于边缘设备的数据处理能力无法支撑深度学习模型复杂的算法运行过程，导致在边缘设备上无法运行深度学习模型，可见，现有对深度学习模型的测试不仅只能基于云端服务器进行测试，测试完成后仍无法部署在边缘设备上。而本公开提供一种可通过边缘设备实现深度学习模型自动化测试到的方法，利用自动化对获取的深度学习模型进行加速后，降低了深度学习模型的计算量，从而可在边缘设备实现对深度学习模型的自动化测试流程，加快了深度学习模型在边缘设备上的部署，能够有效缩短部署周期。由于本实施例中的测试流程适用于各类深度学习模型，是一种具有标准化、自动化的深度学习模型测试流程，能够满足各类深度学习模型的测试需求，并利用边缘设备进行测试，能够提高将深度学习模型部署在边缘设备的效率。

如图1所示，本实施例提供的测试方法的实施流程如下所示：

步骤100、获取待部署的深度学习模型；

本实施例可以针对多种深度学习模型进行自动化加速和测试，在一些实施例中，所述待部署的深度学习模型可以存储于模型仓库，其中所述模型仓库用于存储各类深度学习模型，实施中，可以将不同的深度学习模型存储到对应的路径地址，存储的形式包括但不限于深度学习模型的代码、镜像代码等。

在一些实施例中，可以从本地服务器或云端服务器获取待部署的深度学习模型。

步骤101、获取用户指定的加速指令，根据与所述加速指令对应的加速方法，对所述深度学习模型进行加速，以提高所述深度学习模型的推理速度；

本实施例中获取的加速指令和加速方法的对应关系，包括但不限于如下关系中的部分或全部：一对一、一对多、多对多。

其中，一对一，是指获取一种加速指令，该加速指令对应一种加速方法，实施中按照与该加速指令对应的一种加速方法对所述深度学习模型进行加速；一对多，是指获取一种加速指令，该加速指令对应多种加速方法，实施中按照与该加速指令对应的多种加速方法同时或分阶段对所述深度学习模型进行加速；多对多，是指获取多种加速指令，每种加速指令对应一种加速方法，实施中，按照与每种加速指令对应的加速方法同时或分阶段对所述深度学习模型进行加速。

在一些实施例中，若用户指定的加速指令对应一种加速方法，则按用户指定的加速方法，对深度学习模型进行加速。

在一些实施例中，若用户指定的加速指令对应的加速方法包括多种，则根据当前测试该深度学习模型所使用的边缘设备的系统类型和边缘设备的硬件性能，从所述多种加速方法中选择一种满足预设性能指标的加速方法，在一些示例中，预设性能指标包括但不限于性能最优和/或运行速度最快。实施中，系统类型包括但不限于：windows、linux以及android；硬件性能可依据边缘设备的处理器CPU性能、存储器性能、内存大小等确定。实施中，选择一种满足预设性能指标的加速方法，具体包括如下一种或多种实施方式：

方式1、边缘设备对深度学习模型进行加速的过程中，选择一种在单位时间内运行该深度学习模型的代码条数最多的加速方法，即选择一种运行速度最快的加速方法；

方式2、边缘设备对深度学习模型进行加速的过程中，选择一种边缘设备的CPU占用率最少的加速方法，即选择一种性能最优的加速方法；

方式3、边缘设备对深度学习模型进行加速的过程中，选择一种在单位时间内运行该深度学习模型的代码条数最多且边缘设备的CPU占用率最少的加速方法，即选择一种运行速度最快且CPU占用率最少的加速方法；

方式4、边缘设备对深度学习模型进行加速的过程中，利用与性能和运行速度分别对应的权重，对加速过程中得到的CPU占用率和运行速度进行加权求和，选择一种求和值最小的加速方法。

在一些实施例中，本实施例提供的加速方法包括但不限于如下一种或多种：

移动神经网络(Mobile Neural Network，MNN)；推理框架TNN；神经网络推理引擎Tengine-Lite。

步骤102、完成所述加速后，获取与所述深度学习模型对应的测试样本；

实施中，所述测试样本可以存储于数据仓库，所述数据仓库用于存储与深度学习模型对应的测试样本。

步骤103、利用所述测试样本对所述深度学习模型进行测试。

本实施例提供的自动化的测试流程，为了便于将深度学习模型部署在边缘设备上，完成了对深度学习模型从获取到加速、测试的完整的自动化流程，提高了部署前期准备工作的效率，节省了人力成本。并且本实施例提供的自动化测试流程由于对深度学习模型进行了加速处理，有效降低了深度学习模型的计算量，提高了处理速度，尤其针对本地端的边缘设备仍能保证利用本实施例中的测试流程实现线下测试。

在一些实施例中，本实施例中涉及的多种加速方式，包括但不限于MNN、TNN和Tengine-Lite，在三种加速方式中，用户可以指定选择一种速度最小且CPU占用率最少的加速方式。下面对本实施例中涉及到的三种加速方式进行如下说明：

方式1、MNN；

其中，MNN是一个轻量级的深度神经网络推理引擎，核心解决深度神经网络模型在端侧推理运行问题，涵盖深度神经网络模型的优化、转换和推理。MNN可以分为转换器Converter和解释器Interpreter两部分。

Converter由前端Frontends和图形优化Graph Optimize构成。Frontends负责支持不同的训练框架，MNN当前支持Tensorflow(Lite)、Caffe和ONNX；Graph Optimize通过算子融合、算子替代、布局调整等方式优化图。

Interpreter由引擎Engine和后端Backends构成。Engine负责模型的加载、计算图的调度；Backends包含各计算设备下的内存分配。在Engine和Backends中，MNN应用了多种优化方案，包括在卷积和反卷积中应用维诺格拉德Winograd算法、在矩阵乘法中应用矩阵乘法Strassen算法、低精度计算、手写汇编、多线程优化、内存复用、异构计算等。

方式2、TNN；

其中，TNN是一种移动端高性能、轻量级推理框架，同时拥有跨平台、高性能、模型压缩、代码裁剪等众多突出优势。TNN包括：模型转换，低精度优化，算子编译优化，计算引擎，硬件架构等，其中，模型转换用于模型解析与转换，低精度优化用于FP16低精度转换、INT8后训练量化，算子编译优化包括算子tuning，布局优化，计算图优化等；计算引擎包括高性能kernel实现和高效能内存调度；硬件架构包括ARM，GPU，NPU等。

方式3、Tengine-Lite。

其中，Tengine-Lite实现了深度学习神经网络模型在嵌入式设备上快速、高效部署。Tengine-Lite的特性为：只依赖C库，具有独立模型加载过程，与Tengine(Web服务器项目)保持统一的应用接口，支持CMSIS-NN和HCL-M算子库，支持AI加速器与异构计算，开放支持Caffe/TensorFlow/MXNet模型，提供模型量化训练工具。TNN的优势是具有轻量级，易部署，解耦模型部署与模型运行代码，Cortex-A/M统一生态，MCU应用轻松移植到AP，支持算子定制开发，同时提升性能，适应嵌入式AI平台，给开发者更多自由选择等。

在一些实施例中，所述利用所述测试样本对所述深度学习模型进行测试之前，本实施例还提供一种编译方法，具体执行步骤如下：

步骤1)根据当前测试深度学习模型所使用的边缘设备的系统类型，确定编译器；

在一些实施例中，根据不同的系统有如下一种或多种确定编译器的方法：

11)若当前测试使用Linux系统，则确定所述编译器为gcc、g++以及交叉编译器中的一种；

12)若当前测试使用ARM-Linux系统，则确定所述编译器为GNU编译器套件(GNU Compiler Collection，gcc)、g++(GUN C++Compiler)以及交叉编译器中的一种；

13)若当前测试使用Android系统，则确定所述编译器为gcc、g++以及交叉编译器中的一种；

14)若当前测试使用Windows系统，则确定编译器为Windows编译器。

步骤2)利用所述编译器对所述深度学习模型对应的算法代码进行编译，打包成库。

在一些实施例中，对于Linux、ARM-Linux以及Android系统，使用跨平台的安装(编译)工具CMAKE，选择编译器gcc、g++以及交叉编译器中的一种，将算法代码编译打包成so库形式；对于Windows系统，通过设置宏开关的方式控制编译器的执行，指定是否需要执行Windows编译器，将算法代码编译打包成dll库形式。即本实施例提供一种或多种库的形式，可通过如下方式确定打包的所述库的类型：

本实施例提供一种自动化对深度学习模型进行加速、编译、测试的流程，实现了一键编译，一键打包，加快了深度学习模型的部署。

在一些实施例中，本实施例整个自动化流程中，包括但不限于如下一种或多种中间件：

1、模型仓库，用于存储待部署的深度学习模型；

2、代码仓库，用于存储待部署的深度学习模型对应的算法代码；

3、数据仓库，用于存储待部署的深度学习模型对应的测试样本及测试数据、测试报告等。

4、编译平台的docker镜像，用于实现对深度学习模型的编译、打包。

在一些实施例中，如图2所示，本公开实施例提供的一种自动化测试的流程，具体实施步骤如下所示：

步骤200、获取待部署的深度学习模型，并将所述深度学习模型存储至模型仓库；

步骤201、获取用户指定的加速指令，从加速库中选取与所述加速指令对应的一种运算速度最小且内存占用最少的加速方法；

步骤202、利用选取的加速方法对所述深度学习模型进行加速；

步骤203、确定加速完成；

步骤204、根据当前测试使用的系统类型，确定编译器；

步骤205、利用所述编译器对所述深度学习模型对应的算法代码进行编译，打包成库；

步骤206、从数据库中获取与所述深度学习模型对应的测试样本；

步骤207、利用所述测试样本对所述深度学习模型进行测试。

在一些实施例中，为了将深度学习模型部署在边缘设备后能够具备一些功能以供用户使用，还可以在编译之后，利用编译宏将一些功能库封装到深度学习模型的算法代码中，以使将深度学习模型部署在边缘设备后，能够使用该功能库的功能。具体实施方式如下所示：

将至少一个预设功能库封装到所述深度学习模型，所述预设功能库用于实现鉴权功能、加密功能以及网络功能中的一种或多种。其中，各个功能库可实现的功能进行如下说明：

1、鉴权功能；

实施中，采用授权激活的方式，基于设备(包括边缘设备或云端设备)的硬件指纹(通过指纹工具读取)，具有设备唯一性，若每次申请license试用有效期为自申请日期后3个月，正式购买后可申请永久有效。则以Linux平台为例，开启鉴权功能需要进行如图3A、图3B、图3C所示的配置。按图3A配置后，响应于申请license功能按键的点击指令，则显示图3C所示界面，在该界面响应于运行平台的选择指令以及下载按钮的点击指令，则可以下载license。

2、加密功能；

实施中，采用高级加密标准(Advanced Encryption Standard，AES)加密的方式，保护算法模型和网络数据传输安全。

3、网络功能。

实施中，采用http post请求方式，将数据以Json报文的形式加密传输，因此网络功能需要和加密功能同时开启。

在一些实施例中，本公开实施例还提供一种自动化测试的流程，并将用户指定的功能库封装到深度学习模型编译打包的库中，实现对所述深度学习模型的鉴权功能、加密功能以及网络功能等，如图4所示，该流程的具体实施方式如下所示：

步骤400、获取待部署的深度学习模型，并将所述深度学习模型存储至模型仓库；

步骤401、获取用户指定的加速指令，从加速库中选取与所述加速指令对应的一种运算速度最小且CPU占用率最少的加速方法；

步骤402、利用选取的加速方法对所述深度学习模型进行加速；

步骤403、确定加速完成；

步骤404、根据当前测试使用的系统类型，确定编译器；

步骤405、利用所述编译器对所述深度学习模型对应的算法代码进行编译，打包成库；

步骤406、将鉴权功能库、加密功能库以及网络功能库中的一种或多种封装到所述打包的库中；

步骤407、从数据库中获取与所述深度学习模型对应的测试样本；

步骤408、利用所述测试样本对所述深度学习模型进行测试。

在一些实施例中，本实施例可通过如下一种或多种设备对所述深度学习模型进行测试：服务器设备；云端设备；边缘设备。

在一些实施例中，本实施例可通过如下一种或多种设备对所述深度学习模型进行加速：服务器设备；云端设备；边缘设备。

在一些实施例中，本实施例可通过如下一种或多种设备对所述深度学习模型进行编译：服务器设备；云端设备；边缘设备。

在一些实施例中，所述利用所述测试样本对所述深度学习模型进行测试之后，还包括：根据测试得到的测试数据生成测试报告，以方便技术人员查看，依据测试报告中的内容判断该深度学习模型是否可以部署在边缘设备上。

在一些实施例中，本实施例可基于Gitlab runner功能，将模型仓库、代码仓库、数据仓库进行关联，实现本实施例中对深度学习模型的自动化加速、编译以及测试的流程，使得整个流程实现标准化，自动化，模块化，大幅度缩短算法的开发周期。

在一些实施例中，如图5所示，本实施例还提供一种完整的自动化测试流程，应用于边缘设备，该流程的具体实施步骤如下所示：

步骤500、获取待部署的深度学习模型；

其中，可以通云服务器或本地服务器获取待部署的深度学习模型，对此本实施例不作过多限定。

步骤501、将所述深度学习模型存储至模型仓库；

其中，所述模型仓库为所述边缘设备中的模型存储分区，用于存储深度学习模型。

步骤502、获取用户指定的加速指令，从加速库中选取与所述加速指令对应的一种运算速度最小且内存占用最少的加速方法；

实施中，可以通过命令行(代码)的方式，实现自动下拉加速方法对应的加速镜像docker，利用所述加速镜像中的加速方法对应的代码实现对深度学习模型的加速。

其中，所述加速库中存储有多种加速方法，所述加速库为所述边缘设备中的加速存储分区。

步骤503、利用选取的加速方法对所述深度学习模型进行加速，确定加速完成；

步骤504、根据当前测试使用的系统类型，确定编译器；

实施中，可以根据业务需求或系统类型，确定编译器。

步骤505、利用所述编译器对所述深度学习模型对应的算法代码进行编译，打包成库；

步骤506、将鉴权功能库、加密功能库以及网络功能库中的一种或多种封装到所述打包的库中；

步骤507、从数据库中获取与所述深度学习模型对应的测试样本；

实施中，自动在数据库下拉测试样本。

步骤508、利用所述测试样本对所述深度学习模型进行测试。

步骤509、根据测试得到的测试数据生成测试报告。

在一些实施例中，基于相同的发明构思，本公开实施例还提供了一种深度学习模型测试的设备，由于该设备即是本公开实施例中的方法中的设备，并且该设备解决问题的原理与该方法相似，因此该设备的实施可以参见方法的实施，重复之处不再赘述。

如图6所示，该设备包括处理器600和存储器601，所述存储器用于存储所述处理器可执行的程序，所述处理器用于读取所述存储器中的程序并执行如下步骤：

获取待部署的深度学习模型；

利用所述测试样本对所述深度学习模型进行测试。

在一些实施例中，所述处理器具体被配置为执行通过如下方式确定打包的所述库的类型：

若当前测试使用Windows系统，则确定编译器为Windows编译器。

根据测试得到的测试数据生成测试报告。

在一些实施例中，所述加速方法包括如下一种或多种：

移动神经网络MNN；

推理框架TNN；

神经网络推理引擎Tengine-Lite。

在一些实施例中，基于相同的发明构思，本公开实施例还提供了一种深度学习模型测试的装置，由于该装置即是本公开实施例中的方法中的装置，并且该装置解决问题的原理与该方法相似，因此该装置的实施可以参见方法的实施，重复之处不再赘述。

如图7所示，该装置包括：

获取模型单元700，用于获取待部署的深度学习模型；

加速模型单元701，用于获取用户指定的加速指令，根据与所述加速指令对应的加速方法，对所述深度学习模型进行加速，以提高所述深度学习模型的推理速度；

获取样本单元702，用于完成所述加速后，获取与所述深度学习模型对应的测试样本；

测试模型单元703，用于利用所述测试样本对所述深度学习模型进行测试。

若当前测试使用Windows系统，则确定编译器为Windows编译器。

根据测试得到的测试数据生成测试报告。

在一些实施例中，所述加速方法包括如下一种或多种：

移动神经网络MNN；

推理框架TNN；

神经网络推理引擎Tengine-Lite。

在一些实施例中，基于相同的发明构思，本公开实施例还提供了一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现如下步骤：

获取待部署的深度学习模型；

利用所述测试样本对所述深度学习模型进行测试。

本领域内的技术人员应明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本公开的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本公开范围的所有变更和修改。

显然，本领域的技术人员可以对本公开实施例进行各种改动和变型而不脱离本公开实施例的精神和范围。这样，倘若本公开实施例的这些修改和变型属于本公开权利要求及其等同技术的范围之内，则本公开也意图包含这些改动和变型在内。

Claims

一种深度学习模型测试的方法，其中，应用于边缘设备，该方法包括：

获取待部署的深度学习模型；

获取用户指定的加速指令，根据与所述加速指令对应的加速方法，对所述深度学习模型进行加速，以提高所述深度学习模型的推理速度；

完成所述加速后，获取与所述深度学习模型对应的测试样本；

利用所述测试样本对所述深度学习模型进行测试。
根据权利要求1所述的方法，其中，所述对所述深度学习模型进行加速之前，还包括：

若与所述加速指令对应的加速方法包括多种，则根据当前测试所述深度学习模型所使用的所述边缘设备的系统类型和所述边缘设备的硬件性能，从所述多种加速方法中选择一种满足预设性能指标的加速方法。
根据权利要求1所述的方法，其中，所述利用所述测试样本对所述深度学习模型进行测试之前，还包括：

根据当前测试所述深度学习模型所使用的所述边缘设备的系统类型，确定编译器；

利用所述编译器对所述深度学习模型对应的算法代码进行编译，打包成库。
根据权利要求3所述的方法，其中，通过如下方式确定打包的所述库的类型：

若所述编译器为gcc、g++以及交叉编译器中的一种，则确定打包的所述库的类型为so库；

若所述编译器为Windows编译器，则确定打包的所述库的类型为dll库。
根据权利要求3所述的方法，其中，通过如下一种或多种方式确定编译器：

若当前测试使用Linux系统，则确定所述编译器为gcc、g++以及交叉编译器中的一种；

若当前测试使用ARM-Linux系统，则确定所述编译器为gcc、g++以及交叉编译器中的一种；

若当前测试使用Android系统，则确定所述编译器为gcc、g++以及交叉编译器中的一种；

若当前测试使用Windows系统，则确定编译器为Windows编译器。
根据权利要求3所述的方法，其中，所述利用所述编译器对所述深度学习模型对应的算法代码进行编译，打包成库之后，还包括：

将至少一个预设功能库封装到所述库中，所述预设功能库用于实现鉴权功能、加密功能以及网络功能中的一种或多种。
根据权利要求1～6任一所述的方法，其中，所述利用所述测试样本对所述深度学习模型进行测试之后，还包括：

根据测试得到的测试数据生成测试报告。
根据权利要求1～6任一所述的方法，其中，所述加速方法包括如下一种或多种：

移动神经网络MNN；

推理框架TNN；

神经网络推理引擎Tengine-Lite。
一种深度学习模型测试的设备，其中，该设备包括处理器和存储器，所述存储器用于存储所述处理器可执行的程序，所述处理器用于读取所述存储器中的程序并执行权利要求1～8任一所述方法的步骤。
一种计算机存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现如权利要求1～8任一所述方法的步骤。