CN113111995A

CN113111995A - 一种缩短模型推理和模型后处理运行时间的方法

Info

Publication number: CN113111995A
Application number: CN202010020706.XA
Authority: CN
Inventors: 张东; 于晓静
Original assignee: Beijing Ingenic Semiconductor Co Ltd
Current assignee: Beijing Ingenic Semiconductor Co Ltd
Priority date: 2020-01-09
Filing date: 2020-01-09
Publication date: 2021-07-13

Abstract

本发明提供一种缩短模型推理和模型后处理运行时间的方法，所述方法包括以下步骤：S1，在卷积神经网络模型推理之后，设置N个缓存区，其中，N为大于等于2的正整数；S2，所述模型推理处理完一帧后，同时读取N个缓存区的写标志位，如果读到所述写标志位为1，则将数据写入对应的该缓存区中，并将读标志位置为1；S3，数据存入缓存区后，模型后处理部分读取缓存区的读标志位，如果读取到的缓存区读标志位为1，则将处理对应的该缓存区的数据，处理完后将该缓存区的读标志位置为0，写标志位置为1；S4，重复上述步骤S2‑S3，缩短模型推理和模型后处理部分运行时间。

Description

一种缩短模型推理和模型后处理运行时间的方法

技术领域

本发明涉及卷积神经网络加速技术领域，特别涉及一种缩短模型推理和模型后处理运行时间的方法。

背景技术

近年来，随着科技的飞速发展，大数据时代已经到来。卷积神经网络(CNN)作为一种用于进行图像处理的、包含卷积计算且具有深度结构的前馈神经网络，其被广泛用于图像分类、图像识别等。深度学习以深度神经网络(DNN)作为模型，在许多人工智能的关键领域取得了十分显著的成果，如图像识别、增强学习、语义分析等。卷积神经网络(CNN)作为一种典型的DNN结构，能有效提取出图像的隐层特征，并对图像进行准确分类，在近几年的图像识别和检测领域得到了广泛的应用。

其中，为本领域技术人员熟悉的技术术语包括：

卷积神经网络(Convolutional Neural Networks,CNN)：是一类包含卷积计算且具有深度结构的前馈神经网络。

检测模型：根据目标任务定位图像中的目标对象的位置。

推理：在深度学习中，推理是指将一个预先训练好的神经网络模型部署到实际业务场景中，如图像分类、物体检测、在线翻译等。由于推理直接面向用户，因此推理性能至关重要，尤其对于企业级产品而言更是如此。

卷积神经网络推理和模型后处理流水线式运行：对于一帧图像先运行模型推理部分，然后再运行模型后处理部分。

但是，在现有技术中由于模型运行和模型后处理是按顺序运行的，必然会存在一个等待的情况，这对于采用硬件加速后，模型推理和模型后处理时间相当时，会延长处理时间，从而大大降低模型的整体的运行效率。

发明内容

为了解决上述问题，特别是模型推理和模型后处理之间产生的冗余时间的问题，本发明的目的在于：缩短模型推理和模型后处理运行时间，通过并行运行，利用重叠时间，充分提高检测模型的整体效率。

具体地，本发明提供一种缩短模型推理和模型后处理运行时间的方法，所述方法包括以下步骤：

S1，在卷积神经网络模型推理之后，设置N个缓存区，其中，N为大于等于2的正整数；

S2，所述模型推理处理完一帧后，同时读取N个缓存区的写标志位，如果读到所述写标志位为1，则将数据写入对应的该缓存区中，并将读标志位置为1；

S3，数据存入缓存区后，模型后处理部分读取缓存区的读标志位，如果读取到的缓存区读标志位为1，则将处理对应的该缓存区的数据，处理完后将该缓存区的读标志位置为0，写标志位置为1；

S4，重复上述步骤S2-S3，缩短模型推理和模型后处理部分运行时间。

所述步骤S2进一步包括：如果所读取缓存区的写标志位均为0，则等待；如果所读取缓存区的写标志位有一个为1，则将数据写入对应的该缓存区中，并将读标志位置为1。

所述步骤S3中模型后处理部分读取缓存区的读标志位是同时读取。

由此，本申请的优势在于：对于模型推理和模型后处理采用设置多个Buffer缓存的策略，通过利用缓冲区的先后处理数据的时间差，从而让模型推理和模型后处理部分可以同步运行，而减少等待时间，从而缩短了模型推理和模型后处理运行时间。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。

图1是本发明方法的示意流程图。

图2是本发明所应用方法的系统的示意图。

具体实施方式

为了能够更清楚地理解本发明的技术内容及优点，现结合附图对本发明进行进一步的详细说明。

如图1所示，本发明涉及一种缩短模型推理和模型后处理运行时间的方法，所述方法包括以下步骤：

所述N＝2，3，4，5，6，并且分别对应相应个数的缓存区。

优选N＝2，分别对应为第一缓存区和第二缓存区。

所述的步骤S3进一步包括：如果读取到的缓存区的读标志位为0，则该缓存区等待；如果读取到的缓存区的读标志位均为0，则重新读取缓存区的读标志位，直至读取到有缓存区的读标志位为1。

所述的模型推理和模型处理部分可以同步进行，而不需要等待上一级的结果。

所述步骤S1中设置的缓存区是针对模型推理结果数据进行存储。

如图2所示，根据本申请的方法，可以对应以下的系统，对于模型推理结果，设置多个缓存Buffer，优选为2个，模型推理处理完一帧后，会同时读取Buff1和Buff2的写标志位，如果标志位为1则将数据写入相应的Buffer中,并将读标志为置为1。模型后处理部分可以同时读取Buff1和Buff2的读标志位，如果标志位为1则将处理相应Buffer的数据，处理完后将该Buffer的读标志为置为0，写标志为置为1。这样模型推理和模型处理部分就缩短了运行时间，而不需要等待上一级的结果，从而提高系统的整体效率。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种缩短模型推理和模型后处理运行时间的方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的一种缩短模型推理和模型后处理运行时间的方法，其特征在于，所述N＝2，3，4，5，6，并且分别对应相应个数的缓存区。

3.根据权利要求2所述的一种缩短模型推理和模型后处理运行时间的方法，其特征在于，优选N＝2，分别对应为第一缓存区和第二缓存区。

4.根据权利要求2所述的一种缩短模型推理和模型后处理运行时间的方法，其特征在于，所述步骤S2进一步包括：如果所读取缓存区的写标志位均为0，则等待；如果所读取缓存区的写标志位有一个为1，则将数据写入对应的该缓存区中，并将读标志位置为1。

5.根据权利要求1所述的一种缩短模型推理和模型后处理运行时间的方法，其特征在于，所述步骤S3中模型后处理部分读取缓存区的读标志位是同时读取。

6.根据权利要求1所述的一种缩短模型推理和模型后处理运行时间的方法，其特征在于，所述的步骤S3进一步包括：如果读取到的缓存区的读标志位为0，则该缓存区等待；如果读取到的缓存区的读标志位均为0，则重新读取缓存区的读标志位，直至读取到有缓存区的读标志位为1。

7.根据权利要求1所述的一种缩短模型推理和模型后处理运行时间的方法，其特征在于，所述的模型推理和模型处理部分可以同步进行，而不需要等待上一级的结果。

8.根据权利要求1所述的一种缩短模型推理和模型后处理运行时间的方法，其特征在于，所述步骤S1中设置的缓存区是针对模型推理结果数据进行存储。