CN108564524A

CN108564524A - 一种视觉图像的卷积计算优化方法

Info

Publication number: CN108564524A
Application number: CN201810375397.0A
Authority: CN
Inventors: 张锐; 王海涛; 黄明飞
Original assignee: Open Intelligent Machine (shanghai) Co Ltd
Current assignee: Open Intelligent Machine (shanghai) Co Ltd
Priority date: 2018-04-24
Filing date: 2018-04-24
Publication date: 2018-09-21

Abstract

本发明涉及一种图像处理技术，尤其涉及一种视觉图像的卷积计算优化方法，包括：步骤S1，将第一存储单元中的所有图像数据转化为矩阵形式并分成多个批次，并将卷积运算所需的过滤器模板数据加载至第一存储区内；步骤S2，将首个批次的图像数据写入单个第二存储区中；步骤S3，对新写入的图像数据和过滤器模板数据进行卷积计算，同时通过直接存储访问控制器将下一批次的图像数据写入其他第二存储区中；步骤S4，循环执行步骤S3直至完成所有批次的图像数据的卷积计算；在不增加额外的存储空间的前提下，能够充分利用图像数据的传输和运算的时间，具有较高的图像的卷积运算的效率。

Description

一种视觉图像的卷积计算优化方法

技术领域

本发明涉及一种图像处理技术，尤其涉及一种视觉图像的卷积计算优化方法。

背景技术

近些年随着AI(Artificial Intelligence人工智能，简称AI)技术的发展，越来越多的机器视觉算法被应用到实际应用场景中。

在实际应用过程中，由于每次卷积计算读取的数据不连续，导致图像数据的传输和卷积计算是分别进行的，卷积计算需要等待图像数据的传输完成后才能进行，以及图像数据的传输需要卷积计算完成后才能进行，从而大大增加了卷积计算所需时间。

发明内容

针对上述问题，本发明提出了一种视觉图像的卷积计算优化方法，应用于视觉机器人中的处理单元；

其中，所述处理单元分别连接一第一存储单元和一第二存储单元，所述第二存储单元的存取速率大于所述第一存储单元；

所述处理单元还通过一直接存储访问控制器与所述第二存储单元连接；

所述视觉机器人采集的图像数据预存储在所述第一存储单元中；

所述第二存储单元中包括一第一存储区和预设数量的第二存储区；

所述卷积计算优化方法包括：

步骤S1，将所述第一存储单元中的所有所述图像数据转化为矩阵形式并分成多个批次，并将卷积运算所需的过滤器模板数据加载至所述第一存储区内；

步骤S2，将首个批次的所述图像数据写入单个所述第二存储区中；

步骤S3，对新写入的所述图像数据和所述过滤器模板数据进行卷积计算，同时通过所述直接存储访问控制器将下一批次的所述图像数据写入其他所述第二存储区中；

步骤S4，循环执行所述步骤S3直至完成所有批次的所述图像数据的卷积计算。

上述的卷积计算优化方法，其中，所述图像数据的批次数量大于所述预设数量；

所述步骤S3中，于相应的所述第二存储区中存在所述图像数据时，采用新写入的所述图像数据覆盖已存在的所述图像数据。

上述的卷积计算优化方法，其中，所述预设数量等于2。

上述的卷积计算优化方法，其中，采用双倍速率随机存储器形成所述第一存储单元。

上述的卷积计算优化方法，其中，每个所述第二存储区的容量相同；

每个批次的所述图像数据的大小相同。

上述的卷积计算优化方法，其中，每个批次的所述图像数据的大小为通过应的所述第二存储区的容量除以单个图像的尺寸得到。

上述的卷积计算优化方法，其中，所述过滤器模板数据为矩阵形式的；

所述步骤S4中，将所述图像数据和所述过滤器模板数据进行卷积计算，具体包括：

将所述图像数据的每一列与作为卷积核的所述过滤器模板数据的每一行依次进行乘法运算，得到对应的矩阵结果。

有益效果：本发明提出的一种视觉图像的卷积计算优化方法，在不增加额外的存储空间的前提下，能够充分利用图像数据的传输和运算的时间，具有较高的图像的卷积运算的效率。

附图说明

图1为本发明一实施例中视觉图像的卷积计算优化方法的步骤流程图；

图2为本发明一实施例中第二存储单元的存储区的划分示意图；

图3为本发明一实施例中卷积计算的示意图。

具体实施方式

下面结合附图和实施例对本发明进行进一步说明。

在一个较佳的实施例中，如图1和图2所示，提出了一种视觉图像的卷积计算优化方法，可以应用于视觉机器人中的处理单元；

其中，处理单元分别连接一第一存储单元和一第二存储单元，第二存储单元的存取速率大于第一存储单元；

处理单元还通过一直接存储访问控制器与第二存储单元连接；

视觉机器人采集的图像数据预存储在第一存储单元中；

第二存储单元中包括一第一存储区R和预设数量的第二存储区L；

卷积计算优化方法可以包括：

步骤S1，将第一存储单元中的所有图像数据转化为矩阵形式并分成多个批次，并将卷积运算所需的过滤器模板数据加载至第一存储区R内；

步骤S2，将首个批次的图像数据写入单个第二存储区L中；

步骤S3，对新写入的图像数据和过滤器模板数据进行卷积计算，同时通过直接存储访问控制器将下一批次的图像数据写入其他第二存储区L中；

步骤S4，循环执行步骤S3直至完成所有批次的图像数据的卷积计算。

上述技术方案中，由于能够利用不同的第二存储区L循环进行图像数据的传输，同时对不在传输转态的第二存储区L内的图像数据进行卷积计算，从而使得图像数据的传输和卷积计算几乎同时进行，能够大幅度提高图像数据的处理的效率；处理单元可以是嵌入式向量处理单元；步骤S1中，将第一存储单元中的所有图像数据转化为矩阵形式后可以存储为一个数据库，且优选地，向该数据库输入数据时可以采用直接数据，不需要采用特定的输入规则，以简化操作流程。

在一个较佳的实施例中，图像数据的批次数量大于预设数量；

步骤S3中，于相应的第二存储区L中存在图像数据时，采用新写入的图像数据覆盖已存在的图像数据。

上述实施例中，优选地，预设数量等于2，即第二存储区L的数量为2个，这两个存储区轮流交叉进行图像数据的存储和卷积计算。

在一个较佳的实施例中，可以采用双倍速率随机存储器形成第一存储单元。

在一个较佳的实施例中，每个第二存储区L的容量可以是相同的；

每个批次的图像数据的大小可以是相同的，从而使得每一次传输的图像数据的大小是固定的。

在一个较佳的实施例中，每个批次的图像数据的大小为通过应的第二存储区L的容量除以单个图像的尺寸得到，以保证每次最大程度地传输尽量多的图像数据。

如图3所示，在一个较佳的实施例中，过滤器模板数据为矩阵形式的；

步骤S4中，将图像数据和过滤器模板数据进行卷积计算，具体包括：

将图像数据的每一列与作为卷积核的过滤器模板数据的每一行依次进行乘法运算，得到对应的矩阵结果。

综上所述，本发明提出的一种视觉图像的卷积计算优化方法，可以应用于视觉机器人中的处理单元；其中，处理单元分别连接一第一存储单元和一第二存储单元，第二存储单元的存取速率大于第一存储单元；处理单元还通过一直接存储访问控制器与第二存储单元连接；视觉机器人采集的图像数据预存储在第一存储单元中；第二存储单元中包括一第一存储区和预设数量的第二存储区；卷积计算优化方法可以包括：步骤S1，将第一存储单元中的所有图像数据转化为矩阵形式并分成多个批次，并将卷积运算所需的过滤器模板数据加载至第一存储区内；步骤S2，将首个批次的图像数据写入单个第二存储区中；步骤S3，对新写入的图像数据和过滤器模板数据进行卷积计算，同时通过直接存储访问控制器将下一批次的图像数据写入其他第二存储区中；步骤S4，循环执行步骤S3直至完成所有批次的图像数据的卷积计算；在不增加额外的存储空间的前提下，能够充分利用图像数据的传输和运算的时间，具有较高的图像的卷积运算的效率。

通过说明和附图，给出了具体实施方式的特定结构的典型实施例，基于本发明精神，还可作其他的转换。尽管上述发明提出了现有的较佳实施例，然而，这些内容并不作为局限。

对于本领域的技术人员而言，阅读上述说明后，各种变化和修正无疑将显而易见。因此，所附的权利要求书应看作是涵盖本发明的真实意图和范围的全部变化和修正。在权利要求书范围内任何和所有等价的范围与内容，都应认为仍属本发明的意图和范围内。

Claims

1.一种视觉图像的卷积计算优化方法，应用于视觉机器人中的处理单元；

其特征在于，所述处理单元分别连接一第一存储单元和一第二存储单元，所述第二存储单元的存取速率大于所述第一存储单元；

所述卷积计算优化方法包括：

2.根据权利要求1所述的卷积计算优化方法，其特征在于，所述图像数据的批次数量大于所述预设数量；

3.根据权利要求1所述的卷积计算优化方法，其特征在于，所述预设数量等于2。

4.根据权利要求1所述的卷积计算优化方法，其特征在于，采用双倍速率随机存储器形成所述第一存储单元。

5.根据权利要求1所述的卷积计算优化方法，其特征在于，每个所述第二存储区的容量相同；

每个批次的所述图像数据的大小相同。

6.根据权利要求1所述的卷积计算优化方法，其特征在于，每个批次的所述图像数据的大小为通过应的所述第二存储区的容量除以单个图像的尺寸得到。

7.根据权利要求1所述的卷积计算优化方法，其特征在于，所述过滤器模板数据为矩阵形式的；