CN111275162A

CN111275162A - 用于通过神经网络处理数据的方法和设备

Info

Publication number: CN111275162A
Application number: CN201911229922.9A
Authority: CN
Inventors: P·德马雅; L·福里奥特
Original assignee: STMicroelectronics Rousset SAS
Current assignee: STMicroelectronics Rousset SAS
Priority date: 2018-12-05
Filing date: 2019-12-04
Publication date: 2020-06-12
Anticipated expiration: 2039-12-04
Also published as: EP3663989A1; CN111275162B; US20200184331A1; US11645519B2; FR3089664A1

Abstract

本公开的各实施例涉及用于通过神经网络处理数据的方法和设备。一种方法，可以被用于通过卷积神经网络处理初始数据集合，该卷积神经网络包括跟随有池化层的卷积层。初始集沿着正交的第一方向和第二方向而被存储在初始存储器中。方法包括由卷积层使用第一滑动窗口，沿着第一方向，执行对初始数据集合的第一过滤。第一窗口的每次滑动产生第一数据集合。方法还包括由池化层使用第二滑动窗口，沿着第二方向，执行对第一数据集合的第二过滤。

Description

用于通过神经网络处理数据的方法和设备

相关申请的交叉引用

本申请要求于2018年12月05日提交的法国专利申请号 1872330的优先权，该申请通过引用并入本文。

技术领域

实施例涉及用于通过神经网络处理数据的方法和设备。

背景技术

大量使用神经网络来解决各种统计问题，尤其是数据分类问题。

在通常受监督的自动学习阶段之后，也就是说，在已经分类的基准数据库上，神经网络“学习”并且自身变得有能力来将相同的分类应用于未知数据。

卷积神经网络(或CNN)是神经网络的类型，其中神经元之间的连接模式受到动物视觉皮层的启发。卷积神经网络允许有效识别图像或视频中的物体或人物。

卷积神经网络通常包含相继地处理信息的层的四种类型：

卷积层，该卷积层例如依次地处理图像的块；

非线性层，该非线性层使得可以改善结果的相关性；

池化层，该池化层使得可以将多个神经元组合为单个神经元；

完全连接层(或密集层)，该完全连接层将层的所有神经元链接到之前层的所有神经元。

每个层将数据作为输入，并在由该层处理之后将输出数据(“特征”)作为输出递送。

卷积层通常对应于之前层的输出和该层的权重之间的标量积的集合。卷积层通常构成卷积神经网络的第一层。

作为其含义在神经网络领域中为本领域技术人员所公知的术语，“权重”意指可以被配置为获取良好输出数据的神经元的参数。

卷积层的目的是标记在作为输入接收的图像中特定数据集合的存在。相应地，卷积过滤被执行。原理是滑动表示要被检测的数据的窗口，并且是计算该窗口与所扫描的图像的每个部分之间的卷积积。

过滤窗口通过术语“卷积核”被本领域技术人员公知，并且处于矩阵的形式，例如3×3权重的核。

针对每个卷积积，获得指示特定数据在图像上的位置的输出数据。

池化层通常被放置在两个卷积层之间。池化层接收卷积层的输出数据作为输入，对卷积层应用“池化”操作，其包括在保留其重要特性的同时减小数据的大小。这使得减少网络中参数和计算的数目成为可能。因此，网络的效率得以提高。

最常见的形式是利用处于矩阵形式(例如2×2矩阵)的过滤窗口进行池化的层。

完全连接层构成了卷积或非卷积神经网络的最后的层。它这使得对神经网络的输入数据进行分类成为可能。

神经网络的通常架构堆叠了几对卷积层和非线性层，并且然后添加池化层并且重复这种方案，直到获取足够小尺寸的输出数据为止，并且然后以一个或多个完全连接层结束。

如今，神经网络变得更加复杂，并且需要大量的计算功率。

每秒指令是衡量系统(例如，微处理器)性能的单位。神经网络的配置越复杂，由系统每秒执行的指令的数目减少的越多。

发明内容

本发明的实施方式和实施例的模式涉及深度学习，特别是深度神经网络，并且更具体地涉及计算单元(例如，微处理器)的计算负载的减少，该计算单元通过卷积神经网络处理初始数据集合。

本发明的实施例可以减少例如处理由卷积神经网络接收或创建的数据的微处理器的计算负载。

根据一个方面，提出了一种用于减少计算单元(例如，微处理器)的计算负载的方法，该计算单元通过卷积神经网络处理初始数据集合。初始集合沿着正交的第一方向和第二方向而被存储在初始存储器中。该网络包括至少一个卷积层，该卷积层跟随有至少一个池化层。处理包括：由至少一个卷积层使用第一滑动窗口，沿着第一方向，对初始数据集合进行第一过滤，第一窗口的每次滑动产生第一数据集合，以及由至少一个池化层使用第二滑动窗口，沿着第二方向，对第一数据集合进行第二过滤。

这两种过滤的组合有助于减少计算单元的计算负载。

“初始存储器”意指例如易失性存储器，例如RAM存储器(意指“随机存取存储器”)。

这里，第一过滤窗口是执行卷积过滤的窗口。第一过滤窗口是卷积层的特性。

第二过滤窗口使得可以对由第一过滤窗口获取的输出数据进行“池化”操作。第二过滤窗口是池化层的特性。根据实施方式的一种模式，第二滑动窗口具有沿着第一方向计数的维度N，第一过滤包括：第一滑动窗口沿着第一方向的N-1次滑动，以及N个第一数据集合在第一临时存储器中的第一存储。

“第一临时存储器”意指例如缓冲存储器(通常由术语“缓冲器”指代)。

第一过滤窗口的每次滑动使得可以获取第一输出数据集合。每个第一集合被存储在第一临时存储器的行中，第一临时存储器包括 N行，N表示第二滑动窗口的高度。

根据实施方式的一种模式，初始数据集合根据多个行和多个列，以矩阵方式被存储，一连串的行沿着第一方向(例如，竖直方向)延伸，并且一连串的列沿着第二方向(例如，水平方向)延伸，每个单独的行沿着第二方向延伸，并且每个单独的列沿着第一方向延伸。

根据实施方式的一种模式，第一滑动窗口沿着第一方向逐步幅滑动，并且在每个步幅处遍历对应的行。步幅可以是任意的。因此，第一滑动窗口可以逐行滑动或者可以跳过行。

根据实施方式的一种模式，第二过滤包括第二滑动窗口在第一临时存储器上沿着第二方向的滑动，该第一临时存储器存储N个第一数据集合，每次滑动产生第二数据集合，第二过滤包括M个第二数据集合在第二临时存储器中的第二存储。

“第二临时存储器”意指例如缓冲存储器(通常由术语“缓冲器”指代)。

换句话说，第二滑动窗口在包括N个第一数据集合的第一临时存储器上的每次滑动产生第二数据集合。

每个第二数据集合表示池化层的输出数据。

根据实施方式的一种模式，第一存储包括由在第一滑动窗口的每次滑动时产生的第一数据集合来循环填充第一临时存储器。

最旧的第一数据集合被最新的第一数据集合代替。

根据实施方式的一种模式，在第一临时存储器的多个循环填充之后执行第二过滤。

例如，可以在第一滑动窗口的两次连续滑动之后执行第二过滤，所述第一滑动窗口刚刚产生两个新的第一数据集合。

根据实施方式的一种模式，第一过滤和第二过滤彼此跟随，直到处理初始集合的所有数据。

根据实施方式的一种模式，神经网络包括在至少一个卷积层和至少一个池化层之间的至少一个非线性层。

根据实施方式的一种模式，神经网络由以浮点或定点实施的参数限定。

“浮点”意指由符号、尾数和指数表示的实数。

“定点”意指在该点之后拥有固定数目的位的数字。

“参数”意指，例如，神经网络的权重和限定网络的每个的数据。

根据另一方面，提出了一种设备，设备包括：初始存储器，旨在沿着第一正交方向和第二正交方向存储初始数据集合；以及第一存储器，旨在存储限定卷积神经网络的参数，卷积神经网络被配置为处理初始数据集合，网络包括跟随有至少一个池化层的至少一个卷积层；以及计算单元(例如，微处理器)，被配置为执行神经网络的各种层的操作，至少一个卷积层被配置为使用第一滑动窗口，沿着第一方向，执行对初始数据集合的第一过滤，以便在每次滑动时产生第一数据集合，并且至少一个池化层被配置为使用第二滑动窗口，沿着第二方向，执行对第一数据集合的第二过滤。

根据一个实施例，第二滑动窗口具有沿着第一方向计数的维度 N，并且其中设备包括处理器，该处理器被配置为将第一滑动窗口的滑动限制为沿着第一方向的N-1次滑动，设备还包括第一临时存储器，第一临时存储器被配置为存储N个第一数据集合。

根据一个实施例，初始数据集合根据多个行和多个列以矩阵方式而被存储，一连串的行沿着第一方向延伸，并且一连串的列沿着第二方向延伸，每个单独的行沿着第二方向延伸，并且每个单独的列沿着第一方向延伸。

根据一个实施例，处理器被配置为沿着第一方向逐步幅滑动第一滑动窗口，并且在每个步幅处使第一滑动窗口遍历对应的行。

根据一个实施例，处理器被配置为：在存储N个第一数据集合的第一临时存储器上，沿着第二方向滑动第二滑动窗口，以便在每次滑动时产生第二数据集合，设备还包括第二临时存储器，第二临时存储器被配置为存储M个第二数据集合。

根据一个实施例，处理器被配置为利用在第一滑动窗口的滑动期间产生的第一数据集合来循环填充第一临时存储器。

根据一个实施例，处理器被配置为在第一存储器已经执行了多个循环填充之后，执行第二过滤。

根据一个实施例，处理器被配置为相继执行第一过滤和第二过滤，直到处理了初始集的所有数据。

根据一个实施例，神经网络包括在至少一个卷积层和至少一个池化层之间的至少一个非线性层。

根据一个实施例，神经网络的参数以浮点或固定精度实施。

还提出了一种包括该设备的微控制器。

附图说明

通过阅读对实施方式和实施例的完全非限制性模式的详细描述以及附图，本发明的其他优点和特性将变得清楚，在附图中：

图1示意性地图示了本发明的一个实施例，

图2示意性地图示了本发明的实施方式的一种模式和实施例，

图3示意性地图示了本发明的实施方式的一种模式和实施例，

图4A示意性地图示了本发明的实施方式的一种模式和实施例，

图4B示意性地图示了本发明的实施方式的一种模式和实施例，以及

图4C示意性地图示了本发明的实施方式的一种模式和实施例。

具体实施方式

在图1中，附图标记MC指定电子对象，例如，微控制器、代码生成器或可以包含硬件或嵌入式软件架构的任何其他对象。

对象MC包括设备MO，设备MO例如是包括初始存储器MV 的模块，初始存储器MV例如是被配置为存储初始数据集合DI的 RAM(意指“随机存取存储器”)易失性存储器。

设备MO还包括非易失性存储器MNV，非易失性存储器MNV 例如是ROM(意指“只读存储器”)存储器，其旨在存储限定卷积神经网络RN的参数。

“参数”意指神经网络的权重和限定神经网络每个层的数据。

参数可以以定点或浮点实施。

“浮点”意指由符号、尾数和指数表示的实数。

“定点”意指在该点之后具有固定数目的位的数字。

这种配置使得可以以特定的方式处理存储在初始存储器MV 中的数据DI并递送输出数据。

相应地，设备MO包括计算单元UC(例如，微处理器)，其被配置为执行由神经网络RN的每层限定的操作。

因此，计算单元UC被耦合到非易失性存储器MNV，以便提取神经网络RN的每层的参数。计算单元UC还被耦合到易失性存储器MV，以便提取将对其执行处理的初始数据集合DI。

设备MO包括第一临时存储器MEM1和第二临时存储器 MEM2。

“临时”意指缓冲器存储器(通常由术语“缓冲器”指代)。

第一临时存储器MEM1和第二临时存储器MEM2被耦合到计算单元UC。

第一临时存储器MEM1和第二临时存储器MEM2被配置为存储由计算单元UC递送的数据。

设备MO包括处理器MT，处理器MT耦合到计算单元UC并且被配置为控制要针对每个层执行的操作的数目，并且因此控制由计算单元UC递送的数据的存储。

处理器可以例如由微处理器内的软件模块和/或由特定的逻辑电路实施。

图2示意性地图示了由神经网络RN的层对初始数据集合DI 的处理的各个步骤。

神经网络RN包括跟随有至少一个池化层CMC的至少一个卷积层CV。

卷积层CV使得可以标记在步骤V1中接收的初始数据集合DI 中的一组特定数据的存在。因此，在步骤V2中，卷积层使用图4A、图4B和图4C中图示的第一滑动窗口F1执行卷积过滤。

第一滑动窗口F1使得可以计算窗口与初始数据集合DI的每个部分之间的卷积积。

初始数据集合DI作为具有行和列的矩阵出现，一连串的行沿着第一方向并且因此竖直地延伸，并且一连串的列沿着第二方向 (即水平地)延伸。

第一滑动窗口F1沿着第一方向并且因此竖直地滑动，同时在每次滑动时，遍历初始数据集合DI的行。在步骤V3每次滑动中产生第一数据集合D1。

“滑动”在这里意指第一滑动窗口F1遍历初始数据集合DI 的每行。

每个第一数据集合D1被存储在第一临时存储器MEM1中。

神经网络可以包括非线性层CNL，其使得可以改善结果的相关性。在步骤V4中，将第一数据集合D1作为输入，并且在步骤 V5中产生中间数据集合D11。

中间数据集合D11可以被放置在中间临时存储器中。

非线性层CNL是可选的，第一数据集合D1可以被直接分发到池化层CMC。

因此，在步骤V6中，池化层CMC接收第一数据集合D1，对该第一数据集合D1应用“池化”操作，这包括减小数据集合D1 的尺寸，同时保留其重要特性。

相应地，池化层CMC使用图4A、图4B和图4C中图示的第二滑动窗口F2。

在步骤V7中，第二滑动窗口F2沿着第二方向滑动，并且产生第一数据集合D2。

每个第二数据集合D2被存储在第二临时存储器MEM2中。

图3示意性地图示了在处理器MT中实施的算法。

该算法允许处理器MT控制要针对每个层执行的操作的数目，并且因此控制由计算单元UC递送的数据的存储。

当处理器MT在步骤S1中检测到卷积层CV的存在时，处理器MT在步骤S2中将变量i初始化为0，并且将变量N1也初始化为0。

变量i表示索引，该索引遍历作为卷积层的输出而生成的行的列表。

变量N1表示存储在第一临时存储器MEM1中的第一集合D1 的数目。

在步骤S2中，第一临时存储器MEM1和第二临时存储器 MEM2为空。

在步骤S3中，第一滑动窗口F1沿着第一方向并且因此竖直地滑动，同时在每次滑动时，遍历初始数据集合DI的行。每次滑动产生第一数据集合D1。在步骤S4中，可以将第一数据集合D1分发给非线性层CNL，该非线性层CNL产生中间数据集合D11。该步骤S4是可选的。

在步骤S5中，由于第一数据集合D1刚刚被存储在临时存储器MEM1中，因此变量N1的值增加1。

在步骤S6中，第一比较在变量N1和第三变量N之间被执行，该第三变量N表示第二滑动窗口F2的维度，并且表示第一临时存储器MEM1可以容纳的第一数据集合D1的最大数目。

如果变量N1的值等于值N，则这意味着第一临时存储器 MEM1包括N个第一数据集合D1。因此，第一临时存储器MEM1 不能再容纳更多的第一数据集合。

如果变量N1的值小于值N，则这意味着第一临时存储器 MEM1可以存储更多的第一数据集合D1。

鉴于在该示例中，仅存储了一个第一数据集合D1，变量N1 的值小于值N，并且因此转到步骤S7，其中变量i的值增加1。

在步骤S8中，第二比较在变量i的值和变量Max之间被执行，变量Max表示作为卷积层的输出而生成的行的最大数目。

如果变量i的值大于变量Max的值，则这意味着所生成的所有行已经被遍历。如果有任何行剩余，则在步骤S9中处理器MT将该行传递给下一个卷积层CV。

在相反的情况下，重复步骤S3、S4和S5，直到变量N1的值等于变量N的值。

此后，我们转到步骤S10，在该步骤S10中，池化层CMC在被包含在第一临时存储器MEM1中的N个第一数据集合D1上沿着第二方向使用第二过滤窗口F2，并且产生第二数据集合D2。

在步骤S11中，从变量N1的值中减去限定数N2，限定数N2 表示在执行第二过滤之前要被执行的第一窗口F1的滑动的次数。

变量N1的值等于N1-N2。

在步骤S12中，变量i的值增加1，并且在步骤S13中，我们验证变量i的值是否小于变量Max的值。

如果否，我们在步骤S14中传递给下一个卷积层CV，该卷积层CV将使用另一第一过滤窗口F1，并且将遍历初始数据集合DI。

如果是，我们继续利用第一过滤窗口对初始数据集合D1进行 N2次过滤，也就是说，直到N1等于N为止。

N2个第一数据集合D1覆写第一临时存储器MEM1中最旧的第一数据集合D1。因此，计算单元UC执行循环填充。

第二滑动窗口F2在包括两个新的第一集合D1的第一临时存储器MEM1上执行滑动，并且产生第二集合D2。

该算法被重复，直到处理了初始数据集合DI的所有行。

图4A、图4B和图4C示意性地图示了算法的实施方式。

在图4A中，第一滑动窗口F1第一次在初始数据集合DI的第一行之上滑动，并且产生第一数据集合D1，该第一数据集合D1将被存储在第一临时存储器MEM1中。N1现在等于1。

第一窗口F1第二次在初始数据集合DI的第二行之上滑动，并且产生第一数据集合D1，该第一数据集合D1将被存储在第一临时存储器MEM1中。N2现在等于2。

滑动被重复直到N1等于N，这里N为5。N表示第二滑动窗口的高度。

因此，第一临时存储器包含N个第一数据集合D1。

第二滑动窗口F2在第一临时存储器MEM1上沿着第二方向滑动，并且产生第二数据集合D2，该第二数据集合D2将被存储在第二临时存储器MEM2中。

从N1中减去N2，在这里N2等于2。因此，N1等于3。

第一滑动窗口F1第六次在初始数据集合DI的第六行之上滑动，并且产生第一数据集合D1。N1等于4。

该第一数据集合D1覆写最旧的第一数据集合D1。

第一窗口F1第七次在初始数据集合DI的第七行上滑动，并且产生第一数据集合D1。N1等于5。

该第一数据集合D1覆写最旧的第一数据集合D1。

应当注意，第一窗口F1可以例如不在初始数据集合DI的每个行上滑动。第一窗口F1可以具有滑动步幅。

在图4B中，第二滑动窗口F2在包含两个新的第一数据集合 D1的第一临时存储器MEM1之上滑动，并且产生第二数据集合D2，该第二数据集合D2将被存储在第二临时存储器MEM2中。

从N1中减去N2，在这里N2等于2。因此，N1等于3。

图4B和图4C中的相同步骤被重复，直到初始数据集合DI中不再有要被处理的任何行。

Claims

1.一种通过卷积神经网络处理初始数据集合的方法，所述卷积神经网络包括跟随有池化层的卷积层，所述初始数据集合沿着正交的第一方向和第二方向被存储在初始存储器中，所述方法包括：

由所述卷积层使用第一滑动窗口，沿着所述第一方向，执行对所述初始数据集合的第一过滤，所述第一滑动窗口的每次滑动产生第一数据集合；以及

由所述池化层使用第二滑动窗口，沿着所述第二方向，执行对所述第一数据集合的第二过滤。

2.根据权利要求1所述的方法，其中所述卷积层包括多个卷积层，并且所述池化层包括多个池化层。

3.根据权利要求1所述的方法，其中所述初始数据集合根据多个行和多个列以矩阵方式被存储，所述多个行沿着所述第一方向延伸，并且所述多个列沿着所述第二方向延伸，每个单独的行沿着所述第二方向延伸，并且每个单独的列沿着所述第一方向延伸。

4.根据权利要求3所述的方法，其中所述第一滑动窗口沿着所述第一方向逐步幅滑动，并且在每个步幅处遍历对应的所述行。

5.根据权利要求1所述的方法，其中所述第一过滤和所述第二过滤彼此跟随，直到所述初始数据集合的所有数据被处理为止。

6.根据权利要求1所述的方法，其中所述神经网络包括在所述卷积层与所述池化层之间的非线性层。

7.根据权利要求1所述的方法，其中所述神经网络由以浮点或固定精度实施的参数限定。

8.一种通过卷积神经网络处理初始数据集合的方法，所述卷积神经网络包括跟随有池化层的卷积层，所述初始数据集合沿着正交的第一方向和第二方向被存储在初始存储器中，所述方法包括：

由所述卷积层使用第一滑动窗口，沿着所述第一方向，执行对所述初始数据集合的第一过滤，所述第一滑动窗口的每次滑动产生第一数据集合；

由所述池化层使用第二滑动窗口，沿着所述第二方向，执行对所述第一数据集合的第二过滤，其中所述第二滑动窗口具有沿着所述第一方向计数的维度N，所述第一过滤包括所述第一滑动窗口沿着所述第一方向的N-1次滑动；以及

将N个第一数据集合存储在第一临时存储器中。

9.根据权利要求8所述的方法，其中所述第二过滤包括：所述第二滑动窗口在存储所述N个第一数据集合的所述第一临时存储器上沿着所述第二方向的滑动，每次滑动产生第二数据集合，所述第二过滤包括M个第二数据集合在第二临时存储器中的第二存储。

10.根据权利要求8所述的方法，其中所述第一存储包括由在所述第一滑动窗口的每次滑动时产生的所述第一数据集合来循环填充所述第一临时存储器。

11.根据权利要求10所述的方法，其中所述第二过滤在对所述第一临时存储器的多个循环填充之后被执行。

12.一种设备，包括：

初始存储器，被配置为沿着正交的第一方向和第二方向存储初始数据集合；

第一存储器，被配置为存储限定卷积神经网络的参数，所述卷积神经网络被配置为处理所述初始数据集合，所述卷积神经网络包括跟随有池化层的卷积层；以及

计算单元，被配置为执行所述神经网络的所述卷积层和所述池化层的操作，所述卷积层被配置为使用第一滑动窗口，沿着所述第一方向，执行对所述初始数据集合的第一过滤，以便在每次滑动时产生第一数据集合，并且所述池化层被配置为使用第二滑动窗口，沿着所述第二方向，执行对所述第一数据集合的第二过滤。

13.根据权利要求12所述的设备，其中所述第二滑动窗口具有沿着所述第一方向计数的维度N，所述设备包括处理器，所述处理器被配置为将所述第一滑动窗口的所述滑动限制为沿着所述第一方向的N-1次滑动，所述设备还包括第一临时存储器，所述第一临时存储器被配置为存储N个第一数据集合。

14.根据权利要求13所述的设备，其中所述初始数据集合根据多个行和多个列以矩阵方式被存储，所述多个行沿着所述第一方向延伸，并且所述多个列沿着所述第二方向延伸，每个单独的行沿着所述第二方向延伸，并且每个单独的列沿着所述第一方向延伸。

15.根据权利要求14所述的设备，其中所述处理器被配置为沿着所述第一方向逐步幅滑动所述第一滑动窗口，并且被配置为在每个步幅处使所述第一滑动窗口遍历对应的所述行。

16.根据权利要求13所述的设备，其中所述处理器被配置为：在存储所述N个第一数据集合的所述第一临时存储器上，沿着所述第二方向滑动所述第二滑动窗口，以便在每次滑动时产生第二数据集合，所述设备还包括第二临时存储器，所述第二临时存储器被配置为存储M个第二数据集合。

17.根据权利要求13所述的设备，其中所述处理器被配置为：利用在所述第一滑动窗口的所述滑动期间产生的所述第一数据集合，来执行对所述第一临时存储器的循环填充。

18.根据权利要求17所述的设备，其中所述处理器被配置为：一旦所述第一存储器已经执行了多个循环填充，就执行所述第二过滤。

19.根据权利要求13所述的设备，其中所述处理器被配置为相继执行所述第一过滤和所述第二过滤，直到处理了所述初始数据集合的所有数据为止。

20.根据权利要求12所述的设备，其中所述神经网络包括在所述卷积层与所述池化层之间的非线性层。

21.根据权利要求12所述的设备，其中所述神经网络由以浮点或固定精度实施的参数限定。

22.根据权利要求12所述的设备，其中所述设备是微控制器。