CN111914984A

CN111914984A - 用于辨识装置的人工神经网络正规化系统

Info

Publication number: CN111914984A
Application number: CN201910376478.7A
Authority: CN
Inventors: 刘子瑄; 谢明得
Original assignee: Himax Technologies Ltd; NCKU Research and Development Foundation
Current assignee: Himax Technologies Ltd; NCKU Research and Development Foundation
Priority date: 2019-05-07
Filing date: 2019-05-07
Publication date: 2020-11-10
Anticipated expiration: 2039-05-07
Also published as: CN111914984B

Abstract

本发明公开了一种用于辨识装置的人工神经网络正规化系统，包含输入层，产生影像的初始特征图；多个隐藏层，对初始特征图进行卷积以产生对象特征图；匹配单元，其接收对象特征图且执行匹配，以输出辨识结果。第一推论区块与第二推论区块，设于人工神经网络的至少一个隐藏层中。在第一模式，开启第一推论区块且关闭第二推论区块，其中第一推论区块仅接收前一层的第一推论区块的输出。在第二模式，开启第一推论区块与第二推论区块，其中第二推论区块接收前一层的第二推论区块的输出与前一层的第一推论区块的输出。

Description

用于辨识装置的人工神经网络正规化系统

技术领域

本发明涉及一种人工神经网络正规化系统，特别是涉及一种用于辨识装置的人工神经网络正规化系统或对象辨识架构。

背景技术

卷积神经网络(convolutional neural network,CNN)是深层(deep)神经网络的一种，其使用卷积层以过滤输入，以得到有用信息。卷积层的滤波器可根据所学习参数进行修改，以萃取得到特定工作的最有用信息。卷积神经网络普遍用于分类(classification)、侦测及辨识(recognition)，例如影像分类、医学影像分析及影像/视讯辨识。然而，卷积神经网络的推论(inference)需要大量的内存及运算。一般来说，卷积神经网络的模型准确度越高，则架构越复杂(即，更多内存与运算)且功耗越大。

当低功率终端(end)装置(例如全时传感器(always-on-sensor,AOS))越发展，则低复杂度的卷积神经网络的需求越大。然而，低复杂度的卷积神经网络由于受到功率的限制，无法达到高复杂度的卷积神经网络的高效能。受控于高效能的协处理器的全时传感器，配合低复杂度的卷积神经网络，可持续侦测简单对象，直到主处理器配合高复杂度的卷积神经网络被启动为止。因此，系统需要储存两个卷积神经网络模型(即，低复杂度模型与高复杂度模型)，因而需要更多高成本的静态随机存取内存(SRAM)装置。

发明内容

鉴于上述，本发明实施例的目的之一在于提出一种人工神经网络正规化系统，可支持多个模式以降低功耗。

本发明实施例提出一种用于辨识装置的人工神经网络正规化系统，包含输入层、多个隐藏层及匹配单元。输入层产生影像的初始特征图。隐藏层对初始特征图进行卷积以产生对象特征图。匹配单元接收对象特征图且执行匹配，以输出辨识结果。第一推论区块与第二推论区块，设于人工神经网络的至少一个隐藏层中。在第一模式，开启第一推论区块且关闭第二推论区块，其中第一推论区块仅接收前一层的第一推论区块的输出。在第二模式，开启第一推论区块与第二推论区块，其中第二推论区块接收前一层的第二推论区块的输出与前一层的第一推论区块的输出。

进一步地，在该第二模式，其中该第一推论区块仅接收前一层的第一推论区块的输出。

进一步地，在该第二模式，其中该第一推论区块接收前一层的第一推论区块的输出与前一层的第二推论区块的输出。

进一步地，用于辨识装置的人工神经网络正规化系统，还包含第三推论区块，设于该至少一个隐藏层中，该第三推论区块包含多个第三滤波器。

进一步地，该第三推论区块在该第一模式与该第二模式时为关闭，且于第三模式时为开启。

进一步地，该匹配单元包含脸部匹配单元，用以决定是否辨识出特定脸部。

本发明实施例的用于追踪装置的人工神经网络正规化系统，能够根据实际需求可操作于高精确模式或低功率模式，得以大量减少实施人工神经网络所需的静态随机存取内存(SRAM)装置，并且当人工神经网络正规化系统在操作于低功率模式时，能够有效地降低消耗。

附图说明

图1示出了本发明实施例的用于辨识装置的卷积神经网络(CNN)正规化系统的示意图；

图2示出了本发明一实施例的多阶段训练方法的流程图，可使用于图1所示的卷积神经网络正规化系统；

图3示出了本发明另一实施例的用于辨识装置的卷积神经网络正规化系统的示意图；

图4示出了本发明又一实施例的用于辨识装置的卷积神经网络正规化系统的示意图。

【符号说明】

100 卷积神经网络正规化系统

400 卷积神经网络正规化系统

11 输入层

12 隐藏层

13 输出层

14 匹配单元

101 第一推论区块

102 第二推论区块

103 第三推论区块

200 多阶段训练方法

21 (第一阶段)广泛地训练整个系统

22 (第二阶段)微调第一推论区块以产生低功率模型

23 (第三阶段)微调第二推论区块以产生高精确模型

具体实施方式

以下将详述本案的各实施例，并配合图式作为例示。除了这些详细描述之外，本发明还可以广泛地实行在其他的实施例中，任何所述实施例的轻易替代、修改、等效变化都包含在本案的范围内，并以权利要求为准。在说明书的描述中，为了使读者对本发明有较完整的了解，提供了许多特定细节；然而，本发明可能在省略部分或全部这些特定细节的前提下，仍可实施。此外，众所周知的程序步骤或组件并未描述于细节中，以避免造成本发明不必要的限制。

图1示出了本发明实施例用于辨识装置的卷积神经网络(convolutional neuralnetwork,CNN)正规化(regularization)系统100的示意图。卷积神经网络正规化系统100可使用数字图像处理器与内存装置(例如静态随机存取内存(SRAM)装置)来实施。卷积神经网络正规化系统100可适用于脸部辨识。

虽然本实施例以卷积神经网络作为例示，然而本实施例可概括至人工神经网络(artificial neural network)，其包含多个互相连结的节点(node)，类似于人脑的神经网络。根据本实施例的特征之一，卷积神经网络正规化系统100可支持多个(操作)模式，可选择操作于其中之一的模式。本实施例的卷积神经网络正规化系统100可操作于高精确(high-precision)模式或低功率模式。相较于高精确模式，操作于低功率模式的卷积神经网络正规化系统100消耗较少功率，但得到较小精确度。

在本实施例中，如图1所示，卷积神经网络正规化系统100可包含输入层11及多个隐藏(hidden)层12，其包含输出层13以输出对象特征图(或对象特征或对象向量)。其中，输入层11可产生影像的初始特征图(initial feature map)。隐藏层12可对初始特征图进行卷积运算，以产生对象特征图。在至少一个隐藏层中，本实施例的卷积神经网络正规化系统100可包含第一推论(inference)区块(或群)101(如所示实线区块)，其包含多个第一节点或滤波器(filter)。在至少一个隐藏层中，本实施例的卷积神经网络正规化系统100可包含第二推论区块(或群)102(如所示虚线区块)，其包含多个第二节点或滤波器。如图1所示，至少一个第一推论区块101与至少一个第二推论区块102位于同一隐藏层12。

本实施例的卷积神经网络正规化系统100可包含匹配(matching)单元14(例如脸部匹配单元)，其接收输出层13的对象特征图(例如脸部特征图、脸部特征或脸部向量)，并配合数据库以执行(对象)匹配，用以决定是否辨识出特定对象(例如脸部)。匹配单元14可使用传统脸部匹配技术，其细节因此省略。

图2示出了本发明实施例的多阶段训练方法200的流程图，可使用于图1所示的卷积神经网络正规化系统100。在本实施例中，多阶段训练方法200提供三阶段训练。根据本实施例的另一特征，多阶段训练方法200可得到(训练)模型，其具有多个操作模式(例如高精确模式与低功率模式)。

在第一阶段(步骤21)，如一般的训练流程，训练整个卷积神经网络正规化系统100，因而产生训练前(pre-trained)模型。即，在第一阶段，第一推论区块101与第二推论区块102的节点(或滤波器)是广泛地训练。

在第二阶段(步骤22)，微调(fine-tune)训练前模型的第一推论区块101的第一节点的权重(weight)，且将第二推论区块102的第二节点的权重设为零(或关闭)，因而产生低功率(或第一)模型。如图1所示，沿着推论路径(如所示实线)，微调第一推论区块101的第一节点的权重，且将第二推论区块102的第二节点的权重设为零。在本实施例中，每一个第一推论区块101仅接收前一层的第一推论区块101的输出，并关闭每一个第二推论区块102。

在第三阶段(步骤23)，微调第二推论区块102的第二节点的权重，且固定低功率模型的第一推论区块101的第一节点的权重(使其维持于步骤22结束时的值)，因而产生高精确(或第二)模型。如图1所示，沿着推论路径(如所示虚线)，微调训练前模型的第二推论区块102的第二节点的权重，且固定低功率模型的第一推论区块101的第一节点的权重。在一实施例中，欧几里得长度(Euclidean length)(即，L2长度(norm))可予以删除，以确保第三阶段所训练的模型可以收敛(converge)，使得执行得以正常。

在本实施例中，每一个第二推论区块102接收前一层第二推论区块102的输出及前一层第一推论区块101的输出，然而每一个第一推论区块101仅接收前一层第一推论区块101的输出。在另一实施例中，如图3所示，每一个第一推论区块101更接收前一层第二推论区块102的输出。

根据前述多阶段训练方法200所训练的卷积神经网络正规化系统100可用以执行脸部辨识。经训练的卷积神经网络正规化系统100可操作于低功率模式，其中第二推论区块102可关闭以降低功耗。经训练的卷积神经网络正规化系统100可操作于高精确模式，其操作整个卷积神经网络正规化系统100以得到高精确度。

根据前述实施例，由于仅需使用单一系统或模型，而非如传统使用二个系统或模型，因而得以大量减少实施卷积神经网络所需的静态随机存取内存(SRAM)装置。因此，受控于协处理器(co-processor)的全时传感器(always-on-sensor,AOS)可在低功率模式持续侦测简单对象，直到主处理器在高精确度模式被启动为止。

图1或3所示所例示的卷积神经网络正规化系统100可概括至支持二个以上模式的卷积神经网络正规化系统。图4示出了本发明又一实施例的用于辨识装置的卷积神经网络正规化系统400的示意图。在本实施例中，在至少一个隐藏层12中，卷积神经网络正规化系统400还包含第三推论区块103。

在训练卷积神经网络正规化系统400的第一阶段，如一般的训练流程，训练整个卷积神经网络正规化系统400，因而产生训练前(pre-trained)模型。在第二阶段，微调训练前模型的第一推论区块101的第一节点的权重，且将第二推论区块102的第二节点及第三推论区块103的第三节点的权重设为零(或关闭)，因而产生第一低功率模型。在第三阶段，微调第二推论区块102的第二节点的权重，将第三推论区块103的第三节点的权重设为零，且固定第一低功率模型的第一推论区块101的第一节点的权重，因而产生第二低功率模型。在第四(最终)阶段，微调第三推论区块103的第三节点的权重，且固定第二低功率模型的第一推论区块101的第一节点及第二推论区块102的第二节点的权重，因而产生高精确(或第三)模型。

经训练的卷积神经网络正规化系统400可操作于第一低功率模式，其中第二推论区块102及第三推论区块103可关闭以降低功耗。经训练的卷积神经网络正规化系统400可操作于第二低功率模式，其中第三推论区块103可关闭以降低功耗。经训练的卷积神经网络正规化系统400可操作于高精确模式，其操作整个卷积神经网络正规化系统400以得到高精确度。

以上所述仅为本发明的较佳实施例而已，并非用以限定本发明的保护范围；凡其它未脱离发明所揭示的精神下所完成的等效改变或修饰，均应包含在本发明权利要求所限定的范围内。

Claims

1.一种用于辨识装置的人工神经网络正规化系统，其特征在于，包含：

输入层，产生影像的初始特征图；

多个隐藏层，对该初始特征图进行卷积以产生对象特征图；及

匹配单元，其接收该对象特征图且执行匹配，以输出辨识结果；

第一推论区块与第二推论区块，设于人工神经网络的至少一个隐藏层中，该第一推论区块包含多个第一滤波器且该第二推论区块包含多个第二滤波器；

在第一模式，开启该第一推论区块且关闭该第二推论区块，其中该第一推论区块仅接收前一层的第一推论区块的输出；在第二模式，开启该第一推论区块与该第二推论区块，其中该第二推论区块接收前一层的第二推论区块的输出与前一层的第一推论区块的输出。

2.根据权利要求1所述的用于辨识装置的人工神经网络正规化系统，其特征在于，在该第二模式，其中该第一推论区块仅接收前一层的第一推论区块的输出。

3.根据权利要求1所述的用于辨识装置的人工神经网络正规化系统，其特征在于，在该第二模式，其中该第一推论区块接收前一层的第一推论区块的输出与前一层的第二推论区块的输出。

4.根据权利要求1所述的用于辨识装置的人工神经网络正规化系统，其特征在于，还包含第三推论区块，设于该至少一个隐藏层中，该第三推论区块包含多个第三滤波器。

5.根据权利要求4所述的用于辨识装置的人工神经网络正规化系统，其特征在于，该第三推论区块在该第一模式与该第二模式时为关闭，且于第三模式时为开启。

6.根据权利要求1所述的用于辨识装置的人工神经网络正规化系统，其特征在于，该匹配单元包含脸部匹配单元，用以决定是否辨识出特定脸部。