WO2020151108A1

WO2020151108A1 - 基于情境信号类前额叶网络的信息处理方法、系统、装置

Info

Publication number: WO2020151108A1
Application number: PCT/CN2019/083356
Authority: WO
Inventors: 曾冠雄; 陈阳; 余山
Original assignee: 中国科学院自动化研究所
Priority date: 2019-01-22
Filing date: 2019-04-19
Publication date: 2020-07-30
Also published as: US10915815B1; CN109784287A; US20210056415A1

Abstract

本发明属于模式识别及类脑机器学习领域，具体涉及了一种基于情境信号类前额叶网络的信息处理方法、系统、装置，旨在解决复杂情况下即复杂多任务情况下系统结构复杂、灵活性差、训练样本需求量大的问题。本发明方法包括：选择对应特征向量提取器进行特征提取；将信息特征向量与情境信号集中每一个情境信号进行维度匹配；维度匹配后的情境特征向量输入特征向量分类器，获得分类信息。本发明方法利用类似于前额叶的模块，实现面向情境信息的多任务学习，在上下文情境信息不能事先确定的情况下，可以逐步学习依赖于上下文情境信息的映射，处理后的数据可应用于多任务学习或更高要求的连续多任务学习。

Description

基于情境信号类前额叶网络的信息处理方法、系统、装置

技术领域

本发明属于模式识别及类脑机器学习领域，具体涉及了一种基于情境信号类前额叶网络的信息处理方法、系统、装置。

背景技术

高级智能的特点之一就是具有灵活性。人类可以根据不同的目标，环境和内部状态等不同情境对同一刺激做出不同的反应。前额叶在灵长类中高度精细化，在实现这种能力中起着关键的作用。前额叶可以快速学习“游戏规则”，并动态地将它们应用于将感官输入映射到以不同的动作为依据的上下文相关的任务中,这个过程被称为认知控制，它让灵长类在无限多种情况下都可以有适当的行为。

当前的人工神经网络在从原始数据中提取高级特征去做模式分类，学习复杂的映射规则方面功能非常强大，然而，它们的响应主要由网络输入决定的，并呈现出刻板的输入输出映射。另外，一旦网络训练完成，那么网络的映射通常是固定的。

因此，目前的人工神经网络在复杂情况下缺乏必要的灵活性，主要是因为映射规则可能根据上下文而变化，而且这些规则需要从少量训练样本中“随时”学习。从这可以看出人工神经网络和人类大脑之间具有巨大的能力差距。

发明内容

为了解决现有技术中的上述问题，即复杂多任务情况下系统结构复杂，灵活性差，以及训练样本需求量大的问题，本发明提供了一种受前额叶功能启发的，基于情境信号类前额叶网络的信息处理方法，包括：

步骤S10，基于获取信息选择特征向量提取器进行特征提取，得到信息特征向量；

步骤S20，将所述信息特征向量输入类前额叶网络，与所输入的情境信号集中每一个情境信号进行维度匹配，获得情境特征向量，构成情境特征向量集；

步骤S30，将情境特征向量集中各特征向量通过预先构建的特征向量分类器分类获得各特征向量分类信息，构成分类信息集；所述特征向量分类器为情境特征向量和分类信息的映射网络。

在一些优选的实施例中步骤S10中“选择特征向量提取器”，其方法为：

基于预设的特征向量提取器库，依据获取信息的类别选择对应的特征向量提取器。

在一些优选的实施例中，所述特征向量提取器，其构建方法为：

基于训练数据集，采用Adam算法迭代地更新特征向量提取网络中参数的权重；所述特征向量提取网络基于深度神经网络构建；

将训练后的特征提取网络最后的分类层去除后的网络作为特征向量提取器。

在一些优选的实施例中，步骤S20中“将所述信息特征向量输入类前额叶网络，与所输入的情境信号集中每一个情境信号进行维度匹配，获得情境特征向量”，其步骤为：

步骤S201，基于情境信号及类前额叶网络构建权重矩阵，并对该权重矩阵每一列进行模归一化；

其中，W ⁱⁿ为权重矩阵，

为

的归一化的模，i为输入特征的维度索引，k为输入特征的维度，m为隐藏层的维度；

步骤S202，基于权重矩阵，将情境信号与信息特征向量进行维度匹配，获得情境特征向量；

Y ^out＝g([c ₁cosθ ₁,c ₂cosθ ₂,…,c _mcosθ _m] ^T)||F||

其中，Y ^out为情境特征向量，

F为信息特征向量，

C为情境信号，

⊙代表向量对应元素相乘；θ _m是

和F之间的角度，g＝max(0,x)；W ⁱⁿ为权重矩阵，

步骤S203，所述情境信号集中每一个情境信号与信息特征向量进行维度匹配后获得的情境特征向量构成情境特征向量集。

在一些优选的实施例中，步骤S30中所述特征向量分类器基于下式构建：

Y ^Lable＝(W ^out) ^TY ^out＝||W ^out||||F||cosφ

其中，Y ^Lable为分类信息，W ^out为分类器的分类权重，Y ^out为类前额叶网络输出的特征，n为类前额叶网络输出权重的维度，F为信息特征向量。

在一些优选的实施例中，所述Adam算法，其参数配置为：

Adam算法的学习率为0.1，权重衰减率为0.0001，每个批次的训练样本数为256。

在一些优选的实施例中，所述情境信号为对应分类属性的多维词向量；所述词向量维度为200维。

在一些优选的实施例中，所述权重矩阵W ⁱⁿ为：

基于词向量的维度以及类前额前层的维度，构建的词向量维度×类前额叶维度大小的矩阵。

本发明的另一方面，提出了一种基于情境信号类前额叶网络的信息处理系统，包括获取模块、特征提取模块、维度匹配模块、分类模块、输出模块；

所述获取模块，配置为获取输入信息以及情境信号集并输入；

所述特征提取模块，配置为采用对应输入信息的特征向量提取器提取输入信息的特征，获得信息特征向量；

所述维度匹配模块，配置为将信息特征向量输入类前额叶网络，与所输入的情境信号集中每一个情境信号进行维度匹配，获得情境特征向量，构成情境特征向量集；

所述分类模块，配置为将情境特征向量集中各特征向量通过预先构建的特征向量分类器分类获得各特征向量分类信息，构成分类信息集；

所述输出模块，配置为将获取的分类信息集输出。

本发明的第三方面，提出了一种存储装置，其中存储有多条程序，所述程序适于由处理器加载并执行以实现上述的基于情境信号类前额叶网络的信息处理方法。

本发明的第四方面，提出了一种处理装置，包括处理器、存储装置；所述处理器，适于执行各条程序；所述存储装置，适于存储多条程序；所述程序适于由处理器加载并执行以实现上述的基于情境信号类前额叶网络的信息处理方法。

本发明的有益效果：

(1)本发明基于情境信号的多任务信息处理方法利用类似于前额叶的模块，实现面向情境信息的多任务学习。在上下文情境信息不能事先确定的情况下，可以逐步学习依赖于上下文情境信息的映射。经过本发明方法处理后的数据可以应用于多任务学习或更高要求的连续多任务学习，并且可以简化网络结构，减少多任务学习难度，增加系统灵活性。

(2)本发明使用深度神经网络作为特征提取器，然后在线性层使用设计的优化方法。这样既充分发挥了深度神经网络的作用，又降低了设计难度。

(3)本发明方法中设计了情境信号，这个情境信号可以根据当前工作的环境变化而变化，解决了神经网络不能根据不同的目标，环境和内部状态等不同情境对同一刺激做出不同的反应的缺陷。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本发明基于情境信号类前额叶网络的信息处理方法的流程示意图；

图2是本发明基于情境信号类前额叶网络的信息处理方法的网络结构示意图；

图3是本发明基于情境信号类前额叶网络的信息处理方法的实施例的三维空间示意图；

图4是本发明基于情境信号类前额叶网络的信息处理方法的传统多任务学习网络和连续多任务学习网络的网络架构示意图；

图5是本发明基于情境信号类前额叶网络的信息处理方法的多任务训练和连续多场景训练的人脸识别任务精度示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

本发明的一种基于情境信号类前额叶网络的信息处理方法，包括：

步骤S20，将所述图片特征向量输入类前额叶网络，与所输入的情境信号集中每一个情境信号进行维度匹配，获得情境特征向量，构成情境特征向量集；

为了更清晰地对本发明基于情境信号类前额叶网络的信息处理方法进行说明，下面结合图1对本发明方法实施例中各步骤展开详述。

本发明一种实施例的基于情境信号类前额叶网络的信息处理方法，包括步骤S10-步骤S30，各步骤详细描述如下：

步骤S10，基于获取信息选择特征向量提取器进行特征提取，得到信息特征向量。

特征向量提取器库包含图片特征向量提取器、语音特征向量提取器、文本特征向量提取器中的一个或多个；还可以包括其他常见信息类别的特征向量提取器，此处不再一一列举。本发明中特征向量提取器可以基于深度神经网络构建，例如，对于图片输入信息，可选择ResNet等深度神经网络；对于语音输入信息，可选择CNN、LSTM、GRU等深度神经网络；对于文本输入信息，可以使用fastText、TextCNN和TextRNN等深度神经网络。

在现实环境中，信息一般是多模态的，可同时结合使用多种特征向量处理器提取特征，能够丰富信息的表达，还可以大大降低原始信息的维度，使得下游信息更容易处理。

特征向量提取器库中的每一个特征向量提取器，其构建方法为：

基于训练数据集，采用Adam算法迭代地更新特征向量提取网络中参数的权重；所述特征向量提取网络基于深度神经网络构建。

本发明优选的实施例中，Adam算法的学习率为0.1，权重衰减率为0.0001，每个批次的训练样本数(Batch Size)为256。本发明获取的训练数据集为人脸数据集CelebA(CelebA是香港中文大学的开放数据，包含10177个名人身份的202599张图片，每个人脸有对应的40个属性，每个属性作为一种场景，不同的场景对应不同的情境信号)。

采用Adam算法训练深度神经网络ResNet50，去除ResNet50网络最后的分类层，使用倒数第二层的输出作为人脸数据的特征，倒数第二层的输出有2048维度。

步骤S20，将所述信息特征向量输入类前额叶网络，与所输入的情境信号集中每一个情境信号进行维度匹配，获得情境特征向量，构成情境特征向量集。如图2所示为本发明实施例的基于情境信号的类前额叶网络结构示意图。

本发明优选的实施例中，采用gensim工具包的默认参数训练的英文词向量作为情境信号，40个属性分类任务的情境信号为其对应属性标签的200维词向量。

步骤S201，基于情境信号及类前额叶网络构建权重矩阵，并对该权重矩阵每一列进行模归一化。

情境信号维度为200维，类前额前层为5000维，构建大小为200×5000的权重矩阵。本发明优选实施例的三维空间示意图如图3所示。

构建的权重矩阵W ⁱⁿ如式(1)所示：

其中，k为输入特征的维度，m为隐藏层的维度。

对权重矩阵每一列归一化，如式(2)所示：

其中，i为输入特征的维度索引。

步骤S202，基于权重矩阵，将情境信号与信息特征向量进行维度匹配，获得情境特征向量，如式(3)所示：

其中，Y ^out为情境特征向量，

F为信息特征向量，

C为情境信号，

⊙代表向量对应元素相乘；θ _m是

和F之间的角度，g＝max(0,x)；W ⁱⁿ为权重矩阵，

步骤S203，所述情境信号集中每一个情境信号与输入信息特征向量进行维度匹配后获得的情境特征向量构成情境特征向量集。

特征向量分类器基于式(4)和式(5)构建：

Y ^Lable＝(W ^out) ^TY ^out＝||W ^out||||F||cosφ 式(4)

如图4所示，为本发明基于情境信号类前额叶网络的信息处理方法的传统多任务学习网络和连续多任务学习网络的网络架构示意图， C代表分类器。为了实现依赖于上下文的处理，在多任务训练中需要开关模块和n个分类器，其中n是情境信号的个数。

如图5所示，为本发明基于情境信号类前额叶网络的信息处理方法的多任务训练和连续多场景训练的人脸识别任务精度示意图，每个点代表一个人脸属性，总共40个。每个属性与一个情境信号相关联，从而可以做基于情境信号的连续多任务学习，实现多任务训练获得的结果。

本发明第二实施例的基于情境信号类前额叶网络的信息处理系统，包括获取模块、特征提取模块、维度匹配模块、分类模块、输出模块；

所述输出模块，配置为将获取的分类信息集输出。

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

需要说明的是，上述实施例提供的基于情境信号类前额叶网络的信息处理系统，仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块来完成，即将本发明实施例中的模块或者步骤再分解或者组合，例如，上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块，以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称，仅仅是为了区分各个模块或者步骤，不视为对本发明的不当限定。

本发明第三实施例的一种存储装置，其中存储有多条程序，所述程序适于由处理器加载并执行以实现上述的基于情境信号类前额叶网络的信息处理方法。

本发明第四实施例的一种处理装置，包括处理器、存储装置；处理器，适于执行各条程序；存储装置，适于存储多条程序；所述程序适于由处理器加载并执行以实现上述的基于情境信号类前额叶网络的信息处理方法。

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的存储装置、处理装置的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域技术人员应该能够意识到，结合本文中所公开的实施例描述的各示例的模块、方法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素，而且还包括没有明确列出的其它要素，或者还包括这些过程、方法、物品或者设备/装置所固有的要素。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征作出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

一种基于情境信号类前额叶网络的信息处理方法，其特征在于，包括：

步骤S10，基于获取信息选择特征向量提取器进行特征提取，得到信息特征向量；

步骤S20，将所述信息特征向量输入类前额叶网络，与所输入的情境信号集中每一个情境信号进行维度匹配，获得情境特征向量，构成情境特征向量集；

步骤S30，将情境特征向量集中各特征向量通过预先构建的特征向量分类器分类获得各特征向量分类信息，构成分类信息集；所述特征向量分类器为情境特征向量和分类信息的映射网络。
根据权利要求1所述的基于情境信号类前额叶网络的信息处理方法，其特征在于，步骤S10中“选择特征向量提取器”，其方法为：

基于预设的特征向量提取器库，依据获取信息的类别选择对应的特征向量提取器。
根据权利要求2所述的基于情境信号类前额叶网络的信息处理方法，其特征在于，所述特征向量提取器，其构建方法为：

基于训练数据集，采用Adam算法迭代地更新特征向量提取网络中参数的权重；所述特征向量提取网络基于深度神经网络构建；

将训练后的特征提取网络最后的分类层去除后的网络作为特征向量提取器。
根据权利要求1所述的基于情境信号类前额叶网络的信息处理方法，其特征在于，步骤S20中“将所述信息特征向量输入类前额叶网络，与所输入的情境信号集中每一个情境信号进行维度匹配，获得情境特征向量”，其步骤为：

步骤S201，基于情境信号及类前额叶网络构建权重矩阵，并对该权重矩阵每一列进行模归一化；

其中，Win为权重矩阵，
为
的归一化的模，i为隐藏层的维度索引，k为输入特征的维度，m为隐藏层的维度；

步骤S202，基于权重矩阵，将情境信号与信息特征向量进行维度匹配，获得情境特征向量；

Y ^out＝g([c ₁ cosθ ₁,c ₂ cosθ ₂,…,c _m cosθ _m] ^T)||F||

其中，Y ^out为情境特征向量，
F为信息特征向量，
C为情境信号，
⊙代表向量对应元素相乘；θ _m是
和F之间的角度，g＝max(0,x)；W ⁱⁿ为权重矩阵，

步骤S203，所述情境信号集中每一个情境信号与输入信息特征向量进行维度匹配后获得的情境特征向量构成情境特征向量集。
根据权利要求1所述的基于情境信号类前额叶网络的信息处理方法，其特征在于，步骤S30中所述特征向量分类器基于下式构建：

Y ^Lable＝(W ^out) ^TY ^out＝||W ^out||||F||cosφ

其中，Y ^Lable为分类信息，W ^out为分类器的分类权重，Y ^out为类前额叶网络输出的特征，n为类前额叶网络输出权重的维度，F为信息特征向量。
根据权利要求2所述的基于情境信号类前额叶网络的信息处理方法，其特征在于，所述Adam算法，其参数配置为：

Adam算法的学习率为0.1，权重衰减率为0.0001，每个批次的训练样本数为256。
根据权利要求3所述的基于情境信号类前额叶网络的信息处理方法，其特征在于，所述情境信号为对应分类属性的多维词向量；所述词向量维度为200维。
根据权利要求6所述的基于情境信号类前额叶网络的信息处理方法，其特征在于，所述权重矩阵W ⁱⁿ为：

基于词向量的维度以及类前额前层的维度，构建的词向量维度×类前额叶维度大小的矩阵。
一种基于情境信号类前额叶网络的信息处理系统，其特征在于，包括获取模块、特征提取模块、维度匹配模块、分类模块、输出模块；

所述获取模块，配置为获取输入信息以及情境信号集并输入；

所述特征提取模块，配置为采用对应输入信息的特征向量提取器提取输入信息的特征，获得信息特征向量；

所述维度匹配模块，配置为将信息特征向量输入类前额叶网络，与所输入的情境信号集中每一个情境信号进行维度匹配，获得情境特征向量，构成情境特征向量集；

所述分类模块，配置为将情境特征向量集中各特征向量通过预先构建的特征向量分类器分类获得各特征向量分类信息，构成分类信息集；

所述输出模块，配置为将获取的分类信息集输出。
一种存储装置，其中存储有多条程序，其特征在于，所述程序适于由处理器加载并执行以实现权利要求1-8任一项所述的基于情境信号类前额叶网络的信息处理方法。
一种处理装置，包括

处理器，适于执行各条程序；以及

存储装置，适于存储多条程序；

其特征在于，所述程序适于由处理器加载并执行以实现：

权利要求1-8任一项所述的基于情境信号类前额叶网络的信息处理方法。