WO2020248581A1

WO2020248581A1 - 图数据识别方法、装置、计算机设备和存储介质

Info

Publication number: WO2020248581A1
Application number: PCT/CN2019/129708
Authority: WO
Inventors: 张一帆; 史磊
Original assignee: 中国科学院自动化研究所; 中国科学院自动化研究所南京人工智能芯片创新研究院
Priority date: 2019-06-11
Filing date: 2019-12-30
Publication date: 2020-12-17
Also published as: CN110378372A

Abstract

一种图数据识别方法、装置、计算机设备和存储介质。所述方法包括：获取输入已训练的卷积神经网络的当前卷积层的输入特征图（S201），输入特征图为根据图像数据生成的特征图，获取当前卷积层的第一偏置矩阵（S202），其中第一偏置矩阵为生成已训练的卷积神经网络时生成的矩阵，根据输入特征图生成第二偏置矩阵（S203），获取参考邻接矩阵，计算参考邻接矩阵、第一偏置矩阵和第二偏置矩阵的和，得到目标邻接矩阵（S204），获取当前卷积层的卷积核（S205），根据当前卷积层的卷积核、目标邻接矩阵和输入特征图生成目标输出特征图（S206），根据目标输出特征图，识别出图数据的识别结果。所述方法对现有的固定的邻接矩阵基础上增加可调整的偏置矩阵，提高已训练的卷积神经网络的识别准确率。

Description

图数据识别方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种图数据识别方法、装置、计算机设备和存储介质。

背景技术

在骨骼点数据中，人体是由若干预先定义好的关键关节点在相机坐标系中的坐标来表示的。它可以很方便地通过深度摄像头(例如Kinect)以及各种姿态估计算法(例如OpenPose)获得。图1为Kinect深度摄像机所定义的人体的关键关节点。它将人体定义为25个关键关节点的三维坐标。由于行为往往是以视频的形式存在的，所以一个长度为T帧的行为可以用Tx25x3的张量来表示。

参照图2，图2为一个实施例中的时空图。每个关节点定义为图的节点，关节点之间的物理连接定义为图的边，并且在相邻帧的同一个节点间加上时间维度的边，得到一张可以描述人体行为的时空图。

目前常见的基于骨骼点的行为识别方法为图卷积。图卷积和普通卷积操作不同，在图上做卷积时，每一个节点的邻节点数是不固定的，而卷积操作的参数是固定的，为了将固定数量的参数和不定数量的临节点数对应起来，需要定义映射函数，通过映射函数实现参数和节点的对应。如定义卷积核大小为三，如图3所示，三个参数分别对应于远离人体中心的点001，靠近人体中心点000的点002和卷积点本身003。则卷积操作可以用公式(1)表示：

其中f是输入输出特征张量，w是卷积参数，v是图中节点，l代表节点与参数间的映射函数，Z是归一化函数。在具体实现时，映射函数可以通过图的邻接矩阵来实现，通过邻接矩阵表示的卷积操作如公式(2)所示：

其中A代表图的邻接矩阵，K是卷积核大小，Λ用于对A进行归一化处理。通过与邻接矩阵A相乘，从特征张量中“筛选”出所需要的节点并与对应的参数相乘。

上述通过邻接矩阵表示的卷积操作时，邻接矩阵定义了用于图卷积网络中的人体图的拓扑结构。人体姿态多种多样，固定的拓扑结构无法准确地描述人体的每一种姿态，从而导致识别准确率低下。

技术问题

为了解决上述技术问题，本申请提供了一种图数据识别方法、装置、计算机设备和存储介质。

技术解决方案

第一方面，本申请提供了一种图数据识别方法，包括：

获取输入已训练的卷积神经网络的当前卷积层的输入特征图，输入特征图为根据图像数据生成的特征图；

获取当前卷积层的第一偏置矩阵，其中第一偏置矩阵为生成已训练的卷积神经网络时生成的矩阵；

根据输入特征图生成第二偏置矩阵；

获取参考邻接矩阵，计算参考邻接矩阵、第一偏置矩阵和第二偏置矩阵的和，得到目标邻接矩阵；

获取当前卷积层的卷积核；

根据当前卷积层的卷积核、目标邻接矩阵和输入特征图生成目标输出特征图；

根据目标输出特征图，识别出图数据的识别结果。

第二方面，本申请提供了一种特图生成装置，包括：

数据获取模块，用于获取输入已训练的卷积神经网络的当前卷积层的输入特征图，输入特征图为根据图像数据生成的特征图，获取当前卷积层的第一偏置矩阵，其中第一偏置矩阵为生成已训练的卷积神经网络时生成的矩阵；

第二偏置矩阵生成模块，用于根据输入特征图生成第二偏置矩阵；

目标邻接矩阵生成模块，用于获取参考邻接矩阵，计算参考邻接矩阵、第一偏置矩阵和第二偏置矩阵的和，得到目标邻接矩阵；

目标输出特征图生成模块，用于获取当前卷积层的卷积核，根据当前卷积层的卷积核、目标邻接矩阵和输入特征图生成目标输出特征图。

识别模块，用于根据目标输出特征图，识别出图数据的识别结果。

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

根据输入特征图生成第二偏置矩阵；

获取当前卷积层的卷积核；

根据目标输出特征图，识别出图数据的识别结果。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

根据输入特征图生成第二偏置矩阵；

获取当前卷积层的卷积核；

根据目标输出特征图，识别出图数据的识别结果。

有益效果

上述图数据识别方法、装置、计算机设备和存储介质，所述方法包括：获取输入已训练的卷积神经网络的当前卷积层的输入特征图，输入特征图为根据图像数据生成的特征图，获取当前卷积层的第一偏置矩阵，其中第一偏置矩阵为生成已训练的卷积神经网络时生成的矩阵，根据输入特征图生成第二偏置矩阵，获取参考邻接矩阵，计算参考邻接矩阵、第一偏置矩阵和第二偏置矩阵的和，得到目标邻接矩阵，获取当前卷积层的卷积核，根据当前卷积层的卷积核、目标邻接矩阵和输入特征图生成目标输出特征图，根据目标输出特征图，识别出图数据的识别结果。对已训练的卷积神经网络中各个卷积层中的邻接矩阵增加偏置矩阵，偏置矩阵中的第一偏置矩阵为根据需求确定的已矩阵，和根据输入特征图生成的第二偏置矩阵为根据输入数据生成的矩阵，增加偏置矩阵能够表征需求所需的特征和输入数据的样本特征，提高生成特征图的准确性，进而提高已训练的卷积神经网络的识别准确率。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为一个实施例中Kinect深度摄像机所定义的人体的关键关节点的示意图；

图2为一个实施例中描述人体行为的时空图；

图3为一个实施例中图卷积中定义的节点示意图；

图4为一个实施例中一个实施例中图数据识别方法的应用环境图；

图5为一个实施例中特征图生成方法的流程示意图；

图6为一个实施例中卷积层的数据处理流程示意图；

图7为一个实施例中特征图生成装置的结构框图；

图8为一个实施例中计算机设备的内部结构图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

图4为一个实施例中图数据识别方法的应用环境图。参照图4，该图数据识别方法应用于特征图生成系统。该特征图生成系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端或服务器获取输入已训练的卷积神经网络的当前卷积层的输入特征图，输入特征图为根据图像数据生成的特征图，输入特征图为是通过提取图数据得到的特征图，获取当前卷积层的第一偏置矩阵，其中第一偏置矩阵为生成已训练的卷积神经网络时生成的矩阵，根据输入特征图生成第二偏置矩阵，获取参考邻接矩阵，计算参考邻接矩阵、第一偏置矩阵和第二偏置矩阵的和，得到目标邻接矩阵，获取当前卷积层的卷积核，根据当前卷积层的卷积核、目标邻接矩阵和输入特征图生成目标输出特征图，根据目标输出特征图，识别出图数据的识别结果。终端110具体可以是台式终端或移动终端，移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

如图5所示，在一个实施例中，提供了一种图数据识别方法。本实施例主要以该方法应用于上述图4中的终端110(或服务器120)来举例说明。参照图5，该图数据识别方法具体包括如下步骤：

步骤S201，获取输入已训练的卷积神经网络的当前卷积层的输入特征图。

在本具体实施例中，输入特征图为根据图像数据生成的特征图。

具体地，已训练的卷积神经网络是指通过大量的携带标签的图数据训练得到的，其中图数据为人体行为的时空图，时空图如图2所示。图数据携带的标签包括人体的行为，如拍手、跳跃、拉手和打架等个人行为或多人行为。已训练的卷积神经网络包含多个卷积层，当前卷积层可以为卷积神经网络中的任意一个卷积层。上一个卷积层的输出数据为当前卷积层的输入数据，获取上一个卷积层中的输出数据作为当前卷积层的输入数据，输入数据为输入特征图。

步骤S202，获取当前卷积层的第一偏置矩阵。

具体地，第一偏置矩阵为生成已训练的卷积神经网络时生成的矩阵。第一偏置矩阵是根据训练需求得到的偏置矩阵，不同的训练需求，是指卷积神经网络训练后用于做什么的需求，如用于识别拍手和用于识别打架时，得到的第一偏置矩阵不相同。

步骤S203，根据输入特征图生成第二偏置矩阵。

具体地，第二偏置矩阵为根据输入特征图生成的矩阵。通过对输入矩阵进行降维、归一化等操作得到第二偏置矩阵。第二偏置矩阵与输入特征图相关，根据当前卷积层中的函数对输入特征图进行映射，得到映射后的矩阵，将对映射后的矩阵进行乘积运算，对乘积运算结果进行归一化等处理，得到第二偏置矩阵。

在一个实施例中，步骤S203，包括：采用已训练的卷积神经网络中的降维函数对输入特征图进行降维，得到降维矩阵，归一化降维矩阵，得到归一化矩阵，归一化矩阵为第二偏置矩阵。

具体地，降维函数包括第一降维函数和第二降维函数，根据第一降维函数对输入特征图对进行降维得到第一特征图，根据第二降维函数对输入特征图进行降维得到第二特征图。计算第一特征图和第二特征图的乘积，得到第一乘积矩阵。对输入特征图采用不同的降维函数进行降维，得到不同的降维矩阵，其中降维函数的参数是根据需求进行训练得到的。计算两个降维后的矩阵的乘积，即第一乘积矩阵，第一乘积矩阵中的各个点表示横坐标对应的点和纵坐标对应的点之间的特征相似度。如1表示关节点1，2表示关节点2，则第一乘积矩阵中的坐标(1，2)中的矩阵元素，表示关节点1和关节点2之间的特征相似度。对第一乘积矩阵进行归一化操作得到归一化矩阵，归一化操作，对数据进行归一化操作可以提高数据计算的精度，加快数据的收敛速度。将归一化后的第一乘积矩阵作为第二偏置矩阵。

步骤S204，获取参考邻接矩阵，计算参考邻接矩阵、第一偏置矩阵和第二偏置矩阵的和，得到目标邻接矩阵。

具体地，第一偏置矩阵、第二偏置矩阵和参考邻接矩阵具有相同的维度信息，计算参考邻接矩阵、第一偏置矩阵和第二偏置矩阵的和，即对相同位置的矩阵元素直接进行相加，得到目标邻接矩阵。

步骤S205，获取当前卷积层的卷积核。

具体地，每个卷积层包含多个卷积核，各个卷积层对应的卷积核数量可以相同或不同，各个卷积核可以相同也可以不相同。卷积核是用于对图像进行卷积运算，不同的卷积核可以提取不同的图像特征。采用目标邻接矩阵对输入特征图进行特征提取，得到特征图。

步骤S205，根据当前卷积层的卷积核、目标邻接矩阵和输入特征图生成目标输出特征图。

具体地，采用目标邻接矩阵对应输入特征图进行特征提取，得到对应的特征图，采用卷积核对根据目标路径矩阵提取的特征图进行卷积运算，将卷积运算得到的特征图作为目标输出特征图。采用目标邻接矩阵对输入特征图进行特征提取，能够提取到更为准确的特征。

在一个实施例中，输入特征图至少包括三个维度，目标邻接矩阵包括至少三个维度，步骤S205，包括：

步骤S2051，重塑输入特征图，得到重塑特征图。

在本具体实施例中，重塑特征图的第一维度为输入特征图的第一维度和第二维度的乘积。

具体地，重塑是指对输入特征图进行调整，使得第一维度和第二维度的乘积为重塑特征图的第一维度，如将包含三个维度的输入特征图调整成2个维度的重塑特征图，假设输入特征图为C×M×N，其中第一维度为C，第二维度为M，第三维度为N，则可以重塑图为C×M×N，第一维度为C和M的乘积CM，第二维度与输入特征图的第三维图相同，保持整个输入特征图的元素不变，总元素为C、M和N的乘积CMN。其中第一维度C为通道素，第二维度M为输入特征图的行数，第三维度N为输入特征图的列数。其中N代表的是人体关节点的数量，在Kinect中N定义为25。对矩阵进行重塑是为了方便运算。

步骤S2052，计算重塑特征图和目标邻接矩阵的各个通道的矩阵的乘积，得到各个通道的第二乘积矩阵。

具体地，重塑特征图的第二维度与目标邻接矩阵的各个通道的矩阵的第一维度相同，如重塑特征图为C×M×N，目标邻接矩阵为C×N×N，各个通道矩阵为N×N，则重塑特征图与各个通道的矩阵的乘积矩阵为CMN。

步骤S2053，反重塑各个通道的第二乘积矩阵，得到各个通道的反重塑特征图。

具体地，反重塑是重塑的逆过程，如重塑是将三维矩阵转换为二位矩阵，则反重塑为将二维矩阵转换为三维矩阵，如各个通道的乘积矩阵为CM×N，则反重塑后得到的反重塑特征图为C×M×N的矩阵。

步骤S2054，根据各个通道的卷积核，根据各个通道的卷积核对反重塑特征图进行卷积运算，得到当前卷积层各个通道的目标特征图。

步骤S2055，对各个通道的目标特征图进行求和，得到当前卷积层的输出特征图，将当前卷积层的输出特征图作为目标输出特征图。

具体地，通过各个通道对应的卷积核，对反重塑特征图进行特征提取，得到各个卷积核对应的特征，由各个卷积核提取到的特征组成各个通道的目标特征图。计算各个通道的目标特征图的和，即对应位置的矩阵元素相加，得到输出特征图，该输出特征图为当前卷积层的输出特征图。

在一个实施例中，步骤S205，还包括：

步骤S2056，判断输出特征图的通道数是否与输入特征图的通道数一致。

步骤S2057，当一致时，将输入特征图对输出特征图的和，作为当前卷积层的目标输出特征图。

步骤S2058，当不一致时，对输入特征图进行卷积运算，得到与输出特征图的通道数一致的卷积特征图，将卷积特征图与输出特征图的和，作为目标输出特征图。

具体地，根据各个通道的卷积核和对应的额反重塑矩阵生成的输出特征图的各个通道矩阵，判断输出特征图是通道是否与输入特征图的通道数一致，当一致时，输入特征图与输出特征对应的位置的元素进行相加，得到目标输出特征图。当不一致时，对输入特征图进行卷积运算，得到与输出特征图具有相同通道的卷积特征图，计算卷积特征图与输出特征图相同位置的元素的和，得到目标输出特征图。通过判断输入特征图与输出特征图的通道数，根据通道数确定目标输出特征图，提高了目标输出特征图的准确性。

步骤S206，根据目标输出特征图，识别出图数据的识别结果。

具体地，将目标输出特征图输入已训练的卷积神经网络中的识别层，通过识别层识别目标输出特征图对应的候选识别结果，从候选识别结果中选择识别概率最大的候选识别结果，作为目标识别结果，将目标识别结果作为图数据对应的识别结果。如识别类型包括拍手、跳跃、牵手三个类型时，其中拍手对应的识别概率为0.89，跳跃对应的识别概率为0.01，牵手对应的识别概率为0.1时，则图数据对应的识别结果为拍手。

在一个实施例中，当已训练的卷积神经网络中包括当前卷积层，和当前卷积层的下一个卷积层时，将目标输出特征图作为下一个卷积层的输入特征图，将下一卷积层作为当前卷积层，进入获取输入已训练的卷积神经网络的当前卷积层的输入特征图，直至已训练的卷积神经网络中的各个卷积层都完成时，输出最后一个卷积层的目标输出特征图，将最后一个卷积层的目标输出特征图输入识别层，得到图书对应的识别结果。具有相同网络结构的卷积层的数据处理流程相同。

上述图数据识别方法，获取输入已训练的卷积神经网络的当前卷积层的输入特征图，输入特征图为根据图像数据生成的特征图，获取当前卷积层的第一偏置矩阵，其中第一偏置矩阵为生成已训练的卷积神经网络时生成的矩阵，根据输入特征图生成第二偏置矩阵，获取参考邻接矩阵，计算参考邻接矩阵、第一偏置矩阵和第二偏置矩阵的和，得到目标邻接矩阵，获取当前卷积层的卷积核，根据当前卷积层的卷积核、目标邻接矩阵和输入特征图生成目标输出特征图，根据目标输出特征图，识别出图数据的识别结果。对现有的固定的邻接矩阵基础上增加可调整的偏置矩阵，偏置矩阵中的第一偏置矩阵为根据训练需求得到的，故能够好的表征需求所对应的特征，第二偏置矩阵根据任务需求确定参数，且根据输入的图数据生成，能够表征各个图数据的特征，从图数据本身和需求同时确定的偏置矩阵，能够更好的标准各个图数据的本身的特征，从而提高已训练的卷积神经网络的识别准确率。在一个实施例中，步骤S206，包括：

步骤S2061，当当前卷积层为已训练的卷积神经网络中的最后一个卷积层时，判断多个目标输出特征图中是否存在需要合并的目标特征图。

步骤S2062，当存在时，合并需要合并的目标输出特征图，得到合并特征图。

步骤S2063，当合并特征图包含全部目标输出特征图时，对合并特征图进行识别，得到合并特征图对应的识别结果。

步骤S2064，当合并特征图包含全部目标输出特征图时，对合并特征图进行识别，得到合并特征图对应的识别结果，对未合并的目标输出特征图进行识别，得到未合并的目标输出特征图对应的识别结果。

步骤S2065，当不存在时，对各个目标输出特征图进行识别，得到各个目标输出特征图对应的识别结果。

具体地，当当前卷积层为为已训练的卷积神经网络中的最后一个卷积层时，表示卷积运算已经解释，提取到了图数据最终的目标输出特征图，根据最终的目标输出特征图进行识别之前，判断各个最终的目标输出特征图是否需要合并。需要进行合并是因为，有的行为需要多人才能完成，如牵手、打架等行为至少需要两个人才能够完成。对于个人可以完成的行为，则无需合并目标输出特征图，直接对目标输出特征图进行识别，将目标输出特征图的识别结果，作为图数据的识别结果。图数据的识别结果可以为一个或多个子识别结果，当图数据的输入包含个行为时，得到的识别结果包含多个行为，各个行为作为一个子识别结果。

当存在需要合并的目标输出特征图时，确定哪些目标输出特征图为需要合并的，如何合并的，将需要合并的目标输出特征图进行合并，直接对合并特征图，其中合并特征图可以为一个或多个，具体的合并结果与输入数据中的人体行为相关，如图数据中包括拍手、牵手、打架等多个类型的行为时，牵手和打架需要进行合并，则合并特征图包括两个。直接对合并特征图进行识别，得到合并特征图的识别结果。当存在部分合并，部分不合并的情况时，不合并的目标输出特征图直接进行识别，得到不合并的目标输出特征图对应的识别结果。

在一个具体的实施例中，参照图6，图6为一个实施例中卷积层的数据处理流程示意图。图中的fin为当前卷积层的输入特征图，fout为当前卷积层的输出特征图。输出特征图采用输入特征图的具体表示方式如公式(3)所示：

式中，Ak为参考邻接矩阵中的第k个邻接矩阵，Bk为偏置矩阵中的第k个邻接矩阵，Ck为偏置矩阵中的第k个邻接矩阵，softmax(S)表示对矩阵S 进行归一化一算，Wk为卷积核的第k个参数，Kv为卷积核的大小，卷积核的大小可以自定义，如可以设置Kv＝3或5。为第一降维函数，为第二降维函数。假设输入特征图的尺寸信息为Cin×T×N，其中Cin代表输入通道数，T代表图数据的帧数，N代表kinect定义的关节节点数，其中N＝25。对输入特征图进行重塑得到CinT×N的重塑特征图，偏置矩阵Bk为训练卷积神经网络后得到的矩阵，Bk与Ak具有相同的尺寸信息，即为N×N，计算计算第一偏置矩阵Bk、第二篇值矩阵CK与参考邻接矩阵Ak的和，得到目标邻接矩阵的各个通道的矩阵，计算目标邻接矩阵各个通道的矩阵与重塑特征图的乘积，得到各个通道的第二乘积矩阵，并对各个通道的第二乘积矩阵进行反重塑，得到反重塑矩阵，获取个卷积核Wk，其，通过各个通道的卷积核对反重塑矩阵进行卷积运算，得到各个通道对应的输出特征图。判断输出特征图是否与输入特征图的通道数是否一致，当不一致时，通过残差网络res，其中残差网络中的卷积核大小为1×1。将输入特征图调整致与输出特征图的通道数一致的矩阵，计算调整后的输入特征图与输出特征图的和，得到目标输出特征图。当一致时，计算输入特征图与输出特征图的和，得到目标输出特征图。根据目标输出特征图对各个图数据的行为进行识别，得到对应的识别结果。

当上述特征图的生过程为训练卷积神经网络的数据处理过程，且当各个图数据对应的识别与图数据的标签中的类别不一致时，根据预设损失函数各个图数据对应的损失值，根据梯度回传算法回传损失值，得到卷积层的回传值，根据回传值更新对应的卷积层的各个通道的卷积核w的参数、第一偏置矩阵B和用于计算第二偏置矩阵C的映射函数的参数。

当上述特征图的生过程为训练后的已训练的卷积神经网络的数据处理过程时，根据目标输出特征图识别的结果作为图数据对应的识别结果。将图数据输入已训练的卷积神经网路，卷积神经网络包含多个卷积层和识别层，各个卷积层包括卷积核和目标邻接矩阵，通过各个卷积层的目标邻接矩阵对图数据进行特征提取，得到对应的图像特征图集合，通过卷积核对图像特征集合进行卷积运算，得到各个卷积层的目标输出特征图，识别层的上一个卷积层的目标输出特征图作为识别层的输入数据，根据各个图数据的目标输出特征图，识别出对应的人体行为类型。

图5为一个实施例中图数据识别方法的流程示意图。应该理解的是，虽然图5的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图5中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图7所示，提供了一种特图生成装置200，包括：

数据获取模块201，用于获取输入已训练的卷积神经网络的当前卷积层的输入特征图，输入特征图为根据图像数据生成的特征图，获取当前卷积层的第一偏置矩阵，其中第一偏置矩阵为生成已训练的卷积神经网络时生成的矩阵。

第二偏置矩阵生成模块202，用于根据输入特征图生成第二偏置矩阵。

目标邻接矩阵生模块203，用于获取参考邻接矩阵，计算参考邻接矩阵、第一偏置矩阵和第二偏置矩阵的和，得到目标邻接矩阵。

目标输出特征图生成模块204，用于获取当前卷积层的卷积核，根据当前卷积层的卷积核、目标邻接矩阵和输入特征图生成目标输出特征图。

识别模块205，用于根据目标输出特征图，识别出图数据的识别结果。

在一个实施例中，第二偏置矩阵生成模块具体用于采用已训练的卷积神经网络中的降维函数对输入特征图进行降维，得到降维矩阵，归一化降维矩阵，得到归一化矩阵，归一化矩阵为第二偏置矩阵。

在一个实施例中，第二偏置矩阵生成模块具体用于根据降维函数中的第一降维函数对输入特征图的各个通道的矩阵进行降维，得到各个通道的第一降维矩阵，根据降维函数中的第二降维函数对输入特征图的各个通道的矩阵进行降维，得到各个通道的第二降维矩阵，其中，降维函数包括两个，输入特征图至少包括三个维度，第一维度为通道数，计算各个通道的第一降维矩阵和第二降维矩阵的乘积，得到各个通道的第一乘积矩阵，归一化各个通道的第一乘积矩阵，得到归一化矩阵对应的通道的矩阵。

在一个实施例中，上述图数据识别装置，还包括：

网络生成模块，用于生成已训练的卷积神经网络。其中网络生成模块，包括：

数据获取单元，用于获取包含多个训练图数据的训练集合，训练图数据携带标签信息。

特征提取单元，用于将训练图数据和标签信息输入初始卷积神经网络，通过初始卷积神经网络提取各个训练图数据的特征。

识别单元，用于根据各个训练图数据的特征，识别出各个训练图数据对应的识别结果。

损失值计算单元，用于按照预设损失函数计算各个训练图数据的识别结果和标签的损失值。

网络确定单元，用于当损失值小于或等于预设损失值时，得到已训练的卷积神经网络。

在一个实施例中，网络确定单元，还包括：

参数更新子单元，用于当损失值大于预设损失值时，根据损失值通过梯度回传算法更新初始卷积神经网络的网络参数。

网络确定子单元，用于采用更新了网络参数的初始卷积神经网络作为初始卷积神经网络，进入将训练图数据和标签信息输入初始卷积神经网络，直至按照预设损失函数计算各个训练图数据的识别结果和标签的损失值，小于或等于预设损失值时，得到已训练的卷积神经网络。

在一个实施例中，网络确定子单元具体通过梯度回传算法将损失值回传到任意一个卷积层时，得到各个卷积层的回传值，根据各个卷积层的回传值更新卷积层的网络参数，其中，初始卷积神经网络模型包括至少一个卷积层，网络参数包括初始降维函数的参数和初始偏置矩阵的参数。

图8示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图4中的终端110(或服务器120)。如图8所示，该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现图数据识别方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行图数据识别方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图8中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的特图生成装置可以实现为一种计算机程序的形式，计算机程序可在如图8所示的计算机设备上运行。计算机设备的存储器中可存储组成该特图生成装置的各个程序模块，比如，图7所示的数据获取模块201、第二偏置矩阵生成模块202、目标邻接矩阵生模块203、目标输出特征图生成模块204和识别模块205。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的图数据识别方法中的步骤。

例如，图8所示的计算机设备可以通过如图7所示的特图生成装置中的数据获取模块201执行获取输入已训练的卷积神经网络的当前卷积层的输入特征图，输入特征图为根据图像数据生成的特征图，获取当前卷积层的第一偏置矩阵，其中第一偏置矩阵为生成已训练的卷积神经网络时生成的矩阵。计算机设备可以通过第二偏置矩阵生成模块202执行根据输入特征图生成第二偏置矩阵。计算机设备可以通过目标邻接矩阵生模块203执行获取参考邻接矩阵，计算参考邻接矩阵、第一偏置矩阵和第二偏置矩阵的和，得到目标邻接矩阵。计算机设备可以通过目标输出特征图生成模块204执行获取当前卷积层的卷积核，根据当前卷积层的卷积核、目标邻接矩阵和输入特征图生成目标输出特征图。计算机设备可以通过识别模块205执行根据目标输出特征图，识别出图数据的识别结果。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：获取输入已训练的卷积神经网络的当前卷积层的输入特征图，输入特征图为根据图像数据生成的特征图，获取当前卷积层的第一偏置矩阵，其中第一偏置矩阵为生成已训练的卷积神经网络时生成的矩阵，根据输入特征图生成第二偏置矩阵，获取参考邻接矩阵，计算参考邻接矩阵、第一偏置矩阵和第二偏置矩阵的和，得到目标邻接矩阵，获取当前卷积层的卷积核，根据当前卷积层的卷积核、目标邻接矩阵和输入特征图生成目标输出特征图，根据目标输出特征图，识别出图数据的识别结果。

在一个实施例中，根据输入特征图生成的第二偏置矩阵，包括：采用已训练的卷积神经网络中的降维函数对输入特征图进行降维，得到降维矩阵，归一化降维矩阵，得到归一化矩阵，归一化矩阵为第二偏置矩阵。

在一个实施例中，降维函数包括两个，输入特征图至少包括三个维度，其中，第一维度为通道数，包括：根据降维函数中的第一降维函数对输入特征图的各个通道的矩阵进行降维，得到各个通道的第一降维矩阵，根据降维函数中的第二降维函数对输入特征图的各个通道的矩阵进行降维，得到各个通道的第二降维矩阵，计算各个通道的第一降维矩阵和第二降维矩阵的乘积，得到各个通道的第一乘积矩阵，归一化各个通道的第一乘积矩阵，得到归一化矩阵对应的通道的矩阵。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：生成已训练的卷积神经网络的步骤，包括：获取包含多个训练图数据的训练集合，训练图数据携带标签信息，将训练图数据和标签信息输入初始卷积神经网络，通过初始卷积神经网络提取各个训练图数据的特征，根据各个训练图数据的特征，识别出各个训练图数据对应的识别结果，按照预设损失函数计算各个训练图数据的识别结果和标签的损失值，当损失值小于或等于预设损失值时，得到已训练的卷积神经网络。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：当损失值大于预设损失值时，根据损失值通过梯度回传算法更新初始卷积神经网络的网络参数，采用更新了网络参数的初始卷积神经网络作为初始卷积神经网络，进入将训练图数据和标签信息输入初始卷积神经网络，直至按照预设损失函数计算各个训练图数据的识别结果和标签的损失值，小于或等于预设损失值时，得到已训练的卷积神经网络。

在一个实施例中，初始卷积神经网络模型包括至少一个卷积层，卷积层中包括初始偏置矩阵和初始降维函数，根据损失值通过梯度回传算法更新初始卷积神经网络的网络参数，包括：通过梯度回传算法将损失值回传到任意一个卷积层时，得到各个卷积层的回传值，根据各个卷积层的回传值更新初始降维函数的参数和初始偏置矩阵的参数。

在一个实施例中，根据目标输出特征图，识别出图数据对应的识别结果，包括：当当前卷积层为已训练的卷积神经网络中的最后一个卷积层时，判断多个目标输出特征图中是否存在需要合并的目标特征图，当存在时，合并需要合并的目标输出特征图，得到合并特征图，当合并特征图包含全部目标输出特征图时，对合并特征图进行识别，得到合并特征图对应的识别结果，当合并特征图包含全部目标输出特征图时，对合并特征图进行识别，得到合并特征图对应的识别结果，对未合并的目标输出特征图进行识别，得到未合并的目标输出特征图对应的识别结果，当不存在时，对各个目标输出特征图进行识别，得到各个目标输出特征图对应的识别结果。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取输入已训练的卷积神经网络的当前卷积层的输入特征图，输入特征图为根据图像数据生成的特征图，获取当前卷积层的第一偏置矩阵，其中第一偏置矩阵为生成已训练的卷积神经网络时生成的矩阵，根据输入特征图生成第二偏置矩阵，获取参考邻接矩阵，计算参考邻接矩阵、第一偏置矩阵和第二偏置矩阵的和，得到目标邻接矩阵，获取当前卷积层的卷积核，根据当前卷积层的卷积核、目标邻接矩阵和输入特征图生成目标输出特征图，根据目标输出特征图，识别出图数据的识别结果。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：生成已训练的卷积神经网络的步骤，包括：获取包含多个训练图数据的训练集合，训练图数据携带标签信息，将训练图数据和标签信息输入初始卷积神经网络，通过初始卷积神经网络提取各个训练图数据的特征，根据各个训练图数据的特征，识别出各个训练图数据对应的识别结果，按照预设损失函数计算各个训练图数据的识别结果和标签的损失值，当损失值小于或等于预设损失值时，得到已训练的卷积神经网络。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：当损失值大于预设损失值时，根据损失值通过梯度回传算法更新初始卷积神经网络的网络参数，采用更新了网络参数的初始卷积神经网络作为初始卷积神经网络，进入将训练图数据和标签信息输入初始卷积神经网络，直至按照预设损失函数计算各个训练图数据的识别结果和标签的损失值，小于或等于预设损失值时，得到已训练的卷积神经网络。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本发明的具体实施方式，使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims

一种图数据识别方法，其特征在于，所述方法包括：获取输入已训练的卷积神经网络的当前卷积层的输入特征图，所述输入特征图为根据图数据生成的特征图；

获取所述当前卷积层的第一偏置矩阵，其中所述第一偏置矩阵为生成所述已训练的卷积神经网络时生成的矩阵；

根据所述输入特征图生成第二偏置矩阵；

获取参考邻接矩阵，计算所述参考邻接矩阵、所述第一偏置矩阵和所述第二偏置矩阵的和，得到目标邻接矩阵；

获取所述当前卷积层的卷积核；

根据所述当前卷积层的卷积核、所述目标邻接矩阵和所述输入特征图生成目标输出特征图；

根据所述目标输出特征图，识别出所述图数据对应的识别结果。
根据权利要求1所时述的方法，其特征在于，所述根据所述输入特征图生成的第二偏置矩阵，包括：采用所述已训练的卷积神经网络中的降维函数对所述输入特征图进行降维，得到降维矩阵；

归一化所述降维矩阵，得到归一化矩阵，所述归一化矩阵为所述第二偏置矩阵。
根据权利要求2所述的方法，其特征在于，所述降维函数包括两个，所述输入特征图至少包括三个维度，其中，第一维度为通道数，所述方法包括：根据所述降维函数中的第一降维函数对所述输入特征图的各个通道的矩阵进行降维，得到各个通道的第一降维矩阵；

根据所述降维函数中的第二降维函数对所述输入特征图的各个通道的矩阵进行降维，得到各个所述通道的第二降维矩阵；

计算各个通道的所述第一降维矩阵和第二降维矩阵的乘积，得到各个通道的第一乘积矩阵；

归一化各个通道的第一乘积矩阵，得到所述归一化矩阵对应的通道的矩阵。
根据权利要求1所述的方法，其特征在于，生成所述已训练的卷积神经网络的步骤，包括：获取包含多个训练图数据的训练集合，所述训练图数据携带标签信息；

将所述训练图数据和所述标签信息输入初始卷积神经网络，通过所述初始卷积神经网络提取各个所述训练图数据的特征；

根据各个所述训练图数据的特征，识别出各个所述训练图数据对应的识别结果；

按照预设损失函数计算各个所述训练图数据的识别结果和所述标签的损失值；

当所述损失值小于或等于预设损失值时，得到所述已训练的卷积神经网络。
根据权利要求4所述的方法，其特征在于，所述方法还包括：当所述损失值大于所述预设损失值时，根据所述损失值通过梯度回传算法更新所述初始卷积神经网络的网络参数；

采用更新了网络参数的初始卷积神经网络作为所述初始卷积神经网络，进入将所述训练图数据和所述标签信息输入初始卷积神经网络，直至所述按照预设损失函数计算各个所述训练图数据的识别结果和所述标签的损失值，小于或等于所述预设损失值时，得到所述已训练的卷积神经网络。
根据权利要求5所述的方法，其特征在于，所述初始卷积神经网络模型包括至少一个卷积层，所述卷积层中包括初始偏置矩阵和初始降维函数，所述根据所述损失值通过梯度回传算法更新所述初始卷积神经网络的网络参数，包括：通过所述梯度回传算法将所述损失值回传到任意一个所述卷积层时，得到各个所述卷积层的回传值；

根据各个所述卷积层的回传值更新所述卷积层的网络参数，所述网络参数包括初始降维函数的参数和所述初始偏置矩阵的参数。
根据权利要求1至6中任一项所述的方法，其特征在于，所述根据所述目标输出特征图，识别出所述图数据对应的识别结果，包括：当所述当前卷积层为所述已训练的卷积神经网络中的最后一个卷积层时，判断多个所述目标输出特征图中是否存在需要合并的目标特征图；

当存在时，合并需要合并的所述目标输出特征图，得到合并特征图；

当所述合并特征图包含全部所述目标输出特征图时，对所述合并特征图进行识别，得到所述合并特征图对应的识别结果；

当所述合并特征图包含全部所述目标输出特征图时，对所述合并特征图进行识别，得到所述合并特征图对应的识别结果，对未合并的所述目标输出特征图进行识别，得到所述未合并的目标输出特征图对应的识别结果；

当不存在时，对各个所述目标输出特征图进行识别，得到各个所述目标输出特征图对应的识别结果。
一种图数据识别装置，其特征在于，所述装置包括：数据获取模块，用于获取输入已训练的卷积神经网络的当前卷积层的输入特征图，所述输入特征图为根据图像数据生成的特征图，获取所述当前卷积层的第一偏置矩阵，其中所述第一偏置矩阵为生成所述已训练的卷积神经网络时生成的矩阵；

第二偏置矩阵生成模块，用于根据所述输入特征图生成第二偏置矩阵；

目标邻接矩阵生模块，用于获取参考邻接矩阵，计算所述参考邻接矩阵、所述第一偏置矩阵和所述第二偏置矩阵的和，得到目标邻接矩阵；

目标输出特征图生成模块，用于获取所述当前卷积层的卷积核，根据所述当前卷积层的卷积核、所述目标邻接矩阵和所述输入特征图生成目标输出特征图；

识别模块，用于根据所述目标输出特征图，识别出所述图数据的识别结果。
一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。