WO2018113261A1

WO2018113261A1 - 目标对象的识别方法和装置、机器人

Info

Publication number: WO2018113261A1
Application number: PCT/CN2017/092045
Authority: WO
Inventors: 刘若鹏; 钱贝贝; 赵金玉
Original assignee: 深圳光启合众科技有限公司; 深圳光启创新技术有限公司
Priority date: 2016-12-22
Filing date: 2017-07-06
Publication date: 2018-06-28
Also published as: CN108229263B; CN108229263A

Abstract

本发明公开了一种目标对象的识别方法和装置、机器人。其中，该方法包括：获取待识别的目标对象；通过预设网络模型对待识别的目标对象进行特征提取，得到目标对象的第一特征和第二特征，其中，第一特征为目标对象的特定特征，第二特征为对第一特征和目标对象的基本特征进行特征提取得到的特征；通过预设网络模型对第一特征和第二特征进行分类，得到目标对象的识别结果。本发明解决了现有技术中的基于深度学习的网络模型，网络不收敛或者收敛慢，导致目标对象的识别时间长，鲁棒性低的技术问题。

Description

发明名称：目标对象的识别方法和装置、机器人技术领域

[0001] 本发明涉及目标识别领域，具体而言，涉及一种目标对象的识别方法和装置、机器人。

背景技术

[0002] 当前，深度学习的训练都是在输入端输入样本，末端给出样本标签（分类网络

) 或者是代价函数（回归网络），训练过程具体如下：

[0003] 1) 使用自下上升非监督学习：

[0004] 具体的，先用无标定数据训练第一层，训练吋先学习第一层的参数（这一层可以看作是得到一个使得输出和输入差别最小的三层神经网络的隐层），由于模型 capacity的限制以及稀疏性约束，使得得到的模型能够学习到数据本身的结构，从而得到比输入更具有表示能力的特征；在学习得到第 n-1层后，将 n-1层的输出作为第 n层的输入，训练第 n层，由此分别得到各层的参数；这个过程可以看作是 feature learning过禾呈

[0005] 2) 自顶向下的监督学习：

[0006] 基于第一步得到的各层参数进一步 fine-tune整个多层模型的参数，从顶层计算梯度，进行微调参数。

[0007] 由于在现有技术中的深度学习的网络模型在学习的过程中，网络首先进行前向传输，直到最后一层，然后再计算梯度，反向传输，直到第一层，传输过程由网络进行自动更新参数。然而，由于参数是自动进行，因而会存在网络不收敛或者收敛慢等一些问题。

技术问题

[0008] 针对现有技术中的基于深度学习的网络模型，网络不收敛或者收敛慢，导致目标对象的识别吋间长，鲁棒性低的问题，目前尚未提出有效的解决方案。

问题的解决方案

技术解决方案 [0009] 本发明实施例提供了一种目标对象的识别方法和装置、机器人，以至少解决现有技术中的基于深度学习的网络模型，网络不收敛或者收敛慢，导致目标对象的识别吋间长，鲁棒性低的技术问题。

[0010] 根据本发明实施例的一个方面，提供了一种目标对象的识别方法，包括：获取待识别的目标对象；通过预设网络模型对待识别的目标对象进行特征提取，得到目标对象的第一特征和第二特征，其中，第一特征为目标对象的特定特征，第二特征为对第一特征和目标对象的基本特征进行特征提取得到的特征；通过预设网络模型对第一特征和第二特征进行分类，得到目标对象的识别结果。

[0011] 进一步地，预设网络模型包括：多个卷积层、第一预设卷积层、第二预设卷积层、第一输出层和第二输出层，其中，多个卷积层依次连接，第一预设卷积层与多个卷积层连接，第一输出层与第一预设卷积层连接，第二预设卷积层与多个卷积层连接，第二输出层与第二预设卷积层连接。

[0012] 进一步地，通过预设网络模型对待识别的目标对象进行特征提取，得到目标对象的第一特征和第二特征包括：通过多个卷积层对待识别的目标对象进行特征提取，得到目标对象的基本特征；通过第一预设卷积层对目标对象的基本特征进行特征提取，得到目标对象的第一特征；通过第二预设卷积层对基本特征和第一特征进行特征提取，得到目标对象的第二特征。

[0013] 进一步地，第二预设卷积层包括：第一子卷积层和第二子卷积层，第一子卷积层与多个卷积层连接，第二子卷积层与第一预设卷积层和第一子卷积层连接，其中，通过第二预设卷积层对基本特征和第一特征进行特征提取，得到目标对象的第二特征包括：通过第一子卷积层对基本特征进行特征提取，得到第三特征，其中，第三特征为目标对象的基本特征中除特定特征之外的其他特征；将第三特征和第一特征进行合并，得到合并后的特征；通过第二子卷积层对合并后的特征进行特征提取，得到第二特征。

[0014] 进一步地，通过预设网络模型对第一特征和第二特征进行分类，得到目标对象的识别结果包括：通过第一输出层对第一特征进行分类，得到第一识别结果；通过第二输出层对第二特征进行分类，得到第二识别结果；将第一识别结果和第二识别结果进行加权，得到目标对象的识别结果。 [0015] 进一步地，预设网络模型还包括：多个第一全连接层和多个第二全连接层，其中，多个第一全连接层连接在第一预设卷积层和第一输出层之间，多个第二全连接层连接在第二预设卷积层和第二输出层之间。

[0016] 进一步地，在通过预设网络模型对第一特征和第二特征进行分类，得到目标对象的识别结果之前，上述方法还包括：通过多个第一全连接层对第一特征进行内积运算，得到处理后的第一特征；通过多个第二全连接层对第二特征进行内积运算，得到处理后的第二特征；通过预设网络模型对处理后的第一特征和处理后的第二特征进行分类，得到目标对象的识别结果。

[0017] 根据本发明实施例的另一方面，还提供了一种目标对象的识别装置，包括：获取单元，用于获取待识别的目标对象；提取单元，用于通过预设网络模型对待识别的目标对象进行特征提取，得到目标对象的第一特征和第二特征，其中，第一特征为目标对象的特定特征，第二特征为对第一特征和目标对象的基本特征进行特征提取得到的特征；分类单元，用于通过预设网络模型对第一特征和第二特征进行分类，得到目标对象的识别结果。

[0018] 进一步地，预设网络模型包括：多个卷积层、第一预设卷积层、第二预设卷积层、第一输出层和第二输出层，其中，多个卷积层依次连接，第一预设卷积层与多个卷积层连接，第一输出层与第一预设卷积层连接，第二预设卷积层与多个卷积层连接，第二输出层与第二预设卷积层连接。

[0019] 进一步地，提取单元包括：第一提取模块，用于通过多个卷积层对待识别的目标对象进行特征提取，得到目标对象的基本特征；第二提取模块，用于通过第一预设卷积层对目标对象的基本特征进行特征提取，得到目标对象的第一特征；第三提取模块，用于通过第二预设卷积层对基本特征和第一特征进行特征提取，得到目标对象的第二特征。

[0020] 进一步地，第二预设卷积层还包括：第一子卷积层和第二子卷积层，第一子卷积层与多个卷积层连接，第二子卷积层与第一预设卷积层和第一子卷积层连接

，其中，第三提取模块包括：第一提取子模块，用于通过第一子卷积层对基本特征进行特征提取，得到第三特征，其中，第三特征为目标对象的基本特征中除特定特征之外的其他特征；合并子模块，用于将第三特征和第一特征进行合并，得到合并后的特征；第二提取子模块，用于通过第二子卷积层对合并后的特征进行特征提取，得到第二特征。

[0021] 进一步地，分类单元包括：第一分类模块，用于通过第一输出层对第一特征进行分类，得到第一识别结果；第二分类模块，用于通过第二输出层对第二特征进行分类，得到第二识别结果；加权模块，用于将第一识别结果和第二识别结果进行加权，得到目标对象的识别结果。

[0022] 进一步地，预设网络模型还包括：多个第一全连接层和多个第二全连接层，其中，多个第一全连接层连接在第一预设卷积层和第一输出层之间，多个第二全连接层连接在第二预设卷积层和第二输出层之间。

[0023] 进一步地，上述装置还包括：第一运算单元，用于通过多个第一全连接层对第一特征进行内积运算，得到处理后的第一特征；第二运算单元，用于通过多个第二全连接层对第二特征进行内积运算，得到处理后的第二特征；分类单元还用于通过预设网络模型对处理后的第一特征和处理后的第二特征进行分类，得到目标对象的识别结果。

[0024] 根据本发明实施例的另一方面，还提供了一种机器人，包括：上述实施例中任意一项的目标对象的识别装置。

发明的有益效果

有益效果

[0025] 在本发明实施例中，获取待识别的目标对象，通过预设网络模型对待识别的目标对象进行特征提取，得到目标对象的第一特征和第二特征，通过预设网络模型对第一特征和第二特征进行分类，得到目标对象的识别结果，从而实现对目标对象进行识别的目的。容易注意到的是，由于可以通过预设网络模型提取目标对象的第一特征和第二特征，并对这些特征进行组合，从而能够迫使预设网络模型快速收敛，解决了现有技术中的基于深度学习的网络模型，网络不收敛或者收敛慢，导致目标对象的识别吋间长，鲁棒性低的技术问题。因此，通过本发明上述实施例提供的方案，通过预设网络模型对目标对象进行识别，可以达到加快预设网络模型的训练吋间，缩短目标识别吋间，避免预设网络模型的过拟合，提高目标对象识别的鲁棒性的效果。对附图的简要说明

附图说明

[0026] 此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

[0027] 图 1是根据本发明实施例的一种目标对象的识别方法的流程图；

[0028] 图 2是根据本发明实施例的一种可选的卷积神经网络的示意图；以及

[0029] 图 3是根据本发明实施例的一种目标对象的识别装置的示意图。

本发明的实施方式

[0030] 为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

[0031] 需要说明的是，本发明的说明书和权利要求书及上述附图中的术语"第一"、 " 第二"等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语"包括"和"具有"以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

[0032] 实施例 1

[0033] 根据本发明实施例，提供了一种目标对象的识别方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。 [0034] 图 1是根据本发明实施例的一种目标对象的识别方法的流程图，如图 1所示，该方法包括如下步骤：

[0035] 步骤 S 102，获取待识别的目标对象。

[0036] 具体的，在人脸识别领域中，上述的目标对象可以是人脸，上述的待识别的目标对象可以是包含人脸信息的图像数据。

[0037] 步骤 S104，通过预设网络模型对待识别的目标对象进行特征提取，得到目标对象的第一特征和第二特征，其中，第一特征为目标对象的特定特征，第二特征为对第一特征和目标对象的基本特征进行特征提取得到的特征。

[0038] 具体的，上述的预设网络模型可以是卷积神经网络（Convolutional Neural

Network, 简写为 CNN) ；上述的特定特征可以是目标对象的部分重要特征，例如，在人脸识别领域中，人的眼睛、鼻子、眉毛、耳朵、嘴巴等特征；在人脸识别领域中，上述的基本特征可以包括：边缘、角点、颜色等特征。

[0039] 步骤 S106，通过预设网络模型对第一特征和第二特征进行分类，得到目标对象的识别结果。

[0040] 在一种可选的方案中，在需要对图像数据中的人脸进行识别的情况下，可以将待识别的图像数据输入至训练好的 CNN网络中，通过 CNN网络，可以对图像数据中的人脸进行特征提取，得到人脸的特定特征和第二特征，然后通过 CNN网络对提取到的部分重要特征和第二特征进行处理，计算得到每种特征对应的 loss 值，然后根据 loss值，即可得到人脸识别结果；或者给出每种特征对应的分类标签，即可得到人脸识别结果。

[0041] 采用本发明上述实施例，获取待识别的目标对象，通过预设网络模型对待识别的目标对象进行特征提取，得到目标对象的第一特征和第二特征，通过预设网络模型对第一特征和第二特征进行分类，得到目标对象的识别结果，从而实现对目标对象进行识别的目的。容易注意到的是，由于可以通过预设网络模型提取目标对象的第一特征和第二特征，并对这些特征进行组合，从而能够迫使预设网络模型快速收敛，解决了现有技术中的基于深度学习的网络模型，网络不收敛或者收敛慢，导致目标对象的识别吋间长，鲁棒性低的技术问题。因此，通过本发明上述实施例提供的方案，通过预设网络模型对目标对象进行识别，可以达到加快预设网络模型的训练吋间，缩短目标识别吋间，避免预设网络模型的过拟合，提高目标对象识别的鲁棒性的效果。

[0042] 可选地，在本发明上述实施例中，预设网络模型包括：多个卷积层、第一预设卷积层、第二预设卷积层、第一输出层和第二输出层，其中，多个卷积层依次连接，第一预设卷积层与多个卷积层连接，第一输出层与第一预设卷积层连接，第二预设卷积层与多个卷积层连接，第二输出层与第二预设卷积层连接。

[0043] 具体的，上述的预设网络模型可以是 CNN网络，可以在 CNN网络的某一个卷积层中加入一个卷积层，用于提取目标对象的特定特征；上述的第一输出层和第二输出层可以是 SoftmaxWithLoss层，通过代价函数来计算特征的 loss值。

[0044] 此处需要说明的是，上述的第一预设卷积层的数量可以根据特征需要进行设定，可以在 CNN网络的不同卷积层引入多个卷积层，以便网络可以迅速收敛，并学习到目标对象的特定特征，而新加入的第一预设卷积层不会影响最终的目标对象的识别结果。

[0045] 可选地，在本发明上述实施例中，步骤 S104，通过预设网络模型对的目标对象的待识别数据进行特征提取，得到目标对象的第一特征和第二特征包括：

[0046] 步骤 S1042, 通过多个卷积层对待识别的目标对象进行特征提取，得到目标对象的基本特征。

[0047] 步骤 S1044, 通过第一预设卷积层对目标对象的基本特征进行特征提取，得到目标对象的第一特征。

[0048] 步骤 S 1046，通过第二预设卷积层对基本特征和第一特征进行特征提取，得到目标对象的第二特征。

[0049] 在一种可选的方案中，在人脸识别领域中，可以构建一个四层网络，即四层卷积层提取人脸的基本特征，然后在第五层的卷积网络中可以增加一个第一预设卷积层，用于提取人脸的特定特征，第五层的卷积网络中的另一个第二预设卷积层可以对基本特征和特定特征进行提取，得到人脸的第二特征。

[0050] 可选地，在本发明上述实施例中，第二预设卷积层包括：第一子卷积层和第二子卷积层，第一子卷积层与多个所述卷积层连接，第二子卷积层与第一预设卷积层和第一子卷积层连接，其中，步骤 S 1046，通过第二预设卷积层对基本特征和第一特征进行特征提取，得到目标对象的第二特征包括：

[0051] 步骤 S10462, 通过第一子卷积层对基本特征进行特征提取，得到第三特征，其中，第三特征为目标对象的基本特征中除特定特征之外的其他特征。

[0052] 具体的，上述的第三特征可以是目标对象的其他特征，也可以包括特定特征。

[0053] 步骤 S 10464，将第三特征和第一特征进行合并，得到合并后的特征。

[0054] 步骤 S 10466，通过第二子卷积层对合并后的特征进行特征提取，得到第二特征

[0055] 在一种可选的方案中，在人脸识别领域中，在四层卷积层提取到人脸的基本特征之后，可以将第五层的卷积网络分为两个卷积层模块，一个卷积层模块用于提取人脸的特定特征（即上述的第一预设卷积层），另一个模块用于提取人脸的其他特征（即上述的第一子卷积层），在第六层（即上述的第二子卷积层），可以将上述两个模块提取到的特定特征和其他特征进行合并，再进行特征提取，得到上述的第二特征。

[0056] 可选地，在本发明上述实施例中，步骤 S106，通过预设网络模型对第一特征和第二特征进行分类，得到目标对象的识别结果包括：

[0057] 步骤 S1062, 通过第一输出层对第一特征进行分类，得到第一识别结果。

[0058] 在一种可选的方案中，将通过四层卷积层和第一预设卷积层提取到的特定特征输入 SoftmaxWithLoss层， SoftmaxWithLoss层作为部分特征的代价函数计算 loss 值，得到第一识别结果。

[0059] 步骤 S1064, 通过第二输出层对第二特征进行分类，得到第二识别结果。

[0060] 在一种可选的方案中，将通过四层卷积层和第二预设卷积层提取到的第二特征输入 SoftmaxWithLoss层， SoftmaxWithLoss层作为人脸识别的代价函数计算 loss 值，得到第二识别结果。

[0061] 步骤 S1066 , 将第一识别结果和第二识别结果进行加权，得到目标对象的识别结果。

[0062] 在一种可选的方案中，在确定网络的最终 loss值吋，可以对两个 loss值（即上述的第一识别结果和第二识别结果）进行加权求和，得到最后整个网络的 loss值 ( 即上述的目标对象的识别结果）。 [0063] 通过上述步骤 S1062至步骤 S1066 , 可以对网络自主学习特征和部分模块特征进行权衡，以便对网络更好地进行调节。

[0064] 可选地，在本发明上述实施例中，预设网络模型还包括：多个第一全连接层和多个第二全连接层，其中，多个第一全连接层连接在第一预设卷积层和第一输出层之间，多个第二全连接层连接在第二预设卷积层和第二输出层之间。

[0065] 具体的，可以在第一预设卷积层或第二预设卷积层之后分别连接 2个全连接层

，然后接入 SoftmaxWithLoss层。

[0066] 此处需要说明的是，第一预设卷积层之后的全连接层仅用于网络训练，在网络训练好之后，将包含人脸信息的图片输入至 CNN网络中，得到最终的目标位置

[0067] 可选地，在本发明上述实施例中，在步骤 S106，通过预设网络模型对第一特征和第二特征进行分类，得到目标对象的识别结果之前，该方法还包括：

[0068] 步骤 S108，通过多个第一全连接层对第一特征进行内积运算，得到处理后的第一特征。

[0069] 步骤 S110，通过多个第二全连接层对第二特征进行内积运算，得到处理后的第二特征。

[0070] 步骤 S 112，通过预设网络模型对处理后的第一特征和处理后的第二特征进行分类，得到目标对象的识别结果。

[0071] 在一种可选的方案中，在人脸识别领域中，在通过四层卷积层和第一预设卷积层得到人脸的特定特征之后，可以输入 2个全连接层（即上述的第一全连接层），最后接入 SoftmaxWithLoss层作为部分特征的代价函数计算 loss值；在通过四层卷积层和第二预设卷积层得到人脸的第二特征之后，可以输入 2个全连接层（即上述的第二全连接层），最后 SoftmaxWithLoss作为人脸识别的代价函数得到人脸识别的 loss值，然后对两个 loss值进行加权求和，得到最后整个 CNN网络的 loss 值。

[0072] 图 2是根据本发明实施例的一种可选的卷积神经网络的示意图，下面结合如图 2 所示的卷积神经网络，对人脸识别领域的识别方法进行详细说明，如图 2所示，首先我们构建一个人脸识别的卷积神经网络，构建四层网络（如图 2中的 convl-c onv4) 提取人脸的基本特征（如图 2中的 _COnv4) ，像边缘、角点、颜色等等信息，然后将第 5层的卷积网络中分为 2个模块，一个模块为 _COnv5_l，用于提取部分特征（如图 2中的 _COnv5_l) ，如人的眼睛、鼻子、眉毛、耳朵、嘴巴等信息，具体来说，在 conv5_l后面接 2个全连接层（如图 2中的 fc6和 fc7_l) ，最后接入 Soft maxWithLoss层（如图 2中的 softmaxl) 作为部分特征的代价函数计算 loss值（如图 2的 lossl) 。另一个模块 _COnv5_2完成其他特征提取（也可能包括部分特征）

(如图 2中的 _COnv5_2) 。在 _COnv6层，将上述两个模块进行合并，再提取特征 ( 如图 2中的 conv6) ，送入更上一层的模块（如图 2中的 fc7_2和 fc8) ，最后同样采用 SoftmaxWithLoss (如图 2中的 softmax2) 作为人脸识别的代价函数得到人脸识别的 loss值（如图 2的 loss2) 。在确定网络的最终 loss值吋，我们对两个 loss进行加权求和，得到最后整个网络的 loss值。 _COnv5_l后面的全连接层仅用于训练，在网络训练好之后，将图片输入 CNN网络得到最终的目标位置（如图 2中的 po s所示）。

[0073] 通过上述方案，新加入的模块在卷积神经网络的训练阶段能快速收敛，避免网络过拟合。由于网络迫使待识别的目标具有某些必须的特征，因此，在采用上述的卷积神经网络进行人脸识别的识别阶段系统更加鲁棒。上述卷积神经网络不仅仅可以用到目标识别领域，还可以运用到自然语言处理或者图像检索领域

[0074] 实施例 2

[0075] 根据本发明实施例，提供了一种目标对象的识别装置的实施例。

[0076] 图 3是根据本发明实施例的一种目标对象的识别装置的示意图，如图 3所示，该装置包括：

[0077] 获取单元 31，用于获取待识别的目标对象。

[0078] 具体的，在人脸识别领域中，上述的目标对象可以是人脸，上述的待识别的目标对象可以是包含人脸信息的图像数据。

[0079] 提取单元 33，用于通过预设网络模型对待识别的目标对象进行特征提取，得到目标对象的第一特征和第二特征，其中，第一特征为目标对象的特定特征，第二特征为对第一特征和目标对象的基本特征进行特征提取得到的特征。 [0080] 具体的，上述的预设网络模型可以是卷积神经网络（Convolutional Neural

[0081] 分类单元 35，用于通过预设网络模型对第一特征和第二特征进行处理，得到目标对象的识别结果。

[0082] 在一种可选的方案中，在需要对图像数据中的人脸进行识别的情况下，可以将待识别的图像数据输入至训练好的 CNN网络中，通过 CNN网络，可以对图像数据中的人脸进行特征提取，得到人脸的特定特征和第二特征，然后通过 CNN网络对提取到的部分重要特征和第二特征进行处理，计算得到每种特征对应的 loss 值，然后根据 loss值，即可得到人脸识别结果；或者给出每种特征对应的分类标签，即可得到人脸识别结果。

[0083] 采用本发明上述实施例，获取单元获取待识别的目标对象，提取单元通过预设网络模型对待识别的目标对象进行特征提取，得到目标对象的第一特征和第二特征，第一处理单元通过预设网络模型对第一特征和第二特征进行分类，得到目标对象的识别结果，从而实现对目标对象进行识别的目的。容易注意到的是，由于可以通过预设网络模型提取目标对象的第一特征和第二特征，并对这些特征进行组合，从而能够迫使预设网络模型快速收敛，解决了现有技术中的基于深度学习的网络模型，网络不收敛或者收敛慢，导致目标对象的识别吋间长，鲁棒性低的技术问题。因此，通过本发明上述实施例提供的方案，通过预设网络模型对目标对象进行识别，可以达到加快预设网络模型的训练吋间，缩短目标识别吋间，避免预设网络模型的过拟合，提高目标对象识别的鲁棒性的效果。

[0084] 可选地，在本发明上述实施例中，预设网络模型包括：多个卷积层、第一预设卷积层、第二预设卷积层、第一输出层和第二输出层，其中，多个卷积层依次连接，第一预设卷积层与多个卷积层连接，第一输出层与第一预设卷积层连接，第二预设卷积层与多个卷积层连接，第二输出层与第二预设卷积层连接。

[0085] 具体的，上述的预设网络模型可以是 CNN网络，可以在 CNN网络的某一个卷积层中加入一个卷积层，用于提取目标对象的特定特征；上述的第一输出层和第二输出层可以是 SoftmaxWithLoss层，通过代价函数来计算特征的 loss值。

[0086] 此处需要说明的是，上述的第一预设卷积层的数量可以根据特征需要进行设定，可以在 CNN网络的不同卷积层引入多个卷积层，以便网络可以迅速收敛，并学习到目标对象的特定特征，而新加入的第一预设卷积层不会影响最终的目标对象的识别结果。

[0087] 可选地，在本发明上述实施例中，提取单元包括：

[0088] 第一提取模块，用于通过多个卷积层对待识别的目标对象进行特征提取，得到目标对象的基本特征。

[0089] 第二提取模块，用于通过第一预设卷积层对目标对象的基本特征进行特征提取

，得到目标对象的第一特征。

[0090] 第三提取子模块，用于通过第二预设卷积层对基本特征和第一特征进行特征提取，得到目标对象的第二特征。

[0091] 在一种可选的方案中，在人脸识别领域中，可以构建一个四层网络，即四层卷积层提取人脸的基本特征，然后在第五层的卷积网络中可以增加一个第一预设卷积层，用于提取人脸的特定特征，第五层的卷积网络中的另一个第二预设卷积层可以对基本特征和特定特征进行提取，得到人脸的第二特征。

[0092] 可选地，在本发明上述实施例中，第二预设卷积层包括：第一子卷积层和第二子卷积层，第一子卷积层与多个所述卷积层连接，第二子卷积层与第一预设卷积层和第一子卷积层连接，其中，第三提取模块包括：

[0093] 第一提取子模块，用于通过第一子卷积层对基本特征进行特征提取，得到第三特征，其中，第三特征为目标对象的基本特征中除特定特征之外的其他特征。

[0094] 具体的，上述的第三特征可以是目标对象的其他特征，也可以包括特定特征。

[0095] 合并子模块，用于将第三特征和第一特征进行合并，得到合并后的特征。

[0096] 第二提取子模块，用于通过第二子卷积层对合并后的特征进行特征提取，得到第二特征。

[0097] 在一种可选的方案中，在人脸识别领域中，在四层卷积层提取到人脸的基本特征之后，可以将第五层的卷积网络分为两个卷积层模块，一个卷积层模块用于提取人脸的特定特征（即上述的第一预设卷积层），另一个模块用于提取人脸的其他特征（即上述的第一子卷积层），在第六层（即上述的第二子卷积层），可以将上述两个模块提取到的特定特征和其他特征进行合并，再进行特征提取，得到上述的第二特征。

[0098] 可选地，在本发明上述实施例中，分类单元包括：

[0099] 第一分类模块，用于通过第一输出层对第一特征进行分类，得到第一识别结果

[0100] 在一种可选的方案中，将通过四层卷积层和第一预设卷积层提取到的特定特征输入 SoftmaxWithLoss层， SoftmaxWithLoss层作为部分特征的代价函数计算 loss 值，得到第一识别结果。

[0101] 第二分类模块，用于通过第二输出层对第二特征进行分类，得到第二识别结果

[0102] 在一种可选的方案中，将通过四层卷积层和第二预设卷积层提取到的第二特征输入 SoftmaxWithLoss层， SoftmaxWithLoss层作为人脸识别的代价函数计算 loss 值，得到第二识别结果。

[0103] 加权模块，用于将第一识别结果和第二识别结果进行加权，得到目标对象的识别结果。

[0104] 在一种可选的方案中，在确定网络的最终 loss值吋，可以对两个 loss值（即上述的第一识别结果和第二识别结果）进行加权求和，得到最后整个网络的 loss值 ( 即上述的目标对象的识别结果）。

[0105] 通过上述方案，可以对网络自主学习特征和部分模块特征进行权衡，以便对网络更好地进行调节。

[0106] 可选地，在本发明上述实施例中，预设网络模型还包括：多个第一全连接层和多个第二全连接层，其中，多个第一全连接层连接在第一预设卷积层和第一输出层之间，多个第二全连接层连接在第二预设卷积层和第二输出层之间。

[0107] 具体的，可以在第一预设卷积层或第二预设卷积层之后分别连接 2个全连接层，然后接入 SoftmaxWithLoss层。

[0108] 此处需要说明的是，第一预设卷积层之后的全连接层仅用于网络训练，在网络训练好之后，将包含人脸信息的图片输入至 CNN网络中，得到最终的目标位置 [0109] 可选地，在本发明上述实施例中，该装置还包括：

[0110] 第一运算单元，用于通过多个第一全连接层对第一特征进行内积运算，得到处理后的第一特征。

[0111] 第二运算单元，用于通过多个第二全连接层对第二特征进行内积运算，得到处理后的第二特征。

[0112] 分类单元还用于通过预设网络模型对处理后的第一特征和处理后的第二特征进行分类，得到目标对象的识别结果。

[0113] 在一种可选的方案中，在人脸识别领域中，在通过四层卷积层和第一预设卷积层得到人脸的特定特征之后，可以输入 2个全连接层（即上述的第一全连接层），最后接入 SoftmaxWithLoss层作为部分特征的代价函数计算 loss值；在通过四层卷积层和第二预设卷积层得到人脸的第二特征之后，可以输入 2个全连接层（即上述的第二全连接层），最后 SoftmaxWithLoss作为人脸识别的代价函数得到人脸识别的 loss值，然后对两个 loss值进行加权求和，得到最后整个 CNN网络的 loss 值。

[0114] 实施例 3

[0115] 根据本发明实施例，提供了一种机器人的实施例，包括：上述实施例 2中任意一项的目标对象的识别装置。

[0116] 采用本发明上述实施例，获取待识别的目标对象，通过预设网络模型对待识别的目标对象进行特征提取，得到目标对象的第一特征和第二特征，通过预设网络模型对第一特征和第二特征进行分类，得到目标对象的识别结果，从而实现对目标对象进行识别的目的。容易注意到的是，由于可以通过预设网络模型提取目标对象的第一特征和第二特征，并对这些特征进行组合，从而能够迫使预设网络模型快速收敛，解决了现有技术中的基于深度学习的网络模型，网络不收敛或者收敛慢，导致目标对象的识别吋间长，鲁棒性低的技术问题。因此，通过本发明上述实施例提供的方案，通过预设网络模型对目标对象进行识别，可以达到加快预设网络模型的训练吋间，缩短目标识别吋间，避免预设网络模型的过拟合，提高目标对象识别的鲁棒性的效果。

[0117] 上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

[0118] 在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

[0119] 在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现吋可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

[0120] 所述作为分离部件说明的单元可以是或者也可以不是物理上分幵的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

[0121] 另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

[0122] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用吋，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可为个人计算机、服务器或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括： U盘、只读存储器（ROM, Read-Only

Memory) 、随机存取存储器 (RAM, Random Access Memory) 、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

权利要求书

[权利要求 1] 一种目标对象的识别方法，其特征在于，包括：

获取待识别的目标对象；

通过预设网络模型对所述待识别的目标对象进行特征提取，得到所述目标对象的第一特征和第二特征，其中，所述第一特征为所述目标对象的特定特征，所述第二特征为对所述第一特征和所述目标对象的基本特征进行特征提取得到的特征；

通过所述预设网络模型对所述第一特征和所述第二特征进行分类，得到所述目标对象的识别结果。

[权利要求 2] 根据权利要求 1所述的方法，其特征在于，所述预设网络模型包括：多个卷积层、第一预设卷积层、第二预设卷积层、第一输出层和第二输出层，其中，多个所述卷积层依次连接，所述第一预设卷积层与多个所述卷积层连接，所述第一输出层与所述第一预设卷积层连接，所述第二预设卷积层与多个所述卷积层和所述第一预设卷积层连接，所述第二输出层与所述第二预设卷积层连接。

[权利要求 3] 根据权利要求 2所述的方法，其特征在于，通过预设网络模型对所述待识别的目标对象进行特征提取，得到所述目标对象的第一特征和第二特征包括：

通过多个所述卷积层对所述待识别的目标对象进行特征提取，得到所述目标对象的基本特征；

通过所述第一预设卷积层对所述目标对象的基本特征进行特征提取，得到所述目标对象的第一特征；

通过所述第二预设卷积层对所述基本特征和所述第一特征进行特征提取，得到所述目标对象的第二特征。

[权利要求 4] 根据权利要求 3所述的方法，其特征在于，所述第二预设卷积层包括

：第一子卷积层和第二子卷积层，所述第一子卷积层与多个所述卷积层连接，所述第二子卷积层与所述第一预设卷积层和所述第一子卷积层连接，其中，通过所述第二预设卷积层对所述基本特征和所述第一特征进行特征提取，得到所述目标对象的第二特征包括：通过所述第一子卷积层对所述基本特征进行特征提取，得到第三特征

，其中，所述第三特征为所述目标对象的基本特征中除所述特定特征之外的其他特征；将所述第三特征和所述第一特征进行合并，得到合并后的特征；通过所述第二子卷积层对所述合并后的特征进行特征提取，得到所述第二特征。

[权利要求 5] 根据权利要求 2所述的方法，其特征在于，通过所述预设网络模型对所述第一特征和所述第二特征进行分类，得到所述目标对象的识别结果包括：

通过所述第一输出层对所述第一特征进行分类，得到第一识别结果；通过所述第二输出层对所述第二特征进行分类，得到第二识别结果；将所述第一识别结果和所述第二识别结果进行加权，得到所述目标对象的识别结果。

[权利要求 6] 根据权利要求 2至 5中任意一项所述的方法，其特征在于，所述预设网络模型还包括：多个第一全连接层和多个第二全连接层，其中，多个所述第一全连接层连接在所述第一预设卷积层和所述第一输出层之间，多个所述第二全连接层连接在所述第二预设卷积层和所述第二输出层之间。

[权利要求 7] 根据权利要求 6所述的方法，其特征在于，在通过所述预设网络模型对所述第一特征和所述第二特征进行分类，得到所述目标对象的识别结果之前，所述方法还包括：

通过多个所述第一全连接层对所述第一特征进行内积运算，得到处理后的第一特征；

通过多个所述第二全连接层对所述第二特征进行内积运算，得到处理后的第二特征；

通过所述预设网络模型对处理后的所述第一特征和处理后的所述第二特征进行分类，得到所述目标对象的识别结果。一种目标对象的识别装置，其特征在于，包括：

获取单元，用于获取待识别的目标对象；

提取单元，用于通过预设网络模型对所述待识别的目标对象进行特征提取，得到所述目标对象的第一特征和第二特征，其中，所述第一特征为所述目标对象的特定特征，所述第二特征为对所述第一特征和所述目标对象的基本特征进行特征提取得到的特征；

分类单元，用于通过所述预设网络模型对所述第一特征和所述第二特征进行分类，得到所述目标对象的识别结果。

根据权利要求 8所述的装置，其特征在于，所述预设网络模型包括：多个卷积层、第一预设卷积层、第二预设卷积层、第一输出层和第二输出层，其中，多个所述卷积层依次连接，所述第一预设卷积层与多个所述卷积层连接，所述第一输出层与所述第一预设卷积层连接，所述第二预设卷积层与多个所述卷积层连接，所述第二输出层与所述第二预设卷积层连接。

根据权利要求 9所述的装置，其特征在于，所述提取单元包括：第一提取模块，用于通过多个所述卷积层对所述待识别的目标对象进行特征提取，得到所述目标对象的基本特征；

第二提取模块，用于通过所述第一预设卷积层对所述目标对象的基本特征进行特征提取，得到所述目标对象的第一特征；

第三提取模块，用于通过所述第二预设卷积层对所述基本特征和所述第一特征进行特征提取，得到所述目标对象的第二特征。

根据权利要求 10所述的装置，其特征在于，所述第二预设卷积层包括：第一子卷积层和第二子卷积层，所述第一子卷积层与多个所述卷积层连接，所述第二子卷积层与所述第一预设卷积层和所述第一子卷积层连接，其中，所述第三提取模块包括：

第一提取子模块，用于通过所述第一子卷积层对所述基本特征进行特征提取，得到第三特征，其中，所述第三特征为所述目标对象的基本特征中除所述特定特征之外的其他特征；合并子模块，用于将所述第三特征和所述第一特征进行合并，得到合并后的特征；

第二提取子模块，用于通过所述第二子卷积层对所述合并后的特征进行特征提取，得到所述第二特征。

根据权利要求 9所述的装置，其特征在于，所述分类单元包括：第一分类模块，用于通过所述第一输出层对所述第一特征进行分类，得到第一识别结果；

第二分类模块，用于通过所述第二输出层对所述第二特征进行分类，得到第二识别结果；

加权模块，用于将所述第一识别结果和所述第二识别结果进行加权，得到所述目标对象的识别结果。

根据权利要求 9至 12中任意一项所述的装置，其特征在于，所述预设网络模型还包括：多个第一全连接层和多个第二全连接层，其中，多个所述第一全连接层连接在所述第一预设卷积层和所述第一输出层之间，多个所述第二全连接层连接在所述第二预设卷积层和所述第二输出层之间。

根据权利要求 13所述的装置，其特征在于，所述装置还包括：第一运算单元，用于通过多个所述第一全连接层对所述第一特征进行内积运算，得到处理后的第一特征；

第二运算单元，用于通过多个所述第二全连接层对所述第二特征进行内积运算，得到处理后的第二特征；

所述分类单元还用于通过所述预设网络模型对处理后的所述第一特征和处理后的所述第二特征进行分类，得到所述目标对象的识别结果。一种机器人，其特征在于，包括：权利要求 8至 14中任意一项所述的目标对象的识别装置。