CN111428679B

CN111428679B - 影像识别方法、装置和设备

Info

Publication number: CN111428679B
Application number: CN202010256738.XA
Authority: CN
Inventors: 马祥; 喻勇涛; 高文强; 鄢丽萍; 张耀营
Original assignee: Suzhou Jieruisi Intelligent Technology Co ltd
Current assignee: Suzhou Jieruisi Intelligent Technology Co ltd
Priority date: 2020-04-02
Filing date: 2020-04-02
Publication date: 2023-09-01
Anticipated expiration: 2040-04-02
Also published as: CN111428679A

Abstract

本申请提供一种影像识别方法、装置和设备，方法包括：获取待识别对象的影像信息；识别所述影像信息中的对象特征信息；根据所述对象特征信息，从预设数据库中查询所述待识别对象的身份信息。本申请实现了根据待识别对象的影像信息，识别出待识别对象的身份信息。

Description

影像识别方法、装置和设备

技术领域

本申请涉及信息处理技术领域，具体而言，涉及一种影像识别方法、装置和设备。

背景技术

采用深度学习进行待识别对象识别的网络模型，一般为卷积层结合全连接层的结构。其中，卷积层原理是通过卷积核提取底层图像的局部特征，高层组合成更加抽象的全局特征。然后通过全连接层将最后一个卷积层得到的特征平面展成向量，再与对应的权重和偏置做运算，最终降低到特定维度。最后输入多分类层中计算对应的每个类别的占比，比重最大节点的类别即为输入待识别对象的类别。

上述全连接最大的缺点是需要训练和学习的参数太多，过多的参数不仅容易造成网络过拟合，还造成网络模型的臃肿和模型推理时间的延长。

发明内容

本申请实施例的目的在于提供一种影像识别方法、装置和设备，用以实现根据待识别对象的影像信息，识别出待识别对象的身份信息。

本申请实施例第一方面提供了一种影像识别方法，包括：获取待识别对象的影像信息；识别所述影像信息中的对象特征信息；根据所述对象特征信息，从预设数据库中查询所述待识别对象的身份信息。

于一实施例中，所述识别所述影像信息中的对象特征信息，包括：识别所述影像信息中预设对象的特征点；根据所述特征点的位置信息，判断所述预设对象是否发生倾斜；若所述预设对象发生倾斜，则根据所述特征点的位置信息，对所述预设对象进行扭正变换，将得到的所述预设对象扭正后的信息作为所述对象特征信息。

于一实施例中，所述识别所述影像信息中的对象特征信息，还包括：若所述预设对象未发生倾斜，则将所述预设对象的所述特征点作为所述对象特征信息。

于一实施例中，所述根据所述对象特征信息，从预设数据库中查询所述待识别对象的身份信息，包括：所述对象特征信息进行预处理，生成预设尺寸的特征图像；将所述特征图像输入预设识别模型，生成所述待识别对象的身份标签；于所述预设数据库中，查询与所述身份标签关联的所述身份信息。

于一实施例中，建立所述预设识别模型的步骤包括：采集多个所述待识别对象的原始图像；对所述原始图像进行归一化处理，并对归一化处理后的所述原始图像进行特征标注，生成标注后的样本图像；将样本图像输入至神经网络模型进行训练，生成所述预设识别模型。

本申请实施例第二方面提供了一种影像识别装置，包括：获取模块，用于获取待识别对象的影像信息；识别模块，用于识别所述影像信息中的对象特征信息；查询模块，用于根据所述对象特征信息，从预设数据库中查询所述待识别对象的身份信息。

于一实施例中，所述识别模块用于：识别所述影像信息中预设对象的特征点；根据所述特征点的位置信息，判断所述预设对象是否发生倾斜；若所述预设对象发生倾斜，则根据所述特征点的位置信息，对所述预设对象进行扭正变换，将得到的所述预设对象扭正后的信息作为所述对象特征信息；若所述预设对象未发生倾斜，则将所述预设对象的所述特征点作为所述对象特征信息。

于一实施例中，所述查询模块用于：所述对象特征信息进行预处理，生成预设尺寸的特征图像；将所述特征图像输入预设识别模型，生成所述待识别对象的身份标签；于所述预设数据库中，查询与所述身份标签关联的所述身份信息。

于一实施例中，还包括：建立模块，用于：采集多个所述待识别对象的原始图像；对所述原始图像进行归一化处理，并对归一化处理后的所述原始图像进行特征标注，生成标注后的样本图像；将样本图像输入至神经网络模型进行训练，生成所述预设识别模型。

本申请实施例第三方面提供了一种电子设备，包括：存储器，用以存储计算机程序；处理器，用以执行本申请实施例第一方面及其任一实施例的方法，以识别出待识别对象的身份信息。

本申请提供的影像识别方法、装置和设备，通过对待识别对象的影像信息进行处理，从中识别出对应的对象特征信息，并基于对象特征信息，从预设数据库中查询该待识别对象对应的身份信息。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请一实施例的电子设备的结构示意图；

图2为本申请一实施例的影像识别方法的流程示意图；

图3为本申请一实施例的影像识别方法的流程示意图；

图4为本申请一实施例的基于双眼位置进行仿射变换的示意图；

图5为本申请一实施例的影像识别装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。在本申请的描述中，术语“第一”、“第二”等仅用于区分描述，不用于表示叙号，并且亦不能理解为指示或暗示相对重要性。

如图1所示，本实施例提供一种电子设备1，包括：至少一个处理器11和存储器12，图1中以一个处理器为例。处理器11和存储器12通过总线10连接，存储器12存储有可被处理器11执行的指令，指令被处理器11执行，以使电子设备1可执行下述的实施例中方法的全部或部分流程。

于一实施例中，电子设备1可以是手机、笔记本电脑等设备。

请参看图2，其为本申请一实施例的影像识别方法，该方法可由图1所示的电子设备1来执行，并可应用于基于人脸识别技术的身份识别场景中，以实现根据待识别对象的影像信息，识别出其身份信息。该方法包括如下步骤：

步骤201：获取待识别对象的影像信息。

在本步骤中，待识别对象可以是人，也可以是其他的生物体或者非生物体。影像信息可以是待识别对象的视频流，影像信息可以通过电子设备1的摄像头实时获取，也可以通过外接拍摄设备获取。

步骤202：识别影像信息中的对象特征信息。

在本步骤中，对象特征信息可以是表征待识别对象的唯一特性的信息，以待识别对象是人为例，对象特征信息可以是人的生物特征信息，比如人脸、指纹等，通过对人的视频流进行图像处理，可以从中识别出人的生物特征信息，以此作为人的对象特征信息。

步骤203：根据对象特征信息，从预设数据库中查询待识别对象的身份信息。

在本步骤中，在身份识别的场景中，预设数据库可以是预先录入某些已被授权的待识别对象的身份信息，并且与这些待识别对象的对象特征信息进行关联标记，比如形成身份信心与对象特征的关联表。以人为例，在实际应用中，识别出某个用户的生物特征信息后，可以直接去预设数据库中查找对应于该用户的身份信息。

上述影像识别方法，通过对待识别对象的影像信息进行图像处理，从中识别出对应的对象特征信息，并基于对象特征信息，从预设数据库中查询该待识别对象对应的身份信息。

请参看图3，其为本申请一实施例的影像识别方法，该方法可由图1所示的电子设备1来执行，并可应用于基于人脸识别技术的身份识别场景中，以实现根据待识别对象的影像信息，识别出其身份信息。该方法包括如下步骤：

步骤301：采集多个待识别对象的原始图像。

在本步骤中，以待识别对象为人类用户为例，在对一个用户进行身份识别之前，可以先建立用于识别人的对象特征的预设识别模型。首先，可以通过手机或相机采集若干人的若干人脸影像信息，进而从中获取人的原始图像。

步骤302：对原始图像进行归一化处理，并对归一化处理后的原始图像进行特征标注，生成标注后的样本图像。

在本步骤中，假设对象特征信息是人脸信息，首先可以将原始图像裁剪成只包括人脸部分的相同尺寸的人脸图像。为了更好的识别效果，可以对检测到的人脸图像进行自适应直方图均衡、中值滤波、几何归一化的预处理。其中，归一化的数学依据为：

由式(1-1)可得：

其中，x_i为m(m为正整数)个原始输入(比如人脸图像)中第i个输入变量，μ为m个原始输入x_i的期望，σ²为m个原始输入x_i的方差，为归一化的输入，最后对标准变换后的/>进行γ缩放和β平移得到输出y_i。

步骤303：将样本图像输入至神经网络模型进行训练，生成预设识别模型。

在本步骤中，预设识别模型可以由若干卷积层、若干批标准化层、若干池化层以及全局平均池化层组成。可以先通过将一定数量人脸图像作为样本图像集输入至神经网络模型进行迭代训练，初步生成预设识别模型。然后通过另一部分人脸图像作为测试样本，测试网络泛化能力，可以根据性能需要调整神经网络参数，进而生成最终的预设识别模型。

上述预设识别模型采用全局平局池化而不是全连接的方式，以减少网络大部分训练参数，加快网络训练时间，减小网络训练模型。在卷积层之后采用组归一化，以优化输入数据的分布，实现数据小批次时网络训练。

步骤304：获取待识别对象的影像信息。详细参见上述实施例中对步骤201的描述。

步骤305：识别影像信息中预设对象的特征点。

在本步骤中，已人的身份识别场景为例，预设对象可以是人的某些器官，比如预设对象可以是人脸、头部或者手臂等对象。已人脸为例，特征点可以是表征人脸轮廓和样貌的特征点集合。可以通过dlib(dlib是一个包含机器学习算法的C++开源工具包。)人脸关键点检测方式，对影像信息中的人脸进行特征点识别，比如可以通过dlib人脸关键点检测确定人脸的左眼和右眼的位置坐标。

步骤306：根据特征点的位置信息，判断预设对象是否发生倾斜。如果是，进入步骤307，否则进入步骤308。

在本步骤中，以预设对象为人脸为例，在实际场景中，影像信息中的人脸并不是总是相对正直的，有可能随着人的位置变化和动作发生相应的倾斜，因此为了保证识别的准确性，首先判断人脸是否发生倾斜。位置信息可以用特征点在影像信息上的位置坐标表示，假设步骤305中通过dlib人脸关键点检测确定人脸的左眼和右眼的位置坐标，并以此判断人脸是否发生倾斜。比如可以根据两眼的位置坐标，判断同一副人脸的左眼是否高于右眼，或者同一副人脸的右眼是否高于左眼，如果是，说明人脸发生倾斜，则进入步骤307，否则说明该人脸并未倾斜，进入步骤308。

上述人脸检测方式，可以对人脸倾斜情况下的关键点有很好的鲁棒性检测，先通过关键点检测确定双眼坐标，并以双眼是否水平作为基准，判断人脸是否需要进行仿射变换。

步骤307：根据特征点的位置信息，对预设对象进行扭正变换，得到预设对象扭正后的信息作为对象特征信息。进入步骤309。

在本步骤中，若人脸发生倾斜，则说明当下的人脸信息并不准确，为了进一步保证数据计算的准确性，则可以对当前的人脸信息进行扭正变换，可以采用对当前人脸信息做仿射变换的方式将其扭正，进而将得到的当前人脸扭正后的信息作为对象特征信息，然后进入步骤309。

于一实施例中，仿射变换可以采用如下公式(2-1)：

其中(x′,y′)为原坐标点，(x,y)为仿射变换之后的坐标点，M为旋转变换矩阵，m_ij为旋转变换矩阵M的第i行第j列的元素，i，j为正整数。

于一实施例中，在预设对象为人脸的身份识别场景中，旋转变换矩阵M可以表达为式(2-2)：

其中，如图4所示，在进行仿射变换扭正人脸之前，可以首先根据眼睛的位置坐标，确定旋转中心P(x₀,y₀)和旋转角θ。假设通过dlib人脸关键点检测确定其左眼坐标A(x1,y1)和右眼坐标B(x2,y2)。当左眼高于右眼，或者右眼高于左眼时，便需要进行旋转操作，可得旋转角θ为：

进而以两眼坐标点A和点B的中心为旋转中心P(x₀,y₀)，即

把式(2-3)的旋转角θ和式(2-4)的旋转中心P(x₀,y₀)代入式(2-2)可得人脸的旋转变换矩阵M，然后根据旋转变换矩阵M对倾斜的人脸通过旋转变换进行扭正。

步骤308：将预设对象的特征点作为对象特征信息。进入步骤309。

在本步骤中，若预设对象未发生倾斜，即人脸没有发生倾斜，说明当前人脸是正直的，符合准确计算的要求，则可以直接将当前人脸的信息作为对象特征信息。

步骤309：对象特征信息进行预处理，生成预设尺寸的特征图像。

在本步骤中，在得到人脸的对象特征信息后，可以首先对包含对象特征信息的图像进行自适应直方图均衡和中值滤波预处理，在均衡和滤波预处理后的图像上裁剪出预设尺寸的人脸特征图像，预设尺寸与预设识别模型的识别参数有关，预设尺寸可以与预设模型的样本图像的尺寸相同。

步骤310：将特征图像输入预设识别模型，生成待识别对象的身份标签。

在本步骤中，将特征图像输入步骤303中得到的沈神经网络模型进行特征提取和匹配，如果某个人脸图像匹配成功，则输出该人脸对应的人的身份标签。如果匹配不成功，在可以在直接输出该待识别对象将为陌生人，并可以在屏幕发出提示。

步骤311：于预设数据库中，查询与身份标签关联的身份信息。

在本步骤中，预设数据库可以是MySQL(MySQL是一种开放源代码的关系型数据库管理系统)数据库，其中预先录入某些已被授权的待识别对象的身份信息，并且与这些待识别对象的对象特征信息进行关联标记，比如形成身份信心与对象特征的关联表。基于步骤310识别出的待识别对象的身份标签，在MySQL数据库钟根据该身份标签，获得对应的人的基本身份信息，并可以返还显示在屏幕上。

请参看图5，其为本申请一实施例的影像识别装置500，该装置可应用于图1所示的电子设备1，并可应用于基于人脸识别技术的身份识别场景中，以实现根据待识别对象的影像信息，识别出其身份信息。该装置包括：获取模块501、识别模块502和查询模块503，各个模块的原理关系如下：

获取模块501，用于获取待识别对象的影像信息。详细参见上述实施例中对步骤201的描述。

识别模块502，用于识别影像信息中的对象特征信息。详细参见上述实施例中对步骤202的描述。

查询模块503，用于根据对象特征信息，从预设数据库中查询待识别对象的身份信息。详细参见上述实施例中对步骤203的描述。

于一实施例中，识别模块502用于：识别影像信息中预设对象的特征点。根据特征点的位置信息，判断预设对象是否发生倾斜。若预设对象发生倾斜，则根据特征点的位置信息，对预设对象进行扭正变换，将得到的预设对象扭正后的信息作为对象特征信息。若预设对象未发生倾斜，则将预设对象的特征点作为对象特征信息。详细参见上述实施例中对步骤305至步骤308的描述。

于一实施例中，查询模块503用于：对象特征信息进行预处理，生成预设尺寸的特征图像。将特征图像输入预设识别模型，生成待识别对象的身份标签。于预设数据库中，查询与身份标签关联的身份信息。详细参见上述实施例中对步骤309至步骤311的描述。

于一实施例中，还包括：建立模块504，用于：采集多个待识别对象的原始图像。对原始图像进行归一化处理，并对归一化处理后的原始图像进行特征标注，生成标注后的样本图像。将样本图像输入至神经网络模型进行训练，生成预设识别模型。详细参见上述实施例中对步骤301至步骤303的描述。

上述影像识别装置500的详细描述，请参见上述实施例中相关方法步骤的描述。

本发明实施例还提供了一种非暂态电子设备可读存储介质，包括：程序，当其在电子设备上运行时，使得电子设备可执行上述实施例中方法的全部或部分流程。其中，存储介质可为磁盘、光盘、只读存储记忆体(Read-Only Memory，ROM)、随机存储记忆体(RandomAccess Memory，RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive，缩写：HDD)或固态硬盘(Solid-State Drive，SSD)等。存储介质还可以包括上述种类的存储器的组合。

虽然结合附图描述了本发明的实施例，但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims

1.一种影像识别方法，其特征在于，包括：

获取待识别对象的影像信息；

识别所述影像信息中的对象特征信息；

根据所述对象特征信息，从预设数据库中查询所述待识别对象的身份信息包括：

所述对象特征信息进行预处理，生成预设尺寸的特征图像；

将所述特征图像输入预设识别模型，生成所述待识别对象的身份标签；

于所述预设数据库中，查询与所述身份标签关联的所述身份信息；

建立所述预设识别模型的步骤包括：

采集多个所述待识别对象的原始图像；

对所述原始图像进行归一化处理，并对归一化处理后的所述原始图像进行特征标注，生成标注后的样本图像，

归一化的数学依据为：

其中，x_i为m个原始输入中第i个输入变量，μ为m个原始输入x_i的期望，σ²为m个原始输入x_i的方差，为归一化的输入，最后对标准变换后的/>进行γ缩放和β平移得到输出y_i；

将样本图像输入至神经网络模型进行训练，生成所述预设识别模型，包括：

将一部分数量的原始图像作为样本集输入至所述神经网络模型进行迭代训练，再通过另一部分原始图像作为测试样本测试网络泛化能力。

2.根据权利要求1所述的方法，其特征在于，所述识别所述影像信息中的对象特征信息，包括：

识别所述影像信息中预设对象的特征点；

根据所述特征点的位置信息，判断所述预设对象是否发生倾斜；

若所述预设对象发生倾斜，则根据所述特征点的位置信息，对所述预设对象进行扭正变换，将得到的所述预设对象扭正后的信息作为所述对象特征信息。

3.根据权利要求2所述的方法，其特征在于，所述识别所述影像信息中的对象特征信息，还包括：

若所述预设对象未发生倾斜，则将所述预设对象的所述特征点作为所述对象特征信息。

4.一种影像识别装置，其特征在于，包括：

获取模块，用于获取待识别对象的影像信息；

识别模块，用于识别所述影像信息中的对象特征信息；

查询模块，用于根据所述对象特征信息，从预设数据库中查询所述待识别对象的身份信息，所述对象特征信息进行预处理，生成预设尺寸的特征图像；

建立模块，用于采集多个所述待识别对象的原始图像；

归一化的数学依据为：

将样本图像输入至神经网络模型进行训练，生成所述预设识别模型，包括：将一部分数量的原始图像作为样本集输入至所述神经网络模型进行迭代训练，再通过另一部分原始图像作为测试样本测试网络泛化能力。

5.根据权利要求4所述的装置，其特征在于，所述识别模块用于：

识别所述影像信息中预设对象的特征点；

若所述预设对象发生倾斜，则根据所述特征点的位置信息，对所述预设对象进行扭正变换，将得到的所述预设对象扭正后的信息作为所述对象特征信息；

6.一种电子设备，其特征在于，包括：

存储器，用以存储计算机程序；

处理器，用以执行如权利要求1至3中任一项所述的方法，以识别出待识别对象的身份信息。