CN111738350A

CN111738350A - 图像识别的方法及装置、电子设备、计算机可读介质

Info

Publication number: CN111738350A
Application number: CN202010610701.2A
Authority: CN
Inventors: 陈乃阔; 刘卓; 刘毅枫
Original assignee: Shandong Chaoyue CNC Electronics Co Ltd
Current assignee: Shandong Chaoyue CNC Electronics Co Ltd
Priority date: 2020-06-30
Filing date: 2020-06-30
Publication date: 2020-10-02

Abstract

本发明提供了图像识别的方法及装置、电子设备、计算机可读介质，该方法，包括：确定用于训练的多个样本图像与类别的对应关系；对所述多个样本图像进行降维处理，生成所述多个样本图像的样本数据；根据所述多个样本图像的样本数据和所述对应关系，对图像识别模型进行训练，直到生成满足要求的图像识别模型；利用所述满足要求的图像识别模型对待识别图像进行识别，获取所述满足要求的图像识别模型输出的识别结果。本发明提供了图像识别的方法及装置、电子设备、计算机可读介质，能够降低训练模型的过程中的计算量。

Description

图像识别的方法及装置、电子设备、计算机可读介质

技术领域

本发明涉及图像识别技术领域，特别涉及图像识别的方法及装置、电子设备、计算机可读介质。

背景技术

图像识别是一个有监督学习过程，在现有技术中，首先利用训练集构造一个数学训练模型，然后将测试集与训练集进行匹配，找到与之对应的训练集图像。最容易的方式是直接利用欧式距离计算测试集的每一幅图像与训练集的每一幅图像的距离，然后选择距离最近的图像作为识别的结果。这种直接计算距离的方式计算量非常大。举例来说，每幅图像大小为100*100，训练集大小1000，则识别测试集中的一幅图像就需要1000*100*100的计算量。

通过上述描述可见，现有技术的训练模型的过程中计算量较大。

发明内容

本发明实施例提供了图像识别的方法及装置、电子设备、计算机可读介质，能够降低训练模型的过程中的计算量。

第一方面，本发明实施例提供了图像识别的方法，包括：

确定用于训练的多个样本图像与类别的对应关系；

对所述多个样本图像进行降维处理，生成所述多个样本图像的样本数据；

根据所述多个样本图像的样本数据和所述对应关系，对图像识别模型进行训练，直到生成满足要求的图像识别模型；

利用所述满足要求的图像识别模型对待识别图像进行识别，获取所述满足要求的图像识别模型输出的识别结果。

可选地，

所述根据所述多个样本图像的样本数据和所述对应关系，对图像识别模型进行训练，直到生成满足要求的图像识别模型，包括：

S1：将所述多个样本图像的样本数据划分为训练集和测试集；

S2：将所述训练集中的样本数据输入到所述图像识别模型中，获取所述图像识别模型输出的类别；

S3：根据所述对应关系中的类别和所述图像识别模型输出的类别，对应所述图像识别模型进行调整；

S4：利用所述测试集中的样本数据和所述对应关系，确定所述图像识别模型识别的准确率是否大于预设准确率，如果是，则执行S5，否则，返回S2；

S5：将当前的所述图像识别模型作为所述满足要求的图像识别模型。

可选地，

所述图像识别模型包括KNN(k-nearestneighbor，k最邻近)模型；

根据所述多个样本图像的样本数据和所述对应关系，利用KNN算法对所述KNN模型进行训练，直到生成满足要求的KNN模型超参数，根据满足要求的KNN模型超参数得到满足要求的KNN模型。

可选地，

所述对所述多个样本图像进行降维处理，生成所述多个样本图像的样本数据，包括：

对所述多个样本图像进行处理，使得每个所述样本图像的像素数量相同；

根据每个所述样本图像的像素信息，生成一个二维数组，其中，所述二维数组的每一行对应一个样本图像，每一行的每个元素表示该行对应的样本图像的一个像素的像素信息；

确定所述二维数组的每行的元素的平均值，将每行的元素减去该行对应的平均值，得到第一矩阵；

确定所述第一矩阵的协方差矩阵；

确定所述协方差矩阵的特征值和特征向量；

确定所述协方差矩阵的最大的k个特征值以及该最大的k个特征值对应的特征向量；

根据该最大的k个特征值对应的特征向量，生成第二矩阵；

将第一矩阵的逆矩阵乘以所述第二矩阵，生成第三矩阵；

将所述二维数组中每个所述样本图像对应的行作为每个所述样本图像的图像向量；

将每个所述样本图像的图像向量乘以所述第三矩阵，得到每个所述样本图像的所述样本数据。

可选地，

在所述利用所述满足要求的图像识别模型对待识别图像进行识别之前，进一步包括：

对所述待识别图像进行降维处理，生成所述待识别图像的待识别数据；

所述利用所述满足要求的图像识别模型对待识别图像进行识别，包括：

将所述待识别数据输入所述满足要求的图像识别模型中，利用所述满足要求的图像识别模型对所述待识别数据进行处理。

第二方面，本发明实施例提供了图像识别的装置，包括：

确定模块，用于确定用于训练的多个样本图像与类别的对应关系；

降维模块，用于对所述多个样本图像进行降维处理，生成所述多个样本图像的样本数据；

训练模块，用于根据所述多个样本图像的样本数据和所述对应关系，对图像识别模型进行训练，直到生成满足要求的图像识别模型；

识别模块，用于利用所述满足要求的图像识别模型对待识别图像进行识别，获取所述满足要求的图像识别模型输出的识别结果。

可选地，

所述训练模块，用于执行：

可选地，

所述图像识别模型包括KNN模型；

所所述训练模块，用于根据所述多个样本图像的样本数据和所述对应关系，利用KNN算法对所述KNN模型进行训练，直到生成满足要求的KNN模型超参数，根据满足要求的KNN模型超参数得到满足要求的KNN模型。

可选地，

所述降维模块，用于执行：

确定所述第一矩阵的协方差矩阵；

确定所述协方差矩阵的特征值和特征向量；

根据该最大的k个特征值对应的特征向量，生成第二矩阵；

将第一矩阵的逆矩阵乘以所述第二矩阵，生成第三矩阵；

可选地，

该装置进一步包括：

预处理模块，用于对所述待识别图像进行降维处理，生成所述待识别图像的待识别数据；

所述识别模块，用于将所述待识别数据输入所述满足要求的图像识别模型中，利用所述满足要求的图像识别模型对所述待识别数据进行处理。

第三方面，本发明实施例提供了电子设备，包括：至少一个存储器和至少一个处理器；

所述至少一个存储器，用于存储机器可读程序；

所述至少一个处理器，用于调用所述机器可读程序，执行第一方面中任一所述的方法。

第四方面，本发明实施例提供了计算机可读介质，其特征在于，所述计算机可读介质上存储有计算机指令，所述计算机指令在被处理器执行时，使所述处理器执行第一方面中中任一所述的方法。

在本发明实施例中，将样本图像进行降维处理，得到样本图像的样本数据，样本图像的样本数据是降维后的数据，比样本图像的数据量小，利用样本图像的样本数据对比图像识别模型进行训练能够降低训练模型的过程中的计算量。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的一种图像识别的方法的流程图；

图2是本发明一实施例提供的另一种图像识别的方法的流程图；

图3是本发明一实施例提供的一种图像识别的装置的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本发明实施例提供了一种图像识别的方法，该方法可以包括以下步骤：

步骤101：确定用于训练的多个样本图像与类别的对应关系；

步骤102：对所述多个样本图像进行降维处理，生成所述多个样本图像的样本数据；

步骤103：根据所述多个样本图像的样本数据和所述对应关系，对图像识别模型进行训练，直到生成满足要求的图像识别模型；

步骤104：利用所述满足要求的图像识别模型对待识别图像进行识别，获取所述满足要求的图像识别模型输出的识别结果。

在本发明实施例中，每个样本图像对应一条样本数据，通过样本数据来表示样本图像的图像特征。

在本发明实施例中，对样本图像进行降维处理，以提取高维数据的主要特征然后剔除数据中的噪声和冗余信息，从而加速模型的训练过程，

在本发明一实施例中，所述根据所述多个样本图像的样本数据和所述对应关系，对图像识别模型进行训练，直到生成满足要求的图像识别模型，包括：

在本发明实施例中，通过训练集来训练图像识别模型，通过测试集对图像识别模型识别的准确率进行测试。举例来说，在对应关系中样本图像A对应的类别为类别A，将样本图像A的样本数据输入到图像识别模型中，获取图像识别模型输入的类别，如果图像识别模型输入的类别不是类别A，则需要对图像识别模型进行调整。

在步骤S4中，可以将测试集中的多个样本图像的样本数据输入到图像识别模型中，获取图像识别模型输出的类别。针对一个样本图像，如果图像识别模型对该样本图像的样本数据进行处理后输出的类别与对应关系中该样本图像对应的类别相同，则记录对该样本图像识别准确，如果不同，则记录对该样本图像识别不准确。统计识别准确样本图像的数量与参数测试的样本图像的总数量，将识别准确样本图像的数量除以该总数量得到识别的准确率。

该预设准确率根据要求设置，例如可以是90％等。

在本发明一实施例中，所述图像识别模型包括KNN模型；

在本发明实施例中，通过KNN算法对KNN模型进行训练。具体地，可以利用KNN算法以交叉验证的方式对KNN模型进行训练，从而获得一个具有固定超参数的、人性化的、具有普适推广性的图像分辨器(也就是KNN模型)。

KNN算法将测试图像归类为与其“距离最近”的K个样本中数量最多的类别，采用多类别投票对比机制，消除了偶然性误差，更具有普适性、合理性、健壮性。

KNN算法基于大样本数据集和交叉验证方式来完成模型训练，获得的模型具有鲁棒性，健壮性，不易发生过拟合现象。

在本发明一实施例中，所述对所述多个样本图像进行降维处理，生成所述多个样本图像的样本数据，包括：

确定所述第一矩阵的协方差矩阵；

确定所述协方差矩阵的特征值和特征向量；

根据该最大的k个特征值对应的特征向量，生成第二矩阵；

将第一矩阵的逆矩阵乘以所述第二矩阵，生成第三矩阵；

在本发明实施例中，首先对样本图像进行标准化，使得各个样本图像的像素数量相同，去除背景信息，并进行图片中心化处理，最终转化成尺寸一致的图像。

在上述的二维数组中，二维数组的行与样本图像一一对应。如果有m个样本图像，每个样本图像的像素数量为n，那么该二维数据就是一个m行n列的数组。上述的像素信息可以是像素的RGB值。在本发明实施例中，降维处理就是要通过更少的列来代表一个样本图像。

确定每行的元素的平均值，这些平均值构成了一个平均图像，每个样本图像与该平均图像的向量差组成第一矩阵。

协方差矩阵表示不同随机变量之间的相互关系，图像中也即求任意两个像素之间的关系。如果两个随机变量的协方差为正或为负，表明两个变量之间具有相关性，如果为零表示两个变量不相关。通过计算协方差矩阵，就可以获得不同像素之间的关系。其中，第一矩阵乘以第一矩阵的逆矩阵得到该协方差矩阵。

可以通过以下方式确定协方差矩阵的最大的k个特征值：将协方差矩阵的特征值按照从大到小的顺序排列，选择前k个特征值，该前k个特征值就是最大的k个特征值。k可以是一个预设的固定值，也可以是一个图像识别模型的超参数。

其中，第二矩阵是一个m×k的矩阵，第三矩阵是一个n×k的矩阵。

在本发明一实施例中，在所述利用所述满足要求的图像识别模型对待识别图像进行识别之前，进一步包括：

在本发明实施例中，在利用图像识别模型进行识别之前，可以预先对待识别图像进行降维处理，通过降维处理得到的待识别数据进行识别，能够减少识别过程的计算量，能够加快识别的速度。

下面通过一个具体的实施例来详细描述本发明实施例提供一种图像识别的方法，如图2所示，该方法可以包括以下步骤：

步骤201：确定用于训练的多个样本图像与类别的对应关系。

步骤202：对多个样本图像进行处理，使得每个样本图像的像素数量相同。

步骤203：根据每个样本图像的像素信息，生成一个二维数组，其中，二维数组的每一行对应一个样本图像，每一行的每个元素表示该行对应的样本图像的一个像素的像素信息。

步骤204：确定二维数组的每行的元素的平均值，将每行的元素减去该行对应的平均值，得到第一矩阵。

步骤205：确定第一矩阵的协方差矩阵，确定协方差矩阵的特征值和特征向量，确定协方差矩阵的最大的k个特征值以及该最大的k个特征值对应的特征向量。

步骤206：根据该最大的k个特征值对应的特征向量，生成第二矩阵。

步骤207：将第一矩阵的逆矩阵乘以第二矩阵，生成第三矩阵。

步骤208：将二维数组中每个样本图像对应的行作为每个样本图像的图像向量。

步骤209：将每个样本图像的图像向量乘以第三矩阵，得到每个样本图像的样本数据。

步骤210：将多个样本图像的样本数据划分为训练集和测试集。

具体地，可以按照按1：3的比例划分为测试集和训练集。

步骤211：根据训练集的样本数据和对应关系，利用KNN算法对KNN模型进行训练，并利用训练集对KNN模型进行验证，直到生成满足要求的KNN模型超参数，根据满足要求的KNN模型超参数得到满足要求的KNN模型。

步骤212：对待识别图像进行降维处理，生成待识别图像的待识别数据。

步骤213：将待识别数据输入满足要求的KNN模型中，利用满足要求的KNN模型对待识别数据进行处理，获取满足要求的KNN模型输出的识别结果。

具体地，该识别结果为KNN模型识别出的待识别图像所属于的类别。

在本发明实施例中，还可以通过PCA(principal components analysis，主成分分析)算法实现降维处理。

如图3所示，本发明实施例提供了一种图像识别的装置，包括：

确定模块301，用于确定用于训练的多个样本图像与类别的对应关系；

降维模块302，用于对所述多个样本图像进行降维处理，生成所述多个样本图像的样本数据；

训练模块303，用于根据所述多个样本图像的样本数据和所述对应关系，对图像识别模型进行训练，直到生成满足要求的图像识别模型；

识别模块304，用于利用所述满足要求的图像识别模型对待识别图像进行识别，获取所述满足要求的图像识别模型输出的识别结果。

在本发明一实施例中，所述训练模块，用于执行：

在本发明一实施例中，所述图像识别模型包括KNN模型；

在本发明一实施例中，所述降维模块，用于执行：

确定所述第一矩阵的协方差矩阵；

确定所述协方差矩阵的特征值和特征向量；

根据该最大的k个特征值对应的特征向量，生成第二矩阵；

将第一矩阵的逆矩阵乘以所述第二矩阵，生成第三矩阵；

将每个所述样本图像的图像向量乘以所述第三矩阵，得到每个所述样本图像的所述样本数据；

在本发明一实施例中，该方法进一步包括：

本发明实施例提供了一种电子设备，包括：至少一个存储器和至少一个处理器；

所述至少一个存储器，用于存储机器可读程序；

所述至少一个处理器，用于调用所述机器可读程序，执行本发明实施例提供的任一所述的图像识别的方法。

本发明实施例提供了一种计算机可读介质，所述计算机可读介质上存储有计算机指令，所述计算机指令在被处理器执行时，使所述处理器执行本发明实施例提供的任一所述的图像识别的方法。

可以理解的是，本发明实施例示意的结构并不构成对图像识别的装置的具体限定。在本发明的另一些实施例中，图像识别的装置可以包括比图示更多或者更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。

上述装置内的各单元之间的信息交互、执行过程等内容，由于与本发明方法实施例基于同一构思，具体内容可参见本发明方法实施例中的叙述，此处不再赘述。

本发明还提供了一种计算机可读介质，存储用于使一计算机执行如本文所述的图像识别的方法的指令。具体地，可以提供配有存储介质的系统或者装置，在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码，且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。

在这种情况下，从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能，因此程序代码和存储程序代码的存储介质构成了本发明的一部分。

用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地，可以由通信网络从服务器计算机上下载程序代码。

此外，应该清楚的是，不仅可以通过执行计算机所读出的程序代码，而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作，从而实现上述实施例中任意一项实施例的功能。

此外，可以理解的是，将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中，随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作，从而实现上述实施例中任一实施例的功能。

需要说明的是，上述各流程和各系统结构图中不是所有的步骤和模块都是必须的，可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的，可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构，也可以是逻辑结构，即，有些模块可能由同一物理实体实现，或者，有些模块可能分由多个物理实体实现，或者，可以由多个独立设备中的某些部件共同实现。

以上各实施例中，硬件单元可以通过机械方式或电气方式实现。例如，一个硬件单元可以包括永久性专用的电路或逻辑(如专门的处理器，FPGA或ASIC)来完成相应操作。硬件单元还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器)，可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。

上文通过附图和优选实施例对本发明进行了详细展示和说明，然而本发明不限于这些已揭示的实施例，基与上述多个实施例本领域技术人员可以知晓，可以组合上述不同实施例中的代码审核手段得到本发明更多的实施例，这些实施例也在本发明的保护范围之内。

Claims

1.图像识别的方法，其特征在于，

确定用于训练的多个样本图像与类别的对应关系；

还包括：

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求1所述的方法，其特征在于，

所述图像识别模型包括k最邻近KNN模型；

4.根据权利要求1所述的方法，其特征在于，

确定所述第一矩阵的协方差矩阵；

确定所述协方差矩阵的特征值和特征向量；

根据该最大的k个特征值对应的特征向量，生成第二矩阵；

将第一矩阵的逆矩阵乘以所述第二矩阵，生成第三矩阵；

5.根据权利要求1-4中任一所述的方法，其特征在于，

6.图像识别的装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，

所述训练模块，用于执行：

8.根据权利要求6所述的方法，其特征在于，

所述图像识别模型包括k最邻近KNN模型；

所所述训练模块，用于根据所述多个样本图像的样本数据和所述对应关系，利用KNN算法对所述KNN模型进行训练，直到生成满足要求的KNN模型超参数，根据满足要求的KNN模型超参数得到满足要求的KNN模型；

和/或，

所述降维模块，用于执行：

确定所述第一矩阵的协方差矩阵；

确定所述协方差矩阵的特征值和特征向量；

根据该最大的k个特征值对应的特征向量，生成第二矩阵；

将第一矩阵的逆矩阵乘以所述第二矩阵，生成第三矩阵；

和/或，

进一步包括：

9.电子设备，其特征在于，包括：至少一个存储器和至少一个处理器；

所述至少一个存储器，用于存储机器可读程序；

所述至少一个处理器，用于调用所述机器可读程序，执行权利要求1至4中任一所述的方法。

10.计算机可读介质，其特征在于，所述计算机可读介质上存储有计算机指令，所述计算机指令在被处理器执行时，使所述处理器执行权利要求1至5中任一所述的方法。