CN111738350A - 图像识别的方法及装置、电子设备、计算机可读介质 - Google Patents

图像识别的方法及装置、电子设备、计算机可读介质 Download PDF

Info

Publication number
CN111738350A
CN111738350A CN202010610701.2A CN202010610701A CN111738350A CN 111738350 A CN111738350 A CN 111738350A CN 202010610701 A CN202010610701 A CN 202010610701A CN 111738350 A CN111738350 A CN 111738350A
Authority
CN
China
Prior art keywords
image
sample
image recognition
recognition model
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010610701.2A
Other languages
English (en)
Inventor
陈乃阔
刘卓
刘毅枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Chaoyue CNC Electronics Co Ltd
Original Assignee
Shandong Chaoyue CNC Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Chaoyue CNC Electronics Co Ltd filed Critical Shandong Chaoyue CNC Electronics Co Ltd
Priority to CN202010610701.2A priority Critical patent/CN111738350A/zh
Publication of CN111738350A publication Critical patent/CN111738350A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了图像识别的方法及装置、电子设备、计算机可读介质,该方法,包括:确定用于训练的多个样本图像与类别的对应关系;对所述多个样本图像进行降维处理,生成所述多个样本图像的样本数据;根据所述多个样本图像的样本数据和所述对应关系,对图像识别模型进行训练,直到生成满足要求的图像识别模型;利用所述满足要求的图像识别模型对待识别图像进行识别,获取所述满足要求的图像识别模型输出的识别结果。本发明提供了图像识别的方法及装置、电子设备、计算机可读介质,能够降低训练模型的过程中的计算量。

Description

图像识别的方法及装置、电子设备、计算机可读介质
技术领域
本发明涉及图像识别技术领域,特别涉及图像识别的方法及装置、电子设备、计算机可读介质。
背景技术
图像识别是一个有监督学习过程,在现有技术中,首先利用训练集构造一个数学训练模型,然后将测试集与训练集进行匹配,找到与之对应的训练集图像。最容易的方式是直接利用欧式距离计算测试集的每一幅图像与训练集的每一幅图像的距离,然后选择距离最近的图像作为识别的结果。这种直接计算距离的方式计算量非常大。举例来说,每幅图像大小为100*100,训练集大小1000,则识别测试集中的一幅图像就需要1000*100*100的计算量。
通过上述描述可见,现有技术的训练模型的过程中计算量较大。
发明内容
本发明实施例提供了图像识别的方法及装置、电子设备、计算机可读介质,能够降低训练模型的过程中的计算量。
第一方面,本发明实施例提供了图像识别的方法,包括:
确定用于训练的多个样本图像与类别的对应关系;
对所述多个样本图像进行降维处理,生成所述多个样本图像的样本数据;
根据所述多个样本图像的样本数据和所述对应关系,对图像识别模型进行训练,直到生成满足要求的图像识别模型;
利用所述满足要求的图像识别模型对待识别图像进行识别,获取所述满足要求的图像识别模型输出的识别结果。
可选地,
所述根据所述多个样本图像的样本数据和所述对应关系,对图像识别模型进行训练,直到生成满足要求的图像识别模型,包括:
S1:将所述多个样本图像的样本数据划分为训练集和测试集;
S2:将所述训练集中的样本数据输入到所述图像识别模型中,获取所述图像识别模型输出的类别;
S3:根据所述对应关系中的类别和所述图像识别模型输出的类别,对应所述图像识别模型进行调整;
S4:利用所述测试集中的样本数据和所述对应关系,确定所述图像识别模型识别的准确率是否大于预设准确率,如果是,则执行S5,否则,返回S2;
S5:将当前的所述图像识别模型作为所述满足要求的图像识别模型。
可选地,
所述图像识别模型包括KNN(k-nearestneighbor,k最邻近)模型;
所述根据所述多个样本图像的样本数据和所述对应关系,对图像识别模型进行训练,直到生成满足要求的图像识别模型,包括:
根据所述多个样本图像的样本数据和所述对应关系,利用KNN算法对所述KNN模型进行训练,直到生成满足要求的KNN模型超参数,根据满足要求的KNN模型超参数得到满足要求的KNN模型。
可选地,
所述对所述多个样本图像进行降维处理,生成所述多个样本图像的样本数据,包括:
对所述多个样本图像进行处理,使得每个所述样本图像的像素数量相同;
根据每个所述样本图像的像素信息,生成一个二维数组,其中,所述二维数组的每一行对应一个样本图像,每一行的每个元素表示该行对应的样本图像的一个像素的像素信息;
确定所述二维数组的每行的元素的平均值,将每行的元素减去该行对应的平均值,得到第一矩阵;
确定所述第一矩阵的协方差矩阵;
确定所述协方差矩阵的特征值和特征向量;
确定所述协方差矩阵的最大的k个特征值以及该最大的k个特征值对应的特征向量;
根据该最大的k个特征值对应的特征向量,生成第二矩阵;
将第一矩阵的逆矩阵乘以所述第二矩阵,生成第三矩阵;
将所述二维数组中每个所述样本图像对应的行作为每个所述样本图像的图像向量;
将每个所述样本图像的图像向量乘以所述第三矩阵,得到每个所述样本图像的所述样本数据。
可选地,
在所述利用所述满足要求的图像识别模型对待识别图像进行识别之前,进一步包括:
对所述待识别图像进行降维处理,生成所述待识别图像的待识别数据;
所述利用所述满足要求的图像识别模型对待识别图像进行识别,包括:
将所述待识别数据输入所述满足要求的图像识别模型中,利用所述满足要求的图像识别模型对所述待识别数据进行处理。
第二方面,本发明实施例提供了图像识别的装置,包括:
确定模块,用于确定用于训练的多个样本图像与类别的对应关系;
降维模块,用于对所述多个样本图像进行降维处理,生成所述多个样本图像的样本数据;
训练模块,用于根据所述多个样本图像的样本数据和所述对应关系,对图像识别模型进行训练,直到生成满足要求的图像识别模型;
识别模块,用于利用所述满足要求的图像识别模型对待识别图像进行识别,获取所述满足要求的图像识别模型输出的识别结果。
可选地,
所述训练模块,用于执行:
S1:将所述多个样本图像的样本数据划分为训练集和测试集;
S2:将所述训练集中的样本数据输入到所述图像识别模型中,获取所述图像识别模型输出的类别;
S3:根据所述对应关系中的类别和所述图像识别模型输出的类别,对应所述图像识别模型进行调整;
S4:利用所述测试集中的样本数据和所述对应关系,确定所述图像识别模型识别的准确率是否大于预设准确率,如果是,则执行S5,否则,返回S2;
S5:将当前的所述图像识别模型作为所述满足要求的图像识别模型。
可选地,
所述图像识别模型包括KNN模型;
所所述训练模块,用于根据所述多个样本图像的样本数据和所述对应关系,利用KNN算法对所述KNN模型进行训练,直到生成满足要求的KNN模型超参数,根据满足要求的KNN模型超参数得到满足要求的KNN模型。
可选地,
所述降维模块,用于执行:
对所述多个样本图像进行处理,使得每个所述样本图像的像素数量相同;
根据每个所述样本图像的像素信息,生成一个二维数组,其中,所述二维数组的每一行对应一个样本图像,每一行的每个元素表示该行对应的样本图像的一个像素的像素信息;
确定所述二维数组的每行的元素的平均值,将每行的元素减去该行对应的平均值,得到第一矩阵;
确定所述第一矩阵的协方差矩阵;
确定所述协方差矩阵的特征值和特征向量;
确定所述协方差矩阵的最大的k个特征值以及该最大的k个特征值对应的特征向量;
根据该最大的k个特征值对应的特征向量,生成第二矩阵;
将第一矩阵的逆矩阵乘以所述第二矩阵,生成第三矩阵;
将所述二维数组中每个所述样本图像对应的行作为每个所述样本图像的图像向量;
将每个所述样本图像的图像向量乘以所述第三矩阵,得到每个所述样本图像的所述样本数据。
可选地,
该装置进一步包括:
预处理模块,用于对所述待识别图像进行降维处理,生成所述待识别图像的待识别数据;
所述识别模块,用于将所述待识别数据输入所述满足要求的图像识别模型中,利用所述满足要求的图像识别模型对所述待识别数据进行处理。
第三方面,本发明实施例提供了电子设备,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行第一方面中任一所述的方法。
第四方面,本发明实施例提供了计算机可读介质,其特征在于,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行第一方面中中任一所述的方法。
在本发明实施例中,将样本图像进行降维处理,得到样本图像的样本数据,样本图像的样本数据是降维后的数据,比样本图像的数据量小,利用样本图像的样本数据对比图像识别模型进行训练能够降低训练模型的过程中的计算量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种图像识别的方法的流程图;
图2是本发明一实施例提供的另一种图像识别的方法的流程图;
图3是本发明一实施例提供的一种图像识别的装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种图像识别的方法,该方法可以包括以下步骤:
步骤101:确定用于训练的多个样本图像与类别的对应关系;
步骤102:对所述多个样本图像进行降维处理,生成所述多个样本图像的样本数据;
步骤103:根据所述多个样本图像的样本数据和所述对应关系,对图像识别模型进行训练,直到生成满足要求的图像识别模型;
步骤104:利用所述满足要求的图像识别模型对待识别图像进行识别,获取所述满足要求的图像识别模型输出的识别结果。
在本发明实施例中,将样本图像进行降维处理,得到样本图像的样本数据,样本图像的样本数据是降维后的数据,比样本图像的数据量小,利用样本图像的样本数据对比图像识别模型进行训练能够降低训练模型的过程中的计算量。
在本发明实施例中,每个样本图像对应一条样本数据,通过样本数据来表示样本图像的图像特征。
在本发明实施例中,对样本图像进行降维处理,以提取高维数据的主要特征然后剔除数据中的噪声和冗余信息,从而加速模型的训练过程,
在本发明一实施例中,所述根据所述多个样本图像的样本数据和所述对应关系,对图像识别模型进行训练,直到生成满足要求的图像识别模型,包括:
S1:将所述多个样本图像的样本数据划分为训练集和测试集;
S2:将所述训练集中的样本数据输入到所述图像识别模型中,获取所述图像识别模型输出的类别;
S3:根据所述对应关系中的类别和所述图像识别模型输出的类别,对应所述图像识别模型进行调整;
S4:利用所述测试集中的样本数据和所述对应关系,确定所述图像识别模型识别的准确率是否大于预设准确率,如果是,则执行S5,否则,返回S2;
S5:将当前的所述图像识别模型作为所述满足要求的图像识别模型。
在本发明实施例中,通过训练集来训练图像识别模型,通过测试集对图像识别模型识别的准确率进行测试。举例来说,在对应关系中样本图像A对应的类别为类别A,将样本图像A的样本数据输入到图像识别模型中,获取图像识别模型输入的类别,如果图像识别模型输入的类别不是类别A,则需要对图像识别模型进行调整。
在步骤S4中,可以将测试集中的多个样本图像的样本数据输入到图像识别模型中,获取图像识别模型输出的类别。针对一个样本图像,如果图像识别模型对该样本图像的样本数据进行处理后输出的类别与对应关系中该样本图像对应的类别相同,则记录对该样本图像识别准确,如果不同,则记录对该样本图像识别不准确。统计识别准确样本图像的数量与参数测试的样本图像的总数量,将识别准确样本图像的数量除以该总数量得到识别的准确率。
该预设准确率根据要求设置,例如可以是90%等。
在本发明一实施例中,所述图像识别模型包括KNN模型;
所述根据所述多个样本图像的样本数据和所述对应关系,对图像识别模型进行训练,直到生成满足要求的图像识别模型,包括:
根据所述多个样本图像的样本数据和所述对应关系,利用KNN算法对所述KNN模型进行训练,直到生成满足要求的KNN模型超参数,根据满足要求的KNN模型超参数得到满足要求的KNN模型。
在本发明实施例中,通过KNN算法对KNN模型进行训练。具体地,可以利用KNN算法以交叉验证的方式对KNN模型进行训练,从而获得一个具有固定超参数的、人性化的、具有普适推广性的图像分辨器(也就是KNN模型)。
KNN算法将测试图像归类为与其“距离最近”的K个样本中数量最多的类别,采用多类别投票对比机制,消除了偶然性误差,更具有普适性、合理性、健壮性。
KNN算法基于大样本数据集和交叉验证方式来完成模型训练,获得的模型具有鲁棒性,健壮性,不易发生过拟合现象。
在本发明一实施例中,所述对所述多个样本图像进行降维处理,生成所述多个样本图像的样本数据,包括:
对所述多个样本图像进行处理,使得每个所述样本图像的像素数量相同;
根据每个所述样本图像的像素信息,生成一个二维数组,其中,所述二维数组的每一行对应一个样本图像,每一行的每个元素表示该行对应的样本图像的一个像素的像素信息;
确定所述二维数组的每行的元素的平均值,将每行的元素减去该行对应的平均值,得到第一矩阵;
确定所述第一矩阵的协方差矩阵;
确定所述协方差矩阵的特征值和特征向量;
确定所述协方差矩阵的最大的k个特征值以及该最大的k个特征值对应的特征向量;
根据该最大的k个特征值对应的特征向量,生成第二矩阵;
将第一矩阵的逆矩阵乘以所述第二矩阵,生成第三矩阵;
将所述二维数组中每个所述样本图像对应的行作为每个所述样本图像的图像向量;
将每个所述样本图像的图像向量乘以所述第三矩阵,得到每个所述样本图像的所述样本数据。
在本发明实施例中,首先对样本图像进行标准化,使得各个样本图像的像素数量相同,去除背景信息,并进行图片中心化处理,最终转化成尺寸一致的图像。
在上述的二维数组中,二维数组的行与样本图像一一对应。如果有m个样本图像,每个样本图像的像素数量为n,那么该二维数据就是一个m行n列的数组。上述的像素信息可以是像素的RGB值。在本发明实施例中,降维处理就是要通过更少的列来代表一个样本图像。
确定每行的元素的平均值,这些平均值构成了一个平均图像,每个样本图像与该平均图像的向量差组成第一矩阵。
协方差矩阵表示不同随机变量之间的相互关系,图像中也即求任意两个像素之间的关系。如果两个随机变量的协方差为正或为负,表明两个变量之间具有相关性,如果为零表示两个变量不相关。通过计算协方差矩阵,就可以获得不同像素之间的关系。其中,第一矩阵乘以第一矩阵的逆矩阵得到该协方差矩阵。
可以通过以下方式确定协方差矩阵的最大的k个特征值:将协方差矩阵的特征值按照从大到小的顺序排列,选择前k个特征值,该前k个特征值就是最大的k个特征值。k可以是一个预设的固定值,也可以是一个图像识别模型的超参数。
其中,第二矩阵是一个m×k的矩阵,第三矩阵是一个n×k的矩阵。
在本发明一实施例中,在所述利用所述满足要求的图像识别模型对待识别图像进行识别之前,进一步包括:
对所述待识别图像进行降维处理,生成所述待识别图像的待识别数据;
所述利用所述满足要求的图像识别模型对待识别图像进行识别,包括:
将所述待识别数据输入所述满足要求的图像识别模型中,利用所述满足要求的图像识别模型对所述待识别数据进行处理。
在本发明实施例中,在利用图像识别模型进行识别之前,可以预先对待识别图像进行降维处理,通过降维处理得到的待识别数据进行识别,能够减少识别过程的计算量,能够加快识别的速度。
下面通过一个具体的实施例来详细描述本发明实施例提供一种图像识别的方法,如图2所示,该方法可以包括以下步骤:
步骤201:确定用于训练的多个样本图像与类别的对应关系。
步骤202:对多个样本图像进行处理,使得每个样本图像的像素数量相同。
步骤203:根据每个样本图像的像素信息,生成一个二维数组,其中,二维数组的每一行对应一个样本图像,每一行的每个元素表示该行对应的样本图像的一个像素的像素信息。
步骤204:确定二维数组的每行的元素的平均值,将每行的元素减去该行对应的平均值,得到第一矩阵。
步骤205:确定第一矩阵的协方差矩阵,确定协方差矩阵的特征值和特征向量,确定协方差矩阵的最大的k个特征值以及该最大的k个特征值对应的特征向量。
步骤206:根据该最大的k个特征值对应的特征向量,生成第二矩阵。
步骤207:将第一矩阵的逆矩阵乘以第二矩阵,生成第三矩阵。
步骤208:将二维数组中每个样本图像对应的行作为每个样本图像的图像向量。
步骤209:将每个样本图像的图像向量乘以第三矩阵,得到每个样本图像的样本数据。
步骤210:将多个样本图像的样本数据划分为训练集和测试集。
具体地,可以按照按1:3的比例划分为测试集和训练集。
步骤211:根据训练集的样本数据和对应关系,利用KNN算法对KNN模型进行训练,并利用训练集对KNN模型进行验证,直到生成满足要求的KNN模型超参数,根据满足要求的KNN模型超参数得到满足要求的KNN模型。
步骤212:对待识别图像进行降维处理,生成待识别图像的待识别数据。
步骤213:将待识别数据输入满足要求的KNN模型中,利用满足要求的KNN模型对待识别数据进行处理,获取满足要求的KNN模型输出的识别结果。
具体地,该识别结果为KNN模型识别出的待识别图像所属于的类别。
在本发明实施例中,还可以通过PCA(principal components analysis,主成分分析)算法实现降维处理。
如图3所示,本发明实施例提供了一种图像识别的装置,包括:
确定模块301,用于确定用于训练的多个样本图像与类别的对应关系;
降维模块302,用于对所述多个样本图像进行降维处理,生成所述多个样本图像的样本数据;
训练模块303,用于根据所述多个样本图像的样本数据和所述对应关系,对图像识别模型进行训练,直到生成满足要求的图像识别模型;
识别模块304,用于利用所述满足要求的图像识别模型对待识别图像进行识别,获取所述满足要求的图像识别模型输出的识别结果。
在本发明一实施例中,所述训练模块,用于执行:
S1:将所述多个样本图像的样本数据划分为训练集和测试集;
S2:将所述训练集中的样本数据输入到所述图像识别模型中,获取所述图像识别模型输出的类别;
S3:根据所述对应关系中的类别和所述图像识别模型输出的类别,对应所述图像识别模型进行调整;
S4:利用所述测试集中的样本数据和所述对应关系,确定所述图像识别模型识别的准确率是否大于预设准确率,如果是,则执行S5,否则,返回S2;
S5:将当前的所述图像识别模型作为所述满足要求的图像识别模型。
在本发明一实施例中,所述图像识别模型包括KNN模型;
所所述训练模块,用于根据所述多个样本图像的样本数据和所述对应关系,利用KNN算法对所述KNN模型进行训练,直到生成满足要求的KNN模型超参数,根据满足要求的KNN模型超参数得到满足要求的KNN模型。
在本发明一实施例中,所述降维模块,用于执行:
对所述多个样本图像进行处理,使得每个所述样本图像的像素数量相同;
根据每个所述样本图像的像素信息,生成一个二维数组,其中,所述二维数组的每一行对应一个样本图像,每一行的每个元素表示该行对应的样本图像的一个像素的像素信息;
确定所述二维数组的每行的元素的平均值,将每行的元素减去该行对应的平均值,得到第一矩阵;
确定所述第一矩阵的协方差矩阵;
确定所述协方差矩阵的特征值和特征向量;
确定所述协方差矩阵的最大的k个特征值以及该最大的k个特征值对应的特征向量;
根据该最大的k个特征值对应的特征向量,生成第二矩阵;
将第一矩阵的逆矩阵乘以所述第二矩阵,生成第三矩阵;
将所述二维数组中每个所述样本图像对应的行作为每个所述样本图像的图像向量;
将每个所述样本图像的图像向量乘以所述第三矩阵,得到每个所述样本图像的所述样本数据;
在本发明一实施例中,该方法进一步包括:
预处理模块,用于对所述待识别图像进行降维处理,生成所述待识别图像的待识别数据;
所述识别模块,用于将所述待识别数据输入所述满足要求的图像识别模型中,利用所述满足要求的图像识别模型对所述待识别数据进行处理。
本发明实施例提供了一种电子设备,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行本发明实施例提供的任一所述的图像识别的方法。
本发明实施例提供了一种计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行本发明实施例提供的任一所述的图像识别的方法。
可以理解的是,本发明实施例示意的结构并不构成对图像识别的装置的具体限定。在本发明的另一些实施例中,图像识别的装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明还提供了一种计算机可读介质,存储用于使一计算机执行如本文所述的图像识别的方法的指令。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
需要说明的是,上述各流程和各系统结构图中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构,也可以是逻辑结构,即,有些模块可能由同一物理实体实现,或者,有些模块可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
以上各实施例中,硬件单元可以通过机械方式或电气方式实现。例如,一个硬件单元可以包括永久性专用的电路或逻辑(如专门的处理器,FPGA或ASIC)来完成相应操作。硬件单元还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。
上文通过附图和优选实施例对本发明进行了详细展示和说明,然而本发明不限于这些已揭示的实施例,基与上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的代码审核手段得到本发明更多的实施例,这些实施例也在本发明的保护范围之内。

Claims (10)

1.图像识别的方法,其特征在于,
确定用于训练的多个样本图像与类别的对应关系;
对所述多个样本图像进行降维处理,生成所述多个样本图像的样本数据;
根据所述多个样本图像的样本数据和所述对应关系,对图像识别模型进行训练,直到生成满足要求的图像识别模型;
还包括:
利用所述满足要求的图像识别模型对待识别图像进行识别,获取所述满足要求的图像识别模型输出的识别结果。
2.根据权利要求1所述的方法,其特征在于,
所述根据所述多个样本图像的样本数据和所述对应关系,对图像识别模型进行训练,直到生成满足要求的图像识别模型,包括:
S1:将所述多个样本图像的样本数据划分为训练集和测试集;
S2:将所述训练集中的样本数据输入到所述图像识别模型中,获取所述图像识别模型输出的类别;
S3:根据所述对应关系中的类别和所述图像识别模型输出的类别,对应所述图像识别模型进行调整;
S4:利用所述测试集中的样本数据和所述对应关系,确定所述图像识别模型识别的准确率是否大于预设准确率,如果是,则执行S5,否则,返回S2;
S5:将当前的所述图像识别模型作为所述满足要求的图像识别模型。
3.根据权利要求1所述的方法,其特征在于,
所述图像识别模型包括k最邻近KNN模型;
所述根据所述多个样本图像的样本数据和所述对应关系,对图像识别模型进行训练,直到生成满足要求的图像识别模型,包括:
根据所述多个样本图像的样本数据和所述对应关系,利用KNN算法对所述KNN模型进行训练,直到生成满足要求的KNN模型超参数,根据满足要求的KNN模型超参数得到满足要求的KNN模型。
4.根据权利要求1所述的方法,其特征在于,
所述对所述多个样本图像进行降维处理,生成所述多个样本图像的样本数据,包括:
对所述多个样本图像进行处理,使得每个所述样本图像的像素数量相同;
根据每个所述样本图像的像素信息,生成一个二维数组,其中,所述二维数组的每一行对应一个样本图像,每一行的每个元素表示该行对应的样本图像的一个像素的像素信息;
确定所述二维数组的每行的元素的平均值,将每行的元素减去该行对应的平均值,得到第一矩阵;
确定所述第一矩阵的协方差矩阵;
确定所述协方差矩阵的特征值和特征向量;
确定所述协方差矩阵的最大的k个特征值以及该最大的k个特征值对应的特征向量;
根据该最大的k个特征值对应的特征向量,生成第二矩阵;
将第一矩阵的逆矩阵乘以所述第二矩阵,生成第三矩阵;
将所述二维数组中每个所述样本图像对应的行作为每个所述样本图像的图像向量;
将每个所述样本图像的图像向量乘以所述第三矩阵,得到每个所述样本图像的所述样本数据。
5.根据权利要求1-4中任一所述的方法,其特征在于,
在所述利用所述满足要求的图像识别模型对待识别图像进行识别之前,进一步包括:
对所述待识别图像进行降维处理,生成所述待识别图像的待识别数据;
所述利用所述满足要求的图像识别模型对待识别图像进行识别,包括:
将所述待识别数据输入所述满足要求的图像识别模型中,利用所述满足要求的图像识别模型对所述待识别数据进行处理。
6.图像识别的装置,其特征在于,包括:
确定模块,用于确定用于训练的多个样本图像与类别的对应关系;
降维模块,用于对所述多个样本图像进行降维处理,生成所述多个样本图像的样本数据;
训练模块,用于根据所述多个样本图像的样本数据和所述对应关系,对图像识别模型进行训练,直到生成满足要求的图像识别模型;
识别模块,用于利用所述满足要求的图像识别模型对待识别图像进行识别,获取所述满足要求的图像识别模型输出的识别结果。
7.根据权利要求6所述的装置,其特征在于,
所述训练模块,用于执行:
S1:将所述多个样本图像的样本数据划分为训练集和测试集;
S2:将所述训练集中的样本数据输入到所述图像识别模型中,获取所述图像识别模型输出的类别;
S3:根据所述对应关系中的类别和所述图像识别模型输出的类别,对应所述图像识别模型进行调整;
S4:利用所述测试集中的样本数据和所述对应关系,确定所述图像识别模型识别的准确率是否大于预设准确率,如果是,则执行S5,否则,返回S2;
S5:将当前的所述图像识别模型作为所述满足要求的图像识别模型。
8.根据权利要求6所述的方法,其特征在于,
所述图像识别模型包括k最邻近KNN模型;
所所述训练模块,用于根据所述多个样本图像的样本数据和所述对应关系,利用KNN算法对所述KNN模型进行训练,直到生成满足要求的KNN模型超参数,根据满足要求的KNN模型超参数得到满足要求的KNN模型;
和/或,
所述降维模块,用于执行:
对所述多个样本图像进行处理,使得每个所述样本图像的像素数量相同;
根据每个所述样本图像的像素信息,生成一个二维数组,其中,所述二维数组的每一行对应一个样本图像,每一行的每个元素表示该行对应的样本图像的一个像素的像素信息;
确定所述二维数组的每行的元素的平均值,将每行的元素减去该行对应的平均值,得到第一矩阵;
确定所述第一矩阵的协方差矩阵;
确定所述协方差矩阵的特征值和特征向量;
确定所述协方差矩阵的最大的k个特征值以及该最大的k个特征值对应的特征向量;
根据该最大的k个特征值对应的特征向量,生成第二矩阵;
将第一矩阵的逆矩阵乘以所述第二矩阵,生成第三矩阵;
将所述二维数组中每个所述样本图像对应的行作为每个所述样本图像的图像向量;
将每个所述样本图像的图像向量乘以所述第三矩阵,得到每个所述样本图像的所述样本数据;
和/或,
进一步包括:
预处理模块,用于对所述待识别图像进行降维处理,生成所述待识别图像的待识别数据;
所述识别模块,用于将所述待识别数据输入所述满足要求的图像识别模型中,利用所述满足要求的图像识别模型对所述待识别数据进行处理。
9.电子设备,其特征在于,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行权利要求1至4中任一所述的方法。
10.计算机可读介质,其特征在于,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行权利要求1至5中任一所述的方法。
CN202010610701.2A 2020-06-30 2020-06-30 图像识别的方法及装置、电子设备、计算机可读介质 Pending CN111738350A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010610701.2A CN111738350A (zh) 2020-06-30 2020-06-30 图像识别的方法及装置、电子设备、计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010610701.2A CN111738350A (zh) 2020-06-30 2020-06-30 图像识别的方法及装置、电子设备、计算机可读介质

Publications (1)

Publication Number Publication Date
CN111738350A true CN111738350A (zh) 2020-10-02

Family

ID=72653620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010610701.2A Pending CN111738350A (zh) 2020-06-30 2020-06-30 图像识别的方法及装置、电子设备、计算机可读介质

Country Status (1)

Country Link
CN (1) CN111738350A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335753A (zh) * 2015-10-29 2016-02-17 小米科技有限责任公司 图像识别方法和装置
CN107045621A (zh) * 2016-10-28 2017-08-15 北京联合大学 基于lbp与lda的人脸表情识别方法
CN110111344A (zh) * 2019-05-13 2019-08-09 广州锟元方青医疗科技有限公司 病理切片图像分级方法、装置、计算机设备和存储介质
CN110110799A (zh) * 2019-05-13 2019-08-09 广州锟元方青医疗科技有限公司 细胞分类方法、装置、计算机设备和存储介质
CN111008640A (zh) * 2019-10-17 2020-04-14 平安科技(深圳)有限公司 图像识别模型训练及图像识别方法、装置、终端及介质
CN111062230A (zh) * 2018-10-16 2020-04-24 首都师范大学 一种性别识别模型训练方法和装置及性别识别方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335753A (zh) * 2015-10-29 2016-02-17 小米科技有限责任公司 图像识别方法和装置
CN107045621A (zh) * 2016-10-28 2017-08-15 北京联合大学 基于lbp与lda的人脸表情识别方法
CN111062230A (zh) * 2018-10-16 2020-04-24 首都师范大学 一种性别识别模型训练方法和装置及性别识别方法和装置
CN110111344A (zh) * 2019-05-13 2019-08-09 广州锟元方青医疗科技有限公司 病理切片图像分级方法、装置、计算机设备和存储介质
CN110110799A (zh) * 2019-05-13 2019-08-09 广州锟元方青医疗科技有限公司 细胞分类方法、装置、计算机设备和存储介质
CN111008640A (zh) * 2019-10-17 2020-04-14 平安科技(深圳)有限公司 图像识别模型训练及图像识别方法、装置、终端及介质

Similar Documents

Publication Publication Date Title
EP2808827B1 (en) System and method for OCR output verification
CN109284355B (zh) 一种批改试卷中口算题的方法及装置
CN109740617A (zh) 一种图像检测方法及装置
CN112052813B (zh) 染色体间易位识别方法、装置、电子设备及可读存储介质
WO2018092747A1 (ja) 学習済モデル生成方法、学習済モデル生成装置、信号データ判別方法、信号データ判別装置及び信号データ判別プログラム
CN113449725B (zh) 对象分类方法、装置、设备及存储介质
CN111242119B (zh) 车辆图像的处理方法、装置、电子设备和计算机可读介质
CN102982305A (zh) 信息处理设备和处理信息的方法、存储介质以及程序
CN115343676B (zh) 密封电子设备内部多余物定位技术的特征优化方法
CN115859128B (zh) 一种基于档案数据交互相似度的分析方法和系统
CN111626303A (zh) 性别和年龄的识别方法、装置、存储介质及服务器
CN115761366A (zh) 补充缺失特征的零样本图片分类方法、系统、设备及介质
JP2021111279A (ja) ラベルノイズ検出プログラム、ラベルノイズ検出方法及びラベルノイズ検出装置
CN114897037A (zh) 类别判定系统、类别判定方法及类别判定程序
US11373285B2 (en) Image generation device, image generation method, and image generation program
CN112560855B (zh) 图像信息提取方法、装置、电子设备及存储介质
CN113918471A (zh) 测试用例的处理方法、装置及计算机可读存储介质
CN111091194B (zh) 一种基于cavwnb_kl算法的操作系统识别方法
CN111738350A (zh) 图像识别的方法及装置、电子设备、计算机可读介质
CN112200182A (zh) 基于深度学习的晶圆id识别方法和装置
US20220067480A1 (en) Recognizer training device, recognition device, data processing system, data processing method, and storage medium
EP4064119A1 (en) Method and system for identifying a person
CN113139932B (zh) 一种基于集成学习的深度学习缺陷图像识别方法及系统
CN113158788A (zh) 人脸表情识别方法、装置、终端设备及存储介质
CN113239075A (zh) 一种施工数据自检方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201002

RJ01 Rejection of invention patent application after publication