CN109992691A - 一种图像识别方法和装置 - Google Patents

一种图像识别方法和装置 Download PDF

Info

Publication number
CN109992691A
CN109992691A CN201910230459.3A CN201910230459A CN109992691A CN 109992691 A CN109992691 A CN 109992691A CN 201910230459 A CN201910230459 A CN 201910230459A CN 109992691 A CN109992691 A CN 109992691A
Authority
CN
China
Prior art keywords
image
section
class
query
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910230459.3A
Other languages
English (en)
Inventor
钟石根
张良杰
张志刚
游陈盛
郭凌
郑海文
符伟成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nan Yang Xiamen Professional School
Original Assignee
Nan Yang Xiamen Professional School
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nan Yang Xiamen Professional School filed Critical Nan Yang Xiamen Professional School
Priority to CN201910230459.3A priority Critical patent/CN109992691A/zh
Publication of CN109992691A publication Critical patent/CN109992691A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种图像识别方法和装置,对查询图像进行分区,每个区间的像素大小相同;对查询图像进行解析,获取解析数据,其中,解析数据包括文字数据、每个区间灰度数据、区间连续变化数据获取查询图像对应的第一、二、三类相似图像,将不同类相似图像相互预匹配形成两类识别库,精确匹配识别库中各个图像与查询图像,确定查询图像与相似图像是否匹配成功。本发明能够对查询图像进行更深层次的解析,利用三类解析数据分别检索形成三类相似图像,再将三类相似图像基于区间灰度数据进行预匹配,形成两类识别库,将识别库中图像基于区间连续变化数据与查询图像进行精确匹配,即可得到精确的检索结果。

Description

一种图像识别方法和装置
技术领域
本发明涉及图像处理技术领域,尤其涉及一种图像识别方法和装置。
背景技术
图像检索技术能够检索查询图像中是否包含图像库中的一副或者多幅图像。图像检索技术分为离线训练及在线查询两个阶段。在离线训练阶段,提取图像库中所有图像的视觉特征,形成图像特征索引库。在在线查询阶段,提取查询图像的视觉特征,并与图像特征索引库进行对比,确定图像库中与查询图像相似度最高的一副或几幅参考图像;若确定出的参考图像与查询图像的相似度足够高,则可以认为查询图像包含这一幅或几幅参考图像。根据执行图像检索技术的主体不同,可分为云端图像检索与本地图像检索。现有图像检索技术的识别准确率较低,常常发生误识别现象,严重影响用户体验。
公开号为CN108334644B的专利说明书中公开了一种图像识别方法和装置。该方法包括:获取查询图像对应的相似图像,相似图像为根据查询图像的第一视觉特征检索得到的图像,所述第一视觉特征包括全局视觉特征和/或局部视觉特征;将查询图像的第二视觉特征与相似图像的第二视觉特征进行匹配,形成多组视觉特征对,所述第二视觉特征包括局部视觉特征;从所述多组视觉特征对中去除误匹配的视觉特征对;根据剩余的视觉特征对,确定查询图像与相似图像是否匹配成功。这种图像识别方法和装置仍存在不足之处,其未对查询图像进行更深层次的解析,导致检索结果不够精确,需要改进。
发明内容
本发明的目的在于克服现有技术中存在的上述问题,提供一种图像识别方法和装置。
为实现上述技术目的,达到上述技术效果,本发明是通过以下技术方案实现:
一种图像识别方法,包括如下步骤:
S001:对查询图像进行分区,每个区间的像素大小相同;
S002:对查询图像进行解析,获取解析数据,其中,所述解析数据包括文字数据、每个区间灰度数据、区间连续变化数据;其中,所述文字数据为图像自身的文字单词,所述区间灰度数据为其内所有像素点的灰度平均值,所述区间连续变化数据为每个区间与周围区间的灰度差值;
S003:获取查询图像对应的第一类相似图像,其中,所述第一类相似图像为根据查询图像的文字数据检索得到的图像;
S004:获取查询图像对应的第二类相似图像,其中,所述第二相似图像为根据查询图像的每个区间灰度数据检索得到的图像;
S005:获取查询图像对应的第三类相似图像,其中,所述第三相似图像为根据查询图像的每个区间连续变化数据检索得到的图像;
S006:预匹配获取的第一类相似图像、第二类相似图像和第三相似图像;将第一类相似图像、第二类相似图像匹配形成第一类识别库,将第一类相似图像、第三类相似图像匹配形成第二类识别库,将第二类相似图像和第三类相似图像匹配形成第三类识别库,其中,所述预匹配的过程为:将前类相似图像中各个图像与后类图像中各个图像进行单个对比,对比的两个图像对应区间的区别,以区间序号为X轴,以区间灰度差值为Y轴作拟合曲线,当对比的两个图像的拟合曲线重合度在设定范围时,将这两个图像同时移送至对应的识别库;
S007:精确匹配第一类识别库、第二类识别库中各个图像与查询图像,确定查询图像与相似图像是否匹配成功;其中,所述预匹配的过程为:将查询图像与第一类识别库、第二类识别库中各个图像进行单个对比,对比的两个图像对应区间的区间连续变化数据的区别,以区间序号为X轴,以区间连续变化数据为Y轴作拟合曲线,当对比的两个图像的拟合曲线重合度在设定范围时,将图像作为查询结果呈现。
上述图像识别方法中,每个所述区间的大小为(3-5)点×(3-5)点,每个点为一个像素点。
上述图像识别方法中,所述图像自身未包含文字单词时,所述文字单词图像自身的类别编号,根据数据库中类别分类查询对应的类别编号。
一种图像识别装置,该装置包括:
查询模块,用于对查询图像进行分区,每个区间的像素大小相同;
解析模块,用于对查询图像进行解析,获取解析数据,其中,所述解析数据包括文字数据、每个区间灰度数据、区间连续变化数据;其中,所述文字数据为图像自身的文字单词,所述区间灰度数据为其内所有像素点的灰度平均值,所述区间连续变化数据为每个区间与周围区间的灰度差值;
第一获取模块,用于获取查询图像对应的第一类相似图像,其中,所述第一类相似图像为根据查询图像的文字数据检索得到的图像;
第二获取模块,用于获取查询图像对应的第二类相似图像,其中,所述第二相似图像为根据查询图像的每个区间灰度数据检索得到的图像;
第三获取模块,用于获取查询图像对应的第三类相似图像,其中,所述第三相似图像为根据查询图像的每个区间连续变化数据检索得到的图像;
预匹配模块,用于预匹配获取的第一类相似图像、第二类相似图像和第三相似图像;将第一类相似图像、第二类相似图像匹配形成第一类识别库,将第一类相似图像、第三类相似图像匹配形成第二类识别库,将第二类相似图像和第三类相似图像匹配形成第三类识别库;
以及精确匹配模块,用于精确匹配第一类识别库、第二类识别库中各个图像与查询图像,确定查询图像与相似图像是否匹配成功。
本发明的有益效果是:
本发明能够对查询图像进行更深层次的解析,解析数据包含文字数据、每个区间灰度数据、区间连续变化数据,利用三个数据分别检索形成三类相似图像,再将三类相似图像基于区间灰度数据两两进行预匹配,形成两类识别库,此时识别库中图像数量已大幅缩小,将识别库中图像基于区间连续变化数据与查询图像进行精确匹配,即可得到精确的检索结果。
当然,实施本发明的任一产品并不一定需要同时达到以上的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例的图像识别方法的流程图;
图2为本发明一实施例的图像识别装置的组成框图;
图3为本发明一实施例的获取模块的扩展接口;
图中标号为:
001-查询模块,002-解析模块,003-第一获取模块,004-第二获取模块,005-第三获取模块,006-预匹配模块,007-精确匹配模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1-3所示,本实施例为一种图像识别方法,包括如下步骤:
S001:对查询图像进行分区,每个区间的像素大小相同;
S002:对查询图像进行解析,获取解析数据,其中,所述解析数据包括文字数据、每个区间灰度数据、区间连续变化数据;其中,所述文字数据为图像自身的文字单词,所述区间灰度数据为其内所有像素点的灰度平均值,所述区间连续变化数据为每个区间与周围区间的灰度差值;
S003:获取查询图像对应的第一类相似图像,其中,所述第一类相似图像为根据查询图像的文字数据检索得到的图像;
S004:获取查询图像对应的第二类相似图像,其中,所述第二相似图像为根据查询图像的每个区间灰度数据检索得到的图像;
S005:获取查询图像对应的第三类相似图像,其中,所述第三相似图像为根据查询图像的每个区间连续变化数据检索得到的图像;
S006:预匹配获取的第一类相似图像、第二类相似图像和第三相似图像;将第一类相似图像、第二类相似图像匹配形成第一类识别库,将第一类相似图像、第三类相似图像匹配形成第二类识别库,将第二类相似图像和第三类相似图像匹配形成第三类识别库,其中,所述预匹配的过程为:将前类相似图像中各个图像与后类图像中各个图像进行单个对比,对比的两个图像对应区间的区别,以区间序号为X轴,以区间灰度差值为Y轴作拟合曲线,当对比的两个图像的拟合曲线重合度在设定范围时,将这两个图像同时移送至对应的识别库;
S007:精确匹配第一类识别库、第二类识别库中各个图像与查询图像,确定查询图像与相似图像是否匹配成功;其中,所述预匹配的过程为:将查询图像与第一类识别库、第二类识别库中各个图像进行单个对比,对比的两个图像对应区间的区间连续变化数据的区别,以区间序号为X轴,以区间连续变化数据为Y轴作拟合曲线,当对比的两个图像的拟合曲线重合度在设定范围时,将图像作为查询结果呈现。
上述图像识别方法中,每个所述区间的大小为(3-5)点×(3-5)点,每个点为一个像素点。
上述图像识别方法中,所述图像自身未包含文字单词时,所述文字单词图像自身的类别编号,根据数据库中类别分类查询对应的类别编号。
本实施例还提供了一种图像识别装置,该装置包括:
查询模块001,用于对查询图像进行分区,每个区间的像素大小相同;
解析模块002,用于对查询图像进行解析,获取解析数据,其中,所述解析数据包括文字数据、每个区间灰度数据、区间连续变化数据;其中,所述文字数据为图像自身的文字单词,所述区间灰度数据为其内所有像素点的灰度平均值,所述区间连续变化数据为每个区间与周围区间的灰度差值;
第一获取模块003,用于获取查询图像对应的第一类相似图像,其中,所述第一类相似图像为根据查询图像的文字数据检索得到的图像;
第二获取模块004,用于获取查询图像对应的第二类相似图像,其中,所述第二相似图像为根据查询图像的每个区间灰度数据检索得到的图像;
第三获取模块005,用于获取查询图像对应的第三类相似图像,其中,所述第三相似图像为根据查询图像的每个区间连续变化数据检索得到的图像;
预匹配模块006,用于预匹配获取的第一类相似图像、第二类相似图像和第三相似图像;将第一类相似图像、第二类相似图像匹配形成第一类识别库,将第一类相似图像、第三类相似图像匹配形成第二类识别库,将第二类相似图像和第三类相似图像匹配形成第三类识别库;
以及精确匹配模块007,用于精确匹配第一类识别库、第二类识别库中各个图像与查询图像,确定查询图像与相似图像是否匹配成功。
三个获取模块均设有扩展接口,扩展接口包括:通信接口,用于与外界设备进行通信,进行数据交互传输。存储器可能包含高速RAM存储器,也可能还包括非易失性存储器,例如至少一个磁盘存储器。如果存储器、处理器和通信接口独立实现,则存储器、处理器和通信接口可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构总线、外部设备互连总线或扩展工业标准体系结构总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。可选的,在具体实现上,如果存储器、处理器及通信接口集成在一块芯片上,则存储器、处理器及通信接口可以通过内部接口完成相互间的通信。
本实施例能够对查询图像进行更深层次的解析,解析数据包含文字数据、每个区间灰度数据、区间连续变化数据,利用三个数据分别检索形成三类相似图像,再将三类相似图像基于区间灰度数据两两进行预匹配,形成两类识别库,此时识别库中图像数量已大幅缩小,将识别库中图像基于区间连续变化数据与查询图像进行精确匹配,即可得到精确的检索结果。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (4)

1.一种图像识别方法,其特征在于,包括如下步骤:
S001:对查询图像进行分区,每个区间的像素大小相同;
S002:对查询图像进行解析,获取解析数据,其中,所述解析数据包括文字数据、每个区间灰度数据、区间连续变化数据;其中,所述文字数据为图像自身的文字单词,所述区间灰度数据为其内所有像素点的灰度平均值,所述区间连续变化数据为每个区间与周围区间的灰度差值;
S003:获取查询图像对应的第一类相似图像,其中,所述第一类相似图像为根据查询图像的文字数据检索得到的图像;
S004:获取查询图像对应的第二类相似图像,其中,所述第二相似图像为根据查询图像的每个区间灰度数据检索得到的图像;
S005:获取查询图像对应的第三类相似图像,其中,所述第三相似图像为根据查询图像的每个区间连续变化数据检索得到的图像;
S006:预匹配获取的第一类相似图像、第二类相似图像和第三相似图像;将第一类相似图像、第二类相似图像匹配形成第一类识别库,将第一类相似图像、第三类相似图像匹配形成第二类识别库,将第二类相似图像和第三类相似图像匹配形成第三类识别库,其中,所述预匹配的过程为:将前类相似图像中各个图像与后类图像中各个图像进行单个对比,对比的两个图像对应区间的区别,以区间序号为X轴,以区间灰度差值为Y轴作拟合曲线,当对比的两个图像的拟合曲线重合度在设定范围时,将这两个图像同时移送至对应的识别库;
S007:精确匹配第一类识别库、第二类识别库中各个图像与查询图像,确定查询图像与相似图像是否匹配成功;其中,所述预匹配的过程为:将查询图像与第一类识别库、第二类识别库中各个图像进行单个对比,对比的两个图像对应区间的区间连续变化数据的区别,以区间序号为X轴,以区间连续变化数据为Y轴作拟合曲线,当对比的两个图像的拟合曲线重合度在设定范围时,将图像作为查询结果呈现。
2.根据权利要求1所述的图像识别方法,其特征在于:每个所述区间的大小为(3-5)点×(3-5)点,每个点为一个像素点。
3.根据权利要求1所述的图像识别方法,其特征在于:所述图像自身未包含文字单词时,所述文字单词图像自身的类别编号,根据数据库中类别分类查询对应的类别编号。
4.一种图像识别装置,其特征在于,该装置包括:
查询模块,用于对查询图像进行分区,每个区间的像素大小相同;
解析模块,用于对查询图像进行解析,获取解析数据,其中,所述解析数据包括文字数据、每个区间灰度数据、区间连续变化数据;其中,所述文字数据为图像自身的文字单词,所述区间灰度数据为其内所有像素点的灰度平均值,所述区间连续变化数据为每个区间与周围区间的灰度差值;
第一获取模块,用于获取查询图像对应的第一类相似图像,其中,所述第一类相似图像为根据查询图像的文字数据检索得到的图像;
第二获取模块,用于获取查询图像对应的第二类相似图像,其中,所述第二相似图像为根据查询图像的每个区间灰度数据检索得到的图像;
第三获取模块,用于获取查询图像对应的第三类相似图像,其中,所述第三相似图像为根据查询图像的每个区间连续变化数据检索得到的图像;
预匹配模块,用于预匹配获取的第一类相似图像、第二类相似图像和第三相似图像;将第一类相似图像、第二类相似图像匹配形成第一类识别库,将第一类相似图像、第三类相似图像匹配形成第二类识别库,将第二类相似图像和第三类相似图像匹配形成第三类识别库;
以及精确匹配模块,用于精确匹配第一类识别库、第二类识别库中各个图像与查询图像,确定查询图像与相似图像是否匹配成功。
CN201910230459.3A 2019-03-26 2019-03-26 一种图像识别方法和装置 Pending CN109992691A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910230459.3A CN109992691A (zh) 2019-03-26 2019-03-26 一种图像识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910230459.3A CN109992691A (zh) 2019-03-26 2019-03-26 一种图像识别方法和装置

Publications (1)

Publication Number Publication Date
CN109992691A true CN109992691A (zh) 2019-07-09

Family

ID=67131499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910230459.3A Pending CN109992691A (zh) 2019-03-26 2019-03-26 一种图像识别方法和装置

Country Status (1)

Country Link
CN (1) CN109992691A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502658A (zh) * 2019-08-21 2019-11-26 江西博微新技术有限公司 文档图像页码迁移方法、服务器及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502658A (zh) * 2019-08-21 2019-11-26 江西博微新技术有限公司 文档图像页码迁移方法、服务器及存储介质

Similar Documents

Publication Publication Date Title
CN109447078B (zh) 一种自然场景图像敏感文字的检测识别方法
CN113255694B (zh) 训练图像特征提取模型和提取图像特征的方法、装置
CN111179251A (zh) 基于孪生神经网络利用模板比对的缺陷检测系统及方法
CN113627508B (zh) 陈列场景识别方法、装置、设备以及存储介质
US5555320A (en) Pattern recognition system with improved recognition rate using nonlinear transformation
US10438083B1 (en) Method and system for processing candidate strings generated by an optical character recognition process
CN111191582B (zh) 三维目标检测方法、检测装置、终端设备及计算机可读存储介质
JP6997369B2 (ja) プログラム、測距方法、及び測距装置
CN111582033A (zh) 垃圾分类的识别方法、系统及计算机可读存储介质
WO2020134411A1 (zh) 一种商品类别识别方法、装置及电子设备
CN114429633B (zh) 文本识别方法、模型的训练方法、装置、电子设备及介质
CN112559688A (zh) 财报的阅读难度计算方法、装置、设备及可读存储介质
CN104966109B (zh) 医疗化验单图像分类方法及装置
CN106372216A (zh) 提高题目查找准确率的方法和装置
CN109992691A (zh) 一种图像识别方法和装置
CN111126384A (zh) 基于特征融合的商品分类系统及分类方法
CN114677566A (zh) 深度学习模型的训练方法、对象识别方法和装置
CN113592981B (zh) 图片标注方法、装置、电子设备和存储介质
CN112580620A (zh) 标志图片处理方法、装置、设备和介质
CN109993178B (zh) 一种特征数据生成和特征匹配方法及装置
CN106446902B (zh) 非文字图像识别方法和装置
CN112966606B (zh) 图像识别方法、相关装置及计算机程序产品
CN112733902B (zh) 烟盒识别方法
de M. Sá Junior et al. A simplified gravitational model for texture analysis
CN111695380B (zh) 目标检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination