CN116263992A - 图像识别方法、装置及存储介质 - Google Patents
图像识别方法、装置及存储介质 Download PDFInfo
- Publication number
- CN116263992A CN116263992A CN202211292284.7A CN202211292284A CN116263992A CN 116263992 A CN116263992 A CN 116263992A CN 202211292284 A CN202211292284 A CN 202211292284A CN 116263992 A CN116263992 A CN 116263992A
- Authority
- CN
- China
- Prior art keywords
- feature point
- initial feature
- determining
- grids
- feature points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000003190 augmentative effect Effects 0.000 claims abstract description 29
- 238000012937 correction Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000005286 illumination Methods 0.000 claims description 5
- 238000013461 design Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请实施例公开了一种图像识别方法及相关设备,可以提高增强现实图像识别的识别效率。该方法包括:获取目标图片所对应的N个初始特征点,其中,所述目标图片为待进行图像识别的图片,所述N为大于或等于1的整数;确定所述N个初始特征点中每个初始特征点的位置信息;根据所述每个初始特征点的位置信息确定所述每个初始特征点所对应的网格区域;根据所述每个初始特征点所对应的网格区域的RGB色值确定所述每个初始特征点所对应的比对结果;根据所述每个初始特征点所对应的比对结果确定所述目标图片所对应的识别特征点;根据所述目标图片所对应的识别特征点确定所述目标图片所对应的图像识别结果。
Description
技术领域
本申请涉及图像识别领域,尤其涉及一种图像识别方法、装置及存储介质。
背景技术
图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。增强现实图像识别技术原理是基于OpenCV图像集成库的特征点匹配。主要步骤是结合设备的摄像头,将拍摄到的图片封装成MAT格式文件,与OpenCV中的目标对象进行逐帧对比:将两个目标的特征点的空间定位进行实时比对,获取两个描述符集合间的匹配项,当图像矩阵符合对应项定位时,在空间中绘制出对应模型的跟踪轮廓。
针对增强现实图像识别的SDK主要有:IOS开发的ARKit、GoogleAR开发的ARCore、高通AR开发的Vuforia。以上增强现实SDK均有图像识别功能,但是,增强现实图像识别技术中有还未解决的技术壁垒。
首先,三个SDK的核心问题均为无法识别特征点较少的图片,由于图像识别技术基于特征点的位置匹配,但是特征点的分布和读取都很大程度影响图像识别的成功率,因此目前增强现实的图像识别,都对于被识别物有一定的限制。其次,由于增强现实图片识别技术仅识别特征点的x、y轴位置即平面坐标位置,导致摄像机位置对识别效果、精度和成功率影响严重。
发明内容
本申请实施例提供了一种图像识别方法、装置及存储介质,可以提高增强现实图像识别的识别效率。
本申请第一方面提供一种图像识别方法,可以包括:
获取目标图片所对应的N个初始特征点,其中,所述目标图片为待进行图像识别的图片,所述N为大于或等于1的整数;
确定所述N个初始特征点中每个初始特征点的位置信息;
根据所述每个初始特征点的位置信息确定所述每个初始特征点所对应的网格区域;
根据所述每个初始特征点所对应的网格区域的RGB色值确定所述每个初始特征点所对应的比对结果,所述比对结果为所述每个初始特征点所对应的网格区域中相邻两个子网格的RGB色值的差值与所述色值对比临界值的比对结果;
根据所述每个初始特征点所对应的比对结果确定所述目标图片所对应的识别特征点;
根据所述目标图片所对应的识别特征点确定所述目标图片所对应的图像识别结果。
本申请第二方面提供了一种图像识别装置,包括:
获取单元,用于获取目标图片所对应的N个初始特征点,其中,所述目标图片为待进行图像识别的图片,所述N为大于或等于1的整数;
位置确定单元,用于确定所述N个初始特征点中每个初始特征点的位置信息;
网格确定单元,用于根据所述每个初始特征点的位置信息确定所述每个初始特征点所对应的网格区域;
比对结果确定单元,用于根据所述每个初始特征点所对应的网格区域的RGB色值确定所述每个初始特征点所对应的比对结果,所述比对结果为所述每个初始特征点所对应的网格区域中相邻两个子网格的RGB色值的差值与所述色值对比临界值的比对结果;
特征点识别单元,用于根据所述每个初始特征点所对应的比对结果确定所述目标图片所对应的识别特征点;
特征点比对单元,用于根据所述目标图片所对应的识别特征点确定所述目标图片所对应的图像识别结果。
一种可能的设计中,所述比对结果确定单元具体用于:
确定所述目标图片所对应的色值对比临界值;
确定所述每个初始特征点所对应的网格区域内各个子网格的RGB色值;
将所述每个初始特征点所对应的网格区域内相邻两个子网格的RGB色值的差值与所述色值对比临界值进行比对,以得到所述比对结果。
一种可能的设计中,所述比对结果确定单元还具体用于:
通过如下公式将目标网格区域内相邻两个子网格的RGB色值的差值与所述色值对比临界值进行比对,以得到第一比对结果,所述目标网格区域为所述N个初始特征点中的任意一个特征点所对应的网格区域,所述相邻两个子网格为所述目标网格区域中边相邻的两个子网格:
|Ra1-Ra2|+|Ga1-Ga2|+|Ba1-Ba2|≧n;
其中,Ra1、Ga1以及Ba1为所述边相邻的两个子网格中的一个子网格的RGB色值,Ra2、Ga2以及Ba2为所述边相邻的两个子网格中的另一子网格的RGB色值,n为所述色值对比临界值;
若所述第一比对结果不满足预设条件,则通过如下公式将所述目标网格区域中相邻两个子网格的RGB色值的差值与所述色值对比临界值进行比对,以得到第二比对结果,所述相邻两个子网格为所述目标网格区域中对角相邻的两个子网格:
|Ra1-Ra2|+|Ga1-Ga2|+|Ba1-Ba2|≧n;
其中,Ra1、Ga1以及Ba1为所述对角相邻的两个子网格中的一个子网格的RGB色值,Ra2、Ga2以及Ba2为所述对角相邻的两个子网格中的另一子网格的RGB色值,n为所述色值对比临界值;
其中,所述第一比对结果和所述第二比对结果均为所述比对结果。
一种可能的设计中,所述特征点识别单元具体用于:
若所述第一比对结果为所述目标网格区域中边相邻两个子网格的RGB色值的差值均大于所述色值对比临界值,则将所述目标网格区域所对应的特征点确定为所述识别特征点;
若所述第一比对结果为所述目标网格区域中存在M组边相邻两个子网格的RGB色值的差值小于所述色值对比临界值,且所述第二比对结果为所述目标网格区域中对角相邻的两个子网格的RGB色值的差值均小于所述色值对比临界值,则将所述目标网格区域所对应的特征点作废,其中,M为大于或等于2的整数;
若所述第一比对结果为所述目标网格区域中存在M组边相邻两个子网格的RGB色值的差值小于所述色值对比临界值,且所述第二比对结果为所述目标网格区域中存在一组对角相邻的两个子网格的RGB色值的差值大于所述色值对比临界值,则将所述目标网格区域所对应的特征点确定为所述识别特征点。
一种可能的设计中,所述比对结果确定单元还具体用于:
确定所述目标图片所对应的增强现实影响因素,所述增强现实影响因素包括所述目标图片所对应的对比度、明度以及识别环境中的光照强弱;
根据所述增强现实影响因素确定所述目标图片所对应的色值对比临界值。
一种可能的设计中,所述网格确定单元具体用于:
根据所述每个初始特征点的位置信息确定所述每个初始特征点所对应的边界范围点;
将所述每个初始特征点所对应的边界范围点所围成的区域确定为所述每个初始特征点所对应的网格区域。
一种可能的设计中,所述特征点比对单元具体用于:
将所述识别特征点所对应的特征点分布与所述N个初始特征点进行比对,以得到瑕疵特征点,所述瑕疵特征点为所述N个初始特征点中未识别成功的特征点和识别位置不准确的特征点;
对所述未识别成功的特征点和所述位置不够准确的特征点进行坐标修正,以得到修正特征点;
将所述识别特征点以及所述修正特征点确定为所述图像识别结果。
本申请第三方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一可执行指令,所述可执行指令在计算设备上运行时,使得计算设备执行如本申请第一方面所述的图像识别方法。
本申请第四方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本申请第一方面所述的图像识别方法。
本申请第五方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本申请第一方面所述的图像识别方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
在对目标图片进行识别时,图像识别装置可以确定N个初始特征点的位置信息,并确定该N个初始特征点的位置信息所对应的网格区域,之后根据相应网格的RGB色值来确定每个初始特征点的比对结果,进而可以通过比对结果确定识别特征点,最终通过识别特征点与初始特征点进行比对确定图像识别结果。由此,可以通过色值的比对方式优化增强图像识别技术,进而提高增强现实图像识别的识别效率。
附图说明
附图仅用于示出实施方式,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本申请实施例提供的图像识别方法的流程示意图;
图2为本申请实施例提供的构建初始特征点坐标系的示意图;
图3为本申请实施例提供的网格区域的示意图;
图4为本申请实施例提供的边相邻的两个子网格的示意图;
图5为本申请实施例提供的对角相邻的两个子网格的示意图;
图6为本申请实施例提供的图像识别装置的虚拟结构示意图;
图7为本申请实施例提供的图像识别装置的硬件结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,都应当属于本申请保护的范围。
随着智能手机的兴起,增强现实技术有了天然的开发载体,视频式增强现实技术迅速地发展起来。本发明在分析图像识别技术特征锚点位置匹配的基础上,加入对目标图像的色值匹配和颜色比对,通过结合目标图像的色值优化现有增强现实技术图像识别功能的精准度和成功率。将移动端设备摄像头获取到的色值和录入OpenCV图像集成库的图像色值进行对比,满足相似度数值即为匹配成功。成果可用于优化增强现实图像识别技术,使增强现实图像识别不再受到摄像机位置的影响,减少增强现实被识别图片的特征限制,并在一定程度上提高增强现实图像识别的识别效率。
下面从图像识别装置的角度对本申请提供的图像识别方法进行具体说明。
请参阅图1,图1为本申请实施例提供的图像识别方法的流程示意图,包括:
101、获取目标图片所对应的N个初始特征点。
本实施例中,图像识别装置可以获取目标图片所对应的N个初始特征点,其中,目标图片为待进行图像识别的图片,N为大于或等于1的整数。具体的,可以将该目标图片录入增强现实图片识别系统,并保留该目标图片所对应的RGB色值。
102、确定N个初始特点中每个初始点的位置信息。
本实施例中,图像识别装置可以确定N个初始特征点中每个初始特征点的位置信息,此处以坐标的形式对N个初始特征点中每个初始特征点的位置信息进行表示(当然也还可以通过其他的位置表示形式对每个初始特征点的位置信息进行表示,例如经纬度,具体不做限定),下面结合图2进行说明,请参阅图2,图2为本申请实施例提供的构建初始特征点坐标系的示意图,图像识别装置可以根据增强像是图片识别技术,在空间中建立并生成二位平面直角坐标系,并目标图片进行灰度图识别,得到目标图片所对应的N个初始特征点中的每个初始特征点的(x,y)坐标值,图2中以目标图片包括A和B两个初始特征点为例进行说明,初始特征点A的坐标为(Xa,Ya),初始特征点B的坐标(Xb,Yb)。
103、根据每个初始特征点的位置信息确定每个初始特征点所对应的网格区域。
本实施例中,图像识别装置可以根据每个初始特征点的位置信息确定每个特征点所对应的边界范围点,并将每个特征点所对应的边界范围点所围成的区域确定为每个特征点所对应的网格区域,下面结合图3进行说明,请参阅图3,图3为本申请实施例提供的网格区域的示意图,以初始特征点A为例,在平面直接坐标系中,将初始特征点A单位范围内2×2网格所围成的区域作为初始特征点A所对应的网格区域,也即301区域,也即选取以A1(xa-1、ya-1)、A2(xa-1、ya+1)、A3(xa+1、ya-1)、A4(xa+1、ya+1)四个点为边界点的网格范围,初始特征点B所对应的网格区域302也是如此。
需要说明的是,图3中以2×2网格为例进行说明,当然也还可以是3×3网格,具体不做限定。
104、根据每个初始特征点所对应的网格区域的RGB色值确定每个初始特征点所对应的比对结果。
本实施例中,图像识别装置可以根据每个初始特征点所对应的网格区域的RGB色值确定每个初始特征点所对应的比对结果,该比对结果为每个初始特征点所对应的网格区域中相邻两个子网格的RGB色值的差值与色值对比临界值的比对结果。下面进行具体说明:
图像识别装置可以首先确定目标图片所对应的色值对比临界值,具体的,可以确定目标图片所对应的增强现实影响因素,该增强现实影响因素包括目标图片所对应的对比度、明度以及识别环境中的光照强弱,并根据该增强现实影响因素确定目标图片所对应的色值对比临界值。也即,用户可以根据目标图片的对比度、明度以及识别环境中的光照强弱等影响增强现实图片识别的具体因素设置色值对比的临界值,进而来决定识别特征点的数量,默认值为100;
同时确定每个特征点所对应的网格区域内各个子网格的RGB色值,如图3所示,以初始特征点A为例进行说明,取初始特征点A单位范围中2×2网格内RGB色值进行识别,获取到四个网格内Ra、Ga、Ba共十二个色值;
最后将每个特征点所对应的网格区域内相邻两个子网格的RGB色值的差值与色值对比临界值进行比对,以得到比对结果;具体的,可以通过如下公式将目标网格区域内相邻两个字网络的RGB色值的差值与色值对比临界值进行比对,以得到第一比对结果,其中,该目标网格区域为N个初始特征点中的任意一个特征点所对应的网格区域,相邻两个子网格为目标网格区域中边相邻的两个子网格:
|Ra1-Ra2|+|Ga1-Ga2|+|Ba1-Ba2|≧n;
其中,Ra1、Ga1以及Ba1为边相邻的两个子网格中的一个子网格的RGB色值,Ra2、Ga2以及Ba2为边相邻的两个子网格中的另一子网格的RGB色值,n为色值对比临界值;
若第一比对结果不满足预设条件,则通过如下公式将目标网格区域中相邻两个子网格的RGB色值的差值与色值对比临界值进行比对,以得到第二比对结果,相邻两个子网格为目标网格区域中对角相邻的两个子网格:
|Ra1-Ra2|+|Ga1-Ga2|+|Ba1-Ba2|≧n;
其中,Ra1、Ga1以及Ba1为对角相邻的两个子网格中的一个子网格的RGB色值,Ra2、Ga2以及Ba2为对角相邻的两个子网格中的另一子网格的RGB色值,n为色值对比临界值;
其中,第一比对结果和第二比对结果均为比对结果。下面结合图4对边相邻的两个子网格的对比结果进行说明:
请参阅图4,以初始特征点A以及网格区域为2×2网格为例进行说明,分别通过如下公式将401、402、403、404网格区域中的两个子网格的RGB色值的差值与色值对比临界值进行对比计算(为了便于理解,下面以401网格区域中的两个子网格为例进行说明):
|Ra1-Ra2|+|Ga1-Ga2|+|Ba1-Ba2|≧n;
其中,Ra1、Ga1以及Ba1为401网格区域中的两个子网格中一个子网格的RGB色值,Ra2、Ga2以及Ba2为401网格区域中的两个子网格中另一个子网格的RGB色值,n为色值对比临界值;首先计算401网格区域中两个子网格中RGB色值的差值,之后对RGB色值的差值取绝对值之后相加,并将相加得到的记过与色值对比临界值n进行对比,尽可以得到第一对比结果。
下面通过图5对对角相邻的两个子网格的对比结果进行说明,以初始特征点A和网格区域为2×2网格为例进行说明,分别通过如下公式将501和502中的两个子网格的RGB色值的差值与色值对比临界值进行对比计算(为了便于理解,下面以501网格区域中的两个子网格为例进行说明):
|Ra1-Ra2|+|Ga1-Ga2|+|Ba1-Ba2|≧n;
其中,Ra1、Ga1以及Ba1为501网格区域中一个子网格的RGB色值,Ra2、Ga2以及Ba2为501网格区域中另一子网格的RGB色值,n为色值对比临界值;首先计算501网格区域中两个子网格中RGB色值的差值,之后对RGB色值的差值取绝对值之后相加,并将相加得到的记过与色值对比临界值n进行对比,尽可以得到第一对比结果。
可以理解的是,该401、402、403、404网格区域中的两个子网格为边相邻的两个子网格,该501网格区域中的两个子网格为对角相邻的两个子网格。
105、根据每个初始特征点所对应的比对结果确定目标图片所对应的识别特征点。
本实施例中,图像识别装置在确定每个初始特征点所对应的比对结果之后,可以根据每个初始特征点所对应的比对结果确定目标图片所对应的识别特征点,具体如下:
若第一比对结果为目标网格区域中边相邻两个子网格的RGB色值的差值均大于色值对比临界值,则将目标网格区域所对应的特征点确定为识别特征点;
若第一比对结果为目标网格区域中存在M组边相邻两个子网格的RGB色值的差值小于色值对比临界值,且第二比对结果为目标网格区域中对角相邻的两个子网格的RGB色值的差值均小于色值对比临界值,则将目标网格区域所对应的特征点作废,其中,M为大于或等于2的整数;
若第一比对结果为目标网格区域中存在M组边相邻两个子网格的RGB色值的差值小于色值对比临界值,且第二比对结果为目标网格区域中存在一组对角相邻的两个子网格的RGB色值的差值大于色值对比临界值,则将目标网格区域所对应的特征点确定为识别特征点。
106、根据目标图片所对应的识别特征点确定目标图片所对应的图像识别结果。
本实施例中,图像识别装置在确定目标图片所对应的识别特征点之后,可以首先确定识别特征点的特征点分布图,之后将识别特征点所对应的特征点分布于N个初始特征点进行比对,以得到瑕疵特征点,其中,该瑕疵特征点为N个初始特征点中未识别成功的特征点以及识别位置不准确的特征点;并对未识别成功的特征点和位置不够准确的特征点进行坐标修正,以得到修正特征点;将识别特征点以及修正特征点确定为图像识别结果。
综上所述,可以看出,本申请提供的实施例中,在对目标图片进行识别时,图像识别装置可以确定N个初始特征点的位置信息,并确定该N个初始特征点的位置信息所对应的网格区域,之后根据相应网格的RGB色值来确定每个初始特征点的比对结果,进而可以通过比对结果确定识别特征点,最终通过识别特征点与初始特征点进行比对确定图像识别结果。由此,由此,可以通过色值的比对方式优化增强图像识别技术,进而提高增强现实图像识别的识别效率。
上面从图像识别方法对本申请实施例进行说明,下面从图像识别装置的角度对本申请实施例进行说明:
请参阅图6,图6为本申请实施例提供的图像识别装置的虚拟结构示意图,该图像识别装置600包括:
获取单元601,用于获取目标图片所对应的N个初始特征点,其中,所述目标图片为待进行图像识别的图片,所述N为大于或等于1的整数;
位置确定单元602,用于确定所述N个初始特征点中每个初始特征点的位置信息;
网格确定单元603,用于根据所述每个初始特征点的位置信息确定所述每个初始特征点所对应的网格区域;
比对结果确定单元604,用于根据所述每个初始特征点所对应的网格区域的RGB色值确定所述每个初始特征点所对应的比对结果,所述比对结果为所述每个初始特征点所对应的网格区域中相邻两个子网格的RGB色值的差值与所述色值对比临界值的比对结果;
特征点识别单元605,用于根据所述每个初始特征点所对应的比对结果确定所述目标图片所对应的识别特征点;
特征点比对单元606,用于根据所述目标图片所对应的识别特征点确定所述目标图片所对应的图像识别结果。
一种可能的设计中,所述比对结果确定单元604具体用于:
确定所述目标图片所对应的色值对比临界值;
确定所述每个初始特征点所对应的网格区域内各个子网格的RGB色值;
将所述每个初始特征点所对应的网格区域内相邻两个子网格的RGB色值的差值与所述色值对比临界值进行比对,以得到所述比对结果。
一种可能的设计中,所述比对结果确定单元604还具体用于:
通过如下公式将目标网格区域内相邻两个子网格的RGB色值的差值与所述色值对比临界值进行比对,以得到第一比对结果,所述目标网格区域为所述N个初始特征点中的任意一个特征点所对应的网格区域,所述相邻两个子网格为所述目标网格区域中边相邻的两个子网格:
|Ra1-Ra2|+|Ga1-Ga2|+|Ba1-Ba2|≧n;
其中,Ra1、Ga1以及Ba1为所述边相邻的两个子网格中的一个子网格的RGB色值,Ra2、Ga2以及Ba2为所述边相邻的两个子网格中的另一子网格的RGB色值,n为所述色值对比临界值;
若所述第一比对结果不满足预设条件,则通过如下公式将所述目标网格区域中相邻两个子网格的RGB色值的差值与所述色值对比临界值进行比对,以得到第二比对结果,所述相邻两个子网格为所述目标网格区域中对角相邻的两个子网格:
|Ra1-Ra2|+|Ga1-Ga2|+|Ba1-Ba2|≧n;
其中,Ra1、Ga1以及Ba1为所述对角相邻的两个子网格中的一个子网格的RGB色值,Ra2、Ga2以及Ba2为所述对角相邻的两个子网格中的另一子网格的RGB色值,n为所述色值对比临界值;
其中,所述第一比对结果和所述第二比对结果均为所述比对结果。
一种可能的设计中,所述特征点识别单元605具体用于:
若所述第一比对结果为所述目标网格区域中边相邻两个子网格的RGB色值的差值均大于所述色值对比临界值,则将所述目标网格区域所对应的特征点确定为所述识别特征点;
若所述第一比对结果为所述目标网格区域中存在M组边相邻两个子网格的RGB色值的差值小于所述色值对比临界值,且所述第二比对结果为所述目标网格区域中对角相邻的两个子网格的RGB色值的差值均小于所述色值对比临界值,则将所述目标网格区域所对应的特征点作废,其中,M为大于或等于2的整数;
若所述第一比对结果为所述目标网格区域中存在M组边相邻两个子网格的RGB色值的差值小于所述色值对比临界值,且所述第二比对结果为所述目标网格区域中存在一组对角相邻的两个子网格的RGB色值的差值大于所述色值对比临界值,则将所述目标网格区域所对应的特征点确定为所述识别特征点。
一种可能的设计中,所述比对结果确定单元604还具体用于:
确定所述目标图片所对应的增强现实影响因素,所述增强现实影响因素包括所述目标图片所对应的对比度、明度以及识别环境中的光照强弱;
根据所述增强现实影响因素确定所述目标图片所对应的色值对比临界值。
一种可能的设计中,所述网格确定单元603具体用于:
根据所述每个初始特征点的位置信息确定所述每个初始特征点所对应的边界范围点;
将所述每个初始特征点所对应的边界范围点所围成的区域确定为所述每个初始特征点所对应的网格区域。
一种可能的设计中,所述特征点比对单元606具体用于:
将所述识别特征点所对应的特征点分布与所述N个初始特征点进行比对,以得到瑕疵特征点,所述瑕疵特征点为所述N个初始特征点中未识别成功的特征点和识别位置不准确的特征点;
对所述未识别成功的特征点和所述位置不够准确的特征点进行坐标修正,以得到修正特征点;
将所述识别特征点以及所述修正特征点确定为所述图像识别结果。
本申请实施例还提供了另一种图像识别装置,如图7所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该图像识别装置可以为包括手机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)、POS(Point of Sales,销售终端)、车载电脑等任意终端设备,以图像识别装置为手机为例:
图7示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图7,手机包括:射频(Radio Frequency,RF)电路710、存储器720、输入单元730、显示单元740、传感器750、音频电路760、无线保真(wireless fidelity,WiFi)模块770、处理器780、以及电源790等部件。本领域技术人员可以理解,图7中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图7对手机的各个构成部件进行具体的介绍:
RF电路710可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器780处理;另外,将设计上行的数据发送给基站。通常,RF电路710包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,LNA)、双工器等。此外,RF电路710还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication,GSM)、通用分组无线服务(General Packet RadioService,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE)、电子邮件、短消息服务(Short Messaging Service,SMS)等。
存储器720可用于存储软件程序以及模块,处理器780通过运行存储在存储器720的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器720可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器720可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元730可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元730可包括触控面板731以及其他输入设备732。触控面板731,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板731上或在触控面板731附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板731可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器780,并能接收处理器780发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板731。除了触控面板731,输入单元730还可以包括其他输入设备732。具体地,其他输入设备732可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元740可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元740可包括显示面板741,可选的,可以采用液晶显示器(Liquid CrystalDisplay,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板741。进一步的,触控面板731可覆盖显示面板741,当触控面板731检测到在其上或附近的触摸操作后,传送给处理器780以确定触摸事件的类型,随后处理器780根据触摸事件的类型在显示面板741上提供相应的视觉输出。虽然在图7中,触控面板731与显示面板741是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板731与显示面板741集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器750,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板741的亮度,接近传感器可在手机移动到耳边时,关闭显示面板741和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路760、扬声器761,传声器762可提供用户与手机之间的音频接口。音频电路760可将接收到的音频数据转换后的电信号,传输到扬声器761,由扬声器761转换为声音信号输出;另一方面,传声器762将收集的声音信号转换为电信号,由音频电路760接收后转换为音频数据,再将音频数据输出处理器780处理后,经RF电路710以发送给比如另一手机,或者将音频数据输出至存储器720以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块770可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图7示出了WiFi模块770,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器780是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器720内的软件程序和/或模块,以及调用存储在存储器720内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器780可包括一个或多个处理单元;优选的,处理器780可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器780中。
手机还包括给各个部件供电的电源790(比如电池),优选的,电源可以通过电源管理系统与处理器780逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请施例中,该终端所包括的处理器780还可以执行上述由图像识别装置所执行的操作。
本申请还提供一种计算机可读存储介质,存储介质中存储有至少一可执行指令,所述可执行指令在计算设备上运行时,使得计算设备执行上述任意实施例所述的图像识别方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(Digital Subscriber Line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(Solid State Disk,SSD))等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种图像识别方法,其特征在于,包括:
获取目标图片所对应的N个初始特征点,其中,所述目标图片为待进行图像识别的图片,所述N为大于或等于1的整数;
确定所述N个初始特征点中每个初始特征点的位置信息;
根据所述每个初始特征点的位置信息确定所述每个初始特征点所对应的网格区域;
根据所述每个初始特征点所对应的网格区域的RGB色值确定所述每个初始特征点所对应的比对结果,所述比对结果为所述每个初始特征点所对应的网格区域中相邻两个子网格的RGB色值的差值与所述色值对比临界值的比对结果;
根据所述每个初始特征点所对应的比对结果确定所述目标图片所对应的识别特征点;
根据所述目标图片所对应的识别特征点确定所述目标图片所对应的图像识别结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述每个初始特征点所对应的网格区域的RGB色值确定所述每个初始特征点所对应的比对结果包括:
确定所述目标图片所对应的色值对比临界值;
确定所述每个初始特征点所对应的网格区域内各个子网格的RGB色值;
将所述每个初始特征点所对应的网格区域内相邻两个子网格的RGB色值的差值与所述色值对比临界值进行比对,以得到所述比对结果。
3.根据权利要求2所述的方法,其特征在于,所述将所述每个初始特征点所对应的网格区域内相邻两个子网格的RGB色值的差值与所述色值对比临界值进行比对,以得到所述比对结果包括:
通过如下公式将目标网格区域内相邻两个子网格的RGB色值的差值与所述色值对比临界值进行比对,以得到第一比对结果,所述目标网格区域为所述N个初始特征点中的任意一个特征点所对应的网格区域,所述相邻两个子网格为所述目标网格区域中边相邻的两个子网格:
|Ra1-Ra2|+|Ga1-Ga2|+|Ba1-Ba2|≧n;
其中,Ra1、Ga1以及Ba1为所述边相邻的两个子网格中的一个子网格的RGB色值,Ra2、Ga2以及Ba2为所述边相邻的两个子网格中的另一子网格的RGB色值,n为所述色值对比临界值;
若所述第一比对结果不满足预设条件,则通过如下公式将所述目标网格区域中相邻两个子网格的RGB色值的差值与所述色值对比临界值进行比对,以得到第二比对结果,所述相邻两个子网格为所述目标网格区域中对角相邻的两个子网格:
|Ra1-Ra2|+|Ga1-Ga2|+|Ba1-Ba2|≧n;
其中,Ra1、Ga1以及Ba1为所述对角相邻的两个子网格中的一个子网格的RGB色值,Ra2、Ga2以及Ba2为所述对角相邻的两个子网格中的另一子网格的RGB色值,n为所述色值对比临界值;
其中,所述第一比对结果和所述第二比对结果均为所述比对结果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述每个初始特征点所对应的比对结果确定所述目标图片所对应的识别特征点包括:
若所述第一比对结果为所述目标网格区域中边相邻两个子网格的RGB色值的差值均大于所述色值对比临界值,则将所述目标网格区域所对应的特征点确定为所述识别特征点;
若所述第一比对结果为所述目标网格区域中存在M组边相邻两个子网格的RGB色值的差值小于所述色值对比临界值,且所述第二比对结果为所述目标网格区域中对角相邻的两个子网格的RGB色值的差值均小于所述色值对比临界值,则将所述目标网格区域所对应的特征点作废,其中,M为大于或等于2的整数;
若所述第一比对结果为所述目标网格区域中存在M组边相邻两个子网格的RGB色值的差值小于所述色值对比临界值,且所述第二比对结果为所述目标网格区域中存在一组对角相邻的两个子网格的RGB色值的差值大于所述色值对比临界值,则将所述目标网格区域所对应的特征点确定为所述识别特征点。
5.根据权利要求2所述的方法,其特征在于,所述确定所述目标图片所对应的色值对比临界值包括:
确定所述目标图片所对应的增强现实影响因素,所述增强现实影响因素包括所述目标图片所对应的对比度、明度以及识别环境中的光照强弱;
根据所述增强现实影响因素确定所述目标图片所对应的色值对比临界值。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述根据所述每个初始特征点的位置信息确定所述每个初始特征点所对应的网格区域包括:
根据所述每个初始特征点的位置信息确定所述每个初始特征点所对应的边界范围点;
将所述每个初始特征点所对应的边界范围点所围成的区域确定为所述每个初始特征点所对应的网格区域。
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述根据所述目标图片所对应的识别特征点确定所述目标图片所对应的图像识别结果包括:
将所述识别特征点所对应的特征点分布与所述N个初始特征点进行比对,以得到瑕疵特征点,所述瑕疵特征点为所述N个初始特征点中未识别成功的特征点和识别位置不准确的特征点;
对所述未识别成功的特征点和所述位置不够准确的特征点进行坐标修正,以得到修正特征点;
将所述识别特征点以及所述修正特征点确定为所述图像识别结果。
8.一种图像识别装置,其特征在于,包括:
获取单元,用于获取目标图片所对应的N个初始特征点,其中,所述目标图片为待进行图像识别的图片,所述N为大于或等于1的整数;
位置确定单元,用于确定所述N个初始特征点中每个初始特征点的位置信息;
网格确定单元,用于根据所述每个初始特征点的位置信息确定所述每个初始特征点所对应的网格区域;
比对结果确定单元,用于根据所述每个初始特征点所对应的网格区域的RGB色值确定所述每个初始特征点所对应的比对结果,所述比对结果为所述每个初始特征点所对应的网格区域中相邻两个子网格的RGB色值的差值与所述色值对比临界值的比对结果;
特征点识别单元,用于根据所述每个初始特征点所对应的比对结果确定所述目标图片所对应的识别特征点;
特征点比对单元,用于根据所述目标图片所对应的识别特征点确定所述目标图片所对应的图像识别结果。
9.一种计算机程序产品,其特征在于,当所述计算机程序产品在计算机上运行时,使得所述计算机执行权利要求1至7中任一项所述的图像识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一可执行指令,所述可执行指令在计算设备上运行时,使得计算设备执行如权利要求1至7中任一项所述的图像识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211292284.7A CN116263992A (zh) | 2022-10-21 | 2022-10-21 | 图像识别方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211292284.7A CN116263992A (zh) | 2022-10-21 | 2022-10-21 | 图像识别方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116263992A true CN116263992A (zh) | 2023-06-16 |
Family
ID=86722769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211292284.7A Pending CN116263992A (zh) | 2022-10-21 | 2022-10-21 | 图像识别方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116263992A (zh) |
-
2022
- 2022-10-21 CN CN202211292284.7A patent/CN116263992A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3407177B1 (en) | Method for capturing fingerprint and associated products | |
CN108205398B (zh) | 网页动画适配屏幕的方法和装置 | |
CN106203459B (zh) | 图片处理方法及装置 | |
CN109086761B (zh) | 图像处理方法和装置、存储介质、电子设备 | |
CN104200211A (zh) | 图像二值化方法及装置 | |
CN107450841B (zh) | 交互对象控制方法及装置 | |
CN110147742B (zh) | 一种关键点定位方法、装置及终端 | |
CN110705497A (zh) | 图像帧处理方法、装置、终端设备及计算机可读存储介质 | |
US20210099566A1 (en) | Dialing method and mobile terminal | |
CN107330867B (zh) | 图像合成方法、装置、计算机可读存储介质和计算机设备 | |
CN110083742B (zh) | 一种视频查询方法和装置 | |
CN105513098B (zh) | 一种图像处理的方法和装置 | |
CN110109788B (zh) | 多按键检测方法、装置、电子设备及存储介质 | |
CN110908586B (zh) | 一种键盘的显示方法、装置及终端设备 | |
CN108829600B (zh) | 算法库的测试方法、装置、存储介质和电子设备 | |
CN110708673A (zh) | 一种位置确定方法和便捷式多功能设备 | |
CN114063962B (zh) | 图像显示方法、装置、终端和存储介质 | |
CN113821142B (zh) | 一种界面窗口的管理方法以及相关装置 | |
CN113780291B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN116263992A (zh) | 图像识别方法、装置及存储介质 | |
CN110503084B (zh) | 一种图像中的文字区域识别方法和装置 | |
CN112733573B (zh) | 表格检测方法、装置、移动终端及存储介质 | |
CN108073508B (zh) | 一种兼容性检测方法及装置 | |
CN114077471B (zh) | 信息显示方法、目标设备、源设备、系统及存储介质 | |
CN108959073B (zh) | 算法库的测试方法、装置、存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |