CN116229098A - 一种基于掩模轮廓跟踪的图像识别方法及相关产品 - Google Patents
一种基于掩模轮廓跟踪的图像识别方法及相关产品 Download PDFInfo
- Publication number
- CN116229098A CN116229098A CN202310138440.2A CN202310138440A CN116229098A CN 116229098 A CN116229098 A CN 116229098A CN 202310138440 A CN202310138440 A CN 202310138440A CN 116229098 A CN116229098 A CN 116229098A
- Authority
- CN
- China
- Prior art keywords
- point
- target contour
- pixel
- value
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种基于掩模轮廓跟踪的图像识别方法及相关产品,该方法包括:对获取到的图像进行二值化处理,得到像素值为第一数值或第二数值的二值图像;按照预设规则逐像素扫描二值图像,将第一个像素值为第二数值的像素点作为第一目标轮廓点;将第一目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第二目标轮廓点;将第二目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第三目标轮廓点;若第三目标轮廓点为目标轮廓的终点,对第一目标轮廓点、各第二目标轮廓点以及第三目标轮廓点所围成的目标图像进行识别,可对像素点具有非连续性的图像进行识别。
Description
技术领域
本申请涉及图像识别技术领域,特别是涉及一种基于掩模轮廓跟踪的图像识别方法及相关产品。
背景技术
随着机器学习、移动互联网技术的发展,电子商务越来越受到人们的青睐,网上支付已成为人们主要付款方式之一。但网上支付大多数会涉及到绑定银行卡的操作,需要输入银行卡号以完成绑定。
目前,绝大多数银行采用简单的轮廓跟踪算法,即基于链码的图像跟踪算法。首先,对图像进行二值化处理;然后,按照顺时针方向在邻域像素点中查找下一个轮廓点,当轮廓点已被搜索过,不再对其进行重复遍历,依次迭代查找下一个轮廓点,直到回到轮廓跟踪的起始点。由于图像受外界噪声以及图像自身因素的影响,二值化后的图像像素点普遍具有非连续性,以致运用于像素点连通场景下的基于链码的图像跟踪算法的图像识别方法的识别效果差。
发明内容
基于上述问题,本申请提供了一种基于掩模轮廓跟踪的图像识别方法及相关产品,提高图像识别效果。
本申请实施例公开了如下技术方案:
第一方面,本申请提供一种基于掩模轮廓跟踪的图像识别方法,所述方法包括:
对获取到的图像进行二值化处理,得到像素值为第一数值或第二数值的二值图像;
按照预设规则逐像素扫描所述二值图像,将第一个像素值为所述第二数值的像素点作为第一目标轮廓点,所述第一目标轮廓点为目标轮廓的起点;
将所述第一目标轮廓点作为掩模区域的中心,在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第二目标轮廓点,所述第二目标轮廓点为目标轮廓的第一个中间点;
将所述第二目标轮廓点作为掩模区域的中心,在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第三目标轮廓点,所述第三目标轮廓点为目标轮廓的中间点或目标轮廓的终点;
若第三目标轮廓点为目标轮廓的终点,对所述第一目标轮廓点、各所述第二目标轮廓点以及所述第三目标轮廓点所围成的目标图像进行识别。
可选地,所述掩模为(m,n)掩模,所述在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第二目标轮廓点,包括:
在(m,n)掩模区域中,按照升序从0至(2m+1)*(2n+1)-2的掩模区域中将第一个像素值为所述第二数值的像素点作为第二目标轮廓点。
可选地,所述方法还包括:
将所述图像的分辨率与预设阈值相比较,得到比较结果;
若所述比较结果表征为图像的分辨率大于预设阈值,增大掩模区域;若所述比较结果表征为图像的分辨率小于预设阈值,减小掩模区域。
可选地,所述按照预设规则扫描所述二值图像,将第一个像素值为所述第二数值的像素点作为第一目标轮廓点,包括:
从上至下从左至右逐像素扫描所述二值图像,将第一个像素值为所述第二数值的像素点作为第一目标轮廓点。
可选地,所述目标图像为从所述图像中分离的数字图像轮廓,所述对所述第一目标轮廓点、各所述第二目标轮廓点以及所述第三目标轮廓点所围成的目标图像进行识别,包括:
将从所述图像中分离的数字图像轮廓与模板中的轮廓图像依次进行匹配,直到找到所述数字图像对应的数字,得到识别结果。
可选地,所述将所述第二目标轮廓点作为掩模区域的中心,在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第三目标轮廓点,所述第三目标轮廓点为目标轮廓的中间点或目标轮廓的终点,包括:
将所述第二目标轮廓点作为掩模区域的中心,在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第三目标轮廓点;
若所述第三目标轮廓点与所述第一目标轮廓点不是同一点,所述第三目标轮廓点为目标轮廓的中间点;若所述第三目标轮廓点与所述第一目标轮廓点是同一点,所述第三目标轮廓点为目标轮廓的终点。
可选地,所述方法还包括:
对所述二值图像进行形态学闭运算操作。
第二方面,本申请提供一种基于掩模轮廓跟踪的图像识别装置,所述装置包括:二值化处理模块、扫描模块、第一获取模块、第二获取模块以及识别模块;
所述二值化处理模块,用于对获取到的图像进行二值化处理,得到像素值为第一数值或第二数值的二值图像;
所述扫描模块,用于按照预设规则逐像素扫描所述二值图像,将第一个像素值为所述第二数值的像素点作为第一目标轮廓点,所述第一目标轮廓点为目标轮廓的起点;
所述第一获取模块,用于将所述第一目标轮廓点作为掩模区域的中心,在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第二目标轮廓点,所述第二目标轮廓点为目标轮廓的第一个中间点;
所述第二获取模块,用于将所述第二目标轮廓点作为掩模区域的中心,在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第三目标轮廓点,所述第三目标轮廓点为目标轮廓的中间点或目标轮廓的终点;
所述识别模块,用于若第三目标轮廓点为目标轮廓的终点,对所述第一目标轮廓点、各所述第二目标轮廓点以及所述第三目标轮廓点所围成的目标图像进行识别。
可选地,所述掩模为(m,n)掩模,所述第一获取模块,具体用于:
在(m,n)掩模区域中,按照升序从0至(2m+1)*(2n+1)-2的掩模区域中将第一个像素值为所述第二数值的像素点作为第二目标轮廓点。
可选地,所述装置还包括:调整模块;
所述调整模块,用于将所述图像的分辨率与预设阈值相比较,得到比较结果;
若所述比较结果表征为图像的分辨率大于预设阈值,增大掩模区域;若所述比较结果表征为图像的分辨率小于预设阈值,减小掩模区域。
可选地,所述扫描模块,具体用于:
从上至下从左至右逐像素扫描所述二值图像,将第一个像素值为所述第二数值的像素点作为第一目标轮廓点。
可选地,所述目标图像为从所述图像中分离的数字图像轮廓,所述识别模块,具体用于:
将从所述图像中分离的数字图像轮廓与模板中的轮廓图像依次进行匹配,直到找到所述数字图像对应的数字,得到识别结果。
可选地,所述第二获取获取模块,具体用于:
将所述第二目标轮廓点作为掩模区域的中心,在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第三目标轮廓点;
若所述第三目标轮廓点与所述第一目标轮廓点不是同一点,所述第三目标轮廓点为目标轮廓的中间点;若所述第三目标轮廓点与所述第一目标轮廓点是同一点,所述第三目标轮廓点为目标轮廓的终点。
可选地,所述装置还包括:形态学闭运算处理处理模块;
所述形态学闭运算处理模块,用于对所述二值图像进行形态学闭运算处理。
第三方面,本申请提供一种电子设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如第一方面任一项所述的基于掩模轮廓跟踪的图像识别方法。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如第一方面任一项所述的基于掩模轮廓跟踪的图像识别方法。
对获取到的图像进行二值化处理,得到像素值为第一数值或第二数值的二值图像;按照预设规则逐像素扫描所述二值图像,将第一个像素值为第二数值的像素点作为第一目标轮廓点,第一目标轮廓点为目标轮廓的起点;将第一目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第二目标轮廓点,第二目标轮廓点为目标轮廓的第一个中间点;将第二目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第三目标轮廓点,第三目标轮廓点为目标轮廓的中间点或目标轮廓的终点;若第三目标轮廓点为目标轮廓的终点,对第一目标轮廓点、各第二目标轮廓点以及第三目标轮廓点所围成的目标图像进行识别。本申请所采用的掩模是链码的自然扩展或广义形式,它通过新定义的连通性检测目标轮廓点,在目标识别过程中,通过使用掩模轮廓跟踪算法对轮廓进行跟踪并进行目标识别,提高对像素点非连通的图像进行识别的识别效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种基于掩模轮廓跟踪的图像识别方法对应的流程图;
图2为本申请实施例提供的一种(m,n)掩模的示意图;
图3为本申请实施例提供的另一种基于掩模轮廓跟踪的图像识别方法对应的流程图;
图4为本申请实施例提供的一种基于掩模轮廓跟踪的图像识别装置的结构示意图。
具体实施方式
正如前文描述,目前的基于链码轮廓跟踪的图像识别算法对于像素点不连通的图像的识别效果有限。除此之外,并且对于基于链码轮廓跟踪的图像识别算法需依次迭代遍历下一个轮廓点,在图像的像素点较少时适用。目前每张图像包含数以千百万级的像素点,若仍采用该算法时间成本太大,效率不高,极大地影响了客户体验。
有鉴于此,本申请提供一种基于掩模轮廓跟踪的图像识别方法,该方法包括:
对获取到的图像进行二值化处理,得到像素值为第一数值或第二数值的二值图像;按照预设规则逐像素扫描所述二值图像,将第一个像素值为第二数值的像素点作为第一目标轮廓点,第一目标轮廓点为目标轮廓的起点;将第一目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第二目标轮廓点,第二目标轮廓点为目标轮廓的第一个中间点;将第二目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第三目标轮廓点,第三目标轮廓点为目标轮廓的中间点或目标轮廓的终点;若第三目标轮廓点为目标轮廓的终点,对第一目标轮廓点、各第二目标轮廓点以及第三目标轮廓点所围成的目标图像进行识别。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1,该图为一种基于掩模轮廓跟踪的图像识别方法对应的流程图。
如图1所示,该方法包括:
S101:对获取到的图像进行二值化处理,得到像素值为第一数值或第二数值的二值图像。
具体地,图像的二值化处理就是将图像上的像素点的灰度值设置为第一数值或第二数值,也就是将整个图像呈现出明显的黑白效果。即将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的二值化图像。
其中,图像可以是银行卡的图片,第一数值和第二数值表示像素点的亮度,第一数值可以是“0”,代表对应的像素点为白色,第二数值可以是“1”,代表对应的像素点为黑色。
S102:按照预设规则逐像素扫描所述二值图像,将第一个像素值为第二数值的像素点作为第一目标轮廓点,第一目标轮廓点为目标轮廓的起点。
在一可选的实施例中,从上至下从左至右逐像素扫描所述二值图像,将第一个像素值为第二数值的像素点作为第一目标轮廓点。
作为示例,假设对图像中的像素所在的行与所在的列进行标号,即从第一列第一行的像素从左至右开始扫描,当第一行的像素扫面完之后再从第一列第二行的像素从左至右开始扫描,以此类推。
在一可选的实施例中,只要按照一定的规律逐像素扫描即可,但需避免重复扫描。
S103:将第一目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第二目标轮廓点,第二目标轮廓点为目标轮廓的第一个中间点。
具体地,所述掩模为(m,n)掩模,所述在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第二目标轮廓点,包括:
在(m,n)掩模区域中,按照升序从0至(2m+1)*(2n+1)-2的掩模区域中将第一个像素值为所述第二数值的像素点作为第二目标轮廓点。
其中,掩模是由0和1组成的一个二进制图像。当在某一功能中应用掩模时,1值区域被处理,被屏蔽的0值区域不被包括在计算中。通过指定的数据值,数据范围,有限或无限值,感兴趣区和注释文件来定义图像掩模,也可以应用上述选项的任意组合作为输入来建立掩模。除此之外,掩膜还可以看做是一种图像滤镜的模板,实用掩膜经常处理的是遥感图像。当提取道路或者河流,或者房屋时,通过一个(2m+1)*(2n+1)的矩阵来对图像进行像素过滤,然后将需要的地物或者标志突出显示出来,这个矩阵就是一种掩膜。
作为示例,(m,n)掩模的示意图如图2所示,图2中m和n分别等于3,掩模区域的中心为第一目标轮廓点,按照掩模区域中0至47的顺序对掩膜区域进行扫描,将第一个像素值为所述第二数值的像素点作为第二目标轮廓点。
S104:将第二目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第三目标轮廓点,第三目标轮廓点为目标轮廓的中间点或目标轮廓的终点。
具体地,将第二目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第三目标轮廓点;
若第三目标轮廓点与第一目标轮廓点不是同一点,第三目标轮廓点为目标轮廓的中间点;若第三目标轮廓点与第一目标轮廓点是同一点,第三目标轮廓点为目标轮廓的终点。
S105:若第三目标轮廓点为目标轮廓的终点,对第一目标轮廓点、各第二目标轮廓点以及第三目标轮廓点所围成的目标图像进行识别。
具体地,目标图像为从图像中分离的数字图像轮廓,对第一目标轮廓点、各第二目标轮廓点以及第三目标轮廓点所围成的目标图像进行识别,包括:
将从图像中分离的数字图像轮廓与模板中的轮廓图像依次进行匹配,直到找到所述数字图像对应的数字,得到识别结果。其中目标轮廓可以是从银行卡中分离的数字图像轮廓。
对获取到的图像进行二值化处理,得到像素值为第一数值或第二数值的二值图像;按照预设规则逐像素扫描所述二值图像,将第一个像素值为第二数值的像素点作为第一目标轮廓点,第一目标轮廓点为目标轮廓的起点;将第一目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第二目标轮廓点,第二目标轮廓点为目标轮廓的第一个中间点;将第二目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第三目标轮廓点,第三目标轮廓点为目标轮廓的中间点或目标轮廓的终点;若第三目标轮廓点为目标轮廓的终点,对第一目标轮廓点、各第二目标轮廓点以及第三目标轮廓点所围成的目标图像进行识别。本申请所采用的掩模是链码的自然扩展或广义形式,它通过新定义的连通性检测目标轮廓点,在目标识别过程中,通过使用掩模轮廓跟踪算法对轮廓进行跟踪并进行目标识别,提高对像素点非连通的图像进行识别的识别效果。
参见图3,该图为另一种基于掩模轮廓跟踪的图像识别方法对应的流程图。
如图3所示,该方法包括:
S301:获取图像的分辨率,根据图像的分辨率对掩模区域的大小进行调整。
具体地,将所述图像的分辨率与预设阈值相比较,得到比较结果;
若比较结果表征为图像的分辨率大于预设阈值,增大掩模区域;若比较结果表征为图像的分辨率小于预设阈值,减小掩模区域。
作为示例,假如预设阈值为10000,对应的掩模为(3,3),若图像的分辨率为10100,即图像的分辨率大于预设阈值,需要将掩模区域扩大,例如将对应的掩模调整为(4,4);若图像的分辨率为9000,即图像的分辨率小于预设阈值,需要将掩模区域减小,例如将对应的掩模调整为(2,2)。
通过对掩模进行调整可以有效提高图片识别的效率。
S302:对二值图像进行形态学闭运算处理。
形态学(Morphology)操作一般是对二值化图像进行的操作,包括膨胀、腐蚀、开运算、闭运算等,闭运算是对图像先进行膨胀、再腐蚀操作,目的是为了突出图像区域,弱化噪声带来的影响。
S303:对获取到的图像进行二值化处理,得到像素值为第一数值或第二数值的二值图像。
S304:按照预设规则逐像素扫描所述二值图像,将第一个像素值为第二数值的像素点作为第一目标轮廓点,第一目标轮廓点为目标轮廓的起点。
S305:将第一目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第二目标轮廓点,第二目标轮廓点为目标轮廓的第一个中间点。
S306:将第二目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第三目标轮廓点,第三目标轮廓点为目标轮廓的中间点或目标轮廓的终点。
S307:若第三目标轮廓点为目标轮廓的终点,对第一目标轮廓点、各第二目标轮廓点以及第三目标轮廓点所围成的目标图像进行识别。
参见图4,该图为一种基于掩模轮廓跟踪的图像识别装置对应的结构示意图。
如图4示,该装置包括:二值化处理模块401、扫描模块402、第一获取模块403、第二获取模块404以及识别模块405;
二值化处理模块401,用于对获取到的图像进行二值化处理,得到像素值为第一数值或第二数值的二值图像;
扫描模块402,用于按照预设规则逐像素扫描所述二值图像,将第一个像素值为第二数值的像素点作为第一目标轮廓点,第一目标轮廓点为目标轮廓的起点;
第一获取模块403,用于将第一目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第二目标轮廓点,第二目标轮廓点为目标轮廓的第一个中间点;
第二获取模块404,用于将第二目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第三目标轮廓点,第三目标轮廓点为目标轮廓的中间点或目标轮廓的终点;
识别模块405,用于若第三目标轮廓点为目标轮廓的终点,对第一目标轮廓点、各第二目标轮廓点以及第三目标轮廓点所围成的目标图像进行识别。
可选地,掩模为(m,n)掩模,第一获取模块403,具体用于:
在(m,n)掩模区域中,按照升序从0至(2m+1)*(2n+1)-2的掩模区域中将第一个像素值为第二数值的像素点作为第二目标轮廓点。
可选地,装置还包括:调整模块;
调整模块,用于将图像的分辨率与预设阈值相比较,得到比较结果;
若比较结果表征为图像的分辨率大于预设阈值,增大掩模区域;若比较结果表征为图像的分辨率小于预设阈值,减小掩模区域。
可选地,扫描模块402,具体用于:
从上至下从左至右逐像素扫描二值图像,将第一个像素值为第二数值的像素点作为第一目标轮廓点。
可选地,目标图像为从图像中分离的数字图像轮廓,识别模块505,具体用于:
将从图像中分离的数字图像轮廓与模板中的轮廓图像依次进行匹配,直到找到数字图像对应的数字,得到识别结果。
可选地,第二获取获取模块404,具体用于:
将第二目标轮廓点作为掩模区域的中心,在掩模区域中按照预设规则将第一个像素值为第二数值的像素点作为第三目标轮廓点;
若第三目标轮廓点与第一目标轮廓点不是同一点,第三目标轮廓点为目标轮廓的中间点;若第三目标轮廓点与第一目标轮廓点是同一点,第三目标轮廓点为目标轮廓的终点。
可选地,所述装置还包括:形态学闭运算处理处理模块;
形态学闭运算处理模块,用于对所述二值图像进行形态学闭运算处理。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元提示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (10)
1.一种基于掩模轮廓跟踪的图像识别方法,其特征在于,所述方法包括:
对获取到的图像进行二值化处理,得到像素值为第一数值或第二数值的二值图像;
按照预设规则逐像素扫描所述二值图像,将第一个像素值为所述第二数值的像素点作为第一目标轮廓点,所述第一目标轮廓点为目标轮廓的起点;
将所述第一目标轮廓点作为掩模区域的中心,在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第二目标轮廓点,所述第二目标轮廓点为目标轮廓的第一个中间点;
将所述第二目标轮廓点作为掩模区域的中心,在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第三目标轮廓点,所述第三目标轮廓点为目标轮廓的中间点或目标轮廓的终点;
若第三目标轮廓点为目标轮廓的终点,对所述第一目标轮廓点、各所述第二目标轮廓点以及所述第三目标轮廓点所围成的目标图像进行识别。
2.如权利要求1所述的方法,其特征在于,所述掩模为(m,n)掩模,所述在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第二目标轮廓点,包括:
在(m,n)掩模区域中,按照升序从0至(2m+1)*(2n+1)-2的掩模区域中将第一个像素值为所述第二数值的像素点作为第二目标轮廓点。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
将所述图像的分辨率与预设阈值相比较,得到比较结果;
若所述比较结果表征为图像的分辨率大于预设阈值,增大掩模区域;若所述比较结果表征为图像的分辨率小于预设阈值,减小掩模区域。
4.如权利要求1所述的方法,其特征在于,所述按照预设规则扫描所述二值图像,将第一个像素值为所述第二数值的像素点作为第一目标轮廓点,包括:
从上至下从左至右逐像素扫描所述二值图像,将第一个像素值为所述第二数值的像素点作为第一目标轮廓点。
5.如权利要求1所述的方法,其特征在于,所述目标图像为从所述图像中分离的数字图像轮廓,所述对所述第一目标轮廓点、各所述第二目标轮廓点以及所述第三目标轮廓点所围成的目标图像进行识别,包括:
将从所述图像中分离的数字图像轮廓与模板中的轮廓图像依次进行匹配,直到找到所述数字图像对应的数字,得到识别结果。
6.如权利要求1所述的方法,其特征在于,所述将所述第二目标轮廓点作为掩模区域的中心,在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第三目标轮廓点,所述第三目标轮廓点为目标轮廓的中间点或目标轮廓的终点,包括:
将所述第二目标轮廓点作为掩模区域的中心,在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第三目标轮廓点;
若所述第三目标轮廓点与所述第一目标轮廓点不是同一点,所述第三目标轮廓点为目标轮廓的中间点;若所述第三目标轮廓点与所述第一目标轮廓点是同一点,所述第三目标轮廓点为目标轮廓的终点。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
对所述二值图像进行形态学闭运算处理。
8.一种基于掩模轮廓跟踪的图像识别装置,其特征在于,所述装置包括:二值化处理模块、扫描模块、第一获取模块、第二获取模块以及识别模块;
所述二值化处理模块,用于对获取到的图像进行二值化处理,得到像素值为第一数值或第二数值的二值图像;
所述扫描模块,用于按照预设规则逐像素扫描所述二值图像,将第一个像素值为所述第二数值的像素点作为第一目标轮廓点,所述第一目标轮廓点为目标轮廓的起点;
所述第一获取模块,用于将所述第一目标轮廓点作为掩模区域的中心,在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第二目标轮廓点,所述第二目标轮廓点为目标轮廓的第一个中间点;
所述第二获取模块,用于将所述第二目标轮廓点作为掩模区域的中心,在所述掩模区域中按照预设规则将第一个像素值为所述第二数值的像素点作为第三目标轮廓点,所述第三目标轮廓点为目标轮廓的中间点或目标轮廓的终点;
所述识别模块,用于若第三目标轮廓点为目标轮廓的终点,对所述第一目标轮廓点、各所述第二目标轮廓点以及所述第三目标轮廓点所围成的目标图像进行识别。
9.一种电子设备,其特征在于,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-7任一项所述的基于掩模轮廓跟踪的图像识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如权利要求1-7任一项所述的基于掩模轮廓跟踪的图像识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310138440.2A CN116229098A (zh) | 2023-02-14 | 2023-02-14 | 一种基于掩模轮廓跟踪的图像识别方法及相关产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310138440.2A CN116229098A (zh) | 2023-02-14 | 2023-02-14 | 一种基于掩模轮廓跟踪的图像识别方法及相关产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116229098A true CN116229098A (zh) | 2023-06-06 |
Family
ID=86588729
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310138440.2A Pending CN116229098A (zh) | 2023-02-14 | 2023-02-14 | 一种基于掩模轮廓跟踪的图像识别方法及相关产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116229098A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117649420A (zh) * | 2023-11-14 | 2024-03-05 | 北京医百科技有限公司 | 确定图像中目标区域的膨胀域的方法、装置及电子设备 |
-
2023
- 2023-02-14 CN CN202310138440.2A patent/CN116229098A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117649420A (zh) * | 2023-11-14 | 2024-03-05 | 北京医百科技有限公司 | 确定图像中目标区域的膨胀域的方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
KR101617681B1 (ko) | 히스토그램들을 갖는 다중 층 연결 요소들을 사용하는 텍스트 검출 | |
CN109116129B (zh) | 终端检测方法、检测设备、系统及存储介质 | |
CN112613502A (zh) | 文字识别方法及装置、存储介质、计算机设备 | |
CN108764235B (zh) | 目标检测方法、设备及介质 | |
CN110807110B (zh) | 结合局部和全局特征的图片搜索方法、装置及电子设备 | |
CN112101386B (zh) | 文本检测方法、装置、计算机设备和存储介质 | |
US8538191B2 (en) | Image correction apparatus and method for eliminating lighting component | |
CN111507337A (zh) | 基于混合神经网络的车牌识别方法 | |
CN106203454A (zh) | 证件版式分析的方法及装置 | |
CN111985465A (zh) | 文本识别方法、装置、设备及存储介质 | |
CN110717497A (zh) | 图像相似度匹配方法、装置及计算机可读存储介质 | |
CN112597918A (zh) | 文本检测方法及装置、电子设备、存储介质 | |
CN116229098A (zh) | 一种基于掩模轮廓跟踪的图像识别方法及相关产品 | |
CN113792659B (zh) | 文档识别方法、装置及电子设备 | |
CN110147785B (zh) | 图像识别方法、相关装置和设备 | |
CN110210467A (zh) | 一种文本图像的公式定位方法、图像处理装置、存储介质 | |
CN111311573B (zh) | 枝条确定方法、装置及电子设备 | |
Belhedi et al. | Adaptive scene‐text binarisation on images captured by smartphones | |
CN113379001B (zh) | 针对图像识别模型的处理方法及装置 | |
CN115909378A (zh) | 单据文本检测模型的训练方法及单据文本检测方法 | |
CN110874814A (zh) | 一种图像处理方法、图像处理装置及终端设备 | |
CN115273123A (zh) | 一种票据识别方法、装置、设备及计算机存储介质 | |
CN115457581A (zh) | 表格提取方法、装置及计算机设备 | |
CN114511862A (zh) | 表格识别方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |