CN117671290A - 一种图像识别方法、装置、电子设备和存储介质 - Google Patents
一种图像识别方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN117671290A CN117671290A CN202311666101.8A CN202311666101A CN117671290A CN 117671290 A CN117671290 A CN 117671290A CN 202311666101 A CN202311666101 A CN 202311666101A CN 117671290 A CN117671290 A CN 117671290A
- Authority
- CN
- China
- Prior art keywords
- image
- identified
- contour
- extraction model
- gvf
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000000605 extraction Methods 0.000 claims abstract description 73
- 238000004364 calculation method Methods 0.000 claims description 36
- 230000011218 segmentation Effects 0.000 claims description 30
- 230000006355 external stress Effects 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 6
- 241000270295 Serpentes Species 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种图像识别方法、装置、电子设备和存储介质。该方法包括:接收用户发送的图像识别指令,响应于图像识别指令,获取待识别图像;通过预先确定的基于梯度向量流GVF的轮廓提取模型,计算待识别图像对应的气球力和GVF场;基于轮廓提取模型、气球力和GVF场确定待识别图像对应的轮廓曲线;基于轮廓曲线对待识别图像进行图像识别。本发明的方法能够通过气球力改进优化轮廓提取模型,通过改进后的轮廓提取模型准确的输出待识别图像的轮廓曲线,进一步提高图像识别的准确率和效率。
Description
技术领域
本发明实施例涉及图像处理领域,尤其涉及一种图像识别方法、装置、电子设备和存储介质。
背景技术
图像识别是一种计算机视觉技术,它通过分析数字图像中的内容来识别和分类物体、场景或活动。随着深度学习算法的发展,图像识别技术已经取得了显著的进步,并在许多领域得到了广泛的应用。在医疗领域,图像识别技术被用于辅助医生进行疾病诊断和治疗。例如,通过对X光片、CT扫描和MRI图像的分析,可以自动检测出肿瘤、骨折等病变。
在银行业务中,图像识别技术也得到了广泛的应用,尤其是在身份验证和业务流程中。例如,在开设账户、发放银行卡、激活卡、签约办理以及信用卡申请等环节,银行需要对客户进行身份验证。通过图像识别中的人脸识别技术对客户进行身份验证。其中轮廓提取是人脸识别中的基础,轮廓提取的质量决定了了机器能否对用户更好的进行人脸识别。
Snake模型是一种常用的轮廓提取模型,能输出具备能量、闭合和参数化特性的曲线,动态获取目标物体边缘。但是传统的Snake模型采用图像的梯度构造力场,其捕捉范围非常有限。当Snake模型中的初始轮廓线离目标物体的轮廓比较远时,该外力无法把其吸引到目标所在的轮廓,导致其不能处理轮廓线凹陷的情况。这种轮廓提取方式提取的轮廓曲线不够准确,降低了图像识别的准确率和效率。
发明内容
本发明提供一种图像识别方法、装置、电子设备和存储介质,能够改进优化轮廓提取模型,通过改进后的轮廓提取模型提高图像轮廓提取的准确性,进一步提高图像识别的准确率和效率。
第一方面,本发明实施例提供了一种图像识别方法,所述方法包括:
接收用户发送的图像识别指令,响应于所述图像识别指令,获取待识别图像;
通过预先确定的基于梯度向量流GVF的轮廓提取模型,计算所述待识别图像对应的气球力和GVF场;
基于所述轮廓提取模型、所述气球力和GVF场确定所述待识别图像对应的轮廓曲线;
基于所述轮廓曲线对所述待识别图像进行图像识别。
第二方面,本发明实施例还提供了一种图像识别装置,所述装置包括:
图像获取模块,用于接收用户发送的图像识别指令,响应于所述图像识别指令,获取待识别图像;
参数计算模块,用于通过预先确定的基于梯度向量流GVF的轮廓提取模型,计算所述待识别图像对应的气球力和GVF场;
曲线确定模块,用于基于所述轮廓提取模型、所述气球力和GVF场确定所述待识别图像对应的轮廓曲线;
图像识别模块,用于基于所述轮廓曲线对所述待识别图像进行图像识别。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例提供的图像识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例提供的图像识别方法。
本发明实施例中,接收用户发送的图像识别指令,响应于图像识别指令,获取待识别图像;通过预先确定的基于梯度向量流GVF的轮廓提取模型,计算待识别图像对应的气球力和GVF场;基于轮廓提取模型、气球力和GVF场确定待识别图像对应的轮廓曲线;基于轮廓曲线对待识别图像进行图像识别。即本发明实施例中,能够通过气球力改进优化轮廓提取模型,通过改进后的轮廓提取模型准确的输出待识别图像的轮廓曲线,进一步提高图像识别的准确率和效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例提供的图像识别方法的第一流程图;
图2是本发明实施例提供的图像识别方法的第二流程图;
图3是本发明实施例提供的图像识别装置的结构示意图;
图4是本发明实施例提供的电子设备的一个结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1是本发明实施例提供的图像识别方法的第一流程图,本实施例的方法能够改进优化轮廓提取模型,通过改进后的轮廓提取模型提高图像轮廓提取的准确性,进一步提高图像识别的准确率和效率。该方法可以由本发明实施例中的图像识别装置来执行,该装置可集成在电子设备中,所述电子设备可以是服务器,该方法可以采用软件和/或硬件的方式实现。本实施例提供的图像识别方法具体包括如下步骤:
步骤101、接收用户发送的图像识别指令,响应于图像识别指令,获取待识别图像。
其中,图像识别指令是用户向服务器发送的,用于指示服务器进行图像识别的指令。待识别图像是需要对其进行轮廓提取和内容识别的图像。在一种可选的实施方式中,当需要对待识别图像进行识别时,用户可以向服务器发送图像识别指令。服务器在接收到图像识别指令后,通过摄像头、图像接收器等获取待识别图像。
示例性的,用户在银行的自助柜台上进行交易前需要进行身份验证。当用户开始进行身份验证时,可以通过自助柜台向服务器发送图像识别指令。服务器在接收到图像识别指令后,通过自助柜台旁的摄像头拍摄用户的人脸照片(待识别图像),以此获取待识别图像。
步骤102、通过预先确定的基于梯度向量流GVF的轮廓提取模型,计算待识别图像对应的气球力和GVF场。
其中,轮廓提取模型用于提取待识别图像的轮廓。在图像处理中,轮廓提取是一项重要任务,它旨在从图像中提取出目标的边界或轮廓。轮廓提取模型包括Snake模型、活动轮廓模型、边缘检测模型、Sobel算子模型和高斯滤波器等。本方案中的轮廓提取模型是将梯度向量流(Gradient Vector Flow,GVF)场和Snake模型结合起来,经过训练得到基于GVF的轮廓提取模型。气球力和GVF场是基于GVF的轮廓提取模型的两个参数,根据气球力和GVF场可以计算出待识别图像对应的外部受力,基于GVF的轮廓提取模型可以根据外部受力提取待识别图像的轮廓曲线。
在一种可选的实施方式中,在得到待识别图像后,确定待识别图像的平均灰度的计算方式为:平均灰度等于待识别图像的前景点数占比和前景平均灰度的乘积,和待识别图像的背景点数占比和背景平均灰度的乘积相加;基于平均灰度的计算方式确定待识别图像对应的前景图像和背景图像之间的方差计算方式;基于方差计算方式确定使得前景图像和背景图像之间的方差最大时的分割阈值,并根据分割阈值对待识别图像进行全局阈值分割,得到待识别图像对应的前景图像;通过轮廓提取模型,基于前景图像生成待识别图像的初始化轮廓曲线;基于预先确定的能力系数、初始化轮廓曲线的各个坐标点和气球力计算公式计算气球力。确定前景图像对应的水平梯度和垂直梯度,基于水平梯度和垂直梯度计算GVF场。
步骤103、基于轮廓提取模型、气球力和GVF场确定待识别图像对应的轮廓曲线。
其中,轮廓提取模型是训练好的,基于GVF的轮廓提取模型。具体地,气球力和GVF场是轮廓提取模型中用于计算外部受力的两个重要参数。GVF场可以通过计算图像的梯度向量场得到,它能够提供更准确和稳定的边缘信息,从而改善轮廓线的识别效果。气球力则能够引导轮廓线朝向图像边缘,使得轮廓线更加紧贴边缘,从而解决了轮廓线远离边缘的问题。通过将GVF场和气球力结合起来,可以提高轮廓线的精确度和稳定性,解决局部轮廓的轮廓线问题。在一种可选的实施方式中,在得到气球力和GVF场后,通过轮廓提取模型,基于气球力和GVF场确定轮廓曲线的外部受力;将外部受力带入轮廓提取模型,得到轮廓提取模型输出的待识别图像对应的轮廓曲线表达式。
步骤104、基于轮廓曲线对待识别图像进行图像识别。
其中,轮廓曲线是待识别图像中的需要进行识别部分的轮廓曲线。本方案实施例中,可选的,在基于轮廓曲线对待识别图像进行图像识别之前,还包括如下步骤A1-步骤A3:
步骤A1:将轮廓曲线复制到与待识别图像的尺寸相同的黑底图像上,得到待识别图像对应的像素图像;对像素图像中的轮廓曲线内部进行白点像素填充,得到候选像素图像;根据候选像素图像计算待识别图像的轮廓线面积。
具体地,将轮廓曲线复制到与待识别图像尺寸相同的黑底图像上,可以得到一个与待识别图像相同尺寸的像素图像。如此,便可以直观地观察轮廓线的位置和形状,更方便进行后续的处理和分析。
在一种可选的实施方式中,在得到轮廓曲线后,创建一个与待识别图像具有相同宽度和高度的全黑图像,通过预先设定的绘图函数和轮廓曲线的坐标点,在黑底图像上绘制出待识别图像对应的曲线,将绘制曲线后的黑底图像确定为像素图像。对像素图像中轮廓曲线包围的地方进行白点像素填充,即将像素图像中的孔洞(即内部像素点)填充为与轮廓曲线边界相连的白点。填充后,只需要计算非零像素点的数目,就可以近似得到该图像轮廓线的面积,将填充后的图像确定为候选像素图像。进一步地,计算候选像素图像中非零像素点的个数,即为近似的轮廓线面积。
上述步骤中,可以简单准确的计算出待识别图像的轮廓线面积,避免对每个像素点进行面积计算,提高了待识别图像的轮廓线面积的计算效率。
步骤A2:将轮廓线面积和预设标准面积进行比较,当轮廓线面积与预设标准面积差值的绝对值不超过预设范围时,执行轮廓曲线对待识别图像进行图像识别的步骤。
在实际应用中,待识别图像不一定是符合标准的,能对其顺利进行图像识别的图像。例如,当用户与摄像头距离太近时,摄像头拍摄到的待识别图像的轮廓曲线面积会过大,并且摄像头有可能拍摄不到用户的主要面部特征。当用户与摄像头距离太远时,摄像头拍摄到的待识别图像的轮廓曲线面积会过小,导致服务器无法很好的对待识别图像进行图像识别。因此,在得到轮廓线面积后,可以将轮廓线面积与预设标准面积进行差值计算,如果廓线面积与预设标准面积差值的绝对值不超过预设范围,则执行轮廓曲线对待识别图像进行图像识别的步骤。
步骤A3:当轮廓线面积与预设标准面积差值的绝对值超过预设范围,则基于轮廓线面积生成提示信息,并将提示信息发送给用户,以使得用户基于提示信息调整拍摄位置。
具体地,当轮廓线面积与预设标准面积差值的绝对值超过预设范围,表示轮廓线面积过大或者过小。示例性的,当轮廓线面积与预设标准面积差值的绝对值超过预设范围且轮廓线面积大于预设标准面积时,表示用户与摄像头距离太近。服务器可以生成“距离过近”的提示信息,以提示用户与摄像头距离过近,需要调整拍摄位置。当轮廓线面积与预设标准面积差值的绝对值超过预设范围且轮廓线面积小于预设标准面积时,表示用户与摄像头距离太远。服务器可以生成“距离过远”的提示信息,以提示用户与摄像头距离过远,需要调整拍摄位置。
上述步骤中,可以根据轮廓线面积确定待识别图像是否符合标准,在待识别图像不符合标准时,可以及时提醒用户调整拍摄位置,得到符合标准的待识别图像,提高了图像识别的效率。
本发明实施例的方案中,接收用户发送的图像识别指令,响应于图像识别指令,获取待识别图像。通过预先确定的基于梯度向量流GVF的轮廓提取模型,计算待识别图像对应的气球力和GVF场。基于轮廓提取模型、气球力和GVF场确定待识别图像对应的轮廓曲线。基于轮廓曲线对待识别图像进行图像识别。本实施例的技术方案,能够通过气球力改进优化轮廓提取模型,通过改进后的轮廓提取模型准确的输出待识别图像的轮廓曲线,进一步提高图像识别的准确率和效率。
图2是本发明实施例提供的图像识别方法的第二流程图,如图2所示,该方法主要包括如下步骤:
步骤201、接收用户发送的图像识别指令,响应于图像识别指令,获取待识别图像。
步骤202、对待识别图像进行全局阈值分割,得到待识别图像对应的前景图像。
其中,全局阈值分割是对整个图像内都使用同一个阈值进行分割的方法。全局阈值分割适用于图像中的目标物体和背景之间有着明显的差异的情况,这种差异不受图像位置的影响,即任意一个位置中的差异基本相同。全局阈值分割是一种特殊的局部阈值。前景图像是分割出的待识别图像中的目标物体的图像。本方案中,可选的,对待识别图像进行全局阈值分割,得到待识别图像对应的前景图像,包括如下步骤B1-步骤B2:
步骤B1:确定待识别图像的平均灰度的计算方式为:平均灰度等于待识别图像的前景点数占比和前景平均灰度的乘积,和待识别图像的背景点数占比和背景平均灰度的乘积相加;基于平均灰度的计算方式确定待识别图像对应的前景图像和背景图像之间的方差计算方式。
本方案中,前景点数占图像比例为w0,平均灰度为u0;背景点数占图像比例为w1,平均灰度为u1。根据平均灰度的计算方式确定图像中平均灰度为:u=w0*u0+w1*u1。其中,u为平均灰度。用G表示前景图像和背景图像之间的方差,基于平均灰度的计算方式确定前景图像和背景图像之间的方差计算方式为:G=w0*(u0-u)*(u0-u)+w1*(u1-u)(u1-u)=w0*w1*(u0-u1)*(u0-u1)。
步骤B2:基于方差计算方式确定使得前景图像和背景图像之间的方差最大时的分割阈值,并根据分割阈值对待识别图像进行全局阈值分割,得到待识别图像对应的前景图像。
具体地,分割阈值与前景图像和背景图像之间的方差之间存在正相关关系,在确定出前景图像和背景图像之间的方差计算方式后,根据方差计算方式,寻找使得前景图像和背景图像之间的方差最大时的分割阈值,将该分割阈值确定为目标分割阈值。在得到目标分割阈值后,将待识别图像进行二值化操作,将灰度值大于目标分割阈值的像素设置为前景,灰度值小于等于目标分割阈值的像素设置为背景,对待识别图像进行全局阈值分割,得到待识别图像对应的前景图像。
上述步骤中,能够通过全局阈值分割的方法对待识别图像进行阈值分割,提高了分割待识别图像的前景图像和背景图像的准确性,为后续准确提取待识别图像的轮廓曲线奠定了基础。
步骤203、通过轮廓提取模型,基于前景图像生成待识别图像的初始化轮廓曲线。
其中,初始化轮廓曲线是轮廓提取模型初步确定出的待识别图像中目标物体的轮廓曲线。具体地,由于前景图像是对待识别图像进行全局阈值分割后的图像,前景图像中包括待识别图像中目标物体的轮廓曲线。进一步地,将该轮廓曲线确定为初始化轮廓曲线。
步骤204、基于预先确定的能力系数、初始化轮廓曲线的各个坐标点和气球力计算公式计算气球力。
具体地,气球力能使轮廓曲线往一个确定的方向推向接近目标物体边缘的地方,既解决了轮廓线的方向问题,也解决了因轮廓线远离边缘且外部受力比较小,导致的程序执行时间长的问题。示例性的,气球力可以定义为垂直于初始化轮廓曲线并且为法线方向的大小恒定的力:Fpressure=k1ni。其中,k1表示轮廓线的膨胀或者收缩能力(能力系数),k1影响着轮廓提取模型线形状变化的速度。ni表示坐标点Xi处的单位法线,这个单位法线垂直于初始化轮廓曲线,以初始化轮廓曲线上控制点v(s)表示点Xi,ni可改写为n(s)。
步骤205、确定前景图像对应的水平梯度和垂直梯度,基于水平梯度和垂直梯度计算GVF场。
具体地,在得到前景图像后,用f(x,y)表示前景图像的灰度值,其中(x,y)为前景图像中的像素坐标。本方案中,使用一阶差分的方法将前景图像对应的水平梯度表示为:Gx=f(x+1,y)-f(x-1,y);将前景图像对应的垂直梯度表示为:Gy=f(x,y+1)-f(x,y-1)。
步骤206、基于轮廓提取模型、气球力和GVF场确定待识别图像对应的轮廓曲线。
其中,气球力能使轮廓曲线往一个确定的方向推向接近目标物体边缘的地方。具体地,轮廓提取模型中还包括一个外部受力,外部受力是为了推动其轮廓线移动到目标物体的边界,让其轮廓线与边界相重合。用Fext表示外部受力,用Eext表示预先确定的外部能量函数,则Fext=-▽Eext。在Fext的计算公式中加入气球力,更新Fext的公式为:Fext=k1n(s)+k2V。其中,k1n(s)表示气球力,k2V表示GVF场。进一步地,根据Fext和轮廓提取模型,得到待识别图像对应的轮廓曲线X的表达式为:别图像,t是一个时间变量,s表示轮廓曲线的标准化弧长,α和β是预先确定好的曲线参数。
步骤207、基于轮廓曲线对待识别图像进行图像识别。
本发明实施例提供的图像识别方法,接收用户发送的图像识别指令,响应于图像识别指令,获取待识别图像。对待识别图像进行全局阈值分割,得到待识别图像对应的前景图像。通过轮廓提取模型,基于前景图像生成待识别图像的初始化轮廓曲线。基于预先确定的能力系数、初始化轮廓曲线的各个坐标点和气球力计算公式计算气球力。基于初始化轮廓曲线和前景图像,确定前景图像对应的水平梯度和垂直梯度,基于水平梯度和垂直梯度计算GVF场。基于轮廓提取模型、气球力和GVF场确定待识别图像对应的轮廓曲线。基于轮廓曲线对待识别图像进行图像识别。本实施例的技术方案,能够通过气球力和GVF场提高轮廓曲线的边缘识别效果,解决局部轮廓的轮廓线问题,使得轮廓提取模型能够准确的输出待识别图像的轮廓曲线,进一步提高图像识别的效率。
本申请技术方案中对数据的获取、存储、使用和处理等均符合国家法律法规的相关规定。
图3是本发明实施例提供的图像识别装置的结构示意图。本发明实施例提供了一种图像识别装置,所述装置包括:
图像获取模块301,用于接收用户发送的图像识别指令,响应于所述图像识别指令,获取待识别图像;
参数计算模块302,用于通过预先确定的基于梯度向量流GVF的轮廓提取模型,计算所述待识别图像对应的气球力和GVF场;
曲线确定模块303,用于基于所述轮廓提取模型、所述气球力和GVF场确定所述待识别图像对应的轮廓曲线;
图像识别模块304,用于基于所述轮廓曲线对所述待识别图像进行图像识别。
可选的,参数计算模块302,具体用于:对所述待识别图像进行全局阈值分割,得到所述待识别图像对应的前景图像;
通过所述轮廓提取模型,基于所述前景图像生成所述待识别图像的初始化轮廓曲线;
基于预先确定的能力系数、所述初始化轮廓曲线的各个坐标点和气球力计算公式计算所述气球力。
可选的,参数计算模块302,还用于:确定所述前景图像对应的水平梯度和垂直梯度,基于所述水平梯度和所述垂直梯度计算GVF场。
可选的,曲线确定模块303,具体用于:确定所述待识别图像的平均灰度的计算方式为:所述平均灰度等于所述待识别图像的前景点数占比和前景平均灰度的乘积,和所述待识别图像的背景点数占比和背景平均灰度的乘积相加;
基于所述平均灰度的计算方式确定所述待识别图像对应的前景图像和背景图像之间的方差计算方式;
基于所述方差计算方式确定使得所述前景图像和所述背景图像之间的方差最大时的分割阈值,并根据所述分割阈值对所述待识别图像进行全局阈值分割,得到所述待识别图像对应的前景图像。
可选的,曲线确定模块303,还用于:基于所述气球力和所述GVF场确定所述轮廓曲线的外部受力;
将所述外部受力带入所述轮廓提取模型,得到所述轮廓提取模型输出的所述待识别图像对应的轮廓曲线表达式。
可选的,在基于所述轮廓曲线对所述待识别图像进行图像识别之前,图像识别模块304,具体用于:基于所述轮廓曲线所述待识别图像的轮廓线面积;
将所述轮廓线面积和预设标准面积进行比较,当所述轮廓线面积与所述预设标准面积差值的绝对值不超过预设范围时,执行所述轮廓曲线对所述待识别图像进行图像识别的步骤;
当所述轮廓线面积与所述预设标准面积差值的绝对值超过所述预设范围,则基于所述轮廓线面积生成提示信息,并将所述提示信息发送给用户,以使得所述用户基于所述提示信息调整拍摄位置。
可选的,图像识别模块304,还用于:将所述轮廓曲线复制到与所述待识别图像的尺寸相同的黑底图像上,得到所述待识别图像对应的像素图像;
对所述像素图像中的所述轮廓曲线内部进行白点像素填充,得到候选像素图像;
根据所述候选像素图像计算所述待识别图像的轮廓线面积。
本发明实施例所提供的图像识别装置可执行本发明任意实施例所提供的图像识别方法,具备执行方法相应的功能模块和有益效果。
图4是本发明实施例提供的电子设备的一个结构示意图,参考图4,其示出了适于用来实现本发明实施例的电子设备的计算机系统12的结构示意图。图4示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。另外,本实施例中的电子设备12,显示器24不是作为独立个体存在,而是嵌入镜面中,在显示器24的显示面不予显示时,显示器24的显示面与镜面从视觉上融为一体。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图4中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及图像识别,例如实现本发明实施例所提供的一种图像识别方法:接收用户发送的图像识别指令,响应于所述图像识别指令,获取待识别图像;通过预先确定的基于梯度向量流GVF的轮廓提取模型,计算所述待识别图像对应的气球力和GVF场;基于所述轮廓提取模型、所述气球力和GVF场确定所述待识别图像对应的轮廓曲线;基于所述轮廓曲线对所述待识别图像进行图像识别。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明所有发明实施例提供的一种图像识别方法:接收用户发送的图像识别指令,响应于所述图像识别指令,获取待识别图像;通过预先确定的基于梯度向量流GVF的轮廓提取模型,计算所述待识别图像对应的气球力和GVF场;基于所述轮廓提取模型、所述气球力和GVF场确定所述待识别图像对应的轮廓曲线;基于所述轮廓曲线对所述待识别图像进行图像识别。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体地例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种图像识别方法,其特征在于,所述方法包括:
接收用户发送的图像识别指令,响应于所述图像识别指令,获取待识别图像;
通过预先确定的基于梯度向量流GVF的轮廓提取模型,计算所述待识别图像对应的气球力和GVF场;
基于所述轮廓提取模型、所述气球力和GVF场确定所述待识别图像对应的轮廓曲线;
基于所述轮廓曲线对所述待识别图像进行图像识别。
2.根据权利要求1所述的方法,其特征在于,通过预先确定的基于梯度向量流GVF的轮廓提取模型,计算所述待识别图像对应的气球力,包括:
对所述待识别图像进行全局阈值分割,得到所述待识别图像对应的前景图像;
通过所述轮廓提取模型,基于所述前景图像生成所述待识别图像的初始化轮廓曲线;
基于预先确定的能力系数、所述初始化轮廓曲线的各个坐标点和气球力计算公式计算所述气球力。
3.根据权利要求2所述的方法,其特征在于,通过预先确定的基于梯度向量流GVF的轮廓提取模型,计算所述待识别图像对应的GVF场,包括:确定所述前景图像对应的水平梯度和垂直梯度,基于所述水平梯度和所述垂直梯度计算GVF场。
4.根据权利要求2所述的方法,其特征在于,对所述待识别图像进行全局阈值分割,得到所述待识别图像对应的前景图像,包括:
确定所述待识别图像的平均灰度的计算方式为:所述平均灰度等于所述待识别图像的前景点数占比和前景平均灰度的乘积,和所述待识别图像的背景点数占比和背景平均灰度的乘积相加;
基于所述平均灰度的计算方式确定所述待识别图像对应的前景图像和背景图像之间的方差计算方式;
基于所述方差计算方式确定使得所述前景图像和所述背景图像之间的方差最大时的分割阈值,并根据所述分割阈值对所述待识别图像进行全局阈值分割,得到所述待识别图像对应的前景图像。
5.根据权利要求1所述的方法,其特征在于,基于所述轮廓提取模型、所述气球力和GVF场确定所述待识别图像对应的轮廓曲线,包括:
基于所述气球力和所述GVF场确定所述轮廓曲线的外部受力;
将所述外部受力带入所述轮廓提取模型,得到所述轮廓提取模型输出的所述待识别图像对应的轮廓曲线表达式。
6.根据权利要求1所述的方法,其特征在于,在基于所述轮廓曲线对所述待识别图像进行图像识别之前,所述方法还包括:
基于所述轮廓曲线所述待识别图像的轮廓线面积;
将所述轮廓线面积和预设标准面积进行比较,当所述轮廓线面积与所述预设标准面积差值的绝对值不超过预设范围时,执行所述轮廓曲线对所述待识别图像进行图像识别的步骤;
当所述轮廓线面积与所述预设标准面积差值的绝对值超过所述预设范围,则基于所述轮廓线面积生成提示信息,并将所述提示信息发送给用户,以使得所述用户基于所述提示信息调整拍摄位置。
7.根据权利要求6所述的方法,其特征在于,基于所述轮廓曲线所述待识别图像的轮廓线面积,包括:
将所述轮廓曲线复制到与所述待识别图像的尺寸相同的黑底图像上,得到所述待识别图像对应的像素图像;
对所述像素图像中的所述轮廓曲线内部进行白点像素填充,得到候选像素图像;
根据所述候选像素图像计算所述待识别图像的轮廓线面积。
8.一种图像识别装置,其特征在于,所述装置包括:
图像获取模块,用于接收用户发送的图像识别指令,响应于所述图像识别指令,获取待识别图像;
参数计算模块,用于通过预先确定的基于梯度向量流GVF的轮廓提取模型,计算所述待识别图像对应的气球力和GVF场;
曲线确定模块,用于基于所述轮廓提取模型、所述气球力和GVF场确定所述待识别图像对应的轮廓曲线;
图像识别模块,用于基于所述轮廓曲线对所述待识别图像进行图像识别。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7中任一所述的图像识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的图像识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311666101.8A CN117671290A (zh) | 2023-12-06 | 2023-12-06 | 一种图像识别方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311666101.8A CN117671290A (zh) | 2023-12-06 | 2023-12-06 | 一种图像识别方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117671290A true CN117671290A (zh) | 2024-03-08 |
Family
ID=90082203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311666101.8A Pending CN117671290A (zh) | 2023-12-06 | 2023-12-06 | 一种图像识别方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117671290A (zh) |
-
2023
- 2023-12-06 CN CN202311666101.8A patent/CN117671290A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10699103B2 (en) | Living body detecting method and apparatus, device and storage medium | |
CN107545241B (zh) | 神经网络模型训练及活体检测方法、装置及存储介质 | |
US11501569B2 (en) | System for verifying the identity of a user | |
US11775056B2 (en) | System and method using machine learning for iris tracking, measurement, and simulation | |
EP3576017B1 (en) | Method and system for determining pose of object in image, and storage medium | |
WO2018219180A1 (zh) | 确定人脸图像质量的方法和装置、电子设备和计算机存储介质 | |
US20200019760A1 (en) | Three-dimensional living-body face detection method, face authentication recognition method, and apparatuses | |
WO2018010657A1 (zh) | 结构化文本检测方法和系统、计算设备 | |
US20190026606A1 (en) | To-be-detected information generating method and apparatus, living body detecting method and apparatus, device and storage medium | |
CN109614910B (zh) | 一种人脸识别方法和装置 | |
US20190188460A1 (en) | Method and device for use in hand gesture recognition | |
US20230334235A1 (en) | Detecting occlusion of digital ink | |
Fang et al. | Efficient and robust fragments-based multiple kernels tracking | |
US11727707B2 (en) | Automatic image capture system based on a determination and verification of a physical object size in a captured image | |
CN108229375B (zh) | 用于检测人脸图像的方法和装置 | |
CN106778574A (zh) | 用于人脸图像的检测方法和装置 | |
CN113033519A (zh) | 活体检测方法、估算网络处理方法、装置和计算机设备 | |
CN114549557A (zh) | 一种人像分割网络训练方法、装置、设备及介质 | |
CN116802683A (zh) | 图像的处理方法和系统 | |
US20230360410A1 (en) | User authentication apparatus, user authentication method and training method for user authentication | |
CN117671290A (zh) | 一种图像识别方法、装置、电子设备和存储介质 | |
CN108764033A (zh) | 身份验证方法和装置、电子设备、计算机程序和存储介质 | |
CN112102313A (zh) | 一种支架检测方法、装置和存储介质 | |
KR102579610B1 (ko) | Atm 이상행동감지 장치 및 그 장치의 구동방법 | |
US12035039B2 (en) | Dynamic minimum focus threshold determination inside a region of interest in an image |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |