CN115527023A - 图像检测方法、装置、电子设备及存储介质 - Google Patents
图像检测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115527023A CN115527023A CN202211057511.8A CN202211057511A CN115527023A CN 115527023 A CN115527023 A CN 115527023A CN 202211057511 A CN202211057511 A CN 202211057511A CN 115527023 A CN115527023 A CN 115527023A
- Authority
- CN
- China
- Prior art keywords
- detection frame
- image
- detection
- coordinate
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Abstract
本发明涉及图像检测技术领域,具体提供一种图像检测方法、装置、电子设备及存储介质,旨在解决现有的图像检测方法对应的图像检测精度较低的技术问题。为此目的,本发明的图像检测方法包括:获取待识别图像;利用yolov5网络获取待识别图像对应的第一检测框;判断第一检测框是否满足预设条件;在第一检测框不满足预设条件的情况下,利用Dbnet网络获取待识别图像对应的第二检测框;基于第一检测框和第二检测框确定待识别图像对应的第三检测框。如此,提高了检测框的检测精度。
Description
技术领域
本发明涉及图像检测技术领域,具体提供一种图像检测方法、装置、电子设备及存储介质。
背景技术
目前,银行卡的检测技术比较成熟,现有技术中针对一般场景下的银行卡检测存在较多方案,但是在例如光线暗、拍摄图像时角度倾斜严重、拍摄的时候卡片在图像中占比较小以及卡片的磨损情况比较严重等情况下,图像检测精度较低。
相应地,本领域需要一种新的图像检测方案来解决上述问题。
发明内容
为了克服上述缺陷,提出了本发明,以提供解决或至少部分地解决上述技术问题。本发明提供了一种图像检测方法、装置、电子设备及存储介质。
在第一方面,本发明提供一种图像检测方法,所述方法包括:获取待识别图像;利用yolov5网络获取所述待识别图像对应的第一检测框;判断所述第一检测框是否满足预设条件;在所述第一检测框不满足预设条件的情况下,利用Dbnet网络获取所述待识别图像对应的第二检测框;基于所述第一检测框和第二检测框确定所述待识别图像对应的第三检测框。
在一个实施方式中,所述第一检测框以第一检测框对角线上的第一坐标和第二坐标表示;判断所述第一检测框是否满足预设条件,包括:基于所述第一坐标和第二坐标确定所述第一检测框的长宽比;判断所述长宽比是否大于第一阈值;若是,则确定所述第一检测框满足预设条件;若否,则确定所述第一检测框不满足第一预设条件。
在一个实施方式中,基于所述第一检测框和第二检测框确定所述待识别图像对应的第三检测框,包括:判断所述第一检测框和第二检测框是否有交集;在所述第一检测框和第二检测框有交集的情况下,基于有交集的第一检测框和第二检测框确定所述待识别图像对应的第三检测框。
在一个实施方式中,在所述第一检测框和第二检测框有交集的情况下,基于有交集的第一检测框和第二检测框确定所述待识别图像对应的第三检测框,包括:在与所述第一检测框有交集的第二检测框有多个时,基于置信度最高的第二检测框和所述第一检测框确定所述待识别图像对应的第三检测框。
在一个实施方式中,基于有交集的第一检测框和第二检测框确定所述待识别图像对应的第三检测框,包括:确定是否修正所述第二检测框;若是,则基于所述第一检测框修正所述第二检测框,得到所述第三检测框;若否,将所述第二检测框作为第三检测框。
在一个实施方式中,所述第二检测框以四个顶点坐标表示,分别为第三坐标、第四坐标、第五坐标和第六坐标;确定是否修正所述第二检测框,包括:确定所述第三坐标的横坐标与第一坐标的横坐标之间的第一差值,确定所述第六坐标的横坐标与第一坐标的横坐标的第二差值,确定所述第四坐标的横坐标与第二坐标的横坐标之间的第三差值,确定所述第五坐标的横坐标与第二坐标的横坐标之间的第四差值;判断所述第一差值与第二差值是否均大于第二阈值,和/或所述第三差值与第四差值是否均大于第二阈值;若是,则确定修正所述第二检测框;若否,则确定不修正所述第二检测框。
在一个实施方式中,基于所述第一检测框修正所述第二检测框,包括:在所述第一差值与第二差值均大于第二阈值的情况下,将所述第三坐标的横坐标和所述第六坐标的横坐标替换为所述第一坐标的横坐标;和/或在所述第三差值与第四差值均大于第二阈值的情况下,将所述第四坐标的横坐标和所述第五坐标的横坐标替换为所述第二坐标的横坐标。
在第二方面,本发明提供一种图像检测装置,所述装置包括:
第一获取模块,被配置为获取待识别图像;
第二获取模块,被配置为利用yolov5网络获取所述待识别图像对应的第一检测框;
判断模块,被配置为判断所述第一检测框是否满足预设条件;
第三获取模块,被配置为在所述第一检测框不满足预设条件的情况下,利用Dbnet网络获取所述待识别图像对应的第二检测框;
确定模块,被配置为基于所述第一检测框和第二检测框确定所述待识别图像对应的第三检测框。
在第三方面,提供一种电子设备,该电子设备包括处理器和存储装置,所述存储装置适于存储多条程序代码,所述程序代码适于由所述处理器加载并运行以执行前述任一项所述的图像检测方法。
在第四方面,提供一种计算机可读存储介质,该计算机可读存储介质其中存储有多条程序代码,所述程序代码适于由处理器加载并运行以执行前述任一项所述的图像检测方法。
本发明上述一个或多个技术方案,至少具有如下一种或多种有益效果:
本发明中的图像检测方法,首先获取待识别图像,接着利用yolov5网络获取待识别图像对应的第一检测框,并判断第一检测框是否满足预设条件,以及在第一检测框不满足预设条件的情况下,利用Dbnet网络获取待识别图像对应的第二检测框,最后基于第一检测框和第二检测框确定待识别图像对应的第三检测框。如此,在第一检测框不满足预设条件的情况下,通过yolov5网络获取的第一检测框和Dbnet网络获取的第二检测框相结合的方式来获取待识别图像对应的第三检测框,提高了检测精度,为后续图像的分类和识别提供了技术支撑。
附图说明
参照附图,本发明的公开内容将变得更易理解。本领域技术人员容易理解的是:这些附图仅仅用于说明的目的,而并非意在对本发明的保护范围组成限制。此外,图中类似的数字用以表示类似的部件,其中:
图1是根据本发明的一个实施例的图像检测方法的流程示意图;
图2是根据本发明的一个实施例的利用yolov5网络获得第一检测框的示意图;
图3是利用yolov5网络对倾斜角度拍摄的银行卡图像进行检测得到第一检测框的示意图;
图4是根据本发明的一个实施例的利用Dbnet网络获得第二检测框的示意图;
图5是利用Dbnet网络获得多个第二检测框的示意图;
图6是利用Dbnet网络获得不完整的第二检测框的示意图;
图7是根据本发明的一个实施例的图像检测装置的结构示意图;
图8是根据本发明的一个实施例的电子设备的结构示意图。
附图标记列表:
11:第一获取模块;12:第二获取模块;13:判断模块;14:第三获取模块;15:确定模块。
具体实施方式
下面参照附图来描述本发明的一些实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
在本发明的描述中,“模块”、“处理器”可以包括硬件、软件或者两者的组合。一个模块可以包括硬件电路,各种合适的感应器,通信端口,存储器,也可以包括软件部分,比如程序代码,也可以是软件和硬件的组合。处理器可以是中央处理器、微处理器、图像处理器、数字信号处理器或者其他任何合适的处理器。处理器具有数据和/或信号处理功能。处理器可以以软件方式实现、硬件方式实现或者二者结合方式实现。非暂时性的计算机可读存储介质包括任何合适的可存储程序代码的介质,比如磁碟、硬盘、光碟、闪存、只读存储器、随机存取存储器等等。术语“A和/或B”表示所有可能的A与B的组合,比如只是A、只是B或者A和B。术语“至少一个A或B”或者“A和B中的至少一个”含义与“A和/或B”类似,可以包括只是A、只是B或者A和B。单数形式的术语“一个”、“这个”也可以包含复数形式。
目前,银行卡的检测技术比较成熟,现有技术中针对一般场景下的银行卡检测存在较多方案,但是在例如光线暗、拍摄图像时角度倾斜严重、拍摄的时候卡片在图像中占比较小以及卡片的磨损情况比较严重等情况下,图像检测精度较低。
为此,本申请提出了一种图像检测方法、装置、电子设备及存储介质,首先获取待识别图像,接着利用yolov5网络获取待识别图像对应的第一检测框,并判断第一检测框是否满足预设条件,以及在第一检测框不满足预设条件的情况下,利用Dbnet网络获取待识别图像对应的第二检测框,最后基于第一检测框和第二检测框确定待识别图像对应的第三检测框。如此,在第一检测框不满足预设条件的情况下,通过yolov5网络获取的第一检测框和Dbnet网络获取的第二检测框相结合的方式来获取待识别图像对应的第三检测框,提高了检测精度,为后续图像的分类和识别提供了技术支撑。
参阅附图1,图1是根据本发明的一个实施例的图像检测方法的主要步骤流程示意图。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,以对银行卡的检测作为对本申请图像检测方法的示例进行详细说明。本领域技术人员应当理解的是,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明所描述的图像检测方法仅用于对银行卡的检测。例如,本申请中的图像检测方法还可以适用于身份证、营业执照等图像的检测。
如图1所示,本发明实施例中的图像检测方法主要包括下列步骤S101-步骤S105。
步骤S101:获取待识别图像,具体可以是获取包含完整银行卡的待识别图像。
步骤S102:利用yolov5网络获取所述待识别图像对应的第一检测框。
yolov5网络包括输入端、骨干网络(Backbone)、Neck层和预测层(Head)。
输入端:经输入端输入待识别图像,并对输入图像进行马赛克(Mosaic)数据增强、自适应图片缩放以及自适应锚框计算处理后输出至骨干网络(Backbone)。
骨干网络(Backbone):用于特征提取的网络,具体是对输入的图像经过网络特征提取后生成特征图feature map。
Neck层:一系列混合和组合图像特征的网络层,并将图像特征传递到预测层。
预测层(Head):输出对图像特征进行预测。
具体地,图2是利用yolov5网络获得银行卡卡号的第一检测框的一个示例,第一检测框为矩形,可以以矩形对角线上的两个坐标表示,例如,以矩形对角线的起点(xmin,ymin)和终点(xmax,ymax)表示。
步骤S103:判断所述第一检测框是否满足预设条件。
在一个具体实施方式中,所述第一检测框以第一检测框对角线上的第一坐标和第二坐标表示;判断所述第一检测框是否满足预设条件,包括:
首先,基于所述第一坐标和第二坐标确定所述第一检测框的长宽比。
示例性地,第一坐标(xmin,ymin)和第二坐标(xmax,ymax)可以是第一检测框的对角线的起点和终点,根据第一坐标和第二坐标能够确定第一检测框在待识别图像中的具体位置以及第一检测框的长度和宽度,并基于第一检测框的长度和宽度能够计算得到第一检测框的长宽比。
接着判断所述长宽比是否大于第一阈值。
通过对大量图像进行统计,将得到的经验值10作为第一阈值的示例。
若是,则确定所述第一检测框满足预设条件;若否,则确定所述第一检测框不满足第一预设条件。具体来说,在长宽比大于第一阈值时,则确定第一检测框满足预设条件,在长宽比小于等于第一阈值时,则确定第一检测框不满足预设条件。
示例性地,如果第一检测框的长宽比大于10,说明银行卡倾斜的角度比较小,则满足预设条件。如果第一检测框的长宽比小于等于10,则说明银行卡的倾斜角度比较大,不满足预设条件。
步骤S104:在所述第一检测框不满足预设条件的情况下,利用Dbnet网络获取所述待识别图像对应的第二检测框。
图3是对倾斜角度下拍摄的银行卡卡号检测的一个示例,这种情况下,检测得到的检测框较大,因此,加入了识别干扰。基于此,采用Dbnet网络获取待识别图像对应的第二检测框。
将待识别图像输入Dbnet网络后,经过特征提取和上采样融合并concat操作后得到第一特征图F,然后使用第一特征图F预测出概率图P,以及使用F预测出阈值图T,最后通过P和T计算出第二检测框。
示例性地,在第一检测框不满足预设条件的情况下,可以利用Dbnet模型对待识别图像进行检测,得到银行卡的卡号对应的第二检测框。具体如图4所示,以矩形框的4个顶点坐标表示第二检测框,分别为左上(x1,y1)、右上(x2,y2)、右下(x3,y3)和左下(x4,y4)。
步骤S105:基于所述第一检测框和第二检测框确定所述待识别图像对应的第三检测框。
后续步骤中将以第一坐标(xmin,ymin)、第二坐标(xmax,ymax)、第三坐标(x1,y1)、第四坐标(x2,y2)、第五坐标(x3,y3)和第六坐标(x4,y4)对确定第三检测框的具体步骤进行详细说明。
在一个具体实施方式中,基于所述第一检测框和第二检测框确定所述待识别图像对应的第三检测框,包括:判断所述第一检测框和第二检测框是否有交集;在所述第一检测框和第二检测框有交集的情况下,基于有交集的第一检测框和第二检测框确定所述待识别图像对应的第三检测框。
具体来说,第一检测框和第二检测框没有交集,意味着第二检测框为Dbnet网络的误检测结果,可以忽略这样的检测框,不再执行后续步骤。示例性地,如图5所示的左下角的检测框为Dbnet网络的误检测结果。只有当第一检测框和第二检测框有交集时,意味着第二检测框落在了银行卡号的识别范围内,进一步可根据第一检测框和第二检测框确定所述待识别图像对应的第三检测框。
在一个具体实施方式中,在所述第一检测框和第二检测框有交集的情况下,基于有交集的第一检测框和第二检测框确定所述待识别图像对应的第三检测框,包括:在与所述第一检测框有交集的第二检测框有多个时,基于置信度最高的第二检测框和所述第一检测框确定所述待识别图像对应的第三检测框。
具体地,在与第一检测框有交集的第二检测框有多个时,选择置信度最高的第二检测框来确定第三检测框。
在一个具体实施方式中,基于有交集的第一检测框和第二检测框确定所述待识别图像对应的第三检测框,包括:确定是否修正所述第二检测框;若是,则基于所述第一检测框修正所述第二检测框,得到所述第三检测框;若否,将所述第二检测框作为第三检测框。
具体来说,对于不修正的第二检测框,直接将其输出作为待识别图像对应的最终检测框。对于需要修正的第二检测框,则根据第一检测框对其进行修正。
在一个具体实施方式中,所述第二检测框以四个顶点坐标表示,分别为第三坐标、第四坐标、第五坐标和第六坐标;确定是否修正所述第二检测框,包括:确定所述第三坐标的横坐标与第一坐标的横坐标之间的第一差值,确定所述第六坐标的横坐标与第一坐标的横坐标的第二差值,确定所述第四坐标的横坐标与第二坐标的横坐标之间的第三差值,确定所述第五坐标的横坐标与第二坐标的横坐标之间的第四差值;判断所述第一差值与第二差值是否均大于第二阈值,和/或所述第三差值与第四差值是否均大于第二阈值;若是,则确定修正所述第二检测框;若否,则确定不修正所述第二检测框。
具体来说,第二检测框具体通过四个顶点坐标表示,分别为第三坐标(x1,y1)、第四坐标(x2,y2)、第五坐标(x3,y3)和第六坐标(x4,y4)。该实施例中以100像素作为第二阈值的示例。
示例性地,确定第三坐标的横坐标x1与第一坐标的横坐标xmin之间的第一差值,确定第六坐标的横坐标x4与第一坐标的横坐标xmin的第二差值。若第一差值与第二差值均大于第二阈值,则确定修正第二检测框的第三坐标(x1,y1)和第六坐标(x4,y4)。
类似的,确定第四坐标的横坐标x2与第二坐标的横坐标xmax之间的第三差值,确定第五坐标的横坐标x3与第二坐标的横坐标xmax之间的第四差值。若第三差值与第四差值均大于第二阈值,则确定修正第二检测框的第四坐标(x2,y2)和第五坐标(x3,y3)。
具体地,在不需要修正第二检测框的情况下,直接将(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4)表示的第二检测框作为第三检测框。需要对第二检测框进行修正时,说明Dbnet网络获得的第二检测框不完整或多余,其中图6是第二检测框不完整的一个示例。在Dbnet网络检测不完整或多余的情况下,相当于将Dbnet识别的检测框在长度方向上拉伸或压缩到与yolov5的检测框在长度方向上一致,最终得到经过第一检测框校正过的检测框。
在一个具体实施方式中,基于所述第一检测框的坐标修正所述第二检测框,包括:在所述第一差值与第二差值均大于第二阈值的情况下,将所述第三坐标的横坐标和所述第六坐标的横坐标替换为所述第一坐标的横坐标;和/或在所述第三差值与第四差值均大于第二阈值的情况下,将所述第四坐标的横坐标和所述第五坐标的横坐标替换为所述第二坐标的横坐标。
示例性地,在第一差值与第二差值均大于第二阈值的情况下,可以将第一坐标的横坐标xmin赋值给第三坐标的横坐标x1和第六坐标的横坐标x4。类似的,在第三差值与第四差值均大于第二阈值的情况下,可以将第二坐标的横坐标xmax赋值给第四坐标的横坐标x2和第五坐标的横坐标x3,得到的第三检测框的4个顶点坐标可以表示为左上(xmin,y1)、右上(xmax,y2)、右下(xmax,y3)、左下(xmin,y4)。
基于上述步骤S101-步骤S105,首先获取待识别图像,接着利用yolov5网络获取待识别图像对应的第一检测框,并判断第一检测框是否满足预设条件,以及在第一检测框不满足预设条件的情况下,利用Dbnet网络获取待识别图像对应的第二检测框,最后基于第一检测框和第二检测框确定待识别图像对应的第三检测框。如此,在第一检测框不满足预设条件的情况下,通过yolov5网络获得的第一检测框和Dbnet网络获得的第二检测框相结合的方式来获取待识别图像对应的第三检测框,提高了检测精度,为后续图像的识别和分类提供了技术支撑。
另外,基于本申请中的图像检测方法得到待识别图像对应的第三检测框后,利用OPEN CV技术将该第三检测框所在的图像从待识别图像中截取出来,进一步输入分类器中,从而得到图像类别和方向。
图像类别可以是开卡行、卡号以及有效期等。方向可以包括水平方向和竖直方向等。
示例性地,若文字方向为水平方向,将其直接输入识别器进行识别,得到待识别图像对应的识别结果。若文字方向为竖直方向,可进一步将其旋转为水平方向后再输入识别器进行识别,得到待识别图像对应的识别结果。
需要指出的是,尽管上述实施例中将各个步骤按照特定的先后顺序进行了描述,但是本领域技术人员可以理解,为了实现本发明的效果,不同的步骤之间并非必须按照这样的顺序执行,其可以同时(并行)执行或以其他顺序执行,这些变化都在本发明的保护范围之内。
进一步,本发明还提供了一种图像检测装置。
参阅附图7,图7是根据本发明的一个实施例的图像检测装置的主要结构框图。
如图7所示,本发明实施例中的图像检测装置主要包括第一获取模块11、第二获取模块12、判断模块13、第三获取模块14和确定模块15。在一些实施例中,第一获取模块11、第二获取模块12、判断模块13、第三获取模块14和确定模块15中的一个或多个可以合并在一起成为一个模块。
在一些实施例中,第一获取模块11可以被配置为获取待识别图像。
第二获取模块12可以被配置为利用yolov5网络获取所述待识别图像对应的第一检测框。
判断模块13可以被配置为判断所述第一检测框是否满足预设条件。
第三获取模块14可以被配置为在所述第一检测框不满足预设条件的情况下,利用Dbnet网络获取所述待识别图像对应的第二检测框。
确定模块15可以被配置为基于所述第一检测框和第二检测框确定所述待识别图像对应的第三检测框。
一个实施方式中,具体实现功能的描述可以参见步骤S101-步骤S105所述。
上述图像检测装置以用于执行图1所示的图像检测方法实施例,两者的技术原理、所解决的技术问题及产生的技术效果相似,本技术领域技术人员可以清楚地了解到,为了描述的方便和简洁,图像检测装置的具体工作过程及有关说明,可以参考图像检测方法的实施例所描述的内容,此处不再赘述。
本领域技术人员能够理解的是,本发明实现上述一实施例的方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括电载波信号和电信信号。
进一步,本发明还提供了一种电子设备。在根据本发明的一个电子设备实施例中,如图8所示,电子设备包括处理器31和存储装置32,存储装置可以被配置成存储执行上述方法实施例的图像检测方法的程序,处理器可以被配置成用于执行存储装置中的程序,该程序包括但不限于执行上述方法实施例的图像检测方法的程序。为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。
进一步,本发明还提供了一种计算机可读存储介质。在根据本发明的一个计算机可读存储介质实施例中,计算机可读存储介质可以被配置成存储执行上述方法实施例的图像检测方法的程序,该程序可以由处理器加载并运行以实现上述图像检测方法。为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该计算机可读存储介质可以是包括各种电子设备形成的存储装置设备,可选的,本发明实施例中计算机可读存储介质是非暂时性的计算机可读存储介质。
进一步,应该理解的是,由于各个模块的设定仅仅是为了说明本发明的装置的功能单元,这些模块对应的物理器件可以是处理器本身,或者处理器中软件的一部分,硬件的一部分,或者软件和硬件结合的一部分。因此,图中的各个模块的数量仅仅是示意性的。
本领域技术人员能够理解的是,可以对装置中的各个模块进行适应性地拆分或合并。对具体模块的这种拆分或合并并不会导致技术方案偏离本发明的原理,因此,拆分或合并之后的技术方案都将落入本发明的保护范围内。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (10)
1.一种图像检测方法,其特征在于,所述方法包括:
获取待识别图像;
利用yolov5网络获取所述待识别图像对应的第一检测框;
判断所述第一检测框是否满足预设条件;
在所述第一检测框不满足预设条件的情况下,利用Dbnet网络获取所述待识别图像对应的第二检测框;
基于所述第一检测框和第二检测框确定所述待识别图像对应的第三检测框。
2.根据权利要求1所述的图像检测方法,其特征在于,所述第一检测框以第一检测框对角线上的第一坐标和第二坐标表示;
判断所述第一检测框是否满足预设条件,包括:
基于所述第一坐标和第二坐标确定所述第一检测框的长宽比;
判断所述长宽比是否大于第一阈值;
若是,则确定所述第一检测框满足预设条件;若否,则确定所述第一检测框不满足第一预设条件。
3.根据权利要求1所述的图像检测方法,其特征在于,基于所述第一检测框和第二检测框确定所述待识别图像对应的第三检测框,包括:
判断所述第一检测框和第二检测框是否有交集;
在所述第一检测框和第二检测框有交集的情况下,基于有交集的第一检测框和第二检测框确定所述待识别图像对应的第三检测框。
4.根据权利要求3所述的图像检测方法,其特征在于,在所述第一检测框和第二检测框有交集的情况下,基于有交集的第一检测框和第二检测框确定所述待识别图像对应的第三检测框,包括:在与所述第一检测框有交集的第二检测框有多个时,基于置信度最高的第二检测框和所述第一检测框确定所述待识别图像对应的第三检测框。
5.根据权利要求3或4所述的图像检测方法,其特征在于,基于有交集的第一检测框和第二检测框确定所述待识别图像对应的第三检测框,包括:
确定是否修正所述第二检测框;
若是,则基于所述第一检测框修正所述第二检测框,得到所述第三检测框;若否,将所述第二检测框作为第三检测框。
6.根据权利要求5所述的图像检测方法,其特征在于,所述第二检测框以四个顶点坐标表示,分别为第三坐标、第四坐标、第五坐标和第六坐标;确定是否修正所述第二检测框,包括:
确定所述第三坐标的横坐标与第一坐标的横坐标之间的第一差值,确定所述第六坐标的横坐标与第一坐标的横坐标的第二差值,确定所述第四坐标的横坐标与第二坐标的横坐标之间的第三差值,确定所述第五坐标的横坐标与第二坐标的横坐标之间的第四差值;
判断所述第一差值与第二差值是否均大于第二阈值,和/或所述第三差值与第四差值是否均大于第二阈值;
若是,则确定修正所述第二检测框;若否,则确定不修正所述第二检测框。
7.根据权利要求6所述的图像检测方法,其特征在于,基于所述第一检测框修正所述第二检测框,包括:
在所述第一差值与第二差值均大于第二阈值的情况下,将所述第三坐标的横坐标和所述第六坐标的横坐标替换为所述第一坐标的横坐标;和/或
在所述第三差值与第四差值均大于第二阈值的情况下,将所述第四坐标的横坐标和所述第五坐标的横坐标替换为所述第二坐标的横坐标。
8.一种图像检测装置,其特征在于,所述装置包括:
第一获取模块,被配置为获取待识别图像;
第二获取模块,被配置为利用yolov5网络获取所述待识别图像对应的第一检测框;
判断模块,被配置为判断所述第一检测框是否满足预设条件;
第三获取模块,被配置为在所述第一检测框不满足预设条件的情况下,利用Dbnet网络获取所述待识别图像对应的第二检测框;
确定模块,被配置为基于所述第一检测框和第二检测框确定所述待识别图像对应的第三检测框。
9.一种电子设备,包括处理器和存储装置,所述存储装置适于存储多条程序代码,其特征在于,所述程序代码适于由所述处理器加载并运行以执行权利要求1至7中任一项所述的图像检测方法。
10.一种计算机可读存储介质,其中存储有多条程序代码,其特征在于,所述程序代码适于由处理器加载并运行以执行权利要求1至7中任一项所述的图像检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211057511.8A CN115527023A (zh) | 2022-08-31 | 2022-08-31 | 图像检测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211057511.8A CN115527023A (zh) | 2022-08-31 | 2022-08-31 | 图像检测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115527023A true CN115527023A (zh) | 2022-12-27 |
Family
ID=84697510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211057511.8A Pending CN115527023A (zh) | 2022-08-31 | 2022-08-31 | 图像检测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115527023A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116092087A (zh) * | 2023-04-10 | 2023-05-09 | 上海蜜度信息技术有限公司 | Ocr识别方法、系统、存储介质及电子设备 |
-
2022
- 2022-08-31 CN CN202211057511.8A patent/CN115527023A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116092087A (zh) * | 2023-04-10 | 2023-05-09 | 上海蜜度信息技术有限公司 | Ocr识别方法、系统、存储介质及电子设备 |
CN116092087B (zh) * | 2023-04-10 | 2023-08-08 | 上海蜜度信息技术有限公司 | Ocr识别方法、系统、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11430103B2 (en) | Method for image processing, non-transitory computer readable storage medium, and electronic device | |
US11830230B2 (en) | Living body detection method based on facial recognition, and electronic device and storage medium | |
CN110060237B (zh) | 一种故障检测方法、装置、设备及系统 | |
JP6871314B2 (ja) | 物体検出方法、装置及び記憶媒体 | |
CN110008806B (zh) | 信息处理装置、学习处理方法、学习装置及物体识别装置 | |
CN110414507A (zh) | 车牌识别方法、装置、计算机设备和存储介质 | |
CN108764039B (zh) | 神经网络、遥感影像的建筑物提取方法、介质及计算设备 | |
CN110598788B (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN109711407B (zh) | 一种车牌识别的方法及相关装置 | |
CN110378837B (zh) | 基于鱼眼摄像头的目标检测方法、装置和存储介质 | |
WO2021139197A1 (zh) | 一种图像处理方法及装置 | |
CN111680690B (zh) | 一种文字识别方法及装置 | |
CN111127358B (zh) | 图像处理方法、装置及存储介质 | |
CN110969164A (zh) | 基于深度学习端对端的低照度成像车牌识别方法及装置 | |
CN111353956B (zh) | 图像修复方法、装置、计算机设备及存储介质 | |
CN115527023A (zh) | 图像检测方法、装置、电子设备及存储介质 | |
CN114298985B (zh) | 缺陷检测方法、装置、设备及存储介质 | |
CN111626145A (zh) | 一种简捷有效的残缺表格识别及跨页拼接方法 | |
CN112907433B (zh) | 数字水印嵌入方法、提取方法、装置、设备及介质 | |
CN116503414B (zh) | 屏幕缺陷检测方法、装置、计算机设备和存储介质 | |
CN111767752A (zh) | 一种二维码识别方法及装置 | |
CN116976372A (zh) | 基于方形基准码的图片识别方法、装置、设备及介质 | |
CN110633705A (zh) | 一种低照度成像车牌识别方法及装置 | |
CN116403200A (zh) | 基于硬件加速的车牌实时识别系统 | |
CN115619796A (zh) | 获取光伏组件模板的方法及装置、非易失性存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |