CN111723802A - 一种基于ai的二维码识别方法、装置、设备和介质 - Google Patents
一种基于ai的二维码识别方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN111723802A CN111723802A CN202010611516.5A CN202010611516A CN111723802A CN 111723802 A CN111723802 A CN 111723802A CN 202010611516 A CN202010611516 A CN 202010611516A CN 111723802 A CN111723802 A CN 111723802A
- Authority
- CN
- China
- Prior art keywords
- picture
- dimensional code
- dimensional
- detected
- position information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 230000002708 enhancing effect Effects 0.000 claims abstract description 10
- 238000001514 detection method Methods 0.000 claims description 54
- 230000000007 visual effect Effects 0.000 claims description 25
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 6
- 230000000877 morphologic effect Effects 0.000 claims description 6
- 238000013473 artificial intelligence Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 2
- 230000003628 erosive effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000005299 abrasion Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/1408—Methods for optical code recognition the method being specifically adapted for the type of code
- G06K7/1417—2D bar codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4084—Scaling of whole images or parts thereof, e.g. expanding or contracting in the transform domain, e.g. fast Fourier transform [FFT] domain scaling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Electromagnetism (AREA)
- General Health & Medical Sciences (AREA)
- Toxicology (AREA)
- Artificial Intelligence (AREA)
- Image Processing (AREA)
Abstract
本发明实施例公开一种基于AI的二维码识别方法、装置、设备和介质。该方法包括:检测待检测图片得到二维码在所述待检测图片中的位置信息;根据所述位置信息生成二维码图片;对所述二维码图片进行图片质量增强并识别得到二维码识别结果。本发明实施例中通过对二维码图片进行图片质量增强的方式提高二维码图片的清晰度,以便于后续在进行二维码识别时可以得到二维码识别结果,提高了二维码的识别率。
Description
技术领域
本发明涉及二维码识别技术领域,具体而言,涉及一种基于AI的二维码识别方法、装置、设备和介质。
背景技术
人工智能(Artificial Intelligence,AI)亦称智械、机器智能,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。指由人制造出来的机器所表现出来的智能。通常人工智能是指通过普通计算机程序来呈现人类智能的技术。
目前,二维码被广泛应用在各行各业,在很多场景下,用户需要对纸面上的二维码进行拍照,然后再对照片上的二维码进行扫描识别。由于在拍照时,可能受到纸面磨损、纸面缺失、纸面颜色、拍照当时的光的亮度以及拍照技术等多方面影响,使得所拍到的图片不够清晰,因此,很难对不够清晰的图片上的二维码进行识别,导致对二维码的识别率较低。
发明内容
本发明提供了一种基于AI的二维码识别方法、装置、设备和介质,以提高二维码的识别率。具体的技术方案如下。
第一方面,本发明实施例提供一种基于AI的二维码识别方法,所述方法包括:
S1、检测待检测图片得到二维码在所述待检测图片中的位置信息;
S2、根据所述位置信息生成二维码图片;
S3、对所述二维码图片进行图片质量增强并识别得到二维码识别结果。
可选的,所述步骤S1具体包括:
S11、采用检测模型对待检测图片进行二维码检测,得到各个二维码在所述待检测图片中的位置信息。
可选的,所述步骤S11具体包括:
S111、基于预先建立的二维码检测模型对待检测图片进行二维码检测,得到各个二维码在所述待检测图片中的位置信息;
其中,所述二维码检测模型为:基于多张带有二维码的位置信息的二维码样本图片作为模型训练数据,对初始网络模型进行训练得到的网络模型,其中,所述二维码检测模型用于使得二维码样本图片与对应的二维码的位置信息相关联,所述二维码样本图片由对多个包含二维码的原始图片进行旋转、尺寸变换和/或图片质量变换得到的,且各个包含二维码的原始图片中的二维码的位置各不相同。
可选的,所述步骤S2具体包括:
S21、根据所述位置信息,确定所述二维码在所述待检测图片中的目标区域;
S22、生成包含所述目标区域的二维码图片。
可选的,所述步骤S3具体包括:
S31、从多个预设图片质量增强方式中选择一方式对所述二维码图片进行图片质量增强;
S32、将完成图片质量增强的图片作为当前图片,采用二维码识别算法对所述当前图片进行识别;
S33、判断是否得到识别结果;
S34、如果是,将得到的识别结果作为二维码识别结果。
可选的,上述方法在所述步骤S33之后还包括:
S35、如果否,从剩余的预设图片质量增强方式中选择一方式对所述当前图片进行图片质量增强,返回执行步骤S32。
可选的,所述步骤S31中的所述多个预设图片质量增强方式包括以下方式中的至少两种:
对所述二维码图片进行图片旋转和图片缩放、调节所述二维码图片的颜色直观特性、对所述二维码图片进行形态学上的开操作、提取所述二维码图片的前景图和对所述二维码图片进行去扭曲。
可选的,所述对所述二维码图片进行图片旋转和图片缩放,具体包括:
将所述二维码图片中的二维码相互平行的两个边旋转至水平方向,相互平行的另两个边旋转转至竖直方向;
将旋转后的所述二维码图片的大小缩放到预设大小。
可选的,所述调节所述二维码图片的颜色直观特性,具体包括:
根据所述二维码图片的颜色直观特性确定调整值;
根据调整值对所述二维码图片的颜色直观特性进行调节,其中,所述二维码图片的颜色直观特性包括色调、亮度和饱和度。
第二方面,本发明实施例提供一种基于AI的二维码识别装置,所述装置包括:
二维码检测模块,被配置为检测待检测图片得到二维码在所述待检测图片中的位置信息;
二维码图片生成模块,被配置为根据所述位置信息生成二维码图片;
二维码识别模块,被配置为对所述二维码图片进行图片质量增强并识别得到二维码识别结果。
第三方面,本发明实施例提供一种计算设备,所述设备包括:
存储有可执行程序代码的存储器;
与存储器耦合的处理器;
其中,处理器调用存储器中存储的可执行程序代码,执行如上述第一方面所述的基于AI的二维码识别方法。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的基于AI的二维码识别方法。
由上述内容可知,本发明实施例中,为了对二维码进行识别,需要检测待检测图片得到二维码在待检测图片中的位置信息,然后根据位置信息生成二维码图片,进而对二维码图片进行图片质量增强并识别得到二维码识别结果。本发明实施例中通过对二维码图片进行图片质量增强的方式提高二维码图片的清晰度,以便于后续在进行二维码识别时可以得到二维码识别结果,提高了二维码的识别率。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
本发明实施例的创新点包括:
1、本发明实施例中,为了对二维码进行识别,需要检测待检测图片得到二维码在待检测图片中的位置信息,然后根据位置信息生成二维码图片,进而对二维码图片进行图片质量增强并识别得到二维码识别结果。本发明实施例中通过对二维码图片进行图片质量增强的方式提高二维码图片的清晰度,以便于后续在进行二维码识别时可以得到二维码识别结果,提高了二维码的识别率。
2、本发明实施例提供的基于AI的二维码识别方法整个过程由计算机执行,全程无需人工参与,因而提高了二维码识别的效率。
3、由于本发明实施例中通过对二维码图片进行图片质量增强的方式提高了二维码图片的清晰度,使得某些不够清晰的图片中的二维码也可以被识别出得到二维码识别结果,因此,客户在对二维码进行拍照时无需刻意拍出清晰的照片,使得客户受到拍摄的限制较小,提高了客户的满意度。
4、由于在建立二维码检测模型时所采用的二维码样本图片是由对多个包含二维码的原始图片进行旋转、尺寸变换和/或图片质量变换得到的,且各个包含二维码的原始图片中的二维码的位置各不相同,因此,使得本发明实施例中的二维码样本图片尽可能的涵盖了二维码在图片中的不同位置的各种情况,使得基于此二维码样本图片作为模型训练数据对初始网络模型进行训练得到的二维码检测模型更能够准确的定位待检测图片中的二维码的位置,提高了检测的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例。对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本实施例提供的二维码识别的流程示意图;
图2是本发明实施例提供的一种基于AI的二维码识别方法的流程示意图;
图3为基于位置信息确定待检测图片中的目标区域的原理示意图;
图4是本发明实施例提供的一种基于AI的二维码识别装置的结构示意图;
图5是本发明实施例提供的一种计算设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例及附图中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含的一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本发明的描述中,术语“二维码”,又称二维条码,是一个近几年来移动设备上超流行的一种编码方式,它比传统的条形码能存更多的信息,也能表示更多的数据类型。二维码是用某种特定的几何图形按一定规律在平面的二维方向上分布的、黑白相间的、记录数据符号信息的图形。
在本发明的描述中,术语“位置信息”,是指从待检测图片中识别出的可用于标识二维码位置的信息,例如:二维码所包含的可用于标识二维码位置的三个定位点的位置。
在本发明的描述中,术语“目标区域”,是指在待检测图片中二维码所在的区域,该目标区域理想状态下只包含二维码,实际状态下,在二维码的周边还会包含一些背景色形成的边缘。
在本发明的描述中,术语“颜色直观特性”,是一种颜色空间,也称六角锥体模型,这个模型中包含的颜色参数分别是:色调、亮度和饱和度。
在本发明的描述中,术语“形态学上的开操作”,是指先腐蚀再膨胀的操作。腐蚀是指用一个结构元素一般是3×3的大小扫描图像中的每一个像素,用结构元素中的每一个像素与其覆盖的像素做“与”操作,如果都为1,则该像素为1,否则为0。中心及领域有一个点不是黑点,该点就被腐蚀成白点。膨胀是指用一个结构元素一般是3×3的大小扫描图像中的每一个像素,用结构元素中的每一个像素与其覆盖的像素做“与”操作,如果都为0,则该像素为0,否则为1。
下面将结合附图,对本发明实施例提供的内容进行详细介绍。
实施例一
在运单检测场景中,在客户购买产品后,商家会将包含产品订单信息二维码以及产品信息的纸质签单通过快递的方式发送给客户。
客户在接收到纸质签单后,核对纸质签单中产品信息是正确的情况下会在纸质签单上进行签字,然后对签字后的纸质签单进行拍照并上传到商家平台,商家平台通过人工扫描上传的图片中的二维码得到客户确认的产品订单信息并存储,然后依据客户确认的产品订单信息进行发货。
由于纸质签单在到达客户手中后,可能会变得褶皱或者缺失,且受到纸张颜色、客户拍照时的相机配置、拍照的技术好坏、光照强度、是否有遮挡以及是否有阴影等多种因素的影响,导致所拍摄的图片不够清晰,进一步导致图片中的二维码不够清晰,使得无法对上传的图片中的二维码进行识别。
在本实施例中,参见图1,图1为本实施例提供的二维码识别的流程示意图,为了识别不清晰图片中的二维码,通过预先建立的二维码检测模型检测图片,得到二维码的位置信息,然后基于位置信息生成二维码图片,由于二维码图片不清晰导致无法识别二维码,因此,对二维码图片进行图片质量增强得到清晰的二维码图片,然后对清晰的二维码图片进行二维码识别得到二维码识别结果。
实施例二
请参阅图2,图2是本发明实施例提供的一种基于AI的二维码识别方法的流程示意图。该方法可由基于AI的二维码识别装置来执行,该装置可通过软件和/或硬件的方式实现。如图2所示,本实施例提供的方法具体包括:
S210、检测待检测图片得到二维码在待检测图片中的位置信息。
具体应用场景中,待检测图片中可以包括一个或者多个二维码,例如:在运单检测场景中,由于用户可能同时收到多张纸质签单,使得用户在对签字后的纸质签单进行拍照时,将多张纸质签单中的二维码拍到同一张图片中,因此,客户上传到商家平台的图片中可能包含一个或者多个二维码。
为了对待检测图片中的二维码进行识别,首先需要对检测待检测图片中的二维码进行检测以便定位到二维码在待检测图片中的具体位置。
示例性的,步骤S210具体可以包括:
采用检测模型对待检测图片进行二维码检测,得到各个二维码在待检测图片中的位置信息。
目前,对二维码进行检测的方式有多种,本发明实施例对此并不做任何限定,在一种实现方式中,可以采用检测模型对待检测图片进行二维码检测,得到各个二维码在待检测图片中的位置信息。
优选的,采用检测模型对待检测图片进行二维码检测,得到各个二维码在待检测图片中的位置信息可以通过如下方式实现:
基于预先建立的二维码检测模型对待检测图片进行二维码检测,得到各个二维码在待检测图片中的位置信息;
其中,二维码检测模型为:基于多张带有二维码的位置信息的二维码样本图片作为模型训练数据,对初始网络模型进行训练得到的网络模型,其中,二维码检测模型用于使得二维码样本图片与对应的二维码的位置信息相关联,二维码样本图片由对多个包含二维码的原始图片进行旋转、尺寸变换和/或图片质量变换得到的,且各个包含二维码的原始图片中的二维码的位置各不相同。
为了基于二维码检测模型对待检测图片进行二维码检测,需要建立二维码检测模型。下面对二维码检测模型的建立过程进行描述:
为了建立二维码检测模型,需要得到多张带有二维码的位置信息的二维码样本图片,由于二维码样本图片的数量十分庞大,因此,本发明实施例中采用对多个包含二维码的原始图片进行变换的方式来得到多张二维码样本图片,其中,包含二维码的原始图片中二维码的数量可以为1个也可以为多个,对多个包含二维码的原始图片进行变换的方式可以为旋转、尺寸变换和/或图片质量变换。
由于如果包含二维码的原始图片中的二维码的数量为1个,则需要超大量的原始图片,因此,可以设置包含二维码的原始图片中的二维码的数量为多个,这样可以在不需要非常大量的原始图片的情况下增加二维码的数量。
由于可作为原始图片的图片的数量较少,为了获取足够数量的包含二维码的原始图片,可以采取爬取网络上的多种包含二维码的图片的方式,将爬取得到的图片作为包含二维码的原始图片,从而扩充原始图片的数量,进一步达到扩充二维码样本图片的目的。
为了使二维码样本图片可以尽可能的涵盖二维码在图片中的不同位置的各种情况,设置各个包含二维码的原始图片中的二维码的位置各不相同。且包含二维码的原始图片可以只包括清晰的原始图片、只包括不清晰的原始图片或者既包括清晰的原始图片又包括不清晰的原始图片。
在得到二维码样本图片后,通过人工的方式得到每张二维码样本图片中二维码的位置信息,例如:人工确定每张二维码样本图片中二维码的三个定位点的位置,然后用得到的二维码的位置信息对二维码样本图片进行标注,使得每张二维码样本图片带有二维码的位置信息。
最后,将多张带有二维码的位置信息的二维码样本图片作为模型训练数据,对初始网络模型进行训练,得到二维码检测模型,示例性的,本发明实施例中采用Yolo3模型在GPU上对初始网络模型训练了一天得到二维码检测模型。
由于在建立二维码检测模型时所采用的二维码样本图片是由对多个包含二维码的原始图片进行旋转、尺寸变换和/或图片质量变换得到的,且各个包含二维码的原始图片中的二维码的位置各不相同,因此,使得本发明实施例中的二维码样本图片尽可能的涵盖了二维码在图片中的不同位置的各种情况,使得基于此二维码样本图片作为模型训练数据对初始网络模型进行训练得到的二维码检测模型更能够准确的定位待检测图片中的二维码的位置,提高了检测的准确率。
在得到二维码检测模型后,即可基于预先建立的二维码检测模型对待检测图片进行二维码检测,得到各个二维码在待检测图片中的位置信息。如果待检测图片中只包含一个二维码则得到一个位置信息,如果待检测图片中包含多个二维码则检测得到多个位置信息。
S220、根据位置信息生成二维码图片。
由于在对二维码进行识别时,只需要识别二维码本身即可,如果图片中还包括除二维码以外的过多的其他内容,可能对二维码识别造成影响,导致无法识别,因此,在检测得到二维码的位置信息后,需要根据位置信息生成二维码图片。
示例性的,步骤S220具体可以包括:
根据位置信息,确定二维码在待检测图片中的目标区域;生成包含目标区域的二维码图片。
具体的,根据位置信息,确定二维码在待检测图片中的目标区域可以为:基于各定位点之间的部分亲和域,检测得到二维码在待检测图片中的目标区域。其中,位置信息为二维码的三个定位点的位置。
例如:参见图3,图3为基于位置信息确定待检测图片中的目标区域的原理示意图,在得到位置信息后,也就是得到了二维码的三个定位点的位置,假设以标号为1的定位点作为起始定位点,并按顺时针方向对各定位点依序进行定位标注,如图3中的标号为2的定位点为第二定位点,标号为3的定位点为第三定位点,标号为1的定位点即为第一定位点。基于这3个定位点间的部分亲和域,也就是相当于各定位点与点之间的连线,最终检测得到待检测图片中的二维码所在的目标区域。
在得到目标区域后,将目标区域从待检测图片中抠出,生成包含目标区域的二维码图片。
S230、对二维码图片进行图片质量增强并识别得到二维码识别结果。
由于生成的二维码图片可能不够清晰,为了提高二维码的识别效果,本发明实施例中对二维码图片进行图片质量增强并识别得到二维码识别结果。
示例性的,步骤S230具体可以包括:
S31、从多个预设图片质量增强方式中选择一方式对二维码图片进行图片质量增强;
S32、将完成图片质量增强的图片作为当前图片,采用二维码识别算法对当前图片进行识别;
S33、判断是否得到识别结果;
S34、如果是,将得到的识别结果作为二维码识别结果。
S35、如果否,从剩余的预设图片质量增强方式中选择一方式对当前图片进行图片质量增强,返回执行步骤S32。
由于图片质量增强的方式有多种,而本发明实施例的目的是为了识别二维码,也就是说无论采用了哪一种或多种图片质量增强方式对二维码图片进行了图片质量后,只要可以识别出二维码即可,并不限定使用特定的哪一种或者多种图片质量增强方式。
因此,在进行图片质量增强时,是从多个预设图片质量增强方式中选择一方式对二维码图片进行图片质量增强,增强后就采用二维码识别算法对增强后的二维码图片进行识别,如果能得到识别结果,就将得到的识别结果作为最终的二维码识别结果,如果不能得到识别结果,就从剩余的预设图片质量增强方式中选择一方式对增强后的二维码图片继续进行图片质量增强,然后再采用二维码识别算法对再次增强后的二维码图片进行识别,判断是否能得到识别结果,如果能得到识别结果,就将得到的识别结果作为最终的二维码识别结果,如果不能得到识别结果,就继续重复上述过程直至得到最终的二维码识别结果或者不存在可以选择的预设图片质量增强方式为止。
具体的,步骤S31中的多个预设图片质量增强方式包括以下方式中的至少两种:
对二维码图片进行图片旋转和图片缩放、调节二维码图片的颜色直观特性、对二维码图片进行形态学上的开操作、提取二维码图片的前景图和对二维码图片进行去扭曲。
由于在进行二维码识别时,如果二维码是歪着的,将不利于识别,因此,可以通过对二维码图片进行图片旋转的方式将二维码转正,以便于识别。
由于实验证明二维码在特定的大小例如:110像素×110像素时是足够清晰的是有利于识别的,因此,可以通过对二维码图片进行图片缩放的方式将二维码缩放到特定的大小,以便于识别。
由于二维码图片的颜色直观特性有可能影响二维码的清晰度,例如:亮度过低导致不够清晰,因此,可以通过调节二维码图片的颜色直观特性的方式使二维码变得清晰,以便于识别。
由于二维码内包含多个条纹,有些条纹之间是连接的,由于某些原因导致连接的条纹不再连接使得无法对二维码进行识别,因此,可以通过对二维码图片进行形态学上的开操作的方式,对二维码包含的一些条纹进行扩张或者缩小,使得本应连接的条纹连接,以便于识别。
由于二维码的背景可能对二维码的识别造成影响,因此,可以通过去除背景色提取二维码图片的前景图的方式得到只包含二维码的前景图,以便于识别。
由于在拍照过程中,可能图片会产生扭曲,导致二维码中本应为直的条纹成为了弯曲的条纹,因此,可以通过对二维码图片进行去扭曲的方式将弯曲的条纹进行矫正,以便于识别。
具体的,对二维码图片进行图片旋转和图片缩放,具体包括:
将二维码图片中的二维码相互平行的两个边旋转至水平方向,相互平行的另两个边旋转转至竖直方向;
将旋转后的二维码图片的大小缩放到预设大小。
由于二维码的外框是矩形框,包含两对平行边,二维码处于正方向时,一对平行边处于水平方向,另一对平行边处于竖直方向。
为了将二维码转正,可以将将二维码图片中的二维码相互平行的两个边旋转至水平方向,相互平行的另两个边旋转转至竖直方向,此时,一对平行边处于水平方向,另一对平行边处于竖直方向,二维码处于正方向。
由于实验证明二维码在特定的大小例如:110像素×110像素时是足够清晰的是有利于识别的,因此,可以将旋转后的二维码图片的大小缩放到预设大小以便于识别。
由此,通过将二维码的一对平行边转至水平方向,另一对平行边转至竖直方向的方式将二维码转正,然后通过将二维码图片的大小缩放到预设大小的方式对二维码进行缩放。
具体的,调节二维码图片的颜色直观特性,具体包括:
根据二维码图片的颜色直观特性确定调整值;
根据调整值对二维码图片的颜色直观特性进行调节,其中,二维码图片的颜色直观特性包括灰度、亮度和饱和度。
由于每张二维码图片本身的颜色直观特性是不同的,因此,每张二维码图片所能调节的颜色直观特性的范围也是不同的,因此,需要根据二维码图片的颜色直观特性确定调整值,然后根据调整值对二维码图片的颜色直观特性进行调节,其中,二维码图片的颜色直观特性包括灰度、亮度和饱和度。
由此,通过基于二维码图片的颜色直观特性确定调整值,然后根据调整值对二维码图片的颜色直观特性进行调节的方式,达到调节二维码图片的颜色直观特性的目的。
由上述内容可知,本发明实施例中,为了对二维码进行识别,需要检测待检测图片得到二维码在待检测图片中的位置信息,然后根据位置信息生成二维码图片,进而对二维码图片进行图片质量增强并识别得到二维码识别结果。本发明实施例中通过对二维码图片进行图片质量增强的方式提高二维码图片的清晰度,以便于后续在进行二维码识别时可以得到二维码识别结果,提高了二维码的识别率。
同时,本发明实施例提供的基于AI的二维码识别方法整个过程由计算机执行,全程无需人工参与,因而提高了二维码识别的效率。
并且,由于本发明实施例中通过对二维码图片进行图片质量增强的方式提高了二维码图片的清晰度,使得某些不够清晰的图片中的二维码也可以被识别出得到二维码识别结果,因此,客户在对二维码进行拍照时无需刻意拍出清晰的照片,使得客户受到拍摄的限制较小,提高了客户的满意度。
实施例三
请参阅图4,图4是本发明实施例提供的一种基于AI的二维码识别装置的结构示意图,如图4所示,该装置包括:二维码检测模块410、二维码图片生成模块420和二维码识别模块430;其中,
二维码检测模块410,被配置为检测待检测图片得到二维码在所述待检测图片中的位置信息;
二维码图片生成模块420,被配置为根据所述位置信息生成二维码图片;
二维码识别模块430,被配置为对所述二维码图片进行图片质量增强并识别得到二维码识别结果。
可选的,所述二维码检测模块410,具体包括:
检测单元,被配置为采用检测模型对待检测图片进行二维码检测,得到各个二维码在所述待检测图片中的位置信息。
可选的,所述检测单元,具体被配置为:
基于预先建立的二维码检测模型对待检测图片进行二维码检测,得到各个二维码在所述待检测图片中的位置信息;
其中,所述二维码检测模型为:基于多张带有二维码的位置信息的二维码样本图片作为模型训练数据,对初始网络模型进行训练得到的网络模型,其中,所述二维码检测模型用于使得二维码样本图片与对应的二维码的位置信息相关联,所述二维码样本图片由对多个包含二维码的原始图片进行旋转、尺寸变换和/或图片质量变换得到的,且各个包含二维码的原始图片中的二维码的位置各不相同。
可选的,二维码图片生成模块420,具体包括:
目标区域确定单元,被配置为根据所述位置信息,确定所述二维码在所述待检测图片中的目标区域;
生成单元,被配置为生成包含所述目标区域的二维码图片。
可选的,二维码识别模块430,具体包括:
第一图片质量增强单元,被配置为从多个预设图片质量增强方式中选择一方式对所述二维码图片进行图片质量增强;
识别单元,被配置为将完成图片质量增强的图片作为当前图片,采用二维码识别算法对所述当前图片进行识别;
判断单元,被配置为判断是否得到识别结果,如果是,触发结果确定单元;
所述结果确定单元,被配置为将得到的识别结果作为二维码识别结果。
可选的,所述装置还包括:
第二图片质量增强单元,被配置为判断未得到识别结果,从剩余的预设图片质量增强方式中选择一方式对所述当前图片进行图片质量增强,触发所述识别单元。
可选的,所述第一图片质量增强单元中的所述多个预设图片质量增强方式包括以下方式中的至少两种:
对所述二维码图片进行图片旋转和图片缩放、调节所述二维码图片的颜色直观特性、对所述二维码图片进行形态学上的开操作、提取所述二维码图片的前景图和对所述二维码图片进行去扭曲。
可选的,所述对所述二维码图片进行图片旋转和图片缩放,具体被配置为:
将所述二维码图片中的二维码相互平行的两个边旋转至水平方向,相互平行的另两个边旋转转至竖直方向;
将旋转后的所述二维码图片的大小缩放到预设大小。
可选的,所述调节所述二维码图片的颜色直观特性,具体被配置为:
根据所述二维码图片的颜色直观特性确定调整值;
根据调整值对所述二维码图片的颜色直观特性进行调节,其中,所述二维码图片的颜色直观特性包括色调、亮度和饱和度。
由上述内容可知,本发明实施例中,为了对二维码进行识别,需要检测待检测图片得到二维码在待检测图片中的位置信息,然后根据位置信息生成二维码图片,进而对二维码图片进行图片质量增强并识别得到二维码识别结果。本发明实施例中通过对二维码图片进行图片质量增强的方式提高二维码图片的清晰度,以便于后续在进行二维码识别时可以得到二维码识别结果,提高了二维码的识别率。
本发明实施例所提供的基于AI的二维码识别装置可执行本发明任意实施例所提供的基于AI的二维码识别方法,具备执行方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于AI的二维码识别方法。
实施例四
请参阅图5,图5是本发明实施例提供的一种计算设备的结构示意图。如图5所示,该设备可以包括:
存储有可执行程序代码的存储器501;
与存储器501耦合的处理器502;
其中,处理器502调用存储器501中存储的可执行程序代码,执行本发明任意实施例所提供的基于AI的二维码识别方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行本发明任意实施例所提供的基于AI的二维码识别方法。
在本发明的各种实施例中,应理解,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在本发明所提供的实施例中,应理解,“与A相应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例上述方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种基于AI的二维码识别方法、装置、设备和介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (12)
1.一种基于AI的二维码识别方法,其特征在于,包括:
S1、检测待检测图片得到二维码在所述待检测图片中的位置信息;
S2、根据所述位置信息生成二维码图片;
S3、对所述二维码图片进行图片质量增强并识别得到二维码识别结果。
2.如权利要求1所述的方法,其特征在于,所述步骤S1具体包括:
S11、采用检测模型对待检测图片进行二维码检测,得到各个二维码在所述待检测图片中的位置信息。
3.如权利要求2所述的方法,其特征在于,所述步骤S11具体包括:
S111、基于预先建立的二维码检测模型对待检测图片进行二维码检测,得到各个二维码在所述待检测图片中的位置信息;
其中,所述二维码检测模型为:基于多张带有二维码的位置信息的二维码样本图片作为模型训练数据,对初始网络模型进行训练得到的网络模型,其中,所述二维码检测模型用于使得二维码样本图片与对应的二维码的位置信息相关联,所述二维码样本图片由对多个包含二维码的原始图片进行旋转、尺寸变换和/或图片质量变换得到的,且各个包含二维码的原始图片中的二维码的位置各不相同。
4.如权利要求1所述的方法,其特征在于,所述步骤S2具体包括:
S21、根据所述位置信息,确定所述二维码在所述待检测图片中的目标区域;
S22、生成包含所述目标区域的二维码图片。
5.如权利要求1所述的方法,其特征在于,所述步骤S3具体包括:
S31、从多个预设图片质量增强方式中选择一方式对所述二维码图片进行图片质量增强;
S32、将完成图片质量增强的图片作为当前图片,采用二维码识别算法对所述当前图片进行识别;
S33、判断是否得到识别结果;
S34、如果是,将得到的识别结果作为二维码识别结果。
6.如权利要求5所述的方法,其特征在于,在所述步骤S33之后还包括:
S35、如果否,从剩余的预设图片质量增强方式中选择一方式对所述当前图片进行图片质量增强,返回执行步骤S32。
7.如权利要求5所述的方法,其特征在于,所述步骤S31中的所述多个预设图片质量增强方式包括以下方式中的至少两种:
对所述二维码图片进行图片旋转和图片缩放、调节所述二维码图片的颜色直观特性、对所述二维码图片进行形态学上的开操作、提取所述二维码图片的前景图和对所述二维码图片进行去扭曲。
8.如权利要求7所述的方法,其特征在于,所述对所述二维码图片进行图片旋转和图片缩放,具体包括:
将所述二维码图片中的二维码相互平行的两个边旋转至水平方向,相互平行的另两个边旋转转至竖直方向;
将旋转后的所述二维码图片的大小缩放到预设大小。
9.如权利要求7所述的方法,其特征在于,所述调节所述二维码图片的颜色直观特性,具体包括:
根据所述二维码图片的颜色直观特性确定调整值;
根据调整值对所述二维码图片的颜色直观特性进行调节,其中,所述二维码图片的颜色直观特性包括色调、亮度和饱和度。
10.一种基于AI的二维码识别装置,其特征在于,包括:
二维码检测模块,被配置为检测待检测图片得到二维码在所述待检测图片中的位置信息;
二维码图片生成模块,被配置为根据所述位置信息生成二维码图片;
二维码识别模块,被配置为对所述二维码图片进行图片质量增强并识别得到二维码识别结果。
11.一种计算设备,其特征在于,所述设备包括:
存储有可执行程序代码的存储器;
与存储器耦合的处理器;
其中,处理器调用存储器中存储的可执行程序代码,执行如权利要求1-9任一所述的一种基于AI的二维码识别方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9任一所述的一种基于AI的二维码识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010611516.5A CN111723802A (zh) | 2020-06-30 | 2020-06-30 | 一种基于ai的二维码识别方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010611516.5A CN111723802A (zh) | 2020-06-30 | 2020-06-30 | 一种基于ai的二维码识别方法、装置、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111723802A true CN111723802A (zh) | 2020-09-29 |
Family
ID=72571998
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010611516.5A Pending CN111723802A (zh) | 2020-06-30 | 2020-06-30 | 一种基于ai的二维码识别方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111723802A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113298055A (zh) * | 2021-07-27 | 2021-08-24 | 深兰盛视科技(苏州)有限公司 | 静脉识别方法、装置、设备及计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236883A (zh) * | 2010-04-27 | 2011-11-09 | 株式会社理光 | 图像增强方法和装置、物体检测方法和装置 |
US20160140375A1 (en) * | 2013-10-10 | 2016-05-19 | Tencent Technology (Shenzhen) Company Limited | Two-dimensional code recognition method and apparatus |
CN110046529A (zh) * | 2018-12-11 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 二维码识别方法、装置及设备 |
CN110751004A (zh) * | 2019-10-25 | 2020-02-04 | 北京达佳互联信息技术有限公司 | 二维码检测方法、装置、设备及存储介质 |
CN110969043A (zh) * | 2019-11-25 | 2020-04-07 | 深圳创新奇智科技有限公司 | 基于关键点检测的二维码检测系统及检测方法 |
-
2020
- 2020-06-30 CN CN202010611516.5A patent/CN111723802A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236883A (zh) * | 2010-04-27 | 2011-11-09 | 株式会社理光 | 图像增强方法和装置、物体检测方法和装置 |
US20160140375A1 (en) * | 2013-10-10 | 2016-05-19 | Tencent Technology (Shenzhen) Company Limited | Two-dimensional code recognition method and apparatus |
CN110046529A (zh) * | 2018-12-11 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 二维码识别方法、装置及设备 |
CN110751004A (zh) * | 2019-10-25 | 2020-02-04 | 北京达佳互联信息技术有限公司 | 二维码检测方法、装置、设备及存储介质 |
CN110969043A (zh) * | 2019-11-25 | 2020-04-07 | 深圳创新奇智科技有限公司 | 基于关键点检测的二维码检测系统及检测方法 |
Non-Patent Citations (1)
Title |
---|
刘春树 等: "《深度实践OCR基于深度学习的文字识别》", 机械工业出版社 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113298055A (zh) * | 2021-07-27 | 2021-08-24 | 深兰盛视科技(苏州)有限公司 | 静脉识别方法、装置、设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111667520B (zh) | 红外图像和可见光图像的配准方法、装置及可读存储介质 | |
CN109977886B (zh) | 货架空置率计算方法及装置、电子设备、存储介质 | |
CN111311523B (zh) | 图像处理方法、装置、系统和电子设备 | |
TWI525555B (zh) | 影像處理裝置及處理方法 | |
CN109803172B (zh) | 一种直播视频的处理方法、装置及电子设备 | |
CN109190617B (zh) | 一种图像的矩形检测方法、装置及存储介质 | |
CN111310706B (zh) | 一种商品价签识别方法及装置、电子设备、存储介质 | |
CN110944237B (zh) | 一种字幕区域定位方法、装置和电子设备 | |
US20210117984A1 (en) | Shoe authentication device and authentication process | |
CN113592776A (zh) | 图像处理方法及装置、电子设备、存储介质 | |
CN112990205A (zh) | 手写字符样本的生成方法及装置、电子设备、存储介质 | |
CN108830175A (zh) | 虹膜图像局部增强方法、装置、设备及存储介质 | |
CN112183146A (zh) | 一种条形码的扫描方法、装置、扫描系统及存储介质 | |
CN111461070B (zh) | 文本识别方法、装置、电子设备及存储介质 | |
CN110533704B (zh) | 油墨标签的识别验伪方法、装置、设备及介质 | |
CN111160331A (zh) | 防伪标签验伪方法、设备、介质及模板图生成方法 | |
CN110210467B (zh) | 一种文本图像的公式定位方法、图像处理装置、存储介质 | |
CN111723802A (zh) | 一种基于ai的二维码识别方法、装置、设备和介质 | |
CN115860026A (zh) | 条码检测方法、装置、条码检测设备和可读存储介质 | |
CN109189246B (zh) | 一种对手写板上的涂写内容进行处理的方法、装置和系统 | |
EP4369291A1 (en) | Apparatus and method for identifying empty tray | |
CN113469216B (zh) | 零售终端海报识别与完整性判断方法、系统及存储介质 | |
US20210281742A1 (en) | Document detections from video images | |
JP2023046979A (ja) | 照合装置及びプログラム | |
CN116584100A (zh) | 适合于覆盖媒体内容的图像空间检测 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200929 |
|
RJ01 | Rejection of invention patent application after publication |