CN114549857A - 图像信息识别方法、装置、计算机设备和存储介质 - Google Patents
图像信息识别方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN114549857A CN114549857A CN202210439147.5A CN202210439147A CN114549857A CN 114549857 A CN114549857 A CN 114549857A CN 202210439147 A CN202210439147 A CN 202210439147A CN 114549857 A CN114549857 A CN 114549857A
- Authority
- CN
- China
- Prior art keywords
- dimensional code
- neural network
- point
- feature
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000013528 artificial neural network Methods 0.000 claims abstract description 157
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000004590 computer program Methods 0.000 claims abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 15
- 230000007613 environmental effect Effects 0.000 abstract description 4
- 238000001514 detection method Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000003416 augmentation Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000003321 amplification Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013434 data augmentation Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/1408—Methods for optical code recognition the method being specifically adapted for the type of code
- G06K7/1417—2D bar codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Toxicology (AREA)
- Computational Linguistics (AREA)
- Electromagnetism (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种图像信息识别方法、装置、计算机设备、存储介质和计算机程序产品。通过将待识别二维码输入目标神经网络,并获取目标神经网络输出对应的第一特征点以及第二特征点。其中,目标神经网络基于不同场景的样本图像以及样本图像包含的二维码对应的真实二维码信息训练得到。再根据第一特征点和第二特征点的距离,确定待识别二维码图像对应的版本信息。相较于传统的基于定位中心或面积比例来确定二维码图像版本的方式,本方案利用二维码的两种特征点,以及基于不同场景的二维码训练得到的目标神经网络进行特征点识别,再基于特征点间的距离确定二维码版本,从而降低环境因素对二维码识别的影响,提高了二维码版本识别的准确度。
Description
技术领域
本申请涉及图像处理技术领域,特别是涉及一种图像信息识别方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着计算机技术的发展,手机等移动终端成为了人们日常生活的必需工具之一,而随着二维码技术的出现,目前通过手机等移动终端扫描二维码从而获取到相应信息成为了主流,例如二维码付款等。二维码图像中包含有二维码的版本信息,而准确的版本信息可以帮助更准确地提取到二维码图像中的信息。然而,由于现实场景中的光照、模糊和二维码图像附着的材质等因素,会对采样得到的图像产生影响,降低了从二维码图像中获取版本信息的准确度。
因此,目前的二维码图像的版本信息获取方式存在准确度低的缺陷。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高版本信息获取准确度的图像信息识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种图像信息识别方法,所述方法包括:
获取待识别二维码图像;
将所述待识别二维码图像输入目标神经网络,获取所述目标神经网络输出的所述待识别二维码图像对应的第一特征点以及第二特征点;其中所述第一特征点与所述第二特征点对应,所述第一特征点表征所述待识别二维码图像边缘的特征点,所述第二特征点表征所述待识别二维码图像中与所述第一特征点在同一定位块的特征点;所述目标神经网络基于不同场景下的样本图像以及所述样本图像包含的二维码对应的真实二维码信息训练得到;
根据所述第一特征点和第二特征点的距离和位置,确定所述待识别二维码图像对应的版本信息。
在其中一个实施例中,所述方法还包括:
获取多个具有二维码的不同场景的样本图像以及所述多个样本图像包含的多个真实二维码信息;
将所述多个样本图像输入待训练神经网络,获取所述待训练神经网络输出的所述多个样本图像包含的二维码的多个样本第一特征点和多个样本第二特征点;
根据所述多个样本第一特征点和多个样本第二特征点,以及所述多个真实二维码信息的多个真实第一特征点和多个真实第二特征点,构建损失函数,检测所述损失函数的输出值是否小于或等于预设阈值;
若否,根据所述输出值,通过反向传播算法调整所述待训练神经网络的权重,返回将所述多个样本图像输入待训练神经网络的步骤;
若是,结束循环,将当前的待训练神经网络作为所述目标神经网络。
在其中一个实施例中,所述获取多个具有二维码的不同场景的样本图像,包括:
获取待处理二维码图像以及多个不同类型的背景图像;
将所述待处理二维码图像和所述背景图像融合,得到融合后的二维码图像;
调整多个所述融合后的二维码图像的图像参数,得到多个调整后的二维码图像;
获取多个真实场景下采集的真实场景二维码图像;
根据多个所述融合后的二维码图像、多个所述调整后的二维码图像以及所述真实场景二维码图像,得到所述多个样本图像。
在其中一个实施例中,所述将所述多个样本图像输入待训练神经网络,获取所述待训练神经网络输出的所述多个样本图像包含的二维码的多个样本第一特征点和多个样本第二特征点,包括:
通过Mixup算法和/或Mosiac算法对所述多个样本图像进行图像增强;
将图像增强后的所述多个样本图像输入预训练的Mobilenetv2神经网络,基于特征金字塔网络获取基于所述多个样本图像包含的二维码生成的特征图,从所述特征图中获取所述二维码的多个样本第一特征点和多个样本第二特征点。
在其中一个实施例中,包括多个待识别二维码图像;
所述获取所述目标神经网络输出的所述待识别二维码图像对应的第一特征点以及第二特征点之后,还包括:
获取多组由所述第一特征点和所述第二特征点形成的特征点集合;
获取基于多个所述第一特征点形成的矩形的面积、每个第一特征点距离所在矩形的中心点的距离、每个所述矩形的角度大小、每个所述第一特征点与每个所述第二特征点间的相对位置以及获取每组第一特征点与第二特征点对应的目标神经网络输出值;
根据所述面积、所述每个第一特征点距离所在矩形的中心点的距离、所述角度大小、所述相对位置以及所述目标神经网络输出值,确定所述多组第一特征点和所述第二特征点中属于同一个待识别二维码的一组第一特征点和第二特征点。
在其中一个实施例中,所述获取基于多个所述第一特征点形成的矩形的面积,包括:
从所述特征点集合中获取多组第一特征点组合;每组第一特征点组合中包含预设数量的第一特征点;
获取由所述多组第一特征点组合中各个第一特征点形成的矩形的面积,得到多个矩形的面积。
在其中一个实施例中,所述获取每组第一特征点与第二特征点对应的目标神经网络输出值,包括:
获取每组第一特征点与第二特征点对应的待处理神经网络输出值;
若所述待处理神经网络输出值的响应值大于或等于预设响应值阈值以及所述第一特征点与第二特征点的类别预测正确,确定所述待处理神经网络输出值为该组对应的目标神经网络输出值;
若所述待处理神经网络输出值的响应值小于预设响应值阈值或所述第一特征点与第二特征点的类别预测错误,将所述待处理神经网络输出值对应的第一特征点和第二特征点去除。
在其中一个实施例中,所述根据所述第一特征点和第二特征点的距离,确定所述待识别二维码图像对应的版本信息,包括:
根据所述第一特征点与所述第二特征点的距离和位置,确定由所述第一特征点与所述第二特征点形成的矩形的边长;
根据所述待识别二维码图像一边的边长与所述矩形的边长的长度对应关系,确定所述待识别二维码图像对应的版本信息。
第二方面,本申请提供了一种图像信息识别装置,所述装置包括:
获取模块,用于获取待识别二维码图像;
输入模块,用于将所述待识别二维码图像输入目标神经网络,获取所述目标神经网络输出的所述待识别二维码图像对应的第一特征点以及第二特征点;其中所述第一特征点与所述第二特征点对应,所述第一特征点表征所述待识别二维码图像边缘的特征点,所述第二特征点表征所述待识别二维码图像中与所述第一特征点在同一定位块的特征点;所述目标神经网络基于不同场景下的样本图像以及所述样本图像包含的二维码对应的真实二维码信息训练得到;
识别模块,用于根据所述第一特征点和第二特征点的距离和位置,确定所述待识别二维码图像对应的版本信息。
第三方面,本申请提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
第五方面,本申请提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
上述图像信息识别方法、装置、计算机设备、存储介质和计算机程序产品,通过将待识别二维码输入目标神经网络,并获取目标神经网络输出的待识别二维码边缘的第一特征点,以及第一特征点对应的第二特征点。其中,目标神经网络基于不同场景的样本图像以及样本图像包含的二维码对应的真实二维码信息训练得到。再根据第一特征点和第二特征点的距离,确定待识别二维码图像对应的版本信息。相较于传统的基于定位中心或面积比例来确定二维码图像版本的方式,本方案利用二维码的两种特征点,以及基于不同场景的二维码训练得到的目标神经网络进行特征点识别,再基于特征点间的距离确定二维码版本,从而降低环境因素对二维码识别的影响,提高了二维码版本识别的准确度。
附图说明
图1为一个实施例中图像信息识别方法的应用环境图;
图2为一个实施例中图像信息识别方法的流程示意图;
图3为一个实施例中二维码特征点的结构示意图;
图4为另一个实施例中图像信息识别方法的流程示意图;
图5为一个实施例中图像信息识别装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的图像信息识别方法,可以应用于如图1所示的应用环境中。终端102可以获取待识别二维码图像,并通过将二维码图像输入目标神经网络,获取目标神经网络输出的待识别二维码对应的多个特征点,从而终端102可以根据第一特征点和第二特征点的距离确定待识别二维码图像对应的版本信息。另外,在一些实施例中,包括服务器104。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102可以从服务器104中获取待识别二维码图像,终端102在识别出待识别二维码图像的版本信息后,还可以将版本信息返回至服务器104中。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种图像信息识别方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤S202,获取待识别二维码图像。
其中,待识别二维码图像可以是需要进行信息提取的图像,终端102可以获取待识别的二维码图像。例如,终端102中可以设置有图像采集设备,具体如摄像头,终端102可以通过图像采集设备获取到上述待识别二维码图像。从而终端102可以基于待识别二维码图像对二维码图像的相关信息进行识别。
步骤S204,将待识别二维码图像输入目标神经网络,获取目标神经网络输出的待识别二维码图像对应的第一特征点以及第二特征点;其中第一特征点与第二特征点对应,第一特征点表征待识别二维码图像边缘的特征点,第二特征点表征待识别二维码图像中与第一特征点在同一定位块的特征点;目标神经网络基于不同场景下的样本图像以及样本图像包含的二维码对应的真实二维码信息训练得到。
其中,目标神经网络可以是用于对二维码图像进行特征识别的神经网络模型,终端102可以预先通过样本图像以及样本图像包含的二维码对应的真实二维码信息对神经网络进行训练,得到上述目标神经网络。目标神经网络可以识别二维码图像中对应位置的特征点,包括第一特征点和第二特征点。终端102可以将上述待识别二维码图像输入目标神经网络,获取目标神经网络输出的与待识别二维码对应的第一特征点和第二特征点。
其中,第一特征点可以是二维码图像的边缘的特征点,第二特征点可以是与第一特征点的位置存在相应的对应关系的特征点。例如,如图3所示,图3为一个实施例中二维码特征点的结构示意图。图3展示了一种二维码图像结构,则点400可以是二维码图像中的第一特征点,也称为角点,点402可以是二维码图像中与第一特征点对应的第二特征点,例如,第二特征点可以是在待识别二维码图像中与第一特征点在同一定位块的特征点,即二维码“回”形区域的右下角的点,也称为内点。即二维码图像中的可以包括有四个第一特征点,分别是二维码图像形成的矩形中的四个边缘端点,而由于图3中的二维码图像中包含三个定位块,因此第二特征点可以是三个,即每个第一特征点所在的定位块的对角线的点。需要说明的是,第二特征点可以随着二维码图像定位块的数量而改变,例如一些二维码图像中仅包含一个定位块,则第二特征点可以是一个。由于真实场景中的识别二维码图像时通常会是带有扭曲、被遮挡等具有复杂透视变换的场景,因此终端102可以使用上述的目标神经网络识别二维码图像中的各个角点和对应的内点。
步骤S206,根据第一特征点和第二特征点的距离和位置,确定待识别二维码图像对应的版本信息。
其中,终端102可以利用上述目标神经网络对待识别二维码图像中的特征点进行识别。终端102识别出第一特征点和第二特征点后,可以基于第一特征点和第二特征点的距离和位置关系,确定待识别二维码图像对应的版本信息。例如终端102可以基于上述距离和位置,确定上述第一特征点和对应的第二特征点所在定位块的大小,从而基于该大小确定二维码图像的版本信息。
上述图像信息识别方法中,通过将待识别二维码输入目标神经网络,并获取目标神经网络输出的待识别二维码边缘的第一特征点,以及第一特征点对应的第二特征点。其中,目标神经网络基于不同场景的样本图像以及样本图像包含的二维码对应的真实二维码信息训练得到。再根据第一特征点和第二特征点的距离,确定待识别二维码图像对应的版本信息。相较于传统的基于定位中心或面积比例来确定二维码图像版本的方式,本方案利用二维码的两种特征点,以及基于不同场景的二维码训练得到的目标神经网络进行特征点识别,再基于特征点间的距离确定二维码版本,从而降低环境因素对二维码识别的影响,提高了二维码版本识别的准确度。
在一个实施例中,还包括:获取多个具有二维码的不同场景的样本图像以及多个样本图像包含的多个真实二维码信息;将多个样本图像输入待训练神经网络,获取待训练神经网络输出的多个样本图像包含的二维码的多个样本第一特征点和多个样本第二特征点;根据多个样本第一特征点和多个样本第二特征点,以及多个真实二维码信息的多个真实第一特征点和多个真实第二特征点,构建损失函数,检测损失函数的输出值是否小于或等于预设阈值;若否,根据输出值,通过反向传播算法调整待训练神经网络的权重,返回将多个样本图像输入待训练神经网络的步骤;若是,结束循环,将当前的待训练神经网络作为目标神经网络。
本实施例中,终端102可以预先对待训练神经网络进行训练,从而得到上述目标神经网络。训练时,终端102可以获取多个具有二维码的不同场景的样本图像以及多个样本图像包含的多个真实二维码信息。其中,多个样本图像可以是经过图像增广处理后的二维码图像,上述真实二维码信息可以与样本图像一一对应。真实二维码信息中可以包括已知位置的特征点信息。终端102可以将样本图像输入待训练神经网络,并获取待训练神经网络输出的样本图像包含的样本第一特征点和样本第二特征点,从而终端102可以基于多个样本第一特征点、多个样本第二特征点、多个真实二维码信息的真实第一特征点和真实第二特征点,构建损失函数,从而基于损失函数的输出值是否降低到一定范围并保持稳定来确定待训练神经网络是否完成训练。例如,终端102检测到上述损失函数的输出值大于预设阈值,则终端102确定训练未完成,终端102可以根据输出值,通过反向传播算法调整待训练神经网络的权重,并返回上述将多个样本图像输入待训练神经网络的步骤,继续进行下一次的训练,从而令损失函数的输出值减小。若在一次训练结束时,终端102检测到上述损失函数的输出值小于或等于上述预设阈值,则终端102可以确定训练完成,终端102可以结束循环,并将当前的待训练神经网络作为上述训练完成的目标神经网络。具体地,终端102可以通过反向传播算法,更新神经网络的权重,使得上述损失函数的值不断减小,直到稳定到一个比较小的数值,结束训练过程,否则继续训练神经网络。从而终端102可以基于上述目标神经网络对待识别二维码图像中的第一特征点和第二特征点进行识别。即在训练过程中,对于一个样本图像和对应的样本第一特征点和样本第二特征点,终端102可以设置对应的真实第一特征点和真实第二特征点为1,并令上述神经网络的输出特征图上,二维码对应的第一特征点和第二特征点的位置输出值不断趋向于1,实现对特征点的识别。
其中,终端102训练得到上述目标神经网络后,还可以对目标神经网络的识别性能进行验证。例如,为了验证训练好的网络的有效性,终端102可以使用测试数据,例如将待识别二维码图像作为测试数据,构建测试指标,比如OKS(Object Keypoint Similarity,目标关键点相似度)、像素偏移绝对值、解码率等指标,对模型进行评估,在测试数据上进行验证。具体地,终端102通过上述目标神经网络对待识别二维码图像进行识别后,终端102可以对目标神经网络的输出结果进行上述各项测试指标检测,从而确定目标神经网络的识别性能。
通过本实施例,终端102可以基于样本图像和真实二维码信息对待训练神经网络进行训练,得到目标神经网络,从而终端102可以基于目标神经网络对待识别二维码图像中的特征点进行识别,从而提高二维码版本识别的准确度。
在一个实施例中,获取多个具有二维码的不同场景的样本图像,包括:获取待处理二维码图像以及多个不同类型的背景图像;将待处理二维码图像和背景图像融合,得到融合后的二维码图像;调整多个融合后的二维码图像的图像参数,得到多个调整后的二维码图像;获取多个真实场景下采集的真实场景二维码图像;根据多个融合后的二维码图像、多个调整后的二维码图像以及真实场景二维码图像,得到多个样本图像。
本实施例中,终端102可以基于多个样本图像度待训练神经网络进行训练,因此终端102可以首先获取在多个具有二维码的不同场景的样本图像。终端102可以首先获取未经处理的二维码图像以及多个不同类型的背景图像,并将待处理二维码和背景图像进行融合,从而得到融合后的二维码图像;终端102还可以调整上述融合后的二维码图像的图像参数,从而得到多个融合后的二维码图像。除了通过二维码与背景合成的方式外,终端102还可以获取多个真实场景下采集的真实场景二维码图像,将包含真实二维码图像的真实场景图像作为一种样本图像。其中,真实场景二维码图像可以是从真实场景下采集的二维码图像。终端102可以基于上述多个融合后的二维码图像、多个调整后的二维码图像以及真实场景二维码图像,得到上述多个样本图像。其中,上述的融合和调整过程可以是对待处理二维码图像的图像增广过程。
例如,终端102中可以设置有图像增广模块,终端102通过图像增广模块对采集的图像进行初步处理,形成增广数据集。终端102可以采集标准的QR码,即二维码数据,与不同材料背景数据进行图像合成,增加样本数量,丰富样本的场景背景,终端102还可以通过对实际场景比如快递盒,工业产品等数据进行采集,构建真实样本,从而终端102可以得到上述进行场景融合后的二维码图像。在调整图像参数时,终端102还可以将上述生成图像和真实数据送入图像增广模块,从而终端102可以构造出一些模糊、曝光、缺失等场景的图像,能够丰富样本的多样性,使其更加贴近真实的场景。终端102可以通过常用的一些图像增强方法包括旋转、加干扰噪声、调节图像色相饱和度、人为遮挡、形态学操作(膨胀、腐蚀等)等方法,调整上述二维码图像的图像参数,从而终端102可以得到上述调整后的二维码图像。另外,终端102还可以预先对上述样本图像中的第一特征点和第二特征点进行识别,从而得到已知特征点位置信息的真实二维码信息。
通过本实施例,终端102可以通过场景融合和图像参数调整等方式得到上述样本图像,从而终端102可以基于样本图像训练上述目标神经网络,提高二维码图像识别的准确度。
在一个实施例中,将多个样本图像输入待训练神经网络,获取待训练神经网络输出的多个样本图像包含的二维码的多个样本第一特征点和多个样本第二特征点,包括:通过Mixup算法和/或Mosiac算法对多个样本图像进行图像增强;将图像增强后的多个样本图像输入预训练的Mobilenetv2神经网络,基于特征金字塔网络获取基于多个样本图像包含的二维码生成的特征图,从特征图中获取二维码的多个样本第一特征点和多个样本第二特征点。
本实施例中,终端102可以通过将样本图像输入待训练神经网络中,基于预设的算法输出样本第一特征点和样本第二特征点。终端102可以通过Mixup算法和/或Mosiac算法对上述输入的多个样本图像进行图像增强。并且,终端102还可以将图像增强后的多个样本图像输入预训练的Mobilenetv2神经网络,基于FPN(Feature Pyramid Networks,特征金字塔网络)获取上述多个样本图像包含的二维码的多个样本第一特征点和多个样本第二特征点。
例如,终端102中可以设置有神经网络检测模块,终端102可以在训练过程中通过神经网络检测模块,采用图像增强的方法对训练数据进行随机的增强,包括Mixup、Mosiac等。同时终端102还可以使用ImageNet预训练的Mobilenetv2作为骨干网络,使用FPN进行特征融合,从而进行关键点检测,包括获取头部输入的角点和内点分支,从而终端102可以分别用来检测QR码的第一特征点和第二特征点,其中,QR码的第一特征点可以是QR码的4个角点,QR码的第二特征点可以是角点定位标志对应的3个内点。训练过程中,终端102可以将特征图上对应关键点设置为正样本进行损失函数的运算,从而终端102在将待训练神经网络经过一定迭代后得到训练后的网络。其中,Mixup算法可以是一种混类数据增强方式,运用在计算机视觉中的对图像进行混类增强的算法,它可以将不同类之间的图像进行混合,从而扩充训练数据集。Mosiac是一种数据增广方式,是通过排列四张图片, 以及对应的box来实现数据的增广方式。Mobilenetv2是一个轻量级卷积神经网络。FPN是一种目标检测网络,能在增加极小的计算量的情况下,处理好物体检测中的多尺度变化问题。
通过本实施例,终端102可以基于待训练神经网络中多种算法识别二维码图像中的特征点信息,从而可以利用训练完成的目标神经网络进行二维码图像版本的识别,提高了二维码图像版本信息的识别准确度。
在一个实施例中,获取目标神经网络输出的待识别二维码图像对应的第一特征点以及第二特征点之后,还包括:获取多组由第一特征点和第二特征点形成的特征点集合;获取基于多个第一特征点形成的矩形的面积、每个第一特征点距离所在矩形的中心点的距离、每个矩形的角度大小、每个第一特征点与每个第二特征点间的相对位置以及获取每组第一特征点与第二特征点对应的目标神经网络输出值;根据面积、每个第一特征点距离所在矩形的中心点的距离、角度大小、相对位置以及目标神经网络输出值,确定多组第一特征点和第二特征点中属于同一个待识别二维码的一组第一特征点和第二特征点。
本实施例中,上述待识别二维码图像可以包括多个,则终端102可以利用目标神经网络获取多个待识别二维码图像对应的多个第一特征点和多个第二特征点,终端102可以将多个第一特征点和多个第二特征点形成集合,得到多组有第一特征点和第二特征点形成的特征点集合,终端102还可以获取基于多个第一特征点形成的矩形面积、每个第一特征点距离所在矩形的中心点的距离、每个矩形的角度大小、每个第一特征点与每个第二特征点间的相对位置以及获取每组第一特征点与第二特征点对应的目标神经网络输出值,从而终端102可以根据面积、每个第一特征点距离所在矩形的中心点的距离、角度大小、相对位置以及目标神经网络输出值,确定多组第一特征点和第二特征点中属于同一个待识别二维码的一组第一特征点和第二特征点。即终端102可以对目标神经网络输出的多个第一特征点和多个第二特征点进行组合匹配,得到属于同一个二维码图像的第一特征点和第二特征点组合。其中,上述多个第一特征点形成的矩形的面积可以有多个,即多个第一特征点可以自由进行组合,形成不同的矩形。例如,在一个实施例中,获取基于多个第一特征点形成的矩形的面积,包括:从特征点集合中获取多组第一特征点组合;每组第一特征点组合中包含预设数量的第一特征点;获取由多组第一特征点组合中各个第一特征点形成的矩形的面积,得到多个矩形的面积。本实施例中,终端102可以基于特征点集合中包含的多个第一特征点,得到多组第一特征点组合,每组第一特征点中可以包含预设数量的第一特征点,例如四个。终端102可以基于每组的多个第一特征点进行组合形成矩形,进而得到多个矩形的面积。
其中,终端102还可以预先对上述输出的多个第一特征点和多个第二特征点进行过滤,并基于过滤后的特征点集合进行组合匹配。例如,在一个实施例中,获取每组第一特征点与第二特征点对应的目标神经网络输出值,包括:获取每组第一特征点与第二特征点对应的待处理神经网络输出值;若待处理神经网络输出值的响应值大于或等于预设响应值阈值以及第一特征点与第二特征点的类别预测正确,确定待处理神经网络输出值为该组对应的目标神经网络输出值;若待处理神经网络输出值的响应值小于预设响应值阈值或第一特征点与第二特征点的类别预测错误,将待处理神经网络输出值对应的第一特征点和第二特征点去除。本实施例中,终端102可以对包括角点和内点的集合的神经网络输出结果进行过滤,滤除一些低质量的样本,比如响应值较低,即目标神经网络对输出值的分数较低,以及类别预测错误的点等,从而抑制对检测结果的干扰。终端102还可以进行关键点匹配,对于过滤后的QR码的关键点,终端102可以进行角点和内点的组合匹配,对于同属于一个码的角点和内点,终端102可以采用面积、距离、角度、响应值等方法进行组合。其中,响应值,即上述目标神经网络输出值,可以是目标神经网络对上述各个特征点的定位准确度,该准确度可以用分数表示,分数越低代表这个点的定位越不准,终端102可以通过将响应值设置阈值,过滤掉低质量的定位点。
通过本实施例,终端102可以在待识别二维码图像有多个时,基于多种参数对识别出的多个特定进行组合匹配,从而提高了待识别二维码版本信息的识别准确度。
在一个实施例中,根据第一特征点和第二特征点的距离,确定待识别二维码图像对应的版本信息,包括:根据第一特征点与第二特征点的距离和位置,确定由第一特征点与第二特征点形成的矩形的边长;根据待识别二维码图像一边的边长与矩形的边长的长度对应关系,确定待识别二维码图像对应的版本信息。
本实施例中,终端102可以基于第一特征点和第二特征点的距离,确定待识别二维码图像对应的版本信息。终端102可以根据上述第一特征点和第二特征点的距离和位置关系,确定由第一特征点与第二特征点形成的矩形的边长,并根据待识别二维码图像中一边的边长与上述矩形的边长的长度对应关系,确定待识别二维码图像对应的版本信息。即终端102可以根据组合后的关键点,通过内点和角点的距离与QR码自身格点具有的特性,进行版本号的估计和换算。例如,再如图3所示,角点和对应的内点所在的小方格即是上述矩形,其中小方格也称为码元,可以用于对二维码进行定位,也即一种定位块,终端102知道上述矩形的大小情况下,可以知道这个边有多少个码元,则终端102可以确定有多少个码元,二维码图像的版本号就是多少。二维码的版本号通过与码元的对应关系获得。具体地,终端102可以根据二维码图像一边中单个码元的边长长度,确定一边包含码元的个数,通过码元与版本号的对应关系即可获得二维码的版本信息,其中码元是指构成QR码的方形黑白点。终端102还可以将识别得到的版本信息进行输出和显示。
通过本实施例,终端102可以基于第一特征点和第二特征点形成的矩形大小确定二维码图像的版本信息,从而提高了二维码图像版本信息的识别准确度。
在一个实施例中,如图4所示,图4为另一个实施例中图像信息识别方法的流程示意图。本实施例中,终端102中可以设置有图像增广模块、神经网络检测模块和版本号估计模块。终端102可以通过图像增广模块进行标准二维码图像的采集以及对标准二维码图像进行背景融合,并通过采集真实场景的二维码数据,进行图像增广,包括对图像的参数调整等,形成增广数据集。终端102可以利用该数据集,通过神经网络检测模块进行目标神经网络的训练,将训练完成的目标神经网络投入实际角点和内点的识别过程,得到角点和内点的检测结果。角点和内点有多个时,终端102可以通过版本号估计模块,对多个角点和内点进行过滤,将过滤后的角点和内点进行组合匹配,得到同属于一个二维码图像的角点和内点组合,并基于组合匹配后的角点和内点进行版本号的估计,并输出相应的版本号信息。
通过上述实施例,终端102利用二维码的两种特征点,以及基于不同场景的二维码训练得到的目标神经网络进行特征点识别,再基于特征点间的距离确定二维码版本,从而降低环境因素对二维码识别的影响,提高了二维码版本识别的准确度。并且,终端102基于神经网络设计关键点检测算法,能够输出不规则的四边形,从而对真实场景中带有扭曲、遮挡等具有复杂透视变换的二维码进行更准确的定位,终端102提供QR码的角点位置的同时,还对定位标志对应的内点完成检测,从而能够通过位置计算估算QR码版本信息,相比于传统方法具有更强的鲁棒性和场景适应性。以及,基于神经网络的关键点检测方法,可以更好适应不同的场景变化,算法逻辑相应简单,更加高效。通过神经网络的定位完成QR码版本号的估计具有更高的效率,尤其在一图多码的场景下,速度优势更加明显。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的图像信息识别方法的图像信息识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个图像信息识别装置实施例中的具体限定可以参见上文中对于图像信息识别方法的限定,在此不再赘述。
在一个实施例中,如图5所示,提供了一种图像信息识别装置,包括:获取模块500、输入模块502和识别模块504,其中:
获模块500,用于获取待识别二维码图像。
输入模块502,用于将待识别二维码图像输入目标神经网络,获取目标神经网络输出的待识别二维码图像对应的第一特征点以及第二特征点;其中第一特征点与第二特征点对应,第一特征点表征待识别二维码图像边缘的特征点,第二特征点表征待识别二维码图像中与第一特征点在同一定位块的特征点;目标神经网络基于不同场景下的样本图像以及样本图像包含的二维码对应的真实二维码信息训练得到。
识别模块504,用于根据第一特征点和第二特征点的距离和位置,确定待识别二维码图像对应的版本信息。
在一个实施例中,上述装置还包括:训练模块,用于获取多个具有二维码的不同场景的样本图像以及多个样本图像包含的多个真实二维码信息;将多个样本图像输入待训练神经网络,获取待训练神经网络输出的多个样本图像包含的二维码的多个样本第一特征点和多个样本第二特征点;根据多个样本第一特征点和多个样本第二特征点,以及多个真实二维码信息的多个真实第一特征点和多个真实第二特征点,构建损失函数,检测损失函数的输出值是否小于或等于预设阈值;若否,根据输出值,通过反向传播算法调整待训练神经网络的权重,返回将多个样本图像输入待训练神经网络的步骤;若是,结束循环,将当前的待训练神经网络作为目标神经网络。
在一个实施例中,上述训练模块,具体用于获取待处理二维码图像以及多个不同类型的背景图像;将待处理二维码图像和背景图像融合,得到融合后的二维码图像;调整多个融合后的二维码图像的图像参数,得到多个调整后的二维码图像;获取多个真实场景下采集的真实场景二维码图像;根据多个融合后的二维码图像、多个调整后的二维码图像以及真实场景二维码图像,得到多个样本图像。
在一个实施例中,上述训练模块,具体用于通过Mixup算法和/或Mosiac算法对多个样本图像进行图像增强;将图像增强后的多个样本图像输入预训练的Mobilenetv2神经网络,基于特征金字塔网络获取基于多个样本图像包含的二维码生成的特征图,从特征图中获取二维码的多个样本第一特征点和多个样本第二特征点。
在一个实施例中,上述装置还包括:匹配模块,用于获取多组由第一特征点和第二特征点形成的特征点集合;获取基于多个第一特征点形成的矩形的面积、每个第一特征点距离所在矩形的中心点的距离、每个矩形的角度大小、每个第一特征点与每个第二特征点间的相对位置以及获取每组第一特征点与第二特征点对应的目标神经网络输出值;根据面积、每个第一特征点距离所在矩形的中心点的距离、角度大小、相对位置以及目标神经网络输出值,确定多组第一特征点和第二特征点中属于同一个待识别二维码的一组第一特征点和第二特征点。
在一个实施例中,上述匹配模块,具体用于从所述特征点集合中获取多组第一特征点组合;每组第一特征点组合中包含预设数量的第一特征点;获取由所述多组第一特征点组合中各个第一特征点形成的矩形的面积,得到多个矩形的面积。
在一个实施例中,上述匹配模块,具体用于获取每组第一特征点与第二特征点对应的待处理神经网络输出值;若所述待处理神经网络输出值的响应值大于或等于预设响应值阈值以及所述第一特征点与第二特征点的类别预测正确,确定所述待处理神经网络输出值为该组对应的目标神经网络输出值;若所述待处理神经网络输出值的响应值小于预设响应值阈值或所述第一特征点与第二特征点的类别预测错误,将所述待处理神经网络输出值对应的第一特征点和第二特征点去除。
在一个实施例中,上述识别模块504,具体用于根据第一特征点与第二特征点的距离和位置,确定由第一特征点与第二特征点形成的矩形的边长;根据待识别二维码图像一边的边长与矩形的边长的长度对应关系,确定待识别二维码图像对应的版本信息。
上述图像信息识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种图像信息识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述的图像信息识别方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的图像信息识别方法。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的图像信息识别方法。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (12)
1.一种图像信息识别方法,其特征在于,所述方法包括:
获取待识别二维码图像;
将所述待识别二维码图像输入目标神经网络,获取所述目标神经网络输出的所述待识别二维码图像对应的第一特征点以及第二特征点;其中所述第一特征点与所述第二特征点对应,所述第一特征点表征所述待识别二维码图像边缘的特征点,所述第二特征点表征所述待识别二维码图像中与所述第一特征点在同一定位块的特征点;所述目标神经网络基于不同场景下的样本图像以及所述样本图像包含的二维码对应的真实二维码信息训练得到;
根据所述第一特征点和第二特征点的距离和位置,确定所述待识别二维码图像对应的版本信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取多个具有二维码的不同场景的样本图像以及所述多个样本图像包含的多个真实二维码信息;
将所述多个样本图像输入待训练神经网络,获取所述待训练神经网络输出的所述多个样本图像包含的二维码的多个样本第一特征点和多个样本第二特征点;
根据所述多个样本第一特征点和多个样本第二特征点,以及所述多个真实二维码信息的多个真实第一特征点和多个真实第二特征点,构建损失函数,检测所述损失函数的输出值是否小于或等于预设阈值;
若否,根据所述输出值,通过反向传播算法调整所述待训练神经网络的权重,返回将所述多个样本图像输入待训练神经网络的步骤;
若是,结束循环,将当前的待训练神经网络作为所述目标神经网络。
3.根据权利要求2所述的方法,其特征在于,所述获取多个具有二维码的不同场景的样本图像,包括:
获取待处理二维码图像以及多个不同类型的背景图像;
将所述待处理二维码图像和所述背景图像融合,得到融合后的二维码图像;
调整多个所述融合后的二维码图像的图像参数,得到多个调整后的二维码图像;
获取多个真实场景下采集的真实场景二维码图像;
根据多个所述融合后的二维码图像、多个所述调整后的二维码图像以及所述真实场景二维码图像,得到所述多个样本图像。
4.根据权利要求2所述的方法,其特征在于,所述将所述多个样本图像输入待训练神经网络,获取所述待训练神经网络输出的所述多个样本图像包含的二维码的多个样本第一特征点和多个样本第二特征点,包括:
通过Mixup算法和/或Mosiac算法对所述多个样本图像进行图像增强;
将图像增强后的所述多个样本图像输入预训练的Mobilenetv2神经网络,基于特征金字塔网络获取基于所述多个样本图像包含的二维码生成的特征图,从所述特征图中获取所述二维码的多个样本第一特征点和多个样本第二特征点。
5.根据权利要求1所述的方法,其特征在于,包括多个待识别二维码图像;
所述获取所述目标神经网络输出的所述待识别二维码图像对应的第一特征点以及第二特征点之后,还包括:
获取多组由所述第一特征点和所述第二特征点形成的特征点集合;
获取基于多个所述第一特征点形成的矩形的面积、每个第一特征点距离所在矩形的中心点的距离、每个所述矩形的角度大小、每个所述第一特征点与每个所述第二特征点间的相对位置以及获取每组第一特征点与第二特征点对应的目标神经网络输出值;
根据所述面积、所述每个第一特征点距离所在矩形的中心点的距离、所述角度大小、所述相对位置以及所述目标神经网络输出值,确定所述多组第一特征点和所述第二特征点中属于同一个待识别二维码的一组第一特征点和第二特征点。
6.根据权利要求5所述的方法,其特征在于,所述获取基于多个所述第一特征点形成的矩形的面积,包括:
从所述特征点集合中获取多组第一特征点组合;每组第一特征点组合中包含预设数量的第一特征点;
获取由所述多组第一特征点组合中各个第一特征点形成的矩形的面积,得到多个矩形的面积。
7.根据权利要求5所述的方法,其特征在于,所述获取每组第一特征点与第二特征点对应的目标神经网络输出值,包括:
获取每组第一特征点与第二特征点对应的待处理神经网络输出值;
若所述待处理神经网络输出值的响应值大于或等于预设响应值阈值以及所述第一特征点与第二特征点的类别预测正确,确定所述待处理神经网络输出值为该组对应的目标神经网络输出值;
若所述待处理神经网络输出值的响应值小于预设响应值阈值或所述第一特征点与第二特征点的类别预测错误,将所述待处理神经网络输出值对应的第一特征点和第二特征点去除。
8.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征点和第二特征点的距离,确定所述待识别二维码图像对应的版本信息,包括:
根据所述第一特征点与所述第二特征点的距离和位置,确定由所述第一特征点与所述第二特征点形成的矩形的边长;
根据所述待识别二维码图像一边的边长与所述矩形的边长的长度对应关系,确定所述待识别二维码图像对应的版本信息。
9.一种图像信息识别装置,其特征在于,所述装置包括:
获取模块,用于获取待识别二维码图像;
输入模块,用于将所述待识别二维码图像输入目标神经网络,获取所述目标神经网络输出的所述待识别二维码图像对应的第一特征点以及第二特征点;其中所述第一特征点与所述第二特征点对应,所述第一特征点表征所述待识别二维码图像边缘的特征点,所述第二特征点表征所述待识别二维码图像中与所述第一特征点在同一定位块的特征点;所述目标神经网络基于不同场景下的样本图像以及所述样本图像包含的二维码对应的真实二维码信息训练得到;
识别模块,用于根据所述第一特征点和第二特征点的距离和位置,确定所述待识别二维码图像对应的版本信息。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
12.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210439147.5A CN114549857A (zh) | 2022-04-25 | 2022-04-25 | 图像信息识别方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210439147.5A CN114549857A (zh) | 2022-04-25 | 2022-04-25 | 图像信息识别方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114549857A true CN114549857A (zh) | 2022-05-27 |
Family
ID=81667479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210439147.5A Pending CN114549857A (zh) | 2022-04-25 | 2022-04-25 | 图像信息识别方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114549857A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115578606A (zh) * | 2022-12-07 | 2023-01-06 | 深圳思谋信息科技有限公司 | 二维码识别方法、装置、计算机设备及可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109934038A (zh) * | 2019-03-18 | 2019-06-25 | 阿里巴巴集团控股有限公司 | 二维码校正方法、装置及设备 |
CN110197096A (zh) * | 2019-06-10 | 2019-09-03 | 阿里巴巴集团控股有限公司 | 二维码校正方法、装置及设备 |
CN114022558A (zh) * | 2022-01-05 | 2022-02-08 | 深圳思谋信息科技有限公司 | 图像定位方法、装置、计算机设备和存储介质 |
-
2022
- 2022-04-25 CN CN202210439147.5A patent/CN114549857A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109934038A (zh) * | 2019-03-18 | 2019-06-25 | 阿里巴巴集团控股有限公司 | 二维码校正方法、装置及设备 |
CN110197096A (zh) * | 2019-06-10 | 2019-09-03 | 阿里巴巴集团控股有限公司 | 二维码校正方法、装置及设备 |
CN114022558A (zh) * | 2022-01-05 | 2022-02-08 | 深圳思谋信息科技有限公司 | 图像定位方法、装置、计算机设备和存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115578606A (zh) * | 2022-12-07 | 2023-01-06 | 深圳思谋信息科技有限公司 | 二维码识别方法、装置、计算机设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109961009B (zh) | 基于深度学习的行人检测方法、系统、装置及存储介质 | |
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
CN106778928B (zh) | 图像处理方法及装置 | |
US10534957B2 (en) | Eyeball movement analysis method and device, and storage medium | |
CN109960742B (zh) | 局部信息的搜索方法及装置 | |
CN110659589B (zh) | 基于姿态和注意力机制的行人再识别方法、系统、装置 | |
WO2021051868A1 (zh) | 目标的定位方法及装置、计算机设备、计算机存储介质 | |
CN110765795B (zh) | 二维码识别方法、装置及电子设备 | |
CN107766864B (zh) | 提取特征的方法和装置、物体识别的方法和装置 | |
CN111414803A (zh) | 人脸识别方法、装置、电子设备 | |
CN114022558A (zh) | 图像定位方法、装置、计算机设备和存储介质 | |
CN110826534B (zh) | 一种基于局部主成分分析的人脸关键点检测方法及系统 | |
CN111199169A (zh) | 图像处理方法和装置 | |
CN114549857A (zh) | 图像信息识别方法、装置、计算机设备和存储介质 | |
CN112750071B (zh) | 一种用户自定义的表情制作方法及系统 | |
CN116596935B (zh) | 形变检测方法、装置、计算机设备及计算机可读存储介质 | |
CN112348008A (zh) | 证件信息的识别方法、装置、终端设备及存储介质 | |
CN116071804A (zh) | 人脸识别的方法、装置和电子设备 | |
CN110532971A (zh) | 图像处理及装置、训练方法以及计算机可读存储介质 | |
CN114239758B (zh) | 珠宝款码确定方法、装置、计算机设备和存储介质 | |
CN112084874B (zh) | 一种物体检测方法、装置及终端设备 | |
CN115705758A (zh) | 活体识别方法、装置、电子设备和存储介质 | |
CN113298098A (zh) | 基础矩阵估计方法及相关产品 | |
CN112487858A (zh) | 一种视频生成方法及装置 | |
CN110232326B (zh) | 一种三维物体识别方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220527 |