CN113255389B - 图像的识别方法、装置、电子设备以及存储介质 - Google Patents
图像的识别方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN113255389B CN113255389B CN202011507464.3A CN202011507464A CN113255389B CN 113255389 B CN113255389 B CN 113255389B CN 202011507464 A CN202011507464 A CN 202011507464A CN 113255389 B CN113255389 B CN 113255389B
- Authority
- CN
- China
- Prior art keywords
- target image
- image
- identification
- user operation
- coordinate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/1408—Methods for optical code recognition the method being specifically adapted for the type of code
- G06K7/1417—2D bar codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/235—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on user input or interaction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Electromagnetism (AREA)
- General Health & Medical Sciences (AREA)
- Toxicology (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供了一种图像的识别方法、装置、电子设备及计算机可读存储介质,涉及图像处理技术领域。该方法通过获取目标图像,并展示该目标图像,在目标图像中包括待识别的图像介质标识,接着响应于检测到针对目标图像的用户操作,获取与用户操作对应的坐标信息,通过检测用户操作,动态获取针对图像介质标识的坐标信息,保证了所生成识别区域的准确性、有效性,接着根据坐标信息,生成针对图像介质标识的识别区域,对识别区域进行识别,得到针对目标图像的识别结果,通过生成识别区域,在保证识别区域的有效性的基础上,有效缩小了识别区域的面积,提高二维码识别算法的运算效率,通过识别区域对介质标识进行定位,提高二维码识别的准确性和有效性。
Description
技术领域
本发明涉及图像处理技术领域,特别是涉及一种图像的识别方法、装置、电子设备以及计算机可读存储介质。
背景技术
随着科技的发展,二维码已经成为信息传播的便捷载体,并且随着二维码的集成度越来越高,用户可以通过扫描二维码获得相关的信息,例如识别票据中二维码获取票据或其他凭证文件的相关信息等。然而,在对图像进行识别的过程中,尤其是对图像中的二维码进行识别的过程中,往往采用固定配置值进行二维码算法运算,存在识别操作繁琐、识别不准确、识别效率和成功率低的问题。
发明内容
鉴于上述问题,提出了本发明实施例提供一种图像的识别方法、装置、电子设备以及计算机可读存储介质,以解决或部分解决现有技术中扫描设备对图像的图像标识进行识别过程中,识别不准确、识别效率和成功率低的问题。
本发明实施例公开了一种图像的识别方法,应用于扫描设备,所述方法包括:
获取目标图像,并通过预设的图形用户界面展示所述目标图像,所述目标图像至少包括图像介质标识;
响应于检测到针对所述目标图像的用户操作,获取与所述用户操作对应的坐标信息;
根据所述坐标信息,生成针对所述图像介质标识的识别区域;
对所述识别区域中的图像介质标识进行识别,生成针对所述目标图像的识别结果。
可选地,所述响应于检测到针对所述目标图像的用户操作,获取与所述用户操作对应的坐标信息,包括:
响应作用于所述目标图像的第一用户操作,选定与所述第一用户操作对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标;
响应作用于所述目标图像的第二用户操作的结束,选定与所述第二用户操作对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标。
可选地,所述响应作用于所述目标图像的第一用户操作,选定与所述第一用户操作对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标,包括:
响应作用于所述目标图像的触控操作,选定与所述触控操作对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标;
所述响应作用于所述目标图像的第二用户操作的结束,选定与所述第二用户操作对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标,包括:
响应作用于所述目标图像的滑动操作的结束,选定与所述滑动操作对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标。
可选地,所述响应作用于所述目标图像的第一用户操作,选定与所述第一用户操作对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标,包括:
响应于检测到针对所述目标图像的点击事件,在所述目标图像中选定与所述点击事件对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标;
所述响应作用于所述目标图像的第二用户操作的结束,选定与所述第二用户操作对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标,包括:
响应于检测到针对所述目标图像的拖动事件的结束,选定与所述拖动事件对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标。
可选地,所述根据所述坐标信息,生成针对所述图像介质标识的识别区域,包括:
采用所述起点坐标与所述终点坐标,在所述目标图像中确定针对所述图像介质标识的识别区域。
可选地,所述对所述识别区域中的图像介质标识进行识别,生成针对所述目标图像的识别结果,包括:
响应于检测到针对所述图像介质标识的识别事件,对所述识别区域中的图像介质标识进行识别,生成针对所述目标图像的识别结果。
可选地,所述扫描设备还包括图像传感器、下位机以及上位机,所述获取目标图像,并通过所述图形用户界面展示所述目标图像,包括:
通过所述扫描设备的下位机控制所述图像传感器采集原始图像;
通过所述上位机对所述原始图像进行图像格式转换,生成所述目标图像,并通过所述图形用户界面展示所述目标图像。
本发明实施例还公开了一种图像的识别装置,应用于扫描设备,所述装置包括:
图像获取模块,用于获取目标图像,并通过预设的图形用户界面展示所述目标图像,所述目标图像至少包括图像介质标识;
坐标信息获取模块,用于响应于检测到针对所述目标图像的用户操作,获取与所述用户操作对应的坐标信息;
识别区域生成模块,用于根据所述坐标信息,生成针对所述图像介质标识的识别区域;
图像识别模块,用于对所述识别区域中的图像介质标识进行识别,生成针对所述目标图像的识别结果。
可选地,所述坐标信息获取模块包括:
起点坐标获取子模块,用于响应作用于所述目标图像的第一用户操作,选定与所述第一用户操作对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标;
终点坐标获取子模块,用于响应作用于所述目标图像的第二用户操作的结束,选定与所述第二用户操作对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标。
可选地,所述起点坐标获取子模块具体用于:
响应作用于所述目标图像的触控操作,选定与所述触控操作对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标;
所述终点坐标获取子模块具体用于:
响应作用于所述目标图像的滑动操作的结束,选定与所述滑动操作对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标。
可选地,所述起点坐标获取子模块具体用于:
响应于检测到针对所述目标图像的点击事件,在所述目标图像中选定与所述点击事件对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标;
所述终点坐标获取子模块具体用于:
响应于检测到针对所述目标图像的拖动事件的结束,选定与所述拖动事件对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标。
可选地,所述识别区域生成模块具体用于:
采用所述起点坐标与所述终点坐标,在所述目标图像中确定针对所述图像介质标识的识别区域。
可选地,所述图像识别模块具体用于:
响应于检测到针对所述图像介质标识的识别事件,对所述识别区域中的图像介质标识进行识别,生成针对所述目标图像的识别结果。
可选地,所述扫描设备还包括图像传感器、下位机以及上位机,所述图像获取模块具体用于:
通过所述扫描设备的下位机控制所述图像传感器采集原始图像;
通过所述上位机对所述原始图像进行图像格式转换,生成所述目标图像,并通过所述图形用户界面展示所述目标图像。
本发明实施例还公开了一种电子设备,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述电子设备执行如上所述的一个或多个的方法。
本发明实施例还公开了一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如上所述的一个或多个的方法。
本发明包括以下优点:
在本发明中,可以应用于扫描设备,扫描设备通过获取目标图像,并通过对应的图形用户界面展示该目标图像,在目标图像中可以包括待识别的图像介质标识,接着响应于检测到针对目标图像的用户操作,获取与用户操作对应的坐标信息,通过检测用户操作,动态获取针对图像介质标识的坐标信息,保证了后续所生成识别区域的准确性、有效性,接着根据坐标信息,生成针对图像介质标识的识别区域,并对该识别区域中的图像介质标识进行识别,得到针对目标图像的识别结果,通过生成识别区域,在保证了识别区域的有效性的基础上,有效缩小了识别区域的面积,提高了二维码识别算法的运算效率,并且通过识别区域对介质标识进行定位,提高了二维码识别的准确性和有效性。
附图说明
图1是本发明的一种图像的识别方法实施例的步骤流程图;
图2是本发明实施例中识别区域的示意图;
图3是本发明的一种图像的识别方法的流程图;
图4是本发明的一种图像的识别装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
扫描设备可以为设有图像扫描和图像介质标识识别功能的图像扫描设备,如二代身份证扫描仪、A4纸扫描仪等等。
图像介质标识可以为采用某种特定的几何图形并按一定规律在平面(二维方向上)分布的、黑白相间、记录数据符号信息的图形标识,可以通过图像输入设备或光电扫描设备自动识读以实现信息的自动处理。例如,图像介质标识可以包括二维码、条形码等等,在本发明中,以图像介质标识为二维码为例进行示例性说明,可以理解的是,本发明对此不作限制。
作为一种示例,对于扫描设备的二维码识别功能大部分是通过设备的图像传感器采集带有二维码图案的介质标识的图像数据,将采集到的数据进行旋正提取压缩算法的处理,最终得到Jpg或Bmp格式的图像文件,进而根据需求利用二维码识别算法识别出图片上的二维码码值。
对于二维码识别算法,其需要应用层提供图像数据以及图像上二维码区域,而通过人工查看图像信息确定二维码识别区域,或者直接选取能够保证包含二维码的较大的识别区域,又或者根据产品的固定业务需求(如某个银行仅需识别某一种凭证文件)可确定图像介质标识上的二维码图像位置也是固定的,因此,采用设置固定值的形式进行提前预设坐标值,如将固定的坐标值写入配置文件中,待识别时将配置文件中的坐标值读出来直接用作当前图片上二维码识别区域坐标,供二维码识别算法使用等二维码识别方式。
在上述二维码识别方式中,基于人工查看图像信息确定二维码识别区域坐标值的方式,识别操作过于繁琐,用户体验较差;若直接选取较大值作为二维码识别区域坐标值,保证识别面积能够全面覆盖图像所有区域,在识别算法运算过程中需要经过:图像数据加载、截取识别区域内图像、对截取图像做灰度化、对截取图像做二值化、在识别区遍历膨胀定位识别区域内所有二维码的轮廓位置、逐个截取轮廓内二位码数据进行码值识别等步骤。由此可见识别区域广,会导致二维码识别算法遍历运算耗时长,同时如果给定的识别区域中有多个不需要识别的二维码时,也做识别运算会造成不必要的时间成本浪费,影响识别效率和用户体验度;将固定的坐标值写入配置文件中,待识别时将配置文件中的坐标值读出来直接用作当前图片上二维码识别区域坐标,供二维码识别算法使用的方法,受限于介质的总类,产品灵活度低,例如产品应用在介质上的二维码位置随机变化的时候,扫描出来的图片上的二维码坐标也无法取固定值,因此类场景使用配置文件的固定便无法满足了,同时即使是介质上的二维码位置固定,但是由于介质传输过程中外界因素的干扰每次扫描结果图像都会有一定的偏差,因此二维码识别区域也会有一定幅度的变化波动,使用配置文件的固定也难于保证识别成功率、准确性。因此,在对图像进行二维码识别的过程中,存在识别操作繁琐、识别不准确,识别效率以及成功率低的问题。
因为,本发明实施例的核心发明点之一在于通过扫描设备对目标图像进行展示,并响应于检测到针对目标图像的用户操作,获取与用户操作对应的坐标信息,根据该坐标信息确定二维码在图像中的识别区域,在保证了识别区域的有效性的基础上,有效缩小了识别区域的面积,提高了二维码识别算法的运算效率,同时通过对识别区域对二维码进行定位,提高了二维码识别的准确性和有效性。
具体的,参照图1,示出了本发明的一种图像的识别方法实施例的步骤流程图,应用于扫描设备,具体可以包括如下步骤:
步骤101,获取目标图像,并通过预设的图形用户界面展示所述目标图像,所述目标图像至少包括图像介质标识;
当扫描设备上电初始化完成后,处于就绪状态,若接收到扫描指令,则可以对放置于扫描区域中的带二维码图案的介质进行扫描,得到原始图像,然后对原始图像进行图像格式转换,生成对应的目标图像,并对目标图像进行可视化。
其中,扫描设备可以包括图像传感器、下位机以及上位机等,则扫描设备可以通过下位机控制图像传感器扫描带有二维码图案的介质(例如票据等),采集得到原始图像数据(raw格式),接着对raw数据做旋正提取压缩图像处理算法运算,最终得到Jpg或者Bmp格式图像文件,即目标图像,然后扫描设备可以通过上位机将Jpg/Bmp图像文件加载至对应的图形用户界面进行展示,实现目标图像的可视化。可选地,下位机可以为直接控制设备获取设备状况的计算机,一般是PLC(Programmable Logic Controller,可编程逻辑控制器)/单片机之类的;上位机可以为直接发出操控命令的计算机,例如PC(Personal Computer,个人计算机)等,本发明对此不作限制。
在一种示例中,扫描设备的上位机具有图形用户界面,则上位机得到Jpg/Bmp图像文件后,可以直接在图形用户界面展示目标图像,以便用户对目标图像作进一步的操作。
在另一种示例中,扫描设备可以与用户终端进行通信连接,用户终端可以为移动终端、PC终端等具有图形用户界面的终端设备,则扫描设备可以通过上位机将目标图像发送至用户终端,在用户终端中可以运行对应的应用程序,以在接收到扫描设备发送的目标图像后,在用户终端的图形用户界面中对目标图像进行展示,以便用户对目标图像做进一步的操作。
需要说明的是,在本发明中,以扫描设备具有显示屏,并通过显示屏的图形用户界面进行图像展示为例进行示例性说明,可以理解的是,本发明对此不作限制。
步骤102,响应于检测到针对所述目标图像的用户操作,获取与所述用户操作对应的坐标信息;
当通过图形用户界面展示目标图像后,若需要对目标图像中的二维码进行识别,则扫描设备可以响应于检测到针对目标图像的用户操作,获取与用户操作对应的坐标信息。其中,用户操作可以由至少一种操作组成,坐标信息可以包括起点坐标以及终点坐标等。
在本发明的一种可选实施例中,扫描设备可以响应作用于目标图像的第一用户操作,选定与第一用户操作对应的第一像素点,获取第一像素点在目标图像的起点坐标,接着响应作用于目标图像的第二用户操作的结束,选定与第二用户操作对应的第二像素点,获取第二像素点在目标图像的终点坐标。其中,第一用户操作与第二用户操作可以为互不相同的两种用户操作。
在具体实现中,针对不同类型的图形用户界面,可以扫描设备可以响应不同类型的用户操作,若扫描设备的图形用户界面支持触控操作,则可以响应作用于目标图像的触控操作,选定与触控操作对应的第一像素点,获取第一像素点在目标图像的起点坐标,接着响应作用于目标图像的滑动操作的结束,选定与滑动操作对应的第二像素点,获取第二像素点在目标图像的终点坐标。若扫描设备的图形用户界面不支持触控操作,用户需要通过外接设备对目标图像进行操作,则响应于检测到针对目标图像的点击事件,在目标图像中选定与点击事件对应的第一像素点,获取第一像素点在目标图像的起点坐标,接着响应于检测到针对目标图像的拖动事件的结束,选定与拖动事件对应的第二像素点,获取第二像素点在目标图像的终点坐标,从而在图像可视化的情况下,通过检测用户操作,动态获取针对图像介质标识的坐标信息,保证了后续所生成识别区域的准确性、有效性。
需要说明的是,若扫描设备的图形用户界面不支持触控操作,则用户可以通过鼠标对目标图像进行处理,如点击事件可以为用户通过鼠标在图形用户界面所对应的光标,选中目标位置并产生的点击事件,拖动事件可以为用户在通过鼠标点击之后,在松开手指之前,通过光标在图像用户界面中进行移动后,松开手指所产生的拖动事件。
具体的,对于图形用户界面,其可以由多个像素点组成,则扫描设备可以根据鼠标/触控点在图形用户界面上的位置推到出目标图像上对应像素点的坐标值点,即起点坐标(x0,y0)与终点坐标(x1,y1)。例如,以用户通过鼠标操作为例进行说明,以图形用户界面的左上角为原点(0,0),则鼠标光标当前的位置点M可以为(x=Xm,y=Ym),接着通过映射获取到点M在图形用户界面所显示的目标图像上的相对位置L(x=Xl,y=Yl),并获取目标图像的长度Wi以及宽度Hi,以及图形用户界面的长度Wl以及宽度Hl,然后将目标图像中坐标点L按照比例缩放转换为图片坐标I(xi,yi),其中,图像像素点的横坐标Xi可以如下公式所得:
图像像素点的横坐标Yi可以如下公式所得:
通过上述过程可以得到作用于目标图像的第一用户操作所对应的起点坐标,以及第二用户操作所对应的终点坐标,实现在图像可视化的情况下,通过检测用户操作,动态获取针对图像介质标识的坐标信息,保证了后续所生成识别区域的准确性、有效性。
步骤103,根据所述坐标信息,生成针对所述图像介质标识的识别区域;
在具体实现中,扫描设备通过检测用户在目标图像上的用户操作,得到起点坐标以及终点坐标后,可以采用起点坐标与终点坐标,生成针对二维码的识别区域。
在一种示例中,参考图2,示出了本发明实施例中识别区域的示意图,扫描设备在监控到松开事件(包括鼠标点击松开事件或触控松开事件等),可以通过起点坐标的横坐标与终点坐标的横坐标,计算识别区域的长度,以及根据两者的纵坐标计算识别区域的宽度,并在图形用户界面中展示对应的识别区域,同时提示用户是否对识别区域内的二维码进行识别操作。例如,可以在提供一个识别控件,当用户选中该识别控件时,对识别区域内的二维码进行识别操作;若用户选择不识别,则可以继续监控针对目标图像的用户操作事件,以实时根据用户操作,执行对应的图像处理,从而通过生成识别区域,在保证了识别区域的有效性的基础上,有效缩小了识别区域的面积,提高了二维码识别算法的运算效率,并且通过识别区域对介质标识进行定位,提高了二维码识别的准确性和有效性。
步骤104,对所述识别区域中的图像介质标识进行识别,生成针对所述目标图像的识别结果。
在本发明中,扫描设备可以响应于检测到针对二维码的识别事件,对识别区域中的二维码进行识别,生成针对目标图像的识别结果。
在具体实现中,若用户选择对识别区域内的二维码进行识别,则可以将二维码所在的目标图像的文件目录和所得到识别区域的起点坐标和终点坐标,作为输入参数输入二维码识别算法进行运算,以对二维码进行识别,得到对应二维码码值,进而得到针对目标图像的识别结果,完成图像识别。
具体的,二维码识别算法可以对所得到的识别区域的坐标数据,进行二维码识别算法运算,包括:①加载整张图像数据;②根据识别区域坐标截取识别区域内图像数据;③对所截取得图像数据进行灰度化处理;④对截取图像数据进行二值化处理;⑤在识别区域遍历各个像素点,逐个定位识别区域内所有二维码的轮廓位置;⑥逐个截取轮廓内二维码数据进行码值识别算法处理等,从而完成二维码的识别,由此可见,通过检测用户针对目标图像的用户操作,确定识别区域,在保证了识别区域的有效性的基础上,有效缩小了识别区域的面积,可以准确快速的完成目标二维码识别过程,得到用户需要码值数据。
需要说明的是,本发明实施例包括但不限于上述示例,可以理解的是,本领域技术人员在本发明的思想指导下,还可以根据实际需要进行设置,本发明对此不作限制。
在本发明中,可以应用于扫描设备,扫描设备通过获取目标图像,并通过对应的图形用户界面展示该目标图像,在目标图像中可以包括待识别的图像介质标识,接着响应于检测到针对目标图像的用户操作,获取与用户操作对应的坐标信息,通过检测用户操作,动态获取针对图像介质标识的坐标信息,保证了后续所生成识别区域的准确性、有效性,接着根据坐标信息,生成针对图像介质标识的识别区域,并对该识别区域中的图像介质标识进行识别,得到针对目标图像的识别结果,通过生成识别区域,在保证了识别区域的有效性的基础上,有效缩小了识别区域的面积,提高了二维码识别算法的运算效率,并且通过识别区域对介质标识进行定位,提高了二维码识别的准确性和有效性。
为了使得本领域技术人员能够更好地理解本发明的技术方案,下面通过一个例子进行示例性说明。
参考图3,示出了本发明的一种图像的识别方法的流程图,具体可以包括如下过程:
1、设备上电初始化完成后,处于就绪状态;
2、执行扫描命令,扫描带二维码图案的介质,下位机控制图像传感器采集到原始图像数据(raw格式);
3、对raw数据做旋正提取压缩图像处理算法运算,最终得到jpg或者bmp格式图像文件;
4、上位机应用程序将jpg/bmp图像文件加载显示在可视化的图形用户界面上;
5、此时开启鼠标/触摸事件的实时监控;
6、用户根据业务需求,通过鼠标\触摸点击图形用户界面上显示的图像中需识别的目标二维码\一维码图案其中一个顶角空白区域,此时监控到鼠标/触摸点击按下事件时,获取当前鼠标点击位置对应图像上的像素点坐标值,取该值作为二维码识别区域的起点坐标(x0,y0);
7、此时鼠标/触摸在按下状态,拖动鼠标/触摸点移至二维码图案的对角空白区,监控到移动事件,获取当前鼠标点击位置对应图像上的像素点坐标值,取该值动态更新二维码识别区域的终点坐标(x1,y1);
8、当鼠标/触摸点移动到目标位置后松开,监控到松开事件后,在图形用户界面中提示用户最终确定的识别区域,供其选择是否需要进行识别操作;
9、若选择不识别,则跳到步骤5继续执行事件监控处理;
10、若选择识别二维码,则将二维码所在的当前图像文件目录和捕获到的二维码识别区域像素点坐标值起点S(x0,y0),终点E(x1,y1)作为输入参数供识别算法运算使用;
11、二维码识别算法可以对所得到的识别区域的坐标数据,进行二维码识别算法运算,包括:①加载整张图像数据;②根据识别区域坐标截取识别区域内图像数据;③对所截取得图像数据进行灰度化处理;④对截取图像数据进行二值化处理;⑤在识别区域遍历各个像素点,逐个定位识别区域内所有二维码的轮廓位置;⑥逐个截取轮廓内二维码数据进行码值识别算法处理等;
12、最终完成扫描仪二维码识别的整个处理过程。
在保证了识别区域的有效性的基础上,有效缩小了识别区域的面积,提高了二维码识别算法的运算效率,并且通过识别区域对介质标识进行定位,提高了二维码识别的准确性和有效性。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图4,示出了本发明的一种图像的识别装置实施例的结构框图,具体可以包括如下模块:
图像获取模块401,用于获取目标图像,并通过预设的图形用户界面展示所述目标图像,所述目标图像至少包括图像介质标识;
坐标信息获取模块402,用于响应于检测到针对所述目标图像的用户操作,获取与所述用户操作对应的坐标信息;
识别区域生成模块403,用于根据所述坐标信息,生成针对所述图像介质标识的识别区域;
图像识别模块404,用于对所述识别区域中的图像介质标识进行识别,生成针对所述目标图像的识别结果。
在本发明的一种可选实施例中,所述坐标信息获取模块402包括:
起点坐标获取子模块,用于响应作用于所述目标图像的第一用户操作,选定与所述第一用户操作对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标;
终点坐标获取子模块,用于响应作用于所述目标图像的第二用户操作的结束,选定与所述第二用户操作对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标。
在本发明的一种可选实施例中,所述起点坐标获取子模块具体用于:
响应作用于所述目标图像的触控操作,选定与所述触控操作对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标;
所述终点坐标获取子模块具体用于:
响应作用于所述目标图像的滑动操作的结束,选定与所述滑动操作对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标。
在本发明的一种可选实施例中,所述起点坐标获取子模块具体用于:
响应于检测到针对所述目标图像的点击事件,在所述目标图像中选定与所述点击事件对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标;
所述终点坐标获取子模块具体用于:
响应于检测到针对所述目标图像的拖动事件的结束,选定与所述拖动事件对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标。
在本发明的一种可选实施例中,所述识别区域生成模块403具体用于:
采用所述起点坐标与所述终点坐标,在所述目标图像中确定针对所述图像介质标识的识别区域。
在本发明的一种可选实施例中,所述图像识别模块404具体用于:
响应于检测到针对所述图像介质标识的识别事件,对所述识别区域中的图像介质标识进行识别,生成针对所述目标图像的识别结果。
在本发明的一种可选实施例中,所述扫描设备还包括图像传感器、下位机以及上位机,所述图像获取模块401具体用于:
通过所述扫描设备的下位机控制所述图像传感器采集原始图像;
通过所述上位机对所述原始图像进行图像格式转换,生成所述目标图像,并通过所述图形用户界面展示所述目标图像。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种电子设备,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述电子设备执行本发明实施例所述的方法。
本发明实施例还提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行本发明实施例所述的方法。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器、EEPROM、Flash以及eMMC等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种图像的识别方法和一种图像的识别装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种图像的识别方法,其特征在于,应用于扫描设备,所述方法包括:
获取目标图像,并通过预设的图形用户界面展示所述目标图像,所述目标图像至少包括图像介质标识;
响应于检测到针对所述目标图像的用户操作,获取与所述用户操作对应的坐标信息;
根据所述坐标信息,生成针对所述图像介质标识的识别区域;
对所述识别区域中的图像介质标识进行识别,生成针对所述目标图像的识别结果;
其中,所述响应于检测到针对所述目标图像的用户操作,获取与所述用户操作对应的坐标信息,包括:
响应作用于所述目标图像的第一用户操作,选定与所述第一用户操作对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标;
响应作用于所述目标图像的第二用户操作的结束,选定与所述第二用户操作对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标;
其中,所述根据所述坐标信息,生成针对所述图像介质标识的识别区域,包括:
根据所述起点坐标的横坐标与所述终点坐标的横坐标,计算所述识别区域的长度,根据所述起点坐标的纵坐标与所述终点坐标的纵坐标,计算所述识别区域的宽度,并在所述图形用户界面中展示对应的识别区域;
其中,所述对所述识别区域中的图像介质标识进行识别,生成针对所述目标图像的识别结果,包括:
将所述图像介质标识所在的目标图像的文件目录以及所述识别区域的起点坐标和终点坐标,作为输入参数输入识别算法进行运算,得到所述图像介质标识对应的码值。
2.根据权利要求1所述的方法,其特征在于,所述响应作用于所述目标图像的第一用户操作,选定与所述第一用户操作对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标,包括:
响应作用于所述目标图像的触控操作,选定与所述触控操作对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标;
所述响应作用于所述目标图像的第二用户操作的结束,选定与所述第二用户操作对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标,包括:
响应作用于所述目标图像的滑动操作的结束,选定与所述滑动操作对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标。
3.根据权利要求1所述的方法,其特征在于,所述响应作用于所述目标图像的第一用户操作,选定与所述第一用户操作对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标,包括:
响应于检测到针对所述目标图像的点击事件,在所述目标图像中选定与所述点击事件对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标;
所述响应作用于所述目标图像的第二用户操作的结束,选定与所述第二用户操作对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标,包括:
响应于检测到针对所述目标图像的拖动事件的结束,选定与所述拖动事件对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标。
4.根据权利要求1所述的方法,其特征在于,所述对所述识别区域中的图像介质标识进行识别,生成针对所述目标图像的识别结果,包括:
响应于检测到针对所述图像介质标识的识别事件,对所述识别区域中的图像介质标识进行识别,生成针对所述目标图像的识别结果。
5.根据权利要求1所述的方法,其特征在于,所述扫描设备还包括图像传感器、下位机以及上位机,所述获取目标图像,并通过所述图形用户界面展示所述目标图像,包括:
通过所述扫描设备的下位机控制所述图像传感器采集原始图像;
通过所述上位机对所述原始图像进行图像格式转换,生成所述目标图像,并通过所述图形用户界面展示所述目标图像。
6.一种图像的识别装置,其特征在于,应用于扫描设备,所述装置包括:
图像获取模块,用于获取目标图像,并通过预设的图形用户界面展示所述目标图像,所述目标图像至少包括图像介质标识;
坐标信息获取模块,用于响应于检测到针对所述目标图像的用户操作,获取与所述用户操作对应的坐标信息;
识别区域生成模块,用于根据所述坐标信息,生成针对所述图像介质标识的识别区域;
图像识别模块,用于对所述识别区域中的图像介质标识进行识别,生成针对所述目标图像的识别结果;
其中,所述坐标信息获取模块包括:
起点坐标获取子模块,用于响应作用于所述目标图像的第一用户操作,选定与所述第一用户操作对应的第一像素点,获取所述第一像素点在所述目标图像的起点坐标;
终点坐标获取子模块,用于响应作用于所述目标图像的第二用户操作的结束,选定与所述第二用户操作对应的第二像素点,获取所述第二像素点在所述目标图像的终点坐标;
其中,所述识别区域生成模块具体用于:
根据所述起点坐标的横坐标与所述终点坐标的横坐标,计算所述识别区域的长度,根据所述起点坐标的纵坐标与所述终点坐标的纵坐标,计算所述识别区域的宽度,并在所述图形用户界面中展示对应的识别区域;
其中,所述图像识别模块具体用于:
将所述图像介质标识所在的目标图像的文件目录以及所述识别区域的起点坐标和终点坐标,作为输入参数输入识别算法进行运算,得到所述图像介质标识对应的码值。
7.一种电子设备,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述电子设备执行如权利要求1-5任一项所述的一个或多个的方法。
8.一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如权利要求1-5任一项所述的一个或多个的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011507464.3A CN113255389B (zh) | 2020-12-18 | 2020-12-18 | 图像的识别方法、装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011507464.3A CN113255389B (zh) | 2020-12-18 | 2020-12-18 | 图像的识别方法、装置、电子设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113255389A CN113255389A (zh) | 2021-08-13 |
CN113255389B true CN113255389B (zh) | 2023-07-14 |
Family
ID=77180604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011507464.3A Active CN113255389B (zh) | 2020-12-18 | 2020-12-18 | 图像的识别方法、装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113255389B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114330621B (zh) * | 2021-11-23 | 2024-04-09 | 深圳市祯源科技有限公司 | 一种基于标识信息的二维码防伪方法、装置、存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014176912A1 (en) * | 2013-04-28 | 2014-11-06 | Tencent Technology (Shenzhen) Company Limited | Two dimensional-code scanning method and device |
CN108416896A (zh) * | 2018-03-13 | 2018-08-17 | 深圳怡化电脑股份有限公司 | 鉴别对象的方法和系统 |
CN110263594A (zh) * | 2019-06-25 | 2019-09-20 | 重庆三千一百科技发展股份有限公司 | 批量二维码识别方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9027837B2 (en) * | 2012-07-23 | 2015-05-12 | Korea Advanced Institute Of Science And Technology | Method of recognizing QR code in image data and apparatus and method for converting QR code in content data into touchable object |
CN106527945A (zh) * | 2016-11-09 | 2017-03-22 | 广东小天才科技有限公司 | 文本信息提取方法及装置 |
CN108154058B (zh) * | 2016-12-05 | 2021-04-23 | 北京小米移动软件有限公司 | 图形码展示、位置区域确定方法及装置 |
CN109062648B (zh) * | 2018-07-23 | 2021-10-22 | Oppo广东移动通信有限公司 | 信息处理方法、装置、移动终端及存储介质 |
CN110764685B (zh) * | 2019-10-24 | 2023-04-18 | 上海掌门科技有限公司 | 用于识别二维码的方法和设备 |
CN111274842B (zh) * | 2020-02-25 | 2024-05-24 | 维沃移动通信有限公司 | 编码图像的识别方法及电子设备 |
-
2020
- 2020-12-18 CN CN202011507464.3A patent/CN113255389B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014176912A1 (en) * | 2013-04-28 | 2014-11-06 | Tencent Technology (Shenzhen) Company Limited | Two dimensional-code scanning method and device |
CN108416896A (zh) * | 2018-03-13 | 2018-08-17 | 深圳怡化电脑股份有限公司 | 鉴别对象的方法和系统 |
CN110263594A (zh) * | 2019-06-25 | 2019-09-20 | 重庆三千一百科技发展股份有限公司 | 批量二维码识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113255389A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8433109B2 (en) | Direction controlling system and method of an electronic device | |
JP6089722B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
US9880721B2 (en) | Information processing device, non-transitory computer-readable recording medium storing an information processing program, and information processing method | |
CN106055446B (zh) | 一种移动终端的测试方法及装置 | |
US9207808B2 (en) | Image processing apparatus, image processing method and storage medium | |
US9420144B2 (en) | Image forming device to provide preview image for editing manuscript image, display apparatus to display and edit the preview image, and methods thereof | |
US9025878B2 (en) | Electronic apparatus and handwritten document processing method | |
US20150169134A1 (en) | Methods circuits apparatuses systems and associated computer executable code for providing projection based human machine interfaces | |
JP2009259110A (ja) | 表示オブジェクト制御装置、表示オブジェクト制御プログラムおよび表示装置 | |
CN102034081A (zh) | 使用影像作为数据来源的计算器装置 | |
CN105938403A (zh) | 一种基于指纹识别的光标控制方法及装置 | |
KR101158679B1 (ko) | 직접입력 방식의 전자문서 상의 도형입력 방법, 그리고 직접입력 방식의 전자문서 상의 도형입력 프로그램을 기록한 컴퓨터로 판독가능한 기록매체 | |
CN113255389B (zh) | 图像的识别方法、装置、电子设备以及存储介质 | |
JP2017120503A (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム | |
CN103402131A (zh) | 一种二维码识别方法、机顶盒及系统 | |
JP2018088116A (ja) | 情報処理装置、プログラム、情報処理方法 | |
JP2012027908A (ja) | 視覚処理装置、視覚処理方法、および、視覚処理システム | |
CN108363485B (zh) | 非触摸屏显示终端的控制方法、装置、系统和计算机设备 | |
JP2011118466A (ja) | 差分ノイズ置換装置、差分ノイズ置換方法、差分ノイズ置換プログラム、コンピュータ読み取り可能な記録媒体、および、差分ノイズ置換装置を備えた電子機器 | |
CN112532884B (zh) | 识别方法、装置及电子设备 | |
US9202096B2 (en) | Device and method for conducting transactions | |
KR20230017774A (ko) | 정보 처리 장치, 정보 처리 방법, 및 프로그램 | |
US9396405B2 (en) | Image processing apparatus, image processing method, and image processing program | |
CN101414224B (zh) | 定义书写位置的装置及方法 | |
US11657489B2 (en) | Segmentation of continuous dynamic scans |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |