CN101706875A - 一种手持式的复杂背景下的激光喷码字符识别仪 - Google Patents

一种手持式的复杂背景下的激光喷码字符识别仪 Download PDF

Info

Publication number
CN101706875A
CN101706875A CN200910238176A CN200910238176A CN101706875A CN 101706875 A CN101706875 A CN 101706875A CN 200910238176 A CN200910238176 A CN 200910238176A CN 200910238176 A CN200910238176 A CN 200910238176A CN 101706875 A CN101706875 A CN 101706875A
Authority
CN
China
Prior art keywords
character
image
module
interface
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910238176A
Other languages
English (en)
Other versions
CN101706875B (zh
Inventor
胡晓光
田立岩
张柳军
左廷涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN200910238176XA priority Critical patent/CN101706875B/zh
Publication of CN101706875A publication Critical patent/CN101706875A/zh
Application granted granted Critical
Publication of CN101706875B publication Critical patent/CN101706875B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本发明一种手持式的复杂背景下的激光喷码字符识别仪,它是由硬件结构和软件结构两大部分构成:硬件结构由图像采集单元、图像处理单元、数据存储单元、液晶显示单元、GPRS通信单元、按键操作单元、电源模块等部分组成;软件结构由系统调度、硬件控制模块、驱动模块、硬件平台、人机界面模块、数据库模块、识别算法模块等部分组成。它采用嵌入式设计将图像采集功能、数字图像识别功能、基于GPRS的数据发送功能集成于一体,可以现场对目标进行图像采集和快速自动识别,并将识别结果通过GPRS通信单元发送到指定服务器。该识别仪操作简单,使用方便,在模式识别检测类装置技术领域里具有广泛地实用价值和应用前景。

Description

一种手持式的复杂背景下的激光喷码字符识别仪
(一)技术领域:
本发明涉及一种手持式的复杂背景下的激光喷码字符识别仪,它能够识别复杂背景下的激光喷码字符,其中,涉及到图像采集、图像处理、模式识别和基于GPRS(通用无线分组业务)的无线通信技术,属于模式识别检测类装置技术领域。
(二)背景技术:
现今,随着信息社会的发展,图像处理和模式识别技术在各行各业的应用越来越广泛。字符识别技术发展迅速,在个人信息管理、办公自动化、电子出版物、网络资源、各种大型文献资料管理数据库、数字化图书馆、车牌识别、票据识别、身份证鉴别等方面有着重要的实用价值,提高了工作效率,降低了人工成本。
对图像中的字符识别,目前的研究对象绝大部分是对于简单背景下的字符而言的,或者是虽然整个图像背景复杂,但字符区域的背景简单。在实际应用中,文本图像的情况复杂多变:纹理背景、变化背景、噪声干扰、字体模糊、字符融入背景之中等等。例如,许多激光喷码字符直接喷在产品的外包装表面,而产品外包装本身具有不可预知的复杂图案,使得字符处于复杂的背景图案中。面对这些复杂的情况,传统的简单背景字符识别技术就有很大的局限性。
目前,字符的识别方法主要有基于模板匹配方法,基于字符结构的方法和基于神经网络的方法,这些现有的图像识别方法都或多或少的带有一定的局限性,在一种环境下效果很好的方法换一种环境识别效果可能很不理想。一些有一定通用性,识别效果好的方法,往往计算量很大,难以实时应用。
GPRS是通用无线分组业务(General Packet Radio Service)的简称,是一种基于GSM系统的无线分组交换技术,提供端到端的、广域的无线IP连接,是一项高速数据处理的技术,以分组的形式传送资料,在很多方面具有显著的优势。
(三)发明内容:
1、目的:本发明的目的是提供一种手持式的复杂背景下的激光喷码字符识别仪,它采用嵌入式设计将图像采集功能、数字图像识别功能、基于GPRS的数据发送功能集成于一体,可以现场对目标进行图像采集和快速自动识别,并将识别结果通过GPRS通信模块发送到指定服务器。
2、技术方案:本发明一种手持式的复杂背景下的激光喷码字符识别仪,它是由硬件结构和软件结构两大部分构成:
(1)硬件结构:
手持式复杂背景下的激光喷码字符识别仪的硬件结构方框示意图,如图1。
硬件结构由图像采集单元、图像处理单元、数据存储单元、液晶显示单元、GPRS通信单元、按键操作单元、电源模块等部分组成。
电源模块负责为该识别仪各个部分供电;按键操作单元和液晶显示单元是人机接口,负责操作命令的输入和结果的输出显示;图像采集单元负责采集图像;GPRS通信单元负责识别结果的无线发送.整个过程是:用户通过按键操作单元发出命令,处理器接收到命令,控制图像采集单元采集图像数据,通过数据存储单元进行存储,然后进行图像识别,最后将识别的结果通过GPRS通信单元发送到指定服务器,同时将结果存储到数据存储单元中,便于日后查询.
所述图像采集单元是一款高集成度、高分辨率的CM0S传感芯片OV9650,其内部集成了时序电路,模拟信号处理电路,数字信号处理电路;它带有标准的Serial Camera ControlBus(SCCB)接口,通过该接口可实现各种图像增强和控制功能,如自动曝光、自动增益、自动平衡控制等,以及控制图像色彩、饱和度、伽马校正、锐化、镜头校准、噪声和白像素删除等。
所述图像处理单元是采用三星ARM9S3C2440处理器,它是基于ARM920T内核的32位嵌入式微处理器,最高工作频率可达533MHz;其带有MMU内存管理单元可支持Windows CE、Linux等嵌入式操作系统,具有丰富的片上资源,如:LCD、DMA控制器,以及USB、以太网、UART、摄像头、触摸屏等接口。
所述数据存储单元是采用一片三星的K9F1208芯片(64M×8bit),用于储存系统的Boot Loader、OS内核镜像、文件系统和用户应用程序;采用两片三星的HY57V561620芯片(4M×16bit×4Banks)构成64MB的SDRAM(同步动态随机存取存储器),用于加载Windows CE操作系统和运行应用程序。
所述液晶显示单元是选用夏普的3.5寸TFT触摸屏LQ035Q7DH01;其中,S3C2440提供LCD接口,将其控制信号、帧同步信号、行同步信号、像素时钟信号、数据输出使能信号和数据信号与LCD对应信号相连;将S3C2440的后4通道A与LCD的触摸屏接口相连,实现触点位置的采集。
所述GPRS通信单元是采用sim300模块,它具有三频GSM(全球移动通讯系统)和GPRS功能,内嵌TCP/IP协议,利用6PRS网络平台实现数据信息的透明传输,GPRS与处理器之间通过串口通信。
所述按键操作单元是个4×4的矩阵键盘,它与控制器通过8个通用IO相连,用于对整个识别仪的操作。
所述电源系统是采用外部5V供电,利用两片LM1117-33分别将外部输入的5V转换为2路3.3V,对控制器和外围电路器件单独供电,单独供电最大程度避免了外围电路给控制器带来的影响。由于S3C2440需要3.3V和1.3V两种电压,故再利用一片LM1117-ADJ将3.3V转成1.3V。电源系统为整个识别仪的各个部分提供5V、3.3V和1.3V电压。
(2)软件结构:
该手持式激光喷码字符识别仪的软件架构示意图,如图2。
软件结构由系统调度、硬件控制模块、驱动模块、硬件平台、人机界面模块、数据库模块、识别算法模块等部分组成。系统调度负责整个软件系统的任务调度,首先,由硬件控制模块通过驱动模块控制硬件平台将图像数据采集上来,经过识别算法模块,得到识别结果,然后通过人机界面模块将其显示、通过数据存储模块将结果存储,最后通过硬件控制模块的控制GPRS通信单元将识别结果发送到指定的服务器。
所述的系统调度是整个软件系统的核心,它负责整个软件系统的任务调度,其它模块的操作任务的发出与控制都是由系统调度来完成的.
所述硬件控制模块是整个系统的硬件控制部分,它控制摄像头、GPRS通信单元、实时钟(RTC)和键盘。摄像头的控制基于自主研发的摄像头流接口驱动,操作的基本流程如图3所示。GPRS通信单元采用RS232串口控制;实时钟(RTC)的控制是采用S3C2440内置RTC接口,键盘的控制是通过8个通用IO,采用查询的方式,控制4×4的矩阵键盘。
所述的驱动模块是硬件控制模块与硬件平台之间的接口,硬件控制模块是通过驱动模块来完成对硬件平台的控制。
所述的硬件平台是指整个系统的硬件部分,包括摄像头、GPRS通信模块、按键等。
所述人机界面模块实现用户与识别仪进行人机交互,它基于MFC对话框方式开发,实现了登录界面,主界面、数据库主界面、数据库编辑界面等主要界面,各个界面之间的状态转换如图5所示。开始后,首先进入到登陆界面,正确登陆之后可以进入到主界面,从主界面可以进入到数据库主界面,通过编辑和添加可以进入到数据库的编辑界面,在数据库编辑界面退出可回到数据库主界面,退出数据库主界面可回到系统主界面,在登陆界面和主界面点退出可以关闭整个人机界面。
所述数据库模块用于将识别结果存储,它采用Windows CE自带的数据库EDB设计实现。其具体流程如图4所示。首先,先挂载数据库卷;然后打开数据库卷;如果失败,则重新创建数据库,再打开数据库,如果成功,则继续进行数据库操作,如查找数据库、写记录、读记录等;如果不再需要进行数据库操作,则关闭数据库,最后卸载数据库卷。
所述识别算法模块是该字符识别仪的软件部分主体,它包括:图像预处理、字符区域定位、二值化、倾斜矫正、字符分割、特征提取、初步识别、二次识别等。
该图像预处理(包括有图像灰度化、去除噪声和灰度拉伸)是为了便于后续的快速图像处理,需要先对图像数据进行转换,使彩色图像变为256级灰度图。图像中不可避免的含有噪声,我们采用中值滤波对图像进行预处理。为了增强背景区域和字符区域的对比度,对图像进行灰度拉伸。
该字符区域定位是将复杂背景下的喷码字符区域定位出来,这里,由于原图像是彩色图像,如果仅在灰度图像中进行处理,会丢失很多有用信息,导致无法将字符区域准确的定位出来。因此,本设计将从灰度图像和彩色图像两个目标同时入手,一方面,在灰度图像中进行字符定位,使用纹理分析的方法;另一方面在彩色图像中进行定位,使用颜色聚类、同色联通域分析的方法。通过以上的方法进行分析结束后,将结果信息进行融合,再加上先验信息(字符区域宽高比在6∶1到7∶1之间,喷码字符颜色为黑色),将所有这些信息进行融合,最终得到决策结果,即得到字符区域。
该二值化是对字符区域内的灰度图像进行二值化处理,我们采用最大类间方差法。即类间方差与类内方差比的方法,自适应计算灰度阈值,小于此阈值的区域认为是目标区域,大于此阈值的区域认为是背景区域。
该倾斜矫正是由于摄像头拍摄角度的问题,可能会带来一些角度不大的倾斜,对字符识别的结果造成一定的影响,我们对二值图像进行了自适应倾斜矫正。即用hough变换得到字符区域的倾斜角度,最后根据字符区域的倾斜角度采用仿射变换来进行矫正。
该字符分割是采用局部区域最小值法进行分割,将字符进行垂直投影,在字符粘连范围的垂直投影值最小处进行分割。
该特征提取即提取字符特征。本系统采用统计特征和结构特征相结合的特征提取方式,以期取得较好的分类效果。将字符图像划分为4×4的网格,统计每个区域中的黑色像素占该区域总像素数的比值,形成16维统计特征;将字符图像分别沿水平和垂直方向投影,求投影的峰值位置,形成2维结构特征,将两种特征组合形成18维特征作为字符特征。
该初步识别是采用支持向量机分类算法,对字母和数字分别建立SVM识别模型。以数字识别为例,模型可描述为:给定训练集,输入为18维样本特征输入,输出为10种可能的输出,通过样本训练,得到决策函数,使得对于测试样本,能得出相应的输出结果,以此作为初步识别结果。
该二次识别是在初步识别的基础上,对字符进行再次识别。试验发现,对于一些相似的字符,很难一次识别成功,需要进行再次识别。主要结合字符的特殊结构特征对一些相似字符进行再次识别,比如长宽比例,区域封闭性等,以此识别结果作为最终识别结果。经过二次识别后,可以很有效的提高字符识别率。
识别算法流程如图6所示,首先,对采集来的图像进行预处理,包括图像灰度化、去除噪声、灰度拉伸;然后进行字符区域定位,将字符所在的区域定位出来;接下来对字符区域进行二值化处理,得到二值图像;然后进行倾斜校正;对校正后的图像进行字符分割,将整个字符区域分割成单个的字符;对每一个字符进行特征提取;先进行字符的初步识别;最后通过二次识别区分相似的字符;对每一个字符进行特征提取、初步识别和二次识别,得到最后的识别结果。
3、有益效果:
本发明提供一种手持式的复杂背景下的激光喷码字符识别仪,其优点和有益效果如下:
1.设备主要电子模块单元设计采用较好的抗电磁干扰电路,排除电磁干扰的影响;
2.采用彩色图像识别和灰度图像识别相结合的方式,提高复杂背景下的字符识别率;
3.采用高效的识别算法,大大缩短识别时间;
4.可将识别结果通过GPRS自动发送到指定服务器,提高了工作效率。
(四)附图说明:
图1本发明硬件结构示意图
图2嵌入式字符识别仪软件架构示意图
图3摄像头控制流程示意图
图4EDB数据库操作流程示意图
图5用户界面状态转换示意图
图6识别算法流程示意图
图中符号说明如下:
1图像处理单元;2液晶显示单元;3按键操作单元;4图像采集单元;5GPRS通信单元;6数据存储单元;7电源模块;8系统调度;9识别算法模块;10硬件控制模块;11驱动模块;12硬件平台;13人机界面模块;14数据库模块。
(五)具体实施方式
本发明一种手持式的复杂背景下的激光喷码字符识别仪,它是由硬件结构和软件结构两大部分构成。
(1)硬件结构:
手持式复杂背景下的激光喷码字符识别仪的硬件结构方框示意图,如图1。
硬件结构由图像采集单元4、图像处理单元1、数据存储单元6、液晶显示单元2、GPRS通信单元5、按键操作单元3、电源模块7等部分组成。电源模块7负责为该识别仪各个部分供电;按键操作单元3和液晶显示单元2是人机接口,负责操作命令的输入和结果的输出显示;图像采集单元4负责采集图像;GPRS通信单元5负责识别结果的无线发送。整个过程是:用户通过按键操作单元3发出命令,处理器接收到命令,控制图像采集单元4采集图像数据,放到数据存储单元6中,然后进行图像识别,最后将识别的结果通过GPRS通信单元5发送到指定服务器,同时将结果存储到自带的数据存储单元6中。
所述图像采集单元4是一款高集成度、高分辨率的CMOS传感芯片OV9650,其内部集成了时序电路,模拟信号处理电路,数字信号处理电路;它带有标准的Serial Camera ControlBus(SCCB)接口,通过该接口可实现各种图像增强和控制功能,如自动曝光、自动增益、自动平衡控制等,以及控制图像色彩、饱和度、伽马校正、锐化、镜头校准、噪声和白像素删除等。
所述图像处理单元1是采用三星ARM9 S3C2440处理器,它是基于ARM920T内核的32位嵌入式微处理器,最高工作频率可达533MHz;其带有MMU内存管理单元可支持Windows CE、Linux等嵌入式操作系统,具有丰富的片上资源,如:LCD、DMA控制器,以及USB、以太网、UART、摄像头、触摸屏等接口。
所述数据存储单元6是采用一片三星的K9F1208芯片(64M×8bit),用于储存系统的Boot Loader、OS内核镜像、文件系统和用户应用程序;采用两片三星的HY57V561620芯片(4M×16bit×4Banks)构成64MB的SDRAM(同步动态随机存取存储器),用于加载Windows CE操作系统和运行应用程序。
所述液晶显示单元2是选用夏普的3.5寸TFT触摸屏LQ035Q7DH01;其中,S3C2440提供LCD接口,将其控制信号、帧同步信号、行同步信号、像素时钟信号、数据输出使能信号和数据信号与LCD对应信号相连;将S3C2440的后4通道A与LCD的触摸屏接口相连,实现触点位置的采集。
所述GPRS通信单元5是采用sim300模块,它具有三频GSM(全球移动通讯系统)和GPRS功能,内嵌TCP/IP协议,利用GPRS网络平台实现数据信息的透明传输,GPRS与处理器之间通过串口通信。
所述按键操作单元3是个4×4的矩阵键盘,它与控制器通过8个通用IO相连,用于对整个识别仪的操作。
所述电源模块7是采用外部5V供电,利用两片LM1117-33分别将外部输入的5V转换为2路3.3V,对控制器和外围电路器件单独供电,单独供电最大程度避免了外围电路给控制器带来的影响。由于S3C2440需要3.3V和1.3V两种电压,故再利用一片LM1117-ADJ将3.3V转成1.3V。电源模块7为整个识别仪的各个部分提供5V、3.3V和1.3V电压。
(2)软件结构:
该手持式激光喷码字符识别仪的软件架构示意图,如图2。
软件结构由系统调度8、硬件控制模块10、驱动模块11、硬件平台12、人机界面模块13、数据库模块14、识别算法模块9等部分组成。系统调度8负责整个软件系统的任务调度,首先,由硬件控制模块10通过驱动模块11控制硬件平台12将图像数据采集上来,经过识别算法模块9,得到识别结果,然后通过人机界面模块13将其显示、通过数据库模块14将结果存储,最后通过硬件控制模块10控制GPRS通信单元5将识别结果发送到指定的服务器。
所述的系统调度8是指整个软件系统的核心,它负责整个软件系统的任务调度,其它模块的操作任务的发出与控制都是由系统调度来完成的。
所述硬件控制模块10是整个系统的硬件控制部分,它控制图像采集单元4、GPRS通信单元5、实时钟(RTC)和按键操作单元3。图像采集单元4的控制基于自主研发的摄像头流接口驱动,操作的基本流程如图3所示。GPRS通信单元5采用RS232串口通信方式;实时钟(RTC)的控制是采用S3C2440内置RTC接口,按键操作单元3的控制是通过8个通用I0,采用查询的方式,控制4×4的按键操作单元3。
所述的驱动模块11是硬件控制模块10与硬件平台12之间的接口,硬件控制模块10是通过驱动模块11来完成对硬件平台12的控制。
所述的硬件平台12是指整个系统的硬件部分,包括摄像头、GPRS通信单元5、按键操作单元3等。
所述数据库模块14用于将识别结果存储,它采用Windows CE自带的数据库EDB设计实现。其具体流程如图4所示。首先,先挂载数据库卷;然后打开数据库卷;如果失败,则重新创建数据库,再打开数据库,如果成功,则继续进行数据库操作,如查找数据库、写记录、读记录等;如果不再需要进行数据库操作,则关闭数据库,最后卸载数据库卷。
所述人机界面模块13实现用户与识别仪进行人机交互,它基于MFC对话框方式开发,实现了登录界面,主界面、数据库主界面、数据库编辑界面等主要界面,各个界面之间的状态转换如图5所示。开始后,首先进入到登陆界面,正确登陆之后可以进入到主界面,从主界面可以进入到数据库主界面,通过编辑和添加可以进入到数据库的编辑界面,在数据库编辑界面退出可回到数据库主界面,退出数据库主界面可回到系统主界面,在登陆界面和主界面点退出可以关闭整个人机界面。
所述识别算法模块9是该字符识别仪的软件部分主体,它包括:图像预处理、字符区域定位、二值化、倾斜矫正、字符分割、特征提取、初步识别、二次识别等。
该图像预处理(包含有图像灰度化、去除噪声和灰度拉伸)是为了便于后续的快速图像处理,需要先对图像数据进行转换,使彩色图像变为256级灰度图。图像中不可避免的含有噪声,我们采用中值滤波对图像进行预处理。为了增强背景区域和字符区域的对比度,对图像进行灰度拉伸。
该字符区域定位是将复杂背景下的喷码字符区域定位出来,这里,由于原图像是彩色图像,如果仅在灰度图像中进行处理,会丢失很多有用信息,导致无法将字符区域准确的定位出来.因此,本设计将从灰度图像和彩色图像两个目标同时入手,一方面,在灰度图像中进行字符定位,使用纹理分析的方法;另一方面在彩色图像中进行定位,使用颜色聚类、同色联通域分析的方法.通过以上的方法进行分析结束后,将结果信息进行融合,再加上先验信息(字符区域宽高比在6∶1到7∶1之间,喷码字符颜色为黑色),将所有这些信息进行融合,最终得到决策结果,即得到字符区域.
该二值化是对字符区域内的灰度图像进行二值化处理,我们采用最大类间方差法。即类间方差与类内方差比的方法,自适应计算灰度阈值,小于此阈值的区域认为是目标区域,大于此阈值的区域认为是背景区域。
该倾斜矫正是由于摄像头拍摄角度的问题,可能会带来一些角度不大的倾斜,对字符识别的结果造成一定的影响,我们对二值图像进行了自适应倾斜矫正。即用hough变换得到字符区域的倾斜角度,最后根据字符区域的倾斜角度采用仿射变换来进行矫正。
该字符分割是采用局部区域最小值法进行分割,将字符进行垂直投影,在字符粘连范围的垂直投影值最小处进行分割。
该特征提取即提取字符特征。本系统采用统计特征和结构特征相结合的特征提取方式,以期取得较好的分类效果。将字符图像划分为4×4的网格,统计每个区域中的黑色像素占该区域总像素数的比值,形成16维统计特征;将字符图像分别沿水平和垂直方向投影,求投影的峰值位置,形成2维结构特征,将两种特征组合形成18维特征作为字符特征。
该初步识别是采用支持向量机分类算法,对字母和数字分别建立SVM识别模型。以数字识别为例,模型可描述为:给定训练集,输入为18维样本特征输入,输出为10种可能的输出,通过样本训练,得到决策函数,使得对于测试样本,能得出相应的输出结果,以此作为初步识别结果。
该二次识别是在初步识别的基础上,对字符进行再次识别。试验发现,对于一些相似的字符,很难一次识别成功,需要进行再次识别。主要结合字符的特殊结构特征对一些相似字符进行再次识别,比如长宽比例,区域封闭性等,以此识别结果作为最终识别结果。经过二次识别后,可以很有效的提高字符识别率。
识别算法流程如图6所示,首先,对采集来的图像进行预处理,包括图像灰度化、去除噪声、灰度拉伸;然后进行字符区域定位,将字符所在的区域定位出来;接下来对字符区域进行二值化处理,得到二值图像;然后进行倾斜校正;对校正后的图像进行字符分割,将整个字符区域分割成单个的字符;对每一个字符进行特征提取;先进行字符的初步识别;最后通过二次识别区分相似的字符;对每一个字符进行特征提取、初步识别和二次识别,得到最后的识别结果。
当识别仪工作时,首先手动控制按键,通过图像采集单元4将带有复杂背景的激光喷码字符图像采集上来;然后将采集到的图像进行预处理,去除噪声;然后采用彩色图像和灰度图像相结合的方法,将字符区域定位出来;紧接着,对图像进行二值化操作;对倾斜的字符整体进行倾斜校正;然后把整个字符区域分割成多个单独的字符;对每一个单独的字符进行特征提取,进行字符的初步识别;最后,对相似的、容易混淆的字符进行二次识别,得到最终识别结果。
通过识别算法得到识别结果之后,通过串口,控制GPRS通信单元5,将识别结果发送到指定的服务器,完成整个字符识别仪的全部功能。

Claims (1)

1.一种手持式的复杂背景下的激光喷码字符识别仪,其特征在于:该识别仪是由硬件结构和软件结构两大部分构成:
一、硬件结构:
硬件结构由图像采集单元、图像处理单元、数据存储单元、液晶显示单元、GPRS通信单元、按键操作单元和电源模块组成;
电源模块负责为该识别仪各个部分供电;按键操作单元和液晶显示单元是人机接口,负责操作命令的输入和结果的输出显示;图像采集单元负责采集图像;GPRS通信单元负责识别结果的无线发送,整个过程是:用户通过按键操作单元发出命令,处理器接收到命令,控制图像采集单元采集图像数据,通过数据存储单元进行存储,然后进行图像识别,最后将识别的结果通过GPRS通信单元发送到指定服务器,同时将结果存储到数据存储单元中,便于日后查询;
所述图像采集单元是一款高集成度、高分辨率的CMOS传感芯片OV9650,其内部集成了时序电路,模拟信号处理电路,数字信号处理电路;它带有标准的Serial Camera Control Bus即SCCB接口,通过该接口可实现各种图像增强和控制功能,即自动曝光、自动增益、自动白平衡控制以及控制图像色彩、饱和度、伽马校正、锐化、镜头校准、噪声和白像素删除;
所述图像处理单元是采用三星ARM9 S3C2440处理器;
所述数据存储单元是采用一片三星的K9F1208芯片即64M×8bit,用于储存系统的Boot Loader、OS内核镜像、文件系统和用户应用程序;采用两片三星的HY57V561620芯片即4M×16bit×4Banks构成64MB的SDRAM即同步动态随机存取存储器,用于加载Windows CE操作系统和运行应用程序;
所述液晶显示单元是选用夏普的3.5寸TFT触摸屏LQ035Q7DH01;其中,S3C2440提供LCD接口,将其控制信号、帧同步信号、行同步信号、像素时钟信号、数据输出使能信号和数据信号与LCD对应信号相连;将S3C2440的后4通道A与LCD的触摸屏接口相连,实现触点位置的采集;
所述GPRS通信单元是采用sim300模块,它具有三频GSM即全球移动通讯系统和GPRS功能,内嵌TCP/IP协议,利用GPRS网络平台实现数据信息的透明传输,GPRS与处理器之间通过串口通信;
所述按键操作单元是个4×4的矩阵键盘,它与控制器通过8个通用IO相连,用于对整个识别仪的操作;
所述电源模块是采用外部5V供电,利用两片LM1117-33分别将外部输入的5V转换为2路3.3V,对控制器和外围电路器件单独供电,单独供电最大程度避免了外围电路给控制器带来的影响;由于S3C2440需要3.3V和1.3V两种电压,故再利用一片LM1117-ADJ将3.3V转成1.3V;电源模块为整个识别仪的各个部分提供5V、3.3V和1.3V电压;
二、软件结构:
软件结构由系统调度、硬件控制模块、驱动模块、硬件平台、人机界面模块、数据库模块和识别算法模块组成;系统调度负责整个软件系统的任务调度,首先,由硬件控制模块通过驱动模块控制硬件平台将图像数据采集上来,经过识别算法模块,得到识别结果,然后通过人机界面模块将其显示、通过数据存储模块将结果存储,最后通过硬件控制模块的控制GPRS通信单元将识别结果发送到指定的服务器;
所述的系统调度是整个软件系统的核心,它负责整个软件系统的任务调度,其它模块的操作任务的发出与控制都是由系统调度来完成的;
所述硬件控制模块是整个系统的硬件控制部分,它控制摄像头、GPRS通信单元、实时钟即RTC和键盘;摄像头的控制基于自主研发的摄像头流接口驱动,GPRS通信单元采用RS232串口控制;实时钟即RTC的控制是采用S3C2440内置RTC接口,键盘的控制是通过8个通用IO,采用查询的方式,控制4×4的矩阵键盘;
所述的驱动模块是硬件控制模块与硬件平台之间的接口,硬件控制模块是通过驱动模块来完成对硬件平台的控制;
所述的硬件平台是指整个系统的硬件部分,包括摄像头、GPRS通信模块和按键;
所述人机界面模块实现用户与识别仪进行人机交互,它基于MFC对话框方式开发,实现了登录界面,主界面、数据库主界面、数据库编辑界面之间的状态转换;转换过程是首先进入到登陆界面,正确登陆之后进入到主界面,从主界面可以进入到数据库主界面,通过编辑和添加进入到数据库的编辑界面,在数据库编辑界面退出回到数据库主界面,退出数据库主界面回到系统主界面,在登陆界面和主界面点退出后关闭整个人机界面;
所述数据库模块用于将识别结果存储,它采用Windows CE自带的数据库EDB设计实现;其具体流程是:先挂载数据库卷,然后打开数据库卷;如果失败,则重新创建数据库,再打开数据库;如果成功,则继续进行数据库操作,查找数据库、写记录、读记录;如果不再需要进行数据库操作,则关闭数据库,最后卸载数据库卷;
所述识别算法模块是该字符识别仪的软件部分主体,它包括:图像预处理、字符区域定位、二值化、倾斜矫正、字符分割、特征提取、初步识别和二次识别;
该图像预处理含图像灰度化、去除噪声和灰度拉伸,是为了便于后续的快速图像处理,需要先对图像数据进行转换,使彩色图像变为256级灰度图;图像中不可避免的含有噪声,我们采用中值滤波对图像进行预处理;为了增强背景区域和字符区域的对比度,对图像进行灰度拉伸;
该字符区域定位是将复杂背景下的喷码字符区域定位出来,由于原图像是彩色图像,如果仅在灰度图像中进行处理,会丢失很多有用信息,无法将字符区域准确的定位出来;因此,本设计将从灰度图像和彩色图像两个目标同时入手,一方面,使用纹理分析的方法,在灰度图像中进行字符定位;另一方面使用颜色聚类、同色联通域分析的方法,在彩色图像中进行定位;通过以上的方法进行分析结束后,将结果信息进行融合,再加上先验信息即字符区域宽高比在6∶1到7∶1之间,喷码字符颜色为黑色,将所有这些信息进行融合,最终得到决策结果,即得到字符区域;
该二值化是对字符区域内的灰度图像进行二值化处理,我们采用最大类间方差法,即类间方差与类内方差比的方法,自适应计算灰度阈值,小于此阈值的区域认为是目标区域,大于此阈值的区域认为是背景区域;
该倾斜矫正是由于摄像头拍摄角度的问题,可能会带来一些角度不大的倾斜,对字符识别的结果造成一定的影响,我们对二值图像进行了自适应倾斜矫正;即用hough变换得到字符区域的倾斜角度,最后根据字符区域的倾斜角度采用仿射变换来进行矫正;
该字符分割是采用局部区域最小值法进行分割,将字符进行垂直投影,在字符粘连范围的垂直投影值最小处进行分割;
该特征提取即提取字符特征,本系统采用统计特征和结构特征相结合的特征提取方式,以期取得较好的分类效果;将字符图像划分为4×4的网格,统计每个区域中的黑色像素占该区域总像素数的比值,形成16维统计特征;将字符图像分别沿水平和垂直方向投影,求投影的峰值位置,形成2维结构特征,将两种特征组合形成18维特征作为字符特征;
该初步识别是采用支持向量机分类算法,对字母和数字分别建立SVM识别模型;模型可描述为:给定训练集,输入为18维样本特征输入,输出为10种可能的输出,通过样本训练,得到决策函数,使得对于测试样本能得出相应的输出结果,以此作为初步识别结果;
该二次识别是在初步识别的基础上,对字符进行再次识别;对于一些相似的字符,很难一次识别成功,需要进行再次识别;主要结合字符的特殊结构特征对一些相似字符进行再次识别,以此识别结果作为最终识别结果;经过二次识别后,可以很有效的提高字符识别率;
所述识别算法流程是,先对采集来的图像进行预处理,包括图像灰度化、去除噪声、灰度拉伸;然后进行字符区域定位,将字符所在的区域定位出来;接下来对字符区域进行二值化处理,得到二值图像;然后进行倾斜校正;对校正后的图像进行字符分割,将整个字符区域分割成单个的字符;对每一个字符进行特征提取;先进行字符的初步识别;最后通过二次识别区分相似的字符;对每一个字符进行特征提取、初步识别和二次识别,得到最后的识别结果。
CN200910238176XA 2009-11-17 2009-11-17 一种手持式的复杂背景下的激光喷码字符识别仪 Expired - Fee Related CN101706875B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910238176XA CN101706875B (zh) 2009-11-17 2009-11-17 一种手持式的复杂背景下的激光喷码字符识别仪

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910238176XA CN101706875B (zh) 2009-11-17 2009-11-17 一种手持式的复杂背景下的激光喷码字符识别仪

Publications (2)

Publication Number Publication Date
CN101706875A true CN101706875A (zh) 2010-05-12
CN101706875B CN101706875B (zh) 2012-07-18

Family

ID=42377098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910238176XA Expired - Fee Related CN101706875B (zh) 2009-11-17 2009-11-17 一种手持式的复杂背景下的激光喷码字符识别仪

Country Status (1)

Country Link
CN (1) CN101706875B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102072772A (zh) * 2010-11-17 2011-05-25 广东威创视讯科技股份有限公司 一种无线色彩采集系统及其方法
CN102521591A (zh) * 2011-11-29 2012-06-27 北京航空航天大学 一种复杂背景下小目标快速识别方法
CN103530642A (zh) * 2012-08-21 2014-01-22 深圳市中金岭南有色金属股份有限公司凡口铅锌矿 雷管自动识别机以及雷管编码图像识别方法
CN104200207A (zh) * 2014-09-16 2014-12-10 宁波熵联信息技术有限公司 一种基于隐马尔可夫模型的车牌识别方法
CN105346249A (zh) * 2015-11-23 2016-02-24 昇捷丰电子(厦门)有限公司 一种基于gprs实现远程实时喷码的喷码机
CN105989359A (zh) * 2015-03-20 2016-10-05 株式会社Pfu 日期识别装置
CN106932013A (zh) * 2015-12-31 2017-07-07 杨迅 多链路智能传感装置及系统
CN107092913A (zh) * 2017-03-20 2017-08-25 上海大学 一种喷印字符在线识别及交互式后处理系统及方法
CN107480683A (zh) * 2017-08-24 2017-12-15 郑州云海信息技术有限公司 一种图像处理方法及装置
CN107844792A (zh) * 2017-10-27 2018-03-27 深圳供电局有限公司 一种移动终端及图像识别服务器
CN107977594A (zh) * 2016-10-25 2018-05-01 深圳市寒武纪智能科技有限公司 一种交互式机器人及其讲故事方法
CN109515965A (zh) * 2018-11-14 2019-03-26 何妍 一种酒瓶瓶盖喷码读取记录系统
CN109753963A (zh) * 2019-02-22 2019-05-14 山东大学 一种基于线结构光的轮胎标识自动识别系统及其工作方法
CN110135430A (zh) * 2019-04-28 2019-08-16 广东技术师范大学 一种基于深度神经网络的铝材模具id自动识别系统
CN115797942A (zh) * 2023-02-01 2023-03-14 潍坊工程职业学院 一种宣传信息交互方法及系统

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102072772B (zh) * 2010-11-17 2012-12-05 广东威创视讯科技股份有限公司 一种无线色彩采集系统及其方法
CN102072772A (zh) * 2010-11-17 2011-05-25 广东威创视讯科技股份有限公司 一种无线色彩采集系统及其方法
CN102521591A (zh) * 2011-11-29 2012-06-27 北京航空航天大学 一种复杂背景下小目标快速识别方法
CN103530642A (zh) * 2012-08-21 2014-01-22 深圳市中金岭南有色金属股份有限公司凡口铅锌矿 雷管自动识别机以及雷管编码图像识别方法
CN103530642B (zh) * 2012-08-21 2016-03-09 深圳市中金岭南有色金属股份有限公司凡口铅锌矿 雷管自动识别机以及雷管编码图像识别方法
CN104200207A (zh) * 2014-09-16 2014-12-10 宁波熵联信息技术有限公司 一种基于隐马尔可夫模型的车牌识别方法
CN105989359B (zh) * 2015-03-20 2019-06-18 株式会社Pfu 日期识别装置
CN105989359A (zh) * 2015-03-20 2016-10-05 株式会社Pfu 日期识别装置
CN105346249A (zh) * 2015-11-23 2016-02-24 昇捷丰电子(厦门)有限公司 一种基于gprs实现远程实时喷码的喷码机
CN106932013A (zh) * 2015-12-31 2017-07-07 杨迅 多链路智能传感装置及系统
CN106932013B (zh) * 2015-12-31 2019-07-02 杨迅 多链路智能传感装置及系统
CN107977594A (zh) * 2016-10-25 2018-05-01 深圳市寒武纪智能科技有限公司 一种交互式机器人及其讲故事方法
CN107092913A (zh) * 2017-03-20 2017-08-25 上海大学 一种喷印字符在线识别及交互式后处理系统及方法
CN107480683A (zh) * 2017-08-24 2017-12-15 郑州云海信息技术有限公司 一种图像处理方法及装置
CN107844792A (zh) * 2017-10-27 2018-03-27 深圳供电局有限公司 一种移动终端及图像识别服务器
CN109515965A (zh) * 2018-11-14 2019-03-26 何妍 一种酒瓶瓶盖喷码读取记录系统
CN109515965B (zh) * 2018-11-14 2021-07-20 重庆江记酒庄有限公司 一种酒瓶瓶盖喷码读取记录系统
CN109753963A (zh) * 2019-02-22 2019-05-14 山东大学 一种基于线结构光的轮胎标识自动识别系统及其工作方法
CN110135430A (zh) * 2019-04-28 2019-08-16 广东技术师范大学 一种基于深度神经网络的铝材模具id自动识别系统
CN115797942A (zh) * 2023-02-01 2023-03-14 潍坊工程职业学院 一种宣传信息交互方法及系统
CN115797942B (zh) * 2023-02-01 2023-04-28 潍坊工程职业学院 一种宣传信息交互方法及系统

Also Published As

Publication number Publication date
CN101706875B (zh) 2012-07-18

Similar Documents

Publication Publication Date Title
CN101706875B (zh) 一种手持式的复杂背景下的激光喷码字符识别仪
CN201654804U (zh) 一种字符识别仪
US20200250461A1 (en) Target detection method, apparatus, and system
CN110458095A (zh) 一种有效手势的识别方法、控制方法、装置和电子设备
CN109002841A (zh) 一种基于Faster-RCNN模型的建筑构件提取方法
CN101853071A (zh) 基于视觉的手势识别方法及系统
CN103488415B (zh) 基于纸介质的手书文字和图形识别系统及识别方法
CN104102912A (zh) 一种基于视频图像识别的分项计量能耗数据采集装置及方法
CN113705554A (zh) 图像识别模型的训练方法、装置、设备及存储介质
CN110866900A (zh) 水体颜色识别方法及装置
CN103105924A (zh) 人机交互方法和装置
CN110533046A (zh) 一种图像实例分割方法和装置
Jin et al. A Smart Water Metering System Based on Image Recognition and Narrowband Internet of Things.
Chen et al. Multi-objective solid waste classification and identification model based on transfer learning method
CN109002776A (zh) 人脸识别方法、系统、计算机设备和计算机可读存储介质
CN204926123U (zh) 一种基于手持终端叶片图像的植物物种识别装置
Sharma et al. Automatic number plate recognition and parking management
Dong Intelligent Garbage Classification System based on Computer Vision [J]
Gao et al. Chinese character components segmentation method based on faster RCNN
CN101893960A (zh) 一种基于方向向量的文字识别方法和识别装置
CN101901348A (zh) 一种基于归一化的手写识别方法和识别装置
CN111832337A (zh) 一种车牌识别方法及装置
CN115359468A (zh) 一种目标网站识别方法、装置、设备及介质
Liu et al. Reagent color recognition model for Android platform based on opencv and machine learning
CN112232219A (zh) 一种基于lbp特征算法的人脸识别签到系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120718

Termination date: 20131117