CN112801080B - 基于fpga的印刷体数字字符自动识别装置 - Google Patents

基于fpga的印刷体数字字符自动识别装置 Download PDF

Info

Publication number
CN112801080B
CN112801080B CN202011630072.6A CN202011630072A CN112801080B CN 112801080 B CN112801080 B CN 112801080B CN 202011630072 A CN202011630072 A CN 202011630072A CN 112801080 B CN112801080 B CN 112801080B
Authority
CN
China
Prior art keywords
module
data
sdram
video image
fpga
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011630072.6A
Other languages
English (en)
Other versions
CN112801080A (zh
Inventor
孙铭
王大鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN202011630072.6A priority Critical patent/CN112801080B/zh
Publication of CN112801080A publication Critical patent/CN112801080A/zh
Application granted granted Critical
Publication of CN112801080B publication Critical patent/CN112801080B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • G06F3/147Digital output to display device ; Cooperation and interconnection of the display device with other functional units using display panels
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/955Hardware or software architectures specially adapted for image or video understanding using specific electronic processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种基于FPGA的印刷体数字字符自动识别装置,包括图像传感器OV5640、FPGA单元、LCD显示器、同步动态随机存储器SDRAM芯片、数码管;图像传感器采集到的数据通过送给FPGA单元,FPGA单元完成对印刷体数字字符图像的数据采集、送入同步动态随机存储器SDRAM,将同步动态随机存储器SDRAM封装成FIFO,用作视频图像数据的缓存,然后再送入FPGA单元进行灰度转换,二值化处理,投影分割,数字识别处理;LCD显示器显示处理后的二值化图像和图像的边界。本发明结构简单、成像速度快、数据处理效率高,可以很好地降低成本投入,大幅优化了印刷体数字字符识别系统的性能。

Description

基于FPGA的印刷体数字字符自动识别装置
技术领域
本发明属于图像识别技术领域,具体是一种基于FPGA的印刷体数字字符自动识别装置。
背景技术
数字识别(Digital Recognition)是图像识别下的一个分支领域,目前已经发展成为一门独立的研究学科。数字识别技术涉及模式识别、人工智能、组合数学、计算机等学科,是一门综合性的学科。依据识别对象不同分类,数字识别可以分为印刷体数字识别和手写体数字识别;而手写体数字识别又进一步可以分为联机手写体数字识别和脱机手写体数字识别。数字作为信息的重要组成部分,其识别效果的好坏很大程度上决定了信息的录入速度。数字作为全世界通用的符号,只由0至9是个数字组成,需要识别的种类较少,故识别难度较小,通过对数字识别的研究有利于验证一些新的识别算法及理论。随着我国信息技术的崛起,数字识别技术有了长足快速的发展和应用,如今数字识别理论己经相对较为成熟,识别正确率己经达到很高水平。
在现有的数字识别系统中,实现识别的方法大致有以下几种:1.在个人计算机上通过软件实现,此法一般用于算法的验证与仿真,其缺点是灵活性与实时性较差;2.通过通用的单片机实现,此法一般用于比较简单的数字处理,其缺点是单片机的运算速度比较慢;3.通过通用的数字信号处理器(DSP)实现,此法使用较广,被大多数开发人员所采用,其缺点是外围电路设计复杂,开发调试难度大,开发周期较长,开发完成后的系统扩展性和升级性较差;4.通过专用的数字信号处理器(DSP)实现,此法主要应用于信号处理速度要求极高的场合,其缺点是灵活性差,且成本高。
发明内容
本发明的目的在于提供一种基于FPGA的印刷体数字字符自动识别装置,通过FPGA完成对图像的采集和处理,图像中数字信息的印刷体识别以及数字的显示等功能,充分利用FPGA并行性与模块化的设计思想,提升算法的实现效率,缩短开发周期。
实现本发明目的的技术解决方案为:一种基于FPGA的印刷体数字字符自动识别装置,包括图像传感器、FPGA单元、LCD显示器、同步动态随机存储器SDRAM芯片和数码管;
所述图像传感器实时采集视频图像数据,并将视频图像数据通过I2C协议传入FPGA单元;
所述同步动态随机存储器SDRAM芯片用于接收FPGA单元传入的视频图像数据,用作视频图像数据的缓存,并将视频图像数据再次传入FPGA单元进行后续的视频图像处理与实时显示;
所述LCD显示器实时显示FPGA单元处理后的视频图像;
所述数码管实时显示FPGA单元识别的数字字符;
所述FPGA单元完成视频图像数据的处理及输出,所述FPGA单元包括:
PLL时钟模块,通过调用锁相环IP核实现,为FPGA单元各个模块提供驱动时钟;
I2C驱动模块,负责驱动图像传感器OV5640 SCCB接口总线,用户可根据该模块提供的用户接口对OV5640的寄存器进行配置;
I2C配置模块,该模块用于寄存需要配置的寄存器地址、数据以及控制初始化的开始与结束;
摄像头图像采集模块,将视频图像数据传入SDRAM_TOP读写控制模块,完成对图像传感器图像的采集;
SDRAM_TOP读写控制模块,负责驱动SDRAM片外存储器,缓存图像传感器输出的图像数据;
视频图像处理VIP模块,用于视频图像数据的处理,传入LCD显示器实时显示,并将视频图像处理VIP模块得到的数字字符数据传入数码管驱动模块;
LCD驱动模块,用于驱动LCD显示屏;
数码管驱动模块,用于驱动数码管实时显示得到的数字字符。
本发明与现有技术相比,具有以下收益与效果:
(1)结构简单:已有发明在硬件电路上采用FPGA+DSP或者FPGA+外部处理器的设计方案,本发明硬件电路只使用FPGA完成设计目标,硬件结构简单,有效节省单板面积;
(2)处理速度快:本发明使用FPGA完成图像识别工作,与其他发明使用DSP或其他处理器完成图像识别工作相比,由于FPGA采用流水线技术和并行处理技术,因此提高了图像识别的速度。
下面结合附图对本发明作进一步详细描述。
附图说明
图1为本发明的系统框图。
图2为本发明的数字字符0-9特征图。
图3为本发明的数字字符0-9的数字特征表。
图4为本发明实施例中待处理的印刷体数字字符。
图5为本发明实施例中LCD显示器实时显示的图像。
图6为本发明实施例中数码管实时显示画面。
具体实施方式
如图1所示,本发明提出了一种基于FPGA的印刷体数字字符自动识别装置,解决了印刷体数字字符提取及识别系统存在结构复杂、成本高、处理速度慢的问题。本发明包括图像传感器OV5640、FPGA单元、LCD显示器、同步动态随机存储器SDRAM芯片、数码管。图像传感器采集到的数据通过送给FPGA单元,FPGA单元完成对印刷体数字字符图像的数据采集、送入同步动态随机存储器SDRAM,将同步动态随机存储器SDRAM封装成FIFO,用作视频图像数据的缓存,然后再送入FPGA单元进行灰度转换,二值化处理,投影分割,数字识别处理,将识别到的数字显示在数码管上。LCD显示器显示处理后的二值化图像和图像的边界。下面对各模块具体说明:
图像传感器:实时采集视频图像数据,并将视频图像数据通过I2C协议传入FPGA单元。
同步动态随机存储器SDRAM芯片:用于接收FPGA单元传入的视频图像数据,用作视频图像数据的缓存,并将视频图像数据再次传入FPGA单元进行后续的视频图像处理与实时显示。
LCD显示器:实时显示FPGA单元处理后的视频图像。
数码管:实时显示FPGA单元识别的数字字符。
FPGA单元:完成视频图像数据的处理及输出。
进一步的,所述FPGA单元包括:
PLL时钟模块:PLL时钟模块通过调用锁相环(PLL)IP核实现,为FPGA单元各个模块提供驱动时钟。
I2C驱动模块:I2C驱动模块负责驱动图像传感器OV5640 SCCB接口总线,用户可根据该模块提供的用户接口对OV5640的寄存器进行配置。
I2C配置模块:该模块寄存需要配置的寄存器地址、数据以及控制初始化的开始与结束。
摄像头图像采集模块:摄像头图像采集模块将视频图像数据传入SDRAM_TOP读写控制模块,完成对图像传感器OV5640传感器图像的采集。
SDRAM_TOP读写控制模块:SDRAM_TOP读写控制模块负责驱动SDRAM片外存储器,缓存图像传感器输出的图像数据。该模块将SDRAM复杂的读写操作封装成类似FIFO的用户接口。
视频图像处理VIP模块:用于视频图像数据的处理,传入LCD显示器实时显示,并将视频图像处理VIP模块得到的数字字符数据传入数码管驱动模块。
LCD驱动模块:LCD驱动模块负责驱动LCD显示屏。
数码管驱动模块:驱动数码管实时显示得到的数字字符。
进一步的,所述SDRAM_TOP读写控制模块包括:
FIFO控制模块:包含写FIFO模块和读FIFO模块,作为SDRAM控制器模块与用户的交互接口,该模块在写FIFO中的数据量到达用户指定的突发长度后将数据自动写入SDRAM;并在读FIFO中的数据量小于突发长度时将SDRAM中的数据读出。
SDRAM控制器模块:负责完成外部SDRAM存储芯片的初始化、读写及刷新等一系列操作。
进一步的,所述视频图像处理VIP模块包括:
rgb_YCbCr模块:在该模块以LCD驱动模块传入的16位RGB565红、绿、蓝三原色数据作为输入数据,通过算法实现RGB到YCbCr的转换,并输出三路8位数据。
binarization模块:该模块主要是根据设定阈值,完成图像数据的二值化,将图像化分为黑白两种颜色。
projection模块:projection是投影分割模块,实现对二值化后的图像的水平垂直投影,从而实现对图像的分割。
digital recognition模块:digital recognition是特征匹配识别模块,根据投影分割模块对分割后的单个数字进行特征匹配识别。
本发明结构简单、成像速度快、数据处理效率高,可以很好地降低成本投入,大幅优化了印刷体数字字符识别系统的性能。本发明可广泛应用于包括身份证号识别、车牌号识别等图像处理领域。
下面结合实施例对本发明进行详细说明。
实施例
如图1所示,本发明系统框图。PLL时钟模块为I2C驱动模块、LCD顶层模块以及SDRAM_TOP控制器模块提供驱动时钟;I2C驱动模块和I2C配置模块用于初始化OV5640图像传感器;图像传感器采集模块负责采集图像传感器图像数据,并且把图像数据写入SDRAM读写控制模块;SDRAM读写控制模块负责将用户数据写入和读出片外SDRAM存储器中;LCD驱动模块负责将SDRAM读出视频图像数据传入视频图像处理VIP模块,VIP模块具体负责视频图像数据处理,在rgb_YCbCr模块以LCD驱动模块传入的16位RGB565红、绿、蓝三原色数据作为输入数据,通过算法实现RGB到YCbCr的转换,并输出三路8位数据。在binarization模块根据设定阈值,完成图像数据的二值化,将图像化分为黑白两种颜色,projection模块投影分割模块,实现对二值化后的图像的水平垂直投影,从而实现对图像的分割。在digitalrecognition模块中根据图2,图3所示的数字0-9数字特征进行特征匹配,根据投影分割模块对分割后的单个数字进行特征匹配识别。
本发明采用基于Cyclone IV芯片EP4CE6E22C8的开发板进行设计与研究。该开发板采用50MHz的晶振,图像传感器采用OmniVision(豪威科技)公司生产的CMOS图像传感器OV5640,SDRAM芯片采用型号为W9825G6KH,容量为32M字节,LCD显示器采用4.3寸RGB液晶显示屏。
对本发明的基于FPGA的印刷体数字字符自动识别装置性能进行验证:
将图4待处理的印刷体数字图片合适的放在图像传感器OV5640摄像头前,打开电脑中的数字识别工程digital_recognition,编译程序,将下载器一端连电脑,另一端与开发板上对应端口连接,接上OV5640和4.3寸RGB显示屏后,连接电源线并打开电源开关。接下来我们下载程序,验证数字识别功能,观察到图5所示LCD显示器实时显示的图像,以及图6数码管显示的数字,可以验证本发明实现了印刷体数字字符的自动识别及实时显示。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (3)

1. 一种基于FPGA的印刷体数字字符自动识别装置,其特征在于:包括图像传感器、FPGA单元、LCD显示器、同步动态随机存储器 SDRAM芯片和数码管;
所述图像传感器实时采集视频图像数据,并将视频图像数据通过I2C协议传入FPGA单元;
所述同步动态随机存储器 SDRAM芯片用于接收FPGA单元传入的视频图像数据,用作视频图像数据的缓存,并将视频图像数据再次传入FPGA单元进行后续的视频图像处理与实时显示;
所述LCD显示器实时显示FPGA单元处理后的视频图像;
所述数码管实时显示FPGA单元识别的数字字符;
所述FPGA单元完成视频图像数据的处理及输出,所述FPGA单元包括:
PLL时钟模块,通过调用锁相环IP核实现,为FPGA单元各个模块提供驱动时钟;
I2C驱动模块,负责驱动图像传感器OV5640 SCCB接口总线,用户根据该模块提供的用户接口对OV5640的寄存器进行配置;
I2C配置模块,该模块用于寄存需要配置的寄存器地址、数据以及控制初始化的开始与结束;
摄像头图像采集模块,将视频图像数据传入SDRAM_TOP读写控制模块,完成对图像传感器图像的采集;
SDRAM_TOP读写控制模块,负责驱动SDRAM片外存储器,缓存图像传感器输出的图像数据;
视频图像处理VIP模块,用于视频图像数据的处理,传入LCD显示器实时显示,并将视频图像处理VIP模块得到的数字字符数据传入数码管驱动模块;
LCD驱动模块,用于驱动LCD显示屏;
数码管驱动模块,用于驱动数码管实时显示得到的数字字符。
2.根据权利要求1所述的基于FPGA的印刷体数字字符自动识别装置,其特征在于,所述SDRAM_TOP读写控制模块包括:
FIFO控制模块:包含写FIFO模块和读FIFO模块,作为SDRAM控制器模块与用户的交互接口,该模块在写FIFO中的数据量到达用户指定的突发长度后将数据自动写入SDRAM;并在读FIFO中的数据量小于突发长度时将SDRAM中的数据读出;
SDRAM控制器模块:负责完成外部SDRAM存储芯片的初始化、读写及刷新操作。
3.根据权利要求1所述的基于FPGA的印刷体数字字符自动识别装置,其特征在于,所述视频图像处理VIP模块包括:
rgb_YCbCr模块,该模块以LCD驱动模块传入的16位RGB565红、绿、蓝三原色数据作为输入数据,通过算法实现RGB到YCbCr的转换,并输出三路8位数据;
binarization模块,该模块主要是根据设定阈值,完成图像数据的二值化,将图像化分为黑白两种颜色;
projection模块,projection是投影分割模块,实现对二值化后的图像的水平垂直投影,从而实现对图像的分割;
digital recognition模块,digital recognition是特征匹配识别模块,根据投影分割模块对分割后的单个数字进行特征匹配识别。
CN202011630072.6A 2020-12-30 2020-12-30 基于fpga的印刷体数字字符自动识别装置 Active CN112801080B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011630072.6A CN112801080B (zh) 2020-12-30 2020-12-30 基于fpga的印刷体数字字符自动识别装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011630072.6A CN112801080B (zh) 2020-12-30 2020-12-30 基于fpga的印刷体数字字符自动识别装置

Publications (2)

Publication Number Publication Date
CN112801080A CN112801080A (zh) 2021-05-14
CN112801080B true CN112801080B (zh) 2022-09-30

Family

ID=75808138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011630072.6A Active CN112801080B (zh) 2020-12-30 2020-12-30 基于fpga的印刷体数字字符自动识别装置

Country Status (1)

Country Link
CN (1) CN112801080B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105744217A (zh) * 2014-12-11 2016-07-06 哈尔滨米米米业科技有限公司 基于dsp的全向视觉处理系统
CN209517309U (zh) * 2019-03-30 2019-10-18 西北民族大学 一种基于机器视觉的字符自动识别计数装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150286860A1 (en) * 2014-04-02 2015-10-08 Le Moustache Club S.L. Method and Device for Generating Data from a Printed Document

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105744217A (zh) * 2014-12-11 2016-07-06 哈尔滨米米米业科技有限公司 基于dsp的全向视觉处理系统
CN209517309U (zh) * 2019-03-30 2019-10-18 西北民族大学 一种基于机器视觉的字符自动识别计数装置

Also Published As

Publication number Publication date
CN112801080A (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
CN111340835A (zh) 基于fpga的视频图像边缘检测系统
CN105208275B (zh) 一种支持流数据片内实时处理的系统
CN102945291A (zh) 基于pci-e的高速图像采集存储卡
CN104299354B (zh) 一种红外热成像热点检测告警装置及告警方法
CN105025264A (zh) 基于fpga与usb2.0的便携式计算机视频监控系统
CN1443322A (zh) 存储器控制器中枢
CN101567979A (zh) 基于usb2.0的红外摄像机与计算机间数据采集系统
CN112801080B (zh) 基于fpga的印刷体数字字符自动识别装置
CN201548484U (zh) 通用多路数字图像模拟源
CN101404732A (zh) 数字图像采集系统
CN202261654U (zh) Fpga视频图像存储与处理的装置
Wang et al. A new real-time lucky imaging algorithm and its implementation techniques
CN204270461U (zh) 一种红外热成像热点检测告警装置
CN101472126A (zh) 数字基频处理器及其之操作方法、以及无线装置及其方法
CN216086832U (zh) 一种人机交互实时视频采集与边缘检测装置
CN111914786B (zh) 一种手指静脉识别方法及其系统
CN201449607U (zh) 基于usb2.0的数据采集器
CN212230036U (zh) 显示面板检测装置及系统
CN111242835B (zh) 基于zynq和gpu的特征边缘检测系统和方法
CN207503284U (zh) 图像边缘检测系统
CN220171649U (zh) 一种基于fpga实时检测道路障碍物的装置
Wu et al. License plate recognition system based on STM32 [J]
CN116506560B (zh) 一种视频图像实时采集系统及采集方法
CN207782989U (zh) 基于mt9v032的cmos数字摄像头电路
CN203225823U (zh) 基于arm11和wince6.0的图像采集处理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Sun Ming

Inventor after: Wang Dapeng

Inventor before: Wang Dapeng

Inventor before: Sun Ming

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant