CN105160304A - 一种基于机器视觉的标志文字识别方法及其装置 - Google Patents

一种基于机器视觉的标志文字识别方法及其装置 Download PDF

Info

Publication number
CN105160304A
CN105160304A CN201510487687.0A CN201510487687A CN105160304A CN 105160304 A CN105160304 A CN 105160304A CN 201510487687 A CN201510487687 A CN 201510487687A CN 105160304 A CN105160304 A CN 105160304A
Authority
CN
China
Prior art keywords
region
character
scene text
segmentation
key frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510487687.0A
Other languages
English (en)
Inventor
唐承佩
彭少凯
叶浩文
邹俊
孙晖
孙强
李�杰
晏瑾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China State Construction Engineering Corp Ltd CSCEC
China Construction Fourth Engineering Division Corp Ltd
First Construction Co Ltd of China Construction Third Engineering Division
Sun Yat Sen University
National Sun Yat Sen University
Original Assignee
China State Construction Engineering Corp Ltd CSCEC
China Construction Fourth Engineering Division Corp Ltd
First Construction Co Ltd of China Construction Third Engineering Division
National Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China State Construction Engineering Corp Ltd CSCEC, China Construction Fourth Engineering Division Corp Ltd, First Construction Co Ltd of China Construction Third Engineering Division, National Sun Yat Sen University filed Critical China State Construction Engineering Corp Ltd CSCEC
Priority to CN201510487687.0A priority Critical patent/CN105160304A/zh
Publication of CN105160304A publication Critical patent/CN105160304A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明实施例公开了一种基于机器视觉的标志文字识别方法及其装置,其中,该方法包括:拍摄视频,获取包含标志文字区域的关键帧;分割所述关键帧,获取字符串块区域;对所述字符串块区域进行校正,对所述字符串块区域中的字符距离进行检验;对所述字符串块区域进行字符分割,获得处理后的字符。在本发明实施例中,把处理后的字符与模板字符进行比较,以达到检测标志文字是否合格的目的,可以保持稳定的检测效率,可以检测每个产品上的错误文字,检测效率高,节省人力。

Description

一种基于机器视觉的标志文字识别方法及其装置
技术领域
本发明涉及数字图像处理技术领域,尤其涉及一种基于机器视觉的标志文字识别方法及其装置。
背景技术
标识内容识别技术在现实生活中有很广泛的应用,各种各样的标识文字在生活中随处可见,比如楼层编号,产品上面的品牌字符等等,许多情况下都需要识别标志文字来满足人们的各种需求。
比如在工厂生产产品时,都是检测人员用人眼来观察产品上面的文字是否合格,这样就过多地浪费了人力。并且检测人员可能因为视力异常、疲劳过度、不够细心等人为因素,会大幅度降低检测的效率和准确度,使得企业的产品质量受到影响。
比如当需要识别某些标志文字的时候,比如楼层编号等,现在很多地方都是人通过语音告诉对方当前的楼层号码,这也过多的浪费了人力,而且工作人员可能因为其他因素,会经常发生报错的情况。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种基于机器视觉的标志文字识别方法及其装置,可以保持稳定的检测效率,检测效率高,节省人力。
为了解决上述问题,本发明提出了一种基于机器视觉的标志文字识别方法,所述方法包括:
拍摄视频,获取包含标志文字区域的关键帧;
分割所述关键帧,获取字符串块区域;
对所述字符串块区域进行校正,对所述字符串块区域中的字符距离进行检验;
对所述字符串块区域进行字符分割,获得处理后的字符。
优选地,所述拍摄视频,获取包含标志文字区域的关键帧的步骤包括:
对包括标志文字的区域进行视频拍摄;
扫描所述视频里的每一帧图像,抽取包含标志文字区域的关键帧。
优选地,所述分割所述关键帧,获取字符串块区域的步骤,包括:
分割所述关键帧,抽取所述关键帧中的标志文字区域;
分割所述标志文字区域中的字符串块区域。
优选地,所述对所述字符串块区域进行校正,对所述字符串块区域中的字符距离进行检验的步骤,包括:
对所述字符串块区域进行校正;
对所述字符串块区域中的字符串进行投影,检验字符之间的距离是否正确。
优选地,所述对所述字符串块区域进行字符分割,获得处理后的字符的步骤,包括:
对所述字符串块区域进行字符分割,获得分割后的字符;
对所述分割后的字符进行归一化处理;
对归一化处理后的字符进行二值化和去噪声处理。
优选地,采用阈值分割方式对所述字符串块区域进行字符分割,获得分割后的字符。
优选地,在所述对所述字符串块区域进行字符分割,获得处理后的字符步骤之后,还包括:将所述处理后的字符和模板进行对比,检验所述处理后的字符进否达到标准。
相应地,本发明还提供一种基于机器视觉的标志文字识别装置,所述装置包括:
拍摄模块,用于拍摄视频,获取包含标志文字区域的关键帧;
区域分割模块,用于分割所述拍摄模块所获取的关键帧,获取字符串块区域;
检测模块,用于对所述分割模块所获取的字符串块区域进行校正,对所述字符串块区域中的字符距离进行检验;
字符分割模块,用于对所述字符串块区域进行字符分割,获得处理后的字符。
优选地,所述拍摄模块包括:
拍摄单元,用于对包括标志文字的区域进行视频拍摄;
抽取单元,用于扫描所述视频里的每一帧图像,抽取包含标志文字区域的关键帧。
优选地,所述区域分割模块还用于分割所述关键帧,抽取所述关键帧中的标志文字区域;分割所述标志文字区域中的字符串块区域。
在本发明实施例中,把处理后的字符与模板字符进行比较,以达到检测标志文字是否合格的目的,可以保持稳定的检测效率,可以检测每个产品上的错误文字,检测效率高,节省人力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例的基于机器视觉的标志文字识别方法的流程示意图;
图2是本发明实施例的基于机器视觉的标志文字识别装置的结构组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例的基于机器视觉的标志文字识别方法的流程示意图,如图1所示,该方法包括:
S101,拍摄视频,获取包含标志文字区域的关键帧;
S102,分割关键帧,获取字符串块区域;
S103,对字符串块区域进行校正,对字符串块区域中的字符距离进行检验;
S104,对字符串块区域进行字符分割,获得处理后的字符。
其中,S101进一步包括:
对包括标志文字的区域进行视频拍摄;
扫描视频里的每一帧图像,抽取包含标志文字区域的关键帧。
具体实施中,采用像素较高的摄像机对包括标志文字的区域进行视频拍摄,有利于后续处理。
S102进一步包括:
分割关键帧,抽取关键帧中的标志文字区域;
分割标志文字区域中的字符串块区域。
其中,采用图像分割技术把标志文字区域从关键帧中分割出来;可以采用如阈值分割、区域分割、边缘分割、直方图法等方法,选择不同的分割方法,在保证图片高质量的前提下,达到将标志文字区域从关键帧里分割出来的目的。把标志文字区域从关键帧中分割出来,一般采用区域分割法,当标志文字区域的灰度值与关键帧其他部分的灰度值差别比较大时,也可以采用阈值分割法。
采用分割技术把包含字符的整块区域从标志文字区域分割下来,这样方便对字符块区域进行专门处理。
进一步地,S103包括:
对字符串块区域进行校正;
对字符串块区域中的字符串进行投影,检验字符之间的距离是否正确。
字符串块区域可能因为噪声等因素,字符区域不怎么规整,甚至可能倾斜、弯曲等畸形情况发生,需要对字符串块区域恢复处理一下。
通过进行字符串的投影,检测字符之间的距离是否正确;防止有些字符离得近,有些字符离得远,方便下一步对字符进行分割,以及利于最后让字符与模板字符进行比较。
S104包括:
对字符串块区域进行字符分割,获得分割后的字符;
对分割后的字符进行归一化处理;
对归一化处理后的字符进行二值化和去噪声处理。
因为字符块区域可能包含其他的图案,比如小方格等,需要把字符块区域里面的字符单独分割出来,方便以后和模板字符进行比较,可以采用阈值分割、区域分割、边缘分割、直方图分割法对字符进行分割。一般情况下字符与字符串块区域中其他非字符区域灰度值差别比较大,所以一般采用阈值分割法,进行字符分割。
有的字符可能比较大,有的字符可能比较小,归一化处理之后使它们大小一样,方便和模板字符进行比较,在没有模板的时候,也方便进行人工检查。
二值化使图像变成黑白图像,这样更容易检测字符是否正确,但上述步骤中可能会引入新的噪声,所以需要进行去噪处理,可以根据不同种类的噪声,采用不同的滤波方法,一般采用自适应维纳滤波器进行去噪,当遇到椒盐噪声时,采用中值滤波。当不是识别企业产品标志文字的时候,比如识别楼层编号的时候,到了这一步就结束了。
具体实施中,可以采用图像复原的方法,对字符串区域进行校正,当退化模型仅含噪声时,需要用滤波的方法来恢复图像。
在S104之后,还包括:将处理后的字符和模板进行对比,检验处理后的字符进否达到标准。而当不是识别企业产品标志文字的时候,比如识别楼层编号的时候,在S104之后不需要执行上述步骤。
相应地,本发明实施例还提供一种基于机器视觉的标志文字识别装置,如图2所示,该装置包括:
拍摄模块1,用于拍摄视频,获取包含标志文字区域的关键帧;
区域分割模块2,用于分割拍摄模块1所获取的关键帧,获取字符串块区域;
检测模块3,用于对分割模块2所获取的字符串块区域进行校正,对字符串块区域中的字符距离进行检验;
字符分割模块4,用于对字符串块区域进行字符分割,获得处理后的字符。
其中,拍摄模块1包括:
拍摄单元,用于用对包括标志文字的区域进行视频拍摄;
抽取单元,用于扫描视频里的每一帧图像,抽取包含标志文字区域的关键帧。
区域分割模块2还用于分割关键帧,抽取关键帧中的标志文字区域;分割标志文字区域中的字符串块区域。
本发明的装置实施例中各功能模块的功能可参见本发明方法实施例中的流程处理,这里不再赘述。
在本发明实施例中,把处理后的字符与模板字符进行比较,以达到检测标志文字是否合格的目的,可以保持稳定的检测效率,可以检测每个产品上的错误文字,检测效率高,节省人力。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,ReadOnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁盘或光盘等。
另外,以上对本发明实施例所提供的基于机器视觉的标志文字识别方法及其装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于机器视觉的标志文字识别方法,其特征在于,所述方法包括:
拍摄视频,获取包含标志文字区域的关键帧;
分割所述关键帧,获取字符串块区域;
对所述字符串块区域进行校正,对所述字符串块区域中的字符距离进行检验;
对所述字符串块区域进行字符分割,获得处理后的字符。
2.如权利要求1所述的基于机器视觉的标志文字识别方法,其特征在于,所述拍摄视频,获取包含标志文字区域的关键帧的步骤包括:
对包括标志文字的区域进行视频拍摄;
扫描所述视频里的每一帧图像,抽取包含标志文字区域的关键帧。
3.如权利要求1所述的基于机器视觉的标志文字识别方法,其特征在于,所述分割所述关键帧,获取字符串块区域的步骤,包括:
分割所述关键帧,抽取所述关键帧中的标志文字区域;
分割所述标志文字区域中的字符串块区域。
4.如权利要求1所述的基于机器视觉的标志文字识别方法,其特征在于,所述对所述字符串块区域进行校正,对所述字符串块区域中的字符距离进行检验的步骤,包括:
对所述字符串块区域进行校正;
对所述字符串块区域中的字符串进行投影,检验字符之间的距离是否正确。
5.如权利要求1所述的基于机器视觉的标志文字识别方法,其特征在于,所述对所述字符串块区域进行字符分割,获得处理后的字符的步骤,包括:
对所述字符串块区域进行字符分割,获得分割后的字符;
对所述分割后的字符进行归一化处理;
对归一化处理后的字符进行二值化和去噪声处理。
6.如权利要求5所述的基于机器视觉的标志文字识别方法,其特征在于,采用阈值分割方式对所述字符串块区域进行字符分割,获得分割后的字符。
7.如权利要求1所述的基于机器视觉的标志文字识别方法,其特征在于,在所述对所述字符串块区域进行字符分割,获得处理后的字符步骤之后,还包括:将所述处理后的字符和模板进行对比,检验所述处理后的字符进否达到标准。
8.一种基于机器视觉的标志文字识别装置,其特征在于,所述装置包括:
拍摄模块,用于拍摄视频,获取包含标志文字区域的关键帧;
区域分割模块,用于分割所述拍摄模块所获取的关键帧,获取字符串块区域;
检测模块,用于对所述分割模块所获取的字符串块区域进行校正,对所述字符串块区域中的字符距离进行检验;
字符分割模块,用于对所述字符串块区域进行字符分割,获得处理后的字符。
9.如权利要求8所述的基于机器视觉的标志文字识别装置,其特征在于,所述拍摄模块包括:
拍摄单元,用于对包括标志文字的区域进行视频拍摄;
抽取单元,用于扫描所述视频里的每一帧图像,抽取包含标志文字区域的关键帧。
10.如权利要求8所述的基于机器视觉的标志文字识别装置,其特征在于,所述区域分割模块还用于分割所述关键帧,抽取所述关键帧中的标志文字区域;分割所述标志文字区域中的字符串块区域。
CN201510487687.0A 2015-08-10 2015-08-10 一种基于机器视觉的标志文字识别方法及其装置 Pending CN105160304A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510487687.0A CN105160304A (zh) 2015-08-10 2015-08-10 一种基于机器视觉的标志文字识别方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510487687.0A CN105160304A (zh) 2015-08-10 2015-08-10 一种基于机器视觉的标志文字识别方法及其装置

Publications (1)

Publication Number Publication Date
CN105160304A true CN105160304A (zh) 2015-12-16

Family

ID=54801156

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510487687.0A Pending CN105160304A (zh) 2015-08-10 2015-08-10 一种基于机器视觉的标志文字识别方法及其装置

Country Status (1)

Country Link
CN (1) CN105160304A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239784A (zh) * 2017-07-03 2017-10-10 福建中金在线信息科技有限公司 一种图片识别方法、装置、电子设备及可读存储介质
CN109271850A (zh) * 2018-08-02 2019-01-25 北京三快在线科技有限公司 一种商家信息上传方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346609A (zh) * 2013-08-01 2015-02-11 阿里巴巴集团控股有限公司 一种识别印刷品上字符的方法及装置
CN104766076A (zh) * 2015-02-28 2015-07-08 北京奇艺世纪科技有限公司 一种视频图像文字的检测方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346609A (zh) * 2013-08-01 2015-02-11 阿里巴巴集团控股有限公司 一种识别印刷品上字符的方法及装置
CN104766076A (zh) * 2015-02-28 2015-07-08 北京奇艺世纪科技有限公司 一种视频图像文字的检测方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239784A (zh) * 2017-07-03 2017-10-10 福建中金在线信息科技有限公司 一种图片识别方法、装置、电子设备及可读存储介质
CN109271850A (zh) * 2018-08-02 2019-01-25 北京三快在线科技有限公司 一种商家信息上传方法、装置、电子设备及存储介质
CN109271850B (zh) * 2018-08-02 2021-08-20 北京三快在线科技有限公司 一种商家信息上传方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
JP6262176B2 (ja) 文書画像における縦線および横線の検出および削除
US8009928B1 (en) Method and system for detecting and recognizing text in images
CN101593276B (zh) 一种视频ocr图文分离方法及系统
CN103077388B (zh) 面向便携式计算设备的快速文本扫读方法
CN108108734B (zh) 一种车牌识别方法及装置
CN112183038A (zh) 一种表格识别套打方法、计算机设备及计算机可读存储介质
CN109993161B (zh) 一种文本图像旋转矫正方法及系统
JP2006067585A (ja) デジタル画像におけるキャプションを位置特定及び抽出する方法及び装置
CN107766854B (zh) 一种基于模板匹配实现快速页码识别的方法
CN108830857B (zh) 一种自适应的汉字碑帖图像二值化分割方法
CN114022403A (zh) 检测显示面板不良的方法及装置
CN106504225A (zh) 一种规则多边形的识别方法和装置
CN109741273A (zh) 一种手机拍照低质图像的自动处理与评分方法
CN105160304A (zh) 一种基于机器视觉的标志文字识别方法及其装置
Bhuvaneswari et al. Automatic Detection and Inpainting of Text Images
CN113221778B (zh) 手写表格的检测与识别方法及装置
EP3076674A1 (en) Video quality detection method and device
WO2022121021A1 (zh) 一种身份证号码检测方法、装置、可读存储介质和终端
CN102184553A (zh) 一种运动阴影检测方法和装置
KR20150099116A (ko) Ocr를 이용한 컬러 문자 인식 방법 및 그 장치
CN107330470B (zh) 识别图片的方法和装置
CN111814780B (zh) 一种票据图像处理方法、装置、设备及存储介质
CN111079756B (zh) 一种单据图像中的表格提取与重建方法和设备
Sandhya et al. A novel local enhancement technique for rebuilding broken characters in a degraded Kannada script
CN113139535A (zh) 一种ocr文档识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151216