CN112712058A - 一种字符识别提取方法 - Google Patents

一种字符识别提取方法 Download PDF

Info

Publication number
CN112712058A
CN112712058A CN202110053548.2A CN202110053548A CN112712058A CN 112712058 A CN112712058 A CN 112712058A CN 202110053548 A CN202110053548 A CN 202110053548A CN 112712058 A CN112712058 A CN 112712058A
Authority
CN
China
Prior art keywords
character
image
information
value
image information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110053548.2A
Other languages
English (en)
Inventor
林悦铭
梁光远
蔡文浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yuechuangjin Technology Co ltd
Original Assignee
Shenzhen Yuechuangjin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yuechuangjin Technology Co ltd filed Critical Shenzhen Yuechuangjin Technology Co ltd
Priority to CN202110053548.2A priority Critical patent/CN112712058A/zh
Publication of CN112712058A publication Critical patent/CN112712058A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/06Recognition of objects for industrial automation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

本发明公开一种字符识别提取方法,包括以下步骤:S1:采集产品的图像信息并对其进行预处理;S2:基于S1预处理后的图像信息,提取图像中的字符特征信息;S3:基于S2提取的字符特征信息与预先保存在字符库中的标准字符进行比对识别;S4:对识别后的字符进行校正并输出保存。本发明基于机器视觉采集产品的图像信息,即可自动提取字符特征信息,可以提高字符提取识别的工作效率,同时,对采集的图像信息进行预处理,可使得图像清晰完整,进而提高字符识别的准确率,此外,由于其可自动化识别提取字符,进而可节省大量的人力资源,降低成本,同时也可避免由于人为主观因素造成的错判或误判,提高字符识别精度。

Description

一种字符识别提取方法
技术领域
本发明涉及字符识别技术领域,尤其涉及一种字符识别提取方法。
背景技术
随着科技的不断进步,PCB板在各个生产领域中得到广泛运用。PCB板上一般都刻画有字符,而目前针对PCB板的字符检测的方法,基本都是由人工手动完成,因此,需要大量的劳动力进行检测,检测成本高,且检测率低、主观性强、准确率低。
发明内容
本发明的目的是提供一种字符识别提取方法,该方法基于机器视觉采集产品的图像信息,即可自动提取字符特征信息,可以提高字符提取识别的工作效率,同时,对采集的图像信息进行预处理,可使得图像清晰完整,进而提高字符识别的准确率,此外,由于其可自动化识别提取字符,进而可节省大量的人力资源,降低成本,同时也可避免由于人为主观因素造成的错判或误判,提高字符识别精度。
为实现上述目的,采用以下技术方案:
一种字符识别提取方法,包括以下步骤:
S1:采集产品的图像信息并对其进行预处理;
S2:基于S1预处理后的图像信息,提取图像中的字符特征信息;
S3:基于S2提取的字符特征信息与预先保存在字符库中的标准字符进行比对识别;
S4:对识别后的字符进行校正并输出保存。
进一步地,所述S1包括以下步骤:
S11:通过工业相机扫描产品以获取产品图像信息;
S12:对产品图像信息进行滤波去噪处理;
S13:基于S12滤波去噪处理后的产品图像信息,对其进行动态阈值分割处理。
进一步地,所述S12包括以下步骤:
S121:在需要处理的像素点的周围选取若干个相邻的像素点,形成像素点云;
S122:计算像素点云中若干个像素点的灰度值的均值;
S123:设置第一阈值,并计算需要处理的像素点的灰度值与S122中得到的灰度值均值的差值,若差值大于第一阈值,则将该灰度值均值赋予S121中需要处理的像素点,若差值小于或等于第一阈值,则S121中需要处理的像素点的灰度值保持不变。
进一步地,所述S2包括以下步骤:
S21:提取图像中的字符轮廓信息;
S22:基于形态学图像处理原理,对S21提取的字符轮廓信息进行膨胀处理,以得到完整的字符特征信息。
进一步地,所述S3包括以下步骤:
S31:基于形状匹配算法将提取的字符特征信息与预先保存在字符库中的标准字符进行比对识别;
S32:基于灰度匹配归一化算法将提取的字符特征信息与预先保存在字符库中的标准字符进行比对识别;
S33:若S31与S32比对后的结果是同一个标准字符,则比对成功。
进一步地,所述S31包括以下步骤:
S311:设置第二阈值;
S312:在字符库中搜索标准字符图像,并计算S2中提取的字符特征信息的图像边缘的若干点与标准字符图像边缘的若干点之间的距离的均值;
S313:若均值小于第二阈值,则保存该标准字符的信息。
采用上述方案,本发明的有益效果是:
该方法基于机器视觉采集产品的图像信息,即可自动提取字符特征信息,可以提高字符提取识别的工作效率,同时,对采集的图像信息进行预处理,可使得图像清晰完整,进而提高字符识别的准确率,此外,由于其可自动化识别提取字符,进而可节省大量的人力资源,降低成本,同时也可避免由于人为主观因素造成的错判或误判,提高字符识别精度。
附图说明
图1为本发明的流程性框图;
图2为本发明的其中一实施例中,预处理后的字符图;
图3为本发明的其中一实施例中,对图2进行膨胀处理后的图。
具体实施方式
以下结合附图和具体实施例,对本发明进行详细说明。
参照图1至3所示,本发明提供一种字符识别提取方法,包括以下步骤:
S1:采集产品的图像信息并对其进行预处理;
S2:基于S1预处理后的图像信息,提取图像中的字符特征信息;
S3:基于S2提取的字符特征信息与预先保存在字符库中的标准字符进行比对识别;
S4:对识别后的字符进行校正并输出保存。
其中,所述S1包括以下步骤:
S11:通过工业相机扫描产品以获取产品图像信息;
S12:对产品图像信息进行滤波去噪处理;
S13:基于S12滤波去噪处理后的产品图像信息,对其进行动态阈值分割处理。
所述S12包括以下步骤:
S121:在需要处理的像素点的周围选取若干个相邻的像素点,形成像素点云;
S122:计算像素点云中若干个像素点的灰度值的均值;
S123:设置第一阈值,并计算需要处理的像素点的灰度值与S122中得到的灰度值均值的差值,若差值大于第一阈值,则将该灰度值均值赋予S121中需要处理的像素点,若差值小于或等于第一阈值,则S121中需要处理的像素点的灰度值保持不变。
所述S2包括以下步骤:
S21:提取图像中的字符轮廓信息;
S22:基于形态学图像处理原理,对S21提取的字符轮廓信息进行膨胀处理,以得到完整的字符特征信息。
所述S3包括以下步骤:
S31:基于形状匹配算法将提取的字符特征信息与预先保存在字符库中的标准字符进行比对识别;
S32:基于灰度匹配归一化算法将提取的字符特征信息与预先保存在字符库中的标准字符进行比对识别;
S33:若S31与S32比对后的结果是同一个标准字符,则比对成功。
所述S31包括以下步骤:
S311:设置第二阈值;
S312:在字符库中搜索标准字符图像,并计算S2中提取的字符特征信息的图像边缘的若干点与标准字符图像边缘的若干点之间的距离的均值;
S313:若均值小于第二阈值,则保存该标准字符的信息。
本发明工作原理:
本实施例中,应用该字符识别提取方法的检测装置框架可包括工业相机、镜头、光源、PC机、治具以及人机交互界面,工作时,将产品放置于治具上,并通过工业相机采集产品图像信息,在对图像信息进行预处理后,提取图像中的字符特征信息,然后将其与保存在字符库中的标准字符进行比对,比对成功后,将其保存输出至人机交互界面上即可。
采集产品图像信息时,可通过各种光学输入方式(如工业相机等)将产品(如PCB等)上的字符转化为图像信息到后台设备,如使用工业相机,可将欲识别的产品先行扫描成图像格式文件,扫描的分辨率越高,越有利于字符的识别工作;采集的产品图像信息的表面可能有造成失真的现象,或者存在一些污点或独立点,这样会影响到字符的正确识别,因此,在字符识别前,先对获取的产品图像信息进行图像预处理以清除图像上的污点或独立点,具体地:
首先可对产品图像信息进行滤波去噪处理,其是在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制,不损害图像的轮廓及边缘等重要信息,使图像清晰,视觉效果好,其处理效果将直接影响后续的字符特征提取的有效性和可靠性;可首先在需要处理的像素点的周围选取若干个相邻的像素点(邻域),形成像素点云(通常邻域的选取依据4领域或者8领域),然后通过下式计算像素点云中若干个像素点的灰度值的均值:
Figure BDA0002899847970000041
其中,S表示待处理的像素点的邻域(像素点云),M是像素点的总数量,g(i,j)表示图像在(i,j)处的像素数值,f(x,y)表示经过处理后的该像素点的像素值。
在上述公式中,可通过选取不同的邻域来抑制噪声,但当邻域增大后,图像也会更加模糊化。为了解决这个问题,设置第一阈值R(非封闭值),并通过下式计算要处理的像素点的灰度值与通过上式得到的灰度值均值的差值,若差值大于第一阈值,则将该灰度值均值赋予需要处理的像素点,若差值小于或等于第一阈值,则需要处理的像素点的灰度值保持不变,利用这种方式就可以减少图像模糊化的程度。
Figure BDA0002899847970000051
随后,对图像进行动态阈值分割处理,将图像与其局部背景进行比较的操作称为动态阈值分割处理,因此,可以用fr,c表示输入图像,用gr,c表示处理后的图像,则对亮的物体的动态阈值分割处理如下:
S={(r,c)∈R|fr,c-gr,c≥gdiff},
而对暗物体的动态阈值分割处理是:
S={(r,c)∈R|fr,c-gr,c≥-gdiff},
这样,就可以使得图像中的字符比背景要明亮,进而便于字符特征提取。
在对产品图像信息进行预处理后,就可提取图像中的字符特征信息,可首先提取字符轮廓,但提取后的字符轮廓可能出现断裂现象,如图2中,字符0的上部分与下部份之间断裂,并留有间隙,此时,可通过形态学处理原理对其进行膨胀处理,将缺陷部分进行填充或者将点状喷射字符隔离太远的区域进行连接,以得到完整的字符特征信息(如图3);膨胀是对两个向量进行与的操作,具体定义如下:
设A,B是个集合,分别属于n维空间En,
则A被B膨胀的定义:
AB={c∈En:c=a+b,a∈A,b∈B},
当提取字符特征后,必须有一比对字符库来进行比对识别,字符库的内容应包含所有欲识别的字符字集,以及根据与输入字符一样的特征抽取方法得到的特征群组,通过搜索字符库中原有字符进行对比,如果字体倾斜或者光照不清晰,可以通过学习字体,并保存在字符库中,下次检测如果字符和该字符相近,那么检测结果为学习的字体,字体编号可以随意命名,这里运用到形状和灰度双重匹配对字符进行识别,以提高字符识别的正确率。
其中,可基于形状匹配相似度度量来对提取的字符特征信息与字符库中标准字符进行比对,形状匹配相似度度量是使字符特征图像的边缘点与离它最近的标准字符图像图像边缘点之间的均方距离最小,即是与标准字符图像边缘点之间的距离,而不需要知道哪个点是最近点,因此可以通过计算分割后搜索图像背景的距离变换来高效实现。如果字符特征图像的边缘点与标准字符边缘点之间的平均距离小于一个阈值,即可认为找到了一个相似的标准字符的实例,当然,为了得到字符的唯一位置,必须计算相似度量的局部最小值,其边缘距离的平均值sed表示如下:
Figure BDA0002899847970000061
其中,T表示字符特征图像中的边缘点,d(r,c)表示分割后搜索标准字符图像背景的距离变换。
而基于灰度匹配归一化算法可以作为相似度衡量的一个标准,首先它是将字符特征图像和字符库中标准字符图像的灰度值作为输入参数进行统计计算,然后在通过相关的归一化处理来反应两幅图像之间的匹配程度,其相关匹配算法可定义为:
Figure BDA0002899847970000062
式中,mf(r,c)是字符特征图像的平均灰度值,st 2是标准字符图像的像素点灰度值的方差,
Figure BDA0002899847970000063
Figure BDA0002899847970000064
在归一化积相关的系数中应注意该匹配算法值的范围是在[-1,1]中,如果ncc(r,c)=±1,则图像成一个线性比例的公式:
Figure BDA0002899847970000071
而当ncc(r,c)=±1时,字符特征图像与标准字符图像才会完全匹配。
对字符的识别准确率是无法达到百分之百的,因此需要对其校正处理,可根据前后的识别字符找出最合乎逻辑的字符,作更正的功能,最后将其输出为需要的格式进行输出保存。
以上仅为本发明的较佳实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种字符识别提取方法,其特征在于,包括以下步骤:
S1:采集产品的图像信息并对其进行预处理;
S2:基于S1预处理后的图像信息,提取图像中的字符特征信息;
S3:基于S2提取的字符特征信息与预先保存在字符库中的标准字符进行比对识别;
S4:对识别后的字符进行校正并输出保存。
2.根据权利要求1所述的字符识别提取方法,其特征在于,所述S1包括以下步骤:
S11:通过工业相机扫描产品以获取产品图像信息;
S12:对产品图像信息进行滤波去噪处理;
S13:基于S12滤波去噪处理后的产品图像信息,对其进行动态阈值分割处理。
3.根据权利要求2所述的字符识别提取方法,其特征在于,所述S12包括以下步骤:
S121:在需要处理的像素点的周围选取若干个相邻的像素点,形成像素点云;
S122:计算像素点云中若干个像素点的灰度值的均值;
S123:设置第一阈值,并计算需要处理的像素点的灰度值与S122中得到的灰度值均值的差值,若差值大于第一阈值,则将该灰度值均值赋予S121中需要处理的像素点,若差值小于或等于第一阈值,则S121中需要处理的像素点的灰度值保持不变。
4.根据权利要求1所述的字符识别提取方法,其特征在于,所述S2包括以下步骤:
S21:提取图像中的字符轮廓信息;
S22:基于形态学图像处理原理,对S21提取的字符轮廓信息进行膨胀处理,以得到完整的字符特征信息。
5.根据权利要求1所述的字符识别提取方法,其特征在于,所述S3包括以下步骤:
S31:基于形状匹配算法将提取的字符特征信息与预先保存在字符库中的标准字符进行比对识别;
S32:基于灰度匹配归一化算法将提取的字符特征信息与预先保存在字符库中的标准字符进行比对识别;
S33:若S31与S32比对后的结果是同一个标准字符,则比对成功。
6.根据权利要求5所述的字符识别提取方法,其特征在于,所述S31包括以下步骤:
S311:设置第二阈值;
S312:在字符库中搜索标准字符图像,并计算S2中提取的字符特征信息的图像边缘的若干点与标准字符图像边缘的若干点之间的距离的均值;
S313:若均值小于第二阈值,则保存该标准字符的信息。
CN202110053548.2A 2021-01-15 2021-01-15 一种字符识别提取方法 Pending CN112712058A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110053548.2A CN112712058A (zh) 2021-01-15 2021-01-15 一种字符识别提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110053548.2A CN112712058A (zh) 2021-01-15 2021-01-15 一种字符识别提取方法

Publications (1)

Publication Number Publication Date
CN112712058A true CN112712058A (zh) 2021-04-27

Family

ID=75549129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110053548.2A Pending CN112712058A (zh) 2021-01-15 2021-01-15 一种字符识别提取方法

Country Status (1)

Country Link
CN (1) CN112712058A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114998922A (zh) * 2022-07-29 2022-09-02 成都薯片科技有限公司 一种基于格式模板的电子合同生成方法
CN117173416A (zh) * 2023-11-01 2023-12-05 山西阳光三极科技股份有限公司 基于图像处理的铁路货运车号图像清晰化处理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794827A (zh) * 2014-01-17 2015-07-22 温科尼克斯多夫国际有限公司 用于避免监视系统中的假警报的方法和装置
CN104966047A (zh) * 2015-05-22 2015-10-07 浪潮电子信息产业股份有限公司 一种车牌识别的方法及装置
CN109558875A (zh) * 2018-11-14 2019-04-02 广州同略信息科技有限公司 基于图像自动识别的方法、装置、终端及存储介质
CN210038832U (zh) * 2019-09-25 2020-02-07 科大讯飞华南人工智能研究院(广州)有限公司 一种基于ocr视觉的识别系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794827A (zh) * 2014-01-17 2015-07-22 温科尼克斯多夫国际有限公司 用于避免监视系统中的假警报的方法和装置
CN104966047A (zh) * 2015-05-22 2015-10-07 浪潮电子信息产业股份有限公司 一种车牌识别的方法及装置
CN109558875A (zh) * 2018-11-14 2019-04-02 广州同略信息科技有限公司 基于图像自动识别的方法、装置、终端及存储介质
CN210038832U (zh) * 2019-09-25 2020-02-07 科大讯飞华南人工智能研究院(广州)有限公司 一种基于ocr视觉的识别系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ZHONGJIE CUI 等: "A Fast Image Template Matching Algorithm Based on Normalized Cross Correlation", 《CISAI 2020》, 27 September 2020 (2020-09-27), pages 1 - 10 *
刘恋: "基于Halcon的印刷字体质量检测技术的研究", 《中国优秀硕士学位论文全文数据库 工程科技II辑》, no. 2017, 15 March 2017 (2017-03-15), pages 024 - 86 *
李靓: "基于机器视觉的印刷品缺陷快速在线检测方法研究", 《中国优秀硕士学位论文 工程科技I辑》, no. 2017, 15 February 2017 (2017-02-15), pages 024 - 156 *
梅领亮: "PCB最终外观检查机关键技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 2012, 15 February 2012 (2012-02-15), pages 135 - 195 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114998922A (zh) * 2022-07-29 2022-09-02 成都薯片科技有限公司 一种基于格式模板的电子合同生成方法
CN114998922B (zh) * 2022-07-29 2022-11-04 成都薯片科技有限公司 一种基于格式模板的电子合同生成方法
CN117173416A (zh) * 2023-11-01 2023-12-05 山西阳光三极科技股份有限公司 基于图像处理的铁路货运车号图像清晰化处理方法
CN117173416B (zh) * 2023-11-01 2024-01-05 山西阳光三极科技股份有限公司 基于图像处理的铁路货运车号图像清晰化处理方法

Similar Documents

Publication Publication Date Title
CN114937055B (zh) 基于人工智能的图像自适应分割方法与系统
CN110148130B (zh) 用于检测零件缺陷的方法和装置
CN110033471B (zh) 一种基于连通域分析和形态学操作的框线检测方法
CN110335233B (zh) 基于图像处理技术的高速公路护栏板缺陷检测系统和方法
CN106290392A (zh) 一种小微轴承表面凹痕缺陷在线检测方法及其系统
CN112614062A (zh) 菌落计数方法、装置及计算机存储介质
CN108460344A (zh) 屏幕中的动态区域智能识别系统及智能识别方法
CN112712058A (zh) 一种字符识别提取方法
CN110276759B (zh) 一种基于机器视觉的手机屏坏线缺陷诊断方法
CN111738211B (zh) 基于动态背景补偿与深度学习的ptz摄像机运动目标检测与识别方法
CN113516619B (zh) 一种基于图像处理技术的产品表面瑕疵识别方法
CN112308854A (zh) 一种芯片表面瑕疵的自动检测方法、系统及电子设备
CN111667475A (zh) 一种基于机器视觉的大枣分级检测方法
CN114170165A (zh) 一种芯片表面缺陷检测方法和装置
CN112818983A (zh) 一种利用图片相识度判断字符倒置的方法
CN111563869B (zh) 用于摄像模组质检的污点测试方法
CN104102911A (zh) 一种基于aoi的子弹表观缺陷检测系统的图像处理算法
CN114758139B (zh) 基坑积水检测方法
CN116188826A (zh) 一种复杂光照条件下的模板匹配方法及装置
CN113643290B (zh) 一种基于图像处理的吸管计数方法、装置及存储介质
Machhale et al. Implementation of number recognition using adaptive template matching and feature extraction method
CN114612429B (zh) 一种基于双目视觉的模锻件裂缝识别定位及改进方法
CN112200781A (zh) 医疗影像处理方法及装置
CN109271986B (zh) 一种基于Second-Confirm的数字识别方法
JPH07192134A (ja) 画像処理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination