CN112699890A - 一种图片文字切割系统 - Google Patents

一种图片文字切割系统 Download PDF

Info

Publication number
CN112699890A
CN112699890A CN202110018432.5A CN202110018432A CN112699890A CN 112699890 A CN112699890 A CN 112699890A CN 202110018432 A CN202110018432 A CN 202110018432A CN 112699890 A CN112699890 A CN 112699890A
Authority
CN
China
Prior art keywords
module
character
picture
image
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110018432.5A
Other languages
English (en)
Inventor
杨黎明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Meisiqi Culture Technology Co ltd
Original Assignee
Beijing Meisiqi Culture Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Meisiqi Culture Technology Co ltd filed Critical Beijing Meisiqi Culture Technology Co ltd
Priority to CN202110018432.5A priority Critical patent/CN112699890A/zh
Publication of CN112699890A publication Critical patent/CN112699890A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种图片文字切割系统,包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:前处理模块用于定位图像中的非文字部分(即图片),将其剔除;预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;本发明的有益效果是:通过一系列的图像处理可以将图像中的文字按照位置格式分块,再将每一块分割成单列(行)文字,最后逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置;通过降噪模块减少图片分析中的干扰因素,提高图片文字识别的效率;通过提取模块提高文字识别的准确率和效率。

Description

一种图片文字切割系统
技术领域
本发明属于图像处理技术领域,具体涉及一种图片文字切割系统。
背景技术
在传统文化思维中,图像与文字渊源深厚,从我国最早的象形文字便可窥见一斑。Python是一种跨平台的计算机程序设计语言,是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发;OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉和机器学习软件库,可以运行在Linux、Windows、Android和Mac OS操作系统上,轻量级而且高效-由一系列C函数和少量C++类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法;NumPy(Numerical Python)是Python的一种开源的数值计算扩展,可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
开发语言采用Python,利用opencv2视觉处理算法,NumPy的数值计算扩展,主要技术包含图像形态学变换(腐蚀、膨胀、开运算和闭运算),canny边缘检测,霍夫变换,垂直投影法,轮廓检索,轮廓拟合,二值化;对于印刷体文献资源可以高识别率实现切割,对于损害或者腐蚀比较严重的文献资源,会产生切割误差。
为了最终得到图片中的每一个字和字所在的位置,为此我们提出一种图片文字切割系统。
发明内容
本发明的目的在于提供一种图片文字切割系统,最终得到图片中的每一个字和字所在的位置。
为实现上述目的,本发明提供如下技术方案:一种图片文字切割系统,包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:
前处理模块用于定位图像中的非文字部分(即图片),将其剔除;
预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;
分块模块用于形态学腐蚀提取图像中的框线,根据框线提取文字块的轮廓,通过轮廓提取每个文字块;
分列(行)模块用于形态学膨胀让列(行)之间的分隔更明显,再通过垂直投影法提取列(行)分割点,根据分割点信息分割出每一列(行)元素;
分字模块用于使用垂直投影法对每列(行)之中的元素定位,按照定位点分割出每个字,对于分割出的字横向和纵向分别统计垂直投影,定位字的有效部分,剔除多余的空白部分;对提取出的字进行尺寸匹配,符合匹配结果的字输出为单个字图像,并定位其所在位置,不符合尺寸匹配的再进入一次垂直投影,提取出符合尺寸匹配的字;
接口封装模块用于将程序封装成API接口。
作为本发明的一种优选的技术方案,图片文字分割方法如下:
步骤一:通过一系列的图像处理将图像中的文字按照位置格式分块;
步骤二:再将每一块分割成单列(行)文字;
步骤三:逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置。
作为本发明的一种优选的技术方案,还包括矫正模块、且矫正模块用于对文字进行矫正。
作为本发明的一种优选的技术方案,还包括文字切割算法、文字切割算法如下:
步骤一:对图片进行水平投影,找到每一行的上界限和下界限,进行行切割;
步骤二:对切割出来的每一行,进行垂直投影,找到每一个字符的左右边界,进行单个字符的切割。
作为本发明的一种优选的技术方案,还包括降噪模块、且降噪模块用于减少图片分析中的干扰因素。
作为本发明的一种优选的技术方案,还包括提取模块、且提取模块用于图片中文字的提取。
作为本发明的一种优选的技术方案,还包括存储模块、且存储模块用于数据的加密存储。
与现有技术相比,本发明的有益效果是:
(1)通过一系列的图像处理可以将图像中的文字按照位置格式分块,再将每一块分割成单列(行)文字,最后逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置;
(2)通过降噪模块减少图片分析中的干扰因素,提高图片文字识别的效率;通过提取模块提高文字识别的准确率和效率。
附图说明
图1为本发明的图片文字分割方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
请参阅图1,本发明提供一种技术方案:一种图片文字切割系统,包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:
前处理模块用于定位图像中的非文字部分(即图片),将其剔除;
预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;
分块模块用于形态学腐蚀提取图像中的框线,根据框线提取文字块的轮廓,通过轮廓提取每个文字块;
分列(行)模块用于形态学膨胀让列(行)之间的分隔更明显,再通过垂直投影法提取列(行)分割点,根据分割点信息分割出每一列(行)元素;
分字模块用于使用垂直投影法对每列(行)之中的元素定位,按照定位点分割出每个字,对于分割出的字横向和纵向分别统计垂直投影,定位字的有效部分,剔除多余的空白部分;对提取出的字进行尺寸匹配,符合匹配结果的字输出为单个字图像,并定位其所在位置,不符合尺寸匹配的再进入一次垂直投影,提取出符合尺寸匹配的字;
接口封装模块用于将程序封装成API接口,方便调用。
本实施例中,优选的,图片文字分割方法如下:
步骤一:通过一系列的图像处理将图像中的文字按照位置格式分块;
步骤二:再将每一块分割成单列(行)文字;
步骤三:逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置。
本实施例中,优选的,还包括降噪模块、且降噪模块用于减少图片分析中的干扰因素,提高图片文字识别的效率。
本实施例中,优选的,还包括提取模块、且提取模块用于图片中文字的提取,提高文字识别的准确率和效率。
实施例2
请参阅图1,本发明提供一种技术方案:一种图片文字切割系统,包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:
前处理模块用于定位图像中的非文字部分(即图片),将其剔除;
预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;
分块模块用于形态学腐蚀提取图像中的框线,根据框线提取文字块的轮廓,通过轮廓提取每个文字块;
分列(行)模块用于形态学膨胀让列(行)之间的分隔更明显,再通过垂直投影法提取列(行)分割点,根据分割点信息分割出每一列(行)元素;
分字模块用于使用垂直投影法对每列(行)之中的元素定位,按照定位点分割出每个字,对于分割出的字横向和纵向分别统计垂直投影,定位字的有效部分,剔除多余的空白部分;对提取出的字进行尺寸匹配,符合匹配结果的字输出为单个字图像,并定位其所在位置,不符合尺寸匹配的再进入一次垂直投影,提取出符合尺寸匹配的字;
接口封装模块用于将程序封装成API接口,方便调用。
本实施例中,优选的,图片文字分割方法如下:
步骤一:通过一系列的图像处理将图像中的文字按照位置格式分块;
步骤二:再将每一块分割成单列(行)文字;
步骤三:逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置。
本实施例中,优选的,还包括矫正模块、且矫正模块用于对文字进行矫正。
本实施例中,优选的,还包括降噪模块、且降噪模块用于减少图片分析中的干扰因素,提高图片文字识别的效率。
实施例3
请参阅图1,本发明提供一种技术方案:一种图片文字切割系统,包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:
前处理模块用于定位图像中的非文字部分(即图片),将其剔除;
预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;
分块模块用于形态学腐蚀提取图像中的框线,根据框线提取文字块的轮廓,通过轮廓提取每个文字块;
分列(行)模块用于形态学膨胀让列(行)之间的分隔更明显,再通过垂直投影法提取列(行)分割点,根据分割点信息分割出每一列(行)元素;
分字模块用于使用垂直投影法对每列(行)之中的元素定位,按照定位点分割出每个字,对于分割出的字横向和纵向分别统计垂直投影,定位字的有效部分,剔除多余的空白部分;对提取出的字进行尺寸匹配,符合匹配结果的字输出为单个字图像,并定位其所在位置,不符合尺寸匹配的再进入一次垂直投影,提取出符合尺寸匹配的字;
接口封装模块用于将程序封装成API接口,方便调用。
本实施例中,优选的,图片文字分割方法如下:
步骤一:通过一系列的图像处理将图像中的文字按照位置格式分块;
步骤二:再将每一块分割成单列(行)文字;
步骤三:逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置。
本实施例中,优选的,还包括矫正模块、且矫正模块用于对文字进行矫正。
本实施例中,优选的,还包括文字切割算法、文字切割算法如下:
步骤一:对图片进行水平投影,找到每一行的上界限和下界限,进行行切割;
步骤二:对切割出来的每一行,进行垂直投影,找到每一个字符的左右边界,进行单个字符的切割。
本实施例中,优选的,还包括降噪模块、且降噪模块用于减少图片分析中的干扰因素,提高图片文字识别的效率。
本实施例中,优选的,还包括提取模块、且提取模块用于图片中文字的提取,提高文字识别的准确率和效率。
本实施例中,优选的,还包括存储模块、且存储模块用于数据的加密存储。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (7)

1.一种图片文字切割系统,其特征在于:包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:
前处理模块用于定位图像中的非文字部分(即图片),将其剔除;
预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;
分块模块用于形态学腐蚀提取图像中的框线,根据框线提取文字块的轮廓,通过轮廓提取每个文字块;
分列(行)模块用于形态学膨胀让列(行)之间的分隔更明显,再通过垂直投影法提取列(行)分割点,根据分割点信息分割出每一列(行)元素;
分字模块用于使用垂直投影法对每列(行)之中的元素定位,按照定位点分割出每个字,对于分割出的字横向和纵向分别统计垂直投影,定位字的有效部分,剔除多余的空白部分;对提取出的字进行尺寸匹配,符合匹配结果的字输出为单个字图像,并定位其所在位置,不符合尺寸匹配的再进入一次垂直投影,提取出符合尺寸匹配的字;
接口封装模块用于将程序封装成API接口。
2.根据权利要求1所述的一种图片文字切割系统,其特征在于:图片文字分割方法如下:
步骤一:通过一系列的图像处理将图像中的文字按照位置格式分块;
步骤二:再将每一块分割成单列(行)文字;
步骤三:逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置。
3.根据权利要求1所述的一种图片文字切割系统,其特征在于:还包括矫正模块、且矫正模块用于对文字进行矫正。
4.根据权利要求1所述的一种图片文字切割系统,其特征在于:还包括文字切割算法、且文字切割算法如下:
步骤一:对图片进行水平投影,找到每一行的上界限和下界限,进行行切割;
步骤二:对切割出来的每一行,进行垂直投影,找到每一个字符的左右边界,进行单个字符的切割。
5.根据权利要求1所述的一种图片文字切割系统,其特征在于:还包括降噪模块、且降噪模块用于减少图片分析中的干扰因素。
6.根据权利要求1所述的一种图片文字切割系统,其特征在于:还包括提取模块、且提取模块用于图片中文字的提取。
7.根据权利要求1所述的一种图片文字切割系统,其特征在于:还包括存储模块、且存储模块用于数据的加密存储。
CN202110018432.5A 2021-01-07 2021-01-07 一种图片文字切割系统 Pending CN112699890A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110018432.5A CN112699890A (zh) 2021-01-07 2021-01-07 一种图片文字切割系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110018432.5A CN112699890A (zh) 2021-01-07 2021-01-07 一种图片文字切割系统

Publications (1)

Publication Number Publication Date
CN112699890A true CN112699890A (zh) 2021-04-23

Family

ID=75515027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110018432.5A Pending CN112699890A (zh) 2021-01-07 2021-01-07 一种图片文字切割系统

Country Status (1)

Country Link
CN (1) CN112699890A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446898A (zh) * 2016-09-14 2017-02-22 宇龙计算机通信科技(深圳)有限公司 一种图像中文字信息的提取方法及装置
CN106650736A (zh) * 2016-09-28 2017-05-10 浪潮软件集团有限公司 一种基于深度学习的汉字识别系统的实现方法
WO2018086233A1 (zh) * 2016-11-08 2018-05-17 广州视源电子科技股份有限公司 一种字符分割方法和装置、及元件检测方法和装置
CN110163212A (zh) * 2019-04-08 2019-08-23 天津大学 一种碑帖图像中的文字切割方法
CN110705488A (zh) * 2019-10-09 2020-01-17 广州医药信息科技有限公司 图像文字识别方法
CN110766017A (zh) * 2019-10-22 2020-02-07 国网新疆电力有限公司信息通信公司 基于深度学习的移动终端文字识别方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446898A (zh) * 2016-09-14 2017-02-22 宇龙计算机通信科技(深圳)有限公司 一种图像中文字信息的提取方法及装置
CN106650736A (zh) * 2016-09-28 2017-05-10 浪潮软件集团有限公司 一种基于深度学习的汉字识别系统的实现方法
WO2018086233A1 (zh) * 2016-11-08 2018-05-17 广州视源电子科技股份有限公司 一种字符分割方法和装置、及元件检测方法和装置
CN110163212A (zh) * 2019-04-08 2019-08-23 天津大学 一种碑帖图像中的文字切割方法
CN110705488A (zh) * 2019-10-09 2020-01-17 广州医药信息科技有限公司 图像文字识别方法
CN110766017A (zh) * 2019-10-22 2020-02-07 国网新疆电力有限公司信息通信公司 基于深度学习的移动终端文字识别方法及系统

Similar Documents

Publication Publication Date Title
CN111401371B (zh) 一种文本检测识别方法、系统及计算机设备
CN110363095B (zh) 一种针对表格字体的识别方法
CN110008809B (zh) 表格数据的获取方法、装置和服务器
CN110032998B (zh) 自然场景图片的文字检测方法、系统、装置和存储介质
US9268999B2 (en) Table recognizing method and table recognizing system
Ma et al. Joint layout analysis, character detection and recognition for historical document digitization
KR20170137170A (ko) 텍스트 이미지 처리 방법 및 장치
US11341322B2 (en) Table detection in spreadsheet
CN113780276B (zh) 一种结合文本分类的文本识别方法及系统
CN112085022B (zh) 一种用于识别文字的方法、系统及设备
CN102663378A (zh) 连笔手写字符的识别方法
CN111507330A (zh) 习题识别方法、装置、电子设备及存储介质
CN104992152A (zh) 一种基于模板字符库的字符识别方法及字符识别系统
CN111680690A (zh) 一种文字识别方法及装置
CN110738030A (zh) 表格重建方法、装置、电子设备及存储介质
WO2024041032A1 (zh) 基于不可编辑的图文类图像生成可编辑文档的方法及装置
CN114220091A (zh) 基于Faster Rcnn的图像文本检测方法及系统
CN112699890A (zh) 一种图片文字切割系统
CN111651971A (zh) 一种表格信息转录方法、系统、电子设备和存储介质
CN116597466A (zh) 一种基于改进YOLOv5s的工程图纸文字检测识别方法及系统
CN114332888B (zh) 一种东巴文的文字切分方法、装置、存储介质及电子设备
CN111488870A (zh) 文字识别方法和文字识别装置
CN111079756B (zh) 一种单据图像中的表格提取与重建方法和设备
CN114038000A (zh) 一种图像表格的结构化方法、系统和电子设备
CN114511863A (zh) 表格结构提取方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination