CN103400127A - 图片文字识别方法 - Google Patents

图片文字识别方法 Download PDF

Info

Publication number
CN103400127A
CN103400127A CN2013103348356A CN201310334835A CN103400127A CN 103400127 A CN103400127 A CN 103400127A CN 2013103348356 A CN2013103348356 A CN 2013103348356A CN 201310334835 A CN201310334835 A CN 201310334835A CN 103400127 A CN103400127 A CN 103400127A
Authority
CN
China
Prior art keywords
word
text
pel
matrix
type matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013103348356A
Other languages
English (en)
Inventor
江训德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SUZHOU DINGFU SOFTWARE TECHNOLOGY Co Ltd
Original Assignee
SUZHOU DINGFU SOFTWARE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUZHOU DINGFU SOFTWARE TECHNOLOGY Co Ltd filed Critical SUZHOU DINGFU SOFTWARE TECHNOLOGY Co Ltd
Priority to CN2013103348356A priority Critical patent/CN103400127A/zh
Publication of CN103400127A publication Critical patent/CN103400127A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明提供一种图片文字识别方法,该图片文字识别方法如下:将用户框选的图片上的文本区域以当前图片形式读取;对框选文本区域中的各个图元文字分别进行选取;将框选文本区域中的第一个图元文字与各种常规字体对应的字模库中的各个字模文字作对比,找到相似度最近的字模文字;并记录该相似度最高的字模文字所在的字模库,定义为标准字模库,此后,将所述框选文本区域中第一个图元文字后面的各图元文字只与所述标准字模库中的各字模文字作比较,在标准字模库中分别找到相似度最高的字模文字,并以可编辑文字的形式输出。该方法可以准确而高效地识别图片中的文字信息。

Description

图片文字识别方法
 
技术领域
本发明涉及图文软件领域,特别地,是一种图片文字识别方法。
 
背景技术
对于图片上的文字,在较多情况下需要进行大段地复制使用,因此,必须要首先通过软件方法先将图片形式的文字转换成可编辑文字;在此过程中,目前使用的方法是,采用一套字模库,将图片中截取的每一个图元文字与字模库中的各个字模文字进行对比,并将相似度最高的字模文字以可编辑文字的形式输出,从而使用户获得所需的可编辑文本。
然而,由于各种图片形式的文本通常采用不同的字体,而目前在将图元文字与字模文字相对比时,通常只采用一套字模库,因此,倘若图元文字的字体与字模库中的字体不同时,则文字识别的准确性并不高;若采用多套字模库,则按一套字模库的逐字对比的方式,每个图元文字将需要与多套字模库中的各字模文字相对比,其工作量十分巨大。
 
发明内容
针对上述问题,本发明的目的在于提供一种图片文字识别方法,该方法可以准确而高效地识别图片中的文字信息。
本发明解决其技术问题所采用的技术方案是:该图片文字识别方法如下:将用户框选的图片上的文本区域以当前图片形式读取;对框选文本区域中的各个图元文字分别进行选取;将框选文本区域中的第一个图元文字与各种常规字体对应的字模库中的各个字模文字作对比,找到相似度最近的字模文字;并记录该相似度最高的字模文字所在的字模库,定义为标准字模库,此后,将所述框选文本区域中第一个图元文字后面的各图元文字只与所述标准字模库中的各字模文字作比较,在标准字模库中分别找到相似度最高的字模文字,并以可编辑文字的形式输出。
作为优选,所述常规字体对应的字模库包括宋体、仿宋、黑体、楷体、 行楷、隶书对应的字模库。
作为优选,在分别选取所述框选文本区域中的各个图元文字时,采用矩形框的形式,所述矩形框的框线与各图元文字的最上端、最左端、最下端、最右端相切。
作为优选,在将图元文字与字模文字作对比时,首先将字模文字进行缩放,使之与欲作对比的图元文字大小相同,然后,将缩放好的字模文字转换成字模图元,与所述图元文字作布尔差运算,然后以布尔差之后剩下的文字颜色的多少来衡量相似度,即剩下的文字颜色越少,则相似度越高。
本发明的有益效果在于:在将图元文字与字模文字作对比时,由于采用了多种字模库,因此,使得识别的准确性得到了很大程度的提高,而由于本方法在对于所述框选文本区域中的第一个图元文字作对比的过程中,就可以确定框选文本区域中的第一个图元文字的字体,从而推出该框选文本区域中所有图元文字的字体,这就可以使得后面的图元文字仅与一种字模库中的字模文字进行对比,不仅对比工作量小,且不失准确性。
   
具体实施方式
下面对本发明进一步说明:
本发明提供的图片文字识别方法如下:将用户框选的图片上的文本区域以当前图片形式读取,如,当前图片为jpg格式的,那么用户在当前图片上框选部分文本后,将用户框选的文本区域视为一张待处理的jpg图片;然后,对待处理的jpg图片中的各个图元文字分别进行选取,选取时,采用矩形框的形式,以从上至下、从左到右的顺序逐个选取图元文字,所述矩形框的框线与各图元文字的最上端、最左端、最下端、最右端相切;当选取所述框选文本区域中的第一个图元文字后,将其与各种常规字体对应的字模库中的各个字模文字作对比,找到相似度最近的字模文字,将该字模文字以可编辑文字形式输出,同时,记录该相似度最高的字模文字所在的字模库,定义为标准字模库;此后,将所述框选文本区域中第一个图元文字后面的各图元文字只与所述标准字模库中的各字模文字作比较,在标准字模库中分别找到相似度最高的字模文字,并以可编辑文字的形式输出。
为了满足绝大部分图元文字的字体需求,所述常规字体对应的字模库包括宋体、仿宋、黑体、楷体、 行楷、隶书对应的字模库。
另外,在将图元文字与字模文字作对比时,首先将字模文字进行缩放,使之与欲作对比的图元文字大小相同,然后,将缩放好的字模文字转换成字模图元,与所述图元文字作布尔差运算,然后以布尔差之后剩下的文字颜色的多少来衡量相似度,即剩下的文字颜色越少,则相似度越高;如,通常情况下,文字颜色为黑色,则将所述字模图元与图元文字作布尔差运算后,它们相重合部分的黑色被消除了,由背景色替代,那么如果字模图元和图元文字完全一样,则布尔差运算之后,则黑色的剩余量为零,而相似度越低,则黑色的剩余量就越大。
本发明提供的图片文字识别方法在将图元文字与字模文字作对比时,由于采用了多种字模库,因此,使得识别的准确性得到了很大程度的提高,而由于本方法在对于所述框选文本区域中的第一个图元文字作对比的过程中,就可以确定框选文本区域中的第一个图元文字的字体,从而推出该框选文本区域中所有图元文字的字体,这就可以使得后面的图元文字仅与一种字模库中的字模文字进行对比,不仅对比工作量小,且不失准确性。

Claims (4)

1.一种图片文字识别方法,其特征在于:该图片文字识别方法如下:将用户框选的图片上的文本区域以当前图片形式读取;对框选文本区域中的各个图元文字分别进行选取;将框选文本区域中的第一个图元文字与各种常规字体对应的字模库中的各个字模文字作对比,找到相似度最近的字模文字;并记录该相似度最高的字模文字所在的字模库,定义为标准字模库,此后,将所述框选文本区域中第一个图元文字后面的各图元文字只与所述标准字模库中的各字模文字作比较,在标准字模库中分别找到相似度最高的字模文字,并以可编辑文字的形式输出。
2.根据权利要求1所述的图片文字识别方法,其特征在于:所述常规字体对应的字模库包括宋体、仿宋、黑体、楷体、 行楷、隶书对应的字模库。
3.根据权利要求1所述的图片文字识别方法,其特征在于:在分别选取所述框选文本区域中的各个图元文字时,采用矩形框的形式,所述矩形框的框线与各图元文字的最上端、最左端、最下端、最右端相切。
4.根据权利要求1所述的图片文字识别方法,其特征在于:在将图元文字与字模文字作对比时,首先将字模文字进行缩放,使之与欲作对比的图元文字大小相同,然后,将缩放好的字模文字转换成字模图元,与所述图元文字作布尔差运算,然后以布尔差之后剩下的文字颜色的多少来衡量相似度,即剩下的文字颜色越少,则相似度越高。
CN2013103348356A 2013-08-05 2013-08-05 图片文字识别方法 Pending CN103400127A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013103348356A CN103400127A (zh) 2013-08-05 2013-08-05 图片文字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013103348356A CN103400127A (zh) 2013-08-05 2013-08-05 图片文字识别方法

Publications (1)

Publication Number Publication Date
CN103400127A true CN103400127A (zh) 2013-11-20

Family

ID=49563745

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013103348356A Pending CN103400127A (zh) 2013-08-05 2013-08-05 图片文字识别方法

Country Status (1)

Country Link
CN (1) CN103400127A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550233A (zh) * 2015-12-04 2016-05-04 广东欧珀移动通信有限公司 一种从照片中提取文字的方法及装置
CN106599937A (zh) * 2016-12-29 2017-04-26 池州职业技术学院 一种不良图片过滤装置
CN106778727A (zh) * 2016-12-16 2017-05-31 高格(天津)信息科技发展有限公司 图片文字识别方法
CN107291342A (zh) * 2017-05-03 2017-10-24 广东小天才科技有限公司 一种点读数据的勾勒方法及装置
CN108241594A (zh) * 2016-12-26 2018-07-03 卡西欧计算机株式会社 文字编辑方法、电子设备以及记录介质
CN109753967A (zh) * 2018-12-29 2019-05-14 北京师范大学 一种图片文字识别方法
CN111144114A (zh) * 2019-12-19 2020-05-12 广联达科技股份有限公司 一种文本识别方法及装置
CN111461205A (zh) * 2020-03-30 2020-07-28 拉扎斯网络科技(上海)有限公司 图像处理方法、装置、电子设备和计算机可读存储介质
CN112052647A (zh) * 2019-06-05 2020-12-08 珠海金山办公软件有限公司 一种文档编辑方法、装置、电子设备和可读存储介质
CN113536771A (zh) * 2021-09-17 2021-10-22 深圳前海环融联易信息科技服务有限公司 基于文本识别的要素信息提取方法、装置、设备及介质
CN116049461A (zh) * 2023-03-29 2023-05-02 北京思想天下教育科技有限公司 一种基于大数据云平台的题目转化系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1916942A (zh) * 2005-08-18 2007-02-21 北大方正集团有限公司 一种基于字体预测的字符识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1916942A (zh) * 2005-08-18 2007-02-21 北大方正集团有限公司 一种基于字体预测的字符识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘维平: "中文印刷体文档内容识别系统研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, 15 May 2008 (2008-05-15) *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550233A (zh) * 2015-12-04 2016-05-04 广东欧珀移动通信有限公司 一种从照片中提取文字的方法及装置
CN106778727A (zh) * 2016-12-16 2017-05-31 高格(天津)信息科技发展有限公司 图片文字识别方法
CN108241594B (zh) * 2016-12-26 2022-05-03 卡西欧计算机株式会社 文字编辑方法、电子设备以及记录介质
CN108241594A (zh) * 2016-12-26 2018-07-03 卡西欧计算机株式会社 文字编辑方法、电子设备以及记录介质
CN106599937A (zh) * 2016-12-29 2017-04-26 池州职业技术学院 一种不良图片过滤装置
CN107291342B (zh) * 2017-05-03 2020-01-31 广东小天才科技有限公司 一种点读数据的复制勾勒方法及装置
CN107291342A (zh) * 2017-05-03 2017-10-24 广东小天才科技有限公司 一种点读数据的勾勒方法及装置
CN109753967A (zh) * 2018-12-29 2019-05-14 北京师范大学 一种图片文字识别方法
CN112052647A (zh) * 2019-06-05 2020-12-08 珠海金山办公软件有限公司 一种文档编辑方法、装置、电子设备和可读存储介质
CN111144114A (zh) * 2019-12-19 2020-05-12 广联达科技股份有限公司 一种文本识别方法及装置
CN111144114B (zh) * 2019-12-19 2023-07-18 广联达科技股份有限公司 一种文本识别方法及装置
CN111461205A (zh) * 2020-03-30 2020-07-28 拉扎斯网络科技(上海)有限公司 图像处理方法、装置、电子设备和计算机可读存储介质
CN113536771A (zh) * 2021-09-17 2021-10-22 深圳前海环融联易信息科技服务有限公司 基于文本识别的要素信息提取方法、装置、设备及介质
CN113536771B (zh) * 2021-09-17 2021-12-24 深圳前海环融联易信息科技服务有限公司 基于文本识别的要素信息提取方法、装置、设备及介质
CN116049461A (zh) * 2023-03-29 2023-05-02 北京思想天下教育科技有限公司 一种基于大数据云平台的题目转化系统
CN116049461B (zh) * 2023-03-29 2023-05-30 北京思想天下教育科技有限公司 一种基于大数据云平台的题目转化系统

Similar Documents

Publication Publication Date Title
CN103400127A (zh) 图片文字识别方法
US10489682B1 (en) Optical character recognition employing deep learning with machine generated training data
TWI663553B (zh) 合約生成方法和裝置
CN105447174B (zh) 一种报表生成方法及装置
US11507727B2 (en) Font rendering method and apparatus, and computer-readable storage medium
CN104281830B (zh) 二维码的识别方法及装置
CN114005123B (zh) 一种印刷体文本版面数字化重建系统及方法
CN109492635A (zh) 获取标注数据的方法、装置、设备及存储介质
US8386943B2 (en) Method for query based on layout information
CN105654022A (zh) 一种提取文档结构化信息的方法及装置
CN104636322A (zh) 一种文本复制的方法及装置
CN114972847A (zh) 图像处理方法及装置
CN103488441B (zh) 一种阿拉伯语在pos机上打印的实现方法
CN109726369B (zh) 一种基于标准文献的智能模板化题录技术实现方法
CN106327453A (zh) 一种拼合图片资源的方法及图片资源拼合装置
CN114296660A (zh) 一种基于Vue框架的标签打印方法
US20130329263A1 (en) Image processing apparatus, and image processing method and program therefor
CN117688921A (zh) 一种对于自动生成的ppt如何统一格式及个性化数据设置的方法
CN110119503B (zh) 一种基于Excel的规划项目多类数据报表与格式编辑方法
CN116110065A (zh) 题卡数据生成方法、装置、计算机设备和存储介质
CN103488619B (zh) 一种用于进行文档文件处理的方法及装置
CN106598934B (zh) 电子书数据的显示方法、装置及终端设备
CN106778727A (zh) 图片文字识别方法
CN112818655B (zh) 一种基于模板和文件追加写的excel数据处理方法和工具
CN107122778B (zh) 一种单字区域的合并方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20131120