CN108229460A - 一种水印图像ocr识别方法及其系统 - Google Patents

一种水印图像ocr识别方法及其系统 Download PDF

Info

Publication number
CN108229460A
CN108229460A CN201810025351.6A CN201810025351A CN108229460A CN 108229460 A CN108229460 A CN 108229460A CN 201810025351 A CN201810025351 A CN 201810025351A CN 108229460 A CN108229460 A CN 108229460A
Authority
CN
China
Prior art keywords
watermark identifier
region
image
ocr
conversion treatment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810025351.6A
Other languages
English (en)
Inventor
欧阳永中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan University
Original Assignee
Foshan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan University filed Critical Foshan University
Priority to CN201810025351.6A priority Critical patent/CN108229460A/zh
Publication of CN108229460A publication Critical patent/CN108229460A/zh
Priority to PCT/CN2018/124643 priority patent/WO2019137238A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0062Embedding of the watermark in text images, e.g. watermarking text documents using letter skew, letter distance or row distance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种水印图像OCR识别方法及其系统,包括以下步骤,对图像进行坐标矫正;获取图像的水印标识;标定水印标识部分区域对应坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对含水印标识部分的区域进行灰度处理;对含水印标识部分的区域进行USM锐化处理;对含水印标识部分的区域进行二值化处理;将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上;执行OCR识别。本发明通过将水印部分的图案提出进行灰度、锐化、二值化处理后合并到原图中统一进行OCR识别,由于仅仅对水印部分区域的图像进行处理,不会因为统一处理导致整体图像识别困难,凸显出水印部分的文字,能有效提高对水印部分文字的识别准确性。

Description

一种水印图像OCR识别方法及其系统
技术领域
本发明涉及图像识别领域,特别是一种水印OCR识别方法及其系统。
背景技术
带水印的图片,就是在文字的上面添加上一层半透明的图像,这层图像不会影响读者对于文字的阅读。OCR文字识别,指利用OCR(Optical Character Recognition,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本的软件。软件可以把图片转换成可以编辑的文字。支持JPG、PNG、GIF、BMP、DOC等图片格式。但是目前的OCR识别方法均不能识别出带有水印图片上面的文字。
发明内容
为解决上述问题,本发明的目的在于提供一种能够识别出包括水印图像上文字的一种水印OCR识别方法及其系统。
本发明解决其问题所采用的技术方案是:
一种水印图像OCR识别方法,包括以下步骤:
对图像进行坐标矫正,建立坐标模型;
获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
标定水印标识部分区域对应坐标;
提取包含水印标识部分的区域;
图片去除含有水印标识部分的区域;
对含水印标识部分的区域进行灰度处理;
对含水印标识部分的区域进行USM锐化处理;对含水印标识部分的区域进行二值化处理;
将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;
对待处理图像执行OCR识别。
进一步,所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。
进一步,所述二值化处理包括以下步骤:
横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;
纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;
二值化的阈值为(sum1+sum2)/(p1+P2),若当前像素灰度大于等于阈值,则输出黑色像素块,若当前像素灰度小于阈值,则输出白色像素块。
进一步,对OCR识别的文字进行自动矫正处理,包括以下步骤:
调用并运行word拼写检测与纠正插件;
输出OCR识别后的文字,进行自动纠正;
输出自动纠正后的文字。
一种水印图像OCR识别系统,包括:
纠正装置,对图像进行坐标矫正,建立坐标模型;
水印获取装置,获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
坐标记录装置,标定水印标识部分区域对应坐标;
提取水印装置,提取包含水印标识部分的区域;
去除水印装置,图片去除含有水印标识部分的区域;
灰度处理装置,对含水印标识部分的区域进行灰度处理;
锐化处理装置,对含水印标识部分的区域进行USM锐化处理;
二值化处理装置,对含水印标识部分的区域进行二值化处理;
合并图像装置,将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;
OCR识别装置,对待处理图像执行OCR识别。
本发明的有益效果是:本发明采用的一种水印图像OCR识别方法及其系统,包括以下步骤,对图像进行坐标矫正,建立坐标模型;获取图像的水印标识,在图像上标出包含有水印标识部分的区域;标定水印标识部分区域对应坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对含水印标识部分的区域进行灰度处理;对含水印标识部分的区域进行USM锐化处理;对含水印标识部分的区域进行二值化处理;将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;对待处理图像执行OCR识别。本发明通过将水印部分的图案提出进行灰度、锐化、二值化处理后合并到原图中统一进行OCR识别,由于仅仅对水印部分区域的图像进行处理,不会因为统一处理导致整体图像识别困难,凸显出水印部分的文字,能有效提高对水印部分文字的识别准确性。
附图说明
下面结合附图和实例对本发明作进一步说明。
图1是本发明的方法流程图。
具体实施方式
参照图1,本发明的一种水印图像OCR识别方法,包括以下步骤:
对图像进行坐标矫正,建立坐标模型;
获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
标定水印标识部分区域对应坐标;
提取包含水印标识部分的区域;
图片去除含有水印标识部分的区域;
对含水印标识部分的区域进行灰度处理;
对含水印标识部分的区域进行USM锐化处理;由于水印是半透明地覆盖在文字资料上,使得水印下文字的边缘变得模糊且难以辨认,因此要对图片锐化,这样会突出图片中的文字,有利于实现图片中文字与水印。
对含水印标识部分的区域进行二值化处理;
将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;
对待处理图像执行OCR识别。
进一步,所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。这样得出来的图片就像黑白照片一样,这样就可以降低后面步骤的运算量,并且使得图片更加易于辨认。
具体地,所述二值化处理包括以下步骤:
横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;
纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;
二值化的阈值为(sum1+sum2)/(p1+P2),若当前像素灰度大于等于阈值,则输出黑色像素块,若当前像素灰度小于阈值,则输出白色像素块。
进一步,对OCR识别的文字进行自动矫正处理,包括以下步骤:
调用并运行word拼写检测与纠正插件;
输出OCR识别后的文字,进行自动纠正;
输出自动纠正后的文字。
本发明
一种水印图像OCR识别系统,包括:
纠正装置,对图像进行坐标矫正,建立坐标模型;
水印获取装置,获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
坐标记录装置,标定水印标识部分区域对应坐标;
提取水印装置,提取包含水印标识部分的区域;
去除水印装置,图片去除含有水印标识部分的区域;
灰度处理装置,对含水印标识部分的区域进行灰度处理;
锐化处理装置,对含水印标识部分的区域进行USM锐化处理;
二值化处理装置,对含水印标识部分的区域进行二值化处理;
合并图像装置,将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;
OCR识别装置,对待处理图像执行OCR识别。
一种水印图像OCR识别方法及其系统,通过将水印部分的图案提出进行灰度、锐化、二值化处理后合并到原图中统一进行OCR识别,由于仅仅对水印部分区域的图像进行处理,不会因为统一处理导致整体图像识别困难,凸显出水印部分的文字,能有效提高对水印部分文字的识别准确性。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。

Claims (5)

1.一种水印图像OCR识别方法,其特征在于,包括以下步骤:
对图像进行坐标矫正,建立坐标模型;
获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
标定水印标识部分区域对应坐标;
提取包含水印标识部分的区域;
图片去除含有水印标识部分的区域;
对含水印标识部分的区域进行灰度处理;
对含水印标识部分的区域进行USM锐化处理;
对含水印标识部分的区域进行二值化处理;
将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;
对待处理图像执行OCR识别。
2.根据权利要求1所述的一种水印图像OCR识别方法,其特征在于:
所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。
3.根据权利要求2所述的一种水印图像OCR识别方法,其特征在于:
所述二值化处理包括以下步骤:
横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;
纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;
二值化的阈值为(sum1+sum2)/(p1+P2),若当前像素灰度大于等于阈值,则输出黑色像素块,若当前像素灰度小于阈值,则输出白色像素块。
4.根据权利要求1所述的一种水印图像OCR识别方法,其特征在于:
对OCR识别的文字进行自动矫正处理,包括以下步骤:
调用并运行word拼写检测与纠正插件;
输出OCR识别后的文字,进行自动纠正;
输出自动纠正后的文字。
5.一种水印图像OCR识别系统,其特征在于,包括:
纠正装置,对图像进行坐标矫正,建立坐标模型;
水印获取装置,获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
坐标记录装置,标定水印标识部分区域对应坐标;
提取水印装置,提取包含水印标识部分的区域;
去除水印装置,图片去除含有水印标识部分的区域;
灰度处理装置,对含水印标识部分的区域进行灰度处理;
锐化处理装置,对含水印标识部分的区域进行USM锐化处理;
二值化处理装置,对含水印标识部分的区域进行二值化处理;
合并图像装置,将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;
OCR识别装置,对待处理图像执行OCR识别。
CN201810025351.6A 2018-01-09 2018-01-09 一种水印图像ocr识别方法及其系统 Pending CN108229460A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810025351.6A CN108229460A (zh) 2018-01-09 2018-01-09 一种水印图像ocr识别方法及其系统
PCT/CN2018/124643 WO2019137238A1 (zh) 2018-01-09 2018-12-28 一种水印图像ocr识别方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810025351.6A CN108229460A (zh) 2018-01-09 2018-01-09 一种水印图像ocr识别方法及其系统

Publications (1)

Publication Number Publication Date
CN108229460A true CN108229460A (zh) 2018-06-29

Family

ID=62640818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810025351.6A Pending CN108229460A (zh) 2018-01-09 2018-01-09 一种水印图像ocr识别方法及其系统

Country Status (2)

Country Link
CN (1) CN108229460A (zh)
WO (1) WO2019137238A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019137238A1 (zh) * 2018-01-09 2019-07-18 佛山科学技术学院 一种水印图像ocr识别方法及其系统
CN111127593A (zh) * 2018-10-30 2020-05-08 珠海金山办公软件有限公司 一种文档内容擦除方法、装置、电子设备及可读存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111539406B (zh) * 2020-04-21 2023-04-18 招商局金融科技有限公司 证件复印件信息识别方法、服务器及存储介质
CN111583156B (zh) * 2020-05-13 2023-06-23 中国科学院自动化研究所 文档图像底纹去除方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101465932A (zh) * 2007-12-20 2009-06-24 佳能株式会社 图像处理设备及其控制方法
CN101540815A (zh) * 2008-03-19 2009-09-23 佳能株式会社 信息处理装置、图像处理装置、图像处理系统及图像处理方法
CN101908241A (zh) * 2010-08-03 2010-12-08 广州广电运通金融电子股份有限公司 有价文件识别方法及其识别系统
EP2974260A1 (fr) * 2013-03-15 2016-01-20 Send Only Oked Documents (SOOD) Procèdé de tatouage de la partie textuelle d'un document
CN107247915A (zh) * 2016-08-02 2017-10-13 浙江远望信息股份有限公司 一种敏感图片文件的智能识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101364300A (zh) * 2008-05-30 2009-02-11 西安电子科技大学 基于灰色理论的数字水印方法
CN102682457A (zh) * 2012-05-17 2012-09-19 南开大学 一种对平面媒体图像进行适应屏幕阅读的重排方法
CN108229460A (zh) * 2018-01-09 2018-06-29 佛山科学技术学院 一种水印图像ocr识别方法及其系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101465932A (zh) * 2007-12-20 2009-06-24 佳能株式会社 图像处理设备及其控制方法
CN101540815A (zh) * 2008-03-19 2009-09-23 佳能株式会社 信息处理装置、图像处理装置、图像处理系统及图像处理方法
CN101908241A (zh) * 2010-08-03 2010-12-08 广州广电运通金融电子股份有限公司 有价文件识别方法及其识别系统
EP2974260A1 (fr) * 2013-03-15 2016-01-20 Send Only Oked Documents (SOOD) Procèdé de tatouage de la partie textuelle d'un document
CN107247915A (zh) * 2016-08-02 2017-10-13 浙江远望信息股份有限公司 一种敏感图片文件的智能识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
骆剑峰等: "《改进水印图片里文字识别效果的新方法》", 《信息化纵横》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019137238A1 (zh) * 2018-01-09 2019-07-18 佛山科学技术学院 一种水印图像ocr识别方法及其系统
CN111127593A (zh) * 2018-10-30 2020-05-08 珠海金山办公软件有限公司 一种文档内容擦除方法、装置、电子设备及可读存储介质
CN111127593B (zh) * 2018-10-30 2023-10-31 珠海金山办公软件有限公司 一种文档内容擦除方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
WO2019137238A1 (zh) 2019-07-18

Similar Documents

Publication Publication Date Title
CN108229460A (zh) 一种水印图像ocr识别方法及其系统
CN108319945A (zh) 一种分离式ocr识别方法及其系统
US8971620B2 (en) Detecting a label from an image
JP4261005B2 (ja) 領域ベースのイメージ2値化システム
US20060245650A1 (en) Precise grayscale character segmentation apparatus and method
CN107945194A (zh) 基于OpenCV技术的票据分割方法
CN114283156B (zh) 一种用于去除文档图像颜色及手写笔迹的方法及装置
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
KR101058726B1 (ko) 조명 성분을 제거하기 위한 이미지 보정 장치 및 방법
CN112686265B (zh) 一种基于层级轮廓提取的象形文字分割方法
CN116704523B (zh) 一种用于出版印刷设备的文字排版图像识别系统
CN103605982A (zh) 一种条烟32位条码采集系统及32位条码识别方法
CN115588202B (zh) 一种基于轮廓检测的电气设计图纸中文字提取方法及系统
CN106934411A (zh) 基于模板匹配的电子阅卷方法
WO2023280080A1 (zh) 阴影消除装置和方法、空盘识别装置和方法
CN113139535A (zh) 一种ocr文档识别方法
CN111445402B (zh) 一种图像去噪方法及装置
JP2004280334A (ja) 画像読み取り装置
CN111340040B (zh) 一种纸张字符识别方法、装置、电子设备及存储介质
CN117541546A (zh) 图像裁剪效果的确定方法和装置、存储介质及电子设备
CN112818983A (zh) 一种利用图片相识度判断字符倒置的方法
CN114267035A (zh) 一种文档图像处理方法、系统、电子设备及可读介质
CN113392833B (zh) 一种工业射线底片图像铅字编号识别方法
CN115619813A (zh) Sem图像前景提取方法、装置、计算机设备及存储介质
CN109934215B (zh) 一种身份证识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180629