CN108229460A - 一种水印图像ocr识别方法及其系统 - Google Patents
一种水印图像ocr识别方法及其系统 Download PDFInfo
- Publication number
- CN108229460A CN108229460A CN201810025351.6A CN201810025351A CN108229460A CN 108229460 A CN108229460 A CN 108229460A CN 201810025351 A CN201810025351 A CN 201810025351A CN 108229460 A CN108229460 A CN 108229460A
- Authority
- CN
- China
- Prior art keywords
- watermark identifier
- region
- image
- ocr
- conversion treatment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000006243 chemical reaction Methods 0.000 claims abstract description 24
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 230000001186 cumulative effect Effects 0.000 claims description 13
- 101100311460 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sum2 gene Proteins 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 3
- 238000012015 optical character recognition Methods 0.000 description 26
- 238000013507 mapping Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/225—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0062—Embedding of the watermark in text images, e.g. watermarking text documents using letter skew, letter distance or row distance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种水印图像OCR识别方法及其系统,包括以下步骤,对图像进行坐标矫正;获取图像的水印标识;标定水印标识部分区域对应坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对含水印标识部分的区域进行灰度处理;对含水印标识部分的区域进行USM锐化处理;对含水印标识部分的区域进行二值化处理;将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上;执行OCR识别。本发明通过将水印部分的图案提出进行灰度、锐化、二值化处理后合并到原图中统一进行OCR识别,由于仅仅对水印部分区域的图像进行处理,不会因为统一处理导致整体图像识别困难,凸显出水印部分的文字,能有效提高对水印部分文字的识别准确性。
Description
技术领域
本发明涉及图像识别领域,特别是一种水印OCR识别方法及其系统。
背景技术
带水印的图片,就是在文字的上面添加上一层半透明的图像,这层图像不会影响读者对于文字的阅读。OCR文字识别,指利用OCR(Optical Character Recognition,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本的软件。软件可以把图片转换成可以编辑的文字。支持JPG、PNG、GIF、BMP、DOC等图片格式。但是目前的OCR识别方法均不能识别出带有水印图片上面的文字。
发明内容
为解决上述问题,本发明的目的在于提供一种能够识别出包括水印图像上文字的一种水印OCR识别方法及其系统。
本发明解决其问题所采用的技术方案是:
一种水印图像OCR识别方法,包括以下步骤:
对图像进行坐标矫正,建立坐标模型;
获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
标定水印标识部分区域对应坐标;
提取包含水印标识部分的区域;
图片去除含有水印标识部分的区域;
对含水印标识部分的区域进行灰度处理;
对含水印标识部分的区域进行USM锐化处理;对含水印标识部分的区域进行二值化处理;
将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;
对待处理图像执行OCR识别。
进一步,所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。
进一步,所述二值化处理包括以下步骤:
横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;
纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;
二值化的阈值为(sum1+sum2)/(p1+P2),若当前像素灰度大于等于阈值,则输出黑色像素块,若当前像素灰度小于阈值,则输出白色像素块。
进一步,对OCR识别的文字进行自动矫正处理,包括以下步骤:
调用并运行word拼写检测与纠正插件;
输出OCR识别后的文字,进行自动纠正;
输出自动纠正后的文字。
一种水印图像OCR识别系统,包括:
纠正装置,对图像进行坐标矫正,建立坐标模型;
水印获取装置,获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
坐标记录装置,标定水印标识部分区域对应坐标;
提取水印装置,提取包含水印标识部分的区域;
去除水印装置,图片去除含有水印标识部分的区域;
灰度处理装置,对含水印标识部分的区域进行灰度处理;
锐化处理装置,对含水印标识部分的区域进行USM锐化处理;
二值化处理装置,对含水印标识部分的区域进行二值化处理;
合并图像装置,将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;
OCR识别装置,对待处理图像执行OCR识别。
本发明的有益效果是:本发明采用的一种水印图像OCR识别方法及其系统,包括以下步骤,对图像进行坐标矫正,建立坐标模型;获取图像的水印标识,在图像上标出包含有水印标识部分的区域;标定水印标识部分区域对应坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对含水印标识部分的区域进行灰度处理;对含水印标识部分的区域进行USM锐化处理;对含水印标识部分的区域进行二值化处理;将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;对待处理图像执行OCR识别。本发明通过将水印部分的图案提出进行灰度、锐化、二值化处理后合并到原图中统一进行OCR识别,由于仅仅对水印部分区域的图像进行处理,不会因为统一处理导致整体图像识别困难,凸显出水印部分的文字,能有效提高对水印部分文字的识别准确性。
附图说明
下面结合附图和实例对本发明作进一步说明。
图1是本发明的方法流程图。
具体实施方式
参照图1,本发明的一种水印图像OCR识别方法,包括以下步骤:
对图像进行坐标矫正,建立坐标模型;
获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
标定水印标识部分区域对应坐标;
提取包含水印标识部分的区域;
图片去除含有水印标识部分的区域;
对含水印标识部分的区域进行灰度处理;
对含水印标识部分的区域进行USM锐化处理;由于水印是半透明地覆盖在文字资料上,使得水印下文字的边缘变得模糊且难以辨认,因此要对图片锐化,这样会突出图片中的文字,有利于实现图片中文字与水印。
对含水印标识部分的区域进行二值化处理;
将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;
对待处理图像执行OCR识别。
进一步,所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。这样得出来的图片就像黑白照片一样,这样就可以降低后面步骤的运算量,并且使得图片更加易于辨认。
具体地,所述二值化处理包括以下步骤:
横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;
纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;
二值化的阈值为(sum1+sum2)/(p1+P2),若当前像素灰度大于等于阈值,则输出黑色像素块,若当前像素灰度小于阈值,则输出白色像素块。
进一步,对OCR识别的文字进行自动矫正处理,包括以下步骤:
调用并运行word拼写检测与纠正插件;
输出OCR识别后的文字,进行自动纠正;
输出自动纠正后的文字。
本发明
一种水印图像OCR识别系统,包括:
纠正装置,对图像进行坐标矫正,建立坐标模型;
水印获取装置,获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
坐标记录装置,标定水印标识部分区域对应坐标;
提取水印装置,提取包含水印标识部分的区域;
去除水印装置,图片去除含有水印标识部分的区域;
灰度处理装置,对含水印标识部分的区域进行灰度处理;
锐化处理装置,对含水印标识部分的区域进行USM锐化处理;
二值化处理装置,对含水印标识部分的区域进行二值化处理;
合并图像装置,将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;
OCR识别装置,对待处理图像执行OCR识别。
一种水印图像OCR识别方法及其系统,通过将水印部分的图案提出进行灰度、锐化、二值化处理后合并到原图中统一进行OCR识别,由于仅仅对水印部分区域的图像进行处理,不会因为统一处理导致整体图像识别困难,凸显出水印部分的文字,能有效提高对水印部分文字的识别准确性。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。
Claims (5)
1.一种水印图像OCR识别方法,其特征在于,包括以下步骤:
对图像进行坐标矫正,建立坐标模型;
获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
标定水印标识部分区域对应坐标;
提取包含水印标识部分的区域;
图片去除含有水印标识部分的区域;
对含水印标识部分的区域进行灰度处理;
对含水印标识部分的区域进行USM锐化处理;
对含水印标识部分的区域进行二值化处理;
将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;
对待处理图像执行OCR识别。
2.根据权利要求1所述的一种水印图像OCR识别方法,其特征在于:
所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。
3.根据权利要求2所述的一种水印图像OCR识别方法,其特征在于:
所述二值化处理包括以下步骤:
横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;
纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;
二值化的阈值为(sum1+sum2)/(p1+P2),若当前像素灰度大于等于阈值,则输出黑色像素块,若当前像素灰度小于阈值,则输出白色像素块。
4.根据权利要求1所述的一种水印图像OCR识别方法,其特征在于:
对OCR识别的文字进行自动矫正处理,包括以下步骤:
调用并运行word拼写检测与纠正插件;
输出OCR识别后的文字,进行自动纠正;
输出自动纠正后的文字。
5.一种水印图像OCR识别系统,其特征在于,包括:
纠正装置,对图像进行坐标矫正,建立坐标模型;
水印获取装置,获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
坐标记录装置,标定水印标识部分区域对应坐标;
提取水印装置,提取包含水印标识部分的区域;
去除水印装置,图片去除含有水印标识部分的区域;
灰度处理装置,对含水印标识部分的区域进行灰度处理;
锐化处理装置,对含水印标识部分的区域进行USM锐化处理;
二值化处理装置,对含水印标识部分的区域进行二值化处理;
合并图像装置,将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;
OCR识别装置,对待处理图像执行OCR识别。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810025351.6A CN108229460A (zh) | 2018-01-09 | 2018-01-09 | 一种水印图像ocr识别方法及其系统 |
PCT/CN2018/124643 WO2019137238A1 (zh) | 2018-01-09 | 2018-12-28 | 一种水印图像ocr识别方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810025351.6A CN108229460A (zh) | 2018-01-09 | 2018-01-09 | 一种水印图像ocr识别方法及其系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108229460A true CN108229460A (zh) | 2018-06-29 |
Family
ID=62640818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810025351.6A Pending CN108229460A (zh) | 2018-01-09 | 2018-01-09 | 一种水印图像ocr识别方法及其系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108229460A (zh) |
WO (1) | WO2019137238A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019137238A1 (zh) * | 2018-01-09 | 2019-07-18 | 佛山科学技术学院 | 一种水印图像ocr识别方法及其系统 |
CN111127593A (zh) * | 2018-10-30 | 2020-05-08 | 珠海金山办公软件有限公司 | 一种文档内容擦除方法、装置、电子设备及可读存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111539406B (zh) * | 2020-04-21 | 2023-04-18 | 招商局金融科技有限公司 | 证件复印件信息识别方法、服务器及存储介质 |
CN111583156B (zh) * | 2020-05-13 | 2023-06-23 | 中国科学院自动化研究所 | 文档图像底纹去除方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101465932A (zh) * | 2007-12-20 | 2009-06-24 | 佳能株式会社 | 图像处理设备及其控制方法 |
CN101540815A (zh) * | 2008-03-19 | 2009-09-23 | 佳能株式会社 | 信息处理装置、图像处理装置、图像处理系统及图像处理方法 |
CN101908241A (zh) * | 2010-08-03 | 2010-12-08 | 广州广电运通金融电子股份有限公司 | 有价文件识别方法及其识别系统 |
EP2974260A1 (fr) * | 2013-03-15 | 2016-01-20 | Send Only Oked Documents (SOOD) | Procèdé de tatouage de la partie textuelle d'un document |
CN107247915A (zh) * | 2016-08-02 | 2017-10-13 | 浙江远望信息股份有限公司 | 一种敏感图片文件的智能识别方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101364300A (zh) * | 2008-05-30 | 2009-02-11 | 西安电子科技大学 | 基于灰色理论的数字水印方法 |
CN102682457A (zh) * | 2012-05-17 | 2012-09-19 | 南开大学 | 一种对平面媒体图像进行适应屏幕阅读的重排方法 |
CN108229460A (zh) * | 2018-01-09 | 2018-06-29 | 佛山科学技术学院 | 一种水印图像ocr识别方法及其系统 |
-
2018
- 2018-01-09 CN CN201810025351.6A patent/CN108229460A/zh active Pending
- 2018-12-28 WO PCT/CN2018/124643 patent/WO2019137238A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101465932A (zh) * | 2007-12-20 | 2009-06-24 | 佳能株式会社 | 图像处理设备及其控制方法 |
CN101540815A (zh) * | 2008-03-19 | 2009-09-23 | 佳能株式会社 | 信息处理装置、图像处理装置、图像处理系统及图像处理方法 |
CN101908241A (zh) * | 2010-08-03 | 2010-12-08 | 广州广电运通金融电子股份有限公司 | 有价文件识别方法及其识别系统 |
EP2974260A1 (fr) * | 2013-03-15 | 2016-01-20 | Send Only Oked Documents (SOOD) | Procèdé de tatouage de la partie textuelle d'un document |
CN107247915A (zh) * | 2016-08-02 | 2017-10-13 | 浙江远望信息股份有限公司 | 一种敏感图片文件的智能识别方法 |
Non-Patent Citations (1)
Title |
---|
骆剑峰等: "《改进水印图片里文字识别效果的新方法》", 《信息化纵横》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019137238A1 (zh) * | 2018-01-09 | 2019-07-18 | 佛山科学技术学院 | 一种水印图像ocr识别方法及其系统 |
CN111127593A (zh) * | 2018-10-30 | 2020-05-08 | 珠海金山办公软件有限公司 | 一种文档内容擦除方法、装置、电子设备及可读存储介质 |
CN111127593B (zh) * | 2018-10-30 | 2023-10-31 | 珠海金山办公软件有限公司 | 一种文档内容擦除方法、装置、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2019137238A1 (zh) | 2019-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229460A (zh) | 一种水印图像ocr识别方法及其系统 | |
CN108319945A (zh) | 一种分离式ocr识别方法及其系统 | |
US8971620B2 (en) | Detecting a label from an image | |
JP4261005B2 (ja) | 領域ベースのイメージ2値化システム | |
US20060245650A1 (en) | Precise grayscale character segmentation apparatus and method | |
CN107945194A (zh) | 基于OpenCV技术的票据分割方法 | |
CN114283156B (zh) | 一种用于去除文档图像颜色及手写笔迹的方法及装置 | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
KR101058726B1 (ko) | 조명 성분을 제거하기 위한 이미지 보정 장치 및 방법 | |
CN112686265B (zh) | 一种基于层级轮廓提取的象形文字分割方法 | |
CN116704523B (zh) | 一种用于出版印刷设备的文字排版图像识别系统 | |
CN103605982A (zh) | 一种条烟32位条码采集系统及32位条码识别方法 | |
CN115588202B (zh) | 一种基于轮廓检测的电气设计图纸中文字提取方法及系统 | |
CN106934411A (zh) | 基于模板匹配的电子阅卷方法 | |
WO2023280080A1 (zh) | 阴影消除装置和方法、空盘识别装置和方法 | |
CN113139535A (zh) | 一种ocr文档识别方法 | |
CN111445402B (zh) | 一种图像去噪方法及装置 | |
JP2004280334A (ja) | 画像読み取り装置 | |
CN111340040B (zh) | 一种纸张字符识别方法、装置、电子设备及存储介质 | |
CN117541546A (zh) | 图像裁剪效果的确定方法和装置、存储介质及电子设备 | |
CN112818983A (zh) | 一种利用图片相识度判断字符倒置的方法 | |
CN114267035A (zh) | 一种文档图像处理方法、系统、电子设备及可读介质 | |
CN113392833B (zh) | 一种工业射线底片图像铅字编号识别方法 | |
CN115619813A (zh) | Sem图像前景提取方法、装置、计算机设备及存储介质 | |
CN109934215B (zh) | 一种身份证识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180629 |