CN102750686B - 一种基于学习的超分辨文档图像复原处理方法 - Google Patents
一种基于学习的超分辨文档图像复原处理方法 Download PDFInfo
- Publication number
- CN102750686B CN102750686B CN201210193064.9A CN201210193064A CN102750686B CN 102750686 B CN102750686 B CN 102750686B CN 201210193064 A CN201210193064 A CN 201210193064A CN 102750686 B CN102750686 B CN 102750686B
- Authority
- CN
- China
- Prior art keywords
- image
- low
- resolution
- block
- definition picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于学习的超分辨文档图像复原处理方法,其特征在于,该方法用于低分辨率文档图像的复原,所述的方法包括以下几个步骤:1)图像获取模块获得已知的多个高分辨率图像;2)图像获取模块获得高分辨率图像所对应的低分辨率图像,所述的高分辨率图像和低分辨率图像相对对齐;3)训练模块将获得的高分辨率图像和低分辨率图像作为训练样本,进行训练学习,建立学习模型;4)向复原模块输入待复原低分辨率图像;5)复原模块根据学习模型将待复原低分辨率图像复原为高分辨率复原图像。与现有技术相比,本发明具有复原效果好、操作方便等优点。
Description
技术领域
本发明涉及一种文档图像处理方法,尤其是涉及一种基于学习的超分辨文档图像复原处理方法。
背景技术
在实际的应用环境中,由于扫描仪及打印机等外界硬件设备等条件的限制,采集到的电子文档图像分辨率较低或降质严重,例如图书馆藏的书籍的电子化、传真图像等。经常出现笔画的缺失、断裂、粘连等问题,使得阅读困难、OCR识别率下降。因此,对该类低分辨率文档图像进行复原来提高其显示效果和OCR识别率具有重要意义。
在文档图像复原领域,低分辨率文档图像将直接影响文字识别的正确率。如何在低分辨率条件下对文档图像进行识别,并保持较高的识别率是研究的重点。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种复原效果好的基于学习的超分辨文档图像复原处理方法。
本发明的目的可以通过以下技术方案来实现:
一种基于学习的超分辨文档图像复原处理方法,该方法用于低分辨率文档图像的复原,所述的方法包括以下几个步骤:
1)图像获取模块获得已知的多个高分辨率图像;
2)图像获取模块获得高分辨率图像所对应的低分辨率图像,所述的高分辨率图像和低分辨率图像坐标相对对齐;
3)训练模块将获得的高分辨率图像和低分辨率图像作为训练样本,进行训练学习,建立学习模型;
4)向复原模块输入待复原低分辨率图像;
5)复原模块根据学习模型将待复原低分辨率图像复原为高分辨率复原图像。
所述的步骤2)中的获得高分辨率图像所对应的低分辨率图像的具体方法包括将高分辨率图像以1/3-1/2的比例进行压缩或缩小。
所述的步骤3)中的训练学习过程具体包括以下步骤:
31)对高分辨率图像和低分辨率图像进行图像预处理,消除图像中无关的信息并进行二值化处理;
32)将高分辨率图像与低分辨率图像划分成块数一致、且坐标一一对应的图像块;
33)对这些图像块进行特征值标示,确定图像块之间的位置关系;
34)根据图像块的特征值标示进行类别统计,将相同特征值的块归为一类;
35)用统计的方法确定高分辨率图像类别与低分辨率图像类别之间的概率关系,建立学习模型。
所述的步骤31)中的二值化处理是指图像上的像素点的灰度值设置为0或者1,呈现出黑白效果。
所述的步骤5)中的复原过程具体步骤包括:
51)对待复原低分辨率图像XL进行切分,将其切分成与训练样本对应块数的待修复图像块,设图像块数为n;
52)对每一个待修复图像块x分别寻找其在低分辨率图像类别中所属的类;
53)根据学习模型中高分辨率图像类别与低分辨率图像类别之间的概率关系,获得与待修复图像块x对应的具有最大概率的高分辨率图像块y;
54)根据获得的高分辨率图像块y,生成高分辨率复原图像YH。
所述的步骤53)具体为:
531)降低算法时间复杂度:将公式转化为
532)将待修复图像块x与高分辨率图像块间的概率关系按概率值从大到小排序,按顺序选取前k个概率值所对应的图像块{y1,y2,y3,…yk}作为候选块,将与待修复图像块x相邻的8块低分辨率图像{x1,x2,….x8}分别找出它们各自的前k个候选块;
533)获得与待修复图像块x对应的具有最大概率的高分辨率图像块y:
上述P(YH,XL)为高分辨率图像YH与待复原低分辨率图像XL的联合概率,ψ(yi,yj)为高分辨率图像块yi与高分辨率图像块yj间的概率关系,yi≠yj,为待复原图像块xi与高分辨率图像块yj间的概率关系,t为互异的高分辨率图像块数目,wi为权重,
与现有技术相比,本发明首先对样本图像进行块划分,通过训练学习获得低分辨率图像块和高分辨率图像块之间的先验概率,利用贝叶斯公式对待复原的低分辨率文档图像进行复原,本发明对低分辨率文档图像能够有较好的复原效果,同时也可提高OCR识别率。
附图说明
图1为本发明方法的流程示意图;
图2为本发明训练过程示意图;
图3为本发明复原过程示意图;
图4为实施例2中待修复低分辨率图像;
图5为实施例2中修复好的高分辨率图像。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例1
如图1所示,一种基于学习的超分辨文档图像复原处理方法,该方法用于低分辨率文档图像的复原,所述的方法包括以下几个步骤:
1)获得已知的多个高分辨率图像;
2)将高分辨率图像以1/3的比例进行压缩或缩小,获得高分辨率图像所对应的低分辨率图像,所述的高分辨率图像和低分辨率图像坐标相对对齐;
3)将获得的高分辨率图像和低分辨率图像作为训练样本,进行训练学习,建立学习模型;
4)输入待复原低分辨率图像;
5)根据学习模型将待复原低分辨率图像复原为高分辨率复原图像。
如图2所示,步骤3)中的训练学习过程具体包括以下步骤:
31)对高分辨率图像和低分辨率图像进行图像预处理,消除图像中无关的信息并进行二值化处理;
32)将高分辨率图像与低分辨率图像划分成块数一致、且坐标一一对应的图像块,高低分辨率图像块的大小比例关系即为高低分辨率图像之间的比例关系;
33)对这些图像块进行特征值标示,确定图像块之间的位置关系;
34)根据图像块的特征值标示进行类别统计,将相同特征值的块归为一类;
35)用统计的方法确定高分辨率图像类别与低分辨率图像类别之间的概率关系,如表1所示,建立学习模型。
表1:φ(xi,yj)
φ | y1 | y2 | … | yt |
x1 | p1 | p2 | … | p4 |
x2 | p5 | p6 | … | p8 |
… | … | … | … | … |
xs | pw | pw+1 | … | pz |
上表中,pi表示高分辨率图像与低分辨率图像类别之间的概率关系。
所述的步骤31)中的二值化处理是指图像上的像素点的灰度值设置为0或者1,呈现出黑白效果。
如图3所示,所述的步骤5)中的复原过程具体步骤包括:
51)对待复原低分辨率图像XL进行切分,将其切分成与训练样本对应块数的待修复图像块,设图像块数为n;
52)对每一个待修复图像块x分别寻找其在低分辨率图像类别中所属的类;
53)根据学习模型中高分辨率图像类别与低分辨率图像类别之间的概率关系,获得与待修复图像块x对应的具有最大概率的高分辨率图像块y:
531)降低算法时间复杂度:将公式转化为
532)将待修复图像块x与高分辨率图像块间的概率关系按概率值从大到小排序,按顺序选取前k个概率值所对应的图像块{y1,y2,y3,…yk}作为候选块,将与待修复图像块x相邻的8块低分辨率图像{x1,x2,….x8}分别找出它们各自的前k个候选块;
533)获得与待修复图像块x对应的具有最大概率的高分辨率图像块y:
上述P(YH,XL)为高分辨率图像YH与待复原低分辨率图像XL的联合概率,ψ(yi,yj)为高分辨率图像块yi与高分辨率图像块yj间的概率关系,yi≠yj,为待复原图像块xi与高分辨率图像块yj间的概率关系,t为互异的高分辨率图像块数目,wi为权重,
54)根据获得的高分辨率图像块y,生成高分辨率复原图像YH。
实施例2
参考图1-图3所示,一种基于学习的超分辨文档图像复原处理方法,收集了100张高分辨率文档图像,对其进行降质处理,降质为1/2(即图像的宽度和高度只有高分辨率图像的一半)生成对应的100张低分辨率图像,以此作为训练样本。本实施例中,将高分辨率图像块的大小设置为10*10,低分辨率图像块的大小设置为5*5。根据实施例1中的步骤对待修复低分辨率文档图像进行复原。在类别统计过程中,将特征值相同的图像块归为一类。通过训练学习,求得表1所示概率关系。再利用学习到的数据对输入的待修复低分辨率文档图像进行了复原,结果如图4和图5所示。
Claims (4)
1.一种基于学习的超分辨文档图像复原处理方法,其特征在于,该方法用于低分辨率文档图像的复原,所述的方法包括以下几个步骤:
1)图像获取模块获得已知的多个高分辨率图像;
2)图像获取模块获得高分辨率图像所对应的低分辨率图像,所述的高分辨率图像和低分辨率图像坐标相对对齐;
3)训练模块将获得的高分辨率图像和低分辨率图像作为训练样本,进行训练学习,建立学习模型;
4)向复原模块输入待复原低分辨率图像;
5)复原模块根据学习模型将待复原低分辨率图像复原为高分辨率复原图像;
所述的步骤3)中的训练学习过程具体包括以下步骤:
31)对高分辨率图像和低分辨率图像进行图像预处理,消除图像中无关的信息并进行二值化处理;
32)将高分辨率图像与低分辨率图像划分成块数一致、且坐标一一对应的图像块;
33)对这些图像块进行特征值标示,确定图像块之间的位置关系;
34)根据图像块的特征值标示进行类别统计,将相同特征值的块归为一类;
35)用统计的方法确定高分辨率图像类别与低分辨率图像类别之间的概率关系,建立学习模型;
所述的步骤5)中的复原过程具体步骤包括:
51)对待复原低分辨率图像XL进行切分,将其切分成与训练样本对应块数的待修复图像块,设图像块数为n;
52)对每一个待修复图像块x分别寻找其在低分辨率图像类别中所属的类;
53)根据学习模型中高分辨率图像类别与低分辨率图像类别之间的概率关系,获得与待修复图像块x对应的具有最大概率的高分辨率图像块y;
54)根据获得的高分辨率图像块y,生成高分辨率复原图像YH。
2.根据权利要求1所述的一种基于学习的超分辨文档图像复原处理方法,其特征在于,所述的步骤2)中的获得高分辨率图像所对应的低分辨率图像的具体方法包括将高分辨率图像以1/3-1/2的比例进行压缩或缩小。
3.根据权利要求1所述的一种基于学习的超分辨文档图像复原处理方法,其特征在于,所述的步骤31)中的二值化处理是指图像上的像素点的灰度值设置为0或者1,呈现出黑白效果。
4.根据权利要求1所述的一种基于学习的超分辨文档图像复原处理方法,其特征在于,所述的步骤53)具体为:
531)降低算法时间复杂度:将公式转化为
532)将待修复图像块x与高分辨率图像块间的概率关系按概率值从大到小排序,按顺序选取前k个概率值所对应的图像块{y1,y2,y3,…yk}作为候选块,将与待修复图像块x相邻的8块低分辨率图像{x1,x2,….x8}分别找出它们各自的前k个候选块;
533)获得与待修复图像块x对应的具有最大概率的高分辨率图像块y:
上述P(YH,XL)为高分辨率图像YH与待复原低分辨率图像XL的联合概率,ψ(yi,yj)为高分辨率图像块yi与高分辨率图像块yj间的概率关系,yi≠yj,为待复原图像块xi与高分辨率图像块yj间的概率关系,t为互异的高分辨率图像块数目,wi为权重,
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210193064.9A CN102750686B (zh) | 2012-06-12 | 2012-06-12 | 一种基于学习的超分辨文档图像复原处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210193064.9A CN102750686B (zh) | 2012-06-12 | 2012-06-12 | 一种基于学习的超分辨文档图像复原处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102750686A CN102750686A (zh) | 2012-10-24 |
CN102750686B true CN102750686B (zh) | 2014-12-24 |
Family
ID=47030836
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210193064.9A Expired - Fee Related CN102750686B (zh) | 2012-06-12 | 2012-06-12 | 一种基于学习的超分辨文档图像复原处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102750686B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104899830B (zh) * | 2015-05-29 | 2017-09-29 | 清华大学深圳研究生院 | 一种图像超分辨方法 |
CN105335929B (zh) * | 2015-09-15 | 2018-05-04 | 清华大学深圳研究生院 | 一种深度图超分辨方法 |
CN107888707B (zh) * | 2017-12-08 | 2021-04-20 | 北京奇艺世纪科技有限公司 | 一种图片传输方法、装置及电子设备 |
CN110942439B (zh) * | 2019-12-05 | 2023-09-19 | 北京华恒盛世科技有限公司 | 基于卫星图片缺陷的图像复原和增强方法 |
CN113628121B (zh) * | 2020-05-06 | 2023-11-14 | 阿里巴巴集团控股有限公司 | 数据处理、训练多媒体数据的方法和装置 |
CN115631115B (zh) * | 2022-12-08 | 2023-03-28 | 中国科学院自动化研究所 | 基于递归Transformer的动态图像复原方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101799919A (zh) * | 2010-04-08 | 2010-08-11 | 西安交通大学 | 一种基于pca对齐的正面人脸图像超分辨率重建方法 |
CN101872472A (zh) * | 2010-06-02 | 2010-10-27 | 中国科学院自动化研究所 | 一种基于样本学习的人脸图像超分辨率重建方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7239428B2 (en) * | 2001-06-11 | 2007-07-03 | Solectronics, Llc | Method of super image resolution |
EP1372335B1 (en) * | 2002-06-12 | 2005-03-09 | STMicroelectronics S.r.l. | Processing method for obtaining a high-resolution digital image |
-
2012
- 2012-06-12 CN CN201210193064.9A patent/CN102750686B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101799919A (zh) * | 2010-04-08 | 2010-08-11 | 西安交通大学 | 一种基于pca对齐的正面人脸图像超分辨率重建方法 |
CN101872472A (zh) * | 2010-06-02 | 2010-10-27 | 中国科学院自动化研究所 | 一种基于样本学习的人脸图像超分辨率重建方法 |
Non-Patent Citations (2)
Title |
---|
一种基于实例的文本图像超分辨率重建算法;杨浩等;《东南大学学报(自然科学版)》;20080331;第38卷(第02期);191-194 * |
基于学习的超分辨率技术;郑丽贤等;《计算机工程》;20080331;第34卷(第05期);193-195 * |
Also Published As
Publication number | Publication date |
---|---|
CN102750686A (zh) | 2012-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102750686B (zh) | 一种基于学习的超分辨文档图像复原处理方法 | |
CN110210413B (zh) | 一种基于深度学习的多学科试卷内容检测与识别系统及方法 | |
CN102663377B (zh) | 一种基于模板匹配的字符识别方法 | |
CN101122953B (zh) | 一种图片文字分割的方法 | |
CN101719142B (zh) | 基于分类字典的稀疏表示图片文字检测方法 | |
CN107480203A (zh) | 一种针对相同及相似图片去重的图像数据清洗方法 | |
US9082039B2 (en) | Method and apparatus for recognizing a character based on a photographed image | |
CN111783735B (zh) | 一种基于人工智能的钢材单据解析系统 | |
CN105551044B (zh) | 一种图片对比方法和装置 | |
US9396389B2 (en) | Techniques for detecting user-entered check marks | |
CN102737240B (zh) | 分析数字文档图像的方法 | |
CN113850060A (zh) | 民航文档数据识别录入方法及系统 | |
US9167129B1 (en) | Method and apparatus for segmenting image into halftone and non-halftone regions | |
CN108427954B (zh) | 一种标牌信息采集与识别系统 | |
CN110969163B (zh) | 一种检测图像中文本信息的方法 | |
CN113657162A (zh) | 一种基于深度学习的票据ocr识别方法 | |
CN1804869A (zh) | 灰度字符词典的生成装置 | |
CN114066861B (zh) | 一种基于交叉算法边缘检测理论和视觉特征的煤矸识别方法 | |
Nor et al. | Image segmentation and text extraction: application to the extraction of textual information in scene images | |
Aparna et al. | A complete OCR system development of Tamil magazine documents | |
CN111583130A (zh) | 一种用于lpr的恢复车牌图像的方法 | |
Hegadi | Recognition of printed Kannada numerals based on zoning method | |
Mai et al. | An independent character recognizer for distantly acquired mobile phone text images | |
Amarnath et al. | Line detection in run-length encoded document images using monotonically increasing graph model | |
CN112991470B (zh) | 一种复杂背景下的证件寸照背景颜色检查方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20141224 Termination date: 20210612 |
|
CF01 | Termination of patent right due to non-payment of annual fee |