CN102682457A - 一种对平面媒体图像进行适应屏幕阅读的重排方法 - Google Patents

一种对平面媒体图像进行适应屏幕阅读的重排方法 Download PDF

Info

Publication number
CN102682457A
CN102682457A CN2012101521577A CN201210152157A CN102682457A CN 102682457 A CN102682457 A CN 102682457A CN 2012101521577 A CN2012101521577 A CN 2012101521577A CN 201210152157 A CN201210152157 A CN 201210152157A CN 102682457 A CN102682457 A CN 102682457A
Authority
CN
China
Prior art keywords
image
print media
text
screen
media image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101521577A
Other languages
English (en)
Inventor
江亚庆
张金
杨子健
张敬威
刘鑫鑫
姜洲
罗俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nankai University
Original Assignee
Nankai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nankai University filed Critical Nankai University
Priority to CN2012101521577A priority Critical patent/CN102682457A/zh
Publication of CN102682457A publication Critical patent/CN102682457A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明涉及一种对平面媒体图像进行适应屏幕阅读的重排方法,包括以下步骤:(1)对含有噪声、水印或倾斜度的平面媒体图像分别进行噪声去除、水印去除或倾斜度校正预处理;(2)对图文混排的平面媒体图像进行图文分离处理;(3)对包含有页眉、页脚或标题的平面媒体图像的非正文内容部分进行剔除处理;(4)根据目标屏幕分辨率对正文图像进行分割重排处理,将正文图像分割成宽度为屏幕宽度的图像。本发明设计合理,不需要对文字进行识别即可满足不同分辨率的手持移动设备或大屏幕显示设备自适应显示的需要,同时通过对漫画自动识别边框将漫画分割成单幅漫画,解决了手持移动设备阅读漫画的问题,具有准确性高、方法简单、效率高等特点。

Description

一种对平面媒体图像进行适应屏幕阅读的重排方法
技术领域
本发明属于信息技术领域,尤其是一种对平面媒体图像进行适应屏幕阅读的重排方法。
背景技术
随着互联网、数字影像技术的迅猛发展,数字媒体得以广泛传播,随之而来的是人们对电子阅读方式、特别是跨越不同设备之间阅读方式的需求越来越大。人们普遍希望能够使用手持移动设备阅读各种来源、版式不同的文章,例如图像式PDF或者来源于摄像头拍摄的电子书籍。由于手持移动设备通常只有3-4吋的屏幕可供显示,因此,手持移动设备在阅读图像式PDF或者来源于摄像头拍摄的电子书籍时,往往会产生屏幕尺寸不能满足图像大小的情况,如果缩放,文字太小,看不清楚;如果不缩放,则需要反复拖动图像才能阅读,操作麻烦;而相对于分辨率较高的大屏幕显示设备,例如,微型计算机的高分辨率显示器、电视、投影等设备,会出现相反的情况。针对上述问题,目前主要采用OCR技术对文字进行识别来解决,但是采用OCR技术存在的问题是:(1)识别率不完美,容易出错,给阅读带来不便;(2)含有插图的平面媒体图像需要去除插图,否则影响识别;(3)图像质量差、噪声多、影响识别;(4)算法复杂度高,在移动平台上费时多;(5)适用的字体过于局限,对于华文彩云、华文行楷很难识别。
另外,手持移动设备在阅读漫画时存在如下问题:虽然手持移动设备上安装有漫画阅读软件,但是这些软件相对封闭,不同软件用自己的独有格式,而且只能阅读软件开发者已经制作好的漫画,其阅读范围有限;即使有部分开放的软件,也需要用户自行分割漫画,耗费精力,并需要额外的学习软件使用。
发明内容
本发明的目的在于克服现有技术的不足,提供一种对平面媒体图像进行适应目标屏幕阅读的重排方法,通过对平面媒体图像进行分割以实现版面的重排,解决了手持移动设备对于平面媒体图像阅读不便以及漫画阅读问题。
本发明解决其技术问题是采取以下技术方案实现的:
一种对平面媒体图像进行适应屏幕阅读的重排方法,包括以下步骤:
(1)对含有噪声、水印或倾斜度的平面媒体图像分别进行噪声去除、水印去除或倾斜度校正预处理;
(2)对图文混排的平面媒体图像进行图文分离处理;
(3)对包含有页眉、页脚或标题的平面媒体图像的非正文内容部分进行剔除处理;
(4)根据目标屏幕分辨率对正文图像进行分割重排处理,将正文图像分割成宽度为目标屏幕宽度的图像。
而且,所述的平面媒体图像包括摄像头采集的图像或者从其他方式传入的图像。
而且,所述步骤(1)的噪声去除方法为:首先对光照不均的图像采取背景减除、小波变换实现二值化,然后利用高斯平滑、中值滤波等去除小噪点。
而且,所述步骤(1)的水印去除预处理包括灰度处理、usm锐化和二值化处理步骤。
而且,所述步骤(1)的倾斜度校正采用基于边缘检测的倾斜度校正算法实现,其处理步骤为:通过提取倾斜图像边界像素点的坐标,利用最小二乘法对边界直线进行拟合,求出边界对于图像的倾斜角,进而对图像进行旋转变换,对原始倾斜的图像进行校正。
而且,所述步骤(2)的图文分离处理方法为:利用图像和文字的连通域大小的显著区别,提取出连通域较大的图像,剩余较小的文字、标点。
而且,所述步骤(4)对正文图像进行分割重排处理包括多行文本正文图像分割重排处理方法和漫画正文图像分割重排处理方法。
而且,所述的多行文本正文图像分割重排处理方法包括以下步骤:
(1)采用下式计算行高RowHeight:
RowHeight=RowEnd-RowBeg
上式中,RowBeg为第一个不全为白色像素的行,RowEnd为下一个不全为白像素的行;
(2)以行高RowHeight为单行文字图像的高,把多行文字图像拼接成单行文字的图像;
(3)设目标屏幕宽度为ScreenWide,直接找到单行文字图像的第ScreenWide列像素处,检验该列是否全为白像素,若是,则认为该列位于字与字之间,从该列像素处分割,否则,对屏幕宽度ScreenWide处左侧的-列进行扫描,按上述方法循环下去,直到最后剩余的像素宽度小于等于屏幕宽度ScreenWide,扫描结束,从而实现对多行文本正文图像的分割重排功能。
而且,所述的漫画正文图像分割重排处理方法是通过自动识别边框并将其分割为单幅画面实现对漫画正文图像的分割重排功能。
而且,所述步骤(4)的目标屏幕为比原平面媒体图像分辨率低的手持移动设备,或者为屏幕分辨率比原平面媒体图像分辨率高的显示设备上;对正文图像进行分割重排处理适用于将小分辨率平面媒体图像在相对较大的设备上显示或将大分辨率平面媒体图像在相对较小设备上显示。
本发明的优点和积极效果是:
1、本方法根据目标屏幕分辨率对平面媒体正文图像进行分割重排处理,对于比原图片分辨率小的手持移动设备,通过分割实现每行的文字数减少;对于原图分辨率大的显示设备,通过合并行再重新切分实现每行文字数增加,整个处理过程中不需要对文字进行识别即可满足各种分辨率显示设备的自适应显示需要,避免OCR技术带来的识别出错问题。
2、本方法通过对漫画自动识别边框将漫画分割成单幅漫画,达到了适应屏幕阅读的目的,不需要另外安装漫画软件即可直接阅读,解决了手持移动设备阅读漫画的问题。
附图说明
图1是本发明的对多行文本进行分割重排处理的流程图;
图2是行高计算方法示意图;
图3是多行文本正文图像示意图;
图4是多行文本正文图像处理结果示意图;
图5是漫画正文图像示意图;
图6是漫画正文图像处理结果示意图。
具体实施方式
以下结合附图对本发明实施例做进一步详述:
一种对平面媒体图像进行适应屏幕阅读的重排方法,是通过对平面媒体图像进行版面分块和文本的分割以实现版面的重排,以适应对于比原图片分辨率小的手持移动设备以及对于原图分辨率大的显示设备的现实需要。所谓的平面媒体图像,是指平面媒体经过转化,其内容已经不再以有序的方式存在,而是以图像形式存在,媒体内包含的文字已经无法编辑,也无法被机器设备识别而只能通过人来阅读,上述平面媒体图像既包括了带插图的电子读物,也包括没有文字的漫画读物,其中的文字方向可以是横向或者竖向排版,所使用的语言可以使汉语和英语等。
下面对本发明进行详细说明:
一种对平面媒体图像进行适应屏幕阅读的重排方法,包括以下步骤:
步骤1:对含有噪声、水印或倾斜度的平面媒体图像分别进行噪声去除、水印去除或倾斜度校正预处理
由于待重新排版的平面媒体图像包括手持移动设备通过摄像头采集的图像或者从其他方式传入的图像,这些图像可能会存在一定程度的倾斜和噪声,部分文档为了版权保护加有水印,因此,在本步骤中,需要对这些原始图像进行倾斜度校正、噪声去除、水印去除等预处理工作,以得到理想图像便于后续的处理。
噪声去除是图像处理过程中的一个重要环节,其结果直接影响到图像质量和特征提取的精确性。本噪声去除方法结合多种算法对图像进行噪声去除:首先对光照不均的图像采取背景减除、小波变换实现二值化,然后利用高斯平滑、中值滤波等去除小噪点。
水印去除预处理包括灰度处理、usm锐化和二值化处理步骤实现。
倾斜度校正采用基于边缘检测的倾斜度校正算法实现,其通过提取倾斜图像边界像素点的坐标,利用最小二乘法对边界直线进行拟合,求出边界对于图像的倾斜角,进而对图像进行旋转变换,对原始倾斜的图像进行校正。
步骤2:对图文混排的平面媒体图像进行图文分离处理
图文分离采取相对完美的算法,利用图像和文字的连通域大小的显著区别,提取出连通域较大的图像,剩余较小的文字、标点。
步骤3:对包含有页眉、页脚或标题的平面媒体图像的非正文内容部分进行剔除处理
由于页眉页脚和标题在版面中处于特殊位置,和正文有显著区别,通过简单的算法就可以剔除。
步骤4:根据目标屏幕分辨率对正文图像进行分割重排处理,将正文图像分割成宽度为屏幕宽度的图像,从而达到适应屏幕的效果。
本步骤是对正文图像进行分割重排处理,正文图像既可以是由多行文本构成的,也可以是由漫画构成的。因此,对于正文图像处理包括多行文本正文图像分割重排处理方法和漫画正文图像分割重排处理方法,下面分别进行说明:
多行文本正文图像分割重排处理是采用基于前后检测的方法实现,处理时纵向以行为单位切分,横向通常多个字同时分割,必要时以字或特殊符号为最小分割单位,从而能够明显提高正文分割的正确率。如图1所示,多行文本正文图像分割重排处理方法,包括以下步骤:
1、计算行高
根据汉语书写习惯,多行文本的汉字行距是相等的。如图2所示,在多行文档图像中,从第一行像素开始横向扫描,将第一个不全为白色像素的行记为RowBeg,继续扫描至下一个全为白像素的行记为RowMid,然后扫描至下一个不全为白像素的行记为RowEnd。因此,行高RowHeight计算的公式如下:
RowHeight=RowEnd-RowBeg
这样算出的行高包括字高和行距两部分。
2、以行高RowHeight为单行文字图像的高,把多行文字图像拼接成单行文字的图像。
3、设目标屏幕宽度为ScreenWide,直接找到单行文字图像的第ScreenWide列像素处,检验该列是否全为白像素,若是,则认为该列位于字与字之间,从该列像素处分割,否则,对屏幕宽度ScreenWide处左侧的一列进行扫描。按上述方法循环下去,直到最后剩余的像素宽度小于等于屏幕宽度ScreenWide,扫描结束。
通过上述步骤实现对多行文本正文图像的分割重排处理。图3为处理前的正文图像,图4是处理后在目标屏幕上显示的效果。
漫画分割重排处理通过自动识别边框的方法来实现的,其处理结果是将漫画分割为单幅画面在手持移动设备上进行显示。图5为处理前漫画的内容,图6是将漫画分割为单幅画面在目标屏幕上显示的效果。
通过上述步骤即可将待处理平面媒体图像分割成宽度为屏幕宽度的图像,从而达到适应不同屏幕的显示效果。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

Claims (10)

1.一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于:包括以下步骤:
(1)对含有噪声、水印或倾斜度的平面媒体图像分别进行噪声去除、水印去除或倾斜度校正预处理;
(2)对图文混排的平面媒体图像进行图文分离处理;
(3)对包含有页眉、页脚或标题的平面媒体图像的非正文内容部分进行剔除处理;
(4)根据目标屏幕分辨率对正文图像进行分割重排处理,将正文图像分割成宽度为目标屏幕宽度的图像。
2.根据权利要求1所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于:所述的平面媒体图像包括摄像头采集的图像或者从其他方式传入的图像。
3.根据权利要求1所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于:所述步骤(1)的噪声去除方法为:首先对光照不均的图像采取背景减除、小波变换实现二值化,然后利用高斯平滑、中值滤波等去除小噪点。
4.根据权利要求1所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于:所述步骤(1)的水印去除预处理包括灰度处理、usm锐化和二值化处理步骤。
5.根据权利要求1所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于:所述步骤(1)的倾斜度校正采用基于边缘检测的倾斜度校正算法实现,其处理步骤为:通过提取倾斜图像边界像素点的坐标,利用最小二乘法对边界直线进行拟合,求出边界对于图像的倾斜角,进而对图像进行旋转变换,对原始倾斜的图像进行校正。
6.根据权利要求1所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于:所述步骤(2)的图文分离处理方法为:利用图像和文字的连通域大小的显著区别,提取出连通域较大的图像,剩余较小的文字、标点。
7.根据权利要求1所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于:所述步骤(4)对正文图像进行分割重排处理包括多行文本正文图像分割重排处理方法和漫画正文图像分割重排处理方法。
8.根据权利要求7所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于:所述的多行文本正文图像分割重排处理方法包括以下步骤:
(1)采用下式计算行高RowHeight:
RowHeight=RowEnd-RowBeg
上式中,RowBeg为第一个不全为白色像素的行,RowEnd为下一个不全为白像素的行;
(2)以行高RowHeight为单行文字图像的高,把多行文字图像拼接成单行文字的图像;
(3)设目标屏幕宽度为ScreenWide,直接找到单行文字图像的第ScreenWide列像素处,检验该列是否全为白像素,若是,则认为该列位于字与字之间,从该列像素处分割,否则,对屏幕宽度ScreenWide处左侧的一列进行扫描,按上述方法循环下去,直到最后剩余的像素宽度小于等于屏幕宽度ScreenWide,扫描结束,从而实现对多行文本正文图像的分割重排功能。
9.根据权利要求7所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于:所述的漫画正文图像分割重排处理方法是通过自动识别边框并将其分割为单幅画面实现对漫画正文图像的分割重排功能。
10.根据权利要求1至9任一项所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于:所述步骤(4)的目标屏幕为比原平面媒体图像分辨率低的手持移动设备,或者为屏幕分辨率比原平面媒体图像分辨率高的显示设备上;对正文图像进行分割重排处理适用于将小分辨率平面媒体图像在相对较大的设备上显示或将大分辨率平面媒体图像在相对较小设备上显示。
CN2012101521577A 2012-05-17 2012-05-17 一种对平面媒体图像进行适应屏幕阅读的重排方法 Pending CN102682457A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101521577A CN102682457A (zh) 2012-05-17 2012-05-17 一种对平面媒体图像进行适应屏幕阅读的重排方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101521577A CN102682457A (zh) 2012-05-17 2012-05-17 一种对平面媒体图像进行适应屏幕阅读的重排方法

Publications (1)

Publication Number Publication Date
CN102682457A true CN102682457A (zh) 2012-09-19

Family

ID=46814322

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101521577A Pending CN102682457A (zh) 2012-05-17 2012-05-17 一种对平面媒体图像进行适应屏幕阅读的重排方法

Country Status (1)

Country Link
CN (1) CN102682457A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103985373A (zh) * 2014-05-07 2014-08-13 青岛海信电器股份有限公司 一种应用于拼接显示设备的图像处理方法及装置
CN105208183A (zh) * 2014-06-27 2015-12-30 上海玄霆娱乐信息科技有限公司 电子设备显示漫画的方法
CN109155076A (zh) * 2016-06-17 2019-01-04 谷歌有限责任公司 自动识别和显示图形小说中的感兴趣对象
CN110009712A (zh) * 2019-03-01 2019-07-12 华为技术有限公司 一种图文排版方法及其相关装置
WO2019137238A1 (zh) * 2018-01-09 2019-07-18 佛山科学技术学院 一种水印图像ocr识别方法及其系统
CN113986168A (zh) * 2021-10-14 2022-01-28 深圳Tcl新技术有限公司 一种图像显示方法、装置、设备及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080037873A1 (en) * 2003-01-29 2008-02-14 Kathrin Berkner Reformatting documents using document analysis information
CN101540041A (zh) * 2008-03-21 2009-09-23 中国科学院计算技术研究所 一种扫描文档浏览适配方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080037873A1 (en) * 2003-01-29 2008-02-14 Kathrin Berkner Reformatting documents using document analysis information
CN101540041A (zh) * 2008-03-21 2009-09-23 中国科学院计算技术研究所 一种扫描文档浏览适配方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
牛青: "一种基于边缘检测的图像倾斜校正算法", 《中国科技信息》, no. 19, 31 October 2009 (2009-10-31), pages 114 - 115 *
骆剑锋等: "改进水印图片里文字识别效果的新方法", 《信息化纵横》, no. 11, 30 June 2009 (2009-06-30), pages 28 - 30 *
魏宏喜等: "一种基于连通域的蒙古文文档图像版面分析方法", 《内蒙古大学学报( 自然科学版)》, vol. 38, no. 5, 30 September 2007 (2007-09-30), pages 586 - 590 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103985373A (zh) * 2014-05-07 2014-08-13 青岛海信电器股份有限公司 一种应用于拼接显示设备的图像处理方法及装置
CN105208183A (zh) * 2014-06-27 2015-12-30 上海玄霆娱乐信息科技有限公司 电子设备显示漫画的方法
CN105208183B (zh) * 2014-06-27 2018-11-02 上海玄霆娱乐信息科技有限公司 电子设备显示漫画的方法
CN109155076A (zh) * 2016-06-17 2019-01-04 谷歌有限责任公司 自动识别和显示图形小说中的感兴趣对象
CN109155076B (zh) * 2016-06-17 2023-07-14 谷歌有限责任公司 自动识别和显示图形小说中的感兴趣对象
WO2019137238A1 (zh) * 2018-01-09 2019-07-18 佛山科学技术学院 一种水印图像ocr识别方法及其系统
CN110009712A (zh) * 2019-03-01 2019-07-12 华为技术有限公司 一种图文排版方法及其相关装置
US11790584B2 (en) 2019-03-01 2023-10-17 Huawei Technologies Co., Ltd. Image and text typesetting method and related apparatus thereof
CN113986168A (zh) * 2021-10-14 2022-01-28 深圳Tcl新技术有限公司 一种图像显示方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
US20210256253A1 (en) Method and apparatus of image-to-document conversion based on ocr, device, and readable storage medium
EP1999688B1 (en) Converting digital images containing text to token-based files for rendering
US7593595B2 (en) Photographic document imaging system
US8194983B2 (en) Method and system for preprocessing an image for optical character recognition
CN114299528B (zh) 一种针对扫描文档的信息提取和结构化方法
US8218875B2 (en) Method and system for preprocessing an image for optical character recognition
CN111127339B (zh) 一种文档图像的梯形畸变矫正方法及装置
CN102682457A (zh) 一种对平面媒体图像进行适应屏幕阅读的重排方法
US9098759B2 (en) Image processing apparatus, method, and medium for character recognition
RU2631765C1 (ru) Способ и система исправления перспективных искажений в изображениях, занимающих двухстраничный разворот
EP2270746A2 (en) Method for detecting alterations in printed document using image comparison analyses
US8897574B2 (en) Image processing apparatus, line detection method, and computer-readable, non-transitory medium
CN104966051A (zh) 一种文档图像的版式识别方法
US10455163B2 (en) Image processing apparatus that generates a combined image, control method, and storage medium
CN107992869B (zh) 用于倾斜文字校正的方法、装置及电子设备
US11568623B2 (en) Image processing apparatus, image processing method, and storage medium
US10423851B2 (en) Method, apparatus, and computer-readable medium for processing an image with horizontal and vertical text
JP2011188465A (ja) 原稿レイアウトの方向検出方法及び装置
US11443504B2 (en) Image box filtering for optical character recognition
US7903876B2 (en) Distortion correction of a captured image
US20080131000A1 (en) Method for generating typographical line
Malik et al. An efficient skewed line segmentation technique for cursive script OCR
CN112329641B (zh) 一种表格识别方法、装置、设备及可读存储介质
Hsueh Interactive text recognition and translation on a mobile device
US8045229B2 (en) Image processing apparatus, image processing method and medium

Legal Events

Date Code Title Description
DD01 Delivery of document by public notice

Addressee: Nankai University Jiang Yaqing

Document name: Notification of Passing Preliminary Examination of the Application for Invention

C06 Publication
PB01 Publication
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: 300071 Tianjin City, Nankai District Wei Jin Road No. 94

Applicant after: Nankai University

Address before: 300071 No. 94 South Jin Wei Road, Tianjin, Nankai District

Applicant before: Nankai University

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120919