CN102890826A - 一种扫描版文档重排版的方法 - Google Patents
一种扫描版文档重排版的方法 Download PDFInfo
- Publication number
- CN102890826A CN102890826A CN2011103022668A CN201110302266A CN102890826A CN 102890826 A CN102890826 A CN 102890826A CN 2011103022668 A CN2011103022668 A CN 2011103022668A CN 201110302266 A CN201110302266 A CN 201110302266A CN 102890826 A CN102890826 A CN 102890826A
- Authority
- CN
- China
- Prior art keywords
- image
- level
- value
- binary map
- ranking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种扫描版文档重排版的方法,将扫描版文档生成图像,进行采样获得待处理的彩色图像,转化为二值图,对二值图进行游程平滑、求取连通域,将初始块进行水平合并,得出文字的行信息和图片位置,再进行垂直合并,得出文字段落位置,根据文字段落位置和图片位置,对段落进行文字切分,确定各段文字的阅读顺序后,根据文字段落位置、图片位置和文字段落中文字的位置,将文字和图片按照预先指定的全图宽度和高度排版成新的图像。采用了本发明的技术方案,能够将扫描版文档根据电子阅读设备的显示器的尺寸进行重排版,方便用户阅读,提高用户使用电子阅读设备的感受度。
Description
技术领域
本发明涉及电子阅读技术领域,尤其涉及一种扫描版文档重排版的方法。
背景技术
在科学技术日新月异的今天,尤其是伴随着互联网技术的高速发展,人们的阅读习惯不再只局限于传统的纸质出版物阅读,电子阅读已经非常普及并且比重正在逐渐加大。由于电子阅读设备(电子书、手机等)的便携性,人们可以在生活中的碎片时间里进行电子阅读,比如乘坐公交车、地铁时,甚至在排队买票的几分钟时间里也可以进行电子阅读。
电子阅读素材的来源多种多样,有些来自电子出版物,有些来自纸质出版物的扫描版本。但是由于电子阅读设备的便携性,必然造成阅读屏幕的尺寸受限。在当前各种电子阅读设备的阅读体验中,对于扫描版文档的阅读非常不方便,如果将书页大小尺寸的扫描图片全部显示在小尺寸屏幕中会觉得字太小,如果采用将扫描图片局部放大的方式阅读,由于一屏不能显示完整的一行,阅读一行文字就会产生放大区域的切换,阅读一篇文章将会产生频繁的翻页。
发明内容
本发明的目的在于提出一种扫描版文档重排版的方法,能够将扫描版文档根据电子阅读设备的显示器的尺寸进行重排版,方便用户阅读,提高用户使用电子阅读设备的感受度。
为达此目的,本发明采用以下技术方案:
一种扫描版文档重排版的方法,包括以下步骤:
A、将扫描版文档生成图像,对生成的图像进行采样获得待处理的彩色图像;
B、将采样获得的彩色图像转化为二值图;
C、对二值图进行游程平滑;
D、对游程平滑处理后的二值图求取连通域,把同值的且连通的一块区域的外接矩形的位置记录下来,作为初始块位置信息;
E、将初始块进行水平合并,得出文字的行信息和图片位置;
F、将水平合并后的块进行垂直合并,得出文字段落位置;
G、根据文字段落位置和图片位置,对段落进行文字切分,首先在段落区域位置内进行水平投影,确定每行文字的位置,然后在一行的区域位置内进行垂直投影,确定每个文字的位置;
H、确定各段文字的阅读顺序;
I、根据文字段落位置、图片位置和文字段落中文字的位置,将文字和图片按照预先指定的全图宽度和高度排版成新的图像。
还包括以下步骤:
J、将排版后的新图像放大或缩小至电子阅读设备需要显示的尺寸。
步骤A中,对生成的图像进行采样,采样值采用矩阵fjk形式来表示,矩阵中的每一元素fjk取值如下:
fjk = f(X0+j*dX,Y0+k*dY),
其中,j为0到Mx–1的整数,k为0到My–1的整数,X0和Y0为初始坐标,dX和dY为步长,Mx和My分别为矩阵fjk的列数和行数,即在X、Y方向的采样点数。
步骤B进一步包括以下步骤:
B1、将采样获得的彩色图像转化为灰度图;
B2、采用全局自适应阈值方法将灰度图转换为二值图。
步骤B1中,将采样获得的彩色图像转化为灰度图采用以下公式:
Y=0.299*R+0.587*G+0.114*B,其中R、G和B分别为彩色图像的红色、绿色和蓝色分量,Y为灰度值。
步骤B2中,如果灰度图是白底黑字,则二值图中文字部分所在像素取值为0,其余部分取值为1。
步骤B2中,还包括对二值图进行矫正,进一步包括以下步骤:
采用侧面投影的方法确定图像的倾斜角度,
即采用f(x,y)表示白底黑字的二值图,图像外区域f(x,y) = 1,二值图Mx列、My行,当前的投影方向与X轴成θ角,
Sk=∑jf(Xj,Yk+Xj*tanθ),为一行的投影值,
若Sk等于Mx则取Sk=1,表示该行投影上无黑点,
若Sk小于Mx则取Sk=0,表示该行投影上有黑点,
Tθ= ∑kSk,表示θ角对应的全图投影值,
在限定范围内以预定步长变换θ值,Tθ值最大的角度就是图像的倾斜角度;
根据计算出的倾斜角度,采用二次线性插值将灰度图进行旋转,然后重复步骤B2得到矫正后的二值图。
步骤C中,对二值图进行游程平滑是根据二值图中的数据0和数据1的个数来处理的,预定一个平滑值C,当二值图中连续的1的个数小于等于C时,这一串1将被0所取代。
步骤E中,依据初始块的尺寸和初始块与初始块之间的水平间距将初始块进行水平合并,高度大于预设值的初始块不参加水平合并,被认定为图片,高度小于预设值且水平间距小于预设值的初始块水平合并为一个块。
步骤F中,依据水平合并后的块的尺寸和水平合并后的块与水平合并后的块之间的垂直间距将水平合并后的块进行垂直合并,被认定为图片的初始块不参加垂直合并,高度差小于预设值且垂直间距小于预设值的水平合并后的块垂直合并为一个块。
采用了本发明的技术方案,对电子阅读设备中扫描版文档进行重排版,将扫描版文档根据显示器的尺寸进行重排版,在文字大小方便阅读的前提下将完整的一行显示在当前屏幕中,减少翻页的频率,从而提高用户使用电子阅读设备的感受度。
附图说明
图1是本发明具体实施方式中扫描版文档重排版的流程图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
图1是本发明具体实施方式中扫描版文档重排版的流程图。如图1所示,该扫描版文档重排版的流程适用于电子阅读设备,包括以下步骤:
步骤101、将扫描版文档生成图像,对生成的图像进行采样获得待处理的彩色图像。
采样值采用矩阵fjk形式来表示,矩阵中的每一元素fjk取值如下:
fjk = f(X0+j*dX,Y0+k*dY),
其中,j为0到Mx–1的整数,k为0到My–1的整数,X0和Y0为初始坐标,dX和dY为步长,Mx和My分别为矩阵fjk的列数和行数,即在X、Y方向的采样点数。如果按照原图尺寸进行处理,则取X0=Y0=0,dX=dY=1,如果出于处理速度考虑,需要减小待处理彩色图像的尺寸,则适当增大dX和dY的值。
步骤102、将采样获得的彩色图像转化为灰度图,采用以下公式:
Y=0.299*R+0.587*G+0.114*B,其中R、G和B分别为彩色图像的红色、绿色和蓝色分量,Y为灰度值。
步骤103、采用全局自适应阈值方法将灰度图转换为二值图。如果灰度图是白底黑字,则二值图中文字部分所在像素取值为0,其余部分取值为1。
如果图像本身有倾斜,还需要对二值图进行矫正,进一步包括以下步骤:
首先采用侧面投影的方法确定图像的倾斜角度,投影即把二维平面上的图像信息映射为一维方向上叠加数据,其值的大小表示这个方向上图像白点数目的总和,它表示的是图像的一个全局特征。
采用f(x,y)表示白底黑字的二值图,图像外区域f(x,y) = 1,二值图Mx列、My行,当前的投影方向与X轴成θ角,
Sk=∑jf(Xj,Yk+Xj*tanθ),为一行的投影值,
若Sk等于Mx则取Sk=1,表示该行投影上无黑点,
若Sk小于Mx则取Sk=0,表示该行投影上有黑点,
Tθ= ∑kSk,表示θ角对应的全图投影值,
在限定范围内以预定步长变换θ值,Tθ值最大的角度就是图像的倾斜角度;
根据计算出的倾斜角度,采用二次线性插值将灰度图进行旋转,然后重复将灰度图转换为二值图,得到矫正后的二值图。
步骤104、确定图像中的文字和图片的位置,为重排版做好准备。首先对二值图进行游程平滑,是根据二值图中的数据0和数据1的个数来处理的,预定一个平滑值C,当二值图中连续的1的个数小于等于C时,这一串1将被0所取代。例如C = 4时的平滑结果,
原数值:11111100011110011000111110010011111
平滑后:11111100000000000000111110000011111。
步骤105、对游程平滑处理后的二值图求取值为0的连通域,把同值为0的且连通的一块区域的外接矩形的位置记录下来,作为初始块位置信息。
步骤106、将初始块进行水平合并,得出文字的行信息和图片位置。依据初始块的尺寸和初始块与初始块之间的水平间距将初始块进行水平合并,高度大于预设值的较大初始块不参加水平合并,被认定为图片,高度较小、小于预设值且水平间距小于预设值的初始块水平合并为一个块。
步骤107、将水平合并后的块进行垂直合并,得出文字段落位置。依据水平合并后的块的尺寸和水平合并后的块与水平合并后的块之间的垂直间距将水平合并后的块进行垂直合并,被认定为图片的初始块不参加垂直合并,高度相近、高度差小于预设值且垂直间距小于预设值的水平合并后的块垂直合并为一个块。
步骤108、根据文字段落位置和图片位置,对段落进行文字切分,首先在段落区域位置内进行水平投影,确定每行文字的位置,然后在一行的区域位置内进行垂直投影,确定每个文字的位置,同时要对过小的块进行合并,过大的块进行分裂。
步骤109、确定各段文字的阅读顺序,根据先验知识确定各段文字的阅读顺序,即从左至右,从上至下的阅读顺序。
步骤110、根据文字段落位置、图片位置和文字段落中文字的位置,将文字和图片按照预先指定的全图宽度和高度排版成新的图像,如果排不全则分多页显示。
步骤111、将排版后的新图像放大或缩小至电子阅读设备需要显示的尺寸。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (10)
1.一种扫描版文档重排版的方法,其特征在于,包括以下步骤:
A、将扫描版文档生成图像,对生成的图像进行采样获得待处理的彩色图像;
B、将采样获得的彩色图像转化为二值图;
C、对二值图进行游程平滑;
D、对游程平滑处理后的二值图求取连通域,把同值的且连通的一块区域的外接矩形的位置记录下来,作为初始块位置信息;
E、将初始块进行水平合并,得出文字的行信息和图片位置;
F、将水平合并后的块进行垂直合并,得出文字段落位置;
G、根据文字段落位置和图片位置,对段落进行文字切分,首先在段落区域位置内进行水平投影,确定每行文字的位置,然后在一行的区域位置内进行垂直投影,确定每个文字的位置;
H、确定各段文字的阅读顺序;
I、根据文字段落位置、图片位置和文字段落中文字的位置,将文字和图片按照预先指定的全图宽度和高度排版成新的图像。
2.根据权利要求1所述的一种扫描版文档重排版的方法,其特征在于,还包括以下步骤:
J、将排版后的新图像放大或缩小至电子阅读设备需要显示的尺寸。
3.根据权利要求1所述的一种扫描版文档重排版的方法,其特征在于,步骤A中,对生成的图像进行采样,采样值采用矩阵fjk形式来表示,矩阵中的每一元素fjk取值如下:
fjk = f(X0+j*dX,Y0+k*dY),
其中,j为0到Mx–1的整数,k为0到My–1的整数,X0和Y0为初始坐标,dX和dY为步长,Mx和My分别为矩阵fjk的列数和行数,即在X、Y方向的采样点数。
4.根据权利要求1所述的一种扫描版文档重排版的方法,其特征在于,步骤B进一步包括以下步骤:
B1、将采样获得的彩色图像转化为灰度图;
B2、采用全局自适应阈值方法将灰度图转换为二值图。
5.根据权利要求4所述的一种扫描版文档重排版的方法,其特征在于,步骤B1中,将采样获得的彩色图像转化为灰度图采用以下公式:
Y=0.299*R+0.587*G+0.114*B,其中R、G和B分别为彩色图像的红色、绿色和蓝色分量,Y为灰度值。
6.根据权利要求4所述的一种扫描版文档重排版的方法,其特征在于,步骤B2中,如果灰度图是白底黑字,则二值图中文字部分所在像素取值为0,其余部分取值为1。
7.根据权利要求4或者6所述的一种扫描版文档重排版的方法,其特征在于,步骤B2中,还包括对二值图进行矫正,进一步包括以下步骤:
采用侧面投影的方法确定图像的倾斜角度,
即采用f(x,y)表示白底黑字的二值图,图像外区域f(x,y) = 1,二值图Mx列、My行,当前的投影方向与X轴成θ角,
Sk=∑jf(Xj,Yk+Xj*tanθ),为一行的投影值,
若Sk等于Mx则取Sk=1,表示该行投影上无黑点,
若Sk小于Mx则取Sk=0,表示该行投影上有黑点,
Tθ= ∑kSk,表示θ角对应的全图投影值,
在限定范围内以预定步长变换θ值,Tθ值最大的角度就是图像的倾斜角度;
根据计算出的倾斜角度,采用二次线性插值将灰度图进行旋转,然后重复步骤B2得到矫正后的二值图。
8.根据权利要求1或者6所述的一种扫描版文档重排版的方法,其特征在于,步骤C中,对二值图进行游程平滑是根据二值图中的数据0和数据1的个数来处理的,预定一个平滑值C,当二值图中连续的1的个数小于等于C时,这一串1将被0所取代。
9.根据权利要求1或者6所述的一种扫描版文档重排版的方法,其特征在于,步骤E中,依据初始块的尺寸和初始块与初始块之间的水平间距将初始块进行水平合并,高度大于预设值的初始块不参加水平合并,被认定为图片,高度小于预设值且水平间距小于预设值的初始块水平合并为一个块。
10.根据权利要求9所述的一种扫描版文档重排版的方法,其特征在于,步骤F中,依据水平合并后的块的尺寸和水平合并后的块与水平合并后的块之间的垂直间距将水平合并后的块进行垂直合并,被认定为图片的初始块不参加垂直合并,高度差小于预设值且垂直间距小于预设值的水平合并后的块垂直合并为一个块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110302266.8A CN102890826B (zh) | 2011-08-12 | 2011-10-09 | 一种扫描版文档重排版的方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110230651.6 | 2011-08-12 | ||
CN201110230651 | 2011-08-12 | ||
CN2011102306516 | 2011-08-12 | ||
CN201110302266.8A CN102890826B (zh) | 2011-08-12 | 2011-10-09 | 一种扫描版文档重排版的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102890826A true CN102890826A (zh) | 2013-01-23 |
CN102890826B CN102890826B (zh) | 2015-09-09 |
Family
ID=47534318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110302266.8A Active CN102890826B (zh) | 2011-08-12 | 2011-10-09 | 一种扫描版文档重排版的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102890826B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103092989A (zh) * | 2013-02-08 | 2013-05-08 | 广州市渡明信息技术有限公司 | 适应终端屏幕的图片显示方法及设备 |
CN103488619A (zh) * | 2013-07-05 | 2014-01-01 | 百度在线网络技术(北京)有限公司 | 一种用于进行文档文件处理的方法及装置 |
CN105389165A (zh) * | 2015-10-21 | 2016-03-09 | 广州视睿电子科技有限公司 | 一种文档图片显示方法、装置及终端 |
CN108133214A (zh) * | 2017-12-25 | 2018-06-08 | 广东小天才科技有限公司 | 一种基于图片纠正的信息搜索方法及移动终端 |
CN108804978A (zh) * | 2017-04-28 | 2018-11-13 | 腾讯科技(深圳)有限公司 | 一种版面分析方法及装置 |
CN109934210A (zh) * | 2019-05-17 | 2019-06-25 | 上海肇观电子科技有限公司 | 版面分析方法、阅读辅助设备、电路和介质 |
CN110706310A (zh) * | 2019-08-23 | 2020-01-17 | 华为技术有限公司 | 一种图文融合方法、装置及电子设备 |
CN110728129A (zh) * | 2019-09-03 | 2020-01-24 | 北京字节跳动网络技术有限公司 | 对图片中的文本内容进行排版的方法、装置、介质和设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080240618A1 (en) * | 2007-03-30 | 2008-10-02 | Sharp Kabushiki Kaisha | Image-document retrieving apparatus, method of retrieving image document, program, and recording medium |
CN101876967A (zh) * | 2010-03-25 | 2010-11-03 | 深圳市万兴软件有限公司 | 一种pdf文本段落生成的方法 |
CN101937428A (zh) * | 2010-08-11 | 2011-01-05 | 优视科技有限公司 | 移动终端设备的带文字内容的图片的重新排版方法及系统 |
-
2011
- 2011-10-09 CN CN201110302266.8A patent/CN102890826B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080240618A1 (en) * | 2007-03-30 | 2008-10-02 | Sharp Kabushiki Kaisha | Image-document retrieving apparatus, method of retrieving image document, program, and recording medium |
CN101876967A (zh) * | 2010-03-25 | 2010-11-03 | 深圳市万兴软件有限公司 | 一种pdf文本段落生成的方法 |
CN101937428A (zh) * | 2010-08-11 | 2011-01-05 | 优视科技有限公司 | 移动终端设备的带文字内容的图片的重新排版方法及系统 |
Non-Patent Citations (2)
Title |
---|
岳宁: "多区域图像的分割和倾斜检测方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 August 2008 (2008-08-15) * |
李小锋: "基于非文本图像优先的中文版面分析技术研究和应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 August 2010 (2010-08-15) * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103092989A (zh) * | 2013-02-08 | 2013-05-08 | 广州市渡明信息技术有限公司 | 适应终端屏幕的图片显示方法及设备 |
CN103488619A (zh) * | 2013-07-05 | 2014-01-01 | 百度在线网络技术(北京)有限公司 | 一种用于进行文档文件处理的方法及装置 |
CN105389165A (zh) * | 2015-10-21 | 2016-03-09 | 广州视睿电子科技有限公司 | 一种文档图片显示方法、装置及终端 |
CN105389165B (zh) * | 2015-10-21 | 2019-04-30 | 广州视睿电子科技有限公司 | 一种文档图片显示方法、装置及终端 |
CN108804978A (zh) * | 2017-04-28 | 2018-11-13 | 腾讯科技(深圳)有限公司 | 一种版面分析方法及装置 |
CN108804978B (zh) * | 2017-04-28 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 一种版面分析方法及装置 |
CN108133214A (zh) * | 2017-12-25 | 2018-06-08 | 广东小天才科技有限公司 | 一种基于图片纠正的信息搜索方法及移动终端 |
CN109934210A (zh) * | 2019-05-17 | 2019-06-25 | 上海肇观电子科技有限公司 | 版面分析方法、阅读辅助设备、电路和介质 |
US10467466B1 (en) | 2019-05-17 | 2019-11-05 | NextVPU (Shanghai) Co., Ltd. | Layout analysis on image |
CN110706310A (zh) * | 2019-08-23 | 2020-01-17 | 华为技术有限公司 | 一种图文融合方法、装置及电子设备 |
CN110706310B (zh) * | 2019-08-23 | 2021-10-22 | 华为技术有限公司 | 一种图文融合方法、装置及电子设备 |
CN110728129A (zh) * | 2019-09-03 | 2020-01-24 | 北京字节跳动网络技术有限公司 | 对图片中的文本内容进行排版的方法、装置、介质和设备 |
Also Published As
Publication number | Publication date |
---|---|
CN102890826B (zh) | 2015-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102890826A (zh) | 一种扫描版文档重排版的方法 | |
JP4646797B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
EP3104332B1 (en) | Digital image manipulation | |
US7950589B2 (en) | Program, information storage medium, two-dimensional code generation system, image generation system and printed material | |
CN110298282B (zh) | 文档图像处理方法、存储介质和计算设备 | |
CN102622593B (zh) | 一种文本识别方法及系统 | |
JP2007317184A (ja) | 二次元バーコード、その符号化方法及び復号化方法 | |
CN105765551A (zh) | 用于三维几何重建所捕获的图像数据的系统和方法 | |
KR20120138633A (ko) | 영상 처리 방법, 영상 처리 장치 및 스캐너 | |
CN101155248B (zh) | 图像处理设备及产生轮廓图像数据的方法 | |
KR101597739B1 (ko) | 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체 | |
JP2015122614A (ja) | 画像補正装置、及び画像補正方法、プログラム | |
US10455163B2 (en) | Image processing apparatus that generates a combined image, control method, and storage medium | |
CN104346613B (zh) | 图像处理装置以及图像处理方法 | |
JP2007241356A (ja) | 画像処理装置および画像処理プログラム | |
CN108965646B (zh) | 图像处理装置、图像处理方法 | |
GB2560456A (en) | Billboard containing encoded information | |
KR20100092778A (ko) | 문자 인식의 왜곡을 보정하는 방법 | |
CN106780474B (zh) | 一种基于Kinect的实时深度图与彩图的配准及优化方法 | |
CN102890827B (zh) | 一种扫描版文档重排版的方法 | |
JP5067882B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
CN110557622B (zh) | 基于结构光的深度信息获取方法及装置、设备及介质 | |
CN104933430B (zh) | 一种用于移动终端的交互式图像处理方法及系统 | |
US9268415B2 (en) | Touch positioning method utilizing optical identification (OID) technology, OID positioning system and OID reader | |
CN102843479A (zh) | 文件扫描方法、文件扫描装置及便携式电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |