CN102890827A - 一种扫描版文档重排版的方法 - Google Patents
一种扫描版文档重排版的方法 Download PDFInfo
- Publication number
- CN102890827A CN102890827A CN2011103023016A CN201110302301A CN102890827A CN 102890827 A CN102890827 A CN 102890827A CN 2011103023016 A CN2011103023016 A CN 2011103023016A CN 201110302301 A CN201110302301 A CN 201110302301A CN 102890827 A CN102890827 A CN 102890827A
- Authority
- CN
- China
- Prior art keywords
- document
- zone
- document segment
- segment zone
- version
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
本发明公开了一种扫描版文档重排版的方法,首先将扫描版文档生成图像,转化为二值图,对二值图进行游程平滑、求取连通域、水平合并和垂直合并,得出文字段落位置,根据获得的图片位置和文字段落位置,确定文档段落区域,计算每个文档段落区域的宽高之比和显示屏幕的宽高之比,判断文档段落区域的宽高之比是否满足预设条件,如果满足则不处理,如果不满足,则拆分成多个的满足预设条件的文档段落区域;确定所有文档段落区域的阅读顺序,并按照顺序提供逐屏阅读。采用了本发明的技术方案,能够对电子阅读中扫描版文档进行自动分栏,将扫描版文档根据自动划分的区域逐屏显示,减少选择放大区域的频率。
Description
技术领域
本发明涉及电子阅读技术领域,尤其涉及一种扫描版文档重排版的方法。
背景技术
在科学技术日新月异的今天,尤其是伴随着互联网技术的高速发展,人们的阅读习惯不再只局限于传统的纸质出版物阅读,电子阅读已经非常普及并且比重正在逐渐加大。由于电子阅读终端(电子书、手机等)的便携性,人们可以在生活中的碎片时间里进行电子阅读,比如乘坐公交车、地铁时,甚至在排队买票的几分钟时间里也可以进行电子阅读。
电子阅读素材的来源多种多样,有些来自电子出版物,有些来自纸质出版物的扫描版本。但是由于电子阅读终端的便携性,必然造成阅读屏幕的尺寸受限。在当前各种电子阅读终端的阅读体验中,对于扫描版文档的阅读非常不方便,如果将书页大小尺寸的扫描图片全部显示在小尺寸屏幕中会觉得字太小;如果采用将扫描图片局部放大的方式阅读,需要频繁地选择放大区域,会影响用户的阅读体验。
发明内容
本发明的目的在于提出一种扫描版文档重排版的方法,能够对电子阅读中扫描版文档进行自动分栏,将扫描版文档根据自动划分的区域逐屏显示,减少选择放大区域的频率。
为达此目的,本发明采用以下技术方案:
一种扫描版文档重排版的方法,包括以下步骤:
A、将扫描版文档生成图像,转化为二值图;
B、对二值图进行游程平滑,并对游程平滑处理后的二值图求取连通域,把同值的且连通的一块区域的外接矩形的位置记录下来,作为初始块位置信息;
C、将初始块进行水平合并,得出文字的行信息和图片位置,再将水平合并后的块进行垂直合并,得出文字段落位置;
D、根据获得的图片位置和文字段落位置,确定文档段落区域;
E、计算每个文档段落区域的宽高之比r,计算显示屏幕的宽高之比R;
F、如果一个文档段落区域的宽高之比满足以下公式:
r∈[R-d1,R+d2],其中d1和d2为预设的正的常数,则不处理所述文档段落区域,如果不满足,则将所述文档段落区域拆分成不少于2个的满足所述公式的文档段落区域;
G、确定所有文档段落区域的阅读顺序,并按照顺序将获得的文档段落区域放大或缩小至需要显示的尺寸,提供逐屏阅读。
步骤A中,采用全局自适应阈值方式将生成的图像转化为二值图。
步骤F中,将所述文档段落区域拆分成不少于2个的满足所述公式的文档段落区域时,拆分的分割线在空白区域。
或者步骤F中,将所述文档段落区域拆分成不少于2个的满足所述公式的文档段落区域时,采用将所述文档段落区域进行等分的方式。
步骤G中确定所有文档段落区域的阅读顺序进一步包括以下步骤:
G1、设步骤D中获得的文档段落区域的数量为n,整个文档用集合表示为S={B1,B2,…,Bn},其中Bn表示第n个文档段落区域,设(Xi,Yi)表示文档段落区域Bi的左上顶点的坐标,其中i=1,2,…,n;
G2、对整个文档S中元素进行调整,使调整后的S={B1,B2,…,Bn}满足以下条件:
对于Bi和Bj,并且i<j,若Yi∈[Yj-a1,Yj+a2],其中a1和a2为正的常数,则满足Xi≤Xj,否则需满足Yi≤Yj;
G3、若步骤F中文档段落区域Bi被拆分为S’={P1,P2,…,Pk},按照步骤G2的要求去调整S’中元素的位置,得到调整后的S’={P1,P2,…,Pk},其中Pk表示调整后的第k个文档段落区域,k为正整数;
G4、对于每个被拆分的文档段落区域Bi,将采用步骤G3得到的调整后的S’中的元素全部加入到S中Bi所在的位置,并将Bi从S中删除,得到新的集合S” = {Q1,Q2,…,Qm},其中Qm表示调整后的第m个文档段落区域,m为正整数;
G5、采用Q1,Q2,…,Qm的顺序确定阅读文档段落区域的顺序。
采用了本发明的技术方案,能够对电子阅读中扫描版文档进行自动分栏,将扫描版文档根据自动划分的区域逐屏显示,减少选择放大区域的频率,从而提高用户电子阅读的感受度。
附图说明
图1是本发明具体实施方式中扫描版文档重排版的流程图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
图1是本发明具体实施方式中扫描版文档重排版的流程图。如图1所示,该扫描版文档重排版的流程包括以下步骤:
步骤101、将扫描版文档生成图像,转化为二值图。可以有多种方法将原始图像转换为二值图,如全局自适应阈值方法、局部阈值方法等等。为了不失一般性,采用全局自适应阈值方法转换二值图。
步骤102、对二值图进行游程平滑,并对游程平滑处理后的二值图求取连通域,把同值的且连通的一块区域的外接矩形的位置记录下来,作为初始块位置信息.
步骤103、将初始块进行水平合并,得出文字的行信息和图片位置,再将水平合并后的块进行垂直合并,得出文字段落位置。
步骤104、根据获得的图片位置和文字段落位置,确定文档段落区域。
步骤105、计算每个文档段落区域的宽高之比r=w/h,计算显示屏幕的宽高之比R=W/H。
步骤106、如果一个文档段落区域的宽高之比满足以下公式:
r∈[R-d1,R+d2],其中d1和d2为预设的正的常数,d1和d2的选取原则是:显示最后文档段落区域时能尽可能地利用显示屏幕,则不处理该文档段落区域,如果不满足,则将该文档段落区域拆分成多个满足上述公式的文档段落区域,并尽可能地保证拆分的分割线在空白区域,如果没有空白区域,则采用将该文档段落区域进行等分的方式分割。
步骤107、确定所有文档段落区域的阅读顺序,具体包括以下步骤:
1、设步骤104中获得的文档段落区域的数量为n,整个文档用集合表示为S={B1,B2,…,Bn},其中Bn表示第n个文档段落区域,设(Xi,Yi)表示文档段落区域Bi的左上顶点的坐标,其中i=1,2,…,n。
2、对整个文档S中元素进行调整,使调整后的S={B1,B2,…,Bn}满足以下条件:
对于Bi和Bj,并且i<j,若Yi∈[Yj-a1,Yj+a2],其中a1和a2为正的常数,则满足Xi≤Xj,否则需满足Yi≤Yj。
3、若步骤106中文档段落区域Bi被拆分为S’={P1,P2,…,Pk},按照步骤2的要求去调整S’中元素的位置,得到调整后的S’={P1,P2,…,Pk},其中Pk表示调整后的第k个文档段落区域,k为正整数。
4、对于每个被拆分的文档段落区域Bi,将采用步骤3得到的调整后的S’中的元素全部加入到S中Bi所在的位置,并将Bi从S中删除,得到新的集合S” = {Q1,Q2,…,Qm},其中Qm表示调整后的第m个文档段落区域,m为正整数。
5、采用Q1,Q2,…,Qm的顺序作为阅读文档段落区域的顺序。
步骤108、按照顺序将获得的文档段落区域放大或缩小至需要显示的尺寸,提供逐屏阅读。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (5)
1.一种扫描版文档重排版的方法,其特征在于,包括以下步骤:
A、将扫描版文档生成图像,转化为二值图;
B、对二值图进行游程平滑,并对游程平滑处理后的二值图求取连通域,把同值的且连通的一块区域的外接矩形的位置记录下来,作为初始块位置信息;
C、将初始块进行水平合并,得出文字的行信息和图片位置,再将水平合并后的块进行垂直合并,得出文字段落位置;
D、根据获得的图片位置和文字段落位置,确定文档段落区域;
E、计算每个文档段落区域的宽高之比r,计算显示屏幕的宽高之比R;
F、如果一个文档段落区域的宽高之比满足以下公式:
r∈[R-d1,R+d2],其中d1和d2为预设的正的常数,则不处理所述文档段落区域,如果不满足,则将所述文档段落区域拆分成不少于2个的满足所述公式的文档段落区域;
G、确定所有文档段落区域的阅读顺序,并按照顺序将获得的文档段落区域放大或缩小至需要显示的尺寸,提供逐屏阅读。
2.根据权利要求1所述的一种扫描版文档重排版的方法,其特征在于,步骤A中,采用全局自适应阈值方式将生成的图像转化为二值图。
3.根据权利要求1所述的一种扫描版文档重排版的方法,其特征在于,步骤F中,将所述文档段落区域拆分成不少于2个的满足所述公式的文档段落区域时,拆分的分割线在空白区域。
4.根据权利要求1所述的一种扫描版文档重排版的方法,其特征在于,步骤F中,将所述文档段落区域拆分成不少于2个的满足所述公式的文档段落区域时,采用将所述文档段落区域进行等分的方式。
5.根据权利要求1所述的一种扫描版文档重排版的方法,其特征在于,步骤G中确定所有文档段落区域的阅读顺序进一步包括以下步骤:
G1、设步骤D中获得的文档段落区域的数量为n,整个文档用集合表示为S={B1,B2,…,Bn},其中Bn表示第n个文档段落区域,设(Xi,Yi)表示文档段落区域Bi的左上顶点的坐标,其中i=1,2,…,n;
G2、对整个文档S中元素进行调整,使调整后的S={B1,B2,…,Bn}满足以下条件:
对于Bi和Bj,并且i<j,若Yi∈[Yj-a1,Yj+a2],其中a1和a2为正的常数,则满足Xi≤Xj,否则需满足Yi≤Yj;
G3、若步骤F中文档段落区域Bi被拆分为S’={P1,P2,…,Pk},按照步骤G2的要求去调整S’中元素的位置,得到调整后的S’={P1,P2,…,Pk},其中Pk表示调整后的第k个文档段落区域,k为正整数;
G4、对于每个被拆分的文档段落区域Bi,将采用步骤G3得到的调整后的S’中的元素全部加入到S中Bi所在的位置,并将Bi从S中删除,得到新的集合S” = {Q1,Q2,…,Qm},其中Qm表示调整后的第m个文档段落区域,m为正整数;
G5、采用Q1,Q2,…,Qm的顺序确定阅读文档段落区域的顺序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110302301.6A CN102890827B (zh) | 2011-10-09 | 2011-10-09 | 一种扫描版文档重排版的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110302301.6A CN102890827B (zh) | 2011-10-09 | 2011-10-09 | 一种扫描版文档重排版的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102890827A true CN102890827A (zh) | 2013-01-23 |
CN102890827B CN102890827B (zh) | 2015-05-13 |
Family
ID=47534319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110302301.6A Active CN102890827B (zh) | 2011-10-09 | 2011-10-09 | 一种扫描版文档重排版的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102890827B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10778928B2 (en) | 2015-02-12 | 2020-09-15 | Samsung Electronics Co., Ltd. | Device and method for inputting note information into image of photographed object |
CN112507666A (zh) * | 2020-12-21 | 2021-03-16 | 北京百度网讯科技有限公司 | 文档转换方法、装置、电子设备及存储介质 |
WO2021083057A1 (zh) * | 2019-10-29 | 2021-05-06 | 维沃移动通信有限公司 | 图片显示方法、装置、电子设备及介质 |
CN115828883A (zh) * | 2022-12-07 | 2023-03-21 | 广州文石信息科技有限公司 | 文档内容重排版的方法、装置、电子显示设备以及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030202699A1 (en) * | 2002-04-25 | 2003-10-30 | Simard Patrice Y. | System and method facilitating document image compression utilizing a mask |
WO2004068368A1 (en) * | 2003-01-31 | 2004-08-12 | Canon Kabushiki Kaisha | Image processing method, system, program, program storage medium and information processing apparatus |
CN1525355A (zh) * | 2003-02-21 | 2004-09-01 | ������������ʽ���� | 图像处理方法与图像处理系统 |
CN1604073A (zh) * | 2004-11-22 | 2005-04-06 | 北京北大方正技术研究院有限公司 | 一种对报纸版面进行标题与正文逻辑关联的方法 |
-
2011
- 2011-10-09 CN CN201110302301.6A patent/CN102890827B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030202699A1 (en) * | 2002-04-25 | 2003-10-30 | Simard Patrice Y. | System and method facilitating document image compression utilizing a mask |
WO2004068368A1 (en) * | 2003-01-31 | 2004-08-12 | Canon Kabushiki Kaisha | Image processing method, system, program, program storage medium and information processing apparatus |
CN1525355A (zh) * | 2003-02-21 | 2004-09-01 | ������������ʽ���� | 图像处理方法与图像处理系统 |
CN1604073A (zh) * | 2004-11-22 | 2005-04-06 | 北京北大方正技术研究院有限公司 | 一种对报纸版面进行标题与正文逻辑关联的方法 |
Non-Patent Citations (1)
Title |
---|
岳宁: "多区域图像的分割和倾斜检测方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10778928B2 (en) | 2015-02-12 | 2020-09-15 | Samsung Electronics Co., Ltd. | Device and method for inputting note information into image of photographed object |
WO2021083057A1 (zh) * | 2019-10-29 | 2021-05-06 | 维沃移动通信有限公司 | 图片显示方法、装置、电子设备及介质 |
CN112507666A (zh) * | 2020-12-21 | 2021-03-16 | 北京百度网讯科技有限公司 | 文档转换方法、装置、电子设备及存储介质 |
CN112507666B (zh) * | 2020-12-21 | 2023-07-11 | 北京百度网讯科技有限公司 | 文档转换方法、装置、电子设备及存储介质 |
CN115828883A (zh) * | 2022-12-07 | 2023-03-21 | 广州文石信息科技有限公司 | 文档内容重排版的方法、装置、电子显示设备以及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102890827B (zh) | 2015-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105760178B (zh) | 对界面控件进行适配的方法及装置 | |
US10432820B2 (en) | Image processing apparatus, image processing system, control method for image processing apparatus, and non-transitory computer readable medium | |
JP4774816B2 (ja) | 画像処理装置,画像処理方法,およびコンピュータプログラム。 | |
JP6713141B1 (ja) | レイアウト解析方法、読書補助装置、回路及び媒体 | |
US10002451B2 (en) | Text-based image resizing | |
WO2009090901A1 (ja) | モザイク画像生成装置、方法及びプログラム | |
CN102890826B (zh) | 一种扫描版文档重排版的方法 | |
CN102890827A (zh) | 一种扫描版文档重排版的方法 | |
RU2616173C2 (ru) | Способ, устройство и терминальное устройство для адаптации страницы | |
JP5675194B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JPWO2012114727A1 (ja) | 画像処理装置および画像処理方法 | |
JP2012038286A (ja) | コンテンツ解析装置、方法およびプログラム | |
JP4356752B2 (ja) | 文書編集装置、プログラムおよび記憶媒体 | |
US20160104052A1 (en) | Text-based thumbnail generation | |
KR20160138930A (ko) | 만화 컨텐츠의 이미지컷 정렬 방법 | |
CN102375649A (zh) | 图像显示方法及移动终端 | |
JP2010004166A (ja) | モザイク画像提供装置、方法及びプログラム | |
CN101820486B (zh) | 图像处理装置 | |
JP4541770B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP5501915B2 (ja) | レイアウト選択装置、レイアウト選択方法、レイアウト選択プログラムおよびコンピュータ読み取り可能な記録媒体、ならびに、コンテンツ表示装置およびコンテンツ作成方法 | |
WO2007001026A1 (ja) | 画像処理装置及び画像処理方法 | |
JP2010182204A (ja) | 画像処理方法および画像処理装置およびプログラム | |
JP2010008955A (ja) | 画像データ編集装置、画像データ編集方法及びコンピュータプログラム | |
CN104778456A (zh) | 垃圾视频的识别方法及装置 | |
JP5977342B2 (ja) | 電子コミックデータ圧縮装置、方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |