CN109522539A - 基于移动设备的pdf学术论文重排版系统及方法 - Google Patents
基于移动设备的pdf学术论文重排版系统及方法 Download PDFInfo
- Publication number
- CN109522539A CN109522539A CN201811421742.6A CN201811421742A CN109522539A CN 109522539 A CN109522539 A CN 109522539A CN 201811421742 A CN201811421742 A CN 201811421742A CN 109522539 A CN109522539 A CN 109522539A
- Authority
- CN
- China
- Prior art keywords
- text
- paper
- academic paper
- mobile device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 15
- 238000006243 chemical reaction Methods 0.000 claims abstract description 5
- 238000004321 preservation Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 6
- 230000006978 adaptation Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/189—Automatic justification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
本发明公开了一种基于移动设备的PDF学术论文重排版系统,包括:其一为细粒度地解析原始PDF,得到包括文字、矢量元素等并不具有论文结构信息的元素,再将得到的的元素整合成学术论文各元素,包括正文段落、标题、出版信息、参考文献、图表、图注等文本与媒体元素;其二为根据移动设备不同的设备像素(dp)以及pdf页面宽高得出转换比率,再按照不同的排版法则对学术论文中各类元素进行布局。本发明能够细粒度对PDF中的文字与矢量元素进行解析,从而提高PDF各元素解析的准确率,依据提取到的元素信息对原始PDF学术论文进行重构,进而结合移动设备显示特点动态地按照不同的排版法则调整各元素的坐标位置和大小,从而实现在移动设备上对PDF学术论文进行重排版。
Description
技术领域
本发明涉及小屏超高分辨率显示技术/PDF解析与重排版等领域,尤其是基于移动设备的PDF学术论文重排版系统。
背景技术
PDF是目前非常流行的电子文档格式,它可以将文字、字形、格式、样式及图形图像等封装在一个文件中,由于它可以不依赖操作系统的语言和字体及显示设备,因此很适合阅读,是目前学术论文最常用的电子文档和数字化信息传播的载体。
目前PDF学术论文已经广泛应用于PC端阅览,然而随着移动互联网的发展,学者们希望能够通过移动设备随时随地地阅览学术论文,因此在移动设备上高效、高分辨地对PDF学术论文信息显示是一个很有意义的扩展。目前移动设备上阅览PDF学术论文尚存在一些问题,主要表现在:
a)对页面缩小时,页面所有元素为了保持其整体布局会同时缩小,文字及论文中的图表等元素过小则会导致细节看不清楚。
b)对页面放大时,页面所有元素为了保持其整体布局会同时放大,位图元素会因为放大而导致分辨率下降降低清晰度,并且窗口只会显现指针定位所在区域,页面其它部分会因为窗口容纳不下而不在窗口可见区域中显示,影响阅览体验。
为使PDF文件更好地在移动设备上阅览,目前已有了一些工具可以实现对PDF在移动端适配,而仅依据移动设备的设备像素(dp)与屏幕像素(px)的比例对pdf元素进行缩放的方法对PDF学术论文并不适用,这种适配方法会造成失真因此更适合于对质量要求不高的pdf文件,主要表现在:
c)文本元素的处理,在移动设备上适配时,其文本样式可能会丢失、文字相对于页面的相对坐标往往不精确,造成与原生PDF学术论文样式不一致的情况。
d)图像元素的处理,位图图像在PDF进行压缩处理后,质量会下降从而影响阅读体验,而矢量图像这类由PATH组合而成的复杂路径图像,会被识别成单独的个体,从而无法得到完整图像其精准地坐标信息。
名称解释:
Path类型的元素:它是SVG(可缩放矢量图形)中的一种元素,该元素用于定义一些复杂的图形,它有相应的指令来绘制直线、矩阵、贝塞尔曲线,可以结合使用直线,曲线等来制作各种不规则的图形。
PDF内容流:它由一系列指令组成,用于描述页面的外观或其他图形实体的外观和文件内容。
发明内容
为了克服移动设备阅览PDF格式的论文需要手动缩放PDF带来的用户体验不佳以及将PDF适配移动设备带来的失真的不足,本发明主要解决的技术问题是提供一种基于移动设备的PDF学术论文重排版系统及方法,本发明能够细粒度对PDF中的文字与矢量元素进行解析,从而提高PDF各元素解析的准确率,依据提取到的元素信息对原始PDF学术论文进行重构,进而结合移动设备显示特点动态地按照不同的排版法则调整各元素的坐标位置和大小,从而实现在移动设备上对PDF学术论文进行重排版。
本发明采用的一个技术方案是:
一种基于移动设备的PDF学术论文重排版方法,包括以下步骤:
步骤一、解析文字元素:提取PDF页面元素中类型为文字的元素及文字的元素的样式信息,并求得文字密度及行间距;划分论文中的正文段落与非正文文本;
步骤二、解析矢量元素:提取PDF页面中类型为path的元素,并根据path元素在绘制过程中的操作符的不同,来分类地扩充path元素的坐标范围,检查path元素周围是否有图片或者图片以外非文本元素与path元素有相交或相切的关系,若有则对图片或者图片以外非文本元素组合并合并,从而得出论文中图表的坐标范围;
步骤三、重构PDF,借助解析的文字元素和矢量元素所得到的具有论文结构意义的元素信息,结合PDF内容流,来一一对应PDF中各实体的位置及内容,对PDF进行重构从而得出PDF学术论文中各模块的坐标与样式信息,并按设定的数据结构进行保存;
步骤四、重排版:根据移动设备显示特点,动态调整学术论文各元素在窗口中的坐标与大小,实现重排版。
进一步的改进,所述步骤四的具体步骤如下:根据移动设备窗口大小与PDF页面大小求出转换倍率,在此基础上对重构后的PDF学术论文中的正文段落、非正文文本、图表元素调整坐标及大小,并布局在移动设备的显示窗口中。
进一步的改进,所述矢量元素包括学术论文中的图片、表格、分隔符。
进一步的改进,所述步骤三中,保存时采用的数据格式为json,具体内容为每一页中文字元素和矢量元素的类型、坐标、样式信息。
进一步的改进,所述文字的元素的样式具体包括:字体大小,字体名、文字坐标、文字样式;文字样式包括加粗和倾斜。
一种基于移动设备的PDF学术论文重排版系统,包括文字解析模块、矢量元素解析模块、PDF学术论文重构模块、PDF学术论文重排版模块
文字解析模块:用于提取PDF页面元素中类型为文字的元素及文字的元素的样式信息,样式信息包括:字体大小,字体名、文字坐标、文字样式;文字样式包括加粗和倾斜,并求得文字密度及行间距;根据文字的元素的样式信息来划分论文中的正文段落与非正文文本;
矢量元素解析模块:提取PDF页面中类型为path的元素,并根据path元素在绘制过程中的操作符的不同,来分类地扩充path元素的坐标范围,检查path元素周围是否有图片或者图片以外非文本元素与path元素有相交或相切的关系,若有则对图片或者图片以外非文本元素组合并合并,从而得出论文中图表的坐标范围;
Pdf学术论文重构模块:借助文字解析模块和矢量元素解析模块所得到的具有论文结构意义的元素信息,结合PDF内容流,对PDF进行重构从而得出PDF学术论文中各模块的坐标与样式信息,并按设定的数据结构进行保存;
PDF学术论文重排版模块:根据移动设备显示特点,动态调整学术论文各元素在窗口中的坐标与大小,实现重排版
本发明的有益效果是:
a)本发明可以对原生PDF学术论文进行解析及重构,并在移动设备上重排版,因此在移动设备上阅览PDF学术论文时无须手动缩放。
b)本发明实现细粒度地对PDF文字元素进行解析,高准确率地获取了文本段落信息,同时避免了文字样式丢失的情况发生。
c)本发明实现细粒度地对PDF中复杂路径图像的解析,高准确率地获取了由其组合而成的矢量图像信息,从而保证在移动设备上高质量高分辨率地打印。
附图说明
图1是本发明一种基于移动设备的PDF学术论文重排版系统的处理流程示意图;
图2是一种PDF文字元素解析所示的分解示意图;
图3是一种PDF媒体元素解析所示的分解示意图;
图4是一种PDF重排版所示的分解示意图;
具体实施方式
下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
参见图1,本发明公开了一种基于移动设备的PDF学术论文重排版系统。其一为细粒度地解析原始PDF,得到包括文字、矢量元素等并不具有论文结构信息的元素,再将得到的的元素整合成学术论文各元素,包括正文段落、标题、出版信息、参考文献、图表、图注等文本与媒体元素;其二为根据移动设备不同的设备像素(dp)以及pdf页面宽高得出转换比率,再按照不同的排版法则对学术论文中各类元素进行布局。本发明能够细粒度对PDF中的方字与矢量元素进行解析,从而提高PDF各元素解析的准确率,依据提取到的元素信息对原始PDF学术论文进行重构,进而结合移动设备显示特点动态地按照不同的排版法则调整各元素的坐标位置和大小,从而实现在移动设备上对PDF学术论文进行重排版。具体步骤为:
步骤一、解析文字元素:提取PDF页面元素中类型为文字的元素及它的样式信息,样式信息具体包括:字体大小,字体名、文字坐标、文字样式(加粗、倾斜),并进一步求得到文字密度及行间距。根据文字元素的这些特征来划分论文中的正文段落与非正文文本。
步骤二、解析矢量元素:提取PDF页面中类型为path的元素,并根据path元素在绘制过程中的操作符的不同,来分类地扩充其坐标范围,检查path元素周围是否有图片或者非文本元素与之有相交或相切的关系,若有则对其组合并合并,从而得出论文中图表的坐标范围。
步骤三、重构PDF,借助解析模块所得到的具有论文结构意义的元素信息,结合PDF内容流,对PDF进行重构从而得出PDF学术论文中各模块的坐标与样式信息,并按一定的数据结构进行保存,;
步骤四、重排版:根据移动设备显示特点,动态调整学术论文各元素在窗口中的坐标与大小,实现重排版。
参见图2提供了本发明文字解析模块的实现流程示意图。若类型为文字类型,则逐行遍历文本,获取整行文本信息,具体包括行坐标及字体名称、字体大小、字体样式是否加粗及是否倾斜等,并进一步求出文字密度及行间距,据此是否一致来划分段落,标记正文段落,文字密度及行间距异常的文本标记为非正文文本,此类文本为标题、图注或作为图表中一部分的非正文文本。
参见图3提供了本发明媒体元素解析模块的实现流程示意图。若类型为path类型,则开始路径图像处理,判断其操作符类型,根据操作符类型的不同来扩充坐标范围。由此得到复杂路径图像坐标范围后,检索周围是否有非正文文本或位图图像与之满足相交、相切这种需要合并的关系,若有,则对其合并组成完整的矢量元素,此类矢量元素可以在任何分辨下高质量地打印,不会失真,在论文中一般以图、表、分隔线出现。
参见图4提供了PDF重排版模块,根据移动设备窗口大小与PDF页面大小,求出转换倍率,将学术论文PDF中的各元素按倍率调整,并求出在窗口中的坐标位置,并按照一定的数据结构进行保存,内容为每一页中各类元素的类型、坐标及样式信息,具体为:
a)对于学术论文中的正文段落,保留其对齐方式,同时由于字体大小按照倍率做出了调整,字符间的间距、行间的行间距、段落间的间距也会相应地调整。
b)对于学术论文中的标题、出版信息、章节名、图注、参考文献等非正文段落的文本信息,保留其样式信息,其中包括加粗、倾斜、字体名。同时由于字体大小按照倍率做出了调整,字符间的间距、行间的行间距也会相应地调整。
c)对于学术论文中的图、表等矢量元素信息,保留其对齐方式,按倍率进行缩放布局在求出的坐标位置上。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (6)
1.一种基于移动设备的PDF学术论文重排版方法,其特征在于,包括以下步骤:
步骤一、解析文字元素:提取PDF页面元素中类型为文字的元素及文字的元素的样式信息,并求得文字密度及行间距;划分论文中的正文段落与非正文文本;
步骤二、解析矢量元素:提取PDF页面中类型为path的元素,并根据path元素在绘制过程中的操作符的不同,来分类地扩充path元素的坐标范围,检查path元素周围是否有图片或者图片以外非文本元素与path元素有相交或相切的关系,若有则对图片或者图片以外非文本元素组合并合并,从而得出论文中图表的坐标范围;
步骤三、重构PDF,借助解析的文字元素和矢量元素所得到的具有论文结构意义的元素信息,结合PDF内容流,来一一对应PDF中各实体的位置及内容,对PDF进行重构从而得出PDF学术论文中各模块的坐标与样式信息,并按设定的数据结构进行保存;
步骤四、重排版:根据移动设备显示特点,动态调整学术论文各元素在窗口中的坐标与大小,实现重排版。
2.如权利要求1所述的一种基于移动设备的PDF学术论文重排版方法,其特征在于:所述步骤四的具体步骤如下:根据移动设备窗口大小与PDF页面大小求出转换倍率,在此基础上对重构后的PDF学术论文中的正文段落、非正文文本、图表元素调整坐标及大小,并布局在移动设备的显示窗口中。
3.如权利要求1所述的基于移动设备的PDF学术论文重排版方法,其特征在于,所述矢量元素包括学术论文中的图片、表格、分隔符。
4.如权利要求1所述的基于移动设备的PDF学术论文重排版方法,其特征在于,所述步骤三中,保存时采用的数据格式为json,具体内容为每一页中文字元素和矢量元素的类型、坐标、样式信息。
5.如权利要求1所述的基于移动设备的PDF学术论文重排版方法,其特征在于,所述文字的元素的样式具体包括:字体大小,字体名、文字坐标、文字样式;文字样式包括加粗和倾斜。
6.一种基于移动设备的PDF学术论文重排版系统,其特征在于,包括文字解析模块、矢量元素解析模块、PDF学术论文重构模块、PDF学术论文重排版模块
文字解析模块:用于提取PDF页面元素中类型为文字的元素及文字的元素的样式信息,样式信息包括:字体大小,字体名、文字坐标、文字样式;文字样式包括加粗和倾斜,并求得文字密度及行间距;根据文字的元素的样式信息来划分论文中的正文段落与非正文文本;
矢量元素解析模块:提取PDF页面中类型为path的元素,并根据path元素在绘制过程中的操作符的不同,来分类地扩充path元素的坐标范围,检查path元素周围是否有图片或者图片以外非文本元素与path元素有相交或相切的关系,若有则对图片或者图片以外非文本元素组合并合并,从而得出论文中图表的坐标范围;
Pdf学术论文重构模块:借助文字解析模块和矢量元素解析模块所得到的具有论文结构意义的元素信息,结合PDF内容流,对PDF进行重构从而得出PDF学术论文中各模块的坐标与样式信息,并按设定的数据结构进行保存;
PDF学术论文重排版模块:根据移动设备显示特点,动态调整学术论文各元素在窗口中的坐标与大小,实现重排版。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811421742.6A CN109522539A (zh) | 2018-11-26 | 2018-11-26 | 基于移动设备的pdf学术论文重排版系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811421742.6A CN109522539A (zh) | 2018-11-26 | 2018-11-26 | 基于移动设备的pdf学术论文重排版系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109522539A true CN109522539A (zh) | 2019-03-26 |
Family
ID=65794526
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811421742.6A Pending CN109522539A (zh) | 2018-11-26 | 2018-11-26 | 基于移动设备的pdf学术论文重排版系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109522539A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443202A (zh) * | 2019-08-06 | 2019-11-12 | 北京如优教育科技有限公司 | 论文字体工整度即时分析平台、方法及存储介质 |
CN112100978A (zh) * | 2020-09-16 | 2020-12-18 | 掌阅科技股份有限公司 | 基于电子书的排版处理方法、电子设备及存储介质 |
CN114154460A (zh) * | 2021-12-02 | 2022-03-08 | 江苏中威科技软件系统有限公司 | 一种pdf文件转版式数据流文件的方法 |
CN114169289A (zh) * | 2021-12-10 | 2022-03-11 | 洪恩完美(北京)教育科技发展有限公司 | 图文混排方法以及装置 |
CN114218418A (zh) * | 2021-12-03 | 2022-03-22 | 北京艺源酷科技有限公司 | 一种对多种类型文件进行矢量编辑设计的方法 |
CN114610426A (zh) * | 2022-03-04 | 2022-06-10 | 腾讯科技(深圳)有限公司 | 一种调整界面布局的方法、装置、设备及存储介质 |
CN115935903A (zh) * | 2022-12-28 | 2023-04-07 | 盟浪可持续数字科技(深圳)有限责任公司 | 一种多模态pdf版面结构分析系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102331982A (zh) * | 2011-07-28 | 2012-01-25 | 深圳市万兴软件有限公司 | 自适应窗体大小的pdf文档显示方法、系统及移动终端 |
CN103389969A (zh) * | 2012-05-07 | 2013-11-13 | 腾讯科技(深圳)有限公司 | 一种用于移动终端预览pdf文件的方法、装置和系统 |
CN105260353A (zh) * | 2015-10-23 | 2016-01-20 | 北大方正集团有限公司 | 一种移动终端的排版方法及装置 |
CN105302550A (zh) * | 2015-10-12 | 2016-02-03 | 江苏中威科技软件系统有限公司 | 将页面转为版式数据流文件的方法及系统 |
CN107133566A (zh) * | 2017-03-31 | 2017-09-05 | 常诚 | 一种识别pdf文档中图表的方法 |
CN108470021A (zh) * | 2018-03-26 | 2018-08-31 | 阿博茨德(北京)科技有限公司 | Pdf文档中表格的定位方法及装置 |
-
2018
- 2018-11-26 CN CN201811421742.6A patent/CN109522539A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102331982A (zh) * | 2011-07-28 | 2012-01-25 | 深圳市万兴软件有限公司 | 自适应窗体大小的pdf文档显示方法、系统及移动终端 |
CN103389969A (zh) * | 2012-05-07 | 2013-11-13 | 腾讯科技(深圳)有限公司 | 一种用于移动终端预览pdf文件的方法、装置和系统 |
CN105302550A (zh) * | 2015-10-12 | 2016-02-03 | 江苏中威科技软件系统有限公司 | 将页面转为版式数据流文件的方法及系统 |
CN105260353A (zh) * | 2015-10-23 | 2016-01-20 | 北大方正集团有限公司 | 一种移动终端的排版方法及装置 |
CN107133566A (zh) * | 2017-03-31 | 2017-09-05 | 常诚 | 一种识别pdf文档中图表的方法 |
CN108470021A (zh) * | 2018-03-26 | 2018-08-31 | 阿博茨德(北京)科技有限公司 | Pdf文档中表格的定位方法及装置 |
Non-Patent Citations (2)
Title |
---|
周忆莲: "学术论文PDF结构解析技术的研究", 中国优秀硕士学位论文全文数据库信息科技辑(月刊), no. 3, pages 138 - 3334 * |
杨琪: "GeoPDF地图浏览系统的设计与实现", 中国优秀硕士学位论文全文数据库信息科技辑(月刊), no. 3, pages 138 - 4124 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443202A (zh) * | 2019-08-06 | 2019-11-12 | 北京如优教育科技有限公司 | 论文字体工整度即时分析平台、方法及存储介质 |
CN110443202B (zh) * | 2019-08-06 | 2022-11-01 | 超级知识产权顾问(北京)有限公司 | 论文字体工整度即时分析系统、方法及存储介质 |
CN112100978A (zh) * | 2020-09-16 | 2020-12-18 | 掌阅科技股份有限公司 | 基于电子书的排版处理方法、电子设备及存储介质 |
CN112100978B (zh) * | 2020-09-16 | 2022-07-08 | 掌阅科技股份有限公司 | 基于电子书的排版处理方法、电子设备及存储介质 |
CN114154460A (zh) * | 2021-12-02 | 2022-03-08 | 江苏中威科技软件系统有限公司 | 一种pdf文件转版式数据流文件的方法 |
CN114218418A (zh) * | 2021-12-03 | 2022-03-22 | 北京艺源酷科技有限公司 | 一种对多种类型文件进行矢量编辑设计的方法 |
CN114169289A (zh) * | 2021-12-10 | 2022-03-11 | 洪恩完美(北京)教育科技发展有限公司 | 图文混排方法以及装置 |
CN114610426A (zh) * | 2022-03-04 | 2022-06-10 | 腾讯科技(深圳)有限公司 | 一种调整界面布局的方法、装置、设备及存储介质 |
CN114610426B (zh) * | 2022-03-04 | 2023-09-08 | 腾讯科技(深圳)有限公司 | 一种调整界面布局的方法、装置、设备及存储介质 |
CN115935903A (zh) * | 2022-12-28 | 2023-04-07 | 盟浪可持续数字科技(深圳)有限责任公司 | 一种多模态pdf版面结构分析系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109522539A (zh) | 基于移动设备的pdf学术论文重排版系统及方法 | |
US9898548B1 (en) | Image conversion of text-based images | |
US7512879B2 (en) | Intelligent virtual paging paradigm | |
US8023738B1 (en) | Generating reflow files from digital images for rendering on various sized displays | |
US7788580B1 (en) | Processing digital images including headers and footers into reflow content | |
US7433548B2 (en) | Efficient processing of non-reflow content in a digital image | |
US8515176B1 (en) | Identification of text-block frames | |
US20140108897A1 (en) | Method and apparatus for document conversion | |
US20110164813A1 (en) | Apparatus and method for digitizing documents | |
US9460089B1 (en) | Flow rendering of annotation characters | |
US8386943B2 (en) | Method for query based on layout information | |
US20050039138A1 (en) | Method and system for displaying comic books and graphic novels on all sizes of electronic display screens. | |
US9734132B1 (en) | Alignment and reflow of displayed character images | |
CN104133809B (zh) | 一种字形加粗方法 | |
CN111881648A (zh) | 一种生成电子书字体文件的方法 | |
CN104424174B (zh) | 文档处理系统和文档处理方法 | |
JP5182902B2 (ja) | 文書イメージ出力装置 | |
CN103970723A (zh) | 基于图像检测和切割的电子文档屏幕显示方法 | |
CN115917551A (zh) | 可重排内容的动态布局调整 | |
CN111241805A (zh) | 一种pdf文档的版面重排方法 | |
JP2012022413A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
Praharaj | Illustrate well to get noticed: Graphs and figures in research papers | |
US20130104014A1 (en) | Viewer unit, server unit, display control method, digital comic editing method and non-transitory computer-readable medium | |
US10606928B2 (en) | Assistive technology for the impaired | |
Lee et al. | Exploring the relationship between language and design: a study of Hong Kong newspapers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190326 |