CN115828883A - 文档内容重排版的方法、装置、电子显示设备以及介质 - Google Patents
文档内容重排版的方法、装置、电子显示设备以及介质 Download PDFInfo
- Publication number
- CN115828883A CN115828883A CN202211563849.0A CN202211563849A CN115828883A CN 115828883 A CN115828883 A CN 115828883A CN 202211563849 A CN202211563849 A CN 202211563849A CN 115828883 A CN115828883 A CN 115828883A
- Authority
- CN
- China
- Prior art keywords
- template
- document
- target
- alternative
- typesetting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Abstract
本申请实施例公开了一种文档内容重排版的方法、装置、电子显示设备以及介质,该方法通过打开基于图片数据生成的目标文档文件;获取并显示至少一种备选模板类型;根据模板确认操作作用的备选模板类型,确认目标识别模板和目标排版模板;根据目标识别模板对目标文档文件进行图片分割,得到多个文档图块;将多个文档图块根据分割前的排列顺序、当前的文件显示参数和目标排版模板进行重新排版;根据重新排版后的文档图块生成新的文档页面;实现了基于图像生成的文档文件在不同的电子显示设备上可以进行与所在电子显示设备相适配的重排版,以便于电子显示设备提供图片清晰,排版有序,文字大小合适的文档页面。
Description
技术领域
本申请实施例涉及电子显示技术领域,尤其涉及文档内容重排版的方法、装置、电子显示设备以及介质。
背景技术
随着电子显示技术的发展,越来越多的用户习惯使用便携式的电子显示设备(手机、阅读器以及平板电脑等)来阅读。然而,部分用户还是会希望在电子显示设备上阅读纸质出版物或纸质打印件(书籍、论文、报刊杂志、手册等)的内容,为此,用户可通过拍照、扫描上述纸质文件来获得相关纸质文件的图像,并基于该图像生成文档文件以供用户可以在不同电子显示设备上阅读。然而在大多数情况下,便携式的电子显示设备的屏幕尺寸会小于原始纸质文件的尺寸大小,因此基于图像生成的文档文件在不同电子显示设备上处理和显示会出现图片显示不清晰,排版混乱的问题,也会出现因文字过小需要用户在阅读时手动放大的问题,带来较差的阅读体验。
发明内容
为了解决基于图像生成的文档文件在不同电子显示设备上处理和显示会出现图片显示不清晰,排版混乱的问题,以及因文字过小需要用户在阅读时手动放大的问题,本申请实施例提供了一种文档内容重排版的方法、装置、电子显示设备以及介质,实现了基于图像生成的文档文件在不同的电子显示设备上可以进行与所在电子显示设备相适配的重排版,以便于电子显示设备提供图片清晰,排版有序,文字大小合适的文档页面。
第一方面,本申请实施例提供了一种文档内容重排版的方法,包括:
打开目标文档文件,所述目标文档文件基于图片数据生成;
获取并显示至少一种备选模板类型,所述备选模板类型包括对应的备选识别模板和备选排版模板;
接收模板确认操作,根据所述模板确认操作作用的备选模板类型,确认对应的备选识别模板和备选排版模板分别为目标识别模板和目标排版模板;
根据所述目标识别模板对所述目标文档文件进行图片分割,得到多个文档图块;
将所述多个文档图块根据分割前的排列顺序、当前的文件显示参数和目标排版模板进行重新排版;
根据重新排版后的所述文档图块生成新的文档页面。
第二方面,本申请实施例还提供了一种文档内容重排版装置,包括:
打开模块,用于打开目标文档文件,所述目标文档文件基于图片数据生成;
获取模块,用于获取并显示至少一种备选模板类型,所述备选模板类型包括对应的备选识别模板和备选排版模板;
确认模块,用于接收模板确认操作,根据所述模板确认操作作用的备选模板类型,确认对应的备选识别模板和备选排版模板分别为目标识别模板和目标排版模板;
分割模块,用于根据所述目标识别模板对所述目标文档文件进行图片分割,得到多个文档图块;
排版模块,用于将所述多个文档图块根据分割前的排列顺序、当前的文件显示参数和目标排版模板进行重新排版;
生成模块,用于根据重新排版后的所述文档图块生成新的文档页面。
第三方面,本申请实施例还提供了一种电子显示设备,所述设备包括显示器和处理器,所述处理器用于执行本申请任一实施例所述的文档内容重排版的方法。
第四方面,本申请实施例还提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行本申请任一实施例所述的文档内容重排版的方法。
本申请实施例提供了文档内容重排版的方法、装置、电子显示设备以及介质,该方法通过打开基于图片数据生成的目标文档文件;获取并显示至少一种备选模板类型,所述备选模板类型包括对应的备选识别模板和备选排版模板;接收模板确认操作,根据所述模板确认操作作用的备选模板类型,确认对应的备选识别模板和备选排版模板分别为目标识别模板和目标排版模板;根据所述目标识别模板对所述目标文档文件进行图片分割,得到多个文档图块;将所述多个文档图块根据分割前的排列顺序、当前的文件显示参数和目标排版模板进行重新排版;根据重新排版后的所述文档图块生成新的文档页面;实现了基于图像生成的文档文件在不同的电子显示设备上可以进行与所在电子显示设备相适配的重排版,以便于电子显示设备提供图片清晰,排版有序,文字大小合适的文档页面。
附图说明
图1为本申请实施例提供的一种文档内容重排版的方法的流程图;
图2a为本申请实施例提供的一种备选模板类型显示的示意图;
图2b为本申请实施例提供的另一种备选模板类型显示的示意图;
图3为本申请实施例提供的一种文档内容重排版的方法的重排版的示意图;
图4为本申请实施例提供的一种文档内容重排版装置的示意图;
图5为本申请实施例提供的一种电子显示设备的示意图;
图6为本申请实施例提供的一种示例性的古文的示意图;
图7为本申请实施例提供的一种示例性的论文的示意图;
图8为本申请实施例提供的一种示例性的文字图块的示意图。
具体实施方式
下面结合附图和实施例对本申请实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请实施例,而非对本申请实施例的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请实施例相关的部分而非全部结构。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个,也不能理解为指示或暗示相对重要性。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。此外,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”,“串联”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
随着电子显示技术的发展,越来越多的用户习惯使用便携式的电子显示设备(手机、阅读器以及平板电脑等)来阅读。然而,部分用户还是会希望在电子显示设备上阅读纸质出版物或纸质打印件(书籍、论文、报刊杂志、手册等)的内容,为此,用户可通过拍照、扫描上述纸质文件来获得相关纸质文件的图像,并基于该图像生成文档文件以供用户可以在不同电子显示设备上阅读。然而在大多数情况下,便携式的电子显示设备的屏幕尺寸会小于原始纸质文件的尺寸大小,因此基于图像生成的文档文件在不同电子显示设备上处理和显示会出现图片显示不清晰,排版混乱的问题,也会出现因文字过小需要用户在阅读时手动放大的问题,带来较差的阅读体验。
基于此,本申请实施例提供一种文档内容重排版的方法、装置、电子显示设备以及介质,来解决基于图像生成的文档文件在不同电子显示设备上处理和显示会出现图片显示不清晰,排版混乱的问题,以及因文字过小需要用户在阅读时手动放大的问题。
图1为本申请实施例提供的一种文档内容重排版的方法的流程图,如图1所示,包括以下步骤:
S101:打开目标文档文件,所述目标文档文件基于图片数据生成。
值得说明的是,目标文档文件可以是pdf文档,也可以是其他基于图像生成的文档文件,目标文档文件的生成是基于通过拍照或者扫描获得的纸质出版物或纸质打印件的图像数据,其中图像数据内容可以包括书籍、论文、报刊杂志、手册以及古诗词。用户通过选择电子显示设备的显示界面上目标文档文件对应的功能入口来触发电子显示设备应用该方法后的打开目标文档文件的操作。
S102:获取并显示至少一种备选模板类型,所述备选模板类型包括对应的备选识别模板和备选排版模板。
值得说明的是,本申请实施例的电子显示设备在打开目标文档文件后,可以是电子显示设备自动对目标文档文件的文本内容的关键字提取,或者是文件属性,比如名称、简介的关键字提取,再与所预设的关键字列表进行匹配得到该文件所对应的备选模板类型,并显示所匹配到的备选模板类型,也可以是,在打开目标文档文件的操作之后,电子显示设备会获取并显示出不同的备选模板类型以供用户选择,备选模板类型可以是书籍模板、论文模板、报刊杂志模板、手册模板以及古诗词模板,而每一种备选模板类型都会对应包括备选识别模板和备选排版模板。由于书籍、论文、报刊杂志、手册以及古诗词的文本格式和排版参数均不同,因此每一种文本内容都需要有对应的备选识别模板来实现对该文本内容对应的图像数据进行解析;而备选排版模板则用来基于预设的文本格式以及排版参数对解析后的目标文档文件进行重排版。
可选地,步骤S102的具体实施过程包括:获取并显示至少一种预设的模板类型作为备选模板类型。值得说明的是,备选模板类型可以是预先设置于电子显示设备内,在执行获取操作的时候才会触发调用。预设的模板类型包括古文模板、论文模板和标准文件模板中的一种或多种,标准文件模板针对具有标准格式的红头文件或官方文件而设置,比如,录取通知书,授权通知书,意见书等等。电子显示设备所获取的备选模板类型可以是根据常用文档内容类型,如书籍、如图6所示的论文、报刊杂志、手册、如图7所示的古文进行预设的,另外,如图2a以及图2b所示,电子显示设备所显示的备选模板类型可以是显示对应的类型名称和/或对应的备选识别模板的布局示意图,这样每次用户触发打开目标文档文件后,都会对应显示预设的多种备选模板类型,可以通过类型名称来区分备选模板类型,也可以通过备选识别模板的布局示意图来了解对应备选识别模板具体的识别设置,包括不同段落对应的文本属性,而且这样可以尽可能覆盖各种文档内容类型,丰富用户的阅读选择。
S103:接收模板确认操作,根据所述模板确认操作作用的备选模板类型,确认对应的备选识别模板和备选排版模板分别为目标识别模板和目标排版模板。
值得说明的是,电子显示设备可以是将不同的备选模板类型显示给用户以供选择,用户根据目标文档文件的内容进行模板确认操作,电子显示设备将用户所选择的备选识别模板和备选排版模板分别确认为目标识别模板和目标排版模板;也可以是通过前述自动匹配备选模板类型,并内部自动执行模板确认操作,无需用户侧进行确认操作。目标识别模板用于对目标文档文件的图像数据进行解析,而目标排版模板则基于预设的文本格式以及排版参数对解析后的目标文档文件进行重排版。
可选地,步骤S103的具体实施过程如下:
S103a:接收模板确认操作确认所选择的备选模板类型。
S103b:接收对对应的备选识别模板的模板修正操作。
在具体实现过程中,备选识别模板是每种文档内容类型的通用模板,用户选中备选识别模板后,可以根据目标文档文件进行修正调整,例如,对于论文形式的文档内容类型,需要设置分栏的修正,用户可以向备选识别模板中间增加分隔线,通过拖动备选识别模板的识别边框来将对应的内容进行框选。又例如,在论文中可能出现一篇论文跨两页,其中第二页中只包括页末的一部分,其余属于另一篇论文的排版方式,对于这种同一篇论文被分隔在不同页或者同一段落被分隔在不同页的情况,论文对应的备选识别模板可能只包括基本的论文结构,此时可以在论文基本结构的基础上,将备选识别模板叠加显示于目标文档文件,根据目标文档文件的内容结构对备选识别模板的边框进行调整,从而得到对应于跨页面的论文或段落实际使用的目标识别模板,以使该论文或段落完整显示在同一页。
S103c:确认修正后的备选识别模板和备选排版模板分别为目标识别模板和目标排版模板。
值得说明的是,根据目标文档文件的具体文档内容,通过对已有的备选识别模板的模板修正操作,使得所选定的备选识别模板更好地适配目标文档文件,给用户提供更好的阅读体验。
S104:根据所述目标识别模板对所述目标文档文件进行图片分割,得到多个文档图块。
一种可选的实现方式是,目标文档文件在进行分割前可以进行连通域分析,连通域分析结果可以作为图片分割的参考,图片分割是电子显示设备通过目标识别模板对目标文档文件的图像数据进行解析并执行指定单元的分割,指定单元可以是以文字为单元,也可以是以图片为单元,分割后对应的文档图块也可以分为如图8所示的文字图块和图片图块,将目标文档文件切割为文档图块后才能进行下一步的重排版。例如,可以根据目标识别模板对应的阅读顺序确认切分方式,切分方式包括行切分和列切分;例如,对于古文而言,文段的阅读顺序是按列从上至下,从右至左,那么切分方式可以选择列切分;又例如,对于论文而言,文段的阅读顺序是按行从左至右,从上至下,那么切分方式可以选择行切分。根据切分方式将图像切分为至少一个切分单元,根据切分单元所在文档内容的段落属性,将至少一个切分单元按文档内容的原有段落分布划分为至少一个切分组;根据切分组所在原有段落的位置信息确认切分组的文本属性;将切分组切分为至少一个文档图块。
可选地,步骤S104的具体实施过程如下:
S104a:根据所述目标文档文件生成至少一张待识别图像。
值得说明的是,目标文档文件所对应的纸档文件可能包括多页,在拍摄或扫描该纸档文件会产生多张图像,那么对目标文档文件识别之前需要将目标文档文件拆分为多张待识别图像。
S104b:根据所述目标识别模板从所述待识别图像分割出至少一个区域图块。
在具体实现过程中,目标识别模板对应多个识别区域,每个区域都有对应的文本属性,那么目标识别模式先根据所设定的识别区域对待识别图像进行区域图块的分割,每个区域图块也对应有文本属性。
S104c:对所述区域图块根据分段结构以文字为单位进行拆分得到多个文字文档图块,和/或,根据图块大小以图片为单位进行拆分得到多个图片文档图块。
值得说明的是,区域图块可能包含多个段落,分段结构是以段落为主单元,那么可以是以文字为最小单元对区域图块进行拆分,如图8所示,拆分出来的文字文档图块仍可区分所在的段落,也可以是根据图块大小以图片为单位进行拆分,例如,若图块大小大于等于预设尺寸阈值,该图块为图片文档图块,又例如,可以参考参考图块尺寸在对应的待识别图像尺寸的占比设置,若所述图块尺寸在对应的待识别图像尺寸的占比大于等于所述预设尺寸阈值,该图块为图片文档图块。在具体拆分时,还可以进一步将文字区分为语言文字和标点文字,并对二者进行大小不同的拆分,通常是将标点文字拆分为较小的文字文档图块,以供后续排版时,文字之间有标点时可以保留合适的文字间距,更符合文字的一般排版要求。
S105:将所述多个文档图块根据分割前的排列顺序、当前的文件显示参数和目标排版模板进行重新排版。
在具体实现过程中,多个文档图块分割前的排列顺序和分割前的文档内容阅读顺序是匹配的,例如,古文的阅读顺序是按列从上至下,从右至左,那么该文档类型的目标文档文件所分割出来的文档图块需要按照原有的从上至下,从右至左的顺序依次排列;又例如,普通书籍的阅读顺序是从上至下,从左至右,那么该文档类型的目标文档文件所分割出来的文档图块需要按照原有的从上至下,从左至右的顺序依次排列。除此之外,该排列顺序还保留文档图块的所属段落顺序,而不同的段落位置在目标排版模板中所对应的文本格式和排版参数是不同的;当前文件显示参数是由当前目标文档文件所在的电子显示设备决定的,也是目标文档文件适配当前电子显示设备的参考。如图3所示,电子显示设备根据当前的文件显示参数对文档图块显示大小进行调整后,将文档图块按照排列顺序添加到目标排版模板的对应排版框中,并按照对应排版框的文本属性进行重排版。
可选地,步骤S105的具体实施过程如下:
S105a根据当前的文件显示参数确认所述文档图块的匹配的显示大小,使得每行文档图块能完整显示。
值得说明的是,当前的文件显示参数是基于电子显示设备的屏幕大小以及待识别图像大小决定的,根据待识别图像与屏幕大小的比例关系对应将文档图块的显示大小进行调整,以适应电子显示设备的显示,确保每行文档图块的完整显示。
S105b:将所述多个文档图块按所述分割前的排列顺序,以对应匹配的显示大小,按所述目标排版模板的显示区域和阅读方向,依次添加到所述目标排版模板进行重新排版。
在具体实现过程中,目标排版模板根据文本属性预设了不同的显示区域,例如,古文模板的显示区域可以包括标题,作者和正文段落,又例如,论文模板的显示区域可以包括标题、作者、摘要、关键词和正文,每一个显示区域都对应特定的文本属性,如页边距、行间距(列间距)、字间距、文本字号等等,需要根据每个显示区域设定的字号,确认每个显示区域之间字体大小的比例,再根据匹配的显示大小对应分配字体在对应显示区域的显示尺寸。最后以所述多个文档图块的排列顺序为基准,结合间距参数以及阅读方向进行重新排列组合,得到重排版后的文档内容。
S106:根据重新排版后的所述文档图块生成新的文档页面。
值得说明的是,重新排版后的所述文档图块会在电子显示设备以新的文档界面进行显示,该文档界面会适应于电子显示设备的显示参数。
本申请实施例中,一种文档内容重排版的方法通过打开基于图片数据生成的目标文档文件;获取并显示至少一种备选模板类型,所述备选模板类型包括对应的备选识别模板和备选排版模板;接收模板确认操作,根据所述模板确认操作作用的备选模板类型,确认对应的备选识别模板和备选排版模板分别为目标识别模板和目标排版模板;根据所述目标识别模板对所述目标文档文件进行图片分割,得到多个文档图块;将所述多个文档图块根据分割前的排列顺序、当前的文件显示参数和目标排版模板进行重新排版;根据重新排版后的所述文档图块生成新的文档页面;实现了基于图像生成的文档文件在不同的电子显示设备上可以进行与所在电子显示设备相适配的重排版,以便于电子显示设备提供图片清晰,排版有序,文字大小合适的文档页面。
本申请实施例提供另一种文档内容重排版的方法,在前述实施例的基础上,还包括:
S107:对所述模板确认操作作用的备选模板类型进行统计。
值得说明的是,电子显示设备可以对用户触发的模板确认操作进行统计,由于每次模板确认操作会涉及到相应的备选模板类型的选择,那么可以以一定时间长度作为统计单位对用户选择不同备选模板类型的次数进行统计,也可以以一定模板确认操作次数作为统计单位对用户选择不同备选模板类型的次数进行统计,这样每次都可以确认出统计次数最高的备选模板类型。
S108:将所述预设的模板类型中,对应统计次数最高的至少一个作为备选模板类型。
在具体实现过程中,步骤S108用于替换步骤S102。此外,电子显示设备可以将多次统计次数最高所对应的备选模板类型一个或多个选作备选模板类型进行显示以供用户选择,这样相当于配合用户的阅读习惯,将用户阅读次数多的模板类型选作候选模板类型,这样可以将用户不常选择的文档内容类型筛掉,给用户提供个性化定制的候选模板类型,提高阅读操作体验。
本申请实施例提供另一种文档内容重排版的方法,在前述实施例的基础上,还包括:
S109:对所述目标文档文件的文件属性信息和/或文件内容信息进行识别,根据识别结果和预设的匹配规则,从所述预设的模板类型中匹配出至少一个作为备选模板类型。
值得说明的是,步骤S109用于替换步骤S102。此外,文件属性信息包括文件的标题,简介等信息,电子显示设备可以通过对标题、简介等信息的识别,判断出目标文档文件的文档类型,预设的匹配规则可以是对标题进行整体识别,通过将标题与常用古文标题库比对来判断是否属于古文类型,可以是将标题或简介中涉及的关键字,如论文,期刊等来判断相关文档类型。还可以直接对文件内容信息进行关键字随机提取识别,如出现论文,期刊,诗、词字眼,可以对应匹配相关文档类型。由于预设的匹配规则并非精确匹配,每一种识别结果的文档类型都会匹配到一个或多个备选模板类型,再将这些匹配到的备选模板类型显示给用户以供选择。这样可以基于目标文档文件本身的文件属性信息以及文件内容信息来更准确地匹配备选模板类型,增大备选模板类型命中目标文档文件的文档类型的概率,提高用户为目标文档文件确定目标模板类型的效率。
本申请实施例提供另一种文档内容重排版的方法,在前述实施例的基础上,还包括:
S110:接收类型切换操作,根据所述类型切换操作切换所述备选模板类型。
在具体实现过程中,步骤S110在步骤S102之后。此外,电子显示设备所显示的备选模板类型不一定适配于当前的目标文档文件,不管是常用的文档模板类型,根据用户习惯定制的备选模板类型,还是根据文件属性信息或文件内容信息匹配得到的备选模板类型,都存在一定概率与目标文档文件不适配,如用户选择阅读冷门的文档内容类型,那么用户需要对应进行类型切换操作,具体可以是触发电子显示设备提供的类型切换功能入口,电子显示设备会进行刷新,并显示出其他的备选模板类型来继续供用户做选择,这样可以减少因缺少合适的备选模板类型导致用户无法阅读的不良体验。
本申请实施例提供另一种文档内容重排版的方法,在前述实施例的基础上,还包括:
S111:接收区域选择操作;步骤S111在步骤S103之后,步骤S104之前,而步骤S104还对应包括:将所述区域选择操作对应的每个区域分别作为一个完整的图片文档图块。
值得说明的是,图片分割有时候会将图片以及图片的标题分割开来,这样有可能把图片的标题以文字为单位进行分割,但实际上图片的标题应该跟随着图片一起显示,因而电子显示设备设置可供用户进行区域选择操作,可以将图片以及对应的标题作为一个整体区域选择出来,例如通过在图片上调整一个矩形框的位置和大小,在确认矩形框之后,将图片中对应矩形框内的部分,作为一个完整的图片文档图块,而不会涉及到以文字为单位的分割。这样可以减少图片标题的位置以及大小的显示异常,提高用户的阅读体验。
本申请实施例提供另一种文档内容重排版的方法,在前述实施例的基础上,还包括:
S112:显示所述新的文档页面。
在具体实现过程中,在基于图像生成的文档文件在不同的电子显示设备上可以进行与所在电子显示设备相适配的重排版后,电子显示设备可以提供图片清晰,排版有序,文字大小合适的文档页面。
本申请实施例提供另一种文档内容重排版的方法,在前述实施例的基础上,还包括:
S113:接收页面缩放操作。
S114:响应于所述页面缩放操作,调整所述文档图块显示大小,并根据所述目标排版模板进行重新排版。
值得说明的是,目标排版模板所选定的文字显示大小与图片显示大小是根据电子显示设备的显示参数决定的,但是有时候用户需要根据自己需求对整体大小作调整,因此用户可以触发页面缩放操作,电子显示设备接收到页面缩放操作后,确认该页面缩放操作对应的缩放比例,再根据该缩放比例调整文档图块的显示大小,再添加到对应的目标排版模板进行重新排版以显示正常页面。,这样可以更好地配合用户阅读习惯,提高阅读体验。
图4为本申请实施例提供一种文档内容重排版装置400,包括:
打开模块410,用于打开目标文档文件,所述目标文档文件基于图片数据生成;
获取模块420,用于获取并显示至少一种备选模板类型,所述备选模板类型包括对应的备选识别模板和备选排版模板;
确认模块430,用于接收模板确认操作,根据所述模板确认操作作用的备选模板类型,确认对应的备选识别模板和备选排版模板分别为目标识别模板和目标排版模板;
分割模块440,用于根据所述目标识别模板对所述目标文档文件进行图片分割,得到多个文档图块;
排版模块450,用于将所述多个文档图块根据分割前的排列顺序、当前的文件显示参数和目标排版模板进行重新排版;
生成模块460,用于根据重新排版后的所述文档图块生成新的文档页面。
该文档内容重排版装置400实现了基于图像生成的文档文件在不同的电子显示设备上可以进行与所在电子显示设备相适配的重排版,以便电子显示设备提供图片清晰,排版有序,文字大小合适的文档页面。
图5为本申请实施例提供一种电子显示设备500,所述设备包括显示器520和处理器510,所述处理器510用于执行本申请任一实施例所述的文档内容重排版的方法。
本申请实施例提供一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现本申请任一实施例所述的文档内容重排版的方法。
需要说明的是,本方案中对各步骤的编号仅用于描述本方案的整体设计框架,不表示步骤之间的必然先后关系。在整体实现过程符合本方案整体设计框架的基础上,均属于本方案的保护范围,描述时文字形式上的先后顺序不是对本方案具体实现过程的排他限定。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。
因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (15)
1.一种文档内容重排版的方法,其特征在于,包括:
打开目标文档文件,所述目标文档文件基于图片数据生成;
获取并显示至少一种备选模板类型,所述备选模板类型包括对应的备选识别模板和备选排版模板;
接收模板确认操作,根据所述模板确认操作作用的备选模板类型,确认对应的备选识别模板和备选排版模板分别为目标识别模板和目标排版模板;
根据所述目标识别模板对所述目标文档文件进行图片分割,得到多个文档图块;
将所述多个文档图块根据分割前的排列顺序、当前的文件显示参数和目标排版模板进行重新排版;
根据重新排版后的所述文档图块生成新的文档页面。
2.根据权利要求1所述的方法,其特征在于,所述获取并显示至少一种备选模板类型,包括:
获取并显示至少一种预设的模板类型作为备选模板类型。
3.根据权利要求2所述的方法,其特征在于,还包括:
对所述模板确认操作作用的备选模板类型进行统计;
对应的,所述获取并显示至少一种预设的模板类型作为备选模板类型,包括:
将所述预设的模板类型中,对应统计次数最高的至少一个作为备选模板类型。
4.根据权利要求2至3任一项所述的方法,其特征在于,所述接收模板确认操作,根据所述模板确认操作作用的备选模板类型,确认对应的备选识别模板和备选排版模板分别为目标识别模板和目标排版模板,包括:
接收模板确认操作确认所选择的备选模板类型;
接收对对应的备选识别模板的模板修正操作;
确认修正后的备选识别模板和备选排版模板分别为目标识别模板和目标排版模板。
5.根据权利要求2至3任一项所述的方法,其特征在于,所述预设的模板类型包括古文模板、论文模板和标准文件模板中的一种或多种。
6.根据权利要求5所述的方法,其特征在于,所述备选模板类型显示对应的类型名称和/或对应的备选识别模板的布局示意图。
7.根据权利要求1所述的方法,其特征在于,所述根据所述目标识别模板对所述目标文档文件进行图片分割,得到多个文档图块,包括:
根据所述目标文档文件生成至少一张待识别图像;
根据所述目标识别模板从所述待识别图像分割出至少一个区域图块;
对所述区域图块根据分段结构以文字为单位进行拆分得到多个文字文档图块,和/或,
根据图块大小以图片为单位进行拆分得到多个图片文档图块。
8.根据权利要求1所述的方法,其特征在于,所述接收模板确认操作,根据所述模板确认操作作用的备选模板类型,确认对应的备选识别模板和备选排版模板分别为目标识别模板和目标排版模板之后,还包括:
接收区域选择操作;对应的,所述根据所述目标识别模板对所述目标文档文件进行图片分割,得到多个文档图块,包括:
将所述区域选择操作对应的每个区域分别作为一个完整的图片文档图块。
9.根据权利要求1所述的方法,其特征在于,所述将所述多个文档图块根据分割前的排列顺序、当前的文件显示参数和目标排版模板进行重新排版,包括:
根据当前的文件显示参数确认所述文档图块的匹配的显示大小,使得每行文档图块能完整显示;
将所述多个文档图块按所述分割前的排列顺序,以对应匹配的显示大小,按所述目标排版模板的显示区域和阅读方向,依次添加到所述目标排版模板进行重新排版。
10.根据权利要求9所述的方法,其特征在于,所述目标排版模板包括多个不同文本属性的显示区域,所述将所述多个文档图块按所述分割前的排列顺序,以对应匹配的显示大小,按所述目标排版模板的显示区域和阅读方向,依次添加到所述目标排版模板进行重新排版包括:
将属于同一显示区域的多个文档图块根据所述显示区域的字号参数以及对应匹配的显示大小进行尺寸调整,并且,以所述多个文档图块的排列顺序为基准,结合间距参数以及阅读方向进行重新排列组合。
11.根据权利要求1所述的方法,其特征在于,所述根据重新排版后的所述文档图块生成新的文档页面之后,还包括:
显示所述新的文档页面。
12.根据权利要求11所述的方法,其特征在于,所述显示所述新的文档页面之后,还包括:
接收页面缩放操作;
响应于所述页面缩放操作,调整所述文档图块显示大小,并根据所述目标排版模板进行重新排版。
13.一种文档内容重排版装置,其特征在于,包括:
打开模块,用于打开目标文档文件,所述目标文档文件基于图片数据生成;
获取模块,用于获取并显示至少一种备选模板类型,所述备选模板类型包括对应的备选识别模板和备选排版模板;
确认模块,用于接收模板确认操作,根据所述模板确认操作作用的备选模板类型,确认对应的备选识别模板和备选排版模板分别为目标识别模板和目标排版模板;
分割模块,用于根据所述目标识别模板对所述目标文档文件进行图片分割,得到多个文档图块;
排版模块,用于将所述多个文档图块根据分割前的排列顺序、当前的文件显示参数和目标排版模板进行重新排版;
生成模块,用于根据重新排版后的所述文档图块生成新的文档页面。
14.一种电子显示设备,其特征在于,所述设备包括显示屏和处理器,所述处理器用于执行权利要求1至12任一项所述的文档内容重排版的方法。
15.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至12中任一项所述的文档内容重排版的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211563849.0A CN115828883A (zh) | 2022-12-07 | 2022-12-07 | 文档内容重排版的方法、装置、电子显示设备以及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211563849.0A CN115828883A (zh) | 2022-12-07 | 2022-12-07 | 文档内容重排版的方法、装置、电子显示设备以及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115828883A true CN115828883A (zh) | 2023-03-21 |
Family
ID=85545378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211563849.0A Pending CN115828883A (zh) | 2022-12-07 | 2022-12-07 | 文档内容重排版的方法、装置、电子显示设备以及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115828883A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567300A (zh) * | 2011-12-29 | 2012-07-11 | 方正国际软件有限公司 | 图片文档的处理方法及装置 |
CN102890827A (zh) * | 2011-10-09 | 2013-01-23 | 北京多看科技有限公司 | 一种扫描版文档重排版的方法 |
CN105912519A (zh) * | 2016-05-27 | 2016-08-31 | 北京京东尚科信息技术有限公司 | 一种电子文档的排版方法及排版装置 |
CN108108194A (zh) * | 2016-11-24 | 2018-06-01 | 腾讯科技(深圳)有限公司 | 用户界面编辑方法以及用户界面编辑器 |
CN110390091A (zh) * | 2018-04-18 | 2019-10-29 | 成都野望数码科技有限公司 | 一种排版文档生成方法、装置及设备 |
CN111767488A (zh) * | 2020-06-15 | 2020-10-13 | 咪咕文化科技有限公司 | 文章显示方法、电子设备及存储介质 |
CN112801084A (zh) * | 2021-01-29 | 2021-05-14 | 杭州大拿科技股份有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN113515929A (zh) * | 2021-07-14 | 2021-10-19 | 北京北大方正电子有限公司 | 学位论文的排版方法、装置、设备、储存介质及程序产品 |
CN113570687A (zh) * | 2021-07-21 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 一种文件处理方法及装置 |
CN114118011A (zh) * | 2021-11-23 | 2022-03-01 | 掌阅科技股份有限公司 | 文档处理方法、电子设备及存储介质 |
-
2022
- 2022-12-07 CN CN202211563849.0A patent/CN115828883A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102890827A (zh) * | 2011-10-09 | 2013-01-23 | 北京多看科技有限公司 | 一种扫描版文档重排版的方法 |
CN102567300A (zh) * | 2011-12-29 | 2012-07-11 | 方正国际软件有限公司 | 图片文档的处理方法及装置 |
CN105912519A (zh) * | 2016-05-27 | 2016-08-31 | 北京京东尚科信息技术有限公司 | 一种电子文档的排版方法及排版装置 |
CN108108194A (zh) * | 2016-11-24 | 2018-06-01 | 腾讯科技(深圳)有限公司 | 用户界面编辑方法以及用户界面编辑器 |
CN110390091A (zh) * | 2018-04-18 | 2019-10-29 | 成都野望数码科技有限公司 | 一种排版文档生成方法、装置及设备 |
CN111767488A (zh) * | 2020-06-15 | 2020-10-13 | 咪咕文化科技有限公司 | 文章显示方法、电子设备及存储介质 |
CN112801084A (zh) * | 2021-01-29 | 2021-05-14 | 杭州大拿科技股份有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN113515929A (zh) * | 2021-07-14 | 2021-10-19 | 北京北大方正电子有限公司 | 学位论文的排版方法、装置、设备、储存介质及程序产品 |
CN113570687A (zh) * | 2021-07-21 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 一种文件处理方法及装置 |
CN114118011A (zh) * | 2021-11-23 | 2022-03-01 | 掌阅科技股份有限公司 | 文档处理方法、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8855413B2 (en) | Image reflow at word boundaries | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US8295590B2 (en) | Method and system for creating a form template for a form | |
US7801358B2 (en) | Methods and systems for analyzing data in media material having layout | |
CN101443790B (zh) | 数字图像中的非回流内容的有效处理 | |
US8442324B2 (en) | Method and system for displaying image based on text in image | |
JP4405831B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
US8782516B1 (en) | Content style detection | |
US20140325348A1 (en) | Conversion of a document of captured images into a format for optimized display on a mobile device | |
CN100349454C (zh) | 图像形成装置、图像形成方法及其程序以及存储介质 | |
US20100215272A1 (en) | Automatic file name generation in ocr systems | |
EP2544099A1 (en) | Method for creating an enrichment file associated with a page of an electronic document | |
JP2008234658A (ja) | テキスト検索エンジンにより検索されたページ番号付き文書全体を通してのコースツーファイン・ナビゲーション | |
CN117668402A (zh) | 用于将布局应用于文档的系统和方法 | |
JP2012123093A (ja) | 電子書籍表示装置、方法およびプログラム | |
JP5412903B2 (ja) | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム | |
JP5300387B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
CN115828883A (zh) | 文档内容重排版的方法、装置、电子显示设备以及介质 | |
WO2015167525A1 (en) | Automatic page layout for text items and image items | |
CN116092097B (zh) | 图像内容重排版的方法、装置、电子显示设备以及介质 | |
CN112541331A (zh) | 一种基于编写搜索查看同步同屏的电子文档填充方法 | |
US20130104014A1 (en) | Viewer unit, server unit, display control method, digital comic editing method and non-transitory computer-readable medium | |
JP7229318B1 (ja) | 新聞電子版システム | |
JP3281065B2 (ja) | 領域分離方法 | |
JPH0327471A (ja) | 画像登録方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |