CN104424174B - 文档处理系统和文档处理方法 - Google Patents

文档处理系统和文档处理方法 Download PDF

Info

Publication number
CN104424174B
CN104424174B CN201310412839.1A CN201310412839A CN104424174B CN 104424174 B CN104424174 B CN 104424174B CN 201310412839 A CN201310412839 A CN 201310412839A CN 104424174 B CN104424174 B CN 104424174B
Authority
CN
China
Prior art keywords
document
layout region
pel
page
body matter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310412839.1A
Other languages
English (en)
Other versions
CN104424174A (zh
Inventor
汤帜
丁力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Pku Founder Information Industry Group Co ltd
Peking University
Peking University Founder Group Co Ltd
Founder Apabi Technology Ltd
Original Assignee
Peking University
Founder Information Industry Holdings Co Ltd
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Founder Information Industry Holdings Co Ltd, Peking University Founder Group Co Ltd, Beijing Founder Apabi Technology Co Ltd filed Critical Peking University
Priority to CN201310412839.1A priority Critical patent/CN104424174B/zh
Publication of CN104424174A publication Critical patent/CN104424174A/zh
Application granted granted Critical
Publication of CN104424174B publication Critical patent/CN104424174B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供了一种文档处理系统,包括:图元生成单元,用于在当前界面中,将处于指定区域内的一种或多种类型的背景元素生成为一个复合图元;设置单元,用于根据接收到的用户设置指令,设置与所述复合图元对应的排版区域,以及与所述排版区域对应的正文内容;文档生成单元,用于利用所有的所述复合图元、所述排版区域、所述正文内容及其之间的关联关系,生成对应的流式文档。本发明还提出了一种文档处理方法。通过本发明的技术方案,可以使流式文档中包含原本版式文档中才有的复杂背景元素,从而在流式显示时,展示出各种精美的版式效果。

Description

文档处理系统和文档处理方法
技术领域
本发明涉及文档处理技术领域,具体而言,涉及一种文档处理系统和一种文档处理方法。
背景技术
在阅读电子图书、电子报刊时,通常有两种阅读方式,即版式阅读方式和流式阅读方式。
版式阅读的效果跟印刷的效果一致,所以版面能够做得很复杂,在数字出版中支持版式阅读的文件格式有PDF(Portable Document Format,便携式文件格式)、CEB(Chinese E-paper Basic,北大方正电子公司拥有自主知识产权的一种版式文件格式)、CEBX(Common e-Document of Blending XML,基于混合XML的公共电子文档)等。
流式阅读是根据显示器的大小进行重新排版,比较适合小屏幕的移动终端阅读,在数字出版中支持流式阅读的典型格式有ePub(Electronic Publication,电子出版)、AZW(一种支持流式阅读的格式)、XEB(一种支持流式阅读的格式)、CEBX等。但目前阅读软件在处理流式显示时,虽然可以设置背景,但背景单一,只能设置一种颜色或一个图像,不能表示设置复杂版式的背景。
例如,HTML(Hypertext Markup Language,超文本标记语言)可以有背景,主要通过CSS(Cascading Style Sheet,级联样式表)描述,但只能是简单的背景,背景只能是指定颜色或者图像,不能指定复杂的版面描述(例如由文字、图形、图像等组合而成的复合对象)。如果指定了图像作为背景,则在不同大小的显示器上显示时,需要对图像进行放大或缩小,显示质量下降,同一背景图像在不同大小的显示屏下显示效果不一致。由于ePub采用了HTML相同的方法,也只能设置简单的背景。CEBX格式同时支持版式显示和流式显示,其最新版本CEBX1.2的流式状态下,背景与CSS类似,只能设为一种颜色或者一个图像。此外,CEBX还支持模板页,使多个页面共用相同的背景,但模板页用于版式显示时,针对不同大小的显示屏,不能进行非模板部分内容的重新排版,而且也无排版区域的属性。
PDF主要支持版式的显示,能表示复杂的背景,但是PDF不能区分背景元素和正文元素。虽然有些PDF的阅读软件能把PDF转化为流式进行显示,但是由于PDF不能区分背景元素和正文元素,所以流式显示时,背景被忽略(不显示)或者作为正文元素进行流式排版,从而产生了错误的阅读效果。此外,PDF的阅读软件把PDF转化为流式进行显示时,软件只能设置简单的背景或者无法设置背景。
有些平板电脑(Pad)上的互动阅读应用,在版式阅读的页面上开一个小窗口(或区域),使文字内容在小窗口中显示,并通过滚动条进行滚动显示文字内容,而版式部分保持不变。由于这种方式仍然以版式文件的处理方式,只能以版式的页为处理单元,无法实现整本电子书(或电子报刊)跨页内容的流式阅读,没有翻书的效果。
综上所述,目前的流式文档只能设置简单的背景,远不如版式文档的显示效果,有碍于用户获得更好的阅读体验。
因此,本发明提出了一种文档处理方案,可以使流式文档中包含原本版式文档中才有的复杂背景元素,从而在流式显示时,展示出各种精美的版式效果。
发明内容
本发明正是基于上述问题,提出了一种文档处理方案,可以使流式文档中包含原本版式文档中才有的复杂背景元素,从而在流式显示时,展示出各种精美的版式效果。
有鉴于此,本发明提出了一种文档处理系统,包括:图元生成单元,用于在当前界面中,将处于指定区域内的一种或多种类型的背景元素生成为一个复合图元;设置单元,用于根据接收到的用户设置指令,设置与所述复合图元对应的排版区域,以及与所述排版区域对应的正文内容;文档生成单元,用于利用所有的所述复合图元、所述排版区域、所述正文内容及其之间的关联关系,生成对应的流式文档。
在该技术方案中,通过将多种类型的背景元素生成一个整体的复合图元,避免了现有技术中仅能够显示单一背景元素的问题,可以使得背景元素更加丰富;同时,通过生成复合图元,使得各个背景元素及其显示属性在流式显示时保持不变或动态缩放,从而实现精美的版面效果。此外,通过将复合图元与排版区域之间建立关联关系,便于在背景与正文内容之间紧密联系起来,从而在得到更好的背景效果的同时,保证了对正文内容的正确显示。
在上述技术方案中,优选地,所述背景元素的类型包括以下至少一种或其组合:字符、图形、图像。
在该技术方案中,尤其是当背景元素中包含图形时,可以使用图形来替换原本的图像,比如对于一个粉色的矩形图像,可以利用矩形的外框以及在其中填充粉色进行替换,由于图形是由线条和颜色属性构成,有利于降低文档的数据量,并且由于图形的矢量特性,从而有利于避免图像在缩放过程中出现锯齿等问题。
在上述技术方案中,优选地,还包括:版面分析与理解单元,用于对选定的版式文档进行版面分析与理解,并从所述版式文档中识别出所述背景元素和所述正文内容,以用于生成所述流式文档。
在该技术方案中,本申请提出的基于复合图元的流式文档,可以是从头开始建立的。而通过对现有的版式文档进行版面分析与理解的方法,可以将识别出来的背景元素生成复合图元,从而重新生成为相应的流式文档,实现了版式文档与流式文档之前的转换,且得到的流式文档能够具有与版式文档类似的显示效果。而在进行版面中正文内容和背景元素的识别和分离时,除了采用版面分析与理解的方法进行自动识别,还可以利用工具软件,对正文内容和背景进行手工标注,方便用户对流式显示属性的设置。
在上述技术方案中,优选地,还包括:图元确定单元,用于在终端上显示所述流式文档的指定页面时,确定所述指定页面上的复合图元;图元适配单元,用于根据所述终端的屏幕分辨率,将所述复合图元适配显示在所述终端的屏幕界面上,以作为所述指定页面的显示背景;区域适配单元,用于根据所述复合图元的适配比例,以及所述排版区域与所述复合图元之间的相对位置关系,计算所述排版区域在所述屏幕界面上对应的实际排版区域;内容排版单元,用于将对应于所述排版区域的正文内容排入所述实际排版区域。
在该技术方案中,对流式文档进行显示时,首先显示复合图元,可以根据复合图元与终端屏幕的宽高比例来选择复合图元的适配显示方式,然后根据其适配比例和复合图元与排版区域之间的关联关系,确定实际显示时的实际排版区域,以填充相应的正文内容。
在上述技术方案中,优选地,还包括:页面添加单元,用于在所述正文内容无法全部排入当前页面中的所述实际排版区域中的情况下,生成至少一个新页面,所述至少一个新页面包含与所述当前页面相同的复合图元和排版区域;其中,所述内容排版单元将剩余的正文内容排入所述至少一个新页面中。
在该技术方案中,由于流式显示过程中,需要针对显示终端的分辨率进行界面调整,因而当终端的实际分辨率较低时,可能导致无法将全部的正文内容都填充至实际排版区域内,因而按照实际排版区域能够排入的数据量,将原本显示在一页的正文内容拆分开来,显示在自动重新生成的其他新的页面,且新的页面具有与原来页面相同的背景元素,增强文档的一致性。更为具体地,如果最后一个页面内的正文内容较少,不能排满整个排版区域,则未排版的部分作为空白。
本发明还提出了一种文档处理方法,包括:在当前界面中,将处于指定区域内的一种或多种类型的背景元素生成为一个复合图元;根据接收到的用户设置指令,设置与所述复合图元对应的排版区域,以及与所述排版区域对应的正文内容;利用所有的所述复合图元、所述排版区域、所述正文内容及其之间的关联关系,生成对应的流式文档。
在该技术方案中,通过将多种类型的背景元素生成一个整体的复合图元,避免了现有技术中仅能够显示单一背景元素的问题,可以使得背景元素更加丰富;同时,通过生成复合图元,使得各个背景元素及其显示属性在流式显示时保持不变或动态缩放,从而实现精美的版面效果。此外,通过将复合图元与排版区域之间建立关联关系,便于在背景与正文内容之间紧密联系起来,从而在得到更好的背景效果的同时,保证了对正文内容的正确显示。
在上述技术方案中,优选地,所述背景元素的类型包括以下至少一种或其组合:字符、图形、图像。
在该技术方案中,尤其是当背景元素中包含图形时,可以使用图形来替换原本的图像,比如对于一个粉色的矩形图像,可以利用矩形的外框以及在其中填充粉色进行替换,由于图形是由线条和颜色属性构成,有利于降低文档的数据量,并且由于图形的矢量特性,从而有利于避免图像在缩放过程中出现锯齿等问题。
在上述技术方案中,优选地,还包括:对选定的版式文档进行版面分析与理解,并从所述版式文档中识别出所述背景元素和所述正文内容,以用于生成所述流式文档。
在该技术方案中,本申请提出的基于复合图元的流式文档,可以是从头开始建立的。而通过对现有的版式文档进行版面分析与理解的方法,可以将识别出来的背景元素生成复合图元,从而重新生成为相应的流式文档,实现了版式文档与流式文档之前的转换,且得到的流式文档能够具有与版式文档类似显示效果。而在进行版面中正文内容和背景元素的识别和分离时,除了采用版面分析与理解的方法进行自动识别,还可以利用工具软件,对正文内容和背景进行手工标注,方便用户对流式显示属性的设置。
在上述技术方案中,优选地,还包括:在终端上显示所述流式文档的指定页面时,确定所述指定页面上的复合图元;根据所述终端的屏幕分辨率,将所述复合图元适配显示在所述终端的屏幕界面上,以作为所述指定页面的显示背景;根据所述复合图元的适配比例,以及所述排版区域与所述复合图元之间的相对位置关系,计算所述排版区域在所述屏幕界面上对应的实际排版区域;将对应于所述排版区域的正文内容排入所述实际排版区域。
在该技术方案中,对流式文档进行显示时,首先显示复合图元,可以根据复合图元与终端屏幕的宽高比例来选择复合图元的适配显示方式,然后根据其适配比例和复合图元与排版区域之间的关联关系,确定实际显示时的实际排版区域,以填充相应的正文内容。
在上述技术方案中,优选地,还包括:若所述正文内容无法全部排入当前页面中的所述实际排版区域中,则生成至少一个新页面,所述至少一个新页面包含与所述当前页面相同的复合图元和排版区域;将剩余的正文内容排入所述至少一个新页面中。
在该技术方案中,由于流式显示过程中,需要针对显示终端的分辨率进行界面调整,因而当终端的实际分辨率较低时,可能导致无法将全部的正文内容都填充至实际排版区域内,因而按照实际排版区域能够排入的数据量,将原本显示在一页的正文内容拆分开来,显示在自动重新生成的其他新的页面,且新的页面具有与原来页面相同的背景元素,增强文档的一致性。更为具体地,如果最后一个页面内的正文内容较少,不能排满整个排版区域,则未排版的部分作为空白。
通过以上技术方案,可以使流式文档中包含原来版式文档中才有的复杂背景元素,从而在流式显示时,展示出各种精美的版式效果。
附图说明
图1示出了根据本发明的实施例的文档处理系统的框图;
图2示出了根据本发明的实施例的文档处理方法的流程图;
图3A示出了根据本发明的实施例的电子图书页面;
图3B示出了根据本发明的实施例的电子图书页面的背景图和正文内容图;
图4示出了根据本发明的实施例的复合图元示意图;
图5示出了根据本发明的实施例的复合图元中的主要路径图元的示意图;
图6示出了根据本发明的实施例的复合图元路径的示意图;
图7示出了根据本发明的实施例的流式显示效果图;
图8示出了根据本发明的实施例的多种复合图元示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明并不限于下面公开的具体实施例的限制。
图1示出了根据本发明的实施例的文档处理系统的框图。
如图1所示,根据本发明的实施例的文档处理系统100,包括:图元生成单元102,用于在当前界面中,将处于指定区域内的一种或多种类型的背景元素生成为一个复合图元;设置单元104,用于根据接收到的用户设置指令,设置与所述复合图元对应的排版区域,以及与所述排版区域对应的正文内容;文档生成单元106,用于利用所有的所述复合图元、所述排版区域、所述正文内容及其之间的关联关系,生成对应的流式文档。
在该技术方案中,通过将多种类型的背景元素生成一个整体的复合图元,避免了现有技术中仅能够显示单一背景元素的问题,可以使得背景元素更加丰富;同时,通过生成复合图元,使得各个背景元素及其显示属性在流式显示时保持不变或动态缩放,从而实现精美的版面效果。此外,通过将复合图元与排版区域之间建立关联关系,便于在背景与正文内容之间紧密联系起来,从而在得到更好的背景效果的同时,保证了对正文内容的正确显示。
在上述技术方案中,优选地,所述背景元素的类型包括以下至少一种或其组合:字符、图形、图像。
在该技术方案中,尤其是当背景元素中包含图形时,可以使用图形来替换原本的图像,比如对于一个粉色的矩形图像,可以利用矩形的外框以及在其中填充粉色进行替换,由于图形是由线条和颜色属性构成,有利于降低文档的数据量,并且由于图形的矢量特性,从而有利于避免图像在缩放过程中出现锯齿等问题。
在上述技术方案中,优选地,还包括:版面分析与理解单元108,用于对选定的版式文档进行版面分析与理解,并从所述版式文档中识别出所述背景元素和所述正文内容,以用于生成所述流式文档。
在该技术方案中,本申请提出的基于复合图元的流式文档,可以是从头开始建立的。而通过对现有的版式文档进行版面分析与理解的方法,可以将识别出来的背景元素生成复合图元,从而重新生成为相应的流式文档,实现了版式文档与流式文档之前的转换,且得到的流式文档能够具有与版式文档类似的显示效果。而在进行版面中正文内容和背景元素的识别和分离时,除了采用版面分析与理解的方法进行自动识别,还可以利用工具软件,对正文内容和背景进行手工标注,方便用户对流式显示属性的设置。
在上述技术方案中,优选地,还包括:图元确定单元110,用于在终端上显示所述流式文档的指定页面时,确定所述指定页面上的复合图元;图元适配单元112,用于根据所述终端的屏幕分辨率,将所述复合图元适配显示在所述终端的屏幕界面上,以作为所述指定页面的显示背景;区域适配单元114,用于根据所述复合图元的适配比例,以及所述排版区域与所述复合图元之间的相对位置关系,计算所述排版区域在所述屏幕界面上对应的实际排版区域;内容排版单元116,用于将对应于所述排版区域的正文内容排入所述实际排版区域。
在该技术方案中,对流式文档进行显示时,首先显示复合图元,可以根据复合图元与终端屏幕的宽高比例来选择复合图元的适配显示方式,然后根据其适配比例和复合图元与排版区域之间的关联关系,确定实际显示时的实际排版区域,以填充相应的正文内容。
在上述技术方案中,优选地,还包括:页面添加单元118,用于在所述正文内容无法全部排入当前页面中的所述实际排版区域中的情况下,生成至少一个新页面,所述至少一个新页面包含与所述当前页面相同的复合图元和排版区域;其中,所述内容排版单元将剩余的正文内容排入所述至少一个新页面中。
在该技术方案中,由于流式显示过程中,需要针对显示终端的分辨率进行界面调整,因而当终端的实际分辨率较低时,可能导致无法将全部的正文内容都填充至实际排版区域内,因而按照实际排版区域能够排入的数据量,将原本显示在一页的正文内容拆分开来,显示在自动重新生成的其他新的页面,且新的页面具有与原来页面相同的背景元素,增强文档的一致性。更为具体地,如果最后一个页面内的正文内容较少,不能排满整个排版区域,则未排版的部分作为空白。
图2示出了根据本发明的实施例的文档处理方法的流程图。
如图2所示,根据本发明的实施例的文档处理方法的流程,包括:步骤202,在当前界面中,将处于指定区域内的一种或多种类型的背景元素生成为一个复合图元;步骤204,根据接收到的用户设置指令,设置与所述复合图元对应的排版区域,以及与所述排版区域对应的正文内容;步骤206,利用所有的所述复合图元、所述排版区域、所述正文内容及其之间的关联关系,生成对应的流式文档。
在该技术方案中,通过将多种类型的背景元素生成一个整体的复合图元,避免了现有技术中仅能够显示单一背景元素的问题,可以使得背景元素更加丰富;同时,通过生成复合图元,使得各个背景元素及其显示属性在流式显示时保持不变或动态缩放,从而实现精美的版面效果。此外,通过将复合图元与排版区域之间建立关联关系,便于在背景与正文内容之间紧密联系起来,从而在得到更好的背景效果的同时,保证了对正文内容的正确显示。
在上述技术方案中,优选地,所述背景元素的类型包括以下至少一种或其组合:字符、图形、图像。
在该技术方案中,尤其是当背景元素中包含图形时,可以使用图形来替换原本的图像,比如对于一个粉色的矩形图像,可以利用矩形的外框以及在其中填充粉色进行替换,由于图形是由线条和颜色属性构成,有利于降低文档的数据量,并且由于图形的矢量特性,从而有利于避免图像在缩放过程中出现锯齿等问题。
在上述技术方案中,优选地,还包括:对选定的版式文档进行版面分析与理解,并从所述版式文档中识别出所述背景元素和所述正文内容,以用于生成所述流式文档。
在该技术方案中,本申请提出的基于复合图元的流式文档,可以是从头开始建立的。而通过对现有的版式文档进行版面分析与理解的方法,可以将识别出来的背景元素生成复合图元,从而重新生成为相应的流式文档,实现了版式文档与流式文档之前的转换,且得到的流式文档能够具有与版式文档类似显示效果。而在进行版面中正文内容和背景元素的识别和分离时,除了采用版面分析与理解的方法进行自动识别,还可以利用工具软件,对正文内容和背景进行手工标注,方便用户对流式显示属性的设置。
在上述技术方案中,优选地,还包括:在终端上显示所述流式文档的指定页面时,确定所述指定页面上的复合图元;根据所述终端的屏幕分辨率,将所述复合图元适配显示在所述终端的屏幕界面上,以作为所述指定页面的显示背景;根据所述复合图元的适配比例,以及所述排版区域与所述复合图元之间的相对位置关系,计算所述排版区域在所述屏幕界面上对应的实际排版区域;将对应于所述排版区域的正文内容排入所述实际排版区域。
在该技术方案中,对流式文档进行显示时,首先显示复合图元,可以根据复合图元与终端屏幕的宽高比例来选择复合图元的适配显示方式,然后根据其适配比例和复合图元与排版区域之间的关联关系,确定实际显示时的实际排版区域,以填充相应的正文内容。
在上述技术方案中,优选地,还包括:若所述正文内容无法全部排入当前页面中的所述实际排版区域中,则生成至少一个新页面,所述至少一个新页面包含与所述当前页面相同的复合图元和排版区域;将剩余的正文内容排入所述至少一个新页面中。
在该技术方案中,由于流式显示过程中,需要针对显示终端的分辨率进行界面调整,因而当终端的实际分辨率较低时,可能导致无法将全部的正文内容都填充至实际排版区域内,因而按照实际排版区域能够排入的数据量,将原本显示在一页的正文内容拆分开来,显示在自动重新生成的其他新的页面,且新的页面具有与原来页面相同的背景元素,增强文档的一致性。更为具体地,如果最后一个页面内的正文内容较少,不能排满整个排版区域,则未排版的部分作为空白。
下面结合图3A至图7详细说明本发明的技术方案。
图3A示出了根据本发明的实施例的电子图书页面。
如图3A所示,版式文件包含背景元素302、正文内容304和页脚306以及页眉308。
在本实施例中,排版的结果文件是由PostScript(一种编程语言)或者PDF等描述的版式文件;电子图书的文件用CEBX格式表示,CEBX是一个开放式的文档格式。
(1)步骤一:背景和正文内容分离。
首先在制作CEBX电子图书时,通过版面分析与理解的方法,对版面进行正文内容阅读对象和背景元素对象的识别,并把背景对象组合在一起,成为复合图元。如图3A所示,背景与正文内容分离后的版面如图3B所示,将背景元素复合生成复合图元310。(由于在流式显示时需要忽略页眉和页脚,所以页眉308和页脚306不在图3B中出现。)在进行正文内容和背景元素分离时,除了采用版面分析与理解的方法进行自动识别,还可以利用工具软件,对正文内容和背景进行手工标注。
对于比如图3B所示的背景元素,原来需要使用相应的图像才能使得背景元素既包含形状又包含颜色,但图像的数据量大、缩放时可能产生锯齿;而由于在复合图元310中可以使用字符、图形等,因而可以利用“线”来建立该背景元素的外边框的图形,并且标识出该图形内部的颜色属性,即可在降低最后生成文档的数据量,并且矢量的图形在缩放过程中不会出现锯齿等问题。
当然,本实施例是将现有版式文档转换为流式文档的过程,因而存在上述步骤一,若完全重新生成一个流式文档,则显然并不需要步骤一,而应该是根据用户操作指令,标识出需要作为正文和背景的部分。
(2)步骤二:生成CEBX的流式背景。
图4示出了根据本发明的实施例的复合图元示意图。
如图4所示,是复合图元对应的属性,比如Width是复合图元的宽402,Height是复合图元的高404,Content描述了复合图元中的内容406等等。在本实施例中,Content由一组路径(path)图元组成,这一组路径的显示效果就是图3B中的复合图元310。如图5所示,其中有直线段(L)、三次贝塞尔曲线(B)等图形对象。
(3)步骤三:关联背景和正文内容。
正文部分的内容按照正常的CEBX图元组织方式,由文档逻辑结构信息根节点(StructureRoot)、内容流、资源等描述。其中,在StructureRoot中,正文内容的内容(包括文字、图形和图像等)被组织为几个段落(Paragraph),而每一个段落都指定了段落的样式,利用样式中的背景(Background)属性,把背景与正文内容进行了关联。
由于目前的CEBX1.2格式标准(以及其他的背景描述,如CSS样式)中,只能指定背景的颜色或图像,所以,在本实施例在背景的描述中,增加BkComposite标签,用来表示指向一个复合图元的引用,如图6中的复合图元的背景602所示。
在指定与某个复合图元关联的排版区域时,可以采用下述方式:
针对BkComposite指向的复合图元,还可以指定一组边空属性,该边空有left、top、right和bottom四个值,以相对于复合图示外接矩形宽高的百分比表示,left和right对应宽的百分比,top和bottom对应高的百分比。边空属性指定了正文内容在显示时,正文内容的排版区域与复合图元之间的相对位置关系。
更进一步,针对BkComposite指向的复合图元,还可以指定一组坐标值[(x1,y1),(x2,y2),......,(xn,yn)],分别以相对于复合图示外接矩形宽高的百分比表示x和y的值,n组数据组成一个封闭的多边形。
此外,针对BkComposite指向的复合图元,还可以指定正文内容在背景上绘制时采用的颜色混合模式(blend),使正文内容和背景产生半透明等效果。
基于上述步骤,最终将复合图元、正文内容,以及复合图元与排版区域、排版区域与正文内容之间的关联关系等,共同生成为新的流式文档。
(4)步骤四:流式显示
在阅读软件中对以上步骤生成的流式文档进行显示时,首先根据当前需要显示的正文内容所对应的背景(Background)属性,进行背景的显示,即对相应的复合图元进行显示。
显示复合图元时,可以根据复合图元与终端屏幕的宽高比例来选择复合图元的适配显示方式。具体来说,可以设复合图元的宽为w1,高为h1;终端屏幕的宽为w2,高为h2。对背景复合图元的宽高比例(r1=w1/h1)与终端屏幕的宽高比例(r2=w2/h2)进行比较,如果r1=r2,则可以使复合图元撑满整个终端屏幕进行显示;如果r1>r2,则可以在垂直方向上使复合图元与终端屏幕的高对齐,即复合图元在垂直方向上以h2/h1的比例进行显示。在水平方向,可以根据复合图元的属性值,分两种情况:(1)按宽高等比例,即h2/h1比例进行显示,显示时,可以设定中心对齐、左上角对齐、右上角对齐、左下角对齐或右下角对齐等属性,在等比例显示时,超出终端屏幕的部分将不显示;(2)按终端屏幕的宽度缩放,即水平方向以w2/w1的比例进行显示;如果r1<r2,则可以在水平方向上使复合图元与终端屏幕的宽对齐,即复合图元在水平方向上以w2/w1的比例进行显示。在垂直方向,可以根据复合图元的属性值,分两种情况:(1)按宽高等比例,即w2/w1比例进行显示,显示时,可以设定中心对齐、左上角对齐、右上角对齐、左下角对齐或右下角对齐等属性,在等比例显示时,超出终端屏幕的部分将不显示;(2)按终端屏幕的高度缩放,即水平方向以h2/h1的比例进行显示。
在显示背景复合图元后,进行排版区域的计算。根据上述背景复合图元的垂直和水平方向的显示比例,以相同的垂直比例计算top、bottom,或者y1至yn,以相同的水平比例计算left、right或者x1至xn,得到排版区域的矩形或多边形坐标。
接下来根据排版的规则对具有相同背景(即复合图元)的段落进行排版,使正文内容排入上述排版区域内,如果无法在一个页面内完全排版,则创建出相同的新的页面继续排版,若新的页面中不能排满整个排版区域,则未排版的部分作为空白。阅读软件可以通过翻页、滚屏等操作,一页页地显示排版后的内容。如图7所示为根据本发明的实施例的流式显示效果图。
图8示出了根据本发明的实施例的多种复合图元示意图。
如图8所示,本实施例针对原始排版的版式中,存在多个复合图元的背景情况。其中,区域802和区域804分别有不同的背景元素806A和806B。
类似图3A至图7所述的实施例,在本实施例中,步骤一和步骤三的处理如下:
在步骤一中,背景和正文内容分离时,针对区域802A的背景元素806A、区域802B的背景元素806B、区域802C的背景元素806C和区域802D的背景元素806D,分别生成不同的复合图元,即分别形成对应于区域802A、区域802B、区域802C和区域802D的复合图元。
在步骤三中,关联背景和正文内容时,针对区域802A中的正文内容808A、正文内容808B,区域802B中的正文内容808C,区域802C中的正文内容808D、正文内容808E,区域802D中的正文内容808F、正文内容808G等,分别建立与对应的复合图元之间的关联关系。
在其余步骤中,将每个区域内的复合图元作为独立的个体,分别按照图3A至图7所示的方式进行处理。
以上结合附图详细说明了本发明的技术方案,考虑到在目前的流式阅读状态下,只能设置简单的背景。如果用背景色设置背景,则页面的背景单调;如果用图像设置背景,则在不同大小的屏幕上显示时,质量参差不齐,会出现锯齿状,而且图像数据增大了文档的数据量。因此,本发明提出了一种文档处理方案,可以使流式文档中包含原本版式文档中才有的复杂背景元素,从而在流式显示时,展示出各种精美的版式效果。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.文档处理系统,其特征在于,包括:
图元生成单元,用于在当前界面中,将处于指定区域内的一种或多种类型的背景元素生成为一个复合图元;
设置单元,用于根据接收到的用户设置指令,设置与所述复合图元对应的排版区域,以及与所述排版区域对应的正文内容;
文档生成单元,用于利用所有的所述复合图元、所述排版区域、所述正文内容及其之间的关联关系,生成对应的流式文档;
图元确定单元,用于在终端上显示所述流式文档的指定页面时,确定所述指定页面上的复合图元;
图元适配单元,用于根据所述终端的屏幕分辨率,将所述复合图元适配显示在所述终端的屏幕界面上,以作为所述指定页面的显示背景;
区域适配单元,用于根据所述复合图元的适配比例,以及所述排版区域与所述复合图元之间的相对位置关系,计算所述排版区域在所述屏幕界面上对应的实际排版区域;
内容排版单元,用于将对应于所述排版区域的正文内容排入所述实际排版区域。
2.根据权利要求1所述的文档处理系统,其特征在于,所述背景元素的类型包括以下至少一种或其组合:字符、图形、图像。
3.根据权利要求1所述的文档处理系统,其特征在于,还包括:
版面分析与理解单元,用于对选定的版式文档进行版面分析与理解,并从所述版式文档中识别出所述背景元素和所述正文内容,以用于生成所述流式文档。
4.根据权利要求1所述的文档处理系统,其特征在于,还包括:
页面添加单元,用于在所述正文内容无法全部排入当前页面中的所述实际排版区域中的情况下,生成至少一个新页面,所述至少一个新页面包含与所述当前页面相同的复合图元和排版区域;
其中,所述内容排版单元将剩余的正文内容排入所述至少一个新页面中。
5.一种文档处理方法,其特征在于,包括:
在当前界面中,将处于指定区域内的一种或多种类型的背景元素生成为一个复合图元;
根据接收到的用户设置指令,设置与所述复合图元对应的排版区域,以及与所述排版区域对应的正文内容;
利用所有的所述复合图元、所述排版区域、所述正文内容及其之间的关联关系,生成对应的流式文档;
在终端上显示所述流式文档的指定页面时,确定所述指定页面上的复合图元;
根据所述终端的屏幕分辨率,将所述复合图元适配显示在所述终端的屏幕界面上,以作为所述指定页面的显示背景;
根据所述复合图元的适配比例,以及所述排版区域与所述复合图元之间的相对位置关系,计算所述排版区域在所述屏幕界面上对应的实际排版区域;
将对应于所述排版区域的正文内容排入所述实际排版区域。
6.根据权利要求5所述的文档处理方法,其特征在于,所述背景元素的类型包括以下至少一种或其组合:字符、图形、图像。
7.根据权利要求5所述的文档处理方法,其特征在于,还包括:
对选定的版式文档进行版面分析与理解,并从所述版式文档中识别出所述背景元素和所述正文内容,以用于生成所述流式文档。
8.根据权利要求5所述的文档处理方法,其特征在于,还包括:
若所述正文内容无法全部排入当前页面中的所述实际排版区域中,则生成至少一个新页面,所述至少一个新页面包含与所述当前页面相同的复合图元和排版区域;
将剩余的正文内容排入所述至少一个新页面中。
CN201310412839.1A 2013-09-11 2013-09-11 文档处理系统和文档处理方法 Expired - Fee Related CN104424174B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310412839.1A CN104424174B (zh) 2013-09-11 2013-09-11 文档处理系统和文档处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310412839.1A CN104424174B (zh) 2013-09-11 2013-09-11 文档处理系统和文档处理方法

Publications (2)

Publication Number Publication Date
CN104424174A CN104424174A (zh) 2015-03-18
CN104424174B true CN104424174B (zh) 2017-11-07

Family

ID=52973179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310412839.1A Expired - Fee Related CN104424174B (zh) 2013-09-11 2013-09-11 文档处理系统和文档处理方法

Country Status (1)

Country Link
CN (1) CN104424174B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241304B (zh) * 2018-08-16 2021-12-03 广州视源电子科技股份有限公司 图片处理方法、装置及设备
CN109582934B (zh) * 2018-12-04 2023-02-10 万兴科技股份有限公司 版式文档的转换方法及装置
CN113569528A (zh) * 2021-07-19 2021-10-29 湖州度康科技有限公司 一种自动版面文档标注生成方法
CN116451671B (zh) * 2023-06-16 2023-11-07 上海森亿医疗科技有限公司 文档格式数据加载渲染方法、终端、介质及web编辑器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101308488A (zh) * 2008-06-05 2008-11-19 北大方正集团有限公司 基于版式文件的文档流式信息处理方法及装置
CN101419717A (zh) * 2008-12-11 2009-04-29 北大方正集团有限公司 一种版式文件图文自动关联的方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102302A (ja) * 2005-09-30 2007-04-19 My Print:Kk Webリアルタイム組版システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101308488A (zh) * 2008-06-05 2008-11-19 北大方正集团有限公司 基于版式文件的文档流式信息处理方法及装置
CN101419717A (zh) * 2008-12-11 2009-04-29 北大方正集团有限公司 一种版式文件图文自动关联的方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《The Design and Realization of Exquisite Course Authoring Platform》;KE Heping等;《International Journal of Systems and Control》;20080915(第02期);第139-145页 *
一种在电子出版中融合固定版面与流式信息的方法;仇睿恒等;《电子学报》;20121115;第40卷(第11期);第2276-2281页 *

Also Published As

Publication number Publication date
CN104424174A (zh) 2015-03-18

Similar Documents

Publication Publication Date Title
JP5465015B2 (ja) 文書を電子化する装置及び方法
CN101699426B (zh) 文档格式转化系统及方法
US7234108B1 (en) Ink thickness rendering for electronic annotations
CN108710601B (zh) 一种文本显示方法及其设备、存储介质、电子设备
CN105302550A (zh) 将页面转为版式数据流文件的方法及系统
JP2006285896A (ja) 電子文書の表示装置及び方法、並びにコンピュータプログラム
CN104424174B (zh) 文档处理系统和文档处理方法
CN109857670B (zh) 一种基于通用模板的测试报告自动生成方法
CN105808217A (zh) 一种基于xml的流程图绘制方法及系统
JP2014165766A (ja) コンテンツ作成装置、コンテンツ配信サーバ、およびコンテンツ作成方法
US20100269033A1 (en) Computerized method and computer program for displaying and printing markup
CN105224540A (zh) 页面排版方法及装置
JP2009540359A (ja) リモートサブピクセル解像度の特性
CN107025630A (zh) 一种基于svg的电力系统地理接线图背景地图生成方法
CN110310226B (zh) 图片的拼接显示方法及系统
KR101371406B1 (ko) Pdf 문서의 소스분석을 통한 전자책 제작방법 및 시스템
CN115757272A (zh) 一种将html文件转换为ofd文件的方法及系统
CN103049430A (zh) 一种基于idf格式文件的页面显示方法
US7366978B1 (en) Method and system for creating a grid-like coordinate system for addressing data contained in an irregular computer-generated table
CN102736819A (zh) 电子文档显示方法和装置
JP4928710B2 (ja) 空間変位サンプリングをセマンティックデータと一緒に使用してスタティック画像を表示する方法とシステム
CN102902658A (zh) 一种炫彩字显示方法和装置
US8988423B2 (en) Electronic album generating apparatus, stereoscopic image pasting apparatus, and methods and programs for controlling operation of same
CN101944081A (zh) 一种古琴减字谱的计算机生成、编辑方法与系统
Salim et al. Comparative study of low-cost tools to create effective educational infographics content

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Patentee after: Peking University

Patentee after: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee after: FOUNDER APABI TECHNOLOGY Ltd.

Patentee after: PKU FOUNDER INFORMATION INDUSTRY GROUP CO.,LTD.

Address before: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Patentee before: Peking University

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: FOUNDER APABI TECHNOLOGY Ltd.

Patentee before: FOUNDER INFORMATION INDUSTRY HOLDINGS Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220908

Address after: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Patentee after: Peking University

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: FOUNDER APABI TECHNOLOGY Ltd.

Address before: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Patentee before: Peking University

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: FOUNDER APABI TECHNOLOGY Ltd.

Patentee before: PKU FOUNDER INFORMATION INDUSTRY GROUP CO.,LTD.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171107