CN102541827A - 一种文档的可扩展标记语言的描述方法及系统 - Google Patents

一种文档的可扩展标记语言的描述方法及系统 Download PDF

Info

Publication number
CN102541827A
CN102541827A CN2010106243282A CN201010624328A CN102541827A CN 102541827 A CN102541827 A CN 102541827A CN 2010106243282 A CN2010106243282 A CN 2010106243282A CN 201010624328 A CN201010624328 A CN 201010624328A CN 102541827 A CN102541827 A CN 102541827A
Authority
CN
China
Prior art keywords
document
virtual
page
page number
leaf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010106243282A
Other languages
English (en)
Other versions
CN102541827B (zh
Inventor
蒋国新
张晓迁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI PRINTING (GROUP) CO Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
SHANGHAI PRINTING (GROUP) CO Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI PRINTING (GROUP) CO Ltd, Beijing Founder Electronics Co Ltd filed Critical SHANGHAI PRINTING (GROUP) CO Ltd
Priority to CN201010624328.2A priority Critical patent/CN102541827B/zh
Publication of CN102541827A publication Critical patent/CN102541827A/zh
Application granted granted Critical
Publication of CN102541827B publication Critical patent/CN102541827B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种文档的可扩展标记语言的描述方法及系统。本发明首先把输入文档转换为可移植文档格式,提取文档每页的页面尺寸信息和预览图,生成以页为单位的信息单元。在页面的基础上,使用可扩展标记语言,把多个页面组织成虚拟页面,把虚拟页面组织成一个虚拟文档。针对文档的折手和拼版操作,只生成一个新的虚拟文档。本发明主要应用于数码印刷领域。

Description

一种文档的可扩展标记语言的描述方法及系统
技术领域
本发明属于数字印刷技术领域,具体涉及一种文档的可扩展语言的描述方法和系统。
背景技术
数码印刷时的成品,经常由多个源文档各抽取部分或者全面页面组成,并且源文档的格式可能不一致。比如书籍,其封面和内插页一般是TIFF格式的彩色图像文件,而内页则采用方正书版或者微软办公软件生成,其前言、目录、章节和附录等存储为多个文件,并且成品的生产过程,一般还需要经过折手(或者小册子打印)处理。对于传统印刷这样的情况是适合的,各页面单独印刷,最后通过配页来完成成品的制作。而对于数码印刷,特别是带后处理设备的数码印刷机,一般需要重新排版才能够解决此种需求。这样的处理方式,不仅效率低下,容易出错,而且不适应数码印刷行业排版和印刷分离的状况,
发明内容
针对现有技术中存在的缺陷,本发明所要解决的技术问题是在文档输出时,能够方便地从多个源文档组织复杂的文档结构,调整文档的页序,对文档进行折手或者拼版操作。生成的文档,可以方便地导出生成物理文档,或者送输出设备。
为解决上述技术问题,本发明采用的技术方案如下:
一种文档的可扩展语言的描述方法和系统,其描述方式定义如下:
虚拟页面是一个由多个物理页面组织成的页面描述对象,物理页面是指一个可移植格式的文档中的页面。虚拟页面的属性包括:页面的大小,包含的物理页面的数目,虚拟页面对应的物理页面的列表。列表中的每个元素,对应一个物理页面,其于属性包括:物理页面对象的物理文件名称,其在物理文档中的页码,其在虚拟页面上的裁剪框,物理页面到虚拟页面的几何变换矩阵。虚拟文档是在虚拟页面的基础上,由虚拟页面组成的一个数据结构,虚拟页面和虚拟文档,都采用可扩展语言格式来描述。
一种文档的可扩展语言的描述方法,其包括如下步骤:
(1)输入源文档文件,转化为可移植的文档格式,提取文档每一页的页面信息;这样的页面对象,我们称之为“小页”;
(2)虚拟文档的结构采用可扩展的标记语言来描述,包括文档的总页数以及虚拟页面列表;列表中的一个子项,对应一个虚拟页面;虚拟页面由一个或者多个步骤(1)的“小页”组成,包括:虚拟页面的尺寸,“小页”的数目和“小页”列表;“小页”列表的每一个子项,对应一个“小页”,包括“小页”的标识,“小页”到虚拟页面的几何变换矩阵,“小页”在虚拟页面上的裁剪框;
(3)步骤(1)输入的源文档,按照步骤(2)的定义,生成源文档对应的虚拟文档;虚拟文档的页数等于源文档页数,虚拟文档的每一个虚拟页面由源文档的一个“小页”组成,虚拟页面的大小等于“小页”的尺寸,“小页”到虚拟页面的变换矩阵为单位阵,裁剪框等于“小页”的大小;源文档转化为按照页序由虚拟页面组成的虚拟文档;
(4)混合文档的创建和编辑,可以很方便地把步骤(3)生成的多个虚拟文档中,摘取需要的页面组织而成一个新的虚拟文档;
(5)虚拟文档的折手或者拼版处理,只针对其可扩展的标记语言文件做处理,生成新的虚拟文档;
(6)虚拟文档的导出操作,可以把虚拟文档,转化为可移植的文档格式的物理文档文件;
(7)虚拟文档的输出,使用支持虚拟文档描述的光栅化处理器,把虚拟文档的虚拟页面,转化为物理设备支持的点阵数据,送印刷设备输出。
一种文档的可扩展语言的描述系统,包括:
模块1,用于输入源文档文件,转化为可移植的文档格式,提取文档每一页的页面信息;这样的页面对象,我们称之为“小页”;
模块2,用于虚拟文档的结构采用可扩展的标记语言来描述,包括文档的总页数以及虚拟页面列表;列表中的一个子项,对应一个虚拟页面;虚拟页面由一个或者多个模块1的“小页”组成,包括:虚拟页面的尺寸,“小页”的数目和“小页”列表;“小页”列表的每一个子项,对应一个“小页”,包括“小页”的标识,“小页”到虚拟页面的几何变换矩阵,“小页”在虚拟页面上的裁剪框;
模块3,用于模块1输入的源文档,按照模块2的定义,生成源文档对应的虚拟文档;虚拟文档的页数等于源文档页数,虚拟文档的每一个虚拟页面由源文档的一个“小页”组成,虚拟页面的大小等于“小页”的尺寸,“小页”到虚拟页面的变换矩阵为单位阵,裁剪框等于“小页”的大小;源文档转化为按照页序由虚拟页面组成的虚拟文档;
模块4,用于混合文档的创建和编辑,可以很方便地把模块3生成的多个虚拟文档中,摘取需要的页面组织而成一个新的虚拟文档;
模块5,用于虚拟文档的折手或者拼版处理,只针对其可扩展的标记语言文件做处理,生成新的虚拟文档;
模块6,用于虚拟文档的导出操作,可以把虚拟文档,转化为可移植的文档格式的物理文档文件;
模块7,用于虚拟文档的输出,使用支持虚拟文档描述的光栅化处理器,把虚拟文档的虚拟页面,转化为物理设备支持的点阵数据,送印刷设备输出。
一种文档的可扩展标记语言的描述系统,包括:
页面信息提取装置,用于解析源文档,提取源文档中的页面信息;
虚拟页面创建装置,用于根据源文档中的页面信息创建虚拟页面,一个虚拟页面对应源文档中的一个页面;
虚拟文档组合装置,用于抽取各源文档中需要的虚拟页面组成虚拟文档;
虚拟大版生成装置,用于对虚拟文档进行折手处理,生成虚拟大版;
虚拟文档导出装置,用于把虚拟文档导出成物理文档(可移植文档格式);
虚拟文档光栅化装置,用于对虚拟大版进行光栅化处理,生成点阵;
虚拟文档打印装置,用于输出光栅化装置生成的点阵。
本发明所述方法及系统,通过将各源文档中提取的页面信息组织成虚拟文档,再进行后续处理的方式,无需将不同格式的源文档转换成同一格式的文档,从而有效地提高了文档的组织方式,提高了输出效率。
附图说明
图1是具体实施方式中一种文档的可扩展标记语言的描述方法及系统的结构和数据流图;
图2是具体实施方式中一种文档的可扩展标记语言的描述方法及系统的输出方法流程图。
具体实施方式
下面结合具体实施方式和附图对本发明进行详细描述。
本发明的核心思想是:对于存在多种格式的多个源文档,提取每个源文档中页面信息,根据页面信息创建虚拟页面;再从虚拟页面中抽取需要输出的虚拟页面组成虚拟文档;再对虚拟文档进行折手操作,生成虚拟大版(一个新的虚拟文档);最后对虚拟页面进行光栅化处理,生成点阵,由打印装置输出。
图1出示了本实施方式中一种文档的可扩展标记语言的描述方法及系统的结构和数据流图。该系统包括页面信息提取装置11,与页面信息提取装置11连接的虚拟页面创建装置12,与虚拟页面创建装置12连接的虚拟文档组合装置13,与虚拟文档组合装置13连接的虚拟大版生成装置14,与虚拟大版生成装置14连接的光栅化装置15,以及与光栅化装置15连接的打印装置16。
所述页面信息提取装置11用于解析源文档,提取源文档中的页面信息。虚拟页面创建装置12用于根据源文档中的页面信息创建虚拟页面。虚拟文档组合装置13用于抽取各源文档中需要的虚拟页面组成虚拟文档。虚拟大版生成装置14用于对虚拟文档进行折手处理,生成虚拟大版。光栅化装置15用于对虚拟大版进行光栅化处理,生成点阵。打印装置16用于输出光栅化装置15生成的点阵。
图2出示了采用图1所示系统输出混合文档的方法流程。该方法包括以下步骤:
(1)页面信息提取装置11解析各源文档,提取各源文档中的页面信息。
本实施方式中,包括三个源文档,类型分别为:PDF(Portable DocumentFormat,Adobe公司电子文档格式,可移植文档格式标准)文档、PS(PostScript,Adobe公司开发的一种可编程打印控制语言)文档和CEB(方正Apabi公司的电子书格式)文档。源文档中的页面信息包括源文档包含的总页面数、每个页面的版心尺寸和色面信息等。
对于PDF文档,由于它是结构化的页面描述文件,因此可以很方便地从文档的结构中提取总页数,每个页面的版心尺寸和色面信息。
对于PS文档,可以采用轻光栅化器来获得页面信息,也可以使用转换工具先把PS文档转换为PDF文档,然后再提取页面信息。转换工具可以采用方正开发的规范化器,也可以采用Adobe公司的Distiller。光栅化是指页面描述文件转化为点阵的过程,轻光栅化器是指仅对页面描述进行语法解释,而不生成点阵。
对于CEB文档,不进行格式转换,可以使用方正Apabi公司提供的开发包,获取文档的总页数和每个页面的版心尺寸和色面信息。
对于其他格式的文档,要求该种格式的文档能够获取其页面信息,并且页面描述能够转化为点阵。
在提取源文档的页面信息时,可以生成每个页面的预览图。这样可以方便虚拟页面的浏览,并且对虚拟页面的处理可以有一个比较直观的呈现。在虚拟文档生成虚拟大版时,可以把每个页面的预览图按照折手的规则合并成大版的预览图。生成预览图的过程,一般可以和获取源文档页面信息的过程同时完成。
(2)虚拟页面创建装置12根据各源文档中的页面信息创建虚拟页面。
虚拟页面是一个数据结构,记录虚拟页面的属性,没有一个物理上的文件相对应。一个虚拟页面对应源文档中的一个页面。虚拟页面的属性包括:虚拟页面所属源文档名称、虚拟页面在源文档中的页号,虚拟页面的版芯尺寸和色面信息,虚拟页面对应的预览图文件名称(如果存在),虚拟页面的变换矩阵,虚拟页面的裁剪框。虚拟页面的变换矩阵,初始值为单位矩阵;虚拟页面的裁剪框,初始值为虚拟页面的版芯大小。
虚拟页面创建后,可以对虚拟页面进行旋转、裁切等操作。不需要对源文档有任何处理,只需要更新虚拟页面的属性即可。例如,页面顺时针旋转90度,那么只需改变虚拟页面变换矩阵的值,改变版芯尺寸(横纵尺寸对调),改变裁剪框的值,而不需要对源文档进行处理。
(3)虚拟文档组合装置13抽取各源文档中需要输出的虚拟页面组成虚拟文档。
虚拟文档是虚拟页面的集合,没有物理上的文档文件相对应,只是一个数据结构。其属性包括:虚拟文档包含的总页数,每个页码对应的虚拟页面。
(4)虚拟大版生成装置14对虚拟文档进行折手处理,生成虚拟大版。
选择折手模板,对虚拟文档进行折手操作,生成虚拟大版。虚拟大版没有物理上的文件相对应,只是一个数据结构,记录虚拟大版的属性。其属性包括:大版的版芯尺寸,大版的色面信息,大版上页面的数目,每个页面对应虚拟文档中的页码(从而对应一个虚拟页面),虚拟页面到大版的变换矩阵,虚拟页面在大版上的裁剪框。如果折手操作还生成标记,那么虚拟大版的属性还包括:标记文件的文件名称;标记的变换矩阵和标记的裁剪框。虚拟大版的属性,受折手参数(也是打印参数)的影响。例如单面打印和双面打印,折手的结果是不同的。
文档的折手,是指根据印张折叠成书帖时与出版物页面顺序相符的版式。例如,一个文档有4个A4页面,需要双面打印在一张A3纸张上,打印后A3的长边方面居中折叠,那么A3纸张的正面有两个A4页面,左边是页面4,右边是页码1;A3纸张的反面有两个A4页面,左边是页面2,右边是页码3。折手处理,一般是创建折手程序接受的工作传票,折手程序接收工作传票,生成折手后大版的描述。
(5)光栅化装置15对虚拟大版进行光栅化处理,生成点阵,然后将点阵传送至打印装置16输出。
虚拟大版的光栅化,可以采用如下方法实现:根据打印装置16的分辨率、大版的版芯尺寸和色面信息,创建虚拟大版对应的点阵内存;虚拟大版上的各虚拟页面,分别送相应的光栅化器生成虚拟页面对应的点阵;根据虚拟页面的属性(变换矩阵和裁剪框),处理虚拟页面的旋转、裁剪等操作;处理后的点阵,按照虚拟页面到大版的变换矩阵和在大版上的裁剪框,拷贝相应内容到大版点阵内存上;虚拟大版上所有的虚拟页面处理完毕后,大版的光栅化处理结束。虚拟大版的光栅化方法,可以做多种优化。例如:如果光栅化器能够处理虚拟大版上的所有虚拟页面的光栅化工作,并且具备接收折手的结果直接生成大版点阵的能力,那么就不需要做虚拟页面的点阵到大版点阵的拼点阵操作,这样可以大大提高虚拟大版的光栅化速度。
如果虚拟大版不包含CEB文件,那么方正的光栅化器可以解释大版上的所有虚拟页面,并且可以接受大版描述,直接生成大版点阵;如果虚拟页面包含了CEB文件,那么对于CEB文件,分别光栅化每个CEB页面后,进行虚拟页面的点阵到大版点阵的操作,完成大版的光栅化处理。
点阵生成后,将其传送至打印装置16,由打印装置16完成混合文档的输出。
本发明的一个实施例提供了一种文档的可扩展语言的描述方法,包括以下步骤:
(1)解析源文档,生成可移植文档格式,提取源文档中的页面信息;创建虚拟页面对象;源文档按照描述方法的定义,转化为虚拟文档;
(2)由多个虚拟文档,抽取所需虚拟页面,组成新的虚拟文档。
(3)根据需要,对虚拟文档进行折手或者拼版处理,按照折手或者拼版规则,使用定义的描述方法,生成新的虚拟文档。
(4)根据需要,对虚拟文档进行导出操作,创建新的物理文档;
(5)虚拟文档,使用支持虚拟文档格式的光栅化处理器,送打印机输出;
如上所述的方法,步骤(1)中所述源文档的格式包括Adobe公司的可移植文档(PDF)、PostScript格式文档(PS\EPS)、方正公司的电子书格式(CEB)、方正书版格式(PS2\S2\S72),打印机文件格式(PRN),微软办公软件Office格式文档,文本(TXT)格式文件,图像格式文档。
如上所述的方法,步骤(1)中,源文档到可移植文档的转化,有多家公司有转化的技术。本系统采用的是方正公司的规范化器,可以把PDF、PS、EPS、CEB、PS2、S2、S72、PRN、图像文档转化为可移植文档。对于其它的文档格式,比如微软格式的Office办公软件的文档,可以使用图形设备接口(GDI)打印机方式,转化为可移植文档。
如上所述的方法,步骤(1)中,页面信息,包括源文档名称,可移植文档文件的名称,页面在可移植文件中的页码,页面的尺寸,如果文档需要预览,那么还包括页面的预览图名称。在提取各源文档中的页面信息时,同时生成每个页面的预览图。
如上所述的方法,步骤(1)中创建虚拟页面后,对虚拟页面还可以进行旋转和/或裁减操作。对虚拟页面进行旋转和/或裁减操作通过更新虚拟页面的相关属性实现。
如上所述的方法,步骤(3)中还包括将每个页面的预览图按照折手的规则合并成虚拟大版的预览图的操作。
如上所述的方法,步骤(4)导出操作,是根据虚拟文档的每个页面的描述,使用可移植文档的合并页面功能来完成,生成的结果是一个可移植文档。转化时重新创建可移植文档格式,页面数等同于虚拟文档页面数,每一个页面解析虚拟文档的描述,把“小页”上的对象按照虚拟文档的描述放置到页面上,生成真正的物理文档文件;
如上所述的方法,步骤(5)中对虚拟大版进行光栅化处理的方法如下:根据打印装置的分辨率和页面信息,创建虚拟大版对应的点阵内存;虚拟大版上的各虚拟页面,分别送相应的光栅化器生成虚拟页面对应的点阵;生成的点阵按照虚拟页面的属性,拷贝相应内容到大版点阵内存上;虚拟大版上所有的虚拟页面处理完毕后,光栅化处理结束。
如上所述的方法,其中,如果所述光栅化器能够处理虚拟大版上的所有虚拟页面的光栅化工作,并且具备接收折手的结果直接生成大版点阵的能力,则无需进行虚拟页面的点阵到大版点阵的拼点阵操作。
本发明的一个实施例提供了一种文档的可扩展语言的描述系统,包括:
模块1,用于输入源文档文件,转化为可移植的文档格式,提取文档每一页的页面信息;这样的页面对象,我们称之为“小页”;
模块2,用于虚拟文档的结构采用可扩展的标记语言来描述,包括文档的总页数以及虚拟页面列表;列表中的一个子项,对应一个虚拟页面;虚拟页面由一个或者多个模块1的“小页”组成,包括:虚拟页面的尺寸,“小页”的数目和“小页”列表;“小页”列表的每一个子项,对应一个“小页”,包括“小页”的标识,“小页”到虚拟页面的几何变换矩阵,“小页”在虚拟页面上的裁剪框;
模块3,用于模块1输入的源文档,按照模块2的定义,生成源文档对应的虚拟文档;虚拟文档的页数等于源文档页数,虚拟文档的每一个虚拟页面由源文档的一个“小页”组成,虚拟页面的大小等于“小页”的尺寸,“小页”到虚拟页面的变换矩阵为单位阵,裁剪框等于“小页”的大小;源文档转化为按照页序由虚拟页面组成的虚拟文档;
模块4,用于混合文档的创建和编辑,可以很方便地把模块3生成的多个虚拟文档中,摘取需要的页面组织而成一个新的虚拟文档;
模块5,用于虚拟文档的折手或者拼版处理,只针对其可扩展的标记语言文件做处理,生成新的虚拟文档;
模块6,用于虚拟文档的导出操作,可以把虚拟文档,转化为可移植的文档格式的物理文档文件;
模块7,用于虚拟文档的输出,使用支持虚拟文档描述的光栅化处理器,把虚拟文档的虚拟页面,转化为物理设备支持的点阵数据,送印刷设备输出。
如上所述的系统,模块1中所述源文档的格式包括PDF、PS、EPS、DOC/DOCX、XLS/XLSX、PPT、WPS、PS2、S2、S72、CEB、PRN、TIFF、JPG;页面信息,包括源文档名称,可移植文档文件的名称,页面在可移植文件中的页码,页面的尺寸,如果文档需要预览,那么还包括页面的预览图名称,预览图采用分辨率为每英寸72线的图像来表示,一般使用PNG格式来存储;页面信息可以采用数据库存储;小页的名称采用在源文档名称基础上,添加页码和标识字段值组成的字符串来表示。
如上所述的系统,虚拟页面的预览图,可以使用光栅化器处理可移植文件来生成。
如上所述的系统,模块4中,虚拟文档的导出操作,是根据虚拟文档的每个页面的描述,使用可移植文档的合并页面功能来完成,生成的结果是一个可移植文档;转化时重新创建可移植文档格式,页面数等同于虚拟文档页面数,每一个页面解析虚拟文档的描述,把“小页”上的对象按照虚拟文档的描述放置到页面上,生成真正的物理文档文件。
如上所述的系统,模块7对虚拟文档的输出,需要光栅化器支持可扩展的标记语言定义的虚拟文档,这样才可以实现在不生成新文档的基础上,完成虚拟文档的输出。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其同等技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种文档的可扩展语言的描述方法,包括以下步骤:
(1)输入源文档文件,转化为可移植的文档格式,提取文档每一页的页面信息;这样的页面对象,我们称之为“小页”;
(2)虚拟文档的结构采用可扩展的标记语言来描述,包括文档的总页数以及虚拟页面列表;列表中的一个子项,对应一个虚拟页面;虚拟页面由一个或者多个步骤(1)的“小页”组成,包括:虚拟页面的尺寸,“小页”的数目和“小页”列表;“小页”列表的每一个子项,对应一个“小页”,包括“小页”的标识,“小页”到虚拟页面的几何变换矩阵,“小页”在虚拟页面上的裁剪框;
(3)步骤(1)输入的源文档,按照步骤(2)的定义,生成源文档对应的虚拟文档;虚拟文档的页数等于源文档页数,虚拟文档的每一个虚拟页面由源文档的一个“小页”组成,虚拟页面的大小等于“小页”的尺寸,“小页”到虚拟页面的变换矩阵为单位阵,裁剪框等于“小页”的大小;源文档转化为按照页序由虚拟页面组成的虚拟文档;
(4)混合文档的创建和编辑,可以很方便地把步骤(3)生成的多个虚拟文档中,摘取需要的页面组织而成一个新的虚拟文档;
(5)虚拟文档的折手或者拼版处理,只针对其可扩展的标记语言文件做处理,生成新的虚拟文档;
(6)虚拟文档的导出操作,可以把虚拟文档,转化为可移植的文档格式的物理文档文件;
(7)虚拟文档的输出,使用支持虚拟文档描述的光栅化处理器,把虚拟文档的虚拟页面,转化为物理设备支持的点阵数据,送印刷设备输出。
2.如权利要求1所述的方法,其特征在于:步骤(1)中所述源文档的格式包括PDF、PS、EPS、DOC/DOCX、XLS/XLSX、PPT、WPS、PS2、S2、S72、CEB、PRN、TIFF、JPG;页面信息,包括源文档名称,可移植文档文件的名称,页面在可移植文件中的页码,页面的尺寸,如果文档需要预览,那么还包括页面的预览图名称,预览图采用分辨率为每英寸72线的图像来表示,一般使用PNG格式来存储;页面信息可以采用数据库存储;小页的名称采用在源文档名称基础上,添加页码和标识字段值组成的字符串来表示。
3.如权利要求2所述的方法,其特征在于:虚拟页面的预览图,可以使用光栅化器处理可移植文件来生成。
4.如权利要求1所述的方法,其特征在于:步骤(4)中,虚拟文档的导出操作,是根据虚拟文档的每个页面的描述,使用可移植文档的合并页面功能来完成,生成的结果是一个可移植文档;转化时重新创建可移植文档格式,页面数等同于虚拟文档页面数,每一个页面解析虚拟文档的描述,把“小页”上的对象按照虚拟文档的描述放置到页面上,生成真正的物理文档文件。
5.如权利要求1所述的方法,其特征在于:步骤(7)对虚拟文档的输出,需要光栅化器支持可扩展的标记语言定义的虚拟文档,这样才可以实现在不生成新文档的基础上,完成虚拟文档的输出。
6.一种文档的可扩展语言的描述方法,包括:
模块1,用于输入源文档文件,转化为可移植的文档格式,提取文档每一页的页面信息;这样的页面对象,我们称之为“小页”;
模块2,用于虚拟文档的结构采用可扩展的标记语言来描述,包括文档的总页数以及虚拟页面列表;列表中的一个子项,对应一个虚拟页面;虚拟页面由一个或者多个模块1的“小页”组成,包括:虚拟页面的尺寸,“小页”的数目和“小页”列表;“小页”列表的每一个子项,对应一个“小页”,包括“小页”的标识,“小页”到虚拟页面的几何变换矩阵,“小页”在虚拟页面上的裁剪框;
模块3,用于模块1输入的源文档,按照模块2的定义,生成源文档对应的虚拟文档;虚拟文档的页数等于源文档页数,虚拟文档的每一个虚拟页面由源文档的一个“小页”组成,虚拟页面的大小等于“小页”的尺寸,“小页”到虚拟页面的变换矩阵为单位阵,裁剪框等于“小页”的大小;源文档转化为按照页序由虚拟页面组成的虚拟文档;
模块4,用于混合文档的创建和编辑,可以很方便地把模块3生成的多个虚拟文档中,摘取需要的页面组织而成一个新的虚拟文档;
模块5,用于虚拟文档的折手或者拼版处理,只针对其可扩展的标记语言文件做处理,生成新的虚拟文档;
模块6,用于虚拟文档的导出操作,可以把虚拟文档,转化为可移植的文档格式的物理文档文件;
模块7,用于虚拟文档的输出,使用支持虚拟文档描述的光栅化处理器,把虚拟文档的虚拟页面,转化为物理设备支持的点阵数据,送印刷设备输出。
7.如权利要求6所述的系统,其特征在于:模块1中所述源文档的格式包括PDF、PS、EPS、DOC/DOCX、XLS/XLSX、PPT、WPS、PS2、S2、S72、CEB、PRN、TIFF、JPG;页面信息,包括源文档名称,可移植文档文件的名称,页面在可移植文件中的页码,页面的尺寸,如果文档需要预览,那么还包括页面的预览图名称,预览图采用分辨率为每英寸72线的图像来表示,一般使用PNG格式来存储;页面信息可以采用数据库存储;小页的名称采用在源文档名称基础上,添加页码和标识字段值组成的字符串来表示。
8.如权利要求7所述的系统,其特征在于:虚拟页面的预览图,可以使用光栅化器处理可移植文件来生成。
9.如权利要求6所述的系统,其特征在于:模块4中,虚拟文档的导出操作,是根据虚拟文档的每个页面的描述,使用可移植文档的合并页面功能来完成,生成的结果是一个可移植文档;转化时重新创建可移植文档格式,页面数等同于虚拟文档页面数,每一个页面解析虚拟文档的描述,把“小页”上的对象按照虚拟文档的描述放置到页面上,生成真正的物理文档文件;模块7对虚拟文档的输出,需要光栅化器支持可扩展的标记语言定义的虚拟文档,这样才可以实现在不生成新文档的基础上,完成虚拟文档的输出。
10.一种文档的可扩展标记语言的描述系统,包括:
页面信息提取装置,用于解析源文档,提取源文档中的页面信息;
虚拟页面创建装置,用于根据源文档中的页面信息创建虚拟页面,一个虚拟页面对应源文档中的一个页面;
虚拟文档组合装置,用于抽取各源文档中需要的虚拟页面组成虚拟文档;
虚拟大版生成装置,用于对虚拟文档进行折手处理,生成虚拟大版;
虚拟文档导出装置,用于把虚拟文档导出成物理文档(可移植文档格式);
虚拟文档光栅化装置,用于对虚拟大版进行光栅化处理,生成点阵;
虚拟文档打印装置,用于输出光栅化装置生成的点阵。
CN201010624328.2A 2010-12-31 2010-12-31 一种文档的可扩展标记语言的描述方法及系统 Expired - Fee Related CN102541827B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010624328.2A CN102541827B (zh) 2010-12-31 2010-12-31 一种文档的可扩展标记语言的描述方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010624328.2A CN102541827B (zh) 2010-12-31 2010-12-31 一种文档的可扩展标记语言的描述方法及系统

Publications (2)

Publication Number Publication Date
CN102541827A true CN102541827A (zh) 2012-07-04
CN102541827B CN102541827B (zh) 2015-01-21

Family

ID=46348753

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010624328.2A Expired - Fee Related CN102541827B (zh) 2010-12-31 2010-12-31 一种文档的可扩展标记语言的描述方法及系统

Country Status (1)

Country Link
CN (1) CN102541827B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942187A (zh) * 2013-01-18 2014-07-23 北大方正集团有限公司 一种拼版的方法及装置
CN104111915A (zh) * 2013-04-17 2014-10-22 北大方正集团有限公司 一种大版成书预览方法及装置
CN104281418A (zh) * 2013-07-08 2015-01-14 北大方正集团有限公司 电子监管码印刷方法及系统
CN104572055A (zh) * 2013-10-23 2015-04-29 北大方正集团有限公司 拼版脚本生成装置和拼版脚本生成方法
CN104778153A (zh) * 2014-01-13 2015-07-15 北大方正集团有限公司 文件替换方法和装置
CN105335337A (zh) * 2014-06-17 2016-02-17 北大方正集团有限公司 跨页文件的拆分方法和装置
CN106951200A (zh) * 2017-03-26 2017-07-14 北京图文天地科技发展有限公司 一种用于数码印刷的梯状折标的方法
CN107015960A (zh) * 2017-04-12 2017-08-04 北京图文天地科技发展有限公司 一种用折手工艺进行数码印刷的方法
CN107015953A (zh) * 2017-04-12 2017-08-04 北京图文天地科技发展有限公司 一种对pdf文件拼折手版印刷排版方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1936823A (zh) * 2006-09-21 2007-03-28 北京北大方正电子有限公司 一种生成大版点阵数据的方法及大版点阵数据生成装置
CN101046729A (zh) * 2006-03-31 2007-10-03 佳能株式会社 信息处理设备和其控制方法
US20100088586A1 (en) * 2006-07-25 2010-04-08 ANDROMAQUE PREPRESSE ( Societe a Responsavilite Li Method and system of production and/or automatic conversion from heterogeneous content of at least one page make-up for achieving the fastest read with maximum retention

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101046729A (zh) * 2006-03-31 2007-10-03 佳能株式会社 信息处理设备和其控制方法
US20100088586A1 (en) * 2006-07-25 2010-04-08 ANDROMAQUE PREPRESSE ( Societe a Responsavilite Li Method and system of production and/or automatic conversion from heterogeneous content of at least one page make-up for achieving the fastest read with maximum retention
CN1936823A (zh) * 2006-09-21 2007-03-28 北京北大方正电子有限公司 一种生成大版点阵数据的方法及大版点阵数据生成装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942187A (zh) * 2013-01-18 2014-07-23 北大方正集团有限公司 一种拼版的方法及装置
CN104111915A (zh) * 2013-04-17 2014-10-22 北大方正集团有限公司 一种大版成书预览方法及装置
CN104281418A (zh) * 2013-07-08 2015-01-14 北大方正集团有限公司 电子监管码印刷方法及系统
CN104281418B (zh) * 2013-07-08 2017-07-21 北大方正集团有限公司 电子监管码印刷方法及系统
CN104572055A (zh) * 2013-10-23 2015-04-29 北大方正集团有限公司 拼版脚本生成装置和拼版脚本生成方法
CN104778153A (zh) * 2014-01-13 2015-07-15 北大方正集团有限公司 文件替换方法和装置
CN105335337A (zh) * 2014-06-17 2016-02-17 北大方正集团有限公司 跨页文件的拆分方法和装置
CN105335337B (zh) * 2014-06-17 2017-12-19 北大方正集团有限公司 跨页文件的拆分方法和装置
CN106951200A (zh) * 2017-03-26 2017-07-14 北京图文天地科技发展有限公司 一种用于数码印刷的梯状折标的方法
CN107015960A (zh) * 2017-04-12 2017-08-04 北京图文天地科技发展有限公司 一种用折手工艺进行数码印刷的方法
CN107015953A (zh) * 2017-04-12 2017-08-04 北京图文天地科技发展有限公司 一种对pdf文件拼折手版印刷排版方法

Also Published As

Publication number Publication date
CN102541827B (zh) 2015-01-21

Similar Documents

Publication Publication Date Title
CN102541827B (zh) 一种文档的可扩展标记语言的描述方法及系统
US7710590B2 (en) Automatic maintenance of page attribute information in a workflow system
US10282410B2 (en) Assistive technology for the impaired
CN100478868C (zh) 信息处理设备和其控制方法
CN100565601C (zh) 一种票据处理装置及方法
CN101650640B (zh) 信息处理装置及图像形成装置和后处理装置的控制方法
CN101542426A (zh) 信息处理设备及其控制方法和程序
WO2001059696A3 (en) Imaging documents having static content and variable data
US20100131566A1 (en) Information processing method, information processing apparatus, and storage medium
US8860990B2 (en) Information processing apparatus, PDL data conversion method, and storage medium
KR102296939B1 (ko) 다중 모드를 지원하는 pdf 등의 전자문서를 관리하는 장치 및 방법
TWM607380U (zh) 頁面式文件線上列印系統
JP2011150599A5 (zh)
JP5802706B2 (ja) データ作成装置、方法及びプログラム
JP2013067034A (ja) 画像形成装置、画像形成方法、及び、プログラム
KR102317666B1 (ko) 책의 제본을 위한 전자문서의 편집 방법 및 이를 수행하는 전자 장치
US10606928B2 (en) Assistive technology for the impaired
TWI765315B (zh) 頁面式文件線上列印系統與列印方法
US20040120012A1 (en) Method for outputting a digital product definition of a printed product to a layout application
CN100418051C (zh) 一种多联票据连续打印的方法及系统
JP6545246B2 (ja) 画像形成装置、画像形成装置の制御方法、およびプログラム
CN104111915A (zh) 一种大版成书预览方法及装置
JP2006164027A (ja) 文書処理及び印刷制御処理方法/装置/媒体
JP6468146B2 (ja) 電子情報編集装置、電子情報編集制御プログラム
CN101989185A (zh) 通过电子书阅读器打印电子书的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150121

CF01 Termination of patent right due to non-payment of annual fee