CN101853244A - 一种生成页码文件的方法及装置 - Google Patents

一种生成页码文件的方法及装置 Download PDF

Info

Publication number
CN101853244A
CN101853244A CN200910081068A CN200910081068A CN101853244A CN 101853244 A CN101853244 A CN 101853244A CN 200910081068 A CN200910081068 A CN 200910081068A CN 200910081068 A CN200910081068 A CN 200910081068A CN 101853244 A CN101853244 A CN 101853244A
Authority
CN
China
Prior art keywords
page number
pdf
pdf document
page
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910081068A
Other languages
English (en)
Inventor
张卫林
赵杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN200910081068A priority Critical patent/CN101853244A/zh
Publication of CN101853244A publication Critical patent/CN101853244A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种生成页码文件的方法,用于自动生成页码文件。所述方法包括:将非便携式文档格式PDF的源文件转换为PDF格式的PDF文件;按照预设的页码属性生成PDF格式的页码;根据需要设置页码的PDF文件和页码生成包含页码和PDF文件内容的新文件。本发明还公开了用于实现所述方法的装置。

Description

一种生成页码文件的方法及装置
技术领域
本发明涉及计算机及数码排版领域,特别是涉及生成页码文件的方法及装置。
背景技术
在普通印刷和可变数据印刷、黑白印刷和彩色印刷、单页印刷和按需出版等印刷服务共存的情况下,工作流程的复杂程度便成几何级数上升。如果无法保证印刷过程的顺畅进行,数码印刷的优势将大打折扣。不过各大数码印刷设备厂商在不遗余力地研发先进硬件设备的同时,并没有忽略配套的流程软件的开发。
在数码打印过程中,需要打印的源文件可能有多种格式,并且有些文件可能有页码,有些文件可能没有页码,不同格式的源文件的页码样式和页码位置等也都可能不同。而对于打印输出的文件,用户需要得到统一规格的页码。
现有技术通常采用第三方软件来解决上述问题,如Photoshop软件等。即,将源文件中的每一页制成一个图片,再将页码制成一个图案,然后将每页源文件的图片和页码的图案合成一个有页码的源文件图片,打印输出该图片。
可见,现有技术需要手工的对源文件的每页以图片处理形式为每页添加页码,操作比较繁琐,处理速度较慢。
发明内容
本发明实施例提供一种生成页码文件的方法及装置,用于自动生成页码文件。
一种生成页码文件的方法,包括以下步骤:
将非便携式文档格式PDF的源文件转换为PDF格式的PDF文件;
按照预设的页码属性生成PDF格式的页码;
根据需要设置页码的PDF文件和页码生成包含页码和PDF文件内容的新文件。
一种用于生成页码文件的装置,包括:
转换模块,用于将非PDF格式的源文件转换为PDF格式的PDF文件;
页码生成模块,用于按照预设的页码属性生成PDF格式的页码;
处理模块,用于根据需要设置页码的PDF文件和页码生成包含页码和PDF文件内容的新文件。
本发明实施例先将各种格式的源文件统一为PDF文件,并且生成PDF格式的页码,根据PDF文件和页码得到包括页码和PDF文件内容的新文件,实现了自动为不同格式的源文件设置页码。
附图说明
图1为本发明实施例中生成页码文件的主要方法流程图;
图2为本发明实施例中第一个生成页码文件的详细方法流程图;
图3为本发明实施例中页码属性的示意图;
图4为本发明实施例中关于PDF文件的生成规则的示意图;
图5为本发明实施例中关于页码的生成规则的示意图;
图6为本发明实施例中第二个生成页码文件的详细方法流程图;
图7为本发明实施例中装置的主要结构图;
图8为本发明实施例中装置的详细结构图;
图9为本发明实施例中转换模块的结构图;
图10为本发明实施例中光栅化模块的结构图。
具体实施方式
本发明实施例先将各种格式的文件转换为便携式文档格式(PortableDocument Format,PDF)格式的文件,可同时生成PDF格式的页码,然后根据PDF文件和页码生成包含页码和PDF文件内容的新文件,从而实现了自动生成页码文件。即,实现自动为各文件添加页码。
参见图1,本实施例中生成页码文件的主要方法流程如下:
步骤101:将非PDF格式的源文件转换为PDF格式的PDF文件。即,将不同格式的源文件统一为PDF格式的PDF文件。其中,非PDF格式的源文件可能有PS、tiff、JPG、Bmp、doc、txt等格式文件。
步骤102:按照预设的页码属性生成PDF格式的页码。页码属性包括:初始页码和步长;或者,页码属性包括初始页码和步长,以及包括字体、颜色、奇偶页对齐方式、页面对齐方式、空白页属性中的一项或多项。
步骤103:根据需要设置页码的PDF文件和页码生成包含页码和PDF文件内容的新文件。
在步骤103中生成的新文件可以是PDF格式的也可以是光栅化后的点阵数据。即,根据根据需要设置页码的PDF文件和页码生成PDF格式的新文件,当需要打印输出新文件时,可进一步对PDF格式的新文件进行光栅化;或者,对PDF文件和页码进行光栅化,得到新文件。
还可以根据生成规则对PDF文件和页码进行处理,生成包含页码和PDF文件内容的新文件。生成规则包括:PDF文件的裁剪区域、该裁剪区域相对于新文件的位置、页码的区域和页码的区域相对于新文件的位置。
在上述三个步骤中,每个步骤都可能有多种具体实现方式,下面通过几个实施例来详细描述生成页码文件的实现过程。
参见图2,本实施例中生成页码文件的详细方法流程如下:
步骤201:将每件非PDF格式的源文件都转换为一件PDF格式的PDF文件。
步骤202:检查每件PDF文件是否包括多页,如果有包括多页的PDF文件,则对该PDF文件执行步骤203,否则继续步骤204。其中,此步骤中的PDF文件包括步骤201中得到的PDF文件,还包括需要设置页码的已有的PDF文件。
步骤203:对PDF文件中的每一页生成一件PDF文件。相当于将PDF文件按页拆分为多件PDF文件。
步骤204:将得到的PDF文件按需要的页码顺序进行排列,可进一步生成顺序列表。
步骤205:根据用户设置的页码属性生成包含该页码属性的字符串。生成字符串的好处是便于参数传递。
步骤206:生成包含字符串的页面描述文件。通常用户在前台进行页码属性的设置等操作,进行文件格式转换和生成页码等操作通常由后台完成,为了方便前后台的信息传递,则用该页面描述文件携带传递的信息。页面描述文件的后缀名可以为epx。
步骤207:根据页面描述文件中的字符串生成PDF格式的页码。本实施例中将一个页码生成一个PDF格式的页码文件。
步骤208:根据用户设置的生成规则中PDF文件的裁剪区域对PDF文件进行裁剪。该生成规则也可存于页面描述文件中。
步骤209:对裁剪的PDF文件进行光栅化,得到PDF文件点阵数据。
步骤210:根据生成规则中页码的区域和字体、颜色等信息调整页码。
步骤211:对页码进行光栅化,得到页码点阵数据。
步骤212:根据生成规则中裁剪区域在新文件中的位置和页码的区域在新文件中的位置,将PDF文件点阵数据和页码点阵数据结合,生成点阵格式的包括页码和PDF文件内容的新文件。光栅化处理是以行为单位进行的,一行行的生成点阵数据,当运行到裁剪区域在新文件中的位置时,读取PDF文件点阵数据并继续进行光栅化,当运行到页码的区域在新文件中的位置时,读取页码点阵数据并继续进行光栅化,从而生成包括页码和PDF文件内容的新文件。
得到的新文件可保存到磁盘或输出到打印设备等。
在上述流程中,步骤201-204与步骤205-207是两部分相对独立的过程,可同时进行。步骤208-209与步骤210-211是两部分相对独立的过程,可同时进行。
步骤208-212有多种实现方式,如第一种:在步骤208中,可从PDF文件列表中顺序选择一个PDF文件并对其进行裁剪,然后继续步骤209。在步骤210中,一次只对一个页码进行调整,然后继续步骤211。在步骤212中,将裁剪的一件PDF文件和调整的一个页码进行光栅化。或者如第二种:在步骤208中,一次裁剪PDF文件列表中的所有PDF文件,然后在步骤209中,按顺序选择一个裁剪的PDF文件并对其进行光栅化。在步骤210中,一次对所有的页码进行调整,然后在步骤211中,按顺序选择一个页码并对其进行光栅化。在步骤212中,将裁剪的一件PDF文件和调整的一个页码进行光栅化。或者如第三种:在步骤208中,一次裁剪PDF文件列表中的所有PDF文件,然后对所有裁剪的PDF文件执行步骤209。在步骤210中,一次对所有的页码进行调整,然后对所有调整的页码执行步骤211。在步骤212中,按顺序选择PDF文件点阵数据和页码点阵数据,并对其进行光栅化。
其中,用户设置页码属性的界面可参见图3所示,对应的字符串的实例为{PageNo;odd=true;align=left;initNum=1;step=1;blankPage=2,3}。其中,字符串以{}为开始和结束标志,PageNo为起始字符串,odd、align、initNum、step、blankPage分别表示奇偶性对齐、对齐方式(左对齐用“left”表示,右对齐用“right”表示)、初始页码、页码步长、插入空白页(即第几页为空白页)。该字符串表示第一页的页码为1,后续每页的页码依次加1,即按照1、2、3......顺序生成页码,但第2、3页为空白页,即在第2、3页不设置页码,第4页的页码仍为4,所有页码均采用奇偶性对齐和左对齐。其中,奇偶性对齐是指正面的页码与背面的页码对齐。采用奇偶性对齐则用“true”表示,否则用“fault”表示。
若希望得到的页码形如“-1-”等,则生成的字符串为“-{PageNo;odd=true;align=left;initNum=1;step=1;blankPage=2}-”。并且,通过步骤203或204可统计出PDF文件的数量,该数量对应最大的页码,则可得到形如“总共5页,第1页”的页码。
生成规则可参见图4和图5所示,图4为PDF文件的裁剪区域和裁剪区域在新文件中的位置(用横纵坐标表示),图5为页码的区域和页码的区域在新文件中的位置等信息。
当PDF文件的裁剪区域和页码的区域在新文件中有重叠时,依据图5中“透明”一项的设置可以选择保留PDF文件或页码,如果设置为“覆盖”,则在光栅化过程中保留页码,如果设置为“透明”,则在光栅化过程中保留PDF文件。
参见图6,本实施例中生成页码文件的详细方法流程如下:
步骤601:将每件源文件的每一页均转换为一件PDF格式的PDF文件。
步骤602:将得到的PDF文件按需要的页码顺序进行排列,可进一步生成顺序列表。
步骤603:根据用户设置的页码属性生成包含该页码属性的字符串。
步骤604:生成包含字符串的页面描述文件。
步骤605:根据页面描述文件中的字符串生成PDF格式的页码。
步骤606:根据用户设置的生成规则中PDF文件的裁剪区域,从PDF文件列表中顺序选择一件PDF文件进行裁剪。
步骤607:根据生成规则中页码的区域和字体、颜色等信息顺序调整页码。
步骤608:根据生成规则中裁剪区域在新文件中的位置和页码的区域在新文件中的位置,对裁剪的PDF文件和页码分别进行光栅化后再结合,生成点阵格式的包括页码和PDF文件内容的新文件。在光栅化过程中,一行行的生成点阵数据,当运行到裁剪区域在新文件中的位置时,读取PDF文件并对其进行光栅化,当运行到页码的区域在新文件中的位置时,读取页码并对其进行光栅化,从而生成包括页码和PDF文件内容的新文件。
通过以上描述了解了生成页码文件的实现过程,下面介绍用于实现所述方法的装置。
参见图7,用于生成页码文件的装置包括转换模块701、页码生成模块702和处理模块703。
转换模块701用于将非PDF格式的源文件转换为PDF格式的PDF文件。
页码生成模块702用于按照预设的页码属性生成PDF格式的页码。
处理模块703用于根据需要设置页码的PDF文件和页码生成包含页码和PDF文件内容的新文件。
该装置还包括接口模块704,参见图8所示,接口模块704用于获得用户设置的页码属性和生成规则等。
其中,转换模块701包括:第一转换子模块7011或第二转换子模块7012,参见图9所示。
第一转换子模块7011用于当一件源文件包括多页时,将每页源文件转换为PDF格式的一件PDF文件。
第二转换子模块7012用于将不同格式的源文件转换为PDF格式的PDF文件,当获得PDF文件包括多页时,将PDF文件中的每一页都转换为一件PDF文件。
处理模块703包括:PDF子模块7031和/或光栅化子模块7032,参见图10所示。
PDF子模块7031用于根据需要设置页码的PDF文件和页码,生成PDF格式的包含页码和PDF文件内容的新文件。
光栅化子模块7032用于对PDF格式的文件进行光栅化。PDF格式的文件包括PDF文件、页码和PDF格式的新文件。则光栅化子模块7032至少有两种作用,第一种是,光栅化子模块7032用于对PDF格式的新文件进行光栅化。第二种是,光栅化子模块7032用于根据预设的生成规则,对需要设置页码的PDF文件和页码进行光栅化,生成包含页码和PDF文件内容的新文件。
在第二种情况中,光栅化子模块7032具体用于分别对页码和PDF文件进行光栅化并生成页码点阵数据和PDF文件点阵数据;依据生成规则对页码点阵数据和PDF文件点阵数据再次进行光栅化,生成包含页码和PDF文件内容的新文件。
用于实现本发明实施例的软件可以存储于软盘、硬盘、光盘和闪存等存储介质。
本发明实施例先将各种格式的源文件统一为PDF文件,并且生成PDF格式的页码,根据PDF文件和页码得到包括页码和PDF文件内容的新文件,实现了自动为不同格式的源文件设置页码。本发明实施例通过对PDF文件进行光栅化,得到新文件的点阵数据,便于对新文件进行打印输出。并且,本发明实施例通过字符串和页面描述文件来传输页码属性和生成规则等信息,便于信息流的传递。以及,本发明实施例对格式转换、PDF文件的裁剪、页码的调整和光栅化过程提供了多种具体实现方式,可依据实际需要灵活选择具体实现方式。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若对本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (17)

1.一种生成页码文件的方法,其特征在于,包括以下步骤:
将非便携式文档格式PDF的源文件转换为PDF格式的PDF文件;
按照预设的页码属性生成PDF格式的页码;
根据页码和需要设置页码的PDF文件,生成包含页码和PDF文件内容的新文件。
2.如权利要求1所述的方法,其特征在于,将非PDF格式的源文件转换为PDF格式的PDF文件的步骤包括:当一个源文件包括多页时,将每页源文件均转换为一件PDF格式的PDF文件;或者
在将不同格式的源文件转换为PDF格式的PDF文件之后,当获得的PDF文件包括多页时,将PDF文件中的每一页都转换为一件PDF文件。
3.如权利要求1所述的方法,其特征在于,按照预设的页码属性生成PDF格式的页码的步骤包括:
用字符串描述页码属性;
通过读取字符串来生成PDF格式的页码。
4.如权利要求1所述的方法,其特征在于,所述新文件为PDF格式。
5.如权利要求4所述的方法,其特征在于,还包括步骤:对PDF格式的新文件进行光栅化。
6.如权利要求1所述的方法,其特征在于,根据需要设置页码的PDF文件和页码生成包含页码和PDF文件内容的新文件包括步骤:根据预设的生成规则,对需要设置页码的PDF文件和页码进行光栅化,生成点阵格式的包含页码和PDF文件内容的新文件。
7.如权利要求6所述的方法,其特征在于,根据预设的生成规则,对需要设置页码的PDF文件和页码进行光栅化,生成包含页码和PDF文件内容的新文件的过程包括步骤:
分别对页码和PDF文件进行光栅化并生成页码点阵数据和PDF文件点阵数据;依据生成规则将页码点阵数据和PDF文件点阵数据结合,生成点阵格式的包含页码和PDF文件内容的新文件;或者
依据生成规则,分别对页码和PDF文件进行光栅化的同时,生成点阵格式的包含页码和PDF文件内容的新文件。
8.如权利要求6所述的方法,其特征在于,生成规则包括:PDF文件的裁剪区域、该裁剪区域相对于新文件的位置、页码的区域和页码的区域相对于新文件的位置。
9.如权利要求8所述的方法,其特征在于,当PDF文件的裁剪区域和页码的区域在新文件中有重叠时,在重叠部分保留页码的区域。
10.如权利要求6所述的方法,其特征在于,还包括步骤:依据用户的设置生成页面描述文件,从该页面描述文件中获得页码属性和生成规则。
11.如权利要求1所述的方法,其特征在于,页码属性包括:初始页码和步长;或者,页码属性包括初始页码和步长,以及包括字体、颜色、奇偶页对齐方式、页面对齐方式、空白页属性中的一项或多项。
12.一种用于生成页码文件的装置,其特征在于,包括:
转换模块,用于将非PDF格式的源文件转换为PDF格式的PDF文件;
页码生成模块,用于按照预设的页码属性生成PDF格式的页码;
处理模块,用于根据页码和需要设置页码的PDF文件,生成包含页码和PDF文件内容的新文件。
13.如权利要求12所述的装置,其特征在于,转换模块包括:
第一转换子模块,用于当一个源文件包括多页时,将每页源文件转换为PDF格式的一件PDF文件;或者
第二转换子模块,用于将不同格式的源文件转换为PDF格式的PDF文件,当获得PDF文件包括多页时,将PDF文件中的每一页都转换为一件PDF文件。
14.如权利要求12所述的装置,其特征在于,处理模块包括:
PDF子模块,用于根据需要设置页码的PDF文件和页码,生成PDF格式的包含页码和PDF文件内容的新文件。
15.如权利要求14所述的装置,其特征在于,处理模块还包括:
光栅化子模块,用于对PDF格式的新文件进行光栅化。
16.如权利要求12所述的装置,其特征在于,处理模块包括:
光栅化子模块,用于根据预设的生成规则,对需要设置页码的PDF文件和页码进行光栅化,生成点阵格式的包含页码和PDF文件内容的新文件。
17.如权利要求16所述的装置,其特征在于,光栅化子模块用于分别对页码和PDF文件进行光栅化并生成页码点阵数据和PDF文件点阵数据;并依据生成规则对将页码点阵数据和PDF文件点阵数据结合,生成点阵格式的包含页码和PDF文件内容的新文件。
CN200910081068A 2009-04-01 2009-04-01 一种生成页码文件的方法及装置 Pending CN101853244A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910081068A CN101853244A (zh) 2009-04-01 2009-04-01 一种生成页码文件的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910081068A CN101853244A (zh) 2009-04-01 2009-04-01 一种生成页码文件的方法及装置

Publications (1)

Publication Number Publication Date
CN101853244A true CN101853244A (zh) 2010-10-06

Family

ID=42804742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910081068A Pending CN101853244A (zh) 2009-04-01 2009-04-01 一种生成页码文件的方法及装置

Country Status (1)

Country Link
CN (1) CN101853244A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103144431A (zh) * 2011-12-06 2013-06-12 北大方正集团有限公司 用于数字化印刷的点阵文件处理方法和装置
CN103379246A (zh) * 2012-04-26 2013-10-30 佳能株式会社 图像处理设备及其控制方法
CN105335337A (zh) * 2014-06-17 2016-02-17 北大方正集团有限公司 跨页文件的拆分方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103144431A (zh) * 2011-12-06 2013-06-12 北大方正集团有限公司 用于数字化印刷的点阵文件处理方法和装置
CN103144431B (zh) * 2011-12-06 2015-02-25 北大方正集团有限公司 用于数字化印刷的点阵文件处理方法和装置
CN103379246A (zh) * 2012-04-26 2013-10-30 佳能株式会社 图像处理设备及其控制方法
CN103379246B (zh) * 2012-04-26 2016-01-20 佳能株式会社 图像处理设备及其控制方法
CN105335337A (zh) * 2014-06-17 2016-02-17 北大方正集团有限公司 跨页文件的拆分方法和装置
CN105335337B (zh) * 2014-06-17 2017-12-19 北大方正集团有限公司 跨页文件的拆分方法和装置

Similar Documents

Publication Publication Date Title
US10755041B2 (en) Conversion tool for XPS and OpenXPS documents
US7710590B2 (en) Automatic maintenance of page attribute information in a workflow system
EP1530359A2 (en) Document processing method and apparatus
US20080225336A1 (en) Method and System to Allow Printing Compression of Documents
EP1422632A2 (en) Method and apparatus to process portable document format data containing transparency
CN102541827B (zh) 一种文档的可扩展标记语言的描述方法及系统
CN1932802A (zh) 具有文本提取功能的主机设备及其提取方法
US20140111829A1 (en) Printing system, printing method and computer-readable recording medium
US20120299881A1 (en) System for tracking and processing handwritten pen strokes on mobile terminal
EP2416238A2 (en) Green printing: re-purposing a document to save ink and paper
CN103678268A (zh) 公文自动排版方法和装置
US8656278B2 (en) Data converting apparatus and data converting program
US8582166B2 (en) Image-data generation method, image-data generation apparatus and storage medium of storing image-data generation program
CN105278890A (zh) 信息处理装置及控制方法
Zhang et al. Research on document digitization processing technology
CN101853244A (zh) 一种生成页码文件的方法及装置
CN100452024C (zh) 一种混合编辑文件并自动添加页码信息的处理方法
US20030222916A1 (en) Object-oriented processing of tab text
CN102591849B (zh) 文档格式转换的方法及装置
US20120320417A1 (en) Information processing apparatus, pdl data conversion method, and storage medium
US20130007599A1 (en) Optimizing the layout of electronic documents
CN103699314A (zh) 实现手写签字的方法及终端
US20090046322A1 (en) Information processing apparatus, image forming apparatus, print-data generation method, map-information generation method, and computer program product
CN103186513B (zh) 一种文档格式转换的方法及装置
US20070233716A1 (en) Image data flow producing system, method and program

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20101006