CN103377183A - 重复排版的方法和装置 - Google Patents

重复排版的方法和装置 Download PDF

Info

Publication number
CN103377183A
CN103377183A CN2012101322056A CN201210132205A CN103377183A CN 103377183 A CN103377183 A CN 103377183A CN 2012101322056 A CN2012101322056 A CN 2012101322056A CN 201210132205 A CN201210132205 A CN 201210132205A CN 103377183 A CN103377183 A CN 103377183A
Authority
CN
China
Prior art keywords
contribution
document
module
label
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101322056A
Other languages
English (en)
Other versions
CN103377183B (zh
Inventor
李彦娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201210132205.6A priority Critical patent/CN103377183B/zh
Publication of CN103377183A publication Critical patent/CN103377183A/zh
Application granted granted Critical
Publication of CN103377183B publication Critical patent/CN103377183B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明提供了一种重复排版的方法和装置,方法包括:将文档拆分成多个稿件;将存在修订标记的稿件的内容重新排版;在排版所述文档的所有稿件的版面上,将所述重新排版后的稿件替换所述版面上的原稿件。在本发明提供了一种重复排版的装置。本发明实现了对含有修改后的稿件的文档重新排版,排版过程替换模板中的原稿件,由于仅需要对修订过的稿件排版,节省了时间,相对于现有技术中全部重新排版文档的方式,提高了排版效率;相对于在版面上的相应调整修改的内容方式,简化了排版操作。

Description

重复排版的方法和装置
技术领域
本发明涉及印刷排版领域,具体而言,涉及一种重复排版的方法和装置。
背景技术
印前排版过程中,通常对文本编辑软件编辑的文档进行排版,例如:微软公司的
Figure BSA00000710758500011
软件。存在排版结束后,用户可能对文档中部分的内容进行了修改,修改后的文档需要重新排版。
重新排版目前主要对整个文档重新排版;或按照文档中修改的内容,在版面上进行相应调整。这两种方式都存在时间长,效率低的问题。
发明内容
本发明旨在提供一种重复排版的方法和装置,以解决的排版时间长,效率低问题。
在本发明的实施例中,提供了一种重复排版的方法,包括:将文档拆分成多个稿件;将存在修订标记的稿件的内容重新排版;在排版所述文档的所有稿件的版面上,将所述重新排版后的稿件替换所述版面上排版的原稿件。
在本发明的实施例中,提供了一种重复排版的装置,包括:拆分模块,用于将文档拆分成多个稿件;排版模块,用于将存在修订标记的稿件的内容重新排版;替换模块,用于在排版所述文档的所有稿件的版面上,将所述重新排版后的稿件替换所述版面上排版的原稿件。
本发明实现了对含有修改的文档重新排版,排版过程中将文档拆分成多个稿件,由于仅需要对修订过的稿件排版,节省了时间,相对于现有技术中全部重新排版文档,提高了排版效率;相对于在版面上的相应调整修改的内容,简化了排版操作。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了实施例的流程图;
图2示出了实施例中排版word文档的流程图;
图3示出了实施例中模板的示意图;
图4示出了实施例中schema的结构示意图;
图5示出了实施例中修订过的文档的屏幕截图;
图6示出了实施例中document.xml文档的屏幕截图;
图7示出了实施例中的styles.xml文档的屏幕截图;
图8示出了实施例中拆分后的第一个子document.xml文档的屏幕截图;
图9示出了实施例中拆分后的第二个子document.xml文档的屏幕截图;
图10示出了实施例中重新排版后的文档的示意图。
图11示出了实施例中的装置结构框图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。参见图1所示的流程图,包括:
S11:将文档拆分成多个稿件;
S12:将存在修订标记的稿件的内容重新排版;
S13:在排版所述文档的所有稿件的版面上,将所述重新排版后的稿件替换所述版面上排版的原稿件。
通过上述步骤,实现了对含有修改的文档重新排版,排版过程中将文档拆分成多个稿件,由于仅需要对修订过的稿件排版,节省了时间,相对于现有技术中全部重新排版文档,提高了排版效率;相对于在版面上的相应调整修改的内容,简化了排版操作。
优选地,参见图2所示的实施例中对word文档重复排版的流程图,包括:
S21:收集模板中的标签,计算标签的集合在schema中的共同的祖先节点;
排版后的版式文档通常采用模板实现文档的内容排版。参见图3所示的模板,包括标签:一级标题、一级引言、二级标题、三级标题、正文等。每个标签对应一种样式。
在由节点组成、且形成树形结构的schema中,包含记录这些标签的节点。通过从模板遍历并收集的这些标签,在schema中,确定所述标签在schema中所对应节点的祖先节点。
参见图4所示的schema结构的示意图,这些标签的共同祖先节点为一级内容。
S22:通过祖先节点确定拆分节点,进而得到拆分样式;
在实施例中,通过所述祖先节点确定作为其子节点的第一个内容节点;在所述模板中确定所述内容节点对应的标签、及该标签对应的样式。
第一个内容节点为拆分节点。对于图4所示的schema中,第一个内容节点为一级标题。
通过该拆分节点,即第一个内容节点可进一步确定该节点对应的样式,也称为拆分样式。一级标题节点对应的word样式为章标题,因此拆分样式为章标题。
S23:根据拆分样式将word文档拆分成若干个子word文档;
Word文档的内容如图5所示,将word文档拆分成多个稿件。拆分的过程包括:
通过S21、S22的步骤确定的样式,将word文档中应用所述样式的内容拆分成稿件。
将word文档解压缩,获得其中的document.xml文档,其内容如图5所示,里面加框处为删除的内容。根据确定出的拆分样式遍历该文档,找到n个应用了拆分样式的<w:p>,以这n个<w:p>作为拆分位置,将document.xml文档拆分为n个子document.xml文档,然后配合数据包压缩为n个子word文档。
参见图6所示的屏幕截图,实施例中,在document.xml中遍历S22确定的样式。参见图7,在styles.xml文档中,该样式对应章标题样式,在实施例中,章标题包括:第一章“导数及应用”和第二章“推理和证明”。本例中有两个<w:p>应用了章标题样式,如图6中椭圆线圈住的位置,根据章标题样式将document.xml拆分为2个子document.xml。图8为一个拆分后的子文档的屏幕截图;图9为拆分后的另一个子文档的屏幕截图。每个子文档在实施例中也称为稿件。在实施例中,稿件为章,也可根据不同的模板的结构,以篇、或节作为稿件的单位。
S24:根据子文档信息获得增量排版信息数组;
遍历每个子文档是否具有修订标记。在本实施例中,采用的word文档,修订标记为修订标签。
建立一个结构数组,在遍历每个子文档内是否存在修订标签的过程中,将子文档的信息写入到数组中,如子文档的ID、子文档本次是否需要排版的标识,子文档本次排版结果的文件名称等。
检查各个子文档对应的document.xml,如果其中存在<w:del>、<w:ins>等修订标签,则将该子文档对应的结构数组中的需要排版标识设置为true,否则设置为false。所有子文档的结构数据按顺序形成一个信息数组。其记录了含有修订内容的子文档的ID,也称为增量数组。
S25:遍历信息数组;
S26:判断子文档是否需要排版;
通过建立的数组的标识,如果为true,则子文档需要排版,执行S27;如果否,则执行S25。
S27:将子文档配合模板进行排版;
使用定制的模板对子文档进行排版,模板可以是图书、期刊等模板。
S28:删除上一次排版结果中该子文档对应的页面;
在排版软件的版面中,将子文档导入模板,使子文档在版面中呈现相应的排版效果。
排版软内上一次排版所有子文档的排版结果中,遍历记录的数组内每个子文档的ID;在上一次的排版结果中遍历相同ID的子文档的排版页面,将这些页面删除。
S29:将子文档的本次排版结果插入到删除位置;
将本次的排版的子文档的页面插入到删除位置。将数组中所有子文档循环处理后,形成了本次的排版结果。
S30:判断是否为最后一个子文档。
如果是,则结束;如果不是,则执行S25,直到遍历完所有含有修订标记的子文档。最后,通过排版软件,将版面上的子文档重新生成版式文档。
参加图10所示的排版后的屏幕截图,排版后的第一章“导数及应用”中不包含图5中所示的删除的内容。
通过上述步骤,替换完所有重新排版的子文档。提高了排版效率,简化了排版操作。
参见图11,本发明的实施例还提供一种重复排版的装置,包括:
拆分模块31,用于将文档拆分成多个稿件;
排版模块32,用于将拆分模块31拆分的存在修订标记的稿件的内容重新排版;
替换模块33,用于在排版所述文档的所有稿件的版面上,将所述排版模块32重新排版后的稿件替换所述版面上排版的原稿件。
通过上述模块,实现了对含有修改的文档重新排版,排版过程中将文档拆分成多个稿件,由于仅需要对修订过的稿件排版,节省了时间,相对于现有技术中全部重新排版文档,提高了排版效率;相对于在版面上的相应调整修改的内容,简化了排版操作。
优选地,所述拆分模块31包括:
遍历模块311,用于在配合所述稿件排版的模板内,遍历所有标签;
查找模块312,用于确定所述遍历模块311遍历的标签在schema中所对应节点的祖先节点;如何通过祖先节点找到拆分节点
样式确定模块313,用于通过所述祖先节点确定作为其子节点的第一个内容节点;在所述模板中确定所述查找模块312的内容节点对应的标签、及该标签对应的样式;
样式拆分模块314,用于将所述文档中应用所述样式确定模块313确定样式的内容拆分成所述稿件。
优选地,所述修订标记为修订标签;
所述排版模块32,还用于采用所述模板,对存在所述修订标签的稿件的内容重新排版。
优选地,所述替换模块33包括:
标识模块331,用于记录存在所述修订标签的稿件的ID;
遍历模块332,用于在含有所述文档的各个稿件的所述版面中,按照所述标识模块331记录的ID查找所述原稿件;
页面替换模块333,用于使用所述重新排版后的稿件的页面替换所述遍历模块332查找的原稿件的页面。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种重复排版的方法,其特征在于,包括:
将文档拆分成多个稿件;
将存在修订标记的稿件的内容重新排版;
在排版所述文档的所有稿件的版面上,将所述重新排版后的稿件替换所述版面上排版的原稿件。
2.根据权利要求1所述的方法,其特征在于,所述拆分过程包括:
在配合所述稿件排版的模板内,遍历所有标签;
确定所述标签在schema文件中所对应节点的祖先节点;
通过所述祖先节点确定作为其子节点的第一个内容节点;
在所述模板中确定所述内容节点对应的标签、及该标签对应的样式;
将所述文档中应用所述样式的内容拆分成所述稿件。
3.根据权利要求2所述的方法,其特征在于,
所述修订标记为修订标签;
采用所述模板,对存在所述修订标签的稿件的内容重新排版。
4.根据权利要求3所述的方法,其特征在于,所述替换模板版面上的原稿件过程包括:
记录存在所述修订标签的稿件的ID;
在含有所述文档的各个稿件的所述版面中,按照所述ID查找所述原稿件;
使用所述重新排版后的稿件的页面替换所述原稿件的页面。
5.根据权利要求4所述的方法,其特征在于,在所述版面中将所述替换操作后的所有稿件生成版式文档。
6.根据权利要求1~5任一项所述的方法,其特征在于,所述稿件为篇、章或节。
7.一种重复排版的装置,其特征在于,包括:
拆分模块,用于将文档拆分成多个稿件;
排版模块,用于将存在修订标记的稿件的内容重新排版;
替换模块,用于在排版所述文档的所有稿件的版面上,将所述重新排版后的稿件替换所述版面上排版的原稿件。
8.根据权利要求7所述的装置,其特征在于,所述拆分模块包括:
遍历模块,用于在配合所述稿件排版的模板内,遍历所有标签;
查找模块,用于确定所述标签在schema中所对应节点的祖先节点;
样式确定模块,用于通过所述祖先节点确定作为其子节点的第一个内容节点;在所述模板中确定所述内容节点对应的标签、及该标签对应的样式;
样式拆分模块,用于将所述文档中应用所述样式的内容拆分成所述稿件。
9.根据权利要求8所述的装置,其特征在于,所述修订标记为修订标签;
所述排版模块,还用于采用所述模板,对存在所述修订标签的稿件的内容重新排版。
10.根据权利要求9所述的装置,其特征在于,所述替换模块包括:
标识模块,用于记录存在所述修订标签的稿件的ID;
遍历模块,用于在含有所述文档的各个稿件的所述版面中,按照所述ID查找所述原稿件;
页面替换模块,用于使用所述重新排版后的稿件的页面替换所述原稿件的页面。
CN201210132205.6A 2012-04-27 2012-04-27 重复排版的方法和装置 Expired - Fee Related CN103377183B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210132205.6A CN103377183B (zh) 2012-04-27 2012-04-27 重复排版的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210132205.6A CN103377183B (zh) 2012-04-27 2012-04-27 重复排版的方法和装置

Publications (2)

Publication Number Publication Date
CN103377183A true CN103377183A (zh) 2013-10-30
CN103377183B CN103377183B (zh) 2016-04-20

Family

ID=49462316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210132205.6A Expired - Fee Related CN103377183B (zh) 2012-04-27 2012-04-27 重复排版的方法和装置

Country Status (1)

Country Link
CN (1) CN103377183B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657342A (zh) * 2013-11-19 2015-05-27 北大方正集团有限公司 一种清样生成方法和装置
CN105095173A (zh) * 2014-05-07 2015-11-25 北大方正集团有限公司 基于排版结果的排版装置和排版方法
CN105468577A (zh) * 2014-09-23 2016-04-06 北大方正集团有限公司 一种文档拆分方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050091581A1 (en) * 2003-10-28 2005-04-28 Vladislav Bezrukov Maintenance of XML documents
EP1843257A1 (en) * 2006-04-03 2007-10-10 BRITISH TELECOMMUNICATIONS public limited company Methods and systems of indexing and retrieving documents
CN101350009A (zh) * 2008-09-05 2009-01-21 中国工商银行股份有限公司 一种协同文档编写系统
CN101430714A (zh) * 2008-12-08 2009-05-13 北大方正集团有限公司 一种基于样式的内容结构化加工方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050091581A1 (en) * 2003-10-28 2005-04-28 Vladislav Bezrukov Maintenance of XML documents
EP1843257A1 (en) * 2006-04-03 2007-10-10 BRITISH TELECOMMUNICATIONS public limited company Methods and systems of indexing and retrieving documents
CN101350009A (zh) * 2008-09-05 2009-01-21 中国工商银行股份有限公司 一种协同文档编写系统
CN101430714A (zh) * 2008-12-08 2009-05-13 北大方正集团有限公司 一种基于样式的内容结构化加工方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王玥等: "基于XML的InDesign期刊排版文件标记与转换处理实践", 《中国科技期刊研究》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657342A (zh) * 2013-11-19 2015-05-27 北大方正集团有限公司 一种清样生成方法和装置
CN105095173A (zh) * 2014-05-07 2015-11-25 北大方正集团有限公司 基于排版结果的排版装置和排版方法
CN105095173B (zh) * 2014-05-07 2018-03-06 北大方正集团有限公司 基于排版结果的排版装置和排版方法
CN105468577A (zh) * 2014-09-23 2016-04-06 北大方正集团有限公司 一种文档拆分方法及系统
CN105468577B (zh) * 2014-09-23 2018-11-09 北大方正集团有限公司 一种文档拆分方法及系统

Also Published As

Publication number Publication date
CN103377183B (zh) 2016-04-20

Similar Documents

Publication Publication Date Title
CN101025738B (zh) 一种免模板动态网站生成方法
CN101551800B (zh) 标注信息生成装置、查询装置及共享系统
CN101246494B (zh) 一种互联网网页转换方法、系统及设备
US8977606B2 (en) Method and apparatus for generating extended page snippet of search result
JP5930496B2 (ja) レイアウトファイルにおける構造化情報の取得方法及び装置
CN102314497B (zh) 一种用于识别标记语言文件主体内容的方法和设备
CN101145157B (zh) 一种xml格式嵌入式设备特征信息解析方法
JP2002318798A (ja) 構造化文書翻訳におけるユーザ制御可能なデータをグループ化する方法およびシステム
CN101950312B (zh) 一种互联网网页内容解析方法
CN102065114A (zh) 一种移动终端访问网页的方法及装置
CN103123631A (zh) 文案的生成、网页文案的展示方法、装置及网站服务器
US20120304051A1 (en) Automation Tool for XML Based Pagination Process
CN103699591A (zh) 一种基于示例页面的网页正文提取方法
CN102841886B (zh) 拆分文档的方法和装置
CN102982010A (zh) 提取文档结构的方法和装置
CN102129428A (zh) 一种实现从网页中订阅信息的方法及装置
CN104462147A (zh) 一种文档的存储方法
CN102651002A (zh) 一种网页信息抽取方法及其系统
CN103166981A (zh) 一种无线网页转码方法及装置
CN103268340A (zh) 基于层次式索引的版式可回流文件建立和绘制方法
CN103377183A (zh) 重复排版的方法和装置
CN101430685B (zh) 下载方法及其系统
CN101206668B (zh) 一种网站内容组件生成方法、解析方法及装置
BRPI0316335B1 (pt) processo para a geração de uma corrente de bits a partir de uma árvore de indexação
CN102236713A (zh) 一种数字电视交互服务页面的信息提取方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220617

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Beijing, Haidian District Cheng Fu Road 298, founder building, 5 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160420