CN104657342A - 一种清样生成方法和装置 - Google Patents

一种清样生成方法和装置 Download PDF

Info

Publication number
CN104657342A
CN104657342A CN201310585470.4A CN201310585470A CN104657342A CN 104657342 A CN104657342 A CN 104657342A CN 201310585470 A CN201310585470 A CN 201310585470A CN 104657342 A CN104657342 A CN 104657342A
Authority
CN
China
Prior art keywords
periodical
module
structured data
type
data document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310585470.4A
Other languages
English (en)
Inventor
周炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Founder Information Industry Holdings Co Ltd
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Founder Information Industry Holdings Co Ltd
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Founder Information Industry Holdings Co Ltd, Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Founder Information Industry Holdings Co Ltd
Priority to CN201310585470.4A priority Critical patent/CN104657342A/zh
Publication of CN104657342A publication Critical patent/CN104657342A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明提供了一种清样生成的方法和装置,属于计算机数据处理领域。该方法包括:将原稿转换为结构化数据文档;根据预先制作的发布模板,对所述结构化数据文档进行自动排版,得到版式文件;所述发布模板规定了出版物成品的版式;根据所述版式文件形成清样。利用本发明,可以通过自动排版的方式快速产生排版结果、输出清样,大大缩短了期刊稿件的处理时间,提高处理效率。

Description

一种清样生成方法和装置
技术领域
本发明涉及出版领域,具体而言,涉及一种清样生成方法和装置。
背景技术
清样是带版式的排版文件。目前,生成清样的过程是由排版人员参照修改结果使用排版软件进行排版,以生成清样。
目前,期刊的作者提供的稿件大部分都是Word格式的。在期刊的稿件审核过程中,编辑和外审专家大都是基于Word做出内容上的修改。为了能够让作者和外审专家看到带版式的清样稿件,需要再将Word稿件交给排版人员参照修改结果使用排版软件进行排版。初排完成之后,从排版软件中打印出清样纸稿后,编辑再把纸稿递送给作者和外审专家。如果作者或外审专家有新的修改意见,则需要再一次排版、打印纸稿的过程。整个过程可能需要多次的人工排版的环节,大量时间花费在编辑与排版人员的沟通和手工排版的工作上,费时费力。这种手工排版的工作费时费力。
发明内容
本发明提供了一种清样生成的方法和装置,以克服现有依赖人工排版的局限,高效地生成清样,特别适用于科技期刊等出版物的编审过程。
本发明实施例提供一种清样生成的方法,包括:
将原稿转换为结构化数据文档;
根据预先制作的发布模板,对所述结构化数据文档进行自动排版,得到版式文件;所述发布模板规定了出版物成品的版式;
根据所述版式文件形成清样。
优选地,所述方法还包括:
统计各种期刊结构,并对其进行抽象得到期刊结构的普遍特征;
根据所述期刊结构的普遍特征构建期刊的结构模块;
所述将原稿转换为结构化数据文档包括:
根据所述结构模块将原稿转换为结构化数据文档。
优选地,所述根据所述期刊结构的普遍特征构建期刊的结构模块包括:
确定期刊各元素类型;
创建各元素,包括设置每个元素的名称属性、类型属性;
将创建的各元素依据期刊结构建成树形结构,使用Schema标准格式文档描述对应的结构并保存。
优选地,所述方法还包括:
利用Schema或者文档类型定义DTD对所述结构化数据文档进行规范性验证。
优选地,所述方法还包括:
在制作所述发布模板时,根据所述结构模块中的元素类型,确定所述发布模板中的元素类型。
本发明实施例还提供一种清样生成的装置,包括:
结构化处理模块,用于将原稿转换为结构化数据文档;
排版模块,用于根据预先制作的发布模板,对所述结构化数据文档进行自动排版,得到版式文件;所述发布模板规定了出版物成品的版式;
清样生成模块,用于根据所述版式文件形成清样。
优选地,所述装置还包括:
统计模块,用于统计各种期刊结构,并对其进行抽象得到期刊结构的普遍特征;
构建模块,用于根据所述期刊结构的普遍特征构建期刊的结构模块;
所述结构化处理模块,具体用于根据所述结构模块将原稿转换为结构化数据文档。
优选地,所述构建模块包括:
元素类型确定单元,用于确定期刊各元素类型;
元素创建单元,用于创建各元素,包括设置每个元素的名称属性、类型属性;
生成单元,用于将所述元素创建单元创建的各元素依据期刊结构建成树形结构,使用Schema标准格式文档描述对应的结构并保存。
优选地,所述装置还包括:
验证模块,用于利用Schema或者文档类型定义DTD对所述结构化数据文档进行规范性验证。
优选地,所述装置还包括:
发布模板制作模块,用于制作发布模板,并在创建所述发布模板时,根据所述结构模块中的元素类型,确定所述发布模板中的元素类型。
本发明的效果在于:从结构化的文档数据入手,排版引擎自动套用发布模板,自动生成清样文件的过程中不需要人工参与。本发明可以广泛适用于需要清样文档的需求场景,特别适用于科技期刊等出版物的编审过程。
附图说明
图1是本发明实施例清样生成的方法的流程图;
图2是本发明实施例中结构化的期刊文档结构的示意图;
图3是本发明实施例中制作发布模板的流程图;
图4是本发明实施例清样生成的装置的结构示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
如图1所示,是本发明实施例清样生成的方法的流程图,包括以下步骤:
步骤101,将原稿转换为结构化数据文档。
具体地,可以按照特定的结构化规则,对期刊稿件进行结构化操作,从而将原稿转换为结构化数据文档。
上述结构化规则可以是在统计分析各种期刊稿件结构的基础上建立的。
首先,对各种期刊结构进行抽象概括,总结出期刊结构的普遍特征。
然后,根据期刊结构的普遍特征制定出期刊的结构模块XMLSchema。
这样,就可以根据所述结构模块将原稿转换为结构化数据文档。具体地,可以根据Schema文件生成XML实例文件,并将其与所定义结构关联(通过第三方工具通用方法或工具根据Schema文件生成一个XML实例文件,如Altova XML Spy)。
所述期刊结构模块XML Schema通过如下规则创建:确定各种所述期刊各元素类型,如中文标题、中文作者、中文摘要、中文参考文献等;创建各元素,包括设置每个元素的名称属性、类型属性等;将创建的各元素依据所分析期刊结构建成树形结构,使用Schema标准格式文档来描述对应的结构并保存。
典型的期刊稿件如图2所示,包括以下结构:
根据所述结构Schema文件结合第三方架构化加工工具(如方正智能客户端)对期刊稿件进行结构化加工。
需要说明的是,结构化数据底层采用XML文件的方式进行描述。为此,在本发明实施例中,还可以进一步利用Schema或者DTD(Document Type Definition,文档类型定义)对所述结构化数据进行规范性验证。
DTD是一套关于标记的语法规则,它定义了文档的逻辑结构,规定了文档中所使用的元素、实体、元素的属性、元素与实体之间的关系。DTD告诉你可以在哪些文档中使用哪些标记,各标记出现的次序,哪些标记出现在哪些标记中,哪些标记有属性等等。
当需要对结构化数据进行验证时,可通过第三方工具通用方法或工具(如Altova XML Spy)打开结构化数据文档,加载Schema或DTD后,使用校验模式进行规范性验证。
步骤102,根据预先制作的发布模板,对所述结构化数据文档进行自动排版,得到版式文件;所述发布模板规定了出版物成品的版式。
自动排版引擎可以通过接口获取到需要处理的结构化数据文档,将所述结构化数据文档与发布模板相结合,按照发布模板设置的样式对内容进行排版,排版结果以排版软件定义的文件格式的形式保存。
在本发明实施例中,所述结构化数据文档是按照预先构建的Schema进行数据描述的,重点对期刊稿件的结构进行了描述。期刊稿件中每一个使用到的元素,都使用Schema中的合法元素来命名。而发布模版中的元素定义,也是来自于与结构化数据同源的同一个Schema。这就保证了结构化数据与发布模版在元素上的匹配。
发布模版除了描述了元素的定义之外,对元素的表现形态也做了描述。通过以下方法进行约束:
需要说明的是,制作发布模板时,需要根据所述结构模块中的元素类型,确定所述发布模板中的元素类型(如中文标题、中文作者、中文摘要、中文参考文献等),制作相应的样式类型。样式类型包括针对文字,图片,表格,数学公式等版式特征的附加信息(如文字字体、表格的样式等)。
发布模板制作工具要能够支持期刊结构化标签的导入,并将期刊的结构化标签与排版需要的样式相关联,再配套添加排版所需要的版式信息(如页面大小、文字方向、分栏信息、主页设置等),最终生成发布模板。
步骤103,根据所述版式文件形成清样。
如图3所示,是本发明实施例中制作发布模板的流程图,包括以下步骤:
步骤301,新建文档;
步骤302,在所述文档中加载发布模板中需要的标签;
步骤303,将标签与样式对应;
步骤304,进行版式设置,以生成发布模板;
步骤305,保存发布模板。
本发明实施例清样生成的方法,通过自动排版的方式支持期刊稿件的清样文件的快速生成,在编辑修改完稿件之后,即可通过自动排版的方式快速产生排版结果、输出清样,大大缩短了期刊稿件的处理时间。
相应地,本发明实施例还提供一种清样生成的装置,如图4所示,是该装置的一种结构示意图。
在该实施例中,所述装置包括:
结构化处理模块401,用于将原稿转换为结构化数据文档;
排版模块402,用于根据预先制作的发布模板,对所述结构化数据文档进行自动排版,得到版式文件;所述发布模板规定了出版物成品的版式;
清样生成模块403,用于根据所述版式文件形成清样。
所述结构化处理模块401具体可以根据预先构建的期刊的结构模块将原稿转换为结构化数据文档。
为此,在本发明装置的另一实施例中,所述装置还可进一步包括:
统计模块,用于统计各种期刊结构,并对其进行抽象得到期刊结构的普遍特征;
构建模块,用于根据所述期刊结构的普遍特征构建期刊的结构模块。
上述构建模块的一种具体实施例包括:
元素类型确定单元,用于确定期刊各元素类型;
元素创建单元,用于创建各元素,包括设置每个元素的名称属性、类型属性;
生成单元,用于将所述元素创建单元创建的各元素依据期刊结构建成树形结构,使用Schema标准格式文档描述对应的结构并保存。
利用所述构建模块构建期刊的结构模块的具体过程可参照前面本发明方法实施例中的描述,在此不再赘述。
为了进一步保证所述结构化数据文档的正确性,本发明实施例的装置还可进一步包括:验证模块,用于利用Schema或者文档类型定义DTD对所述结构化数据文档进行规范性验证。
另外,本发明实施例的装置还可进一步包括:发布模板制作模块,用于制作发布模板,并在创建所述发布模板时,根据所述结构模块中的元素类型,确定所述发布模板中的元素类型。
本发明实施例清样生成的装置,通过自动排版的方式支持期刊稿件的清样文件的快速生成,在编辑修改完稿件之后,即可通过自动排版的方式快速产生排版结果、输出清样,大大缩短了期刊稿件的处理时间。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种清样生成的方法,其特征在于,包括:
将原稿转换为结构化数据文档;
根据预先制作的发布模板,对所述结构化数据文档进行自动排版,得到版式文件;所述发布模板规定了出版物成品的版式;
根据所述版式文件形成清样。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
统计各种期刊结构,并对其进行抽象得到期刊结构的普遍特征;
根据所述期刊结构的普遍特征构建期刊的结构模块;
所述将原稿转换为结构化数据文档包括:
根据所述结构模块将原稿转换为结构化数据文档。
3.根据权利要求2所述的方法,其特征在于,所述根据所述期刊结构的普遍特征构建期刊的结构模块包括:
确定期刊各元素类型;
创建各元素,包括设置每个元素的名称属性、类型属性;
将创建的各元素依据期刊结构建成树形结构,使用Schema标准格式文档描述对应的结构并保存。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
利用Schema或者文档类型定义DTD对所述结构化数据文档进行规范性验证。
5.根据权利要求2至4任一项所述的方法,其特征在于,所述方法还包括:
在制作所述发布模板时,根据所述结构模块中的元素类型,确定所述发布模板中的元素类型。
6.一种清样生成的装置,其特征在于,包括:
结构化处理模块,用于将原稿转换为结构化数据文档;
排版模块,用于根据预先制作的发布模板,对所述结构化数据文档进行自动排版,得到版式文件;所述发布模板规定了出版物成品的版式;
清样生成模块,用于根据所述版式文件形成清样。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
统计模块,用于统计各种期刊结构,并对其进行抽象得到期刊结构的普遍特征;
构建模块,用于根据所述期刊结构的普遍特征构建期刊的结构模块;
所述结构化处理模块,具体用于根据所述结构模块将原稿转换为结构化数据文档。
8.根据权利要求7所述的装置,其特征在于,所述构建模块包括:
元素类型确定单元,用于确定期刊各元素类型;
元素创建单元,用于创建各元素,包括设置每个元素的名称属性、类型属性;
生成单元,用于将所述元素创建单元创建的各元素依据期刊结构建成树形结构,使用Schema标准格式文档描述对应的结构并保存。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
验证模块,用于利用Schema或者文档类型定义DTD对所述结构化数据文档进行规范性验证。
10.根据权利要求7至9任一项所述的装置,其特征在于,所述装置还包括:
发布模板制作模块,用于制作发布模板,并在创建所述发布模板时,根据所述结构模块中的元素类型,确定所述发布模板中的元素类型。
CN201310585470.4A 2013-11-19 2013-11-19 一种清样生成方法和装置 Pending CN104657342A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310585470.4A CN104657342A (zh) 2013-11-19 2013-11-19 一种清样生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310585470.4A CN104657342A (zh) 2013-11-19 2013-11-19 一种清样生成方法和装置

Publications (1)

Publication Number Publication Date
CN104657342A true CN104657342A (zh) 2015-05-27

Family

ID=53248492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310585470.4A Pending CN104657342A (zh) 2013-11-19 2013-11-19 一种清样生成方法和装置

Country Status (1)

Country Link
CN (1) CN104657342A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701073A (zh) * 2015-12-31 2016-06-22 北京中科江南信息技术股份有限公司 版式文件的生成方法及装置
CN106407319A (zh) * 2016-08-31 2017-02-15 徐工集团工程机械有限公司 产品信息展示方法和装置
CN109960787A (zh) * 2017-12-14 2019-07-02 北大方正集团有限公司 版式模板的生成方法及装置
CN111414741A (zh) * 2018-12-19 2020-07-14 北大方正集团有限公司 出版物的版式模板制作方法、装置、设备及介质
CN112069784A (zh) * 2020-09-15 2020-12-11 成都彬果科技有限公司 一种基于智能识别的填充式自动文档排版方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101430714A (zh) * 2008-12-08 2009-05-13 北大方正集团有限公司 一种基于样式的内容结构化加工方法及系统
CN101989256A (zh) * 2009-07-31 2011-03-23 北京大学 一种文书文件的排版方法及装置
CN102103591A (zh) * 2009-12-18 2011-06-22 北大方正集团有限公司 一种利用结构化数据实现文档内容自动更新的方法及系统
CN102982010A (zh) * 2011-09-02 2013-03-20 北大方正集团有限公司 提取文档结构的方法和装置
CN103377183A (zh) * 2012-04-27 2013-10-30 北大方正集团有限公司 重复排版的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101430714A (zh) * 2008-12-08 2009-05-13 北大方正集团有限公司 一种基于样式的内容结构化加工方法及系统
CN101989256A (zh) * 2009-07-31 2011-03-23 北京大学 一种文书文件的排版方法及装置
CN102103591A (zh) * 2009-12-18 2011-06-22 北大方正集团有限公司 一种利用结构化数据实现文档内容自动更新的方法及系统
CN102982010A (zh) * 2011-09-02 2013-03-20 北大方正集团有限公司 提取文档结构的方法和装置
CN103377183A (zh) * 2012-04-27 2013-10-30 北大方正集团有限公司 重复排版的方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701073A (zh) * 2015-12-31 2016-06-22 北京中科江南信息技术股份有限公司 版式文件的生成方法及装置
CN106407319A (zh) * 2016-08-31 2017-02-15 徐工集团工程机械有限公司 产品信息展示方法和装置
CN106407319B (zh) * 2016-08-31 2019-07-23 徐工集团工程机械有限公司 产品信息展示方法和装置
CN109960787A (zh) * 2017-12-14 2019-07-02 北大方正集团有限公司 版式模板的生成方法及装置
CN111414741A (zh) * 2018-12-19 2020-07-14 北大方正集团有限公司 出版物的版式模板制作方法、装置、设备及介质
CN111414741B (zh) * 2018-12-19 2022-06-14 北大方正集团有限公司 出版物的版式模板制作方法、装置、设备及介质
CN112069784A (zh) * 2020-09-15 2020-12-11 成都彬果科技有限公司 一种基于智能识别的填充式自动文档排版方法及系统

Similar Documents

Publication Publication Date Title
US7434160B2 (en) PDF document to PPML template translation
US20070028166A1 (en) System and processes for dynamic document construction
CN104657342A (zh) 一种清样生成方法和装置
US20050235202A1 (en) Automatic graphical layout printing system utilizing parsing and merging of data
CN100543725C (zh) 一种为电子印章定位的方法
CN102360274A (zh) 一种可变数据打印的模板实现装置及其应用方法
CN103777989A (zh) 用于将视觉稿源文件生成html标记的方法及系统
CN104020984A (zh) 一种生成静态页面的方法及装置
CN103885731A (zh) 一种数据打印的方法及装置
WO2009074974A1 (en) System and process for producing a two-layer document, and a two-layer document produced accordingly
CN105630747A (zh) 一种应用于特种设备行业的检验报告专业化系统及方法
CN108073562A (zh) 基于云平台的出版物处理方法及装置
KR102296939B1 (ko) 다중 모드를 지원하는 pdf 등의 전자문서를 관리하는 장치 및 방법
CN107015959A (zh) 一种对pdf文件合版的方法
JP2011150599A5 (zh)
CN103136314A (zh) 一种舆情监控中剪报生成方法及系统
US20120246559A1 (en) Method and system for estimating variable data document conversion time
CN108196850A (zh) 一种应用于可变信息印刷的自动数据处理与拼版方法
CN108132918A (zh) 一种输出报表的方法及系统
CN104933021B (zh) 印前校验传版方法和设备
CN117236282B (zh) 基于xml数据的智能排版方法、装置、终端及介质
Răcheru et al. Aspects regarding the organization of printing production in the context of Industry 4.0
Akehurst Proposal for a model driven approach to creating a tool to support the RM-ODP
CN107451232A (zh) 一种电子文档图文信息还原方法、存储设备及终端
WO2004015588A3 (en) Electronic document processing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150527