CN109670160B - 文件的排版处理方法和装置 - Google Patents

文件的排版处理方法和装置 Download PDF

Info

Publication number
CN109670160B
CN109670160B CN201710954887.1A CN201710954887A CN109670160B CN 109670160 B CN109670160 B CN 109670160B CN 201710954887 A CN201710954887 A CN 201710954887A CN 109670160 B CN109670160 B CN 109670160B
Authority
CN
China
Prior art keywords
domain
xml
file
entry information
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710954887.1A
Other languages
English (en)
Other versions
CN109670160A (zh
Inventor
郑瑞连
占定心
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201710954887.1A priority Critical patent/CN109670160B/zh
Publication of CN109670160A publication Critical patent/CN109670160A/zh
Application granted granted Critical
Publication of CN109670160B publication Critical patent/CN109670160B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/189Automatic justification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供一种文件的排版处理方法和装置。该方法包括:接收Web平台发送的至少一个域数据、以及关联关系标识信息,关联关系标识信息标识域数据与域条目信息关联;根据至少一个域数据中的每一个域数据,以及与每一个域数据关联的域条目信息,生成域内容,域条目信息和域内容关联;根据域内容与域条目信息的关联关系,以及域条目信息与待处理的XML文件的XML节点的关联关系,确定与域内容对应的XML节点;将域内容添加到与域内容对应的XML节点中;根据添加有域内容的XML文件,生成待出版的预设格式的数据文件。自动将域数据添加待出版的数据文件中,生成的待出版的数据文件完整,提高待出版的数据文件的完整性和准确性。

Description

文件的排版处理方法和装置
技术领域
本发明涉及自动化排版技术领域,尤其涉及一种文件的排版处理方法和装置。
背景技术
随着自动化排版技术的发展,在自动化排版技术中常常需要对可扩展标记语言(Extensible Markup Language,简称XML)文件进行排版。
现有技术中,可以根据预设的模板,对多个XML文件进行合成等处理,以生成待出版的数据文件,该数据文件的格式可以为Word格式、便携式文档格式(Portable DocumentFormat,简称PDF)格式等等。
然而现有技术中,常常需要将刊号、卷号、期号、纸质出版日期等域数据添加到待出版的数据文件中,现有技术中尚无法自动将域数据添加待出版的数据文件中,进而生成的待出版的数据文件不完整,进而得到的待出版的数据文件的完整性和准确性较低。
发明内容
本发明提供一种文件的排版处理方法和装置,用以解决无法自动将域数据添加待出版的数据文件中,进而生成的待出版的数据文件不完整,进而得到的待出版的数据文件的完整性和准确性较低的问题。
一方面,本发明提供一种文件的排版处理方法,包括:
接收Web平台发送的至少一个域数据、以及关联关系标识信息,其中,所述关联关系标识信息标识所述域数据与域条目信息关联;
根据所述至少一个域数据中的每一个域数据,以及与每一个域数据关联的域条目信息,生成域内容,所述域条目信息和所述域内容关联;
根据所述域内容与所述域条目信息的关联关系,以及所述域条目信息与待处理的XML文件的XML节点的关联关系,确定与所述域内容对应的XML节点;
将所述域内容添加到与所述域内容对应的XML节点中,得到添加有域内容的XML文件;
根据所述添加有域内容的XML文件,生成待出版的预设格式的数据文件。
进一步地,在所述接收Web平台发送的至少一个域数据、以及关联关系标识信息之前,还包括:
获取域配置文件,其中,域配置文件中包括各域条目信息、各路径信息、以及域条目信息与路径信息的关联关系;
获取所述待处理的XML文件,其中,所述待处理的XML文件中包括各XML节点、以及XML节点与路径信息的关联关系;
根据域条目信息与路径信息的关联关系、以及XML节点与路径信息的关联关系,确定域条目信息与XML节点的关联关系。
进一步地,所述获取域配置文件,包括:
接收用户输入的所述各域条目信息、以及与各域条目信息对应的路径信息;
根据所述各域条目信息、以及所述与各域条目信息对应的路径信息,生成所述域配置文件。
进一步地,在所述根据域条目信息与路径信息的关联关系、以及XML节点与路径信息的关联关系,确定域条目信息与XML节点的关联关系之后,还包括:
根据域条目信息与XML节点的关联关系,在确定不存在与域条目信息对应的XML节点时,根据不存在对应的XML节点的域条目信息的路径信息所描述的路径,生成与该域条目信息对应的XML节点;
将生成的XML节点添加到所述待处理的XML文件中。
进一步地,获取所述待处理的XML文件,包括:
将各个采用了不同标准的XML文件,转换为预设统一标准的所述待处理的XML文件。
进一步地,根据所述添加有域内容的XML文件,生成待出版的预设格式的数据文件,包括:
根据预设模板、以及所述添加有域内容的XML文件,生成各个章节的排版结果文件;
将所述各个章节的排版结果文件,合成为一个待处理文件;
将所述待处理文件,转换为所述待出版的预设格式的数据文件。
进一步地,在根据所述添加有域内容的XML文件,生成待出版的预设格式的数据文件之前,还包括:
调节所述待处理的XML文件中的各XML节点的顺序,使得所述待处理的XML文件符合JATS标准。
另一方面,本发明提供一种文件的排版处理装置,包括:
接收模块,用于接收Web平台发送的至少一个域数据、以及关联关系标识信息,其中,所述关联关系标识信息标识所述域数据与域条目信息关联;
第一生成模块,用于根据所述至少一个域数据中的每一个域数据,以及与每一个域数据关联的域条目信息,生成域内容,所述域条目信息和所述域内容关联;
第一确定模块,用于根据所述域内容与所述域条目信息的关联关系,以及所述域条目信息与待处理的XML文件的XML节点的关联关系,确定与所述域内容对应的XML节点;
第一添加模块,用于将所述域内容添加到与所述域内容对应的XML节点中,得到添加有域内容的XML文件;
第二生成模块,用于根据所述添加有域内容的XML文件,生成待出版的预设格式的数据文件。
进一步地,所述装置,还包括:
第一获取模块,用于在所述接收模块接收Web平台发送的至少一个域数据、以及关联关系标识信息之前,获取域配置文件,其中,域配置文件中包括各域条目信息、各路径信息、以及域条目信息与路径信息的关联关系;
第二获取模块,用于获取所述待处理的XML文件,其中,所述待处理的XML文件中包括各XML节点、以及XML节点与路径信息的关联关系;
第二确定模块,用于根据域条目信息与路径信息的关联关系、以及XML节点与路径信息的关联关系,确定域条目信息与XML节点的关联关系。
进一步地,所述第一获取模块,具体用于:
接收用户输入的所述各域条目信息、以及与各域条目信息对应的路径信息;
根据所述各域条目信息、以及所述与各域条目信息对应的路径信息,生成所述域配置文件。
进一步地,所述装置,还包括:
第三生成模块,用于在所述第二确定模块根据域条目信息与路径信息的关联关系、以及XML节点与路径信息的关联关系,确定域条目信息与XML节点的关联关系之后,根据域条目信息与XML节点的关联关系,在确定不存在与域条目信息对应的XML节点时,根据不存在对应的XML节点的域条目信息的路径信息所描述的路径,生成与该域条目信息对应的XML节点;
第二添加模块,用于将生成的XML节点添加到所述待处理的XML文件中。
进一步地,所述第二获取模块,具体用于:
将各个采用了不同标准的XML文件,转换为预设统一标准的所述待处理的XML文件。
进一步地,所述第一添加模块,具体用于:
根据预设模板、以及所述添加有域内容的XML文件,生成各个章节的排版结果文件;
将所述各个章节的排版结果文件,合成为一个待处理文件;
将所述待处理文件,转换为所述待出版的预设格式的数据文件。
进一步地,所述装置,还包括:
调节模块,用于在所述第二生成模块根据所述添加有域内容的XML文件,生成待出版的预设格式的数据文件之前,调节所述待处理的XML文件中的各XML节点的顺序,使得所述待处理的XML文件符合JATS标准。
本发明提供的排版处理方法和装置,通过接收Web平台发送的至少一个域数据、以及关联关系标识信息,其中,关联关系标识信息标识域数据与域条目信息关联;根据至少一个域数据中的每一个域数据,以及与每一个域数据关联的域条目信息,生成域内容,域条目信息和域内容关联;根据域内容与域条目信息的关联关系,以及域条目信息与待处理的XML文件的XML节点的关联关系,确定与域内容对应的XML节点;将域内容添加到与域内容对应的XML节点中,得到添加有域内容的XML文件;根据添加有域内容的XML文件,生成待出版的预设格式的数据文件。通过域数据以及与域数据对应的域条目信息,生成域内容;通过域内容与域条目信息的关联关系,域条目信息与待处理的XML文件的XML节点的关联关系,确定出与域内容对应的XML节点,进而将域内容添加到与域内容对应的XML节点中;从而可以自动将域数据添加待出版的数据文件中,使得生成的待出版的数据文件完整,提高了待出版的数据文件的完整性和准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本申请实施例提供的一种文件的排版处理方法的流程示意图;
图2为本申请实施例提供的另一种文件的排版处理方法的流程示意图;
图3为本发明实施例提供的一种文件的排版处理装置的结构示意图;
图4为本发明实施例提供的另一种文件的排版处理装置的结构示意图;
图5是根据一示例性实施例示出的一种终端设备的框图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
首先对本发明所涉及的名词进行解释:
XML:是一种用于标记电子文件使其具有结构性的标记语言;可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。
数字对象唯一标识符(Digital Object Unique Identifier,简称DOI):是一套识别数字资源的机制,涵括的对象有视频、报告或书籍等等。它既有一套为资源命名的机制,也有一套将识别号解析为具体地址的协议。DOI码由前缀和后缀两部分组成,中间用"/"分开,并且前缀以"."再分为两部分。前缀由国际数字对象识别号基金会确定,后缀部分由资源发布者自行指定,用于区分一个单独的数字资料,具有唯一性。发布者可以选择以何单位进行注册,例如,一本书可以注册单一的DOI,也可以依各章节分别注册,甚至独立注册其中的一个表格或图片。
期刊论文标签集(Journal Article Tag Suite,简称JATS):是一种用于期刊全文电子文档交换和存档的通用数据交换格式,它定义了一系列描述期刊、文章特征的元素及属性,并对文章中的图片、表格、术语[6]等有特定的说明,标签集共包含了250余个元素和130余个元素属性。JATS文档的内容可开放获取,出版商、科技期刊、数据库、文章作者可以根据需求选择一组JATS标准。JATS专为XML提供的一套标准,共包含三个标准库,为出版商和数据库厂商提供一种通用的期刊论文数据存储和交换的文档格式。
XPath:即为XML路径语言,它是一种用来确定XML文档中某部分位置的语言,XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力;XPath用于在XML文档中通过元素和属性进行导航;XPath使用路径表达式在XML文档中进行导航。
现有技术中,常常需要将刊号、卷号、期号、纸质出版日期等域数据添加到待出版的数据文件中,现有技术中尚无法自动将域数据添加待出版的数据文件中,进而生成的待出版的数据文件不完整,进而得到的待出版的数据文件的完整性和准确性较低。本发明提供的文件的排版处理方法和装置,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图1为本申请实施例提供的一种文件的排版处理方法的流程示意图。如图1所示,该方法包括:
步骤101、接收全球广域网(World Wide Web,简称Web)平台发送的至少一个域数据、以及关联关系标识信息,其中,关联关系标识信息标识域数据与域条目信息关联。
在本实施例中,具体的,从Web平台中获取域数据,其中,域数据为刊号、卷号、期号、纸质出版日期等。在获取域数据的同时,需要从Web平台中获取关联关系标识信息,其中,关联关系标识信息标识域数据与域条目信息关联。其中,域条目信息指的是章节、图像、表格、刊号、卷号、期号、纸质出版日期、网上出版日期、收稿日期、修订日期等信息。
由于获取到了各域数据,以及域数据与域条目信息之间的关联关系,进而可以根据域数据与域条目信息的关联关系,确定出与每一个域数据对应的域条目信息,例如,一个域数据与一个域条目信息一一对应,或者,一个域数据与多个域条目信息对应。其中,域条目信息为用户输入的,一个域条目信息中包括以下的至少一种:章节、图像、表格、刊号、卷号、期号、纸质出版日期、网上出版日期、收稿日期、修订日期、录用日期、纸质出版年、纸质出版年、纸质出版月、纸质出版日、英文纸质出版月、DOI。
步骤102、根据至少一个域数据中的每一个域数据,以及与每一个域数据关联的域条目信息,生成域内容,域条目信息和域内容关联。
在本实施例中,具体的,针对每一个域数据,根据域数据以及与域数据对应的域条目信息,生成域内容;并且,域内容与域条目信息之间具有关联关系,例如,域内容与域条目信息之间一一对应。
步骤103、根据域内容与域条目信息的关联关系,以及域条目信息与待处理的XML文件的XML节点的关联关系,确定与域内容对应的XML节点。
在本实施例中,具体的,对于待处理的XML文件来说,待处理的XML文件中包括多个XML节点。域内容与域条目信息具有关联关系,并且域条目信息与待处理的XML文件的XML节点之间也具有对应关系,进而,可以根据域内容与域条目信息的关联关系,确定出与域内容对应的域条目信息,然后根据域条目信息与待处理的XML文件的XML节点的关联关系,确定出与该域条目信息对应的XML节点,进而确定出与域内容对应的XML节点。
步骤104、将域内容添加到与域内容对应的XML节点中,得到添加有域内容的XML文件。
在本实施例中,具体的,针对每一个域内容,将域内容,添加到与域内容对应的XML节点中,以得到添加有域内容的XML文件,进而得到添加有域条目信息的XML文件。
步骤105、根据添加有域内容的XML文件,生成待出版的预设格式的数据文件。
在本实施例中,具体的,将添加有域内容的XML文件转换为预设格式的数据文件,该预设格式为word格式、或pdf格式等等。
本实施例通过接收Web平台发送的至少一个域数据、以及关联关系标识信息,其中,关联关系标识信息标识域数据与域条目信息关联;根据至少一个域数据中的每一个域数据,以及与每一个域数据关联的域条目信息,生成域内容,域条目信息和域内容关联;根据域内容与域条目信息的关联关系,以及域条目信息与待处理的XML文件的XML节点的关联关系,确定与域内容对应的XML节点;将域内容添加到与域内容对应的XML节点中,得到添加有域内容的XML文件;根据添加有域内容的XML文件,生成待出版的预设格式的数据文件。通过域数据以及与域数据对应的域条目信息,生成域内容;通过域内容与域条目信息的关联关系,域条目信息与待处理的XML文件的XML节点的关联关系,确定出与域内容对应的XML节点,进而将域内容添加到与域内容对应的XML节点中;从而可以自动将域数据添加待出版的数据文件中,使得生成的待出版的数据文件完整,提高了待出版的数据文件的完整性和准确性。
图2为本申请实施例提供的另一种文件的排版处理方法的流程示意图。如图2所示,该方法包括:
步骤201、获取域配置文件,其中,域配置文件中包括各域条目信息、各路径信息、以及域条目信息与路径信息的关联关系。
其中,步骤201具体包括:接收用户输入的各域条目信息、以及与各域条目信息对应的路径信息;根据各域条目信息、以及与各域条目信息对应的路径信息,生成域配置文件。
在本实施例中,具体的,首先接收用户输入的多个域条目信息,其中一个域条目信息中包括以下的至少一种:章节、图像、表格、刊号、卷号、期号、纸质出版日期、网上出版日期、收稿日期、修订日期、录用日期、纸质出版年、纸质出版年、纸质出版月、纸质出版日、英文纸质出版月、DOI。并且,需要接收用户输入的与各域条目信息对应的路径信息xpath。然后,根据每一个域条目信息,以及与每一个域条目信息一一对应的路径信息xpath,生成域配置文件,进而,域配置文件中包括多个域条目信息、以及与每一个域条目信息一一对应的路径信息xpath,其中,一些域条目信息是由其他的多个域条目信息拼装而来的。
读取上述域配置文件,可知,域配置文件中包括多个域条目信息、多个路径信息xpath、以及域条目信息与路径信息的关联关系,其中,域条目信息与路径信息的关联关系可以为为每一个域条目信息与每一个路径信息xpath之间一一对应。
步骤202、获取待处理的XML文件,其中,待处理的XML文件中包括各XML节点、以及XML节点与路径信息的关联关系。
其中,步骤202具体包括:将各个采用了不同标准的XML文件,转换为预设统一标准的待处理的XML文件。
在本实施例中,具体的,获取各不同格式的文件,然后将不同格式的文件转换为对应的XML文件,进而得到各个采用了不同标准的XML文件;然后,将各个采用了不同标准的XML文件,转换为预设的统一标准的标准XML文件,进而得到待处理的XML文件,待处理的XML文件中包括了多个XML节点,以及XML节点与路径信息xpath之间的关联关系。
步骤203、根据域条目信息与路径信息的关联关系、以及XML节点与路径信息的关联关系,确定域条目信息与XML节点的关联关系。
在本实施例中,具体的,每一个域条目信息与每一个路径信息之间具有一一对应的关联关系,且XML节点与路径信息之间具有关联关系,进而可以确定出域条目信息与XML节点之间的关联关系。
步骤204、根据域条目信息与XML节点的关联关系,在确定不存在与域条目信息对应的XML节点时,根据不存在对应的XML节点的域条目信息的路径信息所描述的路径,生成与该域条目信息对应的XML节点。
在本实施例中,具体的,根据XML节点与路径信息xpath的关联关系,确定与域条目信息对应的XML节点。具体来说,根据XML节点与路径信息xpath的关联关系,判断是否存在于与域条目信息对应的路径信息xpath所对应的XML节点,若存在,则确定与域条目信息对应的路径信息xpath所对应的XML节点,为与域条目信息对应的XML节点,若不存在,则确定出与域条目信息对应的路径信息xpath所描述的路径。
然后,根据与域条目信息对应的路径信息xpath所描述的路径,生成与域条目信息对应的XML节点。
步骤205、将生成的XML节点添加到待处理的XML文件中。
在本实施例中,具体的,将生成的与域条目信息对应的XML节点添加到待处理的XML文件中,进而可以保证可以根据每个域条目信息对应的路径信息xpath所描述信息,都能找到与域条目信息所对应的XML节点。
步骤206、接收Web平台发送的至少一个域数据、以及关联关系标识信息,其中,关联关系标识信息标识域数据与域条目信息关联。
在本实施例中,具体的,接收web平台发送的多个域数据,其中,每一个域数据的名称表征了域数据与域条目信息之间的关联关系。
步骤207、根据至少一个域数据中的每一个域数据,以及与每一个域数据关联的域条目信息,生成域内容,域条目信息和域内容关联。
在本实施例中,具体的,本步骤参见图1的步骤102,不再赘述。
步骤208、根据域内容与域条目信息的关联关系,以及域条目信息与待处理的XML文件的XML节点的关联关系,确定与域内容对应的XML节点。
在本实施例中,具体的,本步骤参见图1的步骤103,不再赘述。
步骤209、将域内容添加到与域内容对应的XML节点中,得到添加有域内容的XML文件。
在本实施例中,具体的,本步骤参见图1的步骤104,不再赘述。
步骤210、调节待处理的XML文件中的各XML节点的顺序,使得待处理的XML文件符合JATS标准。
在本实施例中,具体的,在以上步骤中,可以根据JATS标准,调整XML节点的顺序,具体来说,调节XML文件中的各XML节点的顺序,使得XML文件符合JATS标准。
步骤211、根据添加有域内容的XML文件,生成待出版的预设格式的数据文件。
其中,步骤211具体包括:根据预设模板、以及添加有域内容的XML文件,生成各个章节的排版结果文件;将各个章节的排版结果文件,合成为一个待处理文件;将待处理文件,转换为待出版的预设格式的数据文件。
在本实施例中,具体的,将添加有域内容的XML文件转换到预设模板中,进而生成各个章节的排版结果文件。然后,对各个章节的排版结果文件进行渲染,得到渲染后的各个章节的排版结果文件,其中,每一个章节的排版结果文件包括了该章节的版面内容,其中,渲染例如为调整图片大小;可以将多个章节的排版结果文件,合并为一个章节的排版结果文件。并且,可以接收web平台发送的更新的域数据;然后,根据更新的域数据以及与该域数据对应的域条目信息,生成更新的域内容;将更新的域内容,添加到与域条目信息对应的XML节点中,以得到添加有域内容的新的XML文件。
然后,可以将各个单章的排版结果文件,合成为一个待处理文件,进而组装成一个书籍文件。
最后,将书籍文件,转换为预设格式的数据文件,该预设格式为word格式、或pdf格式等等。
本实施例通过接收Web平台发送的至少一个域数据、以及关联关系标识信息,其中,关联关系标识信息标识域数据与域条目信息关联;根据至少一个域数据中的每一个域数据,以及与每一个域数据关联的域条目信息,生成域内容,域条目信息和域内容关联;根据域内容与域条目信息的关联关系,以及域条目信息与待处理的XML文件的XML节点的关联关系,确定与域内容对应的XML节点;将域内容添加到与域内容对应的XML节点中,得到添加有域内容的XML文件;根据添加有域内容的XML文件,生成待出版的预设格式的数据文件。进而通过获取域配置文件,其中,域配置文件中包括多个域条目信息、以及与每一个域条目信息一一对应的xpath;将各个采用了不同标准的XML文件转换为预设的统一标准的标准XML文件;根据xpath与XML节点的对应关系,确定与域条目信息对应的XML节点;接收web平台发送的多个域数据,将域内容,添加到与域条目信息对应的XML节点中,以得到添加有域内容的XML文件;根据预设模板、以及添加有域内容的XML文件,生成各个章节的排版结果文件;将各个单章的排版结果文件,组装成一个书籍文件;将书籍文件,转换为预设格式的数据文件。从而可以自动将域数据添加待出版的数据文件中,使得生成的待出版的数据文件完整,提高了待出版的数据文件的完整性和准确性。
图3为本发明实施例提供的一种文件的排版处理装置的结构示意图,如图3所示,本实施例的装置可以包括:
接收模块31,用于接收Web平台发送的至少一个域数据、以及关联关系标识信息,其中,关联关系标识信息标识域数据与域条目信息关联;
第一生成模块32,用于根据至少一个域数据中的每一个域数据,以及与每一个域数据关联的域条目信息,生成域内容,域条目信息和域内容关联;
第一确定模块33,用于根据域内容与域条目信息的关联关系,以及域条目信息与待处理的XML文件的XML节点的关联关系,确定与域内容对应的XML节点;
第一添加模块34,用于将域内容添加到与域内容对应的XML节点中,得到添加有域内容的XML文件;
第二生成模块35,用于根据添加有域内容的XML文件,生成待出版的预设格式的数据文件。
本实施例的文件的排版处理装置可执行本发明实施例提供的一种文件的排版处理方法,其实现原理相类似,此处不再赘述。
本实施例通过接收Web平台发送的至少一个域数据、以及关联关系标识信息,其中,关联关系标识信息标识域数据与域条目信息关联;根据至少一个域数据中的每一个域数据,以及与每一个域数据关联的域条目信息,生成域内容,域条目信息和域内容关联;根据域内容与域条目信息的关联关系,以及域条目信息与待处理的XML文件的XML节点的关联关系,确定与域内容对应的XML节点;将域内容添加到与域内容对应的XML节点中,得到添加有域内容的XML文件;根据添加有域内容的XML文件,生成待出版的预设格式的数据文件。通过域数据以及与域数据对应的域条目信息,生成域内容;通过域内容与域条目信息的关联关系,域条目信息与待处理的XML文件的XML节点的关联关系,确定出与域内容对应的XML节点,进而将域内容添加到与域内容对应的XML节点中;从而可以自动将域数据添加待出版的数据文件中,使得生成的待出版的数据文件完整,提高了待出版的数据文件的完整性和准确性。
图4为本发明实施例提供的另一种文件的排版处理装置的结构示意图,在图3所示实施例的基础上,如图4所示,本实施例的装置,还包括:
第一获取模块41,用于在接收模块31接收Web平台发送的至少一个域数据、以及关联关系标识信息之前,获取域配置文件,其中,域配置文件中包括各域条目信息、各路径信息、以及域条目信息与路径信息的关联关系;
第二获取模块42,用于获取待处理的XML文件,其中,待处理的XML文件中包括各XML节点、以及XML节点与路径信息的关联关系;
第二确定模块43,用于根据域条目信息与路径信息的关联关系、以及XML节点与路径信息的关联关系,确定域条目信息与XML节点的关联关系。
第一获取模块41,具体用于:
接收用户输入的各域条目信息、以及与各域条目信息对应的路径信息;
根据各域条目信息、以及与各域条目信息对应的路径信息,生成域配置文件。
本实施例提供的装置,还包括:
第三生成模块44,用于在第二确定模块43根据域条目信息与路径信息的关联关系、以及XML节点与路径信息的关联关系,确定域条目信息与XML节点的关联关系之后,根据域条目信息与XML节点的关联关系,在确定不存在与域条目信息对应的XML节点时,根据不存在对应的XML节点的域条目信息的路径信息所描述的路径,生成与该域条目信息对应的XML节点;
第二添加模块45,用于将生成的XML节点添加到待处理的XML文件中。
第二获取模块42,具体用于:
将各个采用了不同标准的XML文件,转换为预设统一标准的待处理的XML文件。
第一添加模块34,具体用于:
根据预设模板、以及添加有域内容的XML文件,生成各个章节的排版结果文件;
将各个章节的排版结果文件,合成为一个待处理文件;
将待处理文件,转换为待出版的预设格式的数据文件。
本实施例提供的装置,还包括:
调节模块46,用于在第二生成模块35根据添加有域内容的XML文件,生成待出版的预设格式的数据文件之前,调节待处理的XML文件中的各XML节点的顺序,使得待处理的XML文件符合JATS标准。
本实施例的文件的排版处理装置可执行本发明实施例提供的另一种文件的排版处理方法,其实现原理相类似,此处不再赘述。
本实施例通过接收Web平台发送的至少一个域数据、以及关联关系标识信息,其中,关联关系标识信息标识域数据与域条目信息关联;根据至少一个域数据中的每一个域数据,以及与每一个域数据关联的域条目信息,生成域内容,域条目信息和域内容关联;根据域内容与域条目信息的关联关系,以及域条目信息与待处理的XML文件的XML节点的关联关系,确定与域内容对应的XML节点;将域内容添加到与域内容对应的XML节点中,得到添加有域内容的XML文件;根据添加有域内容的XML文件,生成待出版的预设格式的数据文件。进而通过获取域配置文件,其中,域配置文件中包括多个域条目信息、以及与每一个域条目信息一一对应的xpath;将各个采用了不同标准的XML文件转换为预设的统一标准的标准XML文件;根据xpath与XML节点的对应关系,确定与域条目信息对应的XML节点;接收web平台发送的多个域数据,将域内容,添加到与域条目信息对应的XML节点中,以得到添加有域内容的XML文件;根据预设模板、以及添加有域内容的XML文件,生成各个章节的排版结果文件;将各个单章的排版结果文件,组装成一个书籍文件;将书籍文件,转换为预设格式的数据文件。从而可以自动将域数据添加待出版的数据文件中,使得生成的待出版的数据文件完整,提高了待出版的数据文件的完整性和准确性。
图5是根据一示例性实施例示出的一种终端设备的框图,该设备可以是移动终端,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当该存储介质中的指令由终端设备的处理器执行时,使得终端设备能够执行上述文件的排版处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims (8)

1.一种文件的排版处理方法,其特征在于,包括:
接收全球广域网Web平台发送的至少一个域数据、以及关联关系标识信息,其中,所述关联关系标识信息标识所述域数据与域条目信息关联;
根据所述至少一个域数据中的每一个域数据,以及与每一个域数据关联的域条目信息,生成域内容,所述域条目信息和所述域内容关联;
根据所述域内容与所述域条目信息的关联关系,以及所述域条目信息与待处理的可扩展标记语言XML文件的XML节点的关联关系,确定与所述域内容对应的XML节点;
将所述域内容添加到与所述域内容对应的XML节点中,得到添加有域内容的XML文件;
根据所述添加有域内容的XML文件,生成待出版的预设格式的数据文件;
其中,在所述接收Web平台发送的至少一个域数据、以及关联关系标识信息之前,还包括:
获取域配置文件,其中,域配置文件中包括各域条目信息、各路径信息、以及域条目信息与路径信息的关联关系;
获取所述待处理的XML文件,其中,所述待处理的XML文件中包括各XML节点、以及XML节点与路径信息的关联关系;
根据域条目信息与路径信息的关联关系、以及XML节点与路径信息的关联关系,确定域条目信息与XML节点的关联关系;
其中,所述获取域配置文件,包括:
接收用户输入的所述各域条目信息、以及与各域条目信息对应的路径信息;
根据所述各域条目信息、以及所述与各域条目信息对应的路径信息,生成所述域配置文件;
其中,在所述根据域条目信息与路径信息的关联关系、以及XML节点与路径信息的关联关系,确定域条目信息与XML节点的关联关系之后,还包括:
根据域条目信息与XML节点的关联关系,在确定不存在与域条目信息对应的XML节点时,根据不存在对应的XML节点的域条目信息的路径信息所描述的路径,生成与该域条目信息对应的XML节点;
将生成的XML节点添加到所述待处理的XML文件中。
2.根据权利要求1所述的方法,其特征在于,获取所述待处理的XML文件,包括:
将各个采用了不同标准的XML文件,转换为预设统一标准的所述待处理的XML文件。
3.根据权利要求1或2所述的方法,其特征在于,根据所述添加有域内容的XML文件,生成待出版的预设格式的数据文件,包括:
根据预设模板、以及所述添加有域内容的XML文件,生成各个章节的排版结果文件;
将所述各个章节的排版结果文件,合成为一个待处理文件;
将所述待处理文件,转换为所述待出版的预设格式的数据文件。
4.根据权利要求1或2所述的方法,其特征在于,在根据所述添加有域内容的XML文件,生成待出版的预设格式的数据文件之前,还包括:
调节所述待处理的XML文件中的各XML节点的顺序,使得所述待处理的XML文件符合期刊论文标签集JATS标准。
5.一种文件的排版处理装置,其特征在于,包括:
接收模块,用于接收Web平台发送的至少一个域数据、以及关联关系标识信息,其中,所述关联关系标识信息标识所述域数据与域条目信息关联;
第一生成模块,用于根据所述至少一个域数据中的每一个域数据,以及与每一个域数据关联的域条目信息,生成域内容,所述域条目信息和所述域内容关联;
第一确定模块,用于根据所述域内容与所述域条目信息的关联关系,以及所述域条目信息与待处理的XML文件的XML节点的关联关系,确定与所述域内容对应的XML节点;
第一添加模块,用于将所述域内容添加到与所述域内容对应的XML节点中,得到添加有域内容的XML文件;
第二生成模块,用于根据所述添加有域内容的XML文件,生成待出版的预设格式的数据文件;
其中,还包括:
第一获取模块,用于在所述接收模块接收Web平台发送的至少一个域数据、以及关联关系标识信息之前,获取域配置文件,其中,域配置文件中包括各域条目信息、各路径信息、以及域条目信息与路径信息的关联关系;
第二获取模块,用于获取所述待处理的XML文件,其中,所述待处理的XML文件中包括各XML节点、以及XML节点与路径信息的关联关系;
第二确定模块,用于根据域条目信息与路径信息的关联关系、以及XML节点与路径信息的关联关系,确定域条目信息与XML节点的关联关系;
其中,所述第一获取模块,具体用于:
接收用户输入的所述各域条目信息、以及与各域条目信息对应的路径信息;
根据所述各域条目信息、以及所述与各域条目信息对应的路径信息,生成所述域配置文件;
其中,所述装置,还包括:
第三生成模块,用于在所述第二确定模块根据域条目信息与路径信息的关联关系、以及XML节点与路径信息的关联关系,确定域条目信息与XML节点的关联关系之后,根据域条目信息与XML节点的关联关系,在确定不存在与域条目信息对应的XML节点时,根据不存在对应的XML节点的域条目信息的路径信息所描述的路径,生成与该域条目信息对应的XML节点;
第二添加模块,用于将生成的XML节点添加到所述待处理的XML文件中。
6.根据权利要求5所述的装置,其特征在于,所述第二获取模块,具体用于:
将各个采用了不同标准的XML文件,转换为预设统一标准的所述待处理的XML文件。
7.根据权利要求5或6所述的装置,其特征在于,所述第一添加模块,具体用于:
根据预设模板、以及所述添加有域内容的XML文件,生成各个章节的排版结果文件;
将所述各个章节的排版结果文件,合成为一个待处理文件;
将所述待处理文件,转换为所述待出版的预设格式的数据文件。
8.根据权利要求5或6所述的装置,其特征在于,所述装置,还包括:
调节模块,用于在所述第二生成模块根据所述添加有域内容的XML文件,生成待出版的预设格式的数据文件之前,调节所述待处理的XML文件中的各XML节点的顺序,使得所述待处理的XML文件符合JATS标准。
CN201710954887.1A 2017-10-13 2017-10-13 文件的排版处理方法和装置 Expired - Fee Related CN109670160B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710954887.1A CN109670160B (zh) 2017-10-13 2017-10-13 文件的排版处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710954887.1A CN109670160B (zh) 2017-10-13 2017-10-13 文件的排版处理方法和装置

Publications (2)

Publication Number Publication Date
CN109670160A CN109670160A (zh) 2019-04-23
CN109670160B true CN109670160B (zh) 2021-04-09

Family

ID=66139676

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710954887.1A Expired - Fee Related CN109670160B (zh) 2017-10-13 2017-10-13 文件的排版处理方法和装置

Country Status (1)

Country Link
CN (1) CN109670160B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110941616B (zh) * 2019-11-26 2023-03-14 北大方正集团有限公司 出版物中关联数据生成方法、装置、设备及存储介质
CN117236282B (zh) * 2023-10-24 2024-06-21 雅昌文化(集团)有限公司 基于xml数据的智能排版方法、装置、终端及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102841887A (zh) * 2011-06-21 2012-12-26 北大方正集团有限公司 可变数据排版的方法和装置
CN105279144A (zh) * 2015-10-10 2016-01-27 中国空气动力研究与发展中心高速空气动力研究所 一种风洞试验数据文本文件的排版方法和装置
CN105446946A (zh) * 2014-07-17 2016-03-30 阿里巴巴集团控股有限公司 版式文档的重排方法、系统及电子阅读终端
CN105589842A (zh) * 2014-11-14 2016-05-18 北大方正集团有限公司 数字出版物的排版方法及装置
CN106610929A (zh) * 2015-10-26 2017-05-03 北大方正集团有限公司 数字出版的结构化内容文件的排版方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020103826A1 (en) * 2001-01-29 2002-08-01 Banta Corporation System and method for creating documents populated with variable data
US7117220B2 (en) * 2001-10-15 2006-10-03 Vanderdrift Richard William System and method for non-programmers to dynamically manage multiple sets of XML document data
CN100418086C (zh) * 2006-08-22 2008-09-10 北京北大方正电子有限公司 一种文字的可变数据排版的方法
KR101004141B1 (ko) * 2009-02-24 2010-12-27 연세대학교 산학협력단 텍스트 파일의 xsd변환과 스키마 매칭을 통한 구조계산서 검사방법
CN102567303A (zh) * 2010-12-24 2012-07-11 北京大学 一种可变公文数据的排版方法和装置
CN104424172B (zh) * 2013-09-04 2018-05-18 北大方正集团有限公司 一种排版方法、装置及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102841887A (zh) * 2011-06-21 2012-12-26 北大方正集团有限公司 可变数据排版的方法和装置
CN105446946A (zh) * 2014-07-17 2016-03-30 阿里巴巴集团控股有限公司 版式文档的重排方法、系统及电子阅读终端
CN105589842A (zh) * 2014-11-14 2016-05-18 北大方正集团有限公司 数字出版物的排版方法及装置
CN105279144A (zh) * 2015-10-10 2016-01-27 中国空气动力研究与发展中心高速空气动力研究所 一种风洞试验数据文本文件的排版方法和装置
CN106610929A (zh) * 2015-10-26 2017-05-03 北大方正集团有限公司 数字出版的结构化内容文件的排版方法和装置

Also Published As

Publication number Publication date
CN109670160A (zh) 2019-04-23

Similar Documents

Publication Publication Date Title
CN109032606B (zh) 原生应用程序的编译处理方法、装置及终端
US11853730B2 (en) Mini program data binding method and apparatus, device, and storage medium
US10791187B2 (en) Information displaying method and apparatus, and storage medium
US10909203B2 (en) Method and device for improving page display effect via execution, conversion and native layers
JP6302602B2 (ja) チケット情報ディスプレイ方法、装置、プログラムおよび記録媒体
JP2016522483A (ja) ページロールバック制御方法、ページロールバック制御装置、端末、プログラム及び記録媒体
KR20120045190A (ko) 전자책을 표시하는 모바일 단말기 및 그 방법
KR20150144264A (ko) 태그 작성 방법, 장치, 단말기, 프로그램 및 저장매체
CN111857903A (zh) 显示页面的处理方法、装置、设备以及存储介质
CN112035031B (zh) 便签生成方法、装置、电子设备和存储介质
CN109670160B (zh) 文件的排版处理方法和装置
CN104951445B (zh) 一种网页处理方法及装置
CN111310747A (zh) 信息处理方法、信息处理装置及存储介质
CN105468606B (zh) 网页保存的方法及装置
CN107179837B (zh) 输入方法及装置
CN108874758B (zh) 笔记处理方法和装置、用于笔记处理的装置
CN105808304A (zh) 代码部署方法、装置及系统
CN112256445A (zh) 基于应用程序的数据处理方法、装置、设备及存储介质
CN112269620A (zh) 显示方法及装置、电子设备和存储介质
CN111079040A (zh) 资源嗅探方法、装置、终端、服务器及存储介质
JP2014010485A (ja) 関連コンテンツ検索装置及び関連コンテンツ検索方法
CN116362206A (zh) 文件处理方法、装置、设备及介质
CN112862349B (zh) 基于abs业务数据的数据处理方法、装置和设备
CN113420531B (zh) 一种代码文本的转换方法、装置及存储介质
CN110084065B (zh) 数据脱敏方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230614

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Beijing, Haidian District, Cheng Fu Road, No. 298, Zhongguancun Fangzheng building, 9 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210409

CF01 Termination of patent right due to non-payment of annual fee