一种基于网页的排版文件校对方法及设备
技术领域
本发明涉及出版物内容制作领域,具体涉及一种基于网页的排版文件校对方法及设备。
背景技术
当今的出版已经是数字出版和印刷出版并存的时代。无论是数字出版还是印刷出版,都需要有内容制作和内容校对的环节。特别是文字编辑员对排版后的版面进行文字校对是一个非常重要的环节。当前文字编辑员进行校对主要有两种方式:方法一是打印出纸稿,由文字编辑员在纸稿上进行校对;方法二是将文件输出为PDF格式,由文字编辑员在Acrobat Reader上进行校对。方法一符合文字编辑员的习惯,操作简单,缺点是浪费纸张、需要排版员将修改的内容增加到排版文件中;方法二不会浪费纸张,但是文字编辑员的操作会比较复杂,而且也需要排版员将修改的内容增加到排版文件中。文字编辑员直接基于排版文件进行内容校对可以克服以上两个缺点,但是由于排版软件的安装和使用较为复杂,这种方法极少采用。
发明内容
本发明的目的在于如何提供一种排版文件校对方法及设备,以克服现有技术在校对排版文件时浪费纸张、操作复杂的缺陷。
为此目的,第一方面,本发明提出一种基于网页的排版文件校对方法,包括:
在接收到携带有文字编辑员信息的查找请求后,基于预先存储的拆分信息,从预先存储的各子排版文件中查找与所述文字编辑员对应的目标子排版文件;
基于所述目标子排版文件,生成目标网页,并将所述目标网页发送到发出所述查找请求的终端;
在接收到携带有校对信息的校对请求后,根据所述校对信息,修改与所述校对信息对应的子排版文件,得到修改后的子排版文件;
其中,所述拆分信息包括各子排版文件与文字编辑员的对应信息及各子排版文件的拆分顺序信息。
可选的,所述在接收到携带有文字编辑员信息的查找请求后,从预先存储的各子排版文件中查找与所述文字编辑员对应的目标子排版文件之前,所述方法还包括:
在接收到携带有排版文件以及拆分信息的网页数据包后,根据所述拆分信息,对所述排版文件进行拆分,得到与文字编辑员对应的子排版文件;
存储各子排版文件以及所述拆分信息,得到预先存储的各子排版文件以及预先存储的拆分信息。
可选的,所述基于所述目标子排版文件,生成目标网页,包括:
对所述目标子排版文件中各页进行预览图生成,得到各页对应的预览图;
识别所述目标子排版文件中各页的文字区域;
基于所述目标子排版文件中各页的文字区域,对各预览图设置热区,得到各预览图中与文字区域对应的热区;
基于所述各页对应的预览图、所述各预览图中与文字区域对应的热区以及预先存储的校对控件,生成目标网页。
可选的,所述基于所述目标子排版文件中各页的文字区域,对各预览图设置热区,得到各预览图中与文字区域对应的热区之后,所述方法还包括:
将各页的文字区域与热区的对应关系存储在可扩展标记语言XML文件中。
可选的,所述在接收到携带有校对信息的校对请求后,根据所述校对信息,修改与所述校对信息对应的子排版文件,得到修改后的子排版文件之前,所述方法还包括:
在接收到携带有第一目标热区信息以及对话框信息的修改请求后,基于所述XML文件中存储的各页的文字区域与热区的对应关系,确定所述第一目标热区对应的第一目标文字区域;
从所述第一目标文字区域中提取文本内容,并将提取到的文本内容填充到所述对话框中;
将填充后的对话框信息发送到发出所述修改请求的终端,以使终端在所述对话框中显示所述提取到的文本内容。
可选的,所述在接收到携带有校对信息的校对请求后,根据所述校对信息,修改与所述校对信息对应的子排版文件,得到修改后的子排版文件,包括:
在接收到携带有校对信息以及所述校对信息与第二目标热区的对应信息的校对请求后,提取与所述校对信息对应的第二目标热区;
基于所述XML文件中存储的各页的文字区域与热区的对应关系,确定所述第二目标热区对应的第二目标文字区域;
将所述校对信息更新到所述第二目标文字区域中,得到修改后的子排版文件。
可选的,所述方法还包括:
在接收到携带有排版员信息的打开请求后,基于修改后的子排版文件和预先存储的拆分信息,将各子排版文件合并为排版文件;
将所述排版文件发送到发出所述打开请求的终端。
第二方面,本发明还提出一种基于网页的排版文件校对设备,包括:
查找单元,用于在接收到携带有文字编辑员信息的查找请求后,基于预先存储的拆分信息,从预先存储的各子排版文件中查找与所述文字编辑员对应的目标子排版文件;
处理单元,用于基于所述目标子排版文件,生成目标网页,并将所述目标网页发送到发出所述查找请求的终端;
修改单元,用于在接收到携带有校对信息的校对请求后,根据所述校对信息,修改与所述校对信息对应的子排版文件,得到修改后的子排版文件;
其中,所述拆分信息包括各子排版文件与文字编辑员的对应信息及各子排版文件的拆分顺序信息。
可选的,所述设备还包括:
拆分单元,用于在接收到携带有排版文件以及拆分信息的网页数据包后,根据所述拆分信息,对所述排版文件进行拆分,得到与文字编辑员对应的子排版文件;
存储单元,用于存储拆分单元得到的各子排版文件以及所述拆分信息,得到预先存储的各子排版文件以及预先存储的拆分信息。
可选的,所述处理单元,用于对所述目标子排版文件中各页进行预览图生成,得到各页对应的预览图;识别所述目标子排版文件中各页的文字区域;基于所述目标子排版文件中各页的文字区域,对各预览图设置热区,得到各预览图中与文字区域对应的热区;基于所述各页对应的预览图、所述各预览图中与文字区域对应的热区以及预先存储的校对控件,生成目标网页。
相比于现有技术,本发明的基于网页的排版文件校对方法及设备,通过网页呈现排版文件并可使文字编辑员直接在网页上对排版文件进行校对,能够方便的实现多个文字编辑员与排版员的协同作业,克服现有技术在校对排版文件时浪费纸张、操作复杂的缺陷。
附图说明
图1为本发明实施例提供的一种基于网页的排版文件校对方法流程图;
图2为本发明实施例提供的一种基于网页的排版文件校对设备结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下对本公开实施例中提及的部分词语进行举例说明。
本领域技术人员应当理解,本公开实施例中提及的终端是指安装浏览器的任何终端,可以包括任何类型的用户设备,诸如计算机、手持式计算机、个人数字助理PDA、网络家电、智能电话或者这些数据处理设备或其他数据处理设备中的任何两个或多个的组合。
本领域技术人员应当理解,本公开实施例中提及的基于网页的排版文件校对方法的执行主体、基于网页的排版文件校对设备均可以为服务器,服务器既可以代表如计算机服务器的单个服务器,也可以代表一起工作以执行功能的多个服务器,例如云服务器hadoop。
本领域技术人员应当理解,本公开实施例中“第一”“第二”仅用来区分名称相同实体或操作,而不是暗示这些实体或操作之间的顺序或关系。
如图1所示,本实施例公开一种基于网页的排版文件校对方法,该方法可包括以下步骤101至103:
101、在接收到携带有文字编辑员信息的查找请求后,基于预先存储的拆分信息,从预先存储的各子排版文件中查找与所述文字编辑员对应的目标子排版文件。
本实施例中,拆分信息包括各子排版文件与文字编辑员的对应信息及各子排版文件的拆分顺序信息。
本实施例中,可由排版员在排版软件中将排版文件导出为一个用于在浏览器上呈现、校对的网页数据包,并将网页数据包发布到服务器。其中,网页数据包中携带有拆分信息,以使服务器在接收到网页数据包后,根据拆分信息,拆分排版文件。
102、基于所述目标子排版文件,生成目标网页,并将所述目标网页发送到发出所述查找请求的终端。
本实施例中,文字编辑员可通过安装在终端上的浏览器打开排版员分配给自己的待校对的拆分后的排版文件,拆分后的排版文件即子排版文件。
103、在接收到携带有校对信息的校对请求后,根据所述校对信息,修改与所述校对信息对应的子排版文件,得到修改后的子排版文件。
本实施例中,文字编辑员可通过目标网页对目标子排版文件进行校对,在校对完成后,可向服务器发送携带有校对信息的校对请求。
上述基于网页的排版文件校对方法,通过网页呈现排版文件并可使文字编辑员直接在网页上对排版文件进行校对,能够方便的实现多个文字编辑员与排版员的协同作业,克服现有技术在校对排版文件时浪费纸张、操作复杂的缺陷。
进一步地,在步骤103中,上述方法可将修改后的子排版文件的版面效果进行更新,文字编辑员可在其终端上看到更新后的版面内容。
在一个具体的例子中,在步骤101之前,上述方法还可包括图1中未示出的步骤100’和100”:
100’、在接收到携带有排版文件以及拆分信息的网页数据包后,根据所述拆分信息,对所述排版文件进行拆分,得到与文字编辑员对应的子排版文件。
100”、存储各子排版文件以及所述拆分信息,得到预先存储的各子排版文件以及预先存储的拆分信息。
在一个具体的例子中,步骤102中“基于所述目标子排版文件,生成目标网页”,具体可包括以下图1中未示出的步骤1021至1024:
1021、对所述目标子排版文件中各页进行预览图生成,得到各页对应的预览图。
1022、识别所述目标子排版文件中各页的文字区域。
1023、基于所述目标子排版文件中各页的文字区域,对各预览图设置热区,得到各预览图中与文字区域对应的热区。
本实施例中,热区是覆盖在预览图上的空文字块,一个热区与排版文件中的一个真实文字块相对应。
1024、基于所述各页对应的预览图、所述各预览图中与文字区域对应的热区以及预先存储的校对控件,生成目标网页。
上述基于网页的排版文件校对方法,采用预览图+热区方案,绕过了在网页上直接编辑内容这一技术难点。
在一个具体的例子中,网页数据包携带有可扩展标记语言(Extensible MarkupLanguage,XML)文件;相应地,步骤1023之后,进一步地,将各页的文字区域与热区的对应关系存储在所述XML文件中。
在一个具体的例子中,步骤103:“在接收到携带有校对信息的校对请求后,根据所述校对信息,修改与所述校对信息对应的子排版文件,得到修改后的子排版文件”之前,上述方法还可包括图1中未示出的步骤1031至1033:
1031、在接收到携带有第一目标热区信息以及对话框信息的修改请求后,基于所述XML文件中存储的各页的文字区域与热区的对应关系,确定所述第一目标热区对应的第一目标文字区域;
1032、从所述第一目标文字区域中提取文本内容,并将提取到的文本内容填充到所述对话框中;本实施例中,可通过排版文件操作接口从第一目标文字区域中提取文本内容;
1033、将填充后的对话框信息发送到发出所述修改请求的终端,以使终端在所述对话框中显示所述提取到的文本内容。
本实施例中,文字编辑员可通过目标网页中的校对控件执行校对,例如:选中需要修改内容的热区,点击网页上的“改内容”按钮,校对控件将弹出一个对话框,相应地,服务器则执行步骤1031至1033,从而使对话框中呈现了热区中现有的文字内容,文字编辑员在对话框中对文字进行修改,修改完毕后,点击确定,网页将发生改变。
在一个具体的例子中,步骤103:“在接收到携带有校对信息的校对请求后,根据所述校对信息,修改与所述校对信息对应的子排版文件,得到修改后的子排版文件”,具体可包括图1中未示出的步骤1031’至1033’:
1031’、在接收到携带有校对信息以及所述校对信息与第二目标热区的对应信息的校对请求后,提取与所述校对信息对应的第二目标热区;
1032’、基于XML文件中存储的各页的文字区域与热区的对应关系,确定所述第二目标热区对应的第二目标文字区域;
1033’、将所述校对信息更新到所述第二目标文字区域中,得到修改后的子排版文件,本实施例中,可通过排版文件操作接口将新的文字内容(即校对信息)更新到第二目标文字区域中。
本实施例中,若文字编辑员在对话框中对文字修改完毕后,点击“确定”按钮,服务器将执行1031’至1033’。
在本实施例中,步骤1033’可能引发与该文字区域相邻的文字区域的文字内容的重排。服务器会调用重排功能,对所述相邻的文字区域的文字内容进行重排。
在步骤1033’后,服务器端会重新生成新的排版文件的每页预览图,重新生成热区,从而实现对网页的一次更新。
在一个具体的例子中,上述方法还可包括图1中未示出的步骤104和105:
104、在接收到携带有排版员信息的打开请求后,基于修改后的子排版文件和预先存储的拆分信息,将各子排版文件合并为排版文件。
105、将所述排版文件发送到发出所述打开请求的终端。
本实施例中,排版员发送打开请求后,服务器将按照拆分时的顺序(该顺序记录在XML文件中)将子文件合并为一个整体文件。由于文字编辑员校对时版面的调整是通过服务器自动完成的,并且文字编辑员对版面中文字块、图片块的位置并不进行主动干预。因此可能存在版面布局不合理的地方,排版员可根据实际情况进行微调。
进一步,排版员在进行排版的时候会使用专业的排版软件。服务器可将该排版软件进行引擎化、后台化、并通过API提供对外操作的接口。服务器以WebService方式提供对外服务,包括热区文字内容的提取、热区内容的更新、文件重排、排版文件的拆分与合并。
上述基于网页的排版文件校对方法,使得文字编辑员通过网页浏览器即可以打开排版内容并进行修改,大大降低了文字编辑员安装、使用专业软件的复杂度,节约了软件成本。
进一步地,由于文字编辑员的主要任务是文字内容的修改,上述基于网页的排版文件校对方法,比较符合编辑工作的定位,同时也降低了文字编辑员使用及系统开发的复杂度;
进一步地,上述基于网页的排版文件校对方法,支持协同工作模式,排版员负责分配、统筹工作,文字编辑员完成各自的校对任务。
如图2所示,本实施例公开一种基于网页的排版文件校对设备,该设备可包括:查找单元21、处理单元22和修改单元23。
查找单元21,用于在接收到携带有文字编辑员信息的查找请求后,基于预先存储的拆分信息,从预先存储的各子排版文件中查找与所述文字编辑员对应的目标子排版文件;
处理单元22,用于基于所述目标子排版文件,生成目标网页,并将所述目标网页发送到发出所述查找请求的终端;
修改单元23,用于在接收到携带有校对信息的校对请求后,根据所述校对信息,修改与所述校对信息对应的子排版文件,得到修改后的子排版文件。
本实施例中,拆分信息包括各子排版文件与文字编辑员的对应信息及各子排版文件的拆分顺序信息。
在一个具体的例子中,所述设备还包括图2中未示出的以下单元:拆分单元24和存储单元25。
拆分单元24,用于在接收到携带有排版文件以及拆分信息的网页数据包后,根据所述拆分信息,对所述排版文件进行拆分,得到与文字编辑员对应的子排版文件;
存储单元25,用于存储拆分单元得到的各子排版文件以及所述拆分信息,得到预先存储的各子排版文件以及预先存储的拆分信息。
在一个具体的例子中,所述处理单元22,用于对所述目标子排版文件中各页进行预览图生成,得到各页对应的预览图;识别所述目标子排版文件中各页的文字区域;基于所述目标子排版文件中各页的文字区域,对各预览图设置热区,得到各预览图中与文字区域对应的热区;基于所述各页对应的预览图、所述各预览图中与文字区域对应的热区以及预先存储的校对控件,生成目标网页。
在一个具体的例子中,所述处理单元22,还用于将各页的文字区域与热区的对应关系存储在可扩展标记语言XML文件中。
在一个具体的例子中,所述设备还可包括图2中未示出的第二处理单元26,用于在接收到携带有第一目标热区信息以及对话框信息的修改请求后,基于所述XML文件中存储的各页的文字区域与热区的对应关系,确定所述第一目标热区对应的第一目标文字区域;从所述第一目标文字区域中提取文本内容,并将提取到的文本内容填充到所述对话框中;将填充后的对话框信息发送到发出所述修改请求的终端,以使终端在所述对话框中显示所述提取到的文本内容。
在一个具体的例子中,所述修改单元23,用于在接收到携带有校对信息以及所述校对信息与第二目标热区的对应信息的校对请求后,提取与所述校对信息对应的第二目标热区;基于所述XML文件中存储的各页的文字区域与热区的对应关系,确定所述第二目标热区对应的第二目标文字区域;将所述校对信息更新到所述第二目标文字区域中,得到修改后的子排版文件。
在一个具体的例子中,所述设备还可包括图2中未示出的第三处理单元27,用于在接收到携带有排版员信息的打开请求后,基于修改后的子排版文件和预先存储的拆分信息,将各子排版文件合并为排版文件;将所述排版文件发送到发出所述打开请求的终端。
本实施例的基于网页的排版文件校对设备,可以用于执行上述图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
上述基于网页的排版文件校对设备,使得文字编辑员通过网页浏览器即可以打开排版内容并进行修改,大大降低了文字编辑员安装、使用专业软件的复杂度,节约了软件成本。
进一步地,由于文字编辑员的主要任务是文字内容的修改,上述基于网页的排版文件校对设备,比较符合编辑工作的定位,同时也降低了文字编辑员使用及系统开发的复杂度;
进一步地,上述基于网页的排版文件校对设备,支持协同工作模式,排版员负责分配、统筹工作,文字编辑员完成各自的校对任务;
进一步地,上述基于网页的排版文件校对设备,采用预览图+热区方案,绕过了在网页上直接编辑内容这一技术难点。
本领域技术人员可以理解,可以对实施例中的设备中的单元进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的单元组合成一个单元,以及此外可以把它们分成多个子单元。除了这样的特征和/或过程或者单元中的至少一些是互相排斥之处,可以采用任何组合对本说明书中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一种浏览器终端的设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。