排版文件校验方法和系统
技术领域
本发明属于数字出版领域,尤其是涉及一种排版文件校验方法和系统。
背景技术
图书数字化出版因为能够显著提高工作效率、降低人工干预,有效推动图书出版印刷的新应用发展,帮助出版社解决传统生产流程的问题,已经成为主流的图书出版方式。
目前,在图书的数字化出版过程中,排版文件审校并归档的流程如下:
(1)排版人员按照出版社编辑的要求以及出版社编辑提供的素材进行图书的原始文件排版工作;
(2)排版完毕后利用第三方辅助软件将原始排版文件转化为可移植文档格式(Portable Document Format,简称PDF)文件;
(3)将PDF文件提交给编辑进行审校;
(4)编辑接收到PDF文件之后进行审校,并把审校结果反馈给排版人员;
(5)排版人员依据接收到的审校意见进行原始排版文件的修订,并再次进行PDF转换并提交给编辑进行审校;
(6)出版社编辑确认当前版本的PDF文件内容无误之后,提交该PDF文件进入签发环节;
(7)出版社具有签发权限的操作人员执行签发操作;
(8)文件签发后,排版人员手工选择或查找与签发PDF文件对应的原始排版文件,并上传给出版社进行排版文件的归档。
目前,由于出版社需要对资源进行归档以及后期可能需要对排版文件进行再次编辑,因此,出版社需要排版人员上传最终版本的排版文件。而在旧有的操作流程下,排版人员选择最终签发的PDF文件对应的排版文件进行上传,出版社人员为了确认其上传的排版文件的正确性,只能依赖人工检验的方式来识别排版人员上传的排版文件是否和最终签发的PDF文件内容一致。这样人工检验的方式,不但存在人工检查存在纰漏的问题,还严重影响了排版文件的检验处理效率。
发明内容
针对上述存在的问题,本发明提供一种排版文件校验方法和系统,用以提高排版文件的检验处理效率。
本发明提供了一种排版文件校验方法,包括:
接收排版文件和所述排版文件对应的第一PDF文件;
生成与所述第一PDF文件对应的第一校验信息;
将所述第一校验信息与预先存储的第二校验信息进行比较,所述第二校验信息为第二PDF文件对应的校验信息,所述第二PDF文件为已签发的PDF文件;
当所述第一校验信息与所述第二校验信息一致时,确定所述排版文件通过了校验,将所述排版文件归档。
具体地,所述生成与所述第一PDF文件对应的第一校验信息,包括:
生成与所述第一PDF文件对应的第一完整性校验信息;
对所述第一PDF文件逐页进行光栅化处理,获得对应的第一图片格式文件;
生成与所述第一图片格式文件中每个页面对应的第一特征码;
所述第一校验信息中包括所述第一完整性校验信息和所述每个页面对应的第一特征码。
其中,所述第二校验信息中包括与所述第二PDF文件对应的第二完整性校验信息,以及与第二图片格式文件中每个页面对应的第二特征码,所述第二图片格式文件为对所述第二PDF进行光栅化处理后的文件。
相应的,所述当所述第一校验信息与所述第二校验信息一致时,确定所述排版文件通过了校验,将所述排版文件归档,包括:
当所述第一完整性校验信息与所述第二完整性校验信息一致时,确定所述排版文件通过了校验,将所述排版文件归档;
或者,
当所述第一完整性校验信息与所述第二完整性校验信息不一致,每个第一特征码与对应的每个第二特征码一致时,确定所述排版文件通过了校验,将所述排版文件归档。
可选的,所述方法还包括:
当所述第一完整性校验信息与所述第二完整性校验信息不一致,各第一特征码中存在与对应的第二特征码不一致的差异特征码时,确定所述排版文件未通过校验,并发送错误提示信息。
可选的,所述方法还包括:
当所述第一完整性校验信息与所述第二完整性校验信息不一致,各第一特征码中存在与对应的第二特征码不一致的差异特征码时,显示所述差异特征码对应的第一页面,以及所述差异特征码对应的第二特征码所对应的第二页面;
接收用户输入的兼容性指示;
当所述兼容性指示表征所述第一页面与所述第二页面兼容时,确定所述排版文件通过了校验,将所述排版文件归档;
当所述兼容性指示表征所述第一页面与所述第二页面不兼容时,确定所述排版文件未通过校验,并发送错误提示信息。
本发明提供了一种排版文件校验系统,包括:
第一接收模块,用于接收排版文件和所述排版文件对应的第一PDF文件;
生成模块,用于生成与所述第一PDF文件对应的第一校验信息;
比较模块,用于将所述第一校验信息与预先存储的第二校验信息进行比较,所述第二校验信息为第二PDF文件对应的校验信息,所述第二PDF文件为已签发的PDF文件;
归档处理模块,用于当所述比较模块确定所述第一校验信息与所述第二校验信息一致时,确定所述排版文件通过了校验,将所述排版文件归档。
具体地,所述生成模块包括:
第一生成单元,用于生成与所述第一PDF文件对应的第一完整性校验信息;
光栅化处理单元,用于对所述第一PDF文件逐页进行光栅化处理,获得对应的第一图片格式文件;
第二生成单元,用于生成与所述第一图片格式文件中每个页面对应的第一特征码;
所述第一校验信息中包括所述第一完整性校验信息和所述每个页面对应的第一特征码。
其中,所述第二校验信息中包括与所述第二PDF文件对应的第二完整性校验信息,以及与第二图片格式文件中每个页面对应的第二特征码,所述第二图片格式文件为对所述第二PDF进行光栅化处理后的文件。
相应的,所述归档处理模块,具体用于:
当所述比较模块确定所述第一完整性校验信息与所述第二完整性校验信息一致时,确定所述排版文件通过了校验,将所述排版文件归档;
或者,
当所述比较模块确定所述第一完整性校验信息与所述第二完整性校验信息不一致,每个第一特征码与对应的每个第二特征码一致时,确定所述排版文件通过了校验,将所述排版文件归档。
可选的,该排版文件校验系统还包括:
错误提示模块,用于当所述比较模块确定所述第一完整性校验信息与所述第二完整性校验信息不一致,各第一特征码中存在与对应的第二特征码不一致的差异特征码时,确定所述排版文件未通过校验,并发送错误提示信息。
可选的,该排版文件校验系统还包括:
显示模块,用于当所述比较模块确定所述第一完整性校验信息与所述第二完整性校验信息不一致,各第一特征码中存在与对应的第二特征码不一致的差异特征码时,显示所述差异特征码对应的第一页面,以及所述差异特征码对应的第二特征码所对应的第二页面;
第二接收模块,用于接收用户输入的兼容性指示;
所述归档处理模块,还用于当所述兼容性指示表征所述第一页面与所述第二页面兼容时,确定所述排版文件通过了校验,将所述排版文件归档;
所述错误提示模块,还用于当所述兼容性指示表征所述第一页面与所述第二页面不兼容时,确定所述排版文件未通过校验,并发送错误提示信息。
本发明提供的排版文件校验方法和系统,当排版文件校验系统接收到排版人员上传的排版文件和排版文件对应的第一PDF文件后,首先生成与第一PDF文件对应的第一校验信息,进而将该第一校验信息与预先存储的已签发的第二PDF文件的第二校验信息进行比较,当第一校验信息与第二校验信息一致时,确定第一PDF文件对应的排版文件通过了校验,将该排版文件归档。在上传排版文件时,一并上传对应的PDF文件,从而可以基于文件格式的一致性,将上传的PDF文件的校验信息与已签发的PDF文件的校验信息进行自动比较,实现了对上传的PDF文件对应的排版文件的自动校验,提高了排版文件的校验处理效率。
附图说明
图1为本发明排版文件校验方法实施例一的流程图;
图2为本发明排版文件校验方法实施例二的流程图;
图3为本发明排版文件校验方法实施例三的流程图;
图4为本发明排版文件校验系统实施例一的结构示意图;
图5为本发明排版文件校验系统实施例二的结构示意图;
图6为本发明排版文件校验系统实施例三的结构示意图。
具体实施方式
图1为本发明排版文件校验方法实施例一的流程图,如图1所示,该方法包括如下步骤:
步骤101、接收排版文件和排版文件对应的第一PDF文件。
步骤102、生成与第一PDF文件对应的第一校验信息。
步骤103、将第一校验信息与预先存储的第二校验信息进行比较,第二校验信息为第二PDF文件对应的校验信息,第二PDF文件为已签发的PDF文件。
步骤104、当第一校验信息与第二校验信息一致时,确定排版文件通过了校验,将排版文件归档。
本实施例中,排版人员上传排版文件和对应的第一PDF文件的时机,与现有技术中相似,简单说明如下:
排版人员对排版素材比如文档、图片等进行排版后,获得原始排版文件,进而使用第三方辅助工具将原始排版文件转化为PDF文件,进而将该PDF文件上传至排版文件校验系统。排版文件校验系统对该PDF文件进行审校,如果审校通过还进行内容签发;如果审校不通过则提示排版人员重新对原始排版文件进行修改,并重新上传修改后排版文件对应的PDF文件,再对重新上传的PDF文件进行审校。
对于审校通过的PDF文件进行签发后,则提醒排版人员上传排版文件,该排版文件是指与签发的PDF文件对应的排版文件。
为了描述方便,也为了避免混淆,本实施例中,将审校通过并已签发的PDF文件称为第二PDF文件。并且假设排版人员先后排版生成了两个排版文件,分别称为排版文件1和排版文件2,其中,第二PDF文件与排版文件2对应,即对排版文件2进行转换得到的第二PDF文件最终通过了审校,并被签发。
因此,排版文件校验系统提醒排版人员上传排版文件时,正确情况下,排版人员应该上传的是排版文件2。但是在实际操作中,排版人员既可能上传的是排版文件2,也可能选择错误,上传了排版文件1。
因此,为了校验排版人员上传的排版文件是否正确,即是否与签发的第二PDF文件对应,可以采用本实施例提供的排版文件校验方法进行处理。
具体来说,上述步骤101中排版文件校验系统接收到的排版文件为排版人员上传的排版文件,该排版文件可能是排版文件1,也可能是排版文件2,以是排版文件2为例进行说明。
排版人员除了上传排版文件2外,还对排版文件2进行转换,转换为PDF文件,称为第一PDF文件,将排版文件2和第一PDF文件一起打包上传。
值得说明的是,虽然上述第一PDF文件和第二PDF文件都是基于排版文件2转换得到的,但是转换的时机不同,具体参见前面的描述,而且,第二PDF文件是处于已签发状态的文件。
当排版文件校验系统接收到该排版文件2和第一PDF文件后,首先生成与第一PDF文件对应的第一校验信息,其中,该第一校验信息可以是完整性校验信息。进而,将第一校验信息与预先存储的第二PDF文件对应的第二校验信息进行比较,当第一校验信息与第二校验信息一致时,确定排版文件2通过了校验,将排版文件2归档。
值得说明的是,第二PDF文件对应的第二校验信息的生成时机,可以是在排版文件校验系统接收到第二PDF文件时便生成的,也可以是在第二PDF文件通过审校后生成的。该第二校验信息的含义与第一校验信息的含义一致,比如都为完整性校验信息。
由于第一校验信息与第二校验信息分别是根据第一PDF文件和第二PDF文件的相同类型因素,比如布局格式、字体大小等生成的,因此,当这两个校验信息一致时,可以认为第一PDF文件和第二PDF文件相同,并且,第一PDF文件是根据排版文件2转换得到的,因此随第一PDF文件一并上传的排版文件2为与已签发的第二PDF文件对应的排版文件,进行归档处理。
本实施例中,当排版文件校验系统接收到排版人员上传的排版文件和排版文件对应的第一PDF文件后,首先生成与第一PDF文件对应的第一校验信息,进而将该第一校验信息与预先存储的已签发的第二PDF文件的第二校验信息进行比较,当第一校验信息与第二校验信息一致时,确定第一PDF文件对应的排版文件通过了校验,将该排版文件归档。在上传排版文件时,一并上传对应的PDF文件,从而可以基于文件格式的一致性,将上传的PDF文件的校验信息与已签发的PDF文件的校验信息进行自动比较,从而实现了对上传的PDF文件对应的排版文件的自动校验,提高了排版文件的校验处理效率。
图2为本发明排版文件校验方法实施例二的流程图,如图2所示,该方法包括如下步骤:
步骤201、接收排版文件和排版文件对应的第一PDF文件。
步骤202、生成与第一PDF文件对应的第一完整性校验信息。
步骤203、对第一PDF文件逐页进行光栅化处理,获得对应的第一图片格式文件。
步骤204、生成与第一图片格式文件中每个页面对应的第一特征码。
上述步骤202至步骤204是对图1所示实施例中步骤102的一种可选实现方式的具体说明,也就是说,第一校验信息中包括第一完整性校验信息和上述第一图片格式文件中每个页面对应的第一特征码。
具体来说,可以根据第一PDF文件中的布局、字体大小、字体类型的因素生成对应的第一完整性校验信息。
另外,再对第一PDF文件进行光栅化处理,以页面为单位进行,每一个页面生成一个固定分辨率的图片格式文件比如JPG文件,并计算每个页面的第一特征码。其中,针对一个页面来说,可以将该页面划分为多个区域,根据每个区域的内容生成对应的第一特征码,从而每个页面可以获得多个不同的特征码,以第一个页面为例,假设第一个页面对应的第一特征码为M1001,M1002。
可以理解的是,对于已经签发的第二PDF文件,其在上传至排版文件校验系统时,或者在通过审校时,也可以进行相同的校验信息生成处理过程。从而,上述第二校验信息中包括与第二PDF文件对应的第二完整性校验信息,以及与第二图片格式文件中每个页面对应的第二特征码,第二图片格式文件为对第二PDF进行光栅化处理后的文件。
仍以前述排版文件1、排版文件2的举例进行说明,当生成了上述第一校验信息后,可以采用如下的步骤205至步骤207的排版文件校验过程进行排版文件2是否是与第二PDF文件对应的排版文件的判定处理。值得说明的是,步骤205至步骤207之间没有顺序限定关系,是并列的关系。
步骤205、当第一完整性校验信息与第二完整性校验信息一致时,确定排版文件通过了校验,将排版文件归档。
步骤206、当第一完整性校验信息与第二完整性校验信息不一致,每个第一特征码与对应的每个第二特征码一致时,确定排版文件通过了校验,将排版文件归档。
本实施例中,当满足如下两个条件中的任一个条件时,可以判定排版文件2是与第二PDF文件对应的排版文件:
其一是:第一完整性校验信息与第二完整性校验信息一致。由于这两个完整性校验信息是分别根据对应的PDF文件生成的,因此当这两个完整性校验信息一致时,可以认为第一PDF文件与第二PDF文件相同,从而确定排版文件2是与第二PDF文件对应的排版文件,进行归档。
其二是:第一完整性校验信息与第二完整性校验信息不一致,但是每个第一特征码与对应的每个第二特征码一致。实际应用中,可能由于PDF文件转换过程中的误差、转换软件的不足等原因,使得即使是基于相同的排版文件2转换得到的第一PDF文件与第二PDF文件,也可能出现细微差别。而当因为该细微差别导致上述两个完整性校验信息不相同时,如果此时便认定排版文件2不通过校验,显然是错误的。因此此时,还需要结合两个PDF文件的各页面的特征码进行判定,如果两个PDF文件的各对应页面的特征码都一致,也确定排版文件2是与第二PDF文件对应的排版文件,进行归档。
步骤207、当第一完整性校验信息与第二完整性校验信息不一致,各第一特征码中存在与对应的第二特征码不一致的差异特征码时,确定排版文件未通过校验,并发送错误提示信息。
与上述第二个校验通过的条件相对的,当第一完整性校验信息与第二完整性校验信息不一致,并且第一PDF文件的各第一特征码中存在与第二PDF文件中对应页面的第二特征码不一致的差异特征码时,确定排版文件未通过校验,并发送错误提示信息。比如,第一PDF文件的第一个页面对应的两个特征码M1001,M1002,与第二PDF文件的第一个页面对应的两个特征码M2001,M2002不同,此时确定排版文件2未通过校验,并发送错误提示信息,以提示排版人员重新上传排版文件。
本实施例中,在上传排版文件时,一并上传对应的PDF文件,通过生成上传的PDF文件对应的完整性校验信息和页面特征码,以这两个具体的校验信息与已签发的PDF文件的相应校验信息进行比较,实现了对上传的PDF文件对应的排版文件的自动校验,提高了排版文件的校验处理效率的同时,也保证了排版文件的校验结果的准确可靠。
图3为本发明排版文件校验方法实施例三的流程图,如图3所示,在图2所示实施例的基础上,可选的,步骤204之后,还可以包括如下步骤:
步骤301、当第一完整性校验信息与第二完整性校验信息不一致,各第一特征码中存在与对应的第二特征码不一致的差异特征码时,显示差异特征码对应的第一页面,以及差异特征码对应的第二特征码所对应的第二页面。
步骤302、接收用户输入的兼容性指示。
步骤303、当兼容性指示表征第一页面与第二页面兼容时,确定排版文件通过了校验,将排版文件归档。
步骤304、当兼容性指示表征第一页面与第二页面不兼容时,确定排版文件未通过校验,并发送错误提示信息。
本实施例中,针对实际应用中可能出现的一种情况进行排版文件校验过程的补充说明。
具体来说,由于PDF文件转换过程中,或者PDF文件光栅化处理过程中的意外情况,可能出现第一PDF文件对应的第一图片格式文件的某个页面比如P11,与第二PDF文件对应的第二图片格式文件的对应页面比如P21来说,这两个页面的特征码可能因为其中某个页面相对于两一个页面多出一个空格而不同,此时如果认定排版文件2不是与第二PDF文件对应的排版文件,显然也是不对的。
因此,对于该情况,可以将存在差异的两个页面显示出来,辅助以人工鉴别的方式,由人工判定两个页面是否可以兼容,比如仅是一个空格的细微差异,且不影响页面的整体、段落等布局,则认为两个页面是兼容的,相反的,则认为两个页面是不兼容的。从而,根据判定结果,分别向排版文件校验系统输入相应的兼容指示。
那么,当兼容性指示表征这两个页面兼容时,确定排版文2通过了校验,将排版文件2归档。当兼容性指示表征这两个页面不兼容时,确定排版文件2未通过校验,并发送错误提示信息。
本实施例中,在对排版文件校验的过程中,进一步辅助以上述差异页面的兼容性判定方式,可以进一步提高排版文件校验结果的准确性。
图4为本发明排版文件校验系统实施例一的结构示意图,如图4所示,该排版文件校验系统包括:第一接收模块11、生成模块12、比较模块13、归档处理模块14。
第一接收模块11,用于接收排版文件和所述排版文件对应的第一PDF文件
生成模块12,用于生成与所述第一PDF文件对应的第一校验信息
比较模块13,用于将所述第一校验信息与预先存储的第二校验信息进行比较,所述第二校验信息为第二PDF文件对应的校验信息,所述第二PDF文件为已签发的PDF文件
归档处理模块14,用于当所述比较模块13确定所述第一校验信息与所述第二校验信息一致时,确定所述排版文件通过了校验,将所述排版文件归档。
本实施例的排版文件校验系统可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图5为本发明排版文件校验系统实施例二的结构示意图,如图5所示,在图6所示实施例的基础上,所述生成模块12包括:第一生成单元121、光栅化处理单元122、第二生成单元123。
第一生成单元121,用于生成与所述第一PDF文件对应的第一完整性校验信息。
光栅化处理单元122,用于对所述第一PDF文件逐页进行光栅化处理,获得对应的第一图片格式文件。
第二生成单元123,用于生成与所述第一图片格式文件中每个页面对应的第一特征码。
其中,所述第一校验信息中包括所述第一完整性校验信息和所述每个页面对应的第一特征码。
其中,所述第二校验信息中包括与所述第二PDF文件对应的第二完整性校验信息,以及与第二图片格式文件中每个页面对应的第二特征码,所述第二图片格式文件为对所述第二PDF进行光栅化处理后的文件。
具体地,所述归档处理模块14,具体用于:
当所述比较模块13确定所述第一完整性校验信息与所述第二完整性校验信息一致时,确定所述排版文件通过了校验,将所述排版文件归档;
或者,
当所述比较模块13确定所述第一完整性校验信息与所述第二完整性校验信息不一致,每个第一特征码与对应的每个第二特征码一致时,确定所述排版文件通过了校验,将所述排版文件归档。
可选的,该排版文件校验系统还包括:错误提示模块21。
错误提示模块21,用于当所述比较模块13确定所述第一完整性校验信息与所述第二完整性校验信息不一致,各第一特征码中存在与对应的第二特征码不一致的差异特征码时,确定所述排版文件未通过校验,并发送错误提示信息。
本实施例的排版文件校验系统可以用于执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图6为本发明排版文件校验系统实施例二的结构示意图,如图6所示,在图5所示实施例的基础上,该排版文件校验系统还包括:显示模块31、第二接收模块32。
显示模块31,用于当所述比较模块13确定所述第一完整性校验信息与所述第二完整性校验信息不一致,各第一特征码中存在与对应的第二特征码不一致的差异特征码时,显示所述差异特征码对应的第一页面,以及所述差异特征码对应的第二特征码所对应的第二页面。
第二接收模块32,用于接收用户输入的兼容性指示。
所述归档处理模块14,还用于当所述兼容性指示表征所述第一页面与所述第二页面兼容时,确定所述排版文件通过了校验,将所述排版文件归档。
所述错误提示模块21,还用于当所述兼容性指示表征所述第一页面与所述第二页面不兼容时,确定所述排版文件未通过校验,并发送错误提示信息。
本实施例的排版文件校验系统可以用于执行图3所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。