发明内容
本发明的实施例提供一种页面校对的方法和装置,能够提高文档页面的对比效率,还可以用正确的文档页面来替换错误的文档页面。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,提供一种页面校对的方法,包括:
将修改前文档拆分为至少一个修改前单页文档文件,将修改后文档拆分为至少一个修改后单页文档文件,每个所述修改前单页文档文件包括:修改前单页文档和对应的预览图,每个所述修改后单页文档文件包含:修改后单页文档和对应的预览图;
在第一页面中添加至少一个所述修改前单页文档,在第二页面中添加至少一个所述修改后单页文档;
设置所述第一页面中每个所述修改前单页文档与所述第二页面中每个所述修改后单页文档之间的关联关系;
按照像素要素对比所有所述第一页面与所述第二页面之间有关联关系的所述修改前单页文档和所述修改后单页文档的预览图,所述像素要素包括像素值和像素点的灰度值;
当所述修改前单页文档与所述修改后单页文档中存在不同部分时,以标记所述不同部分的形式显示对比结果。
在第一种可能的实现方式中,根据第一方面,所述方法还包括:当对比结果为所述修改前单页文档与所述修改后单页文档中存在不同部分时,将所述修改后单页文档替换所述修改前单页文档。
在第二种可能的实现方式中,结合第一方面或第一种可能的实现方式,所述设置所述第一页面中每个所述修改前单页文档与所述第二页面中每个所述修改后单页文档之间的关联关系,包括:
将添加至少一个所述修改前单页文档至所述第一页面的顺序与添加至少一个所述修改后单页文档至所述第二页面的顺序相关联,并设置所述第一页面中每个所述修改前单页文档与所述第二页面中每个所述修改后单页文档之间的关联关系;
或者,
将所述第一页面中的至少一个所述修改前单页文档和所述第二页面中的至少一个所述修改后单页文档进行排序;
将移动后至少一个的所述修改前单页文档在所述第一页面中的顺序和移动后的至少一个的所述修改后单页文档在所述第二页面中的顺序相关联,并设置所述第一页面中每个所述修改前单页文档与所述第二页面中每个所述修改后单页文档之间的关联关系。
在第三种可能的实现方式中,结合第一方面或第一种可能的实现方式,所述按照像素要素对比所有所述第一页面与所述第二页面之间有具有关联关系的所述修改前单页文档和所述修改后单页文档的预览图,包括:
在按照所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图中确定对比区域;
将所述修改前单页文档和所述修改后单页文档的预览图中的对比区域以阵列的形式分割成相同大小的区域块;
对比分别属于所述修改前单页文档和所述修改后单页文档的相同位置处的区域块中的每个像素点的灰度值,并记录所述出现像素点的灰度值不同的区域块。
在第四种可能的实现方式中,根据第三种可能的实现方式,所述在按照所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图中确定对比区域,包括:
对比按照所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图的像素值的大小;
若所述修改前单页文档和所述修改后单页文档的预览图的像素值相同,则设置所述修改前单页文档和所述修改后单页文档的预览图的全部区域为所述对比区域;
若所述修改前单页文档和所述修改后单页文档的预览图的像素值不相同,则将像素值小的预览图的全部区域和所述像素值大的预览图中对应所述像素值小的预览图的像素坐标的区域设置为所述对比区域。
在第五种可能的实现方式中,根据第三种可能的实现方式,所述将所述修改前单页文档和所述修改后单页文档的预览图中的对比区域按照阵列形式分割成大小相同的区域块,包括:
将所述修改前单页文档和所述修改后单页文档的预览图中的对比区域长度方向的一个侧边和/或宽度方向的一个侧边增加预设宽度的空白像素区域,形成新的对比区域;
将所述新的对比区域按照阵列形式分割成大小相同的区域块。
第二方面,提供一种页面校对的装置,包括:
拆分单元,用于将修改前文档拆分为至少一个修改前单页文档文件,将修改后文档拆分为至少一个修改后单页文档文件,每个所述修改前单页文档文件包括:修改前单页文档和对应的预览图,每个所述修改后单页文档文件包含:修改后单页文档和对应的预览图;
存储单元,用于在第一页面中添加所述拆分单元拆分的至少一个所述修改前单页文档,在第二页面中添加所述拆分单元拆分的至少一个所述修改后单页文档;
关联单元,用于设置所述存储单元存储在所述第一页面中每个所述修改前单页文档与所述存储单元存储在所述第二页面中每个所述修改后单页文档之间的关联关系;
对比单元,用于按照像素要素对比所有所述第一页面与所述第二页面之间有所述关联单元设置的关联关系的所述修改前单页文档和所述修改后单页文档的预览图,所述像素要素包括像素值和像素点的灰度值;
显示单元,用于当所述对比单元对比所述修改前单页文档与所述修改后单页文档的对比结果存在不同部分时,以标记所述不同部分的形式显示对比结果。
在第一种可能的实现方式中,根据第二方面,所述装置还包括:
替换单元,用于当所述对比单元的所述对比结果为所述修改前单页文档与所述修改后单页文档中存在不同部分时,将所述修改后单页文档替换所述修改前单页文档。
在第二种可能的实现方式中,结合第二方面或第一种可能的实现方式,所述关联单元具体用于:将所述存储单元添加至少一个所述修改前单页文档至所述第一页面的顺序与所述存储单元添加至少一个所述修改后单页文档至所述第二页面的顺序相关联,并设置所述存储单元存储在所述第一页面中每个所述修改前单页文档与所述存储单元存储在所述第二页面中每个所述修改后单页文档之间的关联关系;
或者,
用于将所述存储单元存储在所述第一页面中的至少一个所述修改前单页文档和所述存储单元存储在所述第二页面中的至少一个所述修改后单页文档进行排序;将移动后至少一个的所述修改前单页文档在所述第一页面中的顺序和移动后的至少一个的所述修改后单页文档在所述第二页面中的顺序相关联,并设置所述存储单元存储在所述第一页面中每个所述修改前单页文档与所述存储单元存储在所述第二页面中每个所述修改后单页文档之间的关联关系。
在第三种可能的实现方式中,结合第一方面或第一种可能的实现方式,所述对比单元包括:
区域确定模块,用于在按照所述关联单元设置的所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图中确定对比区域;
区域分割模块,用于将所述区域确定模块确定的所述修改前单页文档和所述修改后单页文档的预览图中的对比区域以阵列的形式分割成相同大小的区域块;
区域对比模块,用于对比分别属于所述修改前单页文档和所述修改后单页文档的相同位置处的所述区域分割模块分割出的区域块中的每个像素点的灰度值,并记录所述出现像素点的灰度值不同的区域块。
在第四种可能的实现方式中,根据第三种可能的实现方式,所述区域确定模块还包括:
像素值对比子模块,用于对比按照所述关联单元设置的所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图的像素值的大小;
区域设置子模块,用于若所述像素值对比子模块对比的所述修改前单页文档和所述修改后单页文档的预览图的像素值相同,则设置所述修改前单页文档和所述修改后单页文档的预览图的全部区域为所述对比区域;还用于若所述修改前单页文档和所述修改后单页文档的预览图的像素值不相同,则将像素值小的预览图的全部区域和所述像素值大的预览图中对应所述像素值小的预览图的像素坐标的区域设置为所述对比区域。
在第五种可能的实现方式中,根据第三种可能的实现方式,所述区域分割模块还包括:
新区域形成子模块,用于将所述区域确定模块确定的所述修改前单页文档和所述修改后单页文档的预览图中的对比区域长度方向的一个侧边和/或宽度方向的一个侧边增加预设宽度的空白像素区域,形成新的对比区域;
区域分割子模块,用于将所述新区域形成子模块形成的所述新的对比区域按照阵列形式分割成大小相同的区域块。
本发明实施例提供的页面校对的方法和装置,能够根据像素的像素值、像素点的灰度值和像素坐标对比出相关联的修改前单页文档页面和修改后单页文档页面的不同之处,避免了人工操作,提高了文档页面的对比效率,还可以将修改前单页文档页面的不同之处的内容替换为对应的修改后单页文档页面的内容。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在排版印刷时,需要排版人员对印刷品的内容进行多次校对,由于在这个过程中会耗费巨大的人力物力,而且人体本身存在视觉误差,使得在校对过程中经常会产生误差,因此而发展出的PDF文档对比工具能够支持对PDF文档中的文字进行对比,但现有的一些PDF文档对比工具不能对图片形式的PDF文档进行对比,且对于对比出不同的错误文档页面内容无法用正确的文档页面内容来替换,因此为了实现快速高效的对两个PDF文档页面进行检错和替换的过程,本发明的实施例提供了一种页面校对的方法和装置,其中,页面校对的方法具体实现方式如下,参照图1所示,该方法包括如下步骤:
101、页面校对装置将修改前文档拆分为至少一个修改前单页文档文件,将修改后文档拆分为至少一个修改后单页文档文件。
每个修改前单页文档文件包括:修改前单页文档和对应的预览图,每个修改后单页文档文件包含:修改后单页文档和对应的预览图。
步骤101主要是对要进行校对的修改前文档和修改后文档进行预处理,将修改前文档和修改后文档进行拆分,分别生成单页文档和对应的具有一定分辨率的预览图,以便进行后续的对比过程。且上述的文档可以是单页文档也可以是多页文档,该文档包含文字信息或图片信息,并且上述的文档的格式包括但不限于CAJ(China AcademicJournals,中国学术期刊)、KDH(一种电子期刊的阅读格式)或PDF(Portable Document Format,便携式文件格式)等能够生成预览图的文档格式。
102、页面校对装置在第一页面中添加至少一个修改前单页文档,在第二页面中添加至少一个修改后单页文档。
103、页面校对装置设置第一页面中每个修改前单页文档与第二页面中每个修改后单页文档之间的关联关系。
进一步可选的,步骤203还包括:
103a、页面校对装置将添加至少一个修改前单页文档至第一页面的顺序与添加至少一个修改后单页文档至第二页面的顺序相关联,并设置第一页面中每个修改前单页文档与第二页面中每个修改后单页文档之间的关联关系。
或者,
103b、页面校对装置将第一页面中的至少一个修改前单页文档和第二页面中的至少一个修改后单页文档进行排序;将移动后至少一个的修改前单页文档在第一页面中的顺序和移动后的至少一个的修改后单页文档在第二页面中的顺序相关联,并设置为设置第一页面中每个修改前单页文档与第二页面中每个修改后单页文档之间的关联关系。
除此之外,用户还可以对第一页面中的至少一个修改前单页文档和第二页面中的至少一个修改后单页文档进行手动关联,首先将原有的默认关联关系取消,通过手动方式任意移动第一页面中的至少一个修改前单页文档和第二页面中的至少一个修改后单页的位置,确定好要进行后续对比的顺序,按照确定好的修改前单页文档和修改后单页文档的顺序依次一一对应的进行关联。
具体的,步骤103a中的关联关系为页面校对装置默认的关联关系,该关联关系是按照至少一个修改前单页文档添加至第一页面的顺序与至少一个修改后单页文档添加至第二页面的顺序来进行关联的,即按照修改前单页文档和修改后单页文档进行存储时的顺序来依次一一对应的进行关联。
步骤103b中的调整关联关系的方式可以理解为通过指定信息将第一页面中的至少一个修改前单页文档和第二页面中的至少一个修改后单页文档进行排序,然后按照该顺序进行关联。该指定信息可以为文档的格式信息(如,正文或封面)也可以为时间信息或名称信息,若按照文档的封面或正文来进行关联,即至少一个修改前单页文档中正文部分或封面部分的页面和至少一个修改后单页文档中的正文部分或封面部分的页面依次一一对应进行关联。
104、页面校对装置按照像素要素对比所有第一页面与第二页面之间有关联关系的修改前单页文档和修改后单页文档的预览图,该像素要素包括像素值和像素点的灰度值。
进一步可选的,参照图2所示,步骤104还包括:
104a、页面校对装置在按照关联关系关联的修改前单页文档和修改后单页文档的预览图中确定对比区域。
104a1、页面校对装置对比按照关联关系关联的修改前单页文档和修改后单页文档的预览图的像素值的大小。
具体的,本发明是基于对按照关联关系关联的修改前单页文档和修改后单页文档的预览图中的具有相同像素坐标的像素点的灰度值进行比较的,则只有将要进行对比的上述两个预览图中的对比区域中的像素值相同,且每个像素点所占的尺寸及像素坐标位置相同(即像素点的个数相同)才能进行像素点的灰度值的对比。而上述两个预览图的分辨率是相同的(即相同尺寸的预览图中具有的像素个数相同,且每个像素点所占的尺寸相同)。
因此只要对上述两个预览图中的像素值进行对比,便可确定上述两个预览图的对比区域,即如下述步骤104a2所述。
104a2、若修改前单页文档和修改后单页文档的预览图的像素值相同,则设置修改前单页文档和修改后单页文档的预览图的全部区域为对比区域。
若修改前单页文档和修改后单页文档的预览图的像素值不相同,则将像素值小的预览图的全部区域和像素值大的预览图中对应像素值小的预览图的像素坐标的区域设置为对比区域。
具体的,当按照关联关系关联的修改前单页文档和修改后单页文档的预览图的像素值相等时,则对比区域为该修改前单页文档和修改后单页文档的预览图全部区域。
当按照关联关系关联的修改前单页文档和修改后单页文档的预览图的像素值不相等时,则对比区域为上述预览图中的像素值小的预览图和上述预览图中的像素值大的预览图中的按照上述预览图中的像素值小的预览图中的所有像素坐标一一对应所找到的所有像素点组成的页面区域。
104b、页面校对装置将修改前单页文档和修改后单页文档的预览图中的对比区域以阵列的形式分割成相同大小的区域块。
进一步可选的,步骤104b还包括:
104b 1、页面校对装置将修改前单页文档和修改后单页文档的预览图中的对比区域长度方向的一个侧边和/或宽度方向的一个侧边增加预设宽度的空白像素区域,形成新的对比区域。
104b2、页面校对装置将新的对比区域按照阵列形式分割成大小相同的区域块。且该区域块的长和宽是预先设置的。
具体的,这里的空白像素区域是用于当对对比区域进行分割时,该对比区域的长度或宽度不能对预先设置的区域块的长和宽进行整除时而加的,且所加的空白像素区域的区域大小为一列或/和一行预设的区域块。当对比区域的长度不能整除预设的区域块的长度时,该空白像素区域为在对比区域的宽度方向的一个侧边加一列区域块,当对比区域的宽度不能整除预设的区域块的宽度时,该空白像素区域为在对比区域的长度方向的一个侧边加一行区域块,当对比区域的长度和宽度均不能整除预设的区域块的长度和宽度时,该空白像素区域为在对比区域的宽度方向的一个侧边和长度方向的一个侧边加上一列和一行区域块。
这样在对比区域分割成预设的区域块时,由于加上的空白像素区域,可以避免对比区域的长度和宽度不能整除预设的区域块的长度和宽度时,将边缘部分丢失。
104c、页面校对装置对比分别属于修改前单页文档和修改后单页文档的相同位置处的区域块中的每个像素点的灰度值,并记录出现像素点的灰度值不同的区域块。
具体的,当预览图为黑白图时,预览图中的像素点的像素坐标中所存储的是该像素点的灰度值,该灰度值的范围为0~255;当预览图为彩色图时,预览图中的像素点的像素坐标中所存储的是一个RGB值,即该值是由红绿蓝三色的灰度值组成的,其表现形式为(R,G,B),如(R,G,B)=(100,255,50),即红色的灰度值为50,绿色的灰度为255,蓝色的灰度值为50;因此不管该预览图为黑白图还是彩色图,在对区域块中的像素点进行对比时,均是对预览图中的像素点的像素坐标中所存储的灰度值进行对比的,不同的是在黑白图中对比的是一个灰度值,彩色图中对比的是三个灰度值,且这三个灰度值只要有一个值不相同,就判断进行对比的两个像素点的不同,进而记录包含该像素点的区域块。
其中,当修改前单页文档和修改后单页文档的预览图的像素值不相同时,将其上述预览图中的像素值大的预览图中的按照上述预览图中的像素值小的预览图中的所有像素坐标一一对应所找到的所有像素点组成的页面区域之外的剩余页面,已经是上述预览图中的不同区域,则直接进行记录。
105、当修改前单页文档与修改后单页文档中存在不同部分时,页面校对装置以标记不同部分的形式显示对比结果。
具体的,在对比完某个区域块之后,若该区域块中出现灰度值不同的像素点,则对该区域块进行记录。例如,建立一个与经过分割的对比区域相同的空白区域,当某个区域块中出现灰度值不同的像素点,即在该区域块对应的空白区域中的空白区域块中记录一个1。当对比完所有的区域块之后,将相邻的记录有1的空白区域块进行合并,并通过红色矩形框来显示该经过合并的区域块,然后将该红色矩形框显示在修改前单页文档与修改后单页文档中的对应区域块上。
除此之外,该页面校对装置还具有筛选功能,能将出现红色矩形框的修改前单页文档对应的第一页面列表位置和修改后单页文档对应的第二页面列表位置用红叉来表示,将未出现红色矩形框的修改前单页文档对应的第一页面列表位置和修改后单页文档对应的第二页面列表位置用绿勾来表示。这样就可以通过筛选功能来显示对比结果,该筛选功能的筛选条件可以为:显示全部页面,显示有差异页面,显示无差异页面和显示为处理页面。
可选的,该方法还包括:
106、当对比结果为修改前单页文档与修改后单页文档中存在不同部分时,页面校对装置将修改后单页文档替换修改前单页文档。即用户可以根据实际需求来选择是否替换有错误页面。
本发明实施例提供的页面校对的方法,能够根据像素的像素值、像素点的灰度值和像素坐标对比出相关联的修改前单页文档页面和修改后单页文档页面的不同之处,避免了人工操作,提高了文档页面的对比效率,还可以将修改前单页文档页面的不同之处的内容替换为对应的修改后单页文档页面的内容。
本发明的实施例提供一种页面校对装置,如图3所示,该页面校对装置3包括:拆分单元31、存储单元32、关联单元33、对比单元34和替换单元35,其中:
拆分单元31,用于将修改前文档拆分为至少一个修改前单页文档文件,将修改后文档拆分为至少一个修改后单页文档文件,每个修改前单页文档文件包括:修改前单页文档和对应的预览图,每个修改后单页文档文件包含:修改后单页文档和对应的预览图。
存储单元32,用于在第一页面中添加拆分单元31拆分的至少一个修改前单页文档,在第二页面中添加拆分单元31拆分的至少一个修改后单页文档。
关联单元33,用于设置存储单元32存储在第一页面中每个修改前单页文档与存储单元32存储在第二页面中每个修改后单页文档之间的关联关系。
对比单元34,用于按照像素要素对比所有第一页面与第二页面之间有关联单元33设置的关联关系的修改前单页文档和修改后单页文档的预览图,该像素要素包括像素值和像素点的灰度值。
显示单元35,用于当对比单元34对比修改前单页文档与修改后单页文档的对比结果存在不同部分时,以标记不同部分的形式显示对比结果。
可选的,该装置还包括:替换单元36,其中:
替换单元36,当对比单元34的对比结果为修改前单页文档与修改后单页文档中存在不同部分时,将修改后单页文档替换所述修改前单页文档。
进一步可选的,关联单元具体用于:将存储单元32添加至少一个修改前单页文档至第一页面的顺序与存储单元32添加至少一个修改后单页文档至第二页面的顺序相关联,并设置存储单元32存储在第一页面中每个修改前单页文档与存储单元32存储在第二页面中每个修改后单页文档之间的关联关系。
或者,
用于将存储单元32存储在第一页面中的至少一个修改前单页文档和存储单元32存储在第二页面中的至少一个修改后单页文档进行排序;将移动后至少一个的修改前单页文档在第一页面中的顺序和移动后的至少一个的修改后单页文档在第二页面中的顺序相关联,并设置存储单元32存储在第一页面中每个修改前单页文档与存储单元32存储在第二页面中每个修改后单页文档之间的关联关系。
进一步可选的,如图4所示,对比单元34包括:区域确定模块341、区域分割模块342和区域对比模块343,其中:
区域确定模块341,用于在按照关联单元33设置的关联关系关联的修改前单页文档和修改后单页文档的预览图中确定对比区域。
区域分割模块342,用于将区域确定模块341确定的修改前单页文档和修改后单页文档的预览图中的对比区域以阵列的形式分割成相同大小的区域块。
区域对比模块343,用于对比分别属于修改前单页文档和修改后单页文档的相同位置处的区域分割模块342分割出的区域块中的每个像素点的灰度值,并记录出现像素点的灰度值不同的区域块。
进一步可选的,如图4所示,该区域确定模块341还包括:
像素值对比子模块341a,用于对比按照关联关系33关联的修改前单页文档和修改后单页文档的预览图的像素值的大小。
区域设置子模块341b,用于若像素值对比子模块341a对比的修改前单页文档和修改后单页文档的预览图的像素值相同,则设置修改前单页文档和修改后单页文档的预览图的全部区域为对比区域;还用于若像素值对比子模块341a对比的修改前单页文档和修改后单页文档的预览图的像素值不相同,则将像素值小的预览图的全部区域和像素值大的预览图中对应像素值小的预览图的像素坐标的区域设置为对比区域。
进一步可选的,如图4所示,该区域分割模块342还包括:
新区域形成子模块342a,用于将区域确定模块341确定的修改前单页文档和修改后单页文档的预览图中的对比区域长度方向的一个侧边和/或宽度方向的一个侧边增加预设宽度的空白像素区域,形成新的对比区域。
区域分割子模块342b,用于将新区域形成子模块342a形成的新的对比区域按照阵列形式分割成大小相同的区域块。
本发明实施例提供的页面校对的装置,能够根据像素的像素值、像素点的灰度值和像素坐标对比出相关联的修改前单页文档页面和修改后单页文档页面的不同之处,避免了人工操作,提高了文档页面的对比效率,还可以将修改前单页文档页面的不同之处的内容替换为对应的修改后单页文档页面的内容。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。