CN108733643A - 基于版心的pdf文件对比的方法及系统 - Google Patents

基于版心的pdf文件对比的方法及系统 Download PDF

Info

Publication number
CN108733643A
CN108733643A CN201710276628.8A CN201710276628A CN108733643A CN 108733643 A CN108733643 A CN 108733643A CN 201710276628 A CN201710276628 A CN 201710276628A CN 108733643 A CN108733643 A CN 108733643A
Authority
CN
China
Prior art keywords
page
pdf
preview graph
type page
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710276628.8A
Other languages
English (en)
Inventor
谢倩倩
翟盼盼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201710276628.8A priority Critical patent/CN108733643A/zh
Publication of CN108733643A publication Critical patent/CN108733643A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/189Automatic justification

Abstract

本发明提供了一种基于版心的PDF文件对比的方法及系统。其中,基于版心的PDF文件对比的方法,包括:将进行对比的两个PDF文件分别拆分为至少一个单页PDF文件,单页PDF文件包括单页PDF和对应的预览图;添加单页PDF文件至旧页面和新页面,设置旧页面与新页面中单页PDF之间的关联关系;根据预览图,确定对应的版心对比区域;将版心对比区域中像素值相同的像素点的灰度值进行对比;当灰度值不同时,标记像素点。本发明提供的基于版心的PDF文件对比的方法,实现根据版心对比区域的版心内容,结合像素点的像素值和灰度值,将相关联的两个PDF文件对比,提高PDF页面的对比效率,避免PDF页面校对的人为失误,提高PDF页面对比的正确率,保证PDF页面校对工作的质量。

Description

基于版心的PDF文件对比的方法及系统
技术领域
本发明涉及印刷领域,具体而言,涉及一种基于版心的PDF文件对比的方法及系统。
背景技术
随着印刷技术的进步,印刷校对工作对人工的依赖程度在不断的缩小,但是仍需要大量的人力物力,在排版印刷之前,排版人员仍然需要对印刷品进行多次的校对,由于人体本身的因素,将本次修改的内容与上次修改的内容进行对比时,不同之处不容易被察觉,整个校对过程效率不是很高,影响印刷进度和质量。
目前,发展出了一种便携式文件格式文件(Portable Document Format,简称PDF)对比工具来进行PDF校对,降低印刷校对的人为失误,提高校对效率。在实际的印刷校对工作中,主要是对PDF的版心内容进行对比,但是现有技术中的某些PDF对比工具存在很多缺陷:一方面,若比较经过处理加了边空调整的两个PDF文档页面,实际版心内容相同,但是版心在版面上的位置有偏移,这种情况需要人工干预来进行对比,降低了校对效率;另一方面,当对比的两个PDF的预览图的高度和宽度不相同时,现有的PDF工具不进行对比,直接就认为两个PDF不同,但是可能版心内容是相同的,影响校对工作的质量;另外,现有的PDF对比工具,对于经过一定的旋转角度变换得到的两个PDF页,无法正确地进行对比版心内容。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一个目的在于提出了一种基于版心的PDF文件对比的方法。
本发明的另一个目的在于提出了一种基于版心的PDF文件对比的系统。
有鉴于此,本发明提出了一种基于版心的PDF文件对比的方法,包括:将进行对比的两个PDF文件分别拆分为至少一个单页PDF文件,单页PDF文件包括单页PDF和对应的预览图;添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中单页PDF之间的关联关系;根据预览图,确定对应的版心对比区域;将版心对比区域中像素值相同的像素点的灰度值进行对比;当灰度值不同时,标记像素点以显示对比结果。
本发明提供的基于版心的PDF文件对比的方法,通过将进行对比的两个PDF文件分别拆分为至少一个单页PDF文件,添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中单页PDF之间的关联关系,根据单页PDF的预览图,确定对应的版心对比区域,将版心对比区域中像素值相同的像素点的灰度值进行对比,当灰度值不同时,标记像素点以显示对比结果,实现根据版心对比区域的版心内容,并结合像素点的像素值和灰度值,将相关联的两个PDF文件进行对比,不需要人工干预进行PDF页面校对工作,节省大量的人力资源,提高PDF页面的对比效率,同时避免PDF页面校对的人为失误,提高PDF页面对比的正确率,保证PDF页面校对工作的质量。
根据本发明上述的基于版心的PDF文件对比的方法,还可以具有如下附加的技术特征:
在上述技术方案中,优选地,在添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中所述单页PDF之间的关联关系的步骤之后,进一步包括:在关联的两个单页PDF中,当一个单页PDF是另一单页PDF经过旋转角度A旋转变换得到时,将另一单页PDF以旋转角度A进行旋转变换。
在该技术方案中,在关联的两个单页PDF中,当一个单页PDF是另一单页PDF经过旋转角度A旋转变换得到时,通过将另一单页PDF以旋转角度A进行旋转变换,实现可以对经过一定的旋转角度变换得到的两个PDF的版心内容进行正确地对比,提高PDF页面对比的正确率,提高PDF页面的对比质量,进而提高PDF页面的对比效率。
在上述任一技术方案中,优选地,添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中所述单页PDF之间的关联关系的步骤,具体包括:在旧页面中添加至少一个单页PDF文件,在新页面中添加至少一个PDF文件,通过添加的顺序设置单页PDF之间的关联关系;或者将旧页面和新页面中的单页PDF通过移动进行排序,通过排序后的顺序设置单页PDF之间的关联关系。
在该技术方案中,在旧页面中添加至少一个单页PDF文件,在新页面中添加至少一个PDF文件,通过添加的顺序设置单页PDF之间的关联关系,或者通过将旧页面和新页面中的单页PDF通过移动进行排序,通过排序后的顺序设置单页PDF之间的关联关系,增添PDF页面校对工作的灵活性,方便后续将相关联的两个PDF文件进行对比,提高PDF页面的对比质量,进而提高PDF页面的对比效率。
在上述任一技术方案中,优选地,将版心对比区域中像素值相同的像素点的灰度值进行对比的步骤,具体包括:通过预设的分块数C,将版心对比区域以阵列的形式分割成C*C块相同大小的区域块;分别对比像素值相同的区域块的每个像素点的灰度值;当灰度值不同时,标出像素点以显示对比结果的步骤,具体包括:当区域块的不同的像素点的灰度值N大于等于设定阈值P时,标记该像素点灰度值不同的区域块。
在该技术方案中,通过预设的分块数C,将版心对比区域以阵列的形式分割成C*C块相同大小的区域块,进而将相关联的两个PDF文件的版心对比区域,通过像素值相同的区域块的每个像素点的灰度值直接进行对比,提高PDF页面的对比效率。进一步地,当区域块的不同的像素点的灰度值N大于等于设定阈值P时,标记该像素点灰度值不同的区域块,该PDF页面对比的方法简单,对比结果直观,提升了用户的使用体验。
在上述任一技术方案中,优选地,根据预览图,确定对应的版心对比区域的步骤,具体包括:设置预览图中的左上顶点为坐标原点,记为(0,0);从坐标原点开始,利用双重循环,外层循环X从0增加至预览图的宽度,内层循环Y从0增加至预览图的高度,找到第一个不是白色像素的点(X1,Y1),确定Xmin,其中Xmin=X1;从坐标原点开始,利用双重循环,外层循环Y从0增加至预览图的高度,内层循环X从0增加至预览图的宽度,找到第一个不是白色像素的点(X2,Y2),确定Ymin,其中Ymin=Y2;从预览图中的右下顶点开始,利用双重循环,外层循环Y从预览图的高度减少至0,内层循环X从预览图的宽度减小至0,找到第一个不是白色像素的点(X3,Y3),确定Ymax,其中,Ymax=Y3;从预览图中的右下顶点开始,外层循环X从预览图的宽度减小至0,内层循环Y从预览图的高度减少至0,找到第一个不是白色像素的点(X4,Y4),确定Xmax,其中,Xmax=X4;根据(Xmin,Ymin,Xmax,Ymax),确认版心的外接矩形为预览图对应的版心区域;判断版心区域的宽度和长度是否相同;根据判断结果,确定预览图对应的版心对比区域;其中,Xmin为距离坐标原点水平距离最小的横坐标,Ymin为距离坐标原点垂直距离最小的纵坐标,Xmax为距离坐标原点水平距离最大的横坐标,Ymax为距离坐标原点垂直距离最大的纵坐标,宽度为(Xmax-Xmin),长度为(Ymax-Ymin)。
在该技术方案中,通过设置预览图中的左上顶点为坐标原点,采用双重循环,从坐标原点开始,找到距离坐标原点水平距离最小的横坐标Xmin,以及距离坐标原点垂直距离最小的纵坐标Ymin,再从预览图中的右下顶点开始,采用双重循环,找到距离坐标原点水平距离最大的横坐标Xmax,以及距离坐标原点垂直距离最大的纵坐标Ymax,即可根据(Xmin,Ymin,Xmax,Ymax),确认版心的外接矩形为预览图对应的版心区域,再判断版心区域的宽度和长度是否相同,根据判断结果,确定预览图对应的版心对比区域,实现通过单页PDF对应的预览图,结合双重循环对应的简单算法,准确快速地确定对应的版心对比区域,进而可以根据版心对比区域的版心内容,将相关联的两个PDF文件进行对比,提高PDF页面的对比效率。
在上述任一技术方案中,优选地,根据判断结果,确定预览图对应的版心对比区域的步骤,具体包括:当版心区域的宽度和长度相同时,分别设置版心区域为版心对比区域;当版心区域的宽度和长度不同时,设置像素值小的预览图的版心区域为版心对比区域,以及像素值大的版心区域中对应像素值小的像素坐标的区域为版心对比区域。
在该技术方案中,当版心区域的宽度和长度对应相同时,通过分别设置版心区域为版心对比区域,并且当版心区域的宽度和长度对应不同时,通过设置像素值小的预览图的版心区域为版心对比区域,以及像素值大的版心区域中对应像素值小的像素坐标的区域为版心对比区域,通过版心区域的宽度和长度是否对应相同的不同情况,准确快速地确定对应的版心对比区域,进而可以根据版心对比区域的版心内容,将相关联的两个PDF文件进行对比,提高PDF页面的对比效率。
本发明还提出一种基于版心的PDF文件对比的系统,包括:预处理单元,用于将进行对比的两个PDF文件分别拆分为至少一个单页PDF文件,单页PDF文件包括单页PDF和对应的预览图;还用于添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中单页PDF之间的关联关系;版心对比区域确定单元,用于根据预览图,确定对应的版心对比区域;对比单元,用于将版心对比区域中像素值相同的像素点的灰度值进行对比;以及显示单元,用于当灰度值不同时,标记像素点以显示对比结果。
本发明提供的基于版心的PDF文件对比的系统,通过预处理单元,将进行对比的两个PDF文件分别拆分为至少一个单页PDF文件,添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中单页PDF之间的关联关系,通过版心对比区域确定单元,根据单页PDF的预览图,确定对应的版心对比区域,通过对比单元,将版心对比区域中像素值相同的像素点的灰度值进行对比,通过显示单元,当灰度值不同时,标记像素点以显示对比结果,实现根据版心对比区域的版心内容,并结合像素点的像素值和灰度值,将相关联的两个PDF文件进行对比,不需要人工干预进行PDF页面校对工作,节省大量的人力资源,提高PDF页面的对比效率,同时避免PDF页面校对的人为失误,提高PDF页面对比的正确率,保证PDF页面校对工作的质量。
根据本发明上述的基于版心的PDF文件对比的系统,还可以具有如下附加的技术特征:
在上述技术方案中,优选地,预处理单元,还用于在关联的两个单页PDF中,当一个单页PDF是另一单页PDF经过旋转角度A旋转变换得到时,将另一单页PDF以旋转角度A进行旋转变换。
在该技术方案中,在关联的两个单页PDF中,当一个单页PDF是另一单页PDF经过旋转角度A旋转变换得到时,通过预处理单元,将另一单页PDF以旋转角度A进行旋转变换,实现可以对经过一定的旋转角度变换得到的两个PDF的版心内容进行正确地对比,提高PDF页面对比的正确率,提高PDF页面的对比质量,进而提高PDF页面的对比效率。
在上述任一技术方案中,优选地,预处理单元,具体用于:在旧页面中至少添加一个单页PDF文件,在新页面中至少添加一个PDF文件,将添加的顺序相关联,设置单页PDF之间的关联关系;或者将旧页面和新页面中的单页PDF通过移动进行排序,调整两个页面中单页PDF的顺序,设置经过排序后的两个页面中单页PDF之间的关联关系。
在该技术方案中,通过预处理单元,在旧页面中添加至少一个单页PDF文件,在新页面中添加至少一个PDF文件,通过添加的顺序设置单页PDF之间的关联关系,或者通过将旧页面和新页面中的单页PDF通过移动进行排序,通过排序后的顺序设置单页PDF之间的关联关系,增添PDF页面校对工作的灵活性,方便后续将相关联的两个PDF文件进行对比,提高PDF页面的对比质量,进而提高PDF页面的对比效率。
在上述任一技术方案中,优选地,对比单元,具体用于:通过预设的分块数C,将版心对比区域以阵列的形式分割成C*C块相同大小的区域块;分别对比像素值相同的区域块的每个像素点的灰度值;显示单元,具体用于:当区域块的不同的像素点的灰度值N大于等于设定阈值P时,标记该像素点灰度值不同的区域块。
在该技术方案中,通过对比单元,将版心对比区域以阵列的形式分割成C*C块相同大小的区域块,进而将相关联的两个PDF文件的版心对比区域,通过像素值相同的区域块的每个像素点的灰度值直接进行对比,提高PDF页面的对比效率。进一步地,通过显示单元,当区域块的不同的像素点的灰度值N大于等于设定阈值P时,标记该像素点灰度值不同的区域块,该PDF页面对比的方法简单,对比结果直观,提升了用户的使用体验。
在上述任一技术方案中,优选地,版心对比区域确定单元,具体用于:设置预览图中的左上顶点为坐标原点,记为(0,0);从坐标原点开始,利用双重循环,外层循环X从0增加至预览图的宽度,内层循环Y从0增加至预览图的高度,找到第一个不是白色像素的点(X1,Y1),确定Xmin,其中Xmin=X1;从坐标原点开始,利用双重循环,外层循环Y从0增加至预览图的高度,内层循环X从0增加至预览图的宽度,找到第一个不是白色像素的点(X2,Y2),确定Ymin,其中Ymin=Y2;从预览图中的右下顶点开始,利用双重循环,外层循环Y从预览图的高度减少至0,内层循环X从预览图的宽度减小至0,找到第一个不是白色像素的点(X3,Y3),确定Ymax,其中,Ymax=Y3;从预览图中的右下顶点开始,外层循环X从预览图的宽度减小至0,内层循环Y从预览图的高度减少至0,找到第一个不是白色像素的点(X4,Y4),确定Xmax,其中,Xmax=X4;根据(Xmin,Ymin,Xmax,Ymax),确认版心的外接矩形为预览图对应的版心区域;判断版心区域的宽度和长度是否对应相同;根据判断结果,确定预览图对应的版心对比区域;其中,Xmin为距离坐标原点水平距离最小的横坐标,Ymin为距离坐标原点垂直距离最小的纵坐标,Xmax为距离坐标原点水平距离最大的横坐标,Ymax为距离坐标原点垂直距离最大的纵坐标,所述宽度为(Xmax-Xmin),所述长度为(Ymax-Ymin)。
在该技术方案中,通过版心对比区域确定单元,设置预览图中的左上顶点为坐标原点,采用双重循环,从坐标原点开始,找到距离坐标原点水平距离最小的横坐标Xmin,以及距离坐标原点垂直距离最小的纵坐标Ymin,再从预览图中的右下顶点开始,采用双重循环,找到距离坐标原点水平距离最大的横坐标Xmax,以及距离坐标原点垂直距离最大的纵坐标Ymax,即可根据(Xmin,Ymin,Xmax,Ymax),确认版心的外接矩形为预览图对应的版心区域,再判断版心区域的宽度和长度是否相同,根据判断结果,确定预览图对应的版心对比区域,实现通过单页PDF对应的预览图,结合双重循环对应的简单算法,准确快速地确定对应的版心对比区域,进而可以根据版心对比区域的版心内容,将相关联的两个PDF文件进行对比,提高PDF页面的对比效率。
在上述任一技术方案中,优选地,版心对比区域确定单元,进一步具体用于:当版心区域的宽度和长度对应相同时,分别设置版心区域为版心对比区域;当版心区域的宽度和长度对应不同时,设置像素值小的预览图的版心区域为版心对比区域,以及像素值大的版心区域中对应像素值小的像素坐标的区域为版心对比区域。
在该技术方案中,通过版心对比区域确定单元,当版心区域的宽度和长度对应相同时,通过分别设置版心区域为版心对比区域,并且当版心区域的宽度和长度对应不同时,通过设置像素值小的预览图的版心区域为版心对比区域,以及像素值大的版心区域中对应像素值小的像素坐标的区域为版心对比区域,通过版心区域的宽度和长度是否对应相同的不同情况,准确快速地确定对应的版心对比区域,进而可以根据版心对比区域的版心内容,将相关联的两个PDF文件进行对比,提高PDF页面的对比效率。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明的一个实施例的基于版心的PDF文件对比的方法的流程示意图;
图2是本发明的另一个实施例的基于版心的PDF文件对比的方法的流程示意图;
图3是本发明的再一个实施例的基于版心的PDF文件对比的方法的流程示意图;
图4是本发明的一个实施例的基于版心的PDF文件对比的系统的示意图;
图5是本发明的另一个实施例的基于版心的PDF文件对比的系统的示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不限于下面公开的具体实施例的限制。
如图1所示,本发明的一个实施例的基于版心的PDF文件对比的方法的流程示意图。其中,该基于版心的PDF文件对比的方法,包括:
步骤102,将进行对比的两个PDF文件分别拆分为至少一个单页PDF文件,单页PDF文件包括单页PDF和对应的预览图;
步骤104,添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中单页PDF之间的关联关系;
步骤106,根据预览图,确定对应的版心对比区域;
步骤108,将版心对比区域中像素值相同的像素点的灰度值进行对比;
步骤110,当灰度值不同时,标记像素点以显示对比结果。
本发明提供的基于版心的PDF文件对比方法,通过将进行校对的修改前文档和修改后文档分别拆分为至少一个单页PDF文件,分别生成单页文档和对应的具有一定分辨率的预览图,添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中单页PDF之间的关联关系,根据单页PDF的预览图,确定对应的版心对比区域,将版心对比区域中像素值相同的像素点的灰度值进行对比,当灰度值不同时,标记像素点以显示对比结果,实现根据版心对比区域的版心内容,并结合像素点的像素值和灰度值,将相关联的两个PDF文件进行对比,不需要人工干预进行PDF页面校对工作,节省大量的人力资源,提高PDF页面的对比效率,同时避免PDF页面校对的人为失误,提高PDF页面对比的正确率,保证PDF页面校对工作的质量。
如图2所示,本发明的另一个实施例的基于版心的PDF文件对比的方法的流程示意图。其中,该基于版心的PDF文件对比的方法,包括:
步骤202,将进行对比的两个PDF文件分别拆分为至少一个单页PDF文件,单页PDF文件包括单页PDF和对应的预览图;
步骤204,添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中单页PDF之间的关联关系;
步骤206,在关联的两个单页PDF中,当一个单页PDF是另一单页PDF经过旋转角度A旋转变换得到时,将另一单页PDF以旋转角度A进行旋转变换;
步骤208,根据预览图,确定对应的版心对比区域;
步骤210,将版心对比区域中像素值相同的像素点的灰度值进行对比;
步骤212,当灰度值不同时,标记像素点以显示对比结果。
在该实施例中,在关联的两个单页PDF中,当一个单页PDF是另一单页PDF经过旋转角度A旋转变换得到时,通过将另一单页PDF以旋转角度A进行旋转变换,实现可以对经过一定的旋转角度变换得到的两个PDF的版心内容进行正确地对比,提高PDF页面对比的正确率,提高PDF页面的对比质量,进而提高PDF页面的对比效率。
在本发明的一个实施例中,优选地,添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中所述单页PDF之间的关联关系的步骤,具体包括:在旧页面中添加至少一个单页PDF文件,在新页面中添加至少一个PDF文件,通过添加的顺序设置单页PDF之间的关联关系;或者将旧页面和新页面中的单页PDF通过移动进行排序,通过排序后的顺序设置单页PDF之间的关联关系。
在该实施例中,在旧页面中添加至少一个单页PDF文件,在新页面中添加至少一个PDF文件,通过添加的顺序设置单页PDF之间的关联关系,或者通过将旧页面和新页面中的单页PDF通过移动进行排序,通过排序后的顺序设置单页PDF之间的关联关系,增添PDF页面校对工作的灵活性,方便后续将相关联的两个PDF文件进行对比,提高PDF页面的对比质量,进而提高PDF页面的对比效率。
如图3所示,本发明的再一个实施例的基于版心的PDF文件对比的方法的流程示意图。其中,该基于版心的PDF文件对比的方法,包括:
步骤302,将进行对比的两个PDF文件分别拆分为至少一个单页PDF文件,单页PDF文件包括单页PDF和对应的预览图;
步骤304,添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中单页PDF之间的关联关系;
步骤306,根据预览图,确定对应的版心对比区域;
步骤308,通过预设的分块数C,将版心对比区域以阵列的形式分割成C*C块相同大小的区域块;
步骤310,当区域块的不同的像素点的灰度值N大于等于设定阈值P时,标记该像素点灰度值不同的区域块。
在该实施例中,通过预设的分块数C,将版心对比区域以阵列的形式分割成C*C块相同大小的区域块,进而将相关联的两个PDF文件的版心对比区域,通过像素值相同的区域块的每个像素点的灰度值直接进行对比,提高PDF页面的对比效率。进一步地,当区域块的不同的像素点的灰度值N大于等于设定阈值P时,标记该像素点灰度值不同的区域块,该PDF页面对比的方法简单,对比结果直观,提升了用户的使用体验。
具体实施例中,用户可以根据自己的PDF页面的对比需求,将设定阈值P设置为任意合理的数值。
具体实施例中,在对比完某个区域块之后,若该区域块中出现灰度值不同的像素点时,则对该区域块进行标记。具体地说,建立一个与经过分割的对比区域相同的空白区域,当某个区域块中出现灰度值不同的像素点时,在该区域块对应的空白区域中的空白区域块中记录为1,当对比完所有的区域块之后,将相邻的记录有1的空白区域块进行合并,并通过红色矩形框来显示该经过合并的区域块,将该红色矩形框显示在修改前单页PDF与修改后单页PDF中的对应区域块上,当然,也可以通过其他颜色的矩形框来显示该经过合并的区域块。
在本发明的一个实施例中,优选地,根据预览图,确定对应的版心对比区域的步骤,具体包括:设置预览图中的左上顶点为坐标原点,记为(0,0);从坐标原点开始,利用双重循环,外层循环X从0增加至预览图的宽度,内层循环Y从0增加至预览图的高度,找到第一个不是白色像素的点(X1,Y1),确定Xmin,其中Xmin=X1;从坐标原点开始,利用双重循环,外层循环Y从0增加至预览图的高度,内层循环X从0增加至预览图的宽度,找到第一个不是白色像素的点(X2,Y2),确定Ymin,其中Ymin=Y2;从预览图中的右下顶点开始,利用双重循环,外层循环Y从预览图的高度减少至0,内层循环X从预览图的宽度减小至0,找到第一个不是白色像素的点(X3,Y3),确定Ymax,其中,Ymax=Y3;从预览图中的右下顶点开始,外层循环X从预览图的宽度减小至0,内层循环Y从预览图的高度减少至0,找到第一个不是白色像素的点(X4,Y4),确定Xmax,其中,Xmax=X4;根据(Xmin,Ymin,Xmax,Ymax),确认版心的外接矩形为预览图对应的版心区域;判断版心区域的宽度和长度是否相同;根据判断结果,确定预览图对应的版心对比区域;其中,Xmin为距离坐标原点水平距离最小的横坐标,Ymin为距离坐标原点垂直距离最小的纵坐标,Xmax为距离坐标原点水平距离最大的横坐标,Ymax为距离坐标原点垂直距离最大的纵坐标,宽度为(Xmax-Xmin),长度为(Ymax-Ymin)。
在该实施例中,通过设置预览图中的左上顶点为坐标原点,采用双重循环,从坐标原点开始,找到距离坐标原点水平距离最小的横坐标Xmin,以及距离坐标原点垂直距离最小的纵坐标Ymin,再从预览图中的右下顶点开始,采用双重循环,找到距离坐标原点水平距离最大的横坐标Xmax,以及距离坐标原点垂直距离最大的纵坐标Ymax,即可根据(Xmin,Ymin,Xmax,Ymax),确认版心的外接矩形为预览图对应的版心区域,再判断版心区域的宽度和长度是否相同,根据判断结果,确定预览图对应的版心对比区域,实现通过单页PDF对应的预览图,结合双重循环对应的简单算法,准确地确定对应的版心对比区域,可以根据版心对比区域的版心内容,将相关联的两个PDF文件进行对比,提高PDF页面的对比效率。
在本发明的一个实施例中,优选地,根据判断结果,确定预览图对应的版心对比区域的步骤,具体包括:当版心区域的宽度和长度相同时,分别设置版心区域为版心对比区域;当版心区域的宽度和长度不同时,设置像素值小的预览图的版心区域为版心对比区域,以及像素值大的版心区域中对应像素值小的像素坐标的区域为版心对比区域。
在该实施例中,通过版心区域的宽度和长度是否对应相同的不同情况,准确地确定对应的版心对比区域,可以根据版心对比区域的版心内容,将相关联的两个PDF文件进行对比,提高PDF页面的对比效率。具体地说,当版心区域的宽度和长度对应相同时,说明两边版心区域的像素值相同,相同尺寸的预览图中具有的像素个数相同,且每个像素点所占的尺寸相同,因此,两个预览图的分辨率是相同的,则分别设置对应的版心外接矩形为版心对比区域。当版心区域的宽度和长度对应不同时,通过设置像素值小的预览图的版心区域为版心对比区域,以及像素值大的版心区域中对应像素值小的像素坐标的区域为版心对比区域。
具体实施例中,当预览图为黑白图时,预览图中的像素点的像素坐标中所存储的是该像素点的灰度值,该灰度值的范国为0至255;当预览图为彩色图时,预览图中的像素点的像素坐标中所存储的是一个RGB值,即该值是由红绿蓝三色的灰度值组成的,其表现形式为(R,G,B),如(R,G,B)=(100,255,50),即红色的灰度值为50,绿色的灰度为255,蓝色的灰度值为50;因此不管该预览图为黑白图还是彩色图,在对区域块中的像素点进行对比时,均是对预览图中的像素点的像素坐标中所存储的灰度值进行对比的,不同的是在黑白图中对比的是一个灰度值,彩色图中对比的是三个灰度值,且这三个灰度值只要有一个值不相同,就判断进行对比的两个像素点不同,进而标记包含该像素点的区域块。
如图4所示,本发明的一个实施例的基于版心的PDF文件对比的系统400的示意图。其中,该基于版心的PDF文件对比的系统400,包括:
预处理单元402,用于将进行对比的两个PDF文件分别拆分为至少一个单页PDF文件,单页PDF文件包括单页PDF和对应的预览图;
还用于添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中单页PDF之间的关联关系;
版心对比区域确定单元404,用于根据预览图,确定对应的版心对比区域;
对比单元406,用于将版心对比区域中像素值相同的像素点的灰度值进行对比;以及
显示单元408,用于当灰度值不同时,标记像素点以显示对比结果。
本发明提供的基于版心的PDF文件对比的系统400,通过预处理单元402,将进行对比的两个PDF文件分别拆分为至少一个单页PDF文件,添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中单页PDF之间的关联关系,通过版心对比区域确定单元404,根据单页PDF的预览图,确定对应的版心对比区域,通过对比单元406,将版心对比区域中像素值相同的像素点的灰度值进行对比,通过显示单元408,当灰度值不同时,标记像素点以显示对比结果,实现根据版心对比区域的版心内容,并结合像素点的像素值和灰度值,将相关联的两个PDF文件进行对比,不需要人工干预进行PDF页面校对工作,节省大量的人力资源,提高PDF页面的对比效率,同时避免PDF页面校对的人为失误,提高PDF页面对比的正确率,保证PDF页面校对工作的质量。
在本发明的一个实施例中,如图4所示,优选地,该基于版心的PDF文件对比的系统400,还包括:旋转单元410,用于在关联的两个单页PDF中,当一个单页PDF是另一单页PDF经过旋转角度A旋转变换得到时,将另一单页PDF以旋转角度A进行旋转变换。
在该实施例中,在关联的两个单页PDF中,当一个单页PDF是另一单页PDF经过旋转角度A旋转变换得到时,通过旋转单元410,将另一单页PDF以旋转角度A进行旋转变换,实现可以对经过一定的旋转角度变换得到的两个PDF的版心内容进行正确地对比,提高PDF页面对比的正确率,提高PDF页面的对比质量,进而提高PDF页面的对比效率。
在本发明的一个实施例中,优选地,预处理单元402,具体用于:在旧页面中至少添加一个单页PDF文件,在新页面中至少添加一个PDF文件,将添加的顺序相关联,设置单页PDF之间的关联关系;或者将旧页面和新页面中的单页PDF通过移动进行排序,调整两个页面中单页PDF的顺序,设置经过排序后的两个页面中单页PDF之间的关联关系。
在该实施例中,通过预处理单元402,在旧页面中添加至少一个单页PDF文件,在新页面中添加至少一个PDF文件,通过添加的顺序设置单页PDF之间的关联关系,或者通过将旧页面和新页面中的单页PDF通过移动进行排序,通过排序后的顺序设置单页PDF之间的关联关系,增添PDF页面校对工作的灵活性,方便后续将相关联的两个PDF文件进行对比,提高PDF页面的对比质量,进而提高PDF页面的对比效率。
如图5所示,本发明的另一个实施例的基于版心的PDF文件对比的系统500的示意图。其中,该基于版心的PDF文件对比的系统500,包括:
预处理单元502,用于将进行对比的两个PDF文件分别拆分为至少一个单页PDF文件,单页PDF文件包括单页PDF和对应的预览图;
还用于添加单页PDF文件至旧页面和新页面,并设置旧页面与新页面中单页PDF之间的关联关系;
版心对比区域确定单元504,用于根据预览图,确定对应的版心对比区域;
对比单元506,包括区域分割模块5060和区域对比模块5062;区域分割模块5060,用于通过预设的分块数C,将版心对比区域以阵列的形式分割成C*C块相同大小的区域块;还用于分别对比像素值相同的区域块的每个像素点的灰度值;区域对比模块5062,用于将区域块的不同的像素点的灰度值N与设定阈值P进行比较;
显示单元508,用于当区域块的不同的像素点的灰度值N大于等于设定阈值P时,标记该像素点灰度值不同的区域块。
在该实施例中,通过区域分割模块5060,将版心对比区域以阵列的形式分割成C*C块相同大小的区域块,进而通过区域对比模块5062,将相关联的两个PDF文件的版心对比区域中,像素值相同的区域块的每个像素点的灰度值直接进行对比,提高PDF页面的对比效率,最后通过显示单元508,当区域块的不同的像素点的灰度值N大于等于设定阈值P时,标记该像素点灰度值不同的区域块,该PDF页面对比的方法简单,对比结果直观,提升用户的使用体验。
在本发明的一个实施例中,如图5所示,优选地,该基于版心的PDF文件对比的系统500,还包括:旋转单元510,用于在关联的两个单页PDF中,当一个单页PDF是另一单页PDF经过旋转角度A旋转变换得到时,将另一单页PDF以旋转角度A进行旋转变换。
在该实施例中,在关联的两个单页PDF中,当一个单页PDF是另一单页PDF经过旋转角度A旋转变换得到时,通过旋转单元510,将另一单页PDF以旋转角度A进行旋转变换,实现可以对经过一定的旋转角度变换得到的两个PDF的版心内容进行正确地对比,提高PDF页面对比的正确率,提高PDF页面的对比质量,进而提高PDF页面的对比效率。
在本发明的一个实施例中,如图5所示,优选地,版心对比区域确定单元504,具体包括:
版心区域确定子模块5040,用于设置预览图中的左上顶点为坐标原点,记为(0,0);从坐标原点开始,利用双重循环,外层循环X从0增加至预览图的宽度,内层循环Y从0增加至预览图的高度,找到第一个不是白色像素的点(X1,Y1),确定Xmin,其中Xmin=X1;从坐标原点开始,利用双重循环,外层循环Y从0增加至预览图的高度,内层循环X从0增加至预览图的宽度,找到第一个不是白色像素的点(X2,Y2),确定Ymin,其中Ymin=Y2;从预览图中的右下顶点开始,利用双重循环,外层循环Y从预览图的高度减少至0,内层循环X从预览图的宽度减小至0,找到第一个不是白色像素的点(X3,Y3),确定Ymax,其中,Ymax=Y3;从预览图中的右下顶点开始,外层循环X从预览图的宽度减小至0,内层循环Y从预览图的高度减少至0,找到第一个不是白色像素的点(X4,Y4),确定Xmax,其中,Xmax=X4;根据(Xmin,Ymin,Xmax,Ymax),确认版心的外接矩形为预览图对应的版心区域;
版心对比区域设置子模块5042,用于判断版心区域的宽度和长度是否对应相同;根据判断结果,确定预览图对应的版心对比区域;
还用于当版心区域的宽度和长度对应相同时,分别设置版心区域为版心对比区域;当版心区域的宽度和长度对应不同时,设置像素值小的预览图的版心区域为版心对比区域,以及像素值大的版心区域中对应像素值小的像素坐标的区域为版心对比区域;其中,Xmin为距离坐标原点水平距离最小的横坐标,Ymin为距离坐标原点垂直距离最小的纵坐标,Xmax为距离坐标原点水平距离最大的横坐标,Ymax为距离坐标原点垂直距离最大的纵坐标,所述宽度为(Xmax-Xmin),所述长度为(Ymax-Ymin)。
在该实施例中,通过版心区域确定子模块5040,设置预览图中的左上顶点为坐标原点,采用双重循环,从坐标原点开始,找到距离坐标原点水平距离最小的横坐标Xmin,以及距离坐标原点垂直距离最小的纵坐标Ymin,再从预览图中的右下顶点开始,采用双重循环,找到距离坐标原点水平距离最大的横坐标Xmax,以及距离坐标原点垂直距离最大的纵坐标Ymax,即可根据(Xmin,Ymin,Xmax,Ymax),确认版心的外接矩形为预览图对应的版心区域,再判断版心区域的宽度和长度是否相同,根据判断结果,确定预览图对应的版心对比区域,实现通过单页PDF对应的预览图,结合双重循环对应的简单算法,准确地确定对应的版心对比区域,可以根据版心对比区域的版心内容,将相关联的两个PDF文件进行对比,提高PDF页面的对比效率。
进一步地,通过版心对比区域设置子模块5042,当版心区域的宽度和长度对应相同时,通过分别设置版心区域为版心对比区域,并且当版心区域的宽度和长度对应不同时,通过设置像素值小的预览图的版心区域为版心对比区域,以及像素值大的版心区域中对应像素值小的像素坐标的区域为版心对比区域,通过版心区域的宽度和长度是否对应相同的不同情况,准确快速地确定对应的版心对比区域,进而可以根据版心对比区域的版心内容,将相关联的两个PDF文件进行对比,提高PDF页面的对比效率。
在本发明的一个实施例中,如图5所示,优选地,对比单元506,还包括:
新区域形成子模块5064,用于将版心区域确定子模块5040确定的单页PDF的预览图中的版心区域长度方向的一个侧边和/或宽度方向的一个侧边增加预设宽度的空白像素区域,形成新的版心对比区域;
区域分割模块5060,还用于将形成的新的版心对比区域通过设定的分块数C,以阵列的形式分割成C*C块相同大小的区域块;
在该实施例中,可以将单页PDF的预览图中的版心区域长度方向的一个侧边和/或宽度方向的一个侧边增加预设宽度的空白像素区域,形成新的版心对比区域,增添PDF页面校对工作的灵活性,方便后续将相关联的两个PDF文件进行对比,提高PDF页面的对比质量,进而提高PDF页面的对比效率。
本领域技术人员可以理解,实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而所述存储介质包括:RoM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种基于版心的PDF文件对比的方法,其特征在于,包括:
将进行对比的两个PDF文件分别拆分为至少一个单页PDF文件,所述单页PDF文件包括单页PDF和对应的预览图;
添加所述单页PDF文件至旧页面和新页面,并设置旧页面与新页面中所述单页PDF之间的关联关系;
根据所述预览图,确定对应的版心对比区域;
将所述版心对比区域中像素值相同的像素点的灰度值进行对比;
当所述灰度值不同时,标记所述像素点以显示对比结果。
2.根据权利要求1所述的基于版心的PDF文件对比的方法,其特征在于,在添加所述单页PDF文件至旧页面和新页面,并设置旧页面与新页面中所述单页PDF之间的关联关系的步骤之后,进一步包括:
在关联的两个单页PDF中,当一个单页PDF是另一单页PDF经过旋转角度A旋转变换得到时,将所述另一单页PDF以所述旋转角度A进行旋转变换。
3.根据权利要求1所述的基于版心的PDF文件对比的方法,其特征在于,添加所述单页PDF文件至旧页面和新页面,并设置旧页面与新页面中所述单页PDF之间的关联关系的步骤,具体包括:
在旧页面中添加至少一个单页PDF文件,在新页面中添加至少一个PDF文件,通过添加的顺序设置单页PDF之间的关联关系;或者
将旧页面和新页面中的单页PDF通过移动进行排序,通过排序后的顺序设置单页PDF之间的关联关系。
4.根据权利要求1所述的基于版心的PDF文件对比的方法,其特征在于,将所述版心对比区域中像素值相同的像素点的灰度值进行对比的步骤,具体包括:
通过预设的分块数C,将所述版心对比区域以阵列的形式分割成C*C块相同大小的区域块;
分别对比像素值相同的区域块的每个像素点的灰度值;
当所述灰度值不同时,标出所述像素点以显示对比结果的步骤,具体包括:当区域块的不同的像素点的灰度值N大于等于设定阈值P时,标记该像素点灰度值不同的区域块。
5.根据权利要求1至4中任一项所述的基于版心的PDF文件对比的方法,其特征在于,根据所述预览图,确定对应的版心对比区域的步骤,具体包括:
设置所述预览图中的左上顶点为坐标原点,记为(0,0);
从坐标原点开始,利用双重循环,外层循环X从0增加至预览图的宽度,内层循环Y从0增加至预览图的高度,找到第一个不是白色像素的点(X1,Y1),确定Xmin,其中Xmin=X1;
从坐标原点开始,利用双重循环,外层循环Y从0增加至预览图的高度,内层循环X从0增加至预览图的宽度,找到第一个不是白色像素的点(X2,Y2),确定Ymin,其中Ymin=Y2;
从预览图中的右下顶点开始,利用双重循环,外层循环Y从预览图的高度减少至0,内层循环X从预览图的宽度减小至0,找到第一个不是白色像素的点(X3,Y3),确定Ymax,其中,Ymax=Y3;
从预览图中的右下顶点开始,外层循环X从预览图的宽度减小至0,内层循环Y从预览图的高度减少至0,找到第一个不是白色像素的点(X4,Y4),确定Xmax,其中,Xmax=X4;
根据(Xmin,Ymin,Xmax,Ymax),确认版心的外接矩形为预览图对应的版心区域;
判断所述版心区域的宽度和长度是否对应相同;
根据判断结果,确定所述预览图对应的版心对比区域;
其中,Xmin为距离坐标原点水平距离最小的横坐标,Ymin为距离坐标原点垂直距离最小的纵坐标,Xmax为距离坐标原点水平距离最大的横坐标,Ymax为距离坐标原点垂直距离最大的纵坐标,所述宽度为(Xmax-Xmin),所述长度为(Ymax-Ymin)。
6.根据权利要求5所述的基于版心的PDF文件对比的方法,其特征在于,根据判断结果,确定所述预览图对应的版心对比区域的步骤,具体包括:
当所述版心区域的宽度和长度对应相同时,分别设置所述版心区域为所述版心对比区域;
当所述版心区域的宽度和长度对应不同时,设置像素值小的预览图的版心区域为所述版心对比区域,以及像素值大的版心区域中对应像素值小的像素坐标的区域为所述版心对比区域。
7.一种基于版心的PDF文件对比的系统,其特征在于,包括:
预处理单元,用于将进行对比的两个PDF文件分别拆分为至少一个单页PDF文件,所述单页PDF文件包括单页PDF和对应的预览图;
还用于添加所述单页PDF文件至旧页面和新页面,并设置旧页面与新页面中所述单页PDF之间的关联关系;
版心对比区域确定单元,用于根据所述预览图,确定对应的版心对比区域;
对比单元,用于将所述版心对比区域中像素值相同的像素点的灰度值进行对比;以及
显示单元,用于当所述灰度值不同时,标记所述像素点以显示对比结果。
8.根据权利要求7所述的基于版心的PDF文件对比的系统,其特征在于,
所述预处理单元,还用于在关联的两个单页PDF中,当一个单页PDF是另一单页PDF经过旋转角度A旋转变换得到时,将所述另一单页PDF以所述旋转角度A进行旋转变换。
9.根据权利要求7所述的基于版心的PDF文件对比的系统,其特征在于,所述预处理单元,具体用于:
在旧页面中至少添加一个单页PDF文件,在新页面中至少添加一个PDF文件,将添加的顺序相关联,设置单页PDF之间的关联关系;或者
将旧页面和新页面中的单页PDF通过移动进行排序,调整两个页面中单页PDF的顺序,设置经过排序后的两个页面中单页PDF之间的关联关系。
10.根据权利要求7所述的基于版心的PDF文件对比的系统,其特征在于,
所述对比单元,具体用于:通过预设的分块数C,将所述版心对比区域以阵列的形式分割成C*C块相同大小的区域块;
分别对比像素值相同的区域块的每个像素点的灰度值;
所述显示单元,具体用于:当区域块的不同的像素点的灰度值N大于等于设定阈值P时,标记该像素点灰度值不同的区域块。
11.根据权利要求7至10中任一项所述的基于版心的PDF文件对比的系统,其特征在于,所述版心对比区域确定单元,具体用于:
设置所述预览图中的左上顶点为坐标原点,记为(0,0);
从坐标原点开始,利用双重循环,外层循环X从0增加至预览图的宽度,内层循环Y从0增加至预览图的高度,找到第一个不是白色像素的点(X1,Y1),确定Xmin,其中Xmin=X1;
从坐标原点开始,利用双重循环,外层循环Y从0增加至预览图的高度,内层循环X从0增加至预览图的宽度,找到第一个不是白色像素的点(X2,Y2),确定Ymin,其中Ymin=Y2;
从预览图中的右下顶点开始,利用双重循环,外层循环Y从预览图的高度减少至0,内层循环X从预览图的宽度减小至0,找到第一个不是白色像素的点(X3,Y3),确定Ymax,其中,Ymax=Y3;
从预览图中的右下顶点开始,外层循环X从预览图的宽度减小至0,内层循环Y从预览图的高度减少至0,找到第一个不是白色像素的点(X4,Y4),确定Xmax,其中,Xmax=X4;
根据(Xmin,Ymin,Xmax,Ymax),确认版心的外接矩形为预览图对应的版心区域;
判断所述版心区域的宽度和长度是否对应相同;
根据判断结果,确定所述预览图对应的版心对比区域;
其中,Xmin为距离坐标原点水平距离最小的横坐标,Ymin为距离坐标原点垂直距离最小的纵坐标,Xmax为距离坐标原点水平距离最大的横坐标,Ymax为距离坐标原点垂直距离最大的纵坐标,所述宽度为(Xmax-Xmin),所述长度为(Ymax-Ymin)。
12.根据权利要求11所述的基于版心的PDF文件对比的系统,其特征在于,所述版心对比区域确定单元,进一步具体用于:
当所述版心区域的宽度和长度对应相同时,分别设置所述版心区域为所述版心对比区域;
当所述版心区域的宽度和长度对应不同时,设置像素值小的预览图的版心区域为所述版心对比区域,以及像素值大的版心区域中对应像素值小的像素坐标的区域为所述版心对比区域。
CN201710276628.8A 2017-04-25 2017-04-25 基于版心的pdf文件对比的方法及系统 Pending CN108733643A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710276628.8A CN108733643A (zh) 2017-04-25 2017-04-25 基于版心的pdf文件对比的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710276628.8A CN108733643A (zh) 2017-04-25 2017-04-25 基于版心的pdf文件对比的方法及系统

Publications (1)

Publication Number Publication Date
CN108733643A true CN108733643A (zh) 2018-11-02

Family

ID=63934444

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710276628.8A Pending CN108733643A (zh) 2017-04-25 2017-04-25 基于版心的pdf文件对比的方法及系统

Country Status (1)

Country Link
CN (1) CN108733643A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232320A (zh) * 2020-12-14 2021-01-15 北京沃东天骏信息技术有限公司 印刷品文字的校对方法及相关设备
CN116091747A (zh) * 2023-04-10 2023-05-09 山东省地质矿产勘查开发局第五地质大队(山东省第五地质矿产勘查院) 一种测绘成果的验证方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101017479A (zh) * 2007-02-09 2007-08-15 北京大学 一种自动识别数字文档版心的方法
EP2354966A2 (en) * 2010-02-05 2011-08-10 Palo Alto Research Center Incorporated System and method for visual document comparison using localized two-dimensional visual fingerprints
CN103136094A (zh) * 2011-11-25 2013-06-05 阿里巴巴集团控股有限公司 一种页面测试方法及装置
CN103914496A (zh) * 2013-01-09 2014-07-09 北大方正集团有限公司 一种页面校对的方法和装置
CN104111960A (zh) * 2013-04-22 2014-10-22 阿里巴巴集团控股有限公司 一种页面的匹配方法和装置
CN104834645A (zh) * 2014-02-11 2015-08-12 阿里巴巴集团控股有限公司 用于展示版式文档的方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101017479A (zh) * 2007-02-09 2007-08-15 北京大学 一种自动识别数字文档版心的方法
EP2354966A2 (en) * 2010-02-05 2011-08-10 Palo Alto Research Center Incorporated System and method for visual document comparison using localized two-dimensional visual fingerprints
CN103136094A (zh) * 2011-11-25 2013-06-05 阿里巴巴集团控股有限公司 一种页面测试方法及装置
CN103914496A (zh) * 2013-01-09 2014-07-09 北大方正集团有限公司 一种页面校对的方法和装置
CN104111960A (zh) * 2013-04-22 2014-10-22 阿里巴巴集团控股有限公司 一种页面的匹配方法和装置
CN104834645A (zh) * 2014-02-11 2015-08-12 阿里巴巴集团控股有限公司 用于展示版式文档的方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232320A (zh) * 2020-12-14 2021-01-15 北京沃东天骏信息技术有限公司 印刷品文字的校对方法及相关设备
CN112232320B (zh) * 2020-12-14 2021-05-25 北京沃东天骏信息技术有限公司 印刷品文字的校对方法及相关设备
CN116091747A (zh) * 2023-04-10 2023-05-09 山东省地质矿产勘查开发局第五地质大队(山东省第五地质矿产勘查院) 一种测绘成果的验证方法及系统

Similar Documents

Publication Publication Date Title
KR101954851B1 (ko) 메타데이터 기반 영상 처리 방법 및 장치
CN103914496B (zh) 一种页面校对的方法和装置
US20150339838A1 (en) Image mask providing a machine-readable data matrix code
JPH04234261A (ja) カラーイメージを白黒イメージへ写像する方法及び装置
CN106295454B (zh) 用于处理2d彩色条形码的数据处理设备和方法
CN101251890B (zh) 基于多色域选择性形态学处理的视频图像肤色检测方法
TW201723930A (zh) 彩色二維條碼的產生方法
RU2009109697A (ru) Способ наложения одного изображения на другое, способ персонализации носителя данных с использованием способа наложения изображений и персонализированный носитель данных
JP2015507307A (ja) 読み取り可能マトリックスコード
CN101155248B (zh) 图像处理设备及产生轮廓图像数据的方法
CN107085505A (zh) 一种cdr文件自动处理和自动比对方法及系统
JP6327533B2 (ja) カメラベースのアプリケーション用の高容量2dカラーバーコードの設計および処理方法
JP2007241356A (ja) 画像処理装置および画像処理プログラム
CN108733643A (zh) 基于版心的pdf文件对比的方法及系统
US6381376B1 (en) Restoring a single image by connecting a plurality of character, shadow or picture input images
CN108460385A (zh) 一种文本图像分割方法与装置
CN101677351B (zh) 图像处理装置、图像形成装置和图像处理方法
JP2011040971A (ja) 画像処理装置、画像処理方法、および、画像処理プログラム
JP2008092447A (ja) 画像処理装置、画像出力装置、および画像処理方法
CN105376460A (zh) 图像处理装置以及图像处理方法
CN101197913B (zh) 图像处理设备及图像处理设备控制方法
JP2005184685A (ja) 画像処理装置、プログラムおよび記録媒体
CN103716506A (zh) 图像处理装置及图像处理方法
CN107852445B (zh) 图像处理装置
US9619901B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium using an elimination color to determine color processing for a document image

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181102