CN103914496A - 一种页面校对的方法和装置 - Google Patents

一种页面校对的方法和装置 Download PDF

Info

Publication number
CN103914496A
CN103914496A CN201310008693.4A CN201310008693A CN103914496A CN 103914496 A CN103914496 A CN 103914496A CN 201310008693 A CN201310008693 A CN 201310008693A CN 103914496 A CN103914496 A CN 103914496A
Authority
CN
China
Prior art keywords
single page
page document
modification
document
described modification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310008693.4A
Other languages
English (en)
Other versions
CN103914496B (zh
Inventor
谢倩倩
石绍坤
李佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201310008693.4A priority Critical patent/CN103914496B/zh
Priority to US14/093,771 priority patent/US9111396B2/en
Publication of CN103914496A publication Critical patent/CN103914496A/zh
Application granted granted Critical
Publication of CN103914496B publication Critical patent/CN103914496B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/189Automatic justification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/114Pagination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种页面校对的方法和装置,涉及印刷领域,能够提高文档页面的对比效率,该方法包括:将修改前文档和修改后文档分别拆分为至少一个修改前单页文档文件和修改后单页文档文件;在第一页面中添加至少一个修改前单页文档,在第二页面中添加至少一个修改后单页文档;设置第一页面中每个修改前单页文档与第二页面中每个修改后单页文档之间的关联关系;按照像素要素对比所有第一页面与第二页面之间有关联关系的修改前单页文档和修改后单页文档的预览图;当修改前单页文档与修改后单页文档中存在不同部分时,以标记不同部分的形式显示对比结果。本发明主要应用于文档页面的校对。

Description

一种页面校对的方法和装置
技术领域
本发明涉及印刷领域,尤其涉及一种页面校对的方法和装置。
背景技术
在排版印刷之前,排版人员需要对印刷品进行多次的校对,尤其是报纸和书籍的印刷,需要对其内容进行不断的更新和修改。并且由于每次对信息的修改在排版时只依靠人工来识别,所以这个过程会花费巨大的人力物力,而且由于人体本身的因素对于本次修改对比上次修改的内容也是不容易被察觉,因此整个校对过程效率不是很高。
现今,为了提高校对效率,降低人为失误,从而提高生产效率,而发展出了便携式文件格式文件(Portable Document Format,简称PDF)对比工具来进行PDF文档校对。但是现有的一些PDF对比工具对扫描的PDF文档或图片效果不是很明显,甚至对不出结果来。而且现有的PDF对比工具一般只能按照PDF页面的次序来对文档进行比对,比如若想比较两个PDF文档的第1页和第100页,通常比较困难,因此这种情况就需要人工干预来进行比对,从而降低了对比效率。其次现有文档对比工具无法对用正确的文档页面来替换有错误的文档页面。
发明内容
本发明的实施例提供一种页面校对的方法和装置,能够提高文档页面的对比效率,还可以用正确的文档页面来替换错误的文档页面。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,提供一种页面校对的方法,包括:
将修改前文档拆分为至少一个修改前单页文档文件,将修改后文档拆分为至少一个修改后单页文档文件,每个所述修改前单页文档文件包括:修改前单页文档和对应的预览图,每个所述修改后单页文档文件包含:修改后单页文档和对应的预览图;
在第一页面中添加至少一个所述修改前单页文档,在第二页面中添加至少一个所述修改后单页文档;
设置所述第一页面中每个所述修改前单页文档与所述第二页面中每个所述修改后单页文档之间的关联关系;
按照像素要素对比所有所述第一页面与所述第二页面之间有关联关系的所述修改前单页文档和所述修改后单页文档的预览图,所述像素要素包括像素值和像素点的灰度值;
当所述修改前单页文档与所述修改后单页文档中存在不同部分时,以标记所述不同部分的形式显示对比结果。
在第一种可能的实现方式中,根据第一方面,所述方法还包括:当对比结果为所述修改前单页文档与所述修改后单页文档中存在不同部分时,将所述修改后单页文档替换所述修改前单页文档。
在第二种可能的实现方式中,结合第一方面或第一种可能的实现方式,所述设置所述第一页面中每个所述修改前单页文档与所述第二页面中每个所述修改后单页文档之间的关联关系,包括:
将添加至少一个所述修改前单页文档至所述第一页面的顺序与添加至少一个所述修改后单页文档至所述第二页面的顺序相关联,并设置所述第一页面中每个所述修改前单页文档与所述第二页面中每个所述修改后单页文档之间的关联关系;
或者,
将所述第一页面中的至少一个所述修改前单页文档和所述第二页面中的至少一个所述修改后单页文档进行排序;
将移动后至少一个的所述修改前单页文档在所述第一页面中的顺序和移动后的至少一个的所述修改后单页文档在所述第二页面中的顺序相关联,并设置所述第一页面中每个所述修改前单页文档与所述第二页面中每个所述修改后单页文档之间的关联关系。
在第三种可能的实现方式中,结合第一方面或第一种可能的实现方式,所述按照像素要素对比所有所述第一页面与所述第二页面之间有具有关联关系的所述修改前单页文档和所述修改后单页文档的预览图,包括:
在按照所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图中确定对比区域;
将所述修改前单页文档和所述修改后单页文档的预览图中的对比区域以阵列的形式分割成相同大小的区域块;
对比分别属于所述修改前单页文档和所述修改后单页文档的相同位置处的区域块中的每个像素点的灰度值,并记录所述出现像素点的灰度值不同的区域块。
在第四种可能的实现方式中,根据第三种可能的实现方式,所述在按照所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图中确定对比区域,包括:
对比按照所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图的像素值的大小;
若所述修改前单页文档和所述修改后单页文档的预览图的像素值相同,则设置所述修改前单页文档和所述修改后单页文档的预览图的全部区域为所述对比区域;
若所述修改前单页文档和所述修改后单页文档的预览图的像素值不相同,则将像素值小的预览图的全部区域和所述像素值大的预览图中对应所述像素值小的预览图的像素坐标的区域设置为所述对比区域。
在第五种可能的实现方式中,根据第三种可能的实现方式,所述将所述修改前单页文档和所述修改后单页文档的预览图中的对比区域按照阵列形式分割成大小相同的区域块,包括:
将所述修改前单页文档和所述修改后单页文档的预览图中的对比区域长度方向的一个侧边和/或宽度方向的一个侧边增加预设宽度的空白像素区域,形成新的对比区域;
将所述新的对比区域按照阵列形式分割成大小相同的区域块。
第二方面,提供一种页面校对的装置,包括:
拆分单元,用于将修改前文档拆分为至少一个修改前单页文档文件,将修改后文档拆分为至少一个修改后单页文档文件,每个所述修改前单页文档文件包括:修改前单页文档和对应的预览图,每个所述修改后单页文档文件包含:修改后单页文档和对应的预览图;
存储单元,用于在第一页面中添加所述拆分单元拆分的至少一个所述修改前单页文档,在第二页面中添加所述拆分单元拆分的至少一个所述修改后单页文档;
关联单元,用于设置所述存储单元存储在所述第一页面中每个所述修改前单页文档与所述存储单元存储在所述第二页面中每个所述修改后单页文档之间的关联关系;
对比单元,用于按照像素要素对比所有所述第一页面与所述第二页面之间有所述关联单元设置的关联关系的所述修改前单页文档和所述修改后单页文档的预览图,所述像素要素包括像素值和像素点的灰度值;
显示单元,用于当所述对比单元对比所述修改前单页文档与所述修改后单页文档的对比结果存在不同部分时,以标记所述不同部分的形式显示对比结果。
在第一种可能的实现方式中,根据第二方面,所述装置还包括:
替换单元,用于当所述对比单元的所述对比结果为所述修改前单页文档与所述修改后单页文档中存在不同部分时,将所述修改后单页文档替换所述修改前单页文档。
在第二种可能的实现方式中,结合第二方面或第一种可能的实现方式,所述关联单元具体用于:将所述存储单元添加至少一个所述修改前单页文档至所述第一页面的顺序与所述存储单元添加至少一个所述修改后单页文档至所述第二页面的顺序相关联,并设置所述存储单元存储在所述第一页面中每个所述修改前单页文档与所述存储单元存储在所述第二页面中每个所述修改后单页文档之间的关联关系;
或者,
用于将所述存储单元存储在所述第一页面中的至少一个所述修改前单页文档和所述存储单元存储在所述第二页面中的至少一个所述修改后单页文档进行排序;将移动后至少一个的所述修改前单页文档在所述第一页面中的顺序和移动后的至少一个的所述修改后单页文档在所述第二页面中的顺序相关联,并设置所述存储单元存储在所述第一页面中每个所述修改前单页文档与所述存储单元存储在所述第二页面中每个所述修改后单页文档之间的关联关系。
在第三种可能的实现方式中,结合第一方面或第一种可能的实现方式,所述对比单元包括:
区域确定模块,用于在按照所述关联单元设置的所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图中确定对比区域;
区域分割模块,用于将所述区域确定模块确定的所述修改前单页文档和所述修改后单页文档的预览图中的对比区域以阵列的形式分割成相同大小的区域块;
区域对比模块,用于对比分别属于所述修改前单页文档和所述修改后单页文档的相同位置处的所述区域分割模块分割出的区域块中的每个像素点的灰度值,并记录所述出现像素点的灰度值不同的区域块。
在第四种可能的实现方式中,根据第三种可能的实现方式,所述区域确定模块还包括:
像素值对比子模块,用于对比按照所述关联单元设置的所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图的像素值的大小;
区域设置子模块,用于若所述像素值对比子模块对比的所述修改前单页文档和所述修改后单页文档的预览图的像素值相同,则设置所述修改前单页文档和所述修改后单页文档的预览图的全部区域为所述对比区域;还用于若所述修改前单页文档和所述修改后单页文档的预览图的像素值不相同,则将像素值小的预览图的全部区域和所述像素值大的预览图中对应所述像素值小的预览图的像素坐标的区域设置为所述对比区域。
在第五种可能的实现方式中,根据第三种可能的实现方式,所述区域分割模块还包括:
新区域形成子模块,用于将所述区域确定模块确定的所述修改前单页文档和所述修改后单页文档的预览图中的对比区域长度方向的一个侧边和/或宽度方向的一个侧边增加预设宽度的空白像素区域,形成新的对比区域;
区域分割子模块,用于将所述新区域形成子模块形成的所述新的对比区域按照阵列形式分割成大小相同的区域块。
本发明实施例提供的页面校对的方法和装置,能够根据像素的像素值、像素点的灰度值和像素坐标对比出相关联的修改前单页文档页面和修改后单页文档页面的不同之处,避免了人工操作,提高了文档页面的对比效率,还可以将修改前单页文档页面的不同之处的内容替换为对应的修改后单页文档页面的内容。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的实施例提供的一种页面校对的方法;
图2为本发明的实施例提供的另一种页面校对的方法;
图3为本发明的实施例提供的一种页面校对的装置;
图4为本发明的实施例提供的另一种页面校对的装置。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在排版印刷时,需要排版人员对印刷品的内容进行多次校对,由于在这个过程中会耗费巨大的人力物力,而且人体本身存在视觉误差,使得在校对过程中经常会产生误差,因此而发展出的PDF文档对比工具能够支持对PDF文档中的文字进行对比,但现有的一些PDF文档对比工具不能对图片形式的PDF文档进行对比,且对于对比出不同的错误文档页面内容无法用正确的文档页面内容来替换,因此为了实现快速高效的对两个PDF文档页面进行检错和替换的过程,本发明的实施例提供了一种页面校对的方法和装置,其中,页面校对的方法具体实现方式如下,参照图1所示,该方法包括如下步骤:
101、页面校对装置将修改前文档拆分为至少一个修改前单页文档文件,将修改后文档拆分为至少一个修改后单页文档文件。
每个修改前单页文档文件包括:修改前单页文档和对应的预览图,每个修改后单页文档文件包含:修改后单页文档和对应的预览图。
步骤101主要是对要进行校对的修改前文档和修改后文档进行预处理,将修改前文档和修改后文档进行拆分,分别生成单页文档和对应的具有一定分辨率的预览图,以便进行后续的对比过程。且上述的文档可以是单页文档也可以是多页文档,该文档包含文字信息或图片信息,并且上述的文档的格式包括但不限于CAJ(China AcademicJournals,中国学术期刊)、KDH(一种电子期刊的阅读格式)或PDF(Portable Document Format,便携式文件格式)等能够生成预览图的文档格式。
102、页面校对装置在第一页面中添加至少一个修改前单页文档,在第二页面中添加至少一个修改后单页文档。
103、页面校对装置设置第一页面中每个修改前单页文档与第二页面中每个修改后单页文档之间的关联关系。
进一步可选的,步骤203还包括:
103a、页面校对装置将添加至少一个修改前单页文档至第一页面的顺序与添加至少一个修改后单页文档至第二页面的顺序相关联,并设置第一页面中每个修改前单页文档与第二页面中每个修改后单页文档之间的关联关系。
或者,
103b、页面校对装置将第一页面中的至少一个修改前单页文档和第二页面中的至少一个修改后单页文档进行排序;将移动后至少一个的修改前单页文档在第一页面中的顺序和移动后的至少一个的修改后单页文档在第二页面中的顺序相关联,并设置为设置第一页面中每个修改前单页文档与第二页面中每个修改后单页文档之间的关联关系。
除此之外,用户还可以对第一页面中的至少一个修改前单页文档和第二页面中的至少一个修改后单页文档进行手动关联,首先将原有的默认关联关系取消,通过手动方式任意移动第一页面中的至少一个修改前单页文档和第二页面中的至少一个修改后单页的位置,确定好要进行后续对比的顺序,按照确定好的修改前单页文档和修改后单页文档的顺序依次一一对应的进行关联。
具体的,步骤103a中的关联关系为页面校对装置默认的关联关系,该关联关系是按照至少一个修改前单页文档添加至第一页面的顺序与至少一个修改后单页文档添加至第二页面的顺序来进行关联的,即按照修改前单页文档和修改后单页文档进行存储时的顺序来依次一一对应的进行关联。
步骤103b中的调整关联关系的方式可以理解为通过指定信息将第一页面中的至少一个修改前单页文档和第二页面中的至少一个修改后单页文档进行排序,然后按照该顺序进行关联。该指定信息可以为文档的格式信息(如,正文或封面)也可以为时间信息或名称信息,若按照文档的封面或正文来进行关联,即至少一个修改前单页文档中正文部分或封面部分的页面和至少一个修改后单页文档中的正文部分或封面部分的页面依次一一对应进行关联。
104、页面校对装置按照像素要素对比所有第一页面与第二页面之间有关联关系的修改前单页文档和修改后单页文档的预览图,该像素要素包括像素值和像素点的灰度值。
进一步可选的,参照图2所示,步骤104还包括:
104a、页面校对装置在按照关联关系关联的修改前单页文档和修改后单页文档的预览图中确定对比区域。
104a1、页面校对装置对比按照关联关系关联的修改前单页文档和修改后单页文档的预览图的像素值的大小。
具体的,本发明是基于对按照关联关系关联的修改前单页文档和修改后单页文档的预览图中的具有相同像素坐标的像素点的灰度值进行比较的,则只有将要进行对比的上述两个预览图中的对比区域中的像素值相同,且每个像素点所占的尺寸及像素坐标位置相同(即像素点的个数相同)才能进行像素点的灰度值的对比。而上述两个预览图的分辨率是相同的(即相同尺寸的预览图中具有的像素个数相同,且每个像素点所占的尺寸相同)。
因此只要对上述两个预览图中的像素值进行对比,便可确定上述两个预览图的对比区域,即如下述步骤104a2所述。
104a2、若修改前单页文档和修改后单页文档的预览图的像素值相同,则设置修改前单页文档和修改后单页文档的预览图的全部区域为对比区域。
若修改前单页文档和修改后单页文档的预览图的像素值不相同,则将像素值小的预览图的全部区域和像素值大的预览图中对应像素值小的预览图的像素坐标的区域设置为对比区域。
具体的,当按照关联关系关联的修改前单页文档和修改后单页文档的预览图的像素值相等时,则对比区域为该修改前单页文档和修改后单页文档的预览图全部区域。
当按照关联关系关联的修改前单页文档和修改后单页文档的预览图的像素值不相等时,则对比区域为上述预览图中的像素值小的预览图和上述预览图中的像素值大的预览图中的按照上述预览图中的像素值小的预览图中的所有像素坐标一一对应所找到的所有像素点组成的页面区域。
104b、页面校对装置将修改前单页文档和修改后单页文档的预览图中的对比区域以阵列的形式分割成相同大小的区域块。
进一步可选的,步骤104b还包括:
104b 1、页面校对装置将修改前单页文档和修改后单页文档的预览图中的对比区域长度方向的一个侧边和/或宽度方向的一个侧边增加预设宽度的空白像素区域,形成新的对比区域。
104b2、页面校对装置将新的对比区域按照阵列形式分割成大小相同的区域块。且该区域块的长和宽是预先设置的。
具体的,这里的空白像素区域是用于当对对比区域进行分割时,该对比区域的长度或宽度不能对预先设置的区域块的长和宽进行整除时而加的,且所加的空白像素区域的区域大小为一列或/和一行预设的区域块。当对比区域的长度不能整除预设的区域块的长度时,该空白像素区域为在对比区域的宽度方向的一个侧边加一列区域块,当对比区域的宽度不能整除预设的区域块的宽度时,该空白像素区域为在对比区域的长度方向的一个侧边加一行区域块,当对比区域的长度和宽度均不能整除预设的区域块的长度和宽度时,该空白像素区域为在对比区域的宽度方向的一个侧边和长度方向的一个侧边加上一列和一行区域块。
这样在对比区域分割成预设的区域块时,由于加上的空白像素区域,可以避免对比区域的长度和宽度不能整除预设的区域块的长度和宽度时,将边缘部分丢失。
104c、页面校对装置对比分别属于修改前单页文档和修改后单页文档的相同位置处的区域块中的每个像素点的灰度值,并记录出现像素点的灰度值不同的区域块。
具体的,当预览图为黑白图时,预览图中的像素点的像素坐标中所存储的是该像素点的灰度值,该灰度值的范围为0~255;当预览图为彩色图时,预览图中的像素点的像素坐标中所存储的是一个RGB值,即该值是由红绿蓝三色的灰度值组成的,其表现形式为(R,G,B),如(R,G,B)=(100,255,50),即红色的灰度值为50,绿色的灰度为255,蓝色的灰度值为50;因此不管该预览图为黑白图还是彩色图,在对区域块中的像素点进行对比时,均是对预览图中的像素点的像素坐标中所存储的灰度值进行对比的,不同的是在黑白图中对比的是一个灰度值,彩色图中对比的是三个灰度值,且这三个灰度值只要有一个值不相同,就判断进行对比的两个像素点的不同,进而记录包含该像素点的区域块。
其中,当修改前单页文档和修改后单页文档的预览图的像素值不相同时,将其上述预览图中的像素值大的预览图中的按照上述预览图中的像素值小的预览图中的所有像素坐标一一对应所找到的所有像素点组成的页面区域之外的剩余页面,已经是上述预览图中的不同区域,则直接进行记录。
105、当修改前单页文档与修改后单页文档中存在不同部分时,页面校对装置以标记不同部分的形式显示对比结果。
具体的,在对比完某个区域块之后,若该区域块中出现灰度值不同的像素点,则对该区域块进行记录。例如,建立一个与经过分割的对比区域相同的空白区域,当某个区域块中出现灰度值不同的像素点,即在该区域块对应的空白区域中的空白区域块中记录一个1。当对比完所有的区域块之后,将相邻的记录有1的空白区域块进行合并,并通过红色矩形框来显示该经过合并的区域块,然后将该红色矩形框显示在修改前单页文档与修改后单页文档中的对应区域块上。
除此之外,该页面校对装置还具有筛选功能,能将出现红色矩形框的修改前单页文档对应的第一页面列表位置和修改后单页文档对应的第二页面列表位置用红叉来表示,将未出现红色矩形框的修改前单页文档对应的第一页面列表位置和修改后单页文档对应的第二页面列表位置用绿勾来表示。这样就可以通过筛选功能来显示对比结果,该筛选功能的筛选条件可以为:显示全部页面,显示有差异页面,显示无差异页面和显示为处理页面。
可选的,该方法还包括:
106、当对比结果为修改前单页文档与修改后单页文档中存在不同部分时,页面校对装置将修改后单页文档替换修改前单页文档。即用户可以根据实际需求来选择是否替换有错误页面。
本发明实施例提供的页面校对的方法,能够根据像素的像素值、像素点的灰度值和像素坐标对比出相关联的修改前单页文档页面和修改后单页文档页面的不同之处,避免了人工操作,提高了文档页面的对比效率,还可以将修改前单页文档页面的不同之处的内容替换为对应的修改后单页文档页面的内容。
本发明的实施例提供一种页面校对装置,如图3所示,该页面校对装置3包括:拆分单元31、存储单元32、关联单元33、对比单元34和替换单元35,其中:
拆分单元31,用于将修改前文档拆分为至少一个修改前单页文档文件,将修改后文档拆分为至少一个修改后单页文档文件,每个修改前单页文档文件包括:修改前单页文档和对应的预览图,每个修改后单页文档文件包含:修改后单页文档和对应的预览图。
存储单元32,用于在第一页面中添加拆分单元31拆分的至少一个修改前单页文档,在第二页面中添加拆分单元31拆分的至少一个修改后单页文档。
关联单元33,用于设置存储单元32存储在第一页面中每个修改前单页文档与存储单元32存储在第二页面中每个修改后单页文档之间的关联关系。
对比单元34,用于按照像素要素对比所有第一页面与第二页面之间有关联单元33设置的关联关系的修改前单页文档和修改后单页文档的预览图,该像素要素包括像素值和像素点的灰度值。
显示单元35,用于当对比单元34对比修改前单页文档与修改后单页文档的对比结果存在不同部分时,以标记不同部分的形式显示对比结果。
可选的,该装置还包括:替换单元36,其中:
替换单元36,当对比单元34的对比结果为修改前单页文档与修改后单页文档中存在不同部分时,将修改后单页文档替换所述修改前单页文档。
进一步可选的,关联单元具体用于:将存储单元32添加至少一个修改前单页文档至第一页面的顺序与存储单元32添加至少一个修改后单页文档至第二页面的顺序相关联,并设置存储单元32存储在第一页面中每个修改前单页文档与存储单元32存储在第二页面中每个修改后单页文档之间的关联关系。
或者,
用于将存储单元32存储在第一页面中的至少一个修改前单页文档和存储单元32存储在第二页面中的至少一个修改后单页文档进行排序;将移动后至少一个的修改前单页文档在第一页面中的顺序和移动后的至少一个的修改后单页文档在第二页面中的顺序相关联,并设置存储单元32存储在第一页面中每个修改前单页文档与存储单元32存储在第二页面中每个修改后单页文档之间的关联关系。
进一步可选的,如图4所示,对比单元34包括:区域确定模块341、区域分割模块342和区域对比模块343,其中:
区域确定模块341,用于在按照关联单元33设置的关联关系关联的修改前单页文档和修改后单页文档的预览图中确定对比区域。
区域分割模块342,用于将区域确定模块341确定的修改前单页文档和修改后单页文档的预览图中的对比区域以阵列的形式分割成相同大小的区域块。
区域对比模块343,用于对比分别属于修改前单页文档和修改后单页文档的相同位置处的区域分割模块342分割出的区域块中的每个像素点的灰度值,并记录出现像素点的灰度值不同的区域块。
进一步可选的,如图4所示,该区域确定模块341还包括:
像素值对比子模块341a,用于对比按照关联关系33关联的修改前单页文档和修改后单页文档的预览图的像素值的大小。
区域设置子模块341b,用于若像素值对比子模块341a对比的修改前单页文档和修改后单页文档的预览图的像素值相同,则设置修改前单页文档和修改后单页文档的预览图的全部区域为对比区域;还用于若像素值对比子模块341a对比的修改前单页文档和修改后单页文档的预览图的像素值不相同,则将像素值小的预览图的全部区域和像素值大的预览图中对应像素值小的预览图的像素坐标的区域设置为对比区域。
进一步可选的,如图4所示,该区域分割模块342还包括:
新区域形成子模块342a,用于将区域确定模块341确定的修改前单页文档和修改后单页文档的预览图中的对比区域长度方向的一个侧边和/或宽度方向的一个侧边增加预设宽度的空白像素区域,形成新的对比区域。
区域分割子模块342b,用于将新区域形成子模块342a形成的新的对比区域按照阵列形式分割成大小相同的区域块。
本发明实施例提供的页面校对的装置,能够根据像素的像素值、像素点的灰度值和像素坐标对比出相关联的修改前单页文档页面和修改后单页文档页面的不同之处,避免了人工操作,提高了文档页面的对比效率,还可以将修改前单页文档页面的不同之处的内容替换为对应的修改后单页文档页面的内容。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (12)

1.一种页面校对的方法,其特征在于,包括:
将修改前文档拆分为至少一个修改前单页文档文件,将修改后文档拆分为至少一个修改后单页文档文件,每个所述修改前单页文档文件包括:修改前单页文档和对应的预览图,每个所述修改后单页文档文件包含:修改后单页文档和对应的预览图;
在第一页面中添加至少一个所述修改前单页文档,在第二页面中添加至少一个所述修改后单页文档;
设置所述第一页面中每个所述修改前单页文档与所述第二页面中每个所述修改后单页文档之间的关联关系;
按照像素要素对比所有所述第一页面与所述第二页面之间有关联关系的所述修改前单页文档和所述修改后单页文档的预览图,所述像素要素包括像素值和像素点的灰度值;
当所述修改前单页文档与所述修改后单页文档中存在不同部分时,以标记所述不同部分的形式显示对比结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:当对比结果为所述修改前单页文档与所述修改后单页文档中存在不同部分时,将所述修改后单页文档替换所述修改前单页文档。
3.根据权利要求1或2所述的方法,其特征在于,所述设置所述第一页面中每个所述修改前单页文档与所述第二页面中每个所述修改后单页文档之间的关联关系,包括:
将添加至少一个所述修改前单页文档至所述第一页面的顺序与添加至少一个所述修改后单页文档至所述第二页面的顺序相关联,并设置所述第一页面中每个所述修改前单页文档与所述第二页面中每个所述修改后单页文档之间的关联关系;
或者,
将所述第一页面中的至少一个所述修改前单页文档和所述第二页面中的至少一个所述修改后单页文档进行排序;
将移动后至少一个的所述修改前单页文档在所述第一页面中的顺序和移动后的至少一个的所述修改后单页文档在所述第二页面中的顺序相关联,并设置所述第一页面中每个所述修改前单页文档与所述第二页面中每个所述修改后单页文档之间的关联关系。
4.根据权利要求1或2所述的方法,其特征在于,所述按照像素要素对比所有所述第一页面与所述第二页面之间有具有关联关系的所述修改前单页文档和所述修改后单页文档的预览图,包括:
在按照所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图中确定对比区域;
将所述修改前单页文档和所述修改后单页文档的预览图中的对比区域以阵列的形式分割成相同大小的区域块;
对比分别属于所述修改前单页文档和所述修改后单页文档的相同位置处的区域块中的每个像素点的灰度值,并记录所述出现像素点的灰度值不同的区域块。
5.根据权利要求4所述的方法,其特征在于,所述在按照所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图中确定对比区域,包括:
对比按照所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图的像素值的大小;
若所述修改前单页文档和所述修改后单页文档的预览图的像素值相同,则设置所述修改前单页文档和所述修改后单页文档的预览图的全部区域为所述对比区域;
若所述修改前单页文档和所述修改后单页文档的预览图的像素值不相同,则将像素值小的预览图的全部区域和所述像素值大的预览图中对应所述像素值小的预览图的像素坐标的区域设置为所述对比区域。
6.根据权利要求4所述的方法,其特征在于,所述将所述修改前单页文档和所述修改后单页文档的预览图中的对比区域按照阵列形式分割成大小相同的区域块,包括:
将所述修改前单页文档和所述修改后单页文档的预览图中的对比区域长度方向的一个侧边和/或宽度方向的一个侧边增加预设宽度的空白像素区域,形成新的对比区域;
将所述新的对比区域按照阵列形式分割成大小相同的区域块。
7.一种页面校对的装置,其特征在于,包括:
拆分单元,用于将修改前文档拆分为至少一个修改前单页文档文件,将修改后文档拆分为至少一个修改后单页文档文件,每个所述修改前单页文档文件包括:修改前单页文档和对应的预览图,每个所述修改后单页文档文件包含:修改后单页文档和对应的预览图;
存储单元,用于在第一页面中添加所述拆分单元拆分的至少一个所述修改前单页文档,在第二页面中添加所述拆分单元拆分的至少一个所述修改后单页文档;
关联单元,用于设置所述存储单元存储在所述第一页面中每个所述修改前单页文档与所述存储单元存储在所述第二页面中每个所述修改后单页文档之间的关联关系;
对比单元,用于按照像素要素对比所有所述第一页面与所述第二页面之间有所述关联单元设置的关联关系的所述修改前单页文档和所述修改后单页文档的预览图,所述像素要素包括像素值和像素点的灰度值;
显示单元,用于当所述对比单元对比所述修改前单页文档与所述修改后单页文档的对比结果存在不同部分时,以标记所述不同部分的形式显示对比结果。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
替换单元,用于当所述对比单元的所述对比结果为所述修改前单页文档与所述修改后单页文档中存在不同部分时,将所述修改后单页文档替换所述修改前单页文档。
9.根据权利要求7或8所述的装置,其特征在于,所述关联单元具体用于:将所述存储单元添加至少一个所述修改前单页文档至所述第一页面的顺序与所述存储单元添加至少一个所述修改后单页文档至所述第二页面的顺序相关联,并设置所述存储单元存储在所述第一页面中每个所述修改前单页文档与所述存储单元存储在所述第二页面中每个所述修改后单页文档之间的关联关系;
或者,
用于将所述存储单元存储在所述第一页面中的至少一个所述修改前单页文档和所述存储单元存储在所述第二页面中的至少一个所述修改后单页文档进行排序;将移动后至少一个的所述修改前单页文档在所述第一页面中的顺序和移动后的至少一个的所述修改后单页文档在所述第二页面中的顺序相关联,并设置所述存储单元存储在所述第一页面中每个所述修改前单页文档与所述存储单元存储在所述第二页面中每个所述修改后单页文档之间的关联关系。
10.根据权利要求7或8所述的装置,其特征在于,所述对比单元包括:
区域确定模块,用于在按照所述关联单元设置的所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图中确定对比区域;
区域分割模块,用于将所述区域确定模块确定的所述修改前单页文档和所述修改后单页文档的预览图中的对比区域以阵列的形式分割成相同大小的区域块;
区域对比模块,用于对比分别属于所述修改前单页文档和所述修改后单页文档的相同位置处的所述区域分割模块分割出的区域块中的每个像素点的灰度值,并记录所述出现像素点的灰度值不同的区域块。
11.根据权利要求10所述的装置,其特征在于,所述区域确定模块还包括:
像素值对比子模块,用于对比按照所述关联单元设置的所述关联关系关联的所述修改前单页文档和所述修改后单页文档的预览图的像素值的大小;
区域设置子模块,用于若所述像素值对比子模块对比的所述修改前单页文档和所述修改后单页文档的预览图的像素值相同,则设置所述修改前单页文档和所述修改后单页文档的预览图的全部区域为所述对比区域;还用于若所述修改前单页文档和所述修改后单页文档的预览图的像素值不相同,则将像素值小的预览图的全部区域和所述像素值大的预览图中对应所述像素值小的预览图的像素坐标的区域设置为所述对比区域。
12.根据权利要求10所述的装置,其特征在于,所述区域分割模块还包括:
新区域形成子模块,用于将所述区域确定模块确定的所述修改前单页文档和所述修改后单页文档的预览图中的对比区域长度方向的一个侧边和/或宽度方向的一个侧边增加预设宽度的空白像素区域,形成新的对比区域;
区域分割子模块,用于将所述新区域形成子模块形成的所述新的对比区域按照阵列形式分割成大小相同的区域块。
CN201310008693.4A 2013-01-09 2013-01-09 一种页面校对的方法和装置 Expired - Fee Related CN103914496B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310008693.4A CN103914496B (zh) 2013-01-09 2013-01-09 一种页面校对的方法和装置
US14/093,771 US9111396B2 (en) 2013-01-09 2013-12-02 Page proofreading method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310008693.4A CN103914496B (zh) 2013-01-09 2013-01-09 一种页面校对的方法和装置

Publications (2)

Publication Number Publication Date
CN103914496A true CN103914496A (zh) 2014-07-09
CN103914496B CN103914496B (zh) 2017-04-19

Family

ID=51040186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310008693.4A Expired - Fee Related CN103914496B (zh) 2013-01-09 2013-01-09 一种页面校对的方法和装置

Country Status (2)

Country Link
US (1) US9111396B2 (zh)
CN (1) CN103914496B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733643A (zh) * 2017-04-25 2018-11-02 北大方正集团有限公司 基于版心的pdf文件对比的方法及系统
CN108921103A (zh) * 2018-07-05 2018-11-30 掌阅科技股份有限公司 用于校对的标记同步方法、计算设备及计算机存储介质
CN109858452A (zh) * 2019-02-15 2019-06-07 滨州建筑工程施工图审查中心 建筑图纸自动比对方法和装置
CN110390081A (zh) * 2018-04-17 2019-10-29 北大方正集团有限公司 文档比对方法、装置及设备
CN110688889A (zh) * 2019-08-06 2020-01-14 珠海格力电器股份有限公司 一种图文内容比对方法及装置
CN111105468A (zh) * 2019-12-05 2020-05-05 北大方正集团有限公司 印刷处理方法、装置及存储介质
CN111737965A (zh) * 2020-05-29 2020-10-02 北京百度网讯科技有限公司 文档的比对方法、装置、电子设备和可读存储介质
CN112100795A (zh) * 2019-06-17 2020-12-18 北京广联达云图梦想科技有限公司 一种计算机辅助设计图纸的对比方法及装置
CN113177392A (zh) * 2021-05-28 2021-07-27 掌阅科技股份有限公司 校对界面中行段信息同步方法、计算设备及存储介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160048605A1 (en) * 2014-08-14 2016-02-18 International Business Machines Corporation Integrating image renditions and page layout
CN109044845B (zh) * 2018-09-29 2021-11-16 河北盛世天昕电子科技有限公司 一种配药余量告警方法及装置
CN109214362B (zh) * 2018-10-23 2021-05-04 金蝶软件(中国)有限公司 单据处理方法及相关设备
US11093715B2 (en) * 2019-03-29 2021-08-17 Samsung Electronics Co., Ltd. Method and system for learning and enabling commands via user demonstration

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101686305A (zh) * 2008-09-25 2010-03-31 富士施乐株式会社 图像处理装置、图像处理方法和计算机可读介质
CN101958989A (zh) * 2009-07-16 2011-01-26 富士施乐株式会社 图像处理装置、图像处理系统及图像处理方法
US20120243796A1 (en) * 2011-03-23 2012-09-27 Fuji Xerox Co., Ltd. Image processing apparatus, computer readable medium storing program, and image processing method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7308649B2 (en) * 2003-09-30 2007-12-11 International Business Machines Corporation Providing scalable, alternative component-level views
US8725729B2 (en) * 2006-04-03 2014-05-13 Steven G. Lisa System, methods and applications for embedded internet searching and result display

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101686305A (zh) * 2008-09-25 2010-03-31 富士施乐株式会社 图像处理装置、图像处理方法和计算机可读介质
CN101958989A (zh) * 2009-07-16 2011-01-26 富士施乐株式会社 图像处理装置、图像处理系统及图像处理方法
US20120243796A1 (en) * 2011-03-23 2012-09-27 Fuji Xerox Co., Ltd. Image processing apparatus, computer readable medium storing program, and image processing method

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733643A (zh) * 2017-04-25 2018-11-02 北大方正集团有限公司 基于版心的pdf文件对比的方法及系统
CN110390081A (zh) * 2018-04-17 2019-10-29 北大方正集团有限公司 文档比对方法、装置及设备
CN108921103A (zh) * 2018-07-05 2018-11-30 掌阅科技股份有限公司 用于校对的标记同步方法、计算设备及计算机存储介质
CN109858452A (zh) * 2019-02-15 2019-06-07 滨州建筑工程施工图审查中心 建筑图纸自动比对方法和装置
CN112100795A (zh) * 2019-06-17 2020-12-18 北京广联达云图梦想科技有限公司 一种计算机辅助设计图纸的对比方法及装置
CN112100795B (zh) * 2019-06-17 2024-01-05 北京鸿鹄云图科技股份有限公司 一种计算机辅助设计图纸的对比方法及装置
CN110688889A (zh) * 2019-08-06 2020-01-14 珠海格力电器股份有限公司 一种图文内容比对方法及装置
CN111105468A (zh) * 2019-12-05 2020-05-05 北大方正集团有限公司 印刷处理方法、装置及存储介质
CN111105468B (zh) * 2019-12-05 2023-05-26 北大方正集团有限公司 印刷处理方法、装置及存储介质
CN111737965A (zh) * 2020-05-29 2020-10-02 北京百度网讯科技有限公司 文档的比对方法、装置、电子设备和可读存储介质
CN113177392A (zh) * 2021-05-28 2021-07-27 掌阅科技股份有限公司 校对界面中行段信息同步方法、计算设备及存储介质

Also Published As

Publication number Publication date
US20140193044A1 (en) 2014-07-10
CN103914496B (zh) 2017-04-19
US9111396B2 (en) 2015-08-18

Similar Documents

Publication Publication Date Title
CN103914496A (zh) 一种页面校对的方法和装置
US20070136660A1 (en) Creation of semantic objects for providing logical structure to markup language representations of documents
CN102262616A (zh) 表单处理系统、ocr装置、表单制作装置
CN102331914A (zh) 表单处理系统、ocr装置、表单制作装置及其处理方法
KR20150099936A (ko) 전자문서의 레이아웃 유지를 위한 대체폰트 적용 방법 및 그 장치
US20080018950A1 (en) Image reading apparatus, image reading method, and image reading program
US20080266606A1 (en) Optimized print layout
US9218327B2 (en) Optimizing the layout of electronic documents by reducing presentation size of content within document sections so that when combined a plurality of document sections fit within a page
CN116108804B (zh) 点码文件生成方法、内容审阅方法和内容审阅系统
CN111198664B (zh) 一种文档打印的方法、装置、计算机存储介质及终端
CN109145618B (zh) 一种基于灰度变换隐藏纸质黑白打印敏感数据的方法
US20100088584A1 (en) Methods and systems for processing a document in a print-production system
CN112365402B (zh) 智能组卷方法、装置、存储介质及电子设备
CN111104805A (zh) 一种翻译处理的方法、装置、计算机存储介质及终端
JP2007241355A (ja) 画像処理装置及び画像処理プログラム
JP4517822B2 (ja) 画像処理装置及びプログラム
JPS60222270A (ja) 表デ−タ差込み印刷装置
CN101242465A (zh) 成像装置和用于控制该成像装置的方法
JP2007087021A (ja) 紙文書の電子文書化装置,紙文書の電子文書化方法および紙文書の電子文書化用プログラム
US8375289B2 (en) Displaying a preview of document data including a region in which an object is inserted
CN106959940A (zh) 一种便于文档自动化录入的文档格式及转换和识别方法
JP6791061B2 (ja) 画像処理装置
JP3381567B2 (ja) 編集装置
JP2017195499A (ja) 画像蓄積装置及び画像蓄積プログラム
EP2711847A2 (en) Page data generation apparatus, recording medium and page data generation method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220620

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Beijing, Haidian District Cheng Fu Road 298, founder building, 5 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170419