CN106155994B - 一种页面内容的比较方法及装置、终端设备 - Google Patents
一种页面内容的比较方法及装置、终端设备 Download PDFInfo
- Publication number
- CN106155994B CN106155994B CN201610514132.5A CN201610514132A CN106155994B CN 106155994 B CN106155994 B CN 106155994B CN 201610514132 A CN201610514132 A CN 201610514132A CN 106155994 B CN106155994 B CN 106155994B
- Authority
- CN
- China
- Prior art keywords
- content
- pages
- scanning file
- scanning
- carrying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/197—Version control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
Abstract
本发明实施例涉及电子设备技术领域,公开了一种页面内容的比较方法及装置、终端设备,该方法包括:扫描页面标识相同的第一页面以及第二页面,得到第一页面的第一扫描文件以及第二页面的第二扫描文件,其中,第一扫描文件承载有第一页面的页面内容,第二扫描文件承载有第二页面的页面内容,比较第一扫描文件承载的页面内容与第二扫描文件承载的页面内容是否完全相同,若第一扫描文件承载的页面内容与第二扫描文件承载的页面内容不完全相同,则确定第一扫描文件承载的页面内容与第二扫描文件承载的页面内容之间存在的差异性页面内容。实施本发明实施例能够提高比较页面内容时的比较效率。
Description
技术领域
本发明涉及电子设备技术领域,具体涉及一种页面内容的比较方法及装置、终端设备。
背景技术
在当前的教育类电子产品中,通常会将纸质图书教材同步制作成有声点读资料,即在使用此教育类电子产品时,用户通过点读笔点击纸质图书教材任意页面上的任意内容时,教育类电子产品能够报读相应的语音。随着纸质图书教材的再排版再印刷,相应的有声点读资料也需要更新,因此,为了保证有声点读资料与新版纸质图书教材相匹配,确定新旧版本纸质图书教材间的差异显得尤为重要。
在实际应用中,确定新旧版本纸质图书教材间的差异的方式主要是人工比较的方式,即由人工比较新版本纸质图书教材与旧版本纸质图书教材中每个页面的页面内容(如每个页面中文字/图片的内容、大小及亮度值等),进而得到新旧版本纸质图书教材间的差异。实践发现,人工每小时能够比较5-10页的页面,对于普遍的100页左右的纸质图书教材来说,人工比较的方式大约需花费10-20个小时。可见,当前通过人工来比较页面内容的方式存在比较效率低的问题。
发明内容
本发明实施例公开了一种页面内容的比较方法及装置、终端设备,能够提高比较页面内容时的比较效率。
本发明实施例第一方面公开了一种页面内容的比较方法,所述方法包括:
扫描页面标识相同的第一页面以及第二页面,得到所述第一页面的第一扫描文件以及所述第二页面的第二扫描文件,所述第一扫描文件承载有所述第一页面的页面内容,所述第二扫描文件承载有所述第二页面的页面内容;
比较所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全相同;
若所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全相同,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容。
作为一种可选的实施方式,在本发明实施例第一方面中,所述比较所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全相同,包括:
重叠所述第一扫描文件以及所述第二扫描文件,并比较所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
若所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全相同。
作为一种可选的实施方式,在本发明实施例第一方面中,所述确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容,包括:
比较所述第一扫描文件的尺寸与所述第二扫描文件的尺寸是否相同;
若所述第一扫描文件的尺寸与所述第二扫描文件的尺寸不相同,则调整所述第一扫描文件的尺寸得到与所述第二扫描文件相同尺寸的第三扫描文件,并比较所述第三扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
若所述第三扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠,则根据所述第二扫描文件承载的页面内容的排版信息,对所述第一扫描文件承载的页面内容执行重排版操作,得到第四扫描文件;
比较所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
若所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面尺寸信息以及页面排版信息;
若所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面尺寸信息以及与所述第二扫描文件的图文信息不相同的所述第一扫描文件的图文信息。
作为一种可选的实施方式,在本发明实施例第一方面中,所述确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容,包括:
比较所述第一扫描文件的尺寸与所述第二扫描文件的尺寸是否相同;
若所述第一扫描文件的尺寸与所述第二扫描文件的尺寸相同,则根据所述第二扫描文件承载的页面内容的排版信息,对所述第一扫描文件承载的页面内容执行重排版操作,得到第四扫描文件;
比较所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
若所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面排版信息;
若所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括与所述第二扫描文件的图文信息不相同的所述第一扫描文件的图文信息。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
确定所述差异性页面内容的差异性参数,并判断所述差异性参数是否处于预设差异性参数范围内;
若所述差异性参数处于所述预设差异性参数范围内,则确定所述差异性页面内容为可忽略的差异性页面内容;
若所述差异性参数未处于所述预设差异性参数范围内,则确定所述差异性页面内容为不可忽略的差异性页面内容并输出。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
输出所述差异性页面内容以及针对所述差异性页面内容的忽略提示消息;
若接收到针对所述忽略提示消息输入的确认消息,则确定所述差异性页面内容的差异性参数并存储;
若未接收到所述确认消息,则存储所述页面标识以及所述差异性页面内容。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
若所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠,则确定所述第一扫描文件的亮度值与所述第二扫描文件的亮度值之间的亮度值差值;
判断所述亮度值差值是否处于预设亮度值差值范围内;
若所述亮度值差值处于所述预设亮度值差值范围内,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全相同;
若所述亮度值差值未处于所述预设亮度值差值范围内,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容为所述亮度值差值。
本发明实施例第二方面公开了一种页面内容的比较装置,所述装置包括扫描单元、比较单元以及确定单元,其中:
所述扫描单元,用于扫描页面标识相同的第一页面以及第二页面,得到所述第一页面的第一扫描文件以及所述第二页面的第二扫描文件,所述第一扫描文件承载有所述第一页面的页面内容,所述第二扫描文件承载有所述第二页面的页面内容;
所述比较单元,用于比较所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全相同;
所述确定单元,用于当所述比较单元比较出所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全相同时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容。
作为一种可选的实施方式,在本发明实施例第二方面中,所述比较单元包括重叠子单元、第一比较子单元以及第一确定子单元,其中:
所述重叠子单元,用于重叠所述第一扫描文件以及所述第二扫描文件;
所述第一比较子单元,用于比较所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
所述第一确定子单元,用于当所述第一比较子单元比较出所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全相同。
作为一种可选的实施方式,在本发明实施例第二方面中,所述确定单元包括第二比较子单元、调整子单元、排版子单元以及第二确定子单元,其中:
所述第二比较子单元,用于比较所述第一扫描文件的尺寸与所述第二扫描文件的尺寸是否相同;
所述调整子单元,用于当所述第二比较子单元比较出所述第一扫描文件的尺寸与所述第二扫描文件的尺寸不相同时,调整所述第一扫描文件的尺寸得到与所述第二扫描文件相同尺寸的第三扫描文件;
所述第二比较子单元,还用于比较所述第三扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
所述排版子单元,用于当所述第二比较子单元比较出所述第三扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠时,根据所述第二扫描文件承载的页面内容的排版信息,对所述第一扫描文件承载的页面内容执行重排版操作,得到第四扫描文件;
所述第二比较子单元,还用于比较所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
所述第二确定子单元,用于当所述第二比较子单元比较出所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面尺寸信息以及页面排版信息,且当所述第二比较子单元比较出所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面尺寸信息以及与所述第二扫描文件的图文信息不相同的所述第一扫描文件的图文信息。
作为一种可选的实施方式,在本发明实施例第二方面中,所述确定单元包括第二比较子单元、排版子单元以及第二确定子单元,其中:
所述第二比较子单元,用于比较所述第一扫描文件的尺寸与所述第二扫描文件的尺寸是否相同;
所述排版子单元,用于当所述第二比较子单元比较出所述第一扫描文件的尺寸与所述第二扫描文件的尺寸相同时,对所述第一扫描文件承载的页面内容执行重排版操作,得到第四扫描文件;
所述第二比较子单元,还用于比较所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
所述第二确定子单元,用于当所述第二比较子单元比较出所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面排版信息,且当所述第二比较子单元比较出所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括与所述第二扫描文件的图文信息不相同的所述第一扫描文件的图文信息。
作为一种可选的实施方式,在本发明实施例第二方面中,所述确定单元,还用于确定所述差异性页面内容的差异性参数;
所述装置还包括第一判断单元以及第一输出单元,其中:
所述第一判断单元,用于判断所述差异性参数是否处于预设差异性参数范围内;
所述确定单元,还用于当所述第一判断单元判断出所述差异性参数处于所述预设差异性参数范围内时,确定所述差异性页面内容为可忽略的差异性页面内容,且当所述第一判断单元判断出所述差异性参数未处于所述预设差异性参数范围内时,确定所述差异性页面内容为不可忽略的差异性页面内容;
所述第一输出单元,用于当所述差异性页面内容为所述不可忽略的差异性页面内容时,输出所述差异性页面内容。
作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括第二输出单元以及存储单元,其中:
所述第二输出单元,用于输出所述差异性页面内容以及针对所述差异性页面内容的忽略提示消息;
所述确定单元,还用于当接收到针对所述忽略提示消息输入的确认消息时,确定所述差异性页面内容的差异性参数;
所述存储单元,用于存储所述确定单元确定出的所述差异性页面内容的差异性参数;
所述存储单元,还用于当未接收到所述确认消息时,存储所述页面标识以及所述差异性页面内容。
作为一种可选的实施方式,在本发明实施例第二方面中,所述确定单元,还用于当所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠时,确定所述第一扫描文件的亮度值与所述第二扫描文件的亮度值之间的亮度值差值;
所述装置还包括第二判断单元,其中:
所述第二判断单元,用于判断所述亮度值差值是否处于预设亮度值差值范围内;
所述确定单元,还用于当所述第二判断单元判断出所述亮度值差值处于所述预设亮度值差值范围内时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全相同;
所述确定单元,还用于当所述第二判断单元判断出所述亮度值差值未处于所述预设亮度值差值范围内,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容为所述亮度值差值。
本发明实施例第三方面公开了一种终端设备,所述终端设备包括本发明实施例第二方面公开的页面内容的比较装置。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,扫描页面标识相同的第一页面以及第二页面,得到第一页面的第一扫描文件以及第二页面的第二扫描文件,其中,第一扫描文件承载有第一页面的页面内容,第二扫描文件承载有第二页面的页面内容,比较第一扫描文件承载的页面内容与第二扫描文件承载的页面内容是否完全相同,若第一扫描文件承载的页面内容与第二扫描文件承载的页面内容不完全相同,则确定第一扫描文件承载的页面内容与第二扫描文件承载的页面内容之间存在的差异性页面内容。可见,实施本发明实施例能够通过扫描页面得到扫描文件并比较扫描文件承载的页面内容是否相同的方式来比较页面间的页面内容是否存在差异,无需进行人工比较,提高了比较页面内容时的比较效率以及准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种页面内容的比较方法的流程示意图;
图2是本发明实施例公开的另一种页面内容的比较方法的流程示意图;
图3是本发明实施例公开的一种页面内容的比较装置的结构示意图;
图4是本发明实施例公开的另一种页面内容的比较装置的结构示意图;
图5是本发明实施例公开的又一种页面内容的比较装置的结构示意图;
图6是本发明实施例公开的又一种页面内容的比较装置的结构示意图;
图7是本发明实施例公开的又一种页面内容的比较装置的结构示意图;
图8是本发明实施例公开的一种终端设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种页面内容的比较方法及装置、终端设备,能够通过扫描页面得到扫描文件并比较扫描文件承载的页面内容是否相同的方式来比较页面间的页面内容是否存在差异,无需进行人工比较,提高了比较页面内容时的比较效率以及准确率。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种页面内容的比较方法的流程示意图。如图1所示,该页面内容的比较方法可以包括以下步骤:
101、终端设备扫描页面标识相同的第一页面以及第二页面,得到该第一页面的第一扫描文件以及该第二页面的第二扫描文件。
本发明实施例中,终端设备上可以安装有扫描应用,终端设备可以通过该扫描应用分别扫描页面标识相同的第一页面以及第二页面;或者,终端设备可以连接有两台扫描参数基本相同的智能扫描仪,其中,终端设备通过其中一台智能扫描仪扫描第一页面,并通过另外一台智能扫描仪扫描第二页面;或者,终端设备可以连接一台安装有两个扫描器的智能扫描仪,其中,两个扫描器的扫描参数基本相同,终端设备可以通过该智能扫描仪的其中一个扫描器扫描第一页面,并通过该智能扫描仪的另一个扫描器扫描第二页面。其中,该第一扫描文件承载有该第一页面的页面内容,该第二扫描文件承载有该第二页面的页面内容。需要说明的是,第一页面以及第二页面是不同版本的纸质图书教材中页面标识相同的页面,若第一页面为最新版本的纸质图书教材中的页面,优选的,该第二页面为该最新版本的纸质图书教材的上一个版本的纸质图书教材中与第一页面具有相同页面标识(相同页数)的页面。
102、终端设备比较上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容是否完全相同。
本发明实施例中,若步骤102的比较结果为否,则触发执行步骤103;若步骤102的比较结果为是,则终端设备可以继续扫描页面标识相同的第三页面以及第四页面,直至所有页面扫描完毕,本发明实施例不做限定。
作为一种可选的实施方式,终端设备比较上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容是否完全相同可以包括:
重叠上述第一扫描文件以及上述第二扫描文件,并比较上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容是否完全重叠;
若上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全重叠,则确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全相同。
进一步可选的,若上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容完全重叠,终端设备还可以执行以下操作:
终端设备确定上述第一扫描文件的亮度值与上述第二扫描文件的亮度值之间的亮度值差值,并判断该亮度值差值是否处于预设亮度值差值范围内;
若该亮度值差值处于预设亮度值差值范围内,则确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容完全相同;
若上述亮度值差值未处于预设亮度值差值范围内,则确定上述第一扫描文件承载的页面内容与第二扫描文件承载的页面内容之间存在的差异性页面内容为亮度值差值。
该可选的实施方式能够通过重叠上述第一扫描文件以及上述第二扫描文件的方式比较其承载的页面内容是否相同,无需人工比较,提高了比较页面内容时的比较效率和准确率。
作为另一种可选的实施方式,终端设备比较上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容是否完全相同可以包括:
终端设备分别以第一扫描文件的尺寸以及第二扫描文件的尺寸为依据,建立对应的第一比较坐标系以及第二比较坐标系;
比较第一比较坐标系中是否存在一个坐标范围,其中,该坐标范围内的页面内容与第二比较坐标系中相同坐标范围内的页面内容不相同;
若存在该坐标范围,则确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全相同。
103、若上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全相同,则终端设备确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容。
本发明实施例中,终端设备确定出的上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容即是上述第一页面的页面内容以及上述第二页面的页面内容之间存在的差异性页面内容。
作为一种可选的实施方式,终端设备确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容可以包括:
终端设备比较上述第一扫描文件的尺寸与上述第二扫描文件的尺寸是否相同;
若上述第一扫描文件的尺寸与上述第二扫描文件的尺寸不相同,则终端设备调整上述第一扫描文件的尺寸得到与上述第二扫描文件相同尺寸的第三扫描文件,并比较该第三扫描文件承载的页面内容与上述第二扫描文件承载的页面内容是否完全重叠;
若该第三扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全重叠,则终端设备根据上述第二扫描文件承载的页面内容的排版信息,对上述第一扫描文件承载的页面内容执行重排版操作,得到第四扫描文件;
终端设备比较该第四扫描文件承载的页面内容与上述第二扫描文件承载的页面内容是否完全重叠;
若该第四扫描文件承载的页面内容与上述第二扫描文件承载的页面内容完全重叠,则终端设备确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面尺寸信息以及页面排版信息;
若该第四扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全重叠,则终端设备确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面尺寸信息以及与上述第二扫描文件的图文信息不相同的上述第一扫描文件的图文信息,该图文信息可以包括图片信息和/或文字信息,其中,图片信息可以包括具体图像与该图像在对应扫描文件中的位置,文字信息可以包括具体文字内容与该文字内容在对应扫描文件中的位置。
在该可选的实施方式中,进一步可选的,终端设备还可以确定上述第一扫描文件的亮度值与上述第二扫描文件的亮度值之间的亮度值差值,若该亮度值差值未处于预设亮度值差值范围内,则终端设备确定出的上述差异性页面内容还可以包括该亮度值差值。
作为另一种可选的实施方式,终端设备确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容也可以包括:
终端设备比较上述第一扫描文件的尺寸与上述第二扫描文件的尺寸是否相同;
若上述第一扫描文件的尺寸与上述第二扫描文件的尺寸相同,则终端设备根据上述第二扫描文件承载的页面内容的排版信息对上述第一扫描文件承载的页面内容执行重排版操作,得到第四扫描文件;
终端设备比较第四扫描文件承载的页面内容与上述第二扫描文件承载的页面内容是否完全重叠;
若第四扫描文件承载的页面内容与上述第二扫描文件承载的页面内容完全重叠,则终端设备确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面排版信息;
若第四扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全重叠,则终端设备确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容包括与上述第二扫描文件的图文信息不相同的上述第一扫描文件的图文信息,该图文信息可以包括图片信息和/或文字信息,其中,图片信息可以包括具体图像与该图像在对应扫描文件中的位置,文字信息可以包括具体文字内容与该文字内容在对应扫描文件中的位置。
在该另一种可选的实施方式中,进一步可选的,终端设备还可以确定上述第一扫描文件的亮度值与上述第二扫描文件的亮度值之间的亮度值差值,若该亮度值差值未处于预设亮度值差值范围内,则终端设备确定出的上述差异性页面内容还可以包括该亮度值差值。
可见,实施图1所描述的页面内容的比较方法能够通过扫描页面得到扫描文件并比较扫描文件承载的页面内容是否相同的方式来比较页面间的页面内容是否存在差异以及确定出存在差异的页面内容,无需进行人工比较,提高了比较页面内容时的比较效率以及准确率。
实施例二
请参阅图2,图2是本发明实施例公开的另一种页面内容的比较方法的流程示意图。其中,图2所描述的方法可以应用于具有扫描功能的终端设备或者安装有智能扫描仪的终端设备或者连接有智能扫描仪的终端设备中。如图2所示,该页面内容的比较方法可以包括以下步骤:
201、扫描页面标识相同的第一页面以及第二页面,得到该第一页面的第一扫描文件以及该第二页面的第二扫描文件。
本发明实施例中,针对步骤201的详细描述请参照实施例一的步骤101,本发明实施例不再赘述。
202、比较上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容是否完全相同。
本发明实施例中,针对步骤202的详细描述请参照实施例一的步骤102,本发明实施例不再赘述。
203、若上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全相同,则终端设备确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容。
本发明实施例中,针对步骤203的详细描述请参照实施例一的步骤103,本发明实施例不再赘述。
204、确定上述差异性页面内容的差异性参数,并判断该差异性参数是否处于预设差异性参数范围内。
本发明实施例中,若步骤204的判断结果为是,则触发执行步骤205;若步骤204的判断结果为否,则触发执行步骤205。
205、确定上述差异性页面内容为可忽略的差异性页面内容。
206、确定上述差异性页面内容为不可忽略的差异性页面内容并输出。
本发明实施例中,举例来说,若上述差异性页面内容包括页面尺寸信息,则确定出的上述差异性页面内容的差异性参数可以为第一扫描文件的长与第二扫描文件的长的第一比例以及第一扫描文件的宽与第二扫描文件的宽的第二比例,若该第一比例处于预设第一比例范围和/或该第二比例处于预设第二比例范围内,则确定页面尺寸信息为可忽略的差异性页面内容。
本发明实施例能够根据预先存储的差异性参数范围自动的判断页面间的差异性页面内容是否为可忽略的差异性页面内容,无需人工判断,效率高。
在另一个可选的实施例中,该页面内容的比较方法除了可以包括步骤204-206之外,还可以包括以下步骤:
输出上述差异性页面内容以及针对上述差异性页面内容的忽略提示消息,该忽略提示消息用于提示是否忽略上述差异性页面内容;
若接收到针对忽略提示消息输入的确认消息,则确定上述差异性页面内容的差异性参数并存储,该确认消息用于指示确认忽略上述差异性页面内容;
若未接收到确认消息,则存储上述页面标识以及上述差异性页面内容。
该另一种可选的实施例能够在确定出差异性页面内容之后输出差异性页面内容供用户判断是否可以忽略,若是,则存储可忽略的差异性页面内容的差异性参数,这为后续判断其他页面间的差异性页面内容是否为可忽略的差异性页面内容提供了参数条件,提高了判断速度;若否,则确定上述差异性页面内容为上述页面标识对应的页面间的差异性页面内容并存储或者输出。这种输出确定出的差异性页面内容供用户选择的方式提高了确定出的差异性页面内容的准确性。
本发明实施例中,需要说明的是,上述差异性页面内容的差异性参数主要是针对页面尺寸信息的差异性参数和/或页面亮度的差异性参数。
可见,实施图2所描述的页面内容的比较方法能够通过扫描页面得到扫描文件并比较扫描文件承载的页面内容是否相同的方式来比较页面间的页面内容是否存在差异以及确定出存在差异的页面内容,无需进行人工比较,提高了比较页面内容时的比较效率以及准确率。
实施例三
请参阅图3,图3是本发明实施例公开的一种页面内容的比较装置的结构示意图。其中,该页面内容的比较装置300可以安装在具有扫描功能或者安装有智能扫描仪或者连接有智能扫描仪的终端设备中。如图3所示,该页面内容的比较装置300可以包括扫描单元301、比较单元302以及确定单元303,其中:
扫描单元301用于扫描页面标识相同的第一页面以及第二页面,得到该第一页面的第一扫描文件以及该第二页面的第二扫描文件。
本发明实施例中,该第一扫描文件承载有该第一页面的页面内容,该第二扫描文件承载有该第二页面的页面内容。需要说明的是,第一页面以及第二页面是不同版本的纸质图书教材中页面标识相同的页面,若第一页面为最新版本的纸质图书教材中的页面,优选的,该第二页面为该最新版本的纸质图书教材的上一个版本的纸质图书教材中与第一页面具有相同页面标识(相同页数)的页面。
比较单元302用于比较扫描单元301扫描得到的上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容是否完全相同。
确定单元303用于当比较单元302比较出上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全相同时,确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容。
可见,实施图3所描述的页面内容的比较装置300能够通过扫描页面得到扫描文件并比较扫描文件承载的页面内容是否相同的方式来比较页面间的页面内容是否存在差异,无需进行人工比较,提高了比较页面内容时的比较效率以及准确率。
在一个可选的实施例中,比较单元302可以包括重叠子单元3021、第一比较子单元3022以及第一确定子单元3023,进一步的,确定单元303可以包括第二比较子单元3031、调整子单元3032、排版子单元3033以及第二确定子单元3034,此时,该页面内容的比较装置300的结构可以如图4所示,图4是本发明实施例公开的另一种页面内容的比较装置的结构示意图。如图4所示:
重叠子单元3021用于重叠扫描单元301扫描得到的上述第一扫描文件以及上述第二扫描文件。
第一比较子单元3022用于比较上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容是否完全重叠。
第一确定子单元3023用于当第一比较子单元3022比较出上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全重叠时,确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全相同。
第二比较子单元3031用于当第一确定子单元3023确定出上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全相同时,比较上述第一扫描文件的尺寸与上述第二扫描文件的尺寸是否相同。
调整子单元3032用于当第二比较子单元3031比较出上述第一扫描文件的尺寸与上述第二扫描文件的尺寸不相同时,调整上述第一扫描文件的尺寸得到与上述第二扫描文件相同尺寸的第三扫描文件。
第二比较子单元3031还用于比较上述第三扫描文件承载的页面内容与上述第二扫描文件承载的页面内容是否完全重叠。
排版子单元3033用于当第二比较子单元3031比较出上述第三扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全重叠时,根据上述第二扫描文件承载的页面内容的排版信息,对上述第一扫描文件承载的页面内容执行重排版操作,得到第四扫描文件。
第二比较子单元3031还用于比较上述第四扫描文件承载的页面内容与上述第二扫描文件承载的页面内容是否完全重叠。
第二确定子单元3034用于当第二比较子单元3031比较出上述第四扫描文件承载的页面内容与上述第二扫描文件承载的页面内容完全重叠时,确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面尺寸信息以及页面排版信息,且当第二比较子单元3031比较出上述第四扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全重叠时,确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面尺寸信息以及与上述第二扫描文件的图文信息不相同的上述第一扫描文件的图文信息,该图文信息可以包括图片信息和/或文字信息。
在另一个可选的实施例中,排版子单元3033还可以用于当第二比较子单元3031比较出上述第一扫描文件的尺寸与上述第二扫描文件的尺寸相同时,对上述第一扫描文件承载的页面内容执行重排版操作,得到第四扫描文件。
第二比较子单元3031还可以用于比较上述第四扫描文件承载的页面内容与上述第二扫描文件承载的页面内容是否完全重叠。
第二确定子单元3034还可以用于当第二比较子单元3031比较出上述第四扫描文件承载的页面内容与上述第二扫描文件承载的页面内容完全重叠时,确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面排版信息,且当第二比较子单元3031比较出上述第四扫描文件承载的页面内容与上述第二扫描文件承载的页面内容不完全重叠时,确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容包括与上述第二扫描文件的图文信息不相同的上述第一扫描文件的图文信息。
在又一个可选的实施例中,确定单元303还可以用于确定上述差异性页面内容的差异性参数,且在图3所示的页面内容的比较装置300的基础上,该页面内容的比较装置300还可以包括第一判断单元304以及第一输出单元305,此时,该页面内容的比较装置300的结构可以如图5所示,图5是本发明实施例公开的又一种页面内容的比较装置的结构示意图。其中:
第一判断单元304用于判断确定单元303确定出的差异性参数是否处于预设差异性参数范围内。
确定单元303还可以用于当第一判断单元304判断出上述差异性参数处于预设差异性参数范围内时,确定上述差异性页面内容为可忽略的差异性页面内容,且当第一判断单元304判断出上述差异性参数未处于预设差异性参数范围内时,确定上述差异性页面内容为不可忽略的差异性页面内容。
第一输出单元305用于当确定单元303确定出上述差异性页面内容为不可忽略的差异性页面内容时,输出上述差异性页面内容。
可见,实施图5所描述的页面内容的比较装置300能够根据预先存储的差异性参数范围自动的判断页面间的差异性页面内容是否为可忽略的差异性页面内容,无需人工判断,效率高。
在又一个可选的实施例中,在图3所示的页面内容的比较装置的结构基础上,该页面内容的比较装置300还可以包括第二输出单元306以及存储单元307,此时,该页面内容的比较装置300的结构可以如图6所示,图6是本发明实施例公开的又一种页面内容的比较装置的结构示意图。其中:
第二输出单元306用于输出上述差异性页面内容以及针对上述差异性页面内容的忽略提示消息。
确定单元303还可以用于当接收到针对上述忽略提示消息输入的确认消息时,确定上述差异性页面内容的差异性参数;
存储单元307用于存储确定单元303确定出的上述差异性页面内容的差异性参数。
存储单元307还用于当未接收到上述确认消息时,存储上述页面标识以及上述差异性页面内容。
可见,实施图6所描述的页面内容的比较装置300能够在确定出差异性页面内容之后输出差异性页面内容供用户判断是否可以忽略,若是,则存储可忽略的差异性页面内容的差异性参数,这为后续判断其他页面间的差异性页面内容是否为可忽略的差异性页面内容提供了参数条件,提高了判断速度;若否,则确定上述差异性页面内容为上述页面标识对应的页面间的差异性页面内容并存储或者输出。这种输出确定出的差异性页面内容供用户选择的方式提高了确定出的差异性页面内容的准确性。
在又一个可选的实施例中,在图4所示的页面内容的比较装置300的结构基础上,该页面内容的比较装置300还可以包括第二判断单元308,此时,该页面内容的比较装置300的结构可以如图7所示,图7是本发明实施例公开的又一种页面内容的比较装置的结构示意图。其中:
确定单元303还可以用于当比较单元302中的第一比较子单元3022比较出上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容完全重叠时,确定上述第一扫描文件的亮度值与上述第二扫描文件的亮度值之间的亮度值差值。
具体的,当比较单元302中的第一比较子单元3022比较出上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容完全重叠时,确定单元303中的第二确定子单元确定上述第一扫描文件的亮度值与上述第二扫描文件的亮度值之间的亮度值差值。
第二判断单元308用于判断确定单元303中的第二确定子单元3034确定出的亮度值差值是否处于预设亮度值差值范围内。
确定单元303还可以用于当第二判断单元308判断出上述亮度值差值处于预设亮度值差值范围内时,确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容完全相同,且当第二判断单元308判断出上述亮度值差值未处于预设亮度值差值范围内时,确定上述第一扫描文件承载的页面内容与上述第二扫描文件承载的页面内容之间存在的差异性页面内容为亮度值差值。
实施例四
请参阅图8,图8是本发明实施例公开的一种终端设备的结构示意图。其中,图8所示的终端设备中可以安装有扫描应用或者智能扫描仪,或者,图8所示的终端设备连接有智能扫描仪。如图8所示,该终端设备可以包括页面内容的比较装置801、壳体802、电路板803以及电源804,其中,页面内容的比较装置801可以是图3至图7所描述的任意一个页面内容的比较装置,本发明实施例不再赘述,电路板803安置在壳体802围成的空间内部,页面内容的比较装置801设置在电路板803上,电源804用于为终端设备上的页面内容的比较装置801供电。可见,实施图8所描述的终端设备能够通过扫描页面得到扫描文件并比较扫描文件承载的页面内容是否相同的方式来比较页面间的页面内容是否存在差异以及确定出存在差异的页面内容,无需进行人工比较,提高了比较页面内容时的比较效率以及准确率。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种页面内容的比较方法及装置、终端设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (13)
1.一种页面内容的比较方法,其特征在于,所述方法包括:
扫描页面标识相同的第一页面以及第二页面,得到所述第一页面的第一扫描文件以及所述第二页面的第二扫描文件,所述第一扫描文件承载有所述第一页面的页面内容,所述第二扫描文件承载有所述第二页面的页面内容;
比较所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全相同;
若所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全相同,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容;
所述比较所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全相同,包括:
重叠所述第一扫描文件以及所述第二扫描文件,并比较所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
若所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全相同;
若所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠,确定所述第一扫描文件的亮度值与所述第二扫描文件的亮度值之间的亮度值差值,并判断所述亮度值差值是否处于预设亮度值差值范围内;若所述亮度值差值处于预设亮度值差值范围内,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全相同;若所述亮度值差值未处于预设亮度值差值范围内,则确定所述第一扫描文件承载的页面内容与第二扫描文件承载的页面内容之间存在的差异性页面内容为亮度值差值。
2.根据权利要求1所述的方法,其特征在于,所述确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容,包括:
比较所述第一扫描文件的尺寸与所述第二扫描文件的尺寸是否相同;
若所述第一扫描文件的尺寸与所述第二扫描文件的尺寸不相同,则调整所述第一扫描文件的尺寸得到与所述第二扫描文件相同尺寸的第三扫描文件,并比较所述第三扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
若所述第三扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠,则根据所述第二扫描文件承载的页面内容的排版信息,对所述第一扫描文件承载的页面内容执行重排版操作,得到第四扫描文件;
比较所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
若所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面尺寸信息以及页面排版信息;
若所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面尺寸信息以及与所述第二扫描文件的图文信息不相同的所述第一扫描文件的图文信息。
3.根据权利要求1所述的方法,其特征在于,所述确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容,包括:
比较所述第一扫描文件的尺寸与所述第二扫描文件的尺寸是否相同;
若所述第一扫描文件的尺寸与所述第二扫描文件的尺寸相同,则根据所述第二扫描文件承载的页面内容的排版信息对所述第一扫描文件承载的页面内容执行重排版操作,得到第四扫描文件;
比较所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
若所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面排版信息;
若所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括与所述第二扫描文件的图文信息不相同的所述第一扫描文件的图文信息。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
确定所述差异性页面内容的差异性参数,并判断所述差异性参数是否处于预设差异性参数范围内;
若所述差异性参数处于所述预设差异性参数范围内,则确定所述差异性页面内容为可忽略的差异性页面内容;
若所述差异性参数未处于所述预设差异性参数范围内,则确定所述差异性页面内容为不可忽略的差异性页面内容并输出。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
输出所述差异性页面内容以及针对所述差异性页面内容的忽略提示消息;
若接收到针对所述忽略提示消息输入的确认消息,则确定所述差异性页面内容的差异性参数并存储;
若未接收到所述确认消息,则存储所述页面标识以及所述差异性页面内容。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠,则确定所述第一扫描文件的亮度值与所述第二扫描文件的亮度值之间的亮度值差值;
判断所述亮度值差值是否处于预设亮度值差值范围内;
若所述亮度值差值处于所述预设亮度值差值范围内,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全相同;
若所述亮度值差值未处于所述预设亮度值差值范围内,则确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容为所述亮度值差值。
7.一种页面内容的比较装置,其特征在于,所述装置包括扫描单元、比较单元以及确定单元,其中:
所述扫描单元,用于扫描页面标识相同的第一页面以及第二页面,得到所述第一页面的第一扫描文件以及所述第二页面的第二扫描文件,所述第一扫描文件承载有所述第一页面的页面内容,所述第二扫描文件承载有所述第二页面的页面内容;
所述比较单元,用于比较所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全相同;
所述确定单元,用于当所述比较单元比较出所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全相同时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容;
所述比较单元包括重叠子单元、第一比较子单元以及第一确定子单元,其中:
所述重叠子单元,用于重叠所述第一扫描文件以及所述第二扫描文件;
所述第一比较子单元,用于比较所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
所述第一确定子单元,用于当所述第一比较子单元比较出所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全相同;
所述第一比较子单元比较出所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠时,确定单元中的第二确定子单元确定所述第一扫描文件的亮度值与所述第二扫描文件的亮度值之间的亮度值差值;第二判断单元用于判断确定单元中的第二确定子单元确定出的亮度值差值是否处于预设亮度值差值范围内;确定单元还用于当第二判断单元判断出上述亮度值差值处于预设亮度值差值范围内时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全相同,且当第二判断单元判断出所述亮度值差值未处于预设亮度值差值范围内时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容为亮度值差值。
8.根据权利要求7所述的装置,其特征在于,所述确定单元包括第二比较子单元、调整子单元、排版子单元以及第二确定子单元,其中:
所述第二比较子单元,用于比较所述第一扫描文件的尺寸与所述第二扫描文件的尺寸是否相同;
所述调整子单元,用于当所述第二比较子单元比较出所述第一扫描文件的尺寸与所述第二扫描文件的尺寸不相同时,调整所述第一扫描文件的尺寸得到与所述第二扫描文件相同尺寸的第三扫描文件;
所述第二比较子单元,还用于比较所述第三扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
所述排版子单元,用于当所述第二比较子单元比较出所述第三扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠时,根据所述第二扫描文件承载的页面内容的排版信息,对所述第一扫描文件承载的页面内容执行重排版操作,得到第四扫描文件;
所述第二比较子单元,还用于比较所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
所述第二确定子单元,用于当所述第二比较子单元比较出所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面尺寸信息以及页面排版信息,且当所述第二比较子单元比较出所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面尺寸信息以及与所述第二扫描文件的图文信息不相同的所述第一扫描文件的图文信息。
9.根据权利要求7所述的装置,其特征在于,所述确定单元包括第二比较子单元、排版子单元以及第二确定子单元,其中:
所述第二比较子单元,用于比较所述第一扫描文件的尺寸与所述第二扫描文件的尺寸是否相同;
所述排版子单元,用于当所述第二比较子单元比较出所述第一扫描文件的尺寸与所述第二扫描文件的尺寸相同时,对所述第一扫描文件承载的页面内容执行重排版操作,得到第四扫描文件;
所述第二比较子单元,还用于比较所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容是否完全重叠;
所述第二确定子单元,用于当所述第二比较子单元比较出所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括页面排版信息,且当所述第二比较子单元比较出所述第四扫描文件承载的页面内容与所述第二扫描文件承载的页面内容不完全重叠时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容包括与所述第二扫描文件的图文信息不相同的所述第一扫描文件的图文信息。
10.根据权利要求7-9任一项所述的装置,其特征在于,所述确定单元,还用于确定所述差异性页面内容的差异性参数;
所述装置还包括第一判断单元以及第一输出单元,其中:
所述第一判断单元,用于判断所述差异性参数是否处于预设差异性参数范围内;
所述确定单元,还用于当所述第一判断单元判断出所述差异性参数处于所述预设差异性参数范围内时,确定所述差异性页面内容为可忽略的差异性页面内容,且当所述第一判断单元判断出所述差异性参数未处于所述预设差异性参数范围内时,确定所述差异性页面内容为不可忽略的差异性页面内容;
所述第一输出单元,用于当所述差异性页面内容为所述不可忽略的差异性页面内容时,输出所述差异性页面内容。
11.根据权利要求7-9任一项所述的装置,其特征在于,所述装置还包括第二输出单元以及存储单元,其中:
所述第二输出单元,用于输出所述差异性页面内容以及针对所述差异性页面内容的忽略提示消息;
所述确定单元,还用于当接收到针对所述忽略提示消息输入的确认消息时,确定所述差异性页面内容的差异性参数;
所述存储单元,用于存储所述确定单元确定出的所述差异性页面内容的差异性参数;
所述存储单元,还用于当未接收到所述确认消息时,存储所述页面标识以及所述差异性页面内容。
12.根据权利要求7所述的装置,其特征在于,所述确定单元,还用于当所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全重叠时,确定所述第一扫描文件的亮度值与所述第二扫描文件的亮度值之间的亮度值差值;
所述装置还包括第二判断单元,其中:
所述第二判断单元,用于判断所述亮度值差值是否处于预设亮度值差值范围内;
所述确定单元,还用于当所述第二判断单元判断出所述亮度值差值处于所述预设亮度值差值范围内时,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容完全相同;
所述确定单元,还用于当所述第二判断单元判断出所述亮度值差值未处于所述预设亮度值差值范围内,确定所述第一扫描文件承载的页面内容与所述第二扫描文件承载的页面内容之间存在的差异性页面内容为所述亮度值差值。
13.一种终端设备,其特征在于,所述终端设备包括如权利要求7-12任一项所述的页面内容的比较装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610514132.5A CN106155994B (zh) | 2016-06-30 | 2016-06-30 | 一种页面内容的比较方法及装置、终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610514132.5A CN106155994B (zh) | 2016-06-30 | 2016-06-30 | 一种页面内容的比较方法及装置、终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106155994A CN106155994A (zh) | 2016-11-23 |
CN106155994B true CN106155994B (zh) | 2019-04-26 |
Family
ID=57351007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610514132.5A Active CN106155994B (zh) | 2016-06-30 | 2016-06-30 | 一种页面内容的比较方法及装置、终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106155994B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111078084B (zh) * | 2019-06-09 | 2021-06-01 | 广东小天才科技有限公司 | 一种点读控制方法及终端设备 |
CN116233327A (zh) * | 2023-05-10 | 2023-06-06 | 深圳传音控股股份有限公司 | 处理方法、智能终端及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1434165A1 (en) * | 2002-11-25 | 2004-06-30 | Eastman Kodak Company | Method and system for detecting a geometrically transformed copy of an image |
CN101196994A (zh) * | 2007-12-26 | 2008-06-11 | 腾讯科技(深圳)有限公司 | 图片内容识别方法及识别系统 |
EP2065813A1 (en) * | 2007-11-30 | 2009-06-03 | Xerox Corporation | Object comparison, retrieval, and categorization methods and apparatuses |
CN101571875A (zh) * | 2009-05-05 | 2009-11-04 | 程治永 | 一种基于图像识别的图像搜索系统的实现方法 |
CN101753764A (zh) * | 2008-12-17 | 2010-06-23 | 夏普株式会社 | 图像处理装置及方法、图像读取装置、图像发送装置 |
CN103345481A (zh) * | 2013-06-19 | 2013-10-09 | 新疆大学 | 一种维吾尔文图像文件的标注方法 |
EP2862100A1 (en) * | 2012-06-15 | 2015-04-22 | En-Hui Yang | Methods and systems for automatically and efficiently categorizing, transmitting, and managing multimedia contents |
-
2016
- 2016-06-30 CN CN201610514132.5A patent/CN106155994B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1434165A1 (en) * | 2002-11-25 | 2004-06-30 | Eastman Kodak Company | Method and system for detecting a geometrically transformed copy of an image |
EP2065813A1 (en) * | 2007-11-30 | 2009-06-03 | Xerox Corporation | Object comparison, retrieval, and categorization methods and apparatuses |
CN101196994A (zh) * | 2007-12-26 | 2008-06-11 | 腾讯科技(深圳)有限公司 | 图片内容识别方法及识别系统 |
CN101753764A (zh) * | 2008-12-17 | 2010-06-23 | 夏普株式会社 | 图像处理装置及方法、图像读取装置、图像发送装置 |
CN101571875A (zh) * | 2009-05-05 | 2009-11-04 | 程治永 | 一种基于图像识别的图像搜索系统的实现方法 |
EP2862100A1 (en) * | 2012-06-15 | 2015-04-22 | En-Hui Yang | Methods and systems for automatically and efficiently categorizing, transmitting, and managing multimedia contents |
CN103345481A (zh) * | 2013-06-19 | 2013-10-09 | 新疆大学 | 一种维吾尔文图像文件的标注方法 |
Non-Patent Citations (4)
Title |
---|
Content based retrieval systems;V N Gudivada 等;《IEEE Computer》;19951231;第28卷(第9期);第18-22页 |
图像差异的分析与识别;刘勇 等;《复旦学报(自然科学版)》;20001031;第39卷(第5期);第472-476页 |
基于内容的图像检索技术研究;黄祥林 等;《电子学报》;20020731;第30卷(第7期);第1065-1071页 |
异或法实现图像差异提取;彭毅;《豆丁网www.docin.com/p-1039812642.html》;20150125;第1页5段,图3 |
Also Published As
Publication number | Publication date |
---|---|
CN106155994A (zh) | 2016-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106155994B (zh) | 一种页面内容的比较方法及装置、终端设备 | |
US9497343B2 (en) | Image forming apparatus, method for displaying operating screen, and storage medium | |
JP7298675B2 (ja) | 画像処理装置、方法、およびプログラム | |
JP2007318519A (ja) | 画像形成装置およびプリントシステム | |
CN106303133B (zh) | 一种图书页面的扫描控制方法及装置、扫描设备 | |
US8665477B2 (en) | Print system, printing apparatus, and computer program product | |
CN106738931A (zh) | 一种3d打印系统 | |
CN110351428A (zh) | 一种日程提醒的方法、终端设备和存储介质 | |
GB2391363A (en) | The display of browsing history or previously accessed data on a mobile phones idle screen. | |
KR940022268A (ko) | Ⅰ/o 메모리 카드 및 i/o 메모리 카드 제어방법 | |
US9888139B2 (en) | Non-transitory computer-readable recording medium storing computer-readable instructions for causing portable terminal to execute communication processing with image processing device, portable terminal, and communication system | |
CN206733614U (zh) | 一种3d打印系统 | |
US9749487B2 (en) | Document reading device that detects orientation of image read from spread document | |
CN106201153A (zh) | 一种操作入口展示方法及装置 | |
CN102841885B (zh) | 建立对象锚定关系的方法和装置 | |
CN104156145A (zh) | 基于手写笔的文本内容选定方法及便携式终端 | |
CN104346385A (zh) | 云端服务器以及图像存储系统 | |
CN106055416B (zh) | 数据跨应用转移的方法和装置 | |
CN106569852A (zh) | 一种烧录方法及装置 | |
JP6201638B2 (ja) | 帳票処理装置及びプログラム | |
JP3953949B2 (ja) | プレゼンテーション装置 | |
JP2017063332A (ja) | 画像形成装置及び画像形成方法 | |
US20030225824A1 (en) | System and method for transferring image data to a server | |
JP3843058B2 (ja) | ガンマ補正データ書き換え装置 | |
US10855859B2 (en) | Information processing apparatus and non-transitory computer readable medium for outputting information to change a setting item |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |