CN109815426A - 页面信息检测方法及装置、终端和计算机可读存储介质 - Google Patents
页面信息检测方法及装置、终端和计算机可读存储介质 Download PDFInfo
- Publication number
- CN109815426A CN109815426A CN201811535113.6A CN201811535113A CN109815426A CN 109815426 A CN109815426 A CN 109815426A CN 201811535113 A CN201811535113 A CN 201811535113A CN 109815426 A CN109815426 A CN 109815426A
- Authority
- CN
- China
- Prior art keywords
- information
- page
- sample
- page info
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 43
- 230000000052 comparative effect Effects 0.000 claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 16
- 230000009193 crawling Effects 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 14
- 230000003321 amplification Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 abstract description 5
- 238000012986 modification Methods 0.000 abstract description 5
- 230000000694 effects Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 230000010485 coping Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
本发明提出了一种页面信息检测方法及装置、终端和计算机可读存储介质,其中,该方法包括:通过文字爬取脚本获取预定存储位置的样本文件内的样本信息;通过统一资源定位符获取H5页面中的页面信息;根据所述H5页面的页面标识和/或所述页面信息的关键字,在所述样本信息中选择对应的待对比信息;将所述页面信息与所述待对比信息进行对比,得到差异信息;按照预定标记方式,在所述H5页面中标记所述差异信息。通过本发明的技术方案,可供用户快速、直观地得到页面信息与样本信息的不同,便于对H5页面的页面信息进行修改,提升了H5页面的内容检测效率、准确率和修改效率。
Description
【技术领域】
本发明涉及计算机技术领域,尤其涉及一种页面信息检测方法及装置、终端和计算机可读存储介质。
【背景技术】
H5,是HTML5的简称,它相比H5页面,H5页面有更多的交互和功能,最大的优点之一是在移动设备上支持多媒体。目前,H5页面越来越多地应用于微信等应用的活动页面,这些活动页面中往往具有大量的活动规则。在页面制作过程中,将文本文件中的活动规则导入H5页面时易发生活动规则内容丢失、错乱等情况,目前,对此情况的应对方式为人工核查。
然而,H5页面中的活动规则既包括页面内活动规则,还包括将页面分享到微信中去所应遵守的规则,整体来说,活动规则的文字量很大,导致人工核查的效率很低,并且,人工核查容易造成疏漏,影响最终的页面效果。
因此,如何高效地对H5页面进行内容检测,成为目前亟待解决的技术问题。
【发明内容】
本发明实施例提供了一种页面信息检测方法及装置、终端和计算机可读存储介质,旨在解决相关技术中H5页面内容易出错的技术问题,能够高效地对H5页面进行内容检测,节省人工成本,提升H5页面的页面效果。
第一方面,本发明实施例提供了一种页面信息检测方法,包括:通过文字爬取脚本获取预定存储位置的样本文件内的样本信息;通过统一资源定位符获取H5页面中的页面信息;根据所述H5页面的页面标识和/或所述页面信息的关键字,在所述样本信息中选择对应的待对比信息;将所述页面信息与所述待对比信息进行对比,得到差异信息;按照预定标记方式,在所述H5页面中标记所述差异信息。
在本发明上述实施例中,可选地,在所述根据所述H5页面的页面标识和/或所述页面信息的关键字,在所述样本信息中选择对应的待对比信息的步骤之前,还包括:将所述页面信息按照信息类型划分为若干项子信息,其中,所述页面信息的信息类型包括:标题文字、活动规则文字和功能选项文字;则所述根据所述H5页面的页面标识和/或所述页面信息的关键字,在所述样本信息中选择对应的待对比信息的步骤,包括:根据所述若干项子信息中每项子信息的关键字和所述信息类型,为所述每项子信息在所述样本信息中选择对应的待对比信息;则所述将所述页面信息与所述待对比信息进行对比,得到差异信息的步骤,包括:将所述每项子信息与对应的所述待对比信息进行对比,得到所述每项子信息对应的所述差异信息。
在本发明上述实施例中,可选地,所述通过文字爬取脚本获取预定存储位置的样本文件内的样本信息的步骤,包括:每隔预定时间间隔,通过所述文字爬取脚本获取所述预定存储位置的所述样本文件内的所述样本信息。
在本发明上述实施例中,可选地,所述按照预定标记方式,在所述H5页面中标记所述差异信息的步骤,包括以下一个或多个步骤:将所述差异信息的文字颜色标记为第一指定颜色;将所述差异信息所在位置填充为第二指定颜色;和对所述差异信息进行字体放大、字体加粗和字体倾斜中的一项或多项处理。
在本发明上述实施例中,可选地,所述将所述差异信息的文字颜色标记为第一指定颜色的步骤,包括:确定所述差异信息的错误类型;将所述差异信息的文字颜色标记为所述错误类型对应的所述第一指定颜色;所述将所述差异信息所在位置填充为第二指定颜色的步骤,包括:确定所述差异信息的错误类型;将所述差异信息所在位置填充为所述错误类型对应的所述第二指定颜色。
在本发明上述实施例中,可选地,还包括:根据所述样本文件内的所述样本信息,自动对所述差异信息进行修改。
第二方面,本发明实施例提供了一种页面信息检测装置,包括:第一获取单元,用于通过文字爬取脚本获取预定存储位置的样本文件内的样本信息;第二获取单元,用于通过统一资源定位符获取H5页面中的页面信息;待对比信息选择单元,用于根据所述H5页面的页面标识和/或所述页面信息的关键字,在所述样本信息中选择对应的待对比信息;信息对比单元,用于将所述页面信息与所述待对比信息进行对比,得到差异信息;差异信息标记单元,用于按照预定标记方式,在所述H5页面中标记所述差异信息。
在本发明上述实施例中,可选地,还包括:页面信息分类单元,用于在所述待对比信息选择单元在所述样本信息中选择对应的待对比信息之前,将所述页面信息按照信息类型划分为若干项子信息,其中,所述页面信息的信息类型包括:标题文字、活动规则文字和功能选项文字;所述待对比信息选择单元用于:根据所述若干项子信息中每项子信息的关键字和所述信息类型,为所述每项子信息在所述样本信息中选择对应的待对比信息;则所述信息对比单元用于:将所述每项子信息与对应的所述待对比信息进行对比,得到所述每项子信息对应的所述差异信息。
在本发明上述实施例中,可选地,所述第一获取单元用于:每隔预定时间间隔,通过所述文字爬取脚本获取所述预定存储位置的所述样本文件内的所述样本信息。
在本发明上述实施例中,可选地,所述差异信息标记单元包括以下单元中的一个或多个:第一处理单元,用于将所述差异信息的文字颜色标记为第一指定颜色;第二处理单元,用于将所述差异信息所在位置填充为第二指定颜色;第三处理单元,用于对所述差异信息进行字体放大、字体加粗和字体倾斜中的一项或多项处理。
在本发明上述实施例中,可选地,所述第一处理单元用于:确定所述差异信息的错误类型;将所述差异信息的文字颜色标记为所述错误类型对应的所述第一指定颜色;所述第二处理单元用于:确定所述差异信息的错误类型;将所述差异信息所在位置填充为所述错误类型对应的所述第二指定颜色。
在本发明上述实施例中,可选地,还包括:自动修改单元,用于根据所述样本文件内的所述样本信息,自动对所述差异信息进行修改。
第三方面,本发明实施例提供了一种终端,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述第一方面中任一项所述的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述第一方面中任一项所述的方法流程。
以上技术方案,针对相关技术中H5页面内容易出错的技术问题,可以爬取样本文件内的样本信息以及H5页面中的页面信息,并自动对页面信息与样本信息进行对比,得到差异信息,最后将差异信息标记出来。
具体来说,样本文件存储在预定存储位置,通过预设的文字爬取脚本可直接访问该预定存储位置,从而获得样本文件内的样本信息,而对于H5页面,则可通过统一资源定位符指示的H5页面位置和H5页面访问方法对H5页面进行访问,从而得到其页面信息。
接着,可以将页面信息与样本信息进行对比,得到差异信息,差异信息指的是页面信息与样本信息中对应位置处不同的信息,由此,即可将页面信息中不同于样本信息的内容作为差异信息标记出来,以便直观展示H5页面中的页面信息错误,便于进一步对差异信息进行修改。
通过以上技术方案,可供用户快速、直观地得到页面信息与样本信息的不同,便于对H5页面的页面信息进行修改,提升了H5页面的内容检测效率、准确率和修改效率。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了本发明的一个实施例的页面信息检测方法的流程图;
图2示出了本发明的另一个实施例的页面信息检测方法的流程图;
图3示出了本发明的再一个实施例的页面信息检测方法的流程图;
图4示出了本发明的一个实施例的页面信息检测装置的框图;
图5示出了本发明的一个实施例的终端的框图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
图1示出了本发明的一个实施例的页面信息检测方法的流程图。
如图1所示,本发明的一个实施例的页面信息检测方法的流程包括:
步骤102,通过文字爬取脚本获取预定存储位置的样本文件内的样本信息。
样本文件存储在预定存储位置,一般为文本文件,如word文档等,样本文件中具有要求写入H5页面中的样本信息,也就是说,样本文件中具有H5页面所应当写入的正确页面信息。文字爬取脚本是一种用于在样本文件中提取文字信息的插件,其具体工作流程为:向预定存储位置(也就是样本文件)发送数据请求,以及接收从预定存储位置返回的数据内容,并解析得到样本信息,其中,解析可以指将源代码格式的数据内容转换为txt或doc格式的文本内容,因此,即可得到样本文件中文本格式的样本信息。通过预设的文字爬取脚本可直接访问该预定存储位置,从而获得样本文件内的样本信息,以便进一步将H5页面中的页面信息与样本信息进行比对来检测页面信息是否正确。
步骤104,通过统一资源定位符获取H5页面中的页面信息。
对于H5页面,可通过url(统一资源定位符)指示的H5页面位置和H5页面访问方法对H5页面进行访问,url是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的url,它包含的信息指出文件的位置以及浏览器应该怎么处理它。由此,可通过已有的H5页面的url对H5页面进行访问,得到其页面信息,以便进一步将页面信息与样本信息进行比对来检测页面信息是否正确。
步骤106,根据所述H5页面的页面标识和/或所述页面信息的关键字,在所述样本信息中选择对应的待对比信息。样本信息可包括当前的H5页面对应的待对比信息,还可能包括其他H5页面对应的待对比信息,对此,需要在样本信息中将当前的H5页面对应的待对比信息提取出来。
在本发明的一种实现方式中,需要对多个H5页面进行页面信息的检测,而样本信息中包含这多个H5页面所应当写入的正确页面信息,因此,可根据每个H5页面的页面标识,在样本信息中选择具有该页面标识或与该页面标识匹配的部分样本信息,作为与该H5页面对应的待对比信息。
在本发明的另一种实现方式中,需要对单个H5页面进行页面信息的检测,而样本信息的数量为多个,其中,有一个样本信息仅包含这单个H5页面所应当写入的正确页面信息,故可直接获取这单个H5页面中的页面信息的关键字,关键字包括内容关键字、页面信息的起始文字、页面信息的末尾文字等,不同H5页面的内容不同,故可根据其关键字区分不同的H5页面,通过关键字匹配的方式在多个样本信息中选择与此H5页面的关键字相匹配的样本信息,作为此H5页面的待对比信息。
在本发明的再一种实现方式中,需要对多个H5页面进行页面信息的检测,且样本信息的数量为多个,每个样本信息中都包括一个或多个H5页面对应的样本信息。因此,可先根据每个H5页面的页面标识,在样本信息中选择具有该页面标识或与该页面标识匹配的样本信息,再对于每个H5页面,根据其关键字,在对应的该样本信息中,通过关键字匹配的方式选择与此H5页面的关键字相匹配的部分样本信息,作为此H5页面的待对比信息。
步骤108,将所述页面信息与所述待对比信息进行对比,得到差异信息.
步骤110,按照预定标记方式,在所述H5页面中标记所述差异信息。
差异信息指的是页面信息与样本信息中对应位置处不同的信息,最终,可将页面信息中不同于样本信息的内容作为差异信息标记出来,以便直观展示H5页面中的页面信息错误,便于进一步对差异信息进行修改。
以上技术方案,针对相关技术中H5页面内容易出错的技术问题,可以爬取样本文件内的样本信息以及H5页面中的页面信息,并自动对页面信息与样本信息进行对比,得到差异信息,最后将差异信息标记出来。通过以上技术方案,可供用户快速、直观地得到页面信息与样本信息的不同,便于对H5页面的页面信息进行修改,提升了H5页面的内容检测效率、准确率和修改效率。
图2示出了本发明的另一个实施例的页面信息检测方法的流程图。
如图2所示,本发明的另一个实施例的页面信息检测方法的流程,包括:
步骤202,通过文字爬取脚本获取预定存储位置的样本文件内的样本信息。
步骤204,通过统一资源定位符获取H5页面中的页面信息。
步骤206,将所述页面信息按照信息类型划分为若干项子信息。
其中,所述页面信息的信息类型包括:标题文字、活动规则文字和功能选项文字。由此,便于在后续步骤中分别选择标题文字、活动规则文字和功能选项文字对应的待对比信息进行分别对比,从而避免将错误的样本信息与页面信息对比的情况发生,有助于减少误判,提升了页面信息检测的有效性。
步骤208,根据所述若干项子信息中每项子信息的关键字和所述信息类型,为所述每项子信息在所述样本信息中选择对应的待对比信息。
步骤210,将所述每项子信息与对应的所述待对比信息进行对比,得到所述每项子信息对应的所述差异信息。
步骤212,按照预定标记方式,在所述H5页面中标记所述差异信息。
具体来说,可以将页面信息按照其内容划分为若干项子信息,比如,将页面信息划分为标题文字、活动规则文字和功能选项文字,其中,标题文字为当前H5页面的标题,活动规则文字为当前H5页面中显示的活动规则,而功能选项文字则是当前H5页面中的功能按钮显示的文字。
接着,可以将标题文字与样本信息中的标题文字进行对比,将活动规则文字与样本信息中的活动规则文字进行对比,将功能选项文字与样本信息中的功能选项文字进行对比,这样一一分别对比,提升了对比的条理性和逻辑性,便于更加精确地检测各信息类型下的内容是否准确,提升了检测结果的有效性。
图3示出了本发明的另一个实施例的页面信息检测方法的流程图。
如图3所示,本发明的另一个实施例的页面信息检测方法的流程,包括:
步骤302,每隔预定时间间隔,通过所述文字爬取脚本获取所述预定存储位置的所述样本文件内的所述样本信息。
由此,可定时检测H5页面的页面内容,以应对预定存储位置的样本文件可能发生更新的情况,换句话说,通过定时爬取预定存储位置的样本文件的样本信息,可在样本信息发生更新时,及时标记出H5页面中与更新内容不符的差异信息,便于尽快适应样本文件的更新内容,提升H5页面的时效性。
步骤304,通过统一资源定位符获取H5页面中的页面信息。
另外,需要知晓,上述的每隔预定时间间隔,即定时检测,是针对整个流程而言的,即定时获取所述样本信息和所述页面信息进行比对,而非仅仅定时获取所述样本信息。
步骤306,将所述页面信息与所述样本信息进行对比,得到差异信息。
步骤308,按照预定标记方式,在所述H5页面中标记所述差异信息。
其中,预定标记方式包括以下一项或多项:将所述差异信息的文字颜色标记为第一指定颜色;将所述差异信息所在位置填充为第二指定颜色;和对所述差异信息进行字体放大、字体加粗和字体倾斜中的一项或多项处理。当然,预定标记方式多种多样,包括但不限上述几种方式及其组合,只要以显著的方式将差异信息标记出来,即能够产生辅助识别H5页面中有别于样本信息的内容的作用,从而便于及时发现并修改H5页面的错误。
在本发明的一种实现方式中,所述将所述差异信息的文字颜色标记为第一指定颜色的步骤,包括:确定所述差异信息的错误类型;将所述差异信息的文字颜色标记为所述错误类型对应的所述第一指定颜色。
具体来说,对于不同的错误类型,采用不同的颜色进行标记。比如,当差异信息的错误类型为文字缺失时,将差异信息标记为红色,当差异信息的错误类型为文字顺序错乱时,将差异信息标记为蓝色,当差异信息的错误类型为文字格式有误时,将差异信息标记为黄色。
在本发明的另一种实现方式中,所述将所述差异信息所在位置填充为第二指定颜色的步骤,包括:确定所述差异信息的错误类型;将所述差异信息所在位置填充为所述错误类型对应的所述第二指定颜色。
具体来说,对于不同的错误类型,采用不同的颜色进行填充。比如,当差异信息的错误类型为文字缺失时,将差异信息填充为红色,当差异信息的错误类型为文字顺序错乱时,将差异信息填充为蓝色,当差异信息的错误类型为文字格式有误时,将差异信息填充为黄色。
步骤310,根据所述样本文件内的所述样本信息,自动对所述差异信息进行修改。
由此,还可以参照样本信息,自动将差异信息修改至与样本信息一致的状态,减少人工修改操作的步骤,简化人工操作,提升了页面检测与修复的效率。
图4示出了本发明的一个实施例的页面信息检测装置的框图。
如图4所示,本发明实施例提供了一种页面信息检测装置400,包括:第一获取单元402,用于通过文字爬取脚本获取预定存储位置的样本文件内的样本信息;第二获取单元404,用于通过统一资源定位符获取H5页面中的页面信息;待对比信息选择单元406,用于根据所述H5页面的页面标识和/或所述页面信息的关键字,在所述样本信息中选择对应的待对比信息;信息对比单元408,用于将所述页面信息与所述待对比信息进行对比,得到差异信息;差异信息标记单元410,用于按照预定标记方式,在所述H5页面中标记所述差异信息。
该页面信息检测装置400使用图1至图3示出的实施例中任一项所述的方案,因此,具有上述所有技术效果,在此不再赘述。页面信息检测装置400还具有以下技术特征:
在本发明上述实施例中,可选地,还包括:页面信息分类单元,用于在所述待对比信息选择单元406在所述样本信息中选择对应的待对比信息之前,将所述页面信息按照信息类型划分为若干项子信息,其中,所述页面信息的信息类型包括:标题文字、活动规则文字和功能选项文字;所述待对比信息选择单元406用于:根据所述若干项子信息中每项子信息的关键字和所述信息类型,为所述每项子信息在所述样本信息中选择对应的待对比信息;则所述信息对比单元408用于:将所述每项子信息与对应的所述待对比信息进行对比,得到所述每项子信息对应的所述差异信息。
在本发明上述实施例中,可选地,所述第一获取单元402用于:每隔预定时间间隔,通过所述文字爬取脚本获取所述预定存储位置的所述样本文件内的所述样本信息。
在本发明上述实施例中,可选地,所述差异信息标记单元410包括以下单元中的一个或多个:第一处理单元,用于将所述差异信息的文字颜色标记为第一指定颜色;第二处理单元,用于将所述差异信息所在位置填充为第二指定颜色;第三处理单元,用于对所述差异信息进行字体放大、字体加粗和字体倾斜中的一项或多项处理。
在本发明上述实施例中,可选地,所述第一处理单元用于:确定所述差异信息的错误类型;将所述差异信息的文字颜色标记为所述错误类型对应的所述第一指定颜色;所述第二处理单元用于:确定所述差异信息的错误类型;将所述差异信息所在位置填充为所述错误类型对应的所述第二指定颜色。
在本发明上述实施例中,可选地,还包括:自动修改单元,用于根据所述样本文件内的所述样本信息,自动对所述差异信息进行修改。
图5示出了本发明的一个实施例的终端的框图。
如图5所示,本发明的一个实施例的终端500,包括至少一个存储器502;以及,与所述至少一个存储器502通信连接的处理器504;其中,所述存储器存储有可被所述至少一个处理器504执行的指令,所述指令被设置为用于执行上述图1至图3实施例中任一项所述的方案。因此,该终端500具有和图1至图3实施例中任一项相同的技术效果,在此不再赘述。
另外,本发明实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述图1至图3实施例中任一项所述的方法流程。
以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,可供用户快速、直观地得到页面信息与样本信息的不同,便于对H5页面的页面信息进行修改,提升了H5页面的内容检测效率、准确率和修改效率。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二等来描述获取单元,但这些获取单元不应限于这些术语。这些术语仅用来将获取单元彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一获取单元也可以被称为第二获取单元,类似地,第二获取单元也可以被称为第一获取单元。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于个人计算机(PersonalComputer,PC)、个人数字助理(PersonalDigital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (10)
1.一种页面信息检测方法,其特征在于,包括:
通过文字爬取脚本获取预定存储位置的样本文件内的样本信息;
通过统一资源定位符获取H5页面中的页面信息;
根据所述H5页面的页面标识和/或所述页面信息的关键字,在所述样本信息中选择对应的待对比信息;
将所述页面信息与所述待对比信息进行对比,得到差异信息;
按照预定标记方式,在所述H5页面中标记所述差异信息。
2.根据权利要求1所述的页面信息检测方法,其特征在于,在所述根据所述H5页面的页面标识和/或所述页面信息的关键字,在所述样本信息中选择对应的待对比信息的步骤之前,还包括:
将所述页面信息按照信息类型划分为若干项子信息,其中,所述页面信息的信息类型包括:标题文字、活动规则文字和功能选项文字;
则所述根据所述H5页面的页面标识和/或所述页面信息的关键字,在所述样本信息中选择对应的待对比信息的步骤,包括:
根据所述若干项子信息中每项子信息的关键字和所述信息类型,为所述每项子信息在所述样本信息中选择对应的待对比信息;
则所述将所述页面信息与所述待对比信息进行对比,得到差异信息的步骤,包括:
将所述每项子信息与对应的所述待对比信息进行对比,得到所述每项子信息对应的所述差异信息。
3.根据权利要求1或2所述的页面信息检测方法,其特征在于,所述通过文字爬取脚本获取预定存储位置的样本文件内的样本信息的步骤,包括:
每隔预定时间间隔,通过所述文字爬取脚本获取所述预定存储位置的所述样本文件内的所述样本信息。
4.根据权利要求1或2所述的页面信息检测方法,其特征在于,所述按照预定标记方式,在所述H5页面中标记所述差异信息的步骤,包括以下一个或多个步骤:
将所述差异信息的文字颜色标记为第一指定颜色;
将所述差异信息所在位置填充为第二指定颜色;和
对所述差异信息进行字体放大、字体加粗和字体倾斜中的一项或多项处理。
5.根据权利要求4所述的页面信息检测方法,其特征在于,所述将所述差异信息的文字颜色标记为第一指定颜色的步骤,包括:
确定所述差异信息的错误类型;
将所述差异信息的文字颜色标记为所述错误类型对应的所述第一指定颜色;
所述将所述差异信息所在位置填充为第二指定颜色的步骤,包括:
确定所述差异信息的错误类型;
将所述差异信息所在位置填充为所述错误类型对应的所述第二指定颜色。
6.根据权利要求1所述的页面信息检测方法,其特征在于,还包括:
根据所述样本文件内的所述样本信息,自动对所述差异信息进行修改。
7.一种页面信息检测装置,其特征在于,包括:
第一获取单元,用于通过文字爬取脚本获取预定存储位置的样本文件内的样本信息;
第二获取单元,用于通过统一资源定位符获取H5页面中的页面信息;
待对比信息选择单元,用于根据所述H5页面的页面标识和/或所述页面信息的关键字,在所述样本信息中选择对应的待对比信息;
信息对比单元,用于将所述页面信息与所述待对比信息进行对比,得到差异信息;
差异信息标记单元,用于按照预定标记方式,在所述H5页面中标记所述差异信息。
8.根据权利要求7所述的页面信息检测装置,其特征在于,还包括:
页面信息分类单元,用于在所述待对比信息选择单元在所述样本信息中选择对应的待对比信息之前,将所述页面信息按照信息类型划分为若干项子信息,其中,所述页面信息的信息类型包括:标题文字、活动规则文字和功能选项文字;
所述待对比信息选择单元用于:
根据所述若干项子信息中每项子信息的关键字和所述信息类型,为所述每项子信息在所述样本信息中选择对应的待对比信息;
则所述信息对比单元用于:
将所述每项子信息与对应的所述待对比信息进行对比,得到所述每项子信息对应的所述差异信息。
9.一种终端,其特征在于,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述权利要求1至6中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于执行如权利要求1至6中任一项所述的方法流程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811535113.6A CN109815426A (zh) | 2018-12-14 | 2018-12-14 | 页面信息检测方法及装置、终端和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811535113.6A CN109815426A (zh) | 2018-12-14 | 2018-12-14 | 页面信息检测方法及装置、终端和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109815426A true CN109815426A (zh) | 2019-05-28 |
Family
ID=66602059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811535113.6A Pending CN109815426A (zh) | 2018-12-14 | 2018-12-14 | 页面信息检测方法及装置、终端和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109815426A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111460763A (zh) * | 2020-03-02 | 2020-07-28 | 南京南瑞继保电气有限公司 | 文件差异的标注方法、装置、设备及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150220819A1 (en) * | 2014-01-31 | 2015-08-06 | Konica Minolta, Inc. | Method of creating sample page, program, and image forming system |
CN107678937A (zh) * | 2017-07-26 | 2018-02-09 | 上海壹账通金融科技有限公司 | 页面兼容性检测方法、装置、服务器和介质 |
CN107798023A (zh) * | 2016-09-07 | 2018-03-13 | 广州市动景计算机科技有限公司 | 网页资源加载方法及网页资源加载装置 |
CN108334480A (zh) * | 2018-02-27 | 2018-07-27 | 智言科技(深圳)有限公司 | 网页信息提取的方法及装置 |
-
2018
- 2018-12-14 CN CN201811535113.6A patent/CN109815426A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150220819A1 (en) * | 2014-01-31 | 2015-08-06 | Konica Minolta, Inc. | Method of creating sample page, program, and image forming system |
CN107798023A (zh) * | 2016-09-07 | 2018-03-13 | 广州市动景计算机科技有限公司 | 网页资源加载方法及网页资源加载装置 |
CN107678937A (zh) * | 2017-07-26 | 2018-02-09 | 上海壹账通金融科技有限公司 | 页面兼容性检测方法、装置、服务器和介质 |
CN108334480A (zh) * | 2018-02-27 | 2018-07-27 | 智言科技(深圳)有限公司 | 网页信息提取的方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111460763A (zh) * | 2020-03-02 | 2020-07-28 | 南京南瑞继保电气有限公司 | 文件差异的标注方法、装置、设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11372935B2 (en) | Automatically generating a website specific to an industry | |
CN110221982B (zh) | 业务系统的性能测试方法、装置、设备及可读存储介质 | |
US10261984B2 (en) | Browser and operating system compatibility | |
CN107133165B (zh) | 浏览器兼容性检测方法及装置 | |
CN111079043A (zh) | 一种关键内容定位方法 | |
CN108959067B (zh) | 搜索引擎的测试方法、装置及计算机可读存储介质 | |
CN110389941B (zh) | 数据库校验方法、装置、设备及存储介质 | |
US9262550B2 (en) | Processing semi-structured data | |
KR20190095099A (ko) | 거래 시스템 에러 검출 방법, 장치, 저장 매체 및 컴퓨터 장치 | |
CN109462632A (zh) | 页面跳转方法、装置、计算机设备及计算机可读存储介质 | |
CN109271315B (zh) | 脚本代码检测方法、装置、计算机设备及存储介质 | |
CN105868290A (zh) | 一种展现搜索结果的方法及装置 | |
CN106911554B (zh) | 一种历史信息展示方法及装置 | |
US9665574B1 (en) | Automatically scraping and adding contact information | |
CN108809896A (zh) | 一种信息校验方法、装置和电子设备 | |
CN109815426A (zh) | 页面信息检测方法及装置、终端和计算机可读存储介质 | |
US20080147652A1 (en) | Physical address verification within electronic documents | |
CN110489032B (zh) | 用于电子书的词典查询方法及电子设备 | |
CN111602129B (zh) | 针对注释和墨迹的智能搜索 | |
CN112579937A (zh) | 一种字符的高亮显示方法及装置 | |
CN114221988B (zh) | 一种内容分发网络热点分析方法和系统 | |
CN112612866B (zh) | 知识库文本同步方法、装置、电子设备及存储介质 | |
JP2016057715A (ja) | 図形式プログラム解析装置 | |
US20120047228A1 (en) | Method for delivering tag based services | |
CN111444716A (zh) | 标题分词方法、终端及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190528 |
|
RJ01 | Rejection of invention patent application after publication |