CN113761442B - 一种页面内容审核方法、装置、设备以及存储介质 - Google Patents

一种页面内容审核方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN113761442B
CN113761442B CN202110915612.3A CN202110915612A CN113761442B CN 113761442 B CN113761442 B CN 113761442B CN 202110915612 A CN202110915612 A CN 202110915612A CN 113761442 B CN113761442 B CN 113761442B
Authority
CN
China
Prior art keywords
page
target
information
style
comparison
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110915612.3A
Other languages
English (en)
Other versions
CN113761442A (zh
Inventor
郑永锐
詹昶晨
王泽选
朱晓平
蒋杰龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yuanguang Software Co Ltd
Original Assignee
Yuanguang Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yuanguang Software Co Ltd filed Critical Yuanguang Software Co Ltd
Priority to CN202110915612.3A priority Critical patent/CN113761442B/zh
Publication of CN113761442A publication Critical patent/CN113761442A/zh
Application granted granted Critical
Publication of CN113761442B publication Critical patent/CN113761442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Storage Device Security (AREA)

Abstract

本申请公开了一种页面内容审核方法、装置、设备以及存储介质。该方法包括:获取第一目标页面以及第一待审核页面,其中,第一目标页面包括目标页面样式以及第一参照信息,第一待审核页面包括对比页面样式和第一待审核信息;将对比页面样式更新为目标页面样式,基于目标页面样式和第一待审核信息得到第一对比页面;将第一对比页面和第一目标页面进行比较,基于第一参照信息对第一待审核信息进行审核。通过上述方式,能够避免人工对比时可能出现浪费时间、浪费人力、效率极低以及对信息内容对比的准确率较低的问题。

Description

一种页面内容审核方法、装置、设备以及存储介质
技术领域
本申请涉及人工智能技术领域,特别是涉及一种页面内容审核方法、装置、设备以及存储介质。
背景技术
现有的内容审核(个人基本信息、证书信息等)的方式,大多是通过人工去逐项对比其填写的信息内容与真实有效的信息内容是否一致,并且在对比一些内容较多较长的信息(证书号、身份证号、住址、通讯地址等)时容易出现疏漏,所以现有的人工逐项对比,不仅相当浪费时间,浪费人力,效率极低,而且对信息内容对比的准确率也造成了一定的负面影响。
发明内容
为了解决现有技术的内容审核的方法存在的上述问题,本申请提供了一种页面内容审核方法、装置、设备以及存储介质。
为解决上述问题,本申请提供了一种页面内容审核方法,页面内容审核方法包括:
获取第一目标页面以及第一待审核页面,其中,第一目标页面包括目标页面样式以及第一参照信息,第一待审核页面包括对比页面样式和第一待审核信息;
将对比页面样式更新为目标页面样式,基于目标页面样式和第一待审核信息得到第一对比页面;
将第一对比页面和第一目标页面进行比较,基于第一参照信息对第一待审核信息进行审核。
为解决上述问题,本申请还提供了一种页面内容审核装置,页面内容审核装置包括:获取模块、调整模块以及审核模块
获取模块用于获取第一目标页面以及第一待审核页面,其中,第一目标页面包括目标页面样式以及第一参照信息,第一待审核页面包括对比页面样式和第一待审核信息;
调整模块用于将对比页面样式更新为目标页面样式,基于目标页面样式和第一待审核信息得到第一对比页面;
审核模块用于将第一对比页面和第一目标页面进行比较,基于第一参照信息对第一待审核信息进行审核。
为解决上述问题,本申请还提供了一种终端设备,终端设备包括:处理器和存储器,存储器中存储有计算机程序,处理器用于执行计算机程序以实现上述的页面内容审核方法。
为解决上述问题,本申请还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序能够被处理器执行时实现上述的页面内容审核方法。
与现有技术相比,本申请的页面内容审核方法包括:获取第一目标页面以及第一待审核页面,其中,第一目标页面包括目标页面样式以及第一参照信息,第一待审核页面包括对比页面样式和第一待审核信息;将对比页面样式更新为目标页面样式,基于目标页面样式和第一待审核信息得到第一对比页面;将第一对比页面和第一目标页面进行比较,基于第一参照信息对第一待审核信息进行审核。通过上述方式,可以在第一对比页面和第一目标页面的页面样式相同的情况下,通过对比第一对比页面和第一目标页面,即可以识别出第一参照信息与第一待审核信息是否相同以得到审核结果,由此能够避免人工对比时可能出现浪费时间、浪费人力、效率极低以及对信息内容对比的准确率较低的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本申请。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的页面内容审核方法的一实施例流程示意图;
图2是图1所示的页面内容审核方法中的步骤S101的一实施例流程示意图;
图3是图1所示的页面内容审核方法中的步骤S103之后的一实施例流程示意图;
图4是本申请提供的页面内容审核装置一实施例结构示意图;
图5是本申请提供的终端设备一实施例的结构示意图;
图6是本申请提供的计算机存储介质一实施例的结构示意图。
具体实施方式
下面结合附图和实施例,对本申请作进一步的详细描述。特别指出的是,以下实施例仅用于说明本申请,但不对本申请的范围进行限定。同样的,以下实施例仅为本申请的部分实施例而非全部实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其他实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其他实施例相结合。
本申请的描述中,需要说明书的是,除非另外明确的规定和限定,术语“安装”、“设置”、“相连”、“连接”应做广义理解,例如,可以是固定连接,可以是可拆卸连接,或一体地连接;可以是机械来能接,也可以是电连接;可以是直接相连,也可以通过中间媒介间隔相连。对于本领域的普通技术人员而言,可以具体情况连接上述属于在本申请的具体含义。
本申请提出了一种页面内容审核方法,具体请参阅图1,图1是本申请提供的页面内容审核方法的一实施例流程示意图。
步骤S101:获取第一目标页面以及第一待审核页面。
其中,第一目标页面包括目标页面样式以及第一参照信息,第一待审核页面包括对比页面样式和第一待审核信息。
第一目标页面和第一待审核页面可以是在数据库中获取,也可以通过在目标的网站中获取。目标页面样式可以是文本、表格、图片、按钮、视频、音频等任何类型的数据,目标页面样式可以作为第一参照信息的背景页面,第一参照信息可以是需要用来对比的信息,因此,作为背景页面的目标页面样式以及作为布置于目标页面样式上的第一参照信息共同构成第一目标页面。
第一待审核页面中的对比页面样式可以是文本、表格、图片、按钮、视频、音频等任何类型的数据,或者对比页面样式可以是空白页面样式,即对比页面样式可以不包括页面样式的相关数据,对比页面样式可以作为第一待审核信息的背景页面,第一待审核信息是需要审核的信息,其中,第一待审核信息可以通过人工录入的第一待审核信息。因此,作为背景页面的对比页面样式以及布置于对比页面样式上的第一待审核信息共同构成第一待审核页面。
在一应用场景中,以证书的信息审核为例,例如注册会计师证书信息审核或教师资格证书信息审核等等。可以通过输入相关证书查询地址,进入相关网页获取第一目标页面,以查询第一参照信息,例如,第一参照信息可以包括相关人员的姓名、资格证号、联系方式以及住址等信息。第一待审核页面可以是人工在对比页面样式中填入第一待审核信息形成,其中,第一待审核信息中需要录入的信息与第一参照信息中的信息的类别相同,例如,第一参照信息包括相关人员的姓名、资格证号、联系方式以及住址等信息,则第一待审核信息也包括相关人员的姓名、资格证号、联系方式以及住址等信息。
步骤S102:将对比页面样式更新为目标页面样式,基于目标页面样式和第一待审核信息得到第一对比页面。
将第一待审核页面的对比页面样式更新为第一目标页面的目标页面样式,以使第一待审核页面的页面样式与第一目标页面的页面样式相同。更新后的第一待审核页面的页面样式与第一待审核信息共同构成第一对比页面。其中,第一待审核信息对应排布于第一对比页面的页面样式中,以使第一待审核信息与第一对比页面中的目标页面样式的对应关系和第一参照信息与第一目标页面中的目标页面样式的对应关系相同。
在一应用场景中,以证书的信息审核为例,例如,第一目标页面的目标页面样式中包括文本,文本为“姓名”和“资格证号”等,第一参照信息为“张三”和“123456”,则文本“姓名”后所填入的内容则为第一参照信息“张三”;文本“资格证号”后所填入的内容则为第一参照信息“123456”。而第一对比页面则也包括文本,且文本的内容与第一目标页面中的文本内容相同,文本同样对应有填入的相关内容,例如:文本“姓名”和“资格证号”后面对应有需要用来对比的第一待审核信息。
进一步地,将第一待审核页面的对比页面样式更新为目标页面样式的步骤包括:检测目标页面样式的元素类型为表格或文本,复制表格或文本,并基于复制的表格或文本更新对比页面样式得到目标页面样式。
在一实施例中,当接收到“提取元素样式”的指令时,检测需要提取的目标页面样式中的元素类型,若检测到目标样式的元素类型为文本,则接收“复制”指令,以提取并复制文本中每一行的层叠样式表(Cascading StyleSheet,CSS),将复制的层叠样式表更新对比页面样式从而得到目标页面样式。在一应用场景中,例如,当需要更新的文本为“姓名”,则将“姓名”的层叠样式表复制,并基于复制的层叠样式表更新第一待审核信息中的页面样式。
在另一实施例中,当接收到“提取元素样式”的指令时,检测需要提取的目标页面样式中的元素类型,若检测到目标样式的元素类型为表格,则接收“复制”指令,以提取并复制第一目标页面中的超文本标记语言(Hyper Text Mark-up Language,HTML)源码,以将整个超文本标记语言中的标签提取,将提取的超文本标记语言中的标签用以更新对比页面样式得到目标页面样式。
进一步地,将第一待审核页面的对比页面样式更新为目标页面样式的步骤包括:检测目标页面样式的元素类型为图片、按钮或视频,将图片、按钮或视频导入对比页面样式得到目标页面样式。
在一实施例中,当接收到“提取元素样式”的指令时,检测需要提取的目标页面样式中的元素类型,若检测到目标样式的元素类型为图片,接收“导入”指令,例如通过按钮接收“导入”指令,然后在第一待审核页面中新建出与第一目标页面中相同的图片的元素样式。
在一实施例中,当接收到“提取元素样式”的指令时,检测需要提取的目标页面样式中的元素类型,若检测到目标样式的元素类型为按钮元素,接收“导入”指令,例如通过按钮接收“导入”指令,则提取按钮元素的内容以及层叠样式表,然后在第一待审核页面中新建出与第一目标页面中相同的按钮的元素样式。
在一实施例中,当接收到“提取元素样式”的指令时,检测需要提取的目标页面样式中的元素类型,若检测到目标样式的元素类型为视频元素,接收“导入”指令,例如通过按钮接收“导入”指令,则提取视频元素的封面图片,然后在第一待审核页面中新建出与第一目标页面中的视频元素的封面图片相同的图片的元素样式。
进一步地,在基于目标页面样式和第一待审核信息得到第一对比页面之后,可以将得到的第一对比页面上传并保存至服务器,以便于其他待审核页面可以基于第一对比页面更新页面样式。
步骤S103:将第一对比页面和第一目标页面进行比较,基于第一参照信息对第一待审核信息进行审核。
第一对比页面和第一目标页面的页面样式相同的情况下,可以通过对比第一对比页面和第一目标页面的整个页面,从而可以确定第一待审核信息和第一参照信息是否相同。例如在第一对比页面和第一目标页面相同的情况下,可以确定第一待审核信息和第一参考信息也相同;若在第一对比页面和第一目标页面不相同的情况下,则可以确定第一待审核信息和第一参考信息不相同。在一实施例中,可以通过对比第一对比页面和第一目标页面的源码得到对比第一对比页面和第一目标页面是否相同。
进一步地,将第一对比页面和第一目标页面进行比较的步骤可以包括:获取与第一对比页面对应的第一对比图像,且与第一目标页面对应的第一目标图像,提取第一对比图像和第一目标图像的像素特征,对比第一目标图像的像素特征以及第一对比图像的像素特征。
在本实施例中,可以将得到的第一对比页面扫描为第一对比图像,将第一目标页面扫描为第一目标图像,提取每个提取第一目标图像和第一对比图像的像素值,将第一目标图像和第一对比图像的像素值进行比较,从而可以确定第一目标图像和第一对比图像是否相同,当第一目标图像和第一对比图像相同的情况下,则可以确定第一待审核信息和第一参照信息相同的。
现有技术中,为了能够确认填入第一待审核信息是否与第一参照信息一致,则需要对两者的内容进行审核。如果采用人工逐项对比,则相当浪费时间和人力,并且对比后的结果仍然有可能出现错误;如果将非结构化的第一参考信息和非结构化的第一待审核信息结构化处理之后再进行对比,此时,如果网站发生变化,则可能需要再次修改识别代码,过程较为复杂。因此,本申请提供的页面内容审核方法在第一对比页面和第一目标页面的页面样式相同的情况下,通过对比第一对比页面和第一目标页面,即可以识别出第一参照信息与第一待审核信息是否相同以得到审核结果,由此能够避免人工对比时可能出现浪费时间、浪费人力、效率极低以及对信息内容对比的准确率较低的问题。
参见图2,图2是图1所示的页面内容审核方法中的步骤S101的一实施例流程示意图。
步骤S201:获取第一待审核页面的第一标识信息。
第一待审核页面的第一标识信息可以是第一待审核信息中的标识信息,其中,第一标识信息可以用来确定需要用来对比第一待审核页面的第一目标页面。例如:在一应用场景中,以证书的信息审核为例,第一标识信息可以是第一待审核信息中的“资格证号”、“姓名”或“联系方式”中的一种或多种。
步骤S202:基于第一标识信息调用目标接口得到第一目标页面。
当提取到第一标识信息之后,可以通过第一标识信息调用网络接口,通过网络接口获取第一待审核信息需要用来对比的第一目标页面。例如:在一应用场景中,以证书的信息审核为例,当第一标识信息为“资格证号”时,可以通过对应的资格证书的官方网站对外的网络接口,通过“资格证号”得到第一目标页面。
参见图3,图3是图1所示的页面内容审核方法中的步骤S103之后的一实施例流程示意图。
步骤S301:获取第二目标页面以及第二待审核页面。
其中,第二目标页面包括目标页面样式和第二参照信息,第二待审核页面包括第二待审核信息。
第二待审核页面可以与第一待审核页面存在于相同的数据库中,第二待审核页面中的页面样式可以与第一待审核页面中的页面样式相同。第二目标页面可以是在数据库中获取,也可以通过在目标的网站中获取。
进一步地,获取第二目标页面以及第二待审核页面的步骤包括:获取第二待审核页面的第二标识信息,基于第二标识信息调用目标接口得到第二目标页面。
第二待审核页面的第二标识信息可以是第二待审核信息中的标识信息,其中,第二标识信息可以用来确定需要用来对比第二待审核页面的第二目标页面。当提取到第二标识信息之后,可以通过第二标识信息调用网络接口,通过网络接口获取第二待审核信息需要用来对比的第二目标页面。
步骤S302:基于第二待审核信息更新第一对比页面的第一待审核信息得到第二对比页面。
将第二待审核信息从第二待审核页面中提取出来,然后将提取出来的第二待审核信息用来更新第一对比页面中的第一待审核信息得到第二对比页面,保存第二对比页面。由于第一对比页面中的页面样式为目标页面样式,只更新第一待审核信息得到的第二对比页面的页面样式也为目标页面样式,那么,第一对比页面、第二对比页面、第一目标页面和第二目标页面的页面样式均为目标页面样式。
步骤S303:将第二对比页面和第二目标页面进行比较,基于第二参照信息对第二待审核信息进行审核。
第二对比页面和第二目标页面的页面样式相同的情况下,可以通过对比第二对比页面和第二目标页面的整个页面,从而可以确定第二待审核信息和第二参照信息是否相同。例如在第二对比页面和第二目标页面相同的情况下,可以确定第二待审核信息和第二参考信息也相同;若在第二对比页面和第二目标页面不相同的情况下,则可以确定第二待审核信息和第二参考信息不相同。
在一实施例中,可以通过对比第一对比页面和第一目标页面的源码得到对比第一对比页面和第一目标页面是否相同。
在另一实施例中,可以将得到的第二对比页面扫描为第二对比图像,将第二目标页面扫描为第二目标图像,提取每个提取第二目标图像和第二对比图像的像素值,将第二目标图像和第二对比图像的像素值进行比较,从而可以确定第二目标图像和第二对比图像是否相同,当第二目标图像和第二对比图像相同的情况下,则可以确定第二待审核信息和第二参照信息相同的。
通过上述方式,可以基于第一目标页面的调整第一待审核页面的页面样式得到第一对比页面,然后通过第一对比页面处理其他的待审核页面,将数据库中的其他待审核页面的页面样式均调整为与第一目标页面相同的页面样式,以便于对待审核页面进行审核。
为实现上述实施例的页面内容审核方法,本申请提供了一种页面内容审核装置。参见图4,图4是本申请提供的页面内容审核装置40一实施例结构示意图。
页面内容审核装置包括:获取模块41、调整模块42以及审核模块43。
获取模块41用于获取第一目标页面以及第一待审核页面,其中,第一目标页面包括目标页面样式以及第一参照信息,第一待审核页面包括对比页面样式和第一待审核信息;
调整模块42用于将第一待审核页面的对比页面样式更新为目标页面样式,基于目标页面样式和第一待审核信息得到第一对比页面;
审核模块43用于将第一对比页面和第一目标页面进行比较,基于第一参照信息对第一待审核信息进行审核。
其中,在本申请的一个实施例,图4所示的页面内容审核装置40中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由多个单元来实现,或者多个模块的功能由一个单元实现。在本申请的其它实施例中,页面内容审核装置40也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
上述方法应用于硬件设备中。具体请参阅图5,图5是本申请终端设备50一实施例的结构示意图,本实施例终端设备50包括处理器51和存储器52。其中,存储器52中存储有计算机程序,处理器51用于执行计算机程序以实现上述页面内容审核方法。
其中,处理器51可以是一种集成电路芯片,具有信号的处理能力。处理器51还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者处理器51也可以是任何常规的处理器等。
对于图1-图3所示实施例的页面内容审核方法,其可以计算机程序的形式呈现,本申请提出一种承载计算机程序的计算机存储介质,请参阅图6,图6是本申请计算机存储介质60一实施例的结构示意图,本实施例计算机存储介质60包括计算机程序61,其可被执行以实现上述页面内容审核方法。
本实施例计算机存储介质60可以是U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等可以存储程序指令的介质,或者也可以为存储有该程序指令的服务器,该服务器可将存储的程序指令发送给其他设备运行,或者也可以自运行该存储的程序指令。
另外,上述功能如果以软件功能的形式实现并作为独立产品销售或使用时,可存储在一个移动终端可读取存储介质中,即,本申请还提供一种存储有程序数据的存储装置,所述程序数据能够被执行以实现上述实施例的方法,该存储装置可以为如U盘、光盘、服务器等。也就是说,本申请可以以软件产品的形式体现出来,其包括若干指令用以使得一台智能终端执行各个实施例所述方法的全部或部分步骤。
在本申请的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(可以是个人计算机,服务器,网络设备或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (9)

1.一种页面内容审核方法,其特征在于,所述方法包括:
获取第一目标页面以及第一待审核页面,其中,所述第一目标页面包括目标页面样式以及第一参照信息,所述第一待审核页面包括对比页面样式和第一待审核信息;
将所述对比页面样式更新为所述目标页面样式,基于所述目标页面样式和所述第一待审核信息得到第一对比页面;
将所述第一对比页面和所述第一目标页面进行比较,基于所述第一参照信息对所述第一待审核信息进行审核;
获取第二目标页面以及第二待审核页面,其中所述第二目标页面包括所述目标页面样式和第二参照信息,所述第二待审核页面包括第二待审核信息;
基于所述第二待审核信息更新所述第一对比页面的所述第一待审核信息得到第二对比页面;
将所述第二对比页面和所述第二目标页面进行比较,基于所述第二参照信息对所述第二待审核信息进行审核。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一对比页面和所述第一目标页面进行比较的步骤,包括:
获取与所述第一对比页面对应的第一对比图像,且与所述第一目标页面对应的第一目标图像;
提取所述第一对比图像和所述第一目标图像的像素特征,对比所述第一目标图像的像素特征以及所述第一对比图像的像素特征。
3.根据权利要求1所述的方法,其特征在于,所述获取第一目标页面以及第一待审核页面的步骤包括:
获取所述第一待审核页面的第一标识信息;
基于所述第一标识信息调用目标接口得到所述第一目标页面。
4.根据权利要求1所述的方法,其特征在于,所述获取第二目标页面以及第二待审核页面的步骤包括:
获取所述第二待审核页面的第二标识信息;
基于所述第二标识信息调用目标接口得到所述第二目标页面。
5.根据权利要求1所述的方法,其特征在于,所述将所述对比页面样式更新为所述目标页面样式的步骤包括:
检测所述目标页面样式的元素类型为表格或文本;
复制所述表格或所述文本,并基于复制的所述表格或所述文本更新所述对比页面样式得到所述目标页面样式。
6.根据权利要求1所述的方法,其特征在于,所述将所述对比页面样式更新为所述目标页面样式的步骤包括:
检测所述目标页面样式的元素类型为图片、按钮或视频;
将所述图片、所述按钮或所述视频导入所述对比页面样式得到所述目标页面样式。
7.一种页面内容审核装置,其特征在于,包括:
获取模块,用于获取第一目标页面以及第一待审核页面,其中,所述第一目标页面包括目标页面样式以及第一参照信息,所述第一待审核页面包括对比页面样式和第一待审核信息;
调整模块,用于将所述对比页面样式更新为所述目标页面样式,基于所述目标页面样式和所述第一待审核信息得到第一对比页面;
审核模块,用于将所述第一对比页面和所述第一目标页面进行比较,基于所述第一参照信息对所述第一待审核信息进行审核;
其中,所述获取模块,还用于获取第二目标页面以及第二待审核页面,其中所述第二目标页面包括所述目标页面样式和第二参照信息,所述第二待审核页面包括第二待审核信息;
所述调整模块,还用于基于所述第二待审核信息更新所述第一对比页面的所述第一待审核信息得到第二对比页面;
所述审核模块,还用于将所述第二对比页面和所述第二目标页面进行比较,基于所述第二参照信息对所述第二待审核信息进行审核。
8.一种终端设备,其特征在于,包括:处理器和存储器,所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以实现权利要求1-6中任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序能够被处理器执行时实现如权利要求1-6中任一项所述的方法。
CN202110915612.3A 2021-08-10 2021-08-10 一种页面内容审核方法、装置、设备以及存储介质 Active CN113761442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110915612.3A CN113761442B (zh) 2021-08-10 2021-08-10 一种页面内容审核方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110915612.3A CN113761442B (zh) 2021-08-10 2021-08-10 一种页面内容审核方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN113761442A CN113761442A (zh) 2021-12-07
CN113761442B true CN113761442B (zh) 2024-01-19

Family

ID=78789027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110915612.3A Active CN113761442B (zh) 2021-08-10 2021-08-10 一种页面内容审核方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN113761442B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285578A (ja) * 2005-03-31 2006-10-19 Seiko Epson Corp ページ編集装置、ページ編集方法およびコンピュータプログラム
CN103365967A (zh) * 2013-06-21 2013-10-23 百度在线网络技术(北京)有限公司 一种基于爬虫的自动化差异检测方法及装置
CN103577571A (zh) * 2013-10-31 2014-02-12 北京奇虎科技有限公司 一种数据处理方法和装置
WO2014190785A1 (en) * 2013-05-28 2014-12-04 Tencent Technology (Shenzhen) Company Limited Apparatuses and methods for webpage content processing
CN105373567A (zh) * 2014-09-01 2016-03-02 北京奇虎科技有限公司 页面生成方法及客户端
WO2017076315A1 (zh) * 2015-11-05 2017-05-11 广州市动景计算机科技有限公司 页面显示方法、装置、系统以及页面显示辅助方法、装置
CN108762758A (zh) * 2018-05-23 2018-11-06 北京五八信息技术有限公司 一种页面字段的显示方法、装置、存储介质及终端
CN110502308A (zh) * 2019-08-28 2019-11-26 广州酷狗计算机科技有限公司 页面样式切换方法、装置、计算机设备及存储介质
CN112380116A (zh) * 2020-11-10 2021-02-19 深圳市共进电子股份有限公司 浏览器对比测试方法、装置和浏览器数据转发方法
CN113076099A (zh) * 2021-03-22 2021-07-06 深圳市金蚁云数字科技有限公司 一种页面生成方法、装置、设备以及计算机存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10705684B2 (en) * 2017-04-05 2020-07-07 The Boeing Company System and method for displaying an electronic checklist for an aircraft
CN111339455B (zh) * 2018-12-18 2024-02-23 阿里巴巴集团控股有限公司 浏览器应用加载页面首屏的方法和装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285578A (ja) * 2005-03-31 2006-10-19 Seiko Epson Corp ページ編集装置、ページ編集方法およびコンピュータプログラム
WO2014190785A1 (en) * 2013-05-28 2014-12-04 Tencent Technology (Shenzhen) Company Limited Apparatuses and methods for webpage content processing
CN103365967A (zh) * 2013-06-21 2013-10-23 百度在线网络技术(北京)有限公司 一种基于爬虫的自动化差异检测方法及装置
CN103577571A (zh) * 2013-10-31 2014-02-12 北京奇虎科技有限公司 一种数据处理方法和装置
CN105373567A (zh) * 2014-09-01 2016-03-02 北京奇虎科技有限公司 页面生成方法及客户端
WO2017076315A1 (zh) * 2015-11-05 2017-05-11 广州市动景计算机科技有限公司 页面显示方法、装置、系统以及页面显示辅助方法、装置
CN108762758A (zh) * 2018-05-23 2018-11-06 北京五八信息技术有限公司 一种页面字段的显示方法、装置、存储介质及终端
CN110502308A (zh) * 2019-08-28 2019-11-26 广州酷狗计算机科技有限公司 页面样式切换方法、装置、计算机设备及存储介质
CN112380116A (zh) * 2020-11-10 2021-02-19 深圳市共进电子股份有限公司 浏览器对比测试方法、装置和浏览器数据转发方法
CN113076099A (zh) * 2021-03-22 2021-07-06 深圳市金蚁云数字科技有限公司 一种页面生成方法、装置、设备以及计算机存储介质

Also Published As

Publication number Publication date
CN113761442A (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
CN108595583B (zh) 动态图表类页面数据爬取方法、装置、终端及存储介质
CN107888978B (zh) Key码烧录方法、装置及计算机可读存储介质
CN107895037B (zh) 一种问答数据处理方法、装置、设备和计算机可读介质
US9589063B2 (en) Two-dimensional code processing method and terminal
CN110705405A (zh) 目标标注的方法及装置
CN113806806B (zh) 一种用于网页截图的脱敏、还原方法和系统
CN108664471B (zh) 文字识别纠错方法、装置、设备及计算机可读存储介质
US20180293610A1 (en) Methods and systems for integrating applications into a content recommendation network
CN106294413A (zh) 图片的加载方法和装置
CN105975549A (zh) 一种基于web页面的自定义二维码识别方法
CN107592334A (zh) 一种信息推广方法、装置及设备
CN104462590A (zh) 信息搜索方法及装置
US8639933B2 (en) Image reading apparatus, electronic document generation method, and storing medium storing electronic document generation program
WO2016086309A1 (en) System and method for interacting with information posted in the media
CN109902726B (zh) 简历信息处理方法及装置
CN110134410B (zh) 冷启动用户的个性化信息关联方法、装置及存储介质
CN110728593A (zh) 案件的立案方法和装置、电子设备和存储介质
CN109710866B (zh) 在线文档内图片显示方法和装置
CN111104542A (zh) 零件识别管理方法及装置
CN110750958A (zh) 一种文本显示方法、装置、电子设备及介质
CN113761442B (zh) 一种页面内容审核方法、装置、设备以及存储介质
US20130321435A1 (en) Format and method for representing a dynamic digital image
CN108399167B (zh) 网页信息提取方法和装置
CN113158044B (zh) 全媒体在线审读的方法、系统、终端设备和存储介质
CN114912051A (zh) 数据处理方法、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant