CN110309049A - 网页内容监听方法、装置、计算机设备和存储介质 - Google Patents

网页内容监听方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110309049A
CN110309049A CN201910426187.4A CN201910426187A CN110309049A CN 110309049 A CN110309049 A CN 110309049A CN 201910426187 A CN201910426187 A CN 201910426187A CN 110309049 A CN110309049 A CN 110309049A
Authority
CN
China
Prior art keywords
web page
page
information
characteristic
reference element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910426187.4A
Other languages
English (en)
Inventor
林泽全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN201910426187.4A priority Critical patent/CN110309049A/zh
Publication of CN110309049A publication Critical patent/CN110309049A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites

Abstract

本申请涉及Web前端性能测试领域,尤其涉及一种网页内容监听方法、装置、计算机设备和存储介质,包括:获取当前网页的页面参数和展示窗口的尺寸信息,得到所述当前网页中所包含的参考元素的初始位置和参考元素的形状信息;获取所述参考元素的实时位置信息,根据所述参考元素的实时位置信息确定用户浏览的页面范围;获取所述页面范围内的特征元素,将所述特征元素的显示图像与标准元素样本进行比较,若所述特征元素的显示图像与所述标准元素样本的差异特征点数目小于预设的显示阈值,则标记所述特征元素为用户当前关注的网页内容,否则不标记。本申请提升了对用户当前浏览网页的内容监听的精准度,以便于根据用户浏览习惯推荐网页。

Description

网页内容监听方法、装置、计算机设备和存储介质
技术领域
本申请涉及Web前端性能测试领域,尤其涉及一种网页内容监听方法、装置、计算机设备和存储介质。
背景技术
当前随着计算机等终端设备的日益普及,用户可通过计算机等终端设备上网、看书或者查看相关文件,还可从网页等相关信息的显示页面上摘取信息。例如,从相关文件的显示页面上选择部分内容进行复制、粘贴等操作,以从上述页面中选取相关的页面信息。
目前,在对用户当前关注的网页进行监听时,往往只能监听到用户在观看哪一个网页,而无法得到用户具体关注网页上的哪个部分的信息。因而,不能有效的针对不同用户的需求设计合理的网页结构。
发明内容
基于此,有必要针对目前监听手段无法精准获知用户关注的具体页面内容的问题,提供一种网页内容监听方法、装置、计算机设备和存储介质。
一种网页内容监听方法,包括如下步骤:
获取当前网页的页面参数和展示窗口的尺寸信息,根据所述页面参数和所述尺寸信息,得到所述当前网页中所包含的参考元素的初始位置和参考元素的形状信息;
获取所述参考元素的实时位置信息,根据所述参考元素的实时位置信息确定用户浏览的页面范围;
获取所述页面范围内的特征元素,将所述特征元素的显示图像与标准元素样本进行比较,若所述特征元素的显示图像与所述标准元素样本的差异特征点数目小于预设的显示阈值,则所述特征元素为用户当前关注的网页内容,否则不是用户当前关注的网页内容。
在其中一个可能的实施例中,所述获取当前网页的页面参数和展示窗口的尺寸信息,根据所述页面参数和所述尺寸信息,得到所述当前网页中所包含的参考元素的初始位置和参考元素的形状信息,包括:
获取所述当前网页的查询参数,从所述当前网页的后台数据库中抽取出与所述当前网页的查询参数对应的页面参数;
获取所述展示窗口所使用的显示屏尺寸和所述展示窗口的轮廓信息,根据所述显示屏尺寸和所述轮廓信息,确定所述展示窗口的尺寸信息;
获取所述当前网页上的页面元素,根据所述页面元素的属性将所述页面元素聚类成特征元素和参考元素,根据所述参考元素在所述展示窗口上的比例信息,确定所述参考元素在所述展示窗口的初始位置和形状信息。
在其中一个可能的实施例中,所述获取所述参考元素的实时位置信息,根据所述参考元素的实时位置信息确定用户浏览的页面范围,包括:
获取用户浏览信息采集指令,根据所述用户浏览信息采集指令,截取所述当前网页的图像中的参考元素;
获取所述当前网页的图像中的参考元素在所述当前网页的图像中的实时位置信息,将所述实时位置信息与所述初始位置信息做比较后得到所述用户浏览的页面范围。
在其中一个可能的实施例中,所述获取所述页面范围内的特征元素,将所述特征元素的显示图像与标准元素样本进行比较,若所述特征元素的显示图像与所述标准元素样本的差异特征点数目小于预设的显示阈值,则标记所述特征元素为用户当前关注的网页内容,否则不标记,包括:
根据所述当前网页存储在后台数据库中的页面信息,遍历所述页面范围,抽取出所述页面范围内的特征元素;
获取所述特征元素的显示图像中的元素特征点和所述标准元素样本上的标准特征点,将所述元素特征点与所述标准特征点进行比较得到差异特征点数目;
若所述差异特征点数目小于预设的显示阈值,则标记所述特征元素为用户当前关注的网页内容,否则不标记。
在其中一个可能的实施例中,所述获取所述当前网页的查询参数,从所述当前网页的后台数据库中抽取出与所述当前网页的查询参数对应的页面参数,包括:
获取当前网页的查询信息,抽取出所述查询信息中的文字信息;
将所述文字信息进行聚类后形成数个查询参数;
将所有所述查询参数发送至所述后台数据库,根据所述文字信息,抽取出所述后台数据库中具有同样文字信息的参数数据后得到所述当前网页的查询参数对应的页面参数。
在其中一个可能的实施例中,所述获取所述当前网页的图像中的参考元素在所述当前网页的图像中的实时位置信息,将所述实时位置信息与所述初始位置信息做比较后得到所述用户浏览的页面范围,包括:
获取所述实时网页的图像中的第一参考元素在所述实时网页的图像中的第一实时位置信息,将所述第一实时位置信息与所述第一参考元素的初始位置信息做差得到所述第一参考元素的第一位移量;
获取所述实时网页的图像中的第二参考元素在所述实时网页的图像中的第二实时位置信息,将所述第二实时位置信息与所述第二参考元素的初始位置信息做差得到所述第二参考元素的第二位移量;
将所述第一位移量和所述第二位移量做差后,得到位移量误差,若所述位移量误差在预设的误差阈值以内,则根据所述第一位移量或者所述第二位移量得到所述当前网页的移动范围,否则,对所述当前网页进行修复直到所述位移量误差在所述误差阈值以内。
在其中一个可能的实施例中,所述根据所述当前网页存储在后台数据库中的页面信息,遍历所述页面范围,抽取出所述页面范围内的特征元素,包括:
获取所述当前网页存储在后台数据库中的页面信息,根据所述所页面信息得到出现在所述页面范围内的所有特征元素的类型;
根据所有所述特征元素的类型确定所述特征元素在所述页面范围内的数量上限;
根据所有所述特征元素的类型和所述数量上限,遍历所述页面范围抽取出所有所述页面范围内的特征元素。
一种网页内容监听装置,包括如下模块:
信息采集模块,设置为获取当前网页的页面参数和展示窗口的尺寸信息,根据所述页面参数和所述尺寸信息,得到所述当前网页中所包含的参考元素的初始位置和参考元素的形状信息;
范围确定模块,设置为获取所述参考元素的实时位置信息,根据所述参考元素的实时位置信息确定用户浏览的页面范围;
内容锁定模块,设置为获取所述页面范围内的特征元素,将所述特征元素的显示图像与标准元素样本进行比较,若所述特征元素的显示图像与所述标准元素样本的差异特征点数目小于预设的显示阈值,则标记所述特征元素为用户当前关注的网页内容,否则不标记。
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述网页内容监听方法的步骤。
一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述网页内容监听方法的步骤。
与现有机制相比,本申请具有以下优点:
(1)通过参考元素确定页面范围,然后通过对特征元素进行分析,从而提升了对用户当前浏览网页的内容监听的精准度,以便于根据用户浏览习惯推荐网页;
(2)引入特征元素和参考元素从而在对用户页面内容进行监听时,即能有效确定用户浏览的页面范围,又能获得具体的浏览内容;
(3)通过引入参考元素对页面范围进行监听,从而及时的获得用户浏览页面的范围;
(4)通过与标准元素样本进行比较,从而根据差异点的数目精确的获知用户关注的网页内容,提升了页面内容锁定的精准性。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。
图1为本申请在一个实施例中的一种网页内容监听方法的整体流程图;
图2为本申请在一个实施例中的一种网页内容监听方法中的信息采集过程示意图;
图3为本申请在一个实施例中的一种网页内容监听方法中的范围确定过程示意图;
图4为本申请在一个实施例中的一种网页内容监听方法中的内容锁定过程示意图;
图5为本申请在一个实施例中的一种网页内容监听装置的结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
图1为本申请在一个实施例中的一种网页内容监听方法的整体流程图,如图1所示,一种网页内容监听方法,包括以下步骤:
S1、获取当前网页的页面参数和展示窗口的尺寸信息,根据所述页面参数和所述尺寸信息,得到所述当前网页中所包含的参考元素的初始位置和参考元素的形状信息;
具体的,页面参数可以从当前网页对应的网站后台数据库中进行查询后得到,而窗口的尺寸可以先获得显示屏的尺寸,然后再对展示窗口在显示屏上的屏占比通过像素点计算等方式获得。参考元素通常是采用滚动条、搜索框等可以随着页面移动发生未知变化的组件。其中,滚动条在移动过程中会出现变长等长度变化,因此,参考元素的形状是可以发生变化的。在进行页面参数获取时,比如以滚动条为例,滚动条在初始页面中一般停留在网页靠近右上角的为准,而在用户浏览网页时,滚动条会向下产生位移。屏幕右上角作为坐标原点,滚动条的初始坐标可以为(0,5),而在用户进行网页浏览后,滚动条的坐标变为(0,15)。即对于滚动条这一参考元素的初始位置可以为坐标(0,5)。
S2、获取所述参考元素的实时位置信息,根据所述参考元素的实时位置信息确定用户浏览的页面范围;
例如,当参考元素为搜索框时,从后台数据库或者从前台的网页脚本中获取该搜索框的初始页面的设置参数,从而确定该搜索框在初始页面中的初始位置为距离初始页面的页面顶端5cm,而在实时页面中,搜索框的实时位置为距离当前页面的页面顶端1cm,因此可以认为整个页面向上移动了4cm。则用户浏览的页面范围为移动的这4cm所包含的范围。
S3、获取所述页面范围内的特征元素,将所述特征元素的显示图像与标准元素样本进行比较,若所述特征元素的显示图像与所述标准元素样本的差异特征点数目小于预设的显示阈值,则标记所述特征元素为用户当前关注的网页内容,否则不标记。
具体的,特征元素可以是一副图片上的一个物体。比如,在图片上的一个苹果,在标准元素样本中是一个显示完整的苹果,而在页面范围内仅仅显示了苹果的柄,这就认为用户当前关注的网页内容不包含苹果这一特征元素。相对的,若在页面范围内是一个显示90%的苹果,则可以认为用户关注的网页内容中包含苹果这一特征元素。
本实施例,通过参考元素确定页面范围,然后通过对特征元素进行分析,从而提升了对用户当前浏览网页的内容监听的精准度,以便于根据用户浏览习惯推荐网页。
图2为本申请在一个实施例中的一种网页内容监听方法中的信息采集过程示意图,如图所示,所述S1、获取当前网页的页面参数和展示窗口的尺寸信息,根据所述页面参数和所述尺寸信息,得到所述当前网页中所包含的参考元素的初始位置和参考元素的形状信息,包括:
S101、获取所述当前网页的查询参数,从所述当前网页的后台数据库中抽取出与所述当前网页的查询参数对应的页面参数;
具体的,在后台数据库中可以存储有一个查询参数和页面参数对应的表,然后根据查询语言从这个对应表中抽取出当前网页的查询参数对应的页面参数。
S102、获取所述展示窗口所使用的显示屏尺寸和所述展示窗口的轮廓信息,根据所述显示屏尺寸和所述轮廓信息,确定所述展示窗口的尺寸信息;
其中,显示屏尺寸信息可以采用光信号捕捉的方法进行获取,即对应用光源向显示屏发送固定波长的光线,接收显示屏的反射光,根据接收到反射光的区域和波长可以确定显示屏的尺寸。展示窗口的轮廓信息可以根据展示窗口与背景的色差进行确定,即展示窗口的边框与背景色存在着色差,通过色差就可以确定展示窗口的尺寸。在获得显示屏的储存后,再结合网页显示时所使用的分辨率就可以确定展示窗口的尺寸信息。对于不同的分辨率如1366*768、1920*1080可以采用屏幕像素点识别的方式获得。在同样的显示屏下,不同的分辨率会对展示窗口的尺寸产生影响。
S103、获取所述当前网页上的页面元素,根据所述页面元素的属性将所述页面元素聚类成特征元素和参考元素,根据所述参考元素在所述展示窗口上的比例信息,确定所述参考元素在所述展示窗口的初始位置和形状信息。
其中,特征元素是指在监听用户关注页面内容时所使用的元素,比如在一个页面上有文字信息和图片信息,那么就可以将文字信息作为一个文字特征元素,图片作为一个图片特征元素,这样就可以采用接收鼠标点击或者触摸或者视觉停留时间的方式确定用户关注的是文字信息还是图片信息。参考元素是指确定当前页面是网页的哪一部分的信息,比如参考元素为滚动条,则可以根据滚动条的位置信息确定用户具体是在浏览网页的哪一个页面。
本实施例,引入特征元素和参考元素从而在对用户页面内容进行监听时,即能有效确定用户浏览的页面范围,又能获得具体的浏览内容。
图3为本申请在一个实施例中的一种网页内容监听方法中的范围确定过程示意图,如图所示,所述S2、获取所述参考元素的实时位置信息,根据所述参考元素的实时位置信息确定用户浏览的页面范围,包括:
S201、获取用户浏览信息采集指令,根据所述用户浏览信息采集指令,截取所述当前网页的图像中的参考元素;
具体的,获取预设的用户浏览信息采集方案,根据所述用户浏览信息采集方案设置发送所述用户浏览信息采集指令的时间节点,该采集指令通过对用户浏览的网页中参考元素位置变化情况,来进行对用户浏览信息进行采集。即参考元素发生位移,则进行一次浏览信息采集。其中,采集方案是根据后台数据库中网页信息所确定的,比如A网页为纯文字网页,则可以设置的用户浏览信息采集方案为采集1次,即在预设的浏览完成时刻对用户进行采集,若当前页面没有相应的文字信息则认为用户已经浏览完该网页。
当所述时间节点到来时,发送用户浏览信息采集指令至浏览器;
其中,用户浏览信息采集指令可以是about:network-网络监控工具指令,通过网络监控工具对浏览器进行监控等。接收所述浏览器截取的所述当前页面的页面图像,根据所述参考元素的形状信息,从所述页面图像中抽取出所述实时网页的图像中的参考元素。
其中,在对页面图像进行参考元素识别时可以采用卷积神经网络模型对页面图像上的参考元素进行识别。
S202、获取所述当前网页的图像中的参考元素在所述当前网页的图像中的实时位置信息,将所述实时位置信息与所述初始位置信息做比较后得到所述用户浏览的页面范围。
具体的,参考元素可以选着一个或者多个,在选择多个时可以采用投票机制等得到更加准确的参考元素。比如,初始页面上一个搜索框位置为距离页面顶端5cm,而在实时页面中,搜素框位置为距离页面顶端1cm,就可以说明用户浏览的范围为初始页面向上移动4cm。
本实施例,通过引入参考元素对页面范围进行监听,从而及时的获得用户浏览页面的范围。
图4为本申请在一个实施例中的一种网页内容监听方法中的内容锁定过程示意图,如图所示,所述S3、获取所述页面范围内的特征元素,将所述特征元素的显示图像与标准元素样本进行比较,若所述特征元素的显示图像与所述标准元素样本的差异特征点数目小于预设的显示阈值,则标记所述特征元素为用户当前关注的网页内容,否则不标记,包括:
S301、根据所述当前网页存储在后台数据库中的页面信息,遍历所述页面范围,抽取出所述页面范围内的特征元素;
具体的,在后台数据库中有当前网页各个展示图像的图像样本,在图像样本中对不同的元素采用了不同的记号进行标记,比如在网页中有一个搜索框,一个图片,则可以将搜索框标记为“S”,图片标记为“P”等,只要搜索到这些标记就可以获得对应的特征元素。
S302、获取所述特征元素的显示图像中的元素特征点和所述标准元素样本上的标准特征点,将所述元素特征点与所述标准特征点进行比较得到差异特征点数目;
具体的,比如一张扣篮的图像,则这样元素的特征点为篮球、篮筐和运动员的手臂,而运动员的腿和球场地板则不是元素特征点;类似的标准特征点也可以是篮球、篮筐和运动员的手臂。若在图像中只有运动员的手臂,则可推断为用户刚刚浏览完这张图像。
S303、若所述差异特征点数目小于预设的显示阈值,则标记所述特征元素为用户当前关注的网页内容,否则不标记。
本实施例,通过与标准元素样本进行比较,从而根据差异点的数目精确的获知用户关注的网页内容,提升了页面内容锁定的精准性。
在一个实施例中,所述101、获取所述当前网页的查询参数,从所述当前网页的后台数据库中抽取出与所述当前网页的查询参数对应的页面参数,包括:
获取当前网页的查询信息,抽取出所述查询信息中的文字信息;
本实施例中的浏览器可以是IE浏览器、火狐浏览器、谷歌浏览器等IE内核和非IE内核浏览器,一般浏览器会在页面发生变化时发送针对当前网页的查询信息,而网页发生变化一般是根据Js脚本对网页状态进行监控后设置的。
将所述文字信息进行聚类后形成数个查询参数;
具体的,可以设置一查询参数的初始语段,所述初始语段中至少包含一个所述数值信息和一个所述文字信息,查询所述初始语段,若所述初始语段中包含了两个或者以上的数值信息或者文字信息,则将所述初始语段进行分割直到仅包含一个所述数值信息和一个所述文字信息的最小语段,提取所述最小语段得到所述查询参数。
将所有所述查询参数发送至所述后台数据库,根据所述文字信息,抽取出所述后台数据库中具有同样文字信息的参数数据后得到所述当前网页的查询参数对应的页面参数。
具体的,在从所述后台数据库中抽取参数数据时,还可以包括判断后台数据库是否可用的步骤,发送心跳信号至所述后台数据库,若所述后台数据库在预设的反馈阈值内没有发生心跳响应信息,则所述后台数据库不可用。此时,需要应用BUG查询和修复工具对后台数据库或者网络进行修复。
本实施例,通过对查询信息进行分析,从而准确的获得了页面参数。
在一个实施例中,所述S202、获取所述当前网页的图像中的参考元素在所述当前网页的图像中的实时位置信息,将所述实时位置信息与所述初始位置信息做比较后得到所述用户浏览的页面范围,包括:
获取所述实时网页的图像中的第一参考元素在所述实时网页的图像中的第一实时位置信息,将所述第一实时位置信息与所述第一参考元素的初始位置信息做差得到所述第一参考元素的第一位移量;
其中,第一参考元素可以是滚动条,即滚动条的初始坐标可以是(8,0)和(8,3)在这里可以把滚动条简略的即为一条垂线以便于比较。网页发生因用户使用产生的位移后,滚动条的坐标变为(8,6)和(8,9)则滚动条在垂直方向上移动了6个单位的位移。
获取所述实时网页的图像中的第二参考元素在所述实时网页的图像中的第二实时位置信息,将所述第二实时位置信息与所述第二参考元素的初始位置信息做差得到所述第二参考元素的第二位移量;
其中,第二参考元素可以是鼠标,比如鼠标的初始坐标为(6,2),实时坐标为(5,8)则认为鼠标的位移和滚动条的位移相一致。
将所述第一位移量和所述第二位移量做差后,得到位移量误差,若所述位移量误差在预设的误差阈值以内,则根据所述第一位移量或者所述第二位移量得到所述当前网页的移动范围,否则,对所述当前网页进行修复直到所述位移量误差在所述误差阈值以内。
本实施例,通过两个参考元素,从而精准的确定页面移动的范围。
在一个实施例中,所述S301、根据所述当前网页存储在后台数据库中的页面信息,遍历所述页面范围,抽取出所述页面范围内的特征元素,包括:
获取所述当前网页存储在后台数据库中的页面信息,根据所述所页面信息得到出现在所述页面范围内的所有特征元素的类型;
具体的,在后台数据库中有对前端当前浏览的网页的全部数据信息,从这些数据信息中可以得到该网页所包含的特征元素的类型,比如网页上可能存在有3张图片,每一张图片的尺寸和RGB数值,有3段文字,每一段文字的长度为XX字符等。
根据所有所述特征元素的类型确定所述特征元素在所述页面范围内的数量上限;
比如,特征元素为一个flash动画,则在某一网页中不能显示超过2个。
根据所有所述特征元素的类型和所述数量上限,遍历所述页面范围抽取出所有所述页面范围内的特征元素。
本实施例中,通过对特征元素的类型和数量进行限制,从而更好的获得页面范围内的特征元素。
在一个实施例中,提出了一种网页内容监听装置,如图5所示,包括如下模块:
信息采集模块51,设置为获取当前网页的页面参数和展示窗口的尺寸信息,根据所述页面参数和所述尺寸信息,得到所述当前网页中所包含的参考元素的初始位置和参考元素的形状信息;
范围确定模块52,设置为获取所述参考元素的实时位置信息,根据所述参考元素的实时位置信息确定用户浏览的页面范围;
内容锁定模块53,设置为获取所述页面范围内的特征元素,将所述特征元素的显示图像与标准元素样本进行比较,若所述特征元素的显示图像与所述标准元素样本的差异特征点数目小于预设的显示阈值,则标记所述特征元素为用户当前关注的网页内容,否则不标记。
在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述网页内容监听方法的步骤。
在一个实施例中,提出了一种存储有计算机可读指令的存储介质,该计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述各实施例中的所述网页内容监听方法的步骤。其中,所述存储介质可以为非易失性存储介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请一些示例性实施例,其中描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种网页内容监听方法,其特征在于,包括:
获取当前网页的页面参数和展示窗口的尺寸信息,根据所述页面参数和所述尺寸信息,得到所述当前网页中所包含的参考元素的初始位置和参考元素的形状信息;
获取所述参考元素的实时位置信息,根据所述参考元素的实时位置信息确定用户浏览的页面范围;
获取所述页面范围内的特征元素,将所述特征元素的显示图像与标准元素样本进行比较,若所述特征元素的显示图像与所述标准元素样本的差异特征点数目小于预设的显示阈值,则标记所述特征元素为用户当前关注的网页内容,否则不标记。
2.根据权利要求1所述的网页内容监听方法,其特征在于,所述获取当前网页的页面参数和展示窗口的尺寸信息,根据所述页面参数和所述尺寸信息,得到所述当前网页中所包含的参考元素的初始位置和参考元素的形状信息,包括:
获取所述当前网页的查询参数,从所述当前网页的后台数据库中抽取出与所述当前网页的查询参数对应的页面参数;
获取所述展示窗口所使用的显示屏尺寸和所述展示窗口的轮廓信息,根据所述显示屏尺寸和所述轮廓信息,确定所述展示窗口的尺寸信息;
获取所述当前网页上的页面元素,根据所述页面元素的属性将所述页面元素聚类成特征元素和参考元素,根据所述参考元素在所述展示窗口上的比例信息,确定所述参考元素在所述展示窗口的初始位置和形状信息。
3.根据权利要求1所述的网页内容监听方法,其特征在于,所述获取所述参考元素的实时位置信息,根据所述参考元素的实时位置信息确定用户浏览的页面范围,包括:
获取用户浏览信息采集指令,根据所述用户浏览信息采集指令,截取所述当前网页的图像中的参考元素;
获取所述当前网页的图像中的参考元素在所述当前网页的图像中的实时位置信息,将所述实时位置信息与所述初始位置信息做比较后得到所述用户浏览的页面范围。
4.根据权利要求1所述的网页内容监听方法,其特征在于,所述获取所述页面范围内的特征元素,将所述特征元素的显示图像与标准元素样本进行比较,若所述特征元素的显示图像与所述标准元素样本的差异特征点数目小于预设的显示阈值,则标记所述特征元素为用户当前关注的网页内容,否则不标记,包括:
根据所述当前网页存储在后台数据库中的页面信息,遍历所述页面范围,抽取出所述页面范围内的特征元素;
获取所述特征元素的显示图像中的元素特征点和所述标准元素样本上的标准特征点,将所述元素特征点与所述标准特征点进行比较得到差异特征点数目;
若所述差异特征点数目小于预设的显示阈值,则标记所述特征元素为用户当前关注的网页内容,否则不标记。
5.根据权利要求2所述的网页内容监听方法,其特征在于,所述获取所述当前网页的查询参数,从所述当前网页的后台数据库中抽取出与所述当前网页的查询参数对应的页面参数,包括:
获取当前网页的查询信息,抽取出所述查询信息中的文字信息;
将所述文字信息进行聚类后形成数个查询参数;
将所有所述查询参数发送至所述后台数据库,根据所述文字信息,抽取出所述后台数据库中具有同样文字信息的参数数据后得到所述当前网页的查询参数对应的页面参数。
6.根据权利要求3所述的网页内容监听方法,其特征在于,所述获取所述当前网页的图像中的参考元素在所述当前网页的图像中的实时位置信息,将所述实时位置信息与所述初始位置信息做比较后得到所述用户浏览的页面范围,包括:
获取所述实时网页的图像中的第一参考元素在所述实时网页的图像中的第一实时位置信息,将所述第一实时位置信息与所述第一参考元素的初始位置信息做差得到所述第一参考元素的第一位移量;
获取所述实时网页的图像中的第二参考元素在所述实时网页的图像中的第二实时位置信息,将所述第二实时位置信息与所述第二参考元素的初始位置信息做差得到所述第二参考元素的第二位移量;
将所述第一位移量和所述第二位移量做差后,得到位移量误差,若所述位移量误差在预设的误差阈值以内,则根据所述第一位移量或者所述第二位移量得到所述当前网页的移动范围,否则,对所述当前网页进行修复直到所述位移量误差在所述误差阈值以内。
7.根据权利要求4所述的网页内容监听方法,其特征在于,所述根据所述当前网页存储在后台数据库中的页面信息,遍历所述页面范围,抽取出所述页面范围内的特征元素,包括:
获取所述当前网页存储在后台数据库中的页面信息,根据所述所页面信息得到出现在所述页面范围内的所有特征元素的类型;
根据所有所述特征元素的类型确定所述特征元素在所述页面范围内的数量上限;
根据所有所述特征元素的类型和所述数量上限,遍历所述页面范围抽取出所有所述页面范围内的特征元素。
8.一种网页内容监听装置,其特征在于,包括以下模块:
信息采集模块,设置为获取当前网页的页面参数和展示窗口的尺寸信息,根据所述页面参数和所述尺寸信息,得到所述当前网页中所包含的参考元素的初始位置和参考元素的形状信息;
范围确定模块,设置为获取所述参考元素的实时位置信息,根据所述参考元素的实时位置信息确定用户浏览的页面范围;
内容锁定模块,设置为获取所述页面范围内的特征元素,将所述特征元素的显示图像与标准元素样本进行比较,若所述特征元素的显示图像与所述标准元素样本的差异特征点数目小于预设的显示阈值,则标记所述特征元素为用户当前关注的网页内容,否则不标记。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述网页内容监听方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述网页内容监听方法的步骤。
CN201910426187.4A 2019-05-21 2019-05-21 网页内容监听方法、装置、计算机设备和存储介质 Pending CN110309049A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910426187.4A CN110309049A (zh) 2019-05-21 2019-05-21 网页内容监听方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910426187.4A CN110309049A (zh) 2019-05-21 2019-05-21 网页内容监听方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN110309049A true CN110309049A (zh) 2019-10-08

Family

ID=68074911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910426187.4A Pending CN110309049A (zh) 2019-05-21 2019-05-21 网页内容监听方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110309049A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767206A (zh) * 2020-05-08 2020-10-13 北京奇艺世纪科技有限公司 一种内容单元露出呈现率的统计方法、装置及电子设备
CN111949516A (zh) * 2020-07-23 2020-11-17 上海硬通网络科技有限公司 页面测试方法、装置及电子设备
CN113779447A (zh) * 2020-07-21 2021-12-10 北京沃东天骏信息技术有限公司 用户浏览数据的获取方法、装置、电子设备及存储介质
CN113886188A (zh) * 2021-10-20 2022-01-04 北京达佳互联信息技术有限公司 网页元素的监测方法、装置、电子设备、存储介质
CN115033335A (zh) * 2022-08-11 2022-09-09 青岛中正合力软件有限公司 一种应用于网页同屏的显示处理方法
CN115659078A (zh) * 2022-10-12 2023-01-31 湖北盈隆腾辉科技有限公司 基于人工智能的网络信息安全监控方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951961A (zh) * 2015-06-02 2015-09-30 百度在线网络技术(北京)有限公司 用于推送内容的方法、终端、服务器以及系统
CN107239566A (zh) * 2017-06-14 2017-10-10 掌阅科技股份有限公司 用户日志生成方法、电子设备及计算机存储介质
CN107273489A (zh) * 2017-06-14 2017-10-20 掌阅科技股份有限公司 内容推送方法、电子设备及计算机存储介质
CN107526760A (zh) * 2016-06-15 2017-12-29 Sk 普兰尼特有限公司 使用滚动模式的兴趣信息分析方法和使用该方法的设备
CN108846116A (zh) * 2018-06-26 2018-11-20 北京京东金融科技控股有限公司 网页曝光数据采集方法、系统、电子设备和存储介质
CN109471571A (zh) * 2018-10-23 2019-03-15 努比亚技术有限公司 悬浮控件的显示方法、移动终端及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951961A (zh) * 2015-06-02 2015-09-30 百度在线网络技术(北京)有限公司 用于推送内容的方法、终端、服务器以及系统
CN107526760A (zh) * 2016-06-15 2017-12-29 Sk 普兰尼特有限公司 使用滚动模式的兴趣信息分析方法和使用该方法的设备
CN107239566A (zh) * 2017-06-14 2017-10-10 掌阅科技股份有限公司 用户日志生成方法、电子设备及计算机存储介质
CN107273489A (zh) * 2017-06-14 2017-10-20 掌阅科技股份有限公司 内容推送方法、电子设备及计算机存储介质
CN108846116A (zh) * 2018-06-26 2018-11-20 北京京东金融科技控股有限公司 网页曝光数据采集方法、系统、电子设备和存储介质
CN109471571A (zh) * 2018-10-23 2019-03-15 努比亚技术有限公司 悬浮控件的显示方法、移动终端及计算机可读存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767206A (zh) * 2020-05-08 2020-10-13 北京奇艺世纪科技有限公司 一种内容单元露出呈现率的统计方法、装置及电子设备
CN113779447A (zh) * 2020-07-21 2021-12-10 北京沃东天骏信息技术有限公司 用户浏览数据的获取方法、装置、电子设备及存储介质
CN111949516A (zh) * 2020-07-23 2020-11-17 上海硬通网络科技有限公司 页面测试方法、装置及电子设备
CN113886188A (zh) * 2021-10-20 2022-01-04 北京达佳互联信息技术有限公司 网页元素的监测方法、装置、电子设备、存储介质
CN115033335A (zh) * 2022-08-11 2022-09-09 青岛中正合力软件有限公司 一种应用于网页同屏的显示处理方法
CN115659078A (zh) * 2022-10-12 2023-01-31 湖北盈隆腾辉科技有限公司 基于人工智能的网络信息安全监控方法及系统

Similar Documents

Publication Publication Date Title
CN110309049A (zh) 网页内容监听方法、装置、计算机设备和存储介质
CN105045901B (zh) 搜索关键词的推送方法和装置
US20180218435A1 (en) Systems and methods for customizing search results and recommendations
CN107729475B (zh) 网页元素采集方法、装置、终端与计算机可读存储介质
US20120010920A1 (en) Method, Apparatus and System for Visualizing User's Web Page Browsing Behavior
CN105556540A (zh) 评估图像清晰度
CN104951961A (zh) 用于推送内容的方法、终端、服务器以及系统
CN102411614A (zh) 图像搜索结果的显示
US20150227276A1 (en) Method and system for providing an interactive user guide on a webpage
Mahajan et al. WebSee: A tool for debugging HTML presentation failures
CN105874449A (zh) 用于提取和生成用于显示内容的图像的系统和方法
CN104991906A (zh) 信息获取方法、服务器、终端及数据库构建方法、装置
CN104899306A (zh) 信息处理方法、信息显示方法及装置
Feng et al. Gallery dc: Auto-created gui component gallery for design search and knowledge discovery
CN110248235A (zh) 软件教学方法、装置、终端设备及介质
CN108369647B (zh) 基于图像的质量控制
CN111597102A (zh) 一种页面性能的测试方法、终端及存储介质
CN112100530A (zh) 网页分类方法、装置、电子设备及存储介质
Qi et al. STBins: Visual tracking and comparison of multiple data sequences using temporal binning
CN114610802A (zh) 词轮播方法、装置、设备及存储介质
KR20110074423A (ko) 상세정보 이미지 파일의 검색 시스템 및 방법
JP5103590B2 (ja) 情報処理装置および情報処理方法
CN110851349A (zh) 页面异常显示的检测方法、终端设备及存储介质
Wróblewska et al. Optimal products presentation in offer images for e-commerce marketplace platform
CN112445992B (zh) 信息处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination