CN103605716B - 用于网页页面点击展现的数据处理方法和装置 - Google Patents

用于网页页面点击展现的数据处理方法和装置 Download PDF

Info

Publication number
CN103605716B
CN103605716B CN201310566741.1A CN201310566741A CN103605716B CN 103605716 B CN103605716 B CN 103605716B CN 201310566741 A CN201310566741 A CN 201310566741A CN 103605716 B CN103605716 B CN 103605716B
Authority
CN
China
Prior art keywords
coordinate
webpage
target area
standard resolution
coordinate system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310566741.1A
Other languages
English (en)
Other versions
CN103605716A (zh
Inventor
何鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201310566741.1A priority Critical patent/CN103605716B/zh
Publication of CN103605716A publication Critical patent/CN103605716A/zh
Application granted granted Critical
Publication of CN103605716B publication Critical patent/CN103605716B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种用于网页页面点击展现的数据处理方法和装置。该用于网页页面点击展现的数据处理方法包括:获取被监测网页页面在标准分辨率下的坐标系;根据标准分辨率下的坐标系在被监测网页页面中获取目标区域;计算目标区域的点击密度;以及根据点击密度生成目标区域的点击展现方式。通过本发明,解决了相关技术中网页页面点击情况的展现方式不能正确反映网页页面位置的相对重要性的问题,进而达到了正确反映网页页面位置的相对重要性的效果。

Description

用于网页页面点击展现的数据处理方法和装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种用于网页页面点击展现的数据处理方法和装置。
背景技术
热力图是一种将用户浏览网页时产生的网页页面点击量进行可视化展现的展现方式,其中,网页页面上点击量不同的位置在热力图上呈现不同的颜色。通过热力图,人们可以直观地了解被监测网页页面中哪些位置的点击量较大、哪些位置的点击量较小,从而可以有针对性地进行网页页面的优化和分析。
目前,在相关技术中,通过记录被监测网页页面中的像素点点击量,并将网页页面上的像素坐标转化成标准单位的像素坐标,以及通过每个标准单位的像素坐标上对应的像素点点击量确定网页页面上点击量不同的位置在热力图上呈现不同的颜色,但是,这种方案具有如下缺点(如图1所示):
(1)上述热力图不能如实反映多像素单位对应相同指向的情况。这是因为虽然像素单位是网页页面所能分割的最小单位,但是单纯根据像素单位对网页页面进行分割并不能完整地反映网页页面内容本身。例如,网页页面中一个栏目导航链接会占若干个像素单位位置,访客对这些位置中的任意一个进行点击都表示该链接被触发,而上述热力图中对网页页面的分割粒度并没有将这种多像素单位对应相同指向的情况如实反映出来。
(2)上述热力图不能如实反映网页页面上单一像素位置的冷热程度。这是因为访客的点击行为具有无规律性,这种点击行为的无规律性可能造成网页页面中具有同一指向的不同像素点的点击量也不相同,进而在热力图中反映出的颜色也不相同。
(3)上述热力图底层展现不连续。这是因为上述热力图的展现是基于对网页页面像素点点击量的统计,而该像素点点击量是非连续性数据,因此在热力图展现中会存在明显的断裂痕迹,进而影响人们对网页页面点击情况的直观理解。
另外,在相关技术中,与上述方案相对应的还可以通过表格数据的方式展现网页页面的点击情况,例如,如下表所示,通过该表对数据的展现可以看出第一行和第二行的前两个位置与第四行的第四个位置以及第五行的第五个位置具有相同的点击热度,而实际上这些位置的点击热度可能并不相同,因此,这种方案不能正确反映网页页面位置的相对重要性,进而可能影响人们对网页页面点击情况的直观理解。
0 0 0 0 0 0
0 0 0 1 1 0
0 0 0 1 2 1
0 0 1 0 4 1
0 0 1 3 0 1
0 0 0 1 1 0
针对相关技术中网页页面点击情况的展现方式不能正确反映网页页面位置的相对重要性的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种用于网页页面点击展现的数据处理方法和装置,以解决相关技术中网页页面点击情况的展现方式不能正确反映网页页面位置的相对重要性的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种用于网页页面点击展现的数据处理方法。该方法包括:获取被监测网页页面在标准分辨率下的坐标系;根据标准分辨率下的坐标系在被监测网页页面中获取目标区域;计算目标区域的点击密度;以及根据点击密度生成目标区域的点击展现方式。
进一步地,根据标准分辨率下的坐标系在被监测网页页面中获取目标区域包括:在标准分辨率下的坐标系中将被监测网页页面沿X轴方向进行第一次等分,将被监测网页页面划分为多个第一区域;在标准分辨率下坐标系的中将被监测网页页面沿Y轴方向进行第二次等分,将多个第一区域划分为多个第二区域;以及将第二区域作为目标区域。
进一步地,计算目标区域的点击密度包括:根据第一次等分和第二次等分获取第一次等分次数和第二次等分次数;获取X坐标最小值和X坐标最大值以及Y坐标最小值和Y坐标最大值;确定目标区域坐标,其中,目标区域坐标通过第一次等分次数和第二次等分次数、X坐标最小值和X坐标最大值以及Y坐标最小值和Y坐标最大值计算得到;获取目标区域内的像素点坐标集合,其中,像素点坐标集合中的坐标为被点击的像素点对应的坐标;根据像素点坐标集合确定高斯核密度估计带宽;以及通过目标区域坐标、像素点坐标集合和高斯核密度估计带宽确定目标区域的点击二维核密度。
进一步地,在获取被监测网页页面在标准分辨率下的坐标系之前,该数据处理方法还包括:获取被监测网页页面在非标准分辨率下的坐标系;以及将非标准分辨率下的坐标系转化成标准分辨率下的坐标系。
进一步地,通过将非标准分辨率下的坐标系按比例放大或者按比例缩小以转化成标准分辨率下的坐标系。
为了实现上述目的,根据本发明的另一方面,提供了一种用于网页页面点击展现的数据处理装置。该装置包括:第一获取单元,用于获取被监测网页页面在标准分辨率下的坐标系;第二获取单元,用于根据标准分辨率下的坐标系在被监测网页页面中获取目标区域;计算单元,用于计算目标区域的点击密度;以及生成单元,用于根据点击密度生成目标区域的点击展现方式。
进一步地,第二获取单元包括:第一划分模块,用于在标准分辨率下的坐标系中将被监测网页页面沿X轴方向进行第一次等分,将被监测网页页面划分为多个第一区域;第二划分模块,用于在标准分辨率下坐标系的中将被监测网页页面沿Y轴方向进行第二次等分,将多个第一区域划分为多个第二区域;以及第一确定模块,用于将第二区域作为目标区域。
进一步地,计算单元包括:第一获取模块,用于根据第一次等分和第二次等分获取第一次等分次数和第二次等分次数;第二获取模块,用于获取X坐标最小值和X坐标最大值以及Y坐标最小值和Y坐标最大值;第二确定模块,用于确定目标区域坐标,其中,目标区域坐标通过第一次等分次数和第二次等分次数、X坐标最小值和X坐标最大值以及Y坐标最小值和Y坐标最大值计算得到;第三获取模块,用于获取目标区域内的像素点坐标集合,其中,像素点坐标集合中的坐标为被点击的像素点对应的坐标;第三确定模块,用于根据像素点坐标集合确定高斯核密度估计带宽;以及第四确定模块,用于通过目标区域坐标、像素点坐标集合和高斯核密度估计带宽确定目标区域的点击二维核密度。
进一步地,数据处理装置还包括:第三获取单元,用于在获取被监测网页页面在标准分辨率下的坐标系之前,获取被监测网页页面在非标准分辨率下的坐标系;以及转化单元,用于将非标准分辨率下的坐标系转化成标准分辨率下的坐标系。
进一步地,转化单元还用于通过将非标准分辨率下的坐标系按比例放大或者按比例缩小以转化成标准分辨率下的坐标系。
通过本发明,采用获取被监测网页页面在标准分辨率下的坐标系;根据标准分辨率下的坐标系在被监测网页页面中获取目标区域;计算目标区域的点击密度;以及根据点击密度生成目标区域的点击展现方式,解决了相关技术中网页页面点击情况的展现方式不能正确反映网页页面位置的相对重要性的问题,进而达到了正确反映网页页面位置的相对重要性的效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据相关技术的用于网页页面点击展现情况的示意图;
图2是根据本发明实施例的用于网页页面点击展现的数据处理方法的流程图;
图3是根据本发明优选实施例的用于网页页面点击展现的数据处理方法的流程图;
图4根据图3所示的本发明优选实施例的用于网页页面点击展现情况的示意图;
图5是根据本发明优选实施例的用于网页页面点击展现的数据处理装置的示意图;以及
图6是根据本发明优选实施例的用于网页页面点击展现的数据处理装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本领域的技术人员更好的理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,在本领域普通技术人员没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
根据本发明的实施例,提供了一种用于网页页面点击展现的数据处理方法,该用于网页页面点击展现的数据处理方法用于通过点击密度生成目标区域的点击展现方式。该用于网页页面点击展现的数据处理方法可以运行在计算机处理设备上。
图2是根据本发明实施例的用于网页页面点击展现的数据处理方法流程图。
如图2所示,该用于网页页面点击展现的数据处理方法包括如下的步骤S101至步骤S104:
步骤S101,获取被监测网页页面在标准分辨率下的坐标系。
需要说明的是,在本发明实施例中,标准分辨率是指显示装置的屏幕的物理像素,它要与显卡输出的逻辑点相对应。标准分辨率可以预先设定,例如,标准分辨率可以预设为800×600,其中,800×600表示在显示装置的屏幕的横向上划分了800个像素点、竖向上划分了600个像素点。分辨率是体现屏幕图像的精密度的物理量,它表示显示装置所能显示的像素点个数的多少,具体地,分辨率越高,显示装置可显示的像素点个数越多,画面就越精细,否则分辨率越低,显示装置可显示的像素点个数越少,画面就越粗糙。
在本发明实施例中,被检测网页页面可以包括多种平台下的网页页面和多种浏览器下的网页页面,例如,被检测网页页面可以为Windows和Linux平台下的网页页面,以及被检测网页页面可以为互联网浏览器(Internet Explorer,简称IE)、360浏览器和搜狗浏览器等。
获取被监测网页页面在标准分辨率下的坐标系可以包括获取被监测网页页面在标准分辨率下的二维直角正交坐标系,其中,获取二维直角正交坐标系包括获取二维直角正交坐标系的要素,该要素包括二维直角正交坐标系的坐标原点、横轴及其正方向、纵轴及其正方向和单位长度。在本发明实施例中,可以根据网页页面上像素点的排列结构获取二维直角正交坐标系的坐标原点,例如,可以根据网页页面上第一行像素点的的排列结构获取二维直角正交坐标系的坐标原点:(1)如果第一行像素点居中排列,则获取的坐标原点在网页页面第一行的居中位置;(2)如果第一行像素点左对齐排列,则获取的坐标原点在网页页面第一行的最左端;(3)如果第一行像素点右对齐排列,则获取的坐标原点在网页页面第一行的最右端。获取的横轴正方向可以包括水平向左,获取的纵轴正方向可以包括竖直向上。获取的单位长度可以为数学领域的单位长度,该数学领域的单位长度可以由网页页面中坐标的精度确定。
优选地,获取的单位长度也可以为计算机网页中的单位长度,即,像素单位长度,其中,像素单位长度可以为1像素(pixel,简称px),网页界面上的每个像素点对应唯一的像素坐标,这样,可以根据坐标系中像素坐标与像素点一一对应的关系,以像素坐标为依据,通过像素坐标上对应的点击量记录与该像素坐标对应的像素点的点击量。需要说明的是,在本发明实施例中,每个单位长度对应一个单位面积,每个单位面积对应一个像素点集合,单位面积决定像素点集合中像素点的个数,这样,可以根据坐标系中单位面积与像素点集合一一对应的关系,以单位面积为依据,通过单位面积上对应的点击量记录与该单位面积对应的像素点集合的点击量。
在本发明实施例中,在步骤S101之前,该数据处理方法还可以包括步骤1至步骤2:
步骤1,获取被监测网页页面在非标准分辨率下的坐标系。
在本发明实施例中,可以先获取被监测网页页面的分辨率,再判断该分辨率是否是标准分辨率,如果判断出该分辨率是标准分辨率,则不做任何处理,否则如果判断出该分辨率不是标准分辨率,即该分辨率为非标准分辨率,则将获取的非标准分辨率下的坐标系转化成标准分辨率下的坐标系,即执行步骤2。
步骤2,将非标准分辨率下的坐标系转化成标准分辨率下的坐标系。
在本发明实施例中,具体地,可以通过以下方式将非标准分辨率下的坐标系转化成标准分辨率下的坐标系:
(1)获取非标准分辨率,其中,包括获取非标准分辨率在横向和纵向上的分辨率,例如,假设获取的非标准分辨率为1600×900,则相应的该非标准分辨率在横向和纵向上的分辨率分别为1600和900。
(2)获取标准分辨率,即为获取预设的标准分辨率,其中,包括获取标准分辨率在横向和纵向上的分辨率,例如,预设的标准分辨率可以为800×600,则相应的该标准分辨率在横向和纵向上的分辨率分别为800和600。
(3)计算非标准分辨率与标准分辨率的比值,其中,包括分别计算非标准分辨率与标准分辨率在横向上的第一比值和纵向上的第二比值,例如,当非标准分辨率为1600×900时,并且标准分辨率为800×600时,则计算得到第一比值为2、第二比值为1.5。
(4)将非标准分辨率下的坐标系按比例放大或者按比例缩小以转化成所述标准分辨率下的坐标系,具体地,在横向上按第一比值进行转化和在纵向上按第二比值进行转化。
步骤S102,根据标准分辨率下的坐标系在被监测网页页面中获取目标区域。
在本发明实施例中,目标区域可以包括整个网页页面或者整个网页页面的子区域,并且目标区域可以包括一个或者多个。目标区域的大小和形状可以根据客户端的分析需求通过划分被监测网页页面得到,例如,可以分别按照步骤S101获取的被监测网页页面在标准分辨率下的坐标系对被监测网页页面进行划分以得到目标区域。
步骤S103,计算目标区域的点击密度。
在本发明实施例中,计算目标区域的点击密度可以包括计算目标区域的点击二维核密度,其中,该目标区域的点击密度为连续的物理量,这样,克服了通过计算目标区域的点击量以展现网页页面的点击分布情况时的不连续缺陷,达到了平滑展现网页页面的点击分布情况的效果,进而有利于人们正确地、直观地了解网页页面位置的相对重要性。具体地,可以通过目标区域的点击量和目标区域的包含的总坐标数量计算目标区域的点击密度。
步骤S104,根据点击密度生成目标区域的点击展现方式。
在本发明实施例中,根据点击密度生成目标区域的点击展现方式可以包括根据点击密度生成目标区域的二维热力图、三维热力图、等高线和矩阵阵列等。其中,在二维热力图中,点击密度可以用颜色表征,并且不同的颜色表征不同的点击密度;在等高线中,点击密度可以用等高线表征,并且不同的等高线表征不同的点击密度;在三维热力图中,点击密度可以同时用颜色和等高线表征;在矩阵阵列中,不同的元素表示网页页面上不同的目标区域上的点击密度。
通过本发明,采用获取被监测网页页面在标准分辨率下的坐标系;根据标准分辨率下的坐标系在被监测网页页面中获取目标区域;计算目标区域的点击密度;以及根据点击密度生成目标区域的点击展现方式,解决了相关技术中网页页面点击情况的展现方式不能正确反映网页页面位置的相对重要性的问题,进而达到了正确反映网页页面位置的相对重要性的效果。
图3是根据本发明优选实施例的用于网页页面点击展现的数据处理方法流程图。
如图3所示,该用于网页页面点击展现的数据处理方法包括如下的步骤S201至步骤S206,该实施例可以作为图2所示实施例的优选实施方式。
步骤S201,同图2所示实施例的步骤S101,在此不再赘述。
步骤S202,将被监测网页页面划分为多个第一区域。
在本发明实施例中,在标准分辨率下的坐标系中将被监测网页页面沿X轴方向进行第一次等分,将被监测网页页面划分为多个第一区域,其中,沿X轴方向进行第一次等分时,相邻的两个等分点之间的距离为第一等分长度,该第一等分长度可以预先设定,例如,第一等分长度可以包括5个像素单位长度。在本发明实施例中,多个第一区域为等宽度的条形区域,并且多个第一区域均平行于Y轴。
步骤S203,将多个第一区域划分为多个第二区域。
在本发明实施例中,在标准分辨率下的坐标系中将被监测网页页面沿Y轴方向进行第二次等分,将被监测网页页面划分为多个第二区域,其中,沿Y轴方向进行第二次等分时,相邻的两个等分点之间的距离为第二等分长度,该第二等分长度可以预先设定,并且第一等分长度和第二等分长度可以相等,也可以不相等。在本发明实施例中,多个第二区域为形状相同的矩形区域,特殊地,当第一等分长度和第二等分长度相等时,多个第二区域为形状相同的正方形区域。
步骤S204,将第二区域作为目标区域。
需要说明的是,在本发明实施例中,步骤S202至步骤S204可以用于实现根据标准分辨率下的坐标系在被监测网页页面中获取目标区域的目的。
步骤S205,计算目标区域的点击密度。
在本发明实施例中,具体地,可以通过以下步骤计算目标区域的点击密度:
步骤1,根据第一次等分和第二次等分获取第一次等分次数和第二次等分次数。具体地,可以根据被监测网页页面的横向宽度与第一次等分长度的比值获取第一次等分次数,该第一次等分次数记为Kx,以及可以根据被监测网页页面的纵向宽度与第二次等分长度的比值获取第一次等分次数,该第二次等分次数记为Ky。
步骤2,获取X坐标最小值和X坐标最大值以及Y坐标最小值和Y坐标最大值。在本发明实施例中,具体地,可以根据坐标原点的位置和被监测网页页面的横向宽度确定X坐标最小值和X坐标最大值,并且该X坐标最小值记为Xmin,该X坐标最大值记为Xmax。同理,可以根据坐标原点的位置和被监测网页页面的纵向宽度确定Y坐标最小值和Y坐标最大值,并且该Y坐标最小值记为Ymin,该Y坐标最大值记为Ymax。
步骤3,确定目标区域坐标,该目标区域坐标记为(X,Y),其中,目标区域坐标通过第一次等分次数和所述第二次等分次数、X坐标最小值和X坐标最大值以及Y坐标最小值和Y坐标最大值计算得到,并且目标区域坐标的计算公式为:X=Xmin+i*(Xmax-Xmin)/(Kx-1),Y=Ymin+i*(Ymax-Ymin)/(Ky-1),其中,i∈(0,Kx-1)且i∈整数。
步骤4,获取目标区域内的像素点坐标集合。在本发明实施例中,像素点坐标集合中的像素点为被点击的像素点,并且像素点每被点击一次,与像素点相对应的坐标被记录一次。获取目标区域内的像素点坐标集合可以为获取记录的目标区域内被点击的像素点坐标的集合,该像素点坐标的集合记为R。
进一步地,在本发明实施例中,可以根据像素点坐标的集合R获取第一序列,其中,该第一序列可以为像素点的横坐标的序列,记为X=【x1,x2,……,xn】,同理,可以根据像素点坐标的集合R获取第二序列,其中,该第二序列可以为像素点的纵坐标的序列,记为Y=【y1,y2,……,yn】,需要说明的是,上述两个序列在相应位置上的元素组成一个坐标对。
步骤5,根据像素点坐标集合确定高斯核密度估计带宽。
在本发明实施例中,高斯核密度估计带宽可以包括X轴高斯核密度估计带宽和Y轴高斯核密度估计带宽,分别记为hx和hy,具体地,可以通过下列公式计算X轴高斯核密度估计带宽和Y轴高斯核密度估计带宽:
步骤6,通过目标区域坐标、像素点坐标集合和高斯核密度估计带宽确定目标区域的点击二维核密度。在本发明实施例中,具体地,可以通过下列公式计算目标区域的点击二维核密度:
f(x,y)=(∑s【φ((x-xs)/hx)φ((y-ys)/hy)】)/(nhx hy),其中,(xs,ys)表示在标准分辨率下步骤4中获取的目标区域内的像素点坐标集合中的第s个坐标。
步骤S206,同图2所示实施例的步骤S104,在此不再赘述。
通过本发明,采用获取被监测网页页面在标准分辨率下的坐标系;根据标准分辨率下的坐标系在被监测网页页面中获取目标区域;计算目标区域的点击密度;以及根据点击密度生成目标区域的点击展现方式,解决了相关技术中网页页面点击情况的展现方式不能正确反映网页页面位置的相对重要性的问题,进而达到了正确反映网页页面位置的相对重要性的效果,如图4所示。
根据本发明的实施例,提供了一种用于网页页面点击展现的数据处理装置,该用于网页页面点击展现的数据处理装置用于通过点击密度生成目标区域的点击展现方式。需要说明的是,本发明实施例的用于网页页面点击展现的数据处理装置也可以用于执行本发明实施例的用于网页页面点击展现的数据处理方法,本发明实施例所提供的用于网页页面点击展现的数据处理方法可以通过本发明实施例的用于网页页面点击展现的数据处理装置来执行。
图5是根据本发明第一实施例的用于网页页面点击展现的数据处理装置的示意图。
如图5所示,该装置包括:第一获取单元10、第二获取单元20、计算单元30和生成单元40。
第一获取单元10用于获取被监测网页页面在标准分辨率下的坐标系。需要说明的是,在本发明实施例中,标准分辨率是指显示装置的屏幕的物理像素,它要与显卡输出的逻辑点相对应。标准分辨率可以预先设定,例如,标准分辨率可以预设为800×600,其中,800×600表示在显示装置的屏幕的横向上划分了800个像素点、竖向上划分了600个像素点。分辨率是体现屏幕图像的精密度的物理量,它表示显示装置所能显示的像素点个数的多少,具体地,分辨率越高,显示装置可显示的像素点个数越多,画面就越精细,否则分辨率越低,显示装置可显示的像素点个数越少,画面就越粗糙。
在本发明实施例中,被检测网页页面可以包括多种平台下的网页页面和多种浏览器下的网页页面,例如,被检测网页页面可以为Windows和Linux平台下的网页页面,以及被检测网页页面可以为互联网浏览器(Internet Explorer,简称IE)、360浏览器和搜狗浏览器等。
第一获取单元10获取被监测网页页面在标准分辨率下的坐标系可以包括获取被监测网页页面在标准分辨率下的二维直角正交坐标系,其中,获取二维直角正交坐标系包括获取二维直角正交坐标系的要素,该要素包括二维直角正交坐标系的坐标原点、横轴及其正方向、纵轴及其正方向和单位长度。在本发明实施例中,可以根据网页页面上像素点的排列结构获取二维直角正交坐标系的坐标原点,例如,可以根据网页页面上第一行像素点的的排列结构获取二维直角正交坐标系的坐标原点:(1)如果第一行像素点居中排列,则获取的坐标原点在网页页面第一行的居中位置;(2)如果第一行像素点左对齐排列,则获取的坐标原点在网页页面第一行的最左端;(3)如果第一行像素点右对齐排列,则获取的坐标原点在网页页面第一行的最右端。获取的横轴正方向可以包括水平向左,获取的纵轴正方向可以包括竖直向上。获取的单位长度可以为数学领域的单位长度,该数学领域的单位长度可以由网页页面中坐标的精度确定。
优选地,第一获取单元10获取的单位长度也可以为计算机网页中的单位长度,即,像素单位长度,其中,像素单位长度可以为1像素(pixel,简称px),网页界面上的每个像素点对应唯一的像素坐标,这样,可以根据坐标系中像素坐标与像素点一一对应的关系,以像素坐标为依据,通过像素坐标上对应的点击量记录与该像素坐标对应的像素点的点击量。需要说明的是,在本发明实施例中,每个单位长度对应一个单位面积,每个单位面积对应一个像素点集合,单位面积决定像素点集合中像素点的个数,这样,可以根据坐标系中单位面积与像素点集合一一对应的关系,以单位面积为依据,通过单位面积上对应的点击量记录与该单位面积对应的像素点集合的点击量。
在本发明实施例中,该数据处理装置还可以包括第三获取单元和转化单元。
第三获取单元用于在获取被监测网页页面在标准分辨率下的坐标系之前,获取被监测网页页面在非标准分辨率下的坐标系。在本发明实施例中,第三获取单元可以先获取被监测网页页面的分辨率,再判断该分辨率是否是标准分辨率,如果判断出该分辨率是标准分辨率,则不做任何处理,否则如果判断出该分辨率不是标准分辨率,即该分辨率为非标准分辨率,则转化单元将获取的非标准分辨率下的坐标系转化成标准分辨率下的坐标系。
转化单元用于将非标准分辨率下的坐标系转化成标准分辨率下的坐标系。在本发明实施例中,具体地,转化单元可以通过以下方式将非标准分辨率下的坐标系转化成标准分辨率下的坐标系:
(1)获取非标准分辨率,其中,包括获取非标准分辨率在横向和纵向上的分辨率,例如,假设获取的非标准分辨率为1600×900,则相应的该非标准分辨率在横向和纵向上的分辨率分别为1600和900。
(2)获取标准分辨率,即为获取预设的标准分辨率,其中,包括获取标准分辨率在横向和纵向上的分辨率,例如,预设的标准分辨率可以为800×600,则相应的该标准分辨率在横向和纵向上的分辨率分别为800和600。
(3)计算非标准分辨率与标准分辨率的比值,其中,包括分别计算非标准分辨率与标准分辨率在横向上的第一比值和纵向上的第二比值,例如,当非标准分辨率为1600×900时,并且标准分辨率为800×600时,则计算得到第一比值为2、第二比值为1.5。
(4)将非标准分辨率下的坐标系按比例放大或者按比例缩小以转化成所述标准分辨率下的坐标系,具体地,在横向上按第一比值进行转化和在纵向上按第二比值进行转化。
第二获取单元20用于根据标准分辨率下的坐标系在被监测网页页面中获取目标区域。在本发明实施例中,目标区域可以包括整个网页页面或者整个网页页面的子区域,并且目标区域可以包括一个或者多个。目标区域的大小和形状可以根据客户端的分析需求通过划分被监测网页页面得到,例如,可以分别按照第一获取单元10获取的被监测网页页面在标准分辨率下的坐标系对被监测网页页面进行划分以得到目标区域。
计算单元30用于计算目标区域的点击密度。在本发明实施例中,计算单元30计算目标区域的点击密度可以包括计算目标区域的点击二维核密度,其中,该目标区域的点击密度为连续的物理量,这样,克服了通过计算目标区域的点击量以展现网页页面的点击分布情况时的不连续缺陷,达到了平滑展现网页页面的点击分布情况的效果,进而有利于人们正确地、直观地了解网页页面位置的相对重要性。具体地,计算单元30可以通过目标区域的点击量和目标区域的包含的总坐标数量计算目标区域的点击密度。
生成单元40用于根据点击密度生成目标区域的点击展现方式。在本发明实施例中,生成单元40根据点击密度生成目标区域的点击展现方式可以包括根据点击密度生成目标区域的二维热力图、三维热力图、等高线和矩阵阵列等。其中,在二维热力图中,点击密度可以用颜色表征,并且不同的颜色表征不同的点击密度;在等高线中,点击密度可以用等高线表征,并且不同的等高线表征不同的点击密度;在三维热力图中,点击密度可以同时用颜色和等高线表征;在矩阵阵列中,不同的元素表示网页页面上不同的目标区域上的点击密度。
通过本发明,解决了相关技术中网页页面点击情况的展现方式不能正确反映网页页面位置的相对重要性的问题,进而达到了正确反映网页页面位置的相对重要性的效果。
图6是根据本发明优选实施例的用于网页页面点击展现的数据处理装置的示意图。
如图6所示,该实施例可以作为图5所示实施例的优选实施方式,该用于网页页面点击展现的数据处理装置包括:第一获取单元10、第二获取单元20、计算单元30和生成单元40,其中,第二获取单元20包括第一划分模块201和第一划分模块202和确认模块203。
第一获取单元10和生成单元40的作用与图5所示实施例中的相同,在此不再赘述。
第一划分模块201用于将被监测网页页面划分为多个第一区域。在本发明实施例中,第一划分模块201在标准分辨率下的坐标系中将被监测网页页面沿X轴方向进行第一次等分,将被监测网页页面划分为多个第一区域,其中,沿X轴方向进行第一次等分时,相邻的两个等分点之间的距离为第一等分长度,该第一等分长度可以预先设定,例如,第一等分长度可以包括5个像素单位长度。在本发明实施例中,多个第一区域为等宽度的条形区域,并且多个第一区域均平行于Y轴。
第二划分模块202用于将多个第一区域划分为多个第二区域。在本发明实施例中,第二划分模块202在标准分辨率下的坐标系中将被监测网页页面沿Y轴方向进行第二次等分,将被监测网页页面划分为多个第二区域,其中,沿Y轴方向进行第二次等分时,相邻的两个等分点之间的距离为第二等分长度,该第二等分长度可以预先设定,并且第一等分长度和第二等分长度可以相等,也可以不相等。在本发明实施例中,多个第二区域为形状相同的矩形区域,特殊地,当第一等分长度和第二等分长度相等时,多个第二区域为形状相同的正方形区域。
确认模块203用于将第二区域作为目标区域。
计算单元30用于计算目标区域的点击密度。在本发明实施例中,具体地,计算单元30可以包括第一获取模块、第二获取模块、第二确定模块、第三获取模块、第三确定模块和第四确定模块。
第一获取模块用于根据第一次等分和第二次等分获取第一次等分次数和第二次等分次数。具体地,第一获取模块可以根据被监测网页页面的横向宽度与第一次等分长度的比值获取第一次等分次数,该第一次等分次数记为Kx,以及第一获取模块可以根据被监测网页页面的纵向宽度与第二次等分长度的比值获取第一次等分次数,该第二次等分次数记为Ky。
第二获取模块用于获取X坐标最小值和X坐标最大值以及Y坐标最小值和Y坐标最大值。在本发明实施例中,具体地,第二获取模块可以根据坐标原点的位置和被监测网页页面的横向宽度确定X坐标最小值和X坐标最大值,并且该X坐标最小值记为Xmin,该X坐标最大值记为Xmax。同理,可以根据坐标原点的位置和被监测网页页面的纵向宽度确定Y坐标最小值和Y坐标最大值,并且该Y坐标最小值记为Ymin,该Y坐标最大值记为Ymax。
第二确定模块用于确定目标区域坐标,该目标区域坐标记为(X,Y),其中,目标区域坐标通过第一次等分次数和所述第二次等分次数、X坐标最小值和X坐标最大值以及Y坐标最小值和Y坐标最大值计算得到,并且目标区域坐标的计算公式为:X=Xmin+i*(Xmax-Xmin)/(Kx-1),Y=Ymin+i*(Ymax-Ymin)/(Ky-1),其中,i∈(0,Kx-1)且i∈整数。
第三获取模块用于获取目标区域内的像素点坐标集合。在本发明实施例中,像素点坐标集合中的像素点为被点击的像素点,并且像素点每被点击一次,与像素点相对应的坐标被记录一次。获取目标区域内的像素点坐标集合可以为获取记录的目标区域内被点击的像素点坐标的集合,该像素点坐标的集合记为R。
进一步地,在本发明实施例中,第三获取模块可以根据像素点坐标的集合R获取第一序列,其中,该第一序列可以为像素点的横坐标的序列,记为X=【x1,x2,……,xn】,同理,第三获取模块可以根据像素点坐标的集合R获取第二序列,其中,该第二序列可以为像素点的纵坐标的序列,记为Y=【y1,y2,……,yn】,需要说明的是,上述两个序列在相应位置上的元素组成一个坐标对。
第三确定模块用于根据像素点坐标集合确定高斯核密度估计带宽。
在本发明实施例中,高斯核密度估计带宽可以包括X轴高斯核密度估计带宽和Y轴高斯核密度估计带宽,分别记为hx和hy,具体地,可以通过下列公式计算X轴高斯核密度估计带宽和Y轴高斯核密度估计带宽:
第四确定模块用于通过目标区域坐标、像素点坐标集合和高斯核密度估计带宽确定目标区域的点击二维核密度。在本发明实施例中,具体地,第四确定模块可以通过下列公式计算目标区域的点击二维核密度:
f(x,y)=(∑s【φ((x-xs)/hx)φ((y-ys)/hy)】)/(nhx hy),其中,(xs,ys)表示在标准分辨率下第三获取模块获取的目标区域内的像素点坐标集合中的第s个坐标。
通过本发明,解决了相关技术中网页页面点击情况的展现方式不能正确反映网页页面位置的相对重要性的问题,进而达到了正确反映网页页面位置的相对重要性的效果,如图4所示。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种用于网页页面点击展现的数据处理方法,其特征在于,包括:
获取被监测网页页面在标准分辨率下的坐标系;
根据所述标准分辨率下的坐标系在所述被监测网页页面中获取目标区域;
计算所述目标区域的点击密度;以及
根据所述点击密度生成所述目标区域的点击展现方式;
根据所述标准分辨率下的坐标系在所述被监测网页页面中获取目标区域包括:
在所述标准分辨率下的坐标系中将所述被监测网页页面沿X轴方向进行第一次等分,将所述被监测网页页面划分为多个第一区域;
在所述标准分辨率下坐标系的中将所述被监测网页页面沿Y轴方向进行第二次等分,将所述多个第一区域划分为多个第二区域;以及
将所述第二区域作为所述目标区域;
计算所述目标区域的点击密度包括:
根据所述第一次等分和所述第二次等分获取第一次等分次数和第二次等分次数;
获取X坐标最小值和X坐标最大值以及Y坐标最小值和Y坐标最大值;
确定目标区域坐标,其中,所述目标区域坐标通过所述第一次等分次数和所述第二次等分次数、所述X坐标最小值和所述X坐标最大值以及所述Y坐标最小值和所述Y坐标最大值计算得到;
获取所述目标区域内的像素点坐标集合,其中,所述像素点坐标集合中的坐标为被点击的像素点对应的坐标;
根据所述像素点坐标集合确定高斯核密度估计带宽;以及
通过所述目标区域坐标、所述像素点坐标集合和所述高斯核密度估计带宽确定所述目标区域的点击二维核密度。
2.根据权利要求1所述的数据处理方法,其特征在于,在获取被监测网页页面在标准分辨率下的坐标系之前,所述数据处理方法还包括:
获取所述被监测网页页面在非标准分辨率下的坐标系;以及
将所述非标准分辨率下的坐标系转化成所述标准分辨率下的坐标系。
3.根据权利要求2所述的数据处理方法,其特征在于,通过将所述非标准分辨率下的坐标系按比例放大或者按比例缩小以转化成所述标准分辨率下的坐标系。
4.一种用于网页页面点击展现的数据处理装置,其特征在于,包括:
第一获取单元,用于获取被监测网页页面在标准分辨率下的坐标系;
第二获取单元,用于根据所述标准分辨率下的坐标系在所述被监测网页页面中获取目标区域;
计算单元,用于计算所述目标区域的点击密度;以及
生成单元,用于根据所述点击密度生成所述目标区域的点击展现方式;
所述第二获取单元包括:
第一划分模块,用于在所述标准分辨率下的坐标系中将所述被监测网页页面沿X轴方向进行第一次等分,将所述被监测网页页面划分为多个第一区域;
第二划分模块,用于在所述标准分辨率下坐标系的中将所述被监测网页页面沿Y轴方向进行第二次等分,将所述多个第一区域划分为多个第二区域;以及
第一确定模块,用于将所述第二区域作为所述目标区域;
所述计算单元包括:
第一获取模块,用于根据所述第一次等分和所述第二次等分获取第一次等分次数和第二次等分次数;
第二获取模块,用于获取X坐标最小值和X坐标最大值以及Y坐标最小值和Y坐标最大值;
第二确定模块,用于确定目标区域坐标,其中,所述目标区域坐标通过所述第一次等分次数和所述第二次等分次数、所述X坐标最小值和所述X坐标最大值以及所述Y坐标最小值和所述Y坐标最大值计算得到;
第三获取模块,用于获取所述目标区域内的像素点坐标集合,其中,所述像素点坐标集合中的坐标为被点击的像素点对应的坐标;
第三确定模块,用于根据所述像素点坐标集合确定高斯核密度估计带宽;以及
第四确定模块,用于通过所述目标区域坐标、所述像素点坐标集合和所述高斯核密度估计带宽确定所述目标区域的点击二维核密度。
5.根据权利要求4所述的数据处理装置,其特征在于,所述数据处理装置还包括:
第三获取单元,用于在获取被监测网页页面在标准分辨率下的坐标系之前,获取所述被监测网页页面在非标准分辨率下的坐标系;以及
转化单元,用于将所述非标准分辨率下的坐标系转化成所述标准分辨率下的坐标系。
6.根据权利要求5所述的数据处理装置,其特征在于,所述转化单元还用于通过将所述非标准分辨率下的坐标系按比例放大或者按比例缩小以转化成所述标准分辨率下的坐标系。
CN201310566741.1A 2013-11-14 2013-11-14 用于网页页面点击展现的数据处理方法和装置 Active CN103605716B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310566741.1A CN103605716B (zh) 2013-11-14 2013-11-14 用于网页页面点击展现的数据处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310566741.1A CN103605716B (zh) 2013-11-14 2013-11-14 用于网页页面点击展现的数据处理方法和装置

Publications (2)

Publication Number Publication Date
CN103605716A CN103605716A (zh) 2014-02-26
CN103605716B true CN103605716B (zh) 2017-05-10

Family

ID=50123939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310566741.1A Active CN103605716B (zh) 2013-11-14 2013-11-14 用于网页页面点击展现的数据处理方法和装置

Country Status (1)

Country Link
CN (1) CN103605716B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617219A (zh) * 2013-11-21 2014-03-05 北京国双科技有限公司 获取立体热力图的方法及装置
CN104881408A (zh) * 2014-02-27 2015-09-02 腾讯科技(深圳)有限公司 页面点击次数统计及结果展示方法、装置和系统
CN105844681A (zh) * 2016-03-22 2016-08-10 北京建飞无限科技有限公司 热力图绘制方法及装置
CN107766375B (zh) 2016-08-19 2020-06-09 华为技术有限公司 一种生成热力图的方法及装置
CN108073594B (zh) * 2016-11-10 2021-12-24 北京国双科技有限公司 一种生成热力图的方法及装置
CN108984070B (zh) * 2017-05-31 2021-01-26 北京京东尚科信息技术有限公司 用于热力图成像的方法、装置、电子设备及可读介质
CN110020347A (zh) * 2017-09-13 2019-07-16 北京国双科技有限公司 一种自动判断网页区域价值的方法及装置
CN111125564B (zh) * 2018-11-01 2023-09-15 百度在线网络技术(北京)有限公司 热力图生成方法、装置、计算机设备及存储介质
CN111381910A (zh) * 2018-12-28 2020-07-07 北京国双科技有限公司 一种热力图的绘制方法及装置
CN114564549B (zh) * 2022-02-14 2024-06-21 北京世纪高通科技有限公司 区域的热力图的生成方法、装置、设备及存储介质
CN114969233B (zh) * 2022-05-25 2024-04-26 浪潮卓数大数据产业发展有限公司 一种地理区域热力图坐标优化方法及设备、介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004091127A2 (en) * 2003-03-31 2004-10-21 University Of Florida Blind equalizers using probability density matching and parzen windowing
CN101504671A (zh) * 2009-03-05 2009-08-12 阿里巴巴集团控股有限公司 用户访问网页行为的可视化处理方法、装置及系统
CN101777080A (zh) * 2010-03-19 2010-07-14 北京国双科技有限公司 基于用户点击数据的网页分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004091127A2 (en) * 2003-03-31 2004-10-21 University Of Florida Blind equalizers using probability density matching and parzen windowing
CN101504671A (zh) * 2009-03-05 2009-08-12 阿里巴巴集团控股有限公司 用户访问网页行为的可视化处理方法、装置及系统
CN101777080A (zh) * 2010-03-19 2010-07-14 北京国双科技有限公司 基于用户点击数据的网页分析方法

Also Published As

Publication number Publication date
CN103605716A (zh) 2014-02-26

Similar Documents

Publication Publication Date Title
CN103605716B (zh) 用于网页页面点击展现的数据处理方法和装置
US7161606B2 (en) Systems and methods for directly generating a view using a layered approach
CN102289808B (zh) 一种图像融合质量评估方法和系统
CN102999926B (zh) 一种基于底层特征融合的图像视觉显著性计算方法
CN108074237B (zh) 图像清晰度检测方法、装置、存储介质及电子设备
EP2081149A1 (en) Weighted average image blending based on relative pixel position
Yoon et al. Fast correlation-based stereo matching with the reduction of systematic errors
WO2004036503A1 (en) Method and system for producing a pseudo three-dimensional display utilizing a two-dimensional display device
CN104680140A (zh) 基于图像的人群聚集状态检测方法
CN102930519A (zh) 基于非局部均值的sar图像变化检测差异图生成方法
CN105261031A (zh) 基于梯度计算的直线检测方法及装置
CN111489383B (zh) 基于深度边缘点与彩色图像的深度图像上采样方法及系统
CN103226824A (zh) 维持视觉显著性的视频重定向系统
US10062088B2 (en) Information distribution apparatus, information distribution method, and storage medium
CN101958006B (zh) 一种基于x光影像的物体三维成像方法
CN105474267A (zh) 硬件字形缓存
CN101593457B (zh) 基于区域划分的屏幕饱和度实现方法及装置
US9811841B2 (en) Correction device, correction method, and storage medium
JP7156527B2 (ja) 路面検査装置、路面検査方法、およびプログラム
EP3304529B1 (en) Geographically smoothed demographic cartograms and cartogram server
CN109978859B (zh) 一种基于可见失真池化的图像显示适应质量评估方法
CN113658288B (zh) 一种多边形数据矢量切片生成及显示的方法
CN110738719A (zh) 一种基于视距分层优化的Web3D模型渲染方法
CN106780452B (zh) 一种结合小波和角点特征的全参考屏幕图像质量评估方法
CN108629786A (zh) 图像边缘检测方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Data processing method and device used for webpage click display

Effective date of registration: 20190531

Granted publication date: 20170510

Pledgee: Shenzhen Black Horse World Investment Consulting Co.,Ltd.

Pledgor: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Registration number: 2019990000503

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

PP01 Preservation of patent right

Effective date of registration: 20240604

Granted publication date: 20170510