具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明的实施例,提供了一种用于网页页面点击分布的数据处理方法,该用于网页页面点击分布的数据处理方法用于计算目标区域内的点击均衡度以定量分析点击分布状态。需要说明的是,该用于网页页面点击分布的数据处理方法可以运行在计算机处理设备上。
需要说明的是,目标区域内的点击均衡度是指目标区域内发生的点击目标区域内的分布均匀程度,其值由目标区域内的实际点击分布与完全平均分布的差异决定。
图1是根据本发明实施例的用于网页页面点击分布的数据处理方法流程图。
如图1所示,该方法包括如下的步骤S101至步骤S104:
步骤S101,获取被监测网页页面的坐标系。
在本发明实施例中,被检测网页页面可以包括多种平台下的网页页面和多种浏览器下的网页页面,例如,被检测网页页面可以为Windows和Linux平台下的网页页面,以及被检测网页页面可以为互联网浏览器(Internet Explorer,简称IE)、360浏览器和搜狗浏览器等。
获取被监测网页页面的坐标系可以包括获取被监测网页页面的二维直角正交坐标系,其中,获取二维直角正交坐标系包括获取二维直角正交坐标系的要素,该要素包括二维直角正交坐标系的坐标原点、横轴及其正方向、纵轴及其正方向和单位长度。在本发明实施例中,可以根据网页页面上像素点的排列结构获取二维直角正交坐标系的坐标原点,例如,可以根据网页页面上第一行像素点的的排列结构获取二维直角正交坐标系的坐标原点:(1)如果第一行像素点居中排列,则获取的坐标原点在网页页面第一行的居中位置;(2)如果第一行像素点左对齐排列,则获取的坐标原点在网页页面第一行的最左端;(3)如果第一行像素点右对齐排列,则获取的坐标原点在网页页面第一行的最右端。获取的横轴正方向可以包括水平向左,获取的纵轴正方向可以包括竖直向上。获取的单位长度可以为数学领域的单位长度,该数学领域的单位长度可以由网页页面中坐标的精度确定。
优选地,获取的单位长度也可以为计算机网页中的单位长度,即,像素单位长度,其中,像素单位长度可以为1像素(pixel,简称px),网页界面上的每个像素点对应唯一的像素坐标,这样,可以根据坐标系中像素坐标与像素点一一对应的关系,以像素坐标为依据,通过像素坐标上对应的点击量记录与该像素坐标对应的像素点的点击量。需要说明的是,在本发明实施例中,每个单位长度对应一个单位面积,每个单位面积对应一个像素点集合,单位面积决定像素点集合中像素点的个数,这样,可以根据坐标系中单位面积与像素点集合一一对应的关系,以单位面积为依据,通过单位面积上对应的点击量记录与该单位面积对应的像素点集合的点击量。
步骤S102,通过坐标系确定目标区域。
在本发明实施例中,目标区域可以为整个被监测的网页页面,或者可以为分割被监测的网页页面得到的被监测的网页页面子区域,其中,分割被监测的网页页面可以按照预定规则,该预定规则可以根据客户端的具体需求确定,例如,可以按照预定规则并根据步骤S101中获取的坐标系,通过以下方式分割被监测的网页页面:(1)沿横轴正方向每隔预定区域划分一个目标区域,(2)沿纵轴正方向每隔预定区域划分一个目标区域,(3)同时沿横轴正方向和沿纵轴正方向每隔预定区域划分目标区域。通过坐标系确定目标区域可以为通过坐标系确定一个或者多个目标区域。另外,在本发明实施例中,目标区域的形状可以为任意的,包括规则和不规则形状,例如,目标区域可以为圆形、矩形和菱形等区域。目标区域的大小也可以为任意的,其中,最大不超出整个被监测网页页面。
步骤S103,通过坐标系记录确定的目标区域的点击量。
需要说明的是,通过坐标系记录确定的目标区域的点击量可以是在预设时间段记录确定的目标区域的点击量,该预设时间段的设定需要根据客户端的分析需求确定,例如,该预设时间段可以是一天中的零点至24点,这样可以记录确定的目标区域在一天内的点击量。需要说明的是,在本发明实施例中,目标区域的点击量可以是以单位面积为单位记录的确定的目标区域的点击量,也可以是以像素坐标为单位记录确定的目标区域的点击量。优选地,目标区域的点击量可以是以像素坐标为单位记录的确定的目标区域的点击量,这样,记录的目标区域的点击量精确度最高、最准确。
具体地,通过坐标系记录确定的目标区域的点击量可以是通过坐标系记录每个像素坐标对应的像素点的点击量,其中,每个像素坐标对应一个记录模块,每个记录模块的初始值设置为0,当用户浏览网页页面并点击该网页页面内的像素点时,与该像素点坐标对应的记录模块就会增加1,这样,在预设时间段内,记录模块会记录网页页面上各个点的点击量。另外,通过坐标系记录确定的目标区域的点击量可以是先通过坐标系记录每个像素坐标对应的像素点的所有点击记录,再将所有点击记录进行累加得到像素点的点击量。
需要说明的是,目标区域的点击量记录结果可以按照像素坐标与像素点的点击量的对应关系进行存储。
步骤S104,根据记录的点击量计算目标区域内的点击均衡度。
在本发明实施例中,可以通过步骤S103记录的确定的目标区域的点击量的变换形式以及目标区域内的像素点的数量等计算目标区域内的点击均衡度。例如,可以首先将各个像素点对应的点击量进行排列组合以得到相应的数列,然后根据上述数列的项数生成相应的数列,再次根据上述数列的项数生成相应的单位数列,最后根据上述数列计算目标区域内的点击均衡度,需要说明的是,也可以先将上述数列转换成相应的行向量或者列向量,再根据向量和矩阵的运算规则计算目标区域内的点击均衡度。
需要说明的是,在本发明实施例中,点击均衡度用于表示网页页面点击分布的均衡程度的定量指标,其值在0至1之间,其中,当网页页面目标区域内所有点击量都集中在一个位置时,则网页页面点击分布极不均衡,此时点击均衡度为0,当网页页面目标区域内所有位置的点击量都相同时,则网页页面点击分布极均衡,此时点击均衡度为1,即,当点击均衡度越小时,网页页面点击分布越不均衡,当点击均衡度越大时,网页页面点击分布越均衡。
通过本发明,采用获取被监测网页页面的坐标系;通过坐标系确定目标区域,其中,目标区域包括整个被监测的网页页面和分割被监测的网页页面得到的被监测的网页页面子区域;通过坐标系记录确定的目标区域的点击量;以及根据记录的点击计算目标区域内的点击均衡度,解决了相关技术中无法对点击分布状态进行定量分析的问题,进而达到了通过目标区域内的点击均衡度对点击分布状态进行定量分析的效果。
图2是根据本发明优选实施例的用于网页页面点击分布的数据处理方法流程图。
如图2所示,该用于网页页面点击分布的数据处理方法包括如下的步骤S201至步骤S208,该实施例可以作为图1所示实施例的优选实施方式。
步骤S201和步骤S202,分别同图1所示实施例的步骤S101和步骤S102,在此不再赘述。
步骤S203,获取目标区域的坐标集合。
需要说明的是,在本发明实施例中,坐标集合中的元素为目标区域的内全部像素点坐标。目标区域的坐标集合中的像素点坐标可以随机排布在坐标集合中,也可以按照预定顺序排布在坐标集合中,例如,像素点可以以横坐标的大小为第一顺序、纵坐标的大小为第二顺序排布在坐标集合中。获取到的目标区域的坐标集合可以存储在数据库的像素点坐标列表中。需要说明的是,当目标区域为整个被监测网页页面时,目标区域的坐标集合为整个被监测网页页面上的全部像素点坐标,当目标区域为被监测网页页面的子区域时,目标区域的坐标集合为整个被监测网页页面子区域上的全部像素点坐标。
例如,目标区域的坐标集合可以为{(1,2),(1,3),(2,2),(2,3)}。
步骤S204,获取被监测网页页面的点击量集合。
在本发明实施例中,可以先获取被监测网页页面上的全部像素点坐标,在根据该被监测网页页面上的全部像素点坐标获取被监测网页页面的点击量集合。
具体地,被监测网页页面上的每一个像素点坐标可以对应唯一的记录模块,该记录模块可以用于记录相应的像素点坐标对应的像素点的点击量。当像素点坐标对应的像素点被用户点击时,与该像素点坐标相对应的记录模块的计数增加1,否则,当像素点坐标对应的像素点不被用户点击时,与该像素点坐标相对应的记录模块不进行计数,这样,只对被点击的像素点记录点击量,不仅节省了服务器的存储的空间,而且有利于更客观地展示点击分布的状态。
在本发明生实施例中,获取的被监测网页页面的点击量集合中的元素可以表示为【(X,Y),HITS】的形式,其中,(X,Y)表示被监测网页页面上的像素点的坐标,HITS表示与像素点的坐标相对应的像素点的点击量,在本发明实施例中,由于只对点击的像素点记录点击量,因此,点击量集合中的元素的个数小于或者等于步骤S203中的集合的元素的个数,并且该HITS为大于零的整数。
在本发明实施例中,还可以通过哈希表获取像素点的点击量。具体地,哈希表中的哈希关键字可以为像素点坐标,哈希值可以为像素点的点击量,当某个像素点被点击时,先判断该像素点对应的像素点坐标是否存在哈希表中,如果判断出该像素点坐标存在哈希表中,则将该像素点坐标对应的哈希值增加1,否则,如果判断出该像素点坐标不存在哈希表中,则将该像素点坐标添加到哈希表中,并且将该像素点坐标对应的哈希值记录为1。
例如,被监测网页页面的点击量集合可以为{【(1,1),1】,【(1,2),1】,【(1,3),2】,【(2,1),2】,【(2,2),3】,【(3,1),3】,【(3,2),4】,【(3,3),4】}。
步骤S205,判断坐标集合中的坐标与点击量集合元素中的坐标是否相同。
具体地,在本发明实施例中,可以按照预定顺序逐个将目标区域的坐标集合中的每一个坐标分别与点击量集合中的坐标进行对比,判断坐标集合中的坐标与点击量集合元素中的坐标是否相同,其中,上述预定顺序可以包括第一顺序和第二顺序,第一顺序可以是横坐标的大小顺序,第二顺序可以是纵坐标的大小顺序。在本发明实施例中,如果判断出坐标集合中的坐标与点击量集合元素中的坐标相同,则执行步骤S206A,否则,如果判断出点击集合元素中的坐标与目标区域的坐标集合中的坐标不相同,则执行步骤S206B。
步骤S206A,将与坐标集合中的坐标相对应的点击量记录为HITS。
步骤S206B,将与坐标集合中的坐标相对应的点击量记录为0。
步骤S207,根据与坐标集合中的坐标相对应的点击量得到整个目标区域的点击量。
例如,通过上述步骤,可以得到整个目标区域的点击量为{【(1,2),1】,【(1,3),2】,【(2,2),3】,【(2,3),0】}。
具体地,在本发明实施例中,可以根据步骤S206A和步骤S206B记录的目标区域的坐标集合中的像素点的点击量得到整个目标区域的点击量,其中,得到整个目标区域的点击量可以是是得到整个目标区域的像素点的点击量的组合,该组合可以是为数列形式或者向量形式或者矩阵形式。
例如,通过上述整个目标区域的点击量可以得到整个目标区域的点击量的数列为{1,2,3,0}。
需要说明的是,在本发明实施例中,可以通过步骤S203至步骤S207实现通过坐标系记录确定的目标区域的点击量的目的。
需要说明的是,在本发明实施例中,在步骤S207之后,该用于网页页面点击分布的数据处理方法还包括:根据得到的整个目标区域的点击量获取点击量的升序数列。
例如,可以根据整个目标区域的点击量的数列{1,2,3,0}得到该数列的升序数列为{0,1,2,3},记作R。
步骤S208,根据记录的点击量计算目标区域内的点击均衡度。
在本发明实施例中,可以通过以下步骤计算目标区域内的点击均衡度:
步骤1,获取升序数列的项数。
在本发明实施例中,获取的升序数列的项数可以记作K。例如,根据升序数列R{0,1,2,3}获取升序数列的项数K为4。
步骤2,根据升序序列的项数获取项数为K的降序数列。
在本发明实施例中,根据升序序列的项数获取项数为K的降序数列的首项可以为K,公差可以为1。例如,当K为4时,获取项数为4的降序数列为{4,3,2,1},记作C。
步骤3,获取项数为K的单位数列。
例如,当K为4时,获取项数为4的单位数列为{1,1,1,1},记作I。
步骤4,根据升序数列、项数为K的降序数列、项数为K的单位数列和项数值计算目标区域内的点击均衡度,其中,计算目标区域内的点击均衡度的公式可以为:
y=【2t(R)C】/【(K+1)t(R)I】
其中,R可以表示点击记录的升序数列的列向量,t(R)可以表示点击记录的升序数列的列向量R的转置向量,C可以表示项数为K的降序数列的列向量,I可以表示项数为K的单位数列的列向量,例如,当R、C、K和I分别取步骤1至步骤3中的值时,y=【2t(R)C】/【(K+1)t(R)I】=2*(0*4+1*3+2*2+3*1)/【5*(0+1+2+3)】=2/3,即,目标区域网页页面的均衡度为2/3。
通过本发明实施例,采用记录目标区域的像素点的点击量以得到目标区域的实际点击量,再通过将上述所有像素点的点击量进行求和并平均分布到目标区域内,最终通过对比目标区域的实际点击量和目标区域内点击量的平均分布的差异,达到了通过目标区域内的点击均衡度对点击分布状态进行定量分析的效果。
根据本发明的实施例,提供了一种用于网页页面点击分布的数据处理装置,该用于网页页面点击分布的数据处理装置用于计算目标区域内的点击均衡度以定量分析点击分布状态。需要说明的是,本发明实施例的用于网页页面点击分布的数据处理装置也可以用于执行本发明实施例的用于网页页面点击分布的数据处理方法,本发明实施例所提供的用于网页页面点击分布的数据处理方法可以通过本发明实施例的用于网页页面点击分布的数据处理装置来执行。
图3是根据本发明优选实施例的用于网页页面点击分布的数据处理装置示意图。
如图3所示,该装置包括:第一获取单元10、确定单元20、记录单元30和计算单元40。
第一获取单元10用于获取被监测网页页面的坐标系。在本发明实施例中,被检测网页页面可以包括多种平台下的网页页面和多种浏览器下的网页页面,例如,被检测网页页面可以为Windows和Linux平台下的网页页面,以及被检测网页页面可以为互联网浏览器(Internet Explorer,简称IE)、360浏览器和搜狗浏览器等。
第一获取单元10可以获取被监测网页页面的二维直角正交坐标系,其中,获取二维直角正交坐标系包括获取二维直角正交坐标系的要素,该要素包括二维直角正交坐标系的坐标原点、横轴及其正方向、纵轴及其正方向和单位长度。在本发明实施例中,可以根据网页页面上像素点的排列结构获取二维直角正交坐标系的坐标原点,例如,可以根据网页页面上第一行像素点的的排列结构获取二维直角正交坐标系的坐标原点:(1)如果第一行像素点居中排列,则第一获取单元10用于获取的坐标原点在网页页面第一行的居中位置;(2)如果第一行像素点左对齐排列,则第一获取单元10用于获取的坐标原点在网页页面第一行的最左端;(3)如果第一行像素点右对齐排列,则第一获取单元10用于获取的坐标原点在网页页面第一行的最右端。第一获取单元10获取的横轴正方向可以包括水平向左,获取的纵轴正方向可以包括竖直向上。第一获取单元10获取的单位长度可以为数学领域的单位长度,该数学领域的单位长度可以由网页页面中坐标的精度确定。
优选地,第一获取单元10获取的单位长度也可以为计算机网页中的单位长度,即,像素单位长度,其中,像素单位长度可以为1像素(pixel,简称px),网页界面上的每个像素点对应唯一的像素坐标,这样,可以根据坐标系中像素坐标与像素点一一对应的关系,以像素坐标为依据,通过像素坐标上对应的点击量记录与该像素坐标对应的像素点的点击量。需要说明的是,在本发明实施例中,每个单位长度对应一个单位面积,每个单位面积对应一个像素点集合,单位面积决定像素点集合中像素点的个数,这样,可以根据坐标系中单位面积与像素点集合一一对应的关系,以单位面积为依据,通过单位面积上对应的点击量记录与该单位面积对应的像素点集合的点击量。
确定单元20用于通过坐标系确定目标区域,其中,目标区域包括整个被监测的网页页面和分割被监测的网页页面得到的被监测的网页页面子区域。在本发明实施例中,目标区域可以为整个被监测的网页页面,或者可以为分割被监测的网页页面得到的被监测的网页页面子区域,其中,分割被监测的网页页面可以按照预定规则,该预定规则可以根据客户端的具体需求确定,例如,可以按照预定规则并根据第一获取单元10获取的坐标系,通过以下方式分割被监测的网页页面:(1)沿横轴正方向每隔预定区域划分一个目标区域,(2)沿纵轴正方向每隔预定区域划分一个目标区域,(3)同时沿横轴正方向和沿纵轴正方向每隔预定区域划分目标区域。确定单元20通过坐标系确定目标区域可以为通过坐标系确定一个或者多个目标区域。另外,在本发明实施例中,目标区域的形状可以为任意的,包括规则和不规则形状,例如,目标区域可以为圆形、矩形和菱形等区域。目标区域的大小也可以为任意的,其中,最大不超出整个被监测网页页面。
记录单元30用于通过坐标系记录确定的目标区域的点击量。需要说明的是,通过坐标系记录确定的目标区域的点击量可以是在预设时间段记录确定的目标区域的点击量,该预设时间段的设定需要根据客户端的分析需求确定,例如,该预设时间段可以是一天中的零点至24点,这样可以记录确定的目标区域在一天内的点击量。需要说明的是,在本发明实施例中,目标区域的点击量可以是以单位面积为单位记录的确定的目标区域的点击量,也可以是以像素坐标为单位记录确定的目标区域的点击量。优选地,目标区域的点击量可以是以像素坐标为单位记录的确定的目标区域的点击量,这样,记录的目标区域的点击量精确度最高、最准确。
具体地,通过坐标系记录确定的目标区域的点击量可以是通过坐标系记录每个像素坐标对应的像素点的点击量,其中,每个像素坐标对应一个记录模块,每个记录模块的初始值设置为0,当用户浏览网页页面并点击该网页页面内的像素点时,与该像素点坐标对应的记录模块就会增加1,这样,在预设时间段内,记录模块会记录网页页面上各个点的点击量。另外,通过坐标系记录确定的目标区域的点击量可以是先通过坐标系记录每个像素坐标对应的像素点的所有点击记录,再将所有点击记录进行累加得到像素点的点击量。
需要说明的是,目标区域的点击量记录结果可以按照像素坐标与像素点的点击量的对应关系进行存储。
计算单元40用于根据记录的点击量计算目标区域内的点击均衡度。在本发明实施例中,可以通过记录的确定的目标区域的点击量的变换形式以及目标区域内的像素点的数量等计算目标区域内的点击均衡度。例如,可以首先将各个像素点对应的点击量进行排列组合以得到相应的数列,然后根据上述数列的项数生成相应的数列,再次根据上述数列的项数生成相应的单位数列,最后根据上述数列计算目标区域内的点击均衡度,需要说明的是,也可以先将上述数列转换成相应的行向量或者列向量,再根据向量和矩阵的运算规则计算目标区域内的点击均衡度。
需要说明的是,在本发明实施例中,点击均衡度用于表示网页页面点击分布的均衡程度的定量指标,其值在0至1之间,其中,当网页页面目标区域内所有点击量都集中在一个位置时,则网页页面点击分布极不均衡,此时点击均衡度为0,当网页页面目标区域内所有位置的点击量都相同时,则网页页面点击分布极均衡,此时点击均衡度为1,即,当点击均衡度越小时,网页页面点击分布越不均衡,当点击均衡度越大时,网页页面点击分布越均衡。
通过本发明,解决了相关技术中无法对点击分布状态进行定量分析的问题,进而达到了通过目标区域内的点击均衡度对点击分布状态进行定量分析的效果。
图4是根据本发明优选实施例的用于网页页面点击分布的数据处理装置示意图。
如图4所示,该实施例可以作为图3所示实施例的优选实施方式,该实施例的用于网页页面点击分布的数据处理装置包括第一获取单元10、确定单元20、记录单元30和计算单元40,其中,记录单元30包括第一获取模块301、第二获取模块302、判断模块303、第一记录模块304、第二记录模块305和确定模块306。
第一获取单元10和确定单元20的作用与图3所示实施例中的相同,在此不再赘述。
第一获取模块301用于获取目标区域的坐标集合。需要说明的是,在本发明实施例中,坐标集合中的元素为目标区域的内全部像素点坐标。目标区域的坐标集合中的像素点坐标可以随机排布在坐标集合中,也可以按照预定顺序排布在坐标集合中,例如,像素点可以以横坐标的大小为第一顺序、纵坐标的大小为第二顺序排布在坐标集合中。获取到的目标区域的坐标集合可以存储在数据库的像素点坐标列表中。需要说明的是,当目标区域为整个被监测网页页面时,目标区域的坐标集合为整个被监测网页页面上的全部像素点坐标,当目标区域为被监测网页页面的子区域时,目标区域的坐标集合为整个被监测网页页面子区域上的全部像素点坐标。
例如,目标区域的坐标集合可以为{(1,2),(1,3),(2,2),(2,3)}。
第二获取模块302用于获取被监测网页页面的点击量集合。在本发明实施例中,可以先获取被监测网页页面上的全部像素点坐标,在根据该被监测网页页面上的全部像素点坐标获取被监测网页页面的点击量集合。
具体地,被监测网页页面上的每一个像素点坐标可以对应唯一的记录模块,该记录模块可以用于记录相应的像素点坐标对应的像素点的点击量。当像素点坐标对应的像素点被用户点击时,与该像素点坐标相对应的记录模块的计数增加1,否则,当像素点坐标对应的像素点不被用户点击时,与该像素点坐标相对应的记录模块不进行计数,这样,只对被点击的像素点记录点击量,不仅节省了服务器的存储的空间,而且有利于更客观地展示点击分布的状态。
在本发明生实施例中,获取的被监测网页页面的点击量集合中的元素可以表示为【(X,Y),HITS】的形式,其中,(X,Y)表示被监测网页页面上的像素点的坐标,HITS表示与像素点的坐标相对应的像素点的点击量,在本发明实施例中,由于只对点击的像素点记录点击量,因此,点击量集合中的元素的个数小于或者等于步骤S203中的集合的元素的个数,并且该HITS为大于零的整数。
在本发明实施例中,还可以通过哈希表获取像素点的点击量。具体地,哈希表中的哈希关键字可以为像素点坐标,哈希值可以为像素点的点击量,当某个像素点被点击时,先判断该像素点对应的像素点坐标是否存在哈希表中,如果判断出该像素点坐标存在哈希表中,则将该像素点坐标对应的哈希值增加1,否则,如果判断出该像素点坐标不存在哈希表中,则将该像素点坐标添加到哈希表中,并且将该像素点坐标对应的哈希值记录为1。
例如,被监测网页页面的点击量集合可以为{【(1,1),1】,【(1,2),1】,【(1,3),2】,【(2,1),2】,【(2,2),3】,【(3,1),3】,【(3,2),4】,【(3,3),4】}。
判断模块303用于判断坐标集合中的坐标与点击量集合元素中的坐标是否相同。具体地,在本发明实施例中,可以按照预定顺序逐个将目标区域的坐标集合中的每一个坐标分别与点击量集合中的坐标进行对比,判断坐标集合中的坐标与点击量集合元素中的坐标是否相同,其中,上述预定顺序可以包括第一顺序和第二顺序,第一顺序可以是横坐标的大小顺序,第二顺序可以是纵坐标的大小顺序。
第一记录模块304用于如果判断出坐标集合中的坐标与点击量集合元素中的坐标相同,则将与坐标集合中的坐标相对应的点击量记录为HITS。
第二记录模块305用于如果判断出点击集合元素中的坐标与目标区域的坐标集合中的坐标不相同,则将与坐标集合中的坐标相对应的点击量记录为0。
确定模块306用于根据与坐标集合中的坐标相对应的点击量确定整个目标区域的点击量。例如,通过上述步骤,可以得到整个目标区域的点击量为{【(1,2),1】,【(1,3),2】,【(2,2),3】,【(2,3),0】}。
具体地,在本发明实施例中,可以根据第一记录模块304和第二记录模块305记录的目标区域的坐标集合中的像素点的点击量得到整个目标区域的点击量,其中,得到整个目标区域的点击量可以是是得到整个目标区域的像素点的点击量的组合,该组合可以是为数列形式或者向量形式或者矩阵形式。
例如,通过上述整个目标区域的点击量可以得到整个目标区域的点击量的数列为{1,2,3,0}。
需要说明的是,在本发明实施例中,该装置还包括:第二获取单元。该第二获取单元用于在根据与坐标集合中的坐标相对应的点击量得到整个目标区域的点击量之后,根据得到的整个目标区域的点击量获取点击量的升序数列。例如,可以根据整个目标区域的点击量的数列{1,2,3,0}得到该数列的升序数列为{0,1,2,3},记作R。
需要说明的是,在本发明实施例中,计算单元40包括:第三获取模块、第四获取模块、第五获取模块和计算模块。
第三获取模块用于获取升序数列的项数。在本发明实施例中,获取的升序数列的项数可以记作K。例如,根据升序数列R{0,1,2,3}获取升序数列的项数K为4。
第四获取模块用于根据升序序列的项数获取项数为K的降序数列。在本发明实施例中,根据升序序列的项数获取项数为K的降序数列的首项可以为K,公差可以为1。例如,当K为4时,获取项数为4的降序数列为{4,3,2,1},记作C。
第五获取模块用于获取项数为K的单位数列。例如,当K为4时,获取项数为4的单位数列为{1,1,1,1},记作I。
计算模块用于根据升序数列、项数为K的降序数列、项数为K的单位数列和项数值计算目标区域内的点击均衡度,其中,计算目标区域内的点击均衡度的公式可以为:y=【2t(R)C】/【(K+1)t(R)I】,其中,R可以表示点击记录的升序数列的列向量,t(R)可以表示点击记录的升序数列的列向量R的转置向量,C可以表示项数为K的降序数列的列向量,I可以表示项数为K的单位数列的列向量,例如,当R、C、K和I分别取步骤1至步骤3中的值时,y=【2t(R)C】/【(K+1)t(R)I】=2*(0*4+1*3+2*2+3*1)/【5*(0+1+2+3)】=2/3,即,目标区域网页页面的均衡度为2/3。
通过本发明实施例,采用记录目标区域的像素点的点击量以得到目标区域的实际点击量,再通过将上述所有像素点的点击量进行求和并平均分布到目标区域内,最终通过对比目标区域的实际点击量和目标区域内点击量的平均分布的差异,达到了通过目标区域内的点击均衡度对点击分布状态进行定量分析的效果。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。