发明内容
本发明的主要目的在于提供一种数据处理方法及装置和访问频次信息处理方法及装置,以解决现有技术中无法准确地得到用户访问网站的间隔时间的问题。
为了实现上述目的,根据本发明实施例的一个方面,提供了一种数据处理方法。根据本发明的数据处理方法包括:在检测到用户访问行为的情况下,获取所述用户访问行为对应的用户信息,并记录所述用户访问行为的访问时间;基于所述用户信息查询所述用户访问行为的上一次访问行为;判断所述用户访问行为与所述上一次访问行为是否在同一个会话中;如果判断出所述用户访问行为与所述上一次访问行为不在同一个会话中,则从所述上一次访问行为的记录中查询所述上一次访问行为的访问时间;以及计算所述用户访问行为的访问时间与所述上一次访问行为的访问时间的间隔时间。
进一步地,在判断所述用户访问行为与所述上一次访问行为是否在同一个会话中之后,所述数据处理方法还包括:如果判断出所述用户访问行为与所述上一次访问行为在同一个会话中,则将所述用户的访问时间更新为所述用户访问行为的访问时间。
进一步地,在获取所述用户访问行为对应的用户信息之后,所述数据处理方法还包括:将所述用户信息与预先存储的用户信息进行匹配;如果所述用户信息未匹配到所述预先存储的用户信息,则存储所述用户信息;以及如果所述用户信息匹配到所述预先存储的用户信息,则基于所述用户信息查询所述用户访问行为的上一次访问行为。
进一步地,将所述用户信息与预先存储的用户信息进行匹配包括:从所述用户信息中提取所述用户的Cookie信息;通过将所述用户的Cookie信息与预先存储的Cookie 信息进行匹配来将所述用户信息与预先存储的用户信息进行匹配,其中,如果所述用户的Cookie信息未匹配到所述预先存储的Cookie信息,则确定所述用户信息未匹配到所述预先存储的用户信息;如果所述用户的Cookie信息匹配到所述预先存储的 Cookie信息,则确定所述用户信息匹配到所述预先存储的用户信息。
为了实现上述目的,根据本发明实施例的一个方面,提供了一种访问频次信息处理方法。根据本发明的访问频次信息处理方法包括:利用上述的数据处理方法计算用户连续两次访问行为的间隔时间,得到计算结果;以及通过按照预先划分的时间间隔对所述计算结果进行分类来对用户的访问行为进行划分,得到对应于所述预先划分的时间间隔的访问量。
为了实现上述目的,根据本发明实施例的另一方面,提供了一种数据处理装置。根据本发明的数据处理装置包括:获取单元,用于在检测到用户访问行为的情况下,获取所述用户访问行为对应的用户信息,并记录所述用户访问行为的访问时间;第一查询单元,用于基于所述用户信息查询所述用户访问行为的上一次访问行为;判断单元,用于判断所述用户访问行为与所述上一次访问行为是否在同一个会话中;第二查询单元,用于如果判断出所述用户访问行为与所述上一次访问行为不在同一个会话中,则从所述上一次访问行为的记录中查询所述上一次访问行为的访问时间;以及计算单元,用于计算所述用户访问行为的访问时间与所述上一次访问行为的访问时间的间隔时间。
进一步地,所述数据处理装置还包括:更新单元,用于在判断所述用户访问行为与所述上一次访问行为是否在同一个会话中之后,如果判断出所述用户访问行为与所述上一次访问行为在同一个会话中,则将所述用户的访问时间更新为所述用户访问行为的访问时间。
进一步地,所述数据处理装置还包括:匹配单元,用于在获取所述用户访问行为对应的用户信息之后,将所述用户信息与预先存储的用户信息进行匹配;存储单元,用于如果所述用户信息未匹配到所述预先存储的用户信息,则存储所述用户信息;以及所述第二查询单元还用于如果所述用户信息匹配到所述预先存储的用户信息,则基于所述用户信息查询所述用户访问行为的上一次访问行为。
进一步地,所述匹配单元包括:提取模块,用于从所述用户信息中提取所述用户的Cookie信息;匹配模块,用于通过将所述用户的Cookie信息与预先存储的Cookie 信息进行匹配来将所述用户信息与预先存储的用户信息进行匹配,其中,如果所述用户的Cookie信息未匹配到所述预先存储的Cookie信息,则确定所述用户信息未匹配到所述预先存储的用户信息;如果所述用户的Cookie信息匹配到所述预先存储的 Cookie信息,则确定所述用户信息匹配到所述预先存储的用户信息。
为了实现上述目的,根据本发明实施例的另一方面,提供了一种访问频次信息处理装置。根据本发明的访问频次信息处理装置包括:上述的数据处理装置,用于计算用户连续两次访问行为的间隔时间,得到计算结果;以及划分单元,用于通过按照预先划分的时间间隔对所述计算结果进行分类来对用户的访问行为进行划分,得到对应于所述预先划分的时间间隔的访问量。
根据本发明实施例,通过获取用户访问行为对应的用户信息,并记录用户访问行为的访问时间,基于用户信息查询用户访问行为的上一次访问行为,如果未查询到该用户的历史访问行为,则认为该用户访问行为是新的访问行为,否则,继续判断用户访问行为与上一次访问行为是否在同一个会话中,如果判断出用户访问行为与上一次访问行为不在同一个会话中,则从上一次访问行为的记录中查询上一次访问行为的访问时间,计算用户访问行为的访问时间与上一次访问行为的访问时间的间隔时间,将属于同一个会话的用户访问行为作为一次访问,避免由于同一会话中产生的多次访问行为影响计算用户访问间隔时间的准确性,解决了无法准确地得到用户访问网站的间隔时间的问题,达到了提高用户访问网站的间隔时间计算的准确性的效果。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种数据处理方法。该数据处理方法可以通过网站服务器来实现。当然,数据处理方法也可以是通过外接到网站服务器的检测设备来实现。
图1是根据本发明实施例的数据处理方法的流程图。如图1所示,该数据处理方法包括步骤如下:
步骤S102,在检测到用户访问行为的情况下,获取用户访问行为对应的用户信息,并记录用户访问行为的访问时间。
用户访问行为可以是指当前用户浏览网站的行为,用户在访问或者浏览网站时,用户所使用的终端设备与网站的服务器建立连接以进行数据通讯,这样,服务器可以以此来检测用户访问行为。在检测到用户访问行为的情况下,可以获取该次访问的用户信息,并记录该次访问的时间。具体地,当用户产生访问行为时,通过JS脚本发送用户信息,从而获取到用户信息,并同时记录本次访问的具体时间点。
步骤S104,基于用户信息查询用户访问行为的上一次访问行为。
用户每次访问网站时,记录该次访问的相关信息,例如用户信息、访问时间、访问时长、访问内容等等。在检测到用户访问行为时,可以以用户信息作为索引,从历史记录的访问行为里,查询该用户上一次访问行为的信息。
步骤S106,判断用户访问行为与上一次访问行为是否在同一个会话中。
步骤S108,如果判断出用户访问行为与上一次访问行为不在同一个会话中,则从上一次访问行为的记录中查询上一次访问行为的访问时间。
由于在同一个会话中,用户可以产生多次访问行为,该会话具有一定的生命周期,该生命周期可以根据需要进行设置,例如30分钟。将与上一次访问行为不属于同一个会话的访问行为作为新的访问行为,将属于同一会话中的访问行为不作为新的访问行为,从而避免同一会话中产生的多次访问行为影响计算用户访问间隔时间的准确性。
优选地,在判断用户访问行为与上一次访问行为是否在同一个会话中之后,数据处理方法还包括:如果判断出用户访问行为与上一次访问行为在同一个会话中,则将用户的访问时间更新为用户访问行为的访问时间。
具体地,在判断出两次访问行为属于同一会话时,则将这两次访问行为作为一次访问,并将后一次访问的时间作为该一次访问的访问时间。也即是,本发明实施例中,以会话为基础计算用户访问网站的间隔时间,从而提高间隔时间的计算的准确性。
步骤S110,计算用户访问行为的访问时间与上一次访问行为的访问时间的间隔时间。
在判断出用户访问行为与该用户上一次访问行为不在同一会话中的情况下,从历史记录的信息中查询上一次访问行为的访问时间,与记录的本次用户访问行为的访问时间一起,计算得到这两次访问的间隔时间。
根据本发明实施例,通过获取用户访问行为对应的用户信息,并记录用户访问行为的访问时间,基于用户信息查询用户访问行为的上一次访问行为,如果未查询到该用户的历史访问行为,则认为该用户访问行为是新的访问行为,否则,继续判断用户访问行为与上一次访问行为是否在同一个会话中,如果判断出用户访问行为与上一次访问行为不在同一个会话中,则从上一次访问行为的记录中查询上一次访问行为的访问时间,计算用户访问行为的访问时间与上一次访问行为的访问时间的间隔时间,将属于同一个会话的用户访问行为作为一次访问,避免由于同一会话中产生的多次访问行为影响计算用户访问间隔时间的准确性,解决了无法准确地得到用户访问网站的间隔时间的问题,达到了提高用户访问网站的间隔时间计算的准确性的效果。
优选地,在获取用户访问行为对应的用户信息之后,数据处理方法还包括:将用户信息与预先存储的用户信息进行匹配;如果用户信息未匹配到预先存储的用户信息,则存储用户信息;如果用户信息匹配到预先存储的用户信息,则基于用户信息查询用户访问行为的上一次访问行为。
在获取到用户信息之后,可以将该用户信息与预先存储的用户信息进行匹配来判断访问的用户是新用户还是老用户,其中,预先存储的用户信息为每次用户访问时,记录到库里的用户信息,如果匹配到预先存储的用户信息,则表明该用户已经访问过网站,即该用户为老用户,在这种情况下,则可以计算该次访问与上一次访问的间隔时间。反之,如果未匹配到,则该用户为新用户,则存储该用户信息,以便于该用户下次访问时,计算其访问的间隔时间。
进一步地,将用户信息与预先存储的用户信息进行匹配包括:从用户信息中提取用户的Cookie信息;通过将用户的Cookie信息与预先存储的Cookie信息进行匹配来将用户信息与预先存储的用户信息进行匹配,其中,如果用户的Cookie信息未匹配到预先存储的Cookie信息,则确定用户信息未匹配到预先存储的用户信息;如果用户的 Cookie信息匹配到预先存储的Cookie信息,则确定用户信息匹配到预先存储的用户信息。
具体地,用户的Cookie信息可以是第一方Cookie信息,将提取到的Cookie信息与库中已有的Cookie信息进行匹配,以确定是否为新用户。如果匹配到,则为老用户,反之,则为新用户。
根据本发明实施例,通过利用Cookie信息来对新老用户进行识别,提高了新老用户识别的准确性。
本发明实施例还提供了一种访问频次信息处理方法。该方法可以采用本发明实施例所提供的上述数据处理方法。
图2是根据本发明实施例的访问频次信息处理方法的流程图。如图2所示,该访问频次信息处理方法包括:
步骤S202,利用数据处理方法计算用户连续两次访问行为的间隔时间,得到计算结果。
步骤S204,通过按照预先划分的时间间隔对计算结果进行分类来对用户的访问行为进行划分,得到对应于预先划分的时间间隔的访问量。
具体地,可以利用上述数据处理方法计算预设时间段内访问网站的用户该次访问与上一次访问网站的间隔时间,得到计算结果,该结果中包括该预设时间段内访问网站的用户的间隔时间,如果用户为新用户时,则无需计算间隔时间,将预设时间段内的新用户作为一类,老用户则按照时间间隔来划分。
例如,用户访问的时间间隔划分为“1天之内”、“跨1天”、“跨2天”、“跨3天”、“跨4到6天”、“超过6天”等几类,假如预设时间段为当前一个月,则计算该一个月内用户连续两次访问的时间间隔,然后按照上述划分的时间间隔来对计算结果进行分类,统计每个类别中的用户访问量如表1所示:
表1
时间间隔 |
访问量 |
百分比 |
1天之内 |
507,108 |
6.63% |
跨1天 |
144,578 |
1.89% |
跨2天 |
93,032 |
1.22% |
跨3天 |
64,765 |
0.85% |
跨4到6天 |
140,852 |
1.84% |
超过6天 |
761,385 |
9.95% |
首次访问 |
5,937,145 |
77.62% |
下面结合图3对本发明实施例的访问频次信息处理方法进行描述,该方法包括:
步骤S302,在检测到用户访问行为的情况下,获取用户信息。
步骤S304,记录访问的时间点。
步骤S306,从用户信息中提取Cookie信息。
步骤S308,判断该Cookie信息是否为新的Cookie信息。如果是,则执行步骤S310,反之,则执行步骤S312。
步骤S310,判定为“首次访问”。
步骤S312,判断本次访问与上次访问是否在同一个会话中。如果是,则返回执行步骤S304;反之,则执行步骤S314。
步骤S314,计算本次访问与上次访问的时间间隔,并根据计算结果对本次访问进行归类。
步骤S316,计算预设时间段内各类访问行为的频次。
具体地,当用户产生访问行为时,通过JS脚本发送用户信息,由此获取访客的第一方Cookie信息,并同时记录本次访问的具体时间点。
将获取到的Cookie信息与库中已有的Cookie信息进行比对,以确定是否为新访问者;若为新访问者,则“是否新访问者”字段值为1,若为老访问者,则“是否新访问者”字段值为0,通过识别“是否新访问者”的字段值即可确定访问者是否为新老访问者。
判定本次访问与上次访问是否在同一个会话中,若为同一个会话,则本次访问不算作新访问,不进行后续计算,只更新时间点;若为不同会话,则将此次访问频次信息记录在数据库中并作相应的计算,将新获取到的老访客访问时间点与之前存储的时间点进行比对,计算老访问者本次访问的时间间隔,在此间隔归属的字段“+1”。
根据上述得到的数据库中的频次信息,结合选定的时间段,对此段时间内的各个时间间隔的频数进行累计求和,并计算百分比。最后可以将上述频数信息以条形图的形式进行展现,并在图旁附上相应的频数、频率指标值。从而更加直观地对计算结果进行展示。
本发明实施例还提供了一种数据处理装置。该装置可以通过网站服务器实现其功能。需要说明的是,本发明实施例的数据处理装置可以用于执行本发明实施例所提供的数据处理方法,本发明实施例的数据处理方法也可以通过本发明实施例所提供的数据处理装置来执行。
图4是根据本发明实施例的数据处理装置的示意图。如图4所示,该数据处理装置包括:获取单元10、第一查询单元20、判断单元30、第二查询单元40和计算单元 50。
获取单元10用于在检测到用户访问行为的情况下,获取用户访问行为对应的用户信息,并记录用户访问行为的访问时间。
用户访问行为可以是指当前用户浏览网站的行为,用户在访问或者浏览网站时,用户所使用的终端设备与网站的服务器建立连接以进行数据通讯,这样,服务器可以以此来检测用户访问行为。在检测到用户访问行为的情况下,可以获取该次访问的用户信息,并记录该次访问的时间。具体地,当用户产生访问行为时,通过JS脚本发送用户信息,从而获取到用户信息,并同时记录本次访问的具体时间点。
第一查询单元20用于基于用户信息查询用户访问行为的上一次访问行为。
用户每次访问网站时,记录该次访问的相关信息,例如用户信息、访问时间、访问时长、访问内容等等。在检测到用户访问行为时,可以以用户信息作为索引,从历史记录的访问行为里,查询该用户上一次访问行为的信息。
判断单元30用于判断用户访问行为与上一次访问行为是否在同一个会话中。
第二查询单元40用于如果判断出用户访问行为与上一次访问行为不在同一个会话中,则从上一次访问行为的记录中查询上一次访问行为的访问时间。
由于在同一个会话中,用户可以产生多次访问行为,该会话具有一定的生命周期,该生命周期可以根据需要进行设置,例如30分钟。将与上一次访问行为不属于同一个会话的访问行为作为新的访问行为,将属于同一会话中的访问行为作不作为新的访问行为,从而避免同一会话中产生的多次访问行为影响计算用户访问间隔时间的准确性。
优选地,数据处理装置还包括:更新单元,用于在判断用户访问行为与上一次访问行为是否在同一个会话中之后,如果判断出用户访问行为与上一次访问行为在同一个会话中,则将用户的访问时间更新为用户访问行为的访问时间。
具体地,在判断出两次访问行为属于同一会话时,则将这两次访问行为作为一次访问,并将后一次访问的时间作为该一次访问的访问时间。也即是,本发明实施例中,以会话为基础计算用户访问网站的间隔时间,从而提高间隔时间的计算的准确性。
计算单元50用于计算用户访问行为的访问时间与上一次访问行为的访问时间的间隔时间。
在判断出用户访问行为与该用户上一次反问行为不在同一会话中的情况下,从历史记录的信息中查询上一次访问行为的访问时间,与记录的本次用户访问行为的访问时间一起,计算得到这两次访问的间隔时间。
根据本发明实施例,通过获取用户访问行为对应的用户信息,并记录用户访问行为的访问时间,基于用户信息查询用户访问行为的上一次访问行为,如果未查询到该用户的历史访问行为,则认为该用户访问行为是新的访问行为,否则,继续判断用户访问行为与上一次访问行为是否在同一个会话中,如果判断出用户访问行为与上一次访问行为不在同一个会话中,则从上一次访问行为的记录中查询上一次访问行为的访问时间,计算用户访问行为的访问时间与上一次访问行为的访问时间的间隔时间,将属于同一个会话的用户访问行为作为一次访问,避免由于同一会话中产生的多次访问行为影响计算用户访问间隔时间的准确性,解决了无法准确地得到用户访问网站的间隔时间的问题,达到了提高用户访问网站的间隔时间计算的准确性的效果。
优选地,数据处理装置还包括:匹配单元,用于在获取用户访问行为对应的用户信息之后,将用户信息与预先存储的用户信息进行匹配;存储单元,用于如果用户信息未匹配到预先存储的用户信息,则存储用户信息;以及第二查询单元还用于如果用户信息匹配到预先存储的用户信息,则基于用户信息查询用户访问行为的上一次访问行为。
在获取到用户信息之后,可以将该用户信息与预先存储的用户信息进行匹配来判断访问的用户是新用户还是老用户,其中,预先存储的用户信息为每次用户访问时,记录到库里的用户信息,如果匹配到预先存储的用户信息,则表明该用户已经访问过网站,即该用户为老用户,在这种情况下,则可以计算该次访问与上一次访问的间隔时间。反之,如果未匹配到,则该用户为新用户,则存储该用户信息,以便于该用户下次访问时,计算其访问的间隔时间。
进一步地,匹配单元包括:提取模块,用于从用户信息中提取用户的Cookie信息;匹配模块,用于通过将用户的Cookie信息与预先存储的Cookie信息进行匹配来将用户信息与预先存储的用户信息进行匹配,其中,如果用户的Cookie信息未匹配到预先存储的Cookie信息,则确定用户信息未匹配到预先存储的用户信息;如果用户的 Cookie信息匹配到预先存储的Cookie信息,则确定用户信息匹配到预先存储的用户信息。
具体地,用户的Cookie信息可以是第一方Cookie信息,将提取到的Cookie信息与库中已有的Cookie信息进行匹配,以确定是否为新用户。如果匹配到,则为老用户,反之,则为新用户。
根据本发明实施例,通过利用Cookie信息来对新老用户进行识别,提高了新老用户识别的准确性。
本发明实施例还提供了一种访问频次信息处理装置。该装置可以通过网站服务器实现其功能。需要说明的是,本发明实施例的访问频次信息处理装置可以用于执行本发明实施例所提供的访问频次信息处理方法,本发明实施例的访问频次信息处理方法也可以通过本发明实施例所提供的访问频次信息处理装置来执行。
图5是根据本发明实施例的访问频次信息处理装置的示意图。该访问频次信息处理装置包括:本发明上述实施例提供的数据处理装置501和划分单元502 。
数据处理装置501用于计算用户连续两次访问行为的间隔时间,得到计算结果。划分单元502用于通过按照预先划分的时间间隔对计算结果进行分类来对用户的访问行为进行划分,得到对应于预先划分的时间间隔的访问量。
具体地,可以利用上述数据处理方法计算预设时间段内访问网站的用户该次访问与上一次访问网站的间隔时间,得到计算结果,该结果中包括该预设时间段内访问网站的用户的间隔时间,如果用户为新用户时,则无需计算间隔时间,将预设时间段内的新用户作为一类,老用户则按照时间间隔来划分。
例如,用户访问的时间间隔划分为“1天之内”、“跨1天”、“跨2天”、“跨3天”、“跨4到6天”、“超过6天”等几类,假如预设时间段为当前一个月,则计算该一个月内用户连续两次访问的时间间隔,然后按照上述划分的时间间隔来对计算结果进行分类,统计每个类别中的用户访问量如表1所示。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、移动终端、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。