CN104484357B - 数据处理方法及装置和访问频次信息处理方法及装置 - Google Patents

数据处理方法及装置和访问频次信息处理方法及装置 Download PDF

Info

Publication number
CN104484357B
CN104484357B CN201410719753.8A CN201410719753A CN104484357B CN 104484357 B CN104484357 B CN 104484357B CN 201410719753 A CN201410719753 A CN 201410719753A CN 104484357 B CN104484357 B CN 104484357B
Authority
CN
China
Prior art keywords
user
access
information
behavior
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410719753.8A
Other languages
English (en)
Other versions
CN104484357A (zh
Inventor
钦滨杰
李梦溪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201410719753.8A priority Critical patent/CN104484357B/zh
Publication of CN104484357A publication Critical patent/CN104484357A/zh
Application granted granted Critical
Publication of CN104484357B publication Critical patent/CN104484357B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种数据处理方法及装置和访问频次信息处理方法及装置。其中,数据处理方法包括:在检测到用户访问行为的情况下,获取用户访问行为对应的用户信息,并记录用户访问行为的访问时间;基于用户信息查询用户访问行为的上一次访问行为;判断用户访问行为与上一次访问行为是否在同一个会话中;如果判断出用户访问行为与上一次访问行为不在同一个会话中,则从上一次访问行为的记录中查询上一次访问行为的访问时间;以及计算用户访问行为的访问时间与上一次访问行为的访问时间的间隔时间。通过本发明,解决了无法准确地得到用户访问网站的间隔时间的问题,达到了提高用户访问网站的间隔时间计算的准确性的效果。

Description

数据处理方法及装置和访问频次信息处理方法及装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种数据处理方法及装置和访问频次信息处理方法及装置。
背景技术
随着互联网的普及和发展,通过互联网了解信息和进行交易的人越来越多。访问量则是互联网上网站的一个非常重要的评价指标,用户访问网站的访问行为能够反映出很多信息,用户访问行为可以作为网站运营商分析的数据基础。
由于互联网的普及和发展,从互联网上得到的用户访问数据也随之日渐庞大。在研究用户访问行为时,需要根据用户的来访次数对用户进行分类和鉴别,再进而研究其各自的访问特点,其中最为基本的是对新、老用户的识别和监测。
目前,网站运营商通常只关注哪些是新用户,哪些是老用户,然后对新、老用户各自的指标特点进行监控、对比和分析。其中,老用户对网站的访问频次则反映了用户对网站使用情况,然而,现有的处理方式则无法准确地得到用户对网站的间隔时间,从而导致无法准确地计算用户对网站的访问频次。
针对现有技术中无法准确地得到用户访问网站的间隔时间的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种数据处理方法及装置和访问频次信息处理方法及装置,以解决现有技术中无法准确地得到用户访问网站的间隔时间的问题。
为了实现上述目的,根据本发明实施例的一个方面,提供了一种数据处理方法。根据本发明的数据处理方法包括:在检测到用户访问行为的情况下,获取所述用户访问行为对应的用户信息,并记录所述用户访问行为的访问时间;基于所述用户信息查询所述用户访问行为的上一次访问行为;判断所述用户访问行为与所述上一次访问行为是否在同一个会话中;如果判断出所述用户访问行为与所述上一次访问行为不在同一个会话中,则从所述上一次访问行为的记录中查询所述上一次访问行为的访问时间;以及计算所述用户访问行为的访问时间与所述上一次访问行为的访问时间的间隔时间。
进一步地,在判断所述用户访问行为与所述上一次访问行为是否在同一个会话中之后,所述数据处理方法还包括:如果判断出所述用户访问行为与所述上一次访问行为在同一个会话中,则将所述用户的访问时间更新为所述用户访问行为的访问时间。
进一步地,在获取所述用户访问行为对应的用户信息之后,所述数据处理方法还包括:将所述用户信息与预先存储的用户信息进行匹配;如果所述用户信息未匹配到所述预先存储的用户信息,则存储所述用户信息;以及如果所述用户信息匹配到所述预先存储的用户信息,则基于所述用户信息查询所述用户访问行为的上一次访问行为。
进一步地,将所述用户信息与预先存储的用户信息进行匹配包括:从所述用户信息中提取所述用户的Cookie信息;通过将所述用户的Cookie信息与预先存储的Cookie 信息进行匹配来将所述用户信息与预先存储的用户信息进行匹配,其中,如果所述用户的Cookie信息未匹配到所述预先存储的Cookie信息,则确定所述用户信息未匹配到所述预先存储的用户信息;如果所述用户的Cookie信息匹配到所述预先存储的 Cookie信息,则确定所述用户信息匹配到所述预先存储的用户信息。
为了实现上述目的,根据本发明实施例的一个方面,提供了一种访问频次信息处理方法。根据本发明的访问频次信息处理方法包括:利用上述的数据处理方法计算用户连续两次访问行为的间隔时间,得到计算结果;以及通过按照预先划分的时间间隔对所述计算结果进行分类来对用户的访问行为进行划分,得到对应于所述预先划分的时间间隔的访问量。
为了实现上述目的,根据本发明实施例的另一方面,提供了一种数据处理装置。根据本发明的数据处理装置包括:获取单元,用于在检测到用户访问行为的情况下,获取所述用户访问行为对应的用户信息,并记录所述用户访问行为的访问时间;第一查询单元,用于基于所述用户信息查询所述用户访问行为的上一次访问行为;判断单元,用于判断所述用户访问行为与所述上一次访问行为是否在同一个会话中;第二查询单元,用于如果判断出所述用户访问行为与所述上一次访问行为不在同一个会话中,则从所述上一次访问行为的记录中查询所述上一次访问行为的访问时间;以及计算单元,用于计算所述用户访问行为的访问时间与所述上一次访问行为的访问时间的间隔时间。
进一步地,所述数据处理装置还包括:更新单元,用于在判断所述用户访问行为与所述上一次访问行为是否在同一个会话中之后,如果判断出所述用户访问行为与所述上一次访问行为在同一个会话中,则将所述用户的访问时间更新为所述用户访问行为的访问时间。
进一步地,所述数据处理装置还包括:匹配单元,用于在获取所述用户访问行为对应的用户信息之后,将所述用户信息与预先存储的用户信息进行匹配;存储单元,用于如果所述用户信息未匹配到所述预先存储的用户信息,则存储所述用户信息;以及所述第二查询单元还用于如果所述用户信息匹配到所述预先存储的用户信息,则基于所述用户信息查询所述用户访问行为的上一次访问行为。
进一步地,所述匹配单元包括:提取模块,用于从所述用户信息中提取所述用户的Cookie信息;匹配模块,用于通过将所述用户的Cookie信息与预先存储的Cookie 信息进行匹配来将所述用户信息与预先存储的用户信息进行匹配,其中,如果所述用户的Cookie信息未匹配到所述预先存储的Cookie信息,则确定所述用户信息未匹配到所述预先存储的用户信息;如果所述用户的Cookie信息匹配到所述预先存储的 Cookie信息,则确定所述用户信息匹配到所述预先存储的用户信息。
为了实现上述目的,根据本发明实施例的另一方面,提供了一种访问频次信息处理装置。根据本发明的访问频次信息处理装置包括:上述的数据处理装置,用于计算用户连续两次访问行为的间隔时间,得到计算结果;以及划分单元,用于通过按照预先划分的时间间隔对所述计算结果进行分类来对用户的访问行为进行划分,得到对应于所述预先划分的时间间隔的访问量。
根据本发明实施例,通过获取用户访问行为对应的用户信息,并记录用户访问行为的访问时间,基于用户信息查询用户访问行为的上一次访问行为,如果未查询到该用户的历史访问行为,则认为该用户访问行为是新的访问行为,否则,继续判断用户访问行为与上一次访问行为是否在同一个会话中,如果判断出用户访问行为与上一次访问行为不在同一个会话中,则从上一次访问行为的记录中查询上一次访问行为的访问时间,计算用户访问行为的访问时间与上一次访问行为的访问时间的间隔时间,将属于同一个会话的用户访问行为作为一次访问,避免由于同一会话中产生的多次访问行为影响计算用户访问间隔时间的准确性,解决了无法准确地得到用户访问网站的间隔时间的问题,达到了提高用户访问网站的间隔时间计算的准确性的效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的数据处理方法的流程图;
图2是根据本发明实施例的访问频次信息处理方法的流程图;
图3是根据本发明实施例一种可选的访问频次信息处理方法的流程图;
图4是根据本发明实施例的数据处理装置的示意图;以及
图5是根据本发明实施例的访问频次信息处理装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种数据处理方法。该数据处理方法可以通过网站服务器来实现。当然,数据处理方法也可以是通过外接到网站服务器的检测设备来实现。
图1是根据本发明实施例的数据处理方法的流程图。如图1所示,该数据处理方法包括步骤如下:
步骤S102,在检测到用户访问行为的情况下,获取用户访问行为对应的用户信息,并记录用户访问行为的访问时间。
用户访问行为可以是指当前用户浏览网站的行为,用户在访问或者浏览网站时,用户所使用的终端设备与网站的服务器建立连接以进行数据通讯,这样,服务器可以以此来检测用户访问行为。在检测到用户访问行为的情况下,可以获取该次访问的用户信息,并记录该次访问的时间。具体地,当用户产生访问行为时,通过JS脚本发送用户信息,从而获取到用户信息,并同时记录本次访问的具体时间点。
步骤S104,基于用户信息查询用户访问行为的上一次访问行为。
用户每次访问网站时,记录该次访问的相关信息,例如用户信息、访问时间、访问时长、访问内容等等。在检测到用户访问行为时,可以以用户信息作为索引,从历史记录的访问行为里,查询该用户上一次访问行为的信息。
步骤S106,判断用户访问行为与上一次访问行为是否在同一个会话中。
步骤S108,如果判断出用户访问行为与上一次访问行为不在同一个会话中,则从上一次访问行为的记录中查询上一次访问行为的访问时间。
由于在同一个会话中,用户可以产生多次访问行为,该会话具有一定的生命周期,该生命周期可以根据需要进行设置,例如30分钟。将与上一次访问行为不属于同一个会话的访问行为作为新的访问行为,将属于同一会话中的访问行为不作为新的访问行为,从而避免同一会话中产生的多次访问行为影响计算用户访问间隔时间的准确性。
优选地,在判断用户访问行为与上一次访问行为是否在同一个会话中之后,数据处理方法还包括:如果判断出用户访问行为与上一次访问行为在同一个会话中,则将用户的访问时间更新为用户访问行为的访问时间。
具体地,在判断出两次访问行为属于同一会话时,则将这两次访问行为作为一次访问,并将后一次访问的时间作为该一次访问的访问时间。也即是,本发明实施例中,以会话为基础计算用户访问网站的间隔时间,从而提高间隔时间的计算的准确性。
步骤S110,计算用户访问行为的访问时间与上一次访问行为的访问时间的间隔时间。
在判断出用户访问行为与该用户上一次访问行为不在同一会话中的情况下,从历史记录的信息中查询上一次访问行为的访问时间,与记录的本次用户访问行为的访问时间一起,计算得到这两次访问的间隔时间。
根据本发明实施例,通过获取用户访问行为对应的用户信息,并记录用户访问行为的访问时间,基于用户信息查询用户访问行为的上一次访问行为,如果未查询到该用户的历史访问行为,则认为该用户访问行为是新的访问行为,否则,继续判断用户访问行为与上一次访问行为是否在同一个会话中,如果判断出用户访问行为与上一次访问行为不在同一个会话中,则从上一次访问行为的记录中查询上一次访问行为的访问时间,计算用户访问行为的访问时间与上一次访问行为的访问时间的间隔时间,将属于同一个会话的用户访问行为作为一次访问,避免由于同一会话中产生的多次访问行为影响计算用户访问间隔时间的准确性,解决了无法准确地得到用户访问网站的间隔时间的问题,达到了提高用户访问网站的间隔时间计算的准确性的效果。
优选地,在获取用户访问行为对应的用户信息之后,数据处理方法还包括:将用户信息与预先存储的用户信息进行匹配;如果用户信息未匹配到预先存储的用户信息,则存储用户信息;如果用户信息匹配到预先存储的用户信息,则基于用户信息查询用户访问行为的上一次访问行为。
在获取到用户信息之后,可以将该用户信息与预先存储的用户信息进行匹配来判断访问的用户是新用户还是老用户,其中,预先存储的用户信息为每次用户访问时,记录到库里的用户信息,如果匹配到预先存储的用户信息,则表明该用户已经访问过网站,即该用户为老用户,在这种情况下,则可以计算该次访问与上一次访问的间隔时间。反之,如果未匹配到,则该用户为新用户,则存储该用户信息,以便于该用户下次访问时,计算其访问的间隔时间。
进一步地,将用户信息与预先存储的用户信息进行匹配包括:从用户信息中提取用户的Cookie信息;通过将用户的Cookie信息与预先存储的Cookie信息进行匹配来将用户信息与预先存储的用户信息进行匹配,其中,如果用户的Cookie信息未匹配到预先存储的Cookie信息,则确定用户信息未匹配到预先存储的用户信息;如果用户的 Cookie信息匹配到预先存储的Cookie信息,则确定用户信息匹配到预先存储的用户信息。
具体地,用户的Cookie信息可以是第一方Cookie信息,将提取到的Cookie信息与库中已有的Cookie信息进行匹配,以确定是否为新用户。如果匹配到,则为老用户,反之,则为新用户。
根据本发明实施例,通过利用Cookie信息来对新老用户进行识别,提高了新老用户识别的准确性。
本发明实施例还提供了一种访问频次信息处理方法。该方法可以采用本发明实施例所提供的上述数据处理方法。
图2是根据本发明实施例的访问频次信息处理方法的流程图。如图2所示,该访问频次信息处理方法包括:
步骤S202,利用数据处理方法计算用户连续两次访问行为的间隔时间,得到计算结果。
步骤S204,通过按照预先划分的时间间隔对计算结果进行分类来对用户的访问行为进行划分,得到对应于预先划分的时间间隔的访问量。
具体地,可以利用上述数据处理方法计算预设时间段内访问网站的用户该次访问与上一次访问网站的间隔时间,得到计算结果,该结果中包括该预设时间段内访问网站的用户的间隔时间,如果用户为新用户时,则无需计算间隔时间,将预设时间段内的新用户作为一类,老用户则按照时间间隔来划分。
例如,用户访问的时间间隔划分为“1天之内”、“跨1天”、“跨2天”、“跨3天”、“跨4到6天”、“超过6天”等几类,假如预设时间段为当前一个月,则计算该一个月内用户连续两次访问的时间间隔,然后按照上述划分的时间间隔来对计算结果进行分类,统计每个类别中的用户访问量如表1所示:
表1
时间间隔 访问量 百分比
1天之内 507,108 6.63%
跨1天 144,578 1.89%
跨2天 93,032 1.22%
跨3天 64,765 0.85%
跨4到6天 140,852 1.84%
超过6天 761,385 9.95%
首次访问 5,937,145 77.62%
下面结合图3对本发明实施例的访问频次信息处理方法进行描述,该方法包括:
步骤S302,在检测到用户访问行为的情况下,获取用户信息。
步骤S304,记录访问的时间点。
步骤S306,从用户信息中提取Cookie信息。
步骤S308,判断该Cookie信息是否为新的Cookie信息。如果是,则执行步骤S310,反之,则执行步骤S312。
步骤S310,判定为“首次访问”。
步骤S312,判断本次访问与上次访问是否在同一个会话中。如果是,则返回执行步骤S304;反之,则执行步骤S314。
步骤S314,计算本次访问与上次访问的时间间隔,并根据计算结果对本次访问进行归类。
步骤S316,计算预设时间段内各类访问行为的频次。
具体地,当用户产生访问行为时,通过JS脚本发送用户信息,由此获取访客的第一方Cookie信息,并同时记录本次访问的具体时间点。
将获取到的Cookie信息与库中已有的Cookie信息进行比对,以确定是否为新访问者;若为新访问者,则“是否新访问者”字段值为1,若为老访问者,则“是否新访问者”字段值为0,通过识别“是否新访问者”的字段值即可确定访问者是否为新老访问者。
判定本次访问与上次访问是否在同一个会话中,若为同一个会话,则本次访问不算作新访问,不进行后续计算,只更新时间点;若为不同会话,则将此次访问频次信息记录在数据库中并作相应的计算,将新获取到的老访客访问时间点与之前存储的时间点进行比对,计算老访问者本次访问的时间间隔,在此间隔归属的字段“+1”。
根据上述得到的数据库中的频次信息,结合选定的时间段,对此段时间内的各个时间间隔的频数进行累计求和,并计算百分比。最后可以将上述频数信息以条形图的形式进行展现,并在图旁附上相应的频数、频率指标值。从而更加直观地对计算结果进行展示。
本发明实施例还提供了一种数据处理装置。该装置可以通过网站服务器实现其功能。需要说明的是,本发明实施例的数据处理装置可以用于执行本发明实施例所提供的数据处理方法,本发明实施例的数据处理方法也可以通过本发明实施例所提供的数据处理装置来执行。
图4是根据本发明实施例的数据处理装置的示意图。如图4所示,该数据处理装置包括:获取单元10、第一查询单元20、判断单元30、第二查询单元40和计算单元 50。
获取单元10用于在检测到用户访问行为的情况下,获取用户访问行为对应的用户信息,并记录用户访问行为的访问时间。
用户访问行为可以是指当前用户浏览网站的行为,用户在访问或者浏览网站时,用户所使用的终端设备与网站的服务器建立连接以进行数据通讯,这样,服务器可以以此来检测用户访问行为。在检测到用户访问行为的情况下,可以获取该次访问的用户信息,并记录该次访问的时间。具体地,当用户产生访问行为时,通过JS脚本发送用户信息,从而获取到用户信息,并同时记录本次访问的具体时间点。
第一查询单元20用于基于用户信息查询用户访问行为的上一次访问行为。
用户每次访问网站时,记录该次访问的相关信息,例如用户信息、访问时间、访问时长、访问内容等等。在检测到用户访问行为时,可以以用户信息作为索引,从历史记录的访问行为里,查询该用户上一次访问行为的信息。
判断单元30用于判断用户访问行为与上一次访问行为是否在同一个会话中。
第二查询单元40用于如果判断出用户访问行为与上一次访问行为不在同一个会话中,则从上一次访问行为的记录中查询上一次访问行为的访问时间。
由于在同一个会话中,用户可以产生多次访问行为,该会话具有一定的生命周期,该生命周期可以根据需要进行设置,例如30分钟。将与上一次访问行为不属于同一个会话的访问行为作为新的访问行为,将属于同一会话中的访问行为作不作为新的访问行为,从而避免同一会话中产生的多次访问行为影响计算用户访问间隔时间的准确性。
优选地,数据处理装置还包括:更新单元,用于在判断用户访问行为与上一次访问行为是否在同一个会话中之后,如果判断出用户访问行为与上一次访问行为在同一个会话中,则将用户的访问时间更新为用户访问行为的访问时间。
具体地,在判断出两次访问行为属于同一会话时,则将这两次访问行为作为一次访问,并将后一次访问的时间作为该一次访问的访问时间。也即是,本发明实施例中,以会话为基础计算用户访问网站的间隔时间,从而提高间隔时间的计算的准确性。
计算单元50用于计算用户访问行为的访问时间与上一次访问行为的访问时间的间隔时间。
在判断出用户访问行为与该用户上一次反问行为不在同一会话中的情况下,从历史记录的信息中查询上一次访问行为的访问时间,与记录的本次用户访问行为的访问时间一起,计算得到这两次访问的间隔时间。
根据本发明实施例,通过获取用户访问行为对应的用户信息,并记录用户访问行为的访问时间,基于用户信息查询用户访问行为的上一次访问行为,如果未查询到该用户的历史访问行为,则认为该用户访问行为是新的访问行为,否则,继续判断用户访问行为与上一次访问行为是否在同一个会话中,如果判断出用户访问行为与上一次访问行为不在同一个会话中,则从上一次访问行为的记录中查询上一次访问行为的访问时间,计算用户访问行为的访问时间与上一次访问行为的访问时间的间隔时间,将属于同一个会话的用户访问行为作为一次访问,避免由于同一会话中产生的多次访问行为影响计算用户访问间隔时间的准确性,解决了无法准确地得到用户访问网站的间隔时间的问题,达到了提高用户访问网站的间隔时间计算的准确性的效果。
优选地,数据处理装置还包括:匹配单元,用于在获取用户访问行为对应的用户信息之后,将用户信息与预先存储的用户信息进行匹配;存储单元,用于如果用户信息未匹配到预先存储的用户信息,则存储用户信息;以及第二查询单元还用于如果用户信息匹配到预先存储的用户信息,则基于用户信息查询用户访问行为的上一次访问行为。
在获取到用户信息之后,可以将该用户信息与预先存储的用户信息进行匹配来判断访问的用户是新用户还是老用户,其中,预先存储的用户信息为每次用户访问时,记录到库里的用户信息,如果匹配到预先存储的用户信息,则表明该用户已经访问过网站,即该用户为老用户,在这种情况下,则可以计算该次访问与上一次访问的间隔时间。反之,如果未匹配到,则该用户为新用户,则存储该用户信息,以便于该用户下次访问时,计算其访问的间隔时间。
进一步地,匹配单元包括:提取模块,用于从用户信息中提取用户的Cookie信息;匹配模块,用于通过将用户的Cookie信息与预先存储的Cookie信息进行匹配来将用户信息与预先存储的用户信息进行匹配,其中,如果用户的Cookie信息未匹配到预先存储的Cookie信息,则确定用户信息未匹配到预先存储的用户信息;如果用户的 Cookie信息匹配到预先存储的Cookie信息,则确定用户信息匹配到预先存储的用户信息。
具体地,用户的Cookie信息可以是第一方Cookie信息,将提取到的Cookie信息与库中已有的Cookie信息进行匹配,以确定是否为新用户。如果匹配到,则为老用户,反之,则为新用户。
根据本发明实施例,通过利用Cookie信息来对新老用户进行识别,提高了新老用户识别的准确性。
本发明实施例还提供了一种访问频次信息处理装置。该装置可以通过网站服务器实现其功能。需要说明的是,本发明实施例的访问频次信息处理装置可以用于执行本发明实施例所提供的访问频次信息处理方法,本发明实施例的访问频次信息处理方法也可以通过本发明实施例所提供的访问频次信息处理装置来执行。
图5是根据本发明实施例的访问频次信息处理装置的示意图。该访问频次信息处理装置包括:本发明上述实施例提供的数据处理装置501和划分单元502 。
数据处理装置501用于计算用户连续两次访问行为的间隔时间,得到计算结果。划分单元502用于通过按照预先划分的时间间隔对计算结果进行分类来对用户的访问行为进行划分,得到对应于预先划分的时间间隔的访问量。
具体地,可以利用上述数据处理方法计算预设时间段内访问网站的用户该次访问与上一次访问网站的间隔时间,得到计算结果,该结果中包括该预设时间段内访问网站的用户的间隔时间,如果用户为新用户时,则无需计算间隔时间,将预设时间段内的新用户作为一类,老用户则按照时间间隔来划分。
例如,用户访问的时间间隔划分为“1天之内”、“跨1天”、“跨2天”、“跨3天”、“跨4到6天”、“超过6天”等几类,假如预设时间段为当前一个月,则计算该一个月内用户连续两次访问的时间间隔,然后按照上述划分的时间间隔来对计算结果进行分类,统计每个类别中的用户访问量如表1所示。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、移动终端、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种数据处理方法,其特征在于,包括:
在检测到用户访问行为的情况下,获取所述用户访问行为对应的用户信息,并记录所述用户访问行为的访问时间;
基于所述用户信息查询所述用户访问行为的上一次访问行为;
判断所述用户访问行为与所述上一次访问行为是否在同一个会话中;
如果判断出所述用户访问行为与所述上一次访问行为不在同一个会话中,则从所述上一次访问行为的记录中查询所述上一次访问行为的访问时间;以及
计算所述用户访问行为的访问时间与所述上一次访问行为的访问时间的间隔时间;
其中,在判断所述用户访问行为与所述上一次访问行为是否在同一个会话中之后,所述数据处理方法还包括:
如果判断出所述用户访问行为与所述上一次访问行为在同一个会话中,则将所述用户的访问时间更新为所述用户访问行为的访问时间。
2.根据权利要求1所述的数据处理方法,其特征在于,在获取所述用户访问行为对应的用户信息之后,所述数据处理方法还包括:
将所述用户信息与预先存储的用户信息进行匹配;
如果所述用户信息未匹配到所述预先存储的用户信息,则存储所述用户信息;以及
如果所述用户信息匹配到所述预先存储的用户信息,则基于所述用户信息查询所述用户访问行为的上一次访问行为。
3.根据权利要求2所述的数据处理方法,其特征在于,将所述用户信息与预先存储的用户信息进行匹配包括:
从所述用户信息中提取所述用户的Cookie信息;
通过将所述用户的Cookie信息与预先存储的Cookie信息进行匹配来将所述用户信息与预先存储的用户信息进行匹配,其中,
如果所述用户的Cookie信息未匹配到所述预先存储的Cookie信息,则确定所述用户信息未匹配到所述预先存储的用户信息;
如果所述用户的Cookie信息匹配到所述预先存储的Cookie信息,则确定所述用户信息匹配到所述预先存储的用户信息。
4.一种访问频次信息处理方法,其特征在于,包括:
利用权利要求1至3中任一项所述的数据处理方法计算用户连续两次访问行为的间隔时间,得到计算结果;以及
通过按照预先划分的时间间隔对所述计算结果进行分类来对用户的访问行为进行划分,得到对应于所述预先划分的时间间隔的访问量。
5.一种数据处理装置,其特征在于,包括:
获取单元,用于在检测到用户访问行为的情况下,获取所述用户访问行为对应的用户信息,并记录所述用户访问行为的访问时间;
第一查询单元,用于基于所述用户信息查询所述用户访问行为的上一次访问行为;
判断单元,用于判断所述用户访问行为与所述上一次访问行为是否在同一个会话中;
第二查询单元,用于如果判断出所述用户访问行为与所述上一次访问行为不在同一个会话中,则从所述上一次访问行为的记录中查询所述上一次访问行为的访问时间;以及
计算单元,用于计算所述用户访问行为的访问时间与所述上一次访问行为的访问时间的间隔时间;
其中,所述数据处理装置还包括:
更新单元,用于在判断所述用户访问行为与所述上一次访问行为是否在同一个会话中之后,如果判断出所述用户访问行为与所述上一次访问行为在同一个会话中,则将所述用户的访问时间更新为所述用户访问行为的访问时间。
6.根据权利要求5所述的数据处理装置,其特征在于,所述数据处理装置还包括:
匹配单元,用于在获取所述用户访问行为对应的用户信息之后,将所述用户信息与预先存储的用户信息进行匹配;
存储单元,用于如果所述用户信息未匹配到所述预先存储的用户信息,则存储所述用户信息;以及
所述第二查询单元还用于如果所述用户信息匹配到所述预先存储的用户信息,则基于所述用户信息查询所述用户访问行为的上一次访问行为。
7.根据权利要求6所述的数据处理装置,其特征在于,所述匹配单元包括:
提取模块,用于从所述用户信息中提取所述用户的Cookie信息;
匹配模块,用于通过将所述用户的Cookie信息与预先存储的Cookie信息进行匹配来将所述用户信息与预先存储的用户信息进行匹配,其中,如果所述用户的Cookie信息未匹配到所述预先存储的Cookie信息,则确定所述用户信息未匹配到所述预先存储的用户信息;如果所述用户的Cookie信息匹配到所述预先存储的Cookie信息,则确定所述用户信息匹配到所述预先存储的用户信息。
8.一种访问频次信息处理装置,其特征在于,包括:
权利要求5至7中任一项所述的数据处理装置,用于计算用户连续两次访问行为的间隔时间,得到计算结果;以及
划分单元,用于通过按照预先划分的时间间隔对所述计算结果进行分类来对用户的访问行为进行划分,得到对应于所述预先划分的时间间隔的访问量。
CN201410719753.8A 2014-12-01 2014-12-01 数据处理方法及装置和访问频次信息处理方法及装置 Active CN104484357B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410719753.8A CN104484357B (zh) 2014-12-01 2014-12-01 数据处理方法及装置和访问频次信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410719753.8A CN104484357B (zh) 2014-12-01 2014-12-01 数据处理方法及装置和访问频次信息处理方法及装置

Publications (2)

Publication Number Publication Date
CN104484357A CN104484357A (zh) 2015-04-01
CN104484357B true CN104484357B (zh) 2018-05-15

Family

ID=52758898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410719753.8A Active CN104484357B (zh) 2014-12-01 2014-12-01 数据处理方法及装置和访问频次信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN104484357B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106611346A (zh) * 2015-10-22 2017-05-03 北京国双科技有限公司 访客筛选方法和装置
CN106611348A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 异常流量的检测方法和装置
CN106921536B (zh) * 2015-12-25 2020-02-07 北京奇虎科技有限公司 基于客户端版本信息的数据处理方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002063102A (ja) * 2000-08-16 2002-02-28 Frontline Dot Jp:Kk ログ解析システム
JP2008026972A (ja) * 2006-07-18 2008-02-07 Fujitsu Ltd ウェブサイト構築支援システム、ウェブサイト構築支援方法およびウェブサイト構築支援プログラム
CN102681999A (zh) * 2011-03-08 2012-09-19 阿里巴巴集团控股有限公司 一种用户行为信息收集及信息发送方法及装置
CN103297469B (zh) * 2012-02-25 2016-12-14 阿里巴巴集团控股有限公司 一种网站数据的采集方法及装置
CN103051637A (zh) * 2012-12-31 2013-04-17 北京亿赞普网络技术有限公司 用户识别方法与装置
CN103631957B (zh) * 2013-12-13 2017-11-21 北京国双科技有限公司 访客行为数据统计方法及装置
CN103823891B (zh) * 2014-03-10 2017-03-22 北京国双科技有限公司 用于计算机历史行为分析的数据处理方法和装置

Also Published As

Publication number Publication date
CN104484357A (zh) 2015-04-01

Similar Documents

Publication Publication Date Title
CN107835231B (zh) 反馈信息的处理方法及终端设备
CN103886068B (zh) 用于互联网用户行为分析的数据处理方法和装置
CN110147821B (zh) 目标用户群体确定方法、装置、计算机设备及存储介质
CN104504077B (zh) 网页访问数据的统计方法和装置
CN106033579A (zh) 数据处理方法和装置
CN110321424B (zh) 一种基于深度学习的艾滋病人员行为分析方法
CN107688987A (zh) 电子装置、保险推荐方法、及计算机可读存储介质
EP2469427B1 (en) A method and a system for managing a website using profile key patterns
CN108628721B (zh) 用户数据值的异常检测方法、装置、存储介质及电子装置
CA3034030A1 (en) System and method for analyzing user device information
CN108366012B (zh) 一种社交关系建立方法、装置及电子设备
CN113412607B (zh) 内容推送方法、装置、移动终端及存储介质
CN111461827B (zh) 产品评价信息的推送方法和装置
CN111815375B (zh) 广告投放中的用户画像方法及装置
CN108304428A (zh) 信息推荐方法及装置
CN107977678A (zh) 用于输出信息的方法和装置
CN110457601B (zh) 社交账号的识别方法和装置、存储介质及电子装置
CN107483381A (zh) 关联账户的监控方法及装置
CN104484357B (zh) 数据处理方法及装置和访问频次信息处理方法及装置
CN111209368A (zh) 信息提示方法和装置、计算机可读的存储介质及电子装置
CN113327146A (zh) 一种信息追踪方法和装置
CN107481039A (zh) 一种事件处理方法及终端设备
CN107038649A (zh) 一种终端用户的好友推荐方法及装置
CN112989158A (zh) 一种识别网页爬虫行为的方法、装置及存储介质
CN112437034A (zh) 虚假终端检测方法和装置、存储介质及电子装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Data processing method and device and access frequency information processing method and device

Effective date of registration: 20190531

Granted publication date: 20180515

Pledgee: Shenzhen Black Horse World Investment Consulting Co.,Ltd.

Pledgor: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Registration number: 2019990000503

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

PP01 Preservation of patent right
PP01 Preservation of patent right

Effective date of registration: 20240604

Granted publication date: 20180515