CN103823891A - 用于计算机历史行为分析的数据处理方法和装置 - Google Patents

用于计算机历史行为分析的数据处理方法和装置 Download PDF

Info

Publication number
CN103823891A
CN103823891A CN201410086090.0A CN201410086090A CN103823891A CN 103823891 A CN103823891 A CN 103823891A CN 201410086090 A CN201410086090 A CN 201410086090A CN 103823891 A CN103823891 A CN 103823891A
Authority
CN
China
Prior art keywords
session
order
behavior
data interaction
historical behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410086090.0A
Other languages
English (en)
Other versions
CN103823891B (zh
Inventor
洪超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201410086090.0A priority Critical patent/CN103823891B/zh
Publication of CN103823891A publication Critical patent/CN103823891A/zh
Application granted granted Critical
Publication of CN103823891B publication Critical patent/CN103823891B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用于计算机历史行为分析的数据处理方法和装置。该用于计算机历史行为分析的数据处理方法包括:获取第一历史行为对应的操作的次序;获取第二历史行为对应的操作的次序;以及根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数,其中,计算机历史行为包括对应于不同时间的第一历史行为和第二历史行为。通过本发明,解决了相关技术中历史行为分析的数据处理的处理效率比较低的问题。

Description

用于计算机历史行为分析的数据处理方法和装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种用于计算机历史行为分析的数据处理方法和装置。
背景技术
用户在使用计算机时,会产生大量的历史行为。其中,用户的历史行为可以是数据交互行为,该数据交互行为可以包括用户的交易行为。用户的历史行为的分析是指对用户的历史操作行为进行的分析。例如,可以分析用户本次交易与上次交易之间所发生的会话(访问)数、页面浏览数以及该两次交易之间间隔的时间长度等等。
目前,在相关技术中,提供了一种分析历史行为的数据处理方案。该方案通过会话表进行历史查询:首先查找用户上次交易的会话的标识,然后根据查找到的标识在会话表中进行会话历史查询,查找出上次交易的会话的开始时间,并根据该用户的用户标识查找会话开始时间晚于上次交易的会话的开始时间且早于本次交易的会话的开始时间的全部会话,进而统计上述全部会话的次数,得到用户本次交易距离上次交易之间的会话数。综上可以看出,该方案的处理效率比较低。这是因为该方案对历史操作行为信息的要求比较高,并且需要对大数据表——会话表进行多次表扫描操作。
针对相关技术中历史行为分析的数据处理的处理效率比较低的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种用于计算机历史行为分析的数据处理方法和装置,以解决相关技术中历史行为分析的数据处理的处理效率比较低的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种用于计算机历史行为分析的数据处理方法。该方法包括:获取第一历史行为对应的操作的次序;获取第二历史行为对应的操作的次序;以及根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数,其中,计算机历史行为包括对应于不同时间的第一历史行为和第二历史行为。
进一步地,第一历史行为包括第一数据交互行为,第二历史行为包括第二数据交互行为,第一历史行为对应的操作的次序包括第一会话的次序,第二历史行为对应的操作的次序包括第二会话的次序,获取第一历史行为对应的操作的次序包括:获取第一数据交互行为对应的第一会话的次序,获取第二历史行为对应的操作的次序包括:获取第二数据交互行为对应的第二会话的次序,根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数包括:根据第一会话的次序和第二会话的次序进行计算,得到第一数据交互行为和第二数据交互行为之间的会话数。
进一步地,在获取第二数据交互行为对应的第二会话的次序之前,该数据处理方法还包括:查找预设数据交互表,得到第一会话的标识;基于第一会话的标识查找会话表,得到第一会话的开始时间,获取第二数据交互行为对应的第二会话的次序包括:查找预设数据交互表,得到多个待定数据交互行为,多个待定数据交互行为和第一数据交互行为为同一用户的行为;获取多个待定数据交互行为中各个待定数据交互行为的会话的开始时间;将各个待定数据交互行为的会话的开始时间与第一会话的开始时间进行比较,得到第二会话的开始时间,第二会话的开始时间为各个待定数据交互行为的会话的开始时间中与第一会话的开始时间的差值最小的开始时间,其中,第二会话的开始时间对应的第二会话中产生的待定数据交互行为为第二数据交互行为;根据第二数据交互行为的标识查找预设数据交互表,得到第二会话的次序。
进一步地,在获取第一历史行为对应的操作的次序之前,该数据处理方法还包括:加载多个会话;调用会话分组函数对多个会话按照用户标识进行分组,得到第一用户会话组,其中,用户包括第一用户;按照时间顺序对第一用户会话组中的多个会话进行排序,得到会话序列;从会话序列中获取第一会话的排序;以及将第一会话的排序作为第一会话的次序。
进一步地,在将第一会话的排序作为第一会话的次序之前,该数据处理方法还包括:从用户表中获取第一用户的累积会话数;根据将第一会话的排序作为第一会话的次序和第一用户的累积会话数进行计算,得到新的第一会话的排序,将第一会话的排序作为第一会话的次序包括:将新的第一会话的排序作为第一会话的次序。
为了实现上述目的,根据本发明的另一方面,提供了一种用于计算机历史行为分析的数据处理装置。该装置包括:第一获取单元,用于获取第一历史行为对应的操作的次序;第二获取单元,用于获取第二历史行为对应的操作的次序;以及第一计算单元,用于根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数,其中,计算机历史行为包括对应于不同时间的第一历史行为和第二历史行为。
进一步地,第一历史行为包括第一数据交互行为,第二历史行为包括第二数据交互行为,第一历史行为对应的操作的次序包括第一会话的次序,第二历史行为对应的操作的次序包括第二会话的次序,第一获取单元还用于获取第一数据交互行为对应的第一会话的次序;第二获取单元还用于获取第二数据交互行为对应的第二会话的次序;以及第一计算单元还用于根据第一会话的次序和第二会话的次序进行计算,得到第一数据交互行为和第二数据交互行为之间的会话数。
进一步地,该数据处理装置还包括:第一查找单元,用于在获取第二数据交互行为对应的第二会话的次序之前,查找预设数据交互表,得到第一会话的标识;第二查找单元,用于基于第一会话的标识查找会话表,得到第一会话的开始时间,第二获取单元包括:第一查找模块,用于查找预设数据交互表,得到多个待定数据交互行为,多个待定数据交互行为和第一数据交互行为为同一用户的行为;获取模块,用于获取多个待定数据交互行为中各个待定数据交互行为的会话的开始时间;比较模块,用于将各个待定数据交互行为的会话的开始时间与第一会话的开始时间进行比较,得到第二会话的开始时间,第二会话的开始时间为各个待定数据交互行为的会话的开始时间中与第一会话的开始时间的差值最小的开始时间,其中,第二会话的开始时间对应的第二会话中产生的待定数据交互行为为第二数据交互行为;第二查找模块,用于根据第二数据交互行为的标识查找预设数据交互表,得到第二会话的次序。
进一步地,该数据处理装置还包括:加载单元,用于在获取第一历史行为对应的操作的次序之前,加载多个会话;调用单元,用于调用会话分组函数对多个会话按照用户标识进行分组,得到第一用户会话组,其中,用户包括第一用户;排序单元,用于按照时间顺序对第一用户会话组中的多个会话进行排序,得到会话序列;第三获取单元,用于从会话序列中获取第一会话的排序;以及确定单元,用于将第一会话的排序作为第一会话的次序。
进一步地,该数据处理装置还包括:第四获取单元,用于在将第一会话的排序作为第一会话的次序之前,从用户表中获取第一用户的累积会话数;第二计算单元,用于根据将第一会话的排序作为第一会话的次序和第一用户的累积会话数进行计算,得到新的第一会话的排序;以及确定单元还用于将新的第一会话的排序作为第一会话的次序。
通过本发明,采用获取第一历史行为对应的操作的次序;获取第二历史行为对应的操作的次序;以及根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数,其中,计算机历史行为包括对应于不同时间的第一历史行为和第二历史行为,解决了相关技术中历史行为分析的数据处理的处理效率比较低的问题,进而达到了快速分析用户的历史行为信息的效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的用于计算机历史行为分析的数据处理装置的示意图;
图2是根据本发明实施例的用于计算机历史行为分析的数据处理方法的流程图;以及
图3是根据本发明可选实施例的用于计算机历史行为分析的数据处理方法的流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本领域的技术人员更好的理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,在本领域普通技术人员没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
根据本发明的实施例,提供了一种用于计算机历史行为分析的数据处理装置,该用于计算机历史行为分析的数据处理装置用于快速分析用户的历史行为信息。
图1是根据本发明实施例的用于计算机历史行为分析的数据处理装置的示意图。
如图1所示,该装置包括:第一获取单元10,第二获取单元20和第一计算单元30。
需要说明的是,计算机历史行为可以包括对应于不同时间的第一历史行为和第二历史行为。其中,计算机历史行为可以是联网的或者非联网的计算机历史行为,第一历史行为可以是第一时刻的历史行为,第二历史行为可以是第二时刻的历史行为。当计算机历史行为为联网的历史行为时,其可以是包括用户的数据交互行为等,例如,其可以是用户的网上购物、选课、购买保险、试驾或者登录以及注册银行账户等行为。第一历史行为和第二历史行为可以分别是第一次购物时下订单的行为和第二次购物时下订单的行为。
第一获取单元10用于获取第一历史行为对应的操作的次序。
由于产生第一历史行为的操作的原因可以是用户访问网站、或者用户正开启一次会话、或者用户正在进行网站的页面浏览等,因此第一历史行为对应的操作的次序可以是第一历史行为对应的第几次访问网站(访问次序)、或者正开启第几次会话(会话次序)、或者正在进行第几个页面浏览(页面浏览次序)等。
其中,第一历史行为及其对应的操作的次序可以基于两者之间的对应关系预先存储在数据库表中,并且第一历史行为可以通过唯一的字段进行标识,该标识可以为第一历史行为标识。这样,可以将第一历史行为标识和其对应对的操作次序分别存储在数据库表的相应列中。
第二获取单元20用于获取第二历史行为对应的操作的次序。
基于上述阐述,第二历史行为对应的操作的次序可以是第二历史行为对应的第几次访问网站(访问次序)、或者正开启第几次会话(会话次序)、或者正在进行第几个页面浏览(页面浏览次序)等。
其中,第二历史行为及其对应的操作的次序可以基于两者之间的对应关系预先存储在数据库表中,并且第二历史行为也可以通过唯一的字段进行标识,该标识可以为第二历史行为标识。这样,可以将第二历史行为标识和其对应对的操作次序分别存储在数据库表的相应列中。
第一计算单元30用于根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数。
具体地,第一历史行为对应的操作的次序可以是第一历史行为对应的会话次序,第二历史行为对应的操作的次序可以是第二历史行为对应的会话次序,这样,可以计算第一历史行为对应的会话次序和第二历史行为对应的会话次序之间的会话数,该会话数可以是上述两个历史行为分别对应的会话次序的差值的绝对值。例如,第一历史行为对应着第N次会话,第二历史行为对应着第M次会话,这样,第一历史行为和第二历史行为之间间隔的会话数为(N-M)的绝对值。
进一步地,根据同样的原理,可以得到第一历史行为和第二历史行为之间间隔的时间长度。
通过本发明实施例,由于可以直接获取预先存储的各个历史行为的操作次序,而无需首先查找大数据会话表中各个历史行为对应的操作的时间,再根据各个历史行为对应的操作的时间统计任意两个历史行为之间的操作的个数(操作数),因此可以节约得到历史行为之间操作数的时间,达到快速分析用户的历史行为信息和提高数据处理的效率的效果。
需要说明的是,第一历史行为可以包括第一数据交互行为,第二历史行为可以包括第二数据交互行为,第一历史行为对应的操作的次序可以包括第一会话的次序,第二历史行为对应的操作的次序可以包括第二会话的次序。其中,第一数据交互行为可以是用户网购时下第一订单的行为,第二数据交互行为可以是该用户网购时下第二订单的行为,以下本发明以数据交互行为为网购时下订单的行为进行阐述。
第一获取单元10还用于获取第一数据交互行为对应的第一会话的次序。
前述实施例中的获取第一历史行为对应的操作的次序可以包括:获取第一数据交互行为对应的第一会话的次序。
其中,第一数据交互行为及其对应的第一会话的次序可以基于这两者之间的对应关系预先存储在预设数据交互表中,并且第一数据交互行为可以通过唯一的字段进行标识,该标识可以为第一数据交互行为标识。这样,可以将第一数据交互行为标识和其对应对的第一会话的次序分别存储在数据交互表的相应列中,其中,数据交互表可以为数据库表。
第二获取单元20还用于获取第二数据交互行为对应的第二会话的次序。
基于上述阐述,前述实施例中的获取第二历史行为对应的操作的次序可以包括:获取第二数据交互行为对应的第二会话的次序。
其中,第二数据交互行为及其对应的第二会话的次序可以基于这两者之间的对应关系预先存储在预设数据交互表中,并且第二数据交互行为可以通过唯一的字段进行标识,该标识可以为第二数据交互行为标识。这样,可以将第二数据交互行为标识和其对应对的第二会话的次序分别存储在数据交互表的相应列中,其中,数据交互表可以为数据库表。
需要说明的是,第一数据交互行为和第二数据交互行为可以是同一用户在不同时间的两次数据交互行为,例如,该两次数据交互行为可以分别是用户在第一时间浏览网站时下第一订单的行为和该用户在第二时间浏览网站时下第二订单的行为。这样,根据两次下订单的行为分别对应的会话次序,可以分析该用户在两次下订单的行为(如,本次购买和上次购买)之间的所发生的会话数,进而可以分析该用户平均每下一次订单需要经过的会话次数信息,达到为商家提供准确的分析数据的目的。
第一计算单元30还用于根据第一会话的次序和第二会话的次序进行计算,得到第一数据交互行为和第二数据交互行为之间的会话数。
基于上述阐述,前述实施例中的根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数可以包括:根据第一会话的次序和第二会话的次序进行计算,得到第一数据交互行为和第二数据交互行为之间的会话数。该会话数可以是上述两个数据交互行为分别对应的第一会话的次序和第二会话的次序的差值的绝对值。例如,第一数据交互行为对应着第X次会话,第二数据交互行为对应着第Y次会话,这样,该两次数据交互行为之间间隔的会话数为(X-Y)的绝对值。
其中,在本发明实施例中,可以基于同样的原理分析任意两次数据交互行为之间所发生的页面浏览数信息,在此不再赘述。
通过本发明实施例,由于可以直接获取预先存储的各个数据交互行为的会话次序,而无需首先查找大数据会话表中各个数据交互行对应的会话的时间,再根据各个数据交互行为对应的会话的时间统计任意两个数据交互行为之间的会话的个数(会话数),因此可以节约得到数据交互行为之间会话数的时间,达到快速分析用户的数据交互行为信息和提高数据处理的效率的效果。
可选地,该数据处理装置还可以包括:第一查找单元和第二查找单元。
第一查找单元用于在获取第二数据交互行为对应的第二会话的次序之前,查找预设数据交互表,得到第一会话的标识,其中,第一会话的标识存储在预设数据交互表的相应列中。第二查找单元用于基于第一会话的标识查找会话表,得到第一会话的开始时间。
这样,第二获取单元20可以包括:第一查找模块、获取模块、比较模块和第二查找模块。
第一查找模块用于查找预设数据交互表,得到多个待定数据交互行为,该多个待定数据交互行为和第一数据交互行为可以为同一用户的行为。获取模块用于获取多个待定数据交互行为中各个待定数据交互行为的会话的开始时间,具体地,可以将多个待定数据交互行为中各个待定数据交互行为的标识与会话表中的各个待定数据交互行为的标识相关联,得到各个待定数据交互行为对应的会话的开始时间。比较模块用于将各个待定数据交互行为的会话的开始时间与第一会话的开始时间进行比较,得到第二会话的开始时间,第二会话的开始时间为各个待定数据交互行为的会话的开始时间中与第一会话的开始时间的差值最小的开始时间,第二会话的开始时间可以是大于第一会话的开始时间,但是小于第三会话的开始时间的会话开始时间,第二会话的开始时间对应的第二会话中产生的待定数据交互行为为第二数据交互行为。例如,会话列表中用户A的会话包括会话1、会话2、会话3、会话4……会话m……会话n……等,会话n为本次购买对应的会话(第二会话),会话m为上次购买对应的会话(第一会话),其中,会话m和会话n之间的会话均为产生购买行为。第二查找模块用于根据第二数据交互行为的标识查找预设数据交互表,得到第二会话的次序。
可选地,在获取第一历史行为对应的操作的次序之前,该数据处理装置还可以包括:加载单元、调用单元、排序单元、第三获取单元和确定单元。
加载单元用于加载多个会话,其中,可以从任意地方加载多个会话,例如,可以从互联网中加载会话以更新会话表。调用单元用于调用会话分组函数对多个会话按照用户标识进行分组,得到第一用户会话组,其中,用户可以包括一个或者多个用户,例如,该用户可以包括第一用户。具体地,可以是SQLserver内置的Row_Number会话分组函数按照用户的标识对用户的会话进行分组,即,相同用户的所有会话在一个会话组中,不同的用户的会话在不同的会话组中。排序单元用于按照时间顺序对第一用户会话组中的多个会话进行排序,得到会话序列。第三获取单元用于从会话序列中获取第一会话的排序。确定单元用于将第一会话的排序作为第一会话的次序。
优选地,该数据处理装置还可以包括:第四获取单元和第二计算单元。
第四获取单元用于在将第一会话的排序作为第一会话的次序之前,从用户表中获取第一用户的累积会话数,其中,需要说明的是,所有用户的累积会话数的初始值均默认为0,并且所有用户基于其用户标识与会话累积数的对应关系存储在用户表中。第二计算单元用于根据将第一会话的排序作为第一会话的次序和第一用户的累积会话数进行计算,得到新的第一会话的排序。这样,确定单元还用于将新的第一会话的排序作为第一会话的次序。
通过本发明实施例,采用建立用户表、会话表、预设数据交互表,并且用户表中至少包括用户标识列和会话累积数了,会话表中至少包括用户标识列、会话标识列、会话开始时间列、数据交互表(如可以是商户订单表)至少包括用户标识列、订单标识列、会话标识列和派生列——会话次序列,其中,上述三个表均为数据库表,他们通过相应的标识列相互关联,从而可以进行基于索引的查询,最终得到两次历史行为之间的操作数信息,避免了多次查找大数据会话表的麻烦,进而达到了快速分析用户的历史行为信息的效果。
根据本发明的实施例,提供了一种用于计算机历史行为分析的数据处理方法,该用于计算机历史行为分析的数据处理方法用于快速分析用户的历史行为信息。该用于计算机历史行为分析的数据处理方法可以运行在计算机处理设备上。需要说明的是,本发明实施例所提供的用于计算机历史行为分析的数据处理方法可以通过本发明实施例的用于计算机历史行为分析的数据处理装置来执行,本发明实施例的用于计算机历史行为分析的数据处理装置也可以用于执行本发明实施例的用于计算机历史行为分析的数据处理方法。
图2是根据本发明实施例的用于计算机历史行为分析的数据处理方法的流程图。
如图2所示,该方法包括如下的步骤S202至步骤S206:
需要说明的是,计算机历史行为可以包括对应于不同时间的第一历史行为和第二历史行为。其中,计算机历史行为可以是联网的或者非联网的计算机历史行为,第一历史行为可以是第一时刻的历史行为,第二历史行为可以是第二时刻的历史行为。当计算机历史行为为联网的历史行为时,其可以是包括用户的数据交互行为等,例如,其可以是用户的网上购物、选课、购买保险、试驾或者登录以及注册银行账户等行为。第一历史行为和第二历史行为可以分别是第一次购物时下订单的行为和第二次购物时下订单的行为。
步骤S202,获取第一历史行为对应的操作的次序。
由于产生第一历史行为的操作的原因可以是用户访问网站、或者用户正开启一次会话、或者用户正在进行网站的页面浏览等,因此第一历史行为对应的操作的次序可以是第一历史行为对应的第几次访问网站(访问次序)、或者正开启第几次会话(会话次序)、或者正在进行第几个页面浏览(页面浏览次序)等。
其中,第一历史行为及其对应的操作的次序可以基于两者之间的对应关系预先存储在数据库表中,并且第一历史行为可以通过唯一的字段进行标识,该标识可以为第一历史行为标识。这样,可以将第一历史行为标识和其对应对的操作次序分别存储在数据库表的相应列中。
步骤S204,获取第二历史行为对应的操作的次序。
基于上述阐述,第二历史行为对应的操作的次序可以是第二历史行为对应的第几次访问网站(访问次序)、或者正开启第几次会话(会话次序)、或者正在进行第几个页面浏览(页面浏览次序)等。
其中,第二历史行为及其对应的操作的次序可以基于两者之间的对应关系预先存储在数据库表中,并且第二历史行为也可以通过唯一的字段进行标识,该标识可以为第二历史行为标识。这样,可以将第二历史行为标识和其对应对的操作次序分别存储在数据库表的相应列中。
步骤S206,根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数。
具体地,第一历史行为对应的操作的次序可以是第一历史行为对应的会话次序,第二历史行为对应的操作的次序可以是第二历史行为对应的会话次序,这样,可以计算第一历史行为对应的会话次序和第二历史行为对应的会话次序之间的会话数,该会话数可以是上述两个历史行为分别对应的会话次序的差值的绝对值。例如,第一历史行为对应着第N次会话,第二历史行为对应着第M次会话,这样,第一历史行为和第二历史行为之间间隔的会话数为(N-M)的绝对值。
进一步地,根据同样的原理,可以得到第一历史行为和第二历史行为之间间隔的时间长度。
通过本发明实施例,由于可以直接获取预先存储的各个历史行为的操作次序,而无需首先查找大数据会话表中各个历史行为对应的操作的时间,再根据各个历史行为对应的操作的时间统计任意两个历史行为之间的操作的个数(操作数),因此可以节约得到历史行为之间操作数的时间,达到快速分析用户的历史行为信息和提高数据处理的效率的效果。
如图3所示,该用于计算机历史行为分析的数据处理方法包括如下的步骤S302至步骤S306,该实施例可以作为图2所示实施例的优选实施方式。
需要说明的是,第一历史行为可以包括第一数据交互行为,第二历史行为可以包括第二数据交互行为,第一历史行为对应的操作的次序可以包括第一会话的次序,第二历史行为对应的操作的次序可以包括第二会话的次序。其中,第一数据交互行为可以是用户网购时下第一订单的行为,第二数据交互行为可以是该用户网购时下第二订单的行为,以下本发明以数据交互行为为网购时下订单的行为进行阐述。
步骤S302,获取第一数据交互行为对应的第一会话的次序。
前述实施例中的获取第一历史行为对应的操作的次序可以包括:获取第一数据交互行为对应的第一会话的次序。
其中,第一数据交互行为及其对应的第一会话的次序可以基于这两者之间的对应关系预先存储在预设数据交互表中,并且第一数据交互行为可以通过唯一的字段进行标识,该标识可以为第一数据交互行为标识。这样,可以将第一数据交互行为标识和其对应对的第一会话的次序分别存储在数据交互表的相应列中,其中,数据交互表可以为数据库表。
步骤S304,获取第二数据交互行为对应的第二会话的次序。
基于上述阐述,前述实施例中的获取第二历史行为对应的操作的次序可以包括:获取第二数据交互行为对应的第二会话的次序。
其中,第二数据交互行为及其对应的第二会话的次序可以基于这两者之间的对应关系预先存储在预设数据交互表中,并且第二数据交互行为可以通过唯一的字段进行标识,该标识可以为第二数据交互行为标识。这样,可以将第二数据交互行为标识和其对应对的第二会话的次序分别存储在数据交互表的相应列中,其中,数据交互表可以为数据库表。
需要说明的是,第一数据交互行为和第二数据交互行为可以是同一用户在不同时间的两次数据交互行为,例如,该两次数据交互行为可以分别是用户在第一时间浏览网站时下第一订单的行为和该用户在第二时间浏览网站时下第二订单的行为。这样,根据两次下订单的行为分别对应的会话次序,可以分析该用户在两次下订单的行为(如,本次购买和上次购买)之间的所发生的会话数,进而可以分析该用户平均每下一次订单需要经过的会话次数信息,达到为商家提供准确的分析数据的目的。
步骤S306,根据第一会话的次序和第二会话的次序进行计算,得到第一数据交互行为和第二数据交互行为之间的会话数。
基于上述阐述,前述实施例中的根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数可以包括:根据第一会话的次序和第二会话的次序进行计算,得到第一数据交互行为和第二数据交互行为之间的会话数。该会话数可以是上述两个数据交互行为分别对应的第一会话的次序和第二会话的次序的差值的绝对值。例如,第一数据交互行为对应着第X次会话,第二数据交互行为对应着第Y次会话,这样,该两次数据交互行为之间间隔的会话数为(X-Y)的绝对值。
其中,在本发明实施例中,可以基于同样的原理分析任意两次数据交互行为之间所发生的页面浏览数信息,在此不再赘述。
通过本发明实施例,由于可以直接获取预先存储的各个数据交互行为的会话次序,而无需首先查找大数据会话表中各个数据交互行对应的会话的时间,再根据各个数据交互行为对应的会话的时间统计任意两个数据交互行为之间的会话的个数(会话数),因此可以节约得到数据交互行为之间会话数的时间,达到快速分析用户的数据交互行为信息和提高数据处理的效率的效果。
可选地,在获取第二数据交互行为对应的第二会话的次序之前,该数据处理方法还可以包括:首先,查找预设数据交互表,得到第一会话的标识,其中,第一会话的标识存储在预设数据交互表的相应列中。然后,基于第一会话的标识查找会话表,得到第一会话的开始时间。
这样,获取第二数据交互行为对应的第二会话的次序可以包括:
首先,查找预设数据交互表,得到多个待定数据交互行为,该多个待定数据交互行为和第一数据交互行为可以为同一用户的行为。其次,获取多个待定数据交互行为中各个待定数据交互行为的会话的开始时间,具体地,可以将多个待定数据交互行为中各个待定数据交互行为的标识与会话表中的各个待定数据交互行为的标识相关联,得到各个待定数据交互行为对应的会话的开始时间。再次,将各个待定数据交互行为的会话的开始时间与第一会话的开始时间进行比较,得到第二会话的开始时间,第二会话的开始时间为各个待定数据交互行为的会话的开始时间中与第一会话的开始时间的差值最小的开始时间,第二会话的开始时间可以是大于第一会话的开始时间,但是小于第三会话的开始时间的会话开始时间,第二会话的开始时间对应的第二会话中产生的待定数据交互行为为第二数据交互行为。例如,会话列表中用户A的会话包括会话1、会话2、会话3、会话4……会话m……会话n……等,会话n为本次购买对应的会话(第二会话),会话m为上次购买对应的会话(第一会话),其中,会话m和会话n之间的会话均为产生购买行为。然后,根据第二数据交互行为的标识查找预设数据交互表,得到第二会话的次序。
可选地,在获取第一历史行为对应的操作的次序之前,该数据处理方法还可以包括:
首先,加载多个会话,其中,可以从任意地方加载多个会话,例如,可以从互联网中加载会话以更新会话表。接着,调用会话分组函数对多个会话按照用户标识进行分组,得到第一用户会话组,其中,用户可以包括一个或者多个用户,例如,该用户可以包括第一用户。具体地,可以是SQLserver内置的Row_Number会话分组函数按照用户的标识对用户的会话进行分组,即,相同用户的所有会话在一个会话组中,不同的用户的会话在不同的会话组中。其次,按照时间顺序对第一用户会话组中的多个会话进行排序,得到会话序列。再次,从会话序列中获取第一会话的排序。然后,将第一会话的排序作为第一会话的次序。
优选地,在将第一会话的排序作为第一会话的次序之前,该数据处理方法还可以包括:首先,从用户表中获取第一用户的累积会话数,其中,需要说明的是,所有用户的累积会话数的初始值均默认为0,并且所有用户基于其用户标识与会话累积数的对应关系存储在用户表中。然后,根据将第一会话的排序作为第一会话的次序和第一用户的累积会话数进行计算,得到新的第一会话的排序。这样,将第一会话的排序作为第一会话的次序包括:将新的第一会话的排序作为第一会话的次序。
通过本发明实施例,采用建立用户表、会话表、预设数据交互表,并且用户表中至少包括用户标识列和会话累积数了,会话表中至少包括用户标识列、会话标识列、会话开始时间列、数据交互表(如可以是商户订单表)至少包括用户标识列、订单标识列、会话标识列和派生列——会话次序列,其中,上述三个表均为数据库表,他们通过相应的标识列相互关联,从而可以进行基于索引的查询,最终得到两次历史行为之间的操作数信息,避免了多次查找大数据会话表的麻烦,进而达到了快速分析用户的历史行为信息的效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用于计算机历史行为分析的数据处理方法,其特征在于,所述计算机历史行为包括对应于不同时间的第一历史行为和第二历史行为,所述数据处理方法包括:
获取所述第一历史行为对应的操作的次序;
获取所述第二历史行为对应的操作的次序;以及
根据所述第一历史行为对应的操作的次序和所述第二历史行为对应的操作的次序进行计算,得到所述第一历史行为和所述第二历史行为之间的操作数。
2.根据权利要求1所述的数据处理方法,其特征在于,所述第一历史行为包括第一数据交互行为,所述第二历史行为包括第二数据交互行为,所述第一历史行为对应的操作的次序包括第一会话的次序,所述第二历史行为对应的操作的次序包括第二会话的次序,
获取所述第一历史行为对应的操作的次序包括:获取所述第一数据交互行为对应的所述第一会话的次序,
获取所述第二历史行为对应的操作的次序包括:获取所述第二数据交互行为对应的所述第二会话的次序,
根据所述第一历史行为对应的操作的次序和所述第二历史行为对应的操作的次序进行计算,得到所述第一历史行为和所述第二历史行为之间的操作数包括:根据所述第一会话的次序和所述第二会话的次序进行计算,得到所述第一数据交互行为和所述第二数据交互行为之间的会话数。
3.根据权利要求2所述的数据处理方法,其特征在于,
在获取所述第二数据交互行为对应的所述第二会话的次序之前,所述数据处理方法还包括:查找预设数据交互表,得到所述第一会话的标识;基于所述第一会话的标识查找会话表,得到所述第一会话的开始时间,
获取所述第二数据交互行为对应的所述第二会话的次序包括:查找所述预设数据交互表,得到多个待定数据交互行为,所述多个待定数据交互行为和所述第一数据交互行为为同一用户的行为;获取所述多个待定数据交互行为中各个所述待定数据交互行为的会话的开始时间;将各个所述待定数据交互行为的会话的开始时间与所述第一会话的开始时间进行比较,得到所述第二会话的开始时间,所述第二会话的开始时间为各个所述待定数据交互行为的会话的开始时间中与所述第一会话的开始时间的差值最小的开始时间,其中,所述第二会话的开始时间对应的所述第二会话中产生的所述待定数据交互行为为所述第二数据交互行为;根据所述第二数据交互行为的标识查找所述预设数据交互表,得到所述第二会话的次序。
4.根据权利要求2所述的数据处理方法,其特征在于,在获取所述第一历史行为对应的操作的次序之前,所述数据处理方法还包括:
加载多个所述会话;
调用会话分组函数对多个所述会话按照用户标识进行分组,得到第一用户会话组,其中,所述用户包括所述第一用户;
按照时间顺序对所述第一用户会话组中的多个会话进行排序,得到会话序列;
从所述会话序列中获取所述第一会话的排序;以及
将所述第一会话的排序作为所述第一会话的次序。
5.根据权利要求4所述的数据处理方法,其特征在于,
在将所述第一会话的排序作为所述第一会话的次序之前,所述数据处理方法还包括:从用户表中获取所述第一用户的累积会话数;根据将所述第一会话的排序作为所述第一会话的次序和所述第一用户的累积会话数进行计算,得到新的所述第一会话的排序,
将所述第一会话的排序作为所述第一会话的次序包括:将新的所述第一会话的排序作为所述第一会话的次序。
6.一种用于计算机历史行为分析的数据处理装置,其特征在于,所述计算机历史行为包括对应于不同时间的第一历史行为和第二历史行为,所述数据处理装置包括:
第一获取单元,用于获取所述第一历史行为对应的操作的次序;
第二获取单元,用于获取所述第二历史行为对应的操作的次序;以及
第一计算单元,用于根据所述第一历史行为对应的操作的次序和所述第二历史行为对应的操作的次序进行计算,得到所述第一历史行为和所述第二历史行为之间的操作数。
7.根据权利要求6所述的数据处理装置,其特征在于,所述第一历史行为包括第一数据交互行为,所述第二历史行为包括第二数据交互行为,所述第一历史行为对应的操作的次序包括第一会话的次序,所述第二历史行为对应的操作的次序包括第二会话的次序,
所述第一获取单元还用于获取所述第一数据交互行为对应的所述第一会话的次序;
所述第二获取单元还用于获取所述第二数据交互行为对应的所述第二会话的次序;以及
所述第一计算单元还用于根据所述第一会话的次序和所述第二会话的次序进行计算,得到所述第一数据交互行为和所述第二数据交互行为之间的会话数。
8.根据权利要求7所述的数据处理装置,其特征在于,还包括:
第一查找单元,用于在获取所述第二数据交互行为对应的所述第二会话的次序之前,查找预设数据交互表,得到所述第一会话的标识;第二查找单元,用于基于所述第一会话的标识查找会话表,得到所述第一会话的开始时间,
所述第二获取单元包括:第一查找模块,用于查找所述预设数据交互表,得到多个待定数据交互行为,所述多个待定数据交互行为和所述第一数据交互行为为同一用户的行为;获取模块,用于获取所述多个待定数据交互行为中各个所述待定数据交互行为的会话的开始时间;比较模块,用于将各个所述待定数据交互行为的会话的开始时间与所述第一会话的开始时间进行比较,得到所述第二会话的开始时间,所述第二会话的开始时间为各个所述待定数据交互行为的会话的开始时间中与所述第一会话的开始时间的差值最小的开始时间,其中,所述第二会话的开始时间对应的所述第二会话中产生的所述待定数据交互行为为所述第二数据交互行为;第二查找模块,用于根据所述第二数据交互行为的标识查找所述预设数据交互表,得到所述第二会话的次序。
9.根据权利要求7所述的数据处理装置,其特征在于,还包括:
加载单元,用于在获取所述第一历史行为对应的操作的次序之前,加载多个所述会话;
调用单元,用于调用会话分组函数对多个所述会话按照用户标识进行分组,得到第一用户会话组,其中,所述用户包括所述第一用户;
排序单元,用于按照时间顺序对所述第一用户会话组中的多个会话进行排序,得到会话序列;
第三获取单元,用于从所述会话序列中获取所述第一会话的排序;以及
确定单元,用于将所述第一会话的排序作为所述第一会话的次序。
10.根据权利要求9所述的数据处理装置,其特征在于,还包括:
第四获取单元,用于在将所述第一会话的排序作为所述第一会话的次序之前,从用户表中获取所述第一用户的累积会话数;
第二计算单元,用于根据将所述第一会话的排序作为所述第一会话的次序和所述第一用户的累积会话数进行计算,得到新的所述第一会话的排序;以及
所述确定单元还用于将新的所述第一会话的排序作为所述第一会话的次序。
CN201410086090.0A 2014-03-10 2014-03-10 用于计算机历史行为分析的数据处理方法和装置 Active CN103823891B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410086090.0A CN103823891B (zh) 2014-03-10 2014-03-10 用于计算机历史行为分析的数据处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410086090.0A CN103823891B (zh) 2014-03-10 2014-03-10 用于计算机历史行为分析的数据处理方法和装置

Publications (2)

Publication Number Publication Date
CN103823891A true CN103823891A (zh) 2014-05-28
CN103823891B CN103823891B (zh) 2017-03-22

Family

ID=50758955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410086090.0A Active CN103823891B (zh) 2014-03-10 2014-03-10 用于计算机历史行为分析的数据处理方法和装置

Country Status (1)

Country Link
CN (1) CN103823891B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484357A (zh) * 2014-12-01 2015-04-01 北京国双科技有限公司 数据处理方法及装置和访问频次信息处理方法及装置
CN104572673A (zh) * 2013-10-15 2015-04-29 威廉·肖 信息查询方法和装置
CN113283713A (zh) * 2021-05-08 2021-08-20 上海华兴数字科技有限公司 一种工程机械操作手的操控行为分析方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2642412A1 (en) * 2012-03-20 2013-09-25 Samsung Electronics Co., Ltd System and method for managing browsing histories of web browser
CN103390067A (zh) * 2013-08-15 2013-11-13 北京国双科技有限公司 用于互联网实体分析的数据处理方法和装置
CN103593441A (zh) * 2013-11-15 2014-02-19 北京国双科技有限公司 获取会话的最大转化步数的方法及装置
CN103617198A (zh) * 2013-11-14 2014-03-05 北京国双科技有限公司 页面归并方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2642412A1 (en) * 2012-03-20 2013-09-25 Samsung Electronics Co., Ltd System and method for managing browsing histories of web browser
CN103390067A (zh) * 2013-08-15 2013-11-13 北京国双科技有限公司 用于互联网实体分析的数据处理方法和装置
CN103617198A (zh) * 2013-11-14 2014-03-05 北京国双科技有限公司 页面归并方法及装置
CN103593441A (zh) * 2013-11-15 2014-02-19 北京国双科技有限公司 获取会话的最大转化步数的方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
一种基于web服务的网页智能推荐方法;周祥,郑应平,王令群;《计算机应用研究》;20060930;第23卷(第9期);46-48 *
一种基于web服务的网页智能推荐方法;周祥,郑应平,王令群;《计算机应用研究》;20060930;第23卷(第9期);第46-48页 *
周祥,郑应平,王令群: "一种基于web服务的网页智能推荐方法", 《计算机应用研究》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572673A (zh) * 2013-10-15 2015-04-29 威廉·肖 信息查询方法和装置
CN104484357A (zh) * 2014-12-01 2015-04-01 北京国双科技有限公司 数据处理方法及装置和访问频次信息处理方法及装置
CN113283713A (zh) * 2021-05-08 2021-08-20 上海华兴数字科技有限公司 一种工程机械操作手的操控行为分析方法及系统

Also Published As

Publication number Publication date
CN103823891B (zh) 2017-03-22

Similar Documents

Publication Publication Date Title
CN109409043B (zh) 应用系统的登录方法、终端设备及介质
CN105335409B (zh) 一种目标用户的确定方法、设备和网络服务器
CN110609937A (zh) 一种爬虫识别方法及装置
CN106503224B (zh) 一种根据关键词推荐应用的方法及装置
US20160034968A1 (en) Method and device for determining target user, and network server
CN105989373B (zh) 利用训练模型实现的获取设备指纹方法及装置
CN104753909B (zh) 信息更新后的鉴权方法、装置及系统
CN105677931A (zh) 信息搜索方法和装置
CN105812353B (zh) 终端识别方法和装置
CN105550175A (zh) 恶意账户识别方法及装置
CN104750760A (zh) 一种推荐应用软件的实现方法及装置
CN104765746A (zh) 用于移动通讯终端浏览器的数据处理方法和装置
CN103605848A (zh) 路径分析方法和装置
CN104156232A (zh) 在线性页面结构下用于页面非线性跳转的方法和设备
CN107807935B (zh) 应用推荐方法及装置
CN107483381A (zh) 关联账户的监控方法及装置
CN103823891A (zh) 用于计算机历史行为分析的数据处理方法和装置
CN108040117A (zh) 信息推送方法及装置
CN104268293A (zh) 数据库中的不可累加指标处理方法和装置
CN107294905A (zh) 一种识别用户的方法及装置
CN102937973A (zh) 一种生成用于信息呈现的呈现配置信息的方法和设备
CN104765747A (zh) 网页处理方法及装置
CN107483565A (zh) 一种服务后台识别方法、代理服务器及计算机存储介质
CN107368923A (zh) 景点热度预测方法及装置
CN106779899A (zh) 恶意订单识别方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Data processing method and device for computer historical behavior analysis

Effective date of registration: 20190531

Granted publication date: 20170322

Pledgee: Shenzhen Black Horse World Investment Consulting Co., Ltd.

Pledgor: Beijing Guoshuang Technology Co.,Ltd.

Registration number: 2019990000503

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: Beijing Guoshuang Technology Co.,Ltd.