发明内容
本发明的主要目的在于提供一种用于计算机历史行为分析的数据处理方法和装置,以解决相关技术中历史行为分析的数据处理的处理效率比较低的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种用于计算机历史行为分析的数据处理方法。该方法包括:获取第一历史行为对应的操作的次序;获取第二历史行为对应的操作的次序;以及根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数,其中,计算机历史行为包括对应于不同时间的第一历史行为和第二历史行为。
进一步地,第一历史行为包括第一数据交互行为,第二历史行为包括第二数据交互行为,第一历史行为对应的操作的次序包括第一会话的次序,第二历史行为对应的操作的次序包括第二会话的次序,获取第一历史行为对应的操作的次序包括:获取第一数据交互行为对应的第一会话的次序,获取第二历史行为对应的操作的次序包括:获取第二数据交互行为对应的第二会话的次序,根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数包括:根据第一会话的次序和第二会话的次序进行计算,得到第一数据交互行为和第二数据交互行为之间的会话数。
进一步地,在获取第二数据交互行为对应的第二会话的次序之前,该数据处理方法还包括:查找预设数据交互表,得到第一会话的标识;基于第一会话的标识查找会话表,得到第一会话的开始时间,获取第二数据交互行为对应的第二会话的次序包括:查找预设数据交互表,得到多个待定数据交互行为,多个待定数据交互行为和第一数据交互行为为同一用户的行为;获取多个待定数据交互行为中各个待定数据交互行为的会话的开始时间;将各个待定数据交互行为的会话的开始时间与第一会话的开始时间进行比较,得到第二会话的开始时间,第二会话的开始时间为各个待定数据交互行为的会话的开始时间中与第一会话的开始时间的差值最小的开始时间,其中,第二会话的开始时间对应的第二会话中产生的待定数据交互行为为第二数据交互行为;根据第二数据交互行为的标识查找预设数据交互表,得到第二会话的次序。
进一步地,在获取第一历史行为对应的操作的次序之前,该数据处理方法还包括:加载多个会话;调用会话分组函数对多个会话按照用户标识进行分组,得到第一用户会话组,其中,用户包括第一用户;按照时间顺序对第一用户会话组中的多个会话进行排序,得到会话序列;从会话序列中获取第一会话的排序;以及将第一会话的排序作为第一会话的次序。
进一步地,在将第一会话的排序作为第一会话的次序之前,该数据处理方法还包括:从用户表中获取第一用户的累积会话数;根据将第一会话的排序作为第一会话的次序和第一用户的累积会话数进行计算,得到新的第一会话的排序,将第一会话的排序作为第一会话的次序包括:将新的第一会话的排序作为第一会话的次序。
为了实现上述目的,根据本发明的另一方面,提供了一种用于计算机历史行为分析的数据处理装置。该装置包括:第一获取单元,用于获取第一历史行为对应的操作的次序;第二获取单元,用于获取第二历史行为对应的操作的次序;以及第一计算单元,用于根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数,其中,计算机历史行为包括对应于不同时间的第一历史行为和第二历史行为。
进一步地,第一历史行为包括第一数据交互行为,第二历史行为包括第二数据交互行为,第一历史行为对应的操作的次序包括第一会话的次序,第二历史行为对应的操作的次序包括第二会话的次序,第一获取单元还用于获取第一数据交互行为对应的第一会话的次序;第二获取单元还用于获取第二数据交互行为对应的第二会话的次序;以及第一计算单元还用于根据第一会话的次序和第二会话的次序进行计算,得到第一数据交互行为和第二数据交互行为之间的会话数。
进一步地,该数据处理装置还包括:第一查找单元,用于在获取第二数据交互行为对应的第二会话的次序之前,查找预设数据交互表,得到第一会话的标识;第二查找单元,用于基于第一会话的标识查找会话表,得到第一会话的开始时间,第二获取单元包括:第一查找模块,用于查找预设数据交互表,得到多个待定数据交互行为,多个待定数据交互行为和第一数据交互行为为同一用户的行为;获取模块,用于获取多个待定数据交互行为中各个待定数据交互行为的会话的开始时间;比较模块,用于将各个待定数据交互行为的会话的开始时间与第一会话的开始时间进行比较,得到第二会话的开始时间,第二会话的开始时间为各个待定数据交互行为的会话的开始时间中与第一会话的开始时间的差值最小的开始时间,其中,第二会话的开始时间对应的第二会话中产生的待定数据交互行为为第二数据交互行为;第二查找模块,用于根据第二数据交互行为的标识查找预设数据交互表,得到第二会话的次序。
进一步地,该数据处理装置还包括:加载单元,用于在获取第一历史行为对应的操作的次序之前,加载多个会话;调用单元,用于调用会话分组函数对多个会话按照用户标识进行分组,得到第一用户会话组,其中,用户包括第一用户;排序单元,用于按照时间顺序对第一用户会话组中的多个会话进行排序,得到会话序列;第三获取单元,用于从会话序列中获取第一会话的排序;以及确定单元,用于将第一会话的排序作为第一会话的次序。
进一步地,该数据处理装置还包括:第四获取单元,用于在将第一会话的排序作为第一会话的次序之前,从用户表中获取第一用户的累积会话数;第二计算单元,用于根据将第一会话的排序作为第一会话的次序和第一用户的累积会话数进行计算,得到新的第一会话的排序;以及确定单元还用于将新的第一会话的排序作为第一会话的次序。
通过本发明,采用获取第一历史行为对应的操作的次序;获取第二历史行为对应的操作的次序;以及根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数,其中,计算机历史行为包括对应于不同时间的第一历史行为和第二历史行为,解决了相关技术中历史行为分析的数据处理的处理效率比较低的问题,进而达到了快速分析用户的历史行为信息的效果。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本领域的技术人员更好的理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,在本领域普通技术人员没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
根据本发明的实施例,提供了一种用于计算机历史行为分析的数据处理装置,该用于计算机历史行为分析的数据处理装置用于快速分析用户的历史行为信息。
图1是根据本发明实施例的用于计算机历史行为分析的数据处理装置的示意图。
如图1所示,该装置包括:第一获取单元10,第二获取单元20和第一计算单元30。
需要说明的是,计算机历史行为可以包括对应于不同时间的第一历史行为和第二历史行为。其中,计算机历史行为可以是联网的或者非联网的计算机历史行为,第一历史行为可以是第一时刻的历史行为,第二历史行为可以是第二时刻的历史行为。当计算机历史行为为联网的历史行为时,其可以是包括用户的数据交互行为等,例如,其可以是用户的网上购物、选课、购买保险、试驾或者登录以及注册银行账户等行为。第一历史行为和第二历史行为可以分别是第一次购物时下订单的行为和第二次购物时下订单的行为。
第一获取单元10用于获取第一历史行为对应的操作的次序。
由于产生第一历史行为的操作的原因可以是用户访问网站、或者用户正开启一次会话、或者用户正在进行网站的页面浏览等,因此第一历史行为对应的操作的次序可以是第一历史行为对应的第几次访问网站(访问次序)、或者正开启第几次会话(会话次序)、或者正在进行第几个页面浏览(页面浏览次序)等。
其中,第一历史行为及其对应的操作的次序可以基于两者之间的对应关系预先存储在数据库表中,并且第一历史行为可以通过唯一的字段进行标识,该标识可以为第一历史行为标识。这样,可以将第一历史行为标识和其对应对的操作次序分别存储在数据库表的相应列中。
第二获取单元20用于获取第二历史行为对应的操作的次序。
基于上述阐述,第二历史行为对应的操作的次序可以是第二历史行为对应的第几次访问网站(访问次序)、或者正开启第几次会话(会话次序)、或者正在进行第几个页面浏览(页面浏览次序)等。
其中,第二历史行为及其对应的操作的次序可以基于两者之间的对应关系预先存储在数据库表中,并且第二历史行为也可以通过唯一的字段进行标识,该标识可以为第二历史行为标识。这样,可以将第二历史行为标识和其对应对的操作次序分别存储在数据库表的相应列中。
第一计算单元30用于根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数。
具体地,第一历史行为对应的操作的次序可以是第一历史行为对应的会话次序,第二历史行为对应的操作的次序可以是第二历史行为对应的会话次序,这样,可以计算第一历史行为对应的会话次序和第二历史行为对应的会话次序之间的会话数,该会话数可以是上述两个历史行为分别对应的会话次序的差值的绝对值。例如,第一历史行为对应着第N次会话,第二历史行为对应着第M次会话,这样,第一历史行为和第二历史行为之间间隔的会话数为(N-M)的绝对值。
进一步地,根据同样的原理,可以得到第一历史行为和第二历史行为之间间隔的时间长度。
通过本发明实施例,由于可以直接获取预先存储的各个历史行为的操作次序,而无需首先查找大数据会话表中各个历史行为对应的操作的时间,再根据各个历史行为对应的操作的时间统计任意两个历史行为之间的操作的个数(操作数),因此可以节约得到历史行为之间操作数的时间,达到快速分析用户的历史行为信息和提高数据处理的效率的效果。
需要说明的是,第一历史行为可以包括第一数据交互行为,第二历史行为可以包括第二数据交互行为,第一历史行为对应的操作的次序可以包括第一会话的次序,第二历史行为对应的操作的次序可以包括第二会话的次序。其中,第一数据交互行为可以是用户网购时下第一订单的行为,第二数据交互行为可以是该用户网购时下第二订单的行为,以下本发明以数据交互行为为网购时下订单的行为进行阐述。
第一获取单元10还用于获取第一数据交互行为对应的第一会话的次序。
前述实施例中的获取第一历史行为对应的操作的次序可以包括:获取第一数据交互行为对应的第一会话的次序。
其中,第一数据交互行为及其对应的第一会话的次序可以基于这两者之间的对应关系预先存储在预设数据交互表中,并且第一数据交互行为可以通过唯一的字段进行标识,该标识可以为第一数据交互行为标识。这样,可以将第一数据交互行为标识和其对应对的第一会话的次序分别存储在数据交互表的相应列中,其中,数据交互表可以为数据库表。
第二获取单元20还用于获取第二数据交互行为对应的第二会话的次序。
基于上述阐述,前述实施例中的获取第二历史行为对应的操作的次序可以包括:获取第二数据交互行为对应的第二会话的次序。
其中,第二数据交互行为及其对应的第二会话的次序可以基于这两者之间的对应关系预先存储在预设数据交互表中,并且第二数据交互行为可以通过唯一的字段进行标识,该标识可以为第二数据交互行为标识。这样,可以将第二数据交互行为标识和其对应对的第二会话的次序分别存储在数据交互表的相应列中,其中,数据交互表可以为数据库表。
需要说明的是,第一数据交互行为和第二数据交互行为可以是同一用户在不同时间的两次数据交互行为,例如,该两次数据交互行为可以分别是用户在第一时间浏览网站时下第一订单的行为和该用户在第二时间浏览网站时下第二订单的行为。这样,根据两次下订单的行为分别对应的会话次序,可以分析该用户在两次下订单的行为(如,本次购买和上次购买)之间的所发生的会话数,进而可以分析该用户平均每下一次订单需要经过的会话次数信息,达到为商家提供准确的分析数据的目的。
第一计算单元30还用于根据第一会话的次序和第二会话的次序进行计算,得到第一数据交互行为和第二数据交互行为之间的会话数。
基于上述阐述,前述实施例中的根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数可以包括:根据第一会话的次序和第二会话的次序进行计算,得到第一数据交互行为和第二数据交互行为之间的会话数。该会话数可以是上述两个数据交互行为分别对应的第一会话的次序和第二会话的次序的差值的绝对值。例如,第一数据交互行为对应着第X次会话,第二数据交互行为对应着第Y次会话,这样,该两次数据交互行为之间间隔的会话数为(X-Y)的绝对值。
其中,在本发明实施例中,可以基于同样的原理分析任意两次数据交互行为之间所发生的页面浏览数信息,在此不再赘述。
通过本发明实施例,由于可以直接获取预先存储的各个数据交互行为的会话次序,而无需首先查找大数据会话表中各个数据交互行对应的会话的时间,再根据各个数据交互行为对应的会话的时间统计任意两个数据交互行为之间的会话的个数(会话数),因此可以节约得到数据交互行为之间会话数的时间,达到快速分析用户的数据交互行为信息和提高数据处理的效率的效果。
可选地,该数据处理装置还可以包括:第一查找单元和第二查找单元。
第一查找单元用于在获取第二数据交互行为对应的第二会话的次序之前,查找预设数据交互表,得到第一会话的标识,其中,第一会话的标识存储在预设数据交互表的相应列中。第二查找单元用于基于第一会话的标识查找会话表,得到第一会话的开始时间。
这样,第二获取单元20可以包括:第一查找模块、获取模块、比较模块和第二查找模块。
第一查找模块用于查找预设数据交互表,得到多个待定数据交互行为,该多个待定数据交互行为和第一数据交互行为可以为同一用户的行为。获取模块用于获取多个待定数据交互行为中各个待定数据交互行为的会话的开始时间,具体地,可以将多个待定数据交互行为中各个待定数据交互行为的标识与会话表中的各个待定数据交互行为的标识相关联,得到各个待定数据交互行为对应的会话的开始时间。比较模块用于将各个待定数据交互行为的会话的开始时间与第一会话的开始时间进行比较,得到第二会话的开始时间,第二会话的开始时间为各个待定数据交互行为的会话的开始时间中与第一会话的开始时间的差值最小的开始时间,第二会话的开始时间可以是大于第一会话的开始时间,但是小于第三会话的开始时间的会话开始时间,第二会话的开始时间对应的第二会话中产生的待定数据交互行为为第二数据交互行为。例如,会话列表中用户A的会话包括会话1、会话2、会话3、会话4……会话m……会话n……等,会话n为本次购买对应的会话(第二会话),会话m为上次购买对应的会话(第一会话),其中,会话m和会话n之间的会话均为产生购买行为。第二查找模块用于根据第二数据交互行为的标识查找预设数据交互表,得到第二会话的次序。
可选地,在获取第一历史行为对应的操作的次序之前,该数据处理装置还可以包括:加载单元、调用单元、排序单元、第三获取单元和确定单元。
加载单元用于加载多个会话,其中,可以从任意地方加载多个会话,例如,可以从互联网中加载会话以更新会话表。调用单元用于调用会话分组函数对多个会话按照用户标识进行分组,得到第一用户会话组,其中,用户可以包括一个或者多个用户,例如,该用户可以包括第一用户。具体地,可以是SQLserver内置的Row_Number会话分组函数按照用户的标识对用户的会话进行分组,即,相同用户的所有会话在一个会话组中,不同的用户的会话在不同的会话组中。排序单元用于按照时间顺序对第一用户会话组中的多个会话进行排序,得到会话序列。第三获取单元用于从会话序列中获取第一会话的排序。确定单元用于将第一会话的排序作为第一会话的次序。
优选地,该数据处理装置还可以包括:第四获取单元和第二计算单元。
第四获取单元用于在将第一会话的排序作为第一会话的次序之前,从用户表中获取第一用户的累积会话数,其中,需要说明的是,所有用户的累积会话数的初始值均默认为0,并且所有用户基于其用户标识与会话累积数的对应关系存储在用户表中。第二计算单元用于根据将第一会话的排序作为第一会话的次序和第一用户的累积会话数进行计算,得到新的第一会话的排序。这样,确定单元还用于将新的第一会话的排序作为第一会话的次序。
通过本发明实施例,采用建立用户表、会话表、预设数据交互表,并且用户表中至少包括用户标识列和会话累积数了,会话表中至少包括用户标识列、会话标识列、会话开始时间列、数据交互表(如可以是商户订单表)至少包括用户标识列、订单标识列、会话标识列和派生列——会话次序列,其中,上述三个表均为数据库表,他们通过相应的标识列相互关联,从而可以进行基于索引的查询,最终得到两次历史行为之间的操作数信息,避免了多次查找大数据会话表的麻烦,进而达到了快速分析用户的历史行为信息的效果。
根据本发明的实施例,提供了一种用于计算机历史行为分析的数据处理方法,该用于计算机历史行为分析的数据处理方法用于快速分析用户的历史行为信息。该用于计算机历史行为分析的数据处理方法可以运行在计算机处理设备上。需要说明的是,本发明实施例所提供的用于计算机历史行为分析的数据处理方法可以通过本发明实施例的用于计算机历史行为分析的数据处理装置来执行,本发明实施例的用于计算机历史行为分析的数据处理装置也可以用于执行本发明实施例的用于计算机历史行为分析的数据处理方法。
图2是根据本发明实施例的用于计算机历史行为分析的数据处理方法的流程图。
如图2所示,该方法包括如下的步骤S202至步骤S206:
需要说明的是,计算机历史行为可以包括对应于不同时间的第一历史行为和第二历史行为。其中,计算机历史行为可以是联网的或者非联网的计算机历史行为,第一历史行为可以是第一时刻的历史行为,第二历史行为可以是第二时刻的历史行为。当计算机历史行为为联网的历史行为时,其可以是包括用户的数据交互行为等,例如,其可以是用户的网上购物、选课、购买保险、试驾或者登录以及注册银行账户等行为。第一历史行为和第二历史行为可以分别是第一次购物时下订单的行为和第二次购物时下订单的行为。
步骤S202,获取第一历史行为对应的操作的次序。
由于产生第一历史行为的操作的原因可以是用户访问网站、或者用户正开启一次会话、或者用户正在进行网站的页面浏览等,因此第一历史行为对应的操作的次序可以是第一历史行为对应的第几次访问网站(访问次序)、或者正开启第几次会话(会话次序)、或者正在进行第几个页面浏览(页面浏览次序)等。
其中,第一历史行为及其对应的操作的次序可以基于两者之间的对应关系预先存储在数据库表中,并且第一历史行为可以通过唯一的字段进行标识,该标识可以为第一历史行为标识。这样,可以将第一历史行为标识和其对应对的操作次序分别存储在数据库表的相应列中。
步骤S204,获取第二历史行为对应的操作的次序。
基于上述阐述,第二历史行为对应的操作的次序可以是第二历史行为对应的第几次访问网站(访问次序)、或者正开启第几次会话(会话次序)、或者正在进行第几个页面浏览(页面浏览次序)等。
其中,第二历史行为及其对应的操作的次序可以基于两者之间的对应关系预先存储在数据库表中,并且第二历史行为也可以通过唯一的字段进行标识,该标识可以为第二历史行为标识。这样,可以将第二历史行为标识和其对应对的操作次序分别存储在数据库表的相应列中。
步骤S206,根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数。
具体地,第一历史行为对应的操作的次序可以是第一历史行为对应的会话次序,第二历史行为对应的操作的次序可以是第二历史行为对应的会话次序,这样,可以计算第一历史行为对应的会话次序和第二历史行为对应的会话次序之间的会话数,该会话数可以是上述两个历史行为分别对应的会话次序的差值的绝对值。例如,第一历史行为对应着第N次会话,第二历史行为对应着第M次会话,这样,第一历史行为和第二历史行为之间间隔的会话数为(N-M)的绝对值。
进一步地,根据同样的原理,可以得到第一历史行为和第二历史行为之间间隔的时间长度。
通过本发明实施例,由于可以直接获取预先存储的各个历史行为的操作次序,而无需首先查找大数据会话表中各个历史行为对应的操作的时间,再根据各个历史行为对应的操作的时间统计任意两个历史行为之间的操作的个数(操作数),因此可以节约得到历史行为之间操作数的时间,达到快速分析用户的历史行为信息和提高数据处理的效率的效果。
如图3所示,该用于计算机历史行为分析的数据处理方法包括如下的步骤S302至步骤S306,该实施例可以作为图2所示实施例的优选实施方式。
需要说明的是,第一历史行为可以包括第一数据交互行为,第二历史行为可以包括第二数据交互行为,第一历史行为对应的操作的次序可以包括第一会话的次序,第二历史行为对应的操作的次序可以包括第二会话的次序。其中,第一数据交互行为可以是用户网购时下第一订单的行为,第二数据交互行为可以是该用户网购时下第二订单的行为,以下本发明以数据交互行为为网购时下订单的行为进行阐述。
步骤S302,获取第一数据交互行为对应的第一会话的次序。
前述实施例中的获取第一历史行为对应的操作的次序可以包括:获取第一数据交互行为对应的第一会话的次序。
其中,第一数据交互行为及其对应的第一会话的次序可以基于这两者之间的对应关系预先存储在预设数据交互表中,并且第一数据交互行为可以通过唯一的字段进行标识,该标识可以为第一数据交互行为标识。这样,可以将第一数据交互行为标识和其对应对的第一会话的次序分别存储在数据交互表的相应列中,其中,数据交互表可以为数据库表。
步骤S304,获取第二数据交互行为对应的第二会话的次序。
基于上述阐述,前述实施例中的获取第二历史行为对应的操作的次序可以包括:获取第二数据交互行为对应的第二会话的次序。
其中,第二数据交互行为及其对应的第二会话的次序可以基于这两者之间的对应关系预先存储在预设数据交互表中,并且第二数据交互行为可以通过唯一的字段进行标识,该标识可以为第二数据交互行为标识。这样,可以将第二数据交互行为标识和其对应对的第二会话的次序分别存储在数据交互表的相应列中,其中,数据交互表可以为数据库表。
需要说明的是,第一数据交互行为和第二数据交互行为可以是同一用户在不同时间的两次数据交互行为,例如,该两次数据交互行为可以分别是用户在第一时间浏览网站时下第一订单的行为和该用户在第二时间浏览网站时下第二订单的行为。这样,根据两次下订单的行为分别对应的会话次序,可以分析该用户在两次下订单的行为(如,本次购买和上次购买)之间的所发生的会话数,进而可以分析该用户平均每下一次订单需要经过的会话次数信息,达到为商家提供准确的分析数据的目的。
步骤S306,根据第一会话的次序和第二会话的次序进行计算,得到第一数据交互行为和第二数据交互行为之间的会话数。
基于上述阐述,前述实施例中的根据第一历史行为对应的操作的次序和第二历史行为对应的操作的次序进行计算,得到第一历史行为和第二历史行为之间的操作数可以包括:根据第一会话的次序和第二会话的次序进行计算,得到第一数据交互行为和第二数据交互行为之间的会话数。该会话数可以是上述两个数据交互行为分别对应的第一会话的次序和第二会话的次序的差值的绝对值。例如,第一数据交互行为对应着第X次会话,第二数据交互行为对应着第Y次会话,这样,该两次数据交互行为之间间隔的会话数为(X-Y)的绝对值。
其中,在本发明实施例中,可以基于同样的原理分析任意两次数据交互行为之间所发生的页面浏览数信息,在此不再赘述。
通过本发明实施例,由于可以直接获取预先存储的各个数据交互行为的会话次序,而无需首先查找大数据会话表中各个数据交互行对应的会话的时间,再根据各个数据交互行为对应的会话的时间统计任意两个数据交互行为之间的会话的个数(会话数),因此可以节约得到数据交互行为之间会话数的时间,达到快速分析用户的数据交互行为信息和提高数据处理的效率的效果。
可选地,在获取第二数据交互行为对应的第二会话的次序之前,该数据处理方法还可以包括:首先,查找预设数据交互表,得到第一会话的标识,其中,第一会话的标识存储在预设数据交互表的相应列中。然后,基于第一会话的标识查找会话表,得到第一会话的开始时间。
这样,获取第二数据交互行为对应的第二会话的次序可以包括:
首先,查找预设数据交互表,得到多个待定数据交互行为,该多个待定数据交互行为和第一数据交互行为可以为同一用户的行为。其次,获取多个待定数据交互行为中各个待定数据交互行为的会话的开始时间,具体地,可以将多个待定数据交互行为中各个待定数据交互行为的标识与会话表中的各个待定数据交互行为的标识相关联,得到各个待定数据交互行为对应的会话的开始时间。再次,将各个待定数据交互行为的会话的开始时间与第一会话的开始时间进行比较,得到第二会话的开始时间,第二会话的开始时间为各个待定数据交互行为的会话的开始时间中与第一会话的开始时间的差值最小的开始时间,第二会话的开始时间可以是大于第一会话的开始时间,但是小于第三会话的开始时间的会话开始时间,第二会话的开始时间对应的第二会话中产生的待定数据交互行为为第二数据交互行为。例如,会话列表中用户A的会话包括会话1、会话2、会话3、会话4……会话m……会话n……等,会话n为本次购买对应的会话(第二会话),会话m为上次购买对应的会话(第一会话),其中,会话m和会话n之间的会话均为产生购买行为。然后,根据第二数据交互行为的标识查找预设数据交互表,得到第二会话的次序。
可选地,在获取第一历史行为对应的操作的次序之前,该数据处理方法还可以包括:
首先,加载多个会话,其中,可以从任意地方加载多个会话,例如,可以从互联网中加载会话以更新会话表。接着,调用会话分组函数对多个会话按照用户标识进行分组,得到第一用户会话组,其中,用户可以包括一个或者多个用户,例如,该用户可以包括第一用户。具体地,可以是SQLserver内置的Row_Number会话分组函数按照用户的标识对用户的会话进行分组,即,相同用户的所有会话在一个会话组中,不同的用户的会话在不同的会话组中。其次,按照时间顺序对第一用户会话组中的多个会话进行排序,得到会话序列。再次,从会话序列中获取第一会话的排序。然后,将第一会话的排序作为第一会话的次序。
优选地,在将第一会话的排序作为第一会话的次序之前,该数据处理方法还可以包括:首先,从用户表中获取第一用户的累积会话数,其中,需要说明的是,所有用户的累积会话数的初始值均默认为0,并且所有用户基于其用户标识与会话累积数的对应关系存储在用户表中。然后,根据将第一会话的排序作为第一会话的次序和第一用户的累积会话数进行计算,得到新的第一会话的排序。这样,将第一会话的排序作为第一会话的次序包括:将新的第一会话的排序作为第一会话的次序。
通过本发明实施例,采用建立用户表、会话表、预设数据交互表,并且用户表中至少包括用户标识列和会话累积数了,会话表中至少包括用户标识列、会话标识列、会话开始时间列、数据交互表(如可以是商户订单表)至少包括用户标识列、订单标识列、会话标识列和派生列——会话次序列,其中,上述三个表均为数据库表,他们通过相应的标识列相互关联,从而可以进行基于索引的查询,最终得到两次历史行为之间的操作数信息,避免了多次查找大数据会话表的麻烦,进而达到了快速分析用户的历史行为信息的效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。