CN109213906A - 会话时长计算方法、装置及系统 - Google Patents

会话时长计算方法、装置及系统 Download PDF

Info

Publication number
CN109213906A
CN109213906A CN201710526986.XA CN201710526986A CN109213906A CN 109213906 A CN109213906 A CN 109213906A CN 201710526986 A CN201710526986 A CN 201710526986A CN 109213906 A CN109213906 A CN 109213906A
Authority
CN
China
Prior art keywords
web page
page access
access behavior
session
last
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710526986.XA
Other languages
English (en)
Other versions
CN109213906B (zh
Inventor
陈熹荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201710526986.XA priority Critical patent/CN109213906B/zh
Publication of CN109213906A publication Critical patent/CN109213906A/zh
Application granted granted Critical
Publication of CN109213906B publication Critical patent/CN109213906B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种会话时长计算方法、装置及系统,通过获取目标会话,然后确定目标会话中末次网页访问行为的行为对象,并根据该末行为对象,确定目标会话的时长。可见,本方案考虑到末次网页访问行为的行为对象对目标会话时长的影响,如末次网页访问行为的行为对象为产生页面浏览量数据的行为对象,则确定末次网页访问行为的页面浏览时间,将该页面浏览时间计算进会话时长;当末次网页访问行为的行为对象为未产生页面浏览量数据的行为对象,则确定目标会话的时长为末次网页访问行为的开始时间‑初始网页访问行为的开始时间,无需获取末次网页访问行为的页面浏览时间,解决了现有技术中采用单一的会话时长计算方式导致的会话时长计算不准确的问题。

Description

会话时长计算方法、装置及系统
技术领域
本发明涉及数据处理技术领域,尤其涉及一种会话时长计算方法、装置及系统。
背景技术
随着科技的不断发展,用户能够通过访问网页来获取更多的信息,如浏览新闻、观看视频、在线游戏等等。网页后台服务器会根据用户访问网页的情况,实现对网页的设计调整,以便提高用户对该网页的访问频率。
目前,会话是网页分析的基础单位,其记录了用户访问网页的一组访问行为。当用户进行网页访问时,后台服务器会建立一个会话,并为该会话内包含的所有访问行为创建不同类型的行为对象,如PageViewObject(网页浏览)、MouseScrollObject(鼠标滚动)、MouseClickObject(鼠标点击)、电子订单(EcomObject)以及SiteSearchObject(站内搜索)等。
而,会话时长是指用户访问网页所持续的时间,是网页分析的重要指标。发明人发现,目前会话时长的计算是采用末次网页开启的时间减去初始网页开启的时间,假如,用户在10:00分第一次打开网页,在10:10分点击第二个网页,在10:30分点击了第三个网页,用户在浏览后,关闭网页,则此时,后台服务器记录的会话时长为30分钟(10:00-10:30)。然而,发明人发现,该方法计算得到的会话时长并不是实际的网页访问时间,如,并未包括最后一个网页的浏览时间。进而基于该方法获取的会话时间,会导致网页分析不准确,因此,如何提供一种会话时长计算方法、装置及系统,以提高网页分析的准确性,成为本领域技术人员亟待解决的一大技术问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的技术方案:
一种会话时长计算方法,包括:
获取目标会话,所述目标会话包括至少一个网页访问行为,且,所述网页访问行为按照时间顺序进行排序;
确定所述末次网页访问行为的行为对象,所述末次网页访问行为是所述目标会话中时间排序最后的所述网页访问行为;
根据所述末次网页访问行为的行为对象,确定所述目标会话的时长。
可选的,所述获取目标会话,包括:
获取预设时间内的用户访问数据;
按照预设会话切分规则,将所述用户访问数据切分成多个会话;
依次确定所述多个会话为所述目标会话。
可选的,所述根据所述末次网页访问行为的行为对象,确定所述目标会话的时长包括:
若所述末次网页访问行为的行为对象为产生页面浏览量数据的行为对象,则获取所述末次网页访问行为的页面浏览时间;
根据所述末次网页访问行为的页面浏览时间、所述目标会话中所述末次网页访问行为的开始时间以及所述目标会话中初始网页访问行为的开始时间确定所述目标会话的时长。
可选的,所述获取所述末次网页访问行为的页面浏览时间包括:
判断所述末次网页访问行为是否包括页面心跳包数据;
若包括,确定所述页面心跳包数据记录的时间与所述末次网页访问行为的开始时间的差值;
若所述差值为正,将所述差值作为所述末次网页访问行为的页面浏览时间。
可选的,所述获取所述末次网页访问行为的页面浏览时间还包括:
若所述差值为负,根据所述目标会话中所述末次网页访问行为的开始时间、所述目标会话中初始网页访问行为的开始时间以及所述目标会话中网页访问行为的数量,确定所述末次网页访问行为的页面浏览时间。
可选的,所述获取所述末次网页访问行为的页面浏览时间还包括:
若所述末次网页访问行为不包括所述页面心跳包数据时,进一步判断所述目标会话是否包括下一会话;
若包括,获取所述目标会话的下一会话的特征标识;
判断所述目标会话的特征标识与下一会话的特征标识是否相同;
如果相同,则确定第一预设值与第一差值之间的较小值为所述末次网页访问行为的页面浏览时间,所述第一差值为所述下一会话的开始时间与所述末次网页访问行为的开始时间的差值。
可选的,所述根据所述末次网页访问行为的行为对象,确定所述目标会话的时长还包括:
若所述末次网页访问行为的行为对象为未产生页面浏览量数据的行为对象,则根据所述目标会话中所述末次网页访问行为的开始时间以及所述目标会话中初始网页访问行为的开始时间确定所述目标会话的时长。
一种会话时长计算装置,包括:
第一获取模块,用于获取目标会话,所述目标会话包括至少一个网页访问行为,且,所述网页访问行为按照时间顺序进行排序;
第一确定模块,用于确定所述末次网页访问行为的行为对象,所述末次网页访问行为是所述目标会话中时间排序最后的所述网页访问行为;
第二确定模块,用于根据所述末次网页访问行为的行为对象,确定所述目标会话的时长。
可选的,,所述第二确定模块包括:
第一获取单元,用于当所述末次网页访问行为的行为对象为产生页面浏览量数据的行为对象,则获取所述末次网页访问行为的页面浏览时间;
第一确定单元,用于根据所述末次网页访问行为的页面浏览时间、所述目标会话中所述末次网页访问行为的开始时间以及所述目标会话中初始网页访问行为的开始时间确定所述目标会话的时长。
一种会话时长计算系统,包括:
存储器,用于存储程序;
处理器,用于执行所述程序,所述程序用于:
获取目标会话,所述目标会话包括至少一个网页访问行为,且,所述网页访问行为按照时间顺序进行排序;
确定所述末次网页访问行为的行为对象,所述末次网页访问行为是所述目标会话中时间排序最后的所述网页访问行为;
根据所述末次网页访问行为的行为对象,确定所述目标会话的时长。
借由上述技术方案,本发明公开了一种会话时长计算方法、计算装置以及计算系统,首先获取目标会话,然后确定目标会话中末次网页访问行为的行为对象,最后根据该末次网页访问行为的行为对象,确定目标会话的时长。可见,本方案考虑到最后一个网页访问行为的行为对象对目标会话时长的影响,如最后一个网页访问行为的行为对象为产生页面浏览量数据的行为对象,则确定目标会话的时长为末次网页访问行为的开始时间-初始网页访问行为的开始时间+末次网页访问行为的页面浏览时间,又如,最后一个网页访问行为的行为对象为未产生页面浏览量数据的行为对象,则可以确定目标会话的时长为末次网页访问行为的开始时间-初始网页访问行为的开始时间。即根据末次网页访问行为的行为对象决定目标会话时长,解决了现有技术中由于单一的会话时长计算方式导致的会话时长计算不准确的问题。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种会话时长计算方法的流程示意图;
图2示出了本发明实施例提供的会话时长计算方法中确定末次网页访问行为的页面浏览时间的方法流程图;
图3示出了本发明实施例提供的又一种获取末次网页访问行为的页面浏览时间的流程示意图;
图4示出了本发明实施例提供的一种会话时长计算装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种会话时长计算方法,请参阅图1,示出了该会话时长计算方法的流程示意图,可以包括:
S11、获取目标会话。
其中,目标会话为待进行会话时长计算的会话,其可以通过服务器获取用户预设时间段的用户访问数据,然后将用户访问数据按照时间进行先后顺序的排序,之后按照预设的会话切分规则对该用户访问数据进行会话逻辑的切分,将该用户访问数据切分成多个会话,得到按照时间先后顺序排列的会话序列,然后从会话序列中确定待检测会话时长的会话为目标会话。
需要说明的是,预设时间段的用户访问数据,可以是用户一天的所有访问数据,还可以是用户12个小时内的所有访问数据,如采集每天早上8:00到晚上8:00的所有访问数据,当然,还可以为其他预设时间段内的所有访问数据,如一个月的用户访问数据。其中,预设时间段的选取的确定可以由用户进行指定,也可以为后台服务器默认的设置。
除此,预设的会话切分规则也可以由用户临时指定,如基于用户的操作,设定会话切分规则为对预设时间段的用户访问数据进行第一预设时间间隔的切分,具体的,可以为:后台服务器获取了一天的用户访问数据,然后该用户访问数据包括多条用户访问记录,按照一个小时进行切分,将该用户数据切分成多个会话,然后多个会话形成了按照时间排序的会话序列。当然,预设的会话切分规则还可以是后台服务器预设置的切分时间间隔,如半个小时切分一次,或者当收到网页访问页面进行关闭的触发指令后的时间作为会话的切分截止时间,等等。
示例性的,
后台服务器首先获取用户一天内的所有访问数据,假设一共包含十条用户访问数据,按照时间顺序依次为:
1、06:31-07:53的第一条用户访问数据;
2、08:05-08:48的第二条用户访问数据;
3、09:25-10:33的第三条用户访问数据;
4、10:35-10:42的第四条用户访问数据;
5、10:45-11:03的第五条用户访问数据;
6、11:30-11:56的第六条用户访问数据;
7、12:21-12:55的第七条用户访问数据;
8、13:26-14:49的第八条用户访问数据;
9、16:36-17:23的第九条用户访问数据;
10、18:00-20:03的第十条用户访问数据。
其中,假定设定会话切分规则为按照一个小时的时间间隔进行用户访问数据的切分,则,上述用户访问数据能够被切分成如下会话:
1、06:31-07:31的第一个会话;
2、07:32-07:53的第二个会话;
3、08:05-08:48的第三个会话;
4、09:25-10:25的第四个会话;
5、10:25-10:33的第五个会话;
6、10:35-10:42的第六个会话;
7、10:45-11:03的第七个会话;
8、11:30-11:56的第八个会话;
9、12:21-12:55的第九个会话;
10、13:26-14:26的第十个会话;
11、14:27-14:49的第十一个会话;
12、16:36-17:23的第十二个会话;
13、18:00-19:00的第十三个会话;
14、19:01-20:00的第十四个会话;
15、20:01-20:03第十五个会话。
而通过上述会话切分规则进行用户访问数据的切分后,得到上述15个会话构成的按照时间顺序排列的会话序列。从上述会话切分规则中不难看出,当一条用户访问数据的持续时间超过一个小时时,对该条用户访问数据进行切分,当用户访问数据的持续时间不超过预设时间间隔(在此处,预设时间间隔为一个小时)时,会话即为当前用户访问数据,不进行时间间隔的切分。
当然,上述实施例只是示意性说明,本发明提供的会话切分规则还可以按照实际的情况由用户进行设定,如,按照网页访问行为的结束时间进行切分。
结合背景技术可知,会话为记录了用户访问网页的一组网页访问行为。当用户进行网页访问时,后台服务器会建立一个会话,并为该会话内包含的所有访问行为创建不同类型的行为对象,如PageViewObject(网页浏览)、MouseScrollObject(鼠标滚动)、MouseClickObject(鼠标点击)、电子订单(EcomObject)以及SiteSearchObject(站内搜索)等。
即,会话包括至少一个网页访问行为,且,网页访问行为按照时间顺序进行排列,并且,会话内的每个网页访问行为都对应一个行为对象。
如,上述会话序列可以具体为:
1、06:31-07:31的第一个会话,该会话包括两个网页访问行为,其中,网页访问行为的行为对象依次为网页浏览以及鼠标滚动;
2、07:32-07:53的第二个会话,该会话包括三个网页访问行为,其中,网页访问行为的行为对象依次为网页浏览、鼠标滚动以及站内搜索;
3、08:05-08:48的第三个会话,该会话包括一个网页访问行为,其中,网页访问行为的行为对象为鼠标点击;
4、09:25-10:25的第四个会话,该会话包括两个网页访问行为,其中,网页访问行为的行为对象依次为鼠标点击以及鼠标滚动;
5、10:25-10:33的第五个会话,该会话包括一个网页访问行为,其中,网页访问行为的行为对象为鼠标滚动;
6、10:35-10:42的第六个会话,该会话包括一个网页访问行为,其中,网页访问行为的行为对象为网页浏览;
7、10:45-11:03的第七个会话,该会话包括两个网页访问行为,其中,网页访问行为的行为对象依次为网页浏览以及鼠标滚动;
8、11:30-11:56的第八个会话,该会话包括两个网页访问行为,其中,网页访问行为的行为对象依次为网页浏览以及鼠标滚动;
9、12:21-12:55的第九个会话,该会话包括三个网页访问行为,其中,网页访问行为的行为对象依次为网页浏览、鼠标点击以及鼠标滚动;
10、13:26-14:26的第十个会话,该会话包括四个网页访问行为,其中,网页访问行为的行为对象依次为网页浏览、鼠标滚动、网页浏览以及鼠标滚动;
11、14:27-14:49的第十一个会话,该会话包括两个网页访问行为,其中,网页访问行为的行为对象依次为网页浏览以及鼠标滚动;
12、16:36-17:23的第十二个会话,该会话包括三个网页访问行为,其中,网页访问行为的行为对象依次为网页浏览、电子订单以及鼠标滚动;
13、18:00-19:00的第十三个会话,该会话包括两个网页访问行为,其中,网页访问行为的行为对象依次为鼠标滚动以及网页浏览;
14、19:01-20:00的第十四个会话,该会话包括两个网页访问行为,其中,网页访问行为的行为对象依次为网页浏览以及站内搜索;
15、20:01-20:03第十五个会话,该会话包括一个网页访问行为,其中,网页访问行为的行为对象为网页浏览。
在得到切分后的会话序列后,后台服务器会从会话序列中确定待检测会话时长的会话为目标会话。其中,待检测会话时长的会话可以按照时间顺序,依次将上述会话序列中的会话确定为目标会话,如先将第一个会话确定为目标会话,计算该会话的时长,在计算完第一个会话的时长后,再将第二个会话确定成目标会话,进而计算第二个会话的时长,在计算完第二个会话的时长后,再将第三个会话确定成目标会话,进而计算第三个会话的时长,以此类推,直到计算完会话序列中所有会话的时长。
当然,还可以随机抽取会话序列中的某一会话,将其确认为目标会话,在此不进行详述,本领域技术人员可以根据实际的计算需求进行设定和选择。
需要说明的是,本实施例中,用户访问数据的记录时间以及会话的时间,均为用户访问数据的起始触发时间。如以会话序列中第十三个会话为例,其中,18:00为该会话第一个网页访问行为的开始时间,即鼠标滚动的时间,19:00为该会话第二个网页访问行为的开始时间,即网页浏览的触发时间。
其中,19:00为网页浏览的开始时间,如用户在19:00打开某一网页,进行了17分钟的网页浏览,那么,19:00为网页浏览的起始时间,19:17为网页浏览的截止时间。而发明人发现,现有技术中,在计算会话时长时,只计算了各个会话的末次网页访问行为的开始时间与初始网页访问行为的开始时间的差值,即,对于第三个会话,现有技术计算出的会话时长为19:00与18:00的时间差,即会话时长为一个小时。而,实际上,用户在19:00打开了网页之后,还进行了一段时间(17分钟)的浏览,因此,真实的会话时长为19:17与18:00的时间差,而非一个小时,可见,现有的会话时长计算方式计算得到的会话时长并不准确。
基于现有技术的问题,本实施例提供了一种会话时长计算方法,考虑了会话中网页访问行为的行为对象,使得计算出的会话时长更加准确。
具体的,结合步骤S2和S3,对本实施例提供的会话时长计算方法进行详细说明:
S12、确定末次网页访问行为的行为对象。
其中,末次网页访问行为是目标会话中最后一个所述网页访问行为,如,目标会话为上述第二个会话,则初始网页访问行为为行为对象为网页浏览的网页访问行为,末次网页访问行为为行为对象为站内搜索的网页访问行为,而位于三个网页访问行为中第二位的是行为对象为鼠标滚动的网页访问行为。
又如,目标会话为第十个会话,则初始网页访问行为为行为对象为网页浏览的网页访问行为,末次网页访问行为为行为对象为鼠标滚动的网页访问行为,而位于四个网页访问行为中第二位的是行为对象为鼠标滚动的网页访问行为,位于四个网页访问行为中第三位的是行为对象为网页浏览的网页访问行为。
本步骤是确定目标会话中末次网页访问行为的行为对象,如,目标会话为第二会话,则确定末次网页访问行为的行为对象为站内搜索,又如,目标会话为第十个会话,则确定末次网页访问行为的行为对象为鼠标滚动,再如,目标会话为第十三个会话,则确定末次网页访问行为的行为对象为网页浏览。
S13、根据所述末次网页访问行为的行为对象,确定所述目标会话的时长。
步骤S12已经确定了目标会话的末次网页访问行为的行为对象,本步骤根据步骤S12确定出的行为对象,确定该目标会话的时长。具体的,行为对象分为产生页面浏览量数据的行为对象以及未产生页面浏览量数据的行为对象,当所述末次网页访问行为的行为对象为产生页面浏览量数据的行为对象,则获取所述末次网页访问行为的页面浏览时间,并根据所述末次网页访问行为的页面浏览时间、所述目标会话中所述末次网页访问行为的开始时间以及所述目标会话中初始网页访问行为的开始时间确定所述目标会话的时长。
当所述末次网页访问行为的行为对象为未产生页面浏览量数据的行为对象,则根据所述目标会话中所述末次网页访问行为的开始时间以及所述目标会话中初始网页访问行为的开始时间确定所述目标会话的时长。
这样,本实施例提供的会话时长计算方法,是根据目标会话中末次网页访问行为的行为对象来进行确定,不同于现有技术中,单一的采用末次网页访问行为的开始时间-初始网页访问行为的开始时间而计算得到。本方案综合考虑了末次网页访问行为的行为对象,然后进行会话时长的确定。
需要说明的是,在本实施例中,划分是否为产生页面浏览量数据的行为对象可以根据行为对象对会话时间的实际影响进行划分,如,网页浏览通常会耗费一定的浏览时间,因此,定义成产生页面浏览量数据的行为对象,在会话时长的计算时,将该网页浏览时间计算进去,进而使得会话时长的计算结果更加准确。而鼠标点击、鼠标滚动等行为对象基本不会耗费时间,因此,在本实施例中定义成未产生页面浏览量数据的行为对象,在会话时间的计算时,可以忽略该时间的计算。
示例性的,当第八会话为目标会话时,末次网页访问行为的行为对象为鼠标滚动,而鼠标滚动属于上述定义的未产生页面浏览量数据的行为对象,因此,确定该目标会话的时长为末次网页访问行为的开始时间与初始网页访问行为的开始时间的差值,即第八会话的会话时长为11:56-11:30=26分钟。
同理,当第十三会话为目标会话时,末次网页访问行为的行为对象为网页浏览,而网页浏览属于上述定义的产生页面浏览量数据的行为对象,因此,确定该目标会话的时长为末次网页访问行为的开始时间与初始网页访问行为的开始时间的差值与末次网页访问行为的页面浏览时间之和,即第十三会话的会话时长为19:00-18:00+末次网页访问行为的页面浏览时间。其中,末次网页访问行为的页面浏览时间可以为预设的经验值,也可以根据一些方法计算得到,那么,假定末次网页访问行为的页面浏览时间为一个默认值,如15分钟,那么第十三会话的时长为19:00-18:00+15=1小时15分钟。
可见,本方案提供的会话时长计算方法,能够考虑到最后一个网页访问行为的行为对象的类型,并根据行为对象的不同确定不同的目标会话时长,如最后一个网页访问行为为网页浏览,则确定会话时长为末次网页访问行为的开始时间-初始网页访问行为的开始时间+末次网页访问行为的页面浏览时间,又如,最后一个网页访问行为为鼠标点击,则可以确定会话的时间为末次网页访问行为的开始时间-初始网页访问行为的开始时间。进而解决了现有技术中由于单一的会话时长计算方式导致的会话时长计算不准确,进而导致网页分析不准确的问题。
在另一种可能的实现方式中,如图2所示,对于上述实施例提供的会话时长计算方法中,在确定末次网页访问行为的页面浏览时间时,具体包括:
S21、判断所述末次网页访问行为是否包括页面心跳包数据;
其中,页面心跳包数据(hb数据)是tracker(数据采集)发送的一类数据,在用户离开某页面时(如关闭网页时,或者页面关闭预设时间后)发送。
若包括,执行步骤S22、确定所述页面心跳包数据记录的时间与所述末次网页访问行为的开始时间的差值;
S23、若所述差值为正,将所述差值作为所述末次网页访问行为的页面浏览时间。
示例性的,以第十三个会话为目标会话为例,其末次网页访问行为的行为对象为网页浏览,属于产生页面浏览量数据的行为对象,因此,进一步的判断该末次网页访问行为是否包括hb数据,
若存在hb数据,则末次网页访问行为的页面浏览时间=hb时间–末pv时间。其中,hb时间表征页面心跳包数据记录的时间,末pv时间表征末次网页访问行为的开始时间。如,第十三个会话的末次网页访问行为的时间为19:00,而假定在19:17,页面关闭,则此时发送hb数据至后台服务器,然后后服务器记录hb时间为19:17,相应的,结合上述公式,第一浏览时间=19:17-19:00=17分钟。
需要说明的是,如果末次网页访问行为的时间和页面心跳包数据记录的时间发生乱序(网络时延),那么,根据公式:末次网页访问行为的页面浏览时间=hb时间–末pv时间,计算得到的差值为负数,则此时本方案可以根据所述目标会话中所述末次网页访问行为的开始时间、所述目标会话中初始网页访问行为的开始时间以及所述目标会话中网页访问行为的数量,确定所述末次网页访问行为的页面浏览时间。或者,直接将末次网页访问行为的页面浏览时间设定成某一预设值。
即,如果末次网页访问行为的时间为19:00,而hb时间为18:39,则计算得到的末次网页访问行为的页面浏览时间为-21分钟,因此,此时肯定是存在数据传输的延时,因此本方案将末次网页访问行为的页面浏览时间设定成第一预设值。
其中,第一预设值可以根据如下公式计算得到:
第一预设值=(末次网页访问行为的开始时间–初始网页访问行为的开始时间)/max(目标会话中网页访问行为的数量–第二预设值,第二预设值)。
假设第二预设值为1小时,那么,第一预设值=(19:00–18:00)/max(2–1,1)=1小时,则确定末次网页访问行为的页面浏览时间为1小时。
在上述实施例的基础上,发明人考虑到页面心跳包数据(hb数据)可能会丢失,那么,如图3所示,本方案中在获取末次网页访问行为的页面浏览时间时,具体包括步骤:
S31、若所述末次网页访问行为不包括所述页面心跳包数据时,进一步判断所述目标会话是否包括下一会话;
若包括,执行步骤S32、获取所述目标会话的下一会话的特征标识,并判断所述目标会话的特征标识与下一会话的特征标识是否相同;
S33、如果相同,则确定第一预设值与第一差值之间的较小值为所述末次网页访问行为的页面浏览时间。
其中,所述第一差值为所述下一会话的开始时间与所述末次网页访问行为的开始时间的差值。
具体的,若hb数据丢失,则查看后一个会话与当前会话的特征标识(client_session_id)是否一致,如果不一致,则定义末次网页访问行为的页面浏览时间为零。其中,特征标识client_session_id是tracker用来表示该用户客户端会话的标志,如果变更,则表示产生了一个新的会话。即当下一会话的特征标识与当前会话的特征标识不同时,则可以认定没有进一步浏览行为了,如第十五个会话之后没有其他会话,因此认为第十五个会话之后,用户没有其他网页浏览行为。
若hb数据丢失,但后一个会话的特征标识与当前会话的特征标识client_session_id一致,则末次网页访问行为的页面浏览时间=min(下一个session起始时间-末pv时间,30min)。其中,30min为会话切分时长(此处为发明人提供的优选经验值,当然本方案不局限于该值)。如假设第十四个会话的特征标识与第十三个会话的特征标识相同,则末次网页访问行为的页面浏览时间=min(19:01-19:00,30min)=1分钟。
与上述方法相对应,本发明实施例还提供了一种会话时长计算装置,请参阅图4,示出了该会话时长计算装置的结构示意图,可以包括:
第一获取模块41,用于获取目标会话,所述目标会话包括至少一个网页访问行为,且,所述网页访问行为按照时间顺序进行排序;
第一确定模块42,用于确定所述末次网页访问行为的行为对象,所述末次网页访问行为是所述目标会话中时间排序最后的所述网页访问行为;
第二确定模块43,用于根据所述末次网页访问行为的行为对象,确定所述目标会话的时长。
可选的,所述第二确定模块包括:
第一获取单元,用于当所述末次网页访问行为的行为对象为产生页面浏览量数据的行为对象,则获取所述末次网页访问行为的页面浏览时间;
第一确定单元,用于根据所述末次网页访问行为的页面浏览时间、所述目标会话中所述末次网页访问行为的开始时间以及所述目标会话中初始网页访问行为的开始时间确定所述目标会话的时长。
所述会话时长计算装置包括处理器和存储器,上述第一获取模块、第一确定模块以及第二确定模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决了现有技术中由于单一的会话时长计算方式导致的会话时长计算不准确的问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述会话时长计算方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述会话时长计算方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:(方法权项步骤,独权+从权)。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取目标会话,所述目标会话包括至少一个网页访问行为,且,所述网页访问行为按照时间顺序进行排序;
确定所述末次网页访问行为的行为对象,所述末次网页访问行为是所述目标会话中时间排序最后的所述网页访问行为;
根据所述末次网页访问行为的行为对象,确定所述目标会话的时长。
其中,所述获取目标会话,包括:
获取预设时间内的用户访问数据;
按照预设会话切分规则,将所述用户访问数据切分成多个会话;
依次确定所述多个会话为所述目标会话。
其中,所述根据所述末次网页访问行为的行为对象,确定所述目标会话的时长包括:
若所述末次网页访问行为的行为对象为产生页面浏览量数据的行为对象,则获取所述末次网页访问行为的页面浏览时间;
根据所述末次网页访问行为的页面浏览时间、所述目标会话中所述末次网页访问行为的开始时间以及所述目标会话中初始网页访问行为的开始时间确定所述目标会话的时长。
其中,所述获取所述末次网页访问行为的页面浏览时间包括:
判断所述末次网页访问行为是否包括页面心跳包数据;
若包括,确定所述页面心跳包数据记录的时间与所述末次网页访问行为的开始时间的差值;
若所述差值为正,将所述差值作为所述末次网页访问行为的页面浏览时间。
其中,所述获取所述末次网页访问行为的页面浏览时间还包括:
若所述差值为负,根据所述目标会话中所述末次网页访问行为的开始时间、所述目标会话中初始网页访问行为的开始时间以及所述目标会话中网页访问行为的数量,确定所述末次网页访问行为的页面浏览时间。
其中,所述获取所述末次网页访问行为的页面浏览时间还包括:
若所述末次网页访问行为不包括所述页面心跳包数据时,进一步判断所述目标会话是否包括下一会话;
若包括,获取所述目标会话的下一会话的特征标识;
判断所述目标会话的特征标识与下一会话的特征标识是否相同;
如果相同,则确定第一预设值与第一差值之间的较小值为所述末次网页访问行为的页面浏览时间,所述第一差值为所述下一会话的开始时间与所述末次网页访问行为的开始时间的差值。
其中,所述根据所述末次网页访问行为的行为对象,确定所述目标会话的时长还包括:
若所述末次网页访问行为的行为对象为未产生页面浏览量数据的行为对象,则根据所述目标会话中所述末次网页访问行为的开始时间以及所述目标会话中初始网页访问行为的开始时间确定所述目标会话的时长。
综上,本发明公开了一种会话时长计算方法、计算装置以及计算系统,首先获取目标会话,然后确定目标会话中末次网页访问行为的行为对象,最后根据该末次网页访问行为的行为对象,确定目标会话的时长。可见,本方案考虑到最后一个网页访问行为的行为对象对目标会话时长的影响,如最后一个网页访问行为的行为对象为产生页面浏览量数据的行为对象,则确定目标会话的时长为末次网页访问行为的开始时间-初始网页访问行为的开始时间+末次网页访问行为的页面浏览时间,又如,最后一个网页访问行为的行为对象为未产生页面浏览量数据的行为对象,则可以确定目标会话的时长为末次网页访问行为的开始时间-初始网页访问行为的开始时间。即根据末次网页访问行为的行为对象决定目标会话时长,解决了现有技术中由于单一的会话时长计算方式导致的会话时长计算不准确的问题。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种会话时长计算方法,其特征在于,包括:
获取目标会话,所述目标会话包括至少一个网页访问行为,且,所述网页访问行为按照时间顺序进行排序;
确定所述末次网页访问行为的行为对象,所述末次网页访问行为是所述目标会话中时间排序最后的所述网页访问行为;
根据所述末次网页访问行为的行为对象,确定所述目标会话的时长。
2.根据权利要求1所述的会话时长计算方法,其特征在于,所述获取目标会话,包括:
获取预设时间内的用户访问数据;
按照预设会话切分规则,将所述用户访问数据切分成多个会话;
依次确定所述多个会话为所述目标会话。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述末次网页访问行为的行为对象,确定所述目标会话的时长包括:
若所述末次网页访问行为的行为对象为产生页面浏览量数据的行为对象,则获取所述末次网页访问行为的页面浏览时间;
根据所述末次网页访问行为的页面浏览时间、所述目标会话中所述末次网页访问行为的开始时间以及所述目标会话中初始网页访问行为的开始时间确定所述目标会话的时长。
4.根据权利要求3所述的方法,其特征在于,所述获取所述末次网页访问行为的页面浏览时间包括:
判断所述末次网页访问行为是否包括页面心跳包数据;
若包括,确定所述页面心跳包数据记录的时间与所述末次网页访问行为的开始时间的差值;
若所述差值为正,将所述差值作为所述末次网页访问行为的页面浏览时间。
5.根据权利要求4所述的方法,其特征在于,所述获取所述末次网页访问行为的页面浏览时间还包括:
若所述差值为负,根据所述目标会话中所述末次网页访问行为的开始时间、所述目标会话中初始网页访问行为的开始时间以及所述目标会话中网页访问行为的数量,确定所述末次网页访问行为的页面浏览时间。
6.根据权利要求4所述的方法,其特征在于,所述获取所述末次网页访问行为的页面浏览时间还包括:
若所述末次网页访问行为不包括所述页面心跳包数据时,进一步判断所述目标会话是否包括下一会话;
若包括,获取所述目标会话的下一会话的特征标识;
判断所述目标会话的特征标识与下一会话的特征标识是否相同;
如果相同,则确定第一预设值与第一差值之间的较小值为所述末次网页访问行为的页面浏览时间,所述第一差值为所述下一会话的开始时间与所述末次网页访问行为的开始时间的差值。
7.根据权利要求1或2所述的方法,其特征在于,所述根据所述末次网页访问行为的行为对象,确定所述目标会话的时长还包括:
若所述末次网页访问行为的行为对象为未产生页面浏览量数据的行为对象,则根据所述目标会话中所述末次网页访问行为的开始时间以及所述目标会话中初始网页访问行为的开始时间确定所述目标会话的时长。
8.一种会话时长计算装置,其特征在于,包括:
第一获取模块,用于获取目标会话,所述目标会话包括至少一个网页访问行为,且,所述网页访问行为按照时间顺序进行排序;
第一确定模块,用于确定所述末次网页访问行为的行为对象,所述末次网页访问行为是所述目标会话中时间排序最后的所述网页访问行为;
第二确定模块,用于根据所述末次网页访问行为的行为对象,确定所述目标会话的时长。
9.根据权利要求8所述的会话时长计算装置,其特征在于,所述第二确定模块包括:
第一获取单元,用于当所述末次网页访问行为的行为对象为产生页面浏览量数据的行为对象,则获取所述末次网页访问行为的页面浏览时间;
第一确定单元,用于根据所述末次网页访问行为的页面浏览时间、所述目标会话中所述末次网页访问行为的开始时间以及所述目标会话中初始网页访问行为的开始时间确定所述目标会话的时长。
10.一种会话时长计算系统,其特征在于,包括:
存储器,用于存储程序;
处理器,用于执行所述程序,所述程序用于:
获取目标会话,所述目标会话包括至少一个网页访问行为,且,所述网页访问行为按照时间顺序进行排序;
确定所述末次网页访问行为的行为对象,所述末次网页访问行为是所述目标会话中时间排序最后的所述网页访问行为;
根据所述末次网页访问行为的行为对象,确定所述目标会话的时长。
CN201710526986.XA 2017-06-30 2017-06-30 会话时长计算方法、装置及系统 Active CN109213906B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710526986.XA CN109213906B (zh) 2017-06-30 2017-06-30 会话时长计算方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710526986.XA CN109213906B (zh) 2017-06-30 2017-06-30 会话时长计算方法、装置及系统

Publications (2)

Publication Number Publication Date
CN109213906A true CN109213906A (zh) 2019-01-15
CN109213906B CN109213906B (zh) 2022-02-11

Family

ID=64977018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710526986.XA Active CN109213906B (zh) 2017-06-30 2017-06-30 会话时长计算方法、装置及系统

Country Status (1)

Country Link
CN (1) CN109213906B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036666A (zh) * 2020-09-29 2020-12-04 中移(杭州)信息技术有限公司 绑定流程评估方法、装置、服务器、存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509233A (zh) * 2011-11-29 2012-06-20 汕头大学 一种基于用户网上动作信息的推荐方法
CN103281217A (zh) * 2013-05-23 2013-09-04 中国科学院计算机网络信息中心 一种用户页面停留时长的测量方法
US20150169601A1 (en) * 2012-11-01 2015-06-18 Tencent Technology (Shenzhen) Company Limited Method and apparatus for storing webpage access records
CN105376311A (zh) * 2015-11-11 2016-03-02 北京北信源软件股份有限公司 一种基于终端访问的页面停留时长确定方法及装置
CN106060117A (zh) * 2016-05-17 2016-10-26 北京京东尚科信息技术有限公司 一种页面停留时长的计时方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509233A (zh) * 2011-11-29 2012-06-20 汕头大学 一种基于用户网上动作信息的推荐方法
US20150169601A1 (en) * 2012-11-01 2015-06-18 Tencent Technology (Shenzhen) Company Limited Method and apparatus for storing webpage access records
CN103281217A (zh) * 2013-05-23 2013-09-04 中国科学院计算机网络信息中心 一种用户页面停留时长的测量方法
CN105376311A (zh) * 2015-11-11 2016-03-02 北京北信源软件股份有限公司 一种基于终端访问的页面停留时长确定方法及装置
CN106060117A (zh) * 2016-05-17 2016-10-26 北京京东尚科信息技术有限公司 一种页面停留时长的计时方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036666A (zh) * 2020-09-29 2020-12-04 中移(杭州)信息技术有限公司 绑定流程评估方法、装置、服务器、存储介质
CN112036666B (zh) * 2020-09-29 2024-03-22 中移(杭州)信息技术有限公司 绑定流程评估方法、装置、服务器、存储介质

Also Published As

Publication number Publication date
CN109213906B (zh) 2022-02-11

Similar Documents

Publication Publication Date Title
CN105550184B (zh) 一种信息获取方法及装置
CN104426713B (zh) 网络站点访问效果数据的监测方法和装置
CN108289121A (zh) 营销信息的推送方法及装置
CN110503206A (zh) 一种预测模型更新方法、装置、设备及可读介质
CN107193750A (zh) 一种脚本录制方法和装置
CN108845936A (zh) 一种基于海量用户的ab测试方法及系统
CN108255886B (zh) 推荐系统的评估方法及装置
CN103729446A (zh) 一种用户操作数据的处理方法、处理装置及服务器
US11016730B2 (en) Transforming a transactional data set to generate forecasting and prediction insights
CN108363657A (zh) 监控app客户端埋点数据采集完整性的方法、设备以及介质
CN110009359A (zh) 无监督风险防控模型的训练方法、更新方法及装置
CN110162292A (zh) 语音播报方法及装置
CN109309596A (zh) 一种压力测试方法、装置及服务器
CN108388509A (zh) 一种软件测试方法、计算机可读存储介质及终端设备
CN109582543A (zh) 数据回溯方法和装置
CN108628537A (zh) 监控数据输出方法及装置
CN109033365A (zh) 一种数据处理方法及相关设备
CN107153702A (zh) 一种数据处理方法及装置
CN108985067A (zh) 基于自动化回溯的内容处理方法和装置
CN106649373A (zh) 热力图显示方法及装置
CN104424294A (zh) 一种信息处理方法及装置
CN103595747A (zh) 用户信息推荐方法和系统
CN107038127A (zh) 应用系统及其缓存控制方法和装置
CN109213906A (zh) 会话时长计算方法、装置及系统
CN110928636A (zh) 虚拟机热迁移方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100080 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant