CN103281217A - 一种用户页面停留时长的测量方法 - Google Patents

一种用户页面停留时长的测量方法 Download PDF

Info

Publication number
CN103281217A
CN103281217A CN201310195502XA CN201310195502A CN103281217A CN 103281217 A CN103281217 A CN 103281217A CN 201310195502X A CN201310195502X A CN 201310195502XA CN 201310195502 A CN201310195502 A CN 201310195502A CN 103281217 A CN103281217 A CN 103281217A
Authority
CN
China
Prior art keywords
duration
user
focus window
page
url
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310195502XA
Other languages
English (en)
Other versions
CN103281217B (zh
Inventor
刘冰
周鑫
王常青
王利军
周煜程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Internet Network Information Center
Original Assignee
Computer Network Information Center of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Network Information Center of CAS filed Critical Computer Network Information Center of CAS
Priority to CN201310195502.XA priority Critical patent/CN103281217B/zh
Publication of CN103281217A publication Critical patent/CN103281217A/zh
Application granted granted Critical
Publication of CN103281217B publication Critical patent/CN103281217B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种用户页面停留时长的测量方法。首先通过数据采集模块记录用户在计算机上的焦点窗口变化情况,形成用户的焦点窗口序列数据;然后通过数据计算模块计算用户页面停留时长,最终得到用户页面停留时长测量结果。该方法与现有的测量方法相比,具有如下优点:用户浏览的任何页面均可测量,包括用户在一次浏览中的最后一个页面;仅当用户真正在浏览页面时,才会计算用户的停留时间,这样的测量结果能够真实反映用户的浏览行为。

Description

一种用户页面停留时长的测量方法
技术领域
本发明属于计算机网络领域,涉及一种用户页面停留时长的测量方法。
背景技术
用户页面停留时长,简单来讲就是用户在某个网站页面上所花的时间,它在一定程度上反映了该网站页面对用户的粘性。准确的测量用户页面停留时长,可以帮助网站运营人员了解网站页面的内容质量,作为页面改进的依据,也可以帮助网站推广人员了解推广流量的质量,从而进一步优化推广策略。
目前,测量用户页面停留时长主要有2种数据获取方式:Web服务日志和JavaScript页面嵌码。这2种方法使用的数据来源不同,但是在测量页面停留时长时的基本思路是相同的,即通过计算2个相邻访问页面的请求时间戳之差,来作为第1个页面的停留时长。如图1所示,某用户按照图中所示顺序访问了某个网站的3个页面后离开,那么该用户在Page1上的停留时长为2分钟,在Page2上的停留时长为5分钟,而Page3由于是最后一个页面无法计算,因此停留时长被忽略。
显然,这种停留时长的测量方法存在明显缺陷:对于用户访问的最后一个页面,服务端无法获知用户是何时离开的,这样也就无法计算这个页面的停留时长,因此只能选择忽略,这导致在后续计算页面平均停留时长时,测量结果与实际情况会有较大的偏差。对于一些视频网站页面来说,这个问题尤为严重。
此外,现有的页面停留时长测量方法还有一个问题,即测量结果无法真实反映用户的实际浏览行为。用户在使用浏览器浏览网页时,往往会打开多个窗口/标签页,而用户在同一时间内一般只会浏览一个网页。这就意味着一些网页虽然被打开了,但是它们都被隐藏在顶端窗口/标签页的背后,并没有真正被用户浏览。无论是通过Web服务日志还是JavaScript页面嵌码,服务端都无法获取这样的用户行为细节,因此在测量停留时长时也就无法将其考虑在内,这导致测量结果可能比用户实际浏览某个页面的停留时长要大一些。
可以看到,现有的页面停留时长测量方法存在一定的缺陷,使得测量结果与用户实际浏览行为之间存在一定的偏差。
发明内容
本发明目的在于提供一种几乎无遗漏的、能够真实反映用户实际浏览行为的用户页面停留时长测量方法。
用户在计算机上使用浏览器或其它软件时,会打开相应的程序窗口。在同一时间内,可能有多个程序窗口被打开,但是只有其中一个窗口可以接收用户的交互,这个当前与用户交互的窗口叫做焦点窗口,焦点窗口反映了用户当前关注的对象。通过调用Windows API,我们可以获取用户计算机上的当前焦点窗口信息,包括焦点窗口的句柄、进程名等,通过进程名我们可以判断用户当前在使用什么软件,如果是浏览器窗口,我们还可以进一步调用Windows API获取浏览器的地址栏信息,得到地址栏中的URL,从而判断用户当前正在浏览的是什么网页。如果我们以一定的频率(推荐间隔为1-3秒)扫描用户计算机上的焦点窗口,我们就可以了解到用户在一段时间内,分别在哪些时点浏览了哪些网页。
为了达到上述目的,本发明提出一种用户页面停留时长测量方法,包括以下步骤:
1)获取用户计算机上的当前焦点窗口进程;
2)当前焦点窗口进程为浏览器时,获取当前浏览器URL;
3)将获取到的焦点窗口进程、浏览器URL连同获取时间一并记录下来,形成焦点窗口序列数据表;
4)读取步骤3)形成的焦点窗口序列数据表中所述浏览器URL的进入和离开时间,用离开时间减去进入时间,得到该页面的本次停留时长。
进一步地,步骤1)中通过数据采集模块扫描用户计算机上的焦点窗口。
进一步地,上述扫描时间间隔为1-3秒。
进一步地,步骤3)中所述当前焦点窗口进程和浏览器URL与焦点窗口序列数据表中的最后一条记录完全相同时,将最后一次扫描时间变量值更新为进入时间;否则,将进入时间、当前焦点窗口进程和浏览器URL追加到焦点窗口序列数据表中。
进一步地,步骤4)中,焦点窗口序列数据表中的当前记录为最后一条时,读取最后一次扫描时间,作为离开时间;否则,读取下一条记录时间,作为离开时间。
进一步地,步骤4)中,所述浏览器URL和停留时长构成时长统计表。
进一步地,上述时长统计表中已存在当前URL的统计时长记录时,将本次停留时长累加到时长统计表中对应的URL统计时长上;否则,将当前URL添加为一条新的统计记录,统计时长初始化为0,并将本次停留时长累加到时长统计表中对应的URL统计时长上。
在上述方法中,所采用的焦点窗口序列数据直接反映了用户实际关注对象的变化,因此计算得到的页面停留时长,也是用户真正浏览页面的时长。当用户的焦点窗口切换到其它程序上时,即便浏览器的页面没有关闭,也不会继续累加停留时长。当用户关闭浏览器时,焦点窗口自然会切换到其它程序上(至少是Windows系统窗口),这样即便是用户浏览的最后一个页面,我们也可以计算出它的停留时长。
本文提出的页面停留时长测量方法,与现有的测量方法相比,有如下优点:
1)用户浏览的任何页面均可测量,包括用户在一次浏览中的最后一个页面;
2)仅当用户真正在浏览页面时,才会计算用户的停留时间,这样的测量结果能够真实反映用户的浏览行为。
附图说明
图1现有技术中用户页面停留时长测量方法示意图;
图2本发明的用户页面停留时长测量流程图;
图3图2中数据采集模块的处理流程图;
图4图2中数据计算模块的处理流程图。
具体实施方式
以下结合附图,对本发明作进一步的说明,但并不以此为限。
图2是本发明的用户页面停留时长测量流程图。本发明的测量方法需要实现数据采集模块和数据计算模块2个模块。首先通过数据采集模块记录用户在计算机上的焦点窗口变化情况,形成用户的焦点窗口序列数据表;然后通过数据计算模块计算用户页面停留时长,最终得到用户页面停留时长测量结果。
图3是图2中数据采集模块的处理流程图。数据采集模块为在用户计算机上连续运行的、以2秒为间隔扫描的一个数据采集程序,它将用户在计算机上的焦点窗口变化情况一一记录下来,形成用户的焦点窗口序列数据表。
数据采集模块的一次扫描的具体处理流程如下:
i)初始化日志记录变量和最近一次进程ID变量,其中日志记录变量包括当前时点距离开机时点的时长、进程名、进程ID、产品名称、产品版本、公司名称、URL、浏览器地址栏句柄和浏览器TAB页句柄;
ii)通过Windows API获取当前焦点窗口句柄,若获取成功则继续执行,否则跳至步骤xiv);
iii)获取焦点窗口标题,获取焦点窗口进程ID;
iv)获取进程名;
v)判断焦点窗口进程ID与最近一次进程ID变量是否一致,若不一致则继续执行,否则跳至步骤ix);
vi)清空日志记录变量,更新最近一次进程ID变量;
vii)获取进程所对应的产品名称、产品版本和公司名称;
viii)将当前时点距离开机时点的时长、进程名、进程ID、产品名称、产品版本和公司名称记录到日志记录变量中;
ix)判断当前进程是否为浏览器,若是浏览器则继续,否则跳至步骤xiv);
x)更新最近一次进程ID变量;
xi)通过Windows API获取当前浏览器URL、浏览器地址栏句柄和浏览器TAB页句柄;
xii)判断当前浏览器URL、浏览器地址栏句柄和浏览器TAB页句柄是否都没有变化,若都没有变化则跳至步骤xiv),否则继续执行;
xiii)将当前时点距离开机时点的时长、进程名、进程ID、浏览器URL、浏览器地址栏句柄和浏览器TAB页句柄记录到日志记录变量中;
xiv)返回日志记录变量。
数据采集模块记录用户焦点窗口变化情况的具体步骤包括:
i)初始化焦点窗口序列数据表,以及最后一次扫描时间变量,其中焦点窗口序列数据表包括时间、窗口进程和浏览器URL三个字段;
ii)调用Windows API,获取用户计算机上的当前焦点窗口进程;
iii)判断当前焦点窗口进程是否为浏览器进程,若是则继续执行,否则跳至步骤vi);
iv)调用Windows API,获取当前浏览器窗口的地址栏URL;
v)判断当前焦点窗口进程和浏览器URL与焦点窗口序列数据表中的最后一条记录是否完全相同,若是则跳至步骤viii),否则跳至步骤vii);
vi)判断当前焦点窗口进程与焦点窗口序列数据表中的最后一条记录是否相同,若是则跳至步骤viii),否则继续执行;
vii)将当前时间、当前焦点窗口进程和浏览器URL(若有)追加到焦点窗口序列数据表中;
viii)将最后一次扫描时间变量值更新为当前时间,等待一个扫描间隔(如2秒),重新执行步骤ii)。
数据采集模块记录的焦点窗口序列数据表如表1所示:
表1.焦点窗口序列数据
Figure BDA00003238453600051
根据表1可知,用户在10:03:11将焦点窗口切换为浏览器,浏览页面URL为http://www.example.net/page1.html,停留47秒后,用户将焦点窗口切换为Office Word……
图4是图2中数据计算模块的处理流程图。数据计算模块计算用户页面停留时长的具体步骤包括:
i)初始化时长统计表,时长统计表包括页面URL和停留时长2个字段;
ii)读取下一条数据记录;
iii)判断焦点窗口是否为浏览器,若是则继续执行,否则重新开始执行步骤ii);
iv)判断当前记录是否为最后一条,若是则继续执行,否则跳至步骤vi);
v)读取最后一次扫描时间,作为离开时间,跳至步骤vii);
vi)读取下一条记录时间,作为离开时间;
vii)用离开时间减去当前记录时间,得到本次停留时长;
viii)查询时长统计表中是否已存在当前URL的统计时长记录,若是则跳至步骤x),否则继续执行;
ix)将当前URL添加为一条新的统计记录,统计时长初始化为0;
x)将本次停留时长累加到时长统计表中对应的URL统计时长上;
xi)判断当前记录是否为最后一条,若是则结束,否则重新开始执行步骤ii)。
以表1中的焦点窗口序列数据为基础,按照本发明的测量方法,我们可以得到如下测量结果:
表2.用户页面停留时长测量结果
页面URL 停留时长
http://www.example.net/page1.html 57秒
http://www.example.net/page2.html 12秒
http://www.example.net/page3.html 21秒
http://www.example.net/page4.html 17秒
具体计算过程如下:
依次读取表1的每一条记录,按照图4处理流程,计算得到每一条记录处理完成后,时长统计表的结果依次为:
第1条记录处理完成:
页面URL 停留时长
http://www.example.net/page1.html 47秒
第2条记录处理完成:
页面URL 停留时长
http://www.example.net/page1.html 47秒
第3条记录处理完成:
页面URL 停留时长
http://www.example.net/page1.html 57秒
第4条记录处理完成:
页面URL 停留时长
http://www.example.net/page1.html 57秒
http://www.example.net/page2.html 12秒
第5条记录处理完成:
页面URL 停留时长
http://www.example.net/page1.html 57秒
http://www.example.net/page2.html 12秒
http://www.example.net/page3.html 8秒
第6条记录处理完成:
页面URL 停留时长
http://www.example.net/page1.html 57秒
http://www.example.net/page2.html 12秒
http://www.example.net/page3.html 8秒
第7条记录处理完成:
页面URL 停留时长
http://www.example.net/page1.html 57秒
http://www.example.net/page2.html 12秒
http://www.example.net/page3.html 21秒
第8条记录处理完成:
页面URL 停留时长
http://www.example.net/page1.html 57秒
http://www.example.net/page2.html 12秒
http://www.example.net/page3.html 21秒
http://www.example.net/page4.html 17秒
第9条记录处理完成:
页面URL 停留时长
http://www.example.net/page1.html 57秒
http://www.example.net/page2.html 12秒
http://www.example.net/page3.html 21秒
http://www.example.net/page4.html 17秒

Claims (7)

1.一种用户页面停留时长的测量方法,包括以下步骤:
1)获取用户计算机上的当前焦点窗口进程;
2)当前焦点窗口进程为浏览器时,获取当前浏览器URL;
3)将获取到的焦点窗口进程、浏览器URL连同获取时间一并记录下来,形成焦点窗口序列数据表;
4)读取步骤3)形成的焦点窗口序列数据表中所述浏览器URL的进入和离开时间,用离开时间减去进入时间,得到该页面的本次停留时长。
2.如权利要求1所述的用户页面停留时长的测量方法,其特征在于,步骤1)中通过数据采集模块扫描用户计算机上的焦点窗口。
3.如权利要求2所述的用户页面停留时长的测量方法,其特征在于,所述数据采集模块扫描时间间隔为1-3秒。
4.如权利要求1所述的用户页面停留时长的测量方法,其特征在于,步骤3)中所述当前焦点窗口进程和浏览器URL与焦点窗口序列数据表中的最后一条记录完全相同时,将最后一次扫描时间变量值更新为进入时间;否则,将进入时间、当前焦点窗口进程和浏览器URL追加到焦点窗口序列数据表中。
5.如权利要求1所述的用户页面停留时长的测量方法,其特征在于,步骤4)中,焦点窗口序列数据表中的当前记录为最后一条时,读取最后一次扫描时间,作为离开时间;否则,读取下一条记录时间,作为离开时间。
6.如权利要求1所述的用户页面停留时长的测量方法,其特征在于,步骤4)中,所述浏览器URL和停留时长构成时长统计表。
7.如权利要求6所述的用户页面停留时长的测量方法,其特征在于,当所述时长统计表中已存在当前URL的统计时长记录时,将本次停留时长累加到时长统计表中对应的URL统计时长上;否则,将当前URL添加为一条新的统计记录,统计时长初始化为0,并将本次停留时长累加到时长统计表中对应的URL统计时长上。
CN201310195502.XA 2013-05-23 2013-05-23 一种用户页面停留时长的测量方法 Active CN103281217B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310195502.XA CN103281217B (zh) 2013-05-23 2013-05-23 一种用户页面停留时长的测量方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310195502.XA CN103281217B (zh) 2013-05-23 2013-05-23 一种用户页面停留时长的测量方法

Publications (2)

Publication Number Publication Date
CN103281217A true CN103281217A (zh) 2013-09-04
CN103281217B CN103281217B (zh) 2016-08-10

Family

ID=49063673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310195502.XA Active CN103281217B (zh) 2013-05-23 2013-05-23 一种用户页面停留时长的测量方法

Country Status (1)

Country Link
CN (1) CN103281217B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778254A (zh) * 2014-02-24 2014-05-07 北京国双科技有限公司 页面访问数据的处理方法、装置及系统
CN105376311A (zh) * 2015-11-11 2016-03-02 北京北信源软件股份有限公司 一种基于终端访问的页面停留时长确定方法及装置
CN106060117A (zh) * 2016-05-17 2016-10-26 北京京东尚科信息技术有限公司 一种页面停留时长的计时方法和装置
CN106897202A (zh) * 2017-02-28 2017-06-27 百度在线网络技术(北京)有限公司 用于输出数据的方法和装置
CN107066510A (zh) * 2017-01-22 2017-08-18 南方科技大学 一种信息处理方法及装置
CN109213906A (zh) * 2017-06-30 2019-01-15 北京国双科技有限公司 会话时长计算方法、装置及系统
CN109446038A (zh) * 2018-09-03 2019-03-08 平安普惠企业管理有限公司 页面访问时长的统计方法及终端设备
CN110633412A (zh) * 2019-08-15 2019-12-31 平安普惠企业管理有限公司 页面停留意愿分析方法、装置、计算机设备及存储介质
CN112269954A (zh) * 2020-10-28 2021-01-26 连尚(北京)网络科技有限公司 页面使用时长确定方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050257138A1 (en) * 2004-05-14 2005-11-17 Microsoft Corporation Systems and methods for defining web content navigation
CN101252401A (zh) * 2008-02-27 2008-08-27 华为技术有限公司 下载节目数据的方法、系统和终端设备
CN101894071A (zh) * 2010-06-30 2010-11-24 中山大学 一种机顶盒嵌入式浏览器集成测试方法及系统
CN102509233A (zh) * 2011-11-29 2012-06-20 汕头大学 一种基于用户网上动作信息的推荐方法
CN102663049A (zh) * 2012-03-29 2012-09-12 奇智软件(北京)有限公司 一种更新搜索引擎网址库方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050257138A1 (en) * 2004-05-14 2005-11-17 Microsoft Corporation Systems and methods for defining web content navigation
CN101252401A (zh) * 2008-02-27 2008-08-27 华为技术有限公司 下载节目数据的方法、系统和终端设备
CN101894071A (zh) * 2010-06-30 2010-11-24 中山大学 一种机顶盒嵌入式浏览器集成测试方法及系统
CN102509233A (zh) * 2011-11-29 2012-06-20 汕头大学 一种基于用户网上动作信息的推荐方法
CN102663049A (zh) * 2012-03-29 2012-09-12 奇智软件(北京)有限公司 一种更新搜索引擎网址库方法及装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778254A (zh) * 2014-02-24 2014-05-07 北京国双科技有限公司 页面访问数据的处理方法、装置及系统
CN105376311A (zh) * 2015-11-11 2016-03-02 北京北信源软件股份有限公司 一种基于终端访问的页面停留时长确定方法及装置
CN105376311B (zh) * 2015-11-11 2018-09-11 北京北信源软件股份有限公司 一种基于终端访问的页面停留时长确定方法及装置
CN106060117A (zh) * 2016-05-17 2016-10-26 北京京东尚科信息技术有限公司 一种页面停留时长的计时方法和装置
CN107066510B (zh) * 2017-01-22 2021-12-03 南方科技大学 一种信息处理方法及装置
CN107066510A (zh) * 2017-01-22 2017-08-18 南方科技大学 一种信息处理方法及装置
CN106897202B (zh) * 2017-02-28 2020-09-01 百度在线网络技术(北京)有限公司 用于输出数据的方法和装置
CN106897202A (zh) * 2017-02-28 2017-06-27 百度在线网络技术(北京)有限公司 用于输出数据的方法和装置
CN109213906A (zh) * 2017-06-30 2019-01-15 北京国双科技有限公司 会话时长计算方法、装置及系统
CN109213906B (zh) * 2017-06-30 2022-02-11 北京国双科技有限公司 会话时长计算方法、装置及系统
CN109446038A (zh) * 2018-09-03 2019-03-08 平安普惠企业管理有限公司 页面访问时长的统计方法及终端设备
CN110633412A (zh) * 2019-08-15 2019-12-31 平安普惠企业管理有限公司 页面停留意愿分析方法、装置、计算机设备及存储介质
CN112269954A (zh) * 2020-10-28 2021-01-26 连尚(北京)网络科技有限公司 页面使用时长确定方法和装置
CN112269954B (zh) * 2020-10-28 2024-05-03 连尚(北京)网络科技有限公司 页面使用时长确定方法和装置

Also Published As

Publication number Publication date
CN103281217B (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
CN103281217A (zh) 一种用户页面停留时长的测量方法
US20210056257A1 (en) Obtaining data from incomplete electronic forms
CN102385594B (zh) 多核浏览器的内核控制方法和装置
US8073947B1 (en) Method and apparatus for determining notable content on web sites
CN102932206B (zh) 监测网站访问信息的方法和系统
CN104239298B (zh) 文本信息推荐方法、服务器、浏览器及系统
US20110078558A1 (en) Method and system for identifying advertisement in web page
WO2014107682A1 (en) Method and apparatus for generating webpage content
KR20080111822A (ko) 사용자 검색어를 연동하여 가이드 정보, 랭킹 정보를제공하는 검색지원 정보 시스템.
CN104951961A (zh) 用于推送内容的方法、终端、服务器以及系统
CN103853716B (zh) 网页显示系统及方法
CN102521251A (zh) 个性化搜索直达的方法、实现该方法的装置和搜索服务器
CN103761330A (zh) 基于模版配置实现互联网信息自动提取的系统及方法
CN103186565A (zh) 根据用户网页浏览行为判断用户偏好的方法及装置
CN105183912A (zh) 异常日志确定方法和装置
CN105069168A (zh) 搜索词推荐方法和装置
CN102360386A (zh) 电子商务网站智能导购系统和方法
CN102932207A (zh) 监测网站访问信息的方法及服务器
CN103235800A (zh) 一种搜索结果的预览方法及系统
CN106326261A (zh) 一种网页页面的预读取方法、装置及智能终端设备
CN105045872A (zh) 信息的筛选方法及装置
CN102314516A (zh) 网页处理方法及其移动终端、电子设备
CN103325051A (zh) 一种平台返利购物方法
CN104090908A (zh) 统计页面组的平均停留时间、网站内容推广的方法和装置
CN103034640A (zh) 一种页面信息的分析方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210209

Address after: 100190 room 506, building 2, courtyard 4, South 4th Street, Zhongguancun, Haidian District, Beijing

Patentee after: CHINA INTERNET NETWORK INFORMATION CENTER

Address before: 100190 No. four, 4 South Street, Haidian District, Beijing, Zhongguancun

Patentee before: Computer Network Information Center, Chinese Academy of Sciences