CN102279786B - 一种监测应用程序有效访问量的方法及装置 - Google Patents

一种监测应用程序有效访问量的方法及装置 Download PDF

Info

Publication number
CN102279786B
CN102279786B CN201110245611.9A CN201110245611A CN102279786B CN 102279786 B CN102279786 B CN 102279786B CN 201110245611 A CN201110245611 A CN 201110245611A CN 102279786 B CN102279786 B CN 102279786B
Authority
CN
China
Prior art keywords
app
user behavior
behavior
session
behavior data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110245611.9A
Other languages
English (en)
Other versions
CN102279786A (zh
Inventor
周俊
杨然
张天龙
朱建庭
望金蓉
刘建国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201110245611.9A priority Critical patent/CN102279786B/zh
Publication of CN102279786A publication Critical patent/CN102279786A/zh
Application granted granted Critical
Publication of CN102279786B publication Critical patent/CN102279786B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了一种监测应用程序(APP)有效访问量的方法及装置,其中方法包括:获取用户行为数据;将用户行为数据与预先挖掘出的有效访问行为模式进行匹配,确定符合所述有效访问行为模式的用户行为数据,所述有效访问行为模式包括:加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;基于符合所述有效访问行为模式的用户行为数据统计所述APP的有效访问量。通过本发明能够准确地识别出对APP的有效访问并统计出APP的有效访问量,从而使之成为准确评价APP、对APP进行排序或者合理分配资源等的依据。

Description

一种监测应用程序有效访问量的方法及装置
【技术领域】
本发明涉及计算机技术领域,特别涉及一种监测应用程序(APP)有效访问量的方法和装置。
【背景技术】
应用程序(APP)的访问量通常是评价APP、对APP进行排序甚至分配资源等的关键标准,因此可能会存在针对APP使用量的作弊行为,并且该作弊行为可能来自APP的开发者本身,例如反复多次点击某个APP的链接,导致监测到的APP使用量增加,但点击该APP的链接的用户可能并未真正使用该APP,那么对该APP的访问就不是有效访问。
因此,为了准确评价APP、对APP进行排序或者合理分配资源等,如何监测出APP有效访问量成为目前亟待解决的问题。
【发明内容】
本发明提供了一种监测APP有效访问量的方法和装置,以便于准确地识别出对APP的有效访问并统计出APP的有效访问量,从而使之成为准确评价APP、对APP进行排序或者合理分配资源等的依据。
具体技术方案如下:
一种挖掘APP有效访问行为模式的方法,该方法包括:
A、获取用户行为数据;
B、将所述用户行为数据按照预设用户行为划分为各会话(session),各session代表所述预设用户行为及所述预设用户行为之后的行为;
C、将每一个session中的用户行为数据按照时间进行排序;
D、确定包含用户行为数据条数排在前N个的session,N为预设的正整数;
E、从确定的session中抽取公共用户行为得到APP有效访问行为模式,所述APP有效访问行为模式至少包括:加载APP且在该APP运行页面的停留时间大于预设的时间阈值。
其中,所述预设用户行为包括:搜索APP的行为、点击APP的行为或者加载APP的行为。
具体地,所述APP有效访问行为模式可以为:
搜索所述APP、点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值。
一种监测APP有效访问量的方法,该方法包括:
A、获取用户行为数据;
B、将用户行为数据与预先挖掘出的APP有效访问行为模式进行匹配,确定符合所述APP有效访问行为模式的用户行为数据,所述APP有效访问行为模式包括:加载APP且在所述APP运行页面的停留时间大于预设的时间阈值;
C、基于符合所述APP有效访问行为模式的用户行为数据统计所述APP的有效访问量。
更进一步地,在所述步骤A和所述步骤B之间还包括:
D、对所述步骤A获取的用户行为数据进行有效性校验,过滤掉校验失败的用户行为数据;
其中所述有效性校验包括:cookie校验、密钥校验或者跳转页面来源校验。
其中,所述步骤B具体包括:
B1、将用户行为数据按照预设用户行为划分为各会话session,各session代表所述预设用户行为及所述预设用户行为之后的行为;
B2、将各session中的用户行为数据按照时间进行排序后,分别与所述有效访问行为模式进行匹配,过滤掉不匹配的session;
B3、从过滤后得到的各session中分别抽取出一条具有公共特征的用户行为数据作为符合APP有效访问行为模式的用户行为数据的代表。
所述预设用户行为包括:搜索APP的行为、点击APP的行为或者加载APP的行为。
较优地,在所述步骤B和所述步骤C之间还包括步骤E、F和G中的至少一个:
E、基于所述步骤B确定的用户行为数据对应的访问频率、访问时间间隔以及设定时长内的访问次数中的至少一种,为所述步骤B确定的用户行为数据打分,过滤掉打分值不满足预设分值要求的用户行为数据;
F、如果在某时间段内某用户的访问次数比所述某用户在第一设定时长内的平均访问次数高出预设的第一次数阈值,则将所述某时间段内所述某用户的用户行为数据过滤掉,所述某时间段的时长为所述第一设定时长;
G、如果在某时间段内所述APP的被访问次数比所述APP在第二设定时长内的平均被访问次数高于预设的第二次数阈值,则将所述某时间段内访问所述APP的用户行为数据过滤掉,所述某时间段的时长为所述第二设定时长。
所述APP有效访问行为模式具体为:
搜索所述APP、点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值。
一种挖掘APP有效访问行为模式的装置,该装置包括:数据获取单元、会话切分单元、行为排序单元、会话确定单元和模式抽取单元;
所述数据获取单元,用于获取用户行为数据;
所述会话切分单元,用于将所述用户行为数据按照预设用户行为划分为各会话session,各session代表所述预设用户行为及所述预设用户行为之后的行为;
所述行为排序单元,用于将每一个session中的用户行为数据按照时间进行排序;
所述会话确定单元,用于确定包含用户行为数据条数排在前N个的session,N为预设的正整数;
所述模式抽取单元,用于从确定的session中抽取公共用户行为得到APP有效访问行为模式,所述APP有效访问行为模式至少包括:加载APP且在该APP运行页面的停留时间大于预设的时间阈值。
其中,所述预设用户行为包括:搜索APP的行为、点击APP的行为或者加载APP的行为。
所述APP有效访问行为模式具体为:
搜索所述APP、点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值。
一种监测APP有效访问量的装置,该装置包括:数据获取单元、模式匹配单元以及访问量统计单元;
所述数据获取单元,用于获取用户行为数据,并提供给所述模式匹配单元;
所述模式匹配单元,用于将用户行为数据与预先挖掘出的APP有效访问行为模式进行匹配,确定符合所述APP有效访问行为模式的用户行为数据,所述APP有效访问行为模式包括:加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;
所述访问量统计单元,用于基于符合所述APP有效访问行为模式的用户行为数据统计所述APP的有效访问量。
更进一步地,该装置还包括:
校验单元,用于将所述数据获取单元提供给所述模式匹配单元的用户行为数据进行有效性校验,过滤掉校验失败的用户行为数据;
其中所述有效性校验包括:cookie校验、密钥校验或者跳转页面来源校验。
具体地,所述模式匹配单元可以包括:
划分子单元,用于将用户行为数据按照预设用户行为划分为各session,各session代表所述预设用户行为及所述预设用户行为之后的行为;
匹配子单元,用于将各session中的用户行为数据按照时间进行排序后,分别与所述APP有效访问行为模式进行匹配,过滤掉不匹配的session;
抽取子单元,用于从所述匹配子单元过滤后得到的各session中分别抽取出一条具有公共特征的用户行为数据作为符合APP有效访问行为模式的用户行为数据的代表。
其中,所述预设用户行为包括:搜索APP的行为、点击APP的行为或者加载APP的行为。
优选地,该装置还包括以下单元中的至少一个:
规则过滤单元,用于基于所述模式匹配单元确定的用户行为数据对应的访问频率、访问时间间隔以及设定时长内的访问次数中的至少一种,为所述模式匹配单元确定的用户行为数据打分,过滤掉打分值不满足预设分值要求的用户行为数据;
第一异常过滤单元,用于如果在某时间段内某用户的访问次数比所述某用户在第一设定时长内的平均访问次数高出预设的第一次数阈值,则将所述某时间段内所述某用户的用户行为数据过滤掉,所述某时间段的时长为所述第一设定时长;
第二异常过滤单元,用于如果在某时间段内所述APP的被访问次数比所述APP在第二设定时长内的平均被访问次数高于预设的第二次数阈值,则将所述某时间段内访问所述APP的用户行为数据过滤掉,所述某时间段的时长为所述第二设定时长。
所述APP有效访问行为模式具体为:
搜索所述APP、点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值。
由以上技术方案可以看出,本发明预先挖掘出APP有效访问行为模式,该APP有效访问行为模式包括:加载APP且在该APP运行页面的停留时间大于预设的时间阈值,利用该APP有效访问行为模式与用户行为数据进行匹配,从而准确地识别出对APP的有效访问并统计出APP的有效访问量,使之成为准确评价APP、对APP进行排序或者合理分配资源等的依据。
【附图说明】
图1为本发明实施例一提供的挖掘APP有效访问行为模式的方法流程图;
图2为本发明实施例二提供的监测APP有效访问量的方法流程图;
图3为本发明实施例二提供的匹配APP有效访问行为模式的方法流程图;
图4为本发明实施例三提供的挖掘APP有效访问行为模式的装置结构图;
图5为本发明实施例四提供的监测APP有效访问量的装置结构图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
在本发明中可以预先挖掘出APP有效访问行为模式,将用户行为数据与该APP有效访问行为模式进行匹配,基于符合该APP有效访问行为模式的用户行为数据统计APP的有效访问量。首先通过实施例一对挖掘APP有效访问行为模式的过程进行详细描述。
实施例一、
图1为本发明实施例一提供的挖掘APP有效访问行为模式的方法流程图,如图1所示,具体挖掘过程可以包括以下步骤:
步骤101:获取用户行为数据。
本步骤可以从用户访问日志中获取设定时间范围内的用户行为数据。
步骤102:将用户行为数据按照搜索划分为不同的session。
一个session中可以包括多条用户行为数据,代表一次搜索以及该搜索之后的行为,例如点击、加载行为等。除了按照搜索划分session之外,也可以按照点击将用户行为数据划分为不同的session,此时,一个session就代表一次点击以及该点击之后的行为。还可以按照加载将用户行为数据划分为不同的session,此时一个session就代表一次加载以及加载之后的行为。
步骤103:将每一个session中的用户行为数据按照时间进行排序。
在一个session中多条用户行为数据是存在时间先后顺序的,为了能够找出准确的APP有效访问行为模式,需要将每一个session中的用户行为数据按照时间进行排序。
例如,在一个session中存在点击APP链接的行为数据、搜索APP的行为数据、加载APP的行为数据等,则按照时间进行排序后,得到的排序结果为:搜索APP的行为数据-点击APP链接的行为数据-记载APP的行为数据。
步骤104:确定包含用户行为数据条数排在前N个的session,N为预设的正整数。
对于各session而言,包含的用户行为数据条数越多,其越有可能具备APP的有效访问,而包含的用户行为数据条数越少,则具备APP的有效访问的可能性越小。例如,某个session包含一条用户行为数据,则该session可能仅限于搜索APP的行为,或点击APP的链接的行为。因此,本步骤将包含用户行为数据条数排在前N个的session确定出来作为抽取APP有效访问行为模式的候选资源。
步骤105:从这些session中抽取公共用户行为得到APP有效访问行为模式。
通过该步骤抽取出的APP有效访问行为模式至少包括:加载APP且在该APP运行页面的停留时间大于预设的时间阈值。具体可以为:搜索APP、点击该APP的链接、加载APP且在该APP运行页面的停留时间大于预设的时间阈值;或者,点击该APP的链接、加载APP且在该APP运行页面的停留时间大于预设的时间阈值;或者,加载APP且在该APP运行页面的停留时间大于预设的时间阈值。
下面通过实施例二对利用挖掘出的APP有效访问行为模式检测APP有效访问量的过程进行描述。
实施例二、
图2为本发明实施例二提供的监测APP有效访问量的方法流程图,如图2所示,该方法可以包括以下步骤:
步骤201:获取用户行为数据。
通常在用户访问日志中会记录有用户行为数据,本步骤可以从用户访问日志中获取用户行为数据。
其中,用户行为数据可以包括但不限于:搜索APP的行为数据、点击APP的行为数据、加载APP的行为数据以及各种用户行为对应的停留时间。
步骤202:对用户行为数据进行有效性校验,过滤掉校验失败的用户行为数据。
上述有效性校验包括但不限于:cookie校验、密钥校验或者参考(refer)校验。
其中,在进行cookie校验时,如果cookie为空,则认为cookie校验失败。
由于服务器端收到的用户行为数据可能是经过加密算法后的数据,在加密算法中会涉及到密钥和密钥生存期,因此,在进行密钥校验时,如果密钥错误或者超过密钥生存期,则认为密钥校验失败。
上述refer校验实际上就是对用户数据中的跳转页面来源进行校验,可以预先定义合法的跳转页面来源或者预先定义不合法的跳转页面来源,将不合法的跳转页面来源所对应的用户数据过滤掉,即如果用户数据对应的跳转页面来源不合法,则认为refer校验失败。例如,预先定义www.baidu.com作为合法的跳转页面来源,那么将其他跳转页面来源的用户行为数据都过滤掉,这样只有通过www.baidu.com搜索并跳转到APP页面的用户数据才会保留。
需要说明的是,步骤202是为了提高效率,降低服务器端的监测压力,提高数据安全性的,是本发明实施例中的可选步骤。
步骤203:将用户行为数据与预先挖掘出的APP有效访问行为模式进行匹配,确定符合APP有效访问行为模式的用户行为数据。
其中,确定符合APP有效访问行为模式的用户行为数据的过程可以如图3所示,具体包括以下步骤:
步骤301:将用户行为数据按照搜索划分为不同的session。
一个session中可以包括多条用户行为数据,代表一次搜索以及该搜索之后的行为,例如点击、加载行为等。除了按照搜索划分session之外,也可以按照点击将用户行为数据划分为不同的session,此时,一个session就代表一次点击以及该点击之后的行为。还可以按照加载将用户行为数据划分为不同的session,此时一个session就代表一次加载以及加载之后的行为。
步骤302:将每一个session中的用户行为数据按照时间进行排序后,分别与APP有效访问行为模式进行匹配,过滤掉不匹配的session。
执行本步骤后,剩余的session就是符合APP有效访问行为模式的session,例如,点击APP的链接后加载该APP且在该APP运行页面的停留时间大于预设的时间阈值的session。当采用这种APP有效访问行为模式时,只有用户具有搜索行为、点击APP的链接、加载该APP且在APP运行页面的停留时间大于预设的时间阈值时,才能确定该用户对该APP有效访问。其中预设的时间阈值可以根据需求灵活设置,例如设置为1分钟。
步骤303:从过滤后的session中分别抽取出一条具有公共特征的用户行为数据作为符合APP有效访问行为模式的用户行为数据的代表。
由于每个session中可能包含多条用户行为数据,为了方便后续进行APP有效访问量的统计,可以从每个session中分别抽取出一条具有公共特征的用户行为数据作为对应session的代表,这样也方便后续进行的过滤步骤。
其中上述公共特征可以为:鼠标滑动至APP范围内、点击行为或者加载行为等。
重新参见图2,接续图2中的步骤203。
步骤204:基于步骤203确定的用户行为数据对应的访问频率、访问时间间隔以及设定时长内的访问次数中的至少一种,为步骤203确定的用户行为数据打分,过滤掉打分值不满足预设分值要求的用户行为数据。
在本步骤中可以预先设置基于访问频率、访问时间间隔或者设定时长内的访问次数的打分规则,本发明对具体的打分规则并不加以限定。举一个例子,可以预先设置用户行为数据的初始分值为100,如果某用户行为数据对应的访问频率在100以内,则不减分,如果对应的访问频率在100到150之间,则减去10分,如果对应的访问频率在150到200之间的,减去20分;如果某用户行为数据对应的访问时间间隔小于5秒,则减去5分;如果某用户行为数据在一天内的总访问次数大于1000次,则减去10分,等等。最终得到用户行为数据的打分值,将不满足预设分值要求的用户行为数据过滤掉,例如将分值小于80分的用户行为数据过滤掉。本步骤的目的是用于进行进一步的访问频率控制、访问时间间隔控制或者访问总次数控制,本步骤也是本发明实施例的可选步骤。
步骤205:如果在某时间段内某用户对APP的访问次数比该用户在第一设定时长内的平均访问次数高出预设的第一次数阈值,则将该时间段内的用户行为数据过滤掉,其中上述某时间段的时长为第一设定时长。
例如,某用户在一天内的平均访问次数为100次,但某一天的访问次数突然增至200次,突增了100次,如果突增的次数高于设定的第一次数阈值,则将该天的用户行为数据过滤掉,不参与后续的有效访问量统计。
步骤206:如果在某时间段内某APP的被访问次数比该APP在第二设定时长内的平均被访问次数高出预设的第二次数阈值,则将该时间段内访问该APP的用户行为数据过滤掉,其中上述时间段的时长为第二设定时长。
例如,如果一天内某APP的平均被访问次数为1000次,但某一天的被访问次数突然增至5000次,突增了4000次,如果突增的次数高于设定的第二次数阈值,则将该天访问该APP的用户行为数据过滤掉,不参与后续的有效访问量统计。
上述步骤205和步骤206是异常过滤,即将用户访问次数突增以及APP被访问次数突增的用户行为数据过滤掉,这两个步骤也是本发明实施例的可选步骤。步骤204、步骤205和步骤206可以以任意的顺序先后执行,也可以同时执行。
步骤207:基于过滤后的用户行为数据统计各APP的有效访问量。
在进行过滤后的用户行为数据中针对各APP分别统计APP的有效访问量,由于在步骤303从session中分别抽取出一条具有公共特征的用户行为数据作为符合APP有效访问行为模式的用户行为数据的代表(参见图3中的步骤303),因此可以直接统计各APP对应的用户行为数据的条数,以此确定各APP的有效访问量。
以上是对本发明所提供的方法进行的描述,下面通过实施例三和实施例四对本发明所提供的对应装置进行详细描述。
实施例三、
图4为本发明实施例三提供的挖掘APP有效访问行为模式的装置结构图,如图4所示,该装置可以包括:数据获取单元400、会话切分单元410、行为排序单元420、会话确定单元430和模式抽取单元440。
数据获取单元400获取用户行为数据。
会话切分单元410将用户行为数据按照预设用户行为划分为各session,各session代表预设用户行为及预设用户行为之后的行为。其中,预设用户行为可以包括:搜索APP的行为、点击APP的行为或者加载APP的行为。
行为排序单元420将每一个session中的用户行为数据按照时间进行排序。
会话确定单元430确定包含用户行为数据条数排在前N个的session,N为预设的正整数。
模式抽取单元440从确定的session中抽取公共用户行为得到APP有效访问行为模式,APP有效访问行为模式至少包括:加载APP且在该APP运行页面的停留时间大于预设的时间阈值。
上述挖掘出的APP有效访问行为模式可以具体为:搜索APP、点击APP的链接、加载APP且在APP运行页面的停留时间大于预设的时间阈值;或者,点击APP的链接、加载APP且在APP运行页面的停留时间大于预设的时间阈值;或者,加载APP且在APP运行页面的停留时间大于预设的时间阈值。
实施例四、
图5为本发明实施例四提供的检测APP有效访问量的装置结构图,如图5所示,该装置可以包括:数据获取单元500、模式匹配单元510以及访问量统计单元520。
数据获取单元500获取用户行为数据,并提供给模式匹配单元510。
上述的用户行为数据可以包括但不限于:搜索行为数据、点击行为数据、APP加载信息以及各种用户行为对应的停留时间。
模式匹配单元510将用户行为数据与预先挖掘出的APP有效访问行为模式进行匹配,确定符合APP有效访问行为模式的用户行为数据,APP有效访问行为模式包括:加载APP且在APP运行页面的停留时间大于预设的时间阈值。
访问量统计单元520基于符合APP有效访问行为模式的用户行为数据统计APP的有效访问量。
另外,为了提高效率,降低服务器端的监测压力,提高数据安全性,该装置还包括:校验单元530。
校验单元530将数据获取单元500提供给模式匹配单元510的用户行为数据进行有效性校验,过滤掉校验失败的用户行为数据。其中有效性校验包括:cookie校验、密钥校验或者跳转页面来源校验。
其中,在进行cookie校验时,如果cookie为空,则认为cookie校验失败。
由于服务器端收到的用户行为数据可能是经过加密算法后的数据,在加密算法中会涉及到密钥和密钥生存期,因此,在进行密钥校验时,如果密钥错误或者超过密钥生存期,则认为密钥校验失败。
对用户数据中的跳转页面来源进行校验时,可以预先定义合法的跳转页面来源或者预先定义不合法的跳转页面来源,将不合法的跳转页面来源所对应的用户数据过滤掉,即如果用户数据对应的跳转页面来源不合法,则认为refer校验失败。例如,预先定义www.baidu.com作为合法的跳转页面来源,那么将其他跳转页面来源的用户行为数据都过滤掉,这样只有通过www.baidu.com搜索并跳转到APP页面的用户数据才会保留。
具体地,模式匹配单元510可以包括:划分子单元511、匹配子单元512以及抽取子单元513。
划分子单元511将用户行为数据按照预设用户行为划分为各session,各session代表预设用户行为及其之后的行为。其中预设用户行为可以包括:搜索APP的行为、点击APP的行为或者加载APP的行为。
匹配子单元512将各session中的用户行为数据按照时间进行排序后,分别与APP有效访问行为模式进行匹配,过滤掉不匹配的session。
抽取子单元513从匹配子单元512过滤后得到的各session中分别抽取出一条具有公共特征的用户行为数据作为符合APP有效访问行为模式的用户行为数据的代表。
其中上述公共特征可以为:鼠标滑动至APP范围内、点击行为或者加载行为等。
另外,该装置还可以包括:规则过滤单元540。
规则过滤单元540基于模式匹配单元510确定的用户行为数据对应的访问频率、访问时间间隔以及设定时长内的访问次数中的至少一种,为模式匹配单元510确定的用户行为数据打分,过滤掉打分值不满足预设分值要求的用户行为数据。
在此可以预先设置基于访问频率、访问时间间隔或者设定时长内的访问次数的打分规则,依据打分规则为用户行为数据打分。
为了避免将访问量突增的用户对应的异常用户行为数据纳入APP的有效访问量统计,该装置还可以包括:第一异常过滤单元550。
如果在某时间段内某用户的访问次数比某用户在第一设定时长内的平均访问次数高出预设的第一次数阈值,则第一异常过滤单元550将某时间段内某用户的用户行为数据过滤掉,某时间段的时长为第一设定时长。
为了避免将被访问量突增的APP对应的异常用户行为数据纳入APP的有效访问量统计,该装置还可以包括:第二异常过滤单元560。
如果在某时间段内APP的被访问次数比APP在第二设定时长内的平均被访问次数高于预设的第二次数阈值,则第二异常过滤单元560将某时间段内访问APP的用户行为数据过滤掉,某时间段的时长为第二设定时长。
上述的规则过滤单元540、第一异常过滤单元550和第二异常过滤单元560可以以任意组合的形式设置在装置中,且这三个单元之间可以以任意的顺序串联在模式匹配单元510和访问量统计单元520之间(图5中示出其中一种方式),也可以以并联的方式连接在模式匹配单元510和访问量统计单元520之间。
该实施例中APP有效访问行为模式可以具体为:搜索APP、点击APP的链接、加载APP且在APP运行页面的停留时间大于预设的时间阈值;或者,点击APP的链接、加载APP且在APP运行页面的停留时间大于预设的时间阈值;或者,加载APP且在APP运行页面的停留时间大于预设的时间阈值。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (16)

1.一种挖掘应用程序APP有效访问行为模式的方法,其特征在于,该方法包括:
A、获取用户行为数据;
B、将所述用户行为数据按照预设用户行为划分为各会话session,各session代表所述预设用户行为及所述预设用户行为之后的行为;
C、将每一个session中的用户行为数据按照时间进行排序;
D、确定包含用户行为数据条数排在前N个的session,N为预设的正整数;
E、从确定的session中抽取公共用户行为得到APP有效访问行为模式,所述APP有效访问行为模式至少包括:加载APP且在该APP运行页面的停留时间大于预设的时间阈值。
2.根据权利要求1所述的方法,其特征在于,所述预设用户行为包括:搜索APP的行为、点击APP的行为或者加载APP的行为。
3.根据权利要求1或2所述的方法,其特征在于,所述APP有效访问行为模式具体为:
搜索所述APP、点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值。
4.一种监测应用程序APP有效访问量的方法,其特征在于,该方法包括:
A、获取用户行为数据;
B、将用户行为数据与预先挖掘出的APP有效访问行为模式进行匹配,确定符合所述APP有效访问行为模式的用户行为数据;
C、基于符合所述APP有效访问行为模式的用户行为数据统计所述APP的有效访问量;
其中,所述APP有效访问行为模式包括:
搜索所述APP、点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值。
5.根据权利要求4所述的方法,其特征在于,在所述步骤A和所述步骤B之间还包括:
D、对所述步骤A获取的用户行为数据进行有效性校验,过滤掉校验失败的用户行为数据;
其中所述有效性校验包括:cookie校验、密钥校验或者跳转页面来源校验。
6.根据权利要求4所述的方法,其特征在于,所述步骤B具体包括:
B1、将用户行为数据按照预设用户行为划分为各会话session,各session代表所述预设用户行为及所述预设用户行为之后的行为;
B2、将各session中的用户行为数据按照时间进行排序后,分别与所述有效访问行为模式进行匹配,过滤掉不匹配的session;
B3、从过滤后得到的各session中分别抽取出一条具有公共特征的用户行为数据作为符合APP有效访问行为模式的用户行为数据的代表。
7.根据权利要求6所述的方法,其特征在于,所述预设用户行为包括:搜索APP的行为、点击APP的行为或者加载APP的行为。
8.根据权利要求4所述的方法,其特征在于,在所述步骤B和所述步骤C之间还包括步骤E、F和G中的至少一个:
E、基于所述步骤B确定的用户行为数据对应的访问频率、访问时间间隔以及设定时长内的访问次数中的至少一种,为所述步骤B确定的用户行为数据打分,过滤掉打分值不满足预设分值要求的用户行为数据;
F、如果在某时间段内某用户的访问次数比所述某用户在第一设定时长内的平均访问次数高出预设的第一次数阈值,则将所述某时间段内所述某用户的用户行为数据过滤掉,所述某时间段的时长为所述第一设定时长;
G、如果在某时间段内所述APP的被访问次数比所述APP在第二设定时长内的平均被访问次数高于预设的第二次数阈值,则将所述某时间段内访问所述APP的用户行为数据过滤掉,所述某时间段的时长为所述第二设定时长。
9.一种挖掘应用程序APP有效访问行为模式的装置,其特征在于,该装置包括:数据获取单元、会话切分单元、行为排序单元、会话确定单元和模式抽取单元;
所述数据获取单元,用于获取用户行为数据;
所述会话切分单元,用于将所述用户行为数据按照预设用户行为划分为各会话session,各session代表所述预设用户行为及所述预设用户行为之后的行为;
所述行为排序单元,用于将每一个session中的用户行为数据按照时间进行排序;
所述会话确定单元,用于确定包含用户行为数据条数排在前N个的session,N为预设的正整数;
所述模式抽取单元,用于从确定的session中抽取公共用户行为得到APP有效访问行为模式,所述APP有效访问行为模式至少包括:加载APP且在该APP运行页面的停留时间大于预设的时间阈值。
10.根据权利要求9所述的装置,其特征在于,所述预设用户行为包括:搜索APP的行为、点击APP的行为或者加载APP的行为。
11.根据权利要求9或10所述的装置,其特征在于,所述APP有效访问行为模式具体为:
搜索所述APP、点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值。
12.一种监测应用程序APP有效访问量的装置,其特征在于,该装置包括:数据获取单元、模式匹配单元以及访问量统计单元;
所述数据获取单元,用于获取用户行为数据,并提供给所述模式匹配单元;
所述模式匹配单元,用于将用户行为数据与预先挖掘出的APP有效访问行为模式进行匹配,确定符合所述APP有效访问行为模式的用户行为数据;
所述访问量统计单元,用于基于符合所述APP有效访问行为模式的用户行为数据统计所述APP的有效访问量;
其中,所述APP有效访问行为模式包括:
搜索所述APP、点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
点击所述APP的链接、加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值;或者,
加载所述APP且在所述APP运行页面的停留时间大于预设的时间阈值。
13.根据权利要求12所述的装置,其特征在于,该装置还包括:
校验单元,用于将所述数据获取单元提供给所述模式匹配单元的用户行为数据进行有效性校验,过滤掉校验失败的用户行为数据;
其中所述有效性校验包括:cookie校验、密钥校验或者跳转页面来源校验。
14.根据权利要求12所述的装置,其特征在于,所述模式匹配单元具体包括:
划分子单元,用于将用户行为数据按照预设用户行为划分为各session,各session代表所述预设用户行为及所述预设用户行为之后的行为;
匹配子单元,用于将各session中的用户行为数据按照时间进行排序后,分别与所述APP有效访问行为模式进行匹配,过滤掉不匹配的session;
抽取子单元,用于从所述匹配子单元过滤后得到的各session中分别抽取出一条具有公共特征的用户行为数据作为符合APP有效访问行为模式的用户行为数据的代表。
15.根据权利要求14所述的装置,其特征在于,所述预设用户行为包括:搜索APP的行为、点击APP的行为或者加载APP的行为。
16.根据权利要求14所述的装置,其特征在于,该装置还包括以下单元中的至少一个:
规则过滤单元,用于基于所述模式匹配单元确定的用户行为数据对应的访问频率、访问时间间隔以及设定时长内的访问次数中的至少一种,为所述模式匹配单元确定的用户行为数据打分,过滤掉打分值不满足预设分值要求的用户行为数据;
第一异常过滤单元,用于如果在某时间段内某用户的访问次数比所述某用户在第一设定时长内的平均访问次数高出预设的第一次数阈值,则将所述某时间段内所述某用户的用户行为数据过滤掉,所述某时间段的时长为所述第一设定时长;
第二异常过滤单元,用于如果在某时间段内所述APP的被访问次数比所述APP在第二设定时长内的平均被访问次数高于预设的第二次数阈值,则将所述某时间段内访问所述APP的用户行为数据过滤掉,所述某时间段的时长为所述第二设定时长。
CN201110245611.9A 2011-08-25 2011-08-25 一种监测应用程序有效访问量的方法及装置 Active CN102279786B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110245611.9A CN102279786B (zh) 2011-08-25 2011-08-25 一种监测应用程序有效访问量的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110245611.9A CN102279786B (zh) 2011-08-25 2011-08-25 一种监测应用程序有效访问量的方法及装置

Publications (2)

Publication Number Publication Date
CN102279786A CN102279786A (zh) 2011-12-14
CN102279786B true CN102279786B (zh) 2015-11-25

Family

ID=45105248

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110245611.9A Active CN102279786B (zh) 2011-08-25 2011-08-25 一种监测应用程序有效访问量的方法及装置

Country Status (1)

Country Link
CN (1) CN102279786B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365927A (zh) * 2012-03-30 2013-10-23 北京千橡网景科技发展有限公司 基于用户数据的网页分析方法和系统
CN103761228B (zh) * 2013-10-10 2017-10-13 北京智谷睿拓技术服务有限公司 应用程序的排名阈值确定方法和排名阈值确定系统
CN103530796B (zh) 2013-10-10 2016-06-01 北京智谷睿拓技术服务有限公司 应用程序的活跃期检测方法和活跃期检测系统
CN103577543B (zh) * 2013-10-10 2017-06-16 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN103559210B (zh) * 2013-10-10 2017-08-15 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN103593484A (zh) * 2013-12-03 2014-02-19 南京安讯科技有限责任公司 一种手机上网垃圾日志的过滤方法
CN103942136B (zh) * 2014-04-21 2017-06-16 北京音之邦文化科技有限公司 日志统计策略配置方法和装置、日志统计方法和装置
CN104156487B (zh) * 2014-08-28 2017-10-03 北京国双科技有限公司 网页数据统计方法及装置
CN104298755B (zh) * 2014-10-20 2018-07-24 北京奇虎科技有限公司 内容推送方法、内容推送系统和服务器
CN105718462B (zh) * 2014-12-02 2020-01-17 阿里巴巴集团控股有限公司 一种针对应用操作的作弊检测方法及装置
CN105515865A (zh) * 2015-12-14 2016-04-20 镇江乐游网络科技有限公司 一种获取游戏访问量统计数据的方法
CN106933905B (zh) * 2015-12-31 2019-12-24 北京国双科技有限公司 网页访问数据的监测方法和装置
CN106656577B (zh) * 2016-11-24 2019-07-09 中国通信建设集团设计院有限公司 一种app及浏览器的用户行为统计方法及智能路由器
CN106789277B (zh) * 2016-12-27 2020-02-07 北京五八信息技术有限公司 基于状态机模型的用户行为确定方法及装置
CN108255879B (zh) * 2016-12-29 2021-10-08 北京国双科技有限公司 网页浏览流量作弊的检测方法及装置
CN107426231B (zh) * 2017-08-03 2020-05-01 奇安信科技集团股份有限公司 一种识别用户行为的方法及装置
CN108009215B (zh) * 2017-11-17 2018-11-06 山东师范大学 一种搜索结果页用户行为模式测评方法、装置及系统
CN108540533B (zh) * 2018-03-14 2021-01-22 聚好看科技股份有限公司 一种应答请求的方法和装置
CN110071912B (zh) * 2019-03-26 2021-05-04 创新先进技术有限公司 数据检验方法、装置以及系统
CN110668754B (zh) * 2019-10-22 2022-08-05 江苏中路工程技术研究院有限公司 一种新旧路面基层拼接界面处治材料及其制备方法
CN110889020B (zh) * 2019-11-22 2022-08-23 百度在线网络技术(北京)有限公司 站点资源挖掘方法、装置以及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983366A (en) * 1997-03-19 1999-11-09 Optimay Corporation Data processing system having monitoring of software activity
CN1253692A (zh) * 1996-12-11 2000-05-17 尼尔逊媒介研究股份有限公司 交互业务装置计量系统
CN1637717A (zh) * 2003-12-23 2005-07-13 阿尔卡特公司 具有防止某些java应用程序故障的保护装置的终端
CN1650269A (zh) * 2002-04-19 2005-08-03 计算机联合思想公司 用于监视计算机应用程序的系统和方法
CN1934539A (zh) * 2004-03-31 2007-03-21 咕果公司 用于监控应用程序中的事件的基于简档的捕捉组件
CN101557500A (zh) * 2009-05-12 2009-10-14 北京学之途网络科技有限公司 一种监测iptv用户行为的方法及其系统
CN101751535A (zh) * 2008-10-31 2010-06-23 赛门铁克公司 通过应用程序数据访问分类进行的数据损失保护
CN101770339A (zh) * 2009-01-05 2010-07-07 深圳富泰宏精密工业有限公司 使用者行为追踪及记录系统与方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1253692A (zh) * 1996-12-11 2000-05-17 尼尔逊媒介研究股份有限公司 交互业务装置计量系统
US5983366A (en) * 1997-03-19 1999-11-09 Optimay Corporation Data processing system having monitoring of software activity
CN1650269A (zh) * 2002-04-19 2005-08-03 计算机联合思想公司 用于监视计算机应用程序的系统和方法
CN1637717A (zh) * 2003-12-23 2005-07-13 阿尔卡特公司 具有防止某些java应用程序故障的保护装置的终端
CN1934539A (zh) * 2004-03-31 2007-03-21 咕果公司 用于监控应用程序中的事件的基于简档的捕捉组件
CN101751535A (zh) * 2008-10-31 2010-06-23 赛门铁克公司 通过应用程序数据访问分类进行的数据损失保护
CN101770339A (zh) * 2009-01-05 2010-07-07 深圳富泰宏精密工业有限公司 使用者行为追踪及记录系统与方法
CN101557500A (zh) * 2009-05-12 2009-10-14 北京学之途网络科技有限公司 一种监测iptv用户行为的方法及其系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一个网格应用程序监测系统的实现;王巍;方滨兴;张宏莉;《计算机工程与应用》;20040415(第4期);全文 *

Also Published As

Publication number Publication date
CN102279786A (zh) 2011-12-14

Similar Documents

Publication Publication Date Title
CN102279786B (zh) 一种监测应用程序有效访问量的方法及装置
CN101448007B (zh) 一种结构化查询语言sql攻击防御方法
CN105528535A (zh) 基于行为日志信息的用户行为分析方法及装置
CN102713861A (zh) 操作管理装置、操作管理方法以及程序存储介质
CN103593376A (zh) 一种采集用户行为数据的方法及装置
CN109933984B (zh) 一种最佳聚类结果筛选方法、装置和电子设备
CN103825774A (zh) 用于生成隐私简档的方法和设备
CN101321084A (zh) 在计算机环境中利用关联规则挖掘为计算实体产生配置规则的方法和装置
CN105721187A (zh) 一种业务故障诊断方法及装置
CN103763124A (zh) 一种互联网用户行为分析预警系统及方法
CN105678125A (zh) 一种用户认证方法、装置
CN102541884B (zh) 数据库优化方法和装置
CN102831021A (zh) 插件拦截或清理的方法及装置
CN104917836A (zh) 基于集群监控分析计算设备可用性的方法及装置
CN110753038A (zh) 一种异常检测自适应权限控制系统及方法
CN102801548B (zh) 一种智能预警的方法、装置及信息系统
CN104217004A (zh) 一种交易系统的数据库热点的监控方法及装置
CN107832333A (zh) 基于分布式处理和dpi数据构建用户网络数据指纹的方法和系统
CN109428857A (zh) 一种恶意探测行为的检测方法和装置
CN113722134A (zh) 一种集群故障处理方法、装置、设备及可读存储介质
CN108833442A (zh) 一种分布式网络安全监控装置及其方法
CN113467314B (zh) 一种基于大数据和边缘计算的信息安全风险评估系统及方法
CN114111352A (zh) 一种碳化炉抽真空系统异常检测方法及系统
CN107430590B (zh) 用于数据比较的系统和方法
CN117240522A (zh) 基于攻击事件模型的漏洞智能挖掘方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant