CN101217392A - 行为采集分析方法及系统 - Google Patents

行为采集分析方法及系统 Download PDF

Info

Publication number
CN101217392A
CN101217392A CNA2007100329019A CN200710032901A CN101217392A CN 101217392 A CN101217392 A CN 101217392A CN A2007100329019 A CNA2007100329019 A CN A2007100329019A CN 200710032901 A CN200710032901 A CN 200710032901A CN 101217392 A CN101217392 A CN 101217392A
Authority
CN
China
Prior art keywords
feature
contribution
content
keyword
presets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100329019A
Other languages
English (en)
Other versions
CN101217392B (zh
Inventor
余斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN200710032901.9A priority Critical patent/CN101217392B/zh
Publication of CN101217392A publication Critical patent/CN101217392A/zh
Priority to PCT/CN2008/073308 priority patent/WO2009076852A1/zh
Priority to EP08863027A priority patent/EP2219118A4/en
Priority to US12/792,614 priority patent/US20100241599A1/en
Application granted granted Critical
Publication of CN101217392B publication Critical patent/CN101217392B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种行为采集分析方法,包括记录门户系统用户对门户系统所展示内容的操作信息,根据所述内容与对预设定特征具有贡献作用的贡献信息的对应关系,以及用于衡量所述操作对所述预设定特征的贡献度量标准,统计所述操作引起所述贡献信息对所述预设定特征的最终贡献值,并根据所述最终贡献值,确定所述预设定特征是否为所述门户系统用户的特征。本发明还公开了一种行为采集分析系统。采用本发明,可实现全方位地对门户系统用户操作行为进行分析,能较准确的细分用户,为该细分的用户部分提供针对性服务,提高服务质量,且简单易行。

Description

行为采集分析方法及系统
技术领域
本发明涉及通信领域,尤其涉及一种行为采集分析方法及一种行为采集分析系统。
背景技术
随着互联网技术的普及,越来越多的用户通过环球网(WEB)、无线应用协议(Wireless Application Protocol,WAP)等方式获取相应的信息,典型的应用场景如下:
(1)通过WEB、WAP等方式浏览新闻,如新浪的WEB、WAP网站;
(2)通过WEB、WAP、互动式语音应答(Interactive Voice Response,IVR)等方式进行电信增值业务消费,如定购彩铃;
(3)通过WEB、WAP、短消息服务(Short Message Service,SMS)等方式进行互动,例如可基于WEB、WAP、SMS等方式发贴的博客(Blog)系统,
如上各应用场景所示,每天都有大量用户通过门户系统来进行信息消费(浏览、互动等),不同用户所获取的信息类别是不同的,如果能够基于用户获取信息的种类的不同对用户行为进行分析,则可以对各细分的用户部分实现特种信息的服务,从而提高服务质量。
现有技术中提供了一种行为采集分析系统,该系统主要采用如图1所示的现有技术的行为采集分析方法,具体为:
101,采集门户系统用户产生消费的话单、通讯记录中记录的操作信息;
102,根据预定义的行为分析策略,对所述采集的操作信息进行分析;
103,根据所述分析结果,确定所述用户特征。
由于现有技术中只对产生消费的话单、通讯记录中记录用户操作信息进行分析,确定分析结果所表征的门户系统用户特征,无法对未产生消费的用户操作信息进行分析,因此,现有技术对门户系统用户操作行为的分析具有局限性,不能准确的细分用户,从而不能对该细分的用户部分提供针对性服务。
发明内容
本发明实施例所要解决的技术问题在于,提供了一种行为采集分析方法及一种行为采集分析系统,可对门户系统用户对门户系统所展示内容的操作信息进行记录并分析,得到门户系统用户的特征,从而为细分的用户部分提供较准确的细分依据。
为了解决上述技术问题,本发明实施例提出了一种行为采集分析方法,包括:
记录门户系统用户对门户系统所展示内容的操作信息;
根据所述内容与对所述预设定特征具有贡献作用的贡献信息的对应关系,以及用于衡量所述操作对所述预设定特征的贡献度量标准,统计在预先设定的统计时段内所述操作引起所述贡献信息对所述预设定特征的最终贡献值;
根据所述最终贡献值,确定所述预设定特征是否为所述门户系统用户的特征。
相应地,本发明实施例还提供了一种行为采集分析系统,包括:
行为采集装置,记录门户系统用户对门户系统所展示内容的操作信息;
行为分析装置,根据所述内容与对所述预设定特征具有贡献作用的贡献信息的对应关系,以及用于衡量所述操作对所述预设定特征的贡献度量标准,统计所述操作引起所述贡献信息对所述预设定特征的最终贡献值,并根据该最终贡献值,确定所述预设定特征是否为所述门户系统用户的特征。
本发明实施例通过记录门户系统用户对门户系统所展示内容的操作信息,根据所述内容与对预设定特征具有贡献作用的贡献信息的对应关系,以及用于衡量所述操作对所述预设定特征的贡献度量标准,统计所述操作引起所述贡献信息对所述预设定特征的最终贡献值,并根据所述最终贡献值,确定所述预设定特征是否为所述门户系统用户的特征,从而实现全方位地对门户系统用户操作行为进行分析,能较准确的细分用户,为该细分的用户部分提供针对性服务,提高服务质量。
附图说明
图1是现有技术的行为采集分析方法的流程图;
图2是本发明实施例的行为采集分析方法的主要流程图;
图3是本发明实施例的行为采集分析系统的主要结构图;
图4是本发明实施例的行为分析装置33的主要结构图。
具体实施方式
本发明实施例提供了一种行为采集分析方法及系统,可实现可对门户系统用户对门户系统所展示内容的操作信息进行记录并分析,得到门户系统用户的特征,从而为细分的用户部分提供较准确的细分依据。
下面结合附图,对本发明实施例进行详细说明。
图2是本发明实施例的行为采集分析方法的主要流程图,参照该图,该方法主要包括:
201,根据预先设定的行为采集策略,记录门户系统用户(以下简称“用户”)对门户系统所展示内容的操作信息;
其中,所述行为采集策略用于指导行为采集的范围和方式,可包括:
A、行为采集范围策略:
a1、内容及内容关键字:
对门户系统所展示的每一条内容赋予唯一的区分标识(Identification,ID),即内容ID,内容可以是一篇帖子、一段视频、一首彩铃、一个游戏等;
门户系统所展示的每一条内容可包括由内容提供商(Content Provider,CP)或个人提供的内容关键字,当CP或个人未提供内容关键字时,以内容标题作为内容关键字;
a2、对内容的操作:
对门户系统所展示的内容的操作可以包括但不仅限于如下类型:
浏览:用户通过点击等方式查看(听取)内容中的详细信息;
收藏:用户在门户系统上将内容中的信息或内容的统一资源定位符(Uniform Resource Locator,URL)添加到收藏夹,以便于下次访问时快速定位到该收藏的内容;
推荐:用户将内容推荐给第三方(由第三方选择消费并扣除第三方费用);
赠送:用户将内容赠送给第三方(由受赠方选择消费并扣除赠送方费用);
定购:通过某种方式实现用户对内容进行消费的签约关系,例如调用业务操作支持系统(Bossiness Operation Support System,BOSS)实现用户对内容进行消费的签约关系的建立;
播放:调用流媒体的能力实现点播/直播操作;
下载:调用下载服务器的能力实现超文本传输协议(Hypertext TransferProtocol,HTTP)、开放移动联盟(Open Mobile Alliance,OMA)或移动信息设备配置文件(Mobile Information Device Profile,MIDP)等下载,可将内容下载到本地设备(如个人电脑、手持设备或其他终端);
购买:通过话费托收、银行卡付费等方式支付一定费用而拥有对内容进行消费的权利;
彩铃:将内容设为彩铃,第三方拨打时可聆听该彩铃;
其他;
B、行为采集方式策略:
b1、记录的操作信息:
记录用户对门户系统所展示内容的操作信息可包括用户ID、内容ID、操作类型(如a2中所述)、操作时间、操作信息采集通道等;
其中,操作信息采集通道可包括但不仅限于如下类型:
WEB通道:用户以WEB方式访问门户系统;
WAP通道:用户以WAP方式访问门户系统;
IVR通道:用户以语音方式访问门户系统;
非结构化补充服务数据(Unstructured Supplementary Service Data,USSD)通道:用户以USSD按键方式访问门户系统;
SMS通道:用户以SMS方式访问门户系统;
WEB客户端(Client)通道:用户以WEB客户端方式访问门户系统;
WAP Client通道:用户以WAP Client方式访问门户系统;
其他;
b2、记录方式:
通过监测各操作信息采集通道(即用户的访问通道),对b1描述的操作信息以日志方式进行记录(用户操作很频繁,导致操作信息数量庞大),并可将用户的操作信息记录在服务器端的内存中,之后通过后台处理队列定时持久化到行为存储装置中,其中,操作信息采集通道类型可如b1中内容,此处不再赘述;
该步骤201则根据上述行为采集策略对用户的操作信息进行记录;
202,存储所记录的操作信息,由于门户系统所展示内容数量为海量级别,且访问门户系统的用户数量也是海量级别的,因此所记录的操作信息也是海量级别,此时,可采用如下存储机制:
分表(文件)存储,按照用户ID号段进行分表(文件)存储,对不同用户采集的操作信息存储在不同表(文件)中,在具体实现时,可有如下两种方案:
S1、手动控制分表存储,可由用户自行编写分表的逻辑代码来实现对所记录的操作信息的分表存储,算法举例:若按照手机号段进行分表,可将用户分成10个号段,那么将建立10张表,手机号码用10模(手机号码除以10取余数),模为0的用户数据放入用户操作积分表0中(如下表2所示),模为1的用户数据放入用户操作积分表1中,以此类推;
S2、数据库自动控制分表存储,基于Oracle和DB2的分表存储功能,在建表时指定分表存储策略,直接在建表的时候指定分开存储,以Oracle算法为例:
PARTITION BY RANGE(msisdn)
(PARTITION BASETAB_PART1 VALUES LESS THAN(′86134′),
PARTITION BASETAB_PART2 VALUES LESS THAN(′86135′),
PARTITION BASETAB_PART3 VALUES LESS THAN(′86136′),
PARTITION BASETAB_PART4 VALUES LESS THAN(′86137′),
PARTITION BASETAB_PART5 VALUES LESS THAN(′86138′),
PARTITION BASETAB_PART6 VALUES LESS THAN(′86139′),
PARTITION BASETAB_PART7 VALUES LESS THAN(′86159′),
PARTITION BASETAB_PART8 VALUES LESS THAN(′86160′),
PARTITION BASETAB_PART9 VALUES LESS THAN(MAXVALUE))
定时备份/清空过期数据,定时备分在存储装置中清除已完成行为分析的操作信息,或定时清空存储装置中已完成行为分析的操作信息,以保证该存储装置中的足够存储空间来容纳新的操作信息,保持较高的信息读写性能;
203,根据预先设定的行为分析策略,对用户的在所述预先设定的统计时段内的操作信息进行分析,从而得到用户的特征;
其中,所述行为分析策略用于指导行为分析的分析依据与机制,可包括:
c1、操作积分标准,该操作积分标准为用户对门户系统所展示内容的操作定义了积分值,在下述内容中则根据该操作积分标准进行处理:
首先预先设定一系列特征,即预设定特征;
定义衡量所述用户操作对预设定特征在贡献度量标准,该贡献度量标准在具体实施时可表现为操作积分标准,例如,可定义浏览一次积分5分,下载一次积分20分,收藏一次积分10分等,其中,操作积分标准定义的各操作类型与对应积分的关系可由下表1表示:
  用户操作配置
  字段名   类型   备注
 *ActionID   Int   操作标识
 *ActionName   Varchar(15)   操作名称
 *ActionScore   Int   每次操作的积分
 *iSAvailable   Boolean   真-有效;假-无效,不积分,默认为真
表1
上述表1可参照备注内容的解释;
c2、预设定特征与贡献信息的关系:
定义对预设定特征具有贡献作用的贡献信息,即每个预设定特征之下包括对该预设定特征具有贡献作用的贡献信息的集合(一个或多个),该贡献信息在具体实施时可表现为关键字,而关键字集合形成关键字库,该关键字库表征了预设定特征与下属各关键字的对应关系,例如,预设定特征为“该用户喜欢音乐”,该预设定特征下包括有对“该用户喜欢音乐”具有贡献作用的贡献信息“音乐”、“Mariah Carey”、“尚雯婕”,与c1中描述的操作积分标准协同,当判断为用户操作的内容中的关键字与某个预设定特征下属关键字匹配时,则该操作引起关键字对预设定特征的积分,参照上述两个例子,当用户对内容“MariahCarey’s New Album”(该内容中的关键字为“Mariah Carey”)进行浏览操作,则该浏览操作引起关键字“Mariah Carey”(与内容关键字匹配)对预设定特征“音乐”的积分为5分;
c3、预设定特征与阈值:
在上述c1、c2定义的行为分析策略基础上,定义用于确定预设定特征是否为用户的特征的阈值,首先获得在预先设定的统计时段内每个操作引起的所述内容中的关键字(该内容中的关键字与关键字库中某关键字匹配,匹配可以是相同或达到某个近似程度)贡献于预设定特征的积分值,其次叠加该统计时段内每个操作引起的所述积分值,得到最终积分值,当该最终积分值达到所述阈值时,确定所述用户具有该预设定特征,下面举例说明:
参照上述三个例子,预设定特征“该用户喜欢音乐”具有贡献作用的存在于关键字库中的关键字集合包括“音乐”、“Mariah Carey”、“尚雯婕”(预先设定“Mariah Carey”、“尚雯婕”归属于“音乐”,那么对“Mariah Carey”、“尚雯婕”的相关操作同样对“音乐”累计该相关操作),“该用户喜欢音乐”的积分阈值为500分,统计时段为2008年1月20日0时至2008年1月21日0时,赋予浏览一次积分5分、下载一次积分20分,收藏一次积分10分,在统计时段内用户ID为001的用户对“音乐”浏览1次、对“Mariah Carey”浏览1次、收藏1次、下载1次、对“尚雯婕”浏览2次,那么在该统计时段内,该用户001得到的最终积分值为95分,根据行为分析策略,该最终积分值95分未达到预设定特征“该用户喜欢音乐”对应的阈值500分,判断该预设定特征不属于该用户001,其中,当用户进行操作时,可根据表1中的操作积分标准进行积分操作,而对统计时段的积分的统计则可参照下表2:
  用户操作积分
  字段名   类型   备注
 *UserID   Vchar(15)   关键字用户手机号码
 *ContentID   Vchar(15)   内容ID
 *ActionSatisticDate   String   被统计的操作信息所属于的月份,例如“YYYYMM”格式(计数信息以月为单位)
 *ActionCount01   Int   定购次数
 *ActionCount02   Int   播放次数
 *ActionCount03   Int   普通下载次数
 *ActionCount04   Int   彩铃下载次数
 *ActionCount05   Int   设置彩铃次数
 *ActionCount06   Int   赠送次数
 *ActionCount07   Int   推荐次数
 *ActionCount08   Int   收藏次数
 *ActionCount09   Int   浏览次数
 *ActionCount10   Int   待定
表2
上述表2可参照备注内容的解释;
此外,行为分析策略中还可以包括:
c4、全新/增量分析:
定义各次行为分析是否为增量分析或全新分析,在上述例子中即表示当前行为分析所得最终积分值是否叠加到前次行为分析所得最终积分值之上,从而以两个最终积分值的和值来与所述阈值比较,确定用户的特征;
c5、统计时段:
定义各次统计时段的起止时间,可根据长度策略或其他策略定义。
该步骤203则根据上述定义的行为分析策略,对用户的在所述预先设定的统计时段内的操作信息进行分析,从而得到用户的特征,即判断预定义特征是否为用户的特征。
值得说明的是,可同时对某一用户的多个特征通过上述行为分析方法进行确定,也可以同时对多个用户的多个特征通过上述行为分析方法进行确定。
相应地,下面对本发明实施例的行为采集分析系统进行说明。
图3为本发明实施例的行为采集分析系统的主要结构图,参照该图,该结构主要包括策略管理装置31、行为采集装置32、行为分析装置33、行为存储装置34、行为分析结果输出装置35,其中各装置连接关系及功能如下述:
策略管理装置31分别与行为采集装置32、行为分析装置33、行为分析结果输出装置35相连,行为采集装置32、行为分析装置33分别与行为存储装置34相连,行为分析装置33与行为分析结果输出装置35相连;
策略管理装置31,用于配置行为采集装置32上的行为采集策略、行为分析装置33上的行为分析策略以及行为分析结果输出装置35上的行为分析结果输出策略,具体包括:
(一)行为采集策略,用于指导行为采集的范围和方式,可包括上述A、B所述内容;
(二)行为分析策略,用于指导行为分析的分析依据与机制,可包括如上述c1、c2、c3的内容,还可以包括上述c4、c5的内容;
(三)行为分析结果输出策略,包括:
输出方式,采用报表、曲线图、比例图或并列表等方式;
输出内容,输出用户明细、按照关键字对应的用户群输出;
行为采集装置32,用于根据策略管理装置31配置的行为采集策略,记录用户对门户系统所展示内容的操作信息;
行为存储装置34,用于存储行为采集装置32采集的操作信息;
行为分析装置33,用于根据策略管理装置31配置的行为分析策略,对用户的在所述预先设定的统计时段内的操作信息进行分析,从而得到用户的特征;
行为分析结果输出装置35,用于根据策略管理装置32配置的行为分析结果输出策略,输出各用户的特征。
在具体实施时,上述行为分析装置33可包括图4所述的结构,即该行为分析装置33可包括查询单元41、判断单元42、统计单元43、确定单元44,其中统计单元43包括获取子单元431、叠加子单元432,确定单元44包括检测子单元441、决定子单元442,各单元连接关系及功能如下述:
查询单元41、统计单元43分别与判断单元42相连,统计单元43与确定单元44相连,获取子单元431与叠加子单元432相连,检测子单元441与决定子单元442相连;
查询单元41,用于根据用户操作内容中的关键字,查询保存有对预设定特征具有贡献作用的关键字的关键字库,例如,预设定特征“该用户喜欢音乐”具有贡献作用的存在于关键字库中的关键字集合包括“音乐”、“Mariah Carey”、“尚雯婕”(预先设定“Mariah Carey”、“尚雯婕”、“音乐”均独立积分),而用户操作内容包括“音乐无极限”、“倾城(尚雯婕单曲)”、“皇台酒业”,“音乐无极限”的关键字“音乐”,“倾城”的关键字“尚雯婕”,“皇台酒业”的关键字“酒”;
判断单元42,用于判断在关键字库中是否存在所述内容中的关键字,参照上例,对于预设定特征“该用户喜欢音乐”,关键字库中存在该预设定特征下属的、与所述内容中关键字相匹配的关键字“音乐”、“尚雯婕”(关键字“酒”非该预设定特征下属的关键字),则判断存在所述内容中的关键字;
获取子单元431,用于当判断单元42判断得到存在所述内容中的关键字时,获取在该统计时段内每个操作引起的关键字贡献于所述预设定特征的积分值,参照上例,若在预定的统计时段内对于预设定特征“该用户喜欢音乐”,关键字库中存在该预设定特征下属的、与内容中的关键字相匹配的关键字“音乐”、“尚雯婕”,且在该统计时段内用户操作包括对  “音乐无极限”浏览10次,对“倾城”浏览1次、下载1次、推荐1次、赠送1次,那么根据操作积分标准,每个操作引起的贡献于预设定特征“该用户喜欢音乐”的积分值为:
对“音乐无极限”浏览1次:1分;
对“倾城”浏览1次:1分;
对“倾城”下载1次:10分;
对“倾城”推荐1次:5分;
对“倾城”赠送1次:20分;
(操作积分标准可根据实际情况设定)
叠加子单元432,用于叠加所述获取子单元431获取的各个操作引起的关键字对预设定特征贡献的最终积分值,参照上例,在统计时段内各操作对预设定特征“该用户喜欢音乐”贡献的最终积分值为46分:对“音乐无极限”浏览10次(共计积分10分)、对“倾城”浏览1次(共计积分1分)、对“倾城”下载1次(共计积分10分)、对“倾城”推荐1次(共计积分5分、对“倾城”赠送1次(共计积分20分);
检测子单元441,用于检测所述最终积分值是否达到预先设定的用于确定所述预设定特征是否为所述用户的特征的阈值,参照上例,当最终积分值为46分,而所述阈值预定为40分,则检测结果为最终积分值达到所述阈值;
决定子单元442,用于当检测子单元441检测到所述最终积分值达到所述阈值时,决定该用户具有上述预设定特征。
另外,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Radom Access Memory,RAM)等。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (11)

1.一种行为采集分析方法,其特征在于,该方法包括:
记录门户系统用户对门户系统所展示内容的操作信息;
根据所述内容与对预设定特征具有贡献作用的贡献信息的对应关系,以及用于衡量所述操作对所述预设定特征的贡献度量标准,统计所述操作引起所述贡献信息对所述预设定特征的最终贡献值;
根据所述最终贡献值,确定所述预设定特征是否为所述门户系统用户的特征。
2.如权利要求1所述的行为采集分析方法,其特征在于,所述贡献信息为对所述预设定特征具有贡献作用的关键字,
所述根据所述内容与对预设定特征具有贡献作用的贡献信息的对应关系,以及用于衡量所述操作对所述预设定特征的贡献度量标准,统计所述操作引起所述贡献信息对所述预设定特征的最终贡献值具体包括:
根据所述内容中的关键字,查询保存有对所述预设定特征具有贡献作用的关键字的关键字库;
判断所述关键字库中是否存在所述内容中的关键字,
若是,则根据所述内容中的关键字以及所述贡献度量标准,统计所述操作引起的所述内容中的关键字对所述预设定特征的最终贡献值。
3.如权利要求2所述的行为采集分析方法,其特征在于,所述贡献度量标准是为所述门户系统用户对门户系统所展示内容的操作定义积分值的操作积分标准,则所述根据所述内容中的关键字以及所述贡献度量标准,统计所述操作引起的所述内容中的关键字对所述预设定特征的最终贡献值具体包括:
根据所述内容中的关键字以及所述操作积分标准,获得所述每个操作引起的所述内容中的关键字贡献于所述预设定特征的积分值;
叠加所述每个操作引起的所述积分值得到最终积分值,
所述根据所述最终贡献值,确定所述预设定特征是否为所述门户系统用户的特征具体包括:
检测所述最终积分值是否达到预先设定的用于确定所述预设定特征是否为所述门户系统用户特征的阈值,
若是,则所述预设定特征为所述门户系统用户的特征。
4.如权利要求3所述的行为采集分析方法,其特征在于,所述操作积分标准为各种操作分别赋予积分值。
5.如权利要求1至4中任一项所述的行为采集分析方法,其特征在于,所述预设定特征是通过对至少两个贡献信息统计最终贡献值确定的。
6.如权利要求1至4中任一项所述的行为采集分析方法,其特征在于,所述操作包括所述用户的消费和/或非消费操作,消费操作包括推荐、赠送、定购、点播、购买、彩铃、下载中的一种或多种的组合,非消费操作包括浏览、收藏、预播中的一种或多种的组合。
7.一种行为采集分析系统,其特征在于,包括:
行为采集装置,记录门户系统用户对门户系统所展示内容的操作信息;
行为分析装置,根据所述内容与对所述预设定特征具有贡献作用的贡献信息的对应关系,以及用于衡量所述操作对所述预设定特征的贡献度量标准,统计所述操作引起所述贡献信息对所述预设定特征的最终贡献值,并根据该最终贡献值,确定所述预设定特征是否为所述门户系统用户的特征。
8.如权利要求7所述的行为采集分析系统,其特征在于,所述贡献信息为对所述预设定特征具有贡献作用的关键字,则所述行为分析装置包括:
查询单元,根据所述内容中的关键字,查询保存有对所述预设定特征具有贡献作用的关键字的关键字库;
判断单元,判断所述关键字库中是否存在所述内容中的关键字;
统计单元,当所述判断为存在所述内容中的关键字时,根据所述内容中的关键字以及所述贡献度量标准,统计所述操作引起的所述内容中的关键字对所述预设定特征的最终贡献值;
确定单元,根据所述最终贡献值,确定所述预设定特征是否为所述门户系统用户的特征。
9.如权利要求8所述的行为采集分析系统,其特征在于,所述贡献度量标准是为所述门户系统用户对门户系统所展示内容的操作定义积分值的操作积分标准,则所述统计单元包括:
获取子单元,当所述判断为存在所述内容中的关键字时,根据所述内容中的关键字以及所述操作积分标准,获得所述每个操作引起的所述内容中的关键字贡献于所述预设定特征的积分值;
叠加子单元,叠加所述每个操作引起的所述积分值得到最终积分值,
所述确定单元包括:
检测子单元,检测所述最终积分值是否达到预先设定的用于确定所述预设定特征是否为所述门户系统用户特征的阈值;
决定子单元,当所述检测到所述最终积分值达到所述阈值时,得到所述预设定特征为所述门户系统用户的特征。
10.如权利要求9所述的行为采集分析系统,其特征在于,所述操作积分标准为各种操作分别赋予积分值。
11.如权利要求7至10中任一项所述的行为采集分析系统,其特征在于,所述操作包括所述用户的消费和/或非消费操作,消费操作包括推荐、赠送、定购、点播、购买、彩铃、下载中的一种或多种的组合,非消费操作包括浏览、收藏、预播中的一种或多种的组合。
CN200710032901.9A 2007-12-03 2007-12-27 行为采集分析方法及系统 Expired - Fee Related CN101217392B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN200710032901.9A CN101217392B (zh) 2007-12-27 2007-12-27 行为采集分析方法及系统
PCT/CN2008/073308 WO2009076852A1 (zh) 2007-12-03 2008-12-03 对用户进行分类的方法、行为采集分析方法与装置
EP08863027A EP2219118A4 (en) 2007-12-03 2008-12-03 METHOD FOR CLASSIFYING USERS, METHOD AND DEVICE FOR BEHAVIOR COLLECTION AND ANALYSIS
US12/792,614 US20100241599A1 (en) 2007-12-03 2010-06-02 Method for classifying users, method and device for collecting and analyzing behaviors

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200710032901.9A CN101217392B (zh) 2007-12-27 2007-12-27 行为采集分析方法及系统

Publications (2)

Publication Number Publication Date
CN101217392A true CN101217392A (zh) 2008-07-09
CN101217392B CN101217392B (zh) 2014-12-03

Family

ID=39623759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200710032901.9A Expired - Fee Related CN101217392B (zh) 2007-12-03 2007-12-27 行为采集分析方法及系统

Country Status (1)

Country Link
CN (1) CN101217392B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009076852A1 (zh) * 2007-12-03 2009-06-25 Huawei Technologies Co., Ltd. 对用户进行分类的方法、行为采集分析方法与装置
CN102456201A (zh) * 2010-10-26 2012-05-16 阿里巴巴集团控股有限公司 一种客户操作数据的分析方法和装置
CN102509233A (zh) * 2011-11-29 2012-06-20 汕头大学 一种基于用户网上动作信息的推荐方法
CN102592182A (zh) * 2011-01-17 2012-07-18 英华达(上海)科技有限公司 行为记录系统
CN102761576A (zh) * 2011-04-28 2012-10-31 中兴通讯股份有限公司 彩铃Web系统防止恶意订购铃音的方法及服务器
CN103020412A (zh) * 2011-09-28 2013-04-03 深圳市快播科技有限公司 一种游戏平台用户属性统计方法及系统
CN101753607B (zh) * 2008-12-04 2013-07-03 联想(北京)有限公司 一种服务器的工作装置及方法
CN104580492A (zh) * 2015-01-21 2015-04-29 冯山泉 Ktv行为数据采集方法及系统
CN104598643A (zh) * 2015-02-13 2015-05-06 成都品果科技有限公司 一种物品相似度贡献系数、相似度获取方法及物品推荐方法及其系统
CN104699704A (zh) * 2013-12-06 2015-06-10 腾讯科技(深圳)有限公司 内容推送及接收方法、装置和系统
CN104794249A (zh) * 2015-05-15 2015-07-22 乐得科技有限公司 一种数据库的实现方法和设备
CN106161091A (zh) * 2016-07-13 2016-11-23 久远谦长(北京)技术服务有限公司 一种统计互联网用户行为的方法和系统
CN106294846A (zh) * 2016-08-19 2017-01-04 维沃移动通信有限公司 一种信息的推荐方法及移动终端
CN106874317A (zh) * 2015-12-11 2017-06-20 财团法人工业技术研究院 数据可视化方法与数据可视化装置
CN109146716A (zh) * 2018-07-27 2019-01-04 四川天恩释农科技有限公司 一种基于区块链技术的全息数字智能文娱交互系统
CN110175808A (zh) * 2019-04-17 2019-08-27 广州精选速购网络科技有限公司 一种订单管理、查询方法、装置、设备及介质
CN111435281A (zh) * 2019-01-11 2020-07-21 北京京东尚科信息技术有限公司 拦截业务操作的方法和装置
CN111831944A (zh) * 2020-07-09 2020-10-27 腾讯科技(深圳)有限公司 多媒体处理方法、装置、客户端、服务器及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6353825B1 (en) * 1999-07-30 2002-03-05 Verizon Laboratories Inc. Method and device for classification using iterative information retrieval techniques
CN1744638A (zh) * 2004-08-30 2006-03-08 华为技术有限公司 广告发布系统及发布广告的方法
CN101079824A (zh) * 2006-06-15 2007-11-28 腾讯科技(深圳)有限公司 一种用户兴趣偏好向量生成系统和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6353825B1 (en) * 1999-07-30 2002-03-05 Verizon Laboratories Inc. Method and device for classification using iterative information retrieval techniques
CN1744638A (zh) * 2004-08-30 2006-03-08 华为技术有限公司 广告发布系统及发布广告的方法
CN101079824A (zh) * 2006-06-15 2007-11-28 腾讯科技(深圳)有限公司 一种用户兴趣偏好向量生成系统和方法

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009076852A1 (zh) * 2007-12-03 2009-06-25 Huawei Technologies Co., Ltd. 对用户进行分类的方法、行为采集分析方法与装置
CN101753607B (zh) * 2008-12-04 2013-07-03 联想(北京)有限公司 一种服务器的工作装置及方法
CN102456201A (zh) * 2010-10-26 2012-05-16 阿里巴巴集团控股有限公司 一种客户操作数据的分析方法和装置
CN102456201B (zh) * 2010-10-26 2016-09-14 阿里巴巴集团控股有限公司 一种客户操作数据的分析方法和装置
CN102592182A (zh) * 2011-01-17 2012-07-18 英华达(上海)科技有限公司 行为记录系统
CN102761576B (zh) * 2011-04-28 2015-04-01 中兴通讯股份有限公司 彩铃Web系统防止恶意订购铃音的方法及服务器
CN102761576A (zh) * 2011-04-28 2012-10-31 中兴通讯股份有限公司 彩铃Web系统防止恶意订购铃音的方法及服务器
WO2012145962A1 (zh) * 2011-04-28 2012-11-01 中兴通讯股份有限公司 彩铃web系统防止恶意订购铃音的方法及服务器
CN103020412A (zh) * 2011-09-28 2013-04-03 深圳市快播科技有限公司 一种游戏平台用户属性统计方法及系统
CN103020412B (zh) * 2011-09-28 2015-12-02 深圳市快播科技有限公司 一种游戏平台用户属性统计方法及系统
CN102509233A (zh) * 2011-11-29 2012-06-20 汕头大学 一种基于用户网上动作信息的推荐方法
CN104699704B (zh) * 2013-12-06 2020-05-19 腾讯科技(深圳)有限公司 内容推送及接收方法、装置和系统
CN104699704A (zh) * 2013-12-06 2015-06-10 腾讯科技(深圳)有限公司 内容推送及接收方法、装置和系统
CN104580492B (zh) * 2015-01-21 2018-10-09 冯山泉 Ktv行为数据采集方法及系统
CN104580492A (zh) * 2015-01-21 2015-04-29 冯山泉 Ktv行为数据采集方法及系统
CN104598643A (zh) * 2015-02-13 2015-05-06 成都品果科技有限公司 一种物品相似度贡献系数、相似度获取方法及物品推荐方法及其系统
CN104794249A (zh) * 2015-05-15 2015-07-22 乐得科技有限公司 一种数据库的实现方法和设备
CN106874317A (zh) * 2015-12-11 2017-06-20 财团法人工业技术研究院 数据可视化方法与数据可视化装置
CN106161091A (zh) * 2016-07-13 2016-11-23 久远谦长(北京)技术服务有限公司 一种统计互联网用户行为的方法和系统
CN106161091B (zh) * 2016-07-13 2019-05-07 久远谦长(北京)技术服务有限公司 一种统计互联网用户行为的方法和系统
CN106294846A (zh) * 2016-08-19 2017-01-04 维沃移动通信有限公司 一种信息的推荐方法及移动终端
CN109146716A (zh) * 2018-07-27 2019-01-04 四川天恩释农科技有限公司 一种基于区块链技术的全息数字智能文娱交互系统
CN111435281A (zh) * 2019-01-11 2020-07-21 北京京东尚科信息技术有限公司 拦截业务操作的方法和装置
CN110175808A (zh) * 2019-04-17 2019-08-27 广州精选速购网络科技有限公司 一种订单管理、查询方法、装置、设备及介质
CN111831944A (zh) * 2020-07-09 2020-10-27 腾讯科技(深圳)有限公司 多媒体处理方法、装置、客户端、服务器及存储介质
CN111831944B (zh) * 2020-07-09 2021-09-28 腾讯科技(深圳)有限公司 多媒体处理方法、装置、客户端、服务器及存储介质

Also Published As

Publication number Publication date
CN101217392B (zh) 2014-12-03

Similar Documents

Publication Publication Date Title
CN101217392B (zh) 行为采集分析方法及系统
US8150732B2 (en) Audience targeting system with segment management
CN102368788B (zh) 信息推送方法与装置
CN100456298C (zh) 广告信息检索系统及广告信息检索方法
CN101072116B (zh) 业务选择方法、装置、系统及客户端应用服务器
EP1460512A2 (en) System and method for providing usage metrics of digital content
US20020007303A1 (en) System for conducting electronic surveys
US20050125290A1 (en) Audience targeting system with profile synchronization
EP2219118A1 (en) Method for classifying users, method and device for behavior collection and analyse
US20110082848A1 (en) Systems, methods and computer program products for search results management
CN103297435A (zh) 一种基于web日志的异常访问行为检测方法与系统
US20050021731A1 (en) Traffic flow analysis method
CN101416212A (zh) 蜂音广告信息的瞄准
CN101828167A (zh) 推荐产生系统、设备和方法
CN101751422A (zh) 一种移动终端智能搜索的方法、移动终端和服务器
CN112348602A (zh) 一种基于大数据的广告自动化投放管理系统
CN102164153A (zh) 一种生成移动终端电子地图的方法及其系统
CN110750726A (zh) 一种基于智能计算器的个性化服务推送方法及系统
US7987123B1 (en) Method and system for providing market analysis for wireless data markets
CN101014072A (zh) 一种针对数据对象的数据信息获取和分析的方法及装置
CN103186571A (zh) 在移动搜索系统中展示移动媒介信息的方法和装置
JP2004515009A (ja) 電子的コンテンツを配信する方法及びシステム
CN107395377A (zh) 一种广播列表推送方法
CN102130932A (zh) 为移动终端构造主页的系统、方法和设备
CN101877866A (zh) 移动终端机型能力的检测方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20141203

Termination date: 20151227

EXPY Termination of patent right or utility model