CN106651606A - 一种多媒体社交网络用户行为模式发现方法 - Google Patents

一种多媒体社交网络用户行为模式发现方法 Download PDF

Info

Publication number
CN106651606A
CN106651606A CN201611069515.2A CN201611069515A CN106651606A CN 106651606 A CN106651606 A CN 106651606A CN 201611069515 A CN201611069515 A CN 201611069515A CN 106651606 A CN106651606 A CN 106651606A
Authority
CN
China
Prior art keywords
sequence
user
pattern
correlation rule
behavior pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611069515.2A
Other languages
English (en)
Other versions
CN106651606B (zh
Inventor
张志勇
黄涛
赵长伟
张丽丽
孙冉冉
向菲
王剑
韩林茜
史培宁
王小雪
刘芳云
李成
闻婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University of Science and Technology
Original Assignee
Henan University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University of Science and Technology filed Critical Henan University of Science and Technology
Priority to CN201611069515.2A priority Critical patent/CN106651606B/zh
Publication of CN106651606A publication Critical patent/CN106651606A/zh
Application granted granted Critical
Publication of CN106651606B publication Critical patent/CN106651606B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

一种多媒体社交网络用户行为模式发现方法,采用基于关联规则的方法在多媒体社交网络中发现用户在不同的情境下对应于某个目标的行为模式序列,从而及时发现用户的意图,为提供更加个性化的服务奠定基础。

Description

一种多媒体社交网络用户行为模式发现方法
技术领域
本发明属于互联网技术领域,具体涉及一种多媒体社交网络用户行为模式发现方法。
背景技术
伴随着移动互联网和Web2.0技术的兴起,多媒体社交网络(Multimedia SocialNetwork,简称MSN)上用户和数字内容呈现爆炸式增长,移动终端设备的出现也使得用户可以随时访问多媒体社交网络,用户与系统的交互行为越来越复杂。因此,如何在这种复杂的交互中及时了解用户变化的意图,给用户提供更加个性化的服务,成为当前多媒体社交网络服务的一个挑战。
多媒体计算技术的目的是根据用户的意图向用户推送多媒体内容。多媒体计算分为以数据为中心的多媒体压缩阶段(存储),以内容为中心的多媒体通信阶段(传播)和多媒体内容分析阶段(智能),以数据为中心和以内容为中心的都已经做了很好的研究,然而理解和预测不同情境下用户需要的多媒体内容还没有做出很好的研究。【P. Cui, W. Zhu,T. S. Chua, R. Jain, “Social-Sensed Multimedia Computing,”IEEE Multimedia,vol. 23, no. 1, pp. 92-96, Jan.-Mar. 2016.】
个性化服务是根据用户的设定来实现,依据各种渠道对资源进行收集、整理和分类,向用户提供和推荐相关信息,以满足用户的需求。为了实现个性化服务,首先需要学习及跟踪用户的兴趣和行为。【李春, 朱珍民, 叶剑, 周佳颖, 个性化服务研究综述, 计算机应用研究, vol. 26, no. 11, Nov.2009】。为了在多媒体社交网络中充分“理解”用户的“隐式”需求,本专利提出一种在多媒体社交网络中基于情境感知分析的用户行为模式发现的新方法。通过发现不同情境下用户的行为模式特征,可以给用户提供相应的个性化服务,如推荐内容、缓冲网页等。
发明内容
本发明所要解决的技术问题是提供一种多媒体社交网络用户行为模式发现方法,在多媒体社交网络中发现用户在不同情境下的频繁行为序列模式,从而及时发现用户的意图,为提供更加个性化的服务奠定基础。
本发明为解决上述技术问题所采用的技术方案是:一种多媒体社交网络用户行为模式发现方法,包括以下步骤:
步骤一、定义SituEx(t)表示时刻t用户的情境信息,G表示用户的一般目标,G={g 1 , g 2 ,…,g n }g i 表示用户在多媒体社交网络中的目标;
步骤二、在Web日志数据库中存储的当前用户与某个目标实现相关的所有频繁SituEx (t)组成该目标对应的行为模式序列,采用关联规则的方法发现当前用户在不同情境下对应于某个目标的行为模式序列,具体方法如下:
(1)扫描经过数据预处理之后的与当前用户相关的Web日志数据库,将时刻t该用户的情境信息记为SituEx(t),识别Web日志数据库中出现的Goal作为该用户在行为模式的结束点,记为:G ={g 1 ’,g 2 ’,…,g m ’},1≤m≤n,G G;
(2)将步骤(1)中获取的结束点g 1 作为关联规则的结果,以每个SituEx(t)作为关联规则的前件,计算每个关联规则的支持度,找出所有满足最小支持度的关联规则,这些关联规则的前件组成集合L 1 ,将L 1 作为新的关联规则前件的种子集;
(3)对集合L 1 中的序列进行连接操作和修剪操作,生成长度为2的候选序列集合C 2 C 2 中的每个候选序列分别作为关联规则的前件,g 1 作为关联规则的结果,计算其支持度,将满足最小支持度的关联规则的前件的集合组成L 2 ;依次类推,得出L 3 ,L 4 ,......,L k ,对于长度为k()的集合L k ,通过连接操作和修剪操作生成长度为k+1的候选序列C k+1 ,分别计算每个候选序列作为关联规则前件,g 1 作为关联规则结果的支持度,满足最小支持度的关联规则的前件组成长度为k+1的序列集合L k+1 ,并将L k+1 作为新的关联规则前件的种子集,以此类推,直到不再产生新的候选序列,得出所有该用户关于目标g 1 SituEx(t)组成的用户的频繁行为模式序列;
(4)同理,重复步骤(2)、(3),分别得到关于目标g 2 ,g 3 ,......,g m 所对应的SituEx(t)组成的频繁行为模式序列,直到不再有新的目标;
步骤三、用户在多媒体社交网络中至少存在一个目标,将找出的当前用户的特定目的的行为模式序列存入数据库中,通过该用户当前的序列与数据库中该用户的行为模式序列进行对比,预测用户当前的意图,以便对用户的请求做出及时快速的响应,提供个性化的服务。
本发明所述的序列的连接操作方法为:如果去掉序列模式s 1 的第一个项目与去掉序列模式s 2 的最后一个项目所得到的序列相同,则可以将序列模式s 1 与序列模式s 2 进行连接,即将序列模式s2的最后一个项目添加到序列模式s1中。
本发明所述的序列的修剪操作方法为:若某候选序列模式的某个子序列不是序列模式,则此候选序列模式不可能是序列模式,将它从候选序列模式中删除。
本发明的有益效果是:本发明根据用户的历史行为记录,通过本发明技术方案得到每个目标对应的行为模式序列,当该用户当前在社交媒体系统中的行为记录与已有的用户的行为序列模式相似度较高,则可以预测该用户的意图为已有行为序列模式的目标,根据预测的用户意图则可以提前为用户推荐可能需要的内容或缓存可能访问的页面,及时了解用户潜在的需求,给用户提供个性化服务,从而提高用户体验质量。
附图说明
图1为本发明用户目标的行为模式序列预测流程图;
图2为本发明用户行为模式发现系统架构图;
图3为本发明数据预处理流程图。
具体实施方式
如图所示,本发明采用基于关联规则的方法发现用户在不同的情境下对应于某个目标的行为模式序列。关联规则是发现大量的数据集中各项间存在的联系。设DS表示全体事务集,其中每一个属性被称为一个项目(item),DS中所有项目组成的集合被称为数据项集合,I={i 1 ,i 2 ,...,i m }|I|=mm表示DS中所含项目的个数。
关联规则具有以下的逻辑蕴含形式:,其中;项集A称为关联规则的前件,项集B称为关联规则的结果,是该规则所对应的项集。支持度:全体实体数据集DS中包含数据项集A的事务数量,称为项集A在DS中的支持数,记为A.Support。对于规则的支持数是指在DS中项集A和项集B共现的事务数量,所以规则的支持度Support()=P()。满足最小支持度(Min_Support)的项集称为频繁项集。将用户的目标作为关联规则的结果,利用关联规则挖掘用户的频繁序列模式作为关联规则的前件,具体方法为:
一种多媒体社交网络用户行为模式发现方法,包括以下步骤:
步骤一、定义SituEx(t)=(ID,d,A,E)表示t时刻用户的情境信息,其中t表示时刻,SituEx(t)表示t时刻用户行为模式集合,ID表示用户的身份信息,包括用户所在的群组和该群组对应的角色,d表示用户在t时刻的意图,A表示用户与实现d意图对应的动作,E表示t时刻用户的环境信息,包括终端信息、位置、时间、天气;定义G表示用户的一般目标,G={g 1 , g 2 ,…,g n }g i 表示用户在多媒体社交网络中的目标;
步骤二、在Web日志数据库中存储的当前用户与某个目标实现相关的所有频繁SituEx (t)组成该目标对应的行为模式序列,采用关联规则的方法发现当前用户在不同情境下对应于某个目标的行为模式序列,具体方法如下:
(1)扫描经过数据预处理之后的与当前用户相关的Web日志数据库,将时刻t该用户的情境信息记为SituEx(t),识别Web日志数据库中出现的Goal作为该用户在行为模式的结束点,记为:G ={g 1 ’,g 2 ’,…,g m ’},1≤m≤n,G G;
(2)将步骤(1)中获取的结束点g 1 作为关联规则的结果,以每个SituEx(t)作为关联规则的前件,计算每个关联规则的支持度,找出所有满足最小支持度的关联规则,这些关联规则的前件组成集合L 1 ,将L 1 作为新的关联规则前件的种子集;
(3)对集合L 1 中的序列进行连接操作和修剪操作,生成长度为2的候选序列集合C 2 C 2 中的每个候选序列分别作为关联规则的前件,g 1 作为关联规则的结果,计算其支持度,将满足最小支持度的关联规则的前件的集合组成L 2 ;依次类推,得出L 3 ,L 4 ,......,L k ,对于长度为k()的集合L k ,通过连接操作和修剪操作生成长度为k+1的候选序列C k+1 ,分别计算每个候选序列作为关联规则前件,g 1 作为关联规则结果的支持度,满足最小支持度的关联规则的前件组成长度为k+1的序列集合L k+1 ,并将L k+1 作为新的关联规则前件的种子集,以此类推,直到不再产生新的候选序列,得出所有该用户关于目标g 1 SituEx(t)组成的用户的频繁行为模式序列;
(4)同理,重复步骤(2)、(3),分别得到关于目标g 2 ,g 3 ,......,g m 所对应的SituEx(t)组成的频繁行为模式序列,直到不再有新的目标;
步骤三、用户在多媒体社交网络中至少存在一个目标,将找出的当前用户的特定目的的行为模式序列存入数据库中,通过该用户当前的序列与数据库中该用户的行为模式序列进行对比,预测用户当前的意图,以便对用户的请求做出及时快速的响应,提供个性化的服务。
进一步,所述的序列的连接操作方法为:如果去掉序列模式s 1 的第一个项目与去掉序列模式s 2 的最后一个项目所得到的序列相同,则可以将序列模式s 1 与序列模式s 2 进行连接,即将序列模式s2的最后一个项目添加到序列模式s1中。
进一步,所述的序列的修剪操作方法为:若某候选序列模式的某个子序列不是序列模式,则此候选序列模式不可能是序列模式,将它从候选序列模式中删除。
进一步,所述t时刻用户的环境信息,包括终端信息、位置、时间、天气。
图2中“数据提取/预处理”表示从数据库和Web日志中记录的用户行为数据要经过数据预处理,将数据格式转化成行为模式发现算法中需要的格式,数据预处理流程如图3所示;图2中“意图序列库”是将用户某个目标对应的行为模式序列保存到意图序列库中,作为将来用户意图预测的基础。
实施例
在多媒体社交网络中,假设用户所在的群组分为普通注册用户群组和VIP群组,分别对应的用户角色为普通注册用户和VIP用户,在多媒体社交网络中普遍存在的用户目标为播放和分享,由于相同用户对于相同目标在不同情境下的行为模式可能发生变化,因此实施例中分别列举同一用户在相同目标不同身份信息下的行为模式发现。
实施例1
在多媒体社交网络中,当用户P所在群组为普通注册用户群组时,相对应的用户身份为普通注册用户,用户的目标为播放音视频(Play)时,从数据库和日志记录中找到P的关于播放音视频的历史访问记录,经过数据预处理过程将用户的身份信息,用户每个时刻的意图,以及该时刻采取的行为,和当前的用户周围的环境转化成格式,如((R,Register),登录,登录,n),表示P是“普通注册用户群组”的“普通注册用户”,P当前的意图为“登录”,为了实现这个意图的行为为“点击登录按钮”,当前的环境为“非移动终端设备(n)”。将“播放”作为关联规则的结果,行为模式发现的具体步骤如下:
(1)计算的支持度,满足最小支持度的(i表示满足最小支持度的SituEx(t)的编号)作为1-频繁集。
(2)步骤(1)中的集合记为,对进行连接和剪枝操作,生成候选序列集中的候选序列作为关联规则前件,“播放”目标作为关联规则结果,计算其支持度,大于最小支持度阈值的候选序列集合记为,依次计算,直至不再产生新的候选序列,得出P为普通注册用户群组的普通注册用户时关于目标“播放”的所有频繁行为序列模式。
实施例2
在多媒体社交网络中,当P为VIP群组的VIP用户时,P的目标仍然为播放音视频(Play)时,,如((V,VIP),登录,登录,n),表示P为“VIP群组”的VIP用户,P当前的意图为“登录”,为了实现这个意图的行为为“点击登录按钮”,当前的环境为“非移动终端设备(n)”。将“播放”作为关联规则的结果,行为模式发现的具体步骤如下:
(1)计算的支持度,满足最小支持度的(i表示满足最小支持度的SituEx(t)的编号)作为1-频繁集。
步骤(1)中的集合记为,对进行连接和剪枝操作,生成候选序列集中的候选序列作为关联规则前件,“播放”目标作为关联规则结果,计算其支持度,大于最小支持度阈值的候选序列集合记为,依次计算,直至不再产生新的候选序列,得出P为VIP群组的VIP用户时关于目标“播放”的所有频繁行为序列模式。

Claims (3)

1.一种多媒体社交网络用户行为模式发现方法,其特征在于:包括以下步骤:
步骤一、定义SituEx(t)表示时刻t用户的情境信息,G表示用户的一般目标,G={g 1 , g 2 ,…,g n }g i 表示用户在多媒体社交网络中的目标;
步骤二、在Web日志数据库中存储的当前用户与某个目标实现相关的所有频繁SituEx (t)组成该目标对应的行为模式序列,采用关联规则的方法发现当前用户在不同情境下对应于某个目标的行为模式序列,具体方法如下:
(1)扫描经过数据预处理之后的与当前用户相关的Web日志数据库,将时刻t该用户的情境信息记为SituEx(t),识别Web日志数据库中出现的Goal作为该用户在行为模式的结束点,记为:G ={g 1 ’,g 2 ’,…,g m ’},1≤m≤n,G G;
(2)将步骤(1)中获取的结束点g 1 作为关联规则的结果,以每个SituEx(t)作为关联规则的前件,计算每个关联规则的支持度,找出所有满足最小支持度的关联规则,这些关联规则的前件组成集合L 1 ,将L 1 作为新的关联规则前件的种子集;
(3)对集合L 1 中的序列进行连接操作和修剪操作,生成长度为2的候选序列集合C 2 C 2 中的每个候选序列分别作为关联规则的前件,g 1 作为关联规则的结果,计算其支持度,将满足最小支持度的关联规则的前件的集合组成L 2 ;依次类推,得出L 3 ,L 4 ,......,L k ,对于长度为k()的集合L k ,通过连接操作和修剪操作生成长度为k+1的候选序列C k+1 ,分别计算每个候选序列作为关联规则前件,g 1 作为关联规则结果的支持度,满足最小支持度的关联规则的前件组成长度为k+1的序列集合L k+1 ,并将L k+1 作为新的关联规则前件的种子集,以此类推,直到不再产生新的候选序列,得出所有该用户关于目标g 1 SituEx(t)组成的用户的频繁行为模式序列;
(4)同理,重复步骤(2)、(3),分别得到关于目标g 2 ,g 3 ,......,g m 所对应的SituEx(t)组成的频繁行为模式序列,直到不再有新的目标;
步骤三、用户在多媒体社交网络中至少存在一个目标,将找出的当前用户的特定目的的行为模式序列存入数据库中,通过该用户当前的序列与数据库中该用户的行为模式序列进行对比,预测用户当前的意图,以便对用户的请求做出及时快速的响应,提供个性化的服务。
2.根据权利要求1所述的一种多媒体社交网络用户行为模式发现方法,其特征在于:所述的序列的连接操作方法为:如果去掉序列模式s 1 的第一个项目与去掉序列模式s 2 的最后一个项目所得到的序列相同,则可以将序列模式s 1 与序列模式s 2 进行连接,即将序列模式s2的最后一个项目添加到序列模式s1中。
3.根据权利要求1所述的一种多媒体社交网络用户行为模式发现方法,其特征在于:所述的序列的修剪操作方法为:若某候选序列模式的某个子序列不是序列模式,则此候选序列模式不可能是序列模式,将它从候选序列模式中删除。
CN201611069515.2A 2016-11-29 2016-11-29 一种多媒体社交网络用户行为模式发现方法 Active CN106651606B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611069515.2A CN106651606B (zh) 2016-11-29 2016-11-29 一种多媒体社交网络用户行为模式发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611069515.2A CN106651606B (zh) 2016-11-29 2016-11-29 一种多媒体社交网络用户行为模式发现方法

Publications (2)

Publication Number Publication Date
CN106651606A true CN106651606A (zh) 2017-05-10
CN106651606B CN106651606B (zh) 2021-02-05

Family

ID=58813095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611069515.2A Active CN106651606B (zh) 2016-11-29 2016-11-29 一种多媒体社交网络用户行为模式发现方法

Country Status (1)

Country Link
CN (1) CN106651606B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111026270A (zh) * 2019-12-09 2020-04-17 大连外国语大学 一种移动情境感知环境下的用户行为模式挖掘方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101888309A (zh) * 2010-06-30 2010-11-17 中国科学院计算技术研究所 在线日志分析方法
CN103390194A (zh) * 2012-05-07 2013-11-13 北京三星通信技术研究有限公司 用户意图预测及推荐建议的方法、设备和系统
CN104616092A (zh) * 2014-12-16 2015-05-13 国家电网公司 一种基于分布式日志分析的行为模式处理方法
WO2015176565A1 (zh) * 2014-05-22 2015-11-26 袁志贤 一种基于多维时间序列的电气设备故障预测方法
CN105260387A (zh) * 2015-09-10 2016-01-20 江苏省邮电规划设计院有限责任公司 一种面向海量事务数据库的关联规则分析方法
CN105528659A (zh) * 2016-01-27 2016-04-27 浙江大学 一种基于序列模式结合时间上下文的移动终端app使用预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101888309A (zh) * 2010-06-30 2010-11-17 中国科学院计算技术研究所 在线日志分析方法
CN103390194A (zh) * 2012-05-07 2013-11-13 北京三星通信技术研究有限公司 用户意图预测及推荐建议的方法、设备和系统
WO2015176565A1 (zh) * 2014-05-22 2015-11-26 袁志贤 一种基于多维时间序列的电气设备故障预测方法
CN104616092A (zh) * 2014-12-16 2015-05-13 国家电网公司 一种基于分布式日志分析的行为模式处理方法
CN105260387A (zh) * 2015-09-10 2016-01-20 江苏省邮电规划设计院有限责任公司 一种面向海量事务数据库的关联规则分析方法
CN105528659A (zh) * 2016-01-27 2016-04-27 浙江大学 一种基于序列模式结合时间上下文的移动终端app使用预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111026270A (zh) * 2019-12-09 2020-04-17 大连外国语大学 一种移动情境感知环境下的用户行为模式挖掘方法

Also Published As

Publication number Publication date
CN106651606B (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
US10194096B2 (en) System and method for optimizing videos using optimization rules
CN112836130B (zh) 一种基于联邦学习的上下文感知推荐系统及方法
US20100082653A1 (en) Event media search
CN105144141A (zh) 用于使用距离关联性散列法对媒体数据库定址的系统和方法
Wei et al. User-generated video emotion recognition based on key frames
Sen et al. Video skimming: Taxonomy and comprehensive survey
CN111368141B (zh) 视频标签的扩展方法、装置、计算机设备和存储介质
CN104216956A (zh) 一种图片信息的搜索方法和装置
JP2015532043A (ja) ネットワークにおいて少なくとも1つの映像サービスプロバイダのユーザに対する映像コンテンツを自動的に要約するためのプロセス
US20230090175A1 (en) Contextual situation analysis
CN107533850A (zh) 音频内容识别方法和装置
US9268861B2 (en) Method and system for recommending relevant web content to second screen application users
US20230164369A1 (en) Event progress detection in media items
CN105589935A (zh) 社交群组识别方法
CN106651606A (zh) 一种多媒体社交网络用户行为模式发现方法
CN108415987B (zh) 一种电影推荐的冷启动解决方法
CN107291875B (zh) 一种基于元数据图的元数据组织管理方法和系统
Dong et al. Advanced news video parsing via visual characteristics of anchorperson scenes
CN107147947B (zh) 关键帧识别方法及装置
CN112749946A (zh) 一种word2vec模型训练、数据召回方法及装置
CN112749131A (zh) 信息消重处理方法、装置及计算机可读存储介质
CN111581420A (zh) 一种基于Flink的医学图像实时检索方法
Valdés et al. A framework for video abstraction systems analysis and modelling from an operational point of view
US20230105830A1 (en) Matching video content to podcast episodes
CN112040329B (zh) 动态处理并播放多媒体内容的方法及多媒体播放装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant