CN106651606A

CN106651606A - 一种多媒体社交网络用户行为模式发现方法

Info

Publication number: CN106651606A
Application number: CN201611069515.2A
Authority: CN
Inventors: 张志勇; 黄涛; 赵长伟; 张丽丽; 孙冉冉; 向菲; 王剑; 韩林茜; 史培宁; 王小雪; 刘芳云; 李成; 闻婧
Original assignee: Henan University of Science and Technology
Current assignee: Henan University of Science and Technology
Priority date: 2016-11-29
Filing date: 2016-11-29
Publication date: 2017-05-10
Anticipated expiration: 2036-11-29
Also published as: CN106651606B

Abstract

一种多媒体社交网络用户行为模式发现方法，采用基于关联规则的方法在多媒体社交网络中发现用户在不同的情境下对应于某个目标的行为模式序列，从而及时发现用户的意图，为提供更加个性化的服务奠定基础。

Description

一种多媒体社交网络用户行为模式发现方法

技术领域

本发明属于互联网技术领域，具体涉及一种多媒体社交网络用户行为模式发现方法。

背景技术

伴随着移动互联网和Web2.0技术的兴起，多媒体社交网络（Multimedia SocialNetwork,简称MSN）上用户和数字内容呈现爆炸式增长，移动终端设备的出现也使得用户可以随时访问多媒体社交网络，用户与系统的交互行为越来越复杂。因此，如何在这种复杂的交互中及时了解用户变化的意图，给用户提供更加个性化的服务，成为当前多媒体社交网络服务的一个挑战。

多媒体计算技术的目的是根据用户的意图向用户推送多媒体内容。多媒体计算分为以数据为中心的多媒体压缩阶段（存储），以内容为中心的多媒体通信阶段（传播）和多媒体内容分析阶段（智能），以数据为中心和以内容为中心的都已经做了很好的研究，然而理解和预测不同情境下用户需要的多媒体内容还没有做出很好的研究。【P. Cui, W. Zhu,T. S. Chua, R. Jain, “Social-Sensed Multimedia Computing,”IEEE Multimedia,vol. 23, no. 1, pp. 92-96, Jan.-Mar. 2016.】

个性化服务是根据用户的设定来实现，依据各种渠道对资源进行收集、整理和分类，向用户提供和推荐相关信息，以满足用户的需求。为了实现个性化服务，首先需要学习及跟踪用户的兴趣和行为。【李春, 朱珍民, 叶剑, 周佳颖, 个性化服务研究综述, 计算机应用研究, vol. 26, no. 11, Nov.2009】。为了在多媒体社交网络中充分“理解”用户的“隐式”需求，本专利提出一种在多媒体社交网络中基于情境感知分析的用户行为模式发现的新方法。通过发现不同情境下用户的行为模式特征，可以给用户提供相应的个性化服务，如推荐内容、缓冲网页等。

发明内容

本发明所要解决的技术问题是提供一种多媒体社交网络用户行为模式发现方法，在多媒体社交网络中发现用户在不同情境下的频繁行为序列模式，从而及时发现用户的意图，为提供更加个性化的服务奠定基础。

本发明为解决上述技术问题所采用的技术方案是：一种多媒体社交网络用户行为模式发现方法，包括以下步骤：

步骤一、定义SituEx(t)表示时刻t用户的情境信息，G表示用户的一般目标，G={g ₁ , g ₂ ,…，g _n }，g _i表示用户在多媒体社交网络中的目标；

步骤二、在Web日志数据库中存储的当前用户与某个目标实现相关的所有频繁SituEx (t)组成该目标对应的行为模式序列，采用关联规则的方法发现当前用户在不同情境下对应于某个目标的行为模式序列，具体方法如下：

（1）扫描经过数据预处理之后的与当前用户相关的Web日志数据库，将时刻t该用户的情境信息记为SituEx(t)，识别Web日志数据库中出现的Goal作为该用户在行为模式的结束点，记为：G ^’ ={g ₁ ’,g ₂ ’,…，g _m ’}，1≤m≤n，G^’ G；

（2）将步骤（1）中获取的结束点g ₁ ^’作为关联规则的结果，以每个SituEx(t)作为关联规则的前件，计算每个关联规则的支持度，找出所有满足最小支持度的关联规则，这些关联规则的前件组成集合L ₁，将L ₁作为新的关联规则前件的种子集；

（3）对集合L ₁中的序列进行连接操作和修剪操作，生成长度为2的候选序列集合C ₂，C ₂中的每个候选序列分别作为关联规则的前件，g ₁ ^’作为关联规则的结果，计算其支持度，将满足最小支持度的关联规则的前件的集合组成L ₂；依次类推，得出L ₃,L ₄,......,L _k，对于长度为k()的集合L _k，通过连接操作和修剪操作生成长度为k+1的候选序列C _k+1，分别计算每个候选序列作为关联规则前件，g ₁ ^’作为关联规则结果的支持度，满足最小支持度的关联规则的前件组成长度为k+1的序列集合L _k+1，并将L _k+1作为新的关联规则前件的种子集，以此类推，直到不再产生新的候选序列，得出所有该用户关于目标g ₁ ^’的SituEx(t)组成的用户的频繁行为模式序列；

（4）同理，重复步骤（2）、（3），分别得到关于目标g ₂ ^’,g ₃ ^’,......,g _m ^’所对应的SituEx(t)组成的频繁行为模式序列，直到不再有新的目标；

步骤三、用户在多媒体社交网络中至少存在一个目标，将找出的当前用户的特定目的的行为模式序列存入数据库中，通过该用户当前的序列与数据库中该用户的行为模式序列进行对比，预测用户当前的意图，以便对用户的请求做出及时快速的响应，提供个性化的服务。

本发明所述的序列的连接操作方法为：如果去掉序列模式s ₁的第一个项目与去掉序列模式s ₂的最后一个项目所得到的序列相同，则可以将序列模式s ₁与序列模式s ₂进行连接，即将序列模式s₂的最后一个项目添加到序列模式s₁中。

本发明所述的序列的修剪操作方法为：若某候选序列模式的某个子序列不是序列模式，则此候选序列模式不可能是序列模式，将它从候选序列模式中删除。

本发明的有益效果是：本发明根据用户的历史行为记录，通过本发明技术方案得到每个目标对应的行为模式序列，当该用户当前在社交媒体系统中的行为记录与已有的用户的行为序列模式相似度较高，则可以预测该用户的意图为已有行为序列模式的目标，根据预测的用户意图则可以提前为用户推荐可能需要的内容或缓存可能访问的页面，及时了解用户潜在的需求，给用户提供个性化服务，从而提高用户体验质量。

附图说明

图1为本发明用户目标的行为模式序列预测流程图；

图2为本发明用户行为模式发现系统架构图；

图3为本发明数据预处理流程图。

具体实施方式

如图所示，本发明采用基于关联规则的方法发现用户在不同的情境下对应于某个目标的行为模式序列。关联规则是发现大量的数据集中各项间存在的联系。设DS表示全体事务集，其中每一个属性被称为一个项目（item），DS中所有项目组成的集合被称为数据项集合，I={i ₁ ,i ₂ ,...,i _m }，|I|=m，m表示DS中所含项目的个数。

关联规则具有以下的逻辑蕴含形式：，其中且；项集A称为关联规则的前件，项集B称为关联规则的结果，是该规则所对应的项集。支持度：全体实体数据集DS中包含数据项集A的事务数量，称为项集A在DS中的支持数，记为A.Support。对于规则的支持数是指在DS中项集A和项集B共现的事务数量，所以规则的支持度Support()=P()。满足最小支持度（Min_Support）的项集称为频繁项集。将用户的目标作为关联规则的结果，利用关联规则挖掘用户的频繁序列模式作为关联规则的前件，具体方法为：

一种多媒体社交网络用户行为模式发现方法，包括以下步骤：

步骤一、定义SituEx(t)=(ID,d,A,E)表示t时刻用户的情境信息，其中t表示时刻，SituEx(t)表示t时刻用户行为模式集合，ID表示用户的身份信息，包括用户所在的群组和该群组对应的角色，d表示用户在t时刻的意图，A表示用户与实现d意图对应的动作，E表示t时刻用户的环境信息，包括终端信息、位置、时间、天气；定义G表示用户的一般目标，G={g ₁ , g ₂ ,…，g _n }，g _i表示用户在多媒体社交网络中的目标；

进一步，所述的序列的连接操作方法为：如果去掉序列模式s ₁的第一个项目与去掉序列模式s ₂的最后一个项目所得到的序列相同，则可以将序列模式s ₁与序列模式s ₂进行连接，即将序列模式s₂的最后一个项目添加到序列模式s₁中。

进一步，所述的序列的修剪操作方法为：若某候选序列模式的某个子序列不是序列模式，则此候选序列模式不可能是序列模式，将它从候选序列模式中删除。

进一步，所述t时刻用户的环境信息，包括终端信息、位置、时间、天气。

图2中“数据提取/预处理”表示从数据库和Web日志中记录的用户行为数据要经过数据预处理，将数据格式转化成行为模式发现算法中需要的格式，数据预处理流程如图3所示；图2中“意图序列库”是将用户某个目标对应的行为模式序列保存到意图序列库中，作为将来用户意图预测的基础。

实施例

在多媒体社交网络中，假设用户所在的群组分为普通注册用户群组和VIP群组，分别对应的用户角色为普通注册用户和VIP用户，在多媒体社交网络中普遍存在的用户目标为播放和分享，由于相同用户对于相同目标在不同情境下的行为模式可能发生变化，因此实施例中分别列举同一用户在相同目标不同身份信息下的行为模式发现。

实施例1

在多媒体社交网络中，当用户P所在群组为普通注册用户群组时，相对应的用户身份为普通注册用户，用户的目标为播放音视频（Play）时，从数据库和日志记录中找到P的关于播放音视频的历史访问记录，经过数据预处理过程将用户的身份信息，用户每个时刻的意图，以及该时刻采取的行为，和当前的用户周围的环境转化成格式，如((R,Register),登录,登录,n)，表示P是“普通注册用户群组”的“普通注册用户”，P当前的意图为“登录”，为了实现这个意图的行为为“点击登录按钮”，当前的环境为“非移动终端设备(n)”。将“播放”作为关联规则的结果，行为模式发现的具体步骤如下：

（1）计算的支持度，满足最小支持度的（i表示满足最小支持度的SituEx(t)的编号）作为1-频繁集。

（2）步骤（1）中的集合记为，对进行连接和剪枝操作，生成候选序列集，中的候选序列作为关联规则前件，“播放”目标作为关联规则结果，计算其支持度，大于最小支持度阈值的候选序列集合记为，依次计算，直至不再产生新的候选序列，得出P为普通注册用户群组的普通注册用户时关于目标“播放”的所有频繁行为序列模式。

实施例2

在多媒体社交网络中，当P为VIP群组的VIP用户时，P的目标仍然为播放音视频（Play）时，,如((V,VIP),登录,登录,n)，表示P为“VIP群组”的VIP用户，P当前的意图为“登录”，为了实现这个意图的行为为“点击登录按钮”，当前的环境为“非移动终端设备(n)”。将“播放”作为关联规则的结果，行为模式发现的具体步骤如下：

步骤（1）中的集合记为，对进行连接和剪枝操作，生成候选序列集，中的候选序列作为关联规则前件，“播放”目标作为关联规则结果，计算其支持度，大于最小支持度阈值的候选序列集合记为，依次计算，直至不再产生新的候选序列，得出P为VIP群组的VIP用户时关于目标“播放”的所有频繁行为序列模式。

Claims

1.一种多媒体社交网络用户行为模式发现方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种多媒体社交网络用户行为模式发现方法，其特征在于：所述的序列的连接操作方法为：如果去掉序列模式s ₁的第一个项目与去掉序列模式s ₂的最后一个项目所得到的序列相同，则可以将序列模式s ₁与序列模式s ₂进行连接，即将序列模式s₂的最后一个项目添加到序列模式s₁中。

3.根据权利要求1所述的一种多媒体社交网络用户行为模式发现方法，其特征在于：所述的序列的修剪操作方法为：若某候选序列模式的某个子序列不是序列模式，则此候选序列模式不可能是序列模式，将它从候选序列模式中删除。