CN110149556B

CN110149556B - 一种基于tdc-lda模型的iptv用户行为模式挖掘方法

Info

Publication number: CN110149556B
Application number: CN201910416747.8A
Authority: CN
Inventors: 顾军华; 李晓雪; 杨亮; 谢志坚; 田泽培; 陈博; 佘士耀; 张亚娟
Original assignee: Hebei University of Technology
Current assignee: Hebei University of Technology
Priority date: 2019-05-20
Filing date: 2019-05-20
Publication date: 2021-05-04
Anticipated expiration: 2039-05-20
Also published as: CN110149556A

Abstract

本发明公开了一种基于TDC‑LDA模型的IPTV用户行为模式挖掘方法，该方法首先用概率生成模型的思想来假设用户具体行为模式中的观看的节目、观看的时间点和观看时长的生成过程，建立TDC‑LDA模型；其次，用Gibbs采样的方式进行模型拟合，推导隐变量条件概率的采样公式以及用户‑行为模式矩阵、兴趣主题‑节目矩阵和时段‑时间点矩阵的计算公式；然后，根据TDC‑LDA模型的Gibbs采样过程，得到每一个用户的行为模式矩阵、兴趣主题‑节目矩阵和时段‑时间点矩阵；最后，通过用户的收视行为模式分布，给用户做出推荐。本发明提出了一种新的TDC‑LDA用户收视行为模式挖掘模型，在现有的cLDA模型的基础上加入了观看时长信息。

Description

一种基于TDC-LDA模型的IPTV用户行为模式挖掘方法

技术领域

本发明涉及IPTV用户行为模式的挖掘方法，具体是一种基于TDC-LDA模型的IPTV用户行为模式挖掘方法。

背景技术

随着互联网的发展，IPTV(网络协议电视)迅速普及，其海量的视频资源及优质的服务吸引了广大用户。IPTV利用宽带网将多媒体信息传递给用户，为用户提供包括数字电视在内的多种交互式服务。它在传统电视的基础上，加入点播、回看等交互功能，这使得电视观众与电视服务提供商之间有了更好的互动。然而，随着网络信息承载量的飞速增长，IPTV中的视频资源层出不穷，这不但给用户寻找节目造成了一定的困扰，也直接影响了用户对IPTV平台的满意度。为了给用户提供更好的收视服务，电视服务提供商可以通过大数据分析用户行为，为用户建模。IPTV用户行为建模可以通过分析用户行为来优化网络规划，进而提升IPTV系统的性能；可以通过挖掘用户收视兴趣，给IPTV用户提供诸如个性化电子菜单、节目推荐、个性化情景广告等服务，以此提升用户收视体验。

现有的用户收视行为模式挖掘方法大致分为两类。一类是通过适当抽象节目类别信息，将收看节目归纳为不同类型，从而建立用户兴趣模型。其中，《AIMED：A personalizedTV recommendation system》是一种利用人工神经网络技术结合用户的活动、兴趣和心情等属性构建的推荐系统，该系统可以预测用户对IPTV节目的偏好。《Towards TVRecommender System:Experiments with User Modeling》通过应用矢量空间模型和信息检索中的聚类假设来建立用户收视兴趣模型。《Recommender System of iptv tv programusing ontology and k-means clustering》通过本体论和K-means聚类算法为用户建模然后进行推荐。另一类方法是基于主题模型LDA算法的改进。LDA(Latent Dirichletallocation，潜在狄利克雷分配)是一种基于概率模型的文本主题建模方法。当不考虑收看时间时，可以把一个IPTV用户当成一篇文档，IPTV节目当成词语，用户由其观看的IPTV节目记录表示。例如，隐式反馈LDA模型结合IPTV用户收视过程中的点播、收藏和浏览等行为，采用LDA联合建模为用户做推荐。TMUD模型将两个LDA模型通过主题连接成为一个统一的模型，用于相似用户群分组和IPTV节目推荐。考虑到一个IPTV用户对应一个家庭，不同的家庭成员会在不同时段观看节目，张娅等人(Zhang Y,Chen W,Zha H,et al.A Time-TopicCoupled LDA Model for IPTV User Behaviors[J].IEEE Transactions onBroadcasting,2015,61(1):56-65.)提出基于时间耦合主题模型(cLDA)的IPTV用户建模方法，该模型通过对用户收视节目与收视时间点的联合建模，挖掘IPTV用户在每个时段的收视兴趣主题。

以上基于LDA模型的改进算法在用户行为建模方面取得了良好的效果，但这些方法忽略了对节目观看时长的利用，而节目的观看时长在很大程度上反映用户对节目的喜爱程度。

发明内容

针对现有技术的不足，本发明拟解决的技术问题是，提供一种基于TDC-LDA模型的IPTV用户行为模式挖掘方法。

本发明解决所述技术问题的技术方案是，提供一种基于TDC-LDA模型的IPTV用户行为模式挖掘方法，其特征在于该方法包括以下步骤：

步骤1、对IPTV节目的收视行为进行研究，得出IPTV用户的收视行为具有周期性；并且IPTV用户观看行为有如下几个特点：(1)一个IPTV用户有一个或多个成员；(2)每个成员有多种不同的收视兴趣；(3)不同成员看电视的时段不同，每个成员倾向于在固定时段观看同一类型的节目；(4)用户对节目的观看时长体现了他对节目的喜爱程度；用户对某个节目的观看时长越长，则对此节目的喜爱程度越高；

步骤2、建立TDC-LDA模型：在TDC-LDA模型中，每个用户对应一个描述该用户观看兴趣主题、观看时段与观看时长的行为模式分布，具体表现为在不同时段所呈现出的兴趣主题分布，且兴趣主题分布受观看时长影响；行为模式具体是指用户选择在哪个时段观看哪种类型的节目以及其观看时长，其中用户的观看时长体现了其对此类型节目的喜爱程度；

假设在TDC-LDA模型中，有K个兴趣主题，V_w个不同的IPTV节目，则兴趣主题对应的IPTV节目的多项式分布描述成K×V_w维的兴趣主题-节目矩阵Φ，

是节目v_w属于兴趣主题k的概率；假设有L个时段，V_t个不同的时间点，时段对应的时间点的多项式分布描述成L×V_t维的时段-时间点矩阵Ψ，

是时间点v_t属于时段l的概率；

对于用户m，把其由兴趣主题和时段构成的K×L维的行为模式矩阵分解成K·L维的向量

为用户m的行为模式分布；

中第z项代表用户m在z_m,n,1时段选择兴趣主题z_m,n,2这个行为并且观看时长为d_m,n的概率；其中z_m,n,1和z_m,n,2由式(1)求得：

式1)中，z_m,n为用户m的第n个收视记录的行为模式，z_m,n,1为用户m的第n个收视记录的时段，z_m,n,2为用户m的第n个收视记录的兴趣主题，K为兴趣主题的数量，mod函数是一个求余函数；

收视记录由观看的IPTV节目、观看的时间点和观看时长组成，则用户m的第n个收视记录包括w_m,n、t_m,n和d_m,n；其中，w_m,n表示用户m的第n个收视记录中观看的IPTV节目，t_m,n表示用户m的第n个收视记录的观看时间点，d_m,n表示用户m的第n个收视记录中的观看时长；

步骤3、根据步骤2得到的TDC-LDA模型，进行模型拟合，得到TDC-LDA模型的Gibbs采样公式；

采用Gibbs采样对TDC-LDA模型中的z_m,n进行推断；在每次采样迭代中，根据

对z_m,n采样；

表示用户m的除第n个收视记录以外的其他收视记录的行为模式；条件概率

可以由联合概率

通过贝叶斯定理求出，如式(2)所示：

式2)中，

是IPTV节目w_m,n被赋予兴趣主题z_m,n,2的次数，

是时间点t_m,n被赋予时段z_m,n,1的次数，

表示用户m被赋予行为模式z_m,n的次数，V_w代表所有IPTV节目总数，V_t代表所有时间点总数，α为行为模式分布

的Dirichlet先验，β为兴趣主题分布

的Dirichlet先验，γ为时段分布

的Dirichlet先验，λ为指数分布的参数；

每一次迭代用式(3)来更新λ:

是属于当前兴趣主题z_m,n,2的所有节目观看时长的均值；

TDC-LDA模型中，用户m的行为模式分布

兴趣主题k的节目分布

和时段l的时间点分布

是以Dirichlet分布为先验分布的多项式分布；因为Dirichlet分布与多项式分布为共轭分布，因此每一个用户对应的行为模式矩阵Θ、兴趣主题对应的IPTV节目矩阵Φ、时段对应的时间点矩阵Ψ作为后验分布可以用Dirichlet分布的期望进行推导得到，如式(4)-(6)所示：

式4-6中，θ_m,i代表用户m具有行为模式i的概率，

代表IPTV节目v_w属于兴趣主题k的概率，

表示时间点v_t属于时段l的概率，

是IPTV节目v_w被赋予兴趣主题k的次数，

是时间点v_t被赋予时段l的次数，

是用户m被赋予行为模式i的次数；

步骤4、对用户收视记录数据进行处理，提取用户的观看节目名称、观看时间点和观看时长信息，得到每个用户的每个收视记录；

步骤5、对步骤4得到的每个用户的每个收视记录的行为模式进行初始化；然后通过Gibbs采样公式对每个用户的每个收视记录的行为模式重新采样，直至算法收敛稳定；最后根据式4)-6)，分别计算得到用户-行为模式矩阵Θ、兴趣主题-节目矩阵Φ和时段-时间点矩阵Ψ；

步骤6、对步骤5得到的三个矩阵进行分析，得到兴趣主题表示的节目类型和每个时段的具体时间区间，进而挖掘到每个用户在不同时段的兴趣主题分布。

与现有技术相比，本发明有益效果在于：

(1)本发明提出了一种新的TDC-LDA用户收视行为模式挖掘模型，在现有的cLDA模型的基础上加入了观看时长信息。TDC-LDA模型是一个概率生成模型，它先假设用户的行为(诸如观看的节目、观看的时间点和观看时长)是如何产生的，改变了原有用户行为模式的生成假设。基于此假设，先推算出如何通过具体行为(观看的节目、观看的时间点和观看时长)来求得行为模式(收视兴趣、收视时段)的计算公式和采样公式，然后通过对已有的大量的IPTV用户收视行为数据进行训练，达到通过用户的观看节目、时段与时长等信息求得用户收视兴趣和收视时段的目的。

(2)本方法首先用概率生成模型的思想来假设用户具体行为模式中的观看的节目、观看的时间点和观看时长的生成过程，建立TDC-LDA模型；其次，用Gibbs采样的方式进行模型拟合，推导隐变量条件概率的采样公式以及用户-行为模式矩阵、兴趣主题-节目矩阵和时段-时间点矩阵的计算公式；然后，用TDC-LDA模型的Gibbs采样公式对每个用户的每个收视记录完成采样，进而得到每一个用户的行为模式矩阵、兴趣主题-节目矩阵和时段-时间点矩阵；最后，通过用户的收视行为模式分布，给用户做出推荐。

(3)本方法从观看的节目、观看的时间点和观看时长三个维度来挖掘用户行为，区分了家庭组成成员在不同时段的观看兴趣，从更精细的时段维度上为用户建模。通过实验表明，本发明可以挖掘到相关性较高的兴趣主题与收视时段，比较精确的挖掘到用户在不同时段的收视兴趣。相比于LDA模型，本发明提出的TDC-LDA模型在推荐任务上有更高的准确率。

(4)本TDC-LDA模型中，观看时间点与观看的节目由Dirichlet分布生成，观看时长由指数分布生成。

附图说明

图1为本发明用户收视记录的周期性变化图；

图2为本发明建立的TDC-LDA模型图；

图3为本发明中TDC-LDA模型挖掘到的用户时段行为模式图；

具体实施方式

下面给出本发明的具体实施例。具体实施例仅用于进一步详细说明本发明，不限制本申请权利要求的保护范围。

本发明提供了一种基于TDC-LDA模型的IPTV用户行为模式挖掘方法(简称方法)，其特征在于该方法包括以下步骤：

步骤1、对IPTV节目的收视行为进行研究；图1展示了一部动画片、一部爱情片和一档综艺节目在三周内的用户收视曲线图，图中横坐标记录了每周周一的起始时间，观看次数以两小时为间隔进行统计，纵坐标记录了每个节目的播放次数；由图1可知该曲线(IPTV用户的收视行为)具有较强的周期性，其周期为一周；假设同一类型的节目会在固定的时段被收看，不同家庭成员看电视的时段不同，在同一时段用户倾向于观看同一类型的节目，用户对节目的观看时长体现了他对节目的喜爱程度；基于上述假设，IPTV用户观看行为有如下几个特点：(1)一个IPTV用户有一个或多个成员；(2)每个成员有多种不同的收视兴趣；(3)每个成员倾向于在每周的特定时段观看电视；(4)用户对某个节目的观看时长越长，则对此节目的喜爱程度越高；

步骤2、建立TDC-LDA模型：将现有的LDA模型中的兴趣主题分布扩展为表示用户观看兴趣主题、观看时段与观看时长的行为模式分布，建立TDC-LDA(时段-时长耦合LDA，Time-Duratioan Coupled LDA)模型；建立的TDC-LDA模型是一个概率生成模型(如图2所示)；在LDA模型中，每个IPTV用户的兴趣主题分布不区分时段；而在TDC-LDA模型中，每个IPTV用户对应一个描述该用户观看兴趣主题、观看时段与观看时长的行为模式分布，每个IPTV用户会因时段的不同而有不同的兴趣主题分布，且兴趣主题分布受观看时长影响；

假设在TDC-LDA模型中，有K个兴趣主题，V_w个不同的IPTV节目，则兴趣主题对应的IPTV节目的多项式分布可以描述成K×V_w维的兴趣主题-节目矩阵Φ，

是节目v_w属于兴趣主题k的概率；同样，假设有L个时段(时段指一些特定的时间区间，例如，工作日17-19pm)，V_t个不同的时间点，时段对应的时间点的多项式分布描述成L×V_t维的时段-时间点矩阵Ψ，

是时间点v_t属于时段l的概率；

用户观看的节目类型(即兴趣主题)、时段以及观看时长为该用户的行为模式；行为模式具体是指用户选择在哪个时段观看哪种类型的节目以及其观看时长，其中用户的观看时长体现了其对此类型节目的喜爱程度；对于用户m，把其由兴趣主题和时段构成的K×L维的行为模式矩阵分解成K·L维的向量

为用户m的行为模式分布；

收视记录由观看的IPTV节目、观看的时间点和观看时长组成，则用户m的第n个收视记录包括w_m,n、t_m,n和d_m,n；其中，w_m,n表示用户m的第n个收视记录中观看的IPTV节目；t_m,n表示用户m的第n个收视记录的观看时间点；d_m,n表示用户m的第n个收视记录中的观看时长；

用户m采用TDC-LDA模型生成收视记录的过程如下：

(1)根据Dirichlet分布选择用户m的行为模式分布

其中m∈{1,...,M}，

是参数为α的Dirichlet分布；

(2)根据Dirichlet分布选择兴趣主题k的节目分布

其中k∈{1,...,K}，

是参数为β的Dirichlet分布；

(3)根据Dirichlet分布选择时段l的时间点分布

其中l∈{1,...,L}，

是参数为γ的Dirichlet分布；

(4)生成用户m的第n个收视记录(收视记录由观看的IPTV节目、观看时间点和观看时长组成)，其中n∈{1,...,N_m}；

a、从该用户的行为模式分布

中，选择一个行为模式

b、根据选择的行为模式z_m,n对应的兴趣主题找到这个兴趣主题生成IPTV节目的多项式分布，然后根据兴趣主题对应的节目分布生成IPTV节目

c、根据选择的行为模式z_m,n对应的时段找到这个时段生成时间点的多项式分布，然后根据时段对应的时间点分布生成时间点

d、根据行为模式z_m,n对应的兴趣主题，生成观看时长

其中，指数分布

(其参数

)的概率密度函数如式

所示；

表1

喜剧片	0.4
		战争片	0.3
家庭片	0.3

表2

表1是LDA模型的兴趣主题分布的一个实例，表明该用户观看喜剧片的概率为0.4，观看战争片的概率为0.3，观看家庭片的概率为0.3；表2是TDC-LDA模型的行为模式分布的一个实例，表明该用户在工作日15-18pm这个时段观看喜剧片的概率为0.1，在工作日20-22pm这个时段观看喜剧片的概率为0.1，在周末14-20pm这个时段观看喜剧片的概率为0.2，以此类推；

采用Gibbs采样对TDC-LDA模型中的隐变量z_m,n进行推断；在每次采样迭代中，根据用户m的除第n个收视记录(w_m,n,t_m,n,d_m,n)以外的其他收视记录的行为模式

对用户m的第n个收视记录(w_m,n,t_m,n,d_m,n)的行为模式z_m,n采样；条件概率

可以由联合概率

通过贝叶斯定理求出，其公式如式(2)所示：

式2)中，

是IPTV节目w_m,n被赋予兴趣主题z_m,n,2的次数，

是时间点t_m,n被赋予时段z_m,n,1的次数，

的Dirichlet先验，β为兴趣主题分布

的Dirichlet先验，γ为时段分布

的Dirichlet先验，λ为指数分布的参数；

每一次迭代用式(3)来更新λ:

是属于当前兴趣主题z_m,n,2的所有节目观看时长的均值；迭代次数一般选为1000次；

TDC-LDA模型中，

(用户m的行为模式分布)、

(兴趣主题k的节目分布)和

(时段l的时间点分布)是以Dirichlet分布为先验分布的多项式分布；因为Dirichlet分布与多项式分布为共轭分布，因此用户对应的行为模式矩阵Θ(简称用户-行为模式矩阵)、兴趣主题对应的IPTV节目矩阵Φ(简称兴趣主题-节目矩阵)、时段对应的时间点矩阵Ψ(简称时段-时间点矩阵)作为后验分布可以用Dirichlet分布的期望进行推导得到，如式(4)-(6)所示：

式4-6中，θ_m,i代表用户m具有行为模式i的概率，

代表IPTV节目v_w属于兴趣主题k的概率，

表示时间点v_t属于时段l的概率，

是IPTV节目v_w被赋予兴趣主题k的次数，

是时间点v_t被赋予时段l的次数，

是用户m被赋予行为模式i的次数；

步骤4、对用户收视记录数据进行处理，提取用户的观看节目名称、观看时间点和观看时长信息，得到每个用户的每个收视记录；具体处理遵循以下几个原则：

(1)将IPTV节目名称中集数与季去掉，不同季与不同集数的节目视为同一节目；

(2)将时间点改成“星期-时”的形式，不同的时间点V_t总共是7×24个；

(3)只保留观看时长超过3分钟的观看记录(节目的平均观看时长是35分钟)；即如果用户相邻观看记录之间的时间间隔小于三分钟，则删除上一个观看记录；

(4)删除无效节目，处理重复和错误数据；

具体是：(1)对每个用户的每个收视记录的行为模式进行初始化，为每个用户的每个收视记录的行为模式赋予一个初始值；具体实施过程如下：

(2)用Gibbs采样公式对每个用户的每个收视记录的行为模式重新采样，直至算法收敛稳定，具体实施过程如下：

(3)根据式(4)-(6)，分别计算得到用户-行为模式矩阵Θ、兴趣主题-节目矩阵Φ和时段-时间点矩阵Ψ；

步骤6、对步骤5得到的三个矩阵进行分析，得到兴趣主题表示的节目类型和每个时段的具体时间区间，进而挖掘到每个用户在不同时段的兴趣主题分布；

(1)根据兴趣主题对应的IPTV节目矩阵Φ，按每个兴趣主题中节目的概率高低进行排序，进而得到每个兴趣主题表示的节目类型；表3是兴趣主题中按节目的概率高低进行排序后的该兴趣主题的IPTV节目分布，由表3可以得出兴趣主题6的节目类型为古装片，兴趣主题35的节目类型为动画片。

表3

(2)根据时段对应的时间点矩阵Ψ，按每个时段中时间点的概率高低进行排序，进而得到每个时段具体对应的时间区间；图3中为根据本方法划分的时段，每个表格代表一个时间点，图中将一周的时间点总共分为8个时段，用序号“0-7”来标记，相同时段的时间点用同种填充图案标记；

具体是时段0包括周一的6-7am、周二的6-7am、周三的6-8am、周四的6-7am、周五的7am、周六的7am和周日的7am；时段1包括周一的9-11am、周二的9-11am、周三的9-11am、周四的10am、周五的10-11am和周六的9-11am；时段2包括周一的12-14pm、周二的12-14pm、周三的12-14pm、周四的12pm、周五的12-13pm、周六的12-13pm和周日的12pm；时段3包括周一至周日的16-17pm；时段4包括周一至周日的18pm；时段5包括周一至周日的19pm；时段6包括周一至周日的20-21pm；时段7包括周一至周日的22-23pm；

(3)根据用户的行为模式矩阵Θ，对每个用户的行为模式按概率高低进行排序，进而分析每个用户在不同时段的兴趣主题；表4为挖掘到的用户行为模式；由表4可知，该用户m倾向于在时段3(下午4-5点)收看动画类节目，在时段6和时段7(晚上8点到11点之间)收看古装爱情类节目。

表4

为验证TDC-LDA模型的效果，用TDC-LDA模型在IPTV用户收视记录数据集上执行推荐任务，并计算LDA、cLDA和TDC-LDA模型的预测困惑度(predictive-perplexity)。推荐任务的目标是预测IPTV用户在特定的时段打开电视时会收看什么节目。实验中，将IPTV用户分为训练集和测试集，训练集包括每个用户除最后一个收视记录外的所有记录，测试集由每个用户的最后一个收视记录构成。推荐任务要完成的是，通过每一个用户最后一个收视记录的时间点来预测用户收看的节目。预测困惑度指标定义如下：

式7)中，M_test是测试集中用户数目；困惑度越低表示模型泛化性能越好，推荐更准确。实验中，令cLDA与TDC-LDA的时段L＝8，通过将兴趣主题K设置为不用的值来比较不同模型的困惑度，如表5所示。由表5可知，TDC-LDA、cLDA、LDA模型的推荐效果依次降低。这说明，在挖掘用户不同时段的收视兴趣时加入用户观看时长信息是非常有必要的。

表5

本发明未述及之处适用于现有技术。

Claims

1.一种基于TDC-LDA模型的IPTV用户行为模式挖掘方法，其特征在于该方法包括以下步骤：

步骤1、建立TDC-LDA模型：在TDC-LDA模型中，每个用户对应一个描述该用户观看兴趣主题、观看时段与观看时长的行为模式分布，具体表现为在不同时段所呈现出的兴趣主题分布，且兴趣主题分布受观看时长影响；行为模式具体是指用户选择在哪个时段观看哪种类型的节目以及其观看时长，其中用户的观看时长体现了其对此类型节目的喜爱程度；

在TDC-LDA模型中，有K个兴趣主题，V_w个不同的IPTV节目，则兴趣主题对应的IPTV节目的多项式分布描述成K×V_w维的兴趣主题-节目矩阵Φ，

是节目v_w属于兴趣主题k的概率；TDC-LDA模型中有L个时段，V_t个不同的时间点，时段对应的时间点的多项式分布描述成L×V_t维的时段-时间点矩阵Ψ，

是时间点v_t属于时段l的概率；

为用户m的行为模式分布；

式(1)中，z_m,n为用户m的第n个收视记录的行为模式，z_m,n,1为用户m的第n个收视记录的时段，z_m,n,2为用户m的第n个收视记录的兴趣主题，mod函数是一个求余函数；

用户m采用TDC-LDA模型生成收视记录的过程如下：

(1)根据Dirichlet分布选择用户m的行为模式分布

其中m∈{1,...,M}，

是参数为α的Dirichlet分布；

(2)根据Dirichlet分布选择兴趣主题k的节目分布

其中k∈{1,...,K}，

是参数为β的Dirichlet分布；

(3)根据Dirichlet分布选择时段l的时间点分布

其中l∈{1,...,L}，

是参数为γ的Dirichlet分布；

(4)生成用户m的第n个收视记录，收视记录由观看的IPTV节目、观看时间点和观看时长组成，其中n∈{1,...,N_m}；

a、从该用户的行为模式分布

中，选择一个行为模式

d、根据行为模式z_m,n对应的兴趣主题，生成观看时长

步骤2、根据步骤1得到的TDC-LDA模型，进行模型拟合，得到TDC-LDA模型的Gibbs采样公式；

对z_m,n采样；

可以由联合概率

通过贝叶斯定理求出，如式(2)所示：

式(2)中，

是IPTV节目w_m,n被赋予兴趣主题z_m,n,2的次数，

是时间点t_m,n被赋予时段z_m,n,1的次数，

的Dirichlet先验，β为兴趣主题分布

的Dirichlet先验，γ为时段分布

的Dirichlet先验，λ为指数分布的参数；β_w为每个IPTV节目w对应兴趣主题分布

的Dirichlet先验；γ_t为每个时间点t对应时段分布

的Dirichlet先验；

用户m的第n个收视记录的行为模式对应行为模式分布

的Dirichlet先验；α_i为第i个行为模式对应的行为模式分布

的Dirichlet先验；

是用户m的第n个收视记录的兴趣主题对应指数分布的参数；

是IPTV节目v_w被赋予兴趣主题z_m,n,2的次数，

是时间点v_t被赋予时段z_m,n,1的次数，

是用户m被赋予行为模式i的次数；

每一次迭代用式(3)来更新λ:

是属于当前兴趣主题z_m,n,2的所有节目观看时长的均值；

TDC-LDA模型中，用户m的行为模式分布

兴趣主题k的节目分布

和时段l的时间点分布

式(4)-(6)中，θ_m,i代表用户m具有行为模式i的概率，

代表IPTV节目v_w属于兴趣主题k的概率，

表示时间点v_t属于时段l的概率，

是IPTV节目v_w被赋予兴趣主题k的次数，

是时间点v_t被赋予时段l的次数；

步骤3、对用户收视记录数据进行处理，提取用户的观看节目名称、观看时间点和观看时长信息，得到每个用户的每个收视记录；

步骤4、对步骤3得到的每个用户的每个收视记录的行为模式进行初始化；然后通过Gibbs采样公式对每个用户的每个收视记录的行为模式重新采样，直至算法收敛稳定；最后根据式(4)-(6)，分别计算得到用户-行为模式矩阵Θ、兴趣主题-节目矩阵Φ和时段-时间点矩阵Ψ；

步骤5、对步骤4得到的三个矩阵进行分析，得到兴趣主题表示的节目类型和每个时段的具体时间区间，进而挖掘到每个用户在不同时段的兴趣主题分布。

2.根据权利要求1所述的基于TDC-LDA模型的IPTV用户行为模式挖掘方法，其特征在于步骤3中，对用户收视记录数据进行处理具体是：将IPTV节目名称中集数与季去掉，不同季与不同集数的节目视为同一节目；将时间点改成星期-时的形式，不同的时间点V_t总共是7×24个；用户相邻观看记录之间的时间间隔小于三分钟，则删除上一个观看记录；删除无效节目。

3.根据权利要求1所述的基于TDC-LDA模型的IPTV用户行为模式挖掘方法，其特征在于步骤5具体是：(1)根据兴趣主题对应的IPTV节目矩阵Φ，按每个兴趣主题中节目的概率高低进行排序，进而得到每个兴趣主题表示的节目类型；(2)根据时段对应的时间点矩阵Ψ，按每个时段中时间点的概率高低进行排序，进而得到每个时段具体对应的时间区间；(3)根据用户的行为模式矩阵Θ，对每个用户的行为模式按概率高低进行排序，进而分析每个用户在不同时段的兴趣主题。