CN104602040B

CN104602040B - 一种节目单制定系统及方法

Info

Publication number: CN104602040B
Application number: CN201410712256.5A
Authority: CN
Inventors: 殷复莲; 柴剑平; 王妍; 潘幸艺; 王鑫; 张贝贝
Original assignee: Communication University of China
Current assignee: Communication University of China
Priority date: 2014-11-28
Filing date: 2014-11-28
Publication date: 2017-08-29
Anticipated expiration: 2034-11-28
Also published as: CN104602040A

Abstract

本发明提供一种节目单制定系统及方法。系统包括：节目标签采集单元，用于采集节目名称及其节目标签；输入单元，用于输入至少一个节目名称、空间区域、时间区域并生成调用指令；节目标签数据库，按照节目名称对节目标签进行汇总存储并接收调用指令导出节目标签数据源；节目播放收视数据库，将各节目播放信息和收看信息存储为播放收视数据源，并接收调用指令将其导出；收视空间构造单元，接收数据源构造基于节目标签兴趣度的收视空间；广播电视用户划分单元，对收视空间内用户进行分群得到各节目标签的广播电视社区；节目单制定单元，制定符合收视偏好节目单并存储；节目单发送单元，将节目单发送给用户。系统的数据反馈充足且准确对用户分群。

Description

一种节目单制定系统及方法

技术领域

本发明涉及广播电视领域，更为具体地，涉及一种节目单制定系统及方法。

背景技术

随着广播电视行业的发展以及电视资源的不断丰富，用户在收视过程中形成了不同的节目类型偏好。通过对用户收视行为进行分析，对收视用户进行分群，找到具有相同收视习惯的用户群体，即广播电视社区，成为了广电行业研究焦点。

传统的电视节目分类是具有包含关系的树状结构，如图1所示，一个电视节目只能被分类到分类体系中的一种节目类型，过于注重节目所属类别，忽视了电视节目具有的多重特点，未能多维地体现节目内容。基于传统的电视节目分类体系，对用户进行用户分群分析，并不能得到很好的效果。

现有的广播电视用户分群方法中通常采用聚类分析。聚类分析就是把对象按照性质上的亲疏程度分成多个类或簇，使得类或簇内的数据相似度最大化，类或簇间的数据相似度最小化。最直接的节目收视数据难以计算用户距离，因此无法直接进行聚类挖掘。现有的广播电视领域中的聚类技术，以节目作为用户的属性供聚类算法中的距离计算，但当节目数量增加时，计算中的维度也增加，当对大量节目收视记录聚类时，出现聚类维度过高的问题。另外，现有广播电视用户分群方法通常采用单一的节目的收视指标作为用户的属性供聚类算法中的距离计算，例如采用收视率、收视时长或者收视次数作为用户的属性，收视率是通过计算总体收视观众的宏观收视情况计算得到的收视指标，不能体现用户的个性化偏好，若使用收视率向用户推送节目单，推送节目会被少数几个收视率较高的节目占据，同时也无法针对用户的偏好进行推送；若以收视时长作为指标来确定用户的偏好，播出时间长的节目会比播出时间短的节目拥有更长的收视时长，推送结果将偏向播出时间更长的节目；若是以收视次数作为指标来确定用户的偏好，以收视频率低但出现次数多的节目(例如广告)的用户偏好要高于出现次数少但收视频率高的节目。总之，采用单一的节目的收视指标利用聚类分析来对广播电视用户分群准确性低，不能全面准确的确定用户的收视偏好。

发明内容

鉴于上述问题，本发明的目的是提供一种计算量小、数据反馈充足且准确对广播电视用户分群的方法。

根据本发明的一个方面，提供一种节目单制定系统，包括：节目标签采集单元，用于从存储节目信息的数据库或者网站上采集节目名称及其节目标签，其中，节目标签是对电视节目内容的多角度概括；节目标签数据库，接收节目标签采集单元采集的节目标签并按照节目名称对其进行汇总存储为节目标签数据集合，即节目标签数据源，并接收下述输入单元的调用指令导出调用指令中的节目标签数据源；节目播放收视数据库，将各节目的播放信息和通过用户机顶盒的收视信号采集的用户对各节目的收看信息存储为播放收视数据集合，即播放收视数据源，并接收下述输入单元的调用指令导出调用指令中的播放收视数据源；输入单元，用于输入确定广播电视用户收视偏好所需的至少一个节目名称、空间区域、时间区域并生成所述节目名称的节目标签数据源和上述空间区域和时间区域内所述节目名称的播放收视数据源的调用指令；收视空间构造单元，接收节目标签数据库调出的节目标签数据源和节目播放收视数据库调出的播放收视数据源构造基于节目标签兴趣度的收视空间，其中，节目标签兴趣度是用户对节目标签的偏好程度，将用户对包含节目标签的每一个节目的收视时长与总播出时长的比值乘以收视天数与时间区域天数的比值，并将上述结果求和；

广播电视用户划分单元，将上述收视空间中广播电视用户按照对不同标签的兴趣度进行分群，得到各节目标签的广播电视社区；节目单制定单元，制定符合上述各广播电视社区对节目标签的偏好的电子节目单；节目单发送单元，将符合各个广播电视社区节目标签偏好的节目单发送给用户。

根据本发明的另一个方面，提供一种节目单制定方法，包括：通过节目标签采集单元采集节目名称及其节目标签，并按照节目名称对其进行汇总和存储；通过输入单元输入确定用户偏好所需的至少一个节目名称、空间区域、时间区域并生成上述空间区域和时间区域内所述节目名称的节目标签数据源和播放收视数据源的调用指令；根据输入单元的调用指令分别从节目标签数据库和节目播放收视数据库导出符合调用指令的节目标签数据源和播放收视数据源，并导入到收视空间构造单元；利用上述数据源构造基于节目标签兴趣度的收视空间；对上述收视空间内用户对各节目的节目标签的节目标签兴趣度进行分群形成各节目标签的广播电视社区；制定符合各广播电视社区的节目标签兴趣度的节目单；将上述节目单发送给各社区的用户。

本发明所述节目单制定系统及方法通过建立基于节目标签兴趣度的收视空间，将用户-节目的二元关系提升为用户-节目标签的二元关系，有效地压缩了大量的节目，降低聚类分析空间中的距离维度，减少了计算消耗，以更贴近节目内容的节目标签的兴趣度对用户收视偏好进行划分，包括了含有节目标签的所有节目，能够准确全面的确定用户的收视偏好。

附图说明

通过参考以下结合附图的说明及权利要求书的内容，并且随着对本发明的更全面理解，本发明的其它目的及结果将更加明白及易于理解。在附图中：

图1是现有技术电视节目树状分类结构的构成示意图；

图2是本发明节目单制定系统的构成框图；

图3是本发明节目标签的示意图；

图4是本发明节目单制定方法的流程图；

图5是本发明基于节目标签兴趣度收视空间构造方法的流程图；

图6是本发明基于节目标签兴趣度收视空间内广播电视用户分群方法的流程图；

图7是本发明利用层次聚类确定广播电视用户分群个数的方法的流程图；

图8是本发明层聚类树状图的示意图

图9是本发明利用K-means方法对广播电视用户按照节目标签兴趣度对广播电视用户分群的方法的流程图。

在所有附图中相同的标号指示相似或相应的特征或功能。

具体实施方式

在下面的描述中，出于说明的目的，为了提供对一个或多个实施例的全面理解，阐述了许多具体细节。然而，很明显，也可以在没有这些具体细节的情况下实现这些实施例。以下将结合附图对本发明的具体实施例进行详细描述。

以下将结合附图对本发明的具体实施例进行详细描述。

图2是本发明节目单制定系统的构成框图，如图2所示,本发明所述标签装置包括：

节目标签采集单元100，用于从存储节目信息的数据库或者网站上采集节目名称及其节目标签，其中，节目标签是对电视节目内容的多角度概括，每一个节目标签体现电视节目一个方面的特性，如图3所示，节目标签包括节目类型标签、年代标签、参加人员标签等，其中节目类型标签可以是新闻类、电视剧类、动漫类等；年代标签可以是古代、现代、抗日年代等；参加人员标签可以是演员、导演、编剧等；

节目标签数据库110，接收节目标签采集单元100采集的节目标签并按照节目名称对其进行汇总存储为节目标签数据集合，即节目标签数据源，并接下述收输入单元120的调用指令导出调用指令中的节目标签数据源，其中，以单个节目为例说明汇总存储的节目标签，图3示出了以节目名称为中心的扁平化节目标签数据库；

节目播放收视数据库130，将各节目的播放信息和通过用户机顶盒的收视信号采集的用户对各节目的收看信息存储为播放收视数据集合，即播放收视数据源，并接下述收输入单元120的调用指令导出调用指令中的播放收视数据源；

输入单元120，用于输入确定广播电视用户收视偏好所需的至少一个节目名称、空间区域、时间区域并生成所述节目名称的节目标签数据源和上述空间区域和时间区域内所述节目名称的播放收视数据源的调用指令，例如，输入单元输入的节目名称为“新闻联播”、空间区域为“北京市”、时间区域为“2013年-2014年”，则生成调用指令中的节目标签数据源为“新闻联播”的节目标签数据集合，调用指令中的播放收视数据源是北京市广播电视用户2013年至2014年对“新闻联播”的播放收视数据集合，输入单元120可以是触摸屏、键盘、手写板、鼠标等具有书写或者确定功能的装置；

收视空间构造单元140，接收节目标签数据库110调出的节目标签数据源和节目播放收视数据库130调出的播放收视数据源构造基于节目标签兴趣度的收视空间，其中，其中，节目标签兴趣度是用户对节目标签的偏好程度，将用户对包含节目标签的每一个节目的收视时长与总播出时长的比值乘以收视天数与时间区域天数的比值，并将上述结果求和；

广播电视用户划分单元150，将节目标签兴趣度空间中广播电视用户按照对不同标签的兴趣度进行分群，得到各节目标签的广播电视社区。

节目单制定单元160，根据分群后的广播电视用户对节目标签的偏好，将包含符合收视偏好的节目标签的节目排列组合形成电子节目单，例如，用户对节目标签【宫廷】的节目标签兴趣度值最大，则说明用户的收视偏好是包含节目标签【宫廷】的电视节目，经上述节目组合排列形成节目单；

节目单发送单元170，将符合各个广播电视社区节目标签偏好的节目单通过短信、微信、APP、或邮件发送给广播电视用户，或者通过机顶盒发送到用户的数字电视。

图4是本发明节目单制定方法的流程图，如图4所示，所述节目单制定方法包括以下几个步骤：

首先，在步骤S400中，通过节目标签采集单元采集节目名称及其节目标签，并对其按照节目名称进行汇总和存储，即，将同一节目名称中从不同数据库或者网站采集得到的相同标签只保留一个，组成节目标签互不相同的该节目名称的标签集，具体地，利用正则表示法从广播电视公司已有的节目数据库或者利用网站API接口从网站上或者利用网络爬虫从视频网站上采集节目名称及其采集节目标签，或者上述三种方式任意组合采集节目标签。

然后，在步骤S410中，通过输入单元输入确定用户偏好所需的至少一个节目名称、空间区域、时间区域并生成上述空间区域和时间区域内所述节目标签的节目标签数据源和播放收视数据源的调用指令。

生成上述调用指令以后，在步骤S420中，根据输入单元的调用指令分别从节目标签数据库和节目播放收视数据库导出符合调用指令的节目标签数据源和播放收视数据源，并导入到收视空间构造单元，例如，输入单元输入的节目名为p₁…p_m，则节目标签数据库导出的节目标签数据源Tag为，

B＝[b₁...b_j]

其中，Tag表示节目标签集合,m表示节目的个数，p₁…p_m为节目的名称，表示第1至m个节目,[tag_m,1,…tag_m,k]表示节目P_m的1至k个节目标签，k表示节目标签的个数，当节目标签不足k个时，为0；为节目标签集合Tag中所有非零和非重叠节目标签的集合，j表示节目P₁至P_m的节目标签的非零和非重叠个数，0<j≤mk。

节目播放收视数据库导出的播放收视数据源R为，

其中，R表示收视时长集合，n表示用户数目，U_n表示第n个用户的用户名，S_n表示用户U_n的收视矩阵，tv_n,m表示用户U_n收看的节目P_m的收视时长，T_n,m表示用户U_n收看的节目P_m的播出时长，0<tv_n,m≤T_n,m，矩阵中包含用户没有收看的节目，没收看节目的所有数据为0。

导入原始数据源以后，在步骤S430中，利用上述数据源构造基于节目标签兴趣度的收视空间，具体地将在图5的详细描述中进行说明。

得到基于节目标签兴趣度的收视空间后，在步骤S440中，对上述收视空间内的用户按照对不同节目标签的兴趣度进行分群，形成各节目标签的广播电视社区，其具体过程将在图6-9的详细描述中进行说明。

形成各节目标签的广播电视社区以后，在步骤S450中，制定符合各广播电视社区的节目标签兴趣度的节目单。

然后在步骤S460中，将上述节目单发送给各社区的用户。

图5是本发明基于节目标签兴趣度收视空间构造方法的流程图，如图5所示，所述基于节目标签兴趣度收视空间的构造方法包括：

首先，在步骤S500中，将节目标签数据源和播放收视数据源按照节目名称进行汇总得到节目标签收视数据源，以节目标签数据源Tag和播放收视数据源R为例说明上述过程，将节目标签数据源Tag和播放收视数据源R按照节目名称进行汇总得到节目标签收视数据源RTag，

其中，S_n'表示用户U_n的节目标签收视矩阵。

得到节目标签收视数据源以后，在步骤S510中，根据节目标签收视数据源RTag中各用户对各节目的收视时长和节目的总播放时长，得到各用户对各个节目的节目比重，组成节目比重矩阵UPW，以单个用户的单个节目比重UPW_i,e为例说明节目比重的计算方法，

其中，UPW_i,e为节目比重矩阵UPW的元素，表用户U_i收看的节目P_e的节目比重，P_e∈Tag，tv_i,e表示用户U_i收看的节目P_e的收视时长，T_i,e表示用户U_i收看的节目P_e的总播出时长。

同时，在步骤S520中，根据上述数据源内各用户在规定时间内对节目的收视次数得到各节目的收视频次因子，组成收视频次因子矩阵freq，以单个用户的单个收视频次因子freq_i,e为例说明收视频次因子的计算方法

其中：Freq_i,e为收视频次因子矩阵的元素，表示用户U_i对节目P_e的收视频次因子，d_i,e代表用户U_i对节目P_e收视的天数，D代表输入单元输入的时间区域的天数；

然后，在步骤S530中，根据节目比重矩阵和收视频次因子矩阵构造节目收视比重矩阵，

FUPW_i,e＝UPW_i,e×Freq_i,e

其中：FUPW_i,e为节目收视比重矩阵的元素，表示用户U_i对节目P_e的的节目收视比重。

得到节目收视比重矩阵以后，在步骤S540中，将节目收视比重矩阵中相同节目标签的不同节目的节目收视比重相加得到节目标签兴趣度矩阵，即构成了基于节目标签兴趣度的收视空间，

其中，UTI为基于节目标签兴趣度的收视空间，UTI_i,d代表用户U_i对电视节目标签b_d的兴趣度，b_d∈B。

基于节目标签的收视空间通过节目标签将不同节目进行了合并，有效地压缩了大量的节目，降低了下述聚类维度，减少了计算损耗。

图6是本发明基于节目标签兴趣度收视空间内广播电视用户分群方法的流程图，如图6所示，所述分群方法包括：

首先，在步骤S600中，对节目标签兴趣度空间内的广播电视用户，利用层次聚类方法确定分群个数，具体过程将在图7和8的描述中详细说明；得到分群个数以后，在步骤S610中，对节目标签兴趣度空间内的广播电视用户利用k-means方法进行分群，得到与上述分群个数一致的广播电视社区，具体过程将在图9的描述中详细说明。

图7是本发明利用层次聚类确定广播电视用户分群个数的方法的流程图；图8是本发明层次聚类树状图的示意图；结合图7和8说明对广播电视用户按照节目标签兴趣度进行分群的方法：首先，在步骤S700中，将每一个用户的所有节目的标签兴趣度作为一个人群，计算每两个人群之间的距离，如下式：

Q_i＝[UTI_i,1 … UTI_i,j]

Q_f＝[UTI_f,1 … UTI_f,j]

其中，Q_i和Q_f表示两个人群，dist_i,f表示人群Q_i与人群Q_f的距离。

得到每两个人群之间的距离以后，在步骤S710中，合并距离最近的两个人群得到新人群；

然后，在步骤S720中，判断人群个数是否为1；

若人群个数不为1，在步骤S730中，将新人群中不同用户相同标签的标签兴趣度求平均，按照上式计算每两个人群之间的距离，然后返回步骤S910，直至人群个数为1；

若是为1，在步骤S740中，根据聚合历史，得到层次聚类树状图，根据其截断层确定广播电视用户分群个数，如图8所示的层次聚类树状图，其截断层有6个，则分群个数为6，图8中的纵坐标为聚类高度，所述聚类高度是与聚类中距离计算方式相关的准则值，聚类高度值越大说明对应聚类中两类数据差异越大。

图9是本发明利用K-means方法对广播电视用户按照节目标签兴趣度对广播电视用户分群的方法的流程图，如图9所示，首先，在步骤S900中，将节目标签兴趣度矩阵UTI中的每一行元素看成一个用户分群数据点，随机选取与分群个数一致的用户分群数据点作为初始簇的中心，例如一个初始簇的中心c_r＝[UTI_r,1 … UTI_r,j]。

然后，在步骤S910中，根据除了初始簇中心的其他用户分群数据点与该簇中心的距离，将其他用户分群数据点指向最相似的簇，即与簇中心距离最小的簇，形成新簇。以一个初始簇的中心c_r为例说明除了初始簇中心的其他用户分群数据点与该簇中心的距离的计算公式：

其中，dist_i,r表示用户U_i的分群数据点与初始簇中心c_r的距离。

将用户分群点指向最相似的簇合成新簇以后，在步骤S920中，将新簇中不同用户相同标签的标签兴趣度求均值,得到新簇的中心。

然后，在步骤S930中，判断新簇的中心是否等于初始簇的中心。

若是等于，则广播电视用户分群完成；

若是不等于，在步骤S940中，将该新簇的中心作为初始簇的中心，返回步骤S910，直至新簇的中心不再发生变化，即，广播电视用户分群完成。

本发明利用节目标签兴趣度确定用户的收视偏好来对广播电视用户进行分群，融合了用户对节目的收视时长、收视频次的比重与节目标签的对节目内容上的重整，更贴近节目内容，包含具有节目标签的所有节目，不会出现诸如收视率、收视时长或者收视次数对节目单方面侧重的问题，所以能够准确的确定用户的收视偏好，从而对广播电视用户进行准确划分，制定出与用户收视偏好符合度高的节目单。

上述描述中，只描述了符合节目标签兴趣度的节目单制定系统及方法，同样本发明所述节目单制定系统及方法也可以制定符合节目标签组合的兴趣度的节目单，例如，按照上述方法构造基于【军旅】和【农村】两个节目标签组合的节目标签兴趣度收视空间，并根据上述收视空间内对上述节目标签组合的兴趣度进行分群，得到上述节目标签组合的广播电视社区，制定包含上述节目标签组合的节目的节目单，发送给该节目标签组合的广播电视社区的用户。

综上所述，参照附图以示例的方式描述了根据本发明提出的节目单制定系统及方法。但是，本领域技术人员应当理解，对于上述本发明所提出的系统及方法，还可以在不脱离本发明内容的基础上做出各种改进。因此，本发明的保护范围应当由所附的权利要求书的内容确定。

Claims

1.一种节目单制定系统，包括：

节目标签采集单元，用于从存储节目信息的数据库或者网站上采集节目名称及其节目标签，其中，节目标签是对电视节目内容的多角度概括；

节目标签数据库，接收节目标签采集单元采集的节目标签并按照节目名称对其进行汇总存储为节目标签数据集合，即节目标签数据源，并接收下述输入单元的调用指令导出调用指令中的节目标签数据源；

节目播放收视数据库，将各节目的播放信息和通过用户机顶盒的收视信号采集的用户对各节目的收看信息存储为播放收视数据集合，即播放收视数据源，并接收下述输入单元的调用指令导出调用指令中的播放收视数据源；

输入单元，用于输入确定广播电视用户收视偏好所需的至少一个节目名称、空间区域、时间区域并生成所述节目名称的节目标签数据源和上述空间区域和时间区域内所述节目名称的播放收视数据源的调用指令；

收视空间构造单元，接收节目标签数据库调出的节目标签数据源和节目播放收视数据库调出的播放收视数据源构造基于节目标签兴趣度的收视空间，其中，节目标签兴趣度是用户对节目标签的偏好程度，将用户对包含节目标签的每一个节目的收视时长与总播出时长的比值乘以收视天数与时间区域天数的比值，并将上述结果求和，包括：将节目标签数据源和播放收视数据源按照节目名称进行汇总得到节目标签收视数据源；根据上述数据源内各用户对节目的收视时长和节目的总播出时长得到各用户对各节目的节目比重，组成节目比重矩阵，

其中，UPW_i,e为节目比重矩阵的元素，表示用户U_i收看的节目P_e的节目比重，tv_i,e表示用户U_i收看的节目P_e的收视时长，T_i,e表示用户U_i收看的节目P_e的总播出时长；同时，根据上述数据源内各用户在规定时间内对节目的收视次数得到各节目的收视频次因子，组成收视频次因子矩阵，

其中：Freq_i,e为收视频次因子矩阵的元素，表示用户U_i对节目P_e的收视频次因子，d_i,e代表用户U_i对节目P_e收视的天数，D代表输入单元输入的时间区域的天数；根据节目比重矩阵和收视频次因子矩阵构造节目收视比重矩阵，

FUPW_i,e＝UPW_i,e×Freq_i,e

其中：FUPW_i,e为节目收视比重矩阵的元素，表示用户U_i对节目P_e的节目收视比重；将节目收视比重矩阵中相同节目标签的不同节目的节目收视比重相加得到节目标签兴趣度矩阵，即构成了基于节目标签兴趣度的收视空间，

<mrow> <msub> <mi>UTI</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>d</mi> </mrow> </msub> <mo>=</mo> <msub> <munderover> <mo>&Sigma;</mo> <mrow> <mi>e</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <mrow> <msub> <mi>b</mi> <mi>d</mi> </msub> <mo>&Element;</mo> <mo>&ForAll;</mo> <mo>&lsqb;</mo> <msub> <mi>p</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>e</mi> </mrow> </msub> <mo>&lsqb;</mo> <msub> <mi>tag</mi> <mrow> <mi>e</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <mo>...</mo> <msub> <mi>tag</mi> <mrow> <mi>e</mi> <mo>,</mo> <mi>m</mi> </mrow> </msub> <mo>&rsqb;</mo> <mo>&rsqb;</mo> </mrow> </msub> <msub> <mi>FUPW</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>e</mi> </mrow> </msub> </mrow>

其中，UTI为基于节目标签兴趣度的收视空间，UTI_i,d代表用户U_i对电视节目标签b_d的兴趣度；

广播电视用户划分单元，将上述收视空间中广播电视用户按照对不同标签的兴趣度进行分群，得到各节目标签的广播电视社区；

节目单制定单元，制定符合上述各广播电视社区对节目标签的偏好的电子节目单；

节目单发送单元，将符合各个广播电视社区节目标签偏好的节目单发送给用户。

2.根据权利要求1所述的系统，其中，所述节目单发送单元将电子节目单发送给用户的方式包括：通过短信、微信、APP、或邮件发送给广播电视用户，或者通过机顶盒发送到用户的数字电视。

3.一种节目单制定方法，包括：

通过节目标签采集单元采集节目名称及其节目标签，并按照节目名称对其进行汇总和存储；

通过输入单元输入确定用户偏好所需的至少一个节目名称、空间区域、时间区域并生成上述空间区域和时间区域内所述节目名称的节目标签数据源和播放收视数据源的调用指令；

根据输入单元的调用指令分别从节目标签数据库和节目播放收视数据库导出符合调用指令的节目标签数据源和播放收视数据源，并导入到收视空间构造单元；

利用上述数据源构造基于节目标签兴趣度的收视空间，包括：将节目标签数据源和播放收视数据源按照节目名称进行汇总得到节目标签收视数据源；根据上述数据源内各用户对节目的收视时长和节目的总播出时长得到各用户对各节目的节目比重，组成节目比重矩阵，

FUPW_i,e＝UPW_i,e×Freq_i,e

对上述收视空间内用户对各节目的节目标签的节目标签兴趣度进行分群形成各节目标签的广播电视社区；

制定符合各广播电视社区的节目标签兴趣度的节目单；

将上述节目单发送给各社区的用户。

4.根据权利要求3所述的节目单制定方法，其中，对上述收视空间内用户对各节目的节目标签的节目标签兴趣度进行分群形成各节目标签的广播电视社区的方法包括：

根据基于节目标签兴趣度的收视空间中用户对节目标签的兴趣度，利用层次聚类确定广播电视用户的分群个数，即广播电视社区的个数；

利用K-means方法对广播电视用户按照节目标签兴趣度分成与上述分群个数一致的广播电视社区。

5.根据权利要求4所述的节目单制定方法，其中，所述根据基于节目标签兴趣度的收视空间中用户对节目标签的兴趣度，利用层次聚类确定广播电视用户的分群个数的方法包括：

将节目标签兴趣度空间中，每一个用户的所有节目的标签兴趣度作为一个人群，计算每两个人群之间的距离；

合并距离最近的两个人群得到新的人群；

判断人群个数是否为1；

若人群个数不为1，则计算合并后的新人群，每两个人群之间的距离，然后返回合并人群的步骤，直至人群个数为1；

若是人群个数不为1，则根据聚合历史，得到层次聚类树状图，根据其截断层确定广播电视用户分群个数。

6.根据权利要求4所述的节目单制定方法，其中，所述利用K-means方法对广播电视用户按照节目标签兴趣度分成与上述分群个数一致的广播电视社区的方法包括：

将节目标签兴趣度空间中的每一个用户的所有节目的标签兴趣度作为一个用户分群数据点，随机选取与分群个数一致的用户分群数据点作为初始簇的中心；

根据除了初始簇中心的其他用户的分群数据点与该簇中心的距离，将其他用户的分群数据点指向最相似的簇，即与簇中心距离最小的簇，形成新簇；

将新簇中不同用户相同标签的标签兴趣度求均值,得到新簇的中心；

判断新簇的中心是否等于初始簇的中心；

若是等于，则广播电视用户分群完成；

若是不等于，将该新簇的中心作为初始簇的中心，返回形成新簇的步骤，直至新簇的中心不再发生变化，即，广播电视用户分群完成。