CN110248246B

CN110248246B - 数据分析方法、装置、计算机设备及计算机可读存储介质

Info

Publication number: CN110248246B
Application number: CN201910396702.9A
Authority: CN
Inventors: 乐志能
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-05-14
Filing date: 2019-05-14
Publication date: 2022-12-30
Anticipated expiration: 2039-05-14
Also published as: CN110248246A

Abstract

本发明公开了数据分析方法、装置、计算机设备及计算机可读存储介质，方法包括：获取用户的第一行为数据集；将第一行为数据集转换为用于训练预测模型的第一特征集；根据第一特征集，对预设分类算法的函数进行训练建模以得到预测模型；若检测到用户正在收看一电视节目，获取用户的收视行为数据，将所获取的用户的收视行为数据作为第一收视行为数据；基于所述预测模型，根据第一预设规则以及第一收视行为数据生成第一互动活动；以及向用户推荐所生成的第一互动活动。本发明实施例通过对用户历史收视行为数据进行数据分析，构建用户兴趣画像，进而通过该用户兴趣画像以及收看的电视直播节目实时推荐一互动活动。

Description

数据分析方法、装置、计算机设备及计算机可读存储介质

技术领域

本发明涉及推荐技术领域，尤其涉及一种数据分析方法、装置、计算机设备及计算机可读存储介质。

背景技术

近年来，在互联网的推动之下，越来越多的用户选择通过交互式网络电视(Internet Protocol Television，IPTV)或数字视频广播(Digital Video Broadcasting，DVB)等智能网络电视来收看电视节目，其中，IPTV作为“三网融合”最典型的应用之一，为用户提供了个性化的交互式服务，比如电视直播、视频点播、时移回看以及播放视频文件等服务，因此，用户可以通过该服务收看各电视台正在直播的视频内容，比如连续剧、电影、综艺等直播节目内容。然而在用户通过电视机收看直播节目的过程中，由于用户只能被动收看电视直播节目，无法参与到直播节目当中，因此，如何提供一种能准确分析用户的收视行为数据的数据分析方法，是非常值得进一步研究和改进的。

发明内容

本发明实施例提供了一种数据分析方法、装置、计算机设备及计算机可读存储介质，可以精确分析得到用户的收视行为特征，并根据得到的用户的收视行为特征生成对应的电视节目的互动活动，且将生成的该互动活动推送给用户以使在用户收看直播节目的同时能通过该互动活动参与到该直播节目当中，提升用户的收看效果，进而可以有效提高用户通过电视机收看节目的积极性以及收看节目的趣味性。

第一方面，本发明实施例提供了一种数据分析方法，其包括：获取用户的第一行为数据集；其中，所述第一行为数据集为从预设数据库中获取的用户在预设时间范围内的所有收视行为数据的集合，所述收视行为数据包括用户的收看时长以及收看的电视节目的有关信息，所述电视节目的有关信息包括所述电视节目的人员信息以及属性信息，所述属性信息包括节目内容以及节目类型；将所述第一行为数据集转换为用于训练预测模型的第一特征集；根据所述第一特征集，对预设分类算法的函数进行训练建模以得到预测模型；若检测到用户正在收看一电视节目，获取用户的收视行为数据，其中，将所获取的用户的收视行为数据作为第一收视行为数据；将所述第一收视行为数据输入到所述预测模型中学习以得到用户正在收看的电视节目的用户喜好度，其中，将得到的用户正在收看的电视节目的用户喜好度作为第一用户喜好度；根据所述第一用户喜好度以及所述第一收视行为数据生成第一互动活动；以及向用户推荐所生成的第一互动活动。

第二方面，本发明实施例还提供了一种数据分析装置，其包括：第一获取单元，用于获取用户的第一行为数据集；其中，所述第一行为数据集为从预设数据库中获取的用户在预设时间范围内的所有收视行为数据的集合，所述收视行为数据包括用户的收看时长以及收看的电视节目的有关信息，所述电视节目的有关信息包括所述电视节目的人员信息以及属性信息，所述属性信息包括节目内容以及节目类型；第一特征转换单元，用于将所述第一行为数据集转换为用于训练预测模型的第一特征集；第一训练单元，用于根据所述第一特征集，对预设分类算法的函数进行训练建模以得到预测模型；第二获取单元，用于若检测到用户正在收看一电视节目，获取用户的收视行为数据，其中，将所获取的用户的收视行为数据作为第一收视行为数据；第一学习单元，用于将所述第一收视行为数据输入到所述预测模型中学习以得到用户正在收看的电视节目的用户喜好度，其中，将得到的用户正在收看的电视节目的用户喜好度作为第一用户喜好度；第一生成单元，用于根据所述第一用户喜好度以及所述第一收视行为数据生成第一互动活动；以及第一推荐单元，用于向用户推荐所生成的第一互动活动。

第三方面，本发明实施例还提供了一种计算机设备，所述计算机设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现上述第一方面的方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时可实现上述第一方面的方法。

本发明实施例提供了一种数据分析方法、装置、计算机设备及计算机可读存储存储介质。本发明实施例能够有效解决现有技术中用户通过电视机收看直播节目的过程中，由于用户只能被动收看电视直播节目，无法参与到直播节目当中的问题。通过实施本发明实施例可以精确分析得到用户的收视行为特征，并根据得到的用户的收视行为特征生成对应的电视节目的互动活动，且将生成的该互动活动推送给用户以实现机器智能推荐互动活动，本发明实施例通过对用户历史收视行为数据进行大数据分析，得到该用户收看的电视节目类型的用户喜好度以及人员兴趣度等收视行为特征，进而可以根据所得到的用户收看的电视节目类型的喜好度以及人员兴趣度等收视行为特征构建用户收视兴趣画像，再根据用户收视兴趣画像以及正在收看的电视直播节目生成一互动活动，可以让用户收看直播节目的同时通过该生成的互动活动参与到该直播节目当中，提升用户的收看效果，进而可以有效提高用户通过电视机收看节目的积极性以及收看节目的趣味性。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明第一实施例提供的一种数据分析方法的流程示意图；

图2为本发明第一实施例提供的一种数据分析方法的一流程示意图；

图3为本发明第二实施例提供的一种数据分析方法的流程示意图；

图4为本发明第二实施例提供的一种数据分析方法的一流程示意图；

图5为本发明第三实施例提供的一种数据分析方法的流程示意图；

图6为本发明第三实施例提供的一种数据分析方法的一流程示意图；

图7为本发明第一实施例提供的一种数据分析装置的示意性框图；

图8为本发明第一实施例提供的一种数据分析装置的第一生成单元的示意性框图；

图9为本发明第二实施例提供的一种数据分析装置的示意性框图；

图10为本发明第二实施例提供的一种数据分析装置的第二特征转换单元的示意性框图；

图11为本发明第三实施例提供的一种数据分析装置的示意性框图；

图12为本发明第三实施例提供的一种数据分析装置的第四生成单元的示意性框图；以及

图13为本发明实施例提供的一种计算机设备的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

请参阅图1，其为本发明第一实施例提供的一种数据分析方法的示意性流程图。具体地，该数据分析方法应用于一电视终端内，用于在用户收看电视直播节目的同时向用户推荐互动活动以使用户可以参与该电视直播节目。该方法可包括步骤S101至S107。

S101、获取用户的第一行为数据集；其中，所述第一行为数据集为从预设数据库中获取的用户在预设时间范围内的所有收视行为数据的集合，所述收视行为数据包括用户的收看时长以及收看的电视节目的有关信息，所述电视节目的有关信息包括所述电视节目的人员信息以及属性信息，所述属性信息包括节目内容以及节目类型。

具体地，所述第一行为数据集为从预设数据库中获取的用户在预设时间范围内的所有收视行为数据的集合，所述收视行为数据包括用户的收看时长以及收看的电视节目的有关信息，所述电视节目的有关信息包括所述电视节目的人员信息以及属性信息，所述人员信息包括出演人员信息以及制作人员信息，所述属性信息包括节目内容以及节目类型，还包括节目时长以及播放时间段，其中，所述节目类型包括军事类、新闻类、综艺类、影视类、音乐类、体育竞技类以及动漫类等类型。

其中，所述步骤S101具体为从预设数据库中获取预设时间范围内用户收看的所有电视节目的收看时长以及收看的所有电视节目的有关信息。其中，所述预设时间范围由用户根据实际应用场景的需求进行自定义设置。由于现有的IPTV和DVB等网络电视的机顶盒里的直播应用为一网页应用或者一安卓软件(andriod apk)应用，可以通过在网页上进行JS(Javascript)埋点或者通过在安卓软件内植入埋点用的java sdk(softwaredevelopment kit，软件开发工具包)实现用户收视行为数据的上报，在一实施例中，可以利用JS(Javascript)埋点将用户在预设时间范围内产生的所有收视行为数据实时上传到一预设的关系型数据库中，并保存在该关系型数据库中。例如，在预设时间范围内用户进入某个电视频道可例如为湖南卫视，则通过该电视频道ID以及当前时间获取用户收看的电视节目的有关信息，并统计用户的收看时长，当用户结束观看该电视节目时，将用户收看的电视节目的有关信息以及统计的该用户收看时长作为一条收视行为数据自动上传到一预设的关系型数据库中以进行保存，进而可以从一关系型数据库中获取用户的第一行为数据集，其中，所述第一行为数据集包括多条收视行为数据。

S102、将所述第一行为数据集转换为用于训练预测模型的第一特征集。

具体地，由步骤S101可知，所述第一行为数据集为在预设时间范围内用户收看的所有电视节目的收看时长以及所有电视节目的有关信息，其中，所述电视节目的有关信息包括节目的人员信息以及属性信息，所述人员信息包括出演人员信息以及制作人员信息，所述属性信息包括节目内容以及节目类型、节目时长以及播放时间段，在本步骤S102中，所述第一特征集为用户的收视行为特征集，具体地该收视行为特征集为用户的收视兴趣特征集，其中，所述收视兴趣特征集包括用户收看的每个节目类型的用户喜好度以及用户收看的人员兴趣度，所述人员包括出演人员以及制作人员。在一实施例中，通过对所述第一行为数据集进行数据分析以获得用户收看的多个节目类型以及用户收看的多个节目类型的收看时长，具体地，根据所述第一行为数据集获取用户收看的多个节目类型并统计该多个节目类型对应的用户收看时长；进而通过该多个节目类型对应的用户收看时长与全部收看时长的比值可得到各个节目类型的用户喜好度；再判断所得到的各个节目类型的用户喜好度是否满足预设条件，其中，所述预设条件可为预设用户喜好度，所述判断所得到的各个节目类型的用户喜好度是否满足预设条件具体可为将所得到的各个节目类型的用户喜好度分别与预设用户喜好度进行一一比较，将各个节目类型的用户喜好度中大于等于预设用户喜好度的判定为满足预设条件；进而获取满足预设条件的多个节目类型的人员统计表，其中，所述人员统计表的内容包括人员的姓名以及出现次数；并对该人员统计表进行数据分析以得到用户收看的人员的出现次数，进而通过该多个人员对应的出现次数与所有人员的出现次数之和的比值可得到用户的人员兴趣度，进而将该用户喜好度以及人员兴趣度作为用户收视兴趣特征集，即作为训练预测模型的第一特征集。

S103、根据所述第一特征集，对预设分类算法的函数进行训练建模以得到预测模型。

具体地，在一实施例中，所述预设分类算法为逻辑回归算法(LogisticRegression，LR)，所述逻辑回归算法为一种分类学习方法，由于其存在易于实现、解释性好以及容易扩展等优势，被广泛应用于点击率预估(CTR)、计算广告(CA)以及推荐系统(RS)等任务中。在一实施例中，所述根据所述第一特征集，对预设分类算法的函数进行训练建模以得到预测模型的步骤具体包括：根据所述第一特征集，对逻辑回归算法的函数进行训练建模以得到预测模型。具体地，将所述第一特征集输入到所述逻辑回归算法的函数中进行训练学习，进而获得该函数的多个超参，将所获得的函数的多个超参对应代入该函数中以得到该逻辑回归算法新的函数，其中，该新的函数为所得到的预测模型，具体的通过第一特征集训练逻辑回归算法的函数请参照逻辑回归算法原理。在一实施例中，所述预设分析算法为推荐算法，可例如为协同过滤算法。

S104、若检测到用户正在收看一电视节目，获取用户的收视行为数据，其中，将所获取的用户的收视行为数据作为第一收视行为数据。

具体地，在一实施例中，所述第一收视行为数据包括用户正在收看的电视节目的有关信息以及用户在该电视节目中的收看时长。其中，由于现有的IPTV和DVB等网络电视的机顶盒里的直播应用为一网页应用或者一安卓软件应用，可以通过在网页上进行JS埋点或者通过在安卓软件内植入埋点用的java sdk实现用户收视行为数据的上报，具体可例如，当检测到电视机正在播放某一电视节目且该电视机前检测到存在至少一位用户，则可确定检测到用户正在收看一电视节目，进而可以利用JS埋点将用户当前所收看的电视节目的有关信息以及用户在该电视节目中的收看时长实时上传到一预设的关系型数据库中以获取用户的收视行为数据，其中，将所获取的用户的收视行为数据作为第一收视行为数据。在一实施例中，若检测到电视机正在播放某一电视节目，可以通过电视机配置的图像传感器或者红外线传感器以检测该电视机前是否存在至少一位用户；在另一实施例中，也可以通过检测到当前时间内该电视机中存在一用户的登陆信息，进而判定为该电视机前检测到至少一位用户。

S105、将所述第一收视行为数据输入到所述预测模型中学习以得到用户正在收看的电视节目的用户喜好度，其中，将得到的用户正在收看的电视节目的用户喜好度作为第一用户喜好度。

具体地，假设Tree1为通过逻辑回归算法训练出来的回归树，即Tree1为训练得到的预测模型，输入样本x为用户的收视行为数据，遍历该Tree1回归树后，可以输出y值，其中，该y值为用户收看的电视节目类型所对应的用户喜好度，在一实施例中，用户对任一电视节目的节目类型的用户喜好度为其收看该节目类型的概率，该概率的取值范围为0-100％。

S106、根据所述第一用户喜好度以及所述第一收视行为数据生成第一互动活动。

具体地，在本步骤S106中，所述第一互动活动为可供于用户点击参与的互动活动，且该生成的第一互动活动的活动类型由用户当前时间收看的电视节目的节目类型所决定，该生成的第一互动活动的活动内容由用户当前时间收看的电视节目的内容所决定，由步骤S105可知，假设Tree1为通过逻辑回归算法学出来的回归树，当检测到用户正在收看一电视节目，获取用户的收视行为数据，其中，将所获取的用户的收视行为数据作为第一收视行为数据；进而该Tree1回归树的输入样本x1为所述第一收视行为数据，遍历该回归树Tree1后，可以输出y1值为用户正在收看的电视节目的节目类型所对应的用户喜好度，其中，将用户正在收看的电视节目的用户喜好度作为第一用户喜好度。进而根据所述第一用户喜好度以及所述第一收视行为数据生成第一互动活动，生成的该第一互动活动的活动类型与用户正在收看的电视节目的节目类型对应。

具体地，在一实施例中，所述根据所述第一用户喜好度以及所述第一收视行为数据生成第一互动活动包括第一互动活动生成方法。该第一互动活动生成方法，如图2所示，即步骤S106包括子步骤S106a至S106d。其中，S106a、判断所述第一用户喜好度是否满足预设条件；S106b、若所述第一用户喜好度满足预设条件，确定用户正在收看的电视节目的节目类型所对应的互动活动类型；S106c、获取所确定的互动活动类型所对应的互动活动模板；以及S106d、在所获取的互动活动模板的多个预设标签位置上对应填充所述第一收视行为数据以生成第一互动活动。

其中，在步骤S106a-b中，存在与用户收看的多个电视节目类型对应的互动活动类型，其中，所述节目类型包括体育竞技类节目、军事类节目、新闻类节目、影视类节目，综艺类节目，音乐类节目以及动漫类节目，与所述多个节目类型对应的多个互动活动类型包括体育竞猜类活动、知识问答类活动、剧情猜测类活动、投票类活动以及人物问答类活动，具体地，与该体育竞技类节目对应的互动活动类型为竞猜类活动，通过该竞猜类活动用户可以对该体育竞技比赛的比分以及胜负结果进行竞猜；与该军事类节目以及新闻类节目对应的互动活动类型为知识问答类活动，通过该知识问答类活动用户可以测试其对该军事类节目以及新闻类节目的了解程度；与影视类节目以及动漫类节目对应的互动活动类型为剧情猜测类活动以及人物问答类活动，通过该剧情猜测类活动用户可以对该影视类节目以及动漫类节目的剧情走向进行猜测也可以对该节目内的CP进行猜测；与综艺类节目对应的互动活动类型为投票类活动以及人物问答类活动，通过该投票类活动用户可以对该综艺类节目的相关内容进行投票，其中，若用户收看的电视节目中的某一人员的兴趣度较高，可以针对该人员进行人物问答类活动。因此，将在步骤S105中得到的用户正在收看的电视直播节目的节目类型的用户喜好度与预设用户喜好度进行比较，其中，将用户正在收看的电视直播节目的节目类型的用户喜好度作为第一用户喜好度，若该第一用户喜好度大于或等于该预设用户喜好度，则判定所述第一用户喜好度满足预设条件，进而可以确定用户正在收看的电视直播节目的节目类型为用户感兴趣的节目类型，进而可以生成可供用户参与到该电视直播节目的互动活动，并将该互动活动推送给用户。

其中，在步骤S106c-d中，存在与所述多个互动活动类型对应的互动活动模板，即体育竞猜类活动、知识问答类活动、剧情猜测类活动、投票类活动以及人物问答类活动等互动活动类型均存在与其一一对应的互动活动模板，且该互动活动模板中设有多个可供填充的预设标签的位置，通过该多个预设标签在所述收视行为数据中查找与其一一对应的数据，并将所查找的数据分别对应填入所述多个预设标签的位置上，进而生成第一互动活动。具体可例如为若用户正在收看一体育比赛节目，获取用户的收视行为数据，确定该体育比赛节目对应的节目类型为体育竞猜类节目，且将所获取的收视行为数据输入到所述预测模型中训练得到用户对该体育比赛节目的用户喜好度，当将该用户喜好度与预设用户喜好度进行比较确定其满足预设条件后，可以确定用户对该体育比赛节目是感兴趣的，进而确定该体育竞猜类节目对应的互动活动类型为竞猜类活动，获取该竞猜类活动模板，进而在所获取的互动活动模板的多个预设标签位置上对应填充所获取的用户的收视行为数据以生成互动活动，可例如为：若该体育比赛节目为世界杯足球比赛小组赛巴西对战英国，根据该竞猜类活动模板以及该体育比赛节目的有关信息可生成如下互动活动：1、巴西(第一预设标签)VS英国(第二预设标签)，A、巴西胜，B、英国胜，C平。2、巴西(第一预设标签)VS英国(第二预设标签)，几比几。其中，该填充在第一预设标签和第二预设标签的位置上预设标签由所获取的用户收视行为数据所决定，即由用户正在收看的电视节目的有关信息所决定，该几比几可以由用户输入。通过该互动活动，用户可以在收看该体育比赛节目的同时猜测该体育比赛节目的比赛结果，进而可以提升用户的收看效果，进而可以有效提高用户通过电视机收看节目的积极性以及收看节目的趣味性。

S107、向用户推荐所生成的第一互动活动。

具体地，在一实施例中，所生成的第一互动活动将被推荐到用户正在观看的电视终端的屏幕上，用户可以利用遥控器作为输入设备，也可以利用与所述电视终端连接的智能移动终端作为输入设备，可以利用所述遥控器或者所述智能移动终端点击打开所述第一互动活动，以选择参与所述第一互动活动；或者用户也可以选择忽视该第一互动活动，等待预设关闭时间，系统将会自动关闭该第一互动活动；又或者可以直接点击关闭该第一互动活动；在另一实施例中，所生成的第一互动活动将被推荐到与用户正在观看的电视终端连接的智能移动终端上，具体地，用户的智能移动终端还可以通过WIFI、蓝牙等无线连接方式或者有线连接方式与所述电视终端连接，并将该第一互动活动推荐到该智能移动终端上，利用该智能移动终端点击打开所述第一互动活动，进而选择参与所述第一互动活动或者选择关闭该第一互动活动。其中，所述智能移动终端包括智能手机、平板电脑、笔记本电脑以及可穿戴智能设备。

在上述实施例中，本发明实施例通过对用户历史收视行为数据进行数据分析，得到该用户收看的电视节目类型的用户喜好度以及人员兴趣度等收视行为特征，进而可以根据所得到的用户收看的电视节目类型的喜好度以及人员兴趣度等收视行为特征构建用户收视兴趣画像，即利用获得的用户喜好度以及人员兴趣度作为第一特征集，以及根据第一特征集，对预设分类算法的函数进行训练建模以得到所述预测模型，通过该预测模型可以输出用户对当前正在收看的电视直播节目所对应的节目类型的用户喜好度，进而判断该用户喜好度是否满足预设条件，若满足，则可以根据用户收视兴趣画像以及用户收看的电视直播节目生成一互动活动，并将该互动活动推荐给用户，以使用户收看电视直播节目的同时可以参与到该电视直播节目当中。本发明实施例能够有效解决现有技术中用户通过电视机收看直播节目的过程中，由于用户只能被动收看电视直播节目，无法参与到直播节目当中的问题。通过实施本发明实施例可以精确分析得到用户的收视行为特征，并根据得到的用户的收视行为特征生成对应的电视节目的互动活动，且将生成的该互动活动推送给用户以实现机器智能推荐互动活动，提升用户的收看效果，进而可以有效提高用户通过电视机收看节目的积极性以及收看节目的趣味性。

请参阅图3，其为本发明第二实施例提供的一种数据分析方法的流程示意图。具体地，如图3所示，该方法可包括步骤S201-S211。其中步骤S201-S207与上述实施例中的步骤S101-S107类似，在此不再赘述。下面详细说明本实施例中所增加的步骤S208-S211。

S208、若检测到用户收看一电视频道，获取所述电视频道ID以及当前时间。

其中，在一实施例中，在所述步骤S208中，所述电视频道为物理或虚拟通道在其中一个电视台或网络电视的分支，其中，所述网络电视又称IPTV，它基于宽带高速IP网，以网络视频资源为主体，将电视机、个人电脑及手持设备作为显示终端，通过机顶盒或计算机接入宽带网络，实现数字电视、时移电视、互动电视等服务。另外，由于现有的IPTV和DVB等网络电视的机顶盒里的直播应用为一网页应用或者一安卓软件(andriod apk)应用，可以通过在网页上进行JS(Javascript)埋点或者通过在安卓软件内植入埋点用的java sdk(software development kit，软件开发工具包)实现用户收视行为数据的上报。因此，当用户进入某个电视频道可例如为湖南卫视，通过在网页上进行JS(Javascript)埋点或者通过在安卓软件内植入埋点可实现自动上报该电视频道ID以及当前时间，进而可以获取该电视频道ID以及当前时间。

S209、根据所述电视频道ID以及当前时间确定所述用户收看的电视节目。

具体地，由上述步骤S208可知，所述电视节目为在所述电视频道上通过载有声音、图像的信号传播的作品。例如，湖南卫视每周六晚上10点播放的电视节目《快乐大本营》。若检测到用户收看一电视频道，自动获取所述电视频道ID以及当前时间；进而根据所获取的电视频道ID和当前时间查找确定用户当前所进入的电视频道的当前时间段的节目单；即可以根据该电视频道ID以及当前时间确定该用户当前正在收看的电视节目。

S210、获取所确定的电视节目的有关信息以及用户收看时长。

具体地，由上述步骤S209可知用户当前收看的电视节目，进而可以获取所确定的电视节目的有关信息以及用户收看时长，其中，所述有关信息包括节目的人员信息以及属性信息，所述人员信息包括出演人员信息以及制作人员信息，所述属性信息包括节目内容以及节目类型、节目时长以及播放时间段，其中，所述节目类型包括军事类、新闻类、综艺类、影视类、音乐类、体育竞技类以及动漫类等类型。

S211、将所获取的电视节目的有关信息以及用户收看时长作为一条收视行为数据保存到一预设数据库中。

具体地，在一实施例中，所述预设数据库可例如为预设的关系型数据库。所述关系型数据库用于存储用户所有历史收视行为数据，即用户在以往任何时间的收视行为数据，即用于存储用户在以往任何时间内收看的所有电视节目的收看时长以及所有电视节目的有关信息。

其中，在步骤S201中，所述步骤S201获取用户的第一行为数据集具体为从预设数据库中获取用户的第一行为数据集；其中，所述第一行为数据集为从预设数据库中获取的用户在预设时间范围内的所有收视行为数据的集合，即在用户以往任何时间内收看的所有收视行为数据中获取预设时间范围内的收视行为数据，所述收视行为数据包括用户的收看时长以及收看的电视节目的有关信息。

其中，在步骤S202中，所述步骤S202将所述第一行为数据集转换为用于训练预测模型的第一特征集具体包括特征转换方法。该特征转换方法，如图4所示，即步骤S202包括子步骤S202a至S202d。其中，S202a、对所述第一行为数据集进行数据分析以获得多个节目类型的用户收看时长；S202b、根据所获得的多个节目类型的用户收看时长确定多个节目类型的用户喜好度，其中，各个所述节目类型的用户喜好度为各个节目类型的用户收看时长分别与所有节目类型的收看总时长的比值；S202c、根据所确定的多个节目类型的用户喜好度以及第一行为数据集获取满足预设条件的节目类型的人员统计表，其中，所述人员统计表的内容包括人员的姓名以及出现次数；以及S202d、根据所获取的人员统计表确定用户收看的人员兴趣度，其中，所述人员兴趣度为所获取的人员统计表中每个人员的出现次数分别与所有人员的出现次数之和的比值；以及将所确定的用户喜好度以及人员兴趣度作为用于训练预测模型的第一特征集。

其中，在步骤S202a以及步骤S202b中，由于获取的第一行为数据集包括用户在预设时间范围内所有电视节目的收看时长以及所有电视节目的有关信息，即从所获取的第一行为数据集中可知用户收看的所有的节目类型以及在收看的所有节目类型中的任一节目类型的收看时长，因此，对所述第一行为数据集进行数据分析可以获得用户在各个节目类型中的收看时长，例如，在预设时间范围内，用户多次收看了综艺类节目以及新闻类节目，则需要对用户每次收看综艺类的时长进行求和以获得在该预设时间范围内用户在综艺类这一节目类型中的收看时长，以此类推，可获得在该预设时间范围内用户在新闻类这一节目类型中的收看时长，进而将用户在综艺类这一节目类型中的收看时长以及新闻类这一节目类型中的收看时长累加起来则为用户收看的所有节目类型的收看总时长。因此，将用户在综艺类这一节目类型中的收看时长以及在新闻类这一节目类型中的收看时长分别与所有节目类型的收看总时长进行相比即可得出用户对该综艺类节目以及新闻类节目的用户喜好度，其中，所述用户喜好度为用户对其收看的各个节目类型的喜欢程度。其中，该用户喜好度为用户收看该节目类型的概率，其中，在一实施例中，该概率的取值范围为0-100％。

其中，在步骤S202c以及步骤S202d中，由上述步骤S202b中可知用户收看的所有节目类型的用户喜好度，进而判断所确定的多个节目类型的用户喜好度是否满足预设条件，具体地，将用户收看的所有节目类型的用户喜好度分别与预设喜好度进行比对即可确定满足预设喜好度的多个节目类型，其中，所述预设喜好度为用户根据实际应用场景需求事先进行自定义设置的，在一实施例中，可以将用户收看的所有电视节目的类型中排名第二的用户喜好度作为所述预设喜好度，例如，用户收看的所有电视节目的节目类型包括综艺类、影视类、音乐类、动漫类，其中，综艺类的用户喜好度最高，影视类的用户喜好度次之，音乐类的用户喜好度较低，而动漫类的用户喜好度最低，则可以将影视类对应的用户喜好度作为该预设喜好度，则在步骤S202c中的满足预设喜好度的多个节目类型为综艺类以及影视类。进而根据所述第一行为数据集获取满足预设喜好度的节目类型的人员信息，即可以在所述第一行为数据集的人员信息中获取满足预设喜好度的节目类型的人员统计表，其中，所述人员统计表的内容包括人员的姓名以及出现次数；进而在步骤S202d中可以根据所获取的人员统计表确定用户收看的人员兴趣度，其中，所述人员兴趣度为所获取的人员统计表中的各个人员的出现次数分别与所有人员的出现次数之和的比值，例如，若所述用户喜好度满足预设喜好度的节目类型为综艺类以及影视类，则从所获取的第一行为数据集中获取用户收看的综艺类节目和影视类的所有人员信息，进而可以获取综艺类节目和影视类的人员统计表，其中，所述人员统计表的内容包括人员的姓名以及出现次数；若在该人员统计表中某主持人的出现次数最高，则表明该用户以往经常收看该主持人主持的综艺节目，对该主持人的兴趣度最高，其中，将该主持人的出现次数与所有人员的出现次数之和进行相比即可得出用户对该主持人的兴趣度，其中，所述人员兴趣度为用户收看该人员所在的电视节目的概率，其中，在一实施例中，该概率的取值范围为0-100％。以及将所确定的用户喜好度以及人员兴趣度作为用于训练预测模型的第一特征集，其中，在一实施例中，可以将所确定的用户喜好度以及人员兴趣度进行加权求和以获得用于训练预测模型的收视兴趣特征集，所述收视兴趣特征集为训练预测模型的第一特征集。

在上述实施例中，本发明实施例通过在网页上进行JS(Javascript)埋点或者通过在安卓软件内植入埋点可实现自动上报该电视频道ID以及当前时间，以实时收集用户的收视行为数据到一预设数据库中并保存，进而可以从该预设数据库中获取预设时间范围内用户的收视行为数据的集合，进而可以对用户的收视行为数据进行数据分析，得到该用户的电视节目类型的用户喜好度以及人员兴趣度，并将该用户喜好度以及人员兴趣度作为用于训练预测模型的收视兴趣特征集，即利用收视兴趣特征集训练一预测模型，通过该预测模型可以输出用户对当前正在收看的电视直播节目所对应的节目类型的喜好度，进而判断该喜好度是否满足用户预设条件，若满足，则可以根据用户收看的电视直播节目生成一互动活动，并将该互动活动推荐给用户，以使用户收看电视直播节目的同时可以选择是否参与到该电视直播节目当中。

请参阅图5，其为本发明第三实施例提供的一种数据分析方法的流程示意图。具体地，所述方法应用于一电视终端，如图5所示，该方法可包括步骤S301-S314。其中步骤S301-S307与上述实施例中的步骤S101-S107类似，在此不再赘述。下面详细说明本实施例中所增加的步骤S308-步骤S314。

S308、获取用户的第二行为数据集；其中，所述第二行为数据集为用户在所述第一互动活动中的所有行为数据。

具体地，由步骤S307可知，用户通过遥控器或者智能移动终端可以打开或者关闭或者打开后参与该第一互动活动，可以获取用户在所述第一互动活动中的所有行为数据。

S309、将所述第二行为数据集转换为第二特征集。

具体地，所述第二特征集为用户的活动兴趣特征的集合，其中，所述活动兴趣特征为对用户在所述第一互动活动中的实际参与情况进行打分的分值特征，例如，若用户打开所述第一互动活动并参与该第一互动活动，完成该第一互动活动并提交了，则表明该用户对该第一互动活动高度感兴趣，对其打分的分值可以为90-100；若用户打开所述第一互动活动并参与该第一互动活动，然而参与了大一部分的第一互动活动但最后并没有提交，则表明该用户对该第一互动活动中高度感兴趣，对其打分的分值可以为80-90；若用户打开所述第一互动活动并参与该第一互动活动，然而参与了一小部分的第一互动活动但最后并没有提交，则表明该用户对该第一互动活动中度感兴趣，对其打分的分值可以为70-80；若用户只是打开所述第一互动活动随即关掉了所述第一互动活动，则表明该用户对该第一互动活动中低度感兴趣，对其打分的分值可以为55-70分；若用户直接关掉或者选择忽视所述第一互动活动，则表明该用户对该第一互动活动低度感兴趣，对其打分的分值可以为30-50分。其中，通过收集用户在所述第一互动活动中的所有行为数据，且将在所述第一互动活动中的所有行为数据作为用户的第二行为数据集，并将该第二行为数据集转换为第二特征集。

S310、根据所述第二特征集，对所述预测模型进行校验以获得优化后的预测模型。

具体地，在一实施例中，所述根据所述第二特征集，对所述预测模型进行校验以获得优化后的预测模型的步骤具体包括：根据所述第二特征集，对所述预测模型进行修正校验以获得优化后的预测模型。其中，所述所述预测模型是根据所述第一特征集，对所述逻辑回归算法的函数进行训练建模以得到的，具体地参照逻辑回归算法原理。

S311、若再次检测到用户收看一电视节目，获取用户的第二收视行为数据。

具体地，在一实施例中，所述第二收视行为数据包括用户当前收看的电视节目的有关信息以及用户在该电视节目中的收看时长。

S312、将所述第二收视行为数据输入优化后的预测模型中学习以得到用户收看的电视节目的用户喜好度，其中，将得到的用户正在收看的电视节目的用户喜好度作为第二用户喜好度。

S313、根据所述第二用户喜好度以及所述第二收视行为数据生成第二互动活动。

S314、向用户推荐所生成的第二互动活动。

具体地，在步骤S314中，所述第二互动活动为可供于用户点击参与的互动活动，且该向用户推荐的第二互动活动的活动类型由用户当前时间收看的电视节目的节目类型所决定，该向用户推荐的第二互动活动的活动内容由用户当前时间收看的电视节目的内容所决定，由步骤S310可知，假设Tree2为通过第二特征集以及所述预测模型校验得到的优化回归树，输入样本x2为所获取的用户的第二收视行为数据，遍历该优化回归树Tree2后，可以输出y2值为用户收看的电视节目类型所对应的用户喜好度。进而可以根据用户收看的电视节目类型所对应的用户喜好度以及所述第二收视行为数据生成第二互动活动，并向用户推荐该第二互动活动。另外，步骤S311-S312以及S314与上述实施例中的步骤S104-105以及S107类似，在此不再赘述。

具体地，在一实施例中，所述步骤S313根据所述第二用户喜好度以及所述第二收视行为数据生成第二互动活动具体包括第二互动活动生成方法。该第二互动活动生成方法，如图6所示，即步骤S313包括子步骤S313a至S313d。其中，S313a、判断所述第二用户喜好度是否满足预设条件；S313b、若所述第二用户喜好度满足预设条件，确定用户收看的电视节目的节目类型所对应的互动活动类型；S313c、获取所确定的互动活动类型所对应的互动活动模板；S313d、在所获取的互动活动模板的多个预设标签位置上对应填充所述第二收视行为数据以生成第二互动活动。其中步骤S313a-S313d与上述实施例中的步骤S106a-106d类似，在此不再赘述。

在上述实施例中，本发明实施例通过获取用户在第一互动活动中的行为数据，并将用户在第一互动活动中的行为数据作为活动兴趣特征，将其转换为第二特征集，并利用该第二特征集训练校验得到优化后的预测模型，进而有效提高该优化后的预测模型的准确性，确保该电视终端可以更加智能化向用户推荐互动活动，可以准确推荐用户高度感兴趣的互动活动以保证用户参与该互动活动的概率，同时避免推荐用户不感兴趣的互动活动以避免造成用户收看电视节目的干扰，可以有效保证用户通过电视机收看节目的积极性以及收看节目的趣味性。

请参阅图7，其为本发明第一实施例提供的一种数据分析装置100的示意性框图。如图7所示，该数据分析装置100对应于图1所示的数据分析方法。该数据分析装置100包括用于执行上述数据分析方法的单元，具体地，该数据分析装置100应用于一电视终端内，用于在用户收看电视节目的同时向用户推荐互动活动以使用户可以参与该电视节目。具体地，请参阅图7，该数据分析装置100包括第一获取单元101、第一特征转换单元102、第一训练单元103、第二获取单元104、第一生成单元106、第一学习单元105以及第一推荐单元107。

所述第一获取单元101用于获取用户的第一行为数据集；其中，所述第一行为数据集为从预设数据库中获取的用户在预设时间范围内的所有收视行为数据的集合，所述收视行为数据包括用户的收看时长以及收看的电视节目的有关信息，所述电视节目的有关信息包括所述电视节目的人员信息以及属性信息，所述属性信息包括节目内容以及节目类型。

所述第一特征转换单元102用于将所述第一行为数据集转换为用于训练预测模型的第一特征集。

所述第一训练单元103用于根据所述第一特征集，对预设分类算法的函数进行训练建模以得到预测模型。

具体地，在一实施例中，所述预设分类算法为逻辑回归算法(LogisticRegression，LR)。在另一实施例中，所述预设分析算法为推荐算法，可例如为协同过滤算法。

所述第二获取单元104用于若检测到用户正在收看一电视节目，获取用户的收视行为数据，其中，将所获取的用户的收视行为数据作为第一收视行为数据。

所述第一学习单元105用于将所述第一收视行为数据输入到所述预测模型中学习以得到用户正在收看的电视节目的用户喜好度，其中，将得到的用户正在收看的电视节目的用户喜好度作为第一用户喜好度。

所述第一生成单元106用于根据所述第一用户喜好度以及所述第一收视行为数据生成第一互动活动。

在一实施例中，如图8所示，第一生成单元106包括第一判断单元106a、第一类型确定单元106b、第一模板获取单元106c以及第一生成子单元106d。其中，所述第一判断单元106a，用于判断所述第一用户喜好度是否满足预设条件；所述第一类型确定单元106b，用于若所述第一用户喜好度满足预设条件，确定用户正在收看的电视节目的节目类型所对应的互动活动类型；第一模板获取单元106c，用于获取所确定的互动活动类型所对应的互动活动模板；第一生成子单元106d，用于在所获取的互动活动模板的多个预设标签位置上对应填充所述第一收视行为数据以生成第一互动活动。

所述第一推荐单元107用于向用户推荐所生成的第一互动活动。

需要说明的是，所属领域的技术人员可以清楚地了解到，上述数据分析装置100和各单元的具体实现过程以及效果，可以参考前述方法实施例中的相应描述，为了描述的方便和简洁，在此不再赘述。

请参阅图9，其为本发明第二实施例提供的一种数据分析装置200的示意性框图。如图9所示，本发明第二实施例提供的一种数据分析装置200是在上述实施例的基础上增加了频道获取单元208、节目确定单元209、信息获取单元210以及数据保存单元211，即所述装置200包括第三获取单元201、第二特征转换单元202、第二训练单元203、第四获取单元204、第二学习单元205、第二生成单元206、第二推荐单元207、频道获取单元208、节目确定单元209、信息获取单元210以及数据保存单元211。其中，该第三获取单元201、第二特征转换单元202、第二训练单元203、第四获取单元204、第二学习单元205、第二生成单元206以及第二推荐单元207与上述实施例中的第一获取单元101、第一特征转换单元102、第一训练单元103、第二获取单元104、第一学习单元105、第一生成单元106以及第一推荐单元107类似，由于其应用过程以及相应功能与上述实施例中所对应的单元类似，在此不再赘述。

所述频道获取单元208用于若检测到用户收看一电视频道，获取所述电视频道ID以及当前时间。

所述节目确定单元209用于根据所述电视频道ID以及当前时间确定所述用户收看的电视节目。

所述信息获取单元210用于获取所确定的电视节目的有关信息以及用户收看时长。

所述数据保存单元211用于将所获取的有关信息以及用户收看时长作为一条收视行为数据保存到一预设数据库中。

具体地，所述第二特征转换单元202用于将所述第一行为数据集转换为用于训练预测模型的第一特征集。具体地，在一实施例中，如图10所示，所述第二特征转换单元202包括数据分析单元202a、喜好度确定单元202b、统计表获取单元202c以及兴趣度确定单元202d。其中，所述数据分析单元202a，用于对所述第一行为数据集进行数据分析以获得多个节目类型的用户收看时长；所述喜好度确定单元202b，用于根据所获得的多个节目类型的用户收看时长确定多个节目类型的用户喜好度，其中，各个所述节目类型的用户喜好度为各个节目类型的用户收看时长分别与所有节目类型的收看总时长的比值；统计表获取单元202c，用于根据所确定的多个节目类型的用户喜好度以及第一行为数据集获取满足预设条件的节目类型的人员统计表，其中，所述人员统计表的内容包括人员的姓名以及出现次数；以及兴趣度确定单元202d，用于根据所获取的人员统计表确定用户收看的人员兴趣度，其中，所述人员兴趣度为所获取的人员统计表中每个人员的出现次数分别与所有人员的出现次数之和的比值；以及将所确定的用户喜好度以及人员兴趣度作为用于训练预测模型的第一特征集。

需要说明的是，所属领域的技术人员可以清楚地了解到，上述装置200和各单元的具体实现过程以及效果，可以参考前述方法实施例中的相应描述，为了描述的方便和简洁，在此不再赘述。

请参阅图11，其为本发明第三实施例提供的一种数据分析装置300的示意性框图。如图11所示，本发明第三实施例提供的一种数据分析装置300是在第一实施例的基础上增加了第七获取单元308、第四特征转换单元309、第四训练单元310、第八获取单元311、第四学习单元312、第四生成单元313以及第四推荐单元314，即所述装置300包括第五获取单元301、第三特征转换单元302、第三训练单元303、第六获取单元304、第三学习单元305、第三生成单元306、第三推荐单元307、第七获取单元308、第四特征转换单元309、第四训练单元310、第八获取单元311、第四学习单元312、第四生成单元313以及第四推荐单元314。其中，该第五获取单元301、第三特征转换单元302、第三训练单元303、第六获取单元304、第三学习单元305、第三生成单元306以及第三推荐单元307与第一实施例中的第一获取单元101、第一特征转换单元102、第一训练单元103、第二获取单元104、第一学习单元105、第一生成单元106以及第一推荐单元107类似，且该第三学习单元305、第三生成单元306以及第三推荐单元307与第四学习单元312、第四生成单元313以及第四推荐单元314类似，由于其应用过程以及相应功能与上述实施例中所对应的单元类似，在此不再赘述。

所述第七获取单元308用于获取用户的第二行为数据集；其中，所述第二行为数据集为用户在所述第一互动活动中的所有行为数据。

所述第四特征转换单元309用于将所述第二行为数据集转换为第二特征集。

所述第四训练单元310用于根据所述第二特征集，对所述预测模型进行校验以获得优化后的预测模型。

所述第八获取单元311用于若再次检测到用户收看一电视节目，获取用户的第二收视行为数据。

所述第四学习单元312用于将所述第二收视行为数据输入优化后的预测模型中学习以得到用户收看的电视节目的用户喜好度，其中，将得到的用户正在收看的电视节目的用户喜好度作为第二用户喜好度。

所述第四生成单元313用于根据所述第二用户喜好度以及所述第二收视行为数据生成第二互动活动。

所述第四推荐单元314用于向用户推荐所生成的第二互动活动。

具体地，在一实施例中，如图12所示，所述第四生成单元313包括第二判断单元313a、第二类型确定单元313b、第二模板获取单元313c以及第二生成子单元313d。其中，所述第二判断单元313a，用于判断所述第二用户喜好度是否满足预设条件；第二类型确定单元313b，用于若所述第二用户喜好度满足预设条件，确定用户收看的电视节目的节目类型所对应的互动活动类型；所述第二模板获取单元313c，用于获取所确定的互动活动类型所对应的互动活动模板；所述第二生成子单元313d，用于在所获取的互动活动模板的多个预设标签位置上对应填充所述第二收视行为数据以生成第二互动活动。

需要说明的是，所属领域的技术人员可以清楚地了解到，上述装置300和各单元的具体实现过程以及效果，可以参考前述方法实施例中的相应描述，为了描述的方便和简洁，在此不再赘述。

上述装置可以实现为一种计算机程序的形式，该计算机程序可以在如图13所示的计算机设备上运行。

请参阅图13，其为本发明实施例提供的一种计算机设备的示意性框图。该计算机设备600具体为智能电视终端。

参阅图13，该计算机设备600包括通过系统总线601连接的处理器602、存储器以及网络接口605，其中，存储器可以包括非易失性存储介质603和内存储器604。

该非易失性存储介质603可存储操作系统6031和计算机程序6032。该计算机程序6032包括程序指令，该程序指令被执行时，可使得处理器602执行一种数据分析方法。

该处理器602用于提供计算和控制能力，以支撑整个计算机设备600的运行。

该内存储器604为非易失性存储介质603中的计算机程序6032的运行提供环境，该计算机程序6032被处理器602执行时，可使得处理器602执行一种数据分析方法。

该网络接口605用于与其它设备进行网络通信。本领域技术人员可以理解，图13中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备600的限定，具体的计算机设备600可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器602用于运行存储在存储器中的计算机程序6032，该处理器602用于执行如上所述的数据分析方法。

应当理解，在本发明实施例中，处理器602可以是中央处理单元(CentralProcessing Unit，CPU)，该处理器602还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable GateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令，计算机程序可存储于一存储介质中，该存储介质为存储介质。该程序指令被该计算机系统中的至少一个处理器执行，以实现上述方法的实施例的流程步骤。

因此，本发明还提供一种计算机可读存储介质。该计算机可读存储介质存储有计算机程序，其中计算机程序包括程序指令。该程序指令被处理器执行时使处理器执行如上所述的数据分析方法。

所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的存储介质。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统和方法，可以通过其它的方式实现。例如，以上所描述的系统实施例仅仅是示意性的。例如，各个单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例系统中的单元可以根据实际需要进行合并、划分和删减。另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，终端，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种数据分析方法，应用于一电视终端，其特征在于，包括：

获取用户的第一行为数据集；其中，所述第一行为数据集为从预设数据库中获取的用户在预设时间范围内的所有收视行为数据的集合，所述收视行为数据包括用户的收看时长以及收看的电视节目的有关信息，所述电视节目的有关信息包括所述电视节目的人员信息以及属性信息，所述属性信息包括节目内容以及节目类型；

将所述第一行为数据集转换为用于训练预测模型的第一特征集；

根据所述第一特征集，对预设分类算法的函数进行训练建模以得到预测模型；

若检测到用户正在收看一电视节目，获取用户的收视行为数据，其中，将所获取的用户的收视行为数据作为第一收视行为数据；

将所述第一收视行为数据输入到所述预测模型中学习以得到用户正在收看的电视节目的用户喜好度，其中，将得到的用户正在收看的电视节目的用户喜好度作为第一用户喜好度；

判断所述第一用户喜好度是否满足预设条件；

若所述第一用户喜好度满足预设条件，确定用户正在收看的电视节目的节目类型对应的互动活动类型；

获取所确定的互动活动类型所对应的互动活动模板；

在所获取的互动活动模板的多个预设标签位置上对应填充所述第一收视行为数据以生成第一互动活动，其中，所述第一互动活动是指可供用户点击参与的互动活动；以及

向用户推荐所生成的第一互动活动。

2.根据权利要求1所述的数据分析方法，其特征在于，所述获取用户的第一行为数据集的步骤之前，还包括：

若检测到用户收看一电视频道，获取所述电视频道ID以及当前时间；

根据所述电视频道ID以及当前时间确定所述用户收看的电视节目；

获取所确定的电视节目的有关信息以及用户收看时长；以及

将所获取的电视节目的有关信息以及用户收看时长作为一条收视行为数据保存到一预设数据库中。

3.根据权利要求2所述的数据分析方法，其特征在于，所述将所述第一行为数据集转换为用于训练预测模型的第一特征集，包括：

对所述第一行为数据集进行数据分析以获得多个节目类型的用户收看时长；

根据所获得的多个节目类型的用户收看时长确定多个节目类型的用户喜好度，其中，各个所述节目类型的用户喜好度为各个节目类型的用户收看时长分别与所有节目类型的收看总时长的比值；

根据所确定的多个节目类型的用户喜好度以及第一行为数据集获取满足预设条件的节目类型的人员统计表，其中，所述人员统计表的内容包括人员的姓名以及出现次数；以及

根据所获取的人员统计表确定用户收看的人员兴趣度，其中，所述人员兴趣度为所获取的人员统计表中每个人员的出现次数分别与所有人员的出现次数之和的比值，以及将所确定的用户喜好度以及人员兴趣度作为用于训练预测模型的第一特征集。

4.根据权利要求1所述的数据分析方法，其特征在于，所述预设分类算法为逻辑回归算法，所述根据所述第一特征集，对预设分类算法的函数进行训练建模以得到预测模型，包括：

根据所述第一特征集，对逻辑回归算法的函数进行训练建模以得到所述预测模型。

5.根据权利要求1所述的数据分析方法，其特征在于，所述向用户推荐所生成的第一互动活动的步骤之后，还包括：

获取用户的第二行为数据集；其中，所述第二行为数据集为用户在所述第一互动活动中的所有行为数据；

将所述第二行为数据集转换为第二特征集；

根据所述第二特征集，对所述预测模型进行校验以获得优化后的预测模型；

若再次检测到用户收看一电视节目，获取用户的第二收视行为数据；

将所述第二收视行为数据输入优化后的预测模型中学习以得到用户收看的电视节目的用户喜好度，其中，将得到的用户正在收看的电视节目的用户喜好度作为第二用户喜好度；

根据所述第二用户喜好度以及所述第二收视行为数据生成第二互动活动；以及

向用户推荐所生成的第二互动活动。

6.根据权利要求5所述的数据分析方法，其特征在于，所述根据所述第二用户喜好度以及所述第二收视行为数据生成第二互动活动，包括：

判断所述第二用户喜好度是否满足预设条件；

若所述第二用户喜好度满足预设条件，确定用户收看的电视节目的节目类型所对应的互动活动类型；

获取所确定的互动活动类型所对应的互动活动模板；以及

在所获取的互动活动模板的多个预设标签位置上对应填充所述第二收视行为数据以生成第二互动活动。

7.一种数据分析装置，应用于一电视终端，其特征在于，包括：

第一获取单元，用于获取用户的第一行为数据集；其中，所述第一行为数据集为从预设数据库中获取的用户在预设时间范围内的所有收视行为数据的集合，所述收视行为数据包括用户的收看时长以及收看的电视节目的有关信息，所述电视节目的有关信息包括所述电视节目的人员信息以及属性信息，所述属性信息包括节目内容以及节目类型；

第一特征转换单元，用于将所述第一行为数据集转换为用于训练预测模型的第一特征集；

第一训练单元，用于根据所述第一特征集，对预设分类算法的函数进行训练建模以得到预测模型；

第二获取单元，用于若检测到用户正在收看一电视节目，获取用户的收视行为数据，其中，将所获取的用户的收视行为数据作为第一收视行为数据；

第一学习单元，用于将所述第一收视行为数据输入到所述预测模型中学习以得到用户正在收看的电视节目的用户喜好度，其中，将得到的用户正在收看的电视节目的用户喜好度作为第一用户喜好度；

第一判断单元，用于判断所述第一用户喜好度是否满足预设条件；

第一类型确定单元，用于若所述第一用户喜好度满足预设条件，确定用户正在收看的电视节目的节目类型对应的互动活动类型；

第一模板获取单元，用于获取所确定的互动活动类型所对应的互动活动模板；以及

第一生成子单元，用于在所获取的互动活动模板的多个预设标签位置上对应填充所述第一收视行为数据以生成第一互动活动，其中，所述第一互动活动是指可供用户点击参与的互动活动；以及

第一推荐单元，用于向用户推荐所生成的第一互动活动。

8.一种计算机设备，其特征在于，所述计算机设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现如权利要求1-6中任一项所述的数据分析方法。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时可实现如权利要求1-6中任一项所述的数据分析方法。