具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示出了本发明基于IPTV的收视评估系统的结构,所述收视评估系统100至少包括有元指标计算模块10、无量纲处理模块20、收视空间构造模块30以及收视指数计算模块40,其中:
所述元指标计算模块10,用于将采集的原始收视数据按照预定指标算法计算出若干收视元指标。所述收视元指标对应不同的收视行为,所述收视元指标优选包括所述收视元指标包括:次均时长、户均时长、户均访次、总收视率、直播收视率、回看收视率、点播收视率、开机率、占有率、到达率、节目消费贡献率、户均消费贡献率、节目引力、演员节目占有率、演员新上线节目占有率、导演节目占有率、导演新上线节目占有率、编剧节目占有率、编剧新上线节目占有率、出品方节目占有率和/或出品方新上线节目占有率。
所述收视元指标的预定指标算法包括:
所述无量纲处理模块20,用于将所述收视元指标进行无量纲处理,生成若干归一化的收视元指标,即生成标准化收视元指标。优选的是,所述收视元指标进行无量纲处理的公式为:
xi表示某一收视元指标的值;xmin表示收视元指标中所有值中的最小值;
xmax表示收视元指标中所有值中的最大值;x′i表示收视元指标经过无量纲处理后生成的归一化的收视元指标的标准值。
所述收视空间构造模块30,用于根据收视行为选择对应的多个归一化的收视元指标来构建多维的收视空间,所选的每个归一化的收视元指标代表收视空间的一个维度,不同收视行为采用不同维度的收视空间表示。
所述收视指数计算模块40,用于根据该收视空间计算收视行为的收视指数。
优选的是,所述收视评估系统100还包括有数据采集模块50、数据清洗模块60和收视指数呈现模块70,其中:
所述数据采集模块50,用于采集原始收视数据,优选采集来自电信业务运营平台、Vis(Video Interactive Service,视频交互服务)系统、EPG(ElectronicProgram Guide,电子节目指南)系统等的原始收视数据。
所述数据清洗模块60,用于将所采集的原始收视数据进行清洗处理,将清洗处理后的原始收视数据存入一收视数据库以供元指标计算模块30的调用。
所述收视指数呈现模块70,用于将元指标计算模块30计算出的收视指数进行呈现。
优选的是,每个收视行为对应收视空间一个收视行为点,收视行为点的坐标值为收视行为对应的多个归一化的收视元指标的值。所述收视指数计算模块30用于计算收视行为对应的收视行为点距离空间原点的欧氏距离,作为所述收视行为的收视指数(本文也称为二级收视指数)。
所述收视空间包括二维收视空间、三维收视空间和N维收视空间,其中N≥3;所述欧氏距离的计算公式包括:
二维收视空间的收视行为点的欧氏距离D2=sqrt((x1-x2)^2+(y1-y2)^2),其中x1和y1为收视行为点的坐标值,x2和y2为空间原点的坐标值;
三维收视空间的收视行为点的欧氏距离D3=sqrt((x1-x2)^2+(y1-y2)^2+(z3-z2)^2),其中x1、y1和z1为收视行为点的坐标值,x2、y2和z2为空间原点的坐标值;
N维收视空间的欧氏距离DN(A,B)=sqrt[∑((a[i]-b[i])^2)](i=1,2,…,n)。
所述收视指数包括:
用户体粘性指数,用户体粘性指数对应的收视元指标包括户均时长、收视时间间隔和户均消费贡献率;
频道收视指数,频道收视指数对应的收视元指标包括直播收视率和回看收视率;
栏目收视指数,栏目收视指数对应的收视元指标包括直播收视率和回看收视率;
电影收视指数,电影收视指数对应的收视元指标包括点播收视率、节目吸引力和节目消费贡献度;
电视剧热度收视指数,电视剧热度收视指数对应的收视元指标包括直播收视率、回看收视率、点播收视率、节目吸引力和节目消费贡献度;
电视剧累积收视指数,电视剧累积收视指数对应的收视元指标包括点播收视率、节目吸引力和节目消费贡献度;
新闻热度指数,新闻热度指数对应的收视元指标包括直播收视率和回看收视率;
演员热度指数,演员热度指数对应的收视元指标包括演员节目占有率、演员新上线节目占有率、节目户均访次和节目户均时长;
导演热度指数,导演热度指数对应的收视元指标包括导演节目占有率、导演新上线节目占有率、节目户均访次和节目户均时长;
编剧热度指数,编剧热度指数对应的收视元指标包括编剧节目占有率、编剧新上线节目占有率、节目户均访次和节目户均时长;
出品方热度指数,出品方热度指数对应的收视元指标包括出品方节目占有率、出品方新上线节目占有率、节目户均访次和节目户均时长。
更好的是,收视指数计算模块30还用于根据各种收视行为的收视指数计算出IPTV收视总体指数IIPTV(本文也称为一级收视指数),计算公式如下:
其中amn是收视空间的一个二级收视指数。
本发明要解决在IPTV商业智能系统中,如何利用用户的原始收视数据客观、全面地评估用户收视行为。特点是根据IPTV商业智能系统自动采集IPTV用户的原始收视数据,然后经过数据清洗处理进入收视数据库,计算收视元指标(即基础收视指标),再将收视元指标进行无量规处理,形成归一化的收视元指标,接着使用归一化的收视元指标描绘收视空间,最后利用收视空间数据计算收视指数,并通过IPTV商业智能系统的收视呈现模块呈现。
图2是本发明基于IPTV的收视评估方法的流程图,其可通过如图1所示的收视评估系统100实现,包括步骤有:
步骤S201,元指标计算步骤,将采集的原始收视数据按照预定指标算法计算出若干收视元指标。所述收视元指标对应不同的收视行为,所述收视元指标优选包括所述收视元指标包括:次均时长、户均时长、户均访次、总收视率、直播收视率、回看收视率、点播收视率、开机率、占有率、到达率、节目消费贡献率、户均消费贡献率、节目引力、演员节目占有率、演员新上线节目占有率、导演节目占有率、导演新上线节目占有率、编剧节目占有率、编剧新上线节目占有率、出品方节目占有率和/或出品方新上线节目占有率等。
步骤S202,无量纲处理步骤,将所述收视元指标进行无量纲处理,生成若干归一化的收视元指标,即生成标准化收视元指标。
步骤S203,收视空间构造步骤,根据收视行为选择对应的多个归一化的收视元指标来构建多维的收视空间,所选的每个归一化的收视元指标代表收视空间的一个维度,不同收视行为采用不同维度的收视空间表示。
步骤S204,收视指数计算步骤,根据收视空间计算收视行为的收视指数。
图3示出了本发明优选基于IPTV的收视评估方法,其可通过如图1所示的收视评估系统100实现,包括步骤有:
步骤S301,数据采集步骤,采集原始收视数据。
本步骤优选采集来自电信业务运营平台、Vis系统、EPG系统等的IPTV用户的原始收视数据。
步骤S302,数据清洗步骤,将所采集的原始收视数据进行清洗处理,将清洗处理后的原始收视数据存入一收视数据库以供元指标计算步骤的调用,所述收视数据库是基础数据库,计算涉及数据均由该收视数据库调用。
如图4所示,本步骤优选首先对原始收视数据进行冗余判断,如有冗余数据将分别通过删除冗余数据与合并冗余数据;再进行准确性判断,如有问题则进行合法性检验与数据转换;接下来进行数据一致性判断,如有不一致性数据,将通过选取新数据与合并数据解决;最后将进行数据缺失判断,如有数据缺失,将通过绕开缺失数据与降低精度步骤解决,到此,数据清洗处理过程结束。
步骤S303,元指标计算步骤,将清洗处理后的原始收视数据按照预定指标算法计算出若干收视元指标。
所述收视元指标包括:次均时长、户均时长、户均访次、总收视率、直播收视率、回看收视率、点播收视率、开机率、占有率、到达率、节目消费贡献率、户均消费贡献率、节目引力、演员节目占有率、演员新上线节目占有率、导演节目占有率、导演新上线节目占有率、编剧节目占有率、编剧新上线节目占有率、出品方节目占有率和/或出品方新上线节目占有率;
所述收视元指标的预定指标算法包括:
(1)次均时长
次均时长是机顶盒每次收看某个节目的平均时长。访问次数是每个机顶盒重复收看某个节目的总次数。
(2)户均时长
户均时长是每个机顶盒收看某一节目的平均时长。由于每个机顶盒可能会多次收看同一节目(即总访次),因此,户均时长一般会大于次均时长。
(3)户均访次
户均访次是节目观看户均次数,是该节目的用户喜好程度的影响因素之一。
(4)总收视率
总收视率是衡量某一节目在一段时间内容的收视情况,总收视可包括直播、回看和点播三种收视类型。
(5)直播收视率
直播收视率衡量直播的节目(频道)收视情况,其数值一般会小于总收视率。
(6)回看收视率
回看收视率衡量节目回看类型收视情况,其数值一般会小于总收视率。
(7)点播收视率
点播看收视率衡量节目点播类型收视情况,其数值一般会小于总收视率。
对于一些存在三种收视类型的节目:
总收视率=直播收视率+回看收视率+点播收视率
(8)开机率
开机率是一段时间内有效打开机顶盒占总IPTV用户的比值,所谓有效打开机顶盒是指机顶盒的有效收视数,无效收视情况主要有两种,一、是用户一直打开机顶盒却关闭了电视机;二、机顶盒打开后始终保持在首页面,没有进入具体节目或频道。无效数据的异常点监测与清洗通过大数据挖掘算法进行分析与剔除。
(9)占有率
占有率是特定时间段内收看某一节目次数与打开机顶盒用户数之比。
(10)到达率
到达率是特定时间段内收看某一节目的用户数(访客数)与所有开机用户数之比。
占有率与到达率不同之处在于到达率是收看某个节目的用户,而不管该用户收看了几次节目。占有率是收看某一节目的所有次数,同一用户可能收看了一次以上该节目,即重复收看。
(11)节目消费贡献率
节目消费贡献率是针对用户的消费行为,即某一特定时间段内某个节目的收费金额与该时间段内所有收费节目的收费金额之比。该指标反映了某个收费节目的经济效益。
(12)户均消费贡献率
户均消费贡献率是某个地区用户在IPTV上消费的总次数与该地区总用户数之比。
(13)节目引力
节目引力是户均有效到达某一节目的时长占该节目时长的比率。反映了一段时间内(如一天,一月等)户均对某一节目的有效覆盖。
(14)演员节目占有率
演员节目占有率是指特定时间段内(如一个季度)该演员参与主演、配角和综艺节目的总次数与该时间段内IPTV总节目数之比。
(15)演员新上线节目占有率
演员新上线节目占有率是在特定时间段内(如一个季度)在所有新上线节目中该演员出镜次数与新上线节目总数之比。演员新上线节目占有率是衡量某一演员在某个时间段内出镜次数占整个新上线节目的比值。而演员节目占有率是衡量某一演员在IPTV节目库中所有出镜次数与节目库所有节目数量之比。
演员节目占有率反映了当前与历史节目中的出镜率,而演员新上线节目占有率则反映了该演员当前的出镜率。
(16)导演节目占有率
导演节目占有率是特定时间段内(如一个季度)某一导演所指导的影视节目总数与IPTV所有影视节目总数的比值。
(17)导演新上线节目占有率
导演新上线节目占有率是特定时间段内某一导演指导的所有影视节目总数与该时间段内所有新上线影视节目总数的比值。
(18)编剧节目占有率
编剧节目占有率是特定时间段内(如一个季度)某一编剧所编辑的影视节目总数与IPTV所有影视节目总数的比值。
(19)编剧新上线节目占有率
编剧新上线节目占有率是特定时间段内某一编剧所编辑的所有影视节目总数与该时间段内所有新上线影视节目总数的比值。
(20)出品方节目占有率
出品方节目占有率是特定时间段内(如一个季度)某一出品方所出品的影视节目总数与IPTV所有影视节目总数的比值。
(21)出品方新上线节目占有率
出品方新上线节目占有率是特定时间段内某一出品方所出品的所有影视节目总数与该时间段内所有新上线影视节目总数的比值。
步骤S304,无量纲处理步骤,将步骤S303计算出的收视元指标进行无量纲处理,生成若干归一化的收视元指标,即生成标准化收视元指标。
优选的是,所述收视元指标进行无量纲处理的公式为:
xi表示某一收视元指标的值,如某一节目的次均时长、户均时长、户均访次、直播收视率、回看收视率、点播收视率、开机率、到达率、节目吸引力等;
xmin表示收视元指标中所有值中的最小值,以次均时长为例,表示在IPTV平台中所有节目次均时长的最小值;
xmax表示收视元指标中所有值中的最大值,以次均时长为例,表示在IPTV平台中所有节目次均时长的最大值;
x′i表示收视元指标经过无量纲处理后生成的归一化的收视元指标的标准值。
步骤S305,收视空间构造步骤,根据收视行为选择对应的多个归一化的收视元指标来构建多维的收视空间,所选的每个归一化的收视元指标代表收视空间的一个维度,不同收视行为采用不同维度的收视空间表示。
收视空间是本发明的主要特点之一,其将用户收视行为看成多维空间中的数据组合。即每一个元指标是这个收视空间中的一个维度,不同的收视行为可以采用不同维度的收视空间表示。根据不同的收视行为,选取不同的标准化收视元指标作为收视空间的维度,判断维度完备后,再进行收视空间构造。
以用户体粘性指数为例,根据收视元指标构建的收视空间(用户粘性空间)如图5,图中每一个坐标点代表一个用户,该用户的粘性通过收视空间中三个因素(户均时长,收视时间间隔(频率),户均消费贡献率)x、y、z来表示。计算该坐标点至原点的欧氏距离,作为该用户的粘性指数。
步骤S306,收视指数计算步骤,根据收视空间计算收视行为的收视指数。
优选的是,每个收视行为对应收视空间一个收视行为点,收视行为点的坐标值为收视行为对应的多个归一化的收视元指标的值;本步骤包括:计算收视行为对应的收视行为点距离空间原点的欧氏距离,作为收视行为的收视指数,具体的指数值也是收视空间的外部值。
本步骤优选分为二级收视指数计算和一级收视指数计算:
步骤6-1、二级收视指数计算。根据收视空间,计算每个收视空间点距离空间原点的欧氏距离作为该二级收视指数的指数值。各收视空间维度不同,有二维、三维、和N维(N≥3),具体欧氏距离计算公式如下:
二维收视空间的收视行为点的欧氏距离D2=sqrt((x1-x2)^2+(y1-y2)^2),其中x1和y1为收视行为点的坐标值,x2和y2为空间原点的坐标值;
三维收视空间的收视行为点的欧氏距离D3=sqrt((x3-x4)^2+(y3-y4)^2+(z3-z4)^2),其中x3、y3和z3为收视行为点的坐标值,x4、y4和z4为空间原点的坐标值;
N维收视空间的欧氏距离DN(A,B)=sqrt[∑((a[i]-b[i])^2)](i=1,2,…,n)。N维欧氏空间是一个点集,它的每个点X可以表示为(x[1],x[2],…,x[n]),其中x[i](i=1,2,…,n)是实数,称为X的第i个坐标,两个点A=(a[1],a[2],…,a[n])和B=(b[1],b[2],…,b[n])之间的距离DN(A,B)定义为上述公式。
步骤6-2、一级收视指数计算。根据各种收视行为的收视指数计算出IPTV收视总体指数IIPTV,IIPTV可以使用一个N阶矩阵空间反映。这个多维的空间称为“IPTV收视空间”。IIPTV用数学模型表示如下公式:
其中,amn是二级收视指数值,例如,其中a1行可以看做用户体粘性指数,以此类推。由于每行中因素不同,当无该因素指标时以(0,0)代入。
优选的是看,基于收视元指标可以构建1个一级收视指数(IPTV收视总体指数),11个二级收视指数(如表一)。优选的是,所述11个二级收视指数包括用户体粘性指数、频道收视指数、栏目收视指数、电影收视指数、电视剧热度收视指数、电视剧累积收视指数、新闻热度指数、演员热度指数、导演热度指数、编剧热度指数和出品方热度指数。
步骤S307,收视指数呈现步骤,将收视指数进行呈现。优选将步骤6-1和6-2的计算结果在系统中呈现。
为了更好的理解本发明,下面描述一个实施例,该实施例涉及了IPTV平台中单天的电影收视数据,其将展示本发明涉及的商业智能系统中根据数据的采集,收视元指标的计算,收视空间的构成、收视指数计算等流程,包括:
步骤20、IPTV商业智能系统的数据层从电信运营平台接收用户电影收视数据,数据字段包括:用户ID、电影ID(节目ID)、开始时间、结束时间、付费、本片时长、访客、访次、访问时长等。
步骤21、将步骤20采集的电影收视数据进行清洗,生成电影收视基础数据。
步骤22、调用元指标计算模块计算电影收视元指标,这里包括点播收视率、节目引力以及节目消费贡献率这3个电影收视元指标。
(1)点播收视率
(2)节目引力
(3)节目消费贡献率
步骤23、将电影收视元指标进行无量纲处理,得到标准化电影收视元指标。
步骤24、根据步骤23得到的标准化电影收视元指标构建用户电影收视空间(x,y,z),x代表该电影点播收视率、y代表该电影节目引力、z代表节目消费贡献率。
步骤25、根据用户电影收视空间计算电影收视指数,计算公式如下:I=sqrt(x1^2+y^2+z^2)
表二中显示了10部电影的计算案例中步骤21至步骤25的计算结果:
注:该10部影片是从某一天IPTV平台中所有电影数据计算得出,其中包括了付费电影和免费电影,免费电影的节目消费贡献率为0。
步骤26、将步骤21至步骤25的计算结果,显示在IPTV商业智能系统的收视呈现模块中。
综上所述,本发明根据采集的原始收视数据计算出反映各种收视行为的若干收视元指标,所述收视元指标包括总收视率、直播收视率、回看收视率、点播收视率等,并对所述收视元指标进行无量纲处理;然后根据收视行为选择多个收视元指标生成收视空间,每一个收视元指标代表收视空间中的一个维度,不同的收视行为可以采用不同维度的收视空间表示;最后通过所述收视空间计算收视指数,以描述用户收视行为。借此,本发明能够客观、全面地评估IPTV中用户收视行为,尤其适用于IPTV商业智能分析系统。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。