CN102970605B - 一种节目推荐方法 - Google Patents

一种节目推荐方法 Download PDF

Info

Publication number
CN102970605B
CN102970605B CN201210476572.8A CN201210476572A CN102970605B CN 102970605 B CN102970605 B CN 102970605B CN 201210476572 A CN201210476572 A CN 201210476572A CN 102970605 B CN102970605 B CN 102970605B
Authority
CN
China
Prior art keywords
program
mark point
mrow
probability
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210476572.8A
Other languages
English (en)
Other versions
CN102970605A (zh
Inventor
董延平
汪灏泓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TCL Corp
Original Assignee
TCL Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TCL Corp filed Critical TCL Corp
Priority to CN201210476572.8A priority Critical patent/CN102970605B/zh
Publication of CN102970605A publication Critical patent/CN102970605A/zh
Application granted granted Critical
Publication of CN102970605B publication Critical patent/CN102970605B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及一种节目推荐方法,其包括:步骤一,提取每个节目的多个属性或/和人工标签,将多个属性或/和人工标签对应设为多个标记点,并建立初始标记点表;步骤二,分别针对每个用户综合每个节目包括的各个标记点被观看的次数,确定每个节目的推荐概率和不推荐概率;步骤三,筛选出推荐概率大于不推荐概率的节目。本发明的节目推荐方法通过提取节目的多个属性,从各个节目所包含的各个属性被观看的次数来确定此节目的推荐概率和不推荐概率,推荐的准确率明显提高。

Description

一种节目推荐方法
技术领域
本发明涉及一种节目推荐方法。
背景技术
在日常生活中,个人行为习惯的个性化是普遍存在的。例如:读什么样的新闻、平时喜欢上那些网站、喜欢用那个博客、喜欢关注那些微博等都是个人行为习惯的体现。随着网络的不断发展,在线群体人数的增多、信息量的扩大,为了更好地针对不同用户提供更好的用户体验,依据用户信息为用户提供“量身定制”的节目推荐变得至关重要。然而,现有的技术为各个用户推荐节目仅仅是从用户喜爱的节目类型角度进行推荐,给用户推荐同类型的节目,比如某个用户喜爱看武打,就给该用户推荐各个武打剧,实际上,并非所有的武打剧用户都喜爱,所以存在推荐的准确率低的问题。
发明内容
本发明实施例的目的在于提供一种节目推荐方法,旨在解决现有技术推荐的准确率低的技术问题。
本发明实施例是这样实现的,一种节目推荐方法,所述方法包括:步骤一,提取每个节目的或/和人工标签,将多个属性或/和人工标签对应设为多个标记点,并建立初始标记点表;步骤二,分别针对每个用户综合每个节目包括的各个标记点被观看的次数,确定每个节目的推荐概率和不推荐概率;步骤三,筛选出推荐概率大于不推荐概率的节目,推荐给相应的用户。
相较于现有技术,本发明的节目推荐方法通过提取节目的多个属性或/和人工标签,从各个节目所包含的各个属性或/和人工标签被观看的次数来确定此节目的推荐概率和不推荐概率,然后将推荐概率大于不推荐概率的节目推荐给用户,推荐的准确率明显提高,而且从人工标签中也很容易发现用户的观看趋势变化。
附图说明
图1是本发明提供的节目推荐方法较佳实施例的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
如图1所示为本发明提供的节目推荐方法较佳实施例的流程图,为了便于说明,仅示出了与本发明实施例相关的部分。
步骤S101,提取每个节目的多个属性或/和人工标签,将多个属性或/和人工标签对应设为多个标记点,并建立初始标记点表。
在本发明实施例中,首先提取每一个节目的所有属性或/和人工标签,所述属性包括多种:如节目的性质(如影视剧、娱乐节目、新闻等)、节目的内容(如歌曲、自然、言情、动作、风景、科技等)、节目的演职人员(如成龙、李连杰等)、节目的播放形式(如周播、日播等),所述人工标签为人工添加的分类,如淘宝体、宅男、腐女等,每个节目包括若干属性或/和人工标签。为了便于理解,下面的表1即为一个示例性的初始标记点表。
a1 言情
a2 西部牛仔
a3 自然
a4 摄影爱好者
a5 军事
a6 成龙
a7 动作
a8 运动
a9 职业
a10 动物
a11 风景
a12 科技
表1
步骤S102,对初始标记点表中的标记点进行筛选,利用筛选出的标记点建立一个更新标记点表。
对初始标记点表中的标记点进行筛选的方法如下:
由所有用户观看初始标记表中的各个标记点的次数除以所有用户观看所有节目的总次数,分别计算出各个标记点的支持度。将各个标记点的支持度与预设值或预设范围相比较,筛选出标记点的支持度大于预设值,或标记点的支持度在预设范围内的若干标记点,并由这些标记点建立一更新标记点表。
若用下述公式计算标记点支持度,则:
di=niN
其中,di表示标记点支持度,ni为所有用户在一段时期内(如3个月等)观看该标记点的次数,N为所有用户在上述一段时期内(如3个月等)观看所有节目的总次数。
对于从众人群(即大众化的人群)而言,只要标记点的支持度大于预设值,则表示包括该标记点的节目为大多数人都观看,则该标记点被列入更新标记点表。预设值由从众人群比例(即观看节目的从众人员比例),经验系数、初始标记点表中的标记点的个数来确定。预设值的公式如下:
T=(N×p×e)/(Na×N)=(p×e)Na,其中,T表示预设值,p表示从众人群比例,取值可以为0.73,e表示经验系数,N表示上述一段时期内所有用户观看所有节目的总次数,Na表示初始标记点表中的标记点的个数。e∈(0,1],优选0.2~0.3之间。经验系数的值越大,筛选出的标记点个数越多,经验系数的值越小,筛选出的标记点个数越少。
对于非从众人群(即非大众化的人群,比较特别的群体)而言,从支持度较低的区间选取一个适当的预设范围,支持度在该预设范围内的标记点也列入更新标记点表中。预设范围由非从众人群比例、最大经验系数、最小经验系数及初始标记点表中的标记点的个数确定。预设范围的计算公式如下:
T'Min=((1-p)×eMin)/Na,T'Max=((1-p)×eMax)/Na,其中,T’Min表示预设范围的最小值,T’Max表示预设范围的最大值,(1-p)表示非从众人群比例,经统计调查,取值可以为0.27,eMin∈[0.1,1)表示最小经验系数,eMax∈(eMin,1]表示最大经验系数,Na表示初始标记点表中的标记点的个数。针对非从众人群,eMin优选取0.1,eMax优选取0.2。
为了便于理解,下面的表2即为一个示例性的更新标记点表。
b1 言情
b2 军事
b3 成龙
b4 运动
b5 动作
b6 科技
表2
步骤S103,分别针对每个用户综合每个节目包括的各个标记点被观看的次数,计算每个节目的推荐概率和不推荐概率。
具体为,通过跟踪所有用户一段时间内观看节目的信息,根据每个用户观看更新标记表中的各个标记点的次数及每个用户观看所有节目的总次数,确定给每个用户推荐每个标记点的推荐概率和不给每个用户推荐每个标记点的不推荐概率。然后,针对每个用户,将各个节目所包括的各个标记点的推荐概率加一个权值计算出总和作为各个筛选后节目的推荐概率;将各个节目所包括的各个标记点的不推荐概率加一个权值计算出总和作为各个节目的不推荐概率。
下面以用户u进行说明:
根据用户u观看标记点bi的次数计算出给用户u推荐标记点bi的推荐概率的公式如下:
其中,表示用户u观看标记点bi的次数,Su表示用户u观看节目的总次数,表示用户u观看标记点bi的概率,表示给用户u推荐标记点bi的概率,表示不给用户u推荐标记点bi的概率。
计算给用户u推荐节目I的概率和不给用户u推荐某节目I的概率的公式如下:
其中,表示用户u观看标记点bi的次数,表示用户u观看节目I所包括的所有标记点的总次数,例如,节目I包括了三个标记点:b1、b2和b4。用户u观看标记点b1的次数为3、观看标记点b2的次数为4、观看标记点b4的次数为5,则表示给用户u推荐标记点bi的推荐概率的权值,表示给用户u推荐节目I的推荐概率,表示不给用户u推荐节目I的不推荐概率。
在步骤S103中,为了更好地获知用户观看各标记点的情况,还可将每一天分为几个时段,统计每个用户在每一天的每个时段观看的各个标记点bi的次数,针对每个时段分别计算各个节目的推荐概率和不推荐概率,如此做法,可以进一步提高推荐的准确率。其中,时段由开发人员预先定义,可以是“等时长的时段”或者“非等时长的时段”,例如早上和下午每两个小时为一个时段,晚上每一个小时为一个时段。
步骤S104,筛选出推荐概率大于不推荐概率的节目,并将节目按照推荐概率从高到低的顺序推荐给相应用户。
具体为,如果给用户u推荐节目I的推荐概率>不给用户u推荐节目I的不推荐概率则给用户u推荐节目I;否则不给用户u推荐节目I。
在步骤S104中,为了提高推荐信息的可解释性,让用户更好的理解为何会推荐这个节目,优选在推荐节目的同时显示推荐节目所包含的标记点。
在本发明的其他变更实施例中,由于现今时代的快速发展,信息的快速更替,为了适应群体和个体的兴趣变更,也为了保持所推荐的节目的有效性,必须要定时更新初始标记点表中的各个标记点。因而每隔一定时间(如两周、1个月或者2个月)重新提取每个节目的多个属性或/和人工标签,并在将属性或/和人工标签对应设为多个新标记点后建立标记点集,将标记点集与初始标记点表进行比较,根据标记点集与初始标记点表的差异更新初始标记点表。
具体为,将标记点集中的新标记点与初始标记点表中的标记点逐个进行比较;如果初始标记点表中有标记点集中的新标记点,则在初始标记点表中保留该标记点;或如果初始标记点表中没有标记点集中的新标记点,则在初始标记点表中新增该新标记点;或如果初始标记点表中有标记点集中没有的标记点,则从初始标记点表中删除该标记点。并在更新所有标记点后,对于初始标记点表中原有的标记点,将用户新增的观看次数与原有观看次数相加获得新的用户观看该标记点的次数;对于新添加的标记点,重新计算用户观看该标记点的次数。
在本发明的其它变更实施例中,本发明的节目推荐方法的步骤S102中建立更新标记点表之后进一步包括:筛选出包含更新标记点表中的标记点的节目,此节目后续称为筛选后节目。相应的,在步骤S103中,只需针对每个用户综合每个筛选后节目包括的各个标记点被观看的次数,确定各个筛选后节目的推荐概率和不推荐概率。推荐概率和不推荐概率的计算方法相同,不再赘述。这样的做法可以使计算变得更加简单。
在本发明的其它变更实施例中,本发明的节目推荐方法也可以省略步骤S102,即不建立更新标记点表,也不根据更新标记表的标记点来筛选节目;相应的,步骤S103具体为,通过跟踪用户一段时间内观看节目的信息,统计出每个用户观看初始标记表中的各个标记点的次数及每个用户观看节目的总次数。利用两者之比值计算出给每个用户推荐每个标记点的推荐概率和不给每个用户推荐每个标记点的不推荐概率。然后,针对每个用户,将各个节目所包括的各个标记点的推荐概率加一个权值计算出总和作为各个节目的推荐概率;将各个节目所包括的各个标记点的不推荐概率加一个权值计算出总和作为各个节目的不推荐概率。这样的做法也可以实现节目的推荐,只是计算复杂了一些。
相较于现有技术,本发明的节目推荐方法通过提取节目的多个属性或/和人工标签,从各个节目所包含的各个属性或/和人工标签被观看的次数来确定此节目的推荐概率和不推荐概率,然后将推荐概率大于不推荐概率的节目推荐给用户,推荐的准确率明显提高,而且从人工标签中也很容易发现用户的观看趋势变化,例如“宅男,腐女等”这些新标签用语是不会在节目属性中出现,并随着社会流行文化的发展而变化的。
本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以在存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种节目推荐方法,其特征在于,所述方法包括:
步骤一,提取每个节目的多个属性或/和人工标签,将多个属性或/和人工标签对应设为多个标记点,并建立初始标记点表;
对初始标记点表中的标记点进行筛选,利用筛选出的标记点建立一个更新标记点表;
步骤二,分别针对每个用户综合每个节目包括的各个标记点被观看的次数,确定每个节目的推荐概率和不推荐概率;
步骤三,筛选出推荐概率大于不推荐概率的节目,推荐给相应的用户;
所述对初始标记点表中的标记点进行筛选包括:
由所有用户观看初始标记表中的各个标记点的次数除以所有用户观看所有节目的总次数,分别计算出各个标记点的支持度,所述标记点的支持度的计算公式如下:di=ni/N,其中,di表示标记点支持度,ni为所有用户在一段时期内观看该标记点的次数,N为所有用户在上述一段时期内观看所有节目的总次数;预设值的公式如下:T=(p×e)/Na,其中,T表示预设值,p为0.73,e∈(0,1],Na表示初始标记点表中的标记点的个数;预设范围的计算公式如下:T'Min=((1-p)×eMin)/Na,T'Max=((1-p)×eMax)/Na,其中,T’Min表示预设范围的最小值,T’Max表示预设范围的最大值,(1-p)为0.27,eMin∈[0.1,1),eMax∈(eMin,1],Na表示初始标记点表中的标记点的个数;
将所述各个标记点的支持度与预设值或预设范围相比较;
筛选出标记点的支持度大于所述预设值,或标记点的支持度在所述预设范围内的若干标记点,并由所述若干标记点建立一更新标记点表。
2.如权利要求1所述的方法,其特征在于,所述步骤三中将节目按照推荐概率从高到低的顺序推荐给相应用户。
3.如权利要求2所述的方法,其特征在于,所述建立更新标记点表之后还包括以下步骤:筛选出包含更新标记点表中的标记点的节目,此节目后续称为筛选后节目;相应的,步骤二中的每个节目为每个筛选后节目。
4.如权利要求3所述的方法,其特征在于,步骤二具体包括如下步骤:根据每个用户观看更新标记表中的各个标记点的次数及每个用户观看所有节目的总次数,确定给每个用户推荐每个标记点的推荐概率和不给每个用户推荐每个标记点的不推荐概率,然后,针对每个用户,将各个筛选后节目所包括的各个标记点的推荐概率加一个权值计算出总和作为各个筛选后节目的推荐概率;将各个筛选后节目所包括的各个标记点的不推荐概率加一个权值计算出总和作为各个筛选后节目的不推荐概率。
5.如权利要求4所述的方法,其特征在于:给用户推荐每个标记点的推荐概率和不给每个用户推荐每个标记点的不推荐概率的计算公式如下:
<mrow> <msubsup> <mi>p</mi> <mrow> <mi>b</mi> <mi>i</mi> </mrow> <mi>u</mi> </msubsup> <mo>=</mo> <msubsup> <mi>n</mi> <mi>i</mi> <mi>u</mi> </msubsup> <mo>/</mo> <msup> <mi>S</mi> <mi>u</mi> </msup> <mo>,</mo> <msubsup> <mi>p</mi> <mi>u</mi> <mi>T</mi> </msubsup> <mrow> <mo>(</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msup> <mrow> <mo>(</mo> <msubsup> <mi>p</mi> <mrow> <mi>b</mi> <mi>i</mi> </mrow> <mi>u</mi> </msubsup> <mo>)</mo> </mrow> <mrow> <msub> <mi>n</mi> <mi>i</mi> </msub> <mo>+</mo> <mn>1</mn> </mrow> </msup> <mo>&amp;times;</mo> <msup> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <msubsup> <mi>p</mi> <mrow> <mi>b</mi> <mi>i</mi> </mrow> <mi>u</mi> </msubsup> <mo>)</mo> </mrow> <msub> <mi>m</mi> <mi>i</mi> </msub> </msup> <mo>,</mo> <msubsup> <mi>p</mi> <mi>u</mi> <mi>F</mi> </msubsup> <mrow> <mo>(</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msup> <mrow> <mo>(</mo> <msubsup> <mi>p</mi> <mrow> <mi>b</mi> <mi>i</mi> </mrow> <mi>u</mi> </msubsup> <mo>)</mo> </mrow> <msub> <mi>n</mi> <mi>i</mi> </msub> </msup> <mo>&amp;times;</mo> <msup> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <msubsup> <mi>p</mi> <mrow> <mi>b</mi> <mi>i</mi> </mrow> <mi>u</mi> </msubsup> <mo>)</mo> </mrow> <mrow> <msub> <mi>m</mi> <mi>i</mi> </msub> <mo>+</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> </mrow>
其中,表示用户u观看标记点bi的次数,Su表示用户u观看节目的总次数,表示用户u观看标记点bi的概率,表示给用户u推荐标记点bi的推荐概率,表示不给用户u推荐标记点bi的不推荐概率。
6.如权利要求5所述的方法,其特征在于:给用户推荐节目的推荐概率和不给用户推荐节目的不推荐概率的计算公式如下:
其中,表示用户u观看标记点bi的次数,表示用户u观看节目I所包括的所有标记点的总次数,表示给用户u推荐标记点bi的推荐概率的权值,表示给用户u推荐节目I的推荐概率,表示不给用户u推荐节目I的不推荐概率。
7.如权利要求1至3任一权利要求所述的方法,其特征在于,所述方法还包括:
每隔一定时间重新提取每个节目的多个属性或/和人工标签,并在将所述属性或/和人工标签对应设为多个新标记点后建立标记点集;
将标记点集与初始标记点表进行比较,根据标记点集与初始标记点表的差异定时更新初始标记点表。
CN201210476572.8A 2012-11-21 2012-11-21 一种节目推荐方法 Expired - Fee Related CN102970605B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210476572.8A CN102970605B (zh) 2012-11-21 2012-11-21 一种节目推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210476572.8A CN102970605B (zh) 2012-11-21 2012-11-21 一种节目推荐方法

Publications (2)

Publication Number Publication Date
CN102970605A CN102970605A (zh) 2013-03-13
CN102970605B true CN102970605B (zh) 2017-10-31

Family

ID=47800423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210476572.8A Expired - Fee Related CN102970605B (zh) 2012-11-21 2012-11-21 一种节目推荐方法

Country Status (1)

Country Link
CN (1) CN102970605B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559206B (zh) * 2013-10-10 2017-08-08 Tcl集团股份有限公司 一种信息推荐方法及系统
CN106331778B (zh) 2015-07-06 2020-08-14 腾讯科技(深圳)有限公司 视频推荐方法和装置
CN106791963B (zh) * 2016-12-08 2020-08-18 Tcl科技集团股份有限公司 一种电视节目推荐方法及系统
CN106604067A (zh) * 2016-12-30 2017-04-26 中广热点云科技有限公司 一种视频浏览信息归类方法及服务器
CN107454442B (zh) * 2017-09-07 2021-02-05 阿里巴巴(中国)有限公司 一种推荐视频的方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6727914B1 (en) * 1999-12-17 2004-04-27 Koninklijke Philips Electronics N.V. Method and apparatus for recommending television programming using decision trees
US20020174429A1 (en) * 2001-03-29 2002-11-21 Srinivas Gutta Methods and apparatus for generating recommendation scores
CN101431694B (zh) * 2008-11-26 2010-09-29 深圳市天威视讯股份有限公司 一种基于贝叶斯算法的数字电视节目推荐方法和系统

Also Published As

Publication number Publication date
CN102970605A (zh) 2013-03-13

Similar Documents

Publication Publication Date Title
CN102970605B (zh) 一种节目推荐方法
Boyland et al. The extent of food advertising to children on UK television in 2008
Tattersall Wallin et al. Time to read: Exploring the timespaces of subscription-based audiobooks
US9710472B2 (en) Customized content consumption interface
AU2013300064B2 (en) Receiving information about a user from a third party application based on action types
US20200099988A1 (en) Method, device and system for processing bullet screen
CN104469430A (zh) 基于上下文和群组组合的视频推荐方法及系统
US20100161384A1 (en) System and Method for Presenting Content
CN103984741B (zh) 用户属性信息提取方法及其系统
CN106407241A (zh) 视频推荐方法及系统
US20140040367A1 (en) Publishing aggregated data to a social networking system
CN106817384A (zh) 一种基于用户电信访问行为的分析方法及系统
CN105208411B (zh) 一种实现数字电视目标受众统计的方法及装置
Gurleen et al. A study of TV viewership patterns among youngsters in northern India
CN104699696A (zh) 文件推荐方法和装置
Farrahi et al. Impact of listening behavior on music recommendation
KR20170120661A (ko) 인간의 개입 없이 알고리즘적으로 어린이들에게 적절한 콘텐츠의 식별
Ardrini et al. ‘I want what they’re eating’: College students’ experiences in watching food content on YouTube
Becattini When we were young: Netflix and the teen audience
JP5194198B1 (ja) コンテンツ提示装置、端末、システム、プログラム、および、方法
KR20140083637A (ko) 사용자의 감성에 기반한 맞춤형 콘텐츠를 제공하는 서버 및 방법
Filofteia MOBILE APPLICATIONS FOR TOURISM. STUDY REGARDING THEIR USE BY ROMANIANS.
Suciati et al. Indonesian gen Z consumer preference for subscribing to netflix in the Covid-19 pandemic era
Zemaityte et al. Understanding the dynamics between the United States and Australian film markets: testing the ‘10% rule’
Thornton Bridges, streams and dams: the multiple negotiated strategies of distribution and access in Latin American cinema

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171031

CF01 Termination of patent right due to non-payment of annual fee