CN106686460A - 一种视频节目推荐方法及视频节目推荐装置 - Google Patents
一种视频节目推荐方法及视频节目推荐装置 Download PDFInfo
- Publication number
- CN106686460A CN106686460A CN201611199886.2A CN201611199886A CN106686460A CN 106686460 A CN106686460 A CN 106686460A CN 201611199886 A CN201611199886 A CN 201611199886A CN 106686460 A CN106686460 A CN 106686460A
- Authority
- CN
- China
- Prior art keywords
- property value
- video frequency
- program
- frequency program
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/4508—Management of client data or end-user data
- H04N21/4532—Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4667—Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明适用于信息处理领域,提供了一种视频节目推荐方法及装置,包括:获取多个视频节目,所述多个视频节目包括第一视频节目以及多个第二视频节目,第一视频节目为用户最近一次观看的视频节目,第二视频节目为待推荐节目;获取视频节目中各个节目属性的属性值;根据各个属性值,分别计算第一视频节目与每个第二视频节目之间的相似度;将相似度最大的一个第二视频节目推荐至用户。本发明中,推荐的节目能够最大程度上地符合用户当前的兴趣爱好,提高了视频节目推荐的准确性。由于无须将视频节目的内容转化为具体的结构化数据,因此,降低了计算复杂度以及计算误差出现的可能性,由此提高了节目的推荐效率,满足了用户对节目推荐的实际需求。
Description
技术领域
本发明属于信息处理领域,尤其涉及一种视频节目推荐方法及视频节目推荐装置。
背景技术
基于内容的推荐算法(Content-based Recommendations,CB)是目前最流行的一种推荐方法。它根据用户过去喜欢的产品(item),为用户推荐与之相似的其他产品。例如,一个推荐饭店的系统可以依据某个用户之前喜欢的多个烤肉店,从而为他推荐其他烤肉店。在真实的应用场景中,每个item往往都会有一些可以描述其特征内容的属性。这些属性通常可以分为两种:结构化的属性与非结构化的属性。包含结构化属性的数据可以直接被分析处理,但是,对于包含非结构化属性的数据而言,例如一篇文章数据,则先要把它转化为结构化属性的数据后,才能加以分析使用。
由于CB算法并非专门应用于视频节目的推荐算法,因此,根据CB算法的原理来推荐视频节目,则需要先将视频节目的内容转化为具体的结构化数据。在该过程中,由于视频节目的内容复杂,视频画面变化多端,因此,计算复杂度过大,容易出现误差,从而导致视频节目推荐的效果难以满足用户的实际需求。
发明内容
本发明实施例的目的在于提供一种视频节目推荐方法及视频节目推荐装置,旨在解决现有视频节目推荐方法中计算复杂度过大,容易出现误差,从而导致视频节目推荐的效果难以满足用户实际需求的问题。
本发明实施例是这样实现的,一种视频节目推荐方法,包括:
获取多个视频节目,所述多个视频节目包括第一视频节目以及多个第二视频节目,所述第一视频节目为用户最近一次观看的视频节目,所述第二视频节目为待推荐节目;
获取每个所述视频节目中各节目属性的属性值;
根据所述属性值,分别计算所述第一视频节目与每个所述第二视频节目之间的相似度;
将所述相似度最大的一个所述第二视频节目输出为推荐节目。
本发明实施例的另一目的在于提供一种视频节目推荐装置,包括:
第一获取单元,用于获取多个视频节目,所述多个视频节目包括第一视频节目以及多个第二视频节目,所述第一视频节目为用户最近一次观看的视频节目,所述第二视频节目为待推荐节目;
第二获取单元,用于获取每个所述视频节目中各节目属性的属性值;
计算单元,用于根据所述属性值,分别计算所述第一视频节目与每个所述第二视频节目之间的相似度;
推荐单元,用于将所述相似度最大的一个所述第二视频节目输出为推荐节目。
本发明实施例中,只需根据视频节目中各个节目属性的属性值,就能计算出每个第二视频节目与用户最近一次观看的视频节目之间的相似度,并将相似度最大的第二视频节目作为推荐节目,因此,该推荐节目能够最大程度上地符合用户当前的兴趣爱好,提高了视频节目推荐的准确性。此外,相对于CB算法,由于本发明实施例提供的视频节目推荐方法无须将视频节目的内容转化为具体的结构化数据,因此,降低了计算复杂度以及计算误差出现的可能性,由此提高了节目的推荐效率,满足了用户对节目推荐的实际需求。
附图说明
图1是本发明实施例提供的视频节目推荐方法的实现流程图;
图2是本发明实施例提供的视频节目推荐方法S103的具体实现流程图;
图3是本发明实施例提供的视频节目推荐方法S201的具体实现流程图;
图4是本发明实施例提供的视频节目推荐方法S301的具体实现流程图;
图5是本发明实施例提供的视频节目推荐方法S302的具体实现流程图;
图6是本发明实施例提供的视频节目推荐装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示出了本发明实施例提供的视频节目推荐方法的实现流程,详述如下:
在S101中,获取多个视频节目,所述多个视频节目包括第一视频节目以及多个第二视频节目,所述第一视频节目为用户最近一次观看的视频节目,所述第二视频节目为待推荐节目。
在本实施例中,视频节目播放系统能够为用户推荐视频节目。在该视频节目播放系统的内部,预设有包含多个视频节目的视频节目列表,视频节目列表中记载了每个视频节目的片名。
视频播放系统对系统中运行的各个进程进行监听,当监听到视频播放系统中的视频播放程序被调用至前台运行时,表示用户打开了视频播放界面并准备浏览节目列表或准备观看视频节目,因此,该视频播放系统读取列表中可播放的所有视频节目的片名。
特别地,视频播放系统还能够从外部设备中获取或更新视频节目列表。例如,当满足预设的时间间隔时,从云端服务器中获取更新的视频节目列表。
当用户利用视频播放系统观看了一个视频节目后,视频播放系统在获取视频节目列表中各个视频节目的同时,还能够基于用户的播放记录,准确获取该用户最近一次观看的一个视频节目的片名,该视频节目称为第一视频节目。在视频节目列表中,除第一视频节目之外的所有视频节目均为第二视频节目,每个第二视频节目都有可能被推荐至用户,因此称为待推荐节目。
在S102中,获取每个所述视频节目中各节目属性的属性值。
对于视频节目列表中的每个视频节目,可从本地数据库或云端服务器中查询到该视频节目在各个节目属性上所对应的属性值。
作为本发明的一个实施例,所述节目属性包括以下至少一项:
导演属性、演员属性、编剧属性、片名属性、类型属性、国家属性、语言属性以及年份属性。
每个节目属性代表视频节目中的一类基本信息,除了上述列出的八个基本节目属性之外,视频节目的节目属性还可以包括制作人属性、翻译属性、效果属性、公司属性、音乐类型属性、背景年份属性等。
在确定每一个节目属性后,还要获取该节目属性的属性值。
例如,当视频节目《变形金刚》的节目属性为导演属性时,该节目属性的属性值为迈克尔·贝。
优选地,在本实施例中,需要获取上述八个基本节目属性的属性值。在特定需求的场景之下,还可以根据实际所需,获取上述八个基本节目属性之中的一个或多个属性值,或者,获取除上述八个基本节目属性之外的其他节目属性的属性值。
在S103中,根据所述属性值,分别计算所述第一视频节目与每个所述第二视频节目之间的相似度。
对于任意一个第二视频节目,其各个节目属性在第一视频节目中均存在,因此,通过确定第一视频节目与第二视频节目之间每个节目属性的属性值之间的特征差异,可得知第一视频节目与每个第二视频节目的关联程度,以相似度来量化二者之间的关联程度。
作为本发明的一个实施例,图2示出了本发明实施例提供的视频节目推荐方法S103的具体实现流程,详述如下:
在S201中,对于任意一个所述第二视频节目,根据所述属性值,计算该第二视频节目与所述第一视频节目之间相同所述节目属性的属性值相似度。
获取第二视频节目与所述第一视频节目之间相同的一个或多个节目属性,则每个相同的节目属性在第一视频节目与在第二视频节目中的属性值分别称为第一节目属性值以及第二节目属性值。
例如,当第一视频节目与任意一个第二视频节目中的国家属性为相同节目属性,则获取第一视频节目与第二视频节目中该国家属性对应的属性值,如“中国”、“美国”。
若一个第二视频节目与第一视频节目之间相同的节目属性有八个,则存在八个第一节目属性值,分别为A、B、C、D、E、F、G、H,在该第二视频节目中,对应的第二节目属性值也有八个,分别为a、b、c、d、e、f、g、h。
在每个相同属性之间,计算属性值相似度。即判断第一视频节目中第一节目属性值与第二视频节目中第二节目属性值的关联程度。
在上述例子中,计算属性值相似度的过程具体如下:计算A与a的属性值相似度、B与b的属性值相似度、C与c的属性值相似度、D与d的属性值相似度、E与e的属性值相似度、F与f的属性值相似度、G与g的属性值相似度以及F与f的属性值相似度,因此,在每个视频节目中都具有上述八个基本节目属性前提下,对于每个第二视频节目,可得到分别对应第一视频节目中八个属性值的八个属性值相似度。
对于仅为线性相关,而不可向量化的两个属性值而言(如两个年份属性的属性值),如果两个属性值的大小越接近,则其属性值相似度越高。
作为本发明的一个实施例,如图3所示,上述S201具体如下:
在S301中,当相同节目属性为可向量化的节目属性时,对所述相同节目属性分别在所述第一视频节目与该第二视频节目中的所述属性值进行分词处理,以得到每个所述属性值对应的多个分词。
在本实施例中,在上述八个基本节目属性的前提下,第一节目属性值与第二节目属性值是可向量化的相同节目属性的属性值,如导演属性、演员属性、编剧属性、片名属性等。
如果两个属性值之间相同的特征越多,则两个属性值越相关。由于属性值的每个特征可由属性值内部的每个词语来体现,因此,为了提取第一节目属性值中的多个特征,先对属性值进行分词处理。
作为本发明的一个实施例,如图4所示,上述S301具体如下:
在S401中,对于所述相同节目属性分别在所述第一视频节目与该第二视频节目中的每个所述属性值,当该属性值中包含有标点符号时,以所述标点符号为分词拆分点,对该属性值进行分词,以得到该属性值对应的多个分词。
在S402中,当该属性值中未包含有任何标点符号时,获取预设的标准词库中的各个词语。
在S403中,判断该属性值是否包含所述标准词库中的至少一个所述词语;
若该属性值包含所述标准词库中的至少一个所述词语,则将其包含的每个词语作为该属性值对应的多个分词。
即,在本实施例中,对属性值进行分词时,分词过程包括以下两种情况:
情况一:若属性值中包含有标点符号,则直接以所述标点符号为拆分点。当检测到第一个标点符号出现时,以该标点符号之前的所有字符作为一个分词;若确定当前检测到的标点符号为最后一个标点符号,则以该标点符号之后的所有字符作为一个分词;若当前检测到的标点符号并非为最后一个标点符号,则将该标点符号与下一个标点符号之间的所有字符作为一个分词。其中,标点符号包括空格符号。
例如,对于第一视频节目中的演员属性,其属性值为“张涵予、邓超、袁文康、汤嬿、王宝强”,则以该属性值中的顿号“、”为拆分点,从而得到该属性值对应的多个分词为“张涵予”、“邓超”、“袁文康”、“汤嬿”、“王宝强”。
情况二:若属性值中未包含有任何标点符号,则以标准词库中的各个词语为比较对象,若该属性值中包含有标准词库中的词语,则将该词语作为该属性值中的一个分词。由于属性值中的同一个字符可能会匹配标准词库中的不同词语,因此,将该字符匹配的所有词语都记录下来,一并作为该属性值中的分词。
例如,对于第一视频节目中的片名属性,其属性值为“变形金刚”,则应当采用上述情况二中的分词算法。该属性值匹配到标准词库中的词语有“变形金刚”、“金刚”、“变形”,虽然属性值中的两个字符“金刚”匹配到了两个不同的词语(分别为“变形金刚”和“金刚”),但依照该算法的原理中,需要将匹配到的所有词语记录下来,因此,该属性值对应的多个分词应当为“变形金刚”、“金刚”、“变形”。
在S302中,在一个所述属性值对应的多个分词中,对每个所述分词进行排序,并为每个所述分词分配权重,以使排序在前的分词的权重大于或等于排序在后的分词的权重。
作为本发明的一个实施例,图5示出了本发明实施例提供的视频节目推荐方法S302的具体实现流程,详述如下:
在S501中,在一个所述属性值对应的多个分词中,依照每个所述分词在该属性值中出现的先后次序,对各个分词进行排序,以得到分词序列。
在S502中,在所述分词序列中,若存在包含有至少两个相同起始字符的两个分词,则将其中字符长度较大的分词排在字符长度较小的分词前面。
在S503中,依照所述分词的排序顺序,为每个所述分词分配权重,以使排序在前的分词的权重大于或等于排序在后的分词的权重。
在S504中,生成权重列表,所述权重列表包含每个所述分词对应的所述权重。具体地,在本实施例中,依照每个分词在属性值中出现的先后次序,对各个分词进行排序。若两个分词中包含有相同的起始词语,则将其中字符长度较大的分词排在字符长度较小的分词前面。此后,依照各个分词的排序顺序,分配权重。
继续以上述例子中“变形金刚”所对应的多个分词为例,该属性值“变形金刚”对应的多个分词为“变形金刚”、“金刚”和“变形”。由于分词“变形金刚”与“变形”相对于分词“金刚”来说,在属性值“变形金刚”中较先出现,因此,“金刚”的排序为三个分词中的最后一个。并且,分词“变形金刚”与分词“变形”均包含有相同的起始词语,而分词“变形金刚”的字符长度为4个汉字符,比分词“变形”的字符长度长,因此,分词“变形金刚”应当排在“变形”的前面。
根据该排序过程可知,属性值“变形金刚”对应的分词排序序列为{“变形金刚”,“变形”,“金刚”}。此时,为该序列中的各个分词分配一个权重,并且权重的大小依照排序顺序依次递减或保持不变,从而得到对应该排序序列的一个权重列表。
特别地,在本实施例中,当属性值对应的分词个数在五个以内时,依照各个分词的顺序,为每个分词分配的权重依次为5、4、3、2、2,因此,属性值“变形金刚”所对应的权重列表如表1所示:
表1
分词 | 权重 |
变形金刚 | 5 |
变形 | 4 |
金刚 | 3 |
在S303中,在每一个所述属性值中,根据各个所述分词的所述权重,生成该属性值对应的一个特征向量。
具体地,在每一个所述属性值中,根据各个所述分词的所述权重,生成该属性值对应的一个特征向量,所述特征向量中的每个元素值依次为所述权重列表中每个所述分词对应的所述权重。
在本实施例中,以向量化的形式表示第一节目属性值。在上述八个基本节目属性的属性值之中,除了年份属性的属性值外,每个第一节目属性值均能够表示为一个特征向量。以权重列表中每个分词对应的权重作为特征向量中的一个元素值,以每个分词的排序作为特征向量中元素值的排序。因此,在上述例子中,属性值“变形金刚”对应的特征向量为{5,4,3}。
同理,以向量化的形式表示第二节目属性值,可得到第二节目属性值对应的特征向量。
在S304中,计算第一特征向量与第二特征向量之间的余弦相似度,所述第一特征向量与所述第二特征向量为所述相同节目属性在所述第一视频节目与该第二视频节目中的所述属性值所分别对应的所述特征向量。
余弦相似度S的计算公式为:
其中,xa表示第一特征向量的第a个元素值;yb表示第一特征向量的第b个元素值;m、n分别表示第一特征向量、第二特征向量中的元素总数;Sj,k表示满足第一条件的各个xj·k值的总和,第一条件具体为:在第一特性向量中第j个元素值xj对应的分词与第二特性向量中第k个元素值yk对应的分词相同,且j≤n,k≤m。
表2示出了第一节目属性值为“变形金刚Ⅰ”的情况下,该属性值对应的权重列表,表3示出了第二节目属性值为“变形金刚Ⅳ”的情况下,该属性值对应的权重列表。
根据上述权重列表可知,第一特征向量为{5,4,3,2},第二特征向量为{5,4,3,2},且第一特征向量中的第1、2、3个元素分别与第二特征向量中的第1、2、3个元素对应的分词相同,因此,根据上述计算公式可得“变形金刚Ⅰ”与“变形金刚Ⅳ”的余弦相似度为:
在S305中,将所述余弦相似度输出为该第二视频节目与所述第一视频节目之间所述相同节目属性的属性值相似度。
作为本发明的一个实施例,上述S201还包括:
当相同节目属性为不可向量化的节目属性时,通过预设公式计算该第二视频节目与所述第一视频节目之间不可向量化的所述相同节目属性的属性值相似度Sy,所述预设公式包括:
其中,所述a1与所述b1为不可向量化的所述相同节目属性分别在所述第一视频节目与该第二视频节目中的属性值。
在本实施例中,在上述八个基本节目属性的前提下,仅存在年份属性为不可向量化的节目属性。当第一节目属性值与第二节目属性值均为年份属性的属性值时,第一节目属性值与第二节目属性值均为具体的年份数值。
作为本发明的一个实施示例,若第一视频节目为《变形金刚》,第二视频节目为《金刚》,则对于第一视频节目中的年份属性,其属性值a1为2007,对于该第二视频节目中的年份属性,其属性值b2为2006,因此,两个属性值之间的属性值相似度Syear为:
在S202中,将计算得到的各个所述节目属性对应的所述属性值相似度进行加权处理,得到该第二视频节目与所述第一视频节目的相似度。
由于第一视频节目包含有八个第一节目属性值,因此,得到每个第一节目属性值与第二视频节目中对应的第二节目属性值之间的属性值相似度后,需要汇总计算出第一视频节目与第二视频节目之间的一个总的相似度。该相似度Stotal根据如下公式进行计算:
Stotal=Wa*SCasts+Wd*Sdirector+Ww*Swriters+Wt*Stitle
+Wy*Syear+Wg*Sgenres+Wc*Scontury+Wl*Slanguage
其中,SCasts、Sdirector、Swriters、Swriters、Stitle、Syear、Sgenres、Scountry、Slanguage分别表示第一视频节目与第二视频节目在演员属性、导演属性、编剧属性、片名属性、年份属性、类型属性、国家属性以及语言属性中的属性值相似度,Wa、Wd、Ww、Wt、Wy、Wg、Wc以及W1均为加权因子,且满足以下关系:
Wa+Wd+Ww+Wt+Wy+Wg+Wc+Wl=1
在S104中,将所述相似度最大的一个所述第二视频节目输出为推荐节目。
对于视频节目列表中的每一个第二视频节目,均可以根据上述计算原理得出其与第一视频节目之间的相似度。在所有视频节目之中选出相似度最大的一个第二视频节目,将其显示在用户的显示屏中,以作为推荐节目,推荐至该用户。
本发明实施例中,只需根据视频节目中各个节目属性的属性值,就能计算出每个第二视频节目与用户最近一次观看的视频节目之间的相似度,并将相似度最大的第二视频节目作为推荐节目,因此,该推荐节目能够最大程度上地符合用户当前的兴趣爱好,提高了视频节目推荐的准确性。此外,相对于CB算法,由于本发明实施例提供的视频节目推荐方法无须将视频节目的内容转化为具体的结构化数据,因此,降低了计算复杂度以及计算误差出现的可能性,由此提高了节目的推荐效率,满足了用户对节目推荐的实际需求。
应理解,在本发明实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于本发明实施例所提供的视频节目推荐方法,图6示出了本发明实施例提供的视频节目推荐装置的结构框图,该装置可以运行于具有显示屏的终端设备之中,例如手机、平板、笔记本电脑、电视机、计算机,等等。为了便于说明,仅示出了与本实施例相关的部分。
参照图6,该装置包括:
第一获取单元61,用于获取多个视频节目,所述多个视频节目包括第一视频节目以及多个第二视频节目,所述第一视频节目为用户最近一次观看的视频节目,所述第二视频节目为待推荐节目。
第二获取单元62,用于获取每个所述视频节目中各节目属性的属性值。
计算单元63,用于根据所述属性值,分别计算所述第一视频节目与每个所述第二视频节目之间的相似度。
推荐单元64,用于将所述相似度最大的一个所述第二视频节目输出为推荐节目。
可选地,所述节目属性包括以下至少一项:导演属性、演员属性、编剧属性、片名属性、类型属性、国家属性、语言属性以及年份属性。
可选地,所述计算单元63包括:
计算子单元,用于对于任意一个所述第二视频节目,根据所述属性值,计算该第二视频节目与所述第一视频节目之间相同所述节目属性的属性值相似度。
加权子单元,用于将计算得到的各个所述节目属性对应的所述属性值相似度进行加权处理,得到该第二视频节目与所述第一视频节目的相似度。
可选地,所述计算子单元具体用于:
当相同节目属性为可向量化的节目属性时,对所述相同节目属性分别在所述第一视频节目与该第二视频节目中的所述属性值进行分词处理,以得到每个所述属性值对应的多个分词;
在一个所述属性值对应的多个分词中,对每个所述分词进行排序,并为每个所述分词分配权重,以使排序在前的分词的权重大于或等于排序在后的分词的权重;
在每一个所述属性值中,根据各个所述分词的所述权重,生成该属性值对应的一个特征向量;
计算第一特征向量与第二特征向量之间的余弦相似度,所述第一特征向量与所述第二特征向量为所述相同节目属性在所述第一视频节目与该第二视频节目中的所述属性值所分别对应的所述特征向量;
将所述余弦相似度输出为该第二视频节目与所述第一视频节目之间所述相同节目属性的属性值相似度。
可选地,所述计算子单元还用于:
对于所述相同节目属性分别在所述第一视频节目与该第二视频节目中的每个所述属性值,当该属性值中包含有标点符号时,以所述标点符号为分词拆分点,对该属性值进行分词,以得到该属性值对应的多个分词;
当该属性值中未包含有任何标点符号时,获取预设的标准词库中的各个词语;
判断该属性值是否包含所述标准词库中的至少一个所述词语;
若该属性值包含所述标准词库中的至少一个所述词语,则将其包含的每个词语作为该属性值对应的多个分词。
可选地,所述计算子单元还用于:
在一个所述属性值对应的多个分词中,依照每个所述分词在该属性值中出现的先后次序,对各个分词进行排序,以得到分词序列;
在所述分词序列中,若存在包含有至少两个相同起始字符的两个分词,则将其中字符长度较大的分词排在字符长度较小的分词前面;
依照所述分词的排序顺序,为每个所述分词分配权重,以使排序在前的分词的权重大于或等于排序在后的分词的权重;
生成权重列表,所述权重列表包含每个所述分词对应的所述权重。
可选地,所述计算子单元还用于:
在每一个所述属性值中,根据各个所述分词的所述权重,生成该属性值对应的一个特征向量,所述特征向量中的每个元素值依次为所述权重列表中每个所述分词对应的所述权重。
可选地,所述计算子单元具体用于:
当相同节目属性为不可向量化的节目属性时,通过预设公式计算该第二视频节目与所述第一视频节目之间不可向量化的所述相同节目属性的属性值相似度Sy,所述预设公式包括:
其中,所述a1与所述b1为不可向量化的所述相同节目属性分别在所述第一视频节目与该第二视频节目中的属性值。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (16)
1.一种视频节目推荐方法,其特征在于,包括:
获取多个视频节目,所述多个视频节目包括第一视频节目以及多个第二视频节目,所述第一视频节目为用户最近一次观看的视频节目,所述第二视频节目为待推荐节目;
获取每个所述视频节目中各节目属性的属性值;
根据所述属性值,分别计算所述第一视频节目与每个所述第二视频节目之间的相似度;
将所述相似度最大的一个所述第二视频节目输出为推荐节目。
2.如权利要求1所述的方法,其特征在于,所述节目属性包括以下至少一项:
导演属性、演员属性、编剧属性、片名属性、类型属性、国家属性、语言属性以及年份属性。
3.如权利要求1或2所述的方法,其特征在于,所述根据所述属性值,分别计算所述第一视频节目与每个所述第二视频节目之间的相似度包括:
对于任意一个所述第二视频节目,根据所述属性值,计算该第二视频节目与所述第一视频节目之间相同所述节目属性的属性值相似度;
将计算得到的各个所述节目属性对应的所述属性值相似度进行加权处理,得到该第二视频节目与所述第一视频节目的相似度。
4.如权利要求3所述的方法,其特征在于,所述对于任意一个所述第二视频节目,根据所述属性值,计算该第二视频节目与所述第一视频节目之间相同所述节目属性的属性值相似度包括:
当相同节目属性为可向量化的节目属性时,对所述相同节目属性分别在所述第一视频节目与该第二视频节目中的所述属性值进行分词处理,以得到每个所述属性值对应的多个分词;
在一个所述属性值对应的多个分词中,对每个所述分词进行排序,并为每个所述分词分配权重,以使排序在前的分词的权重大于或等于排序在后的分词的权重;
在每一个所述属性值中,根据各个所述分词的所述权重,生成该属性值对应的一个特征向量;
计算第一特征向量与第二特征向量之间的余弦相似度,所述第一特征向量与所述第二特征向量为所述相同节目属性在所述第一视频节目与该第二视频节目中的所述属性值所分别对应的所述特征向量;
将所述余弦相似度输出为该第二视频节目与所述第一视频节目之间所述相同节目属性的属性值相似度。
5.如权利要求4所述的方法,其特征在于,当相同节目属性为可向量化的节目属性时,所述对所述相同节目属性分别在所述第一视频节目与该第二视频节目中的所述属性值进行分词处理,以得到每个所述属性值对应的多个分词包括:
对于所述相同节目属性分别在所述第一视频节目与该第二视频节目中的每个所述属性值,当该属性值中包含有标点符号时,以所述标点符号为分词拆分点,对该属性值进行分词,以得到该属性值对应的多个分词;
当该属性值中未包含有任何标点符号时,获取预设的标准词库中的各个词语;
判断该属性值是否包含所述标准词库中的至少一个所述词语;
若该属性值包含所述标准词库中的至少一个所述词语,则将其包含的每个词语作为该属性值对应的多个分词。
6.如权利要求4所述的方法,其特征在于,所述在一个所述属性值对应的多个分词中,对每个所述分词进行排序,并为每个所述分词分配权重包括:
在一个所述属性值对应的多个分词中,依照每个所述分词在该属性值中出现的先后次序,对各个分词进行排序,以得到分词序列;
在所述分词序列中,若存在包含有至少两个相同起始字符的两个分词,则将其中字符长度较大的分词排在字符长度较小的分词前面;
依照所述分词的排序顺序,为每个所述分词分配权重,以使排序在前的分词的权重大于或等于排序在后的分词的权重;
生成权重列表,所述权重列表包含每个所述分词对应的所述权重。
7.如权利要求6所述的方法,其特征在于,所述在每一个所述属性值中,根据各个所述分词的所述权重,生成该属性值对应的一个特征向量包括:
在每一个所述属性值中,根据各个所述分词的所述权重,生成该属性值对应的一个特征向量,所述特征向量中的每个元素值依次为所述权重列表中每个所述分词对应的所述权重。
8.如权利要求3所述的方法,其特征在于,所述对于任意一个所述第二视频节目,根据所述属性值,计算该第二视频节目与所述第一视频节目之间相同所述节目属性的属性值相似度包括:
当相同节目属性为不可向量化的节目属性时,通过预设公式计算该第二视频节目与所述第一视频节目之间不可向量化的所述相同节目属性的属性值相似度Sy,所述预设公式包括:
其中,所述a1与所述b1为不可向量化的所述相同节目属性分别在所述第一视频节目与该第二视频节目中的属性值。
9.一种视频节目推荐装置,其特征在于,包括:
第一获取单元,用于获取多个视频节目,所述多个视频节目包括第一视频节目以及多个第二视频节目,所述第一视频节目为用户最近一次观看的视频节目,所述第二视频节目为待推荐节目;
第二获取单元,用于获取每个所述视频节目中各节目属性的属性值;
计算单元,用于根据所述属性值,分别计算所述第一视频节目与每个所述第二视频节目之间的相似度;
推荐单元,用于将所述相似度最大的一个所述第二视频节目输出为推荐节目。
10.如权利要求9所述的装置,其特征在于,所述节目属性包括以下至少一项:导演属性、演员属性、编剧属性、片名属性、类型属性、国家属性、语言属性以及年份属性。
11.如权利要求9或10所述的装置,其特征在于,所述计算单元包括:
计算子单元,用于对于任意一个所述第二视频节目,根据所述属性值,计算该第二视频节目与所述第一视频节目之间相同所述节目属性的属性值相似度;
加权子单元,用于将计算得到的各个所述节目属性对应的所述属性值相似度进行加权处理,得到该第二视频节目与所述第一视频节目的相似度。
12.如权利要求11所述的装置,其特征在于,所述计算子单元具体用于:
当相同节目属性为可向量化的节目属性时,对所述相同节目属性分别在所述第一视频节目与该第二视频节目中的所述属性值进行分词处理,以得到每个所述属性值对应的多个分词;
在一个所述属性值对应的多个分词中,对每个所述分词进行排序,并为每个所述分词分配权重,以使排序在前的分词的权重大于或等于排序在后的分词的权重;
在每一个所述属性值中,根据各个所述分词的所述权重,生成该属性值对应的一个特征向量;
计算第一特征向量与第二特征向量之间的余弦相似度,所述第一特征向量与所述第二特征向量为所述相同节目属性在所述第一视频节目与该第二视频节目中的所述属性值所分别对应的所述特征向量;
将所述余弦相似度输出为该第二视频节目与所述第一视频节目之间所述相同节目属性的属性值相似度。
13.如权利要求12所述的装置其特征在于,所述计算子单元还用于:
对于所述相同节目属性分别在所述第一视频节目与该第二视频节目中的每个所述属性值,当该属性值中包含有标点符号时,以所述标点符号为分词拆分点,对该属性值进行分词,以得到该属性值对应的多个分词;
当该属性值中未包含有任何标点符号时,获取预设的标准词库中的各个词语;
判断该属性值是否包含所述标准词库中的至少一个所述词语;
若该属性值包含所述标准词库中的至少一个所述词语,则将其包含的每个词语作为该属性值对应的多个分词。
14.如权利要求12所述的装置,其特征在于,所述计算子单元还用于:
在一个所述属性值对应的多个分词中,依照每个所述分词在该属性值中出现的先后次序,对各个分词进行排序,以得到分词序列;
在所述分词序列中,若存在包含有至少两个相同起始字符的两个分词,则将其中字符长度较大的分词排在字符长度较小的分词前面;
依照所述分词的排序顺序,为每个所述分词分配权重,以使排序在前的分词的权重大于或等于排序在后的分词的权重;
生成权重列表,所述权重列表包含每个所述分词对应的所述权重。
15.如权利要求14所述的装置,其特征在于,所述计算子单元还用于:
在每一个所述属性值中,根据各个所述分词的所述权重,生成该属性值对应的一个特征向量,所述特征向量中的每个元素值依次为所述权重列表中每个所述分词对应的所述权重。
16.如权利要求11所述的装置,其特征在于,所述计算子单元具体用于:
当相同节目属性为不可向量化的节目属性时,通过预设公式计算该第二视频节目与所述第一视频节目之间不可向量化的所述相同节目属性的属性值相似度Sy,所述预设公式包括:
其中,所述a1与所述b1为不可向量化的所述相同节目属性分别在所述第一视频节目与该第二视频节目中的属性值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611199886.2A CN106686460B (zh) | 2016-12-22 | 2016-12-22 | 一种视频节目推荐方法及视频节目推荐装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611199886.2A CN106686460B (zh) | 2016-12-22 | 2016-12-22 | 一种视频节目推荐方法及视频节目推荐装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106686460A true CN106686460A (zh) | 2017-05-17 |
CN106686460B CN106686460B (zh) | 2020-03-13 |
Family
ID=58871391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611199886.2A Active CN106686460B (zh) | 2016-12-22 | 2016-12-22 | 一种视频节目推荐方法及视频节目推荐装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106686460B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109783687A (zh) * | 2018-11-22 | 2019-05-21 | 广州市易杰数码科技有限公司 | 一种基于图结构的推荐方法、装置、设备及存储介质 |
CN109800326A (zh) * | 2019-01-24 | 2019-05-24 | 广州虎牙信息科技有限公司 | 一种视频处理方法、装置、设备和存储介质 |
CN109978580A (zh) * | 2017-12-28 | 2019-07-05 | 北京京东尚科信息技术有限公司 | 对象推荐方法、装置以及计算机可读存储介质 |
CN110598045A (zh) * | 2019-09-06 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 视频推荐方法、装置 |
CN110798718A (zh) * | 2019-09-02 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 一种视频推荐方法以及装置 |
CN111294610A (zh) * | 2020-02-20 | 2020-06-16 | 北京奇艺世纪科技有限公司 | 一种视频处理方法及装置 |
CN111931678A (zh) * | 2020-08-21 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 一种视频信息处理方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010266959A (ja) * | 2009-05-12 | 2010-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 推薦番組算出装置、推薦番組算出方法及びコンピュータプログラム |
CN101963974A (zh) * | 2010-09-03 | 2011-02-02 | 深圳创维数字技术股份有限公司 | 一种epg栏目生成方法 |
CN104410913A (zh) * | 2014-12-01 | 2015-03-11 | 北京国双科技有限公司 | 用于智能视频设备的电视节目推荐方法及装置 |
CN105812937A (zh) * | 2014-12-30 | 2016-07-27 | Tcl集团股份有限公司 | 一种电视节目推荐方法和电视节目推荐装置 |
-
2016
- 2016-12-22 CN CN201611199886.2A patent/CN106686460B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010266959A (ja) * | 2009-05-12 | 2010-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 推薦番組算出装置、推薦番組算出方法及びコンピュータプログラム |
CN101963974A (zh) * | 2010-09-03 | 2011-02-02 | 深圳创维数字技术股份有限公司 | 一种epg栏目生成方法 |
CN104410913A (zh) * | 2014-12-01 | 2015-03-11 | 北京国双科技有限公司 | 用于智能视频设备的电视节目推荐方法及装置 |
CN105812937A (zh) * | 2014-12-30 | 2016-07-27 | Tcl集团股份有限公司 | 一种电视节目推荐方法和电视节目推荐装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109978580A (zh) * | 2017-12-28 | 2019-07-05 | 北京京东尚科信息技术有限公司 | 对象推荐方法、装置以及计算机可读存储介质 |
CN109783687A (zh) * | 2018-11-22 | 2019-05-21 | 广州市易杰数码科技有限公司 | 一种基于图结构的推荐方法、装置、设备及存储介质 |
CN109783687B (zh) * | 2018-11-22 | 2023-05-30 | 广州市易杰数码科技有限公司 | 一种基于图结构的推荐方法、装置、设备及存储介质 |
CN109800326A (zh) * | 2019-01-24 | 2019-05-24 | 广州虎牙信息科技有限公司 | 一种视频处理方法、装置、设备和存储介质 |
CN110798718A (zh) * | 2019-09-02 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 一种视频推荐方法以及装置 |
CN110798718B (zh) * | 2019-09-02 | 2021-10-08 | 腾讯科技(深圳)有限公司 | 一种视频推荐方法以及装置 |
CN110598045A (zh) * | 2019-09-06 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 视频推荐方法、装置 |
CN111294610A (zh) * | 2020-02-20 | 2020-06-16 | 北京奇艺世纪科技有限公司 | 一种视频处理方法及装置 |
CN111294610B (zh) * | 2020-02-20 | 2022-03-08 | 北京奇艺世纪科技有限公司 | 一种视频处理方法及装置 |
CN111931678A (zh) * | 2020-08-21 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 一种视频信息处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106686460B (zh) | 2020-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106686460A (zh) | 一种视频节目推荐方法及视频节目推荐装置 | |
CN107330750B (zh) | 一种推荐产品配图方法及装置,电子设备 | |
US20210191509A1 (en) | Information recommendation method, device and storage medium | |
CN104965889B (zh) | 内容推荐方法及装置 | |
US9864747B2 (en) | Content recommendation device, recommended content search method, and program | |
CN106326391B (zh) | 多媒体资源推荐方法及装置 | |
CN108182621A (zh) | 商品推荐方法及商品推荐装置、设备和存储介质 | |
KR20230087622A (ko) | 스트리밍 비디오 내의 객체를 검출하고, 필터링하고 식별하기 위한 방법 및 장치 | |
CN107894998B (zh) | 视频推荐方法及装置 | |
CN100442284C (zh) | 用于按类别提供关键字输入频率信息的搜索系统及其方法 | |
CN108334592B (zh) | 一种基于内容与协同过滤相结合的个性化推荐方法 | |
CN109829108B (zh) | 信息推荐方法、装置、电子设备及可读存储介质 | |
CN104199898B (zh) | 一种属性信息的获取方法及装置、推送方法及装置 | |
CN107632984A (zh) | 一种聚类数据表的展现方法、装置和系统 | |
US8832134B2 (en) | Method, system and controller for searching a database contaning data items | |
CN103646341B (zh) | 一种网站提供对象的推荐方法和装置 | |
JP2005165632A (ja) | 情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法 | |
CN108228844A (zh) | 一种图片筛选方法及装置、存储介质、计算机设备 | |
JP2008117222A (ja) | 情報処理装置および方法、並びにプログラム | |
CN104915440B (zh) | 一种商品排重方法和系统 | |
CN107665221A (zh) | 关键词的分类方法和装置 | |
CN108122126B (zh) | 关联规则的扩充方法、应用其的装置及电脑可读取介质 | |
CN106776863A (zh) | 文本相关度的确定方法、查询结果的推送方法及装置 | |
CN110134783A (zh) | 个性化推荐的方法、装置、设备和介质 | |
CN105718566A (zh) | 一种智能音乐推荐系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 518000 Guangdong city of Shenzhen province Nanshan District Guangdong streets Gao Xin Road No. 016 three storey building on the east side of Lenovo Applicant after: Excellent network Co., Ltd. Address before: 518000 Guangdong city of Shenzhen province Nanshan District Guangdong streets Gao Xin Road No. 016 three storey building on the east side of Lenovo Applicant before: UT Starcom (Shenzhen) Technology Co., Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant |