CN105357583B - 一种发现智能电视用户兴趣偏好的方法和装置 - Google Patents
一种发现智能电视用户兴趣偏好的方法和装置 Download PDFInfo
- Publication number
- CN105357583B CN105357583B CN201510675280.0A CN201510675280A CN105357583B CN 105357583 B CN105357583 B CN 105357583B CN 201510675280 A CN201510675280 A CN 201510675280A CN 105357583 B CN105357583 B CN 105357583B
- Authority
- CN
- China
- Prior art keywords
- video
- user
- node
- content
- tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4662—Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
- H04N21/4665—Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms involving classification methods, e.g. Decision trees
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种发现智能电视用户兴趣偏好的方法和装置,以帮助智能电视服务提供商精准地向智能电视用户推荐其感兴趣的内容。所述方法包括:针对每个智能电视用户构建一棵用户偏好内容树,所述用户偏好内容树的节点对应一个视频内容类型及其描述向量;对于用户偏好内容树的叶子节点,采用聚类算法对所述用户偏好内容树的视频内容进行聚类或者重新分类;重构建所述经过聚类或者重新分类的用户偏好内容树。本发明提供的技术方案无需任何先验性的假设即可让智能电视服务提供商发掘智能电视用户的潜在兴趣和偏好,帮助智能电视服务提供商找到有类似偏好的用户,有利于智能电视服务提供商精准地向智能电视用户推荐其感兴趣的内容,提高服务的品质。
Description
技术领域
本发明属于智能电视领域,尤其涉及一种发现智能电视用户兴趣偏好的方法和装置。
背景技术
随着智能电视内容的愈加丰富,用户需要更精确的、个性化的信息获取手段,从而获得更好的智能电视使用体验和优质的服务质量。为了达到该目的,智能电视服务提供商需要对智能电视用户的兴趣偏好进行发现。这种发现不仅要尽可能覆盖到智能电视用户的所有行为,并且越精确越好。如此,当新的信息到达时,例如,新片上映时,智能电视提供商可以快速地判断智能电视用户对该信息是否感兴趣。若判断智能电视用户对该信息感兴趣,则可以将该信息优先推荐给智能电视用户,否则,过滤掉该信息,从而帮助智能电视用户从海量信息资源中解脱出来,寻找到自己想要的资源。
然而,目前业界尚无一种技术方案能够如上所述发现智能电视用户兴趣偏好。
发明内容
本发明的目的在于提供发现智能电视用户兴趣偏好的方法和装置,以帮助智能电视服务提供商精准地向智能电视用户推荐其感兴趣的内容。
本发明第一方面提供一种发现智能电视用户兴趣偏好的方法,所述方法包括:
针对每个智能电视用户构建一棵用户偏好内容树,所述用户偏好内容树的节点对应一个视频内容类型及其描述向量;
对于用户偏好内容树的叶子节点,采用聚类算法对所述用户偏好内容树的视频内容进行聚类或者重新分类;
重构建所述经过聚类或者重新分类的用户偏好内容树。
本发明第二方面提供一种发现智能电视用户兴趣偏好的装置,所述装置包括:
内容树构建模块,用于针对每个智能电视用户构建一棵用户偏好内容树,所述用户偏好内容树的节点对应一个视频内容类型及其描述向量;
节点处理模块,用于对于用户偏好内容树的叶子节点,采用聚类算法对所述用户偏好内容树的视频内容进行聚类或者重新分类;
内容树重构建模块,用于重构建所述经过聚类或者重新分类的用户偏好内容树。
从上述本发明技术方案可知,在构建好智能电视用户的用户偏好内容树之后,对于用户偏好内容树的叶子节点,对用户偏好内容树的视频内容进行聚类或者重新分类,并重构建所述经过聚类或者重新分类的用户偏好内容树,即,对用户兴趣进行层次化的组织,可以在不同层次对智能终端用户的兴趣偏好进行抽象表示。因此,本发明提供的技术方案无需任何先验性的假设即可让智能电视服务提供商发掘智能电视用户的潜在兴趣和偏好,帮助智能电视服务提供商找到有类似偏好的用户,有利于智能电视服务提供商精准地向智能电视用户推荐其感兴趣的内容,提高服务的品质。
附图说明
图1是本发明实施例一提供的发现智能电视用户兴趣偏好的方法的实现流程示意图;
图2是本发明实施例二提供的用户偏好内容树示意图;
图3是本发明实施例三提供的发现智能电视用户兴趣偏好的装置的结构示意图;
图4是本发明实施例四提供的发现智能电视用户兴趣偏好的装置的结构示意图;
图5是本发明实施例五提供的发现智能电视用户兴趣偏好的装置的结构示意图;
图6是本发明实施例六提供的发现智能电视用户兴趣偏好的装置的结构示意图;
图7是本发明实施例七提供的发现智能电视用户兴趣偏好的装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提供一种发现智能电视用户兴趣偏好的方法,所述方法包括:针对每个智能电视用户构建一棵用户偏好内容树,所述用户偏好内容树的节点对应一个视频内容类型及其描述向量;当所述智能电视用户观看了新的视频时,采用聚类算法对所述用户偏好内容树的视频内容进行聚类或者重新分类;重构建所述经过聚类或者重新分类的用户偏好内容树。本发明实施例还提供相应的发现智能电视用户兴趣偏好的装置。以下分别进行详细说明。
请参阅附图1,是本发明实施例一提供的发现智能电视用户兴趣偏好的方法的实现流程示意图,主要包括以下步骤S101至步骤S103:
S101,针对每个智能电视用户构建一棵用户偏好内容树,所述用户偏好内容树的节点对应一个视频内容类型及其描述向量。
对于智能电视用户观看的视频内容,其一般包括视频内容类型(例如电影、动作、喜剧等)、视频内容的导演、演员、年代和视频简介等内容。这些数据有些是数值型数据,例如,视频年代等,也有些是非数值型数据,例如视频的类型(“纪录片”,“历史”)等。对于这两种类型的数据,本发明都将其作为单词来处理,每个单词赋有一个权重来标识该单词对描述视频的重要程度,类似于文本挖掘的逆文档频率。具体而言,本发明采用的视频编码方案如下:假定某视频内容可以取k个值来描述,以《捉妖记》为例,假定《捉妖记》的视频描述如下:<2015,白百合,动作,奇幻,孕妇,喜剧,天师,妖王>,那么k=8。对于某些特定的单词,例如年代,其权重由建模者根据模型调整指定,而视频内容的描述词,则根据视频简介和评价,基于逆文档频率来计算。计算方式如下:假如视频简介的总词语数是100个,而词语“妖王”出现过8次,那么“妖王”一词在该视频简介文件中的词频就是8/100即0.08。进一步地,如果“妖王”一词在10份文件(例如影评、简介等数据)出现过,而文件总数是100份的话,其文件频率就是10/100即0.1。最后,TF-IDF分数就可以由计算词频除以文件频率而得到。以上面的例子而言,“妖王”一词在该文件集的TF-IDF分数是0.08/0.1即0.8。
根据上述介绍的计算方法,视频特征向量最终可描述为:
ci=<(d1,w1),...,(dj,wj),...,(dk,wk)>
其中,dj为单词,wj表示单词dj在视频ci的权重。视频的特征向量构建完毕以后,作为用户偏好内容树输入数据,输出数据为一棵用户偏好内容树,从而来建模智能电视用户的收视兴趣和偏好。在本发明实施例中,用户偏好内容树为一个层次架构,内部节点表示一个抽象概念,可以理解成一个视频内容类型及其描述向量。该内部节点的分支下面的视频内容均属于该内部节点对应的视频内容类型。例如,某个节点对应的视频内容类型及其描述向量为描述连续剧的,那么韩剧、美剧等内容均属于该节点的子节点。用户偏好内容树的根节点表示该树最一般的特征抽象概念,随着树的增长,越是下面的节点表示的内容范围越小,而叶子节点一般表示视频内容本身。附图2是本发明实施例提供的用户偏好内容树示意图,用户偏好内容树中包含多个视频内容,表示为s=(s1,s2,...,sn),这些视频内容是由算法逐步生成的,每条视频内容可以看作一个视频内容类型。例如,算法发现了一个视频内容为s体育,那么这个视频内容就有一个类似于视频特征向量的描述向量s体育=<(体育,0.5),(得分,0.2),(团队,0.3)>。在附图2是示例的用户偏好内容树中,除了s体育之外,还有一个视频内容为综艺,描述为s综艺=<(综艺,0.6),(主持人,0.2),(湖南卫视,0.2)>。其他的视频内容类型,例如财经等,不属于这两种类型,则用另外的分支来表示。在体育这一视频内容类型的分支下面,还有冰上运动、乒乓球等分支表示的视频内容类型,用以更精确地描述智能电视用户的喜好,以此类推形成整个用户偏好内容树。
作为本发明一个实施例,针对每个智能电视用户构建一棵用户偏好内容树可以通过如下步骤S1011至S1013得到:
S1011,智能电视用户每观看一个视频,则判断智能电视用户观看的视频是否属于用户偏好内容树的节点N1对应的视频内容类型。
在本发明实施例中,当智能电视用户观看了一个视频时,将该视频相关信息编码成前述实施例提及的视频特征向量格式,然后作为输入数据输入到算法中,每遇到一个用户偏好内容树节点,则判断智能电视用户观看的视频是否属于用户偏好内容树的节点N1对应的视频内容类型。
作为本发明一个实施例,判断智能电视用户观看的视频是否属于用户偏好内容树的节点N1对应的视频内容类型可通过如下步骤S1和S2实现:
S1,将智能电视用户观看的视频的相关信息输入二元分类器得到视频所属类型的概率。
在本发明实施例中,用户偏好内容树每个节点对应着一个二元分类器,该分类器决定视频内容是否属于该分类。作为本发明一个实施例,二元分类器可以是朴素贝叶斯分类器,朴素贝叶斯分类器在不同的层次和不同的节点采用的分类特征也不相同。朴素贝叶斯分类器可以简单定义为贝叶斯函数,该函数定义为CSVi:c→[0,1],对于任何给定的视频的相关信息向量c作为输入,输出该视频属于节点i的概率CSVi(c)。
S2,若二元分类器输出的概率大于预设阈值,则确定智能电视用户观看的视频属于用户偏好内容树的节点N1对应的视频内容类型。
具体地,对于预设阈值α,若CSVi(c)>α,则确定智能电视用户观看的视频属于用户偏好内容树的节点N1对应的视频内容类型。若对于智能电视用户观看的视频的相关信息,作为各个二元分类器的输入,没有一个二元分类器输出的概率大于预设阈值,则确定智能电视用户观看的视频不属于任何一个视频内容分类。
需要说明的是,由于用户偏好内容树可能存在多个节点,对于这些节点,可能存在几个节点,其二元分类器输出的概率均大于预设阈值α。此时,就按照这些节点对应的二元分类器输出的概率哪个最大,就确定智能电视用户观看的视频属于用户偏好内容树的该节点。例如,对于用户偏好内容树的节点N2、N5和N9,若对应二元分类器输出的概率CSV2(c)、CSV5(c)和CSV9(c)均大于预设阈值α,则进一步比较,CSV2(c)、CSV5(c)和CSV9(c)。若经过比较,CSV5(c)最大,则确定智能电视用户观看的视频属于用户偏好内容树的节点N5。
进一步地,当智能电视用户观看的一个新视频的描述向量添加到某个节点以后,需要更新该节点对应的视频内容类型的描述和权值,其计算方式如下:
其中,每个单词为不同视频内容单词的汇总,权值为单词权值的平均值。
S1012,若智能电视用户观看的视频属于用户偏好内容树的节点N1对应的视频内容类型,则将智能电视用户观看的视频加入用户偏好内容树的节点N1。
S1013,若智能电视用户观看的视频不属于用户偏好内容树的节点N1对应的视频内容类型,则继续判断是否属于用户偏好内容树其他节点对应的视频内容类型,直至观看的视频成为用户偏好内容树的叶子节点。
S102,对于用户偏好内容树的叶子节点,采用聚类算法对用户偏好内容树的视频内容进行聚类或者重新分类。
作为本发明一个实施例,对于用户偏好内容树的叶子节点,采用聚类算法对用户偏好内容树的视频内容进行聚类或者重新分类可以包括如下步骤S1021至步骤S1024:
S1021,计算智能电视用户所观看新视频与各个视频内容类型的相似度。
在本发明实施例中,可以按照余弦相似度计算视频内容向量与各个视频内容类型质心之间的距离,从而计算智能电视用户所观看新视频与各个视频内容类型的相似度,余弦相似度计算公式如下:
S1022,若智能电视用户所观看新视频与某个视频内容类型的相似度小于预设相似度阈值,则将智能电视用户所观看新视频形成新的聚类,否则,将智能电视用户所观看新视频聚类至所述某个视频内容类型。
S1023,将智能电视用户所观看新视频聚类至所述某个视频内容类型后,评估所述聚类后的某个视频内容类型的凝聚度。
当一个新的视频内容到达并加入到某一聚类时,需要重新评估该聚类的凝聚度,以确定是否要分裂该聚类,从而形成新的视频内容类型。在本发明实施例中,可按照如下公式
评估聚类后的某个视频内容类型的凝聚度。
S1024,若聚类后的某个视频内容类型的凝聚度小于预设凝聚度阈值,则将所述聚类后的某个视频内容的类型重新分类。
S103,重构建经过聚类或者重新分类的用户偏好内容树。
在本发明实施例中,经过聚类或者重新分类的用户偏好内容树,可以对其进行重构建,以更好地反映智能电视用户的兴趣偏好。
作为本发明一个实施例,重构建经过聚类或者重新分类的用户偏好内容树可根据需要,通过如下方式中的任何一种方式进行:
方式一:计算智能电视用户观看的新视频与其父节点和祖父节点的相似度,若智能电视用户观看的新视频与其祖父节点的相似度高于智能电视用户观看的新视频与其父节点的相似度,则将观看的新视频提升至其祖父节点所在的层,其中,智能电视用户观看的新视频与其父节点或祖父节点的相似度计算公式如下:
overlap(ci,cj)=|f(ci)∩f(cj)|。
方式二:计算智能电视用户观看的新视频与各个视频内容类型的相似度,若智能电视用户观看的新视频与某个视频内容类型的相似度大于预设相似度阈值,则将智能电视用户观看的新视频融合至所述某个视频内容类型。
方式二计算智能电视用户观看的新视频与各个视频内容类型的相似度,其方法已经在前述实施例的步骤S1021提及,此处不做赘述。
方式三:计算智能电视用户所观看的新视频所属视频内容类型的凝聚度,若智能电视用户所观看的新视频所属视频内容类型的凝聚度小于预设凝聚度阈值,则将智能电视用户所观看的新视频所属视频内容类型重新分类。
方式三中,智能电视用户所观看的新视频所属视频内容类型的凝聚度的计算方法以及将智能电视用户所观看的新视频所属视频内容类型重新分类,已在前述实施例的步骤S1023中做过说明,此处不做赘述。
从上述附图1示例的发现智能电视用户兴趣偏好的方法可知,在构建好智能电视用户的用户偏好内容树之后,对于用户偏好内容树的叶子节点,对用户偏好内容树的视频内容进行聚类或者重新分类,并重构建所述经过聚类或者重新分类的用户偏好内容树,即,对用户兴趣进行层次化的组织,可以在不同层次对智能终端用户的兴趣偏好进行抽象表示。因此,本发明提供的技术方案无需任何先验性的假设即可让智能电视服务提供商发掘智能电视用户的潜在兴趣和偏好,帮助智能电视服务提供商找到有类似偏好的用户,有利于智能电视服务提供商精准地向智能电视用户推荐其感兴趣的内容,提高服务的品质。
请参阅附图3,是本发明实施例三提供的发现智能电视用户兴趣偏好的装置的结构示意图。为了便于说明,附图3仅示出了与本发明实施例相关的部分。附图3示例的发现智能电视用户兴趣偏好的装置可以是附图1示例的发现智能电视用户兴趣偏好的方法的执行主体。附图3示例二的发现智能电视用户兴趣偏好的装置主要包括内容树构建模块301、节点处理模块302和内容树重构建模块303,其中:
内容树构建模块301,用于针对每个智能电视用户构建一棵用户偏好内容树,其中,用户偏好内容树的节点对应一个视频内容类型及其描述向量;
节点处理模块302,用于对于用户偏好内容树的叶子节点,采用聚类算法对用户偏好内容树的视频内容进行聚类或者重新分类;
内容树重构建模块303,用于重构建经过节点处理模块302聚类或者重新分类的用户偏好内容树。
需要说明的是,以上附图3示例的发现智能电视用户兴趣偏好的装置的实施方式中,各功能模块的划分仅是举例说明,实际应用中可以根据需要,例如相应硬件的配置要求或者软件的实现的便利考虑,而将上述功能分配由不同的功能模块完成,即将所述发现智能电视用户兴趣偏好的装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。而且,实际应用中,本实施例中的相应的功能模块可以是由相应的硬件实现,也可以由相应的硬件执行相应的软件完成,例如,前述的内容树构建模块,可以是具有执行前述针对每个智能电视用户构建一棵用户偏好内容树,所述用户偏好内容树的节点对应一个视频内容类型及其描述向量的硬件,例如内容树构建器,也可以是能够执行相应计算机程序从而完成前述功能的一般处理器或者其他硬件设备;再如前述的节点处理模块,可以是执行对于用户偏好内容树的叶子节点,采用聚类算法对用户偏好内容树的视频内容进行聚类或者重新分类的硬件,例如节点处理器,也可以是能够执行相应计算机程序从而完成前述功能的一般处理器或者其他硬件设备(本说明书提供的各个实施例都可应用上述描述原则)。
附图3示例的内容树构建模块301可以包括第一判断单元401、节点加入单元402和第二判断单元403,如附图4所示本发明实施例四提供的发现智能电视用户兴趣偏好的装置,其中:
第一判断单元401,用于智能电视用户每观看一个视频时,判断智能电视用户观看的视频是否属于用户偏好内容树的节点N1对应的视频内容类型;
节点加入单元402,用于若智能电视用户观看的视频属于用户偏好内容树的节点N1对应的视频内容类型,则将智能电视用户观看的视频加入用户偏好内容树的节点N1;
第二判断单元403,用于若智能电视用户观看的视频不属于用户偏好内容树的节点N1对应的视频内容类型,则继续判断是否属于用户偏好内容树其他节点对应的视频内容类型,直至智能电视用户观看的视频成为用户偏好内容树的叶子节点。
附图4示例的第一判断单元401可以包括概率计算单元501和确定单元502,如附图5所示本发明实施例五提供的发现智能电视用户兴趣偏好的装置,其中:
概率计算单元501,用于将智能电视用户观看的视频的相关信息输入二元分类器得到视频所属类型的概率;
确定单元502,用于若概率计算单元501得到的概率大于预设阈值,则确定智能电视用户观看的视频属于用户偏好内容树的节点N1对应的视频内容类型。
附图3示例的节点处理模块302可以包括第一计算单元601、聚类单元602、凝聚度评估单元603和重分类单元604,如附图6所示本发明实施例六提供的发现智能电视用户兴趣偏好的装置,其中:
第一计算单元601,用于计算智能电视用户所观看新视频与各个视频内容类型的相似度;
聚类单元602,用于若智能电视用户所观看新视频与某个视频内容类型的相似度小于预设相似度阈值,则将智能电视用户所观看新视频形成新的聚类,否则,将智能电视用户所观看新视频聚类至所述某个视频内容类型;
凝聚度评估单元603,用于将智能电视用户所观看新视频聚类至所述某个视频内容类型后,评估聚类后的某个视频内容类型的凝聚度;
重分类单元604,用于若所述聚类后的某个视频内容类型的凝聚度小于预设凝聚度阈值,则将所述聚类后的某个视频内容的类型重新分类。
附图3示例的内容树重构建模块303可以包括提升单元701、融合单元702或分裂单元703,如附图7所示本发明实施例七提供的发现智能电视用户兴趣偏好的装置,其中:
提升单元701,用于计算智能电视用户观看的新视频与其父节点和祖父节点的相似度,若智能电视用户观看的新视频与其祖父节点的相似度高于所述智能电视用户观看的新视频与其父节点的相似度,则将智能电视用户观看的新视频提升至其祖父节点所在的层;
融合单元702,用于计算智能电视用户观看的新视频与各个视频内容类型的相似度,若智能电视用户观看的新视频与某个视频内容类型的相似度大于预设相似度阈值,则将智能电视用户观看的新视频融合至所述某个视频内容类型;或者
分裂单元703,用于计算智能电视用户观看的新视频所属视频内容类型的凝聚度,若智能电视用户观看的新视频所属视频内容类型的凝聚度小于预设凝聚度阈值,则将智能电视用户观看的新视频所属视频内容类型重新分类。
需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
以上对本发明实施例所提供的发现智能电视用户兴趣偏好的方法和装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种发现智能电视用户兴趣偏好的方法,其特征在于,所述方法包括:
针对每个智能电视用户构建一棵用户偏好内容树,所述用户偏好内容树的节点对应一个视频内容类型及其描述向量;
对于所述用户偏好内容树的叶子节点,采用聚类算法对所述用户偏好内容树的视频内容进行聚类或者重新分类;
重构建所述经过聚类或者重新分类的用户偏好内容树;
所述对于所述用户偏好内容树的叶子节点,采用聚类算法对所述用户偏好内容树的视频内容进行聚类或者重新分类,包括:
计算所述智能电视用户所观看新视频与各个视频内容类型的相似度;
若所述新视频与某个视频内容类型的相似度小于预设相似度阈值,则将所述新视频形成新的聚类,否则,将所述新视频聚类至所述某个视频内容类型;
将所述新视频聚类至所述某个视频内容类型后,评估所述聚类后的某个视频内容类型的凝聚度;
若所述聚类后的某个视频内容类型的凝聚度小于预设凝聚度阈值,则将所述聚类后的某个视频内容的类型重新分类。
2.如权利要求1所述的方法,其特征在于,所述针对每个智能电视用户构建一棵用户偏好内容树,包括:
所述智能电视用户每观看一个视频,则判断所述观看的视频是否属于所述用户偏好内容树的节点N1对应的视频内容类型;
若所述观看的视频属于所述用户偏好内容树的节点N1对应的视频内容类型,则将所述观看的视频加入所述用户偏好内容树的节点N1;
若所述观看的视频不属于所述用户偏好内容树的节点N1对应的视频内容类型,则继续判断是否属于所述用户偏好内容树其他节点对应的视频内容类型,直至所述观看的视频成为所述用户偏好内容树的叶子节点。
3.如权利要求2所述的方法,其特征在于,所述判断所述观看的视频是否属于所述用户偏好内容树的节点N1对应的视频内容类型,包括:
将所述观看的视频的相关信息输入二元分类器得到视频所属类型的概率;
若所述概率大于预设阈值,则确定所述观看的视频属于所述用户偏好内容树的节点N1对应的视频内容类型。
4.如权利要求1所述的方法,其特征在于,所述重构建所述经过聚类或者重新分类的用户偏好内容树,包括:
计算所述智能电视用户观看的新视频与其父节点和祖父节点的相似度,若所述智能电视用户观看的新视频与其祖父节点的相似度高于所述智能电视用户观看的新视频与其父节点的相似度,则将所述观看的新视频提升至其祖父节点所在的层;或者
计算所述新视频与各个视频内容类型的相似度,若所述新视频与某个视频内容类型的相似度大于预设相似度阈值,则将所述新视频融合至所述某个视频内容类型;或者
计算所述新视频所属视频内容类型的凝聚度,若所述凝聚度小于预设凝聚度阈值,则将所述新视频所属视频内容类型重新分类。
5.一种发现智能电视用户兴趣偏好的装置,其特征在于,所述装置包括:
内容树构建模块,用于针对每个智能电视用户构建一棵用户偏好内容树,所述用户偏好内容树的节点对应一个视频内容类型及其描述向量;
节点处理模块,用于对于所述用户偏好内容树的叶子节点,采用聚类算法对所述用户偏好内容树的视频内容进行聚类或者重新分类;
内容树重构建模块,用于重构建所述经过聚类或者重新分类的用户偏好内容树;
所述节点处理模块包括:
第一计算单元,用于计算所述智能电视用户所观看新视频与各个视频内容类型的相似度;
聚类单元,用于若所述新视频与某个视频内容类型的相似度小于预设相似度阈值,则将所述新视频形成新的聚类,否则,将所述新视频聚类至所述某个视频内容类型;
凝聚度评估单元,用于将所述新视频聚类至所述某个视频内容类型后,评估所述聚类后的某个视频内容类型的凝聚度;
重分类单元,用于若所述聚类后的某个视频内容类型的凝聚度小于预设凝聚度阈值,则将所述聚类后的某个视频内容的类型重新分类。
6.如权利要求5所述的装置,其特征在于,所述内容树构建模块包括:
第一判断单元,用于所述智能电视用户每观看一个视频时,判断所述观看的视频是否属于所述用户偏好内容树的节点N1对应的视频内容类型;
节点加入单元,用于若所述观看的视频属于所述用户偏好内容树的节点N1对应的视频内容类型,则将所述观看的视频加入所述用户偏好内容树的节点N1;
第二判断单元,用于若所述观看的视频不属于所述用户偏好内容树的节点N1对应的视频内容类型,则继续判断是否属于所述用户偏好内容树其他节点对应的视频内容类型,直至所述观看的视频成为所述用户偏好内容树的叶子节点。
7.如权利要求6所述的装置,其特征在于,所述第一判断单元包括:
概率计算单元,用于将所述观看的视频的相关信息输入二元分类器得到视频所属类型的概率;
确定单元,用于若所述概率大于预设阈值,则确定所述观看的视频属于所述用户偏好内容树的节点N1对应的视频内容类型。
8.如权利要求5所述的装置,其特征在于,所述内容树重构建模块包括:
提升单元,用于计算所述智能电视用户观看的新视频与其父节点和祖父节点的相似度,若所述智能电视用户观看的新视频与其祖父节点的相似度高于所述智能电视用户观看的新视频与其父节点的相似度,则将所述观看的新视频提升至其祖父节点所在的层;或者
融合单元,用于计算所述新视频与各个视频内容类型的相似度,若所述新视频与某个视频内容类型的相似度大于预设相似度阈值,则将所述新视频融合至所述某个视频内容类型;或者
分裂单元,用于计算所述新视频所属视频内容类型的凝聚度,若所述凝聚度小于预设凝聚度阈值,则将所述新视频所属视频内容类型重新分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510675280.0A CN105357583B (zh) | 2015-10-16 | 2015-10-16 | 一种发现智能电视用户兴趣偏好的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510675280.0A CN105357583B (zh) | 2015-10-16 | 2015-10-16 | 一种发现智能电视用户兴趣偏好的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105357583A CN105357583A (zh) | 2016-02-24 |
CN105357583B true CN105357583B (zh) | 2019-08-02 |
Family
ID=55333421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510675280.0A Active CN105357583B (zh) | 2015-10-16 | 2015-10-16 | 一种发现智能电视用户兴趣偏好的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105357583B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108427723B (zh) * | 2018-02-09 | 2021-08-06 | 哈尔滨工业大学深圳研究生院 | 一种基于聚类算法和局部感知重构模型的作者推荐方法和系统 |
CN108921673B (zh) * | 2018-07-16 | 2021-06-01 | 广州天高软件科技有限公司 | 基于大数据的商品推荐方法 |
CN109040776B (zh) * | 2018-07-27 | 2021-11-05 | 联达时代(南京)智能科技有限公司 | 用于播放内容的识别方法及装置 |
CN109886284B (zh) * | 2018-12-12 | 2021-02-12 | 同济大学 | 基于层次化聚类的欺诈检测方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101266603A (zh) * | 2007-03-12 | 2008-09-17 | 北京搜狗科技发展有限公司 | 一种网页信息分类方法、系统及应用该分类的服务系统 |
CN102831193A (zh) * | 2012-08-03 | 2012-12-19 | 人民搜索网络股份公司 | 基于分布式多级聚类的话题检测装置及方法 |
-
2015
- 2015-10-16 CN CN201510675280.0A patent/CN105357583B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101266603A (zh) * | 2007-03-12 | 2008-09-17 | 北京搜狗科技发展有限公司 | 一种网页信息分类方法、系统及应用该分类的服务系统 |
CN102831193A (zh) * | 2012-08-03 | 2012-12-19 | 人民搜索网络股份公司 | 基于分布式多级聚类的话题检测装置及方法 |
Non-Patent Citations (2)
Title |
---|
《Incremental clustering of search history in personalized search》;Xiaochun WANG et al;《Journal of Computational Information Systems》;20131231;第9卷(第6期);2285-2292 |
《基于海量搜索历史数据的用户兴趣模型》;詹天晟 等;《计算机应用》;20141230;第34卷;126-129、139 |
Also Published As
Publication number | Publication date |
---|---|
CN105357583A (zh) | 2016-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7322044B2 (ja) | レコメンダシステムのための高効率畳み込みネットワーク | |
US10565508B2 (en) | Inferred facts discovered through knowledge graph derived contextual overlays | |
CN105357583B (zh) | 一种发现智能电视用户兴趣偏好的方法和装置 | |
Huang et al. | Dirichlet process mixture model for document clustering with feature partition | |
US20220237222A1 (en) | Information determining method and apparatus, computer device, and storage medium | |
CN106294830A (zh) | 多媒体资源的推荐方法及装置 | |
EP2452274A1 (en) | Systems and methods for making recommendations using model-based collaborative filtering with user communities and items collections | |
US20140244614A1 (en) | Cross-Domain Topic Space | |
CN108228844A (zh) | 一种图片筛选方法及装置、存储介质、计算机设备 | |
CN108475256A (zh) | 从同现矩阵生成特征嵌入 | |
US11727248B2 (en) | Interpretable node embedding | |
JP5967577B2 (ja) | 共クラスタリング装置、共クラスタリング方法、プログラム及び集積回路 | |
Zhu et al. | Topic hypergraph hashing for mobile image retrieval | |
CN111338897A (zh) | 应用主机中异常节点的识别方法、监测设备和电子设备 | |
WO2023020214A1 (zh) | 检索模型的训练和检索方法、装置、设备及介质 | |
Wang et al. | Latency-aware adaptive video summarization for mobile edge clouds | |
CN110781377B (zh) | 一种文章推荐方法、装置 | |
Qian et al. | COM: Contrastive Masked-attention model for incomplete multimodal learning | |
CN116051192A (zh) | 处理数据的方法和装置 | |
Aziz et al. | Social network analytics: natural disaster analysis through twitter | |
Zhang et al. | Markov mixed membership models | |
CN114969547B (zh) | 一种基于多视角增强图注意神经网络的音乐推荐方法 | |
CN110134943A (zh) | 领域本体生成方法、装置、设备及介质 | |
Dereventsov et al. | On the unreasonable efficiency of state space clustering in personalization tasks | |
Wei | A multi‐modal heterogeneous data mining algorithm using federated learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |