CN113613081B - 一种基于目标节目推荐模型的节目推荐方法与装置 - Google Patents

一种基于目标节目推荐模型的节目推荐方法与装置 Download PDF

Info

Publication number
CN113613081B
CN113613081B CN202111146905.6A CN202111146905A CN113613081B CN 113613081 B CN113613081 B CN 113613081B CN 202111146905 A CN202111146905 A CN 202111146905A CN 113613081 B CN113613081 B CN 113613081B
Authority
CN
China
Prior art keywords
program
dimension
vector
value
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111146905.6A
Other languages
English (en)
Other versions
CN113613081A (zh
Inventor
陈飞鸽
廖佳秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Justek Technology Co ltd
Original Assignee
Shenzhen Justek Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Justek Technology Co ltd filed Critical Shenzhen Justek Technology Co ltd
Priority to CN202111146905.6A priority Critical patent/CN113613081B/zh
Publication of CN113613081A publication Critical patent/CN113613081A/zh
Application granted granted Critical
Publication of CN113613081B publication Critical patent/CN113613081B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4662Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Library & Information Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于目标节目推荐模型的节目推荐方法,通过提取第一节目向量,计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较,根据比较结果选取目标节目推荐模型,并将第一节目向量输入至目标节目推荐模型中,得到多个第二节目,将各所述第二节目推送给所述指定设备。从而实现了无需获取到用户的用户信息,直接根据用户当前播放的第一节目,就能完成节目的推荐,并且,还通过获取相关的推荐模型,提高了节目推荐的精确度,解决了在没有确定数字电视面前的人员时,很难为该人员推荐相关的电视节目的问题。

Description

一种基于目标节目推荐模型的节目推荐方法与装置
技术领域
本发明涉及数字电视领域,特别涉及一种基于目标节目推荐模型的节目推荐方法与装置。
背景技术
随着我国网络技术在智能广播电视领域的应用与发展,数字电视技术也给人们的播放方式与传统广播技术带来了新的改变。网络数字化广电技术具有画面更高清、更稳定;电视资源更丰富;播放超越时间空间的限制且低成本的优势特点,给电视用户带来了极佳的播放体验。但是,数字电视一般是会面向家庭,即面对的一般都是一个团体,目前,现有的节目的智能推荐一般都是基于客户的信息或者历史记录进行推荐,例如其喜欢运动,26岁,则可以给其推荐体育节目。但是对于家庭而言,尤其是老人和小孩,一般不会去设置自己专属的标签,使用的账号一般也只有一个,因此,在没有确定数字电视面前的人员时,很难为该人员推荐相关的电视节目。
发明内容
本发明的主要目的为提供一种基于目标节目推荐模型的节目推荐方法、装置、设备以及存储介质,旨在解决在没有确定数字电视面前的人员时,很难为该人员推荐相关的电视节目的问题。
本发明提供了一种基于目标节目推荐模型的节目推荐方法,包括:
提取指定设备当前播放的第一节目的第一节目类型以及第一节目信息;
将所述第一节目类型和所述第一节目信息向量化,得到对应的第一类型向量和第一信息向量;
将所述第一类型向量和所述第一信息向量按照预设的加权求和方式进行求和,得到第一节目向量;
获取多个设备各自播放的多个节目的第二节目类型以及第二节目信息;
将所述第二节目类型和所述第二节目信息向量化,得到对应的第二类型向量和第二信息向量;
将各个所述设备对应的所述第二类型向量和第二信息向量按照预设的加权求和方式进行求和,得到第二节目向量;
将各个所述第二节目向量按照预设维度进行聚类处理,得到对应各个预设维度的训练集;
将所述训练集中的各个第二节目向量两两结合依次输入至对应预设维度的初始模型的输入层中,采用公式vik=wj×f(xik)+b得到所述第二节目向量分别对应的特征向量;其中vik表示第k个训练集中的第i个第二节目向量对应的特征向量,xik表示第k个训练集中的第i个第二节目向量,wj为第j个维度预设的训练总权重,b为预设的偏置参数,f(xik)=exp(jwt)*xik,exp(jwt)为模型的特征函数,w表示特征函数的角频率,j为常数,t为所述特征函数的周期,其中,所述初始模型为生成对抗网络模型;
根据公式Rkpq=vpk Tvqk=(wj×f(xpk)+b)T(wj×f(xqk)+b)得到二者的相似值;其中,Rkpq为第k个训练集中的第p个第二节目向量和第q个第二节目向量对应的相似值;
在所述初始模型的判别网络中,根据公式
Figure 100002_DEST_PATH_IMAGE002
计算各个所述初始模型基于所述训练集的损失值;其中,n表示第k个训练集中的第二节目向量的数量,rkpq表示特征向量vqk与特征向量vpk之间的实际相似值,
Figure 100002_DEST_PATH_IMAGE004
为预设的参数;
基于所述初始模型对应的所述损失值对所述初始模型进行参数的调整,调整后得到各个维度对应的节目推荐模型;
计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较;
根据比较结果选取相似度最高的目标节目推荐模型,并将所述第一节目向量输入至所述目标节目推荐模型中,得到与所述第一节目相似度大于相似度阈值的多个第二节目;
将各所述第二节目推送给所述指定设备。
进一步地,所述提取指定设备当前播放的第一节目的第一节目类型以及第一节目信息中,提取所述第一节目信息的步骤,包括:
获取所述指定设备基于所述第一节目的搜索词,并确定所述搜索词的相关词集,所述相关词集包括一个或者多个相关词;
根据所述搜索词的第一词性与各个所述相关词的第二词性,从所述相关词集中确定一个或者多个目标相关词;
根据所述搜索词和所述一个或者多个目标相关词确定多个参考设备;其中所述参考设备为使用所述搜索词和所述一个或者多个目标相关词中的至少一个词搜索所述第一节目的设备;
确定各所述参考设备的共同特征,并将所述共同特征记为所述第一节目信息。
进一步地,所述将各所述第二节目推送给所述指定设备的步骤之前,还包括:
获取所述指定设备播放时间大于设定值的多个目标节目对应的目标节目向量;其中,所述目标节目向量包括所述目标节目的节目类型和所述节目信息;
在预设的维度中提取各所述目标节目向量中的各个维度的维度值;
按照各个所述预设维度分别提取各所述目标节目向量对应的各个维度的维度值,得到各个所述预设维度分别对应的维度集合;
提取各个所述维度集合中的最大值与最小值;
根据公式
Figure 100002_DEST_PATH_IMAGE006
计算每个所述维度集合对应的维度值的标准值,其中,xij表示第j个所述维度集合中第i个所述维度值,min(xij)表示第j个所述维度集合中元素的最小值,max(xij)第j个所述维度集合中元素的最大值,Yij表示所述维度集合中第i个维度值对应的所述标准值;
根据公式
Figure 100002_DEST_PATH_IMAGE008
计算各个所述维度集合的信息熵值,其中
Figure 100002_DEST_PATH_IMAGE010
,其中,Ej表示第j个所述维度集合的所述信息熵值,当Pij=0时,定义
Figure 100002_DEST_PATH_IMAGE012
表示第j个所述维度集合的第i个所述维度值对应的概率值,n表示所述维度集合的个数;
将各个所述维度集合的信息熵值与对应各个预设维度的预设信息熵值进行比较;
根据比较结果筛选出小于对应的所述预设信息熵值的所述维度集合,记为目标维度集合;
将各个目标维度集合中最小的值记为对应预设维度的维度要求值;
获取各个所述第二节目对应所述目标维度集合维度的维度值,并判断是否大于对应的维度要求值;
若大于对应的维度要求值,则判定对应的第二节目满足推送给所述指定设备的要求。
进一步地,所述将各所述第二节目推送给所述指定设备的步骤之后,还包括:
获取用户在所述指定设备上选择的第二节目,并记为第二目标节目;
提取各个所述第二目标节目的节目信息以及播放的完整程度;
将所述完整程度按照预设的分值转化方法转化为对应的推荐分值;
将所述节目信息作为所述目标节目推荐模型的输入,以及将所述推荐分值作为所述目标节目推荐模型的输出,对所述目标节目推荐模型进行再训练。
进一步地,所述将各所述第二节目推送给所述指定设备的步骤,还包括:
统计所述第二节目的目标数量;
若所述第二节目的数量小于第一倍数的数量,或者所述第二节目的数量大于第二倍数的数量人数,则调整所述相似度阈值,并重新统计相似度大于调整后的相似度阈值的第二节目的数量,直至所述第二节目的数量大于或等于第一倍数的所述数量,且小于或等于第二倍数的所述数量时,停止对所述相似度阈值的调整,并输出得到的第二节目;
将各所述第二节目推送给所述指定设备。
进一步地,所述将所述计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较的步骤,包括:
接收用户输入的搜索信息,并解析所述搜索信息的搜索维度所对应的第一维度值;
比较所述搜索维度值与所述第一节目向量对应所述搜索维度的第二维度值;
判断所述第一维度值与所述第二维度值之间的差值是否在预设的范围之内;
若在预设的范围之内,则赋予所述第一节目向量对应所述搜索维度预设权重;
基于所述预设权重计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较。
本发明提供了一种基于目标节目推荐模型的节目推荐装置,包括:
提取模块,用于提取指定设备当前播放的第一节目的第一节目类型以及第一节目信息;
向量化模块,用于将所述第一节目类型和所述第一节目信息向量化,得到对应的第一类型向量和第一信息向量;
求和模块,用于将所述第一类型向量和所述第一信息向量按照预设的加权求和方式进行求和,得到第一节目向量;
第二节目信息获取模块,用于获取多个设备各自播放的多个节目的第二节目类型以及第二节目信息;
第二节目信息向量化模块,用于将所述第二节目类型和所述第二节目信息向量化,得到对应的第二类型向量和第二信息向量;
第二节目向量求取模块,用于将各个所述设备对应的所述第二类型向量和第二信息向量按照预设的加权求和方式进行求和,得到第二节目向量;
聚类模块,用于将各个所述第二节目向量按照预设维度进行聚类处理,得到对应各个预设维度的训练集;
结合模块,用于将所述训练集中的各个第二节目向量两两结合依次输入至对应预设维度的初始模型的输入层中,采用公式vik=wj×f(xik)+b得到所述第二节目向量分别对应的特征向量;其中vik表示第k个训练集中的第i个第二节目向量对应的特征向量,xik表示第k个训练集中的第i个第二节目向量,wj为第j个维度预设的训练总权重,b为预设的偏置参数,f(xik)=exp(jwt)*xik,exp(jwt)为模型的特征函数,w表示特征函数的角频率,j为常数,t为所述特征函数的周期,其中,所述初始模型为生成对抗网络模型;
相似值计算模块,用于根据公式Rkpq=vpk Tvqk=(wj×f(xpk)+b)T(wj×f(xqk)+b)得到二者的相似值;其中,Rkpq为第k个训练集中的第p个第二节目向量和第q个第二节目向量对应的相似值;
判别模块,用于在所述初始模型的判别网络中,根据公式
Figure 100002_DEST_PATH_IMAGE013
计算各个所述初始模型基于所述训练集的损失值;其中,n表示第k个训练集中的第二节目向量的数量,rkpq表示特征向量vqk与特征向量vpk之间的实际相似值,
Figure 403407DEST_PATH_IMAGE004
为预设的参数;
调整模块,用于基于所述初始模型对应的所述损失值对所述初始模型进行参数的调整,调整后得到各个维度对应的节目推荐模型;
计算模块,用于计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较;
选取模块,用于根据比较结果选取相似度最高的目标节目推荐模型,并将所述第一节目向量输入至所述目标节目推荐模型中,得到与所述第一节目相似度大于相似度阈值的多个第二节目;
推送模块,用于将各所述第二节目推送给所述指定设备。
本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本发明的有益效果:通过提取指定设备当前播放的第一节目的第一节目类型以及第一节目信息,得到第一节目向量,计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较,根据比较结果选取相似度最高的目标节目推荐模型,并将所述第一节目向量输入至所述目标节目推荐模型中,得到与所述第一节目相似度大于相似度阈值的多个第二节目,将各所述第二节目推送给所述指定设备。从而实现了无需获取到用户的用户信息,直接根据用户当前播放的第一节目,就能完成节目的推荐,并且,还通过获取相关的推荐模型,提高了节目的推荐的精确度,解决了在没有确定数字电视面前的人员时,很难为该人员推荐相关的电视节目的问题。
附图说明
图1 是本发明一实施例的一种基于目标节目推荐模型的节目推荐方法的流程示意图;
图2是本发明一实施例的一种基于目标节目推荐模型的节目推荐装置的结构示意框图;
图3 为本申请一实施例的计算机设备的结构示意框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后等)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变,所述的连接可以是直接连接,也可以是间接连接。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参照图1,本发明提出一种基于目标节目推荐模型的节目推荐方法,包括:
S1:提取指定设备当前播放的第一节目的第一节目类型以及第一节目信息;
S2:将所述第一节目类型和所述第一节目信息向量化,得到对应的第一类型向量和第一信息向量;
S3:将所述第一类型向量和所述第一信息向量按照预设的加权求和方式进行求和,得到第一节目向量;
S4:获取多个设备各自播放的多个节目的第二节目类型以及第二节目信息;
S5:将所述第二节目类型和所述第二节目信息向量化,得到对应的第二类型向量和第二信息向量;
S6:将各个所述设备对应的所述第二类型向量和第二信息向量按照预设的加权求和方式进行求和,得到第二节目向量;
S7:将各个所述第二节目向量按照预设维度进行聚类处理,得到对应各个预设维度的训练集;
S8:将所述训练集中的各个第二节目向量两两结合依次输入至对应预设维度的初始模型的输入层中,采用公式vik=wj×f(xik)+b得到所述第二节目向量分别对应的特征向量;其中vik表示第k个训练集中的第i个第二节目向量对应的特征向量,xik表示第k个训练集中的第i个第二节目向量,wj为第j个维度预设的训练总权重,b为预设的偏置参数,f(xik)=exp(jwt)*xik,exp(jwt)为模型的特征函数,w表示特征函数的角频率,j为常数,t为所述特征函数的周期,其中,所述初始模型为生成对抗网络模型;;
S9:根据公式Rkpq=vpk Tvqk=(wj×f(xpk)+b)T(wj×f(xqk)+b)得到二者的相似值;其中,Rkpq为第k个训练集中的第p个第二节目向量和第q个第二节目向量对应的相似值;
S10:在所述初始模型的判别网络中,根据公式
Figure DEST_PATH_IMAGE015
计算各个所述初始模型基于所述训练集的损失值;其中,n表示第k个训练集中的第二节目向量的数量,rkpq表示特征向量vqk与特征向量vpk之间的实际相似值,
Figure 320416DEST_PATH_IMAGE004
为预设的参数;
S11:基于所述初始模型对应的所述损失值对所述初始模型进行参数的调整,调整后得到各个维度对应的节目推荐模型;
S12:计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较;其中,不同的节目推荐模型由对应其类型的节目训练而成;
S13:根据比较结果选取相似度最高的目标节目推荐模型,并将所述第一节目向量输入至所述目标节目推荐模型中,得到与所述第一节目相似度大于相似度阈值的多个第二节目;
S14:将各所述第二节目推送给所述指定设备。
如上述步骤S1所述,提取指定设备当前播放的第一节目的第一节目类型以及第一节目信息。其中指定设备为家庭内的数字电视机,利用数字方式处理信号,一般包括:数字高清晰度电视(HDTV,电影级图像)、数字增强清晰度电视(EDTV,比DVD级略高的图像)、数字标准清晰度电视(SDTV,DVD级图像)以及数字普及型电视(VCD级图像)四种。在指定设备处可以得到指定设备当前播放的第一节目的第一节目类型以及第一节目信息,需要说明的是,该第一节目类型可以从预先给该第一节目打的标签中获取,例如为综艺、体育等,第一节目信息包括节目的节目名、节目简介等可以体现出第一节目特点的信息。
如上述步骤S2所述,将所述第一节目类型和所述第一节目信息向量化,得到对应的第一类型向量和第一信息向量。其中,向量化的方式可以通过支持向量机SVM实现,该支持向量机为预先经过不同的节目类型或不同的节目信息以及对应的向量训练而成,需要说明的是,该支持向量机生成的向量是由多个预设维度所组成的向量,即支持向量机可以得到对应节目类型或节目信息的各个维度的维度值,然后按照预设维度的排序方式进行排序,从而得到对应的向量。
如上述步骤S3所述,将所述第一类型向量和所述第一信息向量按照预设的加权求和方式进行求和,得到第一节目向量。其中预设的加权求和方式为预先设定第一类型向量的第一权重以及第一信息向量的第二权重。然后将第一类型向量和第一信息向量乘以各自对应的第一权重和第二权重,并相加得到对应的第一节目向量,从而使第一节目向量具有第一类型向量和第一信息向量的信息,实现了对信息的综合。
如上述步骤S4-S11所述,实现了对应各个节目推荐模型的训练。
步骤S4中为获取到多个设备各自播放的多个节目的第二节目类型以及第二节目信息。其中,获取的方式可以从各个设备处播放的数据进行获取,各个设备在播放节目时,其会对相关节目的节目数据进行接收,因此可以从服务器端获取到对应的多个节目的第二节目类型以及第二节目信息。
步骤S5中,将所述第二节目类型和所述第二节目信息向量化,得到对应的第二类型向量和第二信息向量。其中,向量化可以通过支持向量机SVM实现,该支持向量机为预先经过不同的节目类型或不同的节目信息以及对应的向量训练而成,需要说明的是,该支持向量机生成的向量是由多个预设维度所组成的向量,即支持向量机可以得到对应节目类型或节目信息的各个维度的维度值,然后按照预设维度的排序方式进行排序,从而得到对应的向量。
步骤S6中,将各个所述设备对应的所述第二类型向量和第二信息向量按照预设的加权求和方式进行求和,得到第二节目向量。将所述第二类型向量和所述第二信息向量按照预设的加权求和方式进行求和,得到第二节目向量。其中预设的加权求和方式为预先设定第二类型向量的第一权重以及第二信息向量的第二权重。然后将第二类型向量和第二信息向量乘以各自对应的第一权重和第二权重,并相加得到对应的第二节目向量,从而使第二节目向量具有第二类型向量和第二信息向量的信息,实现了对信息的综合。
步骤S7中,将各个所述第二节目向量按照预设维度进行聚类处理,得到对应各个预设维度的训练集,其中,第二节目向量和预设维度进行聚类处理的方式可以先基于各个维度设置对应的聚类中心点,计算各个第二节目向量至各个聚类中心点的距离,将各个第二节目向量距离最短的聚类中心点所对应的预设维度设置为各个第二节目向量的维度。
步骤S8中,由于训练的是第二节目向量之间的相似度,因此需要将第二节目向量两两结合作为一组训练数据,输入至初始模型的输入层中。采用公式vik=wj×f(xik)+b得到所述第二节目向量分别对应的特征向量;其中vik表示第k个训练集中的第i个第二节目向量对应的特征向量,xik表示第k个训练集中的第i个第二节目向量,wj为第j个维度预设的训练总权重,b为预设的偏置参数,f(xik)=exp(jwt)*xik,exp(jwt)为模型的特征函数,w表示特征函数的角频率,j为常数,t为所述特征函数的周期,其中,所述初始模型为生成对抗网络模型。
步骤S9中,根据公式Rkpq=vpk Tvqk=(wj×f(xpk)+b)T(wj×f(xqk)+b)得到二者的相似值。由于二者的点乘值越大,表示二者的向量相同点就越多,因此以二者的点乘作为相似值,可以很好的体现出二者之间的相似度。
步骤S10-S11中,在所述初始模型的判别网络中,根据公式
Figure DEST_PATH_IMAGE017
计算各个所述初始模型基于所述训练集的损失值;其中,n表示第k个训练集中的第二节目向量的数量,rkpq表示特征向量vqk与特征向量vpk之间的实际相似值,
Figure 926978DEST_PATH_IMAGE004
为预设的参数,基于所述初始模型对应的所述损失值对所述初始模型进行参数的调整,调整后得到各个维度对应的节目推荐模型。其中,公式中采用了
Figure DEST_PATH_IMAGE019
作为过拟合的惩罚项,可以解决第二节目向量经由第二类型向量和所述第二信息向量按照预设的加权求和方式进行求和所带来的稀疏数据过拟合的问题,因此可以得到一种优化后的损失值。再通过对应的生成对抗网络模型进行训练,直至损失值达到预设值。从而完成了各个不同类型的推荐模型的训练。
如上述步骤S12所述,计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较。其中,各个节目推荐模型为预先设定的节目推荐模型,为了提高推荐的精准度,不同的推荐模型通过不同类型的训练数据训练而成,例如,可以体育类型的节目推荐模型,其是利用各个体育节目之间的相似度以及各个体育节目对应的节目向量训练而成,因此,对应的推荐向量即为与体育相关的向量,因此可以通过计算第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较。从而可以从中挑选出理想的节目推荐模型,提高节目推荐的精确度。
如上述步骤S13所述,根据比较结果选取相似度最高的目标节目推荐模型,并将所述第一节目向量输入至所述目标节目推荐模型中,得到与所述第一节目相似度大于相似度阈值的多个第二节目。即将第一节目向量输入,以及节目推荐模型中,即可得到对应的与所述第一节目相似度大于相似度阈值的多个第二节目。需要说明的是,该第二节目的节目向量预先存储在节目推荐模型中,只需要将第一节目向量输入即可得到对应的第二节目。
如上述步骤S14所述,将各所述第二节目推送给所述指定设备。即将各个第二节目推送给指定设备,从而实现了无需获取到用户的用户信息,直接根据用户当前播放的第一节目,就能完成节目的推荐,并且,还通过获取相关的推荐模型,提高了节目的推荐的精确度,解决了在没有确定数字电视面前的人员时,很难为该人员推荐相关的电视节目的问题。
在一个实施例中,所述提取指定设备当前播放的第一节目的第一节目类型以及第一节目信息中,提取所述第一节目信息的步骤S1,包括:
S101:获取所述指定设备基于所述第一节目的搜索词,并确定所述搜索词的相关词集,所述相关词集包括一个或者多个相关词;
S102:根据所述搜索词的第一词性与各个所述相关词的第二词性,从所述相关词集中确定一个或者多个目标相关词;
S103:根据所述搜索词和所述一个或者多个目标相关词确定多个参考设备;其中所述参考设备为使用所述搜索词和所述一个或者多个目标相关词中的至少一个词搜索所述第一节目的设备;
S104:确定各所述参考设备的共同特征,并将所述共同特征记为所述第一节目信息。
如上述步骤S101-S104所述,实现了对第一节目信息的获取,其中需要说明的是,该第一节目信息还可以包括播放该第一节目的各个设备的特征。
步骤S101-S103中,在本实施例中,相关词为链接至预设知识库的词汇,其包括搜索词的多义词中的一个、搜索词本身和搜索词的同义词。终端设备确定搜索词的相关词,包括确定搜索词是否为多义词,若搜索词为多义词,则确定搜索词的含义,从而确定知识库链接为搜索词含义对应的词汇或该词汇对应的同义词,若搜索词不为多义词,则确定搜索词的相关词为搜索词本身或搜索词的同义词。可选地,可根据预先设置的词典确定搜索词是否为多义词,预先设置的词典包括搜索词的多个歧义词,则说明搜索词为多义词。当搜索词不为多义词时,相关词为搜索词本身或搜索词的同义词,例如搜索词为支持向量机,则相关词可以为支持向量机、支持向量网络和SVM。当搜索词为多义词时,确定文本内容中搜索词的含义,以确定搜索词相关词。从而可以确定出使用过相关词或者搜索词进行搜索的参考设备。
步骤S104中,确定各所述参考设备的共同特征,并将所述共同特征记为所述第一节目信息。由于各个参考设备可以视为与当前播放第一节目的用户具有共同点,因此可以认为其具有相同的爱好,从而可以将其作为第一节目的节目信息,以进行第二节目的相似度计算依据。从而实现了无需提前获取用户的用户信息,也可以实现对用户推荐第二节目的技术效果。
在一个实施例中,所述将各所述第二节目推送给所述指定设备的步骤S14之前,还包括:
S1301:获取所述指定设备播放时间大于设定值的多个目标节目对应的目标节目向量;其中,所述目标节目向量包括所述目标节目的节目类型和所述节目信息;
S1302:在预设的维度中提取各所述目标节目向量中的各个维度的维度值;
S1303:按照各个所述预设维度分别提取各所述目标节目向量对应的各个维度的维度值,得到各个所述预设维度分别对应的维度集合;
S1304:提取各个所述维度集合中的最大值与最小值;
S1305:根据公式
Figure DEST_PATH_IMAGE021
计算每个所述维度集合对应的维度值的标准值,其中,xij表示第j个所述维度集合中第i个所述维度值,min(xij)表示第j个所述维度集合中元素的最小值,max(xij)第j个所述维度集合中元素的最大值,Yij表示第j个所述维度集合中第i个维度值对应的所述标准值;
S1306:根据公式
Figure DEST_PATH_IMAGE023
计算各个所述维度集合的信息熵值,其中
Figure DEST_PATH_IMAGE025
,其中,Ej表示第j个所述维度集合的所述信息熵值,当Pij=0时,定义
Figure DEST_PATH_IMAGE027
Figure 77599DEST_PATH_IMAGE012
表示第j个所述维度集合的第i个所述维度值对应的概率值,n表示第j个所述维度集合中元素的个数;
S1307:将各个所述维度集合的信息熵值与对应各个预设维度的预设信息熵值进行比较;
S1308:根据比较结果筛选出小于对应的所述预设信息熵值的所述维度集合,记为目标维度集合;
S1309:将各个目标维度集合中元素的最小值记为对应预设维度的维度要求值;
S1310:获取各个所述第二节目对应所述目标维度集合维度的维度值,并判断是否大于对应的维度要求值;
S1311:若大于对应的维度要求值,则判定对应的第二节目满足推送给所述指定设备的要求。
如上述步骤S1301所述,根据指定设备获取播放时间大于设定值的多个目标节目。即指定设备已经对播放过的节目进行了时间的统计,因此可以直接获取指定设备上的目标节目,然后再通过预设的向量机进行向量化,即可得到对应的目标节目向量。
如上述步骤S1302所述,在预设维度中提取所述目标节目向量的各个维度信息,并将各个所述维度信息按照预设的对应关系转化为维度值。其中,预设维度为提前设定的维度,可以根据指定设备生成,指定设备中有不同维度要求(维度要求为招聘信息中在各个方面的要求),可以事先设定维度信息与维度值的对应关系,后续可以根据维度信息获取到对应的维度值。
如上述步骤S1303-S1304所述,按照各个维度将各所述目标节目向量对应的所述维度值进行提取,得到各维度对应的维度集合;即将每个简历向量中相同的维度提取出来,为每个维度都构建一个维度集合。然后根据其各个维度值的大小,提取各个所述维度集合中的最大值与最小值。
如上述步骤S1305所述,计算各维度集合的信息熵值,其中计算的公式可以是通过计算维度集合中的方差或平均差,即先获取维度集合中的最大值与最小值,根据最大值和最小值来反应整个维度集合的数据波动情况,即先根据公式
Figure DEST_PATH_IMAGE028
计算各个维度值对应的标准值,即先将各个维度值进行标准处理,将其进行归一化处理,避免造成的数据过大而导致计算结果出现偏差。然后根据各个维度值对应的标准差所出现的概率Pij,计算第j个所述维度集合的所述信息熵值。根据上述计算公式计算得到的信息熵值,其充分考虑了同一维度中各个维度值的波动情况,并且也充分考虑了极个别值对整体信息熵值所带来的影响,使计算的信息熵值更具有参考性。
如上述步骤S1307-S1308所述,根据各个维度集合计算的对应信息熵值,设定对应维度的维度要求,应当理解的是,当某一维度集合的信息熵值较小时,则说明对应的维度值比较有规律,说明该维度对于对应的维度的节目具有偏好,因此根据比较结果筛选出小于对应的所述预设信息熵值的所述维度集合,记为目标维度集合。
如上述步骤S1309-S1311所述,将各个目标维度集合中最小的值记为对应预设维度的维度要求值,获取各个所述第二节目对应所述目标维度集合维度的维度值,并判断是否大于对应的维度要求值。若大于对应的维度要求值,则判定对应的第二节目满足推送给所述指定设备的要求。从而实现了对预设维度的筛选,确定出用户的喜好,即要大于维度要求值的第二节目,才进行推送。从而提高了用户对推送的第二节目的满意程度。
在一个实施例中,所述将各所述第二节目推送给所述指定设备的步骤S14之后,还包括:
S1501:获取用户在所述指定设备上选择的第二节目,并记为第二目标节目;
S1502:提取各个所述第二目标节目的节目信息以及播放的完整程度;
S1503:将所述完整程度按照预设的分值转化方法转化为对应的推荐分值;
S1504:将所述节目信息作为所述目标节目推荐模型的输入,以及将所述推荐分值作为所述目标节目推荐模型的输出,对所述目标节目推荐模型进行再训练。
如上述步骤S1501-S1504所述,实现了对目标节目推荐模型的再训练。即获取到用户在所述指定设备上选择的第二节目,并记为第二目标节目。并提取该用户对第二目标节目播放的完整程度,若播放的完整程度很小,则说明用户对第二目标节目并不满意,因此对应的推荐分值就小一些,若播放的完整程度很大,则说明用户对第二目标节目满意,因此对应的推荐分值就大一些,再将所述节目信息作为所述目标节目推荐模型的输入,以及将所述推荐分值作为所述目标节目推荐模型的输出,对所述目标节目推荐模型进行再训练,从而可以不断提高推荐模型与家庭的契合度,由于存在多个推荐模型,因此不会因为推荐模型过度训练,而导致过拟合的现象。
在一个实施例中,所述将各所述第二节目推送给所述指定设备的步骤S14,还包括:
S1511:统计所述第二节目的目标数量;
S1512:若所述第二节目的数量小于第一倍数的数量,或者所述第二节目的数量大于第二倍数的数量人数,则调整所述相似度阈值,并重新统计相似度大于调整后的相似度阈值的第二节目的数量,直至所述第二节目的数量大于或等于第一倍数的所述数量,且小于或等于第二倍数的所述数量时,停止对所述相似度阈值的调整,并输出得到的第二节目;
S1513:将各所述第二节目推送给所述指定设备。
如上述步骤S1511-S1513所述,实现了对第二节目数量的限定。若所述第二节目的数量小于第一倍数的数量,或者所述第二节目的数量大于第二倍数的数量,则调整所述相似度阈值,直至所述第二节目的数量大于或等于第一倍数的所述数量,且小于或等于第二倍数的所述数量时,停止对所述相似度阈值的调整,并输出得到的第二节目。
其中,所述第二节目的数量小于第一倍数的数量时,表示筛选出的第二节目太少,与该第一节目相关的第二节目较少,需要调整所述相似度阈值,以降低相似度要求,提高筛选出的第二节目的数量,避免搜不到合适的第二节目。
所述第二节目的数量大于第二倍数的数量时,表示筛选出的第二节目太多,需要调整所述相似度阈值,以提高相似度要求,降低筛选出的第二节目的数量,同时降低用户浏览各个第二节目并进行筛选的负担,便于用户找到合适的第二节目。
在一个实施例中,所述将所述计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较的步骤S12,包括:
S1201:接收用户输入的搜索信息,并解析所述搜索信息的搜索维度所对应的第一维度值;
S1202:比较所述搜索维度值与所述第一节目向量对应所述搜索维度的第二维度值;
S1203:判断所述第一维度值与所述第二维度值之间的差值是否在预设的范围之内;
S1204:若在预设的范围之内,则赋予所述第一节目向量对应所述搜索维度预设权重;
S1205:基于所述预设权重计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较。
如上述步骤S1201-S1205所述,实现了结合用户的搜索内容,实现精确查询推荐。具体地,用户会在上输入相关的搜索信息,例如为篮球,则可以解析搜索信息对应的维度,即为体育维度,假设篮球对应的维度值是10,则可以比较所述搜索维度值与所述第一节目向量对应所述搜索维度的第二维度值。若用户当前观看的节目是与篮球相关或者相差不大的节目,则其对应的第一维度值和第二维度值的差值会相当小,则说明观看第一节目的类型,以及需要推荐第二节目的类型相同,可以继续以此进行推荐,并且赋予所述第一节目向量对应所述搜索维度预设权重,即更高的权重,从而提高用户的搜索内容对应维度的占比,使得到的第二节目更能满足用户。
参照图2,本发明还提供了一种基于目标节目推荐模型的节目推荐装置,包括:
提取模块10,用于提取指定设备当前播放的第一节目的第一节目类型以及第一节目信息;
向量化模块20,用于将所述第一节目类型和所述第一节目信息向量化,得到对应的第一类型向量和第一信息向量;
求和模块30,用于将所述第一类型向量和所述第一信息向量按照预设的加权求和方式进行求和,得到第一节目向量;
第二节目信息获取模块40,用于获取多个设备各自播放的多个节目的第二节目类型以及第二节目信息;
第二节目信息向量化模块50,用于将所述第二节目类型和所述第二节目信息向量化,得到对应的第二类型向量和第二信息向量;
第二节目向量求取模块60,用于将各个所述设备对应的所述第二类型向量和第二信息向量按照预设的加权求和方式进行求和,得到第二节目向量;
聚类模块70,用于将各个所述第二节目向量按照预设维度进行聚类处理,得到对应各个预设维度的训练集;
结合模块80,用于将所述训练集中的各个第二节目向量两两结合依次输入至对应预设维度的初始模型的输入层中,采用公式vik=wj×f(xik)+b得到所述第二节目向量分别对应的特征向量;其中vik表示第k个训练集中的第i个第二节目向量对应的特征向量,xik表示第k个训练集中的第i个第二节目向量,wj为第j个维度预设的训练总权重,b为预设的偏置参数,f(xik)=exp(jwt)*xik,exp(jwt)为模型的特征函数,w表示特征函数的角频率,j为常数,t为所述特征函数的周期,其中,所述初始模型为生成对抗网络模型;
相似值计算模块90,用于根据公式Rkpq=vpk Tvqk=(wj×f(xpk)+b)T(wj×f(xqk)+b)得到二者的相似值;其中,Rkpq为第k个训练集中的第p个第二节目向量和第q个第二节目向量对应的相似值;
判别模块100,用于在所述初始模型的判别网络中,根据公式
Figure DEST_PATH_IMAGE030
计算各个所述初始模型基于所述训练集的损失值;其中,n表示第k个训练集中的第二节目向量的数量,rkpq表示特征向量vqk与特征向量vpk之间的实际相似值,
Figure 35190DEST_PATH_IMAGE004
为预设的参数;
调整模块110,用于基于所述初始模型对应的所述损失值对所述初始模型进行参数的调整,调整后得到各个维度对应的节目推荐模型。
计算模块120,用于计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较;
选取模块130,用于根据比较结果选取相似度最高的目标节目推荐模型,并将所述第一节目向量输入至所述目标节目推荐模型中,得到与所述第一节目相似度大于相似度阈值的多个第二节目;
推送模块1400,用于将各所述第二节目推送给所述指定设备。
在一个实施例中,基于目标节目推荐模型的节目推荐装置,还包括:
在一个实施例中,提取模块10,包括:
搜索词获取子模块,用于获取所述指定设备基于所述第一节目的搜索词,并确定所述搜索词的相关词集,所述相关词集包括一个或者多个相关词;
目标相关词确定子模块,用于根据所述搜索词的第一词性与各个所述相关词的第二词性,从所述相关词集中确定一个或者多个目标相关词;
参考设备确定子模块,用于根据所述搜索词和所述一个或者多个目标相关词确定多个参考设备;其中所述参考设备为使用所述搜索词和所述一个或者多个目标相关词中的至少一个词搜索所述第一节目的设备;
共同特征确定子模块,用于确定各所述参考设备的共同特征,并将所述共同特征记为所述第一节目信息。
在一个实施例中,基于目标节目推荐模型的节目推荐装置,还包括:
目标节目向量获取模块,用于获取所述指定设备播放时间大于设定值的多个目标节目对应的目标节目向量;其中,所述目标节目向量包括所述目标节目的节目类型和所述节目信息;
维度值提取模块,用于在预设的维度中提取各所述目标节目向量中的各个维度的维度值;
维度集合获取模块,用于按照各个所述预设维度分别提取各所述目标节目向量对应的各个维度的维度值,得到各个所述预设维度分别对应的维度集合;
最值提取模块,用于提取各个所述维度集合中的最大值与最小值;
标准值计算模块,用于根据公式
Figure DEST_PATH_IMAGE031
计算每个所述维度集合对应的维度值的标准值,其中,xij表示第j个所述维度集合中第i个所述维度值,min(xij)表示第j个所述维度集合中元素的最小值,max(xij)第j个所述维度集合中元素的最大值,Yij表示所述维度集合中第i个维度值对应的所述标准值;
信息熵值计算模块,用于根据公式
Figure DEST_PATH_IMAGE033
计算各个所述维度集合的信息熵值,其中
Figure DEST_PATH_IMAGE035
,其中,Ej表示第j个所述维度集合的所述信息熵值,当Pij=0时,定义
Figure DEST_PATH_IMAGE037
表示第j个所述维度集合的第i个所述维度值对应的概率值,n表示第j个所述维度集合中元素的个数;
信息熵值比较模块,用于将各个所述维度集合的信息熵值与对应各个预设维度的预设信息熵值进行比较;
维度集合筛选模块,用于根据比较结果筛选出小于对应的所述预设信息熵值的所述维度集合,记为目标维度集合;
维度要求值设定模块,用于将各个目标维度集合中最小的值记为对应预设维度的维度要求值;
维度值判断模块,用于获取各个所述第二节目对应所述目标维度集合维度的维度值,并判断是否大于对应的维度要求值;
第二节目判定模块,用于若大于对应的维度要求值,则判定对应的第二节目满足推送给所述指定设备的要求。
在一个实施例中,基于目标节目推荐模型的节目推荐装置,还包括:
获取用户在所述指定设备上选择的第二节目,并记为第二目标节目;
完整程度提取模块,用于提取各个所述第二目标节目的节目信息以及播放的完整程度;
转化模块,用于将所述完整程度按照预设的分值转化方法转化为对应的推荐分值;
再训练模块,用于将所述节目信息作为所述目标节目推荐模型的输入,以及将所述推荐分值作为所述目标节目推荐模型的输出,对所述目标节目推荐模型进行再训练。
在一个实施例中,推送模块140,包括:
目标数量统计子模块,用于统计所述第二节目的目标数量;
数量调整子模块,用于若所述第二节目的数量小于第一倍数的数量,或者所述第二节目的数量大于第二倍数的数量人数,则调整所述相似度阈值,并重新统计相似度大于调整后的相似度阈值的第二节目的数量,直至所述第二节目的数量大于或等于第一倍数的所述数量,且小于或等于第二倍数的所述数量时,停止对所述相似度阈值的调整,并输出得到的第二节目;
第二节目推送子模块,用于将各所述第二节目推送给所述指定设备。
在一个实施例中,计算模块120,包括:
搜索信息接收子模块,用于接收用户输入的搜索信息,并解析所述搜索信息的搜索维度所对应的第一维度值;
第一节目向量比较子模块,用于比较所述搜索维度值与所述第一节目向量对应所述搜索维度的第二维度值;
差值判断子模块,用于判断所述第一维度值与所述第二维度值之间的差值是否在预设的范围之内;
赋予子模块,用于若在预设的范围之内,则赋予所述第一节目向量对应所述搜索维度预设权重;
相似度计算子模块,用于基于所述预设权重计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较。
本发明的有益效果:通过提取指定设备当前播放的第一节目的第一节目类型以及第一节目信息,得到第一节目向量,计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较,根据比较结果选取相似度最高的目标节目推荐模型,并将所述第一节目向量输入至所述目标节目推荐模型中,得到与所述第一节目相似度大于相似度阈值的多个第二节目,将各所述第二节目推送给所述指定设备。从而实现了无需获取到用户的用户信息,直接根据用户当前播放的第一节目,就能完成节目的推荐,并且,还通过获取相关的推荐模型,提高了节目的推荐的精确度,解决了在没有确定数字电视面前的人员时,很难为该人员推荐相关的电视节目的问题。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储各种节目类型以及节目信息等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时可以实现上述任一实施例所述的基于目标节目推荐模型的节目推荐方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时可以实现上述任一实施例所述的基于目标节目推荐模型的节目推荐方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM一多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (8)

1.一种基于目标节目推荐模型的节目推荐方法,其特征在于,包括:
提取指定设备当前播放的第一节目的第一节目类型以及第一节目信息;
将所述第一节目类型和所述第一节目信息向量化,得到对应的第一类型向量和第一信息向量;
将所述第一类型向量和所述第一信息向量按照预设的加权求和方式进行求和,得到第一节目向量;
获取多个设备各自播放的多个节目的第二节目类型以及第二节目信息;
将所述第二节目类型和所述第二节目信息向量化,得到对应的第二类型向量和第二信息向量;
将各个所述设备对应的所述第二类型向量和第二信息向量按照预设的加权求和方式进行求和,得到第二节目向量;
将各个所述第二节目向量按照预设维度进行聚类处理,得到对应各个预设维度的训练集;
将所述训练集中的各个第二节目向量两两结合依次输入至对应预设维度的初始模型的输入层中,采用公式vik=wj×f(xik)+b得到所述第二节目向量分别对应的特征向量;其中vik表示第k个训练集中的第i个第二节目向量对应的特征向量,xik表示第k个训练集中的第i个第二节目向量,wj为第j个维度预设的训练总权重,b为预设的偏置参数,f(xik)=exp(jwt)*xik,exp(jwt)为模型的特征函数,w表示特征函数的角频率,j为常数,t为所述特征函数的周期,其中,所述初始模型为生成对抗网络模型;
根据公式Rkpq=vpk Tvqk=(wj×f(xpk)+b)T(wj×f(xqk)+b)得到二者的相似值;其中,Rkpq为第k个训练集中的第p个第二节目向量和第q个第二节目向量对应的相似值;
在所述初始模型的判别网络中,根据公式
Figure DEST_PATH_IMAGE002
计算各个所述初始模型基于所述训练集的损失值;其中,n表示第k个训练集中的第二节目向量的数量,rkpq表示特征向量vqk与特征向量vpk之间的实际相似值,
Figure DEST_PATH_IMAGE004
为预设的参数;
基于所述初始模型对应的所述损失值对所述初始模型进行参数的调整,调整后得到各个维度对应的节目推荐模型;
计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较;
根据比较结果选取相似度最高的目标节目推荐模型,并将所述第一节目向量输入至所述目标节目推荐模型中,得到与所述第一节目相似度大于相似度阈值的多个第二节目;
将各所述第二节目推送给所述指定设备。
2.如权利要求1所述的基于目标节目推荐模型的节目推荐方法,其特征在于,所述提取指定设备当前播放的第一节目的第一节目类型以及第一节目信息中,提取所述第一节目信息的步骤,包括:
获取所述指定设备基于所述第一节目的搜索词,并确定所述搜索词的相关词集,所述相关词集包括一个或者多个相关词;
根据所述搜索词的第一词性与各个所述相关词的第二词性,从所述相关词集中确定一个或者多个目标相关词;
根据所述搜索词和所述一个或者多个目标相关词确定多个参考设备;其中所述参考设备为使用所述搜索词和所述一个或者多个目标相关词中的至少一个词搜索所述第一节目的设备;
确定各所述参考设备的共同特征,并将所述共同特征记为所述第一节目信息。
3.如权利要求1所述的基于目标节目推荐模型的节目推荐方法,其特征在于,所述将各所述第二节目推送给所述指定设备的步骤之前,还包括:
获取所述指定设备播放时间大于设定值的多个目标节目对应的目标节目向量;其中,所述目标节目向量包括所述目标节目的节目类型和所述节目信息;
在预设的维度中提取各所述目标节目向量中的各个维度的维度值;
按照各个所述预设维度分别提取各所述目标节目向量对应的各个维度的维度值,得到各个所述预设维度分别对应的维度集合;
提取各个所述维度集合中的最大值与最小值;
根据公式
Figure DEST_PATH_IMAGE006
计算每个所述维度集合对应的维度值的标准值,其中,xij表示第j个所述维度集合中第i个所述维度值,min(xij)表示第j个所述维度集合中元素的最小值,max(xij)第j个所述维度集合中元素的最大值,Yij表示第j个所述维度集合中第i个维度值对应的所述标准值;
根据公式
Figure DEST_PATH_IMAGE008
计算各个所述维度集合的信息熵值,其中
Figure DEST_PATH_IMAGE010
,其中,Ej表示第j个所述维度集合的所述信息熵值,当Pij=0时,定义
Figure DEST_PATH_IMAGE012
表示第j个所述维度集合的第i个所述维度值对应的概率值,n表示第j个所述维度集合中元素的个数;
将各个所述维度集合的信息熵值与对应各个预设维度的预设信息熵值进行比较;
根据比较结果筛选出小于对应的所述预设信息熵值的所述维度集合,记为目标维度集合;
将各个目标维度集合中元素的最小值记为对应预设维度的维度要求值;
获取各个所述第二节目对应所述目标维度集合维度的维度值,并判断是否大于对应的维度要求值;
若大于对应的维度要求值,则判定对应的第二节目满足推送给所述指定设备的要求。
4.如权利要求1所述的基于目标节目推荐模型的节目推荐方法,其特征在于,所述将各所述第二节目推送给所述指定设备的步骤之后,还包括:
获取用户在所述指定设备上选择的第二节目,并记为第二目标节目;
提取各个所述第二目标节目的节目信息以及播放的完整程度;
将所述完整程度按照预设的分值转化方法转化为对应的推荐分值;
将所述节目信息作为所述目标节目推荐模型的输入,以及将所述推荐分值作为所述目标节目推荐模型的输出,对所述目标节目推荐模型进行再训练。
5.如权利要求1所述的基于目标节目推荐模型的节目推荐方法,其特征在于,所述将所述计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较的步骤,包括:
接收用户输入的搜索信息,并解析所述搜索信息的搜索维度所对应的第一维度值;
比较所述搜索维度值与所述第一节目向量对应所述搜索维度的第二维度值;
判断所述第一维度值与所述第二维度值之间的差值是否在预设的范围之内;
若在预设的范围之内,则赋予所述第一节目向量对应所述搜索维度预设权重;
基于所述预设权重计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较。
6.一种基于目标节目推荐模型的节目推荐装置,其特征在于,包括:
提取模块,用于提取指定设备当前播放的第一节目的第一节目类型以及第一节目信息;
向量化模块,用于将所述第一节目类型和所述第一节目信息向量化,得到对应的第一类型向量和第一信息向量;
求和模块,用于将所述第一类型向量和所述第一信息向量按照预设的加权求和方式进行求和,得到第一节目向量;
第二节目信息获取模块,用于获取多个设备各自播放的多个节目的第二节目类型以及第二节目信息;
第二节目信息向量化模块,用于将所述第二节目类型和所述第二节目信息向量化,得到对应的第二类型向量和第二信息向量;
第二节目向量求取模块,用于将各个所述设备对应的所述第二类型向量和第二信息向量按照预设的加权求和方式进行求和,得到第二节目向量;
聚类模块,用于将各个所述第二节目向量按照预设维度进行聚类处理,得到对应各个预设维度的训练集;
结合模块,用于将所述训练集中的各个第二节目向量两两结合依次输入至对应预设维度的初始模型的输入层中,采用公式vik=wj×f(xik)+b得到所述第二节目向量分别对应的特征向量;其中vik表示第k个训练集中的第i个第二节目向量对应的特征向量,xik表示第k个训练集中的第i个第二节目向量,wj为第j个维度预设的训练总权重,b为预设的偏置参数,f(xik)=exp(jwt)*xik,exp(jwt)为模型的特征函数,w表示特征函数的角频率,j为常数,t为所述特征函数的周期,其中,所述初始模型为生成对抗网络模型;
相似值计算模块,用于根据公式Rkpq=vpk Tvqk=(wj×f(xpk)+b)T(wj×f(xqk)+b)得到二者的相似值;其中,Rkpq为第k个训练集中的第p个第二节目向量和第q个第二节目向量对应的相似值;
判别模块,用于在所述初始模型的判别网络中,根据公式
Figure DEST_PATH_IMAGE013
计算各个所述初始模型基于所述训练集的损失值;其中,n表示第k个训练集中的第二节目向量的数量,rkpq表示特征向量vqk与特征向量vpk之间的实际相似值,
Figure 102688DEST_PATH_IMAGE004
为预设的参数;
调整模块,用于基于所述初始模型对应的所述损失值对所述初始模型进行参数的调整,调整后得到各个维度对应的节目推荐模型;
计算模块,用于计算所述第一节目向量与各个节目推荐模型预设的推荐向量之间的相似度,并进行相似度比较;
选取模块,用于根据比较结果选取相似度最高的目标节目推荐模型,并将所述第一节目向量输入至所述目标节目推荐模型中,得到与所述第一节目相似度大于相似度阈值的多个第二节目;
推送模块,用于将各所述第二节目推送给所述指定设备。
7.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN202111146905.6A 2021-09-29 2021-09-29 一种基于目标节目推荐模型的节目推荐方法与装置 Active CN113613081B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111146905.6A CN113613081B (zh) 2021-09-29 2021-09-29 一种基于目标节目推荐模型的节目推荐方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111146905.6A CN113613081B (zh) 2021-09-29 2021-09-29 一种基于目标节目推荐模型的节目推荐方法与装置

Publications (2)

Publication Number Publication Date
CN113613081A CN113613081A (zh) 2021-11-05
CN113613081B true CN113613081B (zh) 2021-12-03

Family

ID=78343270

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111146905.6A Active CN113613081B (zh) 2021-09-29 2021-09-29 一种基于目标节目推荐模型的节目推荐方法与装置

Country Status (1)

Country Link
CN (1) CN113613081B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116070861B (zh) * 2023-02-08 2023-08-04 武汉博奥鹏程教育科技有限公司 一种基于动态学习目标的课程定制方法和装置
CN116821502B (zh) * 2023-06-30 2024-03-08 武汉大学 一种基于舆情热点的数据管理方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004192461A (ja) * 2002-12-12 2004-07-08 Sony Corp 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
JP2011142432A (ja) * 2010-01-06 2011-07-21 Sony Corp 情報処理装置、情報処理方法およびプログラム
CN108647293A (zh) * 2018-05-07 2018-10-12 广州虎牙信息科技有限公司 视频推荐方法、装置、存储介质和服务器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004192461A (ja) * 2002-12-12 2004-07-08 Sony Corp 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
JP2011142432A (ja) * 2010-01-06 2011-07-21 Sony Corp 情報処理装置、情報処理方法およびプログラム
CN108647293A (zh) * 2018-05-07 2018-10-12 广州虎牙信息科技有限公司 视频推荐方法、装置、存储介质和服务器

Also Published As

Publication number Publication date
CN113613081A (zh) 2021-11-05

Similar Documents

Publication Publication Date Title
WO2020108608A1 (zh) 搜索结果处理方法、装置、终端、电子设备及存储介质
EP3657392A1 (en) Image feature acquisition
CN113613081B (zh) 一种基于目标节目推荐模型的节目推荐方法与装置
US6859802B1 (en) Image retrieval based on relevance feedback
US6671683B2 (en) Apparatus for retrieving similar documents and apparatus for extracting relevant keywords
CN110909182B (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
US6704725B1 (en) Method of searching multimedia data
CN105095516B (zh) 基于谱聚类集成的广播电视用户分群系统及方法
JP2022508163A (ja) ユーザタグ生成方法並びにその、装置、コンピュータプログラム及びコンピュータ機器
Chen et al. Model Metric Co-Learning for Time Series Classification.
US8232996B2 (en) Image learning, automatic annotation, retrieval method, and device
CN107341268B (zh) 一种热搜榜排序方法及系统
CN109783671B (zh) 一种以图搜图的方法、计算机可读介质及服务器
WO2016180270A1 (zh) 网页分类方法和装置、计算设备以及机器可读存储介质
US20110188713A1 (en) Facial image recognition and retrieval
US7401062B2 (en) Method for resource allocation among classifiers in classification systems
CN108647571B (zh) 视频动作分类模型训练方法、装置及视频动作分类方法
JP2005535952A (ja) 画像内容検索法
CN109168047B (zh) 视频推荐方法、装置、服务器及存储介质
CN110750629A (zh) 机器人对话生成方法、装置、可读存储介质及机器人
CN110442702A (zh) 搜索方法、装置、可读存储介质和电子设备
Bounabi et al. A comparison of text classification methods using different stemming techniques
Faheema et al. Feature selection using bag-of-visual-words representation
US20220075804A1 (en) Method and device for providing guide information for enhancement of artist's reputation
Szmidt et al. Three term attribute description of Atanassov's Intuitionistic Fuzzy Sets as a basis of attribute selection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant