CN105049882A - 一种视频推荐方法及装置 - Google Patents

一种视频推荐方法及装置 Download PDF

Info

Publication number
CN105049882A
CN105049882A CN201510543037.3A CN201510543037A CN105049882A CN 105049882 A CN105049882 A CN 105049882A CN 201510543037 A CN201510543037 A CN 201510543037A CN 105049882 A CN105049882 A CN 105049882A
Authority
CN
China
Prior art keywords
sound
video
groove model
user
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510543037.3A
Other languages
English (en)
Other versions
CN105049882B (zh
Inventor
朱柏涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201510543037.3A priority Critical patent/CN105049882B/zh
Publication of CN105049882A publication Critical patent/CN105049882A/zh
Application granted granted Critical
Publication of CN105049882B publication Critical patent/CN105049882B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明实施例公开了一种视频推荐方法及装置,应用于视频推荐系统的服务器端,所述视频推荐系统还包括TV端,该方法包括:接收由TV端发送的、第一用户的语音信号及该TV端的标识信息;根据所述第一用户的语音信号建立第一用户的声纹模型;将第一用户的声纹模型与预先存储的、所述TV端的标识信息对应的所有标准声纹模型进行匹配,确定与第一用户的声纹模型匹配的第一标准声纹模型;向第一用户推荐与所述第一标准声纹模型对应的待推荐视频;所述待推荐视频根据所述第一标准声纹模型对应的视频播放记录确定;所述视频播放记录根据TV端定时发送的当前视频播放信息获得。与相有技术相比,视频推荐的准确度较高。

Description

一种视频推荐方法及装置
技术领域
本发明涉及互联网领域,特别涉及一种视频推荐方法及装置。
背景技术
视频网站向用户推荐视频,一般先收集用户的视频播放记录,然后根据用户的视频播放记录来确定用户感兴趣的视频,并推荐给用户。
当视频网站以电视为终端进行视频推荐时,由于电视终端的共用性特点,视频网站收集的是家庭多个成员的视频播放记录,在推荐视频时,也无法判断当前观看电视的用户,只能将整个家庭作为一个整体用户进行视频推荐。
但是,一个家庭中年龄和性别的差异会造成成员间对于视频的偏好不同,比如小孩喜欢动画片,妻子喜欢综艺,丈夫喜欢战争片等,因此,将整个家庭作为一个整体用户进行视频推荐,很可能会给当前观看电视的用户推荐其不喜欢的视频,视频推荐的准确度不高。
发明内容
本发明实施例公开了一种视频推荐方法及装置,用于解决当视频网站以电视为终端进行视频推荐时视频推荐的准确度不高的问题。技术方案如下:
一种视频推荐方法,应用于视频推荐系统的服务器端,所述视频推荐系统还包括TV端,该方法包括:
接收由TV端发送的、第一用户的语音信号及该TV端的标识信息;
根据所述第一用户的语音信号建立第一用户的声纹模型;
将第一用户的声纹模型与预先存储的、所述TV端的标识信息对应的所有标准声纹模型进行匹配,确定与第一用户的声纹模型匹配的第一标准声纹模型;
向第一用户推荐与所述第一标准声纹模型对应的待推荐视频;所述待推荐视频根据所述第一标准声纹模型对应的视频播放记录确定;所述视频播放记录根据TV端定时发送的当前视频播放信息获得。
其中,所述方法还包括:所述在确定与第一用户的声纹模型匹配的第一标准声纹模型之后,将所述第一标准声纹模型记录为当前TV端对应的声纹模型;
所述视频播放记录在将所述第一标准声纹模型记录为当前TV端对应的声纹模型后,根据TV端定时发送的当前视频播放信息获得。
其中,所述待推荐视频的确定方法,包括:
根据所述第一标准声纹模型对应的视频播放记录,确定第一标准声纹模型所对应的目标视频信息特征向量;
确定所述视频播放记录所对应的视频之外的其它视频的视频信息特征向量;
计算目标视频信息特征向量与其它视频的视频信息特征向量的相似度;
根据相似度的大小,从其所述它视频中选择预设数量的视频作为待推荐视频。
其中,根据所述第一用户的语音信号建立第一用户的声纹模型,包括:
根据所接收的第一用户的语音信号,确定该语音信号对应的声纹特征;
将所确定的声纹特征进行矢量量化处理,得到该声纹特征对应的第一用户的矢量量化码书,将所述第一用户的矢量量化码书作为第一用户的声纹模型;
所述所有标准声纹模型为预先存储的、所述TV端的标识信息对应的所有用户的标准矢量量化码书;
所述将第一用户的声纹模型与预先存储的、所述TV端的标识信息对应的所有标准声纹模型进行匹配,确定与该用户的声纹模型匹配的第一标准声纹模型,包括:
计算第一用户的矢量量化码书与所述所有用户的标准矢量量化码书的欧式距离;
确定所得到的欧式距离的最小值;
判断所述最小值是否满足预设的阈值;
在满足的情况下,将所述最小值对应的标准矢量量化码书作为与第一用户的声纹模型匹配的第一标准声纹模型。
其中,上述方法还包括:在所述确定与第一用户的声纹模型匹配的第一标准声纹模型之后,将所述第一标准声纹模型替换为所述第一用户的声纹模型。
相应于上面的方法实施例,本发明还提供了一种视频推荐装置,应用于视频推荐系统的服务器端,所述视频推荐系统还包括TV端,该装置包括:
语音信号接收模块,用于接收由TV端发送的、第一用户的语音信号及该TV端的标识信息;
声纹模型建立模块,用于根据所述第一用户的语音信号建立第一用户的声纹模型;
声纹模型匹配模块,用于将第一用户的声纹模型与预先存储的、所述TV端的标识信息对应的所有标准声纹模型进行匹配,确定与第一用户的声纹模型匹配的第一标准声纹模型;
视频推荐模块,用于向第一用户推荐与所述第一标准声纹模型对应的待推荐视频;所述待推荐视频根据所述第一标准声纹模型对应的视频播放记录确定;所述视频播放记录根据TV端定时发送的当前视频播放信息获得。
其中,所述装置还包括:声纹模型记录模块,用于在所述声纹模型匹配模块确定与第一用户的声纹模型匹配的第一标准声纹模型之后,将所述第一标准声纹模型记录为当前TV端对应的声纹模型;
所述视频播放记录在所述声纹模型记录模块将所述第一标准声纹模型记录为当前TV端对应的声纹模型后,根据TV端定时发送的当前视频播放信息获得。
其中,所述装置还包括:待推荐视频确定模块,包括:
第一特征向量确定子模块,用于根据所述第一标准声纹模型对应的视频播放记录,确定第一标准声纹模型所对应的目标视频信息特征向量;
第二特征向量确定子模块,用于确定所述视频播放记录所对应的视频之外的其它视频的视频信息特征向量;
相似度计算子模块,用于计算目标视频信息特征向量与其它视频的视频信息特征向量的相似度;
待推荐视频选择子模块,用于根据相似度的大小,从其所述它视频中选择预设数量的视频作为待推荐视频。
其中,声纹模型建立模块包括:
声纹特征确定子模块,用于根据所接收的第一用户的语音信号,确定该语音信号对应的声纹特征;
矢量量化码书确定子模块,用于将所确定的声纹特征进行矢量量化处理,得到该声纹特征对应的第一用户的矢量量化码书,将所述第一用户的矢量量化码书作为第一用户的声纹模型;
所述所有标准声纹模型为预先存储的、所述TV端的标识信息对应的所有用户的标准矢量量化码书;
所述声纹模型匹配模块,包括:
欧式距离计算子模块,用于计算第一用户的矢量量化码书与所述所有用户的标准矢量量化码书的欧式距离;
最小欧式距离确定子模块,用于确定所得到的欧式距离的最小值;
判断子模块,用于判断所述最小值是否满足预设的阈值;
匹配子模块,用于在满足的情况下,将所述最小值对应的标准矢量量化码书作为与第一用户的声纹模型匹配的第一标准声纹模型。
其中,上述各装置还包括:声纹模型替换模块,用于在所述确定与第一用户的声纹模型匹配的第一标准声纹模型之后,将所述第一标准声纹模型替换为所述第一用户的声纹模型。
由上述技术方案可见,本发明能过在服务器侧预先建立TV端对应的标准声纹模型,在接收到该TV端的第一用户的语音信号后,建立第一用户的声纹模型,并将第一用户的声纹模型与预先存储的、所述TV端的标识信息对应的所有标准声纹模型进行匹配,确定与第一用户的声纹模型匹配的第一标准声纹模型,并向第一用户推荐与所述第一标准声纹模型对应的待推荐视频;所述待推荐视频根据所述第一标准声纹模型对应的视频播放记录确定。这样,一方面确定第一用户的待推荐视频时,可以根据第一用户的视频播放记录确定,另一方面向第一用户推荐时,也可以准确识别出第一用户,因此,视频推荐的准确度较高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种视频推荐方法的流程图;
图2为本发明实施例提供的一种视频推荐装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例首先提供了一种视频推荐方法,应用于视频推荐系统的服务器端,所述视频推荐系统还包括TV端,且服务器端与TV端已建立通信连接;所说的TV端具体可以为智能电视等,TV端的具体形式本发明在此不进行限定;如图1所示,该方法可以包括:
S101,接收由TV端发送的、第一用户的语音信号及该TV端的标识信息;
当第一用户通过语音控制TV端时,TV端可以采集用户的语音信号,并将所采集的第一用户的语音信号及该TV端的标识信息向服务器端发送;并由服务器端接收由TV端发送的、第一用户的语音信号及该TV端的标识信息。
本步骤的具体实施方案可以采用现有技术的相关技术方案来实现,本发明在此不作具体限定。
S102,根据所述第一用户的语音信号建立第一用户的声纹模型;
首先需要说明的是,所说的第一用户的声纹模型的建立方法可以采用现有技术的相关技术方案来实现,本发明在此不作具体限定。
在实际应用中,第一用户的声纹模型的建立方法可以包括;
1.根据所接收的第一用户的语音信号,确定该语音信号对应的声纹特征;
首先,服务器在接收到第一用户的语音信号后,需要对该语音信号进行分帧处理,即把第一用户的语音信号分成一个个短时段,每个短时段称为一帧,每一帧语音信号都具有短时平稳性;帧长的实际取值是由研发人员根据实际需要来确定的,本发明在此不作具体限定,一般可以取10ms-30ms。
在进行分帧处理后,要对语音信号的每一帧进行语音端点检测,可以通过对语音的短时能量和短时过零率的计算和判断,来检测出语音信号的说话人语音部分和背景噪音部分,并将背景噪音帧进行删除。
在经过上述的两步处理后,就可以进一步确定第一用户的声纹特征,在实际应用中,可以采用现有技术中的美尔普倒谱系数来表征声纹特征。
2.将所确定的声纹特征进行矢量量化处理,得到该声纹特征对应的第一用户的矢量量化码书,将第一用户的矢量量化码书作为第一用户的声纹模型。
声纹特征的矢量量化方法为现有技术,本发明在此不作详细描述,研发人员完全可以根据本发明在此的描述,采用矢量量化方法对第一用户的声纹特征进行矢量量化处理,最终得到第一用户的矢量量化码书,将所述第一用户的矢量量化码书作为第一用户的声纹模型。
S103,将第一用户的声纹模型与预先存储的、所述TV端的标识信息对应的所有标准声纹模型进行匹配,确定与第一用户的声纹模型匹配的第一标准声纹模型;
需要说明的是,标准声纹模型的建立方法与步骤S102中第一用户的声纹模型的建立方法相同。
在本步骤中,声纹模型的匹配过程需要根据声纹模型的具体形式来确定。
例如,在第一用户的矢量量化码书作为第一用户的声纹模型的情况下,所有标准声纹模型为预先存储的、所述TV端的标识信息对应的所有用户的标准矢量量化码书;
此时,所述将第一用户的声纹模型与预先存储的、所述TV端的标识信息对应的所有标准声纹模型进行匹配,确定与该用户的声纹模型匹配的第一标准声纹模型,可以包括:
计算第一用户的矢量量化码书与所述所有用户的标准矢量量化码书的欧式距离;
确定所得到的欧式距离的最小值;
判断所述最小值是否满足预设的阈值;
在满足的情况下,将所述最小值对应的标准矢量量化码书作为与第一用户的声纹模型匹配的第一标准声纹模型;
需要说明的是,预设的阈值可以由研发人员来确定,本发明在此不作具体限定。
一般情况下,一个TV端会对应多个用户,也就是说会有多个用户在不同的时间段内控制使用该TV端。对于服务器端来说,有几个用户通过语音控制使用过该TV端,服务器端就会建立并存储相同数量的、与该TV端的标识信息对应的标准声纹模型;
实际应用中,标准声纹模型的建立及存储过程可以包括:
接收由TV端发送的、第二用户的语音信号及该TV端的标识信息;
根据所述第二用户的语音信号建立第二用户的声纹模型;
如果服务器端未存储任何与该TV端的标识信息对应的标准声纹模型,则服务器端直接将第二用户的声纹模型作为一个标准声纹模型,并进行存储。
如果服务器端已存储有至少一个与该TV端的标识信息对应的准声纹模型,
则服务器端将第二用户的声纹模型与预先存储的、该TV端的标识信息对应的所有标准声纹模型进行匹配,如果匹配失败,则将第二用户的声纹模型作为一个标准声纹模型,并进行存储。
S104,向第一用户推荐与所述第一标准声纹模型对应的待推荐视频;所述待推荐视频根据所述第一标准声纹模型对应的视频播放记录确定;所述视频播放记录根据TV端定时发送的当前视频播放信息获得;
在实际应用中,在步骤S103确定了与第一用户的声纹模型匹配的第一标准声纹模型之后,可以将所述第一标准声纹模型记录为当前TV端对应的声纹模型。
所述视频播放记录在将所述第一标准声纹模型记录为当前TV端对应的声纹模型后,根据TV端定时发送的当前视频播放信息获得。
也就是说,在确定了第一标准声纹模型为当前TV端对应的声纹模型后,TV端会定时的向服务器端发送当前视频播放信息,服务器端接收到该视频播放信息后,就可以将该视频播放信息所对应的视频播放记录确定为与第一标准声纹模型对应的视频播放记录。
这里所说的“定时发送的当前视频播放信息”可以理解为:TV端开始播放某一视频后,在预设的播放时间发送当前视频播放信息。例如,“定时发送的当前视频播放信息”具体可以为:在TV端开始播放某一视频后,在播放到30分钟时,发送该视频播放信息。如果没播放到30分钟就停止播放该视频,或将该视频换成其它视频,则不发送该视频播放信息。
需要说明的是,现有技术中,根据用户的视频播放记录来确定待推荐视频的方法有很多,一般是根据用户的视频播放记录来推测用户的兴趣、喜好,例如,用户感兴趣的视频的类型,用户感兴趣的演员等;然后再根据用户的兴趣、喜好从其它视频中筛选出一些视频向用户推荐。
本发明实施例在此所用的待推荐视频的确定方法可以采用现有技术的相关技术方案来实现,本发明在此不作具体限定。
例如,在实际应用中,待推荐视频的确定方法,可以包括:
1、根据所述第一标准声纹模型对应的视频播放记录,确定第一标准声纹模型所对应的目标视频信息特征向量;
所说的视频信息特征向量可以理解为由视频特征元素所给成的多维向量。所说的视频特征元素可以包括但不限于:视频类型、主演、导演、集数,这些视频特征元素是由研发人员所确定的,本发明在此不作具体限定。在实际应用中,每一个视频特征元素可以对应一定的分值。这样,根据第一标准声纹模型对应的视频播放记录,就可以采用数学统计的方法确定出目标视频信息特征向量中每一个视频特征元素的分值;具体实现方案可以由研发人员确定,本发明在此不作用具体限定。
下面仅以视频类型这一视频特征元素为例,说明目标视频信息特征向量中各视频特征元素的分值确定方法。假设第一标准声纹模型对应5个视频播放记录,其中有4个是战争片,一个是喜剧片,并且预先确定战争片的分值为4,喜剧片的分值为3,那么目标视频信息特征向量中的视频类型所对应的分值可以为(4×4+3)/5=3.8。
2、确定所述视频播放记录所对应的视频之外的其它视频的视频信息特征向量;需要说明的是,目标视频信息特征向量的维度与其它视频的视频信息特征向量的维度应当相同,且视频信息特征向量中的视频特征元素的种类、顺序应当一致。
例如,目标视频信息特征向量为{视频类型、主演、导演};
其它视频的视频信息特征向量也应当为{视频类型、主演、导演}。
所说的其它视频可以包括服务器端所存储的、第一标准声纹模型对应的视频播放记录所对应的视频之外的其它的所有视频;也可以为根据预设规则所确定的某一范围内的、第一标准声纹模型对应的视频播放记录所对应的视频之外的视频。所说的预设规则可以由研发人员来确定,本发明在此不作具体限定。
3、计算目标视频信息特征向量与其它视频的视频信息特征向量的相似度;
在实际应用中,可以采用多维向量相似度计算公式来进行计算,例如可以采用欧式距离计算公式,或余弦相似度计算公式等,发明在此不作限定。
4、根据相似度的大小,从其所述它视频中选择预设数量的视频作为待推荐视频。
在确定了相似度后,在所述其它视频中,从相似度最大的视频开始,选择预设数量的视频向第一用户推荐。所说的预设数量为预先确定的待推荐视频的数量,可以由研发人员确定。
由上述技术方案可见,本发明实施例能过在服务器侧预先建立TV端对应的标准声纹模型,在接收到该TV端的第一用户的语音信号后,建立第一用户的声纹模型,并将第一用户的声纹模型与预先存储的、所述TV端的标识信息对应的所有标准声纹模型进行匹配,确定与第一用户的声纹模型匹配的第一标准声纹模型,并向第一用户推荐与所述第一标准声纹模型对应的待推荐视频;所述待推荐视频根据所述第一标准声纹模型对应的视频播放记录确定。这样,一方面,确定第一用户的待推荐视频时,可以根据第一用户的视频播放记录确定,另一方面,向第一用户推荐时,也可以准确识别出第一用户,因此,视频推荐的准确度较高。
由于用户的声音随着时间的变化会发生微小变化,这种微小变化积累到一定程度后,可能就会与之前的标准声纹模型匹配不上,为解决这一问题,在实际应用中,可以在S103确定与第一用户的声纹模型匹配的第一标准声纹模型之后,将所述第一标准声纹模型替换为所述第一用户的声纹模型。这样就可以有效的防止由于用户的声音改变所导致的匹配错误。
需要说明的是,上述各方法的具体实施方式,即可单独实施也可以部分或全部组合在一起实施,具体的实施方式由本领域技术人员来确定,本发明在此不作限定。
相应于上面的方法实施例,本发明还提供了一种视频推荐装置,应用于视频推荐系统的服务器端,所述视频推荐系统还包括TV端,如图2所示,该装置可以包括:
语音信号接收模块101,用于接收由TV端发送的、第一用户的语音信号及该TV端的标识信息;
声纹模型建立模块102,用于根据所述第一用户的语音信号建立第一用户的声纹模型;
声纹模型匹配模块103,用于将第一用户的声纹模型与预先存储的、所述TV端的标识信息对应的所有标准声纹模型进行匹配,确定与第一用户的声纹模型匹配的第一标准声纹模型;
视频推荐模块104,用于向第一用户推荐与所述第一标准声纹模型对应的待推荐视频;所述待推荐视频根据所述第一标准声纹模型对应的视频播放记录确定;所述视频播放记录根据TV端定时发送的当前视频播放信息获得。
由上述技术方案可见,本发明实施例能过在服务器侧预先建立TV端对应的标准声纹模型,在接收到该TV端的第一用户的语音信号后,建立第一用户的声纹模型,并将第一用户的声纹模型与预先存储的、所述TV端的标识信息对应的所有标准声纹模型进行匹配,确定与第一用户的声纹模型匹配的第一标准声纹模型,并向第一用户推荐与所述第一标准声纹模型对应的待推荐视频;所述待推荐视频根据所述第一标准声纹模型对应的视频播放记录确定。这样,一方面,确定第一用户的待推荐视频时,可以根据第一用户的视频播放记录确定,另一方面,向第一用户推荐时,也可以准确识别出第一用户,因此,视频推荐的准确度较高。
在实际应用中,上述装置还可以包括:声纹模型记录模块,用于在所述声纹模型匹配模块103确定与第一用户的声纹模型匹配的第一标准声纹模型之后,将所述第一标准声纹模型记录为当前TV端对应的声纹模型;
所述视频播放记录在所述声纹模型记录模块将所述第一标准声纹模型记录为当前TV端对应的声纹模型后,根据TV端定时发送的当前视频播放信息获得。
在实际应用中,上述装置还可以包括:待推荐视频确定模块,包括:
第一特征向量确定子模块,用于根据所述第一标准声纹模型对应的视频播放记录,确定第一标准声纹模型所对应的目标视频信息特征向量;
第二特征向量确定子模块,用于确定所述视频播放记录所对应的视频之外的其它视频的视频信息特征向量;
相似度计算子模块,用于计算目标视频信息特征向量与其它视频的视频信息特征向量的相似度;
待推荐视频选择子模块,用于根据相似度的大小,从其所述它视频中选择预设数量的视频作为待推荐视频。
在实际应用中,上述装置中的声纹模型建立模块102可以包括:
声纹特征确定子模块,用于根据所接收的第一用户的语音信号,确定该语音信号对应的声纹特征;
矢量量化码书确定子模块,用于将所确定的声纹特征进行矢量量化处理,得到该声纹特征对应的第一用户的矢量量化码书,将所述第一用户的矢量量化码书作为第一用户的声纹模型;
所述所有标准声纹模型为预先存储的、所述TV端的标识信息对应的所有用户的标准矢量量化码书;
所述声纹模型匹配模块103,包括:
欧式距离计算子模块,用于计算第一用户的矢量量化码书与所述所有用户的标准矢量量化码书的欧式距离;
最小欧式距离确定子模块,用于确定所得到的欧式距离的最小值;
判断子模块,用于判断所述最小值是否满足预设的阈值;
匹配子模块,用于在满足的情况下,将所述最小值对应的标准矢量量化码书作为与第一用户的声纹模型匹配的第一标准声纹模型。
在实际应用中,上述装置还可以包括:声纹模型替换模块,用于在所述确定与第一用户的声纹模型匹配的第一标准声纹模型之后,将所述第一标准声纹模型替换为所述第一用户的声纹模型。
需要说明的是,上述各装置的具体实施方式,即可单独实施也可以部分或全部组合在一起实施,具体的实施方式由本领域技术人员来确定,本发明在此不作限定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种视频推荐方法,应用于视频推荐系统的服务器端,所述视频推荐系统还包括TV端,其特征在于,该方法包括:
接收由TV端发送的、第一用户的语音信号及该TV端的标识信息;
根据所述第一用户的语音信号建立第一用户的声纹模型;
将第一用户的声纹模型与预先存储的、所述TV端的标识信息对应的所有标准声纹模型进行匹配,确定与第一用户的声纹模型匹配的第一标准声纹模型;
向第一用户推荐与所述第一标准声纹模型对应的待推荐视频;所述待推荐视频根据所述第一标准声纹模型对应的视频播放记录确定;所述视频播放记录根据TV端定时发送的当前视频播放信息获得。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:所述在确定与第一用户的声纹模型匹配的第一标准声纹模型之后,将所述第一标准声纹模型记录为当前TV端对应的声纹模型;
所述视频播放记录在将所述第一标准声纹模型记录为当前TV端对应的声纹模型后,根据TV端定时发送的当前视频播放信息获得。
3.如权利要求1所述的方法,其特征在于,所述待推荐视频的确定方法,包括:
根据所述第一标准声纹模型对应的视频播放记录,确定第一标准声纹模型所对应的目标视频信息特征向量;
确定所述视频播放记录所对应的视频之外的其它视频的视频信息特征向量;
计算目标视频信息特征向量与其它视频的视频信息特征向量的相似度;
根据相似度的大小,从其所述它视频中选择预设数量的视频作为待推荐视频。
4.如权利要求1所述的方法,其特征在于,根据所述第一用户的语音信号建立第一用户的声纹模型,包括:
根据所接收的第一用户的语音信号,确定该语音信号对应的声纹特征;
将所确定的声纹特征进行矢量量化处理,得到该声纹特征对应的第一用户的矢量量化码书,将所述第一用户的矢量量化码书作为第一用户的声纹模型;
所述所有标准声纹模型为预先存储的、所述TV端的标识信息对应的所有用户的标准矢量量化码书;
所述将第一用户的声纹模型与预先存储的、所述TV端的标识信息对应的所有标准声纹模型进行匹配,确定与该用户的声纹模型匹配的第一标准声纹模型,包括:
计算第一用户的矢量量化码书与所述所有用户的标准矢量量化码书的欧式距离;
确定所得到的欧式距离的最小值;
判断所述最小值是否满足预设的阈值;
在满足的情况下,将所述最小值对应的标准矢量量化码书作为与第一用户的声纹模型匹配的第一标准声纹模型。
5.如权利要求1所述的方法,其特征在于,还包括:在所述确定与第一用户的声纹模型匹配的第一标准声纹模型之后,将所述第一标准声纹模型替换为所述第一用户的声纹模型。
6.一种视频推荐装置,应用于视频推荐系统的服务器端,所述视频推荐系统还包括TV端,其特征在于,该装置包括:
语音信号接收模块,用于接收由TV端发送的、第一用户的语音信号及该TV端的标识信息;
声纹模型建立模块,用于根据所述第一用户的语音信号建立第一用户的声纹模型;
声纹模型匹配模块,用于将第一用户的声纹模型与预先存储的、所述TV端的标识信息对应的所有标准声纹模型进行匹配,确定与第一用户的声纹模型匹配的第一标准声纹模型;
视频推荐模块,用于向第一用户推荐与所述第一标准声纹模型对应的待推荐视频;所述待推荐视频根据所述第一标准声纹模型对应的视频播放记录确定;所述视频播放记录根据TV端定时发送的当前视频播放信息获得。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:声纹模型记录模块,用于在所述声纹模型匹配模块确定与第一用户的声纹模型匹配的第一标准声纹模型之后,将所述第一标准声纹模型记录为当前TV端对应的声纹模型;
所述视频播放记录在所述声纹模型记录模块将所述第一标准声纹模型记录为当前TV端对应的声纹模型后,根据TV端定时发送的当前视频播放信息获得。
8.如权利要求6所述的装置,其特征在于,所述装置还包括:待推荐视频确定模块,包括:
第一特征向量确定子模块,用于根据所述第一标准声纹模型对应的视频播放记录,确定第一标准声纹模型所对应的目标视频信息特征向量;
第二特征向量确定子模块,用于确定所述视频播放记录所对应的视频之外的其它视频的视频信息特征向量;
相似度计算子模块,用于计算目标视频信息特征向量与其它视频的视频信息特征向量的相似度;
待推荐视频选择子模块,用于根据相似度的大小,从其所述它视频中选择预设数量的视频作为待推荐视频。
9.如权利要求6所述的装置,其特征在于,声纹模型建立模块包括:
声纹特征确定子模块,用于根据所接收的第一用户的语音信号,确定该语音信号对应的声纹特征;
矢量量化码书确定子模块,用于将所确定的声纹特征进行矢量量化处理,得到该声纹特征对应的第一用户的矢量量化码书,将所述第一用户的矢量量化码书作为第一用户的声纹模型;
所述所有标准声纹模型为预先存储的、所述TV端的标识信息对应的所有用户的标准矢量量化码书;
所述声纹模型匹配模块,包括:
欧式距离计算子模块,用于计算第一用户的矢量量化码书与所述所有用户的标准矢量量化码书的欧式距离;
最小欧式距离确定子模块,用于确定所得到的欧式距离的最小值;
判断子模块,用于判断所述最小值是否满足预设的阈值;
匹配子模块,用于在满足的情况下,将所述最小值对应的标准矢量量化码书作为与第一用户的声纹模型匹配的第一标准声纹模型。
10.如权利要求6所述的装置,其特征在于,还包括:声纹模型替换模块,用于在所述确定与第一用户的声纹模型匹配的第一标准声纹模型之后,将所述第一标准声纹模型替换为所述第一用户的声纹模型。
CN201510543037.3A 2015-08-28 2015-08-28 一种视频推荐方法及装置 Active CN105049882B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510543037.3A CN105049882B (zh) 2015-08-28 2015-08-28 一种视频推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510543037.3A CN105049882B (zh) 2015-08-28 2015-08-28 一种视频推荐方法及装置

Publications (2)

Publication Number Publication Date
CN105049882A true CN105049882A (zh) 2015-11-11
CN105049882B CN105049882B (zh) 2019-02-22

Family

ID=54456009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510543037.3A Active CN105049882B (zh) 2015-08-28 2015-08-28 一种视频推荐方法及装置

Country Status (1)

Country Link
CN (1) CN105049882B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105872792A (zh) * 2016-03-25 2016-08-17 乐视控股(北京)有限公司 基于语音的服务推荐方法及装置
CN105872619A (zh) * 2015-12-15 2016-08-17 乐视网信息技术(北京)股份有限公司 一种视频播放记录的匹配方法及匹配装置
CN105959806A (zh) * 2016-05-25 2016-09-21 乐视控股(北京)有限公司 节目推荐方法及装置
CN105979376A (zh) * 2015-12-02 2016-09-28 乐视致新电子科技(天津)有限公司 一种推荐方法和装置
WO2017181611A1 (zh) * 2016-04-19 2017-10-26 乐视控股(北京)有限公司 在特定视频库中搜索视频的方法及其视频终端
CN107580237A (zh) * 2017-09-05 2018-01-12 深圳Tcl新技术有限公司 电视的操作方法、装置、系统和存储介质
CN108257604A (zh) * 2017-12-08 2018-07-06 平安普惠企业管理有限公司 语音识别方法、终端设备及计算机可读存储介质
CN108495143A (zh) * 2018-03-30 2018-09-04 百度在线网络技术(北京)有限公司 视频推荐的方法和装置
CN108959634A (zh) * 2018-07-25 2018-12-07 南京创维信息技术研究院有限公司 视频推荐方法、装置、设备及存储介质
CN109547854A (zh) * 2019-01-23 2019-03-29 深圳市酷开网络科技有限公司 一种基于声纹识别的电视推送方法、智能电视及存储介质
CN112118486A (zh) * 2019-06-21 2020-12-22 北京达佳互联信息技术有限公司 内容项投放方法、装置、计算机设备及存储介质
CN112135170A (zh) * 2020-09-22 2020-12-25 青岛聚看云科技有限公司 一种显示设备、服务器及视频推荐方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673544A (zh) * 2009-10-10 2010-03-17 上海电虹软件有限公司 一种基于声纹识别和定位跟踪的交叉监控方法和系统
CN103440335A (zh) * 2013-09-06 2013-12-11 北京奇虎科技有限公司 视频推荐方法及装置
CN103442290A (zh) * 2013-08-15 2013-12-11 安徽科大讯飞信息科技股份有限公司 基于电视终端用户及语音的信息提供方法及系统
CN104575504A (zh) * 2014-12-24 2015-04-29 上海师范大学 采用声纹和语音识别进行个性化电视语音唤醒的方法
US20150194155A1 (en) * 2013-06-10 2015-07-09 Panasonic Intellectual Property Corporation Of America Speaker identification method, speaker identification apparatus, and information management method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673544A (zh) * 2009-10-10 2010-03-17 上海电虹软件有限公司 一种基于声纹识别和定位跟踪的交叉监控方法和系统
US20150194155A1 (en) * 2013-06-10 2015-07-09 Panasonic Intellectual Property Corporation Of America Speaker identification method, speaker identification apparatus, and information management method
CN103442290A (zh) * 2013-08-15 2013-12-11 安徽科大讯飞信息科技股份有限公司 基于电视终端用户及语音的信息提供方法及系统
CN103440335A (zh) * 2013-09-06 2013-12-11 北京奇虎科技有限公司 视频推荐方法及装置
CN104575504A (zh) * 2014-12-24 2015-04-29 上海师范大学 采用声纹和语音识别进行个性化电视语音唤醒的方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105979376A (zh) * 2015-12-02 2016-09-28 乐视致新电子科技(天津)有限公司 一种推荐方法和装置
CN105872619A (zh) * 2015-12-15 2016-08-17 乐视网信息技术(北京)股份有限公司 一种视频播放记录的匹配方法及匹配装置
CN105872792A (zh) * 2016-03-25 2016-08-17 乐视控股(北京)有限公司 基于语音的服务推荐方法及装置
WO2017181611A1 (zh) * 2016-04-19 2017-10-26 乐视控股(北京)有限公司 在特定视频库中搜索视频的方法及其视频终端
CN105959806A (zh) * 2016-05-25 2016-09-21 乐视控股(北京)有限公司 节目推荐方法及装置
CN107580237A (zh) * 2017-09-05 2018-01-12 深圳Tcl新技术有限公司 电视的操作方法、装置、系统和存储介质
CN108257604A (zh) * 2017-12-08 2018-07-06 平安普惠企业管理有限公司 语音识别方法、终端设备及计算机可读存储介质
CN108495143A (zh) * 2018-03-30 2018-09-04 百度在线网络技术(北京)有限公司 视频推荐的方法和装置
US10694247B2 (en) 2018-03-30 2020-06-23 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for recommending video
CN108959634A (zh) * 2018-07-25 2018-12-07 南京创维信息技术研究院有限公司 视频推荐方法、装置、设备及存储介质
CN108959634B (zh) * 2018-07-25 2021-11-30 南京创维信息技术研究院有限公司 视频推荐方法、装置、设备及存储介质
CN109547854A (zh) * 2019-01-23 2019-03-29 深圳市酷开网络科技有限公司 一种基于声纹识别的电视推送方法、智能电视及存储介质
CN112118486A (zh) * 2019-06-21 2020-12-22 北京达佳互联信息技术有限公司 内容项投放方法、装置、计算机设备及存储介质
CN112118486B (zh) * 2019-06-21 2022-07-01 北京达佳互联信息技术有限公司 内容项投放方法、装置、计算机设备及存储介质
CN112135170A (zh) * 2020-09-22 2020-12-25 青岛聚看云科技有限公司 一种显示设备、服务器及视频推荐方法

Also Published As

Publication number Publication date
CN105049882B (zh) 2019-02-22

Similar Documents

Publication Publication Date Title
CN105049882A (zh) 一种视频推荐方法及装置
CN107967357B (zh) 一种好友的推送方法、系统及终端设备
CN105095508B (zh) 一种多媒体内容推荐方法和多媒体内容推荐装置
US20150365725A1 (en) Extract partition segments of personalized video channel
CN109819282B (zh) 一种视频用户类别识别方法、装置和介质
CN104575550B (zh) 多媒体文件的片头略过方法与电子装置
WO2017161744A1 (zh) 一种视频推荐方法及装置
KR102614021B1 (ko) 오디오 컨텐츠 인식 방법 및 장치
CN105045818A (zh) 一种图片的推荐方法、装置和系统
CN104104999B (zh) 音视频信息推荐方法及设备
RU2641663C1 (ru) Способ рекомендации телевизионной программы и сервер
CN107729578B (zh) 一种音乐推荐方法及装置
CN104768082A (zh) 一种音视频播放信息处理方法及服务器
CN108260008A (zh) 一种视频推荐方法、装置及电子设备
CN103310663B (zh) 一种智能点读方法、设备及系统
CN104869430A (zh) 一种视频倍速播放方法及装置
CN104750839A (zh) 一种数据推荐方法、终端及服务器
CN104639957A (zh) 移动多媒体终端、视频节目推荐方法及其服务器
CN106802913A (zh) 一种播放内容推荐方法及其装置
CN108540860B (zh) 一种视频召回方法和装置
CN101453604A (zh) 广播节目的记录装置
CN104967690A (zh) 一种信息推送方法及装置
CN111163339A (zh) 一种短视频推荐方法及装置
CN105808719A (zh) 音频信息推荐方法及装置
CN110971973A (zh) 一种视频推送方法、装置及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant