CN115618054A - 视频推荐方法及装置 - Google Patents

视频推荐方法及装置 Download PDF

Info

Publication number
CN115618054A
CN115618054A CN202211286945.5A CN202211286945A CN115618054A CN 115618054 A CN115618054 A CN 115618054A CN 202211286945 A CN202211286945 A CN 202211286945A CN 115618054 A CN115618054 A CN 115618054A
Authority
CN
China
Prior art keywords
video
recommended
user
preference
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211286945.5A
Other languages
English (en)
Inventor
王斌
鄢彪
李双全
丁文杰
华达
杨家栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Hode Information Technology Co Ltd
Original Assignee
Shanghai Hode Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Hode Information Technology Co Ltd filed Critical Shanghai Hode Information Technology Co Ltd
Priority to CN202211286945.5A priority Critical patent/CN115618054A/zh
Publication of CN115618054A publication Critical patent/CN115618054A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种视频推荐方法。该方法包括:根据用户在观看目标视频过程中的行为数据判定用户是否喜欢目标视频;若用户喜欢目标视频,则从视频库中查找与目标视频存在逻辑关联关系的视频组;在接收到视频推荐指令时,获取用户的偏好特征向量、视频库中的每一个待推荐视频的描述特征向量及视频组中除目标视频之外的所有的第一待推荐视频的逻辑加权值;根据偏好特征向量、每一个待推荐视频的描述特征向量、逻辑加权值及预设的匹配度算法计算用户对每一个待推荐视频的偏好度;根据计算得到的所有的偏好度选择符合预设条件的待推荐视频组成推荐列表推荐给用户。本申请可提高用户体验。

Description

视频推荐方法及装置
技术领域
本申请涉及视频技术领域,尤其涉及一种视频推荐方法及装置。
背景技术
目前推荐视频使用的算法主要有:基于内容的推荐算法、基于协同的推荐算法、或者基于关联规则的推荐算法。这些推荐算法都是通过计算用户和视频之间的相似度或者是视频之间的相似度来判断某个视频是否应该被推荐。
然而,发明人发现,现有的推荐算法在视频推荐中存在以下问题:
视频和视频之间的关系除了相似关系以外,部分视频之间还存在逻辑关系。如某个电影有2部,第1部和第2部之间除了有相似关系,还有顺序关系,目前的推荐算法在推荐时,及时能同时推荐出两部电影,但推荐顺序经常是乱的。
发明内容
本申请实施例的目的是提供一种视频推荐方法及系统,可以解决现有技术中在进行视频推荐时,具有逻辑关联关系的视频进行推荐时,视频的推荐顺序经常是乱的问题。
本申请实施例的一个方面提供了一种视频推荐方法,包括:
根据所述用户在观看所述目标视频过程中的行为数据判定所述用户是否喜欢所述目标视频;
若所述用户喜欢所述目标视频,则从视频库中查找与所述目标视频存在逻辑关联关系的视频组;
在接收到视频推荐指令时,获取所述用户的偏好特征向量、所述视频库中的每一个待推荐视频的描述特征向量及所述视频组中除所述目标视频之外的所有的第一待推荐视频的逻辑加权值;
根据所述偏好特征向量、所述视频库中除所述视频组之外的每一个第二待推荐视频的描述特征向量及预设的匹配度算法计算所述用户对每一个第二待推荐视频的偏好度,并根据所述偏好特征向量、所述视频组中的每一个第一待推荐视频的描述特征向量、每一个第一待推荐视频对应的逻辑加权值及所述匹配度算法计算所述用户对每一个第一待推荐视频的偏好度;
根据计算得到的所有的偏好度选择符合预设条件的待推荐视频组成推荐列表推荐给所述用户。
可选地,所述行为数据包括所述用户对所述目标视频的观看完整度数据、互动次数数据及其他行为数据,所述其他行为数据包括评论数据、点赞数据及收藏数据中的至少一种,根据所述用户在观看所述目标视频过程中的行为数据判定所述用户是否喜欢所述目标视频包括:
从所述行为数据中提取出所述用户对所述目标视频的观看完整度、互动次数及所述其他行为数据;
根据观看完整度、所述互动次数、所述其他行为数据及预设的喜爱值算法计算所述用户对所述目标视频的喜爱值,并根据计算得到的喜爱值及预设阈值判定所述用户是否喜欢所述目标视频。
可选地,所述方法还包括:
提取所述视频库中的每一个待推荐视频的内容文本;
采用预设的语义识别算法对每一个待推荐视频的内容文本进行语义归纳,得到每一个待推荐视频的内容描述信息;
根据各个待推荐视频的内容描述信息确定具有逻辑关联关系的视频,并将所有的具有逻辑关联关系的视频组成一个视频组;
针对每一个视频组,将每一个视频组中包含的所有第三待推荐视频按照事件发展顺序进行排序,并为每一个第三待推荐视频配置对应的初始加权值;
根据每一个第三待推荐视频的初始加权值、所述用户对每一个第三待推荐视频的行为数据及预设的逻辑加权值算法计算每一个第三待推荐视频对应的逻辑加权值,并将计算得到的逻辑加权值与对应的第三待推荐视频关联保存。
可选地,所述提取所述视频库中的每一个待推荐视频的内容文本包括:
采用预设的文字识别算法提取所述视频库中的每一个待推荐视频的字幕文本,得到每一个待推荐视频的第一内容文本;
采用预设的语音识别算法提取所述视频库中的每一个待推荐视频的语音,得到每一个待推荐视频的第二内容文本;
将每一个待推荐视频的第一内容文本及第二内容文本按照时间顺序进行合并处理,得到每一个待推荐视频的内容文本。
可选地,所述将每一个待推荐视频的第一内容文本及第二内容文本按照时间顺序进行交叉合并处理,得到每一个待推荐视频的内容文本包括:
针对每一个待推荐视频的第一内容文本及第二内容文本,判断每一个待推荐视频的第一内容文本及第二内容文本在同一个视频进度下对应的语言文本是否相似;
若相似,则将相似的其中一个语言文本丢弃,并将丢弃所述语言文本后的第一内容文本及第二内容文本按照时间顺序进行交叉合并处理,得到每一个待推荐视频的内容文本。
可选地,所述从视频库中查找与所述目标视频存在逻辑关联关系的视频组包括:
依次判断所述视频库中包含的多个视频组中是否存在包含所述目标视频的视频组;
若存在视频组包含所述目标视频,则将包含所述目标视频的视频组作为与所述目标视频存在逻辑关联关系的视频组。
可选地,所述方法还包括:
获取所述用户的历史行为数据,所述历史行为数据包括所述用户在历史时间段内对观看的每一个历史视频的观看完整度数据、互动次数数据及其他历史行为数据,所述其他历史行为数据包括评论数据、点赞数据及收藏数据中的至少一种,其中,每一个历史视频具有对应的描述特征向量;
根据各个历史视频的描述特征向量、预设的权值向量、从每一个历史视频对应的观看完整度数据中提取出的观看完整度、从每一个历史视频对应的互动次数数据提取出的互动次数、每一个历史视频对应的其他历史行为数据确定所述用户的偏好特征向量。
可选地,所述描述特征向量由多个描述特征分量组成,所述权值向量由多个权值分量组成,所述根据各个历史视频的描述特征向量、预设的权值向量、从每一个历史视频对应的观看完整度数据中提取出的观看完整度、从每一个历史视频对应的互动次数数据提取出的互动次数、每一个历史视频对应的其他历史行为数据确定所述用户的偏好特征向量包括:
从所述权值向量中获取每一个描述特征分量对应的权值分量;
根据每一个描述特征分量对应的各个历史视频的所述观看完整度、所述互动次数、所述其他历史行为数据、每一个描述特征分量对应的权值分量及预设的偏好特征算法计算每一个描述特征分量对应的偏好特征分量,并将得到的所有偏好特征分量组成所述偏好特征向量。
可选地,所述根据计算得到的所有的偏好度选择符合预设条件的待推荐视频组成推荐列表推荐给所述用户包括:
对计算得到的所有的偏好度按照从大到小的顺序进行排序;
选择偏好度排在预设位以内的待推荐视频组成推荐列表推荐给所述用户。
本申请实施例的一个方面还提供了一种视频推荐装置,所述视频推荐装置包括:
判定模块,用于根据所述用户在观看所述目标视频过程中的行为数据判定所述用户是否喜欢所述目标视频;
查找模块,用于若所述用户喜欢所述目标视频,则从视频库中查找与所述目标视频存在逻辑关联关系的视频组;
获取模块,用于在接收到视频推荐指令时,获取所述用户的偏好特征向量、所述视频库中的每一个待推荐视频的描述特征向量及所述视频组中除所述目标视频之外的所有的第一待推荐视频的逻辑加权值;
计算模块,用于根据所述偏好特征向量、所述视频库中除所述视频组之外的每一个第二待推荐视频的描述特征向量及预设的匹配度算法计算所述用户对每一个第二待推荐视频的偏好度,并根据所述偏好特征向量、所述视频组中的每一个第一待推荐视频的描述特征向量、每一个第一待推荐视频对应的逻辑加权值及所述匹配度算法计算所述用户对每一个第一待推荐视频的偏好度;
推荐模块,用于根据计算得到的所有的偏好度选择符合预设条件的待推荐视频组成推荐列表推荐给所述用户。
本申请还提供了一种计算机设备,所述计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本申请实施例提供的视频推荐方法,通过在用户观看目标视频的过程中,根据所述用户在观看所述目标视频过程中的行为数据判定所述用户是否喜欢所述目标视频;若所述用户喜欢所述目标视频,则从视频库中查找与所述目标视频存在逻辑关联关系的视频组;在接收到视频推荐指令时,获取所述用户的偏好特征向量、所述视频库中的每一个待推荐视频的描述特征向量及所述视频组中除所述目标视频之外的所有的第一待推荐视频的逻辑加权值;根据所述偏好特征向量、所述视频库中除所述视频组之外的每一个第二待推荐视频的描述特征向量及预设的匹配度算法计算所述用户对每一个第二待推荐视频的偏好度,并根据所述偏好特征向量、所述视频组中的每一个第一待推荐视频的描述特征向量、每一个第一待推荐视频对应的逻辑加权值及所述匹配度算法计算所述用户对每一个第一待推荐视频的偏好度;根据计算得到的所有的偏好度选择符合预设条件的待推荐视频组成推荐列表推荐给所述用户,从而可以实现在对视频进行推荐时,不仅会考虑视频本身的特性是否满足用户的偏好习惯,同时还会考虑视频之间的逻辑关联关系顺序,这样,在进行视频推荐时会按照视频的逻辑关联关系顺序进行推荐,可以避免推荐视频的顺序是乱的,从而可以提高用户体验。
附图说明
图1为本申请实施例的视频推荐方法的环境示意图;
图2为本申请所述的视频推荐方法的一种实施例的流程图;
图3为本申请一实施方式中所述用户在观看所述目标视频过程中的行为数据判定所述用户是否喜欢所述目标视频的步骤细化流程示意图;
图4为本申请一实施方式中从视频库中查找与所述目标视频存在逻辑关联关系的视频组的步骤细化流程示意图;
图5为本申请所述的视频推荐方法的另一种实施例的流程图;
图6为本申请一实施方式中提取所述视频库中的每一个待推荐视频的内容文本的步骤细化流程示意图;
图7为本申请一实施方式中将每一个待推荐视频的第一内容文本及第二内容文本按照时间顺序进行交叉合并处理,得到每一个待推荐视频的内容文本的步骤细化流程示意图;
图8为本申请所述的视频推荐方法的另一种实施例的流程图;
图9为本申请一实施方式中根据各个历史视频的描述特征向量、预设的权值向量、从每一个历史视频对应的观看完整度数据中提取出的观看完整度、从每一个历史视频对应的互动次数数据提取出的互动次数、每一个历史视频对应的其他历史行为数据确定所述用户的步骤细化流程示意图;
图10为本申请一实施方式中根据计算得到的所有的偏好度选择符合预设条件的待推荐视频组成推荐列表推荐给所述用户的步骤细化流程示意图;
图11为本申请所述的视频推荐装置的一种实施例的程序模块图;
图12为本申请实施例提供的执行视频推荐方法的计算机设备的硬件结构示意图。
具体实施方式
以下结合附图与具体实施例进一步阐述本申请的优点。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在本申请的描述中,需要理解的是,步骤前的数字标号并不标识执行步骤的前后顺序,仅用于方便描述本申请及区别每一步骤,因此不能理解为对本申请的限制。
图1示意性示出了根据本申请实施例的视频推荐方法的应用环境示意图。在示例性的实施例中,该应用环境的系统可包括用户终端10、服务器20。其中,用户终端10与服务器20形成无线或有线连接,且用户终端10具有相应的应用客户端或网页客户端。其中,用户终端10可以为PC、手机、iPAD,平板电脑、笔记本电脑、个人数字助理等。服务器20可以为机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。
参阅图2,其为本申请一实施例的视频推荐方法的流程示意图。可以理解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定。该视频推荐方法应用于服务器端。从图中可以看出,本实施例中所提供的视频推荐方法包括:
步骤S20、根据所述用户在观看所述目标视频过程中的行为数据判定所述用户是否喜欢所述目标视频。
具体地,所述行为数据包括所述用户对所述目标视频的观看完整度数据、互动次数数据及其他行为数据,所述其他行为数据包括评论数据、点赞数据及收藏数据中的至少一种。
其中,所述观看完整度数据为记录用户观看的目标视频的观看完整度的数据。
所述互动次数数据为用于记录用户在观看所述目标视频的过程中进行的互动次数的数据。
在本实施例中,当用户完成目标视频的观看后,可以将用户在观看所述目标视频的过程中的行为数据上传至服务器,以便服务器可以获取到所述行为数据,并根据获取到的行为数据判定用户是否喜欢所述目标视频。
需要说明的是,所述目标视频指的是所述用户当前观看的视频,所述目标视频可以为长视频,也可以为短视频,在本实施例中不作限定。
在一示例性的实施方式中,所述行为数据包括所述用户对所述目标视频的观看完整度数据、互动次数数据及其他行为数据,所述其他行为数据包括评论数据、点赞数据及收藏数据中的至少一种,参阅图3,根据所述用户在观看所述目标视频过程中的行为数据判定所述用户是否喜欢所述目标视频包括:
步骤S30,从所述行为数据中提取出所述用户对所述目标视频的观看完整度、互动次数及所述其他行为数据。
具体地,所述观看完整度为用户观看目标视频的观看时长占整个目标视频时长的比例,比如,对于一个时长10分钟的目标视频,用户对该目标视频观看了8分钟,则所述观看完整度为8/10=80%。
所述互动次数指的是用户在观看目标视频的过程中发送弹幕的次数。
步骤S31,根据观看完整度、所述互动次数、所述其他行为数据及预设的喜爱值算法计算所述用户对所述目标视频的喜爱值,并根据计算得到的喜爱值及预设阈值判定所述用户是否喜欢所述目标视频。
具体地,喜爱值算法为预先设定的用于计算所述用户对目标视频的喜爱值的公式。所述喜爱值为用于衡量用户对所述目标视频喜爱程度的数值,所述喜爱值越大,表明用户对目标视频越喜欢,所述喜爱值越小,表明用户对目标视频越不喜欢。所述喜爱值算法为:
f(x)=观看完整度*Ψ0+1/(1+exp(-log(2,互动次数+1)))-0.5)*Ψ1+(评论?Ψ2:0)+(点赞?Ψ3:0)+(收藏?Ψ4:0),其中,f(x)为所述用户对所述目标视频的喜爱值,exp为高等数学里以自然常数e为底的指数函数,Ψ0、Ψ1、Ψ2、Ψ3及Ψ4为预设数值。“评论?2:0”表示若所述其他行为数据中包含有评论数据,则在喜爱值算法中“+”上“Ψ2”,若所述其他行为数据中不包含有评论数据,则在喜爱值算法中“+”上“0”。同理,“点赞?Ψ3:0”表示若所述其他行为数据中包含有点赞数据,则在喜爱值算法中“+”上“Ψ3”,若所述其他行为数据中不包含有点赞数据,则在喜爱值算法中“+”上“0”。同理,“收藏?Ψ4:0”表示若所述其他行为数据中包含有收藏数据,则在喜爱值算法中“+”上“Ψ4”,若所述其他行为数据中不包含有收藏数据,则在喜爱值算法中“+”上“0”。
在本实施例中,在得到观看完整度、所述互动次数、所述其他行为数据后,将这些数据代入至喜爱值算法中,即可以计算得到用户对所述目标视频的喜爱值。
所述预设阈值为预先设定的用于判定用户是否喜欢所述目标视频的阈值,所述预设阈值可以根据实际情况进行设定与调整,比如,所述预设阈值为2,则表明当喜爱值大于或者等于2时,可以判定用户喜欢所述目标视频,当喜爱值小于2时,则可以判定用户不喜欢所述目标视频。
步骤S21,若所述用户喜欢所述目标视频,则从视频库中查找与所述目标视频存在逻辑关联关系的视频组。
具体地,预先会将视频库中存储的所有视频按照逻辑关联关系关系划分为多个视频组,这样,当检测到用户喜欢所述目标视频时,即可以从视频库中查找到与目标视频存在逻辑关联关系的视频组。
其中,若两个或者两个以上的视频所涉及的事件名称相近,涉及主角相同,以及事件内容相似,则可以认为这些视频之间存在逻辑关联关系。所有存在逻辑关联关系的视频组成一个视频组。
所述视频库为用于存储所有的视频的数据库。
在一示例性的实施方式中,参阅图4,所述从视频库中查找与所述目标视频存在逻辑关联关系的视频组包括:步骤S40,依次判断所述视频库中包含的多个视频组中是否存在包含所述目标视频的视频组;步骤S41,若存在视频组包含所述目标视频,则将包含所述目标视频的视频组作为与所述目标视频存在逻辑关联关系的视频组。
在一实施方式中,可以通过将所述目标视频的标识信息与各个视频组中包含的视频的标识信息进行一一比对的方式来判断多个视频组中是否存在包含所述目标视频的视频组,当某一个视频组中存在与该目标视频的标识信息相同的视频,则可以判定该视频组为与所述目标视频存在逻辑关联关系的视频组。其中,所述标识信息为用于区分不同视频的信息,比如,所述标识信息为视频ID。
步骤S22,在接收到视频推荐指令时,获取所述用户的偏好特征向量、所述视频库中的每一个待推荐视频的描述特征向量及所述视频组中除所述目标视频之外的所有的第一待推荐视频的逻辑加权值。
具体地,所述视频推荐指令为用于向所述用户推荐视频的指令。在本实施例中,当用户想要获取推荐视频时,用户可以通过终端设备触发推荐视频获取请求,终端设备在检测到用户触发的推荐视频获取请求后,会根据该推荐视频获取后生成视频推荐指令,并将视频推荐指令发送给服务器,以便服务器在获取到该视频推荐指令湖,可以获取所述用户的偏好特征向量、所述视频库中的每一个待推荐视频的描述特征向量及所述视频组中除所述目标视频之外的所有的第一待推荐视频的逻辑加权值,然后根据这些信息来确定待推荐视频,并将待推荐视频推荐给所述用户。
其中,偏好特征向量为用于描述所述用户偏好视频类型(视频特点)所对应的第一类型向量,可以通过获取用户偏好的视频类型来确定。比如,用户的偏好如下:[喜剧:0.8,惊悚:0.2,战争:1.0,犯罪:0.4,古装:0.4],其中,数字为对用户偏好进行量化得到的偏好类型值,数字越大,表示用户对该类型的偏好越强烈;映射到视频类型向量中,可获得与视频所属类型的描述特征向量在同一向量空间中的表达:[0.8,0,0.2,0,1.0,0.4,0,0,0,0,0.4],其中,用户的偏好对应向量的第0,2,4,5,10位。上述获得的与视频所属类型的描述特征向量在同一向量空间中的表达即可称为所述偏好特征向量。
所述描述特征向量为用于描述用户观看的视频所属的第二类型向量。所述描述特征向量可以通过获取用户预先对视频所打的类型标签进行确定。假设所有的视频共有11种视频类型,用户观看的视频具有如下类型标签:喜剧、悬疑、惊悚,则该视频对应的描述特征向量为:[1,0,0,1,0,1,0,0,0,0,0],其中,视频具有的类型标签对应向量的第0,3,5位)。
可以理解的是,若总共有11种视频类型,则描述特征向量共有11维。所有视频具有的总视频类型数量可以根据实际需要进行设置,在本实施例中不作限定。每一个视频所具有的类型标签可能有一个,也也能有多个,比如,一个视频可能同时满足“惊悚”、“犯罪”和“悬疑”类型视频的特点,则这3个特点都为该视频的视频标签。
在本实施例中,每一个视频在创建或者生成时,视频的作者或者UP主可以根据这个视频在各方面的特点为这个视频增加不同维度的描述性的标签Ti,组合所有的标签Ti,生成用于全面描述这个视频特点的描述特征向量:T={T0,T1,T2,...,Tn}。其中,当视频具有对应的特点时,该对应特点的描述性的标签Ti在描述特征向量采用“1”表示,当视频不具有对应的特点时,该对应特点的描述性的标签在描述特征向量采用“0”表示。
所述逻辑加权值为对用户对视频组中的每一个第一待推荐视频的偏好度进行加权计算的数值,不同的第一待推荐视频的逻辑加权值不同。所述逻辑加权值可以预先计算得到并与对应的第一待推荐视频关联保存起来,也可以在需要获取时,根据预设的参数进行计算得到,在本实施例中不作限定。
在一示例性的实施方式中,参阅图5,所述方法还包括:
步骤S50,提取所述视频库中的每一个待推荐视频的内容文本。
具体地,可以通过语音识别算法及/或文字识别算法从所述视频库中的每一个待推荐视频中提取所述内容文本。
所述内容文本为描述待推荐视频的详细内容的文字。
在一示例性的实施方式中,参阅图6,提取所述视频库中的每一个待推荐视频的内容文本包括:
步骤S60,采用预设的文字识别算法提取所述视频库中的每一个待推荐视频的字幕文本,得到每一个待推荐视频的第一内容文本。
具体地,所述文字识别算法为现有技术中的OCR识别算法,在本实施例中不再赘述。
所述字幕文本为所述待推荐视频中的所有字幕。
步骤S61,采用预设的语音识别算法提取所述视频库中的每一个待推荐视频的语音,得到每一个待推荐视频的第二内容文本。
具体地,所述语音识别算法为现有技术中的一种算法,比如可以为基于动态时间规整(Dynamic Time Warping)的算法、基于参数模型的隐马尔可夫模型(HMM)的方法等。
步骤S62,将每一个待推荐视频的第一内容文本及第二内容文本按照时间顺序进行合并处理,得到每一个待推荐视频的内容文本。
具体地,所述时间顺序指的是识别出的第一内容文本及所述第二内容文本中包含的句子对应的视频进度顺序。
作为示例,第一内容文本由5句话组成,每一句话对应的视频进度依次为1分钟、2分钟、3分钟、4分钟、5分钟。第二内容文本也由5句话组成,每一句话对应的视频进度依次为1分10秒、2分10秒、3分10秒、4分10秒、5分10秒。在进行内容合并后,得到的内容文本中的句子顺序依次为1分钟、1分10秒、2分钟、2钟10秒、3分钟、3分10秒、4分钟、4分10秒、5分钟、5分10秒的句子组成。
在一示例性的实施方式中,参阅图7,所述将每一个待推荐视频的第一内容文本及第二内容文本按照时间顺序进行交叉合并处理,得到每一个待推荐视频的内容文本包括:步骤S70,针对每一个待推荐视频的第一内容文本及第二内容文本,判断每一个待推荐视频的第一内容文本及第二内容文本在同一个视频进度下对应的语言文本是否相似;S71,若相似,则将相似的其中一个语言文本丢弃,并将丢弃所述语言文本后的第一内容文本及第二内容文本按照时间顺序进行交叉合并处理,得到每一个待推荐视频的内容文本。
具体地,所述语言文本指的是所述第一内容文本或所述第二内容文本中包含的句子。
在本实施例中,可以通过基于统计的方法或者基于深度学习的方法来判断第一内容文本及第二内容文本在同一个视频进度下对应的语言文本。其中,基于统计的方法可以为莱文斯坦距离算法、BM25算法、TFIDF算法等。基于深度学习的方法可以为基于Word2vec的余弦相似度算法。当检测到两个语言文本相似时,则可以将其中一个语言文本丢弃,避免在最终的内容文本中出现重复文本。在将计算得到的所有的相似的语言文本丢弃之后,即可以将剩余的语言文本按照上述示例得到的内容文本的方式进行交叉合并,得到最终的内容文本K。
作为示例,K={K0,K1,K2,...,Kn},其中,K0,K1,K2,...,Kn指一个视频进度下的语言文本。
步骤S51,采用预设的语义识别算法对每一个待推荐视频的内容文本进行语义归纳,得到每一个待推荐视频的内容描述信息。
具体地,所述语义识别算法也可以称为语义理解算法。本实施例中的语音识别算法采用现有技术中的成熟的任意一种语义识别算法,具体的算法在本实施例中不再赘述。
所述内容描述信息为用于对待推荐视频中的主要内容进行描述的信息,可以包括待推荐视频中涉及的事件名称、主角人物、事件内容,以及事件进度等信息。
步骤S52,根据各个待推荐视频的内容描述信息确定具有逻辑关联关系的视频,并将所有的具有逻辑关联关系的视频组成一个视频组。
具体地,在得到各个待推荐视频的内容描述信息后,可以根据内容描述信息中包含的事件名称、事件内容以及主角人物来确定各个视频之间是否存在逻辑关联关系。在本实施例中,当多个视频涉及的事件名称相近,涉及主角相同,以及事件内容相似时,则可以确定这些视频为具有逻辑关联关系的视频,并将这些视频组成一个视频组。
需要说明的是,具有不同逻辑关联关系的视频,可以组成不同的视频组。
步骤S53,针对每一个视频组,将每一个视频组中包含的所有第三待推荐视频按照事件发展顺序进行排序,并为每一个第三待推荐视频配置对应的初始加权值。
具体地,事件发展顺序指的是视频中记载的内容的先后发生顺序。比如,一个视频组为一个综艺节目的10期节目,则所述视频组中的视频需要节目的期数进行顺序排序。
作为示例,每一个第三待推荐视频配置对应的初始加权值如下所述:
Ψ={Ψ0,Ψ1,Ψ2,...,Ψn},Ψ0,Ψ1,Ψ2,...,Ψn分别为视频组中按照事件发展顺序排序后的各个视频对应的初始加权值,即第一个视频的初始加权值为Ψ0,第二个视频的初始加权值为Ψ2,以此类推,第n个视频的初始加权值为Ψn,其中,Ψi<Ψ(i+1)。
步骤S54,根据每一个第三待推荐视频的初始加权值、所述用户对每一个第三待推荐视频的行为数据及预设的逻辑加权值算法计算每一个第三待推荐视频对应的逻辑加权值,并将计算得到的逻辑加权值与对应的第三待推荐视频关联保存。
具体地,逻辑加权值算法为预先设定的用于计算每一个第三待推荐视频对应的逻辑加权值的公式。逻辑加权值算法具体为:
当前Ψi=Ψi*f(x),其中,当前Ψi为第三待推荐视频对应的逻辑加权值,Ψi为第三待推荐视频对应的初始加权值,f(x)为用户对第三待推荐视频的喜爱值,f(x)的具体计算方式在上文中已详细描述,在本实施例中不再赘述。
在本实施例中,在通过上述公式计算出每一个第三待推荐视频对应的逻辑加权值后,可以将计算得到的逻辑加权值与对应的第三待推荐视频进行关联保存。这样,在后续对计算该第三待推荐视频的偏好度时,可以很方便获取到逻辑加权值。
步骤S23,根据所述偏好特征向量、所述视频库中除所述视频组之外的每一个第二待推荐视频的描述特征向量及预设的匹配度算法计算所述用户对每一个第二待推荐视频的偏好度,并根据所述偏好特征向量、所述视频组中的每一个第一待推荐视频的描述特征向量、每一个第一待推荐视频对应的逻辑加权值及所述匹配度算法计算所述用户对每一个第一待推荐视频的偏好度。
具体地,匹配度算法为预先设定的用于计算用户对每一个待推荐视频的偏好度的公式。所述匹配度算法具体为:
Y=ɑ*1/exp(d),其中,Y为用户对每一个待推荐视频的匹配度,ɑ为预设数值,d为所述偏好特征向量与每一个待推荐视频的描述特征向量的相似度值。需要说明的是,所述相似度值可以为所述偏好特征向量与每一个待推荐视频的描述特征向量的余弦相似度值,也可以为所述偏好特征向量与每一个待推荐视频的描述特征向量的欧拉距离。
在本实施例中,当d越小,用户偏好度越大,表示用户越喜欢这个视频;当d越大,用户偏好度越小,表示用户越不喜欢这个视频。
在本实施例中,当通过上述公式计算出用户对每一个二待推荐视频的匹配度后,可以将该匹配度作为所述用户对每一个二待推荐视频的偏好度。当通过上述公式计算出用户对每一个第一待推荐视频的匹配度后,需要将该计算得到的匹配度值再乘以对应的逻辑加权值,并将得到的数值作为用户对每一个第一待推荐视频的偏好度。也就是说,用户对每一个二待推荐视频的偏好度==ɑ*1/exp(d),用户对每一个第一待推荐视频的偏好度=ɑ*1/exp(d)*Ψi,其中,Ψi为该第一待推荐视频对应的逻辑加权值。
在一示例性的实施方式中,参阅图8,所述方法还包括:
步骤S80,获取所述用户的历史行为数据,所述历史行为数据包括所述用户在历史时间段内对观看的每一个历史视频的观看完整度数据、互动次数数据及其他历史行为数据,所述其他历史行为数据包括评论数据、点赞数据及收藏数据中的至少一种,其中,每一个历史视频具有对应的描述特征向量。
具体地,所述历史时间段可以根据实际情况进行设定与调整,比如,所述历史时间段为过去半年,过去3个月等。
所述观看完整度数据、互动次数数据及其他历史行为数据已在上文详细描述,在本实施例中不再赘述。
所述历史视频为所述用户在历史时间段内观看的视频。
步骤S81,根据各个历史视频的描述特征向量、预设的权值向量、从每一个历史视频对应的观看完整度数据中提取出的观看完整度、从每一个历史视频对应的互动次数数据提取出的互动次数、每一个历史视频对应的其他历史行为数据确定所述用户的偏好特征向量。
具体地,所述权值向量为预先设定的用于确认每一个描述特征向量对应的权值分量的向量。
作为示例,权值向量V={V0,V1,V2,...,Vn},其中,V0,V1,V2,...,Vn为权值分量,每一个权值分量与一个描述特征分量对应。比如,描述特征向量T={T0,T1,T2,...,Tn},则权值分量V0与T0对应,权值分量V1与T1对应,权值分量V2与T2对应,权值分量Vn与Tn对应。
在本实施例中,通过机器学习算法学习用户对各种类型的历史视频的观看完整度,弹幕互动次数,评论,点赞,收藏等行为数据,从而得到用户的偏好特征向量。
在一示例性的实施方式中,所述描述特征向量由多个描述特征分量组成,比如,所述描述特征向量T={T0,T1,T2,...,Tn},其中,T0,T1,T2,...,Tn为描述特征分量。所述权值向量由多个权值分量组成,比如,权值向量V={V0,V1,V2,...,Vn},其中,V0,V1,V2,...,Vn为权值分量。参阅图9,所述根据各个历史视频的描述特征向量、预设的权值向量、从每一个历史视频对应的观看完整度数据中提取出的观看完整度、从每一个历史视频对应的互动次数数据提取出的互动次数、每一个历史视频对应的其他历史行为数据确定所述用户的偏好特征向量包括:
步骤S90,从所述权值向量中获取每一个描述特征分量对应的权值分量。
具体地,假设总共有11个描述特征分量,则在计算的过程中,需要依次获取第1个描述特征分量对应的权值分量,第2个描述特征分量对应的权值分量,第3个描述特征分量对应的权值分量,第4个描述特征分量对应的权值分量,第5个描述特征分量对应的权值分量,第6个描述特征分量对应的权值分量,第7个描述特征分量对应的权值分量,第8个描述特征分量对应的权值分量,第9个描述特征分量对应的权值分量,第10个描述特征分量对应的权值分量,第11个描述特征分量对应的权值分量。
步骤S91,根据每一个描述特征分量对应的各个历史视频的所述观看完整度、所述互动次数、所述其他历史行为数据、每一个描述特征分量对应的权值分量及预设的偏好特征算法计算每一个描述特征分量对应的偏好特征分量,并将得到的所有偏好特征分量组成所述偏好特征向量。
具体地,所述偏好特征算法为预先设定的用于计算得到偏好特征分量的公式。
所述偏好特征算法为:
Pi=Pi历史+Vi*f(x);
f(x)=观看完整度*Ψ0+1/(1+exp(-log(2,互动次数+1)))-0.5)*Ψ1+(评论?Ψ2:0)+(点赞?Ψ3:0)+(收藏?Ψ4:0),其中,Pi为描述特征分量Ti对应的偏好特征分量,Pi历史为当前Pi更新之前的值,Ti为历史视频的描述特征向量中的任意一个描述特征分量,Vi为描述特征分量Ti对应的权值分量。f(x)在上述实施例中已详细描述,在本实施例中不再赘述。
在本实施例中,通过上述公式依次对每一个描述特征分量对应的各个历史视频进行训练学习,以最终得到每一个描述特征分量对应的偏好特征分量。
作为示例,对于第一个描述特征分量T0对应的各个历史视频进行学习训练,以最终得到T0对应的偏好特征分量P0的训练过程如下:
先将第一个描述特征分量T0对应的第1个历史视频的所述观看完整度、所述互动次数、所述其他历史行为数据代入至上述计算f(x)的公式中,得到第一次训练后的f(x)值。在得到第一次训练后的f(x)值后,根据该f(x)值、第一个描述特征分量T0对应的权值分量及Pi历史值计算第一次训练后的P0值,其中,第一次训练时Pi历史为预设的初始值。
在完成第一次训练后,先将第一个描述特征分量T0对应的第2个历史视频的所述观看完整度、所述互动次数、所述其他历史行为数据代入至上述计算f(x)的公式中,得到第二次训练后的f(x)值。在得到第二次训练后的f(x)值后,根据该f(x)值、第一个描述特征分量T0对应的权值分量及Pi历史值计算第二次训练后的P0值,其中,第二次训练时Pi历史为第一次训练后得到的P0值。
以此类推,在进行最后一次训练时,先将第一个描述特征分量T0对应的最后一个历史视频的所述观看完整度、所述互动次数、所述其他历史行为数据代入至上述计算f(x)的公式中,得到最后一次训练的f(x)值。在得到最后一次训练的f(x)值后,根据该f(x)值、第一个描述特征分量T0对应的权值分量及Pi历史值计算最后一次训练后的P0值,并将该最后一次训练的P0值作为第一个描述特征分量T0对应的偏好特征分量。其中,最后一次训练时Pi历史为上一次训练后得到的P0值。
步骤S24、根据计算得到的所有的偏好度选择符合预设条件的待推荐视频组成推荐列表推荐给所述用户。
具体地,所述预设条件为预先设定的用于从视频库中选择视频作为推荐列表中的视频的条件,比如,所述预设条件为选择偏好度排在10位以内的视频,即在进行视频推荐时,选择选择偏好度值处于10位以内的待推荐视频作为推荐列表中的视频。
在一示例性的实施方式中,为了便于选择视频作为所述推荐列表中的视频,参阅图10,所述根据计算得到的所有的偏好度选择符合预设条件的待推荐视频组成推荐列表推荐给所述用户包括:步骤S100,对计算得到的所有的偏好度按照从大到小的顺序进行排序;步骤S101,选择偏好度排在预设位以内的待推荐视频组成推荐列表推荐给所述用户。
具体地,在计算得到用户对所有的待推荐视频的偏好度后,可以将这些偏好度值从大到小或者从小到大的顺序进行排序,之后可以从中选择排在预设位以内的待推荐视频组成推荐列表推荐给所述用户。
所述预定位为预先设定的,其可以根据实际情况进行设定与调整,比如,所述预设位为排名前10位。
本实施例通过在用户观看目标视频的过程中,根据所述用户在观看所述目标视频过程中的行为数据判定所述用户是否喜欢所述目标视频;若所述用户喜欢所述目标视频,则从视频库中查找与所述目标视频存在逻辑关联关系的视频组;在接收到视频推荐指令时,获取所述用户的偏好特征向量、所述视频库中的每一个待推荐视频的描述特征向量及所述视频组中除所述目标视频之外的所有的第一待推荐视频的逻辑加权值;根据所述偏好特征向量、所述视频库中除所述视频组之外的每一个第二待推荐视频的描述特征向量及预设的匹配度算法计算所述用户对每一个第二待推荐视频的偏好度,并根据所述偏好特征向量、所述视频组中的每一个第一待推荐视频的描述特征向量、每一个第一待推荐视频对应的逻辑加权值及所述匹配度算法计算所述用户对每一个第一待推荐视频的偏好度;根据计算得到的所有的偏好度选择符合预设条件的待推荐视频组成推荐列表推荐给所述用户,从而可以实现在对视频进行推荐时,不仅会考虑视频本身的特性是否满足用户的偏好习惯,同时还会考虑视频之间的逻辑关联关系顺序,这样,在进行视频推荐时会按照视频的逻辑关联关系顺序进行推荐,可以避免推荐视频的顺序是乱的,从而可以提高用户体验。
参阅图11所示,是本申请视频推荐装置110一实施例的程序模块图。
本实施例中,所述视频推荐装置110包括一系列的存储于存储器上的计算机程序指令,当该计算机程序指令被处理器执行时,可以实现本申请各实施例的视频推荐功能。在一些实施例中,基于该计算机程序指令各部分所实现的特定的操作,视频推荐装置110可以被划分为一个或模块,具体可以划分的模块如下:
判定模块111,用于根据所述用户在观看所述目标视频过程中的行为数据判定所述用户是否喜欢所述目标视频;
查找模块112,用于若所述用户喜欢所述目标视频,则从视频库中查找与所述目标视频存在逻辑关联关系的视频组;
获取模块113,用于在接收到视频推荐指令时,获取所述用户的偏好特征向量、所述视频库中的每一个待推荐视频的描述特征向量及所述视频组中除所述目标视频之外的所有的第一待推荐视频的逻辑加权值;
计算模块114,用于根据所述偏好特征向量、所述视频库中除所述视频组之外的每一个第二待推荐视频的描述特征向量及预设的匹配度算法计算所述用户对每一个第二待推荐视频的偏好度,并根据所述偏好特征向量、所述视频组中的每一个第一待推荐视频的描述特征向量、每一个第一待推荐视频对应的逻辑加权值及所述匹配度算法计算所述用户对每一个第一待推荐视频的偏好度;
推荐模块115,用于根据计算得到的所有的偏好度选择符合预设条件的待推荐视频组成推荐列表推荐给所述用户。
在一示例性的实施方式中,行为数据包括所述用户对所述目标视频的观看完整度数据、互动次数数据及其他行为数据,所述其他行为数据包括评论数据、点赞数据及收藏数据中的至少一种,判定模块111,还用于从所述行为数据中提取出所述用户对所述目标视频的观看完整度、互动次数及所述其他行为数据;根据观看完整度、所述互动次数、所述其他行为数据及预设的喜爱值算法计算所述用户对所述目标视频的喜爱值,并根据计算得到的喜爱值及预设阈值判定所述用户是否喜欢所述目标视频。
在一示例性的实施方式中,视频推荐装置110还包括提取模块、归纳模块、组成模块、排序模块及保存模块。
所述提取模块,用于提取所述视频库中的每一个待推荐视频的内容文本;
所述归纳模块,用于采用预设的语义识别算法对每一个待推荐视频的内容文本进行语义归纳,得到每一个待推荐视频的内容描述信息;
所述组成模块,用于根据各个待推荐视频的内容描述信息确定具有逻辑关联关系的视频,并将所有的具有逻辑关联关系的视频组成一个视频组;
所述排序模块,用于针对每一个视频组,将每一个视频组中包含的所有第三待推荐视频按照事件发展顺序进行排序,并为每一个第三待推荐视频配置对应的初始加权值;
所述保存模块,用于根据每一个第三待推荐视频的初始加权值、所述用户对每一个第三待推荐视频的行为数据及预设的逻辑加权值算法计算每一个第三待推荐视频对应的逻辑加权值,并将计算得到的逻辑加权值与对应的第三待推荐视频关联保存。
在一示例性的实施方式中,所述提取模块,还用于采用预设的文字识别算法提取所述视频库中的每一个待推荐视频的字幕文本,得到每一个待推荐视频的第一内容文本;采用预设的语音识别算法提取所述视频库中的每一个待推荐视频的语音,得到每一个待推荐视频的第二内容文本;将每一个待推荐视频的第一内容文本及第二内容文本按照时间顺序进行合并处理,得到每一个待推荐视频的内容文本。
在一示例性的实施方式中,所述提取模块,还用于针对每一个待推荐视频的第一内容文本及第二内容文本,判断每一个待推荐视频的第一内容文本及第二内容文本在同一个视频进度下对应的语言文本是否相似;若相似,则将相似的其中一个语言文本丢弃,并将丢弃所述语言文本后的第一内容文本及第二内容文本按照时间顺序进行交叉合并处理,得到每一个待推荐视频的内容文本。
在一示例性的实施方式中,所述查找模块112,还用于依次判断所述视频库中包含的多个视频组中是否存在包含所述目标视频的视频组;若存在视频组包含所述目标视频,则将包含所述目标视频的视频组作为与所述目标视频存在逻辑关联关系的视频组。
在一示例性的实施方式中,视频推荐装置110还包括行为数据获取模块及确定模块。
行为数据获取模块,用于获取所述用户的历史行为数据,所述历史行为数据包括所述用户在历史时间段内对观看的每一个历史视频的观看完整度数据、互动次数数据及其他历史行为数据,所述其他历史行为数据包括评论数据、点赞数据及收藏数据中的至少一种,其中,每一个历史视频具有对应的描述特征向量。
所述确定模块,用于根据各个历史视频的描述特征向量、预设的权值向量、从每一个历史视频对应的观看完整度数据中提取出的观看完整度、从每一个历史视频对应的互动次数数据提取出的互动次数、每一个历史视频对应的其他历史行为数据确定所述用户的偏好特征向量。
在一示例性的实施方式中,所述描述特征向量由多个描述特征分量组成,所述权值向量由多个权值分量组成,所述确定模块,还用于从所述权值向量中获取每一个描述特征分量对应的权值分量;根据每一个描述特征分量对应的各个历史视频的所述观看完整度、所述互动次数、所述其他历史行为数据、每一个描述特征分量对应的权值分量及预设的偏好特征算法计算每一个描述特征分量对应的偏好特征分量,并将得到的所有偏好特征分量组成所述偏好特征向量。
在一示例性的实施方式中,所述推荐模块115,还用于对计算得到的所有的偏好度按照从大到小的顺序进行排序;选择偏好度排在预设位以内的待推荐视频组成推荐列表推荐给所述用户。
图12示意性示出了根据本申请实施例的适于实现视频推荐方法的计算机设备12的硬件架构示意图。本实施例中,计算机设备12是一种能够按照事先设定或者存储的指令,自动进行数值计算出和/或信息处理的设备。例如,可以是平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者服务器所组成的服务器集群)等。如图12所示,计算机设备12至少包括但不限于:可通过系统总线相互通信链接存储器120、处理器121、网络接口122。其中:
存储器120至少包括一种类型的计算机可读存储介质,该可读存储介质可以是易失性的,也可以是非易失性的,具体而言,可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器120可以是计算机设备12的内部存储模块,例如该计算机设备12的硬盘或内存。在另一些实施例中,存储器120也可以是计算机设备12的外部存储设备,例如该计算机设备12上配备的插接式硬盘,智能存储卡(Smart Media Card,简称为SMC),安全数字(Secure Digital,简称为SD)卡,闪存卡(Flash Card)等。当然,存储器120还可以既包括计算机设备12的内部存储模块也包括其外部存储设备。本实施例中,存储器120通常用于存储安装于计算机设备12的操作系统和各类应用软件,例如视频推荐方法的程序代码等。此外,存储器120还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器121在一些实施例中可以是中央处理器(Central Processing Unit,简称为CPU)、控制器、微控制器、微处理器、或其它视频推荐芯片。该处理器121通常用于控制计算机设备12的总体操作,例如执行与计算机设备12进行数据交互或者通信相关的控制和处理等。本实施例中,处理器121用于运行存储器120中存储的程序代码或者处理数据。
网络接口122可包括无线网络接口或有线网络接口,该网络接口122通常用于在计算机设备12与其它计算机设备之间建立通信链接。例如,网络接口122用于通过网络将计算机设备12与外部终端相连,在计算机设备12与外部终端之间的建立数据传输通道和通信链接等。网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(GlobalSystem of Mobile communication,简称为GSM)、宽带码分多址(Wideband Code DivisionMultiple Access,简称为WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
需要指出的是,图12仅示出了具有部件120~122的计算机设备,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器120中的视频推荐方法可以被分割为一个或者程序模块,并由一个或处理器(本实施例为处理器121)所执行,以完成本申请。
本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质其上存储有计算机程序,计算机程序被处理器执行时实现实施例中的视频推荐方法的步骤。
本实施例中,计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,计算机可读存储介质可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,计算机可读存储介质也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,简称为SMC),安全数字(Secure Digital,简称为SD)卡,闪存卡(Flash Card)等。当然,计算机可读存储介质还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,计算机可读存储介质通常用于存储安装于计算机设备的操作系统和各类应用软件,例如实施例中的视频推荐方法的程序代码等。此外,计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的各类数据。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到至少两个网络单元上。可以根据实际的需要筛选出其中的部分或者全部模块来实现本申请实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域普通技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (12)

1.一种视频推荐方法,其特征在于,所述方法包括:
根据所述用户在观看所述目标视频过程中的行为数据判定所述用户是否喜欢所述目标视频;
若所述用户喜欢所述目标视频,则从视频库中查找与所述目标视频存在逻辑关联关系的视频组;
在接收到视频推荐指令时,获取所述用户的偏好特征向量、所述视频库中的每一个待推荐视频的描述特征向量及所述视频组中除所述目标视频之外的所有的第一待推荐视频的逻辑加权值;
根据所述偏好特征向量、所述视频库中除所述视频组之外的每一个第二待推荐视频的描述特征向量及预设的匹配度算法计算所述用户对每一个第二待推荐视频的偏好度,并根据所述偏好特征向量、所述视频组中的每一个第一待推荐视频的描述特征向量、每一个第一待推荐视频对应的逻辑加权值及所述匹配度算法计算所述用户对每一个第一待推荐视频的偏好度;
根据计算得到的所有的偏好度选择符合预设条件的待推荐视频组成推荐列表推荐给所述用户。
2.根据权利要求1所述的视频推荐方法,其特征在于,所述行为数据包括所述用户对所述目标视频的观看完整度数据、互动次数数据及其他行为数据,所述其他行为数据包括评论数据、点赞数据及收藏数据中的至少一种,根据所述用户在观看所述目标视频过程中的行为数据判定所述用户是否喜欢所述目标视频包括:
从所述行为数据中提取出所述用户对所述目标视频的观看完整度、互动次数及所述其他行为数据;
根据观看完整度、所述互动次数、所述其他行为数据及预设的喜爱值算法计算所述用户对所述目标视频的喜爱值,并根据计算得到的喜爱值及预设阈值判定所述用户是否喜欢所述目标视频。
3.根据权利要求1所述的视频推荐方法,其特征在于,所述方法还包括:
提取所述视频库中的每一个待推荐视频的内容文本;
采用预设的语义识别算法对每一个待推荐视频的内容文本进行语义归纳,得到每一个待推荐视频的内容描述信息;
根据各个待推荐视频的内容描述信息确定具有逻辑关联关系的视频,并将所有的具有逻辑关联关系的视频组成一个视频组;
针对每一个视频组,将每一个视频组中包含的所有第三待推荐视频按照事件发展顺序进行排序,并为每一个第三待推荐视频配置对应的初始加权值;
根据每一个第三待推荐视频的初始加权值、所述用户对每一个第三待推荐视频的行为数据及预设的逻辑加权值算法计算每一个第三待推荐视频对应的逻辑加权值,并将计算得到的逻辑加权值与对应的第三待推荐视频关联保存。
4.根据权利要求3所述的视频推荐方法,其特征在于,所述提取所述视频库中的每一个待推荐视频的内容文本包括:
采用预设的文字识别算法提取所述视频库中的每一个待推荐视频的字幕文本,得到每一个待推荐视频的第一内容文本;
采用预设的语音识别算法提取所述视频库中的每一个待推荐视频的语音,得到每一个待推荐视频的第二内容文本;
将每一个待推荐视频的第一内容文本及第二内容文本按照时间顺序进行合并处理,得到每一个待推荐视频的内容文本。
5.根据权利要求4所述的视频推荐方法,其特征在于,所述将每一个待推荐视频的第一内容文本及第二内容文本按照时间顺序进行交叉合并处理,得到每一个待推荐视频的内容文本包括:
针对每一个待推荐视频的第一内容文本及第二内容文本,判断每一个待推荐视频的第一内容文本及第二内容文本在同一个视频进度下对应的语言文本是否相似;
若相似,则将相似的其中一个语言文本丢弃,并将丢弃所述语言文本后的第一内容文本及第二内容文本按照时间顺序进行交叉合并处理,得到每一个待推荐视频的内容文本。
6.根据权利要求3所述的视频推荐方法,其特征在于,所述从视频库中查找与所述目标视频存在逻辑关联关系的视频组包括:
依次判断所述视频库中包含的多个视频组中是否存在包含所述目标视频的视频组;
若存在视频组包含所述目标视频,则将包含所述目标视频的视频组作为与所述目标视频存在逻辑关联关系的视频组。
7.根据权利要求1至6所述的视频推荐方法,其特征在于,所述方法还包括:
获取所述用户的历史行为数据,所述历史行为数据包括所述用户在历史时间段内对观看的每一个历史视频的观看完整度数据、互动次数数据及其他历史行为数据,所述其他历史行为数据包括评论数据、点赞数据及收藏数据中的至少一种,其中,每一个历史视频具有对应的描述特征向量;
根据各个历史视频的描述特征向量、预设的权值向量、从每一个历史视频对应的观看完整度数据中提取出的观看完整度、从每一个历史视频对应的互动次数数据提取出的互动次数、每一个历史视频对应的其他历史行为数据确定所述用户的偏好特征向量。
8.根据权利要求7所述的视频推荐方法,其特征在于,所述描述特征向量由多个描述特征分量组成,所述权值向量由多个权值分量组成,所述根据各个历史视频的描述特征向量、预设的权值向量、从每一个历史视频对应的观看完整度数据中提取出的观看完整度、从每一个历史视频对应的互动次数数据提取出的互动次数、每一个历史视频对应的其他历史行为数据确定所述用户的偏好特征向量包括:
从所述权值向量中获取每一个描述特征分量对应的权值分量;
根据每一个描述特征分量对应的各个历史视频的所述观看完整度、所述互动次数、所述其他历史行为数据、每一个描述特征分量对应的权值分量及预设的偏好特征算法计算每一个描述特征分量对应的偏好特征分量,并将得到的所有偏好特征分量组成所述偏好特征向量。
9.根据权利要求1所述的视频推荐方法,其特征在于,所述根据计算得到的所有的偏好度选择符合预设条件的待推荐视频组成推荐列表推荐给所述用户包括:
对计算得到的所有的偏好度按照从大到小的顺序进行排序;
选择偏好度排在预设位以内的待推荐视频组成推荐列表推荐给所述用户。
10.一种视频推荐装置,其特征在于,所述视频推荐装置包括:
判定模块,用于根据所述用户在观看所述目标视频过程中的行为数据判定所述用户是否喜欢所述目标视频;
查找模块,用于若所述用户喜欢所述目标视频,则从视频库中查找与所述目标视频存在逻辑关联关系的视频组;
获取模块,用于在接收到视频推荐指令时,获取所述用户的偏好特征向量、所述视频库中的每一个待推荐视频的描述特征向量及所述视频组中除所述目标视频之外的所有的第一待推荐视频的逻辑加权值;
计算模块,用于根据所述偏好特征向量、所述视频库中除所述视频组之外的每一个第二待推荐视频的描述特征向量及预设的匹配度算法计算所述用户对每一个第二待推荐视频的偏好度,并根据所述偏好特征向量、所述视频组中的每一个第一待推荐视频的描述特征向量、每一个第一待推荐视频对应的逻辑加权值及所述匹配度算法计算所述用户对每一个第一待推荐视频的偏好度;
推荐模块,用于根据计算得到的所有的偏好度选择符合预设条件的待推荐视频组成推荐列表推荐给所述用户。
11.一种计算机设备,所述计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至9任一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9任一项所述的方法的步骤。
CN202211286945.5A 2022-10-20 2022-10-20 视频推荐方法及装置 Pending CN115618054A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211286945.5A CN115618054A (zh) 2022-10-20 2022-10-20 视频推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211286945.5A CN115618054A (zh) 2022-10-20 2022-10-20 视频推荐方法及装置

Publications (1)

Publication Number Publication Date
CN115618054A true CN115618054A (zh) 2023-01-17

Family

ID=84863918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211286945.5A Pending CN115618054A (zh) 2022-10-20 2022-10-20 视频推荐方法及装置

Country Status (1)

Country Link
CN (1) CN115618054A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117156184A (zh) * 2023-08-11 2023-12-01 魔人传媒(杭州)有限公司 智能投放视频播放方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117156184A (zh) * 2023-08-11 2023-12-01 魔人传媒(杭州)有限公司 智能投放视频播放方法、装置、设备及存储介质
CN117156184B (zh) * 2023-08-11 2024-05-17 魔人传媒(杭州)有限公司 智能投放视频播放方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN109145153B (zh) 意图类别的识别方法和装置
US10380236B1 (en) Machine learning system for annotating unstructured text
CN107436922B (zh) 文本标签生成方法和装置
CN111444320B (zh) 文本检索方法、装置、计算机设备和存储介质
US8630972B2 (en) Providing context for web articles
CN110888990B (zh) 文本推荐方法、装置、设备及介质
US20080319973A1 (en) Recommending content using discriminatively trained document similarity
US20110078206A1 (en) Tagging method and apparatus based on structured data set
US20080168056A1 (en) On-line iterative multistage search engine with text categorization and supervised learning
JP2005158010A (ja) 分類評価装置・方法及びプログラム
CN111291177A (zh) 一种信息处理方法、装置和计算机存储介质
CN110362798B (zh) 裁决信息检索分析方法、装置、计算机设备和存储介质
CN111191105B (zh) 政务信息的搜索方法、装置、系统、设备及存储介质
CN110427453B (zh) 数据的相似度计算方法、装置、计算机设备及存储介质
US11935315B2 (en) Document lineage management system
CN112395875A (zh) 一种关键词提取方法、装置、终端以及存储介质
JP2020512651A (ja) 検索方法、装置及び非一時的コンピュータ読取可能記憶媒体
CN108228612B (zh) 一种提取网络事件关键词以及情绪倾向的方法及装置
CN111078839A (zh) 一种用于裁判文书的结构化处理方法及处理装置
CN112579729A (zh) 文档质量评价模型的训练方法、装置、电子设备和介质
CN110532229B (zh) 证据文件检索方法、装置、计算机设备和存储介质
CN115618054A (zh) 视频推荐方法及装置
CN111563212A (zh) 一种内链添加方法及装置
CN112579781B (zh) 文本归类方法、装置、电子设备及介质
CA3012647A1 (en) Content based image management and selection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination