CN111026910A - 视频推荐方法、装置、电子设备及计算机可读存储介质 - Google Patents
视频推荐方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111026910A CN111026910A CN201811174793.3A CN201811174793A CN111026910A CN 111026910 A CN111026910 A CN 111026910A CN 201811174793 A CN201811174793 A CN 201811174793A CN 111026910 A CN111026910 A CN 111026910A
- Authority
- CN
- China
- Prior art keywords
- video
- feature vector
- semantic feature
- determining
- title
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 239000013598 vector Substances 0.000 claims abstract description 228
- 238000012545 processing Methods 0.000 claims abstract description 60
- 238000004364 calculation method Methods 0.000 claims abstract description 29
- 230000011218 segmentation Effects 0.000 claims description 140
- 238000013528 artificial neural network Methods 0.000 claims description 46
- 238000007781 pre-processing Methods 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000005034 decoration Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
Images
Abstract
本申请涉及视频处理技术领域,公开了一种视频推荐方法、装置、电子设备及计算机可读存储介质,其中,视频推荐方法包括:确定用户当前观看视频的标题的第一语义特征向量;接着将第一语义特征向量通过预设模型进行预测计算处理;接着根据预测计算结果确定待推荐视频,并向用户推荐待推荐视频。本申请实施例的方法,本申请实施例的方法,能够根据用户当前观看视频的视频特征值准确地向用户推荐相关视频,使得可以针对用户的个性化需求和兴趣,向其推荐更加合适的视频,极大提高视频推荐的准确性,提升用户体验。
Description
技术领域
本申请涉及视频处理技术领域,具体而言,本申请涉及一种视频推荐方法、装置、电子设备及计算机可读存储介质。
背景技术
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代,提供各种信息功能的终端应用程序不断涌现,例如各种视频APP,为用户带来了更加便捷的体验。各种视频APP中均存储着海量的视频资源供用户选择观看,但是用户根据已知视频资源进行视频搜索与观看的能力毕竟有限,在这样的背景下,视频推荐应用而生,视频推荐是视频APP帮助用户查找并观看某个特定领域视频的方法和工具,可以为用户找到其已知范围之外的感兴趣的视频,拓展其观影体验。
相对于传统的视频目录浏览方式或者视频搜索方式,视频推荐能够在用户不确定合适的搜索词的情况下,通过分析用户历史行为,发现用户需求的特定领域,在该领域内进行推荐,避免了搜索词的输入和层次目录的多次点击过程,使得查找并观看某个特定类型的视频更加简单容易。
在现有技术中,一种视频推荐方法是根据用户的观看历史记录,建立用户的喜好标签,然后与视频数据库中的标签进行匹配,从而为用户提供匹配的视频,即基于视频标签来计算视频间的相似度,并根据视频间的相似度生成推荐列表为用户推荐未观看的视频。但是,现有技术中的基于视频标签推荐视频的方法,一方面标签存在信息量过载、无序、垃圾标签等问题,影响视频推荐的准确度和个性化程度,另一方面对于视频推荐,各个固有标签对于用户的重要程度是有差别的,如果一律同等对待,会导致推荐准确度不高,影响用户体验。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一,特提出以下技术方案:
第一方面,提供了一种视频推荐方法,包括:
确定用户当前观看视频的标题的第一语义特征向量;
将第一语义特征向量通过预设模型进行预测计算处理;
根据预测计算结果确定待推荐视频,并向用户推荐待推荐视频。
具体地,确定用户当前观看视频的标题的第一语义特征向量,包括:
对当前观看视频的标题进行相应的分词预处理,得到至少一个分词;
通过基于预设词典训练后的神经网络,确定各个分词分别对应的分词特征向量;
基于分词特征向量确定当前观看视频的标题的第一语义特征向量。
进一步地,对当前观看视频的标题进行相应的分词预处理,包括:
基于预定分词策略,对当前观看视频的标题进行整体分词处理;
基于1-gram分词方法,对当前观看视频的标题进行单个字的分词处理;
基于2-gram分词方法,对当前观看视频的标题进行相邻两个字的分词处理。
进一步地,通过基于词典训练后的神经网络,确定各个分词分别对应的分词特征向量,包括:
通过基于预设词典训练后的神经网络,确定整体分词处理后的各个分词分别对应的第一分词特征向量;
通过基于预设词典训练后的神经网络,确定单个字分词处理后的各个分词分别对应的第二分词特征向量;
通过基于预设词典训练后的神经网络,确定相邻两个字分词处理后的各个分词分别对应的第三分词特征向量。
进一步地,基于分词特征向量确定当前观看视频的标题的第一语义特征向量,包括:
计算各分词特征向量的平均值,并将平均值作为当前观看视频的标题的第一语义特征向量;
计算各分词特征向量的特征值总和,并将特征值总和作为当前观看视频的标题的第一语义特征向量。
进一步地,在通过基于词典训练后的神经网络,确定各个分词分别对应的分词特征向量之前,还包括:
依据样本数据基于预设词典对神经网络进行训练,样本数据为多组视频的标题的语义特征向量,其中,每组中至少两个视频的标题的语义特征向量的相似度大于第一相似度阈值。
进一步地,将第一语义特征向量通过预设模型进行预测计算处理,包括:
将第一语义特征向量与预定语义特征向量库中的多个语义特征向量进行相似度计算,获取第一语义特征向量与各个语义特征向量之间的相似度。
进一步地,根据预测计算结果确定待推荐视频,包括以下至少一种情形:
将与第一语义特征向量的相似度大于第二相似度阈值的至少一个语义特征向量对应的视频,确定为待推荐视频;
对相似度进行降序排序,并将与前预定位数的相似度相应的语义特征向量对应的视频确定为待推荐视频。
第二方面,提供了一种视频推荐装置,包括:
确定模块,用于确定用户当前观看视频的标题的第一语义特征向量;
处理模块,用于将第一语义特征向量通过预设模型进行预测计算处理;
推荐模块,用于根据预测计算结果确定待推荐视频,并向用户推荐待推荐视频。
具体地,确定模块包括分词预处理子模块、第一确定子模块与第二确定子模块;
分词预处理子模块,用于对当前观看视频的标题进行相应的分词预处理,得到至少一个分词;
第一确定子模块,用于通过基于预设词典训练后的神经网络,确定各个分词分别对应的分词特征向量;
第二确定子模块,用于基于分词特征向量确定当前观看视频的标题的第一语义特征向量。
进一步地,分词预处理子模块具体用于基于预定分词策略,对当前观看视频的标题进行整体分词处理;以及基于1-gram分词方法,对当前观看视频的标题进行单个字的分词处理;以及基于2-gram分词方法,对当前观看视频的标题进行相邻两个字的分词处理。
进一步地,第一确定子模块具体用于通过基于预设词典训练后的神经网络,确定整体分词处理后的各个分词分别对应的第一分词特征向量;以及用于通过基于预设词典训练后的神经网络,确定单个字分词处理后的各个分词分别对应的第二分词特征向量;以及用于通过基于预设词典训练后的神经网络,确定相邻两个字分词处理后的各个分词分别对应的第三分词特征向量。
进一步地,第二确定子模块具体用于计算各分词特征向量的平均值,并将平均值作为当前观看视频的标题的第一语义特征向量;或者用于计算各分词特征向量的特征值总和,并将特征值总和作为当前观看视频的标题的第一语义特征向量。
进一步地,还包括训练模块;
训练模块,用于依据样本数据基于预设词典对神经网络进行训练,样本数据为多组视频的标题的语义特征向量,其中,每组中至少两个视频的标题的语义特征向量的相似度大于第一相似度阈值。
进一步地,处理模块具体用于将第一语义特征向量与预定语义特征向量库中的多个语义特征向量进行相似度计算,获取第一语义特征向量与各个语义特征向量之间的相似度。
进一步地,推荐模块具体用于将与第一语义特征向量的相似度大于第二相似度阈值的至少一个语义特征向量对应的视频,确定为待推荐视频;和/或用于对相似度进行降序排序,并将与前预定位数的相似度相应的语义特征向量对应的视频确定为待推荐视频。
第三方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行所述程序时实现上述的视频推荐方法。
第四方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述的视频推荐方法。
本申请实施例提供的视频推荐方法,确定用户当前观看视频的标题的第一语义特征向量,奠定了后续基于该第一语义特征向量进行视频推荐的坚实基础;将第一语义特征向量通过预设模型进行预测计算处理,为后续确定待推荐视频提供前提保障;根据预测计算结果确定待推荐视频,并向用户推荐待推荐视频,从而能够根据用户当前观看视频的视频特征值准确地向用户推荐相关视频,使得可以针对用户的个性化需求和兴趣,向其推荐更加合适的视频,极大提高视频推荐的准确性,提升用户体验。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例的视频推荐方法的流程示意图;
图2为本申请实施例的视频推荐装置的基本结构示意图;
图3为本申请实施例的视频推荐装置的详细结构示意图;
图4为本申请实施例的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在现有技术中,一种视频推荐方法是根据用户的观看历史记录,建立用户的喜好标签,然后与视频数据库中的标签进行匹配,从而为用户提供匹配的视频,即基于视频标签来计算视频间的相似度,并根据视频间的相似度生成推荐列表为用户推荐未观看的视频。但是,现有技术中的基于视频标签推荐视频的方法,一方面标签存在信息量过载、无序、垃圾标签等问题,影响视频推荐的准确度和个性化程度,另一方面对于视频推荐,各个固有标签对于用户的重要程度是有差别的,如果一律同等对待,会导致推荐准确度不高,影响用户体验。
本申请提供的视频推荐方法、装置、电子设备及计算机可读存储介质,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
实施例一
本申请实施例提供了一种视频推荐方法,如图1所示,包括:
步骤S110,确定用户当前观看视频的标题的第一语义特征向量。
具体地,用户可以根据自己的需求,通过终端设备的视频网站或视频应用程序APP,观看自己感兴趣的各种视频,在用户观看视频的过程中,可以根据用户当前观看的视频,确定用户当前观看视频的标题的语义特征向量,即上述的第一语义特征向量。
步骤S120,将第一语义特征向量通过预设模型进行预测计算处理。
具体地,在确定用户当前观看视频的语义特征向量之后,可以对该语义特征向量进行相应处理,以便于后续基于该语义特征向量准确地向用户推荐相应视频,其中,在对语义特征向量进行相应处理的过程中,可以将语义特征向量通过预设模型进行预测计算处理,从而为后续根据预测计算结果确定待推荐视频提供必要前提保障。
步骤S130,根据预测计算结果确定待推荐视频,并向用户推荐待推荐视频。
具体地,在将第一语义特征向量通过预设模型进行预测计算处理之后,可以根据该预测计算结果确定待推荐视频,从而根据用户当前观看视频的标题的语义特征向量准确向用户推荐相关视频,使得可以针对用户的个性化需求和兴趣,向其推荐更加合适的视频,极大提高视频推荐的准确性,提供用户体验。
本申请实施例提供的视频推荐方法,与现有技术相比,确定用户当前观看视频的标题的第一语义特征向量,奠定了后续基于该第一语义特征向量进行视频推荐的坚实基础;将第一语义特征向量通过预设模型进行预测计算处理,为后续确定待推荐视频提供前提保障;根据预测计算结果确定待推荐视频,并向用户推荐待推荐视频,从而能够根据用户当前观看视频的视频特征值准确地向用户推荐相关视频,使得可以针对用户的个性化需求和兴趣,向其推荐更加合适的视频,极大提高视频推荐的准确性,提升用户体验。
本申请实施例提供了另一种可能的实现方式,其中,
步骤S110包括步骤S1101(图中未标注)、步骤S1102(图中未标注)与步骤S1103(图中未标注),其中,
S1101:对当前观看视频的标题进行相应的分词预处理,得到至少一个分词;
S1102:通过基于预设词典训练后的神经网络,确定各个分词分别对应的分词特征向量;
S1103:基于分词特征向量确定当前观看视频的标题的第一语义特征向量。
其中,对当前观看视频的标题进行相应的分词预处理,包括:
基于预定分词策略,对当前观看视频的标题进行整体分词处理;
基于1-gram分词方法,对当前观看视频的标题进行单个字的分词处理;
基于2-gram分词方法,对当前观看视频的标题进行相邻两个字的分词处理。
另外,通过基于预设词典训练后的神经网络,确定各个分词分别对应的分词特征向量,包括:
通过基于预设词典训练后的神经网络,确定整体分词处理后的各个分词分别对应的第一分词特征向量;
通过基于预设词典训练后的神经网络,确定单个字分词处理后的各个分词分别对应的第二分词特征向量;
通过基于预设词典训练后的神经网络,确定相邻两个字分词处理后的各个分词分别对应的第三分词特征向量。
具体地,通常每个视频都会有一个与之对应的标题(即视频名称),该标题是由若干词语构成的,因此在确定用户当前观看视频的标题的语义特征向量(即上述的第一语义特征向量)的过程中,可以先对当前观看视频的标题进行相应的分词预处理,得到至少一个分词,例如得到1个、2个或4个分词,接着,通过基于预设词典训练后的神经网络,确定得到的各个分词分别对应的分词特征向量,即将各个分词作为神经网络的输入,得到各个分词分别对应的特征向量,接着,基于各个分词分别对应的分词特征向量确定当前观看视频的标题的语义特征向量(即上述的第一语义特征向量)。即通过对用户当前观看视频的标题进行切分,并得到各个分词分别对应的特征向量,再根据各个分词分别对应的特征向量得到整个完整视频的标题的语义特征向量,从而有效避免了直接将整个视频的标题作为神经网络的输入,造成的语义特征向量提取复杂度高及准确性差的问题。
进一步地,对当前观看视频的标题进行相应的分词预处理,包括三个方面的分词,分别是:(1)对用户当前观看的视频的标题进行整体分词预处理,得到至少一个分词,此处的分词预处理可以采用现有的分词方法,例如正向最大匹配方法、逆向最大匹配方法和双向最大匹配方法等;(2)基于1-gram分词方法,对当前观看视频的标题进行单个字的分词处理,即将标题中的每个字作为一个分词;(3)基于2-gram分词方法,对当前观看视频的标题进行相邻两个字的分词处理,即将标题中的每相邻的两个字作为一个分词。假设用户当前观看视频的标题是“非常完美”,在采用现有的分词方法对其进行分词时,可以得到“非常”与“完美”两个词,在基于1-gram分词方法对其进行分词时,可以得到“非”、“常”“完”与“美”等4个分词,在基于2-gram分词方法对其进行分词时,可以得到“非常”、“常完”与“完美”3个分词。
进一步地,在通过基于预设词典训练后的神经网络,确定各个分词分别对应的分词特征向量的过程中,将通过上述分词方法得到的各个分词依次输入至基于预设词典训练后的神经网络,得到各个分词分别对应的分词特征向量,即通过基于预设词典训练后的神经网络,确定整体分词处理后的各个分词分别对应的第一分词特征向量,通过基于预设词典训练后的神经网络,确定单个字分词处理后的各个分词分别对应的第二分词特征向量,通过基于预设词典训练后的神经网络,确定相邻两个字分词处理后的各个分词分别对应的第三分词特征向量。该第一分词特征向量、第二分词特征向量以及第三分词特征向量构成了上述的分词特征向量。
对于本申请实施例,通过对用户当前观看视频的标题进行切分,得到各个分词分别对应的特征向量,从而有效避免了直接将整个视频的标题作为神经网络的输入,造成的语义特征向量提取复杂度高及准确性差的问题。
本申请实施例提供了另一种可能的实现方式,其中,
在步骤S1102之前还包括步骤S1104(图中未标注):依据样本数据基于预设词典对神经网络进行训练,样本数据为多组视频的标题的语义特征向量,其中,每组中至少两个视频的标题的语义特征向量的相似度大于第一相似度阈值。
此外,基于分词特征向量确定当前观看视频的标题的第一语义特征向量,包括:
计算各分词特征向量的平均值,并将平均值作为当前观看视频的标题的第一语义特征向量;
计算各分词特征向量的特征值总和,并将特征值总和作为当前观看视频的标题的第一语义特征向量。
另外,将第一语义特征向量通过预设模型进行预测计算处理,包括:
将第一语义特征向量与预定语义特征向量库中的多个语义特征向量进行相似度计算,获取第一语义特征向量与各个语义特征向量之间的相似度。
另外,根据预测计算结果确定待推荐视频,包括以下至少一种情形:
将与第一语义特征向量的相似度大于第二相似度阈值的至少一个语义特征向量对应的视频,确定为待推荐视频;
对相似度进行降序排序,并将与前预定位数的相似度相应的语义特征向量对应的视频确定为待推荐视频。
具体地,在通过基于词典训练后的神经网络,确定各个分词分别对应的分词特征向量之前,还包括:依据样本数据基于预设词典对神经网络进行训练,样本数据为多组视频的标题的语义特征向量,其中,每组中至少两个视频的标题的语义特征向量的相似度大于第一相似度阈值。其中,样本数据可以由任一用户连续观看的两个或三个或更多个视频的标题的语义特征向量构成,对于神经网络进行训练的目标就是使得任一用户连续观看的两个或三个或更多个视频的标题的语义特征向量尽可能的相似,即用户连续观看的不同视频的标题的语义特征向量的相似度大于第一相似度阈值。
进一步地,可以通过计算各个分词特征向量的平均值来得到当前观看视频的标题的语义特征向量(即上述的第一语义特征向量),其中,在计算各个分词特征向量的平均值的过程中,可以先对各个分词特征向量进行加和计算,得到各个分词特征向量的特征向量总和,再利用特征向量总和除以分词特征向量的个数,来得到当前观看视频的的标题的语义特征向量,即计算各个第一分词特征向量、各个第二分词特征向量及各个分词特征向量的平均值,并将该平均值作为当前观看视频的标题的第一语义特征向量。此外,还可以直接将各个分词特征向量的特征向量总和作为当前观看视频的标题的语义特征向量,即计算各个第一分词特征向量、各个第二分词特征向量及各个第三分词特征向量的总和,并将该特征向量总和作为当前观看视频的标题的第一语义特征向量。
进一步地,在得到用户当前观看视频的标题的第一语义特征向量之后,可以将该第一语义特征向量通过预设模型进行预测计算处理,预测计算处理可以是将该第一语义特征向量与预定语义特征向量库中存储的多个语义特征向量进行相似度计算,来得到第一语义特征向量与各个语义特征向量之间的相似度,即依次计算第一语义特征向量与预定语义特征向量库中存储的各个语义特征向量之间的相似度。
进一步地,在得到第一语义特征向量与预定语义特征向量库中存储的各个语义特征向量之间的相似度后,可以根据该相似度确定待推荐视频,其中,在根据该相似度确定待推荐视频的过程中,可以将与第一语义特征向量的相似度大于第二相似度阈值的至少一个语义特征向量对应的视频,确定为待推荐视频。假设预定语义特征向量库中存储了5个语义特征向量,预设第二相似度阈值为90,且该第一语义特征向量与上述5个语义特征向量之间的相似度依次为89、90、93、96、85,则可以将第二、第三及第四个视频确定为待推荐视频。
进一步地,在得到第一语义特征向量与预定语义特征向量库中存储的各个语义特征向量之间的相似度后,还可以对相似度进行从大到小的降序排序,并将与前预定位数的相似度相应的语义特征向量对应的视频确定为待推荐视频。假设预定语义特征向量库中存储了8个语义特征向量,前预定位数为4,且该第一语义特征向量与上述8个语义特征向量之间的相似度依次为78、83、86、89、92、95、98、85,对相似度进行从大到小的降序排序后为:98、95、92、89、86、85、83、78,则可以将第七、第六、第五及第三个视频确定为待推荐视频,从而向用户推荐该待推荐视频。
对于本申请实施例,通过根据视频标题的语义特征向量的相似度,来更加准确地向用户推荐视频,使得可以针对用户的个性化需求和兴趣,向其推荐更加合适的视频,极大提高视频推荐的准确性,提升用户体验。
实施例二
图2为本申请实施例提供的一种视频推荐装置的结构示意图,如图2所示,该装置20可以包括确定模块21、处理模块22及推荐模块23,其中,
确定模块21用于确定用户当前观看视频的标题的第一语义特征向量;
处理模块22用于将第一语义特征向量通过预设模型进行预测计算处理;
推荐模块23用于根据预测计算结果确定待推荐视频,并向用户推荐待推荐视频。
具体地,确定模块21包括分词预处理子模块211、第一确定子模块212与第二确定子模块213,如图3所示,其中,
分词预处理子模块211用于对当前观看视频的标题进行相应的分词预处理,得到至少一个分词;
第一确定子模块212用于通过基于预设词典训练后的神经网络,确定各个分词分别对应的分词特征向量;
第二确定子模块213用于基于分词特征向量确定当前观看视频的标题的第一语义特征向量。
进一步地,分词预处理子模块211具体用于基于预定分词策略,对当前观看视频的标题进行整体分词处理;以及基于1-gram分词方法,对当前观看视频的标题进行单个字的分词处理;以及基于2-gram分词方法,对当前观看视频的标题进行相邻两个字的分词处理。
进一步地,第一确定子模块212具体用于通过基于预设词典训练后的神经网络,确定整体分词处理后的各个分词分别对应的第一分词特征向量;以及用于通过基于预设词典训练后的神经网络,确定单个字分词处理后的各个分词分别对应的第二分词特征向量;以及用于通过基于预设词典训练后的神经网络,确定相邻两个字分词处理后的各个分词分别对应的第三分词特征向量。
进一步地,第二确定子模块212具体用于计算各分词特征向量的平均值,并将平均值作为当前观看视频的标题的第一语义特征向量;或者用于计算各分词特征向量的特征值总和,并将特征值总和作为当前观看视频的标题的第一语义特征向量。
进一步地,还包括训练模块24,如图3所示,训练模块24用于依据样本数据基于预设词典对神经网络进行训练,样本数据为多组视频的标题的语义特征向量,其中,每组中至少两个视频的标题的语义特征向量的相似度大于第一相似度阈值。
进一步地,处理模块22具体用于将第一语义特征向量与预定语义特征向量库中的多个语义特征向量进行相似度计算,获取第一语义特征向量与各个语义特征向量之间的相似度。
进一步地,推荐模块23具体用于将与第一语义特征向量的相似度大于第二相似度阈值的至少一个语义特征向量对应的视频,确定为待推荐视频;和/或用于对相似度进行降序排序,并将与前预定位数的相似度相应的语义特征向量对应的视频确定为待推荐视频。
本申请实施例提供的装置,与现有技术相比,确定用户当前观看视频的标题的第一语义特征向量,奠定了后续基于该第一语义特征向量进行视频推荐的坚实基础;将第一语义特征向量通过预设模型进行预测计算处理,为后续确定待推荐视频提供前提保障;根据预测计算结果确定待推荐视频,并向用户推荐待推荐视频,从而能够根据用户当前观看视频的视频特征值准确地向用户推荐相关视频,使得可以针对用户的个性化需求和兴趣,向其推荐更加合适的视频,极大提高视频推荐的准确性,提升用户体验。
实施例三
本申请实施例提供了一种电子设备,如图4所示,图4所示的电子设备400包括:处理器401和存储器403。其中,处理器401和存储器403相连,如通过总线402相连。进一步地,电子设备400还可以包括收发器404。需要说明的是,实际应用中收发器404不限于一个,该电子设备400的结构并不构成对本申请实施例的限定。
其中,处理器401应用于本申请实施例中,用于实现图2或图3所示的确定模块、处理模块及推荐模块的功能,以及图3所示的训练模块的功能。
处理器401可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器401也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线402可包括一通路,在上述组件之间传送信息。总线402可以是PCI总线或EISA总线等。总线402可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器403可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器403用于存储执行本申请方案的应用程序代码,并由处理器401来控制执行。处理器401用于执行存储器403中存储的应用程序代码,以实现图2或图3所示实施例提供的视频推荐装置的动作。
本申请实施例提供的电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,与现有技术相比,可实现:确定用户当前观看视频的标题的第一语义特征向量,奠定了后续基于该第一语义特征向量进行视频推荐的坚实基础;将第一语义特征向量通过预设模型进行预测计算处理,为后续确定待推荐视频提供前提保障;根据预测计算结果确定待推荐视频,并向用户推荐待推荐视频,从而能够根据用户当前观看视频的视频特征值准确地向用户推荐相关视频,使得可以针对用户的个性化需求和兴趣,向其推荐更加合适的视频,极大提高视频推荐的准确性,提升用户体验。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现实施例一所示的方法。与现有技术相比,确定用户当前观看视频的标题的第一语义特征向量,奠定了后续基于该第一语义特征向量进行视频推荐的坚实基础;将第一语义特征向量通过预设模型进行预测计算处理,为后续确定待推荐视频提供前提保障;根据预测计算结果确定待推荐视频,并向用户推荐待推荐视频,从而能够根据用户当前观看视频的视频特征值准确地向用户推荐相关视频,使得可以针对用户的个性化需求和兴趣,向其推荐更加合适的视频,极大提高视频推荐的准确性,提升用户体验。
本申请实施例提供的计算机可读存储介质适用于上述方法的任一实施例。在此不再赘述。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种视频推荐方法,其特征在于,包括:
确定用户当前观看视频的标题的第一语义特征向量;
将所述第一语义特征向量通过预设模型进行预测计算处理;
根据预测计算结果确定待推荐视频,并向用户推荐所述待推荐视频。
2.根据权利要求1所述的方法,其特征在于,所述确定用户当前观看视频的标题的第一语义特征向量,包括:
对所述当前观看视频的标题进行相应的分词预处理,得到至少一个分词;
通过基于预设词典训练后的神经网络,确定各个分词分别对应的分词特征向量;
基于所述分词特征向量确定所述当前观看视频的标题的第一语义特征向量。
3.根据权利要求2所述的方法,其特征在于,对所述当前观看视频的标题进行相应的分词预处理,包括:
基于预定分词策略,对所述当前观看视频的标题进行整体分词处理;
基于1-gram分词方法,对所述当前观看视频的标题进行单个字的分词处理;
基于2-gram分词方法,对所述当前观看视频的标题进行相邻两个字的分词处理。
4.根据权利要求3所述的方法,其特征在于,通过基于词典训练后的神经网络,确定各个分词分别对应的分词特征向量,包括:
通过基于预设词典训练后的神经网络,确定整体分词处理后的各个分词分别对应的第一分词特征向量;
通过基于预设词典训练后的神经网络,确定单个字分词处理后的各个分词分别对应的第二分词特征向量;
通过基于预设词典训练后的神经网络,确定相邻两个字分词处理后的各个分词分别对应的第三分词特征向量。
5.根据权利要求2-4任一项所述的方法,其特征在于,基于所述分词特征向量确定所述当前观看视频的标题的第一语义特征向量,包括:
计算各分词特征向量的平均值,并将所述平均值作为所述当前观看视频的标题的第一语义特征向量;
计算各分词特征向量的特征值总和,并将所述特征值总和作为所述当前观看视频的标题的第一语义特征向量。
6.根据权利要求2-4任一项所述的方法,其特征在于,在通过基于词典训练后的神经网络,确定各个分词分别对应的分词特征向量之前,还包括:
依据样本数据基于预设词典对所述神经网络进行训练,所述样本数据为多组视频的标题的语义特征向量,其中,每组中至少两个视频的标题的语义特征向量的相似度大于第一相似度阈值。
7.根据权利要求1-6任一项所述的方法,其特征在于,将所述第一语义特征向量通过预设模型进行预测计算处理,包括:
将所述第一语义特征向量与预定语义特征向量库中的多个语义特征向量进行相似度计算,获取所述第一语义特征向量与各个语义特征向量之间的相似度。
8.一种视频推荐装置,其特征在于,包括:
确定模块,用于确定用户当前观看视频的标题的第一语义特征向量;
处理模块,用于将所述第一语义特征向量通过预设模型进行预测计算处理;
推荐模块,用于根据预测计算结果确定待推荐视频,并向用户推荐所述待推荐视频。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述的视频推荐方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现权利要求1-7任一项所述的视频推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811174793.3A CN111026910B (zh) | 2018-10-09 | 2018-10-09 | 视频推荐方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811174793.3A CN111026910B (zh) | 2018-10-09 | 2018-10-09 | 视频推荐方法、装置、电子设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111026910A true CN111026910A (zh) | 2020-04-17 |
CN111026910B CN111026910B (zh) | 2024-04-05 |
Family
ID=70191222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811174793.3A Active CN111026910B (zh) | 2018-10-09 | 2018-10-09 | 视频推荐方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111026910B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111984867A (zh) * | 2020-08-20 | 2020-11-24 | 北京奇艺世纪科技有限公司 | 一种网络资源确定方法及装置 |
CN113038163A (zh) * | 2021-03-26 | 2021-06-25 | 百果园技术(新加坡)有限公司 | 用户体验模型训练方法、短视频用户体验评估方法及装置 |
CN113727195A (zh) * | 2021-08-31 | 2021-11-30 | 广东艾檬电子科技有限公司 | 一种视频推荐方法、终端设备以及计算机可读存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060229896A1 (en) * | 2005-04-11 | 2006-10-12 | Howard Rosen | Match-based employment system and method |
JP2010186349A (ja) * | 2009-02-12 | 2010-08-26 | Nippon Telegr & Teleph Corp <Ntt> | 代表語抽出方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 |
CN105808615A (zh) * | 2014-12-31 | 2016-07-27 | 北京奇虎科技有限公司 | 一种基于分词权重的文档索引生成方法和装置 |
CN106250550A (zh) * | 2016-08-12 | 2016-12-21 | 智者四海(北京)技术有限公司 | 一种实时关联新闻推荐内容的方法和装置 |
US20170270387A1 (en) * | 2016-03-15 | 2017-09-21 | Tata Consultancy Services Limited | Method and system for unsupervised word image clustering |
CN107404656A (zh) * | 2017-06-26 | 2017-11-28 | 武汉斗鱼网络科技有限公司 | 直播视频推荐方法、装置及服务器 |
CN107911719A (zh) * | 2017-10-30 | 2018-04-13 | 中国科学院自动化研究所 | 视频动态推荐装置 |
CN107918656A (zh) * | 2017-11-17 | 2018-04-17 | 北京奇虎科技有限公司 | 基于视频标题的视频封面提取方法及装置 |
CN107967253A (zh) * | 2017-10-27 | 2018-04-27 | 北京大学 | 一种基于迁移学习的低资源领域分词器训练方法及分词方法 |
CN108307240A (zh) * | 2018-02-12 | 2018-07-20 | 北京百度网讯科技有限公司 | 视频推荐方法和装置 |
-
2018
- 2018-10-09 CN CN201811174793.3A patent/CN111026910B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060229896A1 (en) * | 2005-04-11 | 2006-10-12 | Howard Rosen | Match-based employment system and method |
JP2010186349A (ja) * | 2009-02-12 | 2010-08-26 | Nippon Telegr & Teleph Corp <Ntt> | 代表語抽出方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 |
CN105808615A (zh) * | 2014-12-31 | 2016-07-27 | 北京奇虎科技有限公司 | 一种基于分词权重的文档索引生成方法和装置 |
US20170270387A1 (en) * | 2016-03-15 | 2017-09-21 | Tata Consultancy Services Limited | Method and system for unsupervised word image clustering |
CN106250550A (zh) * | 2016-08-12 | 2016-12-21 | 智者四海(北京)技术有限公司 | 一种实时关联新闻推荐内容的方法和装置 |
CN107404656A (zh) * | 2017-06-26 | 2017-11-28 | 武汉斗鱼网络科技有限公司 | 直播视频推荐方法、装置及服务器 |
CN107967253A (zh) * | 2017-10-27 | 2018-04-27 | 北京大学 | 一种基于迁移学习的低资源领域分词器训练方法及分词方法 |
CN107911719A (zh) * | 2017-10-30 | 2018-04-13 | 中国科学院自动化研究所 | 视频动态推荐装置 |
CN107918656A (zh) * | 2017-11-17 | 2018-04-17 | 北京奇虎科技有限公司 | 基于视频标题的视频封面提取方法及装置 |
CN108307240A (zh) * | 2018-02-12 | 2018-07-20 | 北京百度网讯科技有限公司 | 视频推荐方法和装置 |
Non-Patent Citations (2)
Title |
---|
CHHAYA CHAUHAN等: "Sentiment classification for mobile reviews using KNIME", 《2018 INTERNATIONAL CONFERENCE ON COMPUTING,POWER AND COMMUNICATION TECHNOLOGIES》, 28 March 2018 (2018-03-28), pages 1 - 7 * |
周庆燕: "基于企业深度挖掘型垂直搜索引擎的研究与应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 October 2015 (2015-10-15), pages 138 - 584 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111984867A (zh) * | 2020-08-20 | 2020-11-24 | 北京奇艺世纪科技有限公司 | 一种网络资源确定方法及装置 |
CN111984867B (zh) * | 2020-08-20 | 2023-06-06 | 北京奇艺世纪科技有限公司 | 一种网络资源确定方法及装置 |
CN113038163A (zh) * | 2021-03-26 | 2021-06-25 | 百果园技术(新加坡)有限公司 | 用户体验模型训练方法、短视频用户体验评估方法及装置 |
CN113038163B (zh) * | 2021-03-26 | 2023-06-23 | 百果园技术(新加坡)有限公司 | 用户体验模型训练方法、短视频用户体验评估方法及装置 |
CN113727195A (zh) * | 2021-08-31 | 2021-11-30 | 广东艾檬电子科技有限公司 | 一种视频推荐方法、终端设备以及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111026910B (zh) | 2024-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111581510B (zh) | 分享内容处理方法、装置、计算机设备和存储介质 | |
CN110717099B (zh) | 一种推荐影片的方法及终端 | |
CN109344314B (zh) | 一种数据处理方法、装置及服务器 | |
CN112364204B (zh) | 视频搜索方法、装置、计算机设备及存储介质 | |
CN112100504B (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN109800328B (zh) | 视频推荐方法、其装置、信息处理设备及存储介质 | |
CN111026910B (zh) | 视频推荐方法、装置、电子设备及计算机可读存储介质 | |
CN109635157A (zh) | 模型生成方法、视频搜索方法、装置、终端及存储介质 | |
CN113407814B (zh) | 文本搜索方法、装置、可读介质及电子设备 | |
CN111046188A (zh) | 用户偏好度确定方法、装置、电子设备及可读存储介质 | |
CN114996511A (zh) | 一种针对跨模态视频检索模型的训练方法及装置 | |
CN115640449A (zh) | 媒体对象推荐方法、装置、计算机设备和存储介质 | |
CN111104550A (zh) | 视频推荐方法、装置、电子设备及计算机可读存储介质 | |
CN111723280B (zh) | 信息的处理方法、装置、存储介质及电子设备 | |
CN116738060A (zh) | 内容生成方法、装置及电子设备 | |
CN114443916B (zh) | 一种面向试验数据的供需匹配方法及系统 | |
CN114647787A (zh) | 一种基于多模态数据的用户个性化推荐方法 | |
CN113408282B (zh) | 主题模型训练和主题预测方法、装置、设备及存储介质 | |
CN115168724A (zh) | 一种融合多粒度信息的新闻推荐方法及系统 | |
CN115063858A (zh) | 视频人脸表情识别模型训练方法、装置、设备及存储介质 | |
CN111666371A (zh) | 基于主题的匹配度确定方法、装置、电子设备及存储介质 | |
CN113761280A (zh) | 媒体数据处理方法、装置、电子设备及计算机存储介质 | |
Li et al. | MVVA-Net: a Video Aesthetic Quality Assessment Network with Cognitive Fusion of Multi-type Feature–Based Strong Generalization | |
CN116578757A (zh) | 博文向量生成模型训练方法、博文推荐方法及装置、设备 | |
CN116975735A (zh) | 相关程度预估模型的训练方法、装置、设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20240311 Address after: 300450 No. 9-3-401, No. 39, Gaoxin 6th Road, Binhai Science Park, Binhai New Area, Tianjin Applicant after: 3600 Technology Group Co.,Ltd. Country or region after: China Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park) Applicant before: BEIJING QIHOO TECHNOLOGY Co.,Ltd. Country or region before: China |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |