CN115510269A - 视频推荐的方法、装置、设备和存储介质 - Google Patents

视频推荐的方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN115510269A
CN115510269A CN202211212366.6A CN202211212366A CN115510269A CN 115510269 A CN115510269 A CN 115510269A CN 202211212366 A CN202211212366 A CN 202211212366A CN 115510269 A CN115510269 A CN 115510269A
Authority
CN
China
Prior art keywords
emotion
video
bullet screen
texts
target video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211212366.6A
Other languages
English (en)
Inventor
金鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202211212366.6A priority Critical patent/CN115510269A/zh
Publication of CN115510269A publication Critical patent/CN115510269A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种视频推荐的方法、装置、设备和存储介质,可应用于人工智能领域或金融领域,方法包括,根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条弹幕文本的情感标签;情感词指代预设的情感词库中配置有对应的情感极性值的词或字;在视频数据库中搜索出高情感强度的多个目标视频片段;高情感强度指包含的带情感标签的弹幕文本的数量大于预设的情感强度阈值;根据多个目标视频片段包含的带情感标签的弹幕文本对多个目标视频片段进行聚类,获得多个视频群;在观看过同一视频群的视频片段的多个用户之间进行视频推荐。本方案利用弹幕文本的情感标签实现视频推荐,提高了视频推荐的准确度。

Description

视频推荐的方法、装置、设备和存储介质
技术领域
本发明涉及视频推荐技术领域,特别涉及一种视频推荐的方法、装置、设备和存储介质。
背景技术
当前多种视频门户网站层出不穷,视频门户网站上各类视频片段的数量也越来越多,因此为用户精准推荐感兴趣的视频,就成了个视频门户网站吸引用户的关键。
另一方面,现在越来越多的视频门户网站支持用户看视频时编辑并发送弹幕文本,弹幕文本很大程度上反映了用户对当前看的视频的感受,而传统的推荐方法却无法利用这些弹幕文本作为视频推荐的依据,导致推荐结果的准确度较低。
发明内容
针对上述现有技术的缺点,本发明提供一种视频推荐的方法、装置、设备和存储介质,以利用视频片段的弹幕文本提高视频推荐的准确度。
本申请第一方面提供一种视频推荐的方法,包括:
根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条所述弹幕文本的情感标签;其中,所述情感词,指代预设的情感词库中配置有对应的情感极性值的词或字;
在视频数据库中搜索出高情感强度的多个目标视频片段;其中,高情感强度是指,包含的带情感标签的弹幕文本的数量大于预设的情感强度阈值;
根据所述多个目标视频片段包含的带情感标签的弹幕文本对所述多个目标视频片段进行聚类,获得多个视频群;
在观看过同一所述视频群的视频片段的多个用户之间进行视频推荐。
可选的,所述根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条所述弹幕文本的情感标签,包括:
针对每一条所述弹幕文本,根据所述情感词库确定出所述弹幕文本中每一个情感词对应的情感极性值和每一个情感词的类别;
针对每一条所述弹幕文本,以所述弹幕文本的情感词的情感极性值和类别为依据,利用朴素贝叶斯分类器对所述弹幕文本进行情感分类,以确定所述弹幕文本的情感标签。
可选的,所述根据所述多个目标视频片段包含的带情感标签的弹幕文本对所述多个目标视频片段进行聚类,获得多个视频群,包括:
针对每两个目标视频片段,根据所述两个目标视频片段包含的弹幕文本的情感标签计算所述两个目标视频片段的相似度;
根据每两个目标视频片段的相似度,对所述多个目标视频片段进行聚类,获得多个视频群。
可选的,所述在观看过同一所述视频群的视频片段的多个用户之间进行视频推荐,包括:
确定出观看过同一所述视频群的视频片段的第一用户和第二用户;
将所述第一用户观看过而所述第二用户未观看过的视频片段,推荐给所述第二用户。
本申请第二方面提供一种视频推荐的装置,包括:
分类单元,用于根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条所述弹幕文本的情感标签;其中,所述情感词,指代预设的情感词库中配置有对应的情感极性值的词或字;
搜索单元,用于在视频数据库中搜索出高情感强度的多个目标视频片段;其中,高情感强度是指,包含的带情感标签的弹幕文本的数量大于预设的情感强度阈值;
聚类单元,用于根据所述多个目标视频片段包含的带情感标签的弹幕文本对所述多个目标视频片段进行聚类,获得多个视频群;
推荐单元,用于在观看过同一所述视频群的视频片段的多个用户之间进行视频推荐。
可选的,所述分类单元根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条所述弹幕文本的情感标签时,具体用于:
针对每一条所述弹幕文本,根据所述情感词库确定出所述弹幕文本中每一个情感词对应的情感极性值和每一个情感词的类别;
针对每一条所述弹幕文本,以所述弹幕文本的情感词的情感极性值和类别为依据,利用朴素贝叶斯分类器对所述弹幕文本进行情感分类,以确定所述弹幕文本的情感标签。
可选的,所述聚类单元根据所述多个目标视频片段包含的带情感标签的弹幕文本对所述多个目标视频片段进行聚类,获得多个视频群时,具体用于:
针对每两个目标视频片段,根据所述两个目标视频片段包含的弹幕文本的情感标签计算所述两个目标视频片段的相似度;
根据每两个目标视频片段的相似度,对所述多个目标视频片段进行聚类,获得多个视频群。
可选的,所述推荐单元在观看过同一所述视频群的视频片段的多个用户之间进行视频推荐,包括:
确定出观看过同一所述视频群的视频片段的第一用户和第二用户;
将所述第一用户观看过而所述第二用户未观看过的视频片段,推荐给所述第二用户。
本申请第三方面提供一种电子设备,包括存储器和处理器;
其中,所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序,所述计算机程序被执行时,具体用于实现本申请第一方面任意一项所提供的视频推荐的方法。
本申请第四方面提供一种计算机存储介质,用于存储计算机程序,所述计算机程序被执行时,具体用于实现本申请第一方面任意一项所提供的视频推荐的方法。
本申请提供一种视频推荐的方法、装置、设备和存储介质,可应用于人工智能领域或金融领域,方法包括,根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条弹幕文本的情感标签;情感词指代预设的情感词库中配置有对应的情感极性值的词;在视频数据库中搜索出高情感强度的多个目标视频片段;高情感强度指包含的带情感标签的弹幕文本的数量大于预设的情感强度阈值;根据多个目标视频片段包含的带情感标签的弹幕文本对多个目标视频片段进行聚类,获得多个视频群;在观看过同一视频群的视频片段的多个用户之间进行视频推荐。本方案利用弹幕文本的情感标签实现视频推荐,提高了视频推荐的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种视频推荐的方法的流程图;
图2为本申请实施例提供的一种对弹幕文本进行情感分类的流程图;
图3为本申请实施例提供的一种基于弹幕文本情感标签的视频推荐流程图;
图4为本申请实施例提供的一种视频推荐的装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着智能移动设备的普及和网络视频产业蓬勃发展,网络视频的种类日趋丰富、数量不断增长,但是也给用户造成了严重的视频信息过载问题,因此视频推荐系统应运而生。然而传统的视频推荐算法,存在数据稀疏、视频情感分析缺乏、推荐准确率低的问题。
针对上面这些问题,本发明提出了一种基于弹幕文本情感分析的视频推荐算法。首先,通过对视频弹幕评论进行情感分析,以解决传统推荐算法对视频的情感分析不准确的问题。然后,在弹幕文本被情感分类的基础上,本项目将高情感强度的视频片段进行自动提取,并使用K-means算法对这些包含弹幕文本的视频片段进行聚类。最后,依据用户的动态社会标签,以及发表弹幕的偏好,使用协同推荐算法,随时间变化动态地为用户推荐潜在感兴趣的视频片段。向用户进行视频推荐。
与传统的文本情感分类方法相比,本发明更适应弹幕文本的特点,可以提高分类的准确率。另外,本发明将弹幕文本的情感倾向作为视频推荐的依据,提高了视频推荐的准确度。
本发明的技术方案主要包括以下三个环节。
弹幕评论情感分类。需要对弹幕评论的情感进行分类,使用基于扩充情感词典和语义规则的方法对弹幕评论进行情感分类。
以中文情感词汇本体库为基础、融入口语词词典、网络用语词典构建领域情感词典,提出情感字和情感词的情感极性值定量计算方法;
然后,结合领域情感词典中情感词的情感极性值分布特点,用朴素贝叶斯分类器对弹幕文本进行分类。
视频用户聚类。需要对兴趣偏好相同的用户进行聚类。
在弹幕文本被情感分类的基础上,本方法将高情感强度的视频片段进行自动提取,并使用K-means算法对这些包含弹幕文本的视频片段进行聚类,得到不同的视频群,这些群满足群内高度相似,群外低相似度。
视频推荐算法。需要基于用户聚类,对用户群推荐视频。
接下来,本方法将依据用户的动态社会标签,以及发表弹幕的偏好,使用协同推荐算法,随时间变化动态地为用户推荐潜在感兴趣的视频。
本发明的原理概述如下。
弹幕评论情感分类。弹幕评论具有内容简短和语法碎片化的特点,而传统情感分类方法对此类文本分类效率及准确率低。因此本文提出基于扩充情感词典和语义规则的方法对弹幕评论进行情感分类。首先将网络情感新词加入基础情感词典中,同时构建了程度副词词典等相关词典,然后以情感词为中心对视频弹幕评论进行语义规则提取并计算情感值,从而实现弹幕文本情感的有效分类。
视频用户聚类。在弹幕文本被情感分类的基础上,本方法将高情感强度的视频片段进行自动提取,并使用K-means算法对这些包含弹幕文本的视频片段进行聚类,得到不同的视频群,这些群满足群内高度相似,群外低相似度。
视频推荐算法。相同情感特征的用户通常有类似的视频偏好。统计同一聚类集合中其他用户看过的视频,并通过视频热度和发布者权威度,计算这些视频的推荐指数。过滤推荐指数偏低的视频后,对用户进行视频推荐。
下面结合附图对本发明的具体实现进行详细说明。
本申请实施例提供一种视频推荐的方法,请参见图1,为该方法的流程图,该方法可以包括如下步骤。
S101,根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条弹幕文本的情感标签。
其中,情感词,指代预设的情感词库(也可以称为情感词典)中配置有对应的情感极性值的词或字。
步骤S101的实施方式可以参见图2。如图2所示,步骤S101可以包括:
A1,构建情感词典。
如图2所示,在构建情感词典时,为了提高情感词典的覆盖率,使得弹幕文本中可能出现的各种字或词都在情感词典中有记录,可以用现有的中文情感词汇本体库,口语词词典和网络用语词典等词库合并组成情感词典。
可选的,在构建情感词典时,可以从中识别并删除部分罕见词或字,以及删除不符合有关规定的禁用词或字。
A2,计算情感词典中多个词或字的情感极性值。
每个词或字的情感极性值,用于表征该词或字的情感倾向以及倾向的程度高低。示例性的,情感极性值为正可以表示正向情感倾向,正值越大则正向情感倾向越强,反之情感极性值为负可以表示负向情感倾向,负值越大则负向情感倾向越强。
词典中每个词或字的情感极性值,具体可以利用任意一种现有的文本情感分析方法,分析包含该词或字的大量文本,然后综合包含该词或字的大量文本的情感倾向,以及不同情感倾向的文本的数量来确定。
例如,预先收集的海量预料库中,包含某词的文本有100条,其中80条的情感倾向都是正向,那么可以为这个词配置一个较大的正情感极性值。
具体的文本情感分析方法可以是任意一种基于机器学习或神经网络而实现的情感分析算法,本实施例对此不作具体限定。
A3,基于朴素贝叶斯分类器进行情感分类。
A4,输出弹幕文本的情感标签。
具体的,步骤S101,根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条弹幕文本的情感标签,可以包括:
针对每一条弹幕文本,根据情感词库确定出弹幕文本中每一个情感词对应的情感极性值和每一个情感词的类别;
针对每一条弹幕文本,以弹幕文本的情感词的情感极性值和类别为依据,利用朴素贝叶斯分类器对弹幕文本进行情感分类,以确定弹幕文本的情感标签。
以上步骤相当于图2所示步骤A3。
为实施步骤S101,还需要预先对情感词典中的各个情感词进行分类,具体来说,可以利用现有的语义分析模型或者语音分析算法分析每一个情感词的语义,然后将语义相同或者相近的词归为一类。
具体的分类标准可以按需设定。若需要较高的准确度,则可以按较细的标准划分出较多的类别,若需要较高的处理效率,则可以按较粗的标准划分出少量类别。
根据情感词的情感极性值和所属类别,针对每一条弹幕文本,以弹幕文本的情感词的情感极性值和类别为依据,利用朴素贝叶斯分类器对弹幕文本进行情感分类,以确定弹幕文本的情感标签的基本实现原理可以是:
对一条弹幕文本,首先确定其中首个情感词所属的类别(假设为一类),然后根据首个情感词所属的类别和其情感极性值,将弹幕文本标记为一类正向或一类负向。
然后确定其中第二个情感词所属类别(假设为二类),并同理根据第二个情感词所属的类别和其情感极性值,将弹幕文本标记为二类正向或二类负向,后续以此类推,直至分析完弹幕文本的每个情感词为止。
最后,根据预先构建的类别-情感倾向-情感标签的映射关系,以上述逐个分析情感词的过程中确定的标记为依据,确定弹幕文本的情感标签。
基于朴素贝叶斯算法进行情感分类的具体方法也可以参见相关的现有技术文献,不限于上述实现方式。
示例性的,假设某弹幕文本共计包含三个情感词,通过上述分析依次标记为一类正向,二类负向,三类正向,然后根据类别-情感倾向-情感标签的映射关系,一类正向、二类负向和三类正向的组合映射的情感标签为情感标签A,于是确定该弹幕文本的情感标签为A。
可以理解,上述一类,二类,三类仅仅是将情感词分类后获得的类别标签的示例,在其他可选实施例中,上述类别标签可以替换为其他更具有具体含义的类别标签,上述示例不构成限定。
可以理解的,步骤S101中处理的多条弹幕文本,具体可以是某视频网站当前处于发布状态的所有视频片段所包含的所有弹幕文本。
在步骤S101中,可能存在部分弹幕文本因过于简短(例如某弹幕文本为“到此一游”)而不包含任何情感词,这部分弹幕文本在步骤S101中可以忽略不处理。
S102,在视频数据库中搜索出高情感强度的多个目标视频片段。
其中,高情感强度是指,包含的带情感标签的弹幕文本的数量大于预设的情感强度阈值。
情感强度阈值的大小可以按需设定。作为示例,可以设定情感强度阈值为15。
视频数据库,可以是用于存储某视频网站当前的全部处于发布状态的视频片段的数据库。
也就是说,对于视频数据库中任一视频片段,如果这个视频片段包含有至少15条经过S101处理后而带有情感标签的弹幕文本,就确定该视频片段为高情感强度的目标视频片段。
S103,根据多个目标视频片段包含的带情感标签的弹幕文本对多个目标视频片段进行聚类,获得多个视频群。
S104,在观看过同一视频群的视频片段的多个用户之间进行视频推荐。
步骤S103和S104,相当于基于弹幕文本情感标签进行视频推荐的过程。该过程也可以参见图3进行理解,图3所示的基于弹幕文本情感标签进行视频推荐的过程包括如下步骤。
B1,相似度计算。
B2,目标视频的近邻集合。
B3,评分预测。
B4,协同推荐。
其中,B1和B2相当于上述步骤S103,B3和B4相当于上述步骤S104。
可选的,步骤S103,即根据多个目标视频片段包含的带情感标签的弹幕文本对多个目标视频片段进行聚类,获得多个视频群,具体可以包括:
针对每两个目标视频片段,根据两个目标视频片段包含的弹幕文本的情感标签计算两个目标视频片段的相似度;
根据每两个目标视频片段的相似度,对多个目标视频片段进行聚类,获得多个视频群。
对于任意两个目标视频片段,不妨以片段1和片段2为例,相似度的计算方法可以如下:
首先,提取片段1中弹幕文本的情感标签,获得标签集合1,示例性的,标签集合1可以包括10个情感标签A,12个情感标签B,5个情感标签C;同理,提取片段2中弹幕文本的情感标签,获得标签集合2,示例性的,标签集合2可以包括15个情感标签A,11个情感标签B,6个情感标签C。
然后,计算标签集合1和标签集合2的交集,以及标签集合1和标签集合2的并集。
最后,用上述交集中标签的数量,除以上述并集中标签的数量,再除以2,得到的结果就可以视为片段1和片段2这两个目标视频的相似度。
其中,在对多个目标视频片段进行聚类时,所用的聚类算法可以是任意一种现有的聚类算法,例如K-means(K均值)算法,本实施例对具体用的算法不做限定。
通过聚类后,每个视频群中各个视频片段之间的相似度均高于预设定的第一相似度阈值(例如均高于65%),不同视频群的视频片段之间的相似度则低于预设的第二相似度阈值(例如低于25%)。
可选的,在观看过同一视频群的视频片段的多个用户之间进行视频推荐,包括:
确定出观看过同一视频群的视频片段的第一用户和第二用户;
将第一用户观看过而第二用户未观看过的视频片段,推荐给第二用户。
上述第一用户和第二用户仅是为方便说明而给出的示例,实际应用中任意两个看过同一视频群的视频片段的用户都可以按上述方法进行视频推荐。
需要说明,上述第一用户的数量可以是多个。比如说,有10个用户都看过视频一群的视频片段,10个用户中可以确定任意一个为第二用户,其他9个为第一用户,那么可以将9个第一用户中至少一个看过,而第二用户没有看过的视频片段推荐给第二用户。
示例性的,用户甲和用户乙都看过视频一群的视频片段,因此可以预测用户甲和用户乙在观看视频片段上具有相近的兴趣偏好。随后,经检测发现,用户甲看过视频片段3,而用户乙没有看过,于是可以预测用户乙可能也对视频片段3感兴趣,进而将视频片段3推荐给用户乙。
可选的,如前文所述,在S104中还可以在同一视频群相互推荐的基础上引入评分预测,进而实现协同推荐。
协同推荐的具体方法如下:
仍以前述看过同一视频群内视频片段的第一用户和第二用户为例,首先收集第一用户看过而第二用户没有看过的若干个视频片段作为备选视频片段,然后统计这些视频片段的视频热度和这些视频片段的发布者权威度,针对每一备选视频片段,根据该备选视频片段的视频热度和发布者权威度加权计算得到该备选视频片段的评分(又称推荐指数)。该段的描述相当于步骤B3的评分预测。
最后,删除推荐指数低于预设的推荐阈值的备选视频片段,将剩余的若干个备选视频片段作为推荐片段推荐给第二用户。
对于一个视频片段,其视频热度可以直接等于该视频片段的播放量或评论量,也可以按预设的计算函数综合计算播放量和评论量得到,本实施例不做限定。
对于一个视频片段的发布者,其发布者权威度可以根据该发布者累计发布的视频量,该发布者累计收到的点赞量和投诉量的比值,该发布者注册当前的视频网站的时间等数据综合计算得到,本实施例对具体计算方法不做限定。
本申请提供一种视频推荐的方法,可应用于人工智能领域或金融领域,方法包括,根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条弹幕文本的情感标签;情感词指代预设的情感词库中配置有对应的情感极性值的词;在视频数据库中搜索出高情感强度的多个目标视频片段;高情感强度指包含的带情感标签的弹幕文本的数量大于预设的情感强度阈值;根据多个目标视频片段包含的带情感标签的弹幕文本对多个目标视频片段进行聚类,获得多个视频群;在观看过同一视频群的视频片段的多个用户之间进行视频推荐。本方案利用弹幕文本的情感标签实现视频推荐,提高了视频推荐的准确度。
根据本申请实施例提供的视频推荐的方法,本申请实施例还提供一种视频推荐的装置,请参见图4,该装置可以包括如下单元。
分类单元401,用于根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条弹幕文本的情感标签。
其中,情感词,指代预设的情感词库中配置有对应的情感极性值的词或字。
搜索单元402,用于在视频数据库中搜索出高情感强度的多个目标视频片段。
其中,高情感强度是指,包含的带情感标签的弹幕文本的数量大于预设的情感强度阈值。
聚类单元403,用于根据多个目标视频片段包含的带情感标签的弹幕文本对多个目标视频片段进行聚类,获得多个视频群。
推荐单元404,用于在观看过同一视频群的视频片段的多个用户之间进行视频推荐。
可选的,分类单元401根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条弹幕文本的情感标签时,具体用于:
针对每一条弹幕文本,根据情感词库确定出弹幕文本中每一个情感词对应的情感极性值和每一个情感词的类别;
针对每一条弹幕文本,以弹幕文本的情感词的情感极性值和类别为依据,利用朴素贝叶斯分类器对弹幕文本进行情感分类,以确定弹幕文本的情感标签。
可选的,聚类单元403根据多个目标视频片段包含的带情感标签的弹幕文本对多个目标视频片段进行聚类,获得多个视频群时,具体用于:
针对每两个目标视频片段,根据两个目标视频片段包含的弹幕文本的情感标签计算两个目标视频片段的相似度;
根据每两个目标视频片段的相似度,对多个目标视频片段进行聚类,获得多个视频群。
可选的,推荐单元404在观看过同一视频群的视频片段的多个用户之间进行视频推荐,包括:
确定出观看过同一视频群的视频片段的第一用户和第二用户;
将第一用户观看过而第二用户未观看过的视频片段,推荐给第二用户。
本申请实施例提供的视频推荐的装置,其具体工作原理可以参见本申请任一实施例所提供的视频推荐的方法中的相关步骤,此处不再赘述。
本申请提供一种视频推荐的装置,可应用于人工智能领域或金融领域,装置包括,分类单元401,根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条弹幕文本的情感标签;情感词指代预设的情感词库中配置有对应的情感极性值的词;搜索单元402,在视频数据库中搜索出高情感强度的多个目标视频片段;高情感强度指包含的带情感标签的弹幕文本的数量大于预设的情感强度阈值;聚类单元403,根据多个目标视频片段包含的带情感标签的弹幕文本对多个目标视频片段进行聚类,获得多个视频群;推荐单元404,在观看过同一视频群的视频片段的多个用户之间进行视频推荐。本方案利用弹幕文本的情感标签实现视频推荐,提高了视频推荐的准确度。
本申请实施例还提供一种电子设备,请参见图5,包括存储器501和处理器502。
其中,存储器501用于存储计算机程序。
处理器502用于执行计算机程序,计算机程序被执行时,具体用于实现本申请任一实施例所提供的视频推荐的方法。
本申请实施例还提供一种计算机存储介质,用于存储计算机程序,计算机程序被执行时,具体用于实现本申请任一实施例所提供的视频推荐的方法。
需要说明的是,本发明提供的视频推荐的方法、装置、设备和存储介质可用于人工智能领域或金融领域。上述仅为示例,并不对本发明提供视频推荐的方法、装置、设备和存储介质的应用领域进行限定。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
需要注意,本发明中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种视频推荐的方法,其特征在于,包括:
根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条所述弹幕文本的情感标签;其中,所述情感词,指代预设的情感词库中配置有对应的情感极性值的词或字;
在视频数据库中搜索出高情感强度的多个目标视频片段;其中,高情感强度是指,包含的带情感标签的弹幕文本的数量大于预设的情感强度阈值;
根据所述多个目标视频片段包含的带情感标签的弹幕文本对所述多个目标视频片段进行聚类,获得多个视频群;
在观看过同一所述视频群的视频片段的多个用户之间进行视频推荐。
2.根据权利要求1所述的方法,其特征在于,所述根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条所述弹幕文本的情感标签,包括:
针对每一条所述弹幕文本,根据所述情感词库确定出所述弹幕文本中每一个情感词对应的情感极性值和每一个情感词的类别;
针对每一条所述弹幕文本,以所述弹幕文本的情感词的情感极性值和类别为依据,利用朴素贝叶斯分类器对所述弹幕文本进行情感分类,以确定所述弹幕文本的情感标签。
3.根据权利要求1所述的方法,其特征在于,所述根据所述多个目标视频片段包含的带情感标签的弹幕文本对所述多个目标视频片段进行聚类,获得多个视频群,包括:
针对每两个目标视频片段,根据所述两个目标视频片段包含的弹幕文本的情感标签计算所述两个目标视频片段的相似度;
根据每两个目标视频片段的相似度,对所述多个目标视频片段进行聚类,获得多个视频群。
4.根据权利要求1所述的方法,其特征在于,所述在观看过同一所述视频群的视频片段的多个用户之间进行视频推荐,包括:
确定出观看过同一所述视频群的视频片段的第一用户和第二用户;
将所述第一用户观看过而所述第二用户未观看过的视频片段,推荐给所述第二用户。
5.一种视频推荐的装置,其特征在于,包括:
分类单元,用于根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条所述弹幕文本的情感标签;其中,所述情感词,指代预设的情感词库中配置有对应的情感极性值的词或字;
搜索单元,用于在视频数据库中搜索出高情感强度的多个目标视频片段;其中,高情感强度是指,包含的带情感标签的弹幕文本的数量大于预设的情感强度阈值;
聚类单元,用于根据所述多个目标视频片段包含的带情感标签的弹幕文本对所述多个目标视频片段进行聚类,获得多个视频群;
推荐单元,用于在观看过同一所述视频群的视频片段的多个用户之间进行视频推荐。
6.根据权利要求5所述的装置,其特征在于,所述分类单元根据弹幕文本中包含的情感词,对多条弹幕文本进行情感分类,以确定每条所述弹幕文本的情感标签时,具体用于:
针对每一条所述弹幕文本,根据所述情感词库确定出所述弹幕文本中每一个情感词对应的情感极性值和每一个情感词的类别;
针对每一条所述弹幕文本,以所述弹幕文本的情感词的情感极性值和类别为依据,利用朴素贝叶斯分类器对所述弹幕文本进行情感分类,以确定所述弹幕文本的情感标签。
7.根据权利要求5所述的装置,其特征在于,所述聚类单元根据所述多个目标视频片段包含的带情感标签的弹幕文本对所述多个目标视频片段进行聚类,获得多个视频群时,具体用于:
针对每两个目标视频片段,根据所述两个目标视频片段包含的弹幕文本的情感标签计算所述两个目标视频片段的相似度;
根据每两个目标视频片段的相似度,对所述多个目标视频片段进行聚类,获得多个视频群。
8.根据权利要求5所述的装置,其特征在于,所述推荐单元在观看过同一所述视频群的视频片段的多个用户之间进行视频推荐,包括:
确定出观看过同一所述视频群的视频片段的第一用户和第二用户;
将所述第一用户观看过而所述第二用户未观看过的视频片段,推荐给所述第二用户。
9.一种电子设备,其特征在于,包括存储器和处理器;
其中,所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序,所述计算机程序被执行时,具体用于实现如权利要求1至4任意一项所述的视频推荐的方法。
10.一种计算机存储介质,其特征在于,用于存储计算机程序,所述计算机程序被执行时,具体用于实现如权利要求1至4任意一项所述的视频推荐的方法。
CN202211212366.6A 2022-09-29 2022-09-29 视频推荐的方法、装置、设备和存储介质 Pending CN115510269A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211212366.6A CN115510269A (zh) 2022-09-29 2022-09-29 视频推荐的方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211212366.6A CN115510269A (zh) 2022-09-29 2022-09-29 视频推荐的方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN115510269A true CN115510269A (zh) 2022-12-23

Family

ID=84507580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211212366.6A Pending CN115510269A (zh) 2022-09-29 2022-09-29 视频推荐的方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN115510269A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116744063A (zh) * 2023-08-15 2023-09-12 四川中电启明星信息技术有限公司 一种融合社会属性信息的短视频推送系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116744063A (zh) * 2023-08-15 2023-09-12 四川中电启明星信息技术有限公司 一种融合社会属性信息的短视频推送系统
CN116744063B (zh) * 2023-08-15 2023-11-03 四川中电启明星信息技术有限公司 一种融合社会属性信息的短视频推送系统

Similar Documents

Publication Publication Date Title
Günther et al. Word counts and topic models: Automated text analysis methods for digital journalism research
Cambria et al. New avenues in opinion mining and sentiment analysis
Asghar et al. Sentiment analysis on youtube: A brief survey
Bisandu et al. Clustering news articles using efficient similarity measure and N-grams
Sharoff In the garden and in the jungle: Comparing genres in the BNC and Internet
CN111368038B (zh) 一种关键词的提取方法、装置、计算机设备和存储介质
CN111309936A (zh) 一种电影用户画像的构建方法
Hensinger et al. Modelling and predicting news popularity
Kaur Incorporating sentimental analysis into development of a hybrid classification model: A comprehensive study
CN107506472B (zh) 一种学生浏览网页分类方法
CN109446423B (zh) 一种新闻以及文本的情感判断系统及方法
Zhang et al. Sentiment analysis on microblogging by integrating text and image features
CN112395421B (zh) 课程标签的生成方法、装置、计算机设备及介质
Faruque et al. Ascertaining polarity of public opinions on Bangladesh cricket using machine learning techniques
Archchitha et al. Opinion spam detection in online reviews using neural networks
CN115510269A (zh) 视频推荐的方法、装置、设备和存储介质
Abdi et al. Using an auxiliary dataset to improve emotion estimation in users’ opinions
CN107967260B (zh) 一种数据处理方法、设备、系统及计算机可读介质
Yusuf et al. A Technical Review of the State-of-the-Art Methods in Aspect-Based Sentiment Analysis
CN111061939B (zh) 基于深度学习的科研学术新闻关键字匹配推荐方法
Saqib et al. Grouping of aspects into relevant category based on wordnet definitions
Lipka Modeling Non-Standard Text Classification Tasks
Alzhrani Ideology detection of personalized political news coverage: A new dataset
Amiri et al. Research topics and trends of the hashtag recommendation domain
Muneera et al. Extractive text summarization for social news using hybrid techniques in opinion mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination