CN110765313A - 网络视频弹幕分类播放方法和系统 - Google Patents

网络视频弹幕分类播放方法和系统 Download PDF

Info

Publication number
CN110765313A
CN110765313A CN201910876465.6A CN201910876465A CN110765313A CN 110765313 A CN110765313 A CN 110765313A CN 201910876465 A CN201910876465 A CN 201910876465A CN 110765313 A CN110765313 A CN 110765313A
Authority
CN
China
Prior art keywords
bullet screen
text
library
video
barrage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910876465.6A
Other languages
English (en)
Inventor
孙春华
魏琳璘
温琴
姜元春
孙见山
方圆
刘鹏鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Hefei Polytechnic University
Original Assignee
Hefei Polytechnic University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Polytechnic University filed Critical Hefei Polytechnic University
Priority to CN201910876465.6A priority Critical patent/CN110765313A/zh
Publication of CN110765313A publication Critical patent/CN110765313A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种网络视频弹幕分类播放方法和系统,涉及网络视频播放领域。本发明首先获取实时视频的弹幕文本和用户选择的目标弹幕类型,然后将弹幕文本和预设的弹幕分类类型进行匹配,得到匹配结果,将匹配结果和弹幕文本存储到数据库中;然后基于所述用户选择的目标弹幕类型,对所述数据库中的弹幕文本进行筛选,得到目标弹幕文本,上述目标弹幕文本为目标弹幕类型对应的弹幕文本;最后播放目标弹幕文本。本发明通过对弹幕文本进行分类匹配,细化了原有的弹幕,改善了传统弹幕播放中信息冗杂等不合理的情况,进而提升了用户视频观看体验。

Description

网络视频弹幕分类播放方法和系统
技术领域
本发明涉及网络视频播放技术领域,具体涉及一种网络视频弹幕分类播放方法和系统。
背景技术
随着信息技术的发展和互联网对人们生活的渗透,网络视频已经成为人们闲暇时间享受生活的方式,伴随着各种文化的冲击,“弹幕”成为网络视频更具娱乐化、分享化的方式和途径。人们通过弹幕感受到与人一起观看的快乐以及通过弹幕获取更多的相关知识。
现有技术提供了弹幕的开启和关闭、弹幕的颜色、透明度等选择方式。
然而随着弹幕数量的增加,网络视频播放平台的弹幕播放技术却没有紧随其后,用户对过多弹幕消化无能使得用户不仅无法获得娱乐而且影响观看体验。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种网络视频弹幕分类播放方法和系统,解决了现有的网络视频播放平台的弹幕播放技术影响观看体验的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
本发明提供一种网络视频弹幕分类播放方法,所述方法由网络视频播放平台执行,包括以下步骤:
S1、获取用户选择的视频的弹幕文本和用户选择的目标弹幕类型;
S2、将所述弹幕文本和预设的弹幕分类类型进行匹配,得到匹配结果,将所述匹配结果和所述弹幕文本存储到数据库中;
S3、基于所述用户选择的目标弹幕类型,对所述数据库中的弹幕文本进行筛选,得到目标弹幕文本,所述目标弹幕文本为目标弹幕类型对应的弹幕文本;
S4、播放所述目标弹幕文本。
优选的,步骤S1还包括:获取用户播放的视频内容。
优选的,步骤S2具体为:
S201、基于主客观对所述弹幕文本进行分类,得到主观弹幕库和客观弹幕库;
S202、基于情感对所述弹幕文本进行分类,得到正面情感弹幕库和负面情感弹幕库;
S203、基于所述视频内容相关对所述弹幕文本进行分类,得到视频相关弹幕库和视频无关弹幕库;
S204、基于所述视频内容相关对所述弹幕文本进行分类,得到兴趣重合弹幕库和兴趣不重合弹幕库;
S205、将主观弹幕库与正面情感弹幕库重合的弹幕放入情感弹幕库中;
S206将客观弹幕库与视频相关弹幕库重合的弹幕放入信息弹幕库中;
S207、将兴趣重合弹幕库放入兴趣弹幕库中;
S208将情感弹幕库、信息弹幕库、兴趣弹幕库存储在数据库中。
优选的,步骤S201具体为:
S20101、对所述弹幕文本进行预处理,基于预处理后的弹幕文本和预设的网络弹幕常用词词典获取弹幕文本特征集,所述弹幕文本特征集包括主观弹幕特征和客观弹幕特征;
S20102、基于主观弹幕特征建立主观词库;基于客观弹幕特征建立客观词库;
S20103、基于主观词库和客观词库对弹幕文本进行标注;
S20104、通过tf-idf权值计算方法对标注后的弹幕文本进行特征选择;
S20105、使用SVM分类器对特征选择后的弹幕文本进行二分类,生成主观弹幕库和客观弹幕库。
优选的,步骤S20104具体为:
选择预设比例的弹幕文本生成弹幕文本训练集;将弹幕文本训练集在步骤S20103中提取出的特征向量按照LibSVM所需的数据格式对弹幕文本进行特征转换;输入LibSVM进行模型训练;得出训练模型;利用模型对预设比例之外的弹幕文本进行分类。
优选的,步骤S202具体为:
S20201、对所述弹幕文本进行预处理;
S20202、建立一个情感词库,分为正面情感词和负面情感词;
S20203、基于情感词库对弹幕文本进行标注;
S20204、通过tf-idf权值计算方法对标注后的弹幕文本进行特征选择;
S20205、使用SVM分类器对特征选择后的弹幕文本进行二分类,生成正面情感弹幕库和负面情感弹幕库。
优选的,步骤S203具体为:
S20301、对所述弹幕信息进行预处理;
S20302、基于所述视频内容建立视频内容相关词库;
S20303、基于所述视频内容相关词库对弹幕文本进行标注;
S20304、通过tf-idf权值计算方法对标注后的弹幕文本进行特征选择;
S20305、使用SVM分类器对特征选择后的弹幕文本进行二分类,生成视频相关弹幕库和视频无关弹幕库。
优选的,步骤S204具体为:
S20401、对所述弹幕信息进行预处理;
S20402、基于用户的搜索记录中的关键词和用户点赞、评论的视频的关键词,建立用户兴趣词库;
S20403、基于用户兴趣词库对弹幕文本进行自动标注;
S20404、通过tf-idf权值计算方法对标注后的弹幕文本进行特征选择;
S20405、使用SVM分类器对特征选择后的弹幕文本进行二分类,生成兴趣重合弹幕库和兴趣不重合弹幕库。
本发明还提供一种网络视频弹幕分类播放系统,所述系统包括计算机,所述计算机包括:
至少一个存储单元;
至少一个处理单元;
其中,所述至少一个存储单元中存储有至少一条指令,所述至少一条指令由所述至少一个处理单元加载并执行以实现以下步骤:
S1、获取用户选择的视频的弹幕文本和用户选择的目标弹幕类型;
S2、将所述弹幕文本和预设的弹幕分类类型进行匹配,得到匹配结果,将所述匹配结果和所述弹幕文本存储到数据库中;
S3、基于所述用户选择的目标弹幕类型,对所述数据库中的弹幕文本进行筛选,得到目标弹幕文本,所述目标弹幕文本为目标弹幕类型对应的弹幕文本;
S4、播放所述目标弹幕文本。
(三)有益效果
本发明提供了一种网络视频弹幕分类播放方法和系统。与现有技术相比,具备以下有益效果:
本发明首先获取实时视频的弹幕文本和用户选择的目标弹幕类型,然后将弹幕文本和预设的弹幕分类类型进行匹配,得到匹配结果,将匹配结果和弹幕文本存储到数据库中;然后基于所述用户选择的目标弹幕类型,对所述数据库中的弹幕文本进行筛选,得到目标弹幕文本,上述目标弹幕文本为目标弹幕类型对应的弹幕文本;最后播放目标弹幕文本。本发明通过对弹幕文本进行分类匹配,细化了原有的弹幕,改善了传统弹幕播放中信息冗杂等不合理的情况,进而提升了用户视频观看体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种网络视频弹幕分类播放方法的框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种网络视频弹幕分类播放方法和系统,解决了现有的网络视频播放平台的弹幕播放技术影响观看体验的问题,实现提高了用户的视频观看体验。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
本发明实施例首先获取实时视频的弹幕文本和用户选择的目标弹幕类型,然后将弹幕文本和预设的弹幕分类类型进行匹配,得到匹配结果,将匹配结果和弹幕文本存储到数据库中;然后基于所述用户选择的目标弹幕类型,对所述数据库中的弹幕文本进行筛选,得到目标弹幕文本;最后播放目标弹幕文本。本发明实施例通过对弹幕文本进行分类匹配,细化了原有的弹幕,改善了传统弹幕播放中信息冗杂等不合理的情况,进而提升了用户视频观看体验。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
本发明实施例提供一种网络视频弹幕分类播放方法,如图1所示,上述方法由网络视频播放平台执行,包括以下步骤S1~S4:
S1、获取用户选择的视频的弹幕文本和用户选择的目标弹幕类型;
S2、将上述弹幕文本和预设的弹幕分类类型进行匹配,得到匹配结果,将上述匹配结果和上述弹幕文本存储到数据库中;
S3、基于用户选择的目标弹幕类型,对上述数据库中的弹幕文本进行筛选,得到目标弹幕文本,上述目标弹幕文本为目标弹幕类型对应的弹幕文本;
S4、播放上述目标弹幕文本。
本发明实施例通过对弹幕文本进行分类,细化了原有的弹幕,改善了传统弹幕播放中信息冗杂等不合理的情况,进而提升了用户视频观看体验。
下面对各个步骤进行详细描述。
在步骤S1中,获取用户选择的视频的弹幕文本和用户选择的目标弹幕类型。具体为:
S101、获取用户播放视频内容。在具体实施过程中,检测用户点击视频的操作,获取用户点击的某一视频的视频内容。
S102、获取视频的弹幕文本。在具体实施过程中,根据用户所选择的视频提取视频中的全部弹幕文本。
S103、获取用户选择的目标弹幕类型。在具体实施过程中,视频播放平台检测用户选择弹幕类型的操作。
在步骤S2中,将上述弹幕文本和预设的弹幕分类类型进行匹配,得到匹配结果,将上述匹配结果和上述弹幕文本存储到数据库中。需要说明的是,在本发明实例中,数据库为弹幕后台服务器,预设的弹幕分类类型包括:情感弹幕类型、信息弹幕类型、兴趣弹幕类型。具体包括以下步骤:
S201、基于主客观对上述弹幕文本进行分类,得到主观弹幕库和客观弹幕库。在具体实施过程中,包括步骤S20101~S20105:
S20101、对上述弹幕文本进行预处理,基于预处理后的弹幕文本和预设的网络弹幕常用词词典获取弹幕文本特征集,上述弹幕文本特征集包括主观弹幕特征和客观弹幕特征。
在本发明实施例中,首先,使用jieba中文分词对弹幕文本的文本进行分词处理,由于弹幕的特殊性,在执行这一步骤时,还需载入网络弹幕常用词词典(预设的网络弹幕常用词词典是以流行网络语为基础,将大量网络用语和网络弹幕专用语收集起来而建立的词语结合),减少因为词汇过滤而引起的信息损失,得到弹幕文本词集,
然后对弹幕文本词集进行过滤,将虚词、助词、停用词等词条过滤,从而形成弹幕文本特征集,上述弹幕文本特征集中包括主观弹幕特征和客观弹幕特征。
S20102、基于主观弹幕特征建立主观词库;基于客观弹幕特征建立客观词库。
在本发明实施例中,根据主观弹幕通常具有的特征:情感词、指示性动词、指示性副词、语气词、标点符号,建立主观词库。根据客观弹幕通常具有的特征:中数词、量词、方位词、人名、地名,建立客观词库。
S20103、基于主观词库和客观词库对弹幕文本进行匹配和标注。
在本发明实施例中,使用主观词库和客观词库对预处理后的弹幕文本进行标注,得到标注后的弹幕文本。
S20104、通过tf-idf权值计算方法对标注后的弹幕文本进行特征选择。
在本发明实施例中,通过tf-idf权值计算方法进行特征选择。具体地,tf-idf可用于文本特征加权,由tf和idf两部分组成。tf为这个词在一条弹幕文本中出现的次数(统计该弹幕文本中该词出现的次数),假设d为具体的某一条弹幕文本,tn为第n个特征词汇,则该特征的tf值计算公式如下:
tf(tn,d=NumberofTimes(tn))
idf为这个词在所有弹幕文本中出现的次数(统计所有弹幕文本中一个词出现的次数),假设D为所有弹幕文本集合,d为具体的某一条弹幕文本,tn为第n个特征词汇,则该特征的idf值计算公式如下:
Figure BDA0002204450670000101
tf和idf两部分相乘,就能得到具体的一个特征词对于一条弹幕文本的重要程度。假设D为所有弹幕文本集合,d为具体的某一条弹幕,tn为第n个特征词汇,tn则对于样本d的tf-idf值计算公式如下:
fn=tf-idf(tn,d,D)=tf(tn,d)×idf(tn,D)
一条弹幕文本拥有多个特征,因此对每一条弹幕文本就拥有由特征值组成的一个特征向量。形式如下:
FeatureVector={f1,f2,f3,...,fn}。
S20105、使用SVM分类器对特征选择后的弹幕文本进行二分类,生成主观弹幕库和客观弹幕库。
在本发明实施例中,将预设比例的弹幕文本生成弹幕文本训练集(在本发明实施例中,从视频的所有弹幕文本中选择10%的弹幕文本生成弹幕文本训练集);将弹幕文本训练集在步骤S20104中提取出的特征向量按照LibSVM所需的数据格式对弹幕文本进行特征转换;输入LibSVM进行模型训练;得出训练模型;利用模型对其余弹幕文本文本进行分类,得到生成主观弹幕库和客观弹幕库。
S202、基于情感对上述弹幕文本进行分类,得到正面情感弹幕库和负面情感弹幕库。在具体实施过程中,包括步骤S20201~S20205:
S20201、将上述弹幕文本进行预处理,这一步的处理过程和步骤S20101相似。具体过程如下:
在本发明实施例中,首先,使用jieba中文分词对弹幕文本的文本进行分词处理,由于弹幕的特殊性,在执行这一步骤时,还需载入网络弹幕常用词词典(预设的网络弹幕常用词词典是以流行网络语为基础,将大量网络用语和网络弹幕专用语收集起来而建立的词语结合),减少因为词汇过滤而引起的信息损失,并将弹幕文本的虚词、助词、停用词等词条过滤。
S20202、建立一个情感词库,分为正面情感词和负面情感词。
在本发明实施例中,这一步包括以下步骤:
a、将含有情感词的文本粗分为两类,含有正负情感词的弹幕归为正面情感弹幕,含有负面情感词的弹幕归为负面情感弹幕。
b、对含有否定词的文本进行处理,收集否定词,如:不,没有,不可以等。
c、针对步骤a中的粗分结果,将情感词前面带有否定词的文本放入到相反地类别中去,例如,在“这个主角不好看。”这句话中的,“好看”前面有否定词“不”,那么步骤a中粗分结果与实际情况相反,所以要将情感词前面带有否定词的文本放入粗分结果相反的类别中去。
d、针对步骤c处理结果,将在文本中同时含有2中冲突情感的文本删除。例如,在“视频拍的不好看,我喜欢另一个版本。”这句话中,“好看”是正面情感词,通过步骤a中将它处理成正面情感弹幕;在步骤c中,因为“好看”前有否定词“不”,所以要将它放入负面情感弹幕中;最后,又在这条弹幕中发现了正面情感词“喜欢”,所以在这条弹幕中情感有冲突的现象,要将其删除。
S20203、利用情感词库对弹幕文本进行匹配和标注,得到标注后的弹幕文本。
S20204、通过tf-idf权值计算方法对标注后的弹幕文本进行特征选择。
S20205、使用SVM分类器对特征选择后的弹幕文本进行二分类,生成正面情感弹幕库和负面情感弹幕库。
在本发明实施例中,在本发明实施例中,将预设比例的弹幕文本生成弹幕文本训练集(在本发明实施例中,从视频的所有弹幕文本中选择10%的弹幕文本生成弹幕文本训练集);将弹幕文本训练集在步骤S20204中提取出的特征向量按照LibSVM所需的数据格式对弹幕文本进行特征转换;输入LibSVM进行模型训练;得出训练模型;利用模型对其余弹幕文本文本进行分类,得到正面情感弹幕库和负面情感弹幕库。
S203、基于是否与上述视频内容相关对上述弹幕文本进行分类,得到视频相关弹幕库和视频无关弹幕库。在具体实施过程中,包括步骤S20301~S20305:
S20301、将上述弹幕文本进行预处理。具体过程如下:
在本发明实施例中,首先,使用jieba中文分词对弹幕文本的文本进行分词处理,由于弹幕的特殊性,在执行这一步骤时,还需载入网络弹幕常用词词典(预设的网络弹幕常用词词典是以流行网络语为基础,将大量网络用语和网络弹幕专用语收集起来而建立的词语结合),减少因为词汇过滤而引起的信息损失,并将弹幕文本的虚词、助词、停用词等词条过滤。
S20302、建立视频内容相关词库。这一步具体过程如下:
获取当前视频的标识和关键词等信息。视频标识可以指视频的名称,例如复仇者联盟、名侦探柯南等等,还可以是带有数字符号的视频名称,如复仇者联盟第一部、名侦探柯南第5000集等等,具体可以根据实际情况进行设定。
根据视频的标识和关键词等信息调取与视频标识和关键词有关的相关词库,如视频名为《名侦探柯南500集》的关键词是“名侦探柯南”,与“名侦探柯南”相关的人名有“小兰”、“毛利小五郎”、“灰原哀”、“博士”等。
S20303、根据视频内容相关词库对弹幕文本进行自动标注。具体过程如下:
将弹幕文本中含有视频内容相关词库中词的弹幕标为视频相关弹幕。如弹幕文本为“小兰空手道真的厉害!”中含有视频相关词库中的词“小兰”,因此将上述弹幕归为视频相关弹幕。
将弹幕文本中不含有视频内容相关词库中词的弹幕标为视频无关弹幕。如弹幕文本“这一集不好看啊。”中不含有任何视频内容相关词库中的词,因此将上述弹幕归为视频无关弹幕。
S20304、通过tf-idf权值计算方法对标注后的弹幕文本进行特征选择。
S20305、使用SVM分类器对特征选择后的弹幕文本进行二分类,生成视频相关弹幕库和视频无关弹幕库。参照步骤S20105。
S204、基于是否与上述视频内容相关对上述弹幕文本进行分类,得到兴趣重合弹幕库和兴趣不重合弹幕库。在具体实施过程中,包括步骤S20401~S20405:
S20401、对上述弹幕文本进行预处理。参照步骤S20301。
S20402、建立用户兴趣词库。具体过程如下:
a、获取当前用户的搜索记录中的关键词以及用户点赞和评论的视频的关键词。如用户曾搜索“福尔摩斯”、“金田一”,用户曾点赞有关“怪盗基德”的视频。
b、根据步骤a生成用户兴趣词库。
S20403、根据用户兴趣词库对弹幕文本进行自动标注。具体过程如下:
a、将弹幕文本中含有用户兴趣词库中词的弹幕标为兴趣重合弹幕。如弹幕文本中含有“怪盗基德”一词,与用户兴趣词库中的“怪盗基德”重合,因此含有“怪盗基德”的弹幕文本标为兴趣重合弹幕。
b、将弹幕文本中不含有用户兴趣词库中词的弹幕标为兴趣不重合弹幕。如弹幕文本为“园子的男朋友是谁来着?”中不含有用户兴趣词库中的词,因此此弹幕文本标为兴趣不重合弹幕。
S20404、通过tf-idf权值计算方法对标注后的弹幕文本进行特征选择。
S20405、使用SVM分类器对特征选择后的弹幕文本进行二分类,生成兴趣重合弹幕库和兴趣不重合弹幕库。
S205、将主观弹幕库与正面情感弹幕库重合的弹幕放入情感弹幕库中;
S206将客观弹幕库与视频相关弹幕库重合的弹幕放入信息弹幕库中;
S207、将兴趣重合弹幕库放入兴趣弹幕库中;
S208将情感弹幕库、信息弹幕库、兴趣弹幕库存储在弹幕后台服务器中。
在步骤S3中,基于用户选择的目标弹幕类型,对上述数据库中的弹幕文本进行筛选,得到目标弹幕文本,上述目标弹幕文本为目标弹幕类型对应的弹幕文本。
在本发明实施例中,视频播放平台检测用户选择目标弹幕类型的操作,向弹幕后台服务器发送发送目标弹幕类型请求,后台服务器根据用户选择目标弹幕类型,筛选出对应的目标弹幕文本。
S4、播放上述目标弹幕文本。具体实施过程如下:
弹幕后台服务器接收到上述用户的选择后,将根据用户的选择反馈信息型弹幕数据至视频播放应用,视频播放应用将直接在播放界面呈现信息型弹幕文本;假如用户选择情感型弹幕,则弹幕后台服务器接收到上述用户的选择后,将根据用户的选择反馈情感弹幕数据至视频播放应用,视频播放应用将直接在播放界面呈现情感型弹幕文本,其他弹幕类型的播放形式如上上述,再次不作赘述。供用户选择的弹幕类型可以包括但不局限于信息型弹幕、情感型弹幕、兴趣型弹幕中的一种或多种,用户可以根据自己的喜好对弹幕类型进行设置,而对弹幕类型的设置可以使同时选择信息型弹幕和情感型弹幕,也可以是情感型弹幕和兴趣型弹幕的组合,不作限制。
一般地,用户在观看视频时不希望有过多复杂的操作,选择弹幕类型之后再播放视频可能会影响用户观看体验。尤其是使用移动端观看视频的用户,移动端界面较小、界面太拥挤等原因都会影响用户观看视频的体验感,因此,在上述检测用户选择弹幕类型的操作之前,还包括:
S01、检测到视频开始播放。
S02、视频播放按钮右侧按钮“弹”闪动,并弹出半透明的小提示框,小提示框中显示出“信息、情感、兴趣”的选项,提示用户是否打开弹幕以及提示用户选择弹幕类型。
本发明实施例还提供了一种网络视频弹幕分类播放系统,上述系统包括计算机,需要说明的是,在本发明实施例中,计算机优选为网络视频播放平台。上述网络视频播放平台包括:
至少一个存储单元;
至少一个处理单元;
其中,上述至少一个存储单元中存储有至少一条指令,上述至少一条指令由上述至少一个处理单元加载并执行以实现以下步骤:
S1、获取用户选择的视频的弹幕文本和用户选择的目标弹幕类型;
S2、将弹幕文本和预设的弹幕分类类型进行匹配,得到匹配结果,将匹配结果和弹幕文本存储到数据库中;
S3、基于用户选择的目标弹幕类型,对数据库中的弹幕文本进行筛选,得到目标弹幕文本,目标弹幕文本为目标弹幕类型对应的弹幕文本;
S4、播放目标弹幕文本。
可理解的是,本发明实施例提供的上述网络视频弹幕分类播放系统与上述网络视频弹幕分类播放方法相对应,其有关内容的解释、举例、有益效果等部分可以参考网络视频弹幕分类播放方法中的相应内容,此处不再赘述。
综上上述,与现有技术相比,具备以下有益效果:
1、本发明实施例通过对弹幕文本进行分类匹配,细化了原有的弹幕,改善了传统弹幕播放中信息冗杂等不合理的情况,进而提升了用户视频观看体验。
2、弹幕的分类匹配中涉及是否与视频内容有关以及是否与用户兴趣重合,极大程度激起用户的兴趣,有效缓解用户在观看弹幕时产生的消极情绪,提高了用户的视频观看体验,降低了用户对弹幕的回避程度,提高了弹幕播放的有效性。
3、弹幕的选择界面改善了原有技术中扰乱用户视野或者无法引起用户关注的缺点,使弹幕选择界面更具有提醒性以及更加简洁便捷,方便用户使用,提高了用户使用弹幕的体验。
需要说明的是,通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括上述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种网络视频弹幕分类播放方法,其特征在于,所述方法由网络视频播放平台执行,包括以下步骤:
S1、获取用户选择的视频的弹幕文本和用户选择的目标弹幕类型;
S2、将所述弹幕文本和预设的弹幕分类类型进行匹配,得到匹配结果,将所述匹配结果和所述弹幕文本存储到数据库中;
S3、基于所述用户选择的目标弹幕类型,对所述数据库中的弹幕文本进行筛选,得到目标弹幕文本,所述目标弹幕文本为目标弹幕类型对应的弹幕文本;
S4、播放所述目标弹幕文本。
2.如权利要求1所述的网络视频弹幕分类播放方法,其特征在于,步骤S1还包括:获取用户播放的视频内容。
3.如权利要求2所述的网络视频弹幕分类播放方法,其特征在于,步骤S2具体为:
S201、基于主客观对所述弹幕文本进行分类,得到主观弹幕库和客观弹幕库;
S202、基于情感对所述弹幕文本进行分类,得到正面情感弹幕库和负面情感弹幕库;
S203、基于所述视频内容相关对所述弹幕文本进行分类,得到视频相关弹幕库和视频无关弹幕库;
S204、基于所述视频内容相关对所述弹幕文本进行分类,得到兴趣重合弹幕库和兴趣不重合弹幕库;
S205、将主观弹幕库与正面情感弹幕库重合的弹幕放入情感弹幕库中;
S206将客观弹幕库与视频相关弹幕库重合的弹幕放入信息弹幕库中;
S207、将兴趣重合弹幕库放入兴趣弹幕库中;
S208将情感弹幕库、信息弹幕库、兴趣弹幕库存储在数据库中。
4.如权利要求3所述的网络视频弹幕分类播放方法,其特征在于,步骤S201具体为:
S20101、对所述弹幕文本进行预处理,基于预处理后的弹幕文本和预设的网络弹幕常用词词典获取弹幕文本特征集,所述弹幕文本特征集包括主观弹幕特征和客观弹幕特征;
S20102、基于主观弹幕特征建立主观词库;基于客观弹幕特征建立客观词库;
S20103、基于主观词库和客观词库对弹幕文本进行标注;
S20104、通过tf-idf权值计算方法对标注后的弹幕文本进行特征选择;
S20105、使用SVM分类器对特征选择后的弹幕文本进行二分类,生成主观弹幕库和客观弹幕库。
5.如权利要求4所述的网络视频弹幕分类播放方法,其特征在于,步骤S20104具体为:
选择预设比例的弹幕文本生成弹幕文本训练集;将弹幕文本训练集在步骤S20103中提取出的特征向量按照LibSVM所需的数据格式对弹幕文本进行特征转换;输入LibSVM进行模型训练;得出训练模型;利用模型对预设比例之外的弹幕文本进行分类。
6.如权利要求3所述的网络视频弹幕分类播放方法,其特征在于,步骤S202具体为:
S20201、对所述弹幕文本进行预处理;
S20202、建立一个情感词库,分为正面情感词和负面情感词;
S20203、基于情感词库对弹幕文本进行标注;
S20204、通过tf-idf权值计算方法对标注后的弹幕文本进行特征选择;
S20205、使用SVM分类器对特征选择后的弹幕文本进行二分类,生成正面情感弹幕库和负面情感弹幕库。
7.如权利要求3所述的网络视频弹幕分类播放方法,其特征在于,步骤S203具体为:
S20301、对所述弹幕信息进行预处理;
S20302、基于所述视频内容建立视频内容相关词库;
S20303、基于所述视频内容相关词库对弹幕文本进行标注;
S20304、通过tf-idf权值计算方法对标注后的弹幕文本进行特征选择;
S20305、使用SVM分类器对特征选择后的弹幕文本进行二分类,生成视频相关弹幕库和视频无关弹幕库。
8.如权利要求3所述的网络视频弹幕分类播放方法,其特征在于,步骤S204具体为:
S20401、对所述弹幕信息进行预处理;
S20402、基于用户的搜索记录中的关键词和用户点赞、评论的视频的关键词,建立用户兴趣词库;
S20403、基于用户兴趣词库对弹幕文本进行自动标注;
S20404、通过tf-idf权值计算方法对标注后的弹幕文本进行特征选择;
S20405、使用SVM分类器对特征选择后的弹幕文本进行二分类,生成兴趣重合弹幕库和兴趣不重合弹幕库。
9.一种网络视频弹幕分类播放系统,其特征在于,所述系统包括计算机,所述计算机包括:
至少一个存储单元;
至少一个处理单元;
其中,所述至少一个存储单元中存储有至少一条指令,所述至少一条指令由所述至少一个处理单元加载并执行以实现以下步骤:
S1、获取用户选择的视频的弹幕文本和用户选择的目标弹幕类型;
S2、将所述弹幕文本和预设的弹幕分类类型进行匹配,得到匹配结果,将所述匹配结果和所述弹幕文本存储到数据库中;
S3、基于所述用户选择的目标弹幕类型,对所述数据库中的弹幕文本进行筛选,得到目标弹幕文本,所述目标弹幕文本为目标弹幕类型对应的弹幕文本;
S4、播放所述目标弹幕文本。
CN201910876465.6A 2019-09-17 2019-09-17 网络视频弹幕分类播放方法和系统 Pending CN110765313A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910876465.6A CN110765313A (zh) 2019-09-17 2019-09-17 网络视频弹幕分类播放方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910876465.6A CN110765313A (zh) 2019-09-17 2019-09-17 网络视频弹幕分类播放方法和系统

Publications (1)

Publication Number Publication Date
CN110765313A true CN110765313A (zh) 2020-02-07

Family

ID=69329899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910876465.6A Pending CN110765313A (zh) 2019-09-17 2019-09-17 网络视频弹幕分类播放方法和系统

Country Status (1)

Country Link
CN (1) CN110765313A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111526410A (zh) * 2020-04-24 2020-08-11 中影环球(北京)科技有限公司 一种基于影片信息的影院实时社交交互系统
CN111541910A (zh) * 2020-04-21 2020-08-14 华中科技大学 一种基于深度学习的视频弹幕评论自动生成方法及系统
CN111800660A (zh) * 2020-06-24 2020-10-20 维沃移动通信有限公司 信息显示方法和装置
CN115170372A (zh) * 2022-09-06 2022-10-11 江西兴智教育科技有限公司 基于互联网的交互式教育平台系统及方法
CN116744063A (zh) * 2023-08-15 2023-09-12 四川中电启明星信息技术有限公司 一种融合社会属性信息的短视频推送系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016095384A1 (zh) * 2014-12-19 2016-06-23 中兴通讯股份有限公司 一种弹幕显示方法及系统
CN109766435A (zh) * 2018-11-06 2019-05-17 武汉斗鱼网络科技有限公司 弹幕类别识别方法、装置、设备及存储介质
CN110113634A (zh) * 2019-03-22 2019-08-09 厦门理工学院 一种信息互动方法、装置、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016095384A1 (zh) * 2014-12-19 2016-06-23 中兴通讯股份有限公司 一种弹幕显示方法及系统
CN109766435A (zh) * 2018-11-06 2019-05-17 武汉斗鱼网络科技有限公司 弹幕类别识别方法、装置、设备及存储介质
CN110113634A (zh) * 2019-03-22 2019-08-09 厦门理工学院 一种信息互动方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
叶健等: "基于大规模弹幕数据监听和情感分类的舆情分析模型", 《华东师范大学学报(自然科学版)》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111541910A (zh) * 2020-04-21 2020-08-14 华中科技大学 一种基于深度学习的视频弹幕评论自动生成方法及系统
CN111541910B (zh) * 2020-04-21 2021-04-20 华中科技大学 一种基于深度学习的视频弹幕评论自动生成方法及系统
CN111526410A (zh) * 2020-04-24 2020-08-11 中影环球(北京)科技有限公司 一种基于影片信息的影院实时社交交互系统
CN111800660A (zh) * 2020-06-24 2020-10-20 维沃移动通信有限公司 信息显示方法和装置
CN111800660B (zh) * 2020-06-24 2022-04-19 维沃移动通信有限公司 信息显示方法和装置
CN115170372A (zh) * 2022-09-06 2022-10-11 江西兴智教育科技有限公司 基于互联网的交互式教育平台系统及方法
CN115170372B (zh) * 2022-09-06 2022-12-09 江西兴智教育科技有限公司 基于互联网的交互式教育平台系统及方法
CN116744063A (zh) * 2023-08-15 2023-09-12 四川中电启明星信息技术有限公司 一种融合社会属性信息的短视频推送系统
CN116744063B (zh) * 2023-08-15 2023-11-03 四川中电启明星信息技术有限公司 一种融合社会属性信息的短视频推送系统

Similar Documents

Publication Publication Date Title
CN110765313A (zh) 网络视频弹幕分类播放方法和系统
CN109657054B (zh) 摘要生成方法、装置、服务器及存储介质
US7822701B2 (en) Lexicon generation methods, lexicon generation devices, and lexicon generation articles of manufacture
CN108595660A (zh) 多媒体资源的标签信息生成方法、装置、存储介质及设备
US20170221476A1 (en) Method and system for constructing a language model
CN110263248A (zh) 一种信息推送方法、装置、存储介质和服务器
CN110597952A (zh) 信息处理方法、服务器及计算机存储介质
CN107729468A (zh) 基于深度学习的答案抽取方法及系统
CN108549723B (zh) 一种文本概念分类方法、装置及服务器
CN110287314B (zh) 基于无监督聚类的长文本可信度评估方法及系统
CN112765974B (zh) 一种业务辅助方法、电子设备及可读存储介质
CN108345612B (zh) 一种问题处理方法和装置、一种用于问题处理的装置
CN108153875B (zh) 语料处理方法、装置、智能音箱和存储介质
CN111046172A (zh) 一种舆情分析方法、装置、设备和存储介质
CN112382295A (zh) 语音识别方法、装置、设备及可读存储介质
Bednarek Keyword analysis and the indexing of Aboriginal and Torres Strait Islander identity: A corpus linguistic analysis of the Australian Indigenous TV drama Redfern Now
CN109543041B (zh) 一种语言模型得分的生成方法及装置
CN109062905B (zh) 一种弹幕文本价值评价方法、装置、设备及介质
CN112527963B (zh) 基于词典的多标签情感分类方法及装置、设备、存储介质
CN109960752B (zh) 应用程序内的查询方法、装置、计算机设备和存储介质
CN111090977A (zh) 一种智能写作系统及智能写作方法
JP2016103156A (ja) テキスト特徴量抽出装置、テキスト特徴量抽出方法、およびプログラム
CN112597295B (zh) 摘要提取方法、装置、计算机设备和存储介质
JPH05233719A (ja) 複合的な情報間の関連性識別方法
JP4423385B2 (ja) 文書分類支援装置およびコンピュータプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200207