CN111107416A - 一种弹幕屏蔽方法、装置及电子设备 - Google Patents

一种弹幕屏蔽方法、装置及电子设备 Download PDF

Info

Publication number
CN111107416A
CN111107416A CN201911291466.0A CN201911291466A CN111107416A CN 111107416 A CN111107416 A CN 111107416A CN 201911291466 A CN201911291466 A CN 201911291466A CN 111107416 A CN111107416 A CN 111107416A
Authority
CN
China
Prior art keywords
preference
user
emotion
bullet screen
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911291466.0A
Other languages
English (en)
Other versions
CN111107416B (zh
Inventor
周静亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing IQIYI Science and Technology Co Ltd
Original Assignee
Beijing IQIYI Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing IQIYI Science and Technology Co Ltd filed Critical Beijing IQIYI Science and Technology Co Ltd
Priority to CN201911291466.0A priority Critical patent/CN111107416B/zh
Publication of CN111107416A publication Critical patent/CN111107416A/zh
Application granted granted Critical
Publication of CN111107416B publication Critical patent/CN111107416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4318Generation of visual interfaces for content selection or interaction; Content or additional data rendering by altering the content in the rendering process, e.g. blanking, blurring or masking an image region
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种弹幕屏蔽方法、装置、电子设备及计算机可读存储介质。该方法包括:获取弹幕屏蔽时所利用的关键词;确定所述关键词所表征的对象,并获取用户对所述对象的情感偏好,作为用户的情感偏好;确定包含所述关键词的待显示弹幕,并识别所述对象在所述待显示弹幕中所表征的情感偏好,作为待显示弹幕的情感偏好;确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果,如果该匹配结果为不匹配,则屏蔽所述待显示弹幕。与现有技术相比,应用本发明实施例提供的方法,可以实现为每个用户提供个性化的弹幕屏蔽结果。

Description

一种弹幕屏蔽方法、装置及电子设备
技术领域
本发明涉及计算机技术领域,特别是涉及一种弹幕屏蔽方法、装置及电子设备。
背景技术
当前,随着计算机技术的快速发展,用户在观看视频的过程中,可以通过发送弹幕来发布自己对于视频内容的感受。其中,所谓弹幕是指在网络上观看视频时弹出的评论性字幕。显然,由于不同用户的欣赏能力、知识水平等方面的不同,不同用户对同一事物的感受也可能不同。这样,针对同一视频内容,不同的用户可能产生完全不同的感受,从而导致弹幕内容所表达的情感是分化的,甚至会出现不文明的弹幕内容。
基于此,为了净化视频环境,使用户获得良好的观影体验,存在对于弹幕屏蔽的需求。在相关技术中,弹幕屏蔽的过程包括:获得指定的关键词,将包括所指定的关键词的弹幕进行屏蔽,从而使用户所看到的弹幕内容中均不包括这些关键词。例如,视频网站可以屏蔽包括某些不文明用语的弹幕,还可以屏蔽包括某个演员的姓名的弹幕等等。
然而,发明人在实现本发明的过程中发现,现有技术至少存在如下问题:
相关技术中,针对同一个关键词,为不同用户所提供的弹幕屏蔽结果是相同的,从而,无法为每个用户提供个性化的弹幕屏蔽结果。
例如,当关键词为演员D的姓名时,由于用户A是演员D的粉丝,因此,用户A所希望的弹幕屏蔽结果是:屏蔽对演员D进行负面评价的弹幕内容,保留对演员D进行正面评价的弹幕内容,而由于用户B不喜欢演员D,因此,用户B所希望的弹幕屏蔽结果是:屏蔽所有包括演员D的姓名的弹幕内容;进一步的,由于用户C虽然不是演员D的粉丝,但是对演员D具有一定的好感度,因此,用户B所希望的弹幕屏蔽结果是:屏蔽对演员D进行负面评价的弹幕内容,以及部分对D进行过度夸奖的弹幕内容。然而,在现有技术中,视频网站将屏蔽所有包括演员D的姓名的弹幕内容,从而无法满足用户A、B和C的弹幕屏蔽需求。
发明内容
本发明实施例的目的在于提供一种弹幕屏蔽方法、装置、电子设备及计算机可读存储介质,以实现为每个用户提供个性化的弹幕屏蔽结果。
具体技术方案如下:
第一方面,本发明实施例提供了一种弹幕屏蔽方法,应用于客户端,所述方法包括:
获取弹幕屏蔽时所利用的关键词;
确定所述关键词所表征的对象,并获取用户对所述对象的情感偏好,作为用户的情感偏好;
确定包含所述关键词的待显示弹幕,并识别所述对象在所述待显示弹幕中所表征的情感偏好,作为待显示弹幕的情感偏好;
确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果,如果该匹配结果为不匹配,则屏蔽所述待显示弹幕。
可选的,一种具体实现方式中,所述获取用户对于所述对象的情感偏好,作为用户的情感偏好的步骤,包括:
从用户发布的多条评论内容中,提取表征情感偏好的词,作为第一参考词;
针对预设的多个词典中的每个词典,统计属于该词典的第一参考词的数量;其中,所述每个词典对应一种情感偏好,且每一所述词典对应的情感偏好与该词典中包括的词所表征的情感偏好相匹配;
确定包含所述第一参考词的数量最多的词典为目标情感词典,并将所述目标情感词典对应的情感偏好,确定为用户的情感偏好。
可选的,一种具体实现方式中,所述识别所述对象在所述待显示弹幕中所表征的情感偏好,作为待显示弹幕的情感偏好的步骤,包括:
从所述待显示弹幕中,提取表征情感偏好的词,作为第二参考词;
将所述第二参考词所表征的情感偏好,确定为待显示弹幕的情感偏好;
所述确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果的步骤,包括:
判断所述目标情感词典中是否包括所述第二参考词,并基于判断结果,确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果;或,
基于所述第二参考词与所述目标情感词典中各个词的向量距离,计算所述第二参考词所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度,基于所计算的相似度是否满足预设匹配阈值,确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果。
可选的,一种具体实现方式中,所述基于所述第二参考词与所述目标情感词典中各个词的向量距离,计算所述第二参考词所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度的步骤,包括:
利用第一公式,计算所述第二参考词所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度;其中,所述第一公式为:
Figure BDA0002319244480000031
其中,ft为所述第二参考词t所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度,|DIC|为所述目标情感词典所包括的词的数量,C(t,uk)为所述第二参考词t与所述目标情感词典中的词uk的向量距离。
可选的,一种具体实现方式中,所述方法还包括:
获取用户对所述对象的情感偏好程度,作为用户的关注度;
基于所述用户的关注度,确定对候选弹幕中需要屏蔽的候选弹幕的屏蔽比例,并按照所确定的屏蔽比例,屏蔽候选弹幕;其中,所述候选弹幕为所述匹配结果为匹配的待显示弹幕。
可选的,一种具体实现方式中,所述获取用户对所述对象的情感偏好程度的步骤,包括:
获取与所述对象相关的各类用户行为的行为数据;
针对每一类用户行为,确定该类用户行为的行为数据所属的目标阈值区间,并将预设的所述目标阈值区间对应的分值作为该类用户行为的目标分值;其中,所述目标阈值区域为:预设的该类用户行为的多个预设阈值区间中的一个;
基于每类用户行为的行为数据和目标分值,确定用户对所述对象的情感偏好程度。
可选的,一种具体实现方式中,所述基于每类用户行为的行为数据和目标分值,确定用户对所述对象的情感偏好程度的步骤,包括:
利用第二公式,确定用户对所述对象的情感偏好程度,其中,所述第二公式为:
Figure BDA0002319244480000041
其中,score为:用户对所述对象的情感偏好程度,VK为:第K类用户行为的目标分值,WK为:第K类用户行为的权重,mK为:第K类用户行为的行为数据,N为各类用户行为的类别总数,N≥1。
第二方面,本发明实施例提供了一种弹幕屏蔽装置,应用于客户端,所述装置包括:
关键词获取模块,用于获取弹幕屏蔽时所利用的关键词;
用户情感偏好获取模块,用于确定所述关键词所表征的对象,并获取用户对所述对象的情感偏好,作为用户的情感偏好;
弹幕情感偏好获取模块,用于确定包含所述关键词的待显示弹幕,并识别所述对象在所述待显示弹幕中所表征的情感偏好,作为待显示弹幕的情感偏好;
第一弹幕屏蔽模块,用于确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果,如果该匹配结果为不匹配,则屏蔽所述待显示弹幕。
可选的,一种具体实现方式中,所述用户情感偏好获取模块包括:
第一参考词提取子模块,用于从用户发布的多条评论内容中,提取表征情感偏好的词,作为第一参考词;
数量统计子模块,用于针对预设的多个词典中的每个词典,统计属于该词典的第一参考词的数量;其中,所述每个词典对应一种情感偏好,且每一所述词典对应的情感偏好与该词典中包括的词所表征的情感偏好相匹配;
用户情感偏好获取子模块,用于确定包含所述第一参考词的数量最多的词典为目标情感词典,并将所述目标情感词典对应的情感偏好,确定为用户的情感偏好。
可选的,一种具体实现方式中,所述弹幕情感偏好获取模块包括:
第二参考词提取子模块,用于从所述待显示弹幕中,提取表征情感偏好的词,作为第二参考词;
弹幕情感偏好获取子模块,用于将所述第二参考词所表征的情感偏好,确定为待显示弹幕的情感偏好;
所述第一弹幕屏蔽模块包括:
第一弹幕屏蔽子模块,用于判断所述目标情感词典中是否包括所述第二参考词,并基于判断结果,确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果;或,
第二弹幕屏蔽子模块,用于基于所述第二参考词与所述目标情感词典中各个词的向量距离,计算所述第二参考词所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度,基于所计算的相似度是否满足预设匹配阈值,确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果。
可选的,一种具体实现方式中,所述第二弹幕屏蔽子模块具体用于:
利用第一公式,计算所述第二参考词所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度;其中,所述第一公式为:
Figure BDA0002319244480000051
其中,ft为所述第二参考词t所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度,|DIC|为所述目标情感词典所包括的词的数量,C(t,uk)为所述第二参考词t与所述目标情感词典中的词uk的向量距离。
可选的,一种具体实现方式中,所述装置还包括:
用户关注度获取模块,用于获取用户对所述对象的情感偏好程度,作为用户的关注度;
第二弹幕屏蔽模块,用于基于所述用户的关注度,确定对候选弹幕中需要屏蔽的候选弹幕的屏蔽比例,并按照所确定的屏蔽比例,屏蔽候选弹幕;其中,所述候选弹幕为所述匹配结果为匹配的待显示弹幕。
可选的,一种具体实现方式中,所述用户关注度获取模块包括:
行为数据获取子模块,用于获取与所述对象相关的各类用户行为的行为数据;
目标数值获取子模块,用于针对每一类用户行为,确定该类用户行为的行为数据所属的目标阈值区间,并将预设的所述目标阈值区间对应的分值作为该类用户行为的目标分值;其中,所述目标阈值区域为:预设的该类用户行为的多个预设阈值区间中的一个;
情感偏好程度获取子模块,用于基于每类用户行为的行为数据和目标分值,确定用户对所述对象的情感偏好程度。
可选的,一种具体实现方式中,所述情感偏好程度获取子模块具体用于:
利用第二公式,确定用户对所述对象的情感偏好程度,其中,所述第二公式为:
Figure BDA0002319244480000061
其中,score为:用户对所述对象的情感偏好程度,VK为:第K类用户行为的目标分值,WK为:第K类用户行为的权重,mK为:第K类用户行为的行为数据,N为各类用户行为的类别总数,N≥1。
第三方面,本发明实施例提供了一种电子设备,所述电子设备安装有客户端,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面提供的任一弹幕屏蔽方法的步骤。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的弹幕屏蔽方法。
在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的弹幕屏蔽方法。
以上可见,应用本发明实施例提供的方案,在存在弹幕,且需要对弹幕进行屏蔽时,客户端可以首先获取弹幕屏蔽时所利用的关键词,并确定该关键词所表征的对象,即确定需要对关于哪个对象的弹幕进行屏蔽。进而,客户端可以获取用户的情感偏好,即获取用户对该对象的情感偏好。这样,针对包含该关键词的待显示弹幕,客户端便可以识别该待显示弹幕的情感偏好,即识别该对象在该待显示弹幕中所表征的情感偏好。进而,确定待显示弹幕的情感偏好和用户的情感偏好的匹配结果,其中,如果该匹配结果为不匹配,则屏蔽该显示弹幕。可见,在本发明实施例提供的方案中,针对不同用户,当对象相同时,客户端可以根据不同用户对该对象的不同的情感偏好,屏蔽不同的待显示弹幕,从而为每个用户提供基于其情感信息的个性化的弹幕屏蔽结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的一种弹幕屏蔽方法的流程示意图;
图2为图1中,S102的一种具体实现方式的流程示意图;
图3为图2中,S202中预设的多个词典的构建方式的一种具体实现方式的流程示意图;
图4为图1中,S103的一种具体实现方式的流程示意图;
图5为本发明实施例提供的另一种弹幕屏蔽方法的流程示意图;
图6为图5中,S105的一种具体实现方式的流程示意图;
图7为图5中,S106的一种具体实现方式的流程示意图;
图8为本发明实施例提供的一种弹幕屏蔽装置的结构示意图;
图9为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
在相关技术中,弹幕屏蔽的过程包括:获得指定的关键词,将包括所指定的关键词的弹幕进行屏蔽,从而使用户所看到的弹幕内容中均不包括这些关键词。因此,相关技术中,针对同一个关键词,为不同用户所提供的弹幕屏蔽结果是相同的,从而,无法为每个用户提供个性化的弹幕屏蔽结果。
为了解决现有技术存在的问题,本发明实施例提供了一种弹幕屏蔽方法。
其中,该弹幕屏蔽方法应用于任一能够进行视频播放的客户端,例如,视频网站、手机视频软件等,对此,本发明实施例不做具体限定,以下简称客户端。此外,该客户端除了可以播放视频外,还可以提供其他服务,例如,发布帖子、为明星打榜、建立有关明星的泡泡圈子等。进而,该弹幕屏蔽方法包括:
获取弹幕屏蔽时所利用的关键词;
确定所述关键词所表征的对象,并获取用户对所述对象的情感偏好,作为用户的情感偏好;
确定包含所述关键词的待显示弹幕,并识别所述对象在所述待显示弹幕中所表征的情感偏好,作为待显示弹幕的情感偏好;
确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果,如果该匹配结果为不匹配,则屏蔽所述待显示弹幕。
以上可见,应用本发明实施例提供的方案,在存在弹幕,且需要对弹幕进行屏蔽时,客户端可以首先获取弹幕屏蔽时所利用的关键词,并确定该关键词所表征的对象,即确定需要对关于哪个对象的弹幕进行屏蔽。进而,客户端可以获取用户的情感偏好,即获取用户对该对象的情感情感。这样,针对包含该关键词的待显示弹幕,客户端便可以识别该待显示弹幕的情感偏好,即识别该对象在该待显示弹幕中所表征的情感偏好。进而,确定待显示弹幕的情感偏好和用户的情感偏好的匹配结果,其中,如果该匹配结果为不匹配,则屏蔽该显示弹幕。可见,在本发明实施例提供的方案中,针对不同用户,当对象相同时,客户端可以根据不同用户对该对象的不同的情感偏好,屏蔽不同的待显示弹幕,从而为每个用户提供基于其情感信息的个性化的弹幕屏蔽结果。
下面对本发明实施例提供的一种弹幕屏蔽方法进行具体说明。
图1为本发明实施例提供的一种弹幕屏蔽方法的流程示意图,如图1所示,该方法可以包括如下步骤:
S101:获取弹幕屏蔽时所利用的关键词;
客户端在播放一视频时,在该视频的播放过程中,视频画面中可以显示多条弹幕。其中,每条弹幕中可以包括一关键词,而该关键词表征了该条弹幕所针对的对象,例如,包括演员名称的弹幕中,该演员名称即为该弹幕所包括的关键词,从而,表明该条弹幕是针对该演员的弹幕,该弹幕的内容可以是对该演员的正面评价,也可以是对该演员的负面评价。
基于此,在对弹幕进行屏蔽时,客户端可以首先获取弹幕屏蔽时所利用的关键词。
其中,客户端可以通过多种方式获取弹幕屏蔽时所利用的关键词,对此,本发明实施例不做具体限定。
例如,该关键词可以是用户发送给客户端的。示例性的,用户可以在向客户端发送该视频的播放指令的同时,向客户端发送该关键词;也可以是用户在视频播放过程中,向客户端发送该关键字。并且,用户可以通过多种方式向客户端发送该关键词,例如,在客户端视频显示界面的指定位置输入该关键词的文字信息,又例如,在客户端视频显示界面所提供的多个关键词选项中,点击所选择的关键词选项等。这都是合理的。
又例如,该关键词可以是预先设定好的,针对客户端可以播放的各个视频,预先设定每一视频与关键词的对应关系,并将该对应关系保存在本地存储空间内或服务器端,从而,在客户端开始播放一视频时,便可以直接从该对应关系中,读取该视频对应的关键词,从而获取对该视频进行弹幕屏蔽时所利用的关键词。其中,每一视频对应的关键词的设定可以是用户根据经验设定的,也可以是客户端对视频中所包括的各类对象进行分析后确定的。这都是合理的。
又例如,该关键词可以是预先设定好的,针对客户端的各个注册用户,可以预先设定每一注册用户的登陆账号与关键词的对应关系,并将该对应关系保存在本地存储空间内或服务器端,从而,当该用户在登录状态下观看视频时,客户端便可以直接从该对应关系中,读取该用户的登录账号对应的关键词,从而获取对该视频进行弹幕屏蔽时所利用的关键词。其中,每一注册用户的登陆账号对应的关键词的设定可以是用户输入的关键词设定的,也可以是根据该注册用户的登陆账号的视频观看历史确定的。这都是合理的。
S102:确定关键词所表征的对象,并获取用户对对象的情感偏好,作为用户的情感偏好;
在获取到弹幕屏蔽时利用的关键词后,客户端便可以确定该关键词所表征的对象,进而,获取用户对该对象的情感偏好,并将所获取的用户对该对象的情感偏好作为用户的情感偏好。
其中,客户端可以通过多种方式获取用户对该对象的情感偏好,对此本发明实施例不做具体限定。例如,客户端可以通过问卷的形式,获取用户输入的对每个弹幕屏蔽时所利用的关键词所表征的对象的情感偏好。为了行文清晰,后续将会对获取用户对对象的情感偏好的实现方式进行举例说明。
S103:确定包含关键词的待显示弹幕,并识别对象在待显示弹幕中所表征的情感偏好,作为待显示弹幕的情感偏好;
可以理解的,所谓弹幕屏蔽是指在视频播放过程中,客户端可以对视频观看者针对该视频内容所发出的某些弹幕进行过滤,使这些弹幕不会在视频画面中显示。其中,视频观看者针对该视频内容所发出的弹幕中可以包括上述所获取到的关键词,以与该关键词所表征的对象相关,也可以不包括上述所获取到的关键词,以与该关键词所表征的对象无关。
由于在本发明实施例中,是为了屏蔽包括上述所获取到的关键词,以与该关键词所表征的对象相关的某些弹幕,因此,客户端需要判断,每个包括上述所获取到的关键词,且还未在视频画面中显示的待显示弹幕,是否符合用户对于上述所确定的用户的情感偏好,从而确定是否对该待显示弹幕进行屏蔽。
基于此,在确定上述弹幕屏蔽时所利用的关键词所表征的对象后,客户端便可以确定包含该关键词的待显示弹幕,并识别该对象在该待显示弹幕中所表征的情感偏好,并将所识别得到的该对象在该待显示弹幕中所表征的情感偏好作为待显示弹幕的情感偏好。
其中,确定关键词所表征的对象,具体可以通过预设的关键词与对象的映射关系,确定该关键词所表征的对象,例如,根据粉丝团对某明星的昵称,预设关键词与对象的映射关系,即可确定该昵称(关键词)所表征的对象即为明星。
可选的,由于可能存在多个关键词均可以表征同一对象的情况,例如,对于明星而言,该明星的名字、昵称和黑称均可以作为表征该对象的关键词,因此,上步骤S101中所获取到的弹幕屏蔽时所利用的关键词可以是一个,也可以是多个。
则当该关键词为多个时,在步骤S103中所确定的包含关键词的待显示弹幕可以为:包括所获取的多个关键词中的至少一个关键词的待显示弹幕。
其中,客户端可以通过多种方式识别对象在待显示弹幕中所表征的情感偏好,对此,本发明实施例不做具体限定。为了行文清晰,后续将会对识别对象在待显示弹幕中所表征的情感偏好的实现方式进行举例说明。
S104:确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果,如果该匹配结果为不匹配,则屏蔽待显示弹幕。
在得到用户的情感偏好和待显示弹幕的情感偏好后,客户端便可以确定用户的情感偏好和待显示弹幕的情感偏好的匹配结果。
显然,当用户的情感偏好和待显示弹幕的情感偏好的匹配结果为不匹配时,则说明该待显示弹幕不符合用户对上述对象的情感偏好,从而,客户端便可以屏蔽该待显示弹幕。
其中,客户端可以通过多种方式确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果,对此,本发明实施例不做具体限定。为了行文清晰,后续将会对确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果的实现方式进行举例说明。
以上可见,应用本发明实施例提供的方案,在存在弹幕,且需要对弹幕进行屏蔽时,客户端可以首先获取弹幕屏蔽时所利用的关键词,并确定该关键词所表征的对象,即确定需要对关于哪个对象的弹幕进行屏蔽。进而,客户端可以获取用户的情感偏好,即获取用户对该对象的情感偏好。这样,针对包含该关键词的待显示弹幕,客户端便可以识别该待显示弹幕的情感偏好,即识别该对象在该待显示弹幕中所表征的情感偏好。进而,确定待显示弹幕的情感偏好和用户的情感偏好的匹配结果,其中,如果该匹配结果为不匹配,则屏蔽该显示弹幕。可见,在本发明实施例提供的方案中,针对不同用户,当对象相同时,客户端可以根据不同用户对该对象的不同的情感偏好,屏蔽不同的待显示弹幕,从而为每个用户提供基于其情感信息的个性化的弹幕屏蔽结果。
下面,对上述步骤S102中,获取用户对对象的情感偏好,作为用户的情感偏好的实现方式进行举例说明。
可选的,一种具体实现方式中,如图2所示,上述步骤S102可以包括如下步骤:
S201:从用户发布的多条评论内容中,提取表征情感偏好的词,作为第一参考词;
在确定所获取的弹幕屏蔽时所利用的关键词所表征的对象后,客户端便可以从用户发布的多条评论内容中提取表征情感偏好的词,得到第一参考词。
其中,用户发布的多条评论内容可以为:用户发布的关于上述所确定的对象的多条评论内容。该评论内容可以为发布在该客户端的任一功能板块,且以任意形式表现的内容,例如,用户对包括所确定对象的视频的评论、用户在包括确定对象的视频中发布的弹幕、用户在所确定对象的泡泡圈子中的发言等。
这样,由于在用户发布的多条评论内容中可以包括表征情感偏好的词,这些词可以反应用户对上述所确定对象的情感偏好,因此,客户端便可以从所确定的多条评论内容中,提取表征情感偏好的词,作为第一参考词。
其中,客户端可以通过多种方式从用户发布的多条评论内容中提取表征情感偏好的词,例如,利用关键词提取算法等,这都是合理的。
需要说明的是,在本发明实施例中,因为是基于用户发布的评论内容确定用户对所确定对象的情感偏好的,因此,在本发明实施例中,客户端需要在所获取的众多评论内容中确定哪些评论内容是该用户发布的。
其中,可选的,用户可以均为该客户端的注册用户。这样,当该用户在登录状态下,发布评论内容时,客户端便可以基于该用户的登录账号确定该用户发布的评论内容。
S202:针对预设的多个词典中的每个词典,统计属于该词典的第一参考词的数量;
其中,每个词典对应一种情感偏好,且每一词典对应的情感偏好与该词典中包括的词所表征的情感偏好相匹配;
显然,每个情感词典是多个词的集合,且属于该词典的词所表征的情感偏好相同,均为该词典对应的情感偏好。例如,一词典对应的情感偏好为正面评价偏好,则该词典中可以包括喜爱、喜欢、心爱、热爱、嗜好等表征正面评价偏好的词。其中,客户端可以通过多种方式构建上述预设的多个词典,对此本发明实施例不做具体限定。为了行文清晰,后续将会对词典的预设方式进行举例说明。
这样,在提取到第一参考词后,针对预设的多个词典中的每个词典,客户端便可以统计所提取到的第一关键词中,属于该词典的第一参考词的数量。
具体的,在提取到第一参考词后,客户端便可以针对每个第一参考词,确定该第一参考词所属的词典。其中,每个第一参考词可以属于上述多个词典中的至少一个词典,也可以不属于上述多个词典中的任一词典。这样,针对上述多个词典中的每个词典,客户端便可以统计所提取到的第一参考词中,属于该词典的第一参考词的数量。
其中,客户端可以通过多种方式确定每个第一参考词所属的词典。对此本发明实施例不做具体限定。为了行文清晰,后续将会对每个第一参考词所属的词典的确定方式进行举例说明。
S203:确定包含第一参考词的数量最多的词典为目标情感词典,并将目标情感词典对应的情感偏好,确定为用户的情感偏好。
在统计得到属于每个词典的第一参考词的数量后,客户端便可以将包括第一参考词的数量最多的词典确定为目标情感词典,进而,将该目标情感词典对应的情感偏好,确定为用户对对象的情感偏好,即确定为用户的情感偏好。
例如,预设的多个词典分别为:词典A、词典B、词典C,且所确定的属于词典A的第一参考词的数量为100,所确定的属于词典B的第一参考词的数量为200,所确定的属于词典C的第一参考词的数量为300,则词典C即为目标情感词典,情感C所对应的情感偏好即为用户的情感那偏好。
下面,对上述步骤S202中预设的多个词典的构建方式进行举例说明。
可选的,一种具体实现方式中,如图3所示,步骤S202中预设的多个词典的构建方式可以包括如下步骤:
S301:构建多个初始词典;
其中,每个初始词典对应于一个情感偏好,且包括多个能够表征该情感偏好的代表词;
可以理解的,人们对于某个事物的情感偏好是多样的,例如,人们可以喜欢某个事物,也可以不喜欢某个事物,还可以对该事物没有明显的好恶。因此,用户对于弹幕屏蔽时所利用的关键词所表征的对象的情感偏好也是多样的。
这样,在构建上述预设的多个词典时,客户端可以先构建多个初始词典,且每个初始词典对应于一情感偏好。其中,初始词典的数量可以根据实际应用中的需求确定。例如,多个初始词典的数量为2个,一个所对应的情感偏好为正面评价偏好,另一个所对应的情感偏好信息为负面评价偏好。
此外,对于每个情感偏好而言,存在能够明确表征该情感偏好的词,例如,喜欢、喜爱、某明星的爱称等词可以明确表征情感偏好为正面评价偏好,厌恶、恶心、某明星的黑称等词可以明确表征情感偏好为负面评价偏好。因此,客户端所构建的每个初始词典中,可以包括多个能够明确表征该初始词典所对应的情感偏好的代表词。
具体的,在上述步骤S301中,客户端开发人员可以通过多种方式向客户端发送词典设定信息,该词典设定信息包括:初始词典的数量、每个初始词典对应的情感偏好及所包括的代表词。这样,客户端在获取该设定信息后,便可以构建得到多个初始词典。
S302:从多个用户发布的多条评论内容中,提取多个表征情感偏好的词,作为待分类关键词;
由于本发明实施例是针对视频弹幕的,而视频弹幕实质上也是视频观看者对视频内容的评论内容,因此,客户端所构建的词典可以是基于多个用户发布的多条评论内容建立的。进而,在构建得到多个对应于不同情感偏好的初始词典后,客户端便可以从多个用户发布的多条评论内容中,提取多个表征情感偏好的词,作为待分类关键词。
其中,上述评论内容可以是任一用户发布在该客户端的任一功能板块,且以任意形式表现的内容,例如,用户对视频的评论、用户在视频中发布的弹幕、用户泡泡圈子中的发言等。
此外,客户端也可以通过多种方式从评论内容中提取表征情感偏好的词。例如,利用关键词提取算法等,这都是合理的。
S303:针对每个待分类关键词,确定该待分类关键词与每个初始词典的相似度,基于该相似度,确定该待分类关键词所属的初始词典,将该待分类关键词加入该目标初始词典,直至将最后一个待分类关键词加入所属的目标初始词典,得到多个词典。
在提取到多个待分类关键词后,针对每个待分类关键词,客户端便可以确定该待分类关键词与每个初始词典的相似度,进而,客户端便可以基于所确定的相似度,确定该待分类关键词所属的初始词典,并将该待分类关键词加入该初始词典。这样,当将最后一个待分类关键加入其所属的初始词典后,便可以得到多个词典。显然,该得到的多个词典即为上述步骤S202中预设的多个词典。
其中,针对每个待分类关键词,客户端可以通过多种方式基于该待分类关键词与每个初始词典的相似度,确定该待分类关键词所属的初始词典。对此,本发明实施例不做具体限定。
可选的,针对每个待分类关键词,在确定该待分类关键词与每个初始词典的相似度后,针对每个相似度,客户端可以判断该相似度是否大于预设阈值。进而,当判断结果为是时,客户端便可以将该相似度对应的初始词典确定该待分类关键词所属的初始词典。
其中,当存在多个相似度大于预设阈值时,可以将多个初始词典确定为该待分类关键词所属的初始词典。
可选的,针对每个待分类关键词,在确定该待分类关键词与每个初始词典的相似度后,客户端便可以确定该多个相似度中的最大相似度,进而,便可以将该最大相似度对应的初始词典确定为该待分类关键词所属的初始词典。
其中,针对上述步骤S303,需要说明的是,在将一个待分类关键词加入到其所属的目标初始词典后,针对下一个待分类关键词,在确定该待分类关键词与每个的相似度时,上述被加入到该初始词典中的待分类关键词将发挥作用。
例如,待分类关键词a所属的初始词典为初始词典A,则将待分类关键词a加入到初始词典A中,这样,对于下一个待分类关键词b,当确定待分类关键词b与初始词典A的相似度时,所确定的是待分类关键词b与加入待分类关键词a后的初始词典A的相似度,即在相似度确定过程中,新加入到初始词典A中的待分类关键词a也将发挥作用。
此外,针对每个待分类关键词,客户端也可以通过多种方式确定该待分类关键词与每个初始词典的相似度。对此本发明实施例不做具体限定。
可选的,一种具体实现方式中,针对每个待分类关键词,客户端可以利用如下公式,确定该待分类关键词与每个初始词典的相似度;其中,该公式为:
Figure BDA0002319244480000161
其中,fk(t∈DICR)为:待分类关键词a与第k个初始词典的相似度,DICR为:多个待分类关键词构成的集合,|DICk|为第k个初始词典所包括的代表词的数量,C(a,vk)为待分类关键词a与第k个初始词典中代表词vk的向量距离。
其中,在上述公式中,待分类关键词a与第k个初始词典中代表词vk的向量距离C(a,vk)的计算方式可以为:确定待分类关键词a的第一特征向量及第k个初始词典中代表词vk的第二特征向量,计算第一特征向量与第二特征向量的夹角余弦值,所计算得到的夹角余弦值即为上述向量距离C(a,vk)。
需要说明的是,随着时间的推进,会有更多的用户发布更多的评论内容,同一用户也可能发布更多的评论内容,因此,上述图2所示实施例中确定的用户的情感偏好,以及上述图3所示实施例中构建的多个词典均可以周期性更新。
下面,对上述步骤S202相关的内容中,所提取到的第一参考词中,各个第一参考词所属的词典的确定方式进行举例说明。
可选的,一种具体实现方式中,针对每个第一参考词,客户端可以确定上述多个词典中包括该第一参考词的词典。其中,当仅有一个词典包括该第一参考词时,则该词典即为该第一参考词所属的词典;当存在多个词典包括该第一参考词时,客户端便可以进一步确定该第一参考词分别与包括该第一参考词的各个词典的相似度,进而将相似度最大的词典确定为该第一参考词所属的词典。
可选的,另一种具体实现方式中,针对每个第一参考词,客户端可以确定该第一参考词与每个预设的词典的相似度。显然,当相似度越大时,说明该第一参考词所表示的情感偏好与该词典对应的情感偏好越相似。因此,可以将所确定的最大相似度所对应的词典确定为该第一参考词所属的词典。
需要说明的,很多时候,同一个词在不同语境中所表示的含义可以不同,因此,所提取的第一参考词表征的情感偏好,与该第一参考词所在的评论内容表征的情感偏好可以是不同的。基于此,可选的,再一种具体实现方式中,所提取到的第一参考词中,各个第一参考词所属的词典的确定方式可以为:
针对每个第一参考词,确定该第一参考词表征的情感偏好;并利用语义分析算法确定该第一参考词所在的评论内容表征的情感偏好;当上述两个情感偏好相同时,便可以将所对应情感偏好与该第一参考词表征的情感偏好相同的词典确定为该第一参考词所属的词典。
其中,针对每个第一参考词,客户端可以通过多种方式确定该第一参考词词表征的情感偏好。例如,客户端可以确定该第一参考词与每个预先的词典的相似度;将所确定的最大相似度所对应的词典所对应的情感偏好,确定为该第一参考词所对应的情感偏好。
进一步的,客户端可以利用语义分析算法确定该第一参考词所在的评论内容表征的情感偏好。
这样,针对每个第一参考词,在确定该第一参考词表征的情感偏好与该第一参考词所在的评论内容表征的情感偏好后,客户端便可以判断上述两个情感偏好是否相同。
显然,当判断结果为是时,说明该第一参考词表征的情感偏好,与该第一参考词所在的评论内容表征的情感偏好相同,即用户在目标评论内容中采用该第一关键词所要表达的情感偏好与该第一参考词表征的情感偏好相同。因此,在判断结果为是时,客户端可以将所对应情感偏好与该第一参考词表征的情感偏好相同的词典确定为该第一参考词所属的词典。
相对应的,当判断结果为否时,说明该第一参考词表征的情感偏好,与该第一参考词所在的评论内容表征的情感偏好不同,因此,客户端可以确定该第一参考词不属于任一词典,即可以确定该第一参考词所属的词典为空。
需要说明的是,在上述三种具体实现方式中,第一参考词与预设的词典的相似度的确定方式与上述图3所示实施例中,每个待分类关键词与每个初始词典的相似度的确定方式相似,在此不再赘述。
下面,对上述步骤S103中,识别对象在待显示弹幕中所表征的情感偏好,作为待显示弹幕的情感偏好的实现方式进行举例说明。
可选的,一种具体实现方式中,如图4所示,上述步骤S103可以包括如下步骤:
S401:从待显示弹幕中,提取表征情感偏好的词,作为第二参考词;
S402:将第二参考词所表征的情感偏好,确定为待显示弹幕的情感偏好;
其中,弹幕是视频观看者针对所观看视频内容发出的评论,该视频观看者可以通过所发布的弹幕来表达自己对视频内容中的某个对象的情感偏好。因此,在所确定的包含上述弹幕屏蔽时所利用的关键词的待显示弹幕中,可以包括表征情感偏好的词。
基于此,在确定包含关键词的待显示弹幕后,客户端便可以从该待显示弹幕中,提取表征情感偏好的词,得到第二参考词,进而,客户端便可以确定该第二参考词所表征的情感偏好,并将所确定的该第二参考词所表征的情感偏好作为该待显示弹幕的情感偏好。
其中,客户端可以通过多种方式确定该第二参考词所表征的情感偏好,对此,本发明实施例不做具体限定。
可选的,一种具体实现方式中,客户端可以在上述步骤S202中预设的多个词典中,确定包括该第二参考词的词典,从而,便可以将该词典所对应的情感偏好确定为该第二参考词所表征的情感偏好。
可选的,另一种具体实现方式中,客户端可以确定该第二关键词与上述步骤S202中预设的多个词典中的每个词典的相似度,进而,将所确定的相似度最大的词典所对应的情感偏好确定为该第二参考词所表征的情感偏好。
其中,第二参考词与预设的词典的相似度的确定方式与上述图3所示实施例中,每个待分类关键词与每个初始词典的相似度的确定方式相似,在此不再赘述。
根据上述两种具体实现方式,待显示弹幕的情感偏好即为上述步骤S202中,预定的多个词典中,第二参考词所属的词典所对应的情感偏好。
相应的,在本具体实现方式中,上述步骤S104中,确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果的实现方式便可以包括如下三种:
第一种实现方式中:判断目标情感词典中是否包括第二参考词,并基于判断结果,确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果。
根据上述对图2所示实施例的说明,用户的情感偏好即为上述图2所示实施例中所确定的目标情感词典对应的情感偏好,因此,客户端可以判断该目标情感词典中是否包括上述第二参考词,进而,基于该判断结果,客户端便可以确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果。
其中,当目标情感词典中不包括该第二参考词时,说明该第二参考词所表征的情感偏好与目标情感词典对应的情感偏好不同,进而,说明该待显示弹幕的情感偏好与用户的情感偏好不同。
基于此,当上述判断结果为否时,可以确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果为不匹配,从而,客户端可以屏蔽该第二参考词所在的待显示弹幕。
第二种实现方式中:判断第二参考词所属的词典与目标情感词典是否为同一词典,并基于判断结果,确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果。
根据上述对图2所示实施例的说明,用户的情感偏好即为上述图2所示实施例中所确定的目标情感词典对应的情感偏好,并且,第二参考词的词典为上述步骤S202中,预定的多个词典中的一个词典所对应的情感偏好,则可以说明第二参考词属于该词典,因此,客户端可以判断第二参考词所属的词典与目标情感词典是否为同一词典,进而,基于该判断结果,客户端便可以确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果。
其中,当第二参考词所属的词典与目标情感词典为不同词典时,说明该第二参考词所表征的情感偏好与目标情感词典对应的情感偏好不同,进而,说明该待显示弹幕的情感偏好与用户的情感偏好不同。
基于此,当上述判断结果为否时,可以确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果为不匹配,从而,客户端可以屏蔽该第二参考词所在的待显示弹幕。
第三种实现方式中:基于第二参考词与目标情感词典中各个词的向量距离,计算第二参考词所表征的情感偏好与目标情感词典对应的情感偏好的相似度,基于所计算的相似度是否满足预设匹配阈值,确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果。
根据上述对图2所示实施例的说明,用户的情感偏好即为上述图2所示实施例中所确定的目标情感词典对应的情感偏好,基于此,客户端可以确定上述第二参考词与该目标情感词典中各个词的向量距离,进而,便可以基于所确定的多个向量距离,计算上述第二参考词与目标情感词典对应的情感偏好的相似度。
显然,当计算得到的上述第二参考词与目标情感词典对应的情感偏好的相似度越大,则说明该第二参考词表征的情感偏好与目标情感词典对应的情感偏好越接近,即待显示弹幕的情感偏好与用户的情感偏好越接近。
基于此,客户端便可以判断所计算得到的上述第二参考词与目标情感词典对应的情感偏好的相似度是否满足预设匹配阈值。
其中,当上述判断结果为是,即所计算得到的上述第二参考词与目标情感词典对应的情感偏好的相似度满足预设匹配阈值时,客户端便可以确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果为匹配,从而,显示该待显示弹幕;相应的,当上述判断结果为否,即所计算得到的上述第二参考词与目标情感词典对应的情感偏好的相似度不满足预设匹配阈值时,客户端便可以确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果为不匹配,从而,屏蔽该待显示弹幕。
可选的,上述判断所计算得到的上述第二参考词与目标情感词典对应的情感偏好的相似度是否满足预设匹配阈值可以为:判断该相似度是否大于预设匹配阈值。其中,当判断结果为大于时,则确定上述相似度满足预设匹配阈值,进而,确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果为匹配,显示该待显示弹幕。相应的,当判断结果为不大于时,则确定上述相似度不满足预设匹配阈值,进而,确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果为不匹配,屏蔽该待显示弹幕。
其中,可选的,一种具体实现方式中,上述第三种实现方式中,基于第二参考词与目标情感词典中各个词的向量距离,计算第二参考词所表征的情感偏好与目标情感词典对应的情感偏好的相似度的实现方式可以为:
利用第一公式,计算第二参考词所表征的情感偏好与目标情感词典对应的情感偏好的相似度;其中,第一公式为:
Figure BDA0002319244480000211
其中,ft为第二参考词t所表征的情感偏好与目标情感词典对应的情感偏好的相似度,|DIC|为目标情感词典所包括的词的数量,C(t,uk)为第二参考词t与目标情感词典中的词uk的向量距离。
可以理解的,对于同一对象,即使不同用户对该对象的情感偏好是一致的,但是情感偏好的程度也可以是不同的。例如,对于某个演员,两个用户对该演员的情感偏好均为喜欢,然而,其中一个特别喜欢该演员,无论该演员在各类影视作品中的表现如何,都会夸奖该演员,俗称“脑残粉”,另一个是比较喜欢该演员,但是会根据该演员在各类影视作品中的实际表现情况,进行评论,会夸奖也会批评该演员,俗称“理智粉”。
基于此,对于包括上述弹幕屏蔽时所利用的关键词的待显示弹幕,用户更倾向于看到与自己的情感偏好的程度更为一致的内容。例如,上述举例中的“理智粉”并不想看到对该演员进行过分夸奖的弹幕。
因此,在上述步骤S104中,当所确定的确定待显示弹幕的情感偏好与用户的情感偏好的匹配结果为匹配时,该待显示弹幕也并不一定是用户想要看到的。
这样,为了进一步提高弹幕屏蔽的准确性,提升用户的观影体验,可选的,一种具体实现方式中,如图5所示,本发明实施例提供的一种弹幕屏蔽方法还可以包括如下步骤:
S105:获取用户对对象的情感偏好程度,作为用户的关注度;
在确定弹幕屏蔽时所利用的关键词所表征的对象后,客户端便可以获取用户对对象的情感偏好程度,作为用户的关注度。
也就是说,上述步骤S105可以在确定上述对象的步骤之后,且后续步骤S106之前的任一时刻进行,对此,本发明实施例不做具体限定。
此外,客户端可以通过多种方式获取用户对对象的情感的偏好程度,对此,本发明实施例不做具体限定。为了行文清晰,后续将会对用户对对象的情感偏好程度的获取方式进行举例说明。
S106:基于用户的关注度,确定对候选弹幕中需要屏蔽的候选弹幕的屏蔽比例,并按照所确定的屏蔽比例,屏蔽候选弹幕;
其中,候选弹幕为匹配结果为匹配的待显示弹幕。
在获取到用户关注度后,针对所确定的匹配结果为匹配的候选弹幕,客户端便可以基于上述所获取到的用户的关注度,确定对候选弹幕中需要屏蔽的候选弹幕的屏蔽比例,并按照所确定的屏蔽比例,屏蔽候选弹幕。
其中,客户端可以根据预设的关注度与屏蔽比例之间的关系,确定所获取的用户的关注度所对应的屏蔽比例,进而,客户端便可以按照该屏蔽比例屏蔽候选弹幕。
例如,用户的关注度分为-2、-1、0、1和2共五种程度,其中,关注度为0表征用户对上述弹幕屏蔽时所利用的关键词所表征的对象的关注度一般,即用户既不喜欢该对象,也不讨厌该对象,进而,当关注度大于0时,关注度越高,表征用户对该对象的正面情感偏好程度越高,反之,当关注度小于0时,关注度越小,表征用户对该对象的负面情感偏好程度越高。
进而,示例性的,预设关注度-2对应的屏蔽比例为1,即可以屏蔽全部候选弹幕;预设关注度-1对应的屏蔽比例为0.8,即可以屏蔽全部候选弹幕中80%的候选弹幕;预设关注度0对应的屏蔽比例为0.5,即可以屏蔽全部候选弹幕中50%的候选弹幕;预设关注度1对应屏蔽比例为0.2,即可以屏蔽全部的候选弹幕中20%的候选弹幕;预设关注度2对应屏蔽弹幕为0,即不屏蔽候选弹幕。
需要说明的是,上述例子中关注度分类的具体情况以及各个关注度对应的屏蔽比例仅用于对上述步骤S106进行举例说明,而并不是对关注度分类的具体情况以及各个关注度对应的屏蔽比例进行的具体限定。
基于此,在本发明实施例中,不对关注度分类的具体情况以及各个关注度对应的屏蔽比例进行具体限定,在实际应用中,可以根据实际应用的需求,设定关注度分类的具体情况以及各个关注度对应的屏蔽比例。
此外,上述步骤S106只要在上述步骤S105之后执行即可。并且,客户端同样可以通过多种方式执行上述步骤S106,对此,本发明实施例不做具体限定。为了行文清晰,后续将会对上述步骤S106的实现方式进行举例说明。
下面,对上述步骤S105中,用户对对象的情感偏好程度的获取方式进行举例说明。
可选的,一种具体实现方式中,客户端可以通过问卷的形式,获取针对不同的对象,各个用户的关注度。
可选的,另一种具体实现方式中,如图6所示,上述步骤S105中,获取用户对对象的情感偏好程度的实现方式,可以包括如下步骤:
S601:获取与对象相关的各类用户行为的行为数据;
可以理解的,用户通常可以通过客户端执行各类与上述弹幕屏蔽时所利用的关键词所表征的对象的关注度相关的各类行为。
例如,当对象为某个明星时,该行为可以为:是否加入该明星的泡泡圈子,是否为该明星打榜,是否观看该明星参演的影视作品,对包括该明星的视频添加“喜欢”标签,关注与该明星相关的话题,发布与该明星相关的帖子等。其中,在本发明实施例中不对各类行为的具体方式进行限定。
显然,当用户十分喜欢该明星时,可以说明用户对该明星的关注度较高,此外,用户可以为该明星打榜,增加该明星的打榜影响力;观看该明星参演的影视作品,提高该明星参演的影视作品的播放量;为该明星参演的影视作品打高分,提高该明星参演的影视作品的评价;加入该明星的泡泡圈子,并发表大量的话题和帖子等等。也就是说,用户可以多次执行各类与上述对象的关注度相关的各类行为,从而所产生的上述各类行为的行为数据较高。
基于此,客户端可以获取用户执行各类与上述对象的关注度相关的各类行为时,所产生的行为数据,即获取与上述对象相关的各类用户行为的行为数据。
其中,该行为数据可以为与各类行为相关的数据,而不限定为用户执行该类型为的操作动作的数据。例如,当该类行为是观看包括对象的视频时,操作数据可以为:观看时长;当该类行为是参与关于对象的打榜行为时,操作数据可以为:打榜影响力;当该类行为是点开与关闭视频时,操作数据可以为:观看包括对象的视频与关闭包括对象的视频的数量比等。
S602:针对每一类用户行为,确定该类用户行为的行为数据所属的目标阈值区间,并将预设的目标阈值区间对应的分值作为该类用户行为的目标分值;
其中,目标阈值区域为:预设的该类用户行为的多个预设阈值区间中的一个;
由于各类行为的行为数据之间可能存在量级的差异,例如,观看时间可能是几百分钟,而观看包括对象的视频与关闭包括对象的视频的数量比可能是个位数。因此,为了统一各个操作数据,便于计算关注度。在获取到与上述对象相关的各类用户行为的行为数据后,针对每一类用户行为,客户端便可以确定该类用户行为的行为数据所属的目标阈值区间,并将预设的目标阈值区间对应的分值作为该类用户行为的目标分值。
其中,针对每一类用户行为,客户端可以采集各个用户执行该类用户行为的行为数据,进而,对该行为数据进行聚类,便可以得到该行为数据集中出现的多个阈值区间。显然,各个阈值区间所对应的行为数据的大小可以表征用户的关注度的高低,并且,当该阈值区间所对应的行为数据较大时,可以表征用户的关注度较高,反之,可以表征用户的关注度较低。基于此,客户端便可以根据各个阈值区间所对应的行为数据的大小,为各个阈值区间设定对应的分值。其中,各个阈值区间所对应的行为数据越大,表征用户的关注度越高,进而,为该阈值区间设定的分值可以越大。
这样,在获取与对象相关的各类用户行为的行为数据后,针对每一类用户行为,当该类用户行为的行为数据属于某一阈值区间时,则该阈值区间对应的分值即可以作为该类用户行为的目标分值。
例如,针对用户行为A,设定有5个阈值区间,按照每个阈值区间所对应的行为数据由小到大的顺序,依次设定每个阈值区间的分值为:-2、-1、0、1和2。其中,当所获取到的用户行为A的行为数据位于按照每个阈值区间所对应的行为数据由小到大的顺序排列的第二个阈值区间时,可以确定该用户行为A的目标分值为-1。
S603:基于每类用户行为的行为数据和目标分值,确定用户对对象的情感偏好程度。
在获取每类行为的行为数据并确定每类行为的目标分值后,客户端便可以基于每类用户行为的行为数据和目标分值,确定用户对对象的情感偏好程度。
其中,客户端可以通过多种方式基于每类用户行为的行为数据和目标分值,确定用户对对象的情感偏好程度。对此,本发明实施例不作具体限定。
可选的,一种具体实现方式中,基于每类用户行为的行为数据和目标分值,确定用户对对象的情感偏好程度的方式向方式可以包括如下步骤:
利用第二公式,确定用户对对象的情感偏好程度,其中,第二公式为:
Figure BDA0002319244480000261
其中,score为:用户对对象的情感偏好程度,VK为:第K类用户行为的目标分值,WK为:第K类用户行为的权重,mK为:第K类用户行为的行为数据,N为各类用户行为的类别总数,N≥1。
下面,对上述步骤S106,基于用户的关注度,确定对候选弹幕中需要屏蔽的候选弹幕的屏蔽比例,并按照所确定的屏蔽比例,屏蔽候选弹幕的实现方式进行举例说明。
可选的,一种具体实现方式中,如图7所示,上述步骤S106可以包括如下步骤:
S701:显示所确定的各个候选弹幕中的第一个候选弹幕;
S702:针对所确定的各个候选弹幕中除第一个候选弹幕以外的每个候选弹幕,计算所确定的各个候选弹幕中该候选弹幕之前的至少一个候选弹幕中,被屏蔽的候选弹幕的当前比例与屏蔽比例的数值关系;当当前比例小于屏蔽比例时,屏蔽该候选弹幕。
可以理解的,视频中的各个弹幕是在视频播放过程中,按照所对应的视频播放时间由早到晚的顺序,随着视频播放时间的延续,依次在所对应的时间点出现的。
基于此,各个候选弹幕也是按照所对应视频播放时间由早到晚的顺序依次排列的,进而,当视频播放时间到达第一个候选弹幕对应的播放时间时,客户端便可以显示该第一个候选弹幕。
进一步的,针对所确定的各个候选弹幕中除第一个候选弹幕以外的每个候选弹幕,当视频播放时间到达该候选弹幕对应的播放时间时,客户端可以首先计算各个候选弹幕中,该候选弹幕之前的至少一个候选弹幕中被屏蔽的候选弹幕的当前比例,并接着判断该当前比例与所确定的屏蔽比例的数值关系。
这样,当所计算得到的当前比例小于所确定的屏蔽比例时,客户端便可以屏蔽该候选弹幕,反之,当所计算得到的当前比例大于所确定的屏蔽比例时,客户端便可以显示该候选弹幕。
其中,需要说明的是,当所计算得到的当前比例等于所确定的屏蔽比例时,客户端可以屏蔽该候选弹幕,也可以显示该候选弹幕,对此,本发明实施例不做具体限定。
例如,所确定的屏蔽比例为0.6,则客户端可以显示第一个候选弹幕,进而,当视频播放至第二个候选弹幕所对应播放时间时,客户端可以计算得到第二候选弹幕之前的各个候选弹幕中,被屏蔽的候选弹幕的当前比例为0,则由于0<0.6,则客户端屏蔽该第二个候选弹幕;进而,当视频播放至第三个候选弹幕所对应播放时间时,客户端可以计算得到第三候选弹幕之前的各个候选弹幕中,被屏蔽的候选弹幕的当前比例为0.5,则由于0.5<0.6,则客户端屏蔽该第三个候选弹幕;进而,当视频播放至第四个候选弹幕所对应播放时间时,客户端可以计算得到第四候选弹幕之前的各个候选弹幕中,被屏蔽的候选弹幕的当前比例为0.67,则由于0.67>0.6,则客户端显示该第四个候选弹幕。依次类推,直至屏蔽或者显示最后一个候选弹幕。
其中,可以理解的,用户在观看视频时,视频中的各个待显示弹幕可以是视频在当次播放之前的播放过程中,各个用户所输入的待显示弹幕,显然,客户端可以预先确定此类待显示弹幕所对应播放时间和此类待显示弹幕中的各个候选弹幕。
此外,视频中的各个待显示弹幕也可以为在当次播放过程中,其他用户实时输入的待显示弹幕,在这种情况下,客户端首先获取该实时输入的待显示弹幕,进而,确定该实时输入的待显示弹幕是否为候选弹幕。
其中,如果该实时输入的待显示弹幕不是候选弹幕,则针对本发明实施例中所提到的用户,客户端将屏蔽该实时输入的待显示弹幕;如果该实时输入的待显示弹幕是候选弹幕,则该实时输入的待显示弹幕输入时,视频的播放时刻即为该实时输入的待显示弹幕所对应的播放时刻,显然,客户端可以将该实时输入的待显示弹幕作为:所确定的各个候选弹幕中所对应播放时间为当前时刻之前的各个候选弹幕之后的第一个待显示弹幕。这样,客户端可以计算所确定的各个候选弹幕中所对应播放时间为当前时刻之前的各个候选弹幕中,被屏蔽的候选弹幕的当前比例与屏蔽比例的数值关系;当当前比例小于屏蔽比例时,屏蔽该候选弹幕。
例如,所确定的屏蔽比例为0.6,则客户端可以显示第一个候选弹幕,进而,当视频播放至第二个候选弹幕所对应播放时间时,客户端可以计算得到第二候选弹幕之前的各个候选弹幕中,被屏蔽的候选弹幕的当前比例为0,由于0<0.6,则客户端屏蔽该第二个候选弹幕;进而,当视频播放至第三个候选弹幕所对应播放时间时,客户端可以计算得到第三候选弹幕之前的各个候选弹幕中,被屏蔽的候选弹幕的当前比例为0.5,由于0.5<0.6,则客户端屏蔽该第三个候选弹幕;进而,当视频播放至第四个候选弹幕所对应播放时间时,客户端可以计算得到第四候选弹幕之前的各个候选弹幕中,被屏蔽的候选弹幕的当前比例为0.67,由于0.67>0.6,则客户端显示该第四个候选弹幕;进而,在视频播放至第五个候选弹幕所对应播放时间之前,客户端接收到其他用户实时输入的待显示弹幕,并确定该实时输入的待显示弹幕为候选弹幕,则客户端可以计算所对应播放时间为接收该实时输入的待显示弹幕的播放时刻之前的各个候选弹幕中,被屏蔽的候选弹幕的当前比例,即确定前4个候选弹幕中,被屏蔽的候选弹幕的当前比例,显然,该比例为:0.5,进而,0.5<0.6,则客户端屏蔽该实时输入的待显示弹幕。
相应于上述本发明实施例提供的一种弹幕屏蔽方法,本发明实施例还提供了一种弹幕屏蔽装置。
图8为本发明实施例提供的一种弹幕屏蔽装置的结构示意图,如图8所示,该装置包括:
关键词获取模块810,用于获取弹幕屏蔽时所利用的关键词;
用户情感偏好获取模块820,用于确定所述关键词所表征的对象,并获取用户对所述对象的情感偏好,作为用户的情感偏好;
弹幕情感偏好获取模块830,用于确定包含所述关键词的待显示弹幕,并识别所述对象在所述待显示弹幕中所表征的情感偏好,作为待显示弹幕的情感偏好;
第一弹幕屏蔽模块840,用于确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果,如果该匹配结果为不匹配,则屏蔽所述待显示弹幕。
以上可见,应用本发明实施例提供的方案,在存在弹幕,且需要对弹幕进行屏蔽时,客户端可以首先获取弹幕屏蔽时所利用的关键词,并确定该关键词所表征的对象,即确定需要对关于哪个对象的弹幕进行屏蔽。进而,客户端可以获取用户的情感偏好,即获取用户对该对象的情感。这样,针对包含该关键词的待显示弹幕,客户端便可以识别该待显示弹幕的情感偏好,即识别该对象在该待显示弹幕中所表征的情感偏好。进而,确定待显示弹幕的情感偏好和用户的情感偏好的匹配结果,其中,如果该匹配结果为不匹配,则屏蔽该显示弹幕。可见,在本发明实施例提供的方案中,针对不同用户,当对象相同时,客户端可以根据不同用户对该对象的不同的情感偏好,屏蔽不同的待显示弹幕,从而为每个用户提供基于其情感信息的个性化的弹幕屏蔽结果。
可选的,一种具体实现方式中,所述用户情感偏好获取模块820包括:
第一参考词提取子模块,用于从用户发布的多条评论内容中,提取表征情感偏好的词,作为第一参考词;
数量统计子模块,用于针对预设的多个词典中的每个词典,统计属于该词典的第一参考词的数量;其中,所述每个词典对应一种情感偏好,且每一所述词典对应的情感偏好与该词典中包括的词所表征的情感偏好相匹配;
用户情感偏好获取子模块,用于确定包含所述第一参考词的数量最多的词典为目标情感词典,并将所述目标情感词典对应的情感偏好,确定为用户的情感偏好。
可选的,一种具体实现方式中,所述弹幕情感偏好获取模块830包括:
第二参考词提取子模块,用于从所述待显示弹幕中,提取表征情感偏好的词,作为第二参考词;
弹幕情感偏好获取子模块,用于将所述第二参考词所表征的情感偏好,确定为待显示弹幕的情感偏好;
所述第一弹幕屏蔽模块包括:
第一弹幕屏蔽子模块,用于判断所述目标情感词典中是否包括所述第二参考词,并基于判断结果,确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果;或,
第二弹幕屏蔽子模块,用于基于所述第二参考词与所述目标情感词典中各个词的向量距离,计算所述第二参考词所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度,基于所计算的相似度是否满足预设匹配阈值,确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果。
可选的,一种具体实现方式中,所述第二弹幕屏蔽子模块具体用于:
利用第一公式,计算所述第二参考词所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度;其中,所述第一公式为:
Figure BDA0002319244480000301
其中,ft为所述第二参考词t所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度,|DIC|为所述目标情感词典所包括的词的数量,C(t,uk)为所述第二参考词t与所述目标情感词典中的词uk的向量距离。
可选的,一种具体实现方式中,所述装置还包括:
用户关注度获取模块,用于获取用户对所述对象的情感偏好程度,作为用户的关注度;
第二弹幕屏蔽模块,用于基于所述用户的关注度,确定对候选弹幕中需要屏蔽的候选弹幕的屏蔽比例,并按照所确定的屏蔽比例,屏蔽候选弹幕;其中,所述候选弹幕为所述匹配结果为匹配的待显示弹幕。
可选的,一种具体实现方式中,所述用户关注度获取模块包括:
行为数据获取子模块,用于获取与所述对象相关的各类用户行为的行为数据;
目标数值获取子模块,用于针对每一类用户行为,确定该类用户行为的行为数据所属的目标阈值区间,并将预设的所述目标阈值区间对应的分值作为该类用户行为的目标分值;其中,所述目标阈值区域为:预设的该类用户行为的多个预设阈值区间中的一个;
情感偏好程度获取子模块,用于基于每类用户行为的行为数据和目标分值,确定用户对所述对象的情感偏好程度。
可选的,一种具体实现方式中,所述情感偏好程度获取子模块具体用于:
利用第二公式,确定用户对所述对象的情感偏好程度,其中,所述第二公式为:
Figure BDA0002319244480000311
其中,score为:用户对所述对象的情感偏好程度,VK为:第K类用户行为的目标分值,WK为:第K类用户行为的权重,mK为:第K类用户行为的行为数据,N为各类用户行为的类别总数,N≥1。
本发明实施例还提供了一种电子设备,该电子设备安装有客户端,如图9所示,包括处理器901、通信接口902、存储器903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信,
存储器903,用于存放计算机程序;
处理器901,用于执行存储器903上所存放的程序时,实现上述本发明实施例提供的一种弹幕屏蔽方法。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的弹幕屏蔽方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的弹幕屏蔽方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例、电子设备实施例、计算机可读存储介质实施例、包含指令的计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (16)

1.一种弹幕屏蔽方法,其特征在于,应用于客户端,所述方法包括:
获取弹幕屏蔽时所利用的关键词;
确定所述关键词所表征的对象,并获取用户对所述对象的情感偏好,作为用户的情感偏好;
确定包含所述关键词的待显示弹幕,并识别所述对象在所述待显示弹幕中所表征的情感偏好,作为待显示弹幕的情感偏好;
确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果,如果该匹配结果为不匹配,则屏蔽所述待显示弹幕。
2.根据权利要求1所述的方法,其特征在于,所述获取用户对于所述对象的情感偏好,作为用户的情感偏好的步骤,包括:
从用户发布的多条评论内容中,提取表征情感偏好的词,作为第一参考词;
针对预设的多个词典中的每个词典,统计属于该词典的第一参考词的数量;其中,所述每个词典对应一种情感偏好,且每一所述词典对应的情感偏好与该词典中包括的词所表征的情感偏好相匹配;
确定包含所述第一参考词的数量最多的词典为目标情感词典,并将所述目标情感词典对应的情感偏好,确定为用户的情感偏好。
3.根据权利要求2所述的方法,其特征在于,所述识别所述对象在所述待显示弹幕中所表征的情感偏好,作为待显示弹幕的情感偏好的步骤,包括:
从所述待显示弹幕中,提取表征情感偏好的词,作为第二参考词;
将所述第二参考词所表征的情感偏好,确定为待显示弹幕的情感偏好;
所述确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果的步骤,包括:
判断所述目标情感词典中是否包括所述第二参考词,并基于判断结果,确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果;或,
基于所述第二参考词与所述目标情感词典中各个词的向量距离,计算所述第二参考词所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度,基于所计算的相似度是否满足预设匹配阈值,确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第二参考词与所述目标情感词典中各个词的向量距离,计算所述第二参考词所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度的步骤,包括:
利用第一公式,计算所述第二参考词所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度;其中,所述第一公式为:
Figure FDA0002319244470000021
其中,ft为所述第二参考词t所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度,|DIC|为所述目标情感词典所包括的词的数量,C(t,uk)为所述第二参考词t与所述目标情感词典中的词uk的向量距离。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用户对所述对象的情感偏好程度,作为用户的关注度;
基于所述用户的关注度,确定对候选弹幕中需要屏蔽的候选弹幕的屏蔽比例,并按照所确定的屏蔽比例,屏蔽候选弹幕;其中,所述候选弹幕为所述匹配结果为匹配的待显示弹幕。
6.根据权利要求5所述的方法,其特征在于,所述获取用户对所述对象的情感偏好程度的步骤,包括:
获取与所述对象相关的各类用户行为的行为数据;
针对每一类用户行为,确定该类用户行为的行为数据所属的目标阈值区间,并将预设的所述目标阈值区间对应的分值作为该类用户行为的目标分值;其中,所述目标阈值区域为:预设的该类用户行为的多个预设阈值区间中的一个;
基于每类用户行为的行为数据和目标分值,确定用户对所述对象的情感偏好程度。
7.根据权利要求6所述的方法,其特征在于,所述基于每类用户行为的行为数据和目标分值,确定用户对所述对象的情感偏好程度的步骤,包括:
利用第二公式,确定用户对所述对象的情感偏好程度,其中,所述第二公式为:
Figure FDA0002319244470000031
其中,score为:用户对所述对象的情感偏好程度,VK为:第K类用户行为的目标分值,WK为:第K类用户行为的权重,mK为:第K类用户行为的行为数据,N为各类用户行为的类别总数,N≥1。
8.一种弹幕屏蔽装置,其特征在于,应用于客户端,所述装置包括:
关键词获取模块,用于获取弹幕屏蔽时所利用的关键词;
用户情感偏好获取模块,用于确定所述关键词所表征的对象,并获取用户对所述对象的情感偏好,作为用户的情感偏好;
弹幕情感偏好获取模块,用于确定包含所述关键词的待显示弹幕,并识别所述对象在所述待显示弹幕中所表征的情感偏好,作为待显示弹幕的情感偏好;
第一弹幕屏蔽模块,用于确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果,如果该匹配结果为不匹配,则屏蔽所述待显示弹幕。
9.根据权利要求8所述的装置,其特征在于,所述用户情感偏好获取模块包括:
第一参考词提取子模块,用于从用户发布的多条评论内容中,提取表征情感偏好的词,作为第一参考词;
数量统计子模块,用于针对预设的多个词典中的每个词典,统计属于该词典的第一参考词的数量;其中,所述每个词典对应一种情感偏好,且每一所述词典对应的情感偏好与该词典中包括的词所表征的情感偏好相匹配;
用户情感偏好获取子模块,用于确定包含所述第一参考词的数量最多的词典为目标情感词典,并将所述目标情感词典对应的情感偏好,确定为用户的情感偏好。
10.根据权利要求9所述的装置,其特征在于,所述弹幕情感偏好获取模块包括:
第二参考词提取子模块,用于从所述待显示弹幕中,提取表征情感偏好的词,作为第二参考词;
弹幕情感偏好获取子模块,用于将所述第二参考词所表征的情感偏好,确定为待显示弹幕的情感偏好;
所述第一弹幕屏蔽模块包括:
第一弹幕屏蔽子模块,用于判断所述目标情感词典中是否包括所述第二参考词,并基于判断结果,确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果;或,
第二弹幕屏蔽子模块,用于基于所述第二参考词与所述目标情感词典中各个词的向量距离,计算所述第二参考词所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度,基于所计算的相似度是否满足预设匹配阈值,确定所述待显示弹幕的情感偏好与所述用户的情感偏好的匹配结果。
11.根据权利要求10所述的装置,其特征在于,所述第二弹幕屏蔽子模块具体用于:
利用第一公式,计算所述第二参考词所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度;其中,所述第一公式为:
Figure FDA0002319244470000041
其中,ft为所述第二参考词t所表征的情感偏好与所述目标情感词典对应的情感偏好的相似度,|DIC|为所述目标情感词典所包括的词的数量,C(t,uk)为所述第二参考词t与所述目标情感词典中的词uk的向量距离。
12.根据权利要求8所述的装置,其特征在于,所述装置还包括:
用户关注度获取模块,用于获取用户对所述对象的情感偏好程度,作为用户的关注度;
第二弹幕屏蔽模块,用于基于所述用户的关注度,确定对候选弹幕中需要屏蔽的候选弹幕的屏蔽比例,并按照所确定的屏蔽比例,屏蔽候选弹幕;其中,所述候选弹幕为所述匹配结果为匹配的待显示弹幕。
13.根据权利要求12所述的装置,其特征在于,所述用户关注度获取模块包括:
行为数据获取子模块,用于获取与所述对象相关的各类用户行为的行为数据;
目标数值获取子模块,用于针对每一类用户行为,确定该类用户行为的行为数据所属的目标阈值区间,并将预设的所述目标阈值区间对应的分值作为该类用户行为的目标分值;其中,所述目标阈值区域为:预设的该类用户行为的多个预设阈值区间中的一个;
情感偏好程度获取子模块,用于基于每类用户行为的行为数据和目标分值,确定用户对所述对象的情感偏好程度。
14.根据权利要求13所述的装置,其特征在于,所述情感偏好程度获取子模块具体用于:
利用第二公式,确定用户对所述对象的情感偏好程度,其中,所述第二公式为:
Figure FDA0002319244470000051
其中,score为:用户对所述对象的情感偏好程度,VK为:第K类用户行为的目标分值,WK为:第K类用户行为的权重,mK为:第K类用户行为的行为数据,N为各类用户行为的类别总数,N≥1。
15.一种电子设备,所述电子设备安装有客户端,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法步骤。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。
CN201911291466.0A 2019-12-16 2019-12-16 一种弹幕屏蔽方法、装置及电子设备 Active CN111107416B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911291466.0A CN111107416B (zh) 2019-12-16 2019-12-16 一种弹幕屏蔽方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911291466.0A CN111107416B (zh) 2019-12-16 2019-12-16 一种弹幕屏蔽方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111107416A true CN111107416A (zh) 2020-05-05
CN111107416B CN111107416B (zh) 2023-03-28

Family

ID=70423353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911291466.0A Active CN111107416B (zh) 2019-12-16 2019-12-16 一种弹幕屏蔽方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111107416B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112235629A (zh) * 2020-10-15 2021-01-15 广州博冠信息科技有限公司 一种弹幕屏蔽方法、装置、计算机设备和存储介质
CN112256369A (zh) * 2020-10-20 2021-01-22 北京达佳互联信息技术有限公司 一种内容显示方法、装置、系统及存储介质
CN113360053A (zh) * 2021-05-28 2021-09-07 富途网络科技(深圳)有限公司 显示的控制方法、电子设备以及存储介质
CN113487458A (zh) * 2021-07-05 2021-10-08 杭州卓健信息科技股份有限公司 一种基于互联网的医链教学管理系统
CN115379266A (zh) * 2021-05-20 2022-11-22 上海哔哩哔哩科技有限公司 弹幕展示方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180060338A1 (en) * 2016-08-29 2018-03-01 International Business Machines Corporation Sentiment analysis
CN107948708A (zh) * 2017-11-14 2018-04-20 优酷网络技术(北京)有限公司 弹幕展示方法及装置
CN108513175A (zh) * 2018-03-29 2018-09-07 网宿科技股份有限公司 一种弹幕信息的处理方法及系统
CN110263154A (zh) * 2019-05-17 2019-09-20 广州艾媒数聚信息咨询股份有限公司 一种网络舆情情感态势量化方法、系统及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180060338A1 (en) * 2016-08-29 2018-03-01 International Business Machines Corporation Sentiment analysis
CN107948708A (zh) * 2017-11-14 2018-04-20 优酷网络技术(北京)有限公司 弹幕展示方法及装置
CN108513175A (zh) * 2018-03-29 2018-09-07 网宿科技股份有限公司 一种弹幕信息的处理方法及系统
CN110263154A (zh) * 2019-05-17 2019-09-20 广州艾媒数聚信息咨询股份有限公司 一种网络舆情情感态势量化方法、系统及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112235629A (zh) * 2020-10-15 2021-01-15 广州博冠信息科技有限公司 一种弹幕屏蔽方法、装置、计算机设备和存储介质
CN112256369A (zh) * 2020-10-20 2021-01-22 北京达佳互联信息技术有限公司 一种内容显示方法、装置、系统及存储介质
CN115379266A (zh) * 2021-05-20 2022-11-22 上海哔哩哔哩科技有限公司 弹幕展示方法及装置
CN113360053A (zh) * 2021-05-28 2021-09-07 富途网络科技(深圳)有限公司 显示的控制方法、电子设备以及存储介质
CN113487458A (zh) * 2021-07-05 2021-10-08 杭州卓健信息科技股份有限公司 一种基于互联网的医链教学管理系统

Also Published As

Publication number Publication date
CN111107416B (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
CN111107416B (zh) 一种弹幕屏蔽方法、装置及电子设备
CN106331778B (zh) 视频推荐方法和装置
CN111708901B (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN106326391B (zh) 多媒体资源推荐方法及装置
KR101944469B1 (ko) 컴퓨터 실행 방법, 시스템 및 컴퓨터 판독 가능 매체
CN110475155B (zh) 直播视频热度状态识别方法、装置、设备及可读介质
CA3153598A1 (en) Method of and device for predicting video playback integrity
CN109688479B (zh) 一种弹幕显示方法、弹幕显示装置和弹幕显示服务器
US10248645B2 (en) Measuring phrase association on online social networks
US10762122B2 (en) Method and device for assessing quality of multimedia resource
CN112507163B (zh) 时长预测模型训练方法、推荐方法、装置、设备及介质
CN102884524A (zh) 针对显示的电视内容的自动图像发现和推荐
CN110602564A (zh) 视频优化信息提供方法、装置、电子设备及可读介质
CN112328906A (zh) 内容项推荐方法、装置、设备及存储介质
CN110674345A (zh) 一种视频搜索方法、装置及服务器
CN113672793A (zh) 一种信息召回方法、装置、电子设备及存储介质
CN110430448B (zh) 一种弹幕处理方法、装置及电子设备
CN105956061B (zh) 一种用户间相似度确定方法及装置
CN107944026A (zh) 一种图集个性化推荐的方法、装置、服务器和存储介质
CN110569447B (zh) 一种网络资源的推荐方法、装置及存储介质
CN108882024B (zh) 一种视频播放方法、装置及电子设备
CN112055258B (zh) 加载直播画面的时延测试方法、装置、电子设备及存储介质
CN109327736B (zh) 一种基于节目观看表情与用户信息的节目推荐方法
CN115983499A (zh) 一种票房预测方法、装置、电子设备及存储介质
CN111327609B (zh) 数据审核方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant