CN111683274A - 弹幕广告展示方法、装置、设备及计算机可读存储介质 - Google Patents

弹幕广告展示方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111683274A
CN111683274A CN202010584363.XA CN202010584363A CN111683274A CN 111683274 A CN111683274 A CN 111683274A CN 202010584363 A CN202010584363 A CN 202010584363A CN 111683274 A CN111683274 A CN 111683274A
Authority
CN
China
Prior art keywords
bullet screen
advertisement
barrage
time period
playing time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010584363.XA
Other languages
English (en)
Other versions
CN111683274B (zh
Inventor
余自强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010584363.XA priority Critical patent/CN111683274B/zh
Publication of CN111683274A publication Critical patent/CN111683274A/zh
Application granted granted Critical
Publication of CN111683274B publication Critical patent/CN111683274B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2668Creating a channel for a dedicated end-user group, e.g. insertion of targeted commercials based on end-user profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data

Abstract

本申请涉及视频技术领域,提供了一种弹幕广告展示方法、装置、设备及计算机可读存储介质,该方法包括:确定在视频播放时预设播放时间段内的弹幕对应的词向量;确定候选弹幕广告对应的词向量;计算候选弹幕广告对应的词向量与预设播放时间段内的弹幕对应的词向量之间的第一相似度;在候选弹幕广告中确定第一相似度大于第一预设阈值的目标弹幕广告;在预设播放时间段内插入目标弹幕广告,以使客户端在播放视频并展示预设播放时间段的弹幕时,展示目标弹幕广告。本申请的实施使得弹幕广告与视频播放内容充分融合,在让用户对广告无感的同时,增加了广告植入的趣味性。

Description

弹幕广告展示方法、装置、设备及计算机可读存储介质
技术领域
本申请涉及视频技术领域,具体而言,本申请涉及一种弹幕广告展示方法、装置、设备及计算机可读存储介质。
背景技术
弹幕广告是指一种在视频播放时广告内容以弹幕的方式进行展示的广告表现形式,其作为一种新兴的广告表现形式已经在一些视频网站中使用。
然而,目前以弹幕广告的形式植入广告时,一般采用随机设定的方式确定植入的时间点与广告内容,导致在视频播放时展示弹幕广告显得非常突兀,且容易引起用户反感,降低了植入弹幕广告传播广告内容的转化率。
发明内容
本申请提供了一种弹幕广告展示方法、装置、设备及计算机可读存储介质,可以解决上述至少一种技术问题。所述技术方案如下:
第一方面,提供了一种弹幕广告展示方法,包括:确定在视频播放时预设播放时间段内的弹幕对应的词向量;确定候选弹幕广告对应的词向量;计算所述候选弹幕广告对应的词向量与所述预设播放时间段内的弹幕对应的词向量之间的第一相似度;在所述候选弹幕广告中确定所述第一相似度大于第一预设阈值的目标弹幕广告;在所述预设播放时间段内插入所述目标弹幕广告,以使客户端在播放所述视频并展示所述预设播放时间段的弹幕时,展示所述目标弹幕广告。
结合第一方面,本申请在第一方面的第一种实施方式中,所述确定在视频播放时预设播放时间段内的弹幕对应的词向量,包括:提取在视频播放时预设播放时间段内的弹幕;对所述预设播放时间段内的弹幕进行分词,获得若干关键词;基于所述关键词进行词频统计;将词频大于第二预设阈值且词频最大的关键词作为所述预设播放时间段内的弹幕的主题词;确定所述主题词的词向量,并将所述主题词的词向量作为所述预设播放时间段内的弹幕对应的词向量。
结合第一方面的第一种实施方式,本申请在第一方面的第二种实施方式中,所述基于所述关键词进行词频统计,包括:分别计算各个关键词的词向量;基于各个关键词的词向量,确定每两个关键词之间的第二相似度;将所述第二相似度大于第三预设阈值的两个关键词进行合并;统计各个合并后的关键词的词频。
结合第一方面的第一种实施方式,本申请在第一方面的第三种实施方式中,所述确定所述主题词的词向量,并将所述主题词的词向量作为所述预设播放时间段内的弹幕对应的词向量,包括:基于所述主题词提取第一预设维数的词向量作为所述预设播放时间段内的弹幕对应的词向量;所述确定候选弹幕广告对应的词向量,包括:针对每个候选弹幕广告,获取候选弹幕广告的关键词;基于候选弹幕广告的关键词提取第二预设维数的词向量作为候选弹幕广告对应的词向量;其中,所述预设播放时间段内的弹幕对应的词向量与所述候选弹幕广告对应的词向量为低维实数向量。
结合第一方面,本申请在第一方面的第四种实施方式中,所述在所述预设播放时间段内插入所述目标弹幕广告,以使客户端在播放所述视频并展示所述预设播放时间段的弹幕时,展示所述目标弹幕广告,包括:计算所述预设播放时间段内的弹幕在视频历史播放过程中出现的第一平均时间点;在所述第一平均时间点插入所述目标弹幕广告,以使客户端下一次播放所述视频并展示所述预设播放时间段内的弹幕时,在所述第一平均时间点展示所述目标弹幕广告。
结合本申请第一方面的第一种实施方式,本申请在第一方面的第五种实施方式中,所述在所述预设播放时间段内插入所述目标弹幕广告,以使客户端在播放所述视频并展示所述预设播放时间段的弹幕时,展示所述目标弹幕广告,包括:在所述预设播放时间段内的弹幕中提取与所述主题词相关的目标弹幕;计算所述目标弹幕在视频历史播放过程中出现的第二平均时间点;在所述第二平均时间点插入所述目标弹幕广告,以使客户端下一次播放所述视频并展示所述预设播放时间段内的弹幕时,在所述第二平均时间点展示所述目标弹幕广告。
结合本申请第一方面的第五种实施方式,本申请在第一方面的第六种实施方式中,所述在所述第二平均时间点插入所述目标弹幕广告之前,包括:计算所述目标弹幕在所述视频历史播放过程中的平均展示速度;在所述第二平均时间点插入所述目标弹幕广告,以使客户端下一次播放所述视频并展示所述预设播放时间段内的弹幕时,在所述第二平均时间点展示所述目标弹幕广告,包括:在所述第二平均时间点插入所述目标弹幕广告,以使客户端下一次播放所述视频并展示所述预设播放时间段内的弹幕时,在所述第二平均时间点以所述平均展示速度展示所述目标弹幕广告。
第二方面,提供了一种弹幕广告展示装置,包括:第一确定模块,用于确定在视频播放时预设播放时间段内的弹幕对应的词向量;第二确定模块,用于确定候选弹幕广告对应的词向量;计算模块,用于计算所述候选弹幕广告对应的词向量与所述预设播放时间段内的弹幕对应的词向量之间的第一相似度;第三确定模块,用于在所述候选弹幕广告中确定所述第一相似度大于第一预设阈值的目标弹幕广告;插入模块,用于在所述预设播放时间段内插入所述目标弹幕广告,以使客户端在播放所述视频并展示所述预设播放时间段的弹幕时,展示所述目标弹幕广告。
结合第二方面,本申请在第二方面的第一种实施方式中,所述第一确定模块包括:第一提取单元,提取在视频播放时预设播放时间段内的弹幕;分词单元,对所述预设播放时间段内的弹幕进行分词,获得若干关键词;统计单元,基于所述关键词进行词频统计;确定主题词单元,用于将词频大于第二预设阈值且词频最大的关键词作为所述预设播放时间段内的弹幕的主题词;确定词向量单元,用于确定所述主题词的词向量,并将所述主题词的词向量作为所述预设播放时间段内的弹幕对应的词向量。
结合第二方面的第一种实施方式,本申请在第二方面的第二种实施方式中,所述统计单元,包括:计算子单元,用于分别计算各个关键词的词向量;确定子单元,用于基于各个关键词的词向量,确定每两个关键词之间的第二相似度;合并子单元,用于将所述第二相似度大于第三预设阈值的两个关键词进行合并;统计子单元,用于统计各个合并后的关键词的词频。
结合第二方面的第一种实施方式,本申请在第二方面的第三种实施方式中,所述确定词向量单元,包括:第一提取子单元,用于基于所述主题词提取第一预设维数的词向量作为所述预设播放时间段内的弹幕对应的词向量;所述第二确定模块,包括:获取单元,用于针对每个候选弹幕广告,获取候选弹幕广告的关键词;第二提取单元,用于基于候选弹幕广告的关键词提取第二预设维数的词向量作为候选弹幕广告对应的词向量;其中,所述预设播放时间段内的弹幕对应的词向量与所述候选弹幕广告对应的词向量为低维实数向量。
结合第二方面,本申请在第二方面的第四种实施方式中,所述插入模块,包括:第一计算单元,用于计算所述预设播放时间段内的弹幕在视频历史播放过程中出现的第一平均时间点;第一插入单元,用于在所述第一平均时间点插入所述目标弹幕广告,以使客户端下一次播放所述视频并展示所述预设播放时间段内的弹幕时,在所述第一平均时间点展示所述目标弹幕广告。
结合本申请第二方面的第一种实施方式,本申请在第二方面的第五种实施方式中,所述插入模块,包括:第三提取单元,用于在所述预设播放时间段内的弹幕中提取与所述主题词相关的目标弹幕;第二计算单元,用于计算所述目标弹幕在视频历史播放过程中出现的第二平均时间点;第二插入单元,用于在所述第二平均时间点插入所述目标弹幕广告,以使客户端下一次播放所述视频并展示所述预设播放时间段内的弹幕时,在所述第二平均时间点展示所述目标弹幕广告。
结合本申请第二方面的第五种实施方式,本申请在第二方面的第六种实施方式中,所述插入模块,包括:第三计算单元,用于计算所述目标弹幕在所述视频历史播放过程中的平均展示速度;第二插入单元,包括:插入子单元,用于在所述第二平均时间点插入所述目标弹幕广告,以使客户端下一次播放所述视频并展示所述预设播放时间段内的弹幕时,在所述第二平均时间点以所述平均展示速度展示所述目标弹幕广告。
第三方面,提供了一种电子设备,其包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行第一方面及第一方面任一种实施方式所述的弹幕广告展示方法。
第四方面,提供了一种计算机可读存储介质,所述存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现第一方面及第一方面任一实施方式所述的弹幕广告展示方法。
本申请提供的技术方案带来的有益效果是:
本申请分别确定出在视频播放时预设播放时间段内的弹幕对应的词向量与候选弹幕广告对应的词向量,通过计算候选弹幕广告对应的词向量与预设播放时间段内的弹幕对应的词向量之间的第一相似度,在候选弹幕广告中确定出第一相似度大于第一预设阈值的目标弹幕广告,即确定所植入弹幕广告的广告内容,并在预设播放时间段内插入目标弹幕广告,以使客户端在播放视频并展示预设播放时间段内的弹幕时,展示目标弹幕广告。本申请的实施基于预设播放时间段内的弹幕对应的词向量与候选弹幕广告对应的词向量进行相似度计算,确定目标弹幕广告,并在预设播放时间段内插入目标弹幕广告,即基于视频播放时的弹幕设定植入弹幕广告的时间点与广告内容,使得弹幕广告与视频播放内容充分融合,在让用户对广告无感的同时,增加了广告植入的趣味性,有利于提升通过弹幕广告传播广告内容的转化率。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种弹幕广告展示方法的流程示意图;
图2为本申请实施例提供的一种弹幕广告展示方法的流程示意图;
图3为本申请实施例提供的一种弹幕广告展示方法的流程示意图;
图4为本申请实施例提供的一种弹幕广告展示方法的流程示意图;
图5为本申请实施例提供的一种弹幕广告展示方法的流程示意图;
图6为本申请实施例提供的一种弹幕广告展示方法的流程示意图;
图7为本申请实施例提供的一种弹幕广告展示方法的流程示意图;
图8为本申请实施例提供的客户端显示界面的示意图;
图9为本申请实施例提供的一种弹幕广告展示方法的应用场景示意图;
图10为本申请实施例提供的一种弹幕广告展示装置的结构示意图;
图11为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请的实施使用到人工智能技术,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。本申请实施例主要涉及自然语言处理技术。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
在本申请实施例的弹幕广告展示方法中,该方法具体可以由本申请实施例的电子设备执行,具体地,如图9所示,该电子设备可以是服务器902,也可以是客户端901;服务器902可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。客户端901可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。客户端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。如图1所示,本申请实施例包括以下步骤:
S101确定在视频播放时预设播放时间段内的弹幕对应的词向量。
可选地,每一视频均具有对应的播放时长,预设播放时间段为视频播放时长中的时间段,如视频对应的播放时长为10s,预设播放时间段可以为第3s开始至第7s结束的时间段。弹幕是指在网络上观看视频时弹出的字幕。预设播放时间段内的弹幕包括任一客户端播放视频时,在预设播放时间段接收到的弹幕,其至少包括一条。由于弹幕的表现形式多种多样,可以是表情符号、英文符号、文本信息等,本申请实施例主要针对表现形式为文本信息的弹幕进行叙述,文本信息不限于中文文本,还可以是英文文本等其他外语的文本信息。在确定弹幕对应的词向量时,可采用自然语言处理技术中的word2vec模型,word2vec模型可以根据给定的语料库,通过优化后的训练模型快速有效地将一个词语表达成向量形式。由于弹幕对应的文本信息并未限定字符数量,在确定弹幕对应的词向量之前,还包括对弹幕进行分词,基于分词结果确定弹幕对应的词向量。
可选地,若预设播放时间段仅包括一条弹幕,则以该弹幕对应的词向量作为预设播放时间段内的弹幕对应的词向量;若预设播放时间段包括两条及以上的弹幕,则可对弹幕进行合并、筛选、加权计算等确定预设播放时间段内的弹幕唯一对应的词向量。
可选地,预设播放时间段内的弹幕可以理解为任一客户端在播放视频时用户发出的弹幕。服务器将对所有用户发出的弹幕进行缓存,并在下一次任一客户端播放视频时向客户端下发,使得用户在观看视频时,可通过弹幕进行互动,增加视频播放的趣味性。
可选地,预设播放时间段可以为默认时间段,也可以为随机设定的时间段。在一实施例中,预设播放时间段可根据接收到弹幕的时间、接收到弹幕的数量、视频内容中各帧对应的时间节点确定。如:视频播放的时间中第3秒至第10秒接收到的弹幕数量超过预设数量,则将该时间段设置为预设播放时间段。
S102确定候选弹幕广告对应的词向量。
可选地,弹幕广告在本申请实施例中指代以弹幕形式表达的广告,其可以由品牌logo、文字、符号、表情等至少一种信息组合而成,如“XXX前来点赞~”等弹幕广告,穿插在用户发出的弹幕之间进行显示。候选弹幕广告为待植入广告,一般由广告商提供植入内容,视频播放平台适应性调整成弹幕广告后,待相应的时间点进行植入。候选弹幕广告对应的词向量的计算方法可参考步骤S101中预设播放时间段内的弹幕对应的词向量的计算方法,采用word2vec模型完成。为提高弹幕广告与视频播放内容和/或弹幕的融合度,弹幕广告一般除包括广告商的信息外,还包括与视频播放内容和/或弹幕相关的文本信息,如视频播放内容中包括小狗打疫苗的内容,则弹幕广告可为“XXX心疼打针的小狗狗”,若弹幕中包括“哈哈哈”的文本内容时,则弹幕广告可为“想开心,上XXX”;在确定弹幕广告对应的词向量时,以与视频播放内容和/或弹幕相关的文本信息为主要信息确定词向量。
S103计算候选弹幕广告对应的词向量与预设播放时间段内的弹幕对应的词向量之间的第一相似度。
可选地,确定出候选弹幕广告对应的词向量与预设播放时间段内的弹幕对应的词向量时,候选弹幕广告对应的词向量为一条候选弹幕广告对应一个词向量,预设播放时间段内的弹幕对应的词向量为唯一一个词向量,也即候选弹幕广告对应的词向量包括至少一个,预设播放时间段内的弹幕对应的词向量有且仅有一个。在基于两者的词向量计算第一相似度时,可采用余弦相似度(通过计算两个词向量的夹角余弦值来评估候选弹幕广告与预设播放时间段内的弹幕的相似度)或欧式距离等计算方法进行,通过第一相似度值衡量候选弹幕广告与预设播放时间段内的弹幕的相似程度。
S104在候选弹幕广告中确定第一相似度大于第一预设阈值的目标弹幕广告。
可选地,每一候选弹幕广告均有与预设播放时间段内的弹幕相应的第一相似度,为提高植入的弹幕广告与视频播放内容和/或弹幕的融合度,在候选弹幕广告中选择第一相似度大于第一预设阈值的目标弹幕广告。第一预设阈值可以为默认值,也可以为随候选弹幕广告的数量、预设播放时间段内的弹幕数量、候选弹幕广告的内容、预设播放时间段内的弹幕的内容等信息进行设定的阈值。
S105在预设播放时间段内插入目标弹幕广告,以使客户端在播放视频并展示预设播放时间段的弹幕时,展示目标弹幕广告。
可选地,在预设播放时间段内插入目标弹幕广告,如将目标弹幕广告插入预设播放时间段内的弹幕数据中进行缓存,当任一客户端在播放视频并播放至预设播放时间段时,开启了弹幕功能,将接收到服务器下发的缓存数据,并在播放视频的同一显示界面展示该时间段内缓存的弹幕以及目标弹幕广告。
本申请实施例分别确定出在视频播放时预设播放时间段内的弹幕对应的词向量与候选弹幕广告对应的词向量,通过计算候选弹幕广告对应的词向量与预设播放时间段内的弹幕对应的词向量之间的第一相似度,在候选弹幕广告中确定出第一相似度大于第一预设阈值的目标弹幕广告,即确定所植入弹幕广告的广告内容,并在预设播放时间段内插入目标弹幕广告,以使客户端在播放视频并展示预设播放时间段内的弹幕时,展示目标弹幕广告。本申请的实施基于预设播放时间段内的弹幕对应的词向量与候选弹幕广告对应的词向量进行相似度计算,确定目标弹幕广告,并在预设播放时间段内插入目标弹幕广告,即基于视频播放时的弹幕设定植入弹幕广告的时间点与广告内容,使得弹幕广告与视频播放内容充分融合,在让用户对广告无感的同时,增加了广告的趣味性,有利于提升通过弹幕广告传播广告内容的转化率。
在一实施例中,如图2所示,步骤S101确定在视频播放时预设播放时间段内的弹幕对应的词向量,包括:
S201提取在视频播放时预设播放时间段内的弹幕。
可选地,预设播放时间段可以为视频播放中的任一时间段,也可以为视频整体的播放时间段,其可根据视频内容和/或弹幕内容进行调整;如视频刚开始播放时弹幕数量较少,可适当延长预设播放时间段对应的时长;如视频播放至高能内容阶段时弹幕数量较多,可适当减少预设播放时间段对应的时长。
S202对预设播放时间段内的弹幕进行分词,获得若干关键词。
可选地,对弹幕进行分词包括语义层面的分词,可采用分词工具(如,结巴分词)和模型,通过加载语料库训练分词工具进行分词,分词后各弹幕获得对应的若干关键词。其中,分词是指将连续的字序列按照一定的规范重新组合成词序列的过程。
可选地,考虑到弹幕中可能包含的停用词无法体现与弹幕内容相关的信息,因此在对预设播放时间段内的弹幕进行分词时,还包括去除停用词等与弹幕内容无关的信息。一般而言,弹幕包含的停用词包括:标点符号、连词、助词、副词、介词、数词、方位词、代词等。
举例说明,如预设播放时间段内包括弹幕“大晚上,邻居敲我门,说我笑大声了”,对该弹幕进行分词,可得到“大、晚上、邻居、敲、门、笑、大声”的几个关键词,其中,弹幕的文本信息中包含的标点符号和代词不计入关键词。
S203基于关键词进行词频统计。
可选地,在步骤S202中获得预设播放时间段内所有弹幕的关键词后,对关键词进行词频统计。如所有弹幕对应的关键词包括:哈哈、笑、哈哈、画面、笑、画面、哈哈时,可统计得出如下表1所示的结果:
表1
关键词 词频(出现次数)
哈哈 3
2
画面 2
可选地,进行词频统计后,还包括基于词频对关键词进行降序排序。
S204将词频大于第二预设阈值且词频最大的关键词作为预设播放时间段内的弹幕的主题词。
可选地,第二预设阈值可为默认值,也可根据关键词和/或词频进行调整。若词频大于第二预设阈值且词频最大的关键词包括两个及以上时,可将该关键词同时作为主题词,也可基于预设加权系数确定唯一的关键词作为主题词。预设加权系数可基于候选弹幕广告确定,如当前候选弹幕广告的关键词重点涉及“开心”、“生活”类的,则可设定与开心相关的预设加权系数为0.5、与生活相关的预设加权系数为0.3,其余任一关键词的预设加权系数为0.2。若弹幕对应的关键词“哈哈”与“运动”的词频大于第二预设阈值且词频均为最大时,基于预设加权系数,可确定“哈哈”作为预设播放时间段内的弹幕的主题词。
可选地,当第二预设阈值为默认值时,若当前无任一关键词的词频大于第二预设阈值时,可选取词频最大的关键词作为预设播放时间段内的弹幕的主题词。
S205确定主题词的词向量,并将主题词的词向量作为预设播放时间段内的弹幕对应的词向量。
可选地,采用word2vec词向量模型确定主题词的词向量。
可选地,步骤S204与步骤S205还可替换为:将词频大于第二预设阈值的至少一个关键词作为预设播放时间段内的弹幕的主题词;若主题词包括两个及以上时,将主题词的词频对各主题词的词向量进行加权计算所得的结果作为预设播放时间段内弹幕对应的词向量。
在一实施例中,考虑到关键词存在内容不同但语义表达相似的情况,如关键词“哈哈”和关键词“笑”,为减少本申请实施例的计算量,以及提高词频统计的精度,采用基于关键词的词向量计算关键词之间的相似度,以根据相似度进行关键词合并,而后根据合并的结果进行词频统计。如图3所示,步骤S203基于关键词进行词频统计,包括:
S301分别计算各个关键词的词向量。
可选地,在步骤S202获得各个弹幕分别对应的关键词后,分别计算各个关键词的词向量,词向量的计算可采用word2vec词向量模型进行。
S302基于各个关键词的词向量,确定每两个关键词之间的第二相似度。
可选地,与步骤S103的计算逻辑相似,基于词向量进行相似度计算;具体地,在步骤S302中,进行第二相似度计算的对象为预设播放时间段内的弹幕对应的关键词的词向量。在进行第二相似度计算时,以每两个关键词作为一组进行计算,确定出每一关键词与其他所有关键词之间的第二相似度。
S303将第二相似度大于第三预设阈值的两个关键词进行合并。
可选地,合并可理解为将第二相似度大于第三预设阈值的两个关键词归为一类。假设第三预设阈值为0.6,关键词“哈哈”和“笑”的第二相似度为0.64927846,关键词“哈哈”和“画面”的第二相似度为0.3952525;则将关键词“哈哈”和“笑”归为一类(如将“笑”并入“哈哈”中进行计算)。
S304统计各个合并后的关键词的词频。
可选地,统计各个合并后的关键词的词频可理解为将步骤S303中归为一类的各个关键词出现的次数进行求和统计,如当前被归为一类的关键词“哈哈”出现了3次,“笑”出现了2次,则在将关键词“笑”并入“哈哈”中进行计算时,“哈哈”对应的词频为5次。
在一实施例中,如图4所示,步骤S205确定主题词的词向量,并将主题词的词向量作为预设播放时间段内的弹幕对应的词向量,包括:
S401基于主题词提取第一预设维数的词向量作为预设播放时间段内的弹幕对应的词向量。
步骤S102确定候选弹幕广告对应的词向量,包括:
S402针对每个候选弹幕广告,获取候选弹幕广告的关键词;基于候选弹幕广告的关键词提取第二预设维数的词向量作为候选弹幕广告对应的词向量。
其中,预设播放时间段内的弹幕对应的词向量与候选弹幕广告对应的词向量为低维实数向量。
可选地,词向量的表示方式有多种,在本申请实施例中采用一种低维实数向量的词向量表示方式,这种向量一般表达为:[0.792,-0.177,-0.107,0.109,-0.542,...]。采用该种表示方式有利于提高词向量之间相似度计算的精度。针对该种表达方式,第一相似度的计算方式可采用余弦相似度,也可采用欧式距离。
举例说明,第一预设维数与第二预设维数设为80维,当前预设播放时间段内的弹幕的主题词为“哈哈”,则针对“哈哈”提取80维的词向量表示,并将多余部分采用省略号代替,可得到如下词向量:
[0.092419,-0.268407,0.073376,-0.020113,0.318722,-0.043832,0.238052,-0.074542,0.289017,-0.019183,0.134522,0.116291,0.263056,-0.174036,0.127931,-0.058611,-0.488859,-0.245675,-0.103045,-0.0683880.188045,…]。
候选弹幕广告A对应的关键词“有趣”、候选弹幕广告B对应的关键词“开心”、候选弹幕广告C对应的关键词“分享”,针对每一候选弹幕广告分别提取各自的词向量,如针对候选弹幕广告B对应的关键词“开心”提取80维的词向量表示,并将多余部分采用省略号代替,可得到如下的词向量:
[0.019956,-0.161722,0.069651,-0.163736,0.385568,0.170535,0.154082,0.096521,0.304699,0.115487,-0.060921,0.314628,-0.01216,-0.104594,0.211927,-0.274983,-0.216041,-0.310086,0.205416,-0.161124,0.297326,…]。
可选地,确定出预设播放时间段的弹幕对应的词向量与候选弹幕广告的词向量后,可采用余弦相似度分别计算候选弹幕广告与预设播放时间段内的弹幕的相似度,例如对上述例子中主题词“哈哈”与候选弹幕广告B的关键词“开心”计算余弦相似度可得到第一相似度为0.6152418(相似度范围为0-1);假设第一预设阈值为0.6,则候选弹幕广告B为目标弹幕广告。
可选地,每个候选弹幕广告可对应至少一个关键词,在计算候选弹幕广告与预设播放时间段内的弹幕的相似度时,将每个候选弹幕广告对应的每一个关键词的词向量均与预设播放时间段内的弹幕对应的词向量进行第一相似度计算,此时,一个候选弹幕广告将与预设播放时间段内的弹幕具有相应的多个相似度值,可随机选择任一个相似度值作为第一相似度计算的结果,也可将最大的相似度值作为第一相似度计算的结果。
在一实施例中,如图5所示,步骤S105在预设播放时间段内插入目标弹幕广告,以使客户端在播放视频并展示预设播放时间段的弹幕时,展示目标弹幕广告,包括:
S501计算预设播放时间段内的弹幕在视频历史播放过程中出现的第一平均时间点。
可选地,每一弹幕在视频历史播放过程中相对于预设播放时间段均有对应的出现时间,如弹幕A对应的出现时间点为T1,弹幕B对应的出现时间点为T2,第一平均时间点为:(T1+T2)/2。当预设播放时间段内的弹幕数量为N时,第一平均时间点为:(T1+T2+…+TN)/N。
S502在第一平均时间点插入目标弹幕广告,以使客户端下一次播放视频并展示预设播放时间段内的弹幕时,在第一平均时间点展示目标弹幕广告。
可选地,在第一平均时间点插入目标弹幕广告可理解为在预设播放时间段内的弹幕数据中,结合第一平均时间点插入目标弹幕广告,以使目标弹幕广告随已缓存的弹幕一并进行缓存。当客户端下一次播放视频,并在预设播放时间段开启弹幕功能时,展示预设播放时间段内的弹幕,并在第一平均时间点展示目标弹幕广告。
可选地,步骤S104确定的目标弹幕广告包括多个时,可在第一平均时间点插入所有目标弹幕广告,也可以第一平均时间点为基准,在预设播放时间段内依次均匀分布地插入目标弹幕广告。
在一实施例中,为提高目标弹幕广告植入时间的精确度,如图6所示,步骤S105在预设播放时间段内插入目标弹幕广告,以使客户端在播放视频并展示预设播放时间段的弹幕时,展示目标弹幕广告,包括:
S601在预设播放时间段内的弹幕中提取与主题词相关的目标弹幕。
可选地,与主题词相关的目标弹幕包括:包含主题词的弹幕,包含关键词的词向量与主题词的词向量相似度大于第四预设阈值的弹幕。经步骤S601对目标弹幕的筛选,可减少并未参与预设播放时间段内的弹幕对应的词向量计算的弹幕数量,减少对无关弹幕出现时间点的计算量。
S602计算目标弹幕在视频历史播放过程中出现的第二平均时间点。
可选地,每一目标弹幕在视频历史播放过程中相对于预设播放时间段均有对应的出现时间,当目标弹幕的数量为J时,第二平均时间点为(T1+T2+…+TJ)/J,其中,TJ为第J个目标弹幕相对于预设播放时间段的出现时间点。
S603在第二平均时间点插入目标弹幕广告,以使客户端下一次播放视频并展示预设播放时间段内的弹幕时,在第二平均时间点展示目标弹幕广告。
可选地,以第二平均时间点作为目标弹幕广告相对于预设播放时间段的出现时间点,将目标弹幕广告在弹幕功能开启时进行植入。
在一实施例中,如图7所示,步骤S602在第二平均时间点插入目标弹幕广告之前,包括:
S701计算目标弹幕在视频历史播放过程中的平均展示速度。
步骤S603在第二平均时间点插入目标弹幕广告,以使客户端下一次播放视频并展示预设播放时间段内的弹幕时,在第二平均时间点展示目标弹幕广告,包括:
S702在第二平均时间点插入目标弹幕广告,以使客户端下一次播放视频并展示预设播放时间段内的弹幕时,在第二平均时间点以平均展示速度展示目标弹幕广告。
可选地,考虑到弹幕广告的展示速度影响用户对广告内容的读取率与广告投放的转化率,在本申请实施例中,基于目标弹幕的展示速度确定目标弹幕广告的展示速度,具体为将目标弹幕的平均展示速度作为目标弹幕广告的展示速度。
在一应用例中,如图8所示,在预设播放时间段内插入的目标弹幕广告为“logo要开心,上XXX”(XXX为广告品牌或广告词),当任一客户端在播放视频并开启弹幕功能时,进入预设播放时间段将在视频播放的同一显示界面展示步骤S101中预设播放时间段内的弹幕,在相应目标弹幕广告的植入时间点将展示目标弹幕广告。
在一应用例中,如图9所示,通过客户端901与服务器902进行数据交互实现上述弹幕广告展示方法。任一客户端901在播放视频时接收到发出弹幕指令时,将接收到的弹幕发送至服务器902;服务器902将对接收到的弹幕进行存储,并将所存储的弹幕在任一客户端901播放视频并开启弹幕功能时,向该客户端下发;在该过程中,服务器902存储有至少一个候选弹幕广告待植入,在对存储有的弹幕进行分析,获得预设播放时间段内的弹幕对应的词向量后,将基于弹幕对应的词向量与候选弹幕广告的词向量计算第一相似度,进而根据第一相似度判断候选弹幕广告是否符合插入当前存储的预设播放时间段内的弹幕中,若符合(第一相似度大于第一预设阈值),则将候选弹幕广告作为目标弹幕广告,并将目标弹幕广告插入在预设播放时间段内的弹幕中;待任一客户端901播放视频并在预设播放时间段开启有弹幕功能时,服务器902将目标弹幕广告与弹幕一并下发至该客户端901,客户端901播放视频的显示界面上将在视频播放过程中的预设播放时间段内展示弹幕与目标弹幕广告。
在一实施例中,预设播放时间段内的弹幕与候选弹幕广告可采用云存储技术进行存储。云存储(cloud storage)是在云计算概念上延伸和发展出来的一个新的概念,分布式云存储系统(以下简称存储系统)是指通过集群应用、网格技术以及分布存储文件系统等功能,将网络中大量各种不同类型的存储设备(存储设备也称之为存储节点)通过应用软件或应用接口集合起来协同工作,共同对外提供数据存储和业务访问功能的一个存储系统。目前,存储系统的存储方法为:创建逻辑卷,在创建逻辑卷时,就为每个逻辑卷分配物理存储空间,该物理存储空间可能是某个存储设备或者某几个存储设备的磁盘组成。客户端在某一逻辑卷上存储数据,也就是将数据存储在文件系统上,文件系统将数据分成许多部分,每一部分是一个对象,对象不仅包含数据而且还包含数据标识(ID,ID entity)等额外的信息,文件系统将每个对象分别写入该逻辑卷的物理存储空间,且文件系统会记录每个对象的存储位置信息,从而当客户端请求访问数据时,文件系统能够根据每个对象的存储位置信息让客户端对数据进行访问。如当前需要获取在视频播放时预设播放时间段内的弹幕时,文件系统根据弹幕的存储位置信息让客户端对数据进行访问。存储系统为逻辑卷分配物理存储空间的过程,具体为:按照对存储于逻辑卷的对象的容量估量(该估量往往相对于实际要存储的对象的容量有很大余量)和独立冗余磁盘阵列(RAID,Redundant Array ofIndependent Disk)的组别,预先将物理存储空间划分成分条,一个逻辑卷可以理解为一个分条,从而为逻辑卷分配了物理存储空间。
在一实施例,如图10所示,提供了一种弹幕广告展示装置1000,包括:第一确定模块1001、第二确定模块1002、计算模块1003、第三确定模块1004、插入模块1005。其中:
第一确定模块1001,用于确定在视频播放时预设播放时间段内的弹幕对应的词向量。
第二确定模块1002,用于确定候选弹幕广告对应的词向量。
计算模块1003,用于计算候选弹幕广告对应的词向量与预设播放时间段内的弹幕对应的词向量之间的第一相似度。
第三确定模块1004,用于在候选弹幕广告中确定第一相似度大于第一预设阈值的目标弹幕广告。
插入模块1005,用于在预设播放时间段内插入目标弹幕广告,以使客户端在播放视频并展示预设播放时间段的弹幕时,展示目标弹幕广告。
在一实施例中,第一确定模块1001包括:第一提取单元,提取在视频播放时预设播放时间段内的弹幕;分词单元,对预设播放时间段内的弹幕进行分词,获得若干关键词;统计单元,基于关键词进行词频统计;确定主题词单元,用于将词频大于第二预设阈值且词频最大的关键词作为预设播放时间段内的弹幕的主题词;确定词向量单元,用于确定主题词的词向量,并将主题词的词向量作为预设播放时间段内的弹幕对应的词向量。
在一实施例中,统计单元,包括:计算子单元,用于分别计算各个关键词的词向量;确定子单元,用于基于各个关键词的词向量,确定每两个关键词之间的第二相似度;合并子单元,用于将第二相似度大于第三预设阈值的两个关键词进行合并;统计子单元,用于统计各个合并后的关键词的词频。
在一实施例中,确定词向量单元,包括:第一提取子单元,用于基于主题词提取第一预设维数的词向量作为预设播放时间段内的弹幕对应的词向量;第二确定模块,包括:获取单元,用于针对每个候选弹幕广告,获取候选弹幕广告的关键词;第二提取单元,用于基于候选弹幕广告的关键词提取第二预设维数的词向量作为候选弹幕广告对应的词向量;其中,预设播放时间段内的弹幕对应的词向量与候选弹幕广告对应的词向量为低维实数向量。
在一实施例中,插入模块1005,包括:第一计算单元,用于计算预设播放时间段内的弹幕在视频历史播放过程中出现的第一平均时间点;第一插入单元,用于在第一平均时间点插入目标弹幕广告,以使客户端下一次播放视频并展示预设播放时间段内的弹幕时,在第一平均时间点展示目标弹幕广告。
在一实施例中,插入模块1005,包括:第三提取单元,用于在预设播放时间段内的弹幕中提取与主题词相关的目标弹幕;第二计算单元,用于计算目标弹幕在视频历史播放过程中出现的第二平均时间点;第二插入单元,用于在第二平均时间点插入目标弹幕广告,以使客户端下一次播放视频并展示预设播放时间段内的弹幕时,在第二平均时间点展示目标弹幕广告。
在一实施例中,插入模块1005,包括:第三计算单元,用于计算目标弹幕在视频历史播放过程中的平均展示速度;第二插入单元,包括:插入子单元,用于在第二平均时间点插入目标弹幕广告,以使客户端下一次播放视频并展示预设播放时间段内的弹幕时,在第二平均时间点以平均展示速度展示目标弹幕广告。
本申请实施例的弹幕广告展示装置可执行本申请的实施例所提供的一种弹幕广告展示方法,其实现原理相类似,本申请各实施例中的弹幕广告展示装置中的各模块所执行的动作是与本申请各实施例中的弹幕广告展示方法中的步骤相对应的,对于弹幕广告展示装置的各模块的详细功能描述具体可以参见前文中所示的对应的弹幕广告展示方法中的描述,此处不再赘述。
基于与本申请的实施例中所示的方法相同的原理,本申请的实施例中还提供了一种电子设备,该电子设备可以包括但不限于:处理器和存储器;存储器,用于存储计算机操作指令;处理器,用于通过调用计算机操作指令执行实施例所示的弹幕广告展示方法。
在一个可选实施例中提供了一种电子设备,如图11所示,图11所示的电子设备4000包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。可选地,电子设备4000还可以包括收发器4004。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本申请实施例的限定。
处理器4001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。处理器4001通过调用计算机操作指令执行上述实施例所示的弹幕广告展示方法,该弹幕广告展示方法包括:确定在视频播放时预设播放时间段内的弹幕对应的词向量;确定候选弹幕广告对应的词向量;计算候选弹幕广告对应的词向量与预设播放时间段内的弹幕对应的词向量之间的第一相似度;在候选弹幕广告中确定第一相似度大于第一预设阈值的目标弹幕广告;在预设播放时间段内插入目标弹幕广告,以使客户端在播放视频并展示预设播放时间段的弹幕时,展示目标弹幕广告。
总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图11中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器4003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器4003用于存储执行本申请方案的应用程序代码,并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的应用程序代码,以实现前述方法实施例所示的内容。
其中,电子设备包括但不限于:移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图11示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的弹幕广告展示方法。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例所示的方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定,例如,第一确定模块还可以被描述为“用于确定在视频播放时预设播放时间段内的弹幕对应的词向量的模块”。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种弹幕广告展示方法,其特征在于,包括:
确定在视频播放时预设播放时间段内的弹幕对应的词向量;
确定候选弹幕广告对应的词向量;
计算所述候选弹幕广告对应的词向量与所述预设播放时间段内的弹幕对应的词向量之间的第一相似度;
在所述候选弹幕广告中确定所述第一相似度大于第一预设阈值的目标弹幕广告;
在所述预设播放时间段内插入所述目标弹幕广告,以使客户端在播放所述视频并展示所述预设播放时间段的弹幕时,展示所述目标弹幕广告。
2.根据权利要求1所述的方法,其特征在于,所述确定在视频播放时预设播放时间段内的弹幕对应的词向量,包括:
提取在视频播放时预设播放时间段内的弹幕;
对所述预设播放时间段内的弹幕进行分词,获得若干关键词;
基于所述关键词进行词频统计;
将词频大于第二预设阈值且词频最大的关键词作为所述预设播放时间段内的弹幕的主题词;
确定所述主题词的词向量,并将所述主题词的词向量作为所述预设播放时间段内的弹幕对应的词向量。
3.根据权利要求2所述的方法,其特征在于,所述基于所述关键词进行词频统计,包括:
分别计算各个关键词的词向量;
基于各个关键词的词向量,确定每两个关键词之间的第二相似度;
将所述第二相似度大于第三预设阈值的两个关键词进行合并;
统计各个合并后的关键词的词频。
4.根据权利要求2所述的方法,其特征在于,所述确定所述主题词的词向量,并将所述主题词的词向量作为所述预设播放时间段内的弹幕对应的词向量,包括:
基于所述主题词提取第一预设维数的词向量作为所述预设播放时间段内的弹幕对应的词向量;
所述确定候选弹幕广告对应的词向量,包括:
针对每个候选弹幕广告,获取候选弹幕广告的关键词;基于候选弹幕广告的关键词提取第二预设维数的词向量作为候选弹幕广告对应的词向量;
其中,所述预设播放时间段内的弹幕对应的词向量与所述候选弹幕广告对应的词向量为低维实数向量。
5.根据权利要求1所述的方法,其特征在于,所述在所述预设播放时间段内插入所述目标弹幕广告,以使客户端在播放所述视频并展示所述预设播放时间段的弹幕时,展示所述目标弹幕广告,包括:
计算所述预设播放时间段内的弹幕在视频历史播放过程中出现的第一平均时间点;
在所述第一平均时间点插入所述目标弹幕广告,以使客户端下一次播放所述视频并展示所述预设播放时间段内的弹幕时,在所述第一平均时间点展示所述目标弹幕广告。
6.根据权利要求2所述的方法,其特征在于,所述在所述预设播放时间段内插入所述目标弹幕广告,以使客户端在播放所述视频并展示所述预设播放时间段的弹幕时,展示所述目标弹幕广告,包括:
在所述预设播放时间段内的弹幕中提取与所述主题词相关的目标弹幕;
计算所述目标弹幕在视频历史播放过程中出现的第二平均时间点;
在所述第二平均时间点插入所述目标弹幕广告,以使客户端下一次播放所述视频并展示所述预设播放时间段内的弹幕时,在所述第二平均时间点展示所述目标弹幕广告。
7.根据权利要求6所述的方法,其特征在于,所述在所述第二平均时间点插入所述目标弹幕广告之前,还包括:
计算所述目标弹幕在所述视频历史播放过程中的平均展示速度;
在所述第二平均时间点插入所述目标弹幕广告,以使客户端下一次播放所述视频并展示所述预设播放时间段内的弹幕时,在所述第二平均时间点展示所述目标弹幕广告,包括:
在所述第二平均时间点插入所述目标弹幕广告,以使客户端下一次播放所述视频并展示所述预设播放时间段内的弹幕时,在所述第二平均时间点以所述平均展示速度展示所述目标弹幕广告。
8.一种弹幕广告展示装置,其特征在于,包括:
第一确定模块,用于确定在视频播放时预设播放时间段内的弹幕对应的词向量;
第二确定模块,用于确定候选弹幕广告对应的词向量;
计算模块,用于计算所述候选弹幕广告对应的词向量与所述预设播放时间段内的弹幕对应的词向量之间的第一相似度;
第三确定模块,用于在所述候选弹幕广告中确定所述第一相似度大于第一预设阈值的目标弹幕广告;
插入模块,用于在所述预设播放时间段内插入所述目标弹幕广告,以使客户端在播放所述视频并展示所述预设播放时间段的弹幕时,展示所述目标弹幕广告。
9.一种电子设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1~7任一项所述的弹幕广告展示方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1~7任一项所述的弹幕广告展示方法。
CN202010584363.XA 2020-06-23 2020-06-23 弹幕广告展示方法、装置、设备及计算机可读存储介质 Active CN111683274B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010584363.XA CN111683274B (zh) 2020-06-23 2020-06-23 弹幕广告展示方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010584363.XA CN111683274B (zh) 2020-06-23 2020-06-23 弹幕广告展示方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111683274A true CN111683274A (zh) 2020-09-18
CN111683274B CN111683274B (zh) 2021-10-26

Family

ID=72437106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010584363.XA Active CN111683274B (zh) 2020-06-23 2020-06-23 弹幕广告展示方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111683274B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113365138A (zh) * 2021-06-28 2021-09-07 北京百度网讯科技有限公司 内容展示方法、装置、电子设备、存储介质以及程序产品
CN114095774A (zh) * 2022-01-20 2022-02-25 浙大宁波理工学院 一种视频弹幕展示方法、计算机设备及存储介质
CN114968463A (zh) * 2022-05-31 2022-08-30 北京字节跳动网络技术有限公司 实体展示方法、装置、设备及介质
CN115134652A (zh) * 2021-03-22 2022-09-30 阿里巴巴新加坡控股有限公司 视频动态字幕生成方法、装置、电子设备及存储介质
CN115225932A (zh) * 2021-04-20 2022-10-21 上海哔哩哔哩科技有限公司 广告处理系统、方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105872786A (zh) * 2016-05-31 2016-08-17 无锡天脉聚源传媒科技有限公司 一种在节目中通过弹幕投放广告的方法及装置
CN106341703A (zh) * 2016-08-30 2017-01-18 乐视控股(北京)有限公司 弹幕处理方法及装置
US20180041783A1 (en) * 2016-08-05 2018-02-08 Alibaba Group Holding Limited Data processing method and live broadcasting method and device
CN108322788A (zh) * 2018-02-09 2018-07-24 武汉斗鱼网络科技有限公司 一种视频直播中的广告展示方法及装置
CN108566565A (zh) * 2018-03-30 2018-09-21 科大讯飞股份有限公司 弹幕展示方法及装置
CN109003149A (zh) * 2018-10-31 2018-12-14 科大讯飞股份有限公司 一种弹幕广告投放方法及装置
CN109089172A (zh) * 2018-04-11 2018-12-25 北京奇艺世纪科技有限公司 一种弹幕显示方法、装置及电子设备
CN109308487A (zh) * 2018-08-06 2019-02-05 同济大学 一种基于弹幕数据分析的广告投放机制
CN109408639A (zh) * 2018-10-31 2019-03-01 广州虎牙科技有限公司 一种弹幕分类方法、装置、设备和存储介质
CN110248258A (zh) * 2019-07-18 2019-09-17 腾讯科技(深圳)有限公司 视频片段的推荐方法、装置、存储介质和计算机设备
CN110956500A (zh) * 2019-11-28 2020-04-03 湖南快乐阳光互动娱乐传媒有限公司 一种广告实时竞价系统中降低广告请求耗时的方法及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105872786A (zh) * 2016-05-31 2016-08-17 无锡天脉聚源传媒科技有限公司 一种在节目中通过弹幕投放广告的方法及装置
US20180041783A1 (en) * 2016-08-05 2018-02-08 Alibaba Group Holding Limited Data processing method and live broadcasting method and device
CN106341703A (zh) * 2016-08-30 2017-01-18 乐视控股(北京)有限公司 弹幕处理方法及装置
CN108322788A (zh) * 2018-02-09 2018-07-24 武汉斗鱼网络科技有限公司 一种视频直播中的广告展示方法及装置
CN108566565A (zh) * 2018-03-30 2018-09-21 科大讯飞股份有限公司 弹幕展示方法及装置
CN109089172A (zh) * 2018-04-11 2018-12-25 北京奇艺世纪科技有限公司 一种弹幕显示方法、装置及电子设备
CN109308487A (zh) * 2018-08-06 2019-02-05 同济大学 一种基于弹幕数据分析的广告投放机制
CN109003149A (zh) * 2018-10-31 2018-12-14 科大讯飞股份有限公司 一种弹幕广告投放方法及装置
CN109408639A (zh) * 2018-10-31 2019-03-01 广州虎牙科技有限公司 一种弹幕分类方法、装置、设备和存储介质
CN110248258A (zh) * 2019-07-18 2019-09-17 腾讯科技(深圳)有限公司 视频片段的推荐方法、装置、存储介质和计算机设备
CN110956500A (zh) * 2019-11-28 2020-04-03 湖南快乐阳光互动娱乐传媒有限公司 一种广告实时竞价系统中降低广告请求耗时的方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
葛欣怡: "弹幕在不同场景中的传播效果探究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
蔡圆媛: "《大数据环境下基于知识整合的语义计算技术与应用》", 31 August 2018, 北京理工大学出版社 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115134652A (zh) * 2021-03-22 2022-09-30 阿里巴巴新加坡控股有限公司 视频动态字幕生成方法、装置、电子设备及存储介质
CN115225932A (zh) * 2021-04-20 2022-10-21 上海哔哩哔哩科技有限公司 广告处理系统、方法
CN113365138A (zh) * 2021-06-28 2021-09-07 北京百度网讯科技有限公司 内容展示方法、装置、电子设备、存储介质以及程序产品
CN113365138B (zh) * 2021-06-28 2023-02-07 北京百度网讯科技有限公司 内容展示方法、装置、电子设备、存储介质
CN114095774A (zh) * 2022-01-20 2022-02-25 浙大宁波理工学院 一种视频弹幕展示方法、计算机设备及存储介质
CN114095774B (zh) * 2022-01-20 2022-06-03 浙大宁波理工学院 一种视频弹幕展示方法、计算机设备及存储介质
CN114968463A (zh) * 2022-05-31 2022-08-30 北京字节跳动网络技术有限公司 实体展示方法、装置、设备及介质

Also Published As

Publication number Publication date
CN111683274B (zh) 2021-10-26

Similar Documents

Publication Publication Date Title
CN111683274B (zh) 弹幕广告展示方法、装置、设备及计算机可读存储介质
US11409791B2 (en) Joint heterogeneous language-vision embeddings for video tagging and search
CN110582025B (zh) 用于处理视频的方法和装置
CN106874435B (zh) 用户画像构建方法和装置
CN112533051B (zh) 弹幕信息显示方法、装置、计算机设备和存储介质
US10747771B2 (en) Method and apparatus for determining hot event
CN111460153B (zh) 热点话题提取方法、装置、终端设备及存储介质
CN109241286B (zh) 用于生成文本的方法和装置
CN109509010B (zh) 一种多媒体信息处理方法、终端及存储介质
CN112559800B (zh) 用于处理视频的方法、装置、电子设备、介质和产品
US20110150328A1 (en) Apparatus and method for blockiing objectionable image on basis of multimodal and multiscale features
CN111372141B (zh) 表情图像生成方法、装置及电子设备
EP4239585A1 (en) Video loop recognition method and apparatus, computer device, and storage medium
CN112464100B (zh) 信息推荐模型训练方法、信息推荐方法、装置及设备
CN111984821A (zh) 确定视频动态封面的方法、装置、存储介质及电子设备
CN110019948B (zh) 用于输出信息的方法和装置
CN113688310A (zh) 一种内容推荐方法、装置、设备及存储介质
CN111897950A (zh) 用于生成信息的方法和装置
CN110347900B (zh) 一种关键词的重要度计算方法、装置、服务器及介质
CN109451334B (zh) 用户画像生成处理方法、装置及电子设备
CN110019763B (zh) 文本过滤方法、系统、设备及计算机可读存储介质
CN110569447A (zh) 一种网络资源的推荐方法、装置及存储介质
CN111222328A (zh) 标签提取方法、装置和电子设备
CN112672202B (zh) 弹幕处理方法、设备和存储介质
CN110019942B (zh) 一种视频鉴别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant