CN112153474A - 视频弹幕的生成方法、装置、电子设备和计算机存储介质 - Google Patents

视频弹幕的生成方法、装置、电子设备和计算机存储介质 Download PDF

Info

Publication number
CN112153474A
CN112153474A CN202011025538.XA CN202011025538A CN112153474A CN 112153474 A CN112153474 A CN 112153474A CN 202011025538 A CN202011025538 A CN 202011025538A CN 112153474 A CN112153474 A CN 112153474A
Authority
CN
China
Prior art keywords
video
bullet screen
barrage
user
voice information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011025538.XA
Other languages
English (en)
Other versions
CN112153474B (zh
Inventor
罗叶飞
向树桃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan MgtvCom Interactive Entertainment Media Co Ltd
Original Assignee
Hunan MgtvCom Interactive Entertainment Media Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan MgtvCom Interactive Entertainment Media Co Ltd filed Critical Hunan MgtvCom Interactive Entertainment Media Co Ltd
Priority to CN202011025538.XA priority Critical patent/CN112153474B/zh
Publication of CN112153474A publication Critical patent/CN112153474A/zh
Application granted granted Critical
Publication of CN112153474B publication Critical patent/CN112153474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供一种视频弹幕的生成方法、装置、电子设备和计算机存储介质,该方法包括,在视频播放过程中,检测到弹幕输入指令时,采集用户的语音信息,并控制视频继续播放;利用语音识别技术将采集的语音信息转换为语音信息对应的视频弹幕;在视频播放界面显示视频弹幕。本方案能够将用户的语音转换为相应的视频弹幕,能够缩短用户输入弹幕所需的时间,并且用户说话的同时可以观看视频,因此在输入弹幕的过程中可以继续播放视频,不会影响用户的观看进度,有效的改善输入弹幕时的用户体验。

Description

视频弹幕的生成方法、装置、电子设备和计算机存储介质
技术领域
本发明涉及视频技术领域,特别涉及一种视频弹幕的生成方法、装置、电子设备和计算机存储介质。
背景技术
视频弹幕是一种在视频观看过程中弹出的评论性字幕,目前,用户在视频网站观看视频时,可以开启弹幕输入界面,在弹幕输入界面中通过键盘输入弹幕文本,从而在视频播放界面显示对应的弹幕。
然而,这种按键输入弹幕文本的方式,用户输入弹幕所需的时间较长,并且在输入弹幕时用户无法观看视频,因此需要在用户输入弹幕的过程中暂停视频播放,影响了用户的观看进度,导致用户输入弹幕时的体验较差。
发明内容
基于上述现有技术的缺点,本申请提供一种视频弹幕的生成方法、装置、电子设备和计算机存储介质,以改善用户输入视频弹幕时的用户体验。
本申请第一方面提供一种视频弹幕的生成方法,包括:
在视频播放过程中,检测到弹幕输入指令时,采集用户的语音信息,并控制所述视频继续播放;
利用语音识别技术将采集的语音信息转换为所述语音信息对应的视频弹幕;
在视频播放界面显示所述视频弹幕。
可选的,所述检测到用户的弹幕输入指令时,采集用户的语音信息之前,还包括:
在视频播放过程中,以第一透明度在所述视频的播放界面实时显示语音输入图标;其中,所述第一透明度低于所述视频的透明度;
检测到针对所述语音输入图标的点击指令时,以第二透明度显示所述语音输入图标;其中,所述第二透明度与所述视频的透明度一致;
检测到针对以第二透明度显示的所述语音输入图标的长按指令时,将所述长按指令识别为弹幕输入指令,并执行所述检测到用户的弹幕输入指令时,采集用户的语音信息。
可选的,所述控制所述视频继续播放,包括:
在采集语音信息的过程中,控制所述视频以低于第一音量值的第二音量值继续播放;其中,所述第一音量值是检测到弹幕输入指令之前所述视频播放时的音量值。
可选的,所述控制所述视频继续播放,包括:
在采集语音信息的过程中,控制所述视频以低于第一播放速率的第二播放速率继续播放;其中,所述第一播放速率是检测到弹幕输入指令之前所述视频的播放速率。
可选的,所述利用语音识别技术将采集的语音信息转换为所述语音信息对应的视频弹幕,包括:
利用语音识别技术识别采集的语音信息,得到至少一个备选弹幕文本;
在所述视频的播放界面的下方显示每一个所述备选弹幕文本,并将其中用户指定的任意一个弹幕文本确定为所述语音信息对应的视频弹幕。
可选的,所述在所述视频的播放界面的下方显示每一个所述备选弹幕文本之前,还包括:
根据所述备选弹幕文本和用户发布的多条历史视频弹幕,确定所述备选弹幕文本对应的补充弹幕文本;
其中,所述在所述视频的播放界面的下方显示每一个所述备选弹幕文本,包括:
在所述视频的播放界面的下方显示每一个所述备选弹幕文本和每一个所述补充弹幕文本。
本申请第二方面提供一种视频弹幕的生成装置,其特征在于,包括:
采集单元,用于在视频播放过程中,检测到弹幕输入指令时,采集用户的语音信息,并控制所述视频继续播放;
转换单元,用于利用语音识别技术将采集的语音信息转换为所述语音信息对应的视频弹幕;
弹幕显示单元,用于在视频播放界面显示所述视频弹幕。
可选的,所述生成装置还包括:
图标显示单元,用于在视频播放过程中,以第一透明度在所述视频的播放界面实时显示语音输入图标;其中,所述第一透明度低于所述视频的透明度;
所述图标显示单元,用于检测到针对所述语音输入图标的点击指令时,以第二透明度显示所述语音输入图标;其中,所述第二透明度与所述视频的透明度一致;
所述采集单元,用于检测到针对以第二透明度显示的所述语音输入图标的长按指令时,将所述长按指令识别为弹幕输入指令,并执行所述检测到用户的弹幕输入指令时,采集用户的语音信息。
本申请第三方面提供一种电子设备,包括存储器和处理器;
其中,所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序,具体用于执行本申请第一方面任意一项所提供的视频弹幕的生成方法。
本申请第四方面提供一种计算机存储介质,用于存储计算机程序,所述计算机程序被执行时,具体用于实现本申请第一方面任意一项所提供的视频弹幕的生成方法。
本申请提供一种视频弹幕的生成方法、装置、电子设备和计算机存储介质,该方法包括,在视频播放过程中,检测到弹幕输入指令时,采集用户的语音信息,并控制视频继续播放;利用语音识别技术将采集的语音信息转换为语音信息对应的视频弹幕;在视频播放界面显示视频弹幕。本方案能够将用户的语音转换为相应的视频弹幕,能够缩短用户输入弹幕所需的时间,并且用户说话的同时可以观看视频,因此在输入弹幕的过程中可以继续播放视频,不会影响用户的观看进度,有效的改善输入弹幕时的用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种视频弹幕生成方法的流程图;
图2为本申请实施例提供的一种视频播放界面的示意图;
图3为本申请实施例提供的一种将语音信息转换为视频弹幕的方法的流程图;
图4为本申请实施例提供的一种视频弹幕选择界面的示意图;
图5为本申请另一实施例提供的一种视频弹幕的生成方法的流程图;
图6为本申请实施例提供的一种视频弹幕的生成装置的结构示意图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先需要说明的是,本申请任一实施例所提供的视频弹幕生成方法,可以由包括智能手机,平板电脑,笔记本电脑和台式电脑在内的任意一种可以登录视频网站并播放网络视频的终端设备执行。并且,执行本申请提供的视频弹幕的生成方法的程序,可以是安装在上述终端设备中的客户端应用程序,也可以是上述终端设备登录至视频网站并加载视频播放页面后,嵌入在视频播放页面中的网页应用程序。
另外,针对本申请任一实施例提供的方法中涉及的利用语音转换技术将用户的语音转换为文本这一步骤,在执行该步骤时,若上述应用程序自身具有语音识别功能,则可以直接利用自身的语音识别功能实现上述转换,若上述应用程序自身不具有语音识别功能,则也可以调用运行上述应用程序的终端设备配置的语音识别功能实现上述转换。
另外,本申请任一实施例中,利用语音识别技术对用户的语音信息进行识别,可以是,在采集语音信息的过程中实时的进行识别,即采集和识别同时进行,这种情况下,语音信息采集完成时,对语音信息的识别同时完成,也可以是,在采集到完整的语音信息,或者说语音信息采集完毕后才开始识别。
下面,请参考图1,本申请实施例提供的视频弹幕的生成方法可以包括以下步骤:
S101、在视频播放过程中,检测到弹幕输入指令时,采集用户的语音信息,并控制视频继续播放。
S102、利用语音识别技术将采集的语音信息转换为语音信息对应的视频弹幕。
S103、在视频播放界面显示视频弹幕。
可以理解的,一个用户甲观看视频A时发布了一条视频弹幕后,该用户的终端设备可以将这条视频弹幕发送至服务器,由此,另一个用户乙在观看视频A时,服务器可以将甲发送的视频弹幕发送至乙的终端设备,使用户乙能够看到用户甲对视频内容的评论,从而实现观看相同视频的多个用户之间的互动。
因此,在本实施例提供的视频生成方法中,还可以包括下述步骤:
S104、将视频弹幕和对应的时间戳发送至服务器。
其中,视频弹幕对应的时间戳,对应于视频的时间轴上的一个特定的时间点,时间戳用于控制视频弹幕在视频播放至对应进度时在视频播放界面弹出。
例如,一个全长为60分钟的视频,一条视频弹幕的时间戳可以是这60分钟中的21:20(即第21分钟的第20秒),那么,用户观看该视频至21:20的时候,这条视频弹幕就会在视频播放界面弹出,具体的弹出方式可以由发送这条视频弹幕的用户指定,例如可以从视频播放界面的右侧水平匀速向左侧移动,可以从视频播放界面的底部弹出等等,在此不做限定。
在步骤S101中,弹幕输入指令可以理解为预先定义的一种用于触发本申请实施例所提供的方法的操作,当程序检测到用户执行了相应的操作后,就会将其识别为弹幕输入指令,然后开始执行本申请任一实施例所提供的视频弹幕生成方法。
可选的,请参考图2,下面说明一种可选的弹幕输入指令的形式及其检测方法:
图2包括两个视频播放界面的示意图,其中,位于上方的播放界面示意图在画面中央以虚线绘制有一个语音输入图标。图2上方的示意图表示,程序可以在视频播放的过程中,在视频播放界面的中央(当然也可以在其他位置,如侧边,底部等)以第一透明度实时地显示一个语音输入图标,其中,第一透明度低于当前播放的视频的透明度,并且大于0,也就是说,此时的语音输入图标,相对于正在播放的视频来说,是一个部分透明的图标。采用这种显示方式,既能够让用户注意到视频播放界面中存在一个可操作的语音输入图标,也不会遮挡当前的视频内容。
其中,当语音输入图标显示在视频播放界面的侧边时,可以部分隐藏语音输入图标,仅显示一部分语音输入图标。
当然,在其他可选的实施例中,也可以完全不显示语音输入图标,在检测到用户单击视频播放界面的任一区域,或者单击指定区域时,再以第二透明度显示语音输入图标。
在本申请中,图像的透明度越低,在该图像越透明,若图像的透明度为0,则表示该图像完全透明(也就是对用户完全不可见)。
当任意时刻用户想要输入视频弹幕时,用户可以点击上述以第一透明度显示的语音输入图标,相应的,程序就会检测到针对语音输入图标的点击指令,此时,程序可以将语音输入图标的显示方式从第一透明度调整为第二透明度,其中,第二透明度和视频的透明度一致,此时的视频播放界面的示意图是位于图2下方的示意图。
当语音输入图标变更为第二透明度时,语音输入图标相当于一个虚拟按钮,用户可以长按这一虚拟按钮,相应的,程序会检测到针对语音输入图标的长按指令,并且,将这一长按指令识别为弹幕输入指令,从而开始执行后续步骤。
也就是说,在上述方案中,弹幕输入指令可以理解为,对以第二透明度显示的语音输入图标的长按指令。
可选的,当检测到上述长按指令时,可以在语音输入图标的位置播放简单的动画效果,例如,显示以语音输入图标为中心而向外扩散的圆形波纹,或者也可以输出语音提示,通过上述方式提示用户说出想要输入的视频弹幕,也就是后续需要采集的语音信息。
可选的,当弹幕输入指令是上述长按指令时,采集用户的语音信息,可以是在用户长按语音输入图标的这段时间内持续执行,在长按指令结束,也就是用户松开语音输入图标后立即结束,也可以是,在用户松开语音输入图标后开始,然后持续采集一段时间,时间到后自动结束。
当然,弹幕输入指令也可以有其他的形式,比如弹幕输入指令也可以是一个特定的语音指令。
也就是说,可以在视频播放过程中实时的采集并识别环境中的语音信息,当识别到“我要发弹幕”这一语音后,将其识别为弹幕输入指令,并开始执行上述实施例后续的步骤。针对这种形式的弹幕输入指令,采集用户的语音信息的方式可以是,在检测到上述语音后开始采集,持续采集一定时长(如30秒)后结束。
由于用户可以很容易的触发弹幕输入指令,并且在后续采集用户语音信息的过程中,用户说出视频弹幕的同时也可以正常观看视频,因此,在步骤S101中,可以在检测到弹幕输入指令后控制视频继续播放。
可选的,若用户当前使用扬声器或类似的装置外放视频的声音,则为了避免视频的声音和用户的语音信息一并被程序采集,进而对后续将语音信息转换为视频弹幕的准确度造成不良影响,可以在采集用户的语音信息的过程中,控制视频以低于第一音量值的第二音量值继续播放,在语音信息采集结束后,再控制视频切换回第一音量值继续播放。
其中,第一音量值是检测到弹幕输入指令之前,用户设定的播放视频时的音量值。也就是说,在检测到弹幕输入指令后,程序可以自动将视频的音量值在当前的第一音量值的基础上下调,具体下调多少可以预先指定,也可以由程序按一定的算法确定,在语音信息采集完毕后,程序再自动将视频的音量值调回原本的第一音量值。
通过这种方式,可以有效的减少采集到的语音信息中的噪音,从而提高后续的语音识别的准确度。
当然,若用户原本就在静音模式下观看视频,或者用户使用耳机等设备收听视频的声音,则可以不执行上述调整视频音量值的动作。
可选的,考虑到用户在说出视频弹幕时在视频内容上的注意力可能不够集中,容易错过一些重要画面,因此,可以在检测到弹幕输入指令后,控制视频以低于第一播放速率的第二播放速率继续播放,在语音信息采集完毕之后(或者,也可以在生成了视频弹幕之后)再将视频的播放速率调整回第一播放速率。
其中,第一播放速率用于指代,检测到弹幕输入指令之前视频正常播放时的播放速率。例如,假设检测到弹幕输入指令之前视频的播放速率是每秒20帧,那么检测到弹幕输入指令之后,程序可以自动将视频的播放速率下调为每秒10帧,在语音信息采集完毕,或者在生成了视频弹幕之后,再将视频的播放速率回调至每秒20帧。
在步骤S103中,显示视频弹幕时,可以按照默认的视频弹幕样式进行显示,其中,视频弹幕样式具体可以定义视频弹幕的字体,颜色,字号,视频弹幕的弹出方式,移动速度等。
另外,在执行步骤S103显示视频弹幕之前,还可以在视频播放界面中显示弹幕样式设定界面,向用户展示可选择的多种视频弹幕样式,例如,多种可选择的颜色,多种可选择的字体等,然后按照用户在弹幕样式设定界面中指定的视频弹幕样式显示视频弹幕。
相应的,在步骤S104中,向服务器发送的视频弹幕可以携带有用户定义的视频弹幕样式,使得其他终端设备在显示这条视频弹幕时,也能够按照用户定义的视频弹幕样式显示。
最后,在步骤S104中,视频弹幕对应的时间戳可以按照下述方式确定:
在检测到弹幕输入指令后,启动一个计时器,该计时器用于记录从用户触发弹幕输入指令开始,到程序生成视频弹幕为止的时长,换言之,该计时器会在程序生成视频弹幕时停止计时。
在程序生成视频弹幕后,用生成视频弹幕的时间,减去计时器记录的时长,最终得到的时间就是视频弹幕对应的时间戳。
例如,假设程序响应用户的弹幕输入指令,通过执行上述实施例的方法在20:40(视频的第20分,第40秒)生成了一条视频弹幕,但是计时器记录的时长为20秒,说明用户是在20:40这一时刻的20秒之前触发弹幕输入指令的,相对的,最后计算得到的这条视频弹幕的时间戳,就是视频的第20分,第20秒。即20:20。
采用上述方法确定时间戳的目的在于,用户输入的视频弹幕,往往是针对触发弹幕输入指令时的视频画面的评论,例如,视频画面中出现汽车时,可能会有针对该画面的视频弹幕:“这辆车真大”,为了让其他用户观看视频弹幕时能够准确理解视频弹幕的含义,有必要使视频弹幕和其针对的视频画面同步显示。
在本方案中,由于用户触发弹幕输入指令后,视频会继续播放,视频弹幕的生成时间相对于用户触发弹幕输入指令的时间(也就是这条视频弹幕所要评论的视频画面出现的时间)存在一定的延迟。而采用上述方法确定视频弹幕的时间戳,可以修正上述延迟,确保其他用户在观看视频时,视频弹幕和视频弹幕针对的视频画面能够同步显示,从而保障用户能够正确的理解视频弹幕,避免视频弹幕和视频画面的错位。
本申请实施例具有如下的有益效果:
其一,本方案通过采集用户的语音信息并将其转换为视频弹幕,最大限度的减小输入视频弹幕对用户观看视频内容的影响,使用户在输入视频弹幕的同时不影响其观看视频的进度,从而改善输入视频弹幕时的用户体验。
其二,本方案在采集语音信息并生成视频弹幕的阶段,可以控制视频以较低的音量,较慢的播放速率播放,既能够避免视频的音效对用户的语音信息造成干扰,也能够防止用户在说出视频弹幕时错过视频中的重要画面。
其三,本方案能够记录从用户所要评论的视频画面的显示时间(也就是用户触发弹幕输入指令的时间)到实际生成视频弹幕的时间的延迟,并基于该延迟在向服务器发送视频弹幕时修正视频弹幕的时间戳,使得其他用户观看视频弹幕时,看到的视频弹幕能够于当前显示的视频画面相匹配,获得良好的弹幕观看体验。
请参考图3,前述实施例的步骤S102所述的,利用语音识别技术将采集的语音信息转换为语音信息对应的视频弹幕,其具体执行过程可以包括如下的步骤:
S301、利用语音识别技术识别采集的语音信息,得到至少一个备选弹幕文本。
由于用户发音不标准,环境噪音干扰,以及语音识别技术的识别精度等因素的限制,利用语音识别技术识别得到的文本可能不唯一,或者可能出错,例如,用户实际说话的内容,即采集的语音信息为“前方高能”,而语音识别技术识别得到的文本可能有,“前方高能”,“前方高人”,“前方高冷”等等,在从语音信息中识别得到的文本不唯一的情况,可以将识别得到的所有文本确定为步骤S301备选弹幕文本,或者,在识别得到的弹幕文本唯一的情况下,也可以将其中某些容易识别错误的字符替换为其他字符,从而得到多个备选文本。然后向用户展示备选弹幕文本,由用户在多个备选弹幕文本中指定一个作为视频弹幕。
S302、根据备选弹幕文本生成若干个补充弹幕文本。
需要说明的是,步骤S302以及后续步骤S303中生成并显示补充弹幕文本的步骤是可选的步骤,也就是说,也可以不生成补充弹幕文本,相应的也不需要显示补充弹幕文本。
在部分场景中,采集的语音信息可能缺失一部分,或者用户所说的内容仅仅是用户想要发布的视频弹幕的一部分,针对这一场景,程序可以对用户以往发布的若干条历史视频弹幕,特别是可以针对用户对同类型的视频发布的多条历史视频弹幕进行归类,从而确定出若干条该用户在当前视频中可能要发布的视频弹幕(不妨称为该用户的偏好视频弹幕),若其中几条偏好视频弹幕包含从当前的语音信息中识别得到的文本,或者包含识别得到的一部分文本,那么,就可以将这些视频弹幕确定为步骤S302中的补充弹幕文本。
例如,假设通过对历史视频弹幕进行归类,确定用户的一条偏好视频弹幕为“有个可怕的事情即将发生,请看进度条”,而当前从用户的语音信息中识别得到的文本为“可怕的事情即将发生”,那么可以将前面的偏好视频弹幕确定为当前的语音信息所对应的一条补充弹幕文本,换言之,也就是可以推测用户实际要发布的视频弹幕可能是前面的偏好视频弹幕。
当然,除了根据用户的历史视频弹幕归类出该用户的偏好视频弹幕之外,还可以对网站中所有用户对同类型视频的视频弹幕,从中归类出热门视频弹幕,并且将热门视频弹幕也确定为该用户的偏好视频弹幕,进而从热门视频弹幕中筛选出用户可能想发布的补充弹幕文本。
S303、显示所有备选弹幕文本和补充弹幕文本。
具体的,备选弹幕文本和补充弹幕文本可以在视频的播放界面下方一并显示,当然,也可以在其他区域显示。例如,若用户当前以全屏模式观看视频,则在视频的播放界面下方显示,若用户当前以窗口模式观看视频,则可以在显示屏上,除视频的播放窗口以外的其他区域显示上述文本。
其中,在视频的播放界面下方显示文本的示意图可以参考图4。
在图4的示意图中,从语音信息识别得到的两个备选弹幕文本为“可怕的事情即将发生,请看进度条”,“可爱的事情即将发生,请看进度条”,根据用户以往发布的历史视频弹幕,确定的两个补充弹幕文本为:“有个可怕的事情即将发生,请看进度条”,“有个可爱的事情即将发生,请看进度条”,如图4所示,上述四个弹幕文本均显示在选择界面中,用户可以选择其中任意一个弹幕文本作为要发布的视频弹幕。
S304、将任意一个用户指定的弹幕文本确定为语音信息对应的视频弹幕。
用户可以单击如图4所示的视频弹幕选择界面中显示的任意一个弹幕文本,程序检测到针对任意一个弹幕文本的单击指令后,就可以将其确定为上述语音信息对应的视频弹幕,即用户实际要发布的视频弹幕。
当然,在本申请其他的实施例中,若利用语音识别技术从语音信息中识别得到唯一一个文本,则可以直接将该文本确定为采集到的语音信息对应的视频弹幕,而不需要执行图3对应的方法。
可选的,在本申请的其他实施例中,用户还可以指定某一条备选弹幕文本或补充弹幕文本,然后通过键盘对被选中的弹幕文本进行手动编辑,最后以编辑后的弹幕文本作为要发布的视频弹幕。
最后,请参考图5,本申请实施例还提供一种视频弹幕的生成方法,该方法可以包括如下步骤:
S51、是否开启语音识别功能。
若是,则执行步骤S52,若否,即语音识别功能未开启,则本方案结束。
在观看视频时,为了节约终端设备所消耗的计算资源,用户可以主动关闭语音识别功能,这种情况下用户仅能通过键盘输入视频弹幕。
S52、是否单击语音识别按钮。
语音识别按钮相当于前述实施例中所述的语音输入图标。
若是,则执行步骤S54,若否,执行步骤S53。
S53、以第一透明度显示或者隐藏语音识别按钮。
步骤S53执行的同时,实时执行步骤S52,直至检测到用户单击语音识别按钮为止。
S54、是否长按语音识别按钮。
若否,则返回执行步骤S52,若是,则执行步骤S55。
步骤S52至步骤S54所述的过程,相当于图1对应的实施例的步骤S101中检测弹幕输入指令的过程。
S55、采集并识别语音信息。
S56、是否结束长按上述按钮。
若未结束,则继续执行步骤S55,也就是继续采集并识别用户的语音信息,若用户结束对语音识别按钮的长按,则执行步骤S57。
步骤S55和步骤S56,相当于图1对应的实施例中,步骤S101所述的采集用户的语音信息,以及步骤S102中利用语音识别技术将语音信息转换为视频弹幕。
S57、是否编辑弹幕文本。
步骤S57中的弹幕文本,可以是,利用语音识别技术从用户的语音信息中识别得到的唯一的一个文本,也可以是,图3对应的实施例中识别得到的多个备选弹幕文本和确定的多个补充弹幕文本中,由用户指定的那个弹幕文本。
若否,则执行步骤S59,若是,则执行步骤S58。
S58、进入手动编辑模式。
用户可以在手动编辑模式下对选定的弹幕文本进行手动编辑,从而得到编辑后的文本。
S59、显示视频弹幕并向服务器发送视频弹幕和对应的时间戳。
步骤S59相当于前述图1对应的实施例中的步骤S103和步骤S104。
上述实施例中每一个判断步骤,均可以理解为由应用程序执行的对应的检测动作。
结合本申请任一实施例提供的视频弹幕的生成方法,本申请实施例还提供一种视频弹幕的生成装置,请参考图6,该装置可以包括以下单元:
采集单元601,用于在视频播放过程中,检测到弹幕输入指令时,采集用户的语音信息,并控制视频继续播放。
转换单元602,用于利用语音识别技术将采集的语音信息转换为语音信息对应的视频弹幕。
弹幕显示单元603,用于在视频播放界面显示视频弹幕。
可选的,该生成装置还可以包括图标显示单元604,用于:
在视频播放过程中,以第一透明度在视频的播放界面实时显示语音输入图标;其中,第一透明度低于视频的透明度;
检测到针对语音输入图标的点击指令时,以第二透明度显示语音输入图标;其中,第二透明度与视频的透明度一致;
其中,采集单元601检测弹幕输入指令时,具体用于:
检测到针对以第二透明度显示的语音输入图标的长按指令时,将长按指令识别为弹幕输入指令,并执行检测到用户的弹幕输入指令时,采集用户的语音信息。
采集单元601控制视频继续播放时,具体用于:
在采集语音信息的过程中,控制视频以低于第一音量值的第二音量值继续播放;其中,第一音量值是检测到弹幕输入指令之前视频播放时的音量值。
采集单元601控制视频继续播放时,具体用于:
在采集语音信息的过程中,控制视频以低于第一播放速率的第二播放速率继续播放;其中,第一播放速率是检测到弹幕输入指令之前视频的播放速率。
转换单元602利用语音识别技术将采集的语音信息转换为语音信息对应的视频弹幕时,具体用于:
利用语音识别技术识别采集的语音信息,得到至少一个备选弹幕文本;
在视频的播放界面的下方显示每一个备选弹幕文本,并将其中用户指定的任意一个弹幕文本确定为语音信息对应的视频弹幕。
转换单元602还用于:
在视频的播放界面的下方显示每一个备选弹幕文本之前,根据备选弹幕文本和用户发布的多条历史视频弹幕,确定备选弹幕文本对应的补充弹幕文本;
其中,转换单元602在视频的播放界面的下方显示每一个备选弹幕文本时,具体用于:
在视频的播放界面的下方显示每一个备选弹幕文本和每一个补充弹幕文本。
本申请实施例提供的视频弹幕的生成装置,其具体工作原理可以参考本申请任一实施例所提供的视频弹幕的生成方法,此处不再赘述。
本申请提供一种视频弹幕的生成装置,其中,采集单元601在视频播放过程中,检测到弹幕输入指令时,采集用户的语音信息,并控制视频继续播放;转换单元602利用语音识别技术将采集的语音信息转换为语音信息对应的视频弹幕;弹幕显示单元603在视频播放界面显示视频弹幕。本方案能够将用户的语音转换为相应的视频弹幕,能够缩短用户输入弹幕所需的时间,并且用户说话的同时可以观看视频,因此在输入弹幕的过程中可以继续播放视频,不会影响用户的观看进度,有效的改善输入弹幕时的用户体验。
本申请实施例还提供一种计算机存储介质,用于存储计算机程序,当存储的计算机程序被执行时,具体用于实现本申请任一实施例所提供的视频弹幕的生成方法。
本申请实施例还提供一种电子设备,请参考图7,包括存储器701和处理器702,其中,存储器701用于存储计算机程序,处理器702用于执行存储的计算机程序,具体用于实现本申请任一实施例提供的视频弹幕的生成方法。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
需要注意,本发明中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种视频弹幕的生成方法,其特征在于,包括:
在视频播放过程中,检测到弹幕输入指令时,采集用户的语音信息,并控制所述视频继续播放;
利用语音识别技术将采集的语音信息转换为所述语音信息对应的视频弹幕;
在视频播放界面显示所述视频弹幕。
2.根据权利要求1所述的生成方法,其特征在于,所述检测到用户的弹幕输入指令时,采集用户的语音信息之前,还包括:
在视频播放过程中,以第一透明度在所述视频的播放界面实时显示语音输入图标;其中,所述第一透明度低于所述视频的透明度;
检测到针对所述语音输入图标的点击指令时,以第二透明度显示所述语音输入图标;其中,所述第二透明度与所述视频的透明度一致;
检测到针对以第二透明度显示的所述语音输入图标的长按指令时,将所述长按指令识别为弹幕输入指令,并执行所述检测到用户的弹幕输入指令时,采集用户的语音信息。
3.根据权利要求1所述的生成方法,其特征在于,所述控制所述视频继续播放,包括:
在采集语音信息的过程中,控制所述视频以低于第一音量值的第二音量值继续播放;其中,所述第一音量值是检测到弹幕输入指令之前所述视频播放时的音量值。
4.根据权利要求1所述的生成方法,其特征在于,所述控制所述视频继续播放,包括:
在采集语音信息的过程中,控制所述视频以低于第一播放速率的第二播放速率继续播放;其中,所述第一播放速率是检测到弹幕输入指令之前所述视频的播放速率。
5.根据权利要求1所述的生成方法,其特征在于,所述利用语音识别技术将采集的语音信息转换为所述语音信息对应的视频弹幕,包括:
利用语音识别技术识别采集的语音信息,得到至少一个备选弹幕文本;
在所述视频的播放界面的下方显示每一个所述备选弹幕文本,并将其中用户指定的任意一个弹幕文本确定为所述语音信息对应的视频弹幕。
6.根据权利要求5所述的生成方法,其特征在于,所述在所述视频的播放界面的下方显示每一个所述备选弹幕文本之前,还包括:
根据所述备选弹幕文本和用户发布的多条历史视频弹幕,确定所述备选弹幕文本对应的补充弹幕文本;
其中,所述在所述视频的播放界面的下方显示每一个所述备选弹幕文本,包括:
在所述视频的播放界面的下方显示每一个所述备选弹幕文本和每一个所述补充弹幕文本。
7.一种视频弹幕的生成装置,其特征在于,包括:
采集单元,用于在视频播放过程中,检测到弹幕输入指令时,采集用户的语音信息,并控制所述视频继续播放;
转换单元,用于利用语音识别技术将采集的语音信息转换为所述语音信息对应的视频弹幕;
弹幕显示单元,用于在视频播放界面显示所述视频弹幕。
8.根据权利要求7所述的生成装置,其特征在于,所述生成装置还包括:
图标显示单元,用于在视频播放过程中,以第一透明度在所述视频的播放界面实时显示语音输入图标;其中,所述第一透明度低于所述视频的透明度;
所述图标显示单元,用于检测到针对所述语音输入图标的点击指令时,以第二透明度显示所述语音输入图标;其中,所述第二透明度与所述视频的透明度一致;
所述采集单元,用于检测到针对以第二透明度显示的所述语音输入图标的长按指令时,将所述长按指令识别为弹幕输入指令,并执行所述检测到用户的弹幕输入指令时,采集用户的语音信息。
9.一种电子设备,其特征在于,包括存储器和处理器;
其中,所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序,具体用于执行如权利要求1至6任意一项所述的视频弹幕的生成方法。
10.一种计算机存储介质,其特征在于,用于存储计算机程序,所述计算机程序被执行时,具体用于实现如权利要求1至6任意一项所述的视频弹幕的生成方法。
CN202011025538.XA 2020-09-25 2020-09-25 视频弹幕的生成方法、装置、电子设备和计算机存储介质 Active CN112153474B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011025538.XA CN112153474B (zh) 2020-09-25 2020-09-25 视频弹幕的生成方法、装置、电子设备和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011025538.XA CN112153474B (zh) 2020-09-25 2020-09-25 视频弹幕的生成方法、装置、电子设备和计算机存储介质

Publications (2)

Publication Number Publication Date
CN112153474A true CN112153474A (zh) 2020-12-29
CN112153474B CN112153474B (zh) 2022-09-23

Family

ID=73897296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011025538.XA Active CN112153474B (zh) 2020-09-25 2020-09-25 视频弹幕的生成方法、装置、电子设备和计算机存储介质

Country Status (1)

Country Link
CN (1) CN112153474B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114268820A (zh) * 2021-12-20 2022-04-01 歌尔科技有限公司 基于蓝牙耳机的弹幕发送方法、蓝牙耳机、设备和介质
CN115134650A (zh) * 2022-06-27 2022-09-30 上海哔哩哔哩科技有限公司 视频笔记展示方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104822093A (zh) * 2015-04-13 2015-08-05 腾讯科技(北京)有限公司 弹幕发布方法和装置
CN105898557A (zh) * 2016-04-29 2016-08-24 乐视控股(北京)有限公司 一种语音弹幕的生成、播放方法及其装置、客户端
US20180152767A1 (en) * 2016-11-30 2018-05-31 Alibaba Group Holding Limited Providing related objects during playback of video data
CN108668175A (zh) * 2018-05-02 2018-10-16 北京奇艺世纪科技有限公司 一种弹幕文字的发布方法及装置
CN109348145A (zh) * 2018-09-14 2019-02-15 上海连尚网络科技有限公司 基于字幕生成关联弹幕的方法及设备
CN109951743A (zh) * 2019-03-29 2019-06-28 上海哔哩哔哩科技有限公司 弹幕信息处理方法、系统及计算机设备
CN111586469A (zh) * 2020-05-12 2020-08-25 腾讯科技(深圳)有限公司 弹幕显示方法、装置及电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104822093A (zh) * 2015-04-13 2015-08-05 腾讯科技(北京)有限公司 弹幕发布方法和装置
CN105898557A (zh) * 2016-04-29 2016-08-24 乐视控股(北京)有限公司 一种语音弹幕的生成、播放方法及其装置、客户端
US20180152767A1 (en) * 2016-11-30 2018-05-31 Alibaba Group Holding Limited Providing related objects during playback of video data
CN108668175A (zh) * 2018-05-02 2018-10-16 北京奇艺世纪科技有限公司 一种弹幕文字的发布方法及装置
CN109348145A (zh) * 2018-09-14 2019-02-15 上海连尚网络科技有限公司 基于字幕生成关联弹幕的方法及设备
CN109951743A (zh) * 2019-03-29 2019-06-28 上海哔哩哔哩科技有限公司 弹幕信息处理方法、系统及计算机设备
CN111586469A (zh) * 2020-05-12 2020-08-25 腾讯科技(深圳)有限公司 弹幕显示方法、装置及电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114268820A (zh) * 2021-12-20 2022-04-01 歌尔科技有限公司 基于蓝牙耳机的弹幕发送方法、蓝牙耳机、设备和介质
CN114268820B (zh) * 2021-12-20 2024-04-30 歌尔科技有限公司 基于蓝牙耳机的弹幕发送方法、蓝牙耳机、设备和介质
CN115134650A (zh) * 2022-06-27 2022-09-30 上海哔哩哔哩科技有限公司 视频笔记展示方法及装置

Also Published As

Publication number Publication date
CN112153474B (zh) 2022-09-23

Similar Documents

Publication Publication Date Title
CN107193841B (zh) 媒体文件加速播放、传输及存储的方法和装置
JP5746111B2 (ja) 電子装置及びその制御方法
US11238898B2 (en) System and method for recording a video scene within a predetermined video framework
JP5819269B2 (ja) 電子装置及びその制御方法
CN107370887B (zh) 一种表情生成方法及移动终端
CN112153474B (zh) 视频弹幕的生成方法、装置、电子设备和计算机存储介质
CN104618808B (zh) 一种多媒体信息处理方法、客户端及服务器
KR20130018464A (ko) 전자 장치 및 그의 제어 방법
JP2013041580A (ja) 電子装置及びその制御方法
CN104104990B (zh) 调整视频中字幕的方法及装置
JP2007171809A (ja) 情報処理装置及び情報処理方法
US20180070026A1 (en) Video rendering with teleprompter overlay
CN111209437A (zh) 一种标签处理方法、装置、存储介质和电子设备
CN108962220A (zh) 多媒体文件播放场景下的文本显示方法及装置
US20200097528A1 (en) Method and Device for Quickly Inserting Text of Speech Carrier
WO2022007545A1 (zh) 一种视频集锦的生成方法及显示设备
CN112351323A (zh) 一种显示设备及视频集锦文件的生成方法
US11997341B2 (en) Display apparatus and method for person recognition and presentation
CN113709566B (zh) 多媒体内容的播放方法、装置、设备以及计算机存储介质
CN113453057B (zh) 一种显示设备及播放进度控制方法
US20230300429A1 (en) Multimedia content sharing method and apparatus, device, and medium
CN112261470A (zh) 音频处理方法及装置
CN113066491A (zh) 显示设备及语音交互方法
CN109375460B (zh) 智能投影仪的控制方法及智能投影仪
CN114915836A (zh) 用于编辑音频的方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant