CN113573155A

CN113573155A - 语音弹幕实现方法、装置、智能设备及可读存储介质

Info

Publication number: CN113573155A
Application number: CN202110834260.9A
Authority: CN
Inventors: 张进平
Original assignee: Shenzhen Skyworth RGB Electronics Co Ltd
Current assignee: Shenzhen Skyworth RGB Electronics Co Ltd
Priority date: 2021-07-22
Filing date: 2021-07-22
Publication date: 2021-10-29

Abstract

本发明提出的一种语音弹幕实现方法、装置、智能设备及可读存储介质，所述语音弹幕实现方法的步骤包括：实时接收语音弹幕指令，根据所述语音弹幕指令开启弹幕输入框；接收目标语音信息，将所述目标语音信息转换为目标文本信息，并将所述目标文本信息显示在弹幕输入框内；获取弹幕格式设置信息，基于所述弹幕格式设置信息对所述弹幕输入框内的所述目标文本信息进行调整；将调整后的所述目标文本信息通过弹幕服务器进行发布显示。解决了电视机观影时，输入弹幕用时较长的问题，减少了用户输入弹幕的时间，进而提高了电视机观影的互动性。

Description

语音弹幕实现方法、装置、智能设备及可读存储介质

技术领域

本发明涉及智能设备技术领域，尤其涉及一种语音弹幕实现方法、装置、智能设备及可读存储介质。

背景技术

“影视剧弹幕文化”是一种新兴文化，具有即时性、参与性、观点性和娱乐性等特征。近年来，弹幕已成为观众表达对视频直播、网络剧和综艺节目看法的一种独特的文化实践方式。观众不仅将他们对节目、剧情和嘉宾的一些评价反映在弹幕中，也将他们对时代和社会的某种情绪借此表达出来，因此影视弹幕文化越来越受到观影人群的喜欢。

目前，电视机作为观看影视的主要载体，用户在观看电视节目时，若想要参与弹幕互动，需要通过遥控器选择字母进行打字输入的方式，对用户来说用时较长，影响弹幕参与热情。

发明内容

本发明的主要目的在于提供一种语音弹幕实现方法、装置、智能设备及计算机可读存储介质，旨在解决电视机观影时，输入弹幕用时较长的问题。

为实现上述目的，本发明提供一种语音弹幕实现方法，其特征在于，所述语音弹幕实现方法的步骤包括：

实时接收语音弹幕指令，根据所述语音弹幕指令开启弹幕输入框；

接收目标语音信息，将所述目标语音信息转换为目标文本信息，并将所述目标文本信息显示在弹幕输入框内；

获取弹幕格式设置信息，基于所述弹幕格式设置信息对所述弹幕输入框内的所述目标文本信息进行调整；

将调整后的所述目标文本信息通过弹幕服务器进行发布显示。

可选地，所述将所述语音信息转换为目标文本信息的步骤，包括：

将所述语音信息解析为初始文本信息；

识别所述初始文本信息是否包含预设的过滤关键词；

若不包含预设的过滤关键词，则将所述初始文本信息作为目标文本信息；

若包含预设的过滤关键词，则对包含预设的过滤关键词的本文内容进行过滤，将过滤后的初始文本信息作为目标文本信息。

可选地，所述获取弹幕格式设置信息的步骤，包括：

通过弹幕服务器获取当前播放视频的弹幕信息；

通过所述弹幕信息获取所述当前播放视频的人物角色信息；

接收弹幕格式设置指令，基于所述人物角色信息确认弹幕格式设置界面，并在所述弹幕格式设置界面中获取弹幕格式设置信息。

可选地，所述弹幕样格式设置信息包括：弹幕文本字号、弹幕文本颜色、弹幕文本透明度，弹幕滚动速度、弹幕显示区域、弹幕角色信息。

可选地，所述将调整后的所述目标文本信息通过弹幕服务器进行发布显示的步骤之前，还包括：

若接收到清空弹幕指令，则基于所述清空弹幕指令清空所述弹幕输入框。

可选地，所述将调整后的所述目标文本信息通过弹幕服务器进行发布显示的步骤之后，还包括：

检测是否接收到关闭弹幕窗口指令；

若未接收到关闭弹幕窗口指令，则检测预设时间内是否接收到输入的弹幕信息；

若没有弹幕信息输入，则关闭所述弹幕输入框。

可选地，所述接收目标语音信息的步骤，包括：

采集预设时长内的初始语音信息，若所述初始语音信息存在多条，则确定采集到各所述初始语音信息的采集时间；

将各所述采集时间和预设语音弹幕接收时间进行匹配；

若各所述采集时间中存在和预设语音弹幕接收时间匹配的匹配采集时间，则将所述匹配采集时间对应的初始语音信息作为目标语音信息。

此外，为实现上述目的，本发明还提供一种语音弹幕实现装置，包括：

语音弹幕开启控制模块，用于实时接收语音弹幕指令，根据所述语音弹幕指令开启弹幕输入框；

语音接收模块，用于接收目标语音信息，将所述目标语音信息转换为目标文本信息，并将所述目标文本信息显示在弹幕输入框内；

弹幕格式设置模块，用于获取弹幕格式设置信息，基于所述弹幕格式设置信息对所述弹幕输入框内的所述目标文本信息进行调整；

弹幕发送控制模块，用于将调整后的所述目标文本信息通过弹幕服务器进行发布显示。

此外，为实现上述目的，本发明还提供一种智能设备，所述智能设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音弹幕实现程序，所述语音弹幕实现程序被所述处理器执行时实现如上述的语音弹幕实现方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有语音弹幕实现程序，所述语音弹幕实现程序被处理器执行时实现如上述的语音弹幕实现方法的步骤。

本发明通过实时接收语音弹幕指令，根据所述语音弹幕指令开启弹幕输入框；接收目标语音信息，将所述目标语音信息转换为目标文本信息，并将所述目标文本信息显示在弹幕输入框内；获取弹幕格式设置信息，基于所述弹幕格式设置信息对所述弹幕输入框内的所述目标文本信息进行调整；将调整后的所述目标文本信息通过弹幕服务器进行发布显示。实现了通过语音采集设备接收用户语音信息，再将语音信息转换为文本信息进行弹幕显示，使用户观影时可以通过与电视机连接的语音采集设备发送语音的方式发表观影评论，从而减少了弹幕输入时间，解决了电视机观影时，输入弹幕用时较长的问题，进而提高了电视机观影的互动性。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的终端\装置结构示意图；

图2为本发明语音弹幕实现方法第一实施例的流程示意图；

图3为本发明语音弹幕实现方法实施例弹幕输入框的示意图；

图4为本发明语音弹幕实现方法实施例弹幕设置界面示意图；

图5为本发明语音弹幕实现方法实施例弹幕样式设置界面示意图；

图6为本发明语音弹幕实现方法流程示意图；

图7为本发明语音弹幕实现装置的装置单元示意图。

本发明目的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

目前，电视机等观看影视的载体没有外接键盘，有些观影载体虽然可以配置外接键盘，但对用户来说，观看电视节目时，通过键盘打字存在不便，该场景下，若想要参与弹幕互动，则通常需要通过遥控器选择字母进行打字输入的方式，这种方式对用户来说用时较长，很影响弹幕参与热情，容易造成喜好弹幕文化的用户通过电视机观影的需求变低。

本发明实施例的主要解决方案是：

本发明实施例通过语音采集设备接收用户语音信息，再将语音信息转换为文本信息进行弹幕显示，使用户观影时可以通过与电视机连接的语音采集设备发送语音的方式发表观影评论，从而减少了弹幕输入时间，解决了电视机观影时，输入弹幕用时较长的问题，提高了电视机观影的互动性，进而提高了电视机的用户粘性。

为了更好的理解上述技术方案，下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明实施例终端为智能设备。可以理解的，本实施例智能设备可以为但不限于下述设备的一种：电视机、平板电脑、智能手机、智能大屏设备、智能穿戴设备。

如图1所示，该终端可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、Wi-Fi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在终端设备移动到耳边时，关闭显示屏和/或背光。当然，终端设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及语音弹幕实现程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的语音弹幕实现程序，并执行以下操作：

参照图2，本发明提供一种语音弹幕实现方法，在语音弹幕实现方法的第一实施例中，语音弹幕实现方法包括以下步骤：

步骤S10，实时接收语音弹幕指令，根据所述语音弹幕指令开启弹幕输入框；

所述语音弹幕指令为开启通过语音输入弹幕功能的指令，该指令可以通过与电视机适配的遥控机进行发送，具体的，电机机端与遥控器端提前约定某一特定按键为开启通过语音输入弹幕功能的按键，用户触发该按键时，电机机端接收到该按键被触发的指令，控制开启通过语音输入弹幕功能，并在显示屏幕上显示弹幕输入框，同时落焦在弹幕输入框。其中，所述开启通过语音输入弹幕功能可以包括：控制语音接收模块开启以接收语音信息等。

可以理解的，所述接收语音弹幕指令的步骤之前，还可以包括：

判断是否为弹幕开启状态；

若否，则实时接收弹幕开启指令，根据所述弹幕开启指令开启弹幕功能。

弹幕状态默认为开启状态，控制器可以通过总弹幕服务器获取当前播放视频的所有弹幕信息，并将弹幕文字根据预设的弹幕文本字号、弹幕文本颜色、弹幕文本透明度，弹幕滚动速度在预设的弹幕显示区域进行显示。其中，所有弹幕信息包括：当前播放视频的名称、当前播放视频的人物角色，人物角色形象图、所有弹幕文字、所有弹幕文字的发送格式、弹幕文字发送时间对应的视频时间戳、弹幕发送端IP(Internet Protocol，网络协议)等等信息。

用户可以根据自己的观影习惯和喜好选择关闭弹幕，当电视机为弹幕关闭状态时，显示屏幕上不显示弹幕信息，若该状态下用户若想要发送弹幕可以有两种方式：第一种为通过触发遥控器端的弹幕开启按键，向电视机发送开启弹幕功能指令，再通过触发开启通过语音输入弹幕功能的按键，向电视机发送语音弹幕指令，电视机接收到语音弹幕指令，开启弹幕输入框，参照图3，为弹幕输入框的一种实现方式；第二种方式为用户直接触发控器端的开启通过语音输入弹幕功能的按键，向电视机发送语音弹幕指令，电视机接收到语音弹幕指令，将弹幕状态开启，并在显示屏上显示弹幕输入框，此方式可以满足满足用户即时发送弹幕的需求。

具体实现时，所述实时接收语音弹幕指令，根据所述语音弹幕指令开启弹幕输入框的步骤，还可以包括：

判断当前用户是否具备发送弹幕权限；

若是，则根据所述语音弹幕指令开启所述弹幕输入框。

可以理解的，有些家长出于限制小朋友的观影时间以及观影选择的考虑，可能会通过设置儿童模式等方式限制小朋友的观影权限，那么本实施例中也可以加入弹幕权限验证，当验证不通过时，不开启语音弹幕功能，当验证通过时再开启弹幕输入框。权限验证方式可以是和儿童模式进行绑定，也可以通过人脸识别，或者语音识别、账号密码等方式，在此不作限定。

在本实施例中，通过实时接收语音弹幕指令，使用户有弹幕灵感时可以即刻打开弹幕进行发送，不再限定于固定的先开启弹幕功能再开启语音功能的顺序，提高弹幕发送的即时性，提示用户体验感。

步骤S20，接收目标语音信息，将所述目标语音信息转换为目标文本信息，并将所述目标文本信息显示在弹幕输入框内；

通过语音接收模块接收到的用户发送的语音信息，将接收到的语音信息通过语音识别技术转换为文字信息，再识别转换后的文字信息中是否包含有敏感词汇，包含时需要将敏感词汇过滤掉，以得到目标文本信息，再基于用户保存的弹幕格式设置信息或者默认的弹幕格式设置信息将目标文本信息显示在弹幕输入框内，以便用户核对文本转换是否正确。

具体的，语音接收模块和用户端的语音采集模块可以进行通信，用户采集模块可以为具有语音功能的遥控器、录音笔、麦克风等，在此不做限定，通信方式可以为蓝牙通信、Wi-Fi无线通信等。

在本实施例中，通过将语音信息转换为文本信息，实现了通过语音的形式发送弹幕，提高了弹幕发送的便捷性，减少了弹幕输入时间。

步骤S30，获取弹幕格式设置信息，基于所述弹幕格式设置信息对所述弹幕输入框内的所述目标文本信息进行调整；

所述获取弹幕格式设置信息的步骤，可以包括两部分：一部分为获取弹幕显示信息，弹幕显示信息可以包括弹幕文本字号、弹幕文本透明度，弹幕滚动速度、弹幕显示区域等，另一部分为获取弹幕样式信息，弹幕样式信息可以包括弹幕角色信息、弹幕文本颜色等。

具体的，参照图4，本实施例提供一种获取弹幕显示信息的实现方式，在电视机端的在线影视的设置菜单上新增一个名为“弹幕设置”的设置项，该设置项内包括字号、速度、透明度和显示区域四个设置模块，均可以以滑块按钮的形式进行调节，如，弹幕文本字号区间可以为10～20；弹幕滚动速度区间可以为1～10，步进为1；弹幕文本透明度区间为20％～100％；弹幕显示区间为10％～80％，步进为10％。默认选项可以为字号16、速度8、透明度75％、显示区域20％。接收到用户端发送的设置指令时，显示该设置项界面，以供用户选择设置，并根据用户的设置指令获取到对应的弹幕显示信息。以用户仅设置弹幕文本字号为例，用户通过遥控器控制滑块按钮拖到10，则弹幕显示信息为字号10、速度8、透明度75％、显示区域20％。

本实施例还提供一种获取弹幕样式信息的实现方式，参照图5，在电视机端的在线影视的弹幕编辑菜单上设置弹幕编辑界面，该界面包括弹幕角色和弹幕颜色选项。弹幕角色为当前播放影片中的5个主要人物角色头像，弹幕颜色为从根据弹幕服务器获取的弹幕信息中使用频率最高的7种颜色。默认样式下，弹幕样式信息为无弹幕角色，白色弹幕文本。当接收到用户端发送的设置指令时，显示弹幕样式设置界面，若用户选择的是第二个弹幕角色选项，第一个弹幕颜色选项，则弹幕样式信息为第二个人物角色头像，第一种颜色。用户可以基于选项选择是否保存为默认选项，若保存，则下一次发送弹幕时，默认为以该样式信息发送弹幕，若不保存，则下一次发送弹幕时仍是默认样式。

基于所述弹幕格式设置信息对目标文本信息进行调整，调整后的样式显示在弹幕输入框内作为预显示，供用户确认是否符合预想的效果，以便做相应调整。

本实施例中，通过对弹幕格式进行设置，增强了弹幕的趣味性，增强用户粘性。

步骤S40，将调整后的所述目标文本信息通过弹幕服务器进行发布显示。

调整后的目标文本信息显示在弹幕输入框后，实时接收用户端的确认发送指令，确认发送指令可以为用户通过触发遥控器端约定的“确认发送”按钮进行发送的，也可以为用户通过语音的形式发送约定的语音信息，如“确认发送”。接收到确认发送指令后，则将调整后的所述目标文本信息以及对应的其他弹幕信息一并上传至弹幕服务器进行全网分发，弹幕信息同步至全网各平台影视播放器，并在当前电视机显示屏幕同步显示。

参照图6，为弹幕发布的完整的流程，在本实施例中，通过实时接收语音弹幕指令，根据所述语音弹幕指令开启弹幕输入框；接收目标语音信息，将所述目标语音信息转换为目标文本信息，并将所述目标文本信息显示在弹幕输入框内；获取弹幕格式设置信息，基于所述弹幕格式设置信息对所述弹幕输入框内的所述目标文本信息进行调整；将调整后的所述目标文本信息通过弹幕服务器进行发布显示。实现了通过语音采集设备接收用户语音信息，再将语音信息转换为文本信息进行弹幕显示，使用户观影时可以通过与电视机连接的语音采集设备发送语音的方式发表观影评论，从而减少了弹幕输入时间，解决了电视机观影时，输入弹幕用时较长的问题，进而提高了电视机观影的互动性。

进一步地，基于上述本发明的第一实施例，提出本发明语音弹幕实现方法的第二实施例，在本实施例中，上述实施例步骤S20，将所述语音信息转换为目标文本信息的步骤，包括：

步骤a，将所述语音信息解析为初始文本信息；

步骤b，识别所述初始文本信息是否包含预设的过滤关键词；

步骤c，若不包含预设的过滤关键词，则将所述初始文本信息作为目标文本信息；

步骤d，若包含预设的过滤关键词，则对包含预设的过滤关键词的本文内容进行过滤，将过滤后的初始文本信息作为目标文本信息。

所述预设的过滤关键词为敏感词汇，如过激的、不文明用语、涉及国家安全等不合符合规范的词汇。比如，初始文本信息为一个语句，该语句中识别出预设的过滤关键词，则将该词汇过滤掉，只在弹幕输入框中显示过滤后的文本信息。进一步的，还可以基于识别到过滤关键词显示提示框，提示用户网络发言需使用文明用语。

本实施例中，在文本转换时将不符合规范的用语过滤掉，维护了网络文明，并且，在用户输入语音信息时就不显示不符合规范的用语，避免了带有不符合规范的文本信息发送到弹幕服务器端，被网络视频供应商端过滤掉，不显示该弹幕文本，而使用户误认为是本智能设备的识别不良而降低体验感的误会发生。

进一步地，获取弹幕格式设置信息的步骤，包括：

步骤e，通过弹幕服务器获取当前播放视频的弹幕信息；

步骤f，通过所述弹幕信息获取所述当前播放视频的人物角色信息；

步骤g，接收弹幕格式设置指令，基于所述人物角色信息确认弹幕格式设置界面，并在所述弹幕格式设置界面中获取弹幕格式设置信息。

通过弹幕服务器获取的当前播放视频的所有弹幕信息中包括当前播放视频的人物角色、人物角色被选则的频率排名以及主要人物角色形象图等信息。所述当前播放视频的人物角色信息为根据弹幕样式设置界面中预设的人物数目确定的，如预设的人物数目为5，则获取人物角色被选则的频率排名由高到低的5个角色对应的人物角色形象图。

本实施例中，通过选择人物形象发送弹幕，加强了弹幕发送的趣味性以及所观看影片的参与感，进而加深用户用电视机观影的粘性。

具体地，弹幕样格式设置信息包括：弹幕文本字号、弹幕文本颜色、弹幕文本透明度，弹幕滚动速度、弹幕显示区域、弹幕角色信息。

用户可以根据喜好选择弹幕格式，加强了弹幕发送的趣味性。

进一步地，将调整后的所述目标文本信息通过弹幕服务器进行发布显示的步骤之前，还包括：

步骤h，若接收到清空弹幕指令，则基于所述清空弹幕指令清空所述弹幕输入框。

可以理解的，无论是在目标语音信息转换为目标文本信息显示时，还是基于所述弹幕格式设置信息对所述目标文本信息进行调整后，用户都可以在弹幕输入框内看到预显示的文本信息，若用户觉得不满意或者不想发布了，可以选择通过删除键逐字删除，或者将光标移动到需要删除的文字处有选择的删除，或者通过清空指令，对弹幕输入框内的文本信息进行一键删除。其中，清空指令可以是遥控器端约定的某一个按键，或者是如“清空弹幕”的语音信息。

本实施例可以方便用户对弹幕信息随时进行修改和清空，使弹幕编辑更方便，从而减少用户在弹幕输入和删除时的用时，节省用户时间，提升弹幕功能体验。

进一步地，将调整后的所述目标文本信息通过弹幕服务器进行发布显示的步骤之后，还包括：

步骤i，检测是否接收到关闭弹幕窗口指令；

步骤j，若未接收到关闭弹幕窗口指令，则检测预设时间内是否接收到输入的弹幕信息；

步骤k，若没有弹幕信息输入，则关闭所述弹幕输入框。

可以理解的，当弹幕发送完毕后，弹幕输入框内显示为空，但仍可以实时接收语音弹幕信息，因此不会立即将弹幕输入框关闭。该场景下，实时检测是否接收到用户端发送的关闭弹幕窗口指令，如果接收到了，那么立即关闭弹幕输入框，如果没有接收到，则需要判断有没有新的弹幕信息输入，如果预设时间内，既没有收到关闭弹幕窗口指令也没有收到新的弹幕信息输入，则自动关闭弹幕输入框。

所述预设时间的设定，可以先获取用户以往的弹幕发布信息，再根据用户的弹幕发布信息获取用户发布弹幕的习惯，根据用户发布弹幕的习惯进行设定。例如，用户经常在发布一条弹幕后5秒钟内再次发送弹幕，则预设弹幕时间可以设定为5秒钟。

本实施例中，通过获取用户的弹幕发布习惯，对弹幕关闭时间灵活设定，提高了用户发布弹幕的体验感。

进一步地，接收目标语音信息的步骤的细化，包括：

步骤m，采集预设时长内的初始语音信息，若所述初始语音信息存在多条，则确定采集到各所述初始语音信息的采集时间；

步骤n，将各所述采集时间和预设语音弹幕接收时间进行匹配；

步骤x，若各所述采集时间中存在和预设语音弹幕接收时间匹配的匹配采集时间，则将所述匹配采集时间对应的初始语音信息作为目标语音信息。

在本实施例中，当语音弹幕开启时，与智能设备连接的语音采集设备均可以输入语音信息，如，用户可以通过具有语音功能的遥控器、录音笔、麦克风中的一种或几种方式发送初始语音信息。实际观影时，可以几个用户都备有一个语音采集设备，比如，A用户备有遥控器，B用户备有麦克风。当语音输入弹幕功能开启时，当A用户想发送弹幕时，通过遥控器即可发送初始语音信息，B用户想发送弹幕时，B用户使用麦克风输入并发送初始语音信息。

若接收语音弹幕指令后，收到不止一条初始语音信息，则需要确定每条初始语音信息的采集时间，将每条初始语音信息的接收时间进行排序，将语音识别模块开启后，排序在第一的接收时间对应的初始语音信息作为目标语音信息。其中，所述预设语音弹幕接收时间可以为语音识别模块开启后第一条初始语音信息的接收时间。

在本实施例中，不同的观影人员可以通过不同的设备发送语音弹幕信息，从而不限定为由一个输入设备进行弹幕输入，提高了多用户观影时发送弹幕的便捷性。

此外，参照图7，本发明实施例还提供一种语音弹幕实现装置，包括：

语音弹幕开启控制模块A10，用于实时接收语音弹幕指令，根据所述语音弹幕指令开启弹幕输入框；

语音接收模块A20，用于接收目标语音信息，将所述目标语音信息转换为目标文本信息，并将所述目标文本信息显示在弹幕输入框内；

弹幕格式设置模块A30，用于获取弹幕格式设置信息，基于所述弹幕格式设置信息对所述弹幕输入框内的所述目标文本信息进行调整；

弹幕发送控制模块A40，用于将调整后的所述目标文本信息通过弹幕服务器进行发布显示。

可选地，语音接收模块A20，用于：

将所述语音信息解析为初始文本信息；

识别所述初始文本信息是否包含预设的过滤关键词；

可选地，弹幕格式设置模块A30，用于：

获取当前播放视频的弹幕信息；

通过所述弹幕信息获取所述当前播放视频的人物角色信息；

基于所述人物角色信息确认弹幕格式设置界面，并在所述弹幕格式设置界面中获取弹幕格式设置信息。

可选的，弹幕发送控制模块A40，用于：

检测是否接收到关闭弹幕窗口指令；

若没有弹幕信息输入，则关闭所述弹幕输入框。

可选的，语音接收模块A20，用于：

将各所述采集时间和预设语音弹幕接收时间进行匹配；

其中，语音弹幕实现装置的各个功能模块实现的步骤可参照本发明语音弹幕实现方法的各个实施例，此处不再赘述。

此外，本发明还提供一种智能设备，所述智能设备包括：存储器、处理器及存储在所述存储器上的语音弹幕实现程序，所述处理器用于执行所述语音弹幕实现程序，以实现上述语音弹幕实现方法各实施例的步骤。

此外，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者一个以上程序，所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述语音弹幕实现方法各实施例的步骤。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种语音弹幕实现方法，其特征在于，所述语音弹幕实现方法的步骤包括：

2.根据权利要求1所述的语音弹幕实现方法，其特征在于，所述将所述语音信息转换为目标文本信息的步骤，包括：

将所述语音信息解析为初始文本信息；

识别所述初始文本信息是否包含预设的过滤关键词；

3.根据权利要求1所述的语音弹幕实现方法，其特征在于，所述获取弹幕格式设置信息的步骤，包括：

获取当前播放视频的弹幕信息；

通过所述弹幕信息获取所述当前播放视频的人物角色信息；

4.根据权利要求1所述的语音弹幕实现方法，其特征在于，所述弹幕样格式设置信息包括：弹幕文本字号、弹幕文本颜色、弹幕文本透明度，弹幕滚动速度、弹幕显示区域、弹幕角色信息。

5.根据权利要求1所述的语音弹幕实现方法，其特征在于，所述将调整后的所述目标文本信息通过弹幕服务器进行发布显示的步骤之前，还包括：

6.根据权利要求1所述的语音弹幕实现方法，其特征在于，所述将调整后的所述目标文本信息通过弹幕服务器进行发布显示的步骤之后，还包括：

检测是否接收到关闭弹幕窗口指令；

若没有弹幕信息输入，则关闭所述弹幕输入框。

7.根据权利要求1所述的语音弹幕实现方法，其特征在于，所述接收目标语音信息的步骤，包括：

将各所述采集时间和预设语音弹幕接收时间进行匹配；

8.一种语音弹幕实现装置，其特征在于，所述装置包括：

9.一种智能设备，其特征在于，所述智能设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音弹幕实现程序，所述语音弹幕实现程序被所述处理器执行时实现如权利要求1～7中任一项所述的语音弹幕实现方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有语音弹幕实现程序，所述语音弹幕实现程序被处理器执行时实现如权利要求1～7中任一项所述的语音弹幕实现方法的步骤。