CN112825561A

CN112825561A - 字幕显示方法、系统、计算机设备及可读存储介质

Info

Publication number: CN112825561A
Application number: CN201911150781.1A
Authority: CN
Inventors: 谷浩; 管华新; 戴之晨; 郭明; 查普余
Original assignee: Shanghai Hode Information Technology Co Ltd
Current assignee: Shanghai Hode Information Technology Co Ltd
Priority date: 2019-11-21
Filing date: 2019-11-21
Publication date: 2021-05-21
Also published as: US11363344B2; US20210160582A1

Abstract

本发明公开了一种字幕显示方法、系统、计算机设备及可读存储介质，该方法包括：从视频信息中获取目标音频信息；将所述目标音频信息转换成文字信息，并将所述文字信息翻译成不同的语言；将所述文字信息及翻译后的文字信息生成多种不同语言的字幕并对所述字幕进行敏感词的处理；当接收用户发送的字幕显示操作指令时，响应所述字幕显示操作指令，并显示所述字幕显示操作指令对应的字幕。本发明能够极大的提高外挂字幕显示的效率和速度，降低字幕中存在敏感词汇的风险，改善用户体验。

Description

字幕显示方法、系统、计算机设备及可读存储介质

技术领域

本发明涉及视频技术领域，具体涉及一种字幕显示方法、系统、计算机设备及可读存储介质。

背景技术

随着视频显示技术的发展，人们对视频的字幕显示要求也越来越高。例如，同一视频根据用户需求可以显示多种语言。现有的做法是采用外挂字幕的形式，通过用户将翻译好的字幕并对该字幕进行编译成对应的形式，然后将编译好的字幕上传，后台对该编译好的字幕进行审核，当审核通过后再将该编译好的字幕保存于对应的视频的外挂字幕栏。当用户需要显示该外挂字幕时，通过点击该外挂字幕标签，即可将该外挂字幕显示于视频界面。现有技术的人工翻译字幕的方式，极大的降低了外挂字幕显示的效率和速度，影响了用户体验。

发明内容

本发明的目的在于提供一种字幕显示方法、系统、计算机设备及可读存储介质，用于解决现有技术中通过人工翻译字幕的方式，极大降低外挂字幕显示的效率和速度，影响用户体验的缺陷。

根据本发明的一个方面，提供了一种字幕显示方法，该方法包括如下步骤：

从视频信息中获取目标音频信息；

将所述目标音频信息转换成第一文字信息，并将所述第一文字信息翻译成至少一种第二文字信息，其中，所述第一文字信息与所述至少一种第二文字信息为不同的语言表示形式；

根据所述第一文字信息与所述至少一种第二文字信息生成对应的第一字幕与至少一种第二字幕；

对所述第一字幕与所述至少一种第二字幕进行敏感词处理，以得到与所述第一字幕对应的第一目标字幕和与所述至少一种第二字幕对应的至少一种第二目标字幕并保存；

响应用户发送的字幕显示操作指令，并显示所述字幕显示操作指令对应的目标字幕，其中，所述目标字幕为所述第一目标字幕与所述至少一种第二目标字幕中的一种或多种。

可选的，所述对所述第一字幕与所述至少一种第二字幕进行敏感词处理以得到第一目标字幕和至少一种第二目标字幕并保存，包括：

将预设的敏感词汇表中的多个预设词语与所述第一字幕和所述至少一种第二字幕中多个词语进行匹配，以从所述第一字幕和所述至少一种第二字幕中获取目标敏感词语；

将所述目标敏感词语进行处理以得到所述第一目标字幕和所述至少一种第二目标字幕；

将所述第一目标字幕和所述至少一种第二目标字幕保存于对应的语言表示形式字幕列表中。

可选的，所述处理所述目标敏感词语的方法至少包括：将预设字符替代所述目标敏感词语或将所述敏感词语删除。

可选的，所述从视频信息中获取目标音频信息，包括：

将所述视频信息进行解码以获取解码结果；

从所述解码结果中提取所述目标音频信息。

可选的，所述解码结果至少包括音频信息，所述音频信息包括噪音和所述目标音频信息，所述从所述解码结果中提取所述目标音频信息，包括：

将所述音频信息进行降噪处理，以获取所述目标音频信息。

可选的，所述将所述目标音频信息转换成第一文字信息，并将所述第一文字信息翻译成至少一种第二文字信息，包括：

识别所述目标音频信息的语言表示形式为所述第一语言表示形式；

将所述目标音频信息转换成所述第一语言表示形式的所述第一文字信息；

将所述第一文字信息翻译成所述其他语言表示形式的第二文字信息。

可选地，所述响应用户发送的字幕显示操作指令，并显示所述字幕显示操作指令对应的目标字幕，包括：

识别所述字幕显示操作指令中的目标语言表示形式；

根据所述目标语言表示形式，将所述目标语言表示形式字幕列表中的目标字幕显示。

为了实现上述目的，本发明还提供一种字幕显示系统，该系统具体包括以下组成部分：

获取模块，用于从视频信息中获取目标音频信息；

转换模块，用于将所述目标音频信息转换成第一文字信息，并将所述第一文字信息翻译成至少一种第二文字信息，其中，所述第一文字信息与所述至少一种第二文字信息为不同的语言表示形式；

生成模块，用于根据所述第一文字信息与所述至少一种第二文字信息生成对应的第一字幕与至少一种第二字幕；

处理模块，用于对所述第一字幕与所述至少一种第二字幕进行敏感词处理，以得到与所述第一字幕对应的第一目标字幕和与所述至少一种第二字幕对应的至少一种第二目标字幕并保存；

显示模块，用于响应用户发送的字幕显示操作指令，并显示所述字幕显示操作指令对应的目标字幕，其中，所述目标字幕为所述第一目标字幕与所述至少一种第二目标字幕中的一种或多种。

为了实现上述目的，本发明还提供一种计算机设备，该计算机设备具体包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述介绍的字幕显示方法的步骤。

为了实现上述目的，本发明还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述介绍的字幕显示方法的步骤。

本发明提供的字幕显示方法、系统、计算机设备及可读存储介质，通过从视频信息中提取音频信息，将音频信息进行语音识别以转换成文字信息，将该文字信息翻译成多种语言的文字信息，对该文字信息及翻译后的文字信息进行敏感词汇过滤并保存，当用户点击字幕显示的语言时，将该语言对应的文字信息显示，从而达到提高外挂字幕显示的效率和速度，降低字幕中存在敏感词汇的风险，改善用户体验的效果。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为本公开实施例提供的字幕显示方法的一种可选的应用环境图；

图2为实施例一提供的字幕显示方法的一种可选的流程示意图；

图3为所述图2中步骤S100的一种可选的具体流程示意图；

图4为所述图2中步骤S102的一种可选的具体流程示意图；

图5为所述图2中步骤S106的一种可选的具体流程示意图；

图6为所述图2中步骤S108的一种可选的具体流程示意图；

图7为实施例二提供的字幕显示系统的一种可选的程序模块示意图；

图8为实施例三提供的计算机设备的一种可选的硬件架构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是字幕显示方法的一种可选的应用环境图。在视频显示界面中，当用户开启原语言字幕并点亮中文字幕时，按照预设的形式显示该视频用户上传时的语言文字字幕和中文字幕。例如：中文字幕在原语言字幕之上，且所述中文字幕与所述原语言字幕均处于视频的下方。

实施例一

下面结合附图对本发明提供的字幕显示方法进行说明。

图2为本发明字幕显示方法的一种可选的流程示意图，可以理解，本方法实施例中的流程图不用于对执行步骤的顺序进行限定，下面以计算机设备为执行主体进行示例性描述。所述计算机设备可以是移动电话、平板个人计算机(tablet personal computer)、膝上型计算机(laptop computer)、服务器等具有数据传输功能的设备。

如图2所示，该方法具体包括以下步骤S100～S108。

步骤S100：从视频信息中获取目标音频信息。

示例性地，当接收到用户上传的视频信息时，获取该视频信息，并从所述视频信息中提取低噪音的目标音频信息。

在本实施例中，从视频信息提取所述目标音频信息，当然在其他实施例中，也可以采用其他音频提取技术从视频信息提取所述目标音频信息，在此不作限定。

步骤S102：将所述目标音频信息转换成第一文字信息，并将所述第一文字信息翻译成至少一种第二文字信息，其中，所述第一文字信息与所述至少一种第二文字信息为不同的语言表示形式。

示例性地，通过语音识别技术将从视频信息中提取出的目标音频信息转换成第一文字信息，并将所述第一文字信息翻译成多种语言。例如：将韩语的文字信息翻译成英语、日语等多种表示形式。

步骤S104：根据所述第一文字信息与所述至少一种第二文字信息生成对应的第一字幕与至少一种第二字幕。

示例性地，对所述第一文字信息与所述至少一种第二文字信息进行加工，并根据加工结果生成对应的第一字幕与至少一种第二字幕。例如：将韩语的文字信息翻译成英语和日语的文字信息，然后，对韩语的文字信息、翻译出的英语的文字信息和日语的文字信息这三个语种文字信息的字体、颜色、大小、显示位置与视频播放时的显示时间进行加工，以分别确定这三个语种文字信息显示时的字体、颜色、大小、显示位置和显示时间，以便视频播放时根据字体、颜色、大小、显示位置和显示时间等显示效果的不同区分不同语种的文字信息，同时为用户带来更好的观看体验。最后，根据不同的显示效果生成对应的字幕，令字幕在满足用户字幕观看需求，进行字幕区分的同时，不过多遮挡视频。

当然，为了能够更好的展示字幕的显示效果，所述字幕显示方法还可以根据视频播放时显示字幕种类的多少，自动调节字幕的行间距，以提高字幕的显示效果，同时为用户带来更好的观看体验。例如：当仅显示一种语言字幕时，行间距为d1；当显示两种语言字幕时，行间距为d2；当显示三种语言字幕时，行间距为d3，其中，d1>d2>d3。

在示例性的实施例中，当字幕生成后，将所述字幕添加上对应的时间戳，当视频播放时，监测视频播放的时间戳，当视频的时间戳与所述字幕的时间戳一致时，则显示所述字幕，以保持字幕与视频的同步。

需要说明的是，根据视频播放过程中的音频的长短，确定每句字幕的显示时长。当在视频播放的过程中，用户点击显示其他语言的字幕时，则监测视频播放时的时间戳，并将所述时间戳与字幕列表中的时间戳和字幕显示时长进行比较，根据比较结果确定需要显示的字幕和字幕的显示时长。例如：当前视频播放仅显示中文形式的字幕，字幕列表中保存有显示英文语言形式的字幕1的时间戳为t1，且所述英文语言形式的字幕1显示时长t2，当在视频播放至t3时，其中t1<t3<t1+t2，用户点击以英文语言形式显示字幕，则显示所述英文语言形式的字幕1，且显示时长t＝t1+t2-t3。通过控制字幕的显示时长，以进一步的保证字幕与视频的精准同步。

步骤S106：对所述第一字幕与所述至少一种第二字幕进行敏感词处理，以得到与所述第一字幕对应的第一目标字幕和与所述至少一种第二字幕对应的至少一种第二目标字幕并保存。所述第一目标字幕为所述第一字幕经过敏感词处理后得到的字幕，所述第二目标字幕为所述第二字幕经过敏感词处理后得到的字幕。

步骤S108：响应用户发送的字幕显示操作指令，并显示所述字幕显示操作指令对应的目标字幕，其中，所述目标字幕为所述第一目标字幕与所述至少一种第二目标字幕中的一种或多种。

示例性地，请参阅图1，当用户仅开启原语言字幕时，则接收所述用户发送的仅开启原语言字幕的指令，然后根据所述指令将原语言字幕显示。当原语言字幕不为中文字幕，且用户开启原语言字幕并点亮中文字幕时，则接收所述用户发送的开启原语言字幕和点亮中文字幕的指令，然后根据所述指令将原语言字幕和中文字幕显示。

在示例性的实施例中，如图3所示，所述步骤S100可以包括步骤S200～S202。

步骤S200：将所述视频信息进行解码以获取解码结果。

示例性地，由于获取到的视频信息有经过编码处理，故需要先将所述视频信息进行解码以获取解码结果。

步骤S202：从所述解码结果中提取所述目标音频信息。

示例性地，当获取的视频信息中噪音超过一定的阈值时，在获取解码结果之后，从所述解码结果中获取具有噪音的音频信息，并将所述音频信息进行降噪处理，以获取所述目标音频信息。

在示例性的实施例中，如图4所示，所述步骤S102可以包括步骤S300～S304。

步骤S300：识别所述目标音频信息的语言表示形式为所述第一语言表示形式。

示例性地，若从视频信息中提取的目标音频为韩语，则识别所述目标音频信息的语言表示形式为韩语表示形式。需要说明的是，从视频信息中提取的目标音频信息的语言表示形式为图1中的原语言字幕所对应的语言表示形式。

步骤S302：将所述目标音频信息转换成所述第一语言表示形式的所述第一文字信息。

示例性地，请参阅图1，通过语言识别技术，将韩语语言的音频信息转换成韩语语言表示的文字信息。

步骤S304：将所述第一文字信息翻译成所述其他语言表示形式的第二文字信息。

示例性地，将韩语语言表示的文字信息翻译成中文表示的文字信息。通过本发明实施例，可以快速的将音频信息中的文字信息翻译成其他语言的文字信息。

在示例性的实施例中，如图5所示，所述步骤S106可以包括步骤S400～S404。

步骤S400：将预设的敏感词汇表中的多个预设词语与所述第一字幕和所述至少一种第二字幕中多个词语进行匹配，以从所述第一字幕和所述至少一种第二字幕中获取目标敏感词语。

示例性地，将韩语字幕与中文字幕中的词语与数据库中存储的敏感词汇表中的多个预设敏感词语进行匹配，若匹配成功，则判断所述韩语字幕与中文字幕中的词语为敏感词语，并获取所述敏感词语。当然，在将韩语字幕和中文字幕中的词语与数据库中存储的敏感词汇表中的多个预设敏感词语进行匹配的过程中，可以将所述韩语字幕与中文字幕进行语义识别，然后根据语义识别结果，从字幕中提取名词、动词、形容词等，以完成字幕的分词处理，并根据分词处理结果获取多个词语。需要说明的是，为了保证分词处理结果的准确性，可以将分词处理结果后获得的多个词语与预设语义词库中的词语进行匹配，以根据匹配结果确定是否需要对分词处理结果进行调整。韩语字幕表示韩语语言表示的文字信息对应的字幕，中文字幕表示中文表示的文字信息中对应的字幕。

步骤S402：将所述目标敏感词语进行处理以得到所述第一目标字幕和所述至少一种第二目标字幕。

示例性地，当获取到所述目标敏感词语时，将所述目标敏感词语进行处理，例如：将所述目标敏感词语模糊处理，或者将预设字符替代所述目标敏感词语，或者将所述敏感词语删除。将所述第一字幕和所述至少一种第二字幕中的目标敏感词语处理之后，得到第一目标字幕和至少一种第二目标字幕。

步骤S404：将所述第一目标字幕和所述至少一种第二目标字幕保存于对应的语言表示形式字幕列表中。

示例性地，将韩语语言的字幕保存于韩语表示形式字幕列表中，将中文字幕保存于中文表示形式字幕列表中。通过本发明实施例，可以快速的识别字幕中的敏感词，并对该敏感词进行处理，极大的提升了用户的观看体验。

在示例性的实施例中，如图6所示，所述步骤S108可以包括步骤S500～S502。

步骤S500：识别所述字幕显示操作指令中的目标语言表示形式。

步骤S502：根据所述目标语言表示形式，将所述目标语言表示形式字幕列表中的目标字幕显示。

示例性地，请继续参阅图1，当用户开启原语言字幕并点亮中文字幕时，接收所述原语言字幕和中文字幕指令，并识别所述字幕显示操作指令为韩语语言和中文语言表示形式，并将韩语语言表示形式字幕列表中的韩语语言字幕和中文表示形式字幕列表中的中文字幕显示。

实施例二

基于上述实施例一中提供的字幕显示方法，本实施例中提供一种字幕显示系统，所述字幕显示系统可以应用于计算机设备中。具体地，图7示出了该字幕显示系统的可选的结构框图，该字幕显示系统被分割成一个或多个程序模块，一个或者多个程序模块被存储于存储介质中，并由一个或多个处理器所执行，以完成本发明。本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段，比程序本身更适合描述字幕显示系统在存储介质中的执行过程，以下描述将具体介绍本实施例各程序模块的功能。

如图7所示，字幕显示系统具体包括以下组成部分：

获取模块201，用于从视频信息中获取目标音频信息。

示例性地，当接收到用户上传的视频信息时，所述获取模块201获取该视频信息，并从所述视频信息中提取低噪音的目标音频信息。

在本实施例中，通过从视频信息提取所述目标音频信息，当然在其他实施例中，也可以采用其他音频提取技术从视频信息提取所述目标音频信息，在此不作限定。

转换模块202，用于将所述目标音频信息转换成第一文字信息，并将所述第一文字信息翻译成至少一种第二文字信息，其中，所述第一文字信息与所述至少一种第二文字信息为不同的语言表示形式。

示例性地，所述转换模块202通过语音识别技术将从视频信息中提取出的目标音频信息转换成第一文字信息，并将所述第一文字信息翻译成多种预设语种的语言。例如：将韩语的文字信息翻译成英语、日语等多种表示形式。

生成模块203，用于根据所述第一文字信息与所述至少一种第二文字信息生成对应的第一字幕与至少一种第二字幕。

示例性地，所述生成模块203对所述第一文字信息与所述至少一种第二文字信息进行加工，并根据加工结果生成对应的第一字幕与至少一种第二字幕。例如：将韩语的文字信息翻译成英语和日语的文字信息，然后，对韩语的文字信息、翻译出的英语的文字信息和日语的文字信息这三个语种文字信息的字体、颜色、大小、显示位置与视频播放时的显示时间进行加工，以分别确定这三个语种文字信息显示时的字体、颜色、大小、显示位置和显示时间，以便视频播放时根据字体、颜色、大小、显示位置和显示时间等显示效果的不同区分不同语种的文字信息，同时为用户带来更好的观看体验。最后，根据不同的显示效果生成对应的字幕，令字幕在满足用户字幕观看需求，进行字幕区分的同时，不过多遮挡视频。

处理模块204，用于对所述第一字幕与所述至少一种第二字幕进行敏感词处理，以得到与所述第一字幕对应的第一目标字幕和与所述至少一种第二字幕对应的至少一种第二目标字幕并保存。所述第一目标字幕为所述第一字幕经过敏感词处理后得到的字幕，所述第二目标字幕为所述第二字幕经过敏感词处理后得到的字幕。

显示模块205，用于响应用户发送的字幕显示操作指令，并显示所述字幕显示操作指令对应的目标字幕，其中，所述目标字幕为所述第一目标字幕与所述至少一种第二目标字幕中的一种或多种。

示例性地，请参阅图1，当用户仅开启原语言字幕时，则接收所述用户发送的仅开启原语言字幕的指令，然后，所述显示模块205根据所述指令将原语言字幕显示。当原语言字幕不为中文字幕，且用户开启原语言字幕并点亮中文字幕时，则接收所述用户发送的开启原语言字幕和点亮中文字幕的指令，然后根据所述指令将原语言字幕和中文字幕显示。

在示例性的实施例中，所述获取模块201，还用于将所述视频信息进行解码以获取解码结果，并从所述解码结果中提取所述目标音频信息。

示例性地，由于获取到的视频信息有经过编码处理，故需要先将所述视频信息进行解码以获取解码结果。当获取的视频信息中噪音超过一定的阈值时，在获取解码结果之后，从所述解码结果中获取具有噪音的音频信息，并将所述音频信息进行降噪处理，以获取所述目标音频信息。

在示例性的实施例中，所述转换模块102还包括第一识别单元、转换单元和翻译单元。

所述第一识别单元，用于识别所述目标音频信息的语言表示形式为所述第一语言表示形式。

示例性地，若从视频信息中提取的目标音频为韩语，则所述第一识别单元识别所述目标音频信息的语言表示形式为韩语表示形式。需要说明的是，从视频信息中提取的目标音频信息的语言表示形式为图1中的原语言字幕所对应的语言表示形式。

所述转换单元，用于将所述目标音频信息转换成所述第一语言表示形式的所述第一文字信息。

所述翻译单元，用于将所述第一文字信息翻译成所述其他语言表示形式的第二文字信息。

在示例性的实施例中，所述处理模块106还包括获取单元、处理单元和保存单元。

所述获取单元，用于将预设的敏感词汇表中的多个预设词语与所述第一字幕和所述至少一种第二字幕中多个词语进行匹配，以从所述第一字幕和所述至少一种第二字幕中获取目标敏感词语。

示例性地，将韩语字幕与中文字幕中的词语与数据库中存储的敏感词汇表中的多个预设敏感词语进行匹配，若匹配成功，则判断所述韩语字幕与中文字幕中的词语为敏感词语，所述获取单元获取所述敏感词语。当然，在将韩语字幕与中文字幕中的词语与敏感词汇表中的多个预设敏感词语进行匹配的过程中，可以将所述韩语字幕与中文字幕中进行语义识别，然后根据语义识别结果，从字幕中提取名词、动词、形容词等，以完成字幕的分词处理，并根据分词处理结果获取多个词语。需要说明的是，为了保证分词处理结果的准确性，可以将分词处理结果后获得的多个词语与预设语义词库中的词语进行匹配，以根据匹配结果确定是否需要对分词处理结果进行调整。韩语字幕表示韩语语言表示的文字信息对应的字幕，中文字幕表示中文表示的文字信息中对应的字幕。

所述处理单元，用于将所述目标敏感词语进行处理以得到所述第一目标字幕和所述至少一种第二目标字幕。

示例性地，当获取到所述目标敏感词语时，所述处理单元将所述目标敏感词语进行处理，例如：将所述目标敏感词语模糊处理，或者将预设字符替代所述目标敏感词语，或者将所述敏感词语删除。所述处理单元将所述第一字幕和所述至少一种第二字幕中的目标敏感词语处理之后，得到第一目标字幕和至少一种第二目标字幕。

所述保存单元，用于将所述第一目标字幕和所述至少一种第二目标字幕保存于对应的语言表示形式字幕列表中。

示例性地，所述保存单元将韩语语言的字幕保存于韩语表示形式字幕列表中，将中文字幕保存于中文表示形式字幕列表中。通过本发明实施例，可以快速的识别字幕中的敏感词，并对该敏感词进行处理，极大的提升了用户的观看体验。

在示例性的实施例中，所述显示模块205还包括第二识别单元和显示单元。

所述第二识别单元，用于识别所述字幕显示操作指令中的目标语言表示形式。

所述显示单元，用于根据所述目标语言表示形式，将所述目标语言表示形式字幕列表中的目标字幕显示。

示例性地，请继续参阅图1，当用户开启原语言字幕并点亮中文字幕时，接收所述原语言字幕和中文字幕指令，所述第二识别单元识别所述字幕显示操作指令为韩语语言和中文语言表示形式，然后，所述显示单元将韩语语言表示形式字幕列表中的韩语语言字幕和中文表示形式字幕列表中的中文字幕显示。

实施例三

本实施例还提供一种计算机设备，如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。如图8所示，本实施例的计算机设备30至少包括但不限于：可通过系统总线相互通信连接的存储器301、处理器302。需要指出的是，图8仅示出了具有组件301-302的计算机设备30，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

本实施例中，存储器301(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器301可以是计算机设备30的内部存储单元，例如该计算机设备30的硬盘或内存。在另一些实施例中，存储器301也可以是计算机设备30的外部存储设备，例如该计算机设备30上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，存储器301还可以既包括计算机设备30的内部存储单元也包括其外部存储设备。在本实施例中，存储器301通常用于存储安装于计算机设备30的操作系统和各类应用软件，例如实施例二的字幕显示系统的程序代码等。此外，存储器301还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器302在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器302通常用于控制计算机设备30的总体操作。

具体的，在本实施例中，处理器302用于执行处理器302中存储的字幕显示方法的程序，所述字幕显示方法的程序被执行时实现如下步骤：

从视频信息中获取目标音频信息；

上述方法步骤的具体实施例过程可参见实施例一，本实施例在此不再重复赘述。

实施例四

本实施例还提供一种计算机可读存储介质，如闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等，其上存储有计算机程序，所述计算机程序被处理器执行时实现如下方法步骤：

从视频信息中获取目标音频信息；

响应用户发送的字幕显示操作指令，并显示所述字幕显示操作指令对应的目标字幕显示，其中，所述目标字幕为所述第一目标字幕与所述至少一种第二目标字幕中的一种或多种。

本发明实施例提供的字幕显示方法、系统、计算机设备及可读存储介质，从视频信息中提取音频信息，将音频信息进行语音识别以转换成文字信息，将该文字信息翻译成多种语言的文字信息，对该文字信息及翻译后的文字信息进行敏感词汇过滤并保存，当用户点击字幕显示的语言时，将该语言对应的文字信息显示。通过本发明实施例，极大的提高了外挂字幕显示的效率和速度，降低了字幕中存在敏感词汇的风险，改善了用户体验的效果。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种字幕显示方法，其特征在于，所述方法包括：

从视频信息中获取目标音频信息；

2.如权利要求1所述的字幕显示方法，其特征在于，所述对所述第一字幕与所述至少一种第二字幕进行敏感词处理以得到第一目标字幕和至少一种第二目标字幕并保存，包括：

3.如权利要求2所述的字幕显示方法，其特征在于，所述处理所述目标敏感词语的方法至少包括：将预设字符替代所述目标敏感词语或将所述敏感词语删除。

4.如权利要求1所述的字幕显示方法，其特征在于，所述从视频信息中获取目标音频信息，包括：

将所述视频信息进行解码以获取解码结果；

从所述解码结果中提取所述目标音频信息。

5.如权利要求4所述的字幕显示方法，其特征在于，所述解码结果至少包括音频信息，所述音频信息包括噪音和所述目标音频信息，所述从所述解码结果中提取所述目标音频信息，包括：

将所述音频信息进行降噪处理，以获取所述目标音频信息。

6.如权利要求1所述的字幕显示方法，其特征在于，所述将所述目标音频信息转换成第一文字信息，并将所述第一文字信息翻译成至少一种第二文字信息，包括：

7.如权利要求2所述的字幕显示方法，其特征在于，所述响应用户发送的字幕显示操作指令，并显示所述字幕显示操作指令对应的目标字幕，包括：

识别所述字幕显示操作指令中的目标语言表示形式；

8.一种字幕显示系统，其特征在于，所述系统包括：

获取模块，用于从视频信息中获取目标音频信息；

处理模块，用于对所述第一字幕与所述至少一种第二字幕进行敏感词处理以得到与所述第一字幕对应的第一目标字幕和与所述至少一种第二字幕对应的至少一种第二目标字幕并保存；

9.一种计算机设备，所述计算机设备包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项的所述字幕显示方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项的所述字幕显示方法的步骤。