WO2021092733A1 - 字幕显示方法、装置、电子设备和存储介质 - Google Patents

字幕显示方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
WO2021092733A1
WO2021092733A1 PCT/CN2019/117242 CN2019117242W WO2021092733A1 WO 2021092733 A1 WO2021092733 A1 WO 2021092733A1 CN 2019117242 W CN2019117242 W CN 2019117242W WO 2021092733 A1 WO2021092733 A1 WO 2021092733A1
Authority
WO
WIPO (PCT)
Prior art keywords
language
text
subtitle
media stream
playback progress
Prior art date
Application number
PCT/CN2019/117242
Other languages
English (en)
French (fr)
Inventor
郝杰
Original Assignee
深圳市欢太科技有限公司
Oppo广东移动通信有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳市欢太科技有限公司, Oppo广东移动通信有限公司 filed Critical 深圳市欢太科技有限公司
Priority to PCT/CN2019/117242 priority Critical patent/WO2021092733A1/zh
Priority to CN201980100976.7A priority patent/CN114503546A/zh
Publication of WO2021092733A1 publication Critical patent/WO2021092733A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例公开了一种字幕显示方法、装置、电子设备和存储介质。其中,方法包括:确定媒体流的当前播放进度;确定与当前播放进度对应的至少一个语种的字幕文本;所述至少一个语种中的每个语种对应的字幕文本包括第一文本及第二文本;所述第一文本为所述媒体流在当前播放进度对应的字幕;所述第二文本为以下至少一个:所述媒体流在上一播放进度对应的字幕和所述媒体流在下一播放进度对应的字幕;在输出所述媒体流在当前播放进度上的播放内容的同时,将确定出的所述至少一个语种的字幕文本进行显示。

Description

字幕显示方法、装置、电子设备和存储介质 技术领域
本申请涉及计算机技术,具体涉及一种字幕显示方法、装置、电子设备和存储介质。
背景技术
在跨语种的演讲场合或会议场合中,会以字幕的形式将发言者发言内容的原文和译文显示在与会者使用的屏幕上。相关技术中,字幕的显示方式不便于与会人员更好地理解发言内容,导致与会者之间的信息交流出现阻碍。
发明内容
为解决相关技术问题,本申请实施例提供了一种字幕显示方法、装置、电子设备和存储介质。
本申请实施例提供了一种字幕显示方法,包括:
确定媒体流的当前播放进度;
确定与当前播放进度对应的至少一个语种的字幕文本;所述至少一个语种中的每个语种对应的字幕文本包括第一文本及第二文本;所述第一文本为所述媒体流在当前播放进度对应的字幕;所述第二文本为以下至少一个:所述媒体流在上一播放进度对应的字幕和所述媒体流在下一播放进度对应的字幕;
在输出所述媒体流在当前播放进度上的播放内容的同时,将确定出的所述至少一个语种的字幕文本进行显示。
其中,上述方案中,所述确定与当前播放进度对应的至少一个语种的字幕文本,包括:
根据第一信息确定所述至少一个语种;
确定当前播放进度对应的所述至少一个语种的字幕文本;其中,
所述第一信息表征需要显示的字幕文本的语种。
上述方案中,所述方法还包括:
在输出所述媒体流的同时,加载第一交互界面;所述第一交互界面用于设置所述第一信息。
上述方案中,所述将确定出的所述至少一个语种的字幕文本进行显示,包括:
根据所述至少一个语种的语种数量,加载相同数量的显示窗口;
在每个所述显示窗口中显示所述至少一个语种中的一个语种对应的字幕文本;其中,
加载的各个所述显示窗口所占据的屏幕区域互不相接。
上述方案中,所述在每个所述显示窗口中显示所述至少一个语种中的一个语种对应的字幕文本时,所述方法包括:
确定字幕文本的字符长度;
根据所述字符长度和对应的所述显示窗口的尺寸,调节字幕文本的显示字体尺寸。
上述方案中,所述方法还包括:
向服务端发送第一请求;所述第一请求中指示了需要显示的字幕文本的语种;
接收所述服务端根据所述第一请求下发的所述媒体流对应的至少一个语种的字幕文本。
上述方案中,所述至少一个语种包括以下至少一个:
第一语种;
第二语种;其中,
所述第一语种与所述第二语种不同,且所述第一语种与所述媒体流的音频使用的语种相同。
本申请实施例还提供了一种字幕显示装置,所述装置包括:
第一确定单元,配置为确定媒体流的播放进度;
第二确定单元,配置为确定与当前播放进度对应的至少一个语种的字幕文本;所述至少一个语种中的每个语种对应的字幕文本包括第一文本及第二文本;所述第一文本为所述媒体流在当前播放进度对应的字幕;所述第二文本为以下至少一个:所述媒体流在上一播放进度对应的字幕和所述媒体流在下一播放进度对应的字幕;
显示单元,配置为在输出所述媒体流在当前播放进度上的播放内容的同时,将确定出的所述至少一个语种的字幕文本进行显示。
本申请实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述任一字幕显示方法的步骤。
本申请实施例还提供了一种存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时实现上述任一字幕显示方法的步骤。
本申请实施例提供的字幕显示方法、装置、电子设备和存储介质,确定与媒体流的当前播放进度对应的至少一个语种的字幕文本,确定出的每个字幕文本中包括第一文本及第二文本,其中,第一文本为媒体流在当前播放进度对应的字幕,所述第二文本为媒体流在上一播放进度对应的字幕和媒体流在下一播放进度对应的字幕中的至少一个,在输出所述媒体流在 当前播放进度上的播放内容的同时,将确定出的所述至少一个语种的字幕文本进行显示。本申请实施例的方案通过当前字幕及当前字幕的上下文帮助用户更好地阅读并理解字幕,从而更清楚地理解发言者的发言内容,提高信息传递效率。
附图说明
图1为相关技术中字幕显示方法应用的系统架构示意图;
图2为本申请实施例的字幕显示方法的一种流程示意图;
图3为相关技术中字幕显示方法的一种显示示意图;
图4为本申请实施例的字幕显示方法的一种显示示意图;
图5为本申请实施例的字幕显示装置的组成结构示意图;
图6为本申请实施例的电子设备的硬件组成结构示意图。
具体实施方式
在对本申请实施例的技术方案进行详细说明之前,首先对相关技术中的字幕显示方法应用的系统进行简单说明。
图1为相关技术中字幕显示方法应用的系统架构示意图。如图1所示,所述系统可包括:机器同传服务端、语音识别服务器、翻译服务器、移动端下发服务器、观众移动端、电脑(PC,Personal Computer)客户端、显示屏幕。
实际应用中,发言者可以通过PC客户端进行会议发言,并将展示的文档,如演示文稿软件(PPT,PowerPoint)的文档,投屏到所述显示屏幕,通过显示屏幕展示给用户。在进行会议发言的过程中,PC客户端采集发言者的音频,将采集的音频发送给机器同传服务端,所述机器同传服务端通过语音识别服务器对音频数据进行识别,得到识别文本,再通过翻译服务器对所述识别文本进行翻译,得到翻译结果;机器同传服务端将翻译结果发送给PC客户端,并且通过移动端下发服务器将翻译结果发送给观众移动端,为用户展示翻译结果,从而实现将发言者的发言内容翻译成用户需要的语种并进行展示。
此外,相关技术的方案中,机器同传服务端还可根据翻译服务器的翻译结果生成关于发言内容的字幕,包括关于发言内容的原文和对应的译文,并通过移动端下发服务器将字幕发送给观众移动端,观众移动端将字幕与会议现场视频或与发言者的PPT文档同步显示,以帮助用户通过字幕更清楚地理解发言者的发言内容。但是,相关技术在观众移动端中只显示当前播放内容对应的字幕,不利于用户联系上下文对字幕内容进行理解,且当发言内容较多,字幕切换过快时,更加不利于用户理解发言者的发言内容,因此,相关技术的采用对用户更好地理解发言者的发言内容带来了障碍, 降低了信息的传递效率。
基于此,在本申请的各种实施例中,除了显示当前播放进度对应的字幕之外,在播放当前播放进度上的播放内容时,还将当前播放进度的上一播放进度对应的字幕与当前播放进度的下一播放进度对应的字幕同时进行显示,从而通过当前字幕及当前字幕的上下文帮助用户更好地阅读并理解字幕,从而更清楚地理解发言者的发言内容,提高信息传递效率。
下面结合附图及具体实施例对本申请作进一步详细的说明。
本申请实施例提供了一种字幕显示方法,图2为本申请实施例的字幕显示方法的一种流程示意图。如图2所示,所述方法包括:
步骤201:确定媒体流的当前播放进度。
这里,媒体流可以为会议现场视频,或者可以为发言者进行发言的同时在显示屏幕上投屏的流数据,包括发言者展示的视频、文档或图像。确定媒体流的当前播放进度,在实际应用中,可以为确定媒体流的当前播放时间点,或者确定媒体流的当前播放画面,例如,当字幕文本均是通过时间戳实现与媒体流的同步的,那么当前播放进度可以为媒体流的当前播放时间点,当字幕文本是通过与媒体流中的图像帧进行关联实现与媒体流的同步的,那么当前播放进度可以为媒体流的当前播放画面。
步骤202:确定与当前播放进度对应的至少一个语种的字幕文本;所述至少一个语种中的每个语种对应的字幕文本包括第一文本及第二文本;所述第一文本为所述媒体流在当前播放进度对应的字幕;所述第二文本为以下至少一个:所述媒体流在上一播放进度对应的字幕和所述媒体流在下一播放进度对应的字幕。
其中,当前播放进度对应的字幕文本包括了第一文本及至少一个第二文本,这里,第一文本为与当前播放进度对应的字幕,而第二文本可以为当前播放进度的上一播放进度对应的字幕,当前播放进度的下一播放进度对应的字幕,或者可以同时包括当前播放进度的上一播放进度对应的字幕和当前播放进度的下一播放进度对应的字幕。
例如,发言者在会议现场依序陈述观点1、观点2、观点3和观点4,上述四个观点分别展示在连续的四张PPT上,通过媒体流的方式呈现在观众移动端上,且这四张PPT对应的字幕分别为字幕1、字幕2、字幕3和字幕4,那么,若媒体流当前播放的是观点2对应的PPT,那么,当前播放进度对应的字幕为字幕2,当前播放进度的上一播放进度对应的字幕为字幕1,当前播放进度的下一播放进度对应的字幕为字幕3,在媒体流的播放内容跳转至观点3对应的PPT时,当前播放进度对应的字幕为字幕3,当前播放进度的上一播放进度对应的字幕为字幕2,当前播放进度的下一播放进度对应的字幕为字幕4。
此外,需要显示的字幕文本的语种为一种或多种。在一个实施例中,所述至少一个语种包括以下至少一个:
第一语种;
第二语种;其中,
所述第一语种与所述第二语种不同,且所述第一语种与所述媒体流的音频使用的语种相同。
这里,第一语种即媒体流的音频使用的语种,也即发言者所使用的语种,也就是说,第一语种的字幕文本为字幕原文,第二语种的字幕文本为字幕译文。在显示字幕文本时,显示字幕原文和用户所能理解的字幕译文,或者只显示字幕译文,又或者只显示字幕原文。
当然,根据用户的实际需求,也可以显示多个语种的字幕译文,例如,针对多个不同语种的用户共享同一屏幕的情况,可以在屏幕上同时显示多个字幕文本的译文,以满足这些用户的翻译需求。
在一个实施例中,所述确定与当前播放进度对应的至少一个语种的字幕文本,包括:
根据第一信息确定所述至少一个语种;
确定当前播放进度对应的所述至少一个语种的字幕文本;其中,
所述第一信息表征需要显示的字幕文本的语种。
这里,通过第一信息的设置,来表征需要在观众移动端上显示的字幕文本的语种,从而进一步确定出当前播放进度对应的至少一个语种的字幕文本。在实际应用中,可以通过用户交互的方式进行语种设置。在一个实施例中,所述方法还包括:
在输出所述媒体流的同时,加载第一交互界面;所述第一交互界面用于设置所述第一信息。
其中,第一交互界面上设置有交互控件,以使得用户通过操作交互控件完成第一信息的设置。例如,交互控件可以为控制按钮,当用户操作控制按钮处于第一状态时,在观众移动端的屏幕上显示字幕原文和用户指定语种的字幕译文,当用户操作控制按钮处于第二状态时,在观众移动端的屏幕上显示用户指定语种的字幕译文。又例如,交互控件可以为语种选项,当用户操作选中一个或多个语种选项时,在观众移动端的屏幕上显示被选中的语种的字幕译文。这里,通过第一交互界面的设置,使得用户可以自主选择字幕的语种,此外,在输出媒体流的同时,第一交互界面始终加载在观众移动端的屏幕上,这样一来,方便用户在会议过程中根据自身需要随时调整语种设置,也在一定程度上更加有助于用户理解发言内容。
步骤203:在输出所述媒体流在当前播放进度上的播放内容的同时,将确定出的所述至少一个语种的字幕文本进行显示。
在确定出与当前播放进度对应的至少一个语种的字幕文本之后,将确定出的字幕文本与当前播放进度上的播放内容同步输出显示,这样一来,由于字幕文本中包括了当前播放进度对应的字幕,还包括了上一播放进度 对应的字幕和下一播放进度对应的字幕中的至少一个,因此,用户可以通过当前字幕及当前字幕的上下文更好地阅读并理解字幕,从而更清楚地理解发言者的发言内容,提高信息传递效率。
相关技术中,将字幕中的原文与译文紧挨在一起,上下对齐同时显示,阅读时容易上下蹿行,对于不懂原文的用户来说,更是会带来一定的阅读障碍。尤其在两个语种所使用的语言文字较为相似的情况下,例如,英文和法文均使用拉丁字母作为语言文字,如图3所示,若将英文字幕“Ladies and gentlemen”和法文字幕“Mesdames et messieurs”混杂在一起显示,会使得字幕中的原文和译文无法直观地进行区分,不利于用户更好地理解发言者的发言内容,降低了信息的传递效率。
基于此,当显示的字幕文本的语种多于一种时,将各个语种的字幕文本的显示区域分离开来,以更为直观地对不同语种的字幕文本进行区分。因此,在一个实施例中,所述将确定出的所述至少一个语种的字幕文本进行显示,包括:
根据所述至少一个语种的语种数量,加载相同数量的显示窗口;
在每个所述显示窗口中显示所述至少一个语种中的一个语种对应的字幕文本;其中,
加载的各个所述显示窗口所占据的屏幕区域互不相接。
其中,首先确定需要显示的字幕文本的语种数量,根据确定出的语种数量加载相同数量的显示窗口,之后,在进行字幕显示时,在加载出的每个显示窗口中显示其中一个语种对应的字幕文本。这里,显示窗口为用于进行文本显示的显示控件,在实际应用中,根据设计需求,显示窗口可以为带有边框的显示窗口,也可以为不带边框的显示窗口。这里,当加载的显示窗口的数量大于1时,如图4所示,在屏幕左侧的显示窗口中显示了当前播放进度对应的法文字幕“Mesdames et messieurs”及上一播放进度对应的法文字幕“Bonjour”,在屏幕右侧的显示窗口中显示了当前播放进度对应的英文字幕“Ladies and gentlemen”及上一播放进度对应的英文字幕“Good moring”,每个显示窗口所占据的屏幕区域互不相接,即,通过显示窗口的设置,将不同语种的字幕文本分离显示,以避免出现如图3所示的多个语种的字幕文本紧挨在一起显示的情况,提升了字幕文本的可读性。
在一个实施例中,所述在每个所述显示窗口中显示所述至少一个语种中的一个语种对应的字幕文本时,所述方法包括:
确定字幕文本的字符长度;
根据所述字符长度和对应的所述显示窗口的尺寸,调节字幕文本的显示字体尺寸。
每个显示窗口中显示的字幕文本包括了第一文本和至少一个第二文本,当字幕文本中的字符长度超过一定阈值时,可以根据显示窗口的尺寸自动地缩小字幕文本的显示字体尺寸,以保证字幕文本在显示窗口中被完 整显示。
在实际应用中,如前文所述,由机器同传服务端根据翻译服务器的翻译结果生成关于发言内容的字幕,并通过移动端下发服务器将字幕发送给观众移动端,因此,在一个实施例中,所述方法还包括:
向服务端发送第一请求;所述第一请求中指示了需要显示的字幕文本的语种;
接收所述服务端根据所述第一请求下发的所述媒体流对应的至少一个语种的字幕文本。
实际应用中,观众移动端通过用户交互的方式确定出需要显示的字幕文本的语种,或者确定出系统默认的需要显示的字幕文本的语种,之后,向服务端发送第一请求,第一请求中指示了需要显示的字幕文本的语种。在服务端,预先生成各个语种对应的字幕文本,其中,对于原语种的字幕文本,即媒体流的音频使用的语种,也即发言者所使用的语种,服务端生成原语种的字幕文本的过程包括:
对发言者的发言内容进行语音采集,得到第一语音,对第一语音进行语音识别,得到原语种的字幕文本。
这里,在发言者进行发言时,可以通过语音采集模块,如麦克风,对发言者的声音进行采集,得到第一语音,再通过语音识别将第一语音转换为文本,由此得到发言者的实际发言内容对应的原文,也即原语种的字幕文本。此外,在得到原语种的字幕文本之后,还可以对原语种的字幕文本进行添加标点、文本顺滑等后处理,添加标点使得原语种的字幕文本能够实现合理断句,文本顺滑能够调整语音识别出的文本的词语顺序,或者为语音识别出的文本添加连词、助词等,以克服语音识别出的文本口语化的缺陷,得到符合语法表述的原语种的字幕文本。
服务端生成翻译语种的字幕文本的过程包括:
对原语种的字幕文本进行翻译,得到翻译语种的字幕文本。
其中,翻译语种的字幕文本基于原语种的字幕文本生成,通过对确定出的原语种的字幕文本进行翻译,将得到的原语种的字幕文本对应的译文作为翻译语种的字幕文本。这里,翻译语种的字幕文本对于发言内容的翻译质量在很大程度上与翻译语种的字幕文本对发言内容的描述准确度相关。
在实际应用时,可以通过机器翻译技术进行由第一语种至第二语种的翻译,以及实现由第二语种至第一语种的回翻。具体地,可由服务端采用基于规则(Rule-Based)的机器翻译技术或者采用基于语料库(Corpus-Based)的机器翻译技术进行翻译。
此外,服务端生成翻译语种的字幕文本的过程还可以为:
对发言内容对应的同声传译内容进行语音采集,得到第二语音;
对第二语音进行语音识别,得到翻译语种的字幕文本。
当发言者发言时,若对发言内容进行了同声传译,那么可以通过语音采集模块,如麦克风,对同声传译的声音进行采集,得到第二语音,再通过语音识别将第二语音转换为翻译语种的字幕文本,由此得到发言者的实际发言内容对应的翻译语种的字幕文本。
这里,翻译语种的字幕文本对于发言内容的翻译质量不再与原语种的字幕文本对发言内容的描述准确度相关,而是与同声传译的翻译质量相关。
此外,在通过对同声传译内容进行语音识别的方式得到翻译语种的字幕文本之后,也需要对翻译语种的字幕文本进行添加标点、文本顺滑等后处理,以得到符合语法表述的翻译语种的字幕文本。
在服务端,对原语种的字幕文本按句进行切分,得到原语种的字幕文本的句子集合,同样地,对翻译语种的字幕文本按句进行切分,得到翻译语种的字幕文本的句子集合,之后将原语种的字幕文本的句子与翻译语种的字幕文本的句子分别与媒体流的播放时间节点或播放画面进行关联,从而使得观众移动端可以在播放画面的同时同步显示字幕。
本申请实施例提供的字幕显示方法,确定与媒体流的当前播放进度对应的至少一个语种的字幕文本,确定出的每个字幕文本中包括第一文本及第二文本,其中,第一文本为媒体流在当前播放进度对应的字幕,所述第二文本为媒体流在上一播放进度对应的字幕和媒体流在下一播放进度对应的字幕中的至少一个,在输出所述媒体流在当前播放进度上的播放内容的同时,将确定出的所述至少一个语种的字幕文本进行显示。本申请实施例的方案通过当前字幕及当前字幕的上下文帮助用户更好地阅读并理解字幕,从而更清楚地理解发言者的发言内容,提高信息传递效率。
为实现本申请实施例的翻译方法,本申请实施例还提供了一种字幕显示装置,可以设置于电子设备中,作为图1中的观众移动端。图5为本申请实施例的字幕显示装置的组成结构示意图。如图5所示,所述字幕显示装置包括:
第一确定单元51,配置为确定媒体流的播放进度;
第二确定单元52,配置为确定与当前播放进度对应的至少一个语种的字幕文本;所述至少一个语种中的每个语种对应的字幕文本包括第一文本及第二文本;所述第一文本为所述媒体流在当前播放进度对应的字幕;所述第二文本为以下至少一个:所述媒体流在上一播放进度对应的字幕和所述媒体流在下一播放进度对应的字幕;
显示单元53,配置为在输出所述媒体流在当前播放进度上的播放内容的同时,将确定出的所述至少一个语种的字幕文本进行显示。
在一实施例中,所述第二确定单元52,进一步配置为:
根据第一信息确定所述至少一个语种;
确定当前播放进度对应的所述至少一个语种的字幕文本;其中,
所述第一信息表征需要显示的字幕文本的语种。
在一实施例中,所述装置还包括:
加载单元,配置为在输出所述媒体流的同时,加载第一交互界面;
所述第一交互界面用于设置所述第一信息。
在一实施例中,所述显示单元53,进一步配置为:
根据所述至少一个语种的语种数量,加载相同数量的显示窗口;
在每个所述显示窗口中显示所述至少一个语种中的一个语种对应的字幕文本;其中,
加载的各个所述显示窗口所占据的屏幕区域互不相接。
在一实施例中,所述显示单元53在每个所述显示窗口中显示所述至少一个语种中的一个语种对应的字幕文本时,进一步配置为:
确定字幕文本的字符长度;
根据所述字符长度和对应的所述显示窗口的尺寸,调节字幕文本的显示字体尺寸。
在一实施例中,所述装置还包括:
发送单元,配置为向服务端发送第一请求;所述第一请求中指示了需要显示的字幕文本的语种;
接收单元,配置为接收所述服务端根据所述第一请求下发的所述媒体流对应的至少一个语种的字幕文本。
在一实施例中,所述至少一个语种包括以下至少一个:
第一语种;
第二语种;其中,
所述第一语种与所述第二语种不同,且所述第一语种与所述媒体流的音频使用的语种相同。
实际应用时,所述显示单元53、所述加载单元、所述发送单元、所述接收单元可通过电子设备中的通信接口实现;所述第一确定单元51、第二确定单元52可由电子设备中的处理器,比如中央处理器(CPU,Central Processing Unit)、数字信号处理器(DSP,Digital Signal Processor)、微控制单元(MCU,Microcontroller Unit)或可编程门阵列(FPGA,Field-Programmable Gate Array)等实现。
需要说明的是:上述实施例提供的字幕显示装置在进行字幕显示时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将电子设备内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的装置与字幕显示方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上文实施例中的字幕显示装置可以对应设置于图1所示的字幕显示系统中,即,分别对应设置在图1字幕显示系统的观众移动端上,以将本申 请实现例的字幕显示方法应用在翻译系统中。
基于上述设备的硬件实现,本申请实施例还提供了一种电子设备。图6为本申请实施例的电子设备的硬件组成结构示意图,如图6所示,电子设备60包括存储器63、处理器62及存储在存储器63上并可在处理器62上运行的计算机程序;处理器62执行所述程序时实现上述一个或多个技术方案提供的方法。
具体地,电子设备60中的处理器62执行所述程序时实现:确定媒体流的当前播放进度;确定与当前播放进度对应的至少一个语种的字幕文本;所述至少一个语种中的每个语种对应的字幕文本包括第一文本及第二文本;所述第一文本为所述媒体流在当前播放进度对应的字幕;所述第二文本为以下至少一个:所述媒体流在上一播放进度对应的字幕和所述媒体流在下一播放进度对应的字幕;在输出所述媒体流在当前播放进度上的播放内容的同时,将确定出的所述至少一个语种的字幕文本进行显示。
需要说明的是,处理器62执行所述程序时实现的具体步骤已在上文实施例中详述,这里不再赘述。
可以理解,电子设备60还包括通信接口61;电子设备60中的各个组件通过总线系统64耦合在一起。可理解,总线系统64配置为实现这些组件之间的连接通信。总线系统64除包括数据总线之外,还包括电源总线、控制总线和状态信号总线等。
可以理解,上文图6实施例中的存储器可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random Access Memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,Synchronous Dynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存 储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本申请实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
上述本申请实施例揭示的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、DSP,或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成前述方法的步骤。
本申请实施例还提供了一种存储介质,具体为计算机存储介质,更具体的为计算机可读存储介质。其上存储有计算机指令,即计算机程序,该计算机指令被处理器执行时上述一个或多个技术方案提供的方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和智能设备,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个第二处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是:“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
另外,本申请实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。

Claims (10)

  1. 一种字幕显示方法,包括:
    确定媒体流的当前播放进度;
    确定与当前播放进度对应的至少一个语种的字幕文本;所述至少一个语种中的每个语种对应的字幕文本包括第一文本及第二文本;所述第一文本为所述媒体流在当前播放进度对应的字幕;所述第二文本为以下至少一个:所述媒体流在上一播放进度对应的字幕和所述媒体流在下一播放进度对应的字幕;
    在输出所述媒体流在当前播放进度上的播放内容的同时,将确定出的所述至少一个语种的字幕文本进行显示。
  2. 根据权利要求1所述的方法,其中,所述确定与当前播放进度对应的至少一个语种的字幕文本,包括:
    根据第一信息确定所述至少一个语种;
    确定当前播放进度对应的所述至少一个语种的字幕文本;其中,
    所述第一信息表征需要显示的字幕文本的语种。
  3. 根据权利要求2所述的方法,其中,所述方法还包括:
    在输出所述媒体流的同时,加载第一交互界面;所述第一交互界面用于设置所述第一信息。
  4. 根据权利要求1所述的方法,其中,所述将确定出的所述至少一个语种的字幕文本进行显示,包括:
    根据所述至少一个语种的语种数量,加载相同数量的显示窗口;
    在每个所述显示窗口中显示所述至少一个语种中的一个语种对应的字幕文本;其中,
    加载的各个所述显示窗口所占据的屏幕区域互不相接。
  5. 根据权利要求4所述的方法,其中,所述在每个所述显示窗口中显示所述至少一个语种中的一个语种对应的字幕文本时,所述方法包括:
    确定字幕文本的字符长度;
    根据所述字符长度和对应的所述显示窗口的尺寸,调节字幕文本的显示字体尺寸。
  6. 根据权利要求1所述的方法,其中,所述方法还包括:
    向服务端发送第一请求;所述第一请求中指示了需要显示的字幕文本的语种;
    接收所述服务端根据所述第一请求下发的所述媒体流对应的至少一个语种的字幕文本。
  7. 根据权利要求1所述的方法,其中,所述至少一个语种包括以下至少一个:
    第一语种;
    第二语种;其中,
    所述第一语种与所述第二语种不同,且所述第一语种与所述媒体流的音频使用的语种相同。
  8. 一种字幕显示装置,所述装置包括:
    第一确定单元,配置为确定媒体流的播放进度;
    第二确定单元,配置为确定与当前播放进度对应的至少一个语种的字幕文本;所述至少一个语种中的每个语种对应的字幕文本包括第一文本及第二文本;所述第一文本为所述媒体流在当前播放进度对应的字幕;所述第二文本为以下至少一个:所述媒体流在上一播放进度对应的字幕和所述媒体流在下一播放进度对应的字幕;
    显示单元,配置为在输出所述媒体流在当前播放进度上的播放内容的同时,将确定出的所述至少一个语种的字幕文本进行显示。
  9. 一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现权利要求1至7任一项所述方法的步骤。
  10. 一种存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时实现权利要求1至7任一项所述方法的步骤。
PCT/CN2019/117242 2019-11-11 2019-11-11 字幕显示方法、装置、电子设备和存储介质 WO2021092733A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/CN2019/117242 WO2021092733A1 (zh) 2019-11-11 2019-11-11 字幕显示方法、装置、电子设备和存储介质
CN201980100976.7A CN114503546A (zh) 2019-11-11 2019-11-11 字幕显示方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2019/117242 WO2021092733A1 (zh) 2019-11-11 2019-11-11 字幕显示方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
WO2021092733A1 true WO2021092733A1 (zh) 2021-05-20

Family

ID=75911540

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2019/117242 WO2021092733A1 (zh) 2019-11-11 2019-11-11 字幕显示方法、装置、电子设备和存储介质

Country Status (2)

Country Link
CN (1) CN114503546A (zh)
WO (1) WO2021092733A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378001A (zh) * 2021-06-28 2021-09-10 北京百度网讯科技有限公司 视频播放进度的调整方法及装置、电子设备和介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007165981A (ja) * 2005-12-09 2007-06-28 Toshiba Corp 情報処理装置およびその制御プログラム
CN1997138A (zh) * 2006-01-05 2007-07-11 君尊科技股份有限公司 可同时显示多个句子的dvd播放系统及其字幕产生的方法
CN102290081A (zh) * 2011-06-27 2011-12-21 深圳市基思瑞科技有限公司 语言学习播放控制方法
CN104202678A (zh) * 2014-09-22 2014-12-10 杨海 一种可实现重放和预览双语字幕的视频字幕显示方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030190148A1 (en) * 2002-03-20 2003-10-09 Lg Electronics Inc. Displaying multi-text in playback of an optical disc
CN101437149B (zh) * 2007-11-12 2010-10-20 华为技术有限公司 一种提供多语种节目的方法、系统及装置
CN102082931A (zh) * 2009-11-30 2011-06-01 新奥特(北京)视频技术有限公司 一种自适应调整字幕区域的方法及装置
CN107484034A (zh) * 2017-07-18 2017-12-15 深圳Tcl新技术有限公司 字幕显示方法、终端及计算机可读存储介质
CN107277646A (zh) * 2017-08-08 2017-10-20 四川长虹电器股份有限公司 一种音视频资源的字幕配置系统
CN107644016A (zh) * 2017-10-19 2018-01-30 维沃移动通信有限公司 一种多媒体字幕翻译方法、多媒体字幕查找方法及装置
CN107911734B (zh) * 2017-11-10 2020-04-03 青岛海信电器股份有限公司 字幕显示方法、装置以及计算机可存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007165981A (ja) * 2005-12-09 2007-06-28 Toshiba Corp 情報処理装置およびその制御プログラム
CN1997138A (zh) * 2006-01-05 2007-07-11 君尊科技股份有限公司 可同时显示多个句子的dvd播放系统及其字幕产生的方法
CN102290081A (zh) * 2011-06-27 2011-12-21 深圳市基思瑞科技有限公司 语言学习播放控制方法
CN104202678A (zh) * 2014-09-22 2014-12-10 杨海 一种可实现重放和预览双语字幕的视频字幕显示方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378001A (zh) * 2021-06-28 2021-09-10 北京百度网讯科技有限公司 视频播放进度的调整方法及装置、电子设备和介质
CN113378001B (zh) * 2021-06-28 2024-02-27 北京百度网讯科技有限公司 视频播放进度的调整方法及装置、电子设备和介质

Also Published As

Publication number Publication date
CN114503546A (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
US9298704B2 (en) Language translation of visual and audio input
CN111050201B (zh) 数据处理方法、装置、电子设备及存储介质
US20150046146A1 (en) Delay in video for language translation
WO2016037440A1 (zh) 视频语音转换方法、装置和服务器
JP2019213198A (ja) 字幕生成方法および字幕生成装置
CN109348145B (zh) 基于字幕生成关联弹幕的方法及设备、计算机可读介质
US9584761B2 (en) Videoconference terminal, secondary-stream data accessing method, and computer storage medium
CN110784662A (zh) 一种视频背景的更换方法、系统、装置和存储介质
WO2022228235A1 (zh) 生成视频语料的方法、装置及相关设备
CN114390220A (zh) 一种动画视频生成方法及相关装置
WO2015019774A1 (ja) データ生成装置、データ生成方法、翻訳処理装置、プログラム、およびデータ
WO2021092733A1 (zh) 字幕显示方法、装置、电子设备和存储介质
WO2021057957A1 (zh) 视频通话方法、装置、计算机设备和存储介质
WO2024008047A1 (zh) 数字人手语播报方法、装置、设备及存储介质
CN117493593A (zh) 多端融合的演讲稿展示方法和系统
US20230326369A1 (en) Method and apparatus for generating sign language video, computer device, and storage medium
JP7417272B2 (ja) 端末装置、サーバ装置、配信方法、学習器取得方法、およびプログラム
CN110992960A (zh) 控制方法、装置、电子设备和存储介质
WO2021102754A1 (zh) 数据处理方法、装置和存储介质
CN111161710A (zh) 同声传译方法、装置、电子设备及存储介质
WO2021062757A1 (zh) 同声传译方法、装置、服务器和存储介质
CN210091177U (zh) 一种实现同步翻译的会议系统
CN111160051A (zh) 数据处理方法、装置、电子设备及存储介质
KR101425381B1 (ko) 자막 학습 시스템 및 방법
CN114494951B (zh) 视频处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19952418

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19952418

Country of ref document: EP

Kind code of ref document: A1

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 31-10-2022)