CN114125358A - 云会议字幕显示方法、系统、装置、电子设备和存储介质 - Google Patents

云会议字幕显示方法、系统、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN114125358A
CN114125358A CN202111332997.7A CN202111332997A CN114125358A CN 114125358 A CN114125358 A CN 114125358A CN 202111332997 A CN202111332997 A CN 202111332997A CN 114125358 A CN114125358 A CN 114125358A
Authority
CN
China
Prior art keywords
area
cloud conference
subtitle
user interface
cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111332997.7A
Other languages
English (en)
Inventor
刘坚
李秋平
王明轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Youzhuju Network Technology Co Ltd
Original Assignee
Beijing Youzhuju Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Youzhuju Network Technology Co Ltd filed Critical Beijing Youzhuju Network Technology Co Ltd
Priority to CN202111332997.7A priority Critical patent/CN114125358A/zh
Publication of CN114125358A publication Critical patent/CN114125358A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4316Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Abstract

本公开实施例公开了一种云会议字幕显示方法、装置、电子设备和存储介质,该方法包括:显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频流,在所述第二区域显示与所述云会议视频流中音频流对应的第一字幕;响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整。通过本公开实施例提供的云会议字幕显示方案,实现了在云会议场景下实时显示与会议音频对应的字幕的目的,有助于提升通过云会议进行信息分享和交流的效率和效果。

Description

云会议字幕显示方法、系统、装置、电子设备和存储介质
技术领域
本公开涉及信息技术领域,尤其涉及一种云会议字幕显示方法、系统、装置、电子设备和存储介质。
背景技术
随着终端和网络技术的不断发展,越来越多的用户通过云会议进行信息分享和交流。
然而,现有技术中,在用户通过云会议进行信息分享和交流时无法跟随语音同步显示字幕,导致信息分享和交流的效率不高。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开实施例提供了一种云会议字幕显示方法、装置、电子设备和存储介质,实现了在云会议场景下实时显示与会议音频对应的字幕的目的,有助于提升通过云会议进行信息分享和交流的效率和效果。
本公开实施例提供了一种云会议字幕显示方法,该方法包括:
显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频流,在所述第二区域显示与所述云会议视频流中音频流对应的第一字幕;
响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整。
本公开实施例还提供了一种云会议字幕系统,包括:投屏端、云会议服务端和用户端;
其中,所述投屏端与所述云会议服务端通信连接,用于显示至少包括第一字幕的云会议视频,并通过虚拟摄像头采集至少包括第一字幕的云会议视频画面,将采集到的云会议视频画面发送至少所述云会议服务端;
所述用户端与所述云会议服务端通信连接,用于从所述云会议服务端获取所述至少包括第一字幕的云会议视频画面,并显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频,在所述第二区域显示与所述云会议视频对应的第一字幕。
本公开实施例还提供了一种云会议字幕显示装置,该装置包括:
显示模块,用于显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频流,在所述第二区域显示与所述云会议视频流中音频流对应的第一字幕;
调整模块,用于响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整。
本公开实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的云会议字幕显示方法。
本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的云会议字幕显示方法。
本公开实施例提供的技术方案与现有技术相比至少具有如下优点:
本公开实施例提供的云会议字幕显示方法,通过显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频流,在所述第二区域显示与所述云会议视频流中音频流对应的第一字幕,实现了在云会议场景下实时显示与会议音频对应的字幕的目的,有助于提升通过云会议进行信息分享和交流的效率和效果;响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整,通过支持参会人员自定义调整第一区域以及第二区域的大小和位置,可以满足不同参会人员的不同个性化需求,有助于提升用户的使用体验。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例中的一种云会议字幕显示方法的流程图;
图2为本公开实施例中的一种第一用户界面的示意图;
图3为本公开实施例中的另一种第一用户界面的示意图;
图4为本公开实施例中的另一种第一用户界面的示意图;
图5为本公开实施例中的另一种第一用户界面的示意图;
图6为本公开实施例中的一种云会议字幕显示系统的结构示意图;
图7为本公开实施例中的另一种云会议字幕显示系统的结构示意图;
图8为本公开实施例中的一种云会议字幕显示装置的结构示意图;
图9为本公开实施例中的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图1为本公开实施例中的一种云会议字幕显示方法的流程图,该云会议字幕显示方法应用于同传硬件设备,更具体的,该云会议字幕显示方法应用于同传硬件设备的用户端,即除主讲人之外的其他参会人员的终端。该方法可以由云会议字幕显示装置执行,该装置可以采用软件和/或硬件的方式实现,该装置可配置于同传硬件设备中的用户端,例如电子终端,具体包括但不限于智能手机、掌上电脑、平板电脑、带显示屏的可穿戴设备、台式机、笔记本电脑、一体机、智能家居设备等。
如图1所示,该方法具体可以包括如下步骤:
步骤301、显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频流,在所述第二区域显示与所述云会议视频流中音频流对应的第一字幕。
在一些实施例中,参考如图2所示的一种第一用户界面的示意图,其包括第一区域410和第二区域420,在第一区域410播放云会议视频流,在第二区域420显示与云会议视频流中音频流对应的第一字幕421。其中,云会议视频流包括云会议主讲人分享的文件画面和主讲人的音频,主讲人分享的文件画面具体可以是幻灯片。
进一步的,在会议过程中,通常包括交流环节,因此,除了主讲人发言之外,其他参会人员也会发言,故云会议视频流中的音频流还包括除主讲人之外其他参会人员的音频,对应的,所述第一字幕包括其它参会人员的音频对应的字幕。如此实现了针对所有参会人员的音频进行字幕显示的目的。
第一字幕421为针对云会议视频流进行音频提取,并基于提取到的音频进行语音识别获得的文本。由于音频提取以及语音识别通常是通过机器自动进行,因此准确度不高,例如音频对应的真实文本是“张三”,而语音识别的结果是“张珊”,因此,为了提高第一字幕的准确度,通常在获得第一字幕之后通过人工对第一字幕进行校对,以在发现错误时及时修改。优选的,在本实施例中,第一字幕421是通过人工校对之后的字幕,以向用户显示较为准确的字幕,有助于提升用户的使用体验。
步骤302、响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整。
具体的,云会议的参会人员可以根据自己的习惯、需求对第一区域和/或第二区域进行调整。例如有的参会人员更希望将视线聚焦在第一区域中的视频画面,此时可将第一区域的大小调整的较大一些,而第二区域的大小调整的较小一些,如图3所示的一种第一用户界面的示意图,其中,第一区域510比第二区域520大。再例如有的参会人员更希望多关注第二区域中的字幕,此时可将第二区域的大小调整的较大一些,而第一区域的大小调整的较小一些,如图4所示的一种第一用户界面的示意图,其中,第一区域610比第二区域620小。另外,针对第一区域和第二区域在第一用户界面的显示位置,参会人员也可以根据自己的习惯和需求进行调整。通过支持参会人员自定义调整第一区域以及第二区域的大小和位置,可以满足不同参会人员的不同个性化需求,有助于提升用户的使用体验。
在一些实施例中,所述响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整,包括下述至少一种:
响应于第一调整操作,对所述第一区域和/或所述第二区域在所述第一用户界面的位置进行调整;响应于第二调整操作,对所述第一区域和/或所述第二区域在所述第一用户界面的大小进行调整。
在一些实施例中,参考如图5所示的一种第一用户界面的示意图,第一用户界面包括第一区域710和第二区域720,在第一区域710播放云会议视频流,在第二区域720显示与云会议视频流中音频流对应的第一字幕721,进一步的,在第二区域720还显示与云会议视频流中音频流对应的第二字幕722,第二字幕722的语种与第一字幕721的语种不同,第一字幕721的语种与音频流对应的语种相同。例如,第一字幕721为中文,第二字幕722为英文。
为了提高可读性,进而提升用户的使用体验,第一字幕721与第二字幕722以上下文的形式显示在第二区域720中。
本公开实施例提供的云会议字幕显示方法,通过显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频流,在所述第二区域显示与所述云会议视频流中音频流对应的第一字幕,实现了在云会议场景下实时显示与会议音频对应的字幕的目的,有助于提升通过云会议进行信息分享和交流的效率和效果;响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整,通过支持参会人员自定义调整第一区域以及第二区域的大小和位置,可以满足不同参会人员的不同个性化需求,有助于提升用户的使用体验。
图6为本公开实施例中的一种云会议字幕系统的结构示意图。如图6所示,云会议字幕系统包括:用户端810、云会议服务端830和投屏端840。
其中,投屏端840与云会议服务端830通信连接,用于显示至少包括第一字幕的云会议视频,并通过虚拟摄像头采集至少包括第一字幕的云会议视频画面,将采集到的云会议视频画面发送至少云会议服务端830。
云会议视频具体是对主讲人的音频以及主讲人的分享画面进行视频录制获得的。具体的,主讲人可以通过终端加入云会议,并分享信息。在一些实施方式中,支持主讲人自主切换共享屏幕的内容,即主讲人可以随意切换其分享的文件,例如是幻灯片,主讲人可以随意切换演示文稿。
投屏端840用于显示至少包括第一字幕的云会议视频。其中,第一字幕可通过同传设备获得,投屏端840对第一字幕和与第一字幕匹配的视频画面进行合成处理,获得至少包括第一字幕的云会议视频,并显示包括第一字幕的云会议视频。进一步的,投屏端840通过虚拟摄像头采集至少包括第一字幕的云会议视频画面,并将采集到的云会议视频画面发送至少云会议服务端830进行存储。投屏端840通过使用虚拟摄像头采集包括第一字幕的视频播放画面,可避免引入较多的硬件实体设备,达到降低云会议字幕系统复杂度的目的。
用户端810用于从所述云会议服务端830获取包括所述第一字幕的云会议视频,并显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放所述云会议视频,在所述第二区域显示所述第一字幕。其中,第一用户界面的示意图可以参考如图2、图3、图4或者图5所示。即在用户端810可进行双屏显示,例如左右屏显示样式或者上下屏显示样式等。以左右屏显示样式为例,左侧屏幕为主讲人共享屏幕的显示内容,右侧屏幕为实时字幕内容,即音频流对应的字幕,该字幕可以包括第一字幕。
进一步的,投屏端840还用于显示包括第一字幕和第二字幕的云会议视频,并通过虚拟摄像头采集包括第一字幕和第二字幕的云会议视频画面,将采集到的云会议视频画面发送至少所述云会议服务端830。对应的,在所述第二区域还显示与所述云会议视频对应的第二字幕。即在所述第二区域同时显示第一字幕和第二字幕。其中,第一字幕指对云会议视频流中的音频流进行语音识别获得的字幕,或者进一步是对语音识别获得的字幕进行校对所获得的校对之后的字幕,第一字幕的语种通常与音频流的语种相同。第二字幕可以是基于第一字幕进行机器翻译得到的字幕,或者对机器翻译获得的字幕进行校对所获得的校对之后的字幕;第二字幕的语种通常与第一字幕的语种不同。
在一些实施方式中,为了提高可读性,第一字幕与第二字幕呈左右对照的形式,或者上下文的形式排布(如图5所示),以方便用户阅读。
用户端810具体指除主讲人之外的其他参会人员的客户端。
在一些实施方式中,参考如图7所示的一种云会议字幕显示系统的结构示意图,该系统还包括:主控端820、与主控端820通信连接的第一显示终端910以及与主控端820通信连接的第二显示终端920。
其中,主控端820用于从云会议服务端830获取所述云会议视频流中的音频流,并对所述音频流进行语音识别,获得与所述音频流对应的第一字幕,并将所述第一字幕发送至所述投屏端840。
第一显示终端910用于:
显示第二用户界面,所述第二用户界面包括所述第一字幕;响应于第一字幕修改指令,对所述第一字幕修改指令指向的第一字幕进行修改;主控端820还用于将修改后的第一字幕发送至所述投屏端840。具体的,第一显示终端910对应原文校对员的设备,原文校对员基于第一显示终端910显示的第一字幕进行校对。进一步的,主控端820通过音频采集卡从所述云会议服务端830获取所述云会议视频流中的音频流。通过使用音频采集卡进行外置环路收声,可以通过线下硬件设备实时监听输入的音频的音质和音量,相比于通过软件内置收声,音频保真度更高,对系统的资源占用更少,有助于提升主控端820的稳定性。同时,原文校对员可以一边收听音频采集卡采集到的音频,一边对第一字幕进行校对,可提高校对效率和精度。同时将校对后的第一字幕同步至主控端820,主控端820将校对后的第一字幕发送至投屏端840,投屏端将包括校对后的第一字幕的云会议视频流发送至云会议服务端830,以使在用户端810显示的第一字幕是经过校对之后较为准确的字幕,有助于提升用户的使用体验。其中,第一显示终端910可对应图1或图2中的设备24。
第二显示终端920用于:
显示第三用户界面,所述第三用户界面包括所述第一字幕,以及与所述第一字幕呈横向的对照关系的第二字幕,所述第二字幕是所述主控端820基于所述第一字幕进行机器翻译获得的;响应于第二字幕修改指令,对所述第二字幕修改指令指向的第二字幕进行修改,主控端820还用于将修改后的第二字幕发送至投屏端840。其中,所述第二字幕的语种与所述第一字幕的语种不同,所述第一字幕的语种与所述音频流对应的语种相同。具体的,第二显示终端920对应译文校对员的设备,译文校对员基于第二显示终端920显示的第一字幕和第二字幕对第二字幕进行校对,其中的第一字幕是原文校对员校对过的字幕,是比较准确的字幕,故译文校对员可参考第一字幕对第二字幕进行校对。第二显示终端920可对应图1或图2中的设备25。第一字幕与第二字幕通过呈横向的对照关系,可方便译文校对员参考第一字幕对第二字幕进行校对,有助于提升校对效率和准确度。校对后的第二字幕同步至主控端820,以使主控端820将校对后的第二字幕发送至投屏端840。投屏端840还用于:将所述第二字幕与所述云会议视频流进行合成,以在播放所述云会议视频流的同时,显示所述第一字幕以及所述第二字幕;对包括所述第一字幕和所述第二字幕的云会议视频流进行播放,并通过虚拟摄像头采集播放画面,并将采集到的播放画面发送至所述云会议服务端;所述用户端的所述第二区域还显示所述第二字幕。进而保证在用户端810显示的第二字幕是经过校对后的字幕,从而保证字幕的正确性,有助于提升用户的使用体验。
通过设置独立的第一显示终端910和第二显示终端920,可以方便原文校对员和译文校对的校对操作,有助于提升校对效率。且第一显示终端910、第二显示终端920以及主控端820分别为独立的终端设备,降低了第一显示终端910、第二显示终端920以及主控端820之间的耦合性,可以使得主控端820提供的语音识别以及机器翻译功能更加稳定,并保证视频流、音频流以及字幕的传输稳定性。
需要说明的是,参考图9所示,在云会议场景,通常还包括主持人端,主持人接入会议所使用的终端设备(例如手机),主持人指组织会议的用户,以确保用户端(即参会人员的客户端)可以看到主讲人共享的屏幕,听到主讲人的实时音频等,并确保参会人员的发言能够被主讲人实时听到,并在主讲人的客户端显示对应的字幕。
图8为本公开实施例中的一种云会议字幕显示装置的结构示意图。本公开实施例所提供的装置可以配置于云会议字幕显示系统中的用户端。如图8所示,该装置具体包括:显示模块1010和调整模块1020。
其中,显示模块1010,用于显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频流,在所述第二区域显示与所述云会议视频流中音频流对应的第一字幕;调整模块1020,用于响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整。
可选的,调整模块1020具体用于下述至少一种操作:
响应于第一调整操作,对所述第一区域和/或所述第二区域在所述第一用户界面的位置进行调整;响应于第二调整操作,对所述第一区域和/或所述第二区域在所述第一用户界面的大小进行调整。
可选的,在所述第二区域还显示与所述云会议视频流中音频流对应的第二字幕,所述第二字幕的语种与所述第一字幕的语种不同;所述第一字幕的语种与所述音频流对应的语种相同。
可选的,所述第一字幕与所述第二字幕以上下文的形式显示在所述第二区域中;所述音频流包括云会议参会用户的音频流。
本公开实施例提供的装置,可执行本公开方法实施例所提供的方法步骤,具备的有益效果此处不再赘述。
图9为本公开实施例中的一种电子设备的结构示意图。下面具体参考图9,其示出了适于用来实现本公开实施例中的电子设备500的结构示意图。本公开实施例中的电子设备500可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)、可穿戴电子设备等等的移动终端以及诸如数字TV、台式计算机、智能家居设备等等的固定终端。图9示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理以实现如本公开所述实施例的方法。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图9示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码,从而实现如上所述的方法。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:
显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频流,在所述第二区域显示与所述云会议视频流中音频流对应的第一字幕;响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整。
可选的,当上述一个或者多个程序被该电子设备执行时,该电子设备还可以执行上述实施例所述的其他步骤。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,本公开提供了一种云会议字幕显示方法,包括:显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频流,在所述第二区域显示与所述云会议视频流中音频流对应的第一字幕;响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整。
根据本公开的一个或多个实施例,在本公开提供的方法中,可选的,所述响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整,包括下述至少一种:响应于第一调整操作,对所述第一区域和/或所述第二区域在所述第一用户界面的位置进行调整;响应于第二调整操作,对所述第一区域和/或所述第二区域在所述第一用户界面的大小进行调整。
根据本公开的一个或多个实施例,在本公开提供的方法中,可选的,在所述第二区域还显示与所述云会议视频流中音频流对应的第二字幕,所述第二字幕的语种与所述第一字幕的语种不同;所述第一字幕的语种与所述音频流对应的语种相同。
根据本公开的一个或多个实施例,在本公开提供的方法中,可选的,所述第一字幕与所述第二字幕以上下文的形式显示在所述第二区域中;所述音频流包括云会议参会用户的音频流。
根据本公开的一个或多个实施例,本公开提供了一种云会议字幕系统,包括:投屏端、云会议服务端和用户端;其中,所述投屏端与所述云会议服务端通信连接,用于显示至少包括第一字幕的云会议视频,并通过虚拟摄像头采集至少包括第一字幕的云会议视频画面,将采集到的云会议视频画面发送至少所述云会议服务端;所述用户端与所述云会议服务端通信连接,用于从所述云会议服务端获取所述至少包括第一字幕的云会议视频画面,并显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频,在所述第二区域显示与所述云会议视频对应的第一字幕。
根据本公开的一个或多个实施例,在本公开提供的一种云会议字幕显示系统中,所述投屏端还用于显示包括第一字幕和第二字幕的云会议视频,并通过虚拟摄像头采集包括第一字幕和第二字幕的云会议视频画面,将采集到的云会议视频画面发送至少所述云会议服务端。
根据本公开的一个或多个实施例,在本公开提供的一种云会议字幕显示系统中,在所述第二区域还显示与所述云会议视频对应的第二字幕。根据本公开的一个或多个实施例,本公开提供了一种云会议字幕显示装置,包括:显示模块,用于显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频流,在所述第二区域显示与所述云会议视频流中音频流对应的第一字幕;调整模块,用于响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整。
根据本公开的一个或多个实施例,在本公开提供的云会议字幕显示装置中,可选的,调整模块1020具体用于下述至少一种操作:
响应于第一调整操作,对所述第一区域和/或所述第二区域在所述第一用户界面的位置进行调整;响应于第二调整操作,对所述第一区域和/或所述第二区域在所述第一用户界面的大小进行调整。
根据本公开的一个或多个实施例,在本公开提供的云会议字幕显示装置中,可选的,在所述第二区域还显示与所述云会议视频流中音频流对应的第二字幕,所述第二字幕的语种与所述第一字幕的语种不同;所述第一字幕的语种与所述音频流对应的语种相同。
根据本公开的一个或多个实施例,在本公开提供的云会议字幕显示装置中,可选的,所述第一字幕与所述第二字幕以上下文的形式显示在所述第二区域中;所述音频流包括云会议参会用户的音频流。
根据本公开的一个或多个实施例,本公开提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开提供的任一所述的方法。
根据本公开的一个或多个实施例,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开提供的任一所述的方法。
本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序或指令,该计算机程序或指令被处理器执行时实现如上所述的方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (10)

1.一种云会议字幕显示方法,其特征在于,应用于用户端,所述方法包括:
显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频流,在所述第二区域显示与所述云会议视频流中音频流对应的第一字幕;
响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整。
2.根据权利要求1所述的方法,其特征在于,所述响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整,包括下述至少一种:
响应于第一调整操作,对所述第一区域和/或所述第二区域在所述第一用户界面的位置进行调整;
响应于第二调整操作,对所述第一区域和/或所述第二区域在所述第一用户界面的大小进行调整。
3.根据权利要求1所述的方法,其特征在于,在所述第二区域还显示与所述云会议视频流中音频流对应的第二字幕,所述第二字幕的语种与所述第一字幕的语种不同;
所述第一字幕的语种与所述音频流对应的语种相同。
4.根据权利要求3所述的方法,其特征在于,所述第一字幕与所述第二字幕以上下文的形式显示在所述第二区域中;
所述音频流包括云会议参会用户的音频流。
5.一种云会议字幕系统,其特征在于,包括:投屏端、云会议服务端和用户端;
其中,所述投屏端与所述云会议服务端通信连接,用于显示至少包括第一字幕的云会议视频,并通过虚拟摄像头采集至少包括第一字幕的云会议视频画面,将采集到的云会议视频画面发送至少所述云会议服务端;
所述用户端与所述云会议服务端通信连接,用于从所述云会议服务端获取所述至少包括第一字幕的云会议视频画面,并显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频,在所述第二区域显示与所述云会议视频对应的第一字幕。
6.根据权利要求5所述的系统,其特征在于,所述投屏端还用于显示包括第一字幕和第二字幕的云会议视频,并通过虚拟摄像头采集包括第一字幕和第二字幕的云会议视频画面,将采集到的云会议视频画面发送至少所述云会议服务端。
7.根据权利要求6所述的系统,其特征在于,在所述第二区域还显示与所述云会议视频对应的第二字幕。
8.一种云会议字幕显示装置,其特征在于,集成于用户端,包括:
显示模块,用于显示第一用户界面,所述第一用户界面包括第一区域和第二区域,在所述第一区域播放云会议视频流,在所述第二区域显示与所述云会议视频流中音频流对应的第一字幕;
调整模块,用于响应于预设调整操作,对所述第一区域和/或所述第二区域进行调整。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的方法。
CN202111332997.7A 2021-11-11 2021-11-11 云会议字幕显示方法、系统、装置、电子设备和存储介质 Pending CN114125358A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111332997.7A CN114125358A (zh) 2021-11-11 2021-11-11 云会议字幕显示方法、系统、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111332997.7A CN114125358A (zh) 2021-11-11 2021-11-11 云会议字幕显示方法、系统、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN114125358A true CN114125358A (zh) 2022-03-01

Family

ID=80378499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111332997.7A Pending CN114125358A (zh) 2021-11-11 2021-11-11 云会议字幕显示方法、系统、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN114125358A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115988169A (zh) * 2023-03-20 2023-04-18 全时云商务服务股份有限公司 一种云会议中实时视频合屏文字快速显示方法与装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102170553A (zh) * 2010-02-26 2011-08-31 夏普株式会社 会议系统、信息处理装置、会议辅助方法及信息处理方法
US20110246172A1 (en) * 2010-03-30 2011-10-06 Polycom, Inc. Method and System for Adding Translation in a Videoconference
CN107527623A (zh) * 2017-08-07 2017-12-29 广州视源电子科技股份有限公司 传屏方法、装置、电子设备及计算机可读存储介质
CN108401192A (zh) * 2018-04-25 2018-08-14 腾讯科技(深圳)有限公司 视频流处理方法、装置、计算机设备及存储介质
CN109819202A (zh) * 2019-03-20 2019-05-28 上海高屋信息科技有限公司 字幕添加装置及字幕添加方法
CN112153323A (zh) * 2020-09-27 2020-12-29 北京百度网讯科技有限公司 远程会议的同声传译方法、装置、电子设备和存储介质
US20210074298A1 (en) * 2019-09-11 2021-03-11 Soundhound, Inc. Video conference captioning
CN112601102A (zh) * 2020-12-11 2021-04-02 北京有竹居网络技术有限公司 同声传译字幕的确定方法、装置、电子设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102170553A (zh) * 2010-02-26 2011-08-31 夏普株式会社 会议系统、信息处理装置、会议辅助方法及信息处理方法
US20110246172A1 (en) * 2010-03-30 2011-10-06 Polycom, Inc. Method and System for Adding Translation in a Videoconference
CN107527623A (zh) * 2017-08-07 2017-12-29 广州视源电子科技股份有限公司 传屏方法、装置、电子设备及计算机可读存储介质
CN108401192A (zh) * 2018-04-25 2018-08-14 腾讯科技(深圳)有限公司 视频流处理方法、装置、计算机设备及存储介质
CN109819202A (zh) * 2019-03-20 2019-05-28 上海高屋信息科技有限公司 字幕添加装置及字幕添加方法
US20210074298A1 (en) * 2019-09-11 2021-03-11 Soundhound, Inc. Video conference captioning
CN112153323A (zh) * 2020-09-27 2020-12-29 北京百度网讯科技有限公司 远程会议的同声传译方法、装置、电子设备和存储介质
CN112601102A (zh) * 2020-12-11 2021-04-02 北京有竹居网络技术有限公司 同声传译字幕的确定方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115988169A (zh) * 2023-03-20 2023-04-18 全时云商务服务股份有限公司 一种云会议中实时视频合屏文字快速显示方法与装置
CN115988169B (zh) * 2023-03-20 2023-08-18 全时云商务服务股份有限公司 一种云会议中实时视频合屏文字快速显示方法与装置

Similar Documents

Publication Publication Date Title
CN111970524B (zh) 交互类直播连麦的控制方法、装置、系统、设备及介质
CN110809189B (zh) 视频播放方法、装置、电子设备和计算机可读介质
CN111064987B (zh) 信息展示方法、装置及电子设备
CN112492357A (zh) 一种处理多视频流的方法、装置、介质和电子设备
CN110898429B (zh) 一种游戏剧情展现方法、装置、电子设备及存储介质
CN114095671A (zh) 云会议直播系统、方法、装置、设备及介质
CN112259062A (zh) 特效展示方法、装置、电子设备及计算机可读介质
CN113542902B (zh) 一种视频处理方法、装置、电子设备和存储介质
CN112601101A (zh) 一种字幕显示方法、装置、电子设备及存储介质
CN113225483B (zh) 图像融合方法、装置、电子设备和存储介质
CN110290398B (zh) 视频下发方法、装置、存储介质及电子设备
US20240119082A1 (en) Method, apparatus, device, readable storage medium and product for media content processing
CN111818383B (zh) 视频数据的生成方法、系统、装置、电子设备及存储介质
JP2023515392A (ja) 情報処理方法、システム、装置、電子機器及び記憶媒体
WO2023160573A1 (zh) 直播画面的展示方法、装置、电子设备及存储介质
CN112291502A (zh) 信息交互方法、装置、系统和电子设备
CN113992926B (zh) 界面显示方法、装置、电子设备和存储介质
CN114679628A (zh) 一种弹幕添加方法、装置、电子设备和存储介质
CN114567812A (zh) 音频播放方法、装置、系统、电子设备及存储介质
CN114125358A (zh) 云会议字幕显示方法、系统、装置、电子设备和存储介质
JP2023538825A (ja) ピクチャのビデオへの変換の方法、装置、機器および記憶媒体
WO2023226628A1 (zh) 图像展示方法、装置、电子设备及存储介质
CN116708892A (zh) 一种音画同步检测方法、装置、设备和存储介质
WO2023030321A1 (zh) 视线角度调整方法、装置、电子设备及存储介质
CN112486380B (zh) 一种显示界面的处理方法、装置、介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination