CN106340294A - 基于同步翻译的新闻直播字幕在线制作系统 - Google Patents

基于同步翻译的新闻直播字幕在线制作系统 Download PDF

Info

Publication number
CN106340294A
CN106340294A CN201610867242.XA CN201610867242A CN106340294A CN 106340294 A CN106340294 A CN 106340294A CN 201610867242 A CN201610867242 A CN 201610867242A CN 106340294 A CN106340294 A CN 106340294A
Authority
CN
China
Prior art keywords
module
unit
translation
news
captions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610867242.XA
Other languages
English (en)
Inventor
虞焰兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Voice Communication Information Technology Co Ltd
Original Assignee
Anhui Voice Communication Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Voice Communication Information Technology Co Ltd filed Critical Anhui Voice Communication Information Technology Co Ltd
Priority to CN201610867242.XA priority Critical patent/CN106340294A/zh
Publication of CN106340294A publication Critical patent/CN106340294A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4316Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4856End-user interface for client configuration for language selection, e.g. for the menu or subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/278Subtitling

Abstract

本发明公开了一种基于同步翻译的新闻直播字幕在线制作系统,包括相互连接的现场采集单元和流媒体服务器,流媒体服务器分别连接语音处理单元和字幕制作单元,语音处理单元连接文字翻译单元,文字翻译单元连接字幕制作单元,字幕制作单元连接视频播放客户端,本发明通过现场采集单元采集新闻现场的音视频信息,通过语音处理单元识别语音信息,通过文字翻译单元进行翻译,通过字幕制作单元制作双语字幕,并嵌入直播视频流内同步输出,通过视频播放客户端向用户播放,实现新闻直播字幕的在线制作,对新闻内容进行实时翻译,方便来自世界各地的观众第一时间观看到新闻并理解新闻的内容,提高了新闻直播的实时性,突破了新闻直播语言的地域性。

Description

基于同步翻译的新闻直播字幕在线制作系统
技术领域
本发明属于语音识别技术领域,涉及一种新闻直播字幕在线制作系统,具体是一种基于同步翻译的新闻直播字幕在线制作系统。
背景技术
新闻直播,指不经过预先录音或者录像将事件现场情况、演播室播讲或表演同步播出的广播电视传播形式。视频新闻直播一般通过流媒体服务器向用户在线直播新闻,用户通过客户端观看视频新闻,但是,由于新闻直播是同步播出的,无法预先进行翻译,不同国家的用户因为语言问题无法快速理解新闻的内容,限制了新闻直播的地域性,若采用人工进行翻译,对翻译人员的要求很高,并且受到翻译人员翻译水平限制,很大程度影响了新闻直播的实时性。
发明内容
本发明的目的在于提供一种操作简单、使用方便的基于同步翻译的新闻直播字幕在线制作系统。
本发明的目的可以通过以下技术方案实现:
基于同步翻译的新闻直播字幕在线制作系统,包括相互连接的现场采集单元和流媒体服务器,所述的流媒体服务器分别连接语音处理单元和字幕制作单元,所述的语音处理单元连接文字翻译单元,所述的文字翻译单元连接字幕制作单元,所述的字幕制作单元连接视频播放客户端;
所述的语音处理单元包括
语音识别模块,用于对流媒体服务器输出音频流的语音进行识别,判断语言种类,生成语音识别数据;
语义理解模块,用于对语音识别模块生成的语音识别数据进行语义理解,生成语义理解数据;
以及文字转写模块,将语音识别数据和语义理解数据转写为对应的识别文字流和语义文字流;
所述的文字翻译单元包括
语言选择模块,用于选择语言种类;
和翻译模块,根据语言选择模块选择的语言种类,将文字转写模块输出的语义文字流翻译为对应语言的翻译文字流;
所述的字幕制作单元包括
信息接收模块,用于接收流媒体服务器输出的音频流和视频流,语音处理单元输出的识别文字流,以及文字翻译单元输出的翻译文字流;
字幕调整模块,用于将识别文字流和翻译文字流合并制作成双语字幕流,调整字幕的字体、颜色和大小;
字幕嵌入模块,用于将字幕流嵌入视频流内,生成带字幕的视频;
数据同步模块,用于将字幕流与视频流以及音频流进行同步输出。
进一步地,所述的现场采集单元包括
视频采集模块,采用高清摄像机,用于记录直播现场的视频图像信息的;
语音采集模块,采用高清麦克风,用于采集直播现场的语音信息;
以及声音处理模块,用于对语音采集模块采集到的语音信息进行处理,过滤语音信息中的杂音。
本发明的有益效果:本发明提供的新闻直播字幕在线制作系统,通过现场采集单元采集新闻现场的音视频信息,以流式协议输出视频流和音频流,通过语音识别单元识别音频流的语音,输出识别文字流和语义文字流,通过文字翻译单元对语义文字流进行翻译,输出翻译文字流,通过字幕制作单元制作双语字幕,并嵌入直播视频流内同步输出,通过视频播放客户端向用户播放,实现新闻直播字幕的在线制作,对新闻内容进行实时翻译,方便来自世界各地的观众第一时间观看到新闻并理解新闻的内容,提高了新闻直播的实时性,突破了新闻直播语言的地域性。
附图说明
下面结合附图和具体实施例对本发明作进一步详细描述。
图1是本发明的系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,一种基于同步翻译的新闻直播字幕在线制作系统,包括现场采集单元、流媒体服务器、语音识别单元、文字翻译单元、字幕制作单元以及视频播放客户端,现场采集单元连接流媒体服务器,流媒体服务器分别连接语音处理单元和字幕制作单元,语音处理单元连接文字翻译单元,文字翻译单元连接字幕制作单元,字幕制作单元连接视频播放客户端。
现场采集单元包括视频采集模块、语音采集模块和声音处理模块。
视频采集模块,采用高清摄像机,用于记录直播现场的视频图像信息的。
语音采集模块,采用高清麦克风,用于采集直播现场的语音信息。
声音处理模块,用于对语音采集模块采集到的语音信息进行处理,过滤语音信息中的杂音;其中,杂音指直播现场除主持人声音外的其他环境噪音。
流媒体服务器,接收到现场采集单元输出的实时音视频信号,并以流式协议(RTP/RTSP、MMS、RTMP等)进行直播,输出视频流和音频流。
语音处理单元包括语音识别模块、语义理解模块和文字转写模块。
语音识别模块,用于对流媒体服务器输出音频流的语音进行识别,判断语言种类,生成语音识别数据;其中,语言种类包括汉语、英语、日语、韩语、俄语、西班牙语、意大利语、葡萄牙语、德语、法语。
语义理解模块,用于对语音识别模块生成的语音识别数据进行语义理解,生成语义理解数据。
文字转写模块,将语音识别数据和语义理解数据转写为对应的识别文字流和语义文字流。
文字翻译单元包括语言选择模块和翻译模块。
语言选择模块,用于选择语言种类。
翻译模块,根据语言选择模块选择的语言种类,将文字转写模块输出的语义文字流翻译为对应语言的翻译文字流。
字幕制作单元包括信息接收模块、字幕调整模块、字幕嵌入模块以及数据同步模块。
信息接收模块,用于接收流媒体服务器输出的音频流和视频流,语音处理单元输出的识别文字流,以及文字翻译单元输出的翻译文字流。
字幕调整模块,用于将识别文字流和翻译文字流合并制作成双语字幕流,调整字幕的字体、颜色和大小。
字幕嵌入模块,用于将字幕流嵌入视频流内,生成带字幕的视频。
数据同步模块,用于将字幕流与视频流以及音频流进行同步输出。
视频播放客户端,用于向用户现场直播字幕制作单元输出的带字幕的新闻视频。
本发明工作流程:首先,视频采集模块记录直播现场的视频图像信息,语音采集模块采集直播现场的语音信息并通过声音处理模块过滤语音信息中的杂音,流媒体服务器接收到现场采集单元输出的实时音视频信号,并以流式协议进行直播,输出视频流和音频流。
语音识别模块对音频流的语音进行识别,判断语言种类,生成语音识别数据,语义理解模块对语音识别数据进行语义理解,生成语义理解数据,通过文字转写模块将语音识别数据和语义理解数据转写为对应的识别文字流和语义文字流。
然后,通过语言选择模块选择语言种类,翻译模块根据语言种类将语义文字流翻译为对应语言的翻译文字流;字幕调整模块将识别文字流和翻译文字流合并制作成双语字幕流,并调整字幕的字体、颜色和大小,字幕嵌入模块将字幕流嵌入视频流内,生成带字幕的视频,通过数据同步模块将字幕流与视频流以及音频流进行同步输出,再通过视频播放客户端向用户现场直播带字幕的新闻视频。
本发明提供的新闻直播字幕在线制作系统,通过现场采集单元采集新闻现场的音视频信息,以流式协议输出视频流和音频流,通过语音识别单元识别音频流的语音,输出识别文字流和语义文字流,通过文字翻译单元对语义文字流进行翻译,输出翻译文字流,通过字幕制作单元制作双语字幕,并嵌入直播视频流内同步输出,通过视频播放客户端向用户播放,实现新闻直播字幕的在线制作,对新闻内容进行实时翻译,方便来自世界各地的观众第一时间观看到新闻并理解新闻的内容,提高了新闻直播的实时性,突破了新闻直播语言的地域性。
为了描述的方便,描述以上装置时以功能分为各种单元、模块分别描述。当然,在实施本申请时可以把各单元、模块的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。
以上所描述的装置实施方式仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施方式方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (2)

1.基于同步翻译的新闻直播字幕在线制作系统,其特征在于:包括相互连接的现场采集单元和流媒体服务器,所述的流媒体服务器分别连接语音处理单元和字幕制作单元,所述的语音处理单元连接文字翻译单元,所述的文字翻译单元连接字幕制作单元,所述的字幕制作单元连接视频播放客户端;
所述的语音处理单元包括
语音识别模块,用于对流媒体服务器输出音频流的语音进行识别,判断语言种类,生成语音识别数据;
语义理解模块,用于对语音识别模块生成的语音识别数据进行语义理解,生成语义理解数据;
以及文字转写模块,将语音识别数据和语义理解数据转写为对应的识别文字流和语义文字流;
所述的文字翻译单元包括
语言选择模块,用于选择语言种类;
和翻译模块,根据语言选择模块选择的语言种类,将文字转写模块输出的语义文字流翻译为对应语言的翻译文字流;
所述的字幕制作单元包括
信息接收模块,用于接收流媒体服务器输出的音频流和视频流,语音处理单元输出的识别文字流,以及文字翻译单元输出的翻译文字流;
字幕调整模块,用于将识别文字流和翻译文字流合并制作成双语字幕流,调整字幕的字体、颜色和大小;
字幕嵌入模块,用于将字幕流嵌入视频流内,生成带字幕的视频;
数据同步模块,用于将字幕流与视频流以及音频流进行同步输出。
2.根据权利要求1所述的基于同步翻译的新闻直播字幕在线制作系统,其特征在于:所述的现场采集单元包括
视频采集模块,采用高清摄像机,用于记录直播现场的视频图像信息的;
语音采集模块,采用高清麦克风,用于采集直播现场的语音信息;
以及声音处理模块,用于对语音采集模块采集到的语音信息进行处理,过滤语音信息中的杂音。
CN201610867242.XA 2016-09-29 2016-09-29 基于同步翻译的新闻直播字幕在线制作系统 Pending CN106340294A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610867242.XA CN106340294A (zh) 2016-09-29 2016-09-29 基于同步翻译的新闻直播字幕在线制作系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610867242.XA CN106340294A (zh) 2016-09-29 2016-09-29 基于同步翻译的新闻直播字幕在线制作系统

Publications (1)

Publication Number Publication Date
CN106340294A true CN106340294A (zh) 2017-01-18

Family

ID=57840435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610867242.XA Pending CN106340294A (zh) 2016-09-29 2016-09-29 基于同步翻译的新闻直播字幕在线制作系统

Country Status (1)

Country Link
CN (1) CN106340294A (zh)

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107295307A (zh) * 2017-07-13 2017-10-24 安徽声讯信息技术有限公司 基于远程控制的文字与视频同步控制系统
CN107484002A (zh) * 2017-08-25 2017-12-15 四川长虹电器股份有限公司 智能翻译字幕的方法
CN107527618A (zh) * 2017-07-13 2017-12-29 安徽声讯信息技术有限公司 一种音频文字同步播放系统
CN107767871A (zh) * 2017-10-12 2018-03-06 安徽听见科技有限公司 文本显示方法、终端及服务器
CN108063970A (zh) * 2017-11-22 2018-05-22 北京奇艺世纪科技有限公司 一种处理直播流的方法和装置
CN108281145A (zh) * 2018-01-29 2018-07-13 南京地平线机器人技术有限公司 语音处理方法、语音处理装置和电子设备
CN108337559A (zh) * 2018-02-06 2018-07-27 杭州政信金服互联网科技有限公司 一种直播文字展示方法及系统
CN108366182A (zh) * 2018-02-13 2018-08-03 京东方科技集团股份有限公司 文字语音同步播报的校准方法及装置、计算机存储介质
CN108566558A (zh) * 2018-04-24 2018-09-21 腾讯科技(深圳)有限公司 视频流处理方法、装置、计算机设备及存储介质
CN108829688A (zh) * 2018-06-21 2018-11-16 北京密境和风科技有限公司 跨语种交互的实现方法和装置
CN109166583A (zh) * 2018-08-30 2019-01-08 安徽声讯信息技术有限公司 一种语音双平台文字同步直播系统及方法
CN109255130A (zh) * 2018-07-17 2019-01-22 北京赛思美科技术有限公司 一种基于人工智能的语言翻译和学习的方法、系统和设备
CN109819202A (zh) * 2019-03-20 2019-05-28 上海高屋信息科技有限公司 字幕添加装置及字幕添加方法
CN109905756A (zh) * 2019-01-17 2019-06-18 平安科技(深圳)有限公司 基于人工智能的电视字幕动态生成方法及相关设备
CN109949793A (zh) * 2019-03-06 2019-06-28 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN110335610A (zh) * 2019-07-19 2019-10-15 北京硬壳科技有限公司 多媒体翻译的控制方法及显示器
CN110689770A (zh) * 2019-08-12 2020-01-14 合肥马道信息科技有限公司 一种在线课堂语音转写和翻译系统及其工作方法
CN110769265A (zh) * 2019-10-08 2020-02-07 深圳创维-Rgb电子有限公司 一种同声字幕翻译方法、智能电视及存储介质
CN111506278A (zh) * 2019-01-30 2020-08-07 阿里巴巴集团控股有限公司 数据同传的方法、音频翻译的方法、装置和系统
CN111522971A (zh) * 2020-04-08 2020-08-11 广东小天才科技有限公司 一种直播教学中辅助用户听课的方法及装置
CN111709253A (zh) * 2020-05-26 2020-09-25 珠海九松科技有限公司 一种将方言自动转换为字幕的ai翻译方法和系统
CN111931523A (zh) * 2020-04-26 2020-11-13 永康龙飘传感科技有限公司 在新闻播报实时翻译文字和手语的方法和系统
CN111955013A (zh) * 2018-04-04 2020-11-17 诺基私人有限公司 促进实时流事件期间交互作用的方法和系统
CN112437337A (zh) * 2020-02-12 2021-03-02 上海哔哩哔哩科技有限公司 一种直播实时字幕的实现方法、系统及设备
CN112929758A (zh) * 2020-12-31 2021-06-08 广州朗国电子科技有限公司 一种多媒体内容字幕生成方法、设备以及存储介质
WO2021120190A1 (zh) * 2019-12-20 2021-06-24 深圳市欢太科技有限公司 数据处理方法、装置、电子设备和存储介质
US11049501B2 (en) 2018-09-25 2021-06-29 International Business Machines Corporation Speech-to-text transcription with multiple languages
CN113068058A (zh) * 2021-03-19 2021-07-02 安徽宝信信息科技有限公司 一种基于语音识别及转写技术的实时字幕上屏直播系统
CN113115103A (zh) * 2021-03-09 2021-07-13 杭州麦趣网络科技有限公司 一种网络直播实现实时音频转文字的系统及方法
CN113301357A (zh) * 2020-07-27 2021-08-24 阿里巴巴集团控股有限公司 直播方法、装置及电子设备
CN113613025A (zh) * 2020-05-05 2021-11-05 安徽文徽科技有限公司 一种实时语音转换字幕数据同步处理与画面合成直播的方法及装置
CN113873306A (zh) * 2021-09-23 2021-12-31 深圳市多狗乐智能研发有限公司 一种将实时翻译字幕叠加画面经硬件投射到直播间的方法
CN113992926A (zh) * 2021-10-19 2022-01-28 北京有竹居网络技术有限公司 界面显示方法、装置、电子设备和存储介质
CN115278331A (zh) * 2022-06-23 2022-11-01 中译语通科技股份有限公司 基于机器翻译的多语言字幕展示方法、系统、设备及介质
TWI830074B (zh) * 2021-10-20 2024-01-21 香港商冠捷投資有限公司 語音標示方法及其顯示裝置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1762155A (zh) * 2003-02-21 2006-04-19 松下电器产业株式会社 同步地使用音频视频数据的设备和方法
US20080052069A1 (en) * 2000-10-24 2008-02-28 Global Translation, Inc. Integrated speech recognition, closed captioning, and translation system and method
CN201319640Y (zh) * 2008-12-01 2009-09-30 深圳市同洲电子股份有限公司 一种可实时同步翻译的数字电视接收终端
US20110069230A1 (en) * 2009-09-22 2011-03-24 Caption Colorado L.L.C. Caption and/or Metadata Synchronization for Replay of Previously or Simultaneously Recorded Live Programs
CN103051945A (zh) * 2012-12-31 2013-04-17 广东欧珀移动通信有限公司 一种视频播放终端的字幕翻译方法、系统
WO2013122909A1 (en) * 2012-02-13 2013-08-22 Ortsbo, Inc. Real time closed captioning language translation
CN103297710A (zh) * 2013-06-19 2013-09-11 江苏华音信息科技有限公司 汉语自动实时标注中外文字幕音像录播设备
CN103309855A (zh) * 2013-06-18 2013-09-18 江苏华音信息科技有限公司 汉语与外语自动实时语音翻译并标注字幕的音像录播设备
CN103838714A (zh) * 2012-11-22 2014-06-04 北大方正集团有限公司 一种语音信息转换方法及装置
CN103902529A (zh) * 2012-12-30 2014-07-02 上海能感物联网有限公司 外语自动实时标注中外文字幕音像录播方法
CN105631917A (zh) * 2014-11-06 2016-06-01 上海莱凯数码科技有限公司 一种数码动画制作过程中字幕翻译方法
CN105632514A (zh) * 2014-11-06 2016-06-01 上海莱凯数码科技有限公司 一种语义分析将语音转化为文字的方法及装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080052069A1 (en) * 2000-10-24 2008-02-28 Global Translation, Inc. Integrated speech recognition, closed captioning, and translation system and method
CN1762155A (zh) * 2003-02-21 2006-04-19 松下电器产业株式会社 同步地使用音频视频数据的设备和方法
CN201319640Y (zh) * 2008-12-01 2009-09-30 深圳市同洲电子股份有限公司 一种可实时同步翻译的数字电视接收终端
US20110069230A1 (en) * 2009-09-22 2011-03-24 Caption Colorado L.L.C. Caption and/or Metadata Synchronization for Replay of Previously or Simultaneously Recorded Live Programs
WO2013122909A1 (en) * 2012-02-13 2013-08-22 Ortsbo, Inc. Real time closed captioning language translation
CN103838714A (zh) * 2012-11-22 2014-06-04 北大方正集团有限公司 一种语音信息转换方法及装置
CN103902529A (zh) * 2012-12-30 2014-07-02 上海能感物联网有限公司 外语自动实时标注中外文字幕音像录播方法
CN103051945A (zh) * 2012-12-31 2013-04-17 广东欧珀移动通信有限公司 一种视频播放终端的字幕翻译方法、系统
CN103309855A (zh) * 2013-06-18 2013-09-18 江苏华音信息科技有限公司 汉语与外语自动实时语音翻译并标注字幕的音像录播设备
CN103297710A (zh) * 2013-06-19 2013-09-11 江苏华音信息科技有限公司 汉语自动实时标注中外文字幕音像录播设备
CN105631917A (zh) * 2014-11-06 2016-06-01 上海莱凯数码科技有限公司 一种数码动画制作过程中字幕翻译方法
CN105632514A (zh) * 2014-11-06 2016-06-01 上海莱凯数码科技有限公司 一种语义分析将语音转化为文字的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
严勤: "《语音信号处理与识别》", 31 December 2015, 国防工业出版社 *
姚喜双: "《新媒体时代广播电视语言研究》", 31 December 2013, 语文出版社 *

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107295307A (zh) * 2017-07-13 2017-10-24 安徽声讯信息技术有限公司 基于远程控制的文字与视频同步控制系统
CN107527618A (zh) * 2017-07-13 2017-12-29 安徽声讯信息技术有限公司 一种音频文字同步播放系统
CN107484002A (zh) * 2017-08-25 2017-12-15 四川长虹电器股份有限公司 智能翻译字幕的方法
CN107767871A (zh) * 2017-10-12 2018-03-06 安徽听见科技有限公司 文本显示方法、终端及服务器
CN108063970A (zh) * 2017-11-22 2018-05-22 北京奇艺世纪科技有限公司 一种处理直播流的方法和装置
CN108281145A (zh) * 2018-01-29 2018-07-13 南京地平线机器人技术有限公司 语音处理方法、语音处理装置和电子设备
CN108281145B (zh) * 2018-01-29 2021-07-02 南京地平线机器人技术有限公司 语音处理方法、语音处理装置和电子设备
CN108337559A (zh) * 2018-02-06 2018-07-27 杭州政信金服互联网科技有限公司 一种直播文字展示方法及系统
CN108366182A (zh) * 2018-02-13 2018-08-03 京东方科技集团股份有限公司 文字语音同步播报的校准方法及装置、计算机存储介质
CN111955013B (zh) * 2018-04-04 2023-03-03 诺基私人有限公司 促进实时流事件期间交互作用的方法和系统
CN111955013A (zh) * 2018-04-04 2020-11-17 诺基私人有限公司 促进实时流事件期间交互作用的方法和系统
CN108566558A (zh) * 2018-04-24 2018-09-21 腾讯科技(深圳)有限公司 视频流处理方法、装置、计算机设备及存储介质
CN108566558B (zh) * 2018-04-24 2023-02-28 腾讯科技(深圳)有限公司 视频流处理方法、装置、计算机设备及存储介质
US11252444B2 (en) 2018-04-24 2022-02-15 Tencent Technology (Shenzhen) Company Limited Video stream processing method, computer device, and storage medium
CN108829688A (zh) * 2018-06-21 2018-11-16 北京密境和风科技有限公司 跨语种交互的实现方法和装置
CN109255130A (zh) * 2018-07-17 2019-01-22 北京赛思美科技术有限公司 一种基于人工智能的语言翻译和学习的方法、系统和设备
CN109166583A (zh) * 2018-08-30 2019-01-08 安徽声讯信息技术有限公司 一种语音双平台文字同步直播系统及方法
US11562747B2 (en) 2018-09-25 2023-01-24 International Business Machines Corporation Speech-to-text transcription with multiple languages
US11049501B2 (en) 2018-09-25 2021-06-29 International Business Machines Corporation Speech-to-text transcription with multiple languages
CN109905756A (zh) * 2019-01-17 2019-06-18 平安科技(深圳)有限公司 基于人工智能的电视字幕动态生成方法及相关设备
CN109905756B (zh) * 2019-01-17 2021-11-12 平安科技(深圳)有限公司 基于人工智能的电视字幕动态生成方法及相关设备
CN111506278A (zh) * 2019-01-30 2020-08-07 阿里巴巴集团控股有限公司 数据同传的方法、音频翻译的方法、装置和系统
CN109949793A (zh) * 2019-03-06 2019-06-28 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN109819202A (zh) * 2019-03-20 2019-05-28 上海高屋信息科技有限公司 字幕添加装置及字幕添加方法
CN110335610A (zh) * 2019-07-19 2019-10-15 北京硬壳科技有限公司 多媒体翻译的控制方法及显示器
CN110689770A (zh) * 2019-08-12 2020-01-14 合肥马道信息科技有限公司 一种在线课堂语音转写和翻译系统及其工作方法
CN110769265A (zh) * 2019-10-08 2020-02-07 深圳创维-Rgb电子有限公司 一种同声字幕翻译方法、智能电视及存储介质
WO2021120190A1 (zh) * 2019-12-20 2021-06-24 深圳市欢太科技有限公司 数据处理方法、装置、电子设备和存储介质
CN112437337B (zh) * 2020-02-12 2023-07-07 上海哔哩哔哩科技有限公司 一种直播实时字幕的实现方法、系统及设备
CN112437337A (zh) * 2020-02-12 2021-03-02 上海哔哩哔哩科技有限公司 一种直播实时字幕的实现方法、系统及设备
CN111522971A (zh) * 2020-04-08 2020-08-11 广东小天才科技有限公司 一种直播教学中辅助用户听课的方法及装置
CN111931523A (zh) * 2020-04-26 2020-11-13 永康龙飘传感科技有限公司 在新闻播报实时翻译文字和手语的方法和系统
CN113613025A (zh) * 2020-05-05 2021-11-05 安徽文徽科技有限公司 一种实时语音转换字幕数据同步处理与画面合成直播的方法及装置
CN111709253A (zh) * 2020-05-26 2020-09-25 珠海九松科技有限公司 一种将方言自动转换为字幕的ai翻译方法和系统
CN111709253B (zh) * 2020-05-26 2023-10-24 珠海九松科技有限公司 一种将方言自动转换为字幕的ai翻译方法和系统
CN113301357A (zh) * 2020-07-27 2021-08-24 阿里巴巴集团控股有限公司 直播方法、装置及电子设备
WO2022022370A1 (zh) * 2020-07-27 2022-02-03 阿里巴巴集团控股有限公司 直播方法、装置及电子设备
CN112929758A (zh) * 2020-12-31 2021-06-08 广州朗国电子科技有限公司 一种多媒体内容字幕生成方法、设备以及存储介质
CN113115103A (zh) * 2021-03-09 2021-07-13 杭州麦趣网络科技有限公司 一种网络直播实现实时音频转文字的系统及方法
CN113068058A (zh) * 2021-03-19 2021-07-02 安徽宝信信息科技有限公司 一种基于语音识别及转写技术的实时字幕上屏直播系统
CN113873306A (zh) * 2021-09-23 2021-12-31 深圳市多狗乐智能研发有限公司 一种将实时翻译字幕叠加画面经硬件投射到直播间的方法
CN113992926A (zh) * 2021-10-19 2022-01-28 北京有竹居网络技术有限公司 界面显示方法、装置、电子设备和存储介质
CN113992926B (zh) * 2021-10-19 2023-09-12 北京有竹居网络技术有限公司 界面显示方法、装置、电子设备和存储介质
TWI830074B (zh) * 2021-10-20 2024-01-21 香港商冠捷投資有限公司 語音標示方法及其顯示裝置
CN115278331A (zh) * 2022-06-23 2022-11-01 中译语通科技股份有限公司 基于机器翻译的多语言字幕展示方法、系统、设备及介质
CN115278331B (zh) * 2022-06-23 2023-10-20 中译语通科技股份有限公司 基于机器翻译的多语言字幕展示方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
CN106340294A (zh) 基于同步翻译的新闻直播字幕在线制作系统
US11463779B2 (en) Video stream processing method and apparatus, computer device, and storage medium
US10034028B2 (en) Caption and/or metadata synchronization for replay of previously or simultaneously recorded live programs
CN108566558B (zh) 视频流处理方法、装置、计算机设备及存储介质
KR101899588B1 (ko) 수어 애니메이션 데이터를 자동으로 생성하는 시스템과 이를 이용한 방송시스템 및 방송방법
CN106791913A (zh) 数字电视节目同声翻译输出方法及系统
CN106340291A (zh) 一种双语字幕制作方法及系统
US20160212501A1 (en) Enabling Delivery and Synchronization of Auxiliary Content Associated with Multimedia Data
KR101246917B1 (ko) 미디어 재생 시스템의 사용자 간에 정보를 공유하는 방법및 시스템
CN106412678A (zh) 一种视频新闻实时转写存储方法及系统
KR101582574B1 (ko) 실시간 번역을 통한 디지털 방송의 다국어 자막 제공 서비스 장치 및 방법
US20140003792A1 (en) Systems, methods, and media for synchronizing and merging subtitles and media content
US20130151251A1 (en) Automatic dialog replacement by real-time analytic processing
Mikul Audio description background paper
CN105681917A (zh) 一种基于现场识别技术的弹幕系统
Luque et al. Integration of multisensorial stimuli and multimodal interaction in a hybrid 3DTV system
CN104410924B (zh) 一种多媒体字幕显示方法及装置
JP6948934B2 (ja) コンテンツ加工システム、端末装置、およびプログラム
CN108366305A (zh) 一种不带字幕的码流通过语音识别显示字幕的方法及系统
CN109905756A (zh) 基于人工智能的电视字幕动态生成方法及相关设备
CN108184078A (zh) 一种视频处理系统及其方法
KR20120038654A (ko) 방송 음성 인식 서비스를 제공하는 네트워크 tv와 서버 그리고 그 제어방법
US11665392B2 (en) Methods and systems for selective playback and attenuation of audio based on user preference
JP2022088788A (ja) メタデータ生成システム、映像コンテンツ管理システム及びプログラム
WO2003090014A3 (en) Method and system for internet-based interactive television

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170118