CN106791913A - 数字电视节目同声翻译输出方法及系统 - Google Patents
数字电视节目同声翻译输出方法及系统 Download PDFInfo
- Publication number
- CN106791913A CN106791913A CN201611253202.2A CN201611253202A CN106791913A CN 106791913 A CN106791913 A CN 106791913A CN 201611253202 A CN201611253202 A CN 201611253202A CN 106791913 A CN106791913 A CN 106791913A
- Authority
- CN
- China
- Prior art keywords
- data
- voice data
- voice
- audio
- tone color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/23614—Multiplexing of additional data and video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
Abstract
本发明涉及一种数字电视节目同声翻译输出方法及系统,将缓存的电视节目数据流进行视频、音频和字幕三者的分离,然后对音频数据进行分段、音色识别和翻译处理等处理,并利用字幕数据和时间戳进行修正和同步处理,完成将原始音频数据同声翻译成用户所需语言的音频数据,进而播放给用户,使得用户能够无需观看字幕就能够听懂电视节目的音频,给用户观看电视节目带来了极大的便利,用户不会因此错过电视节目的画面内容,大大提高了用户的观看体验。
Description
技术领域
本发明涉及数字电视领域,尤其涉及一种数字电视节目同声翻译输出方法及系统。
背景技术
目前,数字电视机顶盒(或电视机)播放的数字电视节目声音,都是节目中对应的原始声音,使得用户能够原汁原味的观看电视节目。
但是,节目的原始声音有可能是外语发声,例如英语电视节目。外语发声的电视节目为使听不懂外语的观众能够正常观看,往往会提供双语字幕,观众如果听不懂外语,就只能依赖于看屏幕下方的中文字幕才能看懂电视节目内容,而观看下方的中文字幕,往往会顾及不到电视节目中的内容画面,这将会很大程度的影响观众的观看效果,使得观众不能很好的观看电视节目,给观众带来不便。
发明内容
有鉴于此,有必要针对上述外语发声电视节目,观众观看中文字幕影响观众观看电视节目,带来不便的问题,提供一种数字电视节目同声翻译输出方法及系统。
本发明提供的一种数字电视节目同声翻译输出方法,包括如下步骤:
S10:控制音视频终端缓冲存储电视节目数据流;
S20:由缓冲存储的电视节目数据流中分别解析分离出视频数据、音频数据以及字幕数据,并在分离时标记时间戳,为三者标记上同步标签;
S30:对音频数据进行分段,并将分段后的音频数据进行解码处理,生成分段的原始PCM数据;
S40:将分段的原始PCM数据发送到云端服务器通过预设的音色数据库进行音色学习,匹配识别出音频数据的音色;
S50:将原始的PCM数据在云端服务器进行用户所需语言的文字翻译,并将翻译结果与字幕数据进行比对,采用字幕数据对翻译结果进行内容和时间的同步修正;
S60:根据识别出的音色,将修正后的翻译结果转换成相同音色的语音数据,并将语音数据按照时间戳与视频数据、字幕数据进行同步合成,合成新的节目数据流进行播放。
在其中的一个实施方式中,所述步骤S20还包括:
在获取到音频数据后,对除人声之外的环境声音进行过滤。
在其中的一个实施方式中,所述步骤S30还包括:解析字幕数据中的标点符号,获取每一个句号处的时间位置,按照句号处的时间位置对音频数据进行分段。
在其中的一个实施方式中,所述步骤S60还包括:将转换后的语音数据的振幅与原音频数据的振幅进行比对调整,使转换后语音数据的振幅与原音频数据的振幅保持一致。
本发明提供的一种数字电视节目同声翻译输出系统,包括:
电视节目缓存模块,控制音视频终端缓冲存储电视节目数据流;
数据分离模块,由缓冲存储的电视节目数据流中分别解析分离出视频数据、音频数据以及字幕数据,并在分离时标记时间戳,为三者标记上同步标签;
音频分段模块,对音频数据进行分段,并将分段后的音频数据进行解码处理,生成分段的原始PCM数据;
音色匹配模块,将分段的原始PCM数据发送到云端服务器通过预设的音色数据库进行音色学习,匹配识别出音频数据的音色;
音频翻译模块,将原始的PCM数据在云端服务器进行用户所需语言的文字翻译,并将翻译结果与字幕数据进行比对,采用字幕数据对翻译结果进行内容和时间的同步修正;
音频合成模块,根据识别出的音色,将修正后的翻译结果转换成相同音色的语音数据,并将语音数据按照时间戳与视频数据、字幕数据进行同步合成,合成新的节目数据流进行播放。
在其中的一个实施方式中,所述数据分离模块在获取到音频数据后,对除人声之外的环境声音进行过滤。
在其中的一个实施方式中,所述音频分段模块解析字幕数据中的标点符号,获取每一个句号处的时间位置,按照句号处的时间位置对音频数据进行分段。
在其中的一个实施方式中,所述音频合成模块将转换后的语音数据的振幅与原音频数据的振幅进行比对调整,使转换后语音数据的振幅与原音频数据的振幅保持一致。
本发明数字电视节目同声翻译输出方法及系统,将缓存的电视节目数据流进行视频、音频和字幕三者的分离,然后对音频数据进行分段、音色识别和翻译处理等处理,并利用字幕数据和时间戳进行修正和同步处理,完成将原始音频数据同声翻译成用户所需语言的音频数据,进而播放给用户,使得用户能够无需观看字幕就能够听懂电视节目的音频,给用户观看电视节目带来了极大的便利,用户不会因此错过电视节目的画面内容,大大提高了用户的观看体验。
附图说明
图1是一个实施例中的数字电视节目同声翻译输出方法的流程图;
图2是一个实施例中的数字电视节目同声翻译输出系统的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
图1是一个实施例中的数字电视节目同声翻译输出方法的流程图,如图1所示,该方法包括如下步骤:
S10:控制音视频终端缓冲存储电视节目数据流。
由于电视节目很多是实时节目,电视节目数据流很多是实时流,故为使得能够对电视节目进行同声翻译,该实施例中,首先需要对电视节目数据流进行缓存播放,通过缓存时间对电视节目数据流进行处理。
S20:由缓冲存储的电视节目数据流中分别解析分离出视频数据、音频数据以及字幕数据,并在分离时标记时间戳,为三者标记上同步标签。
在缓存存储电视节目数据流之后,将视频数据、音频数据以及字幕数据三者分离,以便后续进行音频转换。该实施例中,为保证分离后重组能够同步,在三者分离时标记时间戳,并为三者标记上同步标签,这样保证后续的同步性操作。
由于音频数据除包含人声之外,还包括大量的环境声音,环境声音会对人声造成干扰,故进一步的,该步骤还包括:在获取到音频数据后,对除人声之外的环境声音进行过滤。
S30:对音频数据进行分段,并将分段后的音频数据进行解码处理,生成分段的原始PCM(一种编码格式,也称为脉冲编码调制)数据。
为保证音频数据语句的完整性和合理性,需要对音频数据进行分段,分段后也便利翻译处理。分段后将音频数据解码成原始PCM数据,以便能够识别和处理。
进一步的,该步骤中对音频数据进行分段具体为:解析字幕数据中的标点符号,获取每一个句号处的时间位置,按照句号处的时间位置对音频数据进行分段,这样就按照语句的完整性和连贯性很好的对音频数据进行了分段。
S40:将分段的原始PCM数据发送到云端服务器通过预设的音色数据库进行音色学习,匹配识别出音频数据的音色。
由于音频翻译时,除音频内容外,音频的音色也是重要的参数,音色的准确翻译能够极大的保证同声翻译的效果,故该实施例中,在将音频数据转换为PCM数据后,发送到前端进行音色学习处理,利用预先设置的音色数据库来匹配PCM数据中的音色,最大可能的真实还原。预设的音色数据库通过输入不同年龄和性别的声音来构建。
S50:将原始的PCM数据在云端服务器进行用户所需语言的文字翻译,并将翻译结果与字幕数据进行比对,采用字幕数据对翻译结果进行内容和时间的同步修正。
在音色学习完毕后,由于原始的PCM数据为外语发声,故需要进行翻译,翻译成用户所需要的语言发声。首先将原始的PCM数据在云端服务器翻译成用户所需语言的文字语句,文字语句翻译完毕后,由于翻译可能存在较大的误差,故将翻译结果与字幕数据进行比对,利用字幕数据来对翻译结果进行内容修正,并且进行时间上的同步,消除翻译结果在内容和时间同步上的误差。
S60:根据识别出的音色,将修正后的翻译结果转换成相同音色的语音数据,并将语音数据按照时间戳与视频数据、字幕数据进行同步合成,合成新的节目数据流进行播放。
在文字翻译得到翻译结果并修正后,由于之前已经得到音频数据的音色数据,则结合识别出的音色,来对翻译结果进行语音合成,将修正后的翻译结果转换成相同音色的语音数据,得到翻译后的新音频数据,最后按照时间戳与视频数据、字幕数据进行同步合成,得到翻译后的节目数据流进行播放,即可完成对电视节目的同声翻译,使得用户能够听懂电视节目的音频,满足用户需求。
此外,为进一步提高同声翻译的效果,该步骤还包括:将转换后的语音数据的振幅与原音频数据的振幅进行比对调整,使转换后语音数据的振幅与原音频数据的振幅保持一致。
该数字电视节目同声翻译输出方法,将缓存的电视节目数据流进行视频、音频和字幕三者的分离,然后对音频数据进行分段、音色识别和翻译处理等处理,并利用字幕数据和时间戳进行修正和同步处理,完成将原始音频数据同声翻译成用户所需语言的音频数据,进而播放给用户,使得用户能够无需观看字幕就能够听懂电视节目的音频,给用户观看电视节目带来了极大的便利,用户不会因此错过电视节目的画面内容,大大提高了用户的观看体验。
同时,本发明还提供一种数字电视节目同声翻译输出系统,如图2所示,该系统包括:
电视节目缓存模块100,控制音视频终端缓冲存储电视节目数据流。
由于电视节目很多是实时节目,电视节目数据流很多是实时流,故为使得能够对电视节目进行同声翻译,该实施例中,电视节目缓存模块100首先需要对电视节目数据流进行缓存播放,通过缓存时间对电视节目数据流进行处理。
数据分离模块200,由缓冲存储的电视节目数据流中分别解析分离出视频数据、音频数据以及字幕数据,并在分离时标记时间戳,为三者标记上同步标签。
在缓存存储电视节目数据流之后,数据分离模块200将视频数据、音频数据以及字幕数据三者分离,以便后续进行音频转换。该实施例中,为保证分离后重组能够同步,数据分离模块200在三者分离时标记时间戳,并为三者标记上同步标签,这样保证后续的同步性操作。
由于音频数据除包含人声之外,还包括大量的环境声音,环境声音会对人声造成干扰,故进一步的,数据分离模块200在获取到音频数据后,对除人声之外的环境声音进行过滤。
音频分段模块300,对音频数据进行分段,并将分段后的音频数据进行解码处理,生成分段的原始PCM(一种编码格式,也称为脉冲编码调制)数据。
为保证音频数据语句的完整性和合理性,音频分段模块300需要对音频数据进行分段,分段后也便利翻译处理。分段后将音频数据解码成原始PCM数据,以便能够识别和处理。
进一步的,音频分段模块300解析字幕数据中的标点符号,获取每一个句号处的时间位置,按照句号处的时间位置对音频数据进行分段,这样就按照语句的完整性和连贯性很好的对音频数据进行了分段。
音色匹配模块400,将分段的原始PCM数据发送到云端服务器通过预设的音色数据库进行音色学习,匹配识别出音频数据的音色。
由于音频翻译时,除音频内容外,音频的音色也是重要的参数,音色的准确翻译能够极大的保证同声翻译的效果,故该实施例中,在将音频数据转换为PCM数据后,发送到前端进行音色学习处理,音色匹配模块400利用预先设置的音色数据库来匹配PCM数据中的音色,最大可能的真实还原。预设的音色数据库通过输入不同年龄和性别的声音来构建。
音频翻译模块500,将原始的PCM数据在云端服务器进行用户所需语言的文字翻译,并将翻译结果与字幕数据进行比对,采用字幕数据对翻译结果进行内容和时间的同步修正。
在音色学习完毕后,由于原始的PCM数据为外语发声,故需要进行翻译,翻译成用户所需要的语言发声。音频翻译模块500首先将原始的PCM数据在云端服务器翻译成用户所需语言的文字语句,文字语句翻译完毕后,由于翻译可能存在较大的误差,故将翻译结果与字幕数据进行比对,利用字幕数据来对翻译结果进行内容修正,并且进行时间上的同步,消除翻译结果在内容和时间同步上的误差。
音频合成模块600,根据识别出的音色,将修正后的翻译结果转换成相同音色的语音数据,并将语音数据按照时间戳与视频数据、字幕数据进行同步合成,合成新的节目数据流进行播放。
在文字翻译得到翻译结果并修正后,由于之前已经得到音频数据的音色数据,音频合成模块600则结合识别出的音色,来对翻译结果进行语音合成,将修正后的翻译结果转换成相同音色的语音数据,得到翻译后的新音频数据,最后按照时间戳与视频数据、字幕数据进行同步合成,得到翻译后的节目数据流进行播放,即可完成对电视节目的同声翻译,使得用户能够听懂电视节目的音频,满足用户需求。
此外,为进一步提高同声翻译的效果,音频合成模块600将转换后的语音数据的振幅与原音频数据的振幅进行比对调整,使转换后语音数据的振幅与原音频数据的振幅保持一致。
该数字电视节目同声翻译输出系统,将缓存的电视节目数据流进行视频、音频和字幕三者的分离,然后对音频数据进行分段、音色识别和翻译处理等处理,并利用字幕数据和时间戳进行修正和同步处理,完成将原始音频数据同声翻译成用户所需语言的音频数据,进而播放给用户,使得用户能够无需观看字幕就能够听懂电视节目的音频,给用户观看电视节目带来了极大的便利,用户不会因此错过电视节目的画面内容,大大提高了用户的观看体验。
本发明数字电视节目同声翻译输出方法及系统,将缓存的电视节目数据流进行视频、音频和字幕三者的分离,然后对音频数据进行分段、音色识别和翻译处理等处理,并利用字幕数据和时间戳进行修正和同步处理,完成将原始音频数据同声翻译成用户所需语言的音频数据,进而播放给用户,使得用户能够无需观看字幕就能够听懂电视节目的音频,给用户观看电视节目带来了极大的便利,用户不会因此错过电视节目的画面内容,大大提高了用户的观看体验。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种数字电视节目同声翻译输出方法,其特征在于,包括如下步骤:
S10:控制音视频终端缓冲存储电视节目数据流;
S20:由缓冲存储的电视节目数据流中分别解析分离出视频数据、音频数据以及字幕数据,并在分离时标记时间戳,为三者标记上同步标签;
S30:对音频数据进行分段,并将分段后的音频数据进行解码处理,生成分段的原始PCM数据;
S40:将分段的原始PCM数据发送到云端服务器通过预设的音色数据库进行音色学习,匹配识别出音频数据的音色;
S50:将原始的PCM数据在云端服务器进行用户所需语言的文字翻译,并将翻译结果与字幕数据进行比对,采用字幕数据对翻译结果进行内容和时间的同步修正;
S60:根据识别出的音色,将修正后的翻译结果转换成相同音色的语音数据,并将语音数据按照时间戳与视频数据、字幕数据进行同步合成,合成新的节目数据流进行播放。
2.根据权利要求1所述的数字电视节目同声翻译输出方法,其特征在于,所述步骤S20还包括:
在获取到音频数据后,对除人声之外的环境声音进行过滤。
3.根据权利要求2所述的数字电视节目同声翻译输出方法,其特征在于,所述步骤S30还包括:解析字幕数据中的标点符号,获取每一个句号处的时间位置,按照句号处的时间位置对音频数据进行分段。
4.根据权利要求3所述的数字电视节目同声翻译输出方法,其特征在于,所述步骤S60还包括:将转换后的语音数据的振幅与原音频数据的振幅进行比对调整,使转换后语音数据的振幅与原音频数据的振幅保持一致。
5.一种数字电视节目同声翻译输出系统,其特征在于,包括:
电视节目缓存模块,控制音视频终端缓冲存储电视节目数据流;
数据分离模块,由缓冲存储的电视节目数据流中分别解析分离出视频数据、音频数据以及字幕数据,并在分离时标记时间戳,为三者标记上同步标签;
音频分段模块,对音频数据进行分段,并将分段后的音频数据进行解码处理,生成分段的原始PCM数据;
音色匹配模块,将分段的原始PCM数据发送到云端服务器通过预设的音色数据库进行音色学习,匹配识别出音频数据的音色;
音频翻译模块,将原始的PCM数据在云端服务器进行用户所需语言的文字翻译,并将翻译结果与字幕数据进行比对,采用字幕数据对翻译结果进行内容和时间的同步修正;
音频合成模块,根据识别出的音色,将修正后的翻译结果转换成相同音色的语音数据,并将语音数据按照时间戳与视频数据、字幕数据进行同步合成,合成新的节目数据流进行播放。
6.根据权利要求5所述的数字电视节目同声翻译输出系统,其特征在于,所述数据分离模块在获取到音频数据后,对除人声之外的环境声音进行过滤。
7.根据权利要求6所述的数字电视节目同声翻译输出系统,其特征在于,所述音频分段模块解析字幕数据中的标点符号,获取每一个句号处的时间位置,按照句号处的时间位置对音频数据进行分段。
8.根据权利要求7所述的数字电视节目同声翻译输出系统,其特征在于,所述音频合成模块将转换后的语音数据的振幅与原音频数据的振幅进行比对调整,使转换后语音数据的振幅与原音频数据的振幅保持一致。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611253202.2A CN106791913A (zh) | 2016-12-30 | 2016-12-30 | 数字电视节目同声翻译输出方法及系统 |
PCT/CN2017/106377 WO2018121001A1 (zh) | 2016-12-30 | 2017-10-16 | 数字电视节目同声翻译输出方法、系统及智能终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611253202.2A CN106791913A (zh) | 2016-12-30 | 2016-12-30 | 数字电视节目同声翻译输出方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106791913A true CN106791913A (zh) | 2017-05-31 |
Family
ID=58953091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611253202.2A Pending CN106791913A (zh) | 2016-12-30 | 2016-12-30 | 数字电视节目同声翻译输出方法及系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN106791913A (zh) |
WO (1) | WO2018121001A1 (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107222792A (zh) * | 2017-07-11 | 2017-09-29 | 成都德芯数字科技股份有限公司 | 一种字幕叠加方法及装置 |
CN107527618A (zh) * | 2017-07-13 | 2017-12-29 | 安徽声讯信息技术有限公司 | 一种音频文字同步播放系统 |
CN107688792A (zh) * | 2017-09-05 | 2018-02-13 | 语联网(武汉)信息技术有限公司 | 一种视频翻译方法及其系统 |
CN107992485A (zh) * | 2017-11-27 | 2018-05-04 | 北京搜狗科技发展有限公司 | 一种同声传译方法及装置 |
WO2018121001A1 (zh) * | 2016-12-30 | 2018-07-05 | 深圳市九洲电器有限公司 | 数字电视节目同声翻译输出方法、系统及智能终端 |
CN108366305A (zh) * | 2018-02-07 | 2018-08-03 | 深圳佳力拓科技有限公司 | 一种不带字幕的码流通过语音识别显示字幕的方法及系统 |
CN108447486A (zh) * | 2018-02-28 | 2018-08-24 | 科大讯飞股份有限公司 | 一种语音翻译方法及装置 |
CN108962293A (zh) * | 2018-07-10 | 2018-12-07 | 武汉轻工大学 | 录像修正方法、系统、终端设备及存储介质 |
CN109119063A (zh) * | 2018-08-31 | 2019-01-01 | 腾讯科技(深圳)有限公司 | 视频配音生成方法、装置、设备及存储介质 |
CN109963092A (zh) * | 2017-12-26 | 2019-07-02 | 深圳市优必选科技有限公司 | 一种字幕的处理方法、装置及终端 |
CN110121097A (zh) * | 2019-05-13 | 2019-08-13 | 深圳市亿联智能有限公司 | 具有无障碍功能的多媒体播放装置及方法 |
WO2019194742A1 (en) * | 2018-04-04 | 2019-10-10 | Nooggi Pte Ltd | A method and system for promoting interaction during live streaming events |
CN110335610A (zh) * | 2019-07-19 | 2019-10-15 | 北京硬壳科技有限公司 | 多媒体翻译的控制方法及显示器 |
CN110767233A (zh) * | 2019-10-30 | 2020-02-07 | 合肥名阳信息技术有限公司 | 一种语音转换系统及方法 |
CN111758264A (zh) * | 2018-02-26 | 2020-10-09 | 谷歌有限责任公司 | 预先录制的视频的自动语音翻译配音 |
CN111931523A (zh) * | 2020-04-26 | 2020-11-13 | 永康龙飘传感科技有限公司 | 在新闻播报实时翻译文字和手语的方法和系统 |
CN112423106A (zh) * | 2020-11-06 | 2021-02-26 | 四川长虹电器股份有限公司 | 一种自动翻译伴音的方法及系统 |
CN113808576A (zh) * | 2020-06-16 | 2021-12-17 | 阿里巴巴集团控股有限公司 | 语音转换方法、装置及计算机系统 |
CN114007116A (zh) * | 2022-01-05 | 2022-02-01 | 凯新创达(深圳)科技发展有限公司 | 一种视频处理方法、视频处理装置 |
WO2022037388A1 (zh) * | 2020-08-17 | 2022-02-24 | 北京字节跳动网络技术有限公司 | 语音生成方法、装置、设备和计算机可读介质 |
CN114283227A (zh) * | 2021-11-26 | 2022-04-05 | 北京百度网讯科技有限公司 | 虚拟人物的驱动方法、装置、电子设备及可读存储介质 |
CN114554238A (zh) * | 2022-02-23 | 2022-05-27 | 北京有竹居网络技术有限公司 | 直播语音同传方法、装置、介质及电子设备 |
US11955118B2 (en) | 2019-09-17 | 2024-04-09 | Samsung Electronics Co., Ltd. | Method and apparatus with real-time translation |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113473238B (zh) * | 2020-04-29 | 2022-10-18 | 海信集团有限公司 | 一种智能设备及视频通话时的同声翻译方法 |
CN113225615B (zh) * | 2021-04-20 | 2023-08-08 | 深圳市九洲电器有限公司 | 电视节目播放方法、终端设备、服务器以及存储介质 |
CN113891168B (zh) * | 2021-10-19 | 2023-12-19 | 北京有竹居网络技术有限公司 | 字幕处理方法、装置、电子设备和存储介质 |
CN114157920B (zh) * | 2021-12-10 | 2023-07-25 | 深圳Tcl新技术有限公司 | 一种展示手语的播放方法、装置、智能电视及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999063756A1 (en) * | 1998-06-04 | 1999-12-09 | Roberto Trinca | Process for carrying out videoconferences with the simultaneous insertion of auxiliary information and films with television modalities |
CN1774715A (zh) * | 2003-04-14 | 2006-05-17 | 皇家飞利浦电子股份有限公司 | 用于对音频-视频流执行自动配音的系统和方法 |
CN102881283A (zh) * | 2011-07-13 | 2013-01-16 | 三星电子(中国)研发中心 | 用于语音处理的方法与系统 |
CN103491429A (zh) * | 2013-09-04 | 2014-01-01 | 张家港保税区润桐电子技术研发有限公司 | 一种音频处理方法和音频处理设备 |
CN104299619A (zh) * | 2014-09-29 | 2015-01-21 | 广东欧珀移动通信有限公司 | 一种音频文件的处理方法及装置 |
KR20150025750A (ko) * | 2013-08-30 | 2015-03-11 | 삼성전자주식회사 | 사용자 단말 장치 및 그 양방향 번역 방법 |
CN104427294A (zh) * | 2013-08-29 | 2015-03-18 | 中兴通讯股份有限公司 | 支持电视会议同声传译的方法及云端服务器 |
CN105280179A (zh) * | 2015-11-02 | 2016-01-27 | 小天才科技有限公司 | 一种文字转语音的处理方法及系统 |
CN105957517A (zh) * | 2016-04-29 | 2016-09-21 | 中国南方电网有限责任公司电网技术研究中心 | 基于开源api的语音数据结构化转换方法及其系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001224002A (ja) * | 2000-02-08 | 2001-08-17 | Atr Interpreting Telecommunications Res Lab | 音声・映像同期方法および音声・映像処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
CN102821259B (zh) * | 2012-07-20 | 2016-12-21 | 冠捷显示科技(厦门)有限公司 | 具有多国语言语音翻译的tv系统及其实现方法 |
CN105704579A (zh) * | 2014-11-27 | 2016-06-22 | 南京苏宁软件技术有限公司 | 媒体播放中实时自动翻译字幕的方法和系统 |
CN204697226U (zh) * | 2015-06-19 | 2015-10-07 | 深圳市人和智聚科技开发有限公司 | 一种具有视频播放功能的电子设备 |
CN105227967A (zh) * | 2015-10-08 | 2016-01-06 | 微鲸科技有限公司 | 支持智能翻译的电视机 |
CN106791913A (zh) * | 2016-12-30 | 2017-05-31 | 深圳市九洲电器有限公司 | 数字电视节目同声翻译输出方法及系统 |
-
2016
- 2016-12-30 CN CN201611253202.2A patent/CN106791913A/zh active Pending
-
2017
- 2017-10-16 WO PCT/CN2017/106377 patent/WO2018121001A1/zh active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999063756A1 (en) * | 1998-06-04 | 1999-12-09 | Roberto Trinca | Process for carrying out videoconferences with the simultaneous insertion of auxiliary information and films with television modalities |
CN1774715A (zh) * | 2003-04-14 | 2006-05-17 | 皇家飞利浦电子股份有限公司 | 用于对音频-视频流执行自动配音的系统和方法 |
CN102881283A (zh) * | 2011-07-13 | 2013-01-16 | 三星电子(中国)研发中心 | 用于语音处理的方法与系统 |
CN104427294A (zh) * | 2013-08-29 | 2015-03-18 | 中兴通讯股份有限公司 | 支持电视会议同声传译的方法及云端服务器 |
KR20150025750A (ko) * | 2013-08-30 | 2015-03-11 | 삼성전자주식회사 | 사용자 단말 장치 및 그 양방향 번역 방법 |
CN103491429A (zh) * | 2013-09-04 | 2014-01-01 | 张家港保税区润桐电子技术研发有限公司 | 一种音频处理方法和音频处理设备 |
CN104299619A (zh) * | 2014-09-29 | 2015-01-21 | 广东欧珀移动通信有限公司 | 一种音频文件的处理方法及装置 |
CN105280179A (zh) * | 2015-11-02 | 2016-01-27 | 小天才科技有限公司 | 一种文字转语音的处理方法及系统 |
CN105957517A (zh) * | 2016-04-29 | 2016-09-21 | 中国南方电网有限责任公司电网技术研究中心 | 基于开源api的语音数据结构化转换方法及其系统 |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018121001A1 (zh) * | 2016-12-30 | 2018-07-05 | 深圳市九洲电器有限公司 | 数字电视节目同声翻译输出方法、系统及智能终端 |
CN107222792A (zh) * | 2017-07-11 | 2017-09-29 | 成都德芯数字科技股份有限公司 | 一种字幕叠加方法及装置 |
CN107527618A (zh) * | 2017-07-13 | 2017-12-29 | 安徽声讯信息技术有限公司 | 一种音频文字同步播放系统 |
CN107688792A (zh) * | 2017-09-05 | 2018-02-13 | 语联网(武汉)信息技术有限公司 | 一种视频翻译方法及其系统 |
CN107992485A (zh) * | 2017-11-27 | 2018-05-04 | 北京搜狗科技发展有限公司 | 一种同声传译方法及装置 |
CN109963092A (zh) * | 2017-12-26 | 2019-07-02 | 深圳市优必选科技有限公司 | 一种字幕的处理方法、装置及终端 |
CN108366305A (zh) * | 2018-02-07 | 2018-08-03 | 深圳佳力拓科技有限公司 | 一种不带字幕的码流通过语音识别显示字幕的方法及系统 |
CN111758264A (zh) * | 2018-02-26 | 2020-10-09 | 谷歌有限责任公司 | 预先录制的视频的自动语音翻译配音 |
US11582527B2 (en) | 2018-02-26 | 2023-02-14 | Google Llc | Automated voice translation dubbing for prerecorded video |
CN108447486A (zh) * | 2018-02-28 | 2018-08-24 | 科大讯飞股份有限公司 | 一种语音翻译方法及装置 |
US11277674B2 (en) | 2018-04-04 | 2022-03-15 | Nooggi Pte Ltd | Method and system for promoting interaction during live streaming events |
WO2019194742A1 (en) * | 2018-04-04 | 2019-10-10 | Nooggi Pte Ltd | A method and system for promoting interaction during live streaming events |
CN108962293A (zh) * | 2018-07-10 | 2018-12-07 | 武汉轻工大学 | 录像修正方法、系统、终端设备及存储介质 |
CN109119063A (zh) * | 2018-08-31 | 2019-01-01 | 腾讯科技(深圳)有限公司 | 视频配音生成方法、装置、设备及存储介质 |
CN109119063B (zh) * | 2018-08-31 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 视频配音生成方法、装置、设备及存储介质 |
CN110121097A (zh) * | 2019-05-13 | 2019-08-13 | 深圳市亿联智能有限公司 | 具有无障碍功能的多媒体播放装置及方法 |
CN110335610A (zh) * | 2019-07-19 | 2019-10-15 | 北京硬壳科技有限公司 | 多媒体翻译的控制方法及显示器 |
US11955118B2 (en) | 2019-09-17 | 2024-04-09 | Samsung Electronics Co., Ltd. | Method and apparatus with real-time translation |
CN110767233A (zh) * | 2019-10-30 | 2020-02-07 | 合肥名阳信息技术有限公司 | 一种语音转换系统及方法 |
CN111931523A (zh) * | 2020-04-26 | 2020-11-13 | 永康龙飘传感科技有限公司 | 在新闻播报实时翻译文字和手语的方法和系统 |
CN113808576A (zh) * | 2020-06-16 | 2021-12-17 | 阿里巴巴集团控股有限公司 | 语音转换方法、装置及计算机系统 |
WO2022037388A1 (zh) * | 2020-08-17 | 2022-02-24 | 北京字节跳动网络技术有限公司 | 语音生成方法、装置、设备和计算机可读介质 |
CN112423106A (zh) * | 2020-11-06 | 2021-02-26 | 四川长虹电器股份有限公司 | 一种自动翻译伴音的方法及系统 |
CN114283227A (zh) * | 2021-11-26 | 2022-04-05 | 北京百度网讯科技有限公司 | 虚拟人物的驱动方法、装置、电子设备及可读存储介质 |
CN114283227B (zh) * | 2021-11-26 | 2023-04-07 | 北京百度网讯科技有限公司 | 虚拟人物的驱动方法、装置、电子设备及可读存储介质 |
CN114007116A (zh) * | 2022-01-05 | 2022-02-01 | 凯新创达(深圳)科技发展有限公司 | 一种视频处理方法、视频处理装置 |
CN114554238A (zh) * | 2022-02-23 | 2022-05-27 | 北京有竹居网络技术有限公司 | 直播语音同传方法、装置、介质及电子设备 |
CN114554238B (zh) * | 2022-02-23 | 2023-08-11 | 北京有竹居网络技术有限公司 | 直播语音同传方法、装置、介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2018121001A1 (zh) | 2018-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106791913A (zh) | 数字电视节目同声翻译输出方法及系统 | |
US11463779B2 (en) | Video stream processing method and apparatus, computer device, and storage medium | |
US8045054B2 (en) | Closed captioning language translation | |
US20160066055A1 (en) | Method and system for automatically adding subtitles to streaming media content | |
US9584837B2 (en) | Receiving device and method of controlling the same, distribution device and distribution method, program, and distribution system | |
US20060285654A1 (en) | System and method for performing automatic dubbing on an audio-visual stream | |
CN106340294A (zh) | 基于同步翻译的新闻直播字幕在线制作系统 | |
US8781291B2 (en) | Data processing device, data processing method, and program | |
KR101899588B1 (ko) | 수어 애니메이션 데이터를 자동으로 생성하는 시스템과 이를 이용한 방송시스템 및 방송방법 | |
US20130219444A1 (en) | Receiving apparatus and subtitle processing method | |
KR20150021258A (ko) | 디스플레이장치 및 그 제어방법 | |
CN103067775A (zh) | 一种音视频终端的字幕显示方法、音视频终端及服务器 | |
US10341631B2 (en) | Controlling modes of sub-title presentation | |
CN102055941A (zh) | 视频播放器及视频播放方法 | |
CN107105352A (zh) | 字幕同步方法及装置 | |
US20150215564A1 (en) | Methods and apparatus for creation of a reference time index for audio/video programming | |
KR101582574B1 (ko) | 실시간 번역을 통한 디지털 방송의 다국어 자막 제공 서비스 장치 및 방법 | |
US8988605B2 (en) | Display apparatus and control method thereof | |
US10299009B2 (en) | Controlling speed of the display of sub-titles | |
CN112055253B (zh) | 独立字幕流的添加复用方法和装置 | |
JP2015173444A (ja) | 受信機 | |
Real et al. | An architecture for the implementation of the Ecuadorian sign language into digital television system | |
KR20130032655A (ko) | 검색을 이용한 수화 방송 장치 및 방법 | |
Paes et al. | Method for Synchronized Driving of Sign Language Avatar Using a Digital TV Signal | |
JP2015159366A (ja) | 受信機 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170531 |
|
RJ01 | Rejection of invention patent application after publication |