CN111556372A - 为视音频节目实时添加字幕的方法和装置 - Google Patents
为视音频节目实时添加字幕的方法和装置 Download PDFInfo
- Publication number
- CN111556372A CN111556372A CN202010313136.3A CN202010313136A CN111556372A CN 111556372 A CN111556372 A CN 111556372A CN 202010313136 A CN202010313136 A CN 202010313136A CN 111556372 A CN111556372 A CN 111556372A
- Authority
- CN
- China
- Prior art keywords
- video
- text
- word segmentation
- subtitles
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000011218 segmentation Effects 0.000 claims abstract description 85
- 230000036651 mood Effects 0.000 claims description 7
- 208000032041 Hearing impaired Diseases 0.000 abstract description 11
- 238000004590 computer program Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 206010011878 Deafness Diseases 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440236—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Studio Circuits (AREA)
Abstract
本申请公开了一种为视音频节目实时添加字幕的方法和装置,涉及辅助字幕领域。该方法包括:获取视音频节目;使用语音识别引擎实时将所述视音频节目的语音转换成文本;采用分词算法将所述文本生成字幕;将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出。该装置包括:获取模块、识别模块、字幕模块和匹配模块。本发明实现了字幕和视音频画面“一块屏”的输出,彻底解决了听障人士无法观看无字幕视音频节目或只能多屏配合收看的痛处。
Description
技术领域
本申请涉及辅助字幕领域,特别是涉及一种为视音频节目实时添加字幕的方法和装置。
背景技术
在数字有线电视时代,有线电视采用的是电视机+外置机顶盒的方式来实现播放的。在各种类型的视音频节目中,新闻和直播体育赛事等视音频节目均没有字幕,此种情况下聋人无法准确知晓视音频节目内容。根据第二次全国残疾人抽样调查,我国有2057万听力言语残疾人,占残疾人总数的三分之一。每年还新增聋儿3万人,这一群体对直播节目的字幕需求极为迫切。
目前,聋人收看无字幕电视节目采用的手段主要是,在手机上打开如讯飞听见、音书等APP,开启语音识别后,APP上就会出现当前播放的电视节目的声音转换后的文本,从而可以进行查看。
但是,上述现有技术的缺点显而易见,首先观看者需要同时观看电视屏幕和手机屏幕两块屏,在电视屏幕上观看视频画面,在手机屏幕上观看文本,无法同时顾及,体验非常差。另外,手机APP中转换出来的密密麻麻的大段文本,通常错别字较多,且毫无逻辑,理解起来相当吃力,根本无法与电视上分行显示且断句逻辑清晰的字幕相比,因此,对理解电视节目内容的效果大打折扣,无法满足听障人士获取字幕的现实需求。
发明内容
本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
根据本申请的一个方面,提供了一种为视音频节目实时添加字幕的方法,包括:
获取视音频节目;
使用语音识别引擎实时将所述视音频节目的语音转换成文本;
采用分词算法将所述文本生成字幕;
将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出。
可选地,采用分词算法将所述文本生成字幕,包括:
采用分词算法对所述文本进行分词、分句和分行处理后得到字幕。
可选地,采用分词算法对所述文本进行分词、分句和分行处理后得到字幕,包括:
采用分词算法对所述文本进行分词,替换其中的特殊标点符号,按照语气间隔进行分句,且对过短语句进行自动拼接,然后进行分行,如果超过每行上限字数则进行切割,最终得到字幕。
可选地,所述方法还包括:
在分行之前,过滤掉背景音乐和歌曲的识别结果,处理病句和错句,过滤重复文字。
可选地,所述方法还包括:
获取视音频节目之后,判断当前设置的字幕状态,如果为开启状态,则执行后续生成字幕及输出的流程,如果为关闭状态,则直接输出所述视音频节目。
根据本申请的另一个方面,提供了一种为视音频节目实时添加字幕的装置,包括:
获取模块,其配置成获取视音频节目;
识别模块,其配置成使用语音识别引擎实时将所述视音频节目的语音转换成文本;
字幕模块,其配置成采用分词算法将所述文本生成字幕;
匹配模块,其配置成将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出。
可选地,所述字幕模块包括:
分词算法单元,其配置成采用分词算法对所述文本进行分词、分句和分行处理后得到字幕。
可选地,所述分词算法单元具体配置成:
采用分词算法对所述文本进行分词,替换其中的特殊标点符号,按照语气间隔进行分句,且对过短语句进行自动拼接,然后进行分行,如果超过每行上限字数则进行切割,最终得到字幕。
可选地,所述分词算法单元还配置成:
在分行之前,过滤掉背景音乐和歌曲的识别结果,处理病句和错句,过滤重复文字。
可选地,所述装置还包括:
控制模块,其配置成在所述获取模块获取视音频节目之后,判断当前设置的字幕状态,如果为开启状态,则触发所述识别模块执行后续流程,如果为关闭状态,则直接输出所述视音频节目。
根据本申请的又一个方面,提供了一种计算设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上所述的方法。
根据本申请的又一个方面,提供了一种计算机可读存储介质,优选为非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现如上所述的方法。
根据本申请的又一个方面,提供了一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行上述的方法。
本申请提供的技术方案,通过获取视音频节目,使用语音识别引擎实时将所述视音频节目的语音转换成文本,采用分词算法将所述文本生成字幕,将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出,实现了字幕和视音频画面“一块屏”的输出,彻底解决了听障人士无法观看无字幕视音频节目或只能多屏配合收看的痛处。进一步地,通过设置字幕状态可以随时关闭字幕,不会影响不需要此类辅助字幕的其它家庭成员收看视音频节目,方便了听障人士和正常人士不同需求的使用,使用更灵活。
根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。
附图说明
后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:
图1是根据本申请一个实施例的为视音频节目实时添加字幕的方法流程图;
图2是根据本申请另一个实施例的为视音频节目实时添加字幕的方法流程图;
图3是根据本申请另一个实施例的为视音频节目实时添加字幕的装置结构图;
图4是根据本申请另一个实施例的计算设备结构图;
图5是根据本申请另一个实施例的计算机可读存储介质结构图。
具体实施方式
本发明实施例涉及为视音频节目实时添加字幕,其中的视音频节目包括但不限于电视节目或网络视音频节目等等,尤其适用于播出时间固定且无字幕的直播新闻、综艺、体育等节目。对于自带字幕的视音频节目不在本发明涉及的范围之内,本发明实施例中的视音频节目均是指不配有字幕的视音频节目,下文不再特别声明。本发明实施例不仅适用于听障人士,同样也适用于需要静音收视者,或者多语种字幕收视者等等,应用极为广泛。
图1是根据本申请一个实施例的为视音频节目实时添加字幕的方法流程图。
参见图1,该方法包括:
101:获取视音频节目;
102:使用语音识别引擎实时将视音频节目的语音转换成文本;
103:采用分词算法将文本生成字幕;
104:将生成的字幕匹配且叠加到视音频节目的画面上输出。
本实施例中,可选的,采用分词算法将文本生成字幕,包括:
采用分词算法对文本进行分词、分句和分行处理后得到字幕。
本实施例中,可选的,采用分词算法对文本进行分词、分句和分行处理后得到字幕,包括:
采用分词算法对文本进行分词,替换其中的特殊标点符号,按照语气间隔进行分句,且对过短语句进行自动拼接,然后进行分行,如果超过每行上限字数则进行切割,最终得到字幕。
本实施例中,可选的,上述方法还包括:
在分行之前,过滤掉背景音乐和歌曲的识别结果,处理病句和错句,过滤重复文字。
本实施例中,可选的,上述方法还包括:
获取视音频节目之后,判断当前设置的字幕状态,如果为开启状态,则执行后续生成字幕及输出的流程,如果为关闭状态,则直接输出视音频节目。
本实施例中,可选的,使用语音识别引擎实时将视音频节目的语音转换成文本,包括:
判断当前设置的显示语种,然后使用语音识别引擎实时将视音频节目的语音转换成该语种下的文本。
本实施例提供的上述方法,通过获取视音频节目,使用语音识别引擎实时将所述视音频节目的语音转换成文本,采用分词算法将所述文本生成字幕,将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出,实现了字幕和视音频画面“一块屏”的输出,彻底解决了听障人士无法观看无字幕视音频节目或只能多屏配合收看的痛处。进一步地,通过设置字幕状态可以随时关闭字幕,不会影响不需要此类辅助字幕的其它家庭成员收看视音频节目,方便了听障人士和正常人士不同需求的使用,使用更灵活。
图2是根据本申请另一个实施例的为视音频节目实时添加字幕的方法流程图。参见图2,该方法包括:
201:获取视音频节目;
202:判断当前设置的字幕状态,如果为关闭状态,则执行203;如果为开启状态,则执行204;
203:直接输出视音频节目,流程结束;
204:使用语音识别引擎实时将视音频节目的语音转换成文本;
其中,语音识别引擎可以采用任一种,本发明实施例不做具体限定,如科大讯飞、腾讯、思必驰、百度等推出的语音识别技术均可以采用。
205:采用分词算法对文本进行分词,替换其中的特殊标点符号,按照语气间隔进行分句,且对过短语句进行自动拼接;
其中,分词可以保证词语的完整性,特殊标点符号是指预先指定的标点符号,一般是指对于字幕来说可有可无的标点,即使没有也不会对句子的理解造成影响,因此会将其过滤掉,尽量减少对画面的占用。
分句过程中通常将句子以空格隔断,且以语气间隔为一句,能够保证句子的可观性。
206:过滤掉背景音乐和歌曲的识别结果,处理病句和错句,过滤重复文字,然后进行分行,如果超过每行上限字数则进行切割,最终得到字幕;
其中,每行字幕的上限字数可以根据需要设置,具体字数不限定。长句进行切割可以避免过长的句子无法在画面上一次都显示出来,切割后分屏显示更合理有效。
207:将生成的字幕匹配且叠加到视音频节目的画面上输出,流程结束。
本实施例提供的上述方法,通过获取视音频节目,使用语音识别引擎实时将所述视音频节目的语音转换成文本,采用分词算法将所述文本生成字幕,将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出,实现了字幕和视音频画面“一块屏”的输出,彻底解决了听障人士无法观看无字幕视音频节目或只能多屏配合收看的痛处。进一步地,通过设置字幕状态可以随时关闭字幕,不会影响不需要此类辅助字幕的其它家庭成员收看视音频节目,方便了听障人士和正常人士不同需求的使用,使用更灵活。
图3是根据本申请另一个实施例的为视音频节目实时添加字幕的装置结构图。参见图3,该装置包括:
获取模块301,其配置成获取视音频节目;
识别模块302,其配置成使用语音识别引擎实时将视音频节目的语音转换成文本;
字幕模块303,其配置成采用分词算法将文本生成字幕;
匹配模块304,其配置成将生成的字幕匹配且叠加到视音频节目的画面上输出。
本实施例中,可选的,字幕模块包括:
分词算法单元,其配置成采用分词算法对文本进行分词、分句和分行处理后得到字幕。
本实施例中,可选的,分词算法单元具体配置成:
采用分词算法对文本进行分词,替换其中的特殊标点符号,按照语气间隔进行分句,且对过短语句进行自动拼接,然后进行分行,如果超过每行上限字数则进行切割,最终得到字幕。
本实施例中,可选的,分词算法单元还配置成:
在分行之前,过滤掉背景音乐和歌曲的识别结果,处理病句和错句,过滤重复文字。
本实施例中,可选的,上述装置还包括:
控制模块,其配置成在获取模块获取视音频节目之后,判断当前设置的字幕状态,如果为开启状态,则触发识别模块执行后续流程,如果为关闭状态,则直接输出视音频节目。
本实施例提供的上述装置,可以执行上述任一方法实施例提供的方法,详细过程详见方法实施例中的描述,此处不再赘述。
本实施例提供的上述装置,通过获取视音频节目,使用语音识别引擎实时将所述视音频节目的语音转换成文本,采用分词算法将所述文本生成字幕,将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出,实现了字幕和视音频画面“一块屏”的输出,彻底解决了听障人士无法观看无字幕视音频节目或只能多屏配合收看的痛处。进一步地,通过设置字幕状态可以随时关闭字幕,不会影响不需要此类辅助字幕的其它家庭成员收看视音频节目,方便了听障人士和正常人士不同需求的使用,使用更灵活。
根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。
本申请实施例还提供了一种计算设备,参照图4,该计算设备包括存储器1120、处理器1110和存储在所述存储器1120内并能由所述处理器1110运行的计算机程序,该计算机程序存储于存储器1120中的用于程序代码的空间1130,该计算机程序在由处理器1110执行时实现用于执行任一项根据本发明的方法步骤1131。
本申请实施例还提供了一种计算机可读存储介质。参照图5,该计算机可读存储介质包括用于程序代码的存储单元,该存储单元设置有用于执行根据本发明的方法步骤的程序1131′,该程序被处理器执行。
本申请实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时,使得计算机执行根据本发明的方法步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(英文:non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(英文:magnetic tape),软盘(英文:floppy disk),光盘(英文:optical disc)及其任意组合。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (10)
1.一种为视音频节目实时添加字幕的方法,包括:
获取视音频节目;
使用语音识别引擎实时将所述视音频节目的语音转换成文本;
采用分词算法将所述文本生成字幕;
将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出。
2.根据权利要求1所述的方法,其特征在于,采用分词算法将所述文本生成字幕,包括:
采用分词算法对所述文本进行分词、分句和分行处理后得到字幕。
3.根据权利要求2所述的方法,其特征在于,采用分词算法对所述文本进行分词、分句和分行处理后得到字幕,包括:
采用分词算法对所述文本进行分词,替换其中的特殊标点符号,按照语气间隔进行分句,且对过短语句进行自动拼接,然后进行分行,如果超过每行上限字数则进行切割,最终得到字幕。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在分行之前,过滤掉背景音乐和歌曲的识别结果,处理病句和错句,过滤重复文字。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述方法还包括:
获取视音频节目之后,判断当前设置的字幕状态,如果为开启状态,则执行后续生成字幕及输出的流程,如果为关闭状态,则直接输出所述视音频节目。
6.一种为视音频节目实时添加字幕的装置,包括:
获取模块,其配置成获取视音频节目;
识别模块,其配置成使用语音识别引擎实时将所述视音频节目的语音转换成文本;
字幕模块,其配置成采用分词算法将所述文本生成字幕;
匹配模块,其配置成将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出。
7.根据权利要求6所述的装置,其特征在于,所述字幕模块包括:
分词算法单元,其配置成采用分词算法对所述文本进行分词、分句和分行处理后得到字幕。
8.根据权利要求7所述的装置,其特征在于,所述分词算法单元具体配置成:
采用分词算法对所述文本进行分词,替换其中的特殊标点符号,按照语气间隔进行分句,且对过短语句进行自动拼接,然后进行分行,如果超过每行上限字数则进行切割,最终得到字幕。
9.根据权利要求7所述的装置,其特征在于,所述分词算法单元还配置成:
在分行之前,过滤掉背景音乐和歌曲的识别结果,处理病句和错句,过滤重复文字。
10.根据权利要求6-9中任一项所述的装置,其特征在于,所述装置还包括:
控制模块,其配置成在所述获取模块获取视音频节目之后,判断当前设置的字幕状态,如果为开启状态,则触发所述识别模块执行后续流程,如果为关闭状态,则直接输出所述视音频节目。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010313136.3A CN111556372A (zh) | 2020-04-20 | 2020-04-20 | 为视音频节目实时添加字幕的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010313136.3A CN111556372A (zh) | 2020-04-20 | 2020-04-20 | 为视音频节目实时添加字幕的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111556372A true CN111556372A (zh) | 2020-08-18 |
Family
ID=72007535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010313136.3A Pending CN111556372A (zh) | 2020-04-20 | 2020-04-20 | 为视音频节目实时添加字幕的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111556372A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023121850A1 (en) * | 2021-12-23 | 2023-06-29 | Advanced Micro Devices, Inc. | Automatic in-game subtitles and closed captions |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100039498A1 (en) * | 2007-05-17 | 2010-02-18 | Huawei Technologies Co., Ltd. | Caption display method, video communication system and device |
CN102937972A (zh) * | 2012-10-15 | 2013-02-20 | 上海外教社信息技术有限公司 | 一种视听字幕制作系统及方法 |
CN107733876A (zh) * | 2017-09-26 | 2018-02-23 | 惠州Tcl移动通信有限公司 | 一种流媒体字幕显示方法、移动终端及存储装置 |
CN109241286A (zh) * | 2018-09-21 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 用于生成文本的方法和装置 |
CN110415706A (zh) * | 2019-08-08 | 2019-11-05 | 常州市小先信息技术有限公司 | 一种在视频通话中实时叠加字幕的技术及其应用 |
-
2020
- 2020-04-20 CN CN202010313136.3A patent/CN111556372A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100039498A1 (en) * | 2007-05-17 | 2010-02-18 | Huawei Technologies Co., Ltd. | Caption display method, video communication system and device |
CN102937972A (zh) * | 2012-10-15 | 2013-02-20 | 上海外教社信息技术有限公司 | 一种视听字幕制作系统及方法 |
CN107733876A (zh) * | 2017-09-26 | 2018-02-23 | 惠州Tcl移动通信有限公司 | 一种流媒体字幕显示方法、移动终端及存储装置 |
CN109241286A (zh) * | 2018-09-21 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 用于生成文本的方法和装置 |
CN110415706A (zh) * | 2019-08-08 | 2019-11-05 | 常州市小先信息技术有限公司 | 一种在视频通话中实时叠加字幕的技术及其应用 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023121850A1 (en) * | 2021-12-23 | 2023-06-29 | Advanced Micro Devices, Inc. | Automatic in-game subtitles and closed captions |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111445902B (zh) | 数据收集方法、装置、存储介质及电子设备 | |
US9576581B2 (en) | Metatagging of captions | |
US10665267B2 (en) | Correlation of recorded video presentations and associated slides | |
WO2019218467A1 (zh) | 一种音视频通话方言识别方法、装置、终端设备及介质 | |
CN110457673B (zh) | 一种自然语言转换为手语的方法及装置 | |
CN113035199B (zh) | 音频处理方法、装置、设备及可读存储介质 | |
CN111639233A (zh) | 学习视频字幕添加方法、装置、终端设备和存储介质 | |
CN111885416B (zh) | 一种音视频的修正方法、装置、介质及计算设备 | |
US9525896B2 (en) | Automatic summarizing of media content | |
CN105681890A (zh) | 一种视频播放终端的字幕显示方法及装置 | |
KR20190083532A (ko) | 학습자가 선택한 동영상을 학습 콘텐츠로 활용하는 외국어 학습시스템 및 이의 학습 콘텐츠 생성방법 | |
CN112399269A (zh) | 视频分割方法、装置、设备及存储介质 | |
CN109858005B (zh) | 基于语音识别的文档更新方法、装置、设备及存储介质 | |
US20150111189A1 (en) | System and method for browsing multimedia file | |
CN111556372A (zh) | 为视音频节目实时添加字幕的方法和装置 | |
CN113365109A (zh) | 一种生成视频字幕的方法、装置、电子设备和存储介质 | |
CN113038175A (zh) | 视频处理方法、装置、电子设备及计算机可读存储介质 | |
US20140297285A1 (en) | Automatic page content reading-aloud method and device thereof | |
JP2019197210A (ja) | 音声認識誤り修正支援装置およびそのプログラム | |
EP2977983A1 (en) | Note-taking assistance system, information delivery device, terminal, note-taking assistance method, and computer-readable recording medium | |
CN106331844A (zh) | 一种媒体文件字幕的生成方法、装置及电子设备 | |
CN111526431A (zh) | 为视音频节目实时添加字幕的设备 | |
CN114842858A (zh) | 一种音频处理方法、装置、电子设备及存储介质 | |
CN110428668B (zh) | 一种数据提取方法、装置、计算机系统及可读存储介质 | |
CN110727854B (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200818 |