CN202406198U - 面向实时音视频流的字幕叠加系统 - Google Patents

面向实时音视频流的字幕叠加系统 Download PDF

Info

Publication number
CN202406198U
CN202406198U CN2011205583889U CN201120558388U CN202406198U CN 202406198 U CN202406198 U CN 202406198U CN 2011205583889 U CN2011205583889 U CN 2011205583889U CN 201120558388 U CN201120558388 U CN 201120558388U CN 202406198 U CN202406198 U CN 202406198U
Authority
CN
China
Prior art keywords
caption
video stream
video
audio
captions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2011205583889U
Other languages
English (en)
Inventor
赵欢
陈佐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN2011205583889U priority Critical patent/CN202406198U/zh
Application granted granted Critical
Publication of CN202406198U publication Critical patent/CN202406198U/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Studio Circuits (AREA)

Abstract

本实用新型公开了一种面向实时音视频流的字幕叠加系统,包括:字幕内容服务设备,用以对叠加的字幕信息脚本进行制作;字幕机,用以对实时音视频流进行字幕叠加;所述字幕内容服务设备与字幕机相连并将制作好的字幕信息脚本发送给字幕机;编码模块,与字幕机相连,用以对叠加字幕信息后的视频流数据进行重新编码,并将重新编码后的视频流与其它TS流信息组合成新的混合音视频流输出至终端用户设备。本实用新型具有结构简单紧凑、成本低廉、操作简便,可以实现字幕的实时叠加,满足了电视前端在任意时刻对音视频流进行字幕叠加的需求。

Description

面向实时音视频流的字幕叠加系统
技术领域
本实用新型主要涉及到广播电视制作设备领域,特指一种字幕叠加系统。
背景技术
随着电视技术的发展,电视字幕在电视节目制作中的作用也显得越来越重要。早期的电视字幕是通过人手写、手描,用黑白广告色写在黑纸上,然后用摄像机或飞点扫描幻灯机逐行、逐句拍摄,最后再把所拍的信号经限幅处理叠加在图像上,该种方式由于其步骤繁琐且字幕叠加效果差,已渐渐被淘汰。
伴随着计算机技术的迅速发展,字幕叠加技术也得到了进一步发展,变得越来越来自动化,叠加效果也愈来愈好,应用范围也变得广泛。目前,在网络电视的业务应用中,通常会在机顶盒视频播放期间往视频上叠加提示性字幕,这种叠加常采用的方式是把需要显示的字幕通过某种途径发送到机顶盒,然后由机顶盒负责字幕实现的具体叠加过程。该种方法虽然成本不高,但由于需要机顶盒本身支持多种字库、多种语言等,造成其在实现字幕叠加上具有很大的局限性,灵活性不够;且该种方式下的字幕显示方式比较简单,叠加效果差,难以满足用户的实时字幕叠加的需求。
有从业者提出以计算机为操作平台的非线性编辑系统,其由于编辑精度高,叠加效果好,不存在预卷、时基误差等优点,受到各大电视台的青睐,被广泛应用于电视节目的制作中。该非线性编辑系统通常由高性能的计算机、视频压缩卡和非编软件等部件组成,其虽然具有编辑精度高、叠加效果好等优点,但由于其在正式编辑前,需要将录像素材经过数字压缩后形成数据流先存储到计算机的硬盘中,编辑时再按编导人员的创作意图运用非编软件对所存储的录像素材进行编辑、添加字幕等处理,最后再输出;整个处理过程占用时间较长,在对实时音视频流进行字幕叠加方面存在一定局限。
另一方面,由于非线性编辑系统在进行存储录像素材时,需要对录像素材进行数字压缩,如果采用低压缩比进行压缩后存储,势必需要更多的硬盘空间存储录像素材,增加硬件设备投入;而如果采用高压缩比进行压缩存储,则又会给图像带来一定损耗。由上可知,非线性编辑系统同样也存在着字幕的实时叠加局限性较大、成本较高等不足。
实用新型内容
本实用新型要解决的技术问题就在于:针对现有技术存在的技术问题,本实用新型提供一种结构简单紧凑、成本低廉、操作简便、可以实现字幕的实时叠加、满足了电视前端在任意时刻对音视频流进行字幕叠加需求的面向实时音视频流的字幕叠加系统。
为解决上述技术问题,本实用新型采用以下技术方案:
一种面向实时音视频流的字幕叠加系统,包括:
字幕内容服务设备,用以对叠加的字幕信息脚本进行制作;
字幕机,用以对实时音视频流进行字幕叠加;所述字幕内容服务设备与字幕机相连并将制作好的字幕信息脚本发送给字幕机;
编码模块,与字幕机相连,用以对叠加字幕信息后的视频流数据进行重新编码,并将重新编码后的视频流与其它TS流信息组合成新的混合音视频流输出至终端用户设备。
作为本实用新型的进一步改进:
所述字幕机包括:
解码模块,用以对音视频流进行解码并获得每帧图像数据;
字幕叠加模块,包括解析单元和叠加单元,所述解析单元用以对字幕内容服务设备发送来的字幕信息脚本进行解析,且将获得的字幕信息添加在OSD层上,生成字幕画面;所述叠加单元用以将解析单元生成的字幕画面叠加到视频层上,并输出至编码模块。
所述解码模块中还包括一用以对前端传送的音视频流数据进行解码的解码单元。
所述解析单元还包括一用以存储字幕信息脚本的存储器。
所述解码模块和字幕叠加模块为机顶盒主芯片。
与现有技术相比,本实用新型的优点在于:
1、本实用新型面向实时音视频流的字幕叠加系统,结构简单、成本低廉,不用对音视频流进行压缩和存储,直接在解码后的视频流上叠加字幕并编码输出,实现了字幕的实时叠加,满足了电视前端在任意时刻对音视频流进行字幕叠加的需求;且这种对音视频流不经存储直接实时叠加的方式还避免了存储时造成的视频图像损耗和存储设备投入;
2、本实用新型中的字幕机可采用一个具有视频解码和字幕叠加功能的芯片完成字幕叠加功能,如机顶盒主芯片,成本相对降低;
3、本实用新型将字幕信息融合在视频流中,用户端无需升级或更换设备,便可以直接显示叠加字幕后的视频信息,适用范围广。
附图说明
图1是本实用新型结构的框架示意图。
图2是本实用新型的执行原理架构示意图。 
图3是本实用新型在具体应用实例中的工作流程示意图。
图例说明:
10、字幕内容服务设备;20、字幕机;201、解码模块;202、字幕叠加模块;2021、解析单元;2022、叠加单元;30、编码模块。
具体实施方式
以下将结合说明书附图和具体实施例对本实用新型做进一步详细说明。
如图1所示,本实用新型的面向实时音视频流的字幕叠加系统,包括字幕内容服务设备10、字幕机20以及编码模块30。
字幕内容服务设备10用以对叠加的字幕信息脚本进行制作,并将其发送给字幕机20。该字幕内容服务设备10可以为具有字幕编辑功能的设备,本实施例中,其为装载有字幕编辑软件的计算机。
字幕机20用以对实时音视频流进行字幕叠加,字幕机20包括解码模块201和字幕叠加模块202。其中,解码模块201用以对音视频流进行解码并获得每帧图像数据;字幕叠加模块202包括解析单元2021和叠加单元2022,解析单元2021用以对字幕内容服务设备10发送来的字幕信息脚本进行解析,且将获得的字幕信息添加在OSD层上,生成字幕画面;叠加单元2022用以将解析单元2021生成的字幕画面叠加到视频层上,即视频图像数据上,并输出至编码模块30。
编码模块30用以对字幕叠加后的每帧图像数据进行重新编码,该编码模块30可以为码流生成器或编码器;例如本实施例中,其可采用北京世纪鼎点软件有限公司推出的PowerSmart编码器去对字幕叠加后的每帧图像数据进行重新编码。
本实施例中,解码模块201中还包括一解码单元(图中未示),该解码单元用以对前端传送的音视频流数据进行解码。
本实施例中,解析单元2021还包括一用以存储字幕信息脚本的存储器(图中未示)。
本实施例中,解码模块201和字幕叠加模块202可采用机顶盒主芯片实现,例如,可采用海思的HI3100E芯片去实现对TS流中音视频流数据的解码,从而获取到每帧视频图像数据以及进而对解码后每帧视频图像数据进行字幕叠加等功能。
由此可见,本实用新型为一种通过利用机顶盒的OSD技术,在电视前端实现对实时音视频流进行字幕叠加,且叠加速度快、成本低的字幕叠加系统。本实用新型相比于现有的非线性编辑系统,在达到字幕叠加目的的同时已大大降低了设备成本。参见图2,本实用新型在工作时,将携带原始音视频信息的TS流送入字幕机20;首先字幕机20会对TS流中的视频流数据进行解码,以获取每帧视频图像数据,同时,字幕机20中的字幕叠加模块202对输入的字幕信息脚本进行解析并获得字幕信息,且进一步将该字幕信息数据添加到OSD层上;其次,字幕叠加模块202将添加字幕信息后的OSD层和视频帧层相互叠加,进一步形成新的每帧视频图像数据;最后重新将叠加后的每帧图像数据进行重新编码,并将编码后的视频流数据与其他TS流信息通过电视信号混合器等设备组合成新的混合音视频流进行输出。
如图3所示,为本实用新型在具体应用过程中的流程示意图,其包括以下步骤:
步骤401:字幕内容服务设备10对字幕信息脚本文件进行制作,并通过网口(或串口)将定义好字幕显示效果的字幕信息脚本文件发送给字幕机20;其中,字幕信息脚本定义了显示信息和控制关键字描述信息,上述显示信息包括字幕文本,控制关键字描述信息包括字幕显示位置、字幕语言、字体颜色、背景颜色、字体样式以及滚动方向等。
步骤402:字幕机20将自字幕内容服务设备10处获取的字幕信息脚本保存在存储器中。
进一步,字幕叠加模块202将字幕信息叠加到实时音视频流上,具体实现过程如下:
步骤403:解析单元2021实时从存储器中读取字幕信息脚本并对其进行解析,并将解析获得的字幕信息添加到同屏显示层上生成字幕画面;
步骤404:叠加单元2022将解析单元2021生成的字幕画面与经解码模块201解码获得的视频图像数据进行叠加;
步骤405;编码模块30对叠加字幕信息后的视频流数据进行重新编码,进一步该重新编码后的视频流与其它TS流信息组合成新的混合音视频流输出至终端用户设备。
以上仅是本实用新型的优选实施方式,本实用新型的保护范围并不仅局限于上述实施例,凡属于本实用新型思路下的技术方案均属于本实用新型的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本实用新型原理前提下的若干改进和润饰,应视为本实用新型的保护范围。 

Claims (5)

1.一种面向实时音视频流的字幕叠加系统,其特征在于,包括:
字幕内容服务设备(10),用以对叠加的字幕信息脚本进行制作;
字幕机(20),用以对实时音视频流进行字幕叠加;所述字幕内容服务设备(10)与字幕机(20)相连并将制作好的字幕信息脚本发送给字幕机(20);
编码模块(30),与字幕机(20)相连,用以对叠加字幕信息后的视频流数据进行重新编码,并将重新编码后的视频流与其它TS流信息组合成新的混合音视频流输出至终端用户设备。
2.根据权利要求1所述的面向实时音视频流的字幕叠加系统,其特征在于,所述字幕机(20)包括:
解码模块(201),用以对音视频流进行解码并获得每帧图像数据;
字幕叠加模块(202),包括解析单元(2021)和叠加单元(2022),所述解析单元(2021)用以对字幕内容服务设备(10)发送来的字幕信息脚本进行解析,且将获得的字幕信息添加在OSD层上,生成字幕画面;所述叠加单元(2022)用以将解析单元(2021)生成的字幕画面叠加到视频层上,并输出至编码模块(30)。
3.根据权利要求2所述的面向实时音视频流的字幕叠加系统,其特征在于:所述解码模块(201)中还包括一用以对前端传送的音视频流数据进行解码的解码单元。
4.根据权利要求2所述的面向实时音视频流的字幕叠加系统,其特征在于:所述解析单元(2021)还包括一用以存储字幕信息脚本的存储器。
5.根据权利要求2所述的面向实时音视频流的字幕叠加系统,其特征在于:所述解码模块(201)和字幕叠加模块(202)为机顶盒主芯片。
CN2011205583889U 2011-12-28 2011-12-28 面向实时音视频流的字幕叠加系统 Expired - Fee Related CN202406198U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011205583889U CN202406198U (zh) 2011-12-28 2011-12-28 面向实时音视频流的字幕叠加系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011205583889U CN202406198U (zh) 2011-12-28 2011-12-28 面向实时音视频流的字幕叠加系统

Publications (1)

Publication Number Publication Date
CN202406198U true CN202406198U (zh) 2012-08-29

Family

ID=46703812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011205583889U Expired - Fee Related CN202406198U (zh) 2011-12-28 2011-12-28 面向实时音视频流的字幕叠加系统

Country Status (1)

Country Link
CN (1) CN202406198U (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103986940A (zh) * 2014-06-03 2014-08-13 王军明 一种视频字幕的流化方法
CN104683853A (zh) * 2015-02-04 2015-06-03 广州酷狗计算机科技有限公司 多媒体文件的获取装置及终端
CN105828216A (zh) * 2016-03-31 2016-08-03 北京奇艺世纪科技有限公司 一种直播视频字幕合成系统及方法
CN106488264A (zh) * 2016-11-24 2017-03-08 福建星网视易信息系统有限公司 在演唱直播中显示歌词的方法、系统及装置
CN107205165A (zh) * 2017-07-11 2017-09-26 成都德芯数字科技股份有限公司 图文叠加方法及装置
CN110460889A (zh) * 2019-09-16 2019-11-15 深圳市迅雷网络技术有限公司 一种视频投屏方法、装置、系统及存储介质
CN111935531A (zh) * 2020-08-04 2020-11-13 天津七所精密机电技术有限公司 一种基于嵌入式平台的综合显示系统图形处理方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103986940A (zh) * 2014-06-03 2014-08-13 王军明 一种视频字幕的流化方法
CN104683853A (zh) * 2015-02-04 2015-06-03 广州酷狗计算机科技有限公司 多媒体文件的获取装置及终端
CN104683853B (zh) * 2015-02-04 2018-09-04 广州酷狗计算机科技有限公司 多媒体文件的获取装置及终端
CN105828216A (zh) * 2016-03-31 2016-08-03 北京奇艺世纪科技有限公司 一种直播视频字幕合成系统及方法
CN105828216B (zh) * 2016-03-31 2019-04-26 北京奇艺世纪科技有限公司 一种直播视频字幕合成系统及方法
CN106488264A (zh) * 2016-11-24 2017-03-08 福建星网视易信息系统有限公司 在演唱直播中显示歌词的方法、系统及装置
CN107205165A (zh) * 2017-07-11 2017-09-26 成都德芯数字科技股份有限公司 图文叠加方法及装置
CN110460889A (zh) * 2019-09-16 2019-11-15 深圳市迅雷网络技术有限公司 一种视频投屏方法、装置、系统及存储介质
CN111935531A (zh) * 2020-08-04 2020-11-13 天津七所精密机电技术有限公司 一种基于嵌入式平台的综合显示系统图形处理方法

Similar Documents

Publication Publication Date Title
CN202406198U (zh) 面向实时音视频流的字幕叠加系统
CN112291627B (zh) 一种视频编辑方法、装置、移动终端和存储介质
US8023568B2 (en) Capture, editing and encoding of motion pictures encoded with repeating fields or frames
JP4430882B2 (ja) 複合メディアコンテンツの変換装置及び変換方法並びに複合メディアコンテンツ変換プログラム
CN109889882B (zh) 一种视频剪辑合成方法和系统
CN101540847A (zh) 字幕制作系统及字幕制作方法
CN101188697A (zh) 一种非编中导入文稿中字幕的方法
CN112188136A (zh) 多合一拼接实时刻录视频的方法、系统、存储介质及设备
WO2005013618A1 (ja) ライブストリーミング放送方法、ライブストリーミング放送装置、ライブストリーミング放送システム、プログラム、記録媒体、放送方法及び放送装置
CN1561637A (zh) 用于传输多媒体信息流的系统和方法,例如用于远程教学
CN103905744A (zh) 一种渲染合成方法及系统
CN104301657B (zh) 一种会议电视终端及其辅流数据接入方法
CN105704508A (zh) 一种视频合并方法及装置
CN101188698B (zh) 一种非编中导入文稿中字幕的装置
JP4017290B2 (ja) 自動番組制作装置および自動番組制作プログラムを記録した記録媒体
CN101764957B (zh) 一种在会议字幕中插入图片的方法和装置
US11437072B2 (en) Recording presentations using layered keyframes
US20070038781A1 (en) Apparatus and method for converting contents
CN109874024A (zh) 一种基于动态视频海报的弹幕处理方法、系统及存储介质
JP5091502B2 (ja) 字幕付き映像表示システム、サーバ装置及び端末装置
US8200067B2 (en) Processing of scalable compressed video data formats for nonlinear video editing systems
US20040078496A1 (en) Information file data structure, information file generating method, information file generating apparatus, information file reproducing method, information file reproducing apparatus, and storage medium
KR20010035099A (ko) 장면 전환 자동 검출을 이용한 스트리밍 하이퍼비디오시스템 및 그 제어 방법
CN104853245A (zh) 一种电影预览方法和装置
CN102547183B (zh) 一种dcom进程管理的字幕系统和方法

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120829

Termination date: 20121228