CN103248951A - 一种向视频中添加滚屏信息的系统及方法 - Google Patents

一种向视频中添加滚屏信息的系统及方法 Download PDF

Info

Publication number
CN103248951A
CN103248951A CN2013101546920A CN201310154692A CN103248951A CN 103248951 A CN103248951 A CN 103248951A CN 2013101546920 A CN2013101546920 A CN 2013101546920A CN 201310154692 A CN201310154692 A CN 201310154692A CN 103248951 A CN103248951 A CN 103248951A
Authority
CN
China
Prior art keywords
video
screen information
roll screen
frame
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013101546920A
Other languages
English (en)
Other versions
CN103248951B (zh
Inventor
武悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TVMining Beijing Media Technology Co Ltd
Original Assignee
TVMining Beijing Media Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TVMining Beijing Media Technology Co Ltd filed Critical TVMining Beijing Media Technology Co Ltd
Priority to CN201310154692.0A priority Critical patent/CN103248951B/zh
Publication of CN103248951A publication Critical patent/CN103248951A/zh
Application granted granted Critical
Publication of CN103248951B publication Critical patent/CN103248951B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

本发明提供一种向视频中添加滚屏信息的系统,包括:解封装装置,用于对音视频文件进行解封装,从而将所述音视频文件解析为相应的音频帧序列和视频帧序列;视频数据解码装置,用于对所述视频帧序列进行解码,并将所述视频帧序列中的视频帧还原为RAW格式的视频数据;视频合成装置,根据用户输入的滚屏信息文本和参数向所述RAW格式的视频数据添加滚屏信息;编码装置,通过对已经添加了滚屏信息的RAW格式的视频数据进行编码,获得经重新编码后的视频帧序列;封装装置,用于对所述音频帧序列和所述经重新编码后的视频帧序列进行封装。本发明还提供一种向视频中添加滚屏信息的方法。

Description

一种向视频中添加滚屏信息的系统及方法
技术领域:
本发明涉及一种视频处理的系统及方法,特别是一种利用计算机程序实现自动向视频中添加滚屏信息的系统及方法。
背景技术:
我们在观看视频、电视节目时,经常会看到视频的下方出现滚动的字幕,这些滚屏的信息是视频编辑人员在节目的后期制作期间通过手工编辑的方式合成到视频中的,在此项工作中需要借助一些视频编辑工具(软件)来实现。
如果采用手工编辑的方式将滚屏的信息合成到视频中,容易视频与滚屏的信息不同步。并且,当需要给大量的视频文件加入相应的不同的滚屏信息,而且这些视频文件的格式还五花八门时,这将是一项繁重且极易出错的手工劳动,需要消耗大量的人力和时间。
中国专利申请201110054486.3公开了一种从RGB色彩空间到YUV色彩空间的转换方法,该方法可以用于实现将字幕位图合成到视频帧序列的各帧图像中。但该技术只能实现将字幕图像插入到视频中,不能实现自动向视频中插入字幕图像。
发明内容:
为解决上述技术问题,本发明提供一种向视频中添加滚屏信息的系统,包括:解封装装置,用于对音视频文件进行解封装,从而将所述音视频文件解析为相应的音频帧序列和视频帧序列;视频数据解码装置,用于对所述视频帧序列进行解码,并将所述视频帧序列中的视频帧还原为RAW格式的视频数据;视频合成装置,根据用户输入的滚屏信息文本和参数向所述RAW格式的视频数据添加滚屏信息;编码装置,通过对已经添加了滚屏信息的RAW格式的视频数据进行编码,获得经重新编码后的视频帧序列;封装装置,用于对所述音频帧序列和所述经重新编码后的视频帧序列进行封装。  
优选地,所述视频合成装置包括:用户设定接口,用于从用户接收滚屏信息的文本和参数的设定;字库单元,用于将用户输入的滚屏信息的文本转换成对应的字符的图形信息;显示处理单元,用于根据用户设定的参数计算每个视频帧中应显示的滚屏信息;计算机视觉库单元;用于将每个视频帧中应显示的滚屏信息对应的字符的图形信息合成为滚屏信息的图像;图像合成单元,用于将每个视频帧对应的滚屏信息的图像合成到该视频帧的RAW格式数据中。
优选地,所述视频合成装置还包括字符编码转换单元,用于将用户输入的滚屏信息的文本转换为字库单元可以识别的字符编码类型。
优选地,所述字库单元可以识别Unicode编码格式。
优选地,所述字库单元使用FreeType字库。
优选地,所述计算机视觉库单元使用OpenCV视觉库。
优选地,视频数据解码装置仅对显示处理单元判断需要添加滚屏信息的视频帧进行解码;视频合成装置仅向显示处理单元判断需要添加滚屏信息的视频帧相应的RAW格式数据添加滚屏信息。
优选地,所述编码装置能够根据原视频帧序列的相关参数或用户指令对已经添加了滚屏信息的RAW格式的视频数据进行编码。
优选地,所述原视频帧序列的相关参数或所述用户指令包括编码格式、视频帧率、视频码率、视频分辨率和视频帧制式中的一种或几种。
本发明同时提供一种向视频中添加滚屏信息的方法,包括:解封装步骤,对音视频文件进行解封装,从而将所述音视频文件解析为相应的音频帧序列和视频帧序列;视频数据解码步骤,对所述视频帧序列进行解码,并将所述视频帧序列中的视频帧还原为RAW格式的视频数据;滚屏信息添加步骤,根据用户输入的滚屏信息文本和参数设定对所述RAW格式的视频数据添加滚屏信息;编码步骤,通过对添加了滚屏信息的RAW格式的视频数据进行编码,获得经重新编码后的视频帧序列;封装步骤,对所述音频帧序列和所述经重新编码后的视频帧序列进行封装。  
优选地,所述滚屏信息添加步骤包括:利用字库将用户输入的滚屏信息的文本转换成对应的字符的图形信息的步骤;根据用户设定的参数计算每个视频帧中应显示的滚屏信息的步骤;利用计算机视觉库将每个视频帧中应显示的滚屏信息对应的字符的图形信息合成为滚屏信息的图像的步骤;将每个视频帧对应的滚屏信息的图像合成到该视频帧的RAW格式数据中的步骤。
优选地,还包括:将用户输入的滚屏信息的文本转换为字库单元可以识别的编码类型的步骤。
优选地,所述字库可以识别Unicode编码格式。
优选地,所述字库为FreeType字库。
优选地,所述计算机视觉库为OpenCV视觉库。
优选地,在所述视频数据解码步骤中,仅对需要添加滚屏信息的视频帧进行解码;在所述滚屏信息添加步骤中,仅向需要添加滚屏信息的视频帧相应的RAW格式数据添加滚屏信息。
优选地,在所述编码步骤中,根据原视频帧序列的相关参数或用户指令对已经添加了滚屏信息的RAW格式的视频数据进行编码。
优选地,所述原视频帧序列的相关参数或所述用户指令包括编码格式、视频帧率、视频码率、视频分辨率和视频帧制式中的一种或几种。
本发明的上述技术方案能够使用户只需输入视频文件位置、信息文本、各参数,即可实现自动对大批量视频进行字幕或滚屏信息的添加处理,大大减轻了编辑人员的操作负荷,节省了大量的时间和人力,同时降低了出错的几率。
附图说明:
图1为本发明实施方式涉及的滚屏信息添加系统的结构框图;
图2为本发明实施方式涉及的滚屏信息添加系统的解封装模块的结构框图;
图3为本发明实施方式涉及的滚屏信息添加系统的视频数据解码模块的结构框图;
图4为本发明实施方式涉及的滚屏信息添加系统的编码模块的结构框图;
图5为本发明实施方式涉及的滚屏信息添加系统的封装模块的结构框图;
图6为本发明实施方式涉及的视频合成模块7的结构框图;
图7为本发明实施方式涉及的向视频中添加滚屏信息的流程图;
图8为本发明实施方式涉及的步骤S12的流程图;
图9为本发明实施方式涉及的步骤S13的流程图;
图10为本发明实施方式涉及的步骤S14的流程图;
图11为本发明实施方式涉及的步骤S15的流程图;
图12为本发明实施方式涉及的步骤S16的流程图。
具体实施方式:
下面根据附图所示实施方式阐述本项发明。本发明实施方式所涉及的滚屏信息添加系统可以对多个视频文件按用户的设定进行字幕或滚屏信息的添加处理,用户在输入滚屏信息的文本并设定好参数后就不必再参与处理过程,余下的处理由计算机完成。
图1显示了本发明实施方式涉及的滚屏信息添加系统的结构框图。如图1所示,上述滚屏信息添加系统包括音视频数据接收模块1、解封装模块2、视频数据解码模块3、编码模块4、封装模块5、存储模块6、视频合成模块7和数据总线8。上述音视频数据接收模块1、解封装模块2、视频数据解码模块3、编码模块4、封装模块5、存储模块6和视频合成模块7通过上述数据总线8进行连接。
上述音视频数据接收模块1用于接收需要进行处理的音视频数据,并将所接收的上述音视频数据输送至上述解封装模块2进行相应的解封装。上述解封装模块2从上述音视频数据接收模块1接收到上述音视频数据后,根据所收到的上述音视频数据的相应文件格式进行解封装。在上述解封装过程中,上述解封装模块2将音视频文件解析为相应的视频帧序列和音频帧序列,并将上述视频帧序列和音频帧序列及上述音视频文件封装格式的相关参数存储到上述存储模块6中。上述视频数据解码模块3从上述存储模块6中获取上述视频帧序列,并根据所收到的视频帧序列的相应编码格式进行解码。在上述解码过程中,上述视频数据解码模块3对上述视频帧序列进行解码,将上述视频帧序列中的视频帧还原为RAW格式的视频数据,并将上述RAW格式的视频数据和上述视频帧序列编码格式相关的参数存储在上述存储模块6中,直至完成对所有的视频帧序列的解码。上述视频合成模块7获取用户输入的滚屏信息的文本和参数,并根据这些文本和参数向RAW格式的视频数据中添加滚屏信息,将处理后的数据存入存储模块6。上述编码模块4从上述存储模块6获取添加滚屏信息处理后的RAW格式的视频数据,并根据从上述存储模块6中所获取的上述视频帧序列编码格式相关的参数或用户的要求选择相应的编码器对上述添加滚屏信息处理后的RAW格式的视频数据进行编码、压缩,形成新的视频帧序列并存储在存储模块6中。上述封装模块5从上述存储模块6中获取上述音视频文件封装格式的相关参数、上述音频帧序列和新的视频帧序列,然后根据上述音视频文件封装格式的相关参数将上述音频帧序列和上述新的视频帧序列封装成新的音视频文件。
图2为本发明实施方式涉及的滚屏信息添加系统的解封装模块2的结构框图。如图2所示,上述解封装模块2包括音视频文件格式判断单元21、解封装选择单元22和数个解封装单元23、24、25……。其中,上述数个解封装单元23、24、25……具有不同的格式,可以对应于不同的文件格式进行解封装。上述音视频文件格式判断单元21可以判断来自上述音视频数据接收模块1所接收的音视频的文件格式并获取上述音视频的文件格式的相关参数,并将上述音视频的文件格式的相关参数存储到上述存储模块6中,上述解封装选择单元22可以根据上述音视频文件格式判断单元21的判断结果(即音视频文件的格式)从解封装单元23、24、25……中选择相应的解封装单元对上述音视频文件进行解封装,上述相应的解封装单元(即上述解封装单元23、24、25……中之一)将所接收到的上述音视频文件解封为相应的视频帧序列和音频帧序列,并将上述视频帧序列和音频帧序列存储在上述存储模块6中。
图3为本发明实施方式涉及的滚屏信息添加系统的视频数据解码模块3的结构框图。如图3所示,上述视频数据解码模块3包括编码格式判断单元31、解码器选择单元32和数个解码器33、34、35……。其中,上述数个解码器33、34、35……可以对应于不同的解码要求进行解码。上述编码格式判断单元31可以判断来自上述解封装模块2所解封的视频帧序列的编码格式并获取所解封的视频帧序列的编码格式的相关参数,并将原视频帧序列的编码格式的相关参数存储在上述存储模块6中。上述解码器选择单元32可以根据上述编码格式判断单元31的判断结果(即上述视频帧序列的编码格式)从解码器33、34、35……中选择相应的解码器对上述视频帧序列进行解码,上述相应的解码器(即上述解码器33、34、35……中之一)对所收到的上述视频帧序列进行解码,将上述视频帧序列中的视频帧还原为RAW格式数据,上述RAW格式数据被暂存在存储模块6中。
图4为本发明实施方式涉及的滚屏信息添加系统的编码模块4的结构框图。如图4所示,上述编码模块4包括编码器选择单元41、数个编码器42、43、44……和指令接收单元45。上述编码器选择单元41可以从上述存储模块6中获取经上述视频合成模块7进行滚屏信息添加处理后的新的RAW格式数据,并根据从上述存储模块6中获取的原视频帧序列的编码格式或上述指令接收单元45所接受的用户指定的编码格式选择相应的编码器(即上述编码器42、43、44……中之一)。上述指令接收单元45可以接受用户的指令并将上述指令输送给上述编码器选择单元41。其中,上述原视频帧序列的编码格式的相关参数或上述用户的指令可以包括编码格式、视频帧率、视频码率、视频分辨率、视频帧制式等参数。上述所选择的相应的编码器根据上述指令接收单元45所接受的用户指令或原视频帧序列的参数对上述滚屏信息添加处理后的新的RAW格式数据进行重新编码,形成新的视频帧序列,并将新的视频帧序列存储在上述存储模块6中。例如,上述编码器分析上述RAW格式数据文件的头结构,取得上述RAW格式数据文件中的视频帧率、视频码率、视频分辨率、视频帧制式等参数,然后将上述视频帧率、视频码率、视频分辨率、视频帧制式等参数转换为用户所指定的视频帧率、视频码率、视频分辨率、视频帧制式等参数,然后根据用户对编码格式的要求或原视频帧序列的编码格式形成新的视频帧序列,并将上述新的视频帧序列存入上述存储模块6中。
在本实施方式中,上述编码器选择单元41如果接收到用户指令,则根据用户指令选择相应的编码器并进行编码;如果未接收到用户指令,则根据上述原视频帧序列的编码格式的相关参数选择相应的编码器并进行编码。
图5为本发明实施方式涉及的滚屏信息添加系统的封装模块5的结构框图。如图5所示,上述封装模块5包括封装格式选择单元51和数个封装单元52、53、54……。其中,上述数个封装单元52、53、54……具有不同的封装格式,可以对应于不同的封装格式的要求进行封装。
上述封装格式选择单元51从上述存储模块6中获取上述音视频文件封装格式的相关参数、上述音频帧序列、新的视频帧序列并根据上述音视频文件封装格式的相关参数选择相应的封装单元(即封装单元52、53、54……中之一)对上述音频帧序列和新的视频帧序列进行封装,获得调节后的音视频文件。
在上述实施方式中,上述封装模块5还可以根据用户的需求来选择相应的编码格式和封装格式。
图6为本发明实施方式涉及的视频合成模块7的结构框图。如图6所示,上述视频合成模块7包括字符编码转换单元71、字库单元72、显示处理单元73、计算机视觉库单元74、图像合成单元75和用户设定接口76。字符编码转换单元71中存有字符编码库,字符编码库中存储着各种字符与对应的计算机可处理的二进制编码的对照表,常见字符编码包括Unicode、ASCII、UTF-8、GB2312、BIG5等。字符编码转换单元71接受用户输入的滚屏信息文本和字符编码类型,选择相应的字符编码库,将用户输入的滚屏信息编码转换为相应的字库单元72可以识别的编码类型发送给字库单元72。字库单元72中存有图形字库,存储着各字符与对应的计算机可处理的该字符的图形信息的对照表,常见字库包括TrueType、FreeType、PostScript等。字库单元72接受字符编码转换单元71发送的与滚屏信息的文本相对应的二进制编码和用户设定的参数,按照用户的设定选择相应的字库,将二进制编码转换成对应的字符的图形信息发送给显示处理单元73。显示处理单元73接收字库单元72发送的字符的图形信息,根据用户输入的滚屏方向、滚动速度、起始位置坐标等参数结合视频帧帧率等信息计算出每个视频帧要插入的图像和位置等,将每一帧的处理结果发送给计算机视觉库单元74。计算机视觉库单元74可以运行计算机视觉库软件,该软件可以对得到的字符的图形信息进行进一步渲染与合成,从而得到字幕位图,常见的计算机视觉库有OpenCV等。计算机视觉库单元74接受显示处理单元73发送的每一帧的处理结果并进行处理,得到滚屏信息的图像发送给图像合成单元74。图像合成单元74从计算机视觉库单元74接收滚屏信息的图像,将该图像合成到每一帧视频中。用户设定接口76接收用户输入的滚屏信息文本和各种参数的设定值,将接收的相应的用户设定分别发送给上述字符编码转换单元71、字库单元72、显示处理单元73、计算机视觉库单元74、图像合成单元75。
图7为本发明实施方式涉及的向视频中添加滚屏信息的流程图。下面,参照图7说明在本实施方式涉及的添加滚屏信息的处理过程。
首先,输入音视频文件,上述音视频数据接收模块1接收上述音视频文件数据并将其输送至上述解封装模块2(步骤S11)。上述解封装模块2对上述音视频文件数据进行解封装,将上述音视频文件数据解析为视频帧序列和音频帧序列,并将上述视频帧序列和音频帧序列以及原音视频文件的封装格式的相关参数存储在上述存储模块6中(步骤S12)。
上述视频数据解码模块3从上述存储模块6中获取上述视频帧序列,将上述视频帧序列中的视频帧还原为RAW格式数据,并将上述RAW格式数据和原视频帧序列的编码格式的相关参数存储到上述存储模块6中(步骤S13)。
上述视频合成模块7根据用户输入的滚屏信息的文本和设定参数, 对RAW格式数据进行添加滚屏信息的处理,获取处理后的RAW格式数据,并将处理后的RAW格式数据存储到上述存储模块6中(步骤S14)
上述编码模块4从上述存储模块6中获取添加滚屏信息后的RAW格式数据,并根据从上述存储模块6中所获取的原视频帧序列的编码格式的相关参数或所接收的用户指令对添加滚屏信息后的RAW格式数据进行编码,形成新的视频帧序列并存储到上述存储模块6中(步骤S15)。
上述封装模块5从上述存储模块6中获取音频帧序列、新的视频帧序列和原音视频文件的封装格式的相关参数,并根据原音视频文件的封装格式的相关参数进行封装,形成新音视频文件(步骤S16)。
图8为本发明实施方式涉及的向音视频文件添加滚屏信息的处理的步骤S12的流程图。下面,参照图8说明在本实施方式涉及的音视频文件进行解封装处理过程。
音视频文件格式判断单元21基于所接收的音视频文件数据判断所接收的音视频文件的封装格式,将判断结果输送到解封装选择单元22(步骤S121),同时将原音视频文件的封装格式的相关参数存储到上述存储模块6中(步骤S122)。上述解封装选择单元22基于上述判断结果选择相应的解封装单元(步骤S123)。上述解封装单元(即解封装单元23、24、25……中之一)对上述音视频文件数据进行解封装,将上述音视频文件数据解析为视频帧序列和音频帧序列(步骤S124),并将视频帧序列和音频帧序列存储到上述存储模块6中(步骤S125)。 
图9为本发明实施方式涉及的向音视频文件添加滚屏信息的处理的步骤S13的流程图。下面,参照图9说明在本实施方式涉及的对视频数据进行解码处理过程。
编码格式判断单元31对解封装后的视频帧序列的编码格式进行判断,并将判断结果输送到解码器选择单元32(步骤S131),同时将视频帧序列的编码格式的相关参数存储到上述存储模块6中(步骤S132)。上述解码器选择单元32基于上述判断结果选择与上述编码格式相应的解码器进行解码(步骤S133),上述解码器(即解码器33、34、35……中之一)将上述视频帧序列中的视频帧还原为RAW格式数据(步骤S134),并将上述RAW格式数据存储至存储模块6中(步骤S135)。
图10为本发明实施方式涉及的向音视频文件添加滚屏信息的处理的步骤S14的流程图。下面,参照图10说明在本实施方式涉及的对RAW格式视频添加滚屏信息的处理过程。
首先,字符编码转换单元71从用户设定接口76接收用户输入的滚屏信息的文本和指定的字符编码库。字符编码转换单元71在用户指定的字符编码库中对滚屏信息的文本逐个字符进行检索,将所有文本转换为字库单元可以识别的字符编码(步骤S141)。比如,用户指定文本为GB2312编码,而字库单元只能识别Unicode编码,字符编码转换单元71参照GB2312和Unicode字符编码库,将用户输入的文本转换为Unicode字符编码发送到字库单元72。字库单元72从用户设定接口76接收用户输入的对滚屏信息的字体等参数的设定,并据此检索相应的字库,将接收到的字符编码转换为相应的字形图像发送到显示处理单元73(步骤S142)。比如,字库单元72以两个字节为单位(Unicode编码以两个字节作为一个编码单元)检索收到的Unicode字符编码在用户指定的FreeType字库中对应的字形位图(此位图可根据用户的要求选择单位或具有一定灰度阶数的像素图,或不同字体的图像)。显示处理单元73接收字库单元72发送的字形图像,并从用户设定接口76接收用户输入的处理参数,如滚屏方向、滚动速度、起始位置坐标、透明度等。显示处理单元73根据用户输入的参数计算在每一个视频帧中应显示的滚屏信息,并发送给计算机视觉库单元74(步骤S143)。计算机视觉库单元74接收显示处理单元73发送的每一帧的滚屏信息,并从用户设定接口76接收用户输入的参数,如字幕方向、字幕宽度、字幕高度、文字大小、背景色、字体颜色、透明度等。计算机视觉库单元74将每一帧的滚屏信息按用户设定的参数进行渲染与合成,得到每个视频帧中要插入的滚屏信息的图像,并发送给图像合成单元75(步骤S144)。比如,计算机视觉库单元74可以使用OpenCV视觉库处理滚屏信息,得到32bit的滚屏信息的位图。图像合成单元75接收计算机视觉库单元74发送的每个视频帧的滚屏信息的图像,并从存储模块6中调取每一个视频帧的RAW格式数据,将滚屏信息的图像合成到RAW格式数据中。图像合成单元75对每个视频帧重复上述处理,直至所有视频帧处理完成(步骤S145)。
图11为本发明实施方式涉及的向音视频文件添加滚屏信息的处理的的步骤S15的流程图。下面,参照图11说明在本实施方式涉及的对RAW格式数据进行编码的处理过程。
编码器选择单元41从上述存储模块6中获取上述经处理后的RAW格式数据(步骤S151)。编码器选择单元41基于上述原视频帧序列的编码格式的相关参数或用户的指令选择相应的编码器(步骤S152)。上述被选定的编码器对经上述滚屏信息处理后的RAW格式的视频数据进行编码,以获得新的视频帧序列(步骤S153),并将所获得的新的视频帧序列存储在存储模块6中(步骤S154)。
图12为本发明实施方式涉及的对音频帧序列和新的视频帧序列进行封装的步骤S16的流程图。下面,参照图12说明在本实施方式涉及的对音频帧序列和新的视频帧序列进行封装的处理过程。
上述封装格式选择单元51从上述存储模块6中获取音频帧序列、新的视频帧序列和原音视频文件的封装格式的相关参数(步骤S161)。上述封装格式选择单元51基于原音视频文件的封装格式的相关参数选择与原音视频文件的封装格式相应的封装单元(步骤S162),上述封装单元对上述音频帧序列和上述新的视频帧序列进行重新封装,形成具有与原音视频文件的封装格式相同的新的音视频文件(步骤S163),并输出新的音视频文件(步骤S164)。
在本实施方式中,在步骤S13中对所有视频帧进行了解码。但本发明并不限于此,也可以由视频合成模块7先进行步骤S140-S143的处理,由此可以知道对哪些视频帧需要插入滚屏信息,对哪些视频帧不需要插入滚屏信息。据此,在步骤S13中只对需要插入滚屏信息的视频帧进行解码操作,在步骤S14中只对需要插入滚屏信息的视频帧添加滚屏信息。这样可以减轻视频数据解码模块3、编码模块4、和视频合成模块7处理的数据量,提高效率。
在本实施方式中,由用户设定接口76接收用户输入的设定。但本发明并不限于此,用户可以在用户设定接口76中设定待处理的音视频文件所在的文件夹、将各音视频文件的滚屏信息和各项参数设定保存为一个指令文件,由处理系统自动执行对指定文件夹下的所有文件或指令文件中涉及的所有文件进行添加滚屏信息的操作。用户设定接口76也可以根据用户的需要设计成其他便于使用的形式。
在本实施方式中,在步骤S16中采用与原音视频文件的封装格式相同的封装格式对音频帧序列和新的视频帧序列进行封装。但本发明并不限于此,在步骤S16中也可以采用用户指定的封装格式对音频帧序列和新的视频帧序列进行封装。
在本实施方式中,相关数据均存储于上述存储模块6中。但本发明并不限于此,相关数据可以不用存储于上述存储模块6中而直接用于各个模块进行处理。
应理解以上说明书中所描述的具体实施方式和实施例仅用于说明本发明而不用于限制本发明的范围。在阅读了本发明之后,本领域技术人员对本发明的各种等同形式的修改均落于本申请所附权利要求所限定的范围。

Claims (18)

1. 一种向视频中添加滚屏信息的系统,包括:
解封装装置,用于对音视频文件进行解封装,从而将所述音视频文件解析为相应的音频帧序列和视频帧序列;
视频数据解码装置,用于对所述视频帧序列进行解码,并将所述视频帧序列中的视频帧还原为RAW格式的视频数据;
视频合成装置,根据用户输入的滚屏信息文本和参数向所述RAW格式的视频数据添加滚屏信息;
编码装置,通过对已经添加了滚屏信息的RAW格式的视频数据进行编码,获得经重新编码后的视频帧序列;
封装装置,用于对所述音频帧序列和所述经重新编码后的视频帧序列进行封装。
2.根据权利要求1所述的系统,其特征在于:
所述视频合成装置包括:
用户设定接口,用于从用户接收滚屏信息的文本和参数的设定;
字库单元,用于将用户输入的滚屏信息的文本转换成对应的字符的图形信息;
显示处理单元,用于根据用户设定的参数计算每个视频帧中应显示的滚屏信息;
计算机视觉库单元;用于将每个视频帧中应显示的滚屏信息对应的字符的图形信息合成为滚屏信息的图像;
图像合成单元,用于将每个视频帧对应的滚屏信息的图像合成到该视频帧的RAW格式数据中。
3.根据权利要求2所述的系统,其特征在于:
所述视频合成装置还包括字符编码转换单元,用于将用户输入的滚屏信息的文本转换为字库单元可以识别的字符编码类型。
4.根据权利要求2所述的系统,其特征在于:
所述字库单元可以识别Unicode编码格式。
5. 根据权利要求2所述的系统,其特征在于:
所述字库单元使用FreeType字库。
6. 根据权利要求2所述的系统,其特征在于:
所述计算机视觉库单元使用OpenCV视觉库。
7. 根据权利要求2~6所述的系统,其特征在于:
视频数据解码装置仅对显示处理单元判断需要添加滚屏信息的视频帧进行解码;视频合成装置仅向显示处理单元判断需要添加滚屏信息的视频帧相应的RAW格式数据添加滚屏信息。
8. 根据权利要求7所述的系统,其特征在于:
所述编码装置能够根据原视频帧序列的相关参数或用户指令对已经添加了滚屏信息的RAW格式的视频数据进行编码。
9.根据权利要求8所述的系统,其特征在于:
所述原视频帧序列的相关参数或所述用户指令包括编码格式、视频帧率、视频码率、视频分辨率和视频帧制式中的一种或几种。
10.一种向视频中添加滚屏信息的方法,包括:
解封装步骤,对音视频文件进行解封装,从而将所述音视频文件解析为相应的音频帧序列和视频帧序列;
视频数据解码步骤,对所述视频帧序列进行解码,并将所述视频帧序列中的视频帧还原为RAW格式的视频数据;
滚屏信息添加步骤,根据用户输入的滚屏信息文本和参数设定对所述RAW格式的视频数据添加滚屏信息;
编码步骤,通过对添加了滚屏信息的RAW格式的视频数据进行编码,获得经重新编码后的视频帧序列;
封装步骤,对所述音频帧序列和所述经重新编码后的视频帧序列进行封装。
11.根据权利要求10所述的方法,其特征在于:
所述滚屏信息添加步骤包括:
利用字库将用户输入的滚屏信息的文本转换成对应的字符的图形信息的步骤;
根据用户设定的参数计算每个视频帧中应显示的滚屏信息的步骤;
利用计算机视觉库将每个视频帧中应显示的滚屏信息对应的字符的图形信息合成为滚屏信息的图像的步骤;
将每个视频帧对应的滚屏信息的图像合成到该视频帧的RAW格式数据中的步骤。
12. 根据权利要求11所述的方法,还包括:
将用户输入的滚屏信息的文本转换为字库单元可以识别的字符编码类型的步骤。
13. 根据权利要求11所述的方法,其特征在于:
所述字库可以识别Unicode编码格式。
14. 根据权利要求11所述的方法,其特征在于:
所述字库为FreeType字库。
15. 根据权利要求11所述的方法,其特征在于:
所述计算机视觉库为OpenCV视觉库。
16. 根据权利要求11~15所述的方法,其特征在于:
在所述视频数据解码步骤中,仅对需要添加滚屏信息的视频帧进行解码;
在所述滚屏信息添加步骤中,仅向需要添加滚屏信息的视频帧相应的RAW格式数据添加滚屏信息。
17. 根据权利要求16所述的方法,其特征在于:
在所述编码步骤中,根据原视频帧序列的相关参数或用户指令对已经添加了滚屏信息的RAW格式的视频数据进行编码。
18.根据权利要求17所述的方法,其特征在于:
所述原视频帧序列的相关参数或所述用户指令包括编码格式、视频帧率、视频码率、视频分辨率和视频帧制式中的一种或几种。
CN201310154692.0A 2013-04-28 2013-04-28 一种向视频中添加滚屏信息的系统及方法 Expired - Fee Related CN103248951B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310154692.0A CN103248951B (zh) 2013-04-28 2013-04-28 一种向视频中添加滚屏信息的系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310154692.0A CN103248951B (zh) 2013-04-28 2013-04-28 一种向视频中添加滚屏信息的系统及方法

Publications (2)

Publication Number Publication Date
CN103248951A true CN103248951A (zh) 2013-08-14
CN103248951B CN103248951B (zh) 2016-01-20

Family

ID=48928132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310154692.0A Expired - Fee Related CN103248951B (zh) 2013-04-28 2013-04-28 一种向视频中添加滚屏信息的系统及方法

Country Status (1)

Country Link
CN (1) CN103248951B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104301772A (zh) * 2014-09-11 2015-01-21 无锡天脉聚源传媒科技有限公司 一种在视频中叠加图片的方法及装置
CN107483940A (zh) * 2017-09-19 2017-12-15 武汉大学 一种基于屏幕变化检测的屏幕视频编码方法
CN108965930A (zh) * 2017-12-29 2018-12-07 北京视联动力国际信息技术有限公司 一种视频数据处理的方法和装置
CN109525890A (zh) * 2018-09-26 2019-03-26 北京雷石天地电子技术有限公司 一种基于字幕识别的mv字幕移植方法及装置
CN110213504A (zh) * 2018-04-12 2019-09-06 腾讯科技(深圳)有限公司 一种视频处理方法、信息发送方法及相关设备
CN110557578A (zh) * 2019-09-29 2019-12-10 苏州科达科技股份有限公司 用于led拼接屏的字幕显示装置、方法及相关设备
CN111757172A (zh) * 2019-03-29 2020-10-09 Tcl集团股份有限公司 Hdr视频获取方法、hdr视频获取装置及终端设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2456408Y (zh) * 2000-12-01 2001-10-24 张健 滚动字幕装置
CN101197948A (zh) * 2007-12-04 2008-06-11 北京工业大学 在视频中实现图标或字幕多种特效的方法
CN101478661A (zh) * 2008-11-04 2009-07-08 深圳中兴力维技术有限公司 一种在视频流中提供高质量字幕叠加的系统和方法
US20130100348A1 (en) * 2010-07-13 2013-04-25 Huawei Device Co., Ltd. Method, terminal and system for caption transmission in telepresence

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2456408Y (zh) * 2000-12-01 2001-10-24 张健 滚动字幕装置
CN101197948A (zh) * 2007-12-04 2008-06-11 北京工业大学 在视频中实现图标或字幕多种特效的方法
CN101478661A (zh) * 2008-11-04 2009-07-08 深圳中兴力维技术有限公司 一种在视频流中提供高质量字幕叠加的系统和方法
US20130100348A1 (en) * 2010-07-13 2013-04-25 Huawei Device Co., Ltd. Method, terminal and system for caption transmission in telepresence

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104301772A (zh) * 2014-09-11 2015-01-21 无锡天脉聚源传媒科技有限公司 一种在视频中叠加图片的方法及装置
CN104301772B (zh) * 2014-09-11 2018-06-19 无锡天脉聚源传媒科技有限公司 一种在视频中叠加图片的方法及装置
CN107483940A (zh) * 2017-09-19 2017-12-15 武汉大学 一种基于屏幕变化检测的屏幕视频编码方法
CN107483940B (zh) * 2017-09-19 2019-06-11 武汉大学 一种基于屏幕变化检测的屏幕视频编码方法
CN108965930A (zh) * 2017-12-29 2018-12-07 北京视联动力国际信息技术有限公司 一种视频数据处理的方法和装置
CN110213504A (zh) * 2018-04-12 2019-09-06 腾讯科技(深圳)有限公司 一种视频处理方法、信息发送方法及相关设备
CN110213504B (zh) * 2018-04-12 2021-10-08 腾讯科技(深圳)有限公司 一种视频处理方法、信息发送方法及相关设备
CN109525890A (zh) * 2018-09-26 2019-03-26 北京雷石天地电子技术有限公司 一种基于字幕识别的mv字幕移植方法及装置
CN109525890B (zh) * 2018-09-26 2021-07-13 北京雷石天地电子技术有限公司 一种基于字幕识别的mv字幕移植方法及装置
CN111757172A (zh) * 2019-03-29 2020-10-09 Tcl集团股份有限公司 Hdr视频获取方法、hdr视频获取装置及终端设备
CN110557578A (zh) * 2019-09-29 2019-12-10 苏州科达科技股份有限公司 用于led拼接屏的字幕显示装置、方法及相关设备

Also Published As

Publication number Publication date
CN103248951B (zh) 2016-01-20

Similar Documents

Publication Publication Date Title
CN103248951B (zh) 一种向视频中添加滚屏信息的系统及方法
CN106170921B (zh) 涉及符号压缩的数据的源编码和解码方法及装置
CA2831967C (en) Image compression using sub-resolution images
CN1681330B (zh) 自适应2n叉树生成方法及3D体数据编码和解码方法和设备
CN111885346B (zh) 一种画面码流合成方法、终端、电子设备和存储介质
CN101282410B (zh) 多维数据编码装置和解码装置及其控制方法
US10440360B2 (en) Video processing system
JP6989299B2 (ja) ビデオデータ処理システム
CN109964204B (zh) 用于处理图形的方法和系统
US10063870B2 (en) Method of and apparatus for generating an encoded frame
CN103475935A (zh) 一种视频片段的检索方法及装置
CN105282124A (zh) 基于xmpp协议的渐进式图片的传输方法及呈现方法
GB2511355A (en) Encoder, decoder and method
CN106031168A (zh) 具有减少色彩分辨率的视频流的自适应处理
US20100266217A1 (en) 3d contents data encoding/decoding apparatus and method
CN111726615B (zh) 点云编解码方法及编解码器
CN104104954A (zh) 用于图形应用的基于瓦片的压缩与解压缩
CN107222747B (zh) 对帧进行解码的方法及装置、对帧进行编码的方法及装置
US20230224481A1 (en) Methods, apparatuses, computer programs and computer-readable media for processing configuration data
JP2016116224A (ja) ビデオデータ処理システム
CN1248863A (zh) 图形数据压缩方法
CN105163124A (zh) 一种图像编码方法、图像解码方法及装置
WO2015052968A1 (ja) サーバ装置、クライアント装置、情報処理方法および記録媒体
CN108711191A (zh) 一种视频处理方法和vr设备
CN115576513A (zh) 目标图像的显示方法、显示装置、电子设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A system and method of adding scrolling information to video

Effective date of registration: 20210104

Granted publication date: 20160120

Pledgee: Inner Mongolia Huipu Energy Co.,Ltd.

Pledgor: TVMINING (BEIJING) MEDIA TECHNOLOGY Co.,Ltd.

Registration number: Y2020990001527

PE01 Entry into force of the registration of the contract for pledge of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160120

Termination date: 20210428

CF01 Termination of patent right due to non-payment of annual fee