CN102723104A - 基于mp4文件封装格式的多媒体录播系统 - Google Patents

基于mp4文件封装格式的多媒体录播系统 Download PDF

Info

Publication number
CN102723104A
CN102723104A CN2012102298139A CN201210229813A CN102723104A CN 102723104 A CN102723104 A CN 102723104A CN 2012102298139 A CN2012102298139 A CN 2012102298139A CN 201210229813 A CN201210229813 A CN 201210229813A CN 102723104 A CN102723104 A CN 102723104A
Authority
CN
China
Prior art keywords
file
video
multimedia
recorded broadcast
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012102298139A
Other languages
English (en)
Inventor
王赟
陈伟
廖海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN REACH INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHENZHEN REACH INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN REACH INFORMATION TECHNOLOGY Co Ltd filed Critical SHENZHEN REACH INFORMATION TECHNOLOGY Co Ltd
Priority to CN2012102298139A priority Critical patent/CN102723104A/zh
Publication of CN102723104A publication Critical patent/CN102723104A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)

Abstract

本发明公开一种基于MP4文件封装格式的多媒体录播系统,其包括:多个的音视频产生设备;在每个音视频产生设备的视频输出端分别连接一个视频编码器,用于对每路视频数据分别进行编码处理;在每个音视频产生设备的视频输出端分别连接一个音频编码器,用于将每路音频数据进行AAC音频编码处理;分别与各个所述视频编码器、所述音频编码器相连的多媒体录播服务器,用于将各路视频数据和音频数据进行合并,按照MP4文件封装格式生成MP4文件。本发明使多媒体录播服务器可以使用流媒体服务器或者HTTP服务器,MP4文件格式也使得浏览播放端也具有较好的广泛适用性。

Description

基于MP4文件封装格式的多媒体录播系统
技术领域
本发明涉及一种媒体数据处理技术,尤其是涉及一种基于MP4文件封装格式的多媒体录播系统。
背景技术
目前,大多数录播系统在录播时使用的文件格式是asf,afs(AdvancedStreaming Format,高级串流格式的缩写)是Microsoft为Windows98所开发的串流多媒体文件格式,是微软公司Windows Media的核心,是一种包含音频、视频、图像以及控制命令脚本的数据格式。asf文件格式只有在windows系统上完美的支持,可以用于文件播放和流媒体传输,但是在其它的操作系统和应用上不被广泛的支持,所以使用asf文件格式作为媒体存储和流媒体播放局限性很大。
另外,目前大多数录播系统的音频主要是AAC(AdvancedAudio Coding,高级音频编码)音频,AAC音频如果用在asf文件格式中,这种文件微软的媒体播放器MediaPlayer是不能播放的。
对于音频、视频文件而言,MP4文件封装格式近来得到较快发展和较为广泛的应用。所述的MP4文件封装格式,对应的标准为ISO/IEC1449612。MP4文件格式作为开放容器,几乎可用来描述所有的媒体结构,目前被广泛用于封装H.264视频和AAC音频,是高清视频的代表。同时,由于受到美国Apple公司产品的支持,使得该格式发展前景较好。
而MP4格式非常完美的支持AAC音频,使用微软的播放器MediaPlayer也能正常播放,因此,若能够将各个录播系统的asf格式的多路视频与AAC音频合并后采用MP4文件封装格式进行封装,则将使录播系统输出的音视频文件能够得到更广泛的播放支持。
发明内容
本发明提出一种基于MP4文件封装格式的多媒体录播系统,由多媒体录播服务器将多路视频与AAC音频合并后采用MP4文件封装格式进行封装,输出MP4文件。
本发明采用如下技术方案实现:一种基于MP4文件封装格式的多媒体录播系统,其包括:
多个的音视频产生设备;
在每个音视频产生设备的视频输出端分别连接一个视频编码器,用于对每路视频数据分别进行编码处理;
在每个音视频产生设备的视频输出端分别连接一个音频编码器,用于将每路音频数据进行AAC音频编码处理;
分别与各个所述视频编码器、所述音频编码器相连的多媒体录播服务器,用于将各路视频数据和音频数据进行合并,按照MP4文件封装格式生成MP4文件。
其中,各个所述视频编码器、所述音频编码器分别通过IP网络连接所述多媒体录播服务器。
其中,所述多媒体录播系统还包括:若干个通过IP网络连接多媒体录播服务器的浏览播放端,用于从多媒体录播服务器获取MP4文件进行浏览播放。
其中,所述多媒体录播服务器在将各路视频数据和音频数据在写入MP4文件时,使各路视频数据和音频数据中的时间戳保持同步。
其中,所述多媒体录播服务器在将各路视频数据和音频数据写入MP4文件时,在找到MP4文件中的第一个关键帧时才开始写入视频数据和音频数据。
其中,所述多媒体录播服务器在将各路视频数据和音频数据写入MP4文件时,从收到的第一个IDR帧之中提取SPS和PPS写到MP4文件中。
其中,所述音视频产生设备包括摄像机、视频会议终端、话筒或/和广播设备。
其中,所述多媒体录播服务器为流媒体服务器或HTTP服务器。
与现有技术相比,本发明具有如下有益效果:
本发明基于MP4文件封装格式将各路视频数据和音频数据合并生成MP4文件,一方面,使多媒体录播服务器可以不再局限在使用微软的流媒体服务器,还可以使用开源的流媒体服务器或者HTTP服务器,另一方面,由于MP4文件格式是目前较为流行且广发支持的文件格式,从而使得浏览播放端也具有较好的广泛适用性。
附图说明
图1是本发明的系统结构示意图;
图2是MP4文件封装格式的部分结构示意图。
具体实施方式
如图1所示,本发明提出一种基于MP4文件封装格式的多媒体录播系统,所述多媒体录播系统具体包括:多个的音视频产生设备,包括但不限于摄像机11、视频会议终端12、话筒和广播设备;每个音视频产生设备的视频输出端连接一个视频编码器13,由视频编码器13采用H.264High Profile视频压缩技术对每路视频数据分别进行编码处理,将每路视频数据编码生成标准的RTSP(Real Time Streaming Protocol,实时流传输协议)媒体流、TS(transport stream,传输流)媒体流,且每个音视频产生设备的音频输出端连接一个音频编码器14,由音频编码器14将每路音频数据进行AAC(AdvancedAudio Coding,高级音频编码)的音频编码处理;每个视频编码器13、音频编码器14分别通过IP网络连接多媒体录播服务器15;由多媒体录播服务器15将一路或多路视频数据、一路或多路音频数据进行合并,按照MP4文件封装格式生成MP4文件;若干个通过IP网络连接多媒体录播服务器15的浏览播放端16,通过IP网络从多媒体录播服务器15获取MP4文件,通过播放器播放MP4文件从而浏览播放来自音视频产生设备的音频数据和视频数据。
其中,由多媒体录播服务器15将多路视频数据、音频数据合并处理为MP4文件的过程中,需要注意以下几个部分:
(1)各路视频数据和音频数据的时间戳保持同步
各路视频数据和音频数据在写入MP4文件时需要保持同步,才能确保视频与音频的对应关系。由于音频的时间单位是采样率,在写入时时间要转换为以音频采样率为单位的时间;视频的时间单位可以自己设定,同样根据实际需要进行统一时间转换,以确保各路视频数据在时间上的一致性。
(2)防止开始播放MP4时产生花屏现象
在将各路视频数据和音频数据写入MP4文件时,需要在找到MP4文件中的第一个关键帧时才开始写入视频数据和音频数据,这样生成的MP4文件能避免一始播放就出现花屏的现象。
(3)视频参数集的提取和写入
如果视频trak的stsd没有H.264的参数集时播放器不能播放。这时,在收到第一个IDR(Instantaneous Decoding Refresh,即时解码刷新)帧时,从IDR帧提取SPS(序列参数集,Sequence Parameter Set)和PPS(图像参数集Picture Parameter Set)写到MP4文件中,这样就解决了H.264不能播放的问题
(4)音频信息提取和写入
当音频为AAC音频时,需要将MP4文件中音频trak的stsd中写入音频特定信息,否则播放时将没有声音:在解码音频时,首先解析adts头,提取AAC类型、采样率、声道配置等信息,写入到MP4的stsd中,这样解决了音频不能播放的问题。
因此,本发明基于MP4文件封装格式将各路视频数据和音频数据合并生成MP4文件,一方面,使多媒体录播服务器可以不再局限在使用微软的流媒体服务器,还可以使用开源的流媒体服务器或者HTTP服务器,另一方面,由于MP4文件格式是目前较为流行且广发支持的文件格式,从而使得浏览播放端也具有较好的广泛适用性。
其中,结合图2所示为本发明MP4文件格式的结构示意图,图中trak可以是任意视频trak或者音频trak。为了帮助了解MP4文件格式并理解本发明,对MP4文件格式做如下介绍:
MP4文件是指符合ISO/IEC1449612标准的文件,由若干个封装有数据的容器(box)(其中,每个box的结构都是4字节的size,4字节的type,还有一些data数据)组成,具体包括:一个MP4文件首先会有且只有一个“ftyp”类型的box,作为MP4格式的标志并包含关于文件的一些信息;之后会有且只有一个“moov”类型的box(电影容器,Movie Box),它是一种内容容器(container box),不包含具体媒体数据,但包含本文件中所有媒体数据的宏观描述信息,moov box下有mvhd和trak这2个子box,其中,mvhd box中记录了创建时间、修改时间、时间度量标尺、可播放时长等信息,而trak box(轨道容器)中的一系列子box描述了每个媒体轨道的具体信息;MP4文件的媒体数据包含在“mdat”类型的box(媒体数据容器,Midia Data Box)中,该类型的box也是container box,可以有多个,也可以没有(当媒体数据全部引用其他文件时);在MP4文件末尾是一个mfra box,为媒体数据的索引文件,可通过查询直接定位所需时间点的媒体数据。
其中,trak box里面包含三类子box,分别是tkhd、edts和mdia,tkhd主要表述本视频轨或音频轨的一些基本信息,其域与前述的mvhd类似,不过mvhd描述的是整个文件的信息,而tkhd描述是本轨道的信息。edts是一个容器box,里面通过包含子box elst描述一些编辑片段信息,在文件的定位会有一些用处。trak box里面最重要的子box就是mdia box了,这个box也是一个容器box,里面包含mdhd、hdlr和minf三类子box。minf box里面又分别有vmhd(或smhd)(分别表示视频和音频)、dinf和stbl这三个box中,最重要的信息保存在stbl box中,stbl box可以说是mp4文件中最重要的box了,几乎关于所有核心数据描述都放在这个box里面。
stbl box也是一个容器,全称是sample table。stbl box里面包含对样本(sample)进行各种描述的子box。其中,样本(sample)是MP4文件数据的基本单位,一个样本就是表示音视频的一帧。stbl里面包含的几类主要的样本容器(sample box),分别是:
1、样本时间容器(stts box,time to sample box),存储了样本的时间信息。Stts box能很方便的根据时间标签(timestamp)找到对应的样本,或者获取某个样本对应的时间标签。
2、样本关键帧容器(stss box,sync sample box),存储了每个关键帧的样本ID,根据stss box能方便的找到当前帧最近的关键帧。
3、样本大小容器(stsz box,sample size box),stsz box可以描述每个样本的大小。
4、样本位置容器(stco box,chunk offset box),stco box描述了每个块(chunk)在文件中的绝对偏移位置。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于MP4文件封装格式的多媒体录播系统,其特征在于,所述多媒体录播系统包括:
多个的音视频产生设备;
在每个音视频产生设备的视频输出端分别连接一个视频编码器,用于对每路视频数据分别进行编码处理;
在每个音视频产生设备的视频输出端分别连接一个音频编码器,用于将每路音频数据进行AAC音频编码处理;
分别与各个所述视频编码器、所述音频编码器相连的多媒体录播服务器,用于将各路视频数据和音频数据进行合并,按照MP4文件封装格式生成MP4文件。
2.根据权利要求1所述基于MP4文件封装格式的多媒体录播系统,其特征在于,各个所述视频编码器、所述音频编码器分别通过IP网络连接所述多媒体录播服务器。
3.根据权利要求2所述基于MP4文件封装格式的多媒体录播系统,其特征在于,所述多媒体录播系统还包括:若干个通过IP网络连接多媒体录播服务器的浏览播放端,用于从多媒体录播服务器获取MP4文件进行浏览播放。
4.根据权利要求1所述基于MP4文件封装格式的多媒体录播系统,其特征在于,所述多媒体录播服务器在将各路视频数据和音频数据在写入MP4文件时,使各路视频数据和音频数据中的时间戳保持同步。
5.根据权利要求1所述基于MP4文件封装格式的多媒体录播系统,其特征在于,所述多媒体录播服务器在将各路视频数据和音频数据写入MP4文件时,在找到MP4文件中的第一个关键帧时才开始写入视频数据和音频数据。
6.根据权利要求1所述基于MP4文件封装格式的多媒体录播系统,其特征在于,所述多媒体录播服务器在将各路视频数据和音频数据写入MP4文件时,从收到的第一个IDR帧之中提取SPS和PPS写到MP4文件中。
7.根据权利要求1所述基于MP4文件封装格式的多媒体录播系统,其特征在于,所述音视频产生设备包括摄像机、视频会议终端、话筒或/和广播设备。
8.根据权利要求1-7任何一项所述基于MP4文件封装格式的多媒体录播系统,其特征在于,所述多媒体录播服务器为流媒体服务器或HTTP服务器。
CN2012102298139A 2012-07-04 2012-07-04 基于mp4文件封装格式的多媒体录播系统 Pending CN102723104A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012102298139A CN102723104A (zh) 2012-07-04 2012-07-04 基于mp4文件封装格式的多媒体录播系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012102298139A CN102723104A (zh) 2012-07-04 2012-07-04 基于mp4文件封装格式的多媒体录播系统

Publications (1)

Publication Number Publication Date
CN102723104A true CN102723104A (zh) 2012-10-10

Family

ID=46948840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012102298139A Pending CN102723104A (zh) 2012-07-04 2012-07-04 基于mp4文件封装格式的多媒体录播系统

Country Status (1)

Country Link
CN (1) CN102723104A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105704581A (zh) * 2016-01-25 2016-06-22 互联天下科技发展(深圳)有限公司 基于mp4文件格式的http实时视频传输方法
CN107197317A (zh) * 2017-06-06 2017-09-22 深圳市米亚印乐科技有限公司 局域网多路信号的直播方法和系统
CN112804564A (zh) * 2021-03-29 2021-05-14 浙江华创视讯科技有限公司 视频会议的媒体流加工方法、装置、设备及可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1787036A (zh) * 2005-10-21 2006-06-14 上海复旦光华信息科技股份有限公司 基于网络的多种媒体实时同步教学系统
CN1802858A (zh) * 2003-04-17 2006-07-12 韩国电子通信研究院 基于运动图像专家组-4的立体视频因特网广播系统和方法
CN101197992A (zh) * 2006-12-05 2008-06-11 中兴通讯股份有限公司 基于媒体服务器的视频和音频同步方法
CN101395922A (zh) * 2006-11-17 2009-03-25 Lg电子株式会社 用于解码/编码视频信号的方法及装置
CN101444102A (zh) * 2006-03-27 2009-05-27 诺基亚公司 在可伸缩视频编码中的图像分隔符
US20100262667A1 (en) * 2007-12-20 2010-10-14 France Telecom System and method for managing federated messagings
CN102137098A (zh) * 2011-01-25 2011-07-27 北京天纵网联科技有限公司 一种移动互联网终端在线实时录制和转发音视频流的方法
CN102291599A (zh) * 2011-05-07 2011-12-21 董友球 网络视频播放方法及网络视频播放装置
US20120096056A1 (en) * 2008-05-12 2012-04-19 Edward Eric Thomas Managing media files using metadata injection

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1802858A (zh) * 2003-04-17 2006-07-12 韩国电子通信研究院 基于运动图像专家组-4的立体视频因特网广播系统和方法
CN1787036A (zh) * 2005-10-21 2006-06-14 上海复旦光华信息科技股份有限公司 基于网络的多种媒体实时同步教学系统
CN101444102A (zh) * 2006-03-27 2009-05-27 诺基亚公司 在可伸缩视频编码中的图像分隔符
CN101395922A (zh) * 2006-11-17 2009-03-25 Lg电子株式会社 用于解码/编码视频信号的方法及装置
CN101197992A (zh) * 2006-12-05 2008-06-11 中兴通讯股份有限公司 基于媒体服务器的视频和音频同步方法
US20100262667A1 (en) * 2007-12-20 2010-10-14 France Telecom System and method for managing federated messagings
US20120096056A1 (en) * 2008-05-12 2012-04-19 Edward Eric Thomas Managing media files using metadata injection
CN102137098A (zh) * 2011-01-25 2011-07-27 北京天纵网联科技有限公司 一种移动互联网终端在线实时录制和转发音视频流的方法
CN102291599A (zh) * 2011-05-07 2011-12-21 董友球 网络视频播放方法及网络视频播放装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105704581A (zh) * 2016-01-25 2016-06-22 互联天下科技发展(深圳)有限公司 基于mp4文件格式的http实时视频传输方法
CN107197317A (zh) * 2017-06-06 2017-09-22 深圳市米亚印乐科技有限公司 局域网多路信号的直播方法和系统
CN112804564A (zh) * 2021-03-29 2021-05-14 浙江华创视讯科技有限公司 视频会议的媒体流加工方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
JP6681986B2 (ja) トランスポートのためのコード化された次世代オーディオデータの選択
JP6845223B2 (ja) コーディングされたオーディオデータのトランスポート
KR102534899B1 (ko) Http 를 통한 동적 적응형 스트리밍에서의 가상 현실 비디오 시그널링
CN103069799B (zh) 发信号通知用于多路复用视频分量的数据
RU2459378C2 (ru) Устройство и способ для обработки и чтения файла, имеющего хранилище медиаданных и хранилище метаданных
TW201841512A (zh) 在使用mime類型參數之網路視頻串流中發信重要視頻資訊
TWI699115B (zh) 用於視訊之改良式限制方案設計
US10887645B2 (en) Processing media data using file tracks for web content
CN104602105B (zh) 视频文件的播放方法及用户设备
KR20100087196A (ko) 적어도 하나의 파일 내에 미디어 및 멀티미디어 데이터 중 적어도 하나를 구성하는 방법 및 장치, 액세스 방법, 컴퓨터 판독가능 저장 매체
CA2740119C (en) System and method for storing multi-source multimedia presentations
CN105049920A (zh) 一种多媒体文件的录制方法和装置
CN102611690A (zh) 一种基于超文本传输协议流化的容器格式转化方法
TW201909007A (zh) 使用用於檔案格式邏輯框之一通用描述符處理媒體資料
WO2020093931A1 (zh) 字幕数据处理方法、装置、设备和计算机存储介质
WO2010130188A1 (zh) 一种承载ts流的方法及装置
CN105049904A (zh) 一种多媒体文件的播放方法和装置
CN109076264A (zh) 样本条目和随机存取
CN104919809A (zh) 内容服务器和内容分配法
CN102723104A (zh) 基于mp4文件封装格式的多媒体录播系统
JPWO2017122543A1 (ja) 情報処理装置および情報処理方法
CN103428527A (zh) 数据源实时媒体流转换方法和续点切换播放方法
CN109640162A (zh) 码流转换方法及系统
WO2014171385A1 (ja) サーバ装置、コンテンツ提供方法及びコンピュータプログラム
US10484725B2 (en) Information processing apparatus and information processing method for reproducing media based on edit file

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20121010

RJ01 Rejection of invention patent application after publication