CN105141973A - 多分段的媒体文件拼接方法和系统 - Google Patents

多分段的媒体文件拼接方法和系统 Download PDF

Info

Publication number
CN105141973A
CN105141973A CN201510553206.1A CN201510553206A CN105141973A CN 105141973 A CN105141973 A CN 105141973A CN 201510553206 A CN201510553206 A CN 201510553206A CN 105141973 A CN105141973 A CN 105141973A
Authority
CN
China
Prior art keywords
file
media
media file
spliced
whole section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510553206.1A
Other languages
English (en)
Inventor
高上
冷志勇
李凤山
卢述奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING BAOFENG TECHNOLOGY Co Ltd
Original Assignee
BEIJING BAOFENG TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING BAOFENG TECHNOLOGY Co Ltd filed Critical BEIJING BAOFENG TECHNOLOGY Co Ltd
Priority to CN201510553206.1A priority Critical patent/CN105141973A/zh
Publication of CN105141973A publication Critical patent/CN105141973A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请公开了一种多分段的媒体文件拼接方法,包括:分析各个分段媒体文件的头信息和媒体数据尺寸,确定待拼接成的整段媒体文件的文件类型、文件播放时长、所含视音频流数量、各视音频流采用的编码标准、以及各视音频流所含的所有视音频帧在待拼接成的整段媒体文件中的位置偏移和时间偏移信息;根据确定结果,生成待拼接成的整段媒体文件的头信息;至少利用各个分段媒体文件的媒体数据按顺序物理拼接,生成待拼接成的整段媒体文件的媒体数据;利用生成的待拼接成的整段媒体文件的头信息和待拼接成的整段媒体文件的媒体数据,输出拼接文件。本发明还公开了一种相应的拼接系统。通过将多分段转化为单个长媒体文件,在播放过程中不会出现短暂中断。

Description

多分段的媒体文件拼接方法和系统
技术领域
本发明涉及媒体文件拼接方法及系统,尤其涉及一种多分段的媒体文件拼接方法和系统。
背景技术
基于开放互联网的移动流媒体服务是将来满足直播、点播以及时移等诸多应用需求的最佳解决方案之一。基于开放互联网的音视频服务,终端可以是电视机、电脑、机顶盒、PAD、智能手机等等。意指在网络之上提供服务,强调服务与物理网络的无关性。对于现在各大音视频网站所提供的媒体内容,绝大多数是采用按时间分割成多个分段的方式来存储和传输一段媒体内容(例如:一部90分钟的电影,可分成9段,每段10分钟),其中的每个分段都是独立完整的媒体文件。
目前的多分段媒体文件有分段FLV文件和分段MP4文件,每个媒体文件(FLV或MP4)分段都由“头信息”和“媒体数据”组成。通常,头信息在媒体文件头部,媒体数据在头信息后直到媒体文件尾。
头信息通常由文件类型、文件播放时长、所含视音频流数量、各音视频流采用的编码标准以及各音视频流所含“帧信息”等描述信息组成。其中,FLV文件的帧信息由各个关键帧在文件中的位置偏移信息和时间偏移信息组成;MP4文件的帧信息由所有帧在文件中的增量位置偏移信息和增量时间偏移信息组成。目前通常的,同属于一段媒体内容的各个分段头信息中的文件类型、所含视音频流数量、各音视频流采用的编码等信息也是一致的。
媒体数据由各视频帧和各音频帧组成。其中,FLV文件的视(音)频帧包含此帧的显示时间戳和编码数据;MP4的视(音)频帧只含有编码数据。
现有技术在播放这种多分段的媒体文件时,是按照列表的方式顺序播放的,即:打开播放器,播放第一段媒体文件,待第一段媒体文件播放结束后“重置播放器”,然后再播放下一段媒体文件……以此类推,直到播放完所有分段后关闭播放器。这里的“重置播放器”指的是在播放器内部重新初始化播放器的过程。
但是,目前的这种“分段播放”存在着明显的缺陷,主要在于:
当这种多分段的媒体文件(例如视频文件)播放时间较短时,每个分段文件的播放时间更短。于是播放器在播放两个连续分段(A、B分段)的切换过程中,会发生A分段播放完成后关闭音视频解码器,关闭文件解复用器,重置播放器到初始状态,重新打开解复用器,重新打开音视频解码器,解析B分段头信息等。然而,这个过程的执行需要一段时间,势必会使A、B分段播放衔接的过程中出现画面短暂停滞和声音短暂停顿(本文称为音视频“短暂中断”)。对于短的分段文件而言,在整个视频的播放过程中会频繁出现“短暂中断”的现象,这严重影响了用户体验。
当这种多分段的视频文件很大时,相应的各个分段的头信息(其设置在视频文件的最开始位置,包含上述提到的视频文件的类型、编码信息以及各关键帧的数据位置偏移和显示时间戳等)也会非常大。这样就造成在线视频的多个分段在下载过程中每次都需要先经过长时间缓存才能把头信息文件下载下来,然后才能逐步播放,这样非常影响客户的体验,客户需要多次等待长时间的缓存才能全部读取完视频文件。
另外,即使用户采用下载离线视频文件后续来播放,针对这种下载的视频文件依然存在分段点,在此分段点处切换来读取播放,这就会导致在播放过程中段与段之间会出现闪烁,或者音频之间停顿等问题。
发明内容
有鉴于此,本申请所要解决的技术问题是提供了一种多分段的媒体文件拼接方法和系统,来解决目前通常的多分段的媒体文件播放时的多次等待或中断的问题。
为了解决上述技术问题,本申请一方面提出了一种多分段的媒体文件拼接方法,包括:
分析各个分段媒体文件的头信息和媒体数据尺寸,确定待拼接成的整段媒体文件的文件类型、文件播放时长、所含视音频流数量、各视音频流采用的编码标准、以及各视音频流所含的所有视音频帧在待拼接成的整段媒体文件中的位置偏移和时间偏移信息;
根据确定结果,生成待拼接成的整段媒体文件的头信息;
至少利用各个分段媒体文件的媒体数据按顺序物理拼接,生成待拼接成的整段媒体文件的媒体数据;
利用生成的待拼接成的整段媒体文件的头信息和待拼接成的整段媒体文件的媒体数据,输出拼接文件。
在一些实施方式中,所述分析各个分段媒体文件的头信息和媒体数据尺寸,确定待拼接成的整段媒体文件的文件类型、文件播放时长、所含视音频流数量、各视音频流采用的编码标准、以及各视音频流所含的所有视音频帧在待拼接成的整段媒体文件中的位置偏移和时间偏移信息包括:
解析各个分段媒体文件的分段头信息,统计出待拼接成的整段媒体文件的文件类型、文件播放时长、所含视音频流的数量和编码标准、所含音视频帧的数量;
根据统计信息,确定待拼接成的整段媒体文件的头信息的大小;
根据待拼接成的整段媒体文件的头信息的大小,确定待拼接成的整段媒体文件中媒体数据的偏移量,根据各个分段媒体文件中媒体数据的尺寸,各个分段媒体文件中媒体数据的偏移,以及待拼接成的整段媒体文件中媒体数据的偏移量,确定每一个分段媒体文件中每一帧在待拼接成的整段媒体文件中的位置偏移;
根据各个分段媒体文件中媒体播放时长,确定每一个分段媒体文件中每一帧在待拼接成的整段媒体文件中的时间偏移。
在一些实施方式中,所述至少利用各个分段媒体文件的媒体数据按顺序物理拼接,生成待拼接成的整段媒体文件的媒体数据包括:在各个分段媒体文件的媒体数据按顺序物理拼接的基础上,修改各个分段媒体数据中的所有音视频帧的显示时间为此帧在待拼接成的整段媒体文件中的显示时间。
在一些实施方式中,所述利用生成的待拼接成的整段媒体文件的头信息和待拼接成的整段媒体文件的媒体数据,输出拼接文件包括:输出拼接文件至媒体播放器或本地HTTP服务器。
在一些实施方式中,所述媒体文件为MP4文件或FLV文件。
本发明另一方面提出了一种多分段的媒体文件拼接系统,包括:
分析计算单元,配置以分析各个分段媒体文件的头信息和媒体数据尺寸,确定待拼接成的整段媒体文件的文件类型、文件播放时长、所含视音频流数量、各视音频流采用的编码标准、以及各视音频流所含的所有视音频帧在待拼接成的整段媒体文件中的位置偏移和时间偏移信息;
拼接文件的头信息生成单元,配置以根据确定结果,生成待拼接成的整段媒体文件的头信息;
拼接文件的媒体数据生成单元,配置以至少利用各个分段媒体文件的媒体数据按顺序物理拼接,生成待拼接成的整段媒体文件的媒体数据;
拼接文件输出单元,配置以利用生成的待拼接成的整段媒体文件的头信息和待拼接成的整段媒体文件的媒体数据,输出拼接文件。
在一些实施方式中,所述分析计算单元特别配置以解析各个分段媒体文件的分段头信息,统计出待拼接成的整段媒体文件的文件类型、文件播放时长、所含视音频流的数量和编码标准、所含音视频帧的数量;
根据统计信息,确定待拼接成的整段媒体文件的头信息的大小;
根据待拼接成的整段媒体文件的头信息的大小,确定待拼接成的整段媒体文件中媒体数据的偏移量,根据各个分段媒体文件中媒体数据的尺寸,各个分段媒体文件中媒体数据的偏移,以及待拼接成的整段媒体文件中媒体数据的偏移量,确定每一个分段媒体文件中每一帧在待拼接成的整段媒体文件中的位置偏移;
根据各个分段媒体文件中媒体播放时长,确定每一个分段媒体文件中每一帧在待拼接成的整段媒体文件中的时间偏移。
在一些实施方式中,所述拼接文件的媒体数据生成单元配置以在各个分段媒体文件的媒体数据按顺序物理拼接的基础上,修改各个分段媒体数据中的所有音视频帧的显示时间为此帧在待拼接成的整段媒体文件中的显示时间。
本发明还提出了一种媒体播放器或HTTP服务器,包括上述的多分段的媒体文件拼接系统。
与现有技术相比,本申请所述的方法和系统,达到了如下效果:
本发明将多分段式媒体文件转化为单个长媒体文件。因此,在后续播放过程中,不会出现因为多个分段逐步播放导致的现有技术中的多次“重置播放器”操作。也就不会出现媒体文件“短暂中断”的现象,极大地提升了用户体验。
另外,因为后续播放的实际上是实时拼接后的单段媒体文件,因此,不会多次缓存分段文件的多个头信息,确保播放过程中的连贯性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本发明一实施例的多分段的MP4文件拼接方法的流程图;
图2示出了本发明另一实施例的多分段的FLV文件拼接方法的流程图;
图3示出了图1和2中的方法中的步骤S101的一种具体实施方式的详细执行图;
图4示出了根据本发明的多分段的媒体文件拼接系统的示意图;
图5示出了本发明一实施例的多分段的媒体文件拼接系统的具体应用示意图;
图6示出了本发明另一实施例的多分段的媒体文件拼接系统的具体应用示意图。
具体实施方式
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包括”为一开放式用语,故应解释成“包括但不限定于”。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求书所界定者为准。
如图1所示,为本发明一实施例的多分段的MP4文件的拼接的方法,包括:
S101:分析各个分段媒体文件File1、File2…Filen的头信息和媒体数据尺寸,确定待拼接成的整段媒体文件Fileall的文件类型、文件播放时长、所含视音频流数量、各视音频流采用的编码标准、以及各视音频流所含的所有视音频帧在Fileall中的位置偏移和时间偏移信息;
S102:根据确定结果,生成Fileall的头信息;
S103:对各个分段媒体文件的媒体数据Data1、Data2…Datan按顺序物理拼接,生成Fileall的媒体数据;
S104:利用生成的Fileall的头信息和Fileall的媒体数据,输出拼接文件Fileall
参照图2,为本发明另一实施例的多分段的FLV文件的拼接的方法,包括:
S101:分析各个分段媒体文件File1、File2…Filen的头信息和媒体数据尺寸,确定拼接成整段媒体文件Fileall的文件类型、文件播放时长、所含视音频流数量、各视音频流采用的编码标准、以及各视音频流所含的所有视音频帧在Fileall中的位置偏移和时间偏移信息;
S102:根据确定结果,生成Fileall的头信息;
S103’:在各个分段媒体文件的媒体数据Data1、Data2…Datan按顺序物理拼接的基础上,修改各个分段媒体数据中的所有音视频帧的显示时间为此帧在拼接文件Fileall中的显示时间(比如,每段10分钟,第三分段中某帧在第三分段的显示时间为1分,则此帧在整个拼接文件的显示时间就是10+10+1=21分。修改就是在原数据内容中将在分段中的显示时间替换成在整段中的显示时间);
S104:利用生成的Fileall的头信息和Fileall的媒体数据,输出拼接文件Fileall
针对上述图1和2中的步骤S104中输出的拼接文件Fileall,可以将其输出至媒体播放器或本地HTTP服务器以用于后续的播放。
继续参照图3,关于图1和2中的步骤S101的执行,可以包括如下子步骤:
S1011:解析各个分段媒体文件File1、File2…Filen的分段头信息,统计出待拼接成的整段媒体文件Fileall的文件类型(MP4或FLV)、文件播放时长(各个分段时长相加)、所含视音频流的数量(与各个分段数量一致)和编码标准(与各个分段一致)、所含音视频帧(FLV文件中指关键帧)的数量(各个分段帧数相加);
S1012:根据统计信息,可以计算出待拼接成的整段媒体文件Fileall的头信息所占有的字节数,确定Fileall的头信息的大小;
S1013:由于头信息后紧接媒体数据,根据Fileall的头信息的大小,也就确定了Fileall中媒体数据的偏移量DataOffsetall(DataOffsetall等于头信息大小);
S1014:根据各个分段媒体文件File1、File2...Filen中媒体数据的尺寸DataSize1、DataSize2...DataSizen,各个分段媒体文件中媒体数据的偏移DataOffset1、DataOffset2...DataOffsetn,以及Fileall中媒体数据的偏移量DataOffsetall,确定每一个分段媒体文件中每一帧(FLV文件中的每一关键帧)在Fileall中的位置偏移;
S1015:根据各个分段媒体文件File1、File2...Filen中媒体播放时长Duration1、Duration2...Durationn,确定每一个分段媒体文件中每一帧(FLV文件中的每一关键帧)在Fileall中的时间偏移。
对于步骤S1014中的位置偏移的确定,可以假设某分段媒体文件Filem中的某帧Frame,设其在Filem中的位置偏移为FramePositionm(分段头信息中可知),采用如下公式:
FramePositionall=DataOffsetall+DataSize1+DataSize2+...+DataSizem-1+FramePositionm-DataOffsetm
来确定Frame在Fileall中的位置偏移FramePositionall
对于步骤S1015中的时间偏移的确定,可以假设某分段媒体文件Filem中的某帧Frame,设其在Filem中的时间偏移为FrameTimem(分段头信息中可知),采用如下公式:
FrameTimeall=Duration1+Duration2+...+Durationm-1+FrameTimem
来确定Frame在Fileall中的时间偏移FrameTimeall
采用的本发明的示例性的上述实施例的拼接方法,对于播放分段式的媒体文件来说,非常有利,避免了播放过程中的卡顿等现象。其中,上述图1中的方法,可以根据本发明的下述系统(同样可以参照图4)予以实施。
一种多分段的MP4文件拼接以便播放的系统,包括:
分析计算单元,配置以分析各个分段媒体文件File1、File2…Filen的头信息和媒体数据尺寸,确定待拼接成的整段媒体文件Fileall的文件类型、文件播放时长、所含视音频流数量、各视音频流采用的编码标准、以及各视音频流所含的所有视音频帧在Fileall中的位置偏移和时间偏移信息;
拼接文件Fileall的头信息生成单元,配置以根据确定结果,生成Fileall的头信息;
拼接文件Fileall的媒体数据生成单元,配置以对各个分段媒体文件的媒体数据Data1、Data2…Datan按顺序物理拼接,生成Fileall的媒体数据;
拼接文件Fileall输出单元,配置以利用生成的Fileall的头信息和Fileall的媒体数据,输出拼接文件Fileall
上述图2中的方法,可以根据本发明的下述系统(同样可以参照图4)予以实施。
一种多分段的FLV文件拼接以便播放的系统,包括:
分析计算单元,配置以分析各个分段媒体文件File1、File2…Filen的头信息和媒体数据尺寸,确定拼接成整段媒体文件Fileall的文件类型、文件播放时长、所含视音频流数量、各视音频流采用的编码标准、以及各视音频流所含的所有视音频帧在Fileall中的位置偏移和时间偏移信息;
拼接文件Fileall的头信息生成单元,配置以根据确定结果,生成Fileall的头信息;
拼接文件Fileall的媒体数据生成单元,配置以在各个分段媒体文件的媒体数据Data1、Data2…Datan按顺序物理拼接的基础上,修改各个分段媒体数据中的所有音视频帧的显示时间为此帧在拼接文件Fileall中的显示时间;
拼接文件Fileall输出单元,配置以利用生成的Fileall的头信息和Fileall的媒体数据,输出拼接文件Fileall
在本发明的系统中,该分析计算单元可以具体配置为:
解析各个分段媒体文件File1、File2…Filen的分段头信息,统计出待拼接成的整段媒体文件Fileall的文件类型、文件播放时长、所含视音频流的数量和编码标准、所含音视频帧的数量;
根据统计信息,计算出待拼接成的整段媒体文件Fileall的头信息所占有的字节数,确定Fileall的头信息的大小;
根据Fileall的头信息的大小,确定Fileall中媒体数据的偏移量DataOffsetall
根据各个分段媒体文件File1、File2...Filen中媒体数据的尺寸DataSize1、DataSize2...DataSizen,各个分段媒体文件中媒体数据的偏移DataOffset1、DataOffset2...DataOffsetn,以及Fileall中媒体数据的偏移量DataOffsetall,确定每一个分段媒体文件中每一帧(FLV文件中的每一关键帧)在Fileall中的位置偏移;
根据各个分段媒体文件File1、File2...Filen中媒体播放时长Duration1、Duration2...Durationn,确定每一个分段媒体文件中每一帧(FLV文件中的每一关键帧)在Fileall中的时间偏移。
本发明实现了一种“多分段的媒体文件拼接的系统”,其可作为其他应用开发中的“输入模块”,根据应用输入的请求,实时输入多分段视频,并拼接输出单段视频给应用。参照图5,作为本发明的多分段的媒体文件拼接系统的一种实际应用。其中,媒体播放器可以配置成包括上述多分段的媒体文件拼接系统。
针对系统播放器(或第三方实现的媒体播放器),考虑到无法直接增量开发播放器中的“输入模块”。可转而开发采用包括本发明的“多分段的媒体文件拼接系统”的本地HTTP服务器(如图6所示)。于是可以设置系统播放器(或第三方实现的媒体播放器)通过HTTP协议向此HTTP服务器请求拼接后的整段视频数据,此HTTP服务器根据请求,实时输入多分段视频,并拼接输出单段视频回复播放器请求。这样间接实现了系统播放器(或第三方实现的媒体播放器)的输入模块。
本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包括有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。

Claims (10)

1.一种多分段的媒体文件拼接方法,包括:
分析各个分段媒体文件的头信息和媒体数据尺寸,确定待拼接成的整段媒体文件的文件类型、文件播放时长、所含视音频流数量、各视音频流采用的编码标准、以及各视音频流所含的所有视音频帧在待拼接成的整段媒体文件中的位置偏移和时间偏移信息;
根据确定结果,生成待拼接成的整段媒体文件的头信息;
至少利用各个分段媒体文件的媒体数据按顺序物理拼接,生成待拼接成的整段媒体文件的媒体数据;
利用生成的待拼接成的整段媒体文件的头信息和待拼接成的整段媒体文件的媒体数据,输出拼接文件。
2.根据权利要求1所述的方法,其特征在于,所述分析各个分段媒体文件的头信息和媒体数据尺寸,确定待拼接成的整段媒体文件的文件类型、文件播放时长、所含视音频流数量、各视音频流采用的编码标准、以及各视音频流所含的所有视音频帧在待拼接成的整段媒体文件中的位置偏移和时间偏移信息包括:
解析各个分段媒体文件的分段头信息,统计出待拼接成的整段媒体文件的文件类型、文件播放时长、所含视音频流的数量和编码标准、所含音视频帧的数量;
根据统计信息,确定待拼接成的整段媒体文件的头信息的大小;
根据待拼接成的整段媒体文件的头信息的大小,确定待拼接成的整段媒体文件中媒体数据的偏移量,根据各个分段媒体文件中媒体数据的尺寸,各个分段媒体文件中媒体数据的偏移,以及待拼接成的整段媒体文件中媒体数据的偏移量,确定每一个分段媒体文件中每一帧在待拼接成的整段媒体文件中的位置偏移;
根据各个分段媒体文件中媒体播放时长,确定每一个分段媒体文件中每一帧在待拼接成的整段媒体文件中的时间偏移。
3.根据权利要求1所述的方法,其特征在于,所述至少利用各个分段媒体文件的媒体数据按顺序物理拼接,生成待拼接成的整段媒体文件的媒体数据包括:在各个分段媒体文件的媒体数据按顺序物理拼接的基础上,修改各个分段媒体数据中的所有音视频帧的显示时间为此帧在待拼接成的整段媒体文件中的显示时间。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述利用生成的待拼接成的整段媒体文件的头信息和待拼接成的整段媒体文件的媒体数据,输出拼接文件包括:输出拼接文件至媒体播放器或本地HTTP服务器。
5.根据权利要求1-3中任一项所述的方法,其特征在于,所述媒体文件为MP4文件或FLV文件。
6.一种多分段的媒体文件拼接系统,包括:
分析计算单元,配置以分析各个分段媒体文件的头信息和媒体数据尺寸,确定待拼接成的整段媒体文件的文件类型、文件播放时长、所含视音频流数量、各视音频流采用的编码标准、以及各视音频流所含的所有视音频帧在待拼接成的整段媒体文件中的位置偏移和时间偏移信息;
拼接文件的头信息生成单元,配置以根据确定结果,生成待拼接成的整段媒体文件的头信息;
拼接文件的媒体数据生成单元,配置以至少利用各个分段媒体文件的媒体数据按顺序物理拼接,生成待拼接成的整段媒体文件的媒体数据;
拼接文件输出单元,配置以利用生成的待拼接成的整段媒体文件的头信息和待拼接成的整段媒体文件的媒体数据,输出拼接文件。
7.根据权利要求6所述的系统,其特征在于,所述分析计算单元配置以解析各个分段媒体文件的分段头信息,统计出待拼接成的整段媒体文件的文件类型、文件播放时长、所含视音频流的数量和编码标准、所含音视频帧的数量;
根据统计信息,确定待拼接成的整段媒体文件的头信息的大小;
根据待拼接成的整段媒体文件的头信息的大小,确定待拼接成的整段媒体文件中媒体数据的偏移量,根据各个分段媒体文件中媒体数据的尺寸,各个分段媒体文件中媒体数据的偏移,以及待拼接成的整段媒体文件中媒体数据的偏移量,确定每一个分段媒体文件中每一帧在待拼接成的整段媒体文件中的位置偏移;
根据各个分段媒体文件中媒体播放时长,确定每一个分段媒体文件中每一帧在待拼接成的整段媒体文件中的时间偏移。
8.根据权利要求6所述的系统,其特征在于,所述拼接文件的媒体数据生成单元配置以在各个分段媒体文件的媒体数据按顺序物理拼接的基础上,修改各个分段媒体数据中的所有音视频帧的显示时间为此帧在待拼接成的整段媒体文件中的显示时间。
9.一种媒体播放器,包括根据权利要求6-8中任一项所述的多分段的媒体文件拼接系统。
10.一种HTTP服务器,包括根据权利要求6-8中任一项所述的多分段的媒体文件拼接系统。
CN201510553206.1A 2015-09-01 2015-09-01 多分段的媒体文件拼接方法和系统 Pending CN105141973A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510553206.1A CN105141973A (zh) 2015-09-01 2015-09-01 多分段的媒体文件拼接方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510553206.1A CN105141973A (zh) 2015-09-01 2015-09-01 多分段的媒体文件拼接方法和系统

Publications (1)

Publication Number Publication Date
CN105141973A true CN105141973A (zh) 2015-12-09

Family

ID=54727159

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510553206.1A Pending CN105141973A (zh) 2015-09-01 2015-09-01 多分段的媒体文件拼接方法和系统

Country Status (1)

Country Link
CN (1) CN105141973A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017101433A1 (zh) * 2015-12-15 2017-06-22 乐视控股(北京)有限公司 一种客户端及视频拼接方法
CN106899757A (zh) * 2017-02-06 2017-06-27 青岛海信电器股份有限公司 音视频文件的播放控制方法、装置及终端设备
CN107295376A (zh) * 2016-04-05 2017-10-24 北京优朋普乐科技有限公司 广告和正片的合并方法、装置和广告的投放系统
CN108632541A (zh) * 2017-03-20 2018-10-09 杭州海康威视数字技术股份有限公司 一种多视频片段合并方法及装置
CN110545271A (zh) * 2019-08-28 2019-12-06 北京天融信网络安全技术有限公司 一种文件的还原方法及系统
CN111145778A (zh) * 2019-11-28 2020-05-12 科大讯飞股份有限公司 音频数据的处理方法、装置、电子设备及计算机存储介质
WO2020134892A1 (zh) * 2018-12-29 2020-07-02 华为技术有限公司 一种媒体文件裁剪的方法、电子设备和服务器

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101374231A (zh) * 2007-04-30 2009-02-25 Vixs系统公司 合并多个视频流的系统以及相应使用的方法
CN101409831A (zh) * 2008-07-10 2009-04-15 浙江师范大学 一种多媒体视频对象处理方法
CN102857794A (zh) * 2011-06-28 2013-01-02 上海聚力传媒技术有限公司 一种用于合并视频分段的方法与设备
CN103024603A (zh) * 2012-12-27 2013-04-03 合一网络技术(北京)有限公司 一种用于解决播放网络视频时短时停顿的装置及方法
CN103678689A (zh) * 2013-12-27 2014-03-26 成都索贝数码科技股份有限公司 一种基于文件驱动逻辑的多媒体文件片段快速拼接方法
CN103686203A (zh) * 2013-12-04 2014-03-26 深圳市融创天下科技股份有限公司 视频转码方法及装置
US20150020095A1 (en) * 2013-07-15 2015-01-15 Kt Corporation Video stream combination for video advertisement

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101374231A (zh) * 2007-04-30 2009-02-25 Vixs系统公司 合并多个视频流的系统以及相应使用的方法
CN101409831A (zh) * 2008-07-10 2009-04-15 浙江师范大学 一种多媒体视频对象处理方法
CN102857794A (zh) * 2011-06-28 2013-01-02 上海聚力传媒技术有限公司 一种用于合并视频分段的方法与设备
CN103024603A (zh) * 2012-12-27 2013-04-03 合一网络技术(北京)有限公司 一种用于解决播放网络视频时短时停顿的装置及方法
US20150020095A1 (en) * 2013-07-15 2015-01-15 Kt Corporation Video stream combination for video advertisement
CN103686203A (zh) * 2013-12-04 2014-03-26 深圳市融创天下科技股份有限公司 视频转码方法及装置
CN103678689A (zh) * 2013-12-27 2014-03-26 成都索贝数码科技股份有限公司 一种基于文件驱动逻辑的多媒体文件片段快速拼接方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017101433A1 (zh) * 2015-12-15 2017-06-22 乐视控股(北京)有限公司 一种客户端及视频拼接方法
CN107295376A (zh) * 2016-04-05 2017-10-24 北京优朋普乐科技有限公司 广告和正片的合并方法、装置和广告的投放系统
CN106899757A (zh) * 2017-02-06 2017-06-27 青岛海信电器股份有限公司 音视频文件的播放控制方法、装置及终端设备
CN108632541A (zh) * 2017-03-20 2018-10-09 杭州海康威视数字技术股份有限公司 一种多视频片段合并方法及装置
CN108632541B (zh) * 2017-03-20 2021-07-20 杭州海康威视数字技术股份有限公司 一种多视频片段合并方法及装置
WO2020134892A1 (zh) * 2018-12-29 2020-07-02 华为技术有限公司 一种媒体文件裁剪的方法、电子设备和服务器
CN110545271A (zh) * 2019-08-28 2019-12-06 北京天融信网络安全技术有限公司 一种文件的还原方法及系统
CN111145778A (zh) * 2019-11-28 2020-05-12 科大讯飞股份有限公司 音频数据的处理方法、装置、电子设备及计算机存储介质
CN111145778B (zh) * 2019-11-28 2023-04-04 科大讯飞股份有限公司 音频数据的处理方法、装置、电子设备及计算机存储介质

Similar Documents

Publication Publication Date Title
CN105141973A (zh) 多分段的媒体文件拼接方法和系统
JP4270379B2 (ja) デジタル情報の効率的な伝送および再生
CN103024603B (zh) 一种用于解决播放网络视频时短时停顿的装置及方法
CN105187896A (zh) 多分段的媒体文件播放方法和系统
WO2020078165A1 (zh) 视频处理方法、装置、电子设备及计算机可读介质
CN105208463B (zh) 针对m3u8文件进行帧确定的方法和系统
TWI727186B (zh) 使用網路內容之檔案軌處理媒體資料
EP3209025A1 (en) Splicing method and splicing system for http live streaming media fragmentation
WO2013008867A1 (ja) 送信装置、送信装置の制御方法、制御プログラム、及び記録媒体
US11490173B2 (en) Switch of audio and video
CN110784750B (zh) 视频播放方法、装置及计算机设备
US12046262B2 (en) Content playback control
JP6969013B2 (ja) メディアファイルの同期再生方法、装置及び記憶媒体
CN103165151A (zh) 多媒体文件播放方法和装置
CN105187897A (zh) 多分段的媒体文件跨段播放方法和系统
KR101700040B1 (ko) 이미지 기반 동영상 콘텐츠 제공 방법 및 그 시스템
JP2016072858A (ja) メディアデータ生成方法、メディアデータ再生方法、メディアデータ生成装置、メディアデータ再生装置、コンピュータ読み取り可能な記録媒体、及びプログラム
WO2020035036A1 (zh) 一种节目录制、播放方法及装置
CN116261008B (zh) 音频处理方法和音频处理装置
WO2018139283A1 (ja) 画像処理装置および方法、並びにプログラム
US12096051B2 (en) Systems, methods, and devices for video stream signal analysis
CN112423096B (zh) 播放优化方法及系统
KR101823767B1 (ko) 사용자 요구 및 환경 맞춤형 콘텐츠 제공을 위한 메타 정보를 포함하는 멀티미디어 파일 구조 및 그 시스템
JP7521531B2 (ja) 情報処理装置、情報処理方法、再生処理装置及び再生処理方法
KR101803965B1 (ko) Http 스트리밍 서비스를 제공하는 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100191 Beijing, Xueyuan Road No. 51, the first to enjoy the science and technology building, floor 6,

Applicant after: Storm group Limited by Share Ltd

Address before: 100191 Beijing, Xueyuan Road No. 51, the first to enjoy the science and technology building, floor 6,

Applicant before: Beijing Baofeng Technology Co., Ltd.

COR Change of bibliographic data
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151209