CN102055966A - 一种媒体文件的压缩方法和系统 - Google Patents

一种媒体文件的压缩方法和系统 Download PDF

Info

Publication number
CN102055966A
CN102055966A CN2009102094962A CN200910209496A CN102055966A CN 102055966 A CN102055966 A CN 102055966A CN 2009102094962 A CN2009102094962 A CN 2009102094962A CN 200910209496 A CN200910209496 A CN 200910209496A CN 102055966 A CN102055966 A CN 102055966A
Authority
CN
China
Prior art keywords
video
original
audio
target
resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009102094962A
Other languages
English (en)
Other versions
CN102055966B (zh
Inventor
刘俊
陈敬昌
王新亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN2009102094962A priority Critical patent/CN102055966B/zh
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to MYPI2014703431A priority patent/MY171382A/en
Priority to MYPI2012700169A priority patent/MY159752A/en
Priority to MYPI2014703430A priority patent/MY172698A/en
Priority to PCT/CN2010/074646 priority patent/WO2011054208A1/zh
Priority to US13/500,883 priority patent/US8761244B2/en
Publication of CN102055966A publication Critical patent/CN102055966A/zh
Application granted granted Critical
Publication of CN102055966B publication Critical patent/CN102055966B/zh
Priority to US14/167,820 priority patent/US9014261B2/en
Priority to US14/167,784 priority patent/US8989259B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种媒体文件的压缩方法,包括:从输入的媒体文件中提取编码参数,并对输入的媒体文件进行音、视频流分离和解码,提取出原始音频流和原始视频流;根据编码参数计算压缩所需的转码参数;根据转码参数对原始音频流编码输出新的压缩音频流,对原始视频流编码输出新的压缩视频流;将新的压缩音频流和压缩视频流合并生成新的媒体文件。本发明还提供了一种媒体文件的压缩系统。通过本发明的方法和系统,无需用户了解媒体专业知识就能够实现对各种不同格式的媒体文件的简单快捷压缩,节省存储空间,便于媒体文件的携带、传输和分享。

Description

一种媒体文件的压缩方法和系统
技术领域
本发明涉及媒体文件的压缩技术,尤其涉及一种媒体文件的压缩方法和系统。
背景技术
随着当今数码产品的普及,越来越多的用户通过数码摄像机(DV,Digital Video)、带摄影功能的照相机等设备来拍摄视频,但通过这种方式生成的媒体文件有一个明显的缺点,就是文件通常很大,占用磁盘空间较多,例如:用普通DV拍摄1小时保存的文件大小可能达到2G以上。因此,为了方便用户存储这类较大的视频文件,需要有一款实用工具来帮助用户压缩文件大小,并能保持视频的主观质量。
在生成媒体文件的过程中,音、视频编码是最关键的操作。音、视频编码标准种类繁多,不同的编码标准往往面向不同的业务需求。例如:针对视频电话和视频会议业务提出的H.263标准,针对数字视频广播(DVB,Digital Video Broadcasting)、高清电视(HDTV,High Definition Television)和数字视频光盘(DVD,Digital Video Disc)提出的活动图像专家组(MPEG2,Moving Picture Experts Group2)标准,针对网络中流媒体服务开发的MPEG4标准,以及能够提供高视频压缩性能的H.264标准等。
由于多种编码标准的存在,用户所拥有的媒体文件,其文件格式和音、视频编码格式各不相同。要压缩文件大小,首先需要进行文件解析和音、视频解码,在获得原始的音、视频流之后,要选择合适的音、视频转码器和转码参数来生成新的文件大小更小的媒体文件。因此,要压缩媒体文件大小,首先必须对媒体文件的格式信息进行分析,根据源文件所采用的编解码器的效率和编码参数来确定转码参数。而现有的视频压缩工具往往需要用户对媒体的专业知识有深入的了解,并设置合适的转码参数,才能够得到较好的压缩效果。对于普通的大众用户而言,这种视频压缩工具的使用门槛太高,因此需要提供一种简单快捷的实用工具来满足这类压缩需求。
发明内容
有鉴于此,本发明的主要目的在于提供一种媒体文件的压缩方法和系统,以实现对各种不同格式的媒体文件的简单快捷压缩。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种媒体文件的压缩方法,该方法包括:
从输入的媒体文件中提取编码参数,并对输入的媒体文件进行音、视频流分离和解码,提取出原始音频流和原始视频流;
根据所述编码参数计算压缩所需的转码参数;
根据所述转码参数对所述原始音频流编码输出新的压缩音频流,对所述原始视频流编码输出新的压缩视频流;
将所述新的压缩音频流和压缩视频流合并生成新的媒体文件。
所述编码参数包括视频编码参数和音频编码参数,其中,所述视频编码参数包括:原始视频编码器类型、原始视频编码码率、原始视频编码帧率、原始视频分辨率;所述音频编码参数包括:原始音频编码器类型、原始音频编码码率、原始音频通道数、原始音频采样率;
所述转码参数包括视频转码参数和音频转码参数,其中,所述视频转码参数包括:目标视频编码器类型、目标视频编码码率、目标视频编码帧率、目标视频分辨率;所述音频转码参数包括:目标音频编码器类型、目标音频编码码率、目标音频通道数、目标音频采样率。
该方法进一步包括:计算压缩所需的目标视频编码帧率,按照以下原则进行:
将原始视频编码帧率与15fps进行比较,如果原始视频编码帧率大于15fps,则确定所述目标视频编码帧率为15fps;如果原始视频编码帧率小于15fps,则确定所述目标视频编码帧率与原始视频编码帧率相同。
该方法进一步包括:计算压缩所需的目标视频分辨率,按照以下原则进行:
将原始视频分辨率与640×480进行比较,如果原始视频分辨率不超过640×480,则确定所述目标视频分辨率与原始视频分辨率相同;如果原始视频分辨率超过640×480,则降低分辨率,以640×480为目标保持原始图像宽高比进行缩放,进而得到所述目标视频分辨率。
该方法进一步包括:计算压缩所需的目标视频编码器类型,按照以下原则进行:
如果原始视频编码器类型为RM、或VC1、或H.264,则确定所述目标视频编码器类型为H.264;否则,确定所述目标视频编码器类型为活动图像专家组MPEG4。
该方法进一步包括:计算压缩所需的目标视频编码码率,按照以下原则进行:
计算目标视频编码帧率与原始视频编码帧率的比值K_fps,以及目标视频分辨率与原始视频分辨率的比值K_pix,并根据下式得到备选的目标视频编码码率:K_fps·K_pix·K_br·原始视频编码码率,其中,K_br表示预定的目标码率降低系数;
根据所述目标视频分辨率从预设的参考对应表中选取最接近的参考分辨率,并将选取的参考分辨率所对应的参考码率与所述备选的目标视频编码码率进行比较,选取两者之间相对较小的码率作为压缩所需的目标视频编码码率。
该方法进一步包括:计算压缩所需的音频转码参数,按照以下原则进行:
确定所述目标音频采样率与原始音频采样率相同,目标音频通道数与原始音频通道数相同;确定所述目标音频编码器类型为高级音频编码AAC;
计算原始音频编码码率与原始视频编码码率的比值,并判断该比值是否大于1/3,如果大于1/3,则将所述目标音频编码码率下调一或两个级别;否则,确定所述目标音频编码码率与原始音频编码码率相同。
本发明还提供了一种媒体文件的压缩系统,该系统包括:
媒体信息提取模块,用于从输入的媒体文件中提取所述编码参数;
转码参数计算模块,用于根据所述编码参数计算压缩所需的转码参数;
音、视频流分离模块,用于对输入的媒体文件进行音、视频流分离,得到音频压缩流和视频压缩流;
音频解码模块,用于对分离出的音频压缩流进行解码提取出原始音频流;
视频解码模块,用于对分离出的视频压缩流进行解码提取出原始视频流;
音频编码模块,用于根据所述转码参数对所述原始音频流编码输出新的压缩音频流;
视频编码模块,用于根据所述转码参数对所述原始视频流编码输出新的压缩视频流;
音、视频流合成模块,用于将所述新的压缩音频流和压缩视频流合并生成新的媒体文件。
所述编码参数包括视频编码参数和音频编码参数,其中,所述视频编码参数包括:原始视频编码器类型、原始视频编码码率、原始视频编码帧率、原始视频分辨率;所述音频编码参数包括:原始音频编码器类型、原始音频编码码率、原始音频通道数、原始音频采样率;
所述转码参数包括视频转码参数和音频转码参数,其中,所述视频转码参数包括:目标视频编码器类型、目标视频编码码率、目标视频编码帧率、目标视频分辨率;所述音频转码参数包括:目标音频编码器类型、目标音频编码码率、目标音频通道数、目标音频采样率。
所述转码参数计算模块进一步用于,按照如下原则计算压缩所需的目标视频编码帧率:
将原始视频编码帧率与15fps进行比较,如果原始视频编码帧率大于15fps,则确定所述目标视频编码帧率为15fps;如果原始视频编码帧率小于15fps,则确定所述目标视频编码帧率与原始视频编码帧率相同。
所述转码参数计算模块进一步用于,按照如下原则计算压缩所需的目标视频分辨率:
将原始视频分辨率与640×480进行比较,如果原始视频分辨率不超过640×480,则确定所述目标视频分辨率与原始视频分辨率相同;如果原始视频分辨率超过640×480,则降低分辨率,以640×480为目标保持原始图像宽高比进行缩放,进而得到所述目标视频分辨率。
所述转码参数计算模块进一步用于,按照如下原则计算压缩所需的目标视频编码码率:
计算目标视频编码帧率与原始视频编码帧率的比值K_fps,以及目标视频分辨率与原始视频分辨率的比值K_pix,并根据下式得到备选的目标视频编码码率:K_fps·K_pix·K_br·原始视频编码码率,其中,K_br表示预定的目标码率降低系数;
根据所述目标视频分辨率从预设的参考对应表中选取最接近的参考分辨率,并将选取的参考分辨率所对应的参考码率与所述备选的目标视频编码码率进行比较,选取两者之间相对较小的码率作为压缩所需的目标视频编码码率。
本发明所提供的一种媒体文件的压缩方法和系统,通过从输入的媒体文件中提取编码参数,并对输入的媒体文件进行音、视频流分离和解码,提取出原始音频流和原始视频流;根据编码参数计算压缩所需的转码参数;根据转码参数对原始音频流编码输出新的压缩音频流,对原始视频流编码输出新的压缩视频流;将新的压缩音频流和压缩视频流合并生成新的媒体文件。通过本发明,无需用户了解媒体专业知识就能够实现对各种不同格式的媒体文件的简单快捷压缩,节省存储空间,便于媒体文件的携带、传输和分享。此外,通过本发明的压缩也能够保持源媒体文件的主观质量。
附图说明
图1为本发明一种媒体文件的压缩方法的流程图;
图2为本发明一种媒体文件的压缩系统的组成结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
本发明所提供的一种媒体文件的压缩方法,由本发明的一种媒体文件的压缩系统实现,下面首先对本发明的压缩方法进行详细说明。如图1所示,该压缩方法主要包括以下步骤:
步骤101,从输入的媒体文件中提取编码参数,并对输入的媒体文件进行音、视频流分离和解码,得到原始音频流和原始视频流。
用户指定一个媒体文件,输入到本发明的压缩系统中,输入媒体文件通常可以采用以下方式(本发明并不仅限于这种方式,还可以进行扩展):在媒体播放器中播放某个媒体文件,用于通过点击鼠标右键调用菜单并发起媒体文件的压缩指令,媒体文件随之输入到本发明的压缩系统。
本发明所指的编码参数包括:视频编码参数和音频编码参数,其中,视频编码参数包括:原始视频编码器类型(Src_VideoCodec)、原始视频编码码率(Src_VideoBitrate)、原始视频编码帧率(Src_VideoFps)、原始视频分辨率(Src_Resolution);音频编码参数包括:原始音频编码器类型(Src_AudioCodec)、原始音频编码码率(Src_AudioBitrate)、原始音频通道数(Src_AudioChannel)、原始音频采样率(Src_AudioSamplerate)。
另外,还需要对输入的媒体文件进行音、视频流分离和解码操作。首先,通过音、视频流分离操作得到原始的音频压缩流和视频压缩流,即,根据媒体文件中的文件描述信息可以分辨出音频压缩流和视频压缩流,进而将媒体文件分离得到原始的音频压缩流和视频压缩流;然后,对原始音频压缩流和视频压缩流分别进行解码(或解压缩),得到解码后的原始音频流和原始视频流。
步骤102,根据编码参数计算压缩所需的转码参数。
本发明所指的转码参数包括视频转码参数和音频转码参数,其中,视频转码参数包括:目标视频编码器类型(Dst_VideoCodec)、目标视频编码码率(Dst_VideoBitrate)、目标视频编码帧率(Dst_VideoFps)、目标视频分辨率(Dst_Resolution);音频转码参数包括:目标音频编码器类型(Dst_AudioCodec)、目标音频编码码率(Dst_AudioBitrate)、目标音频通道数(Dst_AudioChannel)、目标音频采样率(Dst_AudioSamplerate)。
计算压缩所需的目标视频编码码率,需按照以下原则进行:
A、计算目标视频编码帧率与原始视频编码帧率的比值,即K_fps=目标视频编码帧率/原始视频编码帧率;
B、计算目标视频分辨率与原始视频分辨率的比值,即K_pix=目标视频分辨率/原始视频分辨率;
C、预定目标码率降低系数K_br,该系数可以根据实际测试结果进行调整,如预定K_br=0.7;
D、根据下式得到备选的目标视频编码码率,即备选的目标视频编码码率=K_fps·K_pix·K_br·原始视频编码码率,其中,K_fps表示目标视频编码帧率与原始视频编码帧率的比值,K_pix表示目标视频分辨率与原始视频分辨率的比值,K_br表示预定的目标码率降低系数,“·”表示相乘;
E、根据目标视频分辨率从预设的参考对应表(如下表1所示)中选取最接近的参考分辨率,并将选取的参考分辨率所对应的参考码率与备选的目标视频编码码率进行比较,选取两者之间相对较小的码率作为压缩所需的目标视频编码码率。
  分辨率   帧率(fps)   码率(kbps)
  参考1   640×480   15   768
  参考2   320×240   15   384
  参考3   160×120   15   128
表1
下面结合表1举例进行说明,假设目标视频分辨率为320×240,那么从表1选取最接近的参考分辨率即为参考2所对应的320×240(该实施例中目标视频分辨率与参考2所对应的分辨率相等,且相等只是一种特殊情况);然后,将参考2所对应的码率384kbps与备选的目标视频编码码率进行比较,选取两者之间相对较小的码率作为压缩所需的目标视频编码码率。假设备选的目标视频编码码率为360kbps(小于384kbps),那么选取360kbps(两者相对较小的)作为压缩所需的目标视频编码码率;假设备选的目标视频编码码率为400kbps(大于384kbps),那么选取384kbps(两者相对较小的)作为压缩所需的目标视频编码码率。
其中,上述计算过程中所需的目标视频编码帧率,需按照以下原则计算:
将原始视频编码帧率与预设的视频编码帧率门限值进行比较,优选的,选取预设的视频编码帧率门限值为15帧每秒(fps,frames per second);如果原始视频编码帧率大于15fps,则确定目标视频编码帧率为15fps;如果原始视频编码帧率小于15fps,则确定目标视频编码帧率与原始视频编码帧率相同(保持不变)。这是因为,太高的帧率对视频主观流畅性贡献不大,但对转码速度以及目标文件大小有负面影响。
上述计算过程中所需的目标视频分辨率,需按照以下原则计算:
将原始视频分辨率与预设的视频分辨率门限值进行比较,优选的,选取预设的视频分辨率门限值为640×480;如果原始视频分辨率不超过640×480,则确定目标视频分辨率与原始视频分辨率相同(保持不变);如果原始视频分辨率超过640×480,则降低分辨率,以640×480为目标保持原始图像宽高比进行缩放,进而得到目标视频分辨率。这是因为,分辨率对转码时间的影响较大。
另外,计算压缩所需的目标视频编码器类型,需按照以下原则进行:
如果原始视频编码器类型为RM(Real Media)、或VC1、或H.264,则确定目标视频编码器类型为H.264;否则(即原始视频编码器类型为除RM、VC1、H.264的其他类型),确定目标视频编码器类型为MPEG4。这是因为,H.264和MPEG4在压缩效率方面具有优势。其中,RM是REAL公司的一种视频编码格式,VC1是微软公司的一种视频编码格式。
计算压缩所需的音频转码参数,需按照以下原则进行:
确定目标音频采样率与原始音频采样率相同(保持不变),目标音频通道数与原始音频通道数相同(保持不变);确定目标音频编码器类型为高级音频编码(AAC,Advanced Audio Coding);
计算原始音频编码码率与原始视频编码码率的比值,并判断该比值是否大于预设的门限比值,例如:1/3,如果判断该比值大于1/3,则将目标音频编码码率在原始音频编码码率的基础上下调一或两个级别;否则,确定目标音频编码码率与原始音频编码码率相同。例如:如果以16KB的码率为一个级别,那么下调两个级别,即将目标音频编码码率在原始音频编码码率的基础上降低32KB。
步骤103,根据转码参数对原始音频流编码输出新的压缩音频流,对原始视频流编码输出新的压缩视频流。
步骤104,将新的压缩音频流和压缩视频流合并生成新的媒体文件。
由于文件的大小主要由编码码率决定,因此经过上述压缩处理后,新生成的媒体文件大小大概为源文件的(Dst_VideoBitrate+Dst_AudioBitrate)/(Src_VideoBitrate+Src_AudioBitrate),也即新生成的媒体文件大小与源文件大小的比值为:(Dst_VideoBitrate+Dst_AudioBitrate)/(Src_VideoBitrate+Src_AudioBitratc)。
为实现上述编码方法,本发明还提供一种媒体文件的压缩系统,如图2所示,该系统包括:媒体信息提取模块11,转码参数计算模块12,音、视频流分离模块13,音频解码模块14,视频解码模块15,音频编码模块16,视频编码模块17,音、视频流合成模块18。其中,媒体信息提取模块11,用于对输入的媒体文件进行分析,提取媒体文件的编码参数,并提供给转码参数计算模块12。转码参数计算模块12,用于根据编码参数分析生成压缩所需的转码参数,所述转码参数提供给音频编码模块16和视频编码模块17。音、视频流分离模块13,用于对输入的媒体文件进行音、视频流分离,得到音频压缩流和视频压缩流。音频解码模块14,用于对分离出的音频压缩流进行解码得到原始音频流。视频解码模块15,用于对分离出的视频压缩流进行解码得到原始视频流。音频编码模块16,用于根据转码参数对原始音频流编码得到新的压缩音频流。视频编码模块17,用于根据转码参数对原始视频流编码得到新的压缩视频流。音、视频流合成模块18,用于将新的压缩音频流和压缩视频流合并生成新的媒体文件。
转码参数的分析生成原则在上述编码方法中已详细说明,此处不再赘述。
综上所述,本发明的编码方法和系统,无需用户了解媒体专业知识就能够实现对各种不同格式的媒体文件的简单快捷压缩,节省存储空间,便于媒体文件的携带、传输和分享。此外,通过本发明的压缩也能够保持源媒体文件的主观质量。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (12)

1.一种媒体文件的压缩方法,其特征在于,该方法包括:
从输入的媒体文件中提取编码参数,并对输入的媒体文件进行音、视频流分离和解码,提取出原始音频流和原始视频流;
根据所述编码参数计算压缩所需的转码参数;
根据所述转码参数对所述原始音频流编码输出新的压缩音频流,对所述原始视频流编码输出新的压缩视频流;
将所述新的压缩音频流和压缩视频流合并生成新的媒体文件。
2.根据权利要求1所述媒体文件的压缩方法,其特征在于,所述编码参数包括视频编码参数和音频编码参数,其中,所述视频编码参数包括:原始视频编码器类型、原始视频编码码率、原始视频编码帧率、原始视频分辨率;所述音频编码参数包括:原始音频编码器类型、原始音频编码码率、原始音频通道数、原始音频采样率;
所述转码参数包括视频转码参数和音频转码参数,其中,所述视频转码参数包括:目标视频编码器类型、目标视频编码码率、目标视频编码帧率、目标视频分辨率;所述音频转码参数包括:目标音频编码器类型、目标音频编码码率、目标音频通道数、目标音频采样率。
3.根据权利要求2所述媒体文件的压缩方法,其特征在于,该方法进一步包括:计算压缩所需的目标视频编码帧率,按照以下原则进行:
将原始视频编码帧率与15dps进行比较,如果原始视频编码帧率大于15dps,则确定所述目标视频编码帧率为15dps;如果原始视频编码帧率小于15dps,则确定所述目标视频编码帧率与原始视频编码帧率相同。
4.根据权利要求2所述媒体文件的压缩方法,其特征在于,该方法进一步包括:计算压缩所需的目标视频分辨率,按照以下原则进行:
将原始视频分辨率与640×480进行比较,如果原始视频分辨率不超过640×480,则确定所述目标视频分辨率与原始视频分辨率相同;如果原始视频分辨率超过640×480,则降低分辨率,以640×480为目标保持原始图像宽高比进行缩放,进而得到所述目标视频分辨率。
5.根据权利要求2所述媒体文件的压缩方法,其特征在于,该方法进一步包括:计算压缩所需的目标视频编码器类型,按照以下原则进行:
如果原始视频编码器类型为RM、或VC1、或H.264,则确定所述目标视频编码器类型为H.264;否则,确定所述目标视频编码器类型为活动图像专家组MPEG4。
6.根据权利要求2至5中任一项所述媒体文件的压缩方法,其特征在于,该方法进一步包括:计算压缩所需的目标视频编码码率,按照以下原则进行:
计算目标视频编码帧率与原始视频编码帧率的比值K_fps,以及目标视频分辨率与原始视频分辨率的比值K_pix,并根据下式得到备选的目标视频编码码率:K_fps·K_pix·K_br·原始视频编码码率,其中,K_br表示预定的目标码率降低系数;
根据所述目标视频分辨率从预设的参考对应表中选取最接近的参考分辨率,并将选取的参考分辨率所对应的参考码率与所述备选的目标视频编码码率进行比较,选取两者之间相对较小的码率作为压缩所需的目标视频编码码率。
7.根据权利要求2至5中任一项所述媒体文件的压缩方法,其特征在于,该方法进一步包括:计算压缩所需的音频转码参数,按照以下原则进行:
确定所述目标音频采样率与原始音频采样率相同,目标音频通道数与原始音频通道数相同;确定所述目标音频编码器类型为高级音频编码AAC;
计算原始音频编码码率与原始视频编码码率的比值,并判断该比值是否大于1/3,如果大于1/3,则将所述目标音频编码码率下调一或两个级别;否则,确定所述目标音频编码码率与原始音频编码码率相同。
8.一种媒体文件的压缩系统,其特征在于,该系统包括:
媒体信息提取模块,用于从输入的媒体文件中提取所述编码参数;
转码参数计算模块,用于根据所述编码参数计算压缩所需的转码参数;
音、视频流分离模块,用于对输入的媒体文件进行音、视频流分离,得到音频压缩流和视频压缩流;
音频解码模块,用于对分离出的音频压缩流进行解码提取出原始音频流;
视频解码模块,用于对分离出的视频压缩流进行解码提取出原始视频流;
音频编码模块,用于根据所述转码参数对所述原始音频流编码输出新的压缩音频流;
视频编码模块,用于根据所述转码参数对所述原始视频流编码输出新的压缩视频流;
音、视频流合成模块,用于将所述新的压缩音频流和压缩视频流合并生成新的媒体文件。
9.根据权利要求8所述媒体文件的压缩系统,其特征在于,所述编码参数包括视频编码参数和音频编码参数,其中,所述视频编码参数包括:原始视频编码器类型、原始视频编码码率、原始视频编码帧率、原始视频分辨率;所述音频编码参数包括:原始音频编码器类型、原始音频编码码率、原始音频通道数、原始音频采样率;
所述转码参数包括视频转码参数和音频转码参数,其中,所述视频转码参数包括:目标视频编码器类型、目标视频编码码率、目标视频编码帧率、目标视频分辨率;所述音频转码参数包括:目标音频编码器类型、目标音频编码码率、目标音频通道数、目标音频采样率。
10.根据权利要求9所述媒体文件的压缩系统,其特征在于,所述转码参数计算模块进一步用于,按照如下原则计算压缩所需的目标视频编码帧率:
将原始视频编码帧率与15fps进行比较,如果原始视频编码帧率大于15fps,则确定所述目标视频编码帧率为15fps;如果原始视频编码帧率小于15fps,则确定所述目标视频编码帧率与原始视频编码帧率相同。
11.根据权利要求9所述媒体文件的压缩系统,其特征在于,所述转码参数计算模块进一步用于,按照如下原则计算压缩所需的目标视频分辨率:
将原始视频分辨率与640×480进行比较,如果原始视频分辨率不超过640×480,则确定所述目标视频分辨率与原始视频分辨率相同;如果原始视频分辨率超过640×480,则降低分辨率,以640×480为目标保持原始图像宽高比进行缩放,进而得到所述目标视频分辨率。
12.根据权利要求9至11中任一项所述媒体文件的压缩系统,其特征在于,所述转码参数计算模块进一步用于,按照如下原则计算压缩所需的目标视频编码码率:
计算目标视频编码帧率与原始视频编码帧率的比值K_fps,以及目标视频分辨率与原始视频分辨率的比值K_pix,并根据下式得到备选的目标视频编码码率:K_fps·K_pix·K_br·原始视频编码码率,其中,K_br表示预定的目标码率降低系数;
根据所述目标视频分辨率从预设的参考对应表中选取最接近的参考分辨率,并将选取的参考分辨率所对应的参考码率与所述备选的目标视频编码码率进行比较,选取两者之间相对较小的码率作为压缩所需的目标视频编码码率。
CN2009102094962A 2009-11-04 2009-11-04 一种媒体文件的压缩方法和系统 Active CN102055966B (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN2009102094962A CN102055966B (zh) 2009-11-04 2009-11-04 一种媒体文件的压缩方法和系统
MYPI2012700169A MY159752A (en) 2009-11-04 2010-06-28 Method and system for media file compression
MYPI2014703430A MY172698A (en) 2009-11-04 2010-06-28 Method and system for media file compression
PCT/CN2010/074646 WO2011054208A1 (zh) 2009-11-04 2010-06-28 一种媒体文件的压缩方法和系统
MYPI2014703431A MY171382A (en) 2009-11-04 2010-06-28 Method and system for media file compression
US13/500,883 US8761244B2 (en) 2009-11-04 2010-06-28 Method and system for media file compression
US14/167,820 US9014261B2 (en) 2009-11-04 2014-01-29 Method and system for media file compression
US14/167,784 US8989259B2 (en) 2009-11-04 2014-01-29 Method and system for media file compression

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009102094962A CN102055966B (zh) 2009-11-04 2009-11-04 一种媒体文件的压缩方法和系统

Publications (2)

Publication Number Publication Date
CN102055966A true CN102055966A (zh) 2011-05-11
CN102055966B CN102055966B (zh) 2013-03-20

Family

ID=43959835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009102094962A Active CN102055966B (zh) 2009-11-04 2009-11-04 一种媒体文件的压缩方法和系统

Country Status (4)

Country Link
US (3) US8761244B2 (zh)
CN (1) CN102055966B (zh)
MY (3) MY171382A (zh)
WO (1) WO2011054208A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103702138A (zh) * 2013-11-29 2014-04-02 乐视网信息技术(北京)股份有限公司 自适应指定转码的方法和系统
CN104093072A (zh) * 2014-06-30 2014-10-08 京东方科技集团股份有限公司 一种视频信息播放系统和方法
CN105187835A (zh) * 2014-05-30 2015-12-23 阿里巴巴集团控股有限公司 基于内容的自适应视频转码方法及装置
CN105681823A (zh) * 2014-11-21 2016-06-15 华为技术有限公司 一种对视频文件进行在线转码的方法和装置
CN105979283A (zh) * 2015-08-12 2016-09-28 乐视云计算有限公司 视频转码方法和装置
CN106470340A (zh) * 2015-08-14 2017-03-01 华平智慧信息技术(深圳)有限公司 一种二次视频数据编码方法及系统
CN108712654A (zh) * 2018-05-18 2018-10-26 网宿科技股份有限公司 一种音视频流的转码方法及设备
CN112689194A (zh) * 2020-12-21 2021-04-20 展讯半导体(成都)有限公司 功能机视频配乐方法、装置、终端设备及存储介质
CN113873176A (zh) * 2021-10-27 2021-12-31 北京奇艺世纪科技有限公司 一种媒体文件合并方法及装置
CN114845163A (zh) * 2022-05-31 2022-08-02 海宁奕斯伟集成电路设计有限公司 录制文件压缩装置及方法
CN116156215A (zh) * 2023-04-21 2023-05-23 南京数脉动力信息技术有限公司 一种基于volte网络的视频流文件压缩和高效传输系统和方法
WO2023116254A1 (zh) * 2021-12-22 2023-06-29 Oppo广东移动通信有限公司 一种直播视频录制方法、装置、系统和终端设备

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012175613A (ja) * 2011-02-24 2012-09-10 Sony Corp 画像送信装置、画像送信方法、及びプログラム
KR102218712B1 (ko) 2014-02-11 2021-02-22 삼성전자주식회사 저장 장치의 어드레스 맵핑 방법 및 저장 장치의 데이터 독출 방법
CN103929655B (zh) * 2014-04-25 2017-06-06 网易传媒科技(北京)有限公司 对音视频文件进行转码处理的方法和设备
CN104780392A (zh) * 2015-04-07 2015-07-15 无锡天脉聚源传媒科技有限公司 一种视频文件的转码方法及装置
US20170076752A1 (en) * 2015-09-10 2017-03-16 Laura Steward System and method for automatic media compilation
CN105245813B (zh) * 2015-10-29 2018-05-22 北京易视云科技有限公司 一种视频优化存储的处理器
CN105323591B (zh) * 2015-10-29 2018-06-19 四川奇迹云科技有限公司 一种基于psnr阈值的视频分段存储的方法
CN105307053B (zh) * 2015-10-29 2018-05-22 北京易视云科技有限公司 一种基于视频内容的视频优化存储的方法
US10013263B2 (en) * 2016-02-17 2018-07-03 Vincent Ramirez Systems and methods method for providing an interactive help file for host software user interfaces
JP6530354B2 (ja) * 2016-08-03 2019-06-12 日本電信電話株式会社 映像コンテンツ保管システム、映像コンテンツ保管方法及び映像コンテンツ保管プログラム
CN107493505B (zh) * 2017-10-18 2023-12-26 北京流金岁月科技有限公司 一种支持双音频输出的视音频转码的装置和方法
CN114832373B (zh) * 2021-12-21 2023-03-07 许磊 一种纹理、音频和视频的压缩和重建方法
CN115134339B (zh) * 2022-06-28 2024-07-02 京东方科技集团股份有限公司 媒体文件处理方法、装置及电子设备
CN115243074A (zh) * 2022-07-26 2022-10-25 京东方科技集团股份有限公司 视频流的处理方法及装置、存储介质、电子设备
CN116320431B (zh) * 2023-03-20 2024-03-01 深圳市与众文化传播有限公司 视频压缩编码数据动态无线网络传输系统
CN117955961A (zh) * 2024-03-26 2024-04-30 山东工程职业技术大学 一种数字媒体数据的传输方法及系统

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6633609B1 (en) * 1996-12-24 2003-10-14 Intel Corporation Method and apparatus for bit rate control in a digital video environment for arbitrary bandwidth
KR100487989B1 (ko) 1997-10-23 2005-05-09 미쓰비시덴키 가부시키가이샤 화상 복호화 장치 및 화상 부호화 장치
US6934334B2 (en) 2000-10-02 2005-08-23 Kabushiki Kaisha Toshiba Method of transcoding encoded video data and apparatus which transcodes encoded video data
IL160981A0 (en) 2001-09-26 2004-08-31 Interact Devices Inc System and method for communicating media signals
JP2003256253A (ja) * 2002-03-04 2003-09-10 Matsushita Electric Ind Co Ltd コンテンツ管理装置及び方法
US7274740B2 (en) * 2003-06-25 2007-09-25 Sharp Laboratories Of America, Inc. Wireless video transmission system
US7227899B2 (en) 2003-08-13 2007-06-05 Skystream Networks Inc. Method and system for re-multiplexing of content-modified MPEG-2 transport streams using interpolation of packet arrival times
CN100375533C (zh) * 2004-03-10 2008-03-12 浙江大学 具有多种转换功能的自适应视频转码网关
US20050232497A1 (en) 2004-04-15 2005-10-20 Microsoft Corporation High-fidelity transcoding
JP4967228B2 (ja) * 2004-11-29 2012-07-04 ソニー株式会社 コンテンツ通信システム、通信装置および方法、並びにプログラム
GB0428155D0 (en) * 2004-12-22 2005-01-26 British Telecomm Buffer underflow prevention
US7912127B2 (en) * 2005-08-05 2011-03-22 Lsi Corporation H.264 to VC-1 and VC-1 to H.264 transcoding
JP4266218B2 (ja) 2005-09-29 2009-05-20 株式会社東芝 動画像データの再圧縮符号化方法、装置及びプログラム
KR20070037230A (ko) * 2005-09-30 2007-04-04 엘지전자 주식회사 피브이알로부터 외부 멀티미디어 장치로의 실시간 방송신호저장방법 및 그 방법을 이용한 피브알
US7788395B2 (en) * 2007-02-14 2010-08-31 Microsoft Corporation Adaptive media playback
US8213498B2 (en) * 2007-05-31 2012-07-03 Qualcomm Incorporated Bitrate reduction techniques for image transcoding
CN101098483A (zh) * 2007-07-19 2008-01-02 上海交通大学 以图像组结构为并行处理单元的视频集群转码系统
KR20090029635A (ko) * 2008-08-18 2009-03-23 주식회사 패턴플랜트 비디오 콘텐츠의 트랜스코딩 방법
CN101404767A (zh) * 2008-11-24 2009-04-08 崔天龙 一种基于图像分析及人工智能的可变参数的自动化视频转码方法

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103702138A (zh) * 2013-11-29 2014-04-02 乐视网信息技术(北京)股份有限公司 自适应指定转码的方法和系统
US10645449B2 (en) 2014-05-30 2020-05-05 Alibaba Group Holding Limited Method and apparatus of content-based self-adaptive video transcoding
CN105187835A (zh) * 2014-05-30 2015-12-23 阿里巴巴集团控股有限公司 基于内容的自适应视频转码方法及装置
CN105187835B (zh) * 2014-05-30 2019-02-15 阿里巴巴集团控股有限公司 基于内容的自适应视频转码方法及装置
CN104093072A (zh) * 2014-06-30 2014-10-08 京东方科技集团股份有限公司 一种视频信息播放系统和方法
WO2016000332A1 (zh) * 2014-06-30 2016-01-07 京东方科技集团股份有限公司 一种视频信息播放系统和方法
CN104093072B (zh) * 2014-06-30 2017-06-16 京东方科技集团股份有限公司 一种视频信息播放系统和方法
US9917876B2 (en) 2014-06-30 2018-03-13 Boe Technology Group Co., Ltd. Video information playing system and method
CN105681823A (zh) * 2014-11-21 2016-06-15 华为技术有限公司 一种对视频文件进行在线转码的方法和装置
CN105979283A (zh) * 2015-08-12 2016-09-28 乐视云计算有限公司 视频转码方法和装置
WO2017024901A1 (zh) * 2015-08-12 2017-02-16 乐视控股(北京)有限公司 视频转码方法和装置
CN106470340A (zh) * 2015-08-14 2017-03-01 华平智慧信息技术(深圳)有限公司 一种二次视频数据编码方法及系统
CN108712654A (zh) * 2018-05-18 2018-10-26 网宿科技股份有限公司 一种音视频流的转码方法及设备
CN108712654B (zh) * 2018-05-18 2020-04-14 网宿科技股份有限公司 一种音视频流的转码方法及设备
WO2019218415A1 (zh) * 2018-05-18 2019-11-21 网宿科技股份有限公司 一种音视频流的转码方法及设备
CN112689194A (zh) * 2020-12-21 2021-04-20 展讯半导体(成都)有限公司 功能机视频配乐方法、装置、终端设备及存储介质
CN112689194B (zh) * 2020-12-21 2023-02-10 展讯半导体(成都)有限公司 功能机视频配乐方法、装置、终端设备及存储介质
CN113873176A (zh) * 2021-10-27 2021-12-31 北京奇艺世纪科技有限公司 一种媒体文件合并方法及装置
CN113873176B (zh) * 2021-10-27 2024-03-08 北京奇艺世纪科技有限公司 一种媒体文件合并方法及装置
WO2023116254A1 (zh) * 2021-12-22 2023-06-29 Oppo广东移动通信有限公司 一种直播视频录制方法、装置、系统和终端设备
CN114845163A (zh) * 2022-05-31 2022-08-02 海宁奕斯伟集成电路设计有限公司 录制文件压缩装置及方法
CN116156215A (zh) * 2023-04-21 2023-05-23 南京数脉动力信息技术有限公司 一种基于volte网络的视频流文件压缩和高效传输系统和方法

Also Published As

Publication number Publication date
US8761244B2 (en) 2014-06-24
US20140146871A1 (en) 2014-05-29
US20140146870A1 (en) 2014-05-29
WO2011054208A1 (zh) 2011-05-12
US9014261B2 (en) 2015-04-21
CN102055966B (zh) 2013-03-20
MY172698A (en) 2019-12-10
MY171382A (en) 2019-10-10
MY159752A (en) 2017-01-31
US20120201290A1 (en) 2012-08-09
US8989259B2 (en) 2015-03-24

Similar Documents

Publication Publication Date Title
CN102055966B (zh) 一种媒体文件的压缩方法和系统
US6989868B2 (en) Method of converting format of encoded video data and apparatus therefor
TWI586177B (zh) 基於場景之適應性位元率控制
JP6414061B2 (ja) 画像符号化装置および方法
JP3979897B2 (ja) 映像圧縮ビットストリームのトランスコーディング方法
JP2016226001A (ja) デコーダおよび復号方法
US9800880B2 (en) Configurable transcoder and methods for use therewith
GB2439265A (en) Split screen multimedia video conferencing
CN100455020C (zh) 低码率下屏幕编码方法
Smiti et al. Video and audio streaming issues in multimedia application
KR20110063004A (ko) 키 프레임 추출 장치 및 방법과 이를 이용한 방송 녹화 장치 및 방법
CN112235606A (zh) 一种多层视频处理方法、系统和可读存储介质
JP2006074635A (ja) 符号化映像信号変換方法及び装置
CN101695133A (zh) 后向兼容低分辨率/高分辨率节目同播的视频编解码方法、系统及编码器
JP5267542B2 (ja) 符号化映像信号変換方法及び装置
CN101459833B (zh) 一种用于相似视频码流的转码方法及其转码装置
CN107005706A (zh) 用于再编码图像的方法及其装置
KR101603976B1 (ko) 동영상 파일 결합 방법 및 그 장치
CN114339316A (zh) 一种基于视频直播的视频流编码处理方法
KR101606121B1 (ko) 동영상 파일 조각화 방법 및 그 장치
Pescador et al. A DSP based SVC IP STB using open SVC decoder
CN107493505B (zh) 一种支持双音频输出的视音频转码的装置和方法
JP4793150B2 (ja) ビデオ信号処理装置およびビデオ信号情報処理方法、並びにプログラム
CN104469399A (zh) 一种空间分辨率视频转码中宏块选择skip类型的方法
JP2011078068A (ja) 映像伝送方式

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant