CN102262880A - 一种音频提取装置和方法 - Google Patents

一种音频提取装置和方法 Download PDF

Info

Publication number
CN102262880A
CN102262880A CN2010101870831A CN201010187083A CN102262880A CN 102262880 A CN102262880 A CN 102262880A CN 2010101870831 A CN2010101870831 A CN 2010101870831A CN 201010187083 A CN201010187083 A CN 201010187083A CN 102262880 A CN102262880 A CN 102262880A
Authority
CN
China
Prior art keywords
audio
voice data
file
media file
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010101870831A
Other languages
English (en)
Inventor
袁学文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SUZHOU WENDAO NETWORK TECHNOLOGY Co Ltd
Original Assignee
SUZHOU WENDAO NETWORK TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUZHOU WENDAO NETWORK TECHNOLOGY Co Ltd filed Critical SUZHOU WENDAO NETWORK TECHNOLOGY Co Ltd
Priority to CN2010101870831A priority Critical patent/CN102262880A/zh
Publication of CN102262880A publication Critical patent/CN102262880A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开一种针对媒体文件的音频提取装置,包括解码模块、分离模块以及音频编码模块。所述音频提取装置能够从媒体文件中分离出音频内容,并且将所述音频内容转换为任意格式的音频文件,从而能够满足人们单独欣赏、存储或编辑媒体文件中的音频内容的需要。本发明还提供了相应的音频提取方法。

Description

一种音频提取装置和方法
技术领域
[0001] 本发明涉及视音频媒体文件的处理,尤其涉及一种音频提取装置和方法。 背景技术
[0002] 随着数字广播技术的发展,特别是网络和移动媒体服务的日益普及,人们越来越多地通过网络下载或在线欣赏各种视频节目。因此,在这种情况下视频和音频由共有的信号源提供,并且二者结合为一体形成一个包含视频和音频的媒体文件。这种常见的视音频媒体文件包括AVI视频文件(扩展名为*. avi),MPEG文件(扩展名为*. mpg)或MPEG4文件(扩展名为 *· mp4),3GP 文件(扩展名为 *· 3gp),Windows Media Video 文件(*· wmv), MKV文件(扩展名为*. mkv)以及Real Media文件(扩展名为*. rmvb)等。在这种媒体文件中,音频数据流被嵌入视频流并且使二者同步,从而形成共同的媒体数据流,其中音频和视频二者被共同编码、处理和使用。
[0003] 虽然一般来说,在使用上述形式的视音频媒体文件时,将视频和音频信号共同解码并同步播放才能够为人们提供完整的观看效果。但是,在某些情况下,人们也会希望只获得或者播放其中的音频内容。例如,用户可能希望只欣赏媒体文件中的音频内容而不观看其中的画面;或者,用户可能希望提取媒体文件中的音频内容形成音频文件以便进一步保存、编辑或进行音效处理。
[0004] 然而,现有的媒体播放工具只能够提供对视音频媒体文件的同步播放功能,不能够单独对媒体文件中的音频内容进行播放,也不能从媒体文件中提取音频部分进行保存或处理。
发明内容
[0005] 针对现有技术中的上述不足,本发明主要解决的技术问题是提供一种针对媒体文件的音频提取装置和方法。本发明能够从媒体文件中分离出音频内容,并且将所述音频内容转换为任意格式的音频文件。
[0006] 本发明提供了一种音频提取装置,包括:
[0007] 解码模块,对媒体文件进行解码;
[0008] 分离模块,用于从解码生成的媒体文件数据包中分离视频数据和音频数据;
[0009] 音频编码模块,对所述音频数据按特定格式进行编码生成音频文件。
[0010] 其中,所述分离模块根据所述媒体文件数据包中的识别符区分视频数据和音频数据。进一步地,所述分离模块还包括缓冲器,用于缓存所述音频数据。
[0011] 其中,所述音频编码模块可按用户自定义的采样率、声道设置、编码格式和比特率对所述音频数据进行编码。
[0012] 其中,所述音频编码模块可生成 mp3、m4a、ac3、aac、wma、wav> ogg、ape、mka、au、 aiff或flac格式的音频文件。
[0013] 本发明还提供了一种音频提取方法,包括以下步骤:[0014] 步骤1,对导入的媒体文件进行解码;
[0015] 步骤2,从解码生成的媒体文件数据包中分离视频数据和音频数据;
[0016] 步骤3,对所述音频数据按特定格式进行编码生成音频文件。
[0017] 其中,步骤2中根据所述媒体文件数据包中的识别符区分视频数据和音频数据。 进一步地,所述步骤2中,还包括缓存所述音频数据。
[0018] 其中,步骤3中可自定义采样率、声道设置、编码格式和比特率并按照自定义对所述音频数据进行编码。
[0019] 其中,步骤 3 中编码生成 mp3、m4a、ac3、aac、wma、wav、ogg、ape、mka、au、aiff 或 flac格式的音频文件。
[0020] 区别于现有技术的媒体播放工具,本发明的有益效果是能够实现对MPEG及 MPEG4、AVI、MKV、WMV、3GP和RMVB等多种格式的媒体文件的音频提取,生成多种常见格式的音频文件,并且在转换过程中能够达到无音质损失,能够满足人们单独欣赏、存储或编辑媒体文件中的音频内容的需要。
附图说明
[0021] 图1是本发明实施例的音频提取装置的结构示意图;
[0022] 图2是本发明实施例的音频提取方法的流程示意图;
具体实施方式
[0023] 为详细说明本发明的技术内容、构造特征、所实现目的及效果,以下结合实施方式并配合附图详予说明。
[0024] 参见图1,示出了本发明的音频提取装置的结构示意图。如图,包括视频和音频内容的媒体文件被导入解码模块101。这里所述的媒体文件可以是AVI视频文件(扩展名为 *· avi),MPEG文件(扩展名为*· mpg)或MPEG4文件(扩展名为*· mp4),3GP文件(扩展名为 *· 3gp),Windows Media Video 文件(*. wmv),MKV 文件(扩展名为 mkv)以及 Real Media文件(扩展名为*. rmvb)等各种常见格式的视音频文件。解码模块101对媒体文件进行解码生成数据包。这里解码模块101可以使用自身嵌入的解码程序进行解码,也可以调用REALPLAY等现有解码软件或者操作系统内置的解码软件中的软件解码器进行解码。 媒体文件被解码形成的数据包输入分离模块102。在媒体文件数据包中,通常利用某些标识符来指示某一数据包中所包含的是哪种类型的数据。所述分离模块102根据该标识符分离视频数据和音频数据。其中视频数据可以被输入其它装置进行处理,由于与本发明无关在此不再在赘述。音频数据可以被暂存到分离模块102中设置的缓冲器(未示出)。如图1 所示,分离模块102通过缓冲器依次将音频数据输入音频编码模块103。音频编码模块103 采用预定的编码格式对音频数据执行各种编码,生成某种格式的音频文件。音频编码模块 103 可以生成的音频文件格式包括 mp3、m4a、ac3、aac、wma、wav、ogg、ape、mka、au、aiff 或 flac等。对于音频编码过程,用户可以通过UI接口(未示出)向音频编码模块103输入用户自定义的编码参数,包括采样率(HZ),声道设置(单声道、多声道等),编码格式(mp3、 aaC、Wma等)以及比特率GAps),音频编码模块103将根据以上参数执行编码操作。
[0025] 图2示出了本实施例的音频提取装置所执行的音频提取方法的流程示意图。如图,音频提取方法包括以下步骤:
[0026] 步骤1,对导入的媒体文件进行解码;
[0027] 步骤2,从解码生成的媒体文件数据包中分离视频数据和音频数据;
[0028] 步骤3,对所述音频数据按特定格式进行编码生成音频文件。
[0029] 其中,步骤2中根据所述媒体文件数据包中的识别符区分视频数据和音频数据。 并且在步骤2中还包括缓存所述音频数据并依次将缓存的数据进行编码。并且其中步骤3 中的编码步骤可以由用户自定义采样率、声道设置、编码格式和比特率,并按照自定义对所述音频数据进行编码。
[0030] 以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1. 一种音频提取装置,其特征在于,包括: 解码模块,对媒体文件进行解码;分离模块,用于从解码生成的媒体文件数据包中分离视频数据和音频数据; 音频编码模块,对所述音频数据按特定格式进行编码生成音频文件。
2.根据权利要求1所述的音频提取装置,其特征在于:所述分离模块根据所述媒体文件数据包中的识别符区分视频数据和音频数据。
3.根据权利要求2所述的音频提取装置,其特征在于:所述分离模块还包括缓冲器,用于缓存所述音频数据。
4.根据权利要求1所述的音频提取装置,其特征在于:所述音频编码模块可按用户自定义的采样率、声道设置、编码格式和比特率对所述音频数据进行编码。
5.根据权利要求1所述的音频提取装置,其特征在于:所述音频编码模块可生成mp3、 m4a、ac3、aac、wma、wav、ogg、ape、mka、au、aiff 或 f lac 格式的音步页文件。
6. 一种音频提取方法,其特征在于,包括以下步骤: 步骤1,对导入的媒体文件进行解码;步骤2,从解码生成的媒体文件数据包中分离视频数据和音频数据; 步骤3,对所述音频数据按特定格式进行编码生成音频文件。
7.根据权利要求6所述的音频提取方法,其特征在于:所述步骤2中,根据所述媒体文件数据包中的识别符区分视频数据和音频数据。
8.根据权利要求7所述的音频提取方法,其特征在于:所述步骤2中,还包括缓存所述音频数据。
9.根据权利要求6所述的音频提取方法,其特征在于:所述步骤3中,可自定义采样率、声道设置、编码格式和比特率并按照自定义对所述音频数据进行编码。
10.根据权利要求6所述的音频提取方法,其特征在于:所述步骤3中,编码生成mp3、 m4a、ac3、aac、wma、wav、ogg、ape、mka、au、aiff 或 flac 格式的音步页文件。
CN2010101870831A 2010-05-31 2010-05-31 一种音频提取装置和方法 Pending CN102262880A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101870831A CN102262880A (zh) 2010-05-31 2010-05-31 一种音频提取装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101870831A CN102262880A (zh) 2010-05-31 2010-05-31 一种音频提取装置和方法

Publications (1)

Publication Number Publication Date
CN102262880A true CN102262880A (zh) 2011-11-30

Family

ID=45009487

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101870831A Pending CN102262880A (zh) 2010-05-31 2010-05-31 一种音频提取装置和方法

Country Status (1)

Country Link
CN (1) CN102262880A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105405443A (zh) * 2015-10-23 2016-03-16 福州瑞芯微电子股份有限公司 基于ape格式的音频信号压缩处理系统及方法
CN106998495A (zh) * 2016-01-22 2017-08-01 百度在线网络技术(北京)有限公司 一种视频播放方法及装置
CN107481709A (zh) * 2017-08-11 2017-12-15 腾讯音乐娱乐(深圳)有限公司 音频数据传输方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1110893A (zh) * 1993-06-10 1995-10-25 索尼公司 在视频和音频信号处理系统中辅助信息输入缓冲器的合理结构
US20050185932A1 (en) * 1999-02-15 2005-08-25 Nec Corporation Device and method for editing video and/or audio data recorded in a disc storage medium
CN1853407A (zh) * 2003-09-15 2006-10-25 联合视频制品公司 利用交互式电视应用输出数字内容的系统和方法
CN1930575A (zh) * 2004-03-30 2007-03-14 英特尔公司 分离和评估音频和视频源数据的技术
CN101472156A (zh) * 2007-12-25 2009-07-01 欧阳泳春 家用播放器支持3gp媒体文件播放功能的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1110893A (zh) * 1993-06-10 1995-10-25 索尼公司 在视频和音频信号处理系统中辅助信息输入缓冲器的合理结构
US20050185932A1 (en) * 1999-02-15 2005-08-25 Nec Corporation Device and method for editing video and/or audio data recorded in a disc storage medium
CN1853407A (zh) * 2003-09-15 2006-10-25 联合视频制品公司 利用交互式电视应用输出数字内容的系统和方法
CN1930575A (zh) * 2004-03-30 2007-03-14 英特尔公司 分离和评估音频和视频源数据的技术
CN101472156A (zh) * 2007-12-25 2009-07-01 欧阳泳春 家用播放器支持3gp媒体文件播放功能的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105405443A (zh) * 2015-10-23 2016-03-16 福州瑞芯微电子股份有限公司 基于ape格式的音频信号压缩处理系统及方法
CN106998495A (zh) * 2016-01-22 2017-08-01 百度在线网络技术(北京)有限公司 一种视频播放方法及装置
CN107481709A (zh) * 2017-08-11 2017-12-15 腾讯音乐娱乐(深圳)有限公司 音频数据传输方法及装置

Similar Documents

Publication Publication Date Title
CN105474309B (zh) 高效率对象元数据编码的装置及方法
CN101536101B (zh) 编码方法和装置以及解码方法和装置
CN101981617B (zh) 多对象音频信号的附加信息比特流产生方法和装置
KR101550462B1 (ko) 미디어 스트림에 데이터를 임베딩하는 방법 및 장치
WO2005034092A3 (en) Method and apparatus for coding information
CN102819851B (zh) 一种有声图片的计算机实现方法
CN103268763A (zh) 一种基于同步音频提取和实时传输的无线影音系统
CN107888953A (zh) 一种新型直播系统的实现方法
MX2014012502A (es) SYSTEMS AND METHODS OF IMPLEMENTATION OF EFFICIENT GRADUAL TRANSITION BETWEEN COMPRESSED AUDIO FLOWS.
CN102163201A (zh) 一种多媒体文件切割方法、装置及转码器
CN102592628A (zh) 一种音视频播放文件的播放控制方法
CN106060628A (zh) 基于DirectShow支持可变编码的方法及系统
CN101753946A (zh) 一种视频文件和音频文件的合并方法及系统
CN102262880A (zh) 一种音频提取装置和方法
CN103414949B (zh) 一种基于智能电视的多媒体编辑系统与方法
CN102955809A (zh) 媒体文件编辑和播放的方法和系统
CN104796759A (zh) 一种从多路音频中提取一路音频的方法及装置
CN103841451A (zh) 多媒体播放方法、装置及终端
JP2009089350A (ja) ネットワーク基盤のカスタマイズコンテンツを提供するためのユーザ装置及びその方法並びに著作装置及びその方法
CN106375778B (zh) 一种符合数字电影规范的三维音频节目码流传输的方法
CN107393566A (zh) 一种智能故事机的音频解码方法及装置
JP2021107943A (ja) 受信装置および受信方法
US20210185415A1 (en) Simultaneous recording and uploading of multiple audio files of the same conversation and audio drift normalization systems and methods
CN108461086B (zh) 一种音频的实时切换方法和装置
JPWO2019130763A1 (ja) 情報処理装置、情報処理方法およびプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111130