CN102768844B - 一种音频码流拼接的方法 - Google Patents

一种音频码流拼接的方法 Download PDF

Info

Publication number
CN102768844B
CN102768844B CN201210093471.2A CN201210093471A CN102768844B CN 102768844 B CN102768844 B CN 102768844B CN 201210093471 A CN201210093471 A CN 201210093471A CN 102768844 B CN102768844 B CN 102768844B
Authority
CN
China
Prior art keywords
audio
audioframe
audiosyncoffset
trimin
shearing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210093471.2A
Other languages
English (en)
Other versions
CN102768844A (zh
Inventor
夏永宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Newauto Group Co ltd
Original Assignee
China Digital Video Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Digital Video Beijing Ltd filed Critical China Digital Video Beijing Ltd
Priority to CN201210093471.2A priority Critical patent/CN102768844B/zh
Publication of CN102768844A publication Critical patent/CN102768844A/zh
Application granted granted Critical
Publication of CN102768844B publication Critical patent/CN102768844B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种音频码流拼接的方法,通过读取音频片段的音频数据参数;根据所述音频数据参数判断所述音频片段是否需要重构;若是,则对所述音频片段进行重构,若否,则复制所述音频片段,进而完成音频码流的拼接,实现了只对剪切处所在的音频单元进行可能需要的音频重构,而其它的大部分音频单元仅需复制,大大提高了合成的效率,减少了音频质量的损失,保持了原音频的质量。

Description

一种音频码流拼接的方法
技术领域
本发明涉及视音频剪辑领域,尤其涉及一种音频码流拼接的方法。
背景技术
随着计算机处理能力的增强,视音频处理技术也有了长足的发展。视音频处理的过程中,视音频剪辑是最常用到的技术。
现有技术的视音频剪辑一般是基于视频帧和音频帧,先进行解码,进行剪辑之后,在重新进行编码,之后再输出。编解码的过程是个很复杂的过程,因而剪辑的效率很低。
然而,音频编码都是以一个Audio Frame为单位的,比如AAC格式音频编码一般一个Audio Frame包含有1024个Samples。AC3格式音频编码一般一个Audio Frame包含有1536个Samples。Mpeg Audio格式音频编码一般一个Audio Frame包含有384、576或者1152个Samples三种情况。既然如此,音频码流在剪切处的重构就不需要重新解码、编码。而只需要设计一套合理的机制,确认丢弃或者保留多余的Audio Frames,确认丢弃多少,保留多少Audio Frames,而且要保证与视频内容的声画同步。
发明内容
为解决上述问题,本发明提供一种音频码流拼接的方法,只对剪切处所在的音频单元进行可能需要的音频重构,而其它的大部分音频单元仅需复制,大大提高了合成的效率,减少了音频质量的损失,保持了原音频的质量。
本发明实施例提供了一种音频码流拼接的方法,包括以下步骤:
读取音频片段的音频数据参数;
根据所述音频数据参数判断所述音频片段是否需要重构;
若是,则对所述音频片段进行重构,若否,则复制所述音频片段。
本发明实施例的技术方案带来的有益效果如下:通过读取音频片段的音频数据参数;根据所述音频数据参数判断所述音频片段是否需要重构;若是,则对所述音频片段进行重构,若否,则复制所述音频片段,进而完成音频码流的拼接,实现了只对剪切处所在的音频单元进行可能需要的音频重构,而其它的大部分音频单元仅需复制,大大提高了合成的效率,减少了音频质量的损失,保持了原音频的质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一种音频码流拼接的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例提供了一种音频码流拼接的方法,如图1,包括以下步骤:
步骤101,读取音频片段的音频数据参数;
所述音频数据参数包括:
剪切入点TrimIn、剪切出点TrimOut、音频数据块起始位置、音频数据块结束位置、每个音频单元AudioFrame包含的样本数AudioFrameSampleCount以及历史音频同步补偿数AudioSyncOffset;
其中,所述音频片段包含至少一个音频数据块,所述音频数据块包含至少一个音频单元AudioFrame,所述音频单元AudioFrame包含至少一个样本。
步骤102,根据所述音频数据参数判断所述音频片段是否需要重构;
若是,则进入步骤103,若否,则进入步骤104;
具体包括:
比较所述剪切入点TrimIn与所述音频数据块起始位置以及所述剪切出点TrimOut与所述音频数据块结束位置;
若所述剪切入点TrimIn在所述音频数据块起始位置之后或所述剪切出点TrimOut在所述音频数据块结束位置之前,则所述音频片段需要重构,若否,则不需要重构。
步骤103,对所述音频片段进行重构;
具体包括:
对所述音频片段的头部进行重构;
对所述音频片段的尾部进行重构。
其中,对所述音频片段的头部进行重构具体包括以下步骤:
删除所述剪切入点TrimIn所在的音频单元AudioFrame之前的音频单元AudioFrame;
保留所述剪切入点TrimIn所在的音频单元AudioFrame之后的音频单元AudioFrame;
根据所述每个音频单元AudioFrame包含的样本数AudioFrameSampleCount以及所述剪切入点TrimIn获取所述剪切入点TrimIn所在的音频单元AudioFrame中位于所述剪切入点TrimIn之前的样本数HAudioSampleAdded以及位于所述切入点TrimIn之后的样本数HAudioSampleLost;
比较所述位于剪切入点TrimIn后的样本数HAudioSampleLost是否大于所述历史音频同步补偿数AudioSyncOffset;
若否,丢弃所述剪切入点TrimIn所在的音频单元AudioFrame,并将所述历史音频同步补偿数AudioSyncOffset更新为:
AudioSyncOffset=AudioSyncOffset-HAudioSampleLost;
若是,保留所述剪切入点TrimIn所在的音频单元AudioFrame,并将所述历史音频同步补偿数AudioSyncOffset更新为:
AudioSyncOffset=AudioSyncOffset+HAudioSampleAdded。
其中,对所述音频片段的尾部进行重构具体包括以下步骤:
删除所述剪切出点TrimOut所在的音频单元AudioFrame之后的音频单元AudioFrame;
保留所述剪切出点TrimOut所在的音频单元AudioFrame之前的音频单元AudioFrame;
根据所述每个音频单元AudioFrame包含的样本数AudioFrameSampleCount以及所述剪切出点TrimOut获取所述剪切出点TrimOut所在的音频单元AudioFrame中位于所述剪切出点TrimOut之后的样本数TAudioSampleAdded以及位于所述切出点TrimOut之前的样本数TAudioSampleLost;
比较所述位于剪切出点TrimOut前的样本数TAudioSampleLost是否大于所述历史音频同步补偿数AudioSyncOffset;
若否,丢弃所述剪切入点TrimIn所在的音频单元AudioFrame,并将所述历史音频同步补偿数AudioSyncOffset更新为:
AudioSyncOffset=AudioSyncOffset-TAudioSampleLost;
若是,保留所述剪切出点TrimOut所在的音频单元AudioFrame,并将所述历史音频同步补偿数AudioSyncOffset更新为:
AudioSyncOffset=AudioSyncOffset+TAudioSampleAdded。
步骤104,复制音频片段。
本发明实施例的技术方案带来的有益效果如下:通过读取音频片段的音频数据参数;根据所述音频数据参数判断所述音频片段是否需要重构;若是,则对所述音频片段进行重构,若否,则复制所述音频片段,进而完成音频码流的拼接,实现了只对剪切处所在的音频单元进行可能需要的音频重构,而其它的大部分音频单元仅需复制,大大提高了合成的效率,减少了音频质量的损失,保持了原音频的质量。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可以通过硬件实现,也可以可借助软件加必要的通用硬件平台的方式来实现,基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
总之,以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种音频码流拼接的方法,其特征在于,包括以下步骤:
读取音频片段的音频数据参数;
根据所述音频数据参数判断所述音频片段是否需要重构;
若是,则对所述音频片段进行重构,复制重构后的音频片段,若否,则复制所述音频片段;
所述根据所述音频数据参数判断所述音频片段是否需要重构,具体包括:
比较剪切入点TrimIn与音频数据块起始位置以及剪切出点TrimOut与音频数据块结束位置;
若所述剪切入点TrimIn在所述音频数据块起始位置之后或所述剪切出点TrimOut在所述音频数据块结束位置之前,则所述音频片段需要重构,若否,则不需要重构。
2.如权利要求1所述方法,其特征在于,所述音频数据参数包括:
剪切入点TrimIn、剪切出点TrimOut、音频数据块起始位置、音频数据块结束位置、每个音频单元AudioFrame包含的样本数AudioFrameSampleCount以及历史音频同步补偿数AudioSyncOffset;
其中,所述音频片段包含至少一个音频数据块,所述音频数据块包含至少一个音频单元AudioFrame,所述音频单元AudioFrame包含至少一个样本。
3.如权利要求2所述方法,其特征在于,所述对所述音频片段进行重构具体包括:
对所述音频片段的头部进行重构;
对所述音频片段的尾部进行重构。
4.如权利要求3所述方法,其特征在于,所述对所述音频片段的头部进行重构具体包括以下步骤:
删除所述剪切入点TrimIn所在的音频单元AudioFrame之前的音频单元AudioFrame;
保留所述剪切入点TrimIn所在的音频单元AudioFrame之后的音频单元AudioFrame;
根据所述每个音频单元AudioFrame包含的样本数AudioFrameSampleCount以及所述剪切入点TrimIn获取所述剪切入点TrimIn所在的音频单元AudioFrame中位于所述剪切入点TrimIn之前的样本数HAudioSampleAdded以及位于所述切入点TrimIn之后的样本数HAudioSampleLost;
比较所述位于剪切入点TrimIn后的样本数HAudioSampleLost是否大于所述历史音频同步补偿数AudioSyncOffset;
若否,丢弃所述剪切入点TrimIn所在的音频单元AudioFrame,并将所述历史音频同步补偿数AudioSyncOffset更新为:
AudioSyncOffset=AudioSyncOffset-HAudioSampleLost;
若是,保留所述剪切入点TrimIn所在的音频单元AudioFrame,并将所述历史音频同步补偿数AudioSyncOffset更新为:
AudioSyncOffset=AudioSyncOffset+HAudioSampleAdded。
5.如权利要求3所述方法,其特征在于,所述对所述音频片段的尾部进行重构具体包括以下步骤:
删除所述剪切出点TrimOut所在的音频单元AudioFrame之后的音频单元AudioFrame;
保留所述剪切出点TrimOut所在的音频单元AudioFrame之前的音频单元AudioFrame;
根据所述每个音频单元AudioFrame包含的样本数AudioFrameSampleCount以及所述剪切出点TrimOut获取所述剪切出点TrimOut所在的音频单元AudioFrame中位于所述剪切出点TrimOut之后的样本数TAudioSampleAdded以及位于所述切出点TrimOut之前的样本数TAudioSampleLost;
比较所述位于剪切出点TrimOut前的样本数TAudioSampleLost是否大于所述历史音频同步补偿数AudioSyncOffset;
若否,丢弃所述剪切入点TrimIn所在的音频单元AudioFrame,并将所述历史音频同步补偿数AudioSyncOffset更新为:
AudioSyncOffset=AudioSyncOffset-TAudioSampleLost;
若是,保留所述剪切出点TrimOut所在的音频单元AudioFrame,并将所述历史音频同步补偿数AudioSyncOffset更新为:
AudioSyncOffset=AudioSyncOffset+TAudioSampleAdded。
CN201210093471.2A 2012-03-31 2012-03-31 一种音频码流拼接的方法 Expired - Fee Related CN102768844B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210093471.2A CN102768844B (zh) 2012-03-31 2012-03-31 一种音频码流拼接的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210093471.2A CN102768844B (zh) 2012-03-31 2012-03-31 一种音频码流拼接的方法

Publications (2)

Publication Number Publication Date
CN102768844A CN102768844A (zh) 2012-11-07
CN102768844B true CN102768844B (zh) 2017-06-13

Family

ID=47096218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210093471.2A Expired - Fee Related CN102768844B (zh) 2012-03-31 2012-03-31 一种音频码流拼接的方法

Country Status (1)

Country Link
CN (1) CN102768844B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021179321A1 (zh) * 2020-03-13 2021-09-16 深圳市大疆创新科技有限公司 音频数据处理方法、电子设备及计算机可读存储介质
CN113992937A (zh) * 2021-10-09 2022-01-28 华夏文化传媒集团股份有限公司 一种文化与科技融合的数字宣传系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08152897A (ja) * 1994-11-30 1996-06-11 Toshiba Corp 音声編集処理装置
CN1465182A (zh) * 2001-06-22 2003-12-31 索尼公司 数据传输装置及方法
CN101345790A (zh) * 2007-07-09 2009-01-14 上海基信通讯技术有限公司 在手机上对音频文件进行编辑的方法
CN101740084A (zh) * 2009-11-25 2010-06-16 中兴通讯股份有限公司 多媒体片段的剪辑方法及移动终端

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005229156A (ja) * 2004-02-10 2005-08-25 Funai Electric Co Ltd 復号記録装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08152897A (ja) * 1994-11-30 1996-06-11 Toshiba Corp 音声編集処理装置
CN1465182A (zh) * 2001-06-22 2003-12-31 索尼公司 数据传输装置及方法
CN101345790A (zh) * 2007-07-09 2009-01-14 上海基信通讯技术有限公司 在手机上对音频文件进行编辑的方法
CN101740084A (zh) * 2009-11-25 2010-06-16 中兴通讯股份有限公司 多媒体片段的剪辑方法及移动终端

Also Published As

Publication number Publication date
CN102768844A (zh) 2012-11-07

Similar Documents

Publication Publication Date Title
TW519629B (en) Data framing for adaptive-block-length coding system
JP6538128B2 (ja) オーディオ・オブジェクトを含むオーディオ・シーンの効率的な符号化
US8321216B2 (en) Time-warping of audio signals for packet loss concealment avoiding audible artifacts
CN100377589C (zh) 一种视频文件快速生成的方法
EP2289245B1 (en) Method and apparatus for generating or cutting or changing a frame based bit stream format file including at least one header section, and a corresponding data structure
CA2578190C (en) Device and method for generating a coded multi-channel signal and device and method for decoding a coded multi-channel signal
RU2010144057A (ru) Маскирование ошибки передачи в цифровом аудиосигнале в иерархической структуре декодирования
CN104768025B (zh) 一种视频坏帧修复方法及装置
CN106254867A (zh) 基于画面组对视频文件进行转码的方法及系统
BR112016022466B1 (pt) método para codificar um sinal sonoro, método para decodificar um sinal sonoro, dispositivo para codificar um sinal sonoro e dispositivo para decodificar um sinal sonoro
CN105551512A (zh) 音频格式转换方法和装置
TR201904282T4 (tr) Bağımsız gürültü-doldurma kullanarak iyileştirilmiş bir ses sinyali üretmek için cihaz ve yöntem.
CN106911939A (zh) 一种视频转码方法、装置及系统
CN103646048A (zh) 实现多媒体图片的方法和装置
CN102768844B (zh) 一种音频码流拼接的方法
JP4359499B2 (ja) オーディオ信号の編集
US8543230B2 (en) Optimizing seek functionality in media content
CN102769715B (zh) 一种码流剪辑的方法及系统
CN100454981C (zh) 一种工程快照文件的生成方法
US20130151972A1 (en) Media processing comparison system and techniques
CN110944197B (zh) 一种图像、音频编码的方法和装置
US8364496B2 (en) Signal recording and reproducing apparatus and method
CN102768834B (zh) 一种实现音频帧解码的方法
CN110493604A (zh) 一种基于gpu集群实现8k hevc实时编码的方法
US8559794B2 (en) System and method for recording collaborative information

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180427

Address after: 100195 Beijing Haidian District West Fourth Ring Road North 131 new six layer

Patentee after: Beijing Newauto Group Co.,Ltd.

Address before: 100195 new technology building, 49 Wukesong Road, Haidian District, Beijing

Patentee before: China Digital Video (Beijing) Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170613