CN104157287B - 音频处理方法及装置 - Google Patents

音频处理方法及装置 Download PDF

Info

Publication number
CN104157287B
CN104157287B CN201410367980.9A CN201410367980A CN104157287B CN 104157287 B CN104157287 B CN 104157287B CN 201410367980 A CN201410367980 A CN 201410367980A CN 104157287 B CN104157287 B CN 104157287B
Authority
CN
China
Prior art keywords
audio
volume
sampling value
value
volume sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410367980.9A
Other languages
English (en)
Other versions
CN104157287A (zh
Inventor
刘淦明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Original Assignee
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Shiyuan Electronics Thecnology Co Ltd filed Critical Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority to CN201410367980.9A priority Critical patent/CN104157287B/zh
Publication of CN104157287A publication Critical patent/CN104157287A/zh
Application granted granted Critical
Publication of CN104157287B publication Critical patent/CN104157287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开了一种音频处理方法,该方法包括:按照取样频率对一段音频进行取样,获得一组音量取样值;判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值;当所述差值小于或等于所述音量差阈值时,保存所述音频;当所述差值大于所述音量差阈值时,从所述一组音量取样值的第一个音量取样值开始,直到最后一个音量取样值结束,依次把每个音量取样值与参照值进行比较;当所述音量取样值小于或等于参照值时,删除所述音量取样值对应的音频;当所述音量取样值大于参照值时,保存所述音量取样值对应的音频。本发明还公开了一种音频处理装置。采用本发明实施例,可以节约存储空间、听者的回放时间及音频通过网络传输时的数据流量。

Description

音频处理方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种音频处理方法及装置。
背景技术
当今社会快速发展,人们常常需要记录并回放各种有用语音信息,也常常通过互联网进行语音沟通。比如,人们在参加会议时,需要录下发言人的讲话,以便掌握更详细的信息;人们使用互联网聊天工具进行沟通时会发送微信语音、QQ语音等语音信息。目前,常用的录音方法是从录音开始至结束,录音设备记录录音期间所有的音频信息。
在实现本发明的过程中,发明人发现现有技术至少存在如下问题:
现有的录音记录方法把无用音频也记录了起来。无用音频是指包含无用信息的音频,例如录音期间没有人讲话的无声音频,或者是声音很小的非正常讲话的音频。这种无用音频浪费存储空间,回放的时候也浪费听者的时间,如果在网络传输还会浪费流量。
发明内容
本发明实施例的多个方面提出一种音频处理方法及装置,能够自动识别并删除无用音频,保存有用音频,从而节约了存储空间、回放的时间及音频通过网络传输时的数据流量。
本发明实施例的一个方面提供了一种音频处理方法,包括:
按照取样频率f对一段音频进行取样,获得一组所述音频的音量取样值;
判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值;
当所述差值小于或等于所述音量差阈值时,保存所述音频;
当所述差值大于所述音量差阈值时,从所述一组音量取样值的第一个音量取样值开始,直到最后一个音量取样值结束,依次把每个音量取样值与参照值进行比较;
当所述音量取样值小于或等于参照值时,删除所述音量取样值对应的音频;
当所述音量取样值大于参照值时,保存所述音量取样值对应的音频。
其中,所述参照值是所述一组音量取样值中的最小值与修正系数相乘而得到的值。所述修正系数是一个比1大的数,并且可以修改。
相应地,本发明实施例的另一个方面还提供了一种音频处理装置,包括:
取样模块,用于按照取样频率f对一段音频进行取样,获得一组所述音频的音量取样值;
第一判断模块,用于判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值;
第一保存模块,用于当所述差值小于或等于所述音量差阈值时,保存所述音频;
第二判断模块,用于当所述差值大于所述音量差阈值时,从所述一组音量取样值的第一个音量取样值开始,直到最后一个音量取样值结束,依次把每个音量取样值与参照值进行比较;
音频删除模块,用于当所述音量取样值小于或等于参照值时,删除所述音量取样值对应的音频;和,
第二保存模块,用于当所述音量取样值大于参照值时,保存所述音量取样值对应的音频。
其中,所述参照值是所述一组音量取样值中的最小值与修正系数相乘而得到的值,所述修正系数是一个比1大的数,并且可以修改。实施本发明实施例,具有如下有益效果:
本发明实施例提供的音频处理方法及装置,对音频的音量进行取样,获得一组所述音频的音量取样值,再用所述音量取样值去判断音频是否是有用音频。然后把无用音频删除,仅保存有用音频,从而节约了音频的存储空间和听者回放的时间,如果音频在网络上传输,就也节约了网络流量。
附图说明
图1是本发明提供的音频处理方法的一个实施例的流程示意图;
图2是本发明提供的音频处理装置的一个实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明提供的音频处理方法的一个实施例的流程示意图,该方法包括步骤S101至S106,具体如下:
S101,按照取样频率f对一段音频进行取样,获得一组所述音频的音量取样值;
在一种实施方式中,所述音频可以是一段已经预先录制好的音频,假设所述音频的时长为10分钟,按取样频率f为20Hz对这段音频的音量进行取样,得到12000个所述音频的音量的取样值,即所述音频被平均分成了12000段音频单元,一个所述音量取样值对应一个所述音频单元。
S102,判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值;
具体的,通过比较获得所述一组音量取样值中每个音量取样值的大小,获得最大值与最小值,计算获得所述最大值与所述最小值之间的差值,再将所述差值与音量差阈值进行比较。
所述音量差阈值是预先设置好的数值,在具体实施当中,可以通过大量测试,在有人讲话时录音的音量取样值与无人讲话时录音的音量取样值的差值中,选取一个临界值作为所述音量差阈值。
S103,当所述差值小于或等于所述音量差阈值时,保存所述音频。
具体的,若音量取样值的最大值与最小值的差值较小,则说明这段音频里音量变化不大,都是有用音频,所以不需要删除,直接把整个音频保存,完成音频处理。
S104,当所述差值大于所述音量差阈值时,从所述一组音量取样值的第一个音量取样值开始,直到最后一个音量取样值结束,依次把每个音量取样值与参照值进行比较;
具体的,若音量取样值的最大值与最小值的差值较大,则说明这段音频里音量变化较大,存在有用音频,也存在无用音频,此时,需要把无用音频选择出来,并删除。选择出无用音频的具体方法是:从所述一组音量取样值的第一个音量取样值开始,直到最后一个音量取样值结束,依次把每个音量取样值与参照值进行比较。因为一般情况下,有用音频的音量比无用音频的音量大,所以,通过音量大小的区别就可以判断哪些是有用音频,哪些是无用音频。
优选的,所述参照值是由所述一组音量取样值的最小值乘以修正系数而得到的值。所述修正系数是一个比1大的数,并且可以修改。
S105,当所述音量取样值小于或等于参照值时,删除所述音量取样值对应的音频。
S106,当所述音量取样值大于参照值时,保存所述音量取样值对应的音频。
具体的,如果所述音量取样值小于或等于参照值时,则说明所述音量取样值对应的音频单元是无用音频,所以应当删除所述音频单元;如果所述音量取样值大于参照值时,则说明所述音量取样值对应的音频单元是有用音频,所以应当保存所述音频单元。
在另一个实施例中,上述步骤S101中的一段音频还可以是实时输入的音频,例如是实时的录音音频,在这种情况下,录音与音量取样同时进行,在具体实施当中,系统会预先设定一段时间,如10分钟,在这10分钟内系统把声音录制成录音音频,存放在临时存储空间里;系统也同时按照取样频率f,如20Hz对声音音量进行取样;录音与取样结束后,获得录音音频以及12000个与所述录音音频对应的音量取样值,余下步骤便可按上述实施例的S102、S103、S104、S105、S106进行。
本发明的实施例还提供一种音频处理装置,能够实现上述实施例提供的音频处理方法的所有流程。
参见图2,是本发明提供的音频处理装置的一个实施例的结构示意图。
本发明实施例提供的一种音频处理装置,包括:
取样模块1,用于按照取样频率f对一段音频进行取样,获得一组所述音频的音量取样值;
第一判断模块2,用于判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值;
第一保存模块3,用于当所述差值小于或等于所述音量差阈值时,保存所述音频;
第二判断模块4,用于当所述差值大于所述音量差阈值时,从所述一组音量取样值的第一个音量取样值开始,直到最后一个音量取样值结束,依次把每个音量取样值与参照值进行比较;
音频删除模块5,用于当所述音量取样值小于或等于参照值时,删除所述音量取样值对应的音频;和,
第二保存模块6,用于当所述音量取样值大于参照值时,保存所述音量取样值对应的音频。
优选的,所述参照值是所述一组音量取样值中的最小值与修正系数相乘而得到的值。所述修正系数是一个比1大的数,并且可以修改。
本发明提供的音频处理方法及装置,可以有效地删除音频中无人讲话时的音频,从而达到节省存储空间,节省听者回放的时间及节省音频的网络上传输时消耗的流量。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (4)

1.一种音频处理方法,其特征在于,包括:
按照取样频率f对一段音频进行取样,获得一组所述音频的音量取样值;
判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值;
当所述差值小于或等于所述音量差阈值时,保存所述音频;
当所述差值大于所述音量差阈值时,从所述一组音量取样值的第一个音量取样值开始,直到最后一个音量取样值结束,依次把每个音量取样值与参照值进行比较;
当所述音量取样值小于或等于参照值时,删除所述音量取样值对应的音频;
当所述音量取样值大于参照值时,保存所述音量取样值对应的音频。
2.根据权利要求1所述音频处理方法,其特征在于,所述参照值是所述一组音量取样值中的最小值与修正系数相乘而得到的值。
3.一种音频处理装置,其特征在于,包括:
取样模块,用于按照取样频率f对一段音频进行取样,获得一组所述音频的音量取样值;
第一判断模块,用于判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值;
第一保存模块,用于当所述差值小于或等于所述音量差阈值时,保存所述音频;
第二判断模块,用于当所述差值大于所述音量差阈值时,从所述一组音量取样值的第一个音量取样值开始,直到最后一个音量取样值结束,依次把每个音量取样值与参照值进行比较;
音频删除模块,用于当所述音量取样值小于或等于参照值时,删除所述音量取样值对应的音频;和,
第二保存模块,用于当所述音量取样值大于参照值时,保存所述音量取样值对应的音频。
4.根据权利要求3所述音频处理装置,其特征在于,所述参照值是所述一组音量取样值中的最小值与修正系数相乘而得到的值。
CN201410367980.9A 2014-07-29 2014-07-29 音频处理方法及装置 Active CN104157287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410367980.9A CN104157287B (zh) 2014-07-29 2014-07-29 音频处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410367980.9A CN104157287B (zh) 2014-07-29 2014-07-29 音频处理方法及装置

Publications (2)

Publication Number Publication Date
CN104157287A CN104157287A (zh) 2014-11-19
CN104157287B true CN104157287B (zh) 2017-08-25

Family

ID=51882770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410367980.9A Active CN104157287B (zh) 2014-07-29 2014-07-29 音频处理方法及装置

Country Status (1)

Country Link
CN (1) CN104157287B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104409086A (zh) * 2014-12-01 2015-03-11 联想(北京)有限公司 一种用于音频处理的方法和电子设备
CN109637561A (zh) * 2018-11-13 2019-04-16 成都依能科技股份有限公司 一种多通道音视频自动智能编辑方法
CN110046045B (zh) * 2019-04-03 2021-07-30 百度在线网络技术(北京)有限公司 语音唤醒的数据包处理方法和装置
CN114740926B (zh) * 2021-07-06 2023-07-25 百倍云(浙江)物联科技有限公司 一种温室大棚环境数据智能处理方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3959592A (en) * 1972-12-21 1976-05-25 Gretag Aktiengesellschaft Method and apparatus for transmitting and receiving electrical speech signals transmitted in ciphered or coded form
CN1770263A (zh) * 2004-11-01 2006-05-10 英业达股份有限公司 语音识别系统以及方法
CN1815555A (zh) * 2005-02-04 2006-08-09 光宝科技股份有限公司 电子收音装置及其音量提醒方法
CN1885711A (zh) * 2005-06-24 2006-12-27 腾讯科技(深圳)有限公司 一种音量控制方法和系统
CN101272132A (zh) * 2008-04-30 2008-09-24 北京中星微电子有限公司 一种根据波长动态调整播放音量的方法及系统
CN102142256A (zh) * 2010-08-06 2011-08-03 华为技术有限公司 淡入时间的计算方法和装置
CN102376303A (zh) * 2010-08-13 2012-03-14 国基电子(上海)有限公司 录音设备及利用该录音设备进行声音处理与录入的方法
CN102800324A (zh) * 2012-07-30 2012-11-28 东莞宇龙通信科技有限公司 用于移动终端的音频处理系统和方法
CN103414443A (zh) * 2013-08-27 2013-11-27 广州顶毅电子有限公司 音量自动控制方法以及音量自动控制系统
CN103578470A (zh) * 2012-08-09 2014-02-12 安徽科大讯飞信息科技股份有限公司 一种电话录音数据的处理方法及系统
CN103888610A (zh) * 2014-03-18 2014-06-25 深圳市中兴移动通信有限公司 同时通话和录音的方法和通讯终端
CN103929140A (zh) * 2014-04-30 2014-07-16 深圳市中兴移动通信有限公司 音频预处理方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05241588A (ja) * 1992-03-02 1993-09-21 Fujitsu Ltd 閾値決定方法
JP2009265422A (ja) * 2008-04-25 2009-11-12 Sony Corp 情報処理装置及び情報処理方法
CN101582285A (zh) * 2009-07-02 2009-11-18 福州思迈特数码科技有限公司 录音高效播放的方法
JP4756401B2 (ja) * 2009-12-11 2011-08-24 オンキヨー株式会社 音量調整装置およびそのプログラム
CN103559907B (zh) * 2013-10-25 2016-06-08 广州华多网络科技有限公司 录音方法、装置和终端

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3959592A (en) * 1972-12-21 1976-05-25 Gretag Aktiengesellschaft Method and apparatus for transmitting and receiving electrical speech signals transmitted in ciphered or coded form
CN1770263A (zh) * 2004-11-01 2006-05-10 英业达股份有限公司 语音识别系统以及方法
CN1815555A (zh) * 2005-02-04 2006-08-09 光宝科技股份有限公司 电子收音装置及其音量提醒方法
CN1885711A (zh) * 2005-06-24 2006-12-27 腾讯科技(深圳)有限公司 一种音量控制方法和系统
CN101272132A (zh) * 2008-04-30 2008-09-24 北京中星微电子有限公司 一种根据波长动态调整播放音量的方法及系统
CN102142256A (zh) * 2010-08-06 2011-08-03 华为技术有限公司 淡入时间的计算方法和装置
CN102376303A (zh) * 2010-08-13 2012-03-14 国基电子(上海)有限公司 录音设备及利用该录音设备进行声音处理与录入的方法
CN102800324A (zh) * 2012-07-30 2012-11-28 东莞宇龙通信科技有限公司 用于移动终端的音频处理系统和方法
CN103578470A (zh) * 2012-08-09 2014-02-12 安徽科大讯飞信息科技股份有限公司 一种电话录音数据的处理方法及系统
CN103414443A (zh) * 2013-08-27 2013-11-27 广州顶毅电子有限公司 音量自动控制方法以及音量自动控制系统
CN103888610A (zh) * 2014-03-18 2014-06-25 深圳市中兴移动通信有限公司 同时通话和录音的方法和通讯终端
CN103929140A (zh) * 2014-04-30 2014-07-16 深圳市中兴移动通信有限公司 音频预处理方法和装置

Also Published As

Publication number Publication date
CN104157287A (zh) 2014-11-19

Similar Documents

Publication Publication Date Title
CN104157287B (zh) 音频处理方法及装置
WO2016180100A1 (zh) 一种音频处理的性能提升方法及装置
CN103646654B (zh) 一种录音数据分享方法及终端
CN104167213A (zh) 音频处理方法和装置
CN104952450B (zh) 远场识别的处理方法和装置
CN104102570B (zh) 一种app运行控制的方法及装置
DE10030202A1 (de) Mobilstation mit einer digitalen Audiodatenspeicherungs- und -wiedergabevorrichtung und Verfahren zu ihrer Steuerung
CN103491488A (zh) 一种麦克风回音消除方法及装置
CN110246501B (zh) 用于会议记录的语音识别方法及系统
CN109417583A (zh) 一种将音频信号实时转录为文本的系统和方法
CN104410973A (zh) 一种播放录音的诈骗电话识别方法和系统
CN106453971A (zh) 呼叫中心质检语音的获取方法和呼叫中心质检系统
CN105141502A (zh) 一种即时通信过程的管理方法及装置
CN105429851A (zh) 一种基于即时通信的多人协同录音系统及识别方法
CN104268667A (zh) 一种协助管理人员进行纠纷调解的方法及系统
CN108053023A (zh) 一种自动式意图分类方法及装置
CN104200824B (zh) 音频录制方法和装置
CN104376859B (zh) 一种播放列表自动调整的方法和网络音乐播放器
CN111064971B (zh) 一种自定义开播通知的方法以及相关设备
CN106156036A (zh) 一种车载音频处理方法及车载设备
CN105007364B (zh) 语音通话方法及语音通话装置
JP2011029688A (ja) 通話録音再生方法及び通話録音装置
CN103475768A (zh) 一种移动终端的录音方法和系统
CN105808719A (zh) 音频信息推荐方法及装置
CN105007522B (zh) 一种播放场景管理方法、系统、播放终端及控制终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant