CN112153533B - 音频信号的破音消除方法及装置、存储介质、终端 - Google Patents

音频信号的破音消除方法及装置、存储介质、终端 Download PDF

Info

Publication number
CN112153533B
CN112153533B CN202011024085.9A CN202011024085A CN112153533B CN 112153533 B CN112153533 B CN 112153533B CN 202011024085 A CN202011024085 A CN 202011024085A CN 112153533 B CN112153533 B CN 112153533B
Authority
CN
China
Prior art keywords
digital signal
current frame
frame data
processed
pressing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011024085.9A
Other languages
English (en)
Other versions
CN112153533A (zh
Inventor
雍雅琴
潘思伟
陈皓
罗本彪
董斐
纪伟
林福辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spreadtrum Communications Shanghai Co Ltd
Original Assignee
Spreadtrum Communications Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spreadtrum Communications Shanghai Co Ltd filed Critical Spreadtrum Communications Shanghai Co Ltd
Priority to CN202011024085.9A priority Critical patent/CN112153533B/zh
Publication of CN112153533A publication Critical patent/CN112153533A/zh
Application granted granted Critical
Publication of CN112153533B publication Critical patent/CN112153533B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

一种音频信号的破音消除方法及装置、存储介质、终端,所述方法包括:从接收到的音频信号中获取待处理的当前帧数据;对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理,以得到处理后的当前帧数据,其中,软压制处理前后所述当前帧数据的时域波形保持局部相对不变。通过本发明方案能够在保持最大响度不变的前提下,消除破音,改善音质,提升终端设备的通话及音乐播放体验。

Description

音频信号的破音消除方法及装置、存储介质、终端
技术领域
本发明涉及语音处理技术领域,具体地涉及一种音频信号的破音消除方法及装置、存储介质、终端。
背景技术
在音频外放类终端的接收端,当音量较小时,扬声器正常播放音频信号。当逐渐增大音量时,扬声器播放出较大音量(即响度,是指人耳感受到的声音强弱,是人对声音大小的一个主观感觉量)的音频信号,有时人们会听到的破音,如较刺耳的“pa”的一个突变声音。破音是除音源信号外的额外的音频信号,既不是语音信号也不是音乐信号,会对语音信号或音乐造成干扰且听起来较刺耳。此外,如果顾客在购买新设备试听时听到破音,顾客会认为扬声器是坏掉的,影响商家的销售业绩。
因此,分析并找到破音的原因,并相应调整音频信号以解决破音问题,是一个值得研究的课题。
通常而言,音频信号的破音是指音频信号过载造成信号失真,最终扬声器播放该失真信号,此时人们就会听到破音。信号失真又称“畸变”,指信号在传输过程中与原信号相比发生的偏差,可用总谐波失真(Total Harmonic Distortion,简称THD)表征失真大小。
为了避免破音,现有较常采用的一种做法是减小整个音频信号的增益,使得扬声器播放的音频信号变小。这种方法虽然解决了破音问题,但扬声器播放出的音频信号的响度变小,无法满足使用者的响度需求。如若在嘈杂环境中,采用这种方法播放的音频信号经常会被噪声淹没,造成音频信号的信息丢失,严重影响用户体验。
发明内容
本发明解决的技术问题是如何在保持最大响度不变的前提下消除破音。
为解决上述技术问题,本发明实施例提供一种音频信号的破音消除方法,包括:从接收到的音频信号中获取待处理的当前帧数据;对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理,以得到处理后的当前帧数据,其中,软压制处理前后所述当前帧数据的时域波形保持局部相对不变。
可选的,所述从接收到的音频信号中获取待处理的当前帧数据包括:对所述音频信号进行分帧处理以得到多帧信号,其中相邻两帧信号存在交叠;对于当前帧信号,将所述当前帧信号的数字信号处理结果确定为待处理的当前帧数据,其中,交叠部分的数字信号处理结果为当前帧信号的数字信号处理结果与相交叠的相邻帧信号的数字信号处理结果的叠加。
可选的,所述数字信号幅值超出数字信号最大输出阈值的部分集中于所述交叠部分。
可选的,所述对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理包括:统计所述数字信号幅值超出数字信号最大输出阈值的极值点的数量;若统计得到的所述极值点的数量为单个,则根据所述极值点确定压制区间,并对所述待处理的当前帧数据落入所述压制区间的部分进行软压制处理。
可选的,所述对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理包括:统计所述数字信号幅值超出数字信号最大输出阈值的极值点的数量;若统计得到的所述极值点的数量为多个,则将相邻两个极值点之间的区域确定为压制区间,并对所述待处理的当前帧数据落入各压制区间的部分分别进行软压制处理。
可选的,所述对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理还包括:对于多个极值点中的首个极值点,将时域上位于所述极值点之前的区域也确定为压制区间,并对所述待处理的当前帧数据落入所述压制区间的部分进行软压制处理;对于多个极值点中的末个极值点,将时域上位于所述极值点之后的区域也确定为压制区间,并对所述待处理的当前帧数据落入所述压制区间的部分进行软压制处理。
可选的,所述压制区间内包括多个采样点,同一压制区间内,至少一个采样点的增益不同于其他采样点的增益,其中,所述增益用于表征对采样点的压制幅度。
可选的,每一压制区间内,极值点的增益的绝对值大于其他采样点的增益的绝对值。
可选的,每一压制区间内,极值点的增益用于将所述极值点的数字信号幅值压制至等于所述数字信号最大输出阈值。
可选的,所述破音消除方法还包括:将处理后的当前帧数据进行数模转换以及模拟信号处理,以得到处理后的音频信号并输出。
为解决上述技术问题,本发明实施例还提供一种音频信号的破音消除装置,包括:获取模块,用于从接收到的音频信号中获取待处理的当前帧数据;软压制处理模块,用于对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理,以得到处理后的当前帧数据,其中,软压制处理前后所述当前帧数据的时域波形保持局部相对不变。
为解决上述技术问题,本发明实施例还提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时执行上述方法的步骤。
为解决上述技术问题,本发明实施例还提供一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行上述方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
本发明实施例提供一种音频信号的破音消除方法,包括:从接收到的音频信号中获取待处理的当前帧数据;对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理,以得到处理后的当前帧数据,其中,软压制处理前后所述当前帧数据的时域波形保持局部相对不变。
较之现有技术所采用的破音消除方法,本实施方案能够在最大响度不变的前提下,有针对性的软压制超过数字信号最大输出阈值的数字信号的幅度,避免模拟信号失真,进而消除破音,改善音质,提升通话及音乐播放体验。进一步,区别于现有技术所采用的削顶限幅算法,在本实施方案中,由于处理前后当前帧数据的时域波形保持局部相对不变,利于避免音频信号在数字信号处理部分失真,使得消除破音的同时兼顾音质成为可能。
进一步,统计所述数字信号幅值超出数字信号最大输出阈值的极值点的数量;若统计得到的所述极值点的数量为多个,则将相邻两个极值点之间的区域确定为压制区间,并对所述待处理的当前帧数据落入各压制区间的部分分别进行软压制处理。由此,对于每一压制区间,位于该压制区间内的采样点是整体性地考虑压制幅度的,以确保软压制处理前后当前帧数据的时域波形的变化趋势保持局部相对不变。进一步,由于每一压制区间的边界分别为相邻的两个极值点,使得软压制处理后这相邻两个极值点处不会发生突变。
进一步,对于每一压制区间,该压制区间内各个采样点的增益变化是平滑的。也即,某一采样点的增益大小随着该采样点与界定其所在压制区间边界的极值点之间的距离的变化而平稳变化,防止在压制区间的边界处发生突变。
附图说明
图1是音频外放类终端的接收端的音频信号处理流程示意图;
图2是在音频外放类终端的最大响度下抓取的音频信号的数字信号的时域波形图;
图3是在音频外放类终端的最大响度下抓取的音频信号的模拟信号的时域波形图;
图4是图2中区域a的局部放大图;
图5是图3中区域b的局部放大图;
图6示出数字信号最大输出阈值为-6dB时一段音频信号经数字信号处理模块处理输出的数字信号的整体时域波形图;
图7是相邻两帧数据的交叠处的示意图;
图8是图6中区域e的局部放大图;
图9是本发明实施例一种音频信号的破音消除方法的流程图;
图10是图9中步骤S102的一个具体实施方式的流程图;
图11是图9中步骤S102的另一个具体实施方式的流程图;
图12示出采用图9所示方案对图8所示时域波形进行软压制处理后的时域波形图;
图13示出采用图9所示方案对图6所示时域波形进行软压制处理后的时域波形图;
图14是本发明实施例一种音频信号的破音消除装置的结构示意图。
具体实施方式
如背景技术所言,现有技术无法在不影响响度的前提下有效消除音频信号的破音。
本申请发明人经过分析发现,音频外放类终端的破音产生原因包括数字信号失真、模拟信号失真和扬声器超功率的打底失真。具体而言,数字信号有削顶失真时会产生“zizi”破音。若数字信号无失真,数字信号输入到模拟信号处理部分的音频功率放大器后,如果输入的数字信号超过音频功率放大器的阈值,则会造成模拟信号失真,最终产生较刺耳的“pa”破音。当扬声器超功率工作时,则会出现打底失真。
现有算法中,削顶限幅算法(Clipping)可在不影响响度的前提下,对数字信号进行处理,避免模拟信号失真,消除较刺耳的“pa”破音。但是,削顶算法的思想是将大于阈值的数据赋值为阈值,该算法会使音频信号在数字信号处理部分失真,音质变差,致使语音和音乐的还原度降低,并出现“zizi”破音。也即,现有技术所采用的削顶限幅算法会使得音频信号的数字信号出现削顶失真,仍无法完全消除破音。
为解决上述技术问题,本发明实施例提供一种音频信号的破音消除方法,包括:从接收到的音频信号中获取待处理的当前帧数据;对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理,以得到处理后的当前帧数据,其中,软压制处理前后所述当前帧数据的时域波形保持局部相对不变。
本实施方案能够在最大响度不变的前提下,有针对性的软压制超过数字信号最大输出阈值的数字信号的幅度,避免模拟信号失真,进而消除破音,改善音质,提升通话及音乐播放体验。进一步,区别于现有技术所采用的削顶限幅算法,在本实施方案中,由于处理前后当前帧数据的时域波形保持局部相对不变,利于避免音频信号在数字信号处理部分失真,使得消除破音的同时兼顾音质成为可能。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
本实施方案可以应用于音频外放类终端的语音通话和音乐播放应用场景。本实施方案可以由音频外放类终端执行,如由配置有扬声器的移动通信终端、可穿戴设备等。
图1是音频外放类终端的接收端(receiving direction)的音频信号处理流程示意图。其中,所述接收端可以指音频外放类终端中用于接收并外放音频信号的一系列处理模块。
具体地,参考图1,接收到的音频信号在所述音频外放类终端中主要经过数字信号处理模块11和模拟信号处理模块12这两个模块的处理。
所述数字信号处理模块11主要是对以数字信号表征的所述音频信号做一些处理。如噪声消除、高通滤波器、均衡器、动态范围压制等。
所述模拟信号处理模块12主要包含数字/模拟信号转换,以将经过数字信号处理模块11处理的以数字信号表征的音频信号转换呈模拟信号。进一步,所述模拟信号处理模块12还可以对模拟信号执行音频功率放大器增益等,最终音频信号通过扬声器13等器件播放。
当模拟信号处理模块12中功率放大器的模拟增益为定值时,逐渐增大音频信号的数字信号最大输出阈值(Digital_max_threshold),使用总谐波失真数字测试仪测试经过图1示出的经过数字信号处理模块11和模拟信号处理模块12处理后输出至扬声器13的模拟信号的总谐波失真(Total Harmonic Distortion,简称THD)。其中,所述总谐波失真根据模拟信号处理模块12输送给扬声器13的电信号与数字信号处理模块11输出的数字信号(就是源信号)计算得到的,用于表征数字信号到模拟信号之间的失真度。
随着音频信号的响度增大,音频信号的数字信号最大输出阈值逐渐增大,总谐波失真越大,相应的数字信号到模拟信号之间的失真度越大。当总谐波失真为1%(或更小值)时,可以认为此时音频外放类终端的系统响度是最大响度,即不破音(没有失真)时的最大响度。此时,可以确定音频外放类终端的最大响度的模拟增益和数字信号最大输出阈值。同时,可以抓取音频信号的模拟信号和数字信号,如图2和图3所示。图2和图3中,横坐标为采样点,纵坐标为归一化幅度。其中,所述归一化幅度是指数字信号或模拟信号的输出幅值的归一化结果。
需要指出的是,本实施例中,接收到的音频信号先后经过数字信号处理模块11和模拟信号处理模块12处理。为便于表述,将经过数字信号处理模块11处理得到的以数字信号表征的音频信号记作数字信号,将经过模拟信号处理块12处理得到的以模拟信号表征的音频信号记作模拟信号。
将图2中区域a放大得到图4示出的数字信号的时域波形图,相对应的,将图3中区域b放大得到图5示出的模拟信号的时域波形。对比图4和图5中的区域c和区域d可知,数字信号在时域波形上无失真,但对应模拟信号的波谷处有波形失真。假设THD为1%时,数字信号最大输出阈值Digital_max_thr=0.5,图5区域d中模拟信号失真处在图4中对应的数字信号幅值是0.63,该处信号幅度已经超过了数字信号最大输出阈值Digital_max_thr。
图6示出数字信号最大输出阈值为-6dB(对应数字信号幅值为0.5)时一段音频信号经数字信号处理模块11处理输出的数字信号的整体时域波形图。参考图6可知,数字信号的大部分信号在图中示出的数字信号最大输出阈值以内,个别点会超过数字信号最大输出阈值。而超过数字信号最大输出阈值的数据会造成模拟信号失真,导致破音。因此,需要对超过数字信号最大输出阈值的数据做分析和处理。
由于语音信号是随时间变化的非平稳随机过程,但由于人的发声器官具有惯性,因此,语音在短时间内是平稳信号,可以利用短时稳定性来分析语音信号。具体而言,语音信号的短时分析需要分帧和加窗处理,当对语音信号做分帧处理时,前后两帧信号会有交叠部分,如图7所示。在对分帧后的每一帧信号(即每一帧数据)分别进行数字信号处理后再合并前后两帧数据,交叠部分做叠加处理,最终输出信号较为连续,并且幅值不变。
对于分帧得到的每一帧数据,均会经过数字信号处理模块11处理。具体地,每一帧数据均可以经过噪声消除、高通滤波器、均衡器、动态范围压制等处理。然后,处理后的相邻两帧数据合并得到完整连续的数字信号,相邻两帧数据的交叠处,相邻两帧数据各自的数字信号处理结果做叠加处理,叠加后的数据输入到模拟信号处理模块12继续处理。
本申请发明人经过分析发现,数字信号处理模块11采用的动态范围压制算法使每一帧数据的输出结果都在数字信号最大输出阈值以内,但在交叠处,由于前一帧数据和当前帧数据的增益不同,导致交叠处叠加后的结果可能会超过数字信号最大输出阈值Digital_max_thr。
具体而言,现有的数字信号处理模块11是分帧后逐帧处理的,如针对每帧数据单独做限幅处理,这样可以将每帧数据的数字信号幅值限制到数字信号最大输出阈值内。但是,数字信号处理模块11最终输出的数字信号是要将分帧的各帧数据合并起来的,由于前后两帧数据是各自做限幅处理的,而合并时交叠处的数字信号处理结果(如数字信号幅值)是要叠加的。因此,对于交叠后的每一帧数据,交叠处的数字信号幅值仍有可能超过数字信号最大阈值。而现有技术中,上述数字信号是直接被传输至模拟信号处理模块12的,现有技术无法对交叠后的超出数字信号最大输出阈值的部分再做处理。
也就是说,经过数字信号处理模块11处理后的每一帧数据中,超过数字信号最大输出阈值的数据通常位于该帧数据与相邻帧数据的交叠处。放大图6中的区域e(相邻两帧数据的交叠处)得到如图8所示数字信号的时域波形图,可以看到波峰f的数字信号幅值超过了数字信号最大输出阈值Digital_max_thr(本例中Digital_max_thr=0.5)。因此,虽然图2所示数字信号没有失真,但由于存在数字信号幅值超出数字信号最大输出阈值的部分,导致经过模拟信号处理模块12处理后会出现失真,进而产生破音。
在本实施方案中,对两帧交叠后超过数字信号最大输出阈值Digital_max_thr的信号做软压制处理,而不是削波限幅处理,以在消除破音的同时,避免模拟信号失真。
需要指出的是,所述最大响度的模拟增益和数字信号最大输出阈值可以是在整机研发阶段或出厂阶段测试确定,并作为预设数值存储在音频外放类终端的寄存器内,这两个数值共同作用下决定了音频外放类终端的扬声器13最终输出的响度。进一步而言,所述数字信号最大输出阈值是一个上下限概念,也即,其界定的是如图8示出的-0.5到+0.5的一个区间范围。
图9是本发明实施例一种音频信号的破音消除方法的流程图。
具体地,参考图9,本实施例所述音频信号的破音消除方法可以包括如下步骤:
步骤S101,从接收到的音频信号中获取待处理的当前帧数据;
步骤S102,对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理,以得到处理后的当前帧数据,其中,软压制处理前后所述当前帧数据的时域波形保持局部相对不变。
进一步,所述步骤S101中获取的所述待处理的当前帧数据可以是图1中数字信号处理模块11输出的数据。进一步,经过步骤S102软压制处理得到的处理后的当前帧数据可以传输至图1中的模拟信号处理模块12。
在一个具体实施中,所述步骤S101可以由图1示出的数字信号处理模块11执行。
具体地,所述步骤S101可以包括步骤:对所述音频信号进行分帧处理以得到多帧信号,其中相邻两帧信号存在交叠;对于当前帧信号,将所述当前帧信号的数字信号处理结果确定为待处理的当前帧数据,其中,交叠部分的数字信号处理结果为当前帧信号的数字信号处理结果与相交叠的相邻帧信号的数字信号处理结果的叠加。
例如,分帧操作时,前后两帧可以存在50%、25%的重叠。
进一步,可以对分帧后的每一帧信号执行加窗操作,以有效防止频谱泄露。
进一步,对当前帧信号的数字信号处理可以包括将当前帧信号的数字信号幅值限制到数字信号最大输出阈值的范围内。例如,限制的方式可以采用削顶限幅算法。又例如,限制的方式也可以采用本实施例步骤S102所采用的软压制方法。
在一个具体实施中,所述时域波形保持局部相对不变是指:数字信号幅值随时间的变化趋势保持局部相对不变。
具体而言,相较于现有削顶限幅算法所采用的一刀切方式,本实施方案所采用的软压制方法没有造成信号的额外损失,不改变音频信号的时域波形的变化趋势。也就是说,软压制处理前后的数字信号的时域波形的曲线整体走势保持局部相对不变,曲线仅在超出数字信号最大输出阈值的波峰和波谷处被压制到数字信号最大输出阈值界定的数值范围内,且压制前后这些波峰和波谷的走势仍基本保持不变。
在一个具体实施中,参考图10,所述步骤S102可以包括如下步骤:
步骤S1021,统计所述数字信号幅值超出数字信号最大输出阈值的极值点的数量;
步骤S1022,若统计得到的所述极值点的数量为单个,则根据所述极值点确定压制区间,并对所述待处理的当前帧数据落入所述压制区间的部分进行软压制处理。
具体地,所述极值点是指:数字信号的时域波形中,数字信号幅值超出数字信号最大输出阈值的波峰的极大值或波谷的极小值。
进一步,当极值点的数量为单个时,表明当前帧数据中仅单个波峰(或波谷)超出数字信号最大输出阈值,如图8中的波峰f。相应的,在所述步骤S1022中,可以将时域上位于该极值点前后的预设数量的采样点确定为所述压制区间,并对这些采样点以及极值点做软压制处理。
进一步,软压制处理时,每个采样点上的增益可以是不同的。也就是说,所述压制区间内包括多个采样点,同一压制区间内,至少一个采样点的增益不同于其他采样点的增益,其中,所述增益用于表征对采样点的压制幅度。所述增益可以为负值,以表征向下降低的幅度。
进一步,对于仅统计到单个波峰或波谷的情形,极值点的增益的绝对值最大,越往压制区间的两边则采样点的增益的绝对值越小。
进一步,每一压制区间内,极值点的增益的绝对值大于其他采样点的增益的绝对值。
例如,波峰f的极大值减去10,而极大值前后的采样点只要减去8。由此,可以在保持波峰f整体走势不变的前提下,将波峰f整体地压制到数字信号最大输出阈值以下。
进一步,所述预设数量的具体数值可以与交叠处包括的采样点的数量相关。例如,假设交叠处包括48个采样点,实验表明该交叠处至少会有一个波峰波谷,则预设数量可以12个采样点。也即,将每个波峰或波谷前后各12个采样点确定为该波峰或波谷的压制区间。
在一个具体实施中,在所述压制区间内,极值点的增益可以用于将所述极值点的数字信号幅值压制至等于所述数字信号最大输出阈值。相应的,压制区间内其他采样点的增益可以根据极值点的增益确定,其他采样点的增益根据距离极值点的距离不同,给予不同权重。以确定压制区间内的各采样点整体平滑地被压制到数字信号最大输出阈值以下,且各采样点之间的数字信号幅值的大小相对关系不变。
在一个具体实施中,参考图11,所述步骤S102可以包括如下步骤:
步骤S1021,统计所述数字信号幅值超出数字信号最大输出阈值的极值点的数量;
步骤S1023,若统计得到的所述极值点的数量为多个,则将相邻两个极值点之间的区域确定为压制区间,并对所述待处理的当前帧数据落入各压制区间的部分分别进行软压制处理。
进一步,所述步骤S102还可以包括如下步骤:
步骤S1024,对于多个极值点中的首个极值点,将时域上位于所述极值点之前的区域也确定为压制区间,并对所述待处理的当前帧数据落入所述压制区间的部分进行软压制处理;
步骤S1025,对于多个极值点中的末个极值点,将时域上位于所述极值点之后的区域也确定为压制区间,并对所述待处理的当前帧数据落入所述压制区间的部分进行软压制处理。
其中,步骤S1022、步骤S1023和步骤S1024可以同步执行也可以异步执行,异步执行时,三者的先后执行顺序可以互换。
在本实施例中,若统计到多个极值点,表明可能多个超出数字信号最大输出阈值的波峰或波谷。一种可能的情况是一个波峰旁边有一个小毛刺,两者不是两个完全独立的波峰,则旁边有毛刺时的增益受波峰的极大值的增益的影响,如果将毛刺单独视作一个波峰则会被压制的比较狠,导致和旁边波峰的比例关系改变。因而,本实施将相邻两个极值点之间的区域整体地确定为一个压制区间进行整体压制,避免逐个波峰(或波谷)压制而导致的在某个极值点出现突变的问题。
当交叠处存在多个极值点时,另一种可能的情况是超出数字信号最大输出阈值的波峰和波谷(正负)交叉出现。则在本具体实施中,分别处理了第一个极值点的前若干点和最后一个极值点的后若干点,中间的若干极值点则根据相邻极值点计算增益,以确保相邻两个极值点之间的数据的连续性。
具体而言,可以根据首个极值点及其之前若干个采样点计算增益,以使首个极值点所在波峰(或波谷)的前一半整体压制且各采样点拟合形成的曲线的变化趋势保持局部相对不变。
进一步,可以根据末个极值点及其之后若干个采样点计算增益,以使末个极值点所在波峰(或波谷)的后一半整体压制且各采样点拟合形成的曲线的变化趋势保持局部相对不变。
进一步,对于剩余的极值点,每相邻两个极值点及两者之间的若干个采样点计算增益,以使相邻两个极值点之间的曲线段整体压制且变化趋势保持局部相对不变。
由此,对于每一压制区间,位于该压制区间内的采样点是整体性地考虑压制幅度的,以确保软压制处理前后当前帧数据的时域波形的变化趋势保持局部相对不变。进一步,由于每一压制区间的边界分别为相邻的两个极值点,使得软压制处理后这相邻两个极值点处不会发生突变。
进一步,对于每一压制区间,该压制区间内各个采样点的增益变化是平滑的。也即,某一采样点的增益大小随着该采样点与界定其所在压制区间边界的极值点之间的距离的变化而平稳变化,防止在压制区间的边界处发生突变。
在一个具体实施中,对于上述图10和图11中的步骤S1021,可以是专门针对当前帧数据的交叠处进行统计的。具体而言,所述交叠处是指当前帧数据与前一帧数据的交叠处,如图7所示。处理过程中,相邻两帧数据的交叠是前一帧的后48个点和当前帧的前48点交叠,当前帧的48点和下一帧的前48点交叠,是一个迭代过程。
在一个具体实施中,在所述步骤S102之后,本实施例所述破音消除方法还可以包括步骤:将处理后的当前帧数据进行数模转换以及模拟信号处理,以得到处理后的音频信号并输出。也即,将所述步骤S102处理得到的处理后的当前帧数据传输至图1中的模拟信号处理模块12,以继续后续处理。
由上,采用本实施方案能够在最大响度不变的前提下,有针对性的软压制超过数字信号最大输出阈值的数字信号的幅度,避免模拟信号失真,进而消除破音,改善音质,提升通话及音乐播放体验。进一步,区别于现有技术所采用的削顶限幅算法,在本实施方案中,由于处理前后当前帧数据的时域波形保持局部相对不变,利于避免音频信号在数字信号处理部分失真,使得消除破音的同时兼顾音质成为可能。
例如,图12示出采用本实施方案对图8所示时域波形进行软压制处理后的时域波形图。可以看到,图8中的波峰f被整体压制到数字信号最大输出阈值的范围内,且波峰f的整体波形走势保持不变。
又例如,图13示出采用本实施方案对图6所示整体时域波形进行软压制处理后的整体时域波形图。可以看到,图6中的所有超出数字信号最大输出阈值的部分均被整体压制到数字信号最大输出阈值的范围内,且整体时域波形的曲线走势保持局部相对不变。
由上,通过测试输出信号的总谐波失真,确定最大响度下的数字信号最大输出阈值和模拟信号增益。进一步,在最大响度不变的前提下,有针对性的软压制超过最大输出阈值的数字信号,避免模拟信号失真,进而消除破音,改善音质,提升通话及音乐播放体验。
图14是本发明实施例一种音频信号的破音消除装置的结构示意图。本领域技术人员理解,本实施例所述音频信号的破音消除装置2可以用于实施上述图9至图11所述实施例中所述的方法技术方案。
具体地,参考图14,本实施例所述音频信号的破音消除装置2可以包括:获取模块21,用于从接收到的音频信号中获取待处理的当前帧数据;软压制处理模块22,用于对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理,以得到处理后的当前帧数据,其中,软压制处理前后所述当前帧数据的时域波形保持局部相对不变。
关于所述音频信号的破音消除装置2的工作原理、工作方式的更多内容,可以参照上述图9至图11中的相关描述,这里不再赘述。
进一步地,本发明实施例还公开一种存储介质,其上存储有计算机程序所述计算机程序运行时执行上述图9至图11所示实施例中所述的方法技术方案。优选地,所述存储介质可以包括诸如非挥发性(non-volatile)存储器或者非瞬态(non-transitory)存储器等计算机可读存储介质。所述存储介质可以包括ROM、RAM、磁盘或光盘等。
进一步地,本发明实施例还公开一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行上述图9至图11所示实施例中所述的方法技术方案。具体地,所述终端可以为音频外放类终端,如手机等集成或外部耦接有语音播放模块的移动终端。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (12)

1.一种音频信号的破音消除方法,其特征在于,包括:
从接收到的音频信号中获取待处理的当前帧数据;
对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理,以得到处理后的当前帧数据,其中,软压制处理前后所述当前帧数据的时域波形保持局部相对不变;
其中,所述对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理包括:
统计所述数字信号幅值超出数字信号最大输出阈值的极值点的数量;
若统计得到的所述极值点的数量为单个,则根据所述极值点确定压制区间,并对所述待处理的当前帧数据落入所述压制区间的部分进行软压制处理。
2.根据权利要求1所述的破音消除方法,其特征在于,所述从接收到的音频信号中获取待处理的当前帧数据包括:
对所述音频信号进行分帧处理以得到多帧信号,其中相邻两帧信号存在交叠;
对于当前帧信号,将所述当前帧信号的数字信号处理结果确定为待处理的当前帧数据,其中,交叠部分的数字信号处理结果为当前帧信号的数字信号处理结果与相交叠的相邻帧信号的数字信号处理结果的叠加。
3.根据权利要求2所述的破音消除方法,其特征在于,所述数字信号幅值超出数字信号最大输出阈值的部分集中于所述交叠部分。
4.根据权利要求1所述的破音消除方法,其特征在于,所述对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理包括:
若统计得到的所述极值点的数量为多个,则将相邻两个极值点之间的区域确定为压制区间,并对所述待处理的当前帧数据落入各压制区间的部分分别进行软压制处理。
5.根据权利要求4所述的破音消除方法,其特征在于,所述对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理还包括:
对于多个极值点中的首个极值点,将时域上位于所述极值点之前的区域也确定为压制区间,并对所述待处理的当前帧数据落入所述压制区间的部分进行软压制处理;
对于多个极值点中的末个极值点,将时域上位于所述极值点之后的区域也确定为压制区间,并对所述待处理的当前帧数据落入所述压制区间的部分进行软压制处理。
6.根据权利要求1或4或5所述的破音消除方法,其特征在于,所述压制区间内包括多个采样点,同一压制区间内,至少一个采样点的增益不同于其他采样点的增益,其中,所述增益用于表征对采样点的压制幅度。
7.根据权利要求6所述的破音消除方法,其特征在于,每一压制区间内,极值点的增益的绝对值大于其他采样点的增益的绝对值。
8.根据权利要求6所述的破音消除方法,其特征在于,每一压制区间内,极值点的增益用于将所述极值点的数字信号幅值压制至等于所述数字信号最大输出阈值。
9.根据权利要求1所述的破音消除方法,其特征在于,还包括:
将处理后的当前帧数据进行数模转换以及模拟信号处理,以得到处理后的音频信号并输出。
10.一种音频信号的破音消除装置,其特征在于,包括:
获取模块,用于从接收到的音频信号中获取待处理的当前帧数据;
软压制处理模块,用于对所述待处理的当前帧数据中数字信号幅值超出数字信号最大输出阈值的部分进行软压制处理,以得到处理后的当前帧数据,其中,软压制处理前后所述当前帧数据的时域波形保持局部相对不变;
其中,所述软压制处理模块执行如下步骤:
统计所述数字信号幅值超出数字信号最大输出阈值的极值点的数量;
若统计得到的所述极值点的数量为单个,则根据所述极值点确定压制区间,并对所述待处理的当前帧数据落入所述压制区间的部分进行软压制处理。
11.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1至9任一项所述方法的步骤。
12.一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序时执行权利要求1至9任一项所述方法的步骤。
CN202011024085.9A 2020-09-25 2020-09-25 音频信号的破音消除方法及装置、存储介质、终端 Active CN112153533B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011024085.9A CN112153533B (zh) 2020-09-25 2020-09-25 音频信号的破音消除方法及装置、存储介质、终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011024085.9A CN112153533B (zh) 2020-09-25 2020-09-25 音频信号的破音消除方法及装置、存储介质、终端

Publications (2)

Publication Number Publication Date
CN112153533A CN112153533A (zh) 2020-12-29
CN112153533B true CN112153533B (zh) 2021-09-07

Family

ID=73897579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011024085.9A Active CN112153533B (zh) 2020-09-25 2020-09-25 音频信号的破音消除方法及装置、存储介质、终端

Country Status (1)

Country Link
CN (1) CN112153533B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102158774A (zh) * 2010-01-25 2011-08-17 Nxp股份有限公司 扬声器输出控制

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3991370A (en) * 1975-10-03 1976-11-09 John Pate Peak limiter
RU2468451C1 (ru) * 2008-10-29 2012-11-27 Долби Интернэшнл Аб Защита от ограничения сигнала с использованием заранее существующих метаданных коэффициента усиления аудиосигнала
US20130282372A1 (en) * 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing
US9559650B1 (en) * 2012-07-13 2017-01-31 MUSIC Group IP Ltd. Loudness limiter
US9661438B1 (en) * 2015-03-26 2017-05-23 Amazon Technologies, Inc. Low latency limiter
CN107181996A (zh) * 2017-05-08 2017-09-19 深圳市创锐实业有限公司 一种用于音箱的音频幅度限制的方法和装置
KR102356625B1 (ko) * 2017-06-19 2022-01-28 삼성전자주식회사 아날로그 출력의 특성을 향상시키기 위해 이득 제어 및 이득 압축을 수행하는 전자 회로 및 그것을 포함하는 전자 장치
CN107452399B (zh) * 2017-09-18 2020-09-15 腾讯音乐娱乐科技(深圳)有限公司 音频特征提取方法及装置
CN108540886A (zh) * 2018-04-17 2018-09-14 建荣半导体(深圳)有限公司 一种听力保护方法、系统、存储装置及蓝牙耳机
CN111525902B (zh) * 2020-06-02 2021-05-11 北京快鱼电子股份公司 一种音频限幅的方法和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102158774A (zh) * 2010-01-25 2011-08-17 Nxp股份有限公司 扬声器输出控制

Also Published As

Publication number Publication date
CN112153533A (zh) 2020-12-29

Similar Documents

Publication Publication Date Title
CN107124149B (zh) 一种音量调整方法、装置和设备
TWI463817B (zh) 可適性智慧雜訊抑制系統及方法
TWI535299B (zh) 低音強化系統及其方法
RU2520420C2 (ru) Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала
JP2008065090A (ja) ノイズサプレス装置
US10623854B2 (en) Sub-band mixing of multiple microphones
CN108922558B (zh) 一种语音处理方法、语音处理装置及移动终端
US11380312B1 (en) Residual echo suppression for keyword detection
JP6073456B2 (ja) 音声強調装置
CN113949955B (zh) 降噪处理方法、装置、电子设备、耳机及存储介质
Kates Modeling the effects of single-microphone noise-suppression
CN115348507A (zh) 脉冲噪声抑制方法、系统、可读存储介质及计算机设备
JP2004341339A (ja) 雑音抑圧装置
US20130301841A1 (en) Audio processing device, audio processing method and program
KR20240007168A (ko) 소음 환경에서 음성 최적화
JP2008309955A (ja) ノイズサプレス装置
CN112153533B (zh) 音频信号的破音消除方法及装置、存储介质、终端
JP4922427B2 (ja) 信号補正装置
CN112750451A (zh) 一种提升语音听感的降噪方法
Lezzoum et al. Noise reduction of speech signals using time-varying and multi-band adaptive gain control for smart digital hearing protectors
CN114023352B (zh) 一种基于能量谱深度调制的语音增强方法及装置
CN111477246A (zh) 语音处理方法、装置及智能终端
US20230360662A1 (en) Method and device for processing a binaural recording
JPH09311696A (ja) 自動利得調整装置
US11922933B2 (en) Voice processing device and voice processing method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant