CN111724808A - 音频信号处理方法、装置、终端及存储介质 - Google Patents

音频信号处理方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN111724808A
CN111724808A CN201910204191.6A CN201910204191A CN111724808A CN 111724808 A CN111724808 A CN 111724808A CN 201910204191 A CN201910204191 A CN 201910204191A CN 111724808 A CN111724808 A CN 111724808A
Authority
CN
China
Prior art keywords
audio signal
signal
processing
frame
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910204191.6A
Other languages
English (en)
Inventor
陈岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201910204191.6A priority Critical patent/CN111724808A/zh
Publication of CN111724808A publication Critical patent/CN111724808A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请实施例公开了一种音频信号处理方法、装置、终端及存储介质,属于语音处理技术领域。该方法包括获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号;计算所述帧信号的频谱平滑度;确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。本申请实施例中,通过得到频域下的帧信号并进行频谱平滑度计算,对满足预设条件的帧信号进行增益处理,提高了语音处理的精确性和处理效率。

Description

音频信号处理方法、装置、终端及存储介质
技术领域
本申请实施例涉及语音处理技术,尤其涉及一种音频信号处理方法、装置、终端及存储介质。
背景技术
随着终端设备硬件以及音频处理技术的发展,终端设备可以进行音频信号的播放,其中音频信号为声波的频率、幅度变化信息的载体。
现有的音频信号处理算法中,如在LMS(Least Mean Square,最小均方误差)算法的基础上通过引入动量因子对音频信号进行处理的方式,其算法精度低、复杂度高、运算量大。
发明内容
本申请实施例提供了一种音频信号处理方法、装置、终端及存储介质,可以解决相关技术中,音频信号处理精度低、复杂度高、运算量大的问题。所述技术方案如下:
第一方面,本申请实施例提供了一种音频信号处理方法,包括:
获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号;
计算所述帧信号的频谱平滑度;
确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。
第二方面,本申请实施例还提供了一种音频信号处理装置,包括:
信号预处理模块,用于获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号;
平滑度计算模块,用于计算所述帧信号的频谱平滑度;
增益处理模块,用于确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。
第三方面,本申请实施例还提供了一种终端,包括:处理器、存储器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例所述的音频信号处理方法。
第四方面,本申请实施例还提供了一种包含终端可执行指令的存储介质,所述终端可执行指令在由终端处理器执行时用于执行本申请实施例所述的音频信号处理方法。
本申请实施例提供的方案中,通过获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号,计算所述帧信号的频谱平滑度,确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理,提高了语音处理的精确性和处理效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请一个示例性实施例提供的音频信号处理方法的流程图;
图2是本申请另一个示例性实施例提供的音频信号处理方法的流程图;
图3是本申请另一个示例性实施例提供的音频信号处理方法的流程图;
图4是本申请一个示例性实施例提供的音频信号处理装置的结构框图;
图5是本申请一个示例性实施例提供的终端的结构框图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
示例性的,本申请实施例所示的音频信号处理方法可以应用在终端中,该终端具备处理器、存储器。该终端可以包括服务器、电视、机顶盒、智能眼镜、智能手表、数码相机、MP4播放终端、MP5播放终端、学习机、点读机、电子词典、车载终端、虚拟现实(VirtualReality,VR)播放终端、增强现实(Augmented Reality,AR)播放终端、手机、平板电脑、膝上型电脑、台式电脑或电脑一体机等。
请参考图1,图1示出了本申请一个示例性实施例提供的音频信号处理方法的流程图,该方法包括:
步骤S101、获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号。
音频信号为声波的频率、幅度变化信息的载体,通过音频信号可以进行音频数据的传输,音频信号可由音频信号采集装置(如麦克风)进行采集。在本申请实施例中,该音频信号可以是用户发出的语音,其可被终端集成的信号采集装置所采集,该被采集的音频信号为模拟信号。
终端在采集音频信号时,如手机在免提状态下接收用户的语音,当回声消除处理不好时,或者当两台手机靠近时,同一频率的声音会进行不断叠加,在手机通话的另一端会产生刺耳是声音(即啸叫)。又如,用户通过语音聊天软件进行多人语音通话时,在回声消除技术处理失败时也会出现啸叫现象。
传统的啸叫抑制算法利用最小均方算法(LMS)构建陷波器来检测和消除啸叫,但是这种算法计算量较大,存在一定的延迟,在低延迟和复杂的通话场景下,不能起到较好的效果。
本申请实施例中,获取如麦克风采集的音频信号,对该音频信号进行预处理以得到其在频域下的帧信号。其中,原始的音频信号为时域信号,时域用于描述的是信号随时间变化的波形,而频域用于描述的是信号在频率方面的特性。示例性的,得到音频信号对应的频域下的帧信号的预处理方式包括对音频信号进行分帧、加窗处理,对处理结果进行傅里叶变换以得到时域的音频信号对应的频域下的帧信号。
步骤S102、计算所述帧信号的频谱平滑度。
本申请实施例中,在得到音频信号对应频域下的帧信号后,计算每一帧信号的频谱平滑度,其中频谱平滑度用于表征该帧信号的平滑情况,指在频率域上功率的相对变化,频谱平滑度的值越低(趋近于0)则产生啸叫的可能性越小,频谱平滑度的值越大(趋近于1),则该帧信号为啸叫信号的可能性越大,当确定出该帧信号为啸叫信号(即会产生啸叫现象)时需要进行啸叫抑制处理以避免啸叫现象的产生。
本申请一个实施例中,在得到音频信号对应的频域下的帧信号X(m,k)后,将所述帧信号X(m,k)划分为l个频带的信号Xb(m,k),其中b为第b个频带,b=0,1,2,3....l,示例性的l可以是20,bu为该频带的上频点,bl为该频带的下频点,示例性的每个频带假设有25个频点,bu为该频带的第1个频点,bl为该频带的第25个频点,其中每个频带的宽度为fs/l,每个频带包含的频点数w=N/l,其中fs为采样率,N为每帧的长度,k代表频点,k=0,1,2,3....N-1;计算帧信号的频谱平滑度γ(m,b)的计算公式如下:
Figure BDA0001998441170000041
步骤S103、确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。
本申请实施例中,可设置一啸叫阈值θ,当频谱平滑度的值大于该啸叫阈值θ时,可认定其满足预设条件,则对该帧信号进行增益处理。示例性的,该啸叫阈值的取值范围可以是0.1至0.3,具体可设置为0.15。
本申请实施例中,在得到音频信号对应的频域下的帧信号后,对每一帧信号依据前述S102中的公式计算频谱平滑度,如果满足条件则直接对该帧信号进行增益处理,无需还原为时域信号再对时域信号进行处理,同时,增益处理过程针对每一帧单独设定,处理精准度高,通过上述的频谱平滑度计算公式以及后续和啸叫阈值进行比对以判定是否需要进行增益处理,算法复杂度叫现有技术而言显著降低。
本申请实施例中,对所述帧信号进行增益处理包括:依据公式xm g(n)=gxm(n)对帧信号进行增益处理,其中,g为增益系数,取值范围包括0至0.5,xm(n)为音频信号对应的频域下的帧信号。
本申请实施例中,获取麦克风采集的音频信号,通过啸叫检测模块进行对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号,计算所述帧信号中每一帧的频谱平滑度,以检测该帧是否存在啸叫现象,如果检测出啸叫则将该帧信号送入啸叫抑制模块,即对该帧信号进行增益处理以得到啸叫抑制后的信号再送入CPU进行常规的音频信号处理,最终通过扬声器播放出该处理后的音频信号。如果未检测到啸叫现象,则不进行增益处理,或者将增益值设为1。
由上述可知,通过获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号,计算所述帧信号的频谱平滑度,确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理,其算法复杂度低,且直接针对频域下的帧信号进行处理,处理精度和处理效率均得以显著提高。
请参考图2,图2是本申请另一个示例性实施例提供的音频信号处理方法的流程图,对原步骤S101进一步进行了限定,具体如下:
步骤S201、获取音频信号,对所述音频信号进行分帧处理,对处理结果进行加窗处理后进行傅里叶变换得到和所述音频信号对应的频域下的帧信号。
用户语音的音频信号在宏观上是不平稳的,在微观上是平稳的,具有短时平稳性(10ms-30ms内可以认为用户语音的音频信号近似不变),而傅里叶变换要求输入的时域信号为平稳信号,故本申请实施例中首先对获取的音频信号进行分帧处理,本申请实施例中,在执行分帧处理时,并非采取互不交叠的连续截取的方式,而是采取具备一定交叠的方式进行分帧,如交叠50%,其中分帧的每帧长度N为整数,如采取N=512的方式进行分帧处理。
本申请实施例中,对音频信号x(n)进行分帧处理得到信号xm(n),其中n=0,1,2,3....N-1,m代表帧数为第m帧,N为每帧的长度。在分帧处理后,为了使全局更加连续,避免出现吉布斯效应,同时使原本没有周期性的语音信号呈现出周期函数的部分特征,进行了加窗处理,如可采用矩形窗、三角窗、Hanning窗、Hamming窗、Blackman窗等,本申请实施例中依据公式
Figure BDA0001998441170000051
对xm(n)进行加窗处理,其中,
Figure BDA0001998441170000052
对信号
Figure BDA0001998441170000053
进行傅里叶变换即:X(m,k)=FFT[xm(n)],得到频域下的帧信号X(m,k),其中,k代表频点,k=0,1,2,3....N-1。
步骤S202、计算所述帧信号的频谱平滑度。
本申请实施例中,将S201得到的帧信号X(m,k)划分为l个频带的信号Xb(m,k),其中b为第b个频带,b=0,1,2,3....l,每个频带的宽度为fs/l,每个频带包含的频点数w=N/l,其中fs为采样率;
依据公式
Figure BDA0001998441170000061
计算信号Xb(m,k)的频谱平滑度γ(m,b),其中,bu为频带上频点,bl为频带下频点。
步骤S203、确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。
本申请实施例中,其判定条件可依据如下公式:
Figure BDA0001998441170000062
其中,G取值为1则代表未检测到啸叫,取值为0则代表检测到啸叫,其中,具体判定条件为频谱平滑度γ(m,b)大于啸叫阈值θ。
本申请实施例中,依据公式
Figure BDA0001998441170000063
对帧信号进行增益处理,其中,g为增益系数,取值范围包括0至0.5,xm(n)为音频信号对应的频域下的帧信号。
由上述可知,本方案中合理高效的对音频信号中的啸叫信号进行检测并进行增益处理,有效的避免了啸叫现象的产生,提高了音频信号的通话、播放质量。
请参考图3,图3是本申请另一个示例性实施例提供的音频信号处理方法的流程图,对步骤S103进一步进行了限定,具体参见如下:
步骤S301、获取音频信号,对所述音频信号进行分帧处理,对处理结果进行加窗处理后进行傅里叶变换得到和所述音频信号对应的频域下的帧信号。
步骤S302、计算所述帧信号的频谱平滑度。
步骤S303、确定所述频谱平滑度是否满足预设条件,如果是,则确定所述音频信号对应的播放场景,根据所述播放场景确定增益系数值。
本申请实施例中,不同的音频信号播放场景对应不同的增益系数值,示例性的,如下表所示:
场景 增益值
游戏语音 0.2
电话通话 0.1
其中,在对音频信号进行处理的过程中,可针对终端正在运行的主程序判断该音频信号的播放场景,如运行有xx游戏语音软件,则确定当前场景为游戏语音场景,相应的可查表得到对应的增益值(如0.2)。
步骤S304、对所述帧信号进行增益处理,将增益处理后的音频信号输入至音频播放器进行播放。
由上述可知,本方案中合理高效的对音频信号中的啸叫信号进行检测并进行增益处理,在处理过程中根据不同的场景选取不同的增益值以使得处理结果符合更加符合当前的应用场景,如本申请实施例中针对电话通话设置较低的增益值以最大程度减少啸叫,而游戏语音场景中可稍微提高增益值以保证语音数据的真实性。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图4是本申请一个示例性实施例提供的音频信号处理装置的结构框图。该音频信号处理装置可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。该装置包括:
信号预处理模块101,用于获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号。
本申请实施例中,获取如麦克风采集的音频信号,对该音频信号进行预处理以得到其在频域下的帧信号。其中,原始的音频信号为时域信号,时域用于描述的是信号随时间变化的波形,而频域用于描述的是信号在频率方面的特性。示例性的,得到音频信号对应的频域下的帧信号的预处理方式包括对音频信号进行分帧、加窗处理,对处理结果进行傅里叶变换以得到时域的音频信号对应的频域下的帧信号。
用户语音的音频信号在宏观上是不平稳的,在微观上是平稳的,具有短时平稳性(10ms-30ms内可以认为用户语音的音频信号近似不变),而傅里叶变换要求输入的时域信号为平稳信号,故本申请实施例中首先对获取的音频信号进行分帧处理,本申请实施例中,在执行分帧处理时,并非采取互不交叠的连续截取的方式,而是采取具备一定交叠的方式进行分帧,如交叠50%,其中分帧的每帧长度N为整数,如采取N=512的方式进行分帧处理。
本申请实施例中,对音频信号x(n)进行分帧处理得到信号xm(n),其中n=0,1,2,3....N-1,m代表帧数为第m帧,N为每帧的长度。在分帧处理后,为了使全局更加连续,避免出现吉布斯效应,同时使原本没有周期性的语音信号呈现出周期函数的部分特征,进行了加窗处理,如可采用矩形窗、三角窗、Hanning窗、Hamming窗、Blackman窗等,本申请实施例中依据公式
Figure BDA0001998441170000081
对xm(n)进行加窗处理,其中,
Figure BDA0001998441170000082
对信号
Figure BDA0001998441170000083
进行傅里叶变换即:X(m,k)=FFT[xm(n)],得到频域下的帧信号X(m,k),其中,k代表频点,k=0,1,2,3....N-1。
平滑度计算模块102,用于计算所述帧信号的频谱平滑度。
本申请实施例中,在得到音频信号对应频域下的帧信号后,计算每一帧信号的频谱平滑度,其中频谱平滑度用于表征该帧信号的平滑情况,指在频率域上功率的相对变化,频谱平滑度的值越低(趋近于0)则产生啸叫的可能性越小,频谱平滑度的值越大(趋近于1),则该帧信号为啸叫信号的可能性越大,当确定出该帧信号为啸叫信号(即会产生啸叫现象)时需要进行啸叫抑制处理以避免啸叫现象的产生。
本申请一个实施例中,在得到音频信号对应的频域下的帧信号X(m,k)后,将所述帧信号X(m,k)划分为l个频带的信号Xb(m,k),其中b为第b个频带,b=0,1,2,3....l,示例性的l可以是20,bu为该频带的上频点,bl为该频带的下频点,示例性的每个频带假设有25个频点,bu为该频带的第1个频点,bl为该频带的第25个频点,其中每个频带的宽度为fs/l,每个频带包含的频点数w=N/l,其中fs为采样率,N为每帧的长度,k代表频点,k=0,1,2,3....N-1;计算帧信号的频谱平滑度γ(m,b)的计算公式如下:
Figure BDA0001998441170000084
增益处理模块103,用于确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。
本申请实施例中,可设置一啸叫阈值θ,当频谱平滑度的值大于该啸叫阈值θ时,可认定其满足预设条件,则对该帧信号进行增益处理。示例性的,该啸叫阈值的取值范围可以是0.1至0.3,具体可设置为0.15。
本申请实施例中,在得到音频信号对应的频域下的帧信号后,对每一帧信号依据前述公式计算频谱平滑度,如果满足条件则直接对该帧信号进行增益处理,无需还原为时域信号再对时域信号进行处理,同时,增益处理过程针对每一帧单独设定,处理精准度高,通过上述的频谱平滑度计算公式以及后续和啸叫阈值进行比对以判定是否需要进行增益处理,算法复杂度叫现有技术而言显著降低。
本申请实施例中,对所述帧信号进行增益处理包括:依据公式
Figure BDA0001998441170000091
对帧信号进行增益处理,其中,g为增益系数,取值范围包括0至0.5,xm(n)为音频信号对应的频域下的帧信号。
本申请实施例中,获取麦克风采集的音频信号,通过啸叫检测模块进行对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号,计算所述帧信号中每一帧的频谱平滑度,以检测该帧是否存在啸叫现象,如果检测出啸叫则将该帧信号送入啸叫抑制模块,即对该帧信号进行增益处理以得到啸叫抑制后的信号再送入CPU进行常规的音频信号处理,最终通过扬声器播放出该处理后的音频信号。如果未检测到啸叫现象,则不进行增益处理,或者将增益值设为1。
由上述可知,通过获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号,计算所述帧信号的频谱平滑度,确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理,其算法复杂度低,且直接针对频域下的帧信号进行处理,处理精度和处理效率均得以显著提高。
在一个可能的实施例中,所述信号预处理模块101具体用于:
对所述音频信号进行分帧处理,对处理结果进行加窗处理后进行傅里叶变换得到和所述音频信号对应的频域下的帧信号。
在一个可能的实施例中,所述信号预处理模块101具体用于:
对音频信号x(n)进行分帧处理得到信号xm(n),其中n=0,1,2,3....N-1,m代表帧数为第m帧,N为每帧的长度;
依据公式
Figure BDA0001998441170000092
对xm(n)进行加窗处理,其中,
Figure BDA0001998441170000093
对信号
Figure BDA0001998441170000101
进行傅里叶变换得到频域下的帧信号X(m,k),其中,k代表频点,k=0,1,2,3....N-1。
在一个可能的实施例中,所述平滑度计算模块102具体用于:
将所述帧信号X(m,k)划分为l个频带的信号Xb(m,k),其中b为第b个频带,b=0,1,2,3....l,每个频带的宽度为fs/l,每个频带包含的频点数w=N/l,其中fs为采样率;
依据公式
Figure BDA0001998441170000102
计算信号Xb(m,k)的频谱平滑度γ(m,b),其中,bu为频带上频点,bl为频带下频点。
在一个可能的实施例中,所述增益处理模块103具体用于:
确定所述频谱平滑度是否大于预设啸叫阈值θ。
在一个可能的实施例中,所述增益处理模块103具体用于:
依据公式
Figure BDA0001998441170000103
对帧信号进行增益处理,其中,g为增益系数,取值范围包括0至0.5,xm(n)为音频信号对应的频域下的帧信号。
在一个可能的实施例中,所述增益处理模块103还用于:
确定所述音频信号对应的播放场景,根据所述播放场景确定增益系数值;
播放模块104,用于在对所述帧信号进行增益处理之后,将增益处理后的音频信号输入至音频播放器进行播放。
请参考图5,图5是本申请一个示例性实施例提供的终端的结构框图。该终端包括处理器201和存储器202。
处理器201可以是中央处理器(英文:central processing unit,CPU),网络处理器(英文:network processor,NP)或者CPU和NP的组合。处理器201还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integratedcircuit,ASIC),可编程逻辑器件(英文:programmable logic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,FPGA),通用阵列逻辑(英文:generic array logic,GAL)或其任意组合。
存储器202通过总线或其它方式与处理器201相连,存储器202中存储有至少一条指令、至少一段程序、代码集或指令集,上述至少一条指令、至少一段程序、代码集或指令集由处理器201加载并执行以实现如上各个实施例所述的音频信号处理方法。存储器202包括易失性存储器(英文:volatile memory)和非易失性存储器(英文:non-volatile memory)。易失性存储器可以为随机存取存储器(英文:random-access memory,RAM),例如静态随机存取存储器(英文:static random access memory,SRAM),动态随机存取存储器(英文:dynamic random access memory,DRAM)。非易失性存储器可以为只读存储器(英文:readonly memory image,ROM),例如可编程只读存储器(英文:programmable read onlymemory,PROM),可擦除可编程只读存储器(英文:erasable programmable read onlymemory,EPROM),电可擦除可编程只读存储器(英文:electrically erasableprogrammable read-only memory,EEPROM)。非易失性存储器也可以为快闪存储器(英文:flash memory),磁存储器,例如磁带(英文:magnetic tape),软盘(英文:floppy disk),硬盘。非易失性存储器也可以为光盘。
本申请实施例还提供了一种包含终端可执行指令的存储介质,该存储介质存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的音频信号处理方法。
本申请实施例还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的音频信号处理方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本申请实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.音频信号处理方法,其特征在于,包括:
获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号;
计算所述帧信号的频谱平滑度;
确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。
2.根据权利要求1所述的方法,其特征在于,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号包括:
对所述音频信号进行分帧处理,对处理结果进行加窗处理后进行傅里叶变换得到和所述音频信号对应的频域下的帧信号。
3.根据权利要求2所述的方法,其特征在于,对所述音频信号进行分帧处理,对处理结果进行加窗处理后进行傅里叶变换得到和所述音频信号对应的频域下的帧信号包括:
对音频信号x(n)进行分帧处理得到信号xm(n),其中n=0,1,2,3....N-1,m代表帧数为第m帧,N为每帧的长度;
依据公式
Figure FDA0001998441160000011
对xm(n)进行加窗处理,其中,
Figure FDA0001998441160000012
对信号
Figure FDA0001998441160000013
进行傅里叶变换得到频域下的帧信号X(m,k),其中,k代表频点,k=0,1,2,3....N-1。
4.根据权利要求3所述的方法,其特征在于,所述计算所述帧信号的频谱平滑度包括:
将所述帧信号X(m,k)划分为l个频带的信号Xb(m,k),其中b为第b个频带,b=0,1,2,3....l,每个频带的宽度为fs/l,每个频带包含的频点数w=N/l,其中fs为采样率;
依据公式
Figure FDA0001998441160000014
计算信号Xb(m,k)的频谱平滑度γ(m,b),其中,bu为频带上频点,bl为频带下频点。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述确定所述频谱平滑度是否满足预设条件包括:
确定所述频谱平滑度是否大于预设啸叫阈值θ。
6.根据权利要求1-4中任一项所述的方法,其特征在于,所述对所述帧信号进行增益处理包括:
依据公式
Figure FDA0001998441160000021
对帧信号进行增益处理,其中,g为增益系数,取值范围包括0至0.5,xm(n)为音频信号对应的频域下的帧信号。
7.根据权利要求6中任一项所述的方法,其特征在于,对所述帧信号进行增益处理之前,还包括:
确定所述音频信号对应的播放场景,根据所述播放场景确定增益系数值;
在对所述帧信号进行增益处理之后,还包括:
将增益处理后的音频信号输入至音频播放器进行播放。
8.音频信号处理装置,其特征在于,包括:
信号预处理模块,用于获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号;
平滑度计算模块,用于计算所述帧信号的频谱平滑度;
增益处理模块,用于确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。
9.一种终端,包括:处理器、存储器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的音频信号处理方法。
10.一种包含终端可执行指令的存储介质,其特征在于,所述终端可执行指令在由终端处理器执行时用于执行如权利要求1-7中任一项所述的音频信号处理方法。
CN201910204191.6A 2019-03-18 2019-03-18 音频信号处理方法、装置、终端及存储介质 Pending CN111724808A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910204191.6A CN111724808A (zh) 2019-03-18 2019-03-18 音频信号处理方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910204191.6A CN111724808A (zh) 2019-03-18 2019-03-18 音频信号处理方法、装置、终端及存储介质

Publications (1)

Publication Number Publication Date
CN111724808A true CN111724808A (zh) 2020-09-29

Family

ID=72562257

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910204191.6A Pending CN111724808A (zh) 2019-03-18 2019-03-18 音频信号处理方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN111724808A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022068440A1 (zh) * 2020-09-30 2022-04-07 腾讯科技(深圳)有限公司 啸叫抑制方法、装置、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1934897A (zh) * 2004-02-20 2007-03-21 松下电器产业株式会社 啸叫检测方法及装置、以及具有它们的音响装置
CN103260110A (zh) * 2012-02-16 2013-08-21 Jvc建伍株式会社 噪声降低装置、声音输入装置、无线通信装置及噪声降低方法
CN103903634A (zh) * 2012-12-25 2014-07-02 中兴通讯股份有限公司 激活音检测及用于激活音检测的方法和装置
CN104538029A (zh) * 2014-12-16 2015-04-22 重庆邮电大学 基于语音增强和改进pnsc的鲁棒语音识别方法及系统
CN105654955A (zh) * 2016-03-18 2016-06-08 华为技术有限公司 语音识别方法及装置
CN107180643A (zh) * 2016-03-11 2017-09-19 深圳市有信网络技术有限公司 一种啸叫声检测和消除系统
CN109068012A (zh) * 2018-07-06 2018-12-21 南京时保联信息科技有限公司 一种用于音频会议系统的双端通话检测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1934897A (zh) * 2004-02-20 2007-03-21 松下电器产业株式会社 啸叫检测方法及装置、以及具有它们的音响装置
CN103260110A (zh) * 2012-02-16 2013-08-21 Jvc建伍株式会社 噪声降低装置、声音输入装置、无线通信装置及噪声降低方法
CN103903634A (zh) * 2012-12-25 2014-07-02 中兴通讯股份有限公司 激活音检测及用于激活音检测的方法和装置
CN109119096A (zh) * 2012-12-25 2019-01-01 中兴通讯股份有限公司 一种vad判决中当前激活音保持帧数的修正方法及装置
CN104538029A (zh) * 2014-12-16 2015-04-22 重庆邮电大学 基于语音增强和改进pnsc的鲁棒语音识别方法及系统
CN107180643A (zh) * 2016-03-11 2017-09-19 深圳市有信网络技术有限公司 一种啸叫声检测和消除系统
CN105654955A (zh) * 2016-03-18 2016-06-08 华为技术有限公司 语音识别方法及装置
CN109068012A (zh) * 2018-07-06 2018-12-21 南京时保联信息科技有限公司 一种用于音频会议系统的双端通话检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孟子厚 等, 国防工业出版社 *
李康康: "声反馈抑制算法的研究与实现", 《中国优秀博硕士学位论文全文数据库》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022068440A1 (zh) * 2020-09-30 2022-04-07 腾讯科技(深圳)有限公司 啸叫抑制方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN111341336B (zh) 一种回声消除方法、装置、终端设备及介质
CN111951819A (zh) 回声消除方法、装置及存储介质
CN110956969B (zh) 直播音频处理方法、装置、电子设备和存储介质
KR20170053623A (ko) 사운드 소스들을 향상시키기 위한 방법 및 장치
US8498429B2 (en) Acoustic correction apparatus, audio output apparatus, and acoustic correction method
CN110809214B (zh) 音频播放方法、音频播放装置及终端设备
CN110556125B (zh) 基于语音信号的特征提取方法、设备及计算机存储介质
CN110782914B (zh) 信号处理方法、装置、终端设备及存储介质
CN108922517A (zh) 训练盲源分离模型的方法、装置及存储介质
CN114203163A (zh) 音频信号处理方法及装置
CN109074814B (zh) 一种噪声检测方法及终端设备
CN110956976B (zh) 一种回声消除方法、装置、设备及可读存储介质
US20120158401A1 (en) Music detection using spectral peak analysis
CN109727605B (zh) 处理声音信号的方法及系统
CN108810746A (zh) 一种音质优化方法、反馈降噪系统、耳机及存储介质
CN110503973B (zh) 音频信号瞬态噪音抑制方法、系统以及存储介质
CN111986694B (zh) 基于瞬态噪声抑制的音频处理方法、装置、设备及介质
CN111989934A (zh) 回声消除装置、回声消除方法、信号处理芯片及电子设备
CN112997249A (zh) 语音处理方法、装置、存储介质及电子设备
CN111724808A (zh) 音频信号处理方法、装置、终端及存储介质
CN107919136B (zh) 一种基于高斯混合模型的数字语音采样频率估计方法
CN109378012B (zh) 用于单通道语音设备录制音频的降噪方法及系统
CN114678038A (zh) 音频噪声检测方法、计算机设备和计算机程序产品
CN115662394A (zh) 语音提取方法、装置、存储介质及电子装置
JP6638248B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声信号処理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200929