CN115691537B - 一种耳机音频信号的分析与处理系统 - Google Patents

一种耳机音频信号的分析与处理系统 Download PDF

Info

Publication number
CN115691537B
CN115691537B CN202211688000.6A CN202211688000A CN115691537B CN 115691537 B CN115691537 B CN 115691537B CN 202211688000 A CN202211688000 A CN 202211688000A CN 115691537 B CN115691537 B CN 115691537B
Authority
CN
China
Prior art keywords
frequency
signal
time
audio signal
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211688000.6A
Other languages
English (en)
Other versions
CN115691537A (zh
Inventor
高安芳
穆天睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gansu Midi Acoustics Co ltd
Jiangsu Midi Acoustics Technology Co ltd
Original Assignee
Gansu Midi Acoustics Co ltd
Jiangsu Midi Acoustics Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gansu Midi Acoustics Co ltd, Jiangsu Midi Acoustics Technology Co ltd filed Critical Gansu Midi Acoustics Co ltd
Priority to CN202211688000.6A priority Critical patent/CN115691537B/zh
Publication of CN115691537A publication Critical patent/CN115691537A/zh
Application granted granted Critical
Publication of CN115691537B publication Critical patent/CN115691537B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Stereophonic System (AREA)

Abstract

本发明公开了一种耳机音频信号的分析与处理系统,具体涉及音频信号处理领域,包括短时分析模块、加窗模块、频域分析模块和时频分析模块,所述短时分析模块用于对音频信号进行分帧,使一段音频信号成为平稳的信号,所述加窗模块使分帧后的信号变得连续,减少与原始信号的误差,所述频域分析模块通过将音频信号分成不同分辨率的分量缩小分析范围。本发明采用倒谱对两音频的混合信号分析,倒频谱分析法是基于傅里叶变换的一种分析方法,一个信号和延迟缩放副本之和的对数傅里叶频谱,是由信号的对数频谱加一个和回波相关的周期成分构成的。

Description

一种耳机音频信号的分析与处理系统
技术领域
本发明涉及音频信号处理技术领域,更具体地说,本发明涉及一种耳机音频信号的分析与处理系统。
背景技术
在耳机系统中最重要的衡量指标就是信噪比和失真,信噪比就是信号功率和噪声功率的比值,主要影响信噪比的是噪声和系统特性,而噪声影响系统内部信号,噪声是一种随机变量,一般来自于设备的各个元器件,电路中的噪声主要来源于电阻内电子的热运动和晶体管中带电粒子不规则的运动造成的,这属于系统的固有内部噪声,更广义的噪声是指除有用信号之外的所有其他信号,不仅仅包括内部固有噪声,更包括外部的干扰噪声,比如说耳机的噪声主要是来自于周围环境的噪声。除了噪声之外,重要的就是非线性失真了,主要表现在信号在放大或者传输过程中波形的标准发生变化,主要原因是在耳机中的有源器件比如晶体管的特性是非线性的,在放大过程中总会失真。
发明内容
为了克服现有技术的上述缺陷,本发明的实施例提供一种耳机音频信号的分析与处理系统,通过频域分析模块,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:包括短时分析模块、加窗模块、频域分析模块和时频分析模块,所述短时分析模块用于对音频信号进行分帧,使一段音频信号成为平稳的信号,所述加窗模块使分帧后的信号变得连续,减少与原始信号的误差,所述频域分析模块通过将音频信号分成不同分辨率的分量缩小分析范围,提取不同分辨率的信号分量相当于分解数据在不同时间尺度上的变化,在不同频带上进行分析,所述时频分析模块同时描述信号在不同时间和频率的能量密度以及强度,时间和频率的联合函数称为时频分布,利用时频分布分析音频信号能够得到各个时刻的瞬时频率以及幅值。
在一个优选地实施方式中,所述短时分析模块是音频信号分析和处理过程中的关键,音频信号本身和表征其本质的特征参数都是随时间变化的,属于非平稳信号,将音频信号切分为一系列小段进行分析和提取特征参数,每一小段为一帧,长度称为帧长,整段音频信号的特征参数是由每一帧特征参数组成特征参数时间序列所构成的,音频交叠分段之后后一帧的起始部分和前一帧的末尾部分相同,交叠部分平缓过渡了帧之间的差距,连续性更好。
在一个优选地实施方式中,所述加窗模块用有限窗函数
Figure 165829DEST_PATH_IMAGE001
依次乘以分帧后的每一帧音频信号x(n)即:
Figure 551811DEST_PATH_IMAGE002
其中,
Figure 800390DEST_PATH_IMAGE003
为加窗后的语音信号,窗函数表达式为:
Figure 930020DEST_PATH_IMAGE004
不同特征参数和不同的短时分析方法所需要的窗函数不一样,采样周期
Figure 213233DEST_PATH_IMAGE005
=1//>
Figure 770117DEST_PATH_IMAGE006
,频率分辨率∆/>
Figure 4527DEST_PATH_IMAGE007
和窗函数长度N之间存在下列关系:
Figure 672268DEST_PATH_IMAGE008
采样频率
Figure 75568DEST_PATH_IMAGE006
固定时采样周期/>
Figure 537773DEST_PATH_IMAGE005
也就不变,频率分辨率∆/>
Figure 26523DEST_PATH_IMAGE007
会随窗函数长度N的增大而降低。
在一个优选地实施方式中,所述频域分析模块是音频分析的重要内容,频域分析的主要依据是频率响应特性曲线图,频率响应曲线图反映了音频设备在整个音频范围内的频率响应的分布情况,曲线峰值处的频率成分,回放声压大、声压强,曲线谷底处频率成分声压小、声音弱,信号的频率分析方法包括频谱、能量谱、功率谱,倒频谱以及小波分析,频谱是将信号做傅里叶变换,通过傅里叶变换及其反变换,能够得到信号的傅里叶频谱、功率谱、倒频谱,频谱也是随时间变化的,需要采用短时分析技术,短时傅里叶变换定义为:
Figure 232377DEST_PATH_IMAGE009
实际计算中,先把
Figure 224604DEST_PATH_IMAGE010
·/>
Figure 123289DEST_PATH_IMAGE001
看成一个周期,先进行周期性扩展后,对它作离散傅里叶变换,其中/>
Figure 833757DEST_PATH_IMAGE011
为信号经过中心频率得到的响应,/>
Figure 843301DEST_PATH_IMAGE012
表示音频信号经过处理后的函数,当窗函数的长度为N时,/>
Figure 454148DEST_PATH_IMAGE010
·/>
Figure 523736DEST_PATH_IMAGE001
的长度也为N,/>
Figure 987078DEST_PATH_IMAGE013
(k)的长度为2N,对信号/>
Figure 534734DEST_PATH_IMAGE010
的短时自相关函数作傅里叶变换,对短时傅里叶变换所得频谱幅度作平方运算,就能够得到短时功率谱,/>
Figure 501553DEST_PATH_IMAGE014
为自相关函数,描述随机信号一个时刻与另一个时刻的依赖关系以及两个随机变量的相关性,/>
Figure 7621DEST_PATH_IMAGE015
为输入序列,jωm代表音频信号的阻抗,其中
Figure 427101DEST_PATH_IMAGE016
代表的是音频的短时功率谱:
Figure 44027DEST_PATH_IMAGE017
所述能量谱也叫能量谱密度,能量谱密度描述了信号以及时间序列的能量如何随频率分布,能量谱是原先傅里叶变换的平方,所述功率谱是功率谱密度函数的简称,它定义为单位频带内的信号功率,根据维纳辛钦定理证明一段信号的功率谱等于这段信号自相关函数的傅里叶变换,功率谱密度从物理意义上来讲就是单位频率内的信号能量,因为在时域中功率=功/时间,那么在频域功率=功/频率,功率谱密度曲线下面的面积就是这个信号的总能量,而信号的总能量是对所有幅值求平方和,所述倒频谱是一种基于频率定义的非线性刻度单位,表示人耳对音高变化的感官,能够将线性频率刻度赫兹换算为梅尔刻度,一个常用的公式是,其中m为梅尔频率,f为赫兹表示频度,当频率较小时梅尔频率随赫兹的变化快,频率大时梅尔频率上升缓慢:
Figure 865352DEST_PATH_IMAGE018
=2595/>
Figure 276742DEST_PATH_IMAGE019
所述倒频谱方便提取分析频谱图上的周期性信号,能将频谱图上成簇的边频带谱线简化为单根谱线,所述小波分析在低频部分采用较低的时间分辨率,提高频率分辨率;在高频部分,采用较低的频率分辨率来换取精确的时间定位,小波变换的实质是将信号在一个时域和频域上均具有局部化性质的平移伸缩小波权函数进行卷积,从而将信号分解成位于不同时间和频率上的各个成份。
在一个优选地实施方式中,所述时频分析模块描述了音频设备在时间轴上随事件的变化它的频域特性变化的情况,时频特性在频率的变化过程中描述了音频设备的响应状态,在事件的变化过程中描述了音频设备的响应状态,其表达式为:
Figure 947633DEST_PATH_IMAGE020
d/>
Figure 837091DEST_PATH_IMAGE021
du
通过用不同的和函数对分布时频二维卷积得出,利用平滑函数
Figure 44082DEST_PATH_IMAGE022
对分布进行卷积处理就能得到平滑分布,其表示式为:
Figure 626373DEST_PATH_IMAGE023
Figure 20445DEST_PATH_IMAGE024
常用的一个平滑函数是高斯核:
Figure 979174DEST_PATH_IMAGE025
其中
Figure 509512DEST_PATH_IMAGE026
为信号的魏格纳威利分布,/>
Figure 528284DEST_PATH_IMAGE027
是对信号进行截断得到的,/>
Figure 409652DEST_PATH_IMAGE028
表示的是多分量信号中分量之间的交叉项,信号中的分量成分越多,交叉项越多,/>
Figure 172072DEST_PATH_IMAGE029
中dx是关于x的微分,在一个含x的式子中对x求导,dy是关于y的微分,/>
Figure 321031DEST_PATH_IMAGE030
为窗口函数,/>
Figure 245125DEST_PATH_IMAGE022
函数是声波经过移位和伸缩后产生的,d/>
Figure 613789DEST_PATH_IMAGE021
du代表的是时延因子,t代表时间,u代表声速,s代表t时间内信号传播的距离,/>
Figure 914320DEST_PATH_IMAGE021
是倒频谱,/>
Figure 684830DEST_PATH_IMAGE031
代表采样周期内的音频信号,/>
Figure 514246DEST_PATH_IMAGE032
代表时间轴采样时间内的功率谱。
本发明的技术效果和优点:
为了解决音频中经常存在噪声干扰和时间延迟导致音频比对结果不准确的问题,针对常用算法中测量音频特征距离抗噪性能差的不足,采用倒谱对两音频的混合信号分析,倒频谱分析法是基于傅里叶变换的一种分析方法,一个信号与其延迟并缩放的副本之和的对数傅里叶频谱,是由信号的对数频谱加一个和回波相关的周期成分构成的,将对数频谱再一次做傅里叶分析,倒频谱是将对数频谱视为波形并进行进一步的傅里叶分析,即做对数频谱的离散傅里叶逆变换,倒频谱可以看作是频谱的频谱,其自变量的量纲是时间,因为它是对数频谱的傅里叶逆变换,但通常也被解释为频率,因为这里是对数频谱视为波形,这样可以把对数频谱中的周期成分显现出来,得到一个新的量证明回波的存在。
附图说明
图1为本发明的一种耳机音频信号的分析与处理系统的流程图。
图2为本发明的一种耳机音频信号的分析与处理系统的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本实施例提供了如图1所示一种耳机音频信号的分析与处理系统,包括短时分析模块、加窗模块、频域分析模块和时频分析模块,所述短时分析模块用于对音频信号进行分帧,使一段音频信号成为平稳的信号,所述加窗模块使分帧后的信号变得连续,减少与原始信号的误差,所述频域分析模块通过将音频信号分成不同分辨率的分量缩小分析范围,提取不同分辨率的信号分量相当于分解数据在不同时间尺度上的变化,在不同频带上进行分析,所述时频分析模块同时描述信号在不同时间和频率的能量密度以及强度,时间和频率的联合函数称为时频分布,利用时频分布分析音频信号能够得到各个时刻的瞬时频率以及幅值。
本实施例中,提供了如图1所示的一种耳机音频信号的分析与处理系统,具体包括下列步骤:
101、对音频信号进行分帧,使一段音频信号成为平稳的信号;
本实施例中,具体需要说明的是短时分析模块,所述短时分析模块是音频信号分析和处理过程中的关键,音频信号本身和表征其本质的特征参数都是随时间变化的,属于非平稳信号,将音频信号切分为一系列小段进行分析和提取特征参数,每一小段为一帧,长度称为帧长,整段音频信号的特征参数是由每一帧特征参数组成特征参数时间序列所构成的,音频交叠分段之后后一帧的起始部分和前一帧的末尾部分相同,交叠部分平缓过渡了帧之间的差距,连续性更好。
102、使分帧后的信号变得连续,减少与原始信号的误差;
本实施例中,具体需要说明的是加窗模块,所述加窗模块用有限窗函数
Figure 635786DEST_PATH_IMAGE001
依次乘以分帧后的每一帧音频信号x(n)即:
Figure 474429DEST_PATH_IMAGE002
其中,
Figure 99445DEST_PATH_IMAGE003
为加窗后的语音信号,窗函数表达式为:
Figure 365342DEST_PATH_IMAGE004
不同特征参数和不同的短时分析方法所需要的窗函数不一样,采样周期
Figure 708598DEST_PATH_IMAGE005
=1//>
Figure 872905DEST_PATH_IMAGE006
,频率分辨率∆/>
Figure 618007DEST_PATH_IMAGE007
和窗函数长度N之间存在下列关系:
Figure 54804DEST_PATH_IMAGE008
采样频率
Figure 885357DEST_PATH_IMAGE006
固定时采样周期/>
Figure 65803DEST_PATH_IMAGE005
也就不变,频率分辨率∆/>
Figure 665411DEST_PATH_IMAGE007
会随窗函数长度N的增大而降低。
103、将音频信号分成不同分辨率的分量缩小分析范围,提取不同分辨率的信号分量;
本实施例中,具体需要说明的是频域分析模块,所述频域分析模块是音频分析的重要内容,频域分析的主要依据是频率响应特性曲线图,频率响应曲线图反映了音频设备在整个音频范围内的频率响应的分布情况,曲线峰值处的频率成分,回放声压大、声压强,曲线谷底处频率成分声压小、声音弱,信号的频率分析方法包括频谱、能量谱、功率谱,倒频谱以及小波分析,频谱是将信号做傅里叶变换,通过傅里叶变换及其反变换,能够得到信号的傅里叶频谱、功率谱、倒频谱,频谱也是随时间变化的,需要采用短时分析技术,短时傅里叶变换定义为:
Figure 538689DEST_PATH_IMAGE009
实际计算中,先把
Figure 590959DEST_PATH_IMAGE010
·/>
Figure 575096DEST_PATH_IMAGE001
看成一个周期,先进行周期性扩展后,对它作离散傅里叶变换,其中/>
Figure 29211DEST_PATH_IMAGE011
为信号经过中心频率得到的响应,/>
Figure 73390DEST_PATH_IMAGE012
表示音频信号经过处理后的函数,当窗函数的长度为N时,/>
Figure 377070DEST_PATH_IMAGE010
·/>
Figure 899318DEST_PATH_IMAGE001
的长度也为N,/>
Figure 473519DEST_PATH_IMAGE013
(k)的长度为2N,对信号/>
Figure 423021DEST_PATH_IMAGE010
的短时自相关函数作傅里叶变换,对短时傅里叶变换所得频谱幅度作平方运算,就能够得到短时功率谱,/>
Figure 449883DEST_PATH_IMAGE014
为自相关函数,描述随机信号一个时刻与另一个时刻的依赖关系以及两个随机变量的相关性,/>
Figure 775822DEST_PATH_IMAGE015
为输入序列,/>
Figure 204529DEST_PATH_IMAGE033
代表音频信号的阻抗,其中
Figure 590511DEST_PATH_IMAGE016
代表的是音频的短时功率谱:
Figure 104669DEST_PATH_IMAGE034
所述能量谱也叫能量谱密度,能量谱密度描述了信号以及时间序列的能量如何随频率分布,能量谱是原先傅里叶变换的平方,所述功率谱是功率谱密度函数的简称,它定义为单位频带内的信号功率,根据维纳辛钦定理证明一段信号的功率谱等于这段信号自相关函数的傅里叶变换,功率谱密度从物理意义上来讲就是单位频率内的信号能量,因为在时域中功率=功/时间,那么在频域功率=功/频率,功率谱密度曲线下面的面积就是这个信号的总能量,而信号的总能量是对所有幅值求平方和,所述倒频谱是一种基于频率定义的非线性刻度单位,表示人耳对音高变化的感官,能够将线性频率刻度赫兹换算为梅尔刻度,一个常用的公式是,其中m为梅尔频率,f为赫兹表示频度,当频率较小时梅尔频率随赫兹的变化快,频率大时梅尔频率上升缓慢:
Figure 234299DEST_PATH_IMAGE018
=2595/>
Figure 517513DEST_PATH_IMAGE019
所述倒频谱方便提取分析频谱图上的周期性信号,能将频谱图上成簇的边频带谱线简化为单根谱线,所述小波分析在低频部分采用较低的时间分辨率,提高频率分辨率;在高频部分,采用较低的频率分辨率来换取精确的时间定位,小波变换的实质是将信号在一个时域和频域上均具有局部化性质的平移伸缩小波权函数进行卷积,从而将信号分解成位于不同时间和频率上的各个成份。
104、同时描述信号在不同时间和频率的能量密度以及强度,利用时频分布分析音频信号能够得到各个时刻的瞬时频率以及幅值;
本实施例中具体需要说明的是时频分析模块,所述时频分析模块描述了音频设备在时间轴上随事件的变化它的频域特性变化的情况,时频特性在频率的变化过程中描述了音频设备的响应状态,在事件的变化过程中描述了音频设备的响应状态,其表达式为:
Figure 572931DEST_PATH_IMAGE020
d/>
Figure 574385DEST_PATH_IMAGE021
du
通过用不同的和函数对分布时频二维卷积得出,利用平滑函数
Figure 242127DEST_PATH_IMAGE022
对分布进行卷积处理就能得到平滑分布,其表示式为:
Figure 379847DEST_PATH_IMAGE023
Figure 107632DEST_PATH_IMAGE024
常用的一个平滑函数是高斯核:
Figure 596382DEST_PATH_IMAGE025
其中
Figure 67815DEST_PATH_IMAGE026
为信号的魏格纳威利分布,/>
Figure 60041DEST_PATH_IMAGE027
是对信号进行截断得到的,/>
Figure 224306DEST_PATH_IMAGE028
表示的是多分量信号中分量之间的交叉项,信号中的分量成分越多,交叉项越多,/>
Figure 669194DEST_PATH_IMAGE029
中dx是关于x的微分,在一个含x的式子中对x求导,dy是关于y的微分,/>
Figure 944318DEST_PATH_IMAGE030
为窗口函数,/>
Figure 322210DEST_PATH_IMAGE022
函数是声波经过移位和伸缩后产生的,d/>
Figure 624753DEST_PATH_IMAGE021
du代表的是时延因子,t代表时间,u代表声速,s代表t时间内信号传播的距离,/>
Figure 88095DEST_PATH_IMAGE021
是倒频谱,/>
Figure 635751DEST_PATH_IMAGE031
代表采样周期内的音频信号,/>
Figure 868149DEST_PATH_IMAGE032
代表时间轴采样时间内的功率谱。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种耳机音频信号的分析与处理系统,其特征在于:包括短时分析模块、加窗模块、频域分析模块和时频分析模块,所述短时分析模块用于对音频信号进行分帧,使一段音频信号成为平稳的信号,所述加窗模块使分帧后的信号变得连续,减少与原始信号的误差,所述频域分析模块通过将音频信号分成不同分辨率的分量缩小分析范围,提取不同分辨率的信号分量相当于分解数据在不同时间尺度上的变化,在不同频带上进行分析,所述时频分析模块同时分析信号在不同时间和频率的能量密度以及强度,时间和频率的联合函数称为时频分布,利用时频分布分析音频信号能够得到各个时刻的瞬时频率以及幅值;
所述时频分析模块描述了音频设备在时间轴上随事件的变化它的频域特性变化的情况,时频特性在频率的变化过程中描述了音频设备的响应状态,在事件的变化过程中描述了音频设备的响应状态,其表达式为:
Figure QLYQS_1
通过用不同的和函数对分布时频二维卷积得出,利用平滑函数对分布进行卷积处理就能得到平滑分布,其表示式为:
Figure QLYQS_2
Figure QLYQS_3
常用的一个平滑函数是高斯核:
Figure QLYQS_4
其中
Figure QLYQS_6
为信号的魏格纳威利分布,/>
Figure QLYQS_8
是对信号进行截断得到的,/>
Figure QLYQS_11
表示的是多分量信号中分量之间的交叉项,信号中的分量成分越多,交叉项越多,/>
Figure QLYQS_7
中dx是关于x的微分,在一个含x的式子中对x求导,dy是关于y的微分,/>
Figure QLYQS_9
为窗口函数,/>
Figure QLYQS_12
函数是声波经过移位和伸缩后产生的,
Figure QLYQS_14
代表的是时延因子,t代表时间,u代表声速,s代表t时间内信号传播的距离,/>
Figure QLYQS_5
是倒频谱,/>
Figure QLYQS_10
代表采样周期内的音频信号,/>
Figure QLYQS_13
代表时间轴采样时间内的功率谱。
2.根据权利要求1所述的一种耳机音频信号的分析与处理系统,其特征在于:所述短时分析模块将音频信号切分为一系列小段进行分析和提取特征参数,每一小段为一帧,长度称为帧长,整段音频信号的特征参数是由每一帧特征参数组成特征参数时间序列所构成的,音频交叠分段之后后一帧的起始部分和前一帧的末尾部分吻合,交叠部分平缓过渡了帧之间的差距,连续性更好。
3.根据权利要求1所述的一种耳机音频信号的分析与处理系统,其特征在于:所述加窗模块用有限窗函数
Figure QLYQS_15
依次乘以分帧后的每一帧音频信号x(n)即:
Figure QLYQS_16
其中,
Figure QLYQS_17
为加窗后的语音信号,窗函数表达式为:
Figure QLYQS_18
不同特征参数和不同的短时分析方法所需要的窗函数不一样,采样周期
Figure QLYQS_19
,频率分辨率/>
Figure QLYQS_20
和窗函数长度N之间存在下列关系:
Figure QLYQS_21
采样频率
Figure QLYQS_22
固定时采样周期Ts也就不变,频率分辨率/>
Figure QLYQS_23
会随窗函数长度N的增大而降低。
4.根据权利要求1所述的一种耳机音频信号的分析与处理系统,其特征在于:所述频域分析模块是音频分析的重要内容,频域分析的主要依据是频率响应特性曲线图,频率响应曲线图反映了音频设备在整个音频范围内的频率响应的分布情况,曲线峰值处的频率成分,回放声压大、声压强,曲线谷底处频率成分声压小、声音弱,信号的频率分析方法包括频谱、能量谱、功率谱,倒频谱以及小波分析,频谱是将信号做傅里叶变换,通过傅里叶变换及其反变换,能够得到信号的傅里叶频谱、功率谱、倒频谱,频谱也是随时间变化的,需要采用短时分析技术,短时傅里叶变换定义为:
Figure QLYQS_24
实际计算中,先把
Figure QLYQS_25
看成一个周期,先进行周期性扩展后,对它作离散傅里叶变换,其中/>
Figure QLYQS_26
为信号经过中心频率得到的响应,/>
Figure QLYQS_27
表示音频信号经过处理后的函数,jωm代表音频信号的阻抗。
5.根据权利要求4所述的一种耳机音频信号的分析与处理系统,其特征在于:所述频域分析模块当窗函数的长度为N时,
Figure QLYQS_28
的长度也为N,Rn(k)的长度为2N,对信号
Figure QLYQS_29
的短时自相关函数作傅里叶变换,对短时傅里叶变换所得频谱幅度作平方运算,就能够得到短时功率谱,Rn(k)为自相关函数,描述随机信号一个时刻与另一个时刻的依赖关系以及两个随机变量的相关性,/>
Figure QLYQS_30
为输入序列,其中/>
Figure QLYQS_31
代表的是音频的短时功率谱:
Figure QLYQS_32
所述能量谱也叫能量谱密度,能量谱密度描述了信号以及时间序列的能量如何随频率分布,能量谱是原先傅里叶变换的平方,所述功率谱是功率谱密度函数的简称,它定义为单位频带内的信号功率,根据维纳辛钦定理证明一段信号的功率谱等于这段信号自相关函数的傅里叶变换,功率谱密度从物理意义上来讲就是单位频率内的信号能量,因为在时域中功率=功/时间,那么在频域功率=功/频率,功率谱密度曲线下面的面积就是这个信号的总能量,而信号的总能量是对所有幅值求平方和,所述倒频谱是一种基于频率定义的非线性刻度单位,表示人耳对音高变化的感官,能够将线性频率刻度赫兹换算为梅尔刻度,一个常用的公式是
Figure QLYQS_33
,其中m为梅尔频率,f为赫兹表示频度,当频率小时梅尔频率随赫兹的变化快,频率大时梅尔频率上升缓慢。
6.根据权利要求4所述的一种耳机音频信号的分析与处理系统,其特征在于:所述倒频谱方便提取分析频谱图上的周期性信号,能将频谱图上成簇的边频带谱线简化为单根谱线,所述小波分析在低频部分采用较低的时间分辨率,提高频率分辨率;在高频部分,采用较低的频率分辨率来换取精确的时间定位,小波变换的实质是将信号在一个时域和频域上均具有局部化性质的平移伸缩小波权函数进行卷积,从而将信号分解成位于不同时间和频率上的各个成份。
CN202211688000.6A 2022-12-28 2022-12-28 一种耳机音频信号的分析与处理系统 Active CN115691537B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211688000.6A CN115691537B (zh) 2022-12-28 2022-12-28 一种耳机音频信号的分析与处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211688000.6A CN115691537B (zh) 2022-12-28 2022-12-28 一种耳机音频信号的分析与处理系统

Publications (2)

Publication Number Publication Date
CN115691537A CN115691537A (zh) 2023-02-03
CN115691537B true CN115691537B (zh) 2023-06-23

Family

ID=85056670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211688000.6A Active CN115691537B (zh) 2022-12-28 2022-12-28 一种耳机音频信号的分析与处理系统

Country Status (1)

Country Link
CN (1) CN115691537B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102342858A (zh) * 2010-08-06 2012-02-08 上海中医药大学 中医声诊采集与分析系统
WO2015111084A2 (en) * 2014-01-27 2015-07-30 Indian Institute Of Technology Bombay Dynamic range compression with low distortion for use in hearing aids and audio systems
CN105931649A (zh) * 2016-03-31 2016-09-07 欧仕达听力科技(厦门)有限公司 基于频谱分析的超低时延音频处理方法与系统
CN109036458A (zh) * 2018-08-22 2018-12-18 昆明理工大学 一种基于音频特征参数的多语种场景分析方法
CN112710486B (zh) * 2019-10-24 2022-01-25 广东美的白色家电技术创新中心有限公司 设备故障检测方法、设备故障检测装置及计算机存储介质

Also Published As

Publication number Publication date
CN115691537A (zh) 2023-02-03

Similar Documents

Publication Publication Date Title
US8160732B2 (en) Noise suppressing method and noise suppressing apparatus
EP1772713A1 (en) Impulse-responsive measurement method and device
Sharma et al. An empirical wavelet transform-based approach for cross-terms-free Wigner–Ville distribution
CN110808057A (zh) 一种基于约束朴素生成对抗网络的语音增强方法
Wang et al. Denoising speech based on deep learning and wavelet decomposition
CN105679321B (zh) 语音识别方法、装置及终端
CN110687595B (zh) 一种基于时间重采样和同步挤压变换的地震数据处理方法
CN101131819A (zh) 噪声除去装置、方法以及程序
CN113281809B (zh) 一种地震信号的谱分析方法
CN115691537B (zh) 一种耳机音频信号的分析与处理系统
Ashraf et al. Ambient-noise free generation of clean underwater ship engine audios from hydrophones using generative adversarial networks
Bahadur et al. Performance measurement of a hybrid speech enhancement technique
Rao et al. Speech enhancement using sub-band cross-correlation compensated Wiener filter combined with harmonic regeneration
Razzaq et al. Instantaneous Frequency Estimation for Frequency-Modulated Signals under Gaussian and Symmetric α-Stable Noise
WO2022078164A1 (zh) 一种音质评估方法、装置和设备
Hamid et al. Single Channel Speech Enhancement Using Adaptive Soft‐Thresholding with Bivariate EMD
CN106997766B (zh) 一种基于宽带噪声的同态滤波语音增强方法
Faisal et al. Suppression of false-terms in wigner-ville distribution using time and frequency windowing
Singh et al. A wavelet based method for removal of highly non-stationary noises from single-channel hindi speech patterns of low input SNR
Kumar et al. Noise Reduction Algorithm for Speech Enhancement
Singh et al. Binary mask based method for enhancement of mixed noise speech of low SNR input
CN110610724A (zh) 基于非均匀子带分离方差的语音端点检测方法及装置
Weiqing et al. Research on Speech Enhancement Algorithm Based on EMD in Noisy Environments
Sudheer Kumar et al. Noise Reduction in Audio File Using Spectral Gatting and FFT by Python Modules
MILIVOJEVIC et al. Optimization Parameter of the 1P Keys Interpolation Kernel Implemented in the Correlation Algorithm for Estimating the Fundamental Frequency of the Speech Signal

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant