CN116261086A - 声音信号处理方法、装置、设备及存储介质 - Google Patents

声音信号处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116261086A
CN116261086A CN202211101303.3A CN202211101303A CN116261086A CN 116261086 A CN116261086 A CN 116261086A CN 202211101303 A CN202211101303 A CN 202211101303A CN 116261086 A CN116261086 A CN 116261086A
Authority
CN
China
Prior art keywords
signal
virtual sound
frequency domain
stereo
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211101303.3A
Other languages
English (en)
Inventor
宋明辉
王红丽
韦莎丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhongke Lanxun Technology Co ltd
Original Assignee
Shenzhen Zhongke Lanxun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhongke Lanxun Technology Co ltd filed Critical Shenzhen Zhongke Lanxun Technology Co ltd
Priority to CN202211101303.3A priority Critical patent/CN116261086A/zh
Publication of CN116261086A publication Critical patent/CN116261086A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Abstract

本申请提供声音信号处理方法、装置、设备及存储介质,方法包括:获取待处理立体声频域信号;对待处理立体声频域信号进行空间信息分解,以得到多个虚拟声音信号,多个虚拟声音信号为不同空间方位对应的虚拟声音信号;根据多个虚拟声音信号以及多个虚拟声音信号各自对应的头部相关传递函数,对待处理立体声频域信号进行空间信息重建,以得到待处理立体声频域信号对应的频域输出信号,其中,目标虚拟声音信号对应的头部相关传递函数用于表征目标虚拟声音信号从目标虚拟声音信号对应的空间方位传递到头部的相位和频率响应,目标虚拟声音信号为多个虚拟声音信号中的任意一个虚拟声音信号。该技术方案使得立体声具有丰富的空间信息。

Description

声音信号处理方法、装置、设备及存储介质
技术领域
本申请涉及信号处理领域,尤其涉及声音信号处理方法、装置、设备及存储介质。
背景技术
立体声,是指具有立体感的声音。在日常生活中,人耳听到的自然界的声音即为立体声,声源具有确定的空间位置,人们凭借听觉可以感知各种声源在空间的位置分布情况,从而感受到声源相对头部的方位。
在音频处理技术中,通过由录音、传输和重放系统等组成的处理系统,将不同声源的空间位置反映出来,使得人们在听音频时能够基于人耳听觉特性获得声音空间分布印象,并产生临场感和立体感,通过这种处理系统处理得到的声音,即为立体声。在利用耳机播放立体声时,由于耳机无法像扬声器那样形成声场,会存在声像在头内进行定位的问题,这样就导致耳朵感知到的立体声的空间性不足,不能产生身临其境的感觉。
发明内容
本申请提供声音信号处理方法、装置、设备及存储介质,以解决耳机播放的立体声的空间性不足的技术问题。
第一方面,提供一种声音信号处理方法,包括:
获取待处理立体声频域信号;
对所述待处理立体声频域信号进行空间信息分解,以得到多个虚拟声音信号,所述多个虚拟声音信号为不同空间方位对应的虚拟声音信号;
根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,对所述待处理立体声频域信号进行空间信息重建,以得到所述待处理立体声频域信号对应的频域输出信号,其中,目标虚拟声音信号对应的头部相关传递函数用于表征所述目标虚拟声音信号从所述目标虚拟声音信号对应的空间方位传递到头部的相位和频率响应,所述目标虚拟声音信号为所述多个虚拟声音信号中的任意一个虚拟声音信号。
在该技术方案中,在获取到待处理立体声频域信号之后,通过对待处理立体声频域信号进行空间信息分解,得到多个不同空间方位处的虚拟声音信号,可以实现对不同方位的虚拟声源的模拟;然后根据多个不同空间方位处的虚拟声音信号和多个不同空间方位处的虚拟声音信号对应的头部相关传递函数,对待处理立体声频域信号进行空间信息重建,可以实现对这些不同方位的虚拟声源传输至人耳这一传输过程的模拟再现,因此,能使得重建得到的频域输出信号具有丰富的空间信息,在输出时能够给用户带来更强的虚拟环绕感和空间感。
结合第一方面,在一种可能的实现方式中,所述待处理立体声频域信号包括左声道频域信号和右声道频域信号;所述对所述待处理立体声频域信号进行空间信息分解,以得到多个空间方位各自对应的虚拟声音信号,包括:对所述左声道频域信号和所述右声道频域信号进行频谱分析,以确定目标位置角,所述目标位置角为使得信号相互之间的差异度最大的位置角;根据所述目标位置角、所述左声道频域信号和所述右声道频域信号,进行信号叠加与信号分解,以得到所述多个虚拟声音信号。通过基于信号相互之间的差异度最大的位置角来进行信号叠加与分解,得到多个虚拟声音信号,能使得分解得到的虚拟声音信号之间相互独立,进而使得能模拟得到的虚拟声源之间的空间特征差异更大,从而能够带来更强的空间感。
结合第一方面,在一种可能的实现方式中,所述多个虚拟声音信号包括幻象声源信号、左通道残余信号和右通道残余信号;所述根据所述目标位置角、所述左声道频域信号和所述右声道频域信号,进行信号叠加与信号分解,以得到所述多个虚拟声音信号,包括:根据所述目标位置角、所述左声道频域信号和所述右声道频域信号,进行信号叠加,以得到所述幻象声源信号;根据所述目标位置角、所述幻象声源信号和所述右声道频域信号,进行信号分解,以得到所述左通道残余信号;根据所述目标位置角、所述幻象声源信号和所述左声道频域信号,进行信号分解,以得到所述右通道残余信号。通过根据目标位置角、左声道频域信号和右声道频域信号进行信号叠加得到幻象声源信号,并根据目标位置角、幻象声源信号、左声道频域信号以及右声道频域信号进行信号分解,以此得到左通道残余信号和右通道残余信号,可以得到位置更精准的虚拟声源。
结合第一方面,在一种可能的实现方式中,所述多个虚拟声音信号包括幻象声源信号、左通道残余信号和右通道残余信号;所述根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,对所述待处理立体声频域信号进行空间信息重建,以得到所述待处理立体声频域信号对应的频域输出信号之前,还包括:获取第一位置角和第二位置角,所述第一位置角为左虚拟扬声器对应的位置角,所述第二位置角为右虚拟扬声器对应的位置角;根据所述第一位置角确定所述左通道残余信号对应的空间方位,并根据所述第二位置角确定所述右通道残余信号对应的空间方位;根据所述第一位置角、所述第二位置角以及所述目标位置角,确定所述幻象声源信号对应的空间方位。通过根据目标位置角和左、右虚拟扬声器所在的位置角来确定各个虚拟声源的空间方位,能够使得各个虚拟声源的空间方位差异更大,从而能够带来更强的空间感。
结合第一方面,在一种可能的实现方式中,所述根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,对所述待处理立体声频域信号进行空间信息重建,以得到所述待处理立体声频域信号对应的频域输出信号,包括:根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,确定目标入耳信号,所述目标入耳信号用于指示所述多个虚拟声音信号传递至头部处双耳接收到的混合信号;对所述目标入耳信号与所述待处理立体声频域信号进行混合处理,以得到所述频域输出信号。通过将各个虚拟声源传递至耳朵时的信号与待处理立体声频域信号进行混合处理,能够使得混合得到的频域输出信号携带各个虚拟声源的空间信息,从而具有更强的空间感。
结合第一方面,在一种可能的实现方式中,所述根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,确定目标入耳信号,包括:根据所述目标虚拟声音信号与所述目标虚拟声音信号对应的头部相关传递函数,确定所述目标虚拟声音信号对应的虚拟入耳信号,所述目标虚拟声音信号对应的虚拟入耳信号用于指示所述目标虚拟声音信号传递至头部处双耳接收到的信号;对所述多个虚拟声音信号各自对应的虚拟入耳信号进行信号叠加,以得到所述目标入耳信号。通过对各个虚拟声源传递至耳朵时的信号进行信号叠加,能够实现对多个虚拟声源传输至人耳的传输过程的模拟,从而使得目标入耳信号具有更强的真实性。
结合第一方面,在一种可能的实现方式中,所述对所述目标入耳信号与所述待处理立体声频域信号进行混合处理,以得到所述频域输出信号,包括:获取所述待处理立体声频域信号对应的立体声低频信号,所述立体声低频信号的频率低于预设频率;对所述目标入耳信号、所述待处理立体声频域信号以及所述立体声低频信号进行加权求和调制,以得到所述频域输出信号。通过对目标入耳信号、待处理立体声频域信号以及立体声低频信号进行加权求和调制,能够实现对待处理立体声频域信号的混合,从而使得频域输出信号具有更丰富的层次感。
第二方面,提供一种声音信号处理装置,包括:
获取模块,用于获取待处理立体声频域信号;
分解模块,用于对所述待处理立体声频域信号进行空间信息分解,以得到多个虚拟声音信号,所述多个虚拟声音信号为不同空间方位对应的虚拟声音信号;
重建模块,用于根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,对所述待处理立体声频域信号进行空间信息重建,以得到所述待处理立体声频域信号对应的频域输出信号,其中,目标虚拟声音信号对应的头部相关传递函数用于表征所述目标虚拟声音信号从所述目标虚拟声音信号对应的空间方位传递到头部的相位和频率响应,所述目标虚拟声音信号为所述多个虚拟声音信号中的任意一个虚拟声音信号。
第三方面,提供一种音频设备,包括存储器以及一个或多个处理器,所述存储器连接至所述一个或多个处理器,一个或多个处理器用于执行存储在存储器中的一个或多个计算机程序,一个或多个处理器在执行一个或多个计算机程序时,使得该音频设备实现上述第一方面的声音信号处理方法。
第四方面,提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序包括程序指令,上述程序指令当被处理器执行时使上述处理器执行上述第一方面的声音信号处理方法。
本申请可以实现如下技术效果:通过对待处理立体声频域信号进行空间信息分解,得到多个不同空间方位处的虚拟声音信号,可以实现对不同方位的虚拟声源的模拟;然后根据多个不同空间方位处的虚拟声音信号和多个不同空间方位处的虚拟声音信号对应的头部相关传递函数,对待处理立体声频域信号进行空间信息重建,可以实现对这些不同方位的虚拟声源传输至人耳这一传输过程的模拟再现,因此,能使得重建得到的频域输出信号具有丰富的空间信息,在输出时能够给用户带来更强的虚拟环绕感和空间感。
附图说明
图1为本申请实施例提供的一种声音信号处理方法的流程示意图;
图2是本申请实施例提供的一种音频数据处理装置的结构示意图;
图3是本申请实施例提供的一种音频设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
本申请的技术方案可适用于音频播放场景,具体可应用于对立体声进行处理后输出,以使得输出的立体声具有更强的空间感。其中,立体声可以是指通过立体声录音技术录制得到的声音。例如,可以是通过两个话筒以特定的摆放方式,对该两个话筒所处的场景中的声音进行录制得到的声音。本申请的技术方案可应用于耳机、喇叭、具有音频播放器的终端(如手机)等用于播放音频数据的音频设备。
本申请的技术原理如下:在输出立体声之前,先将输入的立体声信号转换到频域中,在频域中对输入的立体声进行空间信息分解,以提取出具有不同空间信息特征的虚拟声音信号,实现对虚拟声源的模拟;再结合虚拟声源和虚拟声源对应的头部相关传递函数,进行空间信息重建还原,实现对虚拟声源传输到人耳的传输过程的模拟再现,从而得到具有丰富的空间信息的频域信号;最后将频域信号转换到时域进行输出,从而使得输出的立体声信号具有更强的空间感,给用户带来身临其境的听音体验。
为便于理解,首先对本申请的技术方案涉及的部分概念进行介绍。
头部相关传递函数(head related transfer functions,HRTF),又可以称为解剖传递函数(anatomical transfer function,ATF),其描述了声波从声源到双耳的传输过程,用于表达人的生理结构(如头、耳廓以及躯干等)对声波进行综合滤波的结果。声源发出的声波经过人的生理结构散射后到达双耳的物理过程可视为一个线性时不变的声波系统,HRTF为这个声波系统的频域传输函数,其定义为:
Figure BDA0003840534270000061
Figure BDA0003840534270000062
其中,HL和HR分别为左耳和右耳对应的HRTF,PL、PR分别是点声源在听众的左、右耳产生的复数声压;Po是人头不存在时,头中心位置处的复数声压;r为声源到头中心的距离;θ是声源的水平方位角;
Figure BDA0003840534270000063
是声源的垂直方位角;ω是声波的角频率;α是一组与生理结构和尺寸相关的参数。声波到达头中心的传输路径不同,声波到达人耳所经过的传输介质不同,HRTF就不同;在头部中心位置固定不变的情况下,声源处于不同的空间位置,其对应不同的传输路径,因而对应不同的HRTF。
接下来介绍本申请的技术方案,参见图1,图1为本申请实施例提供的一种声音信号处理方法的流程示意图,该方法可以应用于前述提到的各种用于播放音频数据的音频设备,如图1所示,该方法包括如下步骤:
S101,获取待处理立体声频域信号。
这里,待处理立体声频域信号,是指需进行处理的立体声频域信号,待处理立体声频域信号可以由待处理立体声时域信号经过时频转换得到。立体声时域信号可以为通过立体声录音技术录制得到的原始声音信号,也可以为对通过立体声录音技术录制得到的原始声音信号进行信号加工处理(如剪辑、降噪等)得到的声音信号。待处理立体声时域信号可以是指需在音频设备中进行播放的立体声时域信号,也即输入至音频设备中的立体声时域信号;也可以是指其他场景下需进行处理的立体声时域信号。待处理立体声时域信号可以包括左声道时域信号和右声道时域信号;与之相对应地,待处理立体声频域信号也可以包括左声道频域信号和右声道频域信号,其中,左声道频域信号可以由左声道时域信号经过时频转换得到,右声道频域信号可以由右声道频域信号经过时频转换得到。
在一些可能的场景中,待处理立体声频域信号可以由待处理立体声时域信号经过傅里叶变换得到。上述获取待处理立体声频域信号具体包括:获取待处理立体声时域信号,对待处理立体声时域信号进行傅里叶变换,得到待处理立体声频域信号。
为了便于进行频谱分析和处理,在一些可能的实施方式中,可以通过离散傅里叶变换的方式对待处理立体声时域信号进行处理,得到待处理立体声频域信号,上述获取待处理立体声频域信号具体包括:获取待处理立体声时域信号,按照预设采样频率对待处理立体声时域信号进行采样,以得到待处理立体声时域采样信号;对待处理立体声时域采样信号进行离散傅里叶变换,以得到待处理立体声频域信号。其中,预设采样频率和离散傅里叶变换的点数可以根据需求进行设置,例如,可以将采样频率设置为44.1k赫兹(HZ),对左声道时域信号和右声道时域信号进行采样,得到左声道时域采样信号xl和右声道时域采样信号xr,然后按每帧取512个采样点,对左声道时域采样信号xl和右声道时域采样信号xr进行512点的离散傅里叶变换,得到左声道时域采样信号xl在频域上的表示Xl(即左声道频域信号)和右声道时域采样信号xr在频域上的表示Xr(即右声道频域信号)。
可选地,在对待处理立体声时域采样信号进行离散傅里叶变换,以得到待处理立体声频域信号之前,还可以对待处理立体声时域采样信号进行重叠加窗预处理,得到预处理立体声时域采样信号;在对待处理立体声时域采样信号进行离散傅里叶变换,以得到待处理立体声频域信号的过程中,对预处理立体声时域采样信号进行离散傅里叶变换,得到待处理立体声频域信号。例如,在得到左声道时域采样信号xl和右声道时域采样信号xr后,可以按每帧取512个采样点,相邻两帧之间存在50%的重叠的方式从左声道时域采样信号xl和右声道时域采样信号xr中抽取信号,并采用平方根汉宁窗对抽取到的每帧左声道时域采样信号xl和右声道时域采样信号xr进行处理,以得到预处理左声道时域采样信号和预处理右声道时域采样信号,然后对预处理左声道时域采样信号和预处理右声道时域采样信号进行512点的离散傅里叶变换,得到左声道频域信号和右声道频域信号。通过对对待处理立体声时域采样信号进行重叠加窗预处理的方式,能够实现对待处理立体声时域采样信号的幅度调制,并减轻频谱泄露,从而可以防止信号的丢失,有利于对待处理立体声频域信号进行更好地频谱分析。
可选地,也可以通过其他方式实现对待处理立体声时域信号的时频转换以得到待处理立体声频域信号,本申请不做限制。
S102,对待处理立体声频域信号进行空间信息分解,以得到多个虚拟声音信号。
这里,对待处理立体声频域信号进行空间信息分解,得到多个虚拟声音信号,是指通过对待处理立体声频域信号进行频谱分析的方式,确定出立体声中的声源定位线索,以及基于声源定位线索从待处理立体声频域信号中抽取出具有不同空间信息特征的频域信号,作为多个虚拟声音信号。其中,多个虚拟声音信号分别为不同空间方位对应的虚拟声音信号,可用于反映立体声录制过程中不同方位的声音信号。对待处理立体声频域信号进行频谱分析具体可包括对左声道频域信号和对右声道频域信号的频谱分析。
在一种可行的方式中,可以通过如下步骤A1-A2实现对待处理立体声频域信号的空间信息分解:
A1、对左声道频域信号和右声道频域信号进行频谱分析,以确定目标位置角。
其中,目标位置角为使得信号之间的差异度最大的位置角;目标位置角可以在多个虚拟声音信号满足相互独立的能量约束条件下求解得出。目标位置角的求解公式如下:
Figure BDA0003840534270000081
Figure BDA0003840534270000082
Figure BDA0003840534270000083
Figure BDA0003840534270000084
Figure BDA0003840534270000085
其中,Xl(k)为左声道频域信号,Xr(k)为右声道频域信号;γb为目标位置角,变量ρb表示左声道频域信号Xl(k)和右声道频域信号Xr(k)在处理频带b上的归一化相关系数,
Figure BDA0003840534270000086
表示左声道频域信号Xl(k)在处理频带b上的能量,/>
Figure BDA0003840534270000087
表示左声道频域信号Xr(k)在处理频带b上的能量,R表示取实部。
其中,处理频带b的带宽可基于左声道频域信号和右声道频域信号的频带带宽进行设定。在一些可能的场景中,在经过时频转换得到左声道频域信号和右声道频域信号后,可以按用“巴克标度”表示的临界频带(即Bark域)对每帧左声道频域信号和右声道频域信号的频带进行划分,以得到多个Bark域,然后将每个Bark域作为一个处理频带b,以确定每个Bark域各自对应的目标位置角。由于人耳结构大致会对24个频率点产生共振,声音信号在频带上也会呈现出24个临界频带,因此,可以将每帧左声道频域信号和右声道频域信号的频带划分为24个处理频带后进行目标位置角的求解。通过将每帧左声道频域信号和右声道频域信号的频带划分为临界频带后求解目标位置角,可以节省计算量,提高处理效率,另外,由于临界频带是人耳结构产生共振的频率点对应的频谱,通过将每帧左声道频域信号和右声道频域信号的频带划分为临界频带后进行频谱分析,也能使得分析得到的目标位置角符合人耳听觉结构,即使得目标位置角更加准确。
具体地,在获取到左声道频域信号和右声道频域信号在处理频带b上的频谱后,可以根据上述公式(4)分别计算左声道频域信号的能量
Figure BDA0003840534270000091
和右声道频域信号能量/>
Figure BDA0003840534270000092
以此得到σl,b和σr,b;然后根据上述公式(3)计算得到ρb,接着根据上述公式(2)计算得到vb,并根据上述公式(5)计算得到βb;最后根据上述公式(1)计算得到tan(γb),以此可计算得到目标位置角γb。通过计算使得多个虚拟声音信号相互之间的差异度最大的目标位置角,能够使得分解得到的虚拟声音信号互不相关,从而具有更强的方位区分性。
A2、根据目标位置角、左声道频域信号和右声道频域信号,进行信号叠加与分解,以得到多个虚拟声音信号。
这里,根据目标位置角、左声道频域信号和右声道频域信号,进行信号叠加与分解,得到多个虚拟声音信号,是指通过信号叠加和/或信号分解的方式,从左声道频域信号和右声道频域信号中提取出表征主信号的幻象声源信号和表征环境信号的残余信号。其中,主信号是指立体声录制过程中主声源发出的声音信号,主声源是指发出声音的主要声源,可以理解为立体声录制过程主要录制的声源,主信号例如可以为飞机起飞发出的声音、炮弹的声音等等;环境信号是指立体声录制过程中的其他声源发出的声音信号,其他声源是指录制环境中除去主声源外的环境声源。残余信号具体可包括左通道残余信号和右通道残余信号,分别用于表征左右方位上的环境信号。由此,多个虚拟声音信号包括幻象声源信号、左通道残余信号和右通道残余信号。
具体地,可以通过如下步骤A21-A23对左声道频域信号和右声道频域信号进行信号叠加与分解,得到多个虚拟声音信号:
A21、根据目标位置角、左声道频域信号和右声道频域信号,进行信号叠加,以得到幻象声源信号。
具体地,可以基于如下公式(6)计算得到幻象声源信号:
Figure BDA0003840534270000101
其中,S(k)为幻象声源信号,γb为目标位置角,Xl(k)为左声道频域信号,Xr(k)为右声道频域信号。
A22、根据目标位置角、幻象声源信号和右声道频域信号,进行信号分解,以得到左通道残余信号。
具体地,可以基于如下公式(7)计算得到左通道残余信号:
Dl(k)=sin(γb)S(k)-Xr(k) 公式(7)
其中,Dl(k)为左通道残余信号,S(k)为幻象声源信号,γb为目标位置角,Xr(k)为右声道频域信号。
A23、根据目标位置角、幻象声源信号和左声道频域信号,进行信号分解,以得到右通道残余信号。
具体地,可以基于如下公式(8)计算得到右通道残余信号:
Dr(k)=sin(γb)S(k)-Xl(k) 公式(8)
其中,Dr(k)为右通道残余信号,S(k)为幻象声源信号,γb为目标位置角,Xl(k)为左声道频域信号。
通过根据目标位置角、左声道频域信号和右声道频域信号进行信号叠加得到幻象声源信号,并根据目标位置角、幻象声源信号、左声道频域信号以及右声道频域信号进行信号分解,以此得到左通道残余信号和右通道残余信号,可以得到位置更精准的虚拟声源。通过基于信号相互之间的差异度最大的位置角来进行信号叠加与分解,得到多个虚拟声音信号,能使得分解得到的虚拟声音信号之间相互独立,进而使得能模拟得到的虚拟声源之间的空间特征差异更大,从而能够带来更强的空间感。
可选地,也可以通过其他方式来对待处理立体声频域信号进行空间信息分解以得到多个虚拟声音信号,本申请不做限制。
S103,根据多个虚拟声音信号以及多个虚拟声音信号各自对应的头部相关传递函数,对待处理立体声频域信号进行空间信息重建,以得到待处理立体声频域信号对应的频域输出信号。
这里,根据多个虚拟声音信号以及多个虚拟声音信号各自对应的头部相关传递函数,对待处理立体声频域信号进行空间信息重建,是指基于多个虚拟声音信号和多个虚拟声音信号各自对应的头部相关传递函数,完成对进入人耳的虚拟声源信号的模拟和人耳听到的声音信号的重建。
具体地,可以通过如下步骤B1-B2对待处理立体声频域信号进行空间信息重建,以得到待处理立体声频域信号对应的频域输出信号:
B1、根据多个虚拟声音信号以及多个虚拟声音信号各自对应的头部相关传递函数,确定目标入耳信号。
其中,目标入耳信号用于指示多个虚拟声音信号传递至头部处双耳接收到的混合信号,该混合信号由多个虚拟声音信号传递至头部处双耳分别获取到的信号混合叠加而成。目标入耳信号可包括左入耳信号和右入耳信号,其中,左入耳信号用于指示多个虚拟声音信号传递至头部处左耳接收到的混合信号;右入耳信号用于指示多个虚拟声音信号传递至头部处右耳接收到的混合信号。
在一种可行的实施方式中,目标入耳信号可通过如下步骤B11-B12得到:
B11、根据目标虚拟声音信号和目标虚拟声音信号对应的头部相关传递函数,确定目标虚拟声音信号对应的虚拟入耳信号。
B12、对多个虚拟声音信号各自对应的虚拟入耳信号进行信号叠加,以得到目标入耳信号。
其中,目标虚拟声音信号对应的虚拟入耳信号用于指示目标虚拟声音信号传递至头部处双耳接收到的信号。目标虚拟声音信号可以为前述提到的幻象声源信号、左通道残余信号或右通道残余信号。
目标入耳信号的计算公式可参见如下公式(9)-公式(16):
Yl(k)=Yl1(k)+Yl2(k)-Yl3(k) 公式(9)
Figure BDA0003840534270000111
Figure BDA0003840534270000112
Figure BDA0003840534270000113
Yr(k)=Yr1(k)+Yr2(k)-Yr3(k) 公式(13)
Figure BDA0003840534270000121
Figure BDA0003840534270000122
Figure BDA0003840534270000123
其中,Yl(k)为左入耳信号,Yl1(k)为幻象声源信号对应的左虚拟入耳信号,Yl2(k)为左通道残余信号对应的左虚拟入耳信号,Yl3(k)为右通道残余信号对应的左虚拟入耳信号;pl,b,as0为幻象声源信号对应的左耳头部相关传递函数,用以表征幻象声源信号从方位as处传递至左耳的相位和频率响应,pl,b,al0为左通道残余信号对应的左耳头部相关传递函数,用以表征左通道残余信号从方位al处传递至左耳的相位和频率响应,pl,b,ar0为右通道残余信号对应的头部相关传递函数,用以表征右通道残余信号从方位ar处传递至左耳的相位和频率响应;Yr(k)为右入耳信号,Yr1(k)为幻象声源信号对应的右虚拟入耳信号,Yr2(k)为右通道残余信号对应的右虚拟入耳信号,Yr3(k)为右通道残余信号对应的右虚拟入耳信号;pr,b,as,0为幻象声源信号对应的右耳头部相关传递函数,用以表征幻象声源信号从方位as处传递至右耳的相位和频率响应,pr,b,al,0为左通道残余信号对应的右耳头部相关传递函数,用以表征左通道残余信号从方位al处传递至右耳的相位和频率响应,pr,b,ar,0为右通道残余信号对应的头部相关传递函数,用以表征右通道残余信号从方位ar处传递至右耳的相位和频率响应;φb,as,0为幻象声源信号对应的相位补偿,φb,al,0为左通道残余信号对应的相位补偿;φb,ar,0为左通道残余信号对应的相位补偿。
在确定幻象声源信号、左通道残余信号、右通道残余信号各自对应的空间方位后,可根据幻象声源信号、左通道残余信号、右通道残余信号各自对应的空间方位确定幻象声源信号、左通道残余信号、右通道残余信号各自对应的头部相关传递函数,然后上述根据公式(10)-(12)计算得到幻象声源信号、左通道残余信号、右通道残余信号各自对应的左虚拟入耳信号,根据上述公式(9)计算得到左入耳信号;并根据上述公式(14)-(15)计算得到幻象声源信号、左通道残余信号、右通道残余信号各自对应的右虚拟入耳信号,根据上述公式(13)计算得到右入耳信号;以此得到目标入耳信号。
其中,可通过如下步骤C1-C3确定幻象声源信号、左通道残余信号、右通道残余信号各自对应的空间方位。
C1、获取第一位置角和第二位置角。
其中,第一位置角为左虚拟扬声器对应的位置角,左虚拟扬声器发出的声音对应于立体声录制过程中左方位的环境声源发出的声音,可以理解为,左虚拟扬声器用于模拟立体声录制过程中位于录制设备左侧的环境声源;第二位置角为右虚拟扬声器对应的位置角,右虚拟扬声器发出的声音对应于立体声录制过程中右方位的环境声源发出的声音,可以理解为,右虚拟扬声器用于模拟立体声录制过程中位于录制设备右侧的环境声源。
第一位置角和第二位置角可以是预设的,例如分别可以设置为-30°和30°。应理解的是,虚拟扬声器对应的位置角,可基于实际需求设置,本申请不做限制。
C2、根据第一位置角确定左通道残余信号对应的空间方位,并根据第二位置角确定右通道残余信号对应的空间方位。
C3、根据第一位置角、第二位置角以及目标位置角,确定幻象声源信号对应的空间方位。
具体地,左通道残余信号、右通道残余信号以及幻象声源信号对应的空间方位的计算公式可参见如下公式(17)-(19)
as=c1*(a2+(a1-a2)*γb/90)+c0 公式(17)
al=c1*a1+c0 公式(18)
ar=c1*a2+c0 公式(19)
其中,al为第一位置角,ar为第二位置角,c1为方位缩放因子,c0为偏移角,as为幻象声源信号对应的空间方位,al为左通道残余信号对应的空间方位,ar为右通道残余信号对应的空间方位。
通过根据目标位置角和左、右虚拟扬声器所在的位置角来确定各个虚拟声源的空间方位,能够使得各个虚拟声源的空间方位差异更大,从而能够带来更强的空间感。
其中,在确定幻象声源信号、左通道残余信号、右通道残余信号各自对应的头部相关传递函数的过程中,可根据幻象声源信号、左通道残余信号、右通道残余信号各位对应的空间方位,从预设的头部相关传递函数库中获取与幻象声源信号的空间方位对应的头部相关传递函数作为幻象声源信号对应的头部相关传递函数,并获取与左通道残余信号的空间方位对应的头部相关传递函数作为左通道残余信号对应的头部相关传递函数,以及获取与右通道残余信号的空间方位对应的头部相关传递函数作为右通道残余信号对应的头部相关传递函数。预设的头部相关传递函数库中的头部相关传递函数可以通过预先测量获得。
在一些可能的情况中,在该预设的头部相关传递函数库中不存在与目标虚拟声音信号的空间方位对应的头部相关传递函数的情况下,可通过线性插值的方式确定与目标虚拟声音信号的空间方位对应的头部相关传递函数,目标虚拟声音信号为幻象声源信号、左通道残余信号或右通道残余信号中的任意一个。通过线性插值的方式,能够实现对头部传递函数的补缺,从而保证头部传递函数的多样性。
B2、对目标入耳信号与待处理立体声频域信号进行混合处理,以得到频域输出信号。
这里,对目标入耳信号与待处理立体声频域信号进行混合处理,是指将目标入耳信号与待处理立体声频域信号的信号频率进行混合,得到新的信号。
在一种可行的实施方式中,可以通过如下步骤B21-B22对目标入耳信号与待处理立体声频域信号进行混合处理。
B21、获取待处理立体声频域信号对应的立体声低频信号。
其中,立体声低频信号的频率低于预设频率。立体声低频信号可以为低通滤波器提取出的立体声低频信号。示例性地,低通滤波器的截止频率例如可以为200HZ。
具体实现中,可以通过低通滤波器对待处理立体声频域信号进行滤波,以得到该立体声低频信号。
B22、对目标入耳信号、待处理立体声频域信号以及立体声低频信号进行加权求和调制,以得到频域输出信号。
具体地,加权求和调制的公式如下:
OUTl=M1*Yl+M2*Xl+M3*Z
OUTr=M1*Yr+M2*Xr+M3*Z
其中,OUTl和OUTr分别为左右耳频域输出信号,M1、M2、M3分别为加权系数,Yl、Yr分别为左右耳入耳信号,Xl和Xr分别为左右声道频域信号。
通过将各个虚拟声源传递至耳朵时的信号与待处理立体声频域信号进行混合处理,能够使得混合得到的频域输出信号携带各个虚拟声源的空间信息,从而具有更强的空间感。
具体地,可以通过上混频或下混频的方式对目标入耳信号、待处理立体声频域信号以及立体声低频信号进行加权求和调制,得到频域输出信号。
可选地,在得到频域输出信号后,还可以对频域输出信号进行傅里叶逆变换,以得到时域输出信号,即outl=IFFT(M1*Yl+M2*Xl+M3*Z),outr=IFFT(M1*Yr+M2*Xr+M3*Z)。
在上述图1对应的技术方案中,在获取到待处理立体声频域信号之后,通过对待处理立体声频域信号进行空间信息分解,得到多个不同空间方位处的虚拟声音信号,可以实现对不同方位的虚拟声源的模拟;然后根据多个不同空间方位处的虚拟声音信号和多个不同空间方位处的虚拟声音信号对应的头部相关传递函数,对待处理立体声频域信号进行空间信息重建,可以实现对这些不同方位的虚拟声源传输至人耳这一传输过程的模拟再现,因此,能使得重建得到的频域输出信号具有丰富的空间信息,在输出时能够给用户带来更强的虚拟环绕感和空间感。
参见图2,图2是本申请实施例提供的一种音频数据处理装置的结构示意图。如图2所示,该声音信号处理装置20包括:
获取模块201,用于获取待处理立体声频域信号;
分解模块202,用于对所述待处理立体声频域信号进行空间信息分解,以得到多个虚拟声音信号,所述多个虚拟声音信号为不同空间方位对应的虚拟声音信号;
重建模块203,用于根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,对所述待处理立体声频域信号进行空间信息重建,以得到所述待处理立体声频域信号对应的频域输出信号,其中,目标虚拟声音信号对应的头部相关传递函数用于表征所述目标虚拟声音信号从所述目标虚拟声音信号对应的空间方位传递到头部的相位和频率响应,所述目标虚拟声音信号为所述多个虚拟声音信号中的任意一个虚拟声音信号。
在一种可能的设计中,所述待处理立体声频域信号包括左声道频域信号和右声道频域信号;上述分解模块202具体用于:对所述左声道频域信号和所述右声道频域信号进行频谱分析,以确定目标位置角,所述目标位置角为使得信号相互之间的差异度最大的位置角;根据所述目标位置角、所述左声道频域信号和所述右声道频域信号,进行信号叠加与信号分解,以得到所述多个虚拟声音信号。
在一种可能的设计中,所述多个虚拟声音信号包括幻象声源信号、左通道残余信号和右通道残余信号;上述分解模块202具体用于:根据所述目标位置角、所述左声道频域信号和所述右声道频域信号,进行信号叠加,以得到所述幻象声源信号;根据所述目标位置角、所述幻象声源信号和所述右声道频域信号,进行信号分解,以得到所述左通道残余信号;根据所述目标位置角、所述幻象声源信号和所述左声道频域信号,进行信号分解,以得到所述右通道残余信号。
在一种可能的设计中,所述多个虚拟声音信号包括幻象声源信号、左通道残余信号和右通道残余信号;上述声音信号处理装置20还包括:位置角获取模块204,用于获取第一位置角和第二位置角,所述第一位置角为左虚拟扬声器对应的位置角,所述第二位置角为右虚拟扬声器对应的位置角;方位确定模块205,用于根据所述第一位置角确定所述左通道残余信号对应的空间方位,并根据所述第二位置角确定所述右通道残余信号对应的空间方位;根据所述第一位置角、所述第二位置角以及所述目标位置角,确定所述幻象声源信号对应的空间方位。
在一种可能的设计中,上述重建模块203具体用于:根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,确定目标入耳信号,所述目标入耳信号用于指示所述多个虚拟声音信号传递至头部处双耳接收到的混合信号;对所述目标入耳信号与所述待处理立体声频域信号进行混合处理,以得到所述频域输出信号。
在一种可能的设计中,上述重建模块203具体用于:根据所述目标虚拟声音信号与所述目标虚拟声音信号对应的头部相关传递函数,确定所述目标虚拟声音信号对应的虚拟入耳信号,所述目标虚拟声音信号对应的虚拟入耳信号用于指示所述目标虚拟声音信号传递至头部处双耳接收到的信号;对所述多个虚拟声音信号各自对应的虚拟入耳信号进行信号叠加,以得到所述目标入耳信号。
在一种可能的设计中,上述重建模块203具体用于:获取所述待处理立体声频域信号对应的立体声低频信号,所述立体声低频信号的频率低于预设频率;对所述目标入耳信号、所述待处理立体声频域信号以及所述立体声低频信号进行加权求和调制,以得到所述频域输出信号。
需要说明的是,图2对应的实施例中未提及的内容可参见前述方法实施例的描述,这里不再赘述。
上述装置,在获取到待处理立体声频域信号之后,通过对待处理立体声频域信号进行空间信息分解,得到多个不同空间方位处的虚拟声音信号,可以实现对不同方位的虚拟声源的模拟;然后根据多个不同空间方位处的虚拟声音信号和多个不同空间方位处的虚拟声音信号对应的头部相关传递函数,对待处理立体声频域信号进行空间信息重建,可以实现对这些不同方位的虚拟声源传输至人耳这一传输过程的模拟再现,因此,能使得重建得到的频域输出信号具有丰富的空间信息,在输出时能够给用户带来更强的虚拟环绕感和空间感。
参见图3,图3是本申请实施例提供的一种音频设备的结构示意图,该音频设备30包括处理器301、存储器302。存储器302连接至处理器301,例如通过总线连接至处理器301。
处理器301被配置为支持该音频设备30执行上述方法实施例中的方法中相应的功能。该处理器301可以是中央处理器(central processing unit,CPU),网络处理器(network processor,NP),硬件芯片或者其任意组合。上述硬件芯片可以是专用集成电路(application specific integrated circuit,ASIC),可编程逻辑器件(programmablelogic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complexprogrammable logic device,CPLD),现场可编程逻辑门阵列(field-programmable gatearray,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。
存储器302用于存储程序代码等。存储器302可以包括易失性存储器(volatilememory,VM),例如随机存取存储器(random access memory,RAM);存储器302也可以包括非易失性存储器(non-volatile memory,NVM),例如只读存储器(read-only memory,ROM),快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);存储器302还可以包括上述种类的存储器的组合。
处理器301可以调用所述程序代码以执行以下操作:
获取待处理立体声频域信号;
对所述待处理立体声频域信号进行空间信息分解,以得到多个虚拟声音信号,所述多个虚拟声音信号为不同空间方位对应的虚拟声音信号;
根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,对所述待处理立体声频域信号进行空间信息重建,以得到所述待处理立体声频域信号对应的频域输出信号,其中,目标虚拟声音信号对应的头部相关传递函数用于表征所述目标虚拟声音信号从所述目标虚拟声音信号对应的空间方位传递到头部的相位和频率响应,所述目标虚拟声音信号为所述多个虚拟声音信号中的任意一个虚拟声音信号。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时使所述计算机执行如前述实施例所述的方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only memory,ROM)或随机存储记忆体(Random Accessmemory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (10)

1.一种声音信号处理方法,其特征在于,包括:
获取待处理立体声频域信号;
对所述待处理立体声频域信号进行空间信息分解,以得到多个虚拟声音信号,所述多个虚拟声音信号为不同空间方位对应的虚拟声音信号;
根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,对所述待处理立体声频域信号进行空间信息重建,以得到所述待处理立体声频域信号对应的频域输出信号,其中,目标虚拟声音信号对应的头部相关传递函数用于表征所述目标虚拟声音信号从所述目标虚拟声音信号对应的空间方位传递到头部的相位和频率响应,所述目标虚拟声音信号为所述多个虚拟声音信号中的任意一个虚拟声音信号。
2.根据权利要求1所述的方法,其特征在于,所述待处理立体声频域信号包括左声道频域信号和右声道频域信号;
所述对所述待处理立体声频域信号进行空间信息分解,以得到多个空间方位各自对应的虚拟声音信号,包括:
对所述左声道频域信号和所述右声道频域信号进行频谱分析,以确定目标位置角,所述目标位置角为使得信号相互之间的差异度最大的位置角;
根据所述目标位置角、所述左声道频域信号和所述右声道频域信号,进行信号叠加与信号分解,以得到所述多个虚拟声音信号。
3.根据权利要求2所述的方法,其特征在于,所述多个虚拟声音信号包括幻象声源信号、左通道残余信号和右通道残余信号;
所述根据所述目标位置角、所述左声道频域信号和所述右声道频域信号,进行信号叠加与信号分解,以得到所述多个虚拟声音信号,包括:
根据所述目标位置角、所述左声道频域信号和所述右声道频域信号,进行信号叠加,以得到所述幻象声源信号;
根据所述目标位置角、所述幻象声源信号和所述右声道频域信号,进行信号分解,以得到所述左通道残余信号;
根据所述目标位置角、所述幻象声源信号和所述左声道频域信号,进行信号分解,以得到所述右通道残余信号。
4.根据权利要求2所述的方法,其特征在于,所述多个虚拟声音信号包括幻象声源信号、左通道残余信号和右通道残余信号;
所述根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,对所述待处理立体声频域信号进行空间信息重建,以得到所述待处理立体声频域信号对应的频域输出信号之前,还包括:
获取第一位置角和第二位置角,所述第一位置角为左虚拟扬声器对应的位置角,所述第二位置角为右虚拟扬声器对应的位置角;
根据所述第一位置角确定所述左通道残余信号对应的空间方位,并根据所述第二位置角确定所述右通道残余信号对应的空间方位;
根据所述第一位置角、所述第二位置角以及所述目标位置角,确定所述幻象声源信号对应的空间方位。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,对所述待处理立体声频域信号进行空间信息重建,以得到所述待处理立体声频域信号对应的频域输出信号,包括:
根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,确定目标入耳信号,所述目标入耳信号用于指示所述多个虚拟声音信号传递至头部处双耳接收到的混合信号;
对所述目标入耳信号与所述待处理立体声频域信号进行混合处理,以得到所述频域输出信号。
6.根据权利要求5所述的方法,其特征在于,所述根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,确定目标入耳信号,包括:
根据所述目标虚拟声音信号与所述目标虚拟声音信号对应的头部相关传递函数,确定所述目标虚拟声音信号对应的虚拟入耳信号,所述目标虚拟声音信号对应的虚拟入耳信号用于指示所述目标虚拟声音信号传递至头部处双耳接收到的信号;
对所述多个虚拟声音信号各自对应的虚拟入耳信号进行信号叠加,以得到所述目标入耳信号。
7.根据权利要求5所述的方法,其特征在于,所述对所述目标入耳信号与所述待处理立体声频域信号进行混合处理,以得到所述频域输出信号,包括:
获取所述待处理立体声频域信号对应的立体声低频信号,所述立体声低频信号的频率低于预设频率;
对所述目标入耳信号、所述待处理立体声频域信号以及所述立体声低频信号进行加权求和调制,以得到所述频域输出信号。
8.一种声音信号处理装置,其特征在于,包括:
获取模块,用于获取待处理立体声频域信号;
分解模块,用于对所述待处理立体声频域信号进行空间信息分解,以得到多个虚拟声音信号,所述多个虚拟声音信号为不同空间方位对应的虚拟声音信号;
重建模块,用于根据所述多个虚拟声音信号以及所述多个虚拟声音信号各自对应的头部相关传递函数,对所述待处理立体声频域信号进行空间信息重建,以得到所述待处理立体声频域信号对应的频域输出信号,其中,目标虚拟声音信号对应的头部相关传递函数用于表征所述目标虚拟声音信号从所述目标虚拟声音信号对应的空间方位传递到头部的相位和频率响应,所述目标虚拟声音信号为所述多个虚拟声音信号中的任意一个虚拟声音信号。
9.一种音频设备,其特征在于,包括存储器、处理器,所述存储器连接至所述处理器,所述处理器用于执行存储在所述存储器中的一个或多个计算机程序,所述处理器在执行所述一个或多个计算机程序时,使得所述音频设备实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
CN202211101303.3A 2022-09-09 2022-09-09 声音信号处理方法、装置、设备及存储介质 Pending CN116261086A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211101303.3A CN116261086A (zh) 2022-09-09 2022-09-09 声音信号处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211101303.3A CN116261086A (zh) 2022-09-09 2022-09-09 声音信号处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116261086A true CN116261086A (zh) 2023-06-13

Family

ID=86678105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211101303.3A Pending CN116261086A (zh) 2022-09-09 2022-09-09 声音信号处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116261086A (zh)

Similar Documents

Publication Publication Date Title
Ahrens Analytic methods of sound field synthesis
Xie Head-related transfer function and virtual auditory display
US7489788B2 (en) Recording a three dimensional auditory scene and reproducing it for the individual listener
US9961474B2 (en) Audio signal processing apparatus
US9215544B2 (en) Optimization of binaural sound spatialization based on multichannel encoding
EP3895451B1 (en) Method and apparatus for processing a stereo signal
CN104010264B (zh) 双声道音频信号处理的方法和装置
TW201238367A (en) Apparatus and method for decomposing an input signal using a pre-calculated reference curve
KR20180082461A (ko) 파라메트릭 바이너럴 출력 시스템 및 방법을 위한 머리추적
Oreinos et al. Objective analysis of ambisonics for hearing aid applications: Effect of listener's head, room reverberation, and directional microphones
CA2744429C (en) Converter and method for converting an audio signal
US11979723B2 (en) Content based spatial remixing
Garí et al. Flexible binaural resynthesis of room impulse responses for augmented reality research
Xie Spatial sound: Principles and applications
CN108966110B (zh) 声音信号处理方法、装置及系统、终端及存储介质
WO2022133128A1 (en) Binaural signal post-processing
CN116261086A (zh) 声音信号处理方法、装置、设备及存储介质
San Martín et al. Influence of recording technology on the determination of binaural psychoacoustic indicators in soundscape investigations
US10555105B2 (en) Successive decompositions of audio filters
Yuan et al. Externalization improvement in a real-time binaural sound image rendering system
Jeffet et al. Study of a generalized spherical array beamformer with adjustable binaural reproduction
Pihlajamäki Multi-resolution short-time fourier transform implementation of directional audio coding
KR100932791B1 (ko) 음상 외재화를 위한 머리전달함수 생성 방법과, 그를이용한 3차원 오디오 신호 처리 장치 및 그 방법
Oreinos et al. Objective analysis of higher-order Ambisonics sound-field reproduction for hearing aid applications
WO2021212287A1 (zh) 音频信号处理方法、音频处理装置及录音设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination