CN109863764B - 控制将通过电声音响系统记录和/或再现的声信号的方法和装置 - Google Patents
控制将通过电声音响系统记录和/或再现的声信号的方法和装置 Download PDFInfo
- Publication number
- CN109863764B CN109863764B CN201680090188.0A CN201680090188A CN109863764B CN 109863764 B CN109863764 B CN 109863764B CN 201680090188 A CN201680090188 A CN 201680090188A CN 109863764 B CN109863764 B CN 109863764B
- Authority
- CN
- China
- Prior art keywords
- frequency
- digital filter
- determining
- acoustic
- initial digital
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/301—Automatic calibration of stereophonic sound system, e.g. with test microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/001—Monitoring arrangements; Testing arrangements for loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
本发明涉及一种方法和装置,均用于控制将通过电声音响系统记录或再现的声信号。为此:通过求解逆问题确定初始数字滤波器,其中所述初始数字滤波器用于控制将通过所述电声音响系统记录和/或再现的声信号;通过对所述初始数字滤波器执行时谱心理声学自动音频质量测试,确定频率相关清晰度参数;通过使用所述频率相关清晰度参数来调整用于确定所述初始数字滤波器的频率相关正则化参数;以及通过使用调整后的频率相关正则化参数来确定用于控制将通过所述电声音响系统记录或再现的声信号的数字滤波器。
Description
技术领域
本发明涉及一种用于控制将通过电声音响系统捕获或生成的声信号的方法和装置。此外,本发明涉及一种相应布置的计算机程序产品和一种相应布置的计算机可读介质。
背景技术
在电子领域,存在几种用于记录和再现声信号的应用,例如,音频和/或视频系统,电信系统等。对于每个应用,期望在发生拍摄的三维环境(即房间)中准确记录和再现声信号。该功能通常通过数字均衡器实现。
当采用声信号源在有限维度的封闭房间中再现声信号时,电声音响系统(例如扬声器)产生的声信号与声场完全交互,因此将电声音响系统产生的效果与房间产生的效果区分开是一项复杂的任务。房间越小,交互越完全。小型房间的一个示例是包括一个例如电声音响系统等音响系统的汽车。因此,电声音响系统在消声室中可产生具有较好的质量或所期望的质量的声信号,而在小型房间中,电声音响系统产生的声信号的质量较差,反之亦然。
例如小型房间内的麦克风捕获的信号也是如此。
因此,需要能自动或近乎自动地调整所记录和/或再现的信号的装置和方法,以使这些信号的质量满足要求。使用执行相应均衡方法的均衡器来调整声信号内的频率分量之间的平衡。然而,对于所记录和再现的声信号的质量,已知的装置和方法仍有改进空间。此外,一些已知装置和方法需要对用于调整声信号的变量进行复杂的手动微调。在许多情况下,通过易于操作的声信号调整方法调整的声信号的质量不能令人满意,而质量令人满意的声信号调整方法的操作则比较复杂。
发明内容
本发明的目的是提供一种改进通过电声音响系统(例如扬声器、扬声器阵列、麦克风、麦克风阵列、移动电话、智能手机、平板电脑或任何其它用于捕获或发射声信号的设备)记录和/或再现的声信号的处理的装置和方法。
本发明的目的通过所附独立权利要求中提供的方案实现。本发明的有利实施方式在说明书的相应从属权利要求和/或附图中进一步限定。
本发明提供了一种大幅改进所记录和/或再现的声信号的质量的方法和装置。同时,能够简单、有效地操作用于控制将通过电声音响系统记录和/或再现的声信号的方法和装置。此外,所述控制将通过电声音响系统记录和/或再现的声信号,具体是针对所需质量调整所记录和再现的声信号,可以被自动执行。
根据第一方面,提供了一种用于控制将通过电声音响系统记录和/或再现的声信号的方法,所述方法包括以下步骤:通过求解逆问题确定初始数字滤波器,其中所述初始数字滤波器用于控制将通过所述电声音响系统记录和/或再现的声信号;通过对所述初始数字滤波器执行时谱心理声学自动音频质量测试,确定频率相关清晰度参数;通过使用所述频率相关清晰度参数来调整用于确定所述初始数字滤波器的频率相关正则化参数;以及通过使用调整后的频率相关正则化参数来确定用于控制将通过所述电声音响系统记录和/或再现的声信号的数字滤波器。
术语“频率相关”是指使用相应频率相关清晰度参数和相应频率相关正则化参数的值来修改所记录和/或再现的声信号的频率,从而通过调整所记录和/或再现的声信号的频率来提高它们的质量。因此,所述清晰度参数和所述正则化参数基于或依赖于所控制的声信号的频率来确定、计算、设置和/或调整,所以与频率相关。
所述初始数字滤波器是例如用于进行均衡的已知或传统数字滤波器。
根据所述第一方面,在第一种可能实施方式中,通过对所述初始数字滤波器执行所述音频质量测试来确定或计算所述频率相关清晰度参数包括:执行具有声学测试信号的所述初始数字滤波器的卷积;以及通过确定所述声学测试信号的两个连续突发之间的预定时间间隔之后的衰减水平,确定所述频率相关清晰度参数。
根据如上所述第一方面或根据所述第一方面的所述第一种实施形式,在第二种可能实施形式中,所述声学测试信号包括重复的突发。
根据如上所述第一方面或根据所述第一方面的所述第一或第二种实施形式,在第三种可能实施形式中,通过确定所述逆问题的最小二乘解来确定所述初始数字滤波器。
根据如上所述第一方面或根据所述第一方面的任一前述实施形式,在第四种可能实施形式中,调整后的频率相关正则化参数是清晰度的递减函数,其最大值可等于偏移量,所述偏移量包括在确定所述初始数字滤波器时确定的频率相关正则化参数。
根据如上所述第一方面或根据所述第一方面的任一前述实施形式,在第五种可能实施形式中,如下调整所述频率相关正则化参数:
其中,k表示第k个频率指数,β0和β1是预设的频率相关正则化常数,Artk是所述频率相关清晰度参数,βNelson,k是在确定所述初始数字滤波器时采用的所述频率相关正则化参数。βNelson,k是例如传统或常规的频率相关正则化参数。例如,βNelson,k可通过Nelson-Kirkeby-Farina方法计算,该方法在例如1999年5月8-11日于慕尼黑召开的第106次AES会议上O.Kirkeby、P.A.Nelson、P.Rubak和A.Farina的“使用快速去卷积设计串扰抵消网络(Design of Cross-talk Cancellation Networks by using Fast Deconvolution)”中进行了描述,该出版物的相应内容以引入的方式并入本文本中。
根据如上所述第一方面或根据所述第一方面的任一前述实施形式,在第六种可能实施形式中,所述初始数字滤波器是均衡滤波器。
根据第二方面,提供了一种用于控制将通过电声音响系统记录和/或再现的声信号的装置,所述装置包括:初始数字滤波器确定实体,用于通过求解逆问题确定初始数字滤波器,其中所述初始数字滤波器用于控制将通过所述电声音响系统记录和/或再现的声信号;频率相关清晰度参数确定实体,用于通过对所述初始数字滤波器执行时谱心理声学自动音频质量测试来确定频率相关清晰度参数;频率相关正则化参数调整实体,用于通过使用所述频率相关清晰度参数来调整用于确定所述初始数字滤波器的频率相关正则化参数;以及数字滤波器确定实体,用于通过使用调整后的频率相关正则化参数来确定用于控制将通过所述电声音响系统记录和/或再现的声信号的数字滤波器。
根据所述第二方面,在第一种可能实施方式中,所述频率相关清晰度参数确定实体用于:执行具有声学测试信号的所述初始数字滤波器的卷积;以及通过确定所述声学测试信号的两个连续突发之间的预定时间间隔之后的衰减水平,确定所述频率相关清晰度参数。
根据如上所述第二方面或根据所述第二方面的所述第一种实施形式,在第二种可能实施形式中,所述声学测试信号包括重复的突发。
根据如上所述第二方面或根据所述第二方面的所述第一或第二种实施形式,在第三种可能实施形式中,所述初始数字滤波器确定实体用于通过确定所述逆问题的最小二乘解来确定所述初始数字滤波器。
根据如上所述第二方面或根据所述第二方面的任一前述实施形式,在第四种可能实施形式中,调整后的频率相关正则化参数是清晰度的递减函数,其最大值可等于偏移量,所述偏移量包括在确定所述初始数字滤波器时确定的频率相关正则化参数。
根据如上所述第二方面或根据所述第二方面的任一前述实施形式,在第五种可能实施形式中,所述频率相关正则化参数调整实体用于如下调整所述频率相关正则化参数:
其中,k表示第k个频率指数,β0和β1是预设的正则化常数,Artk是所述频率相关清晰度参数,βNelson,k是在确定所述初始数字滤波器时采用的所述频率相关正则化参数。βNelson,k是例如传统或常规的频率相关正则化参数。例如,βNelson,k可通过Nelson-Kirkeby-Farina方法计算,该方法在例如1999年5月8-11日于慕尼黑召开的第106次AES会议上O.Kirkeby、P.A.Nelson、P.Rubak和A.Farina的“使用快速去卷积设计串扰抵消网络(Design of Cross-talk Cancellation Networks by using Fast Deconvolution)”中进行了描述,该出版物的相应内容以引入的方式并入本文本中。
根据如上所述第二方面或根据所述第二方面的任一前述实施形式,在第六种可能实施形式中,所述初始数字滤波器是均衡滤波器。
根据如上所述第二方面或根据所述第二方面的任一前述实施形式,在第七种可能实施形式中,所述装置是均衡器或波束成形器。
根据第三方面,本发明涉及一种包括计算机可读程序代码的计算机程序产品,所述计算机可读程序代码用于使计算设备执行在上文介绍且将在下文详细阐述的方法步骤。根据所述第三方面,在第一种可能实施形式中,所述计算机可读程序代码包含在计算机可读介质中。根据所述第三方面的所述第一种可能实施形式,在第二种可能实施形式中,所述计算机可读介质是非瞬时性计算机可读介质。根据如上所述第三方面或根据所述第三方面的所述第一或第二种可能实施形式,在第三种可能实施形式中,所述计算设备是处理器或任何其它用于执行计算机可读程序代码的计算机。
根据第四方面,本发明涉及一种计算机可读记录介质,用于在其中存储所述计算机程序产品。根据所述第四方面,在第一种可能实施形式中,所述计算机可读介质是非瞬时性计算机可读介质。
附图说明
结合所附附图,下面具体实施例的描述将阐述上述本发明的各方面及其实现形式,其中:
图1示出了根据本发明一实施例的求解的逆问题的场景。
图2示出了根据本发明一实施例的为控制将通过电声音响系统记录和/或再现的声信号而执行的步骤。
图3示出了根据本发明一实施例的为控制将通过电声音响系统记录和/或再现的声信号而执行的其它步骤。
图4示出了根据本发明一实施例的声学测试信号的示例性布置。
图5示出了根据本发明一实施例的用于控制将通过电声音响系统记录和/或再现的声信号的装置的示例性布置。
具体实施方式
通常需要注意的是本申请中描述的所有设置、设备、模块、组件、模型、元件、单元、实体以及方法等都可以由软件或硬件元件或其任意组合实现。本申请中描述的各种实体执行的所有步骤和所描述的将由各种实体执行的功能旨在表明各个实体适于或用于执行各自的步骤和功能。虽然在以下具体实施例的描述中,由通用实体执行的特定功能或步骤没有在执行特定步骤或功能的实体的具体元件的描述中反映,但是技术人员应该清楚的是这些方法和功能可以在各自的硬件或软件元件或其任意组合中实现。此外,本发明的方法及其各个步骤在各个描述的装置元件的功能中体现。
此外,除非有明确排除的组合,否则本文所描述的任何实施例以及任何实施例的特征都可以互相组合。
本发明的目的是在具有入射声场的给定“聆听空间”或房间(例如客厅)中提供一种监听器,该入射声场在空间和时间上尽可能匹配会入射到“记录空间”中的监听器的声信号场。因此,需要提供如下声信号:这些声信号将通过电声音响系统(例如耳机、扬声器、麦克风等)记录或再现到“声学空间”或房间中,使得它们尽量接近已记录的声信号,即,已经记录但尚未通过电声音响系统记录和/或再现的声信号。这些已记录的声信号的质量仍然满足通过声信号的电声音响系统记录或再现到“聆听空间”或房间中的声信号所需的质量,这给所记录和/或再现的声信号增加了非期望的干扰噪声。
首先,进行频域分析。因此,寻找一个或多个离散声源的最佳声信号输出,这些输出在例如最小二乘意义上为所需声场的“最佳匹配”(在幅度和/或相位方面)。为了产生最佳声信号输出,从用于进行处理的一组滤波器中选择一个或多个数字滤波器,处理具体是指对待输出(即,待记录和/或重现)的声信号进行滤波以获得最佳声信号输出。这里,术语“最佳声信号”是指尽可能接近所需声信号(通常称为“目标”)的声信号。所述一个或多个数字滤波器中的每一个都具有可调参数,这些参数的调整会影响相应滤波器所进行的滤波的结果。
因此,找出可以用于控制电声音响系统的输出(即,记录和/或再现的声信号)的数字滤波器矩阵(即,一个或多个数字滤波器)。众所周知,这通过求解逆问题来完成(参见如1999年3月J.Acoust.Soc.Am.105(3)第1503-1516页,Yuvi Kahana、Philip A.Nelson、OleKirkeby、Hareo Hamada的“一种用于生成虚拟声像的多麦克风录制技术(A multiplemicrophone recording technique for the generation of virtual acousticimages)”)。
图1示例性地示出了根据本发明一实施例的求解的逆问题的场景。给定一组S个电声音响系统(例如扬声器等),目的是尽可能准确地在聆听室或空间中的R个点处再现所需声场。结合图1的场景,假设系统在离散时间上运行。因此,使用传统的z变换表示法。变量定义如下:u(z)表示所记录的将在聆听室或空间中的R个点处尽可能再现的声信号的向量,v(z)是S个源输入信号的向量,w(z)是R个再现声信号的向量,d(z)是R个所需声信号的向量,e(z)是R个性能误差信号的向量。所有向量都是列向量,写为:
u(z)=[U1(z)...UT(z)]T (1)
v(z)=[V(z)...Vs(z)]T (2)
w(z)=[W1(z)...WR(z)]T (3)
d(z)=[D1(z)...DR(z)]T (4)
e(z)=[E1(z)...ER(z)]T(5)
矩阵A(z)、C(z)和Hm,A(z)表示多通道数字滤波器。A(z)是R×T目标矩阵,C(z)是R×S对象矩阵,Hm,A(z)是最佳滤波器的S×T矩阵。组件z-m将所有u个元件延迟了整数m个样本。该延迟通常称为建模延迟。目的是确定Hm,A(z),因此问题本质上是逆转C(z)。
根据本实施例,通过逆问题的最小二乘解计算最佳数字滤波器的矩阵Hm,A(z),具体而言,最佳数字滤波器是在它们必须保持稳定这个意义上的最佳,但不限于有因果关系或有限持续时间。
当考虑m=0(无建模延迟)的情况时,通过求解以下逆问题,即在频域中通过正则化进行矩阵求逆,获得要使用的数字滤波器:
H0,A(z)=[CT(z-1)C(z)+βI]-1CT(z1)A(z), (6)
其中,I是S阶单位矩阵。
参见关于逆问题的求解,例如,以下出版物:1999年3月J.Acoust.Soc.Am.105(3)第1503-1516页,Yuvi Kahana、Philip A.Nelson、Ole Kirkeby、Hareo Hamada的“一种用于生成虚拟声像的多麦克风录制技术(A multiple microphone recording technique forthe generation of virtual acoustic images)”、1998年3月IEEE语音和音频处理的转导(IEEE Transductions on Speech and Audio Processing)第6卷第2期第189-194页,OleKirkeby、Philip A.Nelson、Hareo Hamada、Felipe Orduna-Bustamante的“使用正则化进行多通道系统的快速去卷积(Fast Deconvolution of Multichannel Systems UsingRegularization)”、振动与声(Journal of Sound and Vibration)(1994)177(4)第447-477页,Philip A.Nelson的“声场的主动控制以及声音再现(Active Control of AcousticFields and the Reproduction of Sound)”、1999年10月1 7-20日于纽约新帕尔茨召开的1999年IEEE音频和声学信号处理应用研讨会会报(Proc.1999IEEE Workshop onApplications of Signal Processing to Audio and Acoustics)第155-158页,OleKirkeby、Per Rubak、Angelo Farina的“多通道去卷积问题的病态性分析(Analysis ofIll-Conditioning ofMulti-Channel Deconvolution Problems)”。上文所列出版物的全部公开内容以引入的方式并入本文本中,并且更详细地说明了逆问题的求解(通过频率相关正则化参数β(z))以及对用于生成将通过电声音响系统输出(即,记录和/或再现)的声信号的数字滤波器的确定。
上述等式(6)中,β(z)项是正实数,表示用于确定将误差信号减到最少需要多少工作的频率相关正则化参数。通过将β从零变为无穷大,方案从仅将性能误差减到最少逐渐变为仅将工作成本减到最少(参见如1998年3月IEEE语音和音频处理的转导(IEEETransductions on Speech and Audio Processing)第6卷第2期第189-194页,OleKirkeby、PhilipA.Nelson、Hareo Hamada、Felipe Orduna-Bustamante的“使用正则化进行多通道系统的快速去卷积(Fast Deconvolution ofMultichannel Systems UsingRegularization)中第III.A至III.C章)。频率相关正则化参数β的值较大意味着最佳解将有利于所确定的数字滤波器的低功率输出,代价是性能误差较大。因此,可以使用频率相关正则化参数β控制所确定的最佳数字滤波器的功率输出。可以使用频率相关正则化参数β控制最佳数字滤波器的“持续时间”,从而能够提供一种避免不需要的“缠绕”效果的方式,这种“缠绕”效果通常与基于频域采样的最佳滤波器设计方法有关。结果表明,正则化控制最佳数字滤波器的最长时间常数。为了确保该时间常数的值不会过大或过小,必须适当地设置频率相关正则化参数β。如果频率相关正则化参数β太小,则最佳数字滤波器的频率响应中将会有陡峰;如果频率相关正则化参数β太大,则逆问题的解将不会很准确。
因此,确定合适的频率相关正则化参数β很重要。本发明尤其专注于找到合适的频率相关正则化参数β,其值在清晰度较差的频率下会增大。
图2示出了根据本发明一实施例的为控制将通过电声音响系统记录和/或再现的声信号而执行的步骤。
在步骤201中,通过求解逆问题确定一个或多个初始数字滤波器,其中所述一个或多个初始数字滤波器中的每一个用于控制将通过电声音响系统记录和/或再现的声信号。所述一个或多个初始数字滤波器的确定通过用于求解逆问题的合适方法来执行。根据一实施例,使用上述等式(6)。矩阵H0,A(z)提供了所述一个或多个初始数字滤波器。
根据一实施例,在执行步骤201之前,在通过电声音响系统记录声信号时,确定电声音响系统的响应。然后,在确定所述一个或多个初始数字滤波器时,考虑所确定的电声音响系统的响应。该响应被确定为例如上文提及的反向对象矩阵C(z)。
在步骤202中,通过对在步骤201中确定的一个或多个初始数字滤波器执行时谱心理声学自动音频质量测试,确定频率相关清晰度参数。为此,对于所述一个或多个初始数字滤波器中的每一个,执行具有声学测试信号的相应初始数字滤波器的卷积,并通过确定声学测试信号的两个连续突发之间的预定时间间隔之后的衰减水平来确定频率相关清晰度参数。
根据本实施例,声学测试信号代表重复的突发。这些突发为正弦突发等。根据一示例性实施例,声学测试信号是重复的正弦突发,其中每个突发的长度为200ms,并且两个相邻突发之间的间隔是33ms或66ms。声学测试信号的这种布置仅为示例性布置,根据本发明,声学测试信号也可以为其它适当的布置。图4示出了根据本发明一实施例的声学测试信号的示例性布置。
根据一实施例,通过执行众所周知的AQT分析,确定频率相关清晰度参数。AQT分析在例如以下出版物中进行了描述:2003年3月22-25日于阿姆斯特丹召开的第114次AES会议上Andrea Azzali、Alberto Bellini、Eraldo Carpanoni、Marco Romagnoli、AngeloFarina的“AQTool,一种用于心理声学均衡器的设计与合成的自动工具(AQTool anautomatic tool for design and synthesis of psychoacoustic Equalizers)”,以及2001年5月12-15日于阿姆斯特丹召开的第110次AES会议上Angelo Farina、GianfrancoCibelli、Alberto Bellini的“AQT——一种新的用于客观测量小型隔间中的声音再现音质的方法(AQT-A New Objective Measurement Of The Acoustical Quality Of SoundReproduction In Small Compartments)”。上文所列出版物的全部公开内容以引入的方式并入本文本中,并且更详细地说明了执行AQT分析以及确定频率相关清晰度参数的步骤。
然而在应用中,AQT分析是分别针对系统或电声音响系统而执行的,而根据本发明,AQT分析则是针对所述一个或多个初始数字滤波器而执行的。即,将声学测试信号传送给所述一个或多个初始数字滤波器,并针对所处理或滤波的声学测试信号执行AQT分析。
在步骤203中,通过使用在步骤202中确定的频率相关清晰度参数,调整新的频率相关正则化参数β。根据本实施例,调整后的频率相关正则化参数β是清晰度的递减函数,其最大值可等于偏移量,其中偏移量包括在确定初始数字滤波器时分别确定或使用的正则化参数β(参见上文的等式(6)以及等式(6)的频率相关正则化参数β)。具体地,调整后的频率相关正则化参数β是在步骤203中确定的频率相关清晰度参数的递减函数。因此,在步骤203中,确定改进的频率相关正则化参数β。
根据一实施例,如下调整频率相关正则化参数β:
其中,k表示第k个频率指数,βk表示调整后的或改进后的频率相关正则化参数β(对应第k个频率),β0和β1是预设的正则化常数,Artk是在步骤202中确定的频率相关清晰度参数(对应第k个频率),βNelson,k是在确定初始数字滤波器时分别确定或使用的频率相关正则化参数(参见上文的等式(6)以及等式(6)的频率相关正则化参数β)。如上所述,βNelson,k是例如传统或常规的频率相关正则化参数。例如,βNelson,k可通过Nelson-Kirkeby-Farina方法计算,该方法在例如1999年5月8-11日于慕尼黑召开的第106次AES会议上O.Kirkeby、P.A.Nelson、P.Rubak和A.Farina的“使用快速去卷积设计串扰抵消网络(Design ofCross-talk Cancellation Networks by using Fast Deconvolution)”中进行了描述,该出版物的相应内容以引入的方式并入本文本中。
这样,不仅确定了改进的频率相关正则化参数βk,还实现了频率相关正则化参数β的自动适配。这又使得自动控制将通过电声音响系统记录和/或再现的声信号成为可能。
根据一实施例,β0和β1是常数。根据另一实施例,β0=0.01且β1=1。本实施例中β0和β1的值可称为在已知的电声音响系统中使用的“典型”值。
在步骤204中,使用调整后或改进后的频率相关正则化参数βk来确定用于控制将通过电声音响系统记录和/或再现的声信号的一个或多个数字滤波器。数字滤波器确定步骤204以例如与初始数字滤波器确定步骤201相同的方式执行。因此,例如,当在步骤201中通过使用等式(6)以及初始频率相关正则化参数βNelson,k确定一个或多个初始数字滤波器时,在步骤204中,仍然使用等式(6),但通过改进后或调整后的频率相关正则化参数βk,确定数字滤波器。这样,实现了通过电声音响系统记录和/或再现的声信号的质量优化和提高。所记录和/或再现的声信号被限制为所需的声信号。如上所述,所记录和/或再现的声信号的质量优化或提高还可以自动执行,从而不仅简化了所记录和/或再现的声信号的质量优化,还简化了待输出的声信号的调整处理。这样,实现了将通过电声音响系统记录和/或再现的声信号的有效调整,所记录和/或再现的声信号的质量较高。
此外,根据本发明另一实施例,可以通过重复执行步骤203和204进一步提高将通过电声音响系统记录和/或再现的声信号的质量。这在图3中示出,其中图3的实施例补充了图2的实施例。根据图3,在执行步骤204后,验证301是否需要进一步调节或调整频率相关正则化参数β。如果无需进一步调节或调整频率相关正则化参数β,则完成了数字滤波器的确定,即,使用在步骤204中确定的数字滤波器通过声信号确定设备生成所记录和/或再现的声信号,以完成方法的执行。如果需要进一步调节或调整频率相关正则化参数β,则在步骤303中调整频率相关正则化参数β0和β1,即,使用频率相关正则化参数β0和β1的其它值,这些其它值也可预设。随后,再次执行步骤203和204,其中频率相关正则化参数βNelson,k的值现为先前在步骤203中确定的频率相关正则化参数βk的值。这样,频率相关正则化参数βk的值持续改进,直到(尽可能)达到电声音响系统记录和/或再现的声信号的所需质量。
图5示出了根据本发明一实施例的用于控制将通过电声音响系统记录和/或再现的声信号的装置500的示例性布置。
根据本实施例,装置500包括初始数字滤波器确定实体501,用于通过求解逆问题确定初始数字滤波器,其中初始数字滤波器用于控制将通过电声音响系统记录和/或再现的声信号。具体而言,初始数字滤波器确定实体501用于执行上述步骤201。装置500包括频率相关清晰度参数确定实体502,用于通过对初始数字滤波器执行时谱心理声学自动音频质量测试来确定频率相关清晰度参数。具体而言,频率相关清晰度参数确定实体502用于执行上述步骤202。装置500包括频率相关正则化参数调整实体503,用于通过使用频率相关清晰度参数来调整用于确定初始数字滤波器的频率相关正则化参数。具体而言,频率相关正则化参数调整实体503用于执行上述步骤203。装置500包括数字滤波器确定实体504,用于通过使用调整后的频率相关正则化参数来确定用于控制将通过电声音响系统记录和/或再现的声信号的数字滤波器。具体而言,数字滤波器确定实体504用于执行上述步骤204。
根据另一实施例,装置500还用于执行上文结合图3描述的步骤301至303。这里,例如,频率相关正则化参数调整实体503用于执行另外的步骤301至303,以提高通过电声音响系统记录和/或再现的声信号的质量。
此外,根据一实施例,装置500是均衡器。
因此,涉及一种方法和一种装置,均用于控制将通过电声音响系统记录和/或再现的声信号。为此:通过求解逆问题确定初始数字滤波器,其中初始数字滤波器用于控制将通过电声音响系统记录和/或再现的声信号;通过对初始数字滤波器执行时谱心理声学自动音频质量测试,确定频率相关清晰度参数;通过使用频率相关清晰度参数来调整用于确定初始数字滤波器的频率相关正则化参数;以及通过使用调整后的频率相关正则化参数来确定用于控制将通过电声音响系统记录和/或再现的声信号的数字滤波器。
应注意的是,除非有明确排除的组合,否则本文所描述的任何实施例以及任何实施例的特征都可互相组合。
在此结合各种实施例描述了本发明。但本领域技术人员通过实践本发明,研究附图、本发明以及所附的权利要求,能够理解并获得公开实施例的其他变体。在权利要求书中,词语“包括”不排除其它元素或步骤,不定冠词“一”不排除多个。在仅凭某些措施被记载在相互不同的从属权利要求书中这个单纯的事实并不意味着这些措施的结合不能被有效地使用。
Claims (16)
1.一种用于控制将通过电声音响系统记录和/或再现的声信号的方法,其特征在于,所述方法包括以下步骤:
-通过求解逆问题确定初始数字滤波器,其中所述初始数字滤波器用于控制将通过所述电声音响系统记录和/或再现的声信号;
-通过对所述初始数字滤波器执行时谱心理声学自动音频质量测试,确定频率相关清晰度参数;
-通过使用所述频率相关清晰度参数来调整用于确定所述初始数字滤波器的频率相关正则化参数;以及
-通过使用调整后的频率相关正则化参数来确定用于控制将通过所述电声音响系统记录和/或再现的声信号的数字滤波器。
2.根据权利要求1所述的方法,其特征在于,通过对所述初始数字滤波器执行所述音频质量测试来确定所述频率相关清晰度参数包括:
-执行具有声学测试信号的所述初始数字滤波器的卷积;以及
-通过确定所述声学测试信号的两个连续突发之间的预定时间间隔之后的衰减水平,确定所述频率相关清晰度参数。
3.根据权利要求2所述的方法,其特征在于,所述声学测试信号包括重复的突发。
4.根据前述权利要求中任一项所述的方法,其特征在于,通过确定所述逆问题的最小二乘解来确定所述初始数字滤波器。
5.根据权利要求1所述的方法,其特征在于,调整后的频率相关正则化参数是清晰度的递减函数,其最大值可等于偏移量,所述偏移量包括在确定所述初始数字滤波器时确定的频率相关正则化参数。
7.根据权利要求1、2或5中任一项所述的方法,其特征在于,所述初始数字滤波器是均衡滤波器。
8.一种用于控制将通过电声音响系统记录和/或再现的声信号的装置,其特征在于,所述装置包括:
-初始数字滤波器确定实体,用于通过求解逆问题确定初始数字滤波器,其中所述初始数字滤波器用于控制将通过所述电声音响系统记录和/或再现的声信号;
-频率相关清晰度参数确定实体,用于通过对所述初始数字滤波器执行时谱心理声学自动音频质量测试来确定频率相关清晰度参数;
-频率相关正则化参数调整实体,用于通过使用所述频率相关清晰度参数来调整用于确定所述初始数字滤波器的频率相关正则化参数;以及
-数字滤波器确定实体,用于通过使用调整后的频率相关正则化参数来确定用于控制将通过所述电声音响系统记录和/或再现的声信号的数字滤波器。
9.根据权利要求8所述的装置,其特征在于,所述频率相关清晰度参数确定实体用于:
-执行具有声学测试信号的所述初始数字滤波器的卷积;以及
-通过确定所述声学测试信号的两个连续突发之间的预定时间间隔之后的衰减水平,确定所述频率相关清晰度参数。
10.根据权利要求9所述的装置,其特征在于,所述声学测试信号包括重复的突发。
11.根据权利要求8至10中任一项所述的装置,其特征在于,所述初始数字滤波器确定实体用于通过确定所述逆问题的最小二乘解来确定所述初始数字滤波器。
12.根据权利要求8所述的装置,其特征在于,调整后的频率相关正则化参数是清晰度的递减函数,其最大值可等于偏移量,所述偏移量包括在确定所述初始数字滤波器时确定的频率相关正则化参数。
14.根据权利要求8、9或12中任一项所述的装置,其特征在于,所述初始数字滤波器是均衡滤波器。
15.根据权利要求8、9或12中任一项所述的装置,其特征在于,所述装置是均衡器或波束成形器。
16.一种计算机可读存储介质,其特征在于,存储有计算机可读程序代码,用于使计算设备执行根据权利要求1至7中任一项所述的方法的步骤。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2016/075033 WO2018072819A1 (en) | 2016-10-19 | 2016-10-19 | Method and apparatus for controlling acoustic signals to be recorded and/or reproduced by an electro-acoustical sound system |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109863764A CN109863764A (zh) | 2019-06-07 |
CN109863764B true CN109863764B (zh) | 2020-09-08 |
Family
ID=57218863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680090188.0A Active CN109863764B (zh) | 2016-10-19 | 2016-10-19 | 控制将通过电声音响系统记录和/或再现的声信号的方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10743126B2 (zh) |
EP (1) | EP3520443B1 (zh) |
CN (1) | CN109863764B (zh) |
WO (1) | WO2018072819A1 (zh) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6721428B1 (en) * | 1998-11-13 | 2004-04-13 | Texas Instruments Incorporated | Automatic loudspeaker equalizer |
US8682652B2 (en) * | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
WO2010138309A1 (en) * | 2009-05-26 | 2010-12-02 | Dolby Laboratories Licensing Corporation | Audio signal dynamic equalization processing control |
IT1395894B1 (it) | 2009-09-18 | 2012-10-26 | Rai Radiotelevisione Italiana | Metodo per acquisire segnali audio e relativo sistema di acquisizione audio |
FR2995754A1 (fr) * | 2012-09-18 | 2014-03-21 | France Telecom | Calibration optimisee d'un systeme de restitution sonore multi haut-parleurs |
CN105917674B (zh) * | 2013-10-30 | 2019-11-22 | 华为技术有限公司 | 用于处理音频信号的方法和移动装置 |
EP3369257B1 (en) * | 2015-10-27 | 2021-08-18 | Ambidio, Inc. | Apparatus and method for sound stage enhancement |
-
2016
- 2016-10-19 WO PCT/EP2016/075033 patent/WO2018072819A1/en unknown
- 2016-10-19 EP EP16788650.6A patent/EP3520443B1/en active Active
- 2016-10-19 CN CN201680090188.0A patent/CN109863764B/zh active Active
-
2019
- 2019-04-18 US US16/388,592 patent/US10743126B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2018072819A1 (en) | 2018-04-26 |
EP3520443A1 (en) | 2019-08-07 |
US20190246228A1 (en) | 2019-08-08 |
US10743126B2 (en) | 2020-08-11 |
CN109863764A (zh) | 2019-06-07 |
EP3520443B1 (en) | 2021-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7183467B2 (ja) | 少なくとも一つのフィードバック遅延ネットワークを使ったマルチチャネル・オーディオに応答したバイノーラル・オーディオの生成 | |
US10104485B2 (en) | Headphone response measurement and equalization | |
US8082051B2 (en) | Audio tuning system | |
US10028055B2 (en) | Audio signal correction and calibration for a room environment | |
Mertins et al. | Room impulse response shortening/reshaping with infinity-and $ p $-norm optimization | |
JP7410082B2 (ja) | クロストークプロセッシングb-チェーン | |
US9716962B2 (en) | Audio signal correction and calibration for a room environment | |
KR20180088650A (ko) | 고도 렌더링을 실현하는 필터링된 오디오 신호를 생성하기 위한 장치 및 방법 | |
MX2012011203A (es) | Procesador de audio espacial y metodo para proveer parametros espaciales en base a una señal de ntrada acustica. | |
US11380312B1 (en) | Residual echo suppression for keyword detection | |
JP2019083570A (ja) | クロストーク処理の方法 | |
KR102194515B1 (ko) | 회의를 위한 서브밴드 공간 처리 및 크로스토크 제거 시스템 | |
Cadavid et al. | Performance of low-frequency sound zones with very fast room impulse response measurements | |
CN115668986A (zh) | 用于房间校正和均衡的多维自适应传声器-扬声器阵列集的系统、设备和方法 | |
CN109863764B (zh) | 控制将通过电声音响系统记录和/或再现的声信号的方法和装置 | |
Moore et al. | Processing pipelines for efficient, physically-accurate simulation of microphone array signals in dynamic sound scenes | |
KR102573148B1 (ko) | 사운드 교정을 위한 2-채널 공간 전달 함수의 지각적으로-투명한 추정 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |