CN104937955B - 自动的扬声器极性检测 - Google Patents

自动的扬声器极性检测 Download PDF

Info

Publication number
CN104937955B
CN104937955B CN201480005891.8A CN201480005891A CN104937955B CN 104937955 B CN104937955 B CN 104937955B CN 201480005891 A CN201480005891 A CN 201480005891A CN 104937955 B CN104937955 B CN 104937955B
Authority
CN
China
Prior art keywords
loud speaker
impulse response
response
polarity
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480005891.8A
Other languages
English (en)
Other versions
CN104937955A (zh
Inventor
马克·F·戴维斯
路易·D·菲尔德
安东尼奥·马特奥斯·舒莱
朱利奥·琴加莱
苏尼尔·巴里特卡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Dolby Laboratories Licensing Corp
Original Assignee
Dolby International AB
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB, Dolby Laboratories Licensing Corp filed Critical Dolby International AB
Publication of CN104937955A publication Critical patent/CN104937955A/zh
Application granted granted Critical
Publication of CN104937955B publication Critical patent/CN104937955B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers
    • H04R29/002Loudspeaker arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)

Abstract

在一些实施方式中,用于自动检测扬声器例如安装在影院环境中的扬声器的极性的方法。在一些实施方式中,该方法使用一组麦克风来确定一组扬声器(例如,扬声器和/或多驱动器扬声器的驱动器)的相对极性,包括通过以下方式确定相对极性:测量脉冲响应,包括每个扬声器麦克风对的脉冲响应;将扬声器聚类成组的集合,每个组包括在至少一个方面彼此相似的至少两个扬声器;并且针对每个组,对该组中的扬声器的脉冲响应对(例如,脉冲响应的经处理版本对)的互相关进行确定和分析以确定扬声器的相对极性。其他方面包括被配置(例如,被编程)成执行本发明的方法的任何实施方式的系统以及存储用于实现本发明的方法的任何实施方式的代码的计算机可读介质(例如,盘)。

Description

自动的扬声器极性检测
相关申请的交叉引用
本申请要求2013年1月24日提交的美国临时专利申请第61/756,088号的优先权,通过引用将其全部内容合并到本文中。
技术领域
本发明涉及用于检测音频播放系统中的扬声器的极性的系统及方法。典型的实施方式是用于自动检测被安装在影院(影剧院)环境中的扬声器的极性的系统及方法。
背景技术
影院音响行业目前正在经历从广泛使用具有少数声道的多声道扬声器系统(例如,具有5个或7个全范围声道的5.1或7.1声道系统)到使用提供更多个声道(通常,N个全范围声道,其中,12≤N≤64)的新系统的显著变化。扬声器通常位于听者上方的整个半球(hemisphere)之上的这种新系统使得声音能够在该半球内精确定位和运动,并且可以重建更真实的“3D”氛围和混响。在本文中,有时会使用表达“许多声道(many-channel)系统”(相比于“多声道(multi-channel)”系统)来指代新型系统,在该新型系统中,全范围声道的数量远大于7。
预期的是,在典型使用中,许多声道系统将基于幅度平移(amplitude-panning)来平移声源,对于给定的声源,幅度平移强烈地依赖于来自参与再现的几个扬声器(一大组安装的扬声器的子集)的信号的相干性。甚至在与立体声系统一样简单的系统中,如果两个扬声器的响应(幅度和相位)被错误地匹配,则声音的意在在扬声器之间平移的感知位置可以模糊地被呈现,或者甚至在扬声器之间的区域外部。
因此,对于新的许多声道扬声器系统的目前全球部署而言必要的是,技术上可达到确保给定的播放场所中的所有声道被正确地匹配。大多数现有的均衡(equalization)处理关注于对不同声道的幅度响应进行校正,这确保跨声道的音质感知的正确匹配。然而,为了确保遍及整个系统的正确的声音成像,需要解决每个声道的相位响应的匹配。
在许多声道安装中遇到的最常见的问题之一是:大量声道的极性被反转。这通常是由于在建立阶段期间错误的布线或者音频链的部件之一内部的错误布线。后者更难以由安装者检测和修理,因为所有可见的布线实际上是正确的。然而,在这两种情况下,当具有错误的扬声器极性的声道参与声音平移时,将严重地危害声音成像。
此外,在多路有源或无源扬声器系统(具有多个驱动器)中,极性反转会影响驱动器中的仅一个驱动器。当在低音驱动器中发生错误极性时,如心理声学文献中众所周知的,可以如同在全部扬声器极性系统被反转时一样严重地危害声音成像。因此,重要的是不仅确保跨声道的正确的极性匹配而且确保跨单个声道中的不同驱动器的正确的极性匹配。
重要的是,将扬声器极性检测实现为自动的并且避免花费额外时间。发明人已经认识到,为了实现快速和自动的扬声器极性检测,应当避免使用声脉冲群(tone burst)或非对称信号(如在1991年10月4日至8日在纽约举办的第91届音频工程协会会议上D.B.Keen,Jr.提出的论文“Measurement of Polarity Band-Limited Systems(极性带限系统的测量)”)。
随着被安装在典型的播放场所中的声道数量的预期增大,错误极性问题的可能性相应地增大。不幸地,建立许多声道扬声器系统所需要的时间会较长。因此,预期的是,许多声道系统安装者检查和校正错误极性问题的时间通常将较少。因此,会期望提供以下方法:一方面,该方法自动执行这种检测,并且另一方面,该方法不对建立所需要的时间具有显著的影响。后一限制喜好以下方法:不要求针对极性分析具体定制的另外信号的发出和捕获,而是能够重新使用在新安装的扬声器阵列的常规的初始校准或对准(有时称作均衡或剧院均衡)期间正常执行的测量。
最终,期望用于确定扬声器极性的自动方法对于测量麦克风在播放场所中的类型和位置的选择是鲁棒的,以及对于由于在场所中存在不同的扬声器模型以及扬声器在场所中的位置的差异导致的相位响应的细节中的自然差异是鲁棒的。不幸地,延迟、混响和噪声使常规的极性检查方法不准确和/或具有其他问题。
在2006年3月9日公开的美国专利申请公开第2006/0050891号中描述了用于自动确定扬声器相位的常规方法。该方法包括以下步骤:用脉冲驱动扬声器,使用麦克风捕获所产生的发出的声音,根据捕获的音频确定脉冲响应(从扬声器至麦克风),并且通过确定脉冲响应的第一峰(第一峰的幅度的绝对值超过预定阈值)的符号来确定扬声器的极性。如果第一峰的幅度的符号为正,则该方法确定扬声器具有正极性。然而,该方法受制于如下限制:该方法不确定测量的脉冲响应的质量,并且从而会不期望地根据错误测量的响应(例如,仅指示噪声的响应)来确定扬声器极性。
发明内容
在典型的实施方式中,本发明是用于自动检测音频播放系统的扬声器(例如,安装在影院环境中的扬声器)的相对极性的方法。本发明的方法的典型实施方式可以在家庭环境以及影院环境中执行,例如,其中麦克风输出信号的所需要的信号处理在家庭剧院设备(例如,具有用于执行该方法的麦克风的被运送至用户的AVR或蓝光播放器)中被执行。
在第一类实施方式中,本发明是用于使用播放环境中的一组M个麦克风来确定播放环境中的(例如,许多声道播放系统或其他多声道播放系统的)一组N个扬声器的相对极性的方法,其中,M是正整数(例如,M=1或2)并且N是大于1的整数。该方法通常检测声道间的极性反转,其中每个声道包括扬声器(例如,包括一个或更多个驱动器的全范围扬声器),并且还可以检测至少一个声道中的特定驱动器间(即,单个多驱动器扬声器的驱动器间)的极性反转。在第一类的典型实施方式中,该方法包括以下步骤:
(a)测量脉冲响应,包括每个扬声器麦克风对的脉冲响应。通常,这通过以下操作来进行:用宽带激励(例如,如果使用脉冲确定算法,脉冲或噪声信号或正弦波扫描)驱动每个扬声器,获得指示在从每个被驱动的扬声器发出声音期间由每个麦克风捕获的声音的音频数据,并且通过对音频数据进行处理来确定脉冲响应;
(b)将扬声器聚类成组的集合(一个组或多个组),该集合中的每个组包括在至少一个方面彼此相似的至少两个扬声器;以及
(c)针对每个所述组,确定该组中的扬声器的脉冲响应对的互相关,并且根据互相关来确定所述组中的扬声器的相对极性。
由于各自具有域的两个脉冲响应的互相关是具有相同域的函数,所以在本文中可相互交换地使用术语“互相关”和“互相关函数”。如果与所比较的脉冲响应对相对应的扬声器(扬声器或驱动器)同相,则响应的互相关函数的峰值为范围在0与1.0之间的正值(这假定其正值在指出的范围内的归一化的互相关函数。应当假定本文中提及的互相关函数是这样被归一化的)。如果与所比较的脉冲响应对相对应的扬声器180°异相,则响应的互相关函数的峰值是范围在0与-1.0之间的负值。在典型实施方式中,步骤(c)包括以下步骤:(针对每个组)确定与该组中的两个扬声器对应的每对脉冲响应的互相关的峰值,当确定该峰值为正并且超过预定正阈值(通常正阈值的范围为从0.3至0.5)时确定这两个扬声器同相,而当确定该峰值为负并且其绝对值超过预定正阈值时确定这两个扬声器异相。
通常,每个麦克风生成模拟输出信号,并且通过对每个所述模拟输出信号进行采样来生成音频数据,优选地,音频数据被组织成具有足以获得足够低的频率分辨率的帧大小的帧。
可选地,在确定和分析互相关之前,对脉冲响应(或对原始麦克风输出信号)执行处理。通常,该方法的结果是每个组中的具有反转的极性(即,相对于该组中的代表扬声器的极性)的扬声器的列表,其中该列表指示基于每扬声器(全带)或基于每驱动器(其中,扬声器包括多驱动器扬声器的驱动器)的反转的极性。该列表不仅可以指示扬声器同相还是异相,而且还可以指示不与其他扬声器具有清晰的极性关系的扬声器,这可以指示有缺陷的扬声器。这样的列表可以被自动校正算法使用,或简明地用于给扬声器系统安装者标记警告。
与其他技术(例如,峰检测、时间延迟估计和相位分析)相比,使用互相关分析提供了若干优点,包括提供连续估计和鲁棒性。
对所比较的扬声器进行聚类(在本文中有时被称为分组)是本发明的典型实施方式的重要步骤。仅当与分组一起使用时,才能够充分开发互相关分析。在不进行分组的情况下,可以根据迥然不同的扬声器(例如,因为它们具有不同的类型或模型,例如屏幕上扬声器或环绕扬声器,或者因为它们位于迥然不同的位置)的脉冲响应对来确定互相关,这将总是产生很低的峰互相关,并且将不提供指示相对极性的有用的结果。对所比较的扬声器进行聚类使得互相关分析能够受限于相似的扬声器的组,并且从而提高本发明的方法在确定相对极性时的有效性。
在本发明的典型实施方式中执行的聚类通常是以下两种不同类型的聚类中之一:
基于指示扬声器的特性(例如,它们在房间中的位置、每个扬声器的类型、等等)的数据的聚类。这种类型的聚类有时被称为“类型1聚类”。类型1聚类所基于的数据通常被预先确定,并且可以按照各种不同的方式中的任意方式,例如通过读取手工编写的文件或通过从测量的脉冲响应推断(例如,通过从测量的脉冲响应得到房间中的位置,并且从测量的脉冲响应推断被测量的扬声器是否是全带宽)来生成(或被提供至实现本发明的方法的处理器);以及
根据如下算法的聚类,该算法依赖于根据扬声器对的脉冲响应确定的互相关(例如,互相关的峰值)。这种类型的聚类在本文中有时被称为“类型2聚类”。类型2聚类的主要目的是形成具有高的扬声器间相关值的子组。然而,类型1聚类假定相似的扬声器位置和响应将产生高的互相关值,类型2聚类直接使用测量的互相关值。
在本发明的一些实施方式中执行的聚类是类型1聚类和类型2聚类两者的组合(例如,基于指示扬声器的特性的数据的初始聚类,在此之后是基于测量的互相关值初始确定的集群的修改,或同时执行的类型1聚类和类型2聚类)。例如,如果互相关分析发现扬声器相比于初始确定的集群中的其他扬声器不具有清晰的相关,则该扬声器可以从该集群中去除并且被置于另一集群中。
在典型实施方式中,在互相关计算之前,对确定的脉冲响应执行额外的信号处理,以增加互相关值的鲁棒性和显著性或者使得该算法能够检测单个(多驱动器)扬声器中的各个驱动器的极性反转。如下面详细地说明的,这样的信号处理通常包括以下处理中至少之一:带通滤波以选择相关的驱动器;时间加窗(在本文中也称为选通或加窗)以降低房间影响;以及频带的加权(例如,对数加权)以避免对高频进行过加权。时间加窗可以是频率相关的时间加窗。时间加窗也可以用于通过去除所获取的记录中的没有信号仅有噪声的时段来降低噪声影响。
通常执行两种时间加窗操作。第一种对原始记录进行选通,原始记录不一定是脉冲(通常其不是脉冲,因为脉冲通常具有低SNR),并且通常在由房间和麦克风噪声居主导的激励前后具有“静默”时段。在得到脉冲响应之前,第一选通从记录中去除静默时段。第一选通通常要求原始麦克风记录与原始激励的时间对准。在得到全长度脉冲响应(其持续时间可以是几秒)之后,第二选通减小(或以其他方式加窗)脉冲响应的持续时间以去除另外的噪声和房间影响。
在一些实施方式中执行的时间加窗包括将脉冲响应乘以提供淡入和淡出的函数。时间加窗通常是频率相关的,例如,较长的脉冲响应被保留在低频处而较短的脉冲响应被保留在高频处。
在一些实施方式中,本发明是用于检测一组扬声器(例如,一组多驱动器扬声器的每个驱动器)的相对极性的方法,所述方法包括以下步骤:
1.依次用宽带激励驱动每个扬声器,并且获得指示在从每个驱动的扬声器发出声音期间由至少一个麦克风捕获的声音的音频数据。通常,用宽带激励依次驱动每个扬声器,使用一个或更多个麦克风捕获从每个驱动的扬声器发出的声音,并且与对扬声器序列的驱动激励的施加时钟同步地记录所捕获的音频(每个麦克风的输出);
2.根据音频数据(例如,原始记录)确定从每个扬声器(扬声器或其驱动器)至每个麦克风的脉冲响应。虽然保持了房间混响,但是在该操作中隐含的求平均有助于抑制记录中存在的任何噪声;
3.优选地,对脉冲响应进行时间加窗以去除由房间反射居主导的部分。通常,针对宽带扬声器,窗口周期从-1毫秒延伸至2.5毫秒(相对于初始峰),而针对低音炮为从-10毫秒延伸至25毫秒;
4.对于每个麦克风,针对扬声器(扬声器或驱动器)脉冲响应对来计算互相关函数,并且根据该互相关函数确定扬声器对的相对相位。可选地,在确定互相关函数之前,脉冲响应被均衡和/或带通滤波。虽然不同位置的扬声器通常具有不同的不相关的混响尾部(reverberation tail),但是互相关的确定倾向于抑制混响,并且从而提供极性相关的互相关结果。通常,确定每对脉冲响应(对应于两个扬声器)的互相关的峰值,并且该方法包括以下步骤:当确定互相关的峰值为正并且超过预定正阈值(通常正阈值的范围为0.3至0.5)时确定这两个扬声器同相,当确定互相关的峰值为负并且其绝对值超过预定正阈值时确定这两个扬声器异相。
还可选地,还执行以下步骤中至少之一:
5.在模棱两可的情况下,遍及至少三个所使用的麦克风测量根据扬声器(扬声器或驱动器)对而确定的互相关函数,并且使用投票模式(即,执行投票操作或加权平均)来选择扬声器对的最终极性(例如,其中针对N个麦克风中的每个确定互相关,其中N是大于2的奇整数,将由N个互相关中的大多数指示的极性选择为扬声器对的极性);以及
6.由于当不存在明确定义的宽带极性关系时不相似的模型的扬声器有时会产生极性的伪正指示(正或负),所以所比较的扬声器(扬声器或驱动器)被分成不同的组,每个组由其间存在由针对扬声器对确定的互相关函数指示的强相关的扬声器组成(这是类型2聚类的示例)。通常,如果由针对扬声器(使用任意麦克风)确定的互相关函数不指示强相关,则扬声器被分配至不同的组。通过在每个扬声器(最初被分配至第一组)与一组其他扬声器(包括被分配至至少一个其他组的扬声器)中的每个扬声器之间比较互相关,并且如果从该扬声器与不同组中的扬声器的互相关得到较强,更一致的极性指示,则将该扬声器重新分配至不同的组中,来降低伪正(正或负相对极性的伪指示)的风险。分组也可以依赖于观察的频率响应(例如,宽带扬声器或低音炮应当被置于不同的组中)。在一些情况下,系统配置文件对于关于要比较其极性的扬声器的信息是可用的,然后该信息可以用于改进扬声器至组的分配。
在另一类实施方式(实现类型1聚类)中,本发明是用于检测扬声器的集合中的每个扬声器的极性的方法,所述方法包括以下步骤:
1.用宽带激励驱动每个扬声器,并且获得指示在从每个被驱动的扬声器发出声音期间由至少一个麦克风捕获的声音的音频数据。通常,用宽带激励依次驱动每个扬声器,使用一个或更多个麦克风捕获从每个被驱动的扬声器发出的声音,并且与对扬声器序列的宽带激励的施加时钟同步地记录所捕获的音频(每个麦克风的输出);
2.根据音频数据(例如,原始记录)确定从每个扬声器(扬声器或其驱动器)至每个麦克风的脉冲响应。虽然保持了房间混响,但是在该操作中隐含的求平均有助于抑制记录中存在的任何噪声;
3.优选地,对脉冲响应进行时间加窗以去除由房间反射居主导的部分。通常,针对宽带扬声器,窗口周期从-1毫秒延伸至2.5毫秒(相对于初始峰),而针对低音炮,从-10毫秒延伸至25毫秒;
4.响应于指示扬声器的特性(例如,它们在房间中的位置、每个扬声器的类型,等等)的数据来确定扬声器(扬声器或驱动器)的组。这样的数据通常被预先确定,并且可以以各种不同的方式中的任意方式来生成(或被提供至实现本发明的方法的处理器)。例如,该数据可以从手工编写的文件读取或者从测量的脉冲响应来推断(根据脉冲响应,通常可以推断扬声器在房间中的位置、其是否是全带宽等等);以及
5.选择扬声器的每个组的代表扬声器,计算代表扬声器与组中的每个其他扬声器之间的每个互相关的绝对值的最大值的位置,并且计算每个所述互相关在每个所述位置处的符号。如果该符号为负,则确定该组的扬声器相对于该组的代表扬声器的极性具有反转极性。涉及扬声器对的互相关函数可以遍及所有使用的麦克风被测量,并且可以使用投票模式(即,可以执行投票操作或加权平均)来选择该对的最终极性。
可选地,对确定的脉冲响应或原始麦克风输出信号(在根据经处理的脉冲响应或根据经处理的麦克风输出信号确定的脉冲响应确定互相关函数之前)执行以下处理操作中至少之一:
原始记录或脉冲响应的带通滤波,以将互相关分析集中于频谱的不同部分。可选地,可以根据已知的交叉频率设置带通滤波器的参数;
对原始记录或脉冲响应的频谱进行预处理(例如,通过频带的对数加权),以例如通过每倍频程滤波器将频谱乘以-3dB来给所有倍频程进行相似的加权。除非执行这样的处理,否则互相关会使高频比低频加权更多,从而导致在检测仅低音驱动器极性问题时成功率较低;以及
脉冲响应的时间选通(可能地,频率相关的时间选通)。该处理(在本文中有时被称为加窗)通常增大在互相关中获得的索引,因为其过滤掉脉冲响应的由于第一回弹和混响导致的部分。从而,通过仅考虑来自每个扬声器的直接声音来增强鲁棒性。
这三种类型的处理步骤可以在其自身之间组合,并且也可以与其他处理步骤组合。我们不限制可选的信号处理操作(带通滤波、频率加权和加窗)的特定顺序。它们可以按任何期望的顺序来执行,只是加窗处理不与其他处理交换(导致迥然不同的结果),所以如果处理操作的序列包括加窗,应当确定该序列以实现期望的结果。
在本发明的方法的第二类实施方式中,通过将相位确定为所测量的时间选通脉冲响应的频率的函数来确定播放系统的扬声器的极性。在该类中,该方法包括以下步骤:
1.依次用宽带激励驱动每个扬声器,使用一个或更多个麦克风捕获从每个扬声器发出的所产生的声音,并且与对扬声器序列的宽带激励的施加时钟同步地记录所捕获的音频(每个麦克风的输出);
2.根据所捕获的音频(例如,原始记录)确定从每个扬声器(扬声器或其驱动器)至每个麦克风的脉冲响应,并且响应于每个所述脉冲响应通过对脉冲响应进行时间选通以去除由房间反射居主导的部分来生成时间选通脉冲响应;以及
3.通过确定时间选通脉冲响应在每个感兴趣的频率处的相位更接近0°还是更接近180°(分别指示非反转的极性或反转的极性),根据所述每个扬声器的至少一个所述时间选通脉冲响应来将每个扬声器的相对极性确定为频率的函数。在典型实施方式中,每个扬声器(在每个频率处)的相对极性的确定包括以下两种操作之一:
对扬声器的时间选通脉冲响应的频率响应执行最小相位整平以确定经整平的时间选通脉冲响应(通常,整平步骤去除由扬声器或房间的最小相位值引起的相位分量以将分析仅集中于由极性差异引起的相位差),并且如果扬声器的经整平的时间选通脉冲响应的带通滤波版本(其中,通带以相关频率为中心)的最大(或第一)峰的绝对水平为正,则确定相对极性是非反转的(即,相对于某个代表扬声器的极性),而如果经整平的时间选通脉冲响应的带通滤波版本的最大(或第一)峰的绝对水平对应于负值,则确定相对极性是反转的(即,相对于该代表扬声器的极性);或者
确定扬声器的时间选通脉冲响应的时间延迟(即,脉冲响应的第一(或最大)正峰的出现时间相对于驱动脉冲的发出时间,假定驱动脉冲具有正的峰幅度),使用该时间延迟对时间选通脉冲响应执行粗延迟校正(以及可选地还有附加延迟校正)以确定经校正的脉冲响应,其中附加延迟校正包括加上或减去小的额外延迟使得经校正的脉冲响应的相位响应在某个高频率(例如,15kHz或20kHz)处的展开相位至少基本上等于0(在已经执行粗延迟校正和附加延迟校正两者之后),并且如果经校正的脉冲响应的相位在范围-90°≤相位<90°内,则确定相对极性在感兴趣的频率处是非反转的(相对于某个代表扬声器的极性),而如果经校正的脉冲响应的相位在范围90°≤相位≤180°或范围-180°≤相位<-90°内,则确定相对极性在感兴趣的频率处是反转的(相对于代表扬声器的极性)。通常在频域中通过对扬声器的时间选通脉冲响应执行时域至频域变换,确定相位频谱并且从扬声器的时间选通脉冲响应的相位值减去作为与延迟相关联的频率的函数的线性相移来执行附加时间延迟校正。
本发明的方法的第二类实施方式具有本质上频率选择性的优势。遍及整个音频频率范围的频率集合中的每个频率处的极性的评估具有以下益处:能够检测每个各自驱动器的极性或多驱动器扬声器的交叉。
通常,针对每个扬声器,对每个从扬声器到至少两个麦克风的集合中的不同的麦克风的时间选通脉冲响应集合执行该方法,并且扬声器在每个感兴趣的频率(每个通带的中心频率)处的最终极性得分基于所有麦克风的带通滤波的、时间选通脉冲响应相位评定的多数投票或加权平均。
在本发明的方法的第三类实施方式中,使用峰值跟踪技术确定针对每个扬声器已经测量的脉冲响应的第一峰来确定播放环境中的扬声器(例如,播放系统的扬声器)的极性。在该类中,该方法包括以下步骤:使用宽带激励驱动扬声器,使用麦克风捕获从给扬声器发出的所产生的声音,根据捕获的音频确定脉冲响应(从扬声器至麦克风),并且通过确定脉冲响应的其幅度的绝对值超过预定阈值的第一峰的符号来确定扬声器的极性。如果已知或假定扬声器的脉冲响应的直接部分中的正向第一峰对应于正极性并且扬声器的脉冲响应的直接部分中的负向第一峰对应于负极性(假定负极性麦克风),则该方法确定每个扬声器的绝对极性。该类中的每个方法还基于麦克风扬声器间房间脉冲响应分析来提供每个脉冲响应的质量的指示。在典型的实现中,用于确定极性的每个脉冲响应的质量由迭代索引(“j+1”)确定,该索引指示脉冲响应的第一峰的迭代确定所需要的迭代次数。
第三类中的典型实施方式包括以下步骤:
(a)用宽带激励驱动扬声器,并且使用至少一个麦克风来捕获从该扬声器发出的所产生的声音,从而生成每个所述麦克风的输出信号;
(b)针对每个所述麦克风,根据麦克风的输出信号来确定指示脉冲响应(从扬声器至麦克风)的音频值序列;
(c)根据每个所述音频值序列,通过确定其幅度的绝对值超过预定阈值的第一峰(由序列指示)的符号来确定扬声器的极性;以及
(d)确定脉冲响应的质量的度量,
其中,步骤(c)包括以下步骤:
(e)确定所述序列中的值的子集,使得所述子集中的每个值的绝对值超过预定阈值,并且确定与该子集中的具有最大绝对值的值对应的时间(例如,标识值中之一的时间索引)(即,确定与该子集中的其绝对值等于或大于该子集中的所有其他值的绝对值的值对应的时间);以及
(f)通过丢弃该子集中的与晚于在步骤(e)中确定的所述时间的时间对应的所有值来生成值的缩减子集,直到该缩减子集由单个值构成,将该单个值识别为由该序列指示的第一峰,并且确定所述单个值的符号,以及
步骤(d)包括以下步骤:确定数A*(j+1)+B,其中,j是确定值的由该缩减子集的单个值构成的缩减子集而执行的步骤(e)和步骤(f)的迭代次数,*表示乘法,以及A和B是非负数(例如,A=1和B=0),并且将该数A*(j+1)+B识别为脉冲响应的质量的度量。
本发明的方面包括被配置成(例如,被编程成)执行本发明的方法的任何实施方式的系统以及存储用于实现本发明的方法的任何实施方式的代码的计算机可读介质(例如,盘)。
在一些实施方式中,本发明的系统是或者包括至少一个麦克风(每个所述麦克风在系统操作期间被定位来执行本发明的方法的实施方式以捕获从其极性要被确定的一组扬声器发出的声音)以及被耦合以接收来自每个所述麦克风的麦克风输出信号的处理器。该处理器可以是通用或专用处理器(例如,音频数字信号处理器),并且用软件(或固件)被编程和/或以其他方式被配置成响应于每个所述麦克风输出信号来执行本发明的方法的实施方式。在一些实施方式中,本发明的系统是或者包括通用处理器,其被耦合以接收输入音频数据(例如,响应于从被监视的一组扬声器发出的声音而指示至少一个麦克风的输出)。该处理器被编程(用适当的软件和/或固件)以响应于输入音频数据来生成(通过执行本发明的方法的实施方式)输出数据,使得输出数据指示扬声器的状态。
符号和术语
贯穿包括权利要求在内的本公开内容,“对”信号或数据执行操作(例如,对信号或数据进行滤波、缩放或变换)的表达用于在广义上表示对信号或数据、或对信号或数据的已处理版本(例如,在对信号执行操作之前已经经历了初步滤波的信号的版本)直接执行操作。
贯穿包括权利要求在内的本公开内容,表达“系统”用于在广义上表示设备、系统或子系统。例如,实现解码器的子系统可以称为解码器系统,并且包括这样的子系统的系统(例如,响应于多个输入生成X个输出信号的系统,在该系统中,子系统生成M个输入,并且其他X-M个输入从外部源接收)也可以被称为解码器系统。
贯穿包括权利要求在内的本公开内容,下面的表达具有下面的定义:
扬声器(speaker)和扬声器(loudspeaker)同义地用于表示任何发声变换器。从而,扬声器可以被实现为多个变换器或驱动器(例如,低频扬声器和高频扬声器)或单个变换器或驱动器;
扬声器馈送:直接应用到扬声器的音频信号,或应用到串联的放大器和扬声器的音频信号;
声道(或“音频声道”):单声道音频信号;
音频节目:一个或更多个音频声道的集合,以及可选地还包括描述期望的空间音频呈现的相关联的元数据;以及
呈现(render):将音频节目转换成一个或更多个扬声器馈送的处理,或将音频节目转换成一个或更多个扬声器馈送并且使用一个或更多个扬声器将扬声器馈送转换成声音的处理(在后者情况下,在本文中有时将呈现称为“通过”扬声器进行的呈现)。
附图说明
图1是在根据本发明的实现类型1聚类的一类实施方式的扬声器极性确定期间执行的步骤的流程图。
图2是在根据本发明的实现类型2聚类的一类实施方式的扬声器极性确定期间执行的步骤的流程图。
图3是安装有扬声器S1至S9(以及可选地还有另外的扬声器)并且定位有麦克风M1、M2和M3以及编程的处理器2的播放环境1(可以是电影剧院的房间)的图。本发明的系统的实施方式包括处理器2以及与处理器2耦合的麦克风M1至M3,其中处理器2被编程成对每个麦克风M1至M3的输出的样本执行本发明的方法的实施方式。
图4是一组两个曲线图:上曲线图是使用麦克风测量的扬声器的脉冲响应(相对于时间标绘的幅度);以及下曲线图是上曲线图的一部分的放大版本。
图5是另一组两个曲线图:上曲线图是使用麦克风测量的扬声器的脉冲响应(相对于时间标绘的幅度);以及下曲线图是上曲线图的一部分的放大版本。
具体实施方式
本发明的很多实施方式在技术上是可行的。根据本公开内容,如何实现它们对本领域中的普通技术人员而言是明显的。将参照图1至图5来描述本发明的系统及方法的实施方式。
我们应当参照图3更详细地描述示例实施方式。实施方式使用一组M个麦克风(包括麦克风M1、M2和M3,并且可选地还包括另外的麦克风)以及与麦克风耦合的编程的处理器2来确定N个扬声器(包括扬声器S1、S2、S3、S4、S5、S6、S7、S8和S9,并且通常还包括另外的扬声器)或每个包括多个驱动器的扬声器的各个驱动器的极性。每个麦克风被配置成响应于入射声音来产生麦克风输出信号。通过对每个麦克风的输出信号进行采样来生成音频数据,处理器2执行本发明的方法来处理音频数据。可以在该处理器中或该系统的其他元件中(例如,在每个麦克风中)执行采样。处理器2可以输出(或被提供)驱动每个扬声器的信号(或每个这样的信号的缩放版本或其他版本),并且处理器2可以使用每个这样的信号与每个麦克风的输出一起来实现本发明的典型实施方式。
通常在房间1中执行示例方法,房间1可以是电影剧院或播放环境。如图3所示,三个扬声器(S1、S2和S3)以及通常还有显示屏(未示出)被安装在房间1的前墙上。另外的扬声器(通常包括至少一个低音炮)被安装该房间中的其他地方。每个麦克风M1、M2和M3的输出根据本发明的方法的实施方式被处理(通过与其耦合的适当地被编程的处理器2)。
在示例实施方式中,本发明是用于检测多声道(例如,许多声道)播放系统的扬声器的相对极性(例如,扬声器之间的极性反转)的方法。该方法通常检测声道间的极性反转,其中每个声道包括扬声器(例如,包括一个或更多个驱动器的全范围扬声器),并且该方法还可以检测至少一个声道中的特定扬声器间的极性反转(即,单个多驱动器扬声器(例如扬声器S1至S9之一的多驱动器实现)的驱动器间的极性反转)。该方法包括以下步骤:测量扬声器的脉冲响应;将测量了其脉冲响应的扬声器聚类成组的集合(一个组或多个组),每个组包括至少两个扬声器;以及对每个组的脉冲响应(例如,脉冲响应的经处理版本)的互相关进行分析以确定所述每个组中的扬声器的相对极性。可选地,在确定和分析互相关之前,对脉冲响应(或对原始麦克风输出信号)执行处理。通常,该方法的结果是具有反转的极性的扬声器列表,其中该列表指示基于每扬声器(全频带)或者基于每驱动器的反转的极性。这样的列表可以被自动校正算法使用,并且简单地用于给扬声器系统安装者标记警告。
与其他技术(例如,峰值检测、时间延迟估计和相位分析)相比,使用互相关分析提供了若干优点,包括连续估计的提供和鲁棒性。
互相关分析比测量脉冲响应的峰并且检测每个峰的符号的常规分析更鲁棒。这是因为,虽然即使在错误测量的响应(例如,指示仅噪声的响应)的情况下也可以(不希望地)检测脉冲响应的峰,但是这样错误测量的响应之间的互相关将产生很低的值(在这种情况下,它们将通常不被解释为指示相对极性)。此外,脉冲响应的所检测到的峰的符号(不希望地)强烈依赖于响应的高频内容,而脉冲响应之间的互相关仅当全部被比较的信号相似时产生高的值。此外,对于分布式环绕扬声器(由单个共同的信号馈送的多个扬声器)而言,峰检测方法会产生模棱两可的结果,而互相关分析将提供有用的结果。
互相关分析自然地产生连续估计而非仅二进制结果(正极性或负极性的指示),这自然地量化所比较的声道的响应的相似程度。然而,峰检测迫使即使在不确定的情况下也作出决定,连续极性估计使得该算法能够更智能地操作。
对所比较的扬声器进行聚类(在本文中有时被称为分组)是本发明的典型实施方式的重要步骤。仅当与分组一起使用时,才能够充分挖掘互相关分析。在不进行分组的情况下,可以对迥然不同的扬声器(例如,因为它们具有不同的类型或模型,例如屏幕上扬声器或环绕扬声器,或者因为它们位于迥然不同的位置)的脉冲响应执行互相关,这将总是产生互相关的很低的值,并且将不提供指示相对极性的有用的结果。对测量的扬声器进行聚类使得互相关分析能够受限于相似扬声器的组,并且从而提高本发明的方法在确定相对极性时的有效性。
在本发明的典型实施方式中执行的聚类可以是以下两种不同类型的聚类之一:
基于指示测量的扬声器的特性(例如,它们在房间中的位置、每个扬声器的类型或模型,等等)的数据的聚类。这种类型的聚类有时被称为“类型1聚类”。类型1聚类可以基于的数据通常被预先确定,并且可以按照各种不同的方式中的任意方式,例如通过读取手工编写的文件或通过从测量的脉冲响应推断(例如,通过从测量的脉冲响应得到在房间中的位置,并且从测量的脉冲响应推断被测量的扬声器是否是全带宽)来生成(或被提供至实现本发明的方法的处理器)。可能的所得到的组的示例包括以下:屏幕扬声器、墙环绕扬声器、天花板扬声器和低音炮;以及
根据如下算法的聚类,该算法依赖于根据测量的扬声器对的脉冲响应确定的互相关值。这种类型的聚类在本文中有时被称为“类型2聚类”。类型2聚类的主要目的是形成具有高的扬声器间相关值的子组。然而,类型1聚类假定相似的扬声器位置和响应将产生高的互相关值,类型2聚类直接使用测量的互相关值。
图1是根据本发明的实现类型1聚类的一类实施方式的扬声器极性确定的图。
图2是根据本发明的实现类型2聚类的一类实施方式的扬声器极性确定的图。
在本发明的典型实施方式中,在确定响应之间的互相关(或者以其他方式根据互相关确定扬声器极性)之前,对测量的脉冲响应执行另外的信号处理,例如,以增加根据响应确定的互相关值的鲁棒性和显著性,或者以使得本发明的方法的实施方式能够检测单个(多驱动器)扬声器中的各个驱动器的极性反转。如下面详细地说明的,这样的信号处理通常包括以下处理中至少之一:带通滤波以选择相关的驱动器;时间加窗(例如,频率相关的时间加窗)以降低房间影响;以及频带的加权(例如,对数加权)以避免对高频进行过加权。
在一类实施方式(包括图2的实施方式)中,本发明是用于检测一组扬声器(例如,一组多驱动器扬声器的每个驱动器)的相对极性的方法,所述方法包括以下步骤:
1.依次用宽带激励驱动每个扬声器,使用一个或更多个麦克风捕获从每个扬声器发出的所产生的声音,并且通常还与对扬声器序列的宽带激励的施加时钟同步地记录所捕获的音频(每个麦克风的输出);
2.根据捕获的音频(即,原始记录)确定从每个扬声器(或其驱动器)至每个麦克风的脉冲响应。虽然保持了房间混响,但是在该操作中隐含的求平均有助于抑制记录中存在的任何噪声。图2的步骤101实现这些步骤1和步骤2;
3.优选地,对脉冲响应进行时间加窗以去除由房间反射居主导的部分。通常,针对宽带扬声器,窗口周期从-1毫秒延伸至2.5毫秒(相对于初始峰),而针对低音炮,其从-10毫秒延伸至25毫秒。加窗还导致快速处理。图2的可选的步骤103通常实现在步骤101中确定的脉冲响应的加窗;
4.对于每个麦克风,针对扬声器(扬声器或驱动器)脉冲响应对来计算互相关函数。可选地,在确定互相关函数之前,脉冲响应被均衡和/或带通滤波。图2的步骤125实现每对脉冲响应的互相关函数的这样的确定。虽然不同位置中的扬声器通常具有不同的不相关的混响尾部,但是互相关的确定倾向于抑制混响,并且从而提供极性相关的互相关结果。如果所比较的扬声器(扬声器或驱动器)同相,则扬声器的响应的相关函数的峰将为正并且接近值1.0。如果所比较的扬声器(扬声器或驱动器)180°异相,则相关峰将为负并且接近-1.0。相关函数的峰的阈值(通常其绝对值的范围为0.3至0.5的阈值)被用作所比较的扬声器之间是否存在正(或负)极性关系的标准。
此外可选地,还执行以下步骤中至少之一:
5.在模棱两可的情况下,遍及所有使用的麦克风测量根据扬声器(扬声器或驱动器)对来确定的互相关函数,并且可以使用投票模式(即,可以执行投票操作或加权平均)来选择扬声器对的最终极性(例如,其中针对N个麦克风中每个确定互相关,其中N是奇整数,由N个互相关中的大多数指示的极性被选择为扬声器对的极性);以及
6.由于当不存在明确定义的宽带极性关系时不相似的模型的扬声器有时会产生极性(正或负)的伪正指示,所以所比较的扬声器(扬声器或驱动器)被分成不同的组,每个组由其间存在由针对扬声器对而确定的互相关函数指示的强相关的扬声器构成(这是类型2聚类的示例)。图2的步骤125实现扬声器的这样的分组以及每个组中的每对扬声器的互相关函数的确定,以确定每个组中的每个扬声器的极性(例如,如图2所示,步骤125根据也在步骤125中确定的互相关函数来确定扬声器的“K”个组,其中K是大于2的整数,并且步骤125确定组中的第一组中的每个扬声器的极性值127以及组中的第“K”个组中的每个扬声器的极性值127K)。通常,如果由针对扬声器(使用任意麦克风)确定的互相关函数不指示强相关,则扬声器被分配至不同的组。通过在每个扬声器(最初被分配至第一组)与一组其他扬声器(包括被分配至至少一个其他组的扬声器)中的每个扬声器之间比较互相关并且如果从该扬声器与不同组中的扬声器的互相关发现较强更一致的极性指示则将该扬声器重新分配至不同的组中,来降低伪正(正或负相对极性的伪表示)的风险。理想地,这应涉及最小数量的比较以使计算时间最小化。分组还可以依赖于观察的频率响应(例如,宽带扬声器或低音炮应当被置于不同的组中)。在一些情况下,系统配置文件对于关于要比较其极性的扬声器的信息是可用的,然后这可以用于改进扬声器至组的分配。
在另一类实施方式(实现类型1聚类)中,本发明是用于检测一组扬声器(例如,一组多驱动器扬声器的每个驱动器)的相对极性的方法,所述方法包括以下步骤:
1.依次用宽带激励驱动每个扬声器,使用一个或更多个麦克风捕获从每个扬声器发出的所产生的声音,并且通常还与对扬声器序列的宽带激励的施加时钟同步地记录所捕获的音频(每个麦克风的输出);
2.根据捕获的音频(例如,原始记录)确定从每个扬声器(扬声器或其驱动器)至每个麦克风的脉冲响应。虽然保持了房间混响,但是在该操作中隐含的求平均有助于抑制记录中存在的任何噪声。图1的步骤101实现这些步骤1和步骤2;
3.优选地,对脉冲响应进行时间加窗以去除由房间反射居主导的部分。图1的可选步骤103通常实现在步骤101中确定的脉冲响应的加窗。通常,针对宽带扬声器,窗口周期从-1毫秒延伸至2.5毫秒(相对于初始峰),而针对低音炮,其从-10毫秒延伸至25毫秒;
4.响应于指示扬声器的特性(例如,它们在房间中的位置、每个扬声器的类型,等等)的数据来确定扬声器(扬声器或驱动器)的组。这样的数据通常被预先确定,并且可以以各种不同的方式中的任意方式来生成(或被提供至实现本发明的方法的处理器)。例如,该数据可以从手工编写的文件读取或者从测量的脉冲响应来推断(根据脉冲响应,其通常可以推断扬声器在房间中的位置、其是否是全带宽,等等)。图1的步骤107根据扬声器配置数据105确定扬声器的“K”个组(如图1指示的组109至组109K),其中K是大于1的整数;以及
5.选择扬声器的每个组的代表扬声器,计算代表扬声器与组中的每个其他扬声器之间的每个互相关的绝对值的最大值的位置,并且计算每个所述位置处的每个所述互相关的符号。如果该符号为负,则确定该组的扬声器相对于该组的代表扬声器的极性具有反转极性。图1的每个步骤111至111K确定图1的扬声器组109至109K中对应的一组的代表扬声器,并且计算组109至109K中对应的一组中的扬声器的互相关函数。如图1所示,步骤111确定组109中的N个扬声器的相对极性值113至113N,并且步骤111K确定组109K中的M个扬声器的相对极性值114至114M。可以遍及所有使用的麦克风测量涉及扬声器对的互相关函数,并且可以使用投票模式来选择该对的最终极性。
可选地,对所确定的脉冲响应或原始麦克风输出信号执行以下处理操作中至少之一(在根据经处理的脉冲响应或根据经处理的麦克风输出信号确定的脉冲响应确定互相关函数之前):
原始记录或脉冲响应的带通滤波,以将互相关分析集中于频谱的不同部分。图1(或图2)的可选步骤103通常实现在图1(或图2)的步骤101中确定的脉冲响应的带通滤波。可选地,可以根据已知的交叉频率设置带通滤波器的参数;
对原始记录或脉冲响应的频谱进行预处理(例如,通过频带的对数加权),以例如通过每倍频程滤波器(per octave filter)将频谱乘以-3dB来给所有倍频程进行相似的加权。图1(或图2)的可选步骤103通常实现在图1(或图2)的步骤101中确定的脉冲响应的这样的均衡。在一些情况下,除非执行这样的处理,否则互相关会使高频比低频加权更多,从而导致在检测仅低音驱动器极性问题时成功率较低;以及
脉冲响应的时间选通(例如,频率相关的时间选通)。该处理(在本文中有时被称为加窗)通常增大在互相关中获得的索引,因为其过滤掉每个脉冲响应的由于第一回弹和混响导致的部分。从而,通过仅考虑来自每个扬声器的直接声音来增强鲁棒性。图1(或图2)的可选步骤103通常实现在图1(或图2)的步骤101中确定的脉冲响应的这样的加窗。
这三种类型的处理步骤可以自己组合,并且也可以与其他处理步骤组合。它们在确定多驱动器扬声器的一个驱动器(例如,低频扬声器或低音驱动器)相对于扬声器的另一驱动器(例如,高频扬声器)的极性方面尤其有用。例如,如果两个驱动器扬声器的低音驱动器被错误地接线(以相对于其他驱动器的极性具有反转极性),则通常扬声器的频率响应在靠近交叉频率处存在显著的下降,因为交叉滤波器强烈地依赖于在两个驱动器中具有正确的极性。频率响应的该下降可以使当这样的扬声器与其他扬声器共同参与时产生的声像严重地退化。原因在于声音成像强烈地依赖于扬声器间在低频(通常低于800Hz)处的相位相干。通过如下两次利用本发明的方法(针对每个麦克风),可以确定两个驱动器的相对极性:一次对于用低于交叉频率的通带(以及可选地还用脉冲响应的频带的对数加权和/或时间选通)滤波的脉冲响应通带,并且另一次对于用高于交叉频率的通带(以及可选地还用脉冲响应的频带的对数加权和/或时间选通)滤波的脉冲响应通带。
在本发明的一些实施方式中执行的聚类是类型1聚类和类型2聚类两者的组合(例如,基于指示扬声器的特性的数据的初始聚类,在此之后是基于所测量的互相关值的初始确定的集群的修改,或同时执行的类型1聚类和类型2聚类)。例如,如果互相关分析发现扬声器相比于初始确定的集群中的其他扬声器不存在清晰的相关,则该扬声器可以从该集群中被去除,并且被置于另一集群中。
在典型的实施方式中,存在对扬声器对的基于相关的极性分析的三种可能的结果:同相、反相和非可识别的相对相位(即,由于低相关峰,这可以指示有缺陷的扬声器)。组(集群)内的所有扬声器应当具有某种可识别的相位关系,正或负。与组中其他扬声器不具有相位关系的扬声器被分成它们自己的组。典型实施方式中的分组确定将类型1聚类和类型2聚类组合成单个处理块,该单个处理块将配置文件连同相关分析一起考虑以得到最终分组。
在本发明的一些实施方式中,用于确定相关极性的阈值在分析期间自动变化,以适配变化的信号条件。
在本发明的方法的第二类实施方式中,通过将相位确定为测量的时间选通脉冲响应的频率的函数来确定播放系统的扬声器的极性。图3的编程的处理器2可以被编程成执行这样的实施方式以确定安装在房间1中的扬声器(或一个或更多个这样的扬声器的各个驱动器)的相对极性。在该类中,该方法包括以下步骤:
1.依次用宽带激励驱动每个扬声器,使用一个或更多个麦克风捕获从每个扬声器发出的所产生的声音,并且与对扬声器序列的宽带激励的施加时钟同步地记录所捕获的音频(每个麦克风的输出);
2.根据所捕获的音频(例如,原始记录)确定从每个扬声器(扬声器或其驱动器)至每个麦克风的脉冲响应,并且响应于每个所述脉冲响应通过对脉冲响应进行时间选通以去除由房间反射居主导的部分来生成时间选通脉冲响应;以及
3.通过确定时间选通脉冲响应在每个感兴趣的频率处的相位更接近0°还是更接近180°(分别指示非反转的极性或反转的极性),根据所述每个扬声器的至少一个所述时间选通脉冲响应来将每个扬声器的相对极性确定为频率的函数。在第二类的典型实施方式中,每个扬声器(在每个频率处)的相对极性的确定包括以下两种操作之一:
(a)对扬声器的时间选通脉冲响应的频率响应执行最小相位整平以确定经整平的时间选通脉冲响应(通常,整平步骤包括以下步骤:对时间选通脉冲响应执行时域至频域变换以确定频率响应,并且去除由扬声器或房间的最小相位值引起的相位分量以将分析仅集中于由极性差异引起的相位差),并且如果扬声器的经整平的时间选通脉冲响应的带通滤波版本(其中,通带以相关频率为中心)的最大(或第一)峰的绝对水平为正,则确定相对极性是非反转的(即,相对于某个代表扬声器的极性),而如果经整平的时间选通脉冲响应的带通滤波版本的最大(或第一)峰的绝对水平对应于负值,则确定相对极性是反转的(即,相对于代表扬声器的极性);或者
(b)确定扬声器的时间选通脉冲响应的时间延迟(即,脉冲响应的第一(或最大)正峰的出现时间相对于驱动脉冲的发出时间,假定驱动脉冲具有正的峰幅度),使用时间延迟对时间选通脉冲响应执行粗延迟校正(以及可选地还有附加延迟校正)以确定经校正的脉冲响应,其中附加延迟校正包括加上或减去小的额外延迟使得经校正的脉冲响应的相位响应在某个高频率(例如,15kHz或20kHz)处的展开相位至少基本上等于0(在已经执行粗延迟校正和附加延迟校正两者之后),并且如果经校正的脉冲响应的相位在范围-90°≤相位<90°内,则确定相对极性在感兴趣的频率处是非反转的(相对于某个代表扬声器的极性),而如果经校正的脉冲响应的相位在范围90°≤相位≤180°或范围-180°≤相位<-90°内,则确定相对极性在感兴趣的频率处是反转的(相对于代表扬声器的极性)。通常在频域中通过对扬声器的时间选通脉冲响应执行时域至频域变换,确定相位频谱并且从扬声器的时间选通脉冲响应的相位值减去作为与延迟相关联的频率的函数的线性相移来执行附加时间延迟校正。
在第二类的包括上述操作(a)的典型实施方式中,通过对时间选通脉冲响应执行最小相位整平,根据每个时间选通脉冲响应来生成经整平的时间选通脉冲响应,并且通过确定经整平的时间选通脉冲响应在每个感兴趣的频率处的相位更接近0°还是更接近180°,根据所述每个扬声器的经整平的时间选通脉冲响应来确定作为频率的函数的每个扬声器的相对极性。整平步骤去除由扬声器或房间的最小相位值引起的相位分量,以将分析仅集中于由极性差异引起的相位差。
本发明的方法的第二类实施方式具有本质上的频率选择性的优势。遍及整个音频频率范围的一组频率中的每个频率处的极性的评估具有以下益处:能够检测每个各自驱动器的极性或多驱动器扬声器的交叉。
通常,针对每个扬声器,对每个从扬声器至一组至少两个麦克风中的不同的麦克风的一组时间选通脉冲响应执行该方法,并且扬声器在每个感兴趣的频率(每个通带的中心频率)处的最终极性得分基于所有麦克风的带通滤波时间选通脉冲响应相位评定的多数投票或加权平均。
在第二类实施方式中的一些实施方式中,该方法包括以下步骤:
针对房间中的每个扬声器,以及针对每个麦克风,用参考信号驱动扬声器,并且确定扬声器、房间和麦克风与参考信号之间的传递函数的脉冲响应;
对脉冲响应进行时间选通,使用选通的时间间隔来强调第一到达声音以降低房间影响;
对时间选通脉冲响应执行最小相位均衡以使频率响应平整(例如,以降低响应变化效果);
通过得到和使用脉冲响应的第一峰的时间延迟并且从脉冲响应的相位频谱减去该时间延迟(例如,以去除线性相位分量)对脉冲响应执行粗延迟补偿;
使用FFT(或其他时域至频域变换)来得到相位频谱;
通过展开相位频谱并且在某个高频处将延迟设置成0执行细延迟补偿(当使用小于1kHz的频率的相移时,这可以提高延迟补偿准确度);以及
通过确定相位在特定频率处接近0°或180°的接近程度来确定扬声器的极性。
可选地,针对每个麦克风,通过两个或更多个频率中的每个频率处的相位来确定极性。
第二类中的一种实施方式包括以下步骤(针对每个扬声器):
将至少一个(通常多于一个)线性相位二阶带通滤波器(每个这样的滤波器具有以不同频率为中心的通带)应用于扬声器的每个所确定的时间选通脉冲响应;以及
对扬声器的每个带通滤波时间选通脉冲响应的相位进行评定(二进制确定,其评定每个带通滤波时间选通脉冲响应与滤波时间选通脉冲响应中的另一脉冲响应是“同相”还是“异相”)。每个这样的线性相位二阶带通滤波器可以与具有通带的更快的滚降的较宽的带通滤波器组合。这保持由线性相位二阶带通滤波器通常使用0.5<Q<3进行的简单的脉冲响应修改,并且仍然使较远离二阶带通滤波器的通带的中心频率的频率分量较强烈地衰减。这种类型的相位评定具有以下优势:不需要延迟补偿来评定极性。如果扬声器的时间选通脉冲响应的带通滤波版本(具有以相关频率为中心的通带)的最大峰(或第一峰)的绝对水平为正,则确定该极性是非反转的(即,相对于某个代表扬声器在该频率处的极性),而如果时间选通脉冲响应的带通滤波版本的最大峰(或第一峰)的绝对水平对应于负值,则确定该极性是反转的(即,相对于代表扬声器在该频率处的极性)。
第二类中的另一种实施方式包括以下步骤(针对每个扬声器):
确定扬声器的每个带通滤波时间选通脉冲响应的延迟(即,带通滤波的脉冲响应的第一正峰的发生时间相对于音频脉冲的发出时间),以及
确定所述每个带通滤波时间选通脉冲响应的相移,并且对每个感兴趣的频率(即,通带之一的中心频率)处的相移值进行评定。最终极性得分可以基于来自每个麦克风的脉冲响应结果的所有评定的频率处的相移的平均值,或者通过所有麦克风的评定的极性的多数投票。如果延迟(带通滤波的脉冲响应的正峰的相位相对于发出的音频脉冲的相位)在范围-90°≤相位<90°内,则确定每个频率处的极性是非反转的(相对于某个代表扬声器的极性),而如果延迟(带通滤波的脉冲响应的正峰的相位相对于发出的音频脉冲的相位)在范围90°≤相位≤180°内或范围-180°≤相位<-90°内,则确定该频率处的极性是反转的(相对于代表扬声器的极性)。
在第二类中的一些实施方式中,本发明的方法包括以下步骤:
1.依次用宽带激励驱动每个扬声器,使用一个或更多个麦克风捕获从每个扬声器发出的所产生的声音,并且与对扬声器序列的宽带激励的施加时钟同步地记录所捕获的音频(每个麦克风的输出);
2.根据捕获的音频(例如,原始记录)确定从每个扬声器至每个麦克风的脉冲响应。虽然保持了房间混响,但是在该操作中隐含的求平均有助于抑制记录中存在的任何噪声;
3.从第一到达声音开始对每个脉冲响应进行时间选通以去除或降低反射和混响的影响。时间选通的典型持续时间的范围为从2ms至20ms;
4.针对每个时间选通脉冲响应,通过对时间选通脉冲响应执行时域至频域变换(通常包括:通过将时间选通脉冲响应零填充成较长的2的幂的长度,通常为2048个样本,并且对零填充时间选通脉冲响应执行FFT(或其他时域至频域变换))来生成频率响应;
5.针对每个所述频率响应,通过给频率响应应用最小相位整平来生成经整平的频率响应。步骤5可以包括以下步骤:
(a)给频率响应应用分倍频程RMS厢式车平滑(通常1/24倍频程平滑);
(b)使经平滑的响应反转,并且给低于和高于用户定义的频率例如分别20Hz和20,000Hz的反转的响应应用零阶保持。这创建了均衡函数的频率幅度值;
(c)使用所述频率幅度值的自然对数的希尔伯特变换来得到频率幅度值(在步骤(b)中被确定)的最小相位均衡函数的相位值;以及
(d)逐系数地将在步骤(c)中确定的相位值乘以频率响应的系数;
6.针对每个所述经整平的频率响应,将经整平的频率响应的系数乘以与线性相位二阶带通滤波器相关联的频率系数;
7.针对每个所述经整平的频率响应,将步骤6的输出乘以与具有较急剧的滚降的较宽的带通滤波器相关联的频率系数(例如,通过将小于二阶带通滤波器的中心频率的0.2倍的频率和大于其5倍的频率处的变换系数设置成0);
8.对步骤7的输出执行频域至时域变换(例如,逆FFT),以确定时域中的经处理的脉冲响应。
9.对经处理的脉冲响应的最大绝对水平的极性进行评定。
10.以如二阶带通滤波器所需要的次数(即,针对要确定极性的每个频率)重复步骤6至步骤9;
11.针对每个评定的麦克风信号重复步骤3至步骤10;以及
12.通过针对频率和扬声器对步骤11的所有结果进行多数投票或加权平均来确定每个扬声器在每个频率处的极性。
在第二类中的其他实施方式中,该方法包括以下步骤:
1.依次用宽带激励驱动每个扬声器,使用一个或更多个麦克风捕获从每个扬声器发出的所产生的声音,并且与对扬声器序列的宽带激励的施加时钟同步地记录所捕获的音频(每个麦克风的输出);
2.根据捕获的音频(例如,原始记录)确定从每个扬声器至每个麦克风的脉冲响应。虽然保持了房间混响,但是在该操作中隐含的求平均有助于抑制记录中存在的任何噪声;
3.从第一到达声音开始对每个脉冲响应进行时间选通以去除或降低反射和混响的影响。时间选通的典型持续时间的范围为从2ms至20ms;
4.针对每个时间选通脉冲响应,通过对时间选通脉冲响应执行时域至频域变换(通常包括:通过将时间选通脉冲响应零填充成较长的2的幂的长度,通常为2048个样本,并且对零填充时间选通脉冲响应执行FFT(或其他时域至频域变换))来生成频率响应;
5.针对每个所述频率响应,通过给频率响应应用最小相位整平来生成经整平的频率响应。步骤5可以包括以下步骤:
(a)给频率响应应用分倍频程RMS厢式车平滑(通常1/24倍频程平滑);
(b)使经平滑的响应反转,并且给低于和高于用户定义的频率例如分别20Hz和20,000Hz的反转的响应应用零阶保持。这创建了均衡函数的频率幅度值;
(c)使用所述频率幅度值的自然对数的希尔伯特变换来得到频率幅度值(在步骤(b)中被确定)的最小相位均衡函数的相位值;以及
(d)逐系数地将在步骤(c)中确定的相位值乘以频率响应的系数;
6.在粗时间延迟校正之后得到每个时间选通脉冲响应的相位(该步骤可以包括以下步骤:
(a)对每个所述经整平的脉冲响应执行频域至时域变换(例如,逆FFT)以得到脉冲响应的时域版本;
(b)确定对脉冲响应的最大绝对值的时间延迟;
(c)以该得到的时间延迟生成单位脉冲;
(d)执行单位脉冲的时域至频域变换(例如,FFT);以及
(e)执行选通时间脉冲对单位脉冲的频域逐系数除法);
7.得到在步骤6中生成的时间延迟校正的频域系数的相位;
8.展开步骤7的输出的相位;
9.得到20,000Hz处的相移;
10.应用线性相位对频率校正以使20,000Hz处的相移等于0;以及
11.将该相位重新卷绕(rewrap)成±180°。
可选地,还执行以下步骤:
12.通过使用厢式车求平均处理获得平均值来应用分倍频程平滑,通常为1/3倍频程。
在步骤11之后或者在步骤12之后(如果执行步骤12),执行以下处理:
13.对一个或更多个频率处的相移进行评定;
14.得到平均相移并且然后确定整体极性或者进行由相移值确定的极性得分的多数投票或加权平均;
15.针对所有评定的麦克风信号重复步骤1至步骤14;以及
16.进行多数投票或加权平均以对每个扬声器在每个感兴趣的频率处的极性进行评定。
在本发明的方法的第三类实施方式中,使用峰跟踪技术(以确定针对每个扬声器已经测量的脉冲响应的第一峰)来确定播放系统的扬声器的极性。图3的经编程的处理器2可以被编程成执行这样的实施方式以确定安装在房间1中的扬声器(或一个或更多个这样的扬声器的各个驱动器)的相对极性。该类中的每个方法包括以下步骤:用宽带激励驱动扬声器,使用麦克风捕获发出的所产生的声音,根据捕获的音频确定脉冲响应(从扬声器至麦克风),并且通过确定其幅度的绝对值超过预定阈值的脉冲响应的第一峰的符号来确定扬声器的极性。如果已知或假定扬声器的脉冲响应的直接部分中的正向第一峰对应于正极性并且扬声器的脉冲响应的直接部分中的负向第一峰对应于负极性(假定正极性麦克风),则该方法确定每个扬声器的绝对极性。该类中的每个方法还基于麦克风扬声器间房间脉冲响应分析来提供每个脉冲响应的质量的指示。在典型的实现中,用于确定极性的每个脉冲响应的质量由迭代索引(“j+1”)确定,该索引指示脉冲响应的第一峰的迭代确定所需要的迭代次数。通常,该阈值从在直接声音到达之前(在直接声音的到达之前脉冲响应的静默或噪声部分中)开始的最初几毫秒被确定,并且可以根据原始脉冲响应测量或根据作为脉冲响应的响应幅度(以dB为单位)对时间的曲线图的能量时间曲线而获得。在一个方面,该阈值可以被设置为脉冲响应的静默/噪声的绝对值的最大值。为了降低能够影响阈值估计的噪声的影响,移动平均滤波器或其他平滑方案可以被用作脉冲响应的预处理步骤。
第三类中的典型实施方式包括以下步骤:
(a)用宽带激励驱动扬声器,并且使用至少一个麦克风捕获从该扬声器发出的所产生的声音,从而生成每个所述麦克风的输出信号;
(b)针对每个所述麦克风,根据麦克风的输出信号确定指示脉冲响应(从扬声器至麦克风)的音频值序列;
(c)根据每个所述音频值序列,通过确定其幅度的绝对值超过预定阈值的第一峰(由该序列指示)的符号来确定扬声器的极性;以及
(d)确定脉冲响应的质量的度量,
其中,步骤(c)包括以下步骤:
(e)确定该序列中的值的子集,使得该子集中的每个值具有超过预定阈值的绝对值,并且确定与该子集中的具有最大绝对值的值对应的时间(例如,标识值中之一的时间索引)(即,确定与该子集中的其绝对值等于或大于该子集中的所有其他值的绝对值的值对应的时间);以及
(f)通过丢弃该子集中的与晚于在步骤(e)中确定的时间的时间相对应的所有值来生成值的缩减子集,直到缩减子集由单个值构成,将所述单个值识别为由该序列指示的第一峰,并且确定所述单个值的符号(通常,如果在执行子集缩减的迭代之后缩减子集由至少两个值构成,则仅对值的缩减子集再次执行步骤(e)和步骤(f),并且对缩减子集中的值执行步骤(e)和步骤(f)的足够次数的迭代以确定由缩减子集的单个值构成的值的进一步缩减子集,并且将所述单个值识别为由该序列指示的第一峰,并且确定所述单个值的符号),以及
其中,步骤(d)包括以下步骤:确定数A*(j+1)+B,其中,j是确定值的由缩减子集的单个值构成的缩减子集(例如,进一步缩减的子集)而执行的步骤(e)和步骤(f)的迭代次数,*表示乘法,以及A和B是非负数(例如,A=1并且B=0),并且将数A*(j+1)+B识别为脉冲响应的质量的度量。
第三类中的示例实施方式包括以下步骤:
(a)用宽带激励驱动扬声器;
(b)使用至少一个麦克风来捕获所产生的发出的声音;
(c)根据第“k”个麦克风的音频输出来确定从第“k”个麦克风至第“i”个扬声器的脉冲响应hki(n),其中,n是指示时间的样本索引;
(d)通过将脉冲响应hki(n)除以脉冲响应hki(n)的最大绝对值来对脉冲响应hki(n)进行归一化,以确定归一化的响应hnorm ki(n),其包括+1与-1之间的值,
(e)设置阈值参数(“阈值”);
(f)设置迭代次数j=1,并且将索引向量设置成零向量;
(g)将峰跟踪变量(“峰值”)初始化成1(+1);
(h)当峰值>阈值时:
(1)确定绝对值向量|xj|,其是响应向量xj的绝对值。在子步骤(h)(1)的第一次迭代中,响应向量xj是原始脉冲响应向量hnorm ki(n);
(2)按幅度的降序对包括绝对值矢量的值进行排序,并且获得第“j”次迭代的绝对值向量|xj|的最大值的对应的时间索引nj;以及
(3)选择相应矢量xj(要在子步骤(h)(1)的下一次迭代中使用)作为归一化的脉冲响应矢量hnorm ki(n)的值,由第一值至值nj-1构成;以及
(4)设置j=j+1;
(i)当从“当”循环退出(即,当完成步骤(h))时,选择最新更新的值索引nj
(j)对具有在步骤(i)中选择的样本索引nj的hnorm ki(n)的值的符号进行评估,并且如果该符号为正,则确定扬声器极性是正确的(或同相),而如果该符号为负,则确定扬声器极性是错误的(或异相)。
在示例实施方式的变型中,步骤(h)被用相似的步骤替换,在该相似的步骤中,省略“排序”操作(上面的子步骤(h)(2)),并且以其他方式确定最大值的时间索引nj。上述步骤(h)(3)本质上丢弃时间值大于nj-1的全部值。从而,该方法收敛于脉冲响应的超过阈值的第一值(最低时间值)(在若干迭代之后,每个具有不同的索引j)。
在步骤(i)中选择的样本索引nj的迭代索引j可以用于指示脉冲响应的质量(例如,可靠度)。已经观察到,如果测量的脉冲响应中的任何脉冲响应是从损坏的(corrupted)测量得到的,则在步骤(i)中选择的样本nj的迭代索引j(在本文中有时称为寻峰迭代“jcorrupted”)通常等于(S)*juncorrupted,其中,S是等于2、3或4的整数(通常S=3或4),并且“juncorrupted”是当测量的脉冲响应均不是从损坏的测量得到时在步骤(i)中选择的样本索引nj的迭代索引j。因此,用于检查麦克风位置p的(即,使用位置“p”处的麦克风测量的)测量的脉冲响应的质量的度量是q=|jp-jq|。在影院环境中已经观察到,juncorrupted通常具有范围为从4到6的值。从而,如果针对麦克风(使用一个麦克风,或者在不同位置处使用两个或更多个麦克风)测量的所有脉冲响应具有范围为12至24的迭代索引j(在上述步骤(i)中选择的样本索引nj的迭代索引j),该结果指示针对扬声器设置的损坏的脉冲响应。在这种情况下,可以设置标志来指示当对任何识别的问题进行校正时应当测量扬声器的所有响应。
第三类中的一些实施方式通过对具有与感兴趣的驱动器的频率范围相对应的通带的多驱动器扬声器的脉冲响应进行带通滤波来确定多驱动器扬声器(例如,一个扬声器包括低频扬声器和至少一个其他驱动器)的各个驱动器(例如,低频扬声器)的极性。通常,通过将带通滤波器与脉冲响应在时域中卷积来执行带通滤波,并且然后通过将上述方法应用于带通滤波脉冲响应来确定极性。通带可以基于交叉位置的扬声器制造商规范和/或通过从扬声器的频率响应跟踪-3dB点来确定。扬声器的制造商的规范可以包括交叉频率,该交叉频率确定通带的高(上端)截止频率。扬声器的频率响应的-3dB点可以确定通带的低(低端)截止频率。
为了应用具有自动确定的或根据扬声器的制造商规范确定的低截止频率和高截止频率以及特定衰减速率(xdB/倍频程)的带通滤波器,这是有用的。在通带中具有相等的群延迟的使所有频率通过的线性相位带通滤波器可以用于在提取低频扬声器相关联的脉冲响应的同时避免变更相位响应。由于在脉冲响应中使用快速衰减带通滤波器导致的预纹波的适当的平滑可以使用n倍频程平滑滤波器(N=1/3、1/12等)来实现。
对如下四个扬声器执行在前面段落中描述的类型的一个示例实施方式:三个扬声器被安装在第一电影剧院中,而一个扬声器被安装在第二电影剧院中。使用四个麦克风来测量每个扬声器的输出,每个麦克风在相对于扬声器的不同位置处。图4中的上曲线是如使用麦克风之一测量的第一剧院中的扬声器之一的脉冲响应(相对于时间标绘的幅度)(示出了样本索引nj,在样本索引nj处识别出第一峰),并且图4中的下曲线是上曲线的一部分的放大版本(也示出了样本索引nj,在样本索引nj处识别出第一峰)。索引nj是在其处响应超过阈值的最低音频样本序号,并且出现在响应中的第一(最早)识别的峰中。图5中的上曲线是使用麦克风之一测量的第二剧院中的扬声器之一的脉冲响应(示出了样本索引nj,在样本索引nj处识别出第一峰),并且图5中的下曲线是该上曲线的一部分的放大版本(也示出了样本索引nj,在样本索引nj处识别出第一峰)。同样在该图中,索引nj是在其处响应超过阈值的最低音频样本序号,并且出现在响应中的第一(最早)识别的峰中。在该示例中,获得在其处识别出第一峰的样本索引nj的迭代索引j的以下值以及第一峰的极性:
第一剧院中的第一扬声器:第一麦克风:正极性,j=7(这是图4中指示的结果);第二麦克风:正极性,j=6;第三麦克风:正极性,j=6;以及第四麦克风:正极性,j=7;
第一剧院中的第二扬声器:第一麦克风:正极性,j=14;第二麦克风:负极性,j=15;第三麦克风:负极性,j=16;以及第四麦克风:负极性,j=17;
第一剧院中的第三扬声器:第一麦克风:正极性,j=6;第二麦克风:正极性,j=4;第三麦克风:正极性,j=6;以及第四麦克风:负极性,j=14;以及
第二剧院中的扬声器:第一麦克风:负极性,j=7;第二麦克风:负极性,j=6;第三麦克风:负极性,j=6;以及第四麦克风:负极性,j=7(这是图5中指示的结果)。
如由迭代索引j的高值(14、15、16和17)所指示的,第一剧院中的第二扬声器的测量被认为是损坏的,其是第一剧院中的第一扬声器的未损坏的(uncorrupted)测量的值的约两倍。如由迭代索引j的高值(14)所指示的,第一剧院中的第三扬声器(使用第四麦克风)的测量被认为是损坏的,其是同一扬声器用其他麦克风的未损坏的测量的值(j=6、4和6)的约2至3倍。
通常,当用使用若干麦克风测量的脉冲响应来评定扬声器的极性时,迭代索引j从麦克风至麦克风的太大变化指示至少一个麦克风的输出被损坏。
下面的Matlab代码用于对处理器进行编程以执行本发明的方法的上述示例实施方式(对四个扬声器执行:三个扬声器被安装在第一电影剧院中而一个扬声器被安装在第二电影剧院中):
在前述Matlab代码中,“x1”是脉冲响应的归一化的值(范围为从-1至+1),并且“fs”是三个脉冲响应值的时间值(样本数量)。阈值被选择为0.1。
本发明的各个方面包括被配置(例如,被编程)成执行本发明的方法的任何实施方式的系统以及存储用于实现本发明的方法的任何实施方式的代码的计算机可读介质(例如,盘)。例如,这样的计算机可读介质可以被包括在图3的处理器2中。
在一些实施方式中,本发明的系统是或者包括至少一个麦克风(例如,图3的麦克风M1)以及被耦合以接收来自每个所述麦克风的麦克风输出信号的处理器(例如,图3的处理器2)。每个麦克风在系统的操作期间被定位来执行本发明方法的实施方式以捕获从一组扬声器(例如,图3的扬声器)发出的声音并且通过对指示所捕获的声音的音频数据进行处理来确定扬声器对的相对极性。处理器可以是通用或专用处理器(例如,音频数字信号处理器),并且用软件(或固件)编程和/或以其他方式配置成响应于每个所述麦克风输出信号来执行本发明的方法的实施方式。在一些实施方式中,本发明的系统是或者包括处理器(例如,图3的处理器2),其被耦合以接收输入音频数据(例如,指示响应于从一组扬声器发出的声音的至少一个麦克风的输出)。该处理器(其可以是通用处理器或专用处理器)被编程(用适当的软件和/或固件)以响应于输入音频数据来生成(通过执行本发明的方法的实施方式)输出数据,使得输出数据指示扬声器对的相对极性。在一些实施方式中,本发明的系统的处理器是音频数字信号处理器(DSP),其是被配置(例如,由适当的软件或固件编程或者以其他方式响应于控制数据而被配置)成对输入音频数据执行包括本发明的方法的实施方式的多种操作中的任意操作的常规音频DSP。
在本发明的方法的一些实施方式中,同时或者按与本文中描述的示例中指定的顺序不同的顺序执行本文中描述的步骤中的一些或全部。虽然在本发明的方法的一些实施方式中按特定顺序执行步骤,但是在其他实施方式中可以同时或按不同的顺序执行一些步骤。
虽然在本文中已经描述了本发明的具体实施方式以及本发明的应用,但是对本领域普通技术人员而言明显的是,在不偏离本文中所描述和要求保护的本发明的范围的情况下,可以对本文中描述的实施方式和应用进行很多变化。应当理解的是,虽然已经示出和描述了本发明的某些形式,但是本发明不限于所描述和示出的具体实施方式或者所描述的具体方法。

Claims (12)

1.一种使用播放环境中的一组M个麦克风来确定所述播放环境中的一组N个扬声器的相对极性的方法,其中,M是正整数,并且N是大于1的整数,所述方法包括以下步骤:
(a)测量脉冲响应,包括每个扬声器麦克风对的脉冲响应;
(b)将所述扬声器聚类成组的集合,所述集合中的每个组包括在至少一个方面彼此相似的至少两个扬声器;以及
(c)针对每个所述组,确定所述组中的扬声器的脉冲响应对的互相关,并且根据所述互相关确定所述组中的扬声器的相对极性。
2.根据权利要求1所述的方法,其中,步骤(c)包括以下步骤:针对每个所述组,确定与所述组中的两个扬声器相对应的每对脉冲响应的互相关的峰值,当确定所述峰值为正并且超过预定正阈值时确定所述两个扬声器同相,并且当确定所述峰值为负并且所述峰值的绝对值超过所述预定正阈值时确定所述两个扬声器异相。
3.根据权利要求1所述的方法,其中,所述每个麦克风生成模拟输出信号,并且步骤(a)包括以下步骤:对每个所述模拟输出信号进行采样以生成音频数据。
4.根据权利要求1所述的方法,其中,步骤(c)包括:对所述脉冲响应中的至少一些脉冲响应执行带通滤波以生成带通滤波响应,并且确定至少一个所述组中的扬声器的带通滤波响应对的互相关。
5.根据权利要求1所述的方法,其中,步骤(c)包括:对所述脉冲响应中的至少一些脉冲响应进行时间加窗以生成加窗响应,并且确定至少一个所述组中的扬声器的加窗响应对的互相关。
6.根据权利要求1所述的方法,其中,步骤(c)包括:对所述脉冲响应中的至少一些脉冲响应的频带执行频率相关的加权以生成加权响应,并且确定至少一个所述组中的扬声器的加权响应对的互相关。
7.根据权利要求1所述的方法,其中,步骤(a)包括以下步骤:
用宽带激励驱动每个所述扬声器,获得指示在从每个被驱动的扬声器发出声音期间由每个所述麦克风捕获的声音的音频数据,并且通过对所述音频数据进行处理来确定所述脉冲响应。
8.一种用于确定一组N个扬声器的相对极性的系统,其中N是大于1的整数,所述系统包括:
一组M个麦克风,其中M是正整数,并且每个所述麦克风被配置成响应于入射声音来产生输出信号;以及
处理器,被配置成:被耦合以接收每个所述麦克风的输出信号,并且对根据每个所述输出信号确定的音频数据进行处理以确定所述扬声器的相对极性,包括通过以下方式来确定所述相对极性:
通过对所述音频数据进行处理来确定脉冲响应,包括每个扬声器麦克风对的脉冲响应,
将所述扬声器聚类成组的集合,所述集合中的每个组包括在至少一个方面彼此相似的至少两个扬声器;以及
针对每个所述组,确定所述组中的扬声器的脉冲响应对的互相关,并且根据所述互相关来确定所述组中的扬声器的相对极性,
其中,所述音频数据指示响应于用宽带激励对所述每个扬声器的驱动而从每个所述扬声器发出并且由每个所述麦克风捕获的声音。
9.根据权利要求8所述的系统,其中,所述处理器被配置成:针对每个所述组,确定与所述组中的两个扬声器相对应的每对脉冲响应的互相关的峰值,以当确定所述峰值为正并且超过预定正阈值时确定所述两个扬声器同相,并且当确定所述峰值为负并且所述峰值的绝对值超过所述预定正阈值时确定所述两个扬声器异相。
10.根据权利要求8所述的系统,其中,所述处理器被配置成:对所述脉冲响应中的至少一些脉冲响应执行带通滤波以生成带通滤波响应,并且确定至少一个所述组中的扬声器的带通滤波响应对的互相关。
11.根据权利要求8所述的系统,其中,所述处理器被配置成:对所述脉冲响应中的至少一些脉冲响应进行时间加窗以生成加窗响应,并且确定至少一个所述组中的扬声器的加窗响应对的互相关。
12.根据权利要求8所述的系统,其中,所述处理器被配置成:对所述脉冲响应中的至少一个脉冲响应执行频率相关的加权以生成加权响应,并且确定互相关,使得所述互相关是至少一个所述组中的扬声器的加权响应对的互相关。
CN201480005891.8A 2013-01-24 2014-01-17 自动的扬声器极性检测 Active CN104937955B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361756088P 2013-01-24 2013-01-24
US61/756,088 2013-01-24
PCT/US2014/012069 WO2014116518A1 (en) 2013-01-24 2014-01-17 Automatic loudspeaker polarity detection

Publications (2)

Publication Number Publication Date
CN104937955A CN104937955A (zh) 2015-09-23
CN104937955B true CN104937955B (zh) 2018-06-12

Family

ID=51227956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480005891.8A Active CN104937955B (zh) 2013-01-24 2014-01-17 自动的扬声器极性检测

Country Status (4)

Country Link
US (1) US9560461B2 (zh)
EP (1) EP2949133B1 (zh)
CN (1) CN104937955B (zh)
WO (1) WO2014116518A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9832007B2 (en) 2016-04-14 2017-11-28 Ibiquity Digital Corporation Time-alignment measurement for hybrid HD radio™ technology
US10666416B2 (en) 2016-04-14 2020-05-26 Ibiquity Digital Corporation Time-alignment measurement for hybrid HD radio technology
CN106488376B (zh) * 2016-10-28 2020-03-27 努比亚技术有限公司 一种对移动终端的音频元件进行故障诊断的方法和装置
CN109862503B (zh) * 2019-01-30 2021-02-23 北京雷石天地电子技术有限公司 一种扬声器延时自动调整的方法与设备
US20220360927A1 (en) * 2019-09-20 2022-11-10 Harman International Industries, Incorporated Room calibration based on gaussian distribution and k-nearest neighbors algorithm
US11570543B2 (en) * 2021-01-21 2023-01-31 Biamp Systems, LLC Loudspeaker polar pattern creation procedure
CN117278910B (zh) * 2023-11-22 2024-04-16 清华大学苏州汽车研究院(相城) 音频信号的生成方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102655620A (zh) * 2011-03-04 2012-09-05 索尼公司 声学设备、声学调整方法及程序
WO2013006324A2 (en) * 2011-07-01 2013-01-10 Dolby Laboratories Licensing Corporation Audio playback system monitoring

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3067297A (en) * 1960-02-26 1962-12-04 Philco Corp Apparatus for determining the polarities of stereophonic channel connections at anyselected point
US4908868A (en) * 1989-02-21 1990-03-13 Mctaggart James E Phase polarity test instrument and method
US5319714A (en) * 1992-09-23 1994-06-07 Mctaggart James E Audio phase polarity test system
JP3286603B2 (ja) * 1998-09-22 2002-05-27 ヤマハ株式会社 スピーカの極性判別回路、スピーカの極性判別機能を備えたオーディオ回路、スピーカの極性判別および極性切換機能を備えたオーディオ回路
US20060050891A1 (en) * 2004-09-07 2006-03-09 Sunil Bharitkar Method for automatic loudspeaker polarity determination through loudspeaker-room acoustic responses
US20060062399A1 (en) * 2004-09-23 2006-03-23 Mckee Cooper Joel C Band-limited polarity detection
JP4240228B2 (ja) * 2005-04-19 2009-03-18 ソニー株式会社 音響装置、接続極性判定方法および接続極性判定プログラム
WO2010054360A1 (en) * 2008-11-10 2010-05-14 Rensselaer Polytechnic Institute Spatially enveloping reverberation in sound fixing, processing, and room-acoustic simulations using coded sequences
WO2010097924A1 (ja) * 2009-02-26 2010-09-02 パイオニア株式会社 スピーカ極性判定装置
US8842846B2 (en) * 2009-03-18 2014-09-23 Texas Instruments Incorporated Method and apparatus for polarity detection of loudspeaker
US9097795B2 (en) 2010-11-12 2015-08-04 Nokia Technologies Oy Proximity detecting apparatus and method based on audio signals
US9031268B2 (en) * 2011-05-09 2015-05-12 Dts, Inc. Room characterization and correction for multi-channel audio

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102655620A (zh) * 2011-03-04 2012-09-05 索尼公司 声学设备、声学调整方法及程序
WO2013006324A2 (en) * 2011-07-01 2013-01-10 Dolby Laboratories Licensing Corporation Audio playback system monitoring

Also Published As

Publication number Publication date
EP2949133A1 (en) 2015-12-02
US9560461B2 (en) 2017-01-31
US20150365775A1 (en) 2015-12-17
EP2949133B1 (en) 2019-02-13
CN104937955A (zh) 2015-09-23
EP2949133A4 (en) 2016-09-21
WO2014116518A1 (en) 2014-07-31

Similar Documents

Publication Publication Date Title
CN104937955B (zh) 自动的扬声器极性检测
US9602940B2 (en) Audio playback system monitoring
EP3742756A1 (en) Method and device for detecting wearing state of earphone, earphone, and storage medium
CN101416533B (zh) 在音频系统中的方法和设备
US9706305B2 (en) Enhancing audio using a mobile device
US9959886B2 (en) Spectral comb voice activity detection
CN109040940A (zh) 一种扬声器的检测方法及装置
WO2016184138A1 (zh) 一种调整音频参数的方法、移动终端及计算机存储介质
CN104244162B (zh) 一种扬声器的杂音检测方法及装置
CN115862657B (zh) 随噪增益方法和装置、车载系统、电子设备及存储介质
Prawda et al. Robust selection of clean swept-sine measurements in non-stationary noise
CN109997186B (zh) 一种用于分类声环境的设备和方法
CN113534052B (zh) 骨导设备虚拟声源定位性能测试方法、系统、装置及介质
WO2017154378A1 (ja) 測定装置、フィルタ生成装置、測定方法、及びフィルタ生成方法
JP6565709B2 (ja) 音像定位処理装置、及び音像定位処理方法
JP2004325127A (ja) 音源検出方法、音源分離方法、およびこれらを実施する装置
CN113409800A (zh) 一种监控音频的处理方法、装置、存储介质及电子设备
JP6370725B2 (ja) 漏水判定のための波形データ収集装置、漏水判定装置、漏水判定システム、およびプログラム
JP2012095254A (ja) 音量調整装置、音量調整方法及び音量調整プログラム並びに音響機器
TWI383692B (zh) 電子裝置之麥克風測試方法與系統
Lopez et al. Acoustic measurement methods for outdoor sites: A comparative study
WO2021170458A1 (en) Selection criteria for passive sound sensing in a lighting iot network
JP2007049447A (ja) 計測装置及び計測方法

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant