CN102165798B - 用于单声道相容性和外放扬声器相容性的双耳滤波器 - Google Patents

用于单声道相容性和外放扬声器相容性的双耳滤波器 Download PDF

Info

Publication number
CN102165798B
CN102165798B CN2009801373213A CN200980137321A CN102165798B CN 102165798 B CN102165798 B CN 102165798B CN 2009801373213 A CN2009801373213 A CN 2009801373213A CN 200980137321 A CN200980137321 A CN 200980137321A CN 102165798 B CN102165798 B CN 102165798B
Authority
CN
China
Prior art keywords
filter
ears
sum
time
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009801373213A
Other languages
English (en)
Other versions
CN102165798A (zh
Inventor
G·N·迪金斯
D·S·迈克格雷斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN102165798A publication Critical patent/CN102165798A/zh
Application granted granted Critical
Publication of CN102165798B publication Critical patent/CN102165798B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • H04S7/306For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

一种通过双耳滤波器的集合处理至少一个输入信号从而输出可通过耳机播放以提供经由一个或多个虚拟扬声器在收听室中收听声音的感觉的方法,并且还具有单声道下混听起来良好的性质。此外,一种用于处理至少一个输入信号的装置。此外,一种在当通过耳机收听时提供空间化的同时修正一对双耳滤波器以实现单声道下混听起来良好的性质的方法。

Description

用于单声道相容性和外放扬声器相容性的双耳滤波器
相关申请的交叉引用
此申请要求于2008年9月25日提交的美国专利临时申请No.61/099,967的优先权,在此通过引用将其完全合并到此。
技术领域
本公开总体上涉及音频信号的信号处理,并且尤其涉及通过双耳滤波器针对空间化对音频输入进行处理,使得输出可在耳机上、或单声道地、或通过扬声器的集合播放。
背景技术
已知处理用于通过耳机重放的一个或多个音频输入信号的集合,使得收听者具有收听来自位于收听室中的预定位置的多个虚拟扬声器的声音的印象。在此,这种处理被称为空间化和双耳化(binauralization)。在此,处理音频输入信号的滤波器被称为双耳滤波器。如果不是因为这种处理,则通过耳机收听的收听者将具有声音位于该收听者头部内的印象。音频输入信号可以是单个信号、用于立体声再现的一对信号、多个环绕声信号(例如用于4.1环绕声的四个音频输入信号、用于5.1的五个音频输入信号、用于7.1的七个音频输入信号等),并且也可以包括用于特定位置(例如特定声音源)的单独信号。对于将被空间化的各音频输入信号存在一对双耳滤波器。为了真实再现,双耳滤波器考虑从各虚拟扬声器到左耳和右耳中的每一个的头部相关传递函数(HRTF),并且还考虑被模拟的收听室的早期回声和混响响应。
因此,已知通过双耳滤波器对信号进行预处理以产生一对音频输出信号——经双耳化的信号——以便用于通过耳机收听。
常常为如下这样的情况:人们希望通过单个扬声器(也就是说,通过为了单声道再现而对信号进行电子下混而单声道地)收听经双耳化的信号。一个示例是通过移动设备中的单声道外放扬声器进行收听。还常常存在如下这样的情况,人们希望通过一对间隔小的外放扬声器收听这些声音。在后者的情况下,经双耳化的输出信号也被下混,但是通过音频串扰进行而不是电子地进行。在两种情况下,经双耳化的、然后下混的信号听起来不自然,具体地说,听起来有混响且具有降低的可懂度和音频清晰度。难以在不折中经双耳化的音频中的空间和距离的印象的情况下消除该问题。
附图说明
图1示出包括用于处理单个输入信号的一对双耳滤波器并且包括本发明实施例的双耳化器的简化框图。
图2示出包括用于处理相应的一个或多个输入信号的一对或多对双耳滤波器并且包括本发明实施例的双耳化器的简化框图。
图3示出具有一个或多个音频输入信号并且生成被下混为单声道混音的左耳输出信号和右耳输出信号并且可以包括本发明实施例的双耳化器的简化框图。
图4A示出可包括本发明实施例的混洗(shuffling)操作,其后有根据双耳滤波器对的累加与差分滤波,后面为解混洗操作。
图4B示出可包括本发明实施例的对于表示双耳滤波器的脉冲响应的左和右输入信号的混洗操作,后面为解混洗操作。
图5示出示例双耳滤波器脉冲响应。
图6示出对表示其双耳化性质将被匹配的双耳滤波器脉冲响应的一对输入信号进行操作的信号处理装置实施例的简化框图。根据本发明一个或多个方面,该处理装置被配置用于输出表示能够双耳化并且产生自然声单声道混音的双耳滤波器脉冲响应的信号。
图7示出操作信号处理装置(例如图6的信号处理装置)以生成双耳脉冲响应的方法的实施例的简化流程图。
图8示出实施将表示双耳滤波器脉冲响应的一对信号转换为表示双耳滤波器的经修正的脉冲响应的信号的方法实施例的MATLAB(Mathworks,Inc.,Natick,Massachusetts)句法中的代码的一部分,。
图9示出在图6的装置实施例以及图7的方法实施例中使用的时间变化滤波器对于在不同时间的集合中的每一个处的脉冲的脉冲响应的图线。
图10示出在图6的装置实施例、图7的方法实施例中使用的时间变化滤波器的在不同时间的集合中的每一个处的频率响应幅度的图线。
图11示出初始左耳双耳滤波器脉冲响应和根据本发明实施例的左耳双耳滤波器脉冲响应。
图12示出初始双耳化累加滤波器脉冲响应和根据本发明实施例的双耳化累加滤波器脉冲响应。
图13示出初始双耳化差分滤波器脉冲响应和根据本发明实施例的双耳化差分滤波器脉冲响应。
图14A-图14E示出沿着本发明的示例双耳滤波器对实施例的滤波器脉冲响应的长度在变化时间间隔上的累加与差分滤波器响应中的作为频率的函数的能量的图线。
图15A和图15B示出本发明的示例双耳滤波器对实施例的分别对于累加和频率滤波器脉冲响应的时间-频率平面上的等衰减轮廓。
图16A和图16B示出本发明的示例双耳滤波器对实施例的分别对于累加与频率滤波器脉冲响应的时间-频率图线的表面的等距视图、即声谱图。
图17A和图17B示出如图16A和图16B的、但为典型双耳滤波器对的分别对于累加与频率滤波器脉冲响应的时间-频率图线的表面的相同等距视图,该典型双耳滤波器对尤其为将与用于图16A和图16B的那些双耳滤波器匹配的双耳滤波器。
图18示出根据本发明方面的被配置用于处理音频输入信号的集合的音频处理装置的实现形式。
图19A示出接受五个声道的音频信息的双耳化装置的实施例的简化框图。
图19B示出接受四个声道的音频信息的双耳化装置的实施例的简化框图。
具体实施方式
概述
本发明实施例包括一种方法、一种装置、以及程序逻辑,例如当执行时使得实施方法的在计算机可读介质中编码的程序逻辑。一种方法是使用双耳滤波器处理用于通过耳机呈现的一个或多个音频输入信号,以实现一个或多个音频输入的虚拟空间化,并且具有如下的附加性质:经双耳化的信号当在下混之后被单声道地重放时或者当通过间隔相对小的外放扬声器重放时听起来良好。另一方法是处理系统的操作方法,该处理系统用于处理一对或多对双耳滤波器特性(例如双耳滤波器脉冲响应),以确定相应的一对或多对修正的双耳滤波器特性(例如修正的双耳滤波器脉冲响应),从而当一个或多个音频输入信号被具有该一对或多对修正的双耳滤波器特性的对应的一对或多对双耳滤波器双耳化时,经双耳化的信号实现一个或多个音频输入的虚拟空间化,并且具有如下的附加性质:经双耳化的信号当在下混之后被单声道地重放或者通过间隔相对小的外放扬声器重放时听起来良好。
特定实施例包括用于双耳化一个或多个音频输入信号的集合的装置。所述装置包括其特征在于一对或多对基本(base)双耳滤波器的一对双耳滤波器,其中对于音频信号输入中的每一个具有一对基本双耳滤波器。每一对基本双耳滤波器可由基本左耳滤波器和基本右耳滤波器表示,并且可进一步由基本累加滤波器和基本差分滤波器表示。各滤波器可由对应的脉冲响应表征。
至少一对基本双耳滤波器被配置用于空间化其对应的音频信号输入,以结合从对应的虚拟扬声器位置到收听者的直达响应,并且结合收听室的早期回声和混响响应两者。
对于至少一对基本双耳滤波器:
·基本累加滤波器的时间-频率特性与基本差分滤波器的时间频率特性明显不同,其中,在所有频率,基本累加滤波器长度明显小于基本差分滤波器长度、基本左耳滤波器长度和基本右耳滤波器长度。
·与基本左耳滤波器长度或基本右耳滤波器长度的在频率上的变化相比,基本累加滤波器长度跨越不同频率明显变化,其中基本累加滤波器长度随着频率增大而减小。
该装置生成可通过耳机或在单声道混合之后单声道地播放的输出信号。
在一些实施例中,对于至少一对基本双耳滤波器,基本累加滤波器脉冲响应的到可忽略水平的过渡(transition)在基本累加滤波器脉冲响应的初始时间间隔上以依赖于频率的方式随着时间逐渐发生。
对于一些实施例,对于至少一对基本双耳滤波器,基本累加滤波器的频率含量在过渡时间间隔上从初始全带宽朝向低频率截止减小。例如,对于至少一对基本双耳滤波器,过渡时间间隔为使得基本累加滤波器脉冲响应从直到约3ms的全带宽过渡到在大约40ms低于100Hz。
在一些实施例中,对于至少一对基本双耳滤波器,在10kHz之上的高频率的基本差分滤波器长度小于40ms,在3kHz与4kHz之间的频率的基本差分滤波器长度小于100ms,并且在小于2kHz的频率,该基本差分滤波器长度小于160ms。对于这些实施例中的一些,在10kHz之上的高频率的基本差分滤波器长度小于20ms,在3kHz与4kHz之间的频率的基本差分滤波器长度小于60ms,并且在小于2kHz的频率,该基本差分滤波器长度小于120ms。对于这些实施例中的一些,在10kHz之上的高频率的基本差分滤波器长度小于10ms,在3kHz与4kHz之间的频率的基本差分滤波器长度小于40ms,并且在小于2kHz的频率,该基本差分滤波器长度小于80ms。
在一些实施例中,对于至少一对基本双耳滤波器,基本差分滤波器长度小于大约800ms。在这些实施例中的一些中,基本差分滤波器长度小于大约400ms。在这些实施例中的一些中,基本差分滤波器长度小于大约200ms。
在一些实施例中,对于至少一对基本双耳滤波器,基本累加滤波器长度随着频率增大而减小,对于小于100Hz的所有频率的基本累加滤波器长度是至少40ms且至多160ms,对于100Hz与1kHz之间的所有频率的基本累加滤波器长度是至少20ms且至多80ms,对于1kHz与2kHz之间的所有频率的基本累加滤波器长度是至少10ms且至多20ms,以及对于2kHz与20kHz之间的所有频率的基本累加滤波器长度是至少5ms且至多20ms。在这些实施例中的一些中,对于小于100Hz的所有频率的基本累加滤波器长度是至少60ms且至多120ms,对于100Hz与1kHz之间的所有频率的基本累加滤波器长度是至少30ms且至多60ms,对于1kHz与2kHz之间的所有频率的基本累加滤波器长度是至少15ms且至多30ms,并且对于2kHz与20kHz之间的所有频率的基本累加滤波器长度是至少7ms且至多15ms。此外,在这些实施例中的一些中,对于小于100Hz的所有频率的基本累加滤波器长度是至少70ms且至多90ms,对于100Hz与1kHz之间的所有频率的基本累加滤波器长度是至少35ms且至多50ms,对于1kHz与2kHz之间的所有频率的基本累加滤波器长度是至少18ms且至多25ms,并且对于2kHz与20kHz之间的所有频率的基本累加滤波器长度是至少8ms且至多12ms。
在一些实施例中,对于至少一对基本双耳滤波器,该基本双耳滤波器特性被从一对待匹配的双耳滤波器特性确定。对于一些这样的实施例,对于至少一对基本双耳滤波器,基本差分滤波器脉冲响应在稍后时间基本上与待匹配的双耳滤波器的差分滤波器成比例。例如,基本差分滤波器脉冲响应在40ms之后变为基本上与待匹配的双耳滤波器的差分滤波器成比例。
特定实施例包括一种双耳化一个或多个音频输入信号的集合的方法。该方法包括:通过以一对或多对基本双耳滤波器表征的双耳化器对音频输入信号的集合进行滤波。在不同实施例中,在描述特定装置实施例的此概述部分中如上地描述基本双耳滤波器。
特定实施例包括一种操作信号处理装置的方法。该方法包括:接受表示被配置用于双耳化音频信号的相应的一对待匹配的双耳滤波器的脉冲响应的一对信号,并且通过均由具有时间变化滤波器特性的修正滤波器表征的一对滤波器来处理该对接受的信号。该处理形成表示相应的一对经修正的双耳滤波器的脉冲响应的一对经修正的信号。该经修正的双耳滤波器被配置用于双耳化音频信号,并且还具有在单声道下混中的低感知混响以及对于耳机上双耳滤波器的最小影响的性质。
在一些实施例中,经修正的双耳滤波器的特征在于经修正的累加滤波器和经修正的差分滤波器。该时间变化滤波器被配置为使得经修正的双耳滤波器脉冲响应包括由对于收听在预定位置处的虚拟扬声器的收听者的头部相关传递函数定义的直达部分(direct part)。此外,与经修正的差分滤波器相比,经修正的累加滤波器具有明显减小的水平和明显更短的混响时间,并且存在从累加滤波器的脉冲响应的直达部分到累加滤波器的可忽略响应部分的平滑过渡,其中平滑过渡在时间上是频率选择性的。
在不同的实施例中,该经修正的双耳滤波器具有对于特定装置实施例在该概述部分中如上描述的基本双耳滤波器的性质。
特定实施例包括一种操作信号处理装置的方法。该方法包括接受表示被配置用于双耳化音频信号的相应的左耳和右耳双耳滤波器的脉冲响应的左耳信号和右耳信号。该方法还包括混洗左耳信号和右耳信号,以形成与左耳信号和右耳信号之和成比例的累加信号以及与左耳信号和右耳信号之间的差成正比的差分信号(difference signal)。该方法还包括通过具有时间变化滤波器特性的累加滤波器滤波该累加信号,所述滤波形成经滤波的累加信号,通过由该累加滤波器表征的差分滤波器处理该差分信号,该处理形成经滤波的差分信号。该方法还包括对经滤波的累加信号和经滤波的差分信号进行解混洗,以形成经修正的表示相应的左耳和右耳修正的双耳滤波器的脉冲响应的修正的左耳信号和修正的右耳信号。该修正的双耳滤波器被配置用于双耳化音频信号,可由经修正的累加滤波器和经修正的差分滤波器表示。在不同的实施例中,经修正的双耳滤波器具有对于特定装置实施例在此概述部分中如上所描述的基本双耳滤波器的性质。
特定实施例包括程序逻辑,其在由处理系统的至少一个处理器执行时使得实施对于特定装置实施例在此概述部分中如上描述的方法实施例中的任何一个。
特定实施例包括一种其中具有程序逻辑的计算机可读介质,该程序逻辑在由处理系统的至少一个处理器执行时使得实施对于特定装置实施例在此概述部分中如上描述的方法实施例中的任何一个。
特定实施例包括一种装置。该装置包括处理系统,其具有至少一个处理器以及存储设备。该存储设备被配置有程序逻辑,该程序逻辑在执行时使得该装置实施对于特定装置实施例在此概述部分中如上描述的方法实施例中的任何一个。
特定实施例可以提供这些方面、特征或优点中的全部、一些或不提供这些方面、特征或优点。特定实施例可以提供一个或多个其它方面、特征或优点,从在此的附图、描述和权利要求,其中的一个或多个可对于本领域技术人员是容易理解的。
双耳滤波器和标记(notation)
图1示出包括用于处理单个输入信号的一对双耳滤波器103、104的双耳化器101的简化框图。虽然双耳滤波器在本领域通常是已知的,但包括在此描述的单声道重放特征的双耳滤波器不是现有技术。
为了继续进行该描述,介绍一些标记。为了解释的简洁性,信号在此表示为连续时间函数。然而,信号处理领域技术人员应理解,该框架同样良好地用于离散时间信号,即已被合适地采样并且量化的信号。典型地,这种信号被表示时间中的采样时刻的整数索引。卷积积分变为卷积和,等。此外,本领域技术人员应理解,所描述的滤波器可以在时间域或频率域或甚至二者的组合中实现,并且也可以实现为有限脉冲响应FIR实现、递归无限脉冲响应(IIR)近似、时间延迟等。这些细节被本发明省略。
此外,虽然所描述的方法通常是可应用于并且容易地推广到任何数量的输入源信号。还应注意,此描述和公式并不是个别头部相关传递函数的任何具体集合或任何特定综合或一般头部相关传递函数的所特有的。该技术可以应用于任何期望的双耳响应。
参照图1,u(t)指示将由双耳化器101进行双耳化以用于通过耳机105双耳呈现的单个音频信号,hL(t)和hR(t)分别指示分别对于收听室中的收听者107的左耳和右耳的双耳滤波器脉冲响应。双耳化器被设计为向收听者105提供收听来自源——在预定位置处的“虚拟外放扬声器”109——的信号u(t)的声音的感觉。
存在与通过双耳滤波器103和104的合适设计实现源的这种虚拟空间定位的双耳滤波器的设计、近似和实现有关的大量现有技术。滤波器考虑好像扬声器109在完美无回声室中似的每一耳朵的头部相关传递函数(HRTF),也就是说,考虑直接来自虚拟扬声器109的收听的空间维度,并且还考虑收听环境中的早期反射和混响。对于关于如何设计一些双耳滤波器的更多细节,例如,参见公布为WO 9914983并且标题为UTILIZATION OF FILTERING EFFECTS IN STEREOHEADPHONE DEVICES的国际专利申请No.PCT/AU98/00769和公布为WO9949574并且标题为AUDIO SIGNAL PROCESSINGMETHOD AND APPARATUS的国际专利申请No.PCT/AU99/00002。这些申请中的每一个指定美国。公布WO 9914983和WO 9949574中的每一个的内容通过引用合并到此。
因此,已为了耳机使用而被双耳化的信号可以是可用的。信号的双耳化处理可以通过被提供以使得收听者具有在不同类型的室中收听内容的感觉的一个或多个预定双耳滤波器进行。一个商用双耳化已知是DOLBY HEADPHONE(TM)。DOLBY HEADPHONE双耳化中的双耳滤波器对具有带有公共非空间混响拖尾的各自的脉冲响应。此外,一些DOLBY HEADPHONE实现仅提供描述单个典型收听室的双耳滤波器的单个集合,而其它可以使用被指示为DH1、DH2和DH3的双耳滤波器的三个不同集合中的一个进行双耳化。它们具有以下性质:
·DH1提供适合于电影和仅音乐的录制品两者的小的、良好阻尼的房间中的收听感觉。
·DH2提供特别适合于音乐收听的更声音真实(acoustically live)房间中的收听感觉。
·DH3提供更像音乐厅或电影院的较大房间中的收听感觉。
表示卷积运算,也就是说,a(t)和b(t)的卷积表示为:
a ⊗ b = ∫ a ( t - τ ) b ( τ ) . dτ = ∫ a ( τ ) b ( t - τ ) . dτ ,
其中,时间依赖性没有在左手侧明确地示出,而将通过字母的使用被暗示。非时间依赖量将被清楚地指示。
双耳输出包括vL(t)指示的左输出信号和vR(t)指示的右耳信号。通过将源信号u(t)与双耳滤波器103、104的左脉冲响应和右脉冲响应卷积产生双耳输出:
v L = h L ⊗ u 左输出信号(1)
v R = h R ⊗ u 右输出信号(2)
图1示出单个输入音频信号。图2示出具有u1(t)、u2(t)、......uM(t)指示的一个或多个音频输入信号的双耳化器的简化框图,其中,M是输入音频信号的数量。M可以是1,或大于1。M=2针对立体声再现,并且更大的M针对环绕声音信号,例如M=4针对4.1环绕声,M=5针对5.1环绕声,M=7针对7.1环绕声等。我们也可以具有多个源(例如用于普通背景的多个输入)加上一个或多个输入以定位特定源(例如在环境中说话的人)。对于待空间化的每一音频输入信号存在一对双耳滤波器。为了真实再现,双耳滤波器考虑了对于各虚拟扬声器位置以及左耳和右耳的对应的头部相关传递函数(HRTF),并且还考虑被模拟的收听室的早期回声和混响响应。用于所示双耳化器的左和右双耳滤波器分别包括具有脉冲响应h1L(t)和h1R(t)、h2L(t)和h2R(t)、......、hML(t)和hMR(t)的左耳双耳化器和右耳双耳化器203-1和204-1、203-2和204-2、......、203-M和204-M。加法器205和206将左耳和右耳输出相加以产生输出vL(t)和vR(t)。
Mv表示虚拟扬声器的数量。这些扬声器示出为在图2中的Mv对应位置处的扬声器209-1、209-2、......、209-Mv。虽然典型地,M=MV,但这不是必需的。例如,上混可以被结合以空间化一对立体声输入信号,以使得耳机的收听者听起来就好像存在五个虚拟外放扬声器似的。
在此的描述中,讨论了通过单对双耳滤波器的操作以及单对双耳滤波器的特性。本领域技术人员应理解,这样的双耳滤波器对的操作以及双耳滤波器对的特性应用于例如图2所示的配置中的每一双耳滤波器对。
图3示出双耳化器303的简化框图,双耳化器303具有一个或多个音频输入信号并且生成左输出信号vL(t)和由vR(t)指示的右耳信号。vM(t)指示通过下混器305获得的左和右输出信号的单声道下混,该下混器305对左信号和右信号vL(t)以及vR(t)指示的右耳信号中的每一个执行一些滤波,并且将经滤波的信号相加、即混合。以下描述假设单个输入u(t)。滤波器307和308的分别关于下混器305的左输出信号和右输出信号的脉冲响应被表示为mL(t)和mR(t)。以下描述假设单个输入u(t)。对于每一这种输入发生相似操作。单声道下混然后是:
v M = m L ⊗ v L + m R ⊗ v R = ( m L ⊗ h L + m R ⊗ h R ) ⊗ u - - - ( 3 )
对于理想单声道相容性,期望单声道混合与初始信号u(t)相同(或与其成比例)。也就是说,vM(t)=αu(t),其中,α是某个缩放因子常数。为此对于应用,假设α=1,理想地需要应用以下恒等式:
m L ⊗ h L + m R ⊗ h R = δ - - - ( 4 )
其中,δ(t)是单位积分内核,也称为被定义为使得
Figure BDA0000051776610000113
的狄拉克delta函数。在离散处理中,期望的结果是
Figure BDA0000051776610000114
——每一脉冲响应是离散函数——与单位冲脉响应成比例。当然,在实际实现中,计算花费时间,从而通过实际因果滤波器实现,对于“完美”单声道相容性的需要是
Figure BDA0000051776610000115
是单位脉冲的时间延迟的且缩放的版本。
对于简单单声道混合,mL(t)=mR(t)=δ(t)。也就是说,
Figure BDA0000051776610000121
从而为了简单单声道混合,理想地,为了双耳化输出的单声道混合的完美再现,
hL(t)+hR(t)=δ(t),(5)
期望hL(t)和hR(t)提供良好双耳化,即,输出的呈现经由耳机听起来真实,就好像声音来自虚拟扬声器位置并且在真实收听室中似的。还期望双耳输出的单声道混合在被呈现时听起来像音频输入u(t)。
音频信号处理领域的技术人员将熟悉通过首先执行左和右双耳信号的混洗以生成累加通道和差分通道,表述关于立体声信号的集合的双耳滤波操作。
理想地,对于左输入和右立体声或双耳输入uL(t)和uR(t),累加与差分信号表示为uS(t)和uD(t):
u S ( t ) = u L ( t ) + u R ( t ) 2
u D ( t ) = u L ( t ) - u R ( t ) 2
还通过混洗操作实现反向关系:
u L ( t ) = u S ( t ) + u D ( t ) 2
u R ( t ) = u S ( t ) - u D ( t ) 2
通过混洗,双耳滤波器脉冲响应可被表达为具有脉冲响应hS(t)的累加滤波器以及具有表示为hD(t)的脉冲响应的差分滤波器,分别生成由vS(t)和vD(t)表示的经双耳滤波的累加和差分信号,从而:
v S = h S ⊗ u S
以及
v D = h D ⊗ u D
其中,
h S ( t ) = h L ( t ) + h R ( t ) 2
h D ( t ) = h L ( t ) - h R ( t ) 2
还通过混洗操作实施左耳和右耳双耳滤波器脉冲响应之间的反向关系式:
h L ( t ) = h S ( t ) + h D ( t ) 2 (9a)
h R ( t ) = h S ( t ) - h D ( t ) 2
在此描述中,讨论了与左耳和右耳双耳滤波器hL(t)和hR(t)有关的具有脉冲响应hS(t)的累加滤波器以及具有脉冲响应hD(t)的差分滤波器的特性。对于每一双耳滤波器对定义这些累加与差分滤波器。以上仅为了说明而讨论声立体输入。当然,累加与差分滤波器的存在不取决于存在立体声或任何特定数量的输入。对于每一双耳滤波器对定义累加与差分滤波器。
图4A示出通过混洗器401对左耳立体信号uL(t)和右耳立体信号uR(t)进行的混洗操作的简化框图,在混洗器401之后为分别具有累加滤波器脉冲响应和差分滤波器脉冲响应hS(t)和hD(t)的累加滤波器403和差分滤波器404,后随解混洗器405,实际上每一信号的混洗器和二分器,以产生左耳双耳信号输出和vL(t)右耳双耳信号输出vR(t)。
因为脉冲响应是时间信号——对单位脉冲输入的响应——所以该信号正如任何其它信号一样被执行滤波和其它信号处理操作。图4B示出通过混洗器401对左耳双耳滤波器脉冲响应hL(t)和右耳双耳滤波器脉冲响应hR(t)执行的为了生成累加滤波器双耳脉冲响应hS(t)和差分滤波器双耳脉冲响应hD(t)的混洗操作的简化框图。还示出通过解混洗器405(实际上解混洗器和二分器)执行的用于恢复左耳双耳滤波器脉冲响应hL(t)和右耳双耳滤波器脉冲响应hR(t)的解混洗。
注意,因为线性,所以常常实际上,在混洗中省去了
Figure BDA0000051776610000134
因子,并且向未被混洗的输出添加缩放因子2,从而在一些实施例中:
uS(t)=uL(t)+uR(t)
uD(t)=uL(t)-uR(t)                 (8b)
以及
u L ( t ) = u S ( t ) + u D ( t ) 2
u R ( t ) = u S ( t ) - u D ( t ) 2 - - - ( 9 b )
因此,在此的描述中,如本领域技术人员清楚地,可以适当地缩放所有量。
设计双耳滤波器
本发明特定实施例包括一种操作信号处理装置以修正被提供的一对双耳滤波器特性以确定一对经修正的双耳滤波器特性的方法。该方法的一个实施例包括接受表示被配置用于双耳化音频信号的相应的一对双耳滤波器的脉冲响应的一对信号。该方法还包括通过均由具有时间变化滤波器特性的修正滤波器表征的一对滤波器处理该对接受的信号,该处理形成表示相应的一对经修正的双耳滤波器的脉冲响应的一对经修正的信号。该经修正的双耳滤波器被配置用于将音频信号双耳化为一对双耳化信号,并且还具有双耳化信号的单声道混合对于收听者听起来自然的性质。
考虑分别具有左耳和右耳脉冲响应hL(t)和hR(t)的双耳滤波器的集合。如上所述,对于如等式(3)中描述的单声道混合,对于理想完美单声道相容性,在忽略任何比例常数的情况下,将理想地需要应用以下恒等式:
m L ⊗ h L + m R ⊗ h R = δ - - - ( 4 )
对于简单单声道混合,理想地:
hL(t)+hR(t)=δ(t),(5)
我们将双耳输出的单声道混合在被呈现时听起来像音频输入u(t)的性质称为“单声道重放相容性”或简单地称为“单声道相容性”。除了单声道重放相容性之外,期望hL(t)和hR(t)提供良好双耳化,即,输出的呈现经由耳机听起来自然,就好像声音来自虚拟扬声器位置并且在真实收听室中似的。还期望适应这样的情况:双耳化音频包括与不同虚拟扬声器位置并且因此与不同双耳滤波器对一起混合的若干不同音频输入源。期望单声道滤波器实现简单,优选地与用于立体声内容的单声道下混的一般实践相容。等式(5)的约束通常不可能不对双耳脉冲响应的方向和距离特性造成明显影响。这暗示除了滤波器脉冲响应的初始脉冲和抽头外,对于t>0,hR(t)=-hL(t)。换句话说,对于t>0,当双耳滤波器被表示为具有脉冲响应hS(t)和hD(t)的累加和差分滤波器时,对于t>0,hS(t)=0。
不立即明显的是,可以在没有对双耳响应的明显影响的情况下以任何方式实现此约束。这要求双耳脉冲响应的整体具有相关系数-1。也就是说,脉冲响应将等同于变号。
图5以简化形式示出假设对于累加滤波器hS(t)或对于左耳双耳滤波器或右耳双耳滤波器的典型双耳滤波器脉冲响应。这种声学脉冲响应的一般形式包括直达声、一些早期反射、以及由间隔小的反射组成并且因此由扩散混响良好地近似的响应的稍后部分。
假设被提供有分别具有脉冲响应hL0(t)和hR0(t)的左耳双耳滤波器和右耳双耳滤波器,并且假设它们提供满意的双耳化。本发明一方面是也提供满意的双耳化的脉冲响应hL(t)和hR(t)所定义的双耳滤波器的集合,例如类似于给定滤波器hL0(t)和hR0(t)的集合,但它们的输入当被下混为单声道信号时也听起来良好。讨论的是hL(t)和hR(t)如何与hL0(t)和hR0(t)比较,并且给定hL0(t)和hR0(t),我们将如何设计hL(t)和hR(t)。
直达响应部分
在左耳双耳脉冲响应和右耳双耳脉冲响应的中的每一个中,直达响应对主要负责施加给收听者的方向的感觉的两个对应的耳朵的水平和时间差进行编码。发明人发现,双耳滤波器的直达头部相关传递函数(HRTF)部分的谱效应不是太严重。此外,典型HRTF还包括时间延迟分量。这说明,当经双耳化的输出被混合为单声道信号时,用于单声道信号的等效滤波器将不是最小相位的,并且将引入一些附加谱整形(spectral shaping)。发明人发现,这些延迟相对短,例如<1ms。因此,虽然当经双耳化的信号的输出被混合为单声道信号时延迟确实产生一些谱整形,但发明人发现,该谱整形通常不太严重,并且延迟产生的任何离散回声相对不可感知。因此,在本发明一些实施例中,hL(t)和hR(t)的双耳滤波器脉冲响应的直达部分——HRTF定义的那些——对于例如滤波器hL0(t)和hR0(t)的任何双耳滤波器脉冲响应相同。也就是说,根据本发明一些方面考虑的双耳滤波器hL(t)和hR(t)的特性排除了双耳滤波器的脉冲响应的直达部分。
注意,在一些替换实施例中,考虑此谱整形。通过考虑在给定跨越虚拟扬声器位置的激励的情况下在左耳和右耳得到的组合的谱,一个实施例包括用于实现更平坦的谱响应的补偿均衡滤波器。这常常被称为补偿扩散场头部响应,并且如何执行这种滤波对于本领域技术人员将是简单明了的。虽然这种补偿可以消除谱双耳线索(cue)中的一些,但其确实导致谱着色。
在一个实施例中,直达声响应是对于t<0的响应。也就是说,
hL(t)=hL0(t)for t<3ms,以及          (10)
hR(t)=hR0(t)for t<3ms.               (11)
现在考虑分别表示为hS0(t)和hD0(t)的初始累加与差分滤波器,以及分别表示为hS(t)和hD(t)的双耳化器的累加与差分滤波器。等式(8a)和(9a)以及图4B描述左耳双耳化器和右耳双耳化器脉冲响应与累加以及差分滤波器脉冲响应之间的正向和反向关系,即一个是另一个的混洗版本。再次注意,在混洗操作和反向混洗操作的实际实现中,在各操作中可不包括因子,但作为一个示例,简单地在一个混洗中确定累加与差分,并且在用于反向该操作的混洗中,除以2,如在Eq(8b)和(9b)中描述的那样。
发明人发现,典型双耳滤波器脉冲响应在累加与差分滤波器两者中具有相似的信号能量。等式(5)中标识的单声道相容性约束等同于声明累加滤波器没有脉冲响应,即对于t>0,hS(t)=0。对于不考虑未改变的响应的直达部分的实施例,如等式(10)和(11)所示,该要求被放宽为对于t>3ms或甚至更晚,hS(t)=0。
为了在累加与差分滤波器中保持近似相同的能量,如果需要在修正的响应中保持正确的谱以及直达声与混响能量的比率,则与初始滤波器相比,差分声道应提升大约3dB。然而,这种修正产生双耳成像的不期望的劣化。耳间互相关的突然改变具有强感知效应,并且破坏很多空间和距离的感觉。
在一个实施例中,
对于小的t值,假设t<3ms,hD(t)=hD0(t),以及(12)
对于大的t值,例如t>40ms, h D ( t ) = 2 h D 0 ( t ) , - - - ( 13 )
双耳滤波器具有这样的差分滤波器脉冲响应,即,对于脉冲响应的直达部分(例如<3ms)为典型双耳差分滤波器脉冲响应的3dB提升,并且在差分滤波器脉冲响应的混响部分的稍后部分中具有平坦常数值脉冲响应。
发明人发现,从hD(t)=hD0(t)到的改变突然产生,所得双耳滤波器与初始滤波器相比具有不期望的双耳成像的劣化。耳间互相关的突然改变具有强感知效应,并且破坏很多空间和距离的感觉。
本发明一方面是以被感知掩蔽的渐进方式在双耳响应的稍后部分中引入单声道相容性约束,因此对双耳成像具有最小影响。
发明人发现,双耳滤波器对的典型双耳室脉冲响应典型地在初始时相当地相关,并且在该响应的稍后部分中变得不相关。此外,归因于较短的波长,响应的较高频率部分在双耳响应较早地变得不相关。也就是说,发明人发现,存在依赖于时间的现象。
在本发明一个实施例中,双耳对的累加滤波器通过时间变化滤波器与典型双耳滤波器对的典型累加滤波器相关。将时间变化滤波器的时间变化脉冲响应表示为f(t,τ),其为时间变化滤波器在时间t对于在时间t=τ的脉冲、即对于输入δ(t-τ)的响应。也就是说,
hS(t)=∫hS0(t-τ)f(t,τ).dτ(14)
其中,f(t,τ)是:
f(0,τ)=δ(τ),以及                              (15)
对于稍后的时间,例如t>40ms或者t>80ms,f(t,τ)≈0 (16)
在一些实施例中,f(t,τ)是或者近似于零延迟、线性相位、低通滤波器脉冲响应,具有表示为Ω(t)>0的减小的依赖于时间的带宽,从而表示为|F(t,ω)|的依赖于时间的频率响应具有这样的性质:|F(t,ω)|对于小于带宽的低频率是平坦的,并且在带宽之外是0。
|F(t,ω)|≈1 for|ω|<Ω(t)|(17)
|F(t,ω)|≈0 for|ω|>Ω(t),(18)
其中,时间变化频率响应表示为F(t,ω),其中,
F ( t , ω ) = ∫ - ∞ ∞ f ( t , τ ) e jωr . dτ , - - - ( 19 )
并且其中,时间变化带宽在时间上单调减小,即
Ω(t1)>Ω(t2) for t1<t2,(20)
一个实施例使用如下这样的滤波器时间依赖带宽,即其从在t=0的至少20kHz单调增大到对于高时间值(例如对于t>10ms)的大约100Hz或更少。也就是说,
从而:
Ω ( 0 ) 2 π > 20 kHz , 以及
对于t>40ms, &Omega; ( t ) 2 &pi; < 100 Hz - - - ( 21 )
本领域技术人员应再次理解等式(14)-(21)中表达的滤波器的形式是连续时间的。在离散时间意义上描述该情况将相对简单明了,所以在此将不讨论,以不从描述本发明的特征分心。
关于差分滤波器,一个实施例使用这样的差分滤波器,该差分滤波器的脉冲响应hD(t)与其空间化将通过下式被匹配的差分滤波器相关:
h D ( t ) = 2 h D 0 ( t ) - ( 2 - 1 ) &Integral; h D 0 ( t - &tau; ) f ( t , &tau; ) . d&tau; - - - ( 22 )
其中,hD0(t)表示原始差分滤波器脉冲响应。
本领域技术人员应再次理解,在等式(22)中以连续时间表达滤波器的形式。在离散时间意义上描述该情况将相对简单明了,所以在此将不讨论,以不从描述本发明的特征分心。
在表示为f(t,τ)的低通滤波器脉冲响应具有零延迟和线性相位,从而其空间化量将被匹配的原始差分滤波器hD0(t)和差分滤波器hD(t)是相位相干的情况下,具有等式(22)的脉冲响应的滤波器是适当的。
注意,因为f(0,τ)=δ(τ),
hD(0)=hD0(0)
此外,因为对于稍晚时间,例如t>40ms,f(t,τ)≈0,
对于t>40ms左右, h D ( t ) = 2 h D 0 ( t )
因此,在稍后时间(例如在40ms之后)差分滤波器脉冲响应与将被匹配的或典型的双耳滤波器的差分滤波器成比例。因此,对于原始差分滤波器脉冲响应hD0(t)的修正对于差分通道实现了依赖于频率的提升,其在定义为t=0的初始脉冲时间以0dB开始,并且随着时间t增加而在逐渐更低的频率增大到+3dB。在累加与差分滤波器将具有在幅度上相似并且不相关的脉冲响应的假设下,此增益是适当的。虽然这并非总是严格正确的,但发明人发现这是合理假设,并且已经发现,差分通道脉冲响应hD(t)与其空间化将被匹配的双耳滤波器对的差分通道脉冲响应之间的关系是一种校正经修正的滤波器的谱以及直达声与混响的比率的合理途径。
然而,本发明不限于等式(14)和(22)中所示的关系。在替换实施例中,可使用其它关系以进一步改进与任何被提供的或确定的双耳滤波器对(例如与脉冲响应hL0(t)和hR0(t))的谱匹配。在此将该具体途径描述为用于实现合理结果的相对简单方法,但不意味着限制。
然后可以使用等式(8a)和(9a)以及图4B的或Eq(8a)和(9b)的混洗关系重构目标双耳滤波器。已经发现此途径在单声道下混中的混响减小与对双耳响应的被感知掩蔽的影响之间提供了有效平衡。到相关系数-1的过渡(transition)平滑地并且在初始时间间隔(例如脉冲响应的初始40ms)期间发生。在该实施例中,单声道下混中的混响响应被局限于大约40ms,并且高频混响短得多。
40ms的时间是针对单声道下混将几乎感知地无回声而建议的。虽然在单声道混合中仍存在一些早期反射和混响,但这被直达声有效地掩蔽,并且发明人已经发现,其不被感知为离散回声或附加混响。
本发明不限于过渡区域的长度40ms。这样的过渡区域可以根据应用而改变。如果期望模拟具有尤其长的混响时间或低的直达声与混响的比率的房间,则过渡时间可以进一步延长,并且与用于这样的房间的标准双耳滤波器相比仍提供对于单声道相容性的改进。40ms过渡区域被发现适合于这样的具体应用:其中原始双耳滤波器具有150ms的混响时间,并且需要单声道混合尽可能接近无回声。
虽然在一些实施例中,完全排除了累加滤波器,但这不是要求。累加脉冲响应的幅度以足以实现单声道下混的混响部分中的可察觉的差别或减小的因子被减小。发明人选择大约6dB的混响水平的改变作为准则“恰可察觉差(just noticeable difference)”。因此,在本发明的一些实施例中,与关于通过典型双耳滤波器被双耳化的信号的单声道下混的情况相比,使用至少6dB的累加滤波器混响响应的减小。因此,在一些实施例中,没有完全排除了累加滤波器,但例如通过将累加通道滤波器脉冲响应幅值衰减6dB或更大,使得累加滤波器的影响(例如其脉冲响应的幅度)明显降低。一个实施例通过组合原始累加滤波器脉冲响应与以上提出的经修正的滤波器脉冲响应以确定表示为如下
Figure BDA0000051776610000201
的和脉冲响应实现该情况:
h S &prime; &prime; ( t ) = h S 0 ( t ) + ( 1 - &beta; ) h S ( t ) . - - - ( 23 )
β的典型值是1/2,其相等地加权原始的和经修正的累加滤波器脉冲响应。在替换实施例中,使用其它加权。
还应注意,f(t,τ)为零延迟以及线性相位的约束是为了简单以及等式(22)的差分通道的混洗变换和修正中的适当相位重构。信号处理领域技术人员应明了,假设适当的滤波也被应用于差分通道以创建hD(t)与hD0(t)之间关系,则可以放松此约束。发明人观察到,双耳响应的稍晚部分中的精确相位关系和方向线索对于空间和距离的一般感觉不是关键的。因此,这种滤波可以不是严格必需的。如果目标是将双耳滤波器hL(t)、hR(t)中的混响比率维持为另一双耳滤波器对hL0(t)、hR0(t)中存在的,则这可以通过对于差分滤波器脉冲响应hD(t)的适当的——在一个实施例中依赖于频率的——增益实现。
图6示出信号处理装置的简化框图,并且图7示出操作信号处理装置的方法的简化流程图。该装置用于确定形成这样的双耳滤波器对的左耳和右耳脉冲响应的左耳信号hL(t)和右耳信号hL(t)的集合,该双耳滤波器对近似于具有左耳和右耳脉冲响应hL0(t)和hR0(t)的双耳滤波器对的双耳化。该方法包括:在703中,接受表示被配置用于双耳化音频信号并且其双耳响应将被匹配的相应的左耳和右耳双耳滤波器的脉冲响应的左耳信号hL0(t)和右耳信号hR0(t)。该方法还包括:在705中,混洗该左耳信号和右耳信号,以形成与左耳信号和右耳信号之和成比例的累加信号以及与左耳信号与右耳信号之间的差成比例的差分信号。在图6的装置中,该操作通过混洗器603执行。该方法还包括:在707中,通过具有时间变化滤波器特性的时间变化滤波器(累加滤波器)605滤波该累加信号,该滤波形成经滤波的累加信号,以及通过由累加滤波器605表征的差分时间变化滤波器607(差分滤波器)处理该差分信号,该处理形成经滤波的差分信号。该方法还包括:在709中,解混洗经滤波的累加信号和经滤波的差分信号,以形成产生分别与这样的双耳滤波器的左耳脉冲响应和右耳脉冲响应成比例的左耳信号和右耳信号,该双耳滤波器的空间化特性匹配于该将被匹配的双耳滤波器的空间化特性,并且其输出可被下混为具有可接受的声音的单声道混合。在图6中,除添加了除以2之外,解混洗器609与随机化器603相同。所得脉冲响应定义了这样的双耳滤波器,该双耳滤波器被配置用于双耳化音频信号,并且还具有这样的性质:累加通道脉冲响应在前40ms左右平滑地减小到不可觉察的水平,例如大于-6dB,并且差分通道过渡为变得在前40ms左右与典型或特定的将被匹配的双耳滤波器差分声道脉冲响应成比例。
因此,已经描述了操作信号处理装置的方法。该方法包括:接受表示被配置用于双耳化音频信号的相应的一对双耳滤波器的脉冲响应的一对信号。该方法包括:通过均由具有时间变化滤波器特性的修改滤波器表征的一对滤波器处理该对接受的信号,该处理形成表示相应的一对修正的双耳滤波器的脉冲响应的一对经修正的信号。该修正的双耳滤波器被配置用于双耳化音频信号,并且还具有在单声道下混中的低感知混响以及对于耳机上的双耳滤波器的影响最小的性质。
根据本发明一个或多个方面的双耳滤波器具有以下性质:
·例如脉冲响应的初始3至5ms中的脉冲响应的直达部
分由虚拟扬声器位置的头部相关传递函数定义。
·与差分滤波器脉冲响应相比,累加滤波器脉冲响应中的明显降低的水平和/或明显更短的混响时间。
·从累加滤波器的脉冲响应的直达部分到累加滤波器的稍后为零或可忽略的响应部分的平滑过渡。平滑过渡在时间上是频率选择性的。
这些性质将不产生在任何实际室响应中,因此将不在典型或将被匹配的双耳滤波器中出现。这些性质被引入或者设计到双耳滤波器的集合中。
以下更详细地描述这些性质。
扬声器相容性
虽然以上描述说明了具有单声道重放相容性的双耳滤波器,但本发明另一方面是具有根据本发明实施例的滤波器的输出信号双耳化器也与在外放扬声器的集合上重放相容。
声学串扰是用于描述如下这样的现象的术语:当收听立体声外放扬声器对(例如位于收听者的近似中心前部)时,收听者的每一耳朵将从这两个立体声外放扬声器接收信号。通过根据本发明实施例的双耳滤波器,声学串扰实现了较低频率混响的一些消除。一般来说,对于输入的混响响应的稍后部分逐渐变得被低通滤波。因此,已经发现,当在扬声器上试听时,通过根据本发明实施例的滤波器双耳滤波器被双耳化的信号听起来具有较少混响。这特别地为例如可在移动媒体设备上发现的小型的间隔相对近的立体扬声器的情况。
复杂度降低
已知通过使用脉冲响应的混响部分对于空间位置较不敏感的观察来设计包含相对较少的用于实现的计算的双耳滤波器。因此,很多双耳处理系统使用其脉冲响应对于不同的模拟的虚拟扬声器位置具有共同尾部的双耳滤波器。参见例如上述专利公布WO 9914983和WO9949574。本发明实施例可应用于这样的双耳处理系统,并且应用于修正这样的双耳滤波器以具有单声道重放相容性。特别地,根据本发明实施例设计的双耳滤波器具有这样的性质:左耳脉冲响应和右耳脉冲响应的混响拖尾的后部异相,在数学上表达为:对于时间t>40ms左右,hR(t)≈-hL(t)。因此,根据双耳滤波器的相对低的计算复杂度实现,对于响应的稍后部分仅需要确定单个滤波器脉冲响应,并且这样确定的后部脉冲响应可用于对于全部虚拟扬声器位置的双耳滤波器对的左耳脉冲响应和右耳脉冲响应中的每一个中,导致存储器和计算的节省。每一这样的双耳滤波器对的累加滤波器包括使累加滤波器低频含量进一步延伸到双耳响应的逐渐时间变化频率截止。
示例算法和结果
先前部分阐述用于实现修正的双耳滤波的一般性质和方法。虽然存在将具有相似结果的滤波器设计和处理的很多可能变化,但提出以下示例以阐明期望的滤波器性质,并且提供用于修改现有双耳滤波器的集合的优选方法。
图8示出实施将一对双耳滤波器脉冲响应转换成代表双耳滤波器的脉冲响应的信号的方法的一部分的MATLAB(Mathworks,Inc.,Natick,Massachusetts)的句法中的代码的部分。使用一连串串联的一阶滤波器实现线性相位、零延迟、时间变化低通滤波器。这种简单方法近似了高斯滤波器。MATLAB代码的简要部分获取一对双耳滤波器h_L0和h_R0,并且创建输出双耳滤波器h_L和h_R的集合。其基于48kHz的采样率。首先,在803中,混洗输入滤波器以创建原始累加与差分滤波器(见代码行1-2)
高斯滤波器的3dB带宽(B)根据采样速率的倒数平方以及适当的缩放系数变化。由此计算高斯滤波器的关联方差(GaussVar),并且将其除以4,以获得指数一阶滤波器的方差(ExponVar)。在805中,这被用于计算时间变化指数加权因子(a)。(见代码行3-6)
在807中,使用一阶滤波器的两个前向和两个反向传递实现滤波器。累加与差分响应被滤波。(见代码行7-12)
在809中,从原始差分响应的放大版本重建差分,小于经滤波的差分响应的适当量。这实质上为从在时间0的0dB到在稍后响应中的+3dB的差分声道的频率选择提升。(见代码行13)
最后,在811中,重新混洗滤波器以创建经修正的左双耳滤波器和右双耳滤波器。(见代码行14-15)
通过将图8中编码的方法应用于对于位于收听者前面的声音的双耳滤波器脉冲响应的集合获得以下附图,具有150ms最大混响时间和大约13dB的直达声对混响能量的比率。
图9示出在若干时间τ:在1、5、10、20和40ms处的时间变化滤波器对于脉冲的脉冲响应f(t,τ)的图线。前两个脉冲超过附图的垂直标度范围。图9清楚地示出被应用的滤波器脉冲响应的高斯近似以及近似高斯滤波器脉冲响应随着时间的增加的方差。由于一阶滤波器在前向和反向运行,因此所得滤波器近似为零延迟、线性相位、低通滤波器。
图10示出在1、5、10、20和40ms的时间τ处的脉冲响应f(t,τ)的时间变化滤波器的频率响应能量的图线。可见,响应的直达部分--在此情况下大约从0至3ms--将基本不受滤波器影响,而直到40ms,滤波器一直到100Hz产生几乎10dB的衰减。因为脉冲响应的近似高斯形状,所以频率响应也具有近似高斯分布。此近似地高斯频率响应分布、以及截止频率随时间的变化都有助于实现对于原始滤波器进行的修正的感知掩蔽。
图11示出原始左耳脉冲响应hL0(t)和经修正的左耳脉冲响应hL(t)。可见,二者具有相似的混响能量水平。直达声保持不变。注意,直达声的初始脉冲在0.2左右测量,并且在图中无法按比例示出。
图12示出原始累加脉冲响应和经修正的累加脉冲响应hS0(t)和hS(t)的比较。这清楚地表明累加响应的减小的水平和混响时间。这是当输出被下混到单声道时实现混响的显著减小的特性。还可见,经修正的累加响应hS(t)逐渐变为低通滤波的,其中,仅最低频率信号分量延伸超过响应的早期部分。
图13示出原始差分脉冲响应和经修正的差分脉冲响应hD0(t)和hD(t)。可观察到差分信号的水平被提升。这将实现两个响应的可比较的谱。
双耳滤波器的时间频率分析
例如如由根据本发明一个或多个方面的一对双耳脉冲响应表征的双耳滤波器在用于对源信号滤波时(例如通过与双耳脉冲响应卷积,或者另外应用于源信号),对于经由耳机收听的收听者添加模拟方向、距离和房间声学的空间质量。
例如,对可以交叠的部分信号使用短时傅立叶变换或其它短时变换的时间频率分析是本领域公知的。例如,频率时间分析图线被称为谱图。例如,典型地在期望的信号的分段上实现为加窗离散傅立叶变换(DFT)的短时傅立叶变换。其它变换也可以用于时间频率分析,例如小波变换和其它变换。脉冲响应是时间信号,因此可以由其时间频率性质表征。本发明的双耳滤波器可由这种时间频率特性描述。
根据本发明的一个或多个方面的双耳滤波器被配置用于同时实现例如根据一对将被匹配的双耳滤波器的在耳机上的令人信服双耳效应,以及当被下混到单个输出时的单声道重放相容信号。通过一个或多个特征,本发明的双耳滤波器被配置具有双耳滤波器脉冲响应的(短时)频率响应随着时间变换的性质。具体地说,累加滤波器脉冲响应(例如两个左双耳滤波器脉冲响应和右双耳滤波器脉冲响应的算术和)具有与差分滤波器脉冲响应(例如左双耳滤波器脉冲响应和右双耳滤波器脉冲响应的算术差)明显不同的时间和频率上的图案。对于典型双耳响应,累加与差分滤波器示出十分相似的频率响应随时间的变化。响应的早期部分包含能量的主体,稍后响应包含混响或扩散分量。这是在早期部分和后期部分与给予脉冲响应的空间或双耳特性的滤波器的特性结构之间的平衡。然而,当下混到单声时,此混响响应通常使信号可懂度和感知质量劣化。
简单相容性指的是等式(5)成立。也就是说,除了对于滤波器脉冲响应的初始脉冲或抽头外,对于t>0,hR(t)=-hL(t),即对于t>0,hS(t)=0。所得滤波器集合被称为简单单声道重放相容滤波器集合或简单滤波器。
在此部分中描述了本发明双耳滤波器对的这样的脉冲响应的时间频率分析的一些特性,并且对于一些时间频率参数提供了一些典型值和值的范围。这通过示例数据以及与1)将被匹配的例如典型双耳滤波器的集合以及2)通过利用简单相容性以获得简单单声道相容性滤波器集合而从典型双耳滤波器推导的第一集合的比较被阐明。
图14A-图14E示出沿滤波器的长度在变化的时间跨度处的累加与差分滤波器响应中的作为频率的函数的能量的图线。尽管是任意的,但对于该描述,发明人选择0-5ms、10-15ms、20-25ms、40-45ms以及80-85ms的时间片段。每一部分的5ms跨度在于对于可比较的功率水平保持一致长度,并且其也足以捕获可以在时间上稀疏的滤波器中的回声和细节中的一些。图14A-图14E示出根据本发明一个或多个方面的对于典型对、对于简单单声道相容性对、以及对于新双耳滤波器对的在这些时间的5ms分段的频率谱。为了确定这些图线,从典型(将被匹配的对)确定简单单声道兼容性对的脉冲响应。此外,从根据上文中描述的方法从典型(将被匹配的对)确定包括本发明的特征的滤波器的脉冲响应。使用短时傅立叶变换作为短时窗口DFT计算频率能量响应。没有交叠用于确定频率响应的五个集合。
注意,所示滤波器可被以任意量容易地缩放,从而在这些图线中表示的值应在相对的和定量的意义中解释。感兴趣的不是实际水平,而是当与对应的累加滤波器脉冲响应比较时对应的差分滤波器脉冲响应的谱的特定部分变为可忽略的时间。
图14A,对于在时间0ms开始的前5ms,可见,三个响应是几乎相同的。这是基于用于给予方向的感觉的来自虚拟扬声器位置的HRTF的响应的很早部分。归因于掩蔽效应和占主导的初始脉冲,在此时间中的滤波器中的信号或回声的任何扩展在很大程度上在感知上被忽略。
在图14B中,对于在时间10ms开始的5ms,用于简单化方法的累加信号是零。累加响应的稍后部分已经被排除。作为比较,例如上文中描述的被确定的新颖滤波器对在4kHz之下在累加滤波器中仍保持一些信号能量。所有三个滤波器的差分相似,其中新颖滤波器对差分脉冲响应在较高频率具有稍微更多能量。
在图14C中,对于在时间20ms开始的5ms,新颖滤波器对的累加滤波器被进一步衰减,其中,带宽下降到大约1kHz。新颖滤波器的差分滤波器被提升以维持总体上与典型的或将被匹配的滤波器对的双耳水平和频率响应相似的双耳水平和频率响应。
在图14D中,对于在40ms开始的5ms,仅累加滤波器新颖滤波器对的最低分量保留。最后,在图14E中,对于在80ms开始的5ms,简单和新颖滤波器对两者中的累加滤波器脉冲响应可忽略。
因此,提出具有被配置用于实现非常良好的单声道重放相容性的双耳滤波器脉冲响应的整形的双耳滤波器的集合。在一些实施例中,滤波器被配置为使得单声道响应被约束为前40ms。
以下性质涉及用于实现良好双耳响应和良好单声道重放相容性的滤波器的有效性。其中,“滤波器范围”和“滤波器长度”是滤波器的脉冲响应在该处降到其初始值的-60dB之下的点。这在本领域中也称为“混响时间”。
以下性质允许将在此描述的本发明的滤波器与其它双耳滤波器和单声道重放相容双耳滤波器区分开。
·累积与差分滤波器大不相同。对于普通双耳滤波器,累积与差分滤波器示出在时间频率图线上的相似的强度和衰变的特性。
·在所有频率,累加滤波器明显短于差分滤波器。虽然对于典型的收听室,累加滤波器的持续时间将典型地稍短,但这不那么明显。对于单声相容性,累加滤波器必须相当短。
·累加滤波器示出跨越不同频率的长度中的明显差异。这是与其中累加滤波器跨越频率在长度方面合理地恒定的简单化方法的比较。
·累加滤波器在高频率较短,并且在低频率较长。
注意,可以实现相似的整形,其中,累加通道的抑制更积极主动(更好的单声响应)或更保守(更好的双耳响应)。
在更定量的意义上,为了实现双耳响应和单声道重放相容性的良好组合,发现以下情况是真实的:
差分滤波器
·差分滤波器的高频率(例如10kHz以上)不延伸超过大约10ms。在另一示例实施例中,大约20ms的差分滤波器长度仍然是可接受的,而大约40ms的滤波器长度,单声道信号开始听起来有回声。
·差分滤波器的低频率(例如在3kHz与4kHz之间)较长,向外延伸到大约40ms或在该频率的差分滤波器的混响长度的约1/8至1/4。
·,在甚至更低的频率(例如小于2kHz),对于非常好的响应,差分滤波器在最低频率处不应长于大约80ms。在一些实施例中,甚至120ms的长度听起来可接受,而对于小于2kHz的大约160ms的滤波器长度,单声道信号开始听上去有回声。
此外,为了通过这种受约束的差分滤波器实现良好双耳响应,差分滤波器的整个范围(例如混响)不应太长。发明人已经发现,200ms的混响时间产生优异的结果,400ms产生可接受的结果,而对于800ms的滤波器长度,音频开始听上去有问题。
累加滤波器
表1提供了对于不同频带的累加滤波器脉冲响应长度的典型值的集合,以及还提供了仍将提供单声道重放相容性与收听室空间化之间的平衡的对于频带的累加滤波器脉冲响应长度的值的范围。
表1
  频带(带宽)   典型累加滤波器长度   累加滤波器长度的范围
  0-100Hz   80ms   40-160ms
  100-1kHz   40ms   20-80ms
  1-2kHz   20ms   10-40ms
  2-20kHz   10ms   5-20ms
选择依赖于时间的频率整形取决于例如上文中描述的由将被匹配的双耳滤波器hL0(t)和hR0(t)的集合表征的期望的双耳响应的本质和混响、以及还取决于单声道混合中相对于双耳滤波器中的近似或约束对清晰度的偏好。
为了有助于本发明所指示的和滤波器的整形的描述,示例数据现在被呈现为时间和频率的二维映射上的相对滤波器能量的图线。图15A和图15B示出分别对于示例双耳滤波器对实施例的累加与频率滤波器脉冲响应的时间-频率平面上的等效衰减轮廓,而图16A和图16B示出时间-频率图线的表面(即谱图的)的等距视图。通过使用相隔开始1.5ms(即具有明显交叠)的5ms长的分段上的加窗短时傅立叶变换获得轮廓数据。等距视图使用3ms窗口长度,其中没有交叠,即数据每隔3ms开始,图17A和图17B示出与图16A和图16B相同的时间-频率图线的表面的等距视图,但是分别对于典型双耳滤波器对--特别地用于图16A和图16B的那些双耳滤波器将匹配的双耳滤波器--的累加与频率滤波器脉冲响应。注意,在典型双耳滤波器对中,累加与差分滤波器的各自脉冲响应的时间-频率图线的形状并非那样不同。
注意,简单单声道相容性滤波器对将示出其响应对于所有频率立即并且突然下降到可感知水平之下的累加滤波器脉冲。
注意,执行时间-频率数据的某种平滑以生成图15A、图15B、图16A、图16B、图17A和图17B以简化附图,从而不会由于各个响应中的小细节变化而使时间频率特性的特征模糊。
应注意,在此呈现的所有图线和图形中所示的dB水平仅在相对比例上,因此不是被描述滤波器和图案的绝对特性。本领域技术人员将能够解释这些附图以及它们描述的特性,而无需精确地遵循详细的水平、时间和谱形状。
测试
发明人通过具有以上表1的“典型累加滤波器长度”列中定义的整形以及图14A-图14E的作为示例给出的待匹配的双耳脉冲响应响应的若干类型的源材料进行主观测试。待匹配的脉冲响应具有带有200-300ms混响时间的双耳响应,并且与DOLBY HEADPHONE DH3双耳滤波器对应。不存在其中在测试中主体偏好一个双耳响应超过另一个双耳响应的统计显著情况。然而,对于所有测试的源材料,单声道混和基本上被改进,并且被所有主体无异议地偏好。
通过扬声器的重放
使用双耳滤波器的上述方法和装置不仅可应用于双耳耳机重放,而且可以应用于立体声扬声器重放。当外放扬声器靠近在一起时,在收听期间在收听者的左耳和右耳之间存在串扰,例如,扬声器的输出与距扬声器最远的耳朵之间的串扰。例如,对于在收听者前面放置的一对立体声扬声器,串扰指的是左耳收听来自右扬声器的声音,并且还指的是右耳收听来自左扬声器的声音。当与扬声器与收听者之间的距离相比扬声器充分地接近时,串扰基本上使得收听者听到来自两个扬声器输出的总和。这基本上与单声道回放相同。
实现滤波器
此外,本领域技术人员应理解,可通过很多方法实现数字滤波器。例如,可通过有限脉冲响应(FIR)实现、频域中的实现、交叠变换方法等实施数字滤波器。很多这样的方法是已知的,并且如何将它们应用于在此描述的实现对于本领域技术人员将是简单明了的。
注意,本领域技术人员应理解,以上滤波器描述没有说明所有需要的组件(例如音频放大器以及其它相似的组件),本领域技术人员将知道添加这些元件而无需另外教导。此外,以上实现用于数字滤波。因此,对于模拟输入,本领域技术人员应理解包括模拟到数字转换器。此外,将理解数字到模拟(D/A)转换器被将数字信号输出转换为模拟输出,以用于通过耳机重放,或者在贯穿听觉(transaural)滤波的情况下,通过外放扬声器回放。
图18示出根据本发明方面的用于处理音频输入信号的集合的音频处理装置的实现的形式。音频处理系统包括:输入接口块1821,其包括被配置用于将模拟输入信号转换为相应的数字信号的模拟到数字(A/D)转换器;以及输出块1823,具有用于将处理的信号转换为模拟输出信号的数字到模拟(D/A)转换器。在替换实施例中,输入块1821还可或者作为A/D转换器的替代包括SPDIF(Sony/PhilipsDigital Interconnect Format)接口,被配置为除了模拟输入信号之外或者不同于模拟输入信号,接受数字输入信号。该装置包括能够处理输入以足够快地生成输出的数字信号处理器(DSP)设备1800。在一个实施例中,DSP设备包括被配置用于传递A/D和D/A转换器信息而没有处理器开销的串行端口1817形式的接口电路、以及在一个实施例中,可以从片外存储器1803将数据拷贝到片上存储器1811而不干扰输入/输出处理的操作的DMA引擎1813和设备外存储器1803。在一些实施例中,用于实现在此描述的本发明的方面的程序代码可以根据需要在片外存储器1803中,或者加载到片上存储器1811。所示DSP装置包括程序存储器1807,其包括使得DSP装置的处理器部分1805实现在此描述的滤波的程序代码1809。对于需要外部存储器1803的情况,包括外部总线复用器1815。
注意,术语片外和片上不应被理解为表示存在多于一个的所示芯片。在现代应用中,所示DSP设备1800块可以被提供作为“内核”,以连同其它电路一起被包括在芯片中。此外,本领域技术人员应理解,图18所示的装置仅是示例。
相似地,图19A示出双耳化装置的实施例的简化框图,该装置被配置用于接受为旨在通过前扬声器重放的左、中和右信号以及旨在经由后扬声器重放的左环绕和右环绕信号的形式的五个通道的音频信息。双耳化器实现本发明的各方面的用于各输入的双耳滤波器对,包括用于左环绕和右环绕信号的双耳滤波器对,从而在收听单声道混合的收听者通过愉快方式体验信号如同来自单声道源的同时,通过耳机收听的收听者到体验空间内容。使用处理系统1903实现双耳化器,例如一个包括DSP设备,其包括至少一个处理器1905。包括存储器1907以用于保存指令形式的程序代码,并且还可以保存任何需要的参数。当执行时,程序代码使得处理系统1903执行以上描述的滤波。
相似地,图19B示出双耳化装置的实施例的简化框图,该装置接受旨在通过前扬声器重放的左和右信号以及旨在经由后扬声器重放的左后和右后信号的形式的四个通道的音频信息。双耳化器实现本发明的各方面的用于各输入的双耳滤波器对,包括用于左和右信号以及用于左后和右后信号的双耳滤波器对,从而在收听单声道混合的收听者通过愉快方式体验信号如同来自单声道源的同时,通过耳机收听的收听者体验到空间内容。使用处理系统1903实现双耳化器,例如包括DSP设备,其具有处理器1905。包括存储器1907,用于保存指令形式的程序代码1909,并且还可以保存任何需要的参数。当执行时,程序代码使得处理系统1903执行以上描述的滤波。
在一个实施例中,计算机可读介质被配置有程序逻辑,例如当被至少一个处理器执行时使得实施在此描述的方法的方法步骤的集合的指令的集合。
除非另外具体地声明,否则如从以下讨论清楚的,应理解,在整个说明书讨论中使用例如“处理”、“计算”、“推算”、“确定”等的术语指代操控并且/或者变换表示为物理(例如电子)量的数据为相似地表示为物理量的其它数据的计算机或计算系统或相似电子计算设备的动作和/或处理。
以相似方式,术语“处理器”可以指代处理例如来自寄存器和/或存储器的电子数据以将该电子数据变换为例如可以在寄存器和/或存储器中存储的其它电子数据的任何设备或设备的任何部分。“计算机”或“计算机器”或“计算平台”可以包括至少一个处理器。
注意,当描述包括若干元素(例如若干步骤)的方法时,不暗示这些元素的排序(例如步骤的排序),除非具体地声明。
在一个实施例中,接受一个或多个计算机可读介质上表现的计算机可执行(也称为机器可执行)程序逻辑的一个或多个处理器可执行在此描述的方法。该程序逻辑包括当由处理器中的一个或多个执行时执行在此描述的方法中的至少一个的指令的集合。包括能够执行指定待采取的动作的指令(顺序地或者另外)的集合的任何处理器。因此,一个示例是包括一个处理器或更多处理器的典型处理系统。每一处理器可以包括CPU、图形处理单元和可编程DSP单元中的一个或多个。处理系统也可以包括存储子系统,包含含有主RAM和/或静态RAM和/或ROM的存储器子系统。存储子系统可以还包括一个或多个其它存储设备。可以包括用于在组件之间通信的总线子系统。处理系统还可以是具有网络耦合的处理器的分布式处理系统。如果处理系统需要显示器,可以包括这样的显示器、例如液晶显示器(LCD)、有机发光显示器、等离子显示器、阴极射线管(CRT)显示器等等。如果需要手动数据输入,则处理系统还包括输入设备,例如字母数字输入单元(例如键盘)、指点控制设备(例如鼠标)等中的一个或多个。如果从上下文清楚并且除非另外明确声明,否则在此使用的术语存储设备、存储子系统等单元还包括例如盘驱动单元的存储设备。在一些配置中的处理系统可以包括声音输出设备以及网络接口设备。因此,存储子系统包括承载包括用于当由一个或多个处理器执行时使得执行在此描述的方法中的一个或多个的指令的集合的程序逻辑(例如软件)的计算机可读介质。所述程序逻辑可以驻留在硬盘中,或者也可以在处理系统对其执行期间完全或者至少部分地驻留在RAM内和/或处理器内。因此,存储器和处理器还包括编码的程序逻辑(例如以指令的形式)在其上的计算机可读介质。
此外,计算机可读介质可以形成或者被包括在计算机程序产品中。
在替换实施例中,一个或多个处理器操作为单机设备,或者可以例如连接(例如连网)到其它处理器,在网络的部署中,一个或多个处理器可以操作在服务器客户机网络环境中的服务器或客户机机器的容量中,或者在点对点或分布式网络环境中作为对等机器操作。一个或多个处理器可以形成个人计算机(PC)、平板PC、机顶盒(STB)、个人数字助理(PDA)、蜂窝电话、网络设施、网络路由器、交换机或桥接器、或能够执行指定该机器待采取的动作的指令(顺序地或者另外)的集合的任何机器。
注意,虽然一些示图仅示出承载包括指令的逻辑的单个处理器和单个存储器,但本领域技术人员应理解,包括以上描述的很多组件,但未将其明显地示出或者描述以为了不模糊本发明方面。例如,虽然仅示出单个机器,但术语“机器”也应被使用以包括单独地或者联合地执行指令的集合(或多个集合)以执行在此讨论的方法中的任何一个或多个的任何机器的集合。
因此,在此描述的方法中的每一个的一个实施例是被配置有指令的集合(例如用于在一个或多个处理器(例如作为信号处理装置的部分的一个或多个处理器)上执行的计算机程序)的计算机可读介质的形式。因此,本领域技术人员应理解,本发明实施例可以实施为方法、诸如专用装置的装置、例如数据处理系统的装置、或例如计算机程序产品的计算机可读介质。计算机可读介质承载包括当在一个或多个处理器上执行时使得执行方法步骤的指令的集合的逻辑。相应地,本发明的方面可以采用方法、完全硬件实施例、完全软件实施例或组合软件与硬件方面的实施例的形式。此外,本发明可以采用例如在计算机可读介质中的程序逻辑(例如计算机可读存储介质上的计算机程序)的形式或被配置有计算机可读程序代码的计算机可读介质(例如计算机程序产品)的形式。
虽然在示例实施例中示出计算机可读介质是单个介质,但术语“介质”应被用于包括存储一个或多个指令的集合的单个介质或多个介质(例如集中式或分布式数据库、和/或关联的缓存和服务器)。术语“计算机可读介质”也应采用以包括能够存储、编码或者另外被配置有用于由一个或多个处理器执行并且使得执行本发明的方法中的任何一个或多个的指令的集合的任何计算机可读介质。计算机可读介质可以采取很多形式,包括但不限于非易失性介质和易失性介质。例如,非易失性介质包括光盘、磁盘和磁光盘。易失性介质包括动态存储器(例如主存储器)。
应理解,通过执行存储器中存储的指令的处理系统(例如计算机系统)的适当的处理器(或多个处理器)在一个实施例中执行讨论的方法的步骤。还应理解,本发明实施例不限于任何特定实现方式或编程技术,并且可以使用用于实现在此描述的功能的任何适当的技术实现本发明。此外,实施例不限于任何特定编程语言或操作系统。
贯穿该说明书的对“一个实施例”或“某个实施例”的引用指的是结合实施例所描述的特定特征、结构或特性被包括在本发明的至少一个实施例中。因此,贯穿在该说明书在各个地方出现的短语“在一个实施例中”或“在某个实施例中”并非一定全部指的是同一实施例,但是可以如此。此外,在一个或多个实施例中,从该公开,本领域技术人员应理解,可以通过任何合适的方式组合特定特征结构或特性。
相似地,应理解,为了使得公开流畅并且帮助各个发明方面中的一个或多个方面的理解,在本发明示例实施例的以上描述中,在单个实施例、附图或描述中,本发明各个特征有时被集合在一起。然而,本发明的这种方法不应解释为反映所要求保护的发明需要比每一权利要求中明白地陈述的特征更多的特征的意图。此外,如所附权利要求反映的那样,本发明方面少于单个前述公开实施例的所有特征。因此,具体实施方式之后的权利要求书由此明白地结合到具体实施方式,其中,每一权利要求代表其自身作为本发明的分离的实施例。
此外,虽然在此描述的实施例包括其它实施例中包括的一些但不是其它特征,但本领域技术人员应理解,不同实施例的特征的组合将在本发明的范围内,并且形成不同的实施例。例如,在所附权利要求中,被保护的实施例中的任一个可被以任何组合使用。
此外,实施例中的一些在此被描述为计算机系统的处理器或执行功能的其它部件可以实现的方法或方法的元素的组合。因此,具有用于执行这样的方法或方法的元素的必要指令的处理器形成用于执行方法或方法的元素的装置。此外,装置实施例的在此描述的元件是用于执行由为了执行本发明的元件所执行的功能的装置的示例。
在此提供的描述中,阐述多个具体细节。然而,应理解,可以在没有这些具体细节的情况下实践本发明实施例。在其它实例中,没有详细示出公知方法、结构和技术,以不模糊本发明的理解。
如在此使用的那样,除非另外指定,否则用于描述公共对象的序数形容词“第一”、“第二”、“第三”等仅指示正被提及的类似对象的不同实例,并且并非意图暗指所描述的对象必须处于在时间上、空间上、在排序中、或以任何其它方式的给定的顺序。
该说明书中的现有技术的讨论绝不应考虑承诺所述现有技术是广泛公知的、公开公知的、或者形成本领域公知常识的一部分。
在以下权利要求和在此的描述中,术语包括、构成或其包括中的任何一个是开放术语,表示至少包括随后的元件/特征但不排除其它。因此,当在权利要求中使用时,术语包括不应解释为限制后面列出的装置或元件或步骤。例如,包括A和B的设备的表述的范围不应受限于仅由元件A和B组成的设备。在此使用的术语包括或其包括或其包含中的任何一个也是开放术语,也指的是至少包括术语之后的元件/特征但不排除其它的。因此,包括是与包含同意的,并且表示包含。
相似地,注意,当在权利要求中使用时,术语耦合不应理解为仅受限于直接连接。可以连同其派生词一起使用术语“耦合”和“连接”。应理解,这些术语不意图作为彼此的同义词。因此,设备A耦合到设备B的表述的范围不应受限于其中设备A的输出直接连接到设备B的输入的设备或系统。这说明,在A的输出与B的输入之间存在路径,其可以是包括其它设备或部件的路径。“耦合”可以表示两个或更多个元件直接物理或电接触,或者两个或更多个元件并非彼此直接接触而是仍然协作或者彼此交互。
因此,虽然已经描述被认为是本发明一些实施例的内容,但本领域技术人员应理解,在不脱离本发明精神的情况下,可以对其进行其它和进一步修改,并且其意图保护落入本发明范围内的所有这些改变和修改。例如,以上给出的任何公式仅表示可以被使用的过程。可以从框图添加或者删除功能,并且可以在功能块当中互换操作。对于本发明范围内描述的方法,可以添加或者删除步骤。

Claims (40)

1.一种用于双耳化一个或多个音频输入信号的集合的装置,所述装置包括:
实现一对或多对双耳滤波器(203-1,204-1,...,203-M,204-M)的双耳化器(101),对于音频信号输入中的每一个具有对应的一对双耳滤波器,双耳滤波器(203-1,204-1,...,203-M,204-M)中的每一对具有左耳输出和右耳输出,双耳滤波器中的每一对能够分别由左耳双耳滤波器和右耳双耳滤波器表示,并且双耳滤波器中的每一对还能够由与左耳和右耳双耳滤波器相关的差分滤波器(404)和累加滤波器(403)表示,各滤波器具有表征该滤波器的对应的脉冲响应,
其中,双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对被配置用于将其的对应的音频输入信号空间化,以结合从对应的虚拟扬声器位置(209-1,...,209-M)到收听者(107)的直达响应,并且结合收听室的早期回声和混响响应两者,以及
其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对:
累加滤波器(403)的时间-频率特性与差分滤波器(404)的时间-频率特性不同,其中累加滤波器混响时间在所有频率小于差分滤波器混响时间、左耳滤波器混响时间和右耳滤波器混响时间中的每一个;以及
与左耳滤波器混响时间以及右耳滤波器混响时间各自的在频率上的变化相比,累加滤波器混响时间跨越不同频率更大地变化,其中累加滤波器混响时间随着频率增大而减小,
从而通过双耳滤波器对(203-1,204-1,...,203-M,204-M)进行滤波的一个或多个音频输入信号生成输出信号,所述输出信号在通过耳机(105)播放时被感知为被空间化,并且所述输出信号因为在通过下混或者通过间隔相对近的扬声器播放而实现的单声道混合之后被单声道播放时听起来像是一个或多个音频输入的单声道混合而具有单声道重放相容性,其中对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,累加滤波器脉冲响应到其的可忽略水平的过渡在累加滤波器脉冲响应的初始时间间隔上以依赖于频率方式随着时间逐渐发生,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,累加滤波器的频率含量在过渡时间间隔上从初始全带宽朝向低频截止减小。
2.如权利要求1所述的装置,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,过渡时间间隔为使得累加滤波器脉冲响应从直到3ms的全带宽过渡到在40ms处小于100Hz。
3.如前述任一项权利要求所述的装置,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,在10kHz以上的高频率的差分滤波器混响时间小于40ms,在3kHz与4kHz之间的频率的差分滤波器混响时间小于100ms,并且在小于2kHz的频率,差分滤波器混响时间小于160ms。
4.如权利要求1或2所述的装置,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,在10kHz以上的高频率的差分滤波器混响时间小于20ms,在3kHz与4kHz之间的频率的差分滤波器混响时间小于60ms,并且在小于2kHz的频率,差分滤波器混响时间小于120ms。
5.如权利要求1或2所述的装置,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,在10kHz以上的高频率的差分滤波器混响时间小于10ms,在3kHz与4kHz之间的频率的差分滤波器混响时间小于40ms,并且在小于2kHz的频率,差分滤波器混响时间小于80ms。
6.如权利要求1或2所述的装置,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,差分滤波器混响时间小于800ms。
7.如权利要求1或2所述的装置,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,差分滤波器混响时间小于400ms。
8.如权利要求1或2所述的装置,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,差分滤波器混响时间小于200ms。
9.如权利要求1或2所述的装置,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,
累加滤波器混响时间随着频率增大而减小,
对于小于100Hz的所有频率的累加滤波器混响时间是至少40ms且至多160ms,
对于100Hz与1kHz之间的所有频率的累加滤波器混响时间是至少20ms且至多80ms,
对于1kHz与2kHz之间的所有频率的累加滤波器混响时间是至少10ms且至多20ms,以及
对于2kHz与20kHz之间的所有频率的累加滤波器混响时间是至少5ms且至多20ms。
10.如权利要求1或2所述的装置,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,
累加滤波器混响时间随着频率增大而减小,
对于小于100Hz的所有频率的累加滤波器混响时间是至少60ms且至多120ms,
对于100Hz与1kHz之间的所有频率的累加滤波器混响时间是至少30ms且至多60ms,
对于1kHz与2kHz之间的所有频率的累加滤波器混响时间是至少15ms且至多30ms,以及
对于2kHz与20kHz之间的所有频率的累加滤波器混响时间是至少7ms且至多15ms。
11.如权利要求1或2所述的装置,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,
累加滤波器混响时间随着频率增大而减小,
对于小于100Hz的所有频率的累加滤波器混响时间是至少70ms且至多90ms,
对于100Hz与1kHz之间的所有频率的累加滤波器混响时间是至少35ms且至多50ms,
对于1kHz与2kHz之间的所有频率的累加滤波器混响时间是至少18ms且至多25ms,以及
对于2kHz与20kHz之间的所有频率的累加滤波器混响时间是至少8ms且至多12ms。
12.如权利要求1或2所述的装置,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,双耳滤波器特性被从一对待匹配的双耳滤波器的特性确定。
13.如权利要求12所述的装置,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,作为时间t的函数的差分滤波器脉冲响应对于大于等于预定时间值的所有t值基本上与所述待匹配的双耳滤波器的差分滤波器成比例。
14.如权利要求13所述的装置,其中,预定时间值是40ms。
15.一种双耳化一个或多个音频输入信号的集合的方法,所述方法包括:
通过实现一对或多对双耳滤波器(203-1,204-1,...,203-M,204-M)的双耳化器(101)对音频输入信号的集合进行滤波,对于音频信号输入中的每一个具有对应的一对双耳滤波器,双耳滤波器(203-1,204-1,...,203-M,204-M)中的每一对具有左耳输出和右耳输出,双耳滤波器中的每一对能够分别由左耳双耳滤波器和右耳双耳滤波器表示,并且双耳滤波器中的每一对还能够由与左耳和右耳双耳滤波器有关的差分滤波器(404)和累加滤波器(403)表示,各滤波器具有表征该滤波器的对应的脉冲响应,
其中,双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对被配置用于空间化其的对应的音频输入信号,以结合从对应的虚拟扬声器位置(209-1,...,209-M)到收听者(107)的直达响应,并且结合收听室的早期回声和混响响应两者,以及
其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对:
累加滤波器(403)的时间-频率特性与差分滤波器(404)的时间-频率特性不同,其中累加滤波器混响时间在所有频率小于差分滤波器混响时间、左耳滤波器混响时间和右耳滤波器混响时间中的每一个;以及
与左耳滤波器混响时间和右耳滤波器混响时间各自在频率上的变化相比,累加滤波器混响时间跨越不同频率更大地变化,其中累加滤波器混响时间随着频率增大而减小,
从而输出在通过耳机(105)播放时被感知为被空间化,并且输出因为在通过下混或者通过间隔相对近的扬声器播放而实现的单声道混合之后被单声道播放时听起来像是一个或多个音频输入的单声道混合而具有单声道重放相容性,
其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,累加滤波器脉冲响应到其的可忽略水平的过渡在所述累加滤波器脉冲响应的初始时间间隔上以依赖于频率的方式随着时间逐渐发生,
其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,累加滤波器的频率含量在过渡时间间隔上从初始全带宽朝向低频截止减小。
16.如权利要求15所述的方法,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,过渡时间间隔为使得累加滤波器脉冲响应从直到3ms的全带宽过渡到在40ms处小于100Hz。
17.如权利要求15或16所述的方法,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,在10kHz以上的高频率的差分滤波器混响时间小于40ms,在3kHz与4kHz之间的频率的差分滤波器混响时间小于100ms,并且在小于2kHz的频率,差分滤波器混响时间小于160ms。
18.如权利要求15或16所述的方法,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,在10kHz以上的高频率的差分滤波器混响时间小于20ms,在3kHz与4kHz之间的频率的差分滤波器混响时间小于60ms,并且在小于2kHz的频率,差分滤波器混响时间小于120ms。
19.如权利要求15或16所述的方法,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,在10kHz以上的高频率的差分滤波器混响时间小于10ms,在3kHz与4kHz之间的频率的差分滤波器混响时间小于40ms,并且在小于2kHz的频率,差分滤波器混响时间小于80ms。
20.如权利要求15或16所述的方法,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,差分滤波器混响时间小于800ms。
21.如权利要求15或16所述的方法,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,差分滤波器混响时间小于400ms。
22.如权利要求15或16所述的方法,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,差分滤波器混响时间小于200ms。
23.如权利要求15或16所述的方法,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,
累加滤波器混响时间随着频率增大而减小,
对于小于100Hz的所有频率的累加滤波器混响时间是至少40ms且至多160ms,
对于100Hz与1kHz之间的所有频率的累加滤波器混响时间是至少20ms且至多80ms,
对于1kHz与2kHz之间的所有频率的累加滤波器混响时间是至少10ms且至多20ms,以及
对于2kHz与20kHz之间的所有频率的累加滤波器混响时间是至少5ms且至多20ms。
24.如权利要求15或16所述的方法,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,
累加滤波器混响时间随着频率增大而减小,
对于小于100Hz的所有频率的累加滤波器混响时间是至少60ms且至多120ms,
对于100Hz与1kHz之间的所有频率的累加滤波器混响时间是至少30ms且至多60ms,
对于1kHz与2kHz之间的所有频率的累加滤波器混响时间是至少15ms且至多30ms,以及
对于2kHz与20kHz之间的所有频率的累加滤波器混响时间是至少7ms且至多15ms。
25.如权利要求15或16所述的方法,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,
累加滤波器混响时间随着频率增大而减小,
对于小于100Hz的所有频率的累加滤波器混响时间是至少70ms且至多90ms,
对于100Hz与1kHz之间的所有频率的累加滤波器混响时间是至少35ms且至多50ms,
对于1kHz与2kHz之间的所有频率的累加滤波器混响时间是至少18ms且至多25ms,以及
对于2kHz与20kHz之间的所有频率的累加滤波器混响时间是至少8ms且至多12ms。
26.如权利要求15或16所述的方法,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,双耳滤波器特性被从一对待匹配的双耳滤波器的特性确定。
27.一种处理一对信号以生成经修正的双耳滤波器的方法,所述方法包括:
接受(703)表示被配置用于双耳化音频信号的相应的一对待匹配的双耳滤波器的脉冲响应的一对信号;
通过均由具有时间变化滤波器特性的修正滤波器表征的一对滤波器处理(707)该对接受的信号的累加滤波器和差分滤波器表示,所述处理形成表示相应的一对经修正的双耳滤波器的脉冲响应的一对经修正的信号的累加滤波器和差分滤波器表示,
从而,所述经修正的双耳滤波器被配置用于双耳化音频信号,并且还具有在单声道下混中的低感知混响以及对于耳机上双耳滤波器的最小影响的性质,
其中,经修正的双耳滤波器能够由经修正的累加滤波器和经修正的差分滤波器表征,并且其中所述时间变化滤波器被配置为使得:
经修正的双耳滤波器脉冲响应包括由对于收听在预定位置处的虚拟扬声器的收听者的头部相关传递函数定义的直达部分;
与经修正的差分滤波器的脉冲响应相比,经修正的累加滤波器的脉冲响应具有减小的水平和较短的混响时间,以及
存在从累加滤波器的脉冲响应的直达部分到累加滤波器的可忽略的响应部分的平滑过渡,其中平滑过渡为在时间上频率选择性的。
28.一种处理左耳信号和右耳信号以生成经修正的双耳滤波器的方法,所述方法包括:
接受(703)表示被配置用于双耳化音频信号的相应的左耳和右耳双耳滤波器的脉冲响应的左耳信号和右耳信号;
混洗(705)所述左耳信号和右耳信号,以形成与左耳信号和右耳信号之和成比例的累加信号以及与左耳信号和右耳信号之间的差成比例的差分信号;
通过具有时间变化滤波器特性的累加滤波器对累加信号进行滤波(707),所述滤波形成经滤波的累加信号;
通过由累加滤波器表征的差分滤波器处理(707)所述差分信号,所述处理形成经滤波的差分信号;
对经滤波的累加信号和经滤波的差分信号解混洗(709)以形成表示相应的左耳和右耳修正的双耳滤波器的脉冲响应的经修正的左耳信号和经修正的右耳信号,
其中,经修正的双耳滤波器被配置用于双耳化音频信号,均能够由对应的经修正的累加滤波器和对应的经修正的差分滤波器表示,并且还具有左耳输出和右耳输出,每对双耳滤波器能够分别由左耳双耳滤波器和右耳双耳滤波器表示,每一滤波器具有表征该滤波器的对应的脉冲响应,
其中,双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对被配置用于将其的对应的音频输入信号空间化以结合从对应的虚拟扬声器位置(209-1,...,209-M)到收听者(107)的直达响应,并且结合收听室的早期回声和混响响应两者,以及
其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对:
累加滤波器(403)的时间-频率特性与差分滤波器(404)的时间-频率特性不同,其中累加滤波器混响时间在所有频率小于差分滤波器混响时间、左耳滤波器混响时间和右耳滤波器混响时间中的每一个;以及
与左耳滤波器混响时间和右耳滤波器混响时间各自的在频率上的变化相比,累加滤波器混响时间跨越不同频率更大地变化,其中累加滤波器混响时间随着频率增大而减小,
从而通过双耳滤波器对(203-1,204-1,...,203-M,204-M)进行滤波的一个或多个音频输入信号生成输出信号,所述输出信号在通过耳机(105)播放时被感知为被空间化,并且所述输出信号因为在通过下混或者通过间隔相对近的扬声器播放而实现的单声道混合之后被单声道播放时听起来像是一个或多个音频输入的单声道混合而具有单声道重放相容性,
其中对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,累加滤波器脉冲响应到其的可忽略水平的过渡在累加滤波器脉冲响应的初始时间间隔上以依赖于频率方式随着时间逐渐发生,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,累加滤波器的频率含量在过渡时间间隔上从初始全带宽朝向低频截止减小。
29.如权利要求28所述的方法,其中,适当地提升经修正的累加信号,以补偿时间变化滤波导致的经修正的差分信号中的任何损失能量。
30.如权利要求27至29中的任一项所述的方法,
其中,修正时间变化滤波器能够由对表示待匹配的双耳滤波器的累加滤波器的信号操作的累加修正滤波器以及对表示待匹配的双耳滤波器的差分滤波器的信号操作的差分修正滤波器表示,
其中,所述累加修正滤波器基本上对于40ms之后的时间衰减表示待匹配的双耳滤波器的累加滤波器的信号,并且其中差分修正滤波器能够由累加修正滤波器的时间变化特性定义。
31.如权利要求30所述的方法,
其中,累加修正滤波器能够由在指示为t的时间处通过f(t,τ)对于在时间t=τ的脉冲的时间变化脉冲响应表征,并且其中,累加修正滤波器也能够由包括时间变化带宽的时间变化频率响应表征,其中,能够从f(t,τ)确定差分修正滤波器的脉冲响应,并且其中,所述时间变化带宽在时间中单调地减小。
32.如权利要求31所述的方法,其中,对于大于40ms的时间,时间变化带宽平滑地减小到小于100Hz。
33.如权利要求31至32中的任一项所述的方法,
其中,差分修正滤波器的脉冲响应与 2 h D 0 ( t ) - ( 2 - 1 ) &Integral; h D 0 ( t - &tau; ) f ( t , &tau; ) , d&tau; 成比例,其中hD0(t)指示通过混洗得到的差分信号。
34.一种处理一对信号以生成经修正的双耳滤波器的装置,所述装置包括:
用于接受表示被配置用于双耳化音频信号的相应的一对待匹配的双耳滤波器的脉冲响应的一对信号的装置;
均由具有时间变化滤波器特性的修正滤波器表征的一对滤波器,被配置为处理该对接受的信号的累加滤波器和差分滤波器表示,所述处理形成表示相应的一对经修正的双耳滤波器的脉冲响应的一对经修正的信号的累加滤波器和差分滤波器表示,
从而,所述经修正的双耳滤波器被配置用于双耳化音频信号,并且还具有在单声道下混中的低感知混响以及对于耳机上双耳滤波器的最小影响的性质,
其中,经修正的双耳滤波器能够由经修正的累加滤波器和经修正的差分滤波器表征,并且其中所述时间变化滤波器被配置为使得:
经修正的双耳滤波器脉冲响应包括由对于收听在预定位置处的虚拟扬声器的收听者的头部相关传递函数定义的直达部分;
与经修正的差分滤波器相比,经修正的累加滤波器具有减小的水平和较短的混响时间,以及
存在从累加滤波器的脉冲响应的直达部分到累加滤波器的可忽略的响应部分的平滑过渡,其中平滑过渡为在时间上频率选择性的。
35.一种处理左耳信号和右耳信号以生成经修正的双耳滤波器的装置,所述装置包括:
用于接受表示被配置用于双耳化音频信号的相应的左耳和右耳双耳滤波器的脉冲响应的左耳信号和右耳信号的装置;
用于混洗所述左耳信号和右耳信号以形成与左耳信号和右耳信号之和成比例的累加信号以及与左耳信号和右耳信号之间的差成比例的差分信号的装置;
具有时间变化滤波器特性的累加滤波器,被配置为对累加信号进行滤波,所述滤波形成经滤波的累加信号;
由累加滤波器表征的差分滤波器,被配置为处理所述差分信号,所述处理形成经滤波的差分信号;
用于对经滤波的累加信号和经滤波的差分信号解混洗以形成表示相应的左耳和右耳修正的双耳滤波器的脉冲响应的经修正的左耳信号和经修正的右耳信号的装置,
其中,经修正的双耳滤波器被配置用于双耳化音频信号,均能够由对应的经修正的累加滤波器和对应的经修正的差分滤波器表示,并且还具有左耳输出和右耳输出,每对双耳滤波器能够分别由左耳双耳滤波器和右耳双耳滤波器表示,每一滤波器具有表征该滤波器的对应的脉冲响应,
其中,双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对被配置用于将其的对应的音频输入信号空间化以结合从对应的虚拟扬声器位置(209-1,...,209-M)到收听者(107)的直达响应,并且结合收听室的早期回声和混响响应两者,以及
其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对:
累加滤波器(403)的时间-频率特性与差分滤波器(404)的时间-频率特性不同,其中累加滤波器混响时间在所有频率小于差分滤波器混响时间、左耳滤波器混响时间和右耳滤波器混响时间中的每一个;以及
与左耳滤波器混响时间和右耳滤波器混响时间各自的在频率上的变化相比,累加滤波器混响时间跨越不同频率更大地变化,其中累加滤波器混响时间随着频率增大而减小,
从而通过双耳滤波器对(203-1,204-1,...,203-M,204-M)进行滤波的一个或多个音频输入信号生成输出信号,所述输出信号在通过耳机(105)播放时被感知为被空间化,并且所述输出信号因为在通过下混或者通过间隔相对近的扬声器播放而实现的单声道混合之后被单声道播放时听起来像是一个或多个音频输入的单声道混合而具有单声道重放相容性,其中对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,累加滤波器脉冲响应到其的可忽略水平的过渡在累加滤波器脉冲响应的初始时间间隔上以依赖于频率方式随着时间逐渐发生,其中,对于双耳滤波器(203-1,204-1,...,203-M,204-M)中的至少一对,累加滤波器的频率含量在过渡时间间隔上从初始全带宽朝向低频截止减小。
36.如权利要求35所述的装置,其中,适当地提升经修正的累加信号,以补偿时间变化滤波导致的经修正的差分信号中的任何损失能量。
37.如权利要求34至36中的任一项所述的装置,
其中,修正时间变化滤波器能够由对表示待匹配的双耳滤波器的累加滤波器的信号操作的累加修正滤波器以及对表示待匹配的双耳滤波器的差分滤波器的信号操作的差分修正滤波器表示,
其中,所述累加修正滤波器基本上对于40ms之后的时间衰减表示待匹配的双耳滤波器的累加滤波器的信号,并且其中差分修正滤波器能够由累加修正滤波器的时间变化特性定义。
38.如权利要求37所述的装置,
其中,累加修正滤波器能够由在指示为t的时间处通过f(t,τ)对于在时间t=τ的脉冲的时间变化脉冲响应表征,并且其中,累加修正滤波器也能够由包括时间变化带宽的时间变化频率响应表征,其中,能够从f(t,τ)确定差分修正滤波器的脉冲响应,并且其中,所述时间变化带宽在时间中单调地减小。
39.如权利要求38所述的装置,其中,对于大于40ms的时间,时间变化带宽平滑地减小到小于100Hz。
40.如权利要求38至39中的任一项所述的装置,
其中,差分修正滤波器的脉冲响应与 2 h D 0 ( t ) - ( 2 - 1 ) &Integral; h D 0 ( t - &tau; ) f ( t , &tau; ) , d&tau; 成比例,其中hD0(t)指示通过混洗得到的差分信号。
CN2009801373213A 2008-09-25 2009-09-15 用于单声道相容性和外放扬声器相容性的双耳滤波器 Active CN102165798B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US9996708P 2008-09-25 2008-09-25
US61/099,967 2008-09-25
PCT/US2009/056956 WO2010036536A1 (en) 2008-09-25 2009-09-15 Binaural filters for monophonic compatibility and loudspeaker compatibility

Publications (2)

Publication Number Publication Date
CN102165798A CN102165798A (zh) 2011-08-24
CN102165798B true CN102165798B (zh) 2013-07-17

Family

ID=41346692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801373213A Active CN102165798B (zh) 2008-09-25 2009-09-15 用于单声道相容性和外放扬声器相容性的双耳滤波器

Country Status (8)

Country Link
US (1) US8515104B2 (zh)
EP (4) EP2329661B1 (zh)
JP (1) JP5298199B2 (zh)
KR (1) KR101261446B1 (zh)
CN (1) CN102165798B (zh)
HK (1) HK1256734A1 (zh)
TW (1) TWI475896B (zh)
WO (1) WO2010036536A1 (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9031268B2 (en) * 2011-05-09 2015-05-12 Dts, Inc. Room characterization and correction for multi-channel audio
FR2976759B1 (fr) * 2011-06-16 2013-08-09 Jean Luc Haurais Procede de traitement d'un signal audio pour une restitution amelioree.
EP2642407A1 (en) * 2012-03-22 2013-09-25 Harman Becker Automotive Systems GmbH Method for retrieving and a system for reproducing an audio signal
KR101651419B1 (ko) * 2012-03-23 2016-08-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 머리 전달 함수들의 선형 믹싱에 의한 머리 전달 함수 생성을 위한 방법 및 시스템
JP6160072B2 (ja) * 2012-12-06 2017-07-12 富士通株式会社 オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
CN108810793B (zh) 2013-04-19 2020-12-15 韩国电子通信研究院 多信道音频信号处理装置及方法
CN105075294B (zh) * 2013-04-30 2018-03-09 华为技术有限公司 音频信号处理装置
DE102013217367A1 (de) * 2013-05-31 2014-12-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur raumselektiven audiowiedergabe
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
CN105706468B (zh) 2013-09-17 2017-08-11 韦勒斯标准与技术协会公司 用于音频信号处理的方法和设备
US9426300B2 (en) 2013-09-27 2016-08-23 Dolby Laboratories Licensing Corporation Matching reverberation in teleconferencing environments
WO2015048551A2 (en) * 2013-09-27 2015-04-02 Sony Computer Entertainment Inc. Method of improving externalization of virtual surround sound
FR3012247A1 (fr) * 2013-10-18 2015-04-24 Orange Spatialisation sonore avec effet de salle, optimisee en complexite
KR101804744B1 (ko) * 2013-10-22 2017-12-06 연세대학교 산학협력단 오디오 신호 처리 방법 및 장치
EP4246513A3 (en) 2013-12-23 2023-12-13 Wilus Institute of Standards and Technology Inc. Audio signal processing method and parameterization device for same
US10382880B2 (en) 2014-01-03 2019-08-13 Dolby Laboratories Licensing Corporation Methods and systems for designing and applying numerically optimized binaural room impulse responses
CN104768121A (zh) * 2014-01-03 2015-07-08 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
CN107750042B (zh) * 2014-01-03 2019-12-13 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
CN106105269B (zh) 2014-03-19 2018-06-19 韦勒斯标准与技术协会公司 音频信号处理方法和设备
CN105981412B (zh) * 2014-03-21 2019-05-24 华为技术有限公司 一种估计总体混合时间的装置和方法
WO2015152665A1 (ko) 2014-04-02 2015-10-08 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US10015616B2 (en) 2014-06-06 2018-07-03 University Of Maryland, College Park Sparse decomposition of head related impulse responses with applications to spatial audio rendering
US9560464B2 (en) * 2014-11-25 2017-01-31 The Trustees Of Princeton University System and method for producing head-externalized 3D audio through headphones
EP4002888A1 (en) 2015-02-12 2022-05-25 Dolby Laboratories Licensing Corporation Headphone virtualization
EP3446494A4 (en) * 2016-04-20 2019-12-25 Genelec OY ACTIVE MONITORING HELMET AND ITS BINAURAL PROCESS
CN107358962B (zh) * 2017-06-08 2018-09-04 腾讯科技(深圳)有限公司 音频处理方法及音频处理装置
FR3075443A1 (fr) * 2017-12-19 2019-06-21 Orange Traitement d'un signal monophonique dans un decodeur audio 3d restituant un contenu binaural
CN108156561B (zh) * 2017-12-26 2020-08-04 广州酷狗计算机科技有限公司 音频信号的处理方法、装置及终端
DE112018006970T5 (de) 2018-01-29 2020-10-08 Sony Corporation Akustikverarbeitungsvorrichtung, akustikverarbeitungsverfahren und programm
JP7402185B2 (ja) 2018-06-12 2023-12-20 マジック リープ, インコーポレイテッド 低周波数チャネル間コヒーレンス制御
WO2020216459A1 (en) * 2019-04-23 2020-10-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating an output downmix representation
US11533560B2 (en) 2019-11-15 2022-12-20 Boomcloud 360 Inc. Dynamic rendering device metadata-informed audio enhancement system
EP3840405A1 (de) * 2019-12-16 2021-06-23 M.U. Movie United GmbH Verfahren und system zur übermittlung und wiedergabe akustischer informationen
CN113613143B (zh) * 2021-07-08 2023-06-13 北京小唱科技有限公司 适用于移动终端的音频处理方法、装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6009178A (en) * 1996-09-16 1999-12-28 Aureal Semiconductor, Inc. Method and apparatus for crosstalk cancellation
CN1662101A (zh) * 2004-02-26 2005-08-31 雅马哈株式会社 混合器装置和声音信号处理方法
CN1956606A (zh) * 2005-10-25 2007-05-02 三星电子株式会社 产生空间立体声的方法和装置
CN101040565A (zh) * 2004-10-14 2007-09-19 杜比实验室特许公司 用于移动立体声内容的改善的头相关传递函数
CN101263739A (zh) * 2005-09-13 2008-09-10 Srs实验室有限公司 用于音频处理的系统和方法

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4955057A (en) * 1987-03-04 1990-09-04 Dynavector, Inc. Reverb generator
JPH06121394A (ja) 1992-10-02 1994-04-28 Toshiba Corp 音声出力装置
JPH06165298A (ja) * 1992-11-24 1994-06-10 Nissan Motor Co Ltd 音響再生装置
JP2897586B2 (ja) * 1993-03-05 1999-05-31 ヤマハ株式会社 音場制御装置
US5371799A (en) * 1993-06-01 1994-12-06 Qsound Labs, Inc. Stereo headphone sound source localization system
EP1152343B1 (en) 1993-07-13 2003-05-02 Hewlett-Packard Company, A Delaware Corporation Apparatus and method for communication between a computer and a peripheral device
US5761314A (en) * 1994-01-27 1998-06-02 Sony Corporation Audio reproducing apparatus and headphone
US5436975A (en) * 1994-02-02 1995-07-25 Qsound Ltd. Apparatus for cross fading out of the head sound locations
US5596644A (en) * 1994-10-27 1997-01-21 Aureal Semiconductor Inc. Method and apparatus for efficient presentation of high-quality three-dimensional audio
US5943427A (en) * 1995-04-21 1999-08-24 Creative Technology Ltd. Method and apparatus for three dimensional audio spatialization
GB9606814D0 (en) * 1996-03-30 1996-06-05 Central Research Lab Ltd Apparatus for processing stereophonic signals
US6421446B1 (en) * 1996-09-25 2002-07-16 Qsound Labs, Inc. Apparatus for creating 3D audio imaging over headphones using binaural synthesis including elevation
US5809149A (en) * 1996-09-25 1998-09-15 Qsound Labs, Inc. Apparatus for creating 3D audio imaging over headphones using binaural synthesis
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
JPH1188994A (ja) 1997-09-04 1999-03-30 Matsushita Electric Ind Co Ltd 音像定位装置及び音像制御方法
US6198826B1 (en) * 1997-05-19 2001-03-06 Qsound Labs, Inc. Qsound surround synthesis from stereo
US6067361A (en) * 1997-07-16 2000-05-23 Sony Corporation Method and apparatus for two channels of sound having directional cues
WO1999014983A1 (en) 1997-09-16 1999-03-25 Lake Dsp Pty. Limited Utilisation of filtering effects in stereo headphone devices to enhance spatialization of source around a listener
CA2325482C (en) 1998-03-25 2009-12-15 Lake Technology Limited Audio signal processing method and apparatus
US6990205B1 (en) * 1998-05-20 2006-01-24 Agere Systems, Inc. Apparatus and method for producing virtual acoustic sound
US6590983B1 (en) * 1998-10-13 2003-07-08 Srs Labs, Inc. Apparatus and method for synthesizing pseudo-stereophonic outputs from a monophonic input
JP4499206B2 (ja) * 1998-10-30 2010-07-07 ソニー株式会社 オーディオ処理装置及びオーディオ再生方法
TW437256B (en) * 1999-03-12 2001-05-28 Ind Tech Res Inst Apparatus and method for virtual sound enhancement
DE60125553T2 (de) * 2000-05-10 2007-10-04 The Board Of Trustees For The University Of Illinois, Urbana Verfahren zur interferenzunterdrückung
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
JP4130779B2 (ja) * 2003-03-13 2008-08-06 パイオニア株式会社 音場制御システム及び音場制御方法
US20040213415A1 (en) * 2003-04-28 2004-10-28 Ratnam Rama Determining reverberation time
US7522733B2 (en) 2003-12-12 2009-04-21 Srs Labs, Inc. Systems and methods of spatial image enhancement of a sound source
US20050147261A1 (en) * 2003-12-30 2005-07-07 Chiang Yeh Head relational transfer function virtualizer
CN104112450A (zh) 2004-06-08 2014-10-22 皇家飞利浦电子股份有限公司 音频编码器,音频解码器,编码与解码音频信号的方法及音频设备
TWI249361B (en) * 2004-09-21 2006-02-11 Formosa Ind Computing Inc Cross-talk Cancellation System of multiple sound channels
EP1803115A2 (en) * 2004-10-15 2007-07-04 Koninklijke Philips Electronics N.V. A system and a method of processing audio data to generate reverberation
NO328256B1 (no) 2004-12-29 2010-01-18 Tandberg Telecom As Audiosystem
US8090586B2 (en) 2005-05-26 2012-01-03 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
US8331603B2 (en) * 2005-06-03 2012-12-11 Nokia Corporation Headset
US7761303B2 (en) 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
KR100739776B1 (ko) * 2005-09-22 2007-07-13 삼성전자주식회사 입체 음향 생성 방법 및 장치
KR100708196B1 (ko) * 2005-11-30 2007-04-17 삼성전자주식회사 모노 스피커를 이용한 확장된 사운드 재생 장치 및 방법
CN101401455A (zh) * 2006-03-15 2009-04-01 杜比实验室特许公司 使用子带滤波器的立体声呈现技术
US9100765B2 (en) 2006-05-05 2015-08-04 Creative Technology Ltd Audio enhancement module for portable media player
US8619998B2 (en) * 2006-08-07 2013-12-31 Creative Technology Ltd Spatial audio enhancement processing method and apparatus
TW200743871A (en) * 2006-05-29 2007-12-01 Kenmos Technology Co Ltd Combination of a light source for a direct-type backlight module
US7876903B2 (en) * 2006-07-07 2011-01-25 Harris Corporation Method and apparatus for creating a multi-dimensional communication space for use in a binaural audio system
US8391504B1 (en) * 2006-12-29 2013-03-05 Universal Audio Method and system for artificial reverberation employing dispersive delays
EP1962559A1 (en) * 2007-02-21 2008-08-27 Harman Becker Automotive Systems GmbH Objective quantification of auditory source width of a loudspeakers-room system
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6009178A (en) * 1996-09-16 1999-12-28 Aureal Semiconductor, Inc. Method and apparatus for crosstalk cancellation
CN1662101A (zh) * 2004-02-26 2005-08-31 雅马哈株式会社 混合器装置和声音信号处理方法
CN101040565A (zh) * 2004-10-14 2007-09-19 杜比实验室特许公司 用于移动立体声内容的改善的头相关传递函数
CN101263739A (zh) * 2005-09-13 2008-09-10 Srs实验室有限公司 用于音频处理的系统和方法
CN1956606A (zh) * 2005-10-25 2007-05-02 三星电子株式会社 产生空间立体声的方法和装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Christof Faller,et al.Binaural Cue Coding—Part II:Schemes and Applications.《IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING》.2003,第11卷(第6期), *
F. P. FREELAND,et al.Interpositional Transfer Function for 3D-sound Generation.《JOURNAL OF THE AUDIO ENGINEERING SOCIETY》.2004,第52卷(第9期), *
Generalized Fractional-Octave Smoothing of Audio and Acoustic Responses;Hatziantoniou, et al;《JOURNAL OF THE AUDIO ENGINEERING SOCIETY》;20000401;第48卷(第4期);第259-279页 *
Hatziantoniou, et al.Generalized Fractional-Octave Smoothing of Audio and Acoustic Responses.《JOURNAL OF THE AUDIO ENGINEERING SOCIETY》.2000,第48卷(第4期),
JP特开平11-088994A 1999.03.30

Also Published As

Publication number Publication date
EP4274263A3 (en) 2024-01-24
JP5298199B2 (ja) 2013-09-25
JP2012503943A (ja) 2012-02-09
WO2010036536A1 (en) 2010-04-01
EP3340660A1 (en) 2018-06-27
US20110170721A1 (en) 2011-07-14
KR20110074566A (ko) 2011-06-30
CN102165798A (zh) 2011-08-24
EP2329661B1 (en) 2018-03-21
HK1256734A1 (zh) 2019-10-04
US8515104B2 (en) 2013-08-20
TW201031234A (en) 2010-08-16
EP4274263A2 (en) 2023-11-08
EP3739908A1 (en) 2020-11-18
EP3340660B1 (en) 2020-03-04
EP2329661A1 (en) 2011-06-08
EP3739908B1 (en) 2023-07-12
TWI475896B (zh) 2015-03-01
KR101261446B1 (ko) 2013-05-10

Similar Documents

Publication Publication Date Title
CN102165798B (zh) 用于单声道相容性和外放扬声器相容性的双耳滤波器
US11576004B2 (en) Methods and systems for designing and applying numerically optimized binaural room impulse responses
EP2174519B1 (en) Method and apparatus for generating a stereo signal with enhanced perceptual quality
KR101358700B1 (ko) 오디오 인코딩 및 디코딩
CN101044794B (zh) 用于双声道提示码编码方案和类似方案的散射声音整形的方法和设备
CN103561378B (zh) 双耳信号的信号生成
TWI322630B (en) Device and method for generating an encoded stereo signal of an audio piece or audio datastream,and a computer program for generation an encoded stereo signal
JP5524237B2 (ja) 空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置
US20120321105A1 (en) Using Multichannel Decorrelation for Improved Multichannel Upmixing
CN101366321A (zh) 双声道音频信号的解码
CN110326310A (zh) 串扰消除的动态均衡
CN101112120A (zh) 处理多声道音频输入信号以从其中产生至少两个声道输出信号的装置和方法、以及包括执行该方法的可执行代码的计算机可读介质
CN102334348B (zh) 转换器及转换音频信号的方法
Vilkamo Spatial sound reproduction with frequency band processing of b-format audio signals
Vilkamo Tilaäänen toistaminen B-formaattiäänisignaaleista taajuuskaistaprosessoinnin avulla
MX2008008829A (en) Decoding of binaural audio signals

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant