CN105308988B - 配置成转换音频输入通道用于头戴受话器收听的音频解码器 - Google Patents

配置成转换音频输入通道用于头戴受话器收听的音频解码器 Download PDF

Info

Publication number
CN105308988B
CN105308988B CN201480024914.XA CN201480024914A CN105308988B CN 105308988 B CN105308988 B CN 105308988B CN 201480024914 A CN201480024914 A CN 201480024914A CN 105308988 B CN105308988 B CN 105308988B
Authority
CN
China
Prior art keywords
cross
path
feed signals
audio decoder
direct signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480024914.XA
Other languages
English (en)
Other versions
CN105308988A (zh
Inventor
L-J.布雷恩马克
V.根纳斯森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dirac Research AB
Original Assignee
Dirac Research AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dirac Research AB filed Critical Dirac Research AB
Publication of CN105308988A publication Critical patent/CN105308988A/zh
Application granted granted Critical
Publication of CN105308988B publication Critical patent/CN105308988B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

所提出的技术提供一种音频解码器(100),其配置成接收表示至少两个音频输入通道的输入信号。音频解码器配置成为输入信号提供直接信号路径和交叉馈送路径(10)。音频解码器配置成在直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器(20),用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽。音频解码器还配置成在直接信号路径和交叉馈送信号路径中应用相移滤波器(30),用于引入直接信号路径与交叉馈送信号路径之间表示预计听众的耳朵之间发生的相位差的相位差。音频解码器还配置成对直接和交叉馈送信号路径求和(40),以提供输出信号。

Description

配置成转换音频输入通道用于头戴受话器收听的音频解码器
技术领域
所提出的技术一般涉及声音或音频再现,以及更具体来说,涉及用于解码的方法以及特别是供与耳机一起使用的对应音频解码器、包括这种音频解码器的声音再现系统和用于解码的计算机程序。
背景技术
通常产生和混合音乐用于扬声器再现。然而,当混合音乐用于扬声器再现时,所得到的收听体验在通过耳机收听时变成不是最佳的。
音乐产生和音乐再现的过程能够合起来说成是由声音编码和声音解码部分所组成。编码部分需要在所指定格式、例如CD格式的音乐素材的音乐产生和存储。解码部分是声音再现部分,其需要从存储格式来读取音乐信号到信号处理(其实现向听众的耳朵呈现音乐)的整个例程。解码部分通常需要通过扬声器或耳机收听的声音再现。
立体声音乐信号具有在其中所编码的信息,其在通过试听室中的扬声器回放时,导致向听众呈现的心理声学线索(其给予对声音的某种空间印象)。通过空间印象表示声音的方面,其必须关于例如声音图像中的各仪器的位置和大小以及哪一种声学空间在感知上与各仪器关联。
当耳机用于再现系统中时,这些空间心理声学线索变得强失真或者完全缺失。
用于当再现立体声信号时使所感知声场在耳机中更自然的常用解决方案是使用交叉馈送(cross-feed)网络来向右耳馈送左信号的一些以及向左耳馈送右信号的一些。例如参见参考文献[1]、[2]和[3]。
图1是图示交叉网络的示例的示意框图。如图1所描绘的交叉馈送滤波器通常设计成给予如在听众前面的标准立体声扬声器装备将会给予的类似的头部遮蔽(head-shadowing)和耳间时间差(ITD)。目标是要控制声基宽(sound stage width),使得它变得更自然。
在一些实现中,仅模拟频率相关头部遮蔽,而ITD保持为零。这个的副作用是声基失去环境感,并且变得过窄。如果将时间延迟插入交叉馈送信号路径HRL和HLR中,则能够正确模拟声基比例,但是另一个问题发生—在左与右输入通道之间相互关联的中央声像调节声音(center panned sound)在直接路径和交叉馈送路径声音的相加中经历强梳状滤波效应。这个梳状滤波效应对声音谱着色。
发明内容
所提出的技术克服现有技术布置的这些及其他缺点。
一个目的是提供解码方法和对应解码器,其又称作音频或声音解码器或空间解码器或者双耳声解码器。
又一个目的是提供一种包括音频解码器的声音再现系统。
还有另一个目的是提供一种计算机程序,其用于在由处理器运行时对表示至少两个音频输入通道的输入信号进行解码。
另一个目的是提供一种包括这种计算机程序的载体。
这些及其他目的通过所提出技术的实施例得到满足。
在第一方面,所提出的技术提供一种音频解码器,其配置成接收表示至少两个音频输入通道的输入信号。音频解码器配置成为输入信号提供直接信号路径和交叉馈送路径。音频解码器配置成在直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器,用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽。音频解码器还配置成在直接信号路径和交叉馈送信号路径中应用相移滤波器,用于引入直接信号路径与交叉馈送信号路径之间表示预计听众的耳朵之间发生的相位差的相位差。音频解码器还配置成对直接和交叉馈送信号路径求和,以提供输出信号。
在第二方面,所提出的技术提供一种对表示至少两个音频输入通道的输入信号进行解码的方法,其中为输入信号提供直接信号路径和交叉馈送信号路径。该方法包括下列步骤:在直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器,用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽。该方法还包括下列步骤:在直接信号路径和交叉馈送信号路径中应用相移滤波器,用于引入在一方面的直接信号路径与另一方面的交叉馈送路径之间的相位差。在直接信号路径与交叉馈送信号路径之间的相位差表示在输入通道的任一个上输入信号时的预计听众的耳朵之间发生的相位差。该方法还包括对直接和交叉馈送信号路径求和以提供输出信号的步骤。
在第三方面,所提出的技术提供一种包括按照第一方面的音频解码器的声音再现系统。
在第四方面,所提出的技术提供一种计算机程序,其在由处理器运行时对表示至少两个音频输入通道的输入信号进行解码。计算机程序包括指令,其在由处理器运行时使该处理器:
- 提供用于输入信号的直接信号路径和交叉馈送信号路径的计算机表示;
- 在直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器,用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽;
- 在直接信号路径和交叉馈送信号路径中应用相移滤波器,用于引入直接信号路径与交叉馈送信号路径之间表示预计听众的耳朵之间发生的相位差的相位差;以及
- 对直接和交叉馈送信号路径求和,以提供输出信号。
在第五方面,所提出的技术提供一种包括计算机程序的载体。
在第六方面,所提出的技术提供一种音频解码器,其配置成接收表示至少两个音频输入通道的输入信号。音频解码器包括表示模块,用于提供用于输入信号的直接信号路径和交叉馈送信号路径的计算机表示。音频解码器也包括第一滤波模块,用于在直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器,用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽。音频解码器包括第二滤波模块,用于在直接信号路径和交叉馈送信号路径中应用相移滤波器,用于引入直接信号路径与交叉馈送信号路径之间表示预计听众的耳朵之间发生的相位差的相位差。音频解码器还包括求和模块,用于对直接和交叉馈送信号路径求和,以提供输出信号。
也提供包括如本文所限定的音频解码器的网络客户端以及包括如本文所限定的音频解码器的网络服务器。
对于采用耳机的特定应用,所提出的技术提供一种对立体声信号(或者一般来说是具有一个以上通道、即L个通道的声音信号,其中L>1)中存在的空间线索进行准确地解码的方法,用于实现耳机收听并且在音乐信号被发送给耳机之前加入缺失空间线索。
具体来说,所提出的技术针对正确地再现/模拟所感知声场比例,而没有引入梳状滤波效应。
在阅读详细描述时,将会理解其他优点。
附图说明
通过参照与附图一起进行的描述,可最好地理解所提出技术连同所提出技术的其他目的和优点,附图包括:
图1是图示交叉馈送网络的示例的示意框图。
图2A是图示按照实施例、对表示至少两个音频输入通道的输入信号进行解码的方法的示例的示意流程图。
图2B是图示按照另一个实施例、对表示至少两个音频输入通道的输入信号进行解码的方法的示例的示意流程图。
图3是图示具有对听众以不同角度对称放置的两个扬声器的扬声器装备的示例的示意图。
图4A是图示按照实施例的音频解码器的示例的示意框图。
图4B是图示按照另一个实施例的音频解码器的示例的示意框图。
图5是图示按照一般化实施例的音频解码器的示例的示意框图。
图6是图示双耳声解码器通常将会如何用于回放链中的示例的示意框图。
图7是图示双耳声解码器的具体示例的概述的示意框图。
图8是图示头部阴影(shadow)块的示例的示意框图。
图9是图示相位均衡器块的示例的示意框图。
图10是图示按照另一个实施例、基于处理器-存储器实现的音频解码器的示例的示意框图。
图11是图示按照还有另一个实施例、基于功能模块的音频解码器的示例的示意框图。
具体实施方式
贯穿附图,相同的参考数字用于类似或对应的元件。
图2A是图示按照实施例、对表示至少两个音频输入通道的输入信号进行解码的方法的示例的示意流程图。为输入信号提供直接信号路径和交叉馈送信号路径。
该方法基本上包括下列步骤:
• 在步骤S1中,在直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器,用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽;
• 在步骤S2中,在直接信号路径和交叉馈送信号路径中应用相移滤波器,用于引入直接信号路径与交叉馈送信号路径之间的相位差,所述相位差表示在输入通道的任一个上输入信号时预计听众的耳朵之间发生的相位差;以及
• 在步骤S3中,对直接和交叉馈送信号路径求和,以提供输出信号。
作为示例,执行在直接信号路径和交叉馈送信号路径中应用相移滤波器的步骤S2,用于引入频率相关相位差,其模仿预计听众的耳朵之间由于在耳朵处来自对预计听众的头部以不同角度所定位的扬声器的声音不同到达时间(所谓的ITD)而发生的相位差。
应当理解,步骤S1和S2的顺序在需要时可互换,只要步骤设计为时间不变的。
也能够参照图3的示意图,其图示具有对听众以不同角度对称放置的两个扬声器的扬声器装备的示例。
优选地,引入频率相关相位差用于低于阈值频率的频率。作为示例,阈值频率为大约1 kHz。
图2B是示出按照另一个实施例、对表示至少两个音频输入通道的输入信号进行解码的方法的示例的示意流程图。
在这个示例中,该方法可选地还包括在求和步骤S3之前在直接信号路径和交叉馈送信号路径中应用解相关滤波器的步骤S2',用于高于阈值频率的情况下引入直接信号路径与交叉馈送信号路径之间的相位差或者将其调整为大约90度。作为示例,阈值频率大约为1 kHz。
这考虑求和中的信号的解相关,其中对直接信号路径和交叉馈送信号路径求和,以产生一个输出信号。
应当理解,步骤S1、S2和S2'的顺序在需要时可互换,只要步骤设计为时间不变的。
作为示例,头部遮蔽滤波器可基于其中去除ITD的头部相关传递函数HRTF响应。
优选地,该方法在两个以上输入通道的情况下应用于通道对。
也提供一种对应音频解码器,其配置成接收表示至少两个音频输入通道的输入信号。
• 音频解码器配置成为输入信号提供直接信号路径和交叉馈送路径。
• 音频解码器配置成在直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器,用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽。
• 音频解码器也配置成在直接信号路径和交叉馈送信号路径中应用相移滤波器,用于引入直接信号路径与交叉馈送信号路径之间表示预计听众的耳朵之间发生的相位差的相位差。
• 音频解码器还配置成对直接和交叉馈送信号路径求和,以提供输出信号。
图4A是图示按照实施例的音频解码器的示例的示意框图。音频解码器100基本上包括交叉馈送网络10、头部阴影滤波器20、相移滤波器30和求和块40。
应当理解,图4A中的滤波器块20和30的顺序在需要时可互换,只要滤波器块设计为时间不变的。
图4B是图示按照另一个实施例的音频解码器的示例的示意框图。在这个示例中,音频解码器100还包括解相关滤波器35,如稍后将进行解释。
应当理解,图4B中的滤波器块20、30和35的顺序在需要时可互换,只要滤波器块设计为时间不变的。
图5是图示按照一般化实施例的音频解码器的示例的示意框图,该音频解码器具有L个输入信号和L个输出信号,其中L为大于或等于2的整数。音频解码器100包括交叉馈送网络10、用于头部阴影滤波器的滤波器块20、用于相移滤波器的滤波器块30、用于解相关滤波器的可选滤波器块35以及求和块40。在交叉馈送网络10之后,信号的数量为2L,以及保持信号的数量直到求和块40。在求和块40,信号的数量再次减少为L。
应当理解,图5中的滤波器块20、30和35的顺序在需要时也可互换,只要滤波器块设计为时间不变的。
如图4A、图4B和图5中所举例的,音频解码器100包括用于为输入信号提供直接信号路径和交叉馈送信号路径的部件10以及用于在直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽的部件20。音频解码器100还包括用于在直接信号路径和交叉馈送信号路径中应用相移滤波器用于引入直接信号路径与交叉馈送信号路径之间表示预计听众的耳朵之间发生的相位差的相位差的部件30以及用于对直接和交叉馈送信号路径求和以提供输出信号的部件40。
可选地,如由图5中的虚线所示,音频解码器100包括用于调整直接信号路径与交叉馈送信号路径之间的相位差、优选地以解相关滤波器形式的部件35。
作为示例,音频解码器100可配置成通过引入频率相关相位差(其模仿预计听众的耳朵之间由于在耳朵处来自对预计听众的头部以不同角度所定位的扬声器的声音的不同到达时间(所谓的ITD)而发生的相位差),在直接信号路径和交叉馈送信号路径中应用相移滤波器。
优选地,对频率相关相位差进行建模用于低于阈值频率的频率。作为举例,阈值频率大约为1 kHz。
在具体示例中,如图4B所图示,解码器100还配置成在直接信号路径和交叉馈送信号路径中应用解相关滤波器35,用于高于阈值频率的情况下将直接信号路径与交叉馈送信号路径之间的相位差调整为大约90度的常数。作为示例,阈值频率大约为1 kHz。
如上所示,音频解码器100可配置成通过交叉馈送网络10来提供直接信号路径和交叉馈送信号路径。在具体示例中,音频解码器100还配置成通过在直接信号路径和交叉馈送信号路径的每个中布置的个别的头部遮蔽滤波器来应用头部遮蔽滤波器。音频解码器100也可配置成通过在直接信号路径的每个中布置的第一全通滤波器以及交叉馈送信号路径的每个中布置的第二不同全通滤波器来应用相移滤波器,以提供在一方面直接信号路径的信号与另一方面交叉馈送信号路径的信号之间的相位差。
例如,头部遮蔽滤波器可基于其中去除ITD的HRTF响应。作为示例,HRFT可以任何适当方式,例如基于HRTF建模来获得,通过公共HRTF数据库和/或通过HRTF测量来访问。
如果存在两个以上输入通道,则音频解码器100通常配置成应用于通道对。
在具体应用中,输出信号预计被发送给一组耳机130。
如所示,音频解码器100的具体示例是立体声解码器。但应当理解,本发明并不局限于此。
图6是图示双耳声解码器通常将会如何用于回放链中的示例的示意框图。在这个示例中,回放链基本上包括数字音乐源90、双耳声解码器100、数模(D/A)转换器110、音频放大器以及一组耳机130或类似扬声器设备。声音再现系统105可通过解码器100、D/A转换器110和音频放大器120以及可选地耳机130来限定。因此,声音再现系统105是回放链的一部分。
也应当理解,解码器可在服务器-客户端情形中、在客户端侧和/或在服务器侧实现。当然,音频解码器100可在网络客户端中实现,网络客户端可以是有线和/或无线装置,包含诸如移动电话、智能电话、个人计算机、膝上型计算机、平板等的任何类型的用户设备。备选地,音频解码器100可在网络服务器中实现,网络服务器则配置成对音频信号进行解码,并且以压缩或者未压缩形式将解码音频信号发送给客户端,其又实行回放。音频信号可由网络服务器来解码,并且例如作为流媒体文件实时地传递给客户端。备选地,解码音频信号由网络服务器作为预处理音频文件来存储,解码音频信号后续可传递给客户端。预处理音频文件包含解码音频信号或者其适当表示。
在具体示例中,解码器具有两个输入通道和两个输出通道。如上所示,解码器然而可配置用于两个以上通道,并且更一般地用于L个通道,其中L>1。例如,如果音频源具有两个以上通道,则解码器可配置(复制)成应用于通道对。
然而,为了便利,下面假定立体声输入信号。
图7是图示双耳声解码器的非限制性示例的概述的示意框图。在这个示例中,解码器包括多个信号处理块。在以下小节详细描述每个块。Lin和Rin是原始左和右立体声信号,以及Lout和Rout是预计发送给耳机的系统的所处理左和右输出信号。
头部阴影块(1)以与图1所描绘的相同的方式将信号分成直接和交叉馈送信号,但是没有对信号求和。应用头部遮蔽滤波器,从而模拟对听众以不同角度所放置的两个扬声器的头部遮蔽(但是通常没有ITD)。典型示例将会模拟在标准±30度对称立体声装备中在听众之前水平放置的扬声器,如图3示意所图示。
相位均衡器(EQ)块(2)将相移滤波器应用于直接和交叉馈送信号,其以这种方式设计,使得低频ITD采用在直接与交叉馈送信号之间的对应相移来模拟,并且在块内部对直接和交叉馈送信号求和时不存在梳状滤波效应。与在高频处相比,ITD对于在低频处的定位更为重要,因此在引起妨碍梳状滤波效应的频率范围中不需要模拟ITD。
回响(reverberation)块(3)是可选的,并且将回响环境感加入声音,其在真实房间中收听扬声器时始终存在。
下面更详细描述图7所描绘信号处理块的示例。
块1的示例—头部阴影
头部阴影块的示例模拟与从对听众以不同角度所放置的两个扬声器入射的声音对应的耳朵处的头部遮蔽。在这个示例中,用于头部遮蔽的滤波器对应于多个听众的平均HRTF响应,但是其中去除了ITD。优选地,这通过分别对准与直接和交叉馈送信号路径中应用的头部遮蔽滤波器对应的脉冲响应的开始进行。关于HRTF、ITD和相关心理声学的概念的更多信息,参见参考文献[5]。
如在图8中能够看到,头部遮蔽块的输出信号由下列项组成:1) 通过信号处理块中的下标LL和RR所示的从Lin到Lout以及从Rin到Rout的直接信号路径;以及2) 通过信号处理块中的下标LR和RL所示的从Lin到Rout以及从Rin到Lout的交叉馈送信号路径。
对于头部遮蔽,重要设计变量是作为频率的函数、即在输入中的一个应用信号时预计听众的耳朵之间发生的频率相关幅度差的头部阴影量。
另一个重要设计变量是头部阴影滤波器如何影响声音的所感知音质。在某些条件下,能够执行通过均衡的频率响应校正,以调整声音的所感知音质特性。
块2的示例—相位EQ
相位EQ块的示例在图9中描绘。该块分为两个独立部分30、35。要求这些部分的至少一个—它们可一起使用或者独自使用。下面描述这些部分。在这个示例中,相位EQ块(也参见图7)的每个信号处理块具有全通特性,以及相位EQ块的目的是要在直接和交叉馈送信号路径的求和或加法中给予某些所希望的性质。求和在图9中示出,以图示与相位EQ块的关系。
关于全通滤波器和基本信号处理的一般信息,参见参考文献[4]。
相位EQ部分1的示例—LF(低频)耳间相位差
例如,相位EQ块的第一部分30可通过对直接路径信号应用单独全通滤波器HIAP1以及对交叉馈送信号应用不同的全通滤波器HIAP2,来引入至少两个信号、例如左和右耳信号之间的相移。HIAP1和HIAP2的重要设计参数是例如HIAP1与HIAP2之间的相位差的频率相关性。相位差通过采用稍微不同的滤波器系数来设计HIAP1和HIAP2而实现。
作为示例,所应用的相位差模仿耳朵之间由于在耳朵处来自对头部以不同角度所定位的一对扬声器的声音的不同到达时间(ITD)而自然发生的相位差。因此,与只模拟头部遮蔽相比,所感知声基宽变得更为自然。直到大约1 kHz的最大频率,对ITD相位差进行建模。高于这个频率,HIAP1与HIAP2滤波器之间的相位差接近零,以避免输出处的直接和交叉馈送信号路径的求和中的梳状滤波效应。
相位EQ部分2的示例—HF(高频)串扰解相关
例如,相位EQ块的第二部分35可实现类似部分1的结构中的直接与交叉馈送信号路径之间的解相关全通滤波器。HDC1和HDC2的目的是要使直接与交叉馈送信号路径之间的相位差在高频(高于例如1 kHz,HDC1与HDC2之间的相位差在低频接近零)变成接近90度。这是因为,如果相位差在直接与交叉馈送信号路径之间太小,则立体声差信号(通过取L-R所产生的信号)以在有规律的扬声器收听中的听众的耳朵处没有发生的方式极大地减弱。
块3的示例—回响
例如,回响信号处理部分是可选的,并且将回响滤波器应用于信号。回响脉冲响应例如能够设计成在统计上与具有完全扩散声场的试听室中的听众耳朵处发现的回响脉冲响应类似。
实现和使用示例
解码器的不同实现和使用是可能的,例如:
1. 解码器可实现为移动装置上用于对声音的实时解码的软件算法。
2. 解码器可在硬件中实现为ASIC(专用集成电路),或者可作为用于集成在DSP(数字信号处理器)或其他类处理单元中的软件库来提供。
3. 解码器可在用于音频回放所设计的任何种类的消费电子设备中实现。
4. 解码器可用于对音频(其将经由媒体内容提供商来分配给消费者)的离线解码。
一般来说,所提出的技术能够通过软件、硬件、固件或者它们的任何组合来实现。
例如,上面所描述的步骤、功能、例程和/或块可使用任何常规技术在硬件中实现,任何常规技术例如分立电路或集成电路技术,包含通用电子电路和专用电路。
备选地,上面所述的步骤、功能、例程和/或块的至少一些可通过在供适当计算机或处理装置(例如微处理器、数字信号处理器(DSP))和/或任何适当可编程逻辑装置(例如现场可编程门阵列(FPGA)装置、图形处理单元(GPU)和可编程逻辑控制器(PLC)装置)运行的软件中实现。
也应当理解,再使用任何常规单元的一般处理能力可以是可能的。例如通过现有软件的重新编程或者通过添加新软件组件来再使用现有软件也可以是可能的。
因此,本文所提出的(一个或多个)流程图在由一个或多个处理器执行时可被看作是(一个或多个)计算机流程图。对应设备可限定为一组功能模块,其中由处理器所执行的每个步骤对应于功能模块。在这种情况下,功能模块实现为运行于处理器的计算机程序。
下面将参照图10来描述计算机实现的示例,图10图示基于处理器-存储器实现的音频解码器的示例。在这里,音频解码器100包括一个或多个处理器140和存储器150。在这个具体示例中,本文所述的步骤、功能、例程、模块和/或块的至少一些通过计算机程序155/165(其被加载到存储器150中供(一个或多个)处理器140运行)中实现。
(一个或多个)处理器140和存储器150彼此互连,以便实现正常的软件运行。可选输入/输出装置也可互连到(一个或多个)处理器140和/或存储器150,以便实现诸如(一个或多个)输入参数和/或(一个或多个)所得到的输出参数的相关数据的输入和/或输出。
具体来说,存储器150包括由处理器140可运行的指令,由此音频解码器100可操作以应用头部遮蔽滤波器、应用相移滤波器以及对直接和交叉馈送信号路径求和以提供输出信号。
术语‘计算机’应当以一般意义来解释为能够运行程序代码或计算机程序指令以执行具体处理、确定或计算任务的任何系统或装置。
在具体实施例中,计算机程序155/165包括指令,其在由处理器140运行时使处理器140:
- 提供用于输入信号的直接信号路径和交叉馈送信号路径的计算机表示;
- 在直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器,用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽;
- 在直接信号路径和交叉馈送信号路径中应用相移滤波器,用于引入直接信号路径与交叉馈送信号路径之间表示预计听众的耳朵之间发生的相位差的相位差;以及
- 对直接和交叉馈送信号路径求和,以提供输出信号。
所提出的技术也提供包括计算机程序155/165的载体150/160,其中载体是电子信号、光信号、电磁信号、磁信号、电气信号、无线电信号、微波信号或计算机可读存储媒介中的一个。
软件可实现为计算机程序产品,其通常在计算机可读媒介(例如CD、DVD、USB存储器、硬盘驱动或者任何其他常规存储器装置)上携带。因此,软件可加载到计算机/处理器的操作存储器中,供计算机的处理器运行。计算机/处理电路无需专用于仅运行上面描述步骤、功能、例程和/或块,而且也可运行其他软件任务。
如本文所示,音频解码器备选地可限定为一组功能模块,其中功能模块实现为运行于至少一个处理器上的计算机程序。
因此,驻留(residing)在存储器中的计算机程序可组织为适当功能模块,其配置成在由处理器运行时执行本文所描述步骤和/或任务的至少一部分。这类功能模块的示例在图11中图示。
图11是图示包括一组功能模块的音频解码器100的示例的示意框图。在这个示例中,音频解码器100配置成接收表示至少两个音频输入通道的输入信号。音频解码器100包括表示模块170、第一滤波模块175、第二滤波模块180和求和模块185。
表示模块170适合于提供用于输入信号的直接信号路径和交叉馈送信号路径的计算机表示。第一滤波模块175适合于在直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器,用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽。第二滤波模块180适合于在直接信号路径和交叉馈送信号路径中应用相移滤波器,用于引入直接信号路径与交叉馈送信号路径之间表示预计听众的耳朵之间发生的相位差的相位差。求和模块185适合于对直接和交叉馈送信号路径求和,以提供输出信号。
在具体示例中,音频解码器100还包括第三可选滤波模块,其用于在直接信号路径和交叉馈送信号路径中应用解相关滤波器,用于高于阈值频率的情况下将直接信号路径与交叉馈送信号路径之间的相位差调整为大约90度的常数。
上面描述的实施例只作为示例给出,并且应该理解,所提出技术并不局限于此。本领域的技术人员将理解,在没有背离本发明的范围的情况下,可对实施例进行各种修改、组合和变更。具体来说,不同实施例中的不同部分解决方案在其他配置中、在技术上可能的情况下能够相组合。
参考文献

Claims (19)

1.一种音频解码器(100),配置成接收表示至少两个音频输入通道的输入信号,其中所述音频解码器(100)配置成为所述输入信号提供直接信号路径和交叉馈送信号路径;
其中所述音频解码器(100)配置成在所述直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽;
其中所述音频解码器(100)配置成在所述直接信号路径和交叉馈送信号路径中应用相移滤波器用于引入所述直接信号路径与所述交叉馈送信号路径之间的频率相关相位差,所述频率相关相位差模仿在所述预计听众的耳朵之间由于在所述耳朵处来自对所述预计听众的头部以不同角度所定位的所述扬声器的声音的不同到达时间即所谓的耳间时间差ITD而发生的相位差;
其中设计所述相移滤波器,使得低于阈值频率的低频ITD采用所述直接与交叉馈送信号之间的对应相移来模拟;
所述音频解码器(100)还配置成在所述直接信号路径和交叉馈送信号路径中应用解相关滤波器用于高于所述阈值频率的情况下将所述直接信号路径与交叉馈送信号路径之间的所述相位差调整为大约90度的常数;以及
其中所述音频解码器(100)配置成对所述直接和交叉馈送信号路径求和以提供输出信号。
2.如权利要求1所述的音频解码器,其中,所述音频解码器(100)包括处理器(140)和存储器(150),所述存储器包括由所述处理器可执行的指令,由此所述音频解码器可操作以应用所述头部遮蔽滤波器、应用所述相移滤波器并且对所述直接和交叉馈送信号路径求和以提供输出信号。
3.如权利要求1所述的音频解码器,其中,所述音频解码器(100)包括:
- 用于为所述输入信号提供直接信号路径和交叉馈送信号路径的部件(10);
- 用于在所述直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽的部件(20);
- 用于在所述直接信号路径和交叉馈送信号路径中应用相移滤波器用于引入所述直接信号路径与所述交叉馈送信号路径之间表示所述预计听众的耳朵之间发生的相位差的相位差的部件(30);以及
- 用于对所述直接和交叉馈送信号路径求和以提供输出信号的部件(40)。
4.如权利要求1所述的音频解码器,其中,所述阈值频率为大约1 kHz。
5.如权利要求1至4中的任一项所述的音频解码器,其中,所述音频解码器(100)配置成通过交叉馈送网络来提供所述直接信号路径和交叉馈送信号路径,
其中所述音频解码器(100)配置成通过在所述直接信号路径和交叉馈送信号路径的每个中布置的个别的头部遮蔽滤波器来应用头部遮蔽滤波器,以及
其中所述音频解码器(100)配置成通过在所述直接信号路径的每个中布置的第一全通滤波器以及在所述交叉馈送信号路径的每个中布置的第二不同全通滤波器来应用相移滤波器,以提供一方面所述直接信号路径的信号与另一方面所述交叉馈送信号路径的信号之间的相位差。
6.如权利要求1至4中的任一项所述的音频解码器,其中,所述头部遮蔽滤波器基于其中去除耳间时间差ITD的头部相关传递函数HRTF响应。
7.如权利要求1至4中的任一项所述的音频解码器,其中,所述音频解码器(100)配置成如果存在两个以上输入通道,则应用于通道对。
8.如权利要求1至4中的任一项所述的音频解码器,其中,所述输出信号预计被发送给耳机(130)。
9.如权利要求1至4中的任一项所述的音频解码器,其中,所述音频解码器(100)是立体声解码器。
10.一种对表示至少两个音频输入通道的输入信号进行解码的方法,其中为所述输入信号提供直接信号路径和交叉馈送信号路径,所述方法包括下列步骤:
- 在所述直接信号路径和交叉馈送信号路径中应用(S1)头部遮蔽滤波器用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽;
- 在所述直接信号路径和交叉馈送信号路径中应用(S2)相移滤波器用于引入一方面所述直接信号路径与另一方面所述交叉馈送信号路径之间的频率相关相位差,所述频率相关相位差模仿在所述输入通道的任一个上输入信号时在所述预计听众的耳朵之间由于在所述耳朵处来自对所述预计听众的头部以不同角度所定位的所述扬声器的声音的不同到达时间即所谓的耳间时间差ITD而发生的相位差;
其中设计所述相移滤波器,使得低于阈值频率的低频ITD采用所述直接与交叉馈送信号之间的对应相移来模拟;
在所述直接信号路径和交叉馈送信号路径中应用(S2')解相关滤波器,用于高于所述阈值频率的情况下引入所述直接信号路径与所述交叉馈送信号路径之间的相位差或者将其调整为大约90度;以及
- 对所述直接和交叉馈送信号路径求和(S3),以提供输出信号。
11.如权利要求10所述的方法,其中,所述阈值频率为大约1 kHz。
12.如权利要求10至11中的任一项所述的方法,其中,所述头部遮蔽滤波器基于其中去除耳间时间差ITD的头部相关传递函数HRTF响应。
13.如权利要求10至11中的任一项所述的方法,其中,所述方法在两个以上输入通道的情况下应用于通道对。
14.一种包括如权利要求1至9中的任一项所述的音频解码器(100)的声音再现系统(105)。
15.如权利要求14所述的声音再现系统,其中,所述声音再现系统(105)是回放链的一部分。
16.一种对表示至少两个音频输入通道的输入信号进行解码的设备,包括:
- 用于提供输入信号的直接信号路径和交叉馈送信号路径的计算机表示的部件;
- 用于在所述直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器,用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽的部件;
- 用于在所述直接信号路径和交叉馈送信号路径中应用相移滤波器,用于引入所述直接信号路径与所述交叉馈送信号路径之间的频率相关相位差的部件,所述频率相关相位差模仿在所述预计听众的耳朵之间由于在所述耳朵处来自对所述预计听众的头部以不同角度所定位的所述扬声器的声音的不同到达时间即所谓的耳间时间差ITD而发生的相位差;
其中设计所述相移滤波器,使得低于阈值频率的低频ITD采用所述直接与交叉馈送信号之间的对应相移来模拟;
- 用于在所述直接信号路径和交叉馈送信号路径中应用解相关滤波器,用于高于所述阈值频率的情况下引入所述直接信号路径与所述交叉馈送信号路径之间的相位差或者将其调整为大约90度的部件;以及
- 用于对所述直接和交叉馈送信号路径求和,以提供输出信号的部件。
17.一种配置成接收表示至少两个音频输入通道的输入信号的音频解码器(100),其中所述音频解码器(100)包括:
- 表示模块(170),用于提供所述输入信号的直接信号路径和交叉馈送信号路径的计算机表示;
- 第一滤波模块(175),用于在所述直接信号路径和交叉馈送信号路径中应用头部遮蔽滤波器,用于模拟对预计听众以不同角度所放置的扬声器的头部遮蔽;
- 第二滤波模块(180),用于在所述直接信号路径和交叉馈送信号路径中应用相移滤波器,用于引入所述直接信号路径与所述交叉馈送信号路径之间的频率相关相位差,所述频率相关相位差模仿在所述预计听众的耳朵之间由于在所述耳朵处来自对所述预计听众的头部以不同角度所定位的所述扬声器的声音的不同到达时间即所谓的耳间时间差ITD而发生的相位差;
其中设计所述相移滤波器,使得低于阈值频率的低频ITD采用所述直接与交叉馈送信号之间的对应相移来模拟;
其中所述音频解码器(100)还包括第三滤波模块,用于在所述直接信号路径和交叉馈送信号路径中应用解相关滤波器,用于高于所述阈值频率的情况下引入所述直接信号路径与所述交叉馈送信号路径之间的相位差或者将其调整为大约90度;以及
- 求和模块(185),用于对所述直接和交叉馈送信号路径求和,以提供输出信号。
18.一种包括如权利要求1至9和17中的任一项所述的音频解码器(100)的网络客户端。
19.一种包括如权利要求1至9和17中的任一项所述的音频解码器(100)的网络服务器。
CN201480024914.XA 2013-05-02 2014-04-08 配置成转换音频输入通道用于头戴受话器收听的音频解码器 Active CN105308988B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361818522P 2013-05-02 2013-05-02
US61/818522 2013-05-02
PCT/SE2014/050434 WO2014204377A1 (en) 2013-05-02 2014-04-08 Audio decoder configured to convert audio input channels for headphone listening

Publications (2)

Publication Number Publication Date
CN105308988A CN105308988A (zh) 2016-02-03
CN105308988B true CN105308988B (zh) 2017-12-19

Family

ID=52104978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480024914.XA Active CN105308988B (zh) 2013-05-02 2014-04-08 配置成转换音频输入通道用于头戴受话器收听的音频解码器

Country Status (3)

Country Link
US (1) US9706327B2 (zh)
CN (1) CN105308988B (zh)
WO (1) WO2014204377A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9591427B1 (en) * 2016-02-20 2017-03-07 Philip Scott Lyren Capturing audio impulse responses of a person with a smartphone
EP3446494A4 (en) * 2016-04-20 2019-12-25 Genelec OY ACTIVE MONITORING HELMET AND ITS BINAURAL PROCESS
CN105929967B (zh) * 2016-05-20 2018-08-31 中国电子科技集团公司第十研究所 多路实时音频信号处理的仿真系统
TWI657701B (zh) * 2016-06-17 2019-04-21 中國商信泰光學(深圳)有限公司 耳機裝置
FR3052951B1 (fr) * 2016-06-20 2020-02-28 Arkamys Procede et systeme pour l'optimisation du rendu sonore de basses frequences d'un signal audio
CN110062945B (zh) * 2016-12-02 2023-05-23 迪拉克研究公司 音频输入信号的处理
US11038482B2 (en) * 2017-04-07 2021-06-15 Dirac Research Ab Parametric equalization for audio applications
US10019981B1 (en) 2017-06-02 2018-07-10 Apple Inc. Active reverberation augmentation
US10462599B2 (en) * 2018-03-21 2019-10-29 Sonos, Inc. Systems and methods of adjusting bass levels of multi-channel audio signals
US11617050B2 (en) 2018-04-04 2023-03-28 Bose Corporation Systems and methods for sound source virtualization
US10972835B2 (en) * 2018-11-01 2021-04-06 Sennheiser Electronic Gmbh & Co. Kg Conference system with a microphone array system and a method of speech acquisition in a conference system
US10805726B1 (en) * 2019-08-16 2020-10-13 Bose Corporation Audio system equalization
US11356795B2 (en) 2020-06-17 2022-06-07 Bose Corporation Spatialized audio relative to a peripheral device
US11982738B2 (en) 2020-09-16 2024-05-14 Bose Corporation Methods and systems for determining position and orientation of a device using acoustic beacons
US11665495B2 (en) 2020-09-18 2023-05-30 Nicolas John Gault Methods, systems, apparatuses, and devices for facilitating enhanced perception of ambiance soundstage and imaging in headphones and comprehensive linearization of in-ear monitors
US11700497B2 (en) 2020-10-30 2023-07-11 Bose Corporation Systems and methods for providing augmented audio
US11696084B2 (en) 2020-10-30 2023-07-04 Bose Corporation Systems and methods for providing augmented audio

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101065795A (zh) * 2004-09-23 2007-10-31 皇家飞利浦电子股份有限公司 处理音频数据的系统和方法、程序单元和计算机可读介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9622773D0 (en) 1996-11-01 1997-01-08 Central Research Lab Ltd Stereo sound expander
FI113147B (fi) * 2000-09-29 2004-02-27 Nokia Corp Menetelmä ja signaalinkäsittelylaite stereosignaalien muuntamiseksi kuulokekuuntelua varten
US20060205349A1 (en) * 2005-03-08 2006-09-14 Enq Semiconductor, Inc. Apparatus and method for wireless audio network management
CN101946526B (zh) * 2008-02-14 2013-01-02 杜比实验室特许公司 声音再现方法和系统以及立体声扩展方法
KR101366997B1 (ko) * 2008-07-31 2014-02-24 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 바이노럴 신호를 위한 신호생성

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101065795A (zh) * 2004-09-23 2007-10-31 皇家飞利浦电子股份有限公司 处理音频数据的系统和方法、程序单元和计算机可读介质

Also Published As

Publication number Publication date
US9706327B2 (en) 2017-07-11
CN105308988A (zh) 2016-02-03
WO2014204377A1 (en) 2014-12-24
US20160094929A1 (en) 2016-03-31

Similar Documents

Publication Publication Date Title
CN105308988B (zh) 配置成转换音频输入通道用于头戴受话器收听的音频解码器
US9154896B2 (en) Audio spatialization and environment simulation
US8358091B2 (en) Apparatus and method for generating a number of loudspeaker signals for a loudspeaker array which defines a reproduction space
EP0965247B1 (en) Multi-channel audio enhancement system for use in recording and playback and methods for providing same
JP4347422B2 (ja) 空間形成されたオーディオの再生
KR102430769B1 (ko) 몰입형 오디오 재생을 위한 신호의 합성
EP1416769A1 (en) Object-based three-dimensional audio system and method of controlling the same
US20140050325A1 (en) Multi-dimensional parametric audio system and method
EP3020042B1 (en) Processing of time-varying metadata for lossless resampling
JP2010538572A (ja) オーディオ信号デコーディング方法及び装置
CN103535052A (zh) 用于完整音频信号的设备和方法
WO2018073759A1 (en) System for and method of generating an audio image
Jot et al. Binaural simulation of complex acoustic scenes for interactive audio
US20190394596A1 (en) Transaural synthesis method for sound spatialization
CN105594227A (zh) 利用恒定功率成对平移的矩阵解码器
CN114915874A (zh) 音频处理方法、装置、设备、介质及程序产品
JP4497161B2 (ja) 音像生成装置及び音像生成プログラム
Maher et al. Old and new techniques for artificial stereophonic image enhancement
JP6421385B2 (ja) サウンド立体化のためのトランスオーラル合成方法
KR20000026251A (ko) 5채널 오디오 데이터를 2채널로 변환하여 헤드폰으로 재생하는장치 및 방법
Tsakostas et al. Binaural rendering for enhanced 3d audio perception
Jot et al. Center-Channel Processing in Virtual 3-D Audio Reproduction over Headphones or Loudspeakers
JP2003244798A (ja) ステレオ信号処理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant