CN101521843A

CN101521843A - 头相关传输函数卷积方法和设备

Info

Publication number: CN101521843A
Application number: CN200910118310A
Authority: CN
Inventors: 福井隆郎; 西尾文孝
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2008-02-27
Filing date: 2009-02-25
Publication date: 2009-09-02
Anticipated expiration: 2029-02-25
Also published as: US20090214045A1; EP2096882A3; US9432793B2; JP2009206691A; KR20090092721A; US8503682B2; CN101521843B; EP2375788A1; US20130287235A1; EP2375788B1; EP2096882A2; EP2096882B1

Abstract

本发明提供了一种头相关传输函数卷积方法和设备。该头相关传输函数(HRTF)卷积方法被配置用于当音频信号通过布置在听众双耳附近位置上的电－声转换装置被声音再现时，将HRTF卷积到音频信号中，该HRTF使听众在收听音频信号时就好像声音图像位于感知到的虚拟声音图像定位位置上，所述方法包括以下步骤：当声源被布置在虚拟声音图像定位位置上并且声音收集装置被布置在电－声转换装置的位置上时，预先分别测量关于从声源到声音收集单元的直接波的方向的直接波方向HRTF，以及关于从声源到声音收集单元的一个或多个所选反射波的方向的反射波方向HRTF；并且将所获得的直接波方向HRTF和反射波方向HRTF卷积到音频信号中。

Description

头相关传输函数卷积方法和设备

技术领域

本发明涉及卷积方法和卷积设备，用于在利用布置在听众耳边的例如耳机的声音再现驱动器之类的电声单元进行声音再现期间，将头相关传输函数(下文中简称为“HRTF”)卷积到音频信号中，所述HRTF用于使得听众能够收听位于听众面前或其他位置上的声源。

背景技术

在听众将耳机佩戴在例如头部并利用双耳听取声音再现的信号的情况下，如果在耳机处再现的音频信号是被提供到布置在听众左前方和右前方的扬声器的常用音频信号，则会发生所谓的侧化现象(lateralizationphenomenon)，其中再现的声音图像停留在听众的头部。

例如在WO95/13690和日本未审查专利申请公开No.03-214897中公开了一种被称为虚拟声音图像定位的技术，该技术已经解决了侧化现象的问题。这种虚拟声音图像定位使得声音图像被再现(被虚拟地定位在相关位置上)，从而使得当利用耳机等再现时，声音图像被再现，就好像在听众左前方或右前方存在声源(例如在预定感知位置上的扬声器)一样，并以下述方式被实现。

例如，图30被用于描述在利用双声道立体声耳机再现左右两边的双声道立体声信号的情况下虚拟声音图像定位的技术。

如图30所示，在听众双耳附近的位置上布置有麦克风(声-电转换单元的示例)ML和MR，并且在希望进行虚拟声音图像定位的位置上布置有扬声器SPL和SPR，其中假设在听众双耳位置上布置有两个声音再现驱动器，例如双声道立体声耳机(电-声转换单元的示例)。

在存在假人头1(可替换地，可以是真人，听众他/她自身)的状态下，在一个声道(例如左声道扬声器SPL)上执行例如冲激脉冲的声音再现，通过该再现发射的冲激脉冲被麦克风ML和MR中的每一个所拾取，并且左声道的HRTF被测量。在该示例的情况下，HRTF作为冲激响应被测量。

在此情况下，如图30所示，充当左声道HRTF的冲激响应包括麦克风ML所拾取的来自左声道扬声器SPL的声波的冲激响应HLd(下文中称之为“左侧主要分量的冲激响应”)以及麦克风MR所拾取的来自左声道扬声器SPL的声波的冲激响应HLc(下文中称之为“左侧串话分量的冲激响应”)。

接下来，冲激脉冲的声音再现在右声道扬声器SPR处以相同方式被执行，并且通过该再现所发射的冲激脉冲被麦克风ML和MR中的每一个所拾取，并且针对右声道的HRTF(即右声道的HRTF)作为冲激响应被测量。

在此情况下，充当右声道HRTF的冲激响应包括麦克风MR所拾取的来自右声道扬声器SPR的声波的冲激响应HRd(下文中称之为“右侧主要分量的冲激响应”)以及麦克风ML所拾取的来自右声道扬声器SPR的声波的冲激响应HRc(下文中称之为“右侧串话分量的冲激响应”)。

针对左声道的HRTF和右声道的HRTF的冲激响应分别照原样与提供到用于耳机的左右声道的声音再现驱动器的音频信号相卷积。就是说，通过测量获得的左侧主要分量的冲激响应和左侧串话分量的冲激响应(充当左声道HRTF)照原样与左侧音频信号相卷积，并且通过测量获得的右侧主要分量的冲激响应和右侧串话分量的冲激响应(充当右声道HRTF)照原样与右侧音频信号相卷积。

这实现了声音图像定位(虚拟声音图像定位)，从而使得即使声音再现发生在听众耳朵附近，也感觉到声音就好像是从位于听众左前方和右前方的扬声器再现的一样，或者感觉到声音好像是例如左侧和右侧的双声道立体声音频。

以上描述了双声道的情况，但是对于三声道或更多声道的情况下，也可以通过如下操作以相同的方式执行：针对每个声道将扬声器布置在虚拟声音图像定位位置上，例如再现冲激脉冲，测量每个声道的HRTF，并且将通过测量获得的HRTF的冲激响应关于提供到耳机的用于利用双声道(左和右)进行声音再现的驱动器的音频信号进行卷积。

发明内容

顺便提及，当执行HRTF测量的地点不在消声室中时，不仅来自感知声源(对应于虚拟声音图像定位位置)的直接波而且例如图30中的虚线所示的反射波的分量都被包括在测量出的HRTF中(没有被分离)。因此，根据现有技术测得的HRTF包括相关测量地点的属性，所述属性是根据执行测量的室或地点等的形状以及对声波进行反射的诸如墙壁、天花板、地板等的材料的。

为了消除执行测量的房间或地点的属性，可以设想在消声室中进行测量，在消声室中，不存在来自地板、天花板、墙壁等的反射。但是，在将在消声室中测得的HRTF照原样卷积到音频信号中的情况下，存在如下问题：由于在尝试虚拟地定位声音图像的情况下不存在反射波，因此虚拟声音图像位置和朝向有些模糊。

因此，根据现有技术，将照原样被用于与音频信号卷积的HRTF的测量不是在消声室中执行的，相反，HRTF在具有一定量反射的房间中被测量。此外，已经提出了以下布置：用于测量HRTF的房间或地点(例如演播室、礼堂、大房间等)的清单被呈现给用户，以使得希望通过虚拟声音图像定位来欣赏音乐的用户能够从清单中选择所需房间或地点的HRTF。

但是，如上所述，根据现有技术，HRTF测量的执行不仅利用了来自感知声源位置的直接波的冲激响应，还伴随着反射波的冲激响应，所述冲激响应包括直接波和反射波两者而无法将它们分离开，因此，只有根据所测量的地点或房间的HRTF可获得，并因此，难以获得根据所需周围环境或房间环境的HRTF并将其卷积到音频信号中。例如，当扬声器被布置在既没有墙壁也没有其他障碍物的大平原区域之前时，难以将对应于感知的收听环境的HRTF卷积到音频信号中。

而且，迄今为止，在尝试在具有感知的预定形状和内部音量并且墙壁具有预定声音吸收程度(对应于声波的衰减率)的房间中获取HRTF的情况下，除了找到或建造这样一个房间并在该房间中测量和获取HRTF之外别无它法。但是，实践中，难以找到建造这样所需的收听环境或房间，并且当前使用的技术不足以将对应于所需任意收听环境或房间环境的HRTF卷积到音频信号中。

希望能够提供一种头相关传输函数卷积方法和设备，其使得能够执行对应于所需任意收听环境或房间环境的HRTF的卷积并且能够获得所需的虚拟声音图像定位感觉。

根据本发明的一个实施例的一种头相关传输函数卷积方法被配置用于当音频信号通过布置在听众双耳附近位置上的电-声转换装置被声音再现时，将头相关传输函数卷积到所述音频信号中，该头相关传输函数使听众收听音频信号以使得声音图像被定位在感知到的虚拟声音图像定位位置上，所述头相关传输函数卷积方法包括以下步骤：当声源被布置在所述虚拟声音图像定位位置上并且声音收集装置被布置在所述电-声转换装置的位置上时，预先分别测量：关于从所述声源到所述声音收集装置的直接波的方向的直接波方向头相关传输函数，以及关于从所述声源到所述声音收集装置的一个所选反射波的方向的一个反射波方向头相关传输函数或者关于从所述声源到所述声音收集装置的多个所选反射波的方向的多个反射波方向头相关传输函数，以获得这些头相关传输函数；以及将所获得的所述直接波方向头相关传输函数和关于所述一个所选反射波的方向的所述一个反射波方向头相关传输函数或者关于所述多个所选反射波的方向的所述多个反射波方向头相关传输函数卷积到所述音频信号中。

迄今为止，如上所述，包括直接波方向头相关传输函数和反射波方向头相关传输函数两者的完整的头相关传输函数被测量并在未经改变的情况下被卷积到音频信号中。另一方面，利用以上配置，在头相关传输函数测量过程中，直接波方向头相关传输函数和反射波方向头相关传输函数是预先分开测量的。随后，所获得的直接波方向头相关传输函数和反射波方向头相关传输函数被卷积到音频信号中。

这里，直接波方向头相关传输函数是仅仅根据从布置在感知的虚拟声音图像定位位置上的声源直接输入到声音收集单元的用于测量的声波获得的头相关传输函数，因此不包括反射波的分量。

而且，反射波方向头相关传输函数是仅仅根据从感知的反射波方向直接输入到声音收集单元的用于测量的声波获得的头相关传输函数，因此不包括在此处被反射并在相关的反射波方向上被从声源输入到声音收集单元的分量。

随后，在测量中，如上所述，当虚拟声音图像定位位置是声源时，针对直接波的头相关传输函数和针对反射波的头相关传输函数是分开获得的，但是此时，作为用于获得反射波方向头相关传输函数的反射波方向，一个或多个反射波方向根据感知的收听环境或房间环境被选出。

例如，在假设收听环境中大平原区域的情况下，既不存在围墙也没有天花板，并且只存在来自在虚拟声音图像定位位置上感知到的声源的直接波以及来自声源的在地面或地板处反射的声波，因此，直接波方向头相关传输函数和在来自地面或地板的反射波的方向上的反射波方向头相关传输函数被获得，并且这些头相关传输函数被卷积到音频信号中。

而且，在假设矩形平行六面体形状的常见房间作为收听环境的情况下，作为反射波，存在在听众的围墙、天花板和地板处反射的声波，因此，关于每个反射波方向的反射波方向头相关传输函数被获得，并且相关的反射波方向头相关传输函数和直接波方向头相关传输函数被卷积到音频信号中。

在卷积中，直接波方向头相关传输函数和反射波方向头相关传输函数的相应卷积可以从开始直接波方向头相关传输函数的卷积处理的开始时间点以及开始每个反射波方向头相关传输函数的卷积处理的开始时间点中的每个开始时间点开始在音频信号的时间序列信号上执行，所述开始时间点是根据直接波和反射波中的每一个从虚拟声音图像定位位置到电-声转换装置的位置的声波路径长度来确定的。

利用以上配置，用于开始直接波方向头相关传输函数的卷积处理的开始时间点和用于开始一个或多个反射波方向头相关传输函数中的每一个的卷积处理的开始时间点都是根据从直接波和反射波的虚拟声音图像定位位置到电-声转换单元的声波路径长度来确定的。在此情况下，关于反射波的路径长度是根据感知的收听环境或房间环境来确定的。

换言之，每个头相关传输函数的卷积开始时间点是根据关于直接波和反射波的路径长度来设置的，从而可以将根据感知的收听环境或房间环境的适当的头相关传输函数卷积到音频信号中。

关于反射波方向头相关传输函数，可以根据在感知的反射部分处声波的衰减率来调整增益，并执行卷积。

利用以上配置，在感知的收听环境或房间环境中，在来自反射声波的反射部分的方向上的反射波方向头相关传输函数根据与按照相关反射部分的材料等确定的衰减率相对应的增益被调整，并被卷积到音频信号中。因此，根据以上配置，头相关传输函数考虑到了由在感知的收听环境或房间环境中的声波反射部分处的噪声吸收等所导致的衰减率的影响，并将考虑到衰减率的头相关传输函数卷积到音频信号中。

根据以上布置，可以将对应于所感知的收听环境或房间环境的合适的HRTF卷积到音频信号中。

附图说明

图1是根据本发明实施例的HRTF(头相关传输函数)测量方法被应用到的系统配置示例的框图；

图2A和2B是用于描述利用根据本发明实施例的HRTF测量方法得到的HRTF和自然状态传输属性测量位置的图；

图3是用于描述在根据本发明实施例的HRTF测量方法中HRTF的测量位置的图；

图4是用于描述在根据本发明实施例的HRTF测量方法中HRTF的测量位置的图；

图5是示出根据本发明实施例的HRTF卷积方法已被应用到的再现设备的配置的框图；

图6A和6B是示出根据本发明实施例由HRTF测量单元和自然状态传输属性测量单元获得的测量结果数据的属性示例的图；

图7A和7B是示出根据本发明实施例获得的归一化HRTF的属性示例的图；

图8是示出与根据本发明实施例获得的归一化HRTF的属性相比较的属性示例的图；

图9是示出与根据本发明实施例获得的归一化HRTF的属性相比较的属性示例的图；

图10是用于描述根据现有技术的常见HRTF的卷积过程部分的图；

图11是用于描述根据本发明实施例的归一化HRTF的卷积过程部分的第一示例的图；

图12是示出用于实现根据本发明实施例的归一化HRTF的卷积过程部分的第一示例的硬件配置示例的框图；

图13是用于描述根据本发明实施例的归一化HRTF的卷积过程部分的第二示例的图；

图14是示出用于实现根据本发明实施例的归一化HRTF的卷积过程部分的第二示例的硬件配置示例的框图；

图15是用于描述7.1声道多环绕的示例的图；

图16是示出根据本发明实施例的HRTF卷积方法已被应用到的声音再现系统的一部分的框图；

图17是示出根据本发明实施例的HRTF卷积方法已被应用到的声音再现系统的一部分的框图；

图18是示出图16中的HRTF卷积过程单元的内部配置示例的框图；

图19是用于描述用于利用根据本发明实施例的HRTF卷积方法来卷积归一化HRTF的声波的方向示例的图；

图20是用于描述利用根据本发明实施例的HRTF卷积方法对归一化HRTF的卷积开始时间的示例的图；

图21是用于描述用于利用根据本发明实施例的HRTF卷积方法来卷积归一化HRTF的声波的方向示例的图；

图22是用于描述利用根据本发明实施例的HRTF卷积方法对归一化HRTF的卷积开始时间的示例的图；

图23是用于描述用于利用根据本发明实施例的HRTF卷积方法来卷积归一化HRTF的声波的方向示例的图；

图24是用于描述利用根据本发明实施例的HRTF卷积方法对归一化HRTF的卷积开始时间的示例的图；

图25是用于描述用于利用根据本发明实施例的HRTF卷积方法来卷积归一化HRTF的声波的方向示例的图；

图26是用于描述利用根据本发明实施例的HRTF卷积方法对归一化HRTF的卷积开始时间的示例的图；

图27A到27F是用于描述利用根据本发明实施例的HRTF卷积方法对归一化HRTF的卷积开始时间的示例的图；

图28是用于描述用于利用根据本发明实施例的HRTF卷积方法来卷积归一化HRTF的声波的方向示例的图；

图29是示出根据本发明实施例的HRTF卷积方法已被应用到的声音再现系统的另一示例的一部分的框图；以及

图30是用于描述HRTF的图。

具体实施方式

本发明实施例的简要概述

如上所述，利用根据现有技术的HRTF卷积方法，进行的是如下布置：扬声器被布置在感知声源位置上以定位虚拟声音图像，HRTF是在假设虑及反射波所引起的冲激响应而非虑及来自相关感知声源位置的直接波所引起的冲激响应(假设直接波和反射波之间的冲激响应都被包括在内而没有分开)的情况下测量的，测量出并获得的HRTF不经改变而卷积到音频信号中。

就是说，迄今为止，来自被感知以定位虚拟声音图像的声源位置的反射波的HRTF和直接波的HRTF是作为包括其两者而没有分开的整体HRTF被测量的。

另一方面，根据本发明实施例，来自被感知以定位虚拟声音图像的声源位置的反射波的HRTF和直接波的HRTF是预先分开测量的。

因此，根据本实施例，从测量点位置观察到的关于来自在特定方向上感知声源的直接波(即直接到达测量点位置的声波，不包括反射波)的HRTF将被获得。以声波被墙等物体反射后的方向作为声源方向，反射波的HRTF作为来自其声源方向的直接波被测量。就是说，在考虑被预定墙反射并输入到测量点位置的反射波的情况下，在被墙反射后来自墙的反射声波可以被看作来自在相关墙处在反射位置方向上感知声源的声波的直接波。

因此，根据本实施例，当测量来自被感知以定位虚拟声音图像的声源位置的直接波的HRTF时，充当测量声波生成单元的电-声转换器(例如扬声器)被布置在感知声源位置上，以便定位相关的虚拟声音图像，但是当测量来自被感知以定位虚拟声音图像的声源位置的反射波的HRTF时，充当测量声波生成单元的电-声转换器(例如扬声器)被布置在将被测量的反射波到测量点位置的入射方向上。

因此，关于来自各个方向的反射波的HRTF是通过将充当测量声波生成单元的电-声转换器布置在每个反射波到测量点位置的入射方向上来测量的。

随后，根据本实施例，这样测量的关于直接波和反射波的HRTF被卷积到音频信号中，从而获得目标再现声音空间中的虚拟声音图像定位，但是关于反射波的HRTF，只有在根据目标再现声音空间所选择的方向上的反射波被卷积到音频信号中。

而且，根据本实施例，关于直接波和反射波的HRTF是通过删除与声波从测量声源位置到测量点位置的路径长度相对应的传播延迟代价(propagation delay worth)来测量的，并且在执行用于将每个HRTF卷积到音频信号中的处理时，与声波从测量声源位置(虚拟声音图像定位位置)到测量点位置(声音再现单元位置)的路径长度相对应的传播延迟代价被考虑在内。

因此，关于根据房间等的大小任意设置的虚拟声音图像定位位置的HRTF可以被卷积到音频信号中。

随后，与反射声波的衰减率(attenuation rate)相关的属性(例如由于墙等的材质所引起的反射程度、声音吸收程度等)被感觉到，作为来自相关墙的直接波的增益。就是说，根据本实施例，例如，根据从感知声源位置到测量点位置的直接波的HRTF未经衰减量而被卷积到音频信号中，而且关于来自墙的反射声波分量，根据来自在墙的反射位置方向上感知声源的直接波的HRTF被与衰减率相卷积，所述衰减率根据与墙的属性相对应的反射程度或声音吸收程度。

HRTF被卷积到的音频信号的再现声音被收听，从而可以根据与墙的属性相对应的反射程度或声音吸收程度来验证是否获得哪种类型的虚拟声音图像定位状态。

而且，考虑到衰减率的来自直接波的HRTF和所选反射波的HRTF到音频信号的卷积的声音再现使得能够在各种房间环境和地点环境中仿真虚拟声音图像定位。这可以通过将来自感知声源位置的直接波与反射波分开并测量HRTF来实现。

HRTF测量方法的描述

如上所述，已经从中消除了反射波分量的关于直接波的HRTF可以通过在例如消声室(anechoic chamber)中测量来获得。因此，利用消声室，关于来自所希望的虚拟声音图像定位位置的直接波的HRTF和感觉到的多个反射波的HRTF被测量，并被用于卷积。

就是说，利用消声室，HRTF是通过如下方式测量的：将充当用于在测量点位置上收集将测量的声波的声-电转换单元的麦克风布置在听众双耳附近，还将用于生成将测量的声波的声源布置在直接波和多个反射波的方向上的位置上。

顺便提及，即使在消声室中获得HRTF，用于测量HRTF的测量系统的扬声器和麦克风的属性也没有被消除，这些属性将导致如下问题：所测量并获得的HRTF已经受到用于测量的扬声器和麦克风的属性的影响。

为了消除扬声器和麦克风的属性的影响，使用具有优质属性(平坦频率属性)的昂贵麦克风和扬声器作为用于测量HRTF的麦克风和扬声器。但是，即使这些昂贵的麦克风和扬声器也无法产生理想的平坦频率属性，从而仍旧存在这些麦克风和扬声器的属性的影响无法被完全消除的情况，从而导致再现音频的声音质量恶化。

而且，消除麦克风和扬声器的属性可以设想通过利用测量系统麦克风和扬声器的反向属性校正卷积了HRTF后的音频信号来实现，但是在此情况下，存在如下问题：不得不为音频信号再现电路提供一个校正电路，从而使得配置变复杂，而且要完全消除测量系统的影响的校正是难以实现的。

鉴于上述问题，为了消除房间或地点对测量的影响，根据本实施例，HRTF是在消声室中测量的，并且还为了消除测量所用的麦克风和扬声器的属性的影响，所测量和获得的HRTF被进行归一化处理(normalizationprocessing)，例如下面将描述。首先，将参考附图来描述根据本实施例的HRTF测量方法的实施例。

图1是用于执行用于获得根据本发明实施例的HRTF测量方法所使用的归一化HRTF的数据的处理程序的系统的配置示例的框图。利用该示例，HRTF测量单元10在消声室中执行HRTF测量，以便单独测量直接波的头相关传输属性。利用HRTF测量单元10，在消声室中，充当听众的假人头或真人位于听众的位置上，并且充当用于收集用于测量的声波的声-电转换单元的麦克风位于假人头或真人双耳附近的位置上(测量点位置)，在假人头或真人双耳位置上布置有用于执行音频信号的声音再现的电-声转换单元，其中在音频信号中已经卷积了HRTF。

在用于执行其中已经卷积了HRTF的音频信号的声音再现的电-声转换单元是具有例如左右双声道的耳机的情况下，用于左声道的麦克风位于左声道的耳机驱动器的位置上，而用于右声道的麦克风位于右声道的耳机驱动器的位置上。

随后，充当测量声源的示例的扬声器被布置在将对其测量HRTF的方向之一上，并以充当测量点位置的听众或麦克风位置为基准点。在此状态下，用于HRTF的测量声波(在此情况下是冲激脉冲)被从该扬声器再现，并且利用两个麦克风来拾取冲激响应。注意，在以下描述中，在将测量HRTF的方向上布置用于测量声源的扬声器的位置将被称为“感知声源位置”。

利用HRTF测量单元10，从两个麦克风获得的冲激响应代表HRTF。根据本实施例，在HRTF测量单元10处的测量对应于第一测量。

利用自然状态传输属性测量单元20，对自然状态传输属性的测量在与利用HRTF测量单元10相同的环境下被执行。就是说，根据该示例，传输属性是在自然状态下测量的，其中在听众位置上既没有真人也没有假人头，即，在测量源位置和测量点位置之间不存在障碍物。

具体而言，利用自然状态传输属性测量单元20，根据HRTF测量单元10布置在消声室中的假人头或真人被移走，在作为感知声源位置的扬声器和麦克风之间不存在障碍物的自然状态被创建，并且通过将作为感知声源位置的扬声器和麦克风布置得与利用HRTF测量单元10的状态完全相同，在此状态下，测量声波(在本示例中为冲激脉冲)通过感知声源位置的扬声器被再现，并且冲激响应被两个麦克风所拾取。

利用自然状态传输属性测量单元20从两个麦克风获得的冲激响应代表不具有障碍物(例如假人头或真人)情况下的自然状态传输属性。

注意，利用HRTF测量单元10和自然状态传输属性测量单元20，从两个麦克风中的每一个获得了针对左右主要分量的上述HRTF和自然状态传输属性以及针对左右串话分量的HRTF和自然状态传输属性。下述归一化处理针对主要分量和左右串话分量中的每一个被执行。在以下描述中，为了便于描述，将只描述关于例如主要分量的归一化处理，关于串话分量的归一化处理的描述将省略。当然，关于串话分量的归一化处理也是以相同方式来执行的。

根据该示例，利用HRTF测量单元10和自然状态传输属性测量单元20所获得的冲激响应是在96kHz的采样频率上具有8192个样本的数字数据的输出。

现在，从HRTF测量单元10获得的HRTF数据被表示为X(m)，其中m＝0，1，2，...M-1(M＝8192)，从自然状态传输属性测量单元20获得的自然状态传输属性的数据被表示为Xref(m)，其中m＝0，1，2，...M-1(M＝8192)。

来自HRTF测量单元10的HRTF数据X(m)和来自自然状态传输属性测量单元20的自然状态传输属性数据Xref(m)被延迟删除上移单元31和32删除掉从在扬声器处开始再现冲激脉冲的时间点开始头部部分的数据，等同于声波从在感知声源位置处的扬声器到用于获得冲激响应的麦克风的到达时间的延迟时间量，并且同样在延迟删除上移单元31和32处，数据值被减小到2的幂的数据值，从而使得可以在下一下行流执行从时间轴数据到频率轴数据的正交变换。

接下来，数据值已经在延迟删除上移单元31和32处被减小的HRTF数据X(m)和自然状态传输属性数据Xref(m)被分别提供到FFT(快速傅立叶变换)单元33和34，并从时间轴数据变换成频率轴数据。注意，根据本实施例，FFT单元33和34执行复快速傅立叶变换(复FFT)，其将相位考虑在内。

由于在FFT单元33处的复FFT处理，HRTF数据X(m)被转换成FFT数据，该FFT数据由实部R(m)和虚部jI(m)构成，即R(m)+jI(m)。

而且，由于在FFT单元34处的复FFT处理，自然状态传输属性数据Xref(m)被转换成FFT数据，该FFT数据由实部Rref(m)和虚部jIref(m)构成，即Rref(m)+jIref(m)。

从FFT单元33和34获得的FFT数据是X-Y坐标数据，根据本实施例，进一步地，极坐标转换单元35和36被用于将FFT数据转换成极坐标数据。就是说，HRTF FFT数据R(m)+jI(m)被极坐标转换单元35转换成作为大小分量的半径γ(m)和作为角度分量的幅度θ(m)。作为极坐标数据的半径γ(m)和幅度θ(m)被发送到归一化和X-Y坐标转换单元37。

而且，自然状态传输属性FFT数据Rref(m)+jIref(m)被极坐标转换单元36转换成半径γref(m)和幅度θref(m)。作为极坐标数据的半径γref(m)和幅度θref(m)被发送到归一化和X-Y坐标转换单元37。

在归一化和X-Y坐标转换单元37处，首先，所测量的包括假人头或真人的HRTF利用自然状态传输属性被归一化，其中不存在诸如假人头之类的障碍物。归一化处理的具体计算如下所述。

以归一化后的半径为γn(m)并以归一化后的幅度为θn(m)，得到：

γn(m)＝γ(m)/γref(m)

θn(m)＝θ(m)/θref(m) (等式1)

随后，在归一化和X-Y坐标转换单元37处，归一化处理后的极坐标系数据半径γn(m)和幅度θn(m)被转换成X-Y坐标系的实部为Rn(m)并且虚部为jIn(m)(m＝0，1，...M/4-1)的频率轴数据的归一化HRTF数据。

X-Y坐标系的频率轴数据的归一化HRTF数据在反向FFT单元38处被变换成冲激响应Xn(m)，该冲激响应Xn(m)是时间轴的归一化HRTF数据。反向FFT单元38执行复反向快速傅立叶变换(复反向FFT)。

就是说，在反向FFT(IFFT(反向快速傅立叶变换))单元38处执行计算：Xn(m)＝IFFT(Rn(m)+jIn(m))(其中m＝0，1，...M/2-1)，从而获得冲激响应Xn(m)，该冲激响应Xn(m)是时间轴的归一化HRTF数据。

来自反向FFT单元38的归一化HRTF数据Xn(m)在IR(冲激响应)简化单元39处被简化为冲激脉冲属性抽头(tap)长度，该冲激脉冲属性抽头长度可以被处理(可以被卷积，随后将描述)。根据本实施例，这被简化为600个抽头(从来自反向FFT单元38的数据的头部起600条数据)。

在IR简化单元39处简化得到的归一化HRTF数据Xn(m)(m＝0，1，...599)被写入归一化HRTF存储器40，以用于随后将描述的卷积处理。注意，如前所述，在每个感知声源位置(虚拟声音图像定位位置)上，写入该归一化HRTF存储器40的归一化HRTF包括作为主要分量的归一化HRTF和作为串话函数的归一化HRTF。

以上描述关于如下处理：在用于再现作为测量声波的示例的冲激脉冲的扬声器位于一个感知声源位置上而该感知声源位置与作为测量点位置的麦克风位置相距一预定距离的情况下，在相对于听众位置的一个特定方向上获得关于扬声器位置的归一化HRTF。

根据本实施例，感知声源位置是用于再现作为测量声波的示例的冲激脉冲的扬声器所位于的位置，该感知声源位置相对于测量点位置在不同方向上任意改变，从而针对每个感知声源位置获得一个归一化HRTF。

就是说，根据本实施例，不仅获得关于直接波的HRTF，还获得关于来自虚拟声音图像定位位置的反射波的HRTF，因此，虚拟声源位置被设置为反射波到测量点位置的入射方向上的多个位置，从而获取其归一化HRTF。

现在，作为扬声器布置位置的感知声源位置在水平面内在以作为测量位置的麦克风位置或听众为中心的360度或180度的角度范围内例如以一次改变10度的增量(这是一种用于考虑到将获得的反射波方向的情况的分辨率)发生变化，以获得关于来自听众两侧的墙的反射波的归一化HRTF。

类似地，作为扬声器布置位置的感知声源位置在垂直面内在以作为测量位置的麦克风位置或听众为中心的360度或180度的角度范围内例如以一次改变10度的增量(这是一种用于考虑到将获得的反射波方向的情况的分辨率)发生变化，以获得关于来自天花板或地板的反射波的归一化HRTF。

考虑到360度的角度范围的情况是在听众后面存在充当直接波的虚拟声音图像定位位置的情况，例如，假设再现诸如5.1声道、6.1声道、7.1声道等多声道环绕声音音频的情况，并且还是考虑到来自听众后面的墙的反射波的情况。考虑到180度的角度范围的情况是假设虚拟声音图像定位位置仅在听众前方的情况，或不存在来自听众后面的墙的反射波的状态。

而且，根据本实施例，在HRTF测量单元10和20处对HRTF和自然状态传输属性的测量方法中，麦克风所在的位置是根据向听众实际提供再现声音的声音再现驱动器(例如耳机的驱动器)的位置而改变的。

图2A和2B是在充当用于向听众实际提供再现声音的电-声转换单元的声音再现单元是内置耳机的情况下，用于描述充当测量点位置的麦克风布置位置以及HRTF和自然状态传输属性测量位置(感知声源位置)的图。

具体而言，图2A示出HRTF测量单元10的测量状态，其中用于向听众提供再现声音的声音再现单元是内置耳机，假人头或真人OB位于听众位置上，而用于在感知声源位置上再现冲激脉冲的扬声器位于测量HRTF的方向上的预定位置上，在该示例中，所述感知声源位置以10度间隔开并以位于内置耳机的两个驱动器位置的中心位置或听众位置为中心，如圆点P1、P2、P3...所示。

而且，根据该内置耳机的情况，两个麦克风ML和MR位于假人头或真人耳朵的听囊(auditory capsule)位置内的位置上，如图2A所示。

图2B示出测量环境状态，其中图2A中的假人头或真人OB已被移走，从而示出自然状态传输属性测量单元20的测量状态，其中用于向听众提供再现声音的声音再现单元是内置耳机。

上述归一化处理是通过如下方式来执行的：分别利用在由圆点P1、P2、P3...所指示的感知声源位置上测量出的自然状态传输属性(如图2B所示)对在同样由圆点P1、P2、P3...所指示的感知声源位置上测量出的HRTF(如图2A所示)进行归一化。例如，在感知声源位置P1上测量出的HRTF利用在同一感知声源位置P1上测量出的自然状态传输属性来归一化。

接下来，图3是用于描述在用于向听众提供再现声音的声音再现单元是头戴耳机的情况下，在测量HRTF和自然状态传输属性时感知声源位置和麦克风布置位置的图。利用图3中示例的头戴耳机，为双耳分别提供一个耳机驱动器。

更具体而言，图3示出HRTF测量单元10的测量状态，其中用于向听众提供再现声音的声音再现单元是头戴耳机，假人头或真人OB位于听众位置上，而用于在感知声源位置上再现冲激脉冲的扬声器位于测量HRTF的方向上的感知声源位置上，在该示例中，所述感知声源位置以10度间隔开并以位于头戴耳机的两个驱动器位置的中心位置或听众位置为中心，如圆点P1、P2、P3...所示。而且，两个麦克风ML和MR位于面向假人头或真人的耳朵的耳囊的耳朵附近的位置上，如图3所示。

在声音再现单元是头戴耳机的情况下，自然状态传输属性测量单元20处的测量状态是图3中的假人头或真人OB已被移走的测量环境。同样在此情况下，不用说，HRTF和自然状态传输属性的测量以及归一化处理是以与图2A和2B相同的方式来执行的。

接下来，图4是用于描述在充当用于向听众提供再现声音的声音再现单元的电-声转换单元(例如扬声器)被布置在例如听众就座的椅子的靠头部分中的情况下，在测量HRTF和自然状态传输属性时感知声源位置和麦克风布置位置的图。利用图4的示例，HRTF和自然状态传输属性是在两个扬声器被布置在听众头部后面的左右两侧的情况下被测量的，并且声音再现被执行。

更具体而言，图4示出HRTF测量单元10的测量状态，其中用于向听众提供再现声音的声音再现单元是位于椅子的靠头部分中的扬声器，假人头或真人OB位于听众位置上，而用于在感知声源位置上再现冲激脉冲的扬声器位于测量HRTF的方向上的感知声源位置上，在该示例中，所述感知声源位置以10度间隔开并以听众位置或位于椅子的靠头部分中的两个扬声器的中心位置为中心，如圆点P1、P2、P3...所示。

而且，如图4所示，两个麦克风ML和MR位于假人头或真人头部后面并且在听众耳朵附近的位置上，这等同于附接到椅子的靠头部分中的两个扬声器的布置位置。

在声音再现单元是附接到椅子的靠头部分中的电-声转换驱动器的情况下，在自然状态传输属性测量单元20处的测量状态是图4中的假人头或真人OB已被移走的测量环境。同样在此情况下，不用说，HRTF和自然状态传输属性的测量以及归一化处理是以与图2A和2B相同的方式来执行的。

接下来，图5是用于描述在用于向听众提供再现声音的声音再现单元是具有七个耳机驱动器单元的头戴耳机的情况下，在测量HRTF和自然状态传输属性时感知声源位置和麦克风安装位置的图，其中七个耳机驱动器单元中的每一个是相对于每只耳朵来布置的，作为用于7.1声道多环绕的头戴耳机。利用图5的示例，七个麦克风ML1、ML2、ML3、ML4、ML5、ML6和ML7以及七个麦克风MR1、MR2、MR3、MR4、MR5、MR6和MR7分别面向听众的左耳和右耳被布置在用于左耳的相应七个耳机驱动器中以及用于右耳的相应七个耳机驱动器中。

随后，以与前述情况相同的方式，用于再现冲激脉冲的扬声器被布置在测量HRTF所需的方向上的感知声源位置上，例如每个扬声器相隔10度并且以七个麦克风的中心位置或听众位置为中心，例如如圆圈P1、P2、P3...所示。

随后，利用在每个感知声源位置上的扬声器再现的充当用于测量的声波的冲激脉冲分别在麦克风ML1到ML7和MR1到MR7中的每一个处被声音收集。随后，当在听众位置上存在假人头或真人的状态下，从麦克风ML1到ML7和MR1到MR7的每个输出音频信号中获得HRTF。而且，在既不存在假人头也不存在真人的自然状态下，从麦克风ML1到ML7和MR1到MR7的每个输出音频信号中获得自然状态传输属性。随后，如上所述，从HRTF和自然状态传输属性中获得每个归一化HRTF，并将其存储在归一化HRTF存储器40中。

在图5中的示例的情况下，将被卷积到每个麦克风提供到相应耳机驱动器单元的音频信号中的归一化HRTF是当在每个感知声源方向位置上定位虚拟声音图像时从麦克风ML1到ML7和MR1到MR7的输出音频信号中的每一个获得的。

如上所述，来自虚拟声源位置的冲激响应在消声室中被测量，例如，如图2A到图5所示，虚拟声源位置相互间隔10度，并且以听众头部的中心位置或用于在再现时向听众提供音频的电-声转换单元的中心位置为中心，从而使得可以获得仅关于来自各个虚拟声音图像定位位置的直接波(其中已经消除了反射波)的HRTF。

所获得的归一化HRTF通过归一化处理消除了生成冲激脉冲的扬声器的属性以及拾取冲激脉冲的麦克风的属性。

此外，所获得的归一化HRTF已经去除了与生成冲激脉冲的扬声器的位置(感知声源位置)与用于拾取冲激脉冲的麦克风的位置(假设的驱动器位置)之间的距离相对应的延迟，因此它与生成冲激脉冲的扬声器的位置(感知声源位置)与用于拾取冲激脉冲的麦克风的位置(假设的驱动器位置)之间的距离无关。就是说，所获得的归一化HRTF是仅与从用于拾取冲激脉冲的麦克风的位置(假设的驱动器位置)看生成冲激脉冲的扬声器(感知声源位置)的方向相对应的HRTF。

因此，在将归一化HRTF卷积到音频信号中时，向音频信号提供与虚拟声源位置和假设的驱动器位置之间的距离相对应的延迟能够实现具有距离位置的声音再现，所述距离位置对应于在感知声源位置相对于假设的驱动器位置(作为虚拟声音图像定位位置)的方向上的延迟。利用来自感知声源位置方向的反射波，这可以通过提供具有延迟的音频信号来实现，所述延迟对应于声波的如下路径长度：从所期望的虚拟声音图像定位位置开始，经诸如墙之类的反射部分反射，并从感知声源位置输入到假设的驱动器位置。

就是说，在将关于直接波和反射波的归一化HRTF卷积到音频信号中的情况下，音频信号经历延迟，该延迟对应于要被输入的声波从所期望的虚拟声音图像定位位置到感知驱动器位置的路径长度。

注意，在用于描述HRTF测量方法的实施例的图1中的框图中的信号处理可以都由一个DSP(数字信号处理器)来执行。在此情况下，HRTF测量单元10和自然状态传输属性测量单元20的HRTF数据X(m)和自然状态传输属性数据Xref(m)的获取单元、延迟删除上移单元31和32、FFT单元33和34、极坐标转换单元35和36、归一化和X-Y坐标转换单元37、反向FFT单元38和IR简化单元39可以分别被配置为一个DSP，或者全部信号处理可以被配置为单个或多个DSP。

注意，利用上述图1中的示例，HRTF和自然状态传输属性的数据在延迟删除上移单元31和32处被从中删除了延迟时间量的头部数据，所述延迟时间量对应于感知声源位置和麦克风位置之间的距离，以便减小关于随后将描述的HRTF的卷积的处理量，从而经过上述删除后的数据被上移到头部，并且该数据删除处理是利用例如DSP中的存储器来执行的。但是，在没有执行该延迟删除上移的情况下，DSP可以执行原始数据的处理，所述原始数据具有未经改变的8192个数据样本。

而且，IR简化单元39是用于在随后将描述的HRTF的卷积处理时减小卷积处理量的，并因此可以被省略。

此外，在上述实施例中，来自FFT单元33和34的X-Y坐标系的频率轴数据被转换成极坐标系的频率数据的原因在于考虑到归一化处理不工作在X-Y坐标系的频率数据的状态下，因此利用理想配置，归一化处理可以照原样利用X-Y坐标系的频率数据来执行。

注意，利用上述示例，所获得的归一化HRTF是关于大量感知声源位置、假设的各种虚拟声音图像定位位置以及反射波的入射方向的感知驱动器位置的。这样获得关于多个感知声源位置的归一化HRTF的原因是为了使得能够随后从中选择所使用的感知声源位置的方向上的HRTF。但是，不用说，在虚拟声源定位位置预先固定并且反射波的入射方向预先确定的情况下，可以获得关于固定的虚拟声音图像定位位置和在反射波的入射方向上的感知声源位置的归一化HRTF。

现在，在上述实施例中，虽然为了测量仅关于来自多个感知声源位置的直接波的HRTF和自然状态传输属性而在消声室中执行测量，但是如果反射波相对于直接波被极大地延迟，那么通过向直接波分量应用时间窗，则即使在不同于消声室的具有反射波的房间中也可以提取出直接波分量。

而且，通过使用TSP(时间伸展脉冲)信号取代用于测量由感知声源位置处的扬声器所发射的声波的HRTF的冲激脉冲，可以消除反射波，并且即使不在消声室中也可以单独测量关于直接波的HRTF和自然状态传输属性。

采用归一化HRTF的优点确认

图6A和6B示出包括实际用于HRTF测量的扬声器和麦克风的测量系统的属性。图6A示出当在没有插入诸如假人头或真人之类的障碍物的状态下由扬声器以相同的恒定电平再现从0到20kHz的频率信号的声音并利用麦克风进行拾取时来自麦克风的输出信号的频率属性。

这里使用的扬声器是工业用扬声器，其具有非常好的属性，但是即使显示出如图6A所示的属性，也无法获得平坦的频率属性。实际上，图6A所示的属性被认为是极好的属性，属于相当平坦的一类一般扬声器。

根据现有技术，扬声器和麦克风的属性被添加到HRTF并未被删除，因此通过卷积HRTF所获得的声音的属性和声音质量受扬声器和麦克风的属性所影响。

图6B示出在诸如假人头或真人之类的障碍物在相同条件下被插入的状态下来自麦克风的输出信号的频率属性。可以看出，在1200Hz和10kHz附近存在极大凹陷，从而示出频率属性发生极大改变。

图7A是示出图6A的频率属性和图6B的频率属性相重叠的频率属性图。另一方面，图7B示出根据上述实施例的归一化HRTF属性。从图7B可以看出，利用归一化HRTF属性增益不会下降，即使在低频带也是如此。

利用上述根据本发明的实施例，复FFT处理被执行，并且在考虑到相位分量的情况下使用归一化HRTF，因此，与使用仅利用幅度分量归一化的HRTF的情况相比，归一化的HRTF的保真度更高。

图8中示出了在不考虑相位的情况下单独归一化幅度的处理被执行的布置，并且最后保留的冲激脉冲属性再次经过FFT以获得属性。通过比较图8和图7B(该图是根据本实施例的归一化HRTF的属性)可以理解，利用图7B所示的复FFT正确地获得HRTF X(m)和自然状态传输属性Xref(m)之间的属性差异，但是在不考虑相位的情况下，将偏离其应该具有的属性差异，如图8所示。

而且，在上述图1的处理程序中，IR简化单元39在最后执行归一化HRTF的简化，因此与从最开始就减少数据数目的情况相比，属性的偏离减少。

就是说，在执行简化以减少最初利用HRTF测量单元10和自然状态传输属性测量单元20获得的数据的数据数目的情况下(执行归一化，将在最后使用的多个冲激脉冲之后的部分设为0的情况)，归一化HRTF的属性如图9所示，其中在低频带属性中有特定偏离。另一方面，利用上述实施例的配置所获得的归一化HRTF的属性如图7B所示，其中即使在低频带属性中偏离也很小。

HRTF卷积方法的描述

图10示出充当由根据现有技术的测量方法获得的HRTF的示例的冲激响应，该冲激响应是既包括直接波也包括所有反射波分量的完整响应。迄今为止，如图10所示，既包括直接波也包括所有反射波的完整冲激响应的整体在一个卷积过程部分中被卷积到音频信号中。

反射波包括高阶反射波，还包括从虚拟声音图像定位位置到测量点位置的路径长度很长的反射波，因此，根据现有技术的卷积过程部分成为相对较长的部分，例如如图10所示。注意，在卷积过程部分中的上部DL0指示与直接波从虚拟声音图像定位位置到测量点位置所花费的时间相等的延迟。

与根据现有技术的HRTF卷积方法(例如图10)相比，根据本实施例，如上所述所获得的直接波的归一化HRTF和所选择的归一化HRTF被卷积到音频信号中。

基本上，根据本实施例，当确定虚拟声音图像定位位置时，虚拟声音图像定位位置和测量点位置(声音再现驱动器安装位置)之间的直接波的归一化HRTF被卷积到音频信号中。但是，注意，关于针对反射波的归一化HRTF，只有根据感知收听环境、房间配置等所选择的HRTF被卷积到音频信号中。

例如，在感知收听环境(例如上述大平原)的情况下，只有反射波中从虚拟声音图像定位位置到地表(地面)的反射波被选出，并且在相关反射波被输入到测量点位置的方向上所获得的归一化HRTF被卷积到音频信号中。而且，例如，在常见的矩形平行六面体形的房间的情况下，来自天花板、地板、听众左右两侧墙壁以及听众前后两侧墙壁的所有反射波被选择，在这些反射波被输入到测量点位置的方向上获得的归一化HRTF被卷积。

而且，在后者房间的情况下，引起第二反射、第三反射等等以及主要反射作为反射波，但是例如，主要反射单独被选择。根据实验，即使利用关于主要反射的归一化HRTF被卷积到其中的音频信号，其音频信号也可以在被声音再现，从而获得极好的虚拟声音图像定位感觉。注意，如果关于第二反射波以及随后的反射波的归一化HRTF被卷积到音频信号中，那么当其音频信号被声音再现时，在某些情况下将获得更好的虚拟声音图像定位感觉。

关于直接波的归一化HRTF基本上在不改变其增益的情况下被卷积到音频信号中，但是关于反射波，归一化HRTF以对应于反射波是主要反射还是第二反射还是更高阶反射的增益而被卷积到音频信号中。这是因为根据本实施例所获得的归一化HRTF分别是关于来自设置在预定方向上的感知声源位置的直接波而测量的，并且关于在相关预定方向上的反射波的归一化HRTF相对于直接波被衰减量。注意，反射波的阶数越高，关于该反射波的归一化HRTF的相对于直接波的衰减量量就越大。

而且，如上所述，关于反射波的HRTF，本实施例使得增益进一步考虑到与感知反射部分的表面形状、表面配置、材料等相对应的声音吸收程度(声波的衰减率)而被设置。

如上所述，根据本实施例，用于卷积HRTF的反射波被选择，并且每个反射波的HRTF的增益被调整，从而HRTF关于音频信号的卷积可以根据任意的感知房间环境和收听环境来执行。就是说，与现有技术一样，无需利用提供极好声音场的房间或空间来测量HRTF，而是利用被感知来提供极好声音场空间的房间或空间得到的HRTF就可以被卷积到音频信号中。

卷积方法的第一示例(图11和12)

根据本实施例，如上所述，针对直接波的归一化HRTF(直接波方向HRTF)和针对每个反射波的归一化HRTF(反射波方向HRTF)是独立获得的，因此，根据第一示例，针对直接波和每个反射波的HRTF被独立卷积到音频信号中。

例如，将描述以下情况：三个反射波(反射波方向)以及一个直接波(直接波方向)被选择，对应于其两者的归一化HRTF(直接波方向HRTF和反射波方向HRTF)被卷积。

与从虚拟声音图像定位位置到测量点位置之间的路径长度相对应的延迟时间是针对每个直接波和反射波预先获得的。如果测量点位置(声音再现驱动器位置)和虚拟声音图像定位位置被确定并且反射部分被确定，则通过计算而获得该延迟时间。随后，关于反射波，关于归一化HRTF的衰减量量(增益)也是预先确定的。

图11示出关于直接波和三个反射波的延迟时间、增益以及进一步的卷积处理部分的示例。利用图11的示例，关于直接波的归一化HRTF(直接波方向HRTF)，对于音频信号，与直接波从虚拟声音图像定位位置到测量点位置所花费的时间相等的延迟DL0被考虑到。就是说，直接波的归一化HRTF的卷积开始点变为时间点t0，该时间点t0是通过将音频信号延迟上述延DL0而获得的，例如图11底部所示。

随后，按上述方式获得的关于相关直接波的方向的归一化HRTF在卷积过程部分CP0处被卷积到音频信号中，所述卷积过程部分CP0的数据长度是从上述时间点t0开始相关的归一化HRTF的长度(在以上示例中是600段数据)。

接下来，在三个反射波中，关于第一反射波1的归一化HRTF(反射波方向HRTF)，对于音频信号，与第一反射波从虚拟声音图像定位位置到测量点位置的路径长度相对应的延迟DL1被考虑到。就是说，第一反射波1的归一化HRTF的卷积开始点变为时间点t1，该时间点t1是通过将音频信号延迟延迟DL1而获得的，例如图11底部所示。

随后，按上述方式获得的关于第一反射波1的方向的归一化HRTF(反射波方向HRTF)在卷积过程部分CP1处被卷积到音频信号中，所述卷积过程部分CP1的数据长度是从上述时间点t1开始相关的归一化HRTF的长度(在以上示例中是600段数据)。在该卷积处理时，上述归一化HRTF考虑到第一反射波1的阶数以及在反射部分处的声音吸收程度(或反射程度)而被乘以增益G1(G1<1)。

而且，类似地，关于第二反射波2和第三反射波3的归一化HRTF(反射波方向HRTF)，对于音频信号，与第二反射波和第三反射波从虚拟声音图像定位位置到测量点位置的路径长度相对应的延迟DL2和DL3被考虑到。就是说，如图11底部所示，第二反射波2的归一化HRTF的卷积开始点变为时间点t2，而第三反射波3的归一化HRTF的卷积开始点变为时间点t3，所述时间点t2是通过将音频信号延迟延迟DL2而获得的，所述时间点t3是通过将音频信号延迟延迟DL3而获得的。

随后，按上述方式获得的关于第二反射波2的方向的归一化HRTF(反射波方向HRTF)在卷积过程部分CP2处被卷积到音频信号中，所述卷积过程部分CP2的数据长度是从上述时间点t2开始相关的归一化HRTF的长度(在以上示例中是600段数据)，并且按上述方式获得的关于第三反射波3的方向的归一化HRTF(反射波方向HRTF)在卷积过程部分CP3处被卷积到音频信号中，所述卷积过程部分CP3的数据长度是从上述时间点t3开始相关的归一化HRTF的长度(在以上示例中是600段数据)。

在该卷积处理时，上述归一化HRTF考虑到第二反射波2和第三反射波3中的每一个的阶数以及在反射部分处的声音吸收程度(或反射程度)而被乘以增益G2和G3(G2<1且G3<1)。

图12示出被配置用于执行上述图11中的示例的卷积处理的归一化HRTF卷积单元的硬件配置示例。

图12的示例被配置为具有用于直接波的卷积处理单元51、用于第一到第三反射波1、2和3的卷积处理单元52、53和54以及加法器55。卷积处理单元51到54中的每一个具有完全相同的配置。根据该示例，卷积处理单元51到54被配置为分别具有延迟单元511、521、531和541、HRTF卷积电路512、522、532和542、归一化HRTF存储器513、523、533和543、增益调整单元514、524、534和544以及增益存储器515、525、535和545。

根据该示例，HRTF应该被卷积到的输入音频信号Si被提供到延迟单元511、521、531和541中的每一个。延迟单元511、521、531和541分别将HRTF应该被卷积到的输入音频信号Si延迟到针对直接波和第一到第三反射波的归一化HRTF的卷积开始时间点t0、t1、t2和t3。因此，根据该示例，如图所示，延迟单元511、521、531和541的延迟量被分别确定为DL0、DL1、DL2和DL3。

HRTF卷积电路512、522、532和542中的每一个是用于执行将归一化HRTF卷积到音频信号中的处理的部分，并且根据该示例，被配置为包括具有600个抽头(tap)的IIR(无限冲激响应)滤波器或FIR(有限冲激响应)滤波器。

归一化HRTF存储器513、523、533和543用于存储和保存将在HRTF卷积电路512、522、532和542中的每一个处被卷积的归一化HRTF。归一化HRTF存储器513存储和保存关于直接波的方向的归一化HRTF，归一化HRTF存储器523存储和保存关于第一反射波的方向的归一化HRTF，归一化HRTF存储器533存储和保存关于第二反射波的方向的归一化HRTF，并且归一化HRTF存储器543存储和保存关于第三反射波的方向的归一化HRTF。

所存储和保存的关于直接波的方向的归一化HRTF、所存储和保存的关于第一反射波的方向的归一化HRTF、所存储和保存的关于第二反射波的方向的归一化HRTF以及所存储和保存的关于第三反射波的方向的归一化HRTF例如是从上述归一化HRTF存储器41选择和读出的，并被分别写入到归一化HRTF存储器513、523、533和543中。

增益调整单元514、524、534和544用于调整将被卷积的归一化HRTF的增益。增益调整单元514、524、534和544将来自归一化HRTF存储器513、523、533和543的归一化HRTF乘以存储在增益存储器515、525、535和545中的增益值(<1)，并将乘法结果分别提供到HRTF卷积电路512、522、532和542。

根据该示例，关于直接波的增益值G0(≤1)被存储在增益存储器515中，关于第一反射波的增益值G1(<1)被存储在增益存储器525中，关于第二反射波的增益值G2(<1)被存储在增益存储器535中，并且关于第三反射波的增益值G3(<1)被存储在增益存储器545中。

加法器55相加并且合成来自用于直接波的卷积处理单元51以及用于第一到第三反射波的卷积处理单元52、53和54的归一化HRTF已经被卷积到的音频信号，并输出输出音频信号So。

利用该配置，HRTF应该被卷积到的输入音频信号Si被提供到每个延迟单元511、521、531和541，并且各个输入音频信号Si被延迟到针对直接波和第一到第三反射波的归一化HRTF的卷积开始时间点t0、t1、t2和t3。在延迟单元511、521、531和541处被延迟到HRTF的卷积开始时间点t0、t1、t2和t3的输入音频信号Si被提供到HRTF卷积电路512、522、532和542。

另一方面，所存储和保存的归一化HRTF数据从每个卷积开始时间点t0、t1、t2和t3开始被从每个归一化HRTF存储器513、523、533和543顺序读出。对来自每个归一化HRTF存储器513、523、533和543的归一化HRTF数据的读出定时控制这里将省略。

读出的归一化HRTF数据在每个增益调整单元514、524、534和544处通过乘以来自增益存储器515、525、535和545的增益G0、G1、G2和G3而进行增益调整，然后被提供到每个HRTF卷积电路512、522、532和542。

利用每个HRTF卷积电路512、522、532和542，经过增益调整的归一化HRTF数据在图11所示的卷积过程部分CP0、CP1、CP2和CP3处被进行卷积处理。随后，在每个HRTF卷积电路512、522、532和542处的卷积处理结果在加法器55处被相加，并且加法结果被输出，作为输出音频信号So。

在第一示例的情况下，关于直接波和多个反射波的归一化HRTF中的每一个都可被独立卷积到音频信号中，因此在延迟单元511、521、531和541处的延迟量和存储在增益存储器515、525、535和545中增益被调整，进而，存储在归一化HRTF存储器513、523、533和543中并被卷积的归一化HRTF发生改变，从而可以根据收听环境的差异来容易地执行HRTF的卷积，所述收听环境的差异例如是诸如室内、室外等收听环境空间类型的差异、房间的形状和大小的差异以及反射部分的材料(声音吸收程度和反射程度)等等。

在延迟单元511、521、531和541被配置为具有能够根据外部操作输入(例如操作者等)来改变延迟量的可变延迟单元的情况下，用于将操作者从归一化HRTF存储器40选择的任意归一化HRTF写入到归一化HRTF存储器513、523、533和543中的单元、以及用于允许操作者在增益存储器515、525、535和545中输入和存储任意增益的单元被提供，HRTF的卷积可以根据收听环境(例如操作者任意设置的收听环境空间、房间环境等等)来执行。

例如，在具有完全相同的房间形状的收听环境中，增益可以根据墙壁的材料(声音吸收程度和反射程度)而容易地改变，并且虚拟声音图像定位位置可以根据墙壁的材料发生各种改变的状况而被仿真。

注意，根据图11中的示例的布置，不是分别提供与用于直接波的卷积处理单元51和用于第一到第三反射波的卷积处理单元52、53和54相关的归一化HRTF存储器513、523、533和543，而是可以采取以下布置：提供归一化HRTF存储器40，该存储器被卷积处理单元51到54所共用，并且在每个卷积处理单元51到54中提供被配置用于从归一化HRTF存储器40有选择地读出被每个卷积处理单元51到54所使用的HRTF的单元。

注意，上述第一示例是关于以下情况的描述：除了直接波之外，三个反射波也被选择，并且这些归一化HRTF都被卷积到音频信号中，但是在存在三个或更多个将被选择的关于反射波的归一化HRTF的情况下，利用图12中的配置，适当地提供与卷积处理单元52、53和54相同的卷积处理单元用于反射波，这些归一化HRTF的卷积可以按完全相同的方式执行。

注意，根据图11的示例，进行如下布置：延迟单元511、521、531和541分别将输入信号Si延迟到卷积开始时间点，因此各个延迟量被设置为DL0、DL1、DL2和DL3。但是，如果进行如下布置：延迟单元511的输出端被连接到延迟单元521的输入端，延迟单元521的输出端被连接到延迟单元531的输入端，并且延迟单元531的输出端被连接到延迟单元541的输入端，从而在延迟单元521、531和541处的延迟量可以被设置为DL1-DL0、DL2-DL1和DL3-DL2，并因此可以减小。

而且，在卷积过程部分CP0、CP1、CP2和CP3没有相互重叠的情况下，延迟电路和卷积电路可以被串行连接，同时考虑到卷积过程部分CP0、CP1、CP2和CP3的时间长度。在此情况下，如果我们说卷积过程部分CP0、CP1、CP2和CP3的时间长度为TP0、TP1、TP2和TP3，则在延迟单元521、532和542处的延迟量可以被设置为DL1-DL0-TP0、DL2-DL1-TP1和DL3-DL2-TP2，并因此可以进一步减小。

卷积方法的第二示例(系数合成处理，图13和14)

该第二示例是在关于预定收听环境的HRTF被卷积的情况下采用的。就是说，在收听环境(例如收听环境空间的类型、房间的形状和大小、反射部分的材料(声音吸收程度和反射程度)等)被预先确定的情况下，关于直接波和所选反射波的归一化HRTF的卷积开始时间点被预先确定，并且在卷积每个归一化HRTF时的衰减量量(增益)也被预先确定。

例如，关于直接波和三个反射波的HRTF被看作示例，如图13所示，针对直接波和第一到第三反射波的归一化HRTF的卷积开始时间点分别变为上述开始时间点t0、t1、t2和t3，并且关于音频信号的延迟量分别变为DL0、DL1、DL2和DL3。随后，在卷积关于直接波和第一到第三反射波的归一化HRTF时的增益可以分别确定为G0、G1、G2和G3。

因此，根据第二示例，如图13所示，这些归一化HRTF以面向时间的方式被合成以生成合成归一化HRTF，并且卷积过程部分被设置为多个归一化HRTF被卷积到音频信号的处理完成之前的时段。

这里，如图13所示，各个归一化HRTF的顺序卷积部分为CP0、CP1、CP2和CP3，并且除了卷积部分CP0、CP1、CP2和CP3之外，在其他部分中不存在HRTF数据，因此，在这些部分中，数据0被用作HRTF。

在第二示例的情况下，归一化HRTF卷积单元的硬件配置示例如图14所示。具体而言，根据第二示例，HRTF应该被卷积到的输入音频信号Si在关于直接波的HRTF延迟单元61处被延迟关于直接波的预定延迟量，然后被提供到HRTF卷积电路62。

来自合成归一化HRTF存储器63的合成归一化HRTF被提供到HRTF卷积电路62，并被卷积到音频信号中。存储在合成归一化HRTF存储器63中的合成归一化HRTF是参考图13所描述的合成归一化HRTF。

第二示例即使在改变延迟量、增益等的情况下也会涉及所有合成归一化HRTF的重写，但是如图14所示，其包括可以简化用于卷积HRTF的电路的硬件配置的优点。

卷积方法的其他示例

根据上述第一和第二示例，关于预先测量的相应方向的归一化HRTF在关于直接波和所选反射波的每个卷积过程部分CP0、CP1、CP2和CP3处被卷积到音频信号中。

但是，注意，关于所选反射波的HRTF的卷积开始时间点和卷积过程部分CP1、CP2和CP3具有重要性，因此，将被卷积的信号实际上可能不是相应的HRTF。

具体而言，例如，根据上述第一和第二示例，在针对直接波的卷积过程部分CP0处，关于直接波的归一化HRTF(直接波方向HRTF)被卷积，但是在针对反射波的卷积过程部分CP1、CP2和CP3处，通过将与卷积过程部分CP0相同的直接波方向HRTF乘以所采用的增益G1、G2和G3而被衰减的HRTF可以分别按简化方式被卷积。

具体而言，在第一示例的情况下，与在归一化HRTF存储器513中的HRTF相同的关于直接波的归一化HRTF被预先存储在归一化HRTF存储器523、533和543中。可替换地，可以进行如下布置：归一化HRTF存储器523、533和543被省略，只提供归一化HRTF存储器513，针对直接波的归一化HRTF被从相关的归一化HRTF存储器513读出，以在每个卷积过程部分CP1、CP2和CP3处将其提供到相关的增益调整单元524、534和544以及增益调整单元514。

此外，类似地，根据上述第一和第二示例，在针对直接波的卷积过程部分CP0处，关于直接波的归一化HRTF(直接波方向HRTF)被卷积，但是在针对反射波的卷积过程部分CP1、CP2和CP3处，通过将充当卷积目标的音频信号延迟相应的延迟量DL1、DL2和DL3而获得的音频信号可以分别按简化方式被卷积。具体而言，可以提供保存单元，其被配置用于保存充当卷积目标的音频信号，所述音频信号被分别延迟上述延迟量DL1、DL2和DL3，并且保存在保存单元处的音频信号在针对反射波的卷积过程部分CP1、CP2和CP3处被卷积。

采用HRTF卷积方法的声音再现系统的示例(图16到18)

接下来，根据本发明实施例的HRTF卷积方法将被描述，该描述通过将本实施例应用到多环绕音频信号通过使用耳机被再现的情况，从而参考将本发明应用到能够使用虚拟声音图像定位进行再现的再现设备的示例。

下述示例是假设遵循ITU(国际电信联盟)-R的7.1声道多环绕扬声器的布置情况，并且HRTF被卷积，从而使得每个声道的音频分量在7.1声道多环绕扬声器的布置位置上被进行虚拟声音图像定位。

图15示出遵循ITU-R的7.1声道多环绕扬声器的布置示例，其中每个声道的扬声器被布置在以听众位置Pn为中心的环境中。

在图15中，听众前方位置C是中心声道的扬声器位置。以中心声道的扬声器位置C为中心，在中心两侧相互分开60度角度范围的位置LF和RF分别指示左前声道和右前声道。

随后，在听众前方位置C的左右两侧60度到150度的范围内，一对扬声器位置LS和LB以及一对扬声器位置RS和RB被设置在左侧和右侧。这些扬声器位置LS和LB以及RS和RB被设置在相对于听众的对称位置上。扬声器位置LS和RS是左偏后声道和右偏后声道的扬声器位置，而扬声器位置LB和RB是左后声道和右后声道的扬声器位置。

根据该声音再现系统示例，头戴式耳机被采用，其中七个耳机驱动器被分别相对于两只耳朵中的每一只来布置，如以上参考图5所述。

因此，根据该示例，如以上图5所示，在相对于听众的水平方向和垂直方向中的每个方向上，以预定分辨率(例如针对每10度的角度间隔)确定大量感知声源位置，并且针对这大量感知声源位置中的每一个，关于七个耳机驱动器中的每一个的归一化HRTF被分别获得。

随后，当利用本示例的头戴式耳机从声音上再现7.1声道多环绕音频信号时，所选的归一化HRTF被卷积到7.1声道多环绕音频信号的每个声道的音频信号中，从而使得以图15中的每个扬声器位置C、LF、RF、LS、RS、LB和RB的方向作为虚拟声音图像定位方向来从声音上再现7.1声道多环绕音频信号。

图16和17示出声音再现系统的硬件配置示例。该图被划分成图16和图17的原因在于，考虑到纸张大小的方便，在一张纸的空间中难以示出本示例的声音再现系统，因此图17是图16的继续。

注意，在图16和17中，将被提供到图15中的扬声器位置C、LF、RF、LS、RS、LB和RB的每个声道的音频信号被记作相同的标号C、LF、RF、LS、RS、LB和RB。这里，在图16和17中，LFE(低频率效应)声道是低通效应声道，这是声音图像定位方向不确定的音频，因此，根据该示例，该声道是未被用作HRTF的卷积目标的音频声道。

如图16所示，7.1声道信号，即八个声道LF、LS、RF、RS、LB、RB、C和LFE的音频信号通过电平调整单元71LF、71LS、71RF、71RS、71LB、71RB、71C和71LFE以及放大器72LF、72LS、72RF、72RS、72LB、72RB、72C和72LFE被提供A/D转换器73LF、73LS、73RF、73RS、73LB、73RB、73C和73LFE，并被分别转换成数字音频信号。

如图17所示，根据本示例，用于左耳的七个耳机驱动器90L1、90L2、90L3、90L4、90L5、90L6和90L7被分别用于右前声道的串话声道xRF、左偏后声道LS、左前声道LF、左后声道LB、中心声道C、低通效应声道LFE以及右偏后声道的串话声道xRS。

而且，用于右耳的七个耳机驱动器90R1、90R2、90R3、90R4、90R5、90R6和90R7被分别用于左偏后声道的串话声道xLF、右偏后声道RS、右前声道RF、右后声道RB、中心声道C、低通效应声道LFE以及左偏后声道的串话声道xLS。

根据本示例，进行如下布置：用于中心声道C的音频信号和用于低通效应声道LFE的音频信号被共同生成并被分别提供到左和右耳机驱动器90L5和90R5，以及耳机驱动器90L6和90R6。如上所述，根据图16和17所示的声音再现系统，12声道被生成，作为将被提供到头戴式耳机的分别用于两耳的耳机驱动器的音频信号。

如图16所示，根据本示例，提供了针对HRTF卷积处理单元74xRF、74LS、74LF、74LB、74xRS、74LFE、74C、74xLS、74RB、74RF、74RS和74xLF的12条声道。

HRTF卷积处理单元74xRF用于右前声道的串话声道xRF，HRTF卷积处理单元74LS用于左偏后声道LS、HRTF卷积处理单元74LF用于左前声道LF，HRTF卷积处理单元74LB用于左后声道LB，HRTF卷积处理单元74xRS用于右偏后声道的串话声道xRS，HRTF卷积处理单元74LFE用于低通效应声道LFE，HRTF卷积处理单元74C用于中心声道C，HRTF卷积处理单元74xLS用于左偏后声道的串话声道xLS，HRTF卷积处理单元74RB用于右后声道RB，HRTF卷积处理单元74RF用于右前声道RF，HRTF卷积处理单元74RS用于右偏后声道RS，并且HRTF卷积处理单元74xLF用于左偏后声道的串话声道xLF。

根据本示例，HRTF卷积处理单元74xRF、74LS、74LF、74LB、74xRS、74LFE、74C、74xLS、74RB、74RF、74RS和74xLF具有诸如图18所示的相同硬件配置。

在本示例的情况下，如图5所示，关于来自一个感知声源位置方向的用于测量的声波，HRTF在对应于七个耳机驱动器的七个麦克风中的每一个处被测量，并且按上述方式被分别归一化，从而获得七个归一化HRTF。随后，所获得的七个归一化HRTF被分别卷积到七个将被提供到对应于用于测量的麦克风的耳机驱动器的音频信号中。

因此，如图18所示，HRTF卷积处理单元74xRF、74LS、74LF、74LB、74xRS、74LFE、74C、74xLS、74RB、74RF、74RS和74xLF被配置为分别具有关于不包括LFE声道的七个声道的音频信号的七个归一化HRTF卷积单元101、102、103、104、105、106和107以及加法器108，该加法器108被配置为将来自七个归一化HRTF卷积单元101到107的输出相加。

七个归一化HRTF卷积单元101到107中的每一个执行归一化HRTF关于其输入音频信号的卷积处理。作为七个归一化HRTF卷积单元101到107中的每一个的硬件配置，图12中的第一示例的硬件配置可以被采用，或者图14中的第二示例的硬件配置可以被采用。

利用HRTF卷积处理单元74xRF、74LS、74LF、74LB、74xRS、74LFE、74C、74xLS、74RB、74RF、74RS和74xLF中的每一个，将被卷积以定位作为7.1声道多环绕的再现声场的虚拟声音图像的所选归一化HRTF(关于直接波和反射波的归一化HRTF)中的每一个被卷积。

注意，根据本示例，HRTF卷积单元74LFE不执行HRTF的卷积处理，输入低通效应声道的音频信号，并不经改变地输出该信号。

如图17所示，来自HRTF卷积处理单元74xRF、74LS、74LF、74LB、74xRS、74LFE、74C、74xLS、74RB、74RF、74RS和74xLF的输出音频信号分别通过电平调整单元75xRF、75LS、75LF、75LB、75xRS、75LFE、75C、75xLS、75RB、75RF、75RS和75xLF被提供到D/A转换器76xRF、76LS、76LF、76LB、76xRS、76LFE、76C、76xLS、76RB、76RF、76RS和76xLF，并被转换成模拟音频信号。

来自D/A转换器76xRF、76LS、76LF、76LB、76xRS、76LFE、76C、76xLS、76RB、76RF、76RS和76xLF的模拟音频信号被分别提供到电流-电压转换器77xRF、77LS、77LF、77LB、77xRS、77LFE、77C、77xLS、77RB、77RF、77RS和77xLF，并被从电流信号转换成电压信号。

随后，来自电流-电压转换器77xRF、77LS、77LF、77LB、77xRS、77LFE、77C、77xLS、77RB、77RF、77RS和77xLF的被转换成电压信号的音频信号分别在电平调整单元78xRF、78LS、78LF、78LB、78xRS、78LFE、78C、78xLS、78RB、78RF、78RS和78xLF处进行电平调整，然后被提供到增益调整单元79xRF、79LS、79LF、79LB、79xRS、79LFE、79C、79xLS、79RB、79RF、79RS和79xLF，并进行增益调整。

随后，来自增益调整单元79xRF、79LS、79LF、79LB和79xRS的输出音频信号被分别通过放大器80L1、80L2、80L3、80L4和80L7提供到用于左耳的耳机驱动器90L1、90L2、90L3、90L4和90L7。

而且，来自增益调整单元79xLS、79RB、79RF、79RS和79xLF的输出音频信号被分别通过放大器80R7、80R4、80R3、80R2和80R1提供到用于右耳的耳机驱动器90R7、90R4、90R3、90R2和90R1。

而且，来自增益调整单元79C的输出音频信号通过放大器80L5被提供到耳机驱动器90L5，并且还通过放大器80R5被提供到耳机驱动器90R5。此外，来自增益调整单元79LFE的输出音频信号通过放大器80L6被提供到耳机驱动器90L6，并且还通过放大器80R6被提供到耳机驱动器90R6。

声音再现系统的归一化HRTF卷积开始定时的示例(图19到27)

接下来，将描述在图16中的HRTF卷积处理单元74xRF、74LS、74LF、74LB、74xRS、74LFE、74C、74xLS、74RB、74RF、74RS和74xLF处被卷积的归一化HRTF及其卷积开始定时。

例如，将描述当假设房间具有垂直×水平＝4550mm×3620mm的矩形平行六面体形状并且再现声音空间具有遵循ITU-R的7.1声道多环绕(其中左前扬声器位置LF和右前扬声器位置RF之间的距离为1600mm)时HRTF的卷积。注意，关于反射波，天花板反射和地板反射将被省略，并且这里将只描述墙壁反射以简化描述。

根据本实施例，关于直接波的归一化HRTF、关于其串话分量的归一化HRTF、关于主要反射波的归一化HRTF以及关于其串话分量的归一化HRTF将被卷积。

首先，为了将右前扬声器位置RF设置为虚拟声音图像定位位置，关于归一化HRTF的声波的方向可以被采用，例如如图19所示。

具体而言，在图19中，RFd指的是来自位置RF的直接波，并且xRFd指的是对其左声道的串话。注意，符号x指串话。这可被应用到下面的附图。

而且，RFsR指的是来自位置RF的主要在右侧墙壁反射的反射波，xRFsR指的是对其左声道的串话。而且，RFfR指的是来自位置RF的主要在前面墙壁反射的反射波，xRFfR指的是对其左声道的串话。而且，RFsL指的是来自位置RF的主要在左侧墙壁反射的反射波，xRFsL指的是对其左声道的串话。此外，RFbR指的是来自位置RF的主要在后侧墙壁反射的反射波，xRFbR指的是对其左声道的串话。

关于直接波及其串话以及反射波及其串话中的每一个，将被卷积的归一化HRTF是关于这些声波最近被输入到听众位置Pn的方向所测量的归一化HRTF。具体而言，将被卷积的归一化HRTF是与在一个方向上关于声波的七个耳机驱动器分别相对应地测量的七个归一化HRTF。

随后，七个归一化HRTF中的每个被卷积到将被提供给相应的耳机驱动器的声道的音频信号转。

随后，直接波RFd及其串话xRFd以及反射波RFsR、RFfR、RFsL和RFbR及其串话xRFsR、xRFfR、xRFsL和xRFbR的归一化HRTF关于右前声道RF的音频信号的卷积开始时间点根据声波的路径长度被计算出，并且获得例如图20所示的计算结果。

随后，关于将被卷积的HRTF的增益，对于直接波的衰减量量被设置为0。而且，对于反射波的衰减量量根据感知的声音吸收程度来设置。

注意，图20简单地示出直接波RFd及其串话xRFd以及反射波RFsR、RFfR、RFsL和RFbR及其串话xRFsR、xRFfR、xRFsL和xRFbR的归一化HRTF关于音频信号的卷积开始时间点，但是没有示出将被卷积到将被提供到用于一个信道的耳机驱动器的音频信号中的卷积开始时间点。

具体而言，直接波RFd及其串话xRFd以及反射波RFsR、RFfR、RFsL和RFbR及其串话xRFsR、xRFfR、xRFsL和xRFbR中的每一个在用于该信道的HRTF卷积单元处被卷积，该HRTF卷积单元是从上述HRTF卷积处理单元74xRF、74LS、74LF、74LB、74xRS、74LFE、74C、74xLS、74RB、74RF、74RS和74xLF中预先选出的。

这可以应用到将被卷积以将另一声道的扬声器位置设置为虚拟声音图像定位位置的归一化HRTF与充当卷积目标的音频信号以及将被卷积以将右前扬声器位置RF设置为虚拟声音图像定位位置的归一化HRTF之间的关系。

接下来，为了将左前扬声器位置LF设置为虚拟声音图像定位位置，关于将被卷积的归一化HRTF的声波方向可以被看作通过以对称方式将图19所示的图移到左侧而获得的那些方向。虽然图中将不会示出，但是直接波LFd及其串话xLFd、来自左侧墙壁的反射波LFsL及其串话xLFsL、来自前面墙壁的反射波LFfL及其串话xLFfL、来自右侧墙壁的反射波LFsR及其串话xLFsR以及来自后侧墙壁的反射波LFbL及其串话xLFbL都被获得。

随后，将被卷积的归一化HRTF根据相对于听众位置Pn的入射方向来确定，并且其卷积开始时间点与图20所示相同。

而且，类似地，为了将中心扬声器位置C设置为虚拟声音图像定位位置，关于将被卷积的归一化HRTF的声波方向例如如图21所示。

具体而言，关于将被卷积的归一化HRTF的声波方向是直接波Cd、来自右侧墙壁的反射波CsR及其串话xCsR以及来自后侧墙壁的反射波CbR。在图21中仅仅示出右侧的反射波，但是左侧也可以类似地设置，即，来自左侧墙壁的反射波CsL及其串话xCsL以及来自后侧墙壁的反射波CbL可以类似地设置。

随后，将被卷积的归一化HRTF根据直接波和反射波及其串话相对于听众位置Pn的入射方向被确定，并且其卷积开始时间点与图22所示相同。

接下来，为了将右偏后扬声器位置RS设置为虚拟声音图像定位位置，关于将被卷积的归一化HRTF的声波方向例如如图23所示。

具体而言，直接波RSd及其串话xRSd、来自右侧墙壁的反射波RSsR及其串话xRSsR、来自前面墙壁的反射波RSfR及其串话xRSfR、来自左侧墙壁的反射波RSsL及其串话xRSsL以及来自后侧墙壁的反射波RSbR及其串话xRSbR被获得。随后，将被卷积的归一化HRTF根据这些波相对于听众位置Pn的入射方向被确定，并且其卷积开始时间点与图24所示相同。

为了将左偏后扬声器位置LS设置为虚拟声音图像定位位置，关于将被卷积的归一化HRTF的声波方向可以被看作通过将图23所示的图以对称方式移到左侧所获得那些方向。虽然图中将不会示出，但是直接波LSd及其串话xLSd、来自左侧墙壁的反射波LSsL及其串话xLSsL、来自前面墙壁的反射波LSfL及其串话xLSfL、来自右侧墙壁的反射波LSsR及其串话xLSsR以及来自后侧墙壁的反射波LSbL及其串话xLSbL被获得。随后，将被卷积的归一化HRTF根据这些波相对于听众位置Pn的入射方向被确定，并且其卷积开始时间点与图24所示相同。

而且，为了将右后扬声器位置RB设置为虚拟声音图像定位位置，关于将被卷积的归一化HRTF的声波方向例如如图25所示。

具体而言，直接波RBd及其串话xRBd、来自右侧墙壁的反射波RBsR及其串话xRBsR、来自前面墙壁的反射波RBfR及其串话xRBfR、来自左侧墙壁的反射波RBsL及其串话xRBsL以及来自后侧墙壁的反射波RBbR及其串话xRBbR被获得。随后，将被卷积的归一化HRTF根据这些波相对于听众位置Pn的入射方向被确定，并且其卷积开始时间点与图26所示相同。

为了将左后扬声器位置LB设置为虚拟声音图像定位位置，关于将被卷积的归一化HRTF的声波方向可以被看作通过将图25所示的图以对称方式移到左侧所获得那些方向。虽然图中将不会示出，但是直接波LBd及其串话xLBd、来自左侧墙壁的反射波LBsL及其串话xLBsL、来自前面墙壁的反射波LBfL及其串话xLBfL、来自右侧墙壁的反射波LBsR及其串话xLBsR以及来自后侧墙壁的反射波LBbL及其串话xLBbL被获得。随后，将被卷积的归一化HRTF根据这些波相对于听众位置Pn的入射方向被确定，并且其卷积开始时间点与图26所示相同。

在此之前已经描述了归一化HRTF应该被卷积到的直接波和反射波的方向及其卷积开始定时，并且关于是否在HRTF卷积处理单元74xRF、74LS、74LF、74LB、74xRS、74LFE、74C、74xLS、74RB、74RF、74RS和74xLF中的哪个声道处对这些归一化HRTF执行卷积处理的示例如图27所示。

根据本实施例，图27A示出将在用于右前声道的串话声道xRF的HRTF卷积处理单元74xRF处被卷积到直接波和反射波及其串话的归一化HRTF的卷积开始定时。

虽然图中没有示出将在用于左前声道的串话声道xLF的HRTF卷积处理单元74xLF处被卷积到直接波和反射波及其串话的归一化HRTF，但是通过颠倒图27A所示的直接波和反射波及其串话的两侧所获得的归一化HRTF从与图27A所示的卷积开始定时相同的开始定时起被卷积。

图27B示出将在用于中心声道C的HRTF卷积处理单元74C处被卷积的关于直接波Cd的归一化HRTF的卷积开始定时。就是说，根据本示例，只有关于中心声道的直接波Cd的归一化HRTF在HRTF卷积处理单元74C处被卷积。

图27C示出将在用于左前声道LF的HRTF卷积处理单元74LF处被卷积的关于直接波LFd的归一化HRTF的卷积开始定时。就是说，根据本示例，只有关于左前声道的直接波LFd的归一化HRTF在HRTF卷积处理单元74LF处被卷积。

虽然在图中没有示出，但是在用于右前声道RF的HRTF卷积处理单元74RF处也只有关于右前声道的直接波RFd的归一化HRTF被卷积。

图27D示出将在用于左后声道LB的HRTF卷积处理单元74LB处被卷积的关于直接波和反射波的归一化HRTF的卷积开始定时。

虽然在图中没有示出，但是利用用于右后声道RB的HRTF卷积处理单元74RB，通过颠倒图27D所示的直接波和反射波的两侧而获得的归一化HRTF从与图27D所示的卷积开始定时相同的开始定时起被卷积。

图27E示出将在用于左偏后声道LS的HRTF卷积处理单元74LS处被卷积的关于直接波LSd的归一化HRTF的卷积开始定时。就是说，根据本示例，只有关于左偏后声道的直接波LSd的归一化HRTF在HRTF卷积处理单元74LS处被卷积。

虽然在图中没有示出，但是在用于右偏后声道RS的HRTF卷积处理单元74RS处也只有关于右偏后声道的直接波RSd的归一化HRTF被卷积。

图27F示出将在用于右偏后声道的串话声道xRS的HRTF卷积处理单元74xRS处被卷积的关于直接波和反射波及其串话的归一化HRTF的卷积开始定时。

虽然图中没有示出将在用于左偏后声道的串话声道xLS的HRTF卷积处理单元74xLS处被卷积的关于直接波和反射波及其串话的归一化HRTF，但是通过颠倒图27F所示的直接波和反射波及其串话的两侧而获得的归一化HRTF从与图27A所示的卷积开始定时相同的开始定时起被卷积。

注意，如上所述，以上关于直接波和反射波的归一化HRTF的卷积的描述是仅关于墙壁反射的，但是其可以完全相同的方式被应用到天花板反射和地板反射。

具体而言，图28示出当卷积HRTF以将右前扬声器RF设置为虚拟声音图像定位位置时，例如考虑天花板反射和地板反射。具体而言，可以认为存在在天花板处被反射并被输入到右耳位置的反射波RFcR，类似地，存在在天花板处被反射并被输入到左耳位置的反射波RFcR，存在在地板处被反射并被输入到右耳位置的反射波RFgR，类似地，存在在地板处被反射并被输入到左耳位置的反射波RFgL。而且，关于这些反射波，虽然图中没有示出，但是可以考虑串话。

关于这些反射波及其串话，将被卷积的归一化HRTF是所测量的关于这些声波最近被输入到听众位置Pn的方向的归一化HRTF。随后，关于每个反射波的路径长度被计算，并且每个归一化HRTF的卷积开始定时被确定。随后，每个归一化HRTF的增益根据从天花板和地板的材料、表面形状等感知到的声音吸收程度而被确定为衰减量量。

声音再现系统的第二示例的配置示例(图29)

图16和17所示的声音再现系统是通过包含七个耳机驱动器的头戴式耳机来声音再现7.1声道多环绕音频信号的情况，其中每个耳机驱动器用于双耳。

另一方面，下面描述的另一示例是通过包含用于双耳的一个耳机驱动器的公用头戴式耳机来声音再现7.1声道多环绕音频信号的情况。

假设以下描述的示例采用的是如图5所示通过在双耳附近布置七个麦克风用于7.1声道多环绕而测量到的归一化HRTF。因此，在归一化HRTF被卷积前的处理可以被认为是与上述声音再现系统的处理完全相同。具体而言，假设图16所示的硬件配置与根据本示例的声音再现系统的相同。

利用跟据本示例的声音再现系统，如图29所示，来自电平调整单元75xRF、75LS、75LF、75LB、75xRS、75LFE和75C的音频信号被提供到用于左侧声道的加法器110L以将这些音频信号相加。

而且，来自电平调整单元75LFE、75C、75xLS、75RB、75RF、75RS和75xLF的音频信号被提供到用于右侧声道的加法器110R以将这些音频信号相加。

随后，来自加法器110L和110R的输出信号被分别提供到D/A转换器111L和111R，并被转换成模拟音频信号。来自D/A转换器111L和111R的模拟音频信号被分别提供到电流-电压转换器112L和112R，并被从电流信号转换成电压信号。

随后，来自电流-电压转换器112L和112R的被转换成电压信号的音频信号分别在电平调整单元113L和113R处进行电平调整，然后被提供到增益调整单元114L和114R以进行增益调整。

随后，来自增益调整单元114L和114R的输出音频信号被分别通过放大器115L和115R提供到用于左耳的耳机驱动器120L和用于右耳的耳机驱动器120R，并以声音方式再现。

根据声音再现系统的第二示例，通过虚拟声音图像定位，可以利用耳机来很好地再现7.1声道多环绕声场，其中所述耳机包括每个用于双耳的耳机驱动器。

实施例的优点

根据现有技术，在利用HRTF执行信号处理的情况下，测量系统的属性无法去除，因此最终卷积处理之后的声音质量恶化，除非使用具有良好音质的昂贵的扬声器和麦克风来进行测量。另一方面，利用根据本实施例的归一化HRTF，测量系统的属性可以去除，因此即使使用利用不具有平坦属性的便宜的扬声器和麦克风的测量系统，也能够执行声音质量不会恶化的HRTF卷积处理。

此外，虽然无论扬声器和麦克风多么昂贵并且具有多好的属性都无法获得理想的属性(完全平坦)，但是利用本实施例，可以获得更理想的HRTF，其中根据现有技术的任意属性都可以获得。

而且，例如以关于听众的各个方向作为虚拟声源位置，仅获得关于直接波的HRTF而删除了反射波，因此关于来自各个方向的声波的HRTF可以被容易地卷积到音频信号中，并且在卷积关于每个方向的声波的HRTF时的再现声场可以被容易地检验。

就是说，如上所述，可以进行如下布置：将虚拟声音图像定位位置设置为特定位置，不仅关于来自该虚拟声音图像定位位置的直接波的HRTF被卷积，而且关于来自可以被假设为来自虚拟声音图像定位位置的反射波的方向的声波的HRTF也被卷积，并且再现声场可以被检验，以便执行例如哪个方向上的哪些反射波对虚拟声音图像定位是有效的等等之类的检验。

其他实施例

虽然以上描述是关于主要以耳机作为用于执行将被再现的音频信号的声音再现的电-光转换单元的情况，但是考虑到测量方法和处理内容，本发明可以被应用到以扬声器作为输出系统(例如前环绕等等)的情况。

前面已经描述了采用多环绕方法的声音再现系统，但是不用说，上述实施例也可被应用到常见的双声道立体声。

而且，不用说，上述实施例可以被应用到除了7.1声道之外的其他多环绕情形，例如5.1声道、9.1声道等等。

而且，已经以ITU-R扬声器的布置作为示例描述了7.1声道多环绕扬声器的布置，但是容易理解，上述实施例可被应用到THX公司所推荐的扬声器的布置情况。

本领域技术人员应该理解，取决于设计需求和其他因素，可以发生各种修改、组合、子组合和替换，只要它们落在所附权利要求或其等同物的范围之内即可。

本发明包含与2008年2月27日递交到日本特许厅的日本专利申请JP2008-045597相关的主题，该日本专利申请的全部内容通过引用被结合于此。

Claims

1.一种头相关传输函数卷积方法，所述方法被配置用于当音频信号通过布置在听众双耳附近位置上的电-声转换装置被声音再现时，将头相关传输函数卷积到所述音频信号中，所述头相关传输函数使听众在收听所述音频信号时就好像声音图像位于感知到的虚拟声音图像定位位置上，所述头相关传输函数卷积方法包括以下步骤：

当声源被布置在所述虚拟声音图像定位位置上并且声音收集装置被布置在所述电-声转换装置的位置上时，预先分别测量关于从所述声源到所述声音收集装置的直接波的方向的直接波方向头相关传输函数，以及关于从所述声源到所述声音收集装置的一个所选反射波的方向的一个反射波方向头相关传输函数或者关于从所述声源到所述声音收集装置的多个所选反射波的方向的多个反射波方向头相关传输函数，以获得这些头相关传输函数；以及

将所获得的所述直接波方向头相关传输函数和关于所述一个所选反射波的方向的所述一个反射波方向头相关传输函数或者关于所述多个所选反射波的方向的所述多个反射波方向头相关传输函数卷积到所述音频信号中。

2.如权利要求1所述的头相关传输函数卷积方法，其中在所述卷积中，所述直接波方向头相关传输函数和所述反射波方向头相关传输函数的相应卷积是从开始所述直接波方向头相关传输函数的卷积处理的开始时间点以及开始每个所述反射波方向头相关传输函数的卷积处理的开始时间点中的每个开始时间点开始，在所述音频信号的时间序列信号上执行的，所述开始时间点是根据所述直接波和所述反射波中的每一个从所述虚拟声音图像定位位置到所述电-声转换装置的位置的声波路径长度来确定的。

3.如权利要求1所述的头相关传输函数卷积方法，其中关于所述反射波方向头相关传输函数，根据在感知的反射部分处声波的衰减率对增益进行调整，并执行所述卷积。

4.如权利要求1所述的头相关传输函数卷积方法，所述测量包括：

第一测量，进一步包括：

将声-电转换装置放置在假设放置有电-声转换装置的听众双耳附近，

在在所述听众位置上存在假人头或真人的状态中，利用所述声-电转换装置拾取在感知声源位置上发射的声波，以及

仅仅从直接到达所述声-电转换装置的声波测量头相关传输函数；第二测量，进一步包括：

在在所述听众位置上不存在假人头或真人的状态中，利用所述声-电转换装置拾取在感知声源位置上发射的声波，

仅仅从直接到达所述声-电转换装置的声波测量自然状态传输属性；

利用通过所述第二测量测得的所述自然状态传输属性对通过所述第一测量测得的所述头相关传输函数进行归一化，以获得归一化的头相关传输函数；以及

将在所述归一化中获得的所述归一化的头相关传输函数存储在存储单元中。

5.如权利要求4所述的头相关传输函数卷积方法，其中在所述归一化中，与从在所述感知声源位置上发射所述声波到直接到达所述声-电转换装置的时间相等的数据量被从在所述第一测量和所述第二测量中获得的所述头相关传输函数和所述自然状态传输属性中删除，并且所述归一化处理被执行。

6.如权利要求4所述的头相关传输函数卷积方法，所述归一化进一步包括以下步骤：

对直接到达所述声-电转换装置的每个时间轴数据执行正交变换，以变换成X-Y坐标系的频率轴数据；

将每个所述X-Y坐标系的频率轴数据转换成极坐标系数据；

在所述极坐标系数据的状态下执行所述归一化处理以获得所述归一化的头相关传输函数的数据，并将该归一化的头相关传输函数的极坐标系数据返回到所述X-Y坐标数据；以及

对返回到所述X-Y坐标系的所述归一化的头相关传输函数执行反向正交变换，以变换成时间轴数据。

7.如权利要求6所述的头相关传输函数卷积方法，还包括简化步骤，用于减小通过所述反向正交变换获得的时间轴数据的数据长度。

8.一种头相关传输函数卷积设备，所述设备被配置用于当音频信号通过布置在听众双耳附近位置上的电-声转换装置被声音再现时，将头相关传输函数卷积到所述音频信号中，从而好像声音图像位于感知到的虚拟声音图像定位位置上，所述头相关传输函数卷积设备包括：

存储单元，该存储单元被配置为用于存储当声源被布置在所述虚拟声音图像定位位置上并且声音收集装置被布置在所述电-声转换装置的位置上时测量出的：关于从所述声源到所述声音收集装置的直接波的方向的直接波方向头相关传输函数，以及关于从所述声源到所述声音收集装置的一个所选反射波的方向的一个反射波方向头相关传输函数或者关于从所述声源到所述声音收集装置的多个所选反射波的方向的多个反射波方向头相关传输函数；以及

卷积装置，该卷积装置被配置用于读出所获得的所述直接波方向头相关传输函数和关于所述一个所选反射波的方向的所述一个反射波方向头相关传输函数或者关于所述多个所选反射波的方向的所述多个反射波方向头相关传输函数，并卷积到所述音频信号中。

9.如权利要求8所述的头相关传输函数卷积设备，其中利用所述卷积装置，所述直接波方向头相关传输函数和所述反射波方向头相关传输函数的相应卷积是从开始所述直接波方向头相关传输函数的卷积处理的开始时间点以及开始每个所述反射波方向头相关传输函数的卷积处理的开始时间点中的每个开始时间点开始，在所述音频信号的时间序列信号上执行的，所述开始时间点是根据所述直接波和所述反射波中的每一个从所述虚拟声音图像定位位置到所述电-声转换装置的位置的声波路径长度来确定的。

10.如权利要求8所述的头相关传输函数卷积设备，其中利用所述卷积装置，关于所述反射波方向头相关传输函数，根据在感知的反射部分处声波的衰减率对增益进行调整，并执行所述卷积。

11.如权利要求8所述的头相关传输函数卷积设备，其中所述直接波方向头相关传输函数和所述反射波方向头相关传输函数是通过如下处理获得的归一化的头相关传输函数：将声-电转换装置放置在假设放置有电-声转换装置的听众双耳附近；在在所述听众位置上存在假人头或真人的状态中，利用所述声-电转换装置拾取在感知声源位置上发射的声波；仅仅从直接到达所述声-电转换装置的声波测量头相关传输函数；在在所述听众位置上不存在假人头或真人的状态中，利用所述声-电转换装置拾取在感知声源位置上发射的声波；利用自然状态传输属性对所述头相关传输函数进行归一化，所述自然状态传输属性是仅仅从直接到达所述声-电转换装置的声波测量出的。

12.一种头相关传输函数卷积方法，所述方法被配置用于当音频信号通过布置在听众双耳附近位置上的电-声转换装置被声音再现时，将头相关传输函数卷积到所述音频信号中，所述头相关传输函数使听众在收听所述音频信号时就好像声音图像位于感知到的虚拟声音图像定位位置上，所述头相关传输函数卷积方法包括以下步骤：

当声源被布置在所述虚拟声音图像定位位置上并且声音收集装置被布置在所述电-声转换装置的位置上时，预先获得：开始进行关于从所述声源到所述声音收集装置的直接波的方向的直接波方向头相关传输函数关于所述音频信号的卷积的直接波卷积开始时间点，以及开始进行关于从所述声源到所述声音收集装置的一个所选反射波的方向的一个反射波方向头相关传输函数或者关于从所述声源到所述声音收集装置的多个所选反射波的方向的多个反射波方向头相关传输函数关于所述音频信号的卷积的一个反射波卷积开始时间点或多个反射波卷积开始时间点；

分别保存从所述直接波卷积开始时间点以及所述一个反射波卷积开始时间点或所述多个反射波卷积开始时间点开始，将被卷积到所述音频信号的数据；以及

分别从所述直接波卷积开始时间点以及所述一个反射波卷积开始时间点或所述多个反射波卷积开始时间点开始，将所保存的数据卷积到所述音频信号。

13.如权利要求12所述的头相关传输函数卷积方法，还包括以下步骤：

通过将声源布置在所述虚拟声音图像定位位置上并且将声音收集装置布置在所述电-声转换装置的位置上，来预先获得：关于从所述声源到所述声音收集装置的直接波的方向的直接波方向头相关传输函数，以及关于一个所选反射波的方向的一个反射波方向头相关传输函数或者关于多个所选反射波的方向的多个反射波方向头相关传输函数；并且

其中所述所保存的数据是所述直接波方向头相关传输函数和所述一个或多个反射波方向头相关传输函数。

14.如权利要求12所述的头相关传输函数卷积方法，还包括以下步骤：

通过将声源布置在所述虚拟声音图像定位位置上并且将声音收集装置布置在所述电-声转换装置的位置上，来获得：关于从所述声源到所述声音收集装置的直接波的方向的直接波方向头相关传输函数，并且

其中所述直接波方向头相关传输函数被保存作为从所述直接波卷积开始时间点开始卷积的数据，并且通过根据所述一个或多个反射波卷积开始时间点来衰减所述直接波方向头相关传输函数而获得的数据被保存作为从所述一个或多个反射波卷积开始时间点开始卷积的数据。

15.如权利要求12所述的头相关传输函数卷积方法，还包括以下步骤：

其中所述直接波方向头相关传输函数被保存作为从所述直接波卷积开始时间点开始卷积的数据，并且通过根据所述一个或多个反射波卷积开始时间点来延迟所述音频数据而获得的数据被保存作为从所述一个或多个反射波卷积开始时间点开始卷积的数据。

16.一种头相关传输函数卷积设备，所述设备被配置用于当音频信号通过布置在听众双耳附近位置上的电-声转换装置被声音再现时，将头相关传输函数卷积到所述音频信号中，从而好像声音图像位于感知到的虚拟声音图像定位位置上，所述头相关传输函数卷积设备包括：

被配置用于执行从直接波卷积开始时间点开始将作为直接波卷积数据的头相关传输函数卷积到所述音频信号的卷积处理装置，其中所述头相关传输函数是通过将声源布置在所述虚拟声音图像定位位置上并且将声音收集装置布置在所述电-声转换装置的位置上而测量出的关于从所述声源到所述声音收集装置的直接波的方向的头相关传输函数，并且所述直接波卷积开始时间点是预先设置的开始关于所述音频信号的卷积的时间点；以及

被配置用于执行从一个或多个反射波卷积开始时间点开始将作为反射波卷积数据的一个头相关传输函数或多个头相关传输函数卷积到所述音频信号的卷积处理的装置，其中所述一个头相关传输函数或多个头相关传输函数是通过将声源布置在所述虚拟声音图像定位位置上并且将声音收集装置布置在所述电-声转换装置的位置上而测量出的关于从所述声源到所述声音收集装置的一个所选反射波的方向或多个所选反射波的方向的头相关传输函数，并且所述一个或多个反射波卷积开始时间点是预先设置的开始关于所述音频信号的卷积的时间点。

17.如权利要求16所述的头相关传输函数卷积设备，其中所述直接波卷积数据是直接波方向头相关传输函数，所述直接波方向头相关传输函数是通过将声源布置在所述虚拟声音图像定位位置上并且将声音收集装置布置在所述电-声转换装置的位置上而测量出的关于从所述声源到所述声音收集装置的直接波的方向的头相关传输函数；

并且其中所述反射波卷积数据是反射波方向头相关传输函数，所述反射波方向头相关传输函数是通过将声源布置在所述虚拟声音图像定位位置上并且将声音收集装置布置在所述电-声转换装置的位置上而测量出的关于从所述声源到所述声音收集装置的一个所选反射波的方向或多个所选反射波的方向的头相关传输函数。

18.如权利要求16所述的头相关传输函数卷积设备，其中所述直接波卷积数据是直接波方向头相关传输函数，所述直接波方向头相关传输函数是通过将声源布置在所述虚拟声音图像定位位置上并且将声音收集装置布置在所述电-声转换装置的位置上而测量出的关于从所述声源到所述声音收集装置的直接波的方向的头相关传输函数；

并且其中所述反射波卷积数据是通过根据所述一个或多个反射波卷积开始时间点衰减所述直接波方向头相关传输函数而获得数据。

19.如权利要求16所述的头相关传输函数卷积设备，其中所述直接波卷积数据是直接波方向头相关传输函数，所述直接波方向头相关传输函数是通过将声源布置在所述虚拟声音图像定位位置上并且将声音收集装置布置在所述电-声转换装置的位置上而测量出的关于从所述声源到所述声音收集装置的直接波的方向的头相关传输函数；

并且其中所述反射波卷积数据是通过根据所述一个或多个反射波卷积开始时间点延迟所述音频数据而获得数据。

20.一种头相关传输函数卷积方法，所述方法被配置用于当音频信号通过布置在听众双耳附近位置上的电-声转换单元被声音再现时，将头相关传输函数卷积到所述音频信号中，所述头相关传输函数使听众在收听所述音频信号时就好像声音图像位于感知到的虚拟声音图像定位位置上，所述头相关传输函数卷积方法包括以下步骤：

当声源被布置在所述虚拟声音图像定位位置上并且声音收集单元被布置在所述电-声转换单元的位置上时，预先分别测量：关于从所述声源到所述声音收集单元的直接波的方向的直接波方向头相关传输函数，以及关于从所述声源到所述声音收集单元的一个所选反射波的方向的一个反射波方向头相关传输函数或者关于从所述声源到所述声音收集单元的多个所选反射波的方向的多个反射波方向头相关传输函数，以获得这些头相关传输函数；以及

21.一种头相关传输函数卷积设备，所述设备被配置用于当音频信号通过布置在听众双耳附近位置上的电-声转换单元被声音再现时，将头相关传输函数卷积到所述音频信号中，从而好像声音图像位于感知到的虚拟声音图像定位位置上，所述头相关传输函数卷积设备包括：

存储单元，该存储单元被配置为用于存储当声源被布置在所述虚拟声音图像定位位置上并且声音收集单元被布置在所述电-声转换单元的位置上时测量出的：关于从所述声源到所述声音收集单元的直接波的方向的直接波方向头相关传输函数，以及关于从所述声源到所述声音收集单元的一个所选反射波的方向的一个反射波方向头相关传输函数或者关于从所述声源到所述声音收集单元的多个所选反射波的方向的多个反射波方向头相关传输函数；以及

卷积单元，该卷积单元被配置用于读出所获得的所述直接波方向头相关传输函数和关于所述一个所选反射波的方向的所述一个反射波方向头相关传输函数或者关于所述多个所选反射波的方向的所述多个反射波方向头相关传输函数，并卷积到所述音频信号中。

22.一种头相关传输函数卷积方法，所述方法被配置用于当音频信号通过布置在听众双耳附近位置上的电-声转换单元被声音再现时，将头相关传输函数卷积到所述音频信号中，所述头相关传输函数使听众在收听所述音频信号时就好像声音图像位于感知到的虚拟声音图像定位位置上，所述头相关传输函数卷积方法包括以下步骤：

当声源被布置在所述虚拟声音图像定位位置上并且声音收集单元被布置在所述电-声转换单元的位置上时，预先获得：开始进行关于从所述声源到所述声音收集单元的直接波的方向的直接波方向头相关传输函数关于所述音频信号的卷积的直接波卷积开始时间点，以及开始进行关于从所述声源到所述声音收集单元的一个所选反射波的方向的一个反射波方向头相关传输函数或者关于从所述声源到所述声音收集单元的多个所选反射波的方向的多个反射波方向头相关传输函数关于所述音频信号的卷积的一个反射波卷积开始时间点或多个反射波卷积开始时间点；

分别从所述直接波卷积开始时间点以及所述一个反射波卷积开始时间点或所述多个反射波卷积开始时间点开始，将所述所保存的数据卷积到所述音频信号。

23.一种头相关传输函数卷积设备，所述设备被配置用于当音频信号通过布置在听众双耳附近位置上的电-声转换单元被声音再现时，将头相关传输函数卷积到所述音频信号中，从而声音图像被定位于感知到的虚拟声音图像定位位置上，所述头相关传输函数卷积设备包括：

被配置用于执行从直接波卷积开始时间点开始将作为直接波卷积数据的头相关传输函数卷积到所述音频信号的卷积处理的单元，其中所述头相关传输函数是通过将声源布置在所述虚拟声音图像定位位置上并且将声音收集单元布置在所述电-声转换单元的位置上而测量出的关于从所述声源到所述声音收集单元的直接波的方向的头相关传输函数，并且所述直接波卷积开始时间点是预先设置的开始关于所述音频信号的卷积的时间点；以及

被配置用于执行从一个或多个反射波卷积开始时间点开始将作为反射波卷积数据的一个头相关传输函数或多个头相关传输函数卷积到所述音频信号的卷积处理的单元，其中所述一个头相关传输函数或多个头相关传输函数是通过将声源布置在所述虚拟声音图像定位位置上并且将声音收集单元布置在所述电-声转换单元的位置上而测量出的关于从所述声源到所述声音收集单元的一个所选反射波的方向或多个所选反射波的方向的头相关传输函数，并且所述一个或多个反射波卷积开始时间点是预先设置的开始关于所述音频信号的卷积的时间点。