CN103517199A - 定位声像的装置和方法 - Google Patents

定位声像的装置和方法 Download PDF

Info

Publication number
CN103517199A
CN103517199A CN201310033653.5A CN201310033653A CN103517199A CN 103517199 A CN103517199 A CN 103517199A CN 201310033653 A CN201310033653 A CN 201310033653A CN 103517199 A CN103517199 A CN 103517199A
Authority
CN
China
Prior art keywords
sound
audio signal
characteristic
acoustic image
transmission sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310033653.5A
Other languages
English (en)
Inventor
染田惠一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN103517199A publication Critical patent/CN103517199A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

根据一个实施例,声像定位装置包括存储单元(10)、选择单元(20)和第一操作单元(30)。存储单元(10)存储多个声音传递特性,其中每一个对应于声像方向和定位感的强调度。选择单元(20)被配置为从多个声音传递特性中选择合适的声音传递特性。合适的声音传递特性最适合于由方向指示信息指示的声像方向和由强调度指示信息指示的强调度。第一操作单元(30)被配置为将合适的声音传递特性与第一音频信号进行卷积,以获得第二音频信号。

Description

定位声像的装置和方法
技术领域
在此描述的实施例通常涉及用于定位声像的装置和方法。
背景技术
通过使用诸如扬声器或耳机的声音重放装置,在收听者的任意位置(前后向、左右向)定位声像(作为虚拟声源)的立体声技术是众所周知的。
作为传统的立体声技术的声音定位装置,头相关传递函数(从定位声像的期望位置到收听者的双耳)与音频信号进行卷积,音频信号被呈现给收听者。因此,声像可在期望的位置被定位。
在该用于声音重放装置的声音定位装置中,期望实现根据收听者的喜好调整(将要呈现给收听者的)定位感的强调度(emphasis degree)的功能。
然而,为了调整收听者的定位感的强调度,通过使用头相关传递函数准确地重现在收听者的耳朵处的声压(当声源真实存在时)是不足的。在基于头相关传递函数的声像的定位处理中,影响定位感的强调度的因素并不清楚,声像的定位感的强调度很难进行调整。
发明内容
实施例提供了一种用于容易地调整声像的定位感的强调度的装置和方法。
根据一个实施例,声像定位装置包括存储单元、选择单元和第一操作单元。存储单元存储多个声音传递特性,其中每一个与声像方向和定位感的强调度相对应。选择单元被配置为从多个声音传递特性中选择合适的声音传递特性。合适的声音传递特性最适合于由方向指示信息指示的声像方向和由强调度指示信息指示的强调度。第一操作单元被配置为将合适的声音传递特性与第一音频信号进行卷积,以获得第二音频信号。
根据实施例,可以提供一种用于容易地调整声像的定位感的强调度的装置和方法。
附图说明
图1是根据第一实施例的声像定位装置的框图。
图2是示出根据第一实施例的声音传递特性的第一个例子的图。
图3是示出根据第一实施例的声音传递特性的第二个例子的图。
图4是示出根据第一实施例的声音传递特性的第三个例子的图。
图5是示出根据第一实施例的声音传递特性的第四个例子的图。
图6是示出根据第一实施例的声音传递特性的第五个例子的图。
图7是示出根据第一实施例的由于圆盘的直径的不同而产生的声音传递特性的比较结果的图。
图8是示出由于圆盘的直径的不同而产生的圆盘中心附近的声压级的比较结果的图。
图9是根据第一实施例的声像定位方法的流程图。
图10是根据第二实施例的声像定位装置的框图。
图11是用于测量声音传递特性的装置的示意图。
图12是用于说明双耳声级差和双耳时间差的示意图。
具体实施方式
第一实施例
图1是根据第一实施例的声像定位装置的框图。在下面的说明中,收听者转向的方向被定义为“前方”,收听者转向的方向的相反方向被定义为“后方”。另外,朝着收听者转向的方向的左侧方向被定义为“左方”,朝着收听者转向的方向的右侧方向被定义为“右方”。例如,可以想象收听者通过头戴式听筒享受聆听乐曲的情形。在该声像定位装置中,声像沿着收听者的期望方向被定位,并且收听者可以调整声像的定位感的程度。
在图1中,声像定位装置包括输入单元50和存储单元10。输入单元50用于收听者指示定位声像的方向(声像方向)和声像的定位感的强调度(强调度)。根据来自输入装置50的指示声像方向和强调度的信息,选择单元20从多个声音传递特性中选择与声像方向和强调度最匹配的一个。所选择的声音传递特性被称为“指示的声音传递特性”。第一操作单元30将指示的声音传递特性与音频信号(第一音频信号)进行卷积。因此,可获得添加了前后向定位信息和强调度的音频信号(第二音频信号)。
另外,第二操作单元40将双耳声级差和双耳时间差分配给第二音频信号。在此,双耳时间差可以是双耳相位差。因此,可获得添加了左右向定位信息的音频信号(第三音频信号和第四音频信号)。输出单元60向收听者输出第三音频信号和第四音频信号。
另外,作为存储单元100,例如,使用诸如存储器或HDD的存储设备100。另外,作为选择单元20、第一操作单元30和第二操作单元40,例如,使用诸如CPU的操作处理设备200。另外,输入单元50例如是远程控制器。输出单元60例如是头戴式听筒或耳机。
为了重现立体声,需要实现前后向声像定位和左右向声像定位。前后向声像定位和左右向声像定位可被独立地控制。
对于前后向声像定位,人类的耳廓的声音传递特性是主要相关的。简单来说,耳廓收集来自前方的声音并放大该声音。另一方面,耳廓屏蔽来自后方的声音,并削弱该声音。当人听见声音时,由于耳廓的存在,在来自前方和后方的声音中出现声音传递特性的不同。因此,通过听觉确定前方和后方的声音传递特性的不同,从而可以实现前后向声像定位。
在第一实施例中,作为模拟耳廓的声音传递特性的声音传递特性,可以使用每一个与声像方向和强调度相对应的多个声音传递特性。在此,例如,如果以收听者为中心,收听者的前方是0°,则声像方向表示定位声像的方向,即,收听者听到虚拟声音的方向。另外,例如,如果声像方向发生各种改变,则强调度表示所听到的声音的声压级的变化量。
如在后面所说明的,该强调度的级别对应于位于声音传递特性的最低频率侧的下降(dip)的频率。简单来说,例如,通过使用下降的频率不相同的多个声音传递特性,强调度的级别可以被调整为匹配收听者的喜好。另外,下降是与其它相邻频率的增益相比增益下降的区域。简单来说,下降的频率是位于声音传递特性的最低频率侧的向下凸起的顶点的频率。
该声音传递特性可以例如通过使用从屏蔽板中获得的声音传递特性来创建。简单来说,通过将(从多个声音传递特性中选择的)声音传递特性与第一音频信号进行卷积,可以生成被分配了(收听者期望的)前后向定位信息的第二音频信号。
以下详细说明用于第一实施例的声像定位装置的屏蔽板的声音传递特性。
屏蔽板是模拟人类的耳廓的薄板。屏蔽板最好不容易变形并且不传输声波。因此,可以使用具有适当厚度并由诸如木头、金属或塑料制成的板。作为屏蔽板的形状,期望是更简单的形状,例如,可以使用圆形板。另外,屏蔽板的尺寸可以根据人类耳廓的标准尺寸任意地确定。在这种情况下,作为尺寸的定义,例如可以使用屏蔽板的表面的典型长度(在圆形板的情况下,是其直径)、平面上与前后轴垂直的投影区域(横截面)。如在后面说明的,与强调度的级别对应的下降的频率取决于屏蔽板的尺寸。
以下说明用于测量屏蔽板的声音传递特性的方法。
图11是用于测量屏蔽板的声音传递特性的测量设备的示意图。在图11中,测量设备包括在圆形屏蔽板530表面上的中心附近具有声音接收点的麦克风510和远离屏蔽板530的中心预定距离的扬声器520。另外,作为从法线方向到屏蔽板530的表面的扬声器520的方向θ,通过将屏蔽板530的前侧(麦克风510的一侧)的方向(法线方向)定义为前方0°,与屏蔽板530的前后轴垂直的方向被设置为90°,屏蔽板530的后侧(麦克风510的相反一侧)的方向被设置为后方180°。
在设置了屏蔽板530的条件下从扬声器520到麦克风510的声音传递函数中,包括了模拟耳廓的声音传递特性的信息,即用于收听者识别沿着向前和向后方向的声像信息的信息(前后向定位信息)。另外,包括在声音从声像位置传播到收听者的位置时的幅度衰减和时间延迟的信息,即用于收听者识别沿着向左和向右方向的声像的信息(左右向定位信息)。然而,左右向定位信息还被包括在用于左右向声像定位的信号中(如后面所说明的)。因此,如果是前后向定位,则为了不被双重应用,左右向定位信息应当从声音传递函数中移除。
因此,屏蔽板530的声音传递特性被计算为“在设置了屏蔽板530的条件下从扬声器520到麦克风510的声音传递函数”与“在未设置屏蔽板530的条件下从扬声器520到麦克风510的声音传递函数”之比。简单来说,屏蔽板530的声音传递特性通过下面的等式计算。
H = H a H 0 - - - ( 1 )
其中,H:屏蔽板的声音传递特性,H0:在未设置屏蔽板的条件下从扬声器到麦克风的声音传递函数,Ha:在设置了屏蔽板的条件下从扬声器到麦克风的声音传递函数。
对于来自扬声器520的方向θ的声音,屏蔽板530的声音传递特性表示声音传递函数在存在或不存在屏蔽板530时如何变化。因此,可以模拟耳廓的声音传递特性。
通过使用图11的测量设备,可计算从扬声器520到麦克风510的声音传递函数H0和Ha。例如,在设置了屏蔽板530和未设置屏蔽板530的两种情况下,白噪声都从位于方向θ的扬声器520中发出。通过操作处理设备的频率分析,计算被输入到扬声器520的电压信号与从麦克风510中输出的声压信号之间的传递函数。然后,操作处理设备通过等式(1)计算屏蔽板530的声音传递特性。这样,对于多个扬声器520的每一个(不同的)方向θ和多个屏蔽板的每一个(不同的)尺寸,测量屏蔽板530的声音传递特性。在此,扬声器520的方向θ对应于声像方向。
图2至图6示出屏蔽板530的声音传递特性的例子。图2示出使用直径为4cm的圆形屏蔽板时屏蔽板530的声音传递特性的测量结果。图3示出使用直径为7cm的圆形屏蔽板时屏蔽板530的声音传递特性的测量结果。图4示出使用直径为10cm的圆形屏蔽板时屏蔽板530的声音传递特性的测量结果。图5示出使用直径为12cm的圆形屏蔽板时屏蔽板530的声音传递特性的测量结果。图6示出使用直径为15cm的圆形屏蔽板时屏蔽板530的声音传递特性的测量结果。另外,这些声音传递特性在0°到180°之间以30°的间隔分别测量。在这种情况下,扬声器520所处的位置是以麦克风510的位置为中心且半径为1.2m的半圆上。另外,为了防止反射波混入麦克风510,该测量在消音室中进行。
对于左右向声像定位的原理,通过使用双耳声级差和双耳时间差(相位差),该声像定位可以独立于前后向声像定位和上下向声像定位而被控制。双耳声级差是被呈现给收听者的双耳的音频信号(第三音频信号和第四音频信号)之间的音量级的差。双耳时间差是被呈现给收听者的双耳的音频信号之间的时间差。
图12是说明双耳声级差和双耳时间差的示意图。对于收听者Ob的左耳EL和右耳ER,根据左耳EL与声像位置S之间的距离dL以及右耳ER与声像位置S之间的距离dR,获得双耳声级差和双耳时间差。在此,作为距离dL和dR,通过忽略收听者Ob的耳廓和头的存在,使用从左耳EL和右耳ER到声像位置S的两个直线距离。因此,距离dL和dR通过下面的等式计算。
d L = ( x EL - x S ) 2 + ( y EL - y S ) 2 + ( z EL - z S ) 2 ( 2 )
d R = ( x ER - x S ) 2 + ( y ER - y S ) 2 + ( z ER - z S ) 2
其中,(xS,yS,zS):声像位置S的笛卡尔坐标,(xEL,yEL,zEL):左耳EL的位置的笛卡尔坐标,(xER,yER,zER):右耳ER的位置的笛卡尔坐标。
双耳声级差对应于从声像位置S传播到左耳EL和右耳ER的声音之间的幅度差。在此,声音的幅度与所传播的距离成反比例。双耳时间差是声音从声像位置S分别传播到左耳EL和右耳ER所花费的时间之间的差。在此,声音传播所花费的时间通过将声音所传播的距离除以声音的速度来获得。
通过使用上述的双耳声级差和双耳时间差,在呈现给收听者的双耳的音频信号(第三音频信号和第四音频信号)与原始音频信号(第二音频信号)之间的关系如下表示。
a L ( t ) = A d L a S ( t - d L c - τ ) ( 3 )
a R ( t ) = A d R a S ( t - d R c - τ )
其中,aS(t):原始音频信号(时间t的函数),aL(t):呈现给收听者的左耳的音频信号(时间t的函数),aR(t):呈现给收听者的右耳的音频信号(时间t的函数),A:任意的增益,τ:任意的时移量,c:声音的速度。
因此,被分配了左右向定位信息的第三音频信号和第四音频信号通过对被分配了前后向定位信息的第二声音信号执行放大处理和时移处理来生成。
下面详细说明图1的声像定位装置的组件。
存储单元10存储图2至图6所示的声音传递特性。具体地,存储单元10存储五种类型的声音传递特性集合。声音传递特性集合包括与多个声像方向对应的声音传递特性。这些声音传递特性可根据圆形屏蔽板(以下称为“圆盘”)获得,对于每个声音传递特性集合,圆盘的尺寸(以下称为“直径”)是不同的。在第一实施例中,如图2至图6所示,存储单元10存储根据五个直径为4cm、7cm、10cm、12cm、15cm的圆盘获得的五个声音传递特性集合。在每一个声音传递特性集合中,包括与声像方向为0°、30°、60°、90°、120°、150°、180°对应的七个声音传递特性。另外,存储单元10可存储经过反向傅立叶变换的声音传递特性。
在此说明圆盘的直径与声像定位的强调度之间的关系。
图7是对照图,其示出与扬声器的同一方向(150°)对应的由于圆盘的直径而导致的声音传递特性之间的差异。如图7所示,如果直径较大,则在最低频率侧的下降(图7中的Ο)被偏移到较低的频率侧。因此,在声音传递特性中下降的位置(频率)表示由于圆盘的直径不同而导致的差异。
另外,图8是示出圆盘中心附近的声压级的例子的图。在此,扬声器的音量被调整,以使得在未设置圆盘的条件下,在麦克风的位置处的声压级是73dB。
如图8所示,由于圆盘的影响,当扬声器的方向θ是前方0°~90°时,声压级增加。另一方面,当扬声器的方向θ是后方90°~180°时,声压级降低。另外,如果圆盘的直径变大,则该影响变大,声压级的变化量也变大。特别地,在后方90°~180°处,示出了显著的影响。
该声压级的变化量被认为是对声像的定位感的强调度的影响。因此,为了调整定位感的强调度,与同一声像方向对应的声压级最好变化。简单来说,通过适当地选择与同一声像方向对应的并根据具有不同直径的圆盘获取的声音传递特性,定位感的强调度可被调整。
另外,在第一实施例中,存储单元10存储根据直径为4cm、7cm、10cm、12cm、15cm的五个圆盘获得的五个声音传递特性集合。然而,存储单元10可以存储根据两个圆盘获得的至少两个声音传递特性集合。另外,圆盘的直径(下降的频率)可以被适当地选择,以使得下降的频率被包括在人类可听见的频率范围内(例如,20Hz~20kHz)。
优选地,作为圆盘的直径(下降的频率),通过将收听者的耳朵的大小d设置为基准,指示用于该大小d的比例因子n1和n2(n1<n2)。在此,与长度d×n1对应的频率是上限,与长度d×n2对应的频率是下限。通过设置具有上限和下限的范围,直径可以被适当地选择,以使得下降的频率被包括在该范围内。
另外,比例因子可事先通过调查表调查,作为定位感的强调度有效地作用于人类的听觉的范围。例如,当使用尺寸从耳朵的大小的一半(直径2cm)至四倍(直径16cm)的屏蔽板时,频率范围大约是2kHz~17kHz。因此,当下降的频率等于与耳朵的大小对应的频率时,通过将定位感的强调度(正常感觉)设置为基准,定位感的强调度可对每个收听者相对地调整到该基准。
根据方向指示信息和强调度指示信息,选择单元20从存储单元10中选择最适合于每个信息(方向指示信息和强调度指示信息)的声音传递特性。
在此,方向指示信息用于指示将被呈现给收听者的声像的方向。具体地,方向指示信息包括表示声像方向的角度。例如,在诸如电影或游戏的内容中,通过事前在内容记录媒体内记录将被呈现给收听者的声像方向(通过内容生成器),方向指示信息作为声像信息从内容记录媒体中获取。另外,例如,在收听者自由地指示声像方向的服务中,通过由收听者经由输入单元50指示,可以获取方向指示信息。
另外,强调度指示信息用于指示声像的定位感的强调度。例如,强调度可以被分成从低级别到高级别的五个级别(1,2,3,4,5)。强调度指示信息可以通过由收听者经由输入单元50输入与收听者的喜好匹配的级别来获得。
强调度的级别对应于圆盘的直径(下降的频率)。简单来说,在第一实施例中,从直径为4cm的圆盘获得的声音传递特性集合对应于级别1。从直径为7cm的圆盘获得的声音传递特性集合对应于级别2。从直径为10cm的圆盘获得的声音传递特性集合对应于级别3。从直径为12cm的圆盘获得的声音传递特性集合对应于级别4。从直径为15cm的圆盘获得的声音传递特性集合对应于级别5。
选择单元20从输入单元50获得强调度指示信息,并从存储单元10中选择与由强调度指示信息指示的级别相对应的声音传递特性集合。另外,选择单元20从输入单元50获取方向指示信息,并从所选择的声音传递特性集合中选择最适合于由方向指示信息指示的声像方向的声音传递特性。在此,合适的声音传递特性如下定义。
简单来说,如果存储单元10存储与由方向指示信息指示的声像方向对应的声音传递特性,则该声音传递特性被称为合适的声音传递特性。
另外,如果存储单元10没有存储与由方向指示信息指示的声像方向对应的声音传递特性,则与同由方向指示信息指示的声像方向具有最小差的声像方向对应的声音传递特性(存储在存储单元10中)被称为合适的声音传递特性。在这种情况下,如果存储单元10存储多个具有最小差的声音传递特性,则例如与最靠后的方向(最接近180°)对应的声音传递特性被选择为合适的声音传递特性。另外,在存储在存储单元10中的声音传递特性中,通过使用与最接近于由方向指示信息指示的方向的两个声像方向对应的两个声音传递特性,通过对这两个声音传递特性进行插值而创建的声音传递特性可被称为合适的声音传递特性。
第一操作单元30获取由选择单元20选择的合适的声音传递特性。通过将合适的声音传递特性与从外部输入的音频信号(第一音频信号)进行卷积,第一操作单元30获取被分配了前后向定位信息的音频信号(第二音频信号)。例如,如下面的等式,通过将音频信号输入声音传递特性的反向傅里叶变换被设置为每个抽头(tap)的滤波系数的FIR(有限脉冲响应)滤波器,第一操作单元30可操作卷积运算。
y [ n ] = &Sigma; k = 0 N - 1 h [ k ] x [ n - k ] - - - ( 4 )
其中,x[n]:输入信号,y[n]:输出信号,h[n]:滤波系数,N:抽头长度。
根据距离指示信息,第二操作单元40将双耳声级差和双耳时间差分配给通过第一操作单元30获得的音频信号(第二音频信号),并获得用于左耳的音频信号(第三音频信号)和用于右耳的音频信号(第四音频信号)。
在此,距离指示信息用于指示将被呈现收听者的声像的距离(声像距离)。具体地,距离指示信息包括声像位置与左耳之间的距离dL、声像位置与右耳之间的距离dR、增益A和时移量τ。
另外,dL和dR可以事先根据收听者或平均的收听者的双耳之间的距离来计算。另外,增益A和时移量τ可任意确定或通过使用输入单元50来调整为匹配收听者的喜好。
第二操作单元40从第一操作单元30获取音频信号(第二音频信号)并从输入单元50获取距离指示信息。接着,第二操作单元40通过等式(3)计算用于左耳的音频信号aL(第三音频信号)和用于右耳的音频信号aR(第四音频信号)。
输出单元60向收听者输出(由第二操作单元40计算的)第三音频信号和第四音频信号。当第三音频信号和第四音频信号被直接呈现给收听者的右耳和左耳时,例如,输出单元60可使用头戴式听筒或耳机。
另外,扬声器可用作输出单元60。在此,扬声器远离收听者的耳朵,第三音频信号和第四音频信号不能被直接呈现给收听者的右耳和左耳。在这种情况下,通过使用多个扬声器,从多个扬声器发出的声音被传递到收听者的右耳和左耳并被叠加。因此,第三音频信号和第四音频信号被转换,以使得叠加的结果与第三音频信号和第四音频信号相匹配,并通过多个扬声器输出。作为用于转换第三音频信号和第四音频信号的方法,可使用传统的技术。
图9是说明声音定位方法的流程图。
选择单元20从输入单元50获取方向指示信息和强调度指示信息(S101)。通过使用方向指示信息和强调度指示信息,选择单元20选择在存储单元10中存储的多个声音传递特性中的任意一个(S102)。
通过使用选择单元20所选择的声音传递特性,第一操作单元30将声音传递特性与音频信号进行卷积,并获得被分配了前后向定位信息的音频信号(S103)。
第二操作单元40从输入单元50中获取距离指示信息(S104)。通过使用距离指示信息,第二操作单元40将双耳声级差和双耳时间差分配给(在S103获得的)音频信号,并获得被分配了左右向定位信息的一对音频信号(S105)。
输出单元60向收听者输出(在S105获得的)音频信号。
根据声像定位装置及其方法,声像的定位感的强调度可被容易地调整。
第二实施例
图10是根据第二实施例的声像定位装置的框图。在图10中,声像定位装置还包括修正单元70。该单元是与图1的声像定位装置的不同点。
当使用声音传递特性时,声压级最小的扬声器的方向θ很少正好是180°。如果是圆盘,则如图8所示,声压级在“θ=130°~150°”的方向范围内最小。
另一方面,在人类的听觉中,当声像方向是后向180°时,声压级最小。出现这种差异的最大原因是人的耳廓伴随着头,而模拟耳廓的屏蔽板在空间内孤立。简单来说,当测量声音传递特性时,如果扬声器的方向θ是后向180°,则扬声器520、屏蔽板530和麦克风510对齐成直线。在这种情况下,在屏蔽板530周围的声波在麦克风510的位置叠加,而其声压级不是最小的。另一方面,当声音到达人的正后方时,在耳廓周围的声音被头中断,并没有被叠加。因此,其声压级最小。
为了修正上述的差异,修正单元70修正在方向指示信息中包括的声像方向以最小化在声像方向180°处的声压级。具体地,通过使用在方向指示信息中包括的声像方向φ,修正单元70根据下面的等式计算所修正的声像方向θ。另外,作为声像方向θ0,通过事先检查声压级最小的扬声器的方向,该扬声器的方向可以事先存储在存储单元10中。在第二实施例中,例如,扬声器的方向θ0是140°。
&theta; = &theta; 0 180 &phi; - - - ( 5 )
其中,θ:所修正的声像方向=声音传递特性中扬声器的方向,φ:在方向指示信息中包括的声像方向(0°~180°),θ0:在声音传递特性中声压级最小的扬声器的方向。
根据由修正单元70修正的声像方向θ,选择单元20从存储单元10中选择声音传递特性。
根据第二实施例的声像定位装置,当声像方向是后向180°时,声压级最小。因此,可执行适合于人类的听觉的前后向声像定位处理。
变形例
作为声音传递特性,可使用一部分频带的信息。例如,对于波长足够比屏蔽板的尺寸长的声音,该声音很难受到屏蔽板的存在的影响,在低频中,声音传递特性的值几乎等于1(0dB)。因此,声音传递特性可以不包括低频分量的信息(例如,低于500Hz)。
另外,例如,接近人类可听频率的上限(大约20kHz)的频率分量通常不包括在音频信号中。除此之外,由于用于测量声音传递特性的扬声器和麦克风的性能较差,因此,这种频率的声音传递特性不能被准确测量。因此,声音传递特性可以不包括高频分量(例如,高于17kHz)的信息。
在根据第一实施例或第二实施例的变形例的声像定位装置中,存储单元10仅存储一部分频带(500Hz~17kHz)的声音传递特性。
第一操作单元30仅将一部分频带(500Hz~17kHz)的声音传递特性(存储在存储单元10中)与音频信号进行卷积。
因此,(存储在存储单元10中的)声音传递特性的频率特性的信息量可被降低,并可以节省用于存储的硬件资源。另外,声像定位处理不需要的音频信号的频率分量被输出而无需处理。因此,可以防止音频信号质量的不必要恶化。
根据至少一个上述实施例的声像定位装置,声像的定位感的强调度可以被容易地调整。
在所公开的实施例中,处理可由在计算机可读媒体中存储的计算机程序执行。
在实施例中,计算机可读媒体可以是例如磁盘、软盘、硬盘、光盘(例如CD-ROM、CD-R、DVD)、光学磁盘(例如MD)。然而,可以使用任何被配置为存储用于使计算机执行上述处理的计算机程序的计算机可读媒体。
另外,根据从存储器设备安装到计算机中的程序的指示,在计算机上运行的OS(操作系统)或者诸如数据库管理软件或网络MW(中间件软件)可执行每个处理的一部分以实现实施例。
另外,存储器设备并不限于独立于计算机的设备。通过下载通过LAN或因特网传输的程序,存储有程序的存储器设备也可以被包括。另外,存储器设备并不限于一个。在实施例的处理由多个存储器设备执行的情况下,多个存储器设备可以被包括在存储器设备中。
计算机可以根据在存储器设备中存储的程序,执行实施例的每个处理阶段。计算机可以是诸如个人计算机的一个装置或者多个处理装置通过网络连接的系统。另外,计算机并不限于个人计算机。本领域的普通技术人员知道计算机可包括信息处理器中的处理单元、微处理器等。简而言之,可使用程序执行实施例中的功能的设备或装置通常被称为计算机。
尽管已经描述了某些实施例,但这些实施例仅作为例子提供,而不意味着限制本发明的范围。实际上,在此描述的新颖的实施例可以体现为各种其它形式;另外,在不脱离本发明的精神的情况下,可以对在此描述的实施例的形式中进行各种省略、替换和改变。后附的权利要求及其等同意在覆盖这些形式或修改以落入本发明的范围和精神内。

Claims (7)

1.一种用于定位声像的装置,包括:
存储单元,用于存储多个声音传递特性,其中每一个与声像方向和定位感的强调度对应;
选择单元,其被配置为从所述多个声音传递特性中选择合适的声音传递特性,所述合适的声音传递特性是最适合于由方向指示信息指示的声像方向和由强调度指示信息指示的强调度;以及
第一操作单元,其被配置为将所述合适的声音传递特性与第一音频信号进行卷积,以获取第二音频信号。
2.如权利要求1所述的装置,其中,
所述存储单元存储:
第一声音传递特性集合,其包括与第一声像方向对应且在第一频率处有下降的第一声音传递特性和与第二声像方向对应且在第二频率处有下降的第二声音传递特性;以及
第二声音传递特性集合,其包括与所述第一声像方向对应且在比所述第一频率低的第三频率处有下降的第三声音传递特性和与所述第二声像方向对应且在比所述第二频率低的第四频率处有下降的第四声音传递特性;
所述选择单元通过使用所述强调度指示信息来选择所述第一声音传递特性集合和所述第二声音传递特性集合中的一个,并从所选择的声音传递特性集合中选择与由所述方向指示信息指示的声像方向对应的合适的声音传递特性。
3.如权利要求1所述的装置,还包括:
第二操作单元,其被配置为通过使用指示所述声像的距离的距离指示信息来计算相位差和声级差,并通过将所述相位差和所述声级差分配给所述第二音频信号来获得第三音频信号和第四音频信号。
4.如权利要求3所述的装置,还包括:
输入单元,用于使收听者输入所述强调度指示信息;以及
输出单元,用于输出所述第三音频信号和所述第四音频信号;
其中,所述选择单元从所述输入单元获得所述强调度指示信息。
5.如权利要求1所述的装置,其中,
所述第一操作单元将所述合适的声音传递特性的一部分频带与所述第一音频信号进行卷积。
6.一种用于定位声像的方法,包括:
在存储单元中存储多个声音传递特性,其中每一个与声像方向和定位感的强调度相对应;
从所述多个声音传递特性中选择合适的声音传递特性,所述合适的声音传递特性最适合于由方向指示信息指示的声像方向和由强调度指示信息指示的强调度;以及
将所述合适的声音传递特性与第一音频信号进行卷积,以获取第二音频信号。
7.如权利要求6所述的方法,还包括:
通过使用指示所述声像的距离的距离指示信息,计算相位差和声级差;以及
通过将所述相位差和所述声级差分配给所述第二音频信号来获得第三音频信号和第四音频信号。
CN201310033653.5A 2012-06-15 2013-01-29 定位声像的装置和方法 Pending CN103517199A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP136407/2012 2012-06-15
JP2012136407 2012-06-15

Publications (1)

Publication Number Publication Date
CN103517199A true CN103517199A (zh) 2014-01-15

Family

ID=49755942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310033653.5A Pending CN103517199A (zh) 2012-06-15 2013-01-29 定位声像的装置和方法

Country Status (3)

Country Link
US (1) US9264812B2 (zh)
JP (1) JP6143571B2 (zh)
CN (1) CN103517199A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105007553A (zh) * 2015-07-23 2015-10-28 惠州Tcl移动通信有限公司 一种移动终端的声音定向传输方法及移动终端
CN107251578A (zh) * 2015-02-25 2017-10-13 株式会社索思未来 信号处理装置
CN107258091A (zh) * 2015-02-12 2017-10-17 杜比实验室特许公司 用于耳机虚拟化的混响生成
CN107979807A (zh) * 2016-10-25 2018-05-01 北京酷我科技有限公司 一种模拟环绕立体声的方法及系统
CN112188358A (zh) * 2019-07-04 2021-01-05 歌拉利旺株式会社 音频信号处理装置、音频信号处理方法及非易失性计算机可读记录介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9485578B2 (en) * 2012-12-14 2016-11-01 Queen Mary University Of London Audio format
JP6701824B2 (ja) * 2016-03-10 2020-05-27 株式会社Jvcケンウッド 測定装置、フィルタ生成装置、測定方法、及びフィルタ生成方法
JP6788272B2 (ja) * 2017-02-21 2020-11-25 オンフューチャー株式会社 音源の検出方法及びその検出装置
JP7225067B2 (ja) 2019-09-18 2023-02-20 株式会社東芝 音響制御装置、方法、プログラム、及びこの装置を備える機器

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1419796A (zh) * 2000-12-25 2003-05-21 索尼株式会社 虚拟音像定位处理装置、虚拟音像定位处理方法以及记录介质
US20050147261A1 (en) * 2003-12-30 2005-07-07 Chiang Yeh Head relational transfer function virtualizer
US20050271212A1 (en) * 2002-07-02 2005-12-08 Thales Sound source spatialization system
CN101361123A (zh) * 2006-11-27 2009-02-04 索尼计算机娱乐公司 声音处理装置和声音处理方法
US20100202633A1 (en) * 2008-01-29 2010-08-12 Korea Advanced Institute Of Science And Technology Sound system, sound reproducing apparatus, sound reproducing method, monitor with speakers, mobile phone with speakers

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06269097A (ja) * 1993-03-11 1994-09-22 Sony Corp 音響装置
JPH08126099A (ja) * 1994-10-25 1996-05-17 Matsushita Electric Ind Co Ltd 音場信号再生装置
US6035045A (en) * 1996-10-22 2000-03-07 Kabushiki Kaisha Kawai Gakki Seisakusho Sound image localization method and apparatus, delay amount control apparatus, and sound image control apparatus with using delay amount control apparatus
JP3266020B2 (ja) * 1996-12-12 2002-03-18 ヤマハ株式会社 音像定位方法及び装置
KR100906136B1 (ko) * 2003-12-12 2009-07-07 닛본 덴끼 가부시끼가이샤 정보 처리용 로봇
JP2006203850A (ja) * 2004-12-24 2006-08-03 Matsushita Electric Ind Co Ltd 音像定位装置
JP5206137B2 (ja) * 2008-06-10 2013-06-12 ヤマハ株式会社 音響処理装置、スピーカ装置および音響処理方法
JP2010187363A (ja) * 2009-01-16 2010-08-26 Sanyo Electric Co Ltd 音響信号処理装置及び再生装置
KR101567461B1 (ko) * 2009-11-16 2015-11-09 삼성전자주식회사 다채널 사운드 신호 생성 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1419796A (zh) * 2000-12-25 2003-05-21 索尼株式会社 虚拟音像定位处理装置、虚拟音像定位处理方法以及记录介质
US20050271212A1 (en) * 2002-07-02 2005-12-08 Thales Sound source spatialization system
US20050147261A1 (en) * 2003-12-30 2005-07-07 Chiang Yeh Head relational transfer function virtualizer
CN101361123A (zh) * 2006-11-27 2009-02-04 索尼计算机娱乐公司 声音处理装置和声音处理方法
US20100202633A1 (en) * 2008-01-29 2010-08-12 Korea Advanced Institute Of Science And Technology Sound system, sound reproducing apparatus, sound reproducing method, monitor with speakers, mobile phone with speakers

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107258091A (zh) * 2015-02-12 2017-10-17 杜比实验室特许公司 用于耳机虚拟化的混响生成
US10149082B2 (en) 2015-02-12 2018-12-04 Dolby Laboratories Licensing Corporation Reverberation generation for headphone virtualization
US10382875B2 (en) 2015-02-12 2019-08-13 Dolby Laboratories Licensing Corporation Reverberation generation for headphone virtualization
CN107258091B (zh) * 2015-02-12 2019-11-26 杜比实验室特许公司 用于耳机虚拟化的混响生成
US10750306B2 (en) 2015-02-12 2020-08-18 Dolby Laboratories Licensing Corporation Reverberation generation for headphone virtualization
US11140501B2 (en) 2015-02-12 2021-10-05 Dolby Laboratories Licensing Corporation Reverberation generation for headphone virtualization
US11671779B2 (en) 2015-02-12 2023-06-06 Dolby Laboratories Licensing Corporation Reverberation generation for headphone virtualization
CN107251578A (zh) * 2015-02-25 2017-10-13 株式会社索思未来 信号处理装置
CN107251578B (zh) * 2015-02-25 2018-11-06 株式会社索思未来 信号处理装置
CN105007553A (zh) * 2015-07-23 2015-10-28 惠州Tcl移动通信有限公司 一种移动终端的声音定向传输方法及移动终端
CN107979807A (zh) * 2016-10-25 2018-05-01 北京酷我科技有限公司 一种模拟环绕立体声的方法及系统
CN112188358A (zh) * 2019-07-04 2021-01-05 歌拉利旺株式会社 音频信号处理装置、音频信号处理方法及非易失性计算机可读记录介质

Also Published As

Publication number Publication date
JP6143571B2 (ja) 2017-06-07
JP2014017813A (ja) 2014-01-30
US9264812B2 (en) 2016-02-16
US20130336490A1 (en) 2013-12-19

Similar Documents

Publication Publication Date Title
CN103517199A (zh) 定位声像的装置和方法
CN103634726B (zh) 一种扬声器自动均衡方法
CN102972047B (zh) 用于再现立体声的方法和设备
WO2018008395A1 (ja) 音場形成装置および方法、並びにプログラム
US20140105405A1 (en) Method and Apparatus for Creating Spatialized Sound
US10341799B2 (en) Impedance matching filters and equalization for headphone surround rendering
CN106535039A (zh) 基于响度的音频信号补偿
CN106664497A (zh) 音频再现系统和方法
CN104604254A (zh) 声音处理装置、方法和程序
Olive et al. The relationship between perception and measurement of headphone sound quality
CN113553022A (zh) 设备调整方法、装置、移动终端及存储介质
CN112584277A (zh) 一种室内音频均衡的方法
CN104581541A (zh) 一种可定位多媒体视听装置及其控制方法
US20210211810A1 (en) Partial hrtf compensation or prediction for in-ear microphone arrays
US10659903B2 (en) Apparatus and method for weighting stereo audio signals
CN117376784A (zh) 单声道立体声场扩展方法、电子设备及存储介质
Neal Investigating the sense of listener envelopment in concert halls using third-order Ambisonic reproduction over a loudspeaker array and a hybrid room acoustics simulation method
Stephenson Assessing the quality of low frequency audio reproduction in critical listening spaces
CN110301142A (zh) 滤波器生成装置、滤波器生成方法以及程序
US11012802B2 (en) Computing system for binaural ambisonics decoding
US20200044620A1 (en) Audio processing
JP2015211235A (ja) 立体音再生装置およびプログラム
Griesinger Accurate reproduction of binaural recordings through individual headphone equalization and time domain crosstalk cancellation
Lindborg et al. Design of an interactive earphone simulator and results from a perceptual experiment
WO2022176417A1 (ja) 情報処理装置、情報処理方法、及び、プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140115