CN112567766B - 信号处理装置、信号处理方法和介质 - Google Patents

信号处理装置、信号处理方法和介质 Download PDF

Info

Publication number
CN112567766B
CN112567766B CN201980052823.XA CN201980052823A CN112567766B CN 112567766 B CN112567766 B CN 112567766B CN 201980052823 A CN201980052823 A CN 201980052823A CN 112567766 B CN112567766 B CN 112567766B
Authority
CN
China
Prior art keywords
head
transfer function
related transfer
frequency band
signal processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201980052823.XA
Other languages
English (en)
Other versions
CN112567766A (zh
Inventor
佐藤広则
中川亨
曲谷地哲
冲本越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN112567766A publication Critical patent/CN112567766A/zh
Application granted granted Critical
Publication of CN112567766B publication Critical patent/CN112567766B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

本公开涉及信号处理装置、信号处理方法和程序,其使得可以在所有频带中容易实现头部相关传递函数的个性化。合成单元通过合成从用户的第一头部相关传递函数提取的第一频带的特性和从第二头部相关传递函数提取的除了第一频带之外的第二频带的特性,来生成第三头部相关传递函数,第二头部相关传递函数在与测量第一头部相关传递函数的第一测量环境不同的第二测量环境中测量。本公开可以应用于便携式终端,例如,智能手机。

Description

信号处理装置、信号处理方法和介质
技术领域
本公开涉及信号处理装置、信号处理方法和程序,并且尤其涉及能够容易地实现头部相关传递函数的个性化的信号处理装置、信号处理方法和程序。
背景技术
已知有一种技术,该技术使用表示声音如何从声源传递到耳朵的头部相关传递函数(HRTF)用耳机三维再现声像。
例如,专利文献1公开了一种移动终端,该移动终端使用利用虚拟头部测量的HRTF再现立体声。
然而,由于HRTF的个体性,使用虚拟头部测量HRTF时,不可能实现精确的声像定位。同时,众所周知,可以通过测量听者自己的HRTF来个性化HRTF,来实现精确的声像定位。
然而,在测量听者自己的HRTF的情况下,需要使用大型设备,例如,消声室和大扬声器。
引用列表
专利文献
专利文献1:日本专利申请公开号2009-260574。
发明内容
本发明要解决的问题
鉴于上述情况,例如,如果可以使用智能手机作为声源来测量听者自己的HRTF,则无需使用大型设备就可以轻松实现HRTF的个性化。
然而,由于智能手机的扬声器具有窄的再现频带,所以测量具有足够特性的HRTF是不可行的。
鉴于这种情况而构思本公开,并且旨在容易地在所有频带中实现头部相关传递函数的个性化。
问题的解决方案
根据本公开的信号处理装置是一种信号处理装置,包括:合成单元,通过合成从用户的第一头部相关传递函数提取的第一频带的特性和从第二头部相关传递函数提取的除了第一频带之外的第二频带的特性,来生成第三头部相关传递函数,第二头部相关传递函数在与测量第一头部相关传递函数的第一测量环境不同的第二测量环境中测量。
根据本公开的信号处理方法包括通过合成从用户的第一头部相关传递函数提取的第一频带的特性和从第二头部相关传递函数提取的除了第一频带之外的第二频带的特性,来生成第三头部相关传递函数,第二头部相关传递函数在与测量第一头部相关传递函数的第一测量环境不同的第二测量环境中测量。
根据本公开的程序使计算机执行以下过程:通过合成从用户的第一头部相关传递函数提取的第一频带的特性和从第二头部相关传递函数提取的除了第一频带之外的第二频带的特性,来生成第三头部相关传递函数,第二头部相关传递函数在与测量第一头部相关传递函数的第一测量环境不同的第二测量环境中测量。
在本公开中,通过合成从用户的第一头部相关传递函数提取的第一频带的特性和从第二头部相关传递函数提取的除了第一频带之外的第二频带的特性,来生成第三头部相关传递函数,第二头部相关传递函数在与测量第一头部相关传递函数的第一测量环境不同的第二测量环境中测量。
本发明的效果
根据本公开,可以容易地实现头部相关传递函数的个性化。
注意,本文描述的效果不一定受到限制,并且可以是本公开中描述的任意效果。
附图说明
图1是示出应用了根据本公开的技术的移动终端的示例性配置的框图;
图2是示出移动终端的示例性功能配置的框图;
图3是示出生成头部相关传递函数的过程的流程图;
图4是示出根据第一实施例的移动终端的示例性配置的框图;
图5是示出生成头部相关传递函数的过程的流程图;
图6是示出多个声道的头部相关传递函数的测量的示图;
图7是示出头部相关传递函数的频带提取的曲线图;
图8是示出混响分量的添加的曲线图;
图9是示出使用NC麦克风时的特性校正的曲线图;
图10是示出输出单元的示例性配置的示图;
图11是示出频率特性变化的示图;
图12是示出根据第二实施例的移动终端的示例性配置的框图;
图13是示出生成头部相关传递函数的过程的流程图;
图14是示出水平方向上的头部相关传递函数的估计的示图;
图15是示出估计滤波器的示例性频率特性的曲线图;
图16是示出生成头部相关传递函数的过程的流程图;
图17是示出正中面和矢状面的头部相关传递函数的测量的示图;
图18是示出计算机的示例性配置的框图。
具体实施方式
在下文中,将描述用于执行本公开的模式(以下称为实施例)。注意,将按以下顺序给出描述。
1.应用根据本公开的技术的移动终端的配置和操作
2.第一实施例(多个声道的头部相关传递函数的测量)
3.第二实施例(前向的头部相关传递函数的测量)
4.第三实施例(正中面的头部相关传递函数的测量)
5.其他
<1.应用根据本公开的技术的移动终端的配置和操作>
(移动终端的配置)
首先,将参照图1描述作为应用根据本公开的技术的信号处理装置的移动终端的示例性配置。
图1所示的移动终端1被配置为例如移动电话,例如,所谓的智能手机。
移动终端1包括控制单元11。控制单元11控制移动终端1中每个单元的操作。控制单元11经由控制线28与移动终端1中的每个单元交换数据。
此外,移动终端1包括执行必要的无线通信的通信单元12作为通信终端。天线13连接到通信单元12。通信单元12与用于无线通信的基站进行无线通信,并与基站进行双向数据传输。通信单元12经由数据线29将从基站侧接收的数据发送到移动终端1中的每个单元。此外,通信单元12 经由数据线29将从移动终端1中的每个单元发送的数据发送到基站侧。
除了通信单元12之外,存储器14、显示单元15、音频处理单元17 和立体声处理单元21连接到数据线29。
存储器14存储操作移动终端1所需的程序、用户存储的各种数据等。存储器14还存储音频信号,例如,通过下载等获得的音乐数据。
显示单元15包括液晶显示器、有机电致发光(EL)显示器等,并且在控制单元11的控制下显示各种信息。
操作单元16包括与显示单元15中包括的显示器集成的触摸面板、设置在移动终端1的外壳上的物理按钮等。作为触摸面板(操作单元16)的显示单元15显示表示诸如数字和符号的拨号键、各种功能键等的按钮。每个按钮的操作信息被提供给控制单元11。
音频处理单元17是处理音频信号的处理单元,并且扬声器18和麦克风19连接到其上。扬声器18和麦克风19在呼叫期间用作手机。
从通信单元12提供给音频处理单元17的音频数据被音频处理单元17 解调为模拟音频信号,这些模拟音频信号经过诸如放大的模拟处理并从扬声器18发出。此外,由麦克风19收集的语音的音频信号由音频处理单元17调制成数字音频数据,并且调制的音频数据被提供给通信单元12,以执行无线传输等。
此外,在提供给音频处理单元17的音频数据中,作为立体声输出的语音被提供给立体声处理单元21,并被处理。
立体声处理单元21生成再现双耳立体声的双声道音频信号。除了从音频处理单元17提供之外,要由立体声处理单元21处理的音频信号可以从存储器14等读取,以通过数据线29提供,或者由通信单元12接收的音频数据可以通过数据线29提供。
由立体声处理单元21生成的音频信号从内置在移动终端1的主单元中的左声道和右声道的两个扬声器22L和22R输出,或者从连接到输出端23的耳机(未示出)输出。
扬声器22L和22R是使用内置在移动终端1的主体中的相对较小的扬声器单元的扬声器,这些扬声器是在移动终端1的主体周围的收听者能够听到再现的声音的程度上放大并输出再现的声音的扬声器。
在从耳机(未示出)输出音频信号的情况下,除了通过布线将耳机直接连接到输出端23之外,例如,可以使用诸如蓝牙(注册商标)的方案与耳机进行无线通信,以将音频信号提供给耳机。
图2是示出上述移动终端1的示例性功能配置的框图。
图2的移动终端1包括测量单元51、频带提取单元52、HRTF数据库 53、频带提取单元54、合成单元55、音频输入单元56和输出单元57。
测量单元51测量操作移动终端1的用户的头部相关传递函数(HRTF)。例如,测量单元51基于再现诸如脉冲信号的测量声波的声源,获得头部相关传递函数,该声源相对于用户设置在一个或多个方向上。
如果用于再现测量声波的声源是包括至少一个扬声器的一个装置,并且扬声器不必具有宽的再现频带,这就足够了。
例如,用于再现测量声波的声源可以是移动终端1的扬声器18。在这种情况下,用户在预定方向上设置移动终端1,并使佩戴在用户左耳和右耳上的麦克风(未示出)收集来自扬声器18的测量声波。测量单元51基于由预定装置提供的来自麦克风的音频信号,获得用户的头部相关传递函数Hm。
频带提取单元52从由测量单元51测量的头部相关传递函数Hm中提取第一频带的特性。提取的第一频带的头部相关传递函数Hm被提供给合成单元55。
HRTF数据库53保存在与测量头部相关传递函数Hm的当前测量环境不同的测量环境中测量的头部相关传递函数Hp。头部相关传递函数Hp 被定义为预先测量的预设数据,不同于使用例如由用户设置的移动终端1 的扬声器18实际测量的头部相关传递函数Hm。头部相关传递函数Hp被定义为例如在理想的测量环境中测量的头部相关传递函数,该理想的测量环境配备有用于虚拟头部或具有平均形状的头部和耳朵的人的设施,例如,消声室和大扬声器。
频带提取单元54从存储在HRTF数据库53中的头部相关传递函数中,提取除上述第一频带之外的第二频带的特性。提取的第二频带的头部相关传递函数Hp被提供给合成单元55。
合成单元55合成来自频带提取单元52的第一频带的头部相关传递函数Hm和来自频带提取单元54的第二频带的头部相关传递函数Hp,从而在所有频带中生成头部相关传递函数H。即,头部相关传递函数H是具有第一频带的头部相关传递函数Hm的频率特性和第二频带的头部相关传递函数Hp的频率特性的头部相关传递函数。生成的头部相关传递函数H被提供给输出单元57。
音频输入单元56向输出单元57输入作为要再现的立体声的声源的音频信号。
输出单元57将来自合成单元55的头部相关传递函数H与从音频输入单元56输入的音频信号进行卷积,并且输出这些信号,作为双声道音频信号。从输出单元57输出的音频信号是再现双耳立体声的音频信号。
(移动终端的操作)
接下来,将参考图3的流程图描述移动终端1生成头部相关传递函数的过程。
在步骤S1,测量单元51通过使用智能手机(移动终端1)作为声源,来测量头部相关传递函数Hm。
在步骤S2,频带提取单元52从测量的头部相关传递函数Hm中提取第一频带的特性。第一频带可以是从预定的第一频率f1到高于频率f1的第二频率f2的频带,或者可以简单地是高于频率f1的频带。第一频带被定义为个体相关特性特别可能出现的频带。
在步骤S3,频带提取单元54从保留在HRTF数据库53中的预设头部相关传递函数Hp提取第二频带的特性。第二频带可以是包括低于频率 f1的频带和高于频率f2的频带的频带,或者可以简单地是包括低于频率 f1的频带的频带。第二频带被定义为个体相关特性不太可能出现并且也不能被智能手机重现的频带。
在步骤S4,合成单元55通过合成提取的第一频带的头部相关传递函数Hm和第二频带的头部相关传递函数Hp,来生成头部相关传递函数H。
根据上述过程,从实际测量的头部相关传递函数中提取可能出现个体相关特性的频带的特性,并且从预设的头部相关传递函数中提取不太可能出现并且不能由智能手机再现的个体相关特性的频带的特性。因此,即使在使用具有窄再现频带作为声源的智能手机来测量用户的头部相关传递函数的情况下,也可以获得具有足够特性的头部相关传递函数,由此可以在不使用大型设备的情况下容易地实现所有频带中的头部相关传递函数的个性化。
在下文中,将描述根据本公开技术的实施例。
<2.第一实施例>
(移动终端的配置)
图4是示出根据本公开的技术的第一实施例的移动终端1的示例性配置的示图。
图4的移动终端1包括带通滤波器111、校正单元112和均衡器113。此外,移动终端1包括混响分量分离单元121、高通滤波器131、均衡器 132、带通滤波器141、均衡器142、低通滤波器151、均衡器152、合成单元161和混响分量添加单元162。
带通滤波器111从实际测量的头部相关传递函数Hm中提取适中范围的特性。适中范围(midrange)被定义为从预定的第一频率f1到高于频率 f1的第二频率f2的频带。提取的适中范围的头部相关传递函数Hm被提供给校正单元112。
校正单元112使用移动终端1的扬声器18的逆特性来校正头部相关传递函数Hm,使得移除头部相关传递函数Hm中包括的扬声器18的特性。扬声器18的逆特性是预先测量的预设数据,其指示移动终端1的每个型号的不同特性。已经移除扬声器18的特性的适中范围的头部相关传递函数Hm,被提供给均衡器113。
均衡器113调整适中范围的头部相关传递函数Hm的频率特性,并将其输出到合成单元161。
混响分量分离单元121在时域中,分离表示作为预设数据的头部相关传递函数Hp的头部脉冲响应中的直接分量和混响分量。分离的混响分量被提供给混响分量添加单元162。对应于分离的直接分量的头部相关传递函数Hp,被提供给高通滤波器131、带通滤波器141和低通滤波器151 中的每一个。
高通滤波器131从头部相关传递函数Hp中提取高频特性。高频带被定义为高于上述频率f2的频带。提取的高频的头部相关传递函数Hp被提供给均衡器132。
均衡器132调整高频的头部相关传递函数Hp的频率特性,并将其输出到合成单元161。
带通滤波器141从头部相关传递函数Hp中提取适中范围特性。提取的适中范围的头部相关传递函数Hp,被提供给均衡器142。
均衡器142调整适中范围的头部相关传递函数Hp的频率特性,并将其输出到合成单元161。此时,适中范围的头部相关传递函数Hp可能会经历将其增益设置为零或基本为零的过程。
低通滤波器151从头部相关传递函数Hp中提取低频特性。低频带被定义为低于上述频率f1的频带。提取的低频的头部相关传递函数Hm,被提供给均衡器152。
均衡器152调整低频的头部相关传递函数Hp的频率特性,并将其输出到合成单元161。
合成单元161合成来自均衡器113的适中范围的头部相关传递函数 Hm、来自均衡器132的高频的头部相关传递函数Hp和来自均衡器152 的低频的头部相关传递函数Hp,以在所有频带中生成头部相关传递函数 H。生成的头部相关传递函数H被提供给混响分量添加单元162。
混响分量添加单元162将来自混响分量分离单元121的混响分量,添加到来自合成单元161的头部相关传递函数H。添加了混响分量的头部相关传递函数H,用于输出单元57中的卷积。
(生成头部相关传递函数的过程)
图5是示出由图4的移动终端1执行的生成头部相关传递函数的过程的流程图。
在步骤S11中,测量单元51(图2)通过使用智能手机(移动终端1) 作为声源,来测量多个声道的头部相关传递函数Hm。因此,对于已经测量了头部相关传递函数的多个声道,可以定位虚拟声源。
例如,如图6的A的左侧图所示,假设用户U已经测量了头部相关传递函数,同时他/她的手握着智能手机SP,并且他/她的手臂向左和向右对角向前延伸。在这种情况下,如图6的A的右侧图所示,虚拟声源VS1 和VS2可以分别位于用户U的向左和向右对角前方。
此外,如图6的B的左侧图所示,假设用户U已经测量了头部相关传递函数,同时他/她的手握着智能手机SP,并且他/她的手臂在他/她的前方、向左和向右对角向前、以及向左和向右横向延伸。在这种情况下,如图6的B的右侧图所示,虚拟声源VS1、VS2、VS3、VS4和VS5可以分别位于用户U的前方、向左和向右对角向前、以及向左和向右横向。
在步骤S12中,带通滤波器111从测量的头部相关传递函数Hm中提取适中范围特性。在校正单元112移除扬声器18的特性之后,均衡器113 调整提取的适中范围的头部相关传递函数Hm的频率特性。
在步骤S13中,高通滤波器131和低通滤波器151从保留在HRTF数据库53中的预设头部相关传递函数Hp中提取低频和高频特性。均衡器 152调整提取的低频的头部相关传递函数Hp的频率特性,并且均衡器132 调整高频的头部相关传递函数Hp的频率特性。可以预先执行步骤S13的处理。
注意,由混响分量分离单元121从对应于预设头部相关传递函数Hp 的头部脉冲响应中,分离混响分量。分离的混响分量被提供给混响分量添加单元162。
在步骤S14中,合成单元161通过合成提取的低频的头部相关传递函数Hm以及低频和高频的头部相关传递函数Hp,来生成头部相关传递函数H。
图7的A和B是分别示出实际测量的头部相关传递函数Hm和预设的头部相关传递函数Hp的频率特性的曲线图。
在图7的A中,由虚线框FM包围的频带的特性,指示要由带通滤波器111从头部相关传递函数Hm中提取的适中范围特性。例如,适中范围被定义为从1kHz到12kHz的频带。
同时,在图7的B中,由虚线框FL包围的频带的特性,指示要由低通滤波器151从头部相关传递函数Hp提取的低频特性。例如,低频被定义为低于1kHz的频带。此外,在图7的B中,由虚线框FH包围的频带的特性,指示要由高通滤波器131从头部相关传递函数Hp提取的高频特性。例如,高频被定义为高于12kHz的频带。
以这种方式提取的从1kHz到12kHz的频带的头部相关传递函数Hm 和低于1kHz的频带和高于12kHz的频带的头部相关传递函数Hp合成,从而在所有频带中生成头部相关传递函数H。
在不能由具有小扬声器直径和窄再现频带的智能手机再现的低于 1kHz的频带中,在头部相关传递函数中不太可能出现个体相关特性,并且即使在用预设特性替换的情况下,也可以获得足够的声像定位精度。此外,高于12kHz的频带对声像定位的贡献很小,并且即使在用预设特性替换的情况下,声像定位精度也不受影响,并且基于预设特性期望高音质。
在步骤S15中,混响分量添加单元162将来自混响分量分离单元121 的混响分量添加到来自合成单元161的头部相关传递函数H。
图8的A和B是示出头部脉冲响应的曲线图,其中,分别在时域中表示实际测量的头部相关传递函数Hm和预设的头部相关传递函数Hp。
在图8的A中,由虚线框FD包围的波形,指示对应于实际测量的头部相关传递函数Hm的头部脉冲响应Im的直接分量。
另一方面,在图8的B中,由虚线框FR包围的波形,指示对应于预设的头部相关传递函数Hp的头部脉冲响应Ip的混响分量。
在图8的示例中,实际测量的头部脉冲响应Im的混响分量的波形幅度小于预设的头部脉冲响应Ip的波形幅度。这些波形幅度的幅度关系根据使用智能手机的扬声器的测量环境而不同,并且实际测量的头部脉冲响应Im的混响分量的波形幅度可以大于预设头部脉冲响应Ip的波形幅度。
在混响分量添加单元162中,从头部脉冲响应Ip分离的混响分量被添加到来自合成单元161的头部相关传递函数H。添加了混响分量的头部相关传递函数H,用于输出单元57中的卷积。
根据上述过程,即使在使用具有窄再现频带的智能手机作为声源来测量用户的头部相关传递函数的情况下,也可以获得具有足够特性的头部相关传递函数。即,在不使用大型设备的情况下,可以容易地在所有频带中实现头部相关传递函数的个性化。
此外,由于头部脉冲响应的混响分量不依赖于个体,所以即使在预设的头部脉冲响应被添加到实际测量的头部脉冲响应的情况下,也可以实现头部相关传递函数的个性化。此外,即使在通过用户的手臂伸展测量与头部相关的传递函数的情况下,也可以以基于预设头部脉冲响应的混响特性来定位虚拟声源的方式控制距离感,该虚拟声源使其听起来好像扬声器被放置在几米的距离处。
(使用噪声消除麦克风)
在上述头部相关传递函数的测量中,可以使用市场上可买到的噪声消除麦克风(NC麦克风),作为佩戴在用户的左耳和右耳上的麦克风。
图9是示出使用NC麦克风和智能手机扬声器测量的头部相关传递函数Hn的特性、和使用专用于同一收听者的理想测量环境中的测量的扬声器和麦克风测量的头部相关传递函数Hd的特性的曲线图。
在图中,头部相关传递函数Hn的增益在低于1kHz的频带中小,因为在该频带中智能手机扬声器的增益小。
此外,在使用实际测量的头部相关传递函数的特性的适中范围(由虚线框FM包围的频带)中,头部相关传递函数Hd和头部相关传递函数Hn 之间可能存在差异,如图中白色箭头所示。
鉴于以上所述,预先为每个NC麦克风记录这种差异数据,并将其用作实际测量的头部相关传递函数的特性的校正量。由例如校正单元112执行基于差异数据的校正。利用这种设置,即使在使用市场上可买到的NC 麦克风的情况下,实际测量的头部相关传递函数的特性也可以接近在理想测量环境中测量的头部相关传递函数的特性。
(音色变化)
在本实施例中,可以改变立体声的音色,而不改变虚拟声源的声像定位。
图10是示出输出单元57(图2)的示例性配置的示图。
输出单元57配备有有限脉冲响应(FIR)滤波器181L和181R。
FIR滤波器181L相对于来自音频输入单元56(图2)的音频信号,卷积来自合成单元55的头部相关传递函数H的用于左耳的头部相关传递函数HL,从而输出用于左耳的音频信号SL。
类似地,FIR滤波器181R相对于来自音频输入单元56的音频信号,卷积来自合成单元55的头部相关传递函数H的用于右耳的头部相关传递函数HR,从而输出用于右耳的音频信号SR。
注意,输出单元57具有图10所示的要被定位的虚拟声源的数量的配置,并且添加和合成来自每个配置的音频信号SL和SR,以被输出。
由于FIR滤波器181L和181R具有线性相位特性,所以可以在保持相位特性的同时改变频率特性。例如,如图11所示,通过将FIR滤波器 181L和181R应用于一个脉冲响应190,可以将频率特性设置为特性191 或特性192。
结果,立体声的音色可以改变为另一声场的音色,而不改变个性化声像定位。
<3.第二实施例>
(移动终端的配置)
图12是示出根据本公开的技术的第二实施例的移动终端1的示例性配置的示图。
除了在带通滤波器111的前级中提供估计单元211和均衡器212之外,图12的移动终端1具有类似于图4的移动终端1的配置。
估计单元211从预定方向的实际测量的头部相关传递函数Hm估计另一方向的头部相关传递函数。实际测量的头部相关传递函数和估计的头部相关传递函数被提供给均衡器212。
均衡器212调整来自估计单元211的头部相关传递函数的频率特性,并将其输出到带通滤波器111。
(生成头部相关传递函数的过程)
图13是示出由图12的移动终端1执行的生成头部相关传递函数的过程的流程图。
在步骤S21中,测量单元51(图2)通过使用智能手机(移动终端1) 作为声源来测量用户前方的头部相关传递函数Hm。在该示例中,当用户将移动终端1握在前面并伸出他/她的手臂时,测量头部相关传递函数Hm。
在步骤S22中,估计单元211根据在前方的测量的头部相关传递函数 Hm,来估计用户的水平方向的头部相关传递函数。
在此处,将详细描述水平方向上的头部相关传递函数的估计。
首先,如图14的A所示,通过在用户U的前方设置智能手机SP而测量的左耳和右耳的头部相关传递函数被定义为CL和CR。
接下来,如图14的B中所示,在从用户U的前方向左30°的方向上的左右耳的头部相关传递函数被定义为LL和LR,左右耳是估计对称的。类似地,如图14的C所示,在从用户U的前方向向右30°的方向上的左右耳的头部相关传递函数被定义为RL和RR,左右耳是估计对称的。
在根据用户U和智能手机SP的扬声器之间的距离被分类为阳面特性和阴面特性的同时,估计这四个特性LL、LR、RL和RR。具体地,当从扬声器观看时,LL和RR是更靠近用户U的一侧(阳面)的特性,因此被分类为阳面特性。此外,当从扬声器观看时,当从用户U观看时,LR 和RL是扬声器后面的一侧(阴面)的特性,因此被分类为阴面特性。
由于阳面侧特性具有更大的直接分量,其中,来自扬声器的声音直接传播到耳朵,所以在适中范围到高频范围内的增益大于通过在前方向上的测量而获得的特性的增益。
另一方面,在阴面特性中,来自扬声器的声音在头部周围传播,由此与通过在前方向上的测量获得的特性相比,高频范围中的增益被衰减。
此外,由于从扬声器到左右耳的距离不同,因此存在耳间时间差。
考虑到上述物理传输特性,特性CL和CR在前方向的校正项被设置为以下两项。
(1)校正增益,该增益再现由声源在水平方向上的移动引起的在适中范围到高频范围内的声音放大和在头部阴面的声音衰减
(2)校正由声源在水平方向上的移动引起的与声源距离变化相关的延迟
图15是示出估计滤波器的频率特性的曲线图,该估计滤波器相对于前方向上的特性CL和CR实现上述两项的校正。
图15的A示出了用于估计阳面特性的阳面估计滤波器。在阳面估计滤波器中,增益在适中范围和高频范围内增加。
另一方面,图15的B示出了用于估计阴面特性的阴面估计滤波器。在阴面估计滤波器中,增益在适中范围和高频范围内大幅衰减。
在此处,假设阳面估计滤波器的脉冲响应是filti(t),如下估计阳面特性LL和RR。
LL(t)=filti(t)*CL(t)
RR(t)=filti(t)*CR(t)
注意,“*”表示卷积。
此外,假设阴面估计滤波器的脉冲响应为filtc(t),如下估计阴面特性RL和LR。
RL(t)=filtc(t)*CL(t)
LR(t)=filtc(t)*CR(t)
如上所述估计的水平方向上的头部相关传递函数的频率特性,由均衡器212与前方向上的头部相关传递函数一起调整。注意,由于个体相关特性不太可能出现在阴面特性中,因此可以使用预先准备的预设特性。
在步骤S23中,带通滤波器111从测量/估计的头部相关传递函数中提取适中范围特性。在校正单元112移除扬声器18的特性之后,均衡器113 调整提取的适中范围的头部相关传递函数的频率特性。
注意,步骤S24和后续步骤的处理类似于图5的流程图中的步骤S13 和后续步骤的处理,因此将省略其描述。
根据上述过程,即使在使用具有窄再现频带的智能手机作为声源来测量用户的头部相关传递函数的情况下,也可以获得具有足够特性的头部相关传递函数。即,在不使用大型设备的情况下,可以容易地在所有频带中实现头部相关传递函数的个性化。
具体地,在本实施例中,由用户的前方向上的头部相关传递函数估计水平方向上的头部相关传递函数,由此用于定位多个虚拟声源的头部相关传递函数的个性化,可以仅基于头部相关传递函数的一次测量来实现。
<4.第三实施例>
在下文中,将描述根据用户正中面(median plane)的头部相关传递函数来估计矢状面的头部相关传递函数的示例。
图16是示出由图12的移动终端1生成头部相关传递函数的另一示例性过程的流程图。
在步骤S31,测量单元51(图2)通过使用智能手机(移动终端1) 作为声源来测量用户的正中面的头部相关传递函数。
例如,如图17的A所示,用户U在正中面351中设置智能手机SP,从而测量头部相关传递函数。在图17的示例中,在正中面351内,在包括用户前方、对角上方和对角下方这三个方向上,测量头部相关传递函数。
在步骤S32中,估计单元211根据测量的正中面的头部相关传递函数,来估计用户的左右矢状面的头部相关传递函数。
例如,如图17的B所示,在用户U存在的空间中,估计在用户U左侧与正中面351平行的矢状面352L的头部相关传递函数和在用户U右侧与正中面351平行的矢状面352R的头部相关传递函数。
通过使用如上所述的阳面估计滤波器和阴面估计滤波器,在三个方向上校正相应的头部相关传递函数,来实现此处的头部相关传递函数的估计,三个方向包括例如正中面351内的用户前方、对角上方和对角下方。
矢状面的估计头部相关传递函数的频率特性,由均衡器212与正中面的头部相关传递函数一起调整。
注意,步骤S33和后续步骤的处理类似于图13的流程图中的步骤S23 和后续步骤的处理,因此将省略其描述。
根据上述过程,即使在使用具有窄再现频带的智能手机作为声源来测量用户的头部相关传递函数的情况下,也可以获得具有足够特性的头部相关传递函数。即,在不使用大型设备的情况下,可以容易地在所有频带中实现头部相关传递函数的个性化。
具体地,在本实施例中,估计用户周围的可选方向上的头部相关传递函数,由此可以实现用于在用户期望方向上定位虚拟声源的头部相关传递函数的个性化。
<5.其他>
(其他声源示例)
尽管在以上描述中,具有扬声器的智能手机用作再现测量声波的声源,但是也可以使用除此之外的装置。例如,用于再现测量声波的声源可以是具有扬声器和显示器的电视接收机。电视接收机只能在大约200Hz的频带内进行再现,并且以与智能手机相似的方式其再现频带不太宽。
根据本公开的技术,即使在使用具有窄再现频带的电视接收机作为声源来测量用户的头部相关传递函数的情况下,也可以获得具有足够特性的头部相关传递函数。
(云计算应用)
应用根据本公开的技术的信号处理装置可以采用云计算的配置,其中,一个功能由多个装置经由网络共享和联合处理。
此外,上述流程图中描述的每个步骤可以由一个装置执行或者由多个装置共享。
此外,在一个步骤中包括多个处理的情况下,一个步骤中包括的多个处理可以由一个装置执行或者由多个装置共享。
例如,图2的HRTF数据库53可以设置在服务器等(所谓的云)中,以经由诸如互联网的网络连接。
此外,图2的移动终端1中包括的所有配置可以在云中提供。在这种情况下,移动终端1仅将收集的测量声波的音频信号发送到云,并且接收和再现用于从云再现立体声的音频信号。
(通过程序的处理执行)
上述一系列处理可以由硬件或软件来执行。在通过软件执行一系列处理的情况下,包括在软件中的程序从程序记录介质安装在包含在专用硬件中的计算机、通用个人计算机等上。
图18是示出使用程序执行上述一系列处理的计算机的示例性硬件配置的框图。
上述移动终端1由具有图18所示的配置的计算机构成。
中央处理器(CPU)1001、只读存储器(ROM)1002和随机存取存储器(RAM)1003通过总线1004相互连接。
输入/输出接口1005进一步连接到总线1004。包括键盘、鼠标等的输入单元1006和包括显示器、扬声器等的输出单元1007连接到输入/输出接口1005。此外,包括硬盘、非易失性存储器等的存储器1008、包括网络接口等的通信单元1009以及用于驱动可移动介质1011的驱动器1010连接到输入/输出接口1005。
在如上所述配置的计算机中,例如,CPU 1001经由输入/输出接口1005 和总线1004将存储在存储器1008中的程序加载到RAM 1003中,并执行该程序,从而执行上述一系列处理。
由CPU 1001执行的程序由例如记录程序的可移动介质1011提供,或者经由有线或无线传输介质(例如,局域网、互联网和数字广播)提供,并且安装在存储器1008中。
注意,要由计算机执行的程序可以是根据本说明书中描述的顺序以时序方式执行处理的程序,或者可以是并行执行处理或者在必要的时间(例如,执行调用)执行处理的程序。
注意,本公开的实施例不限于上述实施例,并且可以在不脱离本公开的主旨的情况下进行各种修改。
此外,本文描述的效果仅仅是示例而非限制,并且可以包括额外的效果。
此外,本公开可以采用以下配置。
(1)一种信号处理装置,包括:
合成单元,通过合成从用户的第一头部相关传递函数提取的第一频带的特性和从第二头部相关传递函数提取的除了第一频带之外的第二频带的特性,来生成第三头部相关传递函数,第二头部相关传递函数在与测量第一头部相关传递函数的第一测量环境不同的第二测量环境中测量。
(2)根据(1)的信号处理装置,其中,
第一频带包括从第一频率到第二频率的频带,并且
第二频带包括低于第一频率的频带和高于第二频率的频带。
(3)根据(1)的信号处理装置,其中,
第一频带包括高于第一频率的频带,并且
第二频带包括低于第一频率的频带。
(4)根据(1)至(3)中任一项的信号处理装置,其中,
第一头部相关传递函数包括使用由用户设置的声源实际测量的数据,并且
第二头部相关传递函数包括在理想测量环境中预先测量的预设数据。
(5)根据(4)的信号处理装置,其中,
第一频带包括包含个体相关特性的频带。
(6)根据(4)或(5)的信号处理装置,其中,
第二频带包括声源不能被再现的频带。
(7)根据(4)至(6)中任一项的信号处理装置,其中,
声源包括具有扬声器的装置。
(8)根据(7)的信号处理装置,其中,
装置还包括显示器。
(9)根据(8)的信号处理装置,其中,
装置包括智能手机。
(10)根据(8)的信号处理装置,其中,
装置包括电视接收机。
(11)根据(4)至(10)中任一项的信号处理装置,还包括:
校正单元,校正第一频带的特性,以移除包括在从第一头部相关传递函数提取的第一频带的特性中的声源的特性。
(12)根据(1)至(11)中任一项的信号处理装置,还包括:
添加单元,将与对应于第二头部相关传递函数的头部脉冲响应分离的混响分量,添加到第三头部相关传递函数。
(13)一种信号处理方法,包括使信号处理装置执行:
通过合成从用户的第一头部相关传递函数提取的第一频带的特性和从第二头部相关传递函数提取的除了第一频带之外的第二频带的特性,来生成第三头部相关传递函数,第二头部相关传递函数在与测量第一头部相关传递函数的第一测量环境不同的第二测量环境中测量。
(14)一种程序,使计算机执行:
通过合成从用户的第一头部相关传递函数提取的第一频带的特性和从第二头部相关传递函数提取的除了第一频带之外的第二频带的特性,来生成第三头部相关传递函数,第二头部相关传递函数在与测量第一头部相关传递函数的第一测量环境不同的第二测量环境中测量。
附图标记列表
1 移动终端
51 测量单元
52 频带提取单元
53 HRTF数据库
54 频带提取单元
55 合成单元
56 音频输入单元
57 输出单元。

Claims (13)

1.一种信号处理装置,包括:
合成单元,通过合成从用户的第一头部相关传递函数提取的第一频带的特性和从第二头部相关传递函数提取的除了所述第一频带之外的第二频带的特性,来生成第三头部相关传递函数,所述第二头部相关传递函数在与测量所述第一头部相关传递函数的第一测量环境不同的第二测量环境中测量;
添加单元,将与对应于所述第二头部相关传递函数的头部脉冲响应分离的混响分量,添加到所述第三头部相关传递函数。
2.根据权利要求1所述的信号处理装置,其中,
所述第一频带包括从第一频率到第二频率的频带,并且
所述第二频带包括低于所述第一频率的频带和高于所述第二频率的频带。
3.根据权利要求1所述的信号处理装置,其中,
所述第一频带包括高于第一频率的频带,并且
所述第二频带包括低于所述第一频率的频带。
4.根据权利要求1所述的信号处理装置,其中,
所述第一头部相关传递函数包括使用由所述用户设置的声源实际测量的数据,并且
所述第二头部相关传递函数包括在理想测量环境中预先测量的预设数据。
5.根据权利要求4所述的信号处理装置,其中,
所述第一频带包括具有个体相关特性的频带。
6.根据权利要求4所述的信号处理装置,其中,
所述第二频带包括所述声源不能被再现的频带。
7.根据权利要求4所述的信号处理装置,其中,
所述声源包括具有扬声器的设备。
8.根据权利要求7所述的信号处理装置,其中,
所述设备还包括显示器。
9.根据权利要求8所述的信号处理装置,其中,
所述设备包括智能手机。
10.根据权利要求8所述的信号处理装置,其中,
所述设备包括电视接收机。
11.根据权利要求4所述的信号处理装置,还包括:
校正单元,校正所述第一频带的特性,以移除包括在从所述第一头部相关传递函数提取的所述第一频带的特性中的所述声源的特性。
12.一种信号处理方法,包括使信号处理装置执行:
通过合成从用户的第一头部相关传递函数提取的第一频带的特性和从第二头部相关传递函数提取的除了所述第一频带之外的第二频带的特性,来生成第三头部相关传递函数,所述第二头部相关传递函数在与测量所述第一头部相关传递函数的第一测量环境不同的第二测量环境中测量;
将与对应于所述第二头部相关传递函数的头部脉冲响应分离的混响分量,添加到所述第三头部相关传递函数。
13.一种计算机可读存储介质,存储有程序,所述程序当被执行时使计算机执行:
通过合成从用户的第一头部相关传递函数提取的第一频带的特性和从第二头部相关传递函数提取的除了所述第一频带之外的第二频带的特性,来生成第三头部相关传递函数,所述第二头部相关传递函数在与测量所述第一头部相关传递函数的第一测量环境不同的第二测量环境中测量;
将与对应于所述第二头部相关传递函数的头部脉冲响应分离的混响分量,添加到所述第三头部相关传递函数。
CN201980052823.XA 2018-08-17 2019-08-02 信号处理装置、信号处理方法和介质 Active CN112567766B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018153658 2018-08-17
JP2018-153658 2018-08-17
PCT/JP2019/030413 WO2020036077A1 (ja) 2018-08-17 2019-08-02 信号処理装置、信号処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
CN112567766A CN112567766A (zh) 2021-03-26
CN112567766B true CN112567766B (zh) 2022-10-28

Family

ID=69525513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980052823.XA Active CN112567766B (zh) 2018-08-17 2019-08-02 信号处理装置、信号处理方法和介质

Country Status (5)

Country Link
US (1) US11743671B2 (zh)
JP (1) JP7384162B2 (zh)
CN (1) CN112567766B (zh)
DE (1) DE112019004139T5 (zh)
WO (1) WO2020036077A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2584152B (en) * 2019-05-24 2024-02-21 Sony Interactive Entertainment Inc Method and system for generating an HRTF for a user
JP2021131433A (ja) * 2020-02-19 2021-09-09 ヤマハ株式会社 音信号処理方法および音信号処理装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US20050147261A1 (en) * 2003-12-30 2005-07-07 Chiang Yeh Head relational transfer function virtualizer
KR100754220B1 (ko) * 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
JP2009260574A (ja) 2008-04-15 2009-11-05 Sony Ericsson Mobilecommunications Japan Inc 音声信号処理装置、音声信号処理方法及び音声信号処理装置を備えた携帯端末
JP2012004668A (ja) * 2010-06-14 2012-01-05 Sony Corp 頭部伝達関数生成装置、頭部伝達関数生成方法及び音声信号処理装置
US9426589B2 (en) * 2013-07-04 2016-08-23 Gn Resound A/S Determination of individual HRTFs
JP2015211418A (ja) * 2014-04-30 2015-11-24 ソニー株式会社 音響信号処理装置、音響信号処理方法、および、プログラム
KR101627647B1 (ko) 2014-12-04 2016-06-07 가우디오디오랩 주식회사 바이노럴 렌더링을 위한 오디오 신호 처리 장치 및 방법
WO2016089133A1 (ko) * 2014-12-04 2016-06-09 가우디오디오랩 주식회사 개인 특징을 반영한 바이노럴 오디오 신호 처리 방법 및 장치
JP6565709B2 (ja) 2016-01-26 2019-08-28 株式会社Jvcケンウッド 音像定位処理装置、及び音像定位処理方法
JP6732464B2 (ja) * 2016-02-12 2020-07-29 キヤノン株式会社 情報処理装置および情報処理方法

Also Published As

Publication number Publication date
US20210297802A1 (en) 2021-09-23
CN112567766A (zh) 2021-03-26
US11743671B2 (en) 2023-08-29
WO2020036077A1 (ja) 2020-02-20
JPWO2020036077A1 (ja) 2021-08-10
JP7384162B2 (ja) 2023-11-21
DE112019004139T5 (de) 2021-05-06

Similar Documents

Publication Publication Date Title
KR100919160B1 (ko) 2개의 라우드스피커를 위한 스테레오 확장 네트워크
JP4921470B2 (ja) 頭部伝達関数を表すパラメータを生成及び処理する方法及び装置
JP4780119B2 (ja) 頭部伝達関数測定方法、頭部伝達関数畳み込み方法および頭部伝達関数畳み込み装置
CN107852563A (zh) 双耳音频再现
US7889872B2 (en) Device and method for integrating sound effect processing and active noise control
EP2953383B1 (en) Signal processing circuit
RU2006126231A (ru) Способ и устройство для воспроизведения обширного монофонического звука
US8488820B2 (en) Spatial audio processing method, program product, electronic device and system
US10555108B2 (en) Filter generation device, method for generating filter, and program
JP6515720B2 (ja) 頭外定位処理装置、頭外定位処理方法、及びプログラム
CN107925835B (zh) 头外定位处理装置以及头外定位处理方法
CN112956210B (zh) 基于均衡滤波器的音频信号处理方法及装置
CN112567766B (zh) 信号处理装置、信号处理方法和介质
JP2003230198A (ja) 音像定位制御装置
US20200059750A1 (en) Sound spatialization method
CN105556990A (zh) 音响处理装置、音响处理方法、及音响处理程序
CN113645531B (zh) 一种耳机虚拟空间声回放方法、装置、存储介质及耳机
CN109923877B (zh) 对立体声音频信号进行加权的装置和方法
JP2001359197A (ja) 音像定位信号の生成方法、及び音像定位信号生成装置
CN110312198B (zh) 用于数字影院的虚拟音源重定位方法及装置
US6999590B2 (en) Stereo sound circuit device for providing three-dimensional surrounding effect
EP4207815A1 (en) Method and device for processing spatialized audio signals
JP7332745B2 (ja) 音声処理方法及び音声処理装置
JP2002262385A (ja) 音像定位信号の生成方法、及び音像定位信号生成装置
US11228837B2 (en) Processing device, processing method, reproduction method, and program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant