CN105556992A - 将第一和第二输入声道映射至至少一个输出声道的装置,方法和计算机程序 - Google Patents

将第一和第二输入声道映射至至少一个输出声道的装置,方法和计算机程序 Download PDF

Info

Publication number
CN105556992A
CN105556992A CN201480041269.2A CN201480041269A CN105556992A CN 105556992 A CN105556992 A CN 105556992A CN 201480041269 A CN201480041269 A CN 201480041269A CN 105556992 A CN105556992 A CN 105556992A
Authority
CN
China
Prior art keywords
sound channel
input sound
output channels
channel
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480041269.2A
Other languages
English (en)
Other versions
CN105556992B (zh
Inventor
于尔根·赫勒
法比安·卡驰
迈克尔·卡拉舒曼
阿西姆·孔茨
克里斯托弗·佛里尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN105556992A publication Critical patent/CN105556992A/zh
Application granted granted Critical
Publication of CN105556992B publication Critical patent/CN105556992B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

用于将输入声道配置的第一输入声道和第二输入声道映射至输出声道配置的至少一个输出声道的装置,其中每个输入声道和每个输出声道具有其中相关联的扬声器相对于中心收听者位置定位的方向,其中装置用于将第一输入声道映射至输出声道配置的第一输出声道。装置还用于进行以下至少一个:a)将第二输入声道映射至第一输出声道,包括通过应用均衡滤波器和解相关滤波器中的至少一个至第二输入声道而处理第二输入声道;以及b)尽管事实是第二输入声道的方向与第一输出声道的方向之间的角度偏差比第二输入声道的方向与第二输出声道的方向之间的角度偏差小和/或比第二输入声道的方向与第三输出声道的方向之间的角度偏差小,但是通过第二和第三输出声道之间的平移将第二输入声道映射至第二和第三输出声道。

Description

将第一和第二输入声道映射至至少一个输出声道的装置,方法和计算机程序
技术领域
本发明涉及用于将第一和第二输入声道映射至至少一个输出声道的装置和方法,特别地,涉及适用于不同扬声器声道配置之间的格式转换的装置和方法。
背景技术
空间音频编码工具为业界众所周知且已经标准化,例如MPEG环绕标准。空间音频编码始于多个原始输入,例如5或7个输入声道,通过其在重现设置中的布置识别,例如识别为左声道、中声道、右声道、左环绕声道、右环绕声道、及低频加强(LFE)声道。空间音频编码器可从原始声道得到一个或多个降混声道,此外,可得到与空间线索相关的参数数据,如声道相干值中的声道间位准差、声道间相位差、声道间时间差等。一个或多个降混声道与指示空间线索的参数边带信息一起传送给空间音频解码器用于解码降混声道及相关联的参数数据,从而最终获得输出声道,其为原始输入声道的近似版本。声道在输出设置中的布置可以为固定,例如5.1格式、7.1格式等。
此外,空间音频对象编码工具为业界众所周知且已经标准化,例如MPEGSAOC标准(SAOC=空间音频对象编码)。与始于原始声道的空间音频编码相反,空间音频对象编码始于非自动专用于某些渲染重现设置的音频对象。更确切地,音频对象在重现场景中的布置是灵活的且可由用户设置,例如通过将某些渲染信息输入空间音频对象编码解码器内。可选地或额外地,渲染信息可以作为额外的边带信息或元数据被传输;渲染信息可包括某个音频对象将被布置(例如经过一段时间)在重现设置中的哪个位置的信息。为了获得某个数据压缩,使用SAOC编码器对多个音频对象进行编码,通过根据某个降混信息对对象进行降混,SAOC编码器从输入对象计算一或多个传送声道。此外,SAOC编码器计算表示对象间线索的参数边带信息,如对象级差(OLD)、对象相干值等。如在SAC(SAC=空间音频编码)中,对于各个时间/频率拼贴块(tile)计算对象间参数数据。对于音频信号的某个帧(例如1024或2048个样本),考虑多个频带(例如24、32或64个频带),以便为每个帧及每个频带提供参数数据。例如,当音频片段有20帧且每个帧被划分为32个频带时,时间/频率拼贴块的数量为640。
期望的重现格式,即输出声道配置(输出扬声器配置)可与输入声道配置不同,其中输出声道的数量与输入声道的数量不同。因此,可以要求格式转换以将输入声道配置的输入声道映射至输出声道配置的输出声道。
发明内容
本发明的目的在于提供允许改进的声音重现的装置和方法,尤其在不同扬声器声道配置之间的格式转换的情况下。
该目的由根据权利要求1的装置和根据权利要求12的方法实现。
本发明的实施例提出一种用于将输入声道配置的第一输入声道和第二输入声道映射至输出声道配置的至少一个输出声道的装置,其中每个输入声道和每个输出声道具有其中相关联的扬声器相对于中心收听者位置定位的方向,其中所述装置用于:
将第一输入声道映射至输出声道配置的第一输出声道;以及以下至少一个:
a)将第二输入声道映射至第一输出声道,包括通过应用均衡滤波器和解相关滤波器中的至少一个至第二输入声道而处理第二输入声道;以及
b)尽管事实是第二输入声道的方向与第一输出声道的方向之间的角度偏差比第二输入声道的方向与第二输出声道的方向之间的角度偏差小和/或比第二输入声道的方向与第三输出声道的方向之间的角度偏差小,但是通过第二输出声道与第三输出声道之间的平移(panning)将第二输入声道映射至第二输出声道和第三输出声道。
本发明的实施例提供一种用于将输入声道配置的第一输入声道和第二输入声道映射至输出声道配置的至少一个输出声道的装置,其中每个输入声道和每个输出声道具有其中相关联的扬声器相对于中心收听者位置定位的方向,所述方法包括:
将第一输入声道映射至所输出声道配置的第一输出声道;以及以下至少一个:
a)将第二输入声道映射至第一输出声道,包括通过应用均衡滤波器和解相关滤波器中的至少一个至第二输入声道而处理第二输入声道;以及
b)尽管事实是第二输入声道的方向与第一输出声道的方向之间的角度偏差比第二输入声道的方向与第二输出声道的方向之间的角度偏差小和/或比第二输入声道的方向与第三输出声道的方向之间的角度偏差小,但是通过第二输出声道与第三输出声道之间的平移将第二输入声道映射至第二输出声道和第三输出声道。
本发明的实施例基于发现:如果使用一种被设计为试图保持被映射至至少一个输出声道的至少两个输入声道的空间多样性的方法,即使在从多个输入声道至更少数量的输出声道的降混处理的情况下也可以实现改进的音频重现。根据本发明的实施例,这通过应用均衡滤波器和解相关滤波器中的至少一个来处理映射至相同输出声道的输入声道中的一个而实现,这通过使用两个输出声道生成用于输入声道中的一个的幻象源而实现,两个输出声道中的一个与输入声道的角度偏差比输入声道与另一个输出声道的角度偏差大。
在本发明的实施例中,均衡滤波器被应用至第二输入声道且用于提高第二输入声道的频谱部分,这已知给收听者声音来自与第二输入声道的位置相对应的位置的印象。在本发明的实施例中,第二输入声道的仰角可以比输入声道映射至的一个或多个输出声道的仰角大。例如,与第二输入声道相关联的扬声器可以位于水平收听者平面上方的位置,而与第一或多个输出声道相关联的扬声器可以位于水平收听者平面中的位置。均衡滤波器可以用于提高在7kHz和10kHZ的频率范围内的第二声道的频谱部分。通过以这种方式处理第二输入声道,可以给收听者声音来自高位的印象,即使实际上并非来自高位。
在本发明的实施例中,通过应用用于处理第二输入声道的均衡滤波器而处理第二输入声道,以便补偿因第二输入声道和第二输入声道映射至的至少一个输出声道的不同位置而导致的音色差。因此,可以操作通过错误位置处的扬声器重现的第二输入声道的音色,以便用户可以得到声音来自与原始位置(即,第二输入声道的位置)接近的另一位置的印象。
在本发明的实施例中,应用解相关滤波器至第二输入声道。应用解相关滤波器至第二输入声道也可以给收听者通过第一输出声道重现的声音信号来自位于输入声道配置中的不同位置处的不同输入声道的印象。例如,解相关滤波器可以用于将频率相依延迟和/或随机化相位引入第二输入声道。在本发明的实施例中,解相关滤波器可以是混迭滤波器,用于将混迭信号部分引入第二输入声道,以便收听者可以得到通过第一输出声道重现的声音信号来自不同位置的印象。在本发明的实施例中,解相关滤波器可以用于将第二输入声道与指数衰减噪声序列进行卷积,以便模拟第二输入信号中的漫反射。
在本发明的实施例中,基于测量的特定收听室的双耳室脉冲响应(BRIR)或基于关于室内声学的经验知识(也可以特定收听室)设定均衡滤波器和解相关滤波器的系数。由此,在特定场景(例如,特定收听室)中可以采用用于将输入声道的空间多样性列入考虑的各个处理,其中通过输出声道配置重现信号。
附图说明
现在将关于附图描述本发明的实施例,其中:
图1显示3D音频系统的3D音频编码器的概述;
图2显示3D音频系统的3D音频解码器的概述;
图3显示用于实现可在图2的3D音频解码器中实现的格式转换器的实施例;
图4显示扬声器配置的示意俯视图;
图5显示另一扬声器配置的示意后视图;
图6a和6b显示用于将第一和第二输入声道映射至输出声道的装置的示意图;
图7a和7b显示用于将第一和第二输入声道映射至数个输出声道的装置的示意图;
图8显示用于将第一和第二输入声道映射至一个输出声道的装置的示意图;
图9显示用于将第一和第二输入声道映射至不同输出声道的装置的示意图;
图10显示用于将输入声道配置的输入声道映射至输出声道配置的输出声道的信号处理单元的框图;
图11显示信号处理单元;以及
图12显示所谓的布劳尔特带的示意图。
具体实施方式
在详细描述本发明方法的实施例之前,给出其中可实现本发明方法的3D音频编解码系统的概述。
图1和图2显示根据据实施例的3D音频系统的算法块。更具体地,图1显示3D音频编码器100的概述。音频编码器100在预渲染器/混合器电路102(可选择性地设置)处接收输入信号,更具体地,多个输入声道提供多个声道信号104、多个对象信号106及对应的对象元数据108给音频编码器100。通过预渲染器/混合器102处理的对象信号106(参考信号110)可被提供给SAOC编码器112(SAOC=空间音频对象编码)。SAOC编码器112生成提供给USAC编码器116(USAC=统一语音及音频编码)的输入。此外,信号SAOC-SI118(SAOC-SI=SAOC边带信息)也提供给USAC编码器116的输入。USAC编码器116进一步从预渲染器/混合器直接接收对象信号120以及声道信号及预渲染的对象信号122。对象元数据信息108被应用至OAM编码器124(OAM=对象元数据),OAM编码器124提供压缩的对象元数据信息126给USAC编码器。基于前述输入信号,USAC编码器116生成压缩输出信号MP4,如128所示。
图2显示3D音频系统的3D音频解码器200的概述。音频解码器200,更具体地,USAC解码器202接收由图1的音频编码器100所产生的编码信号128(MP4)。USAC解码器202将接收到的信号128解码成声道信号204、预渲染的对象信号206、对象信号208、及SAOC传送声道信号210。进一步地,压缩的对象元数据信息212及信号SAOC-SI214通过USAC解码器输出。对象信号208被提供给对象渲染器216,对象渲染器216输出渲染的对象信号218。SAOC传送声道信号210被提供给SAOC解码器220,SAOC解码器220输出渲染的对象信号222。压缩的对象元数据信息212被提供给OAM解码器224用于输出各个控制信号给对象渲染器216以及提供给SAOC解码器220用于生成渲染的对象信号218及渲染的对象信号222。解码器进一步包括混合器226,如图2所示,混合器226接收输入信号204、206、218及222用于输出声道信号228。如230指示,声道信号可直接输出给扬声器,例如32声道扬声器。可选地,信号228可提供给格式转换电路232,格式转换电路232接收信号228作为指示声道信号228被转换的方式的重现布局信号的控制输入。在图2描绘的实施例中,假设以信号可被提供给5.1扬声器系统(如234指示)的方式完成转换。此外,声道信号228被提供给双耳渲染器236生成两个输出信号,例如用于耳机,如238指示。
图1及2描绘的编码/解码系统可基于用于声道及对象信号的编码(参考信号104及106)的MPEG-DUSAC编解码器。为了提高编码大量对象的效率,可使用MPEGSAOC技术。三个类型的渲染器可执行下列工作:渲染对象至声道,渲染声道至耳机,或渲染声道至不同扬声器设置(参考图2,附图标记230、234及238)。当对象信号被显式传输或使用SAOC参数化编码时,相应的对象元数据信息108被压缩(参考信号126)及多路复用为3D音频比特流128。
图1及图2显示用于总体3D音频系统的算法块,下面将进一步详细地描述。
可选择性地提供预渲染器/混合器102以在编码之前将声道加对象输入场景转换成声道场景。功能上而言其与对象渲染器/混合器相同,下面将详细描述。可以期望对象的预渲染以确保编码器输入处的确定性信号熵基本上与同时作用的对象信号的数量相独立。通过对象的预渲染,无需传输对象元数据。离散对象信号被渲染至编码器使用的声道布局。从相关联的对象元数据(OAM)获得用于每个声道的对象的加权。
USAC编码器116为用于扬声器声道信号、离散对象信号、对象降混信号及预渲染的信号的核心编解码器。它基于MPEG-DUSAC技术。它基于输入声道及对象分配的几何及语义信息而产生声道及对象映射信息,从而处理上述信号的编码。这个映射信息描述如何将输入声道及对象映射至USAC-声道元素(如声道对元素(CPE)、单声道元素(SCE)、低频音效(LFE)及四声道立体声元素(QCE))以及如何将CPE、SCE及LFE、及相对应信息传输至解码器。在编码器速率控制中考虑所有额外的载荷,例如SAOC数据114、118或对象元数据126。取决于渲染器的速率/失真要求及交互要求,可以以不同的方式进行对象的编码。根据实施例,下列对象编码变化是可能的:
·预渲染对象:在编码之前,对象信号被预渲染及混合成22.2声道信号。后续编码链参见22.2声道信号。
·离散对象波形:对象作为单声道波形提供给编码器。除了声道信号之外,编码器使用单声道元素(SCE)以发送对象。解码的对象在接收器端被渲染及混合。压缩的对象元数据信息被传输至接收器/渲染器。
·参数对象波形:利用SAOC参数描述对象性质及彼此之间的关系。对象信号的降混由USAC编码。一起传输参数信息。取决于对象的数量及总数据速率,选择降混声道的数量。压缩的对象元数据信息被传输至SAOC渲染器。
用于对象信号的SAOC编码器112及SAOC解码器220可基于MPEGSAOC技术。基于较少数量的被传输的声道及额外参数数据如OLD、IOC(对象间相干性)、DMG(降混增益),系统能够重建、修改及渲染多个音频对象。与分别地传输全部对象所要求的数据速率相比,额外参数数据显示显着较低的数据速率,使得编码非常有效率。SAOC编码器112以作为输入的对象/声道信号作为单声道波形,并输出参数信息(其被打包在3D音频比特流128内)及SAOC传送声道(其使用单声道元素被编码及传输)。SAOC解码器220从解码的SAOC传送声道210及参数信息214重建对象/声道信号,并基于重现布局、解压缩的对象元数据信息及选择性地基于用户交互信息生成输出音频场景。
提供对象元数据编解码器(参考OAM编码器124及OAM解码器224),使得对于每个对象,通过对象性质在时间和空间中的量化而有效地编码说明对象在3D空间中的几何位置及体积的相关联元数据。压缩的对象元数据cOAM126被传输至接收器200作为边带信息。
对象渲染器216利用压缩的对象元数据以根据给定重现格式生成对象波形。每个对象根据其元数据被渲染至某个输出声道218。这个块的输出由部分结果的和产生。如果基于声道的内容以及离散/参数对象都被解码,在输出产生的波形228之前,或在将产生的波形228馈至后处理器模块如双耳渲染器236或扬声器渲染器模块232之前,通过混合器226混合基于声道的波形及渲染的对象波形。
双耳渲染器模块236产生多声道音频材料的双耳降混,使得每个输入声道通过虚拟声源表示。在QMF(正交镜像滤波器组)域中帧式地进行处理,并且基于测量的双耳室脉冲响应进行双耳化。
扬声器渲染器232在被传输的的声道配置228与期望的重现格式间转换。也可称作“格式转换器”。格式转换器进行转换成较少数量的输出声道,即产生降混。
图3示出格式转换器232的可能实现。在本发明的实施例中,信号处理单元为此种格式转换器。格式转换器232(又称扬声器渲染器),通过将传送器(输入)声道配置的传送器(输入)声道映射至期望的重现格式(输出声道配置)的(输出)声道而在传送器声道配置与期望的重现格式间转换。格式转换器232通常进行转换成较少数量的输出声道,即进行降混(DMX)处理240。降混器240,优选地在QMF域中操作,接收混合器输出信号228及输出扬声器信号234。可提供配置器242(又称控制器),其接收下列信号作为控制输入:指示混合器输出布局(输入声道配置,即确定通过混合器输出信号228表示的数据的布局)的信号246,及指示期望重现布局(输出声道配置)的信号248。基于这个信息,控制器242优选地自动地生成用于给定组合的输出和输出格式的降混矩阵并将这些矩阵应用至降混器240。格式转换器232允许标准扬声器配置以及允许具有非标准扬声器位置的随机配置。
本发明的实施例涉及扬声器渲染器232的实现,即用于实现扬声器渲染器232的功能的一部分的装置和方法。
现在参考图4及图5。图4显示表示5.1格式的扬声器配置,包括表示左声道LC、中心声道CC、右声道RC、左环绕声道LSC、右环绕声道LRC及低频加强声道LFC的六个扬声器。图5显示另一个扬声器配置,包括表示左声道LC、中心声道CC、右声道RC及架高中心声道ECC的扬声器。
下面,不考虑低频加强声道,因为与低频加强声道相关联的扬声器(重低音喇叭)的正确位置并不重要。
在关于中心收听者位置P的特定方向布置声道。参考图5,通过方位角α及仰角β定义每个声道的方向。方位角表示声道在水平收听者平面300的角度且可表示各个声道关于前中心方向302的方向。如图4可知,前中心方向302可被定义为位于中心收听者位置P处的收听者的假定观察方向。后中心方向304包括相对于前中心方向300为180度的方位角。在前中心方向与后中心方向之间的前中心方向左侧的全部方位角都在前中心方向的左侧上,在前中心方向与后中心方向之间的前中心方向右侧的全部方位角都在前中心方向的右侧上。位于虚拟线306前方的扬声器为前扬声器,虚拟线306与前中心方向302正交且通过中心收听者位置P,位于虚拟线306后方的扬声器为后扬声器。在5.1格式中,声道LC的方位角α为向左30度,CC的α为0度,RC的α为向右30度,LSC的α为向左110度,及RSC的α为向右110度。
声道的仰角β定义水平收听者平面300与中心收听者位置和与声道相关联的扬声器之间的虚拟连接线的方向之间的夹角。在图4的配置中,全部扬声器被布置在水平收听者平面300内,因此全部仰角皆为零。在图5中,声道ECC的仰角β可为30度。位于中心收听者位置正上方的扬声器将具有90度的仰角。布置在水平收听者平面300下方的扬声器具有负仰角。
特定声道在空间中的位置,即与(特定声道)相关联的扬声器位置由方位角、仰角及扬声器距中心收听者位置的距离给定。应注意的是,术语“扬声器位置”经常由本领域技术人员仅参考方位角和仰角而描述。
通常,不同扬声器声道配置之间的格式转换被进行为将多个输入声道映射至多个输出声道的降混处理,其中输出声道的数量通常比输入声道的数量小,并且其中输出声道位置与输入声道位置不同。可以将一个或多个输入声道混合到相同的输出声道。同时,一个或多个输入声道可在多于一个输出声道上渲染。典型地通过降混系数集合(可选地,公式化为降混矩阵)确定这种从输入声道至输出声道的映射。降混系数的选择显着地影响可实现的降混输出声音质量。坏的选择可能导致输入声音场景的不平衡混合或坏的空间重现。
每个声道具有待通过相关联的扬声器重现的与其相关联的音频信号。处理特定声道(例如,通过应用系数,通过应用均衡滤波器或通过应用解相关滤波器)的教导表示与这个声道相关联的对应音频信号被处理。在本申请中,术语“均衡滤波器”表示包含将均衡应用至信号的任何手段,以便实现信号部分的频率相依加权。例如,均衡滤波器可用于应用频率相依增益系数至信号的频带。在本申请中,术语“解相关滤波器”用表示包含应用解相关至信号的任何手段,例如通过引入频率相依延迟和/或随机化相位至信号。例如,解相关滤波器可用于应用频率相依延迟系数至信号的频带和/或应用随机化相位系数至信号。
在本发明的实施例中,将输入声道映射至一个或多个输出声道包括对于输入声道映射至的每个输出声道,应用待应用的至少一个系数至输入声道。至少一个系数可包括待应用至与输入声道相关联的输入信号的增益系数,即增益值;和/或待应用至与输入声道相关联的输入信号的延迟系数,即延迟值。在本发明的实施例中,映射可包括应用频率选择性系数,即对于输入声道的不同频带应用不同系数。在本发明的实施例中,将输入声道映射至输出声道包括从系数生成一个或多个系数矩阵。每个矩阵定义对于输出声道配置的每个输出声道,待应用至输入声道配置的每个输入声道的系数。对于输入声道不映射至的输出声道,系数矩阵中的各个系数将为零。在本发明的实施例中,可以生成用于增益系数及延迟系数的单独的系数矩阵。在本发明的实施例中,在系数为频率选择性的情况下,可生成用于每个频带的系数矩阵。在本发明的实施例中,映射可进一步包括将得到的系数应用至与输入声道相关联的输入信号。
为了获得良好的降混系数,专家(例如音效工程师)可将其专业知识列入考虑,手动调谐系数。一种自动得到用于输入和输出配置的给定组合的降混系数的可能是将每个输入声道作为虚拟声源处理,其在空间中的位置由与特定声道相关联的空间中的位置(即,与特定输入声道相关联的扬声器位置)给定。每个虚拟声源可由通用平移算法重现,例如2D中的正切定律平移,或3D中的矢量基幅值相依(VBAP),参考V.Pulkki:“VirtualSoundSourcePositioningUsingVectorBaseAmplitudePanning”,音频工程学会期刊,45卷,456-466页,1997年。用于输入及输出配置的给定组合的降混系数的数学(即自动)推导的另一项提议已由A.Ando做出:“ConversionofMultichannelSoundSignalMaintainingPhysicalPropertiesofSoundinReprodcuedSoundField”,关于音频、语音及语言处理的IEEE学报,19卷,6期,2011年8月。
由此,现有的降混方法主要基于用于得到降混系数的三个策略。第一策略是将丢弃的输入声道直接映射至相同与可比较方位角位置处的输出声道。可忽略仰角偏差。例如,常见实践是如果高度层不存在于输出声道配置中,则直接用相同或可比较方位角位置处的水平声道渲染高度声道。第二策略是使用通过平移算法,其将输入声道作为虚拟声音源处理并通过在被丢弃的输入声道的位置处引入幻象源来保持方位角信息。忽略仰角偏差。在本技术领域的方法中,仅在期望输出位置(例如期望能够方位角)处没有可用的输出扬声器时才使用平移。第三策略是以经验、技艺或听觉心理意义结合专家知识以得到最佳降混系数。可以使用不同策略的单独或组合应用。
本发明的实施例提供技术解决方案,允许改进或优化降混处理,使得与不利用本解决方案相比,能够获得更高质量的降混输出信号。在实施例中,在不应用所提出的方案时,在降混期间将丧失输入声道配置固有的空间多样性的情况下,该解决方案可改进降混质量。
为了达成此目的,本发明的实施例允许保留输入声道配置特有的且不被直接降混(DMX)方法所保留的空间多样性。在降混场景中,其中声道数目减少,本发明的实施例主要针对减少多样性及包络的损耗,其暗示性地出现在从较高声道数目映射到较低声道数目时。
发明人认知,根据特定配置,输入声道配置的固有空间多样性及空间包络经常在输出声道配置中显著减少或完全丧失。此外,如果来自输入配置的数个扬声器的听觉事件被同时重现,则在输出配置中它们变得更加相干、浓缩及聚焦。如此可能导致感官上更紧迫的空间印象,其显然经常比输入声道配置令人不愉悦。本发明的实施例针对首次在输出声道配置中明确地保留空间多样性。本发明的实施例旨在保持感知的听觉事件的位置与使用原始输入声道扬声器配置的情况尽可能地接近。
据此,本发明的实施例提供将与输入声道配置的不同扬声器位置相关联并因此包括空间多样性的第一输入声道与第二输入声道映射到至少一个输出声道的特定办法。在本发明的实施例中,相对于水平收听者平面,第一及第二输入声道在不同仰角处。如此,第一输入声道与第二输入声道间的仰角偏差可列入考虑,以便使用输出声道配置的扬声器改进声音重现。
在本申请中,多样性可被描述如下。输入声道配置的不同扬声器导致从扬声器至耳朵(如位在位置P的收听者的耳朵)的不同声道。有多个直接声路及多个间接声路,又称反射或混迭,其从多样收听室激励产生,并且其增加额外解相关及音色改变给从不同扬声器位置感知的信号。声道可被BRIR完全模型化,BRIR是每个收听室的特征。输入声道配置的收听经验强烈地取决于不同输入声道及多样BRIR的特性组合,其相对应于特定扬声器位置。如此,多样性及包络源自于多样信号修改,通过收听室将多样信号修改固有地应用至所有扬声器信号。
现在给出需要保留输入声道配置的空间多样性的降混方法的理由。输入声道配置可运用比输出声道配置更多的扬声器,或可使用至少一个不存在输出扬声器配置中的扬声器。仅为了用于例示目的,如图5显示,输入声道配置可运用扬声器LC、CC、RC、ECC,而输出声道配置只可运用扬声器LC、CC、RC,即不运用扬声器ECC。因此,输入声道配置可使用比输出声道配置更多数量的回放层。例如,输入声道配置可提供水平(LC、CC、RC)及高度(ECC)扬声器,而输出声道配置只可提供水平(LC、CC、RC)扬声器。因此,在降混情况下,输出声道配置的从扬声器到耳朵的声道数目被减少。具体地,由于在输出声道配置中缺乏不同重现层,因此3D(例如22.2)至2D(例如5.1)降混(DMX)最受影响。关于多样性及包络,使用输出声道配置以实现相似收听经验的自由度减少并因而受限制。本发明的实施例提供降混办法,其改进输入声道配置的空间多样性的保留,其中所描述的装置及方法并不限于任何特定种类的降混办法,而可应用于各种背景及应用。
后文中,参考图5显示的特定场景描述本发明的实施例。但所描述的问题及解决方案容易调整以适应具有类似状况的其它场景。不丧失一般性,假设下列输入及输出声道配置:
输入声道配置:四个扬声器LC、CC、RC及ECC在位置x1=(α11),x2=(α21),x3=(α31)及x4=(α42),其中α2≈α4或α2=α4
输出声道配置:三个扬声器在位置x1=(α11),x2=(α21),x3=(α31),即降混中舍弃在位置x4的扬声器。α表示方位角,β表示仰角。
如前文解释,直接DMX办法将优先排序方向性方位信息的保留而只忽略任何仰角偏差。如此,来自位置x4的扬声器ECC的信号将被简单地发送至位置x2的扬声器CC。但是,如此进行时特性丧失。首先,因在重现位置x2及x4上固有应用的不同BRIR所致的音色差异丧失。其次,在不同位置x2及x4重现的输入信号的空间多样性丧失。第三,因从位置x2及x4至收听者耳朵的不同声音传播路径所致的输入信号的固有解相关性丧失。
本发明的实施例旨在通过对于降混方法单独地或组合地应用此处解释的策略,保留或模拟所描述特性中的一个或多个。
图6a及6b显示用于解释用于实现将第一输入声道12及第二输入声道14映射到相同输出声道16的策略的装置10的示意图,其中通过应用均衡滤波器及解相关滤波器中的至少一个至第二输入声道而进行第二输入声道的处理。这个处理在图6a中通过块18指示。
本领域技术人员显然易知的是,本申请中解释及描述的装置可通过被配置和/或编程以获得所描述功能的各个计算机或处理器实现。可选地,装置可被实现为其它编程的硬件结构,如现场可编程门阵列等。
图6a中的第一输入声道12可与方向x2处的中置扬声器CC相关联,第二输入声道14可与位置x4处的架高中置扬声器ECC相关联(分别在输入声道配置中)。输出声道16可与位置x2处的中置扬声器ECC相关联(在输出声道配置中)。图6b示出将与位置x4处的扬声器相关联的声道14映射到与位置x2处的扬声器CC相关联的第一输出声道16,并且这个映射包括第二输入声道14的处理18,即与第二输入声道14相关联的音频信号的处理。第二输入声道的处理包括应用均衡滤波器及解相关滤波器中的至少一个至第二输入声道以保持输入声道配置中的第一与第二输入声道间的不同特性。在实施例中,均衡滤波器和/或解相关滤波器可用于保留关于因不同BRIR所致的音色差异的特性,不同BRIR被特有地应用在与第一及第二输入声道相关联的不同扬声器位置x2及x4处。在本发明的实施例中,均衡滤波器和/或解相关滤波器可用于保留在不同位置重现的输入信号的空间多样性,使得第一及第二输入声道的空间多样性保持可感知,尽管事实是第一及第二输入声道被映射到相同输出声道。
在本发明的实施例中,解相关滤波器用于保持因从与第一及第二输入声道相关联的不同扬声器位置到收听者耳朵的不同声音传播路径所导致的输入信号的固有解相关。
在本发明的实施例中,如果位置x4处的第二输出声道被降混至位置x2处的扬声器CC,则将均衡滤波器应用至第二输入声道,即与位置x4处的第二输入声道相关联的音频信号。该均衡滤波器补偿不同声道的音色变化,且可基于实验专家知识和/或测量的BRIR数据等得到。例如,假设输入声道配置提供90度仰角的上帝之声(VoG)声道。如果输出声道配置只提供一层的扬声器而VoG声道被舍弃,例如使用5.1输出配置,则简单直接的办法是将VoG声道分配给全部输出扬声器以保持至少最佳收听位置的VoG声道的方向信息。但是,因不同BRIR,原始VoG扬声器被感知为相当不同。通过在分配全部输出扬声器之前应用专用均衡滤波器至VoG声道,可补偿音色差异。
在本发明的实施例中,均衡滤波器可用于进行相对应输入声道的频率相依加权以将有关音频信号的方向感知的听觉心理发现列入考虑。这个发现的示例是所谓的布劳尔特带,表示方向确定带。图12显示代表所识别的音频信号的特定方向的概率的三个曲线20、22及24。如从曲线20可知,来自上方的音频信号可以高概率地在7kHz至10kHz之间的频带1200中识别。如从曲线22可知,来自后方的音频信号可以高概率地在约0.7kHz至约2kzH之间的频带1202中及在约10kHz至约12.5kHz之间的频带1204中识别。如从曲线24可知,来自前方的音频信号可以高概率地在约0.3kHz至0.6kHz之间的频带1206中及在约2.5kHz至约5.5kHz之间的频带1208中识别。
在本发明的实施例中,利用这个识别配置均衡滤波器。换言之,均衡滤波器可用于与其他频带相比,应用较高增益系数(提高)给已知给使用者声音来自特定方向的印象的频带。具体地,在输入声道被映射到较低输出声道的情况下,在7kHz至10kHz的范围间的频带1200中的输入声道的频谱部分可相比于第二输入声道的其他频带部分被提高,使得收听者可获得相对应信号源自于高位额印象。类似地,如图12显示,均衡滤波器可用于提高第二输入声道的其它频谱部分。例如,当输入声道被映射到配置在较为向前位置的输出声道时频带1206及1208可被提高,当输入声道被映射到配置在较为向后位置的输出声道时频带1202及1204可被提高。
在本发明的实施例中,装置用于应用解相关滤波器至第二输入声道。例如,解相关/混迭滤波器可被应用至与第二输入声道相关联的(与位置x4处的扬声器相关联的)输入信号,如果第二输入声道被降混至位置x2处的扬声器。这种解相关/混迭滤波器可从BRIR测量或有关室内声学等的实验知识得到。如果输入声道被映射到多个输出声道,则滤波信号可在多个扬声器上重现,其中对于每个扬声器可应用不同滤波器。滤波器也可只模型化早期反射。
图8显示装置30的示意图,包括滤波器32,其可表示均衡滤波器或解相关滤波器。装置30接收多个输入声道34及输出多个输出声道36。输入声道34表示输入声道配置,输出声道36表示输出声道配置。如图8中显示,第三输入声道38被直接映射到第二输出声道42,第四输入声道40被直接映射到第三输出声道44。第三输入声道38可为与左扬声器LC相关联的左声道。第四输入声道40可为与右扬声器RC相关联的右声道。第二输出声道42可为与左扬声器LC相关联的左声道,第三输出声道44可为与右扬声器RC相关联的右声道。第一输入声道12可为与中置扬声器CC相关联的中置水平声道,第二输入声道14可为与架高中声道ECC相关联的高度中声道。滤波器32被应用至第二输入声道14,即高度中声道。滤波器32可为解相关或混迭滤波器。在滤波之后,第二输入声道被按路线发送至水平中置扬声器,即与位置x2处的扬声器CC相关联的第一输出声道16。如此,输入声道12及14都被映射到第一输出声道16,如图8中块46指示。在本发明的实施例中,第一输入声道12及第二输入声道14的处理版本可在块46被增加,并供给至与输出声道16相关联的扬声器,即所描述实施例中的中置水平扬声器CC。
在本发明的实施例中,滤波器32可为解相关或混迭滤波器以便当存在有两个单独的声道时模型化感知的额外室内效应。解相关可具有额外效果,通过这个通知可减少DMX撤销假象。在本发明的实施例中,滤波器32可为均衡滤波器且可用于进行音色均衡。在本发明的其它实施例中,可应用解相关滤波器及混迭滤波器以在降混该架高扬声器的信号之前应用音色均衡及解相关。在本发明的实施例中,滤波器32可用于组合两项功能,即音色均衡及解相关。
在本发明的实施例中,解相关滤波器可被实现为混迭滤波器,将混迭导入第二输入声道。在本发明的实施例中,解相关滤波器可用于使用指数衰减噪声序列卷积第二输入声道。在本发明的实施例中,任何解相关滤波器皆可使用,其将第二输入声道解相关以给收听者保留来自第一输入声道及第二输入声道的信号源自不同位置的扬声器的印象。
图7a显示根据另一实施例的装置50的示意图。装置50用于接收第一输入声道12及第二输入声道14。装置50用于将第一输入声道12直接映射到第一输出声道16。装置50进一步用于通过第二与第三输出声道(可以是第二输出声道42和第三输出声道44)之间的平移生成幻象源。这在图7a中通过块52指示。如此,生成方位角与第二输入声道的方位角相对应的幻象源。
当考虑图5中的场景时,第一输入声道12可与水平中置扬声器CC相关联,第二输入声道14可与架高中置扬声器ECC相关联,第一输出声道16可与中置扬声器CC相关联,第二输出声道42可与左扬声器LC相关联,第三输出声道44可与右扬声器RC相关联。因此,在图7a显示的实施例中,通过在位置x1及x3平移扬声器,而不是直接应用相对应信号给位置x2的扬声器,幻象源被放置在位置x2。如此,尽管实际上有另一个扬声器在位置x2,其比位置x1及x3更接近位置x4,但进行位置x1及x3处的扬声器之间的平移。换言之,参考图7b,尽管实际上各个声道42、44与声道14间的方位角偏差Δα大于声道14与16之间的方位角偏差(其为0度),但进行位置x1及x3处的扬声器之间的平移。通过如此做,通过对于原始分配给相对应输入声道的信号使用位置x2处的离散扬声器和相同位置处的幻象源,保持位置x2及x4处的扬声器所导入的空间多样性。幻象源的信号与原始输入声道配置的位置x4处的扬声器的信号相对应。
图7b示意性地显示通过位置x1及x3处的扬声器之间的平移52,与位置x4处扬声器相关联的输入声道的映射。
在关于图7a及7b描述的实施例中,假设输入声道配置提供包括高度中置扬声器及水平中置扬声器的高度及水平层。此外,假设输出声道配置只提供包括水平中置扬声器及左和右水平扬声器的水平层,其可在水平中置扬声器位置实现幻象源。如图中解释,在常见的直接办法中,高度中置输入声道被使用水平中置输出扬声器重现。相反地,根据所描述的本发明的实施例,高度中置输入声道被蓄意地在水平左及右输出扬声器间平移。如此,通过使用水平中置扬声器及由该高度中置输入声道馈入的幻象源而保留输入声道配置的高度中置扬声器及水平中置扬声器的空间多样性。
在本发明的实施例中,除了平移之外,可应用均衡滤波器以补偿因不同BRIR所致的可能音色变化。
图9显示实现平移方法的装置60的实施例。在图9中,输入声道及输出声道相对应于图8显示的输入声道及输出声道,并且省略其重复说明。如图9中以块62显示,装置60用于通过第二及第三输出声道42及44之间的平移而产生幻象源。
在本发明的实施例中,可使用常用平移法实现平移,如通用平移算法,例如2D中的正切定律平移,或3D中的向量基幅值平移,参考V.Pulkki:“VirtualSoundSourcePositioningUsingVectorBaseAmplitudePanning”,音频工程学会期刊,45卷,456-466页,1997年,此处无需以进一步细节描述。应用的平移法则的平移增益确定当将输入声道映射至输出声道时应用的增益。获得的各个信号被增加至第二及第三输出声道42及44,参考图9的加法器块64。如此,通过平移将第二输入声道14映射到第二及第三输出声道42及44以产生位置x2处的幻象源,第一输入声道12被直接映射到第一输出声道16,第三及第四输入声道38及40也被直接映射到第二及第三输出声道42及44。
在可选实施例中,块62可被修改以除了平移功能之外额外提供均衡滤波器的功能。因此,除了通过平移办法保留空间多样性之外,可补偿因不同BRIR所致的可能音色变化。
图10显示用以产生DMX矩阵的系统,其中可实施本发明。系统包含描述输入-输出声道映射的规则集合,块400,以及基于规则集合400,选择用于输入声道配置404及输出声道配置406的给定组合的最适当规则的选择器402。系统可包括适当接口以接收关于输入声道配置404及输出声道配置406的信息。输入声道配置定义存在于输入设置中的声道,其中每个输入声道具有相关联的方向或位置。输出声道配置定义存在于输出设置中的声道,其中每个输出声道具有相关联的方向或位置。选择器402供应所选择的规则408至评估器410。评估器410接收所选择的规则408并评估所选择的规则408以根据所选择的规则408得到DMX系数412。DMX矩阵414可从得到的降混系数产生。评估器410可用于从降混系数得到降混矩阵。评估器410可接收关于输入声道配置及输出声道配置的信息,如关于输出设置几何形状的信息(例如声道位置)及关于输入设置几何形状的信息(例如声道位置),及在推导降混系数时将该信息列入考虑。如图11显示,系统可在信号处理单元420中实现,信号处理单元420包括被配置或编程用作选择器402及评估器410的处理器422,及用于存储映射规则集合400的至少部分的存储器424。映射规则的另一部分可由处理器检查,不获取存储在存储器422中的规则。任一个情况下,规则被提供给处理器以执行所描述的方法。信号处理单元可包括用以接收与输入声道相关联的输入信号228的输入接口426及用以输出与输出声道相关联的输出信号234的输出接口428。
规则400的一些可被设计为使得信号处理单元420实现本发明的实施例。将输入声道映射到一个或多个输出声道的示例性规则在表1中给出。
表1:映射规则
表1中使用的用于各个声道的标记被解释如下:符号“CH”表示“声道”。符号“M”表示“水平收听者平面”,即0度仰角。这是正常2D设置如立体声或5.1中扬声器所在的平面。符号“L”表示较低平面,即仰角<0度。符号“U”表示较高平面,即仰角>0度,如30度,作为3D设置中的上扬声器。符号“T”表示顶声道,即90度仰角,又名“上帝之声”声道。位在标记M/L/U/T中的一个后方的为用于左(L)或右(R)的标记,接着为方位角。例如,CH_M_L030及CH_M_R030表示常规立体声设置的左及右声道。每个声道的方位角及仰角在表1中指示,除了LFE声道及最后的空声道之外。
表1显示规则矩阵,其中一个或多个规则与每个输入声道(源声道)相关联。如从表1可见,每个规则定义输入声道将映射至的一个或多个输出声道(目的声道)。此外,每个规则在其第3栏定义增益值G。每个规则进一步定义EQ索引,EQ索引指示是否应用均衡滤波器,并且如果是,指示将应用哪个特定的均衡滤波器(EQ索引1至4)。以表1第3栏中给定的增益G进行输入声道至一个输出声道的映射。通过应用两个输出声道之间的平移进行输入声道至两个输出声道(第2栏中指示)的映射,其中从应用平移法则所得的平移增益g1及g2被额外乘以各个规则给定的增益(表1第3栏)。特定规则适用顶声道。根据第一规则,顶声道被映射至上平面的全部输出声道,以ALL_U指示;根据第二(较低优先排序)规则,顶声道被映射至水平收听者平面的全部输出声道,以ALL_M指示。
当考虑表1中指示的规则时,定义声道CH_U_000映射到左及右声道的规则表示本发明的实施例的实现。此外,定义待应用的均衡的规则表示本发明的实施例的实现。
如由表1可知,如果架高输入声道被映射到一个或多个较低声道,则均衡滤波器1至4中的一个被应用。基于表2中给定的标准化中心频率及基于表3中给定的参数可如下确定均衡器增益值GEQ
表2:77个滤波器组带的标准化中心频率
表3:均衡器参数
均衡器 Pf[Hz] PQ Pg[dB] g[dB]
GEQ,1 12000 0.3 -2 1.0
GEQ,2 12000 0.3 -3.5 1.0
GEQ,3 200,1300,600 0.3,0.5,1.0 -6.5,1.8,2.0 0.7
GEQ,4 5000,1100 1.0,0.8 4.5,1.8 -3.1
GEQ,5 35 0.25 -1.3 1.0
GEQ由每个频带k及均衡器索引e的增益值组成。五个预定义的均衡器为不同峰值滤波器的组合。如由表3可知,均衡器GEQ,1、GEQ,2、及GEQ,5包括单个峰值滤波器,均衡器GEQ,3包括三个峰值滤波器,均衡器GEQ,4包括两个峰值滤波器。每个均衡器为一个或多个峰值滤波器的串行级联,并且增益为:
G E Q , e k = 10 g 20 &Pi; n = 1 N p e a k ( b a n d ( k ) &CenterDot; f s / 2 , P f , n , P Q , n , P g , n )
其中,band(k)为频带j的标准化中心频率(如表2中指定),fs为采样频率,用于负G的函数peak()为
否则,
均衡器的参数在表3中指明。如上述等式1及2中,b由band(k).fs/2给定,Q由用于各个峰值滤波器(1至n)的PQ给定,G由用于各个峰值滤波器的Pg给定,f由用于各个峰值滤波器的Pf给定。
作为示例,对于具有索引4的均衡器,使用取自表3的相应列中的滤波参数计算均衡器增益值GEQ,4。表3列举用于峰值滤波器GEQ,4的两个参数集合,即对于n=1及n=2的参数集合。参数为峰值频率Pf(以Hz表示),峰值滤波品质因子PQ,峰值频率处应用的增益Pg(以dB表示),及应用至两个峰值滤波器的级联(对于参数n=1及n=2的滤波器的级联)的总增益g(以dB表示)。
因此,
G E Q , 4 = 10 - 3.1 20 &CenterDot; p e a k ( b a n d ( k ) &CenterDot; f s / 2 , P f , 1 , P Q , 1 , P g , 1 ) &CenterDot; p e a k ( b a n d ( k ) &CenterDot; f s / 2 , P f , 2 , P Q , 2 , P g , 2 ) = 10 - 3.1 20 &CenterDot; p e a k ( b a n d ( k ) &CenterDot; f s / 2 , 5000 , 1.0 , 4.5 ) &CenterDot; p e a k ( b a n d ( k ) &CenterDot; f s / 2 , 1100 , 0.8 , 1.8 ) = 10 - 3.1 20 &CenterDot; b 4 + ( 10 4.5 10 1 2 - 2 ) 5000 2 b 2 + 5000 4 b 4 + ( 1 1 2 - 2 ) 5000 2 b 2 + 5000 4 &CenterDot; b 4 + ( 10 1.8 10 0.8 2 - 2 ) 1100 2 b 2 + 1100 4 b 4 + ( 1 0.8 2 - 2 ) 1100 2 b 2 + 1100 4
如上陈述的均衡器,对于每个频带k,独立地定义零相位增益GEQ,4。每个频带k通过其标准化中心频率band(k)指明,其中0<=band<=1。注意的是,标准化中心频率band=1相对应于未经标准化频率fs/2,其中fs表示采样频率。因此band(k).fs/2表示频带k的未经标准化的中心频率,以Hz表示。
因此,已经描述可以在本发明实施例中使用的不同均衡器滤波器。但是,应清楚的是,这些均衡滤波器的描述是为了示例性目的,并且在其他实施例中可使用其他均衡滤波器或解相关滤波器。
表4显示具有与其相关联的各个方位角及仰角的声道示例。
表4:具有相对应方位角及仰角的声道
声道 方位角[度] 仰角[度]
CH_M_000 0 0
CH_M_L030 +30 0
CH_M_R030 -30 0
CH_M_L060 +60 0
CH_M_R060 -60 0
CH_M_L090 +90 0
CH_M_R090 -90 0
CH_M_L110 +110 0
CH_M_R110 -110 0
CH_M_L135 +135 0
CH_M_R135 -135 0
CH_M_180 180 0
CH_U_000 0 +35
CH_U_L045 +45 +35
CH_U_R045 -45 +35
CH_U_L030 +30 +35
CH_U_R030 -30 +35
CH_U_L090 +90 +35
CH_U_R090 -90 +35
CH_U_L110 +110 +35
CH_U_R110 -110 +35
CH_U_L135 +135 +35
CH_U_R135 -135 +35
CH_U_180 180 +35
CH_T_000 0 +90
CH_L_000 0 -15
CH_L_L045 +45 -15
CH_L_R045 -45 -15
CH_LFE1 n/a n/a
CH_LFE2 n/a n/a
CH_EMPTY n/a n/a
在本发明的实施例中,两个目的声道之间的平移可通过应用正切定律幅值平移实现。在将源声道平移至第一及第二目的声道的过程中,计算用于第一目的声道的增益系数G1并计算用于第二目的声道的增益系数G2
G1=(表4中增益栏的值)*g1
G2=(表4中增益栏的值)*g2
通过应用正切定律幅值平移以下述方式计算增益g1及g2
·打开源目的声道方位角为正
·目的声道的方位角为α1及α2(参考表4)
·源声道(平移目标)的方位角为αsrc
·
·
·∝=(∝center-∝src)·s9n(∝2-∝1)
·具有
在其它实施例中,可应用不同的平移法则。
原则上,本发明的实施例旨在通过改变的声道映射及输出声道配置中的信号修改模拟输出声道配置中的较高数量的声音通道。与直接办法相比,该办法常报告为比输入声道配置更加空间压缩、更少多样及较少包络,通过采用本发明的实施例可改进空间多样性及总体收听经验且令人更愉悦。
换言之,在本发明的实施例中,在降混应用中将两个或更多个输入声道混合一起,其中处理模块被应用至输入信号中的一个以保持从原始输入声道至收听者耳朵的不同传输路径的不同特性。在本发明的实施例中,处理模块可涉及修改信号特性的滤波器,例如均衡滤波器或解相关滤波器。均衡滤波器特别地可以使用分配给其的不同仰角补偿输入声道的不同音色的损耗。在本发明的实施例中,处理模块可路由输入信号中的至少一个到多个输出扬声器以产生到收听者的不同传输路径,如此保留输入声道的空间多样性。在本发明的实施例中,滤波及路由修改可单独地或组合地应用。在本发明的实施例中,处理模块输出可在一个或多个扬声器上重现。
虽然已经以装置为背景描述若干方面,但显然这些方面也表示相对应方法的描述,其中块或装置相对应于方法步骤或方法步骤的特性。类似地,以方法步骤为背景描述的方面也表示相对应块或相对应装置的项目或特性的描述。部分或全部方法步骤可通过(或使用)硬件装置执行,例如微处理器、可编程计算机或电子电路。在一些实施例中,最重要的方法步骤中的某一个或多个可通过此种装置执行。在本发明的实施例中,此处描述的方法为处理器实现的或计算机实现的。
根据某些实现要求,本发明的实施例可以硬件或软件实现。该实现可使用非暂时性存储介质执行,如数字存储介质,例如软盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或闪存,具有存储在其上的电子可读取控制信号,其与可编程计算机系统协作(或能够协作),以便执行各个方法。因此,数字存储介质可为计算机可读取的。
根据本发明的一些实施例包括具有电子可读取控制信号的数据载体,电子可读取控制信号能够与可编程计算机系统协作,以便执行此处描述的方法中的一个。
一般而言,本发明的实施例可被实现为具有程序代码的计算机程序产品,当计算机程序产品在计算机上运行时,程序代码被操作用以执行此处描述的方法中的一个。程序代码例如可存储在机器可读取载体上。
其它实施例包括存储在机器可读取载体上用以执行此处描述的方法中的一个的计算机程序。
换言之,因此,本发明方法的实施例为具有程序代码的计算机程序,当计算机程序在计算机上运行时,程序代码用以执行此处描述的方法中的一个。
因此,本发明方法的又一实施例为数据载体(或数字存储介质、或计算机可读取介质),包括记录在其上用以执行此处描述的方法中的一个的计算机程序。数据载体、数字存储介质或记录介质典型地为有形的和/或非暂时性的。
因此,本发明方法的又一实施例为数据流或信号序列,其表示用以执行此处描述的方法中的一个的计算机程序。数据流或信号序列例如可被配置为通过数据通信连接例如通过因特网传送。
又一实施例包括处理组件,例如计算机或可编程逻辑设备,被编程、被配置、或被调适以执行此处描述的方法中的一个。
又一实施例包括计算机,其上安装有计算机程序以执行此处描述的方法中的一个。
根据本发明的又一实施例包含被配置为将用于执行此处描述的方法中的一个的计算机程序传送(例如电子地或光学地)给接收器的装置或系统。接收器例如可为计算机、移动装置、存储装置等。装置或系统例如可包含文件服务器用以将计算机程序传送给接收器。
在一些实施例中,可编程逻辑设备(例如现场可编程门阵列)可用以执行此处描述的方法的部分或全部功能。在一些实施例中,现场可编程门阵列可与微处理器协作以执行此处描述的方法中的一个。一般而言,优选地通过任何硬件装置执行方法。
前述实施例仅用于例示本发明的原理。理解的是,此处描述的配置及细节的修改及变化将为本领域的其他技术人员所显然易知。因此意图本发明仅由所附的专利权利要求的范围所限制而非由通过实施例的描述和解释的方式所呈现的特定细节所限制。

Claims (15)

1.一种用于将输入声道配置的第一输入声道(12)和第二输入声道(14)映射至输出声道配置的至少一个输出声道(16,42,44)的装置(10;30;50;60),其中每个输入声道和每个输出声道具有其中相关联的扬声器相对于中心收听者位置(P)定位的方向,其中所述装置用于:
将所述第一输入声道(12)映射至所述输出声道配置的第一输出声道(16);以及以下至少一个:
a)将所述第二输入声道(14)映射至所述第一输出声道(16),包括通过应用均衡滤波器(18,32)和解相关滤波器(18,32)中的至少一个至所述第二输入声道(14)而处理所述第二输入声道(14);以及
b)尽管事实是所述第二输入声道(14)的方向与所述第一输出声道(16)的方向之间的角度偏差比所述第二输入声道(14)的方向与第二输出声道(42)的方向之间的角度偏差小和/或比所述第二输入声道(14)的方向与第三输出声道(44)的方向之间的角度偏差小,但是通过所述第二和第三输出声道(42,44)之间的平移(52,62)将所述第二输入声道(14)映射至所述第二和第三输出声道(42,44)。
2.如权利要求1所述的装置,其中所述角度偏差为水平收听者平面(300)中的方位角偏差。
3.如权利要求1或2所述的装置,其中所述第一输入声道(12)和所述第二输入声道(14)具有相对于水平收听者平面(300)的不同仰角。
4.如权利要求1至3中任一项所述的装置,用于将所述第二输入声道(14)映射至所述第二和第三输出声道(42,44),包括所述第二和第三输出声道(42,44)之间的平移(52,62),并且此外,用于通过应用均衡滤波器和解相关滤波器中的至少一个至所述第二输入声道(14)而处理所述第二输入声道(14)。
5.如权利要求1至4中任一项所述的装置,用于应用均衡滤波器(18,32)至所述第二输入声道(14),其中所述均衡滤波器(18,32)用于与所述第二输入声道(14)的其他频谱部分相比提高所述第二输入声道(14)的频谱部分,这已知给收听者声音来自与所述第二输入声道(14)的位置相对应的位置的印象。
6.如权利要求5所述的装置,其中所述第二输入声道(14)的方向具有比所述第二输入声道(14)映射至的所述一个或多个输出声道的仰角大的仰角,并且其中所述均衡滤波器(18,32)用于提高7kHz和10kHZ的频率范围内的所述第二声道(14)的频谱部分。
7.如权利要求1至6中任一项所述的装置,其中所述均衡滤波器(18,32)用于处理所述第二输入声道(14),以便补偿因所述第二输入声道(14)与所述第二输入声道(14)映射至的所述一个或多个输出声道(16,42,44)的不同方向而导致的音色差。
8.如权利要求1至7中任一项所述的装置,用于应用解相关滤波器(18,32)至所述第二输入声道(14),其中所述解相关滤波器(18,32)用于将频率相依延迟和/或随机化相位引入所述第二输入声道(14)。
9.如权利要求1至8中任一项所述的装置,用于应用解相关滤波器(18,32)至所述第二输入声道(14),其中所述解相关滤波器为混迭滤波器。
10.如权利要求1至9中任一项所述的装置,用于应用解相关滤波器(18,32)至所述第二输入声道(14),其中所述解相关滤波器用于使用指数衰减噪声序列卷积所述第二输入声道(14)。
11.如权利要求1至10中任一项所述的装置,其中,基于测量的特定收听室的双耳室脉冲响应或基于关于室内声学的经验知识设定均衡滤波器和解相关滤波器(18,32)中的至少一个的系数。
12.一种用于将输入声道配置的第一输入声道(12)和第二输入声道(14)映射至输出声道配置的至少一个输出声道的方法,其中每个输入声道和每个输出声道具有其中相关联的扬声器相对于中心收听者位置(P)定位的方向,所述方法包括:
将所述第一输入声道(12)映射至所述输出声道配置的第一输出声道(16);以及以下至少一个:
a)将所述第二输入声道(14)映射至所述第一输出声道(16),包括通过应用均衡滤波器和解相关滤波器(18,32)中的至少一个至所述第二输入声道(14)而处理所述第二输入声道(14);以及
b)尽管事实是所述第二输入声道(14)的方向与所述第一输出声道(16)的方向之间的角度偏差比所述第二输入声道(14)的方向与第二输出声道(42)之间的角度偏差小和/或比所述第二输入声道(14)的方向与第三输出声道(44)的方向之间的角度偏差小,但是通过所述第二和第三输出声道(42,44)之间的平移(52,62)将所述第二输入声道(14)映射至所述第二和第三输出声道(42,44)。
13.如权利要求12所述的方法,其中所述角度偏差为水平收听者平面(300)中的方位角偏差。
14.如权利要求12或13所述的方法,其中所述第一和第二输入声道(12,14)具有相对于水平收听者平面(300)的不同仰角,所述方法包括应用均衡滤波器(18,32)至所述第二输入声道(14),其中所述均衡滤波器(18,32)用于与所述第二输入声道(14)的其他频谱部分相比提高所述第二输入声道(14)的频谱部分,这已知给收听者声音来自与所述第二输入声道(14)的位置相对应的位置的印象。
15.一种计算机程序,当其在计算机或处理器上运行时,用于执行如权利要求12至14中任一项所述的方法。
CN201480041269.2A 2013-07-22 2014-07-15 声道映射的装置,方法和存储介质 Active CN105556992B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP13177360.8 2013-07-22
EP13177360 2013-07-22
EP13189243.2 2013-10-18
EP13189243.2A EP2830335A3 (en) 2013-07-22 2013-10-18 Apparatus, method, and computer program for mapping first and second input channels to at least one output channel
PCT/EP2014/065153 WO2015010961A2 (en) 2013-07-22 2014-07-15 Apparatus and method for mapping first and second input channels to at least one output channel

Publications (2)

Publication Number Publication Date
CN105556992A true CN105556992A (zh) 2016-05-04
CN105556992B CN105556992B (zh) 2018-07-20

Family

ID=48874133

Family Applications (4)

Application Number Title Priority Date Filing Date
CN201710046368.5A Active CN106804023B (zh) 2013-07-22 2014-07-15 输入声道至输出声道的映射方法、信号处理单元和音频解码器
CN201710457835.3A Active CN107040861B (zh) 2013-07-22 2014-07-15 将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法和信号处理单元
CN201480041269.2A Active CN105556992B (zh) 2013-07-22 2014-07-15 声道映射的装置,方法和存储介质
CN201480041264.XA Active CN105556991B (zh) 2013-07-22 2014-07-15 将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法和信号处理单元

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN201710046368.5A Active CN106804023B (zh) 2013-07-22 2014-07-15 输入声道至输出声道的映射方法、信号处理单元和音频解码器
CN201710457835.3A Active CN107040861B (zh) 2013-07-22 2014-07-15 将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法和信号处理单元

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201480041264.XA Active CN105556991B (zh) 2013-07-22 2014-07-15 将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法和信号处理单元

Country Status (20)

Country Link
US (6) US9936327B2 (zh)
EP (8) EP2830335A3 (zh)
JP (2) JP6227138B2 (zh)
KR (3) KR101858479B1 (zh)
CN (4) CN106804023B (zh)
AR (4) AR096996A1 (zh)
AU (3) AU2014295310B2 (zh)
BR (2) BR112016000990B1 (zh)
CA (3) CA2918843C (zh)
ES (5) ES2729308T3 (zh)
HK (1) HK1248439B (zh)
MX (2) MX355273B (zh)
MY (1) MY183635A (zh)
PL (5) PL3025519T3 (zh)
PT (5) PT3025519T (zh)
RU (3) RU2635903C2 (zh)
SG (3) SG11201600402PA (zh)
TW (2) TWI532391B (zh)
WO (2) WO2015010962A2 (zh)
ZA (1) ZA201601013B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109218948A (zh) * 2017-07-04 2019-01-15 奥迪康有限公司 助听系统、系统信号处理单元及用于产生增强的电音频信号的方法
CN111587582A (zh) * 2017-10-18 2020-08-25 Dts公司 用于3d音频虚拟化的音频信号预调节

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
KR102268836B1 (ko) * 2013-10-09 2021-06-25 소니그룹주식회사 부호화 장치 및 방법, 복호 장치 및 방법, 그리고 프로그램
CN106303897A (zh) 2015-06-01 2017-01-04 杜比实验室特许公司 处理基于对象的音频信号
KR102657547B1 (ko) 2015-06-17 2024-04-15 삼성전자주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
US11128978B2 (en) * 2015-11-20 2021-09-21 Dolby Laboratories Licensing Corporation Rendering of immersive audio content
EP3179744B1 (en) * 2015-12-08 2018-01-31 Axis AB Method, device and system for controlling a sound image in an audio zone
US20170325043A1 (en) * 2016-05-06 2017-11-09 Jean-Marc Jot Immersive audio reproduction systems
GB201609089D0 (en) * 2016-05-24 2016-07-06 Smyth Stephen M F Improving the sound quality of virtualisation
CN106604199B (zh) * 2016-12-23 2018-09-18 湖南国科微电子股份有限公司 一种数字音频信号的矩阵处理方法及装置
EP3583772B1 (en) * 2017-02-02 2021-10-06 Bose Corporation Conference room audio setup
US10979844B2 (en) 2017-03-08 2021-04-13 Dts, Inc. Distributed audio virtualization systems
GB2561844A (en) * 2017-04-24 2018-10-31 Nokia Technologies Oy Spatial audio processing
CA3061809C (en) 2017-05-03 2022-05-03 Andreas Walther Audio processor, system, method and computer program for audio rendering
TWI687919B (zh) * 2017-06-15 2020-03-11 宏達國際電子股份有限公司 音頻訊號處理方法、音頻定位系統以及非暫態電腦可讀取媒體
WO2019064719A1 (ja) * 2017-09-28 2019-04-04 株式会社ソシオネクスト 音響信号処理装置および音響信号処理方法
CN112005560B (zh) * 2018-04-10 2021-12-31 高迪奥实验室公司 使用元数据处理音频信号的方法和设备
CN109905338B (zh) * 2019-01-25 2021-10-19 晶晨半导体(上海)股份有限公司 一种串行数据接收器的多级均衡器增益的控制方法
US11568889B2 (en) 2019-07-22 2023-01-31 Rkmag Corporation Magnetic processing unit
JP2021048500A (ja) * 2019-09-19 2021-03-25 ソニー株式会社 信号処理装置、信号処理方法および信号処理システム
KR102283964B1 (ko) * 2019-12-17 2021-07-30 주식회사 라온에이엔씨 인터콤시스템 통신명료도 향상을 위한 다채널다객체 음원 처리 장치
GB2594265A (en) * 2020-04-20 2021-10-27 Nokia Technologies Oy Apparatus, methods and computer programs for enabling rendering of spatial audio signals
TWI742689B (zh) * 2020-05-22 2021-10-11 宏正自動科技股份有限公司 影音處理裝置、影音播放系統及其影音處理方法
CN112135226B (zh) * 2020-08-11 2022-06-10 广东声音科技有限公司 Y轴音频再生方法以及y轴音频再生系统
RU207301U1 (ru) * 2021-04-14 2021-10-21 Федеральное государственное бюджетное образовательное учреждение высшего образования "Санкт-Петербургский государственный институт кино и телевидения" (СПбГИКиТ) Усилительно-преобразовательное устройство
US20220386062A1 (en) * 2021-05-28 2022-12-01 Algoriddim Gmbh Stereophonic audio rearrangement based on decomposed tracks
WO2022258876A1 (en) * 2021-06-10 2022-12-15 Nokia Technologies Oy Parametric spatial audio rendering
CN114866948A (zh) * 2022-04-26 2022-08-05 北京奇艺世纪科技有限公司 一种音频处理方法、装置、电子设备和可读存储介质
WO2024122759A1 (ko) * 2022-12-06 2024-06-13 주식회사 라온에이엔씨 인터콤용 실감음향 오디오출력장치

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009046460A2 (en) * 2007-10-04 2009-04-09 Creative Technology Ltd Phase-amplitude 3-d stereo encoder and decoder
WO2011152044A1 (ja) * 2010-05-31 2011-12-08 パナソニック株式会社 音響再生装置
EP2434491A1 (en) * 2010-09-28 2012-03-28 Sony Ericsson Mobile Communications Japan, Inc. Sound processing device and sound processing method
US20120093323A1 (en) * 2010-10-14 2012-04-19 Samsung Electronics Co., Ltd. Audio system and method of down mixing audio signals using the same
WO2012109019A1 (en) * 2011-02-10 2012-08-16 Dolby Laboratories Licensing Corporation System and method for wind detection and suppression
US20120288124A1 (en) * 2011-05-09 2012-11-15 Dts, Inc. Room characterization and correction for multi-channel audio

Family Cites Families (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4308423A (en) 1980-03-12 1981-12-29 Cohen Joel M Stereo image separation and perimeter enhancement
US4748669A (en) * 1986-03-27 1988-05-31 Hughes Aircraft Company Stereo enhancement system
JPS6460200A (en) * 1987-08-31 1989-03-07 Yamaha Corp Stereoscopic signal processing circuit
GB9103207D0 (en) * 1991-02-15 1991-04-03 Gerzon Michael A Stereophonic sound reproduction system
JPH04281700A (ja) * 1991-03-08 1992-10-07 Yamaha Corp 多チャンネル再生装置
JP3146687B2 (ja) 1992-10-20 2001-03-19 株式会社神戸製鋼所 高耐食性表面改質TiまたはTi基合金部材
JPH089499B2 (ja) 1992-11-24 1996-01-31 東京窯業株式会社 焼成マグネシア・ドロマイトれんが
JP2944424B2 (ja) * 1994-06-16 1999-09-06 三洋電機株式会社 音響再生回路
US6128597A (en) * 1996-05-03 2000-10-03 Lsi Logic Corporation Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor
US6421446B1 (en) 1996-09-25 2002-07-16 Qsound Labs, Inc. Apparatus for creating 3D audio imaging over headphones using binaural synthesis including elevation
JP4304401B2 (ja) 2000-06-07 2009-07-29 ソニー株式会社 マルチチャンネルオーディオ再生装置
US20040062401A1 (en) * 2002-02-07 2004-04-01 Davis Mark Franklin Audio channel translation
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
TW533746B (en) * 2001-02-23 2003-05-21 Formosa Ind Computing Inc Surrounding sound effect system with automatic detection and multiple channels
TWI315828B (en) 2002-08-07 2009-10-11 Dolby Lab Licensing Corp Audio channel spatial translation
DE60336499D1 (de) * 2002-11-20 2011-05-05 Koninkl Philips Electronics Nv Audio-gestüzte datenrepräsentationsvorrichtung und verfahren
JP3785154B2 (ja) * 2003-04-17 2006-06-14 パイオニア株式会社 情報記録装置、情報再生装置及び情報記録媒体
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JP4867914B2 (ja) 2004-03-01 2012-02-01 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチチャンネルオーディオコーディング
CN101010726A (zh) 2004-08-27 2007-08-01 松下电器产业株式会社 音频解码器、方法以及程序
US8046217B2 (en) 2004-08-27 2011-10-25 Panasonic Corporation Geometric calculation of absolute phases for parametric stereo decoding
US8086331B2 (en) * 2005-02-01 2011-12-27 Panasonic Corporation Reproduction apparatus, program and reproduction method
US7830921B2 (en) * 2005-07-11 2010-11-09 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
KR100619082B1 (ko) 2005-07-20 2006-09-05 삼성전자주식회사 와이드 모노 사운드 재생 방법 및 시스템
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US20070080485A1 (en) 2005-10-07 2007-04-12 Kerscher Christopher S Film and methods of making film
JP4814344B2 (ja) 2006-01-19 2011-11-16 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
TWI342718B (en) 2006-03-24 2011-05-21 Coding Tech Ab Decoder and method for deriving headphone down mix signal, receiver, binaural decoder, audio player, receiving method, audio playing method, and computer program
US8712061B2 (en) * 2006-05-17 2014-04-29 Creative Technology Ltd Phase-amplitude 3-D stereo encoder and decoder
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
FR2903562A1 (fr) * 2006-07-07 2008-01-11 France Telecom Spatialisation binaurale de donnees sonores encodees en compression.
WO2008046530A2 (en) * 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
US8050434B1 (en) * 2006-12-21 2011-11-01 Srs Labs, Inc. Multi-channel audio enhancement system
WO2008100100A1 (en) * 2007-02-14 2008-08-21 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
RU2406165C2 (ru) * 2007-02-14 2010-12-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
TWM346237U (en) * 2008-07-03 2008-12-01 Cotron Corp Digital decoder box with multiple audio source detection function
US8483395B2 (en) 2007-05-04 2013-07-09 Electronics And Telecommunications Research Institute Sound field reproduction apparatus and method for reproducing reflections
US20080298610A1 (en) * 2007-05-30 2008-12-04 Nokia Corporation Parameter Space Re-Panning for Spatial Audio
JP2009077379A (ja) * 2007-08-30 2009-04-09 Victor Co Of Japan Ltd 立体音響再生装置、立体音響再生方法及びコンピュータプログラム
JP2009100144A (ja) * 2007-10-16 2009-05-07 Panasonic Corp 音場制御装置、音場制御方法およびプログラム
WO2009111798A2 (en) * 2008-03-07 2009-09-11 Sennheiser Electronic Gmbh & Co. Kg Methods and devices for reproducing surround audio signals
US8306233B2 (en) * 2008-06-17 2012-11-06 Nokia Corporation Transmission of audio signals
EP2146522A1 (en) * 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
ES2524391T3 (es) * 2008-07-31 2014-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generación de señal para señales binaurales
US9628934B2 (en) * 2008-12-18 2017-04-18 Dolby Laboratories Licensing Corporation Audio channel spatial translation
EP2214161A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
JP4788790B2 (ja) * 2009-02-27 2011-10-05 ソニー株式会社 コンテンツ再生装置、コンテンツ再生方法、プログラム、及びコンテンツ再生システム
AU2013206557B2 (en) 2009-03-17 2015-11-12 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
MX2011006248A (es) 2009-04-08 2011-07-20 Fraunhofer Ges Forschung Aparato, metodo y programa de computacion para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavizacion de valor de fase.
US8699849B2 (en) * 2009-04-14 2014-04-15 Strubwerks Llc Systems, methods, and apparatus for recording multi-dimensional audio
KR20100121299A (ko) 2009-05-08 2010-11-17 주식회사 비에스이 다기능 마이크로 스피커
US8848952B2 (en) * 2009-05-11 2014-09-30 Panasonic Corporation Audio reproduction apparatus
TWI441164B (zh) * 2009-06-24 2014-06-11 Fraunhofer Ges Forschung 音訊信號解碼器、用以將音訊信號解碼之方法、以及運用級聯音訊物件處理級之電腦程式
TWI413110B (zh) * 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
EP2326108B1 (en) 2009-11-02 2015-06-03 Harman Becker Automotive Systems GmbH Audio system phase equalizion
CN102656627B (zh) 2009-12-16 2014-04-30 诺基亚公司 多信道音频处理方法和装置
KR101673232B1 (ko) 2010-03-11 2016-11-07 삼성전자주식회사 수직 방향 가상 채널을 생성하는 장치 및 그 방법
KR102033071B1 (ko) * 2010-08-17 2019-10-16 한국전자통신연구원 멀티 채널 오디오 호환 시스템 및 방법
JP5802753B2 (ja) * 2010-09-06 2015-11-04 ドルビー・インターナショナル・アクチボラゲットDolby International Ab マルチチャンネルオーディオ再生のためのアップミキシング方法及びシステム
KR101756838B1 (ko) 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
KR20120038891A (ko) 2010-10-14 2012-04-24 삼성전자주식회사 오디오 시스템 및 그를 이용한 오디오 신호들의 다운 믹싱 방법
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
TWI517028B (zh) * 2010-12-22 2016-01-11 傑奧笛爾公司 音訊空間定位和環境模擬
KR20140025373A (ko) 2011-03-04 2014-03-04 써드 밀레니엄 메탈즈, 엘엘씨 알루미늄-탄소 조성물
WO2012140525A1 (en) * 2011-04-12 2012-10-18 International Business Machines Corporation Translating user interface sounds into 3d audio space
TW202339510A (zh) * 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
TWM416815U (en) * 2011-07-13 2011-11-21 Elitegroup Computer Sys Co Ltd Output/input module for switching audio source and audiovisual playback device thereof
EP2560161A1 (en) 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
TWI479905B (zh) * 2012-01-12 2015-04-01 Univ Nat Central Multi-channel down mixing device
EP2645749B1 (en) 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audio apparatus and method of converting audio signal thereof
KR101915258B1 (ko) * 2012-04-13 2018-11-05 한국전자통신연구원 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
US9516446B2 (en) * 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
CN107454511B (zh) * 2012-08-31 2024-04-05 杜比实验室特许公司 用于使声音从观看屏幕或显示表面反射的扬声器
BR112015005456B1 (pt) * 2012-09-12 2022-03-29 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Aparelho e método para fornecer capacidades melhoradas de downmix guiado para áudio 3d
KR101407192B1 (ko) * 2012-09-28 2014-06-16 주식회사 팬택 사운드 출력을 제어하는 휴대 단말 및 사운드 출력 제어 방법
US8638959B1 (en) 2012-10-08 2014-01-28 Loring C. Hall Reduced acoustic signature loudspeaker (RSL)

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009046460A2 (en) * 2007-10-04 2009-04-09 Creative Technology Ltd Phase-amplitude 3-d stereo encoder and decoder
WO2011152044A1 (ja) * 2010-05-31 2011-12-08 パナソニック株式会社 音響再生装置
EP2434491A1 (en) * 2010-09-28 2012-03-28 Sony Ericsson Mobile Communications Japan, Inc. Sound processing device and sound processing method
US20120093323A1 (en) * 2010-10-14 2012-04-19 Samsung Electronics Co., Ltd. Audio system and method of down mixing audio signals using the same
WO2012109019A1 (en) * 2011-02-10 2012-08-16 Dolby Laboratories Licensing Corporation System and method for wind detection and suppression
US20120288124A1 (en) * 2011-05-09 2012-11-15 Dts, Inc. Room characterization and correction for multi-channel audio

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109218948A (zh) * 2017-07-04 2019-01-15 奥迪康有限公司 助听系统、系统信号处理单元及用于产生增强的电音频信号的方法
CN109218948B (zh) * 2017-07-04 2021-08-06 奥迪康有限公司 助听系统、系统信号处理单元及用于产生增强的电音频信号的方法
CN111587582A (zh) * 2017-10-18 2020-08-25 Dts公司 用于3d音频虚拟化的音频信号预调节
CN111587582B (zh) * 2017-10-18 2022-09-02 Dts公司 用于3d音频虚拟化的音频信号预调节的系统、方法、以及存储介质

Also Published As

Publication number Publication date
TW201519663A (zh) 2015-05-16
CA2918843C (en) 2019-12-03
KR20170141266A (ko) 2017-12-22
TWI532391B (zh) 2016-05-01
TWI562652B (en) 2016-12-11
KR101858479B1 (ko) 2018-05-16
EP3025518B1 (en) 2017-09-13
CN106804023B (zh) 2019-02-05
ES2925205T3 (es) 2022-10-14
JP6227138B2 (ja) 2017-11-08
CA2968646C (en) 2019-08-20
RU2672386C1 (ru) 2018-11-14
EP2830332A2 (en) 2015-01-28
US20200396557A1 (en) 2020-12-17
ES2688387T3 (es) 2018-11-02
PL3258710T3 (pl) 2019-09-30
AU2017204282B2 (en) 2018-04-26
BR112016000999B1 (pt) 2022-03-15
PL3025518T3 (pl) 2018-03-30
WO2015010961A3 (en) 2015-03-26
PL3133840T3 (pl) 2019-01-31
CN107040861A (zh) 2017-08-11
US20190075419A1 (en) 2019-03-07
EP3133840B1 (en) 2018-07-04
RU2016105608A (ru) 2017-08-28
EP3258710A1 (en) 2017-12-20
US20160134989A1 (en) 2016-05-12
PT3025518T (pt) 2017-12-18
US11272309B2 (en) 2022-03-08
ZA201601013B (en) 2017-09-27
AU2014295310B2 (en) 2017-07-13
CN107040861B (zh) 2019-02-05
AU2014295309A1 (en) 2016-02-11
CN105556992B (zh) 2018-07-20
WO2015010961A2 (en) 2015-01-29
SG11201600475VA (en) 2016-02-26
AR109897A2 (es) 2019-02-06
EP3518563A2 (en) 2019-07-31
HK1248439B (zh) 2020-04-09
EP3518563B1 (en) 2022-05-11
BR112016000990A2 (zh) 2017-07-25
EP2830335A2 (en) 2015-01-28
AU2017204282A1 (en) 2017-07-13
PT3518563T (pt) 2022-08-16
EP2830335A3 (en) 2015-02-25
CA2918843A1 (en) 2015-01-29
EP3025519A2 (en) 2016-06-01
EP3518563A3 (en) 2019-08-14
KR20160034962A (ko) 2016-03-30
RU2640647C2 (ru) 2018-01-10
AR096996A1 (es) 2016-02-10
CA2918811C (en) 2018-06-26
US10701507B2 (en) 2020-06-30
EP3025519B1 (en) 2017-08-23
US20160142853A1 (en) 2016-05-19
WO2015010962A3 (en) 2015-03-26
RU2016105648A (ru) 2017-08-29
EP3258710B1 (en) 2019-03-20
MY183635A (en) 2021-03-04
KR101803214B1 (ko) 2017-11-29
RU2635903C2 (ru) 2017-11-16
AU2014295309B2 (en) 2016-10-27
CA2918811A1 (en) 2015-01-29
US11877141B2 (en) 2024-01-16
JP2016527805A (ja) 2016-09-08
MX2016000905A (es) 2016-04-28
ES2645674T3 (es) 2017-12-07
PL3518563T3 (pl) 2022-09-19
JP2016527806A (ja) 2016-09-08
EP3025518A2 (en) 2016-06-01
MX355273B (es) 2018-04-13
BR112016000999A2 (zh) 2017-07-25
PT3025519T (pt) 2017-11-21
AR097004A1 (es) 2016-02-10
BR112016000990B1 (pt) 2022-04-05
SG11201600402PA (en) 2016-02-26
ES2729308T3 (es) 2019-10-31
CN105556991A (zh) 2016-05-04
KR101810342B1 (ko) 2018-01-18
CN105556991B (zh) 2017-07-11
AR116606A2 (es) 2021-05-26
MX2016000911A (es) 2016-05-05
JP6130599B2 (ja) 2017-05-17
TW201513686A (zh) 2015-04-01
KR20160061977A (ko) 2016-06-01
CA2968646A1 (en) 2015-01-29
WO2015010962A2 (en) 2015-01-29
US20180192225A1 (en) 2018-07-05
EP2830332A3 (en) 2015-03-11
SG10201605327YA (en) 2016-08-30
PL3025519T3 (pl) 2018-02-28
AU2014295310A1 (en) 2016-02-11
PT3258710T (pt) 2019-06-25
US9936327B2 (en) 2018-04-03
US20210037334A1 (en) 2021-02-04
PT3133840T (pt) 2018-10-18
EP4061020A1 (en) 2022-09-21
EP3133840A1 (en) 2017-02-22
MX355588B (es) 2018-04-24
CN106804023A (zh) 2017-06-06
US10798512B2 (en) 2020-10-06
ES2649725T3 (es) 2018-01-15
US10154362B2 (en) 2018-12-11

Similar Documents

Publication Publication Date Title
CN105556992A (zh) 将第一和第二输入声道映射至至少一个输出声道的装置,方法和计算机程序
TWI443647B (zh) 用以將以物件為主之音訊信號編碼與解碼之方法與裝置
RU2420026C2 (ru) Способы и устройства для кодирования и декодирования аудиосигналов на основе объектов
CN107787584A (zh) 处理低复杂度格式转换的内部声道的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant