CN104681030B - 用于编码/解码信号的装置和方法 - Google Patents

用于编码/解码信号的装置和方法 Download PDF

Info

Publication number
CN104681030B
CN104681030B CN201510128054.0A CN201510128054A CN104681030B CN 104681030 B CN104681030 B CN 104681030B CN 201510128054 A CN201510128054 A CN 201510128054A CN 104681030 B CN104681030 B CN 104681030B
Authority
CN
China
Prior art keywords
audio signal
signal
reduction audio
information
reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510128054.0A
Other languages
English (en)
Other versions
CN104681030A (zh
Inventor
郑亮源
房熙锡
吴贤午
金东秀
林宰显
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Priority claimed from CN200780004505.3A external-priority patent/CN101385075B/zh
Publication of CN104681030A publication Critical patent/CN104681030A/zh
Application granted granted Critical
Publication of CN104681030B publication Critical patent/CN104681030B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供了一种解码音频信号的方法和装置。该解码方法包括:跳过包括在输入比特流中的扩展信息;从输入比特流提取三维(3D)缩减混音信号和空间信息;通过对3D缩减混音信号执行3D渲染操作来从3D缩减混音信号去除3D效果;以及利用通过去除获取的缩减混音信号和空间信息生成多声道信号。因此,高效率地编码具有3D效果的多声道信号,并根据音频再现环境的特性以最优音质自适应地恢复和再现音频信号是可能的。

Description

用于编码/解码信号的装置和方法
本申请是申请日为2007年2月7日、申请号为200780004505.3、发明名称为“用于编码/解码信号的装置和方法”的发明专利申请的分案申请。
技术领域
本发明涉及编码/解码方法和编码/解码装置,尤其涉及可处理音频信号使得能够产生三维(3D)音响效果的编码/解码装置,以及利用该编码/解码装置的编码/解码方法。
背景技术
编码装置将多声道信号缩减混音成具有较少声道的信号,并将经缩减混音的信号传送到解码装置。然后,解码装置从经缩减混音的信号恢复多声道信号,并使用如5.1声道扬声器之类的三个或更多扬声器再现所恢复的多声道信号。
多声道信号可由诸如耳机之类的2声道扬声器来再现。在这种情况下,为了使用户觉得由2声道扬声器输出的声音好像从三个或更多声源再现的一样,有必要开发出能够编码或解码多声道信号使得能够产生3D效果的三维(3D)处理技术。
发明内容
技术问题
本发明提供一种能够通过高效率地处理具有3D效果的信号而在各种再现环境中再现多声道信号的编码/解码装置以及编码/解码方法。
技术解决方案
根据本发明的一个方面,提供了一种解码信号的解码方法,该解码方法包括:跳过包括在输入比特流中的扩展信息;从输入比特流提取三维(3D)缩减混音信号和空间信息;通过对3D缩减混音信号执行3D渲染操作来从3D缩减混音信号去除3D效果;以及利用通过去除获取的缩减混音信号和空间信息生成多声道信号。
根据本发明的另一个方面,提供了一种解码信号的解码方法,该解码方法包括:跳过包括在输入比特流中的扩展信息;从输入比特流提取缩减混音信号和空间信息;以及通过对缩减混音信号执行3D渲染操作来生成3D缩减混音信号。
根据本发明的另一个方面,提供了一种编码具有多个声道的多声道信号的编码方法,该编码方法包括:将多声道信号编码成具有较少声道的缩减混音信号并生成关于多个声道的空间信息;生成包括声道扩充信息和残差信息中的至少一个的扩展信息;生成包括空间信息和扩展信息的比特流;以及将跳过扩展信息所必需的跳过信息插入该比特流。
根据本发明的一个方面,提供了一种用于解码信号的解码装置,该解码装置包括:比特拆分单元,其跳过包括在输入比特流中的扩展信息并从输入比特流提取3D缩减混音信号和空间信息;3D渲染单元,其通过对3D缩减混音信号执行3D渲染操作来从3D缩减混音信号去除3D效果;以及多声道解码器,其利用由3D渲染单元执行去除而获取的缩减混音信号和空间信息来生成多声道信号。
根据本发明的另一个方面,提供了一种用于解码信号的解码装置,该解码装置包括:比特拆分单元,其跳过包括在输入比特流中的扩展信息并从输入比特流提取缩减混音信号和空间信息;以及3D渲染单元,其通过对缩减混音信号执行3D渲染操作来生成3D缩减混音信号。
根据本发明的另一个方面,提供了一种编码具有多个声道的多声道信号的编码装置,该编码装置包括:多声道编码器,其将多声道信号编码成具有较少声道的缩减混音信号并生成关于多个声道的空间信息;扩展信息生成单元,其生成包括声道扩充信息和残差信息中的至少一个的扩展信息;以及比特打包单元,其生成包括空间信息、扩展信息和跳过扩展信息所必需的跳过信息的比特流。
根据本发明的另一个方面,提供了一种具有用于执行上述的解码方法或上述的编码方法中的任一种的计算机程序的计算机可读记录介质。
有益效果
根据本发明,可高效地编码具有3D效果的多声道信号,并根据再现环境的特性以最优音质自适应地恢复和再现音频信号。
附图简要说明
图1是根据本发明的实施例的编码/解码装置的框图;
图2是根据本发明的实施例的编码装置的框图;
图3是根据本发明的实施例的解码装置的框图;
图4是根据本发明的另一个实施例的编码装置的框图;
图5是根据本发明的另一个实施例的解码装置的框图;
图6是根据本发明的另一个实施例的解码装置的框图;
图7是根据本发明的实施例的三维(3D)渲染装置的框图;
图8至11示出根据本发明的实施例的比特流;
图12是根据本发明的实施例用于处理任意缩减混音信号的编码/解码装置的框图;
图13是根据本发明的实施例的任意缩减混音信号补偿/3D渲染单元的框图;
图14是根据本发明的实施例用于处理兼容缩减混音信号的解码装置的框图;
图15是根据本发明的实施例的缩减混音兼容性处理/3D渲染单元的框图;以及
图16是根据本发明的实施例用于消除串扰的解码装置的框图。
本发明的最佳实施方式
下文中将参考示出本发明的示例性实施例的附图更全面地描述本发明。图1是根据本发明的实施例的编码/解码装置的框图。参考图1,编码单元100包括多声道编码器110、三维(3D)渲染单元120、缩减混音编码器130以及比特打包单元140
多声道编码器110将具有多个声道的多声道信息缩减混音成诸如立体声或单声道信号之类的缩减混音信号,并生成关于该多声道信号的声道的空间信息。需要空间信息是为了从缩减混音信号恢复多声道信号。
空间信息的例子包括:指示一对声道的能级之差的声道电平差(CLD)、声道预测系数(CPC)——即用于基于2声道信号生成3声道信号的预测系数、指示一对声道之间的相关性的声道间相关性(ICC)以及一对声道之间的时间间隔的声道时间差(CTD)。
3D渲染单元120基于缩减混音信号生成3D缩减混音信号。3D缩减混音信号可以是具有三个或更多方向性的2声道信号,因此可由诸如耳机之类的2声道扬声器再现并具有3D效果。换言之,3D缩减混音信号可由2声道扬声器再现,使得用户觉得3D缩减混音信号好像是从具有三个或更多声道的声源再现的一样。声源的方向可基于分别输入到两耳的两个声音的强度之差、两个声音之间的时间间隔以及两个声音的相位之差中的至少一个来确定。因此,3D渲染单元120可基于人类如何利用其听觉确定声源的3D位置来将缩减混音信号转换成3D缩减混音信号。
3D渲染单元120可通过利用滤波器滤波缩减混音信号来生成3D缩减混音信号。在这种情况下,可由外部源将滤波器相关信息——如滤波器系数输入到3D渲染单元120。3D渲染单元120可利用由多声道编码器110提供的空间信息来基于缩减混音信号生成3D缩减混音信号。更具体地,3D渲染单元120可通过利用空间信息将缩减混音信号转换成想像的多声道信号并滤波该想像的多声道信号来将缩减混音信号转换成3D缩减混音信号。
3D渲染单元120可通过利用报头相关传递函数(HRTF)滤波器滤波缩减混音信号来生成3D缩减混音信号。
HRTF是一种传递函数,它描述任意位置的声源和耳膜之间声波的传输,并返回根据声源的方向和高度变化的值。如果利用HRTF滤波没有方向性的信号,则可听到该信号好像从某方向再现一样。
3D渲染单元120可在例如离散傅立叶变换(DFT)域或快速傅立叶变换(FFT)域之类的频域中执行3D渲染操作。在这种情况下,3D渲染单元120可在3D渲染操作前执行DFT或FFT,或者可在3D渲染操作后执行逆DFT(IDFT)或逆FFT(IFFT)。
3D渲染单元120可在正交镜像滤波器(QMF)/混合域中执行3D渲染操作。在这种情况下,3D渲染单元120可在3D渲染操作之前或之后执行QMF/混合分析和合成操作。
3D渲染单元120可在时域中执行3D渲染操作。3D渲染单元120可根据所需的音质和编码/解码装置的操作能力确定将在哪个域中执行3D渲染操作。
缩减混音编码器130编码由多声道编码器110输出的缩减混音信号或由3D渲染单元120输出的3D缩减混音信号。缩减混音编码器130可利用诸如高级音频译码(AAC)法、MPEG层3(MP3)法或比特片算法译码(BSAC)法之类的音频编码法来编码由多声道编码器110输出的缩减混音信号或由3D渲染单元120输出的3D缩减混音信号。
缩减混音编码器130可编码非3D缩减混音信号或3D缩减混音信号。在这种情况下,经编码的非3D缩减混音信号和经编码的3D缩减混音信号两者都可被包括在待传送的比特流中。
比特打包单元140基于空间信息以及或者经编码的非3D缩减混音信号或者经编码的3D缩减混音信号来生成比特流。
由比特打包单元140生成的比特流可包括空间信息、指示包括在比特流中的缩减混音信号是非3D缩减混音信号还是3D缩减混音信号的缩减混音标识信息、以及标识由3D渲染单元120所使用的滤波器的信息(例如,HRTF系数信息)。
换言之,由比特打包单元140生成的比特流可包括还未经3D处理的非3D缩减混音信号以及通过由编码装置执行的3D处理操作获取的编码器3D缩减混音信号中的至少一个、以及标识包括在比特流中的缩减混音信号的类型的缩减混音标识信息。
可按用户选择或根据图1所示的编码/解码装置的能力和再现环境的特性确定非3D缩减混音信号和编码器3D缩减混音信号中的哪一个将被包括在由比特打包单元140生成的比特流中。
HRTF系数信息可包括由3D渲染单元120所使用的HRTF的反函数的系数。HRTF系数信息可仅包括由3D渲染单元120所使用的HRTF的系数的简短信息,例如,HRTF系数的包络信息。如果将包括HRTF的反函数的系数的比特流传送到解码装置,则解码装置不需要执行HRTF系数转换操作,因此可减少解码装置的计算量。
由比特打包单元140生成的比特流还可包括关于由基于HRTF的滤波导致的信号中的能量变化的信息,即,关于将要滤波的信号的能量与已滤波的信号的能量之差或将要滤波的信号的能量与已滤波的信号的能量之比的信息。
由比特打包单元140生成的比特流还可包括指示其是否包括HRTF系数的信息。如果HRTF系数被包括在由比特打包单元140生成的比特流中,则该比特流还可包括指示其包括由3D渲染单元120所使用的HRTF的系数还是HRTF的反函数的系数的信息。
参考图1,第一解码单元200包括比特拆分单元210、缩减混音解码器220、3D渲染单元230以及多声道解码器240。
比特拆分单元210从编码单元100接收输入比特流,并从该输入比特流中提取经编码的缩减混音信号和空间信息。缩减混音解码器220对经编码的缩减混音信号进行解码。缩减混音解码器220可利用诸如AAC法、MP3法或BSAC法之类的音频信号解码方法来对经编码的缩减混音信号进行解码。
如上所述,从输入比特流中提取的经编码的缩减混音信号可以是经编码的非3D缩减混音信号或经编码的、编码器3D缩减混音信号。指示从输入比特流中提取的经编码的缩减混音信号是经编码的非3D缩减混音信号还是经编码的、编码器3D缩减混音信号的信息可被包括在输入比特流中。
如果从输入比特流中提取的经编码的缩减混音信号是编码器3D缩减混音信号,则经编码的缩减混音信号可在由缩减混音解码器220解码后容易地再现。
另一方面,如果从输入比特流中提取的经编码的缩减混音信号是非3D缩减混音信号,则经编码的缩减混音信号可由缩减混音解码器220解码,且通过解码获取的缩减混音信号可通过由第三渲染单元233执行的3D渲染操作转换成解码器3D缩减混音信号。解码器3D缩减混音信号可被容易地再现。
3D渲染单元230包括第一渲染器231、第二渲染器232和第三渲染器233。第一渲染器231通过对由缩减混音解码器220提供的编码器3D缩减混音信号执行3D渲染操作来生成缩减混音信号。例如,第一渲染器231可通过从编码器3D缩减混音信号去除3D效果来生成非3D缩减混音信号。编码器3D缩减混音信号的3D效果可能不能由第一渲染器231完全去除。在这种情况下,由第一渲染器231输出的缩减混音信号可具有相同的3D效果。
第一渲染器231可将由缩减混音解码器220提供的3D缩减混音信号转换成使用编码单元100的3D渲染单元120所使用的滤波器的逆滤波器来将3D效果从其去除的缩减混音信号。关于由3D渲染单元120所使用的滤波器或由3D渲染单元120所使用的滤波器的逆滤波器的信息可被包括在输入比特流中。
由3D渲染单元120所使用的滤波器可以是HRTF滤波器。在这种情况下,由编码单元100所使用的HRTF的系数或HRTF的反函数的系数也可被包括在输入比特流中。如果由编码器单元100所使用的HRTF的系数被包括在输入比特流中,则HRTF系数可被逆转换,且可在由第一渲染器231执行的3D渲染操作期间使用该逆转换的结果。如果由编码单元100所使用的HRTF的反函数的系数被包括在输入比特流中,则它们可在由第一渲染器231执行的3D渲染操作期间容易地使用,而不进行任何逆转换操作。在这种情况下,可减少第一解码装置100的计算量。
输入比特流还可包括滤波器信息(例如,指示由编码单元100所使用的HRTF的系数是否被包括在输入比特流中的信息)以及指示该滤波器信息是否已被逆转换的信息。
多声道解码器240基于从其去除3D效果的缩减混音信号和从输入比特流中提取的空间信息来生成具有三个或更多声道的3D多声道信号。
第二渲染器232可通过对从其去除3D效果的缩减混音信号执行3D渲染操作来生成具有3D效果的3D缩减混音信号。换言之,第一渲染器231从由缩减混音解码器220提供的编码器3D缩减混音信号中去除3D效果。之后,第二渲染器232可利用第一解码装置的滤波器,通过对由第一渲染器231执行去除而获取的缩减混音信号执行3D渲染操作来生成第一解码装置200所期望的具有3D效果的组合3D缩减混音信号。
第一解码装置200可包括其中结合有执行相同操作的第一、第二和第三渲染器231、232和233中的两个或更多个的渲染器。
由编码单元100生成的比特流可被输入到具有与第一解码装置200不同的结构的第二解码装置300。第二解码装置300可基于包括在向其输入的比特流中的缩减混音信号生成3D缩减混音信号。
更具体地,第二解码装置300包括比特拆分单元310、缩减混音解码器320以及3D渲染单元330。比特拆分单元310从编码单元100接收输入比特流,并从该输入比特流中提取经编码的缩减混音信号和空间信息。缩减混音解码器320对经编码的缩减混音信号进行解码。3D渲染单元330对经解码的缩减混音信号执行3D渲染操作,使得经解码的缩减混音信号可被转换成3D缩减混音信号。
图2是根据本发明的实施例的编码装置的框图。参考图2,该编码装置包括渲染单元400和420以及多声道编码器410。将省略与图1的实施例相同的编码过程的详细描述。
参考图2,可将3D渲染单元400和420分别设置在多声道编码器410的前面和后面。因此,多声道信号可由3D渲染单元400进行3D渲染,然后,经3D渲染的多声道信号可由多声道编码器410编码,从而生成经预处理的、编码器3D缩减混音信号。或者,多声道信号可由多声道编码器410进行缩减混音,然后,经缩减混音的信号可由3D渲染单元420进行3D渲染,从而生成经后处理的、编码器缩减混音信号。
指示多声道信号在缩减混音前还是缩减混音后进行3D渲染的信息可被包括在待传送的比特流中。
3D渲染单元400和420两者都可被设置在多声道编码器410的前面或后面。
图3是根据本发明的实施例的解码装置的框图。参考图3,该解码装置包括3D渲染单元430和450以及多声道解码器440。将省略与图1的实施例相同的解码过程的详细描述。
参考图3,可将3D渲染单元430和450分别设置在多声道解码器440的前面和后面。3D渲染单元430可从编码器3D缩减混音信号去除3D效果,并将通过去除获取的缩减混音信号输入到多声道解码器430。然后,多声道解码器430可解码向其输入的缩减混音信号,从而生成经预处理的3D多声道信号。或者,多声道解码器430可从经编码的3D缩减混音信号恢复多声道信号,且3D渲染单元450可从所恢复的多声道信号去除3D效果,从而生成经后处理的3D多声道信号。
如果由编码装置提供的编码器3D缩减混音信号已经通过执行3D渲染操作和随后的缩减混音操作而生成,则编码器3D缩减混音信号可通过执行多声道解码操作和随后的3D渲染操作而被解码。另一方面,如果编码器3D缩减混音信号已经通过执行缩减混音操作和随后的3D渲染操作而生成,则编码器3D缩减混音信号可通过执行3D渲染操作和随后的多声道解码操作而被解码。
可从编码装置传送的比特流中提取指示经编码的3D缩减混音信号是通过在缩减混音操作前还是在缩减混音操作后执行3D渲染操作而获取的信息。
3D渲染单元430和450两者都可被设置在多声道解码器440的前面或后面。
图4是根据本发明的另一个实施例的编码装置的框图。参考图4,编码装置包括多声道编码器500、3D渲染单元510、缩减混音编码器520以及比特打包单元530。将省略与图1的实施例相同的编码过程的详细描述。
参考图4,多声道编码器500基于输入多声道信号生成缩减混音信号和空间信息。3D渲染单元510通过对缩减混音信号执行3D渲染操作来生成3D缩减混音信号。
可按用户选择或根据编码装置的能力、再现环境的特性或所要求的音质确定是否对缩减混音信号执行3D渲染操作。
缩减混音编码器520编码由多声道编码器500生成的缩减混音信号或由3D渲染单元510生成的3D缩减混音信号。
比特打包单元530基于空间信息以及或者经编码的缩减混音信号或者经编码的、编码器3D缩减混音信号生成比特流。由比特打包单元530生成的比特流可包括指示包括在比特流中的经编码的缩减混音信号是没有3D效果的非3D缩减混音信号还是具有3D效果的编码器3D缩减混音信号的缩减混音标识信息。更具体地,缩减混音标识信息可指示由比特打包单元530生成的比特流是否包括非3D缩减混音信号、编码器3D缩减混音信号或这两者。
图5是根据本发明的另一个实施例的解码装置的框图。参考图5,解码装置包括比特拆分单元540、缩减混音解码器550以及3D渲染单元560。将省略与图1的实施例相同的解码过程的详细描述。
参考图5,比特拆分单元540从输入比特流中提取经编码的缩减混音信号、空间信息和缩减混音标识信息。缩减混音标识信息指示经编码的缩减混音信号是不具有3D效果的经编码的非3D缩减混音信号还是具有3D效果的经编码的3D缩减混音信号。
如果输入比特流包括非3D缩减混音信号和3D缩减混音信号两者,则仅可按用户选择或根据解码装置的能力、再现环境的特性或所需的音质来从输入比特流中提取非3D缩减混音信号和3D缩减混音信号之一。
缩减混音解码器550对经编码的缩减混音信号进行解码。如果通过由缩减混音解码器550执行的解码获取的缩减混音信号是通过执行3D渲染操作获取的编码器3D缩减混音信号,则该缩减混音信号可被容易地再现。
另一方面,如果通过由缩减混音解码器550执行的解码获取的缩减混音信号是不具有3D效果的缩减混音信号,则3D渲染单元560可通过对由缩减混音解码器550执行解码所获取的缩减混音信号执行3D渲染操作来生成解码器3D缩减混音信号。
图6是根据本发明的另一个实施例的解码装置的框图。参考图6,解码装置包括比特拆分单元600、缩减混音解码器610、第一3D渲染单元620、第二3D渲染单元630以及滤波器信息存储单元640。将省略与图1的实施例相同的解码过程的详细描述。
比特拆分单元600从输入比特流中提取经编码的、编码器3D缩减混音信号和空间信息。缩减混音解码器610对经编码的、编码器3D缩减混音信号进行解码。
第一3D渲染单元620使用用于执行3D渲染操作的编码装置的滤波器的逆滤波器,从由缩减混音解码器610执行的解码获取的编码器3D缩减混音信号去除3D效果。第二渲染单元630利用存储在解码装置中的滤波器通过对由第一3D渲染单元620执行去除而获取的缩减混音信号执行3D渲染操作生成具有3D效果的组合3D缩减混音信号。
第二3D渲染单元630可利用其特性与用于执行3D渲染操作的编码单元的滤波器不同的滤波器执行3D渲染操作。例如,第二3D渲染单元630可利用其系数与编码装置所使用的HRTF的系数不同的HRTF执行3D渲染操作。
滤波器信息存储单元640存储关于用于执行3D渲染的滤波器的滤波器信息,例如,HRTF系数信息。第二3D渲染单元630可利用存储在滤波器信息存储单元640中的滤波器信息生成组合3D缩减混音。
滤波器信息存储单元640可存储分别对应于多个滤波器的多条滤波器信息。在这种情况下,可按用户选择或根据解码装置的能力或所要求的音质来选择多条滤波器信息之一。
来自不同种族的人可具有不同的耳结构。因此,针对不同个体优化的HRTF系数可彼此不同。图6中所示的解码装置可生成针对用户优化的3D缩减混音信号。此外,图6中所示的解码装置可不管由3D缩减混音信号供应商所提供的HRTF的类型是什么,而生成与用户所期望的HRTF滤波器相对应的具有3D效果的3D缩减混音信号。
图7是根据本发明的实施例的3D渲染装置的框图。参考图7,3D渲染装置包括第一和第二域转换单元700和720以及3D渲染单元710。为了在预定的域中执行3D渲染操作,可将第一和第二域转换单元700和720分别设置在3D渲染单元710的前面和后面。
参考图7,输入缩减混音信号可由第一域转换单元700转换成频域缩减混音信号。更具体地,第一域转换单元700可通过执行DFT或FFT将输入缩减混音信号转换成DFT域缩减混音信号或FFT域缩减混音信号。
3D渲染单元710通过将空间信息施加于由第一域转换单元700提供的频域缩减混音信号来生成多声道信号。之后,3D渲染单元710通过滤波多声道信号来生成3D缩减混音信号。
由3D渲染单元710生成的3D缩减混音信号由第二域转换单元720转换成时域3D缩减混音信号。更具体地,第二域转换单元720可对由3D渲染单元710生成的3D缩减混音信号执行IDFT或IFFT。
在频域3D缩减混音信号转换成时域3D缩减混音信号期间,可能发生混叠之类的数据丢失或数据失真。
为了生成频域中的多声道信号和3D缩减混音信号,可将每一个参数频带的空间信息映射到频域,并可将多个滤波器系数转换至频域。
3D渲染单元710可通过使第一域转换单元700提供的频域缩减混音信号、空间信息和滤波器系数相乘来生成3D缩减混音信号。
通过使全部在M点频域中表示的缩减混音信号、空间信息和多个滤波器系数相乘而获取的时域信号具有M个有效信号。为了在M点频域中表示缩减混音信号、空间信息和滤波器系数,可执行M点DFT或M点FFT。
有效信号是不一定具有0值的信号。例如,可通过经由采样从音频信号中获取x个信号来生成总共x个有效信号。在该x个有效信号中,y个有效信号被补零。然后,有效信号的数目减少至(x-y)。之后,具有a个有效信号的信号和具有b个有效信号的信号被卷积,从而获取总共(a+b-1)个有效信号。
M点频域中缩减混音信号、空间信息和滤波器系数的相乘可提供与在时域中卷积缩减混音信号、空间信息和滤波器系数相同的效果。具有(3*M-2)个有效信号的信号可通过将M点频域中的缩减混音信号、空间信息和滤波器系数转换至时域并卷积该转换的结果来生成。
因此,通过使频域中的缩减混音信号、空间信息和滤波器系数相乘并将相乘的结果转换至时域而获取的信号中的有效信号的数目可能与通过卷积时域中的缩减混音信号、空间信息和滤波器系数获取的信号中的有效信号的数目不同。结果,在频域中的3D缩减混音信号转换至时域信号期间可发生混叠。
为了防止混叠,时域中的缩减混音信号的有效信号的数目、映射到频域的空间信息的有效信号的数目、以及滤波器系数的数目的总和不能大于M。映射到频域的空间信息的有效信号的数目可根据频域的点的数目确定。换言之,如果对每一参数频带表示的空间信息被映射至N点频域,则空间信息的有效信号的数目可以是N。
参考图7,第一域转换单元700包括第一补零单元701和第一频域转换单元702。第三渲染单元710包括映射单元711、时域转换单元712、第二补零单元713、第二频域转换单元714、多声道信号生成单元715、第三补零单元716、第三频域转换单元717以及3D缩减混音信号生成单元718。
第一补零单元701对时域中的具有X个样本的缩减混音信号执行补零操作使得缩减混音信号的样本数目可从X增加至M。第一频域转换单元702将补零缩减混音信号转换成M点频域信号。经补零的缩减混音信号具有M个样本。在经补零的缩减混音信号的M个样本中,仅X个样本是有效信号。
映射单元711将每一个参数频带的空间信息映射至N点频域。时域转换单元712将通过映射单元711执行的映射而获取的空间信息转换至时域。通过时域转换单元712执行转换而获取的空间信息具有N个样本。
第二补零单元713对时域中的具有N个样本的空间信息执行补零操作,使得空间信息的样本数目可从N增加至M。第二频域转换单元714将经补零的空间信息转换成M点频域信号。经补零的空间信息具有N个样本。在经补零的空间信息的N个样本中,仅N个样本是有效的。
多声道信号生成单元715通过使第一频域转换单元712提供的缩减混音信号和第二频域转换单元714提供的空间信息相乘生成多声道信号。由多声道信号生成单元715生成的多声道信号具有M个有效信号。另一方面,通过在时域中卷积由第一频域转换单元712提供的缩减混音信号和由第二频域转换单元714提供的空间信息获取的多声道信号具有(X+N-1)个有效信号。
第三补零单元716可对时域中表示的Y滤波器系数执行补零操作,使得样本的数目可增加至M。第三频域转换单元717将补零滤波器系数转换成M点频域。经补零的滤波器系数具有M个样本。在M个样本中,仅Y个样本是有效信号。
3D缩减混音信号生成单元718通过将多声道信号生成单元715所生成的多声道信号与第三频域转换单元717提供的多个滤波器系数相乘来生成3D缩减混音信号。由3D缩减混音信号生成单元718生成的3D缩减混音信号具有M个有效信号。另一方面,通过在时域中卷积由多声道信号生成单元715所生成的多声道信号和由第三频域转换单元717所提供的滤波器系数来获取的3D缩减混音信号具有(X+N+Y-2)个有效信号。
通过将第一、第二和第三频域转换单元702所使用的M点频域设置成满足以下方程式:M≥(X+N+Y-2)来防止混叠是可能的。换言之,有可能通过使第一、第二和第三频域转换单元702、714和717能够执行满足以下方程式:M≥(X+N+Y-2)的M点DFT或M点FFT来防止混叠。
至频域的转换可利用除DFT滤波器组、FFT滤波器组和QMF组以外的滤波器组来执行。3D缩减混音信号的生成可利用HRTF滤波器来执行。
空间信息的有效信号的数目可利用除上述方法以外的方法来调节,或可利用上述方法中效率最高且需要计算量最少的一种方法来调节。
不仅在信号、系数或空间信息从频域转换至时域或反过来的期间,而且在信号、系数或空间信息从QMF域转换至混合域或反过来的期间,都可发生混叠。上述防止混叠的方法也可用于在信号、系数或空间信息从QMF域转换至混合域或反过来的期间防止混叠发生。
用于生成多声道信号或3D缩减混音信号的空间信息可改变。作为空间信息改变的结果,在输出信号中可发生作为噪声的信号不连续。
输出信号中的噪声可利用平滑法来减少,通过该平滑法可防止空间信息快速变化。
例如,当在第一帧和第二帧彼此相邻时施加于第一帧的第一空间信息与施加于第二帧的空间信息不同时,在第一帧和第二帧之间极可能发生不连续。
在这种情况下,可利用第一空间信息补偿第二空间信息或利用第二空间信息补偿第一空间信息,使得第一空间信息和第二空间信息之差可减小,从而由第一和第二帧之间的不连续导致的噪声可降低。更具体地,第一空间信息和第二空间信息中的至少一个可用第一空间信息和第二空间信息的平均值来代替,从而降低噪声。
噪声也很可能由于一对相邻参数频带之间的不连续而生成。例如,当在第一和第二参数频带彼此相邻时对应于第一参数频带的第三空间信息与对应于第二参数频带的第四空间信息不同时,不连续可能在第一和第二参数频带之间发生。
在这种情况下,可利用第四空间信息补偿第三空间信息或利用第三空间信息补偿第四空间信息,使得第三空间信息和第四空间信息之差可减小,并且由第一和第二参数频带之间的不连续导致的噪声可降低。更具体地,第三空间信息和第四空间信息中的至少一个可用第三空间信息和第四空间信息的平均值来代替,从而降低噪声。
由一对相邻帧之间或一对相邻参数频带之间的不连续导致的噪声可利用除上述方法以外的方法来降低。
更具体地,可将每个帧乘以诸如汉宁(Hanning)窗口之类的窗口,并可将“重叠和添加”方案施加于乘法的结果,使得帧之间的改变可减小。或者,施加有多条空间信息的输出信号可被平滑,使得可防止输出信号的多个帧之间的改变。
可利用例如ICC之类的空间信息将DFT域中的声道之间的解相关进行如下调节。
可通过使输入到一至二(OTT)或二至三(TTT)框的信号的系数乘以预定值来调节解相关的程度。预定值可由以下方程式来限定:(A+(1-A*A)^0.5*i),其中A指示施加于OTT或TTT框的预定频带的ICC值,而i指示虚部。虚部可以是正的或负的。
预定值可附有根据信号的特性的加权因子,信号的特性例如信号的能级、每一频率的信号的能量特性或施加ICC值A的框的类型。作为引入加权因子的结果,可进一步调节解相关的程度,并可应用帧间平滑或内插法。
如以上参考图7所描述的,可通过使用转换至频域的HRTF或报头相关脉冲响应(HRIR)在频域中生成3D缩减混音信号。
或者,3D缩减混音信号可通过在时域中卷积HRIR和缩减混音信号来生成。可将频域中生成的3D缩减混音信号留在频域中,而不进行逆域变换。
为了在时域中卷积HRIR和缩减混音信号,可使用有限脉冲响应(FIR)滤波器或无限脉冲响应(IIR)滤波器。
如上所述,根据本发明实施例的编码装置和解码装置可利用涉及使用频域中的HRTF或转换至频域的HRIR的第一方法、涉及在时域中卷积HRIR的第二方法或第一和第二方法的组合来生成3D缩减混音信号。
图8至11示出根据本发明的实施例的比特流。
参考图8,比特流包括:包含生成多声道信号所需信息的多声道解码信息字段、包含生成3D缩减混音信号所需信息的3D渲染信息字段、以及包含利用包含在多声道解码信息字段中的信息和包含在3D渲染信息字段中的信息所需的报头信息的报头字段。比特流可仅包括多声道解码信息字段、3D渲染信息字段和报头字段中的一个或两个。
参考图9,含有解码操作所必需的辅助信息的比特流可包括:包含整个经编码信号的报头信息的特定配置报头字段、以及包含关于多个帧的辅助信息的多个帧数据字段。更具体地,每一个帧数据字段可包括:包含相应帧的报头信息的帧报头字段、以及包含相应帧的空间信息的帧参数数据字段。或者,帧数据字段中的每一个仅可包括帧参数数据字段。
帧参数数据字段中的每一个可包括多个模块,每个模块包括标志和参数数据。模块是包括诸如空间信息之类的参数数据以及诸如缩减混音增益和平滑数据之类提高信号音质所必需的其他数据的数据集。
如果在没有任何附加标志的情况下接收关于由帧报头字段指定的信息的模块数据,如果由帧报头字段指定的信息被进一步分类,或者如果接收附加标志和数据连同未被帧报头指定的信息,则模块数据可不包括任何标志。
关于3D缩减混音信号的辅助信息,例如HRTF系数信息,可被包括在特定配置报头字段、帧报头字段和帧参数数据字段中的至少一个中。
参考图10,比特流可包括:包含生成多声道信号所必需的信息的多个多声道解码信息字段、以及包含生成3D缩减混音信号所必需的信息的多个3D渲染信息字段。
当接收比特流时,解码装置可使用多声道解码信息字段或3D渲染信息字段来执行解码操作并跳过任何未在解码操作中使用的多声道解码信息字段和3D渲染信息字段。在这种情况下,可根据要再现的信号的类型确定多声道解码信息字段和3D渲染信息字段中的哪些将被用于执行解码操作。
换言之,为了生成多声道信号,解码装置可跳过3D渲染信息字段,并读取包含在多声道解码信息字段中的信息。另一方面,为了生成3D缩减混音信号,解码装置可跳过多声道解码信息字段,并读取包含在3D渲染信息字段中的信息。
跳过比特流中的多个字段中的某些的方法如下。
首先,关于字段的比特大小的字段长度信息可被包括在比特流中。在这种情况下,可通过跳过对应于字段比特大小的比特数来跳过该字段。可将字段长度信息设置在字段的开头。
第二,可将同步字设置在字段的末端或开头。在这种情况下,可通过基于同步字的位置定位字段来跳过该字段。
第三,如果提前确定并固定了字段的长度,则可通过跳过对应于该字段的长度的数据量来跳过该字段。可将关于字段长度的固定字段长度信息包括在比特流中或存储在解码装置中。
第四,可利用上述字段跳过方法中的两种或更多种的组合来跳过多个字段之一。
诸如字段长度信息、同步字或固定字段长度信息之类的字段跳过信息是跳过字段所必需的信息,可将其包括在图9所示的特定配置报头字段、帧报头字段和帧参数数据字段之一中,或可将其包括在图9所示字段以外的字段中。
例如,为了生成多声道信号,解码装置可参照设置在每个3D渲染信息字段的开头的字段长度信息、同步字或固定字段长度信息跳过3D渲染信息字段,并读取包括在多声道解码信息字段中的信息。
另一方面,为了生成3D缩减混音信号,解码装置可参照设置在每个多声道解码信息字段的开头的字段长度信息、同步字或固定字段长度信息跳过多声道解码信息字段,并读取包括在3D渲染信息字段中的信息。
比特流可包括指示包括在该比特流中的数据是生成多声道信号所必需的还是生成3D缩减混音信号所必需的信息。
然而,即使比特流不包括诸如CLD之类的任何空间信息,而仅包括生成3D缩减混音信号所必需的数据(例如,HRTF滤波器系数),也可通过利用生成3D缩减混音信号所必需的数据进行解码来再现多声道信号,而不需要空间信息。
例如,从缩减混音信号获取作为关于两个声道的空间信息的立体声参数。然后,将立体声参数转换成关于待再现的多个声道的空间信息,并通过将由转换获取的空间信息施加于缩减混音信号来生成多声道信号。
另一方面,即使比特流仅包括生成多声道信号所必需的数据,也可再现缩减混音信号而不需要附加解码操作,或可通过利用附加HRTF滤波器对缩减混音信号执行3D处理来再现3D缩减混音信号。
如果比特流包括生成多声道信号所必需的数据和生成3D缩减混音信号所必需的数据两者,则可允许用户决定是再现多声道信号还是3D缩减混音信号。
将在下文中参考各自相应的句法详细描述跳过数据的方法。
句法1指示以帧为单位解码音频信号的方法。
[句法1]
在句法1中,Ottdata()和TttData()是表示从缩减混音信号恢复多声道信号所必需的参数(诸如包括CLD、ICC和CPC的空间信息)的模块,而SmgData()、TempShapeData()、ArbitraryDownmixData()和ResidualData()是表示通过校正编码操作期间可能发生的信号失真来改善音质所必需的信息的模块。
例如,如果诸如CLD、ICC或CPC之类的参数和包括在模块ArbitraryDownmixData()中的信息仅在解码操作期间使用,则设置在模块TttData()和ArbitraryDownmixData()之间的模块SmgData()和TempShapeData()是不必需的。因此,跳过模块SmgData()和TempShapeData()是有效率的。
在下文中将参考以下的句法2详细描述根据本发明的实施例的跳过模块的方法。
[句法2]
参考句法2,可将模块SkipData()设置在将被跳过的模块之前,且将被跳过的模块的比特大小在模块SkipData()中被指定为bsSkipBits。
换言之,假设模块SmgData()和TempShapeData()将被跳过,且组合的模块SmgData()和TempShapeData()的比特大小是150,则可通过将bsSkipBits设置为150来跳过模块SmgData()和TempShapeData()。
在下文中将参考句法3详细描述根据本发明的另一个实施例的跳过模块的方法。
[句法3]
参考图3,可通过使用bsSkipSyncflag和bsSkipSyncword跳过不必要的模块,bsSkipSyncflag是指示是否使用同步字的标志,bsSkipSyncword是可被设置在将被跳过的模块的末端的同步字。
更具体地,如果将标志bsSkipSyncflag设置成使得同步字可使用,则标志bsSkipSyncflag和同步字bsSkipSyncword之间的一个或多个模块——即模块SmgData()和TempShapeData()可被跳过。
参考图11,比特流可包括:包含再现多声道信号所必需的报头信息的多声道报头字段、包含再现3D缩减混音信号所必需的报头信息的3D渲染报头字段、以及包含再现多声道信号所必需数据的多个多声道解码信息字段。
为了再现多声道信号,解码装置可跳过3D渲染报头字段,并从多声道报头字段和多声道解码信息字段读取数据。
跳过3D渲染报头字段的方法与以上参考图10所述的字段跳过方法相同,因此,可跳过其详细描述。
为了再现3D缩减混音信号,解码装置可从多声道解码信息字段和3D渲染报头字段读取数据。例如,解码装置可利用包括在多声道解码信息字段中的缩减混音信号和包括在3D缩减混音信号中的HRTF系数信息来生成3D缩减混音信号。
图12是根据本发明的实施例的用于处理任意缩减混音信号的编码/解码装置的框图。参考图12,任意缩减混音信号是除了由包括在编码装置800中的多声道编码器801生成的缩减混音信号以外的缩减混音信号。将省略与图1的实施例相同的过程的详细描述。
参考图12,编码装置800包括多声道编码器801、空间信息合成单元802以及比较单元803。
多声道编码器801将输入多声道信号缩减混音成立体声或单声道缩减混音信号,并生成从缩减混音信号恢复多声道信号所必需的基本空间信息。
比较单元803将缩减混音信号与任意缩减混音信号进行比较,并基于比较的结果生成补偿信息。补偿信息是补偿任意缩减混音信号使得任意缩减混音信号可被转换成接近缩减混音信号所必需的。解码装置可利用补偿信息来补偿任意缩减混音信号,并利用经补偿的任意缩减混音信号恢复多声道信号。恢复的多声道信号比从由多声道编码器801生成的任意缩减混音信号恢复的多声道信号更类似于原始的输入多声道信号。
补偿信息可以是缩减混音信号和任意缩减混音信号之差。解码装置可通过将缩减混音信号和任意缩减混音信号之差与任意缩减混音信号相加来补偿任意声道缩减混音信号。
缩减混音信号和任意缩减混音信号之差可以是指示缩减混音信号和任意缩减混音信号的能级之差的缩减混音增益。
可针对每一频带、每一时间/时隙、和/或每一声道确定缩减混音增益。例如,一部分缩减混音增益可针对每一频带确定,而另一部分缩减混音增益可针对每一时隙确定。
缩减混音增益可针对每一参数频带或为任意缩减混音信号优化的每一频带来确定。参数频带是施加有参数类型的空间信息的频率间隔。
可将缩减混音信号和任意缩减混音信号的能级之差量化。量化缩减混音信号和任意缩减混音信号的能级之差的量化电平的分辨率可与量化缩减混音信号和任意缩减混音信号之间的CLD的量化电平的分辨率相同或不同。此外,缩减混音信号和任意缩减混音信号的能级之差的量化可涉及使用量化缩减混音信号和任意缩减混音信号之间的CLD的量化电平的全部或部分。
因为缩减混音信号和任意缩减混音信号的能级之差的分辨率一般低于缩减混音信号和任意缩减混音信号之间的CLD的分辨率,所以与量化缩减混音信号和任意缩减混音信号之间的CLD的量化电平的分辨率相比,量化缩减混音信号和任意缩减混音信号的能级之差的量化电平的分辨率可具有微小的值。
补偿任意缩减混音信号的补偿信息可以是包括残差信息的扩展信息,其指定不能利用任意缩减混音信号或缩减混音增益恢复的输入多声道信号的分量。解码装置可利用扩展信息来恢复不能利用任意缩减混音信号或缩减混音增益恢复的输入多声道信号的分量,从而恢复几乎不可与原始的输入多声道信号区分的信号。
生成扩展信息的方法如下。
多声道编码器801可生成与缩减混音信号所缺少的输入多声道信号的分量有关的信息作为第一扩展信息。解码装置可通过将第一扩展信息应用于利用缩减混音信号和基本的空间信息生成多声道信号来恢复几乎不可与原始的输入多声道信号区分的信号。
或者,多声道编码器801可利用缩减混音信号和基本空间信息来恢复多声道信号,并生成所恢复的多声道信号和原始输入的多声道信号之差作为第一扩展信息。
比较单元803可生成与任意缩减混音信号所缺少的缩减混音信号的分量——即不能利用缩减混音增益补偿的缩减混音信号的分量——有关的信息作为第二扩展信息。解码装置可利用任意缩减混音信号和第二扩展信息恢复几乎不能与缩减混音信号区分的信号。
除上述方法外,扩展信息还可利用各种残差译码方法来生成。
缩减混音增益和扩展信息两者都可被用作补偿信息。更具体地,可针对缩减混音信号的整个频带获取缩减混音增益和扩展信息两者,并可将它们一起用作补偿信息。或者,可将缩减混音增益用作针对缩减混音信号的一部分频带的补偿信息,并将扩展信息用作缩减混音信号的另一部分频带的补偿信息。例如,可将扩展信息用作缩减混音信号的低频带的补偿信息,并将缩减混音增益用作缩减混音信号的高频带的补偿信息。
还可将与除缩减混音信号的低频带以外的、诸如显著影响音质的峰值或凹口之类的部分缩减混音信号有关的扩展信息用作补偿信息。
空间信息合成单元802合成基本空间信息(例如,CLD、CPC、ICC和CTD)和补偿信息,从而生成空间信息。换言之,传送至解码装置的空间信息可包括基本空间信息、缩减混音增益及第一和第二扩展信息。
空间信息可连同任意缩减混音信号一起被包括在比特流中,且可将比特流传送至解码装置。
扩展信息和任意缩减混音信号可利用诸如AAC法、MP3法或BSAC法之类的音频编码方法来编码。扩展信息和任意缩减混音信号可利用相同的音频编码方法或不同的音频编码方法来编码。
如果扩展信息和任意缩减混音信号利用相同的音频编码方法编码,则解码装置可利用单一音频解码方法来解码扩展信息和任意缩减混音信号两者。在这种情况下,因为任意缩减混音信号总是能够被解码,所以扩展信息也总是能够被解码。然而,因为任意缩减混音信号一般被输入至解码装置作为脉冲编码调制(PCM)信号,用于编码任意缩减混音信号的音频编解码器的类型可能不能容易地识别,因此,用于编码扩展信息的音频编解码器的类型可能也不能容易地识别。
因此,与用于编码任意缩减混音信号和扩展信息的音频编解码器的类型有关的音频编解码器信息可被插入比特流中。
更具体地,可将音频编解码器信息插入比特流的特定配置报头字段。在这种情况下,解码装置可从比特流的特定配置报头字段提取音频编解码器信息,并使用所提取的音频编解码器信息解码任意缩减混音信号和扩展信息。
另一方面,如果任意缩减混音信号和扩展信息利用不同的编码方法来编码,则扩展信息可能不能够被解码。在这种情况下,因为不能识别扩展信息的末端,所以不能执行进一步的解码操作。
为了解决该问题,可将与分别用于编码任意缩减混音信号和扩展信息的音频编解码器的类型有关的音频编解码器信息插入比特流的特定配置报头字段。然后,解码装置可从比特流的特定配置报头字段读取音频编解码器信息,并使用读取信息来解码扩展信息。如果解码装置不包括任何可解码扩展信息的解码单元,则可能不能进一步进行扩展信息的解码,且可读取紧接扩展信息之后的信息。
与用于编码扩展信息的音频编解码器的类型有关的音频编解码器信息可由包括在比特流的特定配置报头字段中的句法元素表示。例如,音频编解码信息可由4比特句法元素bsResidualCodecType来表示,如以下的表1中指示的。
表1
扩展信息不仅可包括残差信息,还可包括声道扩充信息。声道扩充信息是将通过利用空间信息解码获取的多声道信号扩充成具有更多声道的多声道信号所必需的信息。例如,声道扩充信息可以是将5.1声道信号或7.1声道信号扩充成9.1声道信号所必需的信息。
可将扩展信息包括在比特流中,并可将比特流传送至解码装置。然后,解码装置可补偿缩减混音信号,或利用扩展信息扩充多声道信号。然而,解码装置可跳过扩展信息,而不是从比特流中提取扩展信息。例如,在利用包括在比特流中的3D缩减混音信号生成多声道信号或利用包括在比特流中的缩减混音信号生成3D缩减混音信号的情况下,解码装置可跳过扩展信息。
跳过包括在比特流中的扩展信息的方法可与以上参考图10所述的字段跳过方法之一相同。
例如,扩展信息可利用附连到包括扩展信息的比特流的开头且指示扩展信息的比特大小的比特大小信息、附连到包括扩展信息的字段的开头或末端的同步字、以及指示扩展信息的固定比特大小的固定比特性大小信息中的至少一个来跳过。可将比特大小信息、同步字和固定比特大小信息全部包括在比特流中。还可将固定比特大小信息存储在解码装置中。
参考图12,解码单元810包括缩减混音补偿单元811、3D渲染单元815以及多声道解码器816。
缩减混音补偿单元811利用包括在空间信息中的补偿信息——例如利用缩减混音增益或扩展信息来补偿任意缩减混音信号。
3D渲染单元815通过对经补偿的缩减混音信号执行3D渲染操作来生成解码器3D缩减混音信号。多声道解码器816利用经补偿的缩减混音信号和包括在空间信息中的基本空间信息来生成3D多声道信号。
缩减混音补偿单元811可按以下方式补偿任意缩减混音信号。
如果补偿信息是缩减混音增益,则缩减混音补偿单元811利用缩减混音增益补偿任意缩减混音信号的能级,使得任意缩减混音信号可被转换成类似于缩减混音信号的信号。
如果补偿信息是第二扩展信息,则缩减混音补偿单元811可利用第二扩展信息补偿任意缩减混音信息所缺少的分量。
多声道解码器816可通过将前置矩阵M1、混音矩阵M2和后置矩阵M3顺序地施加于缩减混音矩阵信号来生成多声道信号。在这种情况下,第二扩展信息可用于在将混音矩阵M2施加于缩减混音信号期间补偿缩减混音信号。换言之,第二扩展信息可用于补偿已经施加有前置矩阵M1的缩减混音信号。
如上所述,可通过将扩展信息应用于生成多声道信号来选择性地补偿多个声道中的每一个。例如,如果将扩展信息施加于混音矩阵M2的中心声道,则可由扩展信息补偿缩减混音信号的左声道和右声道分量。如果将扩展信息施加于混音矩阵M2的左声道,则可由扩展信息补偿缩减混音信号的左声道分量。
缩减混音增益和扩展信息两者都可用作补偿信息。例如,可利用扩展信息补偿任意缩减混音信号的低频带,且可利用缩减混音增益补偿任意缩减混音信号的高频带。此外,还可利用扩展信息补偿除任意缩减混音信号的低频带以外的、诸如可显著影响音质的峰值或凹口之类的部分任意缩减混音信号。与将由扩展信息补偿的部分有关的信息可被包括在比特流中。指示包括在比特流中的缩减混音信号是否是任意缩减混音信号的信息以及指示比特流是否包括补偿信息的信息可被包括在比特流中。
为了防止由编码单元800生成的缩减混音信号被削波,可将缩减混音信号除以预定增益。预定增益可具有静态值或动态值。
缩减混音补偿单元811可通过利用预定增益补偿为防止削波而削弱的缩减混音信号来恢复原始缩减混音信号。
可容易地再现由缩减混音补偿单元811补偿的任意缩减混音信号。或者,还待补偿的任意缩减混音信号可被输入至3D渲染单元815,并可由3D渲染单元815转换成解码器3D缩减混音信号。
参考图12,缩减混音补偿单元811包括第一域转换器812、补偿处理器813和第二域转换器814。
第一域转换器812将任意缩减混音信号的域转换成预定域。补偿处理器813利用补偿信息——例如,缩减混音增益或扩展信息——来补偿预定域中的任意缩减混音信号。
任意缩减混音信号的补偿可在QMF/混合域中进行。为此,第一域转换器812可对任意缩减混音信号执行QMF/混合分析。第一域转换器812可将任意缩减混音信号的域转换成除QMF/混合域以外的域,例如,诸如DFT或FFT域之类的频域。任意缩减混音信号的补偿也可在除QMF/混合域以外的域中进行,例如,频域或时域。
第二域转换器814将经补偿的任意缩减混音信号的域转换成与原始任意缩减混音信号相同的域。更具体地,第二域转换器814通过反向地执行由第一域转换器812所执行的域转换操作来将经补偿的任意缩减混音信号的域转换成与原始任意缩减混音信号相同的域。
例如,第二域转换器814可通过对经补偿的任意缩减混音信号执行QMF/混合合成将经补偿的任意缩减混音信号转换成时域信号。同样,第二域转换器814可对经补偿的任意缩减混音信号执行IDFT或IFFT。
类似于图7所示的3D渲染单元710,3D渲染单元815可对在频域、QMF/混合域或时域中的、经补偿的任意缩减混音信号执行3D渲染操作。为此,该3D渲染单元815可包括域转换器(未示出)。域转换器将经补偿的任意缩减混音信号的域转换成将要执行3D渲染操作的域,或转换通过3D渲染操作获取的信号的域。
其中补偿处理器813补偿任意缩减混音信号的域可与其中3D渲染单元815对经补偿的任意缩减混音信号执行3D渲染操作的域相同或不同。
图13是根据本发明的实施例的缩减混音补偿/3D渲染单元820的框图。参考图13,缩减混音补偿/3D渲染单元820包括第一域转换器821、第二域转换器822、补偿/3D渲染处理器823以及第三域转换器824。
缩减混音补偿/3D渲染单元820可在单个域中对任意缩减混音信号执行补偿操作和3D渲染操作,从而减少解码装置的计算量。
更具体地,第一域转换器821将任意缩减混音信号的域转换成其中将执行补偿操作和3D渲染操作的第一域。第二域转换器822转换空间信息,其包括生成多声道信号所必需的基本空间信息和补偿任意缩减混音信号所必需的补偿信息,使得空间信息变得可适用于第一域。补偿信息可包括缩减混音增益和扩展信息中的至少一个。
例如,第二域转换器822可将QMF/混合域中对应于参数频带的补偿信息映射到频带,使得补偿信息可变得容易地适用于频域。
第一域可以是诸如DFT或FFT之类的频域、QMF/混合域或时域。或者,第一域可以是除本文中陈述的域以外的域。
在补偿信息的转换期间,可发生时延。为了解决该问题,第二域转换器822可执行时延补偿操作,使得补偿信息的域和第一域之间的时延能够被补偿。
补偿/3D渲染处理器823利用经转换的空间信息对第一域中的任意缩减混音信号执行补偿操作,然后对通过补偿操作获取的信号执行3D渲染操作。补偿/3D渲染处理器823可按与本文陈述的不同的顺序执行补偿操作和3D渲染操作。
补偿/3D渲染处理器823可同时对任意缩减混音信号执行补偿操作和3D渲染操作。例如,补偿/3D渲染处理器823可通过使用新滤波器系数对第一域中的任意缩减混音信号执行3D渲染操作来生成经补偿的3D缩减混音信号,该新滤波器系数是补偿信息和通常在3D渲染操作中使用的现有滤波器系数的组合。
第三域转换器824将补偿/3D渲染处理器823所生成的3D缩减混音信号的域转换成频域。
图14是根据本发明的实施例用于处理兼容缩减混音信号的解码装置900的框图。参考图14,解码装置900包括第一多声道解码器910、缩减混音兼容性处理单元920、第二多声道解码器930和3D渲染单元940。将省略与图1的实施例相同的解码过程的详细描述。
兼容缩减混音信号是可由两个或更多多声道解码器解码的缩减混音信号。换言之,兼容缩减混音信号是最初针对预定多声道解码器优化、然后能够通过兼容性处理操作转换成针对除该预定多声道解码器以外的多声道解码器优化的信号的缩减混音信号。
参考图14,假设输入的兼容缩减混音信号针对第一多声道解码器910优化。为了使第二多声道解码器930解码输入的兼容缩减混音信号,缩减混音兼容性处理单元920可对输入的兼容缩减混音信号执行兼容性处理操作,使得输入的兼容缩减混音信号可被转换成针对第二多声道解码器930优化的信号。第一多声道解码器910通过解码输入的兼容缩减混音信号来生成第一多声道信号。第一多声道解码器910可通过仅仅使用输入的兼容缩减混音信号而不需要空间信息进行解码来生成多声道信号。
第二多声道解码器930利用由缩减混音兼容性处理单元920执行的兼容性处理操作获取的缩减混音信号生成第二多声道信号。3D渲染单元940可通过对由缩减混音兼容性处理单元920执行的兼容性处理操作获取的缩减混音信号执行3D渲染操作来生成解码器3D缩减混音信号。
可利用诸如逆矩阵之类的兼容性信息,将针对预定多声道解码器优化的兼容缩减混音信号转换成针对除预定多声道解码器以外的多声道解码器优化的缩减混音信号。例如当存在利用不同编码方法的第一和第二多声道编码器与利用不同编码/解码方法的第一和第二多声道解码器时,编码装置可将矩阵施加于第一多声道编码器生成的缩减混音信号,从而生成针对第二多声道解码器优化的兼容缩减混音信号。然后,解码装置可将逆矩阵施加于由编码装置所生成的兼容缩减混音信号,从而生成针对第一多声道解码器优化的兼容缩减混音信号。
参考图14,缩减混音兼容性处理单元920可利用逆矩阵对输入的兼容缩减混音信号执行兼容性处理操作,从而生成针对第二多声道解码器930优化的缩减混音信号。
与缩减混音兼容性处理单元920所使用的逆矩阵有关的信息可提前存储在解码装置900中,或可被包括在编码装置传送的比特流中。此外,指示包括在输入比特流中的缩减混音信号是任意缩减混音信号还是兼容缩减混音信号的信息可被包括在输入比特流中。
参考图14,缩减混音兼容性处理单元920包括第一域转换器921、兼容性处理器922和第二域转换器923。
第一域转换器921将输入的兼容缩减混音信号的域转换成预定域,且兼容性处理器922利用诸如逆矩阵之类的兼容性信息执行兼容性处理操作,使得在预定域中的输入兼容缩减混音信号可被转换成针对第二多声道解码器930优化的信号。
兼容性处理器922可在QMF/混合域中执行兼容性处理操作。为此,第一域转换器921可对输入的兼容缩减混音信号执行QMF/混合分析。同样,第一域转换器921可将输入的兼容缩减混音信号的域转换成除QMF/混合域以外的域,例如,诸如DFT或FFT域之类的频域,且兼容性处理器922可在除QMF/混合域以外的域——如频域或时域中执行兼容性处理操作。
第二域转换器923转换由兼容性处理操作获取的兼容缩减混音信号的域。更具体地,第二域转换器923可通过反向地执行由第一域转换器921所执行的域转换操作来将通过兼容性处理操作获取的兼容性缩减混音信号的域转换成与原始输入兼容缩减混音信号相同的域。
例如,第二域转换器923可通过对由兼容性处理操作获取的兼容缩减混音信号执行QMF/混合域合成来将由兼容性处理操作获取的兼容缩减混音信号转换成时域信号。或者,第二域转换器923可对由兼容处理操作获取的兼容缩减混音信号执行IDFT或IFFT。
3D渲染单元940可对在频域、QMF/混合域或时域中的、由兼容性处理操作获取的兼容缩减混音信号执行3D渲染操作。为此,该3D渲染单元940可包括域转换器(未示出)。域转换器将输入的兼容缩减混音信号的域转换成其中将执行3D渲染操作的域,或转换由3D渲染操作获取的信号的域。
其中兼容性处理器922执行兼容性处理操作的域可与其中3D渲染单元940执行3D渲染操作的域相同或不同。
图15是根据本发明的实施例的缩减混音兼容性处理/3D渲染单元950的框图。参考图15,缩减混音兼容性处理/3D渲染单元950包括第一域转换器951、第二域转换器952、兼容性/3D渲染处理器953以及第三域转换器954。
缩减混音兼容性处理/3D渲染单元950在单个域中执行兼容性处理操作和3D渲染操作,从而减少解码装置的计算量。
第一域转换器951将输入的兼容缩减混音信号转换至其中将执行兼容性处理操作和3D渲染操作的第一域。第二域转换器952转换空间信息和兼容性信息,例如逆矩阵,使得空间信息和兼容性信息能变得适用于第一域。
例如,第二域转换器952可将QMF/混合域中对应于参数频带的逆矩阵映射到频域,使得逆矩阵可容易地适用于频域。
第一域可以是诸如DFT或FFT域之类的频域、QMF/混合域或时域。或者,第一域可以是除本文中陈述的域以外的域。
在空间信息和兼容性信息的转换期间,可发生时间延迟。
为了解决该问题,第二域转换器952可执行时延补偿操作,使得空间信息和补偿信息的域与第一域之间的时延能够被补偿。
兼容性/3D渲染处理器953利用经转换的兼容性信息对第一域中的输入兼容缩减混音信号执行兼容性处理操作,然后对通过兼容性处理操作获取的兼容缩减混音信号执行3D渲染操作。兼容性/3D渲染处理器953可按与本文陈述的不同的顺序执行兼容性处理操作和3D渲染操作。
兼容性/3D渲染处理器953可同时对输入的兼容缩减混音信号执行兼容性处理操作和3D渲染操作。例如,兼容性/3D渲染处理器953可通过使用新滤波器系数对第一域中的输入兼容缩减混音信号执行3D渲染操作来生成3D缩减混音信号,该新滤波器系数是兼容性信息和通常在3D渲染操作中使用的现有滤波器系数的组合。
第三域转换器954将兼容性/3D渲染处理器953所生成的3D缩减混音信号的域转换成频域。
图16是根据本发明的实施例用于消除串扰的解码装置的框图。参考图16,解码装置包括比特拆分单元960、缩减混音解码器970、3D渲染单元980以及串扰消除单元990。将省略与图1的实施例相同的解码过程的详细描述。
由3D渲染单元980输出的3D缩减混音信号可由耳机再现。然而,当3D缩减混音信号由远离用户的扬声器再现时,声道间串扰很可能发生。
因此,解码装置可包括对3D缩减混音信号执行串扰消除操作的串扰消除单元990。
解码装置可执行声场处理操作。
声场处理操作中使用的声场信息,即,标识其中将再现3D缩减混音信号的空间的信息,可被包括在由编码装置传送的输入比特流中,或可由解码装置选择。
输入比特流可包括混响时间信息。可根据混响时间信息控制在声场处理操作中使用的滤波器。
对于早前部分和后面的混响部分可有差别地执行声场处理操作。例如,早前部分可利用FIR滤波器来处理,而后面的混响部分可利用IIR滤波器处理。
更具体地,可通过使用FIR滤波器在时域中执行卷积操作或通过在时域中执行乘法操作、并将乘法操作的结果转换至时域来对早前部分执行声场处理操作。声场处理操作可在时域中对后面的混响部分执行。
可将本发明实现为写在计算机可读记录介质上的计算机可读代码。计算机可读记录介质可以是其中数据以计算机可读方式存储的任何类型的记录设备。计算机可读记录介质的例子包括ROM、RAM、CD-ROM、磁带、软盘、光数据存储器、载波(例如,通过因特网的数据传输)。可将计算机可读记录介质分布在连接至网络的多个计算机系统上,使得计算机可读代码能以分散的方式向其写入或从其执行。实现本发明所需的功能程序、代码和代码段可由本领域的普通技术人员容易地解释。
如上所述,根据本发明,高效率地编码具有3D效果的多声道信号,并根据再现环境的特性以最优音质自适应地恢复和再现音频信号是可能的。
工业实用性
其他实现在以下权利要求的范围内。例如,根据本发明的编组、数据译码和熵译码可被应用于各种应用领域和各种产品。应用本发明的一个方面的存储数据的存储介质在本发明的范围内。

Claims (6)

1.一种解码音频信号的方法,所述方法包括:
由解码装置接收比特流,所述比特流包括缩减混音信号和将缩减混音信号扩展为多声道信号的空间信息,其中所述空间信息包括指示所述缩减混音信号是3D编码的缩减混音标识信息;
由所述解码装置基于所述缩减混音标识信息确定所述缩减混音信号是否是通过执行3D渲染操作所获得的信号;
如果所述缩减混音信号是通过执行3D渲染操作所获得的信号,由所述解码装置通过对所述3D缩减混音信号执行逆3D渲染操作从所述3D缩减混音信号去除3D效果,所述逆3D渲染操作是使用用于生成所述3D缩减混音信号的滤波器的逆滤波器执行的;以及
由所述解码装置利用通过所述去除获取的缩减混音信号和所述空间信息生成多声道信号,
其中,所述3D缩减混音信号是具有3D效果的立体声缩减混音信号,其被再现为想像的多声道信号,
其中,生成所述3D缩减混音信号是利用报头相关传递函数(HRTF)和所述空间信息执行的。
2.如权利要求1所述的方法,其特征在于,所述空间信息包括声道电平差(CLD)、声道预测系数(CPC)和声道间相关性(ICC)中的至少一个,所述声道电平差(CLD)指示两声道之间能级差、所述声道预测系数(CPC)为用于基于2声道信号生成3声道信号的预测系数,所述声道间相关性(ICC)指示两声道之间的相关性。
3.如权利要求1所述的方法,其特征在于进一步包括:如果所述缩减混音信号不是通过执行3D渲染操作所获得的信号,由所述解码装置通过对所述缩减混音信号执行3D渲染操作来生成3D缩减混音信号。
4.一种解码音频信号的装置,所述装置包括:
比特拆分单元,其接收比特流,所述比特流包括缩减混音信号和将缩减混音信号扩展为多声道信号的空间信息,其中所述空间信息包括指示所述缩减混音信号是3D编码的缩减混音标识信息;
3D渲染单元,其基于所述缩减混音标识信息确定所述缩减混音信号是否是通过执行3D渲染操作所获得的信号,以及如果所述缩减混音信号是通过执行3D渲染操作所获得的信号,通过对所述3D缩减混音信号执行逆3D渲染操作从所述3D缩减混音信号去除3D效果,所述逆3D渲染操作是使用用于生成所述3D缩减混音信号的滤波器的逆滤波器执行的;以及
多声道解码器,其利用通过所述去除获取的缩减混音信号和所述空间信息生成多声道信号,
其中,所述3D缩减混音信号是具有3D效果的立体声缩减混音信号,其被再现为想像的多声道信号,
其中,生成所述3D缩减混音信号是利用报头相关传递函数(HRTF)和所述空间信息执行的。
5.如权利要求4所述的装置,其特征在于,所述空间信息包括声道电平差(CLD)、声道预测系数(CPC)和声道间相关性(ICC)中的至少一个,所述声道电平差(CLD)指示两声道之间能级差、所述声道预测系数(CPC)为用于基于2声道信号生成3声道信号的预测系数,所述声道间相关性(ICC)指示两声道之间的相关性。
6.如权利要求4所述的装置,其特征在于,如果所述缩减混音信号不是通过执行3D渲染操作所获得的信号,所述3D渲染单元通过对所述缩减混音信号执行3D渲染操作生成3D缩减混音信号,
其中,所述3D渲染单元生成所述3D缩减混音信号是利用报头相关传递函数(HRTF)执行的。
CN201510128054.0A 2006-02-07 2007-02-07 用于编码/解码信号的装置和方法 Active CN104681030B (zh)

Applications Claiming Priority (17)

Application Number Priority Date Filing Date Title
US76574706P 2006-02-07 2006-02-07
US60/765,747 2006-02-07
US77147106P 2006-02-09 2006-02-09
US60/771,471 2006-02-09
US77333706P 2006-02-15 2006-02-15
US60/773,337 2006-02-15
US77577506P 2006-02-23 2006-02-23
US60/775,775 2006-02-23
US78175006P 2006-03-14 2006-03-14
US60/781,750 2006-03-14
US78251906P 2006-03-16 2006-03-16
US60/782,519 2006-03-16
US79232906P 2006-04-17 2006-04-17
US60/792,329 2006-04-17
US79365306P 2006-04-21 2006-04-21
US60/793,653 2006-04-21
CN200780004505.3A CN101385075B (zh) 2006-02-07 2007-02-07 用于编码/解码信号的装置和方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN200780004505.3A Division CN101385075B (zh) 2006-02-07 2007-02-07 用于编码/解码信号的装置和方法

Publications (2)

Publication Number Publication Date
CN104681030A CN104681030A (zh) 2015-06-03
CN104681030B true CN104681030B (zh) 2018-02-27

Family

ID=38345393

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510128054.0A Active CN104681030B (zh) 2006-02-07 2007-02-07 用于编码/解码信号的装置和方法

Country Status (11)

Country Link
US (8) US8160258B2 (zh)
EP (7) EP1984915B1 (zh)
JP (7) JP5054034B2 (zh)
KR (19) KR100863480B1 (zh)
CN (1) CN104681030B (zh)
AU (1) AU2007212845B2 (zh)
BR (1) BRPI0707498A2 (zh)
CA (1) CA2637722C (zh)
HK (1) HK1128810A1 (zh)
TW (4) TWI331322B (zh)
WO (7) WO2007091842A1 (zh)

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8917874B2 (en) 2005-05-26 2014-12-23 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
JP4814344B2 (ja) 2006-01-19 2011-11-16 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
WO2007091842A1 (en) 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
JP5023662B2 (ja) 2006-11-06 2012-09-12 ソニー株式会社 信号処理システム、信号送信装置、信号受信装置およびプログラム
ATE547786T1 (de) * 2007-03-30 2012-03-15 Panasonic Corp Codierungseinrichtung und codierungsverfahren
CN101414463B (zh) * 2007-10-19 2011-08-10 华为技术有限公司 一种混音编码方法、装置和系统
WO2009057329A1 (ja) * 2007-11-01 2009-05-07 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
JP2009206691A (ja) 2008-02-27 2009-09-10 Sony Corp 頭部伝達関数畳み込み方法および頭部伝達関数畳み込み装置
US8665914B2 (en) 2008-03-14 2014-03-04 Nec Corporation Signal analysis/control system and method, signal control apparatus and method, and program
KR101461685B1 (ko) 2008-03-31 2014-11-19 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
CN102007533B (zh) * 2008-04-16 2012-12-12 Lg电子株式会社 用于处理音频信号的方法和装置
EP2144231A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
WO2010013450A1 (ja) * 2008-07-29 2010-02-04 パナソニック株式会社 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム
EP4293665A3 (en) * 2008-10-29 2024-01-10 Dolby International AB Signal clipping protection using pre-existing audio gain metadata
KR101600352B1 (ko) * 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
KR101496760B1 (ko) 2008-12-29 2015-02-27 삼성전자주식회사 서라운드 사운드 가상화 방법 및 장치
EP2395504B1 (en) * 2009-02-13 2013-09-18 Huawei Technologies Co., Ltd. Stereo encoding method and apparatus
MX2011006248A (es) 2009-04-08 2011-07-20 Fraunhofer Ges Forschung Aparato, metodo y programa de computacion para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavizacion de valor de fase.
JP5540581B2 (ja) * 2009-06-23 2014-07-02 ソニー株式会社 音声信号処理装置および音声信号処理方法
TWI384459B (zh) * 2009-07-22 2013-02-01 Mstar Semiconductor Inc 音框檔頭之自動偵測方法
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
EP2489206A1 (fr) * 2009-10-12 2012-08-22 France Telecom Traitement de donnees sonores encodees dans un domaine de sous-bandes
CN102696070B (zh) 2010-01-06 2015-05-20 Lg电子株式会社 处理音频信号的设备及其方法
JP5533248B2 (ja) 2010-05-20 2014-06-25 ソニー株式会社 音声信号処理装置および音声信号処理方法
JP2012004668A (ja) 2010-06-14 2012-01-05 Sony Corp 頭部伝達関数生成装置、頭部伝達関数生成方法及び音声信号処理装置
JP5680391B2 (ja) * 2010-12-07 2015-03-04 日本放送協会 音響符号化装置及びプログラム
KR101227932B1 (ko) * 2011-01-14 2013-01-30 전자부품연구원 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
US9942593B2 (en) * 2011-02-10 2018-04-10 Intel Corporation Producing decoded audio at graphics engine of host processing platform
US9826238B2 (en) 2011-06-30 2017-11-21 Qualcomm Incorporated Signaling syntax elements for transform coefficients for sub-sets of a leaf-level coding unit
TW202339510A (zh) * 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
JP6007474B2 (ja) * 2011-10-07 2016-10-12 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラムおよび記録媒体
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
EP2702776B1 (en) 2012-02-17 2015-09-23 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
CN112185400A (zh) 2012-05-18 2021-01-05 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
WO2014034555A1 (ja) * 2012-08-29 2014-03-06 シャープ株式会社 音声信号再生装置、方法、プログラム、及び記録媒体
US9460729B2 (en) * 2012-09-21 2016-10-04 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
US9568985B2 (en) * 2012-11-23 2017-02-14 Mediatek Inc. Data processing apparatus with adaptive compression algorithm selection based on visibility of compression artifacts for data communication over camera interface and related data processing method
KR101802335B1 (ko) 2012-12-04 2017-11-28 삼성전자주식회사 오디오 제공 장치 및 오디오 제공 방법
CN104904239B (zh) 2013-01-15 2018-06-01 皇家飞利浦有限公司 双耳音频处理
MX346825B (es) 2013-01-17 2017-04-03 Koninklijke Philips Nv Procesamiento de audio biaural.
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
US9093064B2 (en) 2013-03-11 2015-07-28 The Nielsen Company (Us), Llc Down-mixing compensation for audio watermarking
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
CN104982042B (zh) 2013-04-19 2018-06-08 韩国电子通信研究院 多信道音频信号处理装置及方法
EP2830336A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Renderer controlled spatial upmix
US9319819B2 (en) 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
US20150127354A1 (en) * 2013-10-03 2015-05-07 Qualcomm Incorporated Near field compensation for decomposed representations of a sound field
WO2015152666A1 (ko) * 2014-04-02 2015-10-08 삼성전자 주식회사 Hoa 신호를 포함하는 오디오 신호를 디코딩하는 방법 및 장치
US9560464B2 (en) * 2014-11-25 2017-01-31 The Trustees Of Princeton University System and method for producing head-externalized 3D audio through headphones
CN111556426B (zh) 2015-02-06 2022-03-25 杜比实验室特许公司 用于自适应音频的混合型基于优先度的渲染系统和方法
WO2016167138A1 (ja) * 2015-04-13 2016-10-20 ソニー株式会社 信号処理装置および方法、並びにプログラム
WO2017035281A2 (en) * 2015-08-25 2017-03-02 Dolby International Ab Audio encoding and decoding using presentation transform parameters
ES2956344T3 (es) 2015-08-25 2023-12-19 Dolby Laboratories Licensing Corp Descodificador de audio y procedimiento de descodificación
ES2818562T3 (es) * 2015-08-25 2021-04-13 Dolby Laboratories Licensing Corp Descodificador de audio y procedimiento de descodificación
WO2017038543A1 (ja) 2015-09-03 2017-03-09 ソニー株式会社 音声処理装置および方法、並びにプログラム
EP3369257B1 (en) * 2015-10-27 2021-08-18 Ambidio, Inc. Apparatus and method for sound stage enhancement
US10524075B2 (en) 2015-12-10 2019-12-31 Sony Corporation Sound processing apparatus, method, and program
US10142755B2 (en) * 2016-02-18 2018-11-27 Google Llc Signal processing methods and systems for rendering audio on virtual loudspeaker arrays
CN108206984B (zh) * 2016-12-16 2019-12-17 南京青衿信息科技有限公司 利用多信道传输三维声信号的编解码器及其编解码方法
CN108206983B (zh) * 2016-12-16 2020-02-14 南京青衿信息科技有限公司 兼容现有音视频系统的三维声信号的编码器及其方法
GB2563635A (en) 2017-06-21 2018-12-26 Nokia Technologies Oy Recording and rendering audio signals
GB201808897D0 (en) * 2018-05-31 2018-07-18 Nokia Technologies Oy Spatial audio parameters
CN112309419B (zh) * 2020-10-30 2023-05-02 浙江蓝鸽科技有限公司 多路音频的降噪、输出方法及其系统
AT523644B1 (de) * 2020-12-01 2021-10-15 Atmoky Gmbh Verfahren für die Erzeugung eines Konvertierungsfilters für ein Konvertieren eines multidimensionalen Ausgangs-Audiosignal in ein zweidimensionales Hör-Audiosignal
CN113844974B (zh) * 2021-10-13 2023-04-14 广州广日电梯工业有限公司 电梯遥监的安装方法以及电梯遥监的安装装置
WO2024059505A1 (en) * 2022-09-12 2024-03-21 Dolby Laboratories Licensing Corporation Head-tracked split rendering and head-related transfer function personalization

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1253464A (zh) * 1998-10-15 2000-05-17 三星电子株式会社 针对多个收听者的三维声音再生设备及其方法
US6574339B1 (en) * 1998-10-20 2003-06-03 Samsung Electronics Co., Ltd. Three-dimensional sound reproducing apparatus for multiple listeners and method thereof
CN1589468A (zh) * 2001-11-17 2005-03-02 汤姆森许可贸易公司 确定数据帧是否包含已编码附加数据的方法和设备
CN1655651A (zh) * 2004-02-12 2005-08-17 艾格瑞系统有限公司 基于后期混响的听觉场景

Family Cites Families (201)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US563005A (en) * 1896-06-30 Fireplace-heater
US798796A (en) * 1905-04-24 1905-09-05 Bartholomew Jacob Buckle.
US5166685A (en) 1990-09-04 1992-11-24 Motorola, Inc. Automatic selection of external multiplexer channels by an A/D converter integrated circuit
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
DE4217276C1 (zh) 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5561736A (en) 1993-06-04 1996-10-01 International Business Machines Corporation Three dimensional speech synthesis
DE69428939T2 (de) 1993-06-22 2002-04-04 Thomson Brandt Gmbh Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix
EP0637191B1 (en) 1993-07-30 2003-10-22 Victor Company Of Japan, Ltd. Surround signal processing apparatus
TW263646B (en) 1993-08-26 1995-11-21 Nat Science Committee Synchronizing method for multimedia signal
ATE183049T1 (de) * 1994-02-25 1999-08-15 Henrik Moller Binaurale synthese, kopfbezogene ubertragungsfunktionen und ihre verwendungen
JPH07248255A (ja) 1994-03-09 1995-09-26 Sharp Corp 立体音像生成装置及び立体音像生成方法
JPH11503882A (ja) 1994-05-11 1999-03-30 オーリアル・セミコンダクター・インコーポレーテッド 複雑性を低減したイメージングフィルタを用いた3次元仮想オーディオ表現
JP3397001B2 (ja) 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
US5703584A (en) 1994-08-22 1997-12-30 Adaptec, Inc. Analog data acquisition system
GB9417185D0 (en) 1994-08-25 1994-10-12 Adaptive Audio Ltd Sounds recording and reproduction systems
JP3395807B2 (ja) 1994-09-07 2003-04-14 日本電信電話株式会社 ステレオ音響再生装置
US6072877A (en) * 1994-09-09 2000-06-06 Aureal Semiconductor, Inc. Three-dimensional virtual audio display employing reduced complexity imaging filters
JPH0884400A (ja) 1994-09-12 1996-03-26 Sanyo Electric Co Ltd 音像制御装置
JPH08123494A (ja) 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
US5668924A (en) * 1995-01-18 1997-09-16 Olympus Optical Co. Ltd. Digital sound recording and reproduction device using a coding technique to compress data for reduction of memory requirements
JPH08202397A (ja) 1995-01-30 1996-08-09 Olympus Optical Co Ltd 音声復号化装置
JPH0974446A (ja) 1995-03-01 1997-03-18 Nippon Telegr & Teleph Corp <Ntt> 音声通信制御装置
US5632205A (en) * 1995-06-07 1997-05-27 Acushnet Company Apparatus for the spatial orientation and manipulation of a game ball
IT1281001B1 (it) 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3088319B2 (ja) 1996-02-07 2000-09-18 松下電器産業株式会社 デコード装置およびデコード方法
JPH09224300A (ja) 1996-02-16 1997-08-26 Sanyo Electric Co Ltd 音像位置の補正方法及び装置
JP3483086B2 (ja) 1996-03-22 2004-01-06 日本電信電話株式会社 音声電話会議装置
US6252965B1 (en) 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
US5886988A (en) * 1996-10-23 1999-03-23 Arraycomm, Inc. Channel assignment and call admission control for spatial division multiple access communication systems
SG54383A1 (en) * 1996-10-31 1998-11-16 Sgs Thomson Microelectronics A Method and apparatus for decoding multi-channel audio data
US6711266B1 (en) * 1997-02-07 2004-03-23 Bose Corporation Surround sound channel encoding and decoding
US6721425B1 (en) * 1997-02-07 2004-04-13 Bose Corporation Sound signal mixing
TW429700B (en) 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
US6449368B1 (en) 1997-03-14 2002-09-10 Dolby Laboratories Licensing Corporation Multidirectional audio decoding
JP3594281B2 (ja) * 1997-04-30 2004-11-24 株式会社河合楽器製作所 ステレオ拡大装置及び音場拡大装置
JPH1132400A (ja) 1997-07-14 1999-02-02 Matsushita Electric Ind Co Ltd デジタル信号再生装置
US6307941B1 (en) * 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
DK1025743T3 (da) * 1997-09-16 2013-08-05 Dolby Lab Licensing Corp Anvendelse af filtereffekter i stereohovedtelefoner for at forbedre den rumlige opfattelse af en kilde rundt om en lytter
US6081783A (en) * 1997-11-14 2000-06-27 Cirrus Logic, Inc. Dual processor digital audio decoder with shared memory data transfer and task partitioning for decompressing compressed audio data, and systems and methods using the same
US7085393B1 (en) * 1998-11-13 2006-08-01 Agere Systems Inc. Method and apparatus for regularizing measured HRTF for smooth 3D digital audio
US6414290B1 (en) 1998-03-19 2002-07-02 Graphic Packaging Corporation Patterned microwave susceptor
DK1072089T3 (da) * 1998-03-25 2011-06-27 Dolby Lab Licensing Corp Fremgangsmåde og apparat til bearbejdning af audiosignaler
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
JP3781902B2 (ja) * 1998-07-01 2006-06-07 株式会社リコー 音像定位制御装置および音像定位制御方式
TW408304B (en) * 1998-10-08 2000-10-11 Samsung Electronics Co Ltd DVD audio disk, and DVD audio disk reproducing device and method for reproducing the same
DE19846576C2 (de) 1998-10-09 2001-03-08 Aeg Niederspannungstech Gmbh Plombierbare Verschließeinrichtung
JP3346556B2 (ja) 1998-11-16 2002-11-18 日本ビクター株式会社 音声符号化方法及び音声復号方法
ES2208297T3 (es) * 1999-04-07 2004-06-16 Dolby Laboratories Licensing Corporation Generacion de matrices para codificacion y descodificacion sin perdidas de señales de audio multicanal.
GB2351213B (en) 1999-05-29 2003-08-27 Central Research Lab Ltd A method of modifying one or more original head related transfer functions
KR100416757B1 (ko) 1999-06-10 2004-01-31 삼성전자주식회사 위치 조절이 가능한 가상 음상을 이용한 스피커 재생용 다채널오디오 재생 장치 및 방법
JP2000353968A (ja) 1999-06-11 2000-12-19 Matsushita Electric Ind Co Ltd オーディオ復号装置
US6442278B1 (en) * 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
KR20010009258A (ko) * 1999-07-08 2001-02-05 허진호 가상 멀티 채널 레코딩 시스템
US6175631B1 (en) * 1999-07-09 2001-01-16 Stephen A. Davis Method and apparatus for decorrelating audio signals
US7031474B1 (en) * 1999-10-04 2006-04-18 Srs Labs, Inc. Acoustic correction apparatus
US6931370B1 (en) 1999-11-02 2005-08-16 Digital Theater Systems, Inc. System and method for providing interactive audio in a multi-channel audio environment
US6633648B1 (en) * 1999-11-12 2003-10-14 Jerald L. Bauck Loudspeaker array for enlarged sweet spot
US6829012B2 (en) 1999-12-23 2004-12-07 Dfr2000, Inc. Method and apparatus for a digital parallel processor for film conversion
AUPQ514000A0 (en) * 2000-01-17 2000-02-10 University Of Sydney, The The generation of customised three dimensional sound effects for individuals
JP4281937B2 (ja) 2000-02-02 2009-06-17 パナソニック株式会社 ヘッドホンシステム
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US6973130B1 (en) * 2000-04-25 2005-12-06 Wee Susie J Compressed video signal including information for independently coded regions
TW468182B (en) 2000-05-03 2001-12-11 Ind Tech Res Inst Method and device for adjusting, recording and playing multimedia signals
JP2001359197A (ja) 2000-06-13 2001-12-26 Victor Co Of Japan Ltd 音像定位信号の生成方法、及び音像定位信号生成装置
JP3576936B2 (ja) 2000-07-21 2004-10-13 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
JP4645869B2 (ja) 2000-08-02 2011-03-09 ソニー株式会社 ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
EP1211857A1 (fr) 2000-12-04 2002-06-05 STMicroelectronics N.V. Procédé et dispositif d'estimation des valeurs successives de symboles numériques, en particulier pour l'égalisation d'un canal de transmission d'informations en téléphonie mobile
US7085939B2 (en) * 2000-12-14 2006-08-01 International Business Machines Corporation Method and apparatus for supplying power to a bus-controlled component of a computer
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
JP3566220B2 (ja) 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US6504496B1 (en) * 2001-04-10 2003-01-07 Cirrus Logic, Inc. Systems and methods for decoding compressed data
US20030007648A1 (en) 2001-04-27 2003-01-09 Christopher Currell Virtual audio system and techniques
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US6807528B1 (en) * 2001-05-08 2004-10-19 Dolby Laboratories Licensing Corporation Adding data to a compressed data frame
KR20040014569A (ko) 2001-06-21 2004-02-14 1...리미티드 라우드 스피커
JP2003009296A (ja) 2001-06-22 2003-01-10 Matsushita Electric Ind Co Ltd 音響処理装置および音響処理方法
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP2003111198A (ja) 2001-10-01 2003-04-11 Sony Corp 音声信号処理方法および音声再生システム
BR0206395A (pt) * 2001-11-14 2004-02-10 Matsushita Electric Ind Co Ltd Dispositivo de codificação, dispositivo de decodificação e sistema dos mesmos
TWI230024B (en) 2001-12-18 2005-03-21 Dolby Lab Licensing Corp Method and audio apparatus for improving spatial perception of multiple sound channels when reproduced by two loudspeakers
KR100949232B1 (ko) 2002-01-30 2010-03-24 파나소닉 주식회사 인코딩 장치, 디코딩 장치 및 그 방법
EP1341160A1 (en) 2002-03-01 2003-09-03 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding and for decoding a digital information signal
US7707287B2 (en) * 2002-03-22 2010-04-27 F5 Networks, Inc. Virtual host acceleration system
AU2003209585A1 (en) 2002-04-05 2003-10-20 Koninklijke Philips Electronics N.V. Signal processing
CN100508026C (zh) 2002-04-10 2009-07-01 皇家飞利浦电子股份有限公司 立体声信号编码
DE60311794T2 (de) 2002-04-22 2007-10-31 Koninklijke Philips Electronics N.V. Signalsynthese
CN1307612C (zh) 2002-04-22 2007-03-28 皇家飞利浦电子股份有限公司 声频信号的编码解码方法、编码器、解码器及相关设备
WO2003094369A2 (en) * 2002-05-03 2003-11-13 Harman International Industries, Incorporated Multi-channel downmixing device
JP4296752B2 (ja) 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
DE10228999B4 (de) * 2002-06-28 2006-12-14 Advanced Micro Devices, Inc., Sunnyvale Konstellationsmanipulation zur Frequenz/Phasenfehlerkorrektur
CN100539742C (zh) 2002-07-12 2009-09-09 皇家飞利浦电子股份有限公司 多声道音频信号编解码方法和装置
BR0305555A (pt) 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado
EP2019391B1 (en) * 2002-07-19 2013-01-16 NEC Corporation Audio decoding apparatus and decoding method and program
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
KR101016975B1 (ko) 2002-09-23 2011-02-28 코닌클리케 필립스 일렉트로닉스 엔.브이. 미디어 시스템, 이 미디어 시스템에서 적어도 하나의 출력 신호를 생성하는 방법, 및 컴퓨터 판독 가능한 매체
ATE357043T1 (de) 2002-10-14 2007-04-15 Thomson Licensing Verfahren zum kodieren und dekodieren von der breite einer schallquelle in einer audioszene
JP2006503319A (ja) 2002-10-14 2006-01-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号フィルタリング
JP4578243B2 (ja) 2002-10-15 2010-11-10 韓國電子通信研究院 空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法
AU2003269550A1 (en) 2002-10-15 2004-05-04 Electronics And Telecommunications Research Institute Apparatus and method for adapting audio signal according to user's preference
KR100542129B1 (ko) * 2002-10-28 2006-01-11 한국전자통신연구원 객체기반 3차원 오디오 시스템 및 그 제어 방법
DE60336499D1 (de) * 2002-11-20 2011-05-05 Koninkl Philips Electronics Nv Audio-gestüzte datenrepräsentationsvorrichtung und verfahren
US8139797B2 (en) * 2002-12-03 2012-03-20 Bose Corporation Directional electroacoustical transducing
US6829925B2 (en) 2002-12-20 2004-12-14 The Goodyear Tire & Rubber Company Apparatus and method for monitoring a condition of a tire
US7519530B2 (en) * 2003-01-09 2009-04-14 Nokia Corporation Audio signal processing
KR100917464B1 (ko) 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US7391877B1 (en) * 2003-03-31 2008-06-24 United States Of America As Represented By The Secretary Of The Air Force Spatial processor for enhanced performance in multi-talker speech displays
JP4196274B2 (ja) 2003-08-11 2008-12-17 ソニー株式会社 画像信号処理装置および方法、プログラム、並びに記録媒体
CN1253464C (zh) 2003-08-13 2006-04-26 中国科学院昆明植物研究所 安丝菌素苷类化合物及其药物组合物,其制备方法及其应用
US20050063613A1 (en) 2003-09-24 2005-03-24 Kevin Casey Network based system and method to process images
KR100590340B1 (ko) * 2003-09-29 2006-06-15 엘지전자 주식회사 디지털 오디오 부호화 방법 및 장치
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US6937737B2 (en) * 2003-10-27 2005-08-30 Britannia Investment Corporation Multi-channel audio surround sound from front located loudspeakers
US7519538B2 (en) 2003-10-30 2009-04-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
US7680289B2 (en) * 2003-11-04 2010-03-16 Texas Instruments Incorporated Binaural sound localization using a formant-type cascade of resonators and anti-resonators
US7949141B2 (en) 2003-11-12 2011-05-24 Dolby Laboratories Licensing Corporation Processing audio signals with head related transfer function filters and a reverberator
US20070165886A1 (en) * 2003-11-17 2007-07-19 Richard Topliss Louderspeaker
KR20050060789A (ko) 2003-12-17 2005-06-22 삼성전자주식회사 가상 음향 재생 방법 및 그 장치
KR100598602B1 (ko) * 2003-12-18 2006-07-07 한국전자통신연구원 가상 입체 음향 생성 장치 및 그 방법
KR100532605B1 (ko) * 2003-12-22 2005-12-01 한국전자통신연구원 이동통신 단말기의 가상 입체 음향 제공 장치 및 그 방법
KR101117591B1 (ko) 2004-01-05 2012-02-24 코닌클리케 필립스 일렉트로닉스 엔.브이. 렌더링되지 않은 컬러 공간을 통해 맵핑된 비디오 컨텐츠로부터 유도된 환경광을 위한 플리커가 없는 적응성 임계
JP2007519995A (ja) 2004-01-05 2007-07-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ内容から未レンダリング色空間を経由したマッピング変換によって導出される環境光
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7492915B2 (en) * 2004-02-13 2009-02-17 Texas Instruments Incorporated Dynamic sound source and listener position based audio rendering
CN1906664A (zh) 2004-02-25 2007-01-31 松下电器产业株式会社 音频编码器和音频解码器
JP4867914B2 (ja) 2004-03-01 2012-02-01 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチチャンネルオーディオコーディング
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
KR101183862B1 (ko) 2004-04-05 2012-09-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호를 처리하기 위한 방법 및 디바이스, 인코더 장치, 디코더 장치 및 오디오 시스템
TWI253625B (en) 2004-04-06 2006-04-21 I-Shun Huang Signal-processing system and method thereof
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US20050276430A1 (en) 2004-05-28 2005-12-15 Microsoft Corporation Fast headphone virtualization
KR100636144B1 (ko) * 2004-06-04 2006-10-18 삼성전자주식회사 오디오 신호 부호화/복호화 장치 및 방법
KR100636145B1 (ko) * 2004-06-04 2006-10-18 삼성전자주식회사 확장된 고해상도 오디오 신호 부호화 및 복호화 장치
US20050273324A1 (en) * 2004-06-08 2005-12-08 Expamedia, Inc. System for providing audio data and providing method thereof
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
KR100644617B1 (ko) * 2004-06-16 2006-11-10 삼성전자주식회사 7.1 채널 오디오 재생 방법 및 장치
JP4594662B2 (ja) 2004-06-29 2010-12-08 ソニー株式会社 音像定位装置
US8843378B2 (en) 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7617109B2 (en) 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
WO2006003813A1 (ja) 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ符号化及び復号化装置
KR20060003444A (ko) * 2004-07-06 2006-01-11 삼성전자주식회사 모바일 기기에서 크로스토크 제거 장치 및 방법
TW200603652A (en) 2004-07-06 2006-01-16 Syncomm Technology Corp Wireless multi-channel sound re-producing system
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
KR100773539B1 (ko) 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
EP1769655B1 (en) * 2004-07-14 2011-09-28 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system
TWI498882B (zh) 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
DE102004042819A1 (de) * 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
KR20060022968A (ko) 2004-09-08 2006-03-13 삼성전자주식회사 음향재생장치 및 음향재생방법
US7634092B2 (en) 2004-10-14 2009-12-15 Dolby Laboratories Licensing Corporation Head related transfer functions for panned stereo audio content
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
JP4497161B2 (ja) 2004-11-22 2010-07-07 三菱電機株式会社 音像生成装置及び音像生成プログラム
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
EP1817766B1 (en) 2004-11-30 2009-10-21 Agere Systems Inc. Synchronizing parametric coding of spatial audio with externally provided downmix
EP1817767B1 (en) * 2004-11-30 2015-11-11 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US20060198528A1 (en) 2005-03-03 2006-09-07 Thx, Ltd. Interactive content sound system
KR100608025B1 (ko) * 2005-03-03 2006-08-02 삼성전자주식회사 2채널 헤드폰용 입체 음향 생성 방법 및 장치
ATE470930T1 (de) * 2005-03-30 2010-06-15 Koninkl Philips Electronics Nv Skalierbare mehrkanal-audiokodierung
KR20060109298A (ko) * 2005-04-14 2006-10-19 엘지전자 주식회사 멀티채널 오디오 신호에 대한 서브밴드별 공간 정보의적응적 양자화
US7961890B2 (en) 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
EP1829424B1 (en) * 2005-04-15 2009-01-21 Dolby Sweden AB Temporal envelope shaping of decorrelated signals
KR20060122693A (ko) * 2005-05-26 2006-11-30 엘지전자 주식회사 다운믹스된 오디오 신호에 공간 정보 비트스트림을삽입하는 프레임 크기 조절방법
WO2006132857A2 (en) * 2005-06-03 2006-12-14 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
EP1908057B1 (en) * 2005-06-30 2012-06-20 LG Electronics Inc. Method and apparatus for decoding an audio signal
DE602006010712D1 (de) 2005-07-15 2010-01-07 Panasonic Corp Audiodekoder
US7880748B1 (en) * 2005-08-17 2011-02-01 Apple Inc. Audio view using 3-dimensional plot
CA2620627C (en) * 2005-08-30 2011-03-15 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
KR101370365B1 (ko) * 2005-09-13 2014-03-05 코닌클리케 필립스 엔.브이. 3d 사운드를 발생시키기 위한 방법 및 디바이스
KR100739776B1 (ko) * 2005-09-22 2007-07-13 삼성전자주식회사 입체 음향 생성 방법 및 장치
ES2587999T3 (es) * 2005-10-20 2016-10-28 Lg Electronics Inc. Procedimiento, aparato y soporte de registro legible por ordenador para decodificar una señal de audio multicanal
CN101310563A (zh) 2005-12-16 2008-11-19 唯听助听器公司 用于监视助听器装配系统中的无线连接的方法和系统
EP1971978B1 (en) * 2006-01-09 2010-08-04 Nokia Corporation Controlling the decoding of binaural audio signals
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
WO2007091842A1 (en) 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
KR100773562B1 (ko) 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
ATE532350T1 (de) 2006-03-24 2011-11-15 Dolby Sweden Ab Erzeugung räumlicher heruntermischungen aus parametrischen darstellungen mehrkanaliger signale
WO2007110101A1 (en) * 2006-03-28 2007-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Enhanced method for signal shaping in multi-channel audio reconstruction
EP2000001B1 (en) * 2006-03-28 2011-12-21 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for a decoder for multi-channel surround sound
JP4778828B2 (ja) 2006-04-14 2011-09-21 矢崎総業株式会社 電気接続箱
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US7876904B2 (en) * 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
US20080235006A1 (en) 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR100987457B1 (ko) 2006-09-29 2010-10-13 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
KR101128815B1 (ko) * 2006-12-07 2012-03-27 엘지전자 주식회사 오디오 처리 방법 및 장치
JP2009044268A (ja) * 2007-08-06 2009-02-26 Sharp Corp 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、及び、記録媒体
EP2076900A1 (en) * 2007-10-17 2009-07-08 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Audio coding using upmix
US8077772B2 (en) * 2007-11-09 2011-12-13 Cisco Technology, Inc. Coding background blocks in video coding that includes coding as skipped
JP5056530B2 (ja) * 2008-03-27 2012-10-24 沖電気工業株式会社 復号システム、方法及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1253464A (zh) * 1998-10-15 2000-05-17 三星电子株式会社 针对多个收听者的三维声音再生设备及其方法
US6574339B1 (en) * 1998-10-20 2003-06-03 Samsung Electronics Co., Ltd. Three-dimensional sound reproducing apparatus for multiple listeners and method thereof
CN1589468A (zh) * 2001-11-17 2005-03-02 汤姆森许可贸易公司 确定数据帧是否包含已编码附加数据的方法和设备
CN1655651A (zh) * 2004-02-12 2005-08-17 艾格瑞系统有限公司 基于后期混响的听觉场景

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"MPEG spatial audio coding/MPEG surround: Overview and current status";BREEBAART J ET AL;《AUDIO ENGINEERING SOCIETY CONVENTION PAPER》;20051007;全文 *
"the reference model architecture for MPEG spatial audio coding";HERRE J ET AL;《AUDIO ENGINEERING SOCIETY CONVENTION PAPER》;20050528;全文 *

Also Published As

Publication number Publication date
US20090012796A1 (en) 2009-01-08
JP5173840B2 (ja) 2013-04-03
KR100908055B1 (ko) 2009-07-15
KR20070080593A (ko) 2007-08-10
TW200802307A (en) 2008-01-01
KR101203839B1 (ko) 2012-11-21
KR20080093415A (ko) 2008-10-21
KR20080094775A (ko) 2008-10-24
KR100878814B1 (ko) 2009-01-14
US8625810B2 (en) 2014-01-07
KR20080110920A (ko) 2008-12-19
EP1984914A1 (en) 2008-10-29
KR20080093417A (ko) 2008-10-21
EP1982326A4 (en) 2010-05-19
TWI329464B (en) 2010-08-21
EP1984912A4 (en) 2010-06-09
TWI483244B (zh) 2015-05-01
JP5199129B2 (ja) 2013-05-15
KR20070080602A (ko) 2007-08-10
US8296156B2 (en) 2012-10-23
JP5054035B2 (ja) 2012-10-24
EP1982326A1 (en) 2008-10-22
KR20070080601A (ko) 2007-08-10
KR20070080592A (ko) 2007-08-10
US8612238B2 (en) 2013-12-17
WO2007091842A1 (en) 2007-08-16
TW200740267A (en) 2007-10-16
KR100902899B1 (ko) 2009-06-15
EP1984912A1 (en) 2008-10-29
TWI329465B (en) 2010-08-21
KR100983286B1 (ko) 2010-09-24
CA2637722A1 (en) 2007-08-16
WO2007091845A1 (en) 2007-08-16
KR20080093419A (ko) 2008-10-21
US20090037189A1 (en) 2009-02-05
KR20080093416A (ko) 2008-10-21
US20090245524A1 (en) 2009-10-01
WO2007091847A1 (en) 2007-08-16
US20090248423A1 (en) 2009-10-01
JP2009526259A (ja) 2009-07-16
US8160258B2 (en) 2012-04-17
KR20070080595A (ko) 2007-08-10
EP1984913A4 (en) 2011-01-12
EP1984913A1 (en) 2008-10-29
CN104681030A (zh) 2015-06-03
EP1984915A1 (en) 2008-10-29
KR100902898B1 (ko) 2009-06-16
TW200921644A (en) 2009-05-16
BRPI0707498A2 (pt) 2011-05-10
AU2007212845A1 (en) 2007-08-16
US20090060205A1 (en) 2009-03-05
HK1128810A1 (en) 2009-11-06
US8712058B2 (en) 2014-04-29
JP2009526260A (ja) 2009-07-16
US20090010440A1 (en) 2009-01-08
JP2009526264A (ja) 2009-07-16
EP1987512A4 (en) 2010-05-19
KR100878816B1 (ko) 2009-01-14
US20140222439A1 (en) 2014-08-07
KR20070080598A (ko) 2007-08-10
US8285556B2 (en) 2012-10-09
JP2009526263A (ja) 2009-07-16
EP1982327A1 (en) 2008-10-22
US20090028345A1 (en) 2009-01-29
JP5054034B2 (ja) 2012-10-24
AU2007212845B2 (en) 2010-01-28
WO2007091843A1 (en) 2007-08-16
KR20070080594A (ko) 2007-08-10
US8638945B2 (en) 2014-01-28
KR20070080597A (ko) 2007-08-10
TWI331322B (en) 2010-10-01
KR100991795B1 (ko) 2010-11-04
JP2009526262A (ja) 2009-07-16
KR101014729B1 (ko) 2011-02-16
KR20080093418A (ko) 2008-10-21
EP1982327A4 (en) 2010-05-05
WO2007091849A1 (en) 2007-08-16
EP1984914A4 (en) 2010-06-23
EP1987512A1 (en) 2008-11-05
CA2637722C (en) 2012-06-05
EP1984915B1 (en) 2016-09-07
KR100863479B1 (ko) 2008-10-16
JP5173839B2 (ja) 2013-04-03
WO2007091850A1 (en) 2007-08-16
KR100878815B1 (ko) 2009-01-14
JP2009526258A (ja) 2009-07-16
KR100897809B1 (ko) 2009-05-15
KR20070080596A (ko) 2007-08-10
KR100921453B1 (ko) 2009-10-13
JP2009526261A (ja) 2009-07-16
KR20080093024A (ko) 2008-10-17
TW200740266A (en) 2007-10-16
EP1984915A4 (en) 2010-06-09
KR100863480B1 (ko) 2008-10-16
KR20070080599A (ko) 2007-08-10
KR100913091B1 (ko) 2009-08-19
US9626976B2 (en) 2017-04-18
WO2007091848A1 (en) 2007-08-16
KR20070080600A (ko) 2007-08-10

Similar Documents

Publication Publication Date Title
CN104681030B (zh) 用于编码/解码信号的装置和方法
CN101385075B (zh) 用于编码/解码信号的装置和方法
RU2406164C2 (ru) Устройство и способ для кодирования/декодирования сигнала
MX2008009565A (en) Apparatus and method for encoding/decoding signal

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant