CN1756086B - 多通道音频数据编码/解码方法和设备 - Google Patents

多通道音频数据编码/解码方法和设备 Download PDF

Info

Publication number
CN1756086B
CN1756086B CN2005100841436A CN200510084143A CN1756086B CN 1756086 B CN1756086 B CN 1756086B CN 2005100841436 A CN2005100841436 A CN 2005100841436A CN 200510084143 A CN200510084143 A CN 200510084143A CN 1756086 B CN1756086 B CN 1756086B
Authority
CN
China
Prior art keywords
data
decoding
expansion
coding
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2005100841436A
Other languages
English (en)
Other versions
CN1756086A (zh
Inventor
吴殷美
金美英
金尚煜
金度亨
金重会
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN1756086A publication Critical patent/CN1756086A/zh
Application granted granted Critical
Publication of CN1756086B publication Critical patent/CN1756086B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/50Constructional details
    • H04N23/55Optical parts specially adapted for electronic image sensors; Mounting thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B17/00Details of cameras or camera bodies; Accessories therefor
    • G03B17/02Bodies
    • G03B17/08Waterproof bodies or housings
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B17/00Details of cameras or camera bodies; Accessories therefor
    • G03B17/02Bodies
    • G03B17/12Bodies with means for supporting objectives, supplementary lenses, filters, masks, or turrets
    • G03B17/14Bodies with means for supporting objectives, supplementary lenses, filters, masks, or turrets interchangeably
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/70SSIS architectures; Circuits associated therewith
    • H04N25/71Charge-coupled device [CCD] sensors; Charge-transfer registers specially adapted for CCD sensors

Abstract

提供一种多通道音频数据编码和/或解码方法以及设备。该编码方法包括:编码单声道和/或立体声音频数据;以及编码除了单声道和/或立体声音频数据之外的扩展的多通道音频数据。解码方法包括:解码单声道和/或立体声音频数据;检验除了单声道和/或立体声音频数据之外是否存在将被解码的扩展的多通道音频数据;如果存在,则解码该数据。根据该方法和设备,仅通过一个比特流,可根据用户环境来提供单声道、立体声和多通道。另外在多通道音频中,根据用户终端和网络的状态提供精细可分级(FGS)功能。此外,可实现BSAC的性能的增强。可满足对MPEG标准化的各种需求。可用于更逼真的数字多媒体广播和基于移动以及基于家庭影院的服务。

Description

多通道音频数据编码/解码方法和设备
技术领域
本发明涉及音频编码和解码,更具体地讲,涉及多通道音频数据编码和解码方法以及设备。
背景技术
从2003年起,地面数字多媒体广播(DMB)已经使用音频编解码器MPEG-4比特分片算术编码(BSAC)。尽管目前只能提供立体声服务,但是可以预期在将来将包括多通道服务。MPEG-4BASC应该能够增加压缩效率和改善技术的功能,例如带宽扩展的和空间音频。
在传统BSAC多通道中,在一个层中交替地编码中央、前左、前右、后左和后右通道。图1示出传统BASC多通道的结构。BSAC结构提供精细可分级(FGS)功能。即,所有五个通道在一个层中并且可从最后层中剪切数据。关于通道的工具旁信息(side information)应该在general_header(通用头)中限定。考虑到每个通道中的特性,高性能压缩需要单独的旁信息。
图2是使用传统的BSAC方法的音频编码设备的功能模块的框图。该设备包括心理声学模型单元200、时间/频率映射单元210、时域噪声修整(TNS)单元220、强度立体声处理单元230、知觉噪声替换(PNS)单元240、中侧(M/S)立体声处理单元250、量化单元260和比特打包单元270。
由于相对于时间人可以觉察的信号之间的差别不是很大,所以时间/频率映射单元210将时域中的音频信号转换为频域中的信号。然而,在频域中的信号的情况下,相对于人类声学模型,可被人觉察的信号与不能被人觉察的信号之间的差别在每个带宽中都很大。因此,通过改变相对于每个频率带宽的比特数,可增强压缩的效率。
心理声学模型单元200将被时间/频率映射单元从时域转换到频域中的音频信号结合到合适的子带的信号中,并通过使用由每个信号的交互作用而发生的掩蔽现象,计算每个子带的掩蔽阈值。TNS单元220被用于控制每个转换窗口中的量化噪声的时域形状。通过应用频率数据的滤波处理实现TNS。TNS单元220被随意地应用在编码器中。强度立体声处理单元230被设计为用于更有效地处理立体声信号。在该装置中,仅关于相对于两个通道之一的比例因子波段的量化信息被编码,并且相对于剩余的通道仅仅比例因子被发送。在编码器中,不是必须使用单元230。在当前帧中信号具有强噪声特性的情况下,通过编码与比例因子波段相应的频率分量的每个的能量值,而不编码频率系数的值,PNS单元240可以减少产生的将被使用的比特的量。PNS单元240可确定是否以比例因子波段为单位使用比特。M/S立体声处理单元230也是用于更有效地处理立体声信号的装置。在该装置中,左通道的信号和右通道的信号分别被转为被加的信号和被减的信号,然后这些信号被处理。在编码器中,也不是必须使用M/S立体声处理单元。量化单元260执行每个波段的频率信号的标量量化,从而使得每个波段的量化噪声的大小小于掩蔽阈值,这样人们就感觉不到噪声。比特打包单元270收集在编码设备的每个模式中产生的信息项,并根据产生的适合于可分级的(scalable)音频编解码器的句法形成比特流。
然而,在图1中所示的传统的BSAC多通道结构中,不能使用中侧(M/S)立体声。这是因为在传统的编码和解码句法中,当通道的数目是2或更多时,不能使用M/S立体声功能。因此,编码效率降低。另外,由于窗口切换和PNS对于所有的通道应该使用相同的旁信息,因此,编码效率降低。此外,由于5通道全部被交织,需要比单声道音频的内存大5倍的内存。
发明内容
本发明提供一种多通道音频数据编码方法以及设备,该方法和设备遵守MPEG标准并改善传统的多通道BSAC方法的性能。
本发明还提供一种多通道音频数据解码方法以及设备,该方法和设备遵守MPEG标准并改善传统的多通道BSAC方法的性能。
根据本发明的一方面,提供了一种多通道音频信号编码方法,包括:编码单声道和/或立体声音频数据;编码除了单声道和/或立体声音频数据之外的扩展的多通道音频数据。单声道和/或立体声音频数据可具有分层的比特率。
扩展的多通道音频数据可包括扩展的通道的类型信息,该类型信息至少指示音频通道的配置,并被表达为通道配置索引。所述扩展的多通道音频数据的编码可包括:编码指示扩展的多通道音频数据的起始的预定的起始代码(zero_code,同步字);以及按通道编码扩展的音频数据。所述起始代码可包括:由32比特的连续的0形成的zero_code,以及由8比特的连续的1形成的同步字。
按通道编码扩展的数据的步骤可包括:编码指示音频通道的配置的扩展的通道的类型,以及编码扩展的通道音频数据。扩展的通道的类型可由通道配置索引形成。按通道编码扩展的数据的步骤可包括:编码扩展的数据的长度;以及编码旁信息(bsac_header,general_header)。
扩展的通道音频数据的编码可包括:编码具有最低比特率的基本层;以及编码比特率高于基本层的比特流的增强层,如果有多个增强层,则随增强层的数量而增加比特率。
根据本发明的另一方面,提供了一种多通道音频信号编码设备,包括:单声道/立体声编码单元,用于编码单声道和/或立体声音频数据;以及扩展的数据编码单元,用于编码除了单声道和/或立体声音频数据之外的扩展的多通道音频数据。单声道/立体声编码单元可编码具有分层的比特率的单声道和/或立体声音频数据。
扩展的数据编码单元的扩展的多通道音频数据可包括扩展的通道的类型信息,所述的类型信息至少指示音频通道的配置,并被表达为通道配置索引。扩展的数据编码单元可包括:起始代码编码单元,用于编码指示扩展的多通道音频数据的起始的预定起始代码(zero_code,同步字);以及通道编码单元,用于按通道编码扩展的音频数据。
起始代码编码单元的起始代码可包括:由32比特的连续0形成的zero_code,以及由8比特的连续1形成的同步字。通道编码单元可包括:扩展的通道类型编码单元,用于编码指示音频通道的配置的扩展的通道的类型;以及扩展的音频编码单元,用于编码扩展的通道音频数据。扩展的通道的类型可由通道配置索引形成。通道编码单元可包括:扩展的数据长度编码单元,用于编码扩展的数据的长度;以及旁信息编码单元,用于编码旁信息(bsac_header,general_header)。
扩展的音频编码单元可包括:基本层编码单元,用于编码具有最低比特率的基本层;以及增强层编码单元,用于编码比特流高于基本层的比特率的增强层,如果存在多个增强层,则随增强层的数量而增加比特率。
根据本发明的又一方面,提供了一种多通道音频信号解码方法,包括:解码单声道和/或立体声音频数据;检验除了单声道和/立体声音频数据之外是否存在将被解码的扩展的多通道音频数据;如果存在将被解码的扩展的数据,则解码扩展的多通道音频数据。该单声道和/或立体声音频数据可具有分层的比特率。
扩展的多通道音频数据可包括扩展的通道的类型信息,所述的类型信息至少指示音频通道的配置,并被表达为通道配置索引。在是否存在扩展的多通道音频数据的检验中,可检验指示扩展的多通道音频数据的起始的预定的起始代码(zero_code、同步字)的存在,如果存在起始代码,则确定存在扩展的数据。所述的起始代码可包括:由32比特的连续0形成的zero_code,以及由8比特的连续1形成的同步字。在扩展的多通道音频数据的解码中,如果存在将被解码的扩展的数据,则可按通道解码扩展的数据。接通道解码扩展的数据的步骤可包括:解码指示音频通道的配置的扩展的通道的类型;以及解码扩展的通道的音频数据。所述的扩展的通道的类型可由通道配置索引形成。
按通道解码扩展的数据的步骤可包括:解码扩展的数据的长度;以及解码旁信息(bsac_header,general_header)。扩展的通道音频数据的解码可包括:解码具有最低比特率的基本层;以及解码比特率高于基本层的比特率的增强层,如果存在多个增强层,则随增强层的数量而增加比特率。
根据本发明的再一方面,提供了一种多通道音频信号解码设备,包括:单声道/立体声解码单元,用于解码单声道和/或立体声音频数据;扩展的数据检验单元,检验除了单声道和/或立体声音频数据之外是否存在将被解码的扩展的多通道音频数据;以及扩展的数据解码单元,如果存在将被解码的数据,则解码扩展的多通道音频数据。单声道和/立体声音频数据具有分层的比特率。所述扩展的数据检验单元可通过预定起始代码(zero_code,同步字)的存在进行检验,所述的预定起始代码指示扩展的多通道音频数据的起始。如果存在起始代码,则确定存在扩展的数据。所述的起始代码可包括:由32比特的连续0形成的zero_code;以及由8比特的连续1形成的同步字。如果存在将被解码的数据,则扩展的数据解码单元按通道解码扩展的数据。所述的扩展的数据解码单元可包括:扩展的通道类型解码单元,用于解码指示音频通道的配置的扩展的通道的类型;以及扩展的通道音频解码单元,用于解码扩展的通道音频数据。所述扩展的通道的类型可由通道配置索引形成。
扩展的数据解码单元可包括:扩展的数据长度解码单元,用于解码扩展的数据的长度;以及旁信息解码单元,用于解码旁信息(bsac header,generalheader)。所述扩展的通道音频解码单元可包括:基本层解码单元,用于解码具有最低比特率的基本层;增强层解码单元民用于解码比特流高于基本层的比特率的增强层,如果存在多个增强层,则随增强层的数量而增加比特率。
根据本发明的又一方面,提供了一种多通道音频信号编码方法,包括:编码单声道/立体声音频数据的基本层;编码单声道/立体声音频数据的增强层;编码指示扩展的多通道音频数据的起始的预定起始代码(zero_code,同步字);对构成扩展的多通道音频数据的至少一个通道数据编码基本层,并对所述的至少一个通道数据编码增强层.
所述的对至少一个通道数据的基本层的编码可包括:编码通道数据的长度;编码指示通道的类型的通道配置索引(channel_configuration_index);编码旁信息(bsac_header,general_header);以及编码基本层的音频数据。
根据本发明的又一方面,提供了一种多通道音频信号解码方法,包括:解码单声道/立体声音频数据的基本层;解码单声道/立体声音频数据的增强层;检验除了单声道/立体声音频数据之外,是否存在将被解码的扩展的多通道音频数据;如果存在将被解码的扩展的多通道音频数据,则解码预定的起始代码(zero_code、同步字),所述的起始代码指示扩展的多通道音频数据的起始;对构成扩展的多通道音频数据的至少一个通道数据解码基本层,并对所述的至少一个通道数据解码增强层。
对至少一个通道数据的基本层的解码包括:解码通道数据的长度;解码指示通道的类型的通道配置索引(channel_configuration_index);解码旁信息(bsac header,general header);解码基本层的音频数据。
根据本发明的另一方面,提供了一种其上包含有计算程序的计算机可读记录介质,该计算机程序用于执行多通道音频数据编码和解码方法。
附图说明
通过下面参照附图对本发明实施例的详细描述,本发明的上述和其他特点和优点将会变得更清楚,其中:
图1示出传统的比特分片算术编码(BSAC)多通道的结构;
图2是使用传统的BSAC方法的音频编码设备的功能模块的框图;
图3是根据本发明的多通道音频数据编码设备的结构的框图;
图4是扩展的数据编码单元的详细框图;
图5是扩展的音频编码单元的详细框图;
图6示出根据本发明的用于多通道音频数据编码的基本数据结构;
图7是由根据本发明的多通道音频数据编码方法执行的操作的流程图;
图8是用于扩展的通道的音频数据编码的详细的流程图;
图9是多通道音频解码设备的结构的框图;
图10是图9的扩展的数据解码单元的框图;
图11是图9的扩展的通道音频解码单元的框图;
图12是根据本发明的多通道音频解码方法的操作的流程图;
图13是用于图12中的操作1230的扩展的通道的音频数据解码的详细流程图;
图14是示出表示图12中的操作1200至1240的实施例的Basc_raw_data_block()的句法;
图15示出表示每个扩展的音频通道解码的实施例的extended_bsac_raw_data_block()的句法;
图16示出操作1100的extended_bsac_raw_element()的例子的句法;
图17示出通过使用根据本发明的多通道音频信号编码和/或解码方法及设备测量声音质量的测试结果。
具体实施方式
现在,将参照附图更全面地描述本发明的多通道音频编码和/或解码设备及方法,其中表示了发明的示例性实施例。
首先,将解释多通道音频编码设备和方法。图3是根据本发明的多通道音频数据编码设备的结构的框图。该设备包括单声道/立体声编码单元300和扩展的数据编码单元350。
单声道/立体声编码单元300编码单声道或立体声音频数据。优选地,单声道/立体声编码单元300编码具有分层的比特率的单声道或立体声音频数据。详细地说,根据ISO/IEC 14496-3以比特分片算术编码(BSAC)方法来编码单声道或立体声音频数据是更可取的。由于BSAC方法的音频编码是公知技术,所以这里将省略对该方法的解释。
扩展的数据编码单元350除了编码单声道或立体声音频数据外还编码扩展的多通道音频数据。
优选地,扩展的多通道音频数据至少包括指示音频通道的配置的扩展的通道的类型信息,扩展的通道类型信息被表达为通道配置索引(channel_configuration_index)。优选地,通道配置索引具有指示音频输出通道配置的3比特字段,如表1中所示。因此,通道配置索引指示与通道相应的每个扬声器的特性。
表1
  索引   通道到扬声器的映射  通道数(nch)
  0   前中扬声器  1
  1   左、右前扬声器  2
  2   后环绕扬声器  1
  3   左环绕、右环绕后扬声器  2
  4   前低频效果扬声器  1
  5   左、右外前扬声器  2
  6-7   保留  -
图4是扩展的数据编码单元350的详细框图,包括起始代码编码单元400和通道编码单元450。起始代码编码单元400编码预定的起始代码,所述的起始代码指示扩展的多通道音频数据的起始。起始代码形成有zero_code和同步字。zero_code是由指示立体声音频数据的算术解码完成的32比特的连续0形成。同步字由指示扩展的多通道音频数据的起始的8比特的连续1形成。该比特串是1111 1111。
通道编码单元450编码每个通道中的扩展的音频数据,并形成有扩展的通道长度编码单元452、扩展的通道类型编码单元454、旁信息编码单元456和扩展的音频编码单元458。
扩展的通道长度编码单元452编码扩展的数据的长度。当执行算术解码时,扩展的数据长度信息被使用。
扩展的通道类型编码单元454编码指示音频通道的配置的扩展的通道的类型。旁信息编码单元456编码旁信息(bsac_header、general_header)。旁信息(bsac_header、general_header)与当以BSAC方法编码单声道或立体声音频数据时使用的旁信息相同。扩展的音频编码单元458编码扩展的通道音频数据。
图5是扩展的音频编码单元458的详细框图。该扩展的音频编码单元458包括基本层编码单元500和增强层编码单元550。基本层编码单元500编码具有最低比特率的基本层。增强层编码单元550编码其比特率比基本层的比特率高的增强层,如果有多个层,则比特率随层数而增加。
本发明使用在传统的立体声比特率中扩展的通道的方法。通道配置索引被指定给每个通道元素,并且指示修改关于当编码音频时每个可用工具的旁信息的可能性。由于在窗口、M/S、和PNS信息的每个通道元素中存在通用头(general header),所以可修改需要修改的所有工具。
图6示出根据本发明的用于多通道音频数据编码的基本数据结构。图7是根据本发明的多通道音频数据编码方法的操作的流程图。参照图3和图7,将解释根据本发明的多通道音频编码方法和设备的操作。
首先,在操作700中,在单声道/立体声编码单元300中编码单声道或立体声音频数据。然后,在扩展的数据编码单元350中,除了单声道或立体声数据之外,扩展的多通道音频数据被编码。优选地,如上所述,单声道或立体声数据具有分层的比特率。此外,扩展的多通道音频数据包括如上所述的扩展的通道的类型信息,该信息至少指示音频通道的配置,并被表达为通道配置索引。
现在将更详细地解释扩展的多通道音频数据的编码。单声道或立体声音频数据被编码,然后在操作710中检验将被编码的数据是否存在。如果将被编码的数据存在,则在操作720中,在起始代码编码单元400中编码指示扩展的多通道音频数据的起始的预定起始代码(zero_code、同步字)。该起始代码与上述编码设备中的起始代码相同。然后,通过通道编码单元450编码用于每个通道的扩展的音频数据。这里,首先在操作730中编码用于一个通道的扩展的音频数据,当该通道的编码完成时,在操作740中检验是否存在用于另一个通道的将被编码的音频数据。如果用于另一通道的将被编码的音频数据存在,则编码用于该通道的音频数据。对所有扩展的通道执行该处理。
图8是操作730中的用于扩展的通道的音频数据编码的详细流程图。在操作800中,在扩展的数据长度编码单元452中编码扩展的数据的长度。此外,在操作820中,在扩展的通道类型编码单元454中编码指示音频通道的配置的扩展的通道的类型。在操作840中,在旁信息编码单元456中编码旁信息(bsac header、general header)。然后,在操作860中,在扩展的音频编码单元458中编码扩展的通道音频数据。
在操作860中的扩展的通道音频数据的编码中,首先,在基本层编码单元500中编码具有最低比特率的基本层中的音频数据,然后在增强层编码单元550中编码增强层的音频数据.增强层具有比基本层的比特率高的比特率.当多个增强层存在时,比特率随着增强层的数量而增加.
同时,将解释根据本发明的多通道音频解码设备和方法。基本上,多通道音频解码以与编码操作相反的顺序执行操作。
图9是多通道解码设备的结构的框图。该设备包括单声道/立体声解码单元900、扩展的数据检验单元920和扩展的数据解码单元940。
单声道/立体声解码单元900解码单声道或立体声音频数据。优选地,单声道或立体声音频数据具有分层的比特率,并根据ISO/IEC 14496-3以BASC方法被解码。
扩展的数据检验单元920检验除了单声道或立体声音频数据之外是否存在将被解码的扩展的多通道音频数据。扩展的数据检验单元920检验指示扩展的多通道音频数据的起始的预定起始代码(zero_code、同步字)的存在,如果存在起始代码,则确定存在扩展的数据。该起始代码由zero_code和同步字形成。zero_code由指示立体声音频数据的算术解码完成的32比特的连续的0形成。同步字由指示扩展的多通道音频数据的起始的8比特的连续1形成。该比特串是1111 1111。
如果存在将被解码的扩展的数据,则扩展的数据解码单元940解码扩展的多通道音频数据。此外,优选地,当执行解码时,扩展的数据解码单元940按通道解码扩展的数据。
图10是图9的扩展的数据解码单元940的框图,包括扩展的数据长度解码单元1000、扩展的通道类型解码单元1020、旁信息解码单元1040和扩展的通道音频解码单元1060。
扩展的数据长度解码单元1000解码扩展的数据的长度信息。扩展的通道类型解码单元1020解码指示音频通道的配置的扩展的通道的类型。优选地,扩展的通道类型信息被表达为通道配置索引(channel_configuration_index)。通道配置索引定义通道被映射到扬声器时的通道数,并如表1所示具有指示音频输出通道配置的3比特字段。
旁信息解码单元1040解码旁信息。旁信息对解码音频数据是必需的,所述旁信息是除了音频数据之外的信息,如bsac header和general header。基本上,该旁信息(bsac_header和general_header)与BSAC方法中解码单声道或立体声音频数据所需的旁信息相同。
扩展的通道音频解码单元1060解码扩展的音频数据。图11是图10的扩展的通道音频解码单元1060的框图,该通道音频解码单元包括基本层解码单元1100和增强层解码单元1150。基本层解码单元1100解码具有最低比特率的基本层。增强层解码单元解码其比特率比基本层的比特率高的增强层。如果存在多个层,则增加随增加的层数而增加的比特率。
图12是由根据本发明的多通道音频解码方法执行的操作的流程图。参照图12,将解释根据本发明的多通道音频数据解码方法和设备的操作。
首先,在操作1200中,通过单声道/立体声解码单元900解码单声道或立体声音频数据.然后,在操作1210中,由扩展的数据检验单元920检验除了单声道/立体声音频数据之外是否存在扩展的多通道音频数据.在操作1220中,通过解码预定起始代码(zero_code、同步字)并检验起始代码的存在来确定扩展的多通道音频数据的存在,所述的预定起始代码指示扩展的多通道音频数据的起始.如果存在起始代码,则确定存在扩展的数据.即,如果存在zero_code,则表明单声道或立体声音频数据的解码被完成,如果其后存在同步字,则表明存在将被解码的多通道音频数据.
如果通过起始代码确定存在将被解码的扩展的数据,则在操作1230中通过扩展的数据解码单元940解码扩展的多通道音频数据。
如图14所示,以句法(Bsac_raw_data_block())表达了操作1200至1230的实施例.
参照图14,Bsac_raw_data_block()是包含编码的音频数据、相关的信息和其他数据的原始数据块,并且主要由bsac_base_element()和几个basc_layer_element()形成。Bsac_raw_data_block()是用于确定bsac比特流是否具有扩展部分的模块。优选地,如上所述单声道或立体声数据具有分层的比特率。此外,扩展的多通道音频数据包括扩展的通道的上面描述的类型信息,该类型信息至少指示音频通道的配置并被表达为通道配置索引。
在关于一个通道的扩展的音频数据在操作1230中被解码之后,在操作1240中检验是否存在将被解码的用于另一通道的音频数据。如果存在将被解码的用于另一通道的音频数据,则解码用于另外的通道的音频数据。通过对所有扩展的通道执行该处理,解码所有扩展的通道音频数据。
图15中示出表示每个音频通道的解码的实施例的句法(extended_bsac_raw_block())。
参照图15,extended_bsac_raw_block()是包括与多通道扩展的数据相应的编码的音频数据以及与该音频数据相关的信息的原始数据块。extended_bsac_raw_block()主要由extended_bsac_element()和几个bsac_layer_element()形成。
图13是操作1230的用于扩展的通道的音频数据解码的详细流程图。在操作1300中,在扩展的数据长度解码单元1000中解码扩展的数据的长度。此外,在操作1320中,在扩展的通道类型解码单元1020中解码指示音频通道的配置的扩展的通道的类型。在操作1340中,在旁信息解码单元1040中解码旁信息(bsac header、general header)。解码操作1300至1340的执行顺序无关紧要。然后,在操作1360中,在扩展的通道音频解码单元1060中解码扩展的通道音频数据。
在操作1360的扩展的音频数据的解码中,具有最低比特率的基本层的音频数据首先在基本层解码单元1100中被解码,然后,增强层的音频数据在增强层解码单元1150中被解码。增强层的比特率高于基本层的比特率,如果存在多个增强层,则比特率随着增强层数的增加而增加。图16表示操作1230的句法(extended_bsac_raw_data_block())的实施例。
参照图16,extended_bsac_raw_data_block()是基本层比特流的句法的元素,包含与BSAC扩展的部分相应的编码的音频数据以及与音频数据相关的信息。
本发明也可被实现为计算机(包括具有信息处理功能的所有设备)可读记录介质上的计算机可读代码。计算机可读记录介质是能够存储可由计算机系统随后读取的数据的任何数据存储装置。计算机可读记录介质的例子包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光学数据存储装置。
虽然已经参照本发明的示例性实施例具体表示和描述了本发明,但是本领域的普通技术人员应该理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可在其中作出形式和细节的各种改变。这些优选实施例应该被理解为只是描述性的,而不是为了限制的目的。因此,本发明的范围不是由本发明的详细描述来限定,而是所附权利要求限定。该范围内的所有不同应该认为包括在本发明中。
根据本发明的多通道音频编码和/或解码设备以及方法,多通道数据交错需要的内存比使用传统的BSAC方法所需的内存少20%。这是因为当使用根据本发明的多通道方法时,正被添加的通道元素被顺序地处理,因此同时进行的内存使用的数量相对小,而在传统的多通道方法中,整个多通道的所有数据应该被装载到内存上。
图17表示通过使用根据本发明的多通道音频信号编码和/或解码方法测量声音质量的结果。
收听试验条件如下。使用窗口切换和M/S立体声工具并且在前和后通道元件的每个中控制比特率。参与试验的四个音频专家以及与传统的BSAC相比的相对声音质量(-2-+2)被测量。对于测试项,用于MPEG-2 NBC的共46项被选择。
根据本发明的多通道音频编码和/或解码方法以及设备,通过仅仅一个比特流,可根据用户环境提供单声道、立体声和多通道音频。此外,在多通道音频中,根据用户终端和网络的状态来提供FGS功能。而且,可实现多通道BSAC的性能的增强,例如,高的声音质量、低的复杂性和可分级性。详细地说,可满足对MPEG标准化(传统BSAC的兼容性、维持FGS功能和最小的修改)的各种需求,此外,该方法和设备可被用于更逼真的数字多媒体广播和基于移动影院的和基于家庭影院的服务中。

Claims (51)

1.一种多通道音频信号编码方法,包括:
编码单声道和/或立体声音频数据;
编码除了单声道和/或立体声音频数据之外的扩展的多通道音频数据。
2.如权利要求1所述的方法,其中,所述单声道和/或立体声音频数据具有分层的比特率。
3.如权利要求1或2所述的方法,其中,所述扩展的多通道音频数据包括扩展的通道的类型信息,所述的类型信息至少指示音频通道的配置,并被表达为通道配置索引。
4.如权利要求1或2所述的方法,其中,所述扩展的多通道音频数据的编码包括:
编码指示扩展的多通道音频数据的起始的预定的起始代码;
按通道编码扩展的音频数据。
5.如权利要求4所述的方法,其中,所述起始代码包括:
由32比特的连续的0形成的zero_code;
由8比特的连续的1形成的同步字。
6.如权利要求4所述的方法,其中,所述按通道编码扩展的数据的步骤包括:
编码指示音频通道的配置的扩展的通道的类型;
编码扩展的通道音频数据。
7.如权利要求6所述的方法,其中,所述扩展的通道的类型由通道配置索引形成。
8.如权利要求6所述的方法,其中,所述按通道编码扩展的数据的步骤包括:
编码扩展的数据的长度;
编码旁信息。
9.如权利要求8所述的方法,其中,所述的旁信息包括bsac_header和general_header。
10.如权利要求6所述的方法,其中,所述扩展的通道音频数据的编码包括:
编码具有最低比特率的基本层;
编码比特率高于基本层的比特率的增强层,如果有多个增强层,则随增强层数的增加而增加比特率。
11.一种多通道音频信号编码设备,包括:
单声道/立体声编码单元,用于编码单声道和/或立体声音频数据;
扩展的数据编码单元,用于编码除了单声道和/或立体声音频数据之外的扩展的多通道音频数据。
12.如权利要求11所述的设备,其中,所述单声道/立体声编码单元编码具有分层的比特率的单声道和/或立体声音频数据。
13.如权利要求11或12所述的设备,其中,扩展的数据编码单元的扩展的多通道音频数据包括扩展的通道的类型信息,所述的类型信息至少指示音频通道的配置,并被表达为通道配置索引。
14.如权利要求11或12所述的设备,其中,所述扩展的数据编码单元包括:
起始代码编码单元,用于编码指示扩展的多通道音频数据的起始的预定起始代码;
通道编码单元,用于按通道编码扩展的音频数据。
15.如权利要求14所述的设备,其中,所述起始代码编码单元的起始代码包括:
由32比特的连续的0形成的zero_code;
由8比特的连续的1形成的同步字。
16.如权利要求14所述的设备,其中,所述通道编码单元包括:
扩展的通道类型编码单元,用于编码指示音频通道的配置的扩展的通道的类型;
扩展的音频编码单元,用于编码扩展的通道音频数据。
17.如权利要求16所述的设备,其中,所述扩展的通道的类型由通道配置索引形成。
18.如权利要求16所述的设备,其中,所述通道编码单元包括:
扩展的数据长度编码单元,用于编码扩展的数据的长度;
旁信息编码单元,用于编码旁信息。
19.如权利要求18所述的设备,其中,所述的旁信息包括bsac_header和general_header。
20.如权利要求16所述的设备,其中,所述扩展的音频编码单元包括:
基本层编码单元,用于编码具有最低比特率的基本层;
增强层编码单元,用于编码比特率高于基本层的比特率的增强层,如果存在多个增强层,则随增强层的数量而增加比特率。
21.一种多通道音频信号解码方法,包括:
解码单声道和/或立体声音频数据;
检验除了单声道和/立体声音频数据之外是否存在将被解码的扩展的多通道音频数据;
如果存在将被解码的扩展的数据,则解码扩展的多通道音频数据。
22.如权利要求21所述的方法,其中,单声道和/或立体声音频数据具有分层的比特率。
23.如权利要求21或22所述的方法,其中,所述扩展的多通道音频数据包括扩展的通道的类型信息,所述的类型信息至少指示音频通道的配置,并被表达为通道配置索引。
24.如权利要求21或22所述的方法,其中,在是否存在扩展的多通道音频数据的检验中,检验指示扩展的多通道音频数据的起始的预定的起始代码的存在,如果存在起始代码,则确定存在扩展的数据。
25.如权利要求24所述的方法,其中,所述的起始代码包括:
由32比特的连续的0形成的zero_code;
由8比特的连续的1形成的同步字。
26.如权利要求21或22所述的方法,其中,在扩展的多通道音频数据的解码中,如果存在将被解码的扩展的数据,则按通道解码扩展的数据。
27.如权利要求26所述的方法,其中,按通道解码扩展的数据的步骤包括:
解码指示音频通道的配置的扩展的通道的类型;
解码扩展的通道音频数据。
28.如权利要求27所述的方法,其中,所述的扩展的通道的类型由通道配置索引形成。
29.如权利要求26所述的方法,其中,按通道解码扩展的数据的步骤包括:
解码扩展的数据的长度;
解码旁信息。
30.如权利要求29所述的方法,其中,所述的旁信息包括bsac_header和general_header。
31.如权利要求27所述的方法,其中,扩展的通道音频数据的解码包括:
解码具有最低比特率的基本层;
解码其比特率高于基本层的比特率的增强层,如果存在多个增强层,则随增强层数增加比特率。
32.一种多通道音频信号解码设备,包括:
单声道/立体声解码单元,用于解码单声道和/或立体声音频数据;
扩展的数据检验单元,检验除了单声道和/或立体声音频数据之外是否存在将被解码的扩展的多通道音频数据;
扩展的数据解码单元,如果存在将被解码的扩展的数据,则解码扩展的多通道音频数据。
33.如权利要求32所述的设备,其中,单声道和/立体声音频数据具有分层的比特率。
34.如权利要求32或33所述的设备,其中,所述扩展的数据检验单元检验预定起始代码的存在,所述的预定起始代码指示扩展的多通道音频数据的起始,如果存在起始代码,则确定存在扩展的数据。
35.如权利要求34所述的设备,其中,所述的起始代码包括:
由32比特的连续的0形成的zero_code;
由8比特的连续的1形成的同步字。
36.如权利要求32或33所述的设备,其中,如果存在将被解码的扩展的数据,则扩展的数据解码单元按通道解码扩展的数据。
37.如权利要求36所述的设备,其中,所述的扩展的数据解码单元包括:
扩展的通道类型解码单元,用于解码指示音频通道的配置的扩展的通道的类型;
扩展的通道音频解码单元,用于解码扩展的通道音频数据。
38.如权利要求37所述的设备,其中,所述扩展的通道的类型由通道配置索引形成。
39.如权利要求37所述的设备,其中,扩展的数据解码单元包括:
扩展的数据长度解码单元,用于解码扩展的数据的长度;
旁信息解码单元,用于解码旁信息。
40.如权利要求39所述的设备,其中,所述的旁信息包括bsac_header和general_header。
41.如权利要求37所述的设备,其中,所述扩展的通道音频解码单元包括:
基本层解码单元,用于解码具有最低比特率的基本层;
增强层解码单元,用于解码其比特率高于基本层的比特率的增强层,如果存在多个增强层,则随增强层的数量而增加比特率。
42.一种多通道音频信号编码方法,包括:
编码单声道/立体声音频数据的基本层;
编码单声道/立体声音频数据的增强层;
编码指示扩展的多通道音频数据的起始的预定起始代码(zero_code,同步字);
对构成扩展的多通道音频数据的至少一个通道数据编码基本层,并对所述的至少一个通道数据编码增强层.
43.如权利要求42所述的方法,其中,所述的对至少一个通道数据编码基本层的步骤包括:
编码通道数据的长度;
编码指示通道的类型的通道配置索引(channel_configuration_index);
编码旁信息;
编码基本层的音频数据。
44.如权利要求43所述的方法,其中,所述的旁信息包括bsac_header和general_header。
45.一种多通道音频信号解码方法,包括:
解码单声道/立体声音频数据的基本层;
解码单声道/立体声音频数据的增强层;
检验除了单声道/立体声音频数据之外,是否存在将被解码的扩展的多通道音频数据;
如果存在将被解码的扩展的多通道音频数据,则解码预定的起始代码(zero_code,同步字),所述的起始代码指示扩展的多通道音频数据的起始;
对构成扩展的多通道音频数据的至少一个通道数据解码基本层,并对所述的至少一个通道数据解码增强层。
46.如权利要求45所述的方法,其中,所述的对至少一个通道数据解码基本层的步骤包括:
解码通道数据的长度;
解码指示通道的类型的通道配置索引(channel_configuration_index);
解码旁信息(bsac header,general header);
解码基本层的音频数据。
47.一种多通道音频信号编码方法,包括:
编码音频数据;
生成指示编码音频数据的净荷已经完成的标识代码;
生成指示扩展的数据的净荷已经开始的标识代码;
生成扩展的数据的类型,所述扩展的数据的类型将音频数据的通道扩展为多通道;
编码扩展的数据。
48.一种多通道音频信号解码方法,包括:
解码音频数据;
检测指示音频数据的净荷已经完成的标识代码;
检测指示扩展的数据的净荷已经开始的标识代码;
检测扩展的数据的类型;
确定检测到的扩展的数据的类型是否将音频数据的通道扩展为多通道;
当确定检测到的类型将音频数据的通道扩展为多通道时,解码扩展的数据。
49.一种多通道音频信号解码方法,包括:解码音频数据;
确定是否存在还未被解码的数据;
当确定存在还未被解码的数据时,检测指示音频数据的净荷已经被完成的标识代码;
检测指示扩展的数据的净荷已经开始的标识代码;
检测扩展的数据的类型;
确定检测到的扩展的数据的类型是否将音频数据的通道扩展为多通道;
当确定检测到的类型将音频数据的通道扩展为多通道时,解码扩展的数据。
50.一种多通道音频信号解码方法,包括:
解码分级编码的音频数据;
检测零代码;
检测同步字;
检测扩展的通道的类型;
确定检测到的扩展的通道的类型是否指示扩展的数据,所述扩展的数据将音频数据的通道扩展为多通道;
当确定检测到的扩展的通道的类型指示扩展的数据时,解码扩展的数据。
51.一种多通道音频信号解码方法,包括:
解码分级编码的音频数据;
确定是否存在还未被解码的数据;
当确定存在还未被解码的数据时,检测零代码;
检测同步字;
检测扩展的通道的类型;
确定检测到的扩展的通道的类型是否指示扩展的数据,所述扩展的数据将音频数据的通道扩展为多通道;
当确定检测到的扩展的通道的类型指示扩展的数据时,解码所述扩展的数据。
CN2005100841436A 2004-07-14 2005-07-14 多通道音频数据编码/解码方法和设备 Expired - Fee Related CN1756086B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US58762604P 2004-07-14 2004-07-14
US60/587,626 2004-07-14
KR10-2005-0021840 2005-03-16
KR1020050021840 2005-03-16
KR1020050021840A KR100773539B1 (ko) 2004-07-14 2005-03-16 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2010101222400A Division CN101789792B (zh) 2004-07-14 2005-07-14 多通道音频数据编码/解码方法和设备

Publications (2)

Publication Number Publication Date
CN1756086A CN1756086A (zh) 2006-04-05
CN1756086B true CN1756086B (zh) 2010-05-05

Family

ID=36689093

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2005100841436A Expired - Fee Related CN1756086B (zh) 2004-07-14 2005-07-14 多通道音频数据编码/解码方法和设备
CN2010101222400A Expired - Fee Related CN101789792B (zh) 2004-07-14 2005-07-14 多通道音频数据编码/解码方法和设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN2010101222400A Expired - Fee Related CN101789792B (zh) 2004-07-14 2005-07-14 多通道音频数据编码/解码方法和设备

Country Status (5)

Country Link
US (1) US20060013405A1 (zh)
EP (2) EP2276022A3 (zh)
JP (2) JP2006031012A (zh)
KR (2) KR100773539B1 (zh)
CN (2) CN1756086B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101789792B (zh) * 2004-07-14 2012-03-28 三星电子株式会社 多通道音频数据编码/解码方法和设备

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
US7996216B2 (en) 2005-07-11 2011-08-09 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
KR100755471B1 (ko) * 2005-07-19 2007-09-05 한국전자통신연구원 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법
WO2007032646A1 (en) 2005-09-14 2007-03-22 Lg Electronics Inc. Method and apparatus for decoding an audio signal
KR100813269B1 (ko) * 2005-10-12 2008-03-13 삼성전자주식회사 비트 스트림 처리/전송 방법 및 장치, 비트 스트림수신/처리 방법 및 장치
TWI344638B (en) 2006-01-19 2011-07-01 Lg Electronics Inc Method and apparatus for processing a media signal
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
CN101385076B (zh) * 2006-02-07 2012-11-28 Lg电子株式会社 用于编码/解码信号的装置和方法
WO2007091849A1 (en) 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
CN101361274B (zh) * 2006-02-23 2012-07-18 Lg电子株式会社 处理音频信号的方法和装置
WO2007097549A1 (en) * 2006-02-23 2007-08-30 Lg Electronics Inc. Method and apparatus for processing an audio signal
WO2007097551A1 (en) 2006-02-23 2007-08-30 Lg Electronics Inc. Method and apparatus for processing an audio signal
KR101438387B1 (ko) * 2006-07-12 2014-09-05 삼성전자주식회사 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치
KR100763919B1 (ko) * 2006-08-03 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치
US8571875B2 (en) 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
CN101212845B (zh) * 2006-12-25 2011-05-04 上海乐金广电电子有限公司 家庭影院系统的扩音器声道的设定方法
KR101355376B1 (ko) * 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
ES2653887T3 (es) * 2007-11-28 2018-02-09 Irx Therapeutics, Inc. Procedimiento para aumentar el efecto inmunológico
KR101435815B1 (ko) * 2007-11-28 2014-08-29 엘지전자 주식회사 방송 시스템 및 오디오 데이터 처리 방법
KR101235830B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
KR101074010B1 (ko) 2009-09-04 2011-10-17 (주)이스트소프트 블록 단위 데이터 압축 및 복원 방법 및 그 장치
KR101016776B1 (ko) * 2009-09-21 2011-02-25 (주)이스트소프트 상위 호환성 보장형 압축 및 복원 방법 및 장치
WO2012176084A1 (en) 2011-06-24 2012-12-27 Koninklijke Philips Electronics N.V. Audio signal processor for processing encoded multi - channel audio signals and method therefor
KR102172279B1 (ko) * 2011-11-14 2020-10-30 한국전자통신연구원 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법
WO2013122388A1 (en) * 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmission apparatus, data receiving apparatus, data transceiving system, data transmission method and data receiving method
WO2013122386A1 (en) 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmitting apparatus, data receiving apparatus, data transreceiving system, data transmitting method, data receiving method and data transreceiving method
WO2013122385A1 (en) 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmitting apparatus, data receiving apparatus, data transreceiving system, data transmitting method, data receiving method and data transreceiving method
WO2013122387A1 (en) 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmitting apparatus, data receiving apparatus, data transceiving system, data transmitting method, and data receiving method
TWI505262B (zh) * 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
WO2014005327A1 (zh) * 2012-07-06 2014-01-09 深圳广晟信源技术有限公司 对多声道数字音频编码的方法
KR101454343B1 (ko) * 2013-04-23 2014-10-24 한국산업은행 직접 오디오 채널 데이터 및 간접 오디오 채널 데이터를 이용한 스케일러블 디지털 오디오 인코딩/디코딩 방법 및 장치
US9679572B2 (en) 2013-04-23 2017-06-13 The Korea Development Bank Method and apparatus for encoding/decoding scalable digital audio using direct audio channel data and indirect audio channel data
GB2524333A (en) * 2014-03-21 2015-09-23 Nokia Technologies Oy Audio signal payload
EP3522155B1 (en) * 2015-05-20 2020-10-14 Telefonaktiebolaget LM Ericsson (publ) Coding of multi-channel audio signals
CN105895111A (zh) * 2015-12-15 2016-08-24 乐视致新电子科技(天津)有限公司 基于Android的音频内容处理方法及设备
CN109284080B (zh) * 2018-09-04 2021-01-05 Oppo广东移动通信有限公司 音效调整方法、装置、电子设备以及存储介质
CN110808054B (zh) * 2019-11-04 2022-05-06 思必驰科技股份有限公司 多路音频的压缩与解压缩方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5451942A (en) * 1994-02-04 1995-09-19 Digital Theater Systems, L.P. Method and apparatus for multiplexed encoding of digital audio information onto a digital audio storage medium
US20020165721A1 (en) * 2001-05-04 2002-11-07 Chang Kenneth H.P. Real-time control of playback rates in presentations
US6487535B1 (en) * 1995-12-01 2002-11-26 Digital Theater Systems, Inc. Multi-channel audio encoder

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2766466B2 (ja) * 1995-08-02 1998-06-18 株式会社東芝 オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法
JP3342996B2 (ja) * 1995-08-21 2002-11-11 三星電子株式会社 多チャネルオーディオ符号化器及び符号化方法
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
JPH11282496A (ja) * 1998-03-30 1999-10-15 Matsushita Electric Ind Co Ltd 復号装置
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
KR101016251B1 (ko) * 2002-04-10 2011-02-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호의 코딩
ES2323294T3 (es) * 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
ES2268340T3 (es) * 2002-04-22 2007-03-16 Koninklijke Philips Electronics N.V. Representacion de audio parametrico de multiples canales.
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
EP1414273A1 (en) * 2002-10-22 2004-04-28 Koninklijke Philips Electronics N.V. Embedded data signaling
EP2665294A2 (en) * 2003-03-04 2013-11-20 Core Wireless Licensing S.a.r.l. Support of a multichannel audio extension
KR100561867B1 (ko) * 2003-03-07 2006-03-17 삼성전자주식회사 오디오 신호 처리 장치와 방법 및 컴퓨터 프로그램을저장하는 컴퓨터로 읽을 수 있는 기록 매체
WO2004098105A1 (en) * 2003-04-30 2004-11-11 Nokia Corporation Support of a multichannel audio extension
DE602004028171D1 (de) * 2004-05-28 2010-08-26 Nokia Corp Mehrkanalige audio-erweiterung
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5451942A (en) * 1994-02-04 1995-09-19 Digital Theater Systems, L.P. Method and apparatus for multiplexed encoding of digital audio information onto a digital audio storage medium
US6487535B1 (en) * 1995-12-01 2002-11-26 Digital Theater Systems, Inc. Multi-channel audio encoder
US20020165721A1 (en) * 2001-05-04 2002-11-07 Chang Kenneth H.P. Real-time control of playback rates in presentations

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101789792B (zh) * 2004-07-14 2012-03-28 三星电子株式会社 多通道音频数据编码/解码方法和设备

Also Published As

Publication number Publication date
EP1617413A2 (en) 2006-01-18
US20060013405A1 (en) 2006-01-19
KR20070077220A (ko) 2007-07-25
JP2006031012A (ja) 2006-02-02
EP2276022A3 (en) 2011-10-05
KR100773539B1 (ko) 2007-11-05
EP1617413A3 (en) 2006-07-26
CN101789792B (zh) 2012-03-28
KR100982427B1 (ko) 2010-09-15
EP2276022A2 (en) 2011-01-19
CN101789792A (zh) 2010-07-28
JP2012238034A (ja) 2012-12-06
KR20060043701A (ko) 2006-05-15
CN1756086A (zh) 2006-04-05

Similar Documents

Publication Publication Date Title
CN1756086B (zh) 多通道音频数据编码/解码方法和设备
EP0869622B1 (en) Scalable audio coding/decoding method and apparatus
TWI393120B (zh) 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
CN101933086B (zh) 处理音频信号的方法和设备
TW202145197A (zh) 用以使用量化及熵寫碼來編碼或解碼方向性音訊寫碼參數之設備及方法
US7848931B2 (en) Audio encoder
CN101055720B (zh) 对音频信号编码和解码的方法和设备
US7245234B2 (en) Method and apparatus for encoding and decoding digital signals
JPH06149292A (ja) 高能率符号化方法及び装置
JP4685165B2 (ja) 仮想音源位置情報に基づいたチャネル間レベル差量子化及び逆量子化方法
CN101485094A (zh) 最大熵意义下的后向兼容多通道音频编码与解码方法和系统
JP3964860B2 (ja) ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
US20110311063A1 (en) Embedding and extracting ancillary data
KR20040053501A (ko) 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치
Liu et al. A new intensity stereo coding scheme for MPEG1 audio encoder-layers I and II
CN117476016A (zh) 音频编解码方法、装置、存储介质及计算机程序产品
Yang et al. Progressive syntax-rich coding of multichannel audio sources
TW202403728A (zh) 一種多聲道信號的編解碼方法和編解碼設備以及終端設備
Houtsma Perceptually Based Audio Coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100505

Termination date: 20200714