CN105247610A

CN105247610A - 编码装置和方法、解码装置和方法以及程序

Info

Publication number: CN105247610A
Application number: CN201480029768.XA
Authority: CN
Inventors: 畠中光行; 知念彻; 山本优树; 史润宇
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2013-05-31
Filing date: 2014-05-21
Publication date: 2016-01-13
Anticipated expiration: 2034-05-21
Also published as: JPWO2014192604A1; TWI631554B; CN105247610B; WO2014192604A1; EP3007166B1; EP3007166A4; JP6465020B2; US20160133260A1; TW201503109A; EP3007166A1; US9905232B2

Abstract

本技术涉及可以改善音频信号传输效率的编码装置和方法、解码装置和方法以及程序。标识信息生成器基于音频信号确定是否对音频信号进行编码，并且生成用于指示确定结果的标识信息。编码单元仅对为编码指定的音频信号进行编码。打包单元生成包含标识信息和编码的音频信号的比特流。因此仅将已经编码的音频信号存储在比特流中，从而可以通过在比特流中存储指示音频信号是否被编码的标识信息来改善音频信号传输效率。本技术可以应用于编码器和解码器。

Description

编码装置和方法、解码装置和方法以及程序

技术领域

本技术涉及编码装置和方法、解码装置和方法以及其程序，更具体地，涉及能够改善音频信号传输效率的编码装置和方法、解码装置和方法以及其程序。

背景技术

例如，已知基于作为国际标准的MPEG(运动图像专家组)-2AAC(高级音频编码)或MPEG-4AAC的多通道编码是用于对音频信号进行编码的方法(例如，参照非专利文献1)。

引用列表

非专利文献

非专利文献1：国际标准ISO/IEC14496-3第四版2009-09-01Informationtechnology-codingofaudio-visualobjects(信息技术-视听对象的编码)——第3部分：音频

发明内容

本发明要解决的问题

对于比传统的5.1通道环绕再现给出更高真实感的再现来说，以及对于多个声音素材(对象)的传输来说，需要使用更多音频通道的编码技术。

例如，对于以256kbps对31个通道进行编码，根据MPEGAAC标准在编码中按每个通道和每个音频帧的可以使用的平均比特数为约176比特。然而，在这样的比特数的情况下，在使用典型的标量编码(scalarcoding)对16kHz或更高的高带宽进行编码时，音质可能会明显劣化。

此外，在现有的音频编码中，由于对无声的信号或可以被视为无声的信号也执行编码处理，所以编码所需要的比特数并不少。

在多通道低比特率编码中，重要的是要分配尽可能多的比特以在编码通道中使用；当根据MPEGAAC标准进行编码时，用于对无声帧进行编码的比特数是每帧的每元素30至40比特。因此，随着一个帧中的无声通道的数量越大，所需的比特数或对无声数据进行编码变得越难以忽视。

如上所述，使用上述技术，即使存在不需要必须被编码的信号(如无声的或可以被视为无声的音频信号)，也不能高效地传输音频信号。

鉴于上述情况实现本技术，并且本技术使得能够改善音频信号传输效率。

问题的解决方案

根据本技术的第一方面的编码装置包括：编码单元，该编码单元被配置成：当指示是否要对音频信号进行编码的标识信息是指示要执行编码的信息时对音频信号进行编码，以及当标识信息是指示不执行编码的信息时对音频信号不进行编码；以及打包单元，该打包单元被配置成生成比特流，所述比特流包含第一比特流元素，以及多个第二比特流元素或至少一个第三比特流元素，所述第一比特流元素中存储有标识信息，所述多个第二比特流元素中存储有根据标识信息编码的一个通道的音频信号，所述至少一个第三比特流元素中存储有根据标识信息编码的两个通道的音频信号。

编码装置还可以设置有标识信息生成单元，该标识信息生成单元被配置成根据音频信号生成标识信息。

当音频信号是无声信号时，标识信息生成单元可以生成指示不执行编码的标识信息。

当音频信号是能够被视为无声信号的信号时，标识信息生成单元可以生成指示不执行编码的标识信息。

标识信息生成单元可以根据该音频信号的声源位置与另一音频信号的声源位置之间的距离、该音频信号的水平以及另一音频信号的水平来确定该音频信号是否是能够被视为无声信号的信号。

根据本技术的第一方面的编码方法或程序包括下述步骤：当指示是否要对音频信号进行编码的标识信息是指示要执行编码的信息时对音频信号进行编码，以及当标识信息是指示不执行编码的信息时对音频信号不进行编码；以及生成比特流，所述比特流包含第一比特流元素，以及多个第二比特流元素或至少一个第三比特流元素，所述第一比特流元素中存储有标识信息，所述多个第二比特流元素中存储有根据标识信息编码的一个通道的音频信号，所述至少一个第三比特流元素中存储有根据标识信息编码的两个通道的音频信号。

在本技术的第一方面中，当指示是否要对音频信号进行编码的标识信息是指示要执行编码的信息时对音频信号进行编码，以及当标识信息是指示不执行编码的信息时对音频信号不进行编码；以及生成比特流，所述比特流包含第一比特流元素，以及多个第二比特流元素或至少一个第三比特流元素，所述第一比特流元素中存储有标识信息，所述多个第二比特流元素中存储有根据标识信息编码的一个通道的音频信号，所述至少一个第三比特流元素中存储有根据标识信息编码的两个通道的音频信号。

根据本技术的第二方面的解码装置包括：获取单元，该获取单元被配置成获取比特流，所述比特流包含第一比特流元素，以及多个第二比特流元素或至少一个第三比特流元素，所述第一比特流元素中存储有指示是否对音频信号进行编码的标识信息，所述多个第二比特流元素中存储有根据指示要执行编码的标识信息而编码的一个通道的音频信号，所述至少一个第三比特流元素中存储有根据指示要执行编码的标识信息而编码的两个通道的音频信号；提取单元，该提取单元被配置成从比特流中提取音频信号和标识信息；以及解码单元，该解码单元被配置成对从比特流中提取的音频信号进行解码，并且将具有指示不执行编码的标识信息的音频信号作为无声信号来解码。

为将音频信号作为无声信号来解码，解码单元可以将MDCT系数设置为0，并且执行IMDCT处理以生成音频信号。

根据本技术的第二方面的解码方法或程序包括下述步骤：获取比特流，所述比特流包含第一比特流元素，以及多个第二比特流元素或至少一个第三比特流元素，所述第一比特流元素中存储有指示是否对音频信号进行编码的标识信息，所述多个第二比特流元素中存储有根据指示要执行编码的标识信息而编码的一个通道的音频信号，所述至少一个第三比特流元素中存储有根据指示要执行编码的标识信息而编码的两个通道的音频信号；从比特流中提取音频信号和标识信息；以及对从比特流中提取的音频信号进行解码，并且将具有指示不执行编码的标识信息的音频信号作为无声信号来解码。

在本技术的第二方面中，获取比特流，所述比特流包含第一比特流元素，以及多个第二比特流元素或至少一个第三比特流元素，所述第一比特流元素中存储有指示是否对音频信号进行编码的标识信息，所述多个第二比特流元素中存储有根据指示要执行编码的标识信息而编码的一个通道的音频信号，所述至少一个第三比特流元素中存储有根据指示要执行编码的标识信息而编码的两个通道的音频信号；从比特流中提取音频信号和标识信息；以及对从比特流中提取的音频信号进行解码，并且将具有指示不执行编码的标识信息的音频信号作为无声信号来解码。

本发明的效果

根据本技术的第一方面和第二方面，可以改善音频信号传输效率。

附图说明

图1是示出比特流的图示。

图2是示出是否需要编码的图示。

图3是示出针对每个通道的每帧的编码状态的表。

图4是示出比特流的结构的表。

图5是示出标识信息的表。

图6是示出DSE的图示。

图7是示出DSE的图示。

图8是示出编码器的示例配置的图示。

图9是示出标识信息生成处理的流程图。

图10是示出编码处理的流程图。

图11是示出解码器的示例配置的图示。

图12是示出解码处理的流程图。

图13是示出计算机的示例配置的图示。

具体实施方式

将参照附图在下面描述应用本技术的实施方式。

<第一实施方式>

<本技术的概要>

本技术以下述方式改善音频信号传输效率：满足条件的以帧为单位的多通道音频信号的编码数据不被传输，在所述条件下，信号可以被视为无声的或等同于无声的并且因此不需要被传输。在这种情况下，将用于指示是否对以帧为单位的每个通道的音频信号进行编码的标识信息传输到解码器侧，这使得能够将传输到解码器侧的编码数据分配到合适的通道。

虽然在下面描述了根据AAC标准来编码多通道音频信号的情况，但是在根据其他系统来编码音频信号的情况下也执行类似的处理。

例如，在多通道音频信号根据AAC标准来编码并且然后被传输的情况下，各个通道的音频信号被以帧为单位来编码并且传输。

特别地，如图1中所示，将编码的音频信号和音频信号的解码等所需的信息存储在多个元素(比特流元素)中，并且传输每个均由这样的元素组成的比特流。

在该示例中，帧的比特流包括以从头部开始的顺序布置的n个元素EL1至ELn，以及布置在末端并且指示帧的信息的结束位置的标识符TERM。

例如，布置在头部的元素EL1是被称为DSE(数据流元素)的辅助数据区域，其中写入有关多个通道的信息，如有关音频信号的下混合的信息和标识信息。

在跟随元素EL1之后的元素EL2至元素ELn中存储经编码的音频信号。特别地，存储有单个通道的音频信号的元素被称为SCE，以及存储有构成一对的两个通道的音频信号的元素被称为CPE。

在本技术中，对无声的或可以被视为无声的通道的音频信号不进行编码，并且因此对其不执行编码的通道的音频信号不存储在比特流中。

然而，当一个或多个通道的音频信号不存储在比特流中时，难以标识包含在比特流中的音频信号属于哪个通道。因此，在本技术中，生成指示是否对每个通道的音频信号进行编码的标识信息并且将其存储在DSE中。

例如，假设如图2中所示的连续帧F11至帧F13的音频信号要被编码。

在这种情况下，编码器确定是否对每一帧的音频信号进行编码。例如，编码器基于音频信号的幅度确定音频信号是否是无声信号。如果音频信号是无声信号或可以被视为无声信号，那么确定对该帧的音频信号不进行编码。

在图2的示例中，由于帧F11和帧F13的音频信号不是无声的，所以确定要对该音频信号进行编码；并且由于帧F12的音频信号是无声信号，所以确定对该音频信号不进行编码。

以此方式，编码器在对音频信号进行编码之前确定针对每个通道是否要对每一帧的音频信号进行编码。

更特别地，当两个通道(如R通道和L通道)成对时，确定是否针对一对通道执行编码。例如，假设R通道和L通道成对，并且这些通道的音频信号被编码且被存储在一个CPE(元素)中。

在这种情况下，当R通道和L通道两者的音频信号是无声信号或者可以被视为无声信号时，对这些音频信号不进行编码。换言之，当两个通道的音频信号中的至少一个音频信号不是无声的时，对这两个音频信号进行编码。

当在针对每个通道，或者更具体地以此方式针对每个元素，做出是否要执行编码的决定的同时，对各个通道的音频信号进行编码时，如图3中所示仅对不是无声的可听音频信号进行编码。

在图3中，附图中的竖直方向表示通道，附图中的水平方向表示时间，即，帧。在该示例中，例如在第一帧中，八个通道CH1至CH8的所有音频信号被编码。

在第二帧中，五个通道CH1、CH2、CH5、CH7和CH8的音频信号被编码，并且其他通道的音频信号未被编码。

此外，在第六帧中，仅通道CH1的音频信号被编码，并且其他通道的音频信号未被编码。

在如图3中所示的对音频信号进行编码的情况下，仅是编码的音频信号被按顺序布置并且被打包(pack)，如图4所示，并且被传输给解码器。在该示例中，特别在第六帧中，因为仅是通道CH1的音频信号被传输，所以可以明显减少比特流中的数据量，并且因此可以改善传输效率。

此外，编码器生成如图5中所示的指示是否对每个通道(或者更具体地每个元素)的每一帧进行编码的标识信息，并且将标识信息和编码的音频信号传输给解码器。

在图5中，被输入到每个框中的数字“0”表示指示已经执行编码的标识信息，而被输入到每个框中的数字“1”表示指示未执行编码的标识信息。可以将由编码器生成的一个通道(元素)的一个帧的标识信息写入到一个比特中。对于每一帧将每个通道(元素)的这种标识信息写入到DSE中。

由于如上所述的确定是否对每个元素的音频数据进行编码，以及在比特流中写入并且传输需要被编码的音频数据和用于指示是否对每个元素进行编码的标识信息，所以可以改善音频信号的传输效率。此外，未被传输的音频信号的比特数，即，减少的数据量可以被分配作为要传输的当前帧的其他音频信号或其他帧的代码量。以此方式，可以改善要编码的音频信号的音质。

因为文中描述了根据AAC执行编码的示例，所以针对每个比特流元素生成标识信息，但是还可以根据其他系统在需要时针对每个通道生成标识信息。

例如，当如上所述的标识信息等被写入到DSE中时，图6和图7中所示的信息被写入到DSE中。

图6示出了包含在DSE中的“3da_fragmented_header”的语法。在该信息中，写入“num_of_audio_element”作为用于指示包含在比特流中的音频元素的数量的信息，即元素(例如其中包含有编码的音频信号的SCE和CPE)的数量的信息。

在“num_of_audio_element”之后，写入“element_is_cpe[i]”作为用于指示每个元素是单通道的元素还是通道对的元素(即SCE或CPE)的信息。

此外，图7示出了包含在DSE中的“3da_fragmented_data”的语法。

在这个信息中，写入“3da_fragmented_header_flag”，“3da_fragmented_header_flag”是指示图6中所示的“3da_fragmented_header”是否被包含在DSE中的标志。

此外，当“3da_fragmented_header_flag”的值为“1”时，“3da_fragmented_header”位于“3da_fragmented_header_flag”之后，其中，“1”是指示图6中所示的“3da_fragmented_header”被写入DSE中的值。

此外，在“3da_fragmented_data”中，写入作为标识信息的“fragment_element_flag[i]”，“fragment_element_flag[i]”的数量与其中存储有音频信号的元素的数量对应。

<编码器的示例配置>

接下来，将描述应用本技术的编码器的具体实施方式。

图8是示出应用本技术的编码器的示例配置的图示。

编码器11包括标识信息生成单元21、编码单元22、打包(packing)单元23、以及输出单元24。

标识信息生成单元21基于从外部提供的音频信号确定是否要对每个元素的音频信号进行编码，并且生成用于指示确定结果的标识信息。标识信息生成单元21将所生成的标识信息提供给编码单元22和打包单元23。

编码单元22参考从标识信息生成单元21提供的标识信息，在需要时对从外部提供的音频信号进行编码，并且将编码的音频信号(下文中还称为编码的数据)提供给打包单元23。编码单元22还包括时频转换单元31，时频转换单元31执行对音频信号的时频转换。

打包单元23对从标识信息生成单元21提供的标识信息和从编码单元22提供的编码的数据进行打包以生成比特流，并且将比特流提供给输出单元24。输出单元24将从打包单元23提供的比特流输出给解码器。

<标识信息生成处理的说明>

随后，将描述编码器11的操作。

首先，将参照图9的流程图来描述标识信息生成处理，标识信息生成处理是编码器11生成标识信息的处理。

在步骤S11中，标识信息生成单元21确定是否存在输入数据。例如，如果从外部新提供一个帧的元素的音频信号，那么确定存在输入数据。

如果在步骤S11中确定存在输入数据，那么在步骤S12中，标识信息生成单元21确定是否满足计数器i<元素的数量。

例如，标识信息生成单元21保持用于指示哪个编号的元素是当前元素的计数器i，并且在开始对新帧的音频信号进行编码的时间点处，计数器i的值是0。

如果在步骤S12中确定计数器i<元素的数量，即，如果针对当前帧不是所有的元素未被处理，那么处理行进至步骤S13。

在步骤S13中，标识信息生成单元21确定作为当前元素的第i个元素是否是不需要被编码的元素。

例如，如果当前元素的音频信号的幅度在有些时候不大于预定阈值，那么标识信息生成单元21确定该元素的音频信号为无声的或可以被视为无声的，并且该元素因此不需要被编码。

在这种情况下，当构成元素的音频信号是两个通道的音频信号时，如果两个音频信号两者都为无声的或可以被视为无声的，那么确定该元素不需要被编码。

例如，如果音频信号的幅度仅在某一时候大于预定阈值并且在当时的幅度部分是噪声，那么该音频信号可以被视为无声的。

此外，例如，如果音频信号的幅度(声音音量)远远小于另一通道中的相同帧的音频信号的幅度，并且如果该音频信号的声源位置接近该另一通道的另一音频信号的声源位置，那么该音频信号可以被视为无声的并且可以不被编码。换言之，如果输出比低音量的音频信号更大声音的声源接近于该音频信号的声源，那么来自该声源的音频信号可以被视为无声信号。

在这样的情况下，基于音频信号的声源位置与另一音频信号的声源位置之间的距离，以及基于音频信号和另一音频信号的水平(幅度)，来确定音频信号是否是可被视为无声的信号。

如果在步骤S13中确定当前元素是不需要被编码的元素，那么标识信息生成单元21将元素的标识信息ZeroChan[i]的值设置为“1”，并且在步骤S14中将该值提供给编码单元22和打包单元23。因此，生成值为“1”的标识信息。

在针对当前元素生成标识信息之后，计数器i增加1，然后处理返回至步骤S12并且重复上述的处理。

如果在步骤S13中确定当前元素不是不需要被编码的元素，那么标识信息生成单元21将元素的标识信息ZeroChan[i]的值设置为“0”，并且在步骤S15中将该值提供给编码单元22和打包单元23。因此，生成值为“0”的标识信息。

如果在步骤S12中确定不满足计数器i<元素的数量，那么处理返回至步骤S11并且重复上述的处理。

此外，如果在步骤S11中确定不存在输入数据，即，如果针对所有帧中的每一帧已经生成元素的标识信息，那么标识信息生成处理结束。

如上所述，编码器11基于音频信号确定是否要对每个元素的音频信号进行编码，并且生成每个元素的标识信息。由于以此方式针对每个元素生成标识信息，所以可以减少要被传输的比特流的数据量，并且可以改善传输效率。

<编码处理的说明>

此外，将参照图10描述编码器11对音频信号进行编码的编码处理。在执行参照图9描述的标识信息生成处理的同时执行该编码处理。

在步骤S41中，打包单元23对从标识信息生成单元21提供的标识信息进行编码。

特别地，打包单元23通过基于一个帧的元素的标识信息在需要时生成其中包含有图6中示出的“3da_fragmented_header”和图7中示出的“3da_fragmented_data”的DSE，来对标识信息进行编码。

在步骤S42中，编码单元22确定是否存在输入数据。例如，如果存在未被处理的帧的元素的音频信号，那么确定存在输入数据。

如果在步骤S42中确定存在输入数据，那么在步骤S43中，编码单元22确定是否满足计数器i<元素的数量。

例如，编码单元22保持用于指示哪个编号的元素是当前元素的计数器i，并且在开始对新帧的音频信号进行编码的时间点处，计数器i的值是0。

如果在步骤S43中确定满足计数器i<元素的数量，那么在步骤S44中，编码单元22确定从标识信息生成单元21提供的第i个元素的标识信息ZeroChan[i]的值是否为“0”。

如果在步骤S44中确定标识信息ZeroChan[i]的值为“0”，即，如果第i个元素需要被编码，那么处理行进至步骤S45。

在步骤S45中，编码单元22对从外部提供的第i个元素的音频信号进行编码。

特别地，时频转换单元31对音频信号执行MDCT(修正离散余弦变换)以将音频信号从时间信号转换成频率信号。

编码单元22还对通过对音频信号进行MDCT而获得的MDCT系数进行编码，并且获得比例因子(scalefactor)、边信息(sideinformation)和量化谱。然后，编码单元22将所获得的比例因子、辅助信息和量化谱作为从对音频信号进行编码而得到的编码数据提供给打包单元23。

在音频信号被编码之后，处理行进至步骤S46。

如果在步骤S44中确定标识信息ZeroChan[i]的值为“1”，即，如果第i个元素不需要被编码，那么处理跳过步骤S45中的处理并且行进至步骤S46。在这种情况下，编码单元22对音频信号不进行编码。

如果在步骤S45中确定音频信号已被编码或者如果在步骤S44中确定标识信息ZeroChan[i]的值为“1”，那么在步骤S46中，编码单元22使计数器i的值增加1。

在计数器i被更新之后，处理返回至步骤S43并且重复上述的处理。

如果在步骤S43中确定不满足计数器i<元素的数量，即，如果已经针对当前帧的所有元素执行编码处理，那么步骤行进至步骤S47。

在步骤S47中，打包单元23对通过对标识信息进行编码而获得的DSE和从编码单元22提供的编码数据进行打包以生成比特流。

特别地，打包单元23针对当前帧生成比特流，该比特流包含存储有编码数据的SCE和CPE、DSE等，并且将比特流提供给输出单元24。此外，输出单元24将从打包单元23提供的比特流输出给解码器。

在输出一个帧的比特流之后，处理返回至步骤S42并且重复上述的处理。

此外，如果在步骤S42中确定不存在输入数据，即，如果针对所有帧生成比特流并且输出比特流，那么编码处理结束。

如上所述，编码器11根据标识信息对音频信号进行编码并且生成包含标识信息和编码数据的比特流。由于以此方式生成包含有多个元素中的编码元素的编码数据以及各个元素的标识信息的比特流，所以可以减少要传输的比特流的数据量。因此，可以改善传输效率。应注意描述了多个通道的标识信息(即多个标识信息数据)被存储在一个帧的比特流中的DSE中的示例。然而，例如，在音频信号不是多通道信号的这样的情况下，一个通道的标识信息(即一条标识信息)可以被存储在一个帧的比特流中的DSE中。

<解码器的示例配置>

接下来，将描述接收从编码器11输出的比特流并且对音频信号进行解码的解码器。

图11是示出应用本技术的解码器的示例配置的图示。

图11的解码器51包括获取单元61、提取单元62、解码单元63以及输出单元64。

获取单元61获取来自编码器11的比特流，并且将比特流提供给提取单元62。提取单元62从获取单元61提供的比特流中提取标识信息、在需要时设置MDCT系数并且将MDCT系数提供给解码单元63、从比特流中提取编码的数据并且将编码的数据提供给解码单元63。

解码单元63对提取单元62提供的编码数据进行解码。此外，解码单元63包括频时转换单元71。频时转换单元71基于由解码单元63对编码数据进行解码而获得的MDCT系数或者从提取单元62提供的MDCT系数来执行IMDCT(修正离散余弦逆变换)。解码单元63将通过IMDCT获得的音频信号提供给输出单元64。

输出单元64将从解码单元63提供的每个通道中的每一帧的音频信号输出给随后的再现装置等。

<解码处理的说明>

随后，将描述解码器51的操作。

当从编码器11传输比特流时，解码器51开始对比特流进行接收和解码的解码处理。

下文中，将参照图12的流程图描述由解码器51执行的解码处理。

在步骤S71中，获取单元61接收从编码器11传输的比特流并且将比特流提供给提取单元62。换言之，比特流被获取。

在步骤S72中，提取单元62从获取单元61提供的比特流的DSE中获取标识信息。换言之，标识信息被解码。

在步骤S73中，提取单元62确定是否存在输入数据。例如，如果存在未被处理的帧，那么确定存在输入数据。

如果在步骤S73中确定存在输入数据，那么在步骤S74中，提取单元62确定是否满足计数器i<元素的数量。

例如，提取单元62保持用于指示哪个编号的元素是当前元素的计数器i，并且在开始对新帧的音频信号进行解码的时间点处，计数器i的值是0。

如果在步骤S74中确定满足计数器i<元素的数量，那么在步骤S75中，提取单元62确定作为当前元素的第i个元素的标识信息ZeroChan[i]的值是否为“0”。

如果在步骤S75中确定标识信息ZeroChan[i]的值为“0”，即，如果音频信号已经被编码，那么处理行进至步骤S76。

在步骤S76中，提取单元62对音频信号，即，作为当前元素的第i个元素的编码数据进行解包。

特别地，提取单元62从元素中读取作为比特流的当前元素的SCE或CPE的编码数据，并且将编码数据提供给解码单元63。

在步骤S77中，解码单元63对从提取单元62提供的编码数据进行解码以获得MDCT系数，并且将MDCT系数提供给频时转换单元71。特别地，解码单元63基于作为编码数据而提供的比例因子、辅助信息和量化谱来计算MDCT系数。

在MDCT系数被计算之后，处理行进至步骤S79。

如果在步骤S75中确定标识信息ZeroChan[i]的值为“1”，即，如果音频信号未被编码，那么处理行进至步骤S78。

在步骤S78中，提取单元62给当前元素的MDCT系数阵列赋予“0”，并且将MDCT系数阵列提供给解码单元63的频时转换单元71。换言之，当前元素的每个MDCT系数被设置为“0”。在这种情况下，在假设音频信号为无声信号的前提下对音频信号进行解码。

在MDCT系数被提供给频时转换单元71之后，处理行进至步骤S79。

在步骤S77或步骤S78中MDCT系数被提供给频时转换单元71之后，在步骤S79中，频时转换单元71基于从提取单元62或解码单元63提供的MDCT系数执行IMDCT处理。特别地，执行音频信号的频时转换，并且获得作为时间信号的音频信号。

频时转换单元71将通过IMDCT处理获得的音频信号提供给输出单元64。输出单元64将从频时转换单元71提供的音频信号输出给随后的部件。

当输出通过解码获得的音频信号时，提取单元62将由提取单元62保持的计数器i增加1，并且处理返回至步骤S74。

如果在步骤S74中确定不满足计数器i<元素的数量，那么处理返回至步骤S73并且重复上述的处理。

此外，如果在步骤S73中确定不存在输入数据，即，如果所有帧的音频信号已被解码，那么解码处理结束。

如上所述，解码器51从比特流中提取标识信息，并且根据标识信息对音频信号进行解码。由于以此方式使用标识信息执行解码，所以不需要的数据不需要被存储在比特流中，可以减少所传输的比特流的数据量。因此，可以改善传输效率。

可以通过硬件或通过软件执行上述的一系列处理。当通过软件执行上述的一系列处理时，构成软件的程序被安装在计算机中。应注意，计算机的示例包括嵌入在专用硬件中的计算机，以及能够通过在计算机中安装各种程序来执行各种功能的通用计算机。

图13是示出根据程序执行上述一系列处理的计算机的硬件的示例结构的框图。

在计算机中，CPU501、ROM502和RAM503经由总线504彼此连接。

输入/输出接口505还连接至总线504。输入单元506、输出单元507、记录单元508、通信单元509和驱动510连接至输入/输出接口505。

输入单元506包括键盘、鼠标、麦克风、图像传感器等。输出单元507包括显示器、扬声器等。记录单元508是硬盘、非易失性存储器等。通信单元509是网络接口等。驱动510驱动可移除介质511，如磁盘、光盘、磁光盘或半导体存储器。

在具有上述结构的计算机中，例如，CPU501经由输入/输出接口505和总线504将记录在记录单元508中的程序加载到RAM503中并且执行程序，进而执行上述的一系列处理。

例如，要由计算机(CPU501)执行的程序可以被记录在作为封装(package)介质等的可移除介质511上，并且由可移除介质511提供。另外，可以经由有线或无线传输介质，如局域网、因特网或数字卫星广播来提供程序。

在计算机中，可以通过将可移除介质511安装在驱动510上来经由输入/输出接口505将程序安装在记录单元508中。另外，可以经由有线或无线传输介质由通信单元509接收程序并且将程序安装在记录单元508中。此外，可以预先将程序安装在ROM502或记录单元508中。

要由计算机执行的程序可以是用于根据本说明书中描述的序列按时间顺序执行处理的程序，或者是用于并行地或在必要时(如响应于调用)执行处理的程序。

此外，本技术的实施方式不限于上述的实施方式，在不脱离本技术的范围的前提下可以对本技术的实施方式进行各种修改。

例如，本技术可以被配置为经由网络由多个装置共享一个功能并且合作处理该一个功能的云计算。

此外，上述流程图中说明的步骤可以由一个装置执行，并且也可以在多个装置之间共享。

此外，当多个处理被包括在一个步骤中时，包括在该步骤中的处理可以由一个装置执行，并且也可以在多个装置之间共享。

此外，本技术可以具有下述配置。

[1]一种编码装置，包括：

编码单元，所述编码单元被配置成：当指示是否要对音频信号进行编码的标识信息是指示要执行编码的信息时对所述音频信号进行编码，以及当所述标识信息是指示不执行编码的信息时对所述音频信号不进行编码；以及

打包单元，所述打包单元被配置成生成比特流，所述比特流包含第一比特流元素，以及多个第二比特流元素或至少一个第三比特流元素，所述第一比特流元素中存储所述标识信息，所述多个第二比特流元素中存储根据所述标识信息编码的一个通道的音频信号，所述至少一个第三比特流元素中存储根据所述标识信息编码的两个通道的音频信号。

[2]根据[1]中所述的编码装置，还包括：标识信息生成单元，所述标识信息生成单元被配置成根据所述音频信号生成所述标识信息。

[3]根据[2]中所述的编码装置，其中，当所述音频信号是无声信号时，所述标识信息生成单元生成指示不执行编码的标识信息。

[4]根据[2]中所述的编码装置，其中，当所述音频信号是能够被视为无声信号的信号时，所述标识信息生成单元生成指示不执行编码的标识信息。

[5]根据[4]中所述的编码装置，其中，所述标识信息生成单元根据所述音频信号的声源位置与另一音频信号的声源位置之间的距离、所述音频信号的水平以及所述另一音频信号的水平来确定所述音频信号是否是能够被视为无声信号的信号。

[6]一种编码方法，包括下述步骤：

当指示是否要对音频信号进行编码的标识信息是指示要执行编码的信息时对所述音频信号进行编码，以及当所述标识信息是指示不执行编码的信息时对所述音频信号不进行编码；以及

生成比特流，所述比特流包含第一比特流元素，以及多个第二比特流元素或至少一个第三比特流元素，所述第一比特流元素中存储所述标识信息，所述多个第二比特流元素中存储根据所述标识信息编码的一个通道的音频信号，所述至少一个第三比特流元素中存储根据所述标识信息编码的两个通道的音频信号。

[7]一种使计算机执行处理的程序，所述处理包括下述步骤：

[8]一种解码装置，包括：

获取单元，所述获取单元被配置成获取比特流，所述比特流包含第一比特流元素，以及多个第二比特流元素或至少一个第三比特流元素，所述第一比特流元素中存储指示是否对音频信号进行编码的标识信息，所述多个第二比特流元素中存储根据指示要执行编码的标识信息而编码的一个通道的音频信号，所述至少一个第三比特流元素中存储根据指示要执行编码的标识信息而编码的两个通道的音频信号；

提取单元，所述提取单元被配置成从所述比特流中提取音频信号和标识信息；以及

解码单元，所述解码单元被配置成对从所述比特流中提取的音频信号进行解码，并且将具有指示不执行编码的标识信息的音频信号作为无声信号来解码。

[9]根据[8]中所述的解码装置，其中，为将所述音频信号作为无声信号来解码，所述解码单元将MDCT系数设置为0，并且执行IMDCT处理以生成所述音频信号。

[10]一种解码方法，包括下述步骤：

获取比特流，所述比特流包含第一比特流元素，以及多个第二比特流元素或至少一个第三比特流元素，所述第一比特流元素中存储指示是否对音频信号进行编码的标识信息，所述多个第二比特流元素中存储根据指示要执行编码的标识信息而编码的一个通道的音频信号，所述至少一个第三比特流元素中存储根据指示要执行编码的标识信息而编码的两个通道的音频信号；

从所述比特流中提取音频信号和标识信息；以及

对从所述比特流中提取的音频信号进行解码，并且将具有指示不执行编码的标识信息的音频信号作为无声信号来解码。

[11]一种使计算机执行处理的程序，所述处理包括下述步骤：

从所述比特流中提取音频信号和标识信息；以及

附图标记列表

11：编码器

21：标识信息生成单元

22：编码单元

23：打包单元

24：输出单元

31：时频转换单元

51：解码器

61：获取单元

62：提取单元

63：解码单元

64：输出单元

71：频时转换单元

Claims

1.一种编码装置，包括：

2.根据权利要求1所述的编码装置，还包括：标识信息生成单元，所述标识信息生成单元被配置成根据所述音频信号生成所述标识信息。

3.根据权利要求2所述的编码装置，其中，当所述音频信号是无声信号时，所述标识信息生成单元生成指示不执行编码的标识信息。

4.根据权利要求2所述的编码装置，其中，当所述音频信号是能够被视为无声信号的信号时，所述标识信息生成单元生成指示不执行编码的标识信息。

5.根据权利要求4所述的编码装置，其中，所述标识信息生成单元根据所述音频信号的声源位置与另一音频信号的声源位置之间的距离、所述音频信号的水平以及所述另一音频信号的水平来确定所述音频信号是否是能够被视为无声信号的信号。

6.一种编码方法，包括下述步骤：

7.一种使计算机执行处理的程序，所述处理包括下述步骤：

8.一种解码装置，包括：

提取单元，所述提取单元被配置成从所述比特流中提取所述音频信号和所述标识信息；以及

解码单元，所述解码单元被配置成对从所述比特流中提取的所述音频信号进行解码，并且将具有指示不执行编码的标识信息的音频信号作为无声信号来解码。

9.根据权利要求8所述的解码装置，其中，为将所述音频信号作为无声信号来解码，所述解码单元将MDCT系数设置为0，并且执行IMDCT处理以生成所述音频信号。

10.一种解码方法，包括下述步骤：

从所述比特流中提取所述音频信号和所述标识信息；以及

对从所述比特流中提取的所述音频信号进行解码，并且将具有指示不执行编码的标识信息的音频信号作为无声信号来解码。

11.一种使计算机执行处理的程序，所述处理包括下述步骤：

从所述比特流中提取所述音频信号和所述标识信息；以及