CN103003877B

CN103003877B - 声音信号处理装置及声音信号处理方法

Info

Publication number: CN103003877B
Application number: CN201180035062.0A
Authority: CN
Inventors: 宫阪修二; 新崎理史; 赤松伸; 山田周平
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Socionext Inc
Priority date: 2010-08-23
Filing date: 2011-08-16
Publication date: 2014-12-31
Anticipated expiration: 2031-08-16
Also published as: US9472197B2; WO2012026092A1; CN103003877A; JPWO2012026092A1; EP2610865B1; EP2610865A1; EP2610865A4; JP5650227B2; US20130144631A1

Abstract

一种声音信号处理装置（100），对将声音信号以帧单位编码而得到的比特流进行处理，比特流按每个帧包含表示声音信号的编码数据、附加数据及属性信息，声音信号处理装置具备：解码部（110），通过将编码数据解码，生成解码信号；加工部（140），对解码信号进行加工；检测部（120），检测属性信息是否发生了变化；以及储存部（130）；在没有检测到变化的情况下，加工部（140）利用所储存的至少两个附加数据，对解码信号进行加工，在检测到变化的情况下，加工部（140）仅利用检测到变化之前的附加数据及检测到变化之后的附加数据的某一方，对解码信号进行加工。

Description

声音信号处理装置及声音信号处理方法

技术领域

本发明涉及对将声音信号编码而得到的比特流进行处理的声音信号处理装置及声音信号处理方法。尤其是，本发明涉及对比特流进行解码、并将解码后的信号利用被解码为该信号的比特流中包含的附加数据进行加工的声音信号处理装置及声音信号处理方法。

背景技术

以往，已知一种声音信号处理装置，该声音信号处理装置将通过对声音信号进行压缩编码而生成的比特流进行解码，从而生成解码信号，并对所生成的解码信号进行规定的处理。

例如，已知将解码信号作为可听信号输出的声音信号再现装置、以及将解码信号按照与该解码信号被编码的编码方式不同的编码方式进行再编码来生成再编码后的信号的代码转换装置等。

以往的声音信号处理装置在比特流以帧单位包含用于对音量较大的部分进行压缩的DRC（Dynamic Range Control：动态范围控制）数据的情况下，利用所包含的DRC数据对解码信号的振幅进行调整。

例如，在专利文献1中，公开了一种根据声音信号的声道数而切换利用了DRC数据的处理（DRC功能）的开启/关闭来进行编码的技术。例如，针对5.1ch的声音信号，通过开启DRC功能，来抑制解码信号的振幅，针对2ch的声音信号，通过关闭DRC功能，不抑制解码信号的振幅。由此，能够防止在声音信号的声道的切换部分，发生急剧的音量变化。

此外，在非专利文献1中，公开了一种在连续的2个帧之间动态范围控制数据发生了变化的情况下，进行DRC数据的平滑的技术。通过对DRC数据进行平滑，能够防止急剧的音量变化。

现有技术文献

专利文献

专利文献1：特开2010-114803号公报

非专利文献

非专利文献1：ISO/IEC14496-3

发明概要

发明要解决的问题

但是，在上述以往技术中，存在如下问题：根据所输入的比特流，本来应压缩为较小振幅的解码信号有时在保持较大振幅的状态下输出。较大振幅的部分（例如，参照图8中的第4帧的部分9a等）会对听者带来不适感，因此，根据以往技术，存在主观性音质劣化的问题。

发明内容

因此，本发明的目的在于，提供一种能够抑制主观性音质劣化（参照图4的不适当的振幅6Bh的声音信号5Bh）来提高音质的声音信号处理装置及声音信号处理方法。

用于解决技术问题的手段

为了实现上述目的，本发明的一方式的声音信号处理装置，对将声音信号以帧单位编码而得到的比特流进行处理，上述比特流按每个帧包含：编码数据，表示被编码的声音信号；附加数据（DRC数据等），涉及通过对上述编码数据进行解码而生成的解码信号的振幅；以及属性信息，表示上述编码数据的性质（表示是立体广播中的数据还是多声道广播中的数据的信息等），上述声音信号处理装置具备：解码部，通过将对象帧的编码数据解码，生成上述解码信号；加工部，对由上述解码部生成的上述解码信号进行加工；检测部，检测在上述对象帧（第一期间的帧）和与该对象帧连续的相邻帧（第二期间的帧）之间，上述属性信息是否发生了变化；以及储存部，用于储存将上述对象帧的附加数据包括在内的至少2个上述附加数据，上述加工部在上述检测部没有检测到变化的情况下（参照图5的期间7A），利用上述储存部所储存的至少2个上述附加数据（利用第二期间的附加数据），对上述对象帧的上述解码信号进行加工（加工为根据第二期间的附加数据决定的振幅的信号），在上述检测部检测到变化的情况下，仅利用上述储存部所储存的附加数据中的、检测到变化之前的至少一个附加数据及检测到变化之后的至少一个附加数据的某一方（不使用第二期间的附加数据），对上述对象帧的上述解码信号进行加工。

根据本结构，在检测到属性信息的变化的情况下，仅利用检测到变化之前的附加数据及检测到变化之后的附加数据中的某一方（不使用第二期间的附加数据），对对象帧的解码信号进行加工。即，不会跨越检测到变化的时刻来使用附加数据。即，不会使用声音信号的性质大不相同的帧的附加数据（与第一期间的第一属性信息不同的第二属性信息的第二期间的附加数据）。因此，能够抑制通过加工而生成的第一期间的、加工后的信号中的主观性音质的劣化。例如，能够防止将本来应压缩为小振幅的解码信号的振幅加工成大振幅（参照图4的振幅6Bh）从而加工成不适当的振幅的情况等。即，能够使加工后的振幅成为适当的振幅（参照图5的振幅6Bi），提高音质。

此外，也可以是，上述相邻帧为上述对象帧的紧前的帧，上述储存部至少储存上述对象帧的附加数据和上述相邻帧的附加数据这2个附加数据，上述加工部在上述检测部没有检测到变化的情况下，利用上述对象帧的附加数据和上述相邻帧的附加数据，对上述对象帧的上述解码信号进行加工，在上述检测部检测到变化的情况下，利用包含上述对象帧的附加数据的、检测到变化之后的至少一个附加数据，对上述对象帧的上述解码信号进行加工。

根据本结构，利用检测到变化之后的至少一个附加数据，而不利用检测到变化之前的性质不同的帧的附加数据。即，利用与对象帧相同性质的帧的附加数据，而不利用性质不同的帧的附加数据，因此能够抑制主观性音质的劣化。

此外，也可以是，上述相邻帧为上述对象帧的紧后的帧，上述储存部至少储存上述对象帧的附加数据和上述相邻帧的附加数据这2个附加数据，上述加工部在上述检测部没有检测到变化的情况下，利用上述对象帧的附加数据和上述相邻帧的附加数据，对上述对象帧的上述解码信号进行加工，在上述检测部检测到变化的情况下，利用包含上述对象帧的附加数据的、检测到变化之前的至少一个附加数据，对上述对象帧的上述解码信号进行加工。

根据本结构，利用检测到变化之前的至少一个附加数据，而不利用检测到变化之后的性质不同的帧的附加数据。即，利用与对象帧相同性质的帧的附加数据，而不利用性质不同的帧的附加数据，因此能够抑制主观性音质的劣化。

此外，也可以是，上述附加数据是用于调整上述解码信号的振幅的DRC数据，上述加工部根据上述DRC数据，使上述对象帧的上述解码信号的振幅增减。

根据本结构，利用DRC数据调整解码信号的振幅，因此能够容易调整所输出的声音信号的音量。

此外，也可以是上述属性信息为表示对应的帧的被编码的声音信号的声道数的信息，上述检测部通过参照上述属性信息，检测在上述对象帧和上述相邻帧之间声音信号的声道数是否发生了变化。

根据本结构，通过判断声道数是相同还是不同，能够容易判断帧的性质是否大为不同。即，在对象帧和相邻帧之间声道数不同的情况下，认为声音内容不同。因此，由于不将声音内容不同的帧的附加数据用于对象帧，所以能够抑制主观性音质的劣化。

此外，也可以是，上述属性信息为表示对应的帧的有无上述附加数据的信息，上述检测部通过参照上述属性信息，检测上述对象帧和上述相邻帧之间的上述附加数据的有无的变化。

根据本结构，通过判断有无附加数据，能够容易判断帧的性质是否大为不同。即，在对象帧和相邻帧之间附加数据的有无不同的情况下，认为声音内容不同。因此，不将声音内容不同的帧的附加数据用于对象帧，从而能够抑制主观性音质的劣化。

此外，也可以是，上述加工部以与上述比特流中包含的帧的帧长度不同的帧长度的帧单位，对上述解码信号进行再编码，在上述检测部没有检测到变化的情况下，利用储存在上述储存部中的至少2个附加数据，生成与再编码后的帧对应的附加数据，在上述检测部检测到变化的情况下，仅利用储存在上述储存部的各附加数据中的、检测到变化之前的至少一个附加数据及检测到变化之后的至少一个附加数据的某一方，生成与再编码后的帧对应的附加数据。

根据本结构，在以不同的帧长度的帧单位对解码信号进行再编码时，能够生成适当的附加数据。例如，能够防止在小振幅用的附加数据本来应被复用的帧上复用大振幅用的附加数据而导致主观性音质劣化的情况。

此外，也可以是，上述属性信息为表示对应的帧的被编码的声音信号的声道数的信息，上述检测部通过参照上述属性信息，检测在上述对象帧和上述相邻帧之间声音信号的声道数是否发生了变化；上述加工部在由上述检测部没有检测到变化、并且上述对象帧和上述相邻帧之间的边界和再编码后的2个帧之间的边界不一致的情况下，作为检测到变化之前的至少一个附加数据及检测到变化之后的至少一个附加数据的某一方而利用声道数较多的一方的附加数据，生成与再编码后的帧对应的附加数据。

根据本结构，在对象帧和相邻帧之间的边界、即检测到属性信息的变化的时刻（变化点）和再编码后的帧之间的边界不一致的情况下，利用声道数较多一方的帧的附加数据，生成与再编码后的帧对应的附加数据。在变化点和再编码后的帧的边界不一致的情况下，性质不同的多个帧被再编码为1个帧。此时，能够通过利用声道数较多一方的帧的附加数据，将小振幅用的附加数据复用为再编码后的帧的附加数据。

此外，也可以是，上述属性信息为表示对应的帧的有无上述附加数据的信息，上述检测部通过参照上述属性信息，检测在上述对象帧和上述相邻帧之间，上述附加数据的有无的变化，上述加工部在由上述检测部检测到变化、并且在上述对象帧和上述相邻帧之间的边界和再编码后的2个帧之间的边界不一致的情况下，作为检测到变化之前的至少一个附加数据及检测到变化之后的至少一个附加数据而利用存在附加数据的一方的附加数据，生成与再编码后的帧对应的附加数据。

根据本结构，在变化点和再编码后的帧的边界不一致的情况下，利用所存在的附加数据生成与再编码后的帧对应的附加数据。在变化点和再编码后的帧的边界不一致的情况下，性质不同的多个帧被再编码为1个帧。此时，通过利用所存在的附加数据，能够将小振幅用的附加数据复用为再编码后的帧的附加数据。

此外，也可以是，上述附加数据为用于调整上述解码信号的振幅的DRC数据，上述加工部根据上述DRC数据，生成用于调整通过将再编码后的帧解码而生成的再解码信号的振幅的DRC数据。

根据本结构，由于将DRC数据复用于再编码后的帧上，因此在将再编码后的帧进一步解码的情况下，能够容易调整所输出的声音信号的音量。

此外，本发明不仅能够实现为声音信号处理装置，还可以实现为以构成该声音信号处理装置的处理单元作为步骤的方法。

发明效果

如上所示，根据本发明的声音信号处理装置及声音信号处理方法，能够抑制主观的音质的劣化（参照图4的不适当的振幅6Bh的声音信号5Bh）来提高音质。

附图说明

图1是示出本发明的实施方式1的声音信号处理装置的结构的一例的框图。

图2是示出向本发明的实施方式1的声音信号处理装置输入的比特流的结构的一例的图。

图3是用于说明使用了本发明的实施方式1的附加数据的音量调整处理的一例的图。

图4是用于说明本发明的实施方式1的声音信号处理装置所解决的问题的图。

图5是用于说明本发明的实施方式1的声音信号处理装置的动作及效果的图。

图6是示出本发明的实施方式1的声音信号处理装置的动作的一例的流程图。

图7是示出本发明的实施方式2的声音信号处理装置的结构的一例的框图。

图8是用于说明解决本发明的实施方式2的声音信号处理装置所解决的问题的图。

图9是用于说明本发明的实施方式2的声音信号处理装置的动作及效果的图。

图10是示出本发明的实施方式2的声音信号处理装置的动作的一例的流程图。

具体实施方式

下面，参照附图，对本发明的声音信号处理装置及声音信号处理方法的实施方式进行详细说明。

(实施方式1)

本发明的实施方式1的声音信号处理装置（声音信号处理装置100）具备：解码部（解码部110），通过对对象帧（例如，图4、图5的第一期间7Aa）的编码数据（参照图1的编码数据110f）进行解码，生成解码信号（图5的第一声音信号3Aa）；加工部（加工部140），对所生成的解码信号（第一声音信号3Aa）进行加工；检测部（检测部120），检测在对象帧（第一期间7Aa，7Ba））和相邻帧（附近的第二期间7Ab、7Bb）之间，属性信息（声音信号的种类是如图5等的例中的多声道广播的声音信号，还是立体广播的声音信号等）是否发生了变化；以及储存部（储存部130），用于储存将对象帧（第一期间7Aa，7Ba）的附加数据包括在内的至少2个以上的附加数据（对象帧的DRC数据4Aa、4Ba，相邻帧的DRC数据4A、4B）。此外，加工部的特征在于，在检测部没有检测到变化的情况下（期间7A的情况），利用储存部中所储存的包括附近的第二期间7Ab的DRC数据4A的至少2个附加数据，对对象帧（第一期间7Aa）的解码信号（第一声音信号3Aa）进行加工，在检测部检测到变化的情况下的情况下（期间7B的情况），仅利用储存部中所储存的附加数据中的、检测到变化之前的至少一个附加数据（DRC数据4B）及检测到变化之后的至少一个附加数据（DRC数据4Ba）中的某一方（若仅利用该一方则不会产生不适当的振幅（参照图4的振幅6Bh）的一方（DRC数据4Ba））（不使用附近的第二期间7Bb的DRC数据4B），对对象帧的解码信号（第一声音信号3Ba）进行加工。

即，例如，检测第一声音信号3Xa的种类（立体广播的声音信号，或者多声道广播）是否是与表示由第一声音信号3Xa所示的声音的第一期间7Xa接近的（类似的、附近的）第二期间7Xb的声音的第二声音信号3Xb的种类相同的种类（图6的S103）。第二声音信号3Xb的DRC数据4是仅在相同种类时，利用该DRC数据4进行的调整后的振幅为适当的振幅（例如图5的振幅6Aa），在不是相同种类时，是不适当振幅（例如图4的振幅6Bh）的DRC数据。此外，仅在检测为相同种类时（S103的“否”，期间7A），控制成所生成的第三声音信号5X（第三声音信号5Aa）的振幅成为根据接近的第二期间7Xb（第二期间7Ab）的DRC数据4（DRC数据4A）决定的振幅（振幅6Aa），生成该振幅的第三声音信号5X，或者进行该生成处理本身。在检测为不是相同种类时（S103的“是”，期间7B），不成为根据接近的第二期间7Xb（第二期间7Bb）的DRC数据4（DRC数据4B）决定的振幅（振幅6Bh），而成为其他振幅（仅根据除了该DRC数据4以外的其他数据（例如仅DRC数据4Ba）决定的振幅）。

由此，不仅仅是在期间7A的情况下，被进行加工后的加工后第三声音信号（第三声音信号5Aa）成为高音质的声音信号。

即，在期间7B的情况下，能够避免加工后的第二声音信号成为较低音质的声音信号（图4的，不适当的振幅6Bh的第二声音信号5Bh），能够成为较高音质的声音信号（图5的，适当的振幅6Bi的第二声音信号5Bi）。

由此，在任何情况下，音质都会高，能够可靠地使音质高。

首先，对本发明的实施方式1的声音信号处理装置的结构进行说明。

图1是示出本发明的实施方式1的声音信号处理装置100的结构的一例的框图。

声音信号处理装置100对将声音信号以帧单位编码而得到的比特流进行处理。

本发明的实施方式1的声音信号处理装置100通过对比特流（比特流100a）进行解码，生成比特流被解码后的解码信号。此外，对所生成的解码信号的音量进行调整，作为可听信号输出调整后的解码信号。

在此，用图2，对输入到声音信号处理装置100中的比特流进行说明。

图2是示出输入到本发明的实施方式1的声音信号处理装置100中的比特流的结构的一例的图。

此外，在图2中，示出构成比特流的多个帧中的1个帧（帧100b）。

比特流的1个帧（帧100b）如图2所示，包含头（头100c）和数据块（数据100d）。在头中，包含信息（属性信息）100e。在数据块中，包含编码数据和附加数据（元数据）（数据（附加数据）110f、110g）。

编码数据是示出编码后的声音信号的数据。即，编码数据表示根据规定的编码标准编码而得到的1帧量的、该1帧量的长度的期间（参照图3的帧2f等）的声音信号。

附加数据是与通过对编码数据进行解码而生成的解码信号的振幅有关的数据。

即，附加数据是用于调整解码信号的振幅的DRC数据等。通过利用DRC数据，能够使解码信号的振幅变大或变小。

属性信息是表示编码数据的性质的信息。

例如，属性信息表示与该属性信息对应的帧（包括包含该属性信息的头的帧）的、编码之后的声音信号的声道数。

具体而言，属性信息表示声音信号是多声道广播（5.1ch，7.1ch等），还是立体广播（2ch）。

如上所示，比特流包含按每个帧划分的编码数据（数据110f），并且分别包含与该比特流所含的1个以上的编码数据中的各编码数据对应的附加数据和属性信息。

此外，图2所示的属性信息及附加数据在帧内的位置只是一例，不限定于该例。例如，也可以在头中包含附加数据，此外，也可以在附加数据中包含属性信息。并且，也可以在头和数据块的双方中包含属性信息及附加数据。

返回图1，声音信号处理装置100具备解码部110、检测部120、储存部130以及加工部140。

解码部110通过对对象帧（例如，图3的对象帧2fx）的编码数据进行解码，生成该编码数据被解码后的信号即解码信号（例如，图4的第一声音信号3Ba等）。

检测部120检测在对象帧（例如，图2的帧100m（参照图5的期间7Xa））和与该对象帧连续（相邻）的相邻帧（帧100n（参照图5的期间7Xb））之间，属性信息是否发生了变化。

即，检测部120检测附加数据的属性信息在连续的这些对象帧及相邻帧的2个帧之间是否发生了变化。

例如，检测部120通过参照属性信息，检测在对象帧和相邻帧之间，声音信号的声道数是否发生了变化。

此外，相邻帧例如是在输入顺序或处理顺序上处于对象帧的紧前的帧（紧前帧）。

储存部130是用于储存将对象帧的附加数据包括在内的至少2个附加数据的存储器。具体而言，储存部130至少储存对象帧的附加数据（图1所示的帧100m的附加数据131m）和相邻帧的附加数据（帧100n的附加数据131n）这2个附加数据。

加工部140对由解码部110生成的信号（解码信号）110a（图1）进行加工。

具体而言，当检测部120在对象帧和相邻帧之间没有检测到属性信息的变化的情况下，加工部140进行下面的动作。

在该动作中，使用储存在储存部130中的至少2个附加数据的双方，对对象帧的解码信号进行加工。

此外，当检测部120在对象帧和相邻帧之间检测到属性信息的变化的情况下，加工部140进行下述动作。

在该动作中，仅利用储存在储存部130的附加数据中的检测到变化之前的至少一个附加数据、以及检测到变化之后的至少一个附加数据的某一方，对对象帧的解码信号进行加工。

在本发明的实施方式1中，加工部140具备图1所示的音量调整部141。

音量调整部141利用附加数据，调整对象帧的解码信号的音量。

例如，音量调整部141利用对象帧的DRC数据（附加数据110g），计算音量调整用系数，并利用所计算的系数，调整对象帧的解码信号的振幅。

此外，在对象帧的DRC数据（附加数据131m）和紧前帧的DRC数据（附加数据131n）不同的情况下，音量调整部141对对象帧的DRC数据和紧前帧的DRC数据进行平滑，由此计算出音量调整用系数。此外，音量调整部141利用所计算的系数，调整对象帧（帧100m）的解码信号的振幅。

下面，用图3对使用了附加数据的音量调整处理进行详细说明。

图3是用于说明本发明的实施方式1的使用了附加数据的音量调整处理的一例的图。

在图3所示的例中，信号（解码信号）110a包含多声道广播的声音信号（声音信号110P等）和立体广播的声音信号（声音信号110q等）。

解码信号按每个帧被划分，各帧（帧2f）包含DRC数据（DRC数据110s、110t等），作为附加数据（元数据、附加数据110g）。

在多声道广播的帧（信号110P的帧2f）的情况下，该帧的DRC数据（附加数据）是使解码信号的振幅变小的小振幅用的DRC数据。

此外，在立体广播的帧（信号110q的帧2f）的情况下，该帧的DRC数据（附加数据）是使解码信号的振幅变大的大振幅用的DRC数据。

在立体广播的情况下，通常利用2个扬声器，相对于此，在多声道广播的情况下，利用更多的扬声器，例如6个扬声器等。因此，当输出同一振幅的解码信号时，多声道广播的声音较大。因此，以使多声道广播的解码信号的振幅变小的方式附加DRC数据。

这样，在图3所示的例中，在多声道广播（或立体广播）的声音信号中共同地被附加了小振幅用的DRC数据（或大振幅用的DRC数据）。

此外，这些仅仅是一例，在多声道广播的声音信号内，也可以附加相互不同的2个DRC数据。即，能够对每个帧自由设定DRC数据。

例如，音量调整部141（图1）通过使用小振幅用的DRC数据，能够使解码信号的振幅相比使用大振幅用的DRC数据的情况小。

在时间上连续的2个帧（例如，对象帧和相邻帧）之间，DRC数据相互不同的情况下，音量调整部141对DRC数据进行平滑（同时参照图4的平滑4x）。由此，能够使音量平滑地变化。

例如，在调整图3所示的对象帧（对象帧2fx）的音量的情况下，音量调整部141对对象帧的DRC数据（大振幅用）和紧前的帧（相邻帧2fｙ）的DRC数据（小振幅用）进行平滑。

所谓平滑（smoothing），例如指如下的处理等。即，在该处理中，对帧内的最初的样本使用紧前的帧的DRC数据，对帧内的最后的样本使用对象帧的DRC数据。此外，对剩余的样本，设为最初的样本中的振幅和最后的样本中的振幅之间的中间振幅的处理，以使得振幅变平滑。

如上所示，在DRC数据发生变化的情况下，通过对变化之前的DRC数据和变化之后的DRC数据进行平滑，能够使音量平滑地变化。

但是，例如，若对如图4所示的解码信号进行DRC数据的平滑，则存在本来应该压缩为较小振幅的解码信号以较大振幅（参照不适当的振幅6Bh）状态输出的问题。

图4所示的解码信号在立体广播的声音信号的4个区间中在最初和最后的区间含有无声的帧。例如，有时在电影等多声道广播之间插入CM（广告）等的立体广播。

如图4所示，对象帧的DRC数据和紧前的帧的DRC数据不同，因此音量调整部141对这些DRC数据进行平滑。

由此，多声道广播的对象帧（参照期间7Ba）本来应该是音量被调整成小振幅的帧，但是如图4所示，解码信号的振幅被调整为从大振幅变成小振幅。由此，从无声状态突然输出较大振幅的解码信号，因此，该部分的解码信号由听者听起来是不舒适的声音。

即，仅仅对DRC数据进行平滑是不能防止主观性音质的劣化。

相对于此，本发明的实施方式1的声音信号处理装置100检测属性信息的变化，在属性信息发生了变化的情况下（后述的图6的是），仅利用检测到变化前及检测到变化后的某一方（是若仅使用该一方则不发生不适当的振幅6Bh的一方）的DRC数据，来调整解码信号的振幅。

即，声音信号处理装置100在用于平滑的多个DRC数据跨过属性信息变化的时刻（变化点）的情况下，不将多个DRC数据跨过变化点来使用。

由此，在因属性信息发生变化而解码信号本身发生较大变化的部分，不进行与不同的属性信息对应的DRC数据的平滑，所以能够防止输出具有不协调感的声音。

此外，本发明的实施方式1的声音信号处理装置100在属性信息不发生变化的情况下，进行DRC数据的平滑。由此，能够防止音量急剧变化。

接着，对本发明的实施方式1的声音信号处理装置100的具体动作进行说明。

图5是用于说明本发明的实施方式1的声音信号处理装置100的动作及效果的图。

在本实施方式中，在检测部120没有检测到变化的情况下（参照期间7A等），加工部140利用对象帧的附加数据和紧前的帧即相邻帧（紧前帧）的附加数据，对解码信号进行加工。具体而言，加工部140所具备的音量调整部141对对象帧的DRC数据和紧前帧的DRC数据进行平滑。此外，在图5中，在DRC数据4A和DRC数据4Aa上施加的阴影线的图案相互不同。即，例如，图5的DRC数据4A和DRC数据4Aa在某种程度上也可以不同。可以认为通过图案不同来示意性地示出这一点。

此外，在检测部120检测到变化的情况下（参照期间7B等），加工部140利用将对象帧的附加数据包括在内的检测到变化之后的至少一个附加数据，对解码信号进行加工。

例如，在图5所示的例中，在对象帧A与紧前帧A之间，以及对象帧B与紧前帧B之间，属性信息发生了变化。

具体而言，紧前帧A的属性信息表示紧前帧A为多声道广播，对象帧A的属性信息表示对象帧A为立体广播。

同样，紧前帧B的属性信息表示紧前帧B为立体广播，对象帧B的属性信息表示对象帧B为多声道广播。

因此，音量调整部141在对对象帧A的解码信号进行加工时，利用作为检测到变化之后的帧的对象帧A的DRC数据进行音量调整。

同样，音量调整部141在对对象帧B的解码信号进行加工时，利用作为检测到变化之后的帧的对象帧B的DRC数据进行音量调整。

此时，由于不使用紧前帧B的DRC数据，因此对于对象帧B只使用小振幅用的DRC数据。由此，如图4所示，能够使得不发生振幅较大的声音信号（声音信号5Bh）。

此外，加工部140在对对象帧B进行加工时，也可以使用对象帧B的附加数据。

即，加工部140只要不使用属性信息的变化点之前的帧、具体而言对象帧B之前的帧的附加数据就可以，可以使用属性信息的变化点之后的帧的附加数据。

图6是示出本发明的实施方式1的声音信号处理装置100的动作的一例的流程图。

首先，解码部110通过对1帧的编码数据进行解码，生成解码信号（S101）。即，解码部110对对象帧的编码数据进行解码。

接着，储存部130储存对象帧的附加数据（S102）。

接着，检测部120检测属性信息是否发生了变化（S103）。

具体而言，检测部120检测在紧前帧和对象帧之间，属性信息是否发生了变化。

换言之，检测部120检测紧前帧的属性信息和对象帧的属性信息相同还是不同。

在本实施方式中，检测部120例如通过参照属性信息，检测紧前帧的声道数和对象帧的声道数是否相同。

若紧前帧的声道数和对象帧的声道数相同，则检测部120判断为属性信息没有变化，若不同，则判断为属性信息发生了变化。

在没有检测到属性信息的变化的情况下（S103中否），音量调整部141对附加数据进行平滑，制作音量调整用系数（S104）。此外，在紧前帧的DRC数据和对象帧的DRC数据相互相同时，不需要进行平滑。

在检测到属性信息的变化的情况下（S103中是），音量调整部141仅使用检测到该变化后的附加数据，制作音量调整用系数（S105）。

具体而言，如图5所示，音量调整部141仅使用对象帧的DRC数据，制作音量调整用系数。

最后，音量调整部141使用所制作的系数来调整解码信号的振幅，由此调整声音信号处理装置100所输出的声音信号的音量（S106）。

若不是所有帧的处理完成（S107中否），则声音信号处理装置100重复进行上述处理（返回S101）。

如上所示，本发明的实施方式1的声音信号处理装置100检测属性信息的变化（例如，图5的期间7B中的变化等），在检测到变化的情况下，仅使用变化前的至少一个附加数据（例如DRC数据4B）和变化后的至少一个附加数据（例如DRC数据4Ba）的某一方（是若仅使用该一方则能够避免不适当的振幅6Bh的一方）（例如，仅使用DRC数据4Ba），将解码信号（声音信号3Ba）加工成加工后的信号（声音信号5Bi）。

由此，能够禁止将用于加工与对象的声音信号（声音信号3Ba）的属性信息（多声道广播中的属性信息）不同的属性信息（立体广播中的属性信息）的声音信号（声音信号3Bb）的附加数据（DRC数据4B），用于对象的声音信号（声音信号3Ba）的加工。因此，能够禁止本来应加工成小振幅的声音信号被加工为大振幅（参照图4的声音信号5Bh），因此能够防止主观性的音质的劣化。

此外，属性信息也可以是表示有无附加数据的信息。换言之，属性信息也可以是表示编码数据是否与附加数据建立了对应的信息。此外，此时，如图2所示，属性信息既可以包含在帧的头中，或者也可以包含在数据块中。

此时，检测部120通过参照属性信息，在对象帧和相邻帧之间检测附加数据的有无的变化。例如，有时多声道广播的帧包含附加数据，立体广播的帧不包含附加数据。

例如，如上所示，在对象帧的附加数据和紧前帧的附加数据不同的情况下，音量调整部141通过对这2个附加数据进行平滑，计算出音量调整用系数。此外，利用所计算的系数，调整对象帧的振幅。关于进行这种处理的情况，下面进行更具体的说明。

在没有对象帧的附加数据、而有紧前帧的附加数据、并且检测部120检测到对象帧和紧前帧之间的属性信息的变化的情况下，如上所示，加工部140利用对象帧的附加数据，对解码信号进行加工。但是，此时，由于没有对象帧的附加数据，结果，加工部140不进行对象帧的解码信号的加工。

由此，能够防止如图4所示的问题中那样在加工对象帧的解码信号时使用紧前帧的附加数据，所以能够抑制音质的劣化。

此外，属性信息只要是表示在属性信息发生了变化的情况下（参照S103的“是”）声音信号的性质大为不同的情况的信息就可以。换言之，属性信息只要是表示声音内容的切换的信息就可以。例如，属性信息可以是表示采样频率、量化比特数或编码方式等的信息。

此外，相邻帧也可以是对象帧紧后的帧（紧后帧）。即，加工部140也可以利用对象帧的附加数据和紧后帧的附加数据，对解码信号进行加工。具体而言，在对象帧的DRC数据和紧后帧的DRC数据不同的情况下，音量调整部141通过对对象帧的DRC数据和紧后帧的DRC数据进行平滑，计算出音量调整用系数。此外，音量调整部141利用所计算的系数，调整对象帧的解码信号的振幅。

此外，此时，检测部120检测在对象帧和紧后帧之间，属性信息是否发生了变化。换言之，检测部120检测对象帧的属性信息和紧后帧的属性信息相同还是不同。

在检测部120检测到变化的情况下，加工部140利用检测到变化之前的至少一个附加数据，对解码信号进行加工。具体而言，音量调整部141利用对象帧的DRC数据，调整解码信号的振幅。

此外，在检测部120没有检测到变化的情况下，加工部140利用对象帧的附加数据和对象帧的附加数据以外的附加数据，对对象帧的解码信号进行加工。具体而言，音量调整部141可以通过对对象帧的DRC数据和紧后帧的DRC数据进行平滑，计算音量调整用系数，利用所计算的系数，调整对象帧的解码信号的振幅。

如上所示，在本发明的实施方式1的声音信号处理装置中，用于平滑的DRC数据可以是紧前帧的DRC数据，也可以是紧后帧的DRC数据。

此外，这样，例如也可以进行下面的动作。

在该动作中，决定振幅（例如图5的振幅6Aa）。

此外，执行如下控制，该控制使得生成表示第一期间（例如第一期间7Aa）的声音的第一声音信号（第一声音信号3Aa）的振幅变更为所决定的振幅（振幅6Aa）的第三声音信号（第三声音信号5Aa）。

在决定振幅（振幅6Aa）时，根据与第一期间（第一期间7Aa）接近的（类似的、附近的）第二期间（例如第二期间7Ab）的第二声音信号（第二声音信号3Ab）的DRC数据（DRC数据4A）来决定。

此外，例如也可以是，第一声音信号是表示第一期间的声音的一方，而第二声音信号表示其他的第二期间的声音。

此外，与一方的期间接近的另一方的期间例如是指该期间的任何时刻都是包含于一方的期间附近的时刻的期间等。

具体而言，也可以根据包含该DRC数据的1个以上的数据（例如，2个DRC数据4A、4Aa）来决定。

但是，可以认为并不仅限于存在上述的被根据该声音信号的DRC数据来决定的第二声音信号（第二声音信号3Xb（例如3Ab））的种类（立体广播）为与第一声音信号（第一声音信号3Xa（3Aa））的种类（立体广播）相同的种类（立体广播）的情况（期间7A的情况）。

也就是说，可以认为还存在第二声音信号（第二声音信号3Xb（例如3Bb））的种类（立体广播）是与第一声音信号（第一声音信号3Xa（3Ba））的种类（多声道广播）不同的种类（立体广播）的情况（期间7B的情况）。

即，可以认为仅在为相同种类的情况下（期间7A的情况），根据第二声音信号（第二声音信号3Ab）的DRC数据（DRC数据4A）进行的决定中所决定的振幅（振幅6Aa）为适当的振幅，所生成的该振幅的第三声音信号（第三声音信号5Aa）的音质较高。

也就是说，可以认为在为不同种类的情况下（期间7B的情况），根据第二声音信号（第二声音信号3Bb）的DRC数据（DRC数据4B）进行的决定中所决定的振幅为不适当的振幅（图4的振幅6Bh），该振幅的第三声音信号（图4的第三声音信号5Bh）的音质较低。

因此，也可以判断（检测）第二声音信号（第二声音信号3Xb）的种类是相同的种类（第二声音信号3Ab），还是不同的种类（第二声音信号3Bb）（图6的S103）。

仅在判断为相同种类的情况下（第二声音信号3Ab，S103的“否”），根据附近的第二期间（期间7Ab）的DRC数据（DRC数据4A）进行决定。由此，仅在此情况下（S103的“否”，期间7A），所决定的振幅是根据附近的DRC数据（DRC数据4A）决定的振幅（振幅6Aa）（S104、S106）。

也就是说，在判断为不同种类的情况下（第二声音信号3Bb，S103的“是”），不进行根据附近的第二期间（期间7Bb）的DRC数据（DRC数据4B）的决定。由此，在该情况下（S103的“是”，期间7B），所决定的振幅不是根据附近的DRC数据（DRC数据4B）决定的振幅（图4的不适当的振幅6Bh），而是该振幅以外的其他振幅（图5的适当的振幅6Bi）（S105，S106）。

由此，不仅在相同种类的情况下（期间7A的情况）为适当的振幅（振幅6Aa）、音质高，而且在不同种类的情况下（期间7B的情况），也能够避免不适当的振幅（图4的振幅6Bh）而成为适当的振幅（图5的振幅6Bi）。由此，振幅能够更可靠地成为适当的振幅。

此外，也可以生成利用该DRC数据（例如，后述的图7的DRC数据241a、图9的DRC数据9ni等）进行的振幅的调整中的调整后的振幅为所生成的第三声音信号（参照图9的声音信号5Bi的期间7Bq的部分、图5的第三声音信号5Aa、5Bi）的振幅的DRC数据（例如图7的DRC数据241a）。

利用所生成的DRC数据进行的调整的调整后的振幅也可以是所决定的振幅（参照前述的振幅6Aa、6Bi）。

这样，通过生成DRC数据（DRC数据241a），所生成的第三声音信号的振幅也可以控制成利用该DRC数据进行的调整后的振幅。

此外，所生成的第三声音信号也可以具有对应的DRC数据。此外，第三声音信号的振幅也可以通过成为利用对应的DRC数据进行的调整后的振幅而成为上述的适当的振幅。

此外，也可以进行包含第一、第二声音信号的信号被编码而得到的、再编码前的编码信号（例如，要由后述的图7中的声音信号处理装置200解码的比特流（参照前述的比特流100a））的处理。

也就是说，这种再编码前的编码信号也可以再编码为将包含第三声音信号的信号编码而得到的、再编码后的编码信号（参照图7的编码信号9a）。

此外，也可以将再编码后的编码信号解码（decode）为包含第三声音信号的信号，生成包含第三声音信号的信号，由此生成第三声音信号。

此外，这样，也可以在再编码之后进行的解码中生成第三声音信号时，控制成所生成的第三声音信号的振幅成为上述的适当的振幅。

此外，也可以有多个第二期间（参照图9所示的2个期间7Bb），并且有各个第二期间的DRC数据（DRC数据4Ba、4B）。

此外，也可以有各个第二期间的第二声音信号（参照2个第二声音信号3Bb）。

此外，也可以是，关于各个第二声音信号的种类，判断该种类（左侧的第二声音信号3Bb中的多声道广播的种类、右侧的第二声音信号3Bb中的立体广播的种类）是与第一期间（例如，包含在图9的期间7Ba中的期间7Bq）中的第一声音信号的种类（期间7Bq中的多声道广播的种类）相同的种类（参照左侧的声音信号3Bb）、还是不同的种类（参照右侧的声音信号3Bb）。

也可以根据包含判断为相同的种类的各个第二声音信号（左侧的第二声音信号3Bb）的DRC数据（DRC数据4Ba）、不包含判断为不同的种类的各个第二声音信号（右侧的第二声音信号3Bb）的DRC数据（DRC数据4B）的0个以上的DRC数据（1个DRC数据4Ba）来进行处理。

也就是说，也可以根据该0个以上的DRC数据，决定所生成的第三声音信号（例如，声音信号5Bi中的期间7Bq的部分，或者作为该声音信号5Bi的期间的期间7Ba整体的该声音信号5Bi）的振幅。

此外，也可以如上所示，例如，一个种类的声音信号为立体广播的声音信号，与一个种类不相同的、不同的另一个种类的声音信号为多声道广播的声音信号。

此外，也可以是，一个种类声音信号的采样频率与不同的另一个种类的声音信号中的采样频率不同。

同样，例如也可以是，量化比特数不同，编码方式等不同。

此外，在根据附近的第二期间的DRC数据决定振幅时，例如，也可以进行与非专利文献1所示的平滑的处理同样的处理（参照图4的平滑4x）。

在振幅的决定中，也可以决定第一期间（例如，参照图4中的第一期间7Ba）中的各个时刻的振幅，来决定1个以上的时刻的振幅。

此外，作为DRC数据，可以有根据该DRC数据决定的振幅较小的小振幅用的DRC数据（参照图9的DRC数据4Ba）、以及根据该DRC数据决定的振幅较大的大振幅用的DRC数据（参照图9的DRC数据4B）。

也就是说，也可以存在第一声音信号中的第一期间（例如，图9的期间7Bq）的DRC数据为小振幅用的DRC数据（DRC数据4Ba）的第一情况、以及第一声音信号中的第一期间（例如，图9的期间7Bq）的DRC数据为大振幅用的DRC数据（DRC数据4B）的第二情况。

此外，也可以仅在第一情况（小振幅用的情况）下，发生音质的降低（例如，产生恶劣影响程度的降低幅度较大的降低等），在第二情况（大振幅用的情况）下不发生音质的降低。

此外，也可以判断是第一情况还是第二情况。

此外，也可以是，仅在判断为第一情况（小振幅用的情况）时，进行上述的处理。由此，能够维持音质的提高。

此外，也可以是，在判断为第二情况（大振幅用的情况）时，不进行上述的处理。

由此，处理量能够变少。

由此，能够在维持音质的提高的同时，处理量变少，能够同时实现较高的音质和较少的处理量。

（实施方式2）

在本发明的实施方式2的声音信号处理装置中，加工部以与比特流中包含的帧的帧长度（例如，后述的包含1024个样本的帧的帧长度）不同的帧长度（例如，包含1536个样本的帧中的帧长度）的帧单位，对解码信号进行再编码。本发明的实施方式2的加工部的特征在于，在检测部没有检测到变化的情况下，利用储存在储存部中的至少2个附加数据，生成与再编码后的帧对应的附加数据，在检测部检测到变化的情况下，仅利用储存部所储存的附加数据中的、检测到变化之前的至少一个附加数据及检测到变化之后的至少一个附加数据的某一方（参照前面的说明），生成与再编码后的帧对应的附加数据。

首先，对本发明的实施方式2的声音信号处理装置的结构进行说明。

图7是示出本发明的实施方式2的声音信号处理装置200的结构的一例的框图。

图7所示的声音信号处理装置200与实施方式1的声音信号处理装置100相比，不同的是代替加工部140而具备加工部240。下面，关于与实施方式1相同的点，省略详细的说明，以不同点为中心进行说明。此外，对与图1相同的要素上附加了相同的符号。

本发明的实施方式2的声音信号处理装置200是对以规定的编码方式编码的比特流进行解码，并以不同的编码方式对解码结果进行再编码的代码转换装置。在本实施方式中，说明在被输入的比特流和再编码后的比特流中每1帧的帧长度不同的情况。

加工部240以与比特流中包含的帧的帧长度不同的帧长度的帧单位，对解码信号进行再编码。帧长度例如由1帧所包含的样本数表示。在本发明的实施方式2中，加工部240具备编码部241。

编码部241通过对对象帧的解码信号进行编码，生成再编码后的帧（编码信号9a）。在此，对象帧的帧长度和再编码后的帧长度不同。因此，编码部241在与再编码后的帧长度相当的量的解码信号生成之后，对解码信号进行再编码，由此生成再编码后的帧。

并且，编码部241生成与再编码后的帧对应的附加数据（DRC数据241a）。具体而言，编码部241根据DRC数据，生成用于调整对再编码后的帧进行解码而生成的再解码信号的振幅的DRC数据（DRC数据241a）。

在检测部120没有检测到变化的情况下，编码部241利用储存在储存部130中的至少2个附加数据，生成与再编码后的帧对应的附加数据（DRC数据241a）。此外，在检测部120检测到变化的情况下，编码部241仅利用储存在储存部130中的附加数据中的、检测到变化之前的至少一个附加数据和检测到变化之后的至少一个附加数据的某一方（参照上述的説明），生成与再编码后的帧对应的附加数据。

详细说明属性信息例如表示声音信号的声道数、并且检测部120通过参照属性信息判断在对象帧和相邻帧之间声音信号的声道数是否发生了变化的情况。

在检测部120检测到变化、并且在对象帧与相邻帧之间的边界和再编码帧间的边界不一致的情况下，编码部241利用检测到变化之前的至少一个附加数据和检测到变化之后的至少一个附加数据的某一个中声道数较多的一方的附加数据，生成与再编码后的帧对应的附加数据。

在声道数较多的声音信号中包含小振幅用的附加数据的情况较多。因此，结果，编码部241利用小振幅用的附加数据生成再编码后的附加数据。

下面，对本发明的实施方式2的声音信号处理装置200的动作进行说明。

图8是用于说明本发明的实施方式2的声音信号处理装置200所解决的问题的图。

此外，在图8示出如下情况作为一例：将由多个在每1帧中包含1024个样本的帧构成的输入比特流变换为由多个在每1帧中包含1536个样本的再编码后的多个帧构成的输出比特流。

如图8所示，由于输入比特流的帧长度和输出比特流的帧长度不同，因此编码部241按再编码后的每个帧生成与各个再编码后的帧对应的附加数据（图7的DRC数据241a）。在图8的例中，利用再编码后的帧中包含的与解码信号对应的附加数据，生成新的附加数据。

例如，再编码帧A包括第1帧的解码信号的一部分和第2帧的解码信号。

因此，将与再编码帧A对应的附加数据根据第1帧的附加数据和第2帧的附加数据来生成。

此外，再编码帧B包括第3帧的解码信号和第4帧的解码信号的一部分。

因此，将与再编码帧B对应的附加数据根据第2、第3及第4帧的附加数据来生成。

此外，如实施方式1中也说明的那样，使用第2帧的附加数据是为了防止由紧前的再编码帧引起的急剧变化。

在此，如上所述，在输入比特流和输出比特流中帧长度不同。因此，如图8所示的再编码帧C所示，有时包含不同的属性信息的多个帧（第4、第5帧）。此时，如在实施方式1中说明，在第4帧和第5帧之间检测出属性信息的变化。因此，加工部240利用第5帧，生成再编码帧C的附加数据（DRC数据9nh）。此时，大振幅用的DRC数据（DRC数据4B）被复用为再编码帧C的附加数据。

因此，在对再编码帧C进行解码的情况下，本来应该是小振幅的多声道广播的解码信号的振幅如图8所示成为大振幅（再编码帧C的再解码信号、声音信号5Bh、声音信号5Bh中的期间7Bq的部分9a）。

这样，在对象帧与相邻帧之间的边界和再编码后的帧间的边界不一致的情况下，存在在本来应被复用小振幅用的附加数据的帧上复用大振幅用的附加数据从而导致主观性的音质劣化的问题。

图9是用于说明本发明的实施方式2的声音信号处理装置200的动作及效果的图。

在本发明的实施方式2的声音信号处理装置200中，检测部120通过参照属性信息，检测声音信号的声道数是否发生了变化。此外，在检测到声道数的变化、并且检测到该变化的时刻的紧前帧与对象帧之间的边界和再编码后的帧的边界不一致的情况下，加工部240使用声道数较大的一方的帧的附加数据（DRC数据4Ba），生成与再编码帧对应的附加数据（DRC数据9ni）。

具体而言，如图9所示，将与再编码帧C对应的附加数据仅参照第4帧的附加数据（DRC数据4Ba）来生成。由此，能够使多声道广播的声音信号的振幅为小振幅。

图10是示出本发明的实施方式2的声音信号处理装置200的动作的一例的流程图。

首先，声音信号处理装置200设定代码转换处理所需要的参数（S201）。

例如，声音信号处理装置200具备对该声音信号处理装置200整体进行控制的控制部（图7中未图示），该控制部将储存帧数K和属性信息变化标志Z均设定为0。

此外，储存帧数K是表示储存在用于暂时存储解码信号的存储器（图7中未图示）中的帧的个数的参数。

属性信息变化标志Z是表示在连续的2个帧间属性信息是否发生了变化的参数。具体而言，若Z=0，则表示属性信息没有发生变化，若为Z=1，则表示属性信息发生了变化。

接着，解码部110通过对1帧的编码数据进行解码，生成解码信号（S202）。

即，解码部110对对象帧的编码数据进行解码。

所生成的对象帧的解码信号被储存到上述存储器中。

接着，储存部130储存对象帧的附加数据（S203）。

此外，由于1帧的解码完成，因此声音信号处理装置200使储存帧数K增加（S204）。

接着，检测部120检测属性信息是否发生了变化（S205）。

具体而言，检测部120检测在紧前帧和对象帧之间，属性信息是否发生了变化。即，检测部120检测紧前帧的属性信息和对象帧的属性信息是相同还是不同。

在本实施方式中，检测部120通过参照属性信息，检测紧前帧的声道数和对象帧的声道数是否相同。若紧前帧的声道数和对象帧的声道数相同，则检测部120判断为属性信息没有发生变化（参照图8的期间7A），若不同，则判断为属性信息发生了变化（参照期间7B）。

在检测到属性信息的变化的情况下（S205中“是”，期间7B），声音信号处理装置200将属性信息变化标志Z设定为1（S206）。

接着，编码部241判断是否生成了、即存储器中是否保存有足够进行再编码的解码信号（S207）。

具体而言，编码部241判断是否生成了帧长度为再编码处理的帧长度以上的解码信号。

例如，编码部241判断是否满足K×Ld≥Le。在此，Ld是再编码前的帧长度（具体而言，输入比特流的帧长度），Le是再编码后的帧长度（具体而言，输出比特流的帧长度）。

接着，在检测到了属性信息的变化的情况下、即在属性信息变化标志Ｚ为1的情况下（S208中是，期间7B），声音信号处理装置200将属性信息变化标志Ｚ复位到0（S209）。此外，属性信息变化标志Ｚ的复位只要在接下来帧的处理开始之前进行就可以。

此外，在检测到变化前的声道数大于检测到变化后的声道数的情况下（S210中是），编码部241利用检测到变化前的附加数据（例如，DRC数据4Ba），生成用于复用到输出比特流上的再编码用的附加数据（DRC数据9ni）（S211）。

另一方面，在检测到变化前的声道数小于检测到变化后的声道数的情况下（S210中否），编码部241利用检测到变化的附加数据，生成用于复用到输出比特流上的再编码用的附加数据（S212）。

这样，编码部241利用附加在声道数较大的一方的解码信号上的附加数据，生成与再编码后的帧对应的附加数据。

在没有检测到属性信息的变化的情况下，即在属性信息变化标志Ｚ为0的情况下（S208中否，期间7Aa），编码部241利用储存部130中所储存的附加数据（例如，2个DRC数据4A、4Aa的双方），生成用于复用到输出比特流上的再编码用的附加数据（S213）。

在与再编码后的帧对应的附加数据的生成完成之后，编码部241对1帧的解码信号进行编码（S214）。

若不是所有帧的处理完成（S215中否），则声音信号处理装置200将储存帧数K的值从当前的K的值置换为减去Le/Ld后的值（S216）。此外，重复上述的处理（返回S202）。

如上所示，在本发明的实施方式2的声音信号处理装置200中，以与比特流中包含的帧的帧长度不同的帧长度的帧单位，对解码信号进行再编码。此时，在检测部120检测到属性信息的变化、并且对象帧与相邻帧之间的边界和再编码后的帧的边界不一致的情况（期间7Ba的情况）下，仅利用检测到变化前及检测到变化后的某一方的附加数据（不使用DRC数据4B，不使用DRC数据4Ba），生成与再编码后的帧对应的附加数据（DRC数据9ni）。

具体而言，利用声道数更大一方的附加数据，生成与再编码后的帧对应的附加数据。

由此，能够防止本来应该被复用小振幅用的附加数据的帧（参照图8中的期间7Ba的帧）上复用大振幅用的附加数据（图8的DRC数据9nhを参照）而导致主观的音质劣化。

此外，与实施方式1同样，属性信息也可以是表示有无附加数据的信息。换言之，属性信息也可以是表示编码数据是否与附加数据建立了对应的信息。

并且，编码部241在检测部120检测到变化、并且对象帧与相邻帧之间的边界和再编码后的帧间的边界不一致的情况下，作为检测到变化之前的至少一个附加数据及检测到变化之后的至少一个附加数据某一方而利用存在附加数据的一方的附加数据，生成与再编码后的帧对应的附加数据。由此，由于利用所存在的附加数据，因此能够将小振幅用的附加数据作为再编码后的帧的附加数据来复用。

此外，也可以像这样作为附近的第二期间有2个以上的第二期间（第二期间7Bb），根据各个第二期间的DRC数据（DRC数据4B、4Ba）所包含的2个以上的DRC数据，来决定所生成的第三声音信号（例如，期间7Ba的声音信号5Bi中的期间7Bq的部分的声音信号，或声音信号5Bi本身等）的振幅。

此外，第三声音信号的期间（例如期间7Bq）也可以不同于这些2个以上的DRC数据的期间中的1个以上的期间中的各期间。

即，例如，第三声音信号的期间的长度（期间7Bq的长度、期间7Ba的长度、例如图9的例中的1536个样本中的长度）也可以不同于这些2个以上的DRC数据的期间（期间7Bb）中任意期间的长度（1024个样本中的长度）。

此外，更具体而言，如上所示，例如这些2个以上的DRC数据的也可以分别是由声音信号处理装置200进行再编码之前的、再编码前编码信号中的数据。此外，所生成的第三声音信号也可以是上述的再编码前编码信号再编码之后的声音信号。

以上，根据实施方式，对本发明的声音信号处理装置及声音信号处理方法进行了说明，但是本发明不限于这些实施方式。在不超出本发明的主旨的范围内对该实施方式实施本领域技术人员能够想到的各种变形的形态、或组合不同实施方式的结构要素来构建的形态也包含在本发明的范围内。

例如，附加数据也可以是混缩（down mix）系数。混缩系数例如是用于将多声道的声音信号变换为立体的声音信号的参数。

此外，在上述实施方式中，作为对解码信号的加工处理，说明了信号的振幅的调整（音量的调整）及再编码的例子，但是不限于此。

此外，上述实施方式1及2的声音信号处理装置中包含的各处理部典型地可通过集成电路即LSI（Large Scale Integration：大规模集成电路）实现。这些处理部可以分别形成一个芯片，也可以以包含一部分或全部的方式形成一个芯片。

在此，虽然设为LSI，但是有时根据集成度的不同而称为IC（IntegratedCircuit）、系统LSI、超级LSI、特级LSI。

此外，集成电路化不限于LSI，也可以利用专用电路或通用处理器实现。也可以利用在制造LSI之后能够编程的FPGA（Field Programmable GateArray：现场可编程门阵列）或能够重构LSI内部的电路单元的连接或设定的可重构处理器。

并且，若因半导体技术的进步或派生的其他技术而出现能够置换LSI的集成电路化技术，则当然能够利用该技术进行各处理部的集成化。有可能是生物技术的应用等。

此外，也可以通过由CPU（中央处理器）等处理器执行程序来实现本发明的实施方式1及2的声音信号处理装置的功能的一部分或全部。

并且，本发明也可以是上述程序，也可以是记录了上述程序的记录介质。此外，上述程序当然可以通过互联网等传输介质来流通。

此外，在上述中使用的数字全都是为了具体说明所有本发明而例示的，本发明不限于所例示的数字。此外，构成要素间的连接关系是为了具体说明本发明而例示的，用于实现本发明的功能的连接关系不限于此。

并且，上述的实施方式利用硬件及／或软件来构成，但是使用硬件的结构也可以使用软件来构成，使用软件的结构也可以利用硬件来构成。

工业实用性

本发明的声音信号处理装置及声音信号处理方法抑制主观的音质的劣化（参照图4的不适当的振幅6Bh的声音信号5Bh），得到能够提高音质的效果，例如，能够在音频播放器、数字电视机、数字录音机等中提高音质时利用。

附图标记说明

3Aa、3Ab、3Ba、3Bb 声音信号

3Xa、3Xb 声音信号

4、4A、4B、4Aa、4Ba DRC 数据

5X、5Aa、5Bi、5Bh 声音信号

6Bh、6Bi、6Aa 振幅

7Aa、7Ab、7Ba、7Bb 期间

7Xa、7Xb、7A、7B 期间

100、200 声音信号处理装置

100e 信息

110f 编码数据

110g 附加数据

110 解码部

110a 解码信号

120 检测部

130 储存部

140、240 加工部

141 音量调整部

241 编码部

Claims

1.一种声音信号处理装置，对将声音信号以帧单位编码而得到的比特流进行处理，

上述比特流按每个帧包含：

编码数据，表示被编码的声音信号；

附加数据，有关通过将上述编码数据解码而生成的解码信号的振幅；以及

属性信息，表示上述编码数据的性质；

上述声音信号处理装置具备：

解码部，通过将对象帧的编码数据解码，生成上述解码信号；

加工部，对由上述解码部生成的上述解码信号进行加工；

检测部，检测在上述对象帧和与该对象帧连续的相邻帧之间，上述属性信息是否发生了变化；以及

储存部，用于储存将上述对象帧的附加数据包括在内的至少两个上述附加数据；

在上述检测部没有检测到变化的情况下，上述加工部利用上述储存部所储存的至少两个上述附加数据，对上述对象帧的上述解码信号进行加工；

在上述检测部检测到变化的情况下，上述加工部仅利用上述储存部所储存的附加数据中的、检测到变化之前的至少一个附加数据及检测到变化之后的至少一个附加数据的某一方，对上述对象帧的上述解码信号进行加工。

2.根据权利要求1所述的声音信号处理装置，

上述相邻帧是上述对象帧的紧前的帧；

上述储存部至少储存上述对象帧的附加数据和上述相邻帧的附加数据这两个附加数据；

在上述检测部没有检测到变化的情况下，上述加工部利用上述对象帧的附加数据和上述相邻帧的附加数据，对上述对象帧的上述解码信号进行加工；

在上述检测部检测到变化的情况下，上述加工部利用将上述对象帧的附加数据包括在内的检测到变化之后的至少一个附加数据，对上述对象帧的上述解码信号进行加工。

3.根据权利要求1所述的声音信号处理装置，

上述相邻帧是上述对象帧的紧后的帧；

在上述检测部检测到变化的情况下，上述加工部利用将上述对象帧的附加数据包括在内的、检测到变化之前的至少一个附加数据，对上述对象帧的上述解码信号进行加工。

4.根据权利要求1所述的声音信号处理装置，

上述附加数据是用于调整上述解码信号的振幅的动态范围控制数据即DRC数据；

上述加工部基于上述DRC数据，使上述对象帧的上述解码信号的振幅增减。

5.根据权利要求1所述的声音信号处理装置，

上述属性信息是表示对应的帧的被编码的声音信号的声道数的信息；

上述检测部通过参照上述属性信息，检测在上述对象帧与上述相邻帧之间，声音信号的声道数是否发生了变化。

6.根据权利要求1所述的声音信号处理装置，

上述属性信息是表示对应的帧的上述附加数据的有无的信息；

上述检测部通过参照上述属性信息，检测上述对象帧与上述相邻帧之间的上述附加数据的有无的变化。

7.根据权利要求1所述的声音信号处理装置，

上述加工部进行如下处理：

以与上述比特流中包含的帧的帧长度不同的帧长度的帧单位，对上述解码信号进行再编码；

在上述检测部没有检测到变化的情况下，利用上述储存部所储存的至少两个附加数据，生成与再编码后的帧对应的附加数据；

在上述检测部检测到变化的情况下，仅利用上述储存部所储存的各附加数据中的、检测到变化之前的至少一个附加数据及检测到变化之后的至少一个附加数据的某一方，生成与再编码后的帧对应的附加数据。

8.根据权利要求7所述的声音信号处理装置，

上述检测部通过参照上述属性信息，检测在上述对象帧与上述相邻帧之间，声音信号的声道数是否发生了变化；

上述加工部在由上述检测部检测到变化、并且上述对象帧与上述相邻帧之间的边界和再编码后的两个帧之间的边界不一致的情况下，作为检测到变化之前的至少一个附加数据及检测到变化之后的至少一个附加数据的某一方而利用声道数多的一方的附加数据，生成与再编码后的帧对应的附加数据。

9.根据权利要求7所述的声音信号处理装置，

上述检测部通过参照上述属性信息，检测上述对象帧与上述相邻帧之间的、上述附加数据的有无的变化；

上述加工部在由上述检测部检测到变化、并且上述对象帧与上述相邻帧之间的边界和再编码后的两个帧之间的边界不一致的情况下，作为检测到变化之前的至少一个附加数据及检测到变化之后的至少一个附加数据的某一方而利用存在附加数据的一方的附加数据，生成与再编码后的帧对应的附加数据。

10.根据权利要求7所述的声音信号处理装置，

上述加工部基于上述DRC数据，生成用于调整通过将再编码后的帧解码而生成的再解码信号的振幅的DRC数据。

11.一种声音信号处理方法，对将声音信号以帧单位编码而得到的比特流进行处理，

上述比特流按每个帧包含：

编码数据，表示被编码的声音信号；

属性信息，表示上述编码数据的性质；

上述声音信号处理方法包括：

解码步骤，通过将对象帧的编码数据解码，生成上述解码信号；

加工步骤，对在上述解码步骤中生成的上述解码信号进行加工；以及

检测步骤，检测在上述对象帧和与该对象帧连续的相邻帧之间，上述属性信息是否发生了变化；

在上述加工步骤中，

在上述检测步骤中没有检测到变化的情况下，利用将上述对象帧的附加数据包括在内的至少两个上述附加数据，对上述对象帧的上述解码信号进行加工；

在上述检测步骤中检测到变化的情况下，仅利用检测到变化之前的至少一个附加数据及检测到变化之后的至少一个附加数据中的某一方，对上述对象帧的上述解码信号进行加工。