JP6439843B2 - Signal processing apparatus and method, and program - Google Patents

Signal processing apparatus and method, and program Download PDF

Info

Publication number
JP6439843B2
JP6439843B2 JP2017176432A JP2017176432A JP6439843B2 JP 6439843 B2 JP6439843 B2 JP 6439843B2 JP 2017176432 A JP2017176432 A JP 2017176432A JP 2017176432 A JP2017176432 A JP 2017176432A JP 6439843 B2 JP6439843 B2 JP 6439843B2
Authority
JP
Japan
Prior art keywords
frequency
signal
band
low
high frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017176432A
Other languages
Japanese (ja)
Other versions
JP2017223996A (en
Inventor
優樹 山本
優樹 山本
徹 知念
徹 知念
光行 畠中
光行 畠中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2017176432A priority Critical patent/JP6439843B2/en
Publication of JP2017223996A publication Critical patent/JP2017223996A/en
Application granted granted Critical
Publication of JP6439843B2 publication Critical patent/JP6439843B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は信号処理装置および方法、並びにプログラムに関し、特に、符号化された音声信号を復号する場合に、より高音質な音声が得られるようにした信号処理装置および方法、並びにプログラムに関する。   The present invention relates to a signal processing apparatus, method, and program, and more particularly, to a signal processing apparatus, method, and program that can obtain higher-quality sound when an encoded audio signal is decoded.

従来、音声信号の符号化手法として、HE-AAC(High Efficiency MPEG(Moving Picture Experts Group)4 AAC(Advanced Audio Coding))(国際標準規格ISO/IEC14496-3)等が知られている。このような符号化手法では、SBR(Spectral Band Replication)と呼ばれる高域特徴符号化技術が用いられている(例えば、特許文献1参照)。   Conventionally, HE-AAC (High Efficiency MPEG (Moving Picture Experts Group) 4 AAC (Advanced Audio Coding)) (international standard ISO / IEC14496-3) or the like is known as an audio signal encoding method. In such an encoding method, a high-frequency feature encoding technique called SBR (Spectral Band Replication) is used (for example, see Patent Document 1).

SBRでは、音声信号の符号化時に、符号化された音声信号の低域成分(以下、低域信号と称する)とともに、音声信号の高域成分(以下、高域信号と称する)を生成するためのSBR情報が出力される。復号装置では、符号化された低域信号を復号するとともに、復号により得られた低域信号とSBR情報とを用いて高域信号を生成し、低域信号と高域信号からなる音声信号を得る。   In SBR, at the time of encoding an audio signal, a low frequency component (hereinafter referred to as a low frequency signal) of the encoded audio signal and a high frequency component (hereinafter referred to as a high frequency signal) of the audio signal are generated. SBR information is output. The decoding device decodes the encoded low frequency signal, generates a high frequency signal using the low frequency signal obtained by decoding and the SBR information, and generates an audio signal composed of the low frequency signal and the high frequency signal. obtain.

具体的には、例えば、復号により図1に示す低域信号SL1が得られたとする。なお、図1において、横軸は周波数を示しており、縦軸は音声信号の各周波数のエネルギを示している。また、図中、縦方向の点線は、スケールファクターバンドの境界を表している。スケールファクターバンドとは、QMF(Quadrature Mirror Filter)分析フィルタの分解能である所定帯域幅のサブバンドを複数束ねた帯域である。   Specifically, for example, it is assumed that the low frequency signal SL1 shown in FIG. 1 is obtained by decoding. In FIG. 1, the horizontal axis indicates the frequency, and the vertical axis indicates the energy of each frequency of the audio signal. In the drawing, the dotted line in the vertical direction represents the boundary of the scale factor band. The scale factor band is a band obtained by bundling a plurality of subbands having a predetermined bandwidth, which is the resolution of a QMF (Quadrature Mirror Filter) analysis filter.

図1では、低域信号SL1の図中、右側にある連続する7つのスケールファクターバンドからなる帯域が高域とされ、SBR情報を復号することで高域側のスケールファクターバンドごとに、高域スケールファクターバンドエネルギE11乃至E17が得られる。   In FIG. 1, in the figure of the low-frequency signal SL1, a band composed of seven continuous scale factor bands on the right side is defined as a high frequency, and by decoding SBR information, a high frequency is obtained for each scale factor band on the high frequency side. Scale factor band energies E11 to E17 are obtained.

そして、低域信号SL1と高域スケールファクターバンドエネルギが用いられて、各スケールファクターバンドの高域信号が生成される。例えば、スケールファクターバンドBobjの高域信号が生成される場合、低域信号SL1のうちのスケールファクターバンドBorgの成分が、スケールファクターバンドBobjの帯域に周波数シフトされ、周波数シフトにより得られた信号がゲイン調整されて、高域信号とされる。このとき、周波数シフトにより得られた信号の平均エネルギが、スケールファクターバンドBobjの高域スケールファクターバンドエネルギE13と同じ大きさとなるように、ゲイン調整が行なわれる。   Then, the low frequency signal SL1 and the high frequency scale factor band energy are used to generate a high frequency signal of each scale factor band. For example, when a high-frequency signal of the scale factor band Bobj is generated, the component of the scale factor band Borg in the low-frequency signal SL1 is frequency-shifted to the band of the scale factor band Bobj, and a signal obtained by the frequency shift is obtained. The gain is adjusted to obtain a high frequency signal. At this time, gain adjustment is performed so that the average energy of the signal obtained by the frequency shift becomes the same as the high-frequency scale factor band energy E13 of the scale factor band Bobj.

このような処理により、図2に示す高域信号SH1が、スケールファクターバンドBobjの成分として生成される。なお、図2において、図1における場合と対応する部分には同一の符号を付してあり、その説明は省略する。   Through such processing, the high frequency signal SH1 shown in FIG. 2 is generated as a component of the scale factor band Bobj. In FIG. 2, the same reference numerals are given to the portions corresponding to those in FIG. 1, and the description thereof is omitted.

このように、音声信号の復号側において、低域信号とSBR情報を用いて、符号化及び復号化された低域信号には含まれていない高域成分を生成し帯域を拡張することで、より高音質な音声を再生することができるようになる。   In this way, on the decoding side of the audio signal, by using the low frequency signal and the SBR information, by generating a high frequency component not included in the encoded and decoded low frequency signal and extending the band, Higher quality sound can be played back.

特表2001−521648号公報JP-T-2001-521648

ところが、図2のスケールファクターバンドBorgのように、高域信号の生成に用いる低域信号SL1に穴があいている場合、得られた高域信号SH1の形状は、原信号の周波数形状とは大きく異なる形状となる可能性が高く、聴感上の劣化の原因となる。なお、低域信号に穴があいている状態とは、所定帯域のエネルギが、隣接する帯域のエネルギと比べて顕著に小さく、低域のパワースペクトル(各周波数のエネルギの波形)の一部が図中、下方向に突出している状態、つまり一部の帯域成分のエネルギがへこんでいる状態である。   However, when the low-frequency signal SL1 used for generating the high-frequency signal has a hole as in the scale factor band Borg in FIG. 2, the shape of the obtained high-frequency signal SH1 is the frequency shape of the original signal. There is a high possibility that the shapes will be greatly different, and this will cause deterioration in hearing. It should be noted that the state where the low-frequency signal has a hole is that the energy in the predetermined band is significantly smaller than the energy in the adjacent band, and a part of the low-frequency power spectrum (energy waveform of each frequency) In the figure, it is a state protruding downward, that is, a state where energy of some band components is recessed.

図2の例では、高域信号の生成に用いる低域信号SL1にへこみがあるため、高域信号SH1にもへこみが生じてしまっている。このように、高域信号の生成に用いる低域信号にへこみがあると、高域成分を精度よく再現できなくなり、復号により得られた音声信号に聴感上の劣化が生じてしまうことがある。   In the example of FIG. 2, since the low-frequency signal SL1 used for generating the high-frequency signal has a dent, the dent also occurs in the high-frequency signal SH1. Thus, if there is a dent in the low-frequency signal used to generate the high-frequency signal, the high-frequency component cannot be accurately reproduced, and the audio signal obtained by decoding may be deteriorated in audibility.

また、SBRでは、ゲインリミッタやインターポレーションと呼ばれる処理が行なわれることがあり、これらの処理が原因で、高域成分にへこみが生じてしまう場合もある。   In SBR, processing called gain limiter or interpolation may be performed, and dents may occur in high frequency components due to these processing.

ここで、ゲインリミッタとは、複数のサブバンドからなるリミッタバンド内で、ゲインのピーク値を、リミッタバンド内でのゲインの平均値に抑える処理である。   Here, the gain limiter is a process of suppressing the gain peak value to the average value of the gain within the limiter band within the limiter band composed of a plurality of subbands.

例えば、低域信号の復号により図3に示す低域信号SL2が得られたとする。なお、図3において、横軸は周波数を示しており、縦軸は音声信号の各周波数のエネルギを示している。また、図中、縦方向の点線は、スケールファクターバンドの境界を表している。   For example, it is assumed that the low frequency signal SL2 shown in FIG. 3 is obtained by decoding the low frequency signal. In FIG. 3, the horizontal axis indicates the frequency, and the vertical axis indicates the energy of each frequency of the audio signal. In the drawing, the dotted line in the vertical direction represents the boundary of the scale factor band.

図3では、低域信号SL2の図中、右側にある連続する7つのスケールファクターバンドからなる帯域が高域とされ、SBR情報を復号することにより、高域スケールファクターバンドエネルギE21乃至E27が得られる。   In FIG. 3, the band composed of seven consecutive scale factor bands on the right side of the low-frequency signal SL2 is a high frequency band, and high-frequency scale factor band energy E21 to E27 is obtained by decoding the SBR information. It is done.

また、3つのスケールファクターバンドBobj1乃至Bobj3からなる帯域が、リミッタバンドとされている。さらに、低域信号SL2のスケールファクターバンドBorg1乃至Borg3のそれぞれの成分が用いられて、高域側のスケールファクターバンドBobj1乃至Bobj3の高域信号のそれぞれが生成されるとする。   A band composed of the three scale factor bands Bobj1 to Bobj3 is a limiter band. Furthermore, it is assumed that the respective components of the scale factor bands Borg1 to Borg3 of the low frequency signal SL2 are used to generate the high frequency signals of the scale factor bands Bobj1 to Bobj3 on the high frequency side.

したがって、基本的には、スケールファクターバンドBobj2の高域信号SH2の生成時には、低域信号SL2のスケールファクターバンドBorg2の平均エネルギと、高域スケールファクターバンドエネルギE22とのエネルギ比G2によりゲイン調整がされる。つまり、低域信号SL2のスケールファクターバンドBorg2の成分が周波数シフトされ、その結果得られた信号にエネルギ比G2が乗算されてゲイン調整が行なわれ、高域信号SH2とされる。   Therefore, basically, when the high frequency signal SH2 of the scale factor band Bobj2 is generated, the gain adjustment is performed by the energy ratio G2 between the average energy of the scale factor band Borg2 of the low frequency signal SL2 and the high frequency scale factor band energy E22. Is done. That is, the component of the scale factor band Borg2 of the low-frequency signal SL2 is frequency-shifted, and the resulting signal is multiplied by the energy ratio G2 to perform gain adjustment to obtain the high-frequency signal SH2.

ところが、ゲインリミッタでは、リミッタバンド内のスケールファクターバンドBobj1乃至Bobj3のエネルギ比G1乃至G3の平均値Gよりも、エネルギ比G2が大きいと、周波数シフト後の信号に乗算されるエネルギ比G2が、平均値Gとされてしまう。すなわち、スケールファクターバンドBobj2の高域信号のゲインが低く抑えられてしまう。   However, in the gain limiter, when the energy ratio G2 is larger than the average value G of the energy ratios G1 to G3 of the scale factor bands Bobj1 to Bobj3 in the limiter band, the energy ratio G2 multiplied by the signal after the frequency shift is The average value G is assumed. That is, the gain of the high frequency signal of the scale factor band Bobj2 is kept low.

図3の例では、低域信号SL2のスケールファクターバンドBorg2のエネルギは、隣接するスケールファクターバンドBorg1やBorg3のエネルギと比べて小さくなっている。つまり、スケールファクターバンドBorg2の部分にへこみが生じている。   In the example of FIG. 3, the energy of the scale factor band Borg2 of the low-frequency signal SL2 is smaller than the energy of the adjacent scale factor bands Borg1 and Borg3. In other words, the scale factor band Borg2 has a dent.

これに対して、低域成分の貼り付け先であるスケールファクターバンドBobj2の高域スケールファクターバンドエネルギE22は、スケールファクターバンドBobj1やBobj3の高域スケールファクターバンドエネルギよりも大きい。   On the other hand, the high frequency scale factor band energy E22 of the scale factor band Bobj2 to which the low frequency component is pasted is larger than the high frequency scale factor band energy of the scale factor bands Bobj1 and Bobj3.

そのため、スケールファクターバンドBobj2のエネルギ比G2は、リミッタバンド内のエネルギ比の平均値Gよりも高くなってしまい、スケールファクターバンドBobj2の高域信号のゲインがゲインリミッタにより低く抑えられてしまう。   Therefore, the energy ratio G2 of the scale factor band Bobj2 becomes higher than the average value G of the energy ratios in the limiter band, and the gain of the high frequency signal of the scale factor band Bobj2 is suppressed to a low level by the gain limiter.

したがって、スケールファクターバンドBobj2では、高域信号SH2のエネルギが、高域スケールファクターバンドエネルギE22よりも大幅に低くなり、生成された高域信号の周波数形状は、原信号の周波数形状とは大きく異なる形状となる。そうすると、復号により最終的に得られた音声には、聴感上、劣化が生じてしまう。   Therefore, in the scale factor band Bobj2, the energy of the high frequency signal SH2 is significantly lower than the high frequency scale factor band energy E22, and the frequency shape of the generated high frequency signal is significantly different from the frequency shape of the original signal. It becomes a shape. If it does so, the audio | voice finally obtained by decoding will produce deterioration on hearing.

また、インターポレーションとは、周波数シフトとゲイン調整をスケールファクターバンドごとではなく、サブバンドごとに行なう高域信号生成手法である。   Interpolation is a high-frequency signal generation method in which frequency shift and gain adjustment are performed for each subband, not for each scale factor band.

例えば、図4に示すように、低域信号SL3のサブバンドBorg1乃至Borg3のそれぞれが用いられて、高域側のサブバンドBobj1乃至Bobj3のそれぞれの高域信号が生成され、サブバンドBobj1乃至Bobj3からなる帯域がリミッタバンドとされるとする。   For example, as shown in FIG. 4, each of the subbands Borg1 to Borg3 of the low frequency signal SL3 is used to generate the high frequency signals of the high frequency subbands Bobj1 to Bobj3, and the subbands Bobj1 to Bobj3 are generated. Suppose that the band consisting of is a limiter band.

なお、図4において、横軸は周波数を示しており、縦軸は音声信号の各周波数のエネルギを示している。また、SBR情報の復号により、スケールファクターバンドごとに、高域スケールファクターバンドエネルギE31乃至E37が得られている。   In FIG. 4, the horizontal axis indicates the frequency, and the vertical axis indicates the energy of each frequency of the audio signal. Further, high frequency scale factor band energies E31 to E37 are obtained for each scale factor band by decoding of the SBR information.

図4の例では、低域信号SL3のサブバンドBorg2のエネルギは、隣接するサブバンドBorg1やBorg3のエネルギと比べて小さくなっており、サブバンドBorg2の部分にへこみが生じている。そのため、図3における場合と同様に、低域信号SL3のサブバンドBorg2のエネルギと高域スケールファクターバンドエネルギE33とのエネルギ比は、リミッタバンド内のエネルギ比の平均値よりも高くなる。そうすると、サブバンドBobj2の高域信号SH3のゲインがゲインリミッタにより低く抑えられてしまう。   In the example of FIG. 4, the energy of the subband Borg2 of the low-frequency signal SL3 is smaller than the energy of the adjacent subbands Borg1 and Borg3, and a dent is generated in the subband Borg2. Therefore, as in the case of FIG. 3, the energy ratio between the energy of the sub-band Borg2 of the low-frequency signal SL3 and the high-frequency scale factor band energy E33 is higher than the average value of the energy ratio in the limiter band. Then, the gain of the high-frequency signal SH3 of the subband Bobj2 is suppressed by the gain limiter.

その結果、サブバンドBobj2では、高域信号SH3のエネルギが、高域スケールファクターバンドエネルギE33よりも大幅に低くなり、生成された高域信号の周波数形状は、原信号の周波数形状とは大きく異なる形状となり得る。これにより、図3における場合と同様に、復号により得られた音声には、聴感上、劣化が生じてしまう。   As a result, in the subband Bobj2, the energy of the high frequency signal SH3 is significantly lower than the high frequency scale factor band energy E33, and the frequency shape of the generated high frequency signal is significantly different from the frequency shape of the original signal. It can be a shape. As a result, as in the case of FIG. 3, the audio obtained by decoding is deteriorated in terms of hearing.

以上のように、SBRでは、高域信号の生成に用いる低域信号のパワースペクトルの形状(周波数形状)によっては、音声信号の復号側において高音質な音声が得られない場合があった。   As described above, in the SBR, depending on the shape (frequency shape) of the power spectrum of the low-frequency signal used for generating the high-frequency signal, high-quality sound may not be obtained on the audio signal decoding side.

本発明は、このような状況に鑑みてなされたものであり、音声信号を復号する場合に、より高音質な音声が得られるようにするものである。   The present invention has been made in view of such a situation, and is intended to obtain higher-quality sound when an audio signal is decoded.

本技術の一側面の信号処理装置は、音声信号の低域成分と、前記音声信号の高域成分を得るための高域情報とを抽出する抽出部と、前記低域成分をQMF分析フィルタ処理して低域サブバンド信号を生成するQMF分析フィルタ処理部と、前記低域サブバンド信号のエネルギおよび平均エネルギに基づいて前記低域サブバンド信号を平坦化する平坦化処理部と、平坦化された前記低域サブバンド信号を高域に周波数シフトする周波数シフト部と、前記高域に周波数シフトされた信号と前記高域情報とに基づいて、前記高域に周波数シフトされた信号のゲインを調整して高域サブバンド信号を生成する高域生成部と、前記低域サブバンド信号と、前記高域サブバンド信号とをQMF合成フィルタにより合成して音声信号を生成するQMF合成フィルタ処理部とを備える。   A signal processing device according to one aspect of the present technology includes an extraction unit that extracts a low frequency component of an audio signal and high frequency information for obtaining the high frequency component of the audio signal, and QMF analysis filter processing on the low frequency component And a flattening processing unit for flattening the low-frequency subband signal based on energy and average energy of the low-frequency subband signal, Further, based on the frequency shift unit that frequency-shifts the low-frequency subband signal to the high frequency, the signal frequency-shifted to the high frequency and the high-frequency information, the gain of the signal frequency-shifted to the high frequency is A high-frequency generating unit that generates a high-frequency sub-band signal by adjusting, and a QMF synthesis filter processing unit that generates an audio signal by synthesizing the low-frequency sub-band signal and the high-frequency sub-band signal by a QMF synthesis filter And Obtain.

本技術の一側面の信号処理方法またはプログラムは、音声信号の低域成分と、前記音声信号の高域成分を得るための高域情報とを抽出し、前記低域成分をQMF分析フィルタ処理して低域サブバンド信号を生成し、前記低域サブバンド信号のエネルギおよび平均エネルギに基づいて前記低域サブバンド信号を平坦化し、平坦化された前記低域サブバンド信号を高域に周波数シフトし、前記高域に周波数シフトされた信号と前記高域情報とに基づいて、前記高域に周波数シフトされた信号のゲインを調整して高域サブバンド信号を生成し、前記低域サブバンド信号と、前記高域サブバンド信号とをQMF合成フィルタにより合成して音声信号を生成するステップを含む。   A signal processing method or program according to one aspect of the present technology extracts a low frequency component of an audio signal and high frequency information for obtaining the high frequency component of the audio signal, and performs QMF analysis filtering on the low frequency component. To generate a low-frequency subband signal, flatten the low-frequency subband signal based on the energy and average energy of the low-frequency subband signal, and frequency-shift the flattened low-frequency subband signal to a high frequency. And generating a high frequency sub-band signal by adjusting a gain of the signal frequency shifted to the high frequency based on the signal frequency-shifted to the high frequency and the high frequency information, and generating the low frequency sub-band signal. And a step of synthesizing the signal and the high frequency sub-band signal by a QMF synthesis filter to generate an audio signal.

本技術の一側面においては、音声信号の低域成分と、前記音声信号の高域成分を得るための高域情報とが抽出され、前記低域成分がQMF分析フィルタ処理されて低域サブバンド信号が生成され、前記低域サブバンド信号のエネルギおよび平均エネルギに基づいて前記低域サブバンド信号が平坦化され、平坦化された前記低域サブバンド信号が高域に周波数シフトされ、前記高域に周波数シフトされた信号と前記高域情報とに基づいて、前記高域に周波数シフトされた信号のゲインが調整されて高域サブバンド信号が生成され、前記低域サブバンド信号と、前記高域サブバンド信号とがQMF合成フィルタにより合成されて音声信号が生成される。   In one aspect of the present technology, a low-frequency component of an audio signal and high-frequency information for obtaining the high-frequency component of the audio signal are extracted, and the low-frequency component is subjected to QMF analysis filter processing to obtain a low-frequency subband. A signal is generated, the low frequency subband signal is flattened based on the energy and average energy of the low frequency subband signal, the flattened low frequency subband signal is frequency shifted to a high frequency, and the high frequency subband signal is Based on the frequency-shifted signal and the high-frequency information, the gain of the signal frequency-shifted to the high frequency is adjusted to generate a high-frequency subband signal, the low-frequency subband signal, The high frequency sub-band signal is synthesized by the QMF synthesis filter to generate an audio signal.

本発明の一側面によれば、音声信号を復号する場合に、より高音質な音声を得ることができる。   According to one aspect of the present invention, it is possible to obtain higher-quality sound when decoding an audio signal.

従来のSBRについて説明する図である。It is a figure explaining conventional SBR. 従来のSBRについて説明する図である。It is a figure explaining conventional SBR. 従来のゲインリミッタについて説明する図である。It is a figure explaining the conventional gain limiter. 従来のインターポレーションについて説明する図である。It is a figure explaining the conventional interpolation. 本発明を適用したSBRについて説明する図である。It is a figure explaining SBR to which the present invention is applied. 本発明を適用したエンコーダの一実施の形態の構成例を示す図である。It is a figure which shows the structural example of one Embodiment of the encoder to which this invention is applied. 符号化処理を説明するフローチャートである。It is a flowchart explaining an encoding process. 本発明を適用したデコーダの一実施の形態の構成例を示す図である。It is a figure which shows the structural example of one Embodiment of the decoder to which this invention is applied. 復号処理を説明するフローチャートである。It is a flowchart explaining a decoding process. 符号化処理を説明するフローチャートである。It is a flowchart explaining an encoding process. 復号処理を説明するフローチャートである。It is a flowchart explaining a decoding process. 符号化処理を説明するフローチャートである。It is a flowchart explaining an encoding process. 復号処理を説明するフローチャートである。It is a flowchart explaining a decoding process. コンピュータの構成例を示すブロック図である。It is a block diagram which shows the structural example of a computer.

以下、図面を参照して、本発明を適用した実施の形態について説明する。   Embodiments to which the present invention is applied will be described below with reference to the drawings.

〈本発明の概要〉
まず、図5を参照して、本発明を適用したSBRによる音声信号の帯域拡張について説明する。なお、図5において、横軸は周波数を示しており、縦軸は音声信号の各周波数のエネルギを示している。また、図中、縦方向の点線は、スケールファクターバンドの境界を表している。
<Outline of the present invention>
First, with reference to FIG. 5, description will be given of band expansion of an audio signal by SBR to which the present invention is applied. In FIG. 5, the horizontal axis indicates the frequency, and the vertical axis indicates the energy of each frequency of the audio signal. In the drawing, the dotted line in the vertical direction represents the boundary of the scale factor band.

例えば、音声信号の復号側において、符号化側から受信したデータから、音声信号の低域信号SL11と、高域側の各スケールファクターバンドBobj1乃至Bobj7の高域スケールファクターバンドエネルギEobj1乃至Eobj7が得られたとする。そして、低域信号SL11と、高域スケールファクターバンドエネルギEobj1乃至Eobj7とが用いられて、各スケールファクターバンドBobj1乃至Bobj7の高域信号が生成されるとする。   For example, on the audio signal decoding side, the low frequency signal SL11 of the audio signal and the high frequency scale factor band energies Eobj1 to Eobj7 of the scale factor bands Bobj1 to Bobj7 on the high frequency side are obtained from the data received from the encoding side. Suppose that Then, it is assumed that the low frequency signal SL11 and the high frequency scale factor band energy Eobj1 to Eobj7 are used to generate high frequency signals of the respective scale factor bands Bobj1 to Bobj7.

いま、低域信号SL11のスケールファクターバンドBorg1の成分を用いて、高域側のスケールファクターバンドBobj3の高域信号を生成することを考える。   Now, let us consider generating a high frequency signal of the scale factor band Bobj3 on the high frequency side using the components of the scale factor band Borg1 of the low frequency signal SL11.

図5の例では、低域信号SL11のパワースペクトルは、スケールファクターバンドBorg1部分において、図中、下側に大きくへこんでいる。つまり、他の帯域と比べてエネルギが小さくなっている。そのため、従来のSBRによりスケールファクターバンドBobj3の高域信号を生成すると、得られた高域信号にもへこみが生じてしまい、音声に聴感上の劣化が生じてしまうことになる。   In the example of FIG. 5, the power spectrum of the low-frequency signal SL11 is greatly dented downward in the figure in the scale factor band Borg1 portion. That is, the energy is small compared to other bands. For this reason, when the high frequency signal of the scale factor band Bobj3 is generated by the conventional SBR, the resulting high frequency signal is also dented, resulting in a deterioration in the audibility of the sound.

そこで、本発明では、まず低域信号SL11のスケールファクターバンドBorg1の成分に対して、平坦化処理(平滑化処理)が行なわれる。これにより、平坦化後のスケールファクターバンドBorg1の低域信号H11が得られる。この低域信号H11のパワースペクトルは、低域信号SL11のパワースペクトルにおけるスケールファクターバンドBorg1に隣接する帯域の部分と滑らかに接続される。つまり、平坦化後の低域信号SL11は、スケールファクターバンドBorg1にへこみが生じていないものとなる。   Therefore, in the present invention, first, flattening processing (smoothing processing) is performed on the components of the scale factor band Borg1 of the low-frequency signal SL11. As a result, the low-frequency signal H11 of the scale factor band Borg1 after flattening is obtained. The power spectrum of the low frequency signal H11 is smoothly connected to the portion of the band adjacent to the scale factor band Borg1 in the power spectrum of the low frequency signal SL11. That is, the flattened low-frequency signal SL11 has no dent in the scale factor band Borg1.

このようにして、低域信号SL11の平坦化が行なわれると、平坦化により得られた低域信号H11が、スケールファクターバンドBobj3の帯域に周波数シフトされ、周波数シフトにより得られた信号がゲイン調整されて、高域信号H12とされる。   In this way, when the low frequency signal SL11 is flattened, the low frequency signal H11 obtained by the flattening is frequency shifted to the band of the scale factor band Bobj3, and the signal obtained by the frequency shift is gain adjusted. Thus, a high frequency signal H12 is obtained.

このとき、低域信号H11の各サブバンドのエネルギの平均値が、スケールファクターバンドBorg1の平均エネルギEorg1として求められる。そして、平均エネルギEorg1と高域スケールファクターバンドエネルギEobj3との比に応じて、周波数シフト後の低域信号H11のゲイン調整が行なわれる。具体的には、周波数シフトされた低域信号H11の各サブバンドのエネルギの平均値が、高域スケールファクターバンドエネルギEobj3とほぼ同じ大きさとなるように、ゲイン調整が行なわれる。   At this time, the average value of the energy of each subband of the low frequency signal H11 is obtained as the average energy Eorg1 of the scale factor band Borg1. Then, the gain of the low frequency signal H11 after the frequency shift is adjusted according to the ratio between the average energy Eorg1 and the high frequency scale factor band energy Eobj3. Specifically, the gain adjustment is performed so that the average value of the energy of each subband of the frequency-shifted low frequency signal H11 becomes substantially the same as the high frequency scale factor band energy Eobj3.

図5では、へこみのない低域信号H11が用いられて、高域信号H12が生成されるため、高域信号H12の各サブバンドのエネルギは、高域スケールファクターバンドエネルギEobj3とほぼ同じ大きさとなっている。したがって、原信号の高域信号とほぼ同じ高域信号が得られたことになる。   In FIG. 5, since the high frequency signal H12 is generated by using the low frequency signal H11 having no dent, the energy of each subband of the high frequency signal H12 is substantially the same as the high frequency scale factor band energy Eobj3. It has become. Therefore, a high frequency signal substantially the same as the high frequency signal of the original signal is obtained.

このように、平坦化された低域信号を用いて高域信号を生成すれば、より高精度に音声信号の高域成分を生成することができ、従来、低域信号のパワースペクトルのへこみにより生じていた音声信号の聴感上の劣化を改善することができる。すなわち、より高音質な音声を得ることができるようになる。   Thus, if the high frequency signal is generated using the flattened low frequency signal, the high frequency component of the audio signal can be generated with higher accuracy. Conventionally, the low frequency signal has a dent in the power spectrum. It is possible to improve the audible degradation of the generated audio signal. That is, higher quality sound can be obtained.

また、低域信号を平坦化すれば、パワースペクトルのへこみを除去することができるので、平坦化された低域信号を用いて高域信号を生成すれば、ゲインリミッタやインターポレーションが行なわれる場合でも、音声信号の聴感上の劣化を防止することができる。   In addition, if the low frequency signal is flattened, dents in the power spectrum can be removed. Therefore, if a high frequency signal is generated using the flattened low frequency signal, a gain limiter or interpolation is performed. Even in this case, it is possible to prevent auditory degradation of the audio signal.

なお、低域信号の平坦化は、高域信号の生成に用いられる低域側の全帯域成分に対して行なわれてもよいし、低域側の帯域成分のうち、へこみが生じている帯域成分のみに対して行なわれるようにしてもよい。また、へこみが生じている帯域成分のみに平坦化が行なわれる場合、平坦化の対象となる帯域は、サブバンドを単位とする帯域であれば、1つのサブバンドでもよいし、複数のサブバンドからなる任意の幅の帯域であってもよい。   Note that the flattening of the low-frequency signal may be performed on the entire low-frequency band component used for generating the high-frequency signal, or the band in which the dent is generated in the low-frequency band component. It may be performed only on the component. In addition, when flattening is performed only on the band component in which the dent is generated, the band to be flattened may be one subband or a plurality of subbands as long as the band is a subband unit. It may be a band having an arbitrary width.

さらに、以下、スケールファクターバンド等のいくつかのサブバンドからなる帯域について、その帯域を構成する各サブバンドのエネルギの平均値を、帯域の平均エネルギとも称することとする。   Further, hereinafter, regarding a band composed of several subbands such as a scale factor band, an average value of energy of each subband constituting the band is also referred to as an average energy of the band.

次に、本発明を適用したエンコーダとデコーダについて説明する。なお、以下においては、スケールファクターバンドを単位として、高域信号の生成を行なう場合を例に説明するが、高域信号の生成は、1または複数のサブバンドからなる帯域ごとに行なうことも勿論可能である。   Next, an encoder and a decoder to which the present invention is applied will be described. In the following description, a case where high-frequency signals are generated in units of scale factor bands will be described as an example. However, high-frequency signals are generated for each band composed of one or a plurality of subbands. Is possible.

〈第1の実施の形態〉
[エンコーダの構成]
図6は、本発明を適用したエンコーダの一実施の形態の構成例を示す図である。
<First Embodiment>
[Configuration of encoder]
FIG. 6 is a diagram showing a configuration example of an embodiment of an encoder to which the present invention is applied.

エンコーダ11は、ダウンサンプラ21、低域符号化回路22、QMF分析フィルタ処理部23、高域符号化回路24、および多重化回路25から構成される。エンコーダ11のダウンサンプラ21とQMF分析フィルタ処理部23には、音声信号である入力信号が供給される。   The encoder 11 includes a downsampler 21, a low frequency encoding circuit 22, a QMF analysis filter processing unit 23, a high frequency encoding circuit 24, and a multiplexing circuit 25. An input signal that is an audio signal is supplied to the downsampler 21 and the QMF analysis filter processing unit 23 of the encoder 11.

ダウンサンプラ21は、供給された入力信号をダウンサンプリングすることにより、入力信号の低域成分である低域信号を抽出し、低域符号化回路22に供給する。低域符号化回路22は、ダウンサンプラ21から供給された低域信号を所定の符号化方式により符号化し、その結果得られた低域符号化データを多重化回路25に供給する。低域信号を符号化する方法として、例えば、AAC方式がある。   The downsampler 21 extracts a low-frequency signal that is a low-frequency component of the input signal by down-sampling the supplied input signal and supplies the low-frequency signal to the low-frequency encoding circuit 22. The low frequency encoding circuit 22 encodes the low frequency signal supplied from the down sampler 21 by a predetermined encoding method, and supplies the low frequency encoded data obtained as a result to the multiplexing circuit 25. As a method of encoding the low frequency signal, for example, there is an AAC method.

QMF分析フィルタ処理部23は、供給された入力信号に対して、QMF分析フィルタを用いたフィルタ処理を行い、入力信号を複数のサブバンドの信号に分割する。例えば、フィルタ処理により、入力信号の周波数帯域全体が64分割され、それらの64個の帯域(サブバンド)の成分が抽出される。QMF分析フィルタ処理部23は、フィルタ処理により得られた各サブバンドの信号を高域符号化回路24に供給する。   The QMF analysis filter processing unit 23 performs a filter process using a QMF analysis filter on the supplied input signal, and divides the input signal into a plurality of subband signals. For example, the entire frequency band of the input signal is divided into 64 by filtering, and the components of those 64 bands (subbands) are extracted. The QMF analysis filter processing unit 23 supplies the signal of each subband obtained by the filter processing to the high frequency encoding circuit 24.

なお、以下、入力信号の各サブバンドの信号をサブバンド信号とも称することとする。特に、ダウンサンプラ21により抽出される低域信号の帯域を低域として、低域側の各サブバンドのサブバンド信号を低域サブバンド信号と称する。また、入力信号の全体の帯域のうち、低域側の帯域よりも周波数の高い帯域を高域として、高域側のサブバンドのサブバンド信号を、高域サブバンド信号と称することとする。   Hereinafter, each subband signal of the input signal is also referred to as a subband signal. In particular, the band of the low frequency signal extracted by the down sampler 21 is defined as a low frequency, and the subband signal of each subband on the low frequency side is referred to as a low frequency subband signal. Further, of the entire band of the input signal, a band having a frequency higher than that of the low frequency band is defined as a high frequency, and the subband signal of the high frequency subband is referred to as a high frequency subband signal.

さらに、以下においては、低域よりも周波数の高い帯域を高域として説明を続けるが、低域と高域の一部が重なるようにしてもよい。すなわち、低域と高域とに互いに共通する帯域が含まれるようにしてもよい。   Furthermore, in the following, the description will be continued with a band having a higher frequency than the low band as a high band, but a part of the low band and the high band may overlap. That is, the low frequency band and the high frequency band may include a common band.

高域符号化回路24は、QMF分析フィルタ処理部23から供給されたサブバンド信号に基づいてSBR情報を生成し、多重化回路25に供給する。ここで、SBR情報は、原信号である入力信号の高域側の各スケールファクターバンドの高域スケールファクターバンドエネルギを得るための情報である。   The high frequency encoding circuit 24 generates SBR information based on the subband signal supplied from the QMF analysis filter processing unit 23 and supplies the SBR information to the multiplexing circuit 25. Here, the SBR information is information for obtaining the high frequency scale factor band energy of each scale factor band on the high frequency side of the input signal that is the original signal.

多重化回路25は、低域符号化回路22からの低域符号化データと、高域符号化回路24からのSBR情報とを多重化し、多重化により得られたビットストリームを出力する。   The multiplexing circuit 25 multiplexes the low frequency encoded data from the low frequency encoding circuit 22 and the SBR information from the high frequency encoding circuit 24 and outputs a bit stream obtained by multiplexing.

[符号化処理の説明]
ところで、エンコーダ11に入力信号が入力され、入力信号の符号化が指示されると、エンコーダ11は符号化処理を行なって入力信号の符号化を行う。以下、図7のフローチャートを参照して、エンコーダ11による符号化処理について説明する。
[Description of encoding process]
By the way, when an input signal is input to the encoder 11 and the encoding of the input signal is instructed, the encoder 11 performs an encoding process to encode the input signal. Hereinafter, the encoding process by the encoder 11 will be described with reference to the flowchart of FIG.

ステップS11において、ダウンサンプラ21は、供給された入力信号をダウンサンプリングして低域信号を抽出し、低域符号化回路22に供給する。   In step S <b> 11, the downsampler 21 extracts the low frequency signal by down-sampling the supplied input signal and supplies the low frequency signal to the low frequency encoding circuit 22.

ステップS12において、低域符号化回路22は、ダウンサンプラ21から供給された低域信号を、例えばAAC方式により符号化し、その結果得られた低域符号化データを多重化回路25に供給する。   In step S <b> 12, the low frequency encoding circuit 22 encodes the low frequency signal supplied from the down sampler 21 by, for example, the AAC method, and supplies the low frequency encoded data obtained as a result to the multiplexing circuit 25.

ステップS13において、QMF分析フィルタ処理部23は、供給された入力信号に対してQMF分析フィルタを用いたフィルタ処理を行い、その結果得られた各サブバンドのサブバンド信号を高域符号化回路24に供給する。   In step S <b> 13, the QMF analysis filter processing unit 23 performs a filter process using the QMF analysis filter on the supplied input signal, and outputs the subband signal of each subband obtained as a result thereof to the high frequency encoding circuit 24. To supply.

ステップS14において、高域符号化回路24は、QMF分析フィルタ処理部23から供給されたサブバンド信号に基づいて、高域側の各スケールファクターバンドの高域スケールファクターバンドエネルギEobjを求める。   In step S14, the high frequency encoding circuit 24 obtains a high frequency scale factor band energy Eobj of each scale factor band on the high frequency side based on the subband signal supplied from the QMF analysis filter processing unit 23.

すなわち、高域符号化回路24は、高域側のいくつかの連続するサブバンドからなる帯域をスケールファクターバンドとし、スケールファクターバンド内の各サブバンドのサブバンド信号を用いて、各サブバンドのエネルギを算出する。そして、高域符号化回路24は、スケールファクターバンド内の各サブバンドのエネルギの平均値を求め、求められたエネルギの平均値を、そのスケールファクターバンドの高域スケールファクターバンドエネルギEobjとする。これにより、例えば図5の高域スケールファクターバンドエネルギEobj1乃至Eobj7が算出される。   That is, the high frequency encoding circuit 24 uses a band composed of several continuous subbands on the high frequency side as a scale factor band, and uses a subband signal of each subband in the scale factor band to Calculate energy. Then, the high frequency encoding circuit 24 calculates the average value of the energy of each subband in the scale factor band, and sets the calculated average value of the energy as the high frequency scale factor band energy Eobj of the scale factor band. Thereby, for example, the high frequency scale factor band energy Eobj1 to Eobj7 of FIG. 5 is calculated.

ステップS15において、高域符号化回路24は、複数のスケールファクターバンドの高域スケールファクターバンドエネルギEobjを所定の符号化方式により符号化して、SBR情報を生成する。例えば、高域スケールファクターバンドエネルギEobjは、スカラ量子化、差分符号化、可変長符号化などの方式により符号化される。高域符号化回路24は、符号化により得られたSBR情報を多重化回路25に供給する。   In step S15, the high frequency encoding circuit 24 encodes the high frequency scale factor band energy Eobj of a plurality of scale factor bands by a predetermined encoding method to generate SBR information. For example, the high-frequency scale factor band energy Eobj is encoded by a method such as scalar quantization, differential encoding, or variable length encoding. The high frequency encoding circuit 24 supplies SBR information obtained by encoding to the multiplexing circuit 25.

ステップS16において、多重化回路25は、低域符号化回路22からの低域符号化データと、高域符号化回路24からのSBR情報とを多重化して、多重化により得られたビットストリームを出力し、符号化処理は終了する。   In step S16, the multiplexing circuit 25 multiplexes the low frequency encoded data from the low frequency encoding circuit 22 and the SBR information from the high frequency encoding circuit 24, and the bit stream obtained by multiplexing is multiplexed. Output, and the encoding process ends.

このようにして、エンコーダ11は、入力信号を符号化し、低域符号化データとSBR情報とが多重化されたビットストリームを出力する。したがって、このビットストリームの受信側においては、低域符号化データを復号して低域信号を得るとともに、低域信号とSBR情報とを用いて高域信号を生成し、低域信号と高域信号とからなるより広い帯域の音声信号を得ることができる。   In this way, the encoder 11 encodes the input signal and outputs a bit stream in which the low frequency encoded data and the SBR information are multiplexed. Therefore, on the receiving side of this bit stream, the low frequency encoded data is decoded to obtain a low frequency signal, and a high frequency signal is generated using the low frequency signal and the SBR information. It is possible to obtain a wider-band audio signal composed of signals.

[デコーダの構成]
次に、図6のエンコーダ11から出力されたビットストリームを受信して復号するデコーダについて、説明する。例えば、デコーダは図8に示すように構成される。
[Decoder configuration]
Next, a decoder that receives and decodes the bitstream output from the encoder 11 of FIG. 6 will be described. For example, the decoder is configured as shown in FIG.

すなわち、デコーダ51は、非多重化回路61、低域復号回路62、QMF分析フィルタ処理部63、高域復号回路64、およびQMF合成フィルタ処理部65から構成される。   That is, the decoder 51 includes a demultiplexing circuit 61, a low frequency decoding circuit 62, a QMF analysis filter processing unit 63, a high frequency decoding circuit 64, and a QMF synthesis filter processing unit 65.

非多重化回路61は、エンコーダ11から受信したビットストリームを非多重化し、低域符号化データとSBR情報とを抽出する。非多重化回路61は、非多重化により得られた低域符号化データを低域復号回路62に供給し、SBR情報を高域復号回路64に供給する。   The demultiplexing circuit 61 demultiplexes the bit stream received from the encoder 11 and extracts low frequency encoded data and SBR information. The demultiplexing circuit 61 supplies the low frequency encoded data obtained by the demultiplexing to the low frequency decoding circuit 62 and supplies the SBR information to the high frequency decoding circuit 64.

低域復号回路62は、非多重化回路61から供給された低域符号化データを、エンコーダ11で用いた低域信号の符号化方式(例えば、AAC方式)に対応する復号方式で復号し、その結果得られた低域信号をQMF分析フィルタ処理部63に供給する。QMF分析フィルタ処理部63は、低域復号回路62から供給された低域信号に対して、QMF分析フィルタを用いたフィルタ処理を行い、低域信号から低域側の各サブバンドのサブバンド信号を抽出する。すなわち、低域信号の帯域分割が行なわれる。QMF分析フィルタ処理部63は、フィルタ処理により得られた低域側の各サブバンドの低域サブバンド信号を、高域復号回路64およびQMF合成フィルタ処理部65に供給する。   The low frequency decoding circuit 62 decodes the low frequency encoded data supplied from the non-multiplexing circuit 61 by a decoding method corresponding to the low frequency signal encoding method (for example, AAC method) used in the encoder 11, The low frequency signal obtained as a result is supplied to the QMF analysis filter processing unit 63. The QMF analysis filter processing unit 63 performs filter processing using a QMF analysis filter on the low frequency signal supplied from the low frequency decoding circuit 62, and subband signals of each subband from the low frequency signal to the low frequency side. To extract. That is, band division of the low frequency signal is performed. The QMF analysis filter processing unit 63 supplies the low-frequency subband signal of each subband on the low frequency side obtained by the filter processing to the high-frequency decoding circuit 64 and the QMF synthesis filter processing unit 65.

高域復号回路64は、非多重化回路61から供給されたSBR情報と、QMF分析フィルタ処理部63から供給された低域サブバンド信号とを用いて、高域側の各スケールファクターバンドの高域信号を生成し、QMF合成フィルタ処理部65に供給する。   The high frequency decoding circuit 64 uses the SBR information supplied from the non-multiplexing circuit 61 and the low frequency sub-band signal supplied from the QMF analysis filter processing unit 63 to increase the high frequency of each scale factor band on the high frequency side. A band signal is generated and supplied to the QMF synthesis filter processing unit 65.

QMF合成フィルタ処理部65は、QMF分析フィルタ処理部63から供給された低域サブバンド信号と、高域復号回路64から供給された高域信号とを、QMF合成フィルタを用いたフィルタ処理により合成し、出力信号を生成する。この出力信号は、低域と高域の各サブバンドの成分からなる音声信号であり、出力信号はQMF合成フィルタ処理部65から、後段のスピーカ等の再生部に出力される。   The QMF synthesis filter processing unit 65 synthesizes the low frequency sub-band signal supplied from the QMF analysis filter processing unit 63 and the high frequency signal supplied from the high frequency decoding circuit 64 by filter processing using a QMF synthesis filter. To generate an output signal. This output signal is an audio signal composed of low-frequency and high-frequency subband components, and the output signal is output from the QMF synthesis filter processing unit 65 to a reproduction unit such as a speaker at the subsequent stage.

[復号処理の説明]
図8に示したデコーダ51に、エンコーダ11からビットストリームが供給され、ビットストリームの復号が指示されると、デコーダ51は、復号処理を行なって出力信号を生成する。以下、図9のフローチャートを参照して、デコーダ51による復号処理について説明する。
[Description of decryption processing]
When a bit stream is supplied from the encoder 11 to the decoder 51 shown in FIG. 8 and decoding of the bit stream is instructed, the decoder 51 performs a decoding process to generate an output signal. Hereinafter, the decoding process by the decoder 51 will be described with reference to the flowchart of FIG.

ステップS41において、非多重化回路61は、エンコーダ11から受信したビットストリームを非多重化する。そして、非多重化回路61は、ビットストリームの非多重化により得られた低域符号化データを低域復号回路62に供給するとともに、SBR情報を高域復号回路64に供給する。   In step S41, the demultiplexing circuit 61 demultiplexes the bit stream received from the encoder 11. Then, the demultiplexing circuit 61 supplies the low frequency encoded data obtained by demultiplexing the bitstream to the low frequency decoding circuit 62 and also supplies the SBR information to the high frequency decoding circuit 64.

ステップS42において、低域復号回路62は、非多重化回路61から供給された低域符号化データを復号し、その結果得られた低域信号をQMF分析フィルタ処理部63に供給する。   In step S 42, the low frequency decoding circuit 62 decodes the low frequency encoded data supplied from the demultiplexing circuit 61 and supplies the low frequency signal obtained as a result to the QMF analysis filter processing unit 63.

ステップS43において、QMF分析フィルタ処理部63は、低域復号回路62から供給された低域信号に対して、QMF分析フィルタを用いたフィルタ処理を行なう。そして、QMF分析フィルタ処理部63は、フィルタ処理の結果得られた低域側の各サブバンドの低域サブバンド信号を、高域復号回路64およびQMF合成フィルタ処理部65に供給する。   In step S43, the QMF analysis filter processing unit 63 performs a filter process using the QMF analysis filter on the low frequency signal supplied from the low frequency decoding circuit 62. Then, the QMF analysis filter processing unit 63 supplies the low frequency subband signal of each subband on the low frequency side obtained as a result of the filter processing to the high frequency decoding circuit 64 and the QMF synthesis filter processing unit 65.

ステップS44において、高域復号回路64は、非多重化回路61から供給されたSBR情報を復号する。これにより、高域側の各スケールファクターバンドの高域スケールファクターバンドエネルギEobjが得られる。   In step S44, the high frequency decoding circuit 64 decodes the SBR information supplied from the non-multiplexing circuit 61. Thereby, the high frequency scale factor band energy Eobj of each scale factor band on the high frequency side is obtained.

ステップS45において、高域復号回路64は、QMF分析フィルタ処理部63から供給された低域サブバンド信号に対して、平坦化処理を行なう。   In step S45, the high frequency decoding circuit 64 performs a flattening process on the low frequency sub-band signal supplied from the QMF analysis filter processing unit 63.

例えば、高域復号回路64は、ある高域側のスケールファクターバンドについて、そのスケールファクターバンドの高域信号を生成するのに用いられる低域側のスケールファクターバンドを、平坦化処理の対象スケールファクターバンドとする。なお、高域側の各スケールファクターバンドの高域信号の生成に用いられる低域側のスケールファクターバンドは、予め定められているものとする。   For example, for the high-frequency side scale factor band, the high-frequency decoding circuit 64 converts the low-frequency side scale factor band used for generating the high-frequency signal of the scale factor band into the target scale factor for flattening processing. A band. It is assumed that the scale factor band on the low frequency side used for generating the high frequency signal of each scale factor band on the high frequency side is predetermined.

次に、高域復号回路64は、低域側の処理対象のスケールファクターバンドを構成する各サブバンドの低域サブバンド信号に対して、平坦化フィルタを用いたフィルタ処理を行なう。具体的には、高域復号回路64は、低域側の処理対象のスケールファクターバンドを構成する各サブバンドの低域サブバンド信号に基づいて、それらのサブバンドのエネルギを求め、求められた各サブバンドのエネルギの平均値を平均エネルギとして求める。高域復号回路64は、処理対象のスケールファクターバンドを構成する各サブバンドの低域サブバンド信号に、それらのサブバンドのエネルギと平均エネルギの比を乗算することで、各サブバンドの低域サブバンド信号を平坦化する。   Next, the high frequency decoding circuit 64 performs a filtering process using a flattening filter on the low frequency sub-band signals of each sub-band constituting the scale factor band to be processed on the low frequency side. Specifically, the high frequency decoding circuit 64 obtains the energy of each subband based on the low frequency subband signal of each subband constituting the scale factor band to be processed on the low frequency side. The average value of the energy of each subband is obtained as the average energy. The high frequency decoding circuit 64 multiplies the low frequency subband signal of each subband constituting the scale factor band to be processed by the ratio of the energy of these subbands to the average energy, thereby obtaining the low frequency of each subband. Flatten the subband signal.

例えば、処理対象とされたスケールファクターバンドが、3つのサブバンドSB1乃至SB3から構成されるとし、それらのサブバンドのエネルギとして、エネルギE1乃至E3が得られたとする。この場合、サブバンドSB1乃至SB3のエネルギE1乃至E3の平均値が平均エネルギEAとして求められる。   For example, it is assumed that the scale factor band to be processed includes three subbands SB1 to SB3, and energy E1 to E3 is obtained as energy of these subbands. In this case, the average value of the energy E1 to E3 of the subbands SB1 to SB3 is obtained as the average energy EA.

そして、サブバンドSB1乃至SB3の低域サブバンド信号のそれぞれに、エネルギの比の値であるEA /E1、EA /E2、およびEA /E3が乗算される。このように、エネルギの比が乗算された低域サブバンド信号が、平坦化された低域サブバンド信号とされる。   Then, each of the low-frequency subband signals of subbands SB1 to SB3 is multiplied by EA / E1, EA / E2, and EA / E3, which are energy ratio values. In this way, the low-frequency subband signal multiplied by the energy ratio is a flattened low-frequency subband signal.

なお、エネルギE1乃至E3の最大値とサブバンドのエネルギの比を、そのサブバンドの低域サブバンド信号に乗算することで、低域サブバンド信号を平坦化するようにしてもよい。各サブバンドの低域サブバンド信号の平坦化は、それらのサブバンドからなるスケールファクターバンドのパワースペクトルが平坦化されれば、どのように行なわれてもよい。   Note that the low band subband signal may be flattened by multiplying the low band subband signal of the subband by the ratio of the maximum value of the energy E1 to E3 and the energy of the subband. The flattening of the low-frequency subband signal of each subband may be performed in any way as long as the power spectrum of the scale factor band composed of these subbands is flattened.

このようにして、これから生成しようとする高域側の各スケールファクターバンドについて、それらのスケールファクターバンドの生成に用いられる低域側のスケールファクターバンドを構成する各サブバンドの低域サブバンド信号が、平坦化される。   In this way, for each high-frequency side scale factor band to be generated, the low-frequency sub-band signal of each sub-band constituting the low-frequency side scale factor band used for generating the scale factor band is Flattened.

ステップS46において、高域復号回路64は、高域側のスケールファクターバンドの生成に用いる低域側の各スケールファクターバンドについて、それらのスケールファクターバンドの平均エネルギEorgを求める。   In step S46, the high frequency decoding circuit 64 obtains the average energy Eorg of the scale factor bands for each of the low frequency side scale factor bands used for generating the high frequency side scale factor band.

具体的には、高域復号回路64は、低域側のスケールファクターバンドを構成する各サブバンドの平坦化後の低域サブバンド信号を用いて、各サブバンドのエネルギを求め、さらにそれらのサブバンドのエネルギの平均値を平均エネルギEorgとして求める。   Specifically, the high frequency decoding circuit 64 obtains the energy of each subband by using the low frequency subband signal after the flattening of each subband constituting the scale factor band on the low frequency side, The average value of the energy of the subband is obtained as the average energy Eorg.

ステップS47において、高域復号回路64は、高域側のスケールファクターバンドの生成に用いる低域側の各スケールファクターバンドの信号を、生成しようとする高域側のスケールファクターバンドの周波数帯域に周波数シフトする。すなわち、低域側のスケールファクターバンドを構成する、平坦化後の各サブバンドの低域サブバンド信号が周波数シフトされる。   In step S47, the high frequency decoding circuit 64 uses the low frequency side scale factor band signal used for generating the high frequency side scale factor band to the frequency band of the high frequency side scale factor band to be generated. shift. That is, the low-frequency sub-band signals of the respective sub-bands that form the low-frequency scale factor band are frequency-shifted.

ステップS48において、高域復号回路64は、高域スケールファクターバンドエネルギEobjと平均エネルギEorgの比に応じて、周波数シフト後の低域サブバンド信号をゲイン調整し、高域側のスケールファクターバンドの高域サブバンド信号を生成する。   In step S48, the high frequency decoding circuit 64 adjusts the gain of the low frequency sub-band signal after the frequency shift in accordance with the ratio of the high frequency scale factor band energy Eobj and the average energy Eorg, and adjusts the high frequency side scale factor band. Generate a high frequency sub-band signal.

例えば、これから生成しようとする高域側のスケールファクターバンドを、高域スケールファクターバンドと称し、その高域スケールファクターバンドの生成に用いられる低域側のスケールファクターバンドを低域スケールファクターバンドと呼ぶこととする。   For example, a high-frequency scale factor band to be generated is called a high-frequency scale factor band, and a low-frequency scale factor band used to generate the high-frequency scale factor band is called a low-frequency scale factor band. I will do it.

高域復号回路64は、低域スケールファクターバンドを構成する、周波数シフト後の各サブバンドの低域サブバンド信号のエネルギの平均値が、高域スケールファクターバンドの高域スケールファクターバンドエネルギとほぼ同じ大きさとなるように、周波数シフト後の低域サブバンド信号をゲイン調整する。   In the high frequency decoding circuit 64, the average value of the energy of the low frequency sub-band signal of each sub-band after the frequency shift constituting the low frequency scale factor band is approximately equal to the high frequency scale factor band energy of the high frequency scale factor band. The gain of the low-frequency subband signal after the frequency shift is adjusted so as to have the same magnitude.

このようにして周波数シフト及びゲイン調整された低域サブバンド信号が、高域スケールファクターバンドの各サブバンドの高域サブバンド信号とされ、高域側のスケールファクターバンドの各サブバンドの高域サブバンド信号からなる信号が、高域側のスケールファクターバンドの信号(高域信号)とされる。高域復号回路64は、生成された高域側の各スケールファクターバンドの高域信号を、QMF合成フィルタ処理部65に供給する。   The low frequency sub-band signal frequency-shifted and gain-adjusted in this way becomes the high frequency sub-band signal of each sub-band of the high frequency scale factor band, and the high frequency of each sub-band of the scale factor band on the high frequency side. A signal composed of subband signals is a high-frequency scale factor band signal (high-frequency signal). The high frequency decoding circuit 64 supplies the generated high frequency signal of each scale factor band on the high frequency side to the QMF synthesis filter processing unit 65.

ステップS49において、QMF合成フィルタ処理部65は、QMF分析フィルタ処理部63から供給された低域サブバンド信号と、高域復号回路64から供給された高域信号とを、QMF合成フィルタを用いたフィルタ処理により合成し、出力信号を生成する。そして、QMF合成フィルタ処理部65は、生成した出力信号を出力し、復号処理は終了する。   In step S49, the QMF synthesis filter processing unit 65 uses the QMF synthesis filter for the low frequency sub-band signal supplied from the QMF analysis filter processing unit 63 and the high frequency signal supplied from the high frequency decoding circuit 64. The output signal is generated by combining by filtering. Then, the QMF synthesis filter processing unit 65 outputs the generated output signal, and the decoding process ends.

このようにして、デコーダ51は低域サブバンド信号を平坦化し、平坦化後の低域サブバンド信号と、SBR情報とを用いて、高域側の各スケールファクターバンドの高域信号を生成する。このように、平坦化した低域サブバンド信号を用いて高域信号を生成することで、より高音質な音声を再生できる出力信号を、簡単に得ることができる。   In this way, the decoder 51 flattens the low-frequency subband signal, and generates a high-frequency signal for each scale factor band on the high-frequency side using the flattened low-frequency subband signal and the SBR information. . In this way, by generating a high frequency signal using the flattened low frequency sub-band signal, an output signal capable of reproducing higher quality sound can be easily obtained.

なお、以上においては、低域側の全帯域が平坦化されると説明したが、デコーダ51側において、低域のうち、へこみが生じている帯域に対してのみ平坦化が行なわれてもよい。そのような場合、例えばデコーダ51において、低域信号が用いられて、へこみが生じている周波数帯域が検出される。   In the above description, it has been described that the entire band on the low frequency side is flattened. However, on the decoder 51 side, the flattening may be performed only on the band where the dent is generated in the low frequency band. . In such a case, for example, the decoder 51 uses the low frequency signal to detect the frequency band in which the dent is generated.

〈第2の実施の形態〉
[符号化処理の説明]
また、エンコーダ11が、低域におけるへこみの生じた帯域の位置情報と、その帯域の平坦化に用いる情報とを生成し、それらの情報が含まれるSBR情報を出力するようにしてもよい。そのような場合、エンコーダ11は、図10に示す符号化処理を行なう。
<Second Embodiment>
[Description of encoding process]
In addition, the encoder 11 may generate position information of a band in which a dent is generated in the low band and information used for flattening the band, and output SBR information including the information. In such a case, the encoder 11 performs the encoding process shown in FIG.

以下、図10のフローチャートを参照して、へこみの生じた帯域の位置情報等が含まれたSBR情報が出力される場合における、符号化処理について説明する。   Hereinafter, with reference to the flowchart of FIG. 10, a description will be given of an encoding process in a case where SBR information including position information of a band in which a dent has occurred is output.

なお、ステップS71乃至ステップS73の処理は、図7のステップS11乃至ステップS13の処理と同様であるので、その説明は省略する。ステップS73の処理が行なわれると、高域符号化回路24には、各サブバンドのサブバンド信号が供給される。   In addition, since the process of step S71 thru | or step S73 is the same as the process of FIG.7 S11 thru | or step S13, the description is abbreviate | omitted. When the process of step S73 is performed, the subband signal of each subband is supplied to the high frequency encoding circuit 24.

ステップS74において、高域符号化回路24は、QMF分析フィルタ処理部23から供給された低域側のサブバンドの低域サブバンド信号に基づいて、低域の周波数帯域のうち、へこみのある帯域を検出する。   In step S74, the high frequency encoding circuit 24 uses the low frequency subband signal of the low frequency side subband supplied from the QMF analysis filter processing unit 23 to generate a dent band in the low frequency band. Is detected.

具体的には、例えば、高域符号化回路24は、低域の各サブバンドのエネルギの平均値を求めることで、低域全体のエネルギの平均値である平均エネルギELを求める。そして、高域符号化回路24は、低域のサブバンドのうち、平均エネルギELとサブバンドのエネルギとの差分が予め定めた閾値以上となるサブバンドを検出する。すなわち、平均エネルギELから、サブバンドのエネルギを減算して得られた値が閾値以上であるサブバンドが検出される。   Specifically, for example, the high frequency encoding circuit 24 determines the average energy EL that is the average value of the energy of the entire low frequency band by determining the average value of the energy of each subband of the low frequency band. Then, the high frequency encoding circuit 24 detects a subband in which the difference between the average energy EL and the energy of the subband is equal to or greater than a predetermined threshold among the low frequency subbands. That is, a subband whose value obtained by subtracting the energy of the subband from the average energy EL is equal to or greater than a threshold value is detected.

さらに、高域符号化回路24は、上述した差分が閾値以上となるサブバンドからなる帯域であって、いくつかの連続するサブバンドからなる帯域を、へこみのある帯域(以下、平坦化帯域と称する)とする。なお、平坦化帯域は、1つのサブバンドからなる帯域である場合もある。   Further, the high frequency encoding circuit 24 is a band composed of subbands in which the above-described difference is equal to or greater than a threshold, and a band composed of several consecutive subbands is converted into a band with depressions (hereinafter referred to as a flattened band). Called). The flattening band may be a band composed of one subband.

ステップS75において、高域符号化回路24は平坦化帯域ごとに、平坦化帯域の位置を示す平坦化位置情報と、その平坦化帯域の平坦化に用いる平坦化ゲイン情報を求め、各平坦化帯域の平坦化位置情報および平坦化ゲイン情報からなる情報を、平坦化情報とする。   In step S75, for each flattening band, the high-frequency encoding circuit 24 obtains flattening position information indicating the position of the flattening band and flattening gain information used for flattening the flattening band, and each flattening band. Information consisting of the flattening position information and the flattening gain information is used as flattening information.

具体的には、高域符号化回路24は、平坦化帯域とされた帯域を示す情報を平坦化位置情報とする。また、高域符号化回路24は、平坦化帯域を構成するサブバンドごとに平均エネルギELと、そのサブバンドのエネルギとの差分△Eを算出し、平坦化帯域を構成する各サブバンドの差分△Eからなる情報を、平坦化ゲイン情報とする。   Specifically, the high frequency encoding circuit 24 uses the information indicating the flattened band as the flattened position information. Further, the high frequency encoding circuit 24 calculates the difference ΔE between the average energy EL and the energy of the subband for each subband constituting the flattened band, and the difference between the subbands constituting the flattened band. Information consisting of ΔE is set as flattening gain information.

ステップS76において、高域符号化回路24は、QMF分析フィルタ処理部23から供給されたサブバンド信号に基づいて、高域側の各スケールファクターバンドの高域スケールファクターバンドエネルギEobjを求める。なお、ステップS76では、図7のステップS14と同様の処理が行なわれる。   In step S76, the high frequency encoding circuit 24 obtains the high frequency scale factor band energy Eobj of each scale factor band on the high frequency side based on the subband signal supplied from the QMF analysis filter processing unit 23. In step S76, processing similar to that in step S14 in FIG. 7 is performed.

ステップS77において、高域符号化回路24は、高域側の各スケールファクターバンドの高域スケールファクターバンドエネルギEobjと、各平坦化帯域の平坦化情報とをスカラ量子化等の符号化方式により符号化し、SBR情報を生成する。高域符号化回路24は、生成されたSBR情報を多重化回路25に供給する。   In step S77, the high frequency encoding circuit 24 encodes the high frequency scale factor band energy Eobj of each scale factor band on the high frequency side and the flattening information of each flattened band by an encoding method such as scalar quantization. To generate SBR information. The high frequency encoding circuit 24 supplies the generated SBR information to the multiplexing circuit 25.

その後、ステップS78の処理が行なわれて、符号化処理は終了するが、ステップS78の処理は図7のステップS16の処理と同様であるので、その説明は省略する。   Thereafter, the process of step S78 is performed, and the encoding process ends. However, the process of step S78 is the same as the process of step S16 in FIG.

このようにして、エンコーダ11は、低域から平坦化帯域を検出し、各平坦化帯域の平坦化に用いる平坦化情報が含まれるSBR情報を、低域符号化データとともに出力する。これにより、デコーダ51側において、より簡単に平坦化帯域の平坦化を行なうことができるようになる。   In this way, the encoder 11 detects the flattened band from the low band, and outputs SBR information including the flattened information used for flattening each flattened band together with the low band encoded data. As a result, the flattening band can be flattened more easily on the decoder 51 side.

[復号処理の説明]
また、図10のフローチャートを参照して説明した符号化処理により出力されたビットストリームが、デコーダ51に送信されてくると、そのビットストリームを受信したデコーダ51は図11に示す復号処理を行なう。以下、図11のフローチャートを参照して、デコーダ51による復号処理について説明する。
[Description of decryption processing]
When the bit stream output by the encoding process described with reference to the flowchart of FIG. 10 is transmitted to the decoder 51, the decoder 51 that has received the bit stream performs the decoding process shown in FIG. Hereinafter, the decoding process by the decoder 51 will be described with reference to the flowchart of FIG.

なお、ステップS101乃至ステップS104の処理は、図9のステップS41乃至ステップS44の処理と同様であるので、その説明は省略する。但し、ステップS104の処理では、SBR情報の復号により、高域スケールファクターバンドエネルギEobjと、各平坦化帯域の平坦化情報とが得られる。   Note that the processing from step S101 to step S104 is the same as the processing from step S41 to step S44 in FIG. However, in the process of step S104, the high frequency scale factor band energy Eobj and the flattening information of each flattening band are obtained by decoding the SBR information.

ステップS105において、高域復号回路64は平坦化情報を用いて、平坦化情報に含まれる平坦化位置情報により示される平坦化帯域を平坦化する。すなわち、高域復号回路64は、平坦化位置情報により示される平坦化帯域を構成するサブバンドの低域サブバンド信号に、そのサブバンドの差分△Eを加算することにより、平坦化を行なう。ここで、平坦化帯域のサブバンドごとの差分△Eは、平坦化情報に平坦化ゲイン情報として含まれている情報である。   In step S105, the high frequency decoding circuit 64 uses the flattening information to flatten the flattened band indicated by the flattening position information included in the flattening information. That is, the high-frequency decoding circuit 64 performs flattening by adding the subband difference ΔE to the low-band subband signal of the subband constituting the flattened band indicated by the flattened position information. Here, the difference ΔE for each subband of the flattening band is information included as flattening gain information in the flattening information.

このようにして、低域側のサブバンドのうち、平坦化帯域を構成する各サブバンドの低域サブバンド信号が平坦化されると、その後、平坦化された低域サブバンド信号が用いられて、ステップS106乃至ステップS109の処理が行なわれ、復号処理は終了する。なお、これらのステップS106乃至ステップS109の処理は、図9のステップS46乃至ステップS49の処理と同様であるので、その説明は省略する。   Thus, when the low-frequency subband signal of each subband constituting the flattened band is flattened among the subbands on the low-frequency side, the flattened low-frequency subband signal is used thereafter. Thus, the process from step S106 to step S109 is performed, and the decoding process ends. Note that the processing from step S106 to step S109 is the same as the processing from step S46 to step S49 in FIG.

このようにして、デコーダ51は、SBR情報に含まれる平坦化情報を用いて、平坦化帯域の平坦化を行い、高域側の各スケールファクターバンドの高域信号を生成する。このように、平坦化情報を用いて平坦化帯域の平坦化を行なうことで、より簡単かつ迅速に高域信号を生成することができる。   In this manner, the decoder 51 performs flattening of the flattened band using the flattened information included in the SBR information, and generates a high frequency signal of each scale factor band on the high frequency side. As described above, by flattening the flattening band using the flattening information, a high frequency signal can be generated more easily and quickly.

〈第3の実施の形態〉
[符号化処理の説明]
また、第2の実施の形態では、平坦化情報をそのままSBR情報に含めてデコーダ51に送信すると説明したが、平坦化情報がベクトル量子化されてSBR情報に含まれるようにしてもよい。
<Third Embodiment>
[Description of encoding process]
Further, in the second embodiment, it has been described that the flattening information is included in the SBR information as it is and transmitted to the decoder 51. However, the flattening information may be vector-quantized and included in the SBR information.

そのような場合、例えば、エンコーダ11の高域符号化回路24は、複数の平坦化位置情報ベクトルと、それらの平坦化位置情報ベクトルを特定する位置インデックスとが対応付けられている位置テーブルを記録している。ここで、平坦化位置情報ベクトルとは、1または複数の平坦化帯域の平坦化位置情報のそれぞれを要素とするベクトルであって、平坦化帯域の周波数が低い順にそれらの平坦化位置情報を並べて得られるベクトルである。   In such a case, for example, the high frequency encoding circuit 24 of the encoder 11 records a position table in which a plurality of flattened position information vectors are associated with position indexes that specify the flattened position information vectors. doing. Here, the flattened position information vector is a vector having each of the flattened position information of one or a plurality of flattened bands as an element, and the flattened position information is arranged in order from the lowest flattened band frequency. This is the resulting vector.

なお、位置テーブルには、同じ数の要素からなる互いに異なる平坦化位置情報ベクトルだけでなく、互いに異なる数の要素からなる複数の平坦化位置情報ベクトルが記録されている。   In the position table, not only different flattened position information vectors composed of the same number of elements but also a plurality of flattened position information vectors composed of different numbers of elements are recorded.

さらに、エンコーダ11の高域符号化回路24は、複数の平坦化ゲイン情報ベクトルと、それらの平坦化ゲイン情報ベクトルを特定するゲインインデックスとが対応付けられているゲインテーブルを記録している。なお、平坦化ゲイン情報ベクトルとは、1または複数の平坦化帯域の平坦化ゲイン情報のそれぞれを要素とするベクトルであって、平坦化帯域の周波数が低い順にそれらの平坦化ゲイン情報を並べて得られるベクトルである。   Further, the high frequency encoding circuit 24 of the encoder 11 records a gain table in which a plurality of flattening gain information vectors and gain indexes for specifying these flattening gain information vectors are associated with each other. Note that the flattening gain information vector is a vector having the flattening gain information of one or a plurality of flattening bands as elements, and is obtained by arranging the flattening gain information in ascending order of the flattening band frequencies. Vector.

位置テーブルにおける場合と同様に、ゲインテーブルにも、同じ数の要素からなる互いに異なる複数の平坦化ゲイン情報ベクトルや、互いに異なる数の要素からなる複数の平坦化ゲイン情報ベクトルが記録されている。   As in the case of the position table, a plurality of different flattening gain information vectors composed of the same number of elements and a plurality of flattening gain information vectors composed of different numbers of elements are also recorded in the gain table.

このように、エンコーダ11に位置テーブルとゲインテーブルが記録されている場合、エンコーダ11は、図12に示す符号化処理を行なう。以下、図12のフローチャートを参照して、エンコーダ11による符号化処理について説明する。   Thus, when the position table and the gain table are recorded in the encoder 11, the encoder 11 performs the encoding process shown in FIG. Hereinafter, the encoding process by the encoder 11 will be described with reference to the flowchart of FIG.

なお、ステップS141乃至ステップS145の処理のそれぞれは、図10のステップS71乃至ステップS75のそれぞれと同様であるので、その説明は省略する。   Note that the processes in steps S141 through S145 are the same as those in steps S71 through S75 in FIG.

ステップS145の処理が行なわれると、入力信号の低域の各平坦化帯域について、平坦化位置情報と、平坦化ゲイン情報が得られる。すると高域符号化回路24は、周波数帯域の低い順に、各平坦化帯域の平坦化位置情報を並べて、平坦化位置情報ベクトルとするとともに、周波数帯域の低い順に、各平坦化帯域の平坦化ゲイン情報を並べて、平坦化ゲイン情報ベクトルとする。   When the process of step S145 is performed, the flattened position information and the flattened gain information are obtained for each flattened band in the low band of the input signal. Then, the high frequency encoding circuit 24 arranges the flattened position information of each flattened band in order from the lowest frequency band to obtain a flattened position information vector, and the flattened gain of each flattened band in the order from the lowest frequency band The information is arranged into a flattening gain information vector.

ステップS146において、高域符号化回路24は、得られた平坦化位置情報ベクトルおよび平坦化ゲイン情報ベクトルに対応する位置インデックスおよびゲインインデックスを取得する。   In step S146, the high frequency encoding circuit 24 acquires a position index and a gain index corresponding to the obtained flattened position information vector and flattened gain information vector.

すなわち、高域符号化回路24は、位置テーブルに記録されている平坦化位置情報ベクトルのなかから、ステップS145で得られた平坦化位置情報ベクトルとのユークリッド距離が最も短い平坦化位置情報ベクトルを特定する。そして、高域符号化回路24は、特定された平坦化位置情報ベクトルに対応付けられている位置インデックスを、位置テーブルから取得する。   That is, the high frequency encoding circuit 24 selects the flattened position information vector having the shortest Euclidean distance from the flattened position information vector obtained in step S145 from the flattened position information vectors recorded in the position table. Identify. Then, the high frequency encoding circuit 24 acquires a position index associated with the specified flattened position information vector from the position table.

同様に、高域符号化回路24は、ゲインテーブルに記録されている平坦化ゲイン情報ベクトルのなかから、ステップS145で得られた平坦化ゲイン情報ベクトルとのユークリッド距離が最も短い平坦化ゲイン情報ベクトルを特定する。そして、高域符号化回路24は、特定された平坦化ゲイン情報ベクトルに対応付けられているゲインインデックスを、ゲインテーブルから取得する。   Similarly, the high frequency encoding circuit 24 uses the flattening gain information vector having the shortest Euclidean distance from the flattening gain information vector obtained in step S145 from the flattening gain information vectors recorded in the gain table. Is identified. Then, the high frequency encoding circuit 24 acquires a gain index associated with the specified flattening gain information vector from the gain table.

このようにして、位置インデックスとゲインインデックスが取得されると、続いてステップS147の処理が行なわれて、高域側の各スケールファクターバンドの高域スケールファクターバンドエネルギEobjが算出される。なお、ステップS147の処理は、図10のステップS76の処理と同様であるので、その説明は省略する。   When the position index and the gain index are acquired in this way, the process of step S147 is subsequently performed to calculate the high frequency scale factor band energy Eobj of each scale factor band on the high frequency side. Note that the processing in step S147 is the same as the processing in step S76 in FIG.

ステップS148において、高域符号化回路24は、各高域スケールファクターバンドエネルギEobjと、ステップS146で取得された位置インデックスおよびゲインインデックスとを、スカラ量子化等の符号化方式により符号化し、SBR情報を生成する。高域符号化回路24は、生成されたSBR情報を多重化回路25に供給する。   In step S148, the high-frequency encoding circuit 24 encodes each high-frequency scale factor band energy Eobj and the position index and gain index acquired in step S146 by an encoding method such as scalar quantization, and SBR information. Is generated. The high frequency encoding circuit 24 supplies the generated SBR information to the multiplexing circuit 25.

その後、ステップS149の処理が行なわれて、符号化処理は終了するが、ステップS149の処理は図10のステップS78の処理と同様であるので、その説明は省略する。   Thereafter, the process of step S149 is performed, and the encoding process ends. However, the process of step S149 is the same as the process of step S78 of FIG.

このようにして、エンコーダ11は、低域から平坦化帯域を検出し、各平坦化帯域の平坦化に用いる平坦化情報を得るための位置インデックスおよびゲインインデックスが含まれるSBR情報を、低域符号化データとともに出力する。これにより、エンコーダ11から出力されるビットストリームの情報量を削減することができる。   In this way, the encoder 11 detects the flattening band from the low band, and converts the SBR information including the position index and gain index to obtain the flattening information used for flattening each flattened band into the low band code. Output together with digitized data. Thereby, the information amount of the bit stream output from the encoder 11 can be reduced.

[復号処理の説明]
また、SBR情報に、位置インデックスおよびゲインインデックスが含まれている場合、デコーダ51の高域復号回路64には、位置テーブルとゲインテーブルが、予め記録されている。
[Description of decryption processing]
Further, when the SBR information includes a position index and a gain index, a position table and a gain table are recorded in advance in the high frequency decoding circuit 64 of the decoder 51.

このように、デコーダ51が位置テーブルとゲインテーブルを記録している場合、デコーダ51は、図13に示す復号処理を行なう。以下、図13のフローチャートを参照して、デコーダ51による復号処理について説明する。   As described above, when the decoder 51 records the position table and the gain table, the decoder 51 performs the decoding process shown in FIG. Hereinafter, the decoding process by the decoder 51 will be described with reference to the flowchart of FIG.

なお、ステップS171乃至ステップS174の処理は、図11のステップS101乃至ステップS104の処理と同様であるので、その説明は省略する。但し、ステップS174の処理では、SBR情報の復号により、高域スケールファクターバンドエネルギEobjと、位置インデックスおよびゲインインデックスとが得られる。   Note that the processing from step S171 to step S174 is the same as the processing from step S101 to step S104 in FIG. However, in the process of step S174, the high frequency scale factor band energy Eobj, the position index, and the gain index are obtained by decoding the SBR information.

ステップS175において、高域復号回路64は、位置インデックスおよびゲインインデックスに基づいて、平坦化位置情報ベクトルと平坦化ゲイン情報ベクトルを取得する。   In step S175, the high frequency decoding circuit 64 acquires a flattened position information vector and a flattened gain information vector based on the position index and the gain index.

すなわち、高域復号回路64は、記録している位置テーブルから、復号により得られた位置インデックスに対応付けられている平坦化位置情報ベクトルを取得し、ゲインテーブルから、復号により得られたゲインインデックスに対応付けられている平坦化ゲイン情報ベクトルを取得する。このようにして得られた平坦化位置情報ベクトルと平坦化ゲイン情報ベクトルから、各平坦化帯域の平坦化情報、つまり各平坦化帯域の平坦化位置情報と平坦化ゲイン情報が得られる。   That is, the high frequency decoding circuit 64 acquires the flattened position information vector associated with the position index obtained by decoding from the recorded position table, and the gain index obtained by decoding from the gain table. The flattening gain information vector associated with is acquired. From the flattening position information vector and the flattening gain information vector thus obtained, flattening information of each flattening band, that is, flattening position information and flattening gain information of each flattening band is obtained.

各平坦化帯域の平坦化情報が得られると、その後、ステップS176乃至ステップS180の処理が行なわれて復号処理は終了するが、これらの処理は、図11のステップS105乃至ステップS109の処理と同様であるので、その説明は省略する。   When the flattening information of each flattened band is obtained, the processing from step S176 to step S180 is performed thereafter, and the decoding process ends. These processes are the same as the processes from step S105 to step S109 in FIG. Therefore, the description thereof is omitted.

このようにして、デコーダ51は、SBR情報に含まれる位置インデックスおよびゲインインデックスから、各平坦化帯域の平坦化情報を得て平坦化帯域の平坦化を行い、高域側の各スケールファクターバンドの高域信号を生成する。このように、位置インデックスおよびゲインインデックスから平坦化情報を得るようにすることで、受信するビットストリームの情報量を削減することができる。   In this way, the decoder 51 obtains the flattening information of each flattened band from the position index and gain index included in the SBR information, flattenes the flattened band, and each scale factor band on the high frequency side. Generate a high frequency signal. Thus, by obtaining the flattening information from the position index and the gain index, it is possible to reduce the information amount of the received bit stream.

上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。   The series of processes described above can be executed by hardware or can be executed by software. When a series of processing is executed by software, a program constituting the software may execute various functions by installing a computer incorporated in dedicated hardware or various programs. For example, it is installed from a program recording medium in a general-purpose personal computer or the like.

図14は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。   FIG. 14 is a block diagram illustrating a hardware configuration example of a computer that executes the above-described series of processing by a program.

コンピュータにおいて、CPU(Central Processing Unit)201,ROM(Read Only Memory)202,RAM(Random Access Memory)203は、バス204により相互に接続されている。   In a computer, a central processing unit (CPU) 201, a read only memory (ROM) 202, and a random access memory (RAM) 203 are connected to each other by a bus 204.

バス204には、さらに、入出力インターフェース205が接続されている。入出力インターフェース205には、キーボード、マウス、マイクロホンなどよりなる入力部206、ディスプレイ、スピーカなどよりなる出力部207、ハードディスクや不揮発性のメモリなどよりなる記録部208、ネットワークインターフェースなどよりなる通信部209、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア211を駆動するドライブ210が接続されている。   An input / output interface 205 is further connected to the bus 204. The input / output interface 205 includes an input unit 206 including a keyboard, a mouse, and a microphone, an output unit 207 including a display and a speaker, a recording unit 208 including a hard disk and nonvolatile memory, and a communication unit 209 including a network interface. A drive 210 for driving a removable medium 211 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory is connected.

以上のように構成されるコンピュータでは、CPU201が、例えば、記録部208に記録されているプログラムを、入出力インターフェース205及びバス204を介して、RAM203にロードして実行することにより、上述した一連の処理が行われる。   In the computer configured as described above, the CPU 201 loads, for example, the program recorded in the recording unit 208 to the RAM 203 via the input / output interface 205 and the bus 204, and executes the program. Is performed.

コンピュータ(CPU201)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア211に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。   The program executed by the computer (CPU 201) is, for example, a magnetic disk (including a flexible disk), an optical disk (CD-ROM (Compact Disc-Read Only Memory), DVD (Digital Versatile Disc), etc.), a magneto-optical disk, or a semiconductor. The program is recorded on a removable medium 211 that is a package medium composed of a memory or the like, or provided via a wired or wireless transmission medium such as a local area network, the Internet, or digital satellite broadcasting.

そして、プログラムは、リムーバブルメディア211をドライブ210に装着することにより、入出力インターフェース205を介して、記録部208にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部209で受信し、記録部208にインストールすることができる。その他、プログラムは、ROM202や記録部208に、あらかじめインストールしておくことができる。   The program can be installed in the recording unit 208 via the input / output interface 205 by attaching the removable medium 211 to the drive 210. Further, the program can be received by the communication unit 209 via a wired or wireless transmission medium and installed in the recording unit 208. In addition, the program can be installed in the ROM 202 or the recording unit 208 in advance.

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。   The program executed by the computer may be a program that is processed in time series in the order described in this specification, or in parallel or at a necessary timing such as when a call is made. It may be a program for processing.

なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。   The embodiment of the present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the gist of the present invention.

11 エンコーダ, 22 低域符号化回路, 24 高域符号化回路, 25 多重化回路, 51 デコーダ, 61 非多重化回路, 63 QMF分析フィルタ処理部, 64 高域復号回路, 65 QMF合成フィルタ処理部   11 Encoder, 22 Low frequency encoding circuit, 24 High frequency encoding circuit, 25 Multiplexing circuit, 51 Decoder, 61 Demultiplexing circuit, 63 QMF analysis filter processing unit, 64 High frequency decoding circuit, 65 QMF synthesis filter processing unit

Claims (3)

音声信号の低域成分と、前記音声信号の高域成分を得るための高域情報とを抽出する抽出部と、
前記低域成分をQMF分析フィルタ処理して低域サブバンド信号を生成するQMF分析フィルタ処理部と、
前記低域サブバンド信号のエネルギおよび平均エネルギに基づいて前記低域サブバンド信号を平坦化する平坦化処理部と、
平坦化された前記低域サブバンド信号を高域に周波数シフトする周波数シフト部と、
前記高域に周波数シフトされた信号と前記高域情報とに基づいて、前記高域に周波数シフトされた信号のゲインを調整して高域サブバンド信号を生成する高域生成部と、
前記低域サブバンド信号と、前記高域サブバンド信号とをQMF合成フィルタにより合成して音声信号を生成するQMF合成フィルタ処理部と
を備える信号処理装置。
An extraction unit that extracts a low frequency component of the audio signal and high frequency information for obtaining a high frequency component of the audio signal;
A QMF analysis filter processing unit that generates a low-frequency subband signal by subjecting the low-frequency component to QMF analysis filter processing;
A flattening processing unit for flattening the low-frequency subband signal based on energy and average energy of the low-frequency subband signal;
A frequency shift unit that frequency-shifts the flattened low-frequency subband signal to a high frequency;
A high-frequency generation unit that generates a high-frequency sub-band signal by adjusting a gain of the signal frequency-shifted to the high frequency based on the signal frequency-shifted to the high frequency and the high frequency information;
A signal processing apparatus comprising: a QMF synthesis filter processing unit that synthesizes the low frequency subband signal and the high frequency subband signal with a QMF synthesis filter to generate an audio signal.
音声信号の低域成分と、前記音声信号の高域成分を得るための高域情報とを抽出し、
前記低域成分をQMF分析フィルタ処理して低域サブバンド信号を生成し、
前記低域サブバンド信号のエネルギおよび平均エネルギに基づいて前記低域サブバンド信号を平坦化し、
平坦化された前記低域サブバンド信号を高域に周波数シフトし、
前記高域に周波数シフトされた信号と前記高域情報とに基づいて、前記高域に周波数シフトされた信号のゲインを調整して高域サブバンド信号を生成し、
前記低域サブバンド信号と、前記高域サブバンド信号とをQMF合成フィルタにより合成して音声信号を生成する
ステップを含む信号処理方法。
Extracting the low frequency component of the audio signal and the high frequency information for obtaining the high frequency component of the audio signal,
The low frequency component is subjected to QMF analysis filtering to generate a low frequency sub-band signal,
Flatten the low band subband signal based on the energy and average energy of the low band subband signal;
Frequency-shifting the flattened low-frequency subband signal to a high frequency,
Based on the signal frequency shifted to the high frequency and the high frequency information, the gain of the signal frequency shifted to the high frequency is adjusted to generate a high frequency sub-band signal,
A signal processing method including a step of generating an audio signal by synthesizing the low frequency subband signal and the high frequency subband signal by a QMF synthesis filter.
音声信号の低域成分と、前記音声信号の高域成分を得るための高域情報とを抽出し、
前記低域成分をQMF分析フィルタ処理して低域サブバンド信号を生成し、
前記低域サブバンド信号のエネルギおよび平均エネルギに基づいて前記低域サブバンド信号を平坦化し、
平坦化された前記低域サブバンド信号を高域に周波数シフトし、
前記高域に周波数シフトされた信号と前記高域情報とに基づいて、前記高域に周波数シフトされた信号のゲインを調整して高域サブバンド信号を生成し、
前記低域サブバンド信号と、前記高域サブバンド信号とをQMF合成フィルタにより合成して音声信号を生成する
ステップを含む処理をコンピュータに実行させるプログラム。
Extracting the low frequency component of the audio signal and the high frequency information for obtaining the high frequency component of the audio signal,
The low frequency component is subjected to QMF analysis filtering to generate a low frequency sub-band signal,
Flatten the low band subband signal based on the energy and average energy of the low band subband signal;
Frequency-shifting the flattened low-frequency subband signal to a high frequency,
Based on the signal frequency shifted to the high frequency and the high frequency information, the gain of the signal frequency shifted to the high frequency is adjusted to generate a high frequency sub-band signal,
A program that causes a computer to execute a process including a step of generating an audio signal by combining the low-frequency subband signal and the high-frequency subband signal with a QMF synthesis filter.
JP2017176432A 2017-09-14 2017-09-14 Signal processing apparatus and method, and program Active JP6439843B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017176432A JP6439843B2 (en) 2017-09-14 2017-09-14 Signal processing apparatus and method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017176432A JP6439843B2 (en) 2017-09-14 2017-09-14 Signal processing apparatus and method, and program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015256423A Division JP6210338B2 (en) 2015-12-28 2015-12-28 Signal processing apparatus and method, and program

Publications (2)

Publication Number Publication Date
JP2017223996A JP2017223996A (en) 2017-12-21
JP6439843B2 true JP6439843B2 (en) 2018-12-19

Family

ID=60686962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017176432A Active JP6439843B2 (en) 2017-09-14 2017-09-14 Signal processing apparatus and method, and program

Country Status (1)

Country Link
JP (1) JP6439843B2 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003316394A (en) * 2002-04-23 2003-11-07 Nec Corp System, method, and program for decoding sound
JP5141180B2 (en) * 2006-11-09 2013-02-13 ソニー株式会社 Frequency band expanding apparatus, frequency band expanding method, reproducing apparatus and reproducing method, program, and recording medium
JP4930320B2 (en) * 2006-11-30 2012-05-16 ソニー株式会社 Reproduction method and apparatus, program, and recording medium
WO2009054393A1 (en) * 2007-10-23 2009-04-30 Clarion Co., Ltd. High range interpolation device and high range interpolation method
CN102099855B (en) * 2008-08-08 2012-09-26 松下电器产业株式会社 Spectral smoothing device, encoding device, decoding device, communication terminal device, base station device, and spectral smoothing method
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension

Also Published As

Publication number Publication date
JP2017223996A (en) 2017-12-21

Similar Documents

Publication Publication Date Title
JP6075743B2 (en) Signal processing apparatus and method, and program
US10381018B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
JP5942358B2 (en) Encoding apparatus and method, decoding apparatus and method, and program
KR101975066B1 (en) Signal processing device and method, and computer readable recording medium
WO2010024371A1 (en) Device and method for expanding frequency band, device and method for encoding, device and method for decoding, and program
JP2007017908A (en) Signal encoding apparatus and method, signal decoding apparatus and method, and program and recording medium
JP2011059714A (en) Signal encoding device and method, signal decoding device and method, and program and recording medium
JP6439843B2 (en) Signal processing apparatus and method, and program
JP6210338B2 (en) Signal processing apparatus and method, and program
JP5569476B2 (en) Signal encoding apparatus and method, signal decoding apparatus and method, program, and recording medium
JP2005148539A (en) Audio signal encoding device and audio signal encoding method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181023

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181105

R151 Written notification of patent or utility model registration

Ref document number: 6439843

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151