JPH07202821A - High efficiency coding voice decoder - Google Patents

High efficiency coding voice decoder

Info

Publication number
JPH07202821A
JPH07202821A JP5348433A JP34843393A JPH07202821A JP H07202821 A JPH07202821 A JP H07202821A JP 5348433 A JP5348433 A JP 5348433A JP 34843393 A JP34843393 A JP 34843393A JP H07202821 A JPH07202821 A JP H07202821A
Authority
JP
Japan
Prior art keywords
scale factor
frequency
maximum value
outputting
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5348433A
Other languages
Japanese (ja)
Inventor
Masami Aizawa
雅己 相沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5348433A priority Critical patent/JPH07202821A/en
Publication of JPH07202821A publication Critical patent/JPH07202821A/en
Pending legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

PURPOSE:To eliminate the need for addition of hardware such as a distribute filter and a synthesis filter after complete decoding by providing various adjustment to a high efficiency coding voice signal on the way of voice decoding. CONSTITUTION:A de-format section 12 analyzes a bit stream subject to high efficiency coding to separate allocation information, a scale factor and a frequency sampling thereby implementing de-formatting and the result is fed to a reproduction section 14, in which inverse quantization of a frequency sampling and inverse scaling processing are implemented and its output is given to an inverse mapping section 16 and a decoded acoustic signal is outputted. The scale factor of the reproduction section 14 is fed to an output section 23, from which a maximum value for each prescribed period of the scale factor is outputted as range information. Furthermore, a quantization coefficient in the reproduction section 14 is optionally adjusted by an input section 21.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】高能率符号化された音声信号を復
号化する高能率符号化音声の復号化装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a high-efficiency coded speech decoding apparatus for decoding a high-efficiency coded speech signal.

【0002】[0002]

【従来の技術】従来利用されている音声圧縮は時間軸上
の相関を利用したADPCMや、準瞬時圧縮などであ
り、ここでいう高効率符号化音声信号は、音響信号に対
してスペクトル解析を行ない、人の聴覚心理モデルにも
とずき、聞こえない成分についての情報を削減すること
で大幅な圧縮を行なうものである。
2. Description of the Related Art Conventionally used speech compression is ADPCM utilizing correlation on a time axis, quasi-instantaneous compression, etc. The high-efficiency coded speech signal referred to here is a spectrum analysis of an acoustic signal. According to the human psychology model of human beings, a large amount of compression is performed by reducing the information about inaudible components.

【0003】図2(A)に示すように高能率符号化され
た信号、ビットストリームはヘッダーと、音声信号を周
波数帯域(バンド)に分割し、スケールファクターや、
周波数サンプルの情報量を示す割り当て情報(アロケー
ション情報)と、そのバンドのレンジ(指数情報)を示
すスケールファクターと、周波数サンプルとから構成さ
れている。
As shown in FIG. 2 (A), a signal and a bit stream which are highly efficient coded are divided into a header and an audio signal into frequency bands, and scale factors and
It is composed of allocation information (allocation information) indicating the information amount of the frequency sample, a scale factor indicating the range (index information) of the band, and the frequency sample.

【0004】図11(A)に従来の高能率音声復号化装
置を示す。
FIG. 11A shows a conventional high efficiency speech decoding apparatus.

【0005】入力されたビットストリーム111は、デ
フォーマット112において、アロケーション情報11
3aと、スケールファクター113bと、周波数サンプ
ル113cとに、アロケーション情報113aを参考に
して分割される。分割された周波数サンプル113c
は、再生部114により逆量子化、逆スケーリングされ
る。逆スケールリングされた周波数サンプル115は、
IFFTやIMDCTなどの周波数−時間軸変換の演算
を行う逆マッピング部116により、時間軸のデータに
変換され、オーバーラップ等の処理を施した後合成さ
れ、音響信号117として復元される。
The input bit stream 111 is allocated to the allocation information 11 in the deformat 112.
3a, the scale factor 113b, and the frequency sample 113c are divided with reference to the allocation information 113a. Divided frequency samples 113c
Is inversely quantized and inversely scaled by the reproducing unit 114. The inverse scaled frequency samples 115 are
The inverse mapping unit 116, which performs a frequency-time axis conversion operation such as IFFT or IMDCT, converts the data into time axis data, performs processing such as overlap, and then synthesizes the data to restore the sound signal 117.

【0006】復元した音響信号117は、分配フィルタ
ー118に送られる。分配フィルター118は音声を周
波数分解し、複数の帯域に分割し、レベル調整部120
に伝送する。入力部121は、各帯域の増減比率を与え
るための情報122を出力するもので、この情報122
により、レベル調整部120では帯域ごとに増幅、減衰
が行われ、その出力は、統合フィルター126に伝送さ
れる。また、調整を行われた各帯域の信号125はある
一定の期間、例えば100msの間の最大値が求めら
れ、帯域ごとに出力部123に送られる。出力部123
では各帯域のレベルをインジケーター等で表示する。統
合フィルター126は周波数ごとに分割された信号12
5を合成し、音響信号127として出力する。
The restored acoustic signal 117 is sent to the distribution filter 118. The distribution filter 118 frequency-decomposes the sound and divides it into a plurality of bands, and the level adjusting unit 120
To transmit. The input unit 121 outputs information 122 for giving the increase / decrease ratio of each band.
As a result, the level adjusting unit 120 performs amplification and attenuation for each band, and the output thereof is transmitted to the integrated filter 126. Further, the adjusted signal 125 of each band is determined to have a maximum value for a certain period, for example, 100 ms, and is sent to the output unit 123 for each band. Output unit 123
Then, the level of each band is displayed by an indicator or the like. The integrated filter 126 divides the signal 12 into frequency components.
5 is synthesized and output as an acoustic signal 127.

【0007】次に図11(B)を用いて再生部114で
の処理について説明する。
Next, the processing in the reproducing section 114 will be described with reference to FIG.

【0008】逆量子化部134ではデフォーマットされ
た周波数サンプル113cをアロケーション情報113
aにもとずき、逆量子化し、逆スケーリング部136に
伝送する。逆量子化は次の式により行う。
The dequantization unit 134 converts the reformatted frequency samples 113c into allocation information 113.
Based on a, it is inversely quantized and transmitted to the inverse scaling unit 136. Inverse quantization is performed by the following formula.

【0009】s′=c×(s+d) ここでc,dは逆量子化係数といわれ、アロケーション
情報が示す、量子化ステップ数により定まる。逆量子化
係数c,dを表1に示す。
S '= c * (s + d) Here, c and d are called inverse quantization coefficients and are determined by the number of quantization steps indicated by the allocation information. Table 1 shows the inverse quantized coefficients c and d.

【0010】係数算出器137はレンジ情報であるスケ
ールファクター113bから逆スケーリングに必要な乗
数138を、テーブルを参照、あるいは演算により求
め、逆スケーリングに必要な乗数値138を伝送する。
スケールファクター113bは6ビット、2dBステッ
プの離散値を表している場合、逆スケーリングに必要な
乗数値138をdB、つまり指数の値からを、テーブル
等を利用し、乗数値を算出しなくてはならない。その一
例としてスケールファクター113bと乗数値との関係
を表2に示す。逆スケーリング部136では、逆量子化
された信号を係数算出器137により求められた各バン
ドの乗数値138を乗算し、出力する。
The coefficient calculator 137 obtains a multiplier 138 required for inverse scaling from the scale factor 113b, which is range information, by referring to a table or by calculation, and transmits a multiplier value 138 required for inverse scaling.
When the scale factor 113b represents 6 bits and a discrete value of 2 dB steps, the multiplier value 138 required for inverse scaling is calculated in dB, that is, from the value of the exponent, using a table or the like to calculate the multiplier value. I won't. As an example, Table 2 shows the relationship between the scale factor 113b and the multiplier value. The inverse scaling unit 136 multiplies the inversely quantized signal by the multiplier value 138 of each band obtained by the coefficient calculator 137, and outputs the result.

【0011】[0011]

【発明が解決しようとする課題】上記した高能率音声符
号化信号の復号装置によると、イコライザーなどの音質
を操作するアプリケーションを行う場合、図11に示し
たように、一度、完全な復号を行いに音響信号117を
得てから、分配フィルターにて帯域毎に分配して調整や
レンジの表示を行い、最後に調整された各信号を合成す
るという手法が取られており、分配フィルタや統合フィ
ルターといったハードウェアが必要で、回路規模、及び
価格の面で不利である。
According to the above-described highly efficient speech coded signal decoding apparatus, when an application for manipulating sound quality such as an equalizer is performed, complete decoding is performed once as shown in FIG. After the acoustic signal 117 has been obtained, the distribution filter distributes each band for adjustment and range display, and finally the adjusted signals are combined. Such hardware is required, which is disadvantageous in terms of circuit scale and price.

【0012】そこでこの発明は、分配フィルタや統合フ
ィルターといったハードウェアを不要とし、復号の過程
において各種の音声調整が可能であり、またレンジ情報
の取りだしが可能な高能率符号化音声の復号化装置を提
供することを目的とする。
Therefore, the present invention eliminates the need for hardware such as a distribution filter and an integrated filter, allows various voice adjustments in the decoding process, and is a highly efficient coded voice decoding device capable of extracting range information. The purpose is to provide.

【0013】[0013]

【課題を解決するための手段】[Means for Solving the Problems]

(1)高能率符号化されたビットストリームを解析し、
アロケーション情報、スケールファクター、周波数サン
プルを分離してデフォーマットする手段と、該スケール
ファクター、または周波数データの、一定期間ごとの最
大値または、平均値を出力する手段と、該最大値または
平均値を表示する手段と、該スケールファクターによ
り、周波数サンプルを逆量子化する手段と、逆量子化さ
れた周波数サンプルを周波数統合する手段とを有するこ
とを要旨とする。
(1) Analyze the high efficiency coded bit stream,
Means for separating and reformatting allocation information, scale factor, frequency samples, means for outputting the maximum value or average value of the scale factor or frequency data for each fixed period, and the maximum value or average value The gist of the present invention is to have means for displaying, means for dequantizing frequency samples by the scale factor, and means for frequency integrating the dequantized frequency samples.

【0014】(2)ビットストリームを解析し、アロケ
ーション情報、スケールファクター、周波数サンプルを
分離、デフォーマットする手段と、周波数サンプルを操
作する値を入力する手段と、入力手段のデータによりス
ケールファクターまたは周波数データを変更する手段
と、該スケールファクターにより、周波数サンプルを逆
量子化する手段と、逆量子化された周波数サンプルを周
波数統合する手段とを有することを要旨とする。
(2) A means for analyzing a bit stream and separating and reformatting allocation information, scale factor, and frequency samples, means for inputting values for operating frequency samples, and scale factor or frequency depending on the data of the input means. The gist of the present invention is to have means for changing data, means for dequantizing frequency samples by the scale factor, and means for frequency integrating the dequantized frequency samples.

【0015】[0015]

【作用】ビットストリームを解析し、アロケーション情
報、スケールファクター、周波数サンプルを分離、デフ
ォーマットし、逆量子化された周波数サンプルを周波数
統合する前段階の時点で、スケールファクター、または
周波数データの、一定期間ごとの最大値または、平均値
を出力し、表示を行うことにより、また周波数サンプル
を操作する値を入力し、スケールファクターまたは周波
数データを変更することにより、分析ファクター、統合
フィルターを不必要としている。
Operation: Before the bit stream is analyzed, the allocation information, the scale factor, the frequency samples are separated and reformatted, and the dequantized frequency samples are frequency integrated, the scale factor or the frequency data is kept constant. By outputting the maximum value or average value for each period and displaying it, and by inputting the value for operating the frequency sample, and changing the scale factor or frequency data, the analysis factor and integrated filter are unnecessary. There is.

【0016】[0016]

【実施例】以下、この発明の実施例について図面を参照
しながら説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0017】図1(A)、(B)はこの発明の実施例に
おける全体の構成を示すブロック図である。
FIGS. 1A and 1B are block diagrams showing the overall construction of an embodiment of the present invention.

【0018】図2(A)に示すように高能率符号化され
た信号(ビットストリーム)は、ヘッダーと、音声信号
を周波数帯域(バンド)に分割し、スケールファクター
や周波数サンプルの情報量を示す割り当て情報(アロケ
ーション情報)と、そのバンドのレンジ(指数情報)を
示すスケールファクターと、周波数サンプルとから構成
される。
As shown in FIG. 2 (A), the signal (bit stream) coded with high efficiency is obtained by dividing the header and the audio signal into frequency bands, and indicates the scale factor and the information amount of frequency samples. It is composed of allocation information (allocation information), a scale factor indicating the range of the band (index information), and frequency samples.

【0019】図1(A)は、この発明の高能率復号化装
置の第1の実施例である。
FIG. 1A shows the first embodiment of the high-efficiency decoding device of the present invention.

【0020】入力された上記ビットストリーム11は、
デフォーマット部12において、アロケーション情報1
3aと、スケールファクター13bと、アロケーション
情報13aを参考にして分割された周波数サンプルとに
分離されて、再生部14に送られる。
The input bit stream 11 is
In the reformatting unit 12, allocation information 1
3a, the scale factor 13b, and the frequency samples divided by referring to the allocation information 13a are sent to the reproducing unit 14.

【0021】再生部14では、分割された周波数サンプ
ル13cを量子化、逆スケーリングし、逆マッピング部
16に伝送する。逆マッピング部16では周波数統合が
行われる。また、ある一定の周期、例えば100msの
間の、スケールファクター13bまたは逆スケーリング
された周波数サンプル15の各帯域の最大値あるいは平
均値が求められて、出力部23に送られる。出力部23
では各帯域のレベルを表示手段であるインジケーター
(図示せず)等で表示する。
The reproducing unit 14 quantizes and descales the divided frequency sample 13c, and transmits it to the inverse mapping unit 16. The inverse mapping unit 16 performs frequency integration. Further, the maximum value or the average value of each band of the scale factor 13b or the inversely scaled frequency sample 15 for a certain fixed period, for example, 100 ms, is obtained and sent to the output unit 23. Output unit 23
Then, the level of each band is displayed by an indicator (not shown) which is a display means.

【0022】さらに逆スケーリングされた周波数サンプ
ル15は、IFFT(逆フーリエ変換)やIMDCT
(逆離散コサイン変換)などの周波数−時間軸変換の演
算を行う逆マッピング部16により、周波数統合されて
時間軸のデータに変換され、さらにオーバーラップ等の
処理が施されて合成され、音響信号17として復元され
る。
Further, the inversely scaled frequency sample 15 is subjected to IFFT (Inverse Fourier Transform) or IMDCT.
An inverse mapping unit 16 that performs a frequency-time axis conversion operation such as (inverse discrete cosine transform) frequency-integrates and converts the data into time-axis data, further performs processing such as overlap and synthesizes the acoustic signal. Restored as 17.

【0023】上記のように第1の実施例が構成され、再
生部14では後述するように、スケールファクターある
いは周波数データを用いて、再生部14への入力信号あ
るいは再生部14から出力される信号のレンジ情報を得
ることができる。つまり、従来の如く、完全な復号が済
んだ後で、レンジ情報を得るための手段を設ける必要が
ない。
The first embodiment is configured as described above, and the reproducing section 14 uses a scale factor or frequency data, as will be described later, to input a signal to the reproducing section 14 or a signal output from the reproducing section 14. The range information of can be obtained. That is, unlike the conventional technique, it is not necessary to provide a means for obtaining range information after complete decoding.

【0024】図1(B)には、この発明の高能率復号化
装置の第2の実施例を示す。
FIG. 1B shows a second embodiment of the high efficiency decoding apparatus of the present invention.

【0025】入力されたビットストリーム11は、デフ
ォーマット部12よりアロケーション情報13aと、ス
ケールファクター13bと周波数サンプル13cをアロ
ケーション情報13aを参考に、分割し、再生部14に
送られる。
The input bit stream 11 is divided by the deformatting unit 12 into allocation information 13a, scale factor 13b and frequency samples 13c with reference to the allocation information 13a and sent to the reproducing unit 14.

【0026】入力部21では各帯域の増減比率を入力
し、コントロール信号22を再生部14に送る。再生部
14ではコントロール信号22により帯域ごとに増幅、
減衰を行い、分割された周波数サンプル13cを量子
化、逆スケーリングし、逆マッピング部6に伝送する。
The input section 21 inputs the increase / decrease rate of each band and sends the control signal 22 to the reproducing section 14. The reproduction unit 14 amplifies each band by the control signal 22,
The frequency sample 13 c that has been attenuated and divided is quantized, inversely scaled, and transmitted to the inverse mapping unit 6.

【0027】逆スケーリングされた周波数サンプル15
はIFFTやIMDCTなどの周波数−時間軸変換の演
算を行う逆マッピング部16により、時間軸のデータに
変換され、オーバーラップ等の処理が施されて合成さ
れ、音響信号17として復元される。
Descaled frequency samples 15
Is converted into time axis data by an inverse mapping unit 16 such as IFFT or IMDCT, which performs frequency-time axis conversion calculation, is subjected to processing such as overlap, is synthesized, and is restored as an acoustic signal 17.

【0028】上記のように第2の実施例が構成され、再
生部14では後述するように、入力部21からのコント
ロール信号22を用いて、各種の音声調整を得ることが
できる。つまり、従来の如く、完全な復号が済んだ後
で、音声調整を行うための手段を設ける必要がない。
The second embodiment is configured as described above, and the reproducing unit 14 can obtain various audio adjustments by using the control signal 22 from the input unit 21 as described later. That is, unlike the conventional case, it is not necessary to provide a means for performing voice adjustment after complete decoding.

【0029】次に、図1(A)、図1(B)で実現され
ている再生部14の各種例について説明する。
Next, various examples of the reproducing section 14 realized in FIGS. 1A and 1B will be described.

【0030】図2(B)は、図1(A)の再生部14の
処理ブロックを示している。
FIG. 2B shows processing blocks of the reproducing section 14 of FIG. 1A.

【0031】逆量子化部34では、デフォーマットされ
た周波数サンプル13cをアロケーション情報13aに
もとずき、逆量子化し、逆スケーリング部36に伝送す
る。逆量子化は次の式により行う。
The dequantization section 34 dequantizes the frequency-formatted frequency sample 13c based on the allocation information 13a, dequantizes it, and transmits it to the descaling section 36. Inverse quantization is performed by the following formula.

【0032】s′=c×(s+d) ここでc,dは逆量子化係数といわれ、アロケーション
情報が示す量子化ステップ数により定まる。逆量子化係
数c,dの例を図3に示す。
S '= c * (s + d) Here, c and d are called inverse quantization coefficients and are determined by the number of quantization steps indicated by the allocation information. An example of the inverse quantized coefficients c and d is shown in FIG.

【0033】係数算出器37は、レンジ情報であるスケ
ールファクター13bから逆スケーリングに必要な乗数
38を、テーブルを参照、あるいは演算により求め、逆
スケーリング部36に必要な乗数値38を伝送する。ス
ケールファクター13bは、6ビット、2dBステップ
の離散値を表している場合、逆スケーリングに必要な乗
数値38をdB、つまり指数の値からテーブル等を利用
し、乗数値を算出しなくてはならない。その一例として
スケールファクター13bと乗数値との関係を図4に示
す。逆スケーリング部36では、逆量子化された信号を
係数算出器37により求められた各バンドの乗数値38
を乗算し出力する。
The coefficient calculator 37 obtains a multiplier 38 required for inverse scaling from the scale factor 13b, which is range information, by referring to a table or by calculation, and transmits the required multiplier value 38 to the inverse scaling unit 36. When the scale factor 13b represents 6 bits and a discrete value of 2 dB steps, the multiplier value 38 required for inverse scaling must be calculated from dB, that is, the value of the exponent, using a table or the like. . As an example thereof, FIG. 4 shows the relationship between the scale factor 13b and the multiplier value. In the inverse scaling unit 36, the inversely quantized signal is multiplied by the multiplier value 38 of each band obtained by the coefficient calculator 37.
Is multiplied and output.

【0034】(インジケーターとしての機能)図2
(B)において、スケールファクターは、比較器/加算
器40にも入力される。比較器/加算器40は、ある一
定期間、例えば5フレーム(1フレームは20msとし
て)のスケールファクターの比較を行い、最大値を得
て、その期間の各帯域のレンジ情報24として出力す
る。
(Function as Indicator) FIG. 2
In (B), the scale factor is also input to the comparator / adder 40. The comparator / adder 40 compares the scale factors for a certain fixed period, for example, 5 frames (1 frame is 20 ms), obtains the maximum value, and outputs it as the range information 24 of each band in the period.

【0035】または比較器/加算器40はある一定期
間、例えば5フレーム(1フレームは20msとして)
のスケールファクターの加算を行い、平均値(合計値)
を得て、その期間の各帯域のレンジ情報24として出力
する。
Alternatively, the comparator / adder 40 has a fixed period of time, for example, 5 frames (one frame is 20 ms).
Add the scale factors of and average (total value)
Is obtained and is output as the range information 24 of each band in the period.

【0036】上記の例は再生部14へ入力する入力信号
のレンジ情報24を得る例として説明した。しかし、レ
ンジ情報は、再生部14の出力信号から得る場合もあ
る。
The above example has been described as an example of obtaining the range information 24 of the input signal input to the reproducing unit 14. However, the range information may be obtained from the output signal of the reproducing unit 14.

【0037】図2(C)に示すように、逆スケーリング
部36の出力が、比較器/加算器40に供給される。比
較器/加算器40は、例えば5フレームの逆スケーリン
グされた周波数サンプル15の二乗の加算を行い、平均
値(合計値)を得て、その期間の各帯域のレンジ情報2
4として出力する。
As shown in FIG. 2C, the output of the inverse scaling section 36 is supplied to the comparator / adder 40. The comparator / adder 40 performs square addition of the inversely scaled frequency samples 15 of, for example, 5 frames to obtain an average value (total value), and the range information 2 of each band in the period.
Output as 4.

【0038】(イコライザーとしての機能)図5には、
図1(B)の再生部14について示している。
(Function as Equalizer) FIG.
The reproduction unit 14 of FIG. 1B is shown.

【0039】逆量子化部34ではデフォーマットされた
周波数サンプル13cをアロケーション情報13aにも
とずき、逆量子化し、逆スケーリング部36に伝送す
る。逆量子化は次の式により行う。
The dequantization section 34 dequantizes the frequency-formatted sample 13c based on the allocation information 13a, and transmits it to the descaling section 36. Inverse quantization is performed by the following formula.

【0040】s′=c×(s+d) ここでc,dは逆量子化係数といわれ、アロケーション
情報が示す、量子化ステップ数により定まる。逆量子化
係数c,dを図3に示す。
S '= c * (s + d) Here, c and d are called inverse quantization coefficients and are determined by the number of quantization steps indicated by the allocation information. The inverse quantization coefficients c and d are shown in FIG.

【0041】係数算出器37はレンジ情報であるスケー
ルファクター13bから逆スケーリングに必要な乗数3
8を、テーブルを参照、あるいは演算により求め、逆ス
ケーリングに必要な乗数値38を伝送する。スケールフ
ァクター13bは6ビット、2dBステップの離散値を
表している場合、逆スケーリングに必要な乗数値38を
dB、つまり指数の値からを、テーブル等を利用し、乗
数値を算出しなくてはならない。その一例としてスケー
ルファクター13bと乗数値との関係を図4に示す。
The coefficient calculator 37 calculates the multiplier 3 required for inverse scaling from the scale factor 13b which is range information.
8 is obtained by referring to a table or by calculation, and a multiplier value 38 required for inverse scaling is transmitted. When the scale factor 13b represents 6 bits and a discrete value of 2 dB steps, the multiplier value 38 required for inverse scaling is calculated in dB from the exponent value by using a table or the like. I won't. As an example thereof, FIG. 4 shows the relationship between the scale factor 13b and the multiplier value.

【0042】ここで入力値22に応じて、帯域毎にスケ
ールファクター13bあるいは乗数値38を増減させ
る。またスケールファクターは離散値であるため、入力
値22により次の値に変化させる場合、急激に変化する
ので、スケールファクター値を変えるのでなく、乗数値
に窓関数をかけることで、滑らかに変化(図6(A)参
照)させ、ノイズの発生を低減させるようにしている。
Here, the scale factor 13b or the multiplier value 38 is increased or decreased for each band according to the input value 22. Also, since the scale factor is a discrete value, when it is changed to the next value by the input value 22, it changes abruptly. Therefore, instead of changing the scale factor value, it is possible to smoothly change it by applying a window function to the multiplier value ( 6A), the generation of noise is reduced.

【0043】逆スケーリング部36では、逆量子化され
た信号を係数算出器37により求められた各バンドの乗
数値38を乗算し、出力する。
The inverse scaling unit 36 multiplies the inversely quantized signal by the multiplier value 38 of each band obtained by the coefficient calculator 37, and outputs it.

【0044】また図6(B)に示すように、乗数変化の
調整値テーブル41を持ち、各種モードに選択するだけ
で、個々の帯域のレベル調整値42を決定し、これを係
数算出器37に与えるようにしても良い。
Further, as shown in FIG. 6B, a level change value 42 for each band is determined only by having an adjustment value table 41 for the multiplier change and selecting various modes, and this is calculated by the coefficient calculator 37. You may give it to.

【0045】以上、説明したように、各帯域のスケール
ファクター値、または乗数値を変化させることで様々な
アプリケーションを実現できる。
As described above, various applications can be realized by changing the scale factor value or the multiplier value of each band.

【0046】次に、上述したようなイコライザー機能を
応用したアプリケーションの各種について説明する。
Next, various kinds of applications to which the equalizer function as described above is applied will be described.

【0047】(LRバランス)図1(B)の構成におい
て、入力部21を調整する場合、各帯域ごとの値でな
く、幾つかの帯域をグルーピングして同時に変化させる
ことが可能である。
(LR balance) In the configuration of FIG. 1B, when adjusting the input section 21, it is possible to group not only the values for each band but also several bands and change them simultaneously.

【0048】図7は、入力部21の入力パネルの例を示
している。例えば、チャンネルごといっせいに全バンド
のスケールファクターを変化させるような場合、Lチャ
ンネルならLチャンネルだけのtotal調整81を増
減させたり、またはLR調整82を増減することでLチ
ャンネルを下げながら、Rチャンネルを上げたりなど
で、LRのバランス調整を行うようなアプリケーション
が可能である。
FIG. 7 shows an example of the input panel of the input section 21. For example, when changing the scale factors of all the bands at the same time for each channel, if the L channel is used, the total adjustment 81 of only the L channel may be increased or decreased, or the LR adjustment 82 may be increased or decreased to lower the L channel while changing the R channel. An application that adjusts the balance of the LR by raising or the like is possible.

【0049】(バスブースト)図1(B)の入力部21
に、バスブーストモードを選択した情報を送ると、図6
(B)における調整値テーブル41は、図8(A)に示
すテーブルを適用し、スケールファクターを補正する。
これにより低減を強調した効果が実現する。つまり、調
整値テーブルは、周波数バンドに応じて低域を強調する
ゲインを得られるようにデータが設定されている。
(Bass Boost) Input unit 21 of FIG. 1 (B)
If you send the information that selected the bass boost mode to
As the adjustment value table 41 in (B), the table shown in FIG. 8A is applied to correct the scale factor.
As a result, the effect emphasizing the reduction is realized. That is, data is set in the adjustment value table so that a gain that emphasizes the low frequency range can be obtained according to the frequency band.

【0050】(ラウドネス補正)人間の聴覚は音の周波
数により感度が異なり、音圧を変化させた場合、聴感上
の変化は帯域によって異なっている。例えばヴォーリュ
ームを絞った場合など、高域と低域が中域に比べ、より
音量が下がった感じになる。それを補正することも容易
である。
(Loudness Correction) Human auditory sense has different sensitivity depending on the frequency of the sound, and when the sound pressure is changed, the change in the auditory sense differs depending on the band. For example, when you turn down the volume, the high range and low range feel more quiet than the mid range. It is easy to correct it.

【0051】図1(B)の入力部21に、出力音響信号
のヴォーリューム(音圧レベル調整)の値、またはラウ
ドネスモードを選択した情報を送るようにする。このと
き、図6(B)に示した調整値テーブル41には、ヴォ
ーリュームが低い場合、またはラウドネスモードが選択
された場合は、図8(B)に示すようなテーブルを送
り、低域と高域の乗数値を上げるように設定される。あ
るいはヴォーリューム量に応じて、適切なテーブルを選
択するか、演算により算出するようになっている。
The value of the volume (sound pressure level adjustment) of the output acoustic signal or the information for selecting the loudness mode is sent to the input section 21 of FIG. 1 (B). At this time, when the volume is low or the loudness mode is selected, the adjustment value table 41 shown in FIG. 6 (B) sends a table as shown in FIG. It is set to increase the multiplier value in the high range. Alternatively, an appropriate table is selected or calculated by calculation according to the volume amount.

【0052】(サウンドエフェクト;周波数チェンジャ
ー、音質変化)周波数サンプルをバンド間で交換する
(図9(A)参照)、またはほかのバンドに複写するこ
とで人工的に倍音を作る(図9(B)参照)、または周
波数サンプルを帯域をずらすことでピッチシフトを実現
する(図9(C)参照)などの各種の特殊効果を実現す
ることができる。これは、量子化信号が、周波数バンド
で分かれた量子化係数であるために、その係数を可変し
たり、または、各係数の加算等が容易であるからであ
る。
(Sound Effect; Frequency Changer, Tone Change) Frequency samples are exchanged between bands (see FIG. 9A) or copied to another band to artificially create overtones (FIG. 9B). )), Or by shifting the band of the frequency samples to realize pitch shift (see FIG. 9C), and other various special effects can be realized. This is because the quantized signal is a quantized coefficient divided in frequency bands, so that it is easy to change the coefficient or to add each coefficient.

【0053】また、以上の操作を逆量子化部34の前、
つまり周波数サンプル13cの段階で、または逆量子化
の後、つまり信号35の段階で、行ってもかまわない。
Further, the above operation is performed before the inverse quantizer 34,
That is, it may be performed at the stage of the frequency sample 13c or after the inverse quantization, that is, at the stage of the signal 35.

【0054】(エコー機能)図10(A)に示すように
周波数サンプル101と、フィードバックされた103
とを加算器102で加算して出力信号104とするとエ
コー効果を得ることができる。出力信号104はバッフ
ァ106に送られ、バッファ106は、その入力を外部
より設定された遅延量だけ遅らせて出力する。バッファ
106の出力は、減衰器105に入力され、外部より設
定された減衰率だけ減衰され、加算器102に送られ
る。以上、バンドごとに行い、バンドごとに異なった遅
延量、減衰率を設定し、エコーを実現することができ
る。
(Echo function) As shown in FIG. 10A, the frequency sample 101 and the feedback 103
The echo effect can be obtained by adding and with the adder 102 to form the output signal 104. The output signal 104 is sent to the buffer 106, and the buffer 106 delays its input by an externally set delay amount and outputs it. The output of the buffer 106 is input to the attenuator 105, attenuated by an externally set attenuation rate, and sent to the adder 102. As described above, it is possible to perform echo for each band by setting different delay amounts and attenuation rates for each band.

【0055】以上のエコー器は、図2の再生部の信号1
3cまたは、信号35、または信号15のいずれに対し
て行ってもよい。
The above echo device is the same as the signal 1 of the reproducing section of FIG.
3c, signal 35, or signal 15.

【0056】(各種ホール再現機能)図10(A)にお
けるエコー器において、バンドごとに異なった遅延量、
減衰率をテーブルとして、いくつかの代表値(サンプ
ル)を用意しておき、外部の選択入力によりそのテーブ
ルを選択してもよい。
(Various Hall Reproducing Functions) In the echo device shown in FIG. 10 (A), different delay amounts for each band,
It is also possible to prepare some representative values (samples) using the attenuation rate as a table and select the table by external selection input.

【0057】このようにすると、各種コンサートホール
などのデータ(テーブル)を用意して、選択することだ
け各種コンサートホールなどの状態を実現する。
In this way, the data (table) of various concert halls and the like are prepared and the state of various concert halls and the like is realized only by selecting.

【0058】(ラップ機能)図10(A)において、あ
る一定期間、例えば0.3秒の音声データバッファ10
6に取り込み、バッファ106に取り込んだデータをく
り返し、例えば3回出力し、出力された信号は減衰器1
05を通り、加算器102で周波数サンプルを加算せず
に、信号103をそのまま、信号104として出力する
ことでラップ機能を実現できる。つまり加算器102を
選択器として利用する。その後(この場合、0.9秒)
加算器102は、周波数サンプル101を信号103を
加算せずに、信号104として出力する。その0.3秒
のデータをバッファ106で取り込むといった動作を繰
り返すことでラップ効果が行える。この期間や、回数は
任意に設定できるようにする。また常に一定値をとらな
くとも、時間経過や、音声データの状態、例えば音圧が
下がった時をフレーズとして認識し、取り込み時間や、
回数を変えたりしてもよい。
(Wrap Function) In FIG. 10A, the audio data buffer 10 for a certain fixed period, for example, 0.3 seconds.
6, the data captured in the buffer 106 is repeatedly output, for example, three times, and the output signal is the attenuator 1
It is possible to realize the wrap function by outputting the signal 103 as it is as the signal 104 without passing the frequency sample in the adder 102 through 05. That is, the adder 102 is used as a selector. After that (0.9 seconds in this case)
The adder 102 outputs the frequency sample 101 as the signal 104 without adding the signal 103. The wrap effect can be achieved by repeating the operation of fetching the 0.3 second data in the buffer 106. This period and the number of times can be set arbitrarily. Also, even if it does not always take a constant value, it recognizes the passage of time, the state of voice data, such as when the sound pressure has decreased, as a phrase,
You may change the number of times.

【0059】図10(B)にそのタイミング図を示す。FIG. 10B shows the timing chart.

【0060】通常、再生部はDSP(デジタルシグナル
プロセッサ)等で処理されるため、ソフトウェアの変更
だけで、上記、各種のアプリケーションを実現できる。
Since the reproducing unit is usually processed by a DSP (digital signal processor) or the like, the above various applications can be realized only by changing the software.

【0061】[0061]

【発明の効果】以上説明したように本発明によれば、分
配フィルター、合成フィルターというハードウェアの追
加がなくても、各種のアプリケーションを実行できる。
As described above, according to the present invention, various applications can be executed without the addition of distribution filters and synthesis filters.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の実施例を示すブロック図。FIG. 1 is a block diagram showing an embodiment of the present invention.

【図2】高能率符号化音声のビットストリームを示す図
及び図1の再生部の詳細を示すブロック図。
FIG. 2 is a diagram showing a bit stream of high-efficiency coded audio and a block diagram showing details of a reproducing unit in FIG.

【図3】逆量子化係数の例を示す図。FIG. 3 is a diagram showing an example of inverse quantization coefficients.

【図4】スケールファクターの例を示す図。FIG. 4 is a diagram showing an example of a scale factor.

【図5】図1(B)の再生部の詳細を示すブロック図。FIG. 5 is a block diagram showing details of a reproducing unit in FIG.

【図6】スケールファクターを変化させるときの状態を
説明するために示した図及び再生部の他の例を示す図。
FIG. 6 is a diagram shown for explaining a state when a scale factor is changed and a diagram showing another example of a reproducing unit.

【図7】入力パネルの例を示す図。FIG. 7 is a diagram showing an example of an input panel.

【図8】再生部の音声調整機能の例を説明するために示
した図。
FIG. 8 is a diagram shown for explaining an example of a sound adjusting function of a reproducing unit.

【図9】再生部の他の音声調整機能の例を説明するため
に示した図。
FIG. 9 is a diagram shown for explaining an example of another audio adjusting function of the reproducing unit.

【図10】再生部のさらに他の音声調整機能の例を説明
するために示した図。
FIG. 10 is a diagram shown for explaining an example of still another audio adjusting function of the reproducing unit.

【図11】従来の高能率符号化音声信号の復号装置を示
す図。
FIG. 11 is a diagram showing a conventional high-efficiency coded speech signal decoding apparatus.

【符号の説明】[Explanation of symbols]

12…デフォーマット、14…再生部、16…逆マッピ
ング部、21…入力部、23…出力部、34…逆量子化
部、36…逆スケーリング部、37…係数算出器、40
…比較器/加算器。
12 ... Deformat, 14 ... Reproducing unit, 16 ... Inverse mapping unit, 21 ... Input unit, 23 ... Output unit, 34 ... Inverse quantization unit, 36 ... Inverse scaling unit, 37 ... Coefficient calculator, 40
... comparator / adder.

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】高能率符号化されたビットストリームか
ら、アロケーション情報、スケールファクター、周波数
サンプルを分離してデフォーマットするデフォーマット
手段と、 前記スケールファクターの一定期間ごとの最大値を出力
するレンジ情報出力手段と、 前記最大値を表示する表示手段と、 前記スケールファクターに応じて前記周波数サンプルを
逆量子化する逆量子化手段と、 前記逆量子化手段により逆量子化された周波数サンプル
を周波数統合する周波数統合手段とを具備したことを特
徴とする高能率符号化音声の復号化装置。
1. Deformatting means for separating and reformatting allocation information, scale factor, and frequency samples from a high-efficiency coded bit stream, and range information for outputting the maximum value of the scale factor for each constant period. Output means, display means for displaying the maximum value, dequantization means for dequantizing the frequency samples according to the scale factor, frequency integration of frequency samples dequantized by the dequantization means And a frequency unifying means for performing high efficiency coding speech decoding apparatus.
【請求項2】前記最大値を出力する手段における、スケ
ールファクターの代わりに前記逆量子化された周波数サ
ンプルの一定期間ごとの最大値を出力する手段を有した
ことを特徴とした請求項1記載の高能率符号化音声の復
号化装置。
2. The means for outputting the maximum value, further comprising means for outputting the maximum value of the dequantized frequency samples for each constant period instead of the scale factor. High-efficiency coded speech decoding device.
【請求項3】前記最大値を出力する手段における、最大
値の代わりに平均値を出力する手段を有したことを特徴
とする請求項1記載の高能率符号化音声の復号化装置。
3. The decoding apparatus for high efficiency coded speech according to claim 1, further comprising means for outputting an average value instead of the maximum value in the means for outputting the maximum value.
【請求項4】前記最大値を出力する手段における、最大
値の代わりに平均値を出力する手段を有したことを特徴
とする請求項2記載の高能率符号化音声の復号化装置。
4. The decoding apparatus for high efficiency coded speech according to claim 2, further comprising means for outputting an average value instead of the maximum value in the means for outputting the maximum value.
【請求項5】高能率符号化されたビットストリームか
ら、アロケーション情報、スケールファクター、周波数
サンプルを分離、デフォーマットするデフォーマット手
段と、前記周波数サンプルを操作するための値を入力す
る入力手段と、 前記入力手段のデータにより前記スケールファクターを
変更する調整手段と、 前記調整手段から得られたスケールファクターにより、
前記周波数サンプルを逆量子化する逆量子化手段と、 逆量子化手段により逆量子化された周波数サンプルを周
波数統合する手段とを具備したことを特徴とする高能率
符号化音声の復号化装置。
5. Deformatting means for separating and reformatting allocation information, scale factor, and frequency samples from a high-efficiency coded bit stream, and input means for inputting values for operating the frequency samples. Adjusting means for changing the scale factor according to the data of the input means, and the scale factor obtained from the adjusting means,
An apparatus for decoding highly efficient coded speech, comprising: an inverse quantizer for inversely quantizing the frequency sample; and a means for frequency integrating the frequency samples inversely quantized by the inverse quantizer.
【請求項6】前記スケールファクターを変更する調整手
段におけるスケールファクターの代わりに逆量子化され
た周波数サンプルを変更する手段を有したことを特徴と
する請求項5記載の高能率符号化音声の復号化装置。
6. Decoding of high-efficiency coded speech according to claim 5, further comprising means for changing the dequantized frequency sample instead of the scale factor in the adjusting means for changing the scale factor. Device.
JP5348433A 1993-12-27 1993-12-27 High efficiency coding voice decoder Pending JPH07202821A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5348433A JPH07202821A (en) 1993-12-27 1993-12-27 High efficiency coding voice decoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5348433A JPH07202821A (en) 1993-12-27 1993-12-27 High efficiency coding voice decoder

Publications (1)

Publication Number Publication Date
JPH07202821A true JPH07202821A (en) 1995-08-04

Family

ID=18396979

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5348433A Pending JPH07202821A (en) 1993-12-27 1993-12-27 High efficiency coding voice decoder

Country Status (1)

Country Link
JP (1) JPH07202821A (en)

Similar Documents

Publication Publication Date Title
US8971551B2 (en) Virtual bass synthesis using harmonic transposition
JP4000261B2 (en) Stereo sound signal processing method and apparatus
US8676361B2 (en) Acoustical virtual reality engine and advanced techniques for enhancing delivered sound
JP4934427B2 (en) Speech signal decoding apparatus and speech signal encoding apparatus
US7379866B2 (en) Simple noise suppression model
JP5302980B2 (en) Apparatus for mixing multiple input data streams
JP4786987B2 (en) Efficient and scalable parametric stereo coding for low bit rate audio coding
KR101443568B1 (en) Audio decoder
US6687663B1 (en) Audio processing method and apparatus
JP3513292B2 (en) Noise weight filtering method
WO2013031953A1 (en) Mixing device, mixing signal processing device, mixing program and mixing method
US20090204397A1 (en) Linear predictive coding of an audio signal
US6278387B1 (en) Audio encoder and decoder utilizing time scaling for variable playback
JP5192630B2 (en) Perceptually improved enhancement of coded acoustic signals
JPH09153811A (en) Encoding/decoding method/device and video conference system using the same
WO2005093717A1 (en) Synthesizing a mono audio signal based on an encoded miltichannel audio signal
JP2004258672A (en) Apparatus and method for determining quality of signal
EP2720477B1 (en) Virtual bass synthesis using harmonic transposition
JPH09204200A (en) Conferencing system
KR100477701B1 (en) An MPEG audio encoding method and an MPEG audio encoding device
JP3254953B2 (en) Highly efficient speech coding system
JPH07202821A (en) High efficiency coding voice decoder
JP4997781B2 (en) Mixdown method and mixdown apparatus
JP3138574B2 (en) Linear prediction coefficient interpolator
JP3593201B2 (en) Audio decoding equipment