JPH0519797A - 量子化方法 - Google Patents

量子化方法

Info

Publication number
JPH0519797A
JPH0519797A JP3175582A JP17558291A JPH0519797A JP H0519797 A JPH0519797 A JP H0519797A JP 3175582 A JP3175582 A JP 3175582A JP 17558291 A JP17558291 A JP 17558291A JP H0519797 A JPH0519797 A JP H0519797A
Authority
JP
Japan
Prior art keywords
value
equation
circuit
spectrum
linear approximation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3175582A
Other languages
English (en)
Other versions
JP3134363B2 (ja
Inventor
Masayuki Nishiguchi
正之 西口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP03175582A priority Critical patent/JP3134363B2/ja
Publication of JPH0519797A publication Critical patent/JPH0519797A/ja
Application granted granted Critical
Publication of JP3134363B2 publication Critical patent/JP3134363B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 音声信号の高能率符号化を行う際に、この高
能率符号化された音声信号の付加情報が高い圧縮率で圧
縮できる量子化方法を提供する。 【構成】 直交変換により音声信号を高能率符号化する
際に、高能率符号化された音声信号の付加情報を量子化
する量子化方法において、付加情報のパラメータの直線
近似を求め、この直線近似からの偏差を量子化するよう
にした。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号を高能率符号
化して伝送させる信号処理システムに適用される量子化
方法に関し、特に音声信号の付加情報の量子化方法に関
する。
【0002】
【従来の技術】音声信号(オーディオ信号)の高能率符
号化においては、入力した音声信号を時間軸又は周波数
軸で複数のチャンネルに分割すると共に、各チャンネル
毎のビット数を適応的に割当てるビットアロケーション
(ビット割当て)による符号化技術がある。例えば、オ
ーディオ信号等のビット割当てによる符号化技術には、
時間軸上のオーディオ信号を複数の周波数帯域に分割し
て符号化する帯域分割符号化(サブ・バンド・コーディ
ング:SBC)や、時間軸の信号を周波数軸上の信号に
変換(直交変換)して複数の周波数帯域に分割し各帯域
毎で適応的に符号化するいわゆる適応変換符号化(AT
C)、或いはサブ・バンド・コーディングといわゆる適
応予測符号化(APC)とを組合せ、時間軸の信号を帯
域分割して各帯域信号をベースバンド(低域)に変換し
た後複数次の線形予測分析を行って予測符号化するいわ
ゆる適応ビット割当て(APC−AB)等の符号化技術
がある。
【0003】ここで、これらの高能率符号化の内で、例
えば、適応変換符号化においては、時間軸のオーディオ
信号を、高速フーリエ変換(FFT)或いは離散的余弦
変換(DCT)等の直交変換によって、時間軸に直交す
る軸(周波数軸)に変換し、その後複数の帯域に分割し
て、これら分割された各帯域のFFT係数,DCT係数
等を適応的なビット割当てによって量子化(再量子化)
している。高速フーリエ変換の適応変換符号化における
再量子化の一例としては、図9に示すように、信号を高
速フーリエ変換した後の例えばFFT振幅値Am等をブ
ロック(ブロックB1,B2‥‥)分けして、これら各
ブロック毎に再量子化する際に必要となる付加情報を算
出し、この付加情報を用いてブロック毎に再量子化する
と共に、付加情報自体も量子化させる手法がある。
【0004】
【発明が解決しようとする課題】ところで、このような
直交変換によって時間軸に直交する軸に変換処理する高
能率符号化では、一般にバーク内のスペクトルのパワー
よりマスキング・スレッショルドを求め、そのマスキン
グ・スレッショルドレベル以下に量子化ノイズが抑えら
れるように、周波数軸上でのダイナミック・ビット・ア
ロケーションを行っていた。ここで、1バークの幅は人
間の聴覚の特性(人間が聞き分けられる能力)より決め
られるもので、1バーク毎の上述した処理を行うこと
で、聴覚のマスキング効果(同時刻マスキング)を利用
した高能率符号化が行われる。
【0005】この場合、各バーク毎にバークスペクトル
の付加情報として、RMS値(フローティング係数)や
マスキング・スレッショルド値が付加され、この付加情
報も量子化されている。この付加情報は、デシベル領域
(log軸上)で各サンプル毎に独立に固定均一ビット
割当てで量子化されるか、或いはフレーム内ピーク又は
フレームゲインでノーマライズされてから量子化されて
いる。しかしながら、RMS値やマスキング・スレッシ
ョルド値などのパラメータは、周波数が異なると著しく
変化するので、固定均一ビット割当てで量子化するのは
効率が非常に悪い。
【0006】このため、より高い圧縮率で音声データを
圧縮できるようにするために、付加情報を効率良く圧縮
できるようにすることが要請されている。
【0007】本発明の目的は、付加情報が高い圧縮率で
圧縮できる量子化方法を提供することにある。
【0008】
【課題を解決するための手段】本発明は、直交変換によ
り音声信号を高能率符号化する際に、高能率符号化され
た音声信号の付加情報を量子化する量子化方法におい
て、付加情報のパラメータの直線近似を求め、この直線
近似からの偏差を量子化するようにしたものである。
【0009】
【作用】このようにしたことで、付加情報も効率良く圧
縮されて量子化が行われ、一層の高能率符号化が行われ
て、伝送レートをより低くすることが可能になる。
【0010】
【実施例】以下、本発明の一実施例を図1〜図8を参照
して説明する。
【0011】本例においては、音声信号を高能率符号化
する送出側(エンコーダ側)を図1に示すように構成
し、この高能率符号化された音声信号の受信側(デコー
ダ側)を図2に示すように構成する。
【0012】まず、音声信号を高能率符号化するエンコ
ーダ側の構成について説明すると、図1において、1は
音声信号の入力端子を示し、この入力端子1に得られる
デジタル音声信号(デジタルオーディオ信号)をピッチ
予測回路2に供給し、時間軸上のピッチ予測が行われた
データを窓がけ・直交変換回路3に供給し、適当な窓が
けが行われ、直交変換が施される。このときの窓がけと
しては、入力信号のサンプリング周波数fS を例えば4
8kHzとすると、例えば図3に示すように、1024
サンプルを1単位として窓がけを行う。この場合、オー
バーラップする範囲を1/16として、64サンプルず
つオーバーラップさせている。
【0013】そして、直交変換が施されたデータをスペ
クトル強度計算回路4に供給し、各スペクトルの強度
(パワー)を算出する。本例においては、高速フーリエ
変換(FFT)処理を行うので、各係数の(実部)2
(虚部)2 で強度を算出する。このときの各スペクトル
の強度データは、バーク積分回路5に供給され、クリテ
ィカルバンド毎に積分されて、バークスペクトルの強度
が算出される。このときには、次式による積分が行われ
る。
【0014】
【数1】
【0015】そして、このバークスペクトルの強度分布
に基づいて、マスキング・スレッショルド及びRMS値
計算回路6で、マスキング・スレッショルドの値を各バ
ーク帯域毎に求める。この際には、聴覚の最小可聴カー
ブより求めたアブソリュート・スレッショルドを考慮し
て求める。ここで求めたマスキング・スレッショルドの
値は、各バークの帯域幅で割ってから平方根をとって、
各サンプル当たりの実効値としておく。また、RMS値
(フローティング係数)も、このマスキング・スレッシ
ョルド及びRMS値計算回路6で求めておく。
【0016】次に、マスキング・スレッショルド及びR
MS値計算回路6で求めたスレッショルド値及びRMS
値をパラメータ量子化器7に供給し、スレッショルド値
及びRMS値を量子化する。このとき、RMS値は各バ
ークの強度をそのバーク内のサンプル数で割って平方根
をとり、サンプル当たりの実効値として量子化する。
【0017】ここで本例においては、スレッショルド値
とRMS値との直線近似を求め、それぞれの直線近似か
らの偏差を量子化する。以下、この量子化方法について
説明する。ここでは、バークスペクトルのRMS値の量
子化を例にして説明する。
【0018】まず、バークスペクトルについて説明する
と、バークスペクトルはNo.1からNo.24までの
24本が存在し(後述する表1参照)、この24本のバ
ークスペクトルの値を図4に示すようにB1 ,B2 ‥‥
24とすると、この24本のバークスペクトルB1 〜B
24は、次式で示される。
【0019】
【数2】
【0020】この〔数2〕式において、iは1〜24の
各バークスペクトルに対応した値、kはサンプル点の値
(例えば1,2‥‥1024の値)、Y(k) は係数(F
FT係数,DCT係数など)、u(i) はi番目のバーク
スペクトルの上限、l(i) はi番目のバークスペクトル
の下限である。
【0021】ここで、各バーク毎の1サンプル当たりの
rsm値(フローティング係数)をデシベル(dB)領
域で定義すると、次式のT(i) で示される。
【0022】
【数3】
【0023】この〔数3〕式で示されるrsm値T(i)
を最小2乗法による直線近似し、図4に2点鎖線で示す
直線近似を得る。次に、この最小2乗法による一般的な
直線近似について説明すると、まず次式の演算を行う。
【0024】
【数4】
【0025】この〔数4〕式で示されるa,bの値を求
めることで、直線近似が行われる。即ち、次の〔数5〕
式及び〔数6〕式を解けば良い。
【0026】
【数5】
【0027】
【数6】
【0028】この両式を解くと、以下のようになる。
【0029】
【数7】
【0030】
【数8】
【0031】そして、〔数8〕式より次式が求まる。
【0032】
【数9】
【0033】この〔数9〕式を〔数7〕式に代入する
と、次の式〔数10〕,〔数11〕が得られる。
【0034】
【数10】
【0035】
【数11】
【0036】そして、この〔数10〕式及び〔数11〕
式に、本例のバークスペクトルの直線近似を求める条件
として、xi →i(iは1〜24),yi →T(i),N=
24を代入すると、次の式〔数12〕,〔数13〕が得
られる。
【0037】
【数12】
【0038】
【数13】
【0039】この〔数12〕式及び〔数13〕式で求め
たa,bの値より、直線近似された直線上のi番目の値
Tl(i) =ai+bが定義される。このとき、aが直線
の傾き、bがオフセット値に対応する。このTl(i)
デシベル(dB)で表現された値である。この直線近似
の演算は、8ビット程度のロイド・マックス量子化器
(Lloyd Max Quantizer)で実行で
きる。或いは、一様量子化器で簡易的に量子化できる。
そして、量子化済のa,bの値をa′,b′とすると、
量子化済の直線の値Tl′(i)は、次式〔数14〕で示
される。
【0040】
【数14】
【0041】そして、本例で量子化された値Tn
(i) は、次式〔数15〕で示される。
【0042】
【数15】
【0043】ここで、T(i) は真の値であり、この〔数
15〕式のTn(i) は、T(i) をTl′(i) でノーマラ
イズしたものであることを示している。ここで、Tn
(i) はT(i) に較べダイナミックレンジが狭くなってい
るため、少ないビット数で量子化できることが判る。
【0044】そして、このようにしてパラメータ量子化
器7で量子化されたスレッショルド値及びRMS値のレ
シオから、ビットアロケーション計算回路8で各バーク
内の1サンプルに割り振るビット数(即ち〔数15〕式
のTn(i)の値)を求める。次に、このビットアロケー
ション計算回路8でのビットアロケーションの計算方法
について説明する。
【0045】本例に適したビットアロケーションの計算
としては、固定で一様のビットアロケーションを計算す
る場合と、固定の不均一ビットアロケーションを計算す
る場合と、ダイナミックビットアロケーションを計算す
る場合とがある。
【0046】まず、固定で一様のビットアロケーション
を計算する場合について説明すると、この場合には各バ
ークi毎にTn(i) の分布を調べ、そのパワーの分布
(比較的長時間の分布)に比例したビット割当てを行
う。このときには、例えば図6のAとB(A,Bは連続
した直交変換フレームの部分を示す)とに示すように、
1フレーム(直交変換フレーム)毎に、直線の傾きやT
(k) が変化する。ここで、第jフレームのk番目の値
をTn(k) jとすると、この値Tn(k) jは次式〔数1
6〕で示される。
【0047】
【数16】
【0048】この〔数16〕式においてkは1から24
の値で、この〔数16〕式の値がJ個のフレームでのT
(k) のσ(標準偏差)となる。但し、これはdB値で
の標準偏差である。
【0049】そして、この固定ビット割当ての方法で
は、標準偏差σの最大のものに1ビット与え、〔新しい
標準偏差σ(NEW) 〕←〔元の標準偏差σ(OLD) −6〕と
する。次に、またσの値を一列に並べて最大のものに1
ビット与え、6dB引いた値を新しいσの値として一列
に並べる。そして、トータルのビット(例えば4×25
=100ビット)を使いきるまでこれを繰り返して、固
定のビットアロケーションを決める。
【0050】また、別の固定ビットアロケーションとし
ては、1ステップ当たりのdB値を一定とする方法があ
る。即ち、σの最大のものに1ビット与え、〔新しい標
準偏差σ(NEW) 〕←〔元の標準偏差σ(OLD) /2〕とす
る。つまり、1ビット与えたものは、2で割って新しい
値として一列に並べる。そして、以下は上述した固定ビ
ット割当てと同様に繰り返して、固定のビットアロケー
ションを決める。
【0051】さらに別の固定ビットアロケーションとし
て、直線Tl(i)=ai+bの傾きaを使用する方法が
ある。この場合には、J個のフレーム(Jは充分に大き
な値)でのaの平均をとってa″とすると、このa″は
平均的なT(i) のdB領域での傾きを示す。つまり、i
が1増加する毎のdB値の増加を示している。従って、
Tl(1) とTl(24)とでは、nint{(a″×23)
/6}ビットの落差を付ける必要がある。nintは最
も近い整数を示す。この落差をdビットとする。但し、
d<0とする。このようにすることで、次式〔数17〕
を満たすようにトータルの増大ビット数Cを決めれば良
い。
【0052】
【数17】
【0053】この〔数17〕式で求めた増大ビット数C
と落差dビットとの関係を図に示すと、図7に示すよう
になる。
【0054】次に、ダイナミックビットアロケーション
を計算する場合について説明すると、この場合には上述
したJ個のフレームでの傾きaの平均値a″を使用せず
に、各フレーム毎に次式〔数18〕の演算を行う。
【0055】
【数18】
【0056】なお、この〔数18〕式のトータルビット
は、サイドインフォメーション(付加情報)のトータル
ビットである。そして、この〔数18〕式が満たされる
ように増大ビット数Cを決定させる。
【0057】なお、上述した各ビットアロケーションに
ついて評価すると、〔数16〕に基づいた固定ビットア
ロケーションは、直線からの差の分散をビットアロケー
ションの基準にしているのでフラットぎみになり、〔数
17〕式或いは〔数18〕式に基づいたビットアロケー
ションは、直線そのものの大まかな分散をビットアロケ
ーションの基準にしているので、低域に多めのビット割
当てが行われることになる。
【0058】ここで、再び図1を参照したエンコーダの
全体構成の説明に戻ると、このようにしてパラメータ量
子化器7で量子化されたスレッショルド値及びRMS値
と、ビットアロケーション計算回路8で求めた各バーク
内の1サンプルに割り振るビット数の値とを、後述する
適応量子化器10に供給する。
【0059】そして、窓がけ・直交変換回路3で直交変
換が施されたデータを高速フーリエ変換(FFT)回路
9に供給し、クリティカルバンド内でのデシメンション
(平均化,平滑化)を行う。そして、高速フーリエ変換
回路9でデシメンションされたデータを適応量子化器1
0に供給し、量子化を行う。ここで本例においては、適
応量子化器10で各クリティカルバンド内の代表値の量
子化を行う。
【0060】そして、量子化された各クリティカルバン
ド内の代表値を、代表値出力端子11から伝送させる。
また、付加情報としてパラメータ量子化器7で量子化さ
れたスレッショルド値とRMS値とを、付加情報出力端
子12から伝送させる。
【0061】次に、このような構成のエンコーダにて処
理されるデータについて説明すると、まず各バーク(即
ち各クリティカルバンド:臨界帯域)の一覧を表1に示
す。
【0062】
【表1】
【0063】ここで、例えばサンプリング周波数fS
32kHzとし、1024サンプルのFFTを行ったと
すると、0〜16kHzの周波数範囲fに対して512
点のスペクトルが存在する。このとき、スペクトルのス
ペーシングは31.25Hz(=16000/512)
となる。ここで、オーディオ信号のときには、主な成分
は殆どの場合5kHz以下に集中し、特に2kHz〜3
kHzにエネルギーが集中している。
【0064】いま、1kHzの存在するクリティカルバ
ンド(バーク)について考えると、上述の〔表1〕より
No.9のクリティカルバンドに1kHzが存在する。
このNo.9のクリティカルバンドは、920Hzから
1080Hzまでの幅があり、スペクトルとしては5〜
6本存在する。例えば図8のAに示すように、5本のス
ペクトルx1 ,x2 ,x3 ,x4 ,x5 が存在したとす
る。このとき、本例のエンコーダでは図8のBに示すよ
うに、平滑化された5本のスペクトルy1 ,y 2
3 ,y4 ,y5 とする。そして本例においては、平滑
化によりy1 =y2 =y3 ,y4 =y5 となっているの
で、スペクトルy1 とスペクトルy4 との量子化値だけ
を代表値として伝送させる。
【0065】ここで、スペクトルxからスペクトルyへ
の変換処理例を示すと、各クリティカルバンド内及び平
滑化する帯域内(図8のAのx1 〜x3 の帯域及びx4
〜x 5 の帯域)でのエネルギーは、変換によって影響を
受けないようにする必要があるので、〔数19〕式及び
〔数20〕式の処理が行われる。
【0066】
【数19】
【0067】
【数20】
【0068】この〔数19〕式及び〔数20〕式より、
スペクトルy1 とスペクトルy4 とは、〔数21〕式及
び〔数22〕式で示される。
【0069】
【数21】
【0070】
【数22】
【0071】この〔数21〕式及び〔数22〕式で示さ
れるスペクトルy1とスペクトルy 4 とが、各サンプル
当たりの実効値になる。そして、この代表値y1 ,y4
とクリティカルバンドのrms値との関係が、次式で示
される。
【0072】
【数23】
【0073】つまり、1個のクリティカルバンドをn個
のサブバンドに分割して平滑化するのであれば、そのク
リティカルバンド全体のRMS値及びn−1個の代表値
より、n個目の代表値が求まる。そして、この代表値
を、量子化済のスレッショルド値とRMS値とに基づい
て決められた1サンプル当たりのビット数で、量子化す
ることで、伝送されるデータが決まる。
【0074】ここで、平滑化する例を次の〔表2〕に示
す。
【0075】
【表2】
【0076】この〔表2〕のバークNo.は〔表1〕の
バークNo.に対応したものである。この〔表2〕にお
いては、平滑化により括る数の例を、平滑化例1と平滑
化例2との2種類示していて、例えば図8に示したN
o.9のクリティカルバンドの場合には、2本のスペク
トルを括ると共に3本のスペクトルを括ることが平滑化
例1より判る。また、No.13以降のクリティカルバ
ンドの場合には、平滑化例1と平滑化例2とが選択でき
るが、実際にはNo.9のクリティカルバンドからN
o.12のクリティカルバンドまでで平滑化例1で括
り、No.13以降のクリティカルバンドでは平滑化例
2で括るのが好ましい。
【0077】この〔表2〕より判るように、本来は全帯
域で各クリティカルバンドのスペクトル本数を合計した
512本のスペクトルの量子化値を伝送する必要がある
のに、平滑化例1だけで括った場合には62本のスペク
トルの量子化値を伝送するだけで良く、上述したように
平滑化例1と平滑化例2とを組み合わせた場合にも、1
04本のスペクトルの量子化値を伝送するだけで良い。
従って、伝送信号のデータ量を大幅に少なくすることが
でき、より高い圧縮率の高能率符号化が行われるように
なる。
【0078】そして本例においては、パラメータ量子化
器7での付加情報の量子化を、各パラメータの直線近似
を求めてから、この直線近似からの偏差を量子化するよ
うにしたので、個々のパラメータの相関を利用した効率
の良い量子化が行われる。従って、付加情報も効率良く
圧縮されて量子化され、一層の高能率符号化が行われ
て、伝送レートをより低くすることが可能になる。この
場合、パラメータのRMSや分散に応じた不均一ビット
アロケーションとしたことで、トータルでの量子化ノイ
ズ(即ち代表値の量子化時の量子化ノイズ)のエネルギ
ーを低減できる。また、パラメータの分散に応じたダイ
ナミックビットアロケーションとしたことで、入力信号
の変化に追随した良好な量子化が行われ、この点からも
変換効率が向上する。
【0079】なお、本例においては入力信号のピッチ予
測を行ってから圧縮処理を行うようにしたので、さらに
効果的に高能率符号化が行われる。
【0080】次に、このようにして平滑化されて量子化
されたデータを受信するデコーダについて図2を参照し
て説明すると、図中21は各クリティカルバンド内の代
表値の量子化値が伝送される代表値入力端子を示し、2
2はこの値の付加情報(スレッショルド値及びRMS値
の量子化値)が伝送される付加情報入力端子を示す。そ
して、両入力端子21,22に得られるデータを適応逆
量子化器23に供給し、各クリティカルバンド内の代表
値を得、この代表値を係数補間回路24で補間処理す
る。このときには、各クリティカルバンド内のエネルギ
ーを変化させない必要があり、例えば代表値をそのまま
繰り返して補間させる。そして、補間されたデータを逆
変換・窓がけ重ね合わせ回路25に供給し、周波数軸を
時間軸に逆変換すると共に窓がけされたデータを重ね合
わせる。そして、この逆変換・窓がけ重ね合わせ回路2
5で処理されたデータをピッチ逆予測回路26に供給し
て、元のデジタルオーディオ信号を復元し、音声信号出
力端子27にこのデジタルオーディオ信号を供給する。
【0081】このようにしてデコードされたデジタルオ
ーディオ信号は、各クリティカルバンド内のエネルギー
が元のオーディオ信号と同じであるので、このオーディ
オ信号を再生したときの聴感上の音質劣化が最小限に抑
えられ、実際には聴覚の周波数成分特定能力の低下があ
るので、ほとんど音質劣化がない。即ち、人間の聴覚は
1バーク内のエネルギーが不変であれば、そのバーク内
のスペクトルの位置を特定することが困難であるので、
上述した高能率符号化が行われて伝送された音声を再生
させても、実質的な音質劣化につながらない。
【0082】なお、上述実施例においては、付加情報と
してマスキング・スレッショルド値を伝送するようにし
たが、量子化済のRMS値より作成されたスレッショル
ド値であればデコーダ側でもこのRMS値より得ること
が可能であるので、スレッショルド値は伝送させなくて
も良く、この場合には付加情報の伝送レートが低くな
り、より伝送レートを低くさせることができるようにな
る。
【0083】また、上述実施例においては、入力信号の
ピッチ予測を行ってから圧縮処理を行うようにしたが、
ピッチ予測をしないで圧縮処理を行うようにしても良
い。但し、ピッチ予測をした方が、より効果的に高能率
符号化が行われる。
【0084】また、エンコーダ側のバーク積分回路5で
積分されたスペクトルを、ラウドネス変換などの聴感補
正をしてから、マスキング・スレッショルド及びRMS
値計算回路6に供給するようにしても良い。
【0085】また、上述実施例においては、FFTで直
交変換するようにしたが、他の変換処理を施す高能率符
号化にも適用できる。例えば、DCT(離散的余弦変
換)やMDCT(Modified DCT)による高
能率符号化にも適用できる。この場合、例えばDCTを
適用したときには、エンコーダのスペクトル強度計算回
路4での計算が、(実部)2 だけで行われる(DCTの
場合には虚部がない)。また、スペクトル強度の積分処
理も、DCTの場合には〔数1〕式の代わりに次式の演
算が行われる。
【0086】
【数24】
【0087】さらに、上述実施例ではエンコーダで高能
率符号化されたデータの伝送系については何も説明しな
かったが、有線系,無線系による各種伝送システムが適
用できると共に、エンコーダで高能率符号化されたデー
タを各種記録媒体に記録させた後、この記録媒体からの
再生信号をデコーダで復元させる場合にも適用できる。
何れの場合でも、本例ではビットレートが大幅に低減さ
れているので、伝送効率(記録効率)が良い。
【0088】
【発明の効果】本発明によると、付加情報の量子化をす
る際に、各パラメータの直線近似を求め、この直線近似
からの偏差を量子化するようにしたので、付加情報が効
率良く圧縮されて量子化が行われ、一層の高能率符号化
が行われて、伝送レートをより低くすることが可能にな
る。
【図面の簡単な説明】
【図1】本発明の一実施例によるエンコーダを示す構成
図である。
【図2】本発明の一実施例によるデコーダを示す構成図
である。
【図3】一実施例による窓がけ状態を示す説明図であ
る。
【図4】直線近似の例を示す説明図である。
【図5】直線近似の一般的な説明に供する波形図であ
る。
【図6】一実施例による直線近似の説明に供する波形図
である。
【図7】一実施例によるビットアロケーションの説明図
である。
【図8】一実施例によるスペクトルの例を示す説明図で
ある。
【図9】適応変換符号化のブロックを示す説明図であ
る。
【符号の説明】
1 音声信号入力端子 2 ピッチ予測回路 3 窓がけ・直交変換回路 4 スペクトル強度計算回路 5 バーク積分回路 6 マスキング・スレッショルド及びRMS値計算回路 7 パラメータ量子化器 8 ビットアロケーション計算回路 9 高速フーリエ変換回路 10 適応量子化器 11 代表値出力端子 12 付加情報出力端子 21 代表値入力端子 22 付加情報入力端子 23 適応逆量子化器 24 係数補間回路 25 逆変換・窓がけ重ね合わせ回路 26 ピッチ逆予測回路 27 音声信号出力端子

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 直交変換により音声信号を高能率符号化
    する際に、高能率符号化された音声信号の付加情報を量
    子化する量子化方法において、上記付加情報のパラメー
    タの直線近似を求め、該直線近似からの偏差を量子化す
    るようにした量子化方法。
JP03175582A 1991-07-16 1991-07-16 量子化方法 Expired - Fee Related JP3134363B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03175582A JP3134363B2 (ja) 1991-07-16 1991-07-16 量子化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03175582A JP3134363B2 (ja) 1991-07-16 1991-07-16 量子化方法

Publications (2)

Publication Number Publication Date
JPH0519797A true JPH0519797A (ja) 1993-01-29
JP3134363B2 JP3134363B2 (ja) 2001-02-13

Family

ID=15998610

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03175582A Expired - Fee Related JP3134363B2 (ja) 1991-07-16 1991-07-16 量子化方法

Country Status (1)

Country Link
JP (1) JP3134363B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07501042A (ja) * 1992-06-30 1995-02-02 シェブロン リサーチ アンド テクノロジー カンパニー 新規なゼオライトssz−37
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
KR100672355B1 (ko) * 2004-07-16 2007-01-24 엘지전자 주식회사 음성 코딩/디코딩 방법 및 그를 위한 장치
JP2010538316A (ja) * 2007-08-27 2010-12-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された音声及びオーディオ信号の変換符号化

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07501042A (ja) * 1992-06-30 1995-02-02 シェブロン リサーチ アンド テクノロジー カンパニー 新規なゼオライトssz−37
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
US7613603B2 (en) 2003-06-30 2009-11-03 Fujitsu Limited Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
KR100672355B1 (ko) * 2004-07-16 2007-01-24 엘지전자 주식회사 음성 코딩/디코딩 방법 및 그를 위한 장치
JP2010538316A (ja) * 2007-08-27 2010-12-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された音声及びオーディオ信号の変換符号化

Also Published As

Publication number Publication date
JP3134363B2 (ja) 2001-02-13

Similar Documents

Publication Publication Date Title
JP3446216B2 (ja) 音声信号処理方法
KR100293855B1 (ko) 고능률디지털데이터부호화및복호화장치
JP7010885B2 (ja) 音声または音響符号化装置、音声または音響復号装置、音声または音響符号化方法及び音声または音響復号方法
JP3134455B2 (ja) 高能率符号化装置及び方法
JP3278900B2 (ja) データ符号化装置及び方法
US6098039A (en) Audio encoding apparatus which splits a signal, allocates and transmits bits, and quantitizes the signal based on bits
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
JP3336618B2 (ja) 高能率符号化方法及び高能率符号化信号の復号化方法
US20040162720A1 (en) Audio data encoding apparatus and method
US7003449B1 (en) Method of encoding an audio signal using a quality value for bit allocation
JP3168578B2 (ja) 心理的聴覚基準で適応形量子化する変換ディジタルオーディオ放送信号用の信号圧縮装置
US6772111B2 (en) Digital audio coding apparatus, method and computer readable medium
JP2004309921A (ja) 符号化装置、符号化方法及びプログラム
JP3189401B2 (ja) 音声データ符号化方法及び音声データ符号化装置
JP3336619B2 (ja) 信号処理装置
JP3134363B2 (ja) 量子化方法
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JP3297238B2 (ja) 適応的符号化システム及びビット割当方法
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
JP3089692B2 (ja) ディジタルデータの高能率符号化方法
US5875424A (en) Encoding system and decoding system for audio signals including pulse quantization
JP2993324B2 (ja) 音声高能率符号化装置
KR100340368B1 (ko) 고능률부호화장치,복호화장치및디지털데이터도출방법
JP3060576B2 (ja) ディジタル信号符号化方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071201

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081201

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091201

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees