JP3257584B2 - 音響信号符号化方法及び音響信号符号化装置 - Google Patents

音響信号符号化方法及び音響信号符号化装置

Info

Publication number
JP3257584B2
JP3257584B2 JP02600496A JP2600496A JP3257584B2 JP 3257584 B2 JP3257584 B2 JP 3257584B2 JP 02600496 A JP02600496 A JP 02600496A JP 2600496 A JP2600496 A JP 2600496A JP 3257584 B2 JP3257584 B2 JP 3257584B2
Authority
JP
Japan
Prior art keywords
signal
residual
information
supplied
time domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP02600496A
Other languages
English (en)
Other versions
JPH09200056A (ja
Inventor
孝朗 山辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP02600496A priority Critical patent/JP3257584B2/ja
Priority to EP96305495A priority patent/EP0756386B1/en
Priority to DE69629986T priority patent/DE69629986T2/de
Priority to US08/686,840 priority patent/US5794179A/en
Publication of JPH09200056A publication Critical patent/JPH09200056A/ja
Application granted granted Critical
Publication of JP3257584B2 publication Critical patent/JP3257584B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、デジタル音響信号
等をデータ圧縮する符号化方法と符号化装置に係り、特
に、符号化前のデジタル音響信号(元信号)に対して、
これを圧縮した符号化信号から伸張して得られる復号化
信号を、情報欠落のない(Loss Less )状態で再生する
ことができる、音響信号符号化方法及びその装置に関す
るものである。
【0002】
【従来の技術】一般に、単純にデジタル変換された音響
信号は、ホワイトノイズのようなランダムデータでない
限り何らかの連続性または冗長性を持っており、この性
質を用いたいくつかの可逆圧縮方式(Loss Less 圧縮方
式)が知られている。そして、この時間軸上の隣り合う
サンプルが相関性(連続性)を持つことは音響信号を観
察すれば容易に把握できる。また、音響信号の振幅分布
には一般に偏りがあり、これをデジタル化した信号は、
各ビットが「0」または「1」となる生起確率に規則性
が見られる。この偏りが大きくなると音響信号の持つ冗
長度も拡大する。
【0003】本発明者は、従来、可逆符号化方式として
は不適当とされた周波数変換符号化方式に対して時間領
域の補正を用いることにより、効率的かつ完全な可逆性
を保持した音響信号の符号化方式及びその復号化方式を
特願平7−211220号にて出願した。
【0004】この出願による音響信号符号化装置では、
音響信号の持つ周波数分布の偏差を利用するために、周
波数領域情報生成部においてデジタル音響信号を帯域分
割した後、個々の帯域について求めたエネルギー値を基
に、情報量に応じたビット配分により量子化されたサン
プル値を周波数領域の情報として符号化し、時間領域情
報生成部において、周波数領域情報生成部から供給され
る量子化後のサンプル値を逆量子化し、これを時間領域
信号へ再変換するために帯域合成を行われた後の信号と
元信号との残差信号を時間領域の情報として符号化し、
この両者を多重化部において多重化することにより、可
逆圧縮の符号化を行っていた。
【0005】そして、音響信号復号化装置で、供給され
た多重化信号を周波数領域の情報と残差信号とに分離
し、周波数領域の情報を帯域合成した後に残差信号によ
って補正することにより、元信号と同一のデジタル音響
信号を得ていた。
【0006】なお、復号後信号が完全に元信号と一致す
るために、符号化装置における帯域合成部と復号化装置
における帯域合成部とは共通な構成を持ち、演算精度及
び丸め処理は同一手法を取るようにしていた。この結
果、符号化装置において帯域合成された信号と元信号と
の差分値を求め、これを時間領域の情報として符号化し
伝送することで、復号化装置において帯域合成後の信号
に時間領域の補正値を加算し復号された信号は元信号と
完全に同じになる。
【0007】そして、音響信号を周波数領域と時間領域
の両者の情報を多重化し符号化する可逆圧縮符号化方式
及びその復号化方式は、音響信号を周波数領域で扱うこ
とによって、信号の持つスペクトル分布の偏差から生じ
る冗長性を信号の種類(様々なジャンルのオーディオソ
ース)によらず効果的に削減することができ、さらに時
間領域信号である残差信号を補正のために用いることで
確実に元信号への復元を可能としている。また、この方
式は周波数領域単体で符号化する場合に比べ、周波数領
域信号の量子化精度を厳密に算出しなくても完全可逆圧
縮を行うことができる。
【0008】また、可逆符号化方式とは異なるが、帰還
構造を取り入れた音響信号処理方式としては、機械振動
音等のノイズ成分、例えば空調のファンの音や自動車の
エンジン音を積極的に削減する能動的騒音制御方式があ
る。これらは自らの信号(ノイズ成分)を解析し、逆位
相成分を元信号と重ねることによってノイズ成分として
扱われる音響信号を打ち消している。この帰還構造を取
り入れた方式は、例えば、特開平5−80777号等に
開示されている。
【0009】そして、同じく帰還構造を取り入れた音響
信号処理方式として、復号後の信号と元信号との差を元
信号に帰還し、符号化を繰り返すことによって聴覚心理
モデルが原因となり生じた量子化ノイズを低減すること
を目的とした高能率符号化方式が特開平4−18501
7号に開示されている。
【0010】
【発明が解決しようとする課題】先に本発明者が特願平
7−211220号にて出願した音響信号の可逆符号化
方式及び復号化方式は、時間領域の残差信号の符号化に
おけるグループ毎のビット配分を決定する手段におい
て、グループ内サンプルの振幅最大値を表現することが
可能な最小限のビット数を目安にして残差信号のビット
配分を決定していた。
【0011】ここで、符号化される時間領域の残差信号
は帯域合成のときの演算誤差によって生じる。この演算
誤差は確率統計論に従えば、量子化ステップ幅Δのとき
の一回の乗算においては、図11に示すように、±Δ/
2の範囲で均一に分布する。そして、この演算誤差を含
むデータの加算を繰り返すと、生成される最終データに
含まれる演算誤差は、加算回数をnとすると図12に示
すように、±n×Δ/2の範囲の正規分布を形成するこ
とになる。この演算誤差は入力信号とは独立の関係にあ
り、残差信号の総情報量は総演算量に比例する。情報学
においてシャノンの定理より導かれる符号化情報量には
限界値があり、この場合、時間領域情報の符号化におけ
る符号化情報量の限界値は、先の残差信号の総情報量と
なる。
【0012】例えば、グループ内のそれぞれのサンプル
がほぼ同じ大きさの振幅であり、残差信号の平均振幅値
とビット割当量によって決まる最大許容振幅値との差が
小さければ、符号化総情報量は残差信号の総情報量に接
近し効果的な符号化が成されていることになる。一方、
グループ内の他のサンプルに対し著しく振幅の大きい残
差信号が存在する(標準偏差が大きい残差信号群)場合
は、この信号を表現するために他のサンプルが情報を持
たない上位ビットを数多く所有しなければならないた
め、符号化情報量は残差信号の総情報量よりはるかに大
きくなり、時間領域の情報量が増大して非効率的な符号
化が行われていることになる。
【0013】そして、帯域合成フィルタ演算のように加
算回数が多くなるほど、このような標準偏差の大きい残
差信号群となり、情報を持たない上位ビットを多く抱え
込んで符号化効率を下げていた。
【0014】また、帰還構造を取り入れることによって
ノイズ成分を積極的に打ち消す方法は、聴感上の気にな
るノイズ成分を除去するものであり、特定の周波数帯を
対象としたもので、演算誤差のように帯域内にまんべん
なく分散されるノイズ信号に適用することは困難であっ
た。さらに、演算誤差によって生じるノイズ成分そのも
のの総量を減らすことはできなかった。したがって、音
響信号を伝送するために、演算誤差によるノイズ成分を
符号化する際に、従来の能動的騒音制御方式をそのまま
適用しても符号化情報量を低減することはできなかっ
た。
【0015】そして、聴覚心理モデルを原因として生じ
る量子化誤差を帰還構造を取り入れることによって抑圧
する方法は、非可逆圧縮であるので、本出願の目的(後
述する)である演算誤差振幅値分布の平坦化とは意図が
異なっている。さらに、この方法は、際だった量子化誤
差を防止するために残差信号を元信号の調整に用いてい
る。この方法は聴覚心理モデルを使う以上量子化誤差は
常に存在し、この量子化誤差を聴感上聞き分けられない
帯域に分散することで、聴覚心理モデルによる圧縮を行
っていないCD(コンパクトディスク)に匹敵する音響
信号を提供しようとするものである。したがって、量子
化誤差の帰還によって聴覚心理モデルを改善しているこ
とになるので、可逆符号化を目的とした特願平7−21
1220号の音響信号の可逆符号化方式に用いても効果
をあげることは困難である。
【0016】また、この特願平7−211220号の音
響信号の可逆符号化方式において、符号化効率を向上さ
せるためには、グループ内残差信号の振幅平均値をその
ブロックのビット配分によって定められる最大許容振幅
値に近づけてグループ毎のビット配分を低減することが
好ましい。すなわち、個々のグループ内残差信号の振幅
平均値が大きくても最大振幅値が下がれば、ビット配分
を減少させることが可能であることを利用し、符号化品
質を向上させることができる。
【0017】そして、入力信号と独立の関係にある演算
誤差によって生じる残差成分の総情報量は、入力信号の
種類に関係なく、確率論に従ったある一定の情報量とな
るので、本出願人が先に出願した音響信号符号化方式に
対して従来の帰還構造を取り入れても符号化情報量の削
減を行うことはできなかった。
【0018】そこで、本発明は時間領域の情報量を削減
するために、ブロック毎の残差信号の平均化を図るべく
残差信号の分析を行い、これに基づいたパルス信号を生
成し元信号に付加させ再符号化を実行することにより、
時間領域のビット配分を低減し、符号化総情報量の少な
い、効率的かつ完全な可逆性を保持した音響信号の符号
化方式を提供することを目的とする。
【0019】
【課題を解決するための手段】上記目的を達成するため
の手段として、元信号として供給される時間領域情報の
デジタル音響信号を帯域分割して符号化した周波数領域
情報のデジタル音響信号とする第1の工程と、この第1
の工程にて符号化された周波数領域情報のデジタル音響
信号を帯域合成したデジタル音響信号と前記元信号とし
て供給される時間領域情報のデジタル音響信号との残差
信号を時間領域情報として生成する第2の工程と、この
第2の工程にて符号化された時間領域情報の残差信号を
構成するフレーム内で各サンプルの情報量を平均化する
ためのパルス信号を発生させて前記元信号に付加する第
3の工程とよりなり、前記残差信号と前記周波数領域情
報のデジタル音響信号とを多重化して出力することを特
徴とする音響信号符号化方法、及び、元信号として供給
される時間領域情報のデジタル音響信号を一時記録する
入力信号合成部と、この入力信号合成部より供給される
時間領域情報のデジタル音響信号を帯域分割する帯域分
割フィルタと、この帯域分割フィルタより供給される前
記周波数領域情報のデジタル音響信号を符号化する量子
化器と、この量子化器より供給される信号を逆量子化す
る逆量子化器と、この逆量子化器より供給される信号を
帯域合成して時間領域情報の信号へ再変換する帯域合成
フィルタと、この帯域合成フィルタより供給される時間
領域情報の信号と前記元信号として供給される時間領域
情報のデジタル音響信号との残差信号を生成する残差計
算部と、この残差計算部より供給される前記残差信号を
構成するフレーム内で各サンプルの情報量を平均化する
ためのパルス信号を生成し、前記入力信号合成部に出力
するパルス生成器と、前記残差計算部より供給される前
記残差信号と前記量子化器より供給される信号とを多重
化する多重化部とを有することを特徴とする音響信号符
号化装置を提供しようとするものである。
【0020】
【発明の実施の形態】演算過程における四捨五入などに
よる誤差成分は、不確定要素を含むので予測することが
できない。演算過程における誤差成分は、入力データ及
び演算に必要な係数等の値に誤差を含まないと仮定すれ
ば、乗算におけるある定められた任意の演算精度を保証
するために、その演算精度以下となる情報が四捨五入に
よって上位にまるめられることによって生じることにな
る。先の出願ではこの演算誤差を時間領域の補正情報と
して符号化していたが、この時間領域部分は情報圧縮さ
れておらず、この部分においては冗長性が残されてい
た。
【0021】時間領域の情報を効率的に符号化するに
は、ブロック化されたグループ内サンプルの振幅値を平
均化し、この平均値に合わせたビット割り当てを行うよ
うにすればよい。あるブロック(フレーム)内の残差信
号のサンプル群が図13(A)で示されるサンプル群で
あったとすると、このサンプル群の最大値Maxを表現
するには、最低7ビットが必要となる。したがって、こ
の残差信号グループのビット割当を7ビットにしなけれ
ばならないが、この残差信号のMax値(以後Max信
号とする)を6ビットで表現できる値に低減すれば、M
ax信号を含む残差信号のグループのビット割当を6ビ
ットにして、1ビット削減することができる。
【0022】Max信号を低減する方法としては、パル
ス信号をMax信号の位置に付加することにより行う。
即ち、本発明ではMax信号の振幅値を調整し符号反転
したパルス信号を元信号に加え、再度、周波数変換、逆
変換を施している。この場合、出力される信号は、図1
3(A)に示す残差信号に図13(B)に示すパルス信
号を重ね合わした図13(C)に示すような新たな残差
信号が出力されることになる。
【0023】これは、図14(A)に示すようなパルス
信号を周波数領域へ展開した後、さらに時間領域へ再展
開すると(その周波数変換法や演算精度によって異なる
が)、図14(B)に示すように、パルス信号の位置を
中心としてその周囲のサンプリング点に、わずかながら
分散または量子化による演算誤差を原因とする微小なパ
ルス信号(ノイズ信号)が現れることから、図13
(A)に示す残差信号のMax信号の位置にパルス信号
を付加した後に周波数変換、逆変換を施したものは、図
13(B)に示すパルス信号を重ね合わせた図13
(C)に示す残差信号となる。なお、図14(B)に示
されるこれらのノイズ信号は、パルス信号と比較して非
常に微小な信号であるため、他のサンプリング点の信号
にはほとんど影響を与えない。
【0024】また、残差信号グループ(フレーム)の中
には図13(A)に示す残差信号のように、1サンプル
のみ突出しているものだけでなく、複数サンプルが他の
グループ内信号に比べて大きい場合も存在する。しか
し、その場合は、複数回に渡ってパルス信号をMax信
号に重ね合わせる処理を行えば、対象とするグループ内
においてより平均化された残差信号を得ることができ
る。また、予め、グループ内の残差信号の情報量より削
減可能なビット割当数を計算し、複数のパルス信号から
なる元信号調整パルス群を重ね合わせることにより、一
度に平均化された残差信号を得るようにしてもよい。以
下に示す実施例では、複数回に渡って重ね合わせる場合
について説明している。
【0025】以上説明したように、時間領域上の残差信
号を把握して適当なパルス信号を生成し、これを元信号
と重ね合わせてから再度符号化を行うことによって、時
間領域情報の効率的な情報圧縮を成し得ることができ
る。これを本出願人が先に出願した音響信号符号化方法
に適用することにより、より一層符号化効率を向上させ
ることができる。
【0026】
【実施例】本発明の音響信号符号化方法及び音響信号符
号化装置の一実施例を図面と共に説明する。図1は本発
明の音響信号符号化装置の一実施例を示す構成図であ
り、図6はその動作を示すフローチャート図である。そ
して、各図を参考にして、音響信号符号化方法の一実施
例についても同時に説明する。
【0027】図1に示す音響信号符号化装置は、パルス
発生器12、入力信号合成部13、周波数領域情報生成
部A、時間領域情報生成部B及び多重化部(多重化器)
9により構成されている。そして、周波数領域情報生成
部Aは、帯域分割フィルタ1、最大値選択部2、ビット
配分部3、量子化器4とにより構成され、時間領域情報
生成部Bは、逆量子化器5、帯域合成フィルタ6、遅延
器7、残差計算部8とにより構成されている。また、入
力されるデジタル音響信号は、フレームを処理単位とす
るブロックで形成されている。本実施例では、1フレー
ムを形成する音響信号を1チャンネルあたり512サン
プル、帯域分割幅を32バンドとしている。
【0028】そして、最下位ビット精度は任意のビット
幅で固定するが、ここでは16ビットの固定量子化精度
とし、これ以下の情報は四捨五入によって上位ビット
(最下位ビットである16ビット目)に反映する。周波
数領域のビット配分情報は4ビットでコード0〜16ビ
ットを表現し、時間領域のビット配分は3ビットでコー
ド0〜8ビットを表現するものとする。
【0029】ここで、時間領域のビット配分幅はフィル
タの特性によるものであり、帯域合成にかかる積和演算
中の乗算回数に委ねられる。この演算での誤差の蓄積の
最悪値が時間配分ビット幅以内であれば、周波数領域の
ビット配分幅が最終的な量子化精度を保証することにな
る。本実施例では3ビットでコード化を行っているの
で、16ビット量子化精度を保証している。また、ビッ
ト配分幅を4ビットで表現すれば、24ビットの量子化
精度を持つ入力音響信号の可逆圧縮が可能となる。但し
この場合、時間領域情報が増大して符号化品質が悪くな
るため、周波数領域情報との効率的な情報量配分が必要
となる。
【0030】そして、4ビットの周波数領域ビット配分
表を表1に示し、3ビットの時間領域ビット配分表を表
2に示す。なお、配分無しがコード0で、配分がある場
合は符号ビットを含めた形でコード2〜コード最大値の
間で設定している。
【0031】
【表1】
【0032】
【表2】
【0033】次に、図1に示す音響信号符号化装置の動
作について説明する。入力されるデジタル音響信号(元
信号)は、後述する遅延器7に供給されると共に入力信
号合成部13に供給される。そして、入力信号合成部1
3にて元信号を一時記録してから帯域分割フィルタ1に
出力される。この帯域分割フィルタ1では、時間領域情
報である入力信号を周波数領域情報へと展開している
(ステップ101)。ここでは、サブバンドフィルタを
32バンド等分割とし、そのバンド幅Wを次式のように
設定している。なお、出力されるサブバンドデータの精
度は前述したように最下位ビット精度である16ビット
とする。
【0034】 W=(サンプリング周波数×0.5)/32 (Hz)
【0035】また、この帯域分割フィルタ1及び後述す
る帯域合成フィルタ6としては、例えばDCTのような
直交変換を行うフィルタ、フィルタの原理を利用したサ
ブバンドフィルタ、基底とする波形に信号を分解し表現
するウェーブレット変換、さらには、周波数変換の代表
的な方法であるフーリエ変換等が挙げられる。そして、
本発明では、時間領域の情報成分も利用していることか
ら、帯域分割合成後の信号が完全な元信号に戻る必要は
ないので、何れの周波数変換方法を用いても良い。本実
施例では説明を具体的にするために、512タップのサ
ブバンドフィルタ(ポリフェイズフィルタ)を用いるこ
とにする。なお、遅延は帯域分割合成を通して480サ
ンプル分生じる。
【0036】帯域分割フィルタ1にて32バンド等分割
された周波数領域情報の音響信号は、最大値選択部2及
び量子化器4に供給される。最大値選択部2では、1フ
レーム内に存在する32バンド各々につき、16個(5
12/32個)あるサブバンドデータ(振幅値)または
エネルギー値の絶対値比較を行い、その最大値Sを選択
して出力する(ステップ102)。
【0037】そして、最大値選択部2より出力されるサ
ブバンドデータの最大値Sは、ビット配分部3に供給さ
れる。ビット配分部3では、各帯域(バンド)の最大値
Sを表1に示す周波数領域ビット配分表に参照して、3
2バンドそれぞれに対して割り当てられるビット数を決
定する(ステップ103)。ここでのビット配分は、表
1に示すように、最大値サンプルを2の補数表示で表現
するために、最小限必要なビット数に対応して行われ
る。
【0038】量子化器4では、ビット配分部3より供給
されるビット配分情報に基づいて、帯域分割フィルタ1
より供給される周波数領域情報の音響信号の各サブバン
ドデータのビット数を削減する(ステップ104)。こ
こでの削減は、符号ビットと同一である上位ビットを符
号ビットを除いて(16−割当ビット数)個の削減とな
る。このサブバンドデータのビット数削減の例を表3に
示す。
【0039】
【表3】
【0040】表3に示すように、10進数で表したサブ
バンドデータが、6,31,84,…,12,54であ
るとき、これらの絶対値の最大値は−94となり、ビッ
ト配分情報(割当ビット数)は、表1より8ビットとな
る。したがって、16ビットのサブバンドデータのう
ち、下位7ビットと符号ビットとしての最上位ビット
(signビット)とを合わせたデータ(8ビット)を量子
化データとし、上位第2〜第9の8ビットを削減ビット
としている。これは、符号ビット部分を1ビットのsign
ビットを残して、削減したことと等価である。
【0041】したがって、逆量子化ではビット配分情報
より、この削減された上位ビットを指定数だけ符号ビッ
ト(signビット)で埋めればよい。この様にして量子化
されたサブバンドデータとビット配分情報は、多重化器
(多重化部)9に出力されると共に、サブバンドデータ
を時間領域へ再変換処理をするために、逆量子化器5に
出力される。
【0042】逆量子化器5における逆量子化は、符号ビ
ットと同一コードを上位ビットに(16−割当ビット
数)個付け加えることにより行われる(ステップ10
5)。したがって、このような量子化及び逆量子化にお
いては、その演算中に何ら演算に関わる制約、例えば四
捨五入等を行わないため、量子化誤差が生じることはな
い。
【0043】逆量子化器5での逆量子化によって、最下
位ビット精度(本実施例では16ビット)に揃えられた
サブバンドデータは、帯域合成フィルタ6に供給されて
時間領域情報の信号に変換される(ステップ106)。
この帯域合成フィルタ6における帯域合成処理では、演
算精度、フィルタ係数精度、演算過程及び出力段のデー
タに対する丸め処理を、後述する復号化装置の帯域合成
フィルタ6と完全に一致させる必要がある。
【0044】また、一般にデジタル音響信号処理にはD
SP(Digital Signal Processer)がよく用いられる。
そこで、この帯域合成フィルタ6における帯域合成処理
をDSPを例にとって説明する。帯域合成フィルタ6に
用いるDSPの内部演算ブロック構成を図3に示す。こ
こで使用するDSPは、例えば16ビット×16ビット
の固定小数点とし、内部演算精度、及びメモリ内部のデ
ータ幅を16ビットとする。
【0045】サブバンドフィルタなどでの帯域分割合成
は、主として積和演算によって変換が行われる。したが
って、帯域合成フィルタ6は、乗算器、加算器及び入出
力段のレジスタで構成されており、演算過程で必要な各
種係数用メモリ及び中間データ用のメモリ(演算用メモ
リ)と入出力バスにて接続されている。
【0046】同図において、入力データ(サブバンドデ
ータ)とこの入力データに対応するフィルタ係数データ
とが、それぞれ16ビットの入力用データバスを介して
乗算器21に順次入力される。この入力データは、逆量
子化器5から出力されるデータが図示しないメモリ内に
16ビット精度で格納され、必要なデータが乗算器21
に随時供給されている。また、フィルタ係数データは、
同じく図示しない各種係数用メモリに16ビット精度で
予め格納されている。そして、この乗算器21は、入力
データにフィルタ係数データを乗算して32ビットのデ
ータとして出力している。
【0047】この乗算器21の出力は、32ビット+α
の加算器23に供給されている。このαは上位拡張ビッ
トを指す。なお、積和演算は32ビット幅のバスを用
い、それ以外は16ビットのバスを用いている。そし
て、加算器23からの出力は、一旦レジスタ22に蓄積
され、このレジスタ22の出力と次の乗算器21からの
出力とが加算器23にて加算され、次の演算のためにレ
ジスタ22に蓄積されるという状態を入力データがなく
なるまで、繰り返される。
【0048】そして、一次積和演算が終了すると、加算
器23からの出力は32ビット精度のデータのままレジ
スタ24に供給され、16ビット精度のデータに丸め処
理され、図示しない演算用メモリに出力する。この演算
用メモリは、32ビットから丸め処理を受けた16ビッ
ト精度のデータを格納して、二次積和演算を行うため
に、乗算器21に出力している。そして、同様にして、
二次積和演算が行われると、レジスタ24からデータ出
力として、16ビット精度のデータ(時間領域情報の音
響信号)が残差計算部8に出力される。
【0049】ここで、乗算器21は各16ビット精度の
データ入力に対して32ビット精度のデータ出力である
ため、演算誤差が生じることはない。そして、各メモリ
に格納する場合に16ビット精度の丸め処理を行ってい
るが、加算器23では、積和演算中のオーバーフローや
アンダーフローに備えて十分なビット数の整数域(上位
拡張ビット)を確保している。したがって、丸め処理が
行われるのは、メモリに格納する場合、または最終出力
値を得るときに限られるので、余分な演算誤差が積み重
なることはない。
【0050】上記のような帯域分割合成の演算がなされ
て、図1の帯域合成フィルタ6から出力される16ビッ
ト精度の時間領域情報の音響信号(復号後信号)と、遅
延器7に入力されているデジタル音響信号(元信号)と
が、残差計算部8に供給され、帯域分割フィルタ1及び
帯域合成フィルタ6での帯域分割合成にて発生した演算
誤差を算出して、残差信号として出力する(ステップ1
07)。なお、ここでは残差信号を24サンプルのブロ
ックとして取り扱う。そして、このブロック内の最大値
を表現するために最低必要なビット数をブロックビット
幅とし、これを3ビットでコード化する。表2に残差信
号とブロックビット幅の関係を示す。表2において、ビ
ット配分として示されている数字が、ブロックビット幅
であり、ブロック内の残差信号の絶対値の最大値Mによ
って、その数値が定まっている。
【0051】なお、帯域分割フィルタ1及び帯域合成フ
ィルタ6を通過した復号後信号は、フィルタ固有の遅延
によって時間軸が遅れているので、元信号を遅延器7を
介して残差計算部8に供給することにより(ステップ1
08)、復号後信号との時間軸を揃えている。
【0052】このフィルタ固有の遅延について、図4と
共に簡単に説明する。同図(A)に示すような時間領域
情報のデジタル音響信号(元信号)を帯域分割フィルタ
1に供給すると、元信号はフィルタバンクに32サンプ
ルづつシフトしながら蓄積され、随時32個のサブバン
ドサンプルを生成する(同図(B))。そして、帯域合
成フィルタ6においては、サブバンドサンプルはフィル
タバンクに32サンプルづつシフトしながら蓄積され、
随時32個の出力信号(時間軸に変換された復号後信
号)を生成する(同図(C))。このとき、一連の帯域
分割合成にて生じる遅延は480サンプル分であり、復
号後信号は、元信号に対して、480サンプル遅れて同
じデータが出力される。したがって、遅延器7では48
0サンプル分遅延させてフィルタ固有の遅延を吸収し
(同図(D))、残差計算部8における残差信号の算出
を可能にしている。
【0053】そして、残差計算部8より出力される残差
信号は、パルス発生器12に出力される。そして、この
パルス発生器12より必要に応じてパルスが出力され、
入力信号合成部13にて、元信号に付加している(ステ
ップ112)。ここで、このパルス発生器12の構成図
を図8に示して、以下に説明する。残差計算部8から出
力された残差信号は、パルス発生器12内のグループ内
残差信号平均情報量算出部31及び割当可能範囲外残差
信号検出部33に供給される。
【0054】そして、グループ内残差信号平均情報量算
出部31にて、所定グループ内の平均的な振幅値(残差
信号平均情報量)を求め、目標ビット割当算出部32に
出力している。なお、ここでは残差信号の絶対値を基に
平均値を求めている。また、実際の情報量は符号ビット
を含み、求めた平均情報量は実際より1ビット分少ない
ため、ビット割当値を算出する際にはこのことを考慮す
る必要がある。
【0055】目標ビット割当算出部32では、最適なビ
ット配分を行うための処理を行う(ステップ110)。
個々の残差信号のサンプルを全て平均化することができ
るならば、グループ内残差信号を表現するための割当ビ
ットの最下限値は、供給される残差信号平均情報量を表
すことができるビット数となる。しかしながら、実際に
は、個々の残差信号のサンプルは、何の規則性もない演
算誤差から生じているため、平均化は非常に困難であ
る。したがって、残差信号平均情報量がこの割当ビット
の最下限値に近い場合、その割当ビット数では表現でき
ない残差信号のサンプルが生じる可能性がある。そこ
で、目標ビット割当値の決定は、割当ビットの最下限値
に対して幾らかの余裕度を含んだ状態で行う方が良い。
【0056】この目標割当ビットの決定について図7に
例をあげて説明する。図中の(a)及び(b)で示され
る実際の残差信号平均振幅値は、どちらも7ビットで表
現される。しかしながら、目標ビット割当値算出のため
のしきい値を余裕度を含めて同図のように設定すると、
(b)で示される残差信号平均振幅値を有する残差信号
ブロックは、目標ビット割当も7ビットとなるが、
(a)で示される残差信号平均振幅値を有する残差信号
ブロックは、目標ビット割当値算出のためのしきい値を
越えているので目標ビット割当が8ビットとなる。な
お、この余裕度(目標ビット割当値算出のためのしきい
値)は、同図では割当ビット中のMSBビットで表現で
きる最小値と最大値の中心に設定しているが、帯域分割
合成における量子化精度や演算処理ステップ数に応じて
調整することができる。
【0057】そして、帰還回数を重ねるほど残差信号は
平均化されるので、余裕度を下げて設定し、さらに割当
ビット数を少なくすることもできる。しかしながら、帰
還回数の増加は演算ステップ数を増加させ、処理速度の
低下をもたらすので、実際には、用いる周波数変換法に
よって生じる演算誤差の標準偏差を基に、符号化効率と
処理速度の兼ね合いから余裕度を設定することになる。
【0058】目標ビット割当算出部32から出力される
目標ビット割当値は、割当可能範囲外残差信号検出部3
3に供給される。割当可能範囲外残差信号検出部33で
は、残差計算部8から出力された残差信号のグループか
ら、割り当てられたビット数では表現しきれない残差信
号のサンプルを選別してパルス信号生成部34に出力し
ている(ステップ111→Y)。このとき、残差信号の
サンプル番号をパルス信号発生サンプル点として出力す
ると共に、残差信号の振幅値と目標ビット割当値による
表現可能範囲との差を同時に求めて出力する。なお、割
り当てられたビット数で表現可能な残差信号のサンプル
は、基本的にはパルス信号を生成する必要がないので、
パルス信号生成部34に出力しなくても良いが、目標ビ
ット割当値算出のためのしきい値に非常に近い場合に
は、近隣の残差信号のサンプルにパルス信号を付加した
際に目標ビット割当値算出のためのしきい値を越えてし
まうことがあるので、この場合にもパルス信号生成部3
4に出力するようにした方が帰還回数を少なくすること
ができる。
【0059】パルス信号生成部34では、パルス信号を
必要とする残差信号のサンプルに対して重ね合わせるパ
ルス信号の振幅値を決定し、その振幅値を有するパルス
信号を入力信号合成部13に出力する。このとき、目標
ビット割当値算出のためのしきい値よりも大きい(また
はしきい値付近の)振幅値を有する残差信号のサンプル
に対して、パルス信号を付加させて目標ビット割当値に
するためには、パルス信号の振幅値をうまく決定する必
要がある。
【0060】ここで、パルス信号の振幅値を決定する際
の基準の例を図10に示して、説明する。パルス信号の
振幅値は、残差信号の振幅値から目標ビット割当値によ
る表現可能範囲の3/4の値を差し引いた値を絶対値と
し、残差信号に対して逆符号を持つ振幅値とする。この
3/4という値は、目標ビット割当値で表現される値の
ちょうど中心に当たり、帰還を繰り返す際に発生するノ
イズ信号(図14参照)が他の残差信号のサンプルに対
して与える影響が最も少ない値である。
【0061】そして、入力信号合成部13では、一時記
録されている残差信号のグループの特定の残差信号のサ
ンプルにパルス発生器12より送られてくるパルス信号
を付加して帯域分割フィルタ1に出力する。以下、同様
にしてパルス信号を付加する残差信号のサンプルがなく
なるまで処理を繰り返し、全ての残差信号のサンプルの
振幅値が目標ビット割当値で表現される値になった際に
は(ステップ111→N)、量子化器4及び残差計算部
8からの信号を多重化器9に出力する。
【0062】なお、帰還することにより周波数変換する
信号に微妙な変化が加えられ、帯域分割フィルタ1から
出力されるデータが、最初にビット配分部3にて決定さ
れた周波数領域上でのビット配分を越える可能性が生じ
る。この場合はビット配分部3によるビット配分を増や
すのではなく、最初に決定されたビット配分内の最大値
又は最小値に置き換える。そして、周波数領域上の変化
はサンプルの値のみとし、ビット配分は初回に算出した
配分で最後まで行うものとする。このように、周波数領
域の情報量を固定することにより、時間領域情報の削減
を周波数領域上でのビット配分に左右されることなく行
うことができる。但し、反対に周波数領域上でのビット
配分が減少する場合には、ビット配分部3でのビット配
分を変更して周波数領域上の情報量を削減するようにし
ても良い。この場合は、より高能率な符号化を行うこと
ができる。
【0063】多重化器9では、量子化器4より供給され
るビット数の削減されたサブバンドデータ(周波数領域
情報のデジタル音響信号)と残差計算部8より供給され
る残差信号とに対して、フレーム同期ワード、各種モー
ドや補助情報、周波数領域の信号の補助情報(周波数領
域サイド情報)、さらに時間領域の信号の補助情報(時
間領域サイド情報)等を付加し、例えば図5に示すよう
に配列してビットストリームを生成する(ステップ10
9)。このように多重化して同一フレーム内に残差信号
を含めているので、復号化の時には、帯域合成処理され
時間領域に変換された信号を補正して復号化する際に要
する遅延量を減少させることができる。
【0064】次に、図2に本発明の音響信号符号化装置
で符号化された音響信号を復号する音響信号復号化装置
の一実施例の構成図を示し、図7にその動作フローチャ
ートを示す。なお、図1の音響信号符号化装置に示した
逆量子化器5及び帯域合成フィルタ6と図2に示した逆
量子化器5及び帯域合成フィルタ6とは完全に同一構成
のものを使用している。
【0065】音響信号符号化装置にて符号化されたビッ
トストリームは分離化器10に供給されて、同期ワー
ド、モード、補助情報等を解読し、さらに周波数領域の
信号と時間領域の信号とに分離される(ステップ20
1)。分離後の周波数領域の信号は、帯域合成されるた
めにその前処理である逆量子化器5に供給される。ま
た、時間領域の信号は後に帯域合成フィルタ6を経た信
号に対し補正を行うために残差補正部11に供給され
る。
【0066】逆量子化器5は先に述べたように、帯域合
成フィルタ6と共に音響信号符号化装置で使用されてい
る逆量子化器5及び帯域合成フィルタ6と完全に同じも
のであり、その動作も同一である。そして、ここでも符
号ビットと同一コードを上位に(16−割当ビット数)
個、追加して出力している(ステップ202)。逆量子
化器5より出力される信号は、帯域合成フィルタ6に供
給されて、周波数領域の信号は時間領域の信号に変換さ
れる(ステップ203)。そして、逆量子化器5から帯
域合成フィルタ6までの処理過程は音響信号符号化装置
と全く同じであるため、符号化処理中に生じた元信号と
の誤差は、時間領域の信号として音響信号符号化装置か
ら供給される残差成分によって補正すれば、帯域合成後
の信号は元信号と全く同じ信号に戻ることになる。
【0067】したがって、残差補正部11にて、帯域合
成フィルタ6より供給される時間領域の帯域合成後信号
に分離化器10より供給される時間領域補正信号(残差
信号)を加算することにより、元信号に復元している
(ステップ204)。なお、帯域合成フィルタ6におけ
る帯域合成処理にかかる遅延は音響信号符号化装置側で
調整されているので、時間領域の残差信号は帯域合成後
信号と時間軸が一致した状態で残差補正部12に供給さ
れている。即ち、残差信号は、音響信号符号化装置側に
おいて、帯域分割フィルタ1と帯域合成フィルタ6とを
通過した信号と、この信号に合わせて遅延させた元信号
とから生成されているので、元信号に対して480サン
プル分遅延しているが、周波数領域の信号は帯域合成フ
ィルタ6を介していないので、その分遅延量が少ない状
態で多重化されている。したがって、音響信号復号化装
置側で、周波数領域の信号が帯域合成フィルタ6を通過
した後の遅延量は、残差信号と同じになり、時間軸が一
致する。
【0068】この結果、本発明の音響信号符号化装置に
入力されたデジタル音響信号(元信号)は、符号化信号
としてデータ圧縮された信号として伝送または蓄積さ
れ、この音響信号復号化装置によって、元信号と完全に
一致した復号化信号として出力することができる。
【0069】
【発明の効果】本発明の音響信号符号化方法及び音響信
号符号化装置は、周波数領域情報によって音響信号の持
つ特長を生かした効率的な圧縮符号化を行った上で、こ
の周波数領域情報を時間領域情報である残差信号によっ
て、適切かつ必要最小限の補正を行っているので、元信
号を確実に復号することができる。そして、本発明で
は、時間領域情報である残差信号も圧縮符号化を行って
いるので、より効率的な圧縮符号化が可能となるという
効果がある。
【図面の簡単な説明】
【図1】本発明の音響信号符号化装置の一実施例を示す
構成図である。
【図2】音響信号復号化装置の一実施例を示す構成図で
ある。
【図3】帯域合成フィルタに用いられるDSPの内部演
算ブロック構成を示す構成図である。
【図4】フィルタ固有の遅延量を説明するための図であ
る。
【図5】ビットストリームの生成例を示す構成図であ
る。
【図6】本発明の音響信号符号化装置の動作例を示すフ
ローチャート図である。
【図7】音響信号復号化装置の動作例を示すフローチャ
ート図である。
【図8】本発明の音響信号符号化装置を構成するパルス
発生器の一実施例を示す構成図である。
【図9】目標ビット割当値の算出方法を説明するための
図である。
【図10】パルス信号の振幅値決定を説明するための図
である。
【図11】Nサンプルの演算誤差の確率分布を示すグラ
フである。
【図12】加算回数nのときの演算誤差の確率分布を示
すグラフである。
【図13】パルス信号の付加による残差信号の変化を説
明するためのグラフである。
【図14】周波数変換、逆変換後のパルス信号の変化を
説明するためのグラフである。
【符号の説明】
1 帯域分割フィルタ 2 最大値選択部 3 ビット配分部 4 量子化器 5 逆量子化器 6 帯域合成フィルタ 7 遅延器 8 残差計算部 9 多重化部(多重化器) 10 分離化器 11 残差補正部 12 パルス発生器 13 入力信号合成部 31 グループ内残差信号平均情報量算出部 32 目標ビット割当算出部 33 割当可能範囲外残差信号検出部 34 パルス信号生成部 A 周波数領域情報生成部 B 時間領域情報生成部

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】元信号として供給される時間領域情報のデ
    ジタル音響信号を帯域分割して符号化した周波数領域情
    報のデジタル音響信号とする第1の工程と、 この第1の工程にて符号化された周波数領域情報のデジ
    タル音響信号を帯域合成したデジタル音響信号と前記元
    信号として供給される時間領域情報のデジタル音響信号
    との残差信号を時間領域情報として生成する第2の工程
    と、 この第2の工程にて符号化された時間領域情報の残差信
    号を構成するフレーム内で各サンプルの情報量を平均化
    するためのパルス信号を発生させて前記元信号に付加す
    る第3の工程とよりなり、 前記残差信号と前記周波数領域情報のデジタル音響信号
    とを多重化して出力することを特徴とする音響信号符号
    化方法。
  2. 【請求項2】前記残差信号を、前記残差信号を構成する
    フレーム内で各サンプルの情報量の平均値から算出され
    る目標ビット割当値のビット数に圧縮することを特徴と
    する請求項1記載の音響信号符号化方法。
  3. 【請求項3】前記残差信号を構成するフレーム内で各サ
    ンプルの情報量の最大値が所定値以下になるまで前記第
    1の工程〜第3の工程を繰り返すことを特徴とする請求
    項1または請求項2記載の音響信号符号化方法。
  4. 【請求項4】前記第3の工程において、前記残差信号を
    構成するフレーム内で各サンプルの情報量を平均化する
    ためのパルス信号を複数同時に発生させて、前記残差信
    号を構成する各サンプルの情報量を所定値以下にするこ
    とを特徴とする請求項1または請求項2記載の音響信号
    符号化方法。
  5. 【請求項5】元信号として供給される時間領域情報のデ
    ジタル音響信号を一時記録する入力信号合成部と、 この入力信号合成部より供給される時間領域情報のデジ
    タル音響信号を帯域分割する帯域分割フィルタと、 この帯域分割フィルタより供給される前記周波数領域情
    報のデジタル音響信号を符号化する量子化器と、 この量子化器より供給される信号を逆量子化する逆量子
    化器と、 この逆量子化器より供給される信号を帯域合成して時間
    領域情報の信号へ再変換する帯域合成フィルタと、 この帯域合成フィルタより供給される時間領域情報の信
    号と前記元信号として供給される時間領域情報のデジタ
    ル音響信号との残差信号を生成する残差計算部と、 この残差計算部より供給される前記残差信号を構成する
    フレーム内で各サンプルの情報量を平均化するためのパ
    ルス信号を生成し、前記入力信号合成部に出力するパル
    ス生成器と、 前記残差計算部より供給される前記残差信号と前記量子
    化器より供給される信号とを多重化する多重化部とを有
    することを特徴とする音響信号符号化装置。
  6. 【請求項6】前記残差信号を構成するフレーム内での各
    サンプルの情報量の平均値から算出される目標ビット割
    当値で表現できる最大表現値以下で定められる所定許容
    情報量以上の情報量を有する前記残差信号のサンプルに
    対して、このサンプルの情報量を前記所定許容情報量以
    下にするための情報量を有する符号反転されたパルス信
    号を前記パルス生成器にて生成することを特徴とする請
    求項5記載の音響信号符号化装置。
JP02600496A 1995-07-27 1996-01-19 音響信号符号化方法及び音響信号符号化装置 Expired - Lifetime JP3257584B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP02600496A JP3257584B2 (ja) 1996-01-19 1996-01-19 音響信号符号化方法及び音響信号符号化装置
EP96305495A EP0756386B1 (en) 1995-07-27 1996-07-26 Method and apparatus for coding a digital, acoustic signal
DE69629986T DE69629986T2 (de) 1995-07-27 1996-07-26 Verfahren und Gerät zum Kodieren digitaler akustischer Signale
US08/686,840 US5794179A (en) 1995-07-27 1996-07-26 Method and apparatus for performing bit-allocation coding for an acoustic signal of frequency region and time region correction for an acoustic signal and method and apparatus for decoding a decoded acoustic signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02600496A JP3257584B2 (ja) 1996-01-19 1996-01-19 音響信号符号化方法及び音響信号符号化装置

Publications (2)

Publication Number Publication Date
JPH09200056A JPH09200056A (ja) 1997-07-31
JP3257584B2 true JP3257584B2 (ja) 2002-02-18

Family

ID=12181563

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02600496A Expired - Lifetime JP3257584B2 (ja) 1995-07-27 1996-01-19 音響信号符号化方法及び音響信号符号化装置

Country Status (1)

Country Link
JP (1) JP3257584B2 (ja)

Also Published As

Publication number Publication date
JPH09200056A (ja) 1997-07-31

Similar Documents

Publication Publication Date Title
US6721700B1 (en) Audio coding method and apparatus
US7613603B2 (en) Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
KR100814673B1 (ko) 오디오 부호화
KR100813193B1 (ko) 정보 신호의 양자화 방법 및 장치
EP0756386B1 (en) Method and apparatus for coding a digital, acoustic signal
JP2001343997A (ja) デジタル音響信号符号化装置、方法及び記録媒体
KR100848370B1 (ko) 오디오 부호화
JP3519859B2 (ja) 符号器及び復号器
JP3434260B2 (ja) オーディオ信号符号化方法及び復号化方法、これらの装置及びプログラム記録媒体
US20100082589A1 (en) Computation apparatus and method, quantization apparatus and method, and program
JP3191257B2 (ja) 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置、音響信号復号化装置
JP3257584B2 (ja) 音響信号符号化方法及び音響信号符号化装置
JP2003233397A (ja) オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置
JP4649351B2 (ja) デジタルデータ復号化装置
JP4627737B2 (ja) デジタルデータ復号化装置
JP4024185B2 (ja) デジタルデータ符号化装置
JP4641272B2 (ja) デジタルデータ復号化装置
JP3593201B2 (ja) オーディオ復号装置
JP3361790B2 (ja) オーディオ信号符号化方法、オーディオ信号復号化方法およびオーディオ信号符号化/復号化装置と前記方法を実施するプログラムを記録した記録媒体
JP2006080927A (ja) 符号化方法、符号化装置、復号化方法及び復号化装置
JP2001109497A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法
JP2001148632A (ja) 符号化装置、符号化方法、及びその記録媒体
JP4024784B2 (ja) オーディオ復号装置
JP2004180057A (ja) デジタルデータの符号化装置および符号化方法
JPH07273656A (ja) 信号処理方法及び装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071207

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081207

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091207

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101207

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111207

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111207

Year of fee payment: 10

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121207

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121207

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131207

Year of fee payment: 12

EXPY Cancellation because of completion of term