JP2000259197A - オーディオ符号化におけるアタック/リリース信号の検出および修正方法 - Google Patents

オーディオ符号化におけるアタック/リリース信号の検出および修正方法

Info

Publication number
JP2000259197A
JP2000259197A JP11063041A JP6304199A JP2000259197A JP 2000259197 A JP2000259197 A JP 2000259197A JP 11063041 A JP11063041 A JP 11063041A JP 6304199 A JP6304199 A JP 6304199A JP 2000259197 A JP2000259197 A JP 2000259197A
Authority
JP
Japan
Prior art keywords
sub
attack
ratio
release signal
peak value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11063041A
Other languages
English (en)
Inventor
Mei Shen Shen
メイ・シェン シェン
Pen Tan Aa
ペン・タン アー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11063041A priority Critical patent/JP2000259197A/ja
Publication of JP2000259197A publication Critical patent/JP2000259197A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 オーディオ信号において、アタック/リリー
ス信号を検出し、修正することにより、前エコーや後エ
コーを防止する。 【解決手段】 符号器において、信号に急激な変化があ
るアタック/リリース信号を検出し、信号に急激な変化
がある箇所において、信号の修正を行なう。変化の箇
所、修正のパラメータを記憶し、復号器に送る。復号器
では、変化の箇所を見つけ、修正のパラメータに基づ
き、元の急激な変化に戻す。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オーディオ/ビデ
オ信号のディジタル符号化と処理に使用することができ
る。
【0002】
【従来の技術】DCTまたはMDCT(変形離散コサイ
ン変換)は周波数領域において優れたエネルギー圧縮を
有するので、オーディオ、画像および映像のようなデー
タ圧縮工業で広く使用されている。換言すれば、信号は
DCT変換空間の少数のベクトルによって示すことがで
きる。これは一般的な場合について正しいが、急激な変
化が信号に現われる場合等には正しくない。
【0003】DCTまたはMDCTがこのような急激な
変化を有する過渡信号になされる場合、信号のエネルギ
ーは、低周波バンドから高周波バンドの全周波数領域に
配分される。概して、DCTまたはMDCTを使用した
データ圧縮は、低い周波数成分を符号化し、高い周波数
成分を捨てる。より高いエネルギーを有する高い周波数
成分が捨てられれば、悪い影響が現われることが予想さ
れる。映像圧縮ではリング歪みが再生された画像に見ら
れ、他方オーディオ圧縮では、再生されたオーディオに
ついて前エコーや後エコーが聞こえる。
【0004】急激な変化を含む部分を再生した場合、急
激な変化部分の前に、多くのリング歪みが現われる。オ
ーディオの場合、急激な変化が低いレベルから高いレベ
ルに変わるものである場合は、アタックと呼ばれ、急激
な変化が高いレベルから低レベルに変わるものである場
合は、リリースと呼ばれる。
【0005】ハイブリッド(サブバンドフィルターとM
DCT)オーディオ符号化は、ISO/IEC1381
8−3MPEG2アドバンストオーディオ符号化(AA
C)や、ミニディスクATRACとATRAC2符号化
システムなどの多くのシステムで使用されている。
【0006】再生された信号に前/後エコーが現われる
のを防止するため、ATRAC符号化システムにおいて
は、短いブロックMDCTと長いブロックMDCTと
で、適応的に切り替えるようにしている。しかし、短い
ブロックMDCTは符号化効率が低く、さらにハードウ
ェアを複雑にする。
【0007】ゲインコントロール技術は、ソニーによる
ATRAC2データフォーマットに基づくATRAC2
符号化システムに使用されており、またAAC符号化シ
ステムにおいても使用されている。その基本的な理論は
図3に示されている。アタック信号x(n)が検出され
ると、アタック信号部分はゲイン関数g(n)が乗算さ
れて調整され、修正信号y(n)を出力する。
【0008】復号化側では、修正信号レベルは、データ
フォーマットに従うことにより、元のレベルに戻され
る。符号化側では、アタック/リリース信号を検出し、
修正することによりアタック/リリース信号を除去する
とともに、データフォーマットに整合するように設計し
なければならない。
【0009】本発明は、効率的にアタック/リリース信
号を検出かつ修正できるいくつかの方法を提供する。こ
れらの方法のあるものは非常に効率的であるが、AAC
またはATRAC2データフォーマットに合わないもの
も有れば、合うものも有る。
【0010】
【発明が解決しようとする課題】ハイブリッドオーディ
オ符号化では、MDCTの短いブロックと長いブロック
との間の切り換えが通常使用され、再生される信号に前
エコーが現われるのを防止する。MDCTの短いブロッ
クは、その低い周波数分解能のため符号化効率の低下を
引き起こす。再生される信号に前/後エコーが現われる
のを防止するために短いブロックMDCTを使用する代
わりに、それらの検出されたアタック/リリース信号に
ついて符号化側で信号修正と調整を行うことができる。
これにより信号の急激な変化を滑らかにすることがで
き、また過渡信号を処理するためにも長ブロックMDC
Tが常に同一の符号化効率を有するようにすることがで
きる。
【0011】アタック/リリース信号部分の信号レベル
の調整情報は記憶され、復号器に伝送される。これによ
って復号器では、MDCT、量子化およびエントロピー
符号化が実施された後、信号の同一部分について元のア
タック/リリース信号部分が持っていたと同様の急激な
信号レベルに調整し戻すことができる。
【0012】符号化と復号化との間のアタック/リリー
ス信号の調整は、全体の符号化プロセスと、再生される
信号の品質とに対する副作用がないことを保証するため
に、互いに充分に整合しなければならない。
【0013】聴取可能な前/後エコーをもたらすアタッ
ク/リリース信号の効率的な検出は、より良い音質を達
成するために非常に重要である。低い実装コストを考慮
して効率が設計される。あるアタック検出方法では非常
に複雑であるか、またはすべてのアタック/リリース信
号を検出するには非常に効率的でない。アタック/リリ
ース信号が検出された後、正確な調整位置と調整レベル
とを探索するための手段が必要とされる。
【0014】
【課題を解決するための手段】聴取可能な前/後エコー
の防止に関して非常に効率的であり、また安価なアタッ
ク/リリース信号の検出と修正の手段が、上記の課題を
解決するために発明された。
【0015】アタック/リリース信号の検出は、いくつ
かのサブ領域にサンプルをグループ分けし、各サブ領域
についてピーク値を計算し、また隣接するサブ領域の間
のピーク値を比較することによって検出される。
【0016】アタック/リリース信号の修正手段は、検
出されたサブ領域の過渡信号レベルを調整することによ
って発明される。
【0017】過渡信号レベルを調整する手段は、ビット
使用がより少ないと考えられる最善の位置を見つけるこ
とによってなされる。
【0018】アタック/リリース信号の正確な検出と修
正の手段は、考えられるすべてのアタック/リリース信
号を検出するために、各サンプルについてピーク値を計
算し、また各ピーク値を比較することによって、サンプ
ルに基づく処理に基づいても発明される。
【0019】アタック/リリース信号の正確な修正手段
は、無制限のゲインレベルを有する過渡信号を調整する
ことによって、上述の正確な検出に基づいて発明され
る。
【0020】本発明は、アタック/リリース信号につい
て効率的な検出を達成するためにいくつかの手段を提供
する。
【0021】また本発明は、アタック/リリース信号に
関する正確な修正を達成するためにいくつかの手段を提
供する。
【0022】入力信号にサブバンドフィルター処理が施
される。各サブバンドに生じるサンプルはいくつかのサ
ブ領域にグループ分けされる。絶対ピーク値が各サブ領
域について見つけられる。これらのピーク値に関する比
較が予め規定されたしきい値に対してなされる。アタッ
ク/リリース信号に関する決定は、比較結果が、予め規
定されたしきい値により設定された範囲内に入る時にな
される。
【0023】アタック/リリース信号が検出された後、
最大の比率が計算され、また検出プロセスで発見された
アタック/リリースの位置の近くで探索される。最大の
比率が現われる位置は記憶され、また比率と共に復号器
に送られる。ゲインレベル調整関数は比率と位置情報に
基づいて出力される。アタック/リリース信号は調整さ
れ、またゲインレベル関数を用いて修正される。
【0024】本発明の第1の観点は、オーディオ符号化
におけるアタック/リリース信号の検出および修正方法
であって、各フレームがオーディオチャンネルごとのい
くつかのサンプルからなるフレームにオーディオチャン
ネルの入力オーディオデータを分割する段階と、前記フ
レームのいくつかのサンプルにサブバンド分析フィルタ
ーのフィルター前処理を施す段階と、サブバンド分析フ
ィルター処理の後に得られた各サブバンド信号にアタッ
ク/リリースの検出を行う段階と、前記検出からの結果
に基づいて各サブバンド信号を修正する段階と、各サブ
バンドの前記修正された信号に変換を施してより高い周
波数分解能の周波数成分を得る段階と、前記周波数成分
にビットを割り当てる段階と、各周波数成分に割り当て
られたビット数に応じて量子化ステップを決定する段階
と、前記決定された量子化ステップを用いて各周波数成
分を量子化および正規化する段階と、前記量子化された
周波数成分をエントロピー符号化する段階と、前記検出
と修正から得られた前記情報を符号化する段階と、前記
符号化された検出と修正情報をパッキングし、符号化さ
れたビットをビットストリームにエントロピーする段階
と、を備えた方法である。
【0025】本発明の第2の観点は、オーディオ復号化
におけるアタック/リリース信号の検出および修正方法
であって、前記ビットストリームをアンパッキングする
段階と、前記量子化された周波数成分をエントロピー復
号化し、また逆量子化する段階と、前記逆量子化された
周波数成分に逆MDCTを施して、合成サブバンドフィ
ルター処理がなされる前に各サブバンドにオーディオ信
号を形成する段階と、前記ビットストリームから修正情
報を抽出する段階と、ビットストリームから得られた修
正情報に基づいて各サブバンドの前記オーディオ信号に
関するアタック/リリース部分のゲインレベルを調整す
る段階と、バンド全体について修正されたオーディオ信
号に合成サブバンドフィルター処理を行って時間領域の
オーディオ信号を再生する段階と、を備えた方法。
【0026】本発明の第3の観点は、第1の観点の方法
において、アタック/リリース信号の検出が、各前記サ
ブバンド信号を、いくつかのサンプルを含むサブ領域に
分割する段階と、前記サブバンドの各サブ領域について
ピーク値(または電力エネルギー)を見つける段階と、
サブ領域を複数個含むグループに分ける段階と、各グル
ープのピーク値の内、最大ピーク値を見つける段階と、
任意のグループの最大ピーク値と、その次のグループの
最大ピーク値とを比較し、比を取る段階と、前記比と、
所定のしきい値とを比べ、アタック/リリース信号を検
出する段階と、アタック/リリース信号の検出の状態を
示すフラグを復号器に送る段階と、アタック/リリース
信号が検出された位置を記録する段階と、を備えた方法
である。
【0027】本発明の第4の観点は、第1の観点の方法
において、アタック/リリース信号の検出が、各前記サ
ブバンド信号を、いくつかのサンプルを含むサブ領域に
分割する段階と、前記サブバンドの各サブ領域について
ピーク値(または電力エネルギー)を見つける段階と、
前のサブ領域についてこれまで更新された最大ピーク値
と、次のサブ領域のピーク値とを比較し、比を取る段階
と、前記比と、所定のしきい値とを比べ、アタック/リ
リース信号を検出する段階と、アタック/リリース信号
の検出の状態を示すフラグを復号器に送る段階と、アタ
ック/リリース信号が検出された位置を記録する段階
と、アタック/リリース信号が検出された後に更新ピー
ク値とその位置とを、更新された値にリセットする段階
と、を備えた方法である。
【0028】本発明の第5の観点は、第4の観点の方法
において、アタック/リリース信号の検出が、前記比に
基づいてゲイン調整関数を出力する段階と、前記信号セ
グメントの各サンプルについて、ゲイン調整関数から得
られた値を乗じてアタック/リリース信号レベルを調整
する段階と、前記比と、検出された前記アタック/リリ
ース信号の位置とを記憶する段階と、前記比と位置とを
符号化して復号器に送る段階と、を備えた方法である。
【0029】本発明の第6の観点は、第4の観点の方法
において、アタック/リリース信号の検出が、更新され
た最大ピーク値に対応する位置と、次のサブ領域のピー
ク値に対応する位置との間で1つ以上のアタック/リリ
ース信号を特定する段階と、任意のサブ領域の最大ピー
ク値に対応する位置と、後続のサブ領域であって、前記
任意のサブ領域の最大ピーク値よりもはるかに大きな最
大ピーク値に対応する位置とで囲まれた範囲内における
隣接した2つのサブ領域のピーク値の間の比を順次計算
する段階と、前記範囲内において、サブ領域毎に、それ
ぞれの比に基づいてゲイン調整関数を出力する段階と、
対応するゲイン調整関数から得られた値を乗じてサブバ
ンドの各サンプルの信号レベルを調整する段階と、サブ
バンドの中に検出されたアタック/リリース信号の数を
送る段階と、調整された各サブ領域の前記比と位置とを
符号化して復号器に送る段階と、を備えた方法である。
【0030】本発明の第7の観点は、第4の観点の方法
において、アタック/リリース信号の検出が、任意のサ
ブ領域の最大ピーク値に対応する位置と、後続のサブ領
域であって、ピーク値に対応する位置とで囲まれた範囲
内における隣接した2つのサブ領域のピーク値の間の比
を順次計算する段階と、前記範囲内において、サブ領域
毎に、それぞれの比を比較し、最大の比を選択する段階
と、最大の比を有するサブ領域の位置を記憶する段階
と、前記最大の比に基づいてゲイン調整関数を出力する
段階と、ゲイン調整関数から得られた値を乗じてサブバ
ンドの各サンプルの信号レベルを調整する段階と、前記
比と位置とを符号化して復号器に送る段階と、を備えた
方法である。
【0031】本発明の第8の観点は、第3の観点の方法
において、アタック/リリース信号の検出が、任意のグ
ループ内の最大ピーク値と、次のグループ内の最大ピー
ク値の比を得る段階と、前記任意のグループ内の最大ピ
ーク値に対応する位置を得る段階と、前記比と位置とを
用いてゲイン調整関数を出力する段階と、前記ゲイン調
整関数から得られた値を乗じてサブバンドの各サンプル
の信号レベルを調整する段階と、前記比と位置とを符号
化して復号器に送る段階と、を備えた方法である。
【0032】本発明の第9の観点は、第3の観点の方法
において、アタック/リリース信号の検出が、任意のグ
ループ内の最大ピーク値に対応する位置と、次のグルー
プ内の最大ピーク値に対応する位置とで囲まれた範囲内
における2つの隣接したサブ領域のピーク値の間の比を
順次計算する段階と、複数の前記比において最大の比を
選択する段階と、最大の比を有するサブ領域の位置を記
憶する段階と、前記最大の比に基づいてゲイン調整関数
を出力する段階と、ゲイン調整関数から得られた値を乗
じてサブバンドの各サンプルの信号レベルを調整する段
階と、前記比と位置とを符号化して復号器に送る段階
と、を備えた方法である。
【0033】本発明の第10の観点は、第4の観点の方
法において、アタック/リリース信号の検出が、前記比
と、第1の所定のしきい値とを比べ、アタック信号の候
補を検出する段階と、前記比と、第2の所定のしきい値
とを比べ、リリース信号の候補を検出する段階と、更新
された最大ピーク値の位置と、次のより大きなピーク値
の位置との間の距離を、第3の所定のしきい値と比較
し、アタック信号の候補を検出し、更新された最大ピー
ク値の位置と、次のより大きなピーク値の位置との間の
距離を、前記第3の所定のしきい値よりも大きい第4の
所定のしきい値と比較し、リリース信号の候補を検出
し、前記比と距離の両方の検出がそろった場合、アタッ
ク/リリース信号のフラグを設定する段階と、を備えた
方法である。
【0034】本発明の第11の観点は、第5、6、7、
8、または9の観点の方法において、ゲイン調整関数
が、補間関数である方法である。
【0035】
【発明の実施の形態】符号器の概略ブロック構成図が図
1に示されている。11はサブバンド分析フィルターで
ある。12は、信号検出器で、アタック/リリース信号
の検出と修正がなされる。13は、変形離散コサイン変
換器MDCT(modified discrete cosine transform)
である。14は、量子化器で、量子化とビット割り当て
がなされる。
【0036】図2には、図1に示した符号器に対応する
復号器の概略ブロック構成図が示されている。
【0037】ビットストリームはビットストリーム源2
1から読み取られる。送られてきたビットストリームの
アンパッキング及び逆量子化は逆量子化器22でなさ
れ、また逆変形離散コサイン変換は、逆変形離散コサイ
ン変換器IMDCT (inversemodified discrete cosin
e transform)23でなされる。アタック/リリース信号
補償、すなわちアタック/リリースの信号検出と修正の
逆が信号補償器24でなされる。信号補償の後に、サブ
バンド合成フィルター処理がフィルタ25でなされる。
【0038】アタック/リリース信号の修正と補償の背
後にある理論は、急激な変化を滑らかにするために過渡
信号部分の周囲の信号レベルを調整することである。
【0039】理論は図3に示される。図において、x
(n)はアタック信号であり、またこのアタック信号
は、ゲイン関数g(n)(n=0,1,2,
3,...,255)を乗じて修正されて非アタック信
号であるy(n)になる。次にMDCT13がこの修正
信号y(n)を受けて処理する。新しい信号y(n)は
高周波数バンドの高エネルギー周波数成分を発生しない
ので、修正の結果、MDCT13がy(n)を処理して
も、前エコー(pre-echo)が発生しない。
【0040】通常のMDCTはいくつかのオーディオサ
ンプルからなるサブフレームでなされる。アタック/リ
リース信号の検出と修正はサブフレームに対してなされ
る。サブフレームにおけるアタック/リリース信号の検
出、サブフレームに存在するアタック信号数の検出、修
正を行なう最も適した位置の探索、および修正に関する
ゲインレベルの計算について、ここで説明する。
【0041】復号器に関しては、各サブフレームについ
てアタック信号数を知ることが必要である。アタック信
号の数が多ければ、それだけ多くのビットが使用され
る。このほか、復号器もアタック/リリース信号の補償
を行う位置と、各アタック信号の補償に関する調整レベ
ルとを知る必要がある。
【0042】図4(a)と(b)に示したように、アタ
ックとリリース信号の検出はいくつかのサンプルを含む
サブ領域に基づく。ここでは、8つのサンプルを含むサ
ブ領域を例に取り、更に256のサンプルを含むサブフ
レームの例を考える。一般に、1つのサブ領域に存在す
るサンプル数は1つで有っても良いし、またどのような
正整数であってもよい。
【0043】図4には、図1に示したサブバンド分析フ
ィルター後の1つのサブフレームに256のサンプルが
示されている。サブフレームはさらに32のサブ領域に
分割され、また各サブ領域は8つのサンプルからなる。
絶対ピーク値は各サブ領域について確認され、これは図
4の各サブ領域について垂直の矢印として示されてい
る。
【0044】簡単かつ有効な方法は、図4(a)の
n、Pn+1のような4つのサブ領域ごとに区切られたグ
ループ内で最大のピークを見つけることである。もし次
の条件が満たされるならば、PnとPn+1との間にアタッ
ク信号が現われていると考えられる。 Pn+1/Pn≧Ta (1) ここでTaは予め規定されたしきい値であり、その一例
として6がある。
【0045】ひとつのグループには4つのサブ領域が含
まれており、4×8=32のサンプルがあるので、Pn
とPn+1の間の距離は、平均32サンプルである。また
nとPn+1との間の最大距離は、64サンプル(P
nが、先のグループの先頭にあるサンプルであり、Pn+1
が、次のグループの終端にあるサンプルである場合の、
nとPn+1との間の距離)である。心理聴覚研究によれ
ば、前エコーは連続的に2msを越えて存在するならば
聞くことが可能であり、これは、オーディオ信号のサン
プル周波数が44.1KHzの場合、64のサンプルにほ
ぼ当てはまる。したがって、前のピーク値Pnが現在の
ピーク値Pn+1よりも6分の1未満である限り、この検
出によって2msより長い前エコーを防止することがで
きる。
【0046】リリース信号の検出は同様の方法でなされ
る。 Pn+1/Pn≦Tr かつ Pn+2/Pn≦Tr (2) ここでTrは予め決められたしきい値であり、その一例
として1/8(0.125)がある。後エコー(post-echo)
は前エコーよりも長く続く場合のみ聞こえるだけなの
で、ここでPnは次のピーク値Pn+1とPn+2と比較され
る。式(2)の両方の比較が満たされる限り、再生後に
聴取可能な後エコーを引き起こし得るリリース信号が存
在すると思われる。リリース信号の修正はPnとPn+1
の間の位置でなされる。
【0047】比較のために設定されたしきい値Tr、お
よび聴取可能な後エコーを生じさせるリリース信号の長
さは、異なった用途のために調整できることを指摘す
る。例えば、次の式(3)は、リリース信号がより長く
なれば聴取可能な後エコーを引き起こすことができると
考えられるので、式(3)は、式(2)のリリース信号
よりも少ないリリース信号を検出するためにある。 Pn+1/Pn≦Tr かつ Pn+2/Pn≦Tr かつ Pn+3/Pn≦Tr かつ Pn+4/Pn≦Tr (3) アタックまたはリリース信号が検出された後、1つのサ
ブ領域のみについて信号修正が可能であるならば、アタ
ック信号を例とした場合、複数のサブ領域がP nとPn+1
との間に存在するので、信号修正を実施するための最善
の位置が決定される。
【0048】この場合、最適位置の探索は、隣接するサ
ブ領域の各ピーク値の間の最大の比率を探し出すことに
より行なわれる。アタック信号の場合の例が図5に示さ
れる。
【0049】例えば、図5に示したように、PnとPn+1
との間にアタック信号が検出される。PnとPn+1との間
であって、ピーク値が一番急激に変化している箇所、す
なわち隣接する2つのサブ領域におけるピーク値の比
率、Mi+1/Miが最大である箇所を見つける。Mi
とMi+1の値によって決められるゲインレベルに基づ
いて、ゲイン修正がi番目のサブ領域についてなされ
る。
【0050】信号修正の別の方法は、Pn+1/Pnの比率
に基づいてPnとPn+1との間のすべてのサンプルを修正
することである。ここで、ゲイン調整のための関数は、
2つの点の平均値を2つの点の中間点における補間値と
して使用する公知の補間関数を用いることも可能で有
る。
【0051】検出と修正のために同様の方法をリリース
信号について行うことが可能である。
【0052】アタック/リリース信号の検出精度を理論
的に改良できるより簡単な構想は少ない。アタック信号
を検出するための構想を以下に説明する。
【0053】図6に示したように、検出は、4つのサブ
領域(図4)のグループの代わりに、ひとつのサブ領域
(8つのサンプル、または極端な場合には1つのサンプ
ル)に基づいてなされる。Peak_Sofarは一番
最近の最大ピークであり、またp(n)(1つのサブフ
レームについて256のサンプルの場合、および1つの
サブ領域について8つのサンプルの場合、nは0から3
1)は次のピークである。
【0054】8つのサンプルが含まれる各サブ領域を走
査する。一番最近のピーク、Peak_Sofar、お
よびその位置、Post_Sofarを検出し、更新
し、検出したアタック信号の位置の記録する。詳細は次
のようになされる。
【0055】 Peak_Sofarは低レベルに設定される; for(n=0;n<32、n++){/*合計は32*8サンプル=256サン プル*/ 比率=ピーク(n)/Peak_Sofar; 距離=n−Post_Sofar;/*距離に関するサンプル数は距離の8倍* / もし、(比率>6&距離>4)ならば{/*アタック検出。ここで「6」と「 4」を調整することができる*/ ゲイン修正のためにnの位置を記録; リセットPeak_Sofar=低レベル; リセットPost_Sofar=n; } さもなければ{ もし、(ピーク(n)>Peak_Sofar)ならば{ Peak_Sofar=ピーク(n);/*Peak_Sofar更新を維 持*/ Post_Sofar=n; /*Peak_Sofarの位置更 新を維持*/ } } } これは図6に示され、p(n)はピーク(n)であり、
またp(n)/Peak_Sofarの比率が6よりも
大きい、すなわちPost_Sofarの位置にアタッ
クが検出される場合を考える。
【0056】ゲイン修正のために位置とゲインレベルと
を見つける必要がある。上記の検出後にゲイン修正のた
めの位置とゲインレベルとを見つけるための手順があ
る。その手順は複雑だが正確なゲイン修正方法である。
【0057】図6に示したように、この場合、Post
_Sofarとnとの間に2つのアタック信号があり、
またこれらの2つのアタックの各ゲイン制御レベルは、
p(n−2)とp(n−1)との間から、ならびにp
(n−1)とp(n)との間から、それぞれ計算され
る。ゲイン修正のための位置はn−2、n−1から始ま
りnに終わる。
【0058】上記の手順が、1つ以上のアタック/リリ
ース信号についてより多くの情報を復号器に送信する必
要があることは明白である。
【0059】
【発明の効果】本発明に開示された方法はアタック/リ
リース信号を検出し、また前および後エコーを除去する
のに非常に効率的である。より簡単な方法が、より複雑
でない実装のために実際に有効であり、またより複雑な
方法を、前および後エコーをより正確に検出かつ除去す
るために利用することができる。
【図面の簡単な説明】
【図1】ハイブリッド符号器の概略ブロック構成図であ
る。
【図2】ハイブリッド復号器の概略ブロック構成図であ
る。
【図3】アタック信号修正構想の図面である。
【図4】(a)は、アタック信号の簡単な検出を示す図
であり、(b)は、リリース信号の簡単な検出を示す図
である。
【図5】簡単な検出に基づくアタック信号修正のための
位置探索を示す図である。
【図6】アタック信号のより正確な検出を示す図であ
る。
【符号の説明】
11…サブバンド分析フィルター 12…信号検出器 13…変形離散コサイン変換器(MDCT) 14…量子化器 21…ビットストリーム源 22…逆量子化は逆量子化器 23…逆変形離散コサイン変換器(IMDCT) 24…信号補償器 25…フィルタ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 アー ペン・タン シンガポール534415シンガポール、タイ・ セン・アベニュー、ブロック1022、04− 3530番、タイ・セン・インダストリアル・ エステイト、パナソニック・シンガポール 研究所株式会社内 Fターム(参考) 5D045 DA08 DA20 5J064 BA09 BA13 BB12 BC01 BC02 BC11 BC16 BC17 BC18 BD01 9A001 EE04 EE05 HZ15 JJ71 KK43 KK54

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 オーディオ符号化におけるアタック/リ
    リース信号の検出および修正方法であって、 各フレームがオーディオチャンネルごとのいくつかのサ
    ンプルからなるフレームにオーディオチャンネルの入力
    オーディオデータを分割する段階と、 前記フレームのいくつかのサンプルにサブバンド分析フ
    ィルターのフィルター前処理を施す段階と、 サブバンド分析フィルター処理の後に得られた各サブバ
    ンド信号にアタック/リリースの検出を行う段階と、 前記検出からの結果に基づいて各サブバンド信号を修正
    する段階と、 各サブバンドの前記修正された信号に変換を施してより
    高い周波数分解能の周波数成分を得る段階と、 前記周波数成分にビットを割り当てる段階と、 各周波数成分に割り当てられたビット数に応じて量子化
    ステップを決定する段階と、 前記決定された量子化ステップを用いて各周波数成分を
    量子化および正規化する段階と、 前記量子化された周波数成分をエントロピー符号化する
    段階と、 前記検出と修正から得られた前記情報を符号化する段階
    と、 前記符号化された検出と修正情報をパッキングし、符号
    化されたビットをビットストリームにエントロピーする
    段階と、 を備えた方法。
  2. 【請求項2】 オーディオ復号化におけるアタック/リ
    リース信号の検出および修正方法であって、 前記ビットストリームをアンパッキングする段階と、 前記量子化された周波数成分をエントロピー復号化し、
    また逆量子化する段階と、 前記逆量子化された周波数成分に逆MDCTを施して、
    合成サブバンドフィルター処理がなされる前に各サブバ
    ンドにオーディオ信号を形成する段階と、 前記ビットストリームから修正情報を抽出する段階と、 ビットストリームから得られた修正情報に基づいて各サ
    ブバンドの前記オーディオ信号に関するアタック/リリ
    ース部分のゲインレベルを調整する段階と、 バンド全体について修正されたオーディオ信号に合成サ
    ブバンドフィルター処理を行って時間領域のオーディオ
    信号を再生する段階と、 を備えた方法。
  3. 【請求項3】 請求項1に記載の方法において、アタッ
    ク/リリース信号の検出が、 各前記サブバンド信号を、いくつかのサンプルを含むサ
    ブ領域に分割する段階と、 前記サブバンドの各サブ領域についてピーク値(または
    電力エネルギー)を見つける段階と、 サブ領域を複数個含むグループに分ける段階と、 各グループのピーク値の内、最大ピーク値を見つける段
    階と、 任意のグループの最大ピーク値と、その次のグループの
    最大ピーク値とを比較し、比を取る段階と、 前記比と、所定のしきい値とを比べ、アタック/リリー
    ス信号を検出する段階と、 アタック/リリース信号の検出の状態を示すフラグを復
    号器に送る段階と、 アタック/リリース信号が検出された位置を記録する段
    階と、 を備えた方法。
  4. 【請求項4】 請求項1に記載の方法において、アタッ
    ク/リリース信号の検出が、 各前記サブバンド信号を、いくつかのサンプルを含むサ
    ブ領域に分割する段階と、 前記サブバンドの各サブ領域についてピーク値(または
    電力エネルギー)を見つける段階と、 前のサブ領域についてこれまで更新された最大ピーク値
    と、次のサブ領域のピーク値とを比較し、比を取る段階
    と、 前記比と、所定のしきい値とを比べ、アタック/リリー
    ス信号を検出する段階と、 アタック/リリース信号の検出の状態を示すフラグを復
    号器に送る段階と、 アタック/リリース信号が検出された位置を記録する段
    階と、 アタック/リリース信号が検出された後に更新ピーク値
    とその位置とを、更新された値にリセットする段階と、
    を備えた方法。
  5. 【請求項5】 請求項4に記載の方法において、アタッ
    ク/リリース信号の検出が、 前記比に基づいてゲイン調整関数を出力する段階と、 前記信号セグメントの各サンプルについて、ゲイン調整
    関数から得られた値を乗じてアタック/リリース信号レ
    ベルを調整する段階と、 前記比と、検出された前記アタック/リリース信号の位
    置とを記憶する段階と、 前記比と位置とを符号化して復号器に送る段階と、 を備えた方法。
  6. 【請求項6】 請求項4に記載の方法において、アタッ
    ク/リリース信号の検出が、 更新された最大ピーク値に対応する位置と、次のサブ領
    域のピーク値に対応する位置との間で1つ以上のアタッ
    ク/リリース信号を特定する段階と、 任意のサブ領域の最大ピーク値に対応する位置と、後続
    のサブ領域であって、前記任意のサブ領域の最大ピーク
    値よりもはるかに大きな最大ピーク値に対応する位置と
    で囲まれた範囲内における隣接した2つのサブ領域のピ
    ーク値の間の比を順次計算する段階と、 前記範囲内において、サブ領域毎に、それぞれの比に基
    づいてゲイン調整関数を出力する段階と、 対応するゲイン調整関数から得られた値を乗じてサブバ
    ンドの各サンプルの信号レベルを調整する段階と、 サブバンドの中に検出されたアタック/リリース信号の
    数を送る段階と、 調整された各サブ領域の前記比と位置とを符号化して復
    号器に送る段階と、 を備えた方法。
  7. 【請求項7】 請求項4に記載の方法において、アタッ
    ク/リリース信号の検出が、 任意のサブ領域の最大ピーク値に対応する位置と、後続
    のサブ領域であって、ピーク値に対応する位置とで囲ま
    れた範囲内における隣接した2つのサブ領域のピーク値
    の間の比を順次計算する段階と、 前記範囲内において、サブ領域毎に、それぞれの比を比
    較し、最大の比を選択する段階と、 最大の比を有するサブ領域の位置を記憶する段階と、 前記最大の比に基づいてゲイン調整関数を出力する段階
    と、 ゲイン調整関数から得られた値を乗じてサブバンドの各
    サンプルの信号レベルを調整する段階と、 前記比と位置とを符号化して復号器に送る段階と、 を備えた方法。
  8. 【請求項8】 請求項3に記載の方法において、アタッ
    ク/リリース信号の検出が、 任意のグループ内の最大ピーク値と、次のグループ内の
    最大ピーク値の比を得る段階と、 前記任意のグループ内の最大ピーク値に対応する位置を
    得る段階と、 前記比と位置とを用いてゲイン調整関数を出力する段階
    と、 前記ゲイン調整関数から得られた値を乗じてサブバンド
    の各サンプルの信号レベルを調整する段階と、 前記比と位置とを符号化して復号器に送る段階と、 を備えた方法。
  9. 【請求項9】 請求項3に記載の方法において、アタッ
    ク/リリース信号の検出が、 任意のグループ内の最大ピーク値に対応する位置と、次
    のグループ内の最大ピーク値に対応する位置とで囲まれ
    た範囲内における2つの隣接したサブ領域のピーク値の
    間の比を順次計算する段階と、 複数の前記比において最大の比を選択する段階と、 最大の比を有するサブ領域の位置を記憶する段階と、 前記最大の比に基づいてゲイン調整関数を出力する段階
    と、 ゲイン調整関数から得られた値を乗じてサブバンドの各
    サンプルの信号レベルを調整する段階と、 前記比と位置とを符号化して復号器に送る段階と、 を備えた方法。
  10. 【請求項10】 請求項4に記載の方法において、アタ
    ック/リリース信号の検出が、 前記比と、第1の所定のしきい値とを比べ、アタック信
    号の候補を検出する段階と、 前記比と、第2の所定のしきい値とを比べ、リリース信
    号の候補を検出する段階と、 更新された最大ピーク値の位置と、次のより大きなピー
    ク値の位置との間の距離を、第3の所定のしきい値と比
    較し、アタック信号の候補を検出し、 更新された最大ピーク値の位置と、次のより大きなピー
    ク値の位置との間の距離を、前記第3の所定のしきい値
    よりも大きい第4の所定のしきい値と比較し、リリース
    信号の候補を検出し、 前記比と距離の両方の検出がそろった場合、アタック/
    リリース信号のフラグを設定する段階と、 を備えた方法。
  11. 【請求項11】 オーディオ符号化におけるアタック/
    リリース信号の検出と修正の請求項5、6、7、8また
    は9に記載の方法であって、ゲイン調整関数が、補間関
    数である方法。
JP11063041A 1999-03-10 1999-03-10 オーディオ符号化におけるアタック/リリース信号の検出および修正方法 Pending JP2000259197A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11063041A JP2000259197A (ja) 1999-03-10 1999-03-10 オーディオ符号化におけるアタック/リリース信号の検出および修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11063041A JP2000259197A (ja) 1999-03-10 1999-03-10 オーディオ符号化におけるアタック/リリース信号の検出および修正方法

Publications (1)

Publication Number Publication Date
JP2000259197A true JP2000259197A (ja) 2000-09-22

Family

ID=13217863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11063041A Pending JP2000259197A (ja) 1999-03-10 1999-03-10 オーディオ符号化におけるアタック/リリース信号の検出および修正方法

Country Status (1)

Country Link
JP (1) JP2000259197A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007272238A (ja) * 2000-12-14 2007-10-18 Sony Corp 符号化装置および方法、復号装置および方法、並びに記録媒体
US7406410B2 (en) 2002-02-08 2008-07-29 Ntt Docomo, Inc. Encoding and decoding method and apparatus using rising-transition detection and notification
JP2011008135A (ja) * 2009-06-29 2011-01-13 Fujitsu Ltd 情報処理装置およびプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007272238A (ja) * 2000-12-14 2007-10-18 Sony Corp 符号化装置および方法、復号装置および方法、並びに記録媒体
JP4548444B2 (ja) * 2000-12-14 2010-09-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びに記録媒体
US7406410B2 (en) 2002-02-08 2008-07-29 Ntt Docomo, Inc. Encoding and decoding method and apparatus using rising-transition detection and notification
JP2011008135A (ja) * 2009-06-29 2011-01-13 Fujitsu Ltd 情報処理装置およびプログラム
US8295499B2 (en) 2009-06-29 2012-10-23 Fujitsu Limited Audio information processing and attack detection apparatus and method

Similar Documents

Publication Publication Date Title
US5299240A (en) Signal encoding and signal decoding apparatus
AU2020204222B2 (en) Method and apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
KR100348368B1 (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
KR100840439B1 (ko) 음성부호화장치 및 음성복호장치
US7328161B2 (en) Audio decoding method and apparatus which recover high frequency component with small computation
JPH05304479A (ja) オーディオ信号の高能率符号化装置
JPH0591061A (ja) オーデイオ信号処理方法
JP2005523480A (ja) 空間的オーディオのパラメータ表示
JP2000134105A (ja) オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法
JP5633431B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP2007514977A (ja) 改良された周波数領域におけるエラー隠蔽技術
US20040181395A1 (en) Scalable stereo audio coding/decoding method and apparatus
JP2001102930A (ja) 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置
JPH0590974A (ja) 前反響処理方法およびその装置
US7983346B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
US5899966A (en) Speech decoding method and apparatus to control the reproduction speed by changing the number of transform coefficients
JP3158932B2 (ja) 信号符号化装置及び信号復号化装置
JP2000259197A (ja) オーディオ符号化におけるアタック/リリース信号の検出および修正方法
JP2006003580A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法
JPS6337400A (ja) 音声符号化及び復号化方法
JP2008107629A (ja) オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム
JP3753956B2 (ja) 符号化装置
WO2008072524A1 (ja) オーディオ信号符号化方法及び復号化方法
US20090063161A1 (en) Method and apparatus for encoding and decoding continuation sinusoidal signal of audio signal